You are on page 1of 49

KIỂM ĐỊNH CÁC GIẢ THUYẾT NGHIÊN CỨU

TKDSSKSS.YTCC@GMAIL.COM
MỤC TIÊU

1. Thực hành các bài toán kiểm định giả thuyết cho
biến số định tính và định lượng bằng phần mềm
SPSS
2. Phiên giải được các kết quả phân tích

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 2
PHÂN LOẠI BIẾN SỐ

Thứ
Biến
hạng
thứ(ordinal)
hạng

Biến
Định
định
tính
tính Danh
Biếnmục
danh
(nomial)
mục

NhịBiến
phânnhị
(binomial)
phân

Biến Số
số Định
Biếnlượng
định lượng
liên tục
liên
(continuous)
tục

Định
Biến định
lượnglượng
rời rạc
rời(discrete)
rạc
Biến
Định
định
lượng
lượng
TỷBiến
suấttỷ(Ratio)
suất

Khoảng
Biến khoảng
chia (Interval)
chia
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 3
Thống kê  Bài này sẽ cung cấp các kỹ năng tiến
hành kiểm định giả thuyết thống kê
cho biến số định tính và biến số định
Thống kê Thống kê lượng.
mô tả suy luận
 Lưu ý:
Ước lượng  mỗi kiểm định có những giả định
thống kê riêng nhằm đảm bảo tính chính xác
của các phép tính --> sử dụng không
Kiểm định phù hợp các kiểm định thống kê có
giả thuyết thể dẫn đến những kết luận sai lầm.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 4
A. MỘT SỐ DẠNG BÀI TOÁN KIỂM ĐỊNH TỶ LỆ PHỔ BIẾN

1. Kiểm định một tỷ lệ nghiên cứu với một tỷ lệ cho


trước.
2. Kiểm định hai tỷ lệ ở hai nhóm độc lập (Bảng 2x2).
3. Kiểm định từ 3 tỷ lệ trở lên (các nhóm độc lập)

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 5
LỰA CHỌN TEST THỐNG KÊ?

Biến số phụ
LỰA CHỌN TEST THỐNG KÊ? thuộc là biến số định tính
Suy luận dựa trên tỷ lệ

Một nhóm 2 nhóm 3 nhóm trở lên

Z test Độc lập Phụ thuộc Độc lập

Z test/ Chi square test Z test/ McNemar test Chi square test

Freeman Halton Cỡ mẫu


Binomial exact Fisher's Exact Binomial exact
conditional exact
probability test test probability test nhỏ
test

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 6
2. BÀI TOÁN 1: SO SÁNH 1 TỶ LỆ NGHIÊN CỨU VỚI 1 TỶ LỆ CHO
TRƯỚC

 Ví dụ 1
 Một cuộc điều tra trên 600 trẻ được lựa chọn ngẫu
nhiên từ các trẻ em tại vùng A với mục đích xác định
xem tỷ lệ thiếu máu ở nghiên cứu này có khác với tỷ
lệ thiếu máu chung của trẻ em toàn quốc là 30% hay
không? Biết 𝛼= 0,05.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 7
 Gọi p là tỷ lệ thiếu máu ở trẻ em vùng A; p0 là tỷ lệ
thiếu máu ở trẻ em Việt Nam. Ta có: p0= 0,3
 H0: p= 0,3: Tỷ lệ thiếu máu ở trẻ em tỉnh A năm 2017
là 0,3.
 H1: p≠0,3: Tỷ lệ thiếu máu ở trẻ em vùng A năm
2017 là khác tỷ lệ thiếu máu ở trẻ em Việt Nam
(0,3).

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 8
2.2. THỰC HIỆN TRÊN SPSS

(1) Analyze
 Nonparametric
Tests
 Legacy Dialogs
 Chi-square.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 9
2.2. THỰC HIỆN TRÊN SPSS
p0 và 1-p0
nhập vào
phải nhỏ
hơn 1

Nhập giá trị


theo đúng
thứ tự đã
được mã
hóa trong
bộ số liệu

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 10
OUTPUT:
Hb_thieumau
Observed N Expected N Residual
khong thieu mau 363 420.0 -57.0
co thieu mau 237 180.0 57.0
Total 600

Test Statistics
Hb_thieumau
a
Chi-Square 25.786
df 1
Asymp. Sig. .000
a. 0 cells (0.0%) have expected frequencies less than 5. The minimum expected cell
frequency is 180.0.

• Kết luận: 𝜒 2 = 25,786; Asymp. Sig. tức là p <0,001 với tỷ lệ số kỳ vọng


< 5 là 0% nên ta bác bỏ giả thuyết H0 và chấp nhận giả thuyết H1.
•  Tỷ lệ thiếu máu trong nghiên cứu này khác biệt với tỷ lệ thiếu máu
chung của trẻ em Việt Nam là 30% với độ tin cậy 95%.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 11
3. BÀI TOÁN 2: KIỂM ĐỊNH HAI TỶ LỆ Ở HAI NHÓM ĐỘC LẬP
(BẢNG 2X2)

3.1. Ví dụ 2
 Tỷ lệ nhẹ cân (cân nặng lúc sinh < 2.500g) ở trẻ trai và trẻ gái
trong nghiên cứu này có khác nhau hay không (𝛼 = 0,05)?
 Gọi p1 và p2 lần lượt là tỷ lệ nhẹ cân ở nhóm trẻ trai và trẻ gái.
 H0: p1 = p2.
 H1: p1 ≠ p2.
 Nếu p < 0,05 (mức ý nghĩa) thì ta bác bỏ H0 và chấp nhận H1 và
ngược lại.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 12
3.2. THỰC HIỆN TRÊN SPSS

 Dựa trên biến số clns, khi tạo biến số nhecan với 2


nhóm giá trị:
 1=‘cnls < 2500g’
 0 = ‘cnls >= 2500g’
 Ta thực hiện các bước sau:

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 13
(1) ANALYZE  DESCRIPTIVE STATISTICS  CROSSTABS

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 14
z

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 15
Case Processing Summary
Cases
OUTPUT: Valid Missing Total
N Percent N Percent N Percent
nhecan * gioi 473 78.8% 127 21.2% 600 100.0%

nhecan * gioi Crosstabulation


gioi Total
nam nu
Count 204 241 445
Expected Count 203.2 241.8 445.0
cnls>=2500
% within nhecan 45.8% 54.2% 100.0%
% within gioi 94.4% 93.8% 94.1%
nhecan
Count 12 16 28
Expected Count 12.8 15.2 28.0
cnls <2500g
% within nhecan 42.9% 57.1% 100.0%
% within gioi 5.6% 6.2% 5.9%
Count 216 257 473
Expected Count 216.0 257.0 473.0
Total
% within nhecan 45.7% 54.3% 100.0%
% within gioi 100.0% 100.0% 100.0%
Chi-Square Tests
Value df Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1-
sided) sided) sided)
a
Pearson Chi-Square .095 1 .758
b
Continuity Correction .013 1 .911
Likelihood Ratio .095 1 .758
Fisher's Exact Test .846 .457
Linear-by-Linear
.094 1 .759
Association
N of Valid Cases 473
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is
12.79.
b. Computed only for a 2x2 table

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 16
BẢNG CASE PROCESSING SUMMARY

số trường hợp số trường hợp bị


(case) hợp lệ (valid) thiếu dữ liệu
(missing)

Case Processing Summary


Cases
Valid Missing Total
N Percent N Percent N Percent
nhecan * gioi 473 78.8% 127 21.2% 600 100.0%

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 17
BẢNG CROSSTABULATION
nhecan * gioi Crosstabulation
Tần số gioi Total
thực tế nam nu
(quan Count 204 241 445
sát cnls>=2500
Expected Count 203.2 241.8 445.0
được) % within nhecan 45.8% 54.2% 100.0%
% within gioi 94.4% 93.8% 94.1%
nhecan
Count 12 16 28
Expected Count 12.8 15.2 28.0
cnls <2500g
% within nhecan 42.9% 57.1% 100.0%
% within gioi 5.6% 6.2% 5.9%
Tần Count 216 257 473
số Expected Count 216.0 257.0 473.0
Total
mong % within nhecan 45.7% 54.3% 100.0%
đợi % within gioi 100.0% 100.0% 100.0%

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 18
LƯU Ý:

 Kiểm định Chi-square:


 Dùng để so sánh tỷ lệ trên 2 hoặc nhiều nhóm tương ứng với biến
độc lập, tức là dùng để xét mối liên quan giữa 2 biến số định tính.
 Các giả định sau cần thoả mãn:
 (1) Các quan sát độc lập nhau;
 (2) Bảng 2x2: Không có ô nào có giá trị mong đợi (Expected Count) < 5;
Hoặc ở các bảng tiếp liên lớn hơn: tất cả các ô có giá trị mong đợi > 1 và
≤ 20% số ô có giá trị mong đợi < 5.
 Trường hợp giả định trên bị vi phạm  sử dụng kiểm định chính
xác Fisher (Fisher's Exact Test).

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 19
BẢNG CROSSTABULATION
nhecan * gioi Crosstabulation
gioi Total
nam nu
Count 204 241 445
Expected Count 203.2 241.8 445.0
cnls>=2500 Tần số
% within nhecan 45.8% 54.2% 100.0%
% within gioi 94.4% 93.8% 94.1% mong đợi
nhecan
Count 12 16 28 <5?
Expected Count 12.8 15.2 28.0
cnls <2500g
% within nhecan 42.9% 57.1% 100.0%
% within gioi 5.6% 6.2% 5.9%
Count 216 257 473
Expected Count 216.0 257.0 473.0
Total
% within nhecan 45.7% 54.3% 100.0%
% within gioi 100.0% 100.0% 100.0%

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 20
BẢNG CHI-SQUARE TESTS
Chi-Square Tests
Value df Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1-
sided) sided) sided)
a
Pearson Chi-Square .095 1 .758
b
Continuity Correction .013 1 .911
Likelihood Ratio .095 1 .758
Fisher's Exact Test .846 .457
Linear-by-Linear
.094 1 .759
Association
N of Valid Cases 473
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is
12.79.
b. Computed only for a 2x2 table

Kết luận:
• Ta có 𝜒 2 =0,095; df=1, p=0,758 > 0,05.
•  Tỷ lệ nhẹ cân ở hai giới của trẻ là tương đương với độ tin cậy 95%.
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 21
4. BÀI TOÁN 3: KIỂM ĐỊNH TỪ 3 TỶ LỆ TRỞ LÊN (CÁC NHÓM ĐỘC LẬP)

 Ví dụ 3: So sánh tình trạng thiếu máu giữa 3 nhóm


tuổi khác nhau ở trẻ (< 6 tuổi, 6-10 tuổi và >10
tuổi) với độ tin cậy 95%.
 H0: Tỷ lệ thiếu máu là tương đương nhau ở 3 nhóm
tuổi khác nhau của trẻ.
 H1: Tỷ lệ thiếu máu là không tương đương ở 3 nhóm
tuổi khác nhau ở trẻ.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 22
OUTPUT

số trường hợp bị thiếu


số trường hợp (case) dữ liệu (missing)
hợp lệ (valid)

Case Processing Summary


Cases
Valid Missing Total
N Percent N Percent N Percent
thieumau_Hb * tuoi_3nhom 600 100.0% 0 0.0% 600 100.0%

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 23
BẢNG CROSSTABULATION
thieumau_Hb * tuoi_3nhom Crosstabulation
tuoi_3nhom Total
Tần số
<6 tuoi 6-10 tuoi >10 tuoi
thực tế
Count 210 95 58 363
Expected Count 209.3 99.8 53.8 363.0
Khong
% within thieumau_Hb 57.9% 26.2% 16.0% 100.0%
% within tuoi_3nhom 60.7% 57.6% 65.2% 60.5%
thieumau_Hb
Count 136 70 31 237
Expected Count 136.7 65.2 35.2 237.0
Co
% within thieumau_Hb 57.4% 29.5% 13.1% 100.0%
(1) Ô có tần số % within tuoi_3nhom 39.3% 42.4% 34.8% 39.5%
mong đợi <1? Count 346 165 89 600
(2) >20% ô có Expected Count 346.0 165.0 89.0 600.0
Total
tần số mong % within thieumau_Hb 57.7% 27.5% 14.8% 100.0%
đợi <5? % within tuoi_3nhom 100.0% 100.0% 100.0% 100.0%

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 24
BẢNG CHI-SQUARE TEST
Chi-Square Tests
Value df Asymp. Sig. (2-
sided)
a
Pearson Chi-Square 1.408 2 .495
Likelihood Ratio 1.416 2 .493
Linear-by-Linear
.156 1 .693
Association
N of Valid Cases 600
a. 0 cells (0.0%) have expected count less than 5. The minimum
expected count is 35.16.

Kết luận: Ta có χ2=1,408; df=2, p=0,495 > 0,05.


 Tỷ lệ thiếu máu ở các nhóm tuổi là tương đương với
độ tin cậy 95%.
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 25
B. KIỂM ĐỊNH GIẢ THUYẾT CHO BIẾN SỐ ĐỊNH LƯỢNG

 Các dạng kiểm định trung bình được sử dụng


trong SPSS:
 Kiểm định một giá trị trung bình của mẫu với một
giá trị trung bình lý thuyết (trung bình cho trước) 
kiểm định t một mẫu (One - Sample T - test).
 Kiểm định 2 giá trị trung bình  kiểm định t hai mẫu
độc lập (Independent - samples T - test).
 Kiểm định > 2 giá trị trung bình  test ANOVA một
chiều (One-way ANOVA).
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 26
B.1 KIỂM ĐỊNH MỘT TRUNG BÌNH LÝ THUYẾT VỚI MỘT
TRUNG BÌNH NGHIÊN CỨU (KIỂM ĐỊNH T - MỘT MẪU)

 dùng để kiểm định có hay không sự khác biệt của giá trị trung
bình của một biến số định lượng đơn với một giá trị trung bình
cho trước (trung bình lý thuyết) với giả thuyết ban đầu là giá trị
trung bình cần kiểm định không khác với giá trị trung bình lý
thuyết đó.
 Ví dụ: Kiểm định xem có sự khác nhau hay không giữa trung
bình cân nặng của trẻ lúc mới sinh của mẫu nghiên cứu với
trọng lượng 2.500 gam với độ tin cậy 95%.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 27
B.1. KIỂM ĐỊNH MỘT TRUNG BÌNH LÝ THUYẾT VỚI MỘT
TRUNG BÌNH NGHIÊN CỨU (KIỂM ĐỊNH T - MỘT MẪU)

 Các bước tiến hành


 Mở file số liệu.
 Chọn dòng lệnh Analyze/Compare Means/One-Samples
T-test.
 Chọn biến số định lượng cần kiểm định đưa qua ô bên
phải (Test variables).
 Xác định giá trị cần kiểm định đưa vào ô Test Value.
 Xác định độ tin cậy bằng Option.
 Continue/OK.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 28
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 29
OUTPUT:

Vì p < 0,001< 0,05 nên ta bác bỏ giả thuyết Ho, nghĩa là trung
bình cân nặng lúc sinh của nhóm nghiên cứu khác biệt với 2.500g
với độ tin cậy 95%.
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 30
B.2 KIỂM ĐỊNH HAI TRUNG BÌNH
(KIỂM ĐỊNH T HAI MẪU ĐỘC LẬP)

 Ví dụ: Kiểm định xem có sự khác biệt giữa cân


nặng lúc sinh của trẻ em trai và trẻ em gái trong
mẫu nghiên cứu với độ tin cậy 95%?

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 31
CÁC BƯỚC TIẾN HÀNH

 Mở file số liệu.
 Dùng dòng lệnh Analyze/Compare Means/
Independent - Samples T - test.
 Chọn biến số cần kiểm định (cannanglucsinh) đưa
qua ô bên phải: Ô Test variables.
 Đưa biến số định tính (gioi) vào ô Grouping variable.
 Trong ô Define group, chọn 1: Trai; 2: Gái.
 Continue/OK.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 32
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 33
DEFINE GROUPS...

Numeric grrouping
variables

String grouping
variables
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 34
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 35
OUTPUT

p=0.108>0.05

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 36
B.3 PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU
(ONE WAY - ANOVA)

 Ví dụ: Hãy so sánh cân nặng lúc sinh của con của các
bà mẹ ở 3 nhóm học vấn với độ tin cậy 95%?
 Trình độ học vấn của bà mẹ chia làm 3 nhóm như sau:
 Nhóm 1: Từ tiểu học trở xuống
 Nhóm 2: Trung học cơ sở
 Nhóm 3: Trung học phổ thông trở lên.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 37
CÁC BƯỚC TIẾN HÀNH

 Mở file số liệu.
 Analyze/Compare Means/One-way ANOVA.
 Chọn biến số định lượng cần kiểm định để đưa vào ô Dependent list.
 Chọn biến số phân loại cần kiểm định để đưa vào ô Factor.
 Chọn Options: Để có giá trị trung bình các nhóm, ta chọn:
 chọn Descriptive
 chọn Homogeneity of Variances test.
 Chọn Post Hoc: Để so sánh từng cặp.
 chọn LSD nếu phương sai bằng nhau.
 chọn Dunnett’s T3 nếu phương sai không bằng nhau.
 Continue/OK.

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 38
CÁC BƯỚC THỰC HIỆN

(1) Analyze  Compare Means  One-Way ANOVA...

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 39
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 40
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 41
 Descriptives.

p=0.372>0.05  Chấp nhận


Test of Homogeneity of Variances.
H0 phương sai tương đương

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 42
ANOVA
p-value >0,05  Post-hoc không
cần thiết.

p=0.731>0.05  giá trị trung bình cân nặng lúc sinh của các trẻ là con của bà
mẹ ở 3 mức học vấn là không khác nhau với độ tin cậy 95%

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 43
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 44
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 45
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 46
TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 47
BÀI TẬP

 1. Kiểm định xem tỷ lệ thiếu máu ở trẻ em ở nghiên cứu này có khác với tỷ
lệ thiếu máu ở trẻ em tại Thành phố A là 20% hay không với độ tin cậy
95%?
 2. Tình trạng thiếu máu có liên quan đến nhóm cân nặng lúc sinh (< 2.500
gram và ≥ 2.500 gram) hay không với độ tin cậy 95%.
 3. Trình độ học vấn của mẹ có liên quan đến nhóm cân nặng lúc sinh của
trẻ hay không với độ tin cậy 95%?
 4. Tình trạng thiếu máu có liên quan đến trình độ học vấn của mẹ hay
không với độ tin cậy 95%.
 5. Phương pháp sinh có liên quan đến đến nhóm cân nặng lúc sinh của trẻ
(<2500 g và >=2500g) hay không với độ tin cậy 95%?

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 48
BÀI TẬP

1. Kiểm định xem chiều cao của các trẻ > 10 tuổi có khác biệt với
chiều cao 140 cm với độ tin cậy 95%?
2. Cho biết số lượng và tỷ lệ các trẻ nhẹ cân (cân nặng lúc sinh <
2500g) và không nhẹ cân (≥ 2.500g). Kiểm định xem trung bình
chu vi vòng cánh tay của trẻ > 10 tuổi có khác nhau giữa tình
trạng lúc sinh nhẹ cân và không nhẹ cân với độ tin cậy 95%?
3. Phân nhóm cân nặng lúc sinh của trẻ làm 3 nhóm: nhóm 1: <
2.500g; nhóm 2: 2.500 - 4.000g; nhóm 3: > 4.000g. Cho biết số
lượng và tỷ lệ các nhóm cân nặng lúc sinh. Kiểm định xem trung
bình chu vi vòng cánh tay của trẻ > 10 tuổi có khác nhau giữa
các nhóm cân nặng lúc sinh với độ tin cậy 95%?

TKDSSKSS.YTCC@GMAIL.COM 21.10.2018 49

You might also like