You are on page 1of 80

ĐẠI HỌC Y DƯỢC TP.

HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG

ỨNG DỤNG
KIỂM ĐỊNH T, ANOVA, PHI THAM SỐ

Học phần: Thống kê y học

Huỳnh Ngọc Vân Anh

Bộ môn Thống kê y học và Tin học


MỤC TIÊU

Sau khi học xong, học viên có khả năng:


1. Tính được các giá trị như độ tự do, thống kê t,
thống kê F bằng phần mềm Stata.
2. Ứng dụng được các kiểm định t, ANOVA và
phép kiểm phi tham số trong nghiên cứu khoa
học.

2
3

ÔN TẬP
Biến độc lập
Biến Nhị giá Danh định Thứ tự - Định lượng
phụ thuộc
Đa biến
Định lượng Tương quan Pearson
có phân phối T-test ANOVA
bình thường Hồi quy tuyến tính
Định lượng
phân phối Mann- Kruskal-
Tương quan Spearman
KHÔNG bình Whitney Wallis
thường

Chi bình Chi bình Hồi quy Logistic


Nhị giá
phương phương Hồi quy Poisson
3
ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG

1. KIỂM ĐỊNH T
1.1. Kiểm định giả thuyết cho 1 trung bình
Một nghiên cứu được tiến hành trên 20 người về
việc tuân thủ chế độ ăn đặc biệt. Kết quả là lượng
đường huyết trung bình là 90mg% và độ lệch
chuẩn là 12mg%. Trong khi đó, đường huyết trung
bình của dân số là 100mg%.
→Câu hỏi: đường huyết trung bình của mẫu có bằng
với trung bình của dân số hay không?

5
1.1. Kiểm định giả thuyết cho 1 trung bình
1. Ho: lượng đường huyết trung bình là 100mg%
2. Lựa chọn kiểm định phù hợp: kiểm định t một mẫu
với 20 – 1 = 19 độ tự do
3. Tính giá trị phân phối t nếu giả thuyết Ho đúng
(x -  ) 90 − 100 − 10
t= = = = −3,73
sd / n 12 / 20 2,68
4. Tính xác suất xảy ra | t | = 3,73 dựa trên bảng phân
phối t với 19 độ tự do → 0,001 < p < 0,002.
5. Kết luận: số liệu này rất ít phù hợp với giả thuyết Ho
và chúng ta bác bỏ giả thuyết Ho. 6
Tra bảng phân phối t

3,73

7
1.1. Kiểm định giả thuyết cho 1 trung bình
Câu lệnh Stata:
ttesti quansatmau tbinhmau dolechmau tbinhdanso
ttesti 20 90 12 100

One-sample t test

Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

x 20 90 2.683282 12 84.38383 95.61617

mean = mean(x) t = -3.7268


Ho: mean = 100 degrees of freedom = 19

Ha: mean < 100 Ha: mean != 100 Ha: mean > 100
Pr(T < t) = 0.0007 Pr(|T| > |t|) = 0.0014 Pr(T > t) = 0.9993
8
1.1. Kiểm định giả thuyết cho 1 trung bình
Mở tập tin tlsosinh.dta. Biết rằng trọng lượng sơ
sinh trung bình của dân số là 3000gr.
→Câu hỏi: Trọng lượng sơ sinh trung bình của mẫu
có bằng với trung bình của dân số hay không?

9
1.1. Kiểm định giả thuyết cho 1 trung bình
Câu lệnh Stata:
ttest biendinhluong = #
ttesti tlsosinh = 3000

One-sample t test

Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

tlsosinh 641 3129.137 25.78336 652.7827 3078.507 3179.767

mean = mean(tlsosinh) t = 5.0086


Ho: mean = 3000 degrees of freedom = 640

Ha: mean < 3000 Ha: mean != 3000 Ha: mean > 3000
Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000

10
1.2. Kiểm định t bắt cặp
Một nghiên cứu muốn so sánh chỉ số huyết áp tâm
thu của 10 bệnh nhân trước và sau khi dùng thuốc
hạ áp. Kết quả nghiên cứu thu thập được như sau:

11
1.2. Kiểm định t bắt cặp
Đối tượng Trước Sau Hiệu số
(X0) (X1) (d)
1 128 115 13
2 115 112 3
3 106 107 -1
4 128 119 9
5 122 115 7
6 145 138 7
7 132 126 6
8 109 105 4
9 102 104 -2
10 117 115 2
Trung bình 120,4 115,6 4,8
Ðộ lệch chuẩn 13,2 10,3 4,6 12
1.2. Kiểm định t bắt cặp
Bước 1: Xây dựng giả thuyết Ho
- Sau điều trị HATT của mỗi cá nhân không thay đổi
- Trung bình hiệu số của HATT bằng zero
Bước 2: Chọn kiểm định phù hợp
Kiểm định t bắt cặp với 10 – 1 = 9 độ tự do
Bước 3:
- Tính trung bình, độ lệch chuẩn của hiệu số
- Giá trị t
13
1.2. Kiểm định t bắt cặp
Bước 3: Tính trung bình, độ lệch chuẩn của hiệu số,
giá trị t
d
d = 4,8 sd = 4,6 t= = 3,3
sd / n
Bước 4: Tra bảng t với 9 độ tự do
→0,005 < p < 0,01

Bước 5: BÁC BỎ Ho với mức ý nghĩa p<0,05


→ HATT đã giảm có ý nghĩa thống kê sau khi thực
hiện uống thuốc điều trị 14
1.2. Kiểm định t bắt cặp
Nhập số liệu vào cửa sổ Data Editor

15
1.2. Kiểm định t bắt cặp
Câu lệnh Stata:
ttest dinhluong_truoc = dinhluong_sau
ttest hatruoc = hasau
Paired t test

Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

hatruoc 10 120.4 4.182503 13.22624 110.9385 129.8615


hasau 10 115.6 3.259857 10.30857 108.2257 122.9743

diff 10 4.8 1.443761 4.565572 1.533987 8.066013

mean(diff) = mean(hatruoc - hasau) t = 3.3247


Ho: mean(diff) = 0 degrees of freedom = 9

Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0


Pr(T < t) = 0.9956 Pr(|T| > |t|) = 0.0089 Pr(T > t) = 0.0044

16
1.3. Kiểm định t
với phương sai đồng nhất
Trong 641 đối tượng tham gia nghiên cứu có 326
trẻ trai và 315 trẻ gái. Trọng lượng sơ sinh trung
bình của trẻ trai là 3211,3 gram với độ lệch chuẩn
là 666,0 gram. Trọng lượng sơ sinh trung bình của
trẻ gái là 3044,1 gram với độ lệch chuẩn là 628,7
gram.

Vậy, trọng lượng sơ sinh trung bình của trẻ trai và


trẻ gái khác nhau có ý nghĩa thống kê hay không?

17
1.3. Kiểm định t
với phương sai đồng nhất
1. Ho: Trọng lượng sơ sinh trung bình của trẻ trai
= trọng lượng sơ sinh trung bình của trẻ gái
2. Lựa chọn kiểm định: Kiểm định t không bắt cặp với
n1 + n2 – 2 = 639 độ tự do
3. Tính giá trị t nếu giả thuyết Ho đúng
(ntrai − 1) sd trai
2
+ (ngái − 1) sd gái
2
325  666,0 2 + 314  628,7 2
sd = = = 647,9
(ntrai − 1) + (ngái − 1) 325 + 314
( xtrai − x gái ) 3211,3 − 3044,1 167,2
t= = = = 3,27
1 1 1 1 51,19
sd ( + ) 647,9 +
ntrai ngái 326 315 18
1.3. Kiểm định t
với phương sai đồng nhất
Ðiểm phần trăm
0.5 0.67
4. Tính xác suất của thống
0.4 0.84 kê: 0,001 < p < 0,002
0.3 1.04
5. Kết luận: Bác bỏ Ho
0.2 1.28
0.1 1.64 Trọng lượng sơ sinh trung bình
0.05 1.96 của trẻ trai khác biệt có ý nghĩa
0.02 2.33
thống kê so với trọng lượng sơ
0.01 2.58
0.005 2.81 sinh trung bình của trẻ gái.
0.002 3.09 3.27
0.001 3.29
0.0001 3.89 19
1.3. Kiểm định t
với phương sai đồng nhất
Câu lệnh Stata: ttesti n1 m1 sd1 n2 m2 sd2
ttesti 326 3211.3 666 315 3044.1 628.7
Two-sample t test with equal variances

Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

x 326 3211.3 36.88633 666 3138.734 3283.866


y 315 3044.1 35.42323 628.7 2974.403 3113.797

combined 641 3129.135 25.78464 652.8149 3078.502 3179.767

diff 167.2 51.19168 66.67576 267.7242

diff = mean(x) - mean(y) t = 3.2662


Ho: diff = 0 degrees of freedom = 639

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 0.9994 Pr(|T| > |t|) = 0.0011 Pr(T > t) = 0.0006
20
1.3. Kiểm định t
với phương sai đồng nhất
Mở tập tin tlsosinh.dta.

Hỏi trọng lượng sơ sinh trung bình của trẻ trai và


trẻ gái khác nhau có ý nghĩa thống kê hay không?

21
1.3. Kiểm định t
với phương sai đồng nhất
1
2

Bước 1: So
sánh độ lệch
chuẩn giữa 4
2 nhóm 22

22
1.3. Kiểm định t
với phương sai đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm

6 7
Biến nhị giá
Biến định lượng
8 23
1.3. Kiểm định t
với phương sai đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm
Câu lệnh Stata: sdtest dinhluong,by(nhigia)
sdtest tlsosinh,by(gioi)
Variance ratio test

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

Nu 315 3044.127 35.421 628.6603 2974.434 3113.819


Nam 326 3211.279 36.88521 665.9798 3138.715 3283.843

combined 641 3129.137 25.78336 652.7827 3078.507 3179.767

ratio = sd(Nu) / sd(Nam) f = 0.8911


Ho: ratio = 1 degrees of freedom = 314, 325

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1


Pr(F < f) = 0.1518 2*Pr(F < f) = 0.3037 Pr(F > f) = 0.8482
24
1.3. Kiểm định t
với phương sai đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
1
2

3 4

25
1.3. Kiểm định t
với phương sai đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm

5
Biến định lượng
6 7
Biến nhị giá

8 26
1.3. Kiểm định t
với phương sai đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
Câu lệnh Stata: ttest dinhluong,by(nhigia)
ttest tlsosinh,by(gioi)
Two-sample t test with equal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

Nu 315 3044.127 35.421 628.6603 2974.434 3113.819


Nam 326 3211.279 36.88521 665.9798 3138.715 3283.843

combined 641 3129.137 25.78336 652.7827 3078.507 3179.767

diff -167.1522 51.18935 -267.6718 -66.63249

diff = mean(Nu) - mean(Nam) t = -3.2654


Ho: diff = 0 degrees of freedom = 639

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 0.0006 Pr(|T| > |t|) = 0.0012 Pr(T > t) = 0.9994 27
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Mở tập tin tlsosinh.dta.

Hỏi trọng lượng sơ sinh trung bình của trẻ sinh non
so với trẻ không sinh non khác nhau có ý nghĩa
thống kê hay không?

28
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
1
2

Bước 1: So
sánh độ lệch
chuẩn giữa 4
2 nhóm 29

29
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm

6 7
Biến nhị giá
Biến định lượng
8 30
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm
Câu lệnh Stata: sdtest dinhluong,by(nhigia)
sdtest tlsosinh,by(sinhnon)
Variance ratio test

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

0 552 3286.833 20.53773 482.5274 3246.492 3327.175


1 89 2151.067 76.27273 719.5555 1999.491 2302.643

combined 641 3129.137 25.78336 652.7827 3078.507 3179.767

ratio = sd(0) / sd(1) f = 0.4497


Ho: ratio = 1 degrees of freedom = 551, 88

Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1


Pr(F < f) = 0.0000 2*Pr(F < f) = 0.0000 Pr(F > f) = 1.0000
31
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
1
2

3 4

32
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm

5
Biến định lượng
6 7
8
Biến nhị giá

9 33
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
Câu lệnh Stata: ttest dinhluong,by(nhigia) unequal
ttest tlsosinh,by(sinhnon) unequal
Two-sample t test with unequal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

Khong 552 3286.833 20.53773 482.5274 3246.492 3327.175


Co 89 2151.067 76.27273 719.5555 1999.491 2302.643

combined 641 3129.137 25.78336 652.7827 3078.507 3179.767

diff 1135.766 78.98942 979.0748 1292.457

diff = mean(Khong) - mean(Co) t = 14.3787


Ho: diff = 0 Satterthwaite's degrees of freedom = 101.139

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000
34
ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG

2. PHÂN TÍCH PHƯƠNG SAI

(KIỂM ĐỊNH ANOVA)


2. Kiểm định ANOVA

Nhà nghiên cứu muốn tìm hiểu yếu tố ảnh hưởng đến
trọng lượng sơ sinh của trẻ. Câu hỏi đặt ra là ở những
bà mẹ có nghề nghiệp khác nhau thì sinh con có trọng
lượng khác nhau hay không?

Nhóm nghề tự do n = 104, x = 2981.41, sd = 643.76


Nhóm nghề công nhân n = 238, x = 3118.08, sd = 646.69
Nhóm nghề viên chức n = 299, x = 3189.32, sd = 654.20
Tính giá trị F và p-value???
36
2. Kiểm định ANOVA
Ở những bà mẹ có nghề nghiệp khác nhau thì sinh
con có trọng lượng khác nhau hay không?

Bước 1: Xây dựng giả thuyết Ho


Trọng lượng trẻ sơ sinh trung bình giữa các nhóm
bà mẹ là như nhau.

Bước 2: Chọn kiểm định phù hợp


Kiểm định so sánh nhiều trung bình

37
2. Kiểm định ANOVA
Bước 3: Tính giá trị của thống kê
Tự do Công nhân Viên chức
Ta có:
n 104 238 299
X = 3129.136
Xj 2981.41 3118.08 3189.32
sj 643.76 646.69 654.2
Bảng phân tích phương sai:
𝑆𝑆 MSb
Nguồn biến thiên SS d.f. 𝑀𝑆 =
𝑛−𝑘
F=
MS w
Giữa các nhóm 3382844.5 2 1691422.2
4.01
Trong các nhóm 269338597 638 422160.81
38
2. Kiểm định ANOVA
F= 4.01 df1=2 df2=638

4.01 0.01<p<0.025

39
2. Kiểm định ANOVA

Bước 5: Kết luận


Vì 0.01<p<0.025 BÁC BỎ giả thuyết Ho

Vậy, có sự khác nhau về trọng lượng sơ sinh trung


bình giữa con của các bà mẹ có nghề nghiệp khác
nhau.

40 40
2. Kiểm định ANOVA
Câu lệnh Stata:
aovsum, n(n1 n2 n3) m(m1 m2 m3) sd(sd1 sd2 sd3)
aovsum, n(104 238 299) m(2981.41 3118.08 3189.32) sd(643.76 646.69 654.2)
Groups Summary of Response variable
(cells) Mean Std. Dev. Obs.

1 2981.41 643.76 104


Giá trị p của
2
3
3118.08
3189.32
646.69
654.2
238
299 kiểm định Anova
Total 3129.1363 652.78285 641

Analysis of Variance
Source SS df MS F Prob > F

Between groups 3381693 2 1690846.5 4.01 0.0187


Within groups 269338597 638 422160.81
Giá trị p của
Total 272720290 640 kiểm định phương sai
426125.453

Bartlett's test for equal variances: chi2(2) = 0.0558 Prob>chi2 = 0.972


41
2. Kiểm định ANOVA
Mở tập tin tlsosinh.dta.
Hãy so sánh trọng lượng sơ sinh trung bình giữa
những bà mẹ có nghề nghiệp khác nhau?

42
2. Kiểm định ANOVA
1

43
2. Kiểm định ANOVA

5 6

Biến định lượng Biến danh định


7

8
44
2. Kiểm định ANOVA
Câu lệnh Stata: oneway dinhluong dinhtinh, tab
oneway tlsosinh nghenghiep, tab
Summary of trong luong so sinh
Nghe nghiep (gram)
cua me Mean Std. Dev. Freq.

1 2981.4135 643.76283 104 Giá trị p của


2 3118.084 646.69338 238
3 3189.3177 654.19649 299 kiểm định Anova
Total 3129.1373 652.78265 641

Analysis of Variance
Source SS df MS F Prob > F

Between groups 3381483.56 2 1690741.78 4.00 0.0187


Within groups 269338638 638 422160.875
Giá trị p của
Total 272720122 640 426125.19kiểm định phương sai

Bartlett's test for equal variances: chi2(2) = 0.0558 Prob>chi2 = 0.973 45


2. Kiểm định ANOVA
Câu lệnh Stata: oneway dinhluong dinhtinh, tab
oneway tlsosinh nghenghiep, tab

- Kiểm định Bartlest’s so sánh phương sai cho thấy


p = 0,973 > 0,05 → CHẤP NHẬN Ho.
→ Phương sai giữa các nhóm bằng nhau
- Kiểm định Anova cho thấy p = 0,0187
→ BÁC BỎ Ho
→ Có sự khác biệt về trọng lượng sơ sinh trung bình
của trẻ giữa những bà mẹ có nghề nghiệp khác nhau.
46
ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG

3. KIỂM ĐỊNH PHI THAM SỐ


3. Kiểm định phi tham số
(non-parametric)
- Thay thế cho kiểm định t, ANOVA khi biến định
lượng có phân phối bị lệch.
- Dùng để so sánh thứ hạng của biến số định lượng
giữa các nhóm.
- So sánh biến định lượng giữa các nhóm khi không
quan tâm đến độ lớn sự khác biệt và không cần kiểm
tra giả định.
- Khuyết điểm:
Khó tính khoảng tin cậy.
Không thể mở rộng sang đa biến. 48
3.1. Kiểm định phi tham số
Mann-Whitney
- Còn gọi là kiểm định tổng sắp hạng Wilcoxon.
- Các bước tiến hành:
1. Xếp hạng tất cả các số liệu của cả 2 nhóm
(từ hạng 1 đến hạng N)
2. Tính tổng sắp hạng của từng nhóm (R1, R2)
3. Tính thống kê U của từng nhóm
U1 = R1 – n1(n1 + 1) / 2
U2 = R2 – n2(n2 + 1) / 2
4. Chọn thống kê U từ giá trị nhỏ nhất trong U1 và U2
5. Tra bảng để có giá trị p 49
3.1. Kiểm định phi tham số
Mann-Whitney
Ví dụ: Có dãy số liệu:
Nhóm 1: 77 78 70 72 65 74 (n1 = 6)
Nhóm 2: 60 62 70 76 68 72 70 (n2 = 7)
Bước 1: Xếp hạng số liệu
60 62 65 68 70 70 70 72 72 74 76 77 78
1 2 3 4 5 6 7 8 9 10 11 12 13
1 2 3 4 6 6 6 8.5 8.5 10 11 12 13
Bước 2: Tính tổng sắp hạng
R1 = 3 + 6 + 8.5 + 10 + 12 + 13 = 52.5
50
R2 = 1 + 2 + 4 + 6 + 6 + 8.5 + 11 = 38.5
3.1. Kiểm định phi tham số
Mann-Whitney
Ví dụ: Có dãy số liệu:
Nhóm 1: 77 78 70 72 65 74 (n1 = 6)
Nhóm 2: 60 62 70 76 68 72 70 (n2 = 7)
Bước 3: Tính thống kê U

U1 = 52.5 – 6 x (6 + 1) / 2 = 31.5
U2 = 38.5 – 7 x (7 + 1) / 2 = 10.5
Chọn giá trị U nhỏ nhất → U = 10.5
Bước 4: Tra bảng
51
3.1. Kiểm định phi tham số
Mann-Whitney

U = 10.5 > 6
→ p > 0.05

52
3.1. Kiểm định phi tham số
Mann-Whitney
Mở tập tin tlsosinh.dta.
Hãy so sánh tuổi thai của trẻ giữa những bà mẹ có
cao huyết áp so với những bà mẹ không cao huyết áp.
Biết rằng tuổi thai có phân phối bị lệch.

53
3.1. Kiểm định phi tham số
Mann-Whitney
1
2

54
3.1. Kiểm định phi tham số
Mann-Whitney

5 6

Biến định lượng Biến nhị giá

55
3.1. Kiểm định phi tham số
Mann-Whitney
Câu lệnh Stata: ranksum dinhluong,by(nhigia)
ranksum tuoithai,by(cha)
Two-sample Wilcoxon rank-sum (Mann-Whitney) test

cha obs rank sum expected

0 552 186162 177192


1 89 19599 28569

combined 641 205761 205761

unadjusted variance 2628348.00


adjustment for ties -843.61

adjusted variance 2627504.39

Ho: tuoithai(cha==0) = tuoithai(cha==1)


z = 5.534
Prob > |z| = 0.0000 56
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
- Dùng thay thế cho kiểm định t bắt cặp.
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1
57
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Các bước tiến hành:

1. Loại bỏ mọi hiệu số bằng zero. Sắp xếp các hiệu số còn
lại theo thứ tự tăng dần.

2. Cộng các hạng có hiệu số dương và các hạng theo hiệu


số âm và kí hiệu tổng này là T+ và T-

T+ = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5

T- = 3,5 + 1 = 4,5
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Các bước tiến hành:

3. Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc đánh
giá T, số nhỏ hơn.

Nếu không có sự khác biệt thì T+ = T-

Nếu có sự khác biệt thì T+ > T- hoặc T+ < T-

T = số nhỏ hơn của T+ và T-

→ Chọn T = 4,5

4. Tra bảng
3.2. Kiểm định sắp hạng
có dấu Wilcoxon

4.5<8.47

P<0.05
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Mở tập tin antihyr.dta.
So sánh nhịp tim trước và sau điều trị. Biết rằng nhịp
tim có phân phối lệch.

61
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
1
2

62
3.2. Kiểm định sắp hạng
có dấu Wilcoxon

5 6

Định lượng Định lượng

63
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Câu lệnh Stata: signrank dinhluongtrước = dinhluongsau
signrank hrate1 = hrate2
Wilcoxon signed-rank test

sign obs sum ranks expected

positive 10 72.5 38.5


negative 1 4.5 38.5
zero 1 1 1

all 12 78 78

unadjusted variance 162.50


adjustment for ties -2.50
adjustment for zeros -0.25

adjusted variance 159.75

Ho: hrate1 = hrate2


z = 2.690
Prob > |z| = 0.0071
64
3.3. Kiểm định phi tham số
Kruskall-Wallis
- Thay thế cho kiểm định ANOVA khi biến định lượng
có phân phối bị lệch.
- Các bước tiến hành:
1. Xếp hạng tất cả các số liệu (từ hạng 1 đến hạng N)
2. Tính trung bình hạng các giá trị từ k mẫu
3. Tính giá trị K
4. Tra bảng ni

r 12 gi


ij
j =1 k= ni (ri − r )
ri = N ( N + 1) i =1
ni
65
3.3. Kiểm định phi tham số
Kruskall-Wallis
Mở tập tin tlsosinh.dta.
Hãy so sánh tuổi thai của trẻ giữa những bà mẹ có
nghề nghiệp khác nhau.
Biết rằng tuổi thai có phân phối bị lệch.

66
3.3. Kiểm định phi tham số
Kruskall-Wallis
1
2

67
3.3. Kiểm định phi tham số
Kruskall-Wallis

Biến định lượng


5
6

Biến danh định

7
68
3.3. Kiểm định phi tham số
Kruskall-Wallis
Câu lệnh Stata: kwallis dinhluong,by(danhdinh)
kwallis tuoithai,by(nghenghiep)
Kruskal-Wallis equality-of-populations rank test

ngheng~p Obs Rank Sum

1 104 34714.50
2 238 72973.50
3 299 98073.00

chi-squared = 2.361 with 2 d.f.


probability = 0.3072

chi-squared with ties = 2.362 with 2 d.f.


probability = 0.3070
69
ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG

BÀI TẬP
Bài tập 1
Trung bình và độ lệch chuẩn của đường huyết của
15 người tuân thủ chế độ ăn đặc biệt là 90mg% và
độ lệch chuẩn là 12. Kiểm định giả thuyết Ho:
đường huyết trung bình của nhóm người này bằng
với đường huyết trung bình của quần thể bằng
100mg%. Giá trị của phép kiểm t là (lấy trị số tuyệt
đối của t)
a. 2,54 b. 3,23
c. 2,12 d. 2,80
71
Bài tập 2
Trong một nghiên cứu có 9 người nam tuổi từ 20 -
29 được tiêm Digoxin. Bốn và tám giờ sau khi tiêm,
số liệu của 9 người này lần lượt là
(1,0 - 1,0), (1,3 - 1,3), (0,9 - 0,7), (1,0 - 1,0),
(1,0 - 0,9), (0,9 - 0,8), (1,3 -1,2), (1,1 - 1,0),
(1,0 - 1,0).
Hãy cho biết nồng độ Digoxin có thay đổi hay
không?

72
Bài tập 3
Một nghiên cứu thực nghiệm để so sánh thời gian
không có triệu chứng giữa 2 nhóm bệnh nhân hen
(mỗi nhóm 10 bệnh nhân) được chia ngẫu nhiên và
sử dụng 2 loại thuốc: Ở nhóm A thời gian không có
triệu chứng (theo ngày) là: 16; 16; 20; 22; 28; 30;
30; 30; 34; 40 và của 10 người dùng thuốc B là:
9; 12; 14; 15; 17; 19; 19; 22; 29; 30.
Hãy so sánh thời gian không triệu chứng trung bình
giữa 2 nhóm bệnh nhân hen?

73
Bài tập 4
Để so sánh lượng corticoid/24h trong nước tiểu của
phụ nữ béo phì và phụ nữ bình thường, người ta
thu được kết quả, trong 120 người béo phì có
lượng corticoid trung bình là 6,3mg, sd=1,7mg và
trong 148 người bình thường có lượng corticoid
trung bình là 4,5 mg, sd=1,5mg.
Hỏi lượng corticoid trung bình trong 24 giờ có khác
biệt giữa 2 nhóm hay không?

74
Bài tập 5

Hỏi có sự khác biệt trong nồng độ hemoglobin (H) giữa


các bệnh nhân bị các loại bệnh hồng cầu liềm khác nhau
hay không?
Loại HbS/beta-
HbSS HbSC
bệnh thalassemia
7.2 7.7 8.0 8.1 9.2 10.7 11.3 11.5
8.1 8.3 8.4 10.0 10.4 11.6 11.7 11.8
Số liệu 8.4 8.5 8.6 10.6 10.9 12.0 12.1 12.3
8.7 9.1 9.1 11.1 11.9 12.6 12.6 13.3
9.1 9.8 10.1 10.3 12.0 12.1 13.3 13.8 13.9
75
TÓM TẮT
a. Kiểm định 1 mẫu:

- Giả thuyết Ho: x=


(x -  )
- Giá trị t: t=
sd / n
- Độ tự do: df = N - 1

b. Kiểm định t bắt cặp:

- Giả thuyết Ho: x tr = x sau


d
- Giá trị t: t=
sd / n
- Độ tự do: df = N - 1
76
TÓM TẮT

c. Kiểm định t không bắt cặp:


- Giả thuyết Ho: x1 = x 2

(n1 − 1) s12 + (n2 − 1) s22


- Độ lệch chuẩn gộp: sd =
(n1 − 1) + (n2 − 1)

( x1 − x2 ) ( x1 − x2 )
- Giá trị t: t= =
SE 1 1
sd ( + )
n1 n2
- Độ tự do: df = n1 + n2 - 2

77
TÓM TẮT
d. Kiểm định ANOVA: k

- Trung bình (mean): N


j =1
j X j

X =
N k

- Tổng bình phương nội bộ nhóm: SS w =  ( N j − 1)( s j ) 2


j =1
k

- Tổng bình phương giữa các nhóm: b  j j


= − 2
SS N ( X X )
j =1

SS w SS w
- Trung bình bình phương nội bộ: MS w = =
d. f2 n − k
SSb SSb
- Tr.bình bình phương giữa các nhóm MSb = =
d . f1 k − 1
MSb
- Trung bình bình phương: F =
MSw
78
CÂU LỆNH STATA
1. Kiểm định t:
Đã có biến số:
ttest dinhluong = #
ttest dinhluong_truoc = dinhluong_sau
ttest dinhluong, by(nhigia)

Chưa có biến số:


ttesti quansatmau tbinhmau dolechmau tbinhdanso
ttesti n1 m1 sd1 n2 m2 sd2
79
CÂU LỆNH STATA
2. Kiểm định ANOVA:
Đã có biến số:
oneway dinhluong dinhtinh, tab
Chưa có biến số:
aovsum, n(n1 n2 n3) m(m1 m2 m3) sd(sd1 sd2 sd3)
3. Kiểm định phi tham số:
ranksum dinhluong, by(nhigia)
signrank dinhluongtrước = dinhluongsau
kwallis dinhluong, by(danhdinh) 80

You might also like