You are on page 1of 48

ĐẠI HỌC Y DƯỢC TP.

HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG

KIỂM ĐỊNH CHI BÌNH PHƯƠNG,


FISHER

Học phần: Thống kê y học

Huỳnh Ngọc Vân Anh

Bộ môn Thống kê y học và Tin học


MỤC TIÊU

Sau khi học xong, học viên có khả năng:


1. Tính được các giá trị như độ tự do, vọng trị, chi
bình phương.
2. Ứng dụng được các kiểm định Chi bình
phương, Fisher trong nghiên cứu khoa học.
3

ÔN TẬP
Biến độc lập
Biến Nhị giá Danh định Thứ tự - Định lượng
phụ thuộc
Đa biến
Định lượng Tương quan Pearson
có phân phối T-test ANOVA
bình thường Hồi quy tuyến tính
Định lượng
phân phối Mann- Kruskal-
Tương quan Spearman
KHÔNG bình Whitney Wallis
thường

Chi bình Chi bình Hồi quy Logistic


Nhị giá
phương phương Hồi quy Poisson
4

ÔN TẬP

Bước 1 Xây dựng giả thuyết Ho


Các
bước Bước 2 Chọn kiểm định phù hợp
xây
Tính giá trị thống kê χ 2 của số
dựng Bước 3
liệu thu thập được
1
Tính xác suất của thống kê χ2 –
kiểm Bước 4
gọi là giá trị p
định
Bước 5 Kết luận chấp nhận Ho hay
bác bỏ Ho
1. KIỂM ĐỊNH CHI BÌNH PHƯƠNG

(χ2)
6
1. Kiểm định χ2:
Công dụng của kiểm định χ2:
- Kiểm định sự liên quan giữa các biến số hàng và
biến số cột.
- Sự phân phối của các cá nhân của một biến số
này có phụ thuộc vào sự phân phối của biến kia
hay không.
- Bảng có hai hàng và hai cột (2 x 2) → gọi là so
sánh hai tỷ lệ.
- Bảng có nhiều hàng và nhiều cột (n x m) → gọi
là so sánh nhiều tỷ lệ.
7
1. Kiểm định χ2:

Có 240 người được tiêm vacxin phòng bệnh cúm


và 220 người không được tiêm vacxin. Trong
nhóm tiêm vacxin có 20 người bị cúm và trong
nhóm không được tiêm vacxin có 80 người bị
cúm. Hãy so sánh tỷ lệ mắc cúm giữa 2 nhóm?
Có sự khác biệt về tỷ lệ mắc cúm giữa nhóm tiêm
so với nhóm không được tiêm vacxin hay không?
Có mối liên quan giữa việc tiêm ngừa với bệnh
cúm hay không?
8
1. Kiểm định χ2:

- Giả thuyết Ho: p1 = p2 = ... = pn


Total _col  Total _row
- Vọng trị: E=
Total_table
(O − E ) 2
- Giá trị 2 :  2 = 
E
- Cách tính nhanh 2 (chỉ áp dụng cho bảng 2 x 2)
N  ( ad − bc ) 2
 =
2

h1h2 c1c2
- Độ tự do: df = (r – 1)(c – 1)
9
1. Kiểm định χ2:
Bước 1: Đặt giả thuyết Ho
- Tỷ lệ mắc cúm ở nhóm có tiêm vacxine và nhóm
tiêm placebo là như nhau
- Không có sự khác biệt về tỷ lệ mắc bệnh cúm
giữa nhóm tiêm vacxin so với nhóm không tiêm
vacxin
10
1. Kiểm định χ2:
Bước 2: Chọn lựa kiểm định phù hợp
Kiểm định phù hợp là kiểm định 2 với độ tự do
df = (h – 1)(c – 1) = (2 – 1)(2 – 1) = 1
Bước 3: Tính giá trị thống kê
Lập bảng phân phối tần suất
Bệnh cúm
Đặc tính
Có Không Tổng
a b
Có 20 220 240
Tiêm c d
Không 80 140 220
vacxin
Tổng 100 360 460
11
1. Kiểm định χ2:
Bước 3: Tính giá trị thống kê
Total _col  Total _row
Tính vọng trị: E=
Total _table
Ea= (100 x 240) / 460 = 52,2
Eb= (360 x 240) / 460 = 187,8
Ec= (100 x 220) / 460 = 47,8
Ed= (360 x 220) / 460 = 172,2
Bệnh cúm
Đặc tính
Có Không Tổng
a b
Có 20 220 240
Tiêm c d
Không 80 140 220
vacxin
Tổng 100 360 460
12
1. Kiểm định χ2:
Bước 3: Tính giá trị thống kê
Tính 2 :
(O − E ) 2
2 =  , d. f . = 1
E
Trong đó:
O: Số quan sát
E: Vọng trị Bệnh cúm
Đặc tính
Có Không Tổng
52,2 187,8
Có 20 220 240
Tiêm 47,8 172,2
Không 80 140 220
vacxin
Tổng 100 360 460
13
1. Kiểm định χ2:
Bước 3: Tính giá trị thống kê
Tính 2 :
( 20 − 52, 2) 2
(80 − 47,8) 2
( 220 − 187,8) 2
(140 − 172, 2) 2
2 = + + +
52,2 47,8 187,8 172,2
= 19,86 + 21,69 + 5,52 + 6,02
= 53,09
Bệnh cúm
Đặc tính
Có Không Tổng
52,2 187,8
Có 20 220 240
Tiêm 47,8 172,2
Không 80 140 220
vacxin
Tổng 100 360 460
14
1. Kiểm định χ2:
Bước 3: Tính giá trị thống kê
Tính 2 :

N  (ad − bc) 2
460  (20 140 − 220  80) 2
 =
2
= = 53,09
h1h2 c1c2 100  360  240  220

Bệnh cúm
Đặc tính
Có Không Tổng
a b h1
Có 20 220 240
Tiêm c d h2
Không 80 140 220
vacxin
c1 c2 N
Tổng 100 360 460
15
1. Kiểm định χ2:
Bước 4: Tính xác suất của thống kê

Ta có 2 = 53,09 > 10,83 p<0,001


Giá trị
P
d.f. 0.5 0.25 0.1 0.05 0.025 0.01 0.005 0.001

1 0.45 1.32 2.71 3.84 5.02 6.63 7.88 10.83

2 1.39 2.77 4.61 5.99 7.38 9.21 10.60 13.82

3 2.37 4.11 6.25 7.81 9.35 11.34 12.84 16.27

4 3.36 5.39 7.78 9.49 11.14 13.28 14.86 18.47

5 4.35 6.63 9.24 11.07 12.83 15.09 16.75 20.51


16
1. Kiểm định χ2:
Bước 5: Kết luận

Do p< 0,001 BÁC BỎ giả thuyết Ho


- Có sự khác biệt về tỷ lệ mắc bệnh cúm ở nhóm
có tiêm vacxin so với nhóm không tiêm vacxin

- Những người tiêm vacxin có tỷ lệ mắc cúm thấp


hơn so với những người không được tiêm vacxin
17
1. Kiểm định χ2:
Tính hợp lệ của kiểm định:
- Kiểm định χ2 sẽ hợp lệ nếu có ít hơn 20% số
các giá trị vọng trị <5 và KHÔNG CÓ giá trị vọng
trị nào <1. (Cochran - 1954)
-Vọng trị nhỏ → kiểm định chính xác theo Fisher
(Fisher‘s exact)
18
1. Kiểm định χ2:

Tính phần trăm theo CỘT:

Key
tabi 20 220 \ 80 140, co
frequency
column percentage

col
row 1 2 Total

1 20 220 240
20.00 61.11 52.17

2 80 140 220
80.00 38.89 47.83

Total 100 360 460


100.00 100.00 100.00
19
1. Kiểm định χ2:

Tính phần trăm theo HÀNG:

Key tabi 20 220 \ 80 140, ro


frequency
row percentage

col
row 1 2 Total

1 20 220 240
8.33 91.67 100.00

2 80 140 220
36.36 63.64 100.00

Total 100 360 460


21.74 78.26 100.00
20
1. Kiểm định χ2:

Tính VỌNG TRỊ:

Key tabi 20 220 \ 80 140, exp


frequency
expected frequency

col
row 1 2 Total

1 20 220 240
52.2 187.8 240.0

2 80 140 220
47.8 172.2 220.0

Total 100 360 460


100.0 360.0 460.0
21
1. Kiểm định χ2:

Tính CHI BÌNH PHƯƠNG:

tabi 20 220 \ 80 140, chi


col
row 1 2 Total

1 20 220 240
2 80 140 220

Total 100 360 460

Pearson chi2(1) = 53.0084 Pr = 0.000


22
1. Kiểm định χ2:

Tính CHI BÌNH PHƯƠNG VÀ % THEO HÀNG:

Key tabi 20 220 \ 80 140, ro chi


frequency
row percentage

col
row 1 2 Total

1 20 220 240
8.33 91.67 100.00

2 80 140 220
36.36 63.64 100.00

Total 100 360 460


21.74 78.26 100.00

Pearson chi2(1) = 53.0084 Pr = 0.000


23
Câu lệnh trong Stata:
Kiểm định chi bình phương:
Chưa có biến số:
tabi a b \ c d , exp chi
tabi 20 220 \ 80 140 , exp chi
Có biến số:
tab biếnphụthuộc biếnđộclập, exp chi
Biến phụ thuộc và biến độc lập đều là biến số định tính
2. KIỂM ĐỊNH FISHER
25
2. Kiểm định Fisher:
- Thay thế kiểm định chi bình phương khi có >20%
các ô có vọng trị <5 hoặc có ô vọng trị <1
Quy trình tiến hành:
1. Sắp xếp lại bảng sao số liệu có tổng hàng nhỏ
hơn nằm trên a b a+b
c d c+d
a+c b+d N

5 30 35 2 23 25
2 23 25 5 30 35
7 53 60 7 53 60
26
2. Kiểm định Fisher:
Quy trình tiến hành:

2. Bắt đầu liệt kê bảng đầu tiên có ô (1,1) = 0; (1,2)


= a + b; (2,1) = a + c; (2,2) =(c + d) – (a + c)

0 25
7 28

3. Bảng kế tiếp sẽ tăng ô (1,1) lên 1 đơn vị; giảm ô


(1,2) và (2,1) đi 1 và tăng (2,2) lên 1
1 24
6 29
27
2. Kiểm định Fisher:
Quy trình tiến hành:
4. Tiếp tục cho đến khi nào có 1 ô có giá trị là 0 thì dừng

0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
28
2. Kiểm định Fisher:
Quy trình tiến hành:
5. Tính xác suất cho mỗi bảng:

0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001

(a + b)!(c + d )!(a + c)!(b + d )!


a!b!c!d!n!
29
2. Kiểm định Fisher:
Quy trình tiến hành:
6. Giá trị p của kiểm định Fisher (1 đuôi) là giá trị nhỏ
nhất trong 3 trường hợp:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
• p(0) + p(1) + … + p(a) = 0,018 + 0,105 + 0,252
= 0,375
• p(a) + p(a+1) + … + p(k) = 0,252 + 0,312
+ 0,214 + 0,082 + 0,016 + 0,001 = 0,877
• 0,5 p = 0,375
30
2. Kiểm định Fisher:
Quy trình tiến hành:
6. Giá trị p của kiểm định Fisher (2 đuôi) là là tổng giá trị
nhỏ hơn giá trị p của bảng ban đầu:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
• Giá trị p của bảng ban đầu = 0,252

• pFisher = 0,018 + 0,105 + 0,252 + 0,214 + 0,082


+ 0,016 + 0,001 = 0,688
p = 0,688
31
Câu lệnh trong Stata:
Kiểm định chính xác Fisher:
Chưa có biến số:
tabi a b \ c d , exp exact
tabi 5 30 \ 2 23 , exp exact
Có biến số:
tab biếnphụthuộc biếnđộclập, exp exact
Biến phụ thuộc và biến độc lập đều là biến số định tính
BÀI TẬP
33
Bài tập 1
Ứng dụng phương pháp điều trị A cho 20 đối
tượng có 6 người khỏi bệnh và điều trị B cho 20
người có 13 người khỏi bệnh. Sử dụng kiểm
định chi bình phương, chúng ta có thể kết luận

Điều trị A cho tỷ lệ Điều trị A tỷ lệ điều


A khỏi bệnh tốt hơn B trị khỏi tương
điều trị B 1,76 lần đương điều trị B

C Điều trị B có hiệu Điều trị A cho tỷ lệ


quả tốt hơn điều trị A D điều trị khỏi cao hơn
điều trị B
34
Bài tập 1
tabi 6 14 \ 13 7, exp chi

col
row 1 2 Total

1 6 14 20
9.5 10.5 20.0

2 13 7 20
9.5 10.5 20.0

Total 19 21 40
19.0 21.0 40.0

Pearson chi2(1) = 4.9123 Pr = 0.027


35
Bài tập 1a
Ứng dụng phương pháp điều trị A cho 20 đối
tượng có 7 người khỏi bệnh và điều trị B cho 20
người có 13 người khỏi bệnh. Sử dụng kiểm
định chi bình phương, chúng ta có thể kết luận

Điều trị A cho tỷ lệ Điều trị A tỷ lệ điều


A khỏi bệnh tốt hơn B trị khỏi tương
điều trị B 1,76 lần đương điều trị B

C Điều trị B có hiệu Điều trị A cho tỷ lệ


quả tốt hơn điều trị A D điều trị khỏi cao hơn
điều trị B
36
Bài tập 2
Một khảo sát nhằm nghiên cứu sự liên quan của
tình trạng kinh tế xã hội và bệnh tiêu chảy ở trẻ
em. Nhà nghiên cứu chọn ngẫu nhiên 2 nhóm trẻ:
40 trẻ ở gia đình khá giả và 50 trẻ từ các gia đình
nghèo. Kết quả sau 3 tháng quan sát có 10 trẻ
trong gia đình khá giả bị tiêu chảy và trong gia
đình nghèo có 30 trẻ bị tiêu chảy.
Vậy, có liên quan giữa tình trạng kinh tế xã hội và
bệnh tiêu chảy ở trẻ em hay không?
37
Bài tập 2
tabi 10 30 \ 30 20, exp chi
col
row 1 2 Total

1 10 30 40
17.8 22.2 40.0

2 30 20 50
22.2 27.8 50.0

Total 40 50 90
40.0 50.0 90.0

Pearson chi2(1) = 11.0250 Pr = 0.001


38
Bài tập 3
Một cuộc điều tra việc sử dụng mùng được tiến hành
trong một mẫu ngẫu nhiên gồm các đứa trẻ <7 tuổi ở
khu vực Tây Nguyên. Điều tra ghi nhận dân tộc của
đứa trẻ thường ngủ mùng có tẩm permethrin, mùng
không tẩm permethrin hay không ngủ mùng, kết quả
như bảng dưới. Hỏi việc tẩm mùng có liên quan đến
dân tộc hay không? Tẩm mùng
Không Mùng Mùng tẩm
mùng không tẩm permethrin
Êđê 3 88 165
Dân tộc K’Ho 43 73 76
Stiêng 29 16 26
39
Bài tập 3
tabi 3 88 165 \ 43 73 76 \ 29 16 26, exp chi
col
row 1 2 3 Total

1 3 88 165 256
37.0 87.3 131.7 256.0

2 43 73 76 192
27.7 65.5 98.8 192.0

3 29 16 26 71
10.3 24.2 36.5 71.0

Total 75 177 267 519


75.0 177.0 267.0 519.0

Pearson chi2(4) = 94.2124 Pr = 0.000


40
Bài tập 4

Để so sánh phản ứng của 2 loại vacxin X và Y,


người ta tiêm cho 348 trẻ được chia làm 2 nhóm
như bảng sau:
Nhẹ TB Loét Áp xe
Vacxin X 12 156 8 1
Vacxin Y 29 135 6 1
Hỏi: tác dụng của 2 loại vacxin có
như nhau?
41
Bài tập 4
tabi 12 156 8 1 \ 29 135 6 1, exp chi exact
col
row 1 2 3 4 Total

1 12 156 8 1 177
20.9 148.0 7.1 1.0 177.0

2 29 135 6 1 171
20.1 143.0 6.9 1.0 171.0

Total 41 291 14 2 348


41.0 291.0 14.0 2.0 348.0

Pearson chi2(3) = 8.7491 Pr = 0.033


Fisher's exact = 0.017
42
Bài tập 5
Mở tập tin tlsosinh.dta.
Hãy cho biết có mối liên quan giữa tình trạng
sinh non của trẻ với giới tính hay không?
Biết rằng sinh non khi tuổi thai <37 tuần.
43
Bài tập 5
Đường dẫn trong Stata:
1
2
3

4
44
Bài tập 5
Đường dẫn trong Stata:

Biến cột
Biến hàng Kiểm
5 định Chi 6
10 bình
11 phương 7 % theo cột
Kiểm định 8 % theo hàng
Fisher
9 Vọng trị

12
45
Bài tập 5
tab sinhnon gioi, co ro exp chi
gioi tinh tre -
1=trai, 0=gai
sinhnon gai trai Total Vì p = 0,773
du thang 270 282 552
→ CHẤP NHẬN Ho
271.3 280.7 552.0
48.91 51.09 100.00 → Không có sự
85.71 86.50 86.12
khác biệt về tỷ lệ
sinhnon 45
43.7
44
45.3
89
89.0
sinh non giữa trẻ
50.56 49.44 100.00 trai và trẻ gái.
14.29 13.50 13.88

Total 315 326 641


Hay không có mối
315.0
49.14
326.0
50.86
641.0
100.00
liên quan giữa sinh
100.00 100.00 100.00 non và giới tính.
Pearson chi2(1) = 0.0834 Pr = 0.773
46
Bài tập 6
Mở tập tin tlsosinh.dta.
Hãy cho biết có mối liên quan giữa tình trạng
sinh non của trẻ với tình trạng tăng huyết áp của
mẹ hay không?
47
Bài tập 6
tab sinhnon cha, co ro exp chi
Vì p < 0,001
tang huyet ap thai ki
- 1=tang ha, 0=khong → BÁC BỎ Ho
sinhnon
tang ha
ha bt ha tang Total → Có sự khác biệt
du thang 487 65 552 về tỷ lệ trẻ
475.4
88.22
76.6
11.78
552.0
100.00
sinh non giữa
88.22 73.03 86.12
những bà mẹ có so
sinhnon 65
76.6
24
12.4
89
89.0
với không có tăng
73.03
11.78
26.97
26.97
100.00
13.88
huyết áp.
Total 552 89 641
Hay có mối liên
552.0
86.12
89.0
13.88
641.0
100.00
quan giữa sinh non
100.00 100.00 100.00 và tăng huyết áp
Pearson chi2(1) = 14.7920 Pr = 0.000 của mẹ.
48
Tóm tắt câu lệnh trong Stata:
Kiểm định chi bình phương, Fisher:
Chưa có biến số: tabi a b \ c d, co ro exp chi exact
Có biến số:
tab biếnhàng biếncột, co ro exp chi exact
tab sinhnon gioi, co ro exp chi exact
co: % theo cột
ro: % theo hàng
exp: vọng trị
chi: Kiểm định Chi bình phương
exact: Kiểm định Fisher

You might also like