Professional Documents
Culture Documents
Stata Chi2Fisher
Stata Chi2Fisher
nguyenlamvuong@gmail.com
Ngày 14/10/2019
Sử dụng kiểm định gì?
1. Tăng huyết áp có liên quan đến trẻ sinh nhẹ cân không?
2. Nghề nghiệp của mẹ có liên quan đến trẻ sinh nhẹ cân không?
3. Tuổi thai có liên quan đến trẻ sinh nhẹ cân không?
2
Chọn lựa kiểm định
3
Mục tiêu
1. Chọn lựa các phép kiểm hợp lý với kết cuộc định tính
2. Phép kiểm Chi bình phương
3. Phép kiểm chính xác Fisher
4. Sử dụng Stata để thực hiện các phép kiểm
4
Kiểm định với kết cuộc định tính
5
Kiểm định với kết cuộc định tính
6
Phép kiểm Chi bình phương
• Nguyên tắc: phép kiểm Chi2 so sánh giá trị quan sát với giá trị kỳ vọng
(vọng trị) khi giả thuyết H0 đúng (tỷ lệ các nhóm bằng nhau)
• Tính vọng trị: E = (Tổng hàng) x (Tổng cột) / Tổng chung
• Tính giá trị thống kê: X2 = ∑[(Oi – Ei)2/Ei] Oi: giá trị quan sát ở ô thứ i
Ei: vọng trị ở ô thứ i
• Điều kiện sử dụng: kiểm định Chi2 hợp lệ khi có ít hơn 20% số vọng trị <5 và
không có vọng trị nào <1 [theo Cochrane 1954].
• Nếu không phù hợp với phép kiểm Chi2, sử dụng phép kiểm chính xác Fisher
7
Phép kiểm Chi bình phương
8
Phép kiểm Chi bình phương
9
Phép kiểm Chi bình phương
10
Phép kiểm Chi bình phương
• Tính độ tự do:
Độ tự do = (Tổng số hàng – 1) x (Tổng số cột – 1) = 1
11
Phép kiểm Chi bình phương
12
Phép kiểm Chi bình phương
Kết luận:
• P < 0,0005
• Bác bỏ giả thuyết H0
• Tỷ lệ mắc cúm ở 2 nhóm khác biệt có ý nghĩa thống kê
13
Phép kiểm chính xác Fisher
14
Phép kiểm chính xác Fisher
• Sắp xếp bảng số liệu: tổng hàng nhỏ hơn nằm ở trên
5 30 35 2 23 25
2 23 25 5 30 35
7 53 60 7 53 60
15
Phép kiểm chính xác Fisher
• Chuyển ô đầu tiên thành 0, thay đổi các giá trị sao cho tổng hàng và
tổng cột vẫn giữ nguyên
0 25 25
7 28 35
7 53 60
16
Phép kiểm chính xác Fisher
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p=0.017 p=0.105 p=0.252 p=0.312
4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p=0.214 p=0.082 p=0.016 p=0.001
17
Phép kiểm chính xác Fisher
• Tính giá trị p: p của Fisher 2 đuôi là tổng các p nhỏ hơn p bảng ban đầu
p = 0.017+0.105+0.252+0.082+0.016+0.001 = 0.687
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p=0.017 p=0.105 p=0.252 p=0.312
4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p=0.214 p=0.082 p=0.016 p=0.001
18
Phép kiểm chính xác Fisher
Kết luận:
• P > 0,05
• Không bác bỏ giả thuyết H0
• Tỷ lệ mắc cúm ở 2 nhóm khác biệt không có ý nghĩa thống kê
19
Phép kiểm Chi2 và Fisher
20
Kiểm định với kết cuộc định tính
Ví dụ 1:
– Ăn cay và nguy cơ tử vong[1]. Các nhà NC theo dõi 487 375 người tuổi 30-79 trong
hơn 7 năm để tìm hiểu mối liên quan giữa tần số ăn cay và nguy cơ tử vong:
Ví dụ 1:
. tabi 4636 273855 \ 1893 146702, exp ro chi exact
| col
row | 1 2 | Total
-----------+----------------------+----------
1 | 4,636 273,855 | 278,491
| 4,257.4 274,233.6 | 278,491.0
| 1.66 98.34 | 100.00
-----------+----------------------+----------
2 | 1,893 146,702 | 148,595
| 2,271.6 146,323.4 | 148,595.0
| 1.27 98.73 | 100.00
-----------+----------------------+----------
Total | 6,529 420,557 | 427,086
| 6,529.0 420,557.0 | 427,086.0
| 1.53 98.47 | 100.00
22
Kiểm định với kết cuộc định tính
Ví dụ 2:
– Tử vong trên tàu Titanic[2]. Ngày 10/4/1912, tàu du lịch Titanic chở 1309 du khách
gặp nạn. Trong tai nạn này có 809 người không may mắn tử vong. Số người tử vong
và sống sót được phân chia theo hạng vé như sau:
Chết Sống
Hạng I 123 200
Hạng II + III 416 300
Tổng số 809 500
[2] http://lib.stat.cmu.edu/S/Harrell/data/descriptions/titanic3info.txt 23
Kiểm định với kết cuộc định tính
Ví dụ 2:
. tabi 123 200 \ 416 300, exp ro chi exact
| col
row | 1 2 | Total
-----------+----------------------+----------
1 | 123 200 | 323
| 167.6 155.4 | 323.0
| 38.08 61.92 | 100.00
-----------+----------------------+----------
2 | 416 300 | 716
| 371.4 344.6 | 716.0
| 58.10 41.90 | 100.00
-----------+----------------------+----------
Total | 539 500 | 1,039
| 539.0 500.0 | 1,039.0
| 51.88 48.12 | 100.00
24
Kiểm định với kết cuộc định tính
Ví dụ 3:
– Ung thư phổi và hút thuốc lá[3]. Nghiên cứu do Richard Doll và Bradford Hill thực
hiện. Họ chọn 649 người mắc bệnh ung thư phổi, và 649 người không mắc bệnh
(nhóm chứng). Sau đó, họ �m hiểu �ền sử hút thuốc lá của những người này.
Ví dụ 3:
. tabi 647 622 \ 2 27, exp co chi exact
| col
row | 1 2 | Total
-----------+----------------------+----------
1 | 647 622 | 1,269
| 634.5 634.5 | 1,269.0
| 99.69 95.84 | 97.77
-----------+----------------------+----------
2 | 2 27 | 29
| 14.5 14.5 | 29.0
| 0.31 4.16 | 2.23
-----------+----------------------+----------
Total | 649 649 | 1,298
| 649.0 649.0 | 1,298.0
| 100.00 100.00 | 100.00
26
Thực hành với Stata
27
Thực hành với Stata
. tab gioi sinhnon, chi exact ro exp gioi tinh |
tre - |
+--------------------+ 1=trai, | sinhnon
| Key | 0=gai | 0 1 | Total
|--------------------| -----------+----------------------+----------
| frequency | 0 | 270 45 | 315
| expected frequency | | 271.3 43.7 | 315.0
| row percentage | | 85.71 14.29 | 100.00
+--------------------+ -----------+----------------------+----------
1 | 282 44 | 326
| 280.7 45.3 | 326.0
| 86.50 13.50 | 100.00
-----------+----------------------+----------
Total | 552 89 | 641
| 552.0 89.0 | 641.0
| 86.12 13.88 | 100.00
28
Tóm tắt
29