You are on page 1of 29

Nguyễn Lâm Vương

nguyenlamvuong@gmail.com

Ngày 14/10/2019
Sử dụng kiểm định gì?

1. Tăng huyết áp có liên quan đến trẻ sinh nhẹ cân không?
2. Nghề nghiệp của mẹ có liên quan đến trẻ sinh nhẹ cân không?
3. Tuổi thai có liên quan đến trẻ sinh nhẹ cân không?

2
Chọn lựa kiểm định

3
Mục tiêu

1. Chọn lựa các phép kiểm hợp lý với kết cuộc định tính
2. Phép kiểm Chi bình phương
3. Phép kiểm chính xác Fisher
4. Sử dụng Stata để thực hiện các phép kiểm

4
Kiểm định với kết cuộc định tính

Các bước kiểm định:


1. Xây dựng giả thuyết H0, giả thuyết H1 và ngưỡng ý nghĩa
2. Chọn lựa kiểm định phù hợp
3. Tính chỉ số thống kê tương ứng
4. Tính xác suất (giá trị p)
5. Kết luận

5
Kiểm định với kết cuộc định tính

• Phép kiểm Chi bình phương


Dựa trên sự khác biệt giữa giá trị quan sát và vọng trị
• Phép kiểm chính xác Fisher
Dựa trên xác suất các bảng khi thay đổi giá trị trong bảng

6
Phép kiểm Chi bình phương

• Nguyên tắc: phép kiểm Chi2 so sánh giá trị quan sát với giá trị kỳ vọng
(vọng trị) khi giả thuyết H0 đúng (tỷ lệ các nhóm bằng nhau)
• Tính vọng trị: E = (Tổng hàng) x (Tổng cột) / Tổng chung

• Tính giá trị thống kê: X2 = ∑[(Oi – Ei)2/Ei] Oi: giá trị quan sát ở ô thứ i
Ei: vọng trị ở ô thứ i

• Tính độ tự do: df = (Số hàng – 1) x (Số cột – 1)

• Điều kiện sử dụng: kiểm định Chi2 hợp lệ khi có ít hơn 20% số vọng trị <5 và
không có vọng trị nào <1 [theo Cochrane 1954].

• Nếu không phù hợp với phép kiểm Chi2, sử dụng phép kiểm chính xác Fisher
7
Phép kiểm Chi bình phương

• Ví dụ: Vaccine phòng bệnh cúm

Mắc bệnh cúm


Tiêm phòng Tổng
Có Không
Vaccine 20 (8,3%) 220 240
Giả dược 80 (36,4%) 140 220
Tổng 100 360 460

8
Phép kiểm Chi bình phương

• Chọn phép kiểm chi bình phương: tính vọng trị

Mắc bệnh cúm


Tiêm phòng Tổng
Có Không
Vaccine 20 a 220 c 240
Giả dược 80 b 140 d 220
Tổng 100 360 460

9
Phép kiểm Chi bình phương

• Chọn phép kiểm chi bình phương: tính vọng trị

Mắc bệnh cúm


Tiêm phòng Tổng
Có Không
Vaccine 20 52,2 220 187,8 240
Giả dược 80 47,8 140 172,2 220
Tổng 100 360 460

10
Phép kiểm Chi bình phương

• Tính giá trị thống kê:

• Tính độ tự do:
Độ tự do = (Tổng số hàng – 1) x (Tổng số cột – 1) = 1

11
Phép kiểm Chi bình phương

• Tính giá trị p: (Giá trị thống kê: 53,01; Độ tự do: 1)

12
Phép kiểm Chi bình phương

Kết luận:
• P < 0,0005
• Bác bỏ giả thuyết H0
• Tỷ lệ mắc cúm ở 2 nhóm khác biệt có ý nghĩa thống kê

13
Phép kiểm chính xác Fisher

• Ví dụ: Vaccine phòng bệnh cúm

Mắc bệnh cúm


Tiêm phòng Tổng
Có Không
Vaccine 5 30 35
Giả dược 2 23 25
Tổng 7 53 60

14
Phép kiểm chính xác Fisher

• Sắp xếp bảng số liệu: tổng hàng nhỏ hơn nằm ở trên

5 30 35 2 23 25
2 23 25 5 30 35
7 53 60 7 53 60

15
Phép kiểm chính xác Fisher

• Chuyển ô đầu tiên thành 0, thay đổi các giá trị sao cho tổng hàng và
tổng cột vẫn giữ nguyên

0 25 25
7 28 35
7 53 60

16
Phép kiểm chính xác Fisher

• Tính xác suất cho mỗi bảng

0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p=0.017 p=0.105 p=0.252 p=0.312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p=0.214 p=0.082 p=0.016 p=0.001
17
Phép kiểm chính xác Fisher

• Tính giá trị p: p của Fisher 2 đuôi là tổng các p nhỏ hơn p bảng ban đầu
p = 0.017+0.105+0.252+0.082+0.016+0.001 = 0.687

0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p=0.017 p=0.105 p=0.252 p=0.312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p=0.214 p=0.082 p=0.016 p=0.001
18
Phép kiểm chính xác Fisher

Kết luận:
• P > 0,05
• Không bác bỏ giả thuyết H0
• Tỷ lệ mắc cúm ở 2 nhóm khác biệt không có ý nghĩa thống kê

19
Phép kiểm Chi2 và Fisher

20
Kiểm định với kết cuộc định tính

Ví dụ 1:
– Ăn cay và nguy cơ tử vong[1]. Các nhà NC theo dõi 487 375 người tuổi 30-79 trong
hơn 7 năm để tìm hiểu mối liên quan giữa tần số ăn cay và nguy cơ tử vong:

Ít hơn 1 lần/tuần 6-7 ngày/tuần


Không tử vong do ung thư 273 855 146 702
Tử vong do ung thư 4 636 1 893
Tổng số 278 491 148 595

[1] BMJ 2015;351:h3942 doi: 10.1136/bmj.h3942 21


Kiểm định với kết cuộc định tính

Ví dụ 1:
. tabi 4636 273855 \ 1893 146702, exp ro chi exact

| col
row | 1 2 | Total
-----------+----------------------+----------
1 | 4,636 273,855 | 278,491
| 4,257.4 274,233.6 | 278,491.0
| 1.66 98.34 | 100.00
-----------+----------------------+----------
2 | 1,893 146,702 | 148,595
| 2,271.6 146,323.4 | 148,595.0
| 1.27 98.73 | 100.00
-----------+----------------------+----------
Total | 6,529 420,557 | 427,086
| 6,529.0 420,557.0 | 427,086.0
| 1.53 98.47 | 100.00

Pearson chi2(1) = 98.2798 Pr = 0.000


Fisher's exact = 0.000
1-sided Fisher's exact = 0.000

22
Kiểm định với kết cuộc định tính

Ví dụ 2:
– Tử vong trên tàu Titanic[2]. Ngày 10/4/1912, tàu du lịch Titanic chở 1309 du khách
gặp nạn. Trong tai nạn này có 809 người không may mắn tử vong. Số người tử vong
và sống sót được phân chia theo hạng vé như sau:

Chết Sống
Hạng I 123 200
Hạng II + III 416 300
Tổng số 809 500

[2] http://lib.stat.cmu.edu/S/Harrell/data/descriptions/titanic3info.txt 23
Kiểm định với kết cuộc định tính

Ví dụ 2:
. tabi 123 200 \ 416 300, exp ro chi exact

| col
row | 1 2 | Total
-----------+----------------------+----------
1 | 123 200 | 323
| 167.6 155.4 | 323.0
| 38.08 61.92 | 100.00
-----------+----------------------+----------
2 | 416 300 | 716
| 371.4 344.6 | 716.0
| 58.10 41.90 | 100.00
-----------+----------------------+----------
Total | 539 500 | 1,039
| 539.0 500.0 | 1,039.0
| 51.88 48.12 | 100.00

Pearson chi2(1) = 35.7358 Pr = 0.000


Fisher's exact = 0.000
1-sided Fisher's exact = 0.000

24
Kiểm định với kết cuộc định tính

Ví dụ 3:
– Ung thư phổi và hút thuốc lá[3]. Nghiên cứu do Richard Doll và Bradford Hill thực
hiện. Họ chọn 649 người mắc bệnh ung thư phổi, và 649 người không mắc bệnh
(nhóm chứng). Sau đó, họ �m hiểu �ền sử hút thuốc lá của những người này.

Ung thư phổi Nhóm chứng


Hút thuốc lá 647 622
Không hút thuốc lá 2 27
Tổng số 649 649

[3] R Doll and B Hill. BMJ 1950; ii:739-748 25


Kiểm định với kết cuộc định tính

Ví dụ 3:
. tabi 647 622 \ 2 27, exp co chi exact

| col
row | 1 2 | Total
-----------+----------------------+----------
1 | 647 622 | 1,269
| 634.5 634.5 | 1,269.0
| 99.69 95.84 | 97.77
-----------+----------------------+----------
2 | 2 27 | 29
| 14.5 14.5 | 29.0
| 0.31 4.16 | 2.23
-----------+----------------------+----------
Total | 649 649 | 1,298
| 649.0 649.0 | 1,298.0
| 100.00 100.00 | 100.00

Pearson chi2(1) = 22.0442 Pr = 0.000


Fisher's exact = 0.000
1-sided Fisher's exact = 0.000

26
Thực hành với Stata

• Tập tin số liệu: ivf_v.dta (tlsosinh.dta)


Hãy cho biết có mối liên quan giữa �nh trạng sinh non của trẻ với giới �nh hay
không?

27
Thực hành với Stata
. tab gioi sinhnon, chi exact ro exp gioi tinh |
tre - |
+--------------------+ 1=trai, | sinhnon
| Key | 0=gai | 0 1 | Total
|--------------------| -----------+----------------------+----------
| frequency | 0 | 270 45 | 315
| expected frequency | | 271.3 43.7 | 315.0
| row percentage | | 85.71 14.29 | 100.00
+--------------------+ -----------+----------------------+----------
1 | 282 44 | 326
| 280.7 45.3 | 326.0
| 86.50 13.50 | 100.00
-----------+----------------------+----------
Total | 552 89 | 641
| 552.0 89.0 | 641.0
| 86.12 13.88 | 100.00

Pearson chi2(1) = 0.0834 Pr = 0.773


Fisher's exact = 0.820
1-sided Fisher's exact = 0.431

28
Tóm tắt

Phân tích với kết cuộc định tính cần nhớ:


• Sử dụng kiểm định Chi2 cho bảng nxn
• Khi >20% vọng trị <5 không sử dụng Chi2 mà thay bằng Fisher
• Khi báo cáo kết quả nên có đủ các thông tin:
– Tỷ lệ kết cuộc theo phơi nhiễm (hoặc phơi nhiễm theo kết cuộc)
– Khác biệt có ý nghĩa thống kê hay không
– Mức độ ảnh hưởng của phơi nhiễm đến kết cuộc (số đo kết hợp)

29

You might also like