You are on page 1of 180

TRƯỜNG ÐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH

KHOA Y TẾ CÔNG CỘNG


Bộ môn Thống kê Y Học và Tin Học

Căn bản
thống kê y học

Betty Kirwood
(London School of Hygiene and Tropical Medicine)
Dịch thuật: Ðỗ Văn Dũng

TP Hồ Chí Minh
Tháng 1/2001
MỤC LỤC

MỤC LỤC ............................................................................................................................................. I


LỜI NÓI ÐẦU....................................................................................................................................... 1
CĂN BẢN.............................................................................................................................................. 3
Thống kê là gì?................................................................................................................................... 3
Dân số và mẫu .................................................................................................................................... 3
Xác định dân số.................................................................................................................................. 4
Phân tích số liệu và trình bày kết quả................................................................................................. 4
Chọn máy tính cầm tay....................................................................................................................... 5
TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ ............................................................. 6
Giới thiệu ........................................................................................................................................... 6
Tần suất (số liệu định tính)................................................................................................................. 6
Phân phối tần suất (số liệu định lượng) .............................................................................................. 6
Tổ chức đồ ......................................................................................................................................... 8
Ða giác tần suất .................................................................................................................................. 9
Phân phối tần suất của dân số............................................................................................................. 9
Hình dạng của phân phối tần suất..................................................................................................... 10
TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN............................................................. 11
Giới thiệu ......................................................................................................................................... 11
Trung bình, trung vị và yếu vị .......................................................................................................... 11
Số đo sự biến thiên ........................................................................................................................... 11
Tính toán trung bình và độ lệch chuẩn từ phân phối tần suất ........................................................... 13
Thay đổi đơn vị ................................................................................................................................ 14
Sai số lấy mẫu và sai số chuẩn ......................................................................................................... 14
PHÂN PHỐI BÌNH THƯỜNG ......................................................................................................... 16
Giới thiệu ......................................................................................................................................... 16
Phân phối bình thường chuẩn ........................................................................................................... 16
Bảng tính diện tích dưới đường cong của phân phối bình thường.................................................... 17
Các điểm phần trăm của phân phối bình thường .............................................................................. 19
KHOẢNG TIN CẬY CỦA TRUNG BÌNH ...................................................................................... 21
Giới thiệu ......................................................................................................................................... 21
Trường hợp mẫu cỡ lớn (phân phối bình thường) ............................................................................ 21
Mẫu nhỏ ........................................................................................................................................... 22
Khoảng tin cậy dùng phân phối t...................................................................................................... 22
Tóm tắt các trường hợp .................................................................................................................... 23
KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH....................................................................... 26
Giới thiệu ......................................................................................................................................... 26
Kiểm định t cặp đôi .......................................................................................................................... 26
Quan hệ giữa khoảng tin cậy và kiểm định ý nghĩa .......................................................................... 28
Kiểm định ý nghĩa 1 đuôi và 2 đuôi ................................................................................................. 28
Kiểm định t một mẫu........................................................................................................................ 29
Kiểm định bình thường..................................................................................................................... 29
Các loại sai lầm trong kiểm định giả thuyết ..................................................................................... 30
SO SÁNH HAI TRUNG BÌNH.......................................................................................................... 32
Giới thiệu ......................................................................................................................................... 32
Phân phối lấy mẫu của hiệu số hai trung bình .................................................................................. 32
Kiểm định bình thường (mẫu lớn hay biết độ lệch chuẩn)................................................................ 32
Kiểm định t (mẫu nhỏ, độ lệch chuẩn bằng nhau) ............................................................................ 33
Cỡ mẫu nhỏ, độ lệch chuẩn không bằng nhau .................................................................................. 35
SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI ................................................ 36
Giới thiệu ......................................................................................................................................... 36

i
Phân tích phương sai một chiều........................................................................................................ 37
Phân tích phương sai hai chiều......................................................................................................... 39
Quy hoạch cân đối có lặp ................................................................................................................. 40
Quy hoạch cân đối không lặp ........................................................................................................... 40
Quy hoạch không cân đối ................................................................................................................. 42
Tác động cố định và ngẫu nhiên....................................................................................................... 43
TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH ............................................................................... 45
Giới thiệu ......................................................................................................................................... 45
Tương quan ...................................................................................................................................... 45
Hồi quy tuyến tính............................................................................................................................ 47
Sử dụng máy tính cầm tay ................................................................................................................ 50
HỒI QUY BỘI .................................................................................................................................... 51
Giới thiệu ......................................................................................................................................... 51
Phương pháp phân tích phương sai dùng cho hồi quy tuyến tính đơn .............................................. 51
Quan hệ giữa hệ số tương quan và bảng phân tích phương sai......................................................... 52
Hồi quy bội với 2 biến số ................................................................................................................. 52
Hồi quy bội với nhiều biến............................................................................................................... 53
Hồi quy bội với các biến giải thích rời rạc ....................................................................................... 54
Hồi quy bội với các biến giải thích phi tuyến tính............................................................................ 54
Quan hệ giữa hồi quy bội và phân tích phương sai........................................................................... 55
Phân tích đa biến .............................................................................................................................. 55
XÁC SUẤT.......................................................................................................................................... 56
Giới thiệu ......................................................................................................................................... 56
Tính toán xác suất ............................................................................................................................ 56
Quy tắc nhân..................................................................................................................................... 56
Quy tắc cộng .................................................................................................................................... 57
TỈ LỆ ................................................................................................................................................... 58
Giới thiệu ......................................................................................................................................... 58
Phân phối nhị thức............................................................................................................................ 58
Kiểm định ý nghĩa cho tỉ lệ đơn dùng phân phối nhị thức................................................................ 60
Xấp xỉ phân phối bình thường của phân phối nhị thức..................................................................... 63
Kiểm định ý nghĩa và khoảng tin cậy dùng xấp xỉ bình thường ....................................................... 63
KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ .......................................................... 67
Giới thiệu ......................................................................................................................................... 67
Bảng 2 × 2 (so sánh hai tỉ lệ)............................................................................................................ 67
Công thức ngắn gọn cho bảng 2 × c ................................................................................................ 71
BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ ...................................................... 72
Giới thiệu ......................................................................................................................................... 72
Kiểm định chính xác cho bảng 2 × 2 ............................................................................................... 72
So sánh 2 tỉ lệ - trường hợp cặp đôi.................................................................................................. 73
Phân tích nhiều bảng 2 × 2 .............................................................................................................. 75
Kiểm định chi bình phương định hướng........................................................................................... 78
Kĩ thuật phức tạp hơn ....................................................................................................................... 79
ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG ........................................................................................ 81
Giới thiệu ......................................................................................................................................... 81
Tỉ suất sinh và chết........................................................................................................................... 81
Ðo lường tử vong trong một nghiên cứu .......................................................................................... 82
Ðo lường tử vong ............................................................................................................................. 82
Tỉ suất chuẩn hóa ............................................................................................................................. 84
Phân tích tỉ suất ................................................................................................................................ 87
PHÂN TÍCH SỐNG CÒN.................................................................................................................. 88
Giới thiệu ......................................................................................................................................... 88
Bảng sống......................................................................................................................................... 88
So sánh các bảng sống...................................................................................................................... 90
Mô thức sống còn............................................................................................................................. 91

ii
PHÂN PHỐI POISSON ..................................................................................................................... 92
Giới thiệu ......................................................................................................................................... 92
Ðịnh nghĩa........................................................................................................................................ 92
Hình dáng ......................................................................................................................................... 93
Kết hợp số đếm ................................................................................................................................ 93
Phân phối Poisson và tỉ suất ............................................................................................................. 94
Phân tích tỉ suất mới mắc ................................................................................................................. 95
TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT ........................................................................... 97
Giới thiệu ......................................................................................................................................... 97
Phù hợp theo phân phối bình thường................................................................................................ 97
Kiểm định phù hợp chi bình phương................................................................................................ 98
PHÉP BIẾN ÐỔI .............................................................................................................................. 102
Giới thiệu ....................................................................................................................................... 102
Phép biến đổi logarithm ................................................................................................................. 102
Chọn phép biến đổi ........................................................................................................................ 106
PHƯƠNG PHÁP PHI THAM SỐ................................................................................................... 108
Giới thiệu ....................................................................................................................................... 108
Kiểm định sắp hạng có dấu Wilcoxon............................................................................................ 109
Kiểm định tổng sắp hạng Wilcoxon ............................................................................................... 110
Tương quan sắp hạng Spearman..................................................................................................... 111
LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU .................................................................... 113
Giới thiệu ....................................................................................................................................... 113
Mục tiêu của nghiên cứu ................................................................................................................ 113
Phân tích thống kê hộ tịch .............................................................................................................. 113
Nghiên cứu quan sát ....................................................................................................................... 114
Nghiên cứu thực nghiệm ................................................................................................................ 115
Quy hoạch bản vấn lục ................................................................................................................... 116
Kiểm tra số liệu .............................................................................................................................. 117
NGUỒN GỐC SAI SỐ ..................................................................................................................... 118
Giới thiệu ....................................................................................................................................... 118
Sai số chọn lựa ............................................................................................................................... 118
Sai lệch gây nhiễu........................................................................................................................... 118
Sai lệch thông tin............................................................................................................................ 119
Ðộ nhậy cảm và độ đặc hiệu........................................................................................................... 119
Hồi quy về trung bình..................................................................................................................... 120
PHƯƠNG PHÁP LẤY MẪU........................................................................................................... 123
Giới thiệu ....................................................................................................................................... 123
Chọn mẫu ngẫu nhiên đơn.............................................................................................................. 123
Chọn mẫu hệ thống......................................................................................................................... 124
Các lược đồ lấy mẫu phức tạp hơn ................................................................................................. 124
Lấy mẫu phân tầng ......................................................................................................................... 125
Lấy mẫu nhiều bậc ......................................................................................................................... 125
Lấy mẫu cụm .................................................................................................................................. 126
NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG............................................................................ 127
Giới thiệu ....................................................................................................................................... 127
Nghiên cứu đoàn hệ........................................................................................................................ 127
Nguy cơ tương đối.......................................................................................................................... 127
Nguy cơ qui trách ........................................................................................................................... 128
Nghiên cứu bệnh chứng.................................................................................................................. 132
THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP .................................................. 136
Giới thiệu ....................................................................................................................................... 136
Thử nghiệm lâm sàng ..................................................................................................................... 136
Thử nghiệm vaccine ....................................................................................................................... 139
Nghiên cứu can thiệp...................................................................................................................... 140

iii
TÍNH CỠ MẪU CẦN THIẾT ......................................................................................................... 141
Giới thiệu ....................................................................................................................................... 141
Nguyên lí của việc xác định cỡ mẫu............................................................................................... 141
Công thức tính cỡ mẫu ................................................................................................................... 143
SỬ DỤNG MÁY TÍNH .................................................................................................................... 149
Giới thiệu ....................................................................................................................................... 149
Phần cứng máy tính ........................................................................................................................ 149
Ổ đĩa............................................................................................................................................... 149
Tổ chức dữ liệu .............................................................................................................................. 150
Sao chép lưu................................................................................................................................... 150
Phần mềm máy tính ........................................................................................................................ 151
CHÈ MUÛC...................................................................................................................................... 152

iv
LỜI NÓI ÐẦU
Mục đích của việc viết cuốn sách này là đưa những phương pháp thống kê y học đa dạng áp
dụng trong nghiên cứu y khoa vào trong thực hành, và trong khi làm việc đó, tôi hi vọng là tôi
đã kết hợp được sự đơn giản với tính sâu sắc. Tôi đã sử dụng một các sắp xếp các chủ đề
khác hơn với hầu hết các sách giáo khoa khác, dựa trên tiến trình logic những khái niệm thực
hành, hơn là dựa trên các bước phát triển của toán học hình thức. Ý tưởng thống kê được đưa
vào khi cần thiết, và tất cả các phương pháp được mô tả trong bối cảnh của những ví dụ phù
hợp được rút ra từ những tình huống thực sự. Có nhiều tham khảo qua lại để liên kết và đối
chiếu những cách tiếp cận khác nhau có thể áp dụng trong những tình huống tương tự. Theo
cách này, người đó sẽ được dẫn dắt mau hơn đến việc phân tích những vấn đề thực hành và sẽ
dễ dàng nắm bắt được những thủ tục gì có thể được áp dụng khi nào.
Cuốn sách này là thích hợp để tự học, là bạn đồng hành cho những khóa giảng về thống kê y
học hay là một tài liệu tham khảo. Nó bao gồm tất cả các chủ đề mà một nhà nghiên cứu y
khoa hay một sinh viên có thể gặp phải. Một số những phương pháp cao cấp (hay hiếm) chỉ
được mô tả ngắn gọn,và người đọc được đề nghị tham khảo những sách chuyên môn hơn. Dù
vậy, chúng tôi hi vọng rằng, ít có trường hợp phải tìm kiếm một chủ đề trong chỉ mục và tìm
không tìm được một lưu ý nào. Tất cả các công thức đề được nhấn mạnh một cách rõ ràng để
dễ dàng tham khảo và có những tóm tắt hữu dụng của những phương pháp ở bìa sách.
Cuốn sách này là sự giới thiệu ngắn gọn và trực tiếp những phương pháp và ý tưởng cơ bản
của thống kê y khoa. Dù vậy, nó không dừng ở đó. Nó có mục đích là một hướng dẫn viên
toàn diện về chủ đề. Ðối với ai thực sự quan tâm đến áp dụng thống kê, sẽ là không đủ nếu
chỉ có thể tiến hành, thí dụ như, kiểm định t. Nó cũng quan trọng để đánh giá những hạn chế
của phương pháp đơn giản và biết chúng có thể được mở rộng khi nào và như thế nào. Vì lí
do này, có những chương như phân tích phương sai và hồi quy đa biến đã được đưa vào. Khi
giải quyết với những phương pháp cao cấp, giải pháp chú trọng đến những nguyên lí có liên
quan và việc lí giải kết quả, bởi vì sự có mặt rộng rãi những phương tiện tính toán, do đó việc
làm quen với những chi tiết của tính toán không còn cần thiết nữa. Những phần cao cấp hơn
có thể được bỏ qua trong lần đọc đầu, như đã chỉ ra trong những phần thích hợp của bài. Dù
vậy, chúng tôi đề nghị phần mở đầu của tất cả các chương cần được đọc bởi vì nó cho phép
đưa các phương pháp khác nhau vào bối cảnh.
Người đọc cũng sẽ tìm thấy những chủ đề như test khuynh hướng cho bảng nhiều chiều,
phương pháp chuẩn hóa, sử dụng phép biến đổi, phân tích sống còn và nghiên cứu bệnh
chứng. Phần tư cuối của cuốn sách để dành cho những chủ đề liên quan đến việc thiết kế và
tiến hành nghiên cứu. Phần này không tách rời khỏi phần phướngphap phân tích và phản ánh
tầm quan trọng của nhận thức thống kê thông qua thực hiện nghiên cứu. Có một tóm tắt chi
tiết làm thế nào để quyết định cỡ mẫu thích hợp và việc đưa vào sử dụng máy vi tính, trong
đó có giải thích nhiều từ chuyên môn.
Cuốn sách này là sự kết hợp của nhiều năm kinh nghiệm giảng dạy thống kê cho nhiều người
chuyên môn ngành y và kinh nghiệm cộng tác nghiên cứu. Tôi hi vọng cách tiếp cận đã được
chọn lựa sẽ hấp dẫn cho bất kì ai làm việc trong hay liên quan đến lãnh vực và sẽ làm hài
lòng cả những người chuyên môn y khoa cũng như những nhà thống kê. Ðặc biệt, tôi hi vọng
kết quả sẽ trả lời những nhu cầu của nhiều người cho rằng vấn đề tiến hành công việc thống
kê không phải là cơ chế của một kiểm định đặc hiệu, mà là biết được phương pháp nào được
áp dụng khi nào.
Tôi muốn bày tỏ lòng biết ơn đến những đồng nghiệp, sinh viên và bạn bè đã hỗ trợ tôi trong
nhiệm vụ này. Ðặc biệt, tôi muốn cám ơn David Ross và Cesar Victoria đã sẵn sàng độc bản
thảo và đã góp ý hết sức chi tiết, Richard Hayes cho nhiều lần thảo luận về giảng dạy trong
nhiều năm, Laura Rodrigues đã chia xẻ sự hiểu biết sâu sắc về phương pháp dịch tễ cho tôi,
Peter Smith đã góp ý và nâng đỡ chung, Helen Edwards cho sự giúp đỡ kiên nhẫn và lành

1
nghề trong công tác đánh máy và Jacqui Wright cho việc giúp đỡ trong soạn thảo những bảng
phụ lục. Tôi cũng muốn cám ơn chồng tôi là Tom Kirkwood không những chỉ góp ý cho
những bản thảo, vô vàn cuộc thảo luận và những giúp đỡ thực tế, mà còn bởi vì sự hỗ trợ và
khuyến khích không ngừng. Tôi muốn đề tặng cuốn sách này cho Tom. Cuối cùng tôi muốn
nhắc đến Daisy và Sam Kirkwood, mặc dù sự ra đời của hai cháu đã làm chậm trễ việc kết
thúc của bản thảo gần hoàn tất, nhưng đã cho tôi một cơ hội để có một cách nhìn mới mẻ vào
những gì tôi đã viết và thực hiện những cải tiến quan trọng.

Betty Kirwood
London School of Hygiene and Tropical Medicine

2
CĂN BẢN

CĂN BẢN
Thống kê là gì?
Thống kê là khoa học thu thập, tổng kết, trình bày và lí giải số liệu, và dùng chúng để kiểm
định giả thuyết. Trong vài thập niên qua, thống kê đã đóng vai trò trung tâm ngày càng tăng
trong các điều tra y khoa. Có nhiều lí do và 3 lí do chính như sau. Ðầu tiên, thống kê cho
phép tổ chức các thông tin trên cơ sở rộng hơn và căn bản hơn sự trao đổi các giai thoại và
kinh nghiệm cá nhân. Thứ nhì, ngày càng nhiều các thứ có thể đo lường định lượng được
trong y khoa. Thứ ba, có sự biến thiên rất lớn trong hầu hết các quá trình sinh học. Thí dụ,
huyết áp không chỉ khác nhau từ người này đến người khác, mà trong cùng một người, nó
cũng thay đổi từ ngày này sang ngày khác và từ giờ này sang giờ khác. Sự lí giải những số
liệu khi có những biến thiên nằm ở trọng tâm của thống kê. Do đó, trong việc điều tra tỉ lệ
bệnh tật liên hệ với một nghề nghiệp nhất định có nhiều kích xúc, phương pháp thống kê cần
thiết để đánh giá có phải huyết áp trung bình quan sát được cao hơn huyết áp của dân số
chung chỉ đơn giản là do sự biến thiên tình cờ hay nó phản ánh một nguy cơ sức khỏe nghề
nghiệp thực sự.
Sự biến thiên có thể bắt nguồn từ các tác động ngẫu nhiên của sự tình cờ trong dân số. Cá
nhân không phản ứng như nhau đối với cùng một kích thích. Do đó mặc dù, hút thuốc lá và
uống rượu nói chung là có hại cho sức khỏe, người ta không hiếm khi nghe thấy một người
hút thuốc lá và uống rượu nhiều sống khỏe mạnh tới già, trong khi một người chống rượu và
không hút thuốc lại chết trẻ. Một thí dụ khác, đánh giá một vaccine mới. Cá nhân có thể thay
đổi về sự đáp ứng với vaccine và sự nhậy cảm và tiếp xúc với bệnh. Không chỉ một số người
nào đó không tiêm vaccine không bị bệnh mà một số người có tiêm vaccin có thể bị bệnh. Có
thể kết luận được gì nếu phần trăm người không có bệnh cao hơn trong nhóm tiêm vaccine so
với nhóm không tiêm vaccine? có phải vaccine có hiệu quả thực sự hay không? có thể kết quả
chỉ do tình cờ? hay, có một số các sai lệch trong cách chọn cá nhân được tiêm chủng, thí dụ
có phải họ khác nhau về tuổi tác hay giai cấp xã hội khiến cho nguy cơ mắc bệnh thấp hơn?
phương pháp phân tích thống kê để phân biệt giữa hai khả năng đầu, trong khi việc lựa chọn
thiết kế đúng sẽ loại trừ khả năng thứ ba. Thí dụ này minh họa sự hữu dụng của thống kê
không chỉ nằm trong việc phân tích kết quả. Nó cũng có vai trò trong việc thiết kế và tiến
hành nghiên cứu.

Dân số và mẫu
Có liên hệ với vấn đề cơ bản của sự biến thiên là một điểm quan trọng: trừ khi một cuộc tổng
điều tra được tiến hành, số liệu chỉ là của một mẫu (sample) trong một nhóm lớn hơn được
gọi là dân số (population). Mẫu được quan tâm không phải bởi vì chính nó mà bởi vì cái mà
nó cho người điều tra biết về dân số. Bởi vì sự tình cờ, những mẫu khác nhau sẽ cho những
kết quả khác nhau và điều này phải được xét đến khi dùng các mẫu để kết luận về dân số.
Hiện tượng này được gọi là sự biến thiên lấy mẫu (sampling variation), nằm ở trọng tâm
của thống kê. Nó được trình bày chi tiết ở Chương 3.
Từ 'dân số' được dùng trong thống kê có nghĩa rộng lớn hơn bình thường. Nó không chỉ gồm
dân số người mà có thể dùng cho bất kì một tập hợp các đối tượng. Thí dụ, số liệu có thể là
mẫu của 20 bệnh viện trong một dân số các bệnh viện của quốc gia. Trong trường hợp đó, dễ
dàng có thể thấy rằng có thể liệt kê toàn bộ dân số và có thể chọn mẫu trực tiếp từ đó. Dù vậy
trong nhiều trường hợp, dân số và giới hạn của nó không được chỉ rõ một cách chính xác và
phải cẩn thận để đảm bảo rằng mẫu thực sự đại diện cho dân số cần lấy thông tin. Dân số này
đôi khi được gọi là dân số mục tiêu (target population). Thí dụ, xem một cuộc thử nghiệm
vaccine được tiến hành trong các sinh viên tự nguyện. Giả sử rằng đáp ứng với vaccine và
tiếp xúc với bệnh tật của sinh viên là điển hình cho cộng đồng nói chung, kết quả có tính áp
dụng tổng quát. Mặt khác nếu sinh viên khác về bất kì phương diện nào mà có thể tác động sự
đáp ứng với vaccine và tiếp xúc với bệnh tật, kết luận về thử nghiệm chỉ giới hạn cho dân số

3
Căn bản thống kê y học -Ðỗ Văn Dũng

sinh viên và không có tính áp dụng tổng quát. Trong trường hợp này, dân số mục tiêu bao
gồm không chỉ những người sống hiện nay mà cả những người sống trong tương lai. Hiển
nhiên rằng không thể đếm các dân số như vậy.

Xác định dân số


Các số liệu thô của điều tra bao gồm các quan sát (observations) trên các cá nhân. Trong
nhiều trường hợp cá nhân là con người nhưng không nhất thiết như vậy. Thí dụ, cá nhân có
thể là hồng cầu, mẫu nước tiểu, chuột, hay bệnh viện. Số các cá nhân được gọi la cỡ mẫu
(sample size). Bất kì khía cạnh nào của cá nhân được đo lường, như huyết áp, hay được ghi
nhận, như tuổi và giới tính, được gọi là biến số (variable). Có thể có một hay nhiều biến số
trong một nghiên cứu.
Chia các biến số thành các loại khác nhau có ích bởi vì có thể áp dụng các phương pháp
thống kê khác nhau cho mỗi loại. Cách chia tổng quát là chia thành biến định tính -
qualitative (biến phạm trù - catergorical) hay biến định lượng - quantitative (biến số -
numerical). Biến định tính là biến không phải là số như nơi sinh, nhóm dân tộc hay loại
thuốc. Một loại đặc biệt là biến nhị phân (binary), trong đó đáp ứng chỉ là một trong hai khả
năng. Thí dụ, giới tính là nam hay nữ, bệnh nhân còn sống hay chết. Biến định lượng là biến
số và hoặc là rời rạc (discrete) hay liên tục (continous). Giá trị của biến rời rạc thường là số
nguyên, như số các trường hợp bạch hầu trong một tuần. Một biến liên tục là sự đo lường trên
thang liên tục. Thí dụ là chiều cao, cân nặng, huyết áp và tuổi.

Phân tích số liệu và trình bày kết quả


Phương pháp tổng kết và phân tích số liệu để lí giải kết quả của một nghiên cứu là căn bản
của cuốn sách này. Có ba điểm chính cần nhấn mạnh ở đây. Thứ nhất là cần tránh áp dụng
các phương pháp phức tạp chỉ vì để đạt được sự phức tạp. Ðiều quan trọng là bắt đầu bằng
việc sử dụng các tổng kết căn bản và kĩ thuật đồ thị để thăm dò số liệu. Việc phân tích phải đi
từ đơn giản đến phức tạp. Phải chọn phương pháp đơn giản nhất phù hợp với yêu cầu của số
liệu.
Ðiểm thứ nhì có liên quan là phải ứng dụng các lí luận thống kê cùng với lí trí. Ðiều quan
trọng là không để mất nhận thức vào con số, các yếu tố tác động đến chúng và chúng đại diện
cho cái gì trong khi thao tác con số trong quá trình phân tích. Bradford Hill (1977), Colton
(1974), và Oldham (1968) đã có những chương rất hay minh họa các ngụy biện phổ biến và
các khó khăn xuất phát trong việc lí giải số liệu.

22,7 24
IMR/1000 treí sä

22,6 20
IMR/1000 treí säúng

22,5 16
22,4
12
22,3
8
22,2
22,1 4

22,0 0
1970 1975 1980 1970 1975 1980

Hình 1.1 Giảm tỉ suất tử vong trẻ em từ 1970 đến 1980 (a) chọn thang đo không phù hợp làm khuếch
đại sai lầm mức giảm (b) dùng thang đo đúng.
Ðiểm thứ ba là nên dùng các kĩ thuật đồ thị (graphical techniques) cả trong giai đoạn thăm dò
phân tích và trình bày kết quả, bởi vì sự quan hệ, khuynh hướng, và sự tương phản thường dễ
nhận biết trong các giản đồ hơn từ trong bảng. Giản đồ (và bảng) phải luôn luôn được ghi tựa
đề rõ ràng và dễ hiểu: không cần thiết phải đọc lại văn bản để hiểu chúng. Ðồng thời chúng

4
CĂN BẢN

không được lộn xộn với quá nhiều chi tiết và chúng không được gây mơ hồ. Các điểm gẫy và
không liên tục trong thang đo phải được đánh dấu rõ ràng và, nếu được, cần phải tránh. Hình
1.1 (a) cho thấy dạng thể hiện sai thường gặp do sử dụng thang đo không phù hợp. Giảm tỉ
suất chết trẻ em được làm thấy nhiều lên bằng cách mở rộng trục tung, trong khi thực tế sự
giảm trong 10 năm chỉ rất ít (từ 22,7 đến 22,1/1000 sinh sống/năm). Một cách trình bày chân
thực hơn ở trong Hình 1.1(b) với trục đứng bắt đầu từ 0.

Chọn máy tính cầm tay


Một máy tính cầm tay (calculator) cần thiết cho các ứng dụng thống kê dù là đơn giản nhất.
Có một số loại máy khác nhau với nhiều giá cả khác nhau. Các phương tiện dưới đây được
coi là tối thiểu
1. Các hàm toán học như lấy căn, logarithm và giai thừa
2. Tối thiểu có một bộ nhớ
3. Tính tự động trung bình và độ lệch chuẩn
4. Tính tự động tương quan và hồi quy tuyến tính
5. Phương tiện lập trình, với khả năng giữ tối thiểu 100 bước lập trình, còn giữ lại khi đã tắt
máy tính. Khả năng này phải đủ để cho phép 2 chương trình thường trú trong máy tính đảm
bảo sử dụng hai kiểm định thống kê phổ biến nhất, kiểm định t để so sánh 2 trung bình (xem
Chương 7) và kiểm định chi bình phương để so sánh hai tỉ lệ (xem chương 13).
Có thể tìm được một máy tính tương đối rẻ tiền (khoảng 30 Bảng Anh) thỏa mãn các điều
kiện trên. Các máy mắc tiền hơn có thể có lợi ích là tăng số bước lập trình và khả năng giữ
các chương trình trong các vật thể kí tin bên ngoài như thẻ từ tính hoặc băng cassette.

5
Căn bản thống kê y học -Ðỗ Văn Dũng

TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ


Giới thiệu
Bước đầu tiên trong phân tích là tổng kết số liệu, bởi vì số liệu không được tổ chức sẽ rất khó
hiểu. Minh họa số liệu bằng một giản đồ có ghi tựa đề rõ ràng và dễ hiểu sẽ hữu ích.

Tần suất (số liệu định tính)


Tổng kết số liệu định tính rất dễ dàng, nhiệm vụ đầu tiên là đếm các quan sát trong mỗi phạm
trù. Số quan sát đếm được được gọi là tần suất (frequencies). Chúng thường được trình bày
thành tần suất tương đối (relative frequencies), là phần trăm so với tổng số các cá nhân. Thí
dụ, bảng 2.4 tổng kết phương pháp đỡ đẻ được ghi nhận trong 600 trường hợp sinh trong
bệnh viện. Biến số cần quan tâm là phương pháp đỡ đẻ, một biến định tính có 3 phạm trù,
sinh thường, sinh forceps và sinh mổ
Bảng 2.1. Phương pháp đỡ đẻ 600 em bé sinh trong bệnh viện
Phương pháp đỡ đẻ Số sinh phần trăm
Sinh thường 478 79,7
Sinh forceps 65 10,8
Sinh mổ 57 9,5
Tổng số 600 100,0

Tần suất và tần suất tương đối thường được minh họa bằng giản đồ thanh (bar diagram) (xem
hình 2.1) hay đồ thị hình bánh (pie chart) (xem hình 2.2). Trong giản đồ thanh, chiều dài của
thanh được vẽ tỉ lệ với tần suất và trong đồ thị hình bánh, vòng tròn được chia sao cho diện
tích của mỗi phần tỉ lệ với tần suất

Sinh mäø 57

Sinh forceps 65

Sinh thæåìng 478

0 100 200 300 400 500

Hình 2.1 Giản đồ thanh trình bày phương pháp đỡ đẻ 600 trẻ sinh trong bệnh viện.

Phân phối tần suất (số liệu định lượng)


Nếu có nhiều hơn 20 quan sát, bước đầu tiên có ích trong việc tổng kết số liệu định lượng là
thành lập phân phối tần suất (frequency distribution). Ðó là bảng trình bày số các quan sát ở
các giá trị khác nhau hay trong các khoảng giá trị nhất định. Ðối với biến rời rạc, tần suất có
thể lập bảng hoặc là cho mỗi giá trị của biến hoặc là cho một nhóm các giá trị. Với biến liên
tục, phải thành lập nhóm. Hình 2.2. trình bày một thí dụ, trong đó hemoglobin được đo lường
tới 0,1g/100 ml vvvà nhóm 11- gồm tất cả các đo lường ở giữa 11,0 và 11,9g/100 ml.
Khi thành lập phân phối tần suất, điều đầu tiên cần làm là đếm số các quan sat và xác định
giá trị lớn nhất và nhỏ nhất. Sau đó quyết định số liệu có cần phân nhóm hay không và nếu có
phải dùng khoảng phân nhóm nào. Nói chung người ta chia thành 5-20 nhóm tùy theo số các

6
TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ

quan sát. Nếu khoảng được chọn cho việc phân nhóm quá rộng, nhiều chi tiết sẽ bị mất đi,
trong khi nếu khoảng quá nhỏ, bảng sẽ khó sử dụng. Ðiểm đầu tiên của nhóm phải là số chẵn
và chiều rộng của các khoảng phải bằng nhau nếu có thể. Bảng phải được kí hiệu sao cho có
thể quyết định khi quan sát nằm ở ranh giới.
Thí dụ, trong bảng 2.2, có 70 đo lường hemoglobin. Giá trị nhỏ nhất là 8,8 và lớn nhất là 15,1
g/100ml. Chọn chiều rộng khoảng là 1g/100ml sẽ cho 8 nhóm trong phân phối tần suất. Ðặt
tên nhóm 8-, 9- là rõ ràng. Có thể đặt tên là 8,0-8,9, 9,0-9,9 v.v... Lưu ý rằng đặt tên 8- 9, 9-10
là không rõ bởi vì người ta không biết đo lường 9,0g/100ml thuộc nhóm nào.

Sinh mäø

Sinh forceps

Sinh thæåìng

Hình 2.2 Ðồ thị hình bánh trình bày phương pháp đỡ đẻ 600 trẻ sinh trong bệnh viện.

7
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 2.2 Nồng độ hemoglobin ở 70 phụ nữ (đơn vị g/100 ml)


(a) Số liệu thô (gạch dưới giá trị lớn nhất và nhỏ nhất)

10.2 13.7 10.4 14.9 11.5 12.0 11.0


13.3 12.9 12.1 9.4 13.2 10.8 11.7
10.6 10.5 13.7 11.8 14.1 10.3 13.6
12.1 12.9 11.4 12.7 10.6 11.4 11.9
9.3 13.5 14.6 11.2 11.7 10.9 10.4
12.0 12.9 11.1 8.8 10.2 11.6 12.5
13.4 12.1 10.9 11.3 14.7 10.8 13.3
11.9 11.4 12.5 13.0 11.6 13.1 9.7
11.2 15.1 10.7 12.9 13.4 12.3 11.0
14.6 11.1 13.5 10.9 13.1 11.8 12.2

(b) phân phối tần suất


Hemoglobin đánh dấu số phụ nữ phần trăm
(g/100ml)
8- 1 1 1.4
9- 111 3 4.3
10- 1111 1111 1111 14 20.0
11- 1111 1111 1111 1111 19 27.1
12- 1111 1111 1111 14 20.0
13- 1111 1111 111 13 18.6
14 1111 5 7.1
15-15.9 1 1 1.4
Tổng số 70 100.0

Khi đã quyết định dạng thức của bảng, có thể đếm các số trong mỗi nhóm. Có thể tránh được
sai lầm bằng cách tiến hành số liệu theo thứ tự. Ðối với một giá trị, đánh dấu vào nhóm thích
hợp. Ðể dễ đếm, những đánh dấu này được xếp thành nhóm năm bằng cách gạch dấu thứ năm
nằm ngang qua bốn dấu trước đó. Chúng được gọi là cổng năm thanh (five-bar gates). Quá
trình này được gọi là đánh dấu (tallying) và được minh họa trong bảng 2.2(b).

Tổ chức đồ
Phân phối tần suất thường được minh họa bằng tổ chức đồ (histogram) như được trình bày
trong hình 2.3 về số liệu hemoglobin. Dù là dùng tần suất hay phần trăm, hình dạng của tổ
chức đồ cũng như nhau.

8
TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ

Hình 2.3 Tổ chức đồ của nồng độ hemoglobin của 70 phụ nữ


Dễ dàng xây dựng tổ chức đồ khi các khoảng cách nhóm của phân phối tần suất bằng nhau
như trong trường hợp hình 2.3. Nếu khoảng có chiều rộng khác nhau, cần phải lưu ý khi vẽ tổ
chức đồ nếu không sẽ bị sai lệch. Thí dụ, giả sử hai nhóm hemoglobin cao nhất được kết hợp
lại. Tần suất của nhóm kết hợp này (14,0-15,9 g/100ml) sẽ là 6, nhưng rõ ràng sẽ sai lầm nếu
vẽ hình chữ nhật có chiều cao 6 từ 14- 16g/100ml. Bởi vì khoảng này lớn gấp đôi chiều rộng
khác khoảng khác, chiều cao của đường sẽ là 3, phân nửa của tần suất tổng cộng của nhóm
này. Ðiều này được minh họa trong hình 2.3. Quy tắc chung để vẽ tổ chức đồ khi các khoảng
không cùng chiều rộng là để chiều cao của hình chữ nhật tỉ lệ với tần suất chia cho chiều
rộng, để cho diện tích của hình chữ nhật trong tổ chức đồ tỉ lệ với tần suất.

Ða giác tần suất

Hình 2.4 Ða giác tần suất của nồng độ hemoglobin của 70 phụ nữ.
Một cách khác để minh họa phân phối tần suất nhưng kém phổ biến hơn là đa giác tần suất,
được minh họa trong Hình 2.4. Nó đặc biệt có ích khi so sánh hai hay nhiều hơn các phân
phối tần suất bằng cách cùng vẽ trên một giản đồ. Ða giác được vẽ bằng cách tưởng tượng
(hay vẽ phác bằng chì) tổ chức đồ và nối các trung điểm của cạnh trên hình chữ nhật. Ðiểm
cuối của đường vừa vẽ được nối với trục hoành ở điểm giữa của nhóm sát trên nhóm lớn nhất
và điểm giữa của nhóm sát dưới nhóm nhỏ nhất. Ðối với số liệu của hemoglobin đó là nhóm
7,0-7,9 và 16,0- 16,9g/100ml. Do đó trên hình 2.4 đa giác tần suất được nối với trục hoành ở
7,5 và 16,5g/100ml.

Phân phối tần suất của dân số


Hình 2.3 và 2.4 minh họa phân phối tần suất của hemoglobin của mẫu 70 phụ nữ. Chúng ta
dùng số liệu này để cho thông tin về phân phối nồng độ hemoglobin trong phụ nữ nói chung.

9
Căn bản thống kê y học -Ðỗ Văn Dũng

Thí dụ, dường như rất ít khi phụ nữ có mức dưới 9,0g/100ml hay trên 15,0g/100ml. Sự tin
cậy khi rút ra các kết luận tổng quát từ số liệu phụ thuộc vào có bao nhiêu cá nhân được đo
lường. Mẫu được đo càng lớn, các khoảng cách nhóm được chọn càng nhỏ thì tổ chức đồ và
đa giác tần suất trở nên mịn hơn và càng giống phân phối của dân số tổng quát. Nếu có thể
biết được nồng độ hemoglobin của toàn dân số phụ nữ, giản đồ tạo được sẽ trở thành một
đường cong trơn.

Hình dạng của phân phối tần suất


Hình 2.5 trình bày 3 hình dạng phân phối tần suất phổ biến nhất. Chúng có tần suất cao ở
trung tâm và tần suất thấp ở 2 đầu, được gọi là đuôi trên hay đuôi dưới (upper and lower tails)
của phân phối. Phân phối của hình 2.5(a) được gọi là đối xứng (symmetrical) qua tâm;
dạng đường cong này thường được gọi là 'hình chuông'. Hai phân bố kia được gọi là bất
đối xứng hay lệch (skewed). Ðuôi trên của phân phối trên Hình 2.5(b) dài hơn đuôi dưới; nó
được gọi là lệch dương hay lệch về phía phải. Phân phối của hình 2.5(c) là lệch âm hay lệch
về phía trái.
Tất cả phân phối trong hình 2.5 là một yếu vị (unimodal) bởi vì chúng chỉ có một đỉnh. Hình
2.6(a) trình bày phân phối tần suất hai yếu vị (bimodal), đó là phân phối có 2 đỉnh. Ðôi khi ta
thấy được phân phối này và nó cho thấy số liệu là hỗn hợp của hai phân phối riêng biệt. Hình
2.6 trình bày hai phân phối khác ít gặp khác; đó là phân phối hình J ngược (reverse J-shaped)
và đồng nhất (uniform).

(a) đối xứng và hình chuông (b) lệch dương hay lệch phải (c) lệch âmhay lệch trái
td: chiều cao td: bề dày lớp mỡ dưới da td: thời gian thai kì

Hình 2.5 Ba dạng phân phối phổ biến và ví dụ của mỗi loại

(b) hình J ngược (c) đồng nhất


(a) hai yếu vị td: thời gian sống sau khi chẩn td: sự xuất hiện bệnh không theo
td: nồng độ hormone ở nam và đoán ung thư phổi mùa
nữ

Hình 2.6 Ba dạng phân phối ít phổ biến và ví dụ của mỗi loại

10
TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN


Giới thiệu
Phân phối tần suất cho một bức tranh tổng quát về giá trị của các biến số. Dù vậy sẽ tiện lợi
hơn nếu tổng kết các biến định lượng bằng cách chỉ cho 2 số đo: giá trị trung bình và sự trải
rộng của giá trị.

Trung bình, trung vị và yếu vị


Giá trị trung bình thường được thể hiện bằng trung bình cộng (arithmetic mean), thường được
gọi là trung bình. Ðó là tổng số các giá trị chia cho số các giá trị

Trung bình, x =
∑x
n
Trong đó x biểu thị giá trị của biến số, S (mẫu tự tiếng Hy lạp sigma hoa) có nghĩa là tổng
của và n là số các quan sát. Trung bình được kí hiệu là x (đọc là 'x gạch').
Một số đo khác của giá trị trung bình là trung vị (median) và yếu vị (mode). Trung vị là giá trị
chia phân phối làm đôi. Nếu các giá trị được sắp theo thứ tự tăng dần, trung vị là quan sát ở
chính giữa.
(n + 1)
Trung vị = giá trị ở vị trí trong các quan sát được sắp thứ tự
2
Nếu có một số chẵn các quan sát, không có quan sát ở chính giữa thì người ta lấy trung bình
của 2 quan sát ở giữa. Yếu vị (mode) là giá trị xảy ra thường xuyên nhất
Thí dụ 3.1
Số liệu sau là thể tích huyết tương của 8 người đàn ông khỏe mạnh
2,75 2,86 3,37 2,76 2,62 3,49 3,05 3,12 lít
(a) n = 8
Σ x = 2,75 + 2,86 + 3,37 + 2,76 + 2,62 + 3,49 + 3,05 + 3,12 = 24,021
Trung bình, x = Σ x/n = 24,02/8 = 3,001
(b) sắp xếp lại các số đo theo thứ tự tăng dần
2,62; 2,75; 2,76; 2,86; 3,05; 3,12; 3,37; 3,49
Trung vị = giá trị thứ (n+1)/2 = 9/2 = giá trị thứ 4,5
= trung bình của giá trị thứ 4 và thứ 5 = (2,86+3,05)/2 = 2,96
(c) không có ước lượng của yếúu vị bởi vì các giá trị đều khác nhau
Trung bình thường là số đo được chọn lựa bởi vì nó tính đến mỗi quan sát cá nhân và có thể
được xử lí bằng kĩ thuật toán và thống kê. Trung vị là số đo mô tả hữu ích nếu có một hoặc
hai giá trị quá cao hoặc quá thấp, làm cho trung bình không đại diện được đa số số liệu. Yếu
vị ít khi được dùng. Nếu mẫu nhỏ thì có thể không ước lượng được yếu vị (như trong ví dụ
3.1c) hay ước lượng bị sai lệch. Trung bình, trung vị và yếu trị, nói chung là bằng nhau khi
phân phối đối xứng và có một yếu vị. Khi phân phối bị lệch dương, trung bình nhân (geomtric
mean) thích hợp hơn trung bình cộng. Ðiều này được thảo luận ở Chương 19.

Số đo sự biến thiên
Số đo sự biến thiên đơn giản nhất là phạm vi (range), đó là hiệu số giữa giá trị lớn nhất và
nhỏ nhất. Khuyết điểm của nó là chỉ dựa trên hai quan sát và không cho ý niệm về cách các
quan sát khác sắp xếp ra sao. Tương tự, khi cỡ mẫu càng lớn thì phạm vi càng lớn.

11
Căn bản thống kê y học -Ðỗ Văn Dũng

Bởi vì sự biến thiên nhỏ khi các quan sát tập trung gần chung quanh trung bình và lớn khi các
quan sát phân tán trên một phạm vi đáng kể, sự biến thiên thường được đo lường theo độ lệch
(deviation) của các quan sát so với trung bình. Phương sai (variance) là trung bình của bình
phương những hiệu số này. Khi tính phương sai của một mẫu, tổng của độ lệch bình phương
được chia cho (n-1) chứ không phải cho n bởi vì như vậy sẽ cho một ước lượng tốt hơn của
phương sai dân số toàn bộ.

Phương sai, s 2 =
∑ (x − x) 2

( n − 1)
Ðộ tự do
Mẫu số (n-1) được gọi là độ tự do (degrees of freedom) của phương sai. Con số này là (n-1)
chứ không phải là n, bởi vì chỉ có (n-1) độ lệch (x-x) độc lập với nhau. Ðộ lệch cuối cùng có
thể được tính từ các độ lệch khác bởi vì tổng tất cả các độ lệch bằng zero.
Ðộ lệch chuẩn
Phương sai có các tính chất toán học thuận lợi và là số đo thích hợp khi nghiên cứu lí thuyết
thống kê. Dù vậy, nó có một khuyết điểm là nó có đơn vị là bình phương đơn vị của quan sát.
Thí dụ, nếu quan sát là trọng lượng tính bằng gram thì phương sai là gram bình phương.
Trong nhiều trường hợp sẽ thuận lợi hơn khi biểu thị độ biến thiên theo đơn vị ban đầu bằng
cách lấy căn của phương sai. Nó được gọi là độ lệch chuẩn (standard deviation - SD).

∑ (x − x)2 
SD hay s =  
 (n − 1) 
Hay tương đương

 ∑ x 2 − (∑ x ) 2 / n 
SD hay s =  
 (n − 1) 
Công thức sau tiện lợi hơn cho việc tính toán bởi vì không cần phải tính trung bình và sau đó
trừ các giá trị quan sát cho trung bình. Tương đương của hai công thức trên được minh họa
trong thí dụ 3.2 (lưu ý: nhiều máy tính cầm tay có những hàm để tính trung bình và độ lệch
chuẩn. Các phím bấm thường được kí hiệu bằng x và σn-1, trong đó ơ là mẫu tự Hi lạp sigma
thường).
Thí dụ 3.2
Bảng 3.1 trình bày các bước của tính toán độ lệch chuẩn của 8 số đo thể tích huyết tương ở
thí dụ 3.1. Lưu ý rằng

Σ x2-(Σ x)2/n = 72,7980 - (242)2/8 = 0,6780

Cho kết quả giống như Σ (x-x)2:

s = 0,6780/7=0,311

12
TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

Bảng 3.1 Tính toán độ lệch chuẩn của thể tích huyết tương của 8 đàn ông khỏe mạnh (giống như trong
thí dụ 3.1). Trung bình, x=3,001

Thể tích huyết tương Ðộ lệch khỏi Bình phương độ lệch bình phương của
x trung bình (x-x) 2 quan sát
x-x x2
2.75 -0.25 0.0638 7.5625
2.86 -0.14 0.0203 8.1796
3.37 0.37 0.1351 11.3569
2.76 -0.24 0.0588 7.6176
2.62 -0.38 0.1463 6.8644
3.49 0.49 0.2377 12.1801
3.05 0.05 0.0023 9.3025
3.12 0.12 0.0138 9.7344
Tổng 24.02 0.00 0.6780 72.7980

Lí giải
Thông thường 70% quan sát nằm trong phạm vi một độ lệch chuẩn so với kể từ trung bình và
khoảng 95% nằm trong phạm vi hai độ lệch chuẩn. Các con số này dựa trên một phân phối
tần suất lí thuyết được gọi là phân phối bình thường, được mô tả ở chương 4.
Hệ số biến thiên (Coefficient of variation)

s
c.v. = × 100%
x
Hệ số biến thiên là độ lệch chuẩn tính theo phần trăm của trung bình mẫu. Chúng hữu ích khi
cần quan tâm đến độ lớn của sự biến thiên so với độ lớn của quan sát, và nó có ưu điểm là hệ
số biến thiên độc lập với đơn vị của quan sát. Thí dụ giá trị của độ lệch chuẩn của các trọng
lượng sẽ khác nhau tùy theo chúng được đo lường theo kilogram hay pound. Dù vậy, hệ số
biến thiên sẽ giống như nhau.

Tính toán trung bình và độ lệch chuẩn từ phân phối tần suất
Bảng 3.2 trình bày phân phối của số các lần mang thai trước của một nhóm phụ nữ khám tiền
sản. Mười tám trong 100 phụ nữ không có mang trước đó, 27 đã có mang một lần, 31 có
mang hai lần, 19 có mang 3 lần và 5 phụ nữ có mang 4 lần. Vì cộng 2 ba mươi mốt lần cũng
giống như tích của (2 x 31), tổng số của các lần có thai trước đó được tính bằng:
Σ x=(0 ×18)+(1 × 27)+(2 × 31)+(3 × 19)+(4 × 5)=0 + 27 + 62 + 57 + 20 =166
Do đó số trung bình của các lần mang thai trước đó là
x= 166/100=1,66
Tương tự
Σ x2= (0 × 18)+(1 × 27)+(22 × 31)+(32 × 19)+(42 × 5) = 0+27+124+171+80=402
Do đó độ lệch chuẩn
s= √ [(402 -1662/100)/99] = [126,44/99] = 1,13
Bảng 3.2 Phân phối của số các lần có thai trước của một nhóm phụ nữ tuổi từ 30 đến 34 đến khám tại
phòng khám tiền sản

13
Căn bản thống kê y học -Ðỗ Văn Dũng

Số lần có thai
0 1 2 3 4 Tổng số
Số phụ nữ 18 27 31 19 5 100
Nếu các biến số được phân nhóm để xây dựng phân phối tần suất, cần phải tính trung bình và
độ lệch chuẩn từ các giá trị nguyên thủy chứ không dùng phân phối tần suất. Dù vậy, đôi khi
chỉ có phân phối tần suất. Trong trường hợp đó, giá trị xấp xỉ của trung bình và phương sai có
thể tính được bằng cách dùng giá trị trung điểm của nhóm và tiến hành như trên.

Thay đổi đơn vị


Cộng hay trừ quan sát cho một hằng số làm trung bình cũng cộng hay trừ hằng số đó nhưng
không thay đổi độ lệch chuẩn. Nhân hay chia các quan sát cho một hằng số làm trung bình và
độ lệch chuẩn cũng nhân hay chia cho hằng số đó.
Thí dụ, giả sự nhiệt độ được chuyển từ độ Fahrenheit thành Celsius bằng cách trừ cho 32 và
nhân cho 5 và chia cho 9. Trung bình mới sẽ được tính từ trung bình cũ theo cách tương tự
như vậy: trừ cho 32, nhân 5 và chia cho 9. Ðộ lệch chuẩn mới là độ lệch chuẩn cũ nhân 5 và
chia cho 9 bởi vì phép trừ không tác động đến độ lệch chuẩn.

Sai số lấy mẫu và sai số chuẩn


Như đã nói ở Chương 1, mẫu được quan tâm không phải vì chính nó mà bởi vì nó nói cho
người nghiên cứu về dân số mà nó đại diện. Trung bình mẫu, x, và độ lệch chuẩn,s , được
dùng để ước lượng trung bình và độ lệch chuẩn của dân số, kí hiệu bằng chữ Hi lạp µ (mu) và
s (sigma). Trung bình mẫu không thể chính xác bằng trung bình dân số. Một mẫu khác sẽ cho
ước lượng khác, sự khác biệt là do sự biến thiên lấy mẫu. Giả sử tiến hành lấy nhiều mẫu độc
lập có cỡ bằng nhau và tính trung bình mẫu cho mỗi mẫu và tạo phân phối tần suất của các
trung bình đó. Trung bình của phân phối sẽ bằng với trung bình của dân số và có thể chứng
minh rằng độ lệch chuẩn sẽ bằng s /√ n. Nó được gọi là sai số chuẩn của trung bình mẫu
(standard error of the sample mean) và nó đo lường trung bình của dân số được ước
lượng bởi trung bình mẫu chính xác tới mức nào. Ðộ lớn của sai số chuẩn phụ thuộc vào sự
biến thiên trong dân số và cỡ mẫu. Mẫu càng lớn thì sai số chuẩn càng nhỏ.
Chúng ta ít khi biết được độ lệch chuẩn của dân số, s, và vì vậy chúng ta dùng độ lệch chuẩn
mẫu để tính sai số chuẩn

s
s.e. =
n
Thí dụ 3.3
Trung bình của 8 thể tích huyết tương được trình bày trong bảng 3.1 là 3,001 (thí dụ 3.1) và
độ lệch chuẩn là 0,311 (thí dụ 2). Sai số chuẩn của trung bình được tính bằng
s/√ n=0,31/√ 8=0,111
Thí dụ 3.4
Hình 3.1 trình bày kết quả của một trò chơi trong một lớp học có 30 sinh viên để minh họa
khái niệm biến thiên lấy mẫu, phân phối lấy mẫu và sai số chuẩn. Người ta đo lường huyết áp
của 250 phi công. Phân phối của đo lường này được trình bày trong hình 3.1(a). Trung bình
dân số, µ là 78,2mmHg và độ lệch chuẩn dân số, s, là 9,4mmHg. Mỗi giá trị được viết trên
một đĩa nhỏ và 250 đĩa được đặt trong một cái túi. Mỗi sinh viên được đề nghị lắc túi chọn 10
đĩa và viết 10 huyết áp tâm trương. Bằng cách này ta có 30 mẫu khác nhau và 30 trung bình
mẫu khác nhau, mỗi trung bình đều ước lượng cùng một trung bình dân số. Trung bình của
những trung bình mẫu này là 78,23 mmHg, gần với trung bình dân số. Phân phối được trình

14
TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

bày trong hình 3.1(b). Ðộ lệch chuẩn của trung bình mẫu là 31 mmHg, phù hợp với giá trị lí
thuyết, s /√n=9,4/√10=2,97 mmHg sai số chuẩn của trung bình có cỡ mẫu là 10.

Bài tập được lập lại với cỡ mẫu 20, kết quả được trình bày trong hình 3.1(c). Dễ dàng thấy sự
giảm biến thiên của trung bình mẫu do việc tăng cỡ mẫu từ 10 lên 20. Trung bình của trung
bình mẫu là 78,14 mmHg cũng gần với trung bình dân số. Ðộ lệch chuẩn là 2,07 mmHg, cũng
phù hợp với giá trị lí thuyết 9,4/√ 20=2,10 mmHg
Lí giải
Lí giải sai số chuẩn của trung bình mẫu tương tự như sai số chuẩn. Khoảng 95% trung bình
mẫu có được bởi sự lấy mẫu lập lại sẽ nằm trong phạm vi hai độ lệch chuẩn so với trung bình
dân số. Ðiều này được dùng để xây dựng một phạm vi giá trị khả dĩ của trung bình dân số,
dựa trên các trung bình mẫu quan sát được và sai số chuẩn của nó. Những phạm vi như vậy
được gọi là khoảng tin cậy (confidence interval). Phương pháp xây dựng khoảng tin cậy được
trình bày ở Chương 5 bởi vì nó sử dụng đến phân phối bình thường, được mô tả ở Chương 4.
Sự hiệu chỉnh dân số giới hạn
Nếu cỡ mẫu trong một dân số có giới hạn, thí dụ như các căn nhà trong một làng, sai số lấy
mẫu có thể nhỏ hơn s /√ n khi phần lớn dân số được lấy mẫu. Nó sẽ bằng 0 nếu toàn thể dân
số được lấy mẫu không phải là do không có sự biến thiên trong các cá nhân trong dân số,
nhưng bởi vì trung bình mẫu chính là trung bình dân số. Một mẫu thứ hai có cỡ tương tự
(toàn dân số) sẽ có kết quả tương tự. Khi đó người ta áp dụng sự hiệu chỉnh dân số giới hạn
(finite population correction) cho sai số chuẩn. Công thức trở thành

σ  n
s.e.våïi hiãûu chènh dán säú tåïi haûn = 1 - 
n  N
Trong đó N là kích thước của dân số và n/N là phân số lấy mẫu (sampling fraction).
Bỏ qua sự hiệu chỉnh dân số giới hạn gây nên sự ước lượng thừa sai số chuẩn. Thí dụ, nếu
75% dân số được lấy mẫu, hiệu chỉnh dân số giới hạn sẽ bằng (1-0,75)=0,5. Nếu bỏ qua điều
này, sai số chuẩn sẽ gấp đôi giá trị chính xác. Sự hiệu chỉnh ít có tác động và có thể bị bỏ qua
khi phân số lấy mẫu nhỏ hơn 10%.

15
Căn bản thống kê y học -Ðỗ Văn Dũng

PHÂN PHỐI BÌNH THƯỜNG


Giới thiệu
Phân phối tần suất và các hình dạng của nó được thảo luận ở Chương 2. Trên thực tế người ta
thấy rằng có thể mô tả hợp lí nhiều biến số bằng phân phối bình thường (normal
distribution), đôi khi còn được gọi là phân phối Gauss (Gaussian distribution) theo tên
của người phát hiện Gauss. Ðường cong của phân phối bình thường đối xứng qua trung bình
và có dạng hình chuông; hình chuông cao và hẹp đối khi độ lệch chuẩn nhỏ và thấp và rộng
khi độ lệch chuẩn lớn. Hình 4.1 minh họa phân phối bình thường mô tả chiều cao của người
lớn ở Anh. Một thí dụ khác về biến số được phân phối xấp xỉ bình thường là huyết áp, thân
nhiệt và nồng độ hemoglobin. Thí dụ của các biến số không phân phối bình thường là bề dày
lớp mỡ dưới da sau cánh tay và thu nhập, cả hai biến này đều bị lệch dương. Ðôi khi biến đổi
một biến, thí dụ như lấy logarithm sẽ làm phân phối trở thành bình thường. Ðiều này được
mô tả ở Chương 19 và cách đánh giá xem một biến số có phân phối bình thường không được
mô tả ở chương 18.
Phân phối bình thường quan trọng không chỉ bởi vì nó mô tả tốt các biến số mà còn bởi vì nó
có một vai trò trọng tâm trong kĩ thuật phân tích thống kê. Thí dụ, nó là cơ sở lí luận cho việc
tính toán khoảng tin cậy được trình bày ở chương 3 và được mô tả ở chương 5. Nó cũng là cơ
sở cho phương pháp kiểm định mức ý nghĩa của trung bình được giới thiệu ở Chương 6. Vì
những lí do này, điều quan trọng là mô tả việc ứng dụng phân phối bình thường một cách chi
tiết trước khi trình bày tiếp mặc dù chúng ta không quan tâm đến phương trình toán học chính
xác để định nghĩa bởi vì chúng ta đã có bảng.

σ = 6,5 cm
µ = 171,5 cm

Hình 4.1 Giản đồ trình bày đường cong xấp xỉ bình thường mô tả chiều cao đàn ông trưởng thành

Phân phối bình thường chuẩn


Nếu một biến có phân phối bình thường thì việc đổi đơn vị không tác động đến chúng. Do đó
dù chiều cao đo bằng centimetre hay bằng inch nó cũng phân phối bình thường. Thay đổi
trung bình chỉ có nghĩa là chuyển đường cong qua lại trục trong khi thay đổi độ lệch chuẩn
thay đổi chiều cao và chiều rộng của đường cong.
Ðặc biệt, bằng cách thay đổi đơn vị, bất cứ một biến số có phân phối bình thường nào cũng
có thể thành phân phối bình thường chuẩn (standard normal distribution - còn gọi là phân
phối chuẩn) có trung bình bằng 0 và độ lệch chuẩn bằng 1. Có thể làm được điều này bằng
cách trừ mỗi quan sát cho trung bình rồi chia cho độ lệch chuẩn. Quan hệ là

16
PHÂN PHỐI BÌNH THƯỜNG

x−µ
SND, z =
σ

σ = 6,5 cm
µ = 171,5 cm

-3 -2 -1 0 -1 2 3

Hình 4.2 Quan hệ giữa phân phối bình thường theo đơn vị đo lường nguyên thủy và theo độ lệch bình
thường chuẩn
SND = (chiều cao -171, 5)/6,5
Chiều cao = 171, 5 + (6, 5 x SND)

Trong đó x là biến nguyên thủy có trung bình m và độ lệch chuẩn s và z là độ lệch bình
thường chuẩn (standard normal deviate - SND). Ðiều này được minh họa cho phân phối
chiều cao đàn ông trong hình 4.2. Khả năng chuyển bất kì một biến có phân phối bình thường
thành độ lệch bình thường chuẩn (SND) có nghĩa là chỉ cần một bảng cho phân phối bình
thường chuẩn và không cần tất nhiều bảng cho tất cả các giá trị trung bình và độ lệch chuẩn
khác nhau. Có hai cách phổ biến nhất để tạo thành bảng (i) diện tích dưới đường cong phân
phối tần suất và (ii) điểm bách vị

Bảng tính diện tích dưới đường cong của phân phối bình thường
Bảng tính diện tích dưới đường cong phân phối bình thường của một phân phối bình thường
hữu ích trong việc xác định tỉ lệ dân số có giá trị trong một phạm vi nhất định. Ðiều này đươc
minh họa trong hình 4.1 và 4.2 về chiều cao của đàn ông ở Anh, có phân phối bình thường
với trung bình µ =171,5 cm và độ lệch chuẩn s = 6,5 cm.
Diện tích ở đuôi trên của phân phối
Phân phối bình thường có thể được dùng để ước lượng tỉ lệ đàn ông cao hơn 180 cm. Tỉ lệ
này được xem là phân số diện tích nằm dưới đường cong phân phối tần suất ở bên phải 180
cm. Ðộ lệch bình thường chuẩn tương ứng là
180 − 171 .5
z= = 1.31
6.5
Ðiều này tương đương với tỉ lệ diện tích của phân phối bình thường chuẩn ở bên phải 1,31.
Diện tích này được minh họa trên hình 4.3 (a) và có thể tìm thấy từ bảng A1. Hàng của bảng
chỉ giá trị z với một số lẻ và cột chỉ số lẻ thứ hai. Do đó diện tích trên 1,31 được ghi ở hành
1,3 và cột 0,01 và do đó là 0,0951. Chúng ta có thể kết luận 0,0951 hay 9,51% đàn ông cao
hơn 180 cm.

17
Căn bản thống kê y học -Ðỗ Văn Dũng

0.0375

0.0375 1-0.1587-0.2946=
0.5467
0.0951
0.1587 0.2946

-3 -2 -1 0 -1 2 3 -3 -2 -1 0 -1 2 3 -3 -2 -1 0 -1 2 3

(c) diãûn têch giæîa z=1 vaì


(a) diãûn têch trãn z=1,31 (b) diãûn têch dæåïi z=1,77 z=0,54 tçm bàòng caïch træì
tçm trong baíng A1 bàòng diãûn têch trãn
z=1,77 do âäúi xæïng

Hình 4.3 thí dụ tính toán các diện tích của phân phối bình thường chuẩn
Diện tích ở đuôi dưới của phân phối
Tỉ lệ đàn ông thấp hơn 160 cm có thể được ước tính tương tự
160 − 171.5
z= = −1.77
6.5
Diện tích cần thiết được minh họa ở hình 4.3(b). Bởi vì phân phối bình thường chuẩn là đối
xứng qua 0 nên diện tích bên trái z=-1,77 cũng bằng diện tích bên phải z=1,77 và là 0,0375.
Do đó 3,75 đàn ông thấp hơn 160 cm.
Diện tích phân phối giữa hai giá trị
Tỉ lệ đàn ông có chiều cao giữa 165cm và 175 cm được ước tính bằng cách tìm tỉ lệ đàn ông
thấp hơn 165cm và cao hơn 175 cm và lấy 1 trừ đi chúng. Ðiều này được minh họa bởi hình
4.3 (c)
(i) độ lệch bình thường chuẩn tương ứng với 165 cm là
165 − 171.5
z= = −1
6.5
Tỉ lệ dưới chiều cao này là 0,1587
(ii) độ lệch bình thường chuẩn tương ứng với 175 cm là
175 − 171.5
z= = 0.54
6.5
Tỉ lệ trên chiều cao này là 0,2946
(iii) Tỉ lệ đàn ông có chiều cao giữa 165 cm và 175 cm là
1 - tỉ lệ dưới 165 cm - tỉ lệ trên 175 cm
= 1 -0,1587 -0,2946 = 0,5467 hay 54,67%
Giá trị tương ứng với một diện tích đuôi nhất định
Bảng A1 có thể dùng theo cách khác, đó là bắt đầu với diện tích và tìm điểm z tương ứng. Thí
dụ, chiều cao nào thấp hơn 5% chiều cao của dân số? Hãy nhìn vào bảng tìm giá trị gần nhất
với 0,05 ở hàng 1,6 và cột 0,04 vậy giá trị z cần thiết là 1,64. Chiều cao tương ứng được tìm
thấy bằng cách chuyển đổi:

x = µ + zσ = 171,5 + (1,64 × 6,5) = 182,2 cm

18
PHÂN PHỐI BÌNH THƯỜNG

Các điểm phần trăm của phân phối bình thường


Một cách lí giải hữu dụng của độ lệch bình thường chuẩn là nó biểu thị giá trị của biến số
cách số trung bình bao nhiêu độ lệch chuẩn. Ðiều này được trình bày trên thang đo của giá trị
nguyên thủy trong hình 4.4. Do đó z=1 tương ứng với giá trị ở một độ lệch chuẩn trên trung
bình và z=-1 là giá trị ở một độ lệch chuẩn dưới trung bình. Diện tích trên z=1 và dưới z=-1
đều là 0,1587 hay 15,87%. Do đó 31,74% phân phối cách trung bình hơn một độ lệch chuẩn
hay nói cách khác 68,26% phân phối nằm trong phạm vi 1 độ lệch chuẩn so với trung bình.
Tương tự, 4,55% phân phối cách trung bình hơn 2 độ lệch chuẩn hay nói cách khác 95,45%
phân phối nằm trong phạm vi 2 độ lệch chuẩn so với trung bình. Ðiều này là cơ sở lí luận cho
việc lí giải của độ lệch chuẩn ở Chương 3.

-3 -2 -1 0 -1 2 3

µ−3σ µ−2σ µ−σ µ µ+σ µ+2σ µ+3σ

Hình 4.4 Lí giải SND bằng thang đo cho thấy số độ lệch chuẩn cách xa khỏi trung bình
Giá trị z bao gồm chính xác 95% phân phối giữa -z và z là 1,96 (hình 4.5a). 1,96 là điểm 5
phần trăm (5% percentage point) của phân phối bình thường bởi vì 5% phân phối cách
trung bình hơn 1,96 lần độ lệch chuẩn (2,5% ở mỗi đuôi). Tương tự như vậy 2,58 là điểm
phần trăm 1%. Các điểm phần trăm thường dùng được lập thành bảng A2. Lưu ý rằng các
điểm phần trăm có thể tìm được từ bảng A1.
Ðiểm phần trăm được mô tả ở đây được gọi là điểm phần trăm hai đuôi (two- sided) bởi vì
chúng bao gồm cả các quan sát ở đuôi trên và dưới của phân phối. Một vài cuốn sách lập
bảng điểm phần trăm một đuôi (one- sided) chỉ xét đến một đuôi của phân phối (hình 4.5b).
Thí dụ 1,96 là điểm 2,5% một đuôi bởi vì 2,5% phân phối bình thường chuẩn ở trên 1,96 và
nó chính là điểm 5% hai đuôi. Sự khác biệt này được thảo luận lại ở Chương 6 trong phần
kiểm định ý nghĩa.

a%
2.5%
a%
2.5%

-1.96 0 1.96 -1.96 0 1.96

Hình 4.5 Ðiểm phần trăm của phân phối bình thường
(a) 1.96 laì âiãøm 2.5% mäüt bãn hay laì (b) z laì âiãøm a% mäüt bãn hay laì âiãøm
âiãøm 5% hai bãn 2a% hai bãn

19
Căn bản thống kê y học -Ðỗ Văn Dũng

20
KHOẢNG TIN CẬY CỦA TRUNG BÌNH

KHOẢNG TIN CẬY CỦA TRUNG BÌNH


Giới thiệu
Sự biến thiên lấy mẫu và sai số chuẩn của trung bình mẫu được thảo luận ở Chương 3. Ở đây
chúng ta xét bằng cách nào chúng ta có thể dùng trung bình mẫu và sai số chuẩn để biết được
giá trị khả dĩ của trung bình dân số mà thường không biết được.

Trường hợp mẫu cỡ lớn (phân phối bình thường)


Chúng ta đã lưu ý ở Chương 3 rằng khoảng 95% của trung bình mẫu trong phân phối thu
được bằng cách lấy mẫu lập lại sẽ nằm trong phạm vị hai sai số chuẩn trên hay dưới trung
bình dân số. Ðiều này dựa trên giả thiết rằng tính phân phối bình thường của trung bình mẫu
và trung bình của phân phối là trung bình của dân số, µ, và độ lệch chuẩn là sai số chuẩn của
trung bình mẫu, s /√ n. Ðiều này có thể được biện minh khi cỡ mẫu lớn, thí dụ như n lớn hơn
60 bởi vì gần như luôn luôn phân phối của trung bình mẫu là bình thường (xem ở dưới); hơn
nữa, độ lệch chuẩn mẫu, s, là một ước lượng đáng tin cậy của độ lệch chuẩn dân số, s, thường
không biết. Từ Chương 4 chúng ta có thể khẳng định chính xác rằng 95% trung bình mẫu
phải nằm trong phạm vi 1,96 sai số chuẩn so với trung bình dân số, 19,6 là điểm 5% của phân
phối bình thường chuẩn. Do đó 95% là xác suất một trung bình mẫu nằm trong phạm vi 1,96
sai số chuẩn so với trung bình dân số
Trên thực tiễn, kết quả này được dùng để từ trung bình mẫu quan sát (x) và sai số chuẩn
(s.e.=s/√ n) ước lượng phạm vi trung bình dân số khả dĩ nằm trong đó. Bởi vì có xác suất
95% trung bình mẫu nằm trong 1,96 sai số chuẩn so với trung bình mẫu, có xác suất 95%
khoảng nằm giữa x - 1,96 s.e. và x + 1,96 s.e. chứa trung bình dân số (chưa biết). Khoảng
từ x - 1,96 s.e. đến x + 1,96 s.e. cho được xem là các giá trị khả dĩ của trung bình dân số.
Nó được gọi là khoảng tin cậy 95% (95% confidence interval - c.i.) của trung bình dân số, và
x + 1,96 s.e. và x - 1,96 s.e. là giới hạn tin cậy 95% (95% confidence limits) của trung
bình dân số.

Khoảng tin cậy 95% cho mẫu lớn = x ± (1,96 × s/√ n)


Khoảng tin cây cho các phần trăm khác được tính cũng giống như vậy và dùng điểm phần
trăm tương ứng, z', của phân phối bình thường chuẩn thay vì 1,96. Thí dụ khoảng tin cậy 99%
là x ± (2,58 × s.e.)
Khoảng tin cậy mẫu lớn = x ± (z' × s/√ n)

Thí dụ 5.1
Trong chương trình khống chế sốt rét, người ta dự tính phun tất cả 10.000 nhà ở một vùng
nông thôn với thuốc diệt côn trùng và cần thiết ước lượng số lượng cần thiết. Bởi vì không
thể đo lường tất cả 10.000 nhà, người ta chọn một mẫu ngẫu nhiên 100 nhà và đo diện tích bề
mặt có thể phun thuốc của từng căn nhà.
Diện tích bề mặt có thể phun thuốc trung bình của 100 nhà này là 23,2 m2 và độ lệch chuẩn
là 5,9 m2. Diện tích trung bình của mẫu 100 căn nhà (x) không thể bằng chính xác diện tích
trung bình của 10.000 nhà (µ ). Ðộ chính xác được đo lường bằng sai số chuẩn s/√ n gần bằng
s/√ n=5,9/100=0,6 m2. Xác suất 95% trung bình mẫu (23,2m2) khác với trung bình dân số ít
hơn 1,96 s.e. = 1,96 × 0,6 = 1,2 m2. Khoảng tin cậy 95% là
x ± 1,96 × s/√ n = 23,2 ± 1,2 = 22,0 đến 24,4 m2

21
Căn bản thống kê y học -Ðỗ Văn Dũng

Người ta quyết định dùng giới hạn tin cậy 95% trên trong dự trù cho lượng thuốc trừ sâu cần
thiết bởi vì người ta muốn tính thừa hơn là tính thiếu. Một lít thuốc trừ sâu đủ phun cho 50
m2 và lượng dự trù là
10.000 x 24,4/50 =4880 lít
Dầu vậy vẫn con có khả năng không có đủ thuốc trừ sâu. Khoảng 22,0 tới 44,4 m2 cho phạm
vi các giá trị khả dĩ của diện tích bề mặt trung bình của tất cả 10.000 nhà. Có xác suất 95%
khoảng này chứa trung bình dân số nhưng có xác suất 5% là chúng không chứa trung bình
dân số và có xác suất 2,5% ước lượng dựa trên giới hạn tin cậy trên là quá nhỏ. Ước lượng
cẩn thận hơn lượng thuốc diệt côn trùng cần thiết cần dựa trên khoảng tin cậy rộng hơn, thí
dụ như 99%, thì xác suất ước lượng thiếu sẽ nhỏ hơn (0,05%).

Mẫu nhỏ
Khi tính toán khoảng tin cậy chúng ta giả thuyết rằng cỡ mẫu là lớn (lớn hơn 60). Khi cỡ mẫu
không lớn có hai khía cạnh sẽ thay đổi. Thứ nhất, độ lệch chuẩn mẫu, s, dễ bị tác động bởi
các biến thiên lấy mẫu, có thể không phải là ước lượng đáng tin cậy của s . Thứ nhì, khi phân
phối của dân số phi bình thường, phân phối của trung bình mẫu cũng có thể phi bình thường.
Tác động thứ nhì chỉ có ý nghĩa thực tiễn khi cỡ mẫu rất nhỏ (nhỏ hơn 15) và khi phân phối
của dân số rất khác bình thường. Ðiều này là do một tính chất toán học rất hữu ích được gọi
là định lí giới hạn trung tâm (central limit theorem) khẳng định rằng ngay cả biến không có
phân phối bình thường, trung bình mẫu có khuynh hướng phân phối bình thường (có thể biểu
diễn thực tế của định lí này bằng cách tiến hành một trò chơi lấy mẫu như trong thí dụ 3.4
nhưng thay thế 250 huyết áp bằng một dân số phân phối phi bình thường. Mẫu càng lớn thì
trung bình mẫu càng gần với phân phối bình thường; cỡ mẫu cần thiết để cho xấp xỉ bình
thường phụ thuộc vào dân số có phân phối bình thường nhiều hay ít nhưng trong phần lớn các
trường hợp, cỡ mẫu 15 là đủ.
Bởi vì định lí giới hạn trung tâm, nên thường chỉ có vấn đề thứ nhất là sự biến thiên s do lấy
mẫu mới khiến cho không thể sử dụng phân phối bình thường để tính khoảng tin cậy. Thay
vào đó người ta dùng phân phối t. Nói chính xác, điều này chỉ đúng đắn khi dân số có phân
phối bình thường. Dù vậy việc dùng phân phối t là xác đáng trừ khi dân số phân phối rất phi
bình thường (tính chất ngày được gọi là tính vững (robustness)). Sau này chúng ta sẽ trình
bày phải làm gì trong trường hợp cực kì phi bình thường.

Khoảng tin cậy dùng phân phối t


Các tính toán khoảng tin cậy ở trên dùng phân phối bình thường dựa trên sự kiện (x-µ )/(s/√
n) là một giá trị của phân phối bình thường và chúng ta có thể dùng s tay cho s đối với mẫu
lớn. Trên thực tế, (x- µ)/(s/√ n) không phải là một giá trị của phân phối bình thường mà là
của phân phối t với (n-1) độ tự do (t distribution with (n-1) degrees of freedom). Phân phối
này được W.S. Gossett, có bút danh là Student, tìm ra và thường được gọi là phân phối t của
Student. Giống như phân phối bình thường, phân phối t là một phân phối hình chuông đối
xứng có trung bình là zero nhưng trải rộng hơn và có đuôi dài hơn (Hình 5.1)
Hình dạng chính xác của phân phối t phụ thuộc vào độ tự do (degrees of freedom - d.f.) n-1
của độ lệch chuẩn mẫu, s; độ tự do càng nhỏ phân phối t càng trải rộng. Người ta lập bảng A3
điểm phần trăm cho các độ tự do khác nhau. Thí dụ, nếu cỡ mẫu là 8, độ tự do là 7 và điểm
5% là 2,36. Trong trường hợp này khoảng tin cậy 95% dùng độ lệch chuẩn mẫu s là x ±
2,36×s/√n. Nói chung khoảng tin cậy được tính dùng t, điểm phần trăm thích hợp của phân
phối t với (n-1) độ tự do.

Khoảng tin cậy cỡ mẫu nhỏ = x + (t × s/√ n)

22
KHOẢNG TIN CẬY CỦA TRUNG BÌNH

Phán phäúi bçnh thæåìng

Phán phäúi t våïi 5 âäü tæû do

-3 -2 -1 0 -1 2 3
Hình 5.1 Phân phối t có 5 độ tự do so sánh với phân phối bình thường
Ðối với độ tự do nhỏ, điểm phần trăm của phân phối t lớn hơn đáng kể so với điểm phần trăm
của phân phối bình thường. Ðiều này do độ lệch chuẩn mẫu s có thể là ước lượng không
chính xác của s, và khi tính đến điều này khoảng tin cậy rộng hơn đáng kể so với t đã biết s.
Ðối với độ tự do lớn, phân phối t hầu như là giống như phân phối bình thường chuẩn, bởi vì s
là ước lượng đúng của s. Ðáy của Bảng A3 trình bày điểm phần trăm của phân phối t với vô
hạn (∞) bậc tự do và ta có thể so sánh với Bảng A2 để thấy là chúng giống với phân phối bình
thường chuẩn.
Thí dụ 5.2
Sau đây là số giờ không bị đau của 6 bệnh nhân viêm khớp sau khi sử dụng một loại thuốc
mới
2,2 2,4 4,9 2,5 3,7 4,3 giờ
x = 3,3 giờ, s = 1,13 giờ, n = 6, d.f. = 6-1 = 5
s/√ n = 0,46 giờ
Ðiểm 5% của phân phối t với 5 bậc tự do là 2,57 và khoảng tin cậy 95% của số giờ
trung bình không bị đau đối với bệnh nhân viêm khớp là
3,3 ± 2,57 × 0,46 = 3,3 ±1,2 = 2,1 tới 4,5 giờ
Tính phi bình thường nghiêm trọng
Khi phân phối của dân số rất phi bình thường, ta có thể biến đổi thang đo của biến số x để
cho nó có phân phối bình thường theo thang mới (xem Chương 19). Một cách khác là tính
khoảng tin cậy phi tham số (Chương 20) mặc dù cách này khá phức tạp.

Tóm tắt các trường hợp


Bảng 5.1 tóm tắt các cách xây dựng khoảng tin cậy. Không có ranh giới chính xác giữa tính
bình thường và phi bình thường nhưng ta có thể cho phân phối hình J ngược (hình 2.6b) là
cực kì phi bình thường nhưng phân phối bị lệch (Hình 2.5b và c) chỉ hơi phi bình thường.

23
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 5.1 Các cách được đề nghị để xây dựng khoảng tin cậy
(a) Không biết độ lệch chuẩn dân số s
Phân phối dân số
Cỡ mẫu xấp xỉ bình thường rất phi bình thường
Trên 60 x ± (z' × s/√ n) x ± (z' × s/√ n)
Nhỏ hơn 60 x ± (t' × s/√ n) phi tham số
(b) Ðã biết độ lệch chuẩn dân số
Phân phối dân số
Cỡ mẫu xấp xỉ bình thường rất phi bình thường
Trên 15 x ± (z' × σ /√ n) x ± (z' × σ /√ n)
Nhỏ hơn 15 x ± (z' × σ /√ n) phi tham số

24
KHOẢNG TIN CẬY CỦA TRUNG BÌNH

Trong các trường hợp hiếm người ta biết độ lệch chuẩn dân số và do đó không ước lượng từ
dân số. Khi đó, điểm phần trăm được dùng để tính khoảng tin cậy bất kể cỡ mẫu, với điều
kiện phân phối của dân số không được quá phi bình thường (trong trường hợp này xem lại
đoạn trên).

25
Căn bản thống kê y học -Ðỗ Văn Dũng

KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH


Giới thiệu
Trong Chương 5 chúng ta đã biết làm sao để sử dụng trung bình và độ lệch chuẩn mẫu để xây
dựng khoảng tin cậy thể hiện các giá trị khả dĩ của trung bình dân số. Trong chương này
chúng ta mô tả cách ngược lại để xem trung bình mẫu có phù hợp với một giá trị trung bình
dân số giả thuyết. Phương pháp đánh giá này được gọi là kiểm định ý nghĩa. Nó thường dựa
vào phân phối t hay phân phối bình thường, yếu tố quyết định sự lựa chọn cũng giống như
yếu tố quyết định trong việc tính toán khoảng tin cậy. Một dạng đặc biệt nhưng phổ biến của
kiểm định t một mẫu, kiểm định t cặp đôi, sẽ được mô tả trước tiên, sau đó là dạng tổng quát
của kiểm định t và cuối cùng là kiểm định bình thường một mẫu.

Kiểm định t cặp đôi


Kiểm định t cặp đôi (paired t test) để kiểm định xem có sự khác nhau giữa một cặp biến số đo
lường trên một cá nhân có bằng zero hay không, tính trên trung bình. Xem xét với một ví dụ
cụ thể sẽ dễ dàng hơn. Xét- kết quả của một thử nghiệm lâm sàng kiẻm tra hiệu quả của thuốc
ngủ trong đó người ta quan sát giấc ngủ của 10 bệnh nhân trong một đêm không dùng thuốc
và một đêm có dùng thuốc. Kết quả được trình bày trong Bảng 6.1. Ðối với bệnh nhân. Người
ta ghi nhận một cặp thời gian ngủ và tính hiệu số. Số trung bình của hiệu số số giờ ngủ có
thuốc với số giờ ngủ dùng placebo là x=1,78 giờ, và độ lệch chuẩn là s=1,77 giờ. Sai số
chuẩn là s/√n=1,77/√ 10=0,56 giờ.
Ngay cả khi thuốc không có tác dụng, thời gian ngủ trung bình khi có thuốc và khi dùng
placebo sẽ không giống hệt nhau. Do đó có hai giải thích khả dĩ cho sự gia tăng mà ta vừa
thấy. Thức nhất đó chỉ là do sự biến thiên tình cờ và nói chung thuốc và placebo gây ngủ như
nhau. Cách giải thích thứ nhì là sự gia tăng thời gian ngủ là do tác dụng có thực của thuốc.
Người ta dùng kiểm định ý nghĩa (significant test) để quyết định xem lời giải thích nào khả dĩ
hơn.
Kiểm định bắt đầu bằng cách giả thuyết rằng giải thích đầu tiên là đúng. Bước đầu tiên do đó
là định nghĩa giả thuyết trung tính (null hypothesis) khẳng định rằng không có sự khác biệt
thực sự giữa thời gian ngủ khi có không hoặc khi có placebo, hay nói cách khác sự trung bình
thực sự (µ) của hiệu số là zero. Bước tiếp theo là tính toán xác suất có được giá trị trung bình
quan sát (x) do sự biến thiên tình cờ nếu giả thuyết này đúng. Tìm được bằng cách tính xác
suất có được hiệu số giờ ngủ lớn hơn hoặc bằng giá trị trung bình quan sát được. Xác suất
này được gọi là mức ý nghĩa (significance level) của kết quả. Bác bỏ giả thuyết trung
tính, nghĩa là bác bỏ sự giải thích là do tình cờ, khi xác suất này rất nhỏ.

26
KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

Bảng 6.1 Kết quả của thử nghiệm lâm sàng có đối chứng để xem hiệu quả của thuốc ngủ
Giờ ngủ
Bệnh nhân thuốc placebo hiệu số
1 6,1 5,2 0,9
2 7,0 7,9 -0,9
3 8,2 3,9 4,3
4 7,6 4,7 2,9
5 6,5 5,3 1,2
6 8,4 5,5 3,0
7 6,9 4,2 2,7
8 6,7 6,1 0,6
9 7,4 3,8 3,6
10 5,8 6,3 -0,5
Trung bình 7,06 5,28 1,78
Chúng ta dùng phân phối t để tính mức ý nghĩa của kết quả. Từ Chương 5 chúng ta biết rằng
với điều kiện là hiệu số giờ ngủ phân phối bình thường, (x -µ )/(s/√ n) là giá trị của phân
phối t có 9 bậc tự do. Giả thuyết không của hiệu số thời gian ngủ là zero tương đương với
trung bình dân số, m, bằng zero và do đó.
x
t càûp âäi = , d. f . = n − 1
s/ n
Giá trị tuyệt đối của t càng lớn càng ít khả năng kết quả là do tình cờ (bỏ qua dấu của t).
Trong thí dụ này, giá trị t tương ứng với hiệu số giờ ngủ là 1,78 là

t =1,78/0,56=3,18, độ tự do = 9
Ðiểm 5% (2 đuôi) của phân phối t với 9 độ tự do là 2,26 (Bảng A3), có nghĩa là có xác suất
5% giá trị t lớn hơn 2,26 về trị tuyệt đối. Ðiểm 2% là 2,82 và 1% là 3,25. Giá trị quan sát
được ở giữa 2% và 1% (Hình 6.1). Hiệu số thời gian ngủ được xem là có mức ý nghĩa 2%
(significant at the 2% level), bởi vì xác suất có sự khác biệt lớn đó là do tình cờ ít hơn 2%.
Nếu viết xác suất theo thập phân người ta thường viết P<0,02. Bởi vì xác suất này nhỏ người
ta kết luận rằng giả thuyết này là không phù hợp và thử nghiệm kết luận rằng thuốc có ảnh
hưởng đến thời gian ngủ.

-2.82 0 2.82 -3.25 0 3.25 -3.18 0 3.18

(c) 3.18 åí giæîa 2.82 vaì


(a) 2.82 laì âiãøm 2% (b) 3.25 laì âiãøm 1% 3.25 do âoï täøng diãûn têch
hai bãn khoaíng tæì 1% âãún
2% 27
Căn bản thống kê y học -Ðỗ Văn Dũng

Hình 6.1 Ýï nghĩa của giá trị 3,18 của phân phối t 9 độ tự do
Mức ý nghĩa càng nhỏ thì kết quả càng có ý nghĩa, bởi vì nó chứng minh chống lại giả thuyết
trung tính mạnh mẽ hơn. Người ta thường xem xác suất dưới 5% là bằng chứng hữu lí để bác
bỏ giả thuyết trung tính, xác suất dưới 1% là bằng chứng mạnh mẽ để bác bỏ giả thuyết trung
tính ủng hộ sự kiện có tác động thực sự. Xác suất lớn hơn 5% được coi là không có ý nghĩa
bởi vì nó thường được xem là tương đối phù hợp với giả thuyết không. Ðiều đó không có
nghĩa là giả thuyết trung tính đúng mà chỉ là không có bằng chứng mạnh mẽ nào để bác bỏ
chúng.
Trên lí thuyết có thể tính toán xác suất chính xác tương ứng với giá trị t = 3,18 và một vài
chương trình máy tính đã làm như thế. Dù vậy, để làm bằng tay cần phải một bảng chi tiết
(giống như Bảng A1 cho phân phối bình thường) cho mỗi độ tự do của phân phối t. Thông
thường chỉ cần so sánh giá trị t với điểm phần trăm của độ tự do tương ứng.
Sau khi đã kết luận rằng thuốc có tác dụng thực sự chúng ta nên trình bày ước lượng của thời
gian ngủ thêm do thuốc. Chúng ta thực hiện bằng cách tính 95% độ tin cậy. Ðó là 1,78 ±
(2,26 × 0,56) bằng 0,51 tới 3,05 giờ.

Quan hệ giữa khoảng tin cậy và kiểm định ý nghĩa


Có sự liên hệ chặt chẽ giữa ước lượng khoảng tin cậy và kiểm định ý nghĩa. Khoảng tin cậy
cho phạm vi của giá trị trung bình dân số rút ra từ số liệu, trong khi kiểm định ý nghĩa đánh
giá xem số liệu có phù hợp với một giá trị giả thuyết nào đó hay không. Do đó, nếu kết quả
khác biệt có ý nghĩa với giá trị giả thuyết ở mức ý nghĩa đã chọn, khoảng tin cậy tương ứng sẽ
không bao gồm giá trị này. Mặt khác, nếu giá trị không có ý nghĩa, khoảng tin cậy sẽ chứa giá
trị giả thuyết. trong thí dụ trên, trung bình mẫu quan sát (1,78) khác biệt có ý nghĩa với zero ở
mức 5%, và trong khoảng tin cậy 95% của trung bình dân số không chứa zero. Mặt khác,
trung bình mẫu không khác biệt có ý nghĩa với zero ở mức 1% và khoảng tin cậy 95% của
trung bình dân số (1,78 ± 3,25 × 0,56 = -0,04 tới 3,60) có chứa giá trị zero.

Kiểm định ý nghĩa 1 đuôi và 2 đuôi


Kiểm định ý nghĩa được mô tả ở trên là hai đuôi (two-sided), bởi vì chúng ta cho phép đi khỏi
giả thuyết trung tính theo 2 hướng. Chúng ta chỉ quan tâm đến giá trị tuyệt đối của t và không
tính dấu của nó. giải thuyết trung tính cho rằng không có sự khác biệt giữa thuốc và placebo
và giả thuyết thay thế là có sự khác nhau theo hai hướng (thuốc gây ngủ ít hay nhiều hơn
placebo) là có thể và đều đáng quan tâm. Xác suất của cả hai trường hợp đều được xét đến
trong tính toán mức ý nghĩa; khi đó ta dùng điểm phần trăm 2 đuôi của phân phối t.
Kiểm định một đuôi (one-sided)thích hợp nếu người ta xem xét thuốc sẽ gây ngủ nhiều hơn
hoặc bằng placebo, nhưng không gây ngủ ít hơn. Nếu trường hợp này đúng, kết quả cho thấy
thuốc gây ngủ trung bình ít hơn placebo sẽ được cho là do sự biến thiên tình cờ chứ không
phải là tác dụng thực, dù rằng thời gian ngủ trung bình có lớn tới cỡ nào. Kiểm định ý nghĩa
dựa trên đuôi trên của phân phối t và ta dùng điểm phần trăm 1 đuôi. Trong thí dụ này thuốc
gây ngủ nhiều hơn 1,78 giờ và giá trị t là 3,18 với 9 độ tự do. Số này vượt quá điểm 1% một
chiều, 2,68, và vì vậy nếu dùng kiểm định một đuôi nó có ý nghĩa ở mức 1% (lưu lý rằng 2,82
là điểm 2% hai đuôi và kiểm định có ý nghĩa ở mức 2% chứ không phải ở mức 1%).
Kiểm định hai đuôi thích hợp trong đa số các trường hợp. Kiểm định một đuôi có vẻ cám dỗ
bởi vì có nhiều khả năng cho kết quả có ý nghĩa hơn nhưng nó có nguy cơ bác bỏ giả thuyết
trung tính và kết luận một cách sai lầm là có tác động thực sự bác bỏ. Kiểm định một đuôi chỉ
nên dùng khi có lí do rõ ràng. Ðiều này phải được quyết định trước khi thu thập số liệu và
phải được khẳng định rõ ràng trong phần trình bày kết quả.

28
KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

Kiểm định t một mẫu


Kiểm định t bắt cặp là một trường hợp đặc biệt của kiểm định t một mẫu, kiểm định xem
trung bình mẫu có khác với một giá trị cho trước µ hay không, µ không nhất thiết phải bằng
zero. Công thức tổng quát là

x−µ
t= , d. f . = n − 1
s/ n
Thí dụ 6.1
Dưới đây là chiều cao tính theo centimetre của 24 trẻ trai 2 tuổi người Jamaica mắc bệnh
hồng cầu hình liềm đồng hợp tử
84,4 89,9 89,0 91,9 87,0 78,5 84,1 86,3
80,6 80,0 81,3 86,8 83,4 89,8 85,4 80,6
85,0 82,5 80,7 84,3 85,4 85,0 85,5 81,9

Theo tiêu chuẩn về chiều cao và trọng lượng của Anh, chiều cao tham khảo của trẻ trai 2 tuổi
là 86,5 cm. Mẫu ở trên có chứng minh rằng trẻ trai bị bệnh hồng cầu liềm có chiều cao khác
tiêu chuẩn hay không?
x=84,4 cm, s=3,11 cm , n=24, s/√ n=0,63 cm
Giả thuyết trung tính là chiều cao trung bình của trẻ trai 2 tuổi bị bệnh hồng cầu liềm là 86,5
cm.

x − 86.5 84.1 − 86.5


t= = = −3,81, d . f . = n − 1, P < 0.001
s/ n 0.63

Do đó chiều cao trung bình của các trẻ trai Jamaica bị bệnh hồng cầu liềm thấp hơn có ý
nghĩa so với chiều cao tiêu chuẩn của Anh (P<0,001). Lưu ý rằng cần cẩn thận khi lí giải kết
quả bởi vì sự phát triển của trẻ em bị hồng cầu liềm Jamaica được so sánh với tiêu chuẩn của
Anh chứ không phải trẻ em Jamaica khỏe mạnh. Có thể rằng bệnh hồng cầu liềm làm còi sự
phát triển nhưng cần phải so sánh với trẻ Jamaica không bệnh để khẳng định điều này.
Phương pháp so sánh hai mẫu được trình bày ở Chương 7.

Kiểm định bình thường


Trong trường hợp ước lượng khoảng tin cậy, khi kiểm định trung bình của một mẫu lớn (60
hay hơn 60) hay trong trường hợp đã biết độ lệch chuẩn của dân số, người ta dùng phân phối
bình thường chứ không phải dùng phân phối t. Dạng kiểm định ý nghĩa thì hoàn toàn giống
nhau

(Mẫu lớn) (đã biết σ)


x−µ x−µ
z= t=
s/ n σ/ n

29
Căn bản thống kê y học -Ðỗ Văn Dũng

Dường như không có sự thống nhất trong việc đặt tên kiểm định này. Ðôi khi người ta gọi là
kiểm định bình thường, hay kiểm định z hay kiểm định độ lệch bình thường chuẩn. Sách này
dùng tên kiểm định bình thường.

Các loại sai lầm trong kiểm định giả thuyết


Như đã nói, kiểm định ý nghĩa là phương pháp đánh giá xe, kết quả có thể là do tình cờ hay
do một hiệu quả có thực. Nó không thể chứng minh điều này hoặc điều kia và một trong hai
loại sai lầm trên có thể xảy ra. Giả thuyết trung tính có thể bị bác bỏ khi nó thực sự đúng (sai
lầm loại I) hay ngược lại chúng ta có thể không bác bỏ được trong khi nó sai (sai lầm loại II)
(Bảng 6.2)
Bảng 6.2 Các loại sai lầm trong kiểm định thống kê
Thực tế
Kết luận của kiểm định ý giả thuyết trung tính giả thuyết trung tính sai
nghĩa đúng
Bác bỏ giả thuyết trung sai lầm loại I kết luận đúng
tính (xác suất=ý nghĩa) (xác suất=năng lực)
Không bác bỏ giả thuyết kết luận đúng sai lầm loại II
trung tính (xác suất = 1 - mức ý nghĩa) (xác suất=1-năng lực)

Nhắc lại mức ý nghĩa của một kiểm định bằng với xác suất xảy ra kết quả bằng hoặc vượt quá
giá trị quan sát được, nếu giả thuyết trung tính đúng. Xác suất chúng ta mắc sai lầm loại I và
bác bỏ sai giả thuyết trung tính bằng mức ý nghĩa của kiểm định. Thí dụ, có xác suất 5% có
kết quả có mức ý nghĩa 5% chỉ do sự biến thiên lấy mẫu đơn thuần và do đó nếu chúng ta
đánh giá kết quả là bằng chứng bác bỏ giả thuyết trung tính, có xác suất 5% chúng ta sẽ mắc
sai lầm (hình 6.2a).
Loại sai lầm thứ hai là không bác bỏ giả thuyết trung tính khi nó sai. Ðiều này xảy ra là do sự
chồng lắp giữa phân phối lấy mẫu thực của trung bình mẫu quanh trung bình dân số µ' (≠µ )
và miền chấp nhận của giả thuyết trung tính dựa trên phân phối lấy mẫu giả thuyết về trung
bình không đúng, µ . Ðiều này được minh họa trong Hình 6.2b. Miền gạch chéo cho thấy tỉ lệ
b% của phân phối lấy mẫu thực sẽ rơi vào trong miền chấp nhận của giả thuyết trung tính, đó
là chúng phù hợp với giả thuyết trung tính ở mức ý nghĩa 5%. Nếu chọn mức ý nghĩa thấp
hơn, khiến xác suất sai lầm loại I nhỏ hơn, kích thước miền có gạch chéo tăng lên dẫn tới khả
năng không bác bỏ được giả thuyết trung tính sẽ lớn hơn. Ðiều ngược lại cũng đúng. Xác suất
ta không mắc sai lầm loại II là năng lực (power) của kiểm định. Ðiều này được thảo luận sâu
hơn trong phần xác định cỡ mẫu ở Chương 26. Nói chunng tăng cỡ mẫu sẽ tăng năng lực bởi
vì đường cong phân phối lấy mẫu trong hình 6.2b sẽ cao hơn và hẹp hơ và do đó sự chồng lắp
sẽ giảm.

(a)
Bác bỏ giả thuyết trung tính nếu trung bình chấp nhận giả thuyết trung bác bỏ giả thuyết trung tính nếu
mẫu ở vùng này tính nếu trung bình mẫu ở trung bình mẫu ở vùng này
vùng này

30
KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

µ
(a) Sai lầm loại I. Giả thuyết trung tính đúng. Trung bình dân số = m. Ðường cong cho thấy phân phối
lấy mẫu của trung bình mẫu. Vùng gạch chéo (tổng số = 5%) cho thấy xác suất giả thuyết trung tính bị
loại bỏ một cách sai lầm.

(b)
Bác bỏ giả thuyết trung tính nếu trung bình chấp nhận giả thuyết trung tính bác bỏ giả thuyết trung tính nếu
mẫu ở vùng này nếu trung bình mẫu ở vùng này trung bình mẫu ở vùng này

µ µ'
(b) Sai lầm loại 2. Giả thuyết trung tính sai. Trung bình dân số = m' khác m. Ðường cong liên tục cho
thấy phân phối lấy mẫu thực của trung bình mẫu, trong đó đường chấm là phân phối lấy mẫu theo giả
thuyết trung tính. Vùng gạch chéo là xác suất (b%) giả thuyết trung tính không bị bác bỏ.
Hình 6.2 Xác suất xuất hiện hai loại sai lầm kiểm định ý nghĩa, minh họa ở kiểm định ở mức 5%

31
Căn bản thống kê y học -Ðỗ Văn Dũng

SO SÁNH HAI TRUNG BÌNH


Giới thiệu
Việc sử dụng kiểm định t và bình thường để so sánh một trung bình mẫu với một giá trị giả
thuyết của trung bình dân số được trình bày ở Chương 6. Trong chương này chúng ta mô tả
các sử dụng những kiểm định này để so sánh trung bình của hai mẫu khác nhau thí dụ trong
lượng trung bình của trẻ em con những người hút thuốc lá nhiều và của trẻ em con những
người không hút thuốc. Kiểm định này sử dụng những quy luật rất giống những quy luật
trong trường hợp một mẫu và dạng của kiểm định thì giống nhau, cũng là lượng cần kiểm
định chia cho sai số chuẩn của nó. Dù vậy không giống như trường hợp một mẫu, công thức
cho kiểm t và bình thường khác nhau, bởi vì việc tính toán sai số chuẩn khác nhau và kiểm
định t cần thêm một giả thiết khác đó là hai độ lệch chuẩn dân số bằng nhau. Ở dưới sẽ trình
bày chi tiết. Khoảng tin cậy được tính như bình thường.
Cần phải lưu ý rằng kiểm định 2 mẫu không thích hợp cho việc so sánh hai trung bình của hai
biến số đo lường trên cùng một mẫu. Trong trường hợp này cần tính hiệu số của mỗi cặp
quan sát và dùng kiểm định cặp một mẫu như đã trình bày trong chương 6.

Phân phối lấy mẫu của hiệu số hai trung bình


Hiệu số, (x1 - x2, của trung bình hai mẫu độc lập với nhau có phân phối bình thường với
điều kiện mỗi trung bình có phân phối bình thường. trung bình của phân phối này là hiệu số
giữa hai trung bình dân số, µ1 - µ2. Giả thuyết trung tính của kiểm định ý nghĩa là hai trung
bình này bằng nhau nghĩa là µ1 - µ2=0. Công thức tính sai số chuẩn dựa trên sự kết hợp giữa
hai sai số chuẩn của mỗi trung bình.

s.e.= √ (σ12/n1+σ22/n2)
Các sai số chuẩn này được ước lượng từ độ lệch chuẩn mẫu s1 và s2.

Kiểm định bình thường (mẫu lớn hay biết độ lệch chuẩn)
Kiểm định bình thường được dùng khi mẫu lớn hoặc biết độ lệch chuẩn.

Mẫu lớn biết s


x1 − x 2 x1 − x 2
z= z=
( s / n + s / n)
2
1
2
2 (σ / n + σ 22 / n)
2
1

Xem xét kết quả sau từ một chương trình sốt rét trong đó các lam máu của trẻ từ 1 đến 4 tuổi
được xét nghiệm tìm kí sinh trùng Plasmodium falciparum. Kí sinh trùng được tìm thấy trong
70 lam máu, và nồng độ hemoglobin của những trẻ này là 10,6g% với độ lệch chuẩn là
1,4g%. Mức hemogloin của 80 trẻ khác là 11,5g% với độ lệch chuẩn là 1,3g%. điều này có
phù hợp sự kiện nồng độ hemoglobin bị giảm trong lúc bị nhiễm P. falciparum? Bởi cả hai
mẫu đều lớn nên có thể dùng kiểm định bình thường.

n1 = 70, x1 = 10,6, s1 =1,4


n2 = 80, x2 = 11,5, s2 = 1,3

32
SO SÁNH HAI TRUNG BÌNH

10.6 − 11.5
z= = −4.06, P < 0,001
1.4 2 / 70 + 1.3 2 / 80
Kết quả này có mức ý nghĩa ở 1% bởi vì 4,06 lớn hơn 3,29, điểm 0,1% của phân phối bình
thường (Bảng A2). Do đó nồng độ hemoglobin trung bình của trẻ có P. Falciparum trong máu
thấp hơn những trẻ không có P. falciparum một cách có ý nghĩa (P<0,001).
Khoảng tin cậy

Mẫu lớn biết s

c.i.=(x1-x2) ± (z' × s.e.) c.i.=(x1-x2) ± (z' × s.e.)

s.e.= √ (s12/n1+s22/n2) s.e.= √ (σ12/n1+σ22/n2)

Khoảng tin cậy được tính sử dụng z, điểm phần trăm thích hợp của phân phối bình thường.
Khoảng tin cậy 95% của hiệu số giữa các nồng độ hemoglobin trung bình ở thí dụ trên là:

- 0,9 ± (1,96 × 0,2216) = -1,33 tới - 0,47 g%


Có nghĩa là trẻ có kí sinh trùng trong máu có hemoglobin trung bình thấp hơn từ 0,47 tới 1,33
g%.

Kiểm định t (mẫu nhỏ, độ lệch chuẩn bằng nhau)


Kiểm định t được dùng cho mẫu nhỏ. Nó đòi hỏi phân phối dân số bình thường nhưng nó
cũng vững đối với sự vi phạm giả thiết này, giống như trong trường hợp một mẫu. Khi so
sánh hai trung bình, sự hợp lệ của test t cũng phụ thuộc vào hai độ lệch chuẩn dân số có bằng
nhau hay không. Trong nhiều tình huống có thể giả thuyết chúng bằng nhau. Nếu độ lệch
chuẩn mẫu rất khác nhau, thí dụ như lớn gấp đôi, cần phải sử dụng phương pháp khác. Ðiều
này sẽ được nói ở dưới.
Công thức tính sai số chuẩn của sự khác biệt giữa hai trung bình được đơn giản thành

s.e. = √ (σ2/n1 + σ2/n2)= σ √ (1/n1 +1/n2)


Trong đó s là độ lệch chuẩn chung. Có hai ước lượng mẫu của s từ 2 mẫu, s1 và s2, và chúng
kết hợp để cho một ước lượng của độ lệch chuẩn dân số chung, s, với độ tự do bằng (n1-1) +
(n2-1) = n1+n2-2

 (n − 1) s12 + (n 2 − 1) s 22 
s=  1 
 (n1 − n2 − 2) 
Công thức này gán ước lượng từ mẫu lớn hơn trọng số (weight) lớn hơn bởi vì nó đáng tin
cậy hơn. Sai số chuẩn của sự khác biệt của trung bình được ước lượng bằng

s.e. = s√ (1/n1 +1/n2)


Và giá trị t được tính
x1−x 2
t= ; d . f . = n1 + n2 − 2
s 1 / n1 + 1 / n 2

33
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 7.1 trình bày trọng lượng trẻ em của 15 người không hút thuốc lá và 14 hút thuốc lá
nặng việc tính toán kiểm định t để so sánh hai nhóm như sau

14 × 0.3707 2 + 13 × 0.4927 2 


s=   = 0.4337kg
 (15 + 14 − 2 ) 

(3.5933 − 3.2029) 0.3904


t= = = 2.42; d . f . = 15 + 14 − 2 = 27
0.4337 1 / 15 + 1 / 14 0.1612
Từ bảng 3 có thể thấy 2,42 xấp xỉ bằng 2,47 điểm 2% của phân phối t với 27 độ tự do. Do đó
trẻ trung bình con của người không hút thuốc nặng hơn của của người hút thuốc với mức ý
nghĩa 2%
Khoảng tin cậy
c.i = (x1 - x2) ± (t' × s.e.), s.e. = s√ (1/n1+1/n2)
Khoảng tin cậy được tính bằng cách dùng t, điểm phần trăm thích hợp của phân phối t với (n1
+ n2 - 2) độ tự do. Trong thí dụ trên khoảng tin cậy 95% của sự khác biệt giữa trung bình
trọng lượng lúc sinh là:
0,3904 ± (2,05 × 0,1612) = 0,06 tới 0,72 kg
Có nghĩa là trẻ sinh ra do người mẹ không hút thuốc lá nặng hơn từ 0,06 tới 0,72 kg so với trẻ
sinh từ người mẹ hút thuốc lá.
Bảng 7.1 So sánh trọng lượng lúc sinh của con 15 người không hút thuốc lá và trọng lượng lúc sinh của
con 14 người hút thuốc lá nặng

Trọng lượng lúc sinh


Không hút thuốc Hút thuốc lá nặng
3,99 3,18
3,79 2,84
3,60 2,90
3,73 3,27
3,21 3,85
3,60 3,52
4,08 3,23
3,61 2,76
3,83 3,60
3,31 3,75
4,13 3,59
3,26 3,63
3,54 2,38
3,51 2,34
2,71

x 3,5933 3,2029
s 0,3707 0,4927
n 15 14

34
SO SÁNH HAI TRUNG BÌNH

Cỡ mẫu nhỏ, độ lệch chuẩn không bằng nhau


Khi độ lệch chuẩn dân số của hai nhóm khác nhau, nên làm theo phương án thứ nhất nghĩa là
tìm sự biến đổi thang đo để điều chỉnh (xem Chương 19), để cho có thể dùng kiểm định t. Thí
dụ nếu dường như độ lệch chuẩn tỉ lệ với trung bình, có thể lấy logarithm của từng giá trị.
Một phương án khác là dùng kiểm định phi tham số (xem Chương 20) hay dùng kiểm định
Fisher-Behrens hay Welch (Armitage & Berry, 1987). ở đây không trình bày chi tiết những
kiểm định này bởi vì chúng ít được sử dụng.

35
Căn bản thống kê y học -Ðỗ Văn Dũng

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI


Giới thiệu
Thường có những tập hợp số liệu phức tạp chứa hơn hai nhóm và trong phân tích thường phải
so sánh những trung bình của các nhóm thành phần. Thí dụ, người ta có thể muốn phân tích
các số đo hemoglobin được thu thập trên một cuộc điều tra cộng đồng để xem nó có khác
nhau theo tuổi và giới tính hay không và xem có phải là sự khác biệt giữa các nhóm tuổi là
như nhau dù là nam hay nữ. Thoạt đầu, dường như có thể làm điều này bằng cách dùng một
loạt các kiểm định t, so sánh từng 2 nhóm một. Ðiều này không chỉ rắc rối về mặt thực tiễn
mà còn vô lí về mặt lí thuyết, bởi vì tiến hành một số lớn các kiểm định ý nghĩa có thể dẫn tới
một kết quả có ý nghĩa sai lạc. Thí dụ có thể trông đợi 1 trong 20 (5%) các kiểm định được
tiến hành sẽ có ý nghĩa ở mức 5% ngay cả khi không có sự khác biệt (xem lại thảo luận về sai
lầm loại I trong chương 6).
Một phương pháp khác được gọi là phân tích phương sai (analysis of variance). Ý nghĩa của
tên này được trình bày sau. Phương pháp khá phức tạp. Việc tính toán mất nhiều thời gian và
thường được tiến hành nhờ các gói phần mềm máy tính chuẩn. Vì lí do này, chương này nhấn
mạnh đến các nguyên lí với mục đích giúp người đọc có đủ kiến thức để chỉ định dạng phân
tích cần thiết và lí giải kết quả. Dù vậy trong chương này cũng trình bày chi tiết của việc tính
toán trong trường hợp đơn giản nhất, đó là phân tích phương sai một chiều, bởi vì nó sẽ giúp
ích cho việc nắm vững căn bản của phương pháp và quan hệ của nó với kiểm định t.
Phân tích phương sai một chiều thích hợp khi các nhóm so sánh được xác bằng bởi một yếu
tố (factor), thí dụ như so sánh trung bình giữa các giai cấp khác nhau hay giữa các dân tộc
khác nhau. Phân tích phương sai hai chiều được mô tả và thích hợp khi việc chia nhóm dựa
trên 2 yếu tố, thí dụ như tuổi và giới tính. Phương pháp dễ dàng được mở rộng để so sánh các
nhóm đươc phân loại chéo bằng nhiều hai yếu tố.
Một yếu tố được phân tích phương sai bởi vì người ta muốn so sánh các mức khác nhau của
nó hay bởi vì nó gây cho sự biến thiên cần loại trừ. Xem thí dụ sau. Sau khi khám phá tỉ suất
bệnh mạch vành thay đổi đáng kể giữa các nhóm dân tộc khác nhau, người ta tiến hành một
cuộc điều tra để xem điều này có phải là do nồng độ lipid trung bình khác nhau giữa các
nhóm dân tộc khác nhau. Bởi vì nồng độ lipid thay đổi theo giới tính và tuổi, do đó cần phân
tích phương sai của nhóm tuổi và giới tính cũng như nhóm dân tộc, mặc dù tuổi và giới tính
không phải là mối quan tâm chính của nghiên cứu này. Việc đưa vào phân tích chúng có hai
lợi ích. Thứ nhất, kiểm định ý nghĩa sự khác biệt giữa các nhóm chủng tộc trở nên mạnh mẽ
(powerful) hơn, nghĩa là dễ khiến cho sự khác biệt thực sự trở thành có ý nghĩa. Thứ nhì, nó
đảm bảo sự so sánh các nhóm chủng tộc không bị sai lệch do cơ cấu nhóm tuổi và giới tính
(xem thảo luận về biến số gây nhiễu ở Chương 14. Xem thêm phương pháp chuẩn hóa ở
Chương 15 được dùng để trình bày trung bình của các nhóm dân tộc được hiệu chỉnh theo
tuổi và giới tính).
Cũng có thể phân tích số liệu được phân thành nhiều yếu tố bằng cách dùng một kĩ thuật
tương tự nhưng tổng quát hơn gọi là hồi quy bội (multiple regression) được mô tả ở Chương
10. Cả hai phương pháp đều cho kết quả giống hệt nhau nhưng bởi vì hồi quy bội tổng quát
hơn nên nó cần tính toán phức tạp hơn. Vì thế nó không hiệu quả trong các trường hợp đơn
giản. Dù vậy, sự lựa chọn phụ thuộc vào chương trình máy tính có được và chúng có dễ sử
dụng hay không.
Một vài độc giả có thể thấy nội dung của chương này hơi khó. Nó có thể bỏ qua trong lần đọc
đầu.

36
SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

Phân tích phương sai một chiều


Phân tích phương sai một chiều (one-way analysis of variance) được dùng để so sánh trung
bình của một số nhóm, thí dụ nhưng nồng độ hemoglobin trung bình của bệnh nhân của các
loại bệnh hồng cầu liềm khác nhau (bảng 8.1a). Phương pháp phân tích được gọi là một chiều
bởi vì số liệu được phân tích theo một chiều, trong trường hợp này là loại bệnh hồng cầu
liềm. Phương pháp dựa trên việc xác định thành phần trong toàn bộ biến thiên được quy cho
sự khác biệt giữa các trung bình nhóm và so sánh chúng với thành phần có thể quy cho sự
khác biệt giữa các cá nhân trong cùng nhóm. Do đó nó có tên là phân tích phương sai.
Chúng ta bắt đầu bằng cách tính phương sai của tất cả các quan sát, bỏ qua việc chia thành
từng nhóm. Nhớ lại trong Chương 3 rằng phương sai là bình phương của độ lệch chuẩn và
bằng tổng bình phương các hiệu số của quan sát và trung bình, chia cho độ tự do. Phương
pháp phân tích phương sai một chiều chia tổng các bình phương (sum of square - SS)
thành 2 phần riêng biệt:
(i) Tổng các bình phương do sự khác biệt giữa các trung bình nhóm
(ii) Tổng cách bình phương do sự khác biệt giữa các quan sát trong từng nhóm nó được gọi là
tổng bình phương phần dư (residual sum of squares)
Tổng các độ tự do cũng được tách ra theo cách tương tự. Việc tính toán số liệu hồng cầu liềm
được trình bày ở bảng 8.1(b) và kết quả trình bày của bảng phân tích phương sai ở trong bảng
8.1(c).
Cột thứ tư trong bảng trình bày lượng biến thiên cho mỗi độ tự do và được gọi là trung bình
bình phương (mean square - MS). Kiểm định ý nghĩa cho sự khác biệt giữa các nhóm dựa
trên trung bình bình phương giữa các nhóm (between groups) và trong nội bộ các nhóm
(within groups). Nếu sự khác biệt quan sát được trong nồng độ hemoglobin của các loại bệnh
hồng cầu liềm khác nhau chỉ là tình cờ, sự biến thiên giữa các nhóm cũng tương đương với sự
biến thiên giữa các đối tượng trong cùng một loại bệnh. Ngược lại nếu chúng là do sự khác
biệt thực sự thì sự biến thiên giữa các nhóm sẽ lớn hơn. Trung bình bình phương được so
sánh bằng kiểm định F, đôi khi còn được gọi là kiểm định tỉ số phương sai (variance-ratio).

Trong đó N là tổng số các quan sát và k là số các nhóm.


F phải xấp xỉ bằng 1 nếu không có sự khác biệt thực sự giữa các nhóm và lớn hơn 1 nếu có sự
khác biệt. Theo giả thuyết trung tính cho rằng sự khác biệt chỉ là do tình cờ, tỉ số này sẽ tuân
theo phân phối F mà không giống với các phân phối khác, nó có một cặp độ tự do: (k-1) độ tự
do ở tử số và (N-k) độ tự do ở mẫu số. Ðiểm phần trăm của phân phối F được lập bảng theo
các cặp độ tự do ở Bảng A4. Cột của bảng chỉ độ tự do của tử số và các khối gồm nhiều hàng
chỉ độ tự do của mẫu số. trong mỗi khối này có những hàng khác nhau cho mức phần trăm
khác nhau. Ðiểm phần trăm là một đuôi bởi vì kiểm định dựa trên phân phối F lớn hơn một.
Trong bảng 8.1(c), F=50,26/0,95=52,9 với độ tự do (2,38). Bảng điểm phần trăm có hàng cho
30 và 40 độ tự do chứ không có hàng cho 38 độ tự do. Dù vậy chúng ta có thể nói rằng điểm
0,1% của F(2,38) ở giữa 8,77 và 8,25 (là điểm 0,1% của F(2,30) và F(2,40)). Rõ ràng 52,9
lớn hơn cả hai. Do đó nồng độ hemoglobin khác nhau một cách có ý nghĩa giữa các bệnh
nhân mắc các loại bệnh hồng cầu liềm khác nhau (P<0,001). Nồng độ trung bình thấp nhất là
bênh nhân có Hb SS, trung bình đối với bệnh nhân có Hb S/ß-thalassaemia và cao nhất đối
với bệnh nhân có Hb SC.
Giả thiết
Có hai giả thiết cần cho kiểm định F. Thứ nhất là số liệu phải phân phối bình thường. Thứ nhì
là độ lệch chuẩn giữa các cá thể trong cùng một nhóm phải giống nhau. Có thể ước lượng
bằng căn bậc hai của trung bình bình phương (MS) trong các nhóm. Có thể bỏ qua sự phân

37
Căn bản thống kê y học -Ðỗ Văn Dũng

phối không bình thường nhưng các độ lệch chuẩn không bằng nhau có thể gây hậu quả
nghiêm trọng. Trong trường hợp này có thể biến đổi số liệu.
Mối liên hệ với kiểm định t hai mẫu
Phân tích phương sai một chiều là sự mở rộng của kiểm định t hai mẫu. Khi chỉ có hai mẫu,
nó cho kết quả y như là kiểm định t. Giá trị F bằng bình phương giá trị t tương ứng và điểm
phần trăm của phân phối F với (1,N-2) độ tự do cũng bằng bình phương của điểm phần trăm
của phân phối t với N-2 độ tự do.

38
SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

Bảng 8.1 Phân tích phương sai một chiều: sự khác biệt trong nồng độ hemoglobin giữa các bệnh nhân
bị các loại bệnh hồng cầu liềm khác nhau. Số liệu từ Anionwo et al. (1981) British Medical Journal,
282, 283-6

(a) Số liệu
Loại bệnh hồng cầu Số bệnh Trung bình s.d. Giá trị của các cá thể
liềm nhân hemoglobin g%
(ni) (xi) (si) (x)
Hb SS 16 8,7125 0,8445 7,2, 7,7, 8,0, 8,1, 8,3, 8,4, 8,4,
8,5, 8,6, 8,7, 9,1, 9,1, 9,1, 9,8,
10,1, 10,3
Hb S/b-thalassaemia 10 10,6300 1,2841 8,1, 9,2, 10,0, 10,4, 10,6, 10,9,
11,1, 11,9, 12,0, 12,1
Hb SC 15 13,300 0,9419 10,7, 11,3, 11,5, 11,6, 11,7, 11,8,
12,0, 12,1, 12,3, 12,6, 12,6, 13,3,
13,8, 13,8, 13,9
(b) Tính toán
_____________________________________________________________________________
N = Σ ni = 16 + 10 + 15 = 41, số nhóm (k) = 3
Σ x = 7,2 + 7,7 + ... + 13,8 + 13,9 = 430,2
Σ x2= 7,22 + 7,72 + ... + 13,82 + 13,92 = 4651,80

Tổng cộng: SS = Σ (x-x)2 = Σ x2 - (Σ x)2/N = 4651,80 - 430,22/41=137,85


d.f.= N-1 = 40

Giữa các nhóm SS= Σ ni(xi-x)2= Σ nixi2-( Σ x)2/N


= 16 × 8,71252+10 × 10,63002+15 × 12,3002 - 430,22/41=99,89
d.f. = k-1 = 2

Trong các nhóm SS = Σ (ni -1)si2 =15 x 0,84452 + 9 x 1,28412 + 14 x 0,9419 = 37,96
d.f.= N - k = 41-3 = 38
(c) Phân tích phương sai

Nguồn biến thiên SS d.f. MS=SS/d.f. MS giữa các nhóm


F= ----------------------------
MS bên trong nhóm
Giữa các nhóm 99,89 2 50,26 52,9,P<0,001
Trong các nhóm 37,96 38 0,95
Tổng cộng 137,85 40

Phân tích phương sai hai chiều


Người ta dùng phân tích phương sai hai chiều (two way analysis of variance) khi số liệu được
phân loại theo hai chiều thí dụ như theo tuổi và giới tính. Số liệu là quy hoạch cân đối
(balanced design) nếu số các quan sát trong các nhóm là bằng nhau và quy hoạch không
cân đối (unbalanced design) nếu số các quan sát trong các nhóm không bằng nhau. Qui hoạch
cân đối có hai loại có lặp (with replication) nếu có nhiều quan sát trong mỗi nhóm và không
có lặp (without replication) nếu chỉ có một quan sát. Ba loại quy hoạch này sẽ được trình bày
riêng.

39
Căn bản thống kê y học -Ðỗ Văn Dũng

Quy hoạch cân đối có lặp


Bảng 8.2 trình bày kết quả thực nghiệm trên 3 chủng chuột mỗi chủng gồm 5 chuột đực và 5
chuột cái được điều trị bằng hormone tăng trưởng. Mục đích là tìm xem các chủng chuột và
giới tính chuột có đáp ứng với điều trị như nhau hay không. Số đo của đáp ứng là tăng trọng
sau 7 ngày.
Những số liệu này được phân loại theo hai chiều, bởi chủng tộc và giới tính. Quy hoạch là
cân đối có lặp (balanced with replication) bởi vì có 5 quan sát trong mỗi nhóm chủng-giới
tính. Phân tích phương sai 2 chiều chia tổng bình phương thành 4 thành phần
(i) Tổng bình phương do sự khác biệt giữa các chủng. Ðiều này là tác động chính (main
effect) của yếu tó, chủng. Ðộ tự do của nó là số các chủng chuột trừ một và bằng 2.
(ii) Tổng bình phương do sự khác biệt giới tính, đó là tác động chính của giới tính. Ðộ tự do
của nó bằng 1, bằng số các giới tính trừ một.
(iii) Tổng bình phương do sự tương tác (interaction) giữa chủng và giới tính. Sự tương tác có
nghĩa là sự khác biệt do chủng không giống nhau trên cả hai giới hay ngược lại sự khác biệt
do giới tính không giống nhau trên 3 chủng chuột. Ðộ tự do bằng tích số độ tự do của 2 tác
động chính bằng 2 × 1=1
(iv) tổng bình phương phần dư là sự khác biệt giữa các con chuột trong cùng nhóm chủng-
giới tính. Ðộ tự do bằng 24, tích số của số chủng (3) số giới tính (2) và số quan sát trong mỗi
nhóm trừ một (4).
Tác động chính và tương tác được kiểm định độ ý nghĩa bằng cách dùng kiểm định F để so
sánh trung bình bình phương của nó với trung bình bình phương phần dư như được mô tả
trong phân tích phương sai một chiều. Thực nghiệm này không thu được kết quả có ý nghĩa.

Bảng 8.2 Sự khác biệt đáp ứng với hormone sinh trưởng trên 3 chủng chuột khác nhau (mỗi chủng gồm
5 đực và 5 cái).

(a) Tăng trọng trung bình (tính theo gram) với độ lệch chuẩn ở trong ngoặc (n=5 trong mỗi nhóm),
Giới tính chủng A chủng B chủng C
Nam 11,9(0,9) 12,1(0,7) 12,2(0,7)
Nữ 12,3(1,1) 11,8(0,6) 13,1(0,9)

(b)Phân tích phương sai hai chiều: quy hoạch cân bằng có lặp
Nguồn biến thiên SS d.f. MS=SS/ MS tác động
d.f. F= ----------------------
MS phần dư
Tác động chính
Chủng 2,63 2 1,32 1,9,P>0,1
Giới tính 1,16 1 1,16 1,7,P>0,1
Tương tác
Chủng × Giới 1,65 2 0,83 1,2,>0,1
Phần dư 16,86 24 0,70
Tổng cộng 22,30 29

Quy hoạch cân đối không lặp


Năm phương pháp để xác định tuổi thai được so sánh trên 10 phụ nữ trong bảng 8.3. Không
có tổng bình phương phần dư trong phân tích phương sai bởi vì chỉ có một quan sát cho một

40
SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

phương pháp áp dụng trên một phụ nữ. Trong trường hợp như vậy, tương tác được giả thiết là
do sự biến thiên tình cờ và trung bình bình phương được dùng làm ước lượng trung bình bình
phương phần dư để tính giá trị F của tác động chính. Tác động chính do tuổi thai khác nhau
giữa 10 phụ nữ hiển nhiên có ý nghĩa. Bản thân điều này không được quan tâm lắm nhưng nó
là một nguồn biến thiên quan trọng cần phải tính đến trong khi so sánh các phương pháp. Tác
động chính do sự khác biệt giữa các phương pháp là có ý nghĩa ở mức 5%
(F=757,85/202,81= 3,74, d.f.=[4,36]).
Phân chia tổng bình phương
Cần xem xét chi tiết các hiệu số tạo nên tác động có ý nghĩa. Thí dụ, phương pháp dựa trên
ngày thai máy cho con số trung bình cao hơn đáng kể so với các phương pháp khác. Có thể
phân chia tổng bình phương của tác động chính đối với các phương pháp trong bảng 8.3 (c)
thành:
(i) Tổng bình phương các hiệu số giữa phương pháp dựa trên ngày thai máy và các phương
pháp khác. Tổng này có 1 độ tự do.
Bảng 8.3 Tuổi thai tính theo ngày của 10 phụ nữ được ước tính bằng 5 phương pháp - kì kinh cuối (last
mentrual period - LMP), khám âm đạo (Vaginal examination - VE), ngày thai máy (date of quickening -
DOQ), siêu âm (Ultra sound - US) và oxydase diamine máu (Diamine oxidase - DAO).

(a) số liệu

Ðối tượng LMP VE DOQ US DAO


1 275 273 288 273 244 270,6
2 292 283 284 285 329 294,6
3 281 274 298 270 252 275,0
4 284 275 271 272 258 272,0
5 285 294 307 278 275 287,8
6 283 279 301 276 279 283,6
7 290 265 298 291 295 287,8
8 294 277 295 290 271 285,4
9 300 304 293 279 271 289,4
10 284 297 352 292 284 301,8

Trung bình 286,4 282,1 298,7 280,6 275,8

41
Căn bản thống kê y học -Ðỗ Văn Dũng

(b) Phân tích phương sai hai chiều: quy hoạch cân đối không có lặp (trung bình bình phương tương
tác được dùng làm ước lượng trung bình bình phương phần dư trong kiểm định F)
Nguồn biến thiên SS d.f. MS=SS/d.f. MS tác động
F= -------------------------
MS tương tác

Ðối tượng 4437,6 9 493,07 2,43, P<0,05


Phương pháp 3031,4 4 757,85 3,74, P<0,05
Tương tác 7301,0 36 202,81
Tổng cộng 14770,0 49

(c) Phân chia tổng bình phương theo phương pháp


Nguồn biến thiên SS d.f. MS=SS/d.f. MS tác động
F= -------------------------
MS tương tác

DOQ so với các phương pháp khác 2415,1 1 2415,10 11,91,P<0,001


Khác biệt giữa LMP, VE, US và DAO 616,3 3 205,43 1,01,P>0,1
Kĩ thuật 3031,4 4
(ii) Tổng bình phương còn lại có 3 độ tự do, thể hiện các hiệu số trong số 4 phương pháp
khác (LMP, VE, US, DAO).
Mỗi thành phần được kiểm định bằng kiểm định F theo cách bình thường. Sự phân chia này
cho thấy phương pháp dựa trên ngày thai máy khác đáng kể (P<0,001) với các phương pháp
khác, nhưng không có sự khác biệt có ý nghĩa trong 4 phương pháp này.
Lưu ý rằng tổng bình phương đã được chia theo các phương pháp khác nhau, và thành các
thành phần độc lập bằng độ tự do, trong trường hợp này là 4. Sự phân chia phụ thuộc vào sự
so sánh quan tâm và tốt nhất phải được dựa trên nền tảng tiên nghiệm (a priori) trước khi
phân tích số liệu. Tiến hành phân chia nhờ phương pháp tương phản tuyến tính (method
of linear contrasts). Người đọc có thể tham khảo Armitage & Berry (1987) để biết rõ chi
tiết.
Quan hệ với kiểm định t một mẫu
Phương pháp phân tích phương sai hai chiều quy hoạch cân đối không có lặp là mở rộng của
kiểm định t bắt cặp một mẫu, so sánh các giá trị của nhiều biến được đo lường trên một cá
thể. Trong trường hợp này, có 5 biến: tuổi thai được ước tính bằng các phương pháp khác
nhau trên một phụ nữ. Hai cách tiếp cận cho kết quả tương tự khi chỉ có 2 biến và giá trị F
bằng giá trị t bình phương.

Quy hoạch không cân đối


Bảng 8.4(a) tóm tắt số liệu về nhiễm giun móc và mức hemoglobin, được thu thập trong một
cuộc điều tra về nhiễm kí sinh trùng ở Ðông châu Phi. Số liệu được phân loại theo hai yếu tố,
giới tính và mật độ nhiễm giun móc. Có thể thấy rằng đối với mỗi giới tính, nồng độ
hemoglobin giảm khi nhiễm giun móc càng nhiều, và đối với một mức độ nhiễm giun móc,
hemoglobin trung bình ở nữ thấp hơn ở nam. Dù vậy quy hoạch này là không cân đối bởi vì
số người trong mỗi nhóm không bằng nhau. Ðiều này có nghĩa là không thể tách tác động của
giới tính và mật độ nhiễm giun khiến cho việc lí giải số liệu không thể tiến hành trực tiếp.

42
SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

Bảng 8.4 Nồng độ hemoglobin (g%) theo mật độ nhiễm giun móc ở nam và nữ

(a) Số liệu
Nam Nữ
Mật độ nhiễm giun móc Số Hb trung s.d. Số Hb trung s.d.
bình bình
Âm tính 22 12,3 1,8 35 11,1 1.1
Thấp 20 11,9 1,2 27 10,8 1,3
Trung bình 17 10,7 1,6 14 9,5 1,9
Cao 15 9,0 1,4 11 8,6 1,7

(b) Phân tích phương sai hai chiều: quy hoạch không cân đối
Nguồn biến thiên SS d.f. MS=SS/d.f. MS tác động
F= ----------------------
MS phần dư
Giới tính 20,94 1 20,94 9,9,P<0,01
Mật độ giun móc điều chỉnh theo giới 176,68 3 58,89 27,8, P<0,001
Tương tác 3,24 3 1,08 0,5, P>0,1
Phần dư 324,28 153 2,12
Tổng cộng 525,14 160
Tổng bình phương không thể chia thành các thành phần quy về 2 yếu tố độc lập với nhau và
trong bảng 8.4(b) trình bày phân tích phương sai được cải tiến. Ðầu tiên tính tổng bình
phương do sự khác biệt giới tính. Trừ khi hai giới tính có phân phối giun móc giống nhau,
tổng bình phương sẽ gồm cả một số biến thiên do sự khác biệt mật độ giun. Sau đó tính tổng
bình phương do mật độ nhiễm giun. Tổng này đánh giá quan hệ giữa nồng độ hemoglobin và
mật độ nhiễm giun có điều chỉnh cho sự khác biệt giới tính giữa các nhóm mật độ nhiễm
giun. Cả hai tác động chính đều có ý nghĩa, mức ý nghĩa 1% đối với giới tính (F=9,9,
d.f.=[1,153]) và 0,1% đối với mật độ nhiễm giun (F=27,8, d.f=[3,153]). Sự tương tác không
có ý nghĩa.
Theo phương án khác, tác động của nhiễm giun móc được phân tích phương sai trước, trong
trường hợp đó nó gồm cả sự biến thiên do khác biệt nồng độ hemoglobin giữa nam và nữ. Sau
đó tác động chính của giới tính sẽ là sự khác biệt còn lại sau khi điều chỉnh cho sự khác biệt
mật độ giun giữa nam và nữ. Ðối với quy hoạch không cân bằng cần tiến hành phân tích theo
cả hai cách. Dù vậy, trong thí dụ này, sự xem xét đã dẫn đến rằng nên tính tới giới tính trước.
Số liệu không cân đối phổ biến và không thể tránh được trong cuộc nghiên cứu điều tra. Dù
vậy, thử nghiệm lâm sàng và thực nghiệm labo nên dự trù để có quy hoạch cân đối. Không
phải mọi dự trù đều thành công thí dụ như có người rời khỏi vùng trong khi thử nghiệm. Các
chương trình phân tích phương sai của các phần mềm máy tính nhỏ có thể dùng cho các quy
hoạch cân đối hay quy hoạch chỉ có một số nhỏ các giá trị bị khuyết (missing value); trong
những trường hợp này các chương trình hồi quy bội có thể dùng cho thiết kế không cân đối
(xem Chương 10).

Tác động cố định và ngẫu nhiên


Yếu tố có thể chia làm hai loại, tác động cố định (phổ biến hơn) và tác động ngẫu nhiên. Các
yếu tó như giới tính, nhóm tuổi, và loại bệnh hồng cầu liềm là các tác động cố định (fixed
effects) bởi vì các mức riêng lẻ của nó có các giá trị nhất định; giới tính luôn luôn là nam
hay nữ. Ngược lại, các mức riêng lẻ của của tác động ngẫu nhiên (random effects) không
được sự quan tâm mà chỉ là một mẫu đại diện cho sự biến thiên. Thí dụ, xét một nghiên
cứu điều tra sự biến thiên natri và sucrose trong dung dịch ORS được pha ở nhà, trong đó có

43
Căn bản thống kê y học -Ðỗ Văn Dũng

10 người được đề nghị từng người pha 8 dung dịch. Trong trường hợp này 10 người chỉ là đại
diện cho nguồn biến thiên giữa các dung dịch được pha bởi những người khác nhau. Con
người là một tác động ngẫu nhiên. Trong thí dụ này và để xem tác động con người có ý nghĩa
không, chúng ta sẽ quan tâm đến việc ước lượng độ lớn của sự biến thiên nồng độ giữa các
dung dịch được pha bởi một người và sự biến thiên giữa các dung dịch được pha bởi các
người khác nhau. Chúng được gọi làì thành phần của sự biến thiên (components of
variation). Xem Huitson để biết cách ước lượng chúng.
Phương pháp kiểm định ý nghĩa giống nhau trong tác động cố định và ngẫu nhiên trong quy
hoạch một chiều và trong quy hoạch hai chiều không có lặp, nhưng không giống nhau trong
quy hoạch hai chiều (hay nhiều chiều hơn) có lặp. Trong quy hoạch hai chiều có lặp, nếu cả
hai tác động đều cố định, trung bình bình phương được so sánh với trung bình bình phương
phần dư như đã nói ở trên. Mặt khác nếu cả hai tác động đều là ngẫu nhiên, trung bình bình
phương được so sánh với trung bình bình phương tương tác chứ không phải với trung bình
bình phương phần dư. Nếu một tác động là ngẫu nhiên và một là cố định, nó sẽ là cách khác:
tác động ngẫu nhiên được so sánh với trung bình bình phương phần dư, và tác động cố định
sẽ đươc so sánh với trung bình bình phương tương tác. Ðây là những điểm phức tạp. Người
đọc quan tâm nhiều đến chi tiết nên tham khảo Huitson (1980).

44
TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH


Giới thiệu
Các chương trước chú trọng đến phân tích và so sánh trung bình của một biến. Bây giờ đến
lượt chúng ta chú ý đến quan hệ giữa các biến khác nhau và trong chương này chú ý đến kĩ
thuật tương quan và hồi quy tuyến tính để tìm hiểu mối quan hệ tuyến tính (linear) giữa hai
biến liên tục. Tương quan (correlation) đó lường sự chặt chẽ của mối liên hệ trong khi hồi
quy tuyến tính (linear regression) cho biết phương trình đường thẳng mô tả sự liên hệ tốt nhất
và cho phép tiên đoán biến số này từ biến số khác.
Bảng 9.1 Thể tích huyết tương và trọng lượng cơ thể của 8 người đàn ông khỏe mạnh

Ðối tượng trọng lượng cơ thể (kg) Thể tích huyết tương (lít)
1 58,0 2,75
2 70,0 2,86
3 74,0 3,37
4 63,5 2,76
5 62,0 2,62
6 70,5 3,49
7 71,0 3,05
8 66,0 3,12

3,5
thãø têch huyãút tæång

3,3
3,1
2,9
2,7
2,5
55 60 65 70 75

troüng læåüng cå thãø

Hình 9.1 Phân tán đồ của thể tích huyết tương và trọng lượng cơ thể cùng với đường hồi quy tuyến tính

Tương quan
Bảng 9.1 trình bày trọng lượng cơ thể và thể tích huyết tương của 8 người đàn ông khỏe
mạnh. Phân tán đồ (scatter diagram) của những số liệu này (hình 9.1) cho thấy thể tích huyết
tương lớn có liên quan đến trọng lượng cơ thể cao và ngược lại. Sự liên quan này được đo
lường bằng hệ số tương quan (correllation coefficient), r.
∑ ( x − x )( y − y )
r=
∑( x − x ) 2 ∑( y − y ) 2

45
Căn bản thống kê y học -Ðỗ Văn Dũng

– – –

(a) Không tương quan


– –

(b) Tương quan dương không (c) Tương quan dương hoàn toàn
hoàn toàn


– –

(d) Tương quan âm không (e) Tương quan âm hoàn toàn


hoàn toàn

Hình 9.2 phân tán đồ minh họa các giá trị khác nhau của hê số tương quan. Trong đây cũng có các
đường hồi quy.
Trong đó x là trọng lượng, y thể tích huyết tương, x và (y là trung bình tương ứng. Phân tán
đồ minh họa những hệ số tương quan khác nhau đươc trình bày trong hình 9.2. Hệ số tương
quan luôn luôn là một số giữa -1 và +1 và bằng zero nếu hai biến không liên hệ. Nó dương
nếu x và y cùng cao hay cùng thấp và càng lớn khi sự liên quan càng chặt. Ta có giá trị 1 nếu
các điểm trên phân tán đồ nằm ngay trên đường thẳng. Ngược lại, hệ số tương quan âm nếu
giá trị y cao gắn liền với giá trị x thấp và ngược lại.
Ðiều quan trọng là sự tương quan giữa hai biến số cho thấy sự liên hệ nhưng không nhất thiết
có nghĩa là cá quan hệ 'nhân quả'. Xem thảo luận đầy đủ hơn ở Bradford Hill (1977).
Hệ sốï tương quan được tính dễ dàng hơn bằng cách lưu ý:
Σ (x-x)(y-y)=Σ xy- (Σ x)(Σ y)/n
Σ (x-x)2=Σ x2-(Σ x)2/n
Σ (y-y)2=Σ y2-(Σ y)2/n
Trong thí dụ này
N= 8
Σ x =535 x = 66,835 Σ x2 = 35983,5

46
TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

Σ y=24,2 y = 3,0025 Σ y2= 72,7980


Σ xy=58,0 × 2,75 + 70,0 × 2,86 +...+ 66,0 × 3,12 =1615,295
Do đó
Σ (x-x)(y-y) = 1616,295 - 535 × 24,02/8=8,96
Σ (x-x)2 = 35983,5 - 5352/8=205,38
Σ (y-y)2 = 72,798 - 24,022/8=0,6780

r= 8,96/( 205,38 × 0,6780)=0,76
Kiểm định ý nghĩa
Kiểm định t được dùng để xem r có khác zero một cách có ý nghĩa hay không hay nói cách
khác có phải sự tương quan quan sát được chỉ là do tình cờ hay không

n−2
t=r  , d. f . = n − 2
1 − r 
2

Trong thí dụ này:

 8−2 
t = 0.76  = 2.86, d . f . = 6
1 − 0.76 
2

Ðiều này có ý nghĩa ở mức 5% xác nhận ý nghĩa của sự liên hệ giữa thể tích huyết tương và
trọng lượng cơ thể
Mức ý nghĩa phụ thuộc của cả vào độ lớn của mối tương quan và số các quan sát. Lưu ý rằng
tương quan yếu có thể có ý nghĩa thống kê nếu nó dựa trên một số lớn quan sát, trong khi sự
tương quan mạnh có thể không đạt được mức ý nghĩa nếu chỉ có một ít quan sát.

Hồi quy tuyến tính


Hồi quy tuyến tính cho phương trình đường thẳng mô tả nếu biến x tăng thì biến y tăng như
thế nào. Không giống như tương quan, việc lựa chọn biến nào để làm biến y là quan trọng bởi
vì hai phương pháp không cùng cho một kết quả, y thường được gọi là biến số phụ thuộc
(dependent variable) và x là biến số độc lập hay giải thích (independent or explanatory
variable). Trong thí dụ này, rõ ràng chúng ta cần quan tâm sự phụ thuộc thể tích huyết tương
và trọng lượng cơ thể.
Phương trình hồi quy là

y = a + bx
Trong đó a là điểm chặn (intercept) và b là độ dốc (slope) của đường thẳng (Hình 9.3). Giá trị
đối với a và b được tính sao cho cực tiểu hóa bình phương khoảng cách theo chiều đứng từ
các điểm số liệu tới đường thẳng. Nó được gọi là phù hợp bình phương tối thiểu (least
squares fit) (Hình 9.4). Ðộ dốc b đôi khi được gọi là hệ số hồi quy (regression coefficient).
Nó có cùng dấu với hệ số tương quan. Khi không có sự tương quan, b bằng zero, tương ứng
với một đường thẳng hồi quy nằm ngang đi qua điểm y.

ĉ và a = (y - b(x

47
Căn bản thống kê y học -Ðỗ Văn Dũng

1
a

Hình 9.3 Giao điểm và độ dốc của phương trình hồi quy y = a + bx. Giao điểm a là điểm mà đường
thẳng cắt trục y và cho giá trị y ở x = 0. Ðộ dốc b là mức tăng của y tương ứng với sự gia tăng một đơn
vị của x.

3,5
thãø têch huyãút tæång

3,3
3,1
2,9
2,7
2,5
55 60 65 70 75

troüng læåüng cå thãø

Hình 9.4 Ðường thẳng hồi quy tuyến tính, y = a + bx, được làm phù hợp bằng bình phương tối thiểu, a
và b được tính để cực tiểu hóa tổng bình phương của các độ lệch thẳng đứng (vẽ bằng các đường chấm)
của các điểm đối với đường thẳng, mỗi độ lệch bằng hiệu số giữa số y quan sát và tiểm tương ứng trên
đường thẳng a + bx
Trong thí dụ này

b = 8,96/205,38 = 0,043615
Và:
a = 3,0025 - 0,043615 × 66,875 = 0,0857
Do đó sự phụ thuộc của thể tích huyết tương vào trọng lượng cơ thể được mô tả bằng
Thể tích huyết tương = 0,0857 + 0,0436 × trọng lượng
và được vẽ trên Hình 9.1. Ðường hồi quy được vẽ bằng cách tính tọa độ của hai điểm nằm
trên nó. Thí dụ:

x = 60, y = 0,0857 + 0,0436 × 60 = 2,7



x = 70, y =0,0857 + 0,0436 × 70 = 3,1
Ðường thẳng phải đi qua điểm (x,y)=(66,9 , 3,0)

48
TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

Giá trị a và b là các ước lượng mẫu của giá trị giao điểm và độ dốc của đường thẳng hồi quy
mô tả mối liên hệ tuyến tính giữa x và y trong toàn bộ dân số. Do đó chúng bị các biến thiên
lấy mẫu và độ chính xác của chúng có thể đo lường bằng sai số chuẩn.

trong đó

 ∑ ( y − y ) 2 − b 2 ∑( x − x ) 2 
s=  
 (n − 2) 
s là độ lệch chuẩn của các điểm số liệu so với đường thẳng, có (n-2) độ tự do.

0.6780 − 0.0436 2 × 205 .38


s= = 0.2189
6

 1 66.9 2 
s.e.(a) = 0.2819  +  = 1.3197
 8 205.38 
0.2189
s.e.(b) = = 0.0153
205.38
Kiểm định ý nghĩa
Kiểm định t được dùng để kiểm định xem b có khác biệt có ý nghĩa với một giá trị nhất định,
được kí hiệu là ß (kí tự Hy lạp beta)
b−β
t= , d. f . = n − 2
s.e.(b)
Ðặc biệt nó có thể dùng để kiểm định xem b có khác biệt có ý nghĩa với zero hay không. Và
nó chính xác tương đương với kiểm định t của r = 0. Kiểm định này cho thể tích huyết tương
và trọng lượng cơ thể cho kết quả
b−β 0.0436
t= = = 2.85
s.e.(b) 0.0153
Và giống như giá trị 2,86 (sự khác nhau là do sai số làm tròn) rút ra từ kiểm định cho hệ số
tương quan. Do đó thể tích huyết tương tăng có ý nghĩa (P<0,05) đối với trọng lượng cơ thể.
Tiên đoán
Trong một số tình huống, có thể sử dụng phương trình hồi quy để tiên đoán giá trị y cho một
giá trị đặc biệt của x được gọi là x'. Giá trị tiên đoán là:
y' = a + bx'
Và sai số chuẩn của nó là

1 x2  s
s.e.(b) =
s.e.(a) = s  + 2  ∑( x − x ) 2
 n ∑( x − x ) 

49
Căn bản thống kê y học -Ðỗ Văn Dũng

 1 ( x '− x ) 2 
s.e.( y ' ) = s 1 + + 2
 n ∑( x − x ) 
Sai số chuẩn này tối thiểu khi x' gần với trung bình x. Nói chung phải thận trọng khi sử dụng
đường hồi quy để tính các giá trị ngoài phạm vi của x trong số liệu gốc, bởi vì quan hệ tuyến
tính không nhất thiết sẽ đúng ở ngoài phạm vi mà nó được làm phù hợp.
Trong thí dụ này, sự đo lường thể tích huyết tương tốn nhiều thời gian và do đó trong một số
trường hợp, có thể tiên đoán từ trọng lượng cơ thể. Thí dụ thể tích plasma huyết tương của
một người đàn ông nặng 66 kg là

0,0832 + 0,0436 × 66 = 2,96 lít


Và sai số chuẩn bằng

 1 (66 − 66.9) 2 
s.e.( y ' ) = s 1 + +  = 0.23l
 8 205.38 
Giả thiết
Có hai giả thiết nền tảng trong phương pháp hồi quy tuyến tính. Giả thiết thứ nhất là đối với
bất cứ giá trị x nào, y có phân phối bình thường. Giả thiết thứ hai là độ phân tán của các điểm
quanh đường thẳng là như nhau trong suốt đoạn thẳng. Ðộ phân tán được đo lường bằng độ
lệch chuẩn s của các điểm số liệu so với đường thẳng như đã định nghĩa ở trên. Sự thay đổi
thang đo có thể thích hợp nếu các giả thuyết trên không thỏa hay quan hệ dường như phi
tuyến tính (xem Chương 19). Các quan hệ phi tuyến được thảo luận ở chương 10.

Sử dụng máy tính cầm tay


Một vài máy tính cầm tay có hàm số hồi quy tuyến tính và tương quan tự động (xem Chương
1), giúp cho tránh những tính toán tỉ mỉ mô tả ở trên.

50
HỒI QUY BỘI

HỒI QUY BỘI


Giới thiệu
Ðôi khi xảy ra tình huống là chúng ta quan tâm sự phụ thuộc của một biến vào nhiều các biến
giải thích chứ không phải chỉ vào một biến. Thí dụ, 100 phụ nữ đi khám tiền sản tham gia vào
một cuộc nghiên cứu để xác định các biến số có liên quan với trọng lượng lúc sinh của trẻ,
với mục tiêu cuối cùng là tiên đoán phụ nữ 'có nguy cơ' bị đẻ con nhẹ cân. Kết quả cho thấy
rằng trọng lượng lúc sinh liên quan có ý nghĩa với tuổi của mẹ, chiều cao của mẹ, số con, thời
gian mang thai, thu nhập gia đình nhưng những biến số này không độc lập. Thí dụ: chiều cao
của mẹ và thời gian mang thai có liên quan với nhau. Sự tác động kết hợp của những biến số
này, tính đến những mối liên hệ dương giữa chúng, có thể được tìm hiểu bằng cách dùng hồi
quy bội (mutitple regression) được thảo luận trong bối cảnh của thí dụ này.
Ðể giới thiệu những phương pháp cần thiết cho hồi quy bội, một phương án hồi quy tuyến
tính đơn khác, tương đương với phương án được mô tả ở Chương 9, nhưng dễ tổng quát hóa
hơn sẽ được mô tả. Sau đó nó sẽ được mở rộng cho nhiều biến giải thích. Chi tiết tính toán
không được trình bày bởi vì việc phân tích chắc chắn sẽ được tiến hành bằng cách dùng phần
mềm máy tính. Phương pháp luận khá phức tạp và một số độc giả có thể bỏ qua chương này ở
lần đọc đầu tiên.

Phương pháp phân tích phương sai dùng cho hồi quy tuyến tính đơn
Xem xét mối quan hệ giữa trọng lượng lúc sinh với chiều cao của mẹ. Phân tán đồ cho thấy
rằng mối liên hệ là tuyến tính. Hệ số tương quan là 0,26 (P<0,01).
Hồi quy tuyến tính cho phương trình đường thẳng mô tả quan hệ:
Trọng lượng lúc sinh = a + b × chiều cao của mẹ
Trong đó a và b được tính sao cho cực tiểu hóa tổng các bình phương độ lệch của số liệu so
với đường thẳng. Tổng các bình phương độ lệch đối với đường thẳng sau khi đã tiến hành cực
tiểu hóa được gọi là tổng bình phương phần dư (residual sum of squares). Nó nhỏ hơn tổng
bình phương tổng các biến thiên của trọng lượng lúc sinh và hiệu số đó được gọi là tổng các
bình phương được giải thích bởi hồi quy (sum of squares explained by the regression) của
trọng lượng lúc sinh theo chiều cao của mẹ, hay gọi đơn giản là tổng bình phương hồi quy
(regression sum of squares). Tách đôi tổng bình phương của toàn thể biến thiên trọng lượng
lúc sinh thành 2 phần có thể được trình bày trong bảng phân tích phương sai (Bảng 10.1). Có
một độ tự do cho hồi quy và n - 2 = 98 độ tự do cho phần dư.

Bảng 10.1 Phân tích phương sai của hồi quy tuyến tính trọng lượng lúc sinh theo chiều cao của mẹ
(n=100)
Tổng bình Ðộ tự do Trung bình bình MS hồi qui
Nguồn biến thiên phương (SS) (d.f.) phương F=-------------
(MS=SS/d.f.)
MS phần dư
Hồi quy theo chiều cao của 1,48 1 1,4800 7,11,P<0,01
mẹ
Phần dư 20,39 98 0,2081
Tổng số 21,87 99
Nếu thực sự không có sự liên hệ giữa các biến số, thì trung bình bình phương hồi quy (MS
regression) sẽ có cùng độ lớn với trung bình bình phương phần dư (MS residual). Nếu có sự
liên hệ nó sẽ lớn hơn. Kiểm định bằng cách dùng kiểm định F như được mô tả trong Chương
8.

51
Căn bản thống kê y học -Ðỗ Văn Dũng

MS häöi quy
F= , d . f . = (1, n − 2)
MS pháön dæ
F phải khoảng gần 1 nếu không có sự liên hệ và lớn hơn nếu có. Kiểm định F này tương
đương với kiểm định t cho b=0 và r=0 mô tả ở chương 9, giá trị của F tương đương với t2.
Trong thí dụ này F = 1,4800/0,2081= 7,11 với (1,98) độ tự do. Từ bảng A4, điểm 1% của
F(1,60) là 7,08 và F(1,120) là 6,85. Ðiểm 1% cho F(1,98) do đó nằm giữa 7,08 và 6,85 và
F=7,11 có ý nghĩa ở mức 1%.

Quan hệ giữa hệ số tương quan và bảng phân tích phương sai


Bảng phân tích phương sai cho phép lí giải hệ số tương quan theo cách khác: bình phương
của hệ số tương quan, r2, bằng với tổng bình phương hồi quy chia cho tổng bình phương toàn
bộ (0,262=0,0676=1,48/21,87) và do đó là tỉ lệ biến thiên được giải thích bằng hồi quy.
Chúng ta có thể nói chiều cao người mẹ giải thích cho 6,76% tổng số biến thiến của trọng
lượng lúc sinh.

Hồi quy bội với 2 biến số


Xét quan hệ của trọng lượng lúc sinh với hai biến: chiều cao của mẹ và tuổi thai. Phân tán đồ
cho thấy rằng quan hệ giữa trọng lượng lúc sinh với hai biến kia là tuyến tính. Hệ số tương
quan tương ứng là 0,26 (P<0,01) và 0,39 (P<0,001). Mối quan hệ kết hợp có thể được thể
hiện bằng phương trình hồi quy bội (multiple regression equation),
y = a + b1x1 + b2x2
Và trong thí dụ này
Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2tuổi thai
Nó có nghĩa là với bất cứ tuổi thai nào, trọng lượng lúc sinh quan hệ tuyến tính với chiều cao
của mẹ và cũng vậy, với bất cứ chiều cao của mẹ nào, trọng lượng lúc sinh liên hệ tuyến tính
với tuổi thai. b1và b2 được gọi là hệ số hồi quy riêng phần (partial regression coefficients)
và sự tương quan tương ứng là tương quan riêng phần (partial correlations). Lưu ý rằng
b1 và b2 khác nhau hệ số hồi quy thông thường (đối với một biến số) trừ khi hai biến số
này không liên quan với nhau.
Mặc dù bây giờ khó có thể hình dung được đường hồi quy, ta cũng sử dụng những nguyên lí
tương tự. Mỗi trọng lượng lúc sinh quan sát được được so sánh với (a + b1 chiều cao của mẹ
+ b2tuổi thai). a, b1 , b2 được chọn để cực tiểu hóa tổng bình phương các hiệu số này. Kết
quả được trình bay trong bảng phân tích phương sai (Bảng 10.2). Có hai độ tự do của hồi quy
bởi vì có hai biến số giải thích.

Bảng 10.2 Phân tích phương sai của hồi quy tuyến tính trọng lượng lúc sinh theo chiều cao của mẹ và
tuổi thai (n=100)
Tổng bình Ðộ tự do (d.f.) Trung bình MS hồi qui
Nguồn biến thiên phương (SS) bình phương F=-------------
(MS=SS/d.f.)
MS phần dư
Hồi quy theo chiều cao của 4,43 2 2,2150 12,32,P<0,001
mẹ và tuổi thai
Phần dư 17,44 97 0,1798
Tổng số 21,87 99

Kiểm định F của hồi quy này là 12,32 với (2,97) độ tự do và có ý nghĩa ở mức 0,1%. Hồi quy
đóng góp cho 20,26% (4,43/21,87) tổng số biến thiên. Tỉ lệ này bằng R2, R = √ 0,2026=0,45

52
HỒI QUY BỘI

được gọi là hệ số tương quan bội (multiple correlation coefficient). R luôn luôn dương tính
bởi vì không thể xác định hướng của liên quan khi có nhiều biến số.
Tổng bình phương do hồi quy của trọng lượng lúc sinh do chiều cao của mẹ và tuổi thai gồm
tổng bình phương được giải thích bởi chiều cao của mẹ (tính như trong hồi quy tuyến tính
đơn) cộng với tổng bình phương được giải thích bởi tuổi thai sau khi đã được giải thích bằng
chiều cao của mẹ (Bảng 10.3a). Tổng này có thể được kiểm định ý nghĩa bằng kiểm định F
dùng trung bình bình phương phần dư
F = 2,95/0,1798=16,41 d.f.=(1,97), P<0,001
Do đó mô hình của hai biến số là sự cải thiện so với mô hình chỉ dựa trên chiều cao của mẹ
bởi vì tác động của tuổi thai có ý nghĩa ngay cả khi đã tính đến chiều cao của mẹ.
Bảng 10.3 Sự đóng góp của chiều cao của mẹ và tuổi thai vào hồi quy bội bao gồm cả hai biến
(a) chiều cao của mẹ đưa vào hồi quy bội trước
Nguồn biến thiên Tổng bình Ðộ tự do Trung bình bình MS hồi qui
phương (SS) (d.f.) phương F=--------------
(MS=SS/d.f.)
MS phần dư
Chiều cao của mẹ 1,48 1 1,48 8,23,P<0,01
Tuổi thai sau khi đã điều 2,95 1 2,95 16,41, P<0,001
chỉnh theo chiều cao
Chiều cao của mẹ và tuổi 4,43 2
thai

(b) tuổi thaiđưa vào hồi quy bộ trước


Nguồn biến thiên Tổng bình Ðộ tự do Trung bình bình MS hồi qui
phương (SS) (d.f.) phương F=--------------
(MS=SS/d.f.)
MS phần dư
Tuổi thai 3,33 1 3,33 18,52,P<0,001
Chiều cao sau khi đã điều 1,10 1 1,10 6,12, P<0,025
chỉnh theo tuổi thai
Chiều cao của mẹ và tuổi 4,43 2
thai
Theo cách khác, tổng bình phương được giải thích bởi hồi quy với cả hai biến bao gồm tổng
bình phương được giải thích bởi tuổi thai (tính bằng hồi quy tuyến tính đơn) cộng với tổng
bình phương được giải thích do chiều cao của mẹ sau khi đã điều chỉnh theo tuổi thai. Ðiều
này trình bày trong Bảng 10.3(b). Một lần nữa chúng ta thấy rằng mô hình hai biến số có cải
thiện so với mô hình chỉ có tuổi thai, bởi vì tác động của chiều cao của mẹ có ý nghĩa ngay cả
khi tuổi thai đã được tính.
Hai cách tách tổng bình phương hồi quy kết hợp trong bàng 10.2 thành tổng bình phương
riêng biệt không cho các bình phương kết quả thành phần giống nhau (Bảng 10.3a và b) bởi
vì bản thân các biến giải thích (chiều cao của mẹ và tuổi thai) liên quan với nhau.

Hồi quy bội với nhiều biến


Hồi quy bội có thể mở rộng ra với một số các biến số, mặc dù cần nhắc rằng số các biến số
nên tương đối nhỏ và với nhiều biến số việc lí giải trở nên phức tạp. Một số biến số, như tuổi
và giới tính, có thể cần thiết đưa vào phương trình hồi quy bội bởi vì cần thiết điều chỉnh tác
động của chúng trước khi nghiên cứu các quan hệ khác. Ðưa vào những biến khác dựa trên
chúng liên hệ nhiều hay ít với biến phụ thuộc. Mục tiêu là đạt được sự cân bằng giữa một mặt
là bao gồm đủ các biến số để thu được sự phù hợp tốt nhất giữa phương trình hồi quy bội và

53
Căn bản thống kê y học -Ðỗ Văn Dũng

số liệu, mặt khác là không có quá nhiều biến số để quan hệ trở thành khó lí giải. Việc chọn
lựa biến số có thể tiến hành theo một trong 3 cách:
1. Hồi quy bước tới (Step-up regression). Hồi quy tuyến tính đơn được tiến hành cho mỗi
biến giải thích. Biến nào đóng góp phần trăm biến thiên lớn nhất được chọn và làm biến số
đầu tiên. Sau đó tiến hành hồi quy bội hai biến bằng cách thêm vào từng biến số giải thích
khác. Sau đó chọn hồi quy hai biến đóng góp phần trăm biến thiên lớn nhất. Quá trình này
tiếp tục bằng cách chọn thêm một biến ở mỗi giai đoạn. Quá trình này ngừng khi (i) thêm vào
bất kì biến số nào cũng không làm tăng có ý nghĩa phần đóng góp của nó hay (ii) Khi đã đạt
được số các biến số tối đa đã định trước trong hồi quy bội.
2. Hồi quy bước lùi (Step down regression) Hồi quy bội được tiến hành bằng cách dùng tất cả
các biến số. Sau đó các biến được loại bỏ từng biến một. Ở mỗi giai đoạn, biến được chọn để
loại bỏ là biến đóng góp ít nhất vào việc giải thích các biến thiên. Quá trình này tiếp tục cho
đến khi (i) tất cả các biến còn lại đều có ý nghĩa hay (ii) cho đến khi đã đạt được số các biến
số tối đa đã định trước trong phương trình.
3. Hồi quy tổ hợp tối ưu (Optimal combination regression). Hồi quy từng bước theo cách 1 và
2 không nhất thiết đưa đến cùng một chọn lựa cuối cùng, ngay cả khi chúng cùng kết thúc ở
một số các biến số giải thích nhất định. Không nhất thiết rằng chúng chọn được hồi quy tốt
nhất cho một số các biến số giải thích. Cách tốt hơn là tìm một biến nào là tốt nhất, rồi từng
cặp biến nào là tốt nhất, sau đó là từng cặp 3 biến nào là tốt nhất, bằng cách tiến hành hồi quy
tất cả các tổ hợp có thể. Lưu ý rằng mặc dù cặp hồi quy tốt nhất thường chứa biến hồi quy
đơn tốt nhất, nhưng điều đó không nhất thiết phải xảy ra.

Hồi quy bội với các biến giải thích rời rạc
Người ta thường muốn đưa vào các biến liên tục và rời rạc trong phân tích hồi quy bội. Thí
dụ, trong nghiên cứu trọng lượng lúc sinh, sáu phụ nữ bị nhiễm mycoplasma trong lúc mang
thai và trọng lượng trung bình của con họ sẽ nhỏ hơn. Yếu tố này có thể được đưa vào nhờ
một biến số giả (dummy variable) của sự nhiễm trùng. Nó bằng 1 cho người phụ nữ bị nhiễm
mycoplasma và bằng zero cho phụ nữ không bị. Phương trình hồi quy
Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2 tuổi thai + b3 nhiễm trùng
Ðiều này tương đương với một cặp phương trình
(a) Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2 tuổi thai + b3 cho người phụ nữ bị
nhiễm mycoplasma
(b) Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2 tuổi thai cho người phụ nữ không bị
nhiễm mycoplasma
Hệ số b3 đo lường sự khác nhau trung bình của trọng lượng lúc sinh của con người mẹ bị
nhiễm mycoplasma so với con người mẹ có cùng trọng lượng và tuổi thai và không bị nhiễm.
Tổng bình phương gia số do nhiễm trùng mycoplasma được tìm bằng phương pháp đã được
mô tả ở trên. Nó là hiệu số giữa tổng bình phương do hồi quy bội 3 biến trừ đi hồi quy chỉ
dựa trên chiều cao của mẹ và tuổi thai. Nó có một độ tự do và được kiểm định ý nghĩa bằng
kiểm định F.
Nhiễm trùng mycoplasma là một yếu tố có hai mức, có hay không. Yếu tố có hơn 2 mức, thí
dụ như nhóm tuổi, được đưa vào bằng một loạt các biến giả để mô tả sự khác nhau. Nếu có k
mức, sẽ cần k-1 biến giả và độ tự do bằng k-1. Xem chi tiết ở Armitage và Berry (1987).

Hồi quy bội với các biến giải thích phi tuyến tính
Người ta thường thấy quan hệ phi tuyến giữa biến phụ thuộc và biến giải thích. Có 3 cách sử
dụng biến giải thích đó trong phương trình hồi quy bội. Phương pháp thứ nhất, phổ biến nhất
là chia biến thành một số các nhóm nhỏ và xem nó như là một yếu tố với một mức tương ứng
với một nhóm nhỏ, như được mô tả ở phần trên chứ không phải là biến liên tục. Thí dụ, tuổi

54
HỒI QUY BỘI

có thể chia thành nhóm 5 tuổi một. Quan hệ với tuổi được dựa trên sự so sánh trung bình
trong mỗi nhóm tuổi và không cần giả thiết về dạng quan hệ với tuổi. Ở bước phân tích đầu
tiên, người ta thường đưa biến giải thích vào dưới hai dạng liên tục và yếu tố. Hiệu số của
tổng bìnhphương được dùng để đánh giá xem có thành phần phi tuyến trong mối quan hệ hay
không. Trong phần lớn trường hợp, chia thành 3 tới 5 nhóm nhỏ là đủ để nghiên cứu tính phi
tuyến của quan hệ.
Khả năng thứ nhì là tìm sự biến đổi thích hợp cho biến giải thích. Thí dụ, trong nghiên cứu
trọng lượng lúc sinh, người ta thấy rằng trọng lượng lúc sinh có liên hệ tuyến tính với
logarithm của thu nhập gia đình chứ không liên hệ tuyến tính với thu nhập gia đình. Dùng các
phép biến đổi được thảo luận đầy đủ hơn ở Chương 19. Khả năng thứ ba là tìm cách mô tả đại
số mối quan hệ. Thí dụ, nó có thể là dạng bình phương, trong trường hợp đó cả biến số (x) và
bình phương của biến số (x2) sẽ được đưa vào phương trình.

Quan hệ giữa hồi quy bội và phân tích phương sai


Có nhiều sự trùng lắp giữa hồi quy bội và phân tích phương sai. Hồi quy bội trong đó các
biến giải thích là rời rạc cũng giống như phân tích phương sai với nhiều yếu tố. Hai phương
pháp cho cùng một kết quả giống nhau. Trong trường hợp này người ta khuyên nên dựa vào
các chương trình máy tính có sẵn và tính dễ sử dụng của chúng để lựa chọn.
Một kĩ thuật khác không được mô tả ở đây là phân tích đồng phương sai (analysis of
covariance) (Armitage & Berry 1987). Nó là một phương pháp khác nhưng tương đương để
nghiên cứu sự khác biệt trong các nhóm khi có các biến giải thích liên tục. Một thí dụ của bài
toán mô tả ở trên khi so sánh trọng lượng lúc sinh giữa các bà mẹ bị nhiễm mycoplasma trong
thai kì và những bà mẹ không bị. Chiều cao của mẹ và tuổi thai là các biến giải thích bổ sung
và sẽ được gọi là đồng biến số (covariate) trong trường hợp này. Lưu ý rằng đối khi phân tích
đồng phương sai được gộp trong phân tích phương sai trong một số phần mềm máy tính.

Phân tích đa biến


Hồi quy bội, phân tích phương sai, hồi quy logistic (xem chương 13) và mô hình log
tuyến tính (xem Chương 13) thường được gọi là những phương pháp đa biến (mulivariate
methods), bởi vì chúng nghiên cứu biến phụ thuộc liên quan tới nhiều biến giải thích như thế
nào. Theo nghĩa thống kê chặt chẽ, phân tích đa biến (multivariate analysis) có nghĩa là
nghiên cứu những biến phụ thuộc thay đổi cùng với nhau như thế nào. Có bốn phương pháp
thích hợp cho nghiên cứu y khoa được mô tả ngắn gọn ở đây. Xem chi tiết ở Armitage &
Berry (1987).
Phân tích thành phần chính (pricipal component analysis) là phương pháp dùng để tìm
một số các kết hợp các biến số, được gọi là thành phần để giải thích toàn bộ các biến thiên
quan sát được và giảm tính phức tạp của số liệu. Phân tích phân biệt (discriminat analysis)
là phương pháp dùng để tìm một kết hợp duy nhất các biến số, được gọi là hàm phân biệt
(discriminant function) phân biệt tốt nhất các nhóm. Hàm số này được dùng để tiên đoán một
cá nhân sẽ có thể thuộc vào nhóm nào. Thí dụ, nó đã được dùng để tiên đoán trẻ em có nguy
cơ đột tử. Phân tích yếu tố (factor analysis) là phương pháp thương được dùng trong các
trắc nghiệm tâm lí học. Nó tìm cách giải thích các trả lời cho các mục trắc nghiệm bị tác động
bởi một số các yếu tố, như tình cảm, suy lý v.v. như thế nào. Cuối cùng, phân tích cụm
(cluster analysis) la phương pháp xem xét các biến số sể xem một cá nhân có thể chia thành
một hệ thống tự nhiên các nhóm. Các kĩ thuật được dùng bao gồm các kĩ thuật phân loại học
số (numerical taxonomy), thành phần chính, và phân tích tương ứng (correspondance
analysis).

55
Căn bản thống kê y học -Ðỗ Văn Dũng

XÁC SUẤT
Giới thiệu
Xác suất đã được dùng nhiều lần trong các chương trước, và nghĩa của nó rõ ràng trong bối
cảnh của nó. Bây giờ ta sẽ trình bày nó chính thức hơn và đưa ra các quy tắc tính toán. Mặc
dù xác suất là một khái niệm được dùng trong cuộc sống hàng ngày, chúng ta khó lòng định
nghĩa nó chính xác được. Ðịnh nghĩa theo tần suất (frequentist definition) thường được dùng
trong thống kê. Nó nói rằng xác suất xuất hiện của một biến cố bằng tỉ lệ số lần các biến cố
đó xuất hiện trong một số lớn các lần thử giống nhau được lập lại. Nó có giá trị giữa 0 và 1,
bằng 0 nếu sự kiện không thể xảy ra và bằng 1 nếu nó chắc chắn xảy ra. Xác suất có thể tính
bằng phần trăm và có giá trị từ 0% đến 100%. Thí dụ, giả sử một đồng tiền được tung một
ngàn lần và trong phân nửa các trường hợp nó nằm ngửa mặt và trong phân nửa trường hợp
nó nằm xấp. Xác suất nó ngửa ở một lần tung sẽ là 50%.
Một cách khác là định nghĩa chủ quan (subjective definition) khi độ lớn của xác suất chỉ thể
hiện mức độ tin tưởng của một người vào sự xuất hiện của biến cố. Ðịnh nghĩa này gần với
cách dùng thường ngày và là cơ sở của phương pháp Bayes (Bayesian approach). Theo
phương pháp này người nghiên cứu gắn một xác suất tiền nghiệm (prior probability) cho
biến cố được nghiên cứu. Sau đó người ta tiến hành nghiên cứu, thu thập số liệu số liệu, và
thay đổi xác suất tùy theo kết quả có được. Xác suất được biến cải này được gọi là xác suất
hậu nghiệm (posterior probability). Phương pháp thống kê bắt nguồn từ phương pháp này
hoàn toàn khác lạ và ít được sử dụng rộng rãi. Xem chi tiết ở Lindley (1965).

Tính toán xác suất


Có hai quy tắc căn bản của tính toán xác suất:
1. Quy tắc nhân (mulplicative rule) tính xác suất xuất hiện của cả hai biến cố A và B
2. Quy tắc cộng (additive rule) tính xác suất xuất hiện của biến cố (A) hay biến cố (B) hay cả
hai

Quy tắc nhân


Xem một cặp vợ chồng dự định sẽ co 2 con. Có 4 tổ hợp giới tính của trẻ được trình bày
trong bảng 11.1. Mỗi tổ hợp như nhau về mặt khả năng và có xác suất bằng 1/4.

Bảng 11.1 Các tổ hợp có thể của giới tính hai đứa trẻ với xác suất của chúng

Trẻ thứ nhì


Ðứa thứ nhất Trai Gái
1/2 1/2
Trai 1/2 1/4 1/4
(trai, trai) (trai, gái)
Gái 1/2 1/4 1/4
(gái, trai) (gái, gái)
Mỗi xác suất 1/4 được suy ra từ xác suất về giới tính của mỗi đứa trẻ. Xem chi tiết trường
hợp 2 đứa trẻ là gái. Xác suất đứa trẻ đầu là gái là 1/2 và sau đó xác suất 1/2 của nó (1/2 của
1/2 là 1/4) rằng đứa trẻ thứ hai cũng là con gái. Do đó:

Xác suất (hai đứa trẻ là gái) = xác suất (đứa trẻ đầu là gái) × xác suất (đứa trẻ thứ nhì
là gái) = 1/2 × 1/2 = 1/4

56
XÁC SUẤT

Quy tắc chung của xác suất xuất hiện hai biến cố là

Xác suất (A và B) = xác suất (A) × xác suất (B khi A đã xẩy ra).
Xác suất (B khi A đã xảy ra) được gọi là xác suất điều kiện (conditional probability) bởi vì nó
là xác suất xảy ra biến cố B khi đã xảy ra biến cố A. Nếu khả năng của biến cố B không bị tác
động bởi sự xuất hiện hay không xuất hiện của biến cố A và ngược lại, biến cố A và biến cố
B được gọi là độc lập (independent) và qui tắc trở thành:

Xác suất (A và B) = xác suất (A) × xác suất (B), nếu A và B độc lập
Giới tính của đứa trẻ là biến cố độc lập bởi vì đứa trẻ sau là gái không bị tác động bởi giới
tính của đứa bé trước. Một thí dụ của biến cố phụ thuộc (dependent) là xác suất một đứa trẻ ở
Ấn độ bị thiếu máu và suy dinh dưỡng, bởi vì đứa trẻ sẽ dễ bị thiếu máu nếu nó bị suy dinh
dưỡng.

Quy tắc cộng

Xác suất (A hay B hay cả hai) = xác suất (A) + xác suất (B) - xác suất (cả hai)
Quy tắc này được minh họa trong một thí dụ. Xem một vùng ở Nam Mỹ ở đó xác xuất bị
nhiễm giun móc là 0,5 và xác suất bị sán máng là 0,6. Rõ ràng xác suất có hoặc là giun móc,
hoặc là sán máng, hoặc là cả hai không phải là tổng số 0,5 + 0,6 = 1,1, bởi vì xác suất không
thể lớn hơn 1. Vấn đề là xác suất bị nhiễm giun móc và sán máng được tính hai lần, một lần
trong xác suất nhiễm giun móc, một lần trong xác suất nhiễm sán máng. Tính toán đúng như
sau:

Xác suất (giun móc hay sáng máng hay cả hai) = xác suất (giun móc)+xác suất (sán
máng) - xác suất (nhiễm hai loại)
Nếu hai bệnh độc lập với nhau

Xác suất (nhiễm hai loại) = 0,5 × 0,6 = 0,3


Xác suất (giun móc hay sáng máng hay cả hai) = 0,5 + 0,6 - 0,3 = 0,8

57
Căn bản thống kê y học -Ðỗ Văn Dũng

TỈ LỆ
Giới thiệu
Phương pháp được mô tả từ Chương 4 tới Chương 10 dành cho biến số liên tục. Chúng ta hãy
xem xét phương pháp thích hợp cho tỉ lệ, đó là biến số rời rạc. Chúng ta bắt đầu bằng việc mô
tả phân phối lấy mẫu của một tỉ lệ đựa trên phân phối nhị thức, và chúng ta sẽ mô tả phân
phối nhị thức có thể được xấp xỉ bằng phân phối bình thường như thế nào.

Phân phối nhị thức


Tỉ lệ được dựa trên một biến số nhị phân (binary variable), trong đó giá trị cho mỗi cá thể
trong một mẫu sẽ là một trong hai giá trị mà ta gọi là A hay B. Thí dụ, bệnh nhân sống sót
(A) hay chết (B), một bệnh phẩm là dương tính (A) hay âm tính (B), hay một đứa trẻ được
chích ngừa (A) hay không chích ngừa (B). Tỉ lệû (proportion) của A là số (r) các biến cố A
chia cho tổng số trong mẫu

P = r/n
Số (và tỉ lệ) của biến cố A được quan sát trong mẫu dĩ nhiên sẽ bị biến thiên lấy mẫu (xem
Chương 3), các mẫu khác nhau có thể có những giá trị khác nhau. Phân phối lấy mẫu được
gọi là phân phối nhị thức (binomial distribution) và có thể được tính từ cỡ mẫu, n, và tỉ lệ dân
số, p , như trong thí dụ 12.1. p (kí tự Hi lạp pi; không liên quan gì đến hằng số toán học
3,1416) là xác suất đáp ứng của một cá nhân là A.
Thí dụ 12.1
Một người đàn ông và đàn bà có tính trạng lặn của bệnh hồng cầu liềm (AS; nghĩa là dị hợp
tử của gen hemoglobin hồng cầu liềm [S] và bình thường [A]) có 4 đứa con. Tính xác suất có
không đứa trẻ nào, một, hai, hai, ba hay bốn đứa trẻ bị bệnh hồng cầu liềm (SS)?
Ðối với mỗi đứa trẻ xác suất bị bệnh hồng cầu liềm (SS) là xác suất bị di truyền gen S từ cha
và mẹ, đó là 0,5 × 0,5 = 0,25 theo quy tắc nhân xác suất (Chương 11). Xác suất không bị SS
(đó là AS hay AA) do đó là 0,75. Chúng ta gọi SS là A và không phải SS là B do đó p = 0,25
Xác suất của không đứa trẻ nào bị bênh là SS (r=0) là 0,75 × 0,75 × 0,75 × 0,75 = 0,754 =
0,3164, trong đó 0,754 là 0,75 lũy thừa 4 nghĩa là 0,75 nhân với nhau 4 lần. Ðiều này là do
quy tắc nhân xác suất.
Xác suất cho một đứa trẻ bị SS là xác suất (đứa trẻ thứ nhất bị SS và đứa trẻ thứ hai, thứ ba,
thứ tư không bị SS) hay (đứa trẻ thứ hai bị SS và đứa trẻ thứ nhất, thứ ba, thứ tư không bị SS)
hay (đứa trẻ thứ ba bị SS và đứa trẻ thứ nhất, thứ hai, thứ tư không bị SS) hay (đứa trẻ thứ tư
bị SS và đứa trẻ thứ nhất, thứ hai, thứ ba không bị SS). Mỗi khả năng này có xác suất là 0,25
× 0,753 (quy tắc nhân xác suất) và bởi vì chúng không thể xảy ra đồng thời với nhau xác suất
xảy ra một trong 4 khả năng trên là 4 × 0,25 × 0,753 = 0,4219, theo quy tắc cộng xác suất.
Theo cách tương tự ta có thể tính xác suất có hai, ba, hay bốn đứa trẻ bị bệnh hồng cầu liềm
bằng cách tính trong từng trường hợp, những chỉnh hợp có thể trong gia đình và cộng xác
suất của chúng. Có được xác suất chỉ ra trong bảng 12.1. Lưu ý rằng tổng xác suất là 1, đó là
phải có 1 trong 4 khả năng phải xảy ra. Xác suất cũng được dùng minh họa phân phối xác
suất trong hình 12.1. Ðây là phân phối nhị thức cho p = 0,25 và n = 4.

58
TỈ LỆ

Bảng 12.1 Tính toán xác suất số trẻ em bị di truyền bịnh hồng cầu liềm (SS) trong một gia đình có 4
đứa trẻ trong đó cha mẹ có tính trạng hồng cầu liềm lặn ( xác suất một cá nhân bị di truyền bệnh hồng
cầu liềm là 0,25)
Bị hồng cầu liềm Không bị hồng số cách các tổ xác suất
cầu liềm hợp có thể xảy
ra
0 4 1 1 × 1 × 0,754 = 0,3164
1 3 4 4 × 0,25 × 0,753 = 0,3164
2 2 6 6 × 0,252 × 0,752 =0,2109
3 1 4 4 × 0,253 × 0,75 =0,0469
4 0 1 1 × 0,254 × 1 =0,0039
Tổng số = 1,000

Hình 12.1 phân phối xác suát của số trẻ trong gia đình 4 người bị bệnh hồng cầu liềm khi cả bố mẹ
mang tính trạng lặn hồng cầu liềm. Xác suất đứa trẻ bị hồng cầu liềm là 0,25.
Công thức tổng quát cho phân phối nhị thức
Công thức tổng quát cho xác xuất có r biến cố A trong mẫu gồm n đối tượng khi xác suất xảy
ra biến cố A cho mỗi đối tượng là p:
n!
P(r láön biãún cäú A) = n r (1 − r ) n − r
r!(n-r )!
Trong phần thứ nhất của công thức là số các cách trong đó r biến cố A có thể có trong một
mẫu n, phần thứ hai bằng xác suất của một trong các cách đó. Dấu chấm tham kí hiệu giai
thừa (factorial) của một số và có nghĩa là nhân tất cả với nhau các số nguyên từ số đó đến số
1. (0! được định nghĩa là bằng 1), pr có nghĩa là p lũy thừa r hay p nhân với nhau r lần. Một
số bất kì lũy thừa zero bằng 1. Thí dụ áp dụng công thức trên trong thí dụ trên để tính xác
suất có hai trong bốn đứa trẻ bị bệnh hồng cầu liềm là:
4!
P(2 treí bë häöng cáöu liãöm) = 0.252 (1 − 0.25) 4− 2 = 0.2109
2!( 4-2)!
Nhiều máy tính cầm tay có phím để tính giai thừa và lũy thừa. Nếu không có thể tính dễ dàng
bằng cách dùng biểu thức sau, trong đó (r- n)! được triệt tiêu trong n!

59
Căn bản thống kê y học -Ðỗ Văn Dũng

n! n × ( n − 1) × ( n − 2) × ... × ( n − r − 1)
=
r!( n − r )! r × ( r − 1) × ... × 3 × 2 × 1
Thí dụ nếu n=18 r=5, (n-r+1)=18-5+1=14 và biểu thức trở thành
18 ×17 ×16 ×15 ×14 1028160
= = 8568
5 × 4 × 3 × 2 ×1 120
Ðộc giả quan tâm có thể thực tập công thức trên bằng cách tính lại các công thức trình bày ở
bảng 12.1 và 12.3. Lưu ý rằng khi p = 0,5 thì (1-p) cũng bằng 0,5 và phần thứ hai của công
thức bằng 0,5n
Tính chất của phân phối nhị thức
Hình 12.2 trình bày thí dụ của phân phối nhị thức cho những giá trị khác nhau của p và n.
Những phân phối này đã được trình bày theo số lần xuất hiện, r, biến cố A trong mẫu, mặc dù
chúng có thể áp dụng p, tỉ lệ của biến cố A. Thí dụ, khi cỡ mẫu bằng 5 các giá trị có thể của r
là 0, 1, 2, 3, 4, 5 và trục hoành được kí hiệu theo đó. Các tỉ lệ tương ứng là 0, 0,2, 0,4, 0,6,
0,8, 1. Kí hiệu lại trục hoành theo giá trị các tỉ lệ sẽ có phân phối bình thường của p. Lưu ý
rằng, mặc dù p là phân số, phân phối của nó là rời rạc và không liên tục, bởi vì nó chỉ gồm
một số các giá trị giới hạn cho một cỡ mẫu nhất định.
Bởi vì phân phối nhị thức là phân phối lấy mẫu cho số (hay tỷ lệ) các biến cố A, trung bình
của nó bằng trung bình dân số và độ lệch chuẩn của nó thể hiện sai số chuẩn, đo lường giá trị
mẫu ước lượng giá trị dân số chính xác tới đâu. Trung bình dân số và sai số chuẩn được cho ở
Bảng 12.2 cho số lần xảy ra, tỉ lệ và phần trăm biến cố A. Dĩ nhiên phần trăm là tỉ lệ nhân
cho 100.

Bảng 12.2 Trung bình dân số và sai số chuẩn của số lần xuất hiện, tỉ lệ và phần trăm của biến cố A
trong mẫu
giá trị quan sát trung bình dân số sai số chuẩn
Số lần xuất hiện biến cố A r nπ √ {Ûn π(1-p)}
Tỉ lệ của A p=r/n π √ π (1-π)/n}
Phần trăm biến cố A 100p 100π 100 √ {π(1-π)/n}

Kiểm định ý nghĩa cho tỉ lệ đơn dùng phân phối nhị thức
Xem kết quả của thử nghiệm lâm sàng để so sánh 2 thuốc giảm đau, A và
b. Mười hai người bị migrain được cho thuốc A vào lúc này và thuốc B vào lúc khác, để cho
mỗi bệnh nhân được cho mỗi loại thuốc theo thứ tự nghẫu nhiên. Sau đó bệnh nhân được hỏi
loại thuốc nào giảm đau tốt hơn. Chín bệnh nhân đáp ứng với thuốc A và 3 bệnh nhân đáp
ứng với thuốc B. Ðiều này có nghĩa là thuốc A thực sự hiệu quả hơn hay không hay sự khác
nhau chỉ do tình cờ?
Như trong Chương 6 kiểm định ý nghĩa được dùng để quyết định xem cách lý giải nào là khả
dĩ hơn. Giả thuyết trung tính là hai thuốc các tác dụng bằng nhau. Nếu điều này đúng, bệnh
nhân phải có cơ hội đáp ứng với A và B như nhau (giả thiết rằng có một vài lựa chọn). Phân
phối lấy mẫu đối với số lần xuất hiện của đáp ứng với thuốc A phải là phân phối nhị thức với
p =0,5 và n = 12.
Chương 6 cho biết mức ý nghĩa là xác suất có kết quả bằng hay cực đoan hơn kết quả quan
sát được. Như trong ví dụ này, đó là xác suất xuất hiện đáp ứng với thuốc A là chín, mười,
mười một hay mười hai cộng với xác suất xuất hiện đáp ứng với A là ba, hai, một hay không.
Trong một kiểm định ý nghĩa 2 đuôi, chúng ta phải tính cả hai đuôi của phân phối. Phân phối
nhị thức là phân phối đối xứng với p = 0,5. Do đó trong ví dụ này, xác suất xuất hiện đáp ứng
với thuốc A 3 lần cũng bằng với xác suất xuất hiện đáp ứng với thuốc A 9 lần, cũng như

60
TỈ LỆ

trong 12 tung một đồng tiền thì có khả năng có 3 lần ngửa và 9 lần xấp cũng bằng 9 lần ngửa
và 3 lần xấp.
Xác suất xuất hiện chín, mười, mười một hay mười hai đáp ứng với A được ghi ở bảng 12.3
và tổng số là 0,0729. Xác suất xuất hiện (3,2,1,0) đáp ứng với thuốc A theo hướng khác cũng
là 0,0729. Do đó xác suất có kết quả bằng hay lớn hơn xuất hiện 9 đáp ứng với thuốc A từ 12
bệnh nhân do tình cờ là 0,1458 hay 14,48%. Bởi vì xác suất này quá lớn chúng ta kết luận
rằng thử nghiệm không xác định sự khác biệt có ý nghĩa về hiệu quả các thuốc.

61
Căn bản thống kê y học -Ðỗ Văn Dũng

Hình 12.3 Phân phối nhị thức cho các giá trị các nhau của p và n. Các giá trị trên trục hoành là r.

Tính toán mức ý nghĩa khi p ≠ 0,5


Nói chung, chúng ta có thể dùng phương pháp trên để kiểm định ý nghĩa của sự khác biệt
giữa tỉ lệ của mẫu, p với bất kì giá trị giả thuyết trung tính của tỉ lệ dân số, p. Dù vậy khi p
không phải là 0,5 thì phân phối nhị thức không đối xứng và xác suất của đuôi trên và đuôi
dưới không giống nhau. Ta có thể tính mức ý nghĩa bằng cách cộng vào (i) xác suất của giá
trị mẫu quan sát được và các giá trị cực đoan hơn theo hướng đó và (ii) xác suất của mỗi giá
trị theo hướng ngược lại mà những xác suất này nhỏ hơn xác suất của mẫu quan sát được.
Theo cách khác là ta có thể tính tổng các xác suất theo hướng quan sát, đó là xác suất (i) và

62
TỈ LỆ

nhân đôi nó. Kết quả khác nhau nhưng trên thực tế nó không tác động đến việc đánh giá sự
khác biệt quan sát được là do tình cờ hay do tác động có thực. Không có phương pháp nào
hay hơn phương pháp nào nhưng phương pháp thứ nhì dễ tiến hành hơn.
Bảng 12.3 Tính toán mức ý nghĩa cho thử nghiệm lâm sàng trong đó 9 trong 12 bệnh nhân thích thuốc
A hơn thuốc B
Số bệnh nhân thích thuốc A Xác suất
Giá trị quan sát 9 220 × 0,512=0,0537
Các giá trị cực đoan hơn 10 66 × 0,512=0,0161
11 12 × 0,512=0,0029
12
1 × 0,512=0,0002
Tổng cộng: 9,10,11,12 0,0729
Ðuôi ngược lại: 3,2,1,0 0,0729
Tổng số (mức ý nghĩa ở hai đuôi) 0,1458

Xấp xỉ phân phối bình thường của phân phối nhị thức
Khi cỡ mẫu,n , lớn tính toán xác suất cho mỗi giá trị của một đuôi của phân phối nhị thức để
tính kiểm định ý nghĩa có thể rất mất công. May mắn thay khi n tăng phân phối nhị thức trở
thành rất gần với phân phối bình thường (xem Hình 12.2). Trong thực tế, phân phối bình
thường là xấp xỉ hợp lí của phân phối nhị thức nếu cả np và n-np lớn hơn hoặc bằng 5. Phân
phối xấp xỉ bình thường có trung bình và độ lệch chuẩn như trong phân phối nhị thức (xem
bảng 12.2)

Kiểm định ý nghĩa và khoảng tin cậy dùng xấp xỉ bình thường
Phân phối bình thường có thể dùng để kiểm định ý nghĩa tỉ lệ trong cách giống y như chúng
ta đã làm để kiểm định ý nghĩa trung bình (xem Chương 6 và 7) và có thể dùng để xây dựng
khoảng tin cậy
Kiểm định ý nghĩa dùng tỉ lệ đơn
Kiểm định bình thường cho một tỉ lệ đơn dùng công thức

p −π p −π
Z= =
s.e.( p ) π (1 − π ) / n
Thí dụ trong thử nghiệm lâm sàng để so sánh hay loại thuốc đã mô tả ở trên, tỉ lệ của bệnh
nhân thích thuốc A là 9/12 = 0,75 so sánh với giá trị giả thuyết trung tính là p = 0,5
0.75− 0.5
Z=
0.5× 0.5 /12
Giá trị 1,73 nằm ở giữa điểm 5 và 10% cua phân phối bình thường chuẩn (Bảng A2). Mức ý
nghĩa chính xác của nó có thể được tính từ bảng Bảng A1 và là 2 (0,0418=0,0836 hay 8,36%.
Số này nhỏ hơn đáng kể so với giá trị 14,58% đươc tính từ xác suất nhị thức. Lí do là chúng
ta đã dùng phân phối liên tục, phân phối bình thường, để xấp xỉ một phân phối rời rạc, phân
phối nhị thức. Tình huống này được hiệu chỉnh bằng cách đưa cái gọi là hiệu chỉnh tính liên
tục (continuity correction) vào công thức kiểm định bình thường
| p − π | −1 /(2n)
z=
π (1 − π ) / n

63
Căn bản thống kê y học -Ðỗ Văn Dũng

Trong đó |p-p| có nghĩa là giá trị tuyệt đối của p - p hay nói cách khác đó là p - p không tính
đến dấu trừ nếu có.

0,3

0,2

0,1

0,0
0 1 2 3 4 5 6 7 8 9 10 11 12

Hình 12.3 Phân phối nhị thức (n=12, p =0,5) ứng dụng để tính số bệnh nhân thích thuốc A, cùng với
xấp xỉ bình thường của nó. Các vùng gạch chéo cho thấy xác suất số bệnh nhân thích thuốc A lớn hơn
hay bằng 9 và minh họa việc sử dụng hiệu chỉnh tính liên tục.
Tác động của hiệu chỉnh tính liên tục là giảm giá trị z và cải thiện cho nó phù hợp với phân
phối nhị thức. Trong thí dụ này, giá trị z có hiệu chỉnh tính liên tục là
| 0,75 − 0,5 | −1 / 24
z= = 1,44
{0,5 × 0,5 / 12}
Từ bảng A1, mức ý nghĩa của z = 1,44 là 2 × 0,0749=0,1498 hay 14,98% khá phù hợp giá trị
14,58% từ kiểm định nhị thức.
Lí luận của hiệu chỉnh liên tục có thể được hiểu rất rõ nhờ hình 12.3 trong đó phân phối bình
thường và nhị thức được đặt chồng lên nhau. Cái mà ta đã làm khi hiệu chỉnh tính liên tục
trên thực tế chính là tính toán vùng ở dưới phân phối bình thường bên trái r = 3,5 và bên phải
r = 8,5, thay vì bên trái r = 3 và bên phải r = 9. Có thể thấy rằng nó phù hợp hơn với vùng
gạch chéo thể hiện đuôi của phân phối nhị thức.
Khoảng tin cậy cho tỉ lệ đơn
Dùng phân phối nhị thức để rút ra khoảng tin cậy cho tỉ lệ rất phức tạp. Dù vậy người ta đã
lập bảng các khoảng trong Geigy Scientific Tables (1982) cho các tỉ lệ khác nhau và cho cỡ
mẫu tới 100. Một cách khác là dùng công thức xấp xỉ bằng cách sử dụng phân phối bình
thường và phương pháp tương tự như đã mô tả ở Chương 5. Nó cho công thức

c.i. = p ± z' × s.e., s.e. = √[Ûp(1-p)/n]


Trong đó z' là điểm phần trăm tương ứng của phân phối bình thường chuẩn. Thí dụ đối với
khoảng tin cậy 95% z'=1,96. Công thức này không được hiệu chỉnh tính liên tục và chỉ thích
hợp khi cả np và n-np lớn hơn hoặc bằng 10.
Kiểm định ý nghĩa so sánh hai tỉ lệ
Kiểm định bình thường để so sánh hai tỉ lệ mẫu, p1=r1/n1 và p2=r2/n2 dựa trên
p1− p 2
z=
s.e.( p1 − p 2 )
Trong só sai số chuẩn của p1-p2 dưới giả thuyết trung tính nghĩa là tỉ lệ dân số bằng nhau
(p1=p2=p) là:

64
TỈ LỆ

s.e.( p1− p 2 ) = π (1 − π )(1 / n1 + 1 / n 2 )


p là ước lượng tỉ lệ toàn bộ của cả hai mẫu đó là:
r1 + r2
p=
n1 + n2
Nhưng trong trường hợp tỉ lệ đơn, kiểm định được cải thiện nhờ việc đưa vào hiệu chỉnh tính
liên tục. Công thức là

| p1 − p2 | −{1 /(2n1 ) + 1 /(2n2 )} r1 + r2


z= , p=
p (1 − p )(1 / n1 + 1 / n2 ) n1 + n2

(Như đã trình bày ở trên, |p1-p2| là kích thước của hiệu số, bỏ qua dấu của nó). Kiểm định
bình thường này là một xấp xỉ hợp lí cho hoặc là (i) n1+n2 lớn hơn 40 hay (ii) n1p, n1-n1p,
n2p, n2-n2p đều lớn hơn hoặc bằng 5. Kiểm định chính xác được mô tả ở Chương 4 khi điều
kiện không được thỏa mãn.
Khoảng tin cậy cho hiệu số giữa hai tỉ lệ
Công thức tính khoảng tin cậy cho hiệu số giữa 2 tỉ lệ là

c.i. = ( p1 − p 2 ) ± ( z '×s.e.), s.e. = p1 (1 − p1 ) / n1 + p 2 (1 − p 2 ) / n2


Trong đó z là điểm phần trăm thích hợp của phân phối bình thường. Xấp xỉ này hợp lí nếu
n1p, n1-n1p, n2p, n2-n2p đều lớn hơn hoặc bằng 10 và sẽ tốt hơn nếu những số này lớn hơn.
Thí dụ 12.2
Xét kết quả của một thử nghiệm vaccin cúm được tiến hành trong một vụ dịch. Hai mươi
trong 240 (p1=0,083 hay 8,3%) người được tiêm chủng vaccin thực mắc bệnh cúm so với 80
trong số 220 người(p2=0,364 hay 36,4%) người được chích placebo. Ðây có phải là bằng
chứng thuyết phục rằng vaccin có hiệu quả.
Tỉ lệ toàn bộ mắc cúm là
20 + 80 100
p= = = 0,217 hay 21,7%
240 + 220 460
Và như vậy
| 0,083 − 0,364 | −(1 / 480 + 1 / 440)
z=
0,217(1 − 0,217)(1 / 240 + 1 / 220)
0,281 − 0,0044
= = 7,18
0,0385
Giá trị 7,18 lớn hơn 3,29 là điểm 0,1% cho phân phối bình thường chuẩn. Do đó chúng ta kết
luận rằng giảm nguy cơ nhiễm cúm sau khi tiêm chủng vaccin thật với mức ý nghĩa cao
(P<0,001). Khoảng tin cậy của mức giảm là:

( p1 − p 2 ) ± 1,96 p1 (1 − p1 ) / n1 + p 2 (1 − p 2 ) / n 2
= −0,281 ± (1,96 × 0,037) = −0,354; − 0,208
Nghĩa làm xác suất mắc cúm được ước lượng thấp hơn 20,8% đến 35,4% sau khi tiêm chủng
vaccin cúm so với tiêm placebo.

65
Căn bản thống kê y học -Ðỗ Văn Dũng

Thí dụ này được minh họa một lần nữa ở Chương tiếp theo và trong phần thử nghiệm vaccin
ở Chương 25, ở đó đưa vào khái niệm hiệu quả vaccin.

66
KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ


Giới thiệu
Trình bày số liệu của các biến định tính được mô tả ở Chương 2. Khi có hai biến định tính, số
liệu được sắp xếp trong bảng dự trù (contigency table). Các phạm trù cho một biến số tạo
thành hàng và các phạm trù cho biến số khác tạo thành cột. Cá nhân được đưa vào một ô
thích hợp của bảng dự trù tùy theo giá trị của hai biến số. Bảng dự trù cũng được dùng cho
các biến số định lượng rời rạ hay biến số định lượng liên tục khi các giá trị được phân nhóm.
Kiểm định chi bình phương (χ2) được dùng để kiểm định xem có sự liên hệ giữa các biến
số hàng và biến số cột hay không hay nói cách khác, sự phân phối của các cá nhân trong các
phạm trù của một biến số có phụ thuộc vào sự phân phối trong các phạm trù của biến kia hay
không. Khi bảng chỉ có hai hàng và hai cột điều này có nghĩa là so sánh 2 tỉ lệ.

Bảng 2 × 2 (so sánh hai tỉ lệ)


Kết quả của thử nghiệm cúm được mô tả ở Thí dụ 12.2 được sắp xếp trong theo dạng bảng
trong Bảng 13.1(a). Trong 460 người lớn, 240 người được tiêm chủng vaccin cúm và 220
người được tiêm placebo. Tổng số 100 người bị cúm trong đó có 20 người ở trong nhóm
vaccin và 80 người ở trong nhóm placebo. Bảng đó được gọi là bảng dự trù 2 × 2 (2 × 2
contigency table). Bởi vì hai biến số đó, loại vaccin và sự xuất hiện cúm, đều có 2 giá trị khả
dĩ. Ðôi khi nó được gọi là bảng gấp 4 (fourfold table) bởi vì các đối tượng sẽ ở một bốn
phạm trù khả dĩ.
Bước đầu tiên trong việc lí giải số liệu bảng dự trù là tính toán tỉ lệ hay phần trăm thích hợp.
Do đó tỉ lệ mắc cúm là 8,3% trong nhóm vaccin, 36,4% trong nhóm placebo và 21,7% toàn
bộ. Sau đó chúng ta cần quyết định như vậy có đủ chứng cứ để xem vaccin có hiệu quả hay
sự khác biệt là do tình cờ.
Ðiều này được tiến hành bằng kiểm định chi bình phương (chi square test) nhằm so sánh số
quan sát trong một trong bốn phạm trù trong bảng dự trù với số kì vọng nếu không có sự khác
biệt về hiệu quả giữa vaccine và placebo. Tổng số 100/460 người bị cúm và nếu vaccine và
placebo có hiệu quả bằng nhau, tỉ lệ bị cúm trong hai nhóm cũng như vậy và có
100/460×240=52,2 người trong nhóm vaccine và 100/460 × 220=47,8 người trong nhóm
placebo sẽ bị cúm. Tương tư như vậy sẽ có 360/460 × 240 =187,8 người và 360/480 × 220
người không bị cúm. Những số kì vọng này đươc trình bày trong bảng 13.1(b). Chúng cũng
tạo tổng số hàng và tổng số cột tương tự như trị số quan sát. Giá trị chi bình phương có được
bằng cách tính (quan sát - kì vọng)2/kì vọng cho mỗi ô trong bảng dự trù và cộng chúng lại.
(O − E ) 2
χ =Σ
2
, d . f . = 1 âäúi våïi baíng 2 x 2
E
Hiệu số giữa số quan sát được và số kì vọng càng lớn, giá trị χ2 càng lớn và ít có thể sự khác
biệt này là do tình cờ. Ðiểm phần trăm của phân phối χ2 được trình bày trong bảng A5. Giá trị
này phụ thuộc vào độ tự do và trong bảng 2 × 2 độ tự do bằng 1.
Trong thí dụ này
(20 − 52,2) 2 (80 − 47,8) 2 (220 − 187,8) 2 (140 − 172,2) 2
χ2 = + + +
52,2 47,8 187,8 172,2
= 19,86 + 21,69 + 5,52 + 6,02 = 53,09
53,09 lớn hơn 10,85, điểm 0,1% của phân phối χ2 một độ tự do. Do đó xác suất của sự khác
biệt quan sát được về bệnh cúm do tình cờ nhỏ hơn 0,1%, nếu không có sự khác biệt thực sự
giữa vaccine và placebo. Do đó có thể kết luận rằng vaccin có hiệu quả.

67
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 13.1 Kết quả thử nghiệm vaccine cúm


(a) Số quan sát
Cúm vaccine placebo tổng số
có 20 (8,3%) 80 (36,4%) 100 (21,7%)
không 220 140 360
tổng số 240 220 460
(a) Số kì vọng
cúm vaccine placebo tổng số
có 52,2 47,8 100
không 187,8 172,2 360
tổng số 240 220 460

Sự hiệu chỉnh tính liên tục


Giống như kiểm định bình thường, kiểm định chi bình phương đối với bảng 2 × 2 có thể được
cải tiến nhờ hiệu chỉnh tính liên tục, thường được gọi là hiệu chỉnh tính liên tục của Yates
(Yates' continuity correction). Công thức như sau
(| O − E | − 12
χ2 = Σ , d. f . = 1
E
cho giá trị χ2 nhỏ hơn, |O-E| có nghĩa là giá trị tuyệt đối của O-E hay nói cách khác, giá trị của
O-E bỏ qua dấu của nó.
Trong thí dụ này giá trị của χ2 làì

(32 − 12 ) 2 (32,2 − 12 ) 2 (32 ,2 − 12 ) 2 (32, 2 − 12 ) 2


χ2 = + + +
52, 2 47 ,8 187 ,8 172 ,2
= 19, 25 + 21,02 + 5,35 + 5,84 = 51, 46 P < 0,001

So sánh với kiểm định bình thường


Kiểm định bình thường để so sánh hai tỉ lệ và kiểm định chi bình phương cho bảng dự trù 2 ×
2 thực chất là tương đương với nhau và χ2 = z2. Ðiều này đúng với cả khi có hay không có
hiệu chỉnh tính liên tục, với điều kiện là nó cùng hiệu chỉnh hoặc không cùng hiệu chỉnh. Từ
thí dụ 12.2, z2 với (hiệu chỉnh tính liên tục) = 7,182 = 51,55 mà ngoại trừ sai số làm tròn nó
giống hệt như giá trị χ2 = 51,46 đã được tính ở trên. Kiểm định bình thường có ưu điểm là dễ
tính khoảng tin cậy hơn. Dù vậy kiểm định χ2 dễ áp dụng hơn và có thể mở rộng để so sánh
nhiều tỉ lệ và dùng cho bảng dự trù lớn hơn.
Lưu ý rằng điểm phần trăm trong Bảng A5 cho kiểm định chi bình phương một độ tự do
tương ứng với điểm phần trăm hai đuôi trong bảng A2 của phân phối bình thường. (Khái
niệm kiểm định một đuôi hay hai đuôi không dùng đối với kiểm định chi bình phương có độ
tự do lớn hơn bởi vì chúng bao gồm việc so sánh nhiều tỉ lệ (multiple comparison).)
Tính hợp lệ (validity)
Nên luôn luôn sử dụng hiệu chỉnh tính liên tục mặc dù chúng có tác động nhiều nhất khi số kì
vọng nhỏ. Khi chúng rất nhỏ kiểm định chi bình phương (và kiểm định bình thường) không
phải là xấp xỉ tốt, ngay cả khi có hiệu chỉnh tính liên tục và khi đó nên dùng kiểm định chính
xác (exact test) cho bảng 2 × 2 (xem Chương 14). Cochran (1954) đề nghị sử dụng kiểm định

68
KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

chính xác khi tổng số của bảng nhỏ hơn 20 hay khi nó ở giữa 20 và 40 và số nhỏ nhất trong
bốn giá trị kì vọng nhỏ hơn 5. Do đó kiểm định chi bình phương hợp lệ khi tổng số phải lớn
hơn 40 bất kể các giá trị kì vọng hay khi tổng số kì vọng ở giữa 20 và 40 với điều kiện tất cả
các giá trị kì vọng phải lớn hơn hoặc bằng 5.

Bảng 13.2 Kí hiệu tổng quát cho bảng dự trù 2 × 2


Cúm vaccin placebo tổng số
Có a b e
Không c d f
tổng số g h n
Công thức tính nhanh
Nếu các số trong bảng dự trù được kí hiệu bằng các kí tự như trong bảng 13.2 thì công thức
để tính chi bình phương nhanh hơn cho bảng 2 × 2 như sau:

n(ad − bc) 2 460 × (20 ×140 − 80 × 220) 2


χ2 = = = 53,01
efgh 100 × 360 × 240 × 220
Mà ngoại trừ sai số làm tròn sẽ giống hệt như giá trị đã tính ở trên. Với hiệu chỉnh tính liên
tục, công thức sẽ trở thành
n(| ad − bc | − n / 2) 2
χ2 = , d. f . = 1
efgh
Trong thí dụ này
460× (14800− 230)2
χ2 = = 51,37
100× 360× 240× 220
Kết quả này tương tự như như giá trị đã tính ở trên, nếu không xét đến sai số làm tròn.
Bảng lớn
Kiểm định chi bình phương có thể được áp dụng cho bảng lớn hơn, nói chung là bảng r × c,
trong đó r kí hiệu số hàng trong bảng và c là số cột.
(O − E)2
χ2 = Σ , d . f . = (r −1) × (c −1)
E
Và không có hiệu chỉnh tính liên tục hay kiểm định chính xác cho bảng dự trù ngoại trừ bảng
2 × 2 . Cochran (1954) đã đề nghị rằng xấp xỉ của kiểm định chi bình phương sẽ hợp lệ nếu
có ít hơn 20% số các giá trị kì vọng dưới 5 và không có giá trị kì vọng nào nhỏ hơn một. Có
thể vượt qua hạn chế này bằng cách kết hợp các hàng (hay các cột) có giá trị kì vọng thấp.
Không có công thức tính nhanh cho bảng r × c (trường hợp đặc biệt 2 × c hay r × 2 sẽ được
xét ở phần sau). Phải tính số kì vọng cho mỗi ô. Sử dụng các lí luận y như trong trường hợp
bảng 2 × 2 . Qui tắc chung để tính số kì vọng là:
täøng cuía cäüt × täøng cuía haìng
E=
täøng säú chung
Cần lưu ý rằng kiểm định chi bình phương chỉ hợp lệ nếu được áp dụng cho số thực tế trong
các phạm trù khác nhau. Không bao giờ được áp dụng nó cho bảng chỉ có tỉ lệ hay phần trăm
mà thôi.

69
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 13.3 So sánh các nguồn nước chính được sử dụng bởi gia đình trong 3 làng ở Tây phi
(a) Số quan sát
NGUồN NƯớC LÀNG A LÀNG B LÀNG C TổNG Số
Sông 20(40,0%) 32(53,3%) 18(45,0%) 70(46,7%)
Ao hồ 18(36,0%) 20(33,3%) 12(30,0%) 70(33,3%)
Suối 12(24,0%) 8(13,3%) 10(25,0%) 30(20,0%)
Tổng số 50(100,0%) 60(100,0%) 40(100,0%) 150(100,0%)

(b) Số kì vọng
NGUồN NƯớC LÀNG A LÀNG B LÀNG C TổNG Số
Sông 23,3 28,0 18,7 70
Ao hồ 16,7 20,0 13,3 50
Suối 10,0 12,0 8,0 30
Tổng số 50 60 40 150
Thí dụ 13.1
Bảng 13.3(a) trình bày kết quả của cuộc điều tra so sánh nguồn nước chính trong 3 xã ở Tây
châu Phi. Trong bảng trình bày số và phần trăm các gia đình dùng, nước sông, nước ao, hay
suối. Thí dụ trong làng A, 40% sử dụng nước sông chủ yếu, 36% nước ao hồ, 24,0% sử dụng
giếng. Việc tính toán các phần trăm là cần thiết trong việc lí giải số liệu của bảng dự trù. Nói
chung, 70 trong 150 hộ dùng nước giếng. Nếu không có sự khác biệt giữa các làng, người ta
có thể cho rằng tỉ lệ dùng nước sông là giống nhau trong mỗi làng. Do đó số kì vọng của số
hộ dùng nước sống là

70 × 50/150 = 23,3 70 × 60/150= 28,0 70 × 40/150 = 18,7


Số kì vọng có thể được tính bằng cách áp dụng quy tắc chung. Thí dụ số kì vọng của hộ dùng
nước sống trong làng B là:
täøng cuía haìng (säng) × täøng cuía cäüt (B) 70 × 60
= = 28,0
täøng säú chung 150
Số kì vọng của toàn bộ bảng được trình bày trong bảng 13.3(b)

(O − E ) 2
χ =Σ
2

E
= ( 20-23,3 )2 / 23,3 + ( 32-28,0 )2 / 28,0 + ( 18-18,7 )2 / 18,7 +
( 18-16,7 )2 / 16,7 + ( 20-20,0 )2 / 20,0 + ( 12-12,3 )2 / 13,3 +
( 12-10,0 )2 / 10,0 + ( 8-12,0 )2 / 12,0 + ( 10-8,0 )2 / 8,0
= 3,53
df = (r − 1) × (c − 1) = 2 × 2 = 4
Bởi vì 3,53 nhỏ hơn 5,39 (điểm 25% của χ2 4 độ tự do), có thể kết luận rằng không có sự khác
biệt ý nghĩa giữa các làng về phần trăm số hộ dùng các nguồn nước khá nhau (P>0,25)

70
KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

Công thức ngắn gọn cho bảng 2 × c


Kiểm định chi bình phương được áp dụng cho bảng 2 × c , đó là bảng chỉ có 2 hàng trình bày
sự khác biệt giữa c tỉ lệ thể hiện bởi c cột trong bảng. Công thức cô đọng hơn trong trường
hợp này

N 2 [ Σ ( r 2 / n) − R 2 / N ]
χ2 = , d. f . = c −1
R( N − R)
Trong đó n thể hiện tổng số cho cột và r là giá trị của ô trên trong cột đó. r2/n được tính cho
mỗi cột trong bảng và tổng của chúng là Σ (r2/n). N là tổng số toàn bộ và R là tổng số cả hàng
trên. (đối với bảng có 2 cột chứ không phải hai hàng, từ 'cột' và 'hàng' sẽ đổi chỗ cho nhau
trong phần trình bày trên.)
Bảng 13.4 Suất mắc toàn bộ của Schistosoma mansoni theo nghề nghiệp
Nghề nghiệp
S. Manosi Ngư dân Nông dân Buôn bán thợ thủ công tổng số
Dương tính 22(62,9%) 21 (48,8%) 17 (29,3%) 15 (51,7%) 75 (45,5%)
Âm tính 13 22 41 14 90
Tổng số 35 43 58 29 165
Thí dụ 13.2
Bảng 13.4 trình bày kết quả cuộc điều tra ở một vùng nông thôn ở Trung Phi để so sánh suất
mắc toàn bộ Schistosoma mansoni trong các nghề nghiệp khác nhau. Áp dụng công thức ngắn
gọn cho χ2:
Σ (r 2 /n) = 222 / 35 + 212 / 43 + 172 / 58 + 152 / 29
= 13 ,83 + 10 ,26 + 4 ,98 + 7 ,76 = 36 ,83
R 2 / N = 75 2 / 165 = 34 ,09
1652 ( 36 ,83-34 ,09 )
χ2 = = 11,05 d. f . = 3
75 × 90
Ðiều này có ý nghĩa ở mức 2,5%, gợi ý rằng có thể có sự liên hệ giữa nguy cơ nhiễm bệnh và
nghề nghiệp. Suất mắc toàn bộ của S. mansoni cao ở người ngư dân, thấp ở người buôn bán
so với nông dân và thợ thủ công.

71
Căn bản thống kê y học -Ðỗ Văn Dũng

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ


Giới thiệu
Phân tích bảng dự trù được giới thiệu và kiểm định chi bình phương được mô tả ở Chương
13. Trong chương này chúng ta sẽ mô tả phương pháp cần dùng khi kiểm định chi bình
phương đơn giản không thích hợp hay không đủ phân tích số liệu. Phạm trù đầu tiên bao gồm
các trường hợp khi mẫu quá nhỏ nên việc xấp xỉ không đúng hay khi so sánh tỉ lệ bắt cặp
(xem thí dụ ở bảng 14.3). Phạm trù thứ nhì là việc phân tích kết hợp một số bảng dự trù và
tìm kiếm khuynh hướng tăng (hay giảm) đối với bảng tỉ lệ 2 × c .

Kiểm định chính xác cho bảng 2 2


Như đã trình bày trong Chương 13, xấp xỉ của kiểm định chi bình phương và kiểm định bình
thường đối với bảng 2 × 2 có thể không hợp lệ nếu cỡ mẫu nhỏ. Cochran (1954) đề nghị sử
dụng kiểm định chính xác (exact test), đôi khi đươc gọi là kiểm định chính xác của Fisher
khi:
(i) Tổng số chung của bảng nhỏ hơn 20
(ii) Tổng sổ chung từ 20 đến40 và số nhỏ nhất trong 4 số kì vọng nhỏ hơn 5.
Kiểm định được mô tả dễ hiểu nhất trong trường hợp một thí dụ cụ thể. Bảng 14.1 trình bày
kết quả từ một nghiên cứu để so sánh hai chế độ điều trị để kiểm soát chảy máu ở người bị
hemophili trong khi phẫu thuật. Chỉ có 1 trong số 13 (8%) số người bị hemophili được điều
trị bằng chế độ A bị chảy máu, so với 3 trong 12 (25%) người được điều trị bởi chế độ B.
Những con số này nhỏ nên kiểm định chi bình phương không thể hợp lệ; tổng số chung là 25,
nhỏ hơn 40 và số kì vọng nhỏ nhất là 1,9 (biến chứng trong chế độ điều trị B) nhỏ hơn 5. Do
đó cần dùng kiểm định chính xác.

Kiểm định chính xác được dựa vào sự tính toán xác suất chính xác của bảng quan sát được và
bảng 'cực đoan' hơn (more extreme table) với cùng tổng số hàng và cột, dùng công thức sau

Bảng 14.1 So sánh hai chế độ điều trị để kiểm soát chảy máu ở người bị bệnh hemophili trong phẫu
thuật
chế độ điều trị
Biến chứng chảy máu A B Tổng số
có 1 3 4
không 12 9 21
Tổng số 13 12 25
e! f ! g! h!
Xaïc suáút chênh xaïc cuía baíng 2 =
n! a!b!c! d !
Trong đó kí hiệu đã đươc định nghĩa ở Bảng 13.2. Dấu chấm than kí hiệu giai thừa của một
số và có nghĩa là nhân tất cả các số nguyên từ số đó tới 1 với nhau. (0! được định nghĩa là 1).
Nhiều máy tính cầm tay có phím bấm giai thừa, mặc dù biểu thức này có thể dễ dàng tính
toán bằng cách đơn giản các thừa số ở tử và mẫu số. Xác suất chính xác cho bảng 14.1 là
4! 21!13!12! 4 ×13 ×12 ×11×10
= = 0,2261
25!1! 3!12! 9! 25 × 24 × 23 × 22
(21! được đơn giản với 25! thành 25 × 24 × 23 × 22).

72
BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

Ðể kiểm định giả thuyết trung tính không có sự khác biệt giữa 2 chế độ điều trị, chúng ta cần
tính không những xác suất của bảng quan sát được mà cả xác suất của những bảng cực đoan
hơn có thể xảy ra tình cờ. Như vậy có 5 bảng có thể có mà có cùng tổng số hàng và cột như
trong số liệu. Chúng được trình bày ở bảng 14.2 cùng với xác suất của nó. Trường hợp quan
sát được ở bảng 14.2(b) với xác suất 0.2261. Với nhận định rằng cực đoan hơn nghĩa là kém
khả năng hơn, bảng 14.2(a) và 14.2(e) cực đoan hơn với xác suất tương ứng là 0,0391 và
0,0565. Tổng các xác suất cần cho mức ý nghĩa là 0,2261 + 0,0391 + 0,0565 = 0,3217 và do
đó sự khác biệt giữa các chế độ là không có ý nghĩa.

Mæïc yï nghéa xaïc suáút cuía baíng quan saït âæåüc +


=
(caïch I) xaïc suáút cuía caïc baíng coï xaïc suáút nhoí hån
Các thứ nhì hạn chế việc tính toán cho các bảng cực đoan cùng hướng với hướng đã quan sát
và sau đó nhân đôi xác suất để có cả sự khác biệt theo hướng ngược lại. Trong thí dụ này,
mức ý nghĩa thu được sẽ thu được sẽ gấp đôi tổng xác suất của Bảng 14.2(a) và 14.2(b) đó là
2 × (0,0391 + 0,2261) = 0,534. Không có phương pháp nào hay hơn phương pháp kia nhưng
phương pháp dễ tiến hành hơn. Mặc dù hai phương pháp cho kết quả khác nhau nhưng trên
thực tế cách lựa chọn ít khi tác động đến việc đánh giá xem sự khác biệt là do tình cờ hay là
hiệu quả có thực.

Mæïc yï nghéa  xaïc suáút cuía baíng quan saït âæåüc + 


= 2×  
(caïch II)  xaïc suáút cuía caïc baíng cæûc âoan hån theo hæåïng tæång tæû 

Bảng 14.2 Những bảng có cùng tổng số hàng và cột như bảng 14.1 và xác suất của chúng
(a) (b)
0 4 4 1 3 4
13 8 21 12 9 21
13 12 25 13 12 25
p = 0,0391 p = 0,2261
(c) (d)
2 2 4 3 1 4
11 10 21 10 11 21
13 12 25 13 12 25
p = 0,4070 p = 0,2713
(e)
4 0 4
9 12 21
13 12 25
p = 0,0565

So sánh 2 tỉ lệ - trường hợp cặp đôi


Trong một số nghiên cứu chúng ta quan tâm đến việc so sánh hai tỉ lệ được tính từ các quan
sát được cặp đôi (paired). Ðiều này xảy ra khi hai tỉ lệ cùng được đo lường trên cùng một cá

73
Căn bản thống kê y học -Ðỗ Văn Dũng

nhân (xem thí dụ dưới hay từ nghiên cứu bệnh chứng và thử nghiệm lâm sàng trong đó sử
dụng quy hoạch bắt cặp đôi (matched paired design) (xem Chương 24 và 25)
Thí dụ, xét kết quả một thử nghiệm so sánh phương pháp Bell và Kato- Katz để phát hiện
trứng Schistosoma masoni trong phân gồm 315 bệnh phẩm được phân tích bằng hai phương
pháp. Kết quả được trình bày trong bảng dự trù 2 × 2 trong bảng 14.3(a), cho thấy sự phù hợp
giữa hai phương pháp. Dù vậy chúng ta không quan tâm đến sự phù hợp ở đạy mà chúng ta
quan tâm chủ yếu đến tỉ lệ bệnh phẩm dương tính của hai phương pháp. Ðó là 238/315
(75,6%) khi dùng phương pháp Bell và 198/315 (62,9%) khi dùng phương pháp Kato-Katz.
Lưu ýy rằng nếu trình bày số liệu như trong bảng 14.3(b) và áp dụng kiểm định chi bình
phương là sai, bởi vì nó không tính đến bản chất cặp đôi của số liệu, đó là cùng 315 bệnh
phẩm được xét nghiệm bởi cả hai phương pháp, chứ không phải là 630 bệnh phẩm khác nhau.

Bảng 14.3 So sánh phương pháp Bell và Kato-Katz để phát hiện trứng Schistosoma mansoni trong
phâm. 315 bệnh phẩm được xét nghiệm bằng cả hai phương pháp. Số liệu từ Sleigh et al. (1982)
Transaction of the Royal Society of Tropical Medicine and Hygiene 76, 403-6 (đã xin phép)
(a) Trình bày đúng (b) Trình bày sai
Kato-Katz
+ - Tổng số Kết quả Bell Kato-Katz Tổng số
Bell + 184 54 238 + 238 198 436
- 14 63 77 - 77 117 194
Tổng số 198 117 315 Tổng số 315 215 630

Phương pháp đúng như sau. Một trăm tám mươi bốn bệnh phẩm dương tính với cả 2 phương
pháp và 63 âm tính với cả hai phương pháp. 274 bệnh phẩm này không cho thông tin nào về
phương pháp tốt hơn trong việc phát hiện trứng S. mansoni. Thông tin mà chúng ta cần đến
hoàn toàn nằm trong 69 trường hợp mà hai phương pháp không phù hợp. Trong số này có 54
trường hợp chỉ dương tính với phương pháp Bell so với 14 chỉ dương tính với phương pháp
Kato-Katz.
Nếu không có sự khác biệt về khả năng phát hiện trứng S. Masoni, chúng ta sẽ không kì vọng
sự phù hợp hoàn toàn bởi vì đó là 2 mẫu khác nhau, nhưng chúng ta kì vọng rằng có một phân
nửa trường hợp không phù hợp sẽ chỉ dương tính với phương pháp Bell mà thôi và phân nửa
sẽ chỉ dương tính với phương pháp Kato-Katz. Do đó kiểm định ý nghĩa thích hợp là so sánh
tỉ lệ chỉ dương tính với phương pháp Bell (54/68) với giá trị giả thuyết là 0,5. Ðiều này có thể
làm được nhờ kiểm định bình thường (với hiệu chỉnh tính liên tục) như đã được trình bày
trong Chương 12. Nó tính ra
| 54 / 68 − 0,5 | −1 /(2 × 68)
z= = 4,73
0,5 × 0,5 / 68
Nói lên rằng phương pháp Bell tốt hơn có ý nghĩa (P<0,001) hơn phương pháp Kato-Katz
trong việc phát hiện trứng S. masoni. (Lưu ý rằng sẽ thu được kết quả tương tự nếu so sánh tỉ
lệ chỉ dương tính với Kato-Katz, đó là 14/68, được so sánh với 0,5.)
Kiểm định chi bình phương McNemar
Có kiểm định chi bình phương, được gọi là kiểm định chi bình phương McNemar
(McNemar's chi squared test), dựa trên số các cặp không phù hợp (discordant pairs), r và s.
Công thức có hiệu chỉnh tính liên tục là:

(| r − s | −1)2
χbàõ
2
t càûp = , d. f . = 1
r+s

74
BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

Trong thí dụ r = 54 và s = 14 cho

(| 54 − 14 | −1) 2 39 2
χ 2
= = = 22,36 d . f . = 1, P < 0,001
54 + 14
bàõt càûp
68
Ngoại trừ sai số làm tròn, giá trị χ2 này giống hệt như với bình phương giá trị z có được ở trên
(4,732 = 22,37), hai kiểm định tương đương về mặt toán học với nhau.
Tính hợp lệ
Sử dụng kiểm định chi bình phương McNemar hay kiểm định bình thường hợp lệ nếu tổng số
các cặp không phù hợp phải lớn hơn hoặc bằng 10. Nếu có ít hơn 10 cặp không phù hợp, phải
tính xác suất nhị thức chính xác như đã trình bày ở Chương 12.
Khoảng tin cậy
Tỉ lệ mẫu dương tính với phương pháp Bell là 0,7556 so với 0,6286 của phương pháp Kato-
Katz. Hiệu số của hai tỉ lệ này là 0,1270. Hiệu số này cũng như sai số chuẩn của nó có thể
được tính từ số các cặp không phù hợp, r và s và tổng số các cặp n.

Hiãûu säú cuía r−s r+s


= , s.e. =
hai tè lãû bàõt càûp n n
Ở đây sự khác biệt, (r-s)/n= 40/315=0.1270 giống như khi được tính trực tiếp từ tỉ lệ, với s.e.
= (√ 68)/315=0,0262. Khoảng tin cập xấp xỉ có thể được tính dựa trên phân phối bình
thường.

r−s r+s
c.i. = ± z'
n n
Khoảng tin cậy 95% của hiệu số giữa tỉ lệ của bệnh phẩm dương tính với phương pháp Bell
và Kato-Katz là:
0,1270 ± 1,96 × 0,0262 = 0,0756 đến 0,1784
Ðiều này có nghĩa là tỉ suất dương tính cao hơn từ 7,6% và 17,8% khi dùng phương pháp Bell
để phát hiện trứng S. mansoni so với khi dùng phương pháp Kato-Katz.

Phân tích nhiều bảng 2 × 2


Một điểm tổng quát rất quan trọng cần phải nhận thức khi tiến hành phân tích là khi tập hợp
(pool) nhiều tập hợp số liệu có thể dãn đến kết quả sai lạc. Thí dụ, xét một kết quả được trình
bày ở bảng 14.4 từ một cuộc điều tra được tiến hành để so sánh tỷ suất mắc toàn bộ của
kháng thể chống leptospirosis ở nông thôn và thành thị ở vùng West Indies. Ðiểm chính cần
lưu ý ở đây là đối với nam hay nữ, tỷ suất mắc toàn bộ cao ở vùng nông thôn nhưng khi kết
hợp hai giới tính thì không có sự khác biệt. Ðiều này là do sự kết hợp của hai yếu tố
(i) tỷ suất mắc toàn bộ của kháng thể không giống nhau ở nam và nữ. Nó thấp ở nữ, dù rằng ở
nông thôn hay thành thị.
(ii) Mẫu từ vùng nông thôn và thành thị có cấu trúc giới tính khác nhau. Tỉ lệ nam là 100/200
(50%) ở mẫu thành thị nhưng chỉ có 50/200 (25%) ở mẫu nông thôn.

75
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 1 So sánh tỉ suất mắc toàn bộ của kháng thế chống leptospiro ở giữa vùng thành thị và nông
thôn.
(a) Ðàn ông
Kháng thể Nông thôn Thành thị Tổng số
Có 36 (72%) 50 (50%) 86
Không 14 50 64
Tổng số 50 100 150
χ2 = 5,73 d.f.=1 P<0,025

(b) Ðàn bà
Kháng thể Nông thôn Thành thị Tổng số
Có 24 (16%) 10 (10 34
Không 126 90 216
Tổng số 150 100 250
χ2 = 1,36 d.f.=1 P ≈ 0,25

(c) Ðàn ông và đàn bà


Kháng thể Nông thôn Thành thị Tổng số
Có 60 (30%) 60 (30%) 120
Không 140 140 280
Tổng số 200 200 400
Giới tính được gọi là biến số gây nhiễu (confounding variable) bởi vì nó có quan hệ của với
biến số cần quan tâm (tỷ suất mắc toàn bộ của kháng thể) và nhóm được so sánh (thành thị và
nông thôn). Nếu trong khi phân tích bỏ qua giới tính sẽ dẫn đến kết quả sai lệch. Do đó điều
quan trọng là phân tích nam riêng, nữ riêng. Áp dụng kiểm định chi bình phương cho sự khác
biệt giữa nông thôn và thành thị có ý nghĩa ở nam nhưng không có ý nghĩa ở nữ giới (Bảng
14.4). Kiểm định tổng kết (summary test) nhằm kết hợp hai mảng thông tin này được mô tả ở
dưới và phương pháp chuẩn hóa để điều chỉnh tỉ lệ toàn bộ để phản ánh sự khác biệt về giới
tính được trình bày ở Chương 15.
Trong trường hợp này, sự kết hợp số liệu của 2 giới tính sẽ che dấu sự khác biệt có thực.
Trong một số tình huống khác, sự kết hợp những nhóm số liệu khác nhau có thể cho thấy sự
khác biệt trong khi nó không tồn tại, thậm chí cho thấy sự khác biệt ngược với sự khác biệt có
thực. Một thí dụ khác là việc đánh giá xem người bị nhiễm schistosoma có tỉ suất tử vong cao
hơn người không bị nhiễm hay không. Trong trường hợp này cần phải tính đến tuổi bởi vì cả
nguy cơ chết và nguy cơ bị nhiễm schistosoma đều gia tăng với tuổi. Nếu không xét đến tuổi,
nhiễm schistosoma sẽ dường như sẽ có tỉ suất tử vong cao hơn, ngay cả khi nếu điều này
không xảy ra trong thực tế, bởi vì những người bị nhiễm schistosoma thường lớn tuổi hơn và
do đó có nhiều khả năng bị chết hơn so với những người trẻ không bị nhiễm schistosoma.
Kiểm định chi bình phương Mantel-Haenszel
Khi có biến số gây nhiễu, điều quan trọng là phải phân tích riêng biệt từng nhóm nhỏ các số
liệu thích hợp. Dù vậy, cũng cần áp dụng một kiểm định có thể kết hợp tất cả các chứng cứ từ
các nhóm riêng biệt nhưng có tính đến yếu tố gây nhiễu. Ðiều này đặc biệt đúng khi có sự
khác biệt nhưng không có ý nghĩa ở trong từng nhóm nhỏ, bởi vì có thể là do cỡ mẫu nhỏ.
Kiểm định chi bình phương Mantel Haenszel được dùng cho mục đích này khi số liệu chỉ
gồm vài bảng 2 × 2 . Tính ba giá trị sau đây từ mỗi bảng và lấy tổng trên các bảng (kí hiệu
được định nghĩa trong bảng 13.2):

76
BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

(i) giá trị quan sát a


(ii) giá trị kì vọng của a, Ea=eg/n và
(iii) phương sai của a, Va=efgh/[n2(n-1)]
Giá trị chi bình phương (có hiệu chỉnh tính liên tục) là:
(| Σa − ΣEa | −0,5) 2
χ MH
2
= , d. f . = 1
ΣVa

Lưu ý rằng nó chỉ có một độ tự do dù rằng nó tổng kết bao nhiêu bảng
Việc tính toán số liệu ở bảng 14.4 đươc trình bày trong bảng 14.5(a). Tổng số 60 người trong
vùng nông thôn có kháng thể chống lại Leptospira so với số kì vọng là 49,1, dựa trên giả định
không có sự khác biệt về tần suất mắc toàn bộ giữa nông thôn và thành thị. Giá trị χ2 Mantel-
Haenszel bằng 7,08 và có ý nghĩa ở mức 1%.

(| 60 − 49,1 | −0,5) 2 10,4 2


χ2 = = = 7,08 d . f . = 1, P < 0,01
15,2874 15,2874

Có vẻ kì lạ là dường như kiểm định chỉ dựa hoàn toàn vào giá trị quan sát và giá trị kì vọng
của a và không dựa vào các ô khác trong bảng. Dù vậy điều này không hẳn như vậy, bởi vì
một khi có được giá trị a có thể tính được giá trị b, c, d từ các tổng số trong bảng. Nếu kiểm
định Mantel-Haenszel được áp dụng cho bảng 2 × 2 thì giá trị χ2 thu được sẽ gần với nhưng
không chính xác bằng với giá trị χ2 chuẩn. Nó hơn nhỏ hơn và bằng (n-1)/n nhân với giá trị
chuẩn. Sự khác biệt này có thể bỏ qua cho n lớn hơn hoặc bằng 20, mà điều này cũng cần
thiết cho tính hợp lệ của kiểm định chi bình phương.
Bảng 14.5 Tính toán kiểm định χ2 Mantel-Haenszel, ứng dụng cho số liệu ở Bảng 14.4
(a) Kiểm định
Nhóm nhỏ a Ea Va
Nam 36 28,7 86 × 64 × 50 × 100/(1502 × 149) = 8,2088
Nữ 24 20,4 30 × 216 × 150 × 100/(2502 × 249) = 7,0786
Tổng số 60 49,1 15,2874
(b) Quy tắc 5 để kiểm tra tính hợp lệ
Nhóm nhỏ Tối thiểu của (e,g) g-f Tối đa của (0,g-f)
Nam 50 -14 0
Nữ 34 -66 0
Tổng số 84 0
Tính hợp lệ
Kiểm định χ2 Mantel-Haenszel chỉ là xấp xỉ. Ðộ đầy đủ của nó được đánh giá bằng quy tắc số
5 (rule of 5). Ta tính thêm hai giá trị sau cho mỗi bảng và lấy tổng của các bảng
(i) Tối thiểu của (e,g), đó là số nhỏ nhất của e và g
(ii) Tối đại của (0,g-f), bằng không nếu g nhỏ hơn hay bằng f, bằng g- f nếu g lớn hơn.
Cả hai tổng số phải khác giá trị kì vọng, Σ Ea, ít nhất là 5 để cho kiểm định hợp lệ. Chi tiết
của các tính toán này cho số liệu leptospira được trình bày ở bảng 14.5(b). Cả hai tổng số 84
và zero khác với 49,1 một số lớn hơn 5, do đó kiểm định χ2 Mantel-Haenszel có giá trị.

77
Căn bản thống kê y học -Ðỗ Văn Dũng

Kiểm định chi bình phương định hướng


Kiểm định chi bình phương chuản cho bảng 2 × c là một kiểm định tổng quát để đánh giá có
sự khác nhau trong c tỉ lệ haykhông. Khi các phạm trù trong một cột có các thứ tự tự nhiên thì
một kiểm định hợp lí sẽ là tìm xem có định hướng tăng hay giảm của những tỉ lệ theo cột hay
không. Thí dụ được đưa ra ở Bảng 14.6, cho thấy số liệu béo phì ở phụ nữ. Có thể thấy rằng tỉ
lệ phụ nữ dậy thì sớm có bề dầy lớp mỡ dưới da ở vùng cơ tam đầu tăng. Ðịnh hướng này có
thể được kiểmđ ịnh bằng kiểm định chi bình phương định hướng (chi squared test for trend),
có một độ tự do.
Bước đầu tiên tiên là gán các điểm (score) cho các cột để mô tả định hướng. Thông thường là
chọn số cột 1, 2, 3 v.v. Như ở đây (hay 0, 1, 2, 3 v.v.). Nó đại diện cho định hướng tăng (hay
giảm) đều từ cột này sang cột khác và thích hợp trong hầu hết các trường hợp. Một trả năng
khác là dùng bề dày lớp mỡ dưới da trung bình trong mỗi nhóm, phản ánh định hướng tuyến
tính với các giá trị tuyệt đối của bề dầy lớp mỡ dưới da. (Lưu ý rằng hiệu số giữa kiểm định
χ2 chuẩn và χ2 định hướng là giá trị χ2 với (c-2) độ tự do để kiểm định sự sai lệch khỏi định
hướng phù hợp (departures from the fitted trend).)
Bước tiếp theo là tính ba giá trị cho mỗi cột và cộng các kết quả.
Bảng 14.6 Quan hệ giữa bề dày lớp mỡ dưới da ở vùng cơ tam đầu và dậy thì sớm. Số liệu từ một
nghiên cứu béo phì ở phụ nữ - Beckles et al. (1985), International Journal of Obesity 9, 127-135.
Bề dày lớp mỡ dưới da vùng cơ tam đầu

Tuổi dậy thì Mỏng Trung bình Dày Tổng số


<12 tuổi 15(8,8%) 29(12,8%) 36(19,4%) 80
>=12 tuổi 156 197 150 503
Tổng số 171 226 186 583
Ðiểm (score) cho kiểm định 1 2 3
định hướng
(i) rx, tích số của r, ô trong hàng đầu tiên của cột và điểm x
(ii) nx, tích số của tổng số, n, của cột và điểm x
(iii) nx2, tích số của tổng số, n, của cột và bình phương của điểm, x2
Dùng N để kí hiệu tổng số chung và R là tổng hàng đầu tiên, công thức tính kiểm định chi
bình phương định hướng (có hiệu chỉnh tính liên tục) như sau:

(| A | −0,5) 2
χ coï2 hæåïng = , d. f . = 1
B
R R( N − R)
trong âoï A = Σ(rx) − Σ(nx) vaì B = 2 [ NΣ(nx 2 ) − (Σnx) 2 ]
N N ( N − 1)
Có những dạng kiểm định khác nhau nhưng hầu hết đều tương đương về mặt đại số. Sự khác
biệt duy nhất là một số dạng dùng (N-1) thay chỗ cho N trong khi tính toán B. Sự khác biệt
này không quan trọng. Kiểm định được chọn ở đây tương đối đơn giản và có thể mở rộng cho
một số bảng 2 × c . Trừ 0,5 ở hàng đầu tiên là hiệu chỉnh tính liên tục. Nếu điểm (score)
không phải là số cột thì phải loại bỏ chúng.
Việc tính toán cho số liệu ở Bảng 14.6 như sau

Σ (rx) = 15 × 1 + 29 × 2 + 36 × 3 = 181
Σ (nx)= 171 × 1 + 226 × 2 + 186 × 3 = 1181
Σ (nx2)= 171 × 1 + 226 × 4 + 186 × 9 = 2749

78
BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

R = 80; N = 583; N-R = 503


80
A = 181 − × 1181 = 18,9417
583
80 × 503
B= × (583 × 2749 − 11812 ) = 42,2927
583 × 582
2

(18,9417 − 0,5) 2
χ coï2 hæåïng = = 8,04 d . f . = 1, P < 0,005
42,2927
Do đó định hướng gia tăng tỉ lệ phụ nữ dậy thì sớm với sự gia tăng bề dày lớp mỡ dưới da cơ
tam đầu là có ý nghĩa cao (P<0,005)
Mở rộng cho một số bảng 2 × c
Khi số liệu có nhiều nhóm nhỏ mà không thể gộp lại bởi vì biến số gây nhiễu, phải tiến hành
cho mỗi nhóm một kiểm định định hướng. Dù vậy có kiểm định tổng kết kết hợp các chứng
cứ từ các kiểm định định hướng riêng biệt và có tính đến yếu tố gây nhiễu. Ðó là kiểm định
chi bình phương có một độ tự do, bất kể số nhóm nhỏ. A và B được tính cho mỗi bảng như đã
mô tả ở trên và được lấy tổng. Giá trị χ2 là:
(| Σ A | −0,5) 2
Toïm tàõt χ coï2 hæåïng = , d. f . = 1
ΣB

Kĩ thuật phức tạp hơn


Hai kĩ thuật phức tạp được nhắc nhở ngắn ở đây bởi vì chúng là những phương pháp mạnh
mẽ để phân tích tỉ lệ và bảng dự trù. Phương pháp đầu tiên là hồi quy logistic (logistic
regression), phương pháp để phân tích tỉ lệ tương tự như hồi quy bội đối với biến liên
tục. Phân tích một số bảng 2 × 2 (hay 2 × c ) được xem là trường hợp đặc biệt của phương
pháp này. Thí dụ, số liệu trong bảng 14.4 cho thấy tỉ suất mắc toàn bộ kháng thể leptospira
thay đổi theo hai yếu tố giới tính và khu vực. Hồi quy logistic tổng quát hơn phương pháp chi
bình phương mô tả ở trên bởi vì chúng cho phép bao gồm các biến liên tục và đánh giá sự
tương tác giữa các biến (xem chương 8). Hồi quy logistic được gọi là logistic bởi vì nó
nghiên cứu sự phụ thuộc của biến đổi logistic (logistic tranformation) của tỉ lệ theo theo một
số biến giải thích. Biến đổi logistic hay logit, được định nghĩa như sau:

 tè lãû 
Logit = loge  
1 - tè lãû 
Mô hình được cân chỉnh bằng kĩ thuật toán học gọi là độ khả dĩ cực đại (maximum
likelihood) và cũng tính đến yếu tố là sự biến thiên của tỉ lệ có phân phối nhị thức
Kĩ thuật thứ hai tương tự là sử dụng mô hình tuyến tính log (log linear model). Cả hai phương
pháp này có thể được tiến hành bằng cách sử dụng phần mềm GLIM (1978), mà trên của nó
là các chữ đầu của mô hình tương tác tuyến tính tổng quát hóa (Generalized Linear
Interactive Modelling). Một loạt các mô hình khác nhau được cân chỉnh giống như trong hồi
quy bội. Ý nghĩa của một biến được đánh giá bằng cách chân chỉnh hai mô hình: một có biến
số đó và một không. Kiểm định dựa trên sự khác biệt deviance (giống như tổng bình phương
phần dư, xem Chương 10) của hai mô hình. Sự khác biệt này có phân phối χ2 với số độ tự do
bằng số tham số thêm vào. Xem thêm chi tiết ở Anderson et al. (1980) hay xem cách tiếp cận
toán học ở Dobson (1984).
Có thể tìm thấy phần trình bày hồi quy logistic ở trong sách của Breslow và Day (1980) và
Schlesselman (1982). Mặc dù chúng là được viết trong bối cảnh một nghiên cứu bệnh chứng
(xem chương 24), phương pháp có thể áp dụng cho phân tích tỉ lệ. Những cuốn sách này cũng

79
Căn bản thống kê y học -Ðỗ Văn Dũng

trình bày hồi quy logistic có điều kiện (conditioned logistic regression). Ðây là loại hồi quy
logisitic thích hợp cho phân tích số liệu bắt cặp (matched data), có thể xem như là mở rộng
của kiểm định cặp đôi χ2 McNemar.

80
ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG


Giới thiệu
Ở chương này chúng ta quan tâm đến việc đo lường tử vong và bệnh tật và đặc biệt xem xét
đến việc sử dụng tỉ suất (rate). Tỉ suất tử vong hay bệnh tật là số người chết hay mắc bệnh
trong một khoảng thời gian nhất định chia cho tổng số người được quan sát để tìm biến cố đó.
Trước tiên sẽ trình bày những tỉ suất thường dùng. Sau đó sẽ xem xét các vấn đề về tính toán
và so sánh các tỉ suất trong các dân số nghiên cứu có cấu trúc tuổi giới tính khác nhau và mô
tả các kĩ thuật thống kê để chuẩn hóa tỉ suất. Cuối cùng sẽ tổng kết ngắn gọn phương pháp
phân tích

Tỉ suất sinh và chết


Tỉ suất sinh và chết của dân số được dựa trên các số thống kê thu thập được trong một năm
lịch. Ðể tiện lợi các tỉ suất này thường được nhân cho 1000 để tránh các số lẻ và được trình
bày chẳng hạn như số sinh cho mỗi 1000 thành viên dân số hàng năm. Các đo lường phổ biến
là:

Säú sinh trong nàm


1. Tè suáút sinh = ×1000
dán säú giæîa nàm
Säú sinh säúng trong nàm
2. Tè suáút màõn âeí = × 1000
dán säú phuû næî tæì 15 - 44 åí giæîa nàm

Säú chãút trong nàm


3. Tè suáút tæí vong thä = × 1000
dán säú giæîa nàm

Tè suáút tæí vong Säú chãút trong nàm trong mäüt nhoïm tuäøi (giåïi)
4. = × 1000
âàûc hiãûu theo tuäøi (giåïi) dán säú giæîa nàm cuía nhoïm tuäøi (giåïi) âoï
Säú chãút åí treí dæåïi 1 tuäøi xaíy ra trong nàm
5. Tè suáút tæí vong treí em = × 1000
säú sinh säúng trong nàm
Säú chãút åí treí dæåïi 28 ngaìy tuäøi xaíy ra trong nàm
6. Tè suáút tæí vong så sinh = × 1000
säú sinh säúng trong nàm
Tè suáút tæí vong Säú chãút tæí saín + chãút dæåïi 7 ngaìy tuäøi trong nàm
7. = × 1000
chu sinh säú sinh ( säúng + tæí saín) trong nàm
Tè suáút tæí vong Säú chãút do mäüt nguyãn nhán âàûc biãût trong nàm
8. = × 1000
âàûc hiãûu nguyãn nhán dán säú giæîa nàm
Tè suáút tæí vong Säú chãút do mäüt nguyãn nhán âàûc biãût trong nàm
9. = × 1000
tè lãû täøng säú chãút trong nàm
Säú chãút do mäüt nguyãn nhán âàûc biãût
10. tè suáút bãûnh - tæí vong = × 1000
täøng säú ca cuía bãûnh âoï

Lưu ý rằng mặc dù những số này được gọi là tỉ suất, trên thực tế chúng thuộc hai loại khác
nhau. Những số được đánh dấu sao (*), số 1, 2, 3, 4, 8, là những số thực sự là tỉ suất theo
nghĩa toán học đo lường các thuộc tính trong dân số thay đổi theo thời gian nhanh chậm thế
nào. Do đó tỉ suất sinh đo lường kích thước dân số được tăng do số sinh mới nhanh như thế

81
Căn bản thống kê y học -Ðỗ Văn Dũng

nào và tỉ suất tử vong thô đo lường sự giảm dân số do tử vong nhanh như thế nào. Các số khá,
được đánh dấu thập (†), số 5, 6, 7, 9, 10, là những số đúng hơn nên gọi là nguy cơ (risk) bởi
vì chúng là xác suất xuất hiện một biến cố nhất định. Do đó, tỉ suất ác tính đo lường nguy cơ
một người vì một bệnh nào đó khi mắc bệnh đó. Mặc dù sự phân biệt giữa nguy cơ và tỷ suất
đã được mô tả rõ ràng bởi William Farr trong đầu thế kỉ19, chỉ gần đây nó mới được chú ý
trở lại (Vandenbrouke 1985) và các thuật ngữ hiện đại vẫn còn lẫn lộn. Sự khác biệt sẽ được
thảo luận thêm trong chương về số đo mới mắc bệnh.
Lưu ý rằng người ta dùng một số phương pháp tính toán gián tiếp để đo lường nguy cơ. Thí
dụ, tỉ suất tử vong trẻ em là nguy cơ đứa trẻ chết trước kì sinh nhật đầu tiên của nó. Phương
pháp trực tiếp để đo lường là theo dõi một đoàn hệ các trẻ mới sinh và ghi nhận tỉ lệ trẻ trong
đoàn hệ chết trước khi kì sinh nhật thứ nhát của nó. Dù vậy, để tiện lợi, tỉ suất tử vong trẻ em
được ước tính bằng tỷ số chết dưới một năm tuổi và số sinh sống trong một năm. Do đó tử số
sẽ gồm một số chết trong những đứa trẻ được sinh trong năm trước và như thế cũng bỏ qua
một số tử vong trong số trẻ đã sinh trong năm mà không được theo dõi tới năm sau. Trong
một dân số ổn định người ta giả sử rằng hai yếu tố này sẽ triệt tiêu lẫn nhau. Một quan điểm
tương tự sẽ được áp dụng để ước tính tỉ suất tử vong sơ sinh và tỉ suất tử vong chu sinh.

Ðo lường tử vong trong một nghiên cứu


Ðịnh nghĩa tỉ suất tử vong được trình bày ở trên dựa trên số chết xảy ra trong một năm lịch
chia cho dân số giữa năm. Dù vậy trong một nghiên cứu, không những tử vong được ghi nhận
trong một giai đoạn bất kì (chứ không phải một năm) mà các cá nhân còn có thể được theo
dõi trong những khoảng thời gian khác nhau do những lí do khác nhau. Những lí do này bao
gồm sự chiêu mộ dần dần các đối tượng nghiên cứu để trải đều công việc theo thời gian, sự
chiêu mộ các trẻ mới sinh hay các case bệnh mới khi chúng xuất hiện, sự chiêu mộ các người
dân mới nhập cư vào khu vực và không theo dõi được do họ di cư khỏi khu vực, không còn
muốn tham gia hay chết. Do đó, số tử vong quan sát được liên quan với số người năm quan
sát (person-years of observation), chứ không phải với dân số giữa năm. Lưu ý rằng một
người năm quan sát có thể là một người được quan sát trong trọn một năm hay 12 người được
quan sát trong một tháng

Säú chãút trong nàm


Tè suáút tæí vong thä = × 1000
ngæåìi - nàm quan saït
Tỉ suất tử vong thường được nhân với 1000 và kết quả được tính theo 100 người năm theo
dõi. Khi báo cáo tỉ suất cần phân biệt rõ giữa môi 1000 người mỗi năm , có nghĩa là theo dõi
trong cùng một khoảng thời gian và mỗi 1000 người-năm.
Xét một tình huống phổ biến khi tử vong được ghi nhận bằng cuộc điều tra cộng đồng hai lần
và đếm số người chết trong khoảng giữa. Một người có mặt ở cả hai cuộc điều tra sẽ tham gia
tổng số người năm quan sát. Một người chết hay di chuyển trong giai đoạn đó tham gia một
số năm bằng số năm giữa lần khám thứ nhất và ngày chết hay ngày rời khỏi, trong khi đó một
người sinh ra hay di chuyển vào cộng đồng giữa hai cuộc điều tra góp vào một số năm bằng
số năm giữa ngày sinh hay ngày gia nhập cộng đồng và cuộc điều tra thứ hai. Nếu không thể
xác định chính xác ngày chết hay ngày rời khỏi, người ta thường giả sử rằng sự kiện đó xảy ra
ở giữa hai cuộc điều tra.

Ðo lường tử vong
Có hai phương pháp chính để đo lường sự mắc bệnh của cộng đồng. Số mới mắc (incidence)
là số các trường hợp bệnh mới trong một giai đoạn thời gian nhất định so với số người có
nguy cơ (persons at risk) mắc bệnh đó; trong khi mắc toàn bộ (prevalence) dựa trên tổng số
các trường hợp bệnh hiện có trong toàn dân số. Ðộ lớn của mắc toàn bộ phụ thuộc vào độ lớn

82
ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

của mắc toàn bộ và khoảng thời gian mắc bệnh; đối với mới mắc cố định, mắc toàn bộ sẽ lớn
hơn đối với bệnh kéo dài trong nhiều năm so với bệnh chỉ kéo dài trong vài ngày.
Số mắc toàn bộ
Số mắc toàn bộ có thể đo lường ở một thời điểm (mắc toàn bộ thời điểm - point prevalence)
hay trong một khoảng thời gian (số mắc toàn bộ thời khoảng - period prevalence). Nó thường
được tính theo phần trăm hay nếu nhỏ theo phần ngàn của dân số

Säú ngæåìi coï bãûnh


taûi mäüt thåìi âiãøm
1. Tè suáút hiãûn màõc (thåìi âiãøm) =
toaìn bäü dán säú
Säú ngæåìi coï bãûnh åí mäüt thåìi gian naìo âoï
trong thåìi khoaíng cho træåïc
2. Tè suáút hiãûn màõc (thåìi khoaíng) =
toaìn bäü dán säú åí giæîa thåìi khoaíng

Số mắc toàn bộ thời điểm phổ biến hơn và hữu ích hơn và thường được gọi đơn giản là mắc
toàn bộ
Số mới mắc
Có hai cách khác nhau để định nghĩa mới mắc; nó có thể được đo lường như một nguy cơ hay
như một tỉ suất. Nguy cơ mới mắc (incidence risk) là xác suất một người lúc đầu không mắc
bệnh sau đó có bệnh ở một thời gian nào đó trong khoảng thời gian quan sát. Nó thường được
tính bằng phần trăm và nếu nhỏ bằng phần ngàn người. Mặt khác tỉ suất mới mắc (incidence
rate) là tốc độ mắc bệnh trong số những người vẫn còn nguy cơ (khi một người mắc bệnh họ
không còn nguy cơ). Số case mới không phụ thuộc vào số người nguy cơ lúc đầu mà với số
người nguy cơ trung bình trong thời kì đó, nhân với chiều dài của thời kì, tương đương với số
người năm nguy cơ (person-years at risk) trong thời kì. Ðối với bệnh phổ biến, như là tiêu
chảy, có thể tấn công nhiều lần, tỉ suất mới mắc đo lường số lần mắc cho mỗi người cho mỗi
năm.

Säú træåìng håüp bãûnh måïi


trong mäüt khoaíng thåìi gian nháút âënh
1. Nguy cå måïi màõc =
toaìn bäü dán säú
Säú træåìng håüp bãûnh måïi
trong mäüt khoaíng thåìi gian nháút âënh
2. Tè suáút måïi màõc =
säú ngæåìi nàm nguy cå trong suäút thåìi khoaíng
(nguy cå trung bçnh × khoaíng thåìi gian)
Người năm nguy cơ được tính tương tự như cách tính người năm quan sát. Sự khác biệt duy
nhất là đối với bệnh có thể xảy ra nhiều lần, một người tham gia vào tổng số thời gian không
mắc bệnh trong nghiên cứu, chứ không phải chỉ thời gian từ lúc bắt đầu nghiên cứu tới lần
mắc bệnh đầu tiên
Ðối với bệnh hiếm như ung thư, hai mới mắc này giống nhau về cơ bản, bởi vì số người nguy
cơ sẽ gần bằng với tổng dân số ở mọi lúc. Vì lí do này, chúng thường không phân biệt rõ
ràng. Dù vậy, đối với bệnh phổ biến nguy cơ và tỉ suất mới mắc khác nhau.
Thí dụ, xét bệnh sởi trong năm tuổi thứ hai ở một nước mà ít có tiêm chủng sởi. Giả sử rằng
theo dõi 1000 trẻ trước đây chưa bị nhiễm sởi từ sau sinh nhật lần thứ nhất của nó trong vòng
một năm và có 140 trẻ bị sởi và 860 trẻ vẫn còn có nguy cơ ở cuối năm. Nguy cơ mới mắc là

83
Căn bản thống kê y học -Ðỗ Văn Dũng

xác suất trẻ không mắc bệnh sởi trong năm đầu tiên mắc bệnh trong năm thứ hai và bằng
140/1000 = 0,1400 hay 14,0%. Mặt khác tỉ suất nguy cơ là tỉ suất (tốc độ) mắc bệnh sởi trong
năm thứ hai. Nếu chúng ta giả sử rằng số trường hợp mắc sởi trải đều trong năm, số nguy cơ
trung bình sẽ bằng trung bình cộng ở lúc đầu năm và cuối năm bằng (1000 + 860)/2 = 930. Tỉ
suất nguy cơ bằng 140/930 = 0,1505 hay 150,5 trên 1000 trẻ-năm nguy cơ (child-years at
risk)
Nguy cơ tương đối
Ðôi khi người ta tóm tắt sự so sánh hai mới mắc bằng tỉ số của chúng chứ không phải bằng
hiệu số của chúng. Thí dụ, con người hút thuốc lá có nguy cơ mắc suyễn gấp 3 lần con những
người không hút. Tỉ số này được gọi là nguy cơ tương đối (relative risk) và được nói rõ trong
chương 24.

Tỉ suất chuẩn hóa


Bởi vì cả nguy cơ chết và nguy cơ mắc bệnh liên quan đến tuổi, và bởi vì chúng khác nhau
tùy theo giới tính, tỉ suất tử vong thô và tỉ suất mới mắc và mắc toàn bộ chung phụ thuộc vào
cấu trúc tuổi giới tính của dân số. Thí dụ, một dân số tương đối già sẽ có tỉ suất tử vong thô
cao hơn dân số trẻ, ngay cả khi tử vong là như nhau. Do đó sẽ sai lầm nếu dùng tỉ suất chung
khi so sánh hai dân số khác nhau trừ khi chúng có cùng một cấu trúc tuổi giới tính. Thay vì
vậy cần dựa trên tỉ suất đặc hiệu tuổi giới tính và kiểm định chung sự khác biệt bằng kiểm
định χ2 Mantel-Haenszel áp dụng cho từng nhóm tuổi giới tính (xem Chương 14).
Dù vậy cũng cần có tỉ suất chung tổng kết đã điều chỉnh cho sự khác biệt tuổi giới tính. Có
thể đạt được điều này nhờ việc sử dụng một dân số chuẩn (standard population) với phương
pháp chuẩn hóa (standardization) trực tiếp hay gián tiếp. Trong phương pháp chuẩn hóa trực
tiếp (direct method), tỉ suất đặc hiệu tuổi giới tính từ mỗi dân số nghiên cứu đươc áp dụng
cho một dân số chuản để có tỉ suất tử vong được điều chỉnh theo tuổi giới tính (age-sex
adjusted mortality rate), trong phương pháp gián tiếp (indirect method) tỉ suất đặc hiệu tuổi
giới tính của dân số chuẩn được áp dụng cho mỗi dân số quan tâm để có tỉ số tử vong chuẩn
hóa (standardized mortality ratio). Tỉ số này có thể dùng để tính tỉ suất điều chỉnh. So sánh
được trình bày trong bảng 15.1 cho thấy hai phương pháp đòi hỏi những số liệu khác nhau.
Việc chọn lựa phương pháp phụ thuộc vào số liệu có sẵn và sự chính xác của chúng. Thí dụ,
trong khi so sánh tỉ suất tử vong của các quốc gia khác nhau, phương pháp gián tiếp hay hơn
bởơi vì rất khó có được số liệu quốc gia về tỉ suất tử vong đặc hiệu tuổi giới tính. Nói chung,
chuẩn hóa gián tiếp thường được dùng phổ biến cho tử vong là số mới mắc trong khi chuẩn
hóa gián tiếp dùng cho mắc toàn bộ.

Bảng 15.1 So sánh phương pháp chuẩn hóa trực tiếp và gián tiếp

Chuẩn hóa trực tiếp Chuẩn hóa gián tiếp


Số liệu cần thiết
Dân số nghiên cứu tỉ suất đặc hiệu tuổi giới tính cấu trúc dân số + tỉ suất chung
Dân số chuẩn cấu trúc dân số tỉ suất đặc hiệu tuổi giới tính + tỉ suất
chung
Phương pháp tỉ suất nghiên cứu đươc áp dụng vào tỉ suất chuẩn được áp dụng vào dân
dân số chuẩn số nghiên cứu
Kết quả tỉ suất điều chỉnh tuổi giới tính tỉ suất tử vong chuẩn hóa (+ tỉ suất
điều chỉnh giới tính)

Cả hai phương pháp có thể được mở rộng để điều chỉnh các yếu tố khác ngoài tuổi và giới
tính, như cấu trúc chủng tộc trong các nhóm nghiên cứu. Phương pháp trực tiếp có thể dùng

84
ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

để tính trung bình chuẩn hóa (standardized mean) như huyết áp trung bình được điều chỉnh
theo tuổi giới tính cho các nhóm nghề nghiệp khác nhau.
Chuẩn hóa trực tiếp
Bảng 15.2 trình bày tỉ suất mắc toàn bộ đặc hiệu và tỉ suất mắc toàn bộ chung thô của bệnh
nhiễm onchocerca trong hai làng A và B. Lưu ý rằng tỉ suất mắc toàn bộ của onchocerca gia
tăng theo tuổi và cao ở nam hơn ở nữ và cấu trúc tuổi giới tính của các mẫu từ 2 làng khác
nhau. Tỉ suất mắc toàn bộ chung phải được điều chỉnh theo tuổi giới tính trước khi chúng
được so sánh. Ðiều này có thể tiến hành bằng phương pháp chuẩn hóa trực tiếp.
Trước tiên, cần phải xác định dân số chuẩn. Thường theo một trong các cách sau: hoặc là một
dân số nghiên cứu, hay tổng số hai dân số nghiên cứu (ở dưới sẽ làm theo cách này) và dân số
điều tra từ địa phương hay quốc gia. Việc chọn lựa này có phần nào tùy tiện. Dù vậy cần lưu
ý rằng mặc dù những lựa chọn khác nhau sẽ cho các tỉ suất tổng kết khác nhau nhưng điều
này ít ảnh hưởng đến việc lí giải kết quả.
Bảng 15.2 Sử dụng chuẩn hóa trực tiếp để so sánh tỉ suất mắc toàn bộ của onchocerca trong hai làng A
và B. Dân số chung của hai làng được dùng làm dân số chuẩn.

Làng A Làng B Dân số chuẩn


(làng A + B)
Tuổi Số được số bị % Số được số bị % Số được Làng Làng
khám nhiễm nhiễm khám nhiễm nhiễm khám A B
Nam
0-4 36 2 5,6 14 1 7,1 50 2,8 3,6
5-9 42 4 9,5 28 4 14,3 70 6,7 10,0
10-14 12 3 25,0 10 9 90,0 22 5,5 19,8
15-29 6 4 66,7 11 11 10,0 16 10,7 16,0
30-49 11 9 81,8 11 11 100,0 22 18,0 22,0
50+ 21 17 81,0 8 8 100,0 29 23,5 29,0
Nữ
0-4 35 1 2,9 17 1 5,9 52 1,5 3,1
5-9 52 4 7,7 15 2 13,3 67 5,2 8,9
10-14 15 3 20,0 9 4 44,4 24 4,8 10,7
15-29 24 14 58,3 12 11 91,7 36 21,0 33,0
30-49 25 19 76,0 17 17 100,0 42 31,9 42,0
50+ 8 6 75,0 7 7 100,0 15 11,3 15,0
Tổng 287 86 30,0 158 85 53,8 445 142,9 213,1
số
Tỉ suất mắc toàn bộ điều chỉnh tuổi giới tính 32,1 47,9

Thứ nhì, sẽ tính toán số người trong dân số chuẩn hóa bị nhiễm bệnh nếu tỉ suất mắc toàn bộ
đặc hiệu tuổi giới tính sẽ giống như trong làng A. Thí dụ, xét phái nam tuổi từ 0-4 tuổi. Hai
trong 36 người trong nhóm tuổi này bị nhiễm bệnh ở làng A vì vậy tỉ suất mắc toàn bộ là
5,6%. Có 50 phái nam thuộc lứa tuổi này trong dân số chuẩn và nếu tỉ suất mắc toàn bộ cũng
là 5,6% thì có nghĩa là 5,6% × 50 = 2,8 người trong số đó bị nhiễm bệnh. Các số khác trong
các nhóm tuổi giới tính khác được trình bày trong Bảng 15.2. Nói chung sẽ có 142,9 trong
445 người bị nhiễm onchocerca trong dân số chuẩn, tính ra tỉ suất mắc toàn bộ chung là
32,1% (142,9/445 × 100). Số này được gọi là tỉ suất mắc toàn bộ điều chỉnh tuổi giới tính của
làng A.

85
Căn bản thống kê y học -Ðỗ Văn Dũng

Toaìn bäü tè suáút hiãûn màõc trong dán säú chuáøn


Tè suáút hiãûn màõc nãúu tè suáút hiãûn màõc âàûc hiãûu tuäøi giåïi û
=
âiãöu chènh theo tuäøi - giåïi tæång tæ nhæ tè suáút hiãûn màõc
âàûc hiãûu cuía dán säú quan tám
Tỉ suất mắc toàn bộ điều chỉnh theo tuổi-giới tính cho làng B cũng được tính tương tự. Nó
bằng 47,9% cao hơn đáng kể so với làng A. Kiểm định χ2 Mantel-Haenszel so sánh tỉ suất
mắc toàn bộ giữa hai làng này có ý nghĩa (χ2=21,7; d.f.=1; P<0,001).
Chuẩn hóa gián tiếp
Bảng 15.3 trình bày kết quả của một cuộc nghiên cứu lớn trong một vùng lưu hành
onchocerca, trong đó có 12816 người từ trên 30 tuổi được theo dõi trong 1 năm. Một điểm
cần quan tâm là đánh giá xem có phải mù lòa, hậu quả của nhiễm onchocerca, dẫn đêm nguy
cơ tử vong gia tăng hay không. Ðiều quan trọng là xem xét các tỉ suất tử vong tuổi giới tính
riêng bởi vì tử vong gia tăng theo tuổi và khác nhu giữa giới tính mà còn bởi vì mắc toàn bộ
của mù lòa gia tăng theo tuổi và cao ở nam hơn ở nữ. Dân số bị mù do đó dẽ già hơn và có tỉ
lệ nam cao hơn và như vậy tỉ suất chết thô sẽ cao hơn so với dân số không mù ngay cả khi tỉ
suất đặc hiệu tuổi giới tính giống nhau. So sánh chung giữa người mù và không mù phải dùng
phương pháp chuẩn hóa gián tiếp.
Giống như trong chuẩn hóa trực tiếp, bước đầu tiên là xác định dân số chuẩn. Việc lựa chọn
cũng giống như trên nhưng có hạn chế là cần tỉ suất tử vong đặc hiệu tuổi giới tính cho dân số
chuẩn và do đó dân số được chọn cho mục đích này phải đủ lớn để có ước lượng tin cậy của
những tỉ suất này.
Những tỉ suất chuẩn sau đó được áp dụng cho dân số quan tâm để tính số tử vong kì vọng
trong dân số nếu tử vong giống như trong dân số chuẩn. Thí dụ, người ta kì vọng tỉ lệ 19/2400
của 120 người mù tuổi từ 30 đến 39 sẽ bị chết nếu nguy cơ chết giống như những người đàn
ông không mù cùng tuổi. Tính chung, có 22,55 tử vong kì vong trong dân số nười mù so với
số quan sát là 69. Tk số giữa số tử vong quan sát và số tử vong kì vọng được gọi là tỉ số tử
vong chuẩn hóa (standardize mortality ratio - SMR). Trong trường hợp này nó bằng 3,1
(69/22,55).

Tè säú tæí vong chuáøn hoïa säú chãút quan saït âæåüc
=
(SMR) Säú chãút kç voüng nãúu tè suáút âàûc hiãûu tuäøi giåïi
tæång tæû nhæ trong dán säú chuáøn

SMR đánh giá một người trong dân số nghiên cứu so với một người trong dân số chuẩn dễ
chết hơn (hay ít hơn) mấy lần. Giá trị bằng 1 có nghĩa là khả năng chết bằng nhau, giá trị lớn
hơn một có nghĩa là dễ chết hơn, nhỏ hơn một nghĩa là khó chết hơn. SMR đôi khi được nhân
cho 100 và tính bằng phần trăm.
Bởi vì dân số không bị mù được dùng làm chuẩn, số kì vọng và số quan sát của nó bằng nhau
do đó SMR = 1. So sánh hai SMR cho thấy nhìn chung, người mù dễ bị chết gấp 3,1 lần so
với người không bị mù trong khoảng thời gian một năm. Kiểm định χ2 Mantel-Hanenzel có ý
nghĩa cao (χ2=55,7, độ tự do = 1, P <0,001).

86
ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

Bảng 15.3 Sử dụng chuẩn hóa gián tiếp để so sánh tỉ suất tử von giữa người mù và người không mù,
được thu thấp trong một cuộc nghiên cứu một năm trong vùng lưu hành onchocerca. Tỉ suất tử vong của
dân số không bị mù được dùng làm tỉ suất chuẩn

dân số dân số Số chết kì


không mù mù vọng trong
dân số
người mù
nếu tỉ suất
Tuổi Số theo Số chết Chết/100 Số theo phần trăm Số chết Chết/10 giống như
dõi 0/năm dõi bị mù 00/nàm trong dân
số không
bị mù
Nam
30-39 2400 19 7,9 120 4,8 3 25,0 0,95
40-49 1590 21 13,2 171 9,7 7 40,9 2,26
50-59 1120 20 17,9 244 17,9 13 53,3 4,36
60+ 610 20 32,8 237 28,0 24 101,3 7,77
Nữ
30-39 3100 23 7,4 84 2,6 2 23,8 0,62
40-49 1610 22 13,7 69 4,1 3 43,5 0,94
50-59 930 16 17,2 198 15,3 8 47,6 2,89
60+ 270 8 29,6 93 25,6 9 96,8 2,76
Tổng số 11630 149 12,8 1196 9,3 69 58,2 22,55
SMR 1,0 3,1(69/22,5)
Tỉ suất tử vong điều chỉnh tuổi giới 12,8 39,7(3,1× 12,8)
tính

Tỉ suất tử vong được điều chỉnh theo tuổi giới tính có thể tính được bằng cách nhân SMR
cho tỉ suất tử vong thô của dân số chuẩn. Tính ra được tỉ suất tử vong điều chỉnh tuổi giới
tính là 12,8 và 39,7/1000/năm cho dân số không bị mù và dân số bị mù

Tè suáút tæí vong tè suáút tæí vong thä


= SMR ×
âiãöu chènh tuäøi giåïi tênh dán säú chuáøn.

Phân tích tỉ suất


Phương pháp được mô tả ở Chương 12, 13 và 14 liên quan đến tỉ lệ được áp dụng cho phân
tích tỉ suất mắc toàn bộ, tử vong và mới mắc nguy cơ bởi vì chúng là các tỉ lệ. Những phương
pháp này có thể được áp dụng cho phân tích những tử vong và mới mắc nguy cơ, khi số
trường hợp tử vong (hay trường hợp bệnh mới) nhỏ so với số người nguy cơ trung bình, bởi
vì trong trường hợp này tỉ suất thường được xem như là tỉ lệ. Một cách khác tỉ suất tử vong
và mới mắc có thể được phân tích nhờ phân phối Poisson, được mô tả ở Chương 17 và mô
hình tuyến tính log được nhắc đến ở Chương 14, với điều kiện mỗi trường hợp xảy ra độc lập
với nhau và ngẫu nhiên về thời gian.

87
Căn bản thống kê y học -Ðỗ Văn Dũng

PHÂN TÍCH SỐNG CÒN


Giới thiệu
Trong Chương 15 chúng ta đã xem xét cách tính và phân tích tỉ lệ tử vong. Trong chương này
chúng ta sẽ mô tả các phương pháp phân tích sống còn, chú trong không chỉ vào sự kiện
người đó có chết hay không mà còn vào thời gian sống còn (survival time) trước khi chết.
Phương pháp phân tích sống còn có thể được áp dụng cho các biến cố như nghiên cứu thời
gian bú sữa trong đó sự kiện kết thúc có thể là việc cai sữa.

Bảng sống
Mô thức sống còn của cộng đồng thường được mô tả trong bảng sống (life table). Bảng sống
có 2 dạng. Dạng thứ nhất, bảng sống đoàn hệ (cohort life table). Trình bày thời gian sống còn
của một nhóm cá nhân thực sự theo thời gian. Ðiểm khởi phát để đo thời gian sống còn có thể
là lúc sinh hay có thể là biến cố khác. Thí dụ, một bảng sống đoàn hệ có thể dùng thể trình
bày tử vong của một nhóm nghề nghiệp tùy theo khoảng thời gian trong nghề, hay mô thức
sống còn của bệnh nhân sau điều trị, thí dụ như sau khi điều trị, như xạ trị ung thư phế quản
tế bào nhỏ (Bảng 16.1). Loại bảng sống thứ nhì, bảng sống hiện hành (current life table)
thương được dùng trong mục đích bảo hiểm và ít phổ biến trong nghiên cứu y khoa. Bảng này
trình bày thời gian sống còn kì vọng theo thời gian của một dân số giả thuyết được áp dụng tỉ
suất tử vong đặc hiệu tuổi giới tính hiện nay.
Việc xây dựng bảng sống được mô tả nhờ xem xét bảng 16.1, trình bày thời gian sống còn
bệnh nhân bị ung thư phế quản tế bào nhỏ, từng tháng một sau khi xạ trị. Bảng này dựa trên
số liệu thu thập trong giai đoạn 5 năm. Số liệu được tóm tắt trong cột 1-4 của bảng sống, và
các giá trị tính toán ở trong cột 5-8.
Cột 1 trình bày số tháng từ khi bắt đầu xạ trị. Cột 2 và 3 gồm số bệnh nhân còn sống ở đầu
tháng và số người chết trong tháng. Thí dụ, 12 trong 240 bệnh nhân chết trong tháng thứ nhất
sau khi điều trị, còn lại 228 người còn sống ở đầu tháng thứ hai.
Trong nghiên cứu loại này rất hiếm khi có thể theo dõi tất cả các bệnh nhân cho đến khi họ
chết. Thứ nhất là do một số bệnh nhân có thể đi ra khỏi vùng nghiên cứu hay quyết định
không còn tham gia. Ðiều này là một vấn đề quan trọng đối với một nghiên cứu theo dõi kéo
dài. Thứ nhì bởi vì bệnh nhân thườn tham gia dần dần vào nghiên cứu, những người tham gia
ở cuối thời gian nghiên cứu sẽ chỉ được theo dõi trong thời gian ngắn. Vì vậy trừ khi họ chết
sớm, họ cũng thường không được theo dõi đủ. Do đó có những bệnh nhân sống tới một thời
điểm nào đó nhưng tình trạng sống còn sau đó không rõ. Thời gian sống còn của họ gọi là
được kiểm duyệt (censored). Những bệnh nhân đó được trình bày trong cột 4. Tổng số người
nguy cơ bị chết trong tháng, sau khi đã được điều chỉnh cho sự thất lạc, được trình bày ở cột
5. Nó bằng với số bệnh nhân sống ở đầu tháng, trừ cho phân nửa số bị thất lạc, giả thiết rằng
trung bình những sự thất lạc này xảy ra ở giữa tháng.

88
PHÂN TÍCH SỐNG CÒN

Bảng 16.1 Bảng sống trình bày kiểu hình sống còn của 240 bệnh nhân bị ung thư phế quản tế bào nhỏ
được xạ trị

(1) Thời (2) Số còn (3) Số chết (4) Số (5) Số (6) nguy cơ (7) Cơ hội (8) Cơ hội
khoảng từ sống ở đầu trong thời không theo người nguy chết trong sống còn sống còn
khi bắt đầu thời khoảng dõi được cơ = (2) - thời trong thời lũy tích từ
điều trị khoảng trong thời (4)/2 khoảng khoảng đầu trị liệu
khoảng = (8,
1 240 12 0 240,0 0,0500 0,9500 0,9500
2 228 9 0 228,0 0,0395 0,9605 0,9125
3 219 17 1 218,5 0,0778 0,9222 0,8415
4 201 36 4 199,0 0,1809 0,8191 0,6893
5 161 6 2 160,0 0,0375 0,9625 0,6634
6 153 18 7 149,5 0,1204 0,8796 0,5835
7 128 13 5 125,5 0,1036 0,8986 0,5231
8 110 11 3 108,5 0,1014 0,8519 0,4700
9 96 14 3 94,5 0,1481 0,8986 0,4004
10 79 13 0 79,0 0,1646 0,8354 0,3345
11 66 15 4 64,0 0,2344 0,7656 0,2561
12 47 6 1 46,5 0,1290 0,8710 0,2231
13 40 6 0 40,0 0,1500 0,8500 0,1896
14 34 4 2 33,0 0,1212 0,8788 0,1666
15 28 5 0 28,0 0,1786 0,8214 0,1369
16 23 7 1 22,5 0,3111 0,6889 0,0943
17 15 12 0 15,0 0,8000 0,2000 0,0189
18 3 3 0 3,0 1,0000 0,0000 0,0000
Cột 6 trình bày nguy cơ tử vong trong tháng, được tính bằng số chết trong tháng chia cho số
người nguy cơ. Cột 7 là cơ hội sống còn trong tháng, cột 8 là cơ hội sống còn chung (overall)
hay tích lũy (cumulative), bằng cơ hội sống còn tính tới cuối tháng trước nhân với cơ hội
sống còn trong tháng. Thí dụ, nguy cơ tử vong trong tháng thứ nhất là 12/240 hay 0,0500. Cơ
hội sống còn do đó bằng 1 trừ 0,05 bằng 0,95. Trong tháng thứ hai 9 trong số 228 người còn
lại bị chết tính ra nguy cơ tử vong là 0,0395 và cơ hội sống còn là 0,9605. Ðiều này có nghĩa
là bệnh nhân đã sống tới tháng thứ nhất (với xác suất 0,9500) thì có cơ hội sống còn trong
tháng thứ hai là 0,9605. Cơ hội sống còn chung hai tháng sau khi bắt đầu trị liệu là 0,9500 ×
0,9605 = 0,9125.
Ðường cong sống còn
Trong nghiên cứu này tất cả những bệnh nhân chết sau 18 tháng. Ðường cong sống còn vẽ từ
các giá trị trong cột 8 được vẽ trong Hình 6.1.
Kì vọng sống
Thời gian sống còn trung bình hay kì vọng sống (life expectancy) cũng đáng được quan tâm.
Có thể tính bằng cách dùng cột 1 và 8 của bảng sống. Trong mỗi thời khoảng, thời gian sống
được nhân với cơ hội sống còn lũy tích. Tổng các giá trị này cộng thêm 1/2 là kì vọng sống.
(cộng vào 1/2 là do tác động của việc phân nhóm bảng sống theo nguyên tháng và tương tự
như hiệu chỉnh tính liên tục mà chúng ta đã gặp trong những chương trước).

1  Säú thaïng trong cå häüi säúng coìn 


Kç voüng säúng = + Σ × 

2  mäù i thåì i khoaí n g luî y têch 
Trong bảng 16.1 tất cả các khoảng là một tháng và do đó kì vọng sống là tổng các giá trị
trong cột 8 cộng với 1/2 bằng 7,95 tháng.

89
Căn bản thống kê y học -Ðỗ Văn Dũng

1,0

0,8

0,6

0,4

0,2

0,0
0 3 6 9 12 15 18

Hình 16.1 Ðường con sống còn cho bệnh nhân bị ung thư phế quản tế bào nhỏ được điều trị bằng xạ trị.
Ðường cong được vẽ từ bảng sống, bảng 16.1.

So sánh các bảng sống


Bước đầu tiên so sánh hai bảng sống bất kì là vẽ hai đường cong sống còn tương ứng và so
sánh chúng bằng mắt. Ý nghĩa thống kê của sự khác biệt quan sát được đánh giá bằng kiểm
định log rank. Ðây là một ứng dụng đặc biệt của thao tác χ2 Mantel Haenszel được tiến hành
bằng cách xây dựng bảng 2 × 2 cho mỗi khoảng của bảng sống, để so sánh các tỉ lệ chết trong
mỗi khoảng. Thí dụ, nếu bảng 16.1 cho thấy đường cong sống còn sau khi xạ trị ung thư phế
quản tế bào nhỏ được so sánh với đường cong sống còn sau khi hóa trị, thủ tục này sẽ tạo ra
18 bảng 2 × 2 , mỗi bảng cho một tháng sau khi điều trị. Ứng dụng kiểm định χ2 Mantel
Hanszel cho những bảng này sẽ tổng kết sự khác biệt hàng tháng giữa số chết quan sát được
sau khi xạ trị và số kì vọng nếu mô thức sống còn sau khi xạ trị giống như sau khi xạ trị.
Kiểm định log rank có thể mở rộng để điều chỉnh cơ cấu khác nhau của nhóm điều trị, như tỉ
số giới tính khác nhau hay phân phối tuổi khác nhau. thí dụ, giới tính sẽ được tính đến trong
thí dụ này bằng cách xây dựng bảng 2 × 2 cho nam và nữ cho mỗi khoảng của bảng sống, và
áp dụng kiểm định χ2 Mantel Haenszel cho 36 (2 × 18) bảng. Ðể biết thêm chi tiết, xem bài
báo của Peto et al (1976, 1977), hướng dẫn thực hành cho việc phân tích số liệu sống còn.
Một phương pháp khác, tinh vi hơn, để so sánh đường cong sống còn là dùng mô hình nguy
cơ tỉ lệ của Cox (Cox's proprotional model), một phương pháp giống như hồi quy bội cho
số trung bình và hồi quy logistic cho tỉ lệ. Nó được gọi là mô hình nguy cơ bởi vì nó giả định
rằng tỉ lệ của nguy cơ chết trong hai nhóm hằng định theo thời gian, và tỉ lệ này giống nhau
cho mỗi nhóm số liệu nhỏ, như các nhóm tuổi- giới tính khác nhau. Xem chi tiết ở Cox và
Oakes (1984).

0 t

(a) Nguy cơ tử vong = hằng số, λ

90
PHÂN TÍCH SỐNG CÒN

0 t

(b) Ðường cong sống còn: tỉ lệ sống còn = e-λt

0 t

(c) Phân phối của thời gian sống con = λe-λt thời gian sống trung bình = 1/λ
Hình 16.2 Mô hình mũ: nguy cơ chết theo thời gian (t) hằng định

Mô thức sống còn


Xem cột 6 của bảng 16.1 cho thấy rõ nguy cơ tử vong của ung thư tế bào nhỏ gia tăng với
thời gian sau khi xạ trị. Người ta đã quan tâm nhiều đến việc tìm kiếm các hàm số toán học
mô tả sự liên quan giữa nguy cơ chết (hay còn gọi là tỉ suất nguy hại - hazard rate) theo
thời gian. Mô hình đơn giản nhất và nổi tiếng nhất là mô hình mũ (exponential), trong đó
nguy cơ chết hằng định theo thời gian. Có thể chứng mình rằng nếu một dân số bị một nguy
cơ chết hằng định, không những đường còn sẽ có dạng mũ như hình 16.2 mà phân phối của
thời gian sống còn cũng có dạng hình mũ với kì vọng sống bằng nghịch đảo của nguy cơ chết.
Mô hình mũ thích hợp khi xem xét đời sống của các tạo vật có đời sống ngắn như muỗi, nguy
cơ chết chính không phải vì tuổi tác mà là bởi vì tai nạn trong môi trường. Và nó đã được
dùng trong việc xây dựng mộ hình toán học truyền bệnh sốt rét. Các mô hình khác có các hàm
số gamma, Weibull, Rayleigh và Gompertz để mô tả nguy cơ chết thay đổi theo thời gian.
Mặc dù chúng hữu ích trong việc mô hình hóa bệnh tật và sống còn, những mô hình này
không hữu ích trong việc phân tích số liệu sống còn bằng bảng sống và các phương pháp liên
quan. Ðể biết chi tiết về các mô hình khác xem Cox và Oakes (1984).

91
Căn bản thống kê y học -Ðỗ Văn Dũng

PHÂN PHỐI POISSON


Giới thiệu
Chúng ta đã gặp phân phối bình thường cho trung bình và phân phối nhị thức cho tỉ lệ. Trong
chương này ta gặp phân phối Poisson, được đặt tên theo tên một nhà toán học Pháp, rất thích
hợp cho việc mô tả số lần xuất hiện biến cố theo thời gian, với điều kiện những biến cố này
độc lập với nhau và ngẫu nhiên. Một thí dụ là số lần bức xạ tia phóng xạ được phát hiện bởi
máy đếm lấp lánh (scintillation counter) trong 5 phút (xem Chương 17.2). Sau khi trình bày
tổng quát phân phối Poisson, chúng ta sẽ xét các ứng dụng đặc biệt để phân tích tỉ suất, kể cả
tỉ suất mới mắc bệnh.
Phân phối Poisson cũng thích hợp cho các hạt tìm tháy trong một đơn vị không gian, như là
số các kí sinh trùng sốt rét trong kính hiển vi của một lam máu, với điều kiện các hạt phân
phối ngẫu nhiên và độc lập trên toàn bộ không gian. Muốn đạt được phân phối Poisson cần
thỏa hai thuộc tính ngẫu nhiên và độc lập. Thí dụ số trứng Schistosoma mansoni trong mẫu
phân trong phải là phân phối Poisson bởi vì trứng có khuynh hướng dích chùm chứ không
phải phân phối độc lập.
Ở Chương 18 chúng ta sẽ mô tả cách đánh giá một nhóm số liệu có tuân theo phân phối
Poisson hay không và thí dụ 18.2 trình bày số liệu không tuân theo thuộc tính ngẫu nhiên.
Hơn nữa, đã có những kĩ thuật để xác định các bệnh có tập trung trong không gian và thời
gian hay không (xem tổng quan của Smith, 1982), như là khả năm tập trung các trường hợp
bệnh bạch huyết ở trẻ quan các nhà máy năng lượng hạt nhân. Tập trung như vậy vi phạm
phân phối Poisson.

Ðịnh nghĩa
Phân phối Poisson mô tả phân phối lấy mẫu của số lần xuất hiện, r, của biến cố trong một
khoảng thời gian (hay vùng không gian) Nó phụ thuộc chỉ vào một tham số đó là số lần xuất
hiện trung bình, m, trong khoảng thời gian bằng nhau (hay trong vùng không gian bằng nhau).
e -µ µ r
Xaïc suáút (r láön xuáút hiãûn) =
r!
Hầu hết các máy tính cầm tay đều có phím cho 3 hàm số cơ bản của công thức này. Lưu ý
rằng, theo định nghĩa, cả 0! và µ0 bằng 1. Do đó xác suất không xuất hiện biến cố là e-µ.

s.e. = µ
Sai sô úchuẩn cho số lần xuất hiện bằng căn bậc hai của trung bình, được ước lượng bằng căn
bậc hai của số lần xuất hiện quan sát, (r.
Thí dụ 17.1
Nhà chức trách y tế tại một quận có kế hoạch đóng cửa một trong hai phòng sinh đánh giá
nhu cầu gia tăng đặt ra cho phòng sanh còn lại. Một yếu tố cần xem xét là nguy cơ vào một
ngày nào đó nhu cầu nhập viện vượt quá khả năng của phòng. Hiện nay phòng sinh lớn có
trung bình 4,2 lần nhập viện trong ngày và có khả năng giải quyết 10 lần nhập viện mỗi ngày.
Sau khi đóng của phòng sinh nhỏ số lần nhập viện trung bình sẽ lên khoảng 6,1 lần mỗi ngày.
Phân phối Poisson được dùng để ước lượng tỉ lệ số ngày mà khả năng của phòng bị quá tải.
Thí dụ ta cần xem xác suất nhập viện hơn hoặc bằng 11 lần mỗi ngày. Ðiều này có thể tính
được bằng cách tính xác suất có 0, 1, 2,... tới 10 lần nhập viện và trừ tổng số cho 1, như tính
trong bảng 17.1. Thí dụ:

e -6,1 6,13
Xaïc suáút (3 láön nháûp viãûn) = = 0,0848
3!

92
PHÂN PHỐI POISSON

Tính toán cho thấy xác suất nhập viện 11 lần hay hơn trong một ngày là 0,0470. Do đó khả
năng của phòng có thể bị quá tải 4,7% lần hay khoảng 17 ngày trong năm.
Bảng 17.1 Xác suất số lần nhập viện trong ngày ở một phòng sinh, dựa trên phân phối Poisson với trung
bình 6,1 lần mỗi ngày.
Số lần nhập viện Xác suất
0 0,0022
1 0,0137
2 0,0417
3 0,0848
4 0,1294
5 0,1579
6 0,1605
7 0,1399
8 0,1066
9 0,0723
Tổng số (0-10) 0,9530
11+ (làm phép trừ) 0,0470

Hình dáng
Hình 17.1 vẽ hình dáng của phân phối Poisson cho các giá trị trung bình, µ. Phân phối này rất
lệch khi trung bình nhỏ, khi đó có xác suất không xẩy ra biến cố rất đáng kể. Nó đối xứng với
trung bình lớn và có thể xấp xỉ bằng phân phối bình thường nếu µ ≥ 10.

Kết hợp số đếm


Thí dụ 17.2
Một bệnh phẩm được đánh dấu bằng một chất phóng xạ được đếm trong 5 phút trong một
buồng đếm lấp lánh đếm được 2905. Sai số chuẩn của số này được ước tính bằng phân phối
Poisson

Số hạt đếm được = 2905


s.e. = √2905 = 53,9
Người ta thường trình bày kết quả theo số đếm/phút

Số hạt đếm được trong phút = 2905/5 = 581,0


s.e. = 53,9/5 = 10,8
Khoảng tin cậy trung bình số hạt đếm được trong một phút được tính bằng cách dùng xấp xỉ
bình thường:

581 ± 1,96 × 10,8 = 559,8 tới 602,2 hạt/phút

93
Căn bản thống kê y học -Ðỗ Văn Dũng

Hình 17.1 Phân phối Poisson các giá trị khác nhau của µ. Trục hoành trong các đồ thị là các giá trị của
r.
Giả sử có 3 kết quả khác nhau từ buồng đếm lấp lánh dựa trên thời gian khác nhau, như trình
bày trong bảng 17.2. Các kết hợp để cho số liệu chung của số đếm trong mỗi phút là cộng 3
số đếm này với nhau và chia cho tổng số thời gian:

Säú âãúm/phuït = 8095/14 = 578,2


8095 89,97
s.e. = = = 6,4
14 14
Số hạt đếm được trong một phút trung bình tương tự như số hạt đếm được trong 5 phút trong
thí dụ 17.2. Dù vậy sai số chuẩn nhỏ hơn bởi vì tổng số hạt đếm được trong thời gian dài hơn.
Bảng 17.2 Kết quả từ máy đếm nhấp nháy

Kết quả Số đếm Thời gian


1 1740 3
2 2300 4
3 4055 7

Tổng số 8095 14

Phân phối Poisson và tỉ suất


Trong thí dụ 17.2 biến số đo lường là số các phát xạ phóng xạ đếm được trong buồng đếm lấp
lánh trong 5 phút nhưng cuối cùng chúng ta tính kết quả là tỉ suất số hạt đếm được trong mỗi
phút. Tỉ suất này tính được bằng cách chia số hạt đếm được và sai số chuẩn cho 5. Ở đây
chúng ta thảo luận tổng quát cách phân tích tỷ suất và chúng ta dùng kí hiệu λ (kí tự Hi lạp
lambda) cho tỉ suất trung bình số lần xuất hiện biến cố (nghĩa là số lần xuất hiện biến cố
trung bình trong một đơn vị thời gian).

94
PHÂN PHỐI POISSON

µ
Trung bçnh säú láön xuáút hiãûn biãún cäú trong mäüt âån vë thåìi gian = =λ
t
µ λ
s.e. = =
t t
Trong thí dụ 17.2, ước lượng của µ là 2905, t bằng 5 và λ bằng 581 số hạt đếm được trong
mỗi phút. Sai số chuẩn được tính bằng √µ/t theo cách trên hay √(λ/t):

581
s.e. = = 10,8
5
Cũng giống như trên. Dù vậy công thức thứ hai làm rõ thêm khi thời gian quan sát kéo dài thì
sai số chuẩn sẽ giảm, bởi vì bản thân λ cũng như nhau trong thời gian dài và thời gian ngắn.

Phân tích tỉ suất mới mắc


Tỉ suất mới mắc là một loại tỉ suất theo đơn vị thời gian. Nhớ lại từ Chương 15 rằng tỉ suất
này bằng số r các trường hợp bệnh mới trong một khoảng thời gian chia cho số người năm
nguy cơ. Phân phối Poisson (và xấp xỉ bình thường của nó) có thể được dùng khi có thể giả
thiết rằng số các trường hợp xảy ra độc lập với nhau và ngẫu nhiên theo thời gian. Ðiều này
dĩ nhiên ít đúng trong trường hợp bệnh truyền nhiễm hơn là bệnh không truyền nhiễm, nhưng
với điều kiện không có bằng chứng mạnh mẽ về sự tập trung của bệnh, việc sử dụng vẫn xứng
đáng.
r
λ=
ngæåìi nàm nguy cå

r
s.e. =
ngæåìi nàm nguy cå

Thí dụ 17.3
Người ta ghi nhận được 47 trường hợp nhiễm trùng hô hấp dưới trong một nghiên cứu 2 năm
ở trẻ em dưới 5 tuổi trong một cộng đồng ở Guatemala. Lúc đầu năm trăm trẻ tham gia vào
nghiên cứu nhưng bởi vì có sự di chuyển, mới sinh, vượt quá 5 tuổi và không theo dõi được
con số quan sát thay đổi theo thời gian. Tổng số trẻ × năm quan sát được theo dõi là 873. Tỉ
suất mới mắc của nhiễm trùng hô hấp dưới, tính trên mỗi 1000 trẻ × năm được ước tính bằng
λ = 57/873 × 1000 = 65,3 cho mỗi 100 trẻ × năm
Khoảng tin cậy 95% bằng

65,3 ± 1,96 × 8,6 = 48,4 tới 82,2 nhiễm trùng cho mỗi 1000 trẻ × năm
Bảng 17.3 Mới mắc nhiễm trùng hô hấp dưới trong số trẻ dưới 5 tuổi. theo điều kiện gia đình.
Tình trạng gia đình số nhiễm trùng trẻ × năm nguy cơ tỉ suất mới mắc/1000 trẻ ×
năm
Nghèo 33 355 93,0
Tốt 24 518 46,3
Chung 57 873 65,3
Có thể kiểm định bình thường để so sánh hai tỉ suất mới mắc, λ1 = r1/người×năm1 và λ2 =
r2/người×năm2. Công thức có hiệu chỉnh tính liên tục là:

95
Căn bản thống kê y học -Ðỗ Văn Dũng

 1 1 
| λ1 − λ 2 | −  + 
 2 × (ngæåìi × nàm) 1 2 × (ngæåìi × nàm) 2 
z=
 1 1 
λ + 
 (ngæåìi × nàm) 1 (ngæåìi × nàm) 2 
r1 + r2
λ=
(ngæåìi × nàm)1 + (ngæåìi × nàm) 2
Trong đó λ là tỉ suất mới mắc toàn bộ trong 2 nhóm và λ1 - λ 2 là trị số tuyệt đối của hiệu số.
Thí dụ 17.4
Trẻ em được phân tích ở thí dụ 17.3 được chia làm 2 nhóm, sống ở nhà tốt và ở nhà nghèo.
Kết quả được trình bày trong bảng 17.3. Tỉ suất mới mắc của nhiễm trùng hô hấp dưới cao
hơn đáng kể trong trẻ có điều kiện sống nghèo nàn so với trẻ có điều kiện sống tốt; 93,0 và
46,3 trong 1000 trẻ-năm. Bởi vì tỉ suất này tính theo 100 trẻ-năm, thành phần trẻ năm trong
công thức phải được tính theo đơn vị 1000:

 1 1 
|93,0 - 46,3|-  + 
 1,036 0,710 
z= = 2,52
 1 1 
75,3 ×  + 
 0,518 0,355 

Sự khác biệt này có ý nghĩa cao (P < 0,01).

96
TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT


Giới thiệu
Chúng ta đã gặp một số phân phối lí thuyết. Trong chương này chúng ta sẽ thảo luận cách
đánh giá xem phân phối của một nhóm số liệu có tuân theo một mô hình lí thuyết đặc biệt nào
đó hay không. Thí dụ, có phải số liệu phù hợp với phân phối bình thường, điều kiện cần cho
nhiều phương pháp thống kế. Chúng ta xem phân phối này trước tiên. Phần thứ hai tổng quát
hơn. Nó mô tả kiểm định chi bình phương phù hợp (chi square goodness of fit test) để kiểm
định ý nghĩa của sự khác nhau giữa phân phối tần suất quan sát được và phân phối được tiên
đoán bởi mô hình lí thuyết.

Phù hợp theo phân phối bình thường


Giả thiết về phân phối bình thường là nền tảng cho nhiều phương pháp thống kê. Ðiều này có
thể được kiểm tra bằng cách so sánh hình dạng của phân phối tần suất quan sát được với phân
phối bình thường. Ít khi cần đến kiểm định ý nghĩa hình thức (formal) bởi vì chúng ta chỉ
quan tâm đến việc khám phá sự sai lệch khỏi tính bình thường một cách đáng kể; hầu hết các
phương pháp đều vững vàng đối với sự di lệch vừa phải. Nếu mẫu lớn, việc đánh giá bằng
mắt thường là đủ. Thí dụ, hình dạng của tổ chức đồ ở hình 18.1(a) dường như tuân theo phân
phối bình thường, trong khi ở hình 18.1(b) rõ ràng bị lệch dương.
Kĩ thuật đồ họa có thể được dùng cho mẫu có kích thước bất kì là đồ thị probit (probit plot).
Ðó là phân tán đồ so sánh điểm phần trăm của phân phối tần suất quan sát với điểm tương
ứng (được gọi là probit) của phân phối bình thường chuẩn. Ðồ thị probit tuyến tính nếu số
liệu phân phối bình thường và cong nếu số liệu không phân phối bình thường.
Thí dụ, bảng 18.1 cho thấy phân phối tần suất của nồng độ hemoglobin của 70 phụ nữ, minh
họa ở hình 18.1(a). Không có phụ nữ nào có nồng độ hemoglobin dưới 8 g%. Chỉ dó một,
1,4% trong tổng số, có nồng độ dưới 9 g%. Giá trị của phân phối bình thường chuẩn tương
ứng với phần trăm này có thể tìm ở bảng A6. Nó bằng -2,20, được gọi là probit của 1,4%.
Nhiều người cộng 5 vào giá trị tính được để đảm bảo probit dương nhưng điều này không cần

thiết và sẽ không được tính ở đây.


Ba người phụ nữ có nồng độ hemoglobin từ 9 đến 10 g% vì vậy tổng cộng có 4 người (5,7%)
có nồng độ dưới 10 g%. Dùng bảng 6 lần nữa probit tương ứng với 10g% được tính là -1,58.
Tương tự có 18 phụ nữ (25,7%) có nồng độ hemoglobin dưới 11 g%. Số được tích lũy theo
kiểu này được gọi là số lũy tích (cumulative). Giá trị lũy tích còn lại của phân phối tần suất
được trình bày trong bảng 18.1 cùng với probit tương ứng. Người ta không thống nhất cách
xử trí đối với 0% và 100% và không có cách nào hoàn toàn thuận lợi. Như ở đây chúng ta bỏ
qua chúng và sẽ mất rất ít thông tin.
Bảng 18.1 phân phối tần suất nồng độ hemoglobin của 70 phụ nữ và phân phối tích lũy và probit tương
ứng
Hemoglobin số phụ nữ số tích lũy tích lũy(%) probit
<8 0 0 0,0
8- 1 1 1,4 -2,20
9- 3 4 5,7 -1,58

97
Căn bản thống kê y học -Ðỗ Văn Dũng

10- 14 18 25,7 -0,65


11- 19 37 52,9 -0,07
12- 14 51 72,9 -0,61
13- 13 64 91,4 1,37
14- 5 69 98,6 2,20
15- 1 70 100,0
16+ 0
Hình 18.1(c) trình bày đồ thị probit và nồng độ hemoglobin. Lưu ý rằng probit -2,20 tương
ứng với 9 g% (chứ không phải 8 g%) bởi vì nó tương ứng với phần trăm phân phối nằm dưới
9 g%. Ðồ thị này tuyến tính xác nhận rằng số liệu phân phối bình thường. Ngược lại hình
18.1(d) cho thấy đồ thị probit phi tuyến đối với phân phối chiều dày lớp mỡ dưới da vùng cơ
tam đầu bị lệch dương.
Ðồ thị probit có thể vẽ bằng cách dùng từng quan sát riêng lẻ chứ không dùng phân phối tần
suất. Ðiều này có thể dùng cho mẫu nhỏ. Quan sát được sắp theo thứ tự tăng dần. Phần trăm
tích lũy của chúng là:
100 × 1/n, 100 × 2/n, 100 × 3/n,...., 100 × n/n
Trong đó n là cở mẫu, thí dụ nếu có 24 quan sát, phần trăm lũy tích sẽ là 4,2%, 8,4%,
13,2%,..., 100%. Các probit được tính như trên vào được vẽ theo từng giá trị cá nhân.

Kiểm định phù hợp chi bình phương


Ðôi khi cần kiểm định xem một phân phối tần suất có khác biệt một cách có ý nghĩa với phân
phối tần suất lí thuyết giả thiết, như là phân phối Poisson. Có thể tính được bằng cách so sánh
tần suất kì vọng và tần suất quan sát dùng kiểm định chi bình phương. Loại kiểm định này
cũng giống như trong bảng dự trù, đó là:
(O − E ) 2
χ2 =∑
E
Nhưng cách tính độ tự do có khác. Chúng bằng với số nhóm trong phân phối tần suất trừ 1,
trừ số thông số tính được từ số liệu. Thí đụ nếu, nếu phân phối mũ phù hợp với thời gian sống
thì chỉ cần ước lượng một thông số, đó là l, nghịch đảo của thời gian sống trung bình. Ðể phù
hợp với phân phối bình thường, cần hai tham số, đó là trung bình m và độ lệch chuẩn s.
Trong một số trường hợp không cần ước tính tham số, hoặc là bởi vì mô hình lí thuyết không
cần tham số như trong thí dụ 18.1 hoặc là bởi vì các tham số được xác định trong mô hình.
Säú nhoïm trong Säú caïc tham säú cáön
d. f . = − −1
phán phäúi táön suáút æåïc læåüng

98
TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

20 70
60

Säú âaìn äng


Säú 15 50
phuû 40
10
næî 30
5 20
10
0 0
8 9 10 11 12 13 14 15 2 6 10 14 20

Hemoglobin Nãúp gáúp da (mm)

3 3
2 2
1 1

Probit
Probit

0 0
-1 -1
-2 -2
-3 -3
8 9 10 11 12 13 14 15 16 2 6 10 14 18 22

Hemoglobin Nãúp gáúp da (mm)

Hình 18.1 Phân phối tần suất và đồ thị probit để đánh giá tính bình thường của số liệu. (a) và (c) Nồng
độ hemoglobin của 70 phụ nữ. Phân phối bình thường. Ðồ thị probit tuyến tính. (b) (d) Chiều dày lớp
mỡ dưới da vùng cơ tam đầu ở 440 người nam. Lệch dương. Ðồ thị probit phi tuyến
Tính toán số kì vọng
Bước đầu tiên trong việc tiến hành kiểm định tính phù hợp chi bình phương là ước lượng
tham số cần thiết cho phân phối tần suất lí thuyết từ số liệu . Bước thì nhì là tính số kì vọng
trong mỗi nhóm của phân phối tần suất, bằng cách nhân tổng số tần suất cho xác suất một cá
nhân giá trị rơi vào trong nhóm
xaïc suáút mäüt caï nhán
Táön suáút kç voüng = táön suáút täøng cäüng ×
nàòm trong nhoïm

Ðối với số liệu rời rạc, xác suất đươc tính bằng ứng dụng trực tiếp công thức phân phối, như
được minh họa trong phân phối Poisson ở thí dụ 18.2. Ðối với số liệu liên tục, tính toán từ
phân phốitích lũy. Thí dụ, nếu số liệu là thời gian sống còn của muỗi thì xác suất muỗi chết
trong ngày thứ ba bằng xác suất nó sống tới đầu ngày thứ ba trừ cho xác suất nó sống tới đầu
ngày thứ bốn.
Tính hợp lệ
Kiểm định tính phù hợp chi bình phươg không được dùng nếu có một tần suất kì vọng nào
nhỏ hơn hai hay có nhiều tần suất kì vọng nhỏ hơn 5. có thể tránh được bằng cách kết hợp
những nhóm kề nhau trong phân phối.
Thí dụ 18.1
Bảng 18.2 trình bày phân phối của kí số cuối cùng (final digit) trong trọng lượng được ghi
nhận trong một cuộc điều tra để kiểm tra tính đúng của nó. Chín mươi sáu người lớn được
cân và ghi trọng lượng tới 0,1 kg gần nhất. Nếu không có sai lệch trong ghi nhận, thí dụ như
sai lệch do khuynh hướng ghi tròn kilogram hay ghi tròn nửa kilogram, ta kì vọng rằng số lần
xuất hiện các số 0, 1, 2,..., 9 trong chữ số cuối cùng bằng nhau và bằng 9,6. Có thể kiểm định
tính phù hợp của phân phối quan sát được với giả thuyết bằng cách sử dụng kiểm định tính

99
Căn bản thống kê y học -Ðỗ Văn Dũng

phù hợp chi bình phương. Có 10 phân phối tần suất và không có tham số nào được ước
lượng.
(O − E ) 2
χ2 =∑ = 9,84 d . f . = 10 − 1 = 9
E
9,84 ở giữa điểm phần trăm 25% và 50% đối với phân phối c2 9 độ tự do. Do đó tần suất
quan sát phù hợp với tần suất lí thuyết, gợi ý rằng không có sai lệch ghi nhận.
Bảng 18.2 Kiểm tra tính đúng của cuộc điều tra ghi nhận trọng lượng
Kí số cuối cùng của trọng tần suất quan sát tần suất lí thuyết (O-E)2/E
lượng
0 13 9,6 1,20
1 8 9,6 0,27
2 10 9,6 0,02
3 9 9,6 0,04
4 10 9,6 0,02
5 14 9,6 2,02
6 5 9,6 2,20
7 12 9,6 0,60
8 11 9,6 0,20
9 4 9,6 3,27
Tổng số 96 96,0 9,84
Thí dụ 18.2
Người ta cho rằng sự xâm nhập bội (mulitple invasion) của Plasmodium falciparum vào hồng
cầu xảy ra nhiều hơn so với các kí sinh trùng sốt rét khác. Bảng 18.3 cho thấy số liệu được
thu thập để xem những kí sinh trùng này có tấn cộng vào hồng cầu một cách chọn lọc chya
chỉ đơn giản là sự tình cờ. Năm mươi ngàn hồng cầu được đếm trong một phết máu của bệnh
nhân bị sốt rét falciparum và ghi nhận số kí sinh trùng trong mỗi hồng cầu
Bảng 18.3 Phân phối tần suất quan sát của số các kí sinh trùng cho mỗi hồng cầu trong máu của bệnh
nhận bị Plasmodium falciparum so sánh với phân phối Poisson có cùng trung bình. Ðược pháp của
Wang (1970) Transaction of the Royal Society of Tropical Medicine and Hygiene 64, 268-270.
Số kí sinh trùng trong mỗi hồng cầu số quan sát phân phối Poisson (O- E)2/E
0 40000 39726,7 1,9
1 88621 9137,1 29,2
2 1259 1050,8 41,3
3 99 80,6 4,2
4 21 4,6 68,5
5+ 0 0,2 0,2
Tổng số 50000 50000 135,3
Nếu nhiễm trùng một hồng cầu là một biến cố tình cờ, sự phân phối của số các kí sinh trùng
cho mỗi tế bào sẽ là phân phối Poisson. Có thể kiểm định giả thuyết này bằng cách dùng kiểm
định phù hợp chi bình phương. Bước đầu tiên là tính, , µ , số trung bình của kí sinh trung
trong mỗi hồng cầu:
0 × 40000+ 1× 8 621+ 2 ×1259+ 3 × 99 + 4 × 21 11520
= = 0,23
50000 50000

100
TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

Bước tiếp theo là tính số kì vọng của hồng cầu có 0, 1, 2, 3, 4, 5+ kí sinh trùng dùng phân
phối Poisson với trung bình này. Kết quả được trình bày trong bảng 18.3. Thí dụ, xác suất
hồng cầu có hai kí sinh trùng là:
e − µ µ 2 e −0, 23 0,23 2
= = 0,021015
2! 2!
Số kì vọng của hồng cầu trong tổng số 50000 hồng cầu có hai kí sinh trùng là
50000 × 0,021015 = 1050,8
Cuối cùng tần suất quan sát và tần suất kì vọng được so sánh với nhau. Có thể thấy rằng có số
hồng cầu quan sát có một hay hai kí sinh trùng nhỏ hơn số kì vọng và số hồng cầu quan sát có
ba hay bốn kí sinh trùng nhiều hơn kì vọng, gợi ý rằng kí sinh trùng tấn công vào tế bào có
chọn lọc chứ không phải ngẫu nhiên. Giá trị chi bình phương có ý nghĩa cao.

χ2 = 135,3; d.f. = 6 - 1 - 1 = 4; P < 0,001

101
Căn bản thống kê y học -Ðỗ Văn Dũng

PHÉP BIẾN ÐỔI


Giới thiệu
Giả thuyết làm nền tảng cho phương pháp thống kế có thể không phải luôn luôn thỏa mãn bởi
một nhóm số liệu nhất định. Thí dụ, phân phối có thể bị lệch dương chứ không phải bình
thường, sai số chuẩn của hai nhóm có thể khác nhau không cho phép sử dụng kiểm định t để
so sánh hai trung bình, hay quan hệ của hai biến có thể là đường cong chứ không phải là
đường thẳng. Ở đây chúng ta sẽ mô tả cách thức vượt quan những vấn đề trên bằng phép biến
đổi tới thang đo khác. Sự lựa chọn phổ biến nhất là phép biến đổi logarithm và được mô tả
chi tiết. Tóm tác sử dụng các phép biến đổi sẽ được trình bày ở chương cuối.

Phép biến đổi logarithm


Khi áp dụng phép biến đổi logarithm cho một biến số, mỗi giá trị sẽ được thay thế bằng
logarithm của nó

u = log x
Trong đó x là giá trị nguyên thủy và u là giá trị biến đổi. Chỉ có thể dùng phép biến đổi này
với giá trị dương bởi vì không có logarithm cho giá trị âm và logarithm cho giá trị zero là vô
hạn âm. Dầu vậy có một số trường hợp khi cần biến đổi logarithm như trong trường hợp đếm
số kí sinh trùng, nhưng số liệu có một số giá trị zero cùng với các giá trị dương. Có thể giải
quyết vấn đề này bằng cách cộng 1 vào các giá trị trước khi biến đổi (lưu ý rằng phải trừ đi 1
log x -1 0 1 2 3

x 0.1 0.2 0.5 1 2 5 10 20 50 100 200 500 1000

sau khi kết quả cuối cùng được biến đổi về thang đo gốc).
Phép biến đổi logarithm có tác dụng kéo dài phần bên trái của thang đo và nén phần bên phải
của thang đo như chỉ ra trong hình 19.1. Thí dụn trong một thang đo logarithm thì khoảng
cách giữa 1 và 10 sẽ bằng khoảng cách từ 10 đến 100 và bằng khoảng cách từ 100 đến 1000;
chúng cùng có khác biệt gấp 10 lần.
Hình 19.1 Phép biến đổi logarithm
Các giá trị lệch dương
Phép biến đổi logarithm sẽ bình thường hóa các phân phối bị lệch dương, như trong hình
19.2, trong đó là kết quả sự áp dụng phép biến đổi logarithm cho số liệu lớp mỡ dưới da vùng
cơ tam đầu được trình bày trong hình 18.1(b). Tổ chức đồ đối xứng và đồ thị probit tuyến
đính cho thấy phép biến đổi đã loại bỏ sự lệch và bình thường hóa số liệu. Bề dày lớp mỡ
dưới da được gọi là có phân phối log bình thường (lognormal distribution).

3 100
2 80
Säú âaìn äng

1
Probit

60
0
40
-1
-2 20
-3 0
0,3 0,7 1,1 1,5 0,3 0,7 1,1

Nãúp gáúp da (mm) Nãúp gáúp da (mm)

102
PHÉP BIẾN ÐỔI

Hình 19.2 Phân phối log bình thường của bề dày lớp mỡ dưới da vùng cơ tam đầu của 440 đàn ông. So
sánh với hình 18.1
Ðộ lệch chuẩn không bằng nhau
Cơ chế sử dụng phép biến đổi logarithm sẽ được mô tả bởi việc xem xét số liệu của bảng
19.1(a) cho thấy sự bài tiết ß-throboglobulin (b-TG) ở 12 bệnh nhân tiểu đường cao hơn 12
người bình thường. Những số trung bình này không thể so sánh bằng kiểm định t bởi vì độ
lệch chuẩn của hai nhóm khác nhau. Cột bên phải của bảng cho thấy số quan sát sau khi biến
đổi logarithm. Thí dụ log(4,1)=0,61. Có thể dùng logarithm với cơ số bất kì; kết quả cũng
giống nhau. Người ta thường chọn dùng cơ số 10, như ở đây, hay cơ số e, gọi là logarithm tự
nhiên (natural logarithms).
Phép biến đổi logarithm có tác động cân bằng độ lệch chuẩn ở đây (chúng là 0,26 và 0,28
trong thang đo logarithm) và loại bỏ độ lệch ở mỗi nhóm (xem hình 19.3). Kiểm định t có thể
được dùng cho thấy log ß- TG trung bình cao hơn ở bệnh nhân đái đường một cách có ý
nghĩa. Chi tiết tính toán được trình bày ở bảng 19.1(b).
Trung bình nhân và khoảng tin cậy
Khi sử dụng phép biến đổi, tất cả mọi phân tích được tiến hành trên giá trị đã biến đổi, u.
Ðiều cần lưu ý là điều này cũng đúng trong khi tính khoảng tin cậy. Thí dụ, log ß-TG trung
bình của người bình thường là 1,06 log ng/ngày/100 ml. Khoảng tin cậy của nó là

1,06 ± 2,20 × 0,26/12 = 0,89 tới 1,23 log(ng/ngày/100ml)


(lưu ý rằng 2,20 là điểm 5% của phân phối t với 11 độ tự do.)
Dù vậy khi báo cáo kết quả cuối cùng đôi khi cần biến đổi ngược thành đơn vị gốc bằng cách
lấy antilog như làm trong bảng 19.1(c). Antilog của trung bình của giá trị biến đổi được gọi là
trung bình nhân (geometric mean).

Trung bình nhân (Geometric mean - GM) = antilog(u) = 10u

103
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 19.1 So sánh ß -throboglobulin (b-TG) nước tiểu ở 12 người bình thường và 12 người bị tiểu
đường. Sửa đổi từ kết quả của van Oost et al. (1983). Thrombosis and Haemostasis 49, 18-20, có xin
phép.
(a) Số liệu gốc và log của số liệu
β-TG Log β-TG
(ng/ngày/100ml creatinine (log ng/ngày/100ml creatinine

Bình Thường Tiểu đường Bình Thường Tiểu đường


4.1 11.5 0.61 1.06
6.3 12.1 0.80 1.08
7.8 16.1 0.89 1.21
8.5 17.8 0.93 1.25
8.9 24.0 0.95 1.38
10.4 28.8 1.02 1.46
11.5 33.9 1.06 1.53
12.0 40.7 1.08 1.61
13.8 51.3 1.14 1.71
17.6 56.2 1.25 1.75
24.3 61.7 1.39 1.79
37.2 69.2 1.57 1.84
trung bình 13.5 35.3 1.06 1.47
S.D. 9.2 20.3 0.26 0.28
n 12 12 12 12
(b) tính kiểm định t dựa trên log số liệu
s = √[11 × 0,262 + 11 × 0,282/22]=0,27
1,06 − 1,47
t= = −3,72 d . f . = 22 P ≈ 0,001
0,27 1 / 12 + 1 / 12
(c) kết quả báo cáo trên thang đo nguyên thủy
trung bình nhân
β- TG khoảng tin cậy 95% độ lệch chuẩn hình học
Bình thường 11,5 7,8 ; 17,0 1,8
Tiểu đường 29,5 19,5 ; 44,5 1,9
Thí dụ, trung bình nhân của ß-GT của đối tượng bình thường là:

Antilog(1,06) = 101,06 = 11,5 ng/ngày/100 ml


A 0 10 20 30 40 50 60 70

B 1 2 5 10 20 50 100

Hình 19.3 ß-Thromboglobulin data (Bảng 19.1) vẽ từ (a) dùng thang đo tuyến tính và (b) dùng thang đo
logarithm. Lưu ý trên thang đo logarithm vẫn ghi theo đơn vị nguyên thủy

104
PHÉP BIẾN ÐỔI

Trung bình nhân luôn luôn nhỏ hơn trung bình cộng tương ứng trừ khi tất cả các quan sát có
cùng giá trị, trong trường hợp đó hai số đo bằng nhau. Không giống như trung bình cộng, nó
không bị ảnh hưởng rõ rệt của các giá trị rất lớn trong phân phối lệch, cho nên nó đại diện
cho số trung bình tốt hơn trong tình huống này.
Khoảng tin cậy được tính bằng cách antilog giới hạn tin cậy tính được trên thang đo log. Ðối
với đối tượng bình thường, khoảng tin cậy 95% của trung bình nhân sẽ là:

Antilog(0,89), antilog(1,23) = 100,89, 101,23


=7,8 ; 17,0 ng/ngày/100 ml
Lưu ý rằng khoảng tin cậy này không đối xứng qua trung bình nhân. Thay vào đó tỉ số giữa
giới hạn trên và trung bình nhân, 17,0/11,5 = 1,5 cũng bằng tỉ số giữa trung bình nhân và giới
hạn dưới, 11,5/7,8 = 1,5. Ðiều này phản ánh độ lệch chuẩn theo thang đo log tương ứng với
sai số nhân chứ không phải sai số cộng trong thang đo gốc.
Vì lí do này, antilog của độ lệch chuẩn khó có thể giải thích và do đó thường ít được dùng.
Dù vậy có nhiều tình huống, thí dụ trong bảng lớn có nhiều biến số khác nhau, khi bởi vì tính
ngắn gọn, người ta thích dùng antilog của độ lệch chuẩn hơn là khoảng tin cậy. Người ta đã
đề nghị từ độ lệch chuẩn hình học (geometric standard deviation) (Kirwood, 1979).
Quan hệ phi tuyến
Hình 19.4(a) trình bày tần suất của lympho bào kháng 6-thioguanine (6TG) gia tăng theo tuổi.
Ðường cong quan hệ hướng lên và có độ phân tán lớn hơn đối với tuổi lớn hơn. Hình 19.4(b)
trình bày bằng cách dùng phép biến đổi log cho tần suất đã làm thẳng mối quan hệ và ổn định
độ biến thiên.
Trong thí dụ này, đường cong quan hệ hướng lên và biến số y (tần suất) được biến đổi. Thao
tác tương tự cho quan hệ với đường cong đi xuống là lấy logarithm của giá trị x.

Hình 19.4 Quan hệ giữa tần suất của lymphocyte kháng 6TG và tuổi trên 37 đối tượng được trình bày
dùng (a) thang đo tuyến tính (b) thang đo logarithm của tần suất. Ðược phép của Morley et al. (1982)
Mechanisms of Ageing and Development 19, 21-6
Phân tích hiệu giá
Nhiều thử nghiệm huyết thanh học, như là thử nghiệm kết dính hồng cầu dùng cho kháng thể
sởi, dựa trên một loạt những lần pha loãng gấp đôi và độ pha loãng của dung dịch loãng nhất
mà có phản ứng được ghi nhận. Kết quả được gọi là hiệu giá và được tính bằng độ pha loãng
1/2, 1/4, 1/8, 1/16, 1/32 v.v.. Ðể cho tiện lợi, chúng ta sẽ dùng thuộc ngữ một cách kém chặt
chẽ hơn và gọi số nghịch đảo của những số này, đó là 2, 4, 8, 16, 32, v.v. Là hiệu giá. Hiệu
giá có khuynh hướng bị lệch dương, và do đó cách phân tích tốt nhất là dùng phép biến đổi
logarithm. Ðiều này được thực hiện đơn giản nhất bằng cách dùng số lần pha loãng thay cho
hiệu giá. Do đó hiệu giá 2 được thay bằng số lần pha loãng 1, hiệu giá 4 bằng 2, hiệu giá 8

105
Căn bản thống kê y học -Ðỗ Văn Dũng

bằng 3, hiệu giá 16 bằng 4, hiệu giá 32 bằng 5 v.v. Ðiều này tương đương với lấy logarithm
cơ số 2 bởi vì như ta thấy, 8 = 23 và 16 = 24

u = số lần pha loãng = log2 hiệu giá


Tất cả các phân tích được tiến hành băng cách dùng số lần pha loãng. Kết quả sau đó được
biến đổi ngược trở thành giá trị ban đầu bằng cách tính 2 lũy thừa.
Thí dụ, Bảng 19.2 cho thấy kháng thể sởi của 10 đứa trẻ 1 tháng sau khi tiêm chủng vaccin
sởi. Kết quả được tính bằng hiệu giá và số lần pha loãng tương ứng. Trung bình số lần pha
loãng là u = 4,4. Ta lấy antilog bằng cách tính 24,4 = 21,1. Kết quả được gọi là hiệu giá trung
bình nhân và bằng 21,1.

Hiệu giá trung bình nhân = 2 số lần pha loãng trung bình
Bảng 19.2 Nồng độ kháng thể kháng sởi một tháng sau khi tiêm chủng
Trẻ Hiệu giá kháng thể số lần pha loãng
1 8 3
2 16 4
3 16 4
4 32 5
5 8 3
6 128 7
7 16 4
8 32 5
9 32 5
10 16 4

Chọn phép biến đổi


Như đã nói ở trên, phép biến đổi logarithm thường được áp dụng nhiều nhất. Nó thích hợp để
loại bỏ tính lệch dương và được dùng trong một số các biến số như thời gian ủ bệnh, thời gian
sống còn, số các kí sinh trùng, hiệu giá, liều thuốc, nồng độ chất, và tỉ số. Dù vậy có một số
các phép biến đổi cho các số liệu bị lệch được tóm tắt trong bảng 19.3. Thí dụ, phép biến đổi
nghịch đảo (reciprocal transformation) mạnh hơn phép biến đổi logarithm và sẽ thích hợp nếu
phân phối bị lệch dương nhiều hơn phân phối bình thường, trong khi phép biến đổi lấy căn
(root transformation) yếu hơn. Mặt khác tính lệch âm có thể bị loại bỏ bằng cách dùng phép
biến đổi lấy lũy thừa (power transformation) như là biến đổi bậc hai hoặc bậc ba, độ
mạnh tương đương với bậc của lũy thừa.
Cách chọn lựa tương tự cho việc biến đổi độ lệch chuẩn trở nên giống nhau hơn, phụ thuộc
vào độ lệch chuẩn tăng như thế nào khi trung bình tăng. (ít khi giảm). Do đó, phép biến đổi
logarithm thích hợp nếu độ lệch chuẩn tăng tỉ lệ với độ lệch chuẩn, trong khi phép biến đổi
nghịch đảo thích hợp nếu độ dốc cao hơn và phép biến đổi căn thích hợp khi độ dốc ít hơn.
Bảng 19.3 cũng tổng kết một số loại quan hệ phi tuyến có thể xảy ra. Việc chọn lựa phụ thuộc
vào hình dạng của đường cong và muốn biến đổi biến x hay biến y.
Cuối cùng ta cũng lưu ý hai phép biến đổi liên quan chặt với tỉ lệ. Chúng là phép biến đổi
logistic (hay logit) được giới thiệu ở chương 14 và phép biến đổi probit được mô tả ở chương
18. Tác động chính của hai phép biến đổi này là chuyển một phạm vi giới hạn của thang đo tỉ
lệ, từ zero đến1, thành thang đo vô cực.

106
PHÉP BIẾN ÐỔI

Bảng 19.3 Tổng kết sự lựa chọn phép biến đổi. Phép biến đổi làm giảm tính lệch dương gọi là phép
biến đổi nhóm A Phép biến đổi làm giảm tính lệch âm gọi là phép biến đổi nhóm B
Tình huống Phép biến đổi
Phân phối lệch dương (nhóm A)
Log bình thường (lognormal) logarithm (u = log x)
Lệch nhiều hơn log bình thường nghịch đảo ( u = 1/x)
Ít lệch hơn phân phối bình thường căn bậc hai ( u = x)

Phân phối lệch âm (nhóm B)


Lệch vừa phải bình phương (u=x2)
Lệch nhiều lũy thừa ba (u = x3)

Biến thiên không đều


Ðộ lệch chuẩn tỉ lệ với trung bình logarithm (u = log x)
Ðộ lệch chuẩn tỉ lệ với bình phương của trung bình nghịch đảo ( u = 1/x)
Ðộ lệch chuẩn tỉ lệ với căn của trung bình căn bậc hai ( u = √x)

Quan hệ phi tuyến biến y và/hay biến x


y
Nhóm A Nhóm B

y
Nhóm B Nhóm A

y
Nhóm A Nhóm A

y
Nhóm B Nhóm B

107
Căn bản thống kê y học -Ðỗ Văn Dũng

PHƯƠNG PHÁP PHI THAM SỐ


Giới thiệu
Phương pháp phi tham số (non-parametric methods) là một nhóm các kĩ thuật thống kê nhằm
phân tích số liệu mà không có các giả thuyết về phân phối làm nền tảng, thí dụ như tính bình
thường của số liệu. Chúng đặc biệt hữu dụng khi không có tính bình thường trong một nhóm
số liệu nhỏ mà không thể sửa chữa bằng phép biến đổi thích hợp.
Nhiều phương pháp phi thống kê được phát minh với mục đích ban đầu là tìm các phương
pháp nhanh chóng và dễ dàng nhưng sau đó người ta khám phá ra rằng thành tích của chúng
tốt tương đương với những phương pháp tham số cổ điển như kiểm định t. Chúng hầu như có
hiệu quả tươngn đương trong việc phát hiện những sự khác biệt đơn thuần khi giả thuyết
tham số được thỏa và tốt hơn đáng kể khi giả thuyết này không thỏa. Như chúng ta sẽ thấy,
phương pháp phi tham số rất dễ dùng với điều kiên số liệu không có quá 50 trường hợp. Dù
vậy với sự sử dụng rộng rãi máy tính và máy tính cầm tay, điều này trở nên ít quan trọng hơn
trước đây. Chúng có hai nhược điểm chính. Thứ nhất, nó chú trọng chủ yếu vào kiểm định ý
nghĩa và mặc dù có thể tính được khoảng tin cậy nhưng thao tác phức tạp và tiến hành rất mất
công. Thứ nhì, chúng khó mở rộng ra trong các tình huống phức tạp hơn. Vì những lí do này
cuốn sách này nhấn mạnh nên dùng phương pháp tham số khi chúng hợp lệ.
Bảng 20.1 Tổng kết những phương pháp phi tham số chính
Phương pháp phi tham số Sử dụng Tương đương với
phương pháp tham
số
Kiểm định dấu (sign test) Dạng đơn giản của Kiểm định sắp
hạng có dấu Wilcoxon
Kiểm định sắp hạng có dấu Wilcoxon Kiểm định sự khác nhau giữa các Kiểm định t cặp đôi
(Wilcoxon sign rank test) cặp quan sát
Kiểm định tổng sắp hạng Wilcoxon So sánh 2 nhóm Kiểm định t hai mẫu
(Wilcoxon rank sum test)
Kiểm định U Mann Whitney (Mann Thay thế cho Kiểm định tổng sắp Kiểm định t hai mẫu
Whitney U test) hạng Wilcoxon cho cùng kết
Kiểm định S Kendall (Kendall's S test) quả
Phân tích phương sai một chiều Kruskal So sánh một số nhóm Phân tích phương sai
Wallis (Kruskal Wallis one-way một chiều
ANOVA)
Phân tích phương sai hai chiều Friedman So sánh nhiều nhóm được xác Phân tích phương sai
(Friedman two-way ANOVA) định bởi các giá trị trên 2 biến hai chiều
Tương quan sắp hạng Spearman Ðo lường sự tương quan giữa hai Hệ số tương quan
(Spearman's rank correlation) biến số
Tương quan sắp hạng Kendall (Kendall's Thay thế cho tương quan sắp hạng Hệ số tương quan
rank correlation) Spearman
Kiểm định tính phù hợp χ2 So sánh phân phối tần suất quan
(χ2 goodness of fit) sát với lí thuyết (xem chương
18)
Kiểm định Kolmogorov-Smirnov
(Kolmogorov-Smirnov test)
Một mẫu
Thay thế cho kiểm định tính phù
hợp χ2
Hai mẫu
So sánh hai phân phối tần suất

108
PHƯƠNG PHÁP PHI THAM SỐ

Các phương pháp phi tham số chính được liệt kê ở Bảng 20.1 cùng với các phương pháp
tham số tương ứng. Có ba phương pháp phổ biến nhất là kiểm định sắp hạng có dấu
Wilcoxon, kiểm định tổng sắp hạng Wilcoxon và tương quan sắp hạng Spearman sẽ được mô
tả bằng cách dùng cách thí dụ đã được phân tích bởi các kĩ thuật cổ điển. Ðối với các kiểm
định phi tham số khác độc giả nên đọc Siegel (1956). Nói một cách chặt chẽ, phương pháp χ2
được mô tả ở chương 13 và 14 cũng là phi tham số nhưng chúng là phương pháp chuẩn cho
việc phân tích tỉ lệ và bảng dự trù, nên chúng thường được kể là phương pháp cổ điển.

Kiểm định sắp hạng có dấu Wilcoxon


Ðây là kiểm định phi tham số tương đương với kiểm định t cặp đôi. Nó dùng dấu và độ lớn
tương đối của số liệu chứ không dùng giá trị thực. Thí dụ xem kết quả ở bảng 20.2 cho thấy
số giờ ngủ của 10 người khi dùng thuốc ngủ và khi dùng placebo, và sự khác biệt giữa chúng.
Kiểm định sắp hạng có dấu Wilcoxon (Wilcoxon sign rank test) gồm 4 bước căn bản.
Bảng 20.2 Kết quả của thử nghiệm lâm sàng để kiểm định hiệu quả của thuốc ngủ (giống số liệu với
Bảng 6.1), cùng với hạng (rank) để dùng cho kiểm định sắp hạng có dấu Wilcoxon.
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1
*Cùng hạng 3 và 4 nên được sắp hạng trung bình
1. Loại bỏ mọi hiệu số bằng zero. Sắp xếp các hiệu số còn lại theo thứ tự tăng dần của độ
lớn, bỏ qua dấu và gán cho chúng hạng (rank) 1, 2, 3 v.v.. Nếu hiệu số bằng nhau, như trong
trường hợp bệnh nhân 1 và bệnh nhân 2, lấy trung bình hạng của chúng. Các hạng được trình
bày trong Bảng 20.2
2. Cộng các hạng có hiệu số dương và các hạng theo hiệu số âm và kí hiệu tổng này là T+
và T-
T + = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5
T - = 3,5 + 1 = 4,5
3. Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ và placebo thì tổng T+ và T- phải
bằng nhau. Nếu có sự khác biệt thì một tổng sẽ lớn hơn và tổng kia sẽ nhỏ hơn. Kí hiệu tổng
nhỏ hơn là T

T = số nhỏ hơn của T+ và T-


Trong thí dụ này T = 4,5
4. Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc đánh giá T, số nhỏ hơn trong hai
tổng quan sát, T+ và T-, có nhỏ hơn số nhỏ hơn được kì vọng nếu chỉ có tình cờ. So sánh giá
trị thu được với giá trị quyết định (critical value) cho mức ý nghĩa 5%, 2%, 1% được trình
bày ở bảng A7. Lưu ý rằng cỡ mẫu thích hợp N là số các hiệu số được sắp hạng chứ không
phải tổng số các hiệu số và do đó không kể đến các hiệu số bằng zero.

109
Căn bản thống kê y học -Ðỗ Văn Dũng

N = số các hiệu số khác zero.


Ngược lại với các tình huống thường thấy, kết quả có ý nghĩa nếu nó nhỏ hơn giá trị quyết
định. Trong thí dụ này cỡ mẫu là mười và các điểm 5%, 2% và 1% tương ứng là 8, 5, 3. Kết
quả do đó có mức ý nghĩa 2% bởi vì 4,5 nhỏ hơn 5, chỉ ra rằng thuốc ngủ hiệu quả hơn
placebo.
Bảng 20.3 So sánh trọng lượng lúc sinh của con 15 người không hút thuốc lá và trọng lượng lúc sinh
của con 14 người hút thuốc lá nặng (số liệu giống như trong Bảng 7.1) với hạng dùng để dùng cho kiểm
định tổng sắp hạng Wilcoxon

Không hút thuốc Hút thuốc lá nặng


Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3
Tổng số = 272 Tổng số = 163
* Ðồng hạng 17, 18, 19 nên được xếp trung bình

Kiểm định tổng sắp hạng Wilcoxon


Ðây là kiểm định phi tham số tương đương với kiểm định t. Việc sử dụng kiểm định này được
trình bày trong khi xem xét số liệu trong bảng 20.3 trình bày trọng lượng lúc sinh của con 15
người không hút thuốc lá và 14 người hút thuốc lá nặng. Kiểm định tổng sắp hạng Wilcoxon
(Wilcoxon rank sum test) bao gồm 3 bước
1. Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như trong bảng. Nếu có
giá trị nào bằng nhau thì lấy trung bình của chúng
2. Cộng các hạng trong nhóm có cỡ mẫu nhỏ. Trong trường hợp này chính là nhóm
người hút thuốc lá và tổng sắp hạng là 163. Nếu hai nhóm có cỡ mẫu bằng nhau thì lấy nhóm
nào cũng được.

T = tổng các hạng của nhóm có cỡ mẫu nhỏ


3. So sánh tổng số này với giá trị quyết định trong bảng A8 được sắp đặt hơi khác với
các bảng kiểm định ý nghĩa khác. Hãy nhìn vào hàng tương ứng với cỡ mẫu của nhóm, trong
trường hợp này nó là hàng 14,15. Phạm vị của mức ý nghĩa 5% là 164 tới 256 và tương ứng
với giá trị không có ý nghĩa. Nói cách khác tổng số ở dưới 164 hay trên 256 sẽ là có ý nghĩa ở
mức 5%. Tổng 163 trong trường hợp này ở dưới giới hạn dưới 164 có nghĩa là trọng lượng
lúc sinh của con những người hút thuốc lá nhỏ hơn con những người không hút thuốc lá một
cách có ý nghĩa (P<0,05).

110
PHƯƠNG PHÁP PHI THAM SỐ

Tương quan sắp hạng Spearman


Ðây là số đo phi tham số để đo mức độ liên hệ giữa hai biến số. Phương pháp tham số tương
đương là hệ số tương quan đôi khi còn gọi là tương quan tích moment Pearson (Pearson's
product moment correlation), được mô tả ở chương 9. Giá trị của mỗi biến số được sắp
hạng độc lập và số đo dựa trên hiệu số giữa các cặp số liệu của hai biến. Ðiều này được minh
họa bằng việc sử dụng số liệu trong Bảng 20.4 trong quan hệ giữa thể tích huyết tương và
trọng lượng cơ thể của 8 người đàn ông khỏe mạnh. Có 4 bước căn bản:
1. Sắp hạng các giá trị của mỗi biến riêng, như trình bày trong bảng, nếu bất kì giá trị
nào giống nhau, lấy trung bình hạng của chúng. Nếu có một số lớn các giá trị giống nhau cần
phải dùng công thức điều chỉnh để tính tương quan. Người đọc tham khảo Siegel (1956) để
biết chi tiết.
2. Tính hiệu số d, giữa mỗi cặp sắp hạng, bình phương chúng và cộng lại. Trong thí dụ
này Sd2 bằng 16
3. Tính tương quan sắp hạng Spearman được kí hiệu bằng rs

6Σd 2
rs = 1− 2
n(n −1)
Trong đó n là số các đối đượng. Tương quan này có giá trị giữa -1 và +1, và cách lí giải tương
tự như tương quan thông thường. 1 tương ứng với sự phù hợp hoàn toàn giữa hạng của hai
biến số, zero tương ứng với sự không tương quan và -1 tương ứng với sự phù hợp nghịch đảo
hoàn toàn giữa các hạng
Trong thí dụ này
6 × 16
rs = 1 − = 0,81
8 × (82 − 1)
4. Ý nghĩa của sự liên quan được kiểm định bằng cách so sánh rs với mức ý nghĩa trong
Bảng A9. Giá trị 0,81 dựa trên 8 cặp có ý nghĩa ở mức 5% bởi vì 0,81 lớn hơn giá trị quyết
định 0,738 xác nhận quan hệ dương tính giữa thể tích huyết tương và trọng lượng cơ thể.
Khi có hơn 10 cặp, có thể đánh giá ý nghĩa bằng cách khác bằng cách dùng kiểm định t giống
như trong hệ số tương quan bình thường.

n−2
t = rs , d. f . = n − 2
1 − rs2

111
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 20.4 Quan hệ giữa thể tích huyết tương và trọng lượng cơ thể ở 8 người đàn ông khỏe mạnh
(giống số liệu trong Bảng 9.1) cùng với hạng và hiệu số hạng dùng để tính tương quan sắp hạng
Spearman.
Hiệu số Hiệu số
Trọng lượng cơ thể (kg) Thể tích tuyết tương (l) giữa các bình
hạng phương
Ðối tượng Giá trị(kg) Hạng Giá trị (lít) Hạng d d2
1 58,0 1 2,75 2 -1 1
2 70,0 5 2,86 4 1 1
3 74,0 8 3,37 7 1 1
4 63,5 3 2,76 3 0 0
5 62,0 2 2,62 1 1 1
6 70,5 6 3,49 8 -2 4
7 71,0 7 3,05 5 2 4
8 66,0 4 3,12 6 -2 4
Σd2= 16

112
LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU


Giới thiệu
Từ trước đến giờ chúng ta chỉ nhấn mạnh đến cách phân tích số liệu khi đã thu thập được
chúng. Trong 7 chương còn lại chúng ta sẽ thảo luận cách lập kế hoạch (plan) và tiến hành
(conduct) một nghiên cứu. Xem xét đầy đủ những vấn đề liên quan có tầm quan trọng hàng
đầu, bởi vì dù có phân tích tinh vi đến đâu cũng không thể cứu vớt được một nghiên cứu quy
hoạch kém hay được tiến hành sai. Chương này trình bày tổng quan những vấn đề quy hoạch
có liên quan, và chương 22 thảo luận về các nguồn sai số có thể phát sinh. Chương 23 tới 25
xem xét các loại quy hoạch nghiên cứu (study design) khác nhau một cách chi tiết và chương
26 xét vấn đề cỡ mẫu, đó là cách tính số các đối tượng cần được nghiên cứu để trả lời câu hỏi
quan tâm. Cuối cùng chương 27 giới thiệu về cách sử dụng máy tính.
Không thể trong một phạm vi hạn chế có thể bao trùm tất cả các lãnh vực một cách chi tiết.
Mục đích là mô tả đủ để người đọc trở nên quan thuộc với khái niệm liên quan và có thể quy
hoạch một nghiên cứu đơn giản và đánh giá các quy hoạch nghiên cứu của các nghiên cứu
được đăng trong y văn. Cần tham khảo các sách chuyên môn được liệt kê trong thư mục, thí
dụ như về nghiên cứu thử nghiệm lâm sàng và bệnh chứng, để có được những thảo luận
chuyên sâu.
Cuối cùng cần lưu ý rằng không có sự đồng ý hoàn toàn về cách phân loại các loại mục tiêu
và quy hoạch nghiên cứu khác nhau, cũng chẳng có một ranh giới rõ ràng giữa các loại. Tôi
đã chọn và chấp nhận một sơ đồ mà tôi tin là sẽ đạt được một cách tiện lợi, thực tiễn đẻ đánh
giá quy hoạch nào thích hợp cho một tình huống nhất định, chứ không phải chú trọng vào các
khía cạnh lịch sử của sự phát triển cảc loại quy hoạch khác nhau.

Mục tiêu của nghiên cứu


Ðiểm khởi đầu của mọi nghiên cứu là xác định rõ mục tiêu của nó bởi vì chúng sẽ xác định
quy hoạch nghiên cứu thích hợp và loại số liệu cần đến. Mục tiêu có thể được phân loại thành
một trong ba loại chính dưới đây. Một cuộc nghiên cứu thường có một số mục tiêu, và dĩ
nhiên có thể thuộc những loại mục tiêu khác nhau.
1. Ước lượng (estimation) một số đặc tính của dân số. Thí dụ, bao nhiêu phần trăm trẻ
em đã được tiêm chủng đầy đủ vaccine vào lúc tròn 3 tuổi hay trung bình số lần bị tiêu chảy
hàng năm của trẻ em dưới 5 tuổi ở Bangladesh?
2. Nghiên cứu sự liên quan (association) giữa một yếu tố quan tâm và một kết cuộc nào
đó, như là bệnh tật hay là chết. Thí dụ, có phải trẻ em bú mẹ ít bị chết hơn trẻ em không được
bú mẹ, hay nhiễm trùng hô hấp phổ biến hơn ở những trẻ mà ba mẹ có hút thuốc lá?
3. Lượng giá (evaluation) thuốc hay trị liệu hay một can thiệp nhằm giản mới mắc (hay
độ nặng) của bệnh. Thí dụ, có phải tiêm BCG giảm nguy cơ bị mụt cơm tái phát, hay việc sử
dụng mùng có giảm nguy cơ sốt rét, hay có phải phun thuốc diệt côn trùng vào mùng sẽ giúp
bảo vệ thêm?

Phân tích thống kê hộ tịch


Ðôi khi có thể trả lời mục tiêu bằng cách dùng thống kê hộ tịch (vital statisitics) hay các
thống kê y tế thu thập thường quy. Về mặt lịch sử, phân tích thống kê hộ tịch được ghi nhận
đầu tiên được tiến hành bởi John Graunt ở Luân đôn, người đã xuất bản cuốn sách Natural
and Political Observations upon the Bills of Mortality vào năm 1662. ngoài các điều khác,
Graunt còn khẳng định rằng nam nhiều hơn nữ trong cả sinh và tử, tỉ suất tử vong trẻ em cao
và sự biến thiên theo mùa của tử vong. Năm 1963, Edmund Halley dùng các giấy khai tử để
xây dựng bảng sống đầu tiên (xem Chương 16). Graunt đi trước thời đại của ông và truyền
thống phân tích không được tiến hành cho đến giữa thế kỉ 19 khi William Farr trở thành Tổng

113
Căn bản thống kê y học -Ðỗ Văn Dũng

Ðăng kiểm (Registrar General) đầu tiên ở Anh và xứ Wales. Farr đã áp dụng số liệu thống kê
hộ tịch vào nhiều vấn đề y tế công cộng bao gồm việc so sánh các tỉ suất tử vong giữa các
nhóm nghề nghiệp khác nhau.
Xem xét các số liệu thống kê hộ tịch được thu thập thường quy về sinh, tử vong và bệnh tật
cũng gợi ý cho sự liên hệ giữa bệnh tật và nguyên nhân. Thí dụ, sự gia tăng tử vong vì ung
thư phổi và sự liên hệ với sự gia tăng tần suất hút thuốc lá đầu tiên được lưu ý trong số liệu
thống kê hộ tịch. Giả thuyết này sau đó được kiểm định với các nghiên cứu bệnh chứng và
đoàn hệ được quy hoạch đặc biệt (xem ở dưới).

Nghiên cứu quan sát


Nói chung, cần tiến hành một nghiên cứu đặc biệt để thu thập số liệu thích hợp để trả lời cho
một mục tiêu chuyên biệt. Mục tiêu ước lượng và quan hệ dẫn tới những nghiên cứu có bản
chất quan sát (observational); diễn tiến tự nhiên của bệnh được quan sát mà nghiên cứu
không có ý muốn thay đổi nó. Mục tiêu đánh giá có thể được trả lời bởi nghiên cứu quan sát
hay thực nghiệm (experimental), phụ thuộc vào loại biện pháp được đánh giá và biện pháp đó
đã được sử dụng hay chưa. Một thí dụ của nghiên cứu quan sát là đánh giá hiệu quả của tiêm
BCG chống lại bệnh lao ở một vùng có chương trình tiêm chủng tích cực ở đó BCG được
tiêm chủng thường quy, bởi vì việc lựa chọn có tiêm hay không tiêm không phụ thuộc vào
người nghiên cứu. Ngược lại, thử một loại vaccine chống sốt rét mới có lẽ là thực nghiệm.
Quy hoạch nghiên cứu quan sát có thể chia thành ba loại chính, cắt ngang, cắt dọc (kể cả
đoàn hệ) và nghiên cứu bệnh chứng. Sơ đồ lấy mẫu thích hợp cho nghiên cứu cắt ngang và
cắt dọc được mô tả chi tiết ở Chương 23. Nói chung mục tiêu là sử dụng phương pháp mà
mọi người có cơ hội được chọn bằng nhau, đó là sơ đồ xác suất cân bằng (equal probability
scheme). Người có thể được chọn riêng cá nhân hay chọn thành cụm, mặc dù cần một cỡ
mẫu lớn hơn cho việc chọn cụm. Dù vậy các khó khăn tài nguyên và hậu cần thường làm cho
không thể xét một số lượng các cụm đủ để có một bức tranh đại diện và kết quả có khi chỉ
dựa trên điều tra một cộng đồng. Ðánh giá tính đại diện là vấn đề chủ quan chứ không phải
thống kê. Ðiều này ít quan trọng nếu mục tiêu chính là nghiên cứu sự liÊu quan chứ không
phải là ước lượng. Phương pháp đo lường sự liên quan đươc trình bày ở Chương 24, ở đó
cũng xét các khía cạnh quy hoạch đặc hiệu của nghiên cứu bệnh chứng.
Nghiên cứu cắt ngang
Nghiên cứu cắt ngang (cross-sectional study) được tiến hành tại một thời điểm trong thời
gian hay trong một khoảng thời gian ngắn. Nghiên cứu cắt ngang rất nhanh, rẻ, và dễ tiến
hành và có thể phân tích ngay. Bởi vì chúng có thể ước lượng những đặc tính của cộng đồng
tại một thời điểm chúng thích hợp cho việc đo lường bệnh toàn bộ chứ không thích hợp cho
bệnh mới mắt và khó giải thích mối liên quan tìm thấy. Thí dụ, một cuộc điều tra về
onchocerca cho thấy có hai khả năng của sự liên hệ này. Thứ nhất là những người có tình
trạng dinh dưỡng kém có sức đề kháng kém và do đó dễ bị mù hơn do onchocerca. Thứ nhì là
tình trạng dinh dưỡng kém là hậu quả của không phải là nguyên nhân của mù lòa, bởi vì
người mù không thể tự kiếm sống. Cần nghiên cứu cắt dọc để quyết định lời giải thích nào là
hợp lí hơn.
Nghiên cứu cắt dọc
Trong nghiên cứu cắt dọc (longitudinal study) các cá nhân được theo dõi theo thời gian,
khiến cho có thể đo lường bệnh mới mắc và các thay đổi theo thời gian và dễ dàng nghiên
cứu diễn tiến tự nhiên của bệnh. Trong một vài tình huống có thể theo dõi số liệu sinh, tử
vong, đợt bệnh bằng việc giám sát liên tục (continous monitoring), thí dụ bằng việc giám sát
các hồ sơ đăng kí trong dân số có hệ thống khai tử. Ðôi khi việc thu thập số liệu là hồi cứu
(restrospective) được tiến hành trong các hồ sơ cũ. Phổ biến hơn nó có thể là tiền cứu
(prospective) và vì lí do ngày, nghiên cứu cắt dọc thường được gọi là nghiên cứu tiền cứu.

114
LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

Trong đa số các trường hợp, cách đơn giản nhất để tiến hành nghiên cứu cắt dọc là tiến hành
nhiều lần điều tra cắt ngang (repeated cross- sectional surveys) ở những khoảng thời gian cố
định và điều tra hay đo lường những thay đổi đã xảy ra giữa các cuộc điều tra, như sinh, tử
vong, di trú, thay đổi trọng lượng hay mức kháng thể, hay xuất hiện các đợt bệnh mới.
Khoảng được chọn phụ thuộc vào các yếu tố được nghiên cứu. Thí dụ, để đo lường mới mắc
tiêu chảy, được đặc trung bởi sự lặp đi lặp lại những cơn bệnh ngắn, số liệu cần thu thập hàng
tuần để đảm bảo nhớ lại chính xác. Ðể giám sát sự phát triển trẻ em chỉ cần đo lường mỗi một
hay ba tháng.
Dân số nghiên cưu có thể là động hay cố định. Trong một dân số động (dynamic) các cá nhân
rời khỏi nghiên cứu khi nó không còn tuân theo định nghĩa dân số trong khi các cá nhân mới
thỏa mãn điều kiện có thể tham giaa. Một thí dụ là nghiên cứu mới mắc của bệnh tiêu chảy
trong trẻ dưới 5 tuổi, trong đó việc giám sát sẽ dừng lại khi nó đạt được 5 tuổi trong khi các
trẻ mới sinh được chiêu mộ vào dân số khi mới sinh. Trong tình huống cố định (fixed), dân số
được xác định lúc đầu và ngoài lí do chết, di chuyển hay mất dấu theo dõi, cấu trúc dân số
vẫn giữ nguyên trong suốt nghiên cứu. Một dân số cố định được gọi là đoàn hệ (cohort), như
là các đoàn hệ sinh vào năm 1984 (birth cohort of 1984), đó là tất cả những người cùng
sinh năm 1984. Một thí dụ khác là một đoàn hệ công nghiệp những người làm trong công
nghiệp năng lượng nguyên tử giữa 1970 và 1974.
Bù lại nhiều ưu điểm, nghiên cứu cắt dọc có một số khuyết điểm. Thứ nhất việc phân tích
phức tạp hơn trong nghiên cứu cắt ngang và có thể cần những phương tiện xử lí số liệu tinh
vi. Việc liên kết kết quả giữa các cuộc điều traaa không dễ dàng và phải chấp nhận sự di
chuyển, tử vong hay nhập cuộc mới. Cần điều chỉnh cho việc già đi của nhóm theo thời gian.
Thứ nhì, cần thời gian nghiên cứu dài hơn và nhiều cuộc điều tra, tỉ suất bỏ cuộc và không
đáp ứng cao hơn và vấn đề số liệu không hoàn chỉnh lớn hơn. Cuối cùng nghiên cứu cắt dọc
có thể tốn kém hơn và đặc ra nhiều vấn đề hậu cần trong việc thực hiện.
Nghiên cứu bệnh chứng
Nghiên cứu bệnh chứng (case control study) được dùng để tìm hiểu sự liên hệ giữa một
yếu tố nhất định và một bệnh nhất định. Việc quy hoạch rất khác với những loại nghiên cứu
khác bởi vì được việc lấy mẫu được tiến hành tùy theo tình trạng bệnh tật chứ không phải
theo tình trạng tiếp xúc. Một nhóm các đối tượng được xác định là có bệnh, bệnh (case) được
so sánh với một nhóm không có bệnh, chứng (control). Thí dụ để đánh giá việc bú sữa mẹ
có bảo vệ đứa trẻ không bị chết, nhóm bệnh gồm những đứa trẻ bị chết trong năm đầu tiên
và nhóm chứng là những đứa trẻ sống trong cùng khu vực có cùng tuổi và giới tính với bệnh.
Nếu giả thuyết đúng thì số bệnh sẽ ít bú sữa mẹ hơn nhóm chứng.
Nghiên cứu bệnh chứng đặc biệt thích hợp với các bệnh hiếm, bởi vì nó cần một cỡ mẫu nhỏ
hơn đáng để so với nghiên cứu cắt ngang hoặc cắt dọc tương ứng. Chúng tương đối rẻ tiền,
nhanh chóng, dễ tiến hành và cho phép tính số mới mắc tương đối của bệnh (xem Chương 24)
trong nhóm tiếp xúc và nhóm không tiếp xúc với yếu tố quan tâm. Tính phức tạp của phương
pháp nằm ở chỗ cần phải xem xét cẩn thận trong việc quy hoạch để giảm thiểu sai lệch (bias)
và các phân tích tương đối tinh vi cần thiết. Ðặc biệt vấn đề chọn nhóm chứng cũng là vấn đề
gây tranh luận. Nghiên cứu bệnh chứng thường thành công nhất trong việc phát hiện những
tác động lớn, bởi vì nó dễ dàng thuyết phục rằng tác động đó là thực chứ không phải là hình
ảnh giả tạo do quy hoạch. Cuối cùng, nghiên cứu bệnh chứng (giống như nghiên cứu cắt
ngang) không thích hợp nếu như bệnh hưởng đến yếu tố nguy cơ và cũng có thể là hậu quả
của yếu tố nguy cơ như trong trường hợp suy diinh dưỡng là yếu tố nguy cơ của tiêu chảy.

Nghiên cứu thực nghiệm


Nghiên cứu y khoa có bản chất thực nghiệm có thể phân làm 3 nhóm chính tùy theo bản chất
của đo lường được lượng giá
1. Thử nghiệm lâm sàng (clinical trials ) thuốc hay các biện pháp điều trị

115
Căn bản thống kê y học -Ðỗ Văn Dũng

2. Thử nghiệm vaccine (vaccine trials)


3. Thử nghiệm can thiệp (intervention trials)
(a) các chế độ dự phòng (không phải vaccine), thí dụ cho thuốc chống sốt rét trong 5
năm đầu tiên của cuộc sống cho trẻ ở vùng bị lưu hành sốt rét. Những nghiên cứu
ngày đôi khi còn được gọi là thử nghiệm dự phòng (prophylactic trials)
(b) Các biện pháp phòng ngừa, thí dụ như dùng mùng bảo vệ chống sốt rét.
Việc quy hoạch được thảo luận chi tiết ở Chương 25. Thành phần căn bản là việc định vị cá
nhân vào các nhóm thực nghiệm khác nhau dưới sự kiểm soát của người nghiên cứu, và sự
định vị này phải đảm bảo các nhóm càng giống nhau càng tốt về các mặt ngoại trừ chế độ hay
biện pháp điều trị được lượng giá. Nên sử dụng thử nghiệm có kiểm soát mù đôi (double-
blind controlled trial) (xem Chương 25) để tránh sai lệch (bias).

Quy hoạch bản vấn lục


Trong hầu hết các cuộc nghiên cứu cần phải chuẩn bị một biểu mẫu ghi nhận được quy hoạch
đặc biệt hay một bản vấn lục để thu thập số liệu. Nó phải càng ngắn gọn càng tốt và cần phải
tránh sự cám dỗ muốn hỏi tất cả các câu hỏi. Bảng vấn lục quá dài sẽ làm mệt mỏi người
phỏng vấn và người được phỏng vấn và có thể dẫn tới câu trả lời sai lầm. Câu hỏi phải rõ
ràng và không mơ hồ và phải viết rõ ràng bởi vì chúng sẽ được đọc. Phải tránh các từ kĩ thuật
hay các từ dài cũng như các câu hỏi âm tính, các câu hỏi gợi ý và các câu hỏi giả thuyết.
Cần phải suy nghĩ cẩn thận về thứ tự thu thập thông tin và bảng vấn lục sẽ được tự điền hay
được người phỏng vấn hoàn thành. Phải có một tiến trình logic xuyên suốt biểu mẫu để cho
nó dễ dàng theo dõi. Các câu hỏi được sắp xếp thành các phần. Cần phải chỉ rõ việc hoàn tất
một phần nào đó có phụ thuộc vào câu hỏi trước đó hay không, và điểm tiếp theo của phần
phải được nhận dạng dễ dàng. Tốt nhất nên giảm thiểu số bước nhảy có thể xảy ra bởi vì có
thể có lầm lẫn và các phần có thể bị bỏ sót. Bản vấn lục phải được kí hiệu với tên của nghiên
cứu và tên người trả lời và số danh bộ nghiên cứu. Nó phải được lập lại trên mỗi trang. Phần
tiếp theo thường gồm các thông tin nhận dạng như tuổi, giới tính, và địa chỉ. Nói chung cần
sắp xếp các phần tiếp theo theo thứ tự quan trọng của thông tin đối với nghiên cứu, để cho
phần thông tin quan trọng nhất được thu thập khi người phỏng vấn và người được phỏng vấn
đều thoải mái nhất và ít chán nhất. Dù vậy, bất cứ câu hỏi tế nhị nào phải để sau cùng.
Câu hỏi đóng và câu hỏi mở
Câu hỏi có 2 dạng, mở và đóng. Câu hỏi mở (open question) được dùng để tìm kiếm thông tin
và người phỏng vấn ghi nhận câu trả lời trong dạng viết tự do. Không có định kiến về và câu
trả lời nào sẽ xảy ra. Mặt khác trong câu hỏi đóng (close question), câu trả lời giới hạn ở
trong danh sách các câu trả lời có thể. Danh sách này nên có một mục cho 'các ý kiến khác'
với chỗ trống để viết chi tiết và mục 'không biết'. Người phỏng vấn có hướng dẫn người trả
lời từ mục này tới mục khác trong danh sách hay hỏi dưới dạng mở và đánh dấu mục tương
ứng với câu trả lời. Câu hỏi đóng và câu hỏi mở có ưu điểm và khuyết điểm riêng và việc
chọn lựa phụ thuộc rất nhiều vào hoàn cảnh cụ thể. Trả lời cho câu hỏi đóng dễ xử lí nhưng
câu hỏi mở cho nhiều chi tiết thông tin sâu sắc hơn. Một khả năng là dùng câu hỏi mở trong
giai đoạn nghiên cứu dẫn dường và dùng kết quả để rút ra danh sách các câu trả lời cho câu
hỏi đóng trong nghiên cứu chính.
Mã hóa
Các số liệu số phải được ghi nhận càng chi tiết càng tốt và nên ghi nhận giá trị riêng biệt chứ
không mã hóa trước trong bản vấn lục thành nhiều nhóm. Xét thí dụ về tuổi. Các lựa chọn tốt
là ghi ngày sinh và sau đó tính tuổi từ ngày sinh và ngày phỏng vấn. Lựa chọn tốt tiếp theo là
ghi tuổi của người trả lời, thí dụ như năm cho người lớn, tháng cho trẻ nhỏ, tuần cho trẻ nhũ
nhi và ngày cho trẻ sơ sinh. Các kém thuận lợi nhất là ghi nhận người trả lời thuộc nhóm tuổi
nào như từ 0-4, 5-9, 10-14, 15-24, 25-44, 45-64 và 65+ tuổi. Ðơn vị đo lường phải được ghi

116
LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

rõ, thí dụ trọng lượng được tính theo kilogram hay pound và phải chỉ số số các số lẻ. Với câu
hỏi đóng, mã hóa số tương ứng cần phải in dọc theo danh sách các câu trả lời. Với câu hỏi
mở, cần phải mã hóa câu trả lời sau khi hoàn thành bản vấn lục và phải chừa trống cho việc
mã hóa.
Nếu số liệu được nhập vào máy tính cần phải nhớ điều này khi quy hoạch bản vấn lục. Thí dụ
nó có thể làm nhanh quá trình nhập liệu nếu tất cả các thông tin cần nhập đươc mã hóa thành
ô dọc theo bên lề phải của biểu mẫu. Trong đa số trường hợp cần gán mã số cho câu trả lời
không phải là số như mã 1 cho đàn ông và 2 cho đàn bà. Cần một ô cho mỗi số (hay mỗi kí
tự), tổng số các ô cần thiết cho biến được xác định bằng số tối đa các chữ số cần ghi nhận cho
biến đó. Nếu có thể tránh sử dụng mã zero bởi vì nhiều chương trình máy tính và nhiều gói
phần mềm thống kê không thể phân biệt zero với không trả lời, không có số liệu.
Câu hỏi nhiều trả lời
Câu hỏi nhiều trả lời (multiple response questions) cần phải xem xét đặc biệt. Nó có thể xử trí
bằng 2 cách. Thí dụ, trong nông thôn Tây Phi, một gia đình có thể dùng một hay nhiều trong
tám loại nguồn nước (nước mưa, nước giếng sâu, nước giếng, suối phun, sống, hồ, cao, suối)
để uống. Phương pháp thứ nhất là gán một ô cho mỗi câu trả lời có thể, trong trường hợp này
là 8 ô. Mỗi ô sẽ chứa mã '1' cho việc sử dụng và '2' cho việc không sử dụng nguồn đó. Nếu
một gia đình dùng nước mưa và cũng lấy nước từ sông, ô nước mưa (số một) và ô nước sông
(số năm) sẽ chứa mã '1' trong khi 6 ô còn lại sẽ chứa mã '2'. Phương pháp thứ nhì là gán mã 1
tới 8 cho 8 loại nguồn nước khác nhau và quyết định số câu trả lời tối đa mà gia đình có thể
trả lời. Giả sử rằng chúng ta quyết định giới hạn là 3 trả lời. Chúng ta sẽ để 3 ô mã hóa cho
câu hỏi và nhập mã số của nguồn nước. Gia đình dùng nước mưa và nước sông sẽ được mã
hóa 1 (nước mưa) trong ô 1 và 5 (nước sống) trong ô 2. Ô 3 sẽ để trống. Mã có thể được nhập
theo thứ tự của số, như chúng ta đã làm, hay theo một thứ tự logic, như theo số lượng nước sử
dụng của mỗi nguồn.

Kiểm tra số liệu


Mọi bản vấn lục phải được kiểm tra kĩ lưỡng sau khi hoàn tất và khi số liệu được nhập liệu.
Không thể bỏ qua tầm quan trọng của vấn đề này. Kiểm tra phải được tiến hành ngay sau khi
thu thập số liệu để có cơ hội tối đa giải quyết các thắc mắc. Kiểm tra có hai loại chính, kiểm
tra phạm vi và kiểm tra tính phù hợp. Kiểm tra phạm vi (range checks) loại bỏ, chẳng hạn
như xuất hiện mã 3 cho giới tính, mà lẽ ra chỉ là mã 1 (nam) hay mã 2 (nữ). Kiểm tra tính
phù hợp (consistency checks) phát hiện những tổ hợp không thể có của số liệu như người đàn
ông mang thai, hay 3 tuổi nặng 70 kg. Phân tán đồ cho thấy sự liên hệ giữa hai biến đặc biệt
hữu ích trong trường hợp này, bởi vì nó cho phép phát hiện dễ dàng các tổ hợp kì lạ.
Cần lưu ý 3 điểm cơ bản để giảm thiểu sai số xảy ra trong xử lí số liệu. Thứ nhất là tránh các
việc sao chép không cần thiết số liệu từ biểu mẫu này tới biểu mẫu khác. Thứ nhì là dùng
thao tác kiểm chứng (verification) trong khi nhập liệu. Số liệu được nhập hai lần, tốt nhất là
bởi hai người khác nhau, bởi vì nó cho phép đánh giá độc lập các con số viết tháu. Hai tập
hợp số liệu được so sánh với nhau và giải quyết các điểm không thống nhất. Thứ ba là kiểm
tra các tính toán cẩn thận, hoặc là bằng sự lặp lại hay là chẳng hạn như kiểm tra lại tổng từng
phần cộng lại có bằng tổng số chung hay không. Khi sử dụng máy tính, cần phải thao tác ban
đầu trên một nhóm số liệu nhỏ và kiểm tra lại bằng tính tay.

117
Căn bản thống kê y học -Ðỗ Văn Dũng

NGUỒN GỐC SAI SỐ


Giới thiệu
Ðiều quan trọng là nhận thức rằng các loại sai số khác nhau có thể xâm nhập vào việc quy
hoạch, tiến hành và phân tích nghiên cứu để có thể giảm thiểu sự xuất hiện sai số. Chúng ta
bắt đầu bằng sự phân biệt giữa hai loại chính, sai số hệ thống (systematic) và ngẫu nhiên
(random). Thí dụ, xét kết quả một thực nghiệm để đánh giá sự phù hợp giữa các điều
dưỡng trong việc đo huyết áp. Bốn điều dưỡng cùng đo 10 người tình nguyện. Việc xem xét
kết quả cho thấy mặc dù các điều dưỡng A, B, C không có cùng một kết quả như nhau nhưng
không có một mô thức không phù hợp và giá trị trung bình giống nhau. Do đó mọi sai số xuất
hiện đều là ngẫu nhiên. Ngược lại điều dưỡng D đọc huyết áp luôn luôn thấp hơn các cộng sự
của cô và trung bình của cô thấp hơn 10 mmHg. Cô mắc phải sai số hệ thống và ước lượng
trung bình của cô ta không đúng, thấp hơn trị số thực. Kết quả của cô ta bị sai lệch (bias).
Mỗi giai đoạn nghiên cứu đều có thể bị sai số hệ thống. Chúng nguy hiểm bởi vì sai lệch có
thể dẫn đến những kết luận không hợp lệ. Mặc khác sai số ngẫu nhiên giảm độ chính xác
nhưng không ảnh hưởng tới tính hợp lệ. Chúng xảy ra trong khi thu thập số liệu do bản vấn
lục hay các thiết bị bị hỏng, quan sát sai, sai lầm người trả lời và trong quá trình xử lí số liệu
do việc mã hóa, sao chép, nhập liệu, viết chương trình, sai số tính toán. Sai số cũng phát sinh
trong khi chọn phương pháp phân tích không đúng và lí giải sai kết quả.
Sai lệch có thể được phân loại thành 3 loại chính: sai lệch chọn lựa, sai lệch thông tin và sai
lệch gây nhiễu. Tất cả chúng đều dễ xảy ra trong nghiên cứu quan sát hơn trong nghiên cứu
thực nghiệm, ở đó chúng có thể tránh được bằng cách dùng quy hoạch mù đôi có kiểm soát
ngẫu nhiên hóa (randomized controlled double-blind design) (xem Chương 25). Chúng đặc
biệt là vấn đề trong quy hoạch bệnh chứng. Chúng ta sẽ xét ngắn gọn các loại sai lệch. Ðể có
thêm chi tiết tham khảo Kleinbaum et al. (1982). Sau đó chúng ta sẽ xét hai tham số, độ nhạy
cảm và độ đặc hiệu, được ung để đánh giá khả năng một thao tác phân loại đúng tình trạng
bệnh tật (hay tiếp xúc) của một cá nhân. Cuối cùng, chúng ta sẽ xét một trường hợp đặc biệt
của sai lệch, phát sinh từ hiện tượng gọi là hồi quy về trung bình.

Sai số chọn lựa


Sai số chọn lựa (selection bias) có thể do một (hay cả hai) loại khiếm khuyết khác nhau trong
quy hoạch về đối tượng được chọn nghiên cứu. Thứ nhất là nếu đối tượng được chọn lọc khác
biệt có hệ thống với các đối tượng không được chọn lọc. Nguyên nhân chính là tỉ suất không
đáp ứng cao, thất lạc theo dõi hay cơ cấu lấy mẫu sai. Thí dụ, trong nhiều quốc gia việc
nghiên cứu các trường hợp tiêu chảy nặng dựa vào bệnh viện sẽ loại bỏ các trường hợp cấp
tính chết trước khi đến bệnh viện và sẽ loại bỏ chọn lọc những người sống xa bệnh viện và
những gia đình có tình trạng kinh tế xã hội hay giáo dục kém, bởi vì họ là những người ít sử
dụng các phương tiện y tế. Loại thứ hai là sai lệch chọn lọc trong nghiên cứu so sánh do việc
chọn nhóm so sánh không đúng, khác biệt về mức độ theo dõi y khoa, về việc nhập viện, dẫn
tới khả năng được chẩn đoán trong nhóm tiếp xúc cao hơn số với nhóm không tiếp xúc (ngộ
biện Berkson - Berkson's fallacy), khác biệt sống còn hay khác biệt theo dõi.

Sai lệch gây nhiễu


Sai lệch gây nhiễu (confounding bias) xảy ra khi có sự khác biệt quan trọng giữa các nhóm
được so sánh mà sự khác biệt này có liên quan đến biến số khác tâm. Một thí dụ đã được thảo
luận ở Chương 14 trong Bảng 14.4, trong đó chúng ta đã so sánh mắc toàn bộ của leptospira
trong người lớn ở nông thôn và thành thị. Trong trường hợp này giới tính là biến số gây
nhiễu, bởi vì không chỉ tỉ suất mắc toàn bộ cao hơn ở nam so với nữ mà cấu trúc dân số của
thành thị và nông thôn khác nhau. chúng ta có thể khắc phục bằng cách xây dựng những bảng
2 × 2 riêng cho nam và cho nữ và sử dụng kiểm định χ2 Mantel-Haenszel.

118
NGUỒN GỐC SAI SỐ

Vấn đề gây nhiễu là một vấn đề có thể xảy ra cho mọi nghiên cứu. Có thể kiểm soát bằng quy
hoạch sử dụng kĩ thuật bắt cặp mô tả ở Chương 24 và 25, và trong nghiên cứu thực nghiệm
bằng cách ngẫu nhiên hóa các cá nhân vào các nhóm thực nghiệm khác nhau. Không giống
như các loại sai lệch khác, sai lệch gây nhiễu có thể được điều chỉnh trong giai đoạn phân
tích.

Sai lệch thông tin


Sai lệch thông tin (information bias) do sự đo lường hay trả lời sai một cách có hệ thống hay
từ việc phân loại sai các tình trạng tiếp xúc và bệnh tật. Nó có nhiều nguyên nhân khác nhau.
Các nguyên nhân bao gồm các sai sót trong bản vấn lục, các sai số quan sát, các sai số do
người trả lời, sai số do dụng cụ. Sai sót trong bản vấn lục có thể do câu hỏi không đúng về
mặt văn hóa, cách dùng từ mơ hồ hay có quá nhiều câu hỏi. Sai số quan sát có thể do hiểu
lầm các thao tác, lí giải sai các câu trả lời, hay chỉ do sai lầm. Nghiêm trọng hơn, các sai số
quan sát có thể làm sai lệch phát hiện của nghiên cứu do sự khác biệt trong đánh giá, trong
thăm dò hay trong việc lí giải các câu trả lời còn nghi ngờ, nếu người quan sát biết được tình
trạng tiếp xúc hay bệnh tật của người trả lời. Ðiều này dễ xảy ra khi người phỏng vấn biết giả
thuyết của nghiên cứu.
Sai số do người trả lời có thể bắt nguồn từ việc hiểu lầm, nhớ lại sai lầm, trả lời bằng các câu
trả lời được cảm nhận là 'đúng' hay do thiếu quan tâm. Trong một số trường hợp người trả lời
có thể trả lời sai có ý thức, chẳng hạn như khi mắc cỡ với câu hỏi về bệnh hoa liễu hay ngại
vì câu trả lời sẽ bị chuyển đến cơ quan thuế. Cuối cùng, sai số do dụng cụ là việc cân chỉnh
sai, thuốc thử không tinh khiết, thuốc thử pha loãng hay trộn không đúng cách hay do kiểm
định chẩn đoán sai.

Ðộ nhậy cảm và độ đặc hiệu


Khả năng một thao tác phân loại đúng các cá nhân vào một trong hai nhóm, chẳng hạn như
bệnh và không bệnh, tiếp xúc hay không tiếp xúc, dương tính hay âm ính, có nguy cơ cao hay
không được đánh giá bởi 2 thông số độ nhạy cảm và độ đặc hiệu. Ðộ nhạy cảm (sensitivity) là
tỉ lệ thực sự dương tính được chẩn đoán đúng và bằng 1 trừ cho tỉ suất âm tính giả (false
negative rate). Ðộ đặc hiệu (specificity) là tỉ lệ thực sự âm tính được chẩn đoán đúng và bằng
1 trừ cho tỉ suất dương tính giả (false positive rate). Thí dụ, bảng 22.1 trình bày kết quả của
một nghiên cứu dẫn đường để đánh giá khả năng bố mẹ nhớ lại đúng tình trạng tiêm chủng
của trẻ, khi so với các hồ sơ sức khỏe chính thức. Trong 6 trẻ đã được tiêm chủng BCG, hầu
hết, 55 trẻ được xác định đúng là đã tiêm chủng bởi cha mẹ của chúng, độ nhậy cảm tính ra là
55/60 hay 91,67%. Ngược lại 15 trong 40 trẻ không có hồ sơ về tiêm chủng BCG được bố mẹ
cho là đã tiêm chủng, độ đặc hiệu là 25/40 hay 62,5%.
Bảng 22.1 So sánh sự nhớ lại của cha mẹ về tình trạng tiêm chủng của con với tình trạng tiêm chủng ghi
trong hồ sơ sức khỏe chính thức.
Tiêm chủng BCG theo bố mẹ khai
Tiêm chủng BCG theo hồ sơ Có Không Tổng số
sức khỏe chính thức
Có 55 5 60
Không 15 25 40
Tổng số 70 30 100
Số đo độ nhạy cảm và đặc hiệu rất quan trọng trong đánh giá một thử nghiệm sàng lọc
(screening test). Cần lưu ý có mối liên hệ ngược giữa hai số đo này, xiết chặt (hay nới
lỏng) tiêu chuẩn để cải thiện số đo này sẽ giảm độ lớn của số đo kia. Ðường phân biệt chúng
phụ thuộc vào bản chất của cuộc nghiên cứu. Thí dụ, trong thiết kế một cuộc nghiên cứu để
thử nghiệm một loại vaccine bệnh phong mới, lúc đầu cần loại bỏ tất cả các bệnh nhân
phong.Do đó người ta mong muốn một thử nghiệm có tỉ suất phát hiện dương tính thành công

119
Căn bản thống kê y học -Ðỗ Văn Dũng

cao, hay nói cách khác có độ nhạy cảm cao. Người ta không quan tâm nhiều đến độ đặc hiệu,
bởi vì nó không ảnh hưởng gì nếu một trường hợp thực sự âm tính bị xác định lầm là dương
tính và loại bỏ. Ngược lại, khi phát hiện các trường hợp mắc bệnh trong giai đoạn theo dõi
sau khi tiêm chủng, người ta muốn một thử nghiệm có độ nhạy cảm cao, bởi vì điều quan
trọng là phải tin chắc rằng tất cả các trường hợp dương tính được phát hiện là đúng, và nếu ít
quan trọng hơn nếu chúng bị bỏ qua.

Hồi quy về trung bình


Hồi quy về trung bình nói về một hiện tượng đầu tiên được quan sát bởi Galton khi ông ta
đầu tiên lưu ý rằng chiều cao của một số con trai có khuynh hướng dần tiến trung bình so với
chiều cao của cha. Do đó người cha cao dễ có người con thấp hơn họ, trong khi đối với người
ta thấp thì ngược lại. Không hiểu được điều này có thẻ dẫn tới lí giải sai trong hai trường hợp.
Thứ nhất là hiệu số giữa hai lần đo lường có liên quan đến số đo lần thứ nhất. Thí nhì là
trường hợp chỉ những cá nhân cực đoan trong phân phối được chọn điều trị và theo dõi. Ðiều
này có thể lí giải bằng cách xét sự đo huyết áp lập lại và đánh giá tác dụng của thuốc hạ áp
lên huyết áp.
Hình 22.1 trình bày quan hệ giữa hai huyết áp tâm trương đọc cách nhau 6 tháng trên 50
người tình nguyện. Có thể thấy rằng ngoài sự biến thiên ngẫu nhiên có sự phù hợp giữa hai
lần đo. Dù vậy bức tranh khi hiệu số giữa hai lần đọc được liên kết với trị số ban đầu sẽ khác
hẳn (Hình 22.2). Có vẻ rằng có một khuynh độ đi xuống và những người có huyết áp ban đầu
cao sẽ giảm huyết áp sau 6 tháng và ngược lại đối với người có huyết áp ban đầu thấp. Ðiều
này hoàn toàn chỉ là sự liên hệ toán hợp giữa hiệu số (BP2 - BP1) và huyết áp lúc đầu BP1,
bởi vì BP1 có mặt ở cả hai biến số.

Hình 22.1 Quan hệ giữa hai huyết áp tâm trương cách nhau 6 tháng trên 50 người tình nguyện
cho thấy sự thay đổi rất ít. Ðương thăng là quan hệ khi hai huyết áp trong hai trường hợp giống
hệt nhau.

Ðôi khi người ta muốn đánh giá có phải sự thay đổi trong điều trị có liên quan đến giá trị ban
đầu. Chúng ta hãy xem xét ý nghĩa của hồi quy về trung bình đối với thử nghiệm lâm sàng
của thuốc hạ huyết áp. Những thử nghiệm như vậy chỉ giới hạn ở những người có huyết áp
tâm trương ban đầu cao, chẳng hạn như trên 120 mmHg. Có thể thấy từ hình 22.2 rằng những
người được theo dõi trong một thời gian và đo lường lại huyết áp sẽ có số trung bình giảm đi,

120
NGUỒN GỐC SAI SỐ

ngay cả khi không có một trị liệu nào. Do đó cần có một nhóm chứng có huyết áp tương tự và
để đánh giá mức giảm huyết áp trong nhóm điều trị bằng cách so sánh với mức giảm quan sát
được trong nhóm chứng.

Hình 22.2 Thay đổi trong huyết áp tâm trương vẽ với giá trị ban đầu. Tương quan âm giả tạo (r=-0,42,
d.f.=48, P<0,01). Ðường thăng là đường thẳng hồi quy tương ứng với sự liên hệ này.

Hình 22.3 Thay đổi huyết áp tâm thu vẽ so với trung bình của huyết áp lần đầu và lần sau. Mối tương
quan không ý nghĩa (r = -0,22, d.f.=48, P=0.12) cho thấy hình ảnh chân thật không có liên quan giữa
BP2-BP1 và huyết áp.

121
Căn bản thống kê y học -Ðỗ Văn Dũng

Ðể đánh giá xem tác dụng của thuốc có liên quan đến mức huyết áp hay không, có thể sử
dụng phương pháp được đề nghị bởi Oldham (1962). Hiệu số (BP1-BP2) được vẽ đối với
trung bình của giá trị huyết áp lúc đầu và lúc sau (BP1+BP2)/2 chứ không phải với giá trị ban
đầu. Tương quan âm tính của những biến số này có nghĩa là có khuynh hướng người có huyết
cao giảm nhiều hơn những người có huyết áp thấp và tương quan dương tính có nghĩa ngược
lại. Hình 22.3 trình bày đồ thị của (BP1 - BP2) với (BP1+BP2)/2 cho số liệu của hình 22.1.
Sự tương quan không có ý nghĩa có nghĩa rằng phương pháp Oldham khắc phục sự liên hệ giả
tạo giữa giảm huyết áp và huyết áp ban đầu gây ra do sự hồi quy về trung bình.

122
PHƯƠNG PHÁP LẤY MẪU

PHƯƠNG PHÁP LẤY MẪU


Giới thiệu
Vai trò của điều trị cắt ngang và cắt dọc đã được phác họa trong Chương 21. Chúng ta sẽ mô
tả các lược đồ lấy mẫu (sampling schemes) có thể được dùng. Ðôi khi một cuộc tổng điều tra
(census) dân số được tiến hành nhưng thường người ta chỉ nghiên cứu một mẫu (sample). Lý
do chính là tiết kiệm thời gian và tiền bạc. Bất lợi chính là ước lượng dựa trên mẫu có thể bị
sai số lấy mẫu, như trình bày trong Chương 1 và Chương 3, và có thể bị sai lệch nếu mẫu
không đại diện cho dân số. Việc chọn lựa cỡ mẫu để nghiên cứu để cho sai số trong một giới
hạn nhất định được mô tả ở Chương 26. Chọn lựa ngẫu nhiên mẫu được đề nghị để tránh các
sai lệch chọn lựa, dù là có ý hay không, và các phương pháp thích hợp sẽ được phác thảo
ngắn gọn. Dù vậy chỉ ngẫu nhiên hóa không đủ để khắc phục các sai lệch khả dĩ, như đã trinh
bày trong Chương 22. Thí dụ, sự không đáp ứng của một số cá nhân có thể gây sai lệch, bởi
vì người không đáp ứng có thể khác với người đáp ứng về các khía cạnh cần nghiên cứu.

Chọn mẫu ngẫu nhiên đơn


Trong trong mẫu ngẫu nhiên đơn (simple random sampling), bước đầu tiên là rút ra một danh
sách các cá nhân trong dân số và đánh số chúng. Danh sách này được gọi là khung mẫu
(sampling frame). Sau đó chọn số người cần thiết; mỗi người có một cơ hội bằng nhau được
chọ. Ðiều này có thể được chọn bằng cách đánh dấu một tấm thẻ cho mỗi cá nhân, xáo lên và
chọn một số thẻ. Một phương pháp tiện lợi hơn là dùng bảng số ngẫu nhiên (table of random
numbers) như trong bảng A10. Ðầu tiên nhìn vào tổng số trong dân số và xem nó có bao
nhiêu chữ số (digit). Sau đó chọn các số ngẫu nhiên có bấy nhiêu chữ số. Thí dụ, nếu dân số
có 2432 phần tử thì cần 4 chữ số. Cuối cùng chọn một điểm khởi phát tùy ý trong bảng dự trù
(không nên luôn luôn khởi phát ở cùng một chỗ) và đọc các số lên, di chuyển xuống theo cột
hay ngang theo hàng cho đến khi đã chọn được số lượng cần thiết các đối tượng khác nhau.
Nếu số được chọn lớn hơn tổng số dân hay nếu bằng zero, bỏ qua số đo. Lưu ý rằng sự sắp
xếp các số theo cặp trong bảng chỉ có mục đích trình bày mà thôi. Có thể dùng số ngẫu nhiên
do máy tính tạo ra. Dù vậy không nên dùng các số ngẫu nhiên do các máy tính cầm tay tạo ra
bởi vì chúng không có phân phối ngẫu nhiên thực sự.
Thí dụ 23.1
Thử chọn một mẫu gồm 10 nhà từ một làng có 268 nhà. Bảng 23.1 trình bày một phần của
Bảng A10 để minh họa cách làm. Tổng số nhà là 268 do đó cần 3 chữ số. Chúng được tạo
bằng cách dùng một cặp số và một chữ số đầu tiên của cặp kế bên. Bắt đầu từ góc trên bên
trái và đọc theo cột xuống, số đầu tiên là 173. Số tiếp theo là 770 quá lớn và bỏ qua, Số tiế
theo trong phạm vi cần thiết là 074 hay 74. Ðiều này đươc tiếp tục cho đến khi chọn được 10
số khác nhau. Chúng được gạch dưới trong bảng. Do đó các nhà được nghiên cứu là 5, 74, 79,
83, 138, 166, 173, 201, 242, và 259.
Bảng 23.1 Một phần của bảng số ngẫu nhiên từ Bảng A10, minh họa sự lựa chọn 10 số giữa 1 và 268.

123
Căn bản thống kê y học -Ðỗ Văn Dũng

17 37 93 23 78 87 35 20 96 43
77 04 74 47 67 21 76 33 50 25
98 10 50 71 75 12 86 73 58 07

52 42 07 44 38 15 51 00 13 42
49 17 46 09 62 90 52 84 77 27
79 83 86 19 62 06 76 50 03 10
83 11 46 32 24 20 14 85 88 45
07 45 32 14 08 32 98 94 07 72
00 56 76 31 38 80 22 02 53 53
42 34 07 96 88 54 42 06 87 98

13 89 51 03 74 17 76 37 13 04
97 12 25 93 47 70 33 24 03 54
16 64 36 16 00 04 43 18 66 79
45 59 34 68 49 12 72 07 34 45
20 15 37 00 49 52 85 66 60 44

( Số 074 đã được chọn

Chọn mẫu hệ thống


Ðể tiện lợi, chọn từ một khung mẫu được tiến hành hệ thống thay vì ngẫu nhiên bằng cách
chọn các cá nhân ở một khoảng cách nhất định trong danh sách, điểm bắt đầu được chọn ngẫu
nhiên. Tí dụ để chọn mậu 5% hay 1 phần 20 trong dân đố, điểm khởi phát là được chọn ngẫu
nhiên từ 1 đến 20, và sau có cứ mỗi 20 người trong danh sách chọn một. Giả sử số ngẫu nhiên
được chọn là 13 thì mẫu sẽ gồm các đối tượng 13, 33, 53, 73, 93 v.v.
Lấy mẫu hệ thông tương đương với lấy mẫu ngẫu nhiên với điều kiện không có một mô thức
sắp các đối tượng trong mẫu. Dù vậy người ta thích lấy mẫu ngẫu nhiên bởi vì không cần giả
thiết về cấu trúc dân số.

Các lược đồ lấy mẫu phức tạp hơn


Có một số tình huống trong đó lấy mẫu ngẫu nhiên đơn không thích hợp và cần các lược đồ
lấy mẫu phức tạp hơn. Những tình huống đó phát sinh khi (i) không có khung mẫu và xây
dựng khung mẫu rất tốn kém hay không thể được, (ii) dân số trải ra trong một khu vực rộng,
chi phí và thời gian di chuyển để đi khắp khu vực không cho phép, (iii) dân số có những
nhóm hoàn toàn khác biệt.
Có ba loại lược đồ lấy mẫu phức tạp cơ bản là lấy mẫu phân tầng (stratified), nhiều bậc
(multi-stage) và cụm (cluster). Chúng có thể dùng riêng hay kết hợp. Nói chung mục tiêu
cần phải áp dụng cho những lược đồ này là làm sao cho mỗi cá nhân một cơ hội được chọn
bằng nhau, đó là dùng chúng với phương pháp chọn lựa xác suất bằng nhau (equal
probability selection method - epsem).
Một điểm cần lưu ý là chỉ đối với các lược đồ epsem các giá trị của dân số chỉ được ước
lượng trực tiếp bởi giá trị lấy mẫu chung (overall sample value). Nếu sử dụng các phương
pháp xác suất không bằng nhau, phương pháp ước lượng giá trị dân số sẽ khác (xem Thí dụ
23.2). Trong cả hai trường hợp, việc tính toán sai số chuẩn sẽ phụ thuộc vào lược đồ lấy mẫu.
Ðể thảo luận đầy đủ về các vấn đề thực tiễn có liên quan, người đọc cần tham khảo Lutz
(1986) và Moser và Kalton (1971) và các chi tiết lí thuyết ở Cochran (1977) và Stuart (1984).

124
PHƯƠNG PHÁP LẤY MẪU

Lấy mẫu phân tầng


Lấy mẫu phân tầng được dùng khi dân số bao gồm các nhóm khác biệt, hay tầng (strata), khác
nhau về các đặc tính nghiên cứu và bản thân chúng cũng cần quan tâm. Những thí dụ thường
gặp là các nhóm tuổi giới tính hay các vùng khác nhau trong quốc gia. Một mẫu ngẫu nhiên
đơn được rút ra từ mỗi tầng để đảm bảo rằng chúng đủ đại diện. Ước lượng chung chính xác
hơn dựa vào ngẫu nhiên đơn không tính đến cấu trúc các nhóm nhỏ trong dân số. Chiến lược
thường dùng là chọn các cá nhân trong mỗi tầng với tỉ lệ như nhau (lược đồ epsem), nghĩa là
dùng cùng một phân số lấy mẫu (sampling fraction) cho mỗi tầng. Dù vậy, đôi khi cần
phải thay đổi để cho cỡ mẫu trong mỗi tầng không quá nhỏ.
Bảng 23.2 Kết quả một mẫu phân tầng được tiến hành để ước lượng tỉ suất mắc toàn bộ của một bệnh
trong một quốc gia có ba vùng địa lí chính. Tỉ suất mắc toàn bộ chung được tính bằng cách cộng số các
người bị bệnh ước lượng được trong mỗi vùng và chia cho tổng số dân.
Khu vực dân số cỡ mẫu số bị bệnh tỉ suất mắc toàn tổng số bị bệnh ước
bộ lượng
Ðồng bằng ven 150000 200 120 0,6 900 000
biển
Vùng núi 150000 50 5 0,1 15 000
Bán hoang mạc 300000 50 15 0,3 90 000
Tổng số 1950000 300 140 *0,52 1 005 000
Thí dụ 23.2
Người ta muốn ước lượng tỉ suất mắc toàn bộ của bệnh trong một quốc gia với ba vùng địa lí
chính, vùng đồng bằng ven biển, vùng núi và vùng bán hoang mạc. Bởi vì dân số phân phối
đồng đều trong quốc gia, và bởi vì người ta nghĩ rằng địa lí có thể ảnh hưởng đến tỉ suất mắc
toàn bộ của bệnh, người ta chọn một mẫu phân tầng. Bảng 23.2 trình bày kết quả thu được
với tỉ suất mắc toàn bộ trong mỗi vùng.
Tỉ suất mắc toàn bộ chung được tính bằng cách ước lượng số người bị bệnh trong mỗi vùng.
Thí dụ trong vùng đồng bằng ven biển tỉ suất mắc toàn bộ của mẫu là 120/200 hay 0,6. Áp
dụng số này cho tổng số dân số trong vùng đồng bằng ven biển cho số ước lượng 0,5 ×
1500000 = 900000 người bị bệnh. Số người bị bệnh của vùng núi và bán hoang mạc được
tính tương tự là 15000 và 90000. Tổng số người bị bệnh trong toàn quốc gia là 1050000.
Kích thước dân số là 1950000 cho nên tỉ suất mắc toàn bộ chung là 1050000/1950000 = 0,52.
Lưu lý rằng số này không giống như tỉ suất mắc toàn bộ của mẫu là 140/300 = 0,47. Hai kết
quả chỉ giống nhau khi dùng phân số lấy mẫu giống nhau cho mỗi tầng (nhưng không xảy ra
trong trường hợp này). Việc tính toán sai số chuẩn của tỉ suất mắc toàn bộ cho toàn dân số
dựa trên sự kết hợp các sai số chuẩn của của các tỉ suất mắc toàn bộ của mỗi vùng. Xem
Moser và Kalton (1971) để biết thêm chi tiết.

Lấy mẫu nhiều bậc


Lấy mẫu nhiều bậc (multi-stage sampling) được tiến hành trong nhiều bâc dùng các cấu trúc
đẳng cấp (hierarchical structure) của dân số. Thí dụ, lấy mẫu hai bậc (two stage sampling) có
thể bao gồm lần thứ nhất lấy một mẫu ngẫu nhiên các trường hợp và sau đó lấy một mẫu ngẫu
nhiên các trẻ em trong các trường được chọn. Các trường được gọi là đơn vị bậc một (first
stage units) và trẻ em là đơn vị bậc hai (second-stage units). Ưu điểm là tài nguyên có thể
được tập trung tại một số địa điểm và không cần cơ cấu lấy mẫu cho toàn dân số. Cần danh
sách các đơn vị bậc một nhưng chỉ cần danh sách các đơn vị bậc hai của các đơn vị bậc một
đã được chọn. Khuyết điểm là ước lượng chung kém chính xác hơn khi dựa trên lấy mẫu
ngẫu nhiên đơn có cùng một cỡ mẫu chung. Nó cách khác, để đạt được cùng độ chính xác
như lấy mẫu ngẫu nhiên đơn cần một cỡ mẫu lớn hơn.

125
Căn bản thống kê y học -Ðỗ Văn Dũng

Lấy mẫu ở bậc hai gồm lấy các mẫu ngẫu nhiên đơn có cùng cỡ ctừ các đơn vị bậc một.
Phương páp lấy mẫu bậc một phụ thuộc vào chúng có chứa một số các đơn vị bậc hai như
nhau hay không. Nếu có, có thể mẫu mẫu ngẫu nhiên đơn. Nếu chúng có cỡ khác nhau, có thể
đạt được lược đồ epsem, bằng cách lấy mẫu xác suất tỉ lệ với kích thước (probability
proportional to size - p.p.s). Thí dụ, nếu một trường có nhiều gấp đôi học sinh so với
trường kia nó có cơ hội được chọn gấp đôi. Lấy mẫu p.p.s. Ðược tiến hành hoàn lại mẫu
(with replacement), có nghĩa là sau khi một đơn vị bậc một được chọn nó vẫn còn được rút
chọn và có thể được chọn lần nữa. Khi một đơn vị bậc một được chọn hai lần, chọn mẫu đơn
vị bậc hai nhiều gấp đôi. Tác dụng chung là cho mỗi đơn vị bậc hai trong dân số một cơ hội
được chọn bằng nhau.
Có thể có lược đồ lấy mẫu có hơn hai mức lấy mẫu, thí dụ như chọn tỉnh, quận, đường phố và
cuối cùng là nhà. Nó được gọi là lấy mẫu nhiều bậc (multi-stage sampling).

Lấy mẫu cụm


Nếu chi phí phụ trội không nhiều, nên điều tra tất cả các đơn vị bậc hai từ mỗi đơn vị bậc một
được chọn trong lược đồ lấy mẫu hai bậc. Ðiều đó được gọi là lấy mẫu cụm (cluster
sampling) và đơn vị lấy mẫu bậc một được gọi là cụm (cluster) trong trường hợp này. Có
thể đạt được lược đồ xác suất bằng nhau bằng cách lấy mẫu ngẫu nhiên đơn các cụm bất kể
rằng chúng có kích thước bằng nhau hay không.
Lấy mẫu cụm được dùng nếu có lợi ích được phân phát cho người tham gia và nếu không
thích hợp hoặc không đạo đức nếu chỉ phân phát cho một số thành viên của đơn vị. Thí dụ,
trong khi lấy mẫu trường để ước lượng tỉ suất mắc toàn bộ của bệnh khi muốn sử dụng một
phương pháp điều trị hiệu quả cho tất cả những người bị bệnh, người ta sẽ muốn khám tất cả
các học sinh trong các trường được chọn chứ không khám một mẫu trong đó.
Thí dụ 23.3
Lấy mẫu phân tầng được đề nghị trong thí dụ 23.2 để ước lượng tỉ suất mắc toàn bộ trong một
quốc gia với 3 vùng chính có thể được cải tiến thành mẫu cộng đồng thứ nhất (thành phố,
làng, ấp) và các hàn tong vùng, khám tất cả các thành viên trong nhà. Lược đồ sẽ là sự kết
hợp giữa lấy mãu phân tầng (khu vực) lấy mẫu hai bậc (cộng đồng và nhà) và lấy mẫu cụm
(tất cả các thành viên trong nhà).

126
NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG


Giới thiệu
Ưu và khuyết điểm của phương pháp bệnh chứng so với phương pháp đoàn hệ (hay cắt dọc)
đã được thảo luận ở chương 21. Một nghiên cứu đoàn hệ gồm theo dõi các cá nhân từ khi xác
định tình trạng tiếp xúc đến sự xuất hiện bệnh sau đó. Ngược lại, nghiên cứu bệnh chứng bắt
đầu với tình trạng bệnh tật của cá nhân và nhìn ngược lại thời gian để xác định tình trạng tiếp
xúc trong quá khứ đối với yếu tố nguy cơ quan tâm. Vì lí do này các từ tiền cứu (prospective)
và hồi cứu (retrospective) thường được dùng lẫn lộn với đoàn hệ và bệnh chứng. Dù vậy cách
dùng từ này gây lầm lẫn và không nên dùng bởi vì như đã lưu ý trong Chương 21, đôi khi có
thể tiến hành nghiên cứu đoàn hệ hoàn toàn hồi cứu trong các hồ sơ cũ.
Trong chương này chúng ta sẽ tập trung vào việc đo lương mối liên hệ dùng để đánh giá sức
mạnh của quan hệ giữa yếu tố nguy cơ và sự xuất hiện bệnh sau đó. Nghiên cứu bệnh chứng
được hiểu dễ dàng bằng cách hiểu rằng đằng sau mỗi nghiên cứu bệnh chứng có một nghiên
cứu đoàn hệ tương đương. Do đó chúng ta xem nghiên cứu đoàn hệ trước.
Bảng 24.1 Số liệu từ một cuộc nghiên cứu đoàn hệ để điều tra mối liên hệ giữa hút thuốc lá và ung thư
phổi. Có minh họa tính toán nguy cơ tương đối và quy trách.
ung thư phổi không tổng số Tỉ suất mới mắc
ung thư phổi
Người hút thuốc 39 29961 300000 1,3/1000/năm
Không hút thuốc 6 59994 60000 0,1/1000/năm
Tổng số 45 89955 90000
1,30 AR = 1,3 - 0,1 = 1,2/1000/năm 1.20
RR = = 13,0 AR% = = 0,923 = 92,3%
1,10 1.30

Nghiên cứu đoàn hệ


Trong nghiên cứu đoàn hệ, một mẫu các cá nhân, một số tiếp xúc với yếu tố nguy cơ quan
tâm và một số không, được theo dõi theo thời gian và tỉ suất mắc bệnh của hai nhóm được so
sánh với nhau. Thí dụ, Bảng 24.1 cho thấy một số liệu từ một nghiên cứu đoàn hệ để điều tra
mối liên hệ giữa hút thuốc lá và ung thư phổi. Ba mươi ngàn người hút thuốc và 60000 ngàn
người không hút thuốc được theo dõi trong một năm, trong thời gian đó 39 người hút thuốc
và 6 người không hút thuốc bị ung thư phổi, tính ra nguy cơ mới mắc tương ứng là 1,3 và 0,1
cho mỗi 1000 người mỗi năm. Do đó nguy cơ mới mắc ung thư phổi coa hơn đáng kể trong
những người hút thuốc so với người không hút thuốc. Trên thực tế chúng 13 lần cao hơn. Tỉ
số này được gọi là nguy cơ tương đối (relative risk) và tổng kết đươc sức mạnh của mối liên
hệ giữa yếu tố và bệnh tật.

Nguy cơ tương đối


Tè suáút måïi màõc trong nhoïm tiãúp xuïc
Nguy cå tæång âäúi (RR) =
Tè suáút måïi màõc trong nhoïm khäng tiãúp xuïc
Nguy cơ tương đối (Relative risk - RR) bằng 1 xảy ra khi tỉ suất mới mắc như nhau trong hai
nhóm và tương đương với không có mối liên hệ giữa yếu tố nguy cơ và bệnh. Nguy cơ tương
đối lớn hơn 1 khi nguy cơ mắc bệnh cao ở nhóm tiếp xúc với yếu tố hơn nhóm không tiếp xúc
với yếu tố, như trong thí dụ trên với tiếp xúc là hút thuốc lá. Nguy cơ tương đối nhỏ hơn một
khi nguy cơ trong nhóm tiếp xúc thấp hơn, gợi ý rằng yếu tố có thể là bảo vệ. Một thí dụ là
nguy cơ tiêu chảy giảm được quan sát trong những trẻ bú sữa mẹ so với những trẻ không bú.

127
Căn bản thống kê y học -Ðỗ Văn Dũng

Nguy cơ tương đối càng xa một bao nhiêu thì liên hệ càng mạnh bấy nhiêu. Ý nghĩa thống kê
có thể được kiểm định bằng cách dùng kiểm định χ2 2 × 2 được mô tả ở Chương 13.
Khoảng tin cậy của RR
Việc tính toán khoảng tin cậy khá phức tạp. Công thức ở đây là của Miettinen. Nó là xấp xỉ
dựa trên kiểm định có nghĩa là nó đươc tính dựa trên giá trị χ2 (trên thực tế là căn của χ2) tìm
được trong kiểm định ý nghĩa chứ không phải là sai số chuẩn.
95% c.i. = RR (1±1,96 / χ )
Có thể tính được khoảng tin cậy phần trăm khác bằng cách thay 1,96 với điểm phần trăm
thích hợp trong phân phối bình thường.
Thí dụ, xem số liệu được trình bày trong bảng 24.1

RR = 13,0, χ2= 52,25, P <0,001


Do đó
χ = (55,25 = 7,43 và 1,96/ χ = 1,96/7,43 = 0,26
Nên
RR (1+1,96/χ) = 13,01+0,26 = 13,01,26 = 25,3

RR (1 - 1,96/χ) = 13,01-0,26 = 13,00,74 = 6,7
Khoảng tin cậy 95% của nguy cơ tương đối do đó là 6,7 đến 25,3

Nguy cơ qui trách


Nguy cơ tương đối đánh giá, chẳng hạn như môt người hút thuốc lá có thể bị ung thư phổi
gấp bao nhiêu lần người không hút thuốc, nhưng không nói gì đến độ lớn của nguy cơ vượt
quá theo số tuyệt đối. Số này được đo lường bởi nguy cơ quy trách (attributable risk - AR).
Nguy cå quy traïch tè suáút måïi màõc tè suáút måïi màõc
= −
(AR) trong nhoïm tiãúp xuïc trong nhoïm khäng tiãúp xuïc
Nguy cơ quy trách đôi khi được tính bằng tỉ lệ so với tổng số tỉ suất mới mắc trong nhóm tiếp
xúc và được gọi là phần trăm nguy cơ quy trách (attributable risk percent) hay nguy cơ quy
trách tỉ lệ (proportional attributable risk), tỉ lệ quy trách (tiếp xúc), phân số quy trách (tiếp
xúc) và phân số căn nguyên (tiếp xúc).

Tè suáút måïi màõc Tè suáút måïi màõc



Nguy cå quy traïch tè lãû trong nhoïm tiãúp xuïc trong nhoïm khäng tiãúp xuïc
=
AR% Tè suáút måïi màõc trong nhoïm tiãúp xuïc
RR − 1
=
RR
Trong thí dụ này, nguy cơ quy trách của ung thư phổi do hút thuốc lá là 13,0 - 0,10 = 1,2
trường hợp cho mỗi 1000 mỗi năm, với hút thuốc lá chịu trách nhiệm cho 92,3% (1,20/1,30)
tất cả các trường hợp ung thư phổi trong những người hút thuốc.

128
NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

Bảng 24.2 Nguy cơ tương đối và quy trách của tử vong do các nguyên nhân khác nhau, 1951 đến 1961,
liên hệ với hút thuốc lá nặng ở các nam bác sĩ người Anh. Số liệu từ Doll & Hill (1964), Bristish
medical journal 1, 1399-1410, được trình bày bởi MacMahon & Pugh (1970) Epidemilogy, Principles
and Methods. Little, Brown & Co., Boston (đã xin phép)
tỉ suất tử vong đặc hiệu tuổi
(cho mỗi 1000 người-năm)
Nguyên nhân chết Không hút thuốc Hút thuốc nặng RR AR

Ung thư phổi 0,07 2,27 32,4 2,20
Các ung thư khác 1,91 2,59 1,4 0,68
Viêm phế quản 0,05 1,06 21,2 1,01
mãn
Bệnh tim mạch 7,32 9,93 1,4 2,61
Các nguyên nhân 12,06 19,67 1,6 7,61
Bảng 24.2 trình bày nguy cơ tương đối và nguy cơ quy trách của tử vong từ các nguyên nhân
khác nhau liên hệ đến hút thuốc lá nặng. Mối liên hệ được minh họa rõ nhất đối với ung thư
phổi và viêm phế quản mãn tính, với nguy cơ tương đối tương ứng là 32,1 và 21,2. Dù vậy,
nếu sự liên hệ với bệnh tim mạch, dù là không mạnh như thế, cũng được xem có tính nhân
quả, loại bỏ hút thuốc lá sẽ cứu được nhiều bệnh nhân chết vì tim mạch hơn là vì ung thư
phổi, 2,61 so với 2,20 cho mỗi 1000 người hút thuốc lá mỗi năm. Lưu ý rằng tỉ suất tử vong
được chuẩn hóa để xét đến sự khác biệt do phân phối giữa người hút thuốc và người không
hút thuốc, và sự gia tăng tỉ suất chết theo tuổi.
Nói tóm lại, nguy cơ tương đối là đo lường tốt nhất giữa sức mạnh của sự liên hệ giữa yếu tố
nguy cơ và bệnh tật. Nó càng lớn thì càng có thể rằng mối liên quan là nhân quả. Mặt khác,
nguy cơ quy trách cho ý niệm tốt hơn về nguy cơ thặng dư của bệnh do một cá nhân gánh
chịu do sự tiếp xúc. Dù vậy, tổng số tác động của yếu tố nguy cơ trong dân số sẽ phụ thuộc sự
tiếp xúc phổ biến như thế nào. Tính theo dân số, sự tiếp xúc hiếm với nguy cơ tương đối cao
có thể ít quan trọng hơn một tiếp xúc rất phổ biến với nguy cơ tương đối thấp hơn. Ðiều này
có thể được đánh giá bằng tỷ suất mới mắc chung trong dân số so với tủ suất mới mắc trong
nhóm không tiếp xúc. Số này gọi là nguy cơ quy trách dân số (population attributable risk).

Nguy cå quy traïch dán säú tè suáút måïi màõc tè suáút måïi màõc
= −
(PAR) trong dán säú chung trong nhoïm khäng tiãúp xuïc
Nó có thể được tính bằng tỉ lệ của tỉ suất mắc chung. Số này được gọi là phân số quy trách
dân số (population attributable fraction), tên gọi khác là phân số căn nguyên (dân số)
hay nguy cơ uy trách tỉ lệ dân số (population proportional attributable risk).

Tè suáút måïi màõc Tè suáút måïi màõc



Phán säú quy traïch dán säúû trong dán säú chung trong nhoïm khäng tiãúp xuïc
=
PAR Tè suáút måïi màõc trong dán säú chung
tè lãû tiãúp xuïc ( RR − 1)
=
1 + tè lãû tiãúp xuïc ( RR − 1)
Tỉ suất mới mắc, nguy cơ mới mắc và tỉ số số chênh
Nhớ lại từ Chương 15 rằng số mới mắc có thể là nguy cơ hay một tỉ suất. Việc tính toán nguy
cơ mới mắc dựa trên dân số nguy cơ ở lúc đầu nghiên cứu, trong khi tỉ suất dựa vào tổng số
người năm nguy cơ trong nghiên cứu và phản ánh sự thay đổi của dân số nguy cơ. Ðiều này
đươc minh họa trong hình 24.1 phản ánh sự tích lũy dần dàn các trường hợp bệnh từ những
người không bị bệnh ở trong dân số tiếp xúc và không tiếp xúc.

129
Căn bản thống kê y học -Ðỗ Văn Dũng

Một cách khác để đo lường mới mắc là số chênh (odds) của bệnh so với không bệnh. Nó bằng
tổng số các trường hợp bệnh chia cho tổng số người nguy cơ ở cuối nghiên cứu. Dùng kí hiệu
trong bảng 24.3, số chênh trong nhóm tiếp xúc là a/b và trong nhóm không tiếp xúc là c/d. Tỉ
số này được gọi là tỉ số số chênh (odds ratio). Nó bằng;
a / b ad
=
c / d bc
Là tích chéo của bảng. Tỉ số số chênh được ước tính từ bảng 24.1 bằng (39 × 59994) / (6 ×
29961) = 13,0

Tỉ số số chênh (OR) = ad/bc


Tỉ số số chênh cũng có thể được xem là tỉ số của số chênh tiếp xúc và không tiếp xúc trong
nhóm bệnh (a/c) so với nhóm không bệnh (b/d). Vì lí do này nó đóng vai trò quan trọng trong
nghiên cứu bệnh- chứng (xem ở dưới).
Trong các bệnh hiếm, đó là bệnh mà tỉ lệ các trường hợp bệnh trong dân số rất thấp, đường
trong hình 24,1 cho thấy sự tích lũy của các trường hợp bệnh sẽ hầu như nằm ngang và không
thể phân biệt với đường ở trên thể hiện dân số nghiên cứu. Trong trường hợp này nguy cơ
mới mắc, tỉ suất mới mắc và tỉ số số chênh bằng nhau.

130
NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

(i) Dán säú tiãúp xuïc

Säú bãûnh
(a)

Nguy cå
ban âáöu Nguy cå
Säú khäng bãûnh -
(e) hiãûn taûi
coìn nguy cå
(b)

(i) Dán säú khäng tiãúp xuïc

Säú bãûnh
(c)

Nguy cå
ban âáöu Nguy cå
Säú khäng bãûnh -
(f) hiãûn taûi
coìn nguy cå
(d)

Khåíi âáöu Xuáút hiãûn Kãút thuïc


nghiãn cæïu ca måïi nghiãn cæïu

Hình 24.1 Một trình bày hình ảnh một nghiên cứu đoàn hệ. Có 3 số đo của mới mắc tương đối là:

Nguy cå tæång âäúi a/e


=
(sæí duûng nguy cå måïi màõc) c / f
Nguy cå tæång âäúi a /(pyar tiãúp xuïc)
=
(Sæí duûng tè suáút måïi màõc) b / (pyar khäng tiãúp xuïc)
a/b ad
Tè säú säú chãnh = =
c / d bc
Dù vậy, đối với các bệnh phổ biến, ba số này khác nhau và sẽ cho 3 số đo mối liên hê giữa
yếu tố và bệnh khác nhau, nguy cơ tương đối dùng nguy cơ mới mắc, nguy cơ tương đối dùng
tỉ suất mới mắc và tỉ số số chênh. Cách thông thường là chọn tỉ suất mới mắc. Dù vậy việc
chọn nguy cơ mới mắc thích hợp hơn khi đánh giá tác dụng bảo vệ của sự tiếp xúc, thí dụ như
vaccine mà người ta tin rằng nó bảo vệ đầy đủ với một số cá nhân nhưng không đối với các cá
nhân khác, chứ không phải bảo vệ một phần cho tất cả (Smith et al. 1984). Tỉ số số chênh
được dùng trong nghiên cứu bệnh chứng (xem ở dưới).

131
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 24.3 Kí hiệu cho nghiên cứu đoàn hệ và nghiên cứu bệnh chứng không bắt cặp
Bệnh không bệnh tổng số
Tiếp xúc a b e
Khôngtiếp xúc c d f
Tổng số g h n

Nghiên cứu bệnh chứng


Trong nghiên cứu bệnh chứng (case-control study), mẫu được lấy theo tình trạng bệnh chứ
không phải theo tình trạng tiếp xúc. Một nhóm người được xác định có bệnh, nhóm bệnh
(cases), được so sánh với một nhóm người không có bệnh, nhóm chứng (control) về phương
diện tiếp xúc trước đó đối với yếu tố quan tâm. Không thể trực tiếp thu được thông tin về
bệnh mới mắc trong dân số tiếp xúc và không tiếp xúc, nhưng có thể thấy rằng tỉ số tích chéo
(cross product ratio) trong bảng bệnh chứng ước lượng tỉ số số chênh. Ðối với bệnh hiếm, nó
bàng với nguy cơ tương đối.
Bảng 24.4 trình bày kết quả của một nghiên cứu bệnh chứng tìm hiểu mối liên quan giữa
uống cà phê và ung thư tuyến tụy. Người ta thu được nguy cơ tương đối là 2,5, có nghĩa là
phụ nữ uống cà phê dễ bị ung thư gấp 2,5 lần hơn những người không uống.

Bãûnh hiãúm : OR = ad/bc = RR


Bãûnh phäø biãún : OR = ad/bc, 0 <|RR|<|OR|

Bảng 24.4 Kết quả nghiên cứu bệnh chứng tìm hiểu sự liên hệ giữa uống cà phê và ung thư tụy. Số liệu
ở phụ nữ được trình bày. Với sự cho phép của MacMahon và cộng sự (1981) New England Journal of
Medicine 304,630-3.

Uống cà phê Bệnh Chứng Tổng số


Có 140 280 420
Không 11 56 67
Tổng số 151 336 487
140 × 56
OR = = 2,5
11 × 280
Ðối với bệnh phổ biến, ý nghĩa của tỉ số tích chéo phụ thuộc vào lược đồ lấy mẫu được dùng
cho nhóm chứng (Smith et al. 1984). Người ta thường chọn nhóm chứng từ những người
không bị bệnh ở cuối cuộc nghiên cứu; bất cứ người chứng đươc chọn trong quá trình nghiên
cứu sau đó mắc bệnh được coi là bệnh chứ không phải là chứng. Trong trường hợp này có thể
thấy rằng tỉ số tích chéo đại diện cho tỉ số số chênh, và độ lớn của tỉ số số chênh |OR| lớn hơn
độ lớn của nguy cơ tương đối.
Các biến gây nhiễu
Trong quy hoạch và phân tích các nghiên cứu bệnh chứng, điều quan trọng là đảm bảo không
có biến số gây nhiễu có thể gây sai lệch trong nghiên cứu mối liên quan. Thí dụ, trong nghiên
cứu uống cà phê và ung thư tụy, cần thiết đảm bảo rằng phân phối tuổi của 2 nhóm bệnh và
chứng tương tự nhau, bởi vì nguy cơ ung thư tuyến tụy gia tăng với tuổi. Ðiều này có thể sắp
xếp bằng cách hoặc là chọn số bệnh bằng số chứng trong mỗi nhóm tuổi (bắt cặp tầng -
stratum matching) hay dùng một quy hoạch bắt cặp (xem ở dưới). Một cách khác, có thể xét
đến biến số gây nhiễu trong khi phân tích, thí dụ như chia số liệu thành những nhóm tuổi
khác nhau và tính tỉ số số chênh cho mỗi nhóm. Tính ước lượng chung bằng cách tính ad/n và
bc/n trong mỗi bảng. Những ad/n này được cộng với nhau và chia cho tổng số các bc/n. Số

132
NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

này được gọi là ước lượng Mantel-Haenszel của tỉ số số chênh và kiểm định ý nghĩa thích
hợp là kiểm định χ2 tổng kết Mantel-Haenszel (xem Chương 14).
Σ ad / n
OR Mantel - Haenszel =
Σ bd / n
Một cách tiếp cận tinh vi hơn là dùng hồi quy logistic (xem Chương 14), và để ước lương tỉ
số số chênh từ hệ số hồi quy. Hồi quy này thích hợp để kiểm soát đồng thời nhiều yếu tố gây
nhiễu, trong trường hợp này số các nhóm nhỏ lớn và số các cá nhân trong mỗi nhóm lại rất
nhỏ. Xem chi tiết ở Breslow và Day (1980) và Schlesselman (1982).
Quy hoạch bắt cặp
Trong quy hoạch bắt cặp (matched design), mỗi bệnh được bắt cặp với một hay nhiều chứng,
được chọn sao cho các biến số gây nhiễu có cùng giá trị. Thí dụ, Bảng 24.5 trình bày số liệu
từ một nghiên cứu tìm hiểu mối liên hệ giữa sử dụng thuốc ngừa thai và thuyên tắc mạch.
Bệnh gồm 175 phụ nữ tuổi từ 15-44 được xuất viện từ 43 bệnh viện sau khi cơn thuyên tắc
mạch đầu tiên. Một bệnh nhân nữ bị một bênh khác (không liên quan đến việc sử dụng thuốc
ngừa thai) được chọn lọc từ cùng một bệnh viện để làm chứng cho mỗi bệnh. Người chứng
được chọn có cùng nơi cư ngụ, cùng thời gian nhập viện, chủng tộc, tuổi tác, tình trạng hôn
nhân, tình trạng thai sản và tình hình thu nhập y như người bệnh. Người tham gia được hỏi về
tiền căn dùng thuốc ngừa thai và đặc biệt là họ có dùng thuốc ngừa thai vào tháng trước nhập
viện hay không.
Bảng 24.5 Kết quả nghiên cứu bệnh chứng có bắt cặp số liệu để điều tra mối quan hệ giữa dùng thuốc
ngừa thai (OC) và thuyên tắc mạch. Ðược phép từ Sartwell et al. (1969) American Journal of
Epidemiology 90, 365-80
Chứng
Dùng OC Không dùng OC Tổng số
Bệnh Dùng OC 10 57 67
Không dùng OC 13 95 108
Tổng số 23 152 175
57
OR =
13 = 4,4

Cặp đôi bệnh và chứng được bảo tồn trong quá trình phân tích bằng việc lập bảng việc sử
dụng thuốc ngừa thai trong bệnh so với sử dụng thuốc ngừa thai trong nhóm chứng. Có 10
cặp bệnh chứng trong đó cả bệnh và chứng đều dùng thuốc ngừa thai và 95 cặp đều không
dùng thuốc ngừa thai. 105 cặp này không cho thông tin nào về sự liên hệ. Thông tin hoàn
toàn chứa đựng trong 70 cặp mà bệnh, chứng khác nhau. Có 57 cặp bệnh chứng trong có chỉ
có bệnh dùng thuốc ngừa thai trong tháng trước so với 13 cặp trong đó chỉ có chứng dùng
thuốc ngừa thai trong tháng trước. Tỉ số số chênh được đo bằng tỉ số những cặp không phù
hợp (discordant pairs) và bằng 4,4 (= 57/13). Kiểm định ý nghĩa thích hợp là kiểm định χ2
McNemar để so sánh tỉ lệ cặp đôi (xem Chương 14), cho χ2 = 26,4, P<0,001.

OR = tè säú nhæîng càûp khäng phuì håüp


Säú càûp trong âoï bãûnh tiãúp xuïc, chæïng khäng
=
Säú càûp trong âoï chæïng tiãúp xuïc, bãûnh khäng
Nếu chọn nhiều chứng cho một bệnh, tỉ số số chênh được ước lượng bằng cách áp dụng thao
tác Mantel-Haenszel. Cuối cùng, việc phân tích một số yếu tố nguy cơ, hay cần điều chỉnh
các biến số gây nhiễu khác ngoài các biến số gây nhiễu đã được bắt cặp trong quy hoạch, cần
một dạng hồi quy đặc biệt là hồi quy logistic có điều kiện (conditional logistic regression).

133
Căn bản thống kê y học -Ðỗ Văn Dũng

Những phương pháp khác nhau được trình bày trong bảng 24.6. Thảo luận đầy đủ trong
những tình huống phức tạp hơn, tham khảo Breslow và Day (1980) hay Schlesselman (1982).

Bảng 24.6 Phân tích nghiên cứu bệnh chứng - tổng kết các phương pháp
Nhiều yếu tố nguy cơ/điều chỉnh
Lược đồ lấy mẫu cho cho các biến số gây nhiễu
chứng Một yếu tố nguy cơ
(a) một chứng cho một
bệnh
Ngẫu nhiên Bảng 2×2 đơn trình bày hồi quy logistic hay phân tích phân
yếu tố nguy cơ × bệnh/chứng tầng
Kiểm định χ2 chuẩn
OR=tỉ số tích chéo, ad/bc
Bắt cặp đôi Bảng 2×2 trình bày sự phù hợp giữa hồi quy logistic điều kiện
bệnh và chứng đối với yếu tố nguy

Kiểm định χ2 McNemar
OR = tè säú càûp khäng phuì håüp
bãûnh coï chæïng khäng
=
bãûnh khäng chæïng coï
Bắt cặp tầng Phân tích phân tầng: bảng 2×2 cho mỗi hồi quy logistic hay phân tích phân
tầng tầng
Kiểm định χ2 Mantel-Haenszel
Σ ( ad / n )
OR =
Σ (bc / n )
(b) Nhiều chứng cho
một bệnh
Ngẫu nhiên Như trên như trên
Một nhóm gồm nhiều Ap dụng thao tác Mantel-Haenszel đặc hồi quy logistic có điều kiện
bệnh và nhiều chứng biệt
của nó
Bắt cặp phân tầng Như trên như trên
(c) Khoảng tin cậy
Tất cả các lược đồ 95% = OR (1±1,96 / χ ) tính từ hệ số hồi quy
xấp xỉ dựa vào kiểm định của
Mietinen
Khoảng tin cậy cho tỉ số số chênh
Khoảng tin cậy cho tỉ số số chênh có thể được tính giống như đối với nguy cơ tương đối,
dùng phương pháp dựa vào kiểm định của Miettinen.
95% = OR (1±1,96 / χ )
Có thể tính đươc khoảng tin cậy phần trăm khác bằng cách thay 1,96 với điểm phần trăm
thích hợp của phân phối bình thường. Công thức này được áp dụng khi kiểm định χ2 được
dùng đối với bảng 2 × 2 , kiểm định Mantel-Haenszel hay McNemar. Trong cả hai trường
hợp tính căn bậc hai của χ2.

134
NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

Thí dụ, xét số liệu bắt cặp được trình bày trong bảng 24.5 về sự liên hệ giữa sử dụng thuốc
ngừa thai và thuyên tắc mạch, trong đó:

OR = 4,4, χ2 = 26,4, P<0,001


Do có
χ = (26,4 = 5,14 và 1,96/χ = 1,96/5,14 = 0,38
Suy ra
OR (1+1,96/χ) = 4,4 (1+1,38) = 4,4 1,38 = 7,7

OR (1-1,96/χ) = 4,4 (1-1,38) = 4,40,62 = 2,5
Do đó, khoảng tin cạy 95% của tỉ số số chênh là 2,5 tới 7,7.

135
Căn bản thống kê y học -Ðỗ Văn Dũng

THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP


Giới thiệu
Có 3 loại nghiên cứu thực nghiệm (thử nghiệm lâm sàng, vaccine và can thiệp) được giới
thiệu ngắn gọn ở Chương 21. Các đặc điểm quy hoạch chính sẽ được mô tả ở đây. Ðể đơn
giản, việc thảo luận sẽ chú trọng và thử nghiệm lâm sàng, nhưng nó cũng được áp dụng đối
với thử nghiệm chế độ dự phòng và các biện pháp phòng bệnh khác. Các đặc điểm liên quan
đến thử nghiệm vaccine và các can thiệp khác sẽ được xét ngắn gọn ở cuối chương. Xem
Pocock (1983) để có thảo luận toàn diện về thử nghiệm lâm sàng.

Thử nghiệm lâm sàng


Một thử nghiệm lâm sàng là một thử nghiệm được tiến hành để đánh giá hiệu quả của một
chế độ điều trị mới. Người tình nguyện được phân vào một trong hai nhóm, nhóm điều trị
(treatment group) và nhóm chứng (control group). Nhóm chứng nhận hoặc là một chế độ
điều trị chuẩn của bệnh, như trong đánh giá các thuốc mới, hay không điều trị, như trong
đánh giá hiệu quả của vaccine. Có thể mở rộng phương pháp bằng cho những nhóm có liều
lượng thuốc khác nhau hay có những chế độ điều trị khác nhau.
Cần thiết kế sao cho sự khác biêt giữa nhóm điều trị và chứng có thể quy về tác dụng thực sự
của điều trị. Nhóm ban đầu phải giống nhau càng nhiều càng tốt về tất cả các phương diện trừ
phương diện trị liệu. Sẽ không hay nếu chẳng hạn như nhóm chứng ban đầu có nhiều người bị
bệnh nặng hơn nhóm điều trị, bởi vì chỉ điều này không đã khiến cho trị liệu dường như có
hiệu quả. Nó cách khác, phải cẩn thận tránh sai lệch chọn lựa (selection bias). Ðiều này có
thể được bằng cách dùng ngẫu nhiên hóa (randomization), đôi khi được củng cố bởi bắt cặp
(matched) hay quy hoạch bắt chéo (cross-over design).
Hơn nữa, phương pháp xử lí và đánh giá các nhóm phải giống nhau. Cơ hộ sai lệch trong khi
tiến hành thử nghiệm có thể được giảm thiểu bằng cách dùng quy hoạch mù đơn (single
blind) hay mù đôi (double-blind) và placebo.
Ngẫu nhiên hóa
Phân các người tham dự vào nhóm điều trị và nhóm chứng một cách ngẫu nhiên là một cách
để tránh các sai lệch chọn lựa (cố tình hay vô ý), hoặc là bởi người nghiên cứu hoặc người
tham dự, có thể dẫn đến sự khác nhau giữa hai nhóm. Có thể ngẫu nhiên hóa bằng cách dùng
một bảng số ngẫu nhiên (xem Chương 23). Một chữ số được chọn với số lẻ (1,3,5,7,9) tương
ứng với nhóm điều trị và số chẵn (0, 2, 4, 6, 8) tương ứng với nhóm chứng (hay ngược lại).
Giả sử rằng 6 số đầu tiên được chọn là 2, 7, 9, 0, 4, 7 thì người tham dự thứ nhất sẽ ở nhóm
chứng, thứ nhì và thứ ba sẽ ở nhóm điều trị, thứ tư thứ năm sẽ vào nhóm chứng và thứ sáu sẽ
vào nhóm điều trị.
Ðôi khi người ta muốn phân chia sao cho chẳng hạn như cứ mỗi 10 người tham gia, số tham
dự vào mỗi nhóm sẽ bằng nhau. Ðiều này đươc gọi là ngẫu nhiên hóa giới hạn (restricted
randomization) hay ngẫu nhiên hóa cân bằng (randomization with balance). Trong trường
hợp này việc sử dụng bảng số ngẫu nhiên sẽ khác đi. Chẳng hạn đối với mỗi 10 người tham
gia, bảng được dùng để quyết định 5 người sẽ được phân vào nhóm điều trị bằng cách chọn 5
số ở giữa 01 và 10, giả sử 09, 02, 04, 01, 08 được chọn. Người thứ nhất, thứ hai, thứ tư, tứ
tám và thứ chín trong nhóm sẽ được phân vào nhóm điều trị và những người khác, thứ ba, thứ
năm, thứ sau, thứ bảy và thứ mười sẽ đươc phân vào nhóm đối chứng. quá trình ngẫu nhiêu
hóa lại được lặp lại cho mỗi 10 người tham gia.
Có thể biến đổi để cho quá trình ngẫu nhiên hóa có thể đảm bảo tỉ lệ nam và nữ trong mỗi
nhóm như nhau bằng cách dùng các số ngẫu nhiên riêng cho nam và cho nữ.

136
THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP

Thứ tự sắp xếp tốt nhất phải được quyết định trước khi bắt đầu thử nghiệm. Nên cho một số
các phong bì có đánh số ghi rõ sự sắp xếp đã chuẩn bị, được mở mỗi khi một người mới được
chấp nhận vào thử nghiệm.
Bắt cặp
Một cách khác, quy hoạch bắt cặp đôi (matched pair design) có thể được dùng để sắp xếp cho
nhóm điều trị và nhóm đối chứng tương tự với nhau về các yếu tố gây nhiễu chính, như tuổi
và giới tính. Người tham gia được bắt cặp tùy theo biến số bắt cặp, và một người trong mỗi
cặp đươc sắp xếp ngẫu nhiên vào nhóm điều trị và người khác đươc sắp vào nhóm chứng.
Lưu ý rằng việc bắt cặp phải được tuân thủ trong khi phân tích, chẳng hạn như tiến hạnh kiểm
định χ2 McNemar (xem Chương 14) chứ không phải kiểm định χ2 2 × 2 chuẩn.
Quy hoạch bắt cặp đôi không phù hợp bằng ngẫu nhiên hóa khi có sự gia nhập từ từ các
người tham gia vào cuộc thử nghiệm tiến hành trong một thời gian dài bởi vì sẽ có sự trì hoãn
đáng kể trước khi có thể bắt cặp cho một người mới tham gia.
Quy hoạch bắt chéo
Trong thử nghiệm lâm sàng một chế độ điều trị chỉ có ích lợi tạm thời, có thể dùng chính
người tham gia để làm đối chứng. Thí dụ trong khi so sánh 2 thuốc giảm đau (A và B) để điều
trị migraine, mỗi người tham gia có thể thử dùng mỗi chế phẩm trong các dịp khác nhau. Thứ
tự dùng cần được ngẫu nhiên hóa để cho phân nửa người tham gia dùng thuốc A trước và
phân nửa dùng thuốc B trước. Quy hoạch này được gọi là bắt chéo (Cross-over design).
Khuyết điểm chính la có thể có tác động tồn dư (spill-over effect) từ lần thứ nhất ảnh
hưởng đến lần thứ hai.
Quy hoạch mù đơn và mù đôi
Khi có thể, không nên để người tham gia lẫn người nghiên cứu biết loại trị liệu nào đã sử
dụng cho đến cuối cuộc thử nghiệm. Ðiều này được gọi là quy hoạch mù đôi (double blind
design) và đảm bảo không bị sai lệch do xử lí và đánh giá nhóm. Ðiều này đặc biệt cần thiết
nếu có sự đánh giá chủ quan. Ðể đạt được điều này trị liệu cho nhóm chứng cần phải giống về
bề ngoài với trị liệu của nhóm điều trị. Ðiều này có thể là sử dụng chế phẩm placebo không
có tác dụng cho nhóm chứng. Chế phẩm điều trị và đối chứng chỉ được nhận biết nhờ mã số,
mã số đươc giữa bởi một người không có tham gia cho đến khi thu thập tất cả các số liệu.
Quy hoạch mù đơn (single blind design) là khi người nghiên cứu biết nhưng người tham
gia không biết về chế độ trị liệu.
Vấn đề đạo đức
Mặc dù về mặt khoa học một thử nghiệm kiểm chứng ngẫu nhiên hóa là cách tốt nhất để xác
định ích lợi của một chế độ trị liệu, việc sử dụng chúng đặt ra một vấn đề đạo đức quan trọng.
Có đáng phải hoãn trị liệu có thể có ích lợi cho một nhóm đối chứng không? Ðiều này đặc
biệt đúng khi một phương thức trị liệu mới được tin là không gây tác dụng phụ gì và hiện
chưa có chế độ điều trị có hiệu quả hay chế độ điều trị chuẩn. Một thí dụ là việc gợi ý bổ
sung vitamin trong lúc mang thai có thể giảm số mới mắc của khiếm khuyết ống thần kinh.
Cũng vậy, việc nên ngẫu nhiên hóa hay để cho người tham gia có thể chọn nhóm cho họ? có
cần tờ cam đoan hay không? Ðiều này được thảo luận kĩ trong hoàn cảnh của cắt bỏ khối u
hay đoạn nhũ để điều trị ung thu cú của Cancer Research Campaign Working Party in Breast
Conservation (1983). Ðể thảo luận đầy đủ hơn vấn đề này và những vấn đề liên quan hãy xem
Bradford Hill (1977) trong đó có bản sao Khẳng định của Hội đồng nghiên cứu y khoa về
trách nhiệm trong nghiên cứu đối tượng con người (Medical Research Council's Statement on
Responsibility in Investigations on Human Subjects) và tuyên ngôn Helsinki (Helsinki
Declaration) của Hội đồng y khoa thế giới (World Medical Assembly) về Các khuyến cáo
hướng dẫn bác sĩ y khoa trong nghiên cứu y sinh có liên quan đến đối tượng con người
(Reccomendations Guiding Medical Doctor in Biomedical Research Involving Human
Subjects).

137
Căn bản thống kê y học -Ðỗ Văn Dũng

Thử nghiệm lâm sàng tuần tự


Thử nghiệm lâm sàng tuần tự (sequential clinical trial) là một thử nghiệm trong đó kết quả
được đánh giá liên tục để xem đã có đủ bằng chứng để ngừng thử nghiệm và tuyên bố hoặc là
đã xác định được sự khác biệt hay không có sự khác biệt nào.

30
Antoxin täút hån coï yï nghéa
Antoxin

20 (P<0,05)

10
Læûa choün

0 10 20 30 40 50 60
Khaïc biãût
khäng yï
-10 nghéa
khäng Antoxin

-20 Khäng duìng Antoxin täút hån coï yï nghéa


(P<0,05)

-30
Hình 25.1 Kết quả từ một thử nghiệm tuần tự để đánh giá giá trị của liều cao kháng độc tố trong điều trị
uốn ván lâm sang. Với sự cho phép của Brown et al. (1960) Lancet ii, 227-230
Thử nghiệm tuần tự thường được dùng khi kết cuộc của đo lường là một tỉ lệ, thí dụ như tỉ lệ
sống còn trong mỗi nhóm điều trị. Phương pháp luận được minh họa bằng một thí dụ đặc hiệu
(xem chi tiết ở Armitage, 1975). Hình 25.1 trình bày kết quả của một thử nghiệm để đánh giá
hiệu quả của liều lượng cao kháng độc tố trong điều trị uốn ván lâm sàng bằng cách so sánh tỉ
lệ tử vong giữa những người được và không được cho kháng độc tố. Người tham gia được
chia làm 2 nhóm, một người được nhận kháng độc tố và một người không. Nếu người nhận
kháng độc đố còn sống trong khi người kia chết sẽ có thiên vị thuận lợi cho kháng độc tố.
Ngược lại nếu người nhận kháng độc tố chết còn người kia sống sẽ có thiên vị thuận lợi cho
không sử dụng kháng độc tố. Nếu cả hai thành viên đều sống hay đều chết, đây là một cặp
phù hợp và không góp thêm thông tin gì cho việc so sánh dùng kháng độc tố với không dùng
kháng độc tố.
Kết quả đươc ghi nhận được trên một đồ thị trình bày số dư của thiên vị và số các cặp không
phù hợp. Ðồ thị bắt đầu ở điểm zero và vẽ lên một đơn vị và qua phải cho mỗi thiên vị thuận
lợi cho kháng độc tố và xuống một đơn vị và qua phải cho mỗi thiên vị thuận lợi cho không
dùng kháng độc tố. Ranh giới trên được vẽ để trình bày ý nghĩa ở mức 5% và xác suất đường
này hay đường kia bị cắt là 95% nếu tỉ suất của số dư thiên vị là 75% hay hơn. Ở giữa đường
hình cái nêm thể hiện không có ý nghĩa. Ranh giới trên bị cắt ở thiên vị thứ 18 và thử nghiệm
kết thúc. 15 cặp cho kết quả sống còn thuận lợi cho kháng độc tố và 3 cặp thuận lợi cho
không dùng kháng độc tố, do đó xác định sự giảm tử vong có ý nghĩa trong nhóm được cho
kháng độc tố (P<0,05).

138
THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP

Ưu điểm chính của thử nghiệm lâm sàng tuần tự là nói chung cần ít người tham gia để có
được kết luận hơn một thử nghiệm có kích thước cố định, trong đó phân tích được tiến hành
một lần lúc hoàn tất. Dù vậy điều này bù trừ bởi mức ý nghĩa bị giảm bởi vì người ta đã điều
chỉnh cho sự gia tăng khả năng có kết quả ý nghĩa do các kiểm định được lập lại. Do đó,
trong thí dụ trên, mức ý nghĩa thu được là 5%. Nếu không có điều chỉnh này, kiểm định
McNemar cho giá trị χ2 là 6,7 khi so sánh 15 cặp thuận lợi với kháng độc tố và chỉ 3 cặp
thuận lợi cho việc không dùng kháng độc tố. Nó có mức ý nghĩa 1%. Ðiều cần xét về mặt
thực tiễn là thử nghiệm tuần tự không thích hợp cho các tình huống mà có một khoảng thời
gian dài giữa trị liệu và đánh giá cuối cùng của đáp ứng.

Thử nghiệm vaccine


Vấn đề quy hoạch thử nghiệm vaccine tương tự với thử nghiệm lâm sàng thuốc (và các biện
pháp điều trị) và nên sử dụng quy hoạch đối chứng ngẫu nhiên hóa. Dù vậy, mục tiêu của thử
nghiệm vaccine hoàn toàn khác. Chủng vaccine là một biện pháp phòng bệnh và vaccine và
placebo được dùng cho người khỏe mạnh chứ khôngphải cho người bệnh. Mục tiêu là đánh
giá hiệu lực (efficacy) của chủng vaccin trong việc phòng ngừa sự xuất hiện bệnh. Ðiều này
được đo lường bằng tỉ lệ các trường hợp bệnh trong nhóm placebo mà lẽ ra không xảy ra nếu
họ được chủng vaccine.
Thí dụ hãy xét bảng 25.1 trong đó trình bày kết quả từ một thử nghiệm một vaccince cúm
mới. Tổng số 80 trường hợp cúm xảy ra trong nhóm placebo. Nếu nhóm này được chủng
vaccin người ta kì vọng chỉ 8,3% (tỉ suất trong nhóm chủng vaccine) trong số đó bị cúm bằng
220 × 0,083 = 18,3. Sẽ cứu được 80 - 18,3 = 61,7 trường hợp, tính ra kết quả của vaccine là
61,7/80 = 77%
Bảng 25.1 Kết quả của thử nghiệm vaccine cúm, đã được trình bày trong bảng 13.1
Cúm vaccine placebo tổng số
Có 20(8,3%) 80(36,4%) 100(21,7%)
Không 220 140 360
Tổng số 240 220 460
Có thể đơn giản hóa tính toán thành công thức sau, cho thấy rõ mối liên kết giữa hiệu lực
vaccine và nguy cơ tương đối liên hệ do không sử dụng vaccine.
Hiãûu læûc vaccine tè suáút måïi màõc trong nhoïm tiãm chuíng
=1−
(VE ) tè suáút måïi màõc trong nhoïm khäng tiãm chuíng
Công thức này cũng được dùng để tính độ tin cậy của thử nghiệm vaccine. Trước hết tính
khoảng tin cậy của nguy cơ tương đối như trong Chương 24. Sau đó thay vào công thức trên
để có giới hạn tương ứng của hiệu lực vaccine.
1
95% c.i.(VE ) = 1 − 1±1, 96 / χ
RR
Trong thí dụ này

80 / 220 1 1
RR = = 4,36; VE = 1 − = 1− = 0,77 (giäúng nhæ trãn)
20 / 240 RR 4,36

χ2 = 51,37 và χ = (51,37 = 7,17


Giới hạn tin cậy dưới

RR1-1,96/7,17 = 4,361-0,27 = 4,360,73 = 2,93

139
Căn bản thống kê y học -Ðỗ Văn Dũng

VE tương ứng = 1 - 1/2,93 = 0,66


Giới hạn tin cậy trên

RR1+1,96/7,17 = 4,361+0,27 = 4,361,27 = 6,49


VE tương ứng = 1 - 1/6,49 = 0,85
Do đó khoảng tin cậy 95% của hiệu lực vaccine của vaccine cúm này là 66% tới 85%.

Nghiên cứu can thiệp


Thử nghiệm can thiệp là một loại nghiên cứu thực nghiệm khác. Quy hoạch cơ bản của nó
tương tự như thử nghiệm lâm sàng chỉ trừ một ngoại lệ. Việc áp dụng của can thiệp thường
được áp dụng vào một cộng đồng chứ không phải cho các cá nhân. Thí dụ là đánh giá tác
động bổ sung flourur vào nước uống lên bệnh sâu răng ở một số quận này mà không có ở
quận khác, và việc đánh giá tác động lên số mới mắc tiêu chảy của một nguồn nước cải thiện.
Các vấn đề mà một thử nghiệm dựa trên cộng đồng đặt ra còn là một lãnh vực bị bỏ quên và
ngoài phạm vi của cuốn sách này (xem Smith, 1987).

140
TÍNH CỠ MẪU CẦN THIẾT

TÍNH CỠ MẪU CẦN THIẾT


Giới thiệu
Phần quan trọng trong lập kế hoạch điều tra là quyết định có bao nhiều người cần được
nghiên cứu để trả lời mục tiêu nghiên cứu. Rất nhiều khi người ta quyết định dựa trên lãnh
vực hậu cần đơn thuần. Ðó là thói quen xấu và nhiều người xem đó là không đạo đức. Mặt
khác nghiên cứu nhiều người hơn cần thiết là sự lãng phí thời gian, tiền bạc và tài nguyên
(thường là giới hạn). Trong thử nghiệm lâm sàng điều ngày không chỉ là nhiều người hơn cần
thiết phải sử dụng placebo mà còn có nghĩa là làm trì trệ việc đưa vào sử dụng trị liệu có ích.
Mặt khác tham gia một nghiên cứu quá nhỏ không trả lời được mục tiêu cũng đáng chê trách
không kém.
Dù vậy, tính toán cỡ mẫu cần thiết không phải là một thao tác đơn giản bởi vì trước hết cần
phải định lượng hóa mục tiêu. Thí dụ, không thể chỉ khẳng định đơn thuần rằng mục tiêu là
xác đính có phải trẻ nuôi bằng bình có nguy cơ tử vong cao hơn trẻ nuôi bằng sữa mẹ hay
không. Nó cũng cần khẳng định độ lớn của nguy cơ gia tăng muốn xác định bởi vì để phát
hiện sự gia tăng gấp 4 lần cần cỡ mẫu nhỏ hơn khi muốn phát hiện sự gia tăng gấp 2 lần. Hơn
nữa, ngay cả khi cỡ mẫu gia tăng, bởi vì sự biến thiên lấy mẫu (xem Chương 3), luôn luôn có
khả năng chỉ quan sát được nguy cơ nhỏ hơn rất nhiều và chúng ta không thể đảm bảo rằng
nghiên cứu cho kết quả ý nghĩa. Chúng ta có thể làm gì để định rõ xác suất mà chúng ta muốn
đạt được một ý nghĩa thống kê nhất định. Xác suất này gọi là năng lực (power) của nghiên
cứu. Do đó chúng ta có thể xác định rằng nghiên cứu sẽ xứng đáng nếu có xác suất 90%
khẳng định được sự khác biệt trong nguy cơ giữa nhóm trẻ bú bình và bú mẹ nếu nguy cơ
tương đối thực sự là 2.

Nguyên lí của việc xác định cỡ mẫu


Trong chương 12 chúng ta đã thảo luận việc phân tích kết quả của thử nghiệm lâm sàng để so
sánh 2 loại thuốc giảm đau, trong đó 9 trong số 12 người bị migraine nói rằng họ giảm nhiều
với thuốc A hơn thuốc B. Dù vậy, tỉ lệ vượt trội 0,75 thuận lợi cho thuốc A không có ý nghĩa
(P=0,15), cho thấy rằng kết quả phù hợp giới giả thuyết trung tính là không có sự khác biệt về
hiệu quả giữa hai loại thuốc. Có thể xảy ra một trong hai điều hoặc là thực sự không có sự
khác biệt giữa các loại thuốc hoặc là thuốc A tốt hơn nhưng cỡ mẫu 12 không đủ lớn để cho
thấy điều đó.
Xét quy hoạch một nghiên cứu như vậy, và chúng ta cần bao nhiêu bệnh nhân để có thể xác
định tính chất ưu việt của thuốc A. Ðầu tiên chúng ta phải đặc hiệu hóa ưu việt hơn nghĩa là
gì. Chúng ta bắt đầu bằng cách khẳng định điều này là tỉ lệ thiên lệch 70% hay hơn về thuốc
A và chúng ta quyết định chúng ta muốn năng lực 90% đạt được mức ý nghĩa 5%.

141
Căn bản thống kê y học -Ðỗ Văn Dũng

KHÄNG YÏ NGHÉA COÏ YÏ NGHÉA

Xaïc suáút coï kãút quaí yï


(a) n=20
nghéa =42,1%

0 0.5 0.7 1

0.28 0.72
KHÄNG YÏ NGHÉA COÏ YÏ NGHÉA

Xaïc suáút coï kãút quaí yï


(a) n=50
nghéa tàng lãn 82,4%

0 0.5 0.7 1

0.36 0.64
KHÄNG YÏ NGHÉA COÏ YÏ NGHÉA

Xaïc suáút coï kãút quaí yï


(a) n=62
nghéa âaût 90%

0 0.5 0.7 1

Tè lãû coï kãút quaí täút âäúi våïi thuäúc A

Hình 26.1 Xác suất đạt được ý nghĩa (ở mức 5%) với các cỡ mẫu khác nhau (n) khi kiểm định tỉ lệ thiên
vị thuốc A hơn thuốc B khác giá trị giả thuyết trung tính là 0,5, nếu giá trị thực là 0,7
Nguyên lí của việc xác định cỡ mẫu được giới thiệu tốt nhát bằng cách xem xét các cỡ mẫu
khác nhau và đánh giá chúng có thỏa mãn yêu cầu của chúng ta hay không. Chúng ta sẽ bắt
đầu với cỡ mẫu 20, được mô tả trong hình 26.1 (a). Nhớ lại rằng, kết quả có mức ý nghĩa 5%
nếu nó cách trung bình 1,96 s.e. Hay hơn, và giá trị của giả thuyết trung tính về tỉ lệ thiên
lệch với thuốc A là 0,5 và sai số chuẩn (s.e.) bằng √(0,5 × 0,5/n). Ðiều này có nghĩa là cỡ
mẫu bằng 20?

s.e. = 0,5 × 0,5 / 20 = 0,1118


0,5 + 1,96 s.e. = 0,5 + 1,96 × 0,1118 = 0,72
vaì 0,5 + 1,96 s.e. = 0,5 − 1,96 × 0,1118 = 0,28
Do đó phạm vi giá trị có kết quả ý nghĩa là trên hoặc bằng 0,72 và dưới hoặc bằng 0,28.
Nếu tỉ lệ thực sự là 0,7, khả năng quan sát được tỉ lệ bằng hoặc lớn hơn 0,72 và cho kết quả
có ý nghĩa là bao nhiêu? Khả năng này được minh họa bởi hình gạch chéo trên hình. Ðường
cong thể hiện phân phối lấy mẫu, đó là phân phối bình thường có sai số chuẩn là (0,7 ×
0,3/20) = 0,1025. Giá trị z tương ứng với 0,72 là:

142
TÍNH CỠ MẪU CẦN THIẾT

0 , 72 − 0 , 7
= 0 , 20
0 ,1025
Tỉ lệ của phân phối bình thường lớn hơn 0,20 đươc tìm thấy trong bảng A1 bằng 0,421 hay
42,1%. Do đó, nói tóm lại điều này có nghĩa là với cỡ mẫu 20 ta chỉ có 41,2% cơ hội xác định
được thuốc A tối hơn nếu tỉ lệ thiên vị thực sự là 0,7.
Sau đó chúng ta hãy xem chuyện gì xảy ra nếu ta tăng cỡ mẫu lên 50, như trình bày trong
hình 26.1(b). Phạm vi của giá trị mở rộng đến từ 0,64 lên trên và từ 0,36 xuống dưới. Phân
phối lấy mẫu đã hẹp lại và vùng trùng lắp với phạm vi ý nghĩa lớn hơn. Do đó xác suất có kết
quả ý nghĩa đã tăng lên bằng 82,5% nhưng chưa đạt đến yêu cầu của chúng ta là 90%.
Do đó chúng ta nhất định sẽ cần phải hơn 50 bệnh nhân để có năng lực 90%. Nhưng chúng ta
cần bao nhiêu? Chúng ta càn tăng cỡ mẫu tới n, ở đó vùng trùng lắp giữa phân phối lấy mẫu
và phạm vi ý nghĩa đạt được 90% như trình bày trong hình 26.1(c). Chúng ta sẽ mô tả cách
làm thế nào để tính trực tiếp cỡ mẫu cần thiết. Ðạt được kết quả có ý nghĩa nếu chúng ta quan
sát được giá trị lớn hơn

0,5 + 1,96 s.e. = 0,5 + 1,96 × √(0,5 × 0,5/n)


(hay dưới 0,5 - 1,96 s.e.). Chúng ta muốn chọn n đủ lớn để 90% phân phối lấy mẫu ở trên
điểm này. Giá trị z của phân phối lấy mẫu tương ứng với 90% là - 1,28 (xem bảng A2), có
nghĩa là một giá trị quan sát

0,7 - 1,28 s.e. = 0,7 - 1,28 × √(0,7 × 0,3/n)


Do đó n được chọn đủ lớn để

0,7 - 1,28 × √(0,7 × 0,3/n) > 0,5 + 1,96 × √(0,5 × 0,5/n)


Chuyển vế ta được

1,96 × 0,5 × 0,5 + 1,28× 0,7 × 0,3


0,7 − 0,5 >
n
Bình phương hai vế và chuyển vế ta được

[1,96 × 0,5 × 0,5 + 1,28 × 0,7 × 0,3 ]2


n>
0,2 2
1,5666 2
= = 61,4
0, 2 2
Do đó chúng ta cần khoảng 60 bệnh nhân để thỏa mãn yêu cầu của chúng ta là có năng lực
90% xác định sự khác biệt có ý nghĩa giữa thuốc A và thuốc B ở mức 5%, nếu sự thiên lệch
thực sự cho thuốc A là 0,7.

Công thức tính cỡ mẫu


Thảo luận ở trên lênquan đến việc xác định cỡ mẫu cho phép kiểm định một tỉ lệ đơn, đó là tỉ
lệ người tham dự thiên lệch thuốc A so với thuốc B. Trên thực tiễn không nhất thiết lúc nào
cũng phải lí luận chi tiết như vậy. Cỡ mẫu có thể tính trực tiếp từ công thức tổng quát, dùng
cho kiểm định ý nghĩa một tỉ lệ đơn là

143
Căn bản thống kê y học -Ðỗ Văn Dũng

n>
{u π (1 − π ) + v π 0 (1 − π 0 ) }
2

(π − π 0 )2
Trong đó
n = cỡ mẫu cần thiết
p = tỉ lệ quan tâm
po = tỉ lệ của giả thuyết trung tính
u = điểm phần trăm một đuôi của phân phối bình thường tương ứng với 100% -
năng lực, thí dụ nếu năng lực là 90%, (100% - năng lực) = 10% và u = 1,28
v = điểm phần trăm hai đuôi của phân phối bình thường tương ứng mức ý
nghĩa cần thiết, thí dụ nếu mức ý nghĩa là 5%, v= 1,96
Áp dụng công thức này cho thí dụ trên ta có:

p = 0,7 po = 0,5 u = 1,28 và v = 1,96


Suy ra

[1,28 0,7 × 0,3 + 1,96 0,5 × 0,5 ]2


n>
(0,7 − 0,5) 2
1,5666 2
= = 61,4
0,2 2
Cũng đúng bằng kết quả thu được ở trên.
Cũng có thể áp dụng các nguyên lí tương tự cho các trường hợp khác. Ở đây chúng ta không
lí luận chi tiết nhưng sẽ trình bày các công thức dùng cho các tình huống phổ biến nhất trong
bảng 26.1. Danh sách gồm 2 phần. Bảng 26.1(a) gồm các trường hợp mà mục đích nghiên
cứu là xác định sự khác biệt có ý nghĩa. Bảng 26.1(b) gồm các tình huống ước lượng một con
số quan tâm với độ chính xác nhất định. Lưu ý rằng trong trường hợp có hai trung bình, hai tỉ
lệ hay hai tỉ suất công thức cho cỡ mẫu cần thiết cho một trong hai nhóm. Do đó tổng số cỡ
mẫu cần thiết cho nghiên cứu gấp đôi số này. Bảng 26.2 trình bày các hệ số điều chỉnh cho
việc quy hoạch nghiên cứu có các nhóm không cùng cỡ (xem thí dụ 26.3). Lưu ý rằng trong
công thức áp dụng cho tỉ suất cỡ mẫu có cùng đơn vị với tỉ suất (xem thí dụ 26.2)
Việc sử dụng bảng sẽ được minh họa qua một số ví dụ. Cần nhận thức rằng việc tính toán cỡ
mẫu chỉ dựa trên sự suy đoán tốt nhất của chúng ta về tình hình. Con số không phải là con số
ảo thuật. Nó chỉ cho một ý niệm về độ lớn của số người cần được nghiên cứu. Nói cách khác,
nó hữu dụng khi cần phân biệt giữa 50 và 100 chứ không phải để phân biệt giữa 51 và 52. Vì
lí do này, các hiệu chỉnh liên tục không được đưa vào công thức liên quan đến tỉ lệ, bởi vì nó
đươc coi như sự phức tạp không cần thiết. Hơn nữa, các suy đoán của chúng ta khó có thể
chính xác, bởi vì nếu chúng ta đã biết câu trả lời chúng ta đã chẳng cần làm nghiên cứu. Do
đó cần tiến hành tính cỡ mẫu cho một số hoàn cảnh chứ không phải chỉ trong một hoàn cảnh.
Như vậy sẽ có một hình ảnh rõ ràng về phạm vi có thể của cuộc nghiên cứu và rất hữu ích
trong việc cân đối giữa cái mong muốn và tính khả thi về hậu cần.
Cuối cùng, cỡ mẫu phải tăng để bù trừ cho những người không đáp ứng và bỏ cuộc. Cũng cần
điều chỉnh khi sử dụng lược đồ lấy mẫu cụm chứ không phải lấy mẫu ngẫu nhiên, và cần thiết
kiểm soát yếu tố gây nhiễu trong phân tích. Ðiều này không chỉ ngoài phạm vi cuốn sách mà
còn là một lĩnh vực chưa mấy phát triển.
Thí dụ 26.1
Một nghiên cứu được tiến hành trong một vùng nông thôn ở Ðông Phi để xem việc bổ sung
thức ăn trong lúc mang thai có làm tăng trọng lượng trẻ sinh ra hay không. Phụ nữ khám tiền

144
TÍNH CỠ MẪU CẦN THIẾT

sản được phân ngẫu nhiên thành có nhận thức ăn bổ sung và không nhận thức ăn bổ sung.
Công thức 4 trong bản 26.1 sẽ giúp chúng ta quyết định cần huy động bao nhiêu phụ nữ trong
mỗi nhóm. Chúng ta cần cung cấp những thông tin sau:
(a) độ lớn của sự khác nhau về cân nặng mà chúng ta muốn phát hiện. chúng ta quyết định
rằng sự gia tăng 0,25 kg là tác động đáng kể mà chúng ta không muốn bỏ qua. Do đo chúng ta
áp dụng công thức này với µ1-µ2 = 0,25 kg.

145
Căn bản thống kê y học -Ðỗ Văn Dũng
Bảng 26.1 Công thức xác định cỡ mẫu (a) cho các nghiên cứu xác định sự khác biệt có ý nghĩa (b) cho các
nghiên cứu nhằm ước lượng một chỉ số quan tâm với độ chính xác nhất định
Thông tin cần thiết Công thức tính cỡ mẫu tối thiểu
(a) Kết quả ý nghĩa
1. Trung bình đơn µ-µ0 Sự khác biệt giữa trung bình, µ
với giá trị giả thuyết trung tính
µ1 + µ 2
Ðộ lệch chuẩn
e2
σ Xem ở dưới
u,v
2. Tỉ suất đơn* µ Tỉ suất
µ0 Giá trị giả thuyết trung tính 2
(u + v ) µ
u,v Xem ở dưới (µ − µ0 )
2

{ }
3. Tỉ lệ đơn π Tỉ lệ 2
π0 Giá trị giả thuyết trung tính u π (1 − π ) + v π (1 − π )
0 0
u,v Xem ở dưới 2
(π − π 0 )

4. So sánh hai trung bình µ1 - µ2 Hiệu số hai trung bình


(cỡ mẫu cho mỗi nhóm) σ1, σ2 Ðộ lệch chuẩn 2 2 2
(u + v ) (σ 1 + σ 2
)
u, v Xem ở dưới ( µ1 − µ 2 )
2

5. So sánh hai tỉ suất* µ1,µ2 Tỉ suất


(cỡ mẫu cho mỗi nhóm) 2
u, v Xem ở dưới (u + v ) ( µ + µ )
1 2
2
(µ1 − µ 2 )

6. So sánh hai tỉ lệ
(cỡ mẫu cho mỗi nhóm)
π1, π2
u, v
Tỉ lệ
Xem ở dưới
{
u π (1 − π ) + π (1 − π ) + v 2π (1 − π )
1 1 2 2
}
2

2
(π − π 1 )
2

7. Nghiên cứu bệnh chứng π1 Tỉ lệ nhóm chứng tiếp xúc


(cỡ mẫu cho mỗi nhóm) π 1OR
OR Tỉ số số chênh π2 =
1 + π 1 (OR − 1)
π2 Tỉ lệ nhóm bệnh tiếp xúc
Tất cả các trường hợp u, v Xem ở dưới
u Ðiểm phần trăm một đuôi của
phân phối bình thường tương ứng
với 100%-năng lực, td. nếu năng
lực = 90%, u = 1,28
Ðiểm phần trăm của phân phối
bình thường tương ứng với mức ý
v nghĩa, td. nếu mức ý nghĩa = 5%,
v = 1,96
(b) Ðộ chính xác
8. Trung bình đơn σ Ðộ lệch chuẩn
σ2
e Ðộ lớn sai số chuẩn cần thiết
e2
9. Tỉ suất đơn* µ Tỉ suất
µ
e Ðộ lớn sai số chuẩn cần thiết
e2
10. Tỉ lệ đơn π Tỉ lệ π (1 − π )
e Ðộ lớn sai số chuẩn cần thiết
e2
11. Hiệu số giữa hai trung σ1, σ2 Ðộ lệch chuẩn
bình
σ 12 + σ 22
e Ðộ lớn sai số chuẩn cần thiết
(cỡ mẫu cho mỗi nhóm) e2
12. Hiệu số giữa hai tỉ suất* µ 1, µ 2 Tỉ suất
(cỡ mẫu cho mỗi nhóm)
µ1 + µ 2
e Ðộ lớn sai số chuẩn cần thiết
e2
11. Hiệu số giữa hai tỉ lệ π1, π2 Tỉ lệ π1(1-π1)+π2(1-π2)
(cỡ mẫu cho mỗi nhóm) e Ðộ lớn sai số chuẩn cần thiết ---------------
e2
* Trong các trường hợp này, cỡ mẫu có cùng đơn vị với mẫu số của tỉ suất. Thí dụ nếu tỉ suất tính theo người năm thì công
thức tính ra người năm quan sát (xem thí dụ 26.2)
146
TÍNH CỠ MẪU CẦN THIẾT

(b) Ðộ lệch chuẩn của phân phối trọng lượng lúc sinh trong mỗi nhóm. Chúng ta quyết định
giả sử rằng độ lệch chuẩn của trọng lượng lúc sinh sẽ như nhau trong hai nhóm. Số liệu cũ
gợi ý rằng độ lệch chuẩn là 0,4 kg. Nó cách khác chúng ta giả sử rằng s1 = 0,4 kg và s2 = 0,4
kg.
(c) Thống nhất năng lực cần thiết là 95%. Do đó chúng ta cần u 1,64
(d) Mức ý nghĩa cần thiết. Chúng ta quyết định rằng nếu có thể chúng ta sẽ đạt được mức ý
nghĩa 1%. Do đó v = 2,58. Áp dụng công thức 4 với các giá trị này ta đạt được
(1,64 + 2,58) 2 × (0,4 2 + 0,4 2 )
n>
0,25 2
17,8084 × 0,32
= = 91,2
0,0625
Do để thỏa mãn yêu cầu của chúng ta chúng ta cần huy động khoảng 90 người phụ nữ trong
mỗi nhóm.
Thí dụ 26.2
Trước khi tham gia vào một can thiệp cung cấp nước, thanh khiết và vệ sinh ở nam
Bangladesh, đầu tiên chúng ta muốn biết số lần tiêu chỷa hằng năm của trẻ dưới 5 tuổi.
Chúng ta giả sử tỉ suất mới mắc là 3 nhưng muốn ước lượng chúng với sai số (0,2. Ðiều này
có nghĩa là, nếu chúng ta quan sát được 2,6 lần tiêu chảy/trẻ/năm chúng ta có thể kết luận
rằng tỉ suất thực sự có lẽ ở giữa 2,4 và 2,8 lần/trẻ/năm. Viết lại điều này bằng từ ngữ thống
kê, chúng ta muốn rằng khoảng tin cậy 95% không rộng hơn (0,2. Bởi vì độ rộng của khoảng
tin cậy này khoảng (2 s.e.. Ðiều này có nghĩa là chúng ta muốn nghiên cứu đủ trẻ để có sai số
chuẩn nhỏ hơn 0,1 lần/trẻ/năm. Áp dụng công thức 9 và bảng 26.1 tính ra được
3
n> = 300
0 ,12
Lưu ý rằng công thức này áp dụng cho tỉ suất (số 3, 6, 11, 14) cho số mẫu cần thiết có đơn vị
giống như tỉ suất. Chúng ta tính tỉ suất theo số lần cho mỗi trẻ cho mỗi năm. Do đó chúng ta
cần nghiên cứu 300 trẻ năm để có độ chính xác mong muốn. Ðiều này có thể đạt được bằng
cách quan sát 300 trẻ trong một năm hay quan sát 1200 trẻ trong 3 tháng. Dù vậy không nên
bỏ qua các khả năng khác như tác động của thời tiết khi quyết định khoảng thời gian của
nghiên cứu.
Thí dụ 26.3
Một nghiên cứu bệnh chứng để nghiên cứu xem trẻ bú bình có nguy cơ chết vì nhiễm trùng
hô hấp cấp tính có cao so với trẻ bú mẹ hay không. Mẹ ở một nhóm bệnh (trẻ chết với giấy
chứng tử có nguyên nhân chết là hô hấp sẽ được phỏng vấn về tình trạng bú sữa mẹ của trẻ
trước khi chết. Kết quả được so sánh với số liệu thu được về tình trạng bú sữa mẹ từ mẹ của
những đứa trẻ chứng bình thường. Người ta kì vọng khoảng 40% chứng (p1 = 0,4) sẽ bú bình
và chúng ta muốn phát hiện sự khác biêt nếu bú bình liên quan đến sự gia tăng nguy cơ tử
vong gấp 2 (OR =2). Cần nghiên cứu bao nhiêu bệnh và chứng để có năng lực 90% (u = 1,28)
đạt đươc mức ý nghĩa 5% (v=1,96)? việc tính toán gồm một số bước chi tiết trong công thức
7 của bảng 26.1.

147
Căn bản thống kê y học -Ðỗ Văn Dũng

Bảng 26.2 Hệ số điều chỉnh để sử dụng trong quy hoạch nghiên cứu đ so sánh các nhóm có kích thước
không bằng nhau, như việc chọn nhiều chứng cho một bệnh trong nghiên cứu bệnh chứng. Hệ số (f) ap
dụng cho nhóm nhỏ hơn và bằng (c+1)/2c, trong đó kích thước của nhóm lớn hơn sẽ bằng c lần kích
thước của nhóm nhỏ. Cỡ mẫu của nhóm nhỏ sẽ là fn trong đó n là số cần thiết trong trường hợp 2 nhóm
bằng nhau và cỡ mẫu của nhóm lớn sẽ là cfn (xem thí dụ 26.3)
Tỉ số của nhóm lớn Ðiều chỉnh cỡ mẫu
so với nhóm nhỏ (c) của nhóm nhỏ (f)
1 1
2 3/4
3 2/3
4 5/8
5 3/5
6 7/12
7 4/7
8 9/16
9 5/9
10 11/12
(a) Tính p2, tỉ lệ của trẻ bú bình
π 1OR 0,4 × 2 0,8
π2 = = = = 0,57
1 + π 1 (OR − 1) 1 + 0,4 × ( 2 − 1) 1,4
(b) Tính (p, trung bình của p1 và p2
0 , 4 + 0 ,57
π = = 0 , 485
2

(c) Tính cỡ mẫu tối thiểu

[1,28 0,4 × 0,6 + 0,57 × 0,43 + 1,96 2 × 0,485 × 0,515 ]2


n>
(0,57 − 0,4) 2
[1,28 × 0,4851 + 1,96 × 0,4996 2,2769 2
= = = 179,4
0,17 2 0,17 2
Do đó chúng ta cần huy động khoảng 1 bệnh và 180 chứng để có tổng số cỡ mẫu là 360.
Chuyện gì sẽ xảy ra nếu chúng ta quyết định huy động số chứng lớn gấp 3 lần số bệnh. Bảng
26.2 trình bày các hệ số điều chỉnh cho số các bênh tùy theo số các chứng/bệnh khác nhau.
Thí dụ c = 3, hệ số điều chỉnh là 2/3. Ðiều này có nghĩa là chúng ta cần 180 × 2/3 = 120 bệnh
và số chứng nhiều gấp 3 lần = 360. Mặc dù số chứng cần thiết đã giảm đáng kể, cỡ mẫu
chung đã tăng từ 360 lên 540.

148
SỬ DỤNG MÁY TÍNH

SỬ DỤNG MÁY TÍNH


Giới thiệu
Trong thập kỉ qua đã diễn ra cuộc cách mạng trong sự tiếp cận với công nghệ máy tính. Mười
lăm năm trước, rất ít người có thể có được thậm chí một máy tính cầm tay và đa số các máy
tính cầm tay đều có thành tích tầm thường, chỉ làm các phép tính số học cơ bản. Máy tính là
các máy lớn cần một môi trường được điều hòa không khí và một số người điều hành chúng.
Chúng được sử dụng giới hạn trong các nhà phân tích viên máy tính và các lập trình viên. Sự
phát triển của máy vi tính đã làm thay đổi tất cả. Với một chi phí tương đối thấp, có thể mưa
cho mình một hệ thống máy tính đặt vừa trên một chiếc bàn và thỏa mãn hầu hết các nhu cầu
tính toán và học được (ngay cả khi trước đó không có kinh nghiệm về máy tính) các kĩ năng
về tính toán trong thời gian tương đối ngắn.
Chỉ trừ các nghiên cứu rất nhỏ, hầu hết các nghiên cứu đều có ích khi sử dụng máy tính. Nó
tính toán nhanh hơn và chính xác hơn khi tính bằng tay. Có thể xử lí số liệu lớn và phân tích
phức tạp hơn. Nó cũng cho phép dễ dàng lập lại các phân tích có thay đổi, chẳng hạn như
phân tích nam và nữ riêng và chung. Dù vậy cần phải lưu ý một số điều. Việc sử dụng máy
tính đòi hỏi thêm thì giờ để chuẩn bị số liệu và chương trình. Cần phải kiểm tra tất cả các thủ
tục trên một số nhỏ các số liệu và kiểm chứng kết quả bằng tay. Nếu không có thể xảy ra các
sai sót nghiêm trọng. Cuối cùng, có thể đi rất ra và làm rất nhiều các phân tích mà không có
suy nghĩ thực sự về chúng.
Chúng ta sẽ mô tả ngắn gọn các phương tiện căn bản cho bất kì các hệ thống máy tính nào và
xác định các hạn chế phổ biến. Bởi vì công nghệ máy tính phát triển rất nhanh, chúng tôi
không khuyến cáo nhất định về loại thiết bị cần thiết, và danh sách cũng không toàn diện. Ðể
nắm thêm chi tiết cần một cuốn sách chuyên ngành cập nhật hay một cuốn sách hướng dẫn
cho người mua máy tính.

Phần cứng máy tính


Thiết bị máy tính được gọi là phần cứng (hardware). Một máy vi tính điển hình gồm có một
bàn phím, một màn hình (monitor), một bộ vi xử lí có bộ nhớ (bộ nhớ truy cập ngẫu nhiên -
Random access memory - RAM), và các ổ đĩa. Nó thường được kèm theo máy in.
Một máy tính lớn (mainframe) có bộ xử lí mạnh hơn, có hê thống chia xẻ thời gian giải quyết
với nhiều người dùng cùng một lúc. Nó có hệ điều hành tinh vi hơn và có khả năng lưu trữ
lớn hơn. Số liệu có thể ở trên đĩa cứng để dễ dàng và nhanh chóng truy suất trong khi phân
tích hay trên các băng từ để lưu trữ số lượng lớn trong thời gian lâu dài. Dung lượng của băng
từ phụ thuộc vào chiều dài, mật độ và dạng thức. Thí dụ, một băng từ dài 2400 feet được viết
với mật độ 1600 b.p.i. (bits per inch) có thể giữ khoảng 30 triệu kí tự thông tin. Nếu nó chứa
một bản vấn lục dài 120 biến số, có tổng số 300 chữ số, băng từ sẽ có thể giữ khoảng 100.000
bản vấn lục.

Ổ đĩa
Có hai loại ổ đĩa, đĩa mềm và đĩa cứng. Ổ đĩa mềm có thể tiếp nhận đĩa mềm có kích thước
khác nhau (thí dụ 3,5 inch, 5,25 inch) phụ thuộc vào máy cụ thể. Dung lượng của đĩa (và của
bộ nhớ trong) được tính bằng byte, trong đó một byte là số không gian cần thiết để chứa đựng
một kí tự. Khả năng của đĩa phụ thuộc vào dạng thực của hệ thống sử dụng để sắp xếp số liệu
trên đĩa, thông tin được lưu trữ mật độ đơn hay mật độ đôi, và đĩa có thể đọc một mặt hay hai
mặt. Chữ k kí hiệu 100 và mega có nghĩa là một triệu. Do đó một đĩa mềm có dung lượng
1,44 megabyte có thể chứa được 1.400.000 kí tự.
Ðĩa cứng thường có dạng cố định, nằm ở bên trong máy tính. Nó có dung lượng lớn
chẳng hạn như 120 hay 210 megabyte, truy suất đọc và ghi rất nhanh.

149
Căn bản thống kê y học -Ðỗ Văn Dũng

Tổ chức dữ liệu
Số liệu được lưu trữ dưới dạng tập tin (file), và được tập hợp trong thư mục (directory) của
đĩa. Một tập tin có những mẫu tin (records). Có thể có một hay nhiều mẫu tin cho một cá
nhân chẳng hạn tương ứng với số trang khác nhau của bản vấn lục. Tập tin có thể có cấu trúc
tuần tự hay truy cập ngẫu nhiên. Trong tập tin tuần tự (sequential file) các mẫu tin được
viết và đọc theo thứ tự. Thí dụ, để truy cập thông tin có liên quan đến người số 10, đầu tiên
cần đọc thông tin từ người số 1 đến 9. Tập tin truy cập ngẫu nhiên (random access file) có thể
đi thẳng đến vị trí của mẫu tin số 10 để đọc (hay ghi) thông tin cho người số 10.
Các mẫu tin đươc viết dưới dạng thức cố định hay tự do. Trong dạng thức cố định (fixed
format), số liệu được sắp xếp theo chuỗi các số (hay kí tự), và một biến luôn luôn ở cùng một
vị trí cột trong mẫu tin. Số được căn phải (right justified). Thí dụ, nếu hai vị trí được phân
cho tuổi, thì 9 tuổi sẽ được lưu trữ bằng 09 hay 9 chứ không phải là 9 . Dấu thập phân không
được ghi rõ; vị trí của nó được rút ra từ số cột. Trong dạng thức tự do (free format), biến số
được sắp xếp theo mẫu tin, cách nhau bởi dấu phảy hay khoảng trắng, không cố ý xếp hàng
theo mẫu tin. Phải ghi các số thập phân. Một thí dụ của hai loại dạng thức trên được trình bày
trong bảng 27.1
Cuối cùng số liệu có thể trữ trực tiếp dưới dạng kí tự (dạng ascii) hay đươc chuyển sang dạng
máy gồm một loạt các số 0 và 1 (dạng nhị phân - binary format). Các dạng thức được dùng
phụ thuộc vào tập tin đã được tạo ra như thế nào. Nhiều phần mềm sử dụng dạng nhị phân
cho bất kì mọi thao tác và xử lí số liệu trong phần mềm nhưng chúng tạo ra tập tin dưới dạng
thức ascii nếu nó sử dụng với các phần mềm khác hay chuyển tới máy khác.
Bảng 27.1 So sánh dạng thức cố định và tự do để lưu trữ số liệu
ID Tuổi số con tăng trọng (kg) trọng lượng trẻ sơ
sinh (g)
1 21 1 11,5 3520
2 18 0 9,5 2950
3 25 1 10,6 3380
4 31 3 14,1 3860
5 23 0 9,9 3200

Dạng thức cố định Dạng thức tự do


12111153520 1,21,1,11.5,3520
21800952950 2,18,0,9.5,2950
32511063380 3,25,1,10.6,3380
43131413860 4,31,3,14.1,3860
5230 993200 5,23,0,9.9,3200

Sao chép lưu


Cần phải có ít nhất 3 bản sao của bất kì tập tin số liệu nào. Cả đĩa và băng từ có thể bị hư hay
bị phá hủy. Tốt nhất nên giữ ít nhất một bản sao ở một nơi khác để an toàn không bị các biến
cố như cháy, lụt lội và đánh cắp. Bản sao chép lưu (back-up copy) phải được thực hiện
thường xuyên. Ðiều này không bao giờ được lưu ý đầy đủ.
Hơn nữa, khi được nhập vào máy tính, số liệu thường được lưu ngay vào bộ nhớ máy tính và
chỉ được chuyển vào đĩa khi bộ nhớ đầy. Tốt nhất là phải đảm bảo rằng số liệu được chuyển
vào đĩa thường xuyên, thí dụ như mỗi nửa giờ, để giảm thiểu số liệu bị mất và lãng phí thời
gian khi máy tính bị dừng vì một số lí do. Mất điện hay treo máy do lỗi, thí dụ như cố gắng

150
SỬ DỤNG MÁY TÍNH

ghi nhiều thông tin vào đĩa không còn trống, hay vô tình nhấn một số phím vào đó và có thể
mất số liệu trong bộ nhớ và có thể gây phá hủy đĩa.

Phần mềm máy tính


Không có máy tính nào có thể làm việc được mà không có phần mềm (soft ware). Ở mức thấp
nhất là hệ điều hành (operating system), gồm các lệnh cần thiết để điều hành máy tính như
ghi chép (COPY) tập tin, ghi ra màn hình (TYPE) một tập tin hay thực hiện (RUN) một
chương trình, liệt kê thư mục (DIR) của một đĩa. Kế đến là chương trình (program) gồm
một bộ lệnh để làm một nhiệm vụ nào đó, thí dụ như so sánh trọng lượng của trẻ với trọng
lượng trung vị của tuổi đó ở trong tiêu chuẩn phát triển và tính trọng lượng quan sát được
theo phần trăm của chuẩn. Một chương trình được viết trong một ngôn ngữ (language), thí dụ
như Basic, Fortran, C, hay Pascal. Chương trình được chuyển thành lệnh máy nhờ bộ biên
dịch (compiler). Cuối cùng nhieu chương trình áp dụng chung được gọi là gói phần mềm
(package).
Các gói phần mềm mà chúng ta quan tâm có 3 loại, căn cứ dữ liệu (database), thống kê và xử
lí văn bản (word-processing). Phần mềm căn cứ dữ liệu nên dùng để nhập số liệu và tạo các
cấu trúc dữ liệu tổng quát, như sắp xếp và chọn một nhóm các mẫu tin. Hầu hết sẽ tạo các bản
vấn lục trên màn hình và hiện lên tên các biến được nhập. Con trỏ (cursor) dùng để chỉ vị trí
hiện tại và chuông sẽ kêu khi hoàn thành bản vấn lục. Lưu ý rằng một số gói phần mềm có
hạn chế về tổng số biến có thể nhập cho một cá nhân nhưng có thể khắc phục bằng cách kết
hợp các biến, chẳng hạn như tất cả các biến nhân trắc thành một biến dài.
Nhiều chương trình căn cứ dữ liệu cũng có thể lập bảng và tính các thống kê cơ bản. Dù vậy
nói chung nên dùng gói phần mềm thống kê (statistical package) chuyên dụng để thao tác và
phân tích số liệu. Phần mềm xử lí văn bản (word-processing package) hữu ích không chỉ để
báo cáo kết quả mà còn để xây dựng chương trình và quy hoạch bản vấn lục. Liên kết với gói
phần mềm căn cứ dữ liệu, có thể dùng để tạo ra bản vấn lục đã có một phần tông tin như tên,
địa chỉ, tuổi và tránh chép bằng tay từ cuộc điều tra này sang cuộc điều tra khác.
Dù vậy, đôi khi các đòi hỏi của cuộc điều tra không thể thỏa mãn bằng bộ phần mềm. Do đó
cần phải viết một số chương trình nhỏ.

151
Căn bản thống kê y học -Ðỗ Văn Dũng

CHÈ MUÛC
baíng dæû truì 2 × 2 ............................................ 77
baíng gáúp 4........................................................ 77
95% confidence limits......................................... 25 Baíng låïn (nhiãöu haìng, nhiãöu cäüt) ............... 80
baíng säú ngáùu nhiãn ...................................... 148
A baíng säúng ....................................................... 105
a priori................................................................. 48 so saïnh ........................................................ 107
Âa giaïc táön suáút.............................................. 10 baíng säúng âoaìn hãû....................................... 105
âaïnh dáúu............................................................. 9 baíng säúng hiãûn haình ................................... 105
âån vë báûc hai.................................................. 151 balanced design................................................... 45
âån vë báûc mäüt............................................... 151 balanced with replication .................................... 45
âäö thë................................................................... 5 bàòng phán phäúi bçnh thæåìng.......................... 20
âäöng biãún säú................................................... 64 bàõt càûp táöng................................................. 159
âäöng nháút bar diagram ........................................................... 7
phán phäúi...................................................... 11 bäü biãn dëch .................................................... 182
Âäü âàûc hiãûu.................................................. 144 bãûnh (case) ...................................................... 138
âäü däúc .............................................................. 54 bãûnh hiãúm
âäü khaí dé cæûc âaûi ......................................... 93 giaí âënh....................................................... 157
âäü lãûch bçnh thæåìng chuáøn .......................... 21 bãûnh phäø biãún
âäü lãûch chuáøn................................................. 14 giaí âënh....................................................... 158
tênh toaïn ....................................................... 16 Bayes................................................................... 65
âäü lãûch chuáøn hçnh hoüc ............................. 125 Bayesian approach .............................................. 65
Âäü nhaûy caím ................................................ 144 Berkson's fallacy ............................................... 143
âäü tæû do between groups ................................................... 42
cuía phæång sai .............................................. 14 bias............................................................ 139, 142
âäúi xæïng........................................................... 11 biãún âäøi logistic ............................................... 93
additive rule ........................................................ 65 biãún säú ............................................................... 4
biãún säú gáy nhiãùu........................................... 89
Æ biãún säú nhë phán ............................................. 68
Æåïc læåüng...................................................... 135 biãún thiãn .......................................................... 14
biãún thiãn láúy máùu........................................... 4
A bimodal ............................................................... 11
binary format..................................................... 180
âënh lê giåïi haûn trung tám................................ 26
binary variable .................................................... 68
âënh tênh............................................................... 4
binomial distribution........................................... 68
agesex adjusted mortality rate ............................. 99
âiãøm 5 pháön tràm............................................. 24 C
âiãøm chàûn ........................................................ 54
âiãøm pháön tràm................................................ 23 cåî máùu........................................................ 4, 170
âiãöu tra càõt ngang nguyãn lê xaïc âinh ...................................... 170
nhiãöu láön................................................... 137 Cäng thæïc tênh cåî máùu ................................. 173
analysis of variance............................................. 41 cäøng nàm thanh ................................................... 9
ANCOVA .............See phán têch âäöng phæång sai case control study.............................................. 138
ANOVA.............................................................. 41 casecontrol study............................................... 158
äø âéa ................................................................ 180 cáu hoíi âoïng.................................................... 140
ÄØ âéa cæïng.................................................... 180 Cáu hoíi måí...................................................... 140
ÄØ âéa mãöm.................................................... 180 censored ............................................................ 105
Âo læåìng tæí vong census................................................................ 148
caïc säú âo ...................................................... 97 central limit theorem ........................................... 26
trong nghiãn cæïu........................................... 96 chæång trçnh..................................................... 181
âoaìn hãû........................................................... 138 chæïng (control)................................................ 138
arithmetic mean................................................... 13 chi square test ..................................................... 77
association......................................................... 135 childyears at risk ................................................. 98
attributable risk ................................................. 155 Choün máùu hãû thäúng ................................... 149
attributable risk percent..................................... 155 Choün máùu ngáùu nhiãn âån........................... 148
âuäi dæåïi ............................................................ 11 clinical trials...................................................... 139
âuäi trãn .............................................................. 11 close question ................................................... 140
cluster........................................................ 150, 152
B cluster analysis.................................................... 64
cluster sampling ................................................ 152
backup copy ...................................................... 181
Coefficient of variation ....................................... 16
Baíng 2 × 2 (so saïnh hai tè lãû) ......................... 77
cohort................................................................ 138
baíng 2 × c compiler ............................................................ 182
cäng thæïc ruït goün....................................... 82 components of variation...................................... 50
baíng dæû truì ..................................................... 77 Con troí............................................................. 182

152
Chè muûc

conditional logistic regression .......................... 161 false negative rate ............................................. 144
conditioned logistic regression ........................... 94 false positive rate .............................................. 144
confidence interval.............................................. 19 file..................................................................... 180
confounding bias............................................... 143 final digit........................................................... 119
consistency checks ............................................ 141 finite population correction................................. 19
contigency table .................................................. 77 first stage units .................................................. 151
continous monitoring ........................................ 137 fivebar gates.......................................................... 9
continuity correction ........................................... 74 fixed .................................................................. 138
control group..................................................... 164 fixed effects......................................................... 50
correlation ........................................................... 51 fourfold table ...................................................... 77
correllation coefficient ........................................ 52 free format......................................................... 180
correspondance analysis...................................... 64 frequencies............................................................ 7
covariate.............................................................. 64 relative ............................................................. 7
Cox's proprotional model.................................. 108 frequency
cross product ratio............................................. 158 distribution....................................................... 8
crossover design................................................ 164 frequentist definition........................................... 65
Crossover design............................................... 165 Friedman twoway ANOVA .............................. 130
crosssectional study .......................................... 137
G
cumulative......................................................... 106
current life table ................................................ 105 Gaussian distribution .......................................... 20
cursor ................................................................ 182 Generalized Linear Interactive Modelling .......... 94
cuûm ................................................................. 152 geometric mean................................................. 123
geometric standard deviation ............................ 125
D
geomtric mean..................................................... 14
dán säú giaí thuyãút trung tênh ........................................ 30
Phán phäúi táön suáút .................................... 11 giaï trë bë khuyãút............................................... 50
Dán säú ................................................................. 3 giåïi haûn tin cáûy............................................... 25
dán säú cäú âënh ............................................... 138 giaïm saït liãn tuûc............................................ 137
dán säú âäüng.................................................... 138 goïi pháön mãöm .............................................. 182
dán säú muûc tiãu ................................................. 4 goïi pháön mãöm thäúng kã .............................. 182
database............................................................. 182
H
daûng ascii ........................................................ 180
daûng thæïc cäú âënh ........................................ 180 hai âuäi................................................................ 24
degrees of freedom........................................ 14, 27 hai yãúu vë.......................................................... 11
dependent............................................................ 66 haìm phán biãût................................................... 64
dependent variable .............................................. 54 häöi cæïu................................................... 137, 153
deviance .............................................................. 94 Häöi quy bæåïc luìi............................................. 62
deviation ............................................................. 14 Häöi quy bæåïc tåïi............................................. 62
diãûn têch dæåïi âæåìng cong ............................. 22 häöi quy bäüi ................................................ 42, 58
digit................................................................... 148 vaì phán têch phæång sai ............................... 63
direct method ...................................................... 99 Häöi quy bäüi våïi 2 biãún säú............................ 59
directory............................................................ 180 Häöi quy bäüi våïi caïc biãún giaíi thêch phi tuyãún
discordant pairs................................................. 160 tênh ................................................................ 63
discriminant function .......................................... 64 Häöi quy bäüi våïi caïc biãún giaíi thêch råìi raûc62
discriminat analysis............................................. 64 Häöi quy bäüi våïi nhiãöu biãún ......................... 61
double blind design........................................... 166 häöi quy logistic............................................ 64, 93
doubleblind controlled trial............................... 139 häöi quy logistic coï âiãöu kiãûn ................ 94, 161
dummy variable................................................... 62 Häöi quy täø håüp täúi æu ................................. 62
dynamic............................................................. 138 Häöi quy tuyãún tênh.......................................... 54
Häöi quy vãö trung bçnh................................... 145
E
hardware ........................................................... 179
efficacy.............................................................. 168 hãû âiãöu haình................................................. 181
equal probability scheme .................................. 137 hãû säú häöi quy riãng pháön ............................. 60
equal probability selection method  epsem ....... 150 hãû säú tæång quan............................................. 52
estimation.......................................................... 135 vaì baíng phán têch phæång sai...................... 59
evaluation.......................................................... 136 hãû säú tæång quan bäüi ..................................... 60
exact test ....................................................... 79, 84 hazard rate......................................................... 108
experimental...................................................... 136 Helsinki Declaration ......................................... 166
explanatory variable............................................ 54 hiãûu chènh tênh liãn tuûc .................................. 74
exponential........................................................ 108 hiãûu chènh tênh liãn tuûc cuía Yates................. 78
hiãûu læûc......................................................... 168
F
hiãûu säú hai trung bçnh
factor ................................................................... 41 phán phäúi láúy máùu .................................... 37
factor analysis ..................................................... 64 hierarchical structure......................................... 151
factorial ............................................................... 70 histogram .............................................................. 9

153
Căn bản thống kê y học -Ðỗ Văn Dũng

I life expectancy .................................................. 107


life table ............................................................ 105
ì thaình pháön cuía sæû biãún thiãn.................... 50
linear ................................................................... 51
incidence ............................................................. 97
linear regression.................................................. 51
incidence rate ...................................................... 98
log linear model .................................................. 94
incidence risk ...................................................... 98
logistic regression ............................................... 93
independent variable ........................................... 54
logit................................................................... 127
indirect method ................................................... 99
lognormal distribution ...................................... 122
information bias ................................................ 143
longitudinal study ............................................. 137
interaction ........................................................... 45
intercept .............................................................. 54 M
intervention trials .............................................. 139
mä hçnh muî ..................................................... 108
J mä hçnh nguy cå tè lãû cuía Cox ...................... 108
mä hçnh tuyãún tênh log..................................... 94
J ngæåüc
Mä thæïc säúng coìn ......................................... 108
phán phäúi...................................................... 11
mæïc yï nghéa ............................................... 30, 31
K main effect .......................................................... 45
mainframe ......................................................... 179
kç voüng säúng ................................................. 107 maïy tênh
kê tæû................................................................ 180 trong phán têch thäúng kã ............................ 179
Kendall's rank correlation ................................. 130 maïy tênh cáöm tay ............................................... 6
khoaíng tin cáûy............................................ 19, 28 trong häöi quy tuyãún tênh............................. 57
khung máùu ...................................................... 148 maïy tênh låïn.................................................... 179
Kiãøm âënh bçnh thæåìng................................... 34 Mann Whitney U test ........................................ 130
kiãøm âënh chênh xaïc........................................ 79 màõc toaìn bäü.................................................... 97
Fisher ............................................................. 84 màõc toaìn bäü thåìi âiãøm ................................. 97
Kiãøm âënh chênh xaïc matched............................................................. 164
cho baíng 2 x 2............................................... 84 matched data ....................................................... 94
kiãøm âënh chi bçnh phæång .............................. 77 matched design ................................................. 160
Kiãøm âënh chi bçnh phæång ............................. 77 matched pair design .......................................... 165
Kiãøm âënh chi bçnh phæång âënh hæåïng ........ 91 matched paired design......................................... 86
kiãøm âënh log rank.......................................... 107 mäüt âuäi............................................................. 24
Kiãøm âënh mäüt âuäi......................................... 33 mäüt yãúu vë....................................................... 11
Kiãøm âënh phuì håüp máùu ............................................................. 3, 148
phæång phaïp chi bçnh phæång ................... 118 máùu cåî låïn....................................................... 25
Kiãøm âënh sàõp haûng coï dáúu Wilcoxon..... 131 Máùu nhoí........................................................... 26
Kiãøm âënh t càûp âäi......................................... 30 máùu tin ............................................................ 180
kiãøm âënh t hai âuäi .......................................... 33 maximum likelihood ........................................... 93
Kiãøm âënh t mäüt máùu .................................... 33 mean square ........................................................ 42
Kiãøm âënh täøng sàõp haûng Wilcoxon.......... 132 median ................................................................ 13
kiãøm âënh yï nghéa method of linear contrasts................................... 48
quan hãû våïi khoaíng tin cáûy....................... 32 missing value ...................................................... 50
Kiãøm âënh yï nghéa........................................... 30 mode ................................................................... 13
duìng xáúp xè bçnh thæåìng........................... 73 monitor.............................................................. 179
kiãøm chæïng.................................................... 141 MS regression ..................................................... 59
Kiãøm tra phaûm vi .......................................... 141 MS residual......................................................... 59
Kiãøm tra säú liãûu ........................................... 141 mulitple invasion .............................................. 120
Kiãøm tra tênh phuì håüp.................................. 141 mulplicative rule ................................................. 65
KolmogorovSmirnov test.................................. 130 multiple comparison ........................................... 79
Kruskal Wallis oneway ANOVA ...................... 130 multiple correlation coefficient ........................... 60
L multiple regression.............................................. 42
multiple regression equation ............................... 59
Læåüng giaï....................................................... 136 multiple response questions .............................. 141
language............................................................ 181 multi-stage sampling......................................... 152
lãûch.................................................................... 11 multistage.......................................................... 150
láúy máùu.......................................................... 148 multistage sampling .......................................... 151
láúy máùu cuûm........................................ 150, 152
Láúy máùu cuûm............................................... 152 N
láúy máùu hai báûc ........................................... 151 nàng læûc.................................................... 35, 170
láúy máùu hoaìn laûi......................................... 151 natural logarithms ............................................. 123
láúy máùu nhiãöu báûc ............................. 150, 152 ngän ngæî.......................................................... 181
Láúy máùu nhiãöu báûc .................................... 151 ngäü biãûn Berkson .......................................... 143
láúy máùu phán táöng ....................................... 150 ngáùu nhiãn hoïa cán bàòng.............................. 165
Láúy máùu phán táöng...................................... 150 ngáùu nhiãn hoïa giåïi haûn .............................. 165
least squares fit.................................................... 54 nghiãn cæïu
liãn tuûc ................................................................ 4

154
Chè muûc

láûp kãú hoaûch ........................................... 135 phán phäúi Poisson


muûc tiãu...................................................... 135 Hçnh daïng................................................... 111
tiãún haình ................................................... 135 Phán phäúi Poisson........................................... 110
nghiãn cæïu âoaìn hãû....................................... 153 âënh nghéa ................................................... 110
Nghiãn cæïu bãûnh chæïng....................... 138, 158 vaì tè suáút ................................................... 113
Nghiãn cæïu can thiãûp..................................... 169 phán phäúi t ........................................................ 27
nghiãn cæïu càõt doüc....................................... 137 våïi (n-1) âäü tæû do ...................................... 27
Nghiãn cæïu càõt ngang.................................... 137 phán phäúi táön suáút
Nghiãn cæïu quan saït....................................... 136 Hçnh daûng.................................................... 11
nghiãn cæïu thæí nghiãûm phán säú láúy máùu..................................... 19, 150
bàõt cheïo..................................................... 165 phán säú quy traïch dán säú .............................. 156
Nghiãn cæïu thæûc nghiãûm............................. 139 Phán taïn âäö....................................................... 52
nguy cå phán têch âa biãún .............................................. 64
bãûnh hiãúm - bãûnh phäø biãún ................... 98 Phán têch âa biãún .............................................. 64
Nguy cå måïi màõc.............................................. 98 phán têch âäöng phæång sai................................ 63
Nguy cå qui traïch............................................. 154 phán têch cuûm ................................................... 64
nguy cå quy traïch ............................................. 155 Phán têch nhiãöu baíng 2 × 2.............................. 88
nguy cå quy traïch dán säú ................................ 156 phán têch phæång sai .......................................... 41
nguy cå tæång âäúi...................................... 99, 154 trong häöi quy tuyãún tênh............................. 58
nhæîng càûp khäng phuì håüp .......................... 160 yãúu täú.......................................................... 41
nhë phán........................................................ 4, 180 Phán têch phæång sai hai chiãöu ........................ 45
nhoïm âiãöu trë ................................................. 164 Phán têch phæång sai mäüt chiãöu ..................... 42
nhoïm chæïng.................................................... 164 Phán têch phán biãût........................................... 64
normal distribution.............................................. 20 Phán têch säú liãûu ............................................... 5
null hypothesis .................................................... 30 phán têch säúng coìn......................................... 105
numerical taxonomy............................................ 64 phán têch tæång æïng.......................................... 64
Phán têch tè suáút ............................................. 104
O
Phán têch thaình pháön chênh ............................ 64
observational..................................................... 136 Phán têch thäúng kã häü tëch............................ 136
odds................................................................... 156 Phán têch yãúu täú .............................................. 64
odds ratio .......................................................... 156 pháön cæïng...................................................... 179
one sided ............................................................. 24 pháön mãöm...................................................... 181
onesided .............................................................. 33 Pháön mãöm càn cæï dæî liãûu......................... 182
oneway analysis of variance................................ 42 Pháön mãöm maïy tênh..................................... 181
open question .................................................... 140 Pháön mãöm xæí lê vàn baín ............................ 182
operating system ............................................... 181 phaûm truì............................................................. 4
Optimal combination regression ......................... 62 phaûm vi ............................................................. 14
overall sample value.......................................... 150 pheïp biãún âäøi
læûa choün ................................................... 127
P Pheïp biãún âäøi................................................ 122
package ............................................................. 182 logarithm...................................................... 122
paired .................................................................. 86 pheïp biãún âäøi láúy càn.................................. 127
paired t test.......................................................... 30 pheïp biãún âäøi láúy luîy thæìa ....................... 127
partial correlations .............................................. 60 pheïp biãún âäøi nghëch âaío............................ 127
partial regression coefficients ............................. 60 phi tham säú........................................................ 28
period prevalence................................................ 97 phæång phaïp ............................................... 129
persons at risk ..................................................... 97 pie chart ................................................................ 7
personyears at risk............................................... 98 placebo.............................................................. 166
personyears of observation.................................. 96 point prevalence.................................................. 97
phæång phaïp choün læûa xaïc suáút bàòng nhau population attributable fraction......................... 156
..................................................................... 150 population attributable risk ............................... 156
phæång phaïp chuáøn hoaï giaïn tiãúp................ 99 population proportional attributable risk .......... 156
phæång phaïp chuáøn hoïa træûc tiãúp ............... 99 posterior probability............................................ 65
Phæång sai .......................................................... 14 power .......................................................... 35, 170
phán loaûi hoüc sä .............................................. 64 power transformation ........................................ 127
phán phäúi powerful.............................................................. 41
kiãøm âënh tênh phuì håüp .......................... 116 prevalence ........................................................... 97
phán phäúi bçnh thæåìng pricipal component analysis................................ 64
kiãøm âënh tênh phuì håüp .......................... 116 prior probability.................................................. 65
phán phäúi bçnh thæåìng chuáøn........................ 21 probability proportional to size  p.p.s ............... 151
Phán phäúi bçnh thæåìng chuáøn........................ 21 probit................................................................. 116
phán phäúi F ....................................................... 43 probit plot ......................................................... 116
phán phäúi nhë thæïc .......................................... 68 program............................................................. 181
xáúp xè phán phäúi bçnh thæåìng .................. 73 prophylactic trials ............................................. 139
Phán phäúi nhë thæïc .......................................... 68 proportion ........................................................... 68
proportional attributable risk ............................ 155

155
Căn bản thống kê y học -Ðỗ Văn Dũng

prospective................................................ 137, 153 Sai säú láúy máùu ............................................... 17


sample ............................................................... 148
Q
sampling fraction ........................................ 19, 150
quan saït........................................................ 4, 136 sampling frame.................................................. 148
Qui hoaûch cán âäúi Sao cheïp læu.................................................... 181
coï làûp........................................................... 45 säú chãnh .......................................................... 156
Quy hoaûch baín váún luûc............................... 139 säú luîy têch ...................................................... 117
quy hoaûch bàõt càûp âäi.................................. 165 Säú måïi màõc..................................................... 97
quy hoaûch cán âäúi............................................ 45 säú màõc toaìn bäü thåìi khoaíng........................ 97
khäng coï làûp ................................................ 45 säú ngæåìi nàm quan saït .................................... 96
Quy hoaûch cán âäúi coï làûp ............................. 45 scatter diagram.................................................... 52
Quy hoaûch cán âäúi khäng làûp ........................ 46 screening test .................................................... 144
quy hoaûch khäng cán âäúi ................................. 45 secondstage units .............................................. 151
Quy hoaûch khäng cán âäúi ................................ 48 selection bias............................................. 142, 164
quy hoaûch muì âäi ........................................... 166 sensitivity.......................................................... 144
Quy hoaûch muì âån ......................................... 166 sequential clinical trial ...................................... 166
Quy tàõc cäüng ................................................... 65 sequential file.................................................... 180
xaïc suáút ....................................................... 66 sign test ............................................................. 130
Quy tàõc nhán ..................................................... 65 significance level ................................................ 30
xaïc suáút ....................................................... 65 significant test ..................................................... 30
simple random sampling ................................... 148
R single blind design ............................................ 166
råìi raûc ................................................................. 4 skewed ................................................................ 11
RAM ................................................................. 179 So saïnh 2 tè lãû.................................................. 86
random access file............................................. 180 so saïnh 2 trung bçnh
random effects..................................................... 50 máùu låïn hay biãút âäü lãûch chuáøn ........... 38
randomization ................................................... 164 so saïnh hai trung bçnh
randomization with balance .............................. 165 Cåî máùu nhoí, âäü lãûch chuáøn khäng bàòng
randomized controlled doubleblind design ....... 142 nhau........................................................... 40
range ................................................................... 14 máùu låïn hay biãút âäü lãûch chuáøn ........... 37
range checks...................................................... 141 So saïnh hai trung bçnh....................................... 37
rank ................................................................... 131 So saïnh nhiãöu trung bçnh... See phán têch phæång
rate ...................................................................... 95 sai
reciprocal transformation .................................. 127 soft ware............................................................ 181
records .............................................................. 180 Spearman .......................................................... 133
Registrar General .............................................. 136 specificity.......................................................... 144
regression coefficient .......................................... 54 spillover effect .................................................. 165
relative risk ................................................. 99, 154 standard deviation............................................... 14
Relative risk ...................................................... 154 standard error of the sample mean ...................... 17
repeated cross sectional surveys........................ 137 standard normal deviate ...................................... 21
residual sum of squares ................................. 42, 58 standard normal distribution ............................... 21
restricted randomization.................................... 165 standard population............................................. 99
restrospective .................................................... 137 standardization.................................................... 99
retrospective...................................................... 153 standardized mortality ratio ................................ 99
reverse Jshaped ................................................... 11 statistical package ............................................. 182
risk ...................................................................... 96 Step down regression .......................................... 62
robustness ........................................................... 27 Stepup regression................................................ 62
root transformation ........................................... 127 strata.................................................................. 150
stratified ............................................................ 150
S study design ...................................................... 135
så âäö xaïc suáút cán bàòng .............................. 137 subjective definition............................................ 65
sæû liãn quan .................................................... 135 sum of square ...................................................... 42
sæû sai lãûch khoíi âënh hæåïng phuì håüp ........ 92 summary test ....................................................... 89
sai láöm symmetrical......................................................... 11
trong kiãøm âënh giaí thuyãút........................ 35 systematic.......................................................... 142
sai lãûch ...................................................... 89, 142 T
Sai lãûch gáy nhiãùu ......................................... 143
Sai lãûch thäng tin ............................................ 143 t distribution........................................................ 27
sai säú table of random numbers .................................. 148
hãû thäúng.................................................... 142 tæång phaín tuyãún tênh ..................................... 48
ngáùu nhiãn.................................................. 142 Tæång quan......................................................... 52
nguäön gäúc ................................................. 142 tæång quan riãng pháön ...................................... 60
Sai säú choün læûa............................................ 142 Tæång quan sàõp haûng Spearman ................... 133
sai säú chuáøn ..................................................... 17 tæång quan têch moment Pearson..................... 133
cuía trung bçnh máùu..................................... 17 tæång taïc ............................................................ 45

156
Chè muûc

taïc âäüng cäú âënh ............................................. 50 khoaíng tin cáûy............................................. 25


taïc âäüng chênh.................................................. 45 tênh toaïn ....................................................... 16
taïc âäüng ngáùu nhiãn ....................................... 50 trung bçnh bçnh phæång..................................... 42
taïc âäüng täön dæ............................................. 165 trung bçnh chuáøn hoïa..................................... 100
tails trung bçnh nhán .......................................... 14, 123
upper and lower.............................................. 11 trung vë ............................................................... 13
tallying .................................................................. 9 tuyãn ngän Helsinki .......................................... 166
Täø chæïc âäö ....................................................... 9 two stage sampling............................................ 151
Täø chæïc dæî liãûu .......................................... 180 two sided............................................................. 24
táön suáút twosided.............................................................. 33
säú liãûu âënh læåüng ...................................... 8
U
Táön suáút
säú liãûu âënh tênh........................................... 7 unbalanced design............................................... 45
táön suáút tæång âäúi............................................ 7 uniform ............................................................... 11
táöng ................................................................. 150 unimodal ............................................................. 11
täøng âiãöu tra................................................... 148
täøng bçnh phæång häöi quy............................... 58 V
täøng bçnh phæång pháön dæ....................... 42, 58 vaccine trials ..................................................... 139
täøng caïc bçnh phæång ...................................... 42 validity ................................................................ 79
täøng caïc bçnh phæång âæåüc giaíi thêch båíi häöi variance............................................................... 14
quy ................................................................. 58 varianceratio ....................................................... 43
táûp tin .............................................................. 180 verification........................................................ 141
Táûp tin truy cáûp ngáùu nhiãn ........................ 180 vital statisitics ................................................... 136
táûp tin tuáön tæû ............................................. 180
Tè lãû .................................................................. 68 W
tè lãû âån Wilcoxon .......................................................... 131
kiãøm âënh yï nghéa....................................... 71 Wilcoxon rank sum test .................................... 132
tè säú säú chãnh ................................................ 156 Wilcoxon sign rank test............................. 130, 131
tè säú tæí vong chuáøn hoïa ................................ 99 with replacement............................................... 151
tè suáút ám tênh giaí ......................................... 144 with replication ................................................... 45
Tè suáút chuáøn hoïa .......................................... 99 within groups ...................................................... 42
tè suáút dæång tênh giaí.................................... 144 without replication .............................................. 45
tè suáút måïi màõc .............................................. 98 word-processing package.................................. 182
phán têch ...................................................... 113 wordprocessing ................................................. 182
tè suáút nguy haûi ............................................. 108
Tè suáút sinh ....................................................... 95 X
Tè suáút tæí vong................................................ 95
xaïc suáút ............................................................ 65
tè suáút tæí vong âæåüc âiãöu chènh theo tuäøi giåïi
âënh nghéa chuí quan..................................... 65
tênh ................................................................ 99
Âënh nghéa theo táön suáút ........................... 65
Tè suáút tæí vong âæåüc âiãöu chènh theo tuäøi
quy tàõc.......................................................... 65
giåïi tênh ...................................................... 103
xaïc suáút âiãöu kiãûn......................................... 66
tênh væîng........................................................... 27
xaïc suáút háûu nghiãûm..................................... 65
thæ muûc........................................................... 180
xaïc suáút tè lãû våïi kêch thæåïc...................... 151
Thæí nghiãûm can thiãûp.................................. 139
xaïc suáút tiãön nghiãûm .................................... 65
thæí nghiãûm coï kiãøm soaït muì âäi............... 139
Thæí nghiãûm lám saìng ........................... 139, 164 Y
thæí nghiãûm saìng loüc ................................... 144
Thæí nghiãûm vaccine .............................. 139, 168 Yates' continuity correction ................................ 78
thæûc nghiãûm.................................................. 136 yãúu vë................................................................ 13
thåìi gian säúng coìn ......................................... 105 Z
Thäúng kã ............................................................. 3
Thay âäøi âån vë ................................................. 17 z 21
tiãön cæïu.................................................. 137, 153 χ
trçnh baìy kãút quaí............................................... 5
treatment group ................................................. 164 χ2 goodness of fit............................................... 130
trung bçnh ........................................................... 13

157
Danh sách các bảng số thống kê

Bảng A1 Diện tích ở đuôi của phân phối chuẩn bình thường ................................................2
Bảng A2 Ðiểm phần trăm của phân phối bình thường chuẩn ................................................3
Bảng A3 Ðiểm phần trăm của phân phối t .............................................................................4
Bảng A4 Ðiểm phần trăm của phân phối F ............................................................................5
Bảng A5 Ðiểm phần trăm của phân phối χ2 ...........................................................................8
Bảng A6 Probits .....................................................................................................................9
Bảng A7 Giá trị tới hạn của kiểm định sắp hạng có dấu cặp đôi Wilcoxon ........................11
Bảng A8 Giá trị tới hạn của kiểm định tổng sắp hạng Wilcoxon.........................................12
Bảng A9 Giá trị tới hạn của hệ số tương quan sắp hạng của Spearman ..............................16
Bảng A10 Số ngẫu nhiên......................................................................................................17

1
Bảng A1 Diện tích ở đuôi của phân phối chuẩn bình thường
Cải biên từ Bảng 3 của White el al. có xin phép tác giả và nhà xuất bản
số lẻ thứ nhì của z
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121

0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.281 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611

1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681

1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233

2.0 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.0197 0.01923 0.01876 0.01831
2.1 0.01786 0.01743 0.017 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
2.3 0.01072 0.01044 0.01017 0.0099 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639

2.5 0.00621 0.00604 0.00587 0.0057 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
2.6 0.00466 0.00453 0.0044 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.0028 0.00272 0.00264
2.8 0.00256 0.00248 0.0024 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139

3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.00100
3.1 0.00097 0.00094 0.0009 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024

3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003

2
Bảng A2 Ðiểm phần trăm của phân phối bình thường chuẩn

Ðiểm phần trăm


Giá trị P Một bên Hai bên
0.5 0.00 0.67
0.4 0.25 0.84
0.3 0.52 1.04
0.2 0.84 1.28
0.1 1.28 1.64
0.05 1.64 1.96
0.02 2.05 2.33
0.01 2.33 2.58
0.005 2.58 2.81
0.002 2.88 3.09
0.001 3.09 3.29
0.0001 3.72 3.89

3
Bảng A3 Ðiểm phần trăm của phân phối t
Cải biên từ Bảng 7 của White el al. có xin phép tác giả và nhà xuất bản

P một bên
0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
P hai bên
d.f. 0.5 0.2 0.1 0.05 0.02 0.01 0.005 0.002 0.001
1 1.00 3.08 6.31 12.71 31.82 63.66 127.32 318.29 636.58
2 0.82 1.89 2.92 4.30 6.96 9.92 14.09 22.33 31.60
3 0.76 1.64 2.35 3.18 4.54 5.84 7.45 10.21 12.92
4 0.74 1.53 2.13 2.78 3.75 4.60 5.60 7.17 8.61
5 0.73 1.48 2.02 2.57 3.36 4.03 4.77 5.89 6.87
6 0.72 1.44 1.94 2.45 3.14 3.71 4.32 5.21 5.96
7 0.71 1.41 1.89 2.36 3.00 3.50 4.03 4.79 5.41
8 0.71 1.40 1.86 2.31 2.90 3.36 3.83 4.50 5.04
9 0.70 1.38 1.83 2.26 2.82 3.25 3.69 4.30 4.78
10 0.70 1.37 1.81 2.23 2.76 3.17 3.58 4.14 4.59
11 0.70 1.36 1.80 2.20 2.72 3.11 3.50 4.02 4.44
12 0.70 1.36 1.78 2.18 2.68 3.05 3.43 3.93 4.32
13 0.69 1.35 1.77 2.16 2.65 3.01 3.37 3.85 4.22
14 0.69 1.35 1.76 2.14 2.62 2.98 3.33 3.79 4.14
15 0.69 1.34 1.75 2.13 2.60 2.95 3.29 3.73 4.07
16 0.69 1.34 1.75 2.12 2.58 2.92 3.25 3.69 4.01
17 0.69 1.33 1.74 2.11 2.57 2.90 3.22 3.65 3.97
18 0.69 1.33 1.73 2.10 2.55 2.88 3.20 3.61 3.92
19 0.69 1.33 1.73 2.09 2.54 2.86 3.17 3.58 3.88
20 0.69 1.33 1.72 2.09 2.53 2.85 3.15 3.55 3.85
21 0.69 1.32 1.72 2.08 2.52 2.83 3.14 3.53 3.82
22 0.69 1.32 1.72 2.07 2.51 2.82 3.12 3.50 3.79
23 0.69 1.32 1.71 2.07 2.50 2.81 3.10 3.48 3.77
24 0.68 1.32 1.71 2.06 2.49 2.80 3.09 3.47 3.75
25 0.68 1.32 1.71 2.06 2.49 2.79 3.08 3.45 3.73
26 0.68 1.31 1.71 2.06 2.48 2.78 3.07 3.43 3.71
27 0.68 1.31 1.70 2.05 2.47 2.77 3.06 3.42 3.69
28 0.68 1.31 1.70 2.05 2.47 2.76 3.05 3.41 3.67
29 0.68 1.31 1.70 2.05 2.46 2.76 3.04 3.40 3.66
30 0.68 1.31 1.70 2.04 2.46 2.75 3.03 3.39 3.65
40 0.68 1.30 1.68 2.02 2.42 2.70 2.97 3.31 3.55
60 0.68 1.30 1.67 2.00 2.39 2.66 2.91 3.23 3.46
120 0.68 1.29 1.66 1.98 2.36 2.62 2.86 3.16 3.37
vô cực 0.67 1.28 1.64 1.96 2.33 2.58 2.81 3.09 3.29

4
Bảng A4 Ðiểm phần trăm của phân phối F

Cải biên từ Bảng 4 củaArmitage (1971) và bảng 18 của Pearson & Harley (1966) có xin phép tác
giả và nhà xuất bản và Biometrila Trustees

Các bảng trình bày kiểm định một bên để so sánh 2 phương sai, được dùng trong phân tích
phương sai. Tính kiểm định hai bên bz82ng cách nhân đôi giá trị P
d.f.1= d.f. của tử số; d.f.2 = d.f. của mẫu số
d.f.1
d.f.2 P 1 2 3 4 5 6 7 8 9 10 20 40 60 120 vô cực
1 0.05 161 199 216 225 230 234 237 239 241 242 248 251 252 253 254
1 0.025 648 799 864 900 922 937 948 957 963 969 993 1006 1010 1014 1018
1 0.01 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6209 6286 6313 6340 6366
1 0.005 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24837 25146 25254 25358 25466
1 0.001 405312 499725 540257 562668 576496 586033 593185 597954 602245 605583 620842 628471 631332 634193 636578

2 0.05 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.45 19.47 19.48 19.49 19.50
2 0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.45 39.47 39.48 39.49 39.50
2 0.01 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.45 99.48 99.48 99.49 99.50
2 0.005 198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39 199.39 199.45 199.48 199.48 199.49 199.51
2 0.001 998.38 998.84 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31

3 0.05 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.66 8.59 8.57 8.55 8.53
3 0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.17 14.04 13.99 13.95 13.90
3 0.01 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 26.69 26.41 26.32 26.22 26.13
3 0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68 42.78 42.31 42.15 41.99 41.83
3 0.001 167.06 148.49 141.10 137.08 134.58 132.83 131.61 130.62 129.86 129.22 126.43 124.97 124.45 123.98 123.46

4 0.05 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.80 5.72 5.69 5.66 5.63
4 0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.56 8.41 8.36 8.31 8.26
4 0.01 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.02 13.75 13.65 13.56 13.46
4 0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97 20.17 19.75 19.61 19.47 19.32
4 0.001 74.13 61.25 56.17 53.43 51.72 50.52 49.65 49.00 48.47 48.05 46.10 45.08 44.75 44.40 44.05

5 0.05 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.56 4.46 4.43 4.40 4.37
5 0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.33 6.18 6.12 6.07 6.02
5 0.01 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.55 9.29 9.20 9.11 9.02
5 0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 12.90 12.53 12.40 12.27 12.14
5 0.001 47.18 37.12 33.20 31.08 29.75 28.83 28.17 27.65 27.24 26.91 25.39 24.60 24.33 24.06 23.79

6 0.05 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 3.87 3.77 3.74 3.70 3.67
6 0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.17 5.01 4.96 4.90 4.85
6 0.01 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.40 7.14 7.06 6.97 6.88
6 0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 9.59 9.24 9.12 9.00 8.88
6 0.001 35.51 27.00 23.71 21.92 20.80 20.03 19.46 19.03 18.69 18.41 17.12 16.44 16.21 15.98 15.75

7 0.05 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.44 3.34 3.30 3.27 3.23
7 0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.47 4.31 4.25 4.20 4.14
7 0.01 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.16 5.91 5.82 5.74 5.65
7 0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 7.75 7.42 7.31 7.19 7.08
7 0.001 29.25 21.69 18.77 17.20 16.21 15.52 15.02 14.63 14.33 14.08 12.93 12.33 12.12 11.91 11.70

8 0.05 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.15 3.04 3.01 2.97 2.93
8 0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.00 3.84 3.78 3.73 3.67
8 0.01 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.36 5.12 5.03 4.95 4.86
8 0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 6.61 6.29 6.18 6.06 5.95
8 0.001 25.41 18.49 15.83 14.39 13.48 12.86 12.40 12.05 11.77 11.54 10.48 9.92 9.73 9.53 9.33

9 0.05 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 2.94 2.83 2.79 2.75 2.71
9 0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.67 3.51 3.45 3.39 3.33
9 0.01 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 4.81 4.57 4.48 4.40 4.31
9 0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 5.83 5.52 5.41 5.30 5.19
9 0.001 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 8.90 8.37 8.19 8.00 7.81

5
10 0.05 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.77 2.66 2.62 2.58 2.54
10 0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.42 3.26 3.20 3.14 3.08
10 0.01 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.41 4.17 4.08 4.00 3.91
10 0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.27 4.97 4.86 4.75 4.64
10 0.001 21.04 14.90 12.55 11.28 10.48 9.93 9.52 9.20 8.96 8.75 7.80 7.30 7.12 6.94 6.76

12 0.05 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.54 2.43 2.38 2.34 2.30
12 0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.07 2.91 2.85 2.79 2.72
12 0.01 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 3.86 3.62 3.54 3.45 3.36
12 0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.53 4.23 4.12 4.01 3.90
12 0.001 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 6.40 5.93 5.76 5.59 5.42

14 0.05 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.39 2.27 2.22 2.18 2.13
14 0.025 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 2.84 2.67 2.61 2.55 2.49
14 0.01 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.51 3.27 3.18 3.09 3.00
14 0.005 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.06 3.76 3.66 3.55 3.44
14 0.001 17.14 11.78 9.73 8.62 7.92 7.44 7.08 6.80 6.58 6.40 5.56 5.10 4.94 4.77 4.60

16 0.05 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.28 2.15 2.11 2.06 2.01
16 0.025 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.68 2.51 2.45 2.38 2.32
16 0.01 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.26 3.02 2.93 2.84 2.75
16 0.005 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 3.73 3.44 3.33 3.22 3.11
16 0.001 16.12 10.97 9.01 7.94 7.27 6.80 6.46 6.20 5.98 5.81 4.99 4.54 4.39 4.23 4.06

18 0.05 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.19 2.06 2.02 1.97 1.92
18 0.025 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.56 2.38 2.32 2.26 2.19
18 0.01 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.08 2.84 2.75 2.66 2.57
18 0.005 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.50 3.20 3.10 2.99 2.87
18 0.001 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 4.59 4.15 4.00 3.84 3.67

20 0.05 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.12 1.99 1.95 1.90 1.84
20 0.025 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.46 2.29 2.22 2.16 2.09
20 0.01 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 2.94 2.69 2.61 2.52 2.42
20 0.005 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.32 3.02 2.92 2.81 2.69
20 0.001 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.29 3.86 3.70 3.54 3.38

25 0.05 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.01 1.87 1.82 1.77 1.71
25 0.025 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.30 2.12 2.05 1.98 1.91
25 0.01 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.70 2.45 2.36 2.27 2.17
25 0.005 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64 3.54 3.01 2.72 2.61 2.50 2.38
25 0.001 13.88 9.22 7.45 6.49 5.89 5.46 5.15 4.91 4.71 4.56 3.79 3.37 3.22 3.06 2.89

30 0.05 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 1.93 1.79 1.74 1.68 1.62
30 0.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.20 2.01 1.94 1.87 1.79
30 0.01 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.55 2.30 2.21 2.11 2.01
30 0.005 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 2.82 2.52 2.42 2.30 2.18
30 0.001 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39 4.24 3.49 3.07 2.92 2.76 2.59

40 0.05 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 1.84 1.69 1.64 1.58 1.51
40 0.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.07 1.88 1.80 1.72 1.64
40 0.01 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.37 2.11 2.02 1.92 1.80
40 0.005 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 2.60 2.30 2.18 2.06 1.93
40 0.001 12.61 8.25 6.59 5.70 5.13 4.73 4.44 4.21 4.02 3.87 3.15 2.73 2.57 2.41 2.23

6
60 0.05 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.75 1.59 1.53 1.47 1.39
60 0.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 1.94 1.74 1.67 1.58 1.48
60 0.01 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.20 1.94 1.84 1.73 1.60
60 0.005 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90 2.39 2.08 1.96 1.83 1.69
60 0.001 11.97 7.77 6.17 5.31 4.76 4.37 4.09 3.86 3.69 3.54 2.83 2.41 2.25 2.08 1.89

120 0.05 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.66 1.50 1.43 1.35 1.25
120 0.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 1.82 1.61 1.53 1.43 1.31
120 0.01 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.03 1.76 1.66 1.53 1.38
120 0.005 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71 2.19 1.87 1.75 1.61 1.43
120 0.001 11.38 7.32 5.78 4.95 4.42 4.04 3.77 3.55 3.38 3.24 2.53 2.11 1.95 1.77 1.54

vc 0.05 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.57 1.39 1.32 1.22 1.00
vc 0.025 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05 1.71 1.48 1.39 1.27 1.00
vc 0.01 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 1.88 1.59 1.47 1.32 1.00
vc 0.005 7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52 2.00 1.67 1.53 1.36 1.01
vc 0.001 10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10 2.96 2.27 1.84 1.66 1.45 1.01

7
Bảng A5 Ðiểm phần trăm của phân phối χ2

Cải biên từ Bảng 8 của White et al. (1979) có xin phép tác giả và nhà xuất bản.
d.f.=1 khia so sánh hai tỉ lệ (kiểm định χ2 2×2 hay χ2 Mantel Haenzel) hay trong đánh giá
khuynh hướng, điểm phần trăm của kiểm định 2 đuôi. Có thể làm kiểm định một đuôi bằng cách
chia đôi giá trị P (không thể dùng khái niệm một hoặc hai đuôi cho độ tự do lớn hơn)
Giá trị P
d.f. 0.5 0.25 0.1 0.05 0.025 0.01 0.005 0.001
1 0.45 1.32 2.71 3.84 5.02 6.63 7.88 10.83
2 1.39 2.77 4.61 5.99 7.38 9.21 10.60 13.82
3 2.37 4.11 6.25 7.81 9.35 11.34 12.84 16.27
4 3.36 5.39 7.78 9.49 11.14 13.28 14.86 18.47
5 4.35 6.63 9.24 11.07 12.83 15.09 16.75 20.51
6 5.35 7.84 10.64 12.59 14.45 16.81 18.55 22.46
7 6.35 9.04 12.02 14.07 16.01 18.48 20.28 24.32
8 7.34 10.22 13.36 15.51 17.53 20.09 21.95 26.12
9 8.34 11.39 14.68 16.92 19.02 21.67 23.59 27.88
10 9.34 12.55 15.99 18.31 20.48 23.21 25.19 29.59
11 10.34 13.70 17.28 19.68 21.92 24.73 26.76 31.26
12 11.34 14.85 18.55 21.03 23.34 26.22 28.30 32.91
13 12.34 15.98 19.81 22.36 24.74 27.69 29.82 34.53
14 13.34 17.12 21.06 23.68 26.12 29.14 31.32 36.12
15 14.34 18.25 22.31 25.00 27.49 30.58 32.80 37.70
16 15.34 19.37 23.54 26.30 28.85 32.00 34.27 39.25
17 16.34 20.49 24.77 27.59 30.19 33.41 35.72 40.79
18 17.34 21.60 25.99 28.87 31.53 34.81 37.16 42.31
19 18.34 22.72 27.20 30.14 32.85 36.19 38.58 43.82
20 19.34 23.83 28.41 31.41 34.17 37.57 40.00 45.31
21 20.34 24.93 29.62 32.67 35.48 38.93 41.40 46.80
22 21.34 26.04 30.81 33.92 36.78 40.29 42.80 48.27
23 22.34 27.14 32.01 35.17 38.08 41.64 44.18 49.73
24 23.34 28.24 33.20 36.42 39.36 42.98 45.56 51.18
25 24.34 29.34 34.38 37.65 40.65 44.31 46.93 52.62
26 25.34 30.43 35.56 38.89 41.92 45.64 48.29 54.05
27 26.34 31.53 36.74 40.11 43.19 46.96 49.65 55.48
28 27.34 32.62 37.92 41.34 44.46 48.28 50.99 56.89
29 28.34 33.71 39.09 42.56 45.72 49.59 52.34 58.30
30 29.34 34.80 40.26 43.77 46.98 50.89 53.67 59.70
40 39.34 45.62 51.81 55.76 59.34 63.69 66.77 73.40
50 49.33 56.33 63.17 67.50 71.42 76.15 79.49 86.66
60 59.33 66.98 74.40 79.08 83.30 88.38 91.95 99.61
70 69.33 77.58 85.53 90.53 95.02 100.43 104.21 112.32
80 79.33 88.13 96.58 101.88 106.63 112.33 116.32 124.84
90 89.33 98.65 107.57 113.15 118.14 124.12 128.30 137.21
100 99.33 109.14 118.50 124.34 129.56 135.81 140.17 149.45

8
Bảng A6 Probits
Cải biên từ Bảng A4 của Pearson và Hartley (1966) có xin phép Biometrika Trustees
Probits = giá trị của phân phối bình thường tương ứng với phần trăm tích lũy

phần mười của %


% 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0 - -3.09 -2.88 -2.75 -2.65 -2.58 -2.51 -2.46 -2.41 -2.37
1 -2.33 -2.29 -2.26 -2.23 -2.20 -2.17 -2.14 -2.12 -2.10 -2.07
2 -2.05 -2.03 -2.01 -2.00 -1.98 -1.96 -1.94 -1.93 -1.91 -1.90
3 -1.88 -1.87 -1.85 -1.84 -1.83 -1.81 -1.80 -1.79 -1.77 -1.76
4 -1.75 -1.74 -1.73 -1.72 -1.71 -1.70 -1.68 -1.67 -1.66 -1.65
5 -1.64 -1.64 -1.63 -1.62 -1.61 -1.60 -1.59 -1.58 -1.57 -1.56
6 -1.55 -1.55 -1.54 -1.53 -1.52 -1.51 -1.51 -1.50 -1.49 -1.48
7 -1.48 -1.47 -1.46 -1.45 -1.45 -1.44 -1.43 -1.43 -1.42 -1.41
8 -1.41 -1.40 -1.39 -1.39 -1.38 -1.37 -1.37 -1.36 -1.35 -1.35
9 -1.34 -1.33 -1.33 -1.32 -1.32 -1.31 -1.30 -1.30 -1.29 -1.29
10 -1.28 -1.28 -1.27 -1.26 -1.26 -1.25 -1.25 -1.24 -1.24 -1.23
11 -1.23 -1.22 -1.22 -1.21 -1.21 -1.20 -1.20 -1.19 -1.19 -1.18
12 -1.17 -1.17 -1.17 -1.16 -1.16 -1.15 -1.15 -1.14 -1.14 -1.13
13 -1.13 -1.12 -1.12 -1.11 -1.11 -1.10 -1.10 -1.09 -1.09 -1.08
14 -1.08 -1.08 -1.07 -1.07 -1.06 -1.06 -1.05 -1.05 -1.05 -1.04
15 -1.04 -1.03 -1.03 -1.02 -1.02 -1.02 -1.01 -1.01 -1.00 -1.00
16 -0.99 -0.99 -0.99 -0.98 -0.98 -0.97 -0.97 -0.97 -0.96 -0.96
17 -0.95 -0.95 -0.95 -0.94 -0.94 -0.93 -0.93 -0.93 -0.92 -0.92
18 -0.92 -0.91 -0.91 -0.90 -0.90 -0.90 -0.89 -0.89 -0.89 -0.88
19 -0.88 -0.87 -0.87 -0.87 -0.86 -0.86 -0.86 -0.85 -0.85 -0.85
20 -0.84 -0.84 -0.83 -0.83 -0.83 -0.82 -0.82 -0.82 -0.81 -0.81
21 -0.81 -0.80 -0.80 -0.80 -0.79 -0.79 -0.79 -0.78 -0.78 -0.78
22 -0.77 -0.77 -0.77 -0.76 -0.76 -0.76 -0.75 -0.75 -0.75 -0.74
23 -0.74 -0.74 -0.73 -0.73 -0.73 -0.72 -0.72 -0.72 -0.71 -0.71
24 -0.71 -0.70 -0.70 -0.70 -0.69 -0.69 -0.69 -0.68 -0.68 -0.68
25 -0.67 -0.67 -0.67 -0.67 -0.66 -0.66 -0.66 -0.65 -0.65 -0.65
26 -0.64 -0.64 -0.64 -0.63 -0.63 -0.63 -0.62 -0.62 -0.62 -0.62
27 -0.61 -0.61 -0.61 -0.60 -0.60 -0.60 -0.59 -0.59 -0.59 -0.59
28 -0.58 -0.58 -0.58 -0.57 -0.57 -0.57 -0.57 -0.56 -0.56 -0.56
29 -0.55 -0.55 -0.55 -0.54 -0.54 -0.54 -0.54 -0.53 -0.53 -0.53
30 -0.52 -0.52 -0.52 -0.52 -0.51 -0.51 -0.51 -0.50 -0.50 -0.50
31 -0.50 -0.49 -0.49 -0.49 -0.48 -0.48 -0.48 -0.48 -0.47 -0.47
32 -0.47 -0.46 -0.46 -0.46 -0.46 -0.45 -0.45 -0.45 -0.45 -0.44
33 -0.44 -0.44 -0.43 -0.43 -0.43 -0.43 -0.42 -0.42 -0.42 -0.42
34 -0.41 -0.41 -0.41 -0.40 -0.40 -0.40 -0.40 -0.39 -0.39 -0.39
35 -0.39 -0.38 -0.38 -0.38 -0.37 -0.37 -0.37 -0.37 -0.36 -0.36
36 -0.36 -0.36 -0.35 -0.35 -0.35 -0.35 -0.34 -0.34 -0.34 -0.33
37 -0.33 -0.33 -0.33 -0.32 -0.32 -0.32 -0.32 -0.31 -0.31 -0.31
38 -0.31 -0.30 -0.30 -0.30 -0.29 -0.29 -0.29 -0.29 -0.28 -0.28
39 -0.28 -0.28 -0.27 -0.27 -0.27 -0.27 -0.26 -0.26 -0.26 -0.26
40 -0.25 -0.25 -0.25 -0.25 -0.24 -0.24 -0.24 -0.24 -0.23 -0.23
41 -0.23 -0.22 -0.22 -0.22 -0.22 -0.21 -0.21 -0.21 -0.21 -0.20
42 -0.20 -0.20 -0.20 -0.19 -0.19 -0.19 -0.19 -0.18 -0.18 -0.18
43 -0.18 -0.17 -0.17 -0.17 -0.17 -0.16 -0.16 -0.16 -0.16 -0.15
44 -0.15 -0.15 -0.15 -0.14 -0.14 -0.14 -0.14 -0.13 -0.13 -0.13
45 -0.13 -0.12 -0.12 -0.12 -0.12 -0.11 -0.11 -0.11 -0.11 -0.10
46 -0.10 -0.10 -0.10 -0.09 -0.09 -0.09 -0.09 -0.08 -0.08 -0.08
47 -0.08 -0.07 -0.07 -0.07 -0.07 -0.06 -0.06 -0.06 -0.06 -0.05
48 -0.05 -0.05 -0.05 -0.04 -0.04 -0.04 -0.04 -0.03 -0.03 -0.03
49 -0.03 -0.02 -0.02 -0.02 -0.02 -0.01 -0.01 -0.01 -0.01 0.00
50 0.00 0.00 0.01 0.01 0.01 0.01 0.02 0.02 0.02 0.02

9
51 0.03 0.03 0.03 0.03 0.04 0.04 0.04 0.04 0.05 0.05
52 0.05 0.05 0.06 0.06 0.06 0.06 0.07 0.07 0.07 0.07
53 0.08 0.08 0.08 0.08 0.09 0.09 0.09 0.09 0.10 0.10
54 0.10 0.10 0.11 0.11 0.11 0.11 0.12 0.12 0.12 0.12
55 0.13 0.13 0.13 0.13 0.14 0.14 0.14 0.14 0.15 0.15
56 0.15 0.15 0.16 0.16 0.16 0.16 0.17 0.17 0.17 0.17
57 0.18 0.18 0.18 0.18 0.19 0.19 0.19 0.19 0.20 0.20
58 0.20 0.20 0.21 0.21 0.21 0.21 0.22 0.22 0.22 0.22
59 0.23 0.23 0.23 0.24 0.24 0.24 0.24 0.25 0.25 0.25
60 0.25 0.26 0.26 0.26 0.26 0.27 0.27 0.27 0.27 0.28
61 0.28 0.28 0.28 0.29 0.29 0.29 0.29 0.30 0.30 0.30
62 0.31 0.31 0.31 0.31 0.32 0.32 0.32 0.32 0.33 0.33
63 0.33 0.33 0.34 0.34 0.34 0.35 0.35 0.35 0.35 0.36
64 0.36 0.36 0.36 0.37 0.37 0.37 0.37 0.38 0.38 0.38
65 0.39 0.39 0.39 0.39 0.40 0.40 0.40 0.40 0.41 0.41
66 0.41 0.42 0.42 0.42 0.42 0.43 0.43 0.43 0.43 0.44
67 0.44 0.44 0.45 0.45 0.45 0.45 0.46 0.46 0.46 0.46
68 0.47 0.47 0.47 0.48 0.48 0.48 0.48 0.49 0.49 0.49
69 0.50 0.50 0.50 0.50 0.51 0.51 0.51 0.52 0.52 0.52
70 0.52 0.53 0.53 0.53 0.54 0.54 0.54 0.54 0.55 0.55
71 0.55 0.56 0.56 0.56 0.57 0.57 0.57 0.57 0.58 0.58
72 0.58 0.59 0.59 0.59 0.59 0.60 0.60 0.60 0.61 0.61
73 0.61 0.62 0.62 0.62 0.62 0.63 0.63 0.63 0.64 0.64
74 0.64 0.65 0.65 0.65 0.66 0.66 0.66 0.67 0.67 0.67
75 0.67 0.68 0.68 0.68 0.69 0.69 0.69 0.70 0.70 0.70
76 0.71 0.71 0.71 0.72 0.72 0.72 0.73 0.73 0.73 0.74
77 0.74 0.74 0.75 0.75 0.75 0.76 0.76 0.76 0.77 0.77
78 0.77 0.78 0.78 0.78 0.79 0.79 0.79 0.80 0.80 0.80
79 0.81 0.81 0.81 0.82 0.82 0.82 0.83 0.83 0.83 0.84
80 0.84 0.85 0.85 0.85 0.86 0.86 0.86 0.87 0.87 0.87
81 0.88 0.88 0.89 0.89 0.89 0.90 0.90 0.90 0.91 0.91
82 0.92 0.92 0.92 0.93 0.93 0.93 0.94 0.94 0.95 0.95
83 0.95 0.96 0.96 0.97 0.97 0.97 0.98 0.98 0.99 0.99
84 0.99 1.00 1.00 1.01 1.01 1.02 1.02 1.02 1.03 1.03
85 1.04 1.04 1.05 1.05 1.05 1.06 1.06 1.07 1.07 1.08
86 1.08 1.08 1.09 1.09 1.10 1.10 1.11 1.11 1.12 1.12
87 1.13 1.13 1.14 1.14 1.15 1.15 1.16 1.16 1.17 1.17
88 1.17 1.18 1.19 1.19 1.20 1.20 1.21 1.21 1.22 1.22
89 1.23 1.23 1.24 1.24 1.25 1.25 1.26 1.26 1.27 1.28
90 1.28 1.29 1.29 1.30 1.30 1.31 1.32 1.32 1.33 1.33
91 1.34 1.35 1.35 1.36 1.37 1.37 1.38 1.39 1.39 1.40
92 1.41 1.41 1.42 1.43 1.43 1.44 1.45 1.45 1.46 1.47
93 1.48 1.48 1.49 1.50 1.51 1.51 1.52 1.53 1.54 1.55
94 1.55 1.56 1.57 1.58 1.59 1.60 1.61 1.62 1.63 1.64
95 1.64 1.65 1.66 1.67 1.68 1.70 1.71 1.72 1.73 1.74
96 1.75 1.76 1.77 1.79 1.80 1.81 1.83 1.84 1.85 1.87
97 1.88 1.90 1.91 1.93 1.94 1.96 1.98 2.00 2.01 2.03
98 2.05 2.07 2.10 2.12 2.14 2.17 2.20 2.23 2.26 2.29
99 2.33 2.37 2.41 2.46 2.51 2.58 2.65 2.75 2.88 3.09

10
Bảng A7 Giá trị tới hạn của kiểm định sắp hạng có dấu cặp đôi Wilcoxon
Tạo lại từ bảng 21 của White el al (1979) có xin phép tác giả và nhà xuất bản
N = số hiệu số khác không
T = số nhỏ nhất trong T+ và T-
Có ý nghĩa nếu T < giá trị tới hạn

Giá trị P một bên


0.05 0.025 0.01 0.005
Giá trị P hai bên
N 0.1 0.05 0.02 0.01
5 1
6 2 1
7 4 2 0
8 6 4 2 0
9 8 6 3 2
10 11 8 5 3
11 14 11 7 5
12 17 14 10 7
13 21 17 13 10
14 26 21 16 13
15 30 25 20 16
16 36 30 24 19
17 41 35 28 23
18 47 40 33 28
19 54 46 38 32
20 60 52 43 37
21 68 59 49 43
22 75 66 56 49
23 83 73 62 55
24 92 81 69 61
25 101 90 77 68
26 110 98 85 76
27 120 107 93 84
28 130 117 102 92
29 141 127 111 100
30 152 137 120 109
31 163 148 130 118
32 175 159 141 128
33 188 171 151 138
34 201 183 162 149
35 214 195 174 160
36 228 208 186 171
37 242 222 198 183
38 256 235 211 195
39 271 250 224 208
40 287 264 238 221
41 303 279 252 234
42 319 295 267 248
43 336 311 281 262
44 353 327 297 277
45 371 344 313 292
46 389 361 329 307
47 408 397 345 323
48 427 397 362 339
49 446 415 380 356
50 466 434 398 373

11
Bảng A8 Giá trị tới hạn của kiểm định tổng sắp hạng Wilcoxon
Tạo lại từ bảng A7 của Cotton (1974) có xin phép tác giả và nhà xuất bản
n1, n2 = cỡ mẫu của hai nhóm
T = tổng các hạng trong nhóm có cỡ mẫu nhỏ
Có ý nghĩa nếu T ở ngoài khoảng tới hạn

Giá trị P một bên


0.025 0.005 0.0005
Giá trị P hai bên
n1, n2 0.05 0.01 0.001
2 8 3 19
2 9 3 21
2 10 3 23
2 11 4 24
2 12 4 26
2 13 4 28
2 14 4 30
2 15 4 32
2 16 4 34
2 17 5 35
2 18 5 37
2 19 5 39 3 41
2 20 5 41 3 43
2 21 6 42 3 45
2 22 6 44 3 47
2 23 6 46 3 49
2 24 6 48 3 51
2 25 6 50 3 53

3 5 6 21
3 6 7 23
3 7 7 26
3 8 8 28
3 9 8 31 6 33
3 10 9 33 6 36
3 11 9 36 6 39
3 12 10 38 7 41
3 13 10 41 7 44
3 14 11 43 7 47
3 15 11 46 8 49
3 16 12 48 8 52
3 17 12 51 8 55
3 18 13 53 8 58
3 19 13 56 9 60
3 20 14 58 9 63
3 21 14 61 9 66 6 69
3 22 15 63 10 68 6 72
3 23 15 66 10 71 6 75
3 24 16 68 10 74 6 78
3 25 16 71 11 76 6 81

12
n1, n2 0.05 0.01 0.001

4 4 10 26
4 5 11 29
4 6 12 32 10 34
4 7 13 35 10 38
4 8 14 38 11 41
4 9 15 41 11 45
4 10 15 45 12 48
4 11 16 48 12 52
4 12 17 51 13 55
4 13 18 54 14 58 10 62
4 14 19 57 14 62 10 66
4 15 20 60 15 65 10 70
4 16 21 63 15 69 11 73
4 17 21 67 16 72 11 77
4 18 22 70 16 76 11 81
4 19 23 73 17 79 12 84
4 20 24 76 18 82 12 88
4 21 25 79 18 86 12 92
4 22 26 82 19 89 13 95
4 23 27 85 19 93 13 99
4 24 28 88 20 96 13 103
4 25 28 92 20 100 14 106

5 5 17 38 15 40
5 6 18 42 16 44
5 7 20 45 17 48
5 8 21 49 17 53
5 9 22 53 18 57 15 60
5 10 23 57 19 61 15 65
5 11 24 61 20 65 16 69
5 12 26 64 21 69 16 74
5 13 27 68 22 73 17 78
5 14 28 72 22 78 17 83
5 15 29 76 23 82 18 87
5 16 31 79 24 86 18 92
5 17 32 83 25 90 19 96
5 18 33 87 26 94 19 101
5 19 34 91 27 98 20 105
5 20 35 95 28 102 20 110
5 21 37 98 29 106 21 114
5 22 38 102 29 111 21 119
5 23 39 106 30 115 22 123
5 24 40 110 31 119 23 127
5 25 42 103 32 123 23 132

13
n1, n2 0.05 0.01 0.001
6 6 26 52 23 55
6 7 27 57 24 60
6 8 29 61 25 65 21 69
6 9 31 65 26 70 22 74
6 10 32 70 27 75 23 79
6 11 34 74 28 80 23 85
6 12 35 79 30 84 24 90
6 13 37 83 31 89 25 95
6 14 38 88 32 94 26 100
6 15 40 92 33 99 26 106
6 16 42 96 34 104 27 111
6 17 43 101 36 108 28 116
6 18 45 105 37 113 29 121
6 19 46 110 38 118 29 127
6 20 48 114 39 123 30 132
6 21 50 118 40 128 31 137
6 22 51 123 42 132 32 142
6 23 53 127 43 137 33 147
6 24 55 131 44 142 34 152

7 7 36 69 32 73 28 77
7 8 38 74 34 78 29 83
7 9 40 79 35 84 30 89
7 10 42 84 37 89 31 95
7 11 44 89 38 95 32 101
7 12 46 94 40 100 33 107
7 13 48 99 41 106 34 113
7 14 50 104 43 111 35 119
7 15 52 109 44 117 36 125
7 16 54 114 46 122 37 131
7 17 56 119 47 128 38 137
7 18 58 124 49 133 39 143
7 19 60 129 50 139 41 148
7 20 62 134 52 144 42 154
7 21 64 139 53 150 43 160
7 22 66 144 55 155 44 166
7 23 68 149 57 160 45 172

8 8 49 87 43 93 38 98
8 9 51 93 45 99 40 104
8 10 53 99 47 105 41 111
8 11 55 105 49 111 42 118
8 12 58 110 51 117 43 125
8 13 60 116 53 123 45 131
8 14 63 121 54 130 46 138
8 15 65 127 56 136 47 145
8 16 67 133 58 142 49 151
8 17 70 138 60 148 50 158
8 18 72 144 62 154 51 165
8 19 74 150 64 160 53 171
8 20 77 155 66 166 54 178
8 21 79 161 68 172 56 184
8 22 82 166 70 178 57 191

14
n1, n2 0.05 0.01 0.001

9 9 63 108 56 115 50 121


9 10 65 115 58 122 52 128
9 11 68 121 61 128 53 136
9 12 71 127 63 135 55 143
9 13 73 134 65 142 56 151
9 14 76 140 67 149 58 158
9 15 79 146 70 155 60 165
9 16 82 152 72 162 61 173
9 17 84 159 74 169 63 180
9 18 87 165 76 176 65 187
9 19 90 171 78 183 66 195
9 20 93 177 81 189 68 202
9 21 95 184 83 196 70 209

10 10 78 132 71 139 63 147


10 11 81 139 74 146 65 155
10 12 85 145 76 154 67 163
10 13 88 152 79 161 69 171
10 14 91 159 81 169 71 179
10 15 94 166 84 176 73 187
10 16 97 173 86 184 75 195
10 17 100 180 89 191 77 203
10 18 103 187 92 198 79 211
10 19 107 193 94 206 81 219
10 20 110 200 97 213 83 227

11 11 96 157 87 166 78 175


11 12 99 165 90 174 81 183
11 13 103 172 93 182 83 192
11 14 106 180 96 190 85 201
11 15 110 187 99 198 87 210
11 16 114 194 102 206 90 218
11 17 117 202 105 214 92 227
11 18 121 209 108 222 94 236
11 19 124 217 111 230 97 244

12 12 115 185 106 194 95 205


12 13 119 193 109 203 98 214
12 14 123 201 112 212 100 224
12 15 127 209 115 221 103 233
12 16 131 217 119 229 105 243
12 17 135 225 122 238 108 252
12 18 139 233 125 247 111 261

13 13 137 214 125 226 114 237


13 14 141 223 129 235 116 248
13 15 145 232 133 244 119 258
13 16 150 240 137 253 122 268
13 17 154 249 140 263 125 278

14 14 160 246 147 259 134 272


14 15 164 256 151 269 137 283
14 16 169 265 155 279 140 294

15 15 185 280 171 294 156 309

15
Bảng A9 Giá trị tới hạn của hệ số tương quan sắp hạng của Spearman
Có ý nghĩa nếu rs>giá trị tới hạn. Cải biên từ Bảng A8 của Colton (1974) và từ Bảng 17 của
White el al. (1979), có xin phép tác giả và nhà xuất bản

Giá trị P một bên Giá trị P một bên


số cặp 0.05 0.01 0.05 0.01
5 0.9
6 0.086 0.829 0.943
7 0.786 0.714 0.893
8 0.738 0.881 0.643 0.833
9 0.683 0.833 0.6 0.783
10 0.648 0.794 0.564 0.746
12 0.591 0.78 0.506 0.712
14 0.545 0.716 0.456 0.645
16 0.507 0.666 0.425 0.601
18 0.476 0.625 0.399 0.564
20 0.45 0.591 0.377 0.534
22 0.428 0.562 0.359 0.508
24 0.409 0.537 0.343 0.485
26 0.392 0.515 0.329 0.465
28 0.377 0.496 0.317 0.448
30 0.364 0.478 0.306 0.432

16
Bảng A10 Số ngẫu nhiên

34735 78219 18131 92594 94235 11721 53806 52733 19665 26574 05728 81270 81641
35621 57344 02606 21961 07539 71006 51935 83322 29423 27142 85686 44342 09145
78629 40478 63628 13640 82315 41919 90964 82448 48074 41423 40836 79588 64174
08462 33570 21715 90409 33199 71764 56738 50619 59743 76495 81334 12020 73947
24014 71381 58732 29417 32050 89880 61392 61573 33128 62969 40939 89200 60756
37124 23597 73007 26705 94330 45206 74130 55905 66409 06851 10401 77370 79931
92775 68533 86784 28870 61590 99165 31797 03780 47408 29291 88999 81583 54406
26426 54602 71259 56747 36957 82629 23159 70407 88383 47691 95014 60902 46232
21487 46012 10948 49446 32178 50727 30892 19248 56504 72663 45070 55686 14624
17745 94929 23861 66784 15825 39009 50060 67336 31511 52316 25839 92967 57622
30495 18694 23722 03685 19700 96192 00151 08091 84548 27850 38503 66775 20398
32372 52818 46875 87319 85180 75405 74269 19501 48521 51843 72300 84055 29993
75451 26763 60571 94992 38611 28142 47473 55362 35318 85379 35938 73876 63602
11762 41680 66807 37812 79865 79427 41731 68471 81021 64385 51734 10187 71142
83884 49794 55501 97110 45306 77600 40130 45029 52682 14441 47791 80935 84251
14269 65406 78705 90654 43192 14170 85702 09650 02333 54434 27017 56578 75149
36343 48319 66650 94373 62872 93369 06342 13734 06577 61311 66067 65470 06779
15496 11053 73309 95443 76374 91922 87184 64769 20045 00059 09817 41361 33022
85104 28594 44846 60598 60749 44268 80423 58992 86707 39003 74184 84599 76744
79670 63423 00315 14875 11492 85727 52774 15725 61539 26867 88297 89560 91783
01898 64946 58151 25072 60705 10247 61850 54819 03372 27480 02607 31817 04231
44069 23863 80350 41791 51294 85320 50969 88518 65089 74666 22634 16628 26606
63055 89602 08803 81492 62758 76960 50273 52443 65284 26315 65822 66697 61693
83321 19962 73527 34635 78648 28633 32031 01370 76576 08634 16212 44914 31187
77054 69898 92184 66259 60345 77074 68009 45901 15502 11268 87119 23661 95880
69907 87164 66650 93954 44440 69031 77532 68923 16217 66085 50724 82314 30987
90287 37202 91124 50480 94422 48102 32066 47136 53534 51891 48612 45191 47777
87558 35054 94824 89447 82164 60059 61863 79891 34078 46344 66598 81489 30743
01580 47873 85392 57121 13681 84955 71158 70995 72485 54632 67880 73891 05757
04455 74718 28303 90358 27153 95274 14366 13901 50283 70153 95076 66796 25177
52083 34394 08739 49470 66296 14183 20924 25128 04890 84576 47494 66048 84214
46752 74230 42172 94075 34968 45259 17032 93902 37647 89517 70775 03838 18491
56551 15908 58391 82674 70615 37303 81149 91201 08470 30825 54441 94465 63508
12880 25154 61576 61751 81850 76738 73447 45267 97964 33313 89353 60036 36412
32612 04635 48102 38869 56136 42105 43699 90397 11968 28889 42463 58364 19592
67080 19279 63450 66826 19313 03230 48711 16457 53530 40581 67423 82437 41400
41036 43809 71873 87841 16296 65631 86429 42280 62538 12616 23129 79515 43289
10638 01419 64349 00924 03682 91112 32391 42009 95040 70317 08829 39081 37986
12438 74937 79849 25213 44568 30721 35220 23673 21105 81979 42688 68270 07955
99112 08402 46319 23263 95208 58936 40786 89801 65878 50334 58243 34281 03358
16311 16122 61899 33385 97310 04988 14475 85420 39643 04048 82730 13130 73452
61450 25720 22871 42940 39895 36887 89416 82663 56490 03027 51598 65146 22541
17156 16421 93043 04299 46784 89396 86661 23390 39388 04284 00321 81178 79590
51574 31717 16199 20938 53318 64235 76469 28088 77810 84225 97020 55951 25461
00040 16495 22530 90427 09475 79693 92178 10145 64438 79172 76021 26669 44039
71382 68440 73671 50695 97534 03954 58349 66779 64465 35220 23691 95815 27666
39894 24705 50512 00919 50389 00004 68679 22953 50956 35320 07350 07762 54467
63465 11953 11635 90674 32865 88904 53019 22828 18637 47228 48176 65884 68189
55528 68750 17124 01659 23255 13164 09310 56236 19990 13958 03747 26945 55357
47926 07712 64115 98554 23254 07362 26137 19452 64289 83646 13737 34698 96796
09070 02968 79123 89790 54631 61425 77161 28785 23730 59257 86048 99683 11718
74583 05284 21832 36901 28669 83265 74128 37224 07310 11162 50192 60078 51340
21356 65134 10766 55847 97110 40608 38745 42250 61498 32780 62064 57535 78737
94569 83865 66237 39173 48434 98112 80319 40587 33931 98799 29927 42051 13332
59579 49150 26240 24307 46740 63926 41405 59985 40177 63084 75229 47222 90182

17
18

You might also like