You are on page 1of 117

XÁC SUẤT THỐNG KÊ Y DƯỢC

BIOSTATISTICS
TS. ĐÀO HỒNG NAM
Website: dhnammp.blogspot.com

Fanpage: facebook.com/xstkyd

REFERENCES
1. Jay S. Kim, Ronald J. Dailey (2008), Biostatistics for Oral Healthcare,
published 2008 by Blackwell Munksgaard, a Blackwell Publishing Company.
USA.
2. Wayne W. Daniel (2009), Biostatistics: a foundation for analysis
in the health sciences. John Wiley & Sons, Inc. USA.
3. Nigel C. Smeeton (2017). Dental statistics made easy. Third Edition. © 2017
by Taylor & Francis Group, LLC. USA.
4. Altman DG (1991). Practical statistics for medical research. London: Chapman
and Hall.
XÁC SUẤT
I. Thí nghiệm ngẫu nhiên và biến cố
1. Thí nghiệm ngẫu nhiên
Là một tình huống liên quan ến khả năng xảy ra các kết cục
(outcome) không thể dự oán một cách chắc chắn.
2. Biến cố (sự kiện- event)
Biến cố: kết quả hoặc tập hợp các kết quả có thể có của thí nghiệm
ngẫu nhiên.
Không gian mẫu: là tập hợp tất cả các kết quả có thể có của một thí
nghiệm (hoặc một biến ngẫu nhiên) và ược biểu thị bằng Ω.
Ví dụ 1. Sử dụng thuốc kháng sinh M (Amoxicillin, Clarithromycin,
Metronidazol, Levofloxacin) trong iều trị HP. Quan tâm ến kết cục HP
kháng thuốc. Gọi A là biến cố HP bị tiêu diệt, B là biến cố HP kháng
thuốc. Do ó Ω có 2 phần tử là Ω = {A, B}
Ví dụ 2. Gia đình ông Hải có 3 người con. Không gian mẫu cho giới tính
của ba đứa con là gì?
Bởi vì mỗi người trong số ba đứa trẻ có thể là trai (B) hoặc gái (G) nên:
Ω có 8 phần tử là Ω = {BBB, BBG, BGB, BGG, GBB, GBG, GGB, GGG}.
Các loại biến cố:
- B/c không thể : b/c không bao giờ xảy ra, ký hiệu ∅.
- B/c chắc chắn: b/c nhất ịnh sẽ xảy ra
- B/c hiếm: b/c ít xảy ra
- B/c A ược gọi là b/c bù (b/c ối) của A khi và chỉ khi:
II. QUAN HỆ GiỮA CÁC BiẾN CỐ
1. Phép hội (hợp)
𝐴∪𝐵 =𝐶
Ví dụ 1. Khám cho một b/n,
gọi A: “tim ập yếu”, B: “giãn
mạch” thì C = ?
C = A U B là b/c
2. Phép giao 𝐴 ∩ 𝐵 = 𝐶

Ví dụ 2. Khám cho 1 b/n. Gọi A: “nhiệt ộ


cao”, B: “mệt” thì C = ?
C = A ∩ B là bc

3. Phép hiệu 𝐴\𝐵 = 𝐶

4. Phép bù
𝐶ℎ𝑜𝐴 ⊂ 𝐵 Phần bù của A trong B, ký hiệu là 𝐴 = 𝐵\𝐴
5. Các khái niệm khác
a. Quan hệ kéo theo: Ký hiệu A ⊂ B : Nếu b/c A xảy ra thì
kéo theo b/c B xảy ra.
Ví dụ: Tắc ruột  Bí tiểu

b. Hai b/c xung khắc: Hai b/c A và B gọi là xung khắc nếu
chúng không cùng xảy ra trong một phép thử (AB = ∅).
Ví dụ 3. XN vi khuẩn ường ruột cho 1 b/n. Gọi A: “Vi khuẩn Subtilis
phát triển”, B: “Vi khuẩn E.coli phát triển”
 A và B xung khắc vì 2 loại VK này thường không hiện diện ồng thời
trong ường ruột.
Ví dụ 4. Giả sử các loại thuốc theo chỉ ịnh của bác sĩ có thể ảnh hưởng
ến mùi hoặc hương vị là ampicillin, benzocaine, codeine,
metronidazole, kem ánh răng chứa natri lauryle sulfate và tetracycline.
Gọi sự kiện C = {benzocaine, codeine, metronidazole, tetracycline},
D = {ampicillin, codein, metronidazole, tetracycline}, và E = {ampicillin}

1. Hội (hợp) của hai sự kiện C và D là C ∪ D = {ampicillin, benzocaine,


codeine, metronidazole, tetracycline}.
2. Giao của hai sự kiện C và D là C ∩ D = {codeine, metronidazole,
tetracycline}.
3. Phần bù của C và D là: 𝐶 = {ampicillin, kem ánh răng natri lauryle
sulfate}, và 𝐷 = {benzocaine, kem ánh răng natri lauryle sulfate}.
4. Hai sự kiện C và D không loại trừ lẫn nhau, bởi vì chúng có kết quả
chung: codeine, metronidazole và tetracycline. Cả hai ều có thể xảy ra
cùng một lúc.
5. Các sự kiện C và E là loại trừ lẫn nhau (xung khắc)
c. Nhóm biến cố ầy ủ
Nhóm b/c A1, A2, . . . , An gl ầy ủ nếu chúng xung
khắc từng ôi một và luôn có một b/c xảy ra trong
một phép thử. Nghĩa là:
 A1 + A2 + ... + An = 

 Ai . Aj = , 1  i  j  n

Hệ gồm 5 biến cố đầy đủ Hệ gồm 2 biến cố đầy đủ


d. Sự ộc lập của các biến cố
◼ 2 b/c ộc lập: A và B ộc lập nếu việc A xảy ra hay không
không ảnh hưởng ến XS của B và ngược lại.
◼ 2 b/c không ộc lập gọi là phụ thuộc.

Chú ý:
❑ Độc lập toàn phần → ộc lập từng ôi

❑ Không có chiều ngược lại.

❑ Nếu A ộc lập với B thì B cũng ộc lập với A.


III. XÁC SUẤT
1. Định nghĩa xác suất theo cổ iển
Xét một TN ngẫu nhiên E, có  = {A1, A2, …, An} thỏa iều kiện:
- Hữu hạn phần tử.
- Đồng khả năng, tức là P(A1) = P(A2) = P(An) = 1/n
Định nghĩa 1: Xác suất của b/c A:

Ví dụ 1. Một hộp có 20 lọ thuốc (15 tốt + 5 hỏng). Lấy ngẫu nhiên 3 lọ


ể kiểm tra. Tính các XS:
a. Được 3 lọ tốt b. Được 3 lọ hỏng c. Được ít nhất 1 lọ hỏng.
2. Định nghĩa xác suất theo tần suất
Xét TN ngẫu nhiên E và b/c A liên quan ến E. Thực hiện E n lần
ộc lập, thấy b/c A xuất hiện m lần. Khi ó, tỷ số 𝑓𝑛 = 𝑚
𝑛

gl tần suất của b/c A. Khi n → ∞, fn ≈ c, c gl XS của b/c A.


Định nghĩa: XS của b/c A là giá trị ổn ịnh của tần suất khi số lần thực
hiện thí nghiệm tăng lên vô hạn: 𝑃(𝐴) = lim 𝑓𝑛
𝑛→∞

Ví dụ 2. Buffon Pearson ă thực hiện TN tung một ồng xu cân ối


nhiều lần và có kết quả như sau:
Số lần gieo Tần số xuất Tần suất xuất hiện
hiện mặt ngửa mặt ngửa
4040 2048
12000 6019
24000 12012
3. CÁC TÍNH CHẤT CỦA XÁC SUẤT
XS của b/c A bất kỳ thỏa măn:

a. 0  P( A)  1 với mọi biến cố A.


b. P () = 1 P() = 0
c. P( A) + P( A) = 1
4. Nguyên lý xác suất nhỏ - lớn

◼ Nguyên lý XS nhỏ (nguyên lý b/c hiếm): Nếu một b/c có XS


rất nhỏ thì thực tế có thể xem rằng trong một phép thử b/c
ó sẽ không xảy ra.

◼ Nguyên lý XS lớn: Nếu một b/c có XS rất gần 1 thì thực tế


có thể xem rằng b/c ó sẽ xảy ra trong một phép thử.
Thông thường:
◼ p  0,05 ược coi là ủ nhỏ

◼ p≥ 0,95 ược coi là ủ lớn

12
Trong Ví dụ 1. Một hộp có 20 lọ thuốc (15 tốt + 5 hỏng). Lấy ngẫu
nhiên 3 lọ ể kiểm tra. Tính XS lấy ược ít nhất 1 lọ hỏng.

Cách 1: Tính trực tiếp theo /n:


𝐶51 × 𝐶15
2 1
+ 𝐶52 × 𝐶15 + 𝐶53
𝑃(C) = 3 = 0,6
𝐶20

𝑃(C) + 𝑃(𝐶) = 1
Cách 2: Dùng t/c của XS:
Gọi X là số lọ hỏng trong 3 lọ lấy ra, C là b/c lấy ược ít
nhất 1 lọ hỏng
𝑃(C) = 𝑃(𝑋 ≥ 1) ⇒ 𝑃(𝐶) = 𝑃(𝑋 < 1) = 𝑃(𝑋 = 0) = P( A) = 0,399
IV.Số o sự xuất hiện của bệnh: tỉ suất, nguy c và số
chênh
➢ Số mới mắc (incidence) là ại lượng o lường của sự xuất
hiện của bệnh.
➢ Nguy cơ (risk): Là XS mắc bệnh trong thời gian phơi nhiễm
nhất ịnh
➢ Tỉ suất mới mắc (incidence rate): nguy cơ mắc bệnh tức
thời trong một ơn vị thời gian.
VD: tỉ suất mới mắc (tỷ suất) của bệnh mạch vành tim ở người
có cholesterol  245 mg% là 0,02/năm.
nghĩa là trong 100 người có cholesterol  245 mg% và chưa
bị bệnh mạch vành tim, trung bình có hai người bị xuất hiện
bệnh mạch vành sau thời gian theo dõi 1 năm.
➢ Số chênh (odds): Là tỷ số giữa xs mắc bệnh và xs không
mắc bệnh
➢ Yếu tố nguy cơ (Risk factor)
Là một yếu tố làm tăng nguy cơ mắc bệnh ở một cá nhân.
Ví dụ 1. Hút thuốc lá là một yếu tố nguy cơ ung thư phổi; béo phì là một
yếu tố nguy cơ cho bệnh tim.
➢ Nguyên nhân (Cause)
Ví dụ 2. Nguyên nhân gây bệnh tả là :
vi khuẩn
Nguyên nhân ung thư cổ tử cung:

Đặc iểm của một nguyên nhân


Để là một nguyên nhân, các yếu tố:
- Phải xuất hiện trước hiệu ứng
- Có thể là một vật chủ hoặc yếu tố môi trường (ví dụ: ặc iểm, iều
kiện, hành ộng của cá nhân, sự kiện, hiện tượng tự nhiên, xã hội
hoặc kinh tế)
- Có thể dương tính (có phơi nhiễm nguy cơ) hoặc âm tính (không phơi
nhiễm nguy cơ)
1. Nguy cơ tương ối RR (Relative Risk) (sử dụng trong NC tiền cứu)
Nguy cơ tương ối là một khái niệm quan trọng hữu ích ể so sánh xác
suất của bệnh ở hai nhóm khác nhau; một nhóm bao gồm các ối tượng
ã tiếp xúc với các yếu tố nguy cơ, và khác bao gồm các ối tượng
không ược tiếp xúc với các yếu tố nguy cơ.

Xét yếu tố A và bệnh B


Nhóm 1 (n1 ối tượng) k1 ối tượng Tỷ lệ mắc
(Phơi nhiễm/tiếp xúc với A) mắc bệnh B p1 = k1/n1

Nhóm 2 (n2 ối tượng)


k2 ối tượng Tỷ lệ mắc
(Không phơi nhiễm/không
mắc bệnh B p0 = k2/n2
tiếp xúc)
𝑝1
𝑅𝑅 = - If RR> 1 : A làm tăng nguy cơ mắc bệnh (YTNC)
𝑝0
- If RR <1 : A làm giảm nguy cơ mắc bệnh (YTBV)
- If RR = 1: Không có mối liên hệ giữa A và B
Khoảng tin cậy 95% cho RR (CI) Disease B
1: Tính RR Factor A Total
Yes No
𝑎 𝑐 Yes a b a+b
𝑝1 = ;𝑝 = 𝑝1
𝑎+𝑏 0 𝑐+𝑑 𝑅𝑅 = No c d c+d
𝑝0
Total a+c b+d n

2: Tìm 95% CI theo công thức

1 1 𝑎 𝑐
ln(𝑅𝑅)±1.96 + − −
𝑒 𝑎 𝑐 𝑎+𝑏 𝑐+𝑑

95%CI =

- Nếu CI > 1: : A làm tăng nguy cơ mắc bệnh (YTNC)


- Nếu CI <1 : A làm gỉam nguy cơ mắc bệnh (YTBV)
- Nếu CI chứa 1: : Không có mối liên hệ giữa A và B
Ví dụ 1. Một nghiên cứu về hiệu quả Fracture
Group Total
phòng chống gãy xương của zoledronate, Yes No
bệnh nhân ược chia thành hai nhóm: Zoledronate 92 970 1062
nhóm 1 ược iều trị bằng zoledronate, Placebo 148 917 1065
và nhóm 2 chỉ dùng canxi và vitamin D Total 240 1887 2127
(giả dược). Sau 3 năm theo dõi, kết quả
như sau.
92 148
𝑝1 = 𝑝0 =
1062 1065

𝑝1
⇒ 𝑅𝑅 =
𝑝0 = 0,623

https://www.medcalc.org/calc/relative_risk.php
Ví dụ 2. Một nghiên cứu về tác dụng của DDT ối với các bệnh về da
ược thực hiện trong 2 nhóm. Sau một thời gian theo dõi, kết quả như
sau: Nhóm 1: 93 người sử dụng DDT, với 29 người mắc bệnh ngoài da.
Nhóm 2: 59 người không sử dụng DDT, 23 người mắc bệnh ngoài da.
Hỏi: DDT có hiệu quả trong iều trị các bệnh về da không?
Ví dụ 3. Một nghiên cứu thuần tập iều tra mối liên hệ giữa hút thuốc và
bệnh mạch vành tim ã ược tiến hành trên 2 nhóm khỏe mạnh trên 30
tuổi. Sau 10 năm theo dõi, kết quả như sau: Nhóm hút thuốc: 4893 người,
trong ó có 675 người mắc bệnh tim mạch vành. Nhóm người không hút
thuốc: 3847 người, trong ó có 367 người mắc bệnh mạch vành tim. Kết
luận?
2. Tỷ số chênh OR (Odds Ratio)
𝑝 (sử dụng trong NC hồi cứu)
𝑜𝑑𝑑 =
Gọi p là XS mắc bệnh 1−𝑝

Nếu Odd > 1: Xác suất mắc bệnh cao hơn XS không mắc bệnh;
Nếu Odd <1: Xác suất mắc bệnh thấp hơn XS không mắc bệnh;
Nếu Odd = 1: Xác suất mắc bệnh bằng với XS không mắc bệnh.

𝑝1 𝑝0
𝑜𝑑𝑑0 =
Group 1: 𝑜𝑑𝑑1 =
1 − 𝑝1 Group 2: 1 − 𝑝0

𝑜𝑑𝑑1 𝑝1 1 − 𝑝0 1 − 𝑝0
𝑂𝑅 = = × = 𝑅𝑅 ×
𝑜𝑑𝑑0 𝑝0 1 − 𝑝1 1 − 𝑝1

- OR > 1: A là YTNC
- OR <1: A là YTBV
- OR = 1: A và B không có liên hệ ( ộc lập)
𝑎 𝑏 Disease B
𝑝1 = ; 1 − 𝑝1 = Factor A Total
𝑎+𝑏 𝑎+𝑏 Yes No
𝑝1 𝑎 Yes a b a+b
⇒ 𝑜𝑑𝑑1 = = No c d c+d
1 − 𝑝1 𝑏
Total a+c b+d n
𝑐 𝑑 𝑝0 𝑐
𝑝0 = ; 1 − 𝑝0 = ⇒ 𝑜𝑑𝑑0 = =
𝑐+𝑑 𝑐+𝑑 1 − 𝑝0 𝑑
𝑜𝑑𝑑1 𝑎𝑑
OR = =
𝑜𝑑𝑑0 𝑏𝑐

1 1 1 1
ln( OR)±1.96
e 𝑎+𝑏+𝑐 +𝑑

95%CI =
Ví dụ 1. Một nghiên cứu bệnh chứng Smoking Disease Total
nhằm khảo sát mối tương quan giữa "hút
Yes No
thuốc" và yếu tố bệnh "viêm phế quản mãn
tính" có kết quả sau: Yes 320 200 520
No 180 300 480
Total 500 500 1000

https://www.medcalc.org/calc/odds_ratio.php
Ví dụ 2. Một nghiên cứu về ảnh hưởng của caffeine ối với chứng mất ngủ ược
tiến hành trong 2 nhóm. Nhóm 1: 72 người uống ồ uống ồ uống chứa caffein,
30 người bị mất ngủ Nhóm 2: 73 người dùng giả dược, có 9 người mất ngủ
Hỏi: Caffeine có ảnh hưởng ến chứng mất ngủ không?

Conclusion
Smoking Lung cancer Total Ví dụ 3. Một nghiên cứu bệnh chứng
thực hiện trên 2 nhóm. Nhóm 1 gồm
Yes No 567 người hút thuốc có 297 người bị
ung thư phổi. Nhóm 2 gồm 33 người
Yes 297 270 567 không hút thuốc có 3 người bị ung

No 3 30 33 thư phổi. Kết luận?

Total 300 300 600

𝑎𝑑 297 × 30
OR = = = 11
𝑏𝑐 3 × 270
Ví dụ 4. Các yếu tố chính dẫn ến thất bại cấy ghép implant là mật ộ
xương thấp (tức là xương loại IV) và hút thuốc lá. Một nghiên cứu ược
thực hiện với 223 thiết bị cấy ghép ược ặt trên 78 bệnh nhân. Các
bệnh nhân ược chia thành hai nhóm: người hút thuốc lá và người
không hút thuốc. Tỷ lệ thất bại của các mô cấy ã ược quan sát. Việc
loại bỏ implant vì bất kỳ lý do gì hoặc implant có biểu hiện mất xương
hơn 50% ược coi là thất bại. Dữ liệu ược tóm tắt trong bảng sau.

Tìm OR và KTC cho OR


Kết luận?
3. Kiểm ịnh hiệu lực vaccine
- Tiêm chủng là một biện pháp phòng ngừa, vắc-xin và giả dược ược sử dụng
cho những người khỏe mạnh, không phải người bệnh.
- Kiểm ịnh hiệu lực Vắc xin nhằm ánh giá hiệu quả của vắc-xin trong việc ngăn
ngừa sự xuất hiện của bệnh.
𝑇𝑦û𝑙𝑒ä𝑚𝑎é𝑐​𝑚ôù𝑖𝑡𝑟𝑜𝑛𝑔𝑛ℎ oùm tieâm chuûng
𝑉𝐸 = 1 − 𝑝1
𝑇𝑦û𝑙𝑒ä𝑚𝑎é𝑐​𝑚ôù𝑖𝑡𝑟𝑜𝑛𝑔𝑛ℎ oùm 𝑘ℎ𝑜â𝑛𝑔 tieâm chuûng = 1 −
𝑝0

𝑉𝐸 = 1 − 𝑅𝑅

KTC 95% cho VE


1. Tìm KTC 95% cho RR theo công thức:
1 1 𝑎 𝑐
ln(𝑅𝑅)±1.96 𝑎+𝑐 −𝑎+𝑏−𝑐+𝑑
𝑒 = [𝑥; 𝑦]

2. Tìm KTC 95% cho VE


𝑉𝐸 = 1 − 𝑦; 1 − 𝑥
Ví dụ 1. Một thử nghiệm vắc-xin ể iều trị cúm, kết quả như sau
Flu Vaccine Placebo Total
Yes 20 80 100
No 220 140 360
Total 240 220 460

95% CI for RR = [0.1455;0.3611]


95% CI for VE = [0.6389;0.8545]
Ví dụ 2. Một thử nghiệm vắc-xin trên 2 nhóm chuột: Nhóm tiêm chủng bao
gồm 13076 con chuột, 152 con chuột ã chết. Nhóm chứng bao gồm
11881 con chuột, với 255 con chuột chết. Hỏi: Vắc xin có hiệu quả không?

95% CI for RR = [0.4437;0.6611]


95% CI for VE = [0.3389;0.5563]
Bài tập Thuốc ngừa Bệnh mạch vành tim Tổng
1. Một nghiên cứu hồi cứu về mối thai Có Không
liên quan của bệnh tim mạch với Có 693 320 1013
việc sử dụng thuốc tránh thai ở 307 680 987
Không
2000 phụ nữ. Dữ liệu như thể hiện
Tổng 1000 1000 2000
trong bảng bên. Có mối liên quan
giữa thuốc tránh thai và bệnh tim
mạch không? Hút thuốc Viêm phế quản mãn tính Tổng
2. Nghiên cứu hồi cứu về mối liên Có Không
quan giữa hút thuốc lá và viêm phế Có 300 200 500
quản mãn tính. Dữ liệu ược hiển
Không 200 300 500
thị trong bảng bên. Có mối liên
quan giữa hút thuốc và viêm phế Tổng 500 500 1000
quản mãn tính không?
HPV Ung thư cổ tử cung Tổng
3. Một nghiên cứu hồi cứu về mối Có Không
liên quan giữa HPV và ung thư cổ
tử cung. Dữ liệu ược hiển thị trong Có 22 8 30
bảng bên. Có mối liên quan giữa Không 10 50 60
HPV và ung thư cổ tử cung không? Tổng 32 58 90
CÁC CÔNG THỨC TÌNH XÁC SUẤT
1. CÔNG THỨC CỘNG

P(A  B) = P(A) + P(B) – P(AB)

Khi A và B xung khắc thì: P(A  B) = P(A) + P(B)

P(A  B  C) = P(A) + P(B) + P(C) – P(AB) – P(AC) – P(BC) + P(ABC)

Nếu A, B, C xung khắc thì: P(A  B  C) = P(A) + P(B) + P(C)

Nếu A, B, C ộc lập thì :


Ví dụ 1. Một bệnh nhân ến khám răng ược yêu cầu chụp X quang quanh răng
sau. Đặt A là sự kiện bác sĩ Thành, sau khi xem phim X quang, ưa ra chẩn oán
rằng bệnh nhân có tổn thương nghiêm trọng hoặc bệnh lý (tức là chẩn oán dương
tính), và B là sự kiện bác sĩ An ưa ra kết luận dương tính. chẩn oán. Nếu P (A)
= 0,20, P (B) = 0,26; khả năng bác sĩ Thành hoặc bác sĩ An chẩn oán dương tính
là 29% thì xác suất cả hai bác sĩ ều chẩn oán dương tính là bao nhiêu?

Giải:
Xác suất cần tính là:
P(A ∩ B) = P(A) + P(B) - P(A ∪ B) =
Ví dụ 2. Trong một dân số phụ nữ có 4% bị K vú, 20% có hút
thuốc, 3% có hút thuốc và bị K vú. Chọn nn một phụ nữ trong dân
số ó, tính XS người này bị K vú hoặc có hút thuốc hoặc cả hai.
Giải: cần tính P(A + B)
P(A + B) = P(A) + P(B) – P(AB)
=

Ví dụ 3. Tỷ lệ nhóm máu O:A:B:AB trong một dân số theo thứ tự là:


0,42:0,43:0,11:0,04. Chọn ngẫu nhiên một người trong dân số này.
Tính XS người này có nhóm máu O hoặc B?

P(O + B) = P(O) + P(B) – P(OB)


=
Ví dụ 4. Gọi A, B, C là những sự kiện mà bệnh nhân bị viêm nha chu, sâu răng,
và cần iều trị tủy. Giả sử P(A) = 0,25, P(B) = 0,45 và P(C) = 0,60.
(i). A, B, C có xung khắc không?
(ii). P(A hoặc B hoặc C) là gì nếu cả ba ều ộc lập?

Giải
i) P(A) + P(B) + P(C) = 0,25 + 0,45 + 0,60 = 1,30 > 1,0. Tổng của ba xác
suất vượt quá 1,0, như vậy phải có ít nhất một cặp sự kiện xảy ra cùng một
lúc. Ba sự kiện A, B, C không loại trừ lẫn nhau (xung khắc).
(ii) P(A  B  C) = P(A) + P(B) + P(C) - P(A)P(B) - P(A)P(C) - P(B)P(C) +
P(A)P(B)P(C)
=

Hoặc: 𝑃 A ∪ 𝐵 ∪ 𝐶 = 1 − 𝑃 𝐴ҧ ∩ 𝐵ത ∩ 𝐶ҧ = 1 − 𝑃 𝐴ҧ . 𝑃 𝐵 . 𝑃(𝐶)
Gọi A là biến cố bệnh nhân ánh răng ít nhất một lần mỗi ngày, B là biến cố bệnh
nhân ăn thức ăn giàu carbohydrate và C là biến cố bệnh nhân sử dụng kem ánh
răng có chứa fluor. Giả sử P(A) = 0,76; P(B) = 0,15; P(C) = 0,47; P(A ∪ B) = 0,84
và P(B ∩ C) = 0,12. Tính các xác suất P(A ∩ B) và P(B ∪ C).
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃 𝐴 ∪ 𝐵 = 0,76 + 0,15 − 0,84 = 0,07
𝑃 𝐵 ∪ 𝐶 = 𝑃 𝐵 + 𝑃 𝐶 − 𝑃 𝐵 ∩ 𝐶 = 0,15 + 0,47 − 0,12 = 0,5
2. Công thức xác suất có điều kiện
Các xác suất chúng ta ã thảo luận: P(A), P(B), P(E1), P(E2), v.v. ược gọi là
xác suất vô iều kiện. Thường thì xác suất có iều kiện ược các chuyên gia
chăm sóc sức khỏe quan tâm nhiều hơn xác suất vô iều kiện. Nha sĩ và bác sĩ
hỏi về lối sống của bệnh nhân và lịch sử y tế cá nhân và gia ình ể xác ịnh
xác suất có iều kiện. Xét các tình huống sau:
• Nếu một bệnh nhân ã ăn một chế ộ ăn giàu chất béo và cholesterol trong
phần lớn cuộc ời của mình, thì khả năng anh ta bị nhồi máu cơ tim sẽ lớn
hơn nhiều.
• Nếu một nha sĩ biết rằng cả cha và mẹ của bệnh nhân ều mắc phải chứng
khiếm khuyết cơ tạo xương, họ có thể ưa ra một kế hoạch iều trị khác cho
bệnh nhân, dựa trên thực tế là bệnh nhân có nhiều khả năng mắc chứng
khiếm khuyết tạo xương.
• Nếu một bệnh nhân bị tổn thương quanh răng do hậu quả của hoại tử cuống
phổi và bệnh nha chu, nha sĩ sẽ biết rằng bệnh nhân có thể bị nhiễm trùng
răng miệng và khả năng cao là sẽ bị mất răng.
• Nếu một cá nhân ược biết là ã tiếp xúc với môi trường bị nhiễm cúm, thì
khả năng phát triển bệnh cúm của người ó cao hơn so với những người
chưa tiếp xúc.
Công thức xác suất có điều kiện

Ví dụ 1. Chấn thương mô mềm do làm răng giả, nhiễm trùng miệng do


bệnh nha chu và sâu răng ược biết là có nguy cơ phát triển bệnh hoại tử
xương. Gọi A là trường hợp bệnh nhân bị nhiễm trùng miệng do bệnh nha
chu và sâu răng, và B là trường hợp bệnh nhân bị hoại tử xương. Nếu P
(A) = 0,08, P (B) = 0,06 và P (AB) = 0,03, thì xác suất ể một bệnh nhân bị
hoại tử xương là bao nhiêu, khi bệnh nhân bị nhiễm trùng miệng do bệnh
nha chu và sâu răng?
𝑃 𝐵𝐴 𝑃 𝐴𝐵
𝑃(𝐵 Τ𝐴) = = =
𝑃 𝐴 𝑃 𝐴
Ví dụ 2. Gọi C là sự kiện bác sĩ Tấn chẩn oán bệnh nhân mắc bệnh nha chu
cấp tính và D là sự kiện bác sĩ Rạng chẩn oán bệnh nhân bị bệnh nha chu cấp
tính. Nếu P (C) = 0,24, P (D) = 0,20 và P (CD) = 0,16 thì:
a. Xác suất bác sĩ Rạng ưa ra chẩn oán dương tính là bao nhiêu, với iều kiện
bác sĩ Tấn chẩn oán dương tính?
b. Xác suất bác sĩ Tấn chẩn oán dương tính với iều kiện bác sĩ Rạng chẩn
oán dương tính là bao nhiêu?

𝑃 𝐷𝐶 𝑃 𝐶𝐷
𝑎. 𝑃 𝐷 Τ𝐶 = = 𝑏. 𝑃 𝐶 Τ𝐷 = =
𝑃 𝐶 𝑃 𝐷

Ví dụ 3. Bạch sản niêm mạc miệng là một mảng bám màu trắng ược hình
thành trên màng nhầy miệng từ các tế bào biểu mô bề mặt; tình trạng này ược
nghi ngờ là phổ biến hơn ở những người sử dụng thuốc lá nhai. Giả sử A là biến
cố bệnh nhân bị bạch sản, B là biến cố bệnh nhân sử dụng thuốc lá nhai. Nếu P
(B) = 0,06 và P(AB) = 0,02, thì xác suất bệnh nhân bị bạch sản, biết rằng anh ta
nhai thuốc lá, là:
𝑃 𝐴𝐵
𝑃 𝐴Τ𝐵 = =
𝑃 𝐵
3. Công thức nhân xác suất

𝐴 = 𝐵\𝐴

𝑃(𝐴𝐵)
𝑃(𝐵/𝐴) = ⇒ 𝑃(𝐴𝐵) = 𝑃(𝐴). 𝑃(𝐵/𝐴)
𝑃(𝐴)

⇒ 𝑃(𝐴1 𝐴2 𝐴3 ) = 𝑃(𝐴1 ). 𝑃(𝐴2 /𝐴1 ). 𝑃(𝐴3 /𝐴1 𝐴2 )

- Nếu A, B ộc lập thì:


𝑃(𝐴𝐵) = 𝑃(𝐴) × 𝑃(𝐵)
Nếu A1, A2, A3 ộc lập thì

⇒ 𝑃(𝐴1 𝐴2 𝐴3 ) = 𝑃(𝐴1 ) × 𝑃(𝐴2 ) × 𝑃(𝐴3 )


Ví dụ 1. Giả sử trong một cộng ồng dân số D, nồng ộ florua trong nước uống
là 0,7 ến 1,1 ppm. Một nghiên cứu cho thấy rằng một bệnh nhân sống trong một
cộng ồng như vậy có 21% khả năng bị sâu răng. Nghiên cứu cũng chỉ ra rằng sự
kiện các thành viên trong gia ình bị sâu răng là ộc lập với nhau.
Gia ình ông bà C trong D có ​hai cậu con trai sinh ôi khoảng 11 tuổi. Khả năng
ể cả 4 thành viên trong gia ình này ều bị sâu răng là bao nhiêu?
Giải. Gọi B1, B2, B3 và B4 biểu thị các sự kiện mà mỗi thành viên trong số bốn
thành viên trong gia ình ông bà C bị sâu răng tương ứng.
𝑃 𝐵1 𝐵2 𝐵3 𝐵4 = 𝑃 𝐵1 . 𝑃 𝐵2 . 𝑃 𝐵3 . 𝑃 𝐵4 =
Ví dụ 2. Một bệnh nhân bị chảy máu nướu ã ến bác sĩ nội nha và sau ó ến
bác sĩ nha chu ể khám bệnh. Gọi A và B tương ứng là các sự kiện mà bác sĩ nội
nha và bác sĩ nha chu chẩn oán chính xác bệnh nhân là bị viêm nha chu tiến
triển. Nếu P(A) = 0,49 và P(B) = 0,57 thì xác suất ể cả hai người ều chẩn
oán chính xác bệnh nhân bị viêm nha chu tiến triển là bao nhiêu nếu hai sự
kiện A, B ộc lập?
𝑃 𝐴𝐵 = 𝑃 𝐴 . 𝑃 𝐵 =
Ví dụ 3. Có mức cholesterol cao (>320 mg mỗi 100 ml máu) là một trong
những triệu chứng mà một bệnh nhân nam có thể sẽ bị nhồi máu cơ tim.
Gọi A là sự kiện có mức cholesterol cao và B sự kiện bệnh nhân nam bị
nhồi máu cơ tim. Nếu P(A) = 0,14 và P(B| A) = 0,28, khả năng mà một
bệnh nhân nam, những người có mức cholesterol cao, sẽ phát triển
bệnh nhồi máu cơ tim là bao nhiêu?

P(AB) = P(A) · P(B|A) =

Ví dụ 4. Gọi A là sự kiện người chồng dùng chỉ nha khoa răng ít nhất một lần
một ngày và B là sự kiện mà người vợ dùng chỉ nha khoa răng ít nhất một lần
mỗi ngày.
i) Nếu P(A) = 0,45 và P(B) = 0,60 thì có thể nói gì về sự kiện A ∩ B (A và B),
nghĩa là cả hai vợ chồng ều dùng chỉ nha khoa ít nhất một lần một ngày
nếu thói quen dùng chỉ nha khoa của người chồng ộc lập với thói quen
dùng chỉ nha khoa của người vợ?
ii) Nếu P(A) = 0,45; P(B) = 0,60 và P(A ∩ B) = 0,38 thì có thể kết luận gì về
quan hệ của các sự kiện A, B?
i) Nếu thói quen dùng chỉ nha khoa của người chồng ộc lập với thói quen dùng
chỉ nha khoa của người vợ, nghĩa là các sự kiện A và B ộc lập về mặt thống kê,
thì: P(A ∩ B) = P(A)P(B) =
Khả năng cả hai vợ chồng dùng chỉ nha khoa ít nhất một lần một ngày là 0,27.

ii) Nếu có P(A ∩ B) = P(A). P(B) thì A và B là những sự kiện ộc lập.


Nếu P(A ∩ B) ≠ P(A)×P(B), thì A, B là các sự kiện không ộc lập.
Vì P(A)×P(B) = ≠ P(A ∩ B) nên các sự kiện A và B không ộc
lập.
4. Công thức xác suất toàn phần
Thực hiện thí nghiệm E. Gọi Ω = {A1, A2, · · · , An } , trong ó A1, …, An là
nhóm biến cố xung khắc và ầy ủ, gọi K là biến cố có liên quan ến E.
Khi ó, xác suất của E ược tính theo công thức xác suất toàn phần.
𝑛

𝑃 𝐾 = ෍ 𝑃 𝐴𝑖 𝑃 𝐾ห𝐴𝑖
𝑖=1
Ví dụ 1. Có ba loại sâu răng ở trẻ nhỏ (ECC). ECC loại I là mức ộ nhẹ ến
trung bình, ược chứng minh bằng các tổn thương nghiêm trọng riêng biệt liên
quan ến răng hàm và / hoặc răng cửa. ECC loại II là mức ộ trung bình ến
nặng, ược xem như sâu răng cửa hàm trên, có hoặc không có sâu răng hàm và
răng cửa hàm dưới không bị ảnh hưởng. ECC loại III là nặng, bằng chứng là
loại II bao gồm sự liên quan của các răng cửa dưới.
Gọi A1, A2 và A3 là các sự kiện ại diện cho ba loại ECC và B là sự kiện một
ứa trẻ bị nhiễm khuẩn huyết.
Giả sử rằng P(A1) = 0,48, P(A2) = 0,30 và P(A3) = 0,22. Nếu P(B|A1) = 0,009,
P(B|A2) = 0,01 và P(B|A3) = 0,04, thì khả năng một ứa trẻ, dù có bị ảnh hưởng
bởi ECC hay không, bị nhiễm khuẩn huyết là bao nhiêu?
Giải
Các sự kiện A1, A2 và A3 là loại trừ lẫn nhau và ầy ủ.
Bằng cách áp dụng luật xác suất toàn phần:
P(B) = P(A1).P(B|A1) + P(A2).P(B|A2) + P(A3)P(B|A3)
=
Khả năng một ứa trẻ bị nhiễm khuẩn huyết là
Ví dụ 2. Tiêu xương có thể nhìn thấy trong X quang là bằng chứng mạnh
của bệnh nha chu. Gọi A là sự kiện tiêu xương ã xảy ra, gọi B là sự kiện
bệnh nhân mắc bệnh nha chu. Giả sử dữ liệu bệnh nhân từ một phòng
khám nha khoa lớn chỉ ra rằng P(A) = 0,08, P(B| A) = 0,90 và 𝑃(𝐵/𝐴) =
0.05. Xác suất của bệnh nha chu trong dân số bệnh nhân nói chung là ?

𝑃 𝐵 = 𝑃 𝐴 . 𝑃 𝐵/𝐴 + 𝑃 𝐴 . 𝑃(𝐵/𝐴)
=

Ví dụ 3. Gọi A là sự kiện bệnh nhân bị tiểu ường, và B là sự kiện bệnh


nhân bị chậm lành khi nhổ răng. Nếu P(A) = 0,13, P(B| A) = 0,74 và
𝑃(𝐵/𝐴) = 0.2, xác suất bệnh nhân sẽ chậm lành sau khi nhổ răng là ?
𝑃 𝐵 = 𝑃 𝐴 . 𝑃 𝐵/𝐴 + 𝑃 𝐴 . 𝑃(𝐵/𝐴)
Ví dụ 4. Ung thư tuyến tụy hiếm khi có thể chữa khỏi. Nó chỉ chiếm 2% tổng số
ca ung thư mới ược chẩn oán ở Hoa Kỳ mỗi năm, nhưng 5% tổng số ca tử
vong do ung thư. Dữ liệu của Viện Ung thư Quốc gia chỉ ra rằng khả năng sống
sót cao nhất xảy ra nếu khối u thực sự khu trú. Gọi A là trường hợp khối u khu trú
và B là trường hợp bệnh nhân sống sót ít nhất 5 năm. Biết rằng P(A) = 0,20,
P(B|A) = 0,20 và P(B|Ᾱ) = 0,0001. Tỷ lệ sống 5 năm của một bệnh nhân mới
ược chẩn oán mắc bệnh ung thư tuyến tụy là bao nhiêu?
Giải
Vì hai biến cố A và Ᾱ là loại trừ lẫn nhau và P (A) = 0,20 nên P(Ᾱ) = 1 - 0,20 =
0,80.
Sử dụng quy luật xác suất toàn phần, tỷ lệ sống sót sau 5 năm của một bệnh nhân
ung thư tuyến tụy có thể ược biểu thị bằng:
P(B) = P(A).P(B|A) + P(Ᾱ). P(B|Ᾱ) =
5. Công thức Bayes (Reverend Thomas Bayes)
Trong phần trước, ã chỉ ra sự khác biệt giữa
P(B|A) và P(A|B). Xác suất có iều kiện P(B|A)
có thể tính ược nếu biết P(AB) và P(A). Nếu
P(AB) và P(A) chưa biết thì có thể tính ược xác
suất có iều kiện P(B|A) không?
Định lý Bayes, sẽ giải quyết câu hỏi này.
Sau ây là những ví dụ về các câu hỏi thực tế
mà các bác sĩ lâm sàng trong nha khoa và y học
thường hỏi:
- Xác suất một người mắc bệnh là bao nhiêu, nếu kết quả xét nghiệm
dương tính?
- Xác suất một người không mắc bệnh là bao nhiêu, nếu kết quả xét
nghiệm là âm tính?
- Nếu bệnh nhân bị viêm nha chu thì khả năng bị viêm nha chu cấp tính là
bao nhiêu?
- Nếu bệnh nhân không có dấu hiệu viêm nha chu thì khả năng không bị
viêm nha chu cấp tính là bao nhiêu?
𝑃(𝐴𝑖 ). 𝑃(𝐾/𝐴𝑖 ) 𝐵 3
𝑃(𝐴𝑖 /𝐾) = → 𝑃(𝐵) = =
𝑃(𝐾) Ω 4

Ví dụ 1. Bất cứ khi nào phải ưa ra quyết ịnh thực hiện iều trị nội nha trên răng
hay nhổ răng, iều quan trọng là phải hiểu rõ về xác suất thành công hay thất bại
trong các trường hợp nhất ịnh, chẳng hạn như loại răng, tuổi của bệnh nhân, tủy
còn sống hoặc ã bị hoại tử, có hoặc không có hiếm gặp quanh răng, viêm quanh
răng cấp tính hoặc mãn tính, v.v., ặc biệt khi răng ược sử dụng làm trụ trong
phục hình nhiều răng phức tạp. Gọi A là biến cố tủy răng bị hoại tử, S và F là các
biến cố thành công và thất bại của một iều trị nội nha. Nếu bệnh nhân có tủy
răng bị hoại tử, khả năng thất bại của iều trị nội nha là 0,16, và nếu bệnh nhân
không có tủy răng bị hoại tử thì khả năng thất bại là 0,04. Giả sử có khoảng 10%
bệnh nhân bị hoại tử tủy. Trong số những bệnh nhân iều trị nội nha không thành
công, tỷ lệ bệnh nhân sẽ bị hoại tử tủy?

𝑃 𝐹 = 𝑃 𝐴 . 𝑃(𝐹/𝐴) + 𝑃(𝐴). 𝑃(𝐹/𝐴 )


𝑃 𝐴 . 𝑃 𝐹 Τ𝐴
𝑃 𝐴Τ𝐹 =
𝑃 𝐹
Ví dụ 2. Tỷ lệ hút thuốc lá trong một dân số D là 11%. Một NC trong D cho
biết XS K phổi trong số những người hút thuốc là 34% và trong số những
người không hút thuốc là 3%. Khám ngẫu nhiên một người thấy người này
không bị K phổi. Tính XS người này không hút thuốc.

Giải: Gọi A là biến cố hút thuốc lá, K là biến cố bị K phổi

𝑃(𝐴) = 0,11 𝑃(K/ 𝐴) = 0,34; P( K/ 𝐴) = 0,03

𝑃(𝐾) = 𝑃(𝐴) × 𝑃(K/ 𝐴) + P( 𝐴) × P( K/ 𝐴)

𝑃(𝐴) × 𝑃(𝐾/𝐴)
𝑃(𝐴/𝐾) =
𝑃(𝐾)
Ví dụ 3. Ở bệnh viện X, tỷ lệ bệnh A, B, C tương ứng là 50%, 30%,
20%. XS ể chữa khỏi bệnh A, B, C tương ứng là 0,7; 0,8; 0,9. Tính
XS chữa khỏi bệnh A, B, C trong số bệnh nhân ược chữa khỏi bệnh.

Gọi K là biến cố khỏi bệnh


𝑃(𝐾) = 𝑃(𝐴) × 𝑃(K/ 𝐴) + P( B) × P( K/B) + P( C) × P( K/C)

𝑃(𝐴) × P( K/A)
𝑃(𝐴/𝐾) = =
𝑃(𝐾)

𝑃(B) × P( K/B)
𝑃(B/ 𝐾) = =
𝑃(𝐾)

𝑃(C) × P( K/C)
𝑃(C/ 𝐾) = =
𝑃(𝐾)
Ví dụ 4. Một bệnh nhân nam 40 tuổi bị căng thẳng và hút một bao thuốc mỗi ngày. Khi
khám răng ịnh kỳ, người ta tìm thấy những mảng trắng trên niêm mạc miệng. Bệnh nhân
nhận thức ược tình trạng bệnh, nhưng không có triệu chứng nào xuất hiện. Nha sĩ ã
quan tâm và làm sinh thiết niêm mạc miệng. Gọi:
A = White patches on the buccal mucosa (Các mảng trắng trên niêm mạc).
B1 = Lichen planus ( ược ặc trưng bởi các sẩn tái phát, ngứa, a giác, bề mặt phẳng, và
hơi tím và có thể kết hợp lại thành mảng); B2 = Hairy leukoplakia (Bạch sản niêm mạc
miệng, dạng lông); B3 = Focal hyperkeratosis (Tăng sừng khu trú); B4 = Follicular
keratosis (Dày sừng nang lông); B5 = White spongy nevus (là tình trạng ặc trưng bởi sự
hình thành các mảng mô màu trắng gọi là nevi (số ít: nevus) xuất hiện dưới dạng mô dày,
mịn như bọt biển. Các nevi thường ược tìm thấy trên niêm mạc miệng, ặc biệt là ở mặt
trong của má); B6 = Bình thường, lành tính.
Sự kiện A ại diện cho triệu chứng và các sự kiện B1, B2, · · ·, B6 là các trạng thái bệnh
loại trừ lẫn nhau và toàn bộ.
Nếu P(B1) = 0,24, P(B2) = 0,17, P(B3) = 0,19, P(B4) = 0,11 và P(B5) = 0,17, giả sử P(A|B1)
= 0,09, P(A|B2) = 0,12, P(A|B3) = 0,15, P(A|B4) = 0,21, P(A|B5) = 0,27 và P(A|B6) = 0,03.
Đối với bệnh nhân 40 tuổi và có mảng trắng trên niêm mạc miệng, bệnh nào trong 6 trạng
thái bệnh dễ xảy ra nhất?
𝑃 𝐴 = 𝑃 𝐵1 . 𝑃 𝐴/𝐵1 + ⋯ . +𝑃 𝐵6 . 𝑃(𝐴/𝐵6 ) =

𝑃 𝐵1 . 𝑃 𝐴/𝐵1
𝑃 𝐵1 /𝐴 = =
𝑃 𝐴

𝑃 𝐵5 . 𝑃 𝐴/𝐵5
𝑃 𝐵5 /𝐴 = = Oral leukoplakia
𝑃 𝐴

Trong ví dụ này, với các triệu chứng của các mảng trắng trên niêm mạc, trạng
thái bệnh B6 có nhiều khả năng xảy ra nhất với xác suất 0,3208.
Bài 1. Tỷ lệ bệnh D trong dân số là 0,002. Dùng xét nghiệm T, ể
chẩn oán bệnh D, có tính chất như sau: Tỷ lệ T dương tính ối với
những người có bệnh D (dương thật) là 0,95, tỷ lệ T dương tính ối
với những người không có bệnh D (dương giả) là 0,02. Chọn ngẫu
nhiên một người trong dân số ó có kết quả xét nghiệm T dương
tính, tính xác suất người này bị bệnh D.
Bài 2. Điều trị tương ứng phương pháp 1, 2, 3 cho 5000, 3000 và
2000 bệnh nhân. Xác suất khỏi của các phương pháp tương ứng
bằng 0,85; 0,9 và 0,95.
a) Tìm xác suất khỏi của ba phương pháp khi iều trị riêng rẽ từng
phương pháp cho bệnh nhân.
b) Điều trị một trong ba phương pháp cho bệnh nhân ã khỏi, tìm
tỷ lệ iều trị của từng phương pháp.
c) Tìm xác suất khỏi khi iều trị phối hợp ba phương pháp cho
bệnh nhân.
Bài 3. Tỷ lệ bệnh B tại một ịa phương bằng 0,05. Để chẩn oán bệnh
B người ta dùng xét nghiệm T có tính chất như sau: nếu người bị bệnh
B thì xét nghiệm dương tính 95%; nếu người không bị bệnh B thì xét
nghiệm cũng dương tính (dương giả) 10%.
a) Tìm xác suất dương tính xét nghiệm T.
b) Một người ược chỉ ịnh làm xét nghiệm T có kết quả dương tính,
tìm xác suất sao cho ó là người bị bệnh.
c) Tìm xác suất chẩn oán úng của xét nghiệm T.

Bài 4. Tại một ịa phương tỷ lệ bị bệnh B bằng 0,03. Dùng một xét
nghiệm T giúp chẩn oán, nếu T dương tính thì khả năng bị bệnh là
20%; nếu xét nghiệm T âm tính thì khả năng bị bệnh 2%.
a) Tìm xác suất dương tính của xét nghiệm T.
b) Tìm ộ nhạy, ộ chuyên của xét nghiệm T.
c) Tìm xác suất sai của xét nghiệm T.
ỨNG DỤNG CỦA XS TRONG CHẨN ĐOÁN
1. Mở ầu
XS tiền nghiệm, Xác suất hậu nghiệm
2. Độ chính xác của một xét nghiệm
- Khái niệm ộ nhạy (sensitivity= sn) = P(T+/B+)
- Khái niệm ộ chuyên (specificity = sp) = P(T-/B-)
- Dương giả (False positive = fp) = P(T+/B-)
- Âm giả (False negative = fn) = P(T-/B+)
- Cách xác ịnh các giá trị
Xét nghiệm Bệnh B Tổng
T B+ B-
T+ a b a+b
T- c d c+d
Tổng a+c b+d N = a+b+c+d
𝑎
𝑠𝑛 = 𝑃(𝑇 + / B+ ) =
𝑎+𝑐 𝑓𝑝 = 1 − 𝑠𝑝
𝑑
𝑠𝑝 = 𝑃(𝑇 − / B− ) = 𝑓𝑛 = 1 − 𝑠𝑛
𝑏+𝑑
Ví dụ 1. (tiên lượng bệnh nhồi máu cơ tim: NMCT).
Phân tích troponin trên 718 b/n nghi ngờ NMCT ể ánh giá ộ
chính xác của protein troponin trong việc tiên lượng bệnh NNCT.
Chẩn oán cuối cùng b/n có bị NMCT hay không do 2 bs chuyên
khoa tim mạch xác ịnh một cách ộc lập với kết quả troponin
theo bảng sau:

KQ XN Kết quả chẩn oán Tổng cộng


troponin B+ B-
T+ 102 42 144
T- 21 553 574
Tổng cộng 123 595 718

Xác ịnh ộ nhạy, ộ chuyên, dương giả, âm giả của XN troponin


Ví dụ 2. Các nhân viên tại một phòng khám
nha khoa của trường ại học ã sàng lọc 220
bệnh nhân mắc bệnh nha chu cấp tính. Sau
ó, một cuộc kiểm tra cẩn thận hơn ã ược
ưa ra bởi bác sĩ nha chu. Kết quả của cuộc
kiểm tra nha chu chỉ ra rằng 45 là dương tính
thực sự, 14 âm tính giả, 26 dương tính giả,
135 âm tính thật. Tính tỷ lệ dương tính giả,
âm tính giả, ộ nhạy và ộ ặc hiệu.

Ví dụ 3. Vi khuẩn Streptococcus mutans ược xem là một tác nhân chính gây sâu
răng. Trẻ em có xu hướng nhiễm vi khuẩn này trong ộ tuổi khoảng 1 ến 3 tuổi.
Một kỹ thuật chẩn oán mới ể phát hiện vi khuẩn Streptococcus mutans ã ược
giới thiệu. Nhà sản xuất tuyên bố rằng tỷ lệ ộ nhạy và ộ ặc hiệu của kỹ thuật
này ít nhất là 95%. Để xác minh tuyên bố, một cuộc khảo sát thử nghiệm ã khảo
sát 200 mẫu có S.mutans và 150 mẫu không có S.mutans. Kỹ thuật mới ã chỉ ra
chính xác rằng 191 trong số 200 mẫu chứa S. mutans và 143 trong số 150 mẫu
không chứa S. mutans nào. Dữ liệu này có khẳng ịnh ược tuyên bố của nhà sản
xuất là úng không?
Ví dụ 4. Một nghiên cứu ã ược thực hiện về hiệu quả của sinh thiết bàn chải
như một công cụ sàng lọc ể phát hiện bệnh ác tính trong các tổn thương niêm
mạc miệng.
Là một phần của cuộc iều tra này, 96 tổn thương ã ược kiểm tra bằng sinh
thiết bàn chải OralCDx và mô bệnh học “tiêu chuẩn vàng” (Scheifele và cộng sự
2004). Đối với sinh thiết bàn chải, các tổn thương ược phân loại thành “dương
tính với loạn sản”, “không iển hình” (ít chắc chắn hơn) hoặc “âm tính”. Các
loại “dương tính” và “không iển hình” ược kết hợp ể tạo thành nhóm xét
nghiệm sàng lọc dương tính. Kết quả từ xét nghiệm sàng lọc và kết quả mô học
ược thể hiện trong Bảng.
Độ nhạy của xét nghiệm sàng lọc là tỷ lệ tổn thương trong số những tổn thương
ược ánh giá là ác tính trên mô bệnh học có kết quả tầm soát dương tính. Trong
số 26 tổn thương là ác tính theo mô bệnh học, 24 có kết quả sàng lọc dương tính.
Do ó, ộ nhạy của xét nghiệm sàng lọc là 24/26 (92,3%).
Độ ặc hiệu của xét nghiệm sàng lọc là tỷ lệ tổn thương trong số những tổn
thương ược ánh giá là không ác tính theo mô bệnh học có kết quả tầm soát âm
tính. Trong số 70 tổn thương không phải ác tính theo mô bệnh học, 66 có kết quả
sàng lọc âm tính. Do ó, ộ ặc hiệu của thử nghiệm sàng lọc là 66/70 (94,3%).
2. Giá trị tiên oán (Predictive Value = PV) (XS hậu nghiệm)
- Giá trị tiên oán dương: 𝑃𝑉 + = 𝑃(𝐵+ /𝑇 + )
- Giá trị tiên oán âm: 𝑃𝑉 − = 𝑃(𝐵− /𝑇 − )

a. Phương pháp Bayes


−1 −1
+
1 − 𝑃(𝐵 + ) 1 − 𝑠𝑝 −
𝑃(𝐵 + ) 1 − 𝑠𝑛
𝑃𝑉 = 1 + × 𝑃𝑉 = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛 1 − 𝑃(𝐵 + ) 𝑠𝑝

Ví dụ 1. Chẩn oán thai dị tật


Một bà 27 tuổi, có thai 17 tuần, bị bệnh tiểu ường phụ thuộc Insulin ã 5
năm, ến khám về sản khoa. Trong ba tháng ầu của thai kỳ, bà ta không
kiểm soát ược ường huyết, cứ cao hơn 200 mg%. Bà nghe nói trong ba
tháng ầu thai kỳ mà không kiểm soát ược ường huyết thì thai dễ bị dị
tật với tỷ lệ 20 - 30%. Bà ã làm XN SAF (Maternal, Serum Alpha
Foetoprotein) thấy dương tính. XN này có sn = 34% và sp = 86%
- K/n bà này có thai bị dị tật là bao nhiêu?
- Có nên cho làm siêu âm không? Vì siêu âm có sn = 56% và sp = 99,5%?
Khả năng thai bị dị tật khi XN SAF (T1) dương tính:

+) −1
1 − 𝑃(𝐵 1 − 𝑠𝑝
𝑃𝑉 + = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛

Làm tiếp siêu âm (T2) Nếu T2 cũng dương tính thì


−1
+
1 − 𝑃(𝐵 + ) 1 − 𝑠𝑝
𝑃𝑉 = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛
Ví dụ 2. Tỷ lệ bệnh B trong dân số là 0,02. Dùng XN T, ể chẩn oán
bệnh B, có tính chất như sau: Tỷ lệ T+ ối với những người có bệnh B
là 0,95, ối với những người không có bệnh B là 0,03. Chọn ngẫu nhiên
một người trong dân số ó có T+, tính XS người này bị bệnh B.

+ −1
1 − 𝑃(𝐵 ) 1 − 𝑠𝑝
𝑃(𝐵 + /𝑇 + ) = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛

Giả sử một người có XN T âm tính thì khả năng không bị bệnh?

+) −1
𝑃(𝐵 1 − 𝑠𝑛
𝑃(𝐵 − /𝑇 − ) = 1 + ×
1 − 𝑃(𝐵 + ) 𝑠𝑝
Ví dụ 3. Tỷ lệ bệnh B tại một ịa phương bằng 0,05. Để chẩn oán bệnh
B người ta dùng XN T có tính chất như sau: nếu người bị bệnh B thì T+
là 95%; nếu người không bị bệnh B thì T+ là 10%.
1) Một người ược chỉ ịnh làm XN có T+, tìm XS người ó bị bệnh B.
2) Tìm XS chẩn oán úng của T.

+) −1
1 − 𝑃(𝐵 1 − 𝑠𝑝
1. 𝑃(𝐵 + /𝑇 + ) = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛

2. 𝑃(𝐷) = 𝑃(𝑇 + 𝐵+ ) + 𝑃(𝑇 − 𝐵− )

= 𝑃(𝐵 + ). 𝑃(𝑇 + /𝐵+ ) + 𝑃(𝐵 − ). 𝑃(𝑇 − /𝐵− )


Bài tập. Bệnh B có tỷ lệ lưu hành 20% trong cộng ồng dân
số D. Để chẩn oán bệnh B người ta dùng 2 XN T1 (sn =
90%, sp = 0,95) và T2 (sn = 0,95; sp = 095).
1. Ông X trong D ến khám bệnh. Bs cho thực hiện liên tiếp
2 XN và ều có kết quả dương tính. Tính khả năng bị
bệnh B.
2. Ông Y trong D ến khám bệnh. Bs chỉ ịnh liên tiếp 2 XN
có kết quả T1 dương tính và T2 âm tính. Tính khả năng bị
bệnh B.
Chú ý: Công thức Bayes còn dùng ể biện luận các giá trị tiên oán
−1
+ + +
1 − 𝑃(𝐵 + ) 1 − 𝑠𝑝
𝑃𝑉 = 𝑃(𝐵 /𝑇 ) = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛

+) −1
𝑃(𝐵 1 − 𝑠𝑛
𝑃𝑉 − = 𝑃(𝐵− / T − ) = 1 + ×
1 − 𝑃(𝐵 + ) 𝑠𝑝

Đối với một bệnh nhất ịnh thì P(B+) cố ịnh:


- Giữ sn cố ịnh, thì PV+ tăng khi sp tăng. Khi sp → 1 thì PV+ → 1
- Giữ sp cố ịnh, thì PV- tăng khi sn tăng. Khi sn → 1 thì PV- → 1

Đối với một xét nghiệm nhất ịnh thì sn và sp cố ịnh :


- PV+ tăng khi P(B+) tăng. Khi P(B+)→ 1 thì PV+ → 1
- PV- tăng khi P(B+) giảm. Khi P(B+)→ 0 thì PV- → 1
b. Phương pháp cây quyết ịnh
Ví dụ Bệnh B có tỷ lệ lưu hành trong cộng ồng D là 20%. Để chẩn oán
bệnh B, bs dùng XN T có sn = 90% và sp= 95%.
- Ông X trong D ến khám bệnh và có T+. Tính XS ông X bị bệnh B.
- Bà Y trong D ến khám bệnh và có T-. Tính XS bà Y không bị bệnh B.
Bước 1: Vẽ cây quyết ịnh và gán giá trị XS trên mỗi nhánh cây và tính
XS ầu cành.

T+ = 0,9
0,18
B+ = 0,2
T- = 0,1 0,02
Bệnh B T+ = 0,05 0,04

B- = 0,8 T- = 0,95
0,76
XS XN T+ = 0,18 + 0,04 = 0,22 (cộng ở cành T+)
XS XN T- = 0,02 + 0,76 = 0,78 (cộng ở cành T-)
- XS ông X bị bệnh B khi T+ là:
𝑃𝑉 + = 𝑃(𝐵 + /𝑇 + ) = 0,18: 0,22 = 0,818
- XS bà Y không bị bệnh B khi T- là:
𝑃𝑉 − = 𝑃(𝐵 − /𝑇 − ) = 0,76:0,78 = 0,974
c. Phương pháp tỷ cơ hội (Likelihood Ratio = LR)
Gọi p là khả năng xảy ra của
𝑝 b/c B
Số chênh của B: 𝑜𝑑𝑑 = 1 − 𝑝

tỉ cơ là tỉ số về kết quả XN
• Khái niệm tỷ cơ hội +
𝑠𝑛 đối với người mắc bệnh và
𝐿𝑅 =
- Nếu XN T+ thì 1 − 𝑠𝑝 kết quá đó đối với người
không mắc bệnh.
1 − 𝑠𝑛
- Nếu XN T- thì 𝐿𝑅 − =
𝑠𝑝
𝑃(𝐵 + )
• Khái niệm tỷ số tiền nghiệm odd( B + ) =
𝑃(𝐵 − )

• Khái niệm tỷ số hậu nghiệm


+ + + + +
- Nếu T+ thì odd( posttest ) = odd( B / T ) = 𝑜𝑑𝑑(B ) × 𝐿𝑅 = 𝑥

- Nếu T- thì odd( posttest − ) = odd( B + / T − ) = 𝑜𝑑𝑑(B + ) × 𝐿𝑅− = 𝑦


+ +
𝑥+ − − −
1
𝑃𝑉 = 𝑃(𝐵 /𝑇 ) = 𝑃𝑉 = 𝑃(𝐵 /𝑇 ) =
1+𝑥 1+𝑦

Chú ý: Nếu thực hiện liên tiếp nhiều XN T1, T2, … thì:
𝑜𝑑(posttest + ) = od( B + ) . 𝐿𝑅1+ . 𝐿𝑅2+ . . . . 𝐿𝑅𝑛+

Ví dụ 1. Bệnh B có tỷ lệ lưu hành 20% trong cộng ồng dân số D. Để


chẩn oán bệnh B người ta dùng 2 XN T1 (sn = 90%, sp = 0,95) và T2
(sn = 0,95; sp = 095).
1. Ông X trong D ến khám bệnh. Bs cho thực hiện liên tiếp 2 XN và
ều có kết quả dương tính. Tính khả năng bị bệnh B.
2. Ông Y trong D ến khám bệnh. Bs chỉ ịnh liên tiếp 2 XN có kết quả
T1 dương tính và T2 âm tính. Tính khả năng bị bệnh B.
+
𝑃(𝐵 + )
odd( B ) = =
𝑃(𝐵 − )
𝑠𝑛1 𝑠𝑛2
𝐿𝑅1+ = = 𝐿𝑅2+ = =
1 − 𝑠𝑝1 1 − 𝑠𝑝2

1 − 𝑠𝑛2
𝐿𝑅2− = =
𝑠𝑝2

1. odd( posttest + ) = 𝑜𝑑𝑑(B +) × 𝐿𝑅1+ × 𝐿𝑅2+ = ⋯ … … … … … … … … … … … . = 𝑥

𝑥
𝑃𝑉 + = 𝑃(𝐵 + /𝑇 + ) = =
1+𝑥

2. odd( posttest + ) = 𝑜𝑑𝑑(B +) × 𝐿𝑅1+ × 𝐿𝑅2− = ⋯ … … … … … … … … … … … . = 𝑥

𝑥
𝑃𝑉 + = =
1+𝑥
Chú ý:
Đối với các XN có kết quả là trị số liên tục thì PP tỷ cơ hội có giá
trị tiên oán chính xác hơn các PP khác.
Chẳng hạn, ối với một XN có 3 mức:
Ví dụ 2. Một ứa trẻ bị sốt 39,50C trong 2 ngày và không có dấu
hiệu gì khác ến khám. BS nghi ngờ bé bị nhiễm trùng máu với
XSTN 4% và cho bé làm XN máu có b/c = 36000/mm3. Khả năng
bị nhiễm trùng máu là bao nhiêu nếu chia XN thành 2 mức (cutoff
= 15000/mm3) ?

55 177
𝑠𝑛 = = 0,916; 𝑠𝑝 = = 0,391
60 452

+) −1
1 − 𝑃(𝐵 1 − 𝑠𝑝
𝑃(𝐵 + /𝑇 + ) = 1 + ×
𝑃(𝐵 + ) 𝑠𝑛
Nếu chia XN thành nhiều mức
+
𝑃(𝐵 + )
odd( B ) = =
𝑃(𝐵 − )

odd( posttest + ) = 𝑜𝑑𝑑(B + ) × 𝐿𝑅 +

= ⋯……………………..= 𝑥

𝑥
𝑃𝑉 + = 𝑃(𝐵 + /𝑇 + ) =
1+𝑥

Ý nghĩa của LR

- Nếu LR+ > 1 : XN tốt


- Nếu LR+ < 1: XN không tốt
- Nếu LR = 1: XN vô dụng
Tương tự cho LR-
LR+ càng cao thì k/n mắc bệnh càng cao, LR- càng nhỏ thì k/n không mắc
bệnh càng cao.
3. MÔ HÌNH NGƯỠNG
Sau khi khám bệnh cho 1 người, BS ã có một tiên oán về k/n
mắc bệnh của người ó, ký hiệu P(B+).
P(B+) ược ưa ra trên cơ sở nào?
Căn cứ vào P(B+), bs thường phải lựa chọn quyết ịnh:
- Trì hoãn, không can thiệp gì.
- Chỉ ịnh thêm các XN trước khi quyết ịnh iều trị hay không.
- Cho iều trị ngay
Để giải quyết các tình huống này, năm 1980 Pauker và Kassier
ưa ra mô hình ngưỡng P-K.
Tại một thời iểm, XS bệnh B nằm trong oạn [0, 1]
Ví dụ. Trong mô hình ngưỡng P-K, chọn ngưỡng XN là Tt = 0,25 và Tɣ
= 0,7. BS chẩn oán anh M trong D có bệnh B, cho M làm XN T1. Nếu
T1 dương tính thì cho iều trị, nếu T1 âm tính thì không iều trị. Bs
quyết ịnh như vậy có úng không? Tại sao?

Bs cho làm XN là úng

Bs không cho làm XN là úng

Bs cho iều trị là úng.


Chú ý: Ngưỡng Tt và TƔ có thể xác ịnh như sau:
−1 −1
𝐵 𝐵
𝑇𝑡 = 1 + . LR+ 𝑇𝛾 = 1 + . LR−
𝑅 𝑅

Trong ó: R (Risk) là tỷ lệ rủi ro nếu chỉ ịnh Test và B (Benefits) là tỷ


lệ lợi ích nếu chỉ ịnh Test.
4. ỨNG DỤNG ĐƯỜNG CONG ROC TRONG Y HỌC
4.1. Khái niệm về ường cong Roc (Receiver Operating
Characteristic)
Nguồn gốc của ROC: LT phát tín hiệu
Từ 1970, LT này ược dùng ể phân tích các kết quả XN y học.

Mỗi iểm trên ường cong ROC có tọa


ộ (sn; 1-sp)
Đường cong ROC càng lệch về phía
trên bên trái thì sự khác biệt giữa 2
trạng thái càng rõ.
Độ chính xác của một XN ược xác
ịnh bằng diện tích dưới ường cong
ROC như sau:
Từ 0,8 - 0,9: XN tốt (A)
Từ 0,6 - 0,7: XN tạm ược (B)
Từ 0,5 - 0,6: XN không có giá trị (C)
4. 2. Xác ịnh iểm cắt (cut off)
Trong các XN chẩn oán bệnh, ường cong ROC ược dùng ể xác
ịnh iểm cắt của các biến ịnh lượng có giá trị phân biệt hai trạng thái
(bệnh/không bệnh, dương tính/âm tính) tốt nhất, tức là tìm ngưỡng có
ộ nhạy và ộ chuyên cao nhất.
Ví dụ: Để phân biệt viêm phổi do vi trùng hay do virus, người ta o
nồng ộ CRP (mg/l) (C -Reactive Protein) trong máu và tìm iểm cắt
ể chẩn oán.
Gọi B+ là b/c viêm phổi do vi trùng và B- là b/c viêm phổi do virus. Ta
có bảng số liệu sau:

Đặt các XN Ti ể chẩn oán như sau: Ti dương tính nếu CRP >
ci và âm tính nếu ngược lại. Chọn ci = 1, 5, 9, 13, 17, 21
Dùng chỉ số Youden (ký hiệu J) ể xác ịnh nồng ộ CRP nào có ộ
nhạy và ộ chuyên cao nhất, với J = max(sn + sp - 1). Như vậy, cần
chọn sn và sp sao cho J lớn nhất

CRP sn sp 1-sp J
1 1 0 1 0
5 0,9 0,6 0,4 0,5
9
13
17
21

Vậy chọn CRP = là iểm cắt vì tại ây, chỉ số J lớn nhất tương
ứng với ộ nhạy sn = ……. và ộ chuyên sp = ………..
Ñöôøng cong ROC chaån ñoaùn vieâm phoåi do vi truøng hay virus

1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


1 - Specificity
Area under ROC curve = 0.7750
Sau khi có iểm cắt ta có bảng sau:
B+ B- Tổng
T+ (CRP > 9) 8 2 10
T- (CRP < 9) 2 8 10
Tổng 10 10 20
4. 3. So sánh ộ nhạy và ộ chuyên của 2 test chẩn oán
Để so sánh ộ nhạy và ộ chuyên của  2 tests chẩn oán ta so sánh
diện tích dưới ường cong ROC. Test nào có diện tích dưới ường
cong ROC lớn nhất sẽ có giá trị cao nhất trong chẩn oán. Diện tích
này chính là tích phân của hàm y (sn) theo x (1-sp) với x  [0; 1]
Ví dụ: Dùng xét nghiệm nào trong 3 XN: WBC, CRP, Procalcitonin ể
chẩn oán viêm phổi. Số liệu trong bảng sau:
WBC 6 11 8 9 12 8 11 10 15 12 14 11 10 9 10 17 12 13 14 15 16 8 12 9 19 11 12 10 10 9
CRP 5 6 7 8 97 9 6 11 8 9 15 8 4 5 10 11 12 8 11 6 12 16 12 30 28 8 9 10 8
Procalcitonin 3 2 3 4 24 6 3 2 6 3 4 5 4 2 7 8 9 3 9 12 8 12 8 11 10 4 5 6 22
Sepsis 0 0 0 0 00 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Löïa choïn xeùt nghieäm toát nhaát baèng ñöôøng cong ROC
1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


1-Specificity

wbc ROC area: 0.6867 crp ROC area: 0.8044


procalcitonin ROC area: 0.9222 Reference
cutpoint Sensitivity 1- Specificity Specificity J
1.00 1.000 1.000 0.000 0.000
2.50 1.000 .733 0.267 0.267
3.50 .933 .467 0.533 0.467
4.50 .867 .200 0.800 0.667
5.50 .800 .133 0.867 0.667
6.50 .733 0.000 1.000 0.733
7.50 .667 0.000 1.000 0.667
8.50 .467 0.000 1.000 0.467
9.50 .333 0.000 1.000 0.333
10.50 .267 0.000 1.000 0.267
11.50 .200 0.000 1.000 0.200
17.00 .067 0.000 1.000 0.067
23.00 0.000 0.000 1.000 0.000
Löïa choïn xeùt nghieäm toát nhaát baèng cong ROC toát nhaát
1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


1 - Specificity
Area under ROC curve = 0.9422
BT: Tỷ lệ bệnh B trong vùng D là 0,05. Để chẩn oán bệnh B
người ta dùng XN T có tính chất như sau: nếu người bị bệnh B
thì T+ là 95%; nếu người không bị bệnh B thì T+ là 10%.
1) Ông M trong D ến khám, BS chỉ ịnh làm XN có T+, tìm XS
ông M bị bệnh B.
2) Bà N trong D ến khám, BS chỉ ịnh làm XN có T-, tìm XS bà
N không bị bệnh B.
−1
+ + +
1 − 𝑃(𝐵+ ) 1 − 𝑠𝑝
𝑃(B / 𝑇 ) = 𝑃𝑉 = 1 + ×
𝑃(𝐵+ ) 𝑠𝑛

+ −1
𝑃(𝐵 ) 1 − 𝑠𝑛
𝑃(𝐵 − /𝑇 − ) = 𝑃𝑉 − = 1 + ×
1 − 𝑃(𝐵 + ) 𝑠𝑝
BIẾN SỐ NGẪU NHIÊN
1. Định nghĩa
Là kết cục của các TN ngẫu nhiên mà giá trị của nó thuộc tập số
nguyên hoặc số thực.
2. Phân loại: có 2 loại
- Bsnn rời rạc: X có giá trị là số nguyên Z
- Bsnn liên tục: X có giá trị là số thực R.
Ví dụ:
- Nhịp tim, số bc/1mm3,
- Lượng cholesterol, acid uric, huyết áp, lượng thuốc gây mê, thời
gian lành vết thương.
3. Hàm mật ộ xác suất
a. Nếu X là bsnn rời rạc
- Hàm m xs thể hiện trong bảng PPXS:
𝑝𝑖 , X = x𝑖
𝑓(𝑥) = ቊ
0, 𝑋 ≠ 𝑥𝑖
X x1 x2 … xk
p p1 p2 … pk
Tính chất của hàm m xs: 𝑓(𝑥) ≥ 0 ෍ 𝑓(𝑥) = ෍ 𝑝𝑖 = 1

b. Nếu X là bnn liên tục: f(x) là hàm m xs của X nếu f(x) thỏa mãn:
+∞
𝑓(𝑥) ≥ 0
න 𝑓(𝑥)𝑑𝑥 = 1 1 2 /2
𝑓(𝑥) = 𝑒 −𝑥
−∞ 2𝜋

1 2 /2𝜎2
𝑓(𝑥) = 𝑒 (𝑥−𝜇)
𝜎 2𝜋
3. Các ặc trưng của biến số ngẫu nhiên
a. Kỳ vọng (trung bình): µ = E(X)

෍ 𝑋𝑖 × 𝑝𝑖 ; 𝑋 ∈ 𝑍
𝑖
𝜇 = 𝐸(X) = +∞

න 𝑥𝑓(𝑥)𝑑𝑥; 𝑋 ∈ 𝑅
−∞

• Tính chất của kỳ vọng:


E(c) = c
E(cX) = cE(X)
E(X+Y) = E(X) + E(Y)
E(X.Y) = E(X).E(Y) nếu X và Y ộc lập
• Ý nghĩa của kỳ vọng: Phản ánh giá trị trung tâm của PPXS.
Ví dụ 1. Một hộp có 10 bi (7 ỏ và 3 trắng), lấy nn 1 bi. Nếu ược bi ỏ
thì phạt 4500 Usd, nếu ược bi trắng thì thưởng 10000 Usd. Hỏi có
nên tham gia trò chơi này nhiều lần hay không
Gọi X là số tiền thu ược sau mỗi lần chơi:
X = {-4500; 10000}
Ta có bảng PPXS
X -4500 10000
p 0,7 0,3

𝜇 = 𝐸(𝑋) = ෍ 𝑋𝑖 × 𝑝𝑖 =
Ví dụ 2: Xét bnn X có PPXS ều như sau:

𝜇 = 𝐸(𝑋) =
b. Phương sai:
Phản ánh mức ộ phân tán của các giá trị quan sát xung quanh giá trị
trung bình, ký hiệu 2= D(X)

෍(𝑋𝑖 − 𝜇)2 × 𝑝𝑖 ; 𝑋 ∈ 𝑍
𝑖
𝜎 2 = 𝐷(X) = 𝐸(𝑋 − 𝜇)2 = +∞

න (𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥; 𝑋 ∈ 𝑅
−∞

𝜎 2 = 𝐷(X) = 𝐸(𝑋 − 𝜇)2 = 𝐸(𝑋 2 − 2𝜇𝑋 + 𝜇2 )

= 𝐸(𝑋 2 ) − 2𝜇𝐸(𝑋) + 𝜇2 = 𝐸(𝑋 2 ) − 𝜇2

𝐸(𝑋 2 ) = ෍ 𝑋𝑖 2 × 𝑝𝑖
Ví dụ: Tỷ lệ bệnh B trong dân số D là 20%. Khám ngẫu nhiên 3 người
trong D, gọi X là số người bị bệnh B trong 3 người ược khám. Tìm kỳ
vọng và phương sai của X.
Ta có X = {0, 1, 2, 3}
Gọi Bi là b/c người thứ i bị bệnh B

𝑃(𝑋 = 0) = 𝑃(𝐵1 . 𝐵2 . 𝐵3 ) = 𝑃(𝐵1 )𝑃(𝐵2 ). P( 𝐵3 )

𝑃(𝑋 = 1) = 𝑃(B1 . 𝐵2 . 𝐵3 ) + 𝑃(𝐵1 . B2 . 𝐵3 ) + 𝑃(𝐵1 . 𝐵2 . B3 )

𝑃(𝑋 = 2) = 𝑃(B1 𝐵2 𝐵3 ) + 𝑃(𝐵1 B2 B3 ) + 𝑃(B1 𝐵2 B3 )

𝑃(𝑋 = 3) = 𝑃(B1 𝐵2 B3 )
Bảng PPXS của X X 0 1 2 3
p

𝜇 = 𝐸(𝑋) = ෍ 𝑋𝑖 × 𝑝𝑖 =

𝜎 2 = 𝐸(𝑋 2 ) − 𝜇2 = ෍ 𝑋𝑖 2 × 𝑝𝑖 − 𝜇2

➢ Tính chất của phương sai


D(c) = 0
D(cX) = c2D(X)
D(X + Y) = D(X) + D(Y) nếu X, Y ộc lập
➢ Độ lệch chuẩn (standard deviation = sd) 𝜎 = 𝜎2
𝜎
➢ Sai số chuẩn (standard Error = se) 𝑠𝑒 = 𝑛
3. Các ặc trưng khác
a. Trung vị (Median): ký hiệu Med(X)
- Trong XS, trung vị là giá trị c sao cho P(X ≤ c) = P(X ≥ c)
- Trong thống kê, với 1 dãy DL ã sắp tăng dần gồm n phần tử
• Nếu n lẻ thì trung vị là số nằm giữa dãy DL
• Nếu n chẵn thì trung vị là trung bình cộng hai giá trị nằm giữa
tập DL
b. Yếu vị (Mode): ký hiệu Mod(X)
- Trong XS, yếu vị là giá trị có XS lớn nhất
- Trong TK, yếu vị là giá trị có tần suất lớn nhất
Chú ý:
- Một dãy DL có thể không có mod, có 1 mod hoặc có nhiều
mode
- Nếu một dãy DL có Mean ≈ Mode ≈ Med thì dãy DL ó có
phân phối chuẩn.
CÁC PHÂN PHỐI XS THÔNG DỤNG

1. Phân phối nhị thức

◼ Phép thử Bernoulli


Là một phép thử mà kết cục chỉ có 2 khả năng, là 2 b/c ối
lập nhau, xảy ra:
Chẳng hạn “thành công” với XS = p hoặc “thất bại” với XS =
1- p

Ví dụ: Khám bệnh: Có bệnh / không có bệnh.


Điều trị bệnh: Khỏi / không khỏi.
Phẫu thuật: thành công / thất bại.
Kiểm tra thuốc: tốt / xấu.
◼ Phân phối nhị thức
Thực hiện phép thử Bernoulli B(1,p) n lần ộc lập.
Gọi X = “Số lần thành công trong n lần thí nghiệm”
X = 0, 1, 2, …, n.
Biến ngẫu nhiên X có phân phối nhị thức, ký hiệu là X ~ B(n; p), trong ó n là
số lần thực hiện thí nghiệm và p là xác suất xảy ra một biến cố mà nhà nghiên
cứu quan tâm trong thí nghiệm ó.
Hàm mật ộ xác suất của X là:

𝑃 𝑋 = 𝑥 = 𝐶𝑛𝑥 . 𝑝 𝑥 . 1 − 𝑝 𝑛−𝑥

Nếu X ~ B(n; p) thì 𝜇 = 𝐸 𝑋 = 𝑛. 𝑝; 𝜎 2 = 𝐷 𝑋 = 𝑛𝑝(1 − 𝑝)


Ví dụ 1. Tỷ lệ khỏi bệnh B khi iều trị bằng thuốc A là 20%. Điều trị
cho 5 người. Tính XS
a. Có một người khỏi bệnh B.
b. Có ít nhất 1 người khỏi bệnh B
c. Có nhiều nhất 1 người khỏi bệnh B
Giải: Gọi X là số người khỏi bệnh B trong 5 người ược iều trị. Ta có
X ~ B(5;0,2).
Hàm mật ộ XS là:
𝑃(𝑋 = 𝑥) = 𝐶5𝑥 × 0, 2𝑥 × 0, 85−𝑥

𝑎. 𝑃(𝑋 = 1) = 𝐶51 × 0, 21 × 0, 85−1


𝑏. 𝑃(𝑋 = 0) = 𝐶50 × 0, 20 × 0, 85−0

𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0) =

c. 𝑃 (X ≤ 1) = 𝑃(𝑋 = 0) + P( X = 1) =
Ví dụ 2. Một cá nhân mắc bệnh cúm typeA có 5% nguy cơ lây nhiễm cho
người mà anh ta tiếp xúc gần và người chưa từng tiếp xúc trước ó. Nếu
người mang mầm bệnh cúm loại A tiếp xúc gần với 12 người, thì xác suất
anh ta sẽ truyền bệnh cho ít nhất 3 người trong số họ là bao nhiêu?

Gọi X là số người bị cúm A trong 12 người tiếp xúc gần. X ~ B(12; 0,05)
𝑥
Hàm mật ộ xác suất là: 𝑃 𝑋 = 𝑥 = 𝐶12 . 0,05𝑥 . 0,9512−𝑥
𝑃 𝑋 ≥ 3 = 𝑃 𝑋 = 3 + ⋯ + 𝑃 𝑋 = 12 = σ12 𝑥 𝑥
𝑥=3 𝐶12 . 0,05 . 0,95
12−𝑥

=
Hoặc 𝑃 𝑋 ≥ 3 = 1 − 𝑃 𝑋 < 3 = 1 − [𝑃 𝑋 = 0 + 𝑃 𝑋 = 1 + 𝑃 𝑋 = 2 ]
Ví dụ 3. Nguyên tắc tái tạo xương (The Guided Bone Regeneration- GBR) là
một phương pháp phẫu thuật ã ược thiết lập ược sử dụng ể iều trị các
khuyết tật về xương, các thủ thuật nâng xương và lắp ặt implant.
Đánh giá ịnh lượng chính xác về lượng xương tái tạo trong GBR là rất quan
trọng. Giả sử rằng các nghiên cứu trước ây với thỏ sử dụng phương pháp lập
thể (stereological methods) cho thấy rằng ở 35% ối tượng, lượng xương tái
tạo trong khoảng thời gian 6 tháng là khoảng 23% hoặc lớn hơn. Một nhà
nghiên cứu nha khoa ã thực hiện một nghiên cứu trên 8 con thỏ nhằm ánh
giá lượng xương tái tạo sau khi ặt các màng phân hủy che phủ các khuyết tật
trên răng thỏ bằng nguyên tắc GBR. Xác suất mà nhà nghiên cứu sẽ quan sát
ược tỷ lệ tái tạo xương ít nhất 23% trong nhiều nhất 75% mẫu thỏ của mình là
bao nhiêu?
Gọi X là số thỏ ạt tỷ lệ tái tạo xương ít nhất 23%. X~B(8; 0,35)
Hàm mật ộ xác suất của X là: 𝑃 𝑋 = 𝑥 = 𝐶8𝑥 . 0,35𝑥 . 0,658−𝑥

𝑃 𝑋 ≤ 6 = 𝑃 𝑋 = 1 + ⋯+ 𝑃 𝑋 = 8
=1− 𝑃 𝑋 =7 +𝑃 𝑋 =8 =
Bài tập:
1. Tỷ lệ nhiễm viêm gan B (VGB) trong dân số D là 25%. Khám ngẫu
nhiên 3 người trong D. Tính XS:
a. Có 1 người bị nhiễm VGB
b. Có ít nhất 1 người bị nhiễm VGB
c. Có nhiều nhất 1 người bị nhiễm VGB
2. Tỷ lệ hiện mắc ái tháo ường (ĐTĐ) trên toàn quốc ở người trưởng
thành trong dân số VN là 5,5%. Khám ngẫu nhiên 10 người trong dân số.
Tính XS có:
a. 2 người mắc bệnh ĐTĐ
b. Nhiều nhất 2 người mắc bệnh ĐTĐ
c. Ít nhất 2 người mắc bệnh ĐTĐ
2. Phân phối Poisson
Sau phân phối nhị thức, phân phối Poisson là phân phối rời rạc ược
sử dụng rộng rãi thứ hai. Phân phối Poisson hữu ích khi n lớn và p nhỏ
và khi các sự kiện xảy ra trong một khoảng thời gian, diện tích, thể tích
hoặc không gian xác ịnh, chẳng hạn:
Số cuộc gọi mà trợ lý nha khoa nhận ược ể hủy cuộc hẹn
Số trường hợp nhiễm trùng răng miệng góp phần gây nhiễm khuẩn
huyết.
Số trường hợp biến chứng khi thực hiện một phẫu thuật thường quy

Biến ngẫu nhiên X có phân phối Poisson, ký hiệu X~P(), nếu hàm mật ộ xác
𝑒 −𝜇 .𝜇𝑥
suất của X là 𝑃 𝑋 = 𝑥 =
𝑥!
trong ó  = n.p với n là số lần thực hiện thí nghiệm và p là xác suất xảy ra của
một biến cố mà nhà nghiên cứu quan tâm trong thí nghiệm ó.
Chú ý rằng, nếu X có phân phối Poisson thì 𝐸 𝑋 = 𝜇 = 𝑛. 𝑝 = 𝐷 𝑋 = 𝜎 2
Ví dụ 1. Số lượng bạch cầu của bệnh nhân ung thư ang hóa trị ược giám sát
chặt chẽ bởi bác sĩ chuyên khoa ung thư, bệnh nhân sẽ phải dừng iều trị khi số
lượng bạch cầu của bệnh nhân giảm xuống dưới 2.000/mm3. Nhìn chung, số
lượng bạch cầu bình thường nằm trong khoảng từ 5.000/mm3 ến 10.000/mm3.
Nếu số lượng bạch cầu trung bình của người lớn khỏe mạnh là 7.000/mm3 thì xác
suất ể chỉ tìm thấy 2 bạch cầu trong giọt 0,001 mm3 của mẫu máu ược lấy từ
người lớn khỏe mạnh là bao nhiêu?

μ = 7000.0,001 = 7
𝑒 −7 . 7𝑥
𝑃 𝑋=𝑥 =
𝑥!

𝑃 𝑋=2 =
Ví dụ 2. Các trường hợp khẩn cấp thường gặp tại phòng khám nha
khoa liên quan ến phản ứng dị ứng của bệnh nhân với thuốc mê, co
giật, cơn hen, tắc nghẽn ường thở, ngất, co thắt thanh quản, nhịp tim
chậm, hạ ường huyết và au thắt ngực. Giả sử một cuộc khảo sát
cho thấy trung bình một phòng nha có 3 ca cấp cứu trong một năm.
Xác suất ể bác sĩ nha khoa có 2 ca cấp cứu trong vòng 6 tháng tới là
bao nhiêu?

μ = 3.0,5 = 1,5
𝑒 −1,5 . 1,5𝑥
𝑃 𝑋=𝑥 =
𝑥!

𝑃 𝑋=2 =
Ví dụ 3. Tỷ lệ sứt môi có hoặc không có hở hàm ếch ược biết là 1 trong 700
ến 1000 ca sinh ở Hoa Kỳ. Giả sử tỷ lệ mắc bệnh là 1/1000. Nếu số ca sinh
mỗi năm ở một vùng ô thị lớn là khoảng 18500 thì khả năng có 20 ca sinh mới
bị sứt môi trong khoảng thời gian 1 năm là bao nhiêu?

μ = 18500.0,001 = 18,5
𝑒 −18,5 . 18,5𝑥
𝑃 𝑋=𝑥 =
𝑥!

𝑃 𝑋 = 20 =
2. Phân phối chuẩn (Normal distribution)

◼ Biến ngẫu nhiên X có PPC, ký hiệu: X ~ N(, 2)


nếu hàm mật ộ XS:
1 𝑥−𝜇 2

𝑓(𝑥) = 𝑒 2𝜎2 𝑥∈𝑅
𝜎 2𝜋
f(x)
Phân phối chuẩn
◼ Dạng như một cái chuông
◼ Đối xứng qua µ: P(X< µ)=P(X> µ)=0,5
σ
◼ Trung bình = Trung vị = Yếu vị
x
◼ Cực ại ạt ược tại  μ
◼ Độ phân tán σ Mean= Median = Mode
◼ Xác ịnh từ -  to + 

Ví dụ: X~N(100;102)

1 𝑥−100 2

𝑓(𝑥) = 𝑒 2×102
10 2𝜋

P(X<100) = P(X>100) = 0,5


Ví dụ 1. Huyết áp tâm thu (X, mmHg) của con người trong dân số có
PPC với trung bình 100 mmHg và lc là 10 mmHg.
1. Tính tỷ lệ những người có huyết áp tâm thu =110 mmHg.
2. P(80≤X≤120)
3. P(X>90)
4. P(X< 85)
X~N(100; 102). Hàm mật ộ XS là

1 𝑥−100 2

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑒 2×102
10 2𝜋

1 110−100 2

𝑓(𝑥) = 𝑃(𝑋 = 110) = 𝑒 2×102
10 2𝜋
1 𝑥−100 2

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑒 2×102
10 2𝜋

120

𝑃(80 ≤ 𝑋 ≤ 120) = න 𝑓(𝑥)𝑑𝑥 =


80
100

𝑃(X > 90) = න 𝑓(𝑥)𝑑𝑥 + 0,5 =


90
100

𝑃(X < 85) = 0,5 − න 𝑓(𝑥)𝑑𝑥 =


85
Ví dụ 2. Cho biết nồng ộ [Cl-] trong máu người bình
thường là 100 mEq/l và ộ lệch chuẩn là 3 mEq/l. Tìm tỷ lệ
những người trong dân số ó có:
1. Nồng ộ [Cl- ] lớn hơn 104
2. Nồng ộ [Cl- ] nhỏ hơn 98
3. Nồng ộ [Cl- ] từ 98 ến 104
Ví dụ 3. Chiều sâu túi nha chu, thường ược biểu
thị bằng milimét, là phép o khoảng cách giữa
ỉnh lợi và áy của túi. Nếu phân bố xác suất của
ộ sâu túi của người hút thuốc là phân phối chuẩn
với giá trị trung bình μ = 3,5 mm và phương sai σ2
= 0,64, thì khả năng một người hút thuốc ược
chọn ngẫu nhiên có ộ sâu túi không quá 5,0 mm
là bao nhiêu?

Gọi X là chiều sâu túi nha chu, X~N(3,5; 0,64)


Hàm mật ộ xác suất của X là:
1 − 𝑥−3,5 2
𝑃 𝑥=𝑋 =𝑓 𝑥 = × 𝑒 2.0,64
0,8. 2𝜋
5
𝑃 𝑋 < 5 = 0,5 + න 𝑓 𝑥 𝑑𝑥 =
3,5
Phân phối chuẩn tắc
X−μ
Z= ~𝑁(0; 1)
Nếu X ~ N(, 2) thì σ

f(Z)
1 𝑧2
−2
𝑓(𝑧) = 𝑒
1 2𝜋

Z
0
Bài tập
Bài 1. Trọng lượng viên thuốc trong một lô thuốc có PPC với trung bình 252,6
mg và lc 4,2 mg. Tính tỷ lệ viên thuốc có trọng lượng lớn hơn 260.
Bài 2. Axit ascorbic là một trong những thành phần chính có trong viên
vitamin C. Nó ược tìm thấy trong trái cây tươi và rau quả, chẳng hạn như trái
cây họ cam quýt, cà chua và bắp cải. Sự thiếu hụt axit ascorbic ược biết là
dẫn ến bệnh còi; Các dấu hiệu bệnh lý của bệnh còi, chủ yếu giới hạn ở các
mô liên kết, bao gồm xuất huyết, lung lay răng, viêm lợi và vết thương kém
lành.
Giả sử lượng axit ascorbic chứa trong viên vitamin C tuân theo luật PPC với
giá trị trung bình là 450 mg và ộ lệch chuẩn là 15 mg. Tỷ lệ viên vitamin C
chứa axit ascorbic từ 425 mg ến 475 mg là bao nhiêu?
3. Các phân phối liên quan đến PPC
3.1. Phân phối chi bình phương (Chi-Squared Distribution)
Cho n biến n.n ộc lập X1, X2, …, Xn sao cho Xi~N(0;1). Khi ó biến n.n
𝑈 = 𝑋12 + 𝑋22 +. . . +𝑋𝑛2 ~𝜒𝑛2

3.2. Phân phối Fisher (Sir Ronald A. Fisher, F)


Nếu U và V là 2 biến n.n ộc lập có PP chi bình phương với n và m
bậc tự do thì
𝑈/𝑛
𝐹= ~𝐹(𝑛; 𝑚)
𝑉/𝑚

3.3. Phân phối Student


Nếu Z~N(0;1) và U ~ χ2(n) là 2 biến n.n ộc lập thì
𝑍
𝑇= ~𝑡(𝑛)
𝑈/𝑛

You might also like