You are on page 1of 21

Xác suất thống kê y học

Đại cương Xác suất

1
❖ Không gian mẫu và biến cố
❖ Định nghĩa xác suất
Xác suất
❖ Tính chất
❖ Trực quan hóa biến cố

➢ Biến cố độc lập, phụ thuộc

Nội dung Xác suất có ➢ Định nghĩa xác suất có điều kiện

học tập điều kiện ➢ Luật nhân xác suất


➢ Xác suất toàn phần

Xét nghiệm và ✓ Giá trị dự đoán – Độ chính xác của xét nghiệm
định lý Bayes ✓ Định lý Bayes

2
Xác suất
Không gian mẫu và biến cố

• Không gian mẫu: Tập hợp tất cả các kết quả có thể xảy ra của 1
thử nghiệm ngẫu nhiên. Ký hiệu .

• Biến cố: Tập con của không gian mẫu. Ký hiệu A, B, C…

Ví dụ 1: Tung cục xúc sắc có 6 mặt thì

Không gian mẫu:  = {1,2,3,4,5,6}

Các biến cố: A = { 2,4,6}; B = {1,3,5}; C = {1}

3
Xác suất
Không gian mẫu và biến cố
• Biến cố đơn: Được mô tả bằng 1 đặc điểm.
A :” Bệnh”, B: “Dương tính”
• Biến cố liên kết: Được mô tả bẳng hai hay nhiều đặc điểm.
A  B: “ A hoặc B xảy ra”,
A  B = AB : “ A và B cùng xảy ra”.
• Biến cố bù: 𝐴:ҧ “ A không xảy ra”
A :” Bệnh”, 𝐴:ҧ “ Không bị bệnh”
• Biến cố xung khắc: C và D được gọi là 2 biến cố xung khắc nếu CD =  .
( C và D không cùng xảy ra)
Tung cục xúc sắc, gọi C = {1,2}, D ={3,4} thì C và D là hai biến cố xung khắc.

4
Xác suất
Không gian mẫu và biến cố
• Hệ đầy đủ và xung khắc đôi một: Hệ các biến cố B1, B2, …, Bk là hệ
đầy đủ và xung khắc đôi một, nếu thỏa 2 tính chất sau:

 BiBj = ,  i  j.

 B1 B2  …  Bk = .

Ví dụ 2: Đặt X là tuổi của sản phụ và

B1={ X ≤ 19}, B2={ 19 < X ≤ 35}, B3={ X > 35}.

Ta có B1, B2, B3 là hệ biến cố đầy đủ và đôi một xung khắc.

5
Định nghĩa xác suất Xác suất

• Xác suất của biến cố A (P(A)) là khả năng để biến cố A xảy ra.
• Tần suất của biến cố là tỷ số giữa số lần biến cố đó xuất hiện
và số lần thực hiện thử nghiệm ngẫu nhiên.

Có 3 cách đánh giá


1. Tiên nghiệm : dựa vào kiến tri thức tiên nghiệm về quá trình
𝑛𝐴
P(A) =

𝑛

2. Kinh nghiệm : dựa vào dữ liệu quan sát được


P(A) = Tần suất của biến cố đó trong số lượng lớn lần thử nghiệm

3. Chủ quan: dựa vào niềm tin cá nhân


Đánh giá theo : kinh nghiệm + ý kiến cá nhân + phân tích
6
Xác suất
Định nghĩa xác suất

Ví dụ 3: Tung cục xúc sắc có 6 mặt. Tính xác suất được mặt chẵn?

Ta có: = {1,2,3,4,5,6}; 𝑛𝐴 1
 P( 𝐴) = =
A = { 2,4,6}. 𝑛 2

Ví dụ 4: Theo kết quả báo cáo về hiệu quả sử dụng thực tế của bộ kit
Trueline Covid-19 do Trung tâm Kiếm soát dịch bệnh tỉnh Bắc Giang thực
hiện từ ngày 10/5/2021 đến 15/7/2021.

Covid
Trueline Test Có Không Tổng
Dương tính 549 120 669  P( Bệnh) = 596/125000
Âm tính 47 124284 124331
Tổng 596 124404 125000

7
Xác suất
Tính chất

1. P() = 1.

2. 0 ≤ P(A) ≤ 1, A.

3. Nếu A, B là hai biến cố xung khắc thì P(AB) = P(A) + P(B).

4. Nếu A và B bất kỳ thì P(AB) = P(A) + P(B) – P(AB).

5. P(𝐴)ҧ = 1 - P(A), A.

8
Trực quan hóa biến cố Xác suất

• Bảng tiếp liên


Covid
Test Có Không Tổng
Dương tính 549 120 669
Âm tính 47 124284 124331 Tổng số
Tổng 596 124404 125000 kết quả
• Cây quyết định
549
669
Tổng kết quả 120
125000
47
124331
124284
9
Biến cố độc lập, phụ thuộc Xác suất có
điều kiện

❖ Hai biến cố A, B độc lập nếu P(AB) = P(A).P(B)

Ví dụ 5: Tính xác suất sinh được con gái trong lần thứ nhất và con trai
trong lần thứ hai.
Đặt A: “ Sinh con gái trong lần đầu tiên”
B : “ Sinh con trai trong lần thứ hai”
Ta có: P(AB) = P(A). P(B) = 0.25

❖ Hai biến cố A, B phụ thuộc nếu P(AB)  P(A).P(B).

Ví dụ 6: Hai biến cố “ Dương tính” và “ Bị bệnh” trong ví dụ 4 là phụ


thuộc.

10
Xác suất có
Định nghĩa xác suất có điều kiện điều kiện

• Xác suất có điều kiện là xác suất của một biến cố, trong điều kiện
xảy ra biến cố khác

P(A B) Xác suất của A với


P(A|B) = điều kiện xảy ra B
P(B)
P(AB) Xác suất của B với
P(B|A) = điều kiện xảy ra A
P(A)

11
Xác suất có
Ví dụ 7: điều kiện

Chọn ngẫu nhiên một kết quả trong ví dụ 4, nếu kết quả là dương tính thì
khả năng mắc bệnh/ không mắc bệnh là bao nhiêu?
Covid
Test Có Không Tổng
Dương tính 549 120 669
Âm tính 47 124284 124331
Tổng 596 124404 125000

Dương tính Bệnh Không bệnh

Đặt A: “ Dương tính”, B” Bệnh”. Ta có

𝑃(𝐴𝐵) 549ൗ125000 549


𝑃 𝐵𝐴 = = = = 0,82
𝑃(𝐴) 669ൗ125000 669
𝑃(𝐴𝐵) ത
120

𝑃 𝐵𝐴 = = = 0,18 (=1- 𝑃 𝐵 𝐴 )
𝑃(𝐴) 669
12
Xác suất có
Luật nhân xác suất điều kiện

Cho hai biến cố A, B bất kỳ. Ta có

P(AB) = P(A|B) P(B)


Chú ý:
▪ ത = 𝑃 𝐴 và
Nếu A và B độc lập thì 𝑃 𝐴 𝐵 = 𝑃(𝐴|𝐵)

𝑃 𝐴𝐵 = 𝑃 𝐴 . 𝑃(𝐵)

▪ Nếu A và B phụ thuộc thì 𝑃 𝐴 𝐵  𝑃 𝐴  𝑃(𝐴|𝐵)


13
Công thức xác suất toàn phần Xác suất có
điều kiện
Cho B1, B2 là hệ đầy đủ và rời nhau. Với A  , ta có

 B1 B2

AB1 AB2

P(A) = P(A|B1 )P(B1 ) + P(A|B2 )P(B2 )

Ví dụ 8: Theo một số liệu thống kê năm 2004 ở Canada có 65%


đàn ông là thừa cân và 53,4% đàn bà thừa cân. Số đàn ông và
đàn bà ở Canada coi như bằng nhau Hỏi rằng, trong năm 2004,
xác suất để một người Canada được chọn ngẫu nhiên là người
thừa cân bằng bao nhiêu?
14
Công thức xác suất toàn phần tổng quát Xác suất có
điều kiện

Cho B1, B2, …, Bk là hệ đầy đủ và đôi một rời nhau. Với A  , ta có

B2 B3
B1 Bk

AB1 AB2 AB3 ABk

P(A) = P(A|B1 )P(B1 ) + P(A|B2 )P(B2 )+…+P(A|B𝑘 )P(B𝑘 )

15
Xét nghiệm và
Giá trị dự đoán – Độ chính xác của xét nghiệm định lý Bayes

Giá trị dự đoán dương tính (PV+) của một xét nghiệm là khả năng
một người bị bệnh khi có kết quả xét nghiệm là dương tính
PV+ = P(Bệnh Test + = 𝑃(𝐵|𝐴)
Giá trị dự đoán âm tính (PV-) của một xét nghiệm là khả năng một
người không bị bệnh khi có kết quả xét nghiệm là âm tính
ത 𝐴)ҧ
PV- = P(Không bệnh|Test − )= 𝑃(𝐵|

Độ nhạy (Sensitivity) là khả năng xét nghiệm báo dương tính do


người đó mắc bệnh. Ký hiệu: Sens = P(A|B).
Độ đặc hiệu (specificity) là khả năng xét nghiệm báo âm tính do
người đó không mắc bệnh. Ký hiệu: Spec = P(𝐴|ҧ 𝐵).

16
Xét nghiệm và
định lý Bayes

Ví dụ 9: Tìm độ nhạy, độ đặc hiệu và giá trị dự đoán của Trueline test (T)
trong VD 4
Covid
Trueline Test Có Không Tổng
Dương tính 549 120 669
Âm tính 47 124284 124331
Tổng 596 124404 125000

Ta có
549 124284
Sens = P A B = = 92%, Spec = P 𝐴ҧ 𝐵ത = = 99,9%,
596 124404

549 124284
PV+ = 𝑃 𝐵 𝐴 = = 82%, PV- = 𝑃 𝐵ത 𝐴ҧ = 124331 = 99,96%.
669

17
Xét nghiệm và
định lý Bayes

Ví dụ 10: Một công ty dược phẩm đang phát triển một bộ dụng cụ thử
thai mới. Trong số 100 phụ nữ đang mang thai sử dụng thì có 95 kết
quả xét nghiệm là dương tính. Trong số 100 phụ nữ khác không mang
thai sử dụng thì có 99 người cho kết quả âm tính. Khẳng định nào sau
đây là không đúng?
A. Độ nhạy của xét nghiệm là 95%
B. Độ đặc hiệu của xét nghiệm là 99%
C. Giá trị dự đoán dương tính không thể được xác định từ
thông tin trong bài
D. Giá trị dự đoán âm tính PV- của xét nghiệm là 95,19%
E. Âm giả của xét nghiệm là 5%
D. Dương giả của xét nghiệm là 1%
18
Xét nghiệm và
định lý Bayes
Định lý Bayes
Ta có:
Sens = P A B Spec = P 𝐴ҧ 𝐵ത PV+ = 𝑃 𝐵 𝐴 PV- = 𝑃 𝐵ത 𝐴ҧ

P(B) = pre: Tỷ lệ bệnh trong dân số

𝑃 𝐴 |𝐵 𝑃 𝐵 𝑆𝑒𝑛𝑠×𝑝𝑟𝑒
PV+ = ത ത
=
| |
𝑃 𝐴 𝐵 𝑃 𝐵 +𝑃 𝐴 𝐵 𝑃(𝐵) 𝑆𝑒𝑛𝑠×𝑝𝑟𝑒+ 1−𝑆𝑝𝑒𝑐 × 1−𝑝𝑟𝑒

𝑃 𝐴ҧ |𝐵ത 𝑃(𝐵)
ത 𝑆𝑝𝑒𝑐× 1−𝑝𝑟𝑒
-
PV = =
𝑃 𝐴ҧ |𝐵ത 𝑃 ത ҧ |
𝐵 +𝑃 𝐴 𝐵 𝑃(𝐵) 𝑆𝑝𝑒𝑐× 1−𝑝𝑟𝑒 + 1−𝑆𝑒𝑛𝑠 ×𝑝𝑟𝑒

19
Xét nghiệm và
Ví dụ 11: định lý Bayes

Một bệnh nhân với các triệu chứng ho, đau họng, đau đầu, sổ mũi,
mất vị giác, chán ăn. Chị nghe nói rằng với những dấu hiệu này thì khả
năng chị bị covid là rất cao, giả sử ở khu vực chị sinh sống, cứ 100
người có triệu chứng giống chị thì 10 người bị covid. Chị làm Trueline
COVID-19 Ag Rapid Test. Test này được công bố là có độ nhạy và độ
đặc hiệu lần lượt là 92% và 99%.

1. Nếu test âm tính thì khả năng chị không mắc bệnh là bao nhiêu?

2. Nếu test dương tính thì khả năng chị mắc bệnh là bao nhiêu?

20
Xét nghiệm và
Định lý Bayes tổng quát định lý Bayes

Cho B1, B2, …, Bk là hệ đầy đủ và đôi một rời nhau. Với A  , ta có

P(A | B i )P(B i )
P(B i | A) =
P(A | B 1 )P(B 1 ) + P(A | B 2 )P(B 2 ) +    + P(A | B k )P(B k )

21

You might also like