You are on page 1of 24

Xác su t

 Không gian mẫu và biến cố


 Định nghĩa xác suất
Xác suất
 Tính chất
 Trực quan hóa biến cố

 Biến cố độc lập, phụ thuộc

Nội dung Xác suất có  Định nghĩa xác suất có điều kiện

học tập điều kiện  Luật nhân xác suất


 Xác suất toàn phần

 Giá trị dự đoán của xét nghiệm


Xét nghiệm và  Độ nhạy, độ đặc hiệu của xét nghiệm
định lý Bayes
 Định lý Bayes
Xác suất

• Không gian mẫu: Tập hợp tất cả các kết quả có thể xảy ra
của 1 thử nghiệm ngẫu nhiên. Ký hiệu .

• Biến cố: Tập con của không gian mẫu. Ký hiệu A, B, C…

Ví dụ 1: Tung cục xúc sắc có 6 mặt thì

Không gian mẫu:  = {1,2,3,4,5,6}

Các biến cố: A = { 2,4,6}; B = {1,3,5}; C = {1}


Xác suất

• Biến cố đơn: Được mô tả bằng 1 đặc điểm.


A :” Bệnh”, B: “Dương tính”

• Biến cố liên kết: Được mô tả bẳng hai hay nhiều đặc điểm.
A  B: “ A hoặc B xảy ra”,
A  B = AB : “ A và B cùng xảy ra”.

• Biến cố bù: “ A không xảy ra”


A :” Bệnh”, : “ Không bị bệnh”

• Biến cố xung khắc: C và D được gọi là 2 biến cố xung khắc nếu CD =  .


( C và D không cùng xảy ra)
Tung cục xúc sắc, gọi C = {1,2}, D ={3,4} thì C và D là hai biến cố xung khắc.
Xác suất

• Hệ đầy đủ và xung khắc đôi một: Hệ các biến cố B1, B2, …, Bk là


hệ đầy đủ và xung khắc đôi một, nếu thỏa 2 tính chất sau:

 BiBj = ,  i  j.

 B1 B2  …  Bk = .

Ví dụ 2: Đặt X là tuổi của sản phụ và

B1={ X ≤ 19}, B2={ 19 < X ≤ 35}, B3={ X > 35}.

Ta có B1, B2, B3 là hệ biến cố đầy đủ và đôi một xung khắc.


Xác suất

• Xác suất của biến cố A (P(A)) là khả năng để biến cố A xảy ra.
• Tần suất của biến cố là tỷ số giữa số lần biến cố đó xuất hiện
và số lần thực hiện thử nghiệm ngẫu niên.

Có 3 cách đánh giá


1. Tiên nghiệm : dựa vào kiến tri thức tiên nghiệm về quá trình

P(A) =

2. Kinh nghiệm : dựa vào dữ liệu quan sát được
P(A) = Tần suất của biến cố đó trong số lượng lớn lần thử nghiệm

3. Chủ quan: dựa vào niềm tin cá nhân


Đánh giá theo : kinh nghiệm + ý kiến cá nhân + phân tích
Xác suất

Ví dụ 3: Tung cục xúc sắc có 6 mặt. Tính xác suất được mặt chẵn?

Ta có: = {1,2,3,4,5,6};

A = { 2,4,6}. 

Ví dụ 4: Theo kết quả báo cáo về hiệu quả sử dụng thực tế của bộ
kit Trueline Covid-19 do Trung tâm Kiếm soát dịch bệnh tỉnh Bắc
Giang thực hiện từ ngày 10/5/2021 đến 15/7/2021.

Covid
Trueline Test Có Không Tổng
Dương tính 549 120 669  P( Bệnh) = 596/125000
Âm tính 47 124284 124331
Tổng 596 124404 125000
Xác suất

1. P() = 1.

2. 0 ≤ P(A) ≤ 1, A.

3. Nếu A, B là hai biến cố xung khắc thì P(AB) = P(A) + P(B).

4. Nếu A và B bất kỳ thì P(AB) = P(A) + P(B) – P(AB).

5. P( ) = 1 - P(A), A.
Xác suất

• Bảng tiếp liên


Covid
Test Có Không Tổng
Dương tính 549 120 669
Âm tính 47 124284 124331 Tổng số
Tổng 596 124404 125000 kết quả
• Cây quyết định
549
596
Tổng kết quả 120
125000
47
124404
124284
Xác suất có
điều kiện
 Hai biến cố A, B độc lập nếu P(AB) = P(A).P(B)

Ví dụ 5: Tính xác suất sinh được con gái trong lần thứ nhất và
con trai trong lần thứ hai.
Đặt A: “ Sinh con gái trong lần đầu tiên”
B : “ Sinh con trai trong lần thứ hai”
Ta có: P(AB) = P(A). P(B) = 0.25

 Hai biến cố A, B phụ thuộc nếu P(AB)  P(A).P(B).

Ví dụ 6: Hai biến cố “ Dương tính” và “ Bị bệnh” trong ví dụ 4 là


phụ thuộc.
Xác suất có
điều kiện

• Xác suất có điều kiện là xác suất của một biến cố, trong điều kiện
xảy ra biến cố khác

P(A B) Xác suất của A với


P(A|B)  điều kiện xảy ra B
P(B)
P(AB) Xác suất của B với
P(B|A)  điều kiện xảy ra A
P(A)
Xác suất có
điều kiện

Chọn ngẫu nhiên một kết quả trong ví dụ 4, nếu kết quả là dương
tính thì khả năng mắc bệnh/ không mắc bệnh là bao nhiêu?
Covid
Test Có Không Tổng
Dương tính 549 120 669
Âm tính 47 124284 124331
Tổng 596 124404 125000

Dương tính Bệnh Không bệnh

Đặt A: “ Dương tính”, B” Bệnh”. Ta có

(=1- )
Xác suất có
điều kiện

Cho hai biến cố A, B bất kỳ. Ta có

P(AB)  P(A|B) P(B)


Chú ý:
 Nếu A và B độc lập thì và

 Nếu A và B phụ thuộc thì  


Công thức xác suất toàn phần Xác suất có
điều kiện
Cho B1, B2 là hệ đầy đủ và rời nhau. Với A  , ta có

 B1 B2

AB1 AB2

Ví dụ 8: Theo một số liệu thống kê năm 2004 ở Canada có 65%


đàn ông là thừa cân và 53,4% đàn bà thừa cân. Số đàn ông và
đàn bà ở Canada coi như bằng nhau Hỏi rằng, trong năm 2004,
xác suất để một người Canada được chọn ngẫu nhiên là người
thừa cân bằng bao nhiêu?
Xác suất có
điều kiện

Cho B1, B2, …, Bk là hệ đầy đủ và đôi một rời nhau. Với A  , ta có

B2 B3
B1 Bk

AB1 AB2 AB3 ABk

+…+
Xét nghiệm và
định lý Bayes

Giá trị dự đoán dương tính (PV+) của một xét nghiệm là khả
năng một người bị bệnh khi có kết quả xét nghiệm là dương tính
PV+ = P(Bệnh

Giá trị dự đoán âm tính (PV-) của một xét nghiệm là khả năng
một người không bị bệnh khi có kết quả xét nghiệm là âm tính
PV- = P(Không bệnh =

Ví dụ 9: Giả sử rằng trong số 100,000 phụ nữ chụp quang tuyến


vú âm tính, 20 người sẽ được chẩn đoán mắc bệnh ung thư vú,
trong khi 1 phụ nữ trong số 10 người chụp quang tuyến vú dương
tính sẽ được chẩn đoán mắc bệnh ung thư vú. Tìm PV+, PV- ?
Xét nghiệm và
định lý Bayes

Ta có PV+ = 0,1 và PV-= 1- 0,0002 = 0.9998

Nhận xét:
 PV của xét nghiệm sàng lọc càng cao thì xét nghiệm sẽ càng có
giá trị.
 Các bác sĩ lâm sàng thường không thể đo trực tiếp PV của một
xét nghiệm. Tuy nhiên, họ có thể đo lường tần suất các triệu
chứng (xét nghiệm) cụ thể xảy ra ở những người bị bệnh và
bình thường được định nghĩa như sau.
Xét nghiệm và
định lý Bayes

Độ nhạy (Sensitivity) là xác suất xét nghiệm báo dương tính do


người đó mắc bệnh. Ký hiệu: Sens = .

Độ đặc hiệu (specificity) là xác suất xét nghiệm báo âm tính do


người đó không mắc bệnh. Ký hiệu: Spec = .

Âm giả là xác suất xét nghiệm báo âm tính đối với người bị bệnh. Ký
hiệu: .

Dương giả là xác suất xét nghiệm báo dương tính đối với người
không bị bệnh. Ký hiệu: .
Xét nghiệm và
định lý Bayes
Tìm độ nhạy, độ đặc hiệu, PV+ và PV- của Trueline test (T) trong VD 4

Covid
Trueline Test Có Không Tổng
Dương tính 549 120 669
Âm tính 47 124284 124331
Tổng 596 124404 125000
Ta có

Sens = Spec =

PV+ = PV- =
Xét nghiệm và
định lý Bayes

Ví dụ 11. Một công ty dược phẩm đang phát triển một bộ dụng cụ thử
thai mới. Trong số 100 phụ nữ đang mang thai sử dụng thì có 95 kết
quả xét nghiệm là dương tính. Trong số 100 phụ nữ khác không mang
thai sử dụng thì có 99 người cho kết quả âm tính. Khẳng định nào sau
đây là không đúng?
A. Độ nhạy của xét nghiệm là 95%
B. Độ đặc hiệu của xét nghiệm là 99%
C. Giá trị dự đoán dương tính không thể được xác định từ
thông tin trong bài
D. Giá trị dự đoán âm tính PV- của xét nghiệm là 95,19%
E. Âm giả của xét nghiệm là 5%
D. Dương giả của xét nghiệm là 1%
Xét nghiệm và
định lý Bayes

Ta có:
Sens = Spec = PV+ = PV- =

P(B) = pre: Tỷ lệ bệnh trong dân số

𝑃
𝑃
PV+ = =

PV- = =
Xét nghiệm và
định lý Bayes

Một bệnh nhân với các triệu chứng ho, đau họng, đau đầu, sổ mũi,
mất vị giác, chán ăn. Chị nghe nói rằng với những dấu hiệu này thì khả
năng chị bị covid là rất cao, giả sử ở khu vực chị sinh sống, cứ 100
người có triệu chứng giống chị thì 10 người bị covid. Chị làm Trueline
COVID-19 Ag Rapid Test. Test này được công bố là có độ nhạy và độ
đặc hiệu lần lượt là 92% và 99%.

1. Nếu test âm tính thì khả năng chị không mắc bệnh là bao nhiêu?

2. Nếu test dương tính thì khả năng chị mắc bệnh là bao nhiêu?
Xét nghiệm và
định lý Bayes

Cho B1, B2, …, Bk là hệ đầy đủ và đôi một rời nhau. Với A  , ta có

P(A| Bi )P(Bi )
P(Bi | A)
P(A| B1 )P(B1 )  P(A| B 2 )P(B2 )      P(A| B k )P(Bk )
ổ ế

You might also like