You are on page 1of 40

Xác suất thống kê

cơ bản và ứng dụng


trong y sinh học

Xác suất
Bài này cho biết:

Khái niệm cơ bản về xác


suất
Mục tiêu
học tập
Xác suất có điều kiện

Sử dụng định lý Bayes


Khái niệm cơ bản
• Xác suất :
số đo khả năng xảy ra của một biến cố ngẫu nhiên,
giá trị xác suất = một trị số từ 0 đến 1

• Biến cố bất khả :


một biến cố không có khả năng xảy ra,
giá trị xác suất = 0

• Biến cố chắc chắn :


một biến cố chắc chắn sẽ xảy ra,
giá trị xác suất = 1
Đánh giá xác suất

Có 3 cách

1. tiên nghiệm : dựa vào kiến thức tiên nghiệm

Xác suất của biến cố = SỐ cách xảy ra / SỐ biến cố sơ cấp


Giả sử tất
cả kết quả
đồng nhất 2. kinh nghiệm : dựa vào dữ liệu quan sát được
xác suất

Xác suất của biến cố = SỐ lần xảy ra / SỐ nhiều lần thử

3. chủ quan: dựa vào niềm tin cá nhân


Đánh giá theo : kinh nghiệm + ý kiến cá nhân + phân tích
Ví dụ xác suất tiên nghiệm

Nếu chọn ngẫu nhiên một ngày trong năm 2017, xác suất
chọn được ngày của tháng 1 là bao nhiêu?

X # ngày trong Tháng 1


Pr(January ) = =
T # ngày trong 2017

X 31
=
T 365
Ví dụ xác suất kinh nghiệm

Bảng cho biết thông tin về một nhóm người. Chọn ngẫu
nhiên một người. Tính xác suất chọn một nam giới
không dùng café hàng ngày

Dùng café Không dùng Tổng


hàng ngày café hàng
ngày
Nam 84 145 229
Nữ 76 134 210
Tổng 160 279 439

Pr(Nam | không café hàng ngày) = 145/279


Ví dụ xác suất chủ quan

Khả năng trời mưa vào trưa mai, dựa vào cảm giác
Khả năng người mới quen có vấn đề quan hệ gia đình,
dựa vào cảm giác
Kết quả có thể xảy ra của một
quan sát

Biến cố đơn

• Được mô tả bằng một đặc điểm


• Ví dụ: Một ngày tháng 10 năm 2017
Biến cố: Biến cố liên kết

định • Được mô tả bẳng hai hay nhiều đặc


điểm

nghĩa • Ví dụ: Một ngày tháng 10 và cũng là


thứ Tư của năm 2017

Biến cố bù

• Không phải là thành phần của biến cố A


• Ví dụ: Mọi ngày trong tuần không phải
thứ Sáu
Biến cố: Không gian mẫu
Không gian mẫu là tập hợp tất cả các biến cố
có thể xảy ra
Ví dụ: tất cả 6 mặt xúc sắc

Tất cả 52 lá bài
Biến cố: Trực quan hóa
• Bảng tiếp liên -- Tất cả các ngày trong năm 2017
Tháng 1 Khác Tổng số

Thứ 4 4 48 52
Khác 27 286 313

• Cây quyết định Tổng 31 334 365

Tổng số
4 kết quả
Không của không
gian 27 gian mẫu
mẫu Tất cả
ngày
trong năm 48
2017
286
Định nghĩa: Xác suất đơn

• Xác suất của một biến cố đơn


• Ví dụ: Pr(Tháng 1), Pr(Thứ 4)

Tháng 1 Khác Tổng


P(Thứ 4) = 52 / 365
Thứ 4 4 48 52
Khác 27 286 313

Tổng 31 334 365

P(Tháng 1) = 31 / 365
Định nghĩa: Xác suất liên kết
• Xác suất của hai hay nhiều biến cố đồng thời.
• Ví dụ: P(Tháng 1 & Thứ 4), Pr(Tháng khác & Ngày khác)

Tháng 1 Khác Tổng


P(Tháng khác&Ngày khác)
Thứ 4 4 48 52
= 286 / 365
Khác 27 286 313

Tổng 31 334 365

P(Tháng 1 & Thứ 4) = 4 / 365


Biến cố rời nhau

• Không thể xảy ra đồng thời

Ví dụ: Chọn ngẫu nhiên một ngày trong năm 2017

A = ngày trong tháng 1; B = ngày trong tháng 2

• Biến cố A và B không thể cùng xuất hiện

• Hai biến cố A và B rời nhau


Biến cố đâỳ đủ

• Hệ biến cố đầy đủ
• Một biến cố nào đó của hệ phải xảy ra

• Hệ biến cố bao toàn bộ không gian mẫu

Chọn ngẫu nhiên một ngày trong năm 2017

A = trong tuần; B = cuối tuần;


C = Tháng 1; D = Quý 1;

• Hệ biến cố A, B, C, D đầy đủ

• Hệ biến cố A, B, C, D không đôi một rời nhau

• Hệ A, B đầy đủ và rời nhau


Xác suất liên kết và xác suất lề

• Xác suất liên kết của A và B:

# A & B
P(A & B) =
# b .c . s .c

• Công thức “phân nhóm”:


Khi B1, B2, …, Bk là hệ biến cố đầy đủ và đôi một rời nhau

P(A) = P(A & B 1 ) + P(A & B 2 ) +  + P(A & B k )


Ví dụ: Xác suất liên kết

4
P(Ngày thứ Tư của tháng 1) =
365

Tháng 1 Khác Tổng

Thứ 4 4 48 52
Khác 27 286 313

Tổng 31 334 365


Ví dụ: xác suất lề

P(Thứ Tư)
4 48 52
= P ( Tháng 1 & Th.4) + P(KHÔNG Tháng 1 & Th.4 ) = + =
365 365 365

Tháng 1 Khác Tổng

Thứ Tư 4 48 52
Khác 27 286 313

Tổng 31 334 365


Bảng tiếp liên: xác suất liên kết và lề

Biến Biến cố
cố B1 B2 Tổng
A1 P(A1 & B1) P(A1 & B2) P(A1)

A2 P(A2 & B1) P(A2 & B2) P(A2)

Tổng P(B1) P(B2) 1

Xác suất liên kết Xác suất đơn (xác suất lề)
Tóm tắt về xác suất

• Số đo mức độ có thể xảy ra của một biến cố


1 Chắc
• Trị số trong miền từ 0 đến 1 chắn
0 ≤ P(A) ≤ 1 với mọi biến cố A
• Tổng xác suất của hệ biến cố đầy đủ và rời
nhau là 1
0.5

P(A) + P(B) + P(C) = 1


A, B, C đôi một rời nhau và đầy đủ

0 Bất khả
Luật xác suất tổng quát

Luật cộng:
P(A v B) = P(A) + P(B) - P(A & B)

Nếu A và B rời nhau, thì P(A & B) = 0


Khi đó

P(A v B) = P(A) + P(B)


Ví dụ: luật cộng

P(Tháng 1 & Th4) = P(T1) + P(Th4) - P(T1 & Th4)


= 31/365 + 52/365 - 4/365 = 79/365
Đếm trùng:
- số ngày
trong tháng
Tháng 1 Khác Tổng 1 là thứ 4
- và số ngày
Thứ 4 4 48 52
thứ 4 trong
Khác 27 286 313 tháng 1
Tổng 31 334 365
Xác suất có điều kiện

• Xác suất có điều kiện là xác suất của một biến cố, trong điều kiện xảy ra
biến cố khác

P(A & B) Xác suất của A với


P(A | B) = điều kiện xảy ra B
P(B)

P(A & B) Xác suất của B với


P(B | A) = điều kiện xảy ra A
P(A)
Ví dụ xác suất có điều kiện

Thuốc chữa khó tiêu


◼ 80% dùng tây dược: biến cố T
◼ 40% dùng thuốc nội: biến cố N
◼ 25% dùng cả hai: biến cố T & N

Tính xác suất một người dùng tây dược, biết có dùng thuốc nội địa

P(T | N) = ?
Ví dụ

P(T)= 0,80 P(Đ) = 0,30 P(T & Đ) = 0,25.

Nội Khác Total


Tây dược 0,25 0,55 0,80
Khác 0,15 0,05 0,20
Total 0,40 0,60 1,00

P(T & N) 0,25


P(T | N) = = = 0,3125
P(N) 0,80
Trực quan hóa biến cố: Sơ đồ Cây
0 , 25
0 , 80 P(T & N) = 0,25

0 ,15
P(T & ~N) = 0,15

0 , 80
Xác suất
Thuốc có điều kiện

0 ,15
0 , 20 P(~T & N) = 0,15

0 , 05 P(~T & ~N) = 0,05


0 , 20
Sơ đồ cây
0 , 25
0 , 40 P(T & N) = 0,25

0 ,15
P( ~T & N) = 0,15

0 , 40
Xác suất
Thuốc có điều kiện

0 , 55
0 , 60 P(T & ~N) = 0,55

0 , 05 P(~T & ~N) = 0,05


0 , 60
Độc lập
•Hai biến cố A và B độc lập:

P(A | B) = P(A)

Hai biến cố A và B độc lập khi xác suất của biến cố này
không bị tác động bởi sự xảy ra của biến cố kia
Luật nhân xác suất

• Đối với hai biến cố A và B:

P(A & B) = P(A | B) P(B)

Chú ý: Nếu A và B độc lập, thì P(A | B) = P(A)


Khi đó
P(A & B) = P(A) P(B)
Xác suất lề

• Xác suất lề của biến cố A:

P(A) = P(A | B 1 ) P(B 1


) + P(A | B 2 ) P(B 2
) +  + P(A | B k ) P(B k
)
Trong đó các biến cố B1, B2, …, Bk rời nhau và đầy đủ
Định lý Bayes

• Đánh giá lại xác suất xảy ra biến cố khi cập nhật thông tin mới

• Mở rộng xác suất có điều kiện

• Đặt ra đầu tiên bởi Thomas Bayes


Định lý Bayes

P(A | B i )P(B )
| A) =
i
P(B i
P(A | B 1 )P(B 1
) + P(A | B 2 )P(B 2
) +    + P(A | B k )P(B k
)

Hệ các biến cố Bi đôi một rời nhau và đầy đủ


Biến cố A có thể tác đông các Bi
Ví dụ định lý Bayes

• Một thí sinh ước lượng có 40% cơ may làm bài tốt.

• Thí sinh hay sợ rớt, từ trước đến nay tỷ lệ sợ khi làm bài tốt là 60%, tỷ
lệ sợ khi làm bài không tốt là 20%.

• Nếu lần thi này làm xong sợ ghê lắm thì xác suất thành công là bao
nhiêu?
Ví dụ

• Đặt S = làm bài tốt


U = làm bài không tốt
• Xác suất tiên nghiệm P(S) = 0,4 , P(U) = 0,6
• D = sợ rớt
• Xác suất có điều kiện
P(D|S) = 0,6 P(D|U) = 0,2
• TÌM P(S|D)
Ví dụ

Định lý Bayes
P(D | S)P(S)
P(S | D) =
P(D | S)P(S) + P(D | U)P(U)
(0,6)(0,4)
=
(0,6)(0,4) + (0,2)(0,6)
0,24
= = 0,667
0,24 + 0,12

Đánh giá về khả năng xảy ra biến cố đã thay đổi


Ví dụ

• Có thêm thông tin cập nhật, xác suất có cập nhật của thành
công bây giờ tăng lên 0,667 thay vì đánh giá ban đầu 0,4

Trực quan hóa

Xác suất Xác suất có Xác suất liên kết Xác suất có cập
Biến cố tiên điều kiện nhật
nghiệm
S (thành công) 0,4 0,6 (0,4)(0,6) = 0,24 0,24/0,36 = 0,667
U (thất bại) 0,6 0,2 (0,6)(0,2) = 0,12 0,12/0,36 = 0,333

0.36
Ví dụ

P()= 0,80 P(Đ) = 0,30 P(T & Đ) = 0,25.

B+ B- Tổng
XN + 0,25 0,55 0,80
XN - 0,15 0,05 0,20
Total 0,40 0,60 1,00

P(T & N) 0,25


P(T | N) = = = 0,3125
P(N) 0,80
Sơ đồ cây
0 , 25
0 , 80 P(T & N) = 0,25

0 ,15
P(T & ~N) = 0,15

0 , 80
Xác suất
Thuốc có điều kiện

0 ,15
0 , 20 P(~T & N) = 0,15

0 , 05 P(~T & ~N) = 0,05


0 , 20
Sơ đồ cây
0 , 25
0 , 40 P(T & N) = 0,25

0 ,15
P( ~T & N) = 0,15

0 , 40
Xác suất
Thuốc có điều kiện

0 , 55
0 , 60 P(T & ~N) = 0,55

0 , 05 P(~T & ~N) = 0,05


0 , 60
Ví dụ

• Có thêm thông tin cập nhật, xác suất có cập nhật của thành
công bây giờ tăng lên 0,667 thay vì đánh giá ban đầu 0,4

Tỷ lệ lưu Độ nhạy Độ đặc hiệu Giá trị tiên đoán


Kết quả xét hành

nghiệm
Pos (dương tính) 0,4 0,90 ( 0,24/0,36 = 0,667
Neg (âm tính) 0,4
0.36
Tổng kết

• Khái niệm xác suất cơ bản


• Biến cố, không gian mẫu, bảng tiếp liên, xác suất
• Luật tính xác suất cơ bản
• Luật cộng tổng quát, luật cộng cho biến cố rời nhau, luật cho biến cố
đầy đủ
• Xác suất có điều kiện
• Độc lập, xác suất lề, sơ đồ cây, luật nhân
• Định lý Bayes

You might also like