You are on page 1of 8

PHÂN PHỐI XÁC SUẤT

Mục tiêu
Sau khi nghiên cứu chủ đề, học viên có khả năng:
- Phân biệt được 3 phân phối xác suất phổ biến: phân phối nhị thức, phân phối Poisson và
phân phối bình thường.
- Tính xác suất của phân phối nhị thức và phân phối poisson khi được cung cấp các tham
số
- Xác định được phân phối xác suất của phân phối chuẩn ở một giá trị bất kì, được phép
sử dụng bảng số của phân phối chuẩn.
- Tính tỉ lệ của dân số có một đặc trưng nhất định về một đại lượng có phân phối bình
thường khi được cung cấp các tham số và bảng số của phân phối chuẩn.
1. Phân phối xác suất
Như đã trình bày,nếu chúng ta chỉ quan tâm đến giá trị đại lượng được xác định bởi kết
cục của phép thử,chúng ta mô tả biến cố là biến số ngẫu nhiên. Thí dụ nếu chúng ta tung
3 đồng tiền mà chỉ quan tâm đến số đồng tiên ra mặt ngửa thì chúng ta tạo ra biến số
ngẫu nhiên X là số đồng tiền ngửa. Khi đó chúng ta có thể kí hiệu (X=1) để chỉ biến cố
gồm các kết cuộc có số đồng tiền ngửa là 1 (gồm 3 biến cố Sấp -Sấp - Ngửa; Sấp - Ngửa
- Sấp; Ngửa - Sấp - Sấp). Xác suất của biến cố này được được gọi là phân phối xác suất
của X. Áp dụng vào thí dụ trên chúng ta có phân phối xác suất của X như sau:
xi

Số biến cố thuận lợi

f(xi)=P(X=xi)

F(xi)=P(X  x)

0

1

1/8

1/8

1

3

3/8

4/8

2

3

3/8

7/8

3

1

1/8

1

Ðịnh nghĩa: Phân phối xác suất của biến số rời rạc là một bảng mô tả những giá trị của
biến số rời rạc cùng với xác suất và xác suất tích luỹ tương ứng của nó.
Xác suất của các biến số ngẫu nhiên X được gọi là hàm khối (mass function) của X - kí
hiệu là f(x). Xác suất tích luỹ của biến số ngẫu nhiên X được gọi là hàm phân phối
(distribution function) của X và được kí hiệu là F(x)
Hai đặc tính cơ bản của phân phối xác suất của biến số rời rạc:
(1) 0  P(X=x)  1
(2)  P(X=x) = 1
Có hai phân phối xác suất rời rạc được sử dụng rộng rãi nhất là phân phối nhị thức và
phân phối Poision. Chúng ta sẽ thảo luận về hai phân phối này và phân phối bình thường
trong các phần sau.
2. Phân phối nhị thức
Bài toán: Giả sử chúng ta thực hiện n phép thử đồng nhất và độc lập với nhau, mỗi phép
thử có 2 kết cuộc là thành công hay thất bại với xác suất thành công trong mỗi lần thử là
p. Hãy tính xác suất có x lần thành công.

. có 5C3 = 5!/[3!x2!] = 10 cách khác nhau (đó là TGTTG. Để tính xác suất trong 5 lần sinh này có đúng 3 lần sinh là con trai có thể lập luận như sau: . Trong một mẫu 10 trẻ dưới 5. Nếu chúng ta xem xét kết quả của 5 lần sinh. Hãy tính xác suất trong một đơn vị thời gian có x lần xuất hiện kết cục này.1937.032 = 0. Áp dụng công thức hàm mật độ xác suất nhị thức ta được x f ( x)  P ( X  x)  N C x p (1  p ) x x Nx     1  x  x! N  N N ( )  x x  e   x!  e  f ( X  x)  x! ( N  x) N  ( N  1)  .032. TTGGT. and p = 0. x = 2. Trong trường hợp này xác suất là 0.Ðể trong 5 lần sinh có 3 lần sinh con trai. Để tính xác suất có đúng 2 thanh niên hút thuốc lá trong nhóm 10 thanh niên chúng ta có thể sử dụng hàm mật độ xác suất nhị thức với n = 10.52 không thay đổi trong các lần thử. . tính xác suất có đúng 4 bị suy dinh dưỡng. GGTTT.48 ( 53)  0.52 3  0.1406 = 0. Thí dụ: Giả sử có 30% trẻ dưới 5 tuổi bị suy dinh duỡng. tỉ lệ sinh con trai là 52%. TTGTG. TGGTT. TTTGG.Khi thực hiện n lần thử chúng ta sẽ có 2n kết cục. GTTTG.1. Khi đó bài toán có thể được đặt dưới dạng: Thực hiện thử nghiệm nhị thức với N lần thử đồng nhất và xác suất xảy kết cuộc quan tâm trong mỗi lần thử là /N.2304 x 0.32. Phân phối Poisson Bài toán: Giả sử trong một đơn vị thời gian trung bình có  lần xuất hiện kết cục quan tâm. Khi đó xác suất xảy ra kết cục quan tâm trong một phân tử thời gian là /N.32 Thí dụ: Cho rằng 10% thanh niên trong dân số là hút thuốc lá. GTTGT). 3. Xác suất xảy ra của một cách như vậy = 0. TGTGT. Giả định một đơn vị thời gian được chia thành N phân tử thời gian với N là một số vô cùng lớn.52 3(1-0.  ( N  x  1)          1  x! N  N  ( N  x) . Áp dụng hàm mật độ xác suất nhị thức ta được f (3)  P ( X  3)  5 C 3  0. Trong đó số kết cục có x lần thành công là = px(1-p)n-x và số kết cục có x lần thành công là nCr Vì vậy. xác suất có x lần thành công sau n lần thử là P ( X  x )  n C x p x (1  p ) ( n  x ) Do xác suất này phụ thuộc vào x nên nó là hàm số của x và được gọi là hàm khối xác suất nhị thức (binomial probability mass function) f ( x)  P( X  x )  n C x p x (1  p ) ( n  x ) Thí dụ: giả sử trong một dân số nhất định.52)2= 0.. Như vậy xác suất trong 5 lần sinh có 3 lần sinh là con trai là 10 x 0.Chúng ta cũng có thể xem 5 lần sinh là thử nghiệm nhị thức gồm 5 lần thử đồng nhất và mỗi lần thử có hai kết cuộc (sinh con trai và sinh con gái ) và xác suất sinh con trai là 0. GTGTT.

Hãy tính xác suất trong t đơn vị thời gian có x lần xuất hiện kết cục này. b. trung bình số lần xuất hiện biến cố trong một đơn vị thời gian. Qua hàm khối của phân phối Poisson có thể nhận xét nếu trung bình số lần xuất hiện của biến cố trong một đơn vị thời gian là  thì trung bình số lần xuất hiện của t đơn vị thời gian là t. ta có thể phân loại trọng lượng sơ sinh thành nhiều nhóm nhỏ (thí dụ như từ ( Nt  x ) .. có 1 trường hợp cấp cứu nào. Tính xác suất a. . Hàm khối xác suất Poisson được trình bày công thức sau x f ( X  x)  x ( t ) x e  t x! với  là tham số của phân phối và là số lần xuất hiện trung bình của biến cố trong một khoảng thời gian nhất định (hay trong một không gian nhất định) và e=2..7183. Tỉ suất Số lần xuất hiện trung bình của biến cố trong một đơn vị thời gian. Giả định một đơn vị thời gian được chia thành N phân tử thời gian với N là một số vô cùng lớn. 4.  là đại lượng có đơn vị. Như vậy trong t đơn vị thời gian có Nt phân tử thời gian. phân phối Poisson được dùng làm mô hình cho số lần xuất hiện các biến số thuận lợi trong một khoảng thời gian (t đơn vị thời gian) khi đã biết . c. Vào ngày 12 tháng 8 năm 2003. Phân phối xác suất của biến liên tục Giả sử ta muốn tìm phân phối xác suất của biến liên tục (thí dụ như trọng lượng của trẻ sơ sinh). Khi đó bài toán có thể được phát biểu dưới dạng: Thực hiện thử nghiệm nhị thức với Nt lần thử đồng nhất và xác suất xảy kết cuộc quan tâm trong mỗi lần thử là /N. Vào ngày 12 tháng 8 năm 2003.7183 Bài toán: Giả sử trong một đơn vị thời gian trung bình có  lần xuất hiện kết cục quan tâm.  ( Nt  x  1)          1  x! N  N   Nt ( ) ( ) ( t ) x e  t N xt x     t x     1   1       x! N x  N x!  N x! Một cách tổng quát. có đúng 2 trường hợp cấp cứu. Trong một tuần có 7 trường hợp cấp cứu. Khác với xác suất. Áp dụng công thức hàm mật độ xác suất nhị thức ta được x f ( x )  P ( X  x)  Nt C x p (1  p ) x  Nt ( Nt  x ) Nt  ( Nt  1)  . Thí dụ: Giả sử số lần nhập viện trong ngày cấp cứu ở một bệnh viện có phân phối Poisson với số lần nhập viện trung bình là 3 lần/ngày. Xác suất xảy ra kết cục quan tâm trong một phân tử thời gian là /N. còn được gọi là tỉ suất (rate) hay mật độ mắc mới (incidence rate).để nắm vững các phép biến đổi đại số kể trên cần nhớ lại định nghĩa của số e (cơ số của logarithm Neper)  1 e  lim  1   U   U  U =2.

2.2) Phân phối bình thường có 4 đặc tính quan trọng sau: .Phần diện tích ở dưới đường cong. càng xa giá trị  hàm mật độ càng giảm . Hình 2 là đồ thị của phân phối xác suất bình thường với trung bình là 0 và độ lệch chuẩn là 1.1 kg. Phân phối bình thường Phân phối bình thường là phân phối xác suất liên tục phổ biến nhất.1kg đến < 2. Hình 1.Hàm mật độ tiến tới zero ở các giá trị cách xa  . kí hiệu là P(Xx) hay F(x) được gọi hàm phân phối (distribution function) của biến ngẫu nhiên X 5.Hàm mật độ đối xứng qua đường thẳng đứng đi qua  .0kg đến < 2.2 kg. .Ða giác tần suất sẽ trở thành đường cong trơn và được gọi là hàm mật độ (density function) của phân phối với kí hiệu là f(x) . được bao quanh bởi trục x và hai đường thẳng vuông góc đi qua a và b sẽ là P (a < X ≤ b). Khi đó biến liên tục sẽ trở thành biến số rời rạc và ta có thể dùng phương pháp phân phối xác suất của biến rời rạc cho loại biến số này.v). v. từ 2. Nếu chúng ta lại chia thành những nhóm nhỏ hơn. Để thể hiện biến số X có phân phối bình thường với trung bình là  và phương sai 2 còn có thể sử dụng kí hiệu X  N(. Phân phối xác suất bình thường .Mật độ cao nhất tập trung ở quanh giá trị . phân phối sẽ tinh vi hơn và: .Phần diện tích ở dưới đường cong nằm ở bên trái của đường thẳng vuông góc đi qua x là xác suất biến số ngẫu nhiên nhỏ hơn hay bằng x.Phân phối bình thường là phân phối có hàm mật độ: f ( x)  2 2 1 e  ( x   ) / 2 2 Với  là trung bình của phân phối với  và 2 là phương sai là độ lệch chuẩn và phương sai của phân phối.

thương số thông minh. trục x được gọi là trục z.96 Phân phối bình thường chuẩn hay còn gọi là phân phối chuẩn là phân phối bình thường có trung bình là zero và độ lệch chuẩn =1.96 độ lệch chuẩn là 95%. Phân phối bình thường có thể biến thành phân phối chuẩn nếu ta tạo biến ngẫu nhiêu mới z = (x-)/.96 độ lệch chuẩn đến trung bình + 1. trên trục Z. tính P(Z  2. X~N(.71).96) = 0.96 <X <  + 1.1. . chiều cao người trưởng thành.55. Thí dụ: Cho một phân phối chuẩn. nếu dùng mô hinh phân phối bình thường thì chúng ta có thể có những suy luận xác suất tiện lợi hơn rất nhiều so với việc sử dụng những phương pháp phức tạp khác.55 đến +2. Thí dụ: Cho một phân phối bình thường. có nhiều phân phối có thể được coi là xấp xỉ bình thường. Ứng dụng phân phối bình thường Mặc dù trong thực tế.95 Hay nói khác đi. không có một phân phối nào là phân phối bình thường một cách chính xác.2) => P( . Thí dụ: tính xác suất Z được chọn bất kì trong dân số có phân phối bình thường có giá trị từ -2.. Những phân phối được coi là xấp xỉ bình thường là trọng lượng trẻ sơ sinh. nằm giữa z=-1 và z=2. 1 z2 / 2 f ( z)  e 2 Lưu ý: trong phân phối chuẩn. chỉ có 5% giá trị của biến số X nằm ngoài khoảng   1. xác suất giá trị biến số nằm từ trung bình – 1. tìm diện tích nằm dưới đường cong.Ngoài ra từ hàm mật độ của phân phối bình thường người ta chứng minh được nếu biến số có phân phối bình thường với trung bình là  và độ lệch chuẩn . Khi đó. 6.

46% trẻ 32 tháng có trọng lượng 13 kg hay nhẹ hơn nên cân nặng này không phải là bất thường.96 là giá trị bất . P(IQ<120) = P(Z<(120-100)/15) = P(Z<1.2) – P(Z <-1.000. Thành phố Hồ Chí Minh (trung bình=92. Phân phối của phần trăm so với trọng lượng chuẩn của 1750 trẻ em học sinh nhà trẻ Hoa Hướng Dương 15.66) = 1 – 0. độ lệch chuẩn =10) a.9918 = 0.6 < Z < 1.2.P(Z<2. P(40 < TL < 68) = P(-1.Hình 3. đứa trẻ 32 tháng bình thường có trọng lượng trung bình là 14 kg với độ lệch chuẩn là 1.2) = P(Z< 1.6) Áp dụng quy tắc: muốn tìm P(Z <z) với z âm. ta tính P của trị tuyệt đối của Z rồi lấy 1 trừ cho số đó P(Z <z)=1. Ước lượng tỉ lệ dân số có một thuộc tính nhất định Thí dụ:Thương số thông minh trong một dân số có trung bình =100 và độ lệch chuẩn 15. hãy ước tính ở thành phố Hồ Chí Minh có bao người có trọng lượng lớn hơn 80 kg.33) =0.P(Z<|1.2) = P(Z< 1. chúng ta phải xét hiện tượng đứa trẻ 32 tháng nặng 9 kg có phổ biến hay không.4) = 1-0.4) = 1. Tính xác suất một người đàn ông được chọn ngẫu nhiên có trọng lượng ở giữa 40 kg và 68 kg.2546 Vì có đến 25.0039 Nghĩa là trong 1000 trẻ chỉ có khoảng 4 trẻ có trọng lượng 9 kg hay nhẹ hơn.9961 = 0.6) = 1 .P (Z <|z|) ta có P(Z< . P(TL <13) = P(Z < . Chẩn đoán cho cá nhân Thí dụ: Theo tổ chức y tế thế giới. Chấp nhận giả định ở thí dụ trên.66) = 1 – P(Z>2. Vì vậy đứa trẻ này được xem là suy dinh dưỡng. Người ta quy ước nếu xác suất xảy ra một trị số nào đó hay cực đoan hơn trị số đó nhỏ hơn 5% thì trị số đó là bất thường. Áp dụng tính chất thứ tư của phân phối bình thường.1.000.6|) Ta được: P(40 < TL < 68) = P(-1.9452) = 0.0082 Vì vậy số đàn ông nặng hơn 80 kg = 1. P(TL > 80) = P(Z> (80-56)/10) = P(Z>2.8301 Thí dụ: Trong thành phố Hồ chí minh có cả thẩy 1.0. P(TL <9) = P(Z < . Chọn ngẫu nhiên một người trong dân số này. Một đứa trẻ 32 tháng nặng 13 kg có phải là bất bình thường về dinh dưỡng hay không? Ðể trả lời câu hỏi này chúng ta phải xét hiện tượng đứa trẻ 32 tháng nặng 13 kg có phổ biến hay không.7454 = 0. Ðứa trẻ 32 tháng nặng 9 kg có phải là bất thường về dinh dưỡng hay không? Tương tự như câu hỏi trước đó.6 < Z < 1.5 kg.66) = 1 – P(Z>0.8849 – (1 – 0.2) – P(Z <-1. điều này có thể phát biểu là nếu giá trị nào nằm ngoài khoảng   1.00820 = 8200 người b.000 đàn ông trên 20 tuổi.000 x 0. Q11.9082 Thí dụ: Giả sử trọng lượng của đàn ông ở thành phố Hồ chí Minh có phân phối chuẩn và có trung bình là 56 kg và độ lệch chuẩn 10 kg.66) = 1 – 0. tính xác suất người này có thương số thông minh nhỏ hơn 120.6) = 0.

96  10 < đường huyết < 100 + 1. Thí dụ: nếu đường huyết có phân phối bình thường với trung bình là 100 mg% và độ lệch chuẩn là 10 mg%.+P(X=8) = 1.96 là giá trị bình thường..264 c. Trong khoa lây của bệnh viện.96 là giá trị bình thường. Như vậy quan sát 10 phép thử đồng nhất và độc lập với nhau. b.96 lần độ lệch chuẩn (tương ứng với |Z|>1.0.3874 Nên xác suất có ít nhất 2 người bị chết bằng: 1 . tính xác suất ở một gia đình nhất định có: a.1. Có ít nhất hai người bị chết c. xác suất có ít nhất hai người bị chết là: P(X=0)+P(X=1)+.thường và giá trị nằm trong khoảng   1. Xác suất không có ai sống sót = Xác suất số thành công bằng 0 = P(X=0)= = 10C0 p0(1-p)(10-0) =10C10 .96  10 hay từ 80-120 mg% Bài tập Bài tập phân phối nhị thức 1.. 0. Giả sử bệnh nhân bị viêm màng não có tỉ lệ tử vong là 10%.0574. Có đúng 3 người bị chết Bài giải: Có thể xem diễn tiến của một bệnh nhân viêm màng não là một phép thử. Gọi X là số lần thành công ta có f ( x)  P( X  x )  n C x p x (1  p ) ( n  x ) a.. Nếu số chuột tuân theo phân phối Poisson...3486 Và P(X=9) = 10C9 p9(1-p)(10-9) = 0.96) thì giá trị đó là bất bình thường..1.110=1/(1010) Xác suất là 1 phần mười tỉ.99 = 0.. Không có con chuột nào? b.0. mỗi phép thử có 2 kết cuộc là thành công hay thất bại với xác suất thành công trong mỗi lần thử là 0. hiện có 10 bệnh nhân bị viêm màng não. Tính xác suất: a. Bài tập phân phối Poisson Biết rằng số chuột trung bình trong mỗi hộ gia đình ở Cần thơ là 1. 0.910 = 0. Hỏi khoảng giá trị bình thường của đường huyết là bao nhiêu? Khoảng giá trị bình thường của đường huyết tương ứng với .0.96 hay 100 .3874 = 0. Xác suât có đúng 3 người bị chết là = Xác suất có 7 người sống: P(X=7) = 10C7 p7(1-p)(10-7) = 120 . Ta có P(X=0)+P(X=1)+P(X=2)+P(X=3)+. Không có ai sống sót b.96 < Z < 1. Và giá trị tương ứng với | Z|<1.. Có một con chuột? ..4 con.3486 ..0. Do đó.9..90.13 = 0.110 =10!/(0!10!).97 . Phát biểu theo cách khác nếu khoảng cách giữa một trị số đến giá trị trung bình lớn hơn 1..P(X=9)-P(X=10) Với P(X=10) = 10C10 p10(1-p)(10-10) = 0. 0.+P(X=10) = 1 It nhất hai người bị chết nghĩa là là có từ 0 đến 8 người sống.

Sử dụng công thức  x e  f ( x)  x! P(X=x) = với  = 1.247 .247 x 1. Bài giải 1.5)=2 x 0.40 / 0! = 0.b.5) = P(Z  0.242 = 0.5}= P{Z >2. P(X=1) = 0.40 / 0! = 0.3830.5) .5 = 0.P(Z  -0.c.247 P(X=1) = 0.1056 2.41 / 1! = 0.8944 = 0.8413 .6915 .346 c. = P(-1 < Z  0) = P(0 < Z  1) = P(Z  1) . 2.25) = 1 .0062 2.c.1 + P(Z  0. Có từ 3 con chuột trở lên? Bài giải: a.0. hemoglobin máu.0. đường huyết. Hct. 2. P(190 < cholesterol  210) = P{(190-200)/20 < Z  (210-200)/20} = P(-0. P(180 < cholesterol  200) = P{(180-200)/20 < Z  (200-200)/20} 2.247 x 1.a.0.9938=0. Hãy liệt kê 10 biến số ngẫu nhiên mà anh chị nghĩa rằng nó là phân phối xấp xỉ bình thường. P(cholesterol  150) = P{Z  (150-200)/20} = P{Z  -2.247 x 1. Tính xác suất một cá nhân được chọn ngẫu nhiên có giá trị cholesterol (a) từ 180 đến 200 mg/100ml (b) lớn hơn 225 mg/100 ml (c) nhỏ hơn 150 mg/100ml (d) giữa 190 và 210 mg/100 ml. Vì P(X=0)+P(X=1)+P(X=2)+P(X3) =1 Ta có P(X(3) = 1 . . Những biến số có phân phối xấp xỉ bình thường là : chiều cao của đàn ông trưởng thành.3413 P(cholesterol > 225) = 1-P(cholesterol  225) = 1.1 = 0.5}=1-0. chu vi vòng cánh tay.P(Z  1.0.346 .5 < Z  0.165 Phân phối bình thường 1.P(X=0) . tỉ trọng nước tiểu. cholesterol huyết thanh.41 / 1! = 0.P(Z >0.42 / 2! = 0.5) . Nếu hàm lượng cholesterol huyết thanh là phân phối xấp xỉ bình thường với trung bình là 200mg/100 ml và độ lệch chuẩn là 20 mg/100ml. trọng lượng trẻ sơ sinh.346 P(X=2) = 0.P{Z  (225-200)/20} = 1 .d.247 x 1.5) = P(Z  0.242 Nên P(X  3) = 1 . nhịp tim.P(Z  0) = 0.5}= 1-P{Z  2.247 x 1. tuổi dậy thì của phụ nữ.5) .247 b.P(X=1) .5)= P(Z  0.0.P(X=2) Với P(X=0) = 0.4 và x = 0 ta được P(X=0) = 0.