You are on page 1of 19

CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 27

CHƯƠNG 2
Mục lục chương 2

2.1 Phân phối nhị thức ................................................................................................. 27


2.2 Phân phối siêu bội .................................................................................................. 31
2.3 Phân phối Poisson .................................................................................................. 35
2.4 Phân phối chuẩn..................................................................................................... 36
2.5 Phân phối Chi bình phương ..................................................................................... 40
2.6 Phân phối Student .................................................................................................. 42

2.1 Phân phối nhị thức


Định nghĩa (Phép thử Bernoulli). Phép thử mà ta chỉ quan tâm đến biến cố A có xảy ra hay
không được gọi là phép thử Bernoulli.

Ví dụ 2.1 Một sinh viên thi kết thúc môn học A, ta quan tâm kết quả sinh viên này thi có đạt hay
không đạt. Phép thử này là phép thử Bernoulli.
Định nghĩa (Biến ngẫu nhiên Bernoulli). Thực hiện một phép thử Bernoulli, ta quan tâm đến
0 NÕu biÕn cè A kh«ng x¶y ra
biến cố A có xảy ra hay không. Đặt : X  
1 NÕu biÕn cè A x¶y ra
Giả sử P  A   P  X  1  p . Khi đó biến ngẫu nhiên X được gọi là biến ngẫu nhiên Bernoulli với
tham số p, ký hiệu X ~ B  p 

Bảng phân phối xác suất của biến ngẫu nhiên Bernoulli có dạng
X 0 1
P q =1−p p
Dựa vào bảng phân phối xác suất của biến ngẫu nhiên Bernoulli có EX  p và VarX  pq
Ví dụ 2.2 Sinh viên A trả lời một bài tập trắc nghiệm có bốn lựa chọn trong đó chỉ có một lựa
chọn đúng, giả sử sinh viên này chọn câu trả lời một cách ngẫu nhiên. Ta đặt biến ngẫu nhiên
0 nÕu sinh viªn tr¶ lêi sai.
X 
1 nÕu sinh viªn tr¶ lêi ®óng.
thì X ~ B  p  . Bảng phân phối xác suất của X
X 0 1
28

P 3/4 1/4

Trong thực tế ta thường thực hiện liên tiếp nhiều phép thử Bernoulli và đếm số lần xảy ra biến cố
A trong các lần thực hiện đó. Phân phối xác suất số lần xảy ra A được trình bày ở mục kế tiếp.
Định nghĩa (Phân phối nhị thức).Thực hiện n phép thử Bernoulli độc lập với xác suất xảy ra
biến cố A trong mỗi phép thử là p. Đặt biến ngẫu nhiên
0 nÕu biÕn cè A kh«ng x¶y ra ë phÐp thö thø i.
Xi  
1 nÕu biÕn cè A x¶y ra ë phÐp thö thø i.
Biến ngẫu nhiên X  X 1  X 2  ...  X n chỉ số lần A xảy ra trong n lần thực hiện.
Biến ngẫu nhiên X được gọi là có phân phối nhị thức tham số n và p; ký hiệu X ~ B  n, p 

Ví dụ 2.3 Quan sát quyết định mua hàng của 5 khách hàng bước vào một cữa hàng quần áo. Dựa
trên kinh nghiệm từ trước, quản lý cửa hàng ước lượng xác suất khách hàng sẽ mua hàng là 0,3
và biết các khách hàng mua hàng độc lập với nhau. Các vấn đề liên quan đến số lượng khách hàng
mua hàng như:
a. Xác suất có 3 khách hàng sẽ mua hàng là bao nhiêu.
b. Trung bình sẽ có bao nhiêu khách hàng sẽ mua hàng.
c. Độ lệch trung bình xung quanh giá trị trung bình của khách hàng sẽ mua hàng là bao nhiêu.
d. Số khách hàng chắc chắn nhất sẽ mua hàng hàng là bao nhiêu.

Ví dụ 2.4 Một xạ thủ bắn 3 phát đạn vào một mục tiêu một cách độc lập, xác suất trúng mục tiêu
ở mỗi lần bắn là 0,7. Gọi các biến ngẫu nhiên:
0 nÕu ph¸t thø i kh«ng tróng môc tiªu.
Xi  
1 nÕu ph¸t thø i tróng môc tiªu.
Vậy biến ngẫu nhiên : X  X 1  X 2  X 3 ~ B 3;0.7  là số phát trúng mục tiêu trong 3 phát. Giá trị
có thể của X là 0; 1; 2:
Ta thử tính xác suất có 2 phát trúng mục tiêu:
0.7  0.7  0.3  0.72  0.3 nÕu viªn 1,2 tróng.
2
P  X  2   0.7  0.3  0.7  0.72  0.3 nÕu viªn 1,3 tróng.  3  0.72  0.3  C32 0.7   0.3
0.3 0.7  0.7  0.72  0.3 nÕu viªn 2,3 tróng.

Định lý. Biến ngẫu nhiên X ~ B  n, p 


i. Xác suất có đúng k lần biến cố A xảy ra P  X  k   Cnk pk q nk ; k  0,..., n
ii. EX  np
iii. VarX  npq với q = 1- p
iv. np  q  ModX  np  q  1 , người ta còn gọi ModX là số lần xuất hiện tin chắc nhất.

Chứng minh.
Bởi vì X ~ B  n, p  cho nên : X  X 1  X 2  ...  X n .

Với X i ~ B  p  . Kỳ vọng EX  EX 1  EX 2  ...  EX n  np


Các biến ngẫu nhiên X 1 , X 2 ,..., X n độc lập nên : VarX  VarX 1  VarX 2  ...  VarX n  npq
Pk P X  k n  k  1 p  1
Gọi Pk  P  X  k  ; xét tỷ số  
Pk 1 P  X  k  1 kq
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 29

suy ra Pk là dãy không giảm khi và chỉ khi k  np  q  1


Pk
Tương tự  1 là dãy không tăng khi và chỉ khi k  np  q
Pk 1
Từ hai điều trên ta thu được:
np  q  ModX  np  q  1
Ví dụ 2.5 Một bài thi trắc nghiệm có 10 câu hỏi, mỗi câu hỏi có bốn lựa chọn trong đó chỉ có một
lựa chọn đúng. Một sinh viên trả lời ngẫu nhiên tất cả các câu. Gọi X là số câu trả lời đúng của sinh
viên này.
a. Tính xác suất sinh viên trả lời đúng 2 câu.
b. Tính giá trị kỳ vọng, phương sai và Mod của biến ngẫu nhiên X.

BNN Mật độ Phân phối


0 0.0563135 0.0563135
1 0.1877117 0.2440252
2 0.2815676 0.5255928
3 0.2502823 0.7758751
4 0.145998 0.9218731
5 0.0583992 0.9802723
6 0.016222 0.9964943
7 0.0030899 0.9995842
8 0.0003862 0.9999704
9 2.861E-05 0.999999
10 9.537E-07 1
Hình 2.1: Đồ thị f  x  và F  x  của X ~ B 10;0.25
1 nÕu tr¶ lêi ®óng c©u i.
Giải. Gọi biến ngẫu nhiên X i  
0 nÕu tr¶ lêi sai c©u i.
Trong đó P  X i  1   0.25 ; i  1,...10 .Biến ngẫu nhiên số câu đúng
X  X 1  X 2  ...  X 10 ~ B 10;0.25 
a. Xác suất sinh viên trả lời đúng 2 câu :
2 2 8
P  X  2  C10  0.25 . 0.75  0.2816
b. Kỳ vọng của biến ngẫu nhiên X :
EX  np  10  0.25  2.5
và phương sai :
VarX  npq  10  0.25  0.75  1.875
số lần xuất hiện chắc nhất (ModX ) thỏa điều kiện :
np  q  ModX  np  q  1
thay số vào ta được :

vậy ModX  3
30

X ~ B 10;0.25 X ~ B 10;0.5  X ~ B 10;0.75


Hình 2.2: Đồ thị f  x  và F  x  của X ~ B 10;0.25 ; B 10;0.5 ; B 10;0.75

X ~ B 5;0.5 X ~ B 10;0.5  X ~ B 15;0.5 


Hình 2.3: Đồ thị f  x  và F  x  của X ~ B 5;0.5  ; B 10;0.5 ; B 15;0.5 
Trong EXCEL, phân phối nhị thức được tính thông qua lệnh : BINOM.DIST
Number_s : số lần thành công
k 
Trials : số lần thực hiện phép
thử  n
Probability_s : xác suất 1 lần
thành công  p 
Cumulative : bằng 0 nếu là
hàm mật độ xác suất, bằng 1
nếu là hàm phân phối.
Ví dụ 2.6 Với X ~ B 10;0.5
P  X  5  0.2461

Ví dụ 2.7 Có 9% sinh viên đại học nợ thẻ tín dụng lớn hơn 7000 USD (Reader Digest, tháng 7,
2002). Giả sử chọn ngẫu nhiên 10 sinh viên đại học để phỏng vấn về việc sử dụng thẻ tín dụng.
Giả sử số sinh viên có mức dư nợ thẻ tín dụng cao hơn 7000 USD, thì X là biến ngẫu nhiên có phân
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 31

phối nhị thức.


a. Tính xác suất có 2 sinh viên có mức dư nợ thẻ tín dụng cao hơn 7000 USD. Cần tính P  X  2
2 2 8
P  X  2  C10  0.09 1  0.09  0.1714
b. Tính xác suất không có sinh viên nào có mức dư nợ thẻ tín dụng cao hơn 7000 USD.
0 0 10
P  X  0  C10 0.09 1  0.09  0.3894
c. Tính xác suất có ít nhất 3 sinh viên có mức dư nợ thẻ tín dụng cao hơn 7000 USD.
P  X  3  P 3  X  10   1   P  X  0   P  X  1   P  X  2   0.9460

2.2 Phân phối siêu bội

Định nghĩa (phân phối siêu bội) một tập  gồm có N phần tử, trong đó có NA phần tử có
tính chất A và N — NA phần tử không có tính chất A. Từ tập  ta lấy ngẫu nhiên n phần
tử (lấy một lần n phần tử hoặc lấy n lần không hoàn lại mỗi lần một phần tử).

Gọi X là số phần tử có tính chất A lẫn trong n phần tử lấy ra từ tập  . Khi đó X là biến
0  k  n
ngẫu nhiên rời rạc nhận giá trị k sao cho 
n   N  N A   k  N A
C Nk A C Nn kN A
PX  k ; k S
C Nn
Biến ngẫu nhiên rời rạc X được gọi là có phân phối siêu bội với tham số N; NA; n, ký
hiệu X ~ H  N ; N A ; n

Ví dụ 2.8 Siêu thị mở đợt khuyến mãi dành cho khách hàng mua 5 sản phẩm từ một lô hàng gồm
15 sản phẩm trong đó có 5 sản phẩm loại A và 10 sản phẩm loại B. Quản lý muốn quan tâm về số
lượng sản phẩm mà khách hàng mua như sau:
a. Trong 5 sản phẩm khách hàng chọn, xác suất có 3 sản phẩm loại A là bao nhiêu.
b. Trung bình có bao nhiêu sản phẩm loại A mà khách hàng sẽ mua trong 5 sản phẩm.
c. Độ lệch chuẩn về số sản phẩm A mà khách hàng mua trong 5 sản phẩm.
d. Số sản phẩm A chắc chắn nhất mà khách hàng sẽ mua trong 5 sản phẩm.

Ví dụ 2.9 Bộ phận marketing của một dooanh nghiệp có 50 nhân viên trong đó có 30 nhân
viên nữ. Cần chọn 10 nhân viên tiếp thị cho một sản phẩm mới, giả sử khả năng được chọn
của các nhân viên là như nhau. Gọi X là số nhân viên nữ được chọn. Tính xác suất có
a. Không quá 3 nhân viên nữ được chọn.
b. Ít nhất một nhân viên nữ được chọn
Giải.
X là số nhân viên nữ được chọn, khi đó X ~ H 50;30;10
a. Xác suất không quá 3 nhân viên nữ được chọn :
P  X  3   P  X  0   P  X  1   P  X  2  P  X  3 
0 10 1 9 2 8 3 7
C30C20 C30 C20 C30 C20 C30 C20
 10
 10
 10
 0
 0.03648
C50 C50 C50 C50
b. Xác suất ít nhất một nhân viên nữ được chọn :
32

0 10
C30C20
P  X  1  1  P  X  1  1  P  X  0  1  10
 0.99998
C50

BNN MẬT ĐỘ PHÂN PHỐI


0 1.799E-05 1.799E-05
1 0.0004905 0.0005085
2 0.0053344 0.005843
3 0.0306389 0.0364818
4 0.1034063 0.1398881
5 0.215085 0.3549731
6 0.2800586 0.6350317
7 0.2259296 0.8609613
8 0.1082579 0.9692193
9 0.0278558 0.9970751
10 0.0029249 1
Hình 2.4: Hàm f  x  và F  x  của X ~ H 50;30;10

Định lý. Trong mô hình phân phối siêu bội, khi thực hiện phép thử ta lấy liên tiếp n
lần không hoàn lại, mỗi lần lấy một phần tử. Ta gọi
1 nÕu lÇn i lÊy ®­îc phÇn tö lo¹i A.
Xi  
0 nÕu lÇn i kh«ng lÊy ®­îc phÇn tö lo¹i A.
i. Xác suất mỗi lần lấy phần tử A là như nhau, nghĩa là
NA
P  X i  1  ; i  1,..., n
N
ii. Với mọi i  j thì
NA N A  1
P  X i  1; X j  1 
N N 1

Chứng minh: Đặt các biến


Ai : “ trong n lần đầu có i phần tử loại A”, i  1,..., n
i. Xác suất lần n+1 lấy được phần tử loại A là
P  X n 1  1  P  A0  P  X k  1  A | A0   ...  P  An  P  X k 1  1| An 
k n k
n
N A  k C NA C N  NA 1  n n

 . n
 N C k C nk   kC Nk A C NnkNA 
n  A  N A N N A
k 0 N  n CN  N  n  C N  k 0 k 0 
n
1  n N A k 1 n  k  NA  n n1 k 1 n 1  k 1 
 N  n  C Nn  A N k 1 k NA 1 N NA   N  n C Nn  N 

  N C  k C C   C  C N A 1C N 1 NA 1 
k 1 
NA NA  n n n NA  n  NA

 N  n  N
C n  
CNn  C Nn11 
 nC Nn
N 
C N  C N  
 N
1   
   n  N  N
N
ii. Không mất tính tổng quát, ta giả sử j > i
N N 1
P  X i  1; X j  1  P  X i  1 P  X j  1| X i  1  A . A
N N 1
N 
Nhận xét : Ta thấy biến ngẫu nhiên X i ~ B  A  nên kỳ vọng và phương sai
 N 
NA N N  NA
EX i  ; Var  Xi   A .
N N N
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 33

NA NA  1
  
Kỳ vọng của tích E X i X j  P Xi  1; X j  1   .
N N 1
2
N 
Và tích của hai kỳ vọng EX i .EX j   A 
 N 
Hiệp phương sai
Cov  X i ; X j   E  X i X j   EX i .EX j
2
N A N A  1  NA  N A  N  NA 
   2
N N  1  N  N  N  1

Định lý (Các đặc trưng của biến ngẫu nhiên siêu bội). Nếu biến ngẫu nhiên
X ~ H  N ; N A ; n thì
NA
i. Kỳ vọng EX  np với p 
N
N n
ii. Phương sai VarX  npq với q  1  p
N 1

iii. Giá trị Mod với


 n  1  N A  1   1  ModX   n  1 N A  1
N 2 N 2

Chứng minh.
NA
i. Ta có X  X 1  X 2  ...  X n nên EX  EX 1  EX 2  ...  EX n  n
N
ii. Khai triển phương sai cho biểu thức:
 n  n N N  NA N  N  NA 
Var   X i    Var  X i   2 Cov  X i ; X j   n A .  2Cn2 2
 i 1  i 1 i j N N N  n  1
NA N  N A N  N  NA  N N  NA  n1 
n .   n  1 n 2 n A .  1
N N N  n  1 N N  N  1 
NA N  N A  N  n 
n . .
N N  N  1 
iii. Gọi Pk  P  X  k  ; xét tỷ số
Pk P X  k  N  k  1 n  k  1 
  A
Pk 1 P  X  k  1 k N  NA  n  k 

suy ra Pk là dãy tăng khi và chỉ khi k 


 n  1  N A  1  k
0
N 2

và là dãy không giảm khi và chỉ khi k  k0


 Khi k0 không là số nguyên. k  ModX là số nguyên lớn nhất nhỏ hơn k0 :
 n  1  N A  1   1  ModX   n  1 N A  1
N 2 N 2
 Khi k0 là số nguyên. Ta có ngay ModX  k0  k vì khi k  k0 thì Pk là dãy không giảm.
Mặc khác, lúc này nên Pk  Pk 1 cũng là ModX :
 n  1  N A  1   1  ModX   n  1 N A  1
N 2 N 2
Từ hai trường hợp trên suy ra
34

 n  1 N A  1  1  ModX   n  1 N A  1


N 2 N 2
Ví dụ 2.10 Có một cái hộp chứa 8 quả cầu trắng và 3 quả cầu đen. Lấy ngẫu nhiên không
hoàn lại 4 quả cầu. Gọi X là số quả cầu trắng lấy được. Tính xác suất
a. Lấy được ít nhất 1 quả cầu trắng.
b. Lấy được 2 quả cầu trắng.
c. Tính EX và VarX .
Giải.
X là số bi trắng lẫn trong 4 bi lấy ra, X ~ H  11;8;4  .
a. P  X  1  1
C 82C32 14
b. P  X  2  4

C11 15
8 32
c. Kỳ vọng EX  np  4. 
11 11

N n 8 3 7 336
Phương sai VarX  npq  4. . . 
N 1 11 11 10 605

Trong EXCEL, phân phối siêu bội được tính bằng lệnh : HYPGEOM.DIST
Sample_s : là số phần tử thỏa A
được lấy ra  k 
Number_sample : là số phần tử
lấy ra  n 
Population_s : là số phần tử
thỏa A có trong tập hợp.  N A 
Number_pop : là tổng số phần
tử có trong tập hợp  N 
Cumulative : bằng 0 nếu là hàm
mật độ và bằng 1 nếu là hàm
phân phối
Ví dụ 2.11 : X ~ H 50;30;10 
P  X  5   0,3550

Ví dụ 2.12 Trong một cuộc khảo sát được thực hiện bởi Tổ chức Gallup, người tham
gia được hỏi: “Bạn thích môn thể thao nào?” Bóng đã Mỹ và bóng rổ xếp hạng nhất và
hạng hai về sở thích (www.gallup.com, ngày 03/01/2004). Giả sử rằng trong một nhóm
10 người, bảy người thích bóng đá và ba người thích bóng rổ. Xét một mẫu ngẫu nhiên
gồm 3 trong số 10 người trên.
a. Xác suất có đúng 2 người thích bóng đá là bao nhiêu?
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 35

C72C31
P  X  2  3
 0.525
C10
b. Xác suất mà phần lớn (hai hay ba người) thích bóng đá là bao nhiêu?
C72C31 C73C30
P  X  2  P  x  2  P  X  3  3
 3  0.8176
C10 C10
2.3 Phân phối Poisson
Trong phần này ta xét biến ngẫu nhiên rời rạc thường dùng để ước lượng số lần xảy ra trong
một khoảng thời gian hoặc không gian nhất định.
Ví dụ 2.13 Biến ngẫu nhiên chỉ số ôtô đến một cửa hàng rửa xe trong một một giờ, số hư
hỏng cần sửa chửa trên 10 dặm đường cao tốc, hoặc số lỗ lủng trên 100m ống dẫn nước.
Tính chất của phép thử Poisson:
1. Đối với hai khoảng bất kỳ có độ dài bằng nhau thì xác suất xảy ra bằng nhau.
2. Việc xuất hiện hoặc không xuất hiện trong khoảng này độc lập với trong khoảng khác.

Định nghĩa (Phân phối Poisson). Biến ngẫu nhiên rời rạc X nhận giá trị nguyên dương
k  0,1,2,... với xác suất
 k e 
P X  k  ; k  0,1,2,...
k!
được gọi là có phân phối Poisson với tham số  , ký hiệu X ~ P    .

Ví dụ 2.14 Tại một trường đại học mở một khóa học, và học viên đăng ký qua điện thoại, theo
kinh nghiệm trong những đợt ghi danh trước thì trung bình cứ 2 phút có 1 cuộc gọi đến. Để
đạt hiệu quả cao trong việc tiếp học viên, quản lý phòng ghi danh cần quan tâm đến việc bố trí
nhân viên trực phù hợp thông qua các vấn đề:
a. Xác suất có 5 học viên gọi đến trong 10 phút.
b. Trung bình có bao nhiêu học viên gọi đến trong 10 phút.
c. Độ lệch chuẩn về số lượng học viên gọi đến trong 10 phút.
d. Số lượng học viên gọi điện đến chắc chắn nhất trong 10 phút là bao nhiêu.

Ví dụ 2.15 Tại một nhà máy dệt, trung bình có 8 ống sợi bị đứt trong hai giờ. Tìm xác
suất để trong một giờ có không quá 2 ống sợi bị đứt.
Giải. Gọi X là số ống sợi bị đứt trong một giờ, X ~ P  4 . Ta cần tìm xác suất
40 e 4 41 e 4 42 e 4
P  X  2  P  X  0   P  X  1   P  X  2      13e 4
0! 1! 2!
BNN MẬT ĐỘ
0 0.0183156 0.25
1 0.0732626 0.2
2 0.1465251
3 0.1953668 0.15

…. …. 0.1
12 0.0006415
0.05
13 0.0001974
14 5.64E-05 0
15 1.504E-05 0 5 10 15

Hình 2.4: Hàm f  x  của X ~ P  4


Định lý (Các đặc trưng của biến ngẫu nhiên phân phối Poisson). Nếu biến ngẫu nhiên X
36

có phân phối Poisson với tham số  , X ~ P    thì:


i. Kỳ vọng EX   .
ii. Phương sai VarX   .
iii.   1  ModX  

Ví dụ 2.16 Ở một tổng đài điện thoại, trung bình có 50 cuộc gọi đến trong 5 phút. Tìm
xác suất để trong 1 phút:
a. Có đúng 5 cuộc gọi đến trong 1 phút.
b. Có ít nhất 2 cuộc gọi trong 1 phút.
Giải. Trung bình trong một phút có 10 cuộc gọi đến. Gọi X là số cuộc gọi đến tổng đài
trong 1 phút thì X ~ P 10 

a. Xác suất có đúng 5 cuộc gọi đến trong 1 phút.


105 e 10
P  X  5   0.0378
5!
b. Xác suất có ít nhất 2 cuộc gọi đến trong một phút.
P  X  2   1  P  X  2  1  P  X  1   1  P  X  0   P  X  1   0.9995

Ví dụ 2.17 Tại một trường đại học đăng ký khóa học bằng điện thoại, trung bình có 1 cuộc
gọi đến trong 2 phút.
a. Số cuộc gọi kỳ vọng trong một giờ là bao nhiêu?
b. Xác suất có 3 cuộc gọi trong vòng 5 phút là bao nhiêu?
c. Xác suất không có cuộc gọi nào trong một khoảng thời gian là 5 phút là bao nhiêu?
Giải.
a. Vì trung bình có 1 cuộc gọi đến trong 2 phút nên có 30 cuộc gọi đến trong một giờ (60
phút)
b. Xác suất có 3 cuộc gọi trong vòng 5 phút là bao nhiêu?
e 10  103
P  X  3   0,0076
3!
với X là số cuộc gọi đến trong 5 phút
c. Xác suất không có cuộc gọi nào trong một khoảng thời gian là 5 phút là bao nhiêu?
e 10  100
P  X  0   4.54  105.
0!

2.4 Phân phối chuẩn


Định nghĩa (Phân phối chuẩn). Biến ngẫu nhiên lên tục X nhận giá trị trong khoảng
 ;   được gọi là có phân phối chuẩn tham số  ,  0 . Ký hiệu  
X ~ N  ,  2 nếu hàm
mật độ xác suất có dạng
  x   2 
 
1  2 2 
f x  e  
 x 
 2
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 37

Hình 2.5: Hàm f  x  của X ~ N   ; 2 


Nhận xét
1
 Hàm mật độ chuẩn dạng hình chuông đối xứng qua x   và giá trị cực đại
 2 
tại x  
 Hình 2.6 là đồ thị của biến ngẫu nhiên chuẩn khi cố định   0 , thay đổi giá trị của
  2  0.2;1;5 . Đồ thị hàm mật độ của biến ngẫu nhiên chuẩn với  2  0.2 sẽ cao hơn
và ít phân tán xung quanh giá trị trung bình hơn so với các trường hợp phương sai lớn
hơn.

Hình 2.6: Hàm f  x  của X ~ N   ; 2 


Định lý (Các đặc trưng của biến ngẫu nhiên chuẩn). Nếu X là biến ngẫu nhiên có
phân phối chuẩn tham số  ; thì
i. EX   và VarX   2
ii. ModX  

Định nghĩa (Phân phối chuẩn tắc). Biến ngẫu nhiên Z có phân phối chuẩn với tham
số   0 và  2  1 được gọi là có phân phối chuẩn tắc, ký hiệu Z ~ N  0;1 Hàm mật độ
của Z ~ N  0;1
 z2 
1   
 2
f z  e ,  z 
2
Đồ thị hàm mật độ biến ngẫu nhiên chuẩn tắc Z ~ N  0;1 đối xứng qua trục tung,
38

Hình 2.7: Hàm f  x  của X ~ N 0;1 


x

Định nghĩa (Hàm Laplace). Cho Z ~ N  0;1  . Đặt   x    f  z  dz , 0  x gọi là hàm


0

Laplace (Giá trị   x  được tính sẵn trong bảng B.2 phần phụ lục)

Hình 2.8: Hàm Laplace   x 


z 0.00 0.01 0.02 0.06 0.07 0.08 0.09
… … … … … … … … …
1.7 0.4554 0.4564 0.4573 … 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 … 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 … 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 … 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 … 0.4846 0.4850 0.4854 0.4857
… … … … … … … … …
Đối với bảng tra B2 thì đo vùng xác suất   x  từ 0 đến cận x . Tức nếu biết cận thì sẽ tìm được
vùng xác suất và ngược lại.
Ví dụ :  1,96   0,475 , tức vùng xác suất từ 0 đến 1,96 trong quy luật phân phối chuẩn đơn giản
bằng 0,475.
Đối với bảng tra trong Excel ta dùng 2 lệnh sau:
 NORMSDIST(z) : đo vùng xác suất tới cận z trong quy luật phân phối chuẩn.
Ví dụ: Trong excel NORMSDIST 1,96   0,975 , ta có thể hiểu chênh lệch với kết quả trong bảng
tra là 0,5; là vùng xác suất từ  đến 0.
 NORMSINV(probability) : đo cận tương tứng với vùng xác suất tính từ  .
Ví dụ: Trong excel NORMSINV (0,975)  1,96
Nếu ta cần làm việc với phân phối chuẩn tổng quát, trong EXCEL có 2 hàm sau:
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 39

Hàm NORM.DIST
X: cận của vùng tính xác suất
P    X  x 
Mean: kỳ vọng   
Standard_dev: độ lệch chuẩn  s 
Cumulative: bằng 0 nếu là hàm mật
độ, bằng 1 nếu là hàm phân phối.
Hàm NORM.INV
Probability : giá trị xác suất tính từ
 đến cận cần tìm p  P    X  x 

Tính chất. Hàm Laplace   x  có các tính chất:


i.    x     x  .
ii.      0.5 và      0.5
iii. Nếu Z ~ N  0;1 thì P  a  Z  b     b     a 
X  b   a 
iv. Nếu X ~ N   ; 2  thì Z  ~ N  0;1 và P  a  X  b         
     

Ví dụ 2.18 Cho biến ngẫu nhiên X ~ N 0;1 ; tính các xác suất.
a. P  1  X  2 
b. P 1.5  X 
Giải. Theo tính chất iii
a. P  1  X  2    2    1   2   1  0.4772  0.3413  0.8185
b. P 1.5  X   P  1.5  X           1.5  0.5  0.4332  0.0668

Ví dụ 2.19 Điểm Toeic của sinh viên sắp tốt nghiệp ở trường đại học có phân phối
chuẩn với giá trị trung bình 560 và độ lệch chuẩn 78. Tính:
a. Tỷ lệ sinh viên có điểm nằm giữa 600 và 700.
b. Tỷ lệ sinh viên có điểm Toeic trên 500.
c. Giả sử nhà trường muốn xác định điểm Toeic tối thiểu để sinh viên có thể ra trường với tỉ lệ
80%. Tính điểm Toeic tối thiểu (lấy phần nguyên).
Giải. Gọi X là điểm Toeic của sinh viên sắp tốt nghiệp,
a. Tỷ lệ sinh viên có điểm nằm giữa 600 và 700
 700  560   600  560 
P  600  X  700       
 78   78 
  1,79    0,51  0,4633  0,1950  0,2683
b. Gọi k là đểm Toeic của sinh viên có thể ra trường. Theo giả thiết
40

   560   500  560 


P 500  X   P 500  X          
 78   78 
        0,77   0,50  0,2794  0,7794
c. Gọi k là điểm Toeic của sinh viên có thể ra trường. Theo giả thiết
 k  560   k  560 
P  k  X   0.8           0.8    78   0.3
 78   
k  560
Tra bảng B.2 ta được  0,84 vậy k  494 .
78

Ví dụ 2.20 Đối với người đi vay có điểm tính dụng tốt, nợ trung bình của các tài khoản trả dần và
tài khoản trả góp là 15015 USD (Business Week, 20/3/2006). Giả sử độ lệch chuẩn là 3540 USD
và tiền nợ có phân phối chuẩn.
a. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên cao hơn
18000 USD là bao nhiêu?
b. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên thấp hơn
10000 USD là bao nhiêu?
c. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên nằm giữa
12000 USD và 18000 USD là bao nhiêu?
d. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên không cao
hơn 14000 USD là bao nhiêu?
Giải.
Gọi X là tiền nợ của người đi vay có điểm tín dụng tốt. X ~ N 15015; 35402 
a. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên cao hơn 18
000 USD là bao nhiêu?
 18000  15015 
P  X  18000  0.5      0.5    0.84   0.5  0.2995  0.2005
 3540 
b. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên thấp hơn
10 000 USD là bao nhiêu?
 10000  15015 
P  X  10000      0.5    1.42  0.5  0.4222  0.5  0.0778
 3540 
c. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên nằm giữa
12000 USD và 18000 USD là bao nhiêu?
 18000  15015   12000  15015 
P 12000  X  18000       
 3540   3540 
   0.84     0.85  0.2996  0.3023  0.6019
d. Xác suất để tiền nợ của người vay có điểm tín dụng tốt được lựa chọn ngẫu nhiên không cao
hơn 14 000 USD là bao nhiêu?
 14000  15015 
P  X  14000      0.5    0.29   0.5  0.1141  0.5  0.3859
 3540 
2.5 Phân phối Chi bình phương
Định nghĩa (Phân phối Chi bình phương). Cho các biến ngẫu nhiên X 1 ,..., X n độc lập cùng
phân phối chuẩn tắc, X i ~ N  0;1 . Biến ngẫu nhiên  2  X 12    X n2 được gọi là có phân
phối Chi - bình phương với n - bậc tự do , ký hiệu  2 ~  2,n .
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 41

Với  2 được định nghĩa như trên, ta tìm được hàm mật độ của  2 . Trước hết ta nhận xét
  2
P X 12  x  0 với mọi x  0 . Nếu x  0 thì hàm phân phối xác suất của X1 là

    
P X 12  x  P  x  X 1  x  F  x  F   x  (*)
Trong đó F là hàm phân phối của biến ngẫu nhiên có phân phối chuẩn tắc. Lấy đạo hàm
ha i v ế c ủa (*), ta nhận được biểu t hứ c hàm mật độ của X12 là
 1  1   12 x2 
 x 2 e   khi x  0
 2

0 khi x  0

Hình 2.9: Hàm f  x  của X ~  2;k k  1 ; 2 ; 3; 4 ; 6 ; 9

Định lý (Các đặc trưng của phân phối Chi bình phương). Nếu biến ngẫu nhiên  2 ~  2,n
thì
i. Kỳ vọng EX  n
ii. Phương sai VarX  2n

Hình 2.10: Hàm f  x  của X ~  2;n


Tra bảng B4 phần phụ lục bảng tra phân phối Chi Bình Phương.
r … 0.995 0.01 0.99 0.015 0.985 …
… … … … … … … …
7 … 0.9893 18.4753 1.239 17.3984 1.4184 …
8 … 1.3444 20.0902 1.6465 18.9739 1.8603 …
9 … 1.7349 21.666 2.0879 20.5125 2.3349 …
10 … 2.1559 23.2093 2.5582 22.0206 2.8372 …
11 … 2.6032 24.725 3.0535 23.5028 3.3634 …
Dòng là bậc tự do n và cột là xác suất ở đuôi (phải) của quy luật phân phối
Ví dụ 2.21 2;10
 ~  2;10 , ta có  0.01  23,2093 , nghĩa là P    23,2093  1% .
42

Trong EXCEL, phân phối siêu bội được tính bằng lệnh : CHISQ.DIST và CHISQ.INV
Hàm CHISQ.DIST
X : cận vùng xác suất tính
từ 0 : P  0   2  x 
Deg_freedom: bậc tự do
n
Cumulative: bằng 0 nếu là
hàm mật độ, bằng 1 nếu là
hàm phân phối.
Hàm CHISQ.INV
Probability: Xác suất của
vùng tính từ 0 đến cận x :

p  P 0  2  x 

Ví dụ 2.22 Cho  2 ~  2,15 , tính P   2  32,8  và  0.975


2,15

Giải. Tra bảng B.5 ta tìm được : P   2  32.8   0.995

Và P   2  27.49   0.975 cho nên 0.975


2,15
 27.4884

2.6 Phân phối Student


Định nghĩa (Phân phối Student). Cho X ~ N  0;1  ; Y ~  2,n và X; Y độc lập. Khi đó biến ngẫu
nhiên
X n
T
Y
được gọi là có phân phối Student với n bậc tự do, ký hiệu T ~ T n .

Hình 2.10: Hàm f  x  của X ~ T n n  1 ; 2 ; 5; 


Bây giờ ta đi tìm hàm mật độ của biến ngẫu nhiên T ~ T n . Bởi vì X và Y độc lập cho nên
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 43

hàm mật độ đồng thời sẽ là g  x ; y   gX  x  gY  y  , với gX  x  và gY  y  lần lượt là hàm


mật độ của các biến ngẫu nhiên X và Y .
 x2  y 
1 

2 

g  x; y   e 

 n1 /2 n


2 2   
2
Thực hiện đổi biến:
W  Y Y  W
 
 X n  1
T  X  n T W
 Y 
Jacobian của phép đổi biến từ X và Y sang T và W là
y y 1 0
w t w
J  t w 
x x n
2 nw n
w t
 1  t 2  
n   1  w 
1 2
 2  n  
Suy ra f  t ; w   g  x t ; w  , y  t ; w   . J  w  
e
n
2
n 1 /2
2   
2
 n1   n 1 

2  

t2  2

Vậy hàm mật độ của T : fT  t   f  t ; w  dw  
 1   ;    x  
n n
0 n    
 2

Hình 2.11: Hàm f  x  của X ~ T n


Tra bảng B3 phần phụ lục bảng tra phân phối Student:
r … 0.015 0.02 0.025 0.03 0.035 …
… … … … … … … …
7 … 2.7146 2.5168 2.3646 2.2409 2.1365 …
8 … 2.6338 2.449 2.306 2.1892 2.0902 …
9 … 2.5738 2.3984 2.2622 2.1504 2.0554 …
10 … 2.5275 2.3593 2.2281 2.1202 2.0283 …
11 … 2.4907 2.3281 2.201 2.0961 2.0067 …
Dòng là bậc tự do : n và Cột là xác suất của đuôi (phải) quy luật phân phối.
10
Ví dụ 2.23 Cho T ~ T10 , ta có t 0,025  2,2281 , nghĩa là P T  t 0,025
10
  2,5% .
Trong EXCEL, phân phối siêu bội được tính bằng lệnh : T.DIST và T.INV
44

Hàm T.DIST
x : cận vùng xác suất tính
từ  : P    T  x 
Deg_freedom: bậc tự do
 n
Cumulative: bằng 0 nếu là
hàm mật độ, bằng 1 nếu là
hàm phân phối.
Hàm T.INV
Probability: vùng xác suất
tính từ  đến cận x :
p  P    T  x 

Giống như phân phối chuẩn tắc, hàm mật độ của biến ngẫu nhiên có phân phối Student
đối xứng qua trục tung. Hơn nữa, là khi n càng lớn thì hàm mật độ của T ~ T n càng giống
với hàm mật độ chuẩn tắc, bởi vì
 2  X 12  ...  X n2

với X i ,  i  1,..., n ; là các biến ngẫu nhiên độc lập cùng phân phối chuẩn tắc.

2 P X n F
Theo định lý luật số lớn 6.10 thì  1 . Cũng từ định lý 6.7 thì T  X

n 2
Vậy khi n lớn thì phân phối của biến ngẫu nhiên T ~ Tn được xấp xỉ bằng phân phối của
biến ngẫu nhiên X ~ N 0;1  ;
Nếu gọi F1  x  , F2  x  lần lượt là hàm phân phối xác suất của Z ~ N  0;1 và T ~ T n . Sai số
khi ta xấp xỉ phân phối Student bằng phân phối chuẩn tắc
err  x   F1  x   F2  x  , x  

Sai số lớn nhất sẽ giảm khi n tăng. Sai số lớn nhất là 0,1256 khi n  1 và giảm nhanh đến
0,005244 khi n  30 ; xem hình 5.13.
Khi bậc tự do n  30 ; sai số giữa hai phân phối được mô đánh giá như đồ thị 5.14.
Sai số lớn nhất sẽ giảm khi n tăng lên, sai số lớn nhất là 0,1256 khi n  1 sẽ giảm xuống còn
0,005244 khi n  30 .
Nên trong thực nghiệm, khi n đủ lớn ( n  30 ) ta có thể xấp xỉ phân phối Student bằng phân phối
chuẩn
CHƯƠNG 2 : PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 45

0.14

ĐỘ LỆCH HAI PHÂN PHỐI


0.12
0.1
0.08
0.06
0.04
0.02
0
0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40 1.60 1.80 2.00 2.20 2.40 2.60 2.80 3.00 3.20 3.40
cận x

r=1 r = 10 r = 30

Hình 2.12: Biểu đồ mức chênh lệch giữa phân phối chuẩn và Student

You might also like