You are on page 1of 20

§2.

CÁC QUY LUẬT PHÂN PHỐI XÁC SUẤT


(PROBABILITY DISTRIBUTIONS)

Bài này trình bày một số quy luật phân phối xác suất thông dụng. Để thuận tiện
cho việc ứng dụng, chúng ta gọi biến ngẫu nhiên (BNN-Random variables) thay
cho đại lượng ngẫu nhiên, thực nghiệm (experiments) thay cho phép thử. Đối với
người làm nghiên cứu ứng dụng, vấn đề quan trọng khi nghiên cứu các quy luật
phân phối của các biến ngẫu nhiên là làm sao hiểu đủ để có thể ứng dụng chính
xác vào các bài toán thực nghiệm hay thực tế.

1.Các phân phối rời rạc:


 Phân phối nhị thức
 Phân phối siêu bội
 Phân phối Poisson.

1.1. Phân phối nhị thức (Binomial Distribution)


1.1.1 Dãy thực nghiệm Bernoulli (còn gọi là lượt đồ Bernoulli)
Dãy n thực nghiệm ngẫu nhiên được gọi là dãy thực nghiệm Bernoulli nếu:
[i] Các thực nghiệm độc lập với nhau và “giống nhau”;
[ii] Mỗi thực nghiệm có hai kết cục A và A ;
[iii] Xác suất biến cố A xảy ra trong mỗi thực nghiệm không đổi là P ( A)  p .

1.1.2 Định nghĩa


Biến ngẫu nhiên rời rạc X có tập giá trị X (Ω)  0,1,2,..., n được gọi là có phân phối
nhị thức với tham số n và p, ký hiệu X  B (n, p ) , nếu X nhận một trong các giá trị
0,1,2,..., n với xác suất tương ứng.

P X  k   Cnk p k 1  p 
nk
(k = 0,1,2,..., n )
Nhận xét Nếu X là số lần thành công trong dãy n thực nghiệm Bernoulli thì
X  B(n,p). Đặc biệt khi n  1 thì X gọi là có phân phối Bernoulli hay phân phối
Không-Một, ký hiệu X  B(p).
1.1.3. Định lý Nếu X  B(n,p) thì
[i] E( X ) = np
[ii] Var  X   npq (với q = 1 – p)
[iii] np – q ≤ Mod( X ) ≤ np+p
Ví du 2.13

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 99


Một người bán hàng mỗi ngày đi bán hàng ở 6 nơi với xác xuất bán được hàng ở
mỗi nơi là 0.2 . Hỏi nếu một năm người này đi bán hàng 300 ngày thì trung bình sẽ
có khoảng bao nhiêu ngày người này bán được hàng?
Giải
Mỗi nơi bán hàng là một phép thử Bernoulli và nếu gọi X là số lần bán được hàng
trong một ngày của người này thì X  B(6, 0.2 ). Xác xuất để người này bán được
hàng trong một ngày là
p  P ( X  1)  1  P ( X  0)  1  C 60 (0.2) 0 0.8  1  (0.8) 6  0.737856
6

Mỗi ngày bán hàng là một phép thử Bernoulli và nếu gọi Y là số ngày bán được hàng
trong một năm của người này thì Y  B(300, 0.737856 ). Số ngày trung bình trong một
năm người này bán được hàng chính là kỳ vọng của BNN Y
E (Y )  np  300  0.737856  221.3568  221 ngày

1.2. Phân phối siêu bội (Hypergeometric Distribution)


1.2.1.Bài toán
Xét một tập hợp gồm N phân tử trong đó có M phần tử có tính chất A nào đó và
N  M phần tử không có tính chất A.
Lấy ngẫu nhiên n phần tử (không hoàn lại) từ tập hợp N phần tử. Gọi X là số phần
tử có tính chất A có trong n phần tử lấy ra thì X là đại lượng ngẫu nhiên. Tính
P ( X  k ) . Ta có:
Số trường hợp thuận lợi CMk .C NnkM (k = 0, 1, …, n)
P( X  k ) = 
C Nn
Tổng số trường hợp đồng khả năng
1.2.2.Định nghĩa
Biến ngẫu nhiên rời rạc X  0,1,2,..., n được gọi là có phân phối siêu bội với tham
số N , M , n và ký hiệu X  H ( N , M , n) , nếu X nhận một trong các giá trị 0, 1, 2, …, n
với xác suất tương ứng là:
CMk .C Nn kM
Pk  P X  k   , (k = 0, 1, 2,…, n)
C Nn
1.2.3. Định lý Nếu X  H ( N , M , n) thì
[i] E(X) = np
N n M
[ii] Var  X   np (1  p) với p 
N 1 N
Ví du 2.14 Để thanh toán 1 triệu đồng tiền hàng, một khách hàng gian lận đã xếp
lẫn ngẫu nhiên 5 tờ 50 ngàn tiền giả với 15 tờ 50 ngàn tiền thật. Chủ cửa hàng rút
ngẫu nhiên 3 tờ đi kiểm tra và hai bên giao ước nếu phát hiện tiền giả thì cứ mỗi tờ
tiền giả khách hàng phải bồi thường 2 tờ tiền thật. Tính số tiền phạt trung bình mà
khách hàng có thể phải trả.
Giải

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 100


Gọi X là số tờ tiền giả trong 3 tờ chủ cửa hàng rút ngẫu nhiên đi kiểm tra thì
X  H (20,5,3) . Số tờ tiền giả trung bình chủ cửa hàng kiểm tra và phát hiện được
5 3
E(X) = np  3. 
20 4
Số tiền phạt trung bình mà khách hàng có thể phải trả
3
 2  50000  75000
4

1.3. Phân phối POISSION (Poission Distribution)


Phân phối Poission dùng để nghiên cứu xác suất cho những sự kiện xảy ra trong
một khoảng thời gian hay không gian nhất định (thường gọi là phân đoạn). Chẳng
hạn như:
 Số cuộc điện thoại gọi đến một công ty trong 1 giờ vào một ngày quan sát
nào đó, hoặc trong một khoảng thời gian nhất định.
 Số lần máy hỏng ở một phân xưởng sản xuất trong một tuần quan sát nào đó,
hoặc trong một khoảng thời gian nhất định.
 Số lỗi trên một trang đánh máy hay trang in sách.
 Số tai nạn giao thông trên một đoạn đường (hoặc trong một khu vực quận,
huyện, tỉnh ,thành phố,…) trong 1 ngày quan sát nào đó, hoặc trong một
khoảng thời gian nhất định.

Chúng ta thường sử dụng phân phối Poission khi xác định được: Xác suất biến cố
chúng ta quan tâm xảy ra tương tự nhau và độc lập nhau trên các phân đoạn cùng
kích thước, biết được trung bình hay kỳ vọng ( λ -lambda) trên một đơn vị được
chọn.

1.3.1.Định nghĩa

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 101


Biến ngẫu nhiên rời rạc X  0,1,2,..., n,... được gọi là có phân phối Poisson với tham

số  , ký hiệu X  P ( ) , nếu X nhận các giá trị 0, 1, 2, ... với xác suất tương ứng.
e  λ λk
Pk  P  X  k  
(k = 0, 1, 2, …)
k!
(Xác suất để trong khoảng thời gian (0; t ) có k lần xảy sự kiện)
1.3.2. Định lý Nếu X  P( ) thì
[i] E( X )   (số lần xuất hiện trung bình trong khoảng thời gian (0; t ) )
[ii] Var ( X )  
[iii]   1  Mod  
1.3.3. Xấp xỉ phân phối nhị thức bằng phân phối Poisson
Nếu X  B (n, p ) , n khá lớn và p khá bé (thường n  30 sao cho nq  n với q  1  p )
(np ) k
thì X  P(np ) . Khi đó P( X  k )  e np .
k!
Ví du 2.15 Tại một sân bay, trung bình mỗi giờ có 5 máy bay hạ cánh. Tính xác
suất để trong một giờ mà ta quan sát.
a) Có 3 máy bay hạ cánh. b) Có ít nhất 4 máy bay hạ cánh.
Giải
a) Gọi X là số lần máy bay hạ cánh trong một giờ. Khi đó X có phân phối Poission,
X  P (5) . Xác suất để trong một giờ có 3 máy bay hạ cánh
e 5 53
P  X  3   0.1404  14.04%
3!
b) Xác suất để trong một giờ có ít nhất 4 máy bay hạ cánh
P ( X  4)  1  P ( X  3)  1  ( P0  P1  P2  P3 )

e 5 50 e 5 51 e 5 52 e 5 53
1 (    )  1  0.2650  0.7350  73.50%
0! 1! 2! 3!
Ví du 2.16 Xác suất một nhà máy sản xuất ra phế phẩm là 0.1% .
a)Tính xác suất để trong 1000 sản phẩm do nhà máy sản xuất có đúng 2 phế phẩm.
b)Tính xác suất để trong 1000 sản phẩm do nhà máy sản xuất có không quá 2 phế
phẩm.
Giải
Gọi X là BNN tương ứng là số phế phẩm trong 1000 sản phẩm nhà máy sản xuất.
Khi đó X  B (1000,0.001) ; vì n  1000 khá lớn p  0.001 khá bé và nq  n , np  1 nên
X  P (1) . Ta được
12 1
a) P( X  2)  e 1   0.18393972
2! 2e
10 11 12 1 1
b) P( X  2)  P(0)  P(1)  P(2)  e 1  e 1  e 1  (1  1  )  0.9196986029
0! 1! 2! e 2

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 102


2.Các phân phối liên tục:
 Phân phối đều
 Phân phối mũ
 Phân phối chuẩn
 Phân phối “Khi bình phương”
 Phân phối Student
 Fisher-Snedecor (phân phối F)

2.1. Phân phối đều (Uniform Distribution)


Phân phối đều thường sử dụng rộng
trong thống kê. Trong “một số lý thuyết
kết luận thống kê, người ta thường
xuất phát từ quy tắc” sau đây: Nếu ta
không biết gì về giá trị tham số cần
ước lượng thì mỗi giá trị có thể có của
tham số đó là đồng khả năng. Cụ thể,
nếu biết biến ngẫu nhiên X nhận giá
trị trên đoạn [a, b] mà không biết thêm
thông tin gì về X thì có thể xem mỗi
giá trị có thể có của X trên đoạn [a, b]
là đồng khả năng; tức là X có phân
phối đều trên đoạn [a, b] .
2.1.1. Định nghĩa
Biến ngẫu nhiên liên tục X gọi là có
phân phối đều trên đoạn [a, b] và ký
hiệu X  U [a, b] , nếu X có hàm mật
độ là
 1
 , x  [ a, b]
f ( x)   b  a
 0 , x  [ a, b]

2.1.2. Định lý Nếu X  U [a, b] thì


ab
[i] E ( X ) 
2
(b  a ) 2
[ii] Var ( X ) 
12

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 103


Ví du 2.17
Khi thâm nhập vào một thị trường mới, doanh nghiệp không thể biết được một
cách chắc chắn doanh số hàng tháng có thể đạt được là bao nhiêu mà chỉ dự kiến
được được rằng doanh số tối thiểu 40 triệu đồng/tháng và tối đa là 100 triệu
đồng/tháng. Tìm xác suất để doanh nghiệp đạt được doanh số từ 80 triệu
đồng/tháng trở lên.
Giải
Gọi X là doanh số hàng tháng của doanh nghiệp ở thị trường mới này. Do không
có thông tin gì thêm nên có thể xem X là biến ngẫu nhiên có phân phối đều trên
[40,100] . Khi đó X có hàm mật độ xác xuất

 1
, x  [40,100]
f ( x)  100  40
 0 , x  [40,100]

Xác suất để doanh số hàng tháng của doanh nghiệp ở thị trường mới này từ 80
triệu đồng/tháng trở lên
 100
1 1 1
P( X  80)  80 60dx   60dx  3  33.33%
80

2.2. Phân phối mũ (Exponential Distribution)

Phân phối mũ thường sử dụng


trong những vấn đề như xếp hàng
(queuing) hay dòng đợi (waiting-
line). Ở đây thời gian phục vụ cho
mỗi một khách hàng là ngẫu nhiên
(Ví dụ như thời gian một khách
hàng thực hiện một giao dịch tại
ngân hàng hoặc máy ATM, thời
gian cần phục vụ cho một khách
hàng ở một quán ăn hay nhà hàng
hay siêu thị, thời gian cần phục vụ
cho sinh viên mượn trả sách tại thư
viện …). Sự ngẫu nhiên (không
chắc chắn)này thường có thể biểu
diễn gần đúng bằng phân phối mũ.
Biến ngẫu nhiên có phân phối mũ
không nhận giá trị âm.

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 104


2.2.1. Định nghĩa.

Biến ngẫu nhiên liên tục X gọi là


có phân phối mũ với tham số 
( (  0) , ký hiệu X  E ( ) , nếu hàm
mật độ của X có dạng

 0 , x0
f ( x )    x
e , x0

2.2.2. Định lý Nếu X  E ( ) thì


1
[i] E( X ) 

1
[ii] Var ( X ) 
2
[iii] P (a  X  b) = e  a  e  b
x
1  e  λx khi x0
[iv] Hàm phân phối xác suất: F ( x)   f (t ) dt  
  0 khi x0

Ví du 2.18
Thời gian phục vụ người đọc tại một bàn thông tin thư viện là biến ngẫu nhiên có
phân phối mũ với thời gian phục vụ trung bình là 5 phút/người. Tìm xác suất để
một người đọc được chọn ngẫu nhiên có thời gian phục vụ từ 10 phút trở lên.
Giải
Gọi X là thời gian phục vụ (đơn vị là phút), hàm mật độ xác suất là
 0 , x0
 x
f ( x)   e  5
 , x0
 5
x
x
1  e 5 khi x0
Hàm phân phối xác suất: F ( x)   f (t )dt  
  0 khi x0

Xác suất để một người đọc được chọn ngẫu nhiên có thời gian phục vụ từ 10 phút
trở lên
10
P ( X  10)  1  P ( X  10)  1  (1  e 5
)  e  2  0.1353  13.53%

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 105


2.3. Phân phối chuẩn (The General Normal Distribution)
Phân bố chuẩn được
Abraham De Moivre phát hiện
đầu tiên năm 1733 nhưng sau
gần một thế kỷ mới được
công bố bởi Marquis De
Laplace và Carl Friedrich
Gauss. Người ta thường thuật
ngữ Phân bố Gauss (Gauss
Distribution) để chỉ phân bố
chuẩn. Phân bố chuẩn là
phân bố có vai trò rất quan
trọng trong các phân bố xác
suất liên tục và có mặt trong
hầu hết các ứng dụng thống
kê. Nhiều lĩnh vực trong khoa
học và đời sống ta đều gặp
BNN có phân phối chuẩn. Lý
do phổ biến của phân phối
chuẩn là vì: Nếu BNN X là
tổng của một số lớn biến ngẫu
nhiên độc lập và giá trị mỗi
biến chỉ chiếm vai trò nhỏ
trong tổng đó thì X có phân
phối xấp xỉ phân phối chuẩn.
Nói cách khác, nếu X là kết
quả của nhiều nguyên nhân
mà mỗi nhuyên nhân có vai
trò không đáng kể đến kết
quả thì X có phân phối xấp xỉ
với phân phối chuẩn.

2.3.1. Định nghĩa


Biến ngẫu nhiên liên tục X
gọi là có phân phối chuẩn
tham số > 0 và  > 0, ký hiệu
là X  N (  ,  2 ) , nếu hàm mật
độ xác suất có đồ thị dạng
hình chuông và biểu thức
xác định
2
1  x  
1   
bằng: f x   e 2  

 2

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 106


Biến ngẫu nhiên Z có phân phối chuẩn với  = 0 và  = 1 được gọi là phân phối
chuẩn tắc (The Standard Normal Distribution), ký hiệu Z N(0,1). Hàm mật độ của
phân phối chuẩn tắc còn gọi là hàm mật độ Gauss.
1
1  2 z2
f(z)  e

Hàm phân phối xác suất của phân phối chuẩn tắc, ký hiệu là Φ( z )
z 1
1  t2
Φ z   P ( Z  z )  e 2
dt
2π 

Hàm tích phân Laplace, ký hiệu là Φo ( z )


z 1
1  t2
Φo z    e 2
dt
2π 0
 Tính chất

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 107


1
i) Φ( z )   Φo ( z)
2
ii) Φ( z )  1  Φ( z )
iii) Φo ( z )  Φ o ( z ) ; và z  4 thì Φo ( z )  0,5
Giá trị hàm hàm phân phối xác suất của phân phối chuẩn tắc và hàm tích phân
Laplace cho trong các bảng A.1, A.2, A.3.
2.3.2. Phân vị mức α của Z là một số, ký hiệu zα , thỏa mãn P( Z  zα )  α . Ta có
P ( Z  zα )  α  Φ ( zα )  P ( Z  zα )  1  α

Ví du 2.19
a) Tìm z0.025

b) Tìm z0.05

2.3.3. Chuẩn hóa một biến ngẫu nhiên (standardized normal distribution) tức là
biến đổi biến ngẫu nhiên đó thành biến ngẫu nhiên mới có phân phối chuẩn tắc
N(0,1).
X 
Nếu X  N (  ,  2 ) thì Z   N 0,1 .

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 108


b μ a μ
P a  X  b   P  z1  Z  z2   Φ   Φ 
 σ   σ 
Ví du 2.20

X  xα  μ
Chú ý Nếu X  N (  ,  2 ) và Z  , zα  thì
 σ
P ( Z  zα )  α  P( X  xα )  α

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 109


2.3. 4. Các tính chất của phân phối chuẩn Nếu X  N (  ,  2 ) thì
i) E(X) = , Var(X) = 2
ii) MedX = ModX = 
iii) Đồ thị của phân phối chuẩn (như trong hình) đối xứng qua giá trị kỳ vọng .
iv) Mật độ xác suất của phân phối chuẩn cao nhất tại giá trị trung bình.
b  a b  b   1
v) P a  X  b        , P  X  b      o  
            2
 
vi) Xác suất sai lệch giữa BNN X và kỳ vọng: P( X     )  2 o  
 
2
vii) Quy tắc k  sigma : Nếu X  N (  ,  ) thì P( X    k )  2 o (k )
Với k  3 , ta có quy tắc 3  sigma : P( X    3 )  2 o (3)  0,9973  99,73%

Phân phối chuẩn N(,2), quy tắc k  sigma


Tiêu chuẩn chất lượng 6 Sigma là gì?
Một trong những đỉnh cao của khoa học quản lý đó là mô hình tuyệt hảo “6 Sigma”
với việc ứng dụng các kỹ thuật thống kê trong quản lý. Từ những năm tám mươi
của thế kỷ 20, các nhà quản lý của tập đoàn Motorola đã khởi xướng lên chương
trình cải tiến chất lượng mang tên 6 Sigma và đã thu được nhiều kết quả trong
quản lý, trong kinh doanh.
Bob Galvin – Giám đốc điều hành Motorola tóm tắt 6 Sigma: “6 Sigma là một
phương pháp khoa học tập trung vào việc thực hiện một cách phù hợp và có hiệu
quả các kỹ thuật và các nguyên tắc quản lý chất lượng đã được thừa nhận. Tổng
hợp các yếu tố có ảnh hưởng đến kết quả công việc, 6 Sigma tập trung vào việc
làm thế nào để thực hiện công việc mà không (hay gần như không) có sai lỗi hay
khuyết tật.

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 110


Chữ Sigma (  ) theo ký tự Hy lạp đã được dùng trong kỹ thuật thống kê để đánh
giá sự sai lệch của các quá trình. Hiệu quả hoạt động của một công ty cũng được
đo bằng Sigma mà công ty đó đạt được đối với các quá trình sản xuất kinh doanh
của họ. Thông thường các công ty thường đặt ra mức 3 hoặc 4 Sigma là mức
Sigma chuẩn cho công ty tương ứng với xác suất sai lỗi có thể xảy ra là
khoảng từ 6200 tới 67000 trên một triệu cơ hội. Nếu đạt tới mức 6
Sigma, con số này chỉ còn từ 3 đến 4 lỗi trên một triệu cơ
hội. Điều này cho phép đáp ứng sự mong đợi ngày càng tăng của khách hàng
cũng như sự phức tạp của các sản phẩm và quy trình công nghệ mới ngày nay”.
Đây sẽ là một trong những mô hình tuyệt hảo các doanh nghiệp sẽ hướng đến
trong thời gian tới, tuy nhiên doanh nghiệp hãy thực hiện thật tốt Hệ thống quản lý
chất lượng trước khi nghĩ đến vấn đề này – “không thể quá độ”.

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 111


Ví du 2.21
Tuổi thọ X của một loại bóng đèn (đơn vị là giờ) là biến ngẫu nhiên có phân phối
chuẩn trung bình là μ  2100 giờ và độ lệch chuẩn σ  200 giờ.
a) Tính xác suất để một bóng đèn được chọn ngẫu nhiên có tuổi thọ lớn hơn 2400
giờ.
b) Tính tỷ lệ bóng đèn có tuổi thọ từ 1700 giờ đến 2200 giờ.
Giải
a) Xác suất để một bóng đèn được chọn ngẫu nhiên có tuổi thọ lớn hơn 2400 giờ
 2400  2100 
P ( X  2400)  1  P ( X  2400)  1  Φ 
 200 
 1  Φ(1.5)  1  0.933193  0.066807  6.68%

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 112


b) Tỷ lệ bóng đèn có tuổi thọ từ 1700 giờ đến 2200 giờ
 2200  2100   1700  2100 
P (1700  X  2200)  Φ   Φ 
 200   200 
 Φ(0.5)  Φ(2)  Φ(0.5)  (1  Φ(2))
 Φ(0.5)  Φ(2)  1  0.691462  0.977250  1
 0.668712  66.87%
Ví du 2.22 Tuổi thọ X của một loại sản phẩm (đơn vị là năm) là biến ngẫu nhiên
có phân phối chuẩn trung bình là 4.2 năm, phương sai 2.25 (năm)2. Khi bán mỗi
sản phẩm này thì tiền lỗ lãi như sau: mỗi sản phẩm không phải bảo hành lãi 100
ngàn đồng, mỗi sản phẩm phải bảo hành thì lỗ 200 ngàn đồng.
a) Nếu quy định thời hạn bảo hành sản phẩm là 3 năm thì lãi trung bình khi bán
mỗi sản phẩm là bao nhiêu?
b) Nếu muốn lãi trung bình khi bán mỗi sản phẩm là 50 ngàn đồng thì cần quy
định thời gian bảo hành là bao nhiêu?
Giải
Gọi X là tuổi thọ sản phẩm thì X  N (  ,  2 )  N (4.2,2.25) .
a) Tỷ lệ sản phẩm phải bảo hành
 3  4 .2 
P ( X  3)  Φ   Φ(0.8)  1  Φ(0.8)  1  0.788145  0.211855  21.19%
 1 .5 
Tỷ lệ sản phẩm không phải bảo hành
P ( X  3)  1  P ( X  3)  1  0.211855  0.788145  78.81%
Tiền lãi trung bình khi bán mỗi sản phẩm là
100  0.7881  200  0.2119  36.43 (ngàn đồng)
b) Gọi T là thời gian quy định bảo hành để có lãi trung bình khi bán mỗi sản
phẩm là 50 ngàn đồng. Xác suất để sản phẩm khi bán phải bảo hành
 T  4 .2 
p  P ( X  T )  Φ 
 1.5 
Gọi Y là BNN tương ứng số tiền lãi khi bán mỗi sản phẩm. Bảng phân phối xác
suất của Y là
Y 100 -200
P 1 p p
Số tiền lãi trung bình khi bán mỗi sản phẩm chính là kỳ vọng E (Y ) .Ta có
1
50  E (Y )  100(1  p )  200 p  p   0.166667
6
Suy ra
 T  4 .2  T  4 .2
Φ   0.166667  Φ(0.97)   0.97  T  2.74
 1 .5  1 .5
Nếu muốn lãi trung bình khi bán mỗi sản phẩm là 50 ngàn đồng thì quy định thời
gian bảo hành là khoảng 2.74 năm.
Ví du 2.23 Một doanh nghiệp cần mua một loại trục máy có đường kính từ 1.19cm đến
1.21cm . Có hai nhà máy bán loại trục máy này và đường kính của các loại trục máy sản
xuất ra là các biến ngẫu nhiên có phân phối chuẩn với các số đặc trưng cho trong bảng
Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 113
Đường kính trung Độ lệch tiêu Giá bán
bình ( cm ) chuẩn ( cm )
Nhà máy 1 1.20 0.008 2.7 triệu/hộp/100 chiếc
Nhà máy 2 1.20 0.005 3.0 triệu/hộp/100 chiếc
Hỏi doanh nghiệp cần mua trục máy của nhà máy nào để giá mỗi sản phẩm thỏa yêu cầu
doanh nghiệp rẻ hơn?
Giải
Gọi X 1 , X 2 lần lượt là đường kính trục máy do nhà máy 1,2 sản xuất ra.
 Nhà máy 1
- Tỷ lệ trục máy do nhà máy 1 sản xuất ra thỏa mãn yêu cầu doanh nghiệp là
 1.21  1.20   1.19  1.20 
P(1.19  X 1  1.21)  Φ    Φ   Φ(1.25)  Φ(1.25)
 0.008   0.008 
 2Φ(1.25)  1  2  0.894350  1  0.7887  78.87%
- Giá mỗi sản phẩm thỏa yêu cầu doanh nghiệp mua từ nhà máy 1 là
27000000
 342335.49 đồng/chiếc
78.87
 Nhà máy 2
- Tỷ lệ trục máy do nhà máy 2 sản xuất ra thỏa mãn yêu cầu doanh nghiệp là
 1.21  1.20   1.19  1.20 
P(1.19  X 2  1.21)        Φ ( 2 )  Φ (  2)
 0.005   0.005 
 2Φ(2)  1  2  0.977250  1  0.9545  95.45%
- Giá mỗi sản phẩm thỏa yêu cầu doanh nghiệp mua từ nhà máy 2 là
30000000
 314300.68 đồng/chiếc
95.45
Vậy doanh nghiệp cần mua trục máy của nhà máy 2 để giá mỗi sản phẩm thỏa yêu cầu
doanh nghiệp rẻ hơn.
2.3 Phân phối Khi bình phương (  2 ) (Chi-Square Distribution)
2.3.1. Định nghĩa
Cho Z 1 , Z 2 ,..., Z n -là n biến ngẫu nhiên
độc lập có phân phối chuẩn tắc. Khi đó
biến ngẫu nhiên X xác định như sau
X  Z 12  Z 22  ...  Z n2

gọi là có phân phối Khi bình phương


bậc tự do n hay Chi-Square bậc tự
do n, ký hiệu X   n2 .

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 114


Chú ý
 Biến ngẫu nhiên khi bình
phương X trên đây chỉ nhận giá
trị dương và thường viết là  2 ,
bậc tự do thường viết tắc là df .
 Hàm gama, ký hiệu (x) , là

( x)   t x 1e t dt
0

2.3.1. Định lý Cho X   n2 . Khi đó


i) Hàm mật độ của X là
x n
 1
e 2x2
f n ( x)  n
với x  0
2 n
2  
2
ii) E ( X )  n , Var ( X )  2n

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 115


2.4 Phân phối Student (Student's t-Distribution) (William Sealy Gosset)
Cho hai biến ngẫu nhiên U  N 0,1 và
V   n2 . Khi đó biến ngẫu nhiên T xác
định như sau
U
T
V /n
gọi là có phân phối Student với n bậc tự
do, ký hiệu T  T (n) .
n
Nếu T  T (n) thì E (T )  0 và Var (T ) 
n2
Nhận xét Nếu X  N (  ,  2 ) và V   n2 thì
X 
T    T (n) .
V /n

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 116


3.Quan hệ của biến ngẫu nhiên (các công thức xấp xỉ)
Chúng ta dùng ký hiệu “” để chỉ xấp xỉ phân phối.

3.1. Xấp xỉ phân phối siêu bội bằng phân phối nhị thức
Nếu X  H ( N , M , n) và n rất bé so với N (thường là n  0,05 N ) thì X  B(n, p ) với
M
p . Khi đó P ( X  k )  C nk p k (1  p ) n k , k  0, n .
N
3.2. Xấp xỉ phân phối nhị thức bằng phân phối Poisson
Nếu X  B (n, p ) , n khá lớn và p khá bé (thường n  30 sao cho nq  n với q  1  p )
(np ) k
thì X  P(np ) . Khi đó P( X  k )  e np .
k!
3.3. Xấp xỉ phân phối nhị thức bằng phân phối chuẩn
Nếu X  B (n, p ) , n khá lớn, p không quá lớn cũng không quá bé ( thường np  5 ,
nq  5 với q  1  p ) thì X  N np, npq  . Khi đó
1
1  k  np  1  x2
i) P( X  k )    với   x   e 2
- là hàm mật độ Gauss.
npq  npq  2
x 1
k2  k  np   
 -  o  k1  np  với  o x   1  t2
ii) P(k1  X  k 2 ) =  C nk p k q n k   o  2 e 2
dt - là
 npq   npq  2
k  k1     0

hàm tích phân Laplace. (thường dùng công thức này khi n  50)
 k 2  0,5  np   
iii) P(k1  X  k 2 )   o   -  o  k1  0,5  np 
 npq   npq 
   
(thường dùng công thức này khi 20  n  50)

3.4. Xấp xỉ phân phối chuẩn


Trung bình của n BNN độc lập, đồng dạng phân bố, khi n đủ lớn có phân phối xấp
xỉ phân phối chuẩn.Tức là
1 2
Nếu X 1 , X 2 ,..., X n  IID(  ,  2 ) thì ( X 1  X 2  ...  X n )  X  N (  , )
n n
Bài tập
Bài 1 Số khách hàng vào một cửa hàng bách hóa trong 1 giờ là biến ngẫu nhiên
tuân theo luật phân phối Poission với mật độ (số khách trung bình) là 9 khách hàng
trong một giờ. Tính xác suất để trong một giờ chọn ngẫu nhiên có nhiều hơn 6
khách vào cửa hàng.
Bài 2 Một lô hàng có tỷ lệ phế phẩm 4%. Người mua hàng kiểm tra ngẫu nhiên 150
sản phẩm của lô hàng và nếu có không quá 2 phế phẩm thì chấp nhận mua lô
hàng. Tìm xác suất để lô hàng được chấp nhận mua.

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 117


Bài 3 Trọng lượng của em bé sơ sinh được xem là đại lượng ngẫu nhiên tuân theo
luật phân phối chuẩn với  = 3,2 kg và 2 = (0,4 kg)2. Bé sơ sinh gọi là đạt
chuẩn về cân nặng nếu có trọng lượng từ 2,9kg đến 3,6kg. Tính tỷ lệ các bé sơ
sinh đạt chuẩn về cân nặng.
Bài 4 Chiều cao của một nhóm người cùng chủng tộc là đại lượng ngẫu nhiên liên
tục X (cm) tuân theo luật phân phối chuẩn với  = 165 cm và 2 = (5 cm)2.
a) Người đđược gọi là có chiều cao đạt chuẩn nếu chiều cao từ 160cm đến
180cm. Tính tỷ lệ người có chiều cao đạt chuẩn.
b) Người được gọi l cao nếu có chiều cao > 180 cm. Tính tỷ lệ người cao.
Bài 5 chiều cao của nam giới đã trưởng thành là biến ngẫu nhiên có phân phối
chuẩn N(160 cm ; 36 cm2) . Tính xác suất để khi lấy ngẫu nhiên 4 nam giới thì có ít
nhất một người có chiều cao trong khoảng ( 157 cm ; 163 cm).
Đs: 0,855.
Bài 6 (chuyển sang chuẩn) Xác suất để một máy sản xuất được sản phẩm loại A
là 0,7. Cho máy sản xuất 600 sản phẩm. Tìm xác suất để ít nhất 420 sản phẩm loại
A trong số 600 sản phẩm do máy sản xuất.
Bài 7 Trọng lượng của các bao gạo do một máy đóng bao sản xuất là đại lượng
ngẫu nhiên X. Cho biết X  N (50; 0,16) . Bao gạo là loại I nếu trọng lượng của nó từ
49,8 kg trở lên. Tìm tỉ lệ bao loại I của máy:
Bài 8 Lấy 12 sản phẩm từ kho, xác suất được chính phẩm là 0,98305. Gọi X là số
chính phẩm lấy được. Tính kì vọng và phương sai.
Đs: 11,8 ; 0,19995
Bài 9 (PP đều) Một nhà kinh doanh muốn đầu tư 10 tỷ đồng trong vòng 1 năm vào
một công ty mà nếu làm ăn thuận lợi thì lãi suất đến 14%, còn nếu gặp khó khăn thì
lãi suất giảm xuống đến 4%. Trong khi đó, nếu gửi tiền vào ngân hàng thì lãi suất
bảo đảm sau 1 năm là 8%. Hỏi nếu nhà kinh doanh dùng tiền để đầu tư vào công
ty thì lãi suất cao hơn gửi ngân hàng với xác suất là bao nhiêu?

Xác suất Thống kê và Ứng dụng………………………….…………………………………………….. Trang 118

You might also like