Professional Documents
Culture Documents
Baigiang 3slide
Baigiang 3slide
Tôn Thất Tú
Đà Nẵng, 2021
Pn = n!
- Số cách chọn k phần tử (không thứ tự) trong tập n phần tử:
n!
Cnk =
k!(n − k)!
- Số cách chọn k phần tử (có thứ tự) trong tập n phần tử:
n!
Akn =
(n − k)!
n1 + n2 + ... + nm
- Quy tắc nhân: Công việc A được thực hiện qua m giai đoạn liên tiếp.
* Giai đoạn 1: có n1 cách
* Giai đoạn 2: có n2 cách
..............................
* Giai đoạn m: có nm cách
Số cách thực hiện công việc A:
n1 ∗ n2 ∗ ... ∗ nm
Ví dụ 1
Một nhóm có 10 học sinh, trong đó có 6 nam và 4 nữ. Hỏi có bao nhiêu cách:
a) Xếp thành 1 hàng dọc.
b) Chọn một nhóm có 4 học sinh đều có nam và nữ với số lượng khác nhau.
c) Chọn một nhóm có 4 học sinh trong đó có ít nhất một nữ.
Đáp số: a) 10! b) C61 C43 + C63 C41 c) C10
4
− C64
Ví dụ 2
Một biển số xe được cấu tạo từ 5 chữ số. Hỏi có bao nhiêu biển số có:
a) Các chữ số khác nhau.
b) Ít nhất 2 chữ số giống nhau.
c) Có đúng 3 chữ số giống nhau.
Đáp số: a) A510 b) 105 − A510
c) Được tính qua 3 giai đoạn:
- Gđ 1: Chọn 3 vị trí trong 5 vị trí: C53
- Gđ 2: Chọn 1 chữ số giống nhau cho 3 vị trí trên: C10
1
Ví dụ 3
Gieo 1 đồng xu, rút một lá bài trong bộ bài, đo nhiệt độ không khí tại thời điểm 9h
sáng, chọn ngẫu nhiên 1 sinh viên và đo chiều cao,... là các thí nghiệm ngẫu nhiên
Ví dụ 4
X Gieo 1 đồng xu: Ω = {S, N }
X Chọn ngẫu nhiên 1 ngày trong tháng 1: Ω = {1, 2, ..., 31}
X Do nhiệt độ không khí tại thời điểm 9h sáng: Ω = (−∞, +∞)
Ví dụ 5
Tung ngẫu nhiên 2 đồng xu. Lúc đó:
X Không gian mẫu: Ω = {SS, SN, N S, N N }
X Hiện tượng (sự kiện) "Có mặt sấp xuất hiện" là biến cố ngẫu nhiên. Kí hiệu A.
X Giả sử khi thực hiện, kết quả «SN» xuất hiện. Điều này kéo theo biến cố A xảy ra.
Kết quả «SN» được gọi là kết quả thuận lợi cho biến cố A.
X Tập các kết quả thuận lợi cho A: {SN, N S, SS}. Lúc đó, ta biểu diễn biến cố A:
A = {SN, N S, SS},
Ví dụ 6
Tung ngẫu nhiên đồng xu cho đến khi có mặt sấp xuất hiện. Khi đó:
Ω = {S, N S, N N S, N N N S, ...}
Ví dụ 7
Chọn ngẫu nhiên một chữ số từ 0 đến 9.
Ta có Ω = {0, 1, 2, ..., 9}.
Xét 3 biến cố A = {0, 2, 4}, B = {4, 5, 6} và C = {7, 8, 9}.
Lúc đó:
• A ∩ B = {4}, A ∪ B = {0, 2, 4, 5, 6}, Ā = {1, 3, 5, 6, 7, 8, 9}
• A và C xung khắc vì A ∩ C = ∅ nhưng A và C không phải là hai biến cố đối nhau.
Ví dụ 8
Có 2 xạ thủ, mỗi người bắn 1 viên đạn vào mục tiêu. Gọi A và B tương ứng là các biến
cố: “người thứ nhất và thứ hai bắn trúng mục tiêu” tương ứng. Khi đó ta có biểu diễn
các biến cố như sau:
- Có đạn trúng đích: A ∪ B
- Có đúng 1 viên đạn trúng đích: AB̄ ∪ ĀB
- Chỉ có người thứ nhất bắn trúng: AB̄
- Có nhiều nhất một viên đạn trúng đích: ĀB̄ ∪ AB̄ ∪ ĀB hoặc AB
∪Ai = ∩Āi
∩Ai = ∪Āi
Ví dụ 9
Có 1000 người có triệu chứng A đến cơ sở y tế để khám bệnh. Kết quả có thấy 700
mắc bệnh X. Ta có f = 700/1000 = 70%. Do đó, ta có cơ sở dự đoán nếu một người
có triệu chứng A thì xác suất mắc bệnh X xấp xỉ 70%.
n(A)
P (A) =
n(Ω)
Ví dụ 10
Trong một hộp có 6 bi đen và 4 bi trắng. Lấy ngẫu nhiên 4 viên. Tìm xác suất lấy được
cả hai loại bi.
Giải.
Gọi A là biến cố "lấy được cả hai loại bi".
Số trường hợp đồng khả năng: n(Ω) = C10 4 .
Ví dụ 11
Một đoàn tàu có 3 toa. Có 15 khách lên ngẫu nhiên 3 toa tàu. Biết mỗi toa đều chứa
được 15 khách. Tính xác suất:
a. Toa 1 có 4 khách.
b. Có 2 toa mỗi toa có 6 khách.
Giải.
a. Gọi A là biến cố "toa 1 có 4 khách".
Ta có: n(Ω) = 315 .
Giá trị n(A) được tính thông qua 2 giai đoạn:
- Gđ 1: Chọn 4 khách: C154 cách
Ví dụ 12
Một rổ cam gồm 12 quả, trong đó có 3 quả hỏng. Chia đều 12 quả này cho 3 người,
mỗi người 4 quả. Tính xác suất:
a. Người thứ nhất không có quả hỏng.
b. Mỗi người đều có quả hỏng.
Ví dụ 13
Tính xác suất khi lấy ngẫu nhiên một điểm M trong hình vuông có độ dài cạnh bằng
2m thì điểm này rơi vào hình tròn nội tiếp hình của vuông.
Giải. Dễ thấy:
- Diện tích hình tròn: m(S) = π(m2 )
- Diện tích của hình vuông: m(Ω) = 4(m2 )
Theo quan điểm hình học, xác suất của biến
cố A cần tìm:
m(S) π
P (A) = =
m(Ω) 4
Nói riêng:
P (A) + P (Ā) = 1
Tổng quát:
......
(−1)n−1 P (A1 A2 ...An )
Ví dụ 14
Một lô hàng có 15 thiết bị, trong đó có 6 thiết do nhà máy X sản xuất và 9 thiết bị do
nhà máy Y sản xuất. Người ta chọn ngẫu nhiên 4 thiết bị để kiểm tra. Tính xác suất:
a. Cả 4 thiết bị được chọn do cùng nhà máy sản xuất
b. Có ít nhất một thiết bị được chọn do nhà máy X sản xuất.
Giải.
a. Gọi AX , AY là các biến cố các thiết bị được chọn do nhà máy X, Y sản xuất. Ta có
AX , AY xung khắc.
Xác suất cả 4 thiết bị được chọn do cùng nhà máy sản xuất:
C64 C94
P (AX ∪ AY ) = P (AX ) + P (AY ) = 4 + 4
C15 C15
b. Gọi B là biến cố có ít nhất một thiết bị được chọn do nhà máy X sản xuất. Ta có:
C94
P (B) = 1 − P (B̄) = 1 − 4
C15
Giải.
Gọi A, B là biến cố chọn được sinh viên biết tiếng Anh, Pháp.
Lúc đó, xác suất cần tìm:
Ví dụ 16
Một đội bóng bàn của 1 đơn vị gồm 2 vận động viên A và B. Xác suất A, B vượt qua
vòng bảng lần lượt là 0,7 và 0,5. Do ảnh hưởng tâm lý nên xác suất cả hai người đều
vượt qua vòng bảng là 0,4. Tính xác suất cả hai vận động viên đều không vượt qua vòng
bảng.
Giải. Gọi A, B là các biến cố vận động viên A, B vượt qua vòng bảng. Ta có:
Xác suất cả hai vận động viên đều không vượt qua vòng bảng:
h De Morgan
i
P (ĀB̄) = 1 − P (ĀB̄) = 1 − P (A ∪ B) = 1 − [P (A) + P (B) − P (AB)]
= 1 − (0, 7 + 0, 5 − 0, 4) = 0, 2
LG SONY
Tốt 15 12
Bị hỏng 5 8
Chọn ngẫu nhiên 1 tivi thì được tivi LG. Vậy, khả năng nó bị hỏng là bao nhiêu?
Gợi ý.
- Khi không có thông tin, dễ thấy xác suất này là 13/40.
- Vì biết chọn được tivi LG nên ta "thu hẹp" phạm vi quan sát và chỉ tính đến loại tivi
LG. Lúc đó, khả năng chọn được tivi hỏng với "điều kiện" là tivi LG bằng 5/20=1/4.
P (AB)
P (A|B) =
P (B)
Tính chất:
i. 0 ≤ P (A|B) ≤ 1
ii. P (Ā|B) = 1 − P (A|B)
iii. P (A ∪ B|C) = P (A|C) + P (B|C) − P (AB|C)
Ví dụ 17
Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu dự án A và B tương ứng là
0,6 và 0,7. Xác suất thắng thầu đồng thời cả 2 dự án là 0,5. Tính xác suất:
a) Công ty thắng thầu dự án A biết đã thắng thầu dự án B.
b) Công ty không thắng thầu dự án B biết đã thắng thầu dự án A.
Bình luận. Ta có: P (A|B) = 5/7 > P (A) = 0, 6. Như vậy, việc biết biến cố B xảy ra
đã làm tăng xác suất xảy ra biến cố A, hay nói cách khác, việc thắng dự án B là có lợi
cho quá trình đấu thầu dự án A.
Nhận xét
Trong một số trường hợp, xác suất có điều kiện P (A|B) có thể được tính dựa vào việc
"đếm trực quan", tức là ta thu hẹp tập các kết quả sau khi biến cố B xảy ra và đếm lại
số kết quả đồng khả năng, số kết quả thuận lợi để tính xác suất có điều kiện.
Chẳng hạn, ta quay lại với ví dụ về tivi Sony và LG. Vì biết chọn được tivi LG nên tập
kết quả thu hẹp về 20 tivi LG. Chỉ có 5 tivi LG bị hỏng, nên xác suất chọn được tivi
hỏng khi biết đó là tivi bằng 5/20=1/4.
Giải. Gọi A, B là các biến cố chọn được ít nhất 1 thanh hỏng, chọn được đúng 2 thanh
hỏng.
a. P (A) = 1 − P (Ā) = 1 − C124 /C 4
15
b. P (B|A) = P (AB)/P (A) = P (B)/P (A), trong đó P (B) = C32 C12 2 /C 4 .
15
P (AB)
P (B|A) = ⇒ P (AB) = P (A)P (B|A)
P (A)
Tổng quát: Cho n biến cố Ai với P (A1 A2 ...An−1 ) > 0. Khi đó:
P (A1 A2 ...An ) = P (A1 ).P (A2 |A1 ).P (A3 |A1 A2 )....P (An |A1 ...An−1 )
Ví dụ 19
Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu lần lượt là 0.7 và 0.4. Nếu
dự án A đã thắng thầu thì xác suất thắng tiếp dự án B là 0.4. Tính xác suất:
a. Công ty thắng ít nhất một dự án.
b. Công ty chỉ thắng dự án A.
c. Thắng đúng 1 dự án.
Giải. Gọi Ai là biến cố lần thứ i chọn đúng chìa khóa, i = 1, 2, 3, ...
a. P (Ā1 A2 ) = P (Ā1 )P (A2 |Ā1 ) = 7/9 ∗ 2/8
b. P (Ā1 Ā2 A3 ) = P (Ā1 )P (Ā2 |Ā1 )P (A3 |Ā1 Ā2 ) = 7/9 ∗ 6/8 ∗ 2/7
c. P (A1 ∪ Ā1 A2 ) = P (A1 ) + P (Ā1 A2 ) = 2/9 + 7/9 ∗ 2/8
Nhận xét
- Hai biến cố A và B độc lập ⇔ P (A|B) = P (A) hoặc P (B|A) = P (B).
- Nếu nhóm n biến cố A1 , ..., An độc lập thì nhóm n biến cố B1 , B2 , ..., Bn cũng độc
lập, trong đó Bi là Ai hoặc Āi .
- Nếu nhóm n biến cố A1 , ..., An độc lập thì mọi nhóm con các biến cố của nó cũng
độc lập.
Ví dụ 21
Một nồi hơi có 3 van bảo hiểm hoạt động độc lập với xác suất hỏng của van 1, van 2,
van 3 trong khoảng thời gian T tương ứng là 0,1; 0,2; 0,3. Nồi hơi hoạt động an toàn
nếu có ít nhất một van không hỏng. Tính xác suất để nồi hơi hoạt động an toàn trong
khoảng thời gian T.
Xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T:
P (AB ∪ C) = P (AB) + P (C) − P (ABC) = P (A)P (B) + P (C) − P (A)P (B)P (C)
Ví dụ 23
Một thiết bị có 2 bộ phận hoạt động độc lập. Xác suất bộ phận thứ nhất bị hỏng là
0,1. Xác suất có đúng 1 bộ phận bị hỏng là 0,26.
a. Tính xác suất bộ phận thứ 2 bị hỏng.
b. Biết có ít nhất 1 bộ phận hỏng, tính xác suất bộ phận 1 hỏng.
Ví dụ 24
a. {∅, Ω}, {A, A }, {AB, AB̄, ĀB, ĀB̄} là các nhóm biến cố đầy đủ.
b. Một hộp có 3 bi đỏ và 2 bi xanh. Lấy ngẫu nhiên 2 viên bi. Gọi Hi là biến cố lấy
được i bi xanh, i = 0, 1, 2. Ta có {H0 , H1 , H2 } là nhóm đầy đủ.
Ví dụ 25
Có 2 lô sản phẩm. Lô 1 có 50 sản phẩm trong đó có 20 sản phẩm xấu. Lô 2 có 40 sản
phẩm, trong đó có 15 sản phẩm xấu. Lấy ngẫu nhiên một lô và từ đó lấy ra 1 sản phẩm.
Tìm xác suất để sản phẩm lấy ra là sản phẩm tốt.
Giải. Gọi Hi là chọn lô sản phẩm i, i = 1, 2. Gọi A là biến cố sản phẩm lấy ra là sản
phẩm tốt.
Ta có {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần:
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 1/2 ∗ 30/50 + 1/2 ∗ 25/40 = 49/80
Ví dụ 26
Một nhóm có 3 người nhưng chỉ có 2 vé xem bóng đá. Để chia vé họ làm như sau: Lấy
3 phiếu, 2 phiếu ghi số 1 và 1 phiếu ghi số 0. Sau đó thay phiên nhau bốc ngẫu nhiên
lần lượt không hoàn lại. Ai được phiếu ghi số 1 thì được vé.
a. Tính xác suất người thứ 2 được vé.
b. Hỏi việc bốc phiếu đó có công bằng hay không ?
P (A2 ) = P (A1 )P (A2 |A1 ) + P (Ā1 )P (A2 |Ā1 ) = 2/3 ∗ 1/2 + 1/3 ∗ 2/2 = 2/3
Giải. Gọi HA , HB là biến cố trạm phát tín hiệu A, B. Gọi A là biến cố trạm thu được
tín hiệu A.
a. Ta có: {HA , HB } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần:
Ví dụ 28
Một cửa hàng bán bóng đèn cùng loại do 3 cơ sở sản xuất cung cấp. Cơ sở I, II, III
cung cấp lượng hàng tương ứng là 40%, 35%, 25%. Biết tỉ lệ bóng hỏng do cơ sở I, II,
III sản xuất lần lượt là 2%, 2%, 3%. Ta mua ngẫu nhiên 1 bóng của cửa hàng. Giả sử
bóng mua bị hỏng. Hỏi bóng ta mua có khả năng do cơ sở nào sản xuất nhất ?
Giải. Gọi Hi là biến cố bóng được mua do cơ sở i sản xuất, i = 1, 2, 3. Gọi A là biến
cố bóng được mua bị hỏng.
Ta có: {H1 , H2 , H3 } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần:
Giải. Gọi H1 , H2 là các biến cố người được chọn hút và không hút thuốc lá. Gọi A là
biến cố người được chọn bị bệnh phổi.
Ta có: {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần:
P (H1 )P (A|H1 ) 0, 3 ∗ 0, 6
a. P (H1 |A) = = = 9/16
P (A) 0, 32
P (H1 )P (Ā|H1 ) 0, 3 ∗ (1 − 0, 6)
b. P (H1 |Ā) = = = 3/17
P (Ā) 1 − 0, 32
Tôn Thất Tú - 2021 Chương 1: Xác suất 43/51
Ví dụ 30
Một máy bay bắn độc lập 2 quả tên lửa vào một mục tiêu. Xác suất quả thứ nhất và
thứ 2 trúng là 0,6 và 0,7. Nếu có 1 quả trúng thì mục tiêu bị tiêu diệt với xác suất 0,7
và nếu có 2 quả trúng thì xác suất này là 0,9.
a) Tính xác suất có ít nhất 1 quả trúng. b) Tính xác suất mục tiêu bị tiêu diệt.
c) Biết mục tiêu bị tiêu diệt, tính xác suất cả 2 quả đều trúng.
Giải. Gọi Ai là biến cố quả tên lửa thứ i trúng mục tiêu, i = 1, 2. Ta có A1 , A2 độc lập.
a. P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 A2 ) = 0, 6 + 0, 7 − 0, 6 ∗ 0, 7 = 0, 88
b. Gọi Hi là biến cố có i quả tên lửa trúng, i = 0, 1, 2, và A là biến cố mục tiêu bị tiêu diệt. Ta
có {H0 , H1 , H2 } là nhóm đầy đủ.
P (H0 ) = P (Ā1 Ā2 ) = 0, 4 ∗ 0, 3 = 0, 12; P (H1 ) = P (A1 Ā2 ∪ Ā1 A2 ) = 0, 6 ∗ 0, 3 + 0, 4 ∗ 0, 7 =
0, 46; P (H2 ) = P (A1 A2 ) = 0, 6 ∗ 0, 7 = 0, 42.
Theo công thức xác suất toàn phần:
P (A) = P (H0 )P (A|H0 ) + P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )
= 0, 12 ∗ 0 + 0, 46 ∗ 0, 7 + 0, 42 ∗ 0, 9 = 0, 7
P (H2 )P (A|H2 ) 0, 42 ∗ 0, 9
c. P (H2 |A) = = = 0, 54
P (A) 0, 7
Tôn Thất Tú - 2021 Chương 1: Xác suất 44/51
Ví dụ 31
Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có
đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là p(%). Thiết bị có khả năng
phát hiện đúng sản phẩm là phế phẩm với xác suất α và phát hiện đúng sản phẩm đạt
chất lượng với xác suất β. Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho
sản phẩm này:
a. Được kết luận là phế phẩm.
b. Được kết luận là đạt chất lượng thì lại là phế phẩm.
c. Được kết luận đúng với thực chất của nó.
Gợi ý. Gọi H1 , H2 là biến cố sản phẩm được chọn là chính phẩm, phế phẩm. Gọi A
là biến cố được kết luận là phế phẩm. Ta có {H1 , H2 } là nhóm đầy đủ, P (H2 ) =
p, P (A|H2 ) = α, P (Ā|H1 ) = β.
a. P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = (1 − p)(1 − β) + pα
b. P (H1 |A)
c. P (AH2 ) + P (ĀH1 )
Định nghĩa
Dãy n phép thử được gọi là dãy n phép thử Bernoulli nếu thỏa mãn các điều kiện sau:
- Các phép thử độc lập
- Trong mỗi phép thử chỉ xảy ra một trong hai biến cố, kí hiệu A (thành công) và Ā
(thất bại).
- Xác suất xuất hiện biến cố A là p = P (A) không đổi trong các phép thử.
Ví dụ 32
Xác suất để 1 quả trứng đem ấp nở ra gà con là 0.85. Đem ấp 10 quả trứng. Tính xác
suất để có đúng 8 quả nở ra gà con.
Ví dụ 33
Tín hiệu thông tin được phát đi 3 lần độc lập nhau. Xác suất thu được mỗi lần là 0.4.
a) Tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần.
b) Tìm xác suất để nguồn thu nhận được thông tin đó.
c) Nếu muốn xác suất thu được tin ≥ 0.99 thì phải phát đi ít nhất bao nhiêu lần.
Giải.
Ta có mô hình dãy phép thử Bernoulli với n = 3; p = 0, 4.
a. Xác suất để nguồn thu nhận được thông tin đúng 2 lần:
p3 (2) = C32 0, 42 0, 61
p3 (k ≥ 1) = 1 − p3 (0) = 1 − C30 0, 40 0, 63
pn (k ≥ 1) ≥ 0, 99 ⇔ 1 − pn (0) ≥ 0, 99
ln(0, 01)
⇔ Cn0 0, 40 0, 6n ≤ 0, 01 ⇔ n ≥ = 9, 015
ln(0, 6)
Vậy, n = 10.
Tôn Thất Tú - 2021 Chương 1: Xác suất 48/51
Ví dụ 34
Trên giá có 4 cây súng loại 1 và 6 cây súng loại 2. Một xạ thủ chọn ngẫu nhiên 1 cây
súng và bắn 5 phát độc lập. Biết xác suất bắn trúng khi sử dụng súng loại 1 và 2 lần
lượt là 0,6 và 0,3. Tính xác suất có đúng 2 viên đạn trúng đích.
Giải. Gọi Hi là biến cố xạ thủ chọn được súng loại i, i = 1, 2 và A là biến cố xạ thủ
bắn trúng 2 viên. Ta có {H1 , H2 } là nhóm đầy đủ.
Theo công thức xác suất toàn phần:
trong đó:
P (H1 ) = 4/10 = 0, 4; P (H2 ) = 6/10 = 0, 6
Ví dụ 35
Trong năm học vừa qua, ở trường đại học, tỉ lệ sinh viên thi trượt môn Toán là 34%, thi
trượt môn Lý là 20%, và trong số các sinh viên trượt môn Toán, có 50% sinh viên trượt
môn Lý. Phải chọn bao nhiêu sinh viên của trường này sao cho, với xác suất không bé
hơn 99%, trong số đó có ít nhất một sinh viên đậu cả hai môn Toán và Lý.
Giải. Gọi T, L là các biến cố sinh thi trượt môn Toán, Lý tương ứng. Ta có:
P (T ) = 0, 34; P (L) = 0, 2; P (L|T ) = 0, 5
Xác suất thi đậu cả 2 môn:
P (T̄ L̄) = 1 − P (T ∪ L) = 1 − [P (T ) + P (L) − P (T L)]
= 1 − P (T ) − P (L) + P (T )P (L|T ) = 1 − 0, 34 − 0, 2 + 0, 34 ∗ 0, 5 = 0, 63
Gọi n là số sinh viên cần khảo sát. Ta có mô hình Bernoulli với n phép thử và xác suất
p = 0, 63. Theo giả thiết:
pn (k ≥ 1) = 1 − pn (0) ≥ 0, 99 ⇔ (1 − 0, 63)n ≤ 0, 01 ⇔ n ≥ 4, 63 ⇒ n = 5
Tôn Thất Tú - 2021 Chương 1: Xác suất 50/51
Ví dụ 36
Một xưởng dệt có 50 máy dệt. Xác suất mỗi máy dệt bị hỏng trong mỗi ca làm việc là
0.1. Tìm số máy hỏng với khả năng lớn nhất trong 1 ca làm việc.
Giải. Gọi K là số máy hỏng với khả năng lớn nhất. Ta có mô hình Bernoulli với n =
50; p = 0, 1.
Lại có: q = 1 − p = 0, 9. Giá trị K thỏa điều kiện:
np − q ≤ K ≤ np − q + 1 ⇔ 4, 1 ≤ K ≤ 5, 1
Vậy, K = 5.
Tôn Thất Tú - 2021 Chương 1: Xác suất 51/51
XÁC SUẤT THỐNG KÊ
Tôn Thất Tú
Đà Nẵng, 2021
Phân loại
- BNN rời rạc: BNN có tập giá trị có số lượng hữu hạn hoặc vô hạn đếm được.
- BNN liên tục: BNN thỏa các điều kiện sau:
+ tập giá trị tạo thành 1 đoạn, khoảng hoặc hợp các đoạn, khoảng.
+ Với mọi c ta có P (X = c) = 0.
Chẳng hạn ở Ví dụ 1, X, Y là các BNN rời rạc, còn Z là BNN liên tục.
Nhận xét:
i) P (X ≥ a) = 1 − F (a)
ii) P (a ≤ X < b) = F (b) − F (a)
Ví dụ 2
Cho biến ngẫu nhiên X có hàm phân phối
F (x) = a + b. arctan x, x ∈ R
a) Tìm a và b.
b) Tìm x sao cho: P (X ≥ 1 − x) = 1/4
Giải. a. Ta có:
lim F (x) = 1
( (
bπ
x→+∞ a+ 2 =1 a = 1/2
⇔ bπ
⇔
lim F (x) = 0
x→−∞ a− 2 =0 b = 1/π
b. P (X
≥ 1 − x) = 1 − P (X < 1− x) = 1 − F (1 − x)
= 1 − 1/2 + 1/π ∗ arctan(1 − x) = 1/2 − 1/π ∗ arctan(1 − x) = 1/4.
Từ đó: arctan(1 − x) = π/4 hay x = 0.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 5/88
Ví dụ 3
Cho biến ngẫu nhiên X có hàm phân phối
0, x<0
F (x) = 2
ax + b, 0 ≤ x < 2
1,
x≥2
a) Tìm a và b.
b) Tìm hàm phân phối của Y = 2X + 1.
X x1 x2 ... xn
P p1 p2 ... pn
Nhận xét: i)
P
pi = 1
ii) Hàm phân phối của X sẽ là
X
FX (x) = P (X < x) = P (X = xi )
xi <x
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 8/88
Ví dụ 4
Một lô sản phẩm có 12 sản phẩm, trong đó có 8 chính phẩm và 4 phế phẩm. Lấy ngẫu
nhiên 2 sản phẩm. Gọi X là số chính phẩm trong 2 sản phẩm lấy ra. Tìm phân phối của
X, xác định hàm phân phối và tính xác suất P (1 ≤ X < 3).
Giải. Ta có X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1, 2.
P (X = 0) = C42 /C12
2
= 1/11
P (X = 2) = C82 /C12
2
= 14/33
Bảng phân phối xác suất:
X 0 1 2
P 1/11 16/33 14/33
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 9/88
Bảng phân phối xác suất:
X 0 1 2
P 1/11 16/33 14/33
Ví dụ 5
Một xạ thủ có 4 viên đạn, xạ thủ đó bắn từng phát độc lập cho đến khi có phát trúng
hoặc hết đạn thì thôi. Gọi X là số viên đạn đã bắn. Lập bảng phân phối xác suất và
tìm hàm phân phối của X, biết rằng xác suất bắn trúng mỗi lần đều bằng 0,7.
Giải. Gọi H1 , H2 là biến cố lần 1 lấy bi trắng, đen. Ta có {H1 , H2 } là nhóm đầy đủ.
Từ giả thiết, X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1.
P (X = 0) = P (H1 )P (X = 0|H1 ) + P (H2 )P (X = 0|H2 )
= 2/10 ∗ 6/10 + 8/10 ∗ 7/10 = 0, 68
P (X = 1) = P (H1 )P (X = 1|H1 ) + P (H2 )P (X = 1|H2 )
= 2/10 ∗ 4/10 + 8/10 ∗ 3/10 = 0, 32
Bảng phân phối xác suất:
X 0 1
P 0,68 0,32
Chọn ngẫu nhiên 1 thiết bị. Tính xác suất tuổi thọ của thiết bị này:
a) Nhỏ hơn 1 năm. b) Lớn hơn 2 năm.
Giải. a. Xác suất tuổi thọ thiết bị này nhỏ hơn 1 năm:
Z 1 Z 1
P (0 < X < 1) = f (x)dx = 0, 6e−0,6x dx = 1 − e−0,6
0 0
Ví dụ 8
Cho X là biến ngẫu nhiên liên tục có hàm mật độ
(
a x, x ∈ [0, 1]
f (x) =
0, x ∈ / [0, 1]
0, x<0
FX (x) = x2 , x ∈ [0, 1]
1,
x>1
b. Ta có:
(
1 − 8/x3 = 3/4, √
3
⇔ ⇔x=2 4
x≥2
- Nhóm n biến ngẫu nhiên {X1 , X2 , ..., Xn } được gọi là độc lập nếu các biến cố (X1 <
a1 ), ...., (Xn < an ) độc lập với mọi bộ giá trị (a1 , a2 , ..., an ).
a. Kỳ vọng toán
Định nghĩa: Kỳ vọng toán của biến ngẫu nhiên X, kí hiệu E(X), là một số được xác
định như sau:
- Nếu X có phân phối rời rạc với phân phối xác suất P (X = xk ) = pk , k = 1, 2, ... thì
+∞
X
E(X) = x i pi
i=1
- Nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x) thì
+∞
Z
E(X) = x f (x)dx
−∞
Ví dụ 10
Tính kỳ vọng của biến ngẫu nhiên X trong hai trường hợp sau:
a. X có phân phối rời rạc với bảng phân phối xác suất:
X 1 2 3
P 0,2 0,7 0,1
Giải.
a. E(X) = i pi xi = 0, 2 ∗ 1 + 0, 7 ∗ 2 + 0, 1 ∗ 3 = 1, 9
P
b. Ta có:
+∞
Z Z π/2 Z π/2
E(X) = x f (x)dx = x sin xdx = xd(− cos x)
0 0
−∞
π/2
Z π/2
= −x cos x0 + cos xdx = 1
0
Nhận xét:
i) Kì vọng của biến ngẫu nhiên thể hiện giá trị trung bình của biến ngẫu nhiên đó, tức
là khi thực hiện một số lớn lần các phép thử thì giá trị trung bình thu được của các kết
quả sẽ xấp xỉ với kì vọng.
ii) Xét trò chơi may rủi với số tiền đặt cược trong mỗi ván không đổi. Trò chơi được
gọi là công bằng (có lợi hay có hại) đối với người chơi nếu kỳ vọng số tiền nhận được
trong mỗi lần chơi bằng (lớn hơn hay bé hơn) số tiền đặt cược trong mỗi ván chơi.
iii) Nếu g(x) là hàm liên tục thì g(X) cũng là biến ngẫu nhiên và kì vọng của nó được
tính là:
+∞
g(xi ).pi nếu X là biến ngẫu nhiên rời rạc.
P
• Eg(X) =
i=1
+∞
g(x) fX (x)dx nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x).
R
• Eg(X) =
−∞
Giải. Gọi X (ngàn đồng) là số tiền sinh viên này phải trả. Ta có X nhận các giá trị: 4,
5 và 6.
P (X = 4) = C72 /C10
2 = 7/15
1 1 2 = 7/15
P (X = 5) = C7 C3 /C10
P (X = 6) = C32 /C10
2 = 1/15
X 4 5 6
P 7/15 7/15 1/15
Ví dụ 12
Thời gian xếp hàng chờ mua hàng của khách hàng là 1 biến ngẫu nhiên T (phút) có
hàm mật độ: (
a.t3 , t ∈ [0, 3]
f (t) =
0, t∈/ [0, 3]
Tìm a và tính thời gian chờ trung bình của khách hàng.
Ví dụ 13
Một người tham gia trò chơi may rủi với tiền cược mỗi ván là 10000 đồng. Người này
tung ngẫu nhiên 2 đồng xu, nếu được i mặt sấp người này thu về (i + 1) ∗ 5000 đồng,
i = 1, 2. Ngược lại, người này sẽ mất tiền. Hỏi người này có nên chơi trò này thường
xuyên hay không?
Giải. Gọi X (ngàn đồng) là số tiền người này nhận được trong 1 lần chơi. Ta có X
nhận các giá trị: 0, 10 và 15. Bảng phân phối của X:
X 0 10 15
P 1/4 1/2 1/4
Do đó: E(X) = pi xi = 8, 75 (ngàn đồng). Vì số tiền này nhỏ hơn số tiền đặt cược
P
nên nếu người này chơi càng nhiều thì thua càng lớn.
Vậy, người này không nên chơi trò này thường xuyên.
Nhận xét: Trong thực hành, ta hay sử dụng công thức sau: D(X) = E(X 2 ) − (EX)2 ,
trong đó:
P
pi x2i ,
nếu X là biến ngẫu nhiên rời rạc
2
E(X ) = +∞
x f (x)dx, nếu X là biến ngẫu nhiên liên tục
R 2
−∞
Ý nghĩa:
- Phương sai cũng như độ lệch chuẩn là đại lượng đặc trưng cho mức độ tập trung của
các giá trị của biến ngẫu nhiên X quanh kỳ vọng EX. Phương sai càng lớn thì các giá
trị khuếch tán càng xa so với kỳ vọng.
- Trong kỹ thuật phương sai đặc trưng cho sai số của các thiết bị hoặc của các phép
đo. Trong quản lý và kinh doanh, nó đặc trưng cho mức độ rủi ro của các quyết định.
Ví dụ 14
Cho biến ngẫu nhiên X có phân phối
X 1 2 a
P b 0.3 0.5
Giải. a. Ta có hệ:
(P ( (
pi = 1 b + 0, 3 + 0, 5 = 1 a=3
P ⇔ ⇔
E(X) = pi xi = 2, 3 b + 0, 6 + 0, 5a = 2, 3 b = 0, 2
b. Ta có:
D(2X − 3) = D(2X) + D(3) = 4D(X) = 4[E(X 2 ) − (E(X))2 ] = 4[E(X 2 ) − 5, 29]
E(X 2 ) = pi x2i = 0, 2 ∗ 12 + 0, 3 ∗ 22 + 0, 5 ∗ 32 = 5, 9
P
D(2X − 3) = 4(5, 9 − 5, 29) = 2, 44
Tương tự: D(X 2 ) = E(X 4 ) − (E(X 2 ))2 = pi x4i − 5, 92 = 10, 69
P
Do đó, nếu cần chọn phương án đầu tư sao cho tỉ lệ thu hồi vốn kỳ vọng cao hơn thì
nên chọn dự án A, song nếu chọn phương án đầu tư sao cho độ rủi ro của tỉ lệ thu hồi
vốn thấp hơn (tức khả năng thu hồi vốn ổn định hơn) thì lại nên chọn dự án B.
c. Trung vị (median)
Định nghĩa: Trung vị (hay Median) của biến ngẫu nhiên X, được kí hiệu med(X) xác
định theo hệ thức:
1 1
P (X < med(X)) ≤ và P (X > med(X)) ≤
2 2
Nhận xét: Theo định nghĩa trên thì X có thể có nhiều trung vị và trong trường hợp X
là biến ngẫu nhiên liên tục thì med(X) chính là nghiệm của phương trình
1
FX (x) =
2
0.12
0.2
0.06
median
mean
mean
median
0.00
0.0
7 8 9 10 11 12 13 5 10 15 20 25
0.20
0.20
mean
mean
0.10
median
0.10
median
0.00
0.00
5 10 15 20 25 0 5 10 15
- Phân vị mức α, 0 < α < 1 của phân phối tương ứng với biến ngẫu nhiên X là giá trị
xα thỏa P (X < xα ) = α.
- Giá trị tới hạn mức α, 0 < α < 1 của phân phối tương ứng với biến ngẫu nhiên X là
giá trị x̄α thỏa P (X > x̄α ) = α.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 36/88
7. Một số phân phối quan trọng
X 0 1
P 1-p p
Tính chất:
i) Nếu X ∼ B(n, p) thì E(X) = np, D(X) = np(1 − p).
ii) Nếu các biến ngẫu nhiên Xi , i = 1, n độc lập và Xi ∼ Ber(p) thì
X = X1 + ... + Xn ∼ B(n, p)
Nhận xét:
i) B(1, p) chính là phân phối Ber(p).
ii) Xét dãy n phép thử Bernoulli với xác suất thành công là p. Lúc đó, nếu gọi X là biến
ngẫu nhiên chỉ số lần thành công trong dãy n phép thử này thì X ∼ B(n, p).
0
= 1 − C20 0, 70 0, 320 − C20
1
0, 71 0, 319
Ví dụ 18
Một sinh viên thi vấn đáp trả lời 5 câu hỏi một cách độc lập. Khả năng trả lời đúng
mỗi câu hỏi đều bằng 60%. Nếu trả lời đúng thì sinh viên được 4 điểm, ngược lại bị trừ
2 điểm.
a) Tìm xác suất để sinh viên đó trả lời đúng 3 câu.
b) Tìm số điểm trung bình mà sinh viên đó đạt được.
c) Một sinh viên khác vào thi với khả năng trả lời đúng mỗi câu đều như nhau và cho
rằng số điểm trung bình đạt được không ít hơn 14. Hỏi sinh viên này phán đoán khả
năng trả lời đúng mỗi câu tối thiểu là bao nhiêu ?
Giải. Mô hình Bernoulli với n = 5 và p = 0, 6. Gọi X là số câu trả lời đúng của sinh
viên này. Ta có: X ∼ B(n = 5; p = 0, 6).
a. P (X = 3) = p5 (3) = C53 0, 63 0, 42 .
b. Gọi Y là số điểm sinh viên này đạt được.
Ta có: Y = 4X − 2(5 − X) = 6X − 10.
Số điểm trung bình sinh viên này đạt được:
E(Y ) = 6E(X) − 10 = 6np − 10 = 6 ∗ 5 ∗ 0, 6 − 10 = 8 (điểm)
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 41/88
c. Gọi p là xác suất trả lời đúng mỗi câu của sinh viên mới này. Gọi Z và T là số câu
trả lời đúng và số điểm đạt được. Tương tự, ta có:
Z ∼ B(n = 5; p) và T = 6Z − 10
⇔ 6np − 10 = 30p − 10 ≥ 14 ⇔ p ≥ 0, 8
Vậy, sinh viên này dự đoán khả năng trả lời đúng tối thiểu mỗi câu là 80%.
λk e−λ
P (X = k) = , k = 0, 1, 2, ...
k!
Tính chất:
i) Nếu X ∼ P ois(λ) thì E(X) = λ, D(X) = λ.
ii) Cho X1 , X2 độc lập và có phân phối Poisson với tham số λ1 , λ2 . Khi đó X =
X1 + X2 ∼ P ois(λ1 + λ2 ).
Nhận xét: Trong thực tế phân phối Poisson phản ánh phân phối số lượng các biến cố
xuất hiện trong một khoảng thời gian (số cuộc điện thoại gọi đến tổng đài, số khách
hàng đến rút tiền từ một ngân hàng,....) và có tham số tỉ lệ với độ dài khoảng thời gian
đó.
(λt)k e−λt
P (N (t) = k) = , k ≥ 0.
k!
Điều này có nghĩa N (t) ∼ P ois(λt). Tham số λ chính là số biến cố trung bình xuất
hiện trong một đơn vị thời gian.
Giải. Gọi X là số đơn đặt hàng ôtô vào ngày thứ 7. Ta có X ∼ P ois(λ = 2).
22
a. P (X = 2) = e−2 = 2e−2
2!
b. P (X ≥ 4) = 1 − P (X < 4) =!1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
20 21 22 23
= 1 − e−2 + + + = 1 − 19/3e−2
0! 1! 2! 3!
!
20 2 1 2 2 2 3 24
c. P (X > 4) = 1 − P (X ≤ 4) = 1 − e−2 + + + + = 1 − 7e−2
0! 1! 2! 3! 4!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 46/88
Ví dụ 20
Quan sát tại siêu thị A thấy 4 phút trung bình có 20 khách đến mua hàng.
a) Tính xác suất để trong 7 phút có 30 khách đến siêu thị A ?
b) Tính xác suất để trong 2 phút có từ 3 đến 5 khách đến siêu thị A ?
Giả sử số khách đến siêu thị A tuân theo luật phân phối Poisson.
Giải.
a. Gọi X là số khách đến siêu thị trong 7 phút. Lúc đó, X có phân phối Poisson với
tham số λ = 7/4 ∗ 20 = 35. Xác suất cần tìm:
3530
P (X = 30) = e−35
30!
b. Gọi Y là số khách đến siêu thị trong 2 phút. Lúc đó, Y có phân phối Poisson với
tham số λ = 2/4 ∗ 20 = 10. Xác suất cần tìm:
!
−10 103 104 105
P (3 ≤ Y ≤ 5) = P (Y = 3) + P (Y = 4) + P (Y = 5) = e + +
3! 4! 5!
λk e−λ
P (X = k) ≈ trong đóλ = np.
k!
Điều này có nghĩa là X có phân phối xấp xỉ phân phối Poisson với tham số λ = np.
Ví dụ 21
Xác suất mỗi trang giấy bị lỗi do in ấn là 0,009. Tính xấp xỉ xác suất trong một quyển
sách 300 trang có nhiều nhất 3 trang bị lỗi.
Giải. Gọi X là số trang bị lỗi trong quyển sách 300 trang. Ta có: X ∼ B(n = 300; p =
0, 009). Vì n khá lớn và p khá nhỏ nên X có phân phối xấp xỉ phân phối Poisson với
tham số λ = np = 2, 7. Xác suất cần tìm:
P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)
!
2, 7 0 2, 71 2, 7 2 2, 7 3
≈ e−2,7 + + +
0! 1! 2! 3!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 48/88
7.4 Phân phối hình học
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối hình học với tham số p ∈ (0, 1)
nếu X nhận các giá trị 1,2,3,... với xác suất:
P (X = k) = (1 − p)k−1 p, k = 1, 2, 3, ...
1 1−p
Tính chất: E(X) = , D(X) =
p p2
Nhận xét: Xét phép thử và A là một biến cố ở trong phép thử đó với xác suất xảy
ra p = P (A). Thực hiện độc lập và liên tiếp các phép thử cho đến khi biến cố A xuất
hiện thì dừng. Gọi X là số phép thử đã thực hiện. Khi đó, X có phân phối hình học với
tham số p.
CMk C n−k
N −M
P (X = k) = n , k = 0, 1, ..., n
CN
Tính chất: E(X) = n M
N , D(X) = n M
N 1 − M N −n
N N −1
Nhận xét:
i) Cho một tập có N phần tử, trong đó có M phần tử có tính chất A, M ≤ N . Chọn
ngẫu nhiên lần lượt không hoàn lại n lần, mỗi lần một phần tử trong tập hợp này và
gọi X là số phần tử được chọn có tính chất A. Khi đó X ∼ H(N, M, n).
ii) Khi giá trị N lớn và số lần lấy n nhỏ thì phương pháp lấy không hoàn lại và lấy có
hoàn lại gần như không khác nhau. Vì vậy trong trường hợp N lớn và số lần lấy n nhỏ
thì ta có thể xem phân phối H(N, M, n) xấp xỉ phân phối B(n, p) với p = M/N .
1 , x ∈ [a, b]
f (x) = b − a
0, x∈/ [a, b]
2
Tính chất: EX = a+b 2 , DX =
(b−a)
12
Nhận xét: Các hàm phát sinh số ngẫu nhiên thực trong đoạn [0,1] (trên các ngôn ngữ
lập trình, Excel, may tính bỏ túi, ...) là hàm mô phỏng giá trị của biến ngẫu nhiên có
phân phối đều trên đoạn [0, 1].
Giải: Gọi X (ph) là thời gian tính từ lúc 7h người này đến trạm dừng A. Theo giả thiết
X có phân phối đều trên [0, 30]. Hàm mật độ của X:
(
1/30, x ∈ [0, 30]
f (x) =
0, x∈ / [0, 30]
λe−λt (λt)n−1
fTn (t) =
(n − 1)!
X Phân phối của Tn thường được gọi là phân Gamma với tham số (n, λ) (đôi lúc còn
gọi là phân phối n - Erlang).
X Khi n = 1, T1 có phân phối mũ với tham số λ.
Giải. a. Gọi X (năm) là tuổi thọ của mạch điện tử. Theo giả thiết, X ∼ Exp(λ) với
E(X) = 1/λ = 6, 25 ⇒ λ = 4/25. Hàm mật độ:
(
4/25e−4/25x , x > 0
f (x) =
0, x≤0
E(Y ) = np = 40 ∗ 0, 15 = 6
1 (x−µ)2
f (x) = √ e− 2σ2 , x ∈ R
σ 2π
Khi µ = 0, σ = 1 ta bảo X có phân phối chuẩn tắc N (0, 1). Hàm mật độ ϕ(x) và
hàm phân phối Φ(x) của phân phối chuẩn tắc N(0,1) tương ứng là:
1 2
ϕ(x) = √ e−x /2 , x ∈ R
2π
Z x
1 2
Φ(x) = √ e−t /2 dt, x ∈ R
2π −∞
Nhận xét:
i) Biến ngẫu nhiên có phân phối chuẩn tắc thường được kí hiệu là Z. Do đó:
Φ(x) = P (Z < x)
ii) Φ(−x) = 1 − Φ(x), ∀x ∈ R.
1 R x −t2 /2
iii) Φ(x) = 1/2 + Φ0 (x), trong đó Φ0 (x) = √ e dt - hàm Laplace.
2π 0
Một vài giá trị hay sử dụng:
Giá trị tới hạn: Giá trị tới hạn mức α của phân phối chuẩn tắc được kí hiệu zα , tức là:
Tính chất:
i)Nếu X ∼ N (µ, σ 2 ) thì E(X) = µ, D(X) = σ 2 .
ii) Nếu X ∼ N (µ, σ 2 ) thì Y = aX + b ∼ N (aµ + b, a2 σ 2 ), a 6= 0.
iii) Nếu X1 , ..., Xn là các biến ngẫu nhiên độc lập có phân phối chuẩn Xi ∼
n
N (µi , σi2 ), i = 1, n thì biến ngẫu nhiên X = λ1 X1 + ... + λn Xn + C, λ2i 6= 0
P
i=1
cũng có phân phối chuẩn với
!
n
P n
P
µX = E(X) = E λi X i + C = λi µi + C,
i=1 i=1
!
n n
σ 2 = D(X) = D λ2i σi2
P P
λi Xi + C =
X
i=1 i=1
Đặc biệt, nếu X1 , ..., Xn độc lập và có cùng phân phối chuẩn N (µ, σ 2 ) thì
X1 + ... + Xn σ2
X = X1 + ... + Xn ∼ N (nµ; nσ 2 ); X = ∼ N µ;
n n
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 62/88
X −µ
Z= ∼ N (0; 1)
σ
Giải. Ta có: 5 − 4
P (X < 5) = Φ = 0, 63
3
1 − 4
P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 841
3
4 − 4 2 − 4
P (|X − 3| < 1) = P (2 < X < 4) = Φ −Φ = 0, 2475
3 3
Ví dụ 26
Giả sử số đo chiều dài của một sợi dây kim loại do một máy tự động cắt ra là một biến
ngẫu nhiên chuẩn với µ = 10mm, σ 2 = 4mm2 .
a) Tính xác suất lấy ra được một sợi dây có chiều dài lớn hơn 13mm.
b) Chọn ngẫu nhiên 10 sợi dây loại này. Tính xác suất có đúng 3 sợi có chiều dài từ
8, 5mm đến 12, 5mm.
Giải. Gọi X là số đo chiều dài sợi dây kim loại. Ta có: X ∼ N (10; 22 ).
13 − 10
a. P (X > 13) = 1 − P (X ≤ 13) = 1 − Φ = 0, 067
2
b. Mô hình Bernoulli với n = 10 và p = P (8, 5 < X < 12, 5). Ta có:
12, 5 − 10 8, 5 − 10
p=Φ −Φ = 0, 668
2 2
Ví dụ 27
Cho X là biến ngẫu nhiên có phân phối chuẩn. Biết rằng P (X > 4) = 0, 159 và P (X <
3) = 0, 309. Tính xác suất P (X > 1). Cho biết Φ(1/2) = 0, 691 và Φ(1) = 0, 841.
⇔ 3 − µ = −σ/2 (2)
Giải hệ (1),(2) ta được: µ = 10/3; σ = 2/3.
1 − 10/3
Vậy, P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 99976
2/3
Giải. a. Đặt Z = 2X − 3Y . Theo tính chất của phân phối chuẩn, Z cũng có phân phối
chuẩn với tham số:
(
µZ = E(Z) = 2E(X) − 3E(Y ) = 2 ∗ 15 − 3 ∗ 10 = 0
σZ2 = D(Z) = 4D(X) + 9D(Y ) = 4 ∗ 4 + 9 ∗ 1 = 25
0 − 0
Do đó, Z ∼ N (0; 25). Vậy, P (2X > 3Y ) = P (Z > 0) = 1 − Φ = 1/2.
5
b. Sử dụng tính chất của kỳ vọng và phương sai:
( ( #
E(T ) = 30 15 + 10a + b = 30 a = 1; b = 5
⇔ ⇔
D(T ) = 5 4 + a2 = 5 a = −1; b = 25
Ví dụ 29
Chiều cao X (mét) của nam thanh niên trưởng thành ở quốc gia A tuân theo quy luật
phân bố chuẩn N (µ; 0, 12 ). Chọn ngẫu nhiên 100 nam thanh niên của quốc gia A. Tính
xác suất sai số tuyệt đối giữa chiều cao trung bình của 100 nam thanh niên được chọn
với µ không vượt quá 0, 03.
Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 100 và X̄ = (X1 +...+X100 )/100.
Ta có: Xi độc lập và Xi ∼ N (µ; 0, 12 ). Theo tính chất của phân phối chuẩn, X̄ cũng
có phân phối chuẩn với tham số:
(
µX̄ = E(X̄) = µ
2 = D(X̄) = 0, 12 /100 = 10−4
σX̄
Ứng dụng
- Khi nghiên cứu các phân phối, nếu nó thỏa quy tắc 2σ và 3σ thì điều này cung cấp
cho chúng ta cơ sở để «có thể xem» phân phối đang nghiên cứu là phân phối chuẩn.
- Ngược lại, nếu biết phân phối đang nghiên cứu là phân phối chuẩn, lúc đó các «khoảng»
2σ và 3σ lần lượt chiếm 95,45% và 99,73% các giá trị có thể.
Ví dụ 30
Thu thập dữ liệu từ 2 phân phối, thực hiện tính toán và được kết quả:
trong đó x̄ và s lần lượt là trung bình mẫu và độ lệch chuẩn mẫu (Chương 4).
Câu hỏi: Phân phối nào có thể xem là chuẩn? 1 hay 2?
+∞
trong đó hàm gamma: Γ(a) = xa−1 e−x dx, a > 0.
R
0
tn;α ≈ zα
Tính chất:
i) E(X) = 0, D(X) = n−2n
,n>2
ii) Hàm mật độ của Tn có dạng:
!− n+1
Γ n+12 x2 2
f (x) = √ $n 1 + , x ∈ R.
nπΓ 2 n
trong đó Sn = X1 + X2 + ... + Xn .
Ứng dụng: Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân phối xác suất
với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì với n lớn
(n ≥ 30) Sn = X1 + ... + Xn có phân phối xấp xỉ phân phối chuẩn N (nµ, nσ 2 ).
Giải. a. Gọi Xi là tuổi thọ của bóng đèn thứ i, i ≥ 1. Ta có các biến ngẫu nhiên Xi độc
lập và có cùng phân phối với X. Do đó, áp dụng định lý giới hạn trung tâm:
T = X1 + ... + X30
có phân phối xấp xỉ phân phối chuẩn N (30 ∗ 250; 30 ∗ 502 ) = N (7500; 75000)
Xác suất cần tìm:
8750 − 7500
P (T ≥ 8750) = 1 − P (T < 8750) ≈ 1 − Φ √ ≈0
75000
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 79/88
b. Gọi n là số bóng đèn cần mua dự trữ. Tương tự, áp dụng định lý giới hạn trung tâm:
Tn = X1 + ... + Xn
Ví dụ 32
Tung ngẫu nhiên một con xúc xắc cân đối 200 lần độc lập. Tính xấp xỉ xác suất tổng
số chấm xuất hiện (ở mặt trên cùng) lớn hơn 720.
Giải. Gọi Xi là số chấm xuất hiện ở lần tung thứ i, i = 1, 200. Đặt S = X1 + ... + X200 .
Ta có: X1 , ..., X200 là các biến ngẫu nhiên độc lập cùng phân phối.
Xi 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6
Hay nói cách khác, khi n lớn X có phân phối xấp xỉ phân phối chuẩn N (µ, σ 2 ) với
µ = E(X) = np và σ 2 = D(X) = np(1 − p).
1 2
trong đó ϕ(x) = √ e−x /2 - hàm mật độ phân phối chuẩn tắc N(0,1).
2π
Giải. Gọi X là số viên đạn bắn trúng. Ta có: X ∼ B(n = 200; p = 0, 6). Áp dụng định lý
Moivre-Laplace, X có phân phối xấp xỉ chuẩn với µ = np = 120; σ 2 = np(1 − p) = 48.
Do đó:
200 − 120 100 − 120
P (100 ≤ X ≤ 200) ≈ Φ √ −Φ √ = 0, 998
48 48
Ví dụ 34
Một công ty bảo hiểm xe máy có 10 000 khách hàng. Mỗi chủ xe phải nộp 120.000
đồng/1 năm và trung bình nhận lại là 1.000.000 đồng nếu xe của họ bị tai nạn giao
thông. Qua thống kê biết tỉ lệ để 1 xe máy bị tai nạn giao thông trong một năm là
0,006. Tìm xác suất để sau một năm hoạt động công ty bị thất bại.
Giải. Gọi X là số xe bị tai nạn và Y (ngàn đồng) là số tiền lãi của công ty trong 1 năm.
Ta có: X ∼ B(n = 10000; p = 0, 006) và Y = 12 ∗ 105 − 1000X.
Áp dụng định lý Moivre-Laplace, X có phân phối xấp xỉ chuẩn với tham số
Xác suất để sau một năm hoạt động công ty bị thất bại:
1200 − 60
P (Y < 0) = P (12 ∗ 105 − 1000X < 0) = P (X > 1200) ≈ 1 − Φ √ ≈0
59, 64
Nhận xét: Cho X ∼ N (n, p). Khi n khá lớn (và thỏa điều kiện nhất định) thì theo
đinh lý giới hạn tích phân Moivre-Laplace, X có phân phối xấp xỉ phân phối liên tục
là phân phối chuẩn N (np, np(1 − p)). Vì thế, khi tính xấp xỉ xác suất người ta thường
hiệu chỉnh:
!
k + 0.5 − np
P (X ≤ k) = P (X < k + 0.5) ≈ Φ p
np(1 − p)
!
k − 0.5 − np
P (X < k) = P (X ≤ k − 1) = P (X < k − 0.5) ≈ Φ p
np(1 − p)
P (k1 < X < k2 ) = P (X < k2 ) − P (X ≤ k1 )
P (k1 ≤ X < k2 ) = P (X < k2 ) − P (X < k1 )
...............
Đà Nẵng, 2021
Ví dụ 1
Một hộp có 2 bi trắng và 3 bi đen. Lấy ngẫu nhiên 1 viên không hoàn lại, rồi tiếp tục
lấy ngẫu nhiên 2 viên không hoàn lại. Gọi X và Y là số bi đen lấy được ở lần 1 và lần 2.
a. Lập bảng phân phối đồng thời của X và Y .
b. Tính xác suất P (X + Y < 2).
C22
P (X = 1, Y = 2) = P (X = 1)P (Y = 2|X = 1) = 3/5 ∗ = 1/10
C42
Bảng phân phối đồng thời:
Y
0 1 2
X
0 0 1/5 1/5
1 1/10 2/5 1/10
b. Xác suất:
P (X + Y < 2) = P (X = Y = 0) + P (X = 0, Y = 1) + P (X = 1, Y = 0)
= 0 + 1/5 + 1/10 = 3/10
Từ đó ta được bảng phân phối của X và được gọi là phân phối biên X:
X x1 x2 ... xi ...
P p1. p2. ... pi. ...
Nhận xét: Trong thực hành, để tìm phân phối biên ta có thể xuất phát từ bảng phân
phối đồng thời tính tổng các xác suất theo hàng hoặc theo cột như bảng minh họa sau
đây:
Y
y1 y2 ... yj ... P (X = xi )
X
x1 p11 p12 ... pi1 ... p1.
x2 p21 p22 ... p2j ... p2.
... ... ... ... ... ... ...
xi pi1 pi2 ... pij ... pi.
... ... ... ... ... ... ...
P (Y = yj ) p.1 p.2 ... p.j ...
Phân phối biên của Y được tìm hoàn toàn tương tự.
P (X = xi , Y = yj ) pij
P (xi |yj ) = P (X = xi |Y = yj ) = =
P (Y = yj ) p.j
được gọi là xác suất có điều kiện để X nhận giá trị xi khi biết Y = yj .
Ứng với mỗi yj cố định ta có bảng phân phối xác suất có điều kiện của X với điều kiện
Y = yj :
Tương tự ứng với mỗi xi cố định ta có bảng phân phối xác suất có điều kiện của Y với
điều kiện X = xi .
Ví dụ 3
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
X
1 2 3
Y
5 0.1 0.2 0.3
6 0.08 0.16 0.16
X 1 2 3
P 0,18 0,36 0,46
Y 5 6
P 0,6 0,4
Xác suất:
P (X = 1, Y = 6) 0, 08 4
P (Y = 6|X = 1) = = =
P (X = 1) 0, 18 9
Hàm fX,Y (u, v) được gọi là hàm mật độ đồng thời của X, Y .
Tính chất:
+∞ Z
+∞
∂ 2 FX,Y (u, v)
Z
i)fX,Y (u, v) ≥ 0, ii)fX,Y (u, v) = , iii) fX,Y (u, v)dudv = 1
∂u∂v
−∞ −∞
b. Phân phối biên: Hàm mật độ biên của X và Y được xác định như sau:
+∞
Z
fX (x) = fX,Y (x, y)dy
−∞
+∞
Z
fY (y) = fX,Y (x, y)dx
−∞
fX,Y (x, y)
fX|Y (x|y) =
fY (y)
Ví dụ 4
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
(
C(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) =
0, (x, y) ∈
/ [0, 1] × [0, 1]
Tìm C, fX (x), fY |X (y|x) và tính xác suất P (0 < X < Y < 1/2).
Xác suất:
1/2 Z y 1/2 Z y
4
Z Z
P (0 < X < Y < 1/2) = f (x, y)dxdy = (x + xy)dxdy
0 0 0 0 3
1/2
2
Z
= (1 + y)y 2 dy = 11/288.
0 3
- Nếu (X, Y ) có phân phối đồng thời liên tục với hàm mật độ xác suất đồng thời f (x, y)
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định:
Z +∞ Z +∞
Eh(X, Y ) = h(x, y)f (x, y)dxdy.
−∞ −∞
Ví dụ 5
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
X
1 2
Y
1 0.1 0.2
2 0.3 0.4
Tính E(2X − 3Y )
Giải: Ta có: X
E(2X − 3Y ) = (2xi − 3yj )pi,j = ....
i,j
Tính E(X 2 + Y 2 ).
Giải. Ta có:
+∞ Z +∞ 1Z 1
4
Z Z
2 2 2 2
E(X +Y ) = (x +y )f (x, y)dxdy = (x2 +y 2 ) (x+xy)dxdy = ...
−∞ −∞ 0 0 3
- Nếu X và Y có phân phối đồng thời rời rạc thì điều kiện trên trở thành:
P (X = xi , Y = yj ) = P (X = xi ).P (Y = yj ), ∀i, j
- Nếu X và Y có phân phối đồng thời liên tục thì điều kiện trên trở thành:
iii) Trong thực hành, ta tính Cov(X, Y ) = E(XY ) − E(X).E(Y ), trong đó:
P
xi yj pij ,
X, Y có phân phối đồng thời rời rạc
E(XY ) = +∞ R +∞
xyfXY (x, y)dxdy, X, Y có phân phối đồng thời liên tục
R
−∞ −∞
b. Hệ số tương quan
Hệ số tương quan của hai biến ngẫu nhiên X và Y , kí hiệu ρ(X, Y ) được xác định bởi
biểu thức: Cov(X, Y )
ρ(X, Y ) = p
D(X)D(Y )
Tính chất:
i) ρ(X, Y ) = ρ(Y, X) ii) |ρ(X, Y )| ≤ 1
iii) Nếu Y = aX + b hoặc X = aY + b, a, b ∈ R, a 6= 0 (phụ thuộc tuyến tính) thì
(
1, a>0
ρ(X, Y ) =
−1, a < 0
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 22/27
Ý nghĩa hệ số tương quan: Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa
X và Y . Khi |ρ(X, Y )| càng gần 1 thì quan hệ tuyến tính giữa X và Y càng mạnh.
X Khi ρ(X, Y ) > 0: X, Y tương quan dương (thuận), tức là X, Y có xu hướng cùng
tăng hoặc cùng giảm.
X Khi ρ(X, Y ) < 0: X, Y tương quan âm (nghịch), tức là X, Y có xu hướng tăng và
giảm ngược chiều nhau.
Để đánh giá mức độ tương quan, ta có thể tham khảo bảng sau (Hopkins, 2000):
−2.0
1.5
ρ = 0.96 ρ = − 0.98
−3.0
0.6 0.8 1.0 1.2 1.4 0.6 0.8 1.0 1.2 1.4
0.2
1.0
0.0
0.0
ρ = 0.19
−1.0
ρ = − 0.13
−0.2
Ví dụ 7
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
X
1 2 3
Y
1 0.1 0.1 0.2
2 0.2 0.1 0.3
P (X = 1, Y = 2) 0, 2 2
P (Y = 2|X = 1) = = =
P (X = 1) 0, 3 3
Phân phối có điều kiện:
Y |X = 1 1 2
P 1/3 2/3
Do đó: E(Y |X = 1) =
P
yi P (Y = yi |X = 1) = 5/3.
Hiệp phương
P sai: Cov(X, Y ) = E(XY P ) − E(X)E(Y ), trong đó:P
E(X) = pi xi = 2, 2; E(Y ) = pi yi = 1, 6; E(XY ) = pij xi yj = 3, 5
⇒ Cov(X, Y ) = 3, 5 − 2, 2 ∗ 1, 6 = −0, 02
Phương sai:
D(X) = E(X 2 ) − (EX)2 =P pi x2i − 2, 22 = 0, 76
P
D(Y ) = E(Y 2 ) − (EY )2 = pi yi2 − 1, 62 = 0, 24
Cov(X, Y ) −0, 02
⇒ ρ(X, Y ) = p =√ = −0, 0468
D(X)D(Y ) 0, 76 ∗ 0, 24
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 26/27
Ví dụ 8
Cho vectơ ngẫu nhiên (X, Y ) có hàm
( mật độ đồng thời:
x + y, (x, y) ∈ [0, 1]2
f (x, y) =
0, / [0, 1]2
(x, y) ∈
Z +∞ Z +∞ Z 1Z 1
E(XY ) = xyf (x, y)dxdy = xy(x + y)dxdy = 1/3
−∞ −∞ 0 0
Đà Nẵng, 2021
- Thống kê: khoa học về điều tra và thu thập dữ liệu, tổ chức và sắp xếp dữ liệu, phân
tích, diễn giải và trình bày dữ liệu.
- Mục đích: Rút ra các thông tin hữu ích về quy luật phân phối của tổng thể đang
nghiên cứu từ dữ liệu thu được.
- Thống kê được chia thành:
+ Thống kê mô tả: mô tả dữ liệu thông qua các công cụ: bảng biểu, chỉ số và các biểu
đồ thống kê.
+ Thống kê suy diễn: sử dụng dữ liệu thu được để đưa ra các nhận xét, suy đoán và
kết luận về tổng thể nghiên cứu (dựa trên cơ sở của lý thuyết xác suất).
trong đó x1 , ..., xm là các giá trị khác nhau với số lần xuất hiện là n1 , ..., nm .
- Bảng tần suất:
Ví dụ 1
Khảo sát số học sinh ở các khối lớp của một trường THCS ta được bảng số liệu:
Lớp 6 7 8 9
Số học sinh 230 217 220 235
Lớp
6 7 8 9
Giới tính
Nam 110 117 105 115
Nữ 120 100 115 120
Nếu ta quan tâm thêm tình trạng học học sinh có đeo kính hay không, ta có thể thiết
lập bảng tần số như sau:
Nhận xét: Thông thường các khoảng chia có độ dài bằng nhau. Tuy nhiên, tùy thuộc
vào mục đích nghiên cứu mà ta có thể có những cách chia khoảng khác nhau. Số khoảng
√
chia thường từ 5-20 khoảng, hoặc [ n], hoặc [log2 n] ([x] - số nguyên lớn nhất không
vượt quá x).
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 8/32
Ví dụ 2
Cân thử 100 trái táo vừa thu hoạch, ta được bảng số liệu sau:
Ví dụ 3
Khảo sát ngẫu nhiên một nhóm người từ độ tuổi 15 trở lên thường đọc tin tức thời sự
online ở một thành phố, số liệu được thể hiện ở bảng sau:
X x1 x2 ... xm
ni n1 n2 ... nm
X a0 − a1 a1 − a2 ... am−1 − am
ni n1 n2 ... nm
b. Trung vị mẫu
Sắp xếp mẫu số liệu theo thứ tự tăng dần, giả sử x1 ≤ x2 ≤ ... ≤ xn . Trung vị mẫu, kí
hiệu xmed , xác định bởi:
x n+1 ,
nếu n lẻ,
xmed = x n2 + x n +1
2
2
nếu n chẵn.
2
3. Biểu đồ
a. Biểu đồ cho dữ liệu rời rạc:
- Biểu đồ cột: đồ thị gồm các cột hình chữ nhật có chiều cao bằng tần số (tần suất)
tương ứng.
- Đa giác tần số : đường gấp khúc nối các điểm (x1 , n1 ), ..., (xk , nk ) trên mặt phẳng.
- Đa giác tần suất: đường gấp khúc nối các điểm (x1 , f1 ), ..., (xk , fk ) trên mặt phẳng.
- Biểu đồ hình tròn: hình tròn được chia ra các phần có góc ở tâm tỉ lệ với tần số (tần
suất) tương ứng.
X 1 2 3 4 5
Tần số 12 30 20 11 7
Tần suất 0.15 0.4 0.3 0.14 0.1
Ví dụ 7
Dữ liệu được khảo sát từ biến ngẫu nhiên liên tục. Miền dữ liệu được chia thành 10
khoảng đều nhau. Các tổ chức đồ được xây dựng như ở hình sau đây.
- Biểu đồ xác suất chuẩn: Giả sử mẫu số liệu của biến ngẫu nhiên liên tục X đã sắp thứ
tự tăng dần:
x1 ≤ x2 ≤ x3 ≤ ... ≤ xn .
Với i = 1, 2, ..., n, đặt
i − 0.5
zi = Φ−1 hay Φ(zi ) = (i − 0, 5)/n.
n
Biểu đồ xác suất chuẩn là tập hợp các điểm có tọa độ (zi ; xi ), i = 1, 2, ..., n trên hệ
trục tọa độ Descartes vuông góc Ozx.
Nếu (zi ; xi ), i = 1, 2, ..., n nằm xấp xỉ trên 1 đường thẳng thì có thể xem biến ngẫu
nhiên X có phân phối chuẩn. Đường thẳng này có phương trình: x = σ̂z + µ̂ , với
µ̂ = x̄, σ̂ = s - trung bình và độ lệch chuẩn mẫu được tính dựa trên mẫu đã cho.
Nhận xét: Ở các phần mềm thống kê, người ta còn sử dụng các cách thức khác để xây
dựng đường thẳng ở trên.
Ví dụ 8
Quan sát biểu đồ xác suất chuẩn sau đây.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 25/32
BIỂU ĐỒ XÁC SUẤT CHUẨN
6.5
6.0
5.5
5.0
4.5
4.0
Định lý 2: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
phối chuẩn N (µ; σ 2 ) thì:
√
(n − 1)S 2 2 (X − µ) n
∼ χn−1 , ∼ Tn−1
σ2 S
Định lý 3: Nếu {X1 , X2 , ..., Xn } và {Y1 , Y2 , ..., Ym } là hai mẫu ngẫu nhiên của hai biến
ngẫu nhiên độc lập X và Y có phân phối chuẩn N (µ1 ; σ12 ) và N (µ2 ; σ22 ) tương ứng thì:
!
σ12 σ22
X − Y ∼ N µ1 − µ2 , +
n m
2 /σ 2
SX 1
∼ Fn−1,m−1 .
SY2 /σ22
b. Trường hợp tổng thể không tuân theo luật phân phối chuẩn
- Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có E(X) =
µ, D(X) = σ 2 hữu hạn thì khi n lớn (n > 30) theo định lý giới hạn trung tâm:
√
σ2 n(X − µ)
X có phân phối xấp xỉ N µ, và có phân phối xấp xỉ N (0, 1)
n S
Ví dụ 9
Chiều cao của thanh niên tuân theo luật phân phối chuẩn N (µ; σ 2 ), với µ = 165(cm)
và σ = 5(cm). Tính xác suất chiều cao trung bình của 16 thanh niên được chọn ngẫu
nhiên lớn hơn 167 (cm).
Ví dụ 10
Để nghiên cứu về thâm niên công tác (tính tròn năm) của nhân viên ở một công ty lớn,
người ta khảo sát thâm niên của 100 nhân viên được chọn ngẫu nhiên trong công ty.
Kết quả như sau:
a. Hãy tính giá trị trung bình mẫu và giá trị độ lệch chuẩn mẫu.
b. Giả sử thâm niên công tác của nhân viên ở công ty trên là biến ngẫu nhiên X có kỳ
vọng là 12 năm và độ lệch chuẩn là 3 năm. Tính xác suất để trung bình mẫu nhận giá
trị lớn hơn 12,5 năm.
Thâm niên 6 9 12 15 18
Số nhân viên 8 21 36 25 10
Đà Nẵng, 2021
- Cho θ̂1 và θ̂2 là hai ước lượng không chệch của tham số θ.
D(θ̂1 ) = E(θ̂1 − E θ̂1 )2 = E(θ̂1 − θ)2 và D(θ̂2 ) = E(θ̂2 − E θ̂2 )2 = E(θ̂2 − θ)2
Ta nói ước lượng θ̂1 hiệu quả hơn ước lượng θ̂2 nếu D(θ̂1 ) < D(θ̂2 ).
- Ước lượng θ̂ của θ là ước lượng không chệch và có phương sai D(θ̂) bé nhất được
gọi là ước lượng tốt nhất.
Điều này có nghĩa S∗2 là ước lượng chệch (không chệch tiệm cận) của σ 2 , do đó nó
«không được chọn» làm phương sai mẫu.
X1 + X2 + ... + Xn
P̂ =
n
- Nếu {x1 , x2 , ..., xn } là mẫu ngẫu nhiên kích thước n của phân phối liên tục có hàm
mật độ xác suất f (x, θ) với θ là tham số chưa biết thì hàm hợp lí L(θ) là hàm được
định nghĩa như sau:
Yn
L(θ) = f (xi , θ).
i=1
Nhận xét: Hàm hợp lí L(θ) chính là hàm xác suất (mật độ xác suất) đồng thời của
mẫu ngẫu nhiên.
Định nghĩa: Cho hàm hợp lí L(θ) với tham số θ chưa biết. Nếu θM L là giá trị tham số
thỏa mãn L(θM L ) ≥ L(θ) với mọi θ thì θM L được gọi là ước lượng hợp lí cực đại của
tham số θ.
Nhận xét:
i) Trong thực hành để tìm ước lượng hợp lý cực đại ta giải phương trình:
ii) Trường hợp θ là một vectơ các tham số, tức là θ = (θ1 , ..., θm ), để tìm ước lượng
hợp lý cực đại ta giải hệ phương trình sau đây:
∂L(θ) ∂ ln L(θ)
= 0, = 0,
∂θ1 ∂θ1
··· hoặc ···
∂L(θ) ∂ ln L(θ)
∂θ = 0, = 0.
∂θ
m m
Suy ra: n
X n
Y
ln L(λ) = xi ln(λ) − ln( xi !) − nλ.
i=1 i=1
n n
Do đó: d ln L(λ) 1 X 1X
= xi − n = 0 ⇔ λ = xi .
dλ λ n
i=1 i=1
Vậy, ước lượng hợp lý cực đại λM L của λ là: λM L = n1 ni=1 xi .
P
Ví dụ 3
Tìm ước lượng tham số của phân phối chuẩn N (µ; σ 2 ) bằng phương pháp ước lượng
hợp lí cực đại.
Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý
L(µ, σ 2 ) được xác định:
n
! P "
n 2
Y 1 (x i − µ)
L(µ, σ 2 ) = f (xi ) = √ exp − i=1 2 .
σ n ( 2π)n 2σ
i=1
Suy ra:
Pn
n n i=1 (xi − µ)2
ln L(µ, σ ) = − ln(σ 2 ) − ln(2π) −
2
.
2 2 2σ 2
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 10/45
Do đó:
Pn
∂ ln L(µ, σ 2 ) (xi − µ)
= i=1 2 ,
∂µ σ
n 2
∂ ln L(µ, σ 2 )
P
n i=1 (xi − µ)
= − + .
∂σ 2 2σ 2 2σ 4
Giải hệ:
∂ ln L(µ, σ 2 )
=0
∂µ
∂ ln L(µ, σ 2 )
= 0,
∂σ 2
n n
theo µ, σ 2 ta được: 1X 1X
µ= xi = x̄ và σ 2 = (xi − x̄)2 .
n n
i=1 i=1
Khi đó, khoảng (L, U ) được gọi là khoảng tin cậy của tham số θ với độ tin cậy 1 − α.
Giá trị α được gọi là mức ý nghĩa. Hiệu số U − L được gọi là độ dài khoảng tin cậy.
Ý nghĩa: Nếu ta thực hiện việc lấy mẫu nhiều lần và mỗi lần ta đều tính khoảng tin
cậy (L, U ) dựa trên mẫu thu được, thì tỉ lệ khoảng tin cậy chứa giá trị chính xác θ xấp
xỉ 1 − α.
Phương pháp chung xây dựng khoảng tin cậy với độ tin cây cậy 1 − α:
i) chọn hai số α1 , α2 ∈ (0, 1) sao cho α1 + α2 = α.
ii) xây dựng thống kê:
Gn = Gn (X1 , ..., Xn , θ)
sao cho phân phối của Gn hoàn toàn xác định (hoặc phân phối giới hạn của Gn khi
n → ∞ xác định) và không phụ thuộc vào tham số θ. Ngoài ra, Gn là một hàm đơn
điệu theo θ.
iii) Chọn hai số a và b sao cho P (Gn ≤ a) = α1 và P (Gn < b) = 1 − α2 .
iv) Giải bất phương trình a < Gn (X1 , ..., Xn , θ) < b theo θ ta được khoảng tin cậy cần
tìm.
Nhận xét:
i) Trong một số trường hợp, các giá trị L, U trong định nghĩa có thể được chọn sao cho:
P (L < θ < U ) ≥ 1 − α.
a. Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
σ σ
x − zα/2 √ < µ < x + zα/2 √ ,
n n
Nhận xét: Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả
trên vẫn áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu
nhiên X.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 17/45
Ví dụ 4
Khối lượng (kg) của một thiết bị có phân phối chuẩn N (µ; σ 2 ) với σ = 0.2 (kg). Chọn
ngẫu nhiên 25 thiết bị người ta tính được trung bình mẫu x = 65, 1 (kg). Với độ tin cậy
95% hãy tìm khoảng tin cậy (đối xứng) cho khối lượng trung bình của thiết bị này. Cho
biết z0,025 = 1, 96.
Giải.
- Các số đặc trưng mẫu: n = 25; x̄ = 65, 1.
- Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96.
- Sai số ước lượng:
σ 0, 2
ε = zα/2 √ = 1, 96 ∗ √ = 0, 0784
n 25
- Khoảng tin cậy cho khối lượng trung bình µ của thiết bị này:
b. Vấn đề cỡ mẫu
Từ công thức khoảng tin cậy cho µ ta thấy rằng sai số của ước lượng |x − µ| bé hơn
σ
hoặc bằng zα/2 √ .
n
- Sai số ước lượng:
σ
ε = zα/2 √
n
- Điều kiện hạn chế: ε < ∆ với ∆ > 0 cho trước.
σ
ε = zα/2 √ < ∆
n
Ví dụ 5
Trở lại với Ví dụ 4 nếu yêu cầu sai số ước lượng không vượt quá 0,05 thì với độ tin cậy
98% ta cần chọn tối thiểu bao nhiêu thiết bị để khảo sát? Cho biết z0,01 = 2, 326.
Giải.
- Sai số ước lượng:
σ
ε = zα/2 √
n
- Điều kiện hạn chế: ε < ∆ = 0, 05.
- Suy ra:
zα/2 σ 2
n> .
∆
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326.
Do đó:
2, 326 ∗ 0, 2 2
n> = 86, 56
0, 05
Vậy, kích thước mẫu tối thiểu cần khảo sát: n = 87
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 20/45
2.3 Khoảng tin cậy cho kì vọng khi chưa biết phương sai
Bài toán: Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ và σ 2 chưa biết. Tìm khoảng tin cậy cho µ với độ tin cậy 1 − α.
Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì
√
(X − µ) n
T = ∼ Tn−1
S
- Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị tn−1;α/2 là giá trị tới hạn của
phân phối Tn−1 , tức là P (T > tn−1;α/2 ) = α/2. Sau đó, giải phương trình:
S S
−tn−1;α/2 < T < tn−1;α/2 ⇔ X − tn−1;α/2 √ < µ < X + tn−1;α/2 √
n n
- Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay tn−1;α/2 bởi tn−1;α và thu được khoảng
tin cậy một phía.
Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
s s
x − tn−1;α/2 √ < µ < x + tn−1;α/2 √ ,
n n
Ví dụ 6
Một mẫu 16 pin dùng cho smartphone được chọn ngẫu nhiên của công ty A có tuổi thọ
trung bình tính trên mẫu x = 24308 (giờ) và độ lệch chuẩn mẫu s = 727 (giờ). Giả sử
rằng tuổi thọ pin smartphone có phân phối chuẩn. Với độ tin cậy 95%, hãy tìm khoảng
tin cậy cho tuổi thọ trung bình của pin smartphone được sản xuất bởi công ty A. Cho
biết t15;0,025 = 2, 1314.
Ví dụ 7
Năng suất (tạ/ha) của một loại cây trồng tuân theo luật phân phối chuẩn. Hãy tìm ước
lượng khoảng đối xứng năng suất trung bình của một loại cây trồng này với độ tin cậy
95% trên cơ sở bảng số liệu điều tra sau đây:
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
(n − 1)S 2
χ2 = ∼ χ2n−1 .
σ2
- Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị χ2n−1;α/2 , χ2n−1;1−α/2 là giá trị
tới hạn mức α/2 và 1 − α/2 của phân phối χ2n−1 , ta được khoảng tin cậy hai phía.
- Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay χ2n−1;α/2 bởi χ2n−1;α , χ2n−1;1−α/2 bởi
χ2n−1;1−α và thu được khoảng tin cậy một phía.
(n − 1)s2 2 (n − 1)s2
< σ < ,
χ2n−1;α/2 χ2n−1;1−α/2
(n − 1)s2
0 < σ2 < .
χ2n−1;1−α
(n − 1)s2
2 < σ 2 < +∞.
χn−1;α
Ví dụ 8
Một dây chuyền tự động đóng gạo vào bao được kiểm tra. Cân thử 25 bao gạo do dây
chuyền này thực hiện thì tính được độ lệch chuẩn khối lượng gạo mỗi bao s = 0, 15
(kg). Với độ tin cậy 95% tìm khoảng tin cậy cho phương sai của khối lượng gạo được
đóng cho mỗi bao bởi dây chuyền này. Giả thiết khối lượng gạo được đóng cho mỗi bao
tuân theo luật phân phối chuẩn. Cho biết: χ224;0.025 = 39, 364, χ224;0.975 = 12, 401.
Mặt khác, do p̂ là một ước lượng của p nên ta có thể xem p ≈ p̂ khi n lớn.
Điều kiện: np̂ > 5 và n(1 − p̂) > 5.
a. Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng cho p:
r r
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2 < p < p̂ + zα/2 .
n n
Ví dụ 9
Gieo 400 hạt đậu xanh thì có 50 hạt không nảy mầm. Với độ tin cậy 98%, hãy tìm:
a) Khoảng tin cậy đối xứng cho tỉ lệ hạt nảy mầm.
b) Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm.
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
Giải.
k 400 − 50
a. - Tỉ lệ mẫu: p̂ = = = 0, 875.
n 400
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326
r r
p̂(1 − p̂) 0, 875 ∗ (1 − 0, 875)
- Sai số: ε = zα/2 = 2, 326 ∗ = 0, 0385
n 400
- Khoảng tin cậy cho tỉ lệ hạt nảy mầm p:
- Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm p:
b. Nhận xét
i) Khoảng tin cậy cho số lượng cá thể
Từ khoảng tin cậy cho tỉ lệ ta có thể suy ra khoảng tin cậy cho số lượng cá thể mang
dấu hiệu nghiên cứu hoặc số lượng cá thể của tổng thể. Cụ thể:
- Gọi K và N lần lượt là số lượng cá thể mang dấu hiệu nghiên cứu và số lượng cá thể
của tổng thể. Khi đó, tỉ lệ dấu hiệu nghiên cứu:
K
p= (1)
N
- Dựa trên mẫu điều tra, ta ước lượng được khoảng tin cậy cho tỉ lệ p:
Từ (1) và (2) suy ra khoảng tin cậy cho giá trị K hoặc N.
Ví dụ 10
Trong một cuộc bầu cử ở một địa phương có 10000 cử tri. Người ta phỏng vấn ngẫu
nhiên 300 cử tri thì thấy có 156 người ủng hộ cho ứng cử viên A. Với độ tin cậy 95%
tìm khoảng tin cậy (đối xứng) cho số lượng cử tri ở địa phương này ủng hộ cho ứng cử
viên A.
Giải. Gọi K là số lượng cử tri ở địa phương này ủng hộ ứng cử viên A. Ta có tỉ lệ ủng
hộ ứng cử viên A: p = K/10000.
Tỉ lệ mẫu: p̂ = k/n = 156/300 = 0, 52
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96
Sai số: r
p̂(1 − p̂)
r
0, 52 ∗ 0, 48
ε = zα/2 = 1, 96 ∗ = 0, 0565
n 300
Khoảng tin cậy cho tỉ lệ ủng hộ:
p̂ − ε < p < p̂ + ε ⇔ 0, 4635 < p < 0, 5765
Từ đó, suy ra:
0, 4635 < K/10000 < 0, 5765 ⇔ 4635 < K < 5765
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 38/45
Ví dụ 11
Để ước lượng số lượng cá có trong hồ, người ta làm như sau. Bắt ngẫu nhiên 500 con
cá, sau đó đánh dấu vào các con cá đã được bắt và thả chúng xuống hồ. Sau đó bắt
ngẫu nhiên 200 con cá để kiểm tra thì thấy có 30 con có đánh dấu. Với độ tin cậy 90%
tìm khoảng tin cậy đối xứng cho số lượng cá có trong hồ.
- Trong trường hợp không có dữ liệu để tính giá trị p̂, sử dụng bất đẳng thức p̂(1 − p̂) ≤
1/4 ta thu được bất đẳng thức:
2
zα/2
1
n≥ .
4 ∆
Ví dụ 12
Một cuộc khảo sát sức khỏe cộng đồng đang được lên kế hoạch trong một khu vực đô
thị lớn với mục đích ước tính tỷ lệ trẻ em từ 0 đến 14 tuổi chưa được tiêm chủng bại
liệt đầy đủ. Các nhà tổ chức của dự án muốn tỷ lệ mẫu của trẻ không được tiêm chủng
đầy đủ k/n phải nằm trong khoảng của tỷ lệ thực p với sai số ±0, 05 với xác suất tối
thiểu 98%. Hỏi kích thước mẫu điều tra tối thiểu là bao nhiêu?
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
Vậy, n = 542.
Ví dụ 13
Sản lượng gạo bán ra trong 1 ngày có phân phối chuẩn. Điều tra sản lượng bán ra trong
120 ngày, ta được bảng số liệu sau:
Sản lượng (kg) 400-440 440-480 480-520 520-560 560-600 600-640 640-680
Số ngày 4 9 15 23 30 22 17
a) Với độ tin cậy 95% tìm khoảng tin cậy đối xứng cho số tiền bán ra trung bình trong
một ngày. Biết giá mỗi kg gạo là 15.000 đồng.
b) Ngày có sản lượng gạo bán ra không nhỏ hơn 560 kg được gọi là ngày cao điểm. Với
độ tin cậy 98%, tìm khoảng tin cậy đối xứng cho số ngày cao điểm trong 1000 ngày
bán.
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
Giải.
a. Dạng thu gọn:
Sản lượng (kg) 420 460 500 540 580 620 660
Số ngày 4 9 15 23 30 22 17
Suy ra:
0, 47 < K/1000 < 0, 68 ⇔ 470 < K < 680
Đà Nẵng, 2021
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 1/47
Ví dụ 1
X Tuổi thọ người Việt tuân theo luật phân phối chuẩn N (µ, σ 2 ), với µ, σ chưa biết.
Giả thuyết thống kê có thể là: µ = 60 (tuổi) hoặc µ > 60, hoặc µ 6= 60, ...
X Nghiên cứu về chiều cao (X) của người Việt. Giả thuyết thống kê có thể là: X có
phân phối chuẩn, X có phân phối mũ, ...
X Nghiên cứu tên của bố (X), tên của mẹ (Y ) và tên của người con thứ nhất (Z).
Giả thuyết thống kê: Z có mối quan hệ với X và Y , Z không có mối quan hệ với X và
Y , ...
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 2/47
Khi nghiên cứu ta có thể đưa ra nhiều giả thuyết khác nhau. Trong chương này, chúng
ta chỉ khảo sát bài toán kiểm định với hai giả thuyết mà thôi.
- Bài toán kiểm định giả thuyết là bài toán gồm một cặp giả thuyết thống kê mâu thuẫn
nhau được đưa ra xem xét để chọn một giả thuyết đúng. Một trong hai giả thuyết đó
được giả định ban đầu là giả thuyết đúng, gọi là giả thuyết gốc và được kí hiệu là H0 .
Giả thuyết còn lại gọi là đối thuyết, được kí hiệu là H1 .
(
H0 : giả thuyết gốc
H1 : đối thuyết
- Lưu ý: Với mỗi giả thuyết gốc H0 ta có thể xây dựng nhiều đối thuyết H1 khác nhau.
- Kiểm định giả thuyết là phương pháp sử dụng mẫu dữ liệu thu được để đưa ra quyết
định bác bỏ H0 hay chấp nhận H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 3/47
Với α ∈ (0, 1) cho trước, ta có thể xây dựng miền Wα sao cho:
P (T ∈ Wα |H0 đúng) = α
Lúc đó, miền Wα được gọi là miền bác bỏ với mức ý nghĩa α.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 4/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 5/47
1.4 Sai lầm khi kiểm định
- Sai lầm loại I: Sai lầm mắc phải khi bác bỏ H0 nhưng trong khi thực tế là H0 là giả
thuyết đúng. Xác suất mắc sai lầm loại 1 được kí hiệu: α.
- Sai lầm loại II: Sai lầm mắc phải khi chấp nhận H0 trong khi thực tế là H0 là giả
thuyết sai. Xác suất mắc sai lầm loại 2 được kí hiệu: β.
Bảng dưới đây tổng hợp lại các trường hợp:
Thực tế
H0 đúng H0 sai
Quyết định
Bác bỏ H0 sai lầm loại I quyết định đúng
Chấp nhận H0 quyết định đúng sai lầm loại II
Như vậy,
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 6/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 7/47
Diễn giải: P-giá trị là xác suất (mức độ hợp lý) thu được dữ liệu quan sát và được tính
dựa trên một thống kê kiểm định khi ta giả sử H0 là giả thuyết đúng. Do đó, nếu p-giá
trị càng nhỏ thì ta càng có cơ sở bác bỏ H0 .
Các bước thực hiện:
- Xác định giả thuyết H0 , H1 và phát biểu bài toán.
- Chọn thống kê kiểm định T và tính giá trị của nó trên mẫu dữ liệu thu được (kí
hiệu là Ts ).
- Tính p-giá trị theo thống kê kiểm định
- So sánh p-giá trị với mức ý nghĩa α cho trước:
i) Nếu p-giá trị ≤ α thì bác bỏ H0 .
ii) Nếu p-giá trị > α thì chấp nhận H0 .
Khi giá trị α chưa biết thì người ta hay lấy α = 0, 05.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 8/47
2. Kiểm định giả thuyết về kì vọng của phân phối chuẩn
Ta sẽ bác bỏ H0 nếu X quá khác biệt so với µ0 hay nói cách khác, |Z| > c > 0 với c
là một hằng số nào đó.
- Miền bác bỏ với mức ý nghĩa α: Wα = (−∞; −zα/2 ] ∪ [zα/2 ; +∞).
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 9/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 10/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 11/47
Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 đã biết.
Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: z =
σ
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ 6= µ0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
H 1 : µ > µ0 [zα ; +∞) 1 − Φ(z)
H 1 : µ < µ0 (−∞; −zα ] Φ(z)
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 12/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 13/47
Ví dụ 2
Nguồn cấp điện cho máy tính đạt tiêu chuẩn là 19 volt. Đo nguồn cấp điện của một mẫu
25 sạc pin được chọn ngẫu nhiên của hãng sản xuất A người ta tính được x = 19, 25
volt. Giả sử nguồn cấp điện này có phân phối chuẩn với độ lệch chuẩn σ = 0, 5 volt. Với
mức ý nghĩa α = 0, 05 hãy kiểm định giả thuyết gốc H0 : µ = 19 (volt) với đối thuyết
H1 : µ > 19 (volt), trong đó µ là nguồn cấp điện trung bình của loại sạc pin trên.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Giải. Bài toán kiểm định:
(
H0 : µ = 19
H1 : µ > 19
Các số đặc trưng mẫu: n = 25; x̄ = 19, 25. √ √
(x̄ − µ0 ) n (19, 25 − 19) 25
Giá trị của thống kê kiểm định: z = = = 2, 5.
σ 0, 5
Mức ý nghĩa: α = 0, 05 ⇒ zα = z0,05 = 1, 645.
Miền bác bỏ: Wα = [1, 645; +∞).
Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 và chấp nhận H1 .
Cách khác: p-giá trị = 1 − Φ(2.5) = 0.0062 < α = 0.05 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 14/47
Ví dụ 3
Trong năm trước khối lượng trung bình của bò xuất chuồng ở một trang trại là 380kg.
Năm nay người ta áp dụng thử một chế độ ăn mới với hy vọng là bò sẽ tăng trọng
nhanh hơn. Sau thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con bò xuất chuồng
đem cân và tính được khối lượng trung bình của chúng là x = 390kg. Với mức ý nghĩa
α = 0, 02 có thể cho rằng khối lượng trung bình của bò xuất chuồng đã tăng lên không?
Giả sử rằng khối lượng của bò có phân phối chuẩn với độ lệch chuẩn σ = 25, 2kg.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Giải. Gọi µ(kg) là khối lượng trung bình của bò xuất chuồng. Theo giả thiết, ta có bài
toán kiểm định: (
H0 : µ = 380
H1 : µ > 380
√ √
(x̄ − µ0 ) n (390 − 380) 50
Giá trị của thống kê kiểm định: z = = = 2, 806.
σ 25, 2
Mức ý nghĩa: α = 0, 02 ⇒ zα = z0,02 = 2, 054. Miền bác bỏ: Wα = [2, 054; +∞).
Vì z ∈ Wα nên ta bác bỏ H0 . Vậy, khối lượng trung bình bò xuất chuồng đã tăng lên.
Cách khác: p-giá trị = 1 − Φ(2.806) = 0.0025 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 15/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 16/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 17/47
Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 chưa biết.
Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: t =
s
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ 6= µ0 (−∞; −tn−1;α/2 ] ∪ [tn−1;α/2 ; +∞) 2P (Tn−1 > |t|)
H 1 : µ > µ0 [tn−1;α ; +∞) P (Tn−1 > t)
H 1 : µ < µ0 (−∞; −tn−1;α ] P (Tn−1 < t)
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 18/47
Ví dụ 4
Tuổi thọ trung bình của một loại bóng đèn do nhà máy A sản xuất khi chưa cải tiến kĩ
thuật là 2000 giờ. Sau thời gian cải tiến kĩ thuật người ta chọn ngẫu nhiên 25 bóng đèn
cho lắp thử nghiệm. Kết quả thực nghiệm thu được tuổi thọ trung bình mẫu x = 2022
giờ và độ lệch chuẩn mẫu s = 30 giờ. Với mức ý nghĩa 0, 025 có thể kết luận “sau khi
cải tiến kĩ thuật, tuổi thọ trung bình của bóng đèn có tăng lên” không? Biết tuổi thọ
bóng đèn có phân phối chuẩn. Cho biết t24;0,025 = 2, 063.
Giải. Gọi µ(giờ) là tuổi thọ trung bình của loại bóng đèn sau cải tiến. Ta có bài toán
kiểm định: (
H0 : µ = 2000
H1 : µ > 2000
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 19/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 20/47
Ví dụ 5
Một xí nghiệp có 5000 công nhân cùng sản xuất một loại sản phẩm. Theo dõi thời gian
hoàn thành sản phẩm của 100 công nhân, ta được bảng số liệu sau:
a) Tìm khoảng tin cậy đối xứng cho thời gian hoàn thành trung bình với độ tin cậy 90%.
b) Công nhân có tay nghề cao nếu thời gian hoàn thành 1 sản phẩm dưới 32ph. Với
độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số công nhân có tay nghề cao của xí
nghiệp.
c) Xí nghiệp quy định định mức hoàn thành trung bình 1 sản phẩm là 34 phút. Có ý
kiến cho rằng định mức này có hại cho công nhân. Với mức ý nghĩa 2% hãy nhận xét
về ý kiến đó.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 21/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 22/47
b. Gọi K là số công nhân có tay nghề cao. Tỉ lệ công nhân có tay nghề cao: p = K/5000.
Tỉ lệ mẫu công nhân có tay nghề cao:
p̂ = k/n = (5 + 15)/100 = 0, 2
Suy ra: 0, 1216 < K/5000 < 0, 2784 ⇔ 608 < K < 1392.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 23/47
c. Gọi µ (ph) là thời gian hoàn thành trung bình 1 sản phâm của công nhân. Ta có bài
toán kiểm định: (
H0 : µ = 34
H1 : µ > 34
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 24/47
(X − Y ) − (µx − µy )
Z= r
Sx2 Sy2
+
m n
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 25/47
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết; m > 30 và
n > 30.
Giả thuyết thống kê H0 : µx − µy = ∆0
x − y − ∆0
Giá trị thống kê kiểm định: z = r
s2x s2y
+
m n
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 26/47
Nhận xét: Khi ∆0 = 0, các bài toán kiểm định trên thường được viết lại dưới dạng:
(
H0 : µ x = µ y
(I)
H1 : µx 6= µy
(
H0 : µ x = µ y
(II)
H1 : µ x < µ y
(
H0 : µ x = µ y
(III)
H1 : µ x > µ y
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 27/47
Ví dụ 6
Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn, kết quả thu được:
Khu vực Số trẻ Trung bình mẫu Phương sai mẫu
Nông thôn m = 60 x = 3, 0 kg s2x = 0, 4 kg2
Thành thị n = 50 y = 3, 1 kg s2y = 0, 5 kg2
Với mức ý nghĩa 0, 05 có thể coi khối lượng trung bình của trẻ sơ sinh ở hai khu vực
khác nhau không? Biết khối lượng trẻ sơ sinh ở hai khu vực có phân phối chuẩn. Cho
biết z0.025 = 1.96
Giải. Gọi µx , µy (kg) là khối lượng trung bình của trẻ sơ sinh ở nông thôn và thành thị.
Ta có bài toán kiểm định:
(
H0 : µ x = µ y
H1 : µx 6= µy
Thống kê kiểm định: x̄ − ȳ 3, 0 − 3, 1
z=q =p = −0, 774
s2x /m + s2y /n 0, 4/60 + 0, 5/50
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 28/47
Ví dụ 7
Người ta tiến hành một cuộc nghiên cứu để so sánh mức lương trung bình của phụ nữ
so với mức lượng trung bình của nam giới trong một công ty lớn. Một mẫu gồm 100 phụ
nữ có mức lương trung bình 7,23 đôla/giờ với độ lệch chuẩn 1,64 đôla/giờ. Một mẫu
gồm 75 nam giới có mức lượng trung bình là 8,06 đôla/giờ với độ lệch chuẩn là 1,85
đôla/giờ. Với mức ý nghĩa 1% số liệu này có chứng minh được mức lương trung bình
của phụ nữ trong công ty là thấp hơn nam giới hay không ? Cho biết z0,01 = 2, 326.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 29/47
Giải. Gọi µx , µy (đôla/giờ) là mức lương trung bình của nữ và nam giới. Ta có bài toán
kiểm định: (
H0 : µ x = µ y
H1 : µ x < µ y
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 30/47
Trường hợp mẫu nhỏ và phương sai chưa biết (đọc thêm)
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết.
Giả thuyết thống kê H0 : µx − µy = ∆0
x − y − ∆0
Giá trị thống kê kiểm định: t = r
s2x s2y
+
m n
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|))
H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t)
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t)
trong đó Tν là biến ngẫu nhiên có phân phối Student với ν bậc tự do và ν là giá
trị nguyên gần nhất với giá trị
!2 !
s2x s2y . (s2x /m)2 (s2y /n)2
+ +
m n m−1 n−1
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 31/47
Trường hợp mẫu nhỏ, phương sai chưa biết và σx2 = σy2 (đọc thêm)
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết, σx2 = σy2 .
Giả thuyết thống kê H0 : µx − µy = ∆0 s
x − y − ∆0 (m − 1)s2x + (n − 1)s2y
Giá trị thống kê kiểm định: t = q , với sp =
s 1
+1 m+n−2
p m n
trong đó ν = m + n − 2.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 32/47
4. So sánh cặp hai giá trị trung bình
(đọc thêm)
Cho (X, Y ) là một cặp biến ngẫu nhiên (nói chung phụ thuộc nhau) với E(X) =
µx , E(Y ) = µy .
Chúng ta muốn so sánh µx và µy .
Giả sử (x1 , y1 ), ..., (xn , yn ) là một mẫu kích thước n của (X, Y ).
Vì X, Y có thể phụ thuộc nhau nên ta không thể áp dụng phương pháp ở trên.
Để giải quyết bài toán này, ta đặt
D =X −Y
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 33/47
Ta đưa về bài toán kiểm định trung bình (một mẫu) đã xét.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 34/47
Ví dụ 8
Để khảo sát tác dụng của việc bón thêm một loại phân bón mới (A) người ta chia mỗi
thửa ruộng thí nghiệm làm hai mảnh. Một mảnh đối chứng không có phân bón A (với
sản lượng X) và mảnh kia có phân bón A (với sản lượng Y ). Sản lượng của 17 thửa
ruộng được ghi lại như sau:
Thửa X Y Thửa X Y
1 55,8 60,4 9 53,3 58,7
2 30,1 28,9 10 51,0 48,0
3 37,8 39,7 11 68,6 68,8
4 57,7 57,5 12 59,1 70,4
5 49,4 56,8 13 35,4 40,6
6 53,4 57,3 14 42,7 44,3
7 21,2 32,2 15 28,3 47,7
8 57,3 77,0 16 42,4 55,1
17 61,4 66,1
Với mức ý nghĩa 5% hỏi việc bón phân có tác dụng không?
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 35/47
Giải. Đặt D = X − Y , ta có bảng tóm tắt sau:
Thửa X Y D Thửa X Y D
1 55,8 60,4 -4,6 9 53,3 58,7 -4,7
2 30,1 28,9 1,2 10 51,0 48,0 -5,4
3 37,8 39,7 -1,9 11 68,6 68,8 3
4 57,7 57,5 0,2 12 59,1 70,4 -0,2
5 49,4 56,8 -7,4 13 35,4 40,6 -11,3
6 53,4 57,3 -3,9 14 42,7 44,3 -5,2
7 21,2 32,2 -11 15 28,3 47,7 -1,6
8 57,3 77,0 -19,7 16 42,4 55,1 -19,4
17 61,4 66,1 -12,7
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 36/47
Gọi µx , µy lần lượt là sản lượng trung bình của mảnh đối chứng không có phân bón A
và mảnh có phân bón A.
Bài toán kiểm định giả thuyết: (
H0 : µ x = µ y
H1 : µ x < µy .
Do đó, ta có cơ sở bác bỏ H0 .
Cách khác: p-giá trị = P (T16 < −3.79) = 0.0008031343 < α = 0.05 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 37/47
X1 + X2 + ... + Xn
và P̂ = - tỉ lệ phần tử có tính chất A.
n
Khi H0 đúng, với n đủ lớn, theo Định lí giới hạn trung tâm:
√
(P̂ − p0 ) n
Z=p
p0 (1 − p0 )
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 39/47
Ví dụ 9
Giám đốc một công ty tuyên bố 90% sản phẩm của công ty đạt tiêu chuẩn quốc gia.
Một công ty kiểm định độc lập đã tiến hành kiểm tra 200 sản phẩm của công ty đó thì
thấy có 168 sản phẩm đạt yêu cầu. Với mức ý nghĩa α = 0, 1 có thể cho rằng tỷ lệ sản
phẩm đạt tiêu chuẩn quốc gia thấp hơn 90% không? Cho biết z0,1 = 1, 282.
Giải. Gọi p là tỉ lệ sản phẩm đạt tiêu
( chuẩn quốc gia của công ty. Bài toán kiểm định:
H0 : p = 0, 9
H1 : p < 0, 9
Ví dụ 10
Một khu vực có 10000 hộ gia đình sinh sống và các hộ ở đây chỉ sử dụng ga của 2 công
ty A và B. Điều tra 800 hộ thì có 600 hộ dùng ga, trong đó 360 hộ dùng ga của công
ty A.
a) Với độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số lượng hộ dùng ga ở khu vực
này.
b) Có ý kiến cho rằng ga của công ty A được các hộ thích dùng hơn. Với mức ý nghĩa
2% hãy nhận xét về ý kiến ấy.
Giải. a. Gọi K là số lượng hộ dùng ga ở khu vực này. Ta có tỉ lệ hộ dùng ga: p = K/10000.
Tỉ lệ mẫu: p̂ = k/n = 600/800 = 0, 75.
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96.
Sai số:
r r
p̂(1 − p̂) 0, 75 ∗ 0, 25
ε = zα/2 = 1, 96 ∗ = 0, 03
n 800
Khoảng tin cậy cho tỉ lệ hộ dùng ga: p̂ − ε < p < p̂ + ε ⇔ 0, 72 < p < 0, 78
Suy ra: 0, 72 < K/10000 < 0, 78 ⇔ 7200 < K < 7500.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 41/47
b. Gọi p là tỉ lệ hộ dùng ga của công ty A trong các hộ dùng ga. Bài toán kiểm định:
(
H0 : p = 0, 5
H1 : p > 0, 5
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 42/47
6. So sánh hai tỉ lệ
Xét tính chất A có tỉ lệ là p1 và p2 chưa biết trong hai tổng thể độc lập nhau. Xét bài
toán kiểm định với giả thuyết gốc:
H 0 : p1 = p2
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 43/47
Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu
ngẫu nhiên độc lập.
- Giả thuyết gốc H0 : p1 = p2
- Giá trị thống kê kiểm định:
p̂1 − p̂2 k1 + k2
z=s với p̂ = n + n
1 1 1 2
p̂(1 − p̂) +
n1 n2
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 44/47
Ví dụ 11
Kiểm tra ngẫu nhiên các sản phẩm cùng loại do hai nhà máy sản xuất thu được dữ liệu:
Với mức ý nghĩa α = 0, 05 có thể coi tỷ lệ phế phẩm của hai nhà máy trên bằng nhau
không? Cho biết z0.025 = 1.96
Giải. Gọi p1 , p2 là tỉ lệ phế phẩm của nhà máy A, B tương ứng. Ta có bài toán kiểm
định: (
H 0 : p1 = p 2
H1 : p1 6= p2
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 45/47
Các tỉ lệ mẫu:
Ví dụ 12
Công ty nước giải khát đang nghiên cứu 2 thị trường mới là khu vực A và khu vực B.
Ở khu vực A khi cho 500 người dùng thử thì có 120 người ưa thích thức uống này. Còn
đối với khu vực B khi cho 1000 người dùng thử thì có 300 người bảo ưa thích hương vị
này. Với mức ý nghĩa 2% hãy kiểm định xem tỉ lệ người ưa thích thức uống của công ty
ở khu vực B có cao hơn ở khu vực A hay không ? Cho biết z0,02 = 2, 054.
Giải. Gọi p1 , p2 là tỉ lệ người ưa thích nước uống của công ty ở khu vực A và B. Ta có
bài toán kiểm định: (
H 0 : p1 = p 2
H1 : p1 < p2
Các tỉ lệ mẫu: p̂1 = 0, 24; p̂2 = 0, 3; p̂ = 0, 28.
Giá trị thống kê kiểm định: z = −2, 39
Miền bác bỏ: Wα = (−∞; −2, 054].
Vì z ∈ Wα nên bác bỏ giả thuyết H0 .
Vậy, tỉ lệ người ưa thích thức uống của công ty ở khu vực B cao hơn ở khu vực A.
Cách khác: p-giá trị = Φ(−2.39) = 0.00842 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 47/47