Professional Documents
Culture Documents
1. Hoàng Ngọc Nhậm – Lý thuyết Xác suất và Thống kê Toán – NXB Kinh tế Tp HCM.
2. Hoàng Ngọc Nhậm – Bài tập Xác suất Thống kê – NXB Kinh tế Tp HCM.
3. Đinh Ngọc Thanh - Giáo trình Xác suất Thống kê - ĐH Tôn Đức Thắng Tp HCM.
4. Lê Sĩ Đồng - Xác suất - Thống kê và ứng dụng - NXB Giáo dục.
5. Đậu Thế Cấp - Xác suất Thống kê - Lý thuyết và các bài tập - NXB Giáo dục.
6. Nguyễn Cao Văn - Giáo trình Lý thuyết Xác suất & Thống kê - NXB Kinh tế quốc dân.
7. Đoàn Vương Nguyên – Bài giảng Xác suất và Thống kê – ĐH Công nghiệp Tp HCM.
………………………………………………
Trang 1
Đặng Thục Hiền Bài giảng XS và TK
n!
• Công thức tính: Ank = , trong đó n ! = 1.2.3...n
(n − k )!
Ví dụ: Một lớp phải học 8 môn, mỗi ngày học 2 môn. Hỏi có bao nhiêu cách xếp thời khóa biểu trong 1
ngày?
8!
Số cách xếp TKB là chỉnh hợp chập 2 của 8 phần tử, A82 = = 56 cách
(8 − 2)!
1.3. Chỉnh hợp lặp
k
• Định nghĩa: Chỉnh hợp lặp chập k của n phần tử, ký hiệu Bnk hoặc An là một nhóm có thứ tự gồm k
phần tử chọn từ n phần tử đã cho. Trong đó mỗi phần tử có thể có mặt 1, 2,…, k lần trong nhóm đó.
Vì mỗi phần tử có thể xuất hiện nhiều lần trong một chỉnh hợp lặp nên k có thể lớn hơn n.
• Công thức tính: Bnk = n k
Ví dụ: Xếp 10 quyển sách vào 3 ngăn. Hỏi có bao nhiêu cách xếp?
Số cách xếp là chỉnh hợp lặp chập 10 của 3 phần tử, B310 = 310 = 59049 cách.
1.4. Hoán vị
• Định nghĩa: Hoán vị của m phần tử, ký hiệu Pm là một nhóm có thứ tự gồm đủ m phần tử đã cho.
• Công thức tính: Pm = m !
Ví dụ: Từ 9 chữ số 1-9 có thể lập được bao nhiêu số có 9 chữ số mà chữ số 6 đứng ở vị trí chính giữa?
Số cách lập là 8! = 40320 số.
1.5. Tổ hợp
• Định nghĩa: Tổ hợp chập k của n phần tử ( k ≤ n ), ký hiệu Cnk là một nhóm không phân biệt thứ tự gồm
k phần tử khác nhau chọn từ n phần tử đã cho.
n!
• Công thức tính: Cnk =
k !(n − k )!
Ví dụ: Một lớp có 50 sinh viên. Hỏi có bao nhiêu cách chọn 1 nhóm gồm 4 sinh viên?
50!
C504 = = 230300 cách.
4!46!
Ví dụ: Có bao nhiêu cách xếp 15 hành khách lên 3 toa tàu mà toa số 1 có đúng 3 hành khách?
Số cách xếp 3 hành khách lên toa số 1 là C153 .
12 hành khách lên 2 toa còn lại một cách ngẫu nhiên. Như vậy sẽ có B212 = 212 cách xếp.
Ví dụ: Có 4 loại bút bi: xanh, đỏ, vàng, tím. Có bao nhiêu cách để mua 6 chiếc bút bi?
Số cách chọn 6 chiếc bút bi từ 4 loại bút là tổ hợp lặp chập 6 của 4 phần tử. C46 = C46+ 6 −1 = 84 cách.
• Trong một phép thử, biến cố mà chắc chắn sẽ xảy ra được gọi là biến cố chắc chắn, ký hiệu là Ω . Biến
cố không thể xảy ra được gọi là biến cố rỗng, ký hiệu là ∅ . Biến cố đồng thời khác Ω và khác ∅ được
gọi là biến cố ngẫu nhiên.
Ví dụ: Từ nhóm có 6 nam và 4 nữ, ta chọn ngẫu nhiên ra 5 người.
Biến cố “chọn được ít nhất 1 nam” là chắc chắn.
Trang 3
Đặng Thục Hiền Bài giảng XS và TK
Ví dụ: Quan sát hai xạ thủ cùng bắn vào một bia, mỗi xạ thủ bắn một viên đạn. Gọi A là biến cố “xạ thủ
thứ nhất bắn trúng bia”, B: “xạ thủ thứ hai bắn trúng bia”, C: “bia trúng đạn” thì C = A + B .
d. Định nghĩa 4: Tích của hai biến cố A và B là một biến cố, ký hiệu A ∩ B hoặc A.B , biến cố này xảy ra
khi và chỉ khi cả A và B đều xảy ra.
Tổng quát: Tích của n biến cố Ai là một biến cố, biến cố này xảy ra khi tất cả các biến cố Ai xảy ra.
n n
Ký hiệu ∩ Ai hay
i =1
∏A .
i =1
i
Ví dụ: Quan sát hai xạ thủ cùng bắn vào một bia, mỗi xạ thủ bắn một viên đạn. Gọi A: “xạ thủ thứ nhất
bắn trật”, B: “xạ thủ thứ hai bắn trật”, C: “bia không trúng đạn” thì C = A.B .
e. Định nghĩa 5: Hai biến cố A và B được gọi là xung khắc nhau nếu chúng không thể đồng thời xảy ra
trong một phép thử, tức là AB = ∅ .
Các biến cố A1 , A2 ,..., An được gọi là xung khắc từng đôi nếu có bất kỳ hai trong n biến cố này xung
khắc với nhau.
Ví dụ: Hai sinh viên A và B cùng thi môn XSTK. Gọi A: “sinh viên A thi đỗ”, B: “chỉ có sinh viên B thi
đỗ”, C: “chỉ có 1 sinh viên thi đỗ”. Khi đó, A và B là xung khắc; B và C không xung khắc.
f. Định nghĩa 6: Biến cố A được gọi là biến cố đối lập (biến cố bù) với biến cố A nếu A , A xung khắc
và A ∪ A = Ω . Nói cách khác A và A gọi là đối lập nhau nếu A xảy ra thì A không xảy ra và ngược lại.
Ví dụ: Kiểm tra 3 sản phẩm chọn ngẫu nhiên từ một kiện hàng. Biến cố “có ít nhất một sản phẩm tốt trong
3 sản phẩm” và biến cố “không có sản phẩm tốt nào trong 3 sản phẩm” là hai biến cố đối lập nhau.
g. Các tính chất
A∪ B = B ∪ A
A∩ B = B ∩ A
A ∪ ( B ∪ C ) = ( A ∪ B) ∪ C = A ∪ B ∪ C
A ∩ ( B ∩ C ) = ( A ∩ B) ∩ C = A ∩ B ∩ C
A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C )
A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )
Trang 4
Đặng Thục Hiền Bài giảng XS và TK
A∪ B = A ∩ B
A∩ B = A ∪ B
2.1.4. Hệ đầy đủ các biến cố
Trong một phép thử, họ gồm n biến cố { Ai } , i = 1, 2,..., n được gọi là hệ đầy đủ khi và chỉ khi có duy
n
nhất một biến cố của họ xảy ra. Nghĩa là: Ai ∩ A j = ∅, ∀i ≠ j và ∪A =Ω .i
i =1
Ví dụ: Trộn lẫn 4 bao lúa vào nhau rồi bốc ra 1 hạt. Gọi Ai : “hạt lúa bốc được là của bao thứ i ”, i = 1, 4.
Khi đó, hệ { A1 , A2 , A3 , A4 } là đầy đủ.
{ }
Chú ý: Trong 1 phép thử, hệ A, A là đầy đủ với biến cố A tùy ý.
Trang 5
Đặng Thục Hiền Bài giảng XS và TK
P ( A1 ∪ A2 ∪ ... ∪ A n ) = P ( A1 ) + P ( A2 ) + ... + P ( An )
VD 3. Một hộp có 10 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên từ hộp ra 6 sản phẩm. Tìm xác
suất để có không quá 1 phế phẩm trong 6 sản phẩm đó.
VD 4. Một hộp phấn có 10 viên trong đó có 3 viên màu đỏ. Lấy ngẫu nhiên từ hộp ra 3 viên phấn. Tính
xác suất để lấy được ít nhất 1 viên phấn màu đỏ.
3.2. Công thức nhân xác suất
3.2.1. Xác suất có điều kiện
• Định nghĩa: Trong một phép thử, xét hai biến cố bất kỳ A và B với P(B) > 0. Xác suất của biến cố A
sau khi biến cố B đã xảy ra được gọi là xác suất của A với điều kiện B , ký hiệu P( A B) và công thức tính
là
P( A ∩ B)
P( A B) =
P( B)
VD 5. Từ một hộp chứa 3 bi đỏ và 7 bi xanh người ta bốc ngẫu nhiên ra 2 bi (bốc 1 lần 2 bi). Gọi A: “bốc
được bi đỏ”, B: “bốc được bi xanh”. Hãy tính P( A B) và P( B A)
Nếu A và B không độc lập (phụ thuộc) thì P( AB) = P( B).P( A B) = P( A).P( B A)
Tổng quát: Nếu n biến cố Ai phụ thuộc thì P( A1 A2 ... An ) = P( A1 ).P( A2 A1 )....P( An A1... An −1 )
VD 6. Một người có 5 bóng đèn trong đó có 2 bóng bị hỏng. Người đó thử ngẫu nhiên lần lượt từng bóng
(không hoàn lại) cho đến khi chọn được 1 bóng tốt. Tính xác suất để người đó thử đến lần thứ 2.
Giải: Gọi Ai : “bóng đèn được thử ở lần i là tốt”, i =1,5; A: “người đó thử đến lần thứ 2”
2 3
P ( A) = P ( A1 ∩ A2 ) = P ( A1 ) P ( A2 A1 ) = . = 30%
5 4
Trang 7
Đặng Thục Hiền Bài giảng XS và TK
VD 7. Một sinh viên học hệ niên chế được thi lại 1 lần nếu lần thi thứ nhất bị rớt (2 lần thi độc lập). Biết
rằng xác suất để sinh viên này thi đỗ lần 1 và lần 2 tương ứng là 60%, 80%. Tính xác suất sinh viên này
thi đỗ?
VD 8. Có hai người A và B cùng đặt lệnh (độc lập) để mua cổ phiếu của một công ty với xác suất mua
được tương ứng là 0,8 và 0,7. Biết rằng có người mua được, xác suất để người A mua được cổ phiếu này
là
19 12 40 10
a. b. c. d.
47 19 47 19
VD 9. Ông A bắn lần lượt 2 viên đạn vào 1 mục tiêu và mục tiêu sẽ bị phá hủy nếu bị trúng cả 2 viên đạn.
Xác suất viên đạn thứ nhất trúng mục tiêu là 0,8. Nếu viên thứ nhất trúng mục tiêu thì xác suất viên thứ
hai trúng là 0,7. Nếu viên thứ nhất không trúng thì xác suất viên thứ hai trúng mục tiêu là 0,3. Biết rằng
ông A bắn trúng, tính xác suất để mục tiêu bị phá hủy?
Giải: Gọi Ai : “viên đạn thứ i trúng mục tiêu”, i = 1,2; A: “mục tiêu bị trúng đạn”; B: “mục tiêu bị phá
hủy” thì B = A1 A2
P( A1 A2 ∩ A) P( A1 A2 ∩ A) P( A1 A2 ) P( A1 ) P( A2 A1 ) 0,8.0, 7 28
P( B A) = = = = = =
P( A) 1 − P( A) 1 − P( A1 A2 ) 1 − P( A1 ) P( A2 A1 ) 1 − 0, 2.0, 7 43
VD 10. Hai người A và B cùng chơi trò chơi như sau: Cả hai luân phiên lấy mỗi lần 1 viên bi từ một hộp
đựng 2 bi trắng và 4 bi đen (bi được lấy ra không trả lại hộp). Người nào lấy được bi trắng trước thì thắng
cuộc. Giả sử A lấy trước, tính xác suất A thắng cuộc.
3.3. Công thức Bernoulli
• Giả sử tiến hành n phép thử độc lập. Trong mỗi phép thử chỉ có thể xảy ra một trong hai trường hợp:
hoặc biến cố A xảy ra hoặc biến cố A không xảy ra. Xác suất xảy ra biến cố A trong mỗi phép thử bằng p
và xác suất A không xảy ra bằng 1-p = q. Khi đó, xác suất để trong n phép thử độc lập nói trên, biến cố A
xảy ra đúng k lần, ký hiệu là Pk ( A) được tính theo công thức Bernoulli
Pk ( A) = Cnk p k q n − k
• Xác suất để trong n phép thử A xuất hiện k lần ( 0 ≤ k1 ≤ k ≤ k2 ≤ n ) được tính theo công thức
k2
Pk ( A) = ∑ Cnk p k q n − k
k = k1
Ví dụ: Một lô hàng có tỷ lệ phế phẩm là 5%. Lấy ngẫu nhiên có hoàn lại từ lô hàng đó ra 5 sản phẩm để
kiểm tra. Tìm xác suất để có 2 phế phẩm trong 5 sản phẩm lấy ra.
Gọi A: “sản phẩm lấy ra kiểm tra là phế phẩm”. Xác suất để A xảy ra trong mỗi lần kiểm tra là 0,05.
Vì vậy, xác suất có 2 phế phẩm trong 5 sản phẩm kiểm tra là P2 ( A) = C52 (0, 05) 2 (0,95)3 = 0, 0214 .
VD 11. Xác suất tiêu thụ điện năng trong mỗi ngày không vượt quá quy định tại một công ty là 0,75. Tìm
xác suất sao cho trong 6 ngày liên tiếp có 4 ngày điện năng tiêu thụ không vượt quá quy định.
VD 12: Bắn 5 phát súng vào một mục tiêu, xác suất trúng đích của mỗi phát là 0,2. Để phá hủy mục tiêu
cần từ 3 phát súng trở lên. Tính xác suất mục tiêu bị phá hủy.
3.4. Công thức xác suất đầy đủ và Bayes
3.4.1. Công thức xác suất đầy đủ
Xét họ n biến cố đầy đủ { Ai } , i = 1, 2,..., n và B là một biến cố bất kỳ trong phép thử, ta có
Trang 8
Đặng Thục Hiền Bài giảng XS và TK
n
P ( B ) = P ( A1 ).P ( B A1 ) + P ( A2 ).P ( B A2 ) + ... + P ( An ).P ( B An ) = ∑ P ( Ai ).P ( B Ai )
i =1
VD 13. Một cửa hàng bán hai loại bóng đèn cùng kích cỡ gồm: 70 bóng màu trắng với tỉ lệ bóng hỏng là
1%, 30 bóng màu vàng với tỉ lệ hỏng 2%. Một khách hàng chọn mua ngẫu nhiên 1 bóng đèn từ cửa hàng
này. Tính xác suất để người này mua được bóng đèn tốt?
Gọi B: “khách chọn được bóng đèn tốt”, A1 : “khách chọn được bóng đèn màu trắng”, A2 : “khách
chọn được bóng đèn màu vàng”. Suy ra hệ { A1 , A2 } là đầy đủ. Ta có:
70 30
P ( B ) = P ( A1 ).P ( B A1 ) + P ( A2 ).P ( B A2 ) = .0, 99 + .0, 98 = 0,987
100 100
VD 14. Chuồng thỏ I có 3 con thỏ trắng và 4 con thỏ đen, chuồng II có 5 thỏ trắng và 3 thỏ đen. Quan sát thấy
có 1 con thỏ chạy từ chuồng I sang chuồng II, sau đó có 1 con thỏ chạy ra từ chuồng II. Tính xác suất để
con thỏ chạy ra từ chuồng II là thỏ trắng.
Giải: Gọi A1 : “con thỏ chạy từ chuồng 1 vào chuồng 2 là thỏ trắng”; A2 : “con thỏ chạy từ chuồng 1 vào
chuồng 2 là thỏ đen”; B : “con thỏ chạy ra từ chuồng 2 là thỏ trắng”.
3 6 4 5
P ( B ) = P ( A1 ).P ( B A1 ) + P ( A2 ).P ( B A2 ) = . + . = 0, 6032
7 9 7 9
VD 15. Có một kho bia kém chất lượng chứa các thùng giống nhau (24 lon/thùng) gồm 2 loại: loại I để lẫn
mỗi thùng 5 lon quá hạn sử dụng và loại II để lẫn mỗi thùng 3 lon quá hạn. Biết rằng số thùng bia loại I
bằng 1,5 lần số thùng bia loại II. Chọn ngẫu nhiên 1 thùng trong kho và từ thùng đó lấy ra 10 lon. Tính
xác suất chọn phải 2 lon bia quá hạn sử dụng.
3.4.2. Công thức Bayes
Với các giả thiết như công thức xác suất đầy đủ. Khi đó, xác suất để biến cố Ai xảy ra sau khi biến cố
B đã xảy ra là
P( Ai ) P( B Ai )
P( Ai B) =
P( B)
VD 16. Xét tiếp ví dụ 13, giả sử khách hàng mua được bóng đèn tốt, hãy tính xác suất để người đó mua
P ( A2 ) P( B A2 ) 0,3.0,98 14
được bóng đèn màu vàng. Ta có: P( A2 B) = = =
P( B ) 0,987 47
VD 17. Có 20 thùng hàng giống nhau gồm 3 loại: 8 thùng loại I, 7 thùng loại II và 5 thùng loại III. Mỗi
thùng hàng có 10 sản phẩm và số sản phẩm tốt tương ứng cho mỗi loại lần lượt là 8, 7 và 5. Chọn ngẫu
nhiên 1 thùng hàng và từ thùng đó lấy ra 3 sản phẩm.
a. Tính xác suất có 2 sản phẩm lấy ra là tốt.
b. Tính xác suất có 2 sản phẩm lấy ra là tốt và của thùng hàng loại II.
c. Giả sử có 2 sản phẩm lấy ra là tốt, tính xác suất 2 sản phẩm này là của thùng hàng loại II.
Giải: Gọi Ai : “lấy được thùng loại i”, i = 1,2,3
a. Gọi B: “2 sản phẩm lấy ra là tốt”,
P( B) = P( A1 ).P( B A1 ) + P( A2 ).P( B A2 ) + P( A3 ).P( B A3 ) =
8 C82 .C21 7 C72 .C31 5 C52 .C51
. + . 3 + . 3 =
20 C103 20 C10 20 C10
Trang 9
Đặng Thục Hiền Bài giảng XS và TK
7 C72 .C31
b. Gọi C: “2 sản phẩm tốt của thùng loại 2”, C = B ∩ A2 ⇒ P(C ) = P( A2 ).P( B A2 ) = . =
20 C103
P ( A2 ).P( B A2 )
c. P( A2 B) = =
P( B)
VD 18. Nhà máy X có 3 phân xưởng A, B, C tương ứng sản xuất ra 20%, 30% và 50% tổng sản phẩm của
nhà máy. Giả sử tỉ lệ sản phẩm hỏng do các phân xưởng A, B, C tương ứng sản xuất ra là 1%, 2%, 3%.
Chọn ngẫu nhiên 1 sản phẩm do nhà máy X sản xuất ra.
a. Tính xác suất (tỉ lệ) sản phẩm này là hỏng.
b. Tính xác suất sản phẩm này hỏng và do phân xưởng A sản xuất ra.
c. Biết rằng sản phẩm được chọn là hỏng, tính xác suất sản phẩm này là do phân xưởng A sản xuất ra.
VD 19. Tỉ lệ ôtô tải, ôtô con và xe máy đi qua đường X có trạm bơm dầu là 5:2:13. Xác suất để ôtô tải, ôtô
con và xe máy đi qua đường này vào bơm dầu lần lượt là 0,1; 0,2 và 0,15. Biết rằng có 1 xe đi qua đường
X vào bơm dầu, tính xác suất để đó là ôtô con.
11 10 8 7
a. b. c. d.
57 57 57 57
Giải: Gọi A, B, C: “xe tải, xe con, xe máy đi qua trạm bơm dầu”, Y: “có 1 xe vào bơm dầu”
P (Y ) = P ( A).P (Y A) + P ( B ).P (Y B ) + P (C ).P (Y C ) =
5 2 13 57
.0,1 + .0, 2 + .0,15 =
20 20 20 100
P( B).P(Y B) 8
P( B Y ) = =
P(Y ) 57
Trang 10
Đặng Thục Hiền Bài giảng XS và TK
c. Nếu lấy được 1 chai tốt và 1 chai kém phẩm chất, tìm xác suất hộp thứ nhất được chọn.
ĐS: 25/53
Bài 20: Hộp thứ nhất có 10 sản phẩm (trong đó có 8 sản phẩm loại A và 2 sản phẩm loại B); hộp thứ hai
có 8 sản phẩm (trong đó có 5 sản phẩm loại A và 3 sản phẩm loại B). lấy ngẫu nhiên từ mỗi hộp ra 2 sản
phẩm.
a. Tính xác suất để có 3 sản phẩm loại A trong 4 sản phẩm lấy ra. ĐS: 29/63
b. Nếu trong 4 sản phẩm lấy ra có 1 sản phẩm loại B, tìm xác suất sản phẩm loại B là của hộp thứ
nhất. ĐS: 8/145
Bài 21: Một hộp có 6 sản phẩm hoàn toàn không biết chất lượng. Mọi giả thiết về số sản phẩm tốt có trong
hộp được xem như đồng khả năng. Lấy ngẫu nhiên không hoàn lại 3 sản phẩm thì thấy có 2 sản phẩm tốt.
Hỏi có bao nhiêu sản phẩm tốt có trong 3 sản phẩm còn lại trong hộp? ĐS: 2
• Nếu tập giá trị { X (ω ) / ω ∈ Ω} lấp đầy trên một khoảng trục số thì ta gọi X là biến ngẫu nhiên liên tục.
• Cho biến ngẫu nhiên X và hàm số y = ϕ ( x) . Khi đó, Y = ϕ ( X ) được gọi là hàm của biến ngẫu nhiên và
Y cũng là một biến ngẫu nhiên.
VD 1. Một hộp chứa 3 lá thăm màu đỏ và 2 lá thăm màu đen. Một người bốc lần lượt 2 lá thăm từ hộp đó.
Nếu bốc được lá thăm đỏ thì được thưởng 100 ngàn đồng; nếu bốc lá thăm đen thì bị phạt 70 ngàn đồng.
Gọi A: “bốc được lá thăm đỏ lần thứ i ” (i = 1,2), X là số lá thăm đỏ bốc được và Y là số tiền có được, thì
{
Không gian mẫu Ω = A1 A 2 , A1A 2 , A1 A 2 ,A1A 2 }
X là biến ngẫu nhiên và X = {0,1, 2}
Cho BNN X = { x1 , x2 ,..., xn } , x1 < x2 < ... < xn với xác suất tương ứng là P ( X = xi ) = pi , i = 1, 2,..., n
Ta định nghĩa
• Bảng phân phối xác suất của X là
X x1 x2 ... xn
P p1 p2 ... pn
pi khi x = xi
• Hàm mật độ của X là f ( x) = ∀i
0 khi x ≠ xi
Chú ý
n
pi ≥ 0 ∀i và ∑p
i =1
i =1
P ( a < X ≤ b) = ∑
a < xi ≤b
pi
VD 2. Cho X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất
X -1 0 1 3 5
P 3a a 0,1 2a 0,3
a. Tìm a và tính P (−1 < X ≤ 3)
b. Lập bảng phân phối xác suất của hàm Y = X 2
VD 3. Một xạ thủ có 4 viên đạn, bắn lần lượt vào một mục tiêu một cách độc lập. Xác suất trúng mục tiêu
ở mỗi lần bắn là 0,8. Biết rằng nếu có 1 viên trúng mục tiêu hoặc hết đạn thì dừng. Gọi X là số viên đạn xạ
thủ đã bắn, hãy lập bảng phân phối xác suất của X.
Giải: Gọi Ai : “viên đạn thứ i trúng mục tiêu”, i = 1,2,3,4.
+∞
∫
−∞
f ( x)dx = 1
Hàm mật độ của BNN liên tục X cho biết mức độ tập trung xác suất tại điểm x
Trang 13
Đặng Thục Hiền Bài giảng XS và TK
b
Chú ý: P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) = ∫ f ( x)dx
a
+∞ +∞
+∞ +∞
∫
−∞
f ( x)dx = F ( x) −∞ = F (+∞) − F (−∞); ∫
−∞
f ( x)dx = F ( x) −∞ = lim F ( x) − lim F ( x)
x →+∞ x →−∞
4 x3 khi x ∈ [0,1]
VD 5. Chứng tỏ f ( x) = là hàm mật độ của BNN X và tính P (0, 5 ≤ X < 3)
0 khi x ∉ [0,1]
+∞ 1
∫ f ( x)dx = ∫ 4 x3 dx = x 4 1
Giải: f ( x) ≥ 0, ∀x ∈ ℝ và 0 = 1 nên f ( x) là hàm mật độ của X
−∞ 0
3 1
∫ ∫ 4 x dx = 15 / 16
3
P(0,5 ≤ X < 3) = f ( x)dx =
0,5 0,5
0 khi x < 2
VD 6. Cho BNN X có hàm mật độ f ( x) = k . Tính P (−3 < X < 5)
x 2 khi x ≥ 2
Ý nghĩa: Nếu biết hàm phân phối xác suất của X thì ta có thể tính các xác suất liên quan đến X.
P( X ≥ a) = 1 − P( X < a) = 1 − F (a)
P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) = P ( X < b) − P ( X < a ) = F (b) − F (a )
P ( X = a ) = lim+ F ( x) − F (a )
x →a
Giả sử BNN rời rạc X nhận các giá trị trong tập hợp { x1 , x2 ,..., xn } và có phân phối xác suất
P ( X = xi ) = pi , thì hàm phân phối xác suất của X là
Trang 14
Đặng Thục Hiền Bài giảng XS và TK
0 khi x ≤ x1
p khi x1 < x ≤ x2
1
p + p2 khi x2 < x ≤ x3
F ( x) = 1
.........
p1 + p2 + pn −1 khi xn −1 < x ≤ xn
1 khi xn < x
0 x<a
x
ϕ ( x) x ∈ [a, b]
Nếu BNN X có hàm mật độ f ( x) = thì F ( x) = ∫ ϕ (t )dt a≤ x≤b
0 x ∉ [a, b] a
1 x>b
0 x<a
0 x<a x
Nếu BNN X có hàm mật độ f ( x) = thì F ( x) =
ϕ ( x) x≥a ∫ ϕ (t )dt x≥a
a
x
ϕ ( x) x≤a ∫ ϕ (t )dt x≤a
Nếu BNN X có hàm mật độ f ( x) = thì F ( x) = −∞
0 x>a 1
x>a
VD 1. Lập hàm phân phối xác suất của BNN X có bảng phân phối xác suất là
X -2 1 3 4
P 0,1 0,1 0,2 0,5
0 khi x ≤ −2
0,1 khi − 2 < x ≤1
F ( x) = 0, 2 khi 1< x ≤ 3
0, 4 khi 3< x ≤ 4
1 khi 4< x
0 x ∉ [0,1]
VD 2. Tìm hàm phân phối xác suất của BNN X có hàm mật độ f ( x) = 2
3 x x ∈ [0,1]
0 x<0
x 0 x<0
2
F ( x) = ∫ 3t dt 0 ≤ x ≤ 1 = x3 khi 0 ≤ x ≤ 1
0 1 x >1
1 x >1
0 x < 100
VD 3. Tìm hàm phân phối xác suất của BNN X có hàm mật độ f ( x) = 100 và tính xác suất
x 2 x ≥ 100
P ( X ≥ 400)
Trang 15
Đặng Thục Hiền Bài giảng XS và TK
3 2
x x ∈ [ − 1,3]
VD 4. X có hàm mật độ f ( x) = 28 . Tìm hàm phân phối xác suất của X.
0 x ∉ [ − 1, 3]
0 x ≤ −2
3
VD 5. BNN X có hàm F ( x) = ax + 2b x ∈ (−2,3] .
1 x>3
a. Hãy tìm các hằng số a, b.
−8a + 2b = 0 a = 1 / 35
Từ đó có hệ phương trình ⇒
27 a + 2b = 1 b = 4 / 35
−2 ≤ X < −1
b. Có 2 < X 2 +1 ≤ 5 ⇔ 2 < X 2 +1 ≤ 5 ⇔ 1 < X 2 ≤ 4 ⇔
1 < X ≤ 2
P ( 2 < Y ≤ 5) = P (−2 ≤ X < −1) + P (1 < X ≤ 2) = F (−1) − F (−2) + F (2) − F (1) = 14 / 35
+∞
Trang 16
Đặng Thục Hiền Bài giảng XS và TK
X -1 0 2 3
P 0,1 0,2 0,4 0,3
VD 2. Một lô hàng có 10 sản phẩm tốt và 2 phế phẩm. Gọi X là số sản phẩm tốt có trong 4 sản phẩm lấy
ngẫu nhiên từ lô hàng. Tính kỳ vọng của X.
Giải: Gọi X là số sản phẩm tốt, X = {2,3, 4} .
C102 C22
P ( X = 2) = = 3 / 33 ; P ( X = 3) = 16 / 33; P ( X = 4) = 14 / 33
C124
Vậy E ( X ) = 10 / 3
3 2
( x + 2 x) x ∈ [0,1]
VD 3. Tính kỳ vọng của BNN X có hàm mật độ f ( x) = 4
0 x ∉ [0,1]
ekx x ≤ 0
VD 4. Tính kỳ vọng của BNN X có hàm mật độ f ( x) =
0 x>0
+∞ 0
∫ ∫e
kx
Giải: f ( x) là hàm mật độ nên f ( x)dx = 1 ⇒ dx = 1 ⇒ k = 1
−∞ −∞
+∞ 0
∫ ∫ xe dx = −1
x
E( X ) = xf ( x)dx =
−∞ −∞
X -1 1 3 Y -1 2
P 0,3 0,1 0,6 P 0,6 0,4
Tính E ( X 2Y − 3 XY + 5Y + 7)
Trang 17
Đặng Thục Hiền Bài giảng XS và TK
Trang 18
Đặng Thục Hiền Bài giảng XS và TK
+∞ +∞
2
x ∈ [1, 2] 2
VD 15. Cho BNN X có hàm mật độ f ( x) = x 2 . Tìm E (Y ) biết Y = X 5 −
0 X
x ∉ [1, 2]
i =1 i =1
+∞ 2
+∞
• Nếu X là BNN liên tục có hàm mật độ là f ( x) thì Var ( X ) = ∫ x f ( x)dx − ∫ xf ( x)dx
2
−∞ −∞
VD 16. Tính phương sai của BNN X có bảng phân phối xác suất
X 1 2 3
P 0,2 0,7 0,1
3 2
( x + 2 x) x ∈ [0,1]
VD 17. Tìm phương sai của X biết hàm mật độ f ( x) = 4
0 x ∉ [0,1]
3 2
(1 − x ) x ≤1
VD 18. Cho BNN X có hàm mật độ f ( x) = 4 . Tìm Var(Y) biết Y = 2X2
0 x >1
3.2.2. Tính chất
1) Var(C) = 0 (C là hằng số) 2) Var (CX ) = C 2Var ( X )
3) Var ( X ± Y ) = Var ( X ) + Var (Y ) nếu X, Y độc lập.
3.2.3. Ý nghĩa của phương sai
• ( X − E ( X ))2 là bình phương sai biệt giữa giá trị của X và trung bình của nó. Phương sai là trung bình
của sai biệt này nên phương sai cho biết sự phân tán của các số liệu, phương sai càng nhỏ thì số liệu càng
tập trung quanh giá trị trung bình của chúng.
• Trong kỹ thuật, phương sai đặc trưng cho độ sai số của thiết bị. Trong kinh tế, phương sai đặc trưng cho
độ rủi ro của đầu tư. Trong chăn nuôi, phương sai biểu thị mức độ đồng đều của đàn gia súc còn trong
trồng trọt thì phương sai biểu thị mức độ ổn định của năng suất cây trồng...
Trang 19
Đặng Thục Hiền Bài giảng XS và TK
• Do đơn vị đo của Var(X) bằng bình phương đơn vị đo của X nên để so sánh được với các đặc trưng khác,
người ta dùng tham số độ lệch tiêu chuẩn là σ ( X ) = Var ( X )
Ví dụ: Năng suất của hai máy tương ứng là hai BNN X và Y có bảng phân phối xác suất
X 1 2 3 4 Y 2 3 4 5
P 0,3 0,1 0,5 0,1 P 0,1 0,4 0,4 0,1
Ta tính được E(X) = 2,4; Var(X) = 1,04; E(Y) = 3,5; Var(Y) = 0,65.
Do E(X) < E(Y) và Var(X) > Var(Y) nên nếu phải chọn mua 1 máy thì ta chọn mua máy Y.
E ( X ) < E (Y ) E ( X ) > E (Y )
Chú ý: Nếu hoặc thì ta không so sánh được. Để giải quyết vấn đề
Var ( X ) < Var (Y ) Var ( X ) > Var (Y )
σ
này, trong thực tế người ta dùng tỉ số tương đối 100% ( µ là giá trị trung bình) để so sánh sự ổn định
µ
của các BNN X và Y. Tỉ số tương đối càng nhỏ thì độ ổn định càng cao.
Ví dụ: Điểm thi môn XSTK của 2 lớp A và B là hai BNN X và Y. Có kết quả: E(X) = 6,25; Var(X) = 1,25;
E(Y) = 5,75; Var(Y) = 0,75.
σX σY
Ta có 100% = 17,89%; 100% = 15, 06% . Vậy lớp B học ổn định (học đều) hơn lớp A.
E( X ) E (Y )
3.3. Giá trị tin chắc nhất
3.3.1. Định nghĩa: Giá trị tin chắc nhất của BNN X, ký hiệu là Mod(X) (ModX) là giá trị x0 ∈ X thỏa
mãn
• Nếu X là BNN rời rạc thì P ( X = x0 ) = max P ( X = x) nghĩa là Mod(X) là giá trị của X ứng với xác suất
x∈ X
lớn nhất trong bảng phân phối xác suất.
• Nếu X là BNN liên tục có hàm mật độ f ( x) thì f ( x0 ) = max f ( x) nghĩa là Mod(X) là giá trị của X mà
x∈ X
tại đó hàm mật độ đạt cực đại.
Ví dụ: BNN X có bảng phân phối xác suất như sau
X 7 8 9 10 11 12 14
P 0,1 0,14 0,3 0,24 0,11 0,06 0,05
Mod(X) = 9 vì P ( X = 9) = 0,3 là lớn nhất
VD 19. Tìm Mod(X) biết X có bảng phân phối xác suất
X 1 2 4 5 8
P 1-3p 0,18 0,07 0,25 p
3 2
x (4 − x) x ∈ [0, 4]
VD 20. Tìm Mod(X) biết X có hàm mật độ f ( x) = 64
0 x ∉ [0, 4]
Chú ý: Một BNN X có thể có nhiều Mod(X)
3.3.2. Ý nghĩa của Mod(X): Mod(X) chính là giá trị có khả năng xảy ra nhiều nhất trong các giá trị mà X
có thể có.
3.4. Các tham số đặc trưng khác (Tham khảo): Trung vị, hệ số đối xứng, hệ số nhọn, mô men.
Trang 20
Đặng Thục Hiền Bài giảng XS và TK
Bài 6: Thời gian một khách hàng xếp hàng chờ phục vụ là BNN liên tục X có hàm phân phối xác suất
0 x≤0
F ( x) = ax 2 x ∈ (0,3)
1 x≥3
0 x ∉ (0, 3]
a. Tìm a và hàm mật độ của X. ĐS: a = 1 / 9; f ( x) = F '( x) = 2 x
9 0 < x < 3
b. Tính xác suất để trong 3 người xếp hàng thì có 2 người phải chờ không quá 2 phút.ĐS: 0,3292
Bài 7: Một hộp có 10 sản phẩm. Gọi X là số sản phẩm loại B có trong hộp. Cho biết bảng phân phối xác
suất của X như sau
X 1 2 3
P 0,2 0,5 0,3
Lấy ngẫu nhiên không hoàn lại từ hộp ra 3 sản phẩm. Gọi Y là số sản phẩm loại B có trong 3 sản phẩm lấy
ra.
a. Tìm phân phối xác suất của Y.
b. Tính E(Y) và Var(Y). ĐS: E ( X ) = 0, 63; Var( X ) = 0, 4198
Bài 8: Có 2 kiện hàng, kiện thứ nhất có 12 sản phẩm trong đó có 4 sản phẩm loại A, kiện thứ hai có 8 sản
phẩm trong đó có 3 sản phẩm loại A. Lấy ngẫu nhiên 2 sản phẩm từ kiện thứ nhất bỏ vào kiện thứ hai, sau
đó lấy không hoàn lại từ kiện thứ hai ra 3 sản phẩm. Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy
ra. Tìm E(X), Var(X), Mod(X). ĐS: E ( X ) = 1,1; Var( X ) = 0, 5688; Mod ( X ) = 1
Bài 9: Số liệu thống kê trong 1 năm cho thấy tại một khu vực tỷ lệ tai nạn xe máy là 0,0055 (vụ/tổng số
xe). Một công ty bảo hiểm đề nghị tất cả các chủ xe phải mua bảo hiểm xe máy với số tiền là 30 000đ một
xe và số tiền bảo hiểm trung bình cho 1 vụ tai nạn là 3 000 000đ. Hỏi lợi nhuận công ty kỳ vọng thu được
Trang 21
Đặng Thục Hiền Bài giảng XS và TK
đối với mỗi hợp đồng bảo hiểm là bao nhiêu, biết rằng chi phí quản lý và các chi phí khác chiếm 30% số
tiền bán bảo hiểm? ĐS: E ( X ) = 4500
Trong đó, 0 ≤ k ≤ n và n − ( N − N A ) ≤ k ≤ N A
VD 1. Một hộp gồm 10 viên phấn trong đó có 7 viên phấn trắng. Lấy ngẫu nhiên 5 viên từ hộp này. Gọi X
là số viên trắng lấy được. Lập bảng phân phối xác suất và tính kỳ vọng của X.
1.1.2. Các tham số đặc trưng
N −n N
Nếu X ∼ H ( N , N A , n) thì E ( X ) = np ; Var ( X ) = npq ; trong đó p = A ; q = 1 − p
N −1 N
VD 2. Một cửa hàng bán 100 bóng đèn trong đó có 12 bóng hỏng. Một người chọn mua ngẫu nhiên 15
bóng đèn từ cửa hàng. Hỏi trung bình người đó mua được bao nhiêu bóng đèn tốt?
VD 3. Tại một công trình có 100 người đang làm việc trong đó có 70 kỹ sư. Chọn ngẫu nhiên 40 người từ
công trình, gọi X là số kỹ sư chọn được
a. Tính xác suất chọn được từ 27 đến 29 kỹ sư.
b. Tính E(X) và Var(X)
Giải: N = 100; N A = 70; n = 40 ⇒ X ∼ H (100, 70, 40)
Trang 22
Đặng Thục Hiền Bài giảng XS và TK
Ví dụ: Xác suất để một máy sản xuất được sản phẩm loại I là 0,8. Cho máy sản xuất 5 sản phẩm. Gọi X là
số sản phẩm loại I có trong 5 sản phẩm thì X ∼ B (5;0,8) . Các giá trị X có thể nhận là 0, 1, 2, 3, 4, 5 với
các xác suất tương ứng là P ( X = 0) = (0, 2)5 = 0, 00032 ; P ( X = 1) = C51 (0,8)(0, 2) 4 = 0, 0064 ;
P ( X = 2) = 0, 512 ; P ( X = 3) = 0, 2048 ; P ( X = 4) = 0, 4096 ; P ( X = 5) = 0,32768 .
• Trong thực tế, muốn tính xác suất để BNN X có phân phối nhị thức nhận giá trị trong khoảng [k, k+h]
với h nguyên dương và h ≤ n − k thì ta áp dụng công thức P (k ≤ X ≤ k + h) = Pk + Pk +1 + ... + Pk + h , trong đó
các Pk , Pk +1 ,..., Pk + h được tính theo công thức Bernoulli.
Ví dụ: Gieo ngẫu nhiên 20 lần một đồng tiền cân đối đồng chất. Tính xác suất để xuất hiện đúng 1 lần mặt
sấp.
Gọi X là xác suất xuất hiện mặt sấp, xác suất xuất hiện mặt sấp trong mỗi lần gieo là 0,5.
1 5
P ( X = 1) = C20 (0,5)(0,5)19 = 18
2
VD 4. Một phân xưởng có 5 máy hoạt động độc lập. Xác suất để trong một ngày mỗi máy bị hỏng đều
bằng 0,1. Tìm xác suất để
a. Trong một ngày có 2 máy hỏng.
b. Trong một ngày có không quá 2 máy hỏng.
VD 5. Trong một lần thi trắc nghiệm, mỗi thí sinh nhận một đề thi gồm 10 câu hỏi, mỗi câu có 4 cách trả
lời trong đó chỉ có 1 cách trả lời đúng. Kết quả các câu trả lời là độc lập. Điểm bài thi bằng tổng số câu trả
lời đúng.
a. Thí sinh A không thuộc bài và trả lời ngẫu nhiên. Tính xác suất để thí sinh A đạt yêu cầu.
b. Thí sinh B trả lời đúng được 3 câu. Các câu còn lại trả lời ngẫu nhiên. Tìm xác suất để thí sinh B
đạt yêu cầu.
VD 6. Đề thi trắc nghiệm môn XSTK gồm 20 câu hỏi, mỗi câu có 4 cách trả lời trong đó chỉ có 1 cách trả
lời đúng. Kết quả các câu trả lời là độc lập. Sinh viên C làm bài một cách ngẫu nhiên, nếu trả lời đúng 1
câu thì được 0,5 điểm, nếu trả lời sai 1 câu thì bị bị trừ 0,125 điểm. Tính xác suất để sinh viên C đạt điểm
5.
Giải:
Gọi X là số câu trả lời đúng sv C đã làm và x là số câu trả lời đúng để sv C đạt 5 điểm.
Ta có: 0,5 x − 0,125(20 − x) = 5 ⇒ x = 12 . Do X ∼ B (20;0, 25) ⇒ P ( X = 12) = 0, 0008
1.2.2. Các tham số đặc trưng
• Nếu X ∼ B (n, p ) thì E ( X ) = np ; Var ( X ) = npq ; Mod ( X ) = x0 ∈ ℕ : np − q ≤ x0 ≤ np − q + 1
VD 7. Ông A trồng 100 cây bạch đàn với xác suất cây chết là 0,02. Gọi X là số cây bạch đàn chết.
a. Tìm xác suất có từ 3 đến 5 cây bạch đàn chết.
b. Tính trung bình số cây bạch đàn chết và Var(X).
c. Ông A cần phải trồng tối thiểu bao nhiêu cây để xác suất có ít nhất 1 cây chết lớn hơn 50%?
VD 8. Một nhà vườn trồng 126 cây hoa lan, xác suất nở hoa của mỗi cây trong 1 năm là 0,67.
a. Giá bán 1 cây lan nở hoa là 2 triệu đồng. Giả sử nhà vườn bán hết những cây lan nở hoa thì mỗi
năm nhà vườn thu được chắc chắn nhất là bao nhiêu tiền?
b. Nếu muốn trung bình mỗi năm có nhiều hơn 100 cây lan nở hoa thì nhà vườn phải trồng tối thiểu
mấy cây lan?
Trang 23
Đặng Thục Hiền Bài giảng XS và TK
VD 9. Có 10 hộp phấn màu giống nhau, mỗi hộp chứa 20 viên phấn gồm hai loại: 3 hộp loại I, mỗi hộp có
12 viên phấn đỏ; 7 hộp loại II, mỗi hộp có 8 viên phấn đỏ. Chọn ngẫu nhiên 1 hộp và từ hộp đó lấy lần
lượt ra 5 viên phấn (lấy viên nào xong thì trả lại vào hộp). Tính xác suất chọn được 3 viên phấn đỏ.
Giải: Gọi X là số viên phấn đỏ chọn được X = {0,1, 2,3, 4,5}
VD 13. Một máy dệt có 500 ống sợi. Xác suất một ống bị đứt trong 1 giờ máy làm việc là 0,004. Tìm xác
suất để trong 1 giờ không có quá 2 ống bị đứt.
VD 14. Quan sát tại siêu thị A thấy trung bình 5 phút có 18 khách đến mua hàng.
a. Tính xác suất để trong 7 phút có 25 khách đến siêu thị A.
b. Tính xác suất để trong 2 phút có từ 3 đến 5 khách đến siêu thị A.
c. Tính số khách chắc chắn nhất sẽ đến siêu thị A trong 1 giờ.
VD 15. Cứ mỗi lần đi câu cá thì ông A chọn ngẫu nhiên 1 trong 2 nơi để câu. Nếu đi câu ở địa điểm I thì
trung bình cứ 10 lần móc mồi, ông A câu được 2 con cá; câu ở địa điểm II thì trung bình cứ 12 lần móc
mồi, ông A câu được 3 con cá. Hôm nay ông A đi câu, ông đã móc mồi 20 lần và câu được 5 con cá. Tính
xác suất ông A câu được 5 con cá ở địa điểm II ?
Giải: Gọi X là số con cá ông A câu được.
45 −4
Chọn địa điểm thứ nhất: X ∼ P (4) ⇒ P5 = e = 0,1563
5!
55 −5
Chọn địa điểm thứ hai: X ∼ P (5) ⇒ P5 = e = 0,1755
5!
0,5.0,1755
Vậy P ( II X = 5) = = 0, 5289
0,5.(0,1563 + 0,1755)
VD 16. Một lô hàng thịt đông lạnh đóng gói nhập khẩu có chứa 3% bị nhiễm khuẩn. Tìm xác suất để khi
chọn ngẫu nhiên 2.000 gói thịt từ lô hàng này có từ 40 đến 42 gói bị nhiễm khuẩn ?
VD 17. Một vườn lan có 10.000 cây sắp nở hoa, trong đó có 1.000 cây hoa màu đỏ. Có thể tính xác suất
để khi chọn ngẫu nhiên 300 cây lan thì có 45 cây hoa màu đỏ được không?
1.4. Phân phối mũ (Exponential Distribution)
1.4.1. Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là có phân phối mũ, ký hiệu X ∼ E (λ ) nếu hàm
λ e − λ , x ≥ 0 1
mật độ của nó có dạng f ( x) = , trong đó λ là một hằng số dương và λ = .
0, x<0 E( X )
1.4.2. Các tham số đặc trưng
1 1
Nếu X ∼ E (λ ) thì E ( X ) = , Var( X ) =
λ λ2
Ví dụ: Biết thời gian hoạt động của một bóng đèn điện tử là BNN có phân phối mũ. Tính xác suất sao cho
thời gian hoạt động của bóng đèn không dưới 600 giờ nếu thời gian hoạt động trung bình của mỗi bóng là
400 giờ.
Xác suất cần tìm là P ( X ≥ 600) = 1 − P ( X < 600) = 1 − F (600)
600
−
1
600 −1,5
= 1− ∫0
λ e− λ x dx = 1 − 1 − e
400
= e ≈ 0, 2231 .
1.5. Phân phối đều (Uniform Distribution)
1.5.1. Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a,b], ký hiệu là
1
, x ∈ [a, b]
X ∼ U (a, b) nếu hàm mật độ của nó có dạng f ( x) = b − a
0, x ∉ [a, b]
Trang 25
Đặng Thục Hiền Bài giảng XS và TK
β
β −α
Nếu [α , β ] ⊆ [ a, b] thì P (α ≤ X ≤ β ) = ∫α f ( x)dx = b − a
1.5.2. Các tham số đặc trưng
a+b (b − a ) 2
Nếu X ∼ U (a, b) thì E ( X ) = , Var( X ) =
2 12
Ví dụ: Một loại sản phẩm do một nhà máy sản xuất được đóng thành từng hộp (đơn vị tính là kg). Trọng
lượng của hộp là BNN X, biết X ∼ U (1,9; 2,1) . Tính trọng lượng trung bình của một hộp và tỷ lệ hộp có
trọng lượng từ 1,95kg trở lên.
1, 9 + 2,1
Trọng lượng trung bình của một hộp là E ( X ) = = 2 kg.
2
2,1 − 1, 95
Tỷ lệ hộp có trọng lượng từ 1,95kg trở lên là P ( X ≥ 1, 95) = P (1, 95 ≤ X ≤ 2,1) = = 0, 75
2,1 − 1,9
b−µ
σ z2
x−µ 1 −
Nhận xét: Đổi biến z =
σ
thì P (a ≤ X ≤ b) =
2π
∫
a−µ
e 2
dz
σ
Chú ý
P ( Z < β ) = 0,5 + ϕ ( β ); P ( Z > α ) = 0,5 − ϕ (α ) .
Nếu x ≥ 4 thì ϕ ( x) ≈ 0, 5 .
X −µ
Nếu X ∼ N ( µ , σ 2 ) thì Z = ∼ N (0,1)
σ
b−µ a−µ
Vậy, công thức tính xác suất của phân phối chuẩn là P (a ≤ X ≤ b) = ϕ −ϕ
σ σ
VD 1. Thời gian X (tháng) đạt chuẩn chiều cao của loại cây giống A tại một vườn ươm là biến ngẫu nhiên
có phân phối N(8,3). Tỉ lệ (xác suất) đạt chuẩn chiều cao của loại cây giống A tại vườn ươm này trong
khoảng từ 6 tháng đến 8,2 tháng là:
a. 27,65% b. 31,15% c. 42,27% d. 45,78%.
VD 2. Một kỳ thi đầu vào ở trường chuyên A quy định điểm đỗ là tổng số điểm các môn thi không được
thấp hơn 15 điểm. Giả sử tổng điểm các môn thi của học sinh là biến ngẫu nhiên có phân phối chuẩn với
trung bình 12 điểm. Biết rằng tỉ lệ học sinh thi đỗ là 25,14%. Độ lệch chuẩn là:
a. 4 điểm b. 4,5 điểm c. 5 điểm d. 5,5 điểm.
VD 3. Tốc độ chuyển dữ liệu từ máy chủ của ký túc xá đến máy tính của sinh viên vào buổi sáng chủ nhât
có phân phối chuẩn với trung bình 60Kbits/s và độ lệch chuẩn 4Kbits/s. Xác suất để tốc độ chuyển dữ liệu
lớn hơn 63Kbits/s là
a. 0,2266 b. 0,2144 c. 0,1313 d. 0,1060.
VD 4. Cho BNN X có phân phối chuẩn với E(X) = 10, P(10 < X < 20) = 0,3 . Tính P(0 < X < 15).
VD 5. Thời gian khách phải chờ để được phục vụ tại một cửa hàng là BNN X (phút), X ∼ N (4,5; 1, 21) .
a. Tính xác suất khách phải chờ từ 3,5 phút đến 5 phút.
b. Tính thời gian tối thiểu t nếu xác suất khách phải chờ vượt quá t là không quá 5%.
Giải: µ = 4,5; σ = 1,1
5 − 4, 5 3,5 − 4,5
a. P (3, 5 ≤ X ≤ 5) = ϕ −ϕ = ϕ ( 0, 45 ) − ϕ ( 0, 91) = 0, 4922
1,1 1,1
Trang 27
Đặng Thục Hiền Bài giảng XS và TK
t − 4,5
b. P ( X > t ) ≤ 0, 05 ⇒ 0, 5 − ϕ ≤ 0, 05 ⇒ t ≥ 6, 315 .
1,1
Vậy, thời gian tối thiểu là 6,315 phút
VD 6. Tuổi thọ của 1 loại máy lạnh A là BNN X (năm) có phân phối N(10; 6,25). Khi bán 1 máy lạnh A
thì lãi được 1,4 triệu đồng nhưng nếu máy lạnh phải bảo hành thì lỗ 3,8 triệu đồng. Vậy để có tiền lãi
trung bình khi bán mỗi máy lạnh loại này là 1 triệu đồng thì cần phải quy định thời gian bảo hành là bao
nhiêu ?
α
Hệ quả: Giả sử X ∼ N ( µ , σ 2 ) thì P ( X − µ < α ) = 2ϕ
σ
Ví dụ: Người ta tiện một loại chi tiết máy có độ dài quy định là 20cm. Biết độ dài X của chi tiết máy là
BNN có phân phối chuẩn với độ lệch chuẩn bằng 0,2cm.
a. Tính xác suất để chi tiết được sản xuất ra có độ dài lệch với độ dài quy định (dung sai) không quá
0,3cm.
b. Để tỷ lệ phế phẩm không quá 5% thì dung sai phải bằng bao nhiêu ?
0, 3
Giải: a. P ( X − 20 < 0, 3) = 2ϕ = 2ϕ (1, 5 ) = 2.0, 4332 = 0,8664 . Như vậy, tỷ lệ phế phẩm là 13%
0, 2
nếu dung sai là 0.3cm.
b. Cần tìm dung sai α sao cho
α α α
P ( X − 20 < α ) = 2ϕ ≥ 0,95 ⇒ ϕ ≥ 0, 475 ⇒ ≥ 1,96 ⇒ α ≥ 0, 392
0, 2 0, 2 0, 2
1 80 − 400.0, 2 1 1
P80 = f = f ( 0) = .0,3989 ≈ 0, 05
400.0, 2.0.8 400.0, 2.0.8 400.0, 2.0.8 400.0, 2.0.8
4.1.2. Định lý 2: Thực hiện n phép thử độc lập. Nếu trong mỗi phép thử, biến cố A xuất hiện với xác suất
p (p không quá gần 0 và không quá gần 1) thì
1
x2
−
t2
k − np
lim Pk −
n →+∞ 2π
∫x e dt = 0 trong đó 0 ≤ k1 ≤ k ≤ k2 ≤ n, xi = i
2
npq
i = 1, 2 .
1
Trang 28
Đặng Thục Hiền Bài giảng XS và TK
x2 t2
1 −
Như vậy, với n khá lớn thì Pk ≈
2π
∫e
x1
2
dt = ϕ ( x2 ) − ϕ ( x1 ) . Trong đó, ϕ ( x) là hàm Laplace.
Ví dụ: Xác suất bắn trúng đích của một xạ thủ là 0,75. Tính xác suất để trong 100 phát có ít nhất 81 phát
trúng đích.
81 − 100.0, 75 100 − 100.0, 75
Có x1 = ≈ 1,38 ; x2 = ≈ 5, 77 .
100.0, 75.0, 25 100.0, 75.0, 25
Vậy Pk = ϕ ( x2 ) − ϕ ( x1 ) = 0, 5 − 0, 4162 = 0, 0838
VD 7. Xác suất để một máy sản xuất được sản phẩm loại A là 0,8. Tìm xác suất để trong 400 sản phẩm do
máy sản xuất ra có
a. 336 sản phẩm loại A.
b. Có từ 304 đến 328 sản phẩm loại A.
VD 8. Người ta đã phát ra 480 giấy mời dự hội nghị khách hàng. Biết sức chứa của khán phòng là 400 và
thường chỉ có 80% khách hàng đến dự. Tinh xác suất để tất cả các khách hàng đến dự đều có chỗ ngồi.
phối "khi – bình phương" (Chi – Square Distribution) với n bậc tự do, ký hiệu là χ ∼ χ (n) . 2 2
− x /2 n2 −1
e x x>0
• Hàm mật độ của BNN χ 2 có dạng f n ( x) = 2 n / 2 Γ n
2
0 x≤0
+∞
∫t
x −1 − t
trong đó hàm gama Γ( x) = e dt
0
• Ký hiệu χα2 là giá trị của BNN χ 2 có phân phối "khi – bình phương" với n bậc tự do thỏa mãn điều kiện
P ( χ 2 > χα2 ) = α . Các giá trị của χα2 đã được tính sẵn.
3.1.2. Các tham số đặc trưng
Nếu χ 2 ∼ χ 2 (n) thì E ( χ 2 ) = n; Var ( χ 2 ) = 2n
Chú ý: Khi số bậc tự do đủ lớn, phân phối "khi – bình phương" sẽ xấp xỉ phân phối chuẩn.
3.2. Phân phối Student
3.2.1. Định nghĩa
Z
• Giả sử Z ∼ N (0,1) , V là BNN độc lập với Z và V ∼ χ 2 (n) . Khi đó, BNN T = có phân phối
V /n
Student với n bậc tự do, ký hiệu là T ∼ T (n)
Trang 29
Đặng Thục Hiền Bài giảng XS và TK
n +1
n +1 t
2 2
Γ 1 +
2 n
• Hàm mật độ xác suất của T có dạng f n (t ) = − ∞ < t < +∞
n
Γ nπ
2
• Ký hiệu tα là giá trị của BNN T ∼ T (n) thỏa mãn điều kiện tα > 0 và P (T > tα ) = α . Các giá trị của tα
đã được tính sẵn.
3.2.2. Các tham số đặc trưng
n
Nếu T ∼ T (n) thì E (T ) = 0; Var (T ) =
n−2
Chú ý: Khi số bậc tự do đủ lớn ( n > 30 ) ta có thể dùng phân phối chuẩn tắc thay cho phân phối Student.
Trang 30
Đặng Thục Hiền Bài giảng XS và TK
b. Có từ 70 đến 100 sản phẩm không được kiểm tra. ĐS: 0,8882
Bài 10. Một khách sạn nhận đặt chỗ của 325 khách hàng cho 300 phòng vào ngày 1/1 vì theo kinh nghiệm
những năm trước cho thấy có 10% khách đặt chỗ nhưng không đến. Biết mỗi khách đặt 1 phòng. Tính xác
suất
a. Có 300 khách đến và nhận phòng. ĐS: 0,0281
b. Tất cả các khách đến đều được nhận phòng. ĐS: 0,9177
Bài 11. Một khách hàng chọn ngẫu nhiên 1000 con trong 20000 con cá da trơn trong đó để lẫn 4000 con
cá tra. Tính xác suất khách hàng chọn được từ 182 đến 230 con cá tra.
a. 0,8143 b. 0,9133 c. 0,9424 d. 0,9765 ĐS: b
Bài 12. Một công nhân đứng máy xe sợi gồm 400 ống sợi. Xác suất mỗi ống bị đứt trong vòng một giờ là
0,005. Tính xác suất để trong vòng một giờ có 40 ống bị đứt. ĐS:
Bài 13. Cắt một loại chi tiết máy có độ dài qui định là 1,2m. Biết độ dài của chi tiết này được sản xuất ra
tuân theo luật phân phối chuẩn với độ lệch chuẩn là σ = 5cm. Nếu muốn đảm bảo tỷ lệ sản phẩm đạt yêu
cầu là từ 80% trở lên thì độ lệch giữa độ dài chi tiết sản xuất với độ dài qui định phải bằng bao nhiêu?
ĐS: 6,45cm
Bài 14. Độ dài một chi tiết máy tuân theo luật phân phối chuẩn với giá trị trung bình 20cm và độ lệch
chuẩn là 0,5. Hãy tính xác suất khi chọn ngẫu nhiên ra một chi tiết thì độ dài của nó lớn hơn 20cm.
ĐS: 0,5
Bài 15. Cắt một loại chi tiết máy có độ dài qui định là 1,2m. Biết độ dài của chi tiết này được sản xuất ra
tuân theo luật phân phối chuẩn với độ lệch chuẩn là σ = 5cm. Tính xác suất để độ dài chi tiết sản xuất ra
lệch với độ dài qui định không quá 4cm. ĐS: 0,5762
Bài 16. Độ dài một chi tiết máy tuân theo luật phân phối chuẩn với giá trị trung bình 20cm và độ lệch
chuẩn là 0,5. Hãy tính xác suất khi chọn ngẫu nhiên ra một chi tiết thì độ dài của nó bé hơn 19,5cm.
ĐS: 0,1587
Bài 17. Trọng lượng của một loại sản phẩm X có phân phối chuẩn với kỳ vọng là a = 10kg, độ lệch là
σ = 0,5 . Tính tỷ lệ sản phẩm có trọng lượng từ 9,5kg đến 11 kg. ĐS: 0,8185
• Mẫu được chọn ngẫu nhiên một cách khách quan gọi là mẫu ngẫu nhiên. Giá trị của mẫu ngẫu nhiên
được gọi là mẫu cụ thể. Quan hệ giữa mẫu ngẫu nhiên và mẫu cụ thể tương tự như quan hệ giữa biến ngẫu
nhiên và một giá trị có thể có của nó.
VD: Một công ty cao su có 500 000 công nhân (tổng thể), gọi X là thu nhập của công nhân trong công ty
(dấu hiệu cần khảo sát); lấy ngẫu nhiên 500 công nhân để khảo sát (mẫu ngẫu nhiên, cỡ mẫu là 500) thì
thu được số liệu ở bảng sau (mẫu cụ thể)
xi (tr đồng) 2,5 3,5 4,5 5,5 6,5 7,5 8,5
Nếu lấy ngẫu nhiên 500 công nhân khác thì có mẫu cụ thể (bảng giá trị) khác
• Có hai cách lấy mẫu ngẫu nhiên, lấy có hoàn lại và lấy không hoàn lại. Khi kích thước mẫu lớn thì
không phân biệt mẫu có hoàn lại hay không.
• Có hai loại mẫu: Mẫu định tính là mẫu lấy ra để quan sát một tính chất A nào đấy có trong các phần tử
của mẫu hay không; mẫu định lượng là mẫu lấy ra để quan sát các yếu tố về lượng (chiều dài, cân nặng,
năng suất...) của các phần tử có trong mẫu.
• Gọi X 1 , X 2 ,..., X n là những kết quả quan sát. Ta xem như đã quan sát n lần, mỗi lần ta được một biến
ngẫu nhiên X i (i = 1, 2,..., n) . X 1 , X 2 ,..., X n được xem là độc lập và có cùng phân phối xác suất.
Trang 32
Đặng Thục Hiền Bài giảng XS và TK
2
1 n
( )
2 2
Sɵ = Sɵ n = ∑ X i − X
n i =1
• Phương sai mẫu hiệu chỉnh
2
1 n
2
S =S = 2
n ∑ Xi − X
n − 1 i =1
( )
• Trong tính toán, ta dùng công thức
S2 =
n
(
n −1
X2 − X ( ) ) = n n− 1 Sɵ
2 2
trong đó X 2 =
1 n 2
∑ Xi
n i =1
1 n 2 n ɵ2
( )
2
Hay S 2 = ∑ Xi − n X
n − 1 i =1 = n −1 S
• Độ lệch chuẩn
S = S2
1.3.3. Tỷ lệ mẫu
0 Nếu phần tử không có tính chất A
Xét mẫu định tính với các BNN X i (i = 1, 2,..., n) có phân phối X i =
1 Nếu phần tử có tính chất A
m
Nếu mẫu có m phần tử có tính chất A thì tỷ lệ mẫu là F = Fn =
n
Chú ý: Các đặc trưng mẫu X , S 2 , F dùng để nghiên cứu các đặc trưng µ , σ 2 , p của tổng thể. Người ta
chứng minh được rằng F → p, X → µ , S 2 → σ 2 (theo xác suất)
Nếu có mẫu cụ thể, ta tính được một giá trị của X , ,Sɵ , S , F , ký hiệu là x, sɵ , s, f
Ví dụ: Điều tra năng suất của 100 hecta lúa trong một vùng, ta thu được số liệu ở bảng sau
Năng suất (tấn/ha) 3 - 3,5 3,5 - 4 4 - 4,5 4,5 - 5 5 - 5,5 5,5 - 6 6 - 6,5 6,5 - 7
Diện tích 7 12 18 27 20 8 5 3
Những thửa ruộng có năng suất thấp hơn 4,4 tấn/ha gọi là có năng suất thấp. Hãy tính
a. Tỷ lệ diện tích lúa có năng suất thấp.
b. Năng suất lúa trung bình, phương sai chưa hiệu chỉnh và độ lệch chuẩn mẫu có hiệu chỉnh.
Bảng số liệu được viết lại
Năng suất (tấn/ha) 3,25 3,75 4,25 4,75 5,25 5,75 6,25 6,75
Diện tích 7 12 18 27 20 8 5 3
m 7 + 12 + 18
a. f = = = 37%
n 100
2
b. x = 4, 75; sɵ = 0, 685; s = 0,8318
Trang 33
Đặng Thục Hiền Bài giảng XS và TK
• Bài toán đi tìm khoảng ước lượng (θ1 ,θ 2 ) cho θ được gọi là bài toán ước lượng khoảng.
• Trường hợp 2: Cỡ mẫu n > 30 và phương sai tổng thể σ 2 chưa biết
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
s
Tính độ chính xác ε = zα / 2 .
n
Khoảng ước lượng là ( x − ε , x + ε )
• Trường hợp 3: Cỡ mẫu n ≤ 30 , phương sai tổng thể σ 2 chưa biết và X có phân phối chuẩn
Trang 34
Đặng Thục Hiền Bài giảng XS và TK
X −µ
Nhận xét: Nếu X là BNN có phân phối chuẩn thì BNN T = có phân phối Student với (n-1)
S/ n
bậc tự do.
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
Tra bảng tìm tαn −/ 21
s
Tính độ chính xác ε = tαn −/ 21 .
n
Khoảng ước lượng là ( x − ε , x + ε )
• Sai số chuẩn: Nếu ta chọn mẫu ngẫu nhiên N lần (N rất lớn), mỗi lần chọn n đối tượng thì ta sẽ có N số
trung bình. Độ lệch chuẩn của N số trung bình này gọi là sai số chuẩn, nó phản ánh độ dao động của các
số trung bình mẫu.
VD 1. Lượng vitamin có trong trái cây A là biến ngẫu nhiên X (mg) có độ lệch chuẩn 3,98mg. Phân tích
250 trái cây A thì thu được lượng vitamin trung bình là 20mg. Với độ tin cậy 95%, hãy ước lượng lượng
vitamin trung bình có trong mỗi trái cây A.
VD 2. Chiều cao của người là biến ngẫu nhiên X (cm) có phân phối chuẩn N ( µ ,100) . Với độ tin cậy
95%, muốn ước lượng chiều cao trung bình của dân số có độ chính xác không quá 1cm thì phải đo ít nhất
bao nhiêu người?
VD 3. Chiều cao của loại cây A là biến ngẫu nhiên có phân phối chuẩn. Người ta đo ngẫu nhiên 20 cây A
thì thấy chiều cao trung bình là 23,12m và độ lệch chuẩn của mẫu chưa hiệu chỉnh là 1,25m. Tìm khoảng
ước lượng chiều cao trung bình của loại cây A với độ tin cậy 95%.
VD 4. Nghiên cứu nhu cầu về loại hàng X ở phường A bằng cách tiến hành khảo sát 400 trong toàn bộ
2500 hộ gia đình. Kết quả khảo sát như sau
Nhu cầu (kg/tháng) 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5
Số gia đình 10 35 86 132 78 31 18 10
a. Hãy ước lượng nhu cầu trung bình về loại hàng X của toàn phường A trong 1 năm với độ tin cậy
95%.
b. Với mẫu trên, muốn ước lượng nhu cầu trung bình về loại hàng X của phường A với độ chính xác
lớn hơn 3 tấn/năm và độ tin cậy 99% thì cần khảo sát tối đa bao nhiêu gia đình?
VD 5. Theo dõi mức nguyên liệu hao phí để sản xuất một đơn vị sản phẩm người ta thu được số liệu sau
Mức ng/liệu (gr) 19 - 19,5 19,6 - 20 20,1 - 20,5 20,6 - 21
Số sản phẩm 7 12 18 27
Giả sử mức hao phí nguyên liệu này là biến ngẫu nhiên có phân phối chuẩn, hãy ước lượng mức hao phí
nguyên liệu trung bình để sản xuất 1 đơn vị sản phẩm với độ tin cậy là 95%.
2.2.4. Ước lượng khoảng cho tỷ lệ tổng thể
• Giả sử chưa biết tỷ lệ p các phần tử có tính chất A trong tổng thể. Với độ tin cậy 1 − α cho trước, khoảng
ước lượng p là ( p1 , p2 ) thỏa mãn P ( p1 < p < p2 ) = 1 − α .
• Cách tìm
m
Tính tỷ lệ f =
n
Trang 35
Đặng Thục Hiền Bài giảng XS và TK
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2
2
f (1 − f )
Tính độ chính xác ε = zα / 2
n
Khoảng ước lượng là ( f − ε , f + ε )
NA
• Nhận xét: Nếu p ∈ ( p1 , p2 ) và p = thì
N
NA N N
N A = pN ⇒ p1 N < N A < p2 N ; N= ⇒ A <N< A
p p2 p1
VD 6. Một trại gà tây đang nuôi 250.000 con gà trống 22 tuần tuổi, cân nặng đạt chuẩn của 1 con gà là lớn
hơn 22 kg. Cân thử 160 con thì thấy có 138 con đã đạt chuẩn. Với độ tin cậy 95%, hãy ước lượng số gà
trống đạt chuẩn.
VD 7. Để ước lượng số cá có trong hồ người ta bắt lên 10.000 con, đánh dấu rồi thả lại xuống hồ. Sau một
thời gian, bắt lên 8.000 con thì thấy có 564 con được đánh dấu. Hãy ước lượng cá có đánh dấu và số cá có
trong hồ với độ tin cậy 97%.
VD 8. Chọn ngẫu nhiên 500 chiếc tivi trong một kho hàng thì thấy có 27 tivi Sony.
a. Để ước lượng tỷ lệ TV Sony trong kho có độ chính xác là 1,77% thì đảm bảo độ tin cậy của ước
lượng là bao nhiêu?
b. Nếu muốn có độ chính xác của ước lượng tỷ lệ TV Sony nhỏ hơn 0,01 với độ tin cậy 95% thì cần
chọn ít nhất bao nhiêu TV nữa?
2.2.5. Ước lượng khoảng cho phương sai tổng thể
• Giả sử biến ngẫu nhiên X có phân phối chuẩn. Với độ tin cậy 1 − α cho trước, khoảng ước lượng của
phương sai là (σ 1 , σ 2 ) thỏa mãn P(σ 1 < σ 2 < σ 2 ) = 1 − α .
Có hai trường hợp
• Trường hợp 1: µ đã biết
n
( X i − µ )2
Nhận xét: Nếu X là BNN có phân phối chuẩn N ( µ , σ ) thì BNN χ = ∑ 2 2
có phân phối khi
i =1 σ2
– bình phương với n bậc tự do.
n
Tính tổng ∑ (x − µ)
i =1
i
2
∑ ( xi − µ )2 ∑ (x − µ) i
2
Tính σ 1 = i =1
, σ2 = i =1
χα / 2
2
χ12−α /2
Khoảng ước lượng là (σ 1 , σ 2 ) .
• Trường hợp 1: µ chưa biết
(n − 1) S 2
Nhận xét: Nếu X là BNN có phân phối chuẩn thì BNN χ 2 = có phân phối khi – bình phương
σ2
với (n-1) bậc tự do.
Trang 36
Đặng Thục Hiền Bài giảng XS và TK
Tính s 2
Tra bảng tìm χα2 / 2 và χ12−α / 2 với (n-1) bậc tự do.
(n − 1) s 2 (n − 1) s 2
Tính σ 1 = , σ2 =
χα2 / 2 χ12−α /2
Khoảng ước lượng là (σ 1 , σ 2 )
VD 9. Mức hao phí nguyên liệu cho một đơn vị sản phẩm là một BNN X có phân phối chuẩn. Quan sát 25
sản phẩm, ta có số liệu sau
Mức ng/liệu (gr) 19,5 20 20,5
Số sản phẩm 5 18 2
Với độ tin cậy 95%, hãy ước lượng phương sai trong hai trường hợp
a. µ = 20 (gr) ; b. µ chưa biết.
VD 10. Một giống lúa mới được gieo trong 10 miếng đất thí nghiệm có các điều kiện giống nhau, sản
lượng (tính theo cùng 1 đơn vị) được cho như sau
25,4; 28; 20,1; 27,4; 25,6; 23,9; 24,8; 26,4; 27; 25,4
Coi sản lượng lúa là BNN X có phân phối chuẩn. Hãy ước lượng phương sai sản lượng với độ tin cậy
90%.
Trang 37
Đặng Thục Hiền Bài giảng XS và TK
• Khi ta chấp nhận giả thuyết H 0 , nghĩa là ta tin rằng H 0 đúng; khi bác bỏ H 0 , nghĩa là ta tin H 0 sai. Do
chỉ dựa trên một mẫu quan sát ngẫu nhiên, nên ta không thể khẳng định chắc chắn điều gì cho tổng thể.
• Trong chương này, ta chỉ xét loại kiểm định tham số (so sánh đặc trưng với 1 số, so sánh hai đặc trưng
của hai tổng thể).
1.1. Khái niệm chung
• Giả sử ta khảo sát tham số θ ∈ Θ chưa biết về đặc tính X của tổng thể, với Θ = Θ0 ∪ Θ1 và Θ0 ∩ Θ1 = ∅
• Đặt giả thuyết H 0 : θ ∈ Θ0 và đối thuyết H1 : θ ∈ Θ1 . Bài toán kiểm định giả thuyết là đưa ra tiêu chuẩn
khi nào thì chấp nhận H 0 , khi nào thì chấp nhận H1 .
Trang 38
Đặng Thục Hiền Bài giảng XS và TK
Khi thực hiện kiểm định giả thuyết, ta chỉ quan sát ngẫu nhiên một số trường hợp rồi đưa ra kết luận cho
tổng thể. Sự suy rộng này có khi đúng, có khi sai. Có hai loại sai lầm sau
• Sai lầm loại I: bác bỏ H 0 trong khi H 0 đúng và P( W | H 0 đúng) = α , α càng nhỏ thì khả năng mắc sai
lầm loại I càng ít
• Sai lầm loại II: chấp nhận H 0 trong khi H 0 sai và P( W | H 0 sai) = 1-P( W | H 0 sai) = 1- β , β càng lớn thì
xác suất mắc sai lầm loại II càng nhỏ
Mối liên hệ giữa hai loại sai lầm
• Trong kiểm định, ta luôn muốn sai lầm càng ít càng tốt. Tuy nhiên, nếu hạ thấp α thì β sẽ tăng và
ngược lại. Như vậy, trong hai loại sai lầm này, loại nào ít tác hại hơn thì ta chọn.
• Trong từng hoàn cảnh cụ thể, sai lầm này có thể tai hại hơn sai lầm kia. Chẳng hạn như, từ chối một lô
hàng tốt hay chấp nhận một lô hàng xấu đều tai hại, tuy nhiên trong lúc thiếu hàng thì việc từ chối một lô
hàng tốt (sai lầm loại 1) sẽ tai hại hơn việc chấp nhận 1 lô hàng xấu (sai lầm loại 2). Hay bệnh nhân A có
thể uống loại thuốc B, sai lầm loại 1 dẫn đến việc tìm thuốc khác cho bệnh nhân B còn sai lầm loại 2 là
cho bệnh nhân uống thuốc B, như vậy sai lầm loại 2 tai hại hơn.
• Có hai cách khống chế sai lầm, một là ấn định trước xác suất mắc sai lầm loại 1 và loại 2 rồi chọn cỡ
mẫu nhỏ nhất tương ứng với 2 mức xác suất này; hai là ấn định trước xác suất mắc sai lầm loại 1 rồi chọn
miền W sao cho xác suất mắc sai lầm loại 2 là nhỏ nhất.
• Trong thống kê, người ta thường chọn cách thứ 2 tức là chỉ xét các phép kiểm định có α không vượt
quá 1 giá trị được ấn định trước, thông thường là 1%, 3%, 5%. Giá trị α còn được gọi là mức ý nghĩa của
kiểm định.
1.3. Cơ sở lý thuyết của kiểm định
• Để giải quyết bài toán kiểm định, ta quan sát mẫu ngẫu nhiên X 1 ,..., X n và đưa ra giả thuyết H 0 .
• Từ mẫu trên, ta chọn thống kê T = f ( X 1 ,..., X n , θ0 ) sao cho khi H 0 đúng thì phân phối xác suất của T
hoàn toàn xác định.
• Với mức ý nghĩa α , ta tìm được khoảng ước lượng [a,b] cho T với độ tin cậy 1 − α .
• Khi đó
Nếu t ∈ [a, b] thì chấp nhận giả thuyết H 0 .
• Nếu đồ thị hàm mật độ T đối xứng qua trục xác suất thì ta chọn khoảng đối xứng [ − tα , tα ] với
α
P (T ≤ −tα ) = P (T ≥ tα ) =
2
Vậy khi xét nửa bên phải của trục xác suất thì ta được
Nếu t ≤ tα thì chấp nhận giả thuyết H 0 .
Trang 39
Đặng Thục Hiền Bài giảng XS và TK
• Trường hợp 1: Cỡ mẫu n > 30 (hoặc n ≤ 30 và X có phân phối chuẩn) và phương sai tổng thể σ 2 đã
biết
Tính trung bình mẫu x .
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
x − µ0 x − µ0
Tính giá trị thống kê z = = n.
σ σ
n
Nếu z ≤ zα thì ta chấp nhận H 0 nghĩa là µ =µ0 ; nếu z > zα thì ta bác bỏ H 0 tức µ ≠ µ0 .
2 2
• Trường hợp 2: Cỡ mẫu n > 30 và phương sai tổng thể σ 2 chưa biết
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
x − µ0 x − µ0
Tính giá trị thống kê z = = n.
s s
n
Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .
2 2
• Trường hợp 3: Cỡ mẫu n ≤ 30 , phương sai tổng thể σ 2 chưa biết và X có phân phối chuẩn
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
Tra bảng tìm tαn −/ 21 .
x − µ0 x − µ0
Tính giá trị thống kê t = = n.
s s
n
Nếu t ≤ tαn −1 thì ta chấp nhận H 0 ; nếu t > tαn −1 thì ta bác bỏ H 0 .
2 2
Trang 40
Đặng Thục Hiền Bài giảng XS và TK
x − µ0 x − µ0
Tính giá trị thống kê z = = n.
µ0 / n µ0
Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .
2 2
Chú ý: Trong tất cả các trường hợp bác bỏ giả thuyết H 0 , ta so sánh x và µ0
Trong trường hợp bác bỏ H 0 , nếu f > p0 thì p > p0 , nếu f < p0 thì p < p0 .
Trang 41
Đặng Thục Hiền Bài giảng XS và TK
VD 6. Tỷ lệ phế phẩm của một nhà máy là 5%, sau khi cải tiến kỹ thuật, người ta kiểm tra 400 sản phẩm
thì thấy có 16 phế phẩm. Với mức ý nghĩa 1%, hãy kết luận việc cải tiến kỹ thuật có làm giảm tỷ lệ phế
phẩm hay không?
VD 7. Khảo sát ngẫu nhiên 400 sinh viên về mức độ nghiêm túc trong giờ học thì thấy 13 sinh viên thừa
nhận có ngủ trong giờ học. Trong kiểm định giả thuyết H 0 : "Có 2% sinh viên ngủ trong giờ học" thì mức
ý nghĩa tối đa là bao nhiêu để H 0 được chấp nhận?
Bài 3. KIỂM ĐỊNH SO SÁNH HAI ĐẶC TRƯNG CỦA HAI TỔNG THỂ
3.1. So sánh hai trung bình của hai tổng thể
Xét hai đặc tính X và Y của hai tổng thể. Giả sử ta cần so sánh hai trung bình tương ứng là µ x và µ y , ta
đặt giả thuyết H 0 : µ x =µ y . Có các trường hợp sau
• Trường hợp 1: Cỡ mẫu nx > 30, n y > 30 (hoặc nx ≤ 30, n y ≤ 30 và X, Y có phân phối chuẩn) và phương
sai tổng thể σ x2 , σ y2 đã biết
x− y
Tính giá trị thống kê z = .
σ 2
σ y2
x
+
nx ny
• Trường hợp 2: Cỡ mẫu nx > 30, n y > 30 và phương sai tổng thể σ x2 , σ y2 chưa biết
x− y
Tính giá trị thống kê z = .
2
sx2 s y
+
nx n y
• Trường hợp 3: Cỡ mẫu nx ≤ 30, n y ≤ 30 , phương sai tổng thể σ x2 , σ y2 chưa biết và X, Ycó phân phối
chuẩn
(nx − 1) sx2 + (ny − 1) s y2
Tính phương sai chung của 2 mẫu s 2 =
nx + ny − 2
n + ny −2
Tra bảng tìm tα x/ 2 .
x− y
Tính giá trị thống kê t = .
1 1
s +
nx n y
n + ny − 2 n + ny −2
Nếu t ≤ tα x/ 2 thì ta chấp nhận H 0 ; nếu t > tα x/ 2 thì ta bác bỏ H 0 .
VD 1. Người ta tiến hành bón hai loại phân X, Y cho cây cà chua. Với 60 cây được bón phân X thì thu
được trung bình 32,2 quả và độ lệch chuẩn của mẫu đã hiệu chỉnh là 8,5 quả ; với 72 cây được bón phân Y
Trang 42
Đặng Thục Hiền Bài giảng XS và TK
thì thu được trung bình 28,4 quả và độ lệch chuẩn của mẫu đã hiệu chỉnh là 9,3 quả. Với mức ý nghĩa 5%,
hãy kết luận về hiệu quả của hai loại phân bón trên.
VD 2. Trọng lượng sản phẩm do hai nhà máy sản xuất là các BNN có phân phối chuẩn và có cùng độ lệch
chuẩn là 1kg. Với mức ý nghĩa 0,05, có thể xem trọng lượng trung bình của sản phẩm do hai nhà máy sản
xuất ra là như nhau hay không, nếu cân thử 25 sản phẩm của nhà máy A ta tính được trọng lượng trung
bình là 50kg, còn trọng lượng trung bình của 20 sản phẩm của nhà máy B là 50,6kg?
VD 3. Tuổi thọ của thiết bị là BNN có phân phối chuẩn. Người ta kiểm tra ngẫu nhiên tuổi thọ của 15 thiết
bị loại A thì thu được kết quả
114 ; 78 ; 96 ; 137 ; 78 ; 103 ; 126 ; 86 ; 99 ; 114 ; 72 ; 104 ; 73 ; 86; 117.
Kiểm tra tuổi thọ 17 thiết bị loại B thấy trung bình là 84 tháng và độ lệch chuẩn đã hiệu chỉnh là 19 tháng.
Hãy tìm giá trị thống kê và kết luận kiểm định giả thuyết H 0 : "Tuổi thọ trung bình của 2 loại thiết bị là
như nhau" với mức ý nghĩa 3%.
3.2. So sánh hai tỷ lệ của hai tổng thể
Xét hai tổng thể X, Y. Giả sử ta cần so sánh hai tỷ lệ tương ứng là px và p y về một tính chất A nào đó, ta
đặt giả thuyết H 0 : px = p y . Để chấp nhận hay bác bỏ H 0 , ta làm như kiểm định so sánh tỷ lệ với 1 số
mx my mx + m y
Tính tỷ lệ mẫu f x = ; fy = ; p0 =
nx ny nx + n y
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
fx − fy
Tính giá trị thống kê z = .
1 1
p0 q0 +
n n
x y
Nếu z > zα thì bác bỏ H 0 và nếu f x < f y thì px < p y ; nếu f x > f y thì px > p y
2
VD 4. Từ hai tổng thể X, Y người ta tiến hành kiểm tra 2 mẫu có kích thước nx = 1000; n y = 1200 về một
tính chất A thì được f x = 0, 27; f y = 0, 3 . Với mức ý nghĩa 9% hãy so sánh px , p y của hai tổng thể.
VD 5. Một công ty điện tử nghiên cứu thị trường về sở thích xem tivi của cư dân trong thành phố. Hỏi 400
người ở quận X thì có 270 người xem tivi ít nhất 1 giờ trong ngày, 600 người ở quận Y thì thấy có 450
người. Kiểm định giả thuyết "Tỷ lệ cư dân xem tivi ít nhất 1 giờ trong 1 ngày của 2 quận X và Y là như
nhau", mức ý nghĩa tối đa để giả thuyết này được chấp nhận là bao nhiêu?
VD 6. Trước bầu cử, người ta thăm dò 1000 cử tri thì thấy có 400 người nói sẽ bỏ phiếu cho ông A ; còn 1
tuần nữa đến ngày bầu cử thì thấy có 680 người trong 1500 cử tri nói sẽ bỏ phiếu cho ông A. Kiểm định
giả thuyết "Tỷ lệ cử tri bỏ phiếu cho ông A ở hai lần khảo sát là như nhau", với mức ý nghĩa 5% có giá trị
thống kê là bao nhiêu và hãy kết luận về giả thuyết?
Trang 43
Đặng Thục Hiền Bài giảng XS và TK
giả thuyết H 0 : “Trọng lượng trung bình mỗi bao gạo của nhà máy này là 50kg” có giá trị thống kê và kết
luận là
a. z = 1, 7205 , chấp nhận H 0 với mức ý nghĩa 6%.
b. z = 1, 7205 , bác bỏ H 0 , trọng lượng trung bình thực tế mỗi bao gạo nhỏ hơn 50kg với mức ý nghĩa 6%.
d. z = 1, 9732 , bác bỏ H 0 , trọng lượng trung bình thực tế mỗi bao gạo nhỏ hơn 50kg với mức ý nghĩa 4%.
ĐS: a
Bài 2: Người ta kiểm tra ngẫu nhiên 38 cửa hàng của công ty A và có bảng doanh thu trong 1 tháng là
Doanh thu (triệu/tháng) 200 220 240 260
Số của hàng 8 16 12 2
Kiểm định giả thuyết H 0 : "Doanh thu trung bình hàng tháng của mỗi của hàng của công ty A là 230 triệu
đồng", mức ý nghĩa tối đa để giả thuyết H 0 được chấp nhận là bao nhiêu? ĐS: α max = 3, 4%
Bài 3: Điểm trung bình môn Toán của sinh viên năm trước là 5,72. Năm nay, theo dõi 100 sinh viên thu
được số liệu
Điểm 3 4 5 6 7 8 9
Số sv 3 5 27 43 12 6 4
Hãy tìm mức ý nghĩa tối đa để giả thuyết "Điểm trung bình môn Toán của sinh viên trong 2 năm là bằng
nhau" được chấp nhận. ĐS: α max = 13, 62%
Bài 4: Chiều cao cây giống X trong một vườn ươm là BNN có phân phối chuẩn. Người ta đo ngẫu nhiên
25 cây giống này và thu được bảng số liệu
X (m) 0,8 0,9 1 1,1 1,2 1,3
Số cây 1 2 9 7 4 2
Theo quy định của vườn ươm, khi nào chiều cao trung bình của cây hơn 1m thì đem ra trồng. Với mức ý
nghĩa 5%, kiểm định giả thuyết H 0 "Cây giống trung bình của vườn ươm cao trung bình 1m" có giá trị
thống kê là bao nhiêu và kết luận như thế nào về H 0 ? ĐS: Bác bỏ H 0 và có thể đem cây ra trồng.
Bài 5: Để kiểm tra một loại súng thể thao, người ta cho bắn 1000 viên đạn vào một tấm bia thì có 670 viên
trúng mục tiêu. Sau đó, người ta cải tiến kỹ thuật và cho kiểm tra lại thì thấy tỷ lệ bắn trúng mục tiêu lúc
này là 70%. Trong kiểm định giả thuyết H 0 "tỷ lệ bắn trúng của loại súng thể thao này trước cải tiến là
70%" với mức ý nghĩa 3% có giá trị thống kê và kết luận là
a. z = 2, 0702 và cải tiến kỹ thuật là tốt. b. z = 2, 0702 và cải tiến kỹ thuật là chưa tốt.
c. z = 2, 0716 và cải tiến kỹ thuật là tốt. d. z = 2, 0716 và cải tiến kỹ thuật là chưa tốt.
ĐS: b
Bài 6: Trọng lượng trung bình khi xuất chuồng ở một trại chăn nuôi gà công nghiệp năm trước là
2,8kg/con. Năm nay người ta sử dụng một loại thức ăn mới và cân thử 25 con khi xuất chuồng thì thu
được trọng lượng trung bình là 3,2kg/con với độ lệch chuẩn 0,5kg.
a. Với mức ý nghĩa 5%, hãy kết luận về tác dụng của loại thức ăn này (có làm tăng trọng lượng trung
bình của gà hay không)
b. Nếu trại báo cáo trọng lượng trung bình khi xuất chuồng là 3,3kg/con thì có chấp nhận được
không? (Với mức ý nghĩa 5%)
Trang 44
Đặng Thục Hiền Bài giảng XS và TK
Trang 45