Professional Documents
Culture Documents
Baigiang 4slide
Baigiang 4slide
Nội dung
* Học phần bao gồm 45 tiết, với 6 chương như sau:
Tôn Thất Tú - 2021 Chương 1: Xác suất 1/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 2/51
Chương 1: Xác suất - Quy tắc cộng: Công việc A có m phương án thực hiện.
* Phương án 1: có n1 cách
1. Kiến thức về tổ hợp * Phương án 2: có n2 cách
..............................
- Số hoán vị của một tập n phần tử:
* Phương án m: có nm cách
Pn = n! Số cách thực hiện công việc A:
- Số cách chọn k phần tử (không thứ tự) trong tập n phần tử: n1 + n2 + ... + nm
n! - Quy tắc nhân: Công việc A được thực hiện qua m giai đoạn liên tiếp.
Cnk = * Giai đoạn 1: có n1 cách
k!(n − k)!
* Giai đoạn 2: có n2 cách
- Số cách chọn k phần tử (có thứ tự) trong tập n phần tử: ..............................
* Giai đoạn m: có nm cách
n! Số cách thực hiện công việc A:
Akn =
(n − k)!
n1 ∗ n2 ∗ ... ∗ nm
Tôn Thất Tú - 2021 Chương 1: Xác suất 3/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 4/51
Ví dụ 1
2. Không gian mẫu và biến cố
Một nhóm có 10 học sinh, trong đó có 6 nam và 4 nữ. Hỏi có bao nhiêu cách:
a) Xếp thành 1 hàng dọc. a. Định nghĩa
b) Chọn một nhóm có 4 học sinh đều có nam và nữ với số lượng khác nhau. - Thí nghiệm ngẫu nhiên: thí nghiệm mà ta có thể lặp lại nhiều lần trong cùng điều kiện
c) Chọn một nhóm có 4 học sinh trong đó có ít nhất một nữ. nhưng kết quả không thể dự đoán trước.
Đáp số: a) 10! b) C61 C43 + C63 C41 c) C10
4
− C64 - Không gian mẫu: Tập tất cả các kết quả, kí hiệu Ω.
Ví dụ 2
Ví dụ 3
Một biển số xe được cấu tạo từ 5 chữ số. Hỏi có bao nhiêu biển số có:
Gieo 1 đồng xu, rút một lá bài trong bộ bài, đo nhiệt độ không khí tại thời điểm 9h
a) Các chữ số khác nhau.
sáng, chọn ngẫu nhiên 1 sinh viên và đo chiều cao,... là các thí nghiệm ngẫu nhiên
b) Ít nhất 2 chữ số giống nhau.
c) Có đúng 3 chữ số giống nhau.
Ví dụ 4
Đáp số: a) A510 b) 105 − A510
c) Được tính qua 3 giai đoạn: X Gieo 1 đồng xu: Ω = {S, N }
- Gđ 1: Chọn 3 vị trí trong 5 vị trí: C53 X Chọn ngẫu nhiên 1 ngày trong tháng 1: Ω = {1, 2, ..., 31}
- Gđ 2: Chọn 1 chữ số giống nhau cho 3 vị trí trên: C10
1
X Do nhiệt độ không khí tại thời điểm 9h sáng: Ω = (−∞, +∞)
- Gđ 3: chọn 2 chữ số còn lại (không phân biệt): 92
Vậy, theo quy tắc nhân: C53 C10 9 cách.
1 2
Tôn Thất Tú - 2021 Chương 1: Xác suất 5/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 6/51
X Tập các kết quả thuận lợi cho A: {SN, N S, SS}. Lúc đó, ta biểu diễn biến cố A:
- Biến cố : hiện tượng có thể xảy ra hoặc không xảy ra trong thí nghiệm ngẫu nhiên. Kí
hiệu: A,B,C, ... A = {SN, N S, SS},
- Kết quả thuận lợi cho biến cố A: kết quả xảy ra kéo theo biến cố A xảy ra.
- Mỗi biến cố được đồng nhất với tập các kết quả thuận lợi của nó. Lúc đó, mỗi biến tức A là một tập con của Ω.
cố là một tập con của không gian mẫu. X Khi thực hiện phép thử, nếu xảy ra ít nhất một trong các kết quả (của A): «SS»,
- Biến cố A được xem là xảy ra nếu có ít nhất một kết quả trong A xuất hiện. «SN», «NS» thì ta bảo biến cố A xảy ra.
- Biến cố sơ cấp: biến cố mà tập các kết quả thuận lợi chỉ gồm 1 phần tử. X Các biến cố {SS}, {SN }, {N S}, {N N } là các biến cố sơ cấp.
- Không gian mẫu: Không gian các biến cố sơ cấp.
Ví dụ 6
Ví dụ 5
Tung ngẫu nhiên đồng xu cho đến khi có mặt sấp xuất hiện. Khi đó:
Tung ngẫu nhiên 2 đồng xu. Lúc đó:
X Không gian mẫu: Ω = {SS, SN, N S, N N } Ω = {S, N S, N N S, N N N S, ...}
X Hiện tượng (sự kiện) "Có mặt sấp xuất hiện" là biến cố ngẫu nhiên. Kí hiệu A.
X Giả sử khi thực hiện, kết quả «SN» xuất hiện. Điều này kéo theo biến cố A xảy ra. Lúc đó, ta có biến cố:
Kết quả «SN» được gọi là kết quả thuận lợi cho biến cố A. - dừng sau không quá 3 lần tung: A = {S, N S, N N S}
- thực hiện ít nhất 2 lần tung: B = {N S, N N S, N N N S, N N N N S, ....}
Tôn Thất Tú - 2021 Chương 1: Xác suất 7/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 8/51
Các biến cố đặc biệt:
- Biến cố không thể (∅): là biến cố không thể xảy ra - Hợp của n biến cố Ai , kí hiệu A1 ∪ A2 ∪ ... ∪ An , là biến cố xảy ra nếu ít nhất một
- Biến cố chắc chắn (Ω): là biến cố luôn xảy ra trong các biến cố Ai xảy ra.
Chẳng hạn, gieo ngẫu nhiên 2 con xúc xắc. Lúc đó: - Hai biến cố A và B được gọi là xung khắc nếu chúng không đồng thời xảy ra.
- biến cố "tổng số chấm xuất hiện lớn hơn 12" là biến cố không thể. Nhận xét:
- biến cố "tổng số chấm xuất hiện lớn hơn 1" là biến cố chắc chắn. - Hai biến cố A và B xung khắc khi và chỉ khi AB = ∅.
- Hai biến cố đối nhau thì xung khắc với nhau, nhưng điều ngược lại nói chung là không
b. Các phép toán trên biến cố đúng.
Cho hai biến cố A và B. Khi đó:
- Biến cố đối của A, kí hiệu Ā hoặc Ac , xác định: Ā = Ω\A (là biến cố xảy ra nếu A Ví dụ 7
không xảy ra) Chọn ngẫu nhiên một chữ số từ 0 đến 9.
- Giao của A và B, kí hiệu A ∩ B, AB, xác định AB = {x : x ∈ A, x ∈ B} (là biến cố Ta có Ω = {0, 1, 2, ..., 9}.
xảy ra nếu A và B đồng thời xảy ra). Xét 3 biến cố A = {0, 2, 4}, B = {4, 5, 6} và C = {7, 8, 9}.
- Giao của n biến cố Ai , kí hiệu A1 ∩ A2 ∩ ... ∩ An , là biến cố xảy ra nếu đồng thời các Lúc đó:
biến cố Ai cùng xảy ra. • A ∩ B = {4}, A ∪ B = {0, 2, 4, 5, 6}, Ā = {1, 3, 5, 6, 7, 8, 9}
- Hợp của A và B, kí hiệu A ∪ B, xác định A ∪ B = {x : x ∈ A hoặc x ∈ B} (là biến • A và C xung khắc vì A ∩ C = ∅ nhưng A và C không phải là hai biến cố đối nhau.
cố xảy ra nếu ít nhất A hoặc B xảy ra)
Tôn Thất Tú - 2021 Chương 1: Xác suất 9/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 10/51
Tôn Thất Tú - 2021 Chương 1: Xác suất 11/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 12/51
Định nghĩa (quan điểm cổ điển):
Cho thí nghiệm với n(Ω) < +∞ kết quả đồng khả năng, trong đó có n(A) kết quả
Định nghĩa (quan điểm thống kê): thuận lợi cho biến cố A. Khi đó, xác suất của biến cố A, kí hiệu P (A), được xác định:
Xét biến cố A. Thực hiện phép thử n lần thì có m lần xuất hiện biến cố A. Khi đó tỉ số n(A)
fn = m/n được gọi là tần suất xuất hiện A. Khi số phép thử tăng lên vô hạn, tần suất P (A) =
n(Ω)
fn sẽ tiến đến một hằng số xác định. Hằng số này được gọi là xác suất của biến cố A.
Vì thế, trong thực tế khi số phép thử n lớn, ta có thể xem tần suất fn như là xác suất Ví dụ 10
của xuất hiện biến cố A.
Trong một hộp có 6 bi đen và 4 bi trắng. Lấy ngẫu nhiên 4 viên. Tìm xác suất lấy được
cả hai loại bi.
Ví dụ 9
Có 1000 người có triệu chứng A đến cơ sở y tế để khám bệnh. Kết quả có thấy 700 Giải.
mắc bệnh X. Ta có f = 700/1000 = 70%. Do đó, ta có cơ sở dự đoán nếu một người Gọi A là biến cố "lấy được cả hai loại bi".
có triệu chứng A thì xác suất mắc bệnh X xấp xỉ 70%. Số trường hợp đồng khả năng: n(Ω) = C10 4 .
Tôn Thất Tú - 2021 Chương 1: Xác suất 15/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 16/51
Ví dụ 13
Định nghĩa (quan điểm hình học): Tính xác suất khi lấy ngẫu nhiên một điểm M trong hình vuông có độ dài cạnh bằng
Cho miền Ω đo được (trên đường thẳng, trong mặt phẳng, không gian ba chiều, ...) và 2m thì điểm này rơi vào hình tròn nội tiếp hình của vuông.
miền con S đo được của Ω. Ta lấy ngẫu nhiên một điểm trong miền Ω và đặt A là biến
cố M ∈ S. Khi đó, xác suất của biến cố A được xác định như sau:
P (A) =
m(S)
, Giải. Dễ thấy:
m(Ω) - Diện tích hình tròn: m(S) = π(m2 )
- Diện tích của hình vuông: m(Ω) = 4(m2 )
trong đó m(S), m(Ω) là số đo của miền S và Ω. Cụ thể, Theo quan điểm hình học, xác suất của biến
- Nếu Ω là đường cong hay đoạn thẳng thì m(·) là hàm chỉ độ dài. cố A cần tìm:
- Nếu Ω là hình phẳng hay mặt cong thì m(·) là hàm chỉ diện tích.
- Nếu Ω là hình khối 3 chiều thì m(·) là hàm chỉ thể tích. m(S) π
P (A) = =
- ... m(Ω) 4
Tôn Thất Tú - 2021 Chương 1: Xác suất 17/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 18/51
Tính chất
i) P (∅) = 0, P (Ω) = 1 P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + ... + P (An )
ii) 0 ≤ P (A) ≤ 1, ∀A
X
− P (Ai Aj )
iii) Nếu A ⊂ B thì P (A) ≤ P (B) i<j
iv) Công thức cộng: Khi các biến cố xung khắc đôi một thì
X
+ P (Ai Aj Ak )
i<j<k
P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + ... + P (An )
......
Nói riêng: (−1)n−1 P (A1 A2 ...An )
P (A) + P (Ā) = 1
Tổng quát: Ví dụ 14
Một lô hàng có 15 thiết bị, trong đó có 6 thiết do nhà máy X sản xuất và 9 thiết bị do
P (A ∪ B) = P (A) + P (B) − P (AB) nhà máy Y sản xuất. Người ta chọn ngẫu nhiên 4 thiết bị để kiểm tra. Tính xác suất:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (AB) − P (BC) − P (AC) + P (ABC) a. Cả 4 thiết bị được chọn do cùng nhà máy sản xuất
b. Có ít nhất một thiết bị được chọn do nhà máy X sản xuất.
Tôn Thất Tú - 2021 Chương 1: Xác suất 19/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 20/51
Giải.
Ví dụ 15
a. Gọi AX , AY là các biến cố các thiết bị được chọn do nhà máy X, Y sản xuất. Ta có
Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết tiếng Anh, 12 sinh viên biết tiếng
AX , AY xung khắc.
Pháp và 7 sinh viên biết cả hai thứ tiếng. Chọn ngẫu nhiên một sinh viên. Tìm xác suất
Xác suất cả 4 thiết bị được chọn do cùng nhà máy sản xuất:
để sinh viên đó biết ít nhất một ngoại ngữ.
C64 C4
P (AX ∪ AY ) = P (AX ) + P (AY ) = 4 + 49 Giải.
C15 C15
Gọi A, B là biến cố chọn được sinh viên biết tiếng Anh, Pháp.
b. Gọi B là biến cố có ít nhất một thiết bị được chọn do nhà máy X sản xuất. Ta có: Lúc đó, xác suất cần tìm:
Tôn Thất Tú - 2021 Chương 1: Xác suất 21/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 22/51
Tôn Thất Tú - 2021 Chương 1: Xác suất 23/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 24/51
Định nghĩa: Ví dụ 17
Cho hai biến cố A và B với P (B) > 0. Khi đó, xác suất có điều kiện của A với điều kiện Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu dự án A và B tương ứng là
biến cố B đã xảy ra, kí hiệu P (A|B), xác định như sau: 0,6 và 0,7. Xác suất thắng thầu đồng thời cả 2 dự án là 0,5. Tính xác suất:
a) Công ty thắng thầu dự án A biết đã thắng thầu dự án B.
P (AB) b) Công ty không thắng thầu dự án B biết đã thắng thầu dự án A.
P (A|B) =
P (B)
Giải. Gọi A, B là các biến cố công ty thắng dự án A, B. Theo giả thiết:
Tính chất:
i. 0 ≤ P (A|B) ≤ 1 P (A) = 0, 6; P (B) = 0, 7; P (AB) = 0, 5
ii. P (Ā|B) = 1 − P (A|B)
a. P (A|B) = P (AB)/P (B) = 5/7
iii. P (A ∪ B|C) = P (A|C) + P (B|C) − P (AB|C) b. P (B̄|A) = 1 − P (B|A) = 1 − P (AB)/P (A) = 1 − 5/6 = 1/6.
Tôn Thất Tú - 2021 Chương 1: Xác suất 25/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 26/51
Bình luận. Ta có: P (A|B) = 5/7 > P (A) = 0, 6. Như vậy, việc biết biến cố B xảy ra
đã làm tăng xác suất xảy ra biến cố A, hay nói cách khác, việc thắng dự án B là có lợi Ví dụ 18
cho quá trình đấu thầu dự án A.
Có 15 thanh RAM, trong đó có 3 thanh bị hỏng. Chọn ngẫu nhiên 4 thanh.
a. Tính xác suất có ít nhất 1 thanh bị hỏng được chọn.
Nhận xét
b. Biết chọn được ít nhất 1 thanh hỏng, tính xác suất chọn đúng 2 thanh bị hỏng.
Trong một số trường hợp, xác suất có điều kiện P (A|B) có thể được tính dựa vào việc
"đếm trực quan", tức là ta thu hẹp tập các kết quả sau khi biến cố B xảy ra và đếm lại Giải. Gọi A, B là các biến cố chọn được ít nhất 1 thanh hỏng, chọn được đúng 2 thanh
số kết quả đồng khả năng, số kết quả thuận lợi để tính xác suất có điều kiện. hỏng.
a. P (A) = 1 − P (Ā) = 1 − C124 /C 4
Chẳng hạn, ta quay lại với ví dụ về tivi Sony và LG. Vì biết chọn được tivi LG nên tập
15
b. P (B|A) = P (AB)/P (A) = P (B)/P (A), trong đó P (B) = C32 C12 2 /C 4 .
15
kết quả thu hẹp về 20 tivi LG. Chỉ có 5 tivi LG bị hỏng, nên xác suất chọn được tivi
hỏng khi biết đó là tivi bằng 5/20=1/4.
Tôn Thất Tú - 2021 Chương 1: Xác suất 27/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 28/51
Ví dụ 19
5. Công thức nhân xác suất
Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu lần lượt là 0.7 và 0.4. Nếu
Cho hai biến cố A và B với P (A) > 0. Khi đó: dự án A đã thắng thầu thì xác suất thắng tiếp dự án B là 0.4. Tính xác suất:
a. Công ty thắng ít nhất một dự án.
P (AB)
P (B|A) = ⇒ P (AB) = P (A)P (B|A) b. Công ty chỉ thắng dự án A.
P (A) c. Thắng đúng 1 dự án.
Tương tự, ta sẽ có:
Giải. Gọi A, B là biến cố công ty thắng dự án A, B. Ta có:
P (AB) = P (A)P (B|A) = P (B)P (A|B)
P (A) = 0, 7; P (B) = 0, 4, P (B|A) = 0, 4
Tổng quát: Cho n biến cố Ai với P (A1 A2 ...An−1 ) > 0. Khi đó:
a. P (A ∪ B) = P (A) + P (B) − P (AB) = P (A) + P (B) − P (A)P (B|A) = 0, 7 + 0, 4 −
P (A1 A2 ...An ) = P (A1 ).P (A2 |A1 ).P (A3 |A1 A2 )....P (An |A1 ...An−1 ) 0, 7 ∗ 0, 4 = 0, 82
b. P (AB̄) = P (A)P (B̄|A) = P (A)[1 − P (B|A)] = 0, 7[1 − 0, 4] = 0, 42
c. P (AB̄ ∪ ĀB) = P (AB̄) + P (ĀB) = . . .
Tôn Thất Tú - 2021 Chương 1: Xác suất 29/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 30/51
Tôn Thất Tú - 2021 Chương 1: Xác suất 31/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 32/51
Ví dụ 22
Ví dụ 21
Nước được cấp từ E đến F qua 3 trạm
Một nồi hơi có 3 van bảo hiểm hoạt động độc lập với xác suất hỏng của van 1, van 2, Một trạm cấp nước như hình vẽ:
bơm tăng áp A, B, C. Các trạm bơm
van 3 trong khoảng thời gian T tương ứng là 0,1; 0,2; 0,3. Nồi hơi hoạt động an toàn làm việc độc lập với nhau. Xác suất để
nếu có ít nhất một van không hỏng. Tính xác suất để nồi hơi hoạt động an toàn trong các trạm này có sự cố sau một thời gian
khoảng thời gian T. làm việc lần lượt là 0.1, 0.1, 0.05. Tính
xác suất để vùng F bị mất nước.
Giải. Gọi Ai là biến cố van i bị hỏng trong khoảng thời gian T, i = 1, 2, 3.
Ta có A1 , A2 , A3 độc lập và Giải. Gọi A,B,C là các biến cố trạm bơm A,B,C bị sự cố.
Ta có: A,B,C là các biến cố độc lập và
P (A1 ) = 0, 1; P (A2 ) = 0, 2; P (A3 ) = 0, 3
P (A) = 0, 1; P (B) = 0, 1; P (C) = 0, 05
Xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T:
Xác suất vùng F bị mất nước:
P (Ā1 ∪ Ā2 ∪ Ā3 ) = 1 − P (A1 A2 A3 ) = 1 − P (A1 )P (A2 )P (A3 ) = 0, 994
P (AB ∪ C) = P (AB) + P (C) − P (ABC) = P (A)P (B) + P (C) − P (A)P (B)P (C)
Tôn Thất Tú - 2021 Chương 1: Xác suất 33/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 34/51
Tôn Thất Tú - 2021 Chương 1: Xác suất 35/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 36/51
Ví dụ 26
Công thức trên được gọi là công thức xác suất đầy đủ ( hay công thức xác suất toàn
phần). Một nhóm có 3 người nhưng chỉ có 2 vé xem bóng đá. Để chia vé họ làm như sau: Lấy
Nói riêng, ta có P (B) = P (A).P (B|A) + P (A).(B|A) với 0 < P (A) < 1 . 3 phiếu, 2 phiếu ghi số 1 và 1 phiếu ghi số 0. Sau đó thay phiên nhau bốc ngẫu nhiên
lần lượt không hoàn lại. Ai được phiếu ghi số 1 thì được vé.
a. Tính xác suất người thứ 2 được vé.
Ví dụ 25
b. Hỏi việc bốc phiếu đó có công bằng hay không ?
Có 2 lô sản phẩm. Lô 1 có 50 sản phẩm trong đó có 20 sản phẩm xấu. Lô 2 có 40 sản
phẩm, trong đó có 15 sản phẩm xấu. Lấy ngẫu nhiên một lô và từ đó lấy ra 1 sản phẩm. Giải. Gọi Ai là biến cố người rút thứ i được vé,i = 1, 2, 3.
Tìm xác suất để sản phẩm lấy ra là sản phẩm tốt. a. Ta có {A1 , Ā1 } là nhóm đầy đủ. Do đó:
Giải. Gọi Hi là chọn lô sản phẩm i, i = 1, 2. Gọi A là biến cố sản phẩm lấy ra là sản P (A2 ) = P (A1 )P (A2 |A1 ) + P (Ā1 )P (A2 |Ā1 ) = 2/3 ∗ 1/2 + 1/3 ∗ 2/2 = 2/3
phẩm tốt.
Ta có {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần: b. Ta có P (A1 ) = P (A2 ) = 2/3, cần tính P (A3 ). Mặt khác,
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 1/2 ∗ 30/50 + 1/2 ∗ 25/40 = 49/80 P (A3 ) = 1 − P (Ā3 ) = 1 − P (A1 A2 ) = 1 − P (A1 )P (A2 |A1 ) = 1 − 2/3 ∗ 1/2 = 2/3
Ví dụ 27
Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15. Do có nhiễu
Ý nghĩa công thức xác suất toàn phần trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B; còn 1/8 tín
Công thức xác suất toàn phần giúp ta tính xác suất xảy ra của một biến cố dựa vào hiệu B bị méo và thu được như A.
một nhóm đầy đủ các giả thiết chi phối nó. a. Tìm xác suất thu được tín hiệu A.
b. Giả sử đã thu được tín hiệu A. Tìm xác suất thu được đúng tín hiệu lúc phát.
Định lý (Công thức Bayes)
Giải. Gọi HA , HB là biến cố trạm phát tín hiệu A, B. Gọi A là biến cố trạm thu được
Cho A là một biến cố và P (A) > 0, {H1 , ..., Hn } là một nhóm biến cố đầy đủ. Lúc đó, tín hiệu A.
ta có công thức: a. Ta có: {HA , HB } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần:
P (Hi ).P (A|Hi ) P (Hi ).P (A|Hi )
P (Hi |A) = = n , i = 1, n P (A) = P (HA )P (A|HA ) + P (HB )P (A|HB ) = 0, 85 ∗ (1 − 1/7) + 0, 15 ∗ 1/8 = 0, 747
P (A) P
P (Hj ).P (A|Hj )
j=1 b. Theo công thức Bayes:
Tôn Thất Tú - 2021 Chương 1: Xác suất 39/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 40/51
Ví dụ 28
Một cửa hàng bán bóng đèn cùng loại do 3 cơ sở sản xuất cung cấp. Cơ sở I, II, III
cung cấp lượng hàng tương ứng là 40%, 35%, 25%. Biết tỉ lệ bóng hỏng do cơ sở I, II,
III sản xuất lần lượt là 2%, 2%, 3%. Ta mua ngẫu nhiên 1 bóng của cửa hàng. Giả sử Ý nghĩa công thức Bayes
bóng mua bị hỏng. Hỏi bóng ta mua có khả năng do cơ sở nào sản xuất nhất ?
Các xác suất P (H1 ), ..., P (Hn ) được xác định trước khi phép thử tiến hành và do đo
Giải. Gọi Hi là biến cố bóng được mua do cơ sở i sản xuất, i = 1, 2, 3. Gọi A là biến chúng được gọi là các xác suất tiên nghiệm. Các xác suất P (H1 |A), ..., P (Hn |A) được
cố bóng được mua bị hỏng. xác định sau khi phép thử được tiến hành và biến cố A đã xảy ra và do do chúng được
Ta có: {H1 , H2 , H3 } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần: gọi là các xác suất hậu nghiệm. Vì thế công thức Bayes còn được gọi là công thức tính
xác suất hậu nghiệm.
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) + P (H3 )P (A|H3 ) * Công thức Bayes cho phép đánh giá lại xác suất xảy ra của các giả thiết sau khi đã
= 0, 4 ∗ 0, 02 + 0, 35 ∗ 0, 02 + 0, 25 ∗ 0, 03 = 0.0225 biết kết quả của phép thử là biến cố A đã xảy ra.
P (H1 )P (A|H1 ) 0, 4 ∗ 0, 02
Theo công thức Bayes: P (H1 |A) = = = 0.356
P (A) 0.0225
Tương tự: P (H2 |A) = 0.311, P (H3 |A) = 0.333
Vì P (H1 |A) > P (H3 |A) > P (H2 |A) nên khả năng bóng được mua do cơ sở 1 sản xuất
là lớn nhất.
Tôn Thất Tú - 2021 Chương 1: Xác suất 41/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 42/51
Ví dụ 29 Ví dụ 30
Tỉ lệ người dân ở tỉnh A nghiện thuốc lá là 30%, trong số người nghiện thuốc tỉ lệ người Một máy bay bắn độc lập 2 quả tên lửa vào một mục tiêu. Xác suất quả thứ nhất và
bị bệnh phổi là 60%. Trong số những người không nghiện thuốc có 20% bị bệnh phổi. thứ 2 trúng là 0,6 và 0,7. Nếu có 1 quả trúng thì mục tiêu bị tiêu diệt với xác suất 0,7
Chọn ngẫu nhiên một người. Tính xác suất người đó nghiện thuốc trong hai trường hợp. và nếu có 2 quả trúng thì xác suất này là 0,9.
a) Biết người đó bị bệnh phổi. a) Tính xác suất có ít nhất 1 quả trúng. b) Tính xác suất mục tiêu bị tiêu diệt.
b) Biết người đó không bị bệnh phổi. c) Biết mục tiêu bị tiêu diệt, tính xác suất cả 2 quả đều trúng.
Giải. Gọi H1 , H2 là các biến cố người được chọn hút và không hút thuốc lá. Gọi A là Giải. Gọi Ai là biến cố quả tên lửa thứ i trúng mục tiêu, i = 1, 2. Ta có A1 , A2 độc lập.
biến cố người được chọn bị bệnh phổi. a. P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 A2 ) = 0, 6 + 0, 7 − 0, 6 ∗ 0, 7 = 0, 88
b. Gọi Hi là biến cố có i quả tên lửa trúng, i = 0, 1, 2, và A là biến cố mục tiêu bị tiêu diệt. Ta
Ta có: {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần:
có {H0 , H1 , H2 } là nhóm đầy đủ.
P (H0 ) = P (Ā1 Ā2 ) = 0, 4 ∗ 0, 3 = 0, 12; P (H1 ) = P (A1 Ā2 ∪ Ā1 A2 ) = 0, 6 ∗ 0, 3 + 0, 4 ∗ 0, 7 =
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 0, 3 ∗ 0, 6 + 0, 7 ∗ 0, 2 = 0, 32
0, 46; P (H2 ) = P (A1 A2 ) = 0, 6 ∗ 0, 7 = 0, 42.
P (H1 )P (A|H1 ) 0, 3 ∗ 0, 6 Theo công thức xác suất toàn phần:
a. P (H1 |A) = = = 9/16 P (A) = P (H0 )P (A|H0 ) + P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )
P (A) 0, 32 = 0, 12 ∗ 0 + 0, 46 ∗ 0, 7 + 0, 42 ∗ 0, 9 = 0, 7
P (H1 )P (Ā|H1 ) 0, 3 ∗ (1 − 0, 6) P (H2 )P (A|H2 ) 0, 42 ∗ 0, 9
b. P (H1 |Ā) = = = 3/17 c. P (H2 |A) = = = 0, 54
P (Ā) 1 − 0, 32 P (A) 0, 7
Tôn Thất Tú - 2021 Chương 1: Xác suất 43/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 44/51
Ví dụ 31 8. Dãy phép thử Bernoulli
Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có
đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là p(%). Thiết bị có khả năng Định nghĩa
phát hiện đúng sản phẩm là phế phẩm với xác suất α và phát hiện đúng sản phẩm đạt
Dãy n phép thử được gọi là dãy n phép thử Bernoulli nếu thỏa mãn các điều kiện sau:
chất lượng với xác suất β. Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho
- Các phép thử độc lập
sản phẩm này:
- Trong mỗi phép thử chỉ xảy ra một trong hai biến cố, kí hiệu A (thành công) và Ā
a. Được kết luận là phế phẩm.
(thất bại).
b. Được kết luận là đạt chất lượng thì lại là phế phẩm.
- Xác suất xuất hiện biến cố A là p = P (A) không đổi trong các phép thử.
c. Được kết luận đúng với thực chất của nó.
Gợi ý. Gọi H1 , H2 là biến cố sản phẩm được chọn là chính phẩm, phế phẩm. Gọi A Công thức xác suất nhị thức
là biến cố được kết luận là phế phẩm. Ta có {H1 , H2 } là nhóm đầy đủ, P (H2 ) = Kí hiệu pn (k) là xác suất có đúng k lần xuất hiện biến cố A trong dãy n phép thử
p, P (A|H2 ) = α, P (Ā|H1 ) = β. Bernoulli. Khi đó:
a. P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = (1 − p)(1 − β) + pα pn (k) = Cnk pk (1 − p)n−k , k = 0, n.
b. P (H1 |A)
c. P (AH2 ) + P (ĀH1 ) Công thức trên còn được gọi là công thức Bernoulli.
Tôn Thất Tú - 2021 Chương 1: Xác suất 45/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 46/51
Ví dụ 32 Giải.
Ta có mô hình dãy phép thử Bernoulli với n = 3; p = 0, 4.
Xác suất để 1 quả trứng đem ấp nở ra gà con là 0.85. Đem ấp 10 quả trứng. Tính xác a. Xác suất để nguồn thu nhận được thông tin đúng 2 lần:
suất để có đúng 8 quả nở ra gà con.
p3 (2) = C32 0, 42 0, 61
Giải. Ta có mô hình dãy phép thử Bernoulli với n = 10; p = 0, 85.
Xác suất có đúng 8 quả nở ra gà con: b. Xác suất để nguồn thu nhận được thông tin đó:
8
p10 (8) = C10 0, 858 0, 152 p3 (k ≥ 1) = 1 − p3 (0) = 1 − C30 0, 40 0, 63
Giải. Gọi Hi là biến cố xạ thủ chọn được súng loại i, i = 1, 2 và A là biến cố xạ thủ Giải. Gọi T, L là các biến cố sinh thi trượt môn Toán, Lý tương ứng. Ta có:
bắn trúng 2 viên. Ta có {H1 , H2 } là nhóm đầy đủ.
Theo công thức xác suất toàn phần: P (T ) = 0, 34; P (L) = 0, 2; P (L|T ) = 0, 5
Xác suất thi đậu cả 2 môn:
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )
P (T̄ L̄) = 1 − P (T ∪ L) = 1 − [P (T ) + P (L) − P (T L)]
trong đó: = 1 − P (T ) − P (L) + P (T )P (L|T ) = 1 − 0, 34 − 0, 2 + 0, 34 ∗ 0, 5 = 0, 63
P (H1 ) = 4/10 = 0, 4; P (H2 ) = 6/10 = 0, 6
Gọi n là số sinh viên cần khảo sát. Ta có mô hình Bernoulli với n phép thử và xác suất
p = 0, 63. Theo giả thiết:
P (A|H1 ) = p5 (2) = C52 0, 62 0, 43 ; P (A|H2 ) = p5 (2) = C52 0, 32 0, 73
pn (k ≥ 1) = 1 − pn (0) ≥ 0, 99 ⇔ (1 − 0, 63)n ≤ 0, 01 ⇔ n ≥ 4, 63 ⇒ n = 5
Tôn Thất Tú - 2021 Chương 1: Xác suất 49/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 50/51
Ví dụ 36
Một xưởng dệt có 50 máy dệt. Xác suất mỗi máy dệt bị hỏng trong mỗi ca làm việc là
0.1. Tìm số máy hỏng với khả năng lớn nhất trong 1 ca làm việc.
Tôn Thất Tú
Giải. Gọi K là số máy hỏng với khả năng lớn nhất. Ta có mô hình Bernoulli với n =
50; p = 0, 1.
Lại có: q = 1 − p = 0, 9. Giá trị K thỏa điều kiện: Đà Nẵng, 2021
np − q ≤ K ≤ np − q + 1 ⇔ 4, 1 ≤ K ≤ 5, 1
Vậy, K = 5.
Tôn Thất Tú - 2021 Chương 1: Xác suất 51/51 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 1/88
Chương 2. Biến ngẫu nhiên
1. Định nghĩa Phân loại
- Biến ngẫu nhiên X là một đại lượng có thể nhận giá trị này hay giá trị khác phụ thuộc - BNN rời rạc: BNN có tập giá trị có số lượng hữu hạn hoặc vô hạn đếm được.
vào kết quả của phép thử ngẫu nhiên. - BNN liên tục: BNN thỏa các điều kiện sau:
- Tập hợp tất cả các giá trị mà biến ngẫu nhiên X có thể nhận được được gọi là tập + tập giá trị tạo thành 1 đoạn, khoảng hoặc hợp các đoạn, khoảng.
(miền) giá trị của X, kí hiệu X(Ω). + Với mọi c ta có P (X = c) = 0.
- Về mặt toán học: Cho không gian xác suất (Ω, F, P ). Hàm X xác định trên không Chẳng hạn ở Ví dụ 1, X, Y là các BNN rời rạc, còn Z là BNN liên tục.
gian mẫu Ω và nhận giá trị trong R được gọi là biến ngẫu nhiên nếu với mọi x ∈ R, tập
hợp các kết quả {ω : X(ω) < x} lập thành một biến cố ngẫu nhiên. 2. Hàm phân phối
Ví dụ 1 Định nghĩa: Hàm số thực FX (x) = P (X < x), x ∈ R được gọi là hàm phân phối của
- Gieo ngẫu nhiên 3 lần một đồng xu. Gọi X là số lần mặt sấp xuất hiện. Khi đó X là biến ngẫu nhiên X.
một biến ngẫu nhiên nhận các giá trị 0, 1, 2 và 3. Nhận xét: Hàm phân phối FX (x) chính là xác suất X nhận giá trị trong khoảng
- Gọi Y là số người đến đổ xăng ở cửa hàng AB trong một ngày. Khi đó Y là biến ngẫu (−∞, x).
nhiên nhận các giá trị 0, 1, 2,. . . .
- Gọi Z là nhiệt độ trung bình trong một ngày (đơn vị: độ C). Khi đó Z là biến ngẫu
nhiên nhận các giá trị trong khoảng (−∞, +∞).
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 2/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 3/88
Ví dụ 2
Tính chất: Cho biến ngẫu nhiên X có hàm phân phối
i) 0 ≤ FX (x) ≤ 1, ∀x ∈ R
ii) FX (x) đơn điệu không giảm với mọi x ∈ R F (x) = a + b. arctan x, x ∈ R
iii) FX (x) liên tục trái với mọi x, tức là
a) Tìm a và b.
lim FX (x) = FX (x0 ), ∀x0 ∈ R b) Tìm x sao cho: P (X ≥ 1 − x) = 1/4
x→x−
0
Giải. a. Ta có:
iv) lim FX (x) = 1, lim FX (x) = 0
x→+∞ x→−∞
lim F (x) = 1
( (
bπ
x→+∞ a+ 2 =1 a = 1/2
⇔ ⇔
Nhận xét: lim F (x) = 0
x→−∞ a− bπ
2 =0 b = 1/π
i) P (X ≥ a) = 1 − F (a)
ii) P (a ≤ X < b) = F (b) − F (a) b. P (X
≥ 1 − x) = 1 − P (X < 1− x) = 1 − F (1 − x)
= 1 − 1/2 + 1/π ∗ arctan(1 − x) = 1/2 − 1/π ∗ arctan(1 − x) = 1/4.
Từ đó: arctan(1 − x) = π/4 hay x = 0.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 4/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 5/88
Ví dụ 3
Cho biến ngẫu nhiên X có hàm phân phối
b. Theo định nghĩa:
0, x<0 FY (y) = P (Y < y) = P (2X + 1 < y)
F (x) = 2
ax + b, 0 ≤ x < 2 = P (X < (y − 1)/2) = F ((y − 1)/2)
1, x≥2 0, (y − 1)/2 < 0
2
= 1/4 ∗ [(y − 1)/2] , 0 ≤ (y − 1)/2 < 2
a) Tìm a và b.
1,
(y − 1)/2 ≥ 2
b) Tìm hàm phân phối của Y = 2X + 1.
0, y<1
Giải. a. Vì F (x) liên tục trái nên = 1/16 ∗ (y − 1)2 , 1 ≤ y < 5
1,
y≥5
lim F (x) = F (0)
( (
x→0− 0=b a = 1/4
⇔ ⇔
lim− F (x) = F (2)
4a + b = 1 b=0
x→2
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 6/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 7/88
Nhận xét: i)
P
pi = 1 Bảng phân phối xác suất:
ii) Hàm phân phối của X sẽ là
X X 0 1 2
FX (x) = P (X < x) = P (X = xi ) P 1/11 16/33 14/33
xi <x
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 8/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 9/88
Bảng phân phối xác suất:
X 0 1 2
P 1/11 16/33 14/33
Ví dụ 5
Ví dụ 6
Một xạ thủ có 4 viên đạn, xạ thủ đó bắn từng phát độc lập cho đến khi có phát trúng
Cho 2 hộp chứa bi. Hộp 1 chứa 2T và 8Đ. Hộp 2 chứa 3T và 6Đ. Lấy ngẫu nhiên 1
hoặc hết đạn thì thôi. Gọi X là số viên đạn đã bắn. Lập bảng phân phối xác suất và
viên từ hộp 1 chuyển sang hộp 2, sau đó từ hộp 2 lấy ngẫu nhiên 1 viên. Gọi X là số bi
tìm hàm phân phối của X, biết rằng xác suất bắn trúng mỗi lần đều bằng 0,7.
trắng lần 2 lấy được. Lập bảng phân phối xác suất của X.
Giải. Ta có X là biến ngẫu nhiên nhận các giá trị:1,2,3,4.
Giải. Gọi H1 , H2 là biến cố lần 1 lấy bi trắng, đen. Ta có {H1 , H2 } là nhóm đầy đủ.
Gọi Ai là biến cố viên đạn thứ i trúng đích, i = 1, 2, 3, 4. Ta có các biến cố Ai độc lập.
Từ giả thiết, X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1.
P (X = 1) = P (A1 ) = 0, 7; P (X = 2) = P (Ā1 A2 ) = 0, 3 ∗ 0, 7 = 0, 21
P (X = 0) = P (H1 )P (X = 0|H1 ) + P (H2 )P (X = 0|H2 )
P (X = 3) = P (Ā1 Ā2 A3 ) = 0, 3 ∗ 0, 3 ∗ 0, 7 = 0, 063
= 2/10 ∗ 6/10 + 8/10 ∗ 7/10 = 0, 68
P (X = 4) = P (Ā1 Ā2 Ā3 ) = 0, 3 ∗ 0, 3 ∗ 0, 3 = 0, 027
P (X = 1) = P (H1 )P (X = 1|H1 ) + P (H2 )P (X = 1|H2 )
Bảng phân phối xác suất và hàm phân phối:
= 2/10 ∗ 4/10 + 8/10 ∗ 3/10 = 0, 32
Bảng phân phối xác suất:
0, x≤1
7,
0, 1<x≤2
1 2 3 4
X
X 0 1
P
FX (x) = P (X = xi ) = 0, 91, 2<x≤3
P 0,7 0,21 0,063 0,027 xi <x
0,68 0,32
0, 973, 3<x≤4 P
1, x>4
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 12/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 13/88
4. Biến ngẫu nhiên liên tục
Cho biến ngẫu nhiên liên tục X với hàm phân phối FX (x). Khi đó tồn tại hàm f (x)
sao cho ta có biểu diễn:
Zx
FX (x) = f (t)dt, x ∈ R
−∞
Ví dụ 7 Ví dụ 8
Tuổi thọ (năm) của một thiết bị là biến ngẫu nhiên X có hàm mật độ: Cho X là biến ngẫu nhiên liên tục có hàm mật độ
( (
0.6e−0.6x , x > 0 a x, x ∈ [0, 1]
f (x) = f (x) =
0, x≤0 0, x ∈ / [0, 1]
Chọn ngẫu nhiên 1 thiết bị. Tính xác suất tuổi thọ của thiết bị này: a) Tìm hệ số a và hàm phân phối FX (x).
a) Nhỏ hơn 1 năm. b) Lớn hơn 2 năm. b) Thực hiện 10 phép thử độc lập. Tính xác suất có 3 lần xảy ra biến cố (1/2 < X < 1).
Giải. a. Xác suất tuổi thọ thiết bị này nhỏ hơn 1 năm: Giải. a. Theo tính chất:
R +∞ R1 a
−∞ f (x)dx = 0 axdx = 2 = 1 ⇔ a = 2.
Hàm phân phối:
Z 1 Z 1
P (0 < X < 1) = f (x)dx = 0, 6e−0,6x dx = 1 − e−0,6
0 0 R
x
R−∞ 0dt, R x<0
x
b. Xác suất tuổi thọ thiết bị này lớn hơn 2 năm:
Z
0 x
FX (x) = f (t)dt = 0dt + 0 2tdt, x ∈ [0, 1]
Z +∞ Z +∞ +∞ −∞ R−∞
0 R1 Rx
−∞ 0dt + 0 2tdt + 1 0dt, x>1
P (X > 2) = f (x)dx = 0, 6e−0,6x dx = −e−0,6x = e−1,2
2 2 2
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 16/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 17/88
Ví dụ 9
Cho biến ngẫu nhiên liên tục X có hàm phân phối:
0, x<0
(
FX (x) = x2 , x ∈ [0, 1] 1 − a/x3 , x ≥ 2,
F (x) =
1,
x>1 0, x<2
b. Ta có mô hình Bernoulli với n = 10 và p = P (1/2 < X < 1). a. Tìm a, hàm mật độ f (x). b. Tìm x thỏa P (X > x) = 1/4.
Z 1 Z 1
p= f (x)dx = 2xdx = 3/4 Giải. a. Vì F (x) liên tục trái tại x = 2 nên:
1/2 1/2
lim F (x) = F (2) ⇔ 1 − a/8 = 0 ⇔ a = 8
x→2−
Xác suất cần tìm: 3 7
3 1
3
p10 (3) = C10 Hàm mật độ:
4 4 (
′ 24/x4 , x ≥ 2,
f (x) = F (x) =
0, x<2
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 18/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 19/88
b. Ta có:
6. Các số đặc trưng
P (X > x) = 1 − P (X ≤ x) = 1 − F (x) = 1/4 ⇔ F (x) = 3/4
a. Kỳ vọng toán
( Định nghĩa: Kỳ vọng toán của biến ngẫu nhiên X, kí hiệu E(X), là một số được xác
1 − 8/x3 = 3/4, √
3 định như sau:
⇔ ⇔x=2 4
x≥2 - Nếu X có phân phối rời rạc với phân phối xác suất P (X = xk ) = pk , k = 1, 2, ... thì
+∞
5. Sự độc lập của các biến ngẫu nhiên
X
E(X) = x i pi
i=1
- Hai biến ngẫu nhiên X và Y được gọi là độc lập nếu các biến cố (X < a) và (Y < b)
độc lập với mọi cặp giá trị (a, b), tức là: - Nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x) thì
P (X < a, Y < b) = P (X < a)P (Y < b) +∞
Z
E(X) = x f (x)dx
- Nhóm n biến ngẫu nhiên {X1 , X2 , ..., Xn } được gọi là độc lập nếu các biến cố (X1 <
a1 ), ...., (Xn < an ) độc lập với mọi bộ giá trị (a1 , a2 , ..., an ).
−∞
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 20/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 21/88
+∞ +∞
Trong trường hợp |xi |pi hoặc |x| fX (x)dx phân kì thì ta nói biến ngẫu nhiên X b. Khi X có phân phối liên tục với hàm mật độ:
P R
i=1 −∞ (
không có kỳ vọng. sin x, x ∈ [0, π/2]
Tính chất: f (x) =
0, x∈/ [0, π/2]
i) E(c) = c với c là hằng số.
ii) E(cX) = cE(X) với c là hằng số.
Giải.
iii) E(X ± Y ) = E(X) ± E(Y ) với mọi biến ngẫu nhiên X, Y .
a. E(X) = i pi xi = 0, 2 ∗ 1 + 0, 7 ∗ 2 + 0, 1 ∗ 3 = 1, 9
P
iv) E(XY ) = E(X).E(Y ) nếu X, Y độc lập.
b. Ta có:
Ví dụ 10 +∞
Z Z π/2 Z π/2
E(X) = x f (x)dx = x sin xdx = xd(− cos x)
Tính kỳ vọng của biến ngẫu nhiên X trong hai trường hợp sau: 0 0
a. X có phân phối rời rạc với bảng phân phối xác suất: −∞
Z π/2
X 1 2 3 π/2
= −x cos x0 + cos xdx = 1
P 0,2 0,7 0,1 0
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 22/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 23/88
Ví dụ 11
Trong hộp có 7 bút xanh và 3 bút đỏ. Một sinh viên rút ngẫu nhiên 2 bút để mua. Giá
Nhận xét:
bút xanh và đỏ lần lượt 2000 đồng và 3000 đồng. Tìm số tiền trung bình sinh viên này
i) Kì vọng của biến ngẫu nhiên thể hiện giá trị trung bình của biến ngẫu nhiên đó, tức
phải trả.
là khi thực hiện một số lớn lần các phép thử thì giá trị trung bình thu được của các kết
quả sẽ xấp xỉ với kì vọng.
Giải. Gọi X (ngàn đồng) là số tiền sinh viên này phải trả. Ta có X nhận các giá trị: 4,
ii) Xét trò chơi may rủi với số tiền đặt cược trong mỗi ván không đổi. Trò chơi được
5 và 6.
gọi là công bằng (có lợi hay có hại) đối với người chơi nếu kỳ vọng số tiền nhận được
P (X = 4) = C72 /C10
2 = 7/15
trong mỗi lần chơi bằng (lớn hơn hay bé hơn) số tiền đặt cược trong mỗi ván chơi. 1 1 2 = 7/15
P (X = 5) = C7 C3 /C10
iii) Nếu g(x) là hàm liên tục thì g(X) cũng là biến ngẫu nhiên và kì vọng của nó được 2 2
P (X = 6) = C3 /C10 = 1/15
tính là:
+∞ Bảng phân phối xác suất của X:
g(xi ).pi nếu X là biến ngẫu nhiên rời rạc.
P
• Eg(X) =
i=1
+∞
X 4 5 6
g(x) fX (x)dx nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x).
R
• Eg(X) = P 7/15 7/15 1/15
−∞
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 26/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 27/88
b. Phương sai Nhận xét: Trong thực hành, ta hay sử dụng công thức sau: D(X) = E(X 2 ) − (EX)2 ,
trong đó:
Định nghĩa: Giả sử biến ngẫu nhiên X có kỳ vọng EX. Nếu tồn tại kỳ vọng
E(X − EX)2 thì ta gọi giá trị này là phương sai của X, kí hiệu là DX (hay
P
pi x2i ,
nếu X là biến ngẫu nhiên rời rạc
V ar(X), V (X)), tức là: 2
E(X ) = +∞
x f (x)dx, nếu X là biến ngẫu nhiên liên tục
R 2
DX = E(X − EX)2
√ −∞
Giá trị σ(X) = DX được gọi là độ lệch chuẩn.
Tính chất: Ý nghĩa:
i) D(c) = 0 với c là hằng số - Phương sai cũng như độ lệch chuẩn là đại lượng đặc trưng cho mức độ tập trung của
ii) D(cX) = c2 D(X) với c là hằng số các giá trị của biến ngẫu nhiên X quanh kỳ vọng EX. Phương sai càng lớn thì các giá
iii) DX = E(X 2 ) − (EX)2 trị khuếch tán càng xa so với kỳ vọng.
iv) D(X ± Y ) = D(X) + D(Y ) với X, Y độc lập - Trong kỹ thuật phương sai đặc trưng cho sai số của các thiết bị hoặc của các phép
đo. Trong quản lý và kinh doanh, nó đặc trưng cho mức độ rủi ro của các quyết định.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 28/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 29/88
Ví dụ 14 Ví dụ 15
Cho biến ngẫu nhiên X có phân phối Một nhà đầu tư đang cân nhắc giữa việc đầu tư vào 2 dự án A và B trong 2 lĩnh vực
độc lập. Khả năng thu hồi vốn sau 2 năm (tính bằng %) của 2 dự án là các biến ngẫu
X 1 2 a
nhiên XA , XB có bảng phân phối xác suất như sau:
P b 0.3 0.5
XA 65 67 68 69 70 71 73
a. Tìm a và b, biết E(X) = 2, 3. b. Tính D(2X − 3), D(X 2 ) P 0.04 0.12 0.16 0.28 0.24 0.08 0.08
XB 66 68 69 70 71
Giải. a. Ta có hệ:
(P ( ( P 0.12 0.28 0.32 0.20 0.08
pi = 1 b + 0, 3 + 0, 5 = 1 a=3
⇔ ⇔
E(X) =
P
pi xi = 2, 3 b + 0, 6 + 0, 5a = 2, 3 b = 0, 2 Từ các bảng phân phối trên, ta tính được:
E(XA ) = 69, 16%; D(XA ) = 3, 0944; E(XB ) = 68, 72%; D(XB ) = 1, 8016
b. Ta có:
D(2X − 3) P= D(2X) + D(3) = 4D(X) = 4[E(X 2 ) − (E(X))2 ] = 4[E(X 2 ) − 5, 29] Do đó, nếu cần chọn phương án đầu tư sao cho tỉ lệ thu hồi vốn kỳ vọng cao hơn thì
2
E(X ) = pi xi = 0, 2 ∗ 12 + 0, 3 ∗ 22 + 0, 5 ∗ 32 = 5, 9
2
nên chọn dự án A, song nếu chọn phương án đầu tư sao cho độ rủi ro của tỉ lệ thu hồi
D(2X − 3) = 4(5, 9 − 5, 29) = 2, 44 vốn thấp hơn (tức khả năng thu hồi vốn ổn định hơn) thì lại nên chọn dự án B.
Tương tự: D(X 2 ) = E(X 4 ) − (E(X 2 ))2 = pi x4i − 5, 92 = 10, 69
P
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 30/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 31/88
0.4
c. Trung vị (median)
0.12
Định nghĩa: Trung vị (hay Median) của biến ngẫu nhiên X, được kí hiệu med(X) xác
0.2
0.06
median
mean
mean
định theo hệ thức:
median
0.00
1 1
0.0
P (X < med(X)) ≤ và P (X > med(X)) ≤
2 2 7 8 9 10 11 12 13 5 10 15 20 25
Nhận xét: Theo định nghĩa trên thì X có thể có nhiều trung vị và trong trường hợp X
0.20
0.20
là biến ngẫu nhiên liên tục thì med(X) chính là nghiệm của phương trình
mean
mean
1
0.10
median
0.10
FX (x) =
median
2
0.00
0.00
5 10 15 20 25 0 5 10 15
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 32/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 33/88
Giải. a. Ta có med(X) = 2 vì:
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 34/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 35/88
X 0 1
P 1-p p
Tính chất:
i) Nếu X ∼ B(n, p) thì E(X) = np, D(X) = np(1 − p).
ii) Nếu các biến ngẫu nhiên Xi , i = 1, n độc lập và Xi ∼ Ber(p) thì
X = X1 + ... + Xn ∼ B(n, p)
Nhận xét:
i) B(1, p) chính là phân phối Ber(p).
ii) Xét dãy n phép thử Bernoulli với xác suất thành công là p. Lúc đó, nếu gọi X là biến
ngẫu nhiên chỉ số lần thành công trong dãy n phép thử này thì X ∼ B(n, p).
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 38/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 39/88
Ví dụ 17 Ví dụ 18
Một thành phố A có 70% gia đình có tivi. Chọn ngẫu nhiên 20 gia đình và gọi X là số Một sinh viên thi vấn đáp trả lời 5 câu hỏi một cách độc lập. Khả năng trả lời đúng
gia đình có tivi. mỗi câu hỏi đều bằng 60%. Nếu trả lời đúng thì sinh viên được 4 điểm, ngược lại bị trừ
a) Tính xác suất có đúng 10 gia đình có tivi. 2 điểm.
b) Tính xác suất để có ít nhất 2 gia đình có tivi. a) Tìm xác suất để sinh viên đó trả lời đúng 3 câu.
b) Tìm số điểm trung bình mà sinh viên đó đạt được.
Giải. Ta có mô hình Bernoulli với n = 20 và p = 0, 7. Do đó: X ∼ B(n = 20; p = 0, 7). c) Một sinh viên khác vào thi với khả năng trả lời đúng mỗi câu đều như nhau và cho
a. Xác suất có đúng 10 gia đình có tivi: rằng số điểm trung bình đạt được không ít hơn 14. Hỏi sinh viên này phán đoán khả
năng trả lời đúng mỗi câu tối thiểu là bao nhiêu ?
10
P (X = 10) = p20 (10) = C20 0, 710 0, 310
Giải. Mô hình Bernoulli với n = 5 và p = 0, 6. Gọi X là số câu trả lời đúng của sinh
b. Xác suất có ít nhất 2 gia đình có tivi: viên này. Ta có: X ∼ B(n = 5; p = 0, 6).
a. P (X = 3) = p5 (3) = C53 0, 63 0, 42 .
P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X = 0) − P (X = 1) = 1 − p20 (0) − p20 (1)
b. Gọi Y là số điểm sinh viên này đạt được.
Ta có: Y = 4X − 2(5 − X) = 6X − 10.
0
= 1 − C20 0, 70 0, 320 − C20
1
0, 71 0, 319 Số điểm trung bình sinh viên này đạt được:
E(Y ) = 6E(X) − 10 = 6np − 10 = 6 ∗ 5 ∗ 0, 6 − 10 = 8 (điểm)
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 40/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 41/88
7.3 Phân phối Poisson
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ > 0,
c. Gọi p là xác suất trả lời đúng mỗi câu của sinh viên mới này. Gọi Z và T là số câu kí hiệu X ∼ P ois(λ) nếu X nhận giá trị trong tập N = {0, 1, 2, 3, ...} với xác suất:
trả lời đúng và số điểm đạt được. Tương tự, ta có:
λk e−λ
Z ∼ B(n = 5; p) và T = 6Z − 10 P (X = k) = , k = 0, 1, 2, ...
k!
Theo giả thiết:
E(T ) ≥ 14 Tính chất:
i) Nếu X ∼ P ois(λ) thì E(X) = λ, D(X) = λ.
ii) Cho X1 , X2 độc lập và có phân phối Poisson với tham số λ1 , λ2 . Khi đó X =
⇔ 6np − 10 = 30p − 10 ≥ 14 ⇔ p ≥ 0, 8
X1 + X2 ∼ P ois(λ1 + λ2 ).
Vậy, sinh viên này dự đoán khả năng trả lời đúng tối thiểu mỗi câu là 80%. Nhận xét: Trong thực tế phân phối Poisson phản ánh phân phối số lượng các biến cố
xuất hiện trong một khoảng thời gian (số cuộc điện thoại gọi đến tổng đài, số khách
hàng đến rút tiền từ một ngân hàng,....) và có tham số tỉ lệ với độ dài khoảng thời gian
đó.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 42/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 43/88
(λt)k e−λt
P (N (t) = k) = , k ≥ 0.
k!
Điều này có nghĩa N (t) ∼ P ois(λt). Tham số λ chính là số biến cố trung bình xuất
hiện trong một đơn vị thời gian.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 44/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 45/88
Ví dụ 19 Ví dụ 20
Một gara cho thuê ôtô thấy rằng số đơn đặt hàng thuê ôtô vào ngày thứ 7 là một biến Quan sát tại siêu thị A thấy 4 phút trung bình có 20 khách đến mua hàng.
ngẫu nhiên có phân phối Poisson với tham số λ = 2. Giả sử gara có 4 chiếc ôtô. Hãy a) Tính xác suất để trong 7 phút có 30 khách đến siêu thị A ?
tìm xác suất để: b) Tính xác suất để trong 2 phút có từ 3 đến 5 khách đến siêu thị A ?
a) Có đúng 2 ôtô được thuê. Giả sử số khách đến siêu thị A tuân theo luật phân phối Poisson.
b) Tất cả 4 ôtô đều được thuê.
c) Gara không đáp ứng được yêu cầu. Giải.
a. Gọi X là số khách đến siêu thị trong 7 phút. Lúc đó, X có phân phối Poisson với
Giải. Gọi X là số đơn đặt hàng ôtô vào ngày thứ 7. Ta có X ∼ P ois(λ = 2). tham số λ = 7/4 ∗ 20 = 35. Xác suất cần tìm:
22 3530
a. P (X = 2) = e−2 = 2e−2 P (X = 30) = e−35
2! 30!
b. P (X ≥ 4) = 1 − P (X < 4) =!1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
20 21 22 23 b. Gọi Y là số khách đến siêu thị trong 2 phút. Lúc đó, Y có phân phối Poisson với
= 1 − e−2 + + + = 1 − 19/3e−2 tham số λ = 2/4 ∗ 20 = 10. Xác suất cần tìm:
0! 1! 2! 3! !
103 104 105
!
20 21 22 23 24 P (3 ≤ Y ≤ 5) = P (Y = 3) + P (Y = 4) + P (Y = 5) = e −10
+ +
c. P (X > 4) = 1 − P (X ≤ 4) = 1 − e −2 + + + + = 1 − 7e−2 3! 4! 5!
0! 1! 2! 3! 4!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 46/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 47/88
f (x) = b − a
Tính chất: E(X) = n M , M M N −n 0, x∈/ [a, b]
N D(X) = n N 1− N N −1
Nhận xét: 2
i) Cho một tập có N phần tử, trong đó có M phần tử có tính chất A, M ≤ N . Chọn Tính chất: EX = a+b 2 , DX =
(b−a)
12
ngẫu nhiên lần lượt không hoàn lại n lần, mỗi lần một phần tử trong tập hợp này và Nhận xét: Các hàm phát sinh số ngẫu nhiên thực trong đoạn [0,1] (trên các ngôn ngữ
gọi X là số phần tử được chọn có tính chất A. Khi đó X ∼ H(N, M, n). lập trình, Excel, may tính bỏ túi, ...) là hàm mô phỏng giá trị của biến ngẫu nhiên có
ii) Khi giá trị N lớn và số lần lấy n nhỏ thì phương pháp lấy không hoàn lại và lấy có phân phối đều trên đoạn [0, 1].
hoàn lại gần như không khác nhau. Vì vậy trong trường hợp N lớn và số lần lấy n nhỏ
thì ta có thể xem phân phối H(N, M, n) xấp xỉ phân phối B(n, p) với p = M/N .
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 50/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 51/88
Ví dụ 22
Xe buýt đến trạm dừng A tại một thời điểm cố định bắt đầu từ 7h, và liên tục lặp lại
trong khoảng thời gian 15ph (tức là: 7h, 7h15, 7h30,...). Giả sử một khách đến trạm 7.7 Phân phối mũ
dừng A tại thời điểm có phân phối điều trên đoạn [7h, 7h30]. Tính xác suất người này
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối mũ với tham số λ > 0, kí
chờ xe buýt ít hơn 5ph.
hiệu X ∼ Exp(λ) nếu hàm mật độ của nó có dạng:
Giải: Gọi X (ph) là thời gian tính từ lúc 7h người này đến trạm dừng A. Theo giả thiết
(
λe−λx , x > 0
X có phân phối đều trên [0, 30]. Hàm mật độ của X: f (x) =
0, x≤0
(
1/30, x ∈ [0, 30]
f (x) = Tính chất: E(X) = 1/λ; D(X) = 1/λ2
0, x∈ / [0, 30]
Nhận xét: Trong thực tế, phân phối mũ thường thể hiện phân phối khoảng thời gian
chờ giữa các lần xảy ra biến cố hay thời gian sống của các đối tượng.
Xác suất cần tìm:
15 30
1 1 1
Z Z
P (10 < X < 15) + P (25 < X < 30) = dx + dx = .
10 30 25 30 3
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 52/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 53/88
Giải thích:(đọc thêm) Ví dụ 23
Gọi Tn là thời điểm mà biến cố thứ n xuất hiện và N (t) là số biến cố xuất hiện trong
khoảng thời gian [0, t]. Khi đó: Giả sử tuổi thọ (tính bằng năm) của một mạch điện tử trong máy tính là một biến ngẫu
nhiên có phân phối mũ với tuổi thọ trung bình là 6,25 năm. Thời gian bảo hành của
+∞
X +∞
X (λt)j mạch điện tử này là 1 năm.
P (Tn ≤ t) = P (N (t) ≥ n) = P (N (t) = j) = e−λt . a) Hỏi có bao nhiêu phần trăm mạch điện tử bán ra phải bảo hành ?
j!
j=n j=n b) Một công ty mua 40 mạch điện tử loại này. Tìm số mạch trung bình công ty phải
bảo hành.
Từ đó, hàm mật độ của Tn :
Giải. a. Gọi X (năm) là tuổi thọ của mạch điện tử. Theo giả thiết, X ∼ Exp(λ) với
λe−λt (λt)n−1
fTn (t) = E(X) = 1/λ = 6, 25 ⇒ λ = 4/25. Hàm mật độ:
(n − 1)!
(
4/25e−4/25x , x > 0
X Phân phối của Tn thường được gọi là phân Gamma với tham số (n, λ) (đôi lúc còn f (x) =
gọi là phân phối n - Erlang). 0, x≤0
X Khi n = 1, T1 có phân phối mũ với tham số λ.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 54/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 55/88
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 56/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 57/88
Đường cong chuẩn (đường cong hình chuông) Nhận xét:
i) Biến ngẫu nhiên có phân phối chuẩn tắc thường được kí hiệu là Z. Do đó:
Φ(x) = P (Z < x)
ii) Φ(−x) = 1 − Φ(x), ∀x ∈ R.
1 R x −t2 /2
iii) Φ(x) = 1/2 + Φ0 (x), trong đó Φ0 (x) = √ e dt - hàm Laplace.
2π 0
Một vài giá trị hay sử dụng:
Giá trị tới hạn: Giá trị tới hạn mức α của phân phối chuẩn tắc được kí hiệu zα , tức là:
Ví dụ 26
Ví dụ 25 Giả sử số đo chiều dài của một sợi dây kim loại do một máy tự động cắt ra là một biến
ngẫu nhiên chuẩn với µ = 10mm, σ 2 = 4mm2 .
Cho biến ngẫu nhiên X ∼ N (4, 32 ). a) Tính xác suất lấy ra được một sợi dây có chiều dài lớn hơn 13mm.
Tính xác suất: P (X < 5), P (X > 1), P (|X − 3| < 1). b) Chọn ngẫu nhiên 10 sợi dây loại này. Tính xác suất có đúng 3 sợi có chiều dài từ
8, 5mm đến 12, 5mm.
Giải. Ta có: 5 − 4
P (X < 5) = Φ = 0, 63 Giải. Gọi X là số đo chiều dài sợi dây kim loại. Ta có: X ∼ N (10; 22 ).
3 13 − 10
a. P (X > 13) = 1 − P (X ≤ 13) = 1 − Φ = 0, 067
1 − 4 2
P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 841 b. Mô hình Bernoulli với n = 10 và p = P (8, 5 < X < 12, 5). Ta có:
3
4 − 4 2 − 4 12, 5 − 10 8, 5 − 10
P (|X − 3| < 1) = P (2 < X < 4) = Φ −Φ = 0, 2475 p=Φ −Φ = 0, 668
3 3 2 2
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 64/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 65/88
Ví dụ 28
Ví dụ 27
Cho X ∼ N ( 15, 4 ), Y ∼ N ( 10, 1 ), X và Y độc lập.
Cho X là biến ngẫu nhiên có phân phối chuẩn. Biết rằng P (X > 4) = 0, 159 và P (X <
a) Tính P (2X > 3Y ).
3) = 0, 309. Tính xác suất P (X > 1). Cho biết Φ(1/2) = 0, 691 và Φ(1) = 0, 841.
b) Tìm a và b biết T = X + aY + b và E(T ) = 30, D(T ) = 5.
Giải. Giả sử X ∼ N (µ; σ 2 ). Khi đó:
Giải. a. Đặt Z = 2X − 3Y . Theo tính chất của phân phối chuẩn, Z cũng có phân phối
4 − µ 4 − µ chuẩn với tham số:
P (X > 4) = 1 − Φ = 0, 159 ⇔ Φ = 0, 841 = Φ(1) ⇔ 4 − µ = σ (1)
σ σ
(
µZ = E(Z) = 2E(X) − 3E(Y ) = 2 ∗ 15 − 3 ∗ 10 = 0
3 − µ 3 − µ 3 − µ σZ2 = D(Z) = 4D(X) + 9D(Y ) = 4 ∗ 4 + 9 ∗ 1 = 25
P (X < 3) = Φ = 0, 309 ⇔ Φ − = 1−Φ = 0, 691 = Φ(1/2)
σ σ σ 0 − 0
Do đó, Z ∼ N (0; 25). Vậy, P (2X > 3Y ) = P (Z > 0) = 1 − Φ = 1/2.
5
⇔ 3 − µ = −σ/2 (2) b. Sử dụng tính chất của kỳ vọng và phương sai:
Giải hệ (1),(2) ta được: µ = 10/3; σ = 2/3. ( ( "
1 − 10/3 E(T ) = 30 15 + 10a + b = 30 a = 1; b = 5
Vậy, P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 99976 ⇔ ⇔
2/3 D(T ) = 5 4 + a2 = 5 a = −1; b = 25
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 66/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 67/88
Ví dụ 29
Qui tắc 2σ: Cho X ∼ N (µ, σ 2 ). Khi đó
Chiều cao X (mét) của nam thanh niên trưởng thành ở quốc gia A tuân theo quy luật
phân bố chuẩn N (µ; 0, 12 ). Chọn ngẫu nhiên 100 nam thanh niên của quốc gia A. Tính P (|X − µ| < 2σ) = P (µ − 2σ < X < µ + 2σ) = Φ(2) − Φ(−2) ≈ 0, 9545
xác suất sai số tuyệt đối giữa chiều cao trung bình của 100 nam thanh niên được chọn
với µ không vượt quá 0, 03.
hay P (µ − 2σ < X < µ + 2σ) ≈ 0, 9545
Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 100 và X̄ = (X1 +...+X100 )/100.
Điều này có nghĩa xác suất X nhận giá trị trong khoảng (µ − 2σ, µ + 2σ) bằng 95,45%.
Ta có: Xi độc lập và Xi ∼ N (µ; 0, 12 ). Theo tính chất của phân phối chuẩn, X̄ cũng
có phân phối chuẩn với tham số:
( Qui tắc 3σ: Cho X ∼ N (µ, σ 2 ). Khi đó
µX̄ = E(X̄) = µ
2 = D(X̄) = 0, 12 /100 = 10−4
σX̄ P (|X − µ| < 3σ) = P (µ − 3σ < X < µ + 3σ) = Φ(3) − Φ(−3) ≈ 0, 9973
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 68/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 69/88
Ứng dụng
- Khi nghiên cứu các phân phối, nếu nó thỏa quy tắc 2σ và 3σ thì điều này cung cấp
cho chúng ta cơ sở để «có thể xem» phân phối đang nghiên cứu là phân phối chuẩn.
- Ngược lại, nếu biết phân phối đang nghiên cứu là phân phối chuẩn, lúc đó các «khoảng»
2σ và 3σ lần lượt chiếm 95,45% và 99,73% các giá trị có thể.
Ví dụ 30
Thu thập dữ liệu từ 2 phân phối, thực hiện tính toán và được kết quả:
trong đó x̄ và s lần lượt là trung bình mẫu và độ lệch chuẩn mẫu (Chương 4).
Câu hỏi: Phân phối nào có thể xem là chuẩn? 1 hay 2?
Quy tắc 2σ và 3σ
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 70/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 71/88
+∞
trong đó hàm gamma: Γ(a) = xa−1 e−x dx, a > 0.
R
0
Phân phối χ2 và giá trị tới hạn
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 72/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 73/88
7.10 Phân phối student
Định nghĩa: Cho X ∼ N (0, 1), Y ∼ χ2 n và X, Y độc lập. Khi đó, phân phối của biến
ngẫu nhiên Z = √X được gọi là phân phối student với n bậc tự do, kí hiệu X ∼ Tn .
Y /n
Giá trị tới hạn mức α của phân phối Tn được kí hiệu tn;α và được tra ở bảng. Khi
n > 30 người ta thường sử dụng công thức xấp xỉ:
tn;α ≈ zα
Tính chất:
i) E(X) = 0, D(X) = n−2n
,n>2
ii) Hàm mật độ của Tn có dạng:
!− n+1
Γ n+12 x2 2
f (x) = √ $n 1 + , x ∈ R.
nπΓ 2 n Phân phối student và giá trị tới hạn
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 74/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 75/88
Ví dụ 32
b. Gọi n là số bóng đèn cần mua dự trữ. Tương tự, áp dụng định lý giới hạn trung tâm:
Tung ngẫu nhiên một con xúc xắc cân đối 200 lần độc lập. Tính xấp xỉ xác suất tổng
Tn = X1 + ... + Xn số chấm xuất hiện (ở mặt trên cùng) lớn hơn 720.
có phân phối xấp xỉ phân phối chuẩn N (250n; 502 n). Giải. Gọi Xi là số chấm xuất hiện ở lần tung thứ i, i = 1, 200. Đặt S = X1 + ... + X200 .
Từ giả thiết, ta có: Ta có: X1 , ..., X200 là các biến ngẫu nhiên độc lập cùng phân phối.
8750 − 250n
P (Tn ≥ 8750) = 1 − P (Tn < 8750) ≈ 1 − Φ √ ≥ 0, 9772 = Φ(2)
50 n Xi 1 2 3 4 5 6
1/6 1/6 1/6 1/6 1/6 1/6
8750 − 250n P
⇔Φ − √ ≥ 0, 9772 = Φ(2)
50 n
Khi đó: E(Xi ) = 7/2; D(Xi ) = E(Xi2 ) − (EXi )2 = 35/12.
Giải bất phương trình: Theo định lý giới hạn trung tâm, S sẽ có phân phối xấp xỉ phân phối chuẩn N (200 ∗
8750 − 250n
− √ ≥2 7/2; 200 ∗ 35/12) = N (700; 1750/3). Do đó, xác suất cần tìm:
50 n !
ta được: n ≥ 37, 44. 720 − 700
P (S > 720) = 1 − P (S ≤ 720) ≈ 1 − Φ p ≈ 0, 2
Vậy, n = 38. 1750/3
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 80/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 81/88
Hệ quả: (Định lý giới hạn tích phân Moivre-Laplace) Cho X ∼ B(n, p). Khi n khá lớn
Điều kiện xấp xỉ
ta có: ! !
k2 − np k1 − np Theo quy tắc 3σ:
P (k1 < X < k2 ) ≈ Φ p −Φ p .
np(1 − p) np(1 − p)
(µ − 3σ, µ + 3σ) ∈ (0, n)
Hay nói cách khác, khi n lớn X có phân phối xấp xỉ phân phối chuẩn N (µ, σ 2 ) với p p
µ = E(X) = np và σ 2 = D(X) = np(1 − p). ⇔ (np − np(1 − p), np + np(1 − p)) ∈ (0, n)
( p
np − np(1 − p) > 0
⇔
Định lý giới hạn địa phương Moivre-Laplace (đọc thêm)
p
np + np(1 − p) < n
Cho X ∼ B(n, p). Khi n lớn, ta có:
n > 9 1−p
p
! ⇔
p
1 k − np n > 9 1−p
P (X = k) ≈ p ϕ p ,
np(1 − p) np(1 − p)
1−p p
⇔ n > 9 max ,
1 2 p 1−p
trong đó ϕ(x) = √ e−x /2 - hàm mật độ phân phối chuẩn tắc N(0,1).
2π
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 82/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 83/88
Ví dụ 33
Một xạ thủ bắn độc lập 200 viên đạn vào một mục tiêu. Xác suất bắn trúng mỗi viên
là 0,6. Tính xấp xỉ xác suất có ít nhất 100 viên trúng đích.
Giải. Gọi X là số viên đạn bắn trúng. Ta có: X ∼ B(n = 200; p = 0, 6). Áp dụng định lý
Moivre-Laplace, X có phân phối xấp xỉ chuẩn với µ = np = 120; σ 2 = np(1 − p) = 48.
Do đó:
200 − 120 100 − 120
P (100 ≤ X ≤ 200) ≈ Φ √ −Φ √ = 0, 998
48 48
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 84/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 85/88
Ví dụ 34
Một công ty bảo hiểm xe máy có 10 000 khách hàng. Mỗi chủ xe phải nộp 120.000 Nhận xét: Cho X ∼ N (n, p). Khi n khá lớn (và thỏa điều kiện nhất định) thì theo
đồng/1 năm và trung bình nhận lại là 1.000.000 đồng nếu xe của họ bị tai nạn giao đinh lý giới hạn tích phân Moivre-Laplace, X có phân phối xấp xỉ phân phối liên tục
thông. Qua thống kê biết tỉ lệ để 1 xe máy bị tai nạn giao thông trong một năm là là phân phối chuẩn N (np, np(1 − p)). Vì thế, khi tính xấp xỉ xác suất người ta thường
0,006. Tìm xác suất để sau một năm hoạt động công ty bị thất bại. hiệu chỉnh:
!
Giải. Gọi X là số xe bị tai nạn và Y (ngàn đồng) là số tiền lãi của công ty trong 1 năm. P (X ≤ k) = P (X < k + 0.5) ≈ Φ p
k + 0.5 − np
Ta có: X ∼ B(n = 10000; p = 0, 006) và Y = 12 ∗ 105 − 1000X. np(1 − p)
Áp dụng định lý Moivre-Laplace, X có phân phối xấp xỉ chuẩn với tham số
!
k − 0.5 − np
P (X < k) = P (X ≤ k − 1) = P (X < k − 0.5) ≈ Φ p
µ = np = 60; σ 2 = np(1 − p) = 59, 64 np(1 − p)
P (k1 < X < k2 ) = P (X < k2 ) − P (X ≤ k1 )
Xác suất để sau một năm hoạt động công ty bị thất bại: P (k1 ≤ X < k2 ) = P (X < k2 ) − P (X < k1 )
...............
1200 − 60
P (Y < 0) = P (12 ∗ 105 − 1000X < 0) = P (X > 1200) ≈ 1 − Φ √ ≈0
59, 64
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 86/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 87/88
Ví dụ 35
Cho X ∼ B(n = 300, p = 0.2). Khi đó, n khá lớn và thỏa điều kiện
1−p p
n > 9 max ,
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 88/88 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 1/27
2.1 Phân phối đồng thời rời rạc
Chương 3. Vectơ ngẫu nhiên
1. Định nghĩa a. Bảng phân phối đồng thời: Giả sử X nhận các giá trị trong tập {xi , i ∈ I} và Y
nhận các giá trị trong tập {yj , j ∈ J}.
Giả sử X1 , ..., Xn là n biến ngẫu nhiên liên quan đến thí nghiệm đang xét. Lúc đó ta Đặt pij = P (X = xi , Y = yj ), i ∈ I, j ∈ J. Lúc đó ta có bảng phân phối đồng thời:
gọi bộ gồm n biến ngẫu nhiên (X1 , ..., Xn ) là vectơ ngẫu nhiên n chiều.
Y
Ở đây, ta hạn chế xét trường hợp n = 2. y1 y2 ... yj ...
X
2. Hàm phân phối đồng thời x1 p11 p12 ... p1j ...
Định nghĩa: Giả sử (X, Y ) là vectơ ngẫu nhiên 2 chiều. Khi đó hàm hai biến F (x, y) x2 p21 p22 ... p2j ...
xác định như sau: ... ... ... ... ... ...
FX,Y (x, y) = P (X < x, Y < y) xi pi1 pi2 ... pij ...
được gọi là hàm phân phối đồng thời của vectơ ngẫu nhiên (X, Y ). ... ... ... ... ... ...
Tính chất:
i) 0 ≤ FX,Y (x, y) ≤ 1, ∀x, y ∈ R ii) FX,Y (x, y) không giảm theo từng biến Nhận xét: Ta cũng có: pi,j = 1 và với A ⊂ R2
P
i,j
iii) FX,Y (x, y) liên tục trái X
P ((X, Y ) ∈ A) = P (X = xi , Y = yj )
iv) lim FX,Y (x, y) = 1, lim FX,Y (x, y) = 0, lim FX,Y (x, y) = 0
x→+∞ x→−∞ y→−∞ (xi ,yj )∈A
y→+∞
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 2/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 3/27
Ví dụ 1
Một hộp có 2 bi trắng và 3 bi đen. Lấy ngẫu nhiên 1 viên không hoàn lại, rồi tiếp tục
lấy ngẫu nhiên 2 viên không hoàn lại. Gọi X và Y là số bi đen lấy được ở lần 1 và lần 2. C22
P (X = 1, Y = 2) = P (X = 1)P (Y = 2|X = 1) = 3/5 ∗ = 1/10
a. Lập bảng phân phối đồng thời của X và Y . C42
b. Tính xác suất P (X + Y < 2). Bảng phân phối đồng thời:
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 8/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 9/27
Ví dụ 3
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau: Phân phối biên của X:
X
1 2 3 X 1 2 3
Y
P 0,18 0,36 0,46
5 0.1 0.2 0.3
6 0.08 0.16 0.16
Phân phối biên của Y :
Tìm phân phối biên của X, Y và tính P (Y = 6|X = 1).
Y 5 6
Giải. Ta có:
P 0,6 0,4
X
1 2 3 P (Y = yj )
Y Xác suất:
5 0.1 0.2 0.3 0,6 P (Y = 6|X = 1) =
P (X = 1, Y = 6)
=
0, 08
=
4
6 0.08 0.16 0.16 0,4 P (X = 1) 0, 18 9
P (X = xi ) 0.18 0.36 0.46
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 10/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 11/27
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 12/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 13/27
Ví dụ 4
Do đó:
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
(
2x, x ∈ [0, 1]
fX (x) =
0, x∈/ [0, 1]
(
C(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) =
0, (x, y) ∈
/ [0, 1] × [0, 1] Mật độ có điều kiện:
Tìm C, fX (x), fY |X (y|x) và tính xác suất P (0 < X < Y < 1/2). fX,Y (x,y) 4/3(x + xy) 2
fY |X (y|x) = = = (y + 1), (x, y) ∈ [0, 1] × [0, 1]
fX (x) 2x 3
Giải. Theo tính chất của hàm mật độ:
Xác suất:
Z +∞ Z +∞ Z 1Z 1
C 1 3C
Z
fX,Y (x, y)dxdy = C(x + xy)dxdy = (y + 1)dy = =1 1/2 Z y 1/2 Z y
4
Z Z
−∞ −∞ 0 0 2 0 4 P (0 < X < Y < 1/2) = f (x, y)dxdy = (x + xy)dxdy
0 0 0 0 3
Suy ra: C = 4/3. Mật độ biên của X: 1/2
2
Z
Z +∞ 1 = (1 + y)y 2 dy = 11/288.
4
Z
0 3
fX (x) = fX,Y (x, y)dy = (x + xy)dy = 2x, x ∈ [0, 1].
−∞ 0 3
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 14/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 15/27
Ví dụ 5
2.3 Kỳ vọng của hàm hai biến ngẫu nhiên
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
- Nếu (X, Y ) có phân phối đồng thời rời rạc với pi,j = P (X = xi , Y = yj ), i ∈ I, j ∈ J
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định: X
1 2
X X Y
Eh(X, Y ) = h(xi , yj )P (X = xi , Y = yj ) = h(xi , yj )pi,j . 1 0.1 0.2
i∈I,j∈J i∈I,j∈J
2 0.3 0.4
- Nếu (X, Y ) có phân phối đồng thời liên tục với hàm mật độ xác suất đồng thời f (x, y)
Tính E(2X − 3Y )
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định:
Z +∞ Z +∞ Giải: Ta có:
Eh(X, Y ) = h(x, y)f (x, y)dxdy.
X
E(2X − 3Y ) = (2xi − 3yj )pi,j = ....
−∞ −∞
i,j
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 16/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 17/27
Ví dụ 6
2.4 Sự độc lập của các biến ngẫu nhiên
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi:
(
4
(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) = 3 FX,Y (x, y) = FX (x).FY (y)
0, (x, y) ∈
/ [0, 1] × [0, 1]
- Nếu X và Y có phân phối đồng thời rời rạc thì điều kiện trên trở thành:
Tính E(X 2 + Y 2 ).
P (X = xi , Y = yj ) = P (X = xi ).P (Y = yj ), ∀i, j
Giải. Ta có:
- Nếu X và Y có phân phối đồng thời liên tục thì điều kiện trên trở thành:
+∞ Z +∞ 1Z 1
4
Z Z
E(X 2 +Y 2 ) = (x2 +y 2 )f (x, y)dxdy = (x2 +y 2 ) (x+xy)dxdy = ... fX,Y (x, y) = fX (x).fY (y)
−∞ −∞ 0 0 3
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 18/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 19/27
Ví dụ 7
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
−1.0
X
2.5
1 2 3
−2.0
Y
ρ = − 0.98
1 0.1 0.1 0.2
1.5
ρ = 0.96
−3.0
1.0
X 1 2 3 Y 1 2
0.0
0.0
ρ = 0.19
P 0,3 0,2 0,5 P 0,4 0,6
−1.0
P (X = 1, Y = 1) 0, 1 1
0.6 0.8 1.0 1.2 1.4 −2 0 2 4 6 P (Y = 1|X = 1) = = =
P (X = 1) 0, 3 3
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 24/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 25/27
Ví dụ 8
P (X = 1, Y = 2) 0, 2 2
P (Y = 2|X = 1) = = = Cho vectơ ngẫu nhiên (X, Y ) có hàm
( mật độ đồng thời:
P (X = 1) 0, 3 3
x + y, (x, y) ∈ [0, 1]2
Phân phối có điều kiện: f (x, y) =
0, / [0, 1]2
(x, y) ∈
Y |X = 1 1 2
P 1/3 2/3 Tính P (0 < X < 1/2 < Y < 1), Cov(X, Y ), D(X + 2Y ).
Z +∞ Z +∞ Z 1Z 1
E(XY ) = xyf (x, y)dxdy = xy(x + y)dxdy = 1/3
−∞ −∞ 0 0
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 28/27 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 1/32
Chương 4: Thống kê mô tả
Giới thiệu
«Statistics is the discipline that concerns the collection, organization, analysis, 1. Tổng thể và mẫu
interpretation, and presentation of data.» a. Các khái niệm:
https://en.wikipedia.org/wiki/Statistics - Tổng thể : tập hợp toàn bộ các phần tử thống nhất theo dấu hiệu nghiên cứu. Tổng
thể có thể hữu hạn hoặc vô hạn.
- Thống kê: khoa học về điều tra và thu thập dữ liệu, tổ chức và sắp xếp dữ liệu, phân - Mẫu: một tập con bất kì của tổng thể. Số lượng phần tử của nó được gọi là kích
tích, diễn giải và trình bày dữ liệu. thước hay cỡ mẫu.
- Mục đích: Rút ra các thông tin hữu ích về quy luật phân phối của tổng thể đang - Phép lấy mẫu: việc chọn một tập con bất kì của tổng thể.
nghiên cứu từ dữ liệu thu được. - Mẫu ngẫu nhiên: một mẫu là ngẫu nhiên nếu việc chọn các cá thể được tiến hành
- Thống kê được chia thành: độc lập và có xác suất chọn như nhau.
+ Thống kê mô tả: mô tả dữ liệu thông qua các công cụ: bảng biểu, chỉ số và các biểu
đồ thống kê.
+ Thống kê suy diễn: sử dụng dữ liệu thu được để đưa ra các nhận xét, suy đoán và
kết luận về tổng thể nghiên cứu (dựa trên cơ sở của lý thuyết xác suất).
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 2/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 3/32
Lớp
6 7 8 9
Giới tính
Nam 110 117 105 115
Nữ 120 100 115 120
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 6/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 7/32
Khoảng giá trị [a0 , a1 ) [a1 , a2 ) ... [am−1 , am ) Khối lượng (g) [100;120) [120;140) [140;160) [160;180) [180;200)
Tần số n1 n2 ... nm Số trái 12 19 31 23 15
Khoảng giá trị [a0 , a1 ) [a1 , a2 ) ... [am−1 , am ) Khảo sát ngẫu nhiên một nhóm người từ độ tuổi 15 trở lên thường đọc tin tức thời sự
online ở một thành phố, số liệu được thể hiện ở bảng sau:
Tần suất f1 f2 ... fm
Độ tuổi [15,20) [20,30) [30,40) [40,50) ≥ 50
Nhận xét: Thông thường các khoảng chia có độ dài bằng nhau. Tuy nhiên, tùy thuộc
Số người 20 25 20 30 15
vào mục đích nghiên cứu mà ta có thể có những cách chia khoảng khác nhau. Số khoảng
√
chia thường từ 5-20 khoảng, hoặc [ n], hoặc [log2 n] ([x] - số nguyên lớn nhất không
vượt quá x).
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 8/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 9/32
3. Các số đặc trưng mẫu
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 12/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 13/32
Ví dụ 4
b. Trung vị mẫu
Chiều cao (mét) của 10 sinh viên đại học: 1.75, 1.69, 1.70, 1.82, 1.68, 1.72, 1.70, 1.67,
Sắp xếp mẫu số liệu theo thứ tự tăng dần, giả sử x1 ≤ x2 ≤ ... ≤ xn . Trung vị mẫu, kí
1.71, 1.68. Tính trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu.
hiệu xmed , xác định bởi:
Đáp số. x̄ = 1, 712; s2 = 0.00197; s = 0.0444
Ví dụ 5 x n+1 ,
nếu n lẻ,
xmed = x n2 + x n +1
Doanh thu X (triệu đồng) trong 100 ngày được chọn ngẫu nhiên của 1 cửa hàng: 2
2
nếu n chẵn.
2
X 19,0 - 19,4 19,4 - 19,8 19,8 - 20,2 20,2 - 20,6 20,6 - 21,0
ni 15 25 30 20 10
c. Hệ số tương quan mẫu
Tìm trung bình mẫu và độ lệch chuẩn mẫu.
Cho {(x1 , y1 ); (x2 , y2 ); ...; (xn , yn )} là mẫu hai chiều của vectơ ngẫu nhiên (X, Y ). Hệ
Giải. Dạng thu gọn: số tương quan mẫu được xác định bởi:
X 19,2 19,6 20 20,4 20,8 Pn
(xi − x)(yi − y)
ni 15 25 30 20 10 r = pPn i=1 Pn
2 2
i=1 i − x)
(x i=1 (yi − y)
Các số đặc trưng mẫu: x̄ = 19, 94; s = 0, 48
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 14/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 15/32
Ví dụ 6
3. Biểu đồ Khảo sát số lần đi chợ (X) trong một tuần của một nhóm người được chọn ngẫu nhiên
trong chợ, ta được bảng số liệu sau:
a. Biểu đồ cho dữ liệu rời rạc:
- Biểu đồ cột: đồ thị gồm các cột hình chữ nhật có chiều cao bằng tần số (tần suất) X 1 2 3 4 5
tương ứng.
Tần số 12 30 20 11 7
- Đa giác tần số : đường gấp khúc nối các điểm (x1 , n1 ), ..., (xk , nk ) trên mặt phẳng.
- Đa giác tần suất: đường gấp khúc nối các điểm (x1 , f1 ), ..., (xk , fk ) trên mặt phẳng. Tần suất 0.15 0.4 0.3 0.14 0.1
- Biểu đồ hình tròn: hình tròn được chia ra các phần có góc ở tâm tỉ lệ với tần số (tần
Hãy vẽ các biểu đồ:
suất) tương ứng.
- biểu đồ cột (tần số, tần suất)
- đa giác tần số, tần suất
- biểu đồ hình tròn
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 16/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 17/32
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 18/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 19/32
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 20/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 21/32
b. Biểu đồ cho dữ liệu liên tục:
- Tổ chức đồ (histogram): Miền giá trị được chia làm m khoảng với độ dài các khoảng
lần lượt là hi (thường ta chọn hi = h). Khi đó tổ chức đồ của mẫu dữ liệu này gồm m
hình chữ nhật:
+ Đáy hình thứ i trùng với khoảng thứ i trên trục hoành, có độ dài hi .
+ Chiều cao của hình thứ i bằng di , trong đó:
⊲ di = ni : tổ chức đồ tần số
ni
⊲ di = : tổ chức đồ tần suất
n
ni
⊲ di = : tổ chức đồ mật độ
n.hi
với ni là số lượng các giá trị nằm trong khoảng thứ i và n = n1 + n2 + ... + nm .
Ví dụ 7
Dữ liệu được khảo sát từ biến ngẫu nhiên liên tục. Miền dữ liệu được chia thành 10
khoảng đều nhau. Các tổ chức đồ được xây dựng như ở hình sau đây.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 22/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 23/32
- Biểu đồ xác suất chuẩn: Giả sử mẫu số liệu của biến ngẫu nhiên liên tục X đã sắp thứ
tự tăng dần:
x1 ≤ x2 ≤ x3 ≤ ... ≤ xn .
Với i = 1, 2, ..., n, đặt
−1 i − 0.5
zi = Φ hay Φ(zi ) = (i − 0, 5)/n.
n
Biểu đồ xác suất chuẩn là tập hợp các điểm có tọa độ (zi ; xi ), i = 1, 2, ..., n trên hệ
trục tọa độ Descartes vuông góc Ozx.
Nếu (zi ; xi ), i = 1, 2, ..., n nằm xấp xỉ trên 1 đường thẳng thì có thể xem biến ngẫu
nhiên X có phân phối chuẩn. Đường thẳng này có phương trình: x = σ̂z + µ̂ , với
µ̂ = x̄, σ̂ = s - trung bình và độ lệch chuẩn mẫu được tính dựa trên mẫu đã cho.
Nhận xét: Ở các phần mềm thống kê, người ta còn sử dụng các cách thức khác để xây
dựng đường thẳng ở trên.
Ví dụ 8
Quan sát biểu đồ xác suất chuẩn sau đây.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 24/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 25/32
BIỂU ĐỒ XÁC SUẤT CHUẨN
4. Phân phối mẫu
6.5 a. Trường hợp tổng thể tuân theo phân phối chuẩn
Định lý 1: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
phối chuẩn N (µ; σ 2 ) thì
6.0
σ2 √
(X − µ) n
hay
5.5
X ∼ N µ, ∼ N (0, 1).
n σ
Định lý 2: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
5.0
√
(n − 1)S 2 2 (X − µ) n
∼ χn−1 , ∼ Tn−1
σ2 S
4.0
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 26/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 27/32
Định lý 3: Nếu {X1 , X2 , ..., Xn } và {Y1 , Y2 , ..., Ym } là hai mẫu ngẫu nhiên của hai biến
ngẫu nhiên độc lập X và Y có phân phối chuẩn N (µ1 ; σ12 ) và N (µ2 ; σ22 ) tương ứng thì:
! " - Nếu X là số lượng cá thể mang dấu hiệu A có tỉ lệ là p = P (A) trong mẫu ngẫu nhiên
σ12 σ22 kích thước n, thì
X − Y ∼ N µ1 − µ2 , +
n m X ∼ B(n, p)
2 /σ 2
Theo định lý Moivre-Laplace, nếu n lớn thì X có phân phối xấp xỉ N (np, np(1 − p)).
SX 1 Do đó, tỉ lệ mẫu
∼ Fn−1,m−1 .
SY2 /σ22 X
p̂ =
n
b. Trường hợp tổng thể không tuân theo luật phân phối chuẩn
- Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có E(X) = p(1 − p)
có phân phối xấp xỉ phân phối chuẩn N p,
µ, D(X) = σ 2 hữu hạn thì khi n lớn (n > 30) theo định lý giới hạn trung tâm: n
√
σ2 n(X − µ)
X có phân phối xấp xỉ N µ, và có phân phối xấp xỉ N (0, 1)
n S
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 28/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 29/32
Ví dụ 9 Ví dụ 10
Chiều cao của thanh niên tuân theo luật phân phối chuẩn với µ = 165(cm)
N (µ; σ 2 ), Để nghiên cứu về thâm niên công tác (tính tròn năm) của nhân viên ở một công ty lớn,
và σ = 5(cm). Tính xác suất chiều cao trung bình của 16 thanh niên được chọn ngẫu người ta khảo sát thâm niên của 100 nhân viên được chọn ngẫu nhiên trong công ty.
nhiên lớn hơn 167 (cm). Kết quả như sau:
Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 16. Thâm niên 5-7 8-10 11-13 14-16 17-19
Đặt X̄ = (X1 + ... + X16 )/16. Khi đó, X̄ cũng có phân phối chuẩn với trung bình Số nhân viên 8 21 36 25 10
µ = 165 và phương sai σ 2 /n = 25/16.
Xác suất cần tìm: a. Hãy tính giá trị trung bình mẫu và giá trị độ lệch chuẩn mẫu.
b. Giả sử thâm niên công tác của nhân viên ở công ty trên là biến ngẫu nhiên X có kỳ
167 − 165
P (X̄ > 167) = 1 − P (X̄ ≤ 167) = 1 − Φ = 0.0548 vọng là 12 năm và độ lệch chuẩn là 3 năm. Tính xác suất để trung bình mẫu nhận giá
5/4 trị lớn hơn 12,5 năm.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 30/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 31/32
Thâm niên 6 9 12 15 18
Số nhân viên 8 21 36 25 10
XÁC SUẤT THỐNG KÊ
a. Các số đặc trưng mẫu: x̄ = 12, 24; s = 3, 27.
b. Theo định lý giới hạn trung tâm X̄ có phân phối xấp xỉ chuẩn N (12; 32 /100) =
N (12; 0, 09). Do đó: Tôn Thất Tú
12, 5 − 12
P (X̄ > 12, 5) = 1 − Φ √ = 0.0478
0, 09 Đà Nẵng, 2021
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 32/32 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 1/45
Chương 5. Ước lượng tham số 1.2 Phân loại ước lượng
- Ước lượng θ̂ = θ̂(X1 , ..., Xn ) được gọi là ước lượng không chệch của tham số θ nếu
E(θ̂) = θ.
1. Ước lượng điểm Trong trường hợp ngược lại thì ta gọi θ̂ được gọi là ước lượng chệch và giá trị b(θ) =
E(θ̂) − θ được gọi là độ chệch của ước lượng.
1.1 Định nghĩa - Ước lượng θ̂ = θ̂(X1 , ..., Xn ) được gọi là ước lượng không chệch tiệm cận của tham
số θ nếu
- Cho mẫu ngẫu nhiên {X1 , X2 , ..., Xn } từ tổng thể có phân phối phụ thuộc vào
lim E(θ̂) = θ.
tham số θ chưa biết. Khi đó, một hàm (thống kê) θ̂ = θ̂(X1 , ..., Xn ) được gọi là một n→+∞
ước lượng của tham số θ.
- Cho θ̂1 và θ̂2 là hai ước lượng không chệch của tham số θ.
- Với một mẫu giá trị cụ thể {x1 , x2 , ..., xn } ta thu được một giá trị cụ thể của θ̂.
Khi đó, giá trị θ̂(x1 , ..., xn ) được gọi là ước lượng điểm của tham số θ dựa trên mẫu giá D(θ̂1 ) = E(θ̂1 − E θ̂1 )2 = E(θ̂1 − θ)2 và D(θ̂2 ) = E(θ̂2 − E θ̂2 )2 = E(θ̂2 − θ)2
trị {x1 , x2 , ..., xn }.
Ta nói ước lượng θ̂1 hiệu quả hơn ước lượng θ̂2 nếu D(θ̂1 ) < D(θ̂2 ).
- Ước lượng θ̂ của θ là ước lượng không chệch và có phương sai D(θ̂) bé nhất được
gọi là ước lượng tốt nhất.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 2/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 3/45
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 4/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 5/45
Ví dụ 1
- Cho biến ngẫu nhiên X có kỳ vọng µ và phương sai σ 2 chưa biết. Để ước lượng
cho µ và σ 2 người ta tiến hành điều tra mẫu kích thước 200 và tính được trung bình và - Nếu {x1 , x2 , ..., xn } là mẫu ngẫu nhiên kích thước n của phân phối liên tục có hàm
phương sai chuẩn mẫu: mật độ xác suất f (x, θ) với θ là tham số chưa biết thì hàm hợp lí L(θ) là hàm được
x̄ = 125, 8; s2 = 2, 76
định nghĩa như sau:
n
Khi đó, ta có thể xem µ ≈ 125, 8 và σ 2 ≈ 2, 76. Y
L(θ) = f (xi , θ).
- Để ước lượng tỉ lệ p cử tri ủng hộ cho ứng cử viên A, người ta khảo sát ngẫu nhiên
i=1
4000 người thì có 2640 người ủng hộ ứng cử viên này. Như vậy, ta có thể xem tỉ lệ ủng
hộ ứng cử viên A xấp xỉ: Nhận xét: Hàm hợp lí L(θ) chính là hàm xác suất (mật độ xác suất) đồng thời của
p ≈ 2640/4000 = 0, 66 mẫu ngẫu nhiên.
1.3 Phương pháp hợp lý cực đại
Định nghĩa: Định nghĩa: Cho hàm hợp lí L(θ) với tham số θ chưa biết. Nếu θM L là giá trị tham số
- Cho {k1 , k2 , ..., kn } là mẫu ngẫu nhiên kích thước n của phân phối rời rạc X có hàm thỏa mãn L(θM L ) ≥ L(θ) với mọi θ thì θM L được gọi là ước lượng hợp lí cực đại của
xác suất p(k, θ) với θ là tham số chưa biết. Hàm hợp lí L(θ) là hàm được định nghĩa tham số θ.
như sau: Yn
L(θ) = p(ki , θ).
i=1
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 6/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 7/45
Ví dụ 2
Tìm ước lượng tham số của phân phối Poisson bằng phương pháp hợp lí cực đại.
Nhận xét:
i) Trong thực hành để tìm ước lượng hợp lý cực đại ta giải phương trình: Giải. Phân phối Poisson với tham số λ có hàm xác suất:
λx −λ
L′ (θ) = 0 hoặc [ln(L(θ))]′ = 0 f (x) = e , x = 0, 1, ...
x!
ii) Trường hợp θ là một vectơ các tham số, tức là θ = (θ1 , ..., θm ), để tìm ước lượng Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý L(λ)
hợp lý cực đại ta giải hệ phương trình sau đây: được xác định: n Pn
Y λ i=1 xi −nλ
L(λ) = f (xi ) = Qn e .
∂L(θ) ∂ ln L(θ) i=1 i=1 xi !
= 0, = 0,
∂θ1 ∂θ1 Suy ra:
n n
hoặc
X Y
··· ··· ln L(λ) = xi ln(λ) − ln( xi !) − nλ.
∂L(θ) ∂ ln L(θ)
i=1 i=1
∂θ = 0, = 0.
∂θ n n
m m Do đó: d ln L(λ) 1 X 1X
= xi − n = 0 ⇔ λ = xi .
dλ λ n
i=1 i=1
Vậy, ước lượng hợp lý cực đại λM L của λ là: λM L = n1 ni=1 xi .
P
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 8/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 9/45
Ví dụ 3 Do đó: ∂ ln L(µ, σ 2 )
Pn
(xi − µ)
= i=1 2 ,
Tìm ước lượng tham số của phân phối chuẩn N (µ; σ 2 ) bằng phương pháp ước lượng ∂µ σ
hợp lí cực đại. ∂ ln L(µ, σ 2 )
Pn 2
n i=1 (xi − µ)
= − + .
∂σ 2 2σ 2 2σ 4
Giải. Phân phối chuẩn N (µ, σ 2 ) có hàm mật độ xác suất:
Giải hệ:
∂ ln L(µ, σ 2 )
=0
! "
(x − µ)2
1
∂µ
f (x) = √ exp − . 2
σ 2π 2σ 2 ∂ ln L(µ, σ )
= 0,
∂σ 2
n n
Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý theo µ, σ 2 ta được: 1X 1X
µ= xi = x̄ và σ 2 = (xi − x̄)2 .
L(µ, σ 2 ) được xác định: n n
i=1 i=1
n
! P "
n
2
Y 1 i=1 (xi − µ)2
L(µ, σ ) = f (xi ) = √ exp − . 2 ) của (µ, σ 2 ) là:
Vậy ước lượng hợp lý cực đại (µM L , σM L
σ n ( 2π)n 2σ 2 n
i=1 1X
µM L = x̄ và σM2
L = (xi − x̄)2 .
Suy ra: n
Pn
n n i=1 (xi − µ)2 i=1
ln L(µ, σ ) = − ln(σ 2 ) − ln(2π) −
2
.
2 2 2σ 2
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 10/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 11/45
Phương pháp chung xây dựng khoảng tin cậy với độ tin cây cậy 1 − α:
2. Khoảng tin cậy i) chọn hai số α1 , α2 ∈ (0, 1) sao cho α1 + α2 = α.
ii) xây dựng thống kê:
2.1 Định nghĩa Gn = Gn (X1 , ..., Xn , θ)
Cho biến ngẫu nhiên X có phân phối phụ thuộc vào tham số θ chưa biết và
sao cho phân phối của Gn hoàn toàn xác định (hoặc phân phối giới hạn của Gn khi
{X1 , X2 , ..., Xn } là một mẫu ngẫu nhiên từ phân phối này. Trên cơ sở mẫu ngẫu nhiên
n → ∞ xác định) và không phụ thuộc vào tham số θ. Ngoài ra, Gn là một hàm đơn
này ta xây dựng hai hàm L = L(X1 , ..., Xn ) và U = U (X1 , ..., Xn ) sao cho với một số
điệu theo θ.
α ∈ (0, 1) cho trước ta có:
iii) Chọn hai số a và b sao cho P (Gn ≤ a) = α1 và P (Gn < b) = 1 − α2 .
P (L < θ < U ) = 1 − α. (*) iv) Giải bất phương trình a < Gn (X1 , ..., Xn , θ) < b theo θ ta được khoảng tin cậy cần
tìm.
Khi đó, khoảng (L, U ) được gọi là khoảng tin cậy của tham số θ với độ tin cậy 1 − α.
Giá trị α được gọi là mức ý nghĩa. Hiệu số U − L được gọi là độ dài khoảng tin cậy. Nhận xét:
Ý nghĩa: Nếu ta thực hiện việc lấy mẫu nhiều lần và mỗi lần ta đều tính khoảng tin i) Trong một số trường hợp, các giá trị L, U trong định nghĩa có thể được chọn sao cho:
cậy (L, U ) dựa trên mẫu thu được, thì tỉ lệ khoảng tin cậy chứa giá trị chính xác θ xấp
P (L < θ < U ) ≥ 1 − α.
xỉ 1 − α.
ii) Nếu α1 = 0 hoặc α2 = 0 ta được các khoảng tin cậy 1 phía.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 12/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 13/45
2.2 Khoảng tin cậy cho kì vọng khi đã biết phương sai
Bài toán. Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ chưa biết và σ 2 đã biết. Tìm khoảng tin cậy cho µ với mức ý nghĩa α.
Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì
√
(X − µ) n
Z= ∼ N (0; 1).
σ
- Với α ∈ (0; 1), chọn α1 = α2 = α/2 và chọn zα/2 sao cho P (Z > zα/2 ) = α/2. Giá
trị zα/2 được gọi là giá trị tới hạn mức α/2 của phân phối chuẩn tắc. Sau đó, ta giải
bất phương trình:
σ σ
−zα/2 < Z < zα/2 ⇔ X − zα/2 √ < µ < X + zα/2 √
n n
a. Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
σ σ
x − zα/2 √ < µ < x + zα/2 √ ,
n n
Nhận xét: Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả
trên vẫn áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu
nhiên X.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 16/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 17/45
Ví dụ 4
b. Vấn đề cỡ mẫu
Khối lượng (kg) của một thiết bị có phân phối chuẩn N (µ; σ 2 ) với σ = 0.2 (kg). Chọn
Từ công thức khoảng tin cậy cho µ ta thấy rằng sai số của ước lượng |x − µ| bé hơn
ngẫu nhiên 25 thiết bị người ta tính được trung bình mẫu x = 65, 1 (kg). Với độ tin cậy σ
hoặc bằng zα/2 √ .
95% hãy tìm khoảng tin cậy (đối xứng) cho khối lượng trung bình của thiết bị này. Cho n
biết z0,025 = 1, 96. - Sai số ước lượng:
σ
ε = zα/2 √
Giải. n
- Các số đặc trưng mẫu: n = 25; x̄ = 65, 1. - Điều kiện hạn chế: ε < ∆ với ∆ > 0 cho trước.
- Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96.
σ
- Sai số ước lượng: ε = zα/2 √ < ∆
σ 0, 2 n
ε = zα/2 √ = 1, 96 ∗ √ = 0, 0784
n 25
- Giải bất phương trình theo n:
- Khoảng tin cậy cho khối lượng trung bình µ của thiết bị này: 2
zα/2 σ
x̄ − ε < µ < x̄ + ε ⇔ 65, 02 < µ < 65, 18 n> .
∆
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 18/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 19/45
Ví dụ 5
2.3 Khoảng tin cậy cho kì vọng khi chưa biết phương sai
Trở lại với Ví dụ 4 nếu yêu cầu sai số ước lượng không vượt quá 0,05 thì với độ tin cậy
98% ta cần chọn tối thiểu bao nhiêu thiết bị để khảo sát? Cho biết z0,01 = 2, 326. Bài toán: Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ và σ 2 chưa biết. Tìm khoảng tin cậy cho µ với độ tin cậy 1 − α.
Giải. Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì
- Sai số ước lượng: √
σ (X − µ) n
ε = zα/2 √ T = ∼ Tn−1
n S
- Điều kiện hạn chế: ε < ∆ = 0, 05. - Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị tn−1;α/2 là giá trị tới hạn của
- Suy ra: phân phối Tn−1 , tức là P (T > tn−1;α/2 ) = α/2. Sau đó, giải phương trình:
zα/2 σ 2
n> .
∆ S S
−tn−1;α/2 < T < tn−1;α/2 ⇔ X − tn−1;α/2 √ < µ < X + tn−1;α/2 √
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326. n n
Do đó:
2, 326 ∗ 0, 2 2
n> = 86, 56 - Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay tn−1;α/2 bởi tn−1;α và thu được khoảng
0, 05 tin cậy một phía.
Vậy, kích thước mẫu tối thiểu cần khảo sát: n = 87
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 20/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 21/45
Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
s s
x − tn−1;α/2 √ < µ < x + tn−1;α/2 √ ,
n n
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 22/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 23/45
Nhận xét:
i) Khi n > 30: tn−1;α/2 ≈ zα/2 . Giải. Theo giả thiết:
n = 16; x̄ = 24308; s = 727
ii) Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả trên vẫn
áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu nhiên X. Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 = t15;0,025 = 2, 1314
Lúc đó, ta thay tn−1;γ bởi zγ với γ = α hoặc γ = α/2. Sai số:
s 727
ε = tn−1;α/2 √ = 2, 1314 ∗ √ = 387, 382
Ví dụ 6 n 16
Một mẫu 16 pin dùng cho smartphone được chọn ngẫu nhiên của công ty A có tuổi thọ Khoảng tin cậy cho tuổi thọ trung bình của pin smartphone:
trung bình tính trên mẫu x = 24308 (giờ) và độ lệch chuẩn mẫu s = 727 (giờ). Giả sử
x̄ − ε < µ < x̄ + ε ⇔ 23920.618 < µ < 24695.382
rằng tuổi thọ pin smartphone có phân phối chuẩn. Với độ tin cậy 95%, hãy tìm khoảng
tin cậy cho tuổi thọ trung bình của pin smartphone được sản xuất bởi công ty A. Cho
biết t15;0,025 = 2, 1314.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 24/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 25/45
Ví dụ 7
Năng suất (tạ/ha) của một loại cây trồng tuân theo luật phân phối chuẩn. Hãy tìm ước
lượng khoảng đối xứng năng suất trung bình của một loại cây trồng này với độ tin cậy Các số đặc trưng mẫu:
95% trên cơ sở bảng số liệu điều tra sau đây: n = 36; x̄ = 56, 028; s = 5, 321
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 ≈ zα/2 = z0,025 = 1, 96
Năng suất(tạ/ha) 42-47 47-52 52-57 57-62 62-67
Sai số:
Số điểm thu hoạch 2 5 14 10 5 s 5, 321
ε = tn−1;α/2 √ = 1, 96 ∗ √ = 1, 738
n 36
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
Khoảng tin cậy cho năng suất trung bình:
Giải. Dạng thu gọn: x̄ − ε < µ < x̄ + ε ⇔ 54, 29 < µ < 57, 766
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 26/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 27/45
(n − 1)S 2
χ2 = ∼ χ2n−1 .
σ2
- Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị χ2n−1;α/2 , χ2n−1;1−α/2 là giá trị
tới hạn mức α/2 và 1 − α/2 của phân phối χ2n−1 , ta được khoảng tin cậy hai phía.
- Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay χ2n−1;α/2 bởi χ2n−1;α , χ2n−1;1−α/2 bởi
χ2n−1;1−α và thu được khoảng tin cậy một phía.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 28/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 29/45
Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy hai phía cho σ 2 :
Ví dụ 8
(n − 1)s2 (n − 1)s2
< σ 2
< , Một dây chuyền tự động đóng gạo vào bao được kiểm tra. Cân thử 25 bao gạo do dây
χ2n−1;α/2 χ2n−1;1−α/2 chuyền này thực hiện thì tính được độ lệch chuẩn khối lượng gạo mỗi bao s = 0, 15
(kg). Với độ tin cậy 95% tìm khoảng tin cậy cho phương sai của khối lượng gạo được
- Khoảng tin cậy tối đa cho phương sai σ 2 : đóng cho mỗi bao bởi dây chuyền này. Giả thiết khối lượng gạo được đóng cho mỗi bao
tuân theo luật phân phối chuẩn. Cho biết: χ224;0.025 = 39, 364, χ224;0.975 = 12, 401.
(n − 1)s2
0 < σ2 < .
χ2n−1;1−α
Đáp số: 0, 0137 < σ 2 < 0, 0435.
- Khoảng tin cậy tối thiểu cho phương sai σ 2 :
(n − 1)s2
< σ 2 < +∞.
χ2n−1;α
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 30/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 31/45
b. Nhận xét
b. - Tỉ lệ mẫu: i) Khoảng tin cậy cho số lượng cá thể
k 50
p̂ = = = 0, 125 Từ khoảng tin cậy cho tỉ lệ ta có thể suy ra khoảng tin cậy cho số lượng cá thể mang
n 400
dấu hiệu nghiên cứu hoặc số lượng cá thể của tổng thể. Cụ thể:
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα = z0,02 = 2, 054 - Gọi K và N lần lượt là số lượng cá thể mang dấu hiệu nghiên cứu và số lượng cá thể
- Sai số: của tổng thể. Khi đó, tỉ lệ dấu hiệu nghiên cứu:
r r
p̂(1 − p̂) 0, 125 ∗ (1 − 0, 125) K
ε = zα = 2, 054 ∗ = 0, 034 p= (1)
n 400 N
- Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm p: - Dựa trên mẫu điều tra, ta ước lượng được khoảng tin cậy cho tỉ lệ p:
Từ (1) và (2) suy ra khoảng tin cậy cho giá trị K hoặc N.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 36/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 37/45
Ví dụ 10 Ví dụ 11
Trong một cuộc bầu cử ở một địa phương có 10000 cử tri. Người ta phỏng vấn ngẫu Để ước lượng số lượng cá có trong hồ, người ta làm như sau. Bắt ngẫu nhiên 500 con
nhiên 300 cử tri thì thấy có 156 người ủng hộ cho ứng cử viên A. Với độ tin cậy 95% cá, sau đó đánh dấu vào các con cá đã được bắt và thả chúng xuống hồ. Sau đó bắt
tìm khoảng tin cậy (đối xứng) cho số lượng cử tri ở địa phương này ủng hộ cho ứng cử ngẫu nhiên 200 con cá để kiểm tra thì thấy có 30 con có đánh dấu. Với độ tin cậy 90%
viên A. tìm khoảng tin cậy đối xứng cho số lượng cá có trong hồ.
Giải. Gọi K là số lượng cử tri ở địa phương này ủng hộ ứng cử viên A. Ta có tỉ lệ ủng Giải. Gọi N là số lượng cá trong hồ. Ta có tỉ lệ cá được đánh dấu: p = 500/N .
hộ ứng cử viên A: p = K/10000. Tỉ lệ mẫu: p̂ = k/n = 30/200 = 0, 15
Tỉ lệ mẫu: p̂ = k/n = 156/300 = 0, 52 Độ tin cậy: 1 − α = 0, 9 ⇒ α = 0, 1; zα/2 = z0,05 = 1, 645
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96 Sai số: r r
Sai số: p̂(1 − p̂) 0, 15 ∗ 0, 85
ε = zα/2 = 1, 645 ∗ = 0, 0415
r r
p̂(1 − p̂) 0, 52 ∗ 0, 48 n 200
ε = zα/2 = 1, 96 ∗ = 0, 0565
n 300
Khoảng tin cậy cho tỉ lệ cá được đánh dấu:
Khoảng tin cậy cho tỉ lệ ủng hộ:
p̂ − ε < p < p̂ + ε ⇔ 0, 1085 < p < 0, 1915
p̂ − ε < p < p̂ + ε ⇔ 0, 4635 < p < 0, 5765
Từ đó, suy ra: Từ đó, suy ra:
0, 4635 < K/10000 < 0, 5765 ⇔ 4635 < K < 5765 0, 1085 < 500/N < 0, 1915 ⇔ 2610, 9 < N < 4608, 3
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 38/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 39/45
Ví dụ 12
ii) Vấn đề về cỡ mẫu
- Sai số ước lượng: Một cuộc khảo sát sức khỏe cộng đồng đang được lên kế hoạch trong một khu vực đô
thị lớn với mục đích ước tính tỷ lệ trẻ em từ 0 đến 14 tuổi chưa được tiêm chủng bại
r
p̂(1 − p̂)
ε = zα/2 liệt đầy đủ. Các nhà tổ chức của dự án muốn tỷ lệ mẫu của trẻ không được tiêm chủng
n
đầy đủ k/n phải nằm trong khoảng của tỷ lệ thực p với sai số ±0, 05 với xác suất tối
- Điều kiện hạn chế: ε ≤ ∆, ∆ > 0 cho trước. thiểu 98%. Hỏi kích thước mẫu điều tra tối thiểu là bao nhiêu?
- Giả sử giá trị p̂ không biến động lớn khi tính tính trên các mẫu khác nhau, khi đó: Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
2
zα/2
n≥ p̂(1 − p̂). Giải. Sai số ước lượng:
∆ r
p̂(1 − p̂)
ε = zα/2
- Trong trường hợp không có dữ liệu để tính giá trị p̂, sử dụng bất đẳng thức p̂(1 − p̂) ≤ n
1/4 ta thu được bất đẳng thức: Điều kiện: ε ≤ ∆ = 0, 05. Suy ra:
2 2
zα/2 zα/2
1
n≥ . n≥ p̂(1 − p̂).
4 ∆ ∆
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 40/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 41/45
Ví dụ 13
Vì p̂ chưa biết nên áp dụng bất đẳng thức p̂(1 − p̂) ≤ 1/4 ta thu được: Sản lượng gạo bán ra trong 1 ngày có phân phối chuẩn. Điều tra sản lượng bán ra trong
2 120 ngày, ta được bảng số liệu sau:
zα/2
1
n≥ .
4 ∆ Sản lượng (kg) 400-440 440-480 480-520 520-560 560-600 600-640 640-680
Số ngày 4 9 15 23 30 22 17
Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326. Do đó:
2 a) Với độ tin cậy 95% tìm khoảng tin cậy đối xứng cho số tiền bán ra trung bình trong
1 2, 326 một ngày. Biết giá mỗi kg gạo là 15.000 đồng.
n≥ = 541, 0276
4 0, 05 b) Ngày có sản lượng gạo bán ra không nhỏ hơn 560 kg được gọi là ngày cao điểm. Với
độ tin cậy 98%, tìm khoảng tin cậy đối xứng cho số ngày cao điểm trong 1000 ngày
Vậy, n = 542. bán.
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 42/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 43/45
Giải.
a. Dạng thu gọn: b. Gọi K là số ngày cao điểm trong 1000 ngày. Ta có tỉ lệ ngày cao điểm: p = K/1000.
Tỉ lệ mẫu ngày cao điểm:
Sản lượng (kg) 420 460 500 540 580 620 660
k 30 + 22 + 17
Số ngày 4 9 15 23 30 22 17 p̂ = = = 0, 575
n 120
Các số đặc trưng mẫu: n = 120; x̄ = 566, 67; s = 64 Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326.
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 = t119;0,025 ≈ z0,025 = 1, 96. Sai số: r r
Sai số: p̂(1 − p̂) 0, 575 ∗ (1 − 0, 575)
s 64 ε = zα/2 = 2, 326 ∗ = 0, 105
ε = tn−1;α/2 √ = 1, 96 ∗ √ = 11, 45 n 120
n 120
Khoảng tin cậy cho tỉ lệ ngày cao điểm p:
Khoảng tin cậy cho khối lượng gạo trung bình bán được trong 1 ngày:
x̄ − ε < µ < x̄ + ε ⇔ 555, 22 < µ < 578, 12 p̂ − ε < p < p̂ + ε ⇔ 0, 47 < p < 0, 68
Khoảng tin cậy cho số tiền T (ngàn đồng) trung bình bán được trong 1 ngày: Suy ra:
555, 22 ∗ 15 < T < 578, 12 ∗ 15 ⇔ 8328, 3 < T < 8671, 8 0, 47 < K/1000 < 0, 68 ⇔ 470 < K < 680
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 44/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 45/45
Chương 6: Kiểm định giả thuyết thống kê
1. Các khái niệm
Ví dụ 1
Tôn Thất Tú
X Tuổi thọ người Việt tuân theo luật phân phối chuẩn N (µ, σ 2 ), với µ, σ chưa biết.
Giả thuyết thống kê có thể là: µ = 60 (tuổi) hoặc µ > 60, hoặc µ 6= 60, ...
X Nghiên cứu về chiều cao (X) của người Việt. Giả thuyết thống kê có thể là: X có
Đà Nẵng, 2021 phân phối chuẩn, X có phân phối mũ, ...
X Nghiên cứu tên của bố (X), tên của mẹ (Y ) và tên của người con thứ nhất (Z).
Giả thuyết thống kê: Z có mối quan hệ với X và Y , Z không có mối quan hệ với X và
Y , ...
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 1/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 2/47
Lúc đó, miền Wα được gọi là miền bác bỏ với mức ý nghĩa α.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 3/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 4/47
1.4 Sai lầm khi kiểm định
- Sai lầm loại I: Sai lầm mắc phải khi bác bỏ H0 nhưng trong khi thực tế là H0 là giả
1.3 Các bước tiến hành thuyết đúng. Xác suất mắc sai lầm loại 1 được kí hiệu: α.
- Sai lầm loại II: Sai lầm mắc phải khi chấp nhận H0 trong khi thực tế là H0 là giả
Khi cho trước mức ý nghĩa α ta có thể sử dụng các bước gợi ý sau đây để tiến hành
thuyết sai. Xác suất mắc sai lầm loại 2 được kí hiệu: β.
giải bài toán kiểm định:
Bảng dưới đây tổng hợp lại các trường hợp:
- Xác định giả thuyết H0 , H1 và phát biểu bài toán.
- Chọn thống kê kiểm định T và tính giá trị của nó trên mẫu dữ liệu thu được (kí Thực tế
hiệu là Ts ). H0 đúng H0 sai
Quyết định
- Xác định miền bác bỏ Wα với mức ý nghĩa α cho trước.
- Kết luận: Nếu Ts ∈ Wα thì bác bỏ giả thuyết H0 . Ngược lại, ta chưa có cơ sở bác Bác bỏ H0 sai lầm loại I quyết định đúng
bỏ H0 nên tạm thời chấp nhận giả thuyết này. Chấp nhận H0 quyết định đúng sai lầm loại II
Như vậy,
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 5/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 6/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 7/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 8/47
2. Kiểm định giả thuyết về kì vọng của phân phối chuẩn
Ta sẽ bác bỏ H0 nếu X quá khác biệt so với µ0 hay nói cách khác, |Z| > c > 0 với c
là một hằng số nào đó.
- Miền bác bỏ với mức ý nghĩa α: Wα = (−∞; −zα/2 ] ∪ [zα/2 ; +∞).
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 9/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 10/47
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 11/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 12/47
Ví dụ 2
Nguồn cấp điện cho máy tính đạt tiêu chuẩn là 19 volt. Đo nguồn cấp điện của một mẫu
25 sạc pin được chọn ngẫu nhiên của hãng sản xuất A người ta tính được x = 19, 25
volt. Giả sử nguồn cấp điện này có phân phối chuẩn với độ lệch chuẩn σ = 0, 5 volt. Với
mức ý nghĩa α = 0, 05 hãy kiểm định giả thuyết gốc H0 : µ = 19 (volt) với đối thuyết
H1 : µ > 19 (volt), trong đó µ là nguồn cấp điện trung bình của loại sạc pin trên.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Giải. Bài toán kiểm định:
(
H0 : µ = 19
H1 : µ > 19
Các số đặc trưng mẫu: n = 25; x̄ = 19, 25. √ √
(x̄ − µ0 ) n (19, 25 − 19) 25
Giá trị của thống kê kiểm định: z = = = 2, 5.
Bài toán II Bài toán III σ 0, 5
Mức ý nghĩa: α = 0, 05 ⇒ zα = z0,05 = 1, 645.
Miền bác bỏ: Wα = [1, 645; +∞).
Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 và chấp nhận H1 .
Cách khác: p-giá trị = 1 − Φ(2.5) = 0.0062 < α = 0.05 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 13/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 14/47
Ví dụ 3
Trong năm trước khối lượng trung bình của bò xuất chuồng ở một trang trại là 380kg.
Năm nay người ta áp dụng thử một chế độ ăn mới với hy vọng là bò sẽ tăng trọng
nhanh hơn. Sau thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con bò xuất chuồng 2.2 Khi phương sai chưa biết
đem cân và tính được khối lượng trung bình của chúng là x = 390kg. Với mức ý nghĩa Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với kì vọng µ
α = 0, 02 có thể cho rằng khối lượng trung bình của bò xuất chuồng đã tăng lên không? chưa biết và phương sai σ 2 chưa biết.
Giả sử rằng khối lượng của bò có phân phối chuẩn với độ lệch chuẩn σ = 25, 2kg. Xét bài toán kiểm định với H0 : µ = µ0 và đối thuyết H1 : µ 6= µ0 (µ > µ0 , µ < µ0 ).
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326 Khi giả thuyết H0 : µ = µ0 đúng, thống kê:
Giải. Gọi µ(kg) là khối lượng trung bình của bò xuất chuồng. Theo giả thiết, ta có bài √
toán kiểm định: (X − µ0 ) n
( T =
H0 : µ = 380 S
H1 : µ > 380
√ √ có phân phối Student n − 1 bậc tự do.
(x̄ − µ0 ) n (390 − 380) 50
Giá trị của thống kê kiểm định: z = = = 2, 806.
σ 25, 2
Mức ý nghĩa: α = 0, 02 ⇒ zα = z0,02 = 2, 054. Miền bác bỏ: Wα = [2, 054; +∞).
Vì z ∈ Wα nên ta bác bỏ H0 . Vậy, khối lượng trung bình bò xuất chuồng đã tăng lên.
Cách khác: p-giá trị = 1 − Φ(2.806) = 0.0025 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 15/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 16/47
Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 chưa biết.
Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: t =
s
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ 6= µ0 (−∞; −tn−1;α/2 ] ∪ [tn−1;α/2 ; +∞) 2P (Tn−1 > |t|)
H 1 : µ > µ0 [tn−1;α ; +∞) P (Tn−1 > t)
H 1 : µ < µ0 (−∞; −tn−1;α ] P (Tn−1 < t)
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 17/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 18/47
Ví dụ 4
Tuổi thọ trung bình của một loại bóng đèn do nhà máy A sản xuất khi chưa cải tiến kĩ
- Thống kê kiểm định:
thuật là 2000 giờ. Sau thời gian cải tiến kĩ thuật người ta chọn ngẫu nhiên 25 bóng đèn
cho lắp thử nghiệm. Kết quả thực nghiệm thu được tuổi thọ trung bình mẫu x = 2022 √ √
(x̄ − µ0 ) n (2022 − 2000) 25
giờ và độ lệch chuẩn mẫu s = 30 giờ. Với mức ý nghĩa 0, 025 có thể kết luận “sau khi t=
s
=
25
= 3.67
cải tiến kĩ thuật, tuổi thọ trung bình của bóng đèn có tăng lên” không? Biết tuổi thọ
bóng đèn có phân phối chuẩn. Cho biết t24;0,025 = 2, 063. - Mức ý nghĩa: α = 0, 025; tn−1;α = t24;0,025 = 2, 063
- Miền bác bỏ: Wα = [2, 063; +∞)
Giải. Gọi µ(giờ) là tuổi thọ trung bình của loại bóng đèn sau cải tiến. Ta có bài toán Vì t ∈ Wα nên ta bác bỏ H0 và chấp nhận H1 . Vậy, sau cải tiến kỹ thuật tuổi thọ trung
kiểm định: bình của bóng đèn đã tăng lên.
Cách khác: p-giá trị = 1 − P (T24 < 3.67) = 0.0006 < α = 0.025 nên bác bỏ H0 .
(
H0 : µ = 2000
H1 : µ > 2000
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 19/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 20/47
Ví dụ 5 Giải. a. Dạng thu gọn:
Một xí nghiệp có 5000 công nhân cùng sản xuất một loại sản phẩm. Theo dõi thời gian
hoàn thành sản phẩm của 100 công nhân, ta được bảng số liệu sau: Thời gian (ph) 29 31 33 35 37 39
Thời gian (ph) 28-30 30-32 32-34 34-36 36-38 38-40 Số công nhân 5 15 25 30 20 5
Số công nhân 5 15 25 30 20 5
Các số đặc trưng mẫu: n = 100; x̄ = 34, 2; s = 2, 494
a) Tìm khoảng tin cậy đối xứng cho thời gian hoàn thành trung bình với độ tin cậy 90%. Độ tin cậy: 1 − α = 0, 9 ⇒ α = 0, 1; tn−1;α/2 = t99;0,05 ≈ z0,05 = 1, 645
b) Công nhân có tay nghề cao nếu thời gian hoàn thành 1 sản phẩm dưới 32ph. Với Sai số: s
ε = tn−1;α/2 √ = 1, 645 ∗ √
2, 494
= 0, 41
độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số công nhân có tay nghề cao của xí n 100
nghiệp. Khoảng tin cậy cho thời gian hoàn thành trung bình:
c) Xí nghiệp quy định định mức hoàn thành trung bình 1 sản phẩm là 34 phút. Có ý
kiến cho rằng định mức này có hại cho công nhân. Với mức ý nghĩa 2% hãy nhận xét x̄ − ε < µ < x̄ + ε ⇔ 33, 79 < µ < 34, 61
về ý kiến đó.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 21/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 22/47
c. Gọi µ (ph) là thời gian hoàn thành trung bình 1 sản phâm của công nhân. Ta có bài
b. Gọi K là số công nhân có tay nghề cao. Tỉ lệ công nhân có tay nghề cao: p = K/5000. toán kiểm định: (
Tỉ lệ mẫu công nhân có tay nghề cao: H0 : µ = 34
H1 : µ > 34
p̂ = k/n = (5 + 15)/100 = 0, 2
- Thống kê kiểm định:
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96
√ √
Sai số: (x̄ − µ0 ) n (34, 2 − 34) 100
r r
p̂(1 − p̂) 0, 2 ∗ 0, 8 t= = = 0, 802
ε = zα/2 = 1, 96 ∗ = 0, 0784 s 2, 494
n 100
Khoảng tin cậy cho tỉ lệ công nhân có tay nghề cao: - Mức ý nghĩa: α = 0, 02; tn−1;α = t99;0,02 ≈ z0,02 = 2, 054
- Miền bác bỏ: Wα = [2, 054; +∞)
p̂ − ε < p < p̂ + ε ⇔ 0, 1216 < p < 0, 2784 / Wα nên ta chưa có cơ sở bác bỏ H0 . Vậy, định mức quy định không gây hại cho
Vì t ∈
công nhân.
Suy ra: 0, 1216 < K/5000 < 0, 2784 ⇔ 608 < K < 1392.
Cách khác: p-giá trị = 1 − P (T99 < 0.802) = 0.2122369 > α = 0.02 nên chưa có cơ
sở bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 23/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 24/47
3. So sánh hai kỳ vọng của hai mẫu độc lập
Cho X và Y biến số ngẫu nhiên của hai tổng thể độc lập nhau và lần lượt có phân phối
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết; m > 30 và
chuẩn N (µx ; σx2 ) và N (µy ; σy2 ) với phương sai σx2 , σy2 chưa biết.
n > 30.
Xét bài toán kiểm định với Giả thuyết thống kê H0 : µx − µy = ∆0
H0 : µ x − µ y = ∆0 x − y − ∆0
Giá trị thống kê kiểm định: z = r
và đối thuyết H1 : µx − µy 6= ∆0 (µx − µy > ∆0 , µx − µy < ∆0 ). s2x s2y
+
Giả sử (x1 , ..., xm ) và (y1 , ..., yn ) là các mẫu thu được từ X và Y tương ứng. m n
Chỉ xét trường hợp khi cỡ mẫu lớn (m,n>30).
Khi đó, áp dụng Định lí giới hạn trung tâm ta có: Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µx − µy 6= ∆0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
(X − Y ) − (µx − µy )
Z= r H1 : µ x − µ y > ∆0 [zα ; +∞) 1 − Φ(z)
Sx2 Sy2 H1 : µ x − µ y < ∆0 (−∞; −zα ] Φ(z)
+
m n
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 25/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 26/47
Ví dụ 6
Nhận xét: Khi ∆0 = 0, các bài toán kiểm định trên thường được viết lại dưới dạng:
Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn, kết quả thu được:
(
H0 : µ x = µ y Khu vực Số trẻ Trung bình mẫu Phương sai mẫu
(I)
H1 : µx 6= µy Nông thôn m = 60 x = 3, 0 kg s2x = 0, 4 kg2
( Thành thị n = 50 y = 3, 1 kg s2y = 0, 5 kg2
H0 : µ x = µ y
(II) Với mức ý nghĩa 0, 05 có thể coi khối lượng trung bình của trẻ sơ sinh ở hai khu vực
H 1 : µ x < µy
khác nhau không? Biết khối lượng trẻ sơ sinh ở hai khu vực có phân phối chuẩn. Cho
biết z0.025 = 1.96
(
H0 : µ x = µ y
(III)
H1 : µ x > µ y Giải. Gọi µx , µy (kg) là khối lượng trung bình của trẻ sơ sinh ở nông thôn và thành thị.
Ta có bài toán kiểm định:
(
Thống kê kiểm định trở thành: H0 : µ x = µ y
x−y H1 : µx 6= µy
z=r
s2x s2y Thống kê kiểm định: x̄ − ȳ 3, 0 − 3, 1
+ z=q =p = −0, 774
m n 0, 4/60 + 0, 5/50
s2x /m + s2y /n
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 27/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 28/47
Mức ý nghĩa: α = 0, 05; zα/2 = z0,025 = 1, 96. Giải. Gọi µx , µy (đôla/giờ) là mức lương trung bình của nữ và nam giới. Ta có bài toán
Miền bác bỏ: Wα = (−∞; −1, 96] ∪ [1, 96; +∞) kiểm định: (
/ Wα nên ta chưa có cơ sở bác bỏ giả thuyết H0 . Vậy, không có sự khác biệt về
Vì z ∈ H0 : µ x = µ y
khối lượng trung bình của trẻ sơ sinh ở hai vùng trên. H1 : µ x < µy
Cách khác: p-giá trị = 2(1 − Φ(0.774)) = 0.4389308 > α = 0.05 nên chưa có cơ sở
bác bỏ H0 . Thống kê kiểm định:
x̄ − ȳ 7, 23 − 8, 06
Ví dụ 7 z=q =p = −3, 08
2 2
sx /m + sy /n 1, 642 /100 + 1, 852 /75
Người ta tiến hành một cuộc nghiên cứu để so sánh mức lương trung bình của phụ nữ
so với mức lượng trung bình của nam giới trong một công ty lớn. Một mẫu gồm 100 phụ
nữ có mức lương trung bình 7,23 đôla/giờ với độ lệch chuẩn 1,64 đôla/giờ. Một mẫu Mức ý nghĩa: α = 0, 01; zα = z0,01 = 2, 326.
gồm 75 nam giới có mức lượng trung bình là 8,06 đôla/giờ với độ lệch chuẩn là 1,85 Miền bác bỏ: Wα = (−∞; −2, 326]
đôla/giờ. Với mức ý nghĩa 1% số liệu này có chứng minh được mức lương trung bình Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 . Vậy, lương trung bình của nữ giới thấp hơn so
của phụ nữ trong công ty là thấp hơn nam giới hay không ? Cho biết z0,01 = 2, 326. với nam giới trong công ty.
Cách khác: p-giá trị = Φ(−3.08) = 0.001035003 < α = 0.01 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 29/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 30/47
Trường hợp mẫu nhỏ và phương sai chưa biết (đọc thêm)
Trường hợp mẫu nhỏ, phương sai chưa biết và σx2 = σy2 (đọc thêm)
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết.
Giả thuyết thống kê H0 : µx − µy = ∆0 X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết, σx2 = σy2 .
x − y − ∆0
Giá trị thống kê kiểm định: t = r Giả thuyết thống kê H0 : µx − µy = ∆0
s2x s2y
s
+ x − y − ∆0 (m − 1)s2x + (n − 1)s2y
m n Giá trị thống kê kiểm định: t = q , với sp =
s 1
+1 m+n−2
Đối thuyết Miền bác bỏ H0 p-giá trị p m n
H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|)) Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t) H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|))
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t) H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t)
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t)
trong đó Tν là biến ngẫu nhiên có phân phối Student với ν bậc tự do và ν là giá
trị nguyên gần nhất với giá trị trong đó ν = m + n − 2.
! "2 ! "
s2x s2y . (s2x /m)2 (s2y /n)2
+ +
m n m−1 n−1
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 31/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 32/47
4. So sánh cặp hai giá trị trung bình
(đọc thêm)
Các bài toán kiểm định:
Cho (X, Y ) là một cặp biến ngẫu nhiên (nói chung phụ thuộc nhau) với E(X) =
µx , E(Y ) = µy .
( (
H0 : µ x = µ y H0 : µ d = 0
Chúng ta muốn so sánh µx và µy . ⇔
H1 : µx 6= µy H1 : µd 6= 0
Giả sử (x1 , y1 ), ..., (xn , yn ) là một mẫu kích thước n của (X, Y ). ( (
Vì X, Y có thể phụ thuộc nhau nên ta không thể áp dụng phương pháp ở trên. H0 : µ x = µ y H0 : µ d = 0
⇔
Để giải quyết bài toán này, ta đặt H1 : µ x > µy H1 : µ d > 0
( (
D =X −Y H0 : µ x = µ y H0 : µ d = 0
⇔
H1 : µ x < µy H1 : µ d < 0
và xét mẫu của D:
di = xi − yi , i = 1, n Ta đưa về bài toán kiểm định trung bình (một mẫu) đã xét.
Lúc đó,
µd = E(D) = µx − µy
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 33/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 34/47
Ví dụ 8
Để khảo sát tác dụng của việc bón thêm một loại phân bón mới (A) người ta chia mỗi
thửa ruộng thí nghiệm làm hai mảnh. Một mảnh đối chứng không có phân bón A (với Giải. Đặt D = X − Y , ta có bảng tóm tắt sau:
sản lượng X) và mảnh kia có phân bón A (với sản lượng Y ). Sản lượng của 17 thửa Thửa X Y D Thửa X Y D
ruộng được ghi lại như sau:
1 55,8 60,4 -4,6 9 53,3 58,7 -4,7
Thửa X Y Thửa X Y 2 30,1 28,9 1,2 10 51,0 48,0 -5,4
1 55,8 60,4 9 53,3 58,7 3 37,8 39,7 -1,9 11 68,6 68,8 3
2 30,1 28,9 10 51,0 48,0 4 57,7 57,5 0,2 12 59,1 70,4 -0,2
3 37,8 39,7 11 68,6 68,8 5 49,4 56,8 -7,4 13 35,4 40,6 -11,3
4 57,7 57,5 12 59,1 70,4 6 53,4 57,3 -3,9 14 42,7 44,3 -5,2
5 49,4 56,8 13 35,4 40,6 7 21,2 32,2 -11 15 28,3 47,7 -1,6
6 53,4 57,3 14 42,7 44,3 8 57,3 77,0 -19,7 16 42,4 55,1 -19,4
7 21,2 32,2 15 28,3 47,7 17 61,4 66,1 -12,7
8 57,3 77,0 16 42,4 55,1
17 61,4 66,1
Với mức ý nghĩa 5% hỏi việc bón phân có tác dụng không?
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 35/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 36/47
Gọi µx , µy lần lượt là sản lượng trung bình của mảnh đối chứng không có phân bón A 5. Kiểm định giả thuyết về tỉ lệ
và mảnh có phân bón A. Cho tính chất A có tỉ lệ là p (chưa biết) trong tổng thể. Xét bài toán kiểm định giả
Bài toán kiểm định giả thuyết: (
thuyết:
H0 : µ x = µ y
H 0 : p = p0
H1 : µ x < µ y .
và đối thuyết H1 : p 6= p0 (p > p0 , p < p0 ).
Bài toán này tương đương với bài toán Chọn một mẫu ngẫu nhiên kích thước n, đặt
( kiểm định giả thuyết:
H0 : µ D = 0
(
1, phần tử i có tính chất A
Xi =
H1 : µD < 0. 0, phần tử i không có tính chất A
Ví dụ 9
Giám đốc một công ty tuyên bố 90% sản phẩm của công ty đạt tiêu chuẩn quốc gia.
Một công ty kiểm định độc lập đã tiến hành kiểm tra 200 sản phẩm của công ty đó thì
Cho p̂ = k/n là một ước lượng của tỷ lệ p từ một mẫu kích thước n. thấy có 168 sản phẩm đạt yêu cầu. Với mức ý nghĩa α = 0, 1 có thể cho rằng tỷ lệ sản
Giả thuyết gốc H0 : p = p0 √ phẩm đạt tiêu chuẩn quốc gia thấp hơn 90% không? Cho biết z0,1 = 1, 282.
(p̂ − p0 ) n
Giá trị thống kê kiểm định: z = p Giải. Gọi p là tỉ lệ sản phẩm đạt tiêu
( chuẩn quốc gia của công ty. Bài toán kiểm định:
p0 (1 − p0 )
H0 : p = 0, 9
Đối thuyết Miền bác bỏ H0 p-giá trị H1 : p < 0, 9
H1 : p 6= p0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|)) Tỉ lệ mẫu: p̂ = k/n = 168/200 = 0, 84
H1 : p > p0 [zα ; +∞) 1 − Φ(z) Thống kê kiểm định: (p̂ − p )√n √
0 (0, 84 − 0, 9) 200
z=p = √ = −2, 83
H1 : p < p0 (−∞; −zα ] Φ(z) p0 (1 − p0 ) 0, 9 ∗ 0, 1
6. So sánh hai tỉ lệ
Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu
Xét tính chất A có tỉ lệ là p1 và p2 chưa biết trong hai tổng thể độc lập nhau. Xét bài ngẫu nhiên độc lập.
toán kiểm định với giả thuyết gốc: - Giả thuyết gốc H0 : p1 = p2
- Giá trị thống kê kiểm định:
H 0 : p1 = p 2
p̂1 − p̂2 k1 + k2
và đối thuyết H1 : p1 6= p2 (p1 > p2 , p1 < p2 ). z=s với p̂ = n + n
Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu ngẫu 1 1 1 2
p̂(1 − p̂) +
nhiên độc lập kích thước n1 và n2 tương ứng. n 1 n2
Khi giả thuyết H0 đúng, thống kê
p̂1 − p̂2 k1 + k2 Đối thuyết Miền bác bỏ H0 p-giá trị
Z=s với p̂ = n + n
H1 : p1 6= p2 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
1 1 1 2
p̂(1 − p̂) +
n1 n2 H1 : p1 > p2 [zα ; +∞) 1 − Φ(z)
H1 : p1 < p2 (−∞; −zα ] Φ(z)
có phân phối xấp xỉ phân phối chuẩn tắc N (0, 1).
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 43/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 44/47
Các tỉ lệ mẫu:
Ví dụ 11
Kiểm tra ngẫu nhiên các sản phẩm cùng loại do hai nhà máy sản xuất thu được dữ liệu: p̂1 = k1 /n1 = 25/1000 = 0, 025; p̂2 = k2 /n2 = 30/960 = 0, 03125
p̂ = (k1 + k2 )/(n1 + n2 ) = (25 + 30)/(1000 + 960) = 0, 028
Nhà máy Số sản phẩm được kiểm tra Số phế phẩm
A 1000 25 Giá trị của thống kê kiểm định:
B 960 30 p̂1 − p̂2 0, 025 − 0, 03125
z=s =p = −0, 838
0, 028 ∗ (1 − 0, 028)(1/1000 + 1/960)
Với mức ý nghĩa α = 0, 05 có thể coi tỷ lệ phế phẩm của hai nhà máy trên bằng nhau 1 1
p̂(1 − p̂) +
không? Cho biết z0.025 = 1.96 n1 n 2
Giải. Gọi p1 , p2 là tỉ lệ phế phẩm của nhà máy A, B tương ứng. Ta có bài toán kiểm Mức ý nghĩa: α = 0, 05 ⇒ zα/2 = z0.025 = 1, 96.
định: ( Miền bác bỏ: Wα = (−∞; −1, 96] ∪ [1, 96; +∞).
H0 : p1 = p2 / Wα nên chưa có cơ sở bác bỏ H0 . Vậy, tỉ lệ phế phẩm của hai nhà máy không
Vì z ∈
H1 : p1 6= p2 có sự khác biệt.
Cách khác: p-giá trị = 2(1 − Φ(0.838)) = 0.4020307 > α = 0.05 nên chưa có cơ sở
bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 45/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 46/47
Ví dụ 12
Công ty nước giải khát đang nghiên cứu 2 thị trường mới là khu vực A và khu vực B.
Ở khu vực A khi cho 500 người dùng thử thì có 120 người ưa thích thức uống này. Còn
đối với khu vực B khi cho 1000 người dùng thử thì có 300 người bảo ưa thích hương vị
này. Với mức ý nghĩa 2% hãy kiểm định xem tỉ lệ người ưa thích thức uống của công ty
ở khu vực B có cao hơn ở khu vực A hay không ? Cho biết z0,02 = 2, 054.
Giải. Gọi p1 , p2 là tỉ lệ người ưa thích nước uống của công ty ở khu vực A và B. Ta có
bài toán kiểm định: (
H0 : p1 = p2
H1 : p1 < p2
Các tỉ lệ mẫu: p̂1 = 0, 24; p̂2 = 0, 3; p̂ = 0, 28.
Giá trị thống kê kiểm định: z = −2, 39
Miền bác bỏ: Wα = (−∞; −2, 054].
Vì z ∈ Wα nên bác bỏ giả thuyết H0 .
Vậy, tỉ lệ người ưa thích thức uống của công ty ở khu vực B cao hơn ở khu vực A.
Cách khác: p-giá trị = Φ(−2.39) = 0.00842 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 47/47