You are on page 1of 73

Học phần: Xác suất thống kê

Nội dung
* Học phần bao gồm 45 tiết, với 6 chương như sau:

XÁC SUẤT THỐNG KÊ


- Chương 1. Xác suất
- Chương 2. Biến ngẫu nhiên
- Chương 3: Vectơ ngẫu nhiên
- Chương 4: Thống kê mô tả
- Chương 5: Ước lượng tham số
Tôn Thất Tú - Chương 6: Kiểm định giả thuyết thống kê
* Tài liệu tham khảo:
1. Jay L. Devore (2012), Probability and Statistics for Engineering and the Sciences,
8th Edition, Brooks/Cole, Cengage Learning.
Đà Nẵng, 2021
2. Lê Văn Dũng (2016), Giáo trình Xác suất thống kê, NXB Thông tin và truyền
thông.
* Phần mềm: R, Python, Excel, Geogebra,...

Tôn Thất Tú - 2021 Chương 1: Xác suất 1/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 2/51

Chương 1: Xác suất - Quy tắc cộng: Công việc A có m phương án thực hiện.
* Phương án 1: có n1 cách
1. Kiến thức về tổ hợp * Phương án 2: có n2 cách
..............................
- Số hoán vị của một tập n phần tử:
* Phương án m: có nm cách
Pn = n! Số cách thực hiện công việc A:

- Số cách chọn k phần tử (không thứ tự) trong tập n phần tử: n1 + n2 + ... + nm

n! - Quy tắc nhân: Công việc A được thực hiện qua m giai đoạn liên tiếp.
Cnk = * Giai đoạn 1: có n1 cách
k!(n − k)!
* Giai đoạn 2: có n2 cách
- Số cách chọn k phần tử (có thứ tự) trong tập n phần tử: ..............................
* Giai đoạn m: có nm cách
n! Số cách thực hiện công việc A:
Akn =
(n − k)!
n1 ∗ n2 ∗ ... ∗ nm

Tôn Thất Tú - 2021 Chương 1: Xác suất 3/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 4/51
Ví dụ 1
2. Không gian mẫu và biến cố
Một nhóm có 10 học sinh, trong đó có 6 nam và 4 nữ. Hỏi có bao nhiêu cách:
a) Xếp thành 1 hàng dọc. a. Định nghĩa
b) Chọn một nhóm có 4 học sinh đều có nam và nữ với số lượng khác nhau. - Thí nghiệm ngẫu nhiên: thí nghiệm mà ta có thể lặp lại nhiều lần trong cùng điều kiện
c) Chọn một nhóm có 4 học sinh trong đó có ít nhất một nữ. nhưng kết quả không thể dự đoán trước.
Đáp số: a) 10! b) C61 C43 + C63 C41 c) C10
4
− C64 - Không gian mẫu: Tập tất cả các kết quả, kí hiệu Ω.
Ví dụ 2
Ví dụ 3
Một biển số xe được cấu tạo từ 5 chữ số. Hỏi có bao nhiêu biển số có:
Gieo 1 đồng xu, rút một lá bài trong bộ bài, đo nhiệt độ không khí tại thời điểm 9h
a) Các chữ số khác nhau.
sáng, chọn ngẫu nhiên 1 sinh viên và đo chiều cao,... là các thí nghiệm ngẫu nhiên
b) Ít nhất 2 chữ số giống nhau.
c) Có đúng 3 chữ số giống nhau.
Ví dụ 4
Đáp số: a) A510 b) 105 − A510
c) Được tính qua 3 giai đoạn: X Gieo 1 đồng xu: Ω = {S, N }
- Gđ 1: Chọn 3 vị trí trong 5 vị trí: C53 X Chọn ngẫu nhiên 1 ngày trong tháng 1: Ω = {1, 2, ..., 31}
- Gđ 2: Chọn 1 chữ số giống nhau cho 3 vị trí trên: C10
1
X Do nhiệt độ không khí tại thời điểm 9h sáng: Ω = (−∞, +∞)
- Gđ 3: chọn 2 chữ số còn lại (không phân biệt): 92
Vậy, theo quy tắc nhân: C53 C10 9 cách.
1 2
Tôn Thất Tú - 2021 Chương 1: Xác suất 5/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 6/51

X Tập các kết quả thuận lợi cho A: {SN, N S, SS}. Lúc đó, ta biểu diễn biến cố A:
- Biến cố : hiện tượng có thể xảy ra hoặc không xảy ra trong thí nghiệm ngẫu nhiên. Kí
hiệu: A,B,C, ... A = {SN, N S, SS},
- Kết quả thuận lợi cho biến cố A: kết quả xảy ra kéo theo biến cố A xảy ra.
- Mỗi biến cố được đồng nhất với tập các kết quả thuận lợi của nó. Lúc đó, mỗi biến tức A là một tập con của Ω.
cố là một tập con của không gian mẫu. X Khi thực hiện phép thử, nếu xảy ra ít nhất một trong các kết quả (của A): «SS»,
- Biến cố A được xem là xảy ra nếu có ít nhất một kết quả trong A xuất hiện. «SN», «NS» thì ta bảo biến cố A xảy ra.
- Biến cố sơ cấp: biến cố mà tập các kết quả thuận lợi chỉ gồm 1 phần tử. X Các biến cố {SS}, {SN }, {N S}, {N N } là các biến cố sơ cấp.
- Không gian mẫu: Không gian các biến cố sơ cấp.
Ví dụ 6
Ví dụ 5
Tung ngẫu nhiên đồng xu cho đến khi có mặt sấp xuất hiện. Khi đó:
Tung ngẫu nhiên 2 đồng xu. Lúc đó:
X Không gian mẫu: Ω = {SS, SN, N S, N N } Ω = {S, N S, N N S, N N N S, ...}
X Hiện tượng (sự kiện) "Có mặt sấp xuất hiện" là biến cố ngẫu nhiên. Kí hiệu A.
X Giả sử khi thực hiện, kết quả «SN» xuất hiện. Điều này kéo theo biến cố A xảy ra. Lúc đó, ta có biến cố:
Kết quả «SN» được gọi là kết quả thuận lợi cho biến cố A. - dừng sau không quá 3 lần tung: A = {S, N S, N N S}
- thực hiện ít nhất 2 lần tung: B = {N S, N N S, N N N S, N N N N S, ....}
Tôn Thất Tú - 2021 Chương 1: Xác suất 7/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 8/51
Các biến cố đặc biệt:
- Biến cố không thể (∅): là biến cố không thể xảy ra - Hợp của n biến cố Ai , kí hiệu A1 ∪ A2 ∪ ... ∪ An , là biến cố xảy ra nếu ít nhất một
- Biến cố chắc chắn (Ω): là biến cố luôn xảy ra trong các biến cố Ai xảy ra.
Chẳng hạn, gieo ngẫu nhiên 2 con xúc xắc. Lúc đó: - Hai biến cố A và B được gọi là xung khắc nếu chúng không đồng thời xảy ra.
- biến cố "tổng số chấm xuất hiện lớn hơn 12" là biến cố không thể. Nhận xét:
- biến cố "tổng số chấm xuất hiện lớn hơn 1" là biến cố chắc chắn. - Hai biến cố A và B xung khắc khi và chỉ khi AB = ∅.
- Hai biến cố đối nhau thì xung khắc với nhau, nhưng điều ngược lại nói chung là không
b. Các phép toán trên biến cố đúng.
Cho hai biến cố A và B. Khi đó:
- Biến cố đối của A, kí hiệu Ā hoặc Ac , xác định: Ā = Ω\A (là biến cố xảy ra nếu A Ví dụ 7
không xảy ra) Chọn ngẫu nhiên một chữ số từ 0 đến 9.
- Giao của A và B, kí hiệu A ∩ B, AB, xác định AB = {x : x ∈ A, x ∈ B} (là biến cố Ta có Ω = {0, 1, 2, ..., 9}.
xảy ra nếu A và B đồng thời xảy ra). Xét 3 biến cố A = {0, 2, 4}, B = {4, 5, 6} và C = {7, 8, 9}.
- Giao của n biến cố Ai , kí hiệu A1 ∩ A2 ∩ ... ∩ An , là biến cố xảy ra nếu đồng thời các Lúc đó:
biến cố Ai cùng xảy ra. • A ∩ B = {4}, A ∪ B = {0, 2, 4, 5, 6}, Ā = {1, 3, 5, 6, 7, 8, 9}
- Hợp của A và B, kí hiệu A ∪ B, xác định A ∪ B = {x : x ∈ A hoặc x ∈ B} (là biến • A và C xung khắc vì A ∩ C = ∅ nhưng A và C không phải là hai biến cố đối nhau.
cố xảy ra nếu ít nhất A hoặc B xảy ra)
Tôn Thất Tú - 2021 Chương 1: Xác suất 9/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 10/51

3. Định nghĩa và các tính chất của xác suất


Ví dụ 8
Định nghĩa (theo hệ tiên đề):
Có 2 xạ thủ, mỗi người bắn 1 viên đạn vào mục tiêu. Gọi A và B tương ứng là các biến
Cho trước một thí nghiệm với không gian mẫu Ω. Khi đó, xác suất của một biến cố A,
cố: “người thứ nhất và thứ hai bắn trúng mục tiêu” tương ứng. Khi đó ta có biểu diễn
kí hiệu P (A), là số đo khả năng xảy ra biến cố A.
các biến cố như sau:
- Có đạn trúng đích: A ∪ B Ứng với mỗi biến cố A ta đặt tương ứng với giá trị P (A) thỏa các điều kiện sau:
- Có đúng 1 viên đạn trúng đích: AB̄ ∪ ĀB (i) Với mọi biến cố A, P (A) ≥ 0
- Chỉ có người thứ nhất bắn trúng: AB̄ (ii) P (Ω) = 1
- Có nhiều nhất một viên đạn trúng đích: ĀB̄ ∪ AB̄ ∪ ĀB hoặc AB (iii) Nếu A1 , A2 , ... là các biến cố đôi một xung khắc thì
+∞
Luật De-Morgan về phủ định:
X
P (∪∞
n=1 An ) = P (An )
n=1
∪Ai = ∩Āi
Lúc đó P (A) được gọi là xác suất của biến cố A.
∩Ai = ∪Āi Nhận xét: Trong một số trường hợp, tùy vào không gian mẫu cũng như các thiết lập
"tương ứng" P mà ta sẽ thu được một vài định nghĩa xác suất khác.

Tôn Thất Tú - 2021 Chương 1: Xác suất 11/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 12/51
Định nghĩa (quan điểm cổ điển):
Cho thí nghiệm với n(Ω) < +∞ kết quả đồng khả năng, trong đó có n(A) kết quả
Định nghĩa (quan điểm thống kê): thuận lợi cho biến cố A. Khi đó, xác suất của biến cố A, kí hiệu P (A), được xác định:
Xét biến cố A. Thực hiện phép thử n lần thì có m lần xuất hiện biến cố A. Khi đó tỉ số n(A)
fn = m/n được gọi là tần suất xuất hiện A. Khi số phép thử tăng lên vô hạn, tần suất P (A) =
n(Ω)
fn sẽ tiến đến một hằng số xác định. Hằng số này được gọi là xác suất của biến cố A.
Vì thế, trong thực tế khi số phép thử n lớn, ta có thể xem tần suất fn như là xác suất Ví dụ 10
của xuất hiện biến cố A.
Trong một hộp có 6 bi đen và 4 bi trắng. Lấy ngẫu nhiên 4 viên. Tìm xác suất lấy được
cả hai loại bi.
Ví dụ 9
Có 1000 người có triệu chứng A đến cơ sở y tế để khám bệnh. Kết quả có thấy 700 Giải.
mắc bệnh X. Ta có f = 700/1000 = 70%. Do đó, ta có cơ sở dự đoán nếu một người Gọi A là biến cố "lấy được cả hai loại bi".
có triệu chứng A thì xác suất mắc bệnh X xấp xỉ 70%. Số trường hợp đồng khả năng: n(Ω) = C10 4 .

Số trường hợp thuận lợi: n(A) = C6 C4 + C62 C42 + C63 C41 .


1 3

Xác suất cần tìm:


n(A) C 1 C 3 + C62 C42 + C63 C41
P (A) = = 6 4 4
n(Ω) C10
Tôn Thất Tú - 2021 Chương 1: Xác suất 13/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 14/51

b. Gọi B là biến cố "có 2 toa mỗi toa có 6 khách".


Ví dụ 11
Giá trị n(B) được tính thông qua các giai đoạn:
Một đoàn tàu có 3 toa. Có 15 khách lên ngẫu nhiên 3 toa tàu. Biết mỗi toa đều chứa - Gđ 1: Chọn 2 toa: C32 cách
được 15 khách. Tính xác suất: - Gđ 2: Chọn 6 khách cho mỗi toa: C15 6 C 6 cách.
9
a. Toa 1 có 4 khách. - Gđ 3: Xếp 3 khách còn lại 1 = 1 cách
3
b. Có 2 toa mỗi toa có 6 khách. Suy ra: n(B) = C32 C15
6 C6
9
Xác suất cần tìm: C 2 C15
6 C6
Giải. P (B) =
n(B)
= 3 15 9
a. Gọi A là biến cố "toa 1 có 4 khách". n(Ω) 3
Ta có: n(Ω) = 315 .
Giá trị n(A) được tính thông qua 2 giai đoạn: Ví dụ 12
- Gđ 1: Chọn 4 khách: C154 cách
Một rổ cam gồm 12 quả, trong đó có 3 quả hỏng. Chia đều 12 quả này cho 3 người,
- Gđ 2: Xếp 11 khách còn lại: 211 cách. mỗi người 4 quả. Tính xác suất:
Suy ra: n(A) = C154 211
a. Người thứ nhất không có quả hỏng.
Xác suất cần tìm: b. Mỗi người đều có quả hỏng.
n(A) C 4 211
P (A) = = 1515
n(Ω) 3 Gợi ý. Ta có: n(Ω) = C12
4
C84 C44
a. n(A) = C9 C8 C4 b. n(B) = 3!C93 C63 C33
4 4 4

Tôn Thất Tú - 2021 Chương 1: Xác suất 15/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 16/51
Ví dụ 13
Định nghĩa (quan điểm hình học): Tính xác suất khi lấy ngẫu nhiên một điểm M trong hình vuông có độ dài cạnh bằng
Cho miền Ω đo được (trên đường thẳng, trong mặt phẳng, không gian ba chiều, ...) và 2m thì điểm này rơi vào hình tròn nội tiếp hình của vuông.
miền con S đo được của Ω. Ta lấy ngẫu nhiên một điểm trong miền Ω và đặt A là biến
cố M ∈ S. Khi đó, xác suất của biến cố A được xác định như sau:

P (A) =
m(S)
, Giải. Dễ thấy:
m(Ω) - Diện tích hình tròn: m(S) = π(m2 )
- Diện tích của hình vuông: m(Ω) = 4(m2 )
trong đó m(S), m(Ω) là số đo của miền S và Ω. Cụ thể, Theo quan điểm hình học, xác suất của biến
- Nếu Ω là đường cong hay đoạn thẳng thì m(·) là hàm chỉ độ dài. cố A cần tìm:
- Nếu Ω là hình phẳng hay mặt cong thì m(·) là hàm chỉ diện tích.
- Nếu Ω là hình khối 3 chiều thì m(·) là hàm chỉ thể tích. m(S) π
P (A) = =
- ... m(Ω) 4

Tôn Thất Tú - 2021 Chương 1: Xác suất 17/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 18/51

Tính chất
i) P (∅) = 0, P (Ω) = 1 P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + ... + P (An )
ii) 0 ≤ P (A) ≤ 1, ∀A
X
− P (Ai Aj )
iii) Nếu A ⊂ B thì P (A) ≤ P (B) i<j

iv) Công thức cộng: Khi các biến cố xung khắc đôi một thì
X
+ P (Ai Aj Ak )
i<j<k
P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + ... + P (An )
......
Nói riêng: (−1)n−1 P (A1 A2 ...An )
P (A) + P (Ā) = 1
Tổng quát: Ví dụ 14
Một lô hàng có 15 thiết bị, trong đó có 6 thiết do nhà máy X sản xuất và 9 thiết bị do
P (A ∪ B) = P (A) + P (B) − P (AB) nhà máy Y sản xuất. Người ta chọn ngẫu nhiên 4 thiết bị để kiểm tra. Tính xác suất:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (AB) − P (BC) − P (AC) + P (ABC) a. Cả 4 thiết bị được chọn do cùng nhà máy sản xuất
b. Có ít nhất một thiết bị được chọn do nhà máy X sản xuất.

Tôn Thất Tú - 2021 Chương 1: Xác suất 19/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 20/51
Giải.

Ví dụ 15
a. Gọi AX , AY là các biến cố các thiết bị được chọn do nhà máy X, Y sản xuất. Ta có
Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết tiếng Anh, 12 sinh viên biết tiếng
AX , AY xung khắc.
Pháp và 7 sinh viên biết cả hai thứ tiếng. Chọn ngẫu nhiên một sinh viên. Tìm xác suất
Xác suất cả 4 thiết bị được chọn do cùng nhà máy sản xuất:
để sinh viên đó biết ít nhất một ngoại ngữ.
C64 C4
P (AX ∪ AY ) = P (AX ) + P (AY ) = 4 + 49 Giải.
C15 C15
Gọi A, B là biến cố chọn được sinh viên biết tiếng Anh, Pháp.
b. Gọi B là biến cố có ít nhất một thiết bị được chọn do nhà máy X sản xuất. Ta có: Lúc đó, xác suất cần tìm:

C94 P (A ∪ B) = P (A) + P (B) − P (AB) = 10/20 + 12/20 − 7/20 = 3/4


P (B) = 1 − P (B̄) = 1 − 4
C15

Tôn Thất Tú - 2021 Chương 1: Xác suất 21/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 22/51

Ví dụ 16 4. Xác suất có điều kiện


Một đội bóng bàn của 1 đơn vị gồm 2 vận động viên A và B. Xác suất A, B vượt qua Một lô hàng tivi với các số liệu sau:
vòng bảng lần lượt là 0,7 và 0,5. Do ảnh hưởng tâm lý nên xác suất cả hai người đều
vượt qua vòng bảng là 0,4. Tính xác suất cả hai vận động viên đều không vượt qua vòng LG SONY
bảng. Tốt 15 12
Bị hỏng 5 8
Giải. Gọi A, B là các biến cố vận động viên A, B vượt qua vòng bảng. Ta có:
Chọn ngẫu nhiên 1 tivi thì được tivi LG. Vậy, khả năng nó bị hỏng là bao nhiêu?
P (A) = 0, 7; P (B) = 0, 5; P (AB) = 0, 4
Gợi ý.
Xác suất cả hai vận động viên đều không vượt qua vòng bảng: - Khi không có thông tin, dễ thấy xác suất này là 13/40.
- Vì biết chọn được tivi LG nên ta "thu hẹp" phạm vi quan sát và chỉ tính đến loại tivi
LG. Lúc đó, khả năng chọn được tivi hỏng với "điều kiện" là tivi LG bằng 5/20=1/4.
h De Morgan
i
P (ĀB̄) = 1 − P (ĀB̄) = 1 − P (A ∪ B) = 1 − [P (A) + P (B) − P (AB)]

= 1 − (0, 7 + 0, 5 − 0, 4) = 0, 2 BIẾT ĐIỀU KIỆN XẢY RA → XÁC SUẤT THAY ĐỔI

Tôn Thất Tú - 2021 Chương 1: Xác suất 23/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 24/51
Định nghĩa: Ví dụ 17
Cho hai biến cố A và B với P (B) > 0. Khi đó, xác suất có điều kiện của A với điều kiện Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu dự án A và B tương ứng là
biến cố B đã xảy ra, kí hiệu P (A|B), xác định như sau: 0,6 và 0,7. Xác suất thắng thầu đồng thời cả 2 dự án là 0,5. Tính xác suất:
a) Công ty thắng thầu dự án A biết đã thắng thầu dự án B.
P (AB) b) Công ty không thắng thầu dự án B biết đã thắng thầu dự án A.
P (A|B) =
P (B)
Giải. Gọi A, B là các biến cố công ty thắng dự án A, B. Theo giả thiết:
Tính chất:
i. 0 ≤ P (A|B) ≤ 1 P (A) = 0, 6; P (B) = 0, 7; P (AB) = 0, 5
ii. P (Ā|B) = 1 − P (A|B)
a. P (A|B) = P (AB)/P (B) = 5/7
iii. P (A ∪ B|C) = P (A|C) + P (B|C) − P (AB|C) b. P (B̄|A) = 1 − P (B|A) = 1 − P (AB)/P (A) = 1 − 5/6 = 1/6.

Tôn Thất Tú - 2021 Chương 1: Xác suất 25/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 26/51

Bình luận. Ta có: P (A|B) = 5/7 > P (A) = 0, 6. Như vậy, việc biết biến cố B xảy ra
đã làm tăng xác suất xảy ra biến cố A, hay nói cách khác, việc thắng dự án B là có lợi Ví dụ 18
cho quá trình đấu thầu dự án A.
Có 15 thanh RAM, trong đó có 3 thanh bị hỏng. Chọn ngẫu nhiên 4 thanh.
a. Tính xác suất có ít nhất 1 thanh bị hỏng được chọn.
Nhận xét
b. Biết chọn được ít nhất 1 thanh hỏng, tính xác suất chọn đúng 2 thanh bị hỏng.
Trong một số trường hợp, xác suất có điều kiện P (A|B) có thể được tính dựa vào việc
"đếm trực quan", tức là ta thu hẹp tập các kết quả sau khi biến cố B xảy ra và đếm lại Giải. Gọi A, B là các biến cố chọn được ít nhất 1 thanh hỏng, chọn được đúng 2 thanh
số kết quả đồng khả năng, số kết quả thuận lợi để tính xác suất có điều kiện. hỏng.
a. P (A) = 1 − P (Ā) = 1 − C124 /C 4
Chẳng hạn, ta quay lại với ví dụ về tivi Sony và LG. Vì biết chọn được tivi LG nên tập
15
b. P (B|A) = P (AB)/P (A) = P (B)/P (A), trong đó P (B) = C32 C12 2 /C 4 .
15
kết quả thu hẹp về 20 tivi LG. Chỉ có 5 tivi LG bị hỏng, nên xác suất chọn được tivi
hỏng khi biết đó là tivi bằng 5/20=1/4.

Tôn Thất Tú - 2021 Chương 1: Xác suất 27/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 28/51
Ví dụ 19
5. Công thức nhân xác suất
Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu lần lượt là 0.7 và 0.4. Nếu
Cho hai biến cố A và B với P (A) > 0. Khi đó: dự án A đã thắng thầu thì xác suất thắng tiếp dự án B là 0.4. Tính xác suất:
a. Công ty thắng ít nhất một dự án.
P (AB)
P (B|A) = ⇒ P (AB) = P (A)P (B|A) b. Công ty chỉ thắng dự án A.
P (A) c. Thắng đúng 1 dự án.
Tương tự, ta sẽ có:
Giải. Gọi A, B là biến cố công ty thắng dự án A, B. Ta có:
P (AB) = P (A)P (B|A) = P (B)P (A|B)
P (A) = 0, 7; P (B) = 0, 4, P (B|A) = 0, 4
Tổng quát: Cho n biến cố Ai với P (A1 A2 ...An−1 ) > 0. Khi đó:
a. P (A ∪ B) = P (A) + P (B) − P (AB) = P (A) + P (B) − P (A)P (B|A) = 0, 7 + 0, 4 −
P (A1 A2 ...An ) = P (A1 ).P (A2 |A1 ).P (A3 |A1 A2 )....P (An |A1 ...An−1 ) 0, 7 ∗ 0, 4 = 0, 82
b. P (AB̄) = P (A)P (B̄|A) = P (A)[1 − P (B|A)] = 0, 7[1 − 0, 4] = 0, 42
c. P (AB̄ ∪ ĀB) = P (AB̄) + P (ĀB) = . . .

Tôn Thất Tú - 2021 Chương 1: Xác suất 29/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 30/51

6. Biến cố độc lập


Ví dụ 20 - Hai biến cố A và B được gọi là độc lập nếu P (AB) = P (A).P (B).
- Dãy n biến cố A1 , ..., An được gọi là độc lập nếu ta lấy ra một dãy bất kì các biến cố
Một thủ kho có một chùm chìa khóa gồm 9 chiếc, bề ngoài chúng giống hệt nhau nhưng
khác nhau từ các biến cố trên thì xác suất của tích các biến cố này bằng tích xác suất
trong đó chỉ có đúng 2 chiếc mở được kho. Anh ta thử ngẫu nhiên từng chìa cho đến
của từng biến cố thành phần, nghĩa là:
khi mở được kho thì dừng. Tính xác suất việc làm này:
a. Dừng ở lần thử thứ 2. P(
\
Ak ) =
Y
P (Ak ), ∀I ⊂ {1, 2, ..., n}
b. Dừng ở lần thử thứ 3. k∈I k∈I
c. Sau nhiều nhất hai lần thử.
Nhận xét
Giải. Gọi Ai là biến cố lần thứ i chọn đúng chìa khóa, i = 1, 2, 3, ...
a. P (Ā1 A2 ) = P (Ā1 )P (A2 |Ā1 ) = 7/9 ∗ 2/8 - Hai biến cố A và B độc lập ⇔ P (A|B) = P (A) hoặc P (B|A) = P (B).
b. P (Ā1 Ā2 A3 ) = P (Ā1 )P (Ā2 |Ā1 )P (A3 |Ā1 Ā2 ) = 7/9 ∗ 6/8 ∗ 2/7 - Nếu nhóm n biến cố A1 , ..., An độc lập thì nhóm n biến cố B1 , B2 , ..., Bn cũng độc
c. P (A1 ∪ Ā1 A2 ) = P (A1 ) + P (Ā1 A2 ) = 2/9 + 7/9 ∗ 2/8 lập, trong đó Bi là Ai hoặc Āi .
- Nếu nhóm n biến cố A1 , ..., An độc lập thì mọi nhóm con các biến cố của nó cũng
độc lập.

Tôn Thất Tú - 2021 Chương 1: Xác suất 31/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 32/51
Ví dụ 22
Ví dụ 21
Nước được cấp từ E đến F qua 3 trạm
Một nồi hơi có 3 van bảo hiểm hoạt động độc lập với xác suất hỏng của van 1, van 2, Một trạm cấp nước như hình vẽ:
bơm tăng áp A, B, C. Các trạm bơm
van 3 trong khoảng thời gian T tương ứng là 0,1; 0,2; 0,3. Nồi hơi hoạt động an toàn làm việc độc lập với nhau. Xác suất để
nếu có ít nhất một van không hỏng. Tính xác suất để nồi hơi hoạt động an toàn trong các trạm này có sự cố sau một thời gian
khoảng thời gian T. làm việc lần lượt là 0.1, 0.1, 0.05. Tính
xác suất để vùng F bị mất nước.
Giải. Gọi Ai là biến cố van i bị hỏng trong khoảng thời gian T, i = 1, 2, 3.
Ta có A1 , A2 , A3 độc lập và Giải. Gọi A,B,C là các biến cố trạm bơm A,B,C bị sự cố.
Ta có: A,B,C là các biến cố độc lập và
P (A1 ) = 0, 1; P (A2 ) = 0, 2; P (A3 ) = 0, 3
P (A) = 0, 1; P (B) = 0, 1; P (C) = 0, 05
Xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T:
Xác suất vùng F bị mất nước:
P (Ā1 ∪ Ā2 ∪ Ā3 ) = 1 − P (A1 A2 A3 ) = 1 − P (A1 )P (A2 )P (A3 ) = 0, 994
P (AB ∪ C) = P (AB) + P (C) − P (ABC) = P (A)P (B) + P (C) − P (A)P (B)P (C)

Tôn Thất Tú - 2021 Chương 1: Xác suất 33/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 34/51

7. Công thức xác suất toàn phần và công thức Bayes


Ví dụ 23
Định nghĩa: Nhóm biến cố Hi , i = 1, n được gọi là đầy đủ nếu thỏa mãn 2 điều kiện:
Một thiết bị có 2 bộ phận hoạt động độc lập. Xác suất bộ phận thứ nhất bị hỏng là n
i) Hi ∩ Hj = ∅, ∀i 6= j ii)
S
0,1. Xác suất có đúng 1 bộ phận bị hỏng là 0,26. Hi = Ω
i=1
a. Tính xác suất bộ phận thứ 2 bị hỏng.
b. Biết có ít nhất 1 bộ phận hỏng, tính xác suất bộ phận 1 hỏng. Ví dụ 24
a. {∅, Ω}, {A, A }, {AB, AB̄, ĀB, ĀB̄} là các nhóm biến cố đầy đủ.
Giải. Gọi Ai là biến cố bộ phận thứ i bị hỏng, i = 1, 2. Ta có A1 , A2 độc lập.
b. Một hộp có 3 bi đỏ và 2 bi xanh. Lấy ngẫu nhiên 2 viên bi. Gọi Hi là biến cố lấy
a. Theo giả thiết:
được i bi xanh, i = 0, 1, 2. Ta có {H0 , H1 , H2 } là nhóm đầy đủ.
P (A1 Ā2 ∪ Ā1 A2 ) = P (A1 Ā2 ) + P (Ā1 A2 )
= 0, 1 ∗ [1 − P (A2 )] + 0, 9P (A2 ) = 0, 1 + 0, 8P (A2 ) = 0, 26.
Định lý: (Công thức xác suất đầy đủ )
Suy ra: P (A2 ) = 0, 2.
P (A1 (A1 ∪ A2 )) P (A1 ) Cho Hi , i = 1, n là một nhóm biến cố đầy đủ và P (Hi ) > 0. Khi đó với biến cố A bất
b. P (A1 |A1 ∪ A2 ) = =
P (A1 ∪ A2 ) P (A1 ∪ A2 ) kì liên quan đến phép thử, ta luôn có:
P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 A2 ) = 0, 1 + 0, 2 − 0, 1 ∗ 0, 2 = 0, 28
0, 1 5 n
⇒ P (A1 |A1 ∪ A2 ) =
X
= P (A) = P (Hi ).P (A|Hi )
0, 28 14
i=1

Tôn Thất Tú - 2021 Chương 1: Xác suất 35/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 36/51
Ví dụ 26
Công thức trên được gọi là công thức xác suất đầy đủ ( hay công thức xác suất toàn
phần). Một nhóm có 3 người nhưng chỉ có 2 vé xem bóng đá. Để chia vé họ làm như sau: Lấy
Nói riêng, ta có P (B) = P (A).P (B|A) + P (A).(B|A) với 0 < P (A) < 1 . 3 phiếu, 2 phiếu ghi số 1 và 1 phiếu ghi số 0. Sau đó thay phiên nhau bốc ngẫu nhiên
lần lượt không hoàn lại. Ai được phiếu ghi số 1 thì được vé.
a. Tính xác suất người thứ 2 được vé.
Ví dụ 25
b. Hỏi việc bốc phiếu đó có công bằng hay không ?
Có 2 lô sản phẩm. Lô 1 có 50 sản phẩm trong đó có 20 sản phẩm xấu. Lô 2 có 40 sản
phẩm, trong đó có 15 sản phẩm xấu. Lấy ngẫu nhiên một lô và từ đó lấy ra 1 sản phẩm. Giải. Gọi Ai là biến cố người rút thứ i được vé,i = 1, 2, 3.
Tìm xác suất để sản phẩm lấy ra là sản phẩm tốt. a. Ta có {A1 , Ā1 } là nhóm đầy đủ. Do đó:

Giải. Gọi Hi là chọn lô sản phẩm i, i = 1, 2. Gọi A là biến cố sản phẩm lấy ra là sản P (A2 ) = P (A1 )P (A2 |A1 ) + P (Ā1 )P (A2 |Ā1 ) = 2/3 ∗ 1/2 + 1/3 ∗ 2/2 = 2/3
phẩm tốt.
Ta có {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần: b. Ta có P (A1 ) = P (A2 ) = 2/3, cần tính P (A3 ). Mặt khác,

P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 1/2 ∗ 30/50 + 1/2 ∗ 25/40 = 49/80 P (A3 ) = 1 − P (Ā3 ) = 1 − P (A1 A2 ) = 1 − P (A1 )P (A2 |A1 ) = 1 − 2/3 ∗ 1/2 = 2/3

Vậy, việc làm trên là công bằng.


Tôn Thất Tú - 2021 Chương 1: Xác suất 37/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 38/51

Ví dụ 27
Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15. Do có nhiễu
Ý nghĩa công thức xác suất toàn phần trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B; còn 1/8 tín
Công thức xác suất toàn phần giúp ta tính xác suất xảy ra của một biến cố dựa vào hiệu B bị méo và thu được như A.
một nhóm đầy đủ các giả thiết chi phối nó. a. Tìm xác suất thu được tín hiệu A.
b. Giả sử đã thu được tín hiệu A. Tìm xác suất thu được đúng tín hiệu lúc phát.
Định lý (Công thức Bayes)
Giải. Gọi HA , HB là biến cố trạm phát tín hiệu A, B. Gọi A là biến cố trạm thu được
Cho A là một biến cố và P (A) > 0, {H1 , ..., Hn } là một nhóm biến cố đầy đủ. Lúc đó, tín hiệu A.
ta có công thức: a. Ta có: {HA , HB } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần:
P (Hi ).P (A|Hi ) P (Hi ).P (A|Hi )
P (Hi |A) = = n , i = 1, n P (A) = P (HA )P (A|HA ) + P (HB )P (A|HB ) = 0, 85 ∗ (1 − 1/7) + 0, 15 ∗ 1/8 = 0, 747
P (A) P
P (Hj ).P (A|Hj )
j=1 b. Theo công thức Bayes:

P (HA )P (A|HA ) 0, 85 ∗ (1 − 1/7)


P (HA |A) = = = 0, 975
P (A) 0, 747

Tôn Thất Tú - 2021 Chương 1: Xác suất 39/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 40/51
Ví dụ 28
Một cửa hàng bán bóng đèn cùng loại do 3 cơ sở sản xuất cung cấp. Cơ sở I, II, III
cung cấp lượng hàng tương ứng là 40%, 35%, 25%. Biết tỉ lệ bóng hỏng do cơ sở I, II,
III sản xuất lần lượt là 2%, 2%, 3%. Ta mua ngẫu nhiên 1 bóng của cửa hàng. Giả sử Ý nghĩa công thức Bayes
bóng mua bị hỏng. Hỏi bóng ta mua có khả năng do cơ sở nào sản xuất nhất ?
Các xác suất P (H1 ), ..., P (Hn ) được xác định trước khi phép thử tiến hành và do đo
Giải. Gọi Hi là biến cố bóng được mua do cơ sở i sản xuất, i = 1, 2, 3. Gọi A là biến chúng được gọi là các xác suất tiên nghiệm. Các xác suất P (H1 |A), ..., P (Hn |A) được
cố bóng được mua bị hỏng. xác định sau khi phép thử được tiến hành và biến cố A đã xảy ra và do do chúng được
Ta có: {H1 , H2 , H3 } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần: gọi là các xác suất hậu nghiệm. Vì thế công thức Bayes còn được gọi là công thức tính
xác suất hậu nghiệm.
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) + P (H3 )P (A|H3 ) * Công thức Bayes cho phép đánh giá lại xác suất xảy ra của các giả thiết sau khi đã
= 0, 4 ∗ 0, 02 + 0, 35 ∗ 0, 02 + 0, 25 ∗ 0, 03 = 0.0225 biết kết quả của phép thử là biến cố A đã xảy ra.

P (H1 )P (A|H1 ) 0, 4 ∗ 0, 02
Theo công thức Bayes: P (H1 |A) = = = 0.356
P (A) 0.0225
Tương tự: P (H2 |A) = 0.311, P (H3 |A) = 0.333
Vì P (H1 |A) > P (H3 |A) > P (H2 |A) nên khả năng bóng được mua do cơ sở 1 sản xuất
là lớn nhất.
Tôn Thất Tú - 2021 Chương 1: Xác suất 41/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 42/51

Ví dụ 29 Ví dụ 30
Tỉ lệ người dân ở tỉnh A nghiện thuốc lá là 30%, trong số người nghiện thuốc tỉ lệ người Một máy bay bắn độc lập 2 quả tên lửa vào một mục tiêu. Xác suất quả thứ nhất và
bị bệnh phổi là 60%. Trong số những người không nghiện thuốc có 20% bị bệnh phổi. thứ 2 trúng là 0,6 và 0,7. Nếu có 1 quả trúng thì mục tiêu bị tiêu diệt với xác suất 0,7
Chọn ngẫu nhiên một người. Tính xác suất người đó nghiện thuốc trong hai trường hợp. và nếu có 2 quả trúng thì xác suất này là 0,9.
a) Biết người đó bị bệnh phổi. a) Tính xác suất có ít nhất 1 quả trúng. b) Tính xác suất mục tiêu bị tiêu diệt.
b) Biết người đó không bị bệnh phổi. c) Biết mục tiêu bị tiêu diệt, tính xác suất cả 2 quả đều trúng.

Giải. Gọi H1 , H2 là các biến cố người được chọn hút và không hút thuốc lá. Gọi A là Giải. Gọi Ai là biến cố quả tên lửa thứ i trúng mục tiêu, i = 1, 2. Ta có A1 , A2 độc lập.
biến cố người được chọn bị bệnh phổi. a. P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 A2 ) = 0, 6 + 0, 7 − 0, 6 ∗ 0, 7 = 0, 88
b. Gọi Hi là biến cố có i quả tên lửa trúng, i = 0, 1, 2, và A là biến cố mục tiêu bị tiêu diệt. Ta
Ta có: {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần:
có {H0 , H1 , H2 } là nhóm đầy đủ.
P (H0 ) = P (Ā1 Ā2 ) = 0, 4 ∗ 0, 3 = 0, 12; P (H1 ) = P (A1 Ā2 ∪ Ā1 A2 ) = 0, 6 ∗ 0, 3 + 0, 4 ∗ 0, 7 =
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 0, 3 ∗ 0, 6 + 0, 7 ∗ 0, 2 = 0, 32
0, 46; P (H2 ) = P (A1 A2 ) = 0, 6 ∗ 0, 7 = 0, 42.
P (H1 )P (A|H1 ) 0, 3 ∗ 0, 6 Theo công thức xác suất toàn phần:
a. P (H1 |A) = = = 9/16 P (A) = P (H0 )P (A|H0 ) + P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )
P (A) 0, 32 = 0, 12 ∗ 0 + 0, 46 ∗ 0, 7 + 0, 42 ∗ 0, 9 = 0, 7
P (H1 )P (Ā|H1 ) 0, 3 ∗ (1 − 0, 6) P (H2 )P (A|H2 ) 0, 42 ∗ 0, 9
b. P (H1 |Ā) = = = 3/17 c. P (H2 |A) = = = 0, 54
P (Ā) 1 − 0, 32 P (A) 0, 7
Tôn Thất Tú - 2021 Chương 1: Xác suất 43/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 44/51
Ví dụ 31 8. Dãy phép thử Bernoulli
Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có
đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là p(%). Thiết bị có khả năng Định nghĩa
phát hiện đúng sản phẩm là phế phẩm với xác suất α và phát hiện đúng sản phẩm đạt
Dãy n phép thử được gọi là dãy n phép thử Bernoulli nếu thỏa mãn các điều kiện sau:
chất lượng với xác suất β. Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho
- Các phép thử độc lập
sản phẩm này:
- Trong mỗi phép thử chỉ xảy ra một trong hai biến cố, kí hiệu A (thành công) và Ā
a. Được kết luận là phế phẩm.
(thất bại).
b. Được kết luận là đạt chất lượng thì lại là phế phẩm.
- Xác suất xuất hiện biến cố A là p = P (A) không đổi trong các phép thử.
c. Được kết luận đúng với thực chất của nó.

Gợi ý. Gọi H1 , H2 là biến cố sản phẩm được chọn là chính phẩm, phế phẩm. Gọi A Công thức xác suất nhị thức
là biến cố được kết luận là phế phẩm. Ta có {H1 , H2 } là nhóm đầy đủ, P (H2 ) = Kí hiệu pn (k) là xác suất có đúng k lần xuất hiện biến cố A trong dãy n phép thử
p, P (A|H2 ) = α, P (Ā|H1 ) = β. Bernoulli. Khi đó:
a. P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = (1 − p)(1 − β) + pα pn (k) = Cnk pk (1 − p)n−k , k = 0, n.
b. P (H1 |A)
c. P (AH2 ) + P (ĀH1 ) Công thức trên còn được gọi là công thức Bernoulli.

Tôn Thất Tú - 2021 Chương 1: Xác suất 45/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 46/51

Ví dụ 32 Giải.
Ta có mô hình dãy phép thử Bernoulli với n = 3; p = 0, 4.
Xác suất để 1 quả trứng đem ấp nở ra gà con là 0.85. Đem ấp 10 quả trứng. Tính xác a. Xác suất để nguồn thu nhận được thông tin đúng 2 lần:
suất để có đúng 8 quả nở ra gà con.
p3 (2) = C32 0, 42 0, 61
Giải. Ta có mô hình dãy phép thử Bernoulli với n = 10; p = 0, 85.
Xác suất có đúng 8 quả nở ra gà con: b. Xác suất để nguồn thu nhận được thông tin đó:
8
p10 (8) = C10 0, 858 0, 152 p3 (k ≥ 1) = 1 − p3 (0) = 1 − C30 0, 40 0, 63

c. Gọi n là số tín hiệu cần phát đi. Theo giả thiết:


Ví dụ 33
Tín hiệu thông tin được phát đi 3 lần độc lập nhau. Xác suất thu được mỗi lần là 0.4. pn (k ≥ 1) ≥ 0, 99 ⇔ 1 − pn (0) ≥ 0, 99
a) Tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần.
b) Tìm xác suất để nguồn thu nhận được thông tin đó. ln(0, 01)
c) Nếu muốn xác suất thu được tin ≥ 0.99 thì phải phát đi ít nhất bao nhiêu lần. ⇔ Cn0 0, 40 0, 6n ≤ 0, 01 ⇔ n ≥ = 9, 015
ln(0, 6)
Vậy, n = 10.
Tôn Thất Tú - 2021 Chương 1: Xác suất 47/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 48/51
Ví dụ 35
Ví dụ 34
Trong năm học vừa qua, ở trường đại học, tỉ lệ sinh viên thi trượt môn Toán là 34%, thi
Trên giá có 4 cây súng loại 1 và 6 cây súng loại 2. Một xạ thủ chọn ngẫu nhiên 1 cây trượt môn Lý là 20%, và trong số các sinh viên trượt môn Toán, có 50% sinh viên trượt
súng và bắn 5 phát độc lập. Biết xác suất bắn trúng khi sử dụng súng loại 1 và 2 lần môn Lý. Phải chọn bao nhiêu sinh viên của trường này sao cho, với xác suất không bé
lượt là 0,6 và 0,3. Tính xác suất có đúng 2 viên đạn trúng đích. hơn 99%, trong số đó có ít nhất một sinh viên đậu cả hai môn Toán và Lý.

Giải. Gọi Hi là biến cố xạ thủ chọn được súng loại i, i = 1, 2 và A là biến cố xạ thủ Giải. Gọi T, L là các biến cố sinh thi trượt môn Toán, Lý tương ứng. Ta có:
bắn trúng 2 viên. Ta có {H1 , H2 } là nhóm đầy đủ.
Theo công thức xác suất toàn phần: P (T ) = 0, 34; P (L) = 0, 2; P (L|T ) = 0, 5
Xác suất thi đậu cả 2 môn:
P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )
P (T̄ L̄) = 1 − P (T ∪ L) = 1 − [P (T ) + P (L) − P (T L)]
trong đó: = 1 − P (T ) − P (L) + P (T )P (L|T ) = 1 − 0, 34 − 0, 2 + 0, 34 ∗ 0, 5 = 0, 63
P (H1 ) = 4/10 = 0, 4; P (H2 ) = 6/10 = 0, 6
Gọi n là số sinh viên cần khảo sát. Ta có mô hình Bernoulli với n phép thử và xác suất
p = 0, 63. Theo giả thiết:
P (A|H1 ) = p5 (2) = C52 0, 62 0, 43 ; P (A|H2 ) = p5 (2) = C52 0, 32 0, 73
pn (k ≥ 1) = 1 − pn (0) ≥ 0, 99 ⇔ (1 − 0, 63)n ≤ 0, 01 ⇔ n ≥ 4, 63 ⇒ n = 5
Tôn Thất Tú - 2021 Chương 1: Xác suất 49/51 Tôn Thất Tú - 2021 Chương 1: Xác suất 50/51

Số lần có khả năng lớn nhất


Bài toán: Tìm k sao cho xác suất pn (k) đạt giá trị lớn nhất.
Kết quả: Đặt q = 1 − p và gọi K là giá trị cần tìm. Khi đó K là số nguyên thỏa điều
kiện:

XÁC SUẤT THỐNG KÊ


np − q ≤ K ≤ np − q + 1

Ví dụ 36
Một xưởng dệt có 50 máy dệt. Xác suất mỗi máy dệt bị hỏng trong mỗi ca làm việc là
0.1. Tìm số máy hỏng với khả năng lớn nhất trong 1 ca làm việc.
Tôn Thất Tú
Giải. Gọi K là số máy hỏng với khả năng lớn nhất. Ta có mô hình Bernoulli với n =
50; p = 0, 1.
Lại có: q = 1 − p = 0, 9. Giá trị K thỏa điều kiện: Đà Nẵng, 2021

np − q ≤ K ≤ np − q + 1 ⇔ 4, 1 ≤ K ≤ 5, 1

Vậy, K = 5.
Tôn Thất Tú - 2021 Chương 1: Xác suất 51/51 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 1/88
Chương 2. Biến ngẫu nhiên
1. Định nghĩa Phân loại
- Biến ngẫu nhiên X là một đại lượng có thể nhận giá trị này hay giá trị khác phụ thuộc - BNN rời rạc: BNN có tập giá trị có số lượng hữu hạn hoặc vô hạn đếm được.
vào kết quả của phép thử ngẫu nhiên. - BNN liên tục: BNN thỏa các điều kiện sau:
- Tập hợp tất cả các giá trị mà biến ngẫu nhiên X có thể nhận được được gọi là tập + tập giá trị tạo thành 1 đoạn, khoảng hoặc hợp các đoạn, khoảng.
(miền) giá trị của X, kí hiệu X(Ω). + Với mọi c ta có P (X = c) = 0.
- Về mặt toán học: Cho không gian xác suất (Ω, F, P ). Hàm X xác định trên không Chẳng hạn ở Ví dụ 1, X, Y là các BNN rời rạc, còn Z là BNN liên tục.
gian mẫu Ω và nhận giá trị trong R được gọi là biến ngẫu nhiên nếu với mọi x ∈ R, tập
hợp các kết quả {ω : X(ω) < x} lập thành một biến cố ngẫu nhiên. 2. Hàm phân phối
Ví dụ 1 Định nghĩa: Hàm số thực FX (x) = P (X < x), x ∈ R được gọi là hàm phân phối của
- Gieo ngẫu nhiên 3 lần một đồng xu. Gọi X là số lần mặt sấp xuất hiện. Khi đó X là biến ngẫu nhiên X.
một biến ngẫu nhiên nhận các giá trị 0, 1, 2 và 3. Nhận xét: Hàm phân phối FX (x) chính là xác suất X nhận giá trị trong khoảng
- Gọi Y là số người đến đổ xăng ở cửa hàng AB trong một ngày. Khi đó Y là biến ngẫu (−∞, x).
nhiên nhận các giá trị 0, 1, 2,. . . .
- Gọi Z là nhiệt độ trung bình trong một ngày (đơn vị: độ C). Khi đó Z là biến ngẫu
nhiên nhận các giá trị trong khoảng (−∞, +∞).
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 2/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 3/88

Ví dụ 2
Tính chất: Cho biến ngẫu nhiên X có hàm phân phối
i) 0 ≤ FX (x) ≤ 1, ∀x ∈ R
ii) FX (x) đơn điệu không giảm với mọi x ∈ R F (x) = a + b. arctan x, x ∈ R
iii) FX (x) liên tục trái với mọi x, tức là
a) Tìm a và b.
lim FX (x) = FX (x0 ), ∀x0 ∈ R b) Tìm x sao cho: P (X ≥ 1 − x) = 1/4
x→x−
0
Giải. a. Ta có:
iv) lim FX (x) = 1, lim FX (x) = 0
x→+∞ x→−∞

 lim F (x) = 1
( (
 bπ
x→+∞ a+ 2 =1 a = 1/2
⇔ ⇔
Nhận xét:  lim F (x) = 0
x→−∞ a− bπ
2 =0 b = 1/π
i) P (X ≥ a) = 1 − F (a)
ii) P (a ≤ X < b) = F (b) − F (a) b. P (X
 ≥ 1 − x) = 1 − P (X < 1− x) = 1 − F (1 − x)
= 1 − 1/2 + 1/π ∗ arctan(1 − x) = 1/2 − 1/π ∗ arctan(1 − x) = 1/4.
Từ đó: arctan(1 − x) = π/4 hay x = 0.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 4/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 5/88
Ví dụ 3
Cho biến ngẫu nhiên X có hàm phân phối
 b. Theo định nghĩa:
 0, x<0 FY (y) = P (Y < y) = P (2X + 1 < y)


F (x) = 2
ax + b, 0 ≤ x < 2 = P (X < (y − 1)/2) = F ((y − 1)/2)

 1, x≥2 0, (y − 1)/2 < 0
 

2
= 1/4 ∗ [(y − 1)/2] , 0 ≤ (y − 1)/2 < 2
a) Tìm a và b.

1,

(y − 1)/2 ≥ 2
b) Tìm hàm phân phối của Y = 2X + 1. 
0, y<1


Giải. a. Vì F (x) liên tục trái nên = 1/16 ∗ (y − 1)2 , 1 ≤ y < 5

 1,

y≥5
 lim F (x) = F (0)
 ( (
x→0− 0=b a = 1/4
⇔ ⇔
 lim− F (x) = F (2)
 4a + b = 1 b=0
x→2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 6/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 7/88

3. Biến ngẫu nhiên rời rạc Ví dụ 4


Cho X là biến ngẫu nhiên rời rạc với tập giá trị X(Ω). Khi đó, hàm Một lô sản phẩm có 12 sản phẩm, trong đó có 8 chính phẩm và 4 phế phẩm. Lấy ngẫu
( nhiên 2 sản phẩm. Gọi X là số chính phẩm trong 2 sản phẩm lấy ra. Tìm phân phối của
P (X = x), x ∈ X(Ω), X, xác định hàm phân phối và tính xác suất P (1 ≤ X < 3).
p(x) =
0, x∈/ X(Ω),
Giải. Ta có X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1, 2.
được gọi là hàm khối xác suất (probability mass function). P (X = 0) = C42 /C12
2
= 1/11
Trong trường hợp X(Ω) = {x1 , ..., xn } hữu hạn và pi = P (X = xi ), ta có bảng phân
phối xác suất:
P (X = 1) = C81 C41 /C12
2
= 16/33
X x1 x2 ... xn
P p1 p2 ... pn P (X = 2) = C82 /C12
2
= 14/33

Nhận xét: i)
P
pi = 1 Bảng phân phối xác suất:
ii) Hàm phân phối của X sẽ là
X X 0 1 2
FX (x) = P (X < x) = P (X = xi ) P 1/11 16/33 14/33
xi <x
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 8/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 9/88
Bảng phân phối xác suất:

X 0 1 2
P 1/11 16/33 14/33

Hàm phân phối: X


FX (x) = P (X < x) = P (X = xi )
xi <x
 


 0, x≤0 0,

 x≤0

1/11, 
0<x≤1 1/11, 0<x≤1
= =


 1/11 + 16/33, 1<x≤2 

 19/33, 1<x≤2
Hình 1. Đồ thị hàm phân phối

1/11 + 16/33 + 14/33, 
x>2  1, x>2

Xác suất: P (1 ≤ X < 3) = P (X = 1) + P (X = 2) = 16/33 + 14/33 = 10/11.


Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 10/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 11/88

Ví dụ 5
Ví dụ 6
Một xạ thủ có 4 viên đạn, xạ thủ đó bắn từng phát độc lập cho đến khi có phát trúng
Cho 2 hộp chứa bi. Hộp 1 chứa 2T và 8Đ. Hộp 2 chứa 3T và 6Đ. Lấy ngẫu nhiên 1
hoặc hết đạn thì thôi. Gọi X là số viên đạn đã bắn. Lập bảng phân phối xác suất và
viên từ hộp 1 chuyển sang hộp 2, sau đó từ hộp 2 lấy ngẫu nhiên 1 viên. Gọi X là số bi
tìm hàm phân phối của X, biết rằng xác suất bắn trúng mỗi lần đều bằng 0,7.
trắng lần 2 lấy được. Lập bảng phân phối xác suất của X.
Giải. Ta có X là biến ngẫu nhiên nhận các giá trị:1,2,3,4.
Giải. Gọi H1 , H2 là biến cố lần 1 lấy bi trắng, đen. Ta có {H1 , H2 } là nhóm đầy đủ.
Gọi Ai là biến cố viên đạn thứ i trúng đích, i = 1, 2, 3, 4. Ta có các biến cố Ai độc lập.
Từ giả thiết, X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1.
P (X = 1) = P (A1 ) = 0, 7; P (X = 2) = P (Ā1 A2 ) = 0, 3 ∗ 0, 7 = 0, 21
P (X = 0) = P (H1 )P (X = 0|H1 ) + P (H2 )P (X = 0|H2 )
P (X = 3) = P (Ā1 Ā2 A3 ) = 0, 3 ∗ 0, 3 ∗ 0, 7 = 0, 063
= 2/10 ∗ 6/10 + 8/10 ∗ 7/10 = 0, 68
P (X = 4) = P (Ā1 Ā2 Ā3 ) = 0, 3 ∗ 0, 3 ∗ 0, 3 = 0, 027
P (X = 1) = P (H1 )P (X = 1|H1 ) + P (H2 )P (X = 1|H2 )
Bảng phân phối xác suất và hàm phân phối:
= 2/10 ∗ 4/10 + 8/10 ∗ 3/10 = 0, 32
Bảng phân phối xác suất:



 0, x≤1
 7,
0, 1<x≤2

1 2 3 4

X

X 0 1
P
FX (x) = P (X = xi ) = 0, 91, 2<x≤3
P 0,7 0,21 0,063 0,027 xi <x
0,68 0,32

0, 973, 3<x≤4 P





1, x>4
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 12/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 13/88
4. Biến ngẫu nhiên liên tục
Cho biến ngẫu nhiên liên tục X với hàm phân phối FX (x). Khi đó tồn tại hàm f (x)
sao cho ta có biểu diễn:
Zx
FX (x) = f (t)dt, x ∈ R
−∞

Hàm f (x) được gọi là hàm mật độ của X.


Tính chất của hàm mật độ:
+∞
i) f (x) ≥ 0 ii) f (x)dx = 1 iii) f (x) = FX′ (x)
R
−∞
Ngược lại, một hàm số thực f (x) thỏa 2 điều kiện i) và ii) ở trên thì nó là hàm mật
độ của một biến ngẫu nhiên nào đó.
Nhận xét: i) P (X = c) = 0 với mọi hằng số c
Rb
ii) P (a ≤ X ≤ b) = . . . = P (a < X < b) = FX (b) − FX (a) = f (x)dx
Rx a
iii) Nếu f (x) là hàm mật độ thì hàm phân phối: FX (x) = −∞ f (t)dt.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 14/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 15/88

Ví dụ 7 Ví dụ 8
Tuổi thọ (năm) của một thiết bị là biến ngẫu nhiên X có hàm mật độ: Cho X là biến ngẫu nhiên liên tục có hàm mật độ
( (
0.6e−0.6x , x > 0 a x, x ∈ [0, 1]
f (x) = f (x) =
0, x≤0 0, x ∈ / [0, 1]

Chọn ngẫu nhiên 1 thiết bị. Tính xác suất tuổi thọ của thiết bị này: a) Tìm hệ số a và hàm phân phối FX (x).
a) Nhỏ hơn 1 năm. b) Lớn hơn 2 năm. b) Thực hiện 10 phép thử độc lập. Tính xác suất có 3 lần xảy ra biến cố (1/2 < X < 1).

Giải. a. Xác suất tuổi thọ thiết bị này nhỏ hơn 1 năm: Giải. a. Theo tính chất:
R +∞ R1 a
−∞ f (x)dx = 0 axdx = 2 = 1 ⇔ a = 2.
Hàm phân phối:
Z 1 Z 1
P (0 < X < 1) = f (x)dx = 0, 6e−0,6x dx = 1 − e−0,6
0 0 R
x
R−∞ 0dt, R x<0

x
b. Xác suất tuổi thọ thiết bị này lớn hơn 2 năm:
Z 
0 x
FX (x) = f (t)dt = 0dt + 0 2tdt, x ∈ [0, 1]
Z +∞ Z +∞ +∞ −∞  R−∞
0 R1 Rx
−∞ 0dt + 0 2tdt + 1 0dt, x>1

P (X > 2) = f (x)dx = 0, 6e−0,6x dx = −e−0,6x = e−1,2

2 2 2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 16/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 17/88
Ví dụ 9
 Cho biến ngẫu nhiên liên tục X có hàm phân phối:
0, x<0

 (
FX (x) = x2 , x ∈ [0, 1] 1 − a/x3 , x ≥ 2,
 F (x) =
1,

x>1 0, x<2

b. Ta có mô hình Bernoulli với n = 10 và p = P (1/2 < X < 1). a. Tìm a, hàm mật độ f (x). b. Tìm x thỏa P (X > x) = 1/4.
Z 1 Z 1
p= f (x)dx = 2xdx = 3/4 Giải. a. Vì F (x) liên tục trái tại x = 2 nên:
1/2 1/2
lim F (x) = F (2) ⇔ 1 − a/8 = 0 ⇔ a = 8
x→2−
Xác suất cần tìm:  3  7
3 1
3
p10 (3) = C10 Hàm mật độ:
4 4 (
′ 24/x4 , x ≥ 2,
f (x) = F (x) =
0, x<2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 18/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 19/88

b. Ta có:
6. Các số đặc trưng
P (X > x) = 1 − P (X ≤ x) = 1 − F (x) = 1/4 ⇔ F (x) = 3/4
a. Kỳ vọng toán
( Định nghĩa: Kỳ vọng toán của biến ngẫu nhiên X, kí hiệu E(X), là một số được xác
1 − 8/x3 = 3/4, √
3 định như sau:
⇔ ⇔x=2 4
x≥2 - Nếu X có phân phối rời rạc với phân phối xác suất P (X = xk ) = pk , k = 1, 2, ... thì
+∞
5. Sự độc lập của các biến ngẫu nhiên
X
E(X) = x i pi
i=1
- Hai biến ngẫu nhiên X và Y được gọi là độc lập nếu các biến cố (X < a) và (Y < b)
độc lập với mọi cặp giá trị (a, b), tức là: - Nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x) thì
P (X < a, Y < b) = P (X < a)P (Y < b) +∞
Z
E(X) = x f (x)dx
- Nhóm n biến ngẫu nhiên {X1 , X2 , ..., Xn } được gọi là độc lập nếu các biến cố (X1 <
a1 ), ...., (Xn < an ) độc lập với mọi bộ giá trị (a1 , a2 , ..., an ).
−∞

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 20/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 21/88
+∞ +∞
Trong trường hợp |xi |pi hoặc |x| fX (x)dx phân kì thì ta nói biến ngẫu nhiên X b. Khi X có phân phối liên tục với hàm mật độ:
P R
i=1 −∞ (
không có kỳ vọng. sin x, x ∈ [0, π/2]
Tính chất: f (x) =
0, x∈/ [0, π/2]
i) E(c) = c với c là hằng số.
ii) E(cX) = cE(X) với c là hằng số.
Giải.
iii) E(X ± Y ) = E(X) ± E(Y ) với mọi biến ngẫu nhiên X, Y .
a. E(X) = i pi xi = 0, 2 ∗ 1 + 0, 7 ∗ 2 + 0, 1 ∗ 3 = 1, 9
P
iv) E(XY ) = E(X).E(Y ) nếu X, Y độc lập.
b. Ta có:

Ví dụ 10 +∞
Z Z π/2 Z π/2
E(X) = x f (x)dx = x sin xdx = xd(− cos x)
Tính kỳ vọng của biến ngẫu nhiên X trong hai trường hợp sau: 0 0
a. X có phân phối rời rạc với bảng phân phối xác suất: −∞

Z π/2
X 1 2 3 π/2
= −x cos x 0 + cos xdx = 1
P 0,2 0,7 0,1 0

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 22/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 23/88

Ví dụ 11
Trong hộp có 7 bút xanh và 3 bút đỏ. Một sinh viên rút ngẫu nhiên 2 bút để mua. Giá
Nhận xét:
bút xanh và đỏ lần lượt 2000 đồng và 3000 đồng. Tìm số tiền trung bình sinh viên này
i) Kì vọng của biến ngẫu nhiên thể hiện giá trị trung bình của biến ngẫu nhiên đó, tức
phải trả.
là khi thực hiện một số lớn lần các phép thử thì giá trị trung bình thu được của các kết
quả sẽ xấp xỉ với kì vọng.
Giải. Gọi X (ngàn đồng) là số tiền sinh viên này phải trả. Ta có X nhận các giá trị: 4,
ii) Xét trò chơi may rủi với số tiền đặt cược trong mỗi ván không đổi. Trò chơi được
5 và 6.
gọi là công bằng (có lợi hay có hại) đối với người chơi nếu kỳ vọng số tiền nhận được
P (X = 4) = C72 /C10
2 = 7/15
trong mỗi lần chơi bằng (lớn hơn hay bé hơn) số tiền đặt cược trong mỗi ván chơi. 1 1 2 = 7/15
P (X = 5) = C7 C3 /C10
iii) Nếu g(x) là hàm liên tục thì g(X) cũng là biến ngẫu nhiên và kì vọng của nó được 2 2
P (X = 6) = C3 /C10 = 1/15
tính là:
+∞ Bảng phân phối xác suất của X:
g(xi ).pi nếu X là biến ngẫu nhiên rời rạc.
P
• Eg(X) =
i=1
+∞
X 4 5 6
g(x) fX (x)dx nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x).
R
• Eg(X) = P 7/15 7/15 1/15
−∞

Số tiền trung bình phải trả:


X
E(X) = pi xi = 7/15 ∗ 4 + 7/15 ∗ 5 + 1/15 ∗ 6 = 4, 6(ngàn đồng)
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 24/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 25/88
Ví dụ 12
Ví dụ 13
Thời gian xếp hàng chờ mua hàng của khách hàng là 1 biến ngẫu nhiên T (phút) có
Một người tham gia trò chơi may rủi với tiền cược mỗi ván là 10000 đồng. Người này
hàm mật độ: ( tung ngẫu nhiên 2 đồng xu, nếu được i mặt sấp người này thu về (i + 1) ∗ 5000 đồng,
a.t3 , t ∈ [0, 3]
f (t) = i = 1, 2. Ngược lại, người này sẽ mất tiền. Hỏi người này có nên chơi trò này thường
0, t∈/ [0, 3] xuyên hay không?
Tìm a và tính thời gian chờ trung bình của khách hàng.
Giải. Gọi X (ngàn đồng) là số tiền người này nhận được trong 1 lần chơi. Ta có X
Giải. Theo tính chất của hàm mật độ: nhận các giá trị: 0, 10 và 15. Bảng phân phối của X:
Z +∞ Z 3
f (t)dt = at3 dt = 81a/4 = 1 ⇔ a = 4/81 X 0 10 15
−∞ 0 P 1/4 1/2 1/4
Thời gian chờ trung bình của khách hàng:
Do đó: E(X) = pi xi = 8, 75 (ngàn đồng). Vì số tiền này nhỏ hơn số tiền đặt cược
P
Z +∞ 3
4 3 nên nếu người này chơi càng nhiều thì thua càng lớn.
Z
E(T ) = tf (t)dt = t∗ t dt = 2, 4(phút)
−∞ 0 81 Vậy, người này không nên chơi trò này thường xuyên.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 26/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 27/88

b. Phương sai Nhận xét: Trong thực hành, ta hay sử dụng công thức sau: D(X) = E(X 2 ) − (EX)2 ,
trong đó:
Định nghĩa: Giả sử biến ngẫu nhiên X có kỳ vọng EX. Nếu tồn tại kỳ vọng
E(X − EX)2 thì ta gọi giá trị này là phương sai của X, kí hiệu là DX (hay
P
 pi x2i ,
 nếu X là biến ngẫu nhiên rời rạc
V ar(X), V (X)), tức là: 2
E(X ) = +∞
x f (x)dx, nếu X là biến ngẫu nhiên liên tục
R 2
DX = E(X − EX)2 

√ −∞
Giá trị σ(X) = DX được gọi là độ lệch chuẩn.
Tính chất: Ý nghĩa:
i) D(c) = 0 với c là hằng số - Phương sai cũng như độ lệch chuẩn là đại lượng đặc trưng cho mức độ tập trung của
ii) D(cX) = c2 D(X) với c là hằng số các giá trị của biến ngẫu nhiên X quanh kỳ vọng EX. Phương sai càng lớn thì các giá
iii) DX = E(X 2 ) − (EX)2 trị khuếch tán càng xa so với kỳ vọng.
iv) D(X ± Y ) = D(X) + D(Y ) với X, Y độc lập - Trong kỹ thuật phương sai đặc trưng cho sai số của các thiết bị hoặc của các phép
đo. Trong quản lý và kinh doanh, nó đặc trưng cho mức độ rủi ro của các quyết định.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 28/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 29/88
Ví dụ 14 Ví dụ 15
Cho biến ngẫu nhiên X có phân phối Một nhà đầu tư đang cân nhắc giữa việc đầu tư vào 2 dự án A và B trong 2 lĩnh vực
độc lập. Khả năng thu hồi vốn sau 2 năm (tính bằng %) của 2 dự án là các biến ngẫu
X 1 2 a
nhiên XA , XB có bảng phân phối xác suất như sau:
P b 0.3 0.5
XA 65 67 68 69 70 71 73
a. Tìm a và b, biết E(X) = 2, 3. b. Tính D(2X − 3), D(X 2 ) P 0.04 0.12 0.16 0.28 0.24 0.08 0.08
XB 66 68 69 70 71
Giải. a. Ta có hệ:
(P ( ( P 0.12 0.28 0.32 0.20 0.08
pi = 1 b + 0, 3 + 0, 5 = 1 a=3
⇔ ⇔
E(X) =
P
pi xi = 2, 3 b + 0, 6 + 0, 5a = 2, 3 b = 0, 2 Từ các bảng phân phối trên, ta tính được:
E(XA ) = 69, 16%; D(XA ) = 3, 0944; E(XB ) = 68, 72%; D(XB ) = 1, 8016
b. Ta có:
D(2X − 3) P= D(2X) + D(3) = 4D(X) = 4[E(X 2 ) − (E(X))2 ] = 4[E(X 2 ) − 5, 29] Do đó, nếu cần chọn phương án đầu tư sao cho tỉ lệ thu hồi vốn kỳ vọng cao hơn thì
2
E(X ) = pi xi = 0, 2 ∗ 12 + 0, 3 ∗ 22 + 0, 5 ∗ 32 = 5, 9
2
nên chọn dự án A, song nếu chọn phương án đầu tư sao cho độ rủi ro của tỉ lệ thu hồi
D(2X − 3) = 4(5, 9 − 5, 29) = 2, 44 vốn thấp hơn (tức khả năng thu hồi vốn ổn định hơn) thì lại nên chọn dự án B.
Tương tự: D(X 2 ) = E(X 4 ) − (E(X 2 ))2 = pi x4i − 5, 92 = 10, 69
P

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 30/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 31/88

0.4
c. Trung vị (median)

0.12
Định nghĩa: Trung vị (hay Median) của biến ngẫu nhiên X, được kí hiệu med(X) xác

0.2

0.06

median
mean

mean
định theo hệ thức:

median

0.00
1 1

0.0
P (X < med(X)) ≤ và P (X > med(X)) ≤
2 2 7 8 9 10 11 12 13 5 10 15 20 25
Nhận xét: Theo định nghĩa trên thì X có thể có nhiều trung vị và trong trường hợp X
0.20

0.20
là biến ngẫu nhiên liên tục thì med(X) chính là nghiệm của phương trình

mean

mean
1
0.10

median
0.10
FX (x) =

median
2
0.00

0.00
5 10 15 20 25 0 5 10 15

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 32/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 33/88
Giải. a. Ta có med(X) = 2 vì:

Ví dụ 16 P (X < 2) = P (X = 1) = 0, 4 ≤ 1/2; P (X > 2) = P (X = 3) = 0, 3 ≤ 1/2


Tìm trung vị của biến ngẫu nhiên X biết: b. med(X) = x0 với x0 bất kì thuộc đoạn [2, 3].
X 1 2 3 c. Hàm phân phối:
a. X có bảng phân phối:
P 0.4 0.3 0.3 Z x (R x (
2e−2t dt, x > 0 1 − e−2x , x>0
X 1 2 3 4 F (x) = f (t)dt = 0 =
b. X có bảng phân phối: 0, x≤0 0, x≤0
P 0.2 0.3 0.4 0.1 −∞

c. X có hàm mật độ: ( Xét phương trình: F (x) = 1/2


2e−2x , x>0
f (x) = (
0, x ≤ 0. 1 − e−2x = 1/2 ln2
⇔ ⇔x=
x>0 2

Vậy, med(X) = ln2


2 .

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 34/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 35/88

d. Phân vị và giá trị tới hạn

7. Một số phân phối quan trọng

7.1 Phân phối Bernoulli


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối Bernoulli với tham số p ∈
(0, 1), kí hiệu X ∼ Ber(p), nếu X có bảng phân phối xác suất:

X 0 1
P 1-p p

Tính chất: Nếu X ∼ Ber(p) thì E(X) = p và DX = p(1 − p).


Ý nghĩa: Phân phối Bernoulli thường được sử dụng để mô tả phân phối của đại lượng
chỉ nhận 2 giá trị: đạt/không đạt, đồng ý/không đồng ý, hoàn thành/chưa hoàn thành,
- Phân vị mức α, 0 < α < 1 của phân phối tương ứng với biến ngẫu nhiên X là giá trị thư rác/không phải thư rác,...
xα thỏa P (X < xα ) = α.
- Giá trị tới hạn mức α, 0 < α < 1 của phân phối tương ứng với biến ngẫu nhiên X là
giá trị x̄α thỏa P (X > x̄α ) = α.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 36/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 37/88
7.2 Phân phối nhị thức
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối nhị thức với tham số n và p,
kí hiệu X ∼ B(n, p) nếu X nhận các giá trị {0, 1, 2, ..., n} với xác suất:

P (X = k) = pn (k) = Cnk pk (1 − p)n−k , k = 0, n

Tính chất:
i) Nếu X ∼ B(n, p) thì E(X) = np, D(X) = np(1 − p).
ii) Nếu các biến ngẫu nhiên Xi , i = 1, n độc lập và Xi ∼ Ber(p) thì

X = X1 + ... + Xn ∼ B(n, p)

Nhận xét:
i) B(1, p) chính là phân phối Ber(p).
ii) Xét dãy n phép thử Bernoulli với xác suất thành công là p. Lúc đó, nếu gọi X là biến
ngẫu nhiên chỉ số lần thành công trong dãy n phép thử này thì X ∼ B(n, p).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 38/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 39/88

Ví dụ 17 Ví dụ 18
Một thành phố A có 70% gia đình có tivi. Chọn ngẫu nhiên 20 gia đình và gọi X là số Một sinh viên thi vấn đáp trả lời 5 câu hỏi một cách độc lập. Khả năng trả lời đúng
gia đình có tivi. mỗi câu hỏi đều bằng 60%. Nếu trả lời đúng thì sinh viên được 4 điểm, ngược lại bị trừ
a) Tính xác suất có đúng 10 gia đình có tivi. 2 điểm.
b) Tính xác suất để có ít nhất 2 gia đình có tivi. a) Tìm xác suất để sinh viên đó trả lời đúng 3 câu.
b) Tìm số điểm trung bình mà sinh viên đó đạt được.
Giải. Ta có mô hình Bernoulli với n = 20 và p = 0, 7. Do đó: X ∼ B(n = 20; p = 0, 7). c) Một sinh viên khác vào thi với khả năng trả lời đúng mỗi câu đều như nhau và cho
a. Xác suất có đúng 10 gia đình có tivi: rằng số điểm trung bình đạt được không ít hơn 14. Hỏi sinh viên này phán đoán khả
năng trả lời đúng mỗi câu tối thiểu là bao nhiêu ?
10
P (X = 10) = p20 (10) = C20 0, 710 0, 310
Giải. Mô hình Bernoulli với n = 5 và p = 0, 6. Gọi X là số câu trả lời đúng của sinh
b. Xác suất có ít nhất 2 gia đình có tivi: viên này. Ta có: X ∼ B(n = 5; p = 0, 6).
a. P (X = 3) = p5 (3) = C53 0, 63 0, 42 .
P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X = 0) − P (X = 1) = 1 − p20 (0) − p20 (1)
b. Gọi Y là số điểm sinh viên này đạt được.
Ta có: Y = 4X − 2(5 − X) = 6X − 10.
0
= 1 − C20 0, 70 0, 320 − C20
1
0, 71 0, 319 Số điểm trung bình sinh viên này đạt được:
E(Y ) = 6E(X) − 10 = 6np − 10 = 6 ∗ 5 ∗ 0, 6 − 10 = 8 (điểm)
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 40/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 41/88
7.3 Phân phối Poisson
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ > 0,
c. Gọi p là xác suất trả lời đúng mỗi câu của sinh viên mới này. Gọi Z và T là số câu kí hiệu X ∼ P ois(λ) nếu X nhận giá trị trong tập N = {0, 1, 2, 3, ...} với xác suất:
trả lời đúng và số điểm đạt được. Tương tự, ta có:
λk e−λ
Z ∼ B(n = 5; p) và T = 6Z − 10 P (X = k) = , k = 0, 1, 2, ...
k!
Theo giả thiết:
E(T ) ≥ 14 Tính chất:
i) Nếu X ∼ P ois(λ) thì E(X) = λ, D(X) = λ.
ii) Cho X1 , X2 độc lập và có phân phối Poisson với tham số λ1 , λ2 . Khi đó X =
⇔ 6np − 10 = 30p − 10 ≥ 14 ⇔ p ≥ 0, 8
X1 + X2 ∼ P ois(λ1 + λ2 ).
Vậy, sinh viên này dự đoán khả năng trả lời đúng tối thiểu mỗi câu là 80%. Nhận xét: Trong thực tế phân phối Poisson phản ánh phân phối số lượng các biến cố
xuất hiện trong một khoảng thời gian (số cuộc điện thoại gọi đến tổng đài, số khách
hàng đến rút tiền từ một ngân hàng,....) và có tham số tỉ lệ với độ dài khoảng thời gian
đó.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 42/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 43/88

Giải thích: (đọc thêm)


Gọi N (t) là số biến cố xuất hiện trong khoảng thời gian [0, t]. Giả sử 3 giả thiết sau đây
được thỏa mãn:
(i) Xác suất có đúng 1 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng
λh + o(h) với λ > 0 - hằng số.
(ii) Xác suất có ít nhất 2 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng
o(h2 ).
(iii) Số biến cố xuất hiện trong các khoảng thời gian không giao nhau là các biến
ngẫu nhiên độc lập nhau.
Khi đó, người ta chứng minh được rằng:

(λt)k e−λt
P (N (t) = k) = , k ≥ 0.
k!

Điều này có nghĩa N (t) ∼ P ois(λt). Tham số λ chính là số biến cố trung bình xuất
hiện trong một đơn vị thời gian.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 44/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 45/88
Ví dụ 19 Ví dụ 20

Một gara cho thuê ôtô thấy rằng số đơn đặt hàng thuê ôtô vào ngày thứ 7 là một biến Quan sát tại siêu thị A thấy 4 phút trung bình có 20 khách đến mua hàng.
ngẫu nhiên có phân phối Poisson với tham số λ = 2. Giả sử gara có 4 chiếc ôtô. Hãy a) Tính xác suất để trong 7 phút có 30 khách đến siêu thị A ?
tìm xác suất để: b) Tính xác suất để trong 2 phút có từ 3 đến 5 khách đến siêu thị A ?
a) Có đúng 2 ôtô được thuê. Giả sử số khách đến siêu thị A tuân theo luật phân phối Poisson.
b) Tất cả 4 ôtô đều được thuê.
c) Gara không đáp ứng được yêu cầu. Giải.
a. Gọi X là số khách đến siêu thị trong 7 phút. Lúc đó, X có phân phối Poisson với
Giải. Gọi X là số đơn đặt hàng ôtô vào ngày thứ 7. Ta có X ∼ P ois(λ = 2). tham số λ = 7/4 ∗ 20 = 35. Xác suất cần tìm:
22 3530
a. P (X = 2) = e−2 = 2e−2 P (X = 30) = e−35
2! 30!
b. P (X ≥ 4) = 1 − P (X < 4) =!1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
20 21 22 23 b. Gọi Y là số khách đến siêu thị trong 2 phút. Lúc đó, Y có phân phối Poisson với
= 1 − e−2 + + + = 1 − 19/3e−2 tham số λ = 2/4 ∗ 20 = 10. Xác suất cần tìm:
0! 1! 2! 3! !
103 104 105
!
20 21 22 23 24 P (3 ≤ Y ≤ 5) = P (Y = 3) + P (Y = 4) + P (Y = 5) = e −10
+ +
c. P (X > 4) = 1 − P (X ≤ 4) = 1 − e −2 + + + + = 1 − 7e−2 3! 4! 5!
0! 1! 2! 3! 4!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 46/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 47/88

Định lý: (Luật biến cố hiếm)


Cho X ∼ B(n; p). Khi p khá nhỏ và n khá lớn, ta có
7.4 Phân phối hình học
λk e−λ
P (X = k) ≈ trong đóλ = np. Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối hình học với tham số p ∈ (0, 1)
k! nếu X nhận các giá trị 1,2,3,... với xác suất:
Điều này có nghĩa là X có phân phối xấp xỉ phân phối Poisson với tham số λ = np.
P (X = k) = (1 − p)k−1 p, k = 1, 2, 3, ...
Ví dụ 21
1 1−p
Xác suất mỗi trang giấy bị lỗi do in ấn là 0,009. Tính xấp xỉ xác suất trong một quyển Tính chất: E(X) = , D(X) =
p p2
sách 300 trang có nhiều nhất 3 trang bị lỗi. Nhận xét: Xét phép thử và A là một biến cố ở trong phép thử đó với xác suất xảy
Giải. Gọi X là số trang bị lỗi trong quyển sách 300 trang. Ta có: X ∼ B(n = 300; p = ra p = P (A). Thực hiện độc lập và liên tiếp các phép thử cho đến khi biến cố A xuất
0, 009). Vì n khá lớn và p khá nhỏ nên X có phân phối xấp xỉ phân phối Poisson với hiện thì dừng. Gọi X là số phép thử đã thực hiện. Khi đó, X có phân phối hình học với
tham số λ = np = 2, 7. Xác suất cần tìm: tham số p.
P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)
!
−2,7 2, 70 2, 71 2, 72 2, 73
≈e + + +
0! 1! 2! 3!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 48/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 49/88
7.5 Phân phối siêu bội
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối siêu bội với tham số (N, M, n) 7.6 Phân phối đều
với n ≤ M ≤ N , kí hiệu X ∼ H(N, M, n) nếu tập giá trị của X là {0, 1, 2, ..., n} và Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối đều trên đoạn [a, b], kí hiệu
k C n−k X ∼ U (a, b) nếu hàm mật độ của nó có dạng:
CM N −M
P (X = k) = n , k = 0, 1, ..., n
CN  1 , x ∈ [a, b]

  f (x) = b − a
Tính chất: E(X) = n M , M M N −n 0, x∈/ [a, b]
N D(X) = n N 1− N N −1
Nhận xét: 2
i) Cho một tập có N phần tử, trong đó có M phần tử có tính chất A, M ≤ N . Chọn Tính chất: EX = a+b 2 , DX =
(b−a)
12
ngẫu nhiên lần lượt không hoàn lại n lần, mỗi lần một phần tử trong tập hợp này và Nhận xét: Các hàm phát sinh số ngẫu nhiên thực trong đoạn [0,1] (trên các ngôn ngữ
gọi X là số phần tử được chọn có tính chất A. Khi đó X ∼ H(N, M, n). lập trình, Excel, may tính bỏ túi, ...) là hàm mô phỏng giá trị của biến ngẫu nhiên có
ii) Khi giá trị N lớn và số lần lấy n nhỏ thì phương pháp lấy không hoàn lại và lấy có phân phối đều trên đoạn [0, 1].
hoàn lại gần như không khác nhau. Vì vậy trong trường hợp N lớn và số lần lấy n nhỏ
thì ta có thể xem phân phối H(N, M, n) xấp xỉ phân phối B(n, p) với p = M/N .

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 50/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 51/88

Ví dụ 22
Xe buýt đến trạm dừng A tại một thời điểm cố định bắt đầu từ 7h, và liên tục lặp lại
trong khoảng thời gian 15ph (tức là: 7h, 7h15, 7h30,...). Giả sử một khách đến trạm 7.7 Phân phối mũ
dừng A tại thời điểm có phân phối điều trên đoạn [7h, 7h30]. Tính xác suất người này
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối mũ với tham số λ > 0, kí
chờ xe buýt ít hơn 5ph.
hiệu X ∼ Exp(λ) nếu hàm mật độ của nó có dạng:
Giải: Gọi X (ph) là thời gian tính từ lúc 7h người này đến trạm dừng A. Theo giả thiết
(
λe−λx , x > 0
X có phân phối đều trên [0, 30]. Hàm mật độ của X: f (x) =
0, x≤0
(
1/30, x ∈ [0, 30]
f (x) = Tính chất: E(X) = 1/λ; D(X) = 1/λ2
0, x∈ / [0, 30]
Nhận xét: Trong thực tế, phân phối mũ thường thể hiện phân phối khoảng thời gian
chờ giữa các lần xảy ra biến cố hay thời gian sống của các đối tượng.
Xác suất cần tìm:
15 30
1 1 1
Z Z
P (10 < X < 15) + P (25 < X < 30) = dx + dx = .
10 30 25 30 3

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 52/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 53/88
Giải thích:(đọc thêm) Ví dụ 23
Gọi Tn là thời điểm mà biến cố thứ n xuất hiện và N (t) là số biến cố xuất hiện trong
khoảng thời gian [0, t]. Khi đó: Giả sử tuổi thọ (tính bằng năm) của một mạch điện tử trong máy tính là một biến ngẫu
nhiên có phân phối mũ với tuổi thọ trung bình là 6,25 năm. Thời gian bảo hành của
+∞
X +∞
X (λt)j mạch điện tử này là 1 năm.
P (Tn ≤ t) = P (N (t) ≥ n) = P (N (t) = j) = e−λt . a) Hỏi có bao nhiêu phần trăm mạch điện tử bán ra phải bảo hành ?
j!
j=n j=n b) Một công ty mua 40 mạch điện tử loại này. Tìm số mạch trung bình công ty phải
bảo hành.
Từ đó, hàm mật độ của Tn :
Giải. a. Gọi X (năm) là tuổi thọ của mạch điện tử. Theo giả thiết, X ∼ Exp(λ) với
λe−λt (λt)n−1
fTn (t) = E(X) = 1/λ = 6, 25 ⇒ λ = 4/25. Hàm mật độ:
(n − 1)!
(
4/25e−4/25x , x > 0
X Phân phối của Tn thường được gọi là phân Gamma với tham số (n, λ) (đôi lúc còn f (x) =
gọi là phân phối n - Erlang). 0, x≤0
X Khi n = 1, T1 có phân phối mũ với tham số λ.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 54/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 55/88

7.8 Phân phối chuẩn


Tỉ lệ mạch điện tử phải bảo hành:
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối chuẩn với tham số µ và σ 2 ,
Z 1 Z 1 kí hiệu X ∼ N (µ, σ 2 ) nếu hàm mật độ của nó có dạng:
P (0 < X < 1) = f (x)dx = 4/25e−4/25x dx = 1 − e−4/25 ≈ 0, 15
0 0 1 (x−µ)2
f (x) = √ e− 2σ2 , x ∈ R
b. Ta có mô hình Bernoulli với n = 40 và p = 0, 15. σ 2π
Gọi Y là số mạch công ty cần bảo hành. Ta có:
Khi µ = 0, σ = 1 ta bảo X có phân phối chuẩn tắc N (0, 1). Hàm mật độ ϕ(x) và
Y ∼ B(n = 40; p = 0, 15) hàm phân phối Φ(x) của phân phối chuẩn tắc N(0,1) tương ứng là:

Số mạch trung bình công ty cần bảo hành: 1 2


ϕ(x) = √ e−x /2 , x ∈ R

E(Y ) = np = 40 ∗ 0, 15 = 6 Z x
1 2
Φ(x) = √ e−t /2 dt, x ∈ R
2π −∞

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 56/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 57/88
Đường cong chuẩn (đường cong hình chuông) Nhận xét:
i) Biến ngẫu nhiên có phân phối chuẩn tắc thường được kí hiệu là Z. Do đó:

Φ(x) = P (Z < x)
ii) Φ(−x) = 1 − Φ(x), ∀x ∈ R.
1 R x −t2 /2
iii) Φ(x) = 1/2 + Φ0 (x), trong đó Φ0 (x) = √ e dt - hàm Laplace.
2π 0
Một vài giá trị hay sử dụng:

Φ(0) = 0, 5; Φ(1/2) = 0, 691; Φ(1) = 0, 841; Φ(2) = 0, 977

Giá trị tới hạn: Giá trị tới hạn mức α của phân phối chuẩn tắc được kí hiệu zα , tức là:

P (Z > zα ) = α hay zα = Φ−1 (1 − α)

Giá trị zα được tra ở bảng.


Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 58/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 59/88

Tính Φ(x) bằng máy tính Casio


1) CASIO FX570MS:
- Vào Mode tìm SD: M ode → M ode → 1(SD)
- Shif t → 3(Distr) → 1
- Nhập x.
2) CASIO FX570ES, FX570ES - PLUS, FX570VN - PLUS:
- Vào Mode tìm 1-Var: M ode → 3(Stat) → 1(1 − V ar) → AC
- Shif t → 1(Stat) → 5(Distr) → 1
- Nhập x.
3) CASIO FX580VN:
- Setup → 6 → = → 1 → AC
- OP T N → ↓ → 4 → 1
- Nhập x.
Ví dụ 24
Phân phối chuẩn tắc và giá trị tới hạn Tính Φ(1.96), Φ(2), Φ(3)
Đáp số. Φ(1.96) = 0, 975, Φ(2) = 0, 977, Φ(3) = 0, 998
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 60/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 61/88
Tính chất:
Hệ quả: («chuẩn hóa») Nếu X ∼ N (µ, σ 2 ) thì
i)Nếu X ∼ N (µ, σ 2 ) thì E(X) = µ, D(X) = σ 2 .
ii) Nếu X ∼ N (µ, σ 2 ) thì Y = aX + b ∼ N (aµ + b, a2 σ 2 ), a 6= 0. X −µ
iii) Nếu X1 , ..., Xn là các biến ngẫu nhiên độc lập có phân phối chuẩn Xi ∼ Z=
σ
∼ N (0; 1)
n
N (µi , σi2 ), i = 1, n thì biến ngẫu nhiên X = λ1 X1 + ... + λn Xn + C, λ2i 6= 0
P
i=1 Ứng dụng: Cho X ∼ N (µ, σ 2 ). Lúc đó:
cũng có phân phối chuẩn với    
 a−µ a−µ
n
!
n P (X < a) = P Z < =Φ
σ σ

 P P
µX = E(X) = E λi Xi + C = λi µi + C,



i=1 i=1      
a−µ b−µ b−µ a−µ
!
n n


σ 2 = D(X) = D
P
λi X i + C =
P
λ2i σi2 P (a < X < b) = P <Z< =Φ −Φ

 X

 σ σ σ σ
i=1 i=1
Trường hợp đặc biệt,
Đặc biệt, nếu X1 , ..., Xn độc lập và có cùng phân phối chuẩn thì N (µ, σ 2 )  
a

a
  
a
P (|X − µ| < a) = Φ −Φ − = 2Φ −1
X1 + ... + Xn  σ2  σ σ σ
X = X1 + ... + Xn ∼ N (nµ; nσ 2 ); X= ∼ N µ;
n n
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 62/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 63/88

Ví dụ 26

Ví dụ 25 Giả sử số đo chiều dài của một sợi dây kim loại do một máy tự động cắt ra là một biến
ngẫu nhiên chuẩn với µ = 10mm, σ 2 = 4mm2 .
Cho biến ngẫu nhiên X ∼ N (4, 32 ). a) Tính xác suất lấy ra được một sợi dây có chiều dài lớn hơn 13mm.
Tính xác suất: P (X < 5), P (X > 1), P (|X − 3| < 1). b) Chọn ngẫu nhiên 10 sợi dây loại này. Tính xác suất có đúng 3 sợi có chiều dài từ
8, 5mm đến 12, 5mm.
Giải. Ta có: 5 − 4
P (X < 5) = Φ = 0, 63 Giải. Gọi X là số đo chiều dài sợi dây kim loại. Ta có: X ∼ N (10; 22 ).
3  13 − 10 
a. P (X > 13) = 1 − P (X ≤ 13) = 1 − Φ = 0, 067
1 − 4 2
P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 841 b. Mô hình Bernoulli với n = 10 và p = P (8, 5 < X < 12, 5). Ta có:
3
4 − 4 2 − 4  12, 5 − 10   8, 5 − 10 
P (|X − 3| < 1) = P (2 < X < 4) = Φ −Φ = 0, 2475 p=Φ −Φ = 0, 668
3 3 2 2

Xác suất cần tìm:


3
p10 (3) = C10 0, 6683 (1 − 0, 668)7

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 64/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 65/88
Ví dụ 28
Ví dụ 27
Cho X ∼ N ( 15, 4 ), Y ∼ N ( 10, 1 ), X và Y độc lập.
Cho X là biến ngẫu nhiên có phân phối chuẩn. Biết rằng P (X > 4) = 0, 159 và P (X <
a) Tính P (2X > 3Y ).
3) = 0, 309. Tính xác suất P (X > 1). Cho biết Φ(1/2) = 0, 691 và Φ(1) = 0, 841.
b) Tìm a và b biết T = X + aY + b và E(T ) = 30, D(T ) = 5.
Giải. Giả sử X ∼ N (µ; σ 2 ). Khi đó:
Giải. a. Đặt Z = 2X − 3Y . Theo tính chất của phân phối chuẩn, Z cũng có phân phối
4 − µ 4 − µ chuẩn với tham số:
P (X > 4) = 1 − Φ = 0, 159 ⇔ Φ = 0, 841 = Φ(1) ⇔ 4 − µ = σ (1)
σ σ
(
µZ = E(Z) = 2E(X) − 3E(Y ) = 2 ∗ 15 − 3 ∗ 10 = 0
3 − µ  3 − µ 3 − µ σZ2 = D(Z) = 4D(X) + 9D(Y ) = 4 ∗ 4 + 9 ∗ 1 = 25
P (X < 3) = Φ = 0, 309 ⇔ Φ − = 1−Φ = 0, 691 = Φ(1/2)
σ σ σ 0 − 0
Do đó, Z ∼ N (0; 25). Vậy, P (2X > 3Y ) = P (Z > 0) = 1 − Φ = 1/2.
5
⇔ 3 − µ = −σ/2 (2) b. Sử dụng tính chất của kỳ vọng và phương sai:
Giải hệ (1),(2) ta được: µ = 10/3; σ = 2/3. ( ( "
 1 − 10/3  E(T ) = 30 15 + 10a + b = 30 a = 1; b = 5
Vậy, P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 99976 ⇔ ⇔
2/3 D(T ) = 5 4 + a2 = 5 a = −1; b = 25

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 66/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 67/88

Ví dụ 29
Qui tắc 2σ: Cho X ∼ N (µ, σ 2 ). Khi đó
Chiều cao X (mét) của nam thanh niên trưởng thành ở quốc gia A tuân theo quy luật
phân bố chuẩn N (µ; 0, 12 ). Chọn ngẫu nhiên 100 nam thanh niên của quốc gia A. Tính P (|X − µ| < 2σ) = P (µ − 2σ < X < µ + 2σ) = Φ(2) − Φ(−2) ≈ 0, 9545
xác suất sai số tuyệt đối giữa chiều cao trung bình của 100 nam thanh niên được chọn
với µ không vượt quá 0, 03.
hay P (µ − 2σ < X < µ + 2σ) ≈ 0, 9545
Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 100 và X̄ = (X1 +...+X100 )/100.
Điều này có nghĩa xác suất X nhận giá trị trong khoảng (µ − 2σ, µ + 2σ) bằng 95,45%.
Ta có: Xi độc lập và Xi ∼ N (µ; 0, 12 ). Theo tính chất của phân phối chuẩn, X̄ cũng
có phân phối chuẩn với tham số:
( Qui tắc 3σ: Cho X ∼ N (µ, σ 2 ). Khi đó
µX̄ = E(X̄) = µ
2 = D(X̄) = 0, 12 /100 = 10−4
σX̄ P (|X − µ| < 3σ) = P (µ − 3σ < X < µ + 3σ) = Φ(3) − Φ(−3) ≈ 0, 9973

Do đó, X̄ ∼ N (µ; 10−4 ). Xác suất cần tìm:


    hay P (µ − 3σ < X < µ + 3σ) ≈ 0, 9973
0, 03 0, 03
P (|X̄−µ| ≤ 0, 03) = P (µ−0, 03 ≤ X̄ ≤ µ+0, 03) = Φ −Φ − −2 = 0, 9973 Điều này có nghĩa xác suất X nhận giá trị trong khoảng (µ − 3σ, µ + 3σ) bằng 99,73%.
10−2 10

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 68/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 69/88
Ứng dụng
- Khi nghiên cứu các phân phối, nếu nó thỏa quy tắc 2σ và 3σ thì điều này cung cấp
cho chúng ta cơ sở để «có thể xem» phân phối đang nghiên cứu là phân phối chuẩn.
- Ngược lại, nếu biết phân phối đang nghiên cứu là phân phối chuẩn, lúc đó các «khoảng»
2σ và 3σ lần lượt chiếm 95,45% và 99,73% các giá trị có thể.

Ví dụ 30
Thu thập dữ liệu từ 2 phân phối, thực hiện tính toán và được kết quả:

Bộ dữ liệu (x̄ − 2s, x̄ + 2s) (x̄ − 3s, x̄ + 3s)


1 94,74% 98,61%
2 80,23% 92,15%

trong đó x̄ và s lần lượt là trung bình mẫu và độ lệch chuẩn mẫu (Chương 4).
Câu hỏi: Phân phối nào có thể xem là chuẩn? 1 hay 2?
Quy tắc 2σ và 3σ
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 70/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 71/88

7.9 Phân phối χ2


Định nghĩa: Cho X1 , X2 , ..., Xn là các biến ngẫu nhiên độc lập và có cùng phân phối
N (0, 1). Khi đó, phân phối của biến ngẫu nhiên X = X12 + X22 + ... + Xn2 được gọi là
phân phối χ2 với n bậc tự do. Kí hiệu X ∼ χ2n .
Giá trị tới hạn mức α của phân phối χ2n được kí hiệu χ2n;α và được tra ở bảng.
Tính chất:
i) E(X) = n, D(X) = 2n
ii) Hàm mật độ của χ2n có dạng:
 n x
 n1 x 2 −1 e− 2 , x > 0
2 2 Γ( n )
f (x) = 2
0, x≤0

+∞
trong đó hàm gamma: Γ(a) = xa−1 e−x dx, a > 0.
R
0
Phân phối χ2 và giá trị tới hạn
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 72/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 73/88
7.10 Phân phối student
Định nghĩa: Cho X ∼ N (0, 1), Y ∼ χ2 n và X, Y độc lập. Khi đó, phân phối của biến
ngẫu nhiên Z = √X được gọi là phân phối student với n bậc tự do, kí hiệu X ∼ Tn .
Y /n
Giá trị tới hạn mức α của phân phối Tn được kí hiệu tn;α và được tra ở bảng. Khi
n > 30 người ta thường sử dụng công thức xấp xỉ:

tn;α ≈ zα

Tính chất:
i) E(X) = 0, D(X) = n−2n
,n>2
ii) Hàm mật độ của Tn có dạng:
  !− n+1
Γ n+12 x2 2

f (x) = √ $n 1 + , x ∈ R.
nπΓ 2 n Phân phối student và giá trị tới hạn

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 74/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 75/88

8. Các định lý giới hạn

7.11 Phân phối Fisher-Snedecor 8.1 Luật số lớn


Định nghĩa: Cho X, Y độc lập và X ∼ χ2 m , Y ∼ χ2 n . Khi đó, phân phối của biến Bất đẳng thức Chebyshev: Cho X là biến ngẫu nhiên có kỳ vọng hữu hạn. Khi đó với
ngẫu nhiên Z = X/m mọi ε > 0 ta có:
Y /n = mY được gọi là phân phối Fisher-Snedecor với bậc tự do m và
nX
D(X)
P (|X − E(X)| > ε) ≤
n, kí hiệu X ∼ Fm,n . ε2
Tính chất: Từ đó, dễ thấy P (|X − E(X)| > 3σ(X)) ≤ 1/9.
2n2 (m+n−2)
i) E(X) = n−2n
, n > 2, D(X) = m(n−2) 2
(n−4)
, n>4 Định lý:(Luật yếu số lớn) Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân
ii) Hàm mật độ của Fm,n có dạng: phối xác suất với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì
 lim P (|X̄ − µ| > ε) = 0,
 Γ( 2 ) mm/2 nn/2 x 2 −1 ,
m+n m
n→+∞
x>0

m+n
f (x) = Γ( 2 )Γ( 2 )
m n
(mx+n) 2
trong đó X̄ = (X1 + ... + Xn )/n.
0,

x≤0
Ý nghĩa: Nếu X1 , ..., Xn là các biến ngẫu nhiên độc lập và cùng phân phối với X với
E(X) hữu hạn. Khi đó, với n khá lớn, ta có:
X1 + X2 + ... + Xn
X= ≈ E(X)
n
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 76/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 77/88
Ví dụ 31
Hệ quả: (Định lý Bernoulli) Nếu gọi X$là số lần xuất
 hiện biến cố A trong dãy n phép Tuổi thọ của một loại bóng đèn là một biến ngẫu nhiên X có E(X) = 250h và độ lệch
thử Bernoulli với p = P (A) thì lim P |fn − p| > ε = 0, ∀ε > 0 trong đó fn = X n. chuẩn σ(X) = 50h.
n→∞
a) Một cửa hàng mua 30 bóng đèn để khi hỏng có thể thay thế. Tính xấp xỉ xác suất
8.2 Định lý giới hạn trung tâm cửa hàng có thể duy trì ánh sáng liên tục ít nhất 8750h.
b) Chủ cửa hàng phải mua dự trữ ít nhất bao nhiêu bóng đèn để duy trì ánh sáng liên
Định lý: Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân phối xác suất tục ít nhất 8750h với xác suất lớn hơn 0,9772. Cho biết Φ(2) = 0, 9772.
với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì:

Sn − nµ
 Giải. a. Gọi Xi là tuổi thọ của bóng đèn thứ i, i ≥ 1. Ta có các biến ngẫu nhiên Xi độc
lim P √ < x = Φ(x), lập và có cùng phân phối với X. Do đó, áp dụng định lý giới hạn trung tâm:
n→∞ σ n
T = X1 + ... + X30
trong đó Sn = X1 + X2 + ... + Xn .
Ứng dụng: Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân phối xác suất có phân phối xấp xỉ phân phối chuẩn N (30 ∗ 250; 30 ∗ 502 ) = N (7500; 75000)
với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì với n lớn Xác suất cần tìm:
(n ≥ 30) Sn = X1 + ... + Xn có phân phối xấp xỉ phân phối chuẩn N (nµ, nσ 2 ).
 
8750 − 7500
P (T ≥ 8750) = 1 − P (T < 8750) ≈ 1 − Φ √ ≈0
75000
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 78/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 79/88

Ví dụ 32
b. Gọi n là số bóng đèn cần mua dự trữ. Tương tự, áp dụng định lý giới hạn trung tâm:
Tung ngẫu nhiên một con xúc xắc cân đối 200 lần độc lập. Tính xấp xỉ xác suất tổng
Tn = X1 + ... + Xn số chấm xuất hiện (ở mặt trên cùng) lớn hơn 720.

có phân phối xấp xỉ phân phối chuẩn N (250n; 502 n). Giải. Gọi Xi là số chấm xuất hiện ở lần tung thứ i, i = 1, 200. Đặt S = X1 + ... + X200 .
Từ giả thiết, ta có: Ta có: X1 , ..., X200 là các biến ngẫu nhiên độc lập cùng phân phối.
 
8750 − 250n
P (Tn ≥ 8750) = 1 − P (Tn < 8750) ≈ 1 − Φ √ ≥ 0, 9772 = Φ(2)
50 n Xi 1 2 3 4 5 6
1/6 1/6 1/6 1/6 1/6 1/6
 
8750 − 250n P
⇔Φ − √ ≥ 0, 9772 = Φ(2)
50 n
Khi đó: E(Xi ) = 7/2; D(Xi ) = E(Xi2 ) − (EXi )2 = 35/12.
Giải bất phương trình: Theo định lý giới hạn trung tâm, S sẽ có phân phối xấp xỉ phân phối chuẩn N (200 ∗
8750 − 250n
− √ ≥2 7/2; 200 ∗ 35/12) = N (700; 1750/3). Do đó, xác suất cần tìm:
50 n !
ta được: n ≥ 37, 44. 720 − 700
P (S > 720) = 1 − P (S ≤ 720) ≈ 1 − Φ p ≈ 0, 2
Vậy, n = 38. 1750/3

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 80/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 81/88
Hệ quả: (Định lý giới hạn tích phân Moivre-Laplace) Cho X ∼ B(n, p). Khi n khá lớn
Điều kiện xấp xỉ
ta có: ! !
k2 − np k1 − np Theo quy tắc 3σ:
P (k1 < X < k2 ) ≈ Φ p −Φ p .
np(1 − p) np(1 − p)
(µ − 3σ, µ + 3σ) ∈ (0, n)
Hay nói cách khác, khi n lớn X có phân phối xấp xỉ phân phối chuẩn N (µ, σ 2 ) với p p
µ = E(X) = np và σ 2 = D(X) = np(1 − p). ⇔ (np − np(1 − p), np + np(1 − p)) ∈ (0, n)
( p
np − np(1 − p) > 0

Định lý giới hạn địa phương Moivre-Laplace (đọc thêm)
p
np + np(1 − p) < n
Cho X ∼ B(n, p). Khi n lớn, ta có:
  
n > 9 1−p

p
! ⇔ 
p

1 k − np n > 9 1−p

P (X = k) ≈ p ϕ p ,
np(1 − p) np(1 − p)  
1−p p
⇔ n > 9 max ,
1 2 p 1−p
trong đó ϕ(x) = √ e−x /2 - hàm mật độ phân phối chuẩn tắc N(0,1).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 82/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 83/88

Các định lý giới hạn Moivre-Laplace

Ví dụ 33
Một xạ thủ bắn độc lập 200 viên đạn vào một mục tiêu. Xác suất bắn trúng mỗi viên
là 0,6. Tính xấp xỉ xác suất có ít nhất 100 viên trúng đích.

Giải. Gọi X là số viên đạn bắn trúng. Ta có: X ∼ B(n = 200; p = 0, 6). Áp dụng định lý
Moivre-Laplace, X có phân phối xấp xỉ chuẩn với µ = np = 120; σ 2 = np(1 − p) = 48.
Do đó:
   
200 − 120 100 − 120
P (100 ≤ X ≤ 200) ≈ Φ √ −Φ √ = 0, 998
48 48

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 84/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 85/88
Ví dụ 34
Một công ty bảo hiểm xe máy có 10 000 khách hàng. Mỗi chủ xe phải nộp 120.000 Nhận xét: Cho X ∼ N (n, p). Khi n khá lớn (và thỏa điều kiện nhất định) thì theo
đồng/1 năm và trung bình nhận lại là 1.000.000 đồng nếu xe của họ bị tai nạn giao đinh lý giới hạn tích phân Moivre-Laplace, X có phân phối xấp xỉ phân phối liên tục
thông. Qua thống kê biết tỉ lệ để 1 xe máy bị tai nạn giao thông trong một năm là là phân phối chuẩn N (np, np(1 − p)). Vì thế, khi tính xấp xỉ xác suất người ta thường
0,006. Tìm xác suất để sau một năm hoạt động công ty bị thất bại. hiệu chỉnh:
!
Giải. Gọi X là số xe bị tai nạn và Y (ngàn đồng) là số tiền lãi của công ty trong 1 năm. P (X ≤ k) = P (X < k + 0.5) ≈ Φ p
k + 0.5 − np
Ta có: X ∼ B(n = 10000; p = 0, 006) và Y = 12 ∗ 105 − 1000X. np(1 − p)
Áp dụng định lý Moivre-Laplace, X có phân phối xấp xỉ chuẩn với tham số
!
k − 0.5 − np
P (X < k) = P (X ≤ k − 1) = P (X < k − 0.5) ≈ Φ p
µ = np = 60; σ 2 = np(1 − p) = 59, 64 np(1 − p)
P (k1 < X < k2 ) = P (X < k2 ) − P (X ≤ k1 )
Xác suất để sau một năm hoạt động công ty bị thất bại: P (k1 ≤ X < k2 ) = P (X < k2 ) − P (X < k1 )
...............
 
1200 − 60
P (Y < 0) = P (12 ∗ 105 − 1000X < 0) = P (X > 1200) ≈ 1 − Φ √ ≈0
59, 64

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 86/88 Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 87/88

Ví dụ 35
Cho X ∼ B(n = 300, p = 0.2). Khi đó, n khá lớn và thỏa điều kiện
 
1−p p
n > 9 max ,

XÁC SUẤT THỐNG KÊ


p 1−p

Tính xấp xỉ xác suất P (X ≤ 70).

Chính xác Không hiệu chỉnh Có hiệu chỉnh


0.9330245945 0.9255426634 0.9351827095 Tôn Thất Tú

Tính xấp xỉ xác suất P (60 ≤ X ≤ 150).

Chính xác Không hiệu chỉnh Có hiệu chỉnh Đà Nẵng, 2021


0.2553341683 0.2352432110 0.2580014678

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 88/88 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 1/27
2.1 Phân phối đồng thời rời rạc
Chương 3. Vectơ ngẫu nhiên
1. Định nghĩa a. Bảng phân phối đồng thời: Giả sử X nhận các giá trị trong tập {xi , i ∈ I} và Y
nhận các giá trị trong tập {yj , j ∈ J}.
Giả sử X1 , ..., Xn là n biến ngẫu nhiên liên quan đến thí nghiệm đang xét. Lúc đó ta Đặt pij = P (X = xi , Y = yj ), i ∈ I, j ∈ J. Lúc đó ta có bảng phân phối đồng thời:
gọi bộ gồm n biến ngẫu nhiên (X1 , ..., Xn ) là vectơ ngẫu nhiên n chiều.
Y
Ở đây, ta hạn chế xét trường hợp n = 2. y1 y2 ... yj ...
X
2. Hàm phân phối đồng thời x1 p11 p12 ... p1j ...
Định nghĩa: Giả sử (X, Y ) là vectơ ngẫu nhiên 2 chiều. Khi đó hàm hai biến F (x, y) x2 p21 p22 ... p2j ...
xác định như sau: ... ... ... ... ... ...
FX,Y (x, y) = P (X < x, Y < y) xi pi1 pi2 ... pij ...
được gọi là hàm phân phối đồng thời của vectơ ngẫu nhiên (X, Y ). ... ... ... ... ... ...
Tính chất:
i) 0 ≤ FX,Y (x, y) ≤ 1, ∀x, y ∈ R ii) FX,Y (x, y) không giảm theo từng biến Nhận xét: Ta cũng có: pi,j = 1 và với A ⊂ R2
P
i,j
iii) FX,Y (x, y) liên tục trái X
P ((X, Y ) ∈ A) = P (X = xi , Y = yj )
iv) lim FX,Y (x, y) = 1, lim FX,Y (x, y) = 0, lim FX,Y (x, y) = 0
x→+∞ x→−∞ y→−∞ (xi ,yj )∈A
y→+∞
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 2/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 3/27

Ví dụ 1
Một hộp có 2 bi trắng và 3 bi đen. Lấy ngẫu nhiên 1 viên không hoàn lại, rồi tiếp tục
lấy ngẫu nhiên 2 viên không hoàn lại. Gọi X và Y là số bi đen lấy được ở lần 1 và lần 2. C22
P (X = 1, Y = 2) = P (X = 1)P (Y = 2|X = 1) = 3/5 ∗ = 1/10
a. Lập bảng phân phối đồng thời của X và Y . C42
b. Tính xác suất P (X + Y < 2). Bảng phân phối đồng thời:

Giải. a. Ta có X nhận các giá trị: 0, 1 và Y nhận các giá trị: 0, 1, 2.


Y
P (X = 0, Y = 0) = P (X = 0)P (Y = 0|X = 0) = 2/5 ∗ 0 = 0 0 1 2
X
C 1C 1
P (X = 0, Y = 1) = P (X = 0)P (Y = 1|X = 0) = 2/5 ∗ 3 2 1 = 1/5 0 0 1/5 1/5
C4
1 1/10 2/5 1/10
C2
P (X = 0, Y = 2) = P (X = 0)P (Y = 2|X = 0) = 2/5 ∗ 32 = 1/5
C4
C2 b. Xác suất:
P (X = 1, Y = 0) = P (X = 1)P (Y = 0|X = 1) = 3/5 ∗ 22 = 1/10 P (X + Y < 2) = P (X = Y = 0) + P (X = 0, Y = 1) + P (X = 1, Y = 0)
C4
= 0 + 1/5 + 1/10 = 3/10
C 1C 1
P (X = 1, Y = 1) = P (X = 1)P (Y = 1|X = 1) = 3/5 ∗ 2 2 2 = 2/5
C4
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 4/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 5/27
Ví dụ 2
Cho hai biến ngẫu nhiên X, Y độc lập có bảng phân phối:
b. Phân phối biên: Ta đưa vào kí hiệu
X 1 2 Y 1 2 3
0,4 0,6 0,3 0,3 0,4
X X
P P pi. = P (X = xi ) = P (X = xi , Y = yj ) = pij
j j
Lập bảng phân phối đồng thời của (X, Y ).
Từ đó ta được bảng phân phối của X và được gọi là phân phối biên X:
Giải. Vì X, Y độc lập nên:
P (X = 1, Y = 1) = 0, 4 ∗ 0, 3 = 0, 12; P (X = 1, Y = 2) = 0, 4 ∗ 0, 3 = 0, 12 X x1 x2 ... xi ...
P (X = 1, Y = 3) = 0, 4 ∗ 0, 4 = 0, 16; P (X = 2, Y = 1) = 0, 6 ∗ 0, 3 = 0, 18
P p1. p2. ... pi. ...
P (X = 2, Y = 2) = 0, 6 ∗ 0, 3 = 0, 18; P (X = 2, Y = 3) = 0, 6 ∗ 0, 4 = 0, 24
Bảng phân phối đồng thời: Nhận xét: Trong thực hành, để tìm phân phối biên ta có thể xuất phát từ bảng phân
Y phối đồng thời tính tổng các xác suất theo hàng hoặc theo cột như bảng minh họa sau
1 2 3 đây:
X
1 0,12 0,12 0,16
2 0,18 0,18 0,24
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 6/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 7/27

c. Phân phối có điều kiện: Kí hiệu


Y
y1 y2 ... yj ... P (X = xi ) P (X = xi , Y = yj ) pij
X P (xi |yj ) = P (X = xi |Y = yj ) = =
P (Y = yj ) p.j
x1 p11 p12 ... pi1 ... p1.
x2 p21 p22 ... p2j ... p2. được gọi là xác suất có điều kiện để X nhận giá trị xi khi biết Y = yj .
... ... ... ... ... ... ... Ứng với mỗi yj cố định ta có bảng phân phối xác suất có điều kiện của X với điều kiện
xi pi1 pi2 ... pij ... pi. Y = yj :
... ... ... ... ... ... ... X|Y = yj x1 x2 ... ...
P (Y = yj ) p.1 p.2 ... p.j ... P P (x1 |yj ) P (x2 |yj ) ... ...
Phân phối biên của Y được tìm hoàn toàn tương tự. Tương tự ứng với mỗi xi cố định ta có bảng phân phối xác suất có điều kiện của Y với
điều kiện X = xi .

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 8/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 9/27
Ví dụ 3
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau: Phân phối biên của X:

X
1 2 3 X 1 2 3
Y
P 0,18 0,36 0,46
5 0.1 0.2 0.3
6 0.08 0.16 0.16
Phân phối biên của Y :
Tìm phân phối biên của X, Y và tính P (Y = 6|X = 1).
Y 5 6
Giải. Ta có:
P 0,6 0,4
X
1 2 3 P (Y = yj )
Y Xác suất:
5 0.1 0.2 0.3 0,6 P (Y = 6|X = 1) =
P (X = 1, Y = 6)
=
0, 08
=
4
6 0.08 0.16 0.16 0,4 P (X = 1) 0, 18 9
P (X = xi ) 0.18 0.36 0.46

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 10/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 11/27

2.2 Phân phối đồng thời liên tục


b. Phân phối biên: Hàm mật độ biên của X và Y được xác định như sau:
a. Định nghĩa: Vectơ ngẫu nhiên (X, Y ) được gọi là có phân phối đồng thời liên tục
nếu hàm phân phối đồng thời của (X, Y ) có thể biểu diễn ở dạng +∞
Z
Zx Zy fX (x) = fX,Y (x, y)dy
FX,Y (x, y) = fX,Y (u, v)dudv −∞
−∞ −∞
+∞
Z
Hàm fX,Y (u, v) được gọi là hàm mật độ đồng thời của X, Y . fY (y) = fX,Y (x, y)dx
Tính chất: −∞
+∞
+∞ Z
∂ 2 FX,Y (u, v) c. Phân phối có điều kiện: Hàm
Z
i)fX,Y (u, v) ≥ 0, ii)fX,Y (u, v) = , iii) fX,Y (u, v)dudv = 1
∂u∂v
−∞ −∞ fX,Y (x, y)
fX|Y (x|y) =
fY (y)
Nhận xét: Nếu A ⊂ R2 thì
là hàm mật độ điều kiện của X với điều kiện Y = y.
ZZ
P ((X, Y ) ∈ A) = f (x, y)dxdy.
A

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 12/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 13/27
Ví dụ 4
Do đó:
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
(
2x, x ∈ [0, 1]
fX (x) =
0, x∈/ [0, 1]
(
C(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) =
0, (x, y) ∈
/ [0, 1] × [0, 1] Mật độ có điều kiện:

Tìm C, fX (x), fY |X (y|x) và tính xác suất P (0 < X < Y < 1/2). fX,Y (x,y) 4/3(x + xy) 2
fY |X (y|x) = = = (y + 1), (x, y) ∈ [0, 1] × [0, 1]
fX (x) 2x 3
Giải. Theo tính chất của hàm mật độ:
Xác suất:
Z +∞ Z +∞ Z 1Z 1
C 1 3C
Z
fX,Y (x, y)dxdy = C(x + xy)dxdy = (y + 1)dy = =1 1/2 Z y 1/2 Z y
4
Z Z
−∞ −∞ 0 0 2 0 4 P (0 < X < Y < 1/2) = f (x, y)dxdy = (x + xy)dxdy
0 0 0 0 3
Suy ra: C = 4/3. Mật độ biên của X: 1/2
2
Z
Z +∞ 1 = (1 + y)y 2 dy = 11/288.
4
Z
0 3
fX (x) = fX,Y (x, y)dy = (x + xy)dy = 2x, x ∈ [0, 1].
−∞ 0 3

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 14/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 15/27

Ví dụ 5
2.3 Kỳ vọng của hàm hai biến ngẫu nhiên
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
- Nếu (X, Y ) có phân phối đồng thời rời rạc với pi,j = P (X = xi , Y = yj ), i ∈ I, j ∈ J
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định: X
1 2
X X Y
Eh(X, Y ) = h(xi , yj )P (X = xi , Y = yj ) = h(xi , yj )pi,j . 1 0.1 0.2
i∈I,j∈J i∈I,j∈J
2 0.3 0.4
- Nếu (X, Y ) có phân phối đồng thời liên tục với hàm mật độ xác suất đồng thời f (x, y)
Tính E(2X − 3Y )
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định:
Z +∞ Z +∞ Giải: Ta có:
Eh(X, Y ) = h(x, y)f (x, y)dxdy.
X
E(2X − 3Y ) = (2xi − 3yj )pi,j = ....
−∞ −∞
i,j

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 16/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 17/27
Ví dụ 6
2.4 Sự độc lập của các biến ngẫu nhiên
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi:
(
4
(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) = 3 FX,Y (x, y) = FX (x).FY (y)
0, (x, y) ∈
/ [0, 1] × [0, 1]
- Nếu X và Y có phân phối đồng thời rời rạc thì điều kiện trên trở thành:
Tính E(X 2 + Y 2 ).
P (X = xi , Y = yj ) = P (X = xi ).P (Y = yj ), ∀i, j
Giải. Ta có:
- Nếu X và Y có phân phối đồng thời liên tục thì điều kiện trên trở thành:
+∞ Z +∞ 1Z 1
4
Z Z
E(X 2 +Y 2 ) = (x2 +y 2 )f (x, y)dxdy = (x2 +y 2 ) (x+xy)dxdy = ... fX,Y (x, y) = fX (x).fY (y)
−∞ −∞ 0 0 3

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 18/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 19/27

4. Hiệp phương sai và hệ số tương quan


3. Kỳ vọng có điều kiện a. Hiệp phương sai:
- Hiệp phương sai của hai biến ngẫu nhiên X và Y , kí hiệu Cov(X, Y ) được xác định
Kỳ vọng có điều kiện của biến ngẫu nhiên Y với điều kiện X = x, kí hiệu E(Y |X = x) theo biểu thức:
được xác định: 
Cov(X, Y ) = E (X − EX)(Y − EY )

- Nếu X và Y có phân phối đồng thời rời rạc thì:
X - Hai biến ngẫu nhiên X và Y được gọi là tương quan với nhau nếu Cov(X, Y ) 6= 0 và
E(Y |X = x) = yj P (Y = yj |X = x) không tương quan nếu Cov(X, Y ) = 0.
j Tính chất:
i) Cov(X, Y ) = Cov(Y, X)
- Nếu X và Y có phân phối đồng thời liên tục thì: ii) Cov(aX + b, cY + d) = acCov(X, Y ), a, b, c, d = const
+∞ iii) Cov(X, Y ) = E(XY ) − E(X).E(Y )
iv) D(X ± Y ) = D(X) + D(Y ) ± 2Cov(X, Y )
Z
E(Y |X = x) = yfY |X (y|x)dy
Nhận xét:
−∞
i) Cov(X, X) = D(X)
ii) Nếu X, Y độc lập thì Cov(X, Y ) = 0. Do đó, từ "tính chất độc lập" suy ra "tính
chất không tương quan", tuy nhiên điều ngược lại nói chung không đúng.
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 20/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 21/27
iii) Trong thực hành, ta tính Cov(X, Y ) = E(XY ) − E(X).E(Y ), trong đó:
P Ý nghĩa hệ số tương quan: Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa
 xi yj pij ,
 X, Y có phân phối đồng thời rời rạc X và Y . Khi |ρ(X, Y )| càng gần 1 thì quan hệ tuyến tính giữa X và Y càng mạnh.
E(XY ) = +∞ R +∞ X Khi ρ(X, Y ) > 0: X, Y tương quan dương (thuận), tức là X, Y có xu hướng cùng
xyfXY (x, y)dxdy, X, Y có phân phối đồng thời liên tục
R
tăng hoặc cùng giảm.


−∞ −∞
X Khi ρ(X, Y ) < 0: X, Y tương quan âm (nghịch), tức là X, Y có xu hướng tăng và
giảm ngược chiều nhau.
b. Hệ số tương quan Để đánh giá mức độ tương quan, ta có thể tham khảo bảng sau (Hopkins, 2000):
Hệ số tương quan của hai biến ngẫu nhiên X và Y , kí hiệu ρ(X, Y ) được xác định bởi
biểu thức: Cov(X, Y ) |ρ(X, Y )| Mức độ tương quan
ρ(X, Y ) = p <0.1 Rất nhỏ
D(X)D(Y )
0.1-0.3 Nhỏ
Tính chất:
i) ρ(X, Y ) = ρ(Y, X) ii) |ρ(X, Y )| ≤ 1 0.3-0.5 Trung bình
iii) Nếu Y = aX + b hoặc X = aY + b, a, b ∈ R, a 6= 0 (phụ thuộc tuyến tính) thì 0.5-0.7 Lớn
( 0.7-0.9 Rất lớn
1, a>0
ρ(X, Y ) = >0.9 Gần như hoàn hảo
−1, a < 0
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 22/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 23/27

Ví dụ 7
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
−1.0

X
2.5

1 2 3
−2.0

Y
ρ = − 0.98
1 0.1 0.1 0.2
1.5

ρ = 0.96
−3.0

2 0.2 0.1 0.3


0.6 0.8 1.0 1.2 1.4 0.6 0.8 1.0 1.2 1.4
Tính E(Y |X = 1), Cov(X, Y ), ρ(X, Y ).
Giải. Phân phối biên:
0.2

1.0

X 1 2 3 Y 1 2
0.0

0.0

ρ = 0.19
P 0,3 0,2 0,5 P 0,4 0,6
−1.0

ρ = − 0.13 Xác suất có điều kiện:


−0.2

P (X = 1, Y = 1) 0, 1 1
0.6 0.8 1.0 1.2 1.4 −2 0 2 4 6 P (Y = 1|X = 1) = = =
P (X = 1) 0, 3 3
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 24/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 25/27
Ví dụ 8
P (X = 1, Y = 2) 0, 2 2
P (Y = 2|X = 1) = = = Cho vectơ ngẫu nhiên (X, Y ) có hàm
( mật độ đồng thời:
P (X = 1) 0, 3 3
x + y, (x, y) ∈ [0, 1]2
Phân phối có điều kiện: f (x, y) =
0, / [0, 1]2
(x, y) ∈
Y |X = 1 1 2
P 1/3 2/3 Tính P (0 < X < 1/2 < Y < 1), Cov(X, Y ), D(X + 2Y ).

Do đó: E(Y |X = 1) = Giải. Xác suất:


P
yi P (Y = yi |X = 1) = 5/3. Z 1/2 Z 1
Hiệp phương sai: Cov(X, Y ) = E(XY P ) − E(X)E(Y ), trong đó:
P (0 < X < 1/2 < Y < 1) = f (x, y)dydx = ...
P P 0 1/2
E(X) = pi xi = 2, 2; E(Y ) = pi yi = 1, 6; E(XY ) = pij xi yj = 3, 5
⇒ Cov(X, Y ) = 3, 5 − 2, 2 ∗ 1, 6 = −0, 02 Phân phối biên: Z +∞ Z 1
Phương sai: fX (x) = f (x, y)dy = (x + y)dy = x + 1/2, x ∈ [0, 1]
D(X) = E(X 2 ) − (EX)2 =P pi x2i − 2, 22 = 0, 76 −∞ 0
P
+∞ 1
D(Y ) = E(Y 2 ) − (EY )2 = pi yi2 − 1, 62 = 0, 24
Z Z
fY (y) = f (x, y)dx = (x + y)dx = y + 1/2, y ∈ [0, 1]
−∞ 0
Cov(X, Y ) −0, 02 +∞ 1
=√
Z Z
⇒ ρ(X, Y ) = p = −0, 0468
D(X)D(Y ) 0, 76 ∗ 0, 24 E(X) = xfX (x)dx = x(x + 1/2)dx = 7/12; E(Y ) = 7/12
−∞ 0
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 26/27 Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 27/27

Z +∞ Z +∞ Z 1Z 1
E(XY ) = xyf (x, y)dxdy = xy(x + y)dxdy = 1/3
−∞ −∞ 0 0

Suy ra: Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 1/3 − (7/12)2 = −1/144.


Mặt khác, XÁC SUẤT THỐNG KÊ
D(X + 2Y ) = D(X) + D(2Y ) + 2Cov(X, 2Y ) = D(X) + 4D(Y ) + 4Cov(X, Y )
Tôn Thất Tú
Z +∞ Z 1
E(X 2 ) = x2 fX (x)dx = x2 (x + 1/2)dx = 5/12; E(Y 2 ) = 5/12
−∞ 0
D(X) = E(X 2 ) − (EX)2 = 5/12 − (7/12)2 = 11/144; D(Y ) = 11/144
Đà Nẵng, 2021
Vậy, D(X + 2Y ) = 11/144 + 4 ∗ 11/144 − 4 ∗ 1/144 = 17/48

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 28/27 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 1/32
Chương 4: Thống kê mô tả
Giới thiệu
«Statistics is the discipline that concerns the collection, organization, analysis, 1. Tổng thể và mẫu
interpretation, and presentation of data.» a. Các khái niệm:
https://en.wikipedia.org/wiki/Statistics - Tổng thể : tập hợp toàn bộ các phần tử thống nhất theo dấu hiệu nghiên cứu. Tổng
thể có thể hữu hạn hoặc vô hạn.
- Thống kê: khoa học về điều tra và thu thập dữ liệu, tổ chức và sắp xếp dữ liệu, phân - Mẫu: một tập con bất kì của tổng thể. Số lượng phần tử của nó được gọi là kích
tích, diễn giải và trình bày dữ liệu. thước hay cỡ mẫu.
- Mục đích: Rút ra các thông tin hữu ích về quy luật phân phối của tổng thể đang - Phép lấy mẫu: việc chọn một tập con bất kì của tổng thể.
nghiên cứu từ dữ liệu thu được. - Mẫu ngẫu nhiên: một mẫu là ngẫu nhiên nếu việc chọn các cá thể được tiến hành
- Thống kê được chia thành: độc lập và có xác suất chọn như nhau.
+ Thống kê mô tả: mô tả dữ liệu thông qua các công cụ: bảng biểu, chỉ số và các biểu
đồ thống kê.
+ Thống kê suy diễn: sử dụng dữ liệu thu được để đưa ra các nhận xét, suy đoán và
kết luận về tổng thể nghiên cứu (dựa trên cơ sở của lý thuyết xác suất).

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 2/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 3/32

Về mặt toán học, mẫu ngẫu nhiên được mô tả như sau:


2. Bảng tần số, tần suất
X Xét dấu hiệu nghiên cứu được đặc trưng bởi biến X. Gọi Xi là số đo về dấu hiệu
X của đối tượng thứ i trong mẫu. Khi đó, các biến ngẫu nhiên Xi độc lập và có phân a. Mẫu không ghép lớp
phối như biến X. - Bảng tần số:
X Một mẫu ngẫu nhiên kích thước n từ tổng thể có phân phối theo biến ngẫu nhiên
Giá trị x1 x2 ... xm
X có thể xem như một bộ n biến ngẫu nhiên {X1 , X2 , ..., Xn } độc lập và có cùng phân
phối với X. Tần số n1 n2 ... nm
- Cho mẫu ngẫu nhiên {X1 , X2 , ..., Xn }. Khi đó:
+ Bộ n giá trị {x1 , x2 , ..., xn } cụ thể quan thu được được gọi là mẫu thực nghiệm. trong đó x1 , ..., xm là các giá trị khác nhau với số lần xuất hiện là n1 , ..., nm .
+ Một hàm (đo được) T = T(X1 , X2 , ..., Xn ) được gọi là một thống kê trên mẫu - Bảng tần suất:
ngẫu nhiên {X1 , X2 , ..., Xn }.
Giá trị x1 x2 ... xm
Tần suất f1 f2 ... fm
b. Phép lấy mẫu đơn giản:
- Lấy có hoàn lại: Chọn ngẫu nhiên một cá thể từ tổng thể, ghi lại các dấu hiệu cần m
trong đó fi = ni /n, n = ni . Giá trị fi được gọi là tần suất xuất hiện của xi trong
P
quan tâm và hoàn trả lại vào tổng thể trước khi chọn tiếp lần sau.
i=1
- Lấy không hoàn lại: tương tự trên, nhưng phần tử được lấy ra không trả lại vào mẫu.
tổng thể trước khi chọn tiếp.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 4/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 5/32
Ví dụ 1
Nếu ta quan tâm thêm tình trạng học học sinh có đeo kính hay không, ta có thể thiết
Khảo sát số học sinh ở các khối lớp của một trường THCS ta được bảng số liệu: lập bảng tần số như sau:
Lớp 6 7 8 9
Số học sinh 230 217 220 235

Nếu quan tâm thêm giới tính, ta được bảng 2 chiều:

Lớp
6 7 8 9
Giới tính
Nam 110 117 105 115
Nữ 120 100 115 120

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 6/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 7/32

b. Mẫu ghép lớp


Khi ta thu được mẫu dữ liệu với nhiều giá trị khác nhau thì người ta tiến hành chia Ví dụ 2
miền giá trị thành nhiều khoảng [ai−1 , ai ) không giao nhau.
- Bảng tần số: Cân thử 100 trái táo vừa thu hoạch, ta được bảng số liệu sau:

Khoảng giá trị [a0 , a1 ) [a1 , a2 ) ... [am−1 , am ) Khối lượng (g) [100;120) [120;140) [140;160) [160;180) [180;200)
Tần số n1 n2 ... nm Số trái 12 19 31 23 15

- Bảng tần suất: Ví dụ 3

Khoảng giá trị [a0 , a1 ) [a1 , a2 ) ... [am−1 , am ) Khảo sát ngẫu nhiên một nhóm người từ độ tuổi 15 trở lên thường đọc tin tức thời sự
online ở một thành phố, số liệu được thể hiện ở bảng sau:
Tần suất f1 f2 ... fm
Độ tuổi [15,20) [20,30) [30,40) [40,50) ≥ 50
Nhận xét: Thông thường các khoảng chia có độ dài bằng nhau. Tuy nhiên, tùy thuộc
Số người 20 25 20 30 15
vào mục đích nghiên cứu mà ta có thể có những cách chia khoảng khác nhau. Số khoảng

chia thường từ 5-20 khoảng, hoặc [ n], hoặc [log2 n] ([x] - số nguyên lớn nhất không
vượt quá x).
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 8/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 9/32
3. Các số đặc trưng mẫu

a. Trung bình và phương sai mẫu


Nhận xét:
Cho {x1 , x2 , ..., xn } là mẫu số liệu của biến ngẫu nhiên X. i) Khi mẫu được cho ở dạng bảng tần số:
- Trung bình mẫu, kí hiệu là x, được tính theo công thức:
n X x1 x2 ... xm
x1 + x2 + ... + xn 1X
x= = xi ni n1 n2 ... nm
n n
i=1
- Kích thước mẫu: n = n1 + n2 + ... + nm .
- Phương sai mẫu, kí hiệu là s2 , được tính theo công thức: m
1 P
- Trung bình mẫu: x = ni x i .
  n i=1
n n 1 P n
1 X 1 X
- Phương sai mẫu: s2 = ni (xi − x)2 .
s2 = (xi − x)2 =  x2i − n(x)2  n√
− 1 i=1
n−1 n−1
i=1 i=1
- Độ lệch chuẩn mẫu: s = s2
- Độ lệch chuẩn mẫu, kí hiệu s, được tính:

s= s2
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 10/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 11/32

iii) Hướng dẫn sử dụng máy tính Casio:


ii) Khi mẫu ở dạng bảng ghép lớp: X Tính x và s bằng máy tính CASIO FX570VN PLUS.
- Mode → 3 → 1
X a0 − a1 a 1 − a2 ... am−1 − am - Bật/tắt tần số: Shift → SETUP → REPLAY (↓) → 4(Stat)
ni n1 n2 ... nm - Nhập số liệu, kết thúc nhập: bấm AC
- Lấy x: Shift → 1 → 4 → 2 → =
trong đó ak−1 − ak = [ak−1 ; ak ). - Lấy s: Shift → 1 → 4 → 4 → =
ak−1 + ak
Đặt xk = ta được mẫu dạng thu gọn:
2 X Tính x và s bằng máy tính CASIO FX580VN.
- Setup → 6-Statistics → = → 1
X x1 x2 ... xm - Bật/tắt tần số: Shift → SETUP → REPLAY (↓) → 3(Statistics)
ni n1 n2 ... nm - Nhập số liệu, kết thúc nhập: bấm AC
- Lấy x: OPTN → REPLAY (↓) → 2 → 1 → =
- Lấy s: OPTN → REPLAY (↓) → 2 → 5 → =

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 12/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 13/32
Ví dụ 4
b. Trung vị mẫu
Chiều cao (mét) của 10 sinh viên đại học: 1.75, 1.69, 1.70, 1.82, 1.68, 1.72, 1.70, 1.67,
Sắp xếp mẫu số liệu theo thứ tự tăng dần, giả sử x1 ≤ x2 ≤ ... ≤ xn . Trung vị mẫu, kí
1.71, 1.68. Tính trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu.
hiệu xmed , xác định bởi:
Đáp số. x̄ = 1, 712; s2 = 0.00197; s = 0.0444

Ví dụ 5 x n+1 ,
 nếu n lẻ,
xmed = x n2 + x n +1
Doanh thu X (triệu đồng) trong 100 ngày được chọn ngẫu nhiên của 1 cửa hàng:  2
 2
nếu n chẵn.
2
X 19,0 - 19,4 19,4 - 19,8 19,8 - 20,2 20,2 - 20,6 20,6 - 21,0
ni 15 25 30 20 10
c. Hệ số tương quan mẫu
Tìm trung bình mẫu và độ lệch chuẩn mẫu.
Cho {(x1 , y1 ); (x2 , y2 ); ...; (xn , yn )} là mẫu hai chiều của vectơ ngẫu nhiên (X, Y ). Hệ
Giải. Dạng thu gọn: số tương quan mẫu được xác định bởi:
X 19,2 19,6 20 20,4 20,8 Pn
(xi − x)(yi − y)
ni 15 25 30 20 10 r = pPn i=1 Pn
2 2
i=1 i − x)
(x i=1 (yi − y)
Các số đặc trưng mẫu: x̄ = 19, 94; s = 0, 48
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 14/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 15/32

Ví dụ 6
3. Biểu đồ Khảo sát số lần đi chợ (X) trong một tuần của một nhóm người được chọn ngẫu nhiên
trong chợ, ta được bảng số liệu sau:
a. Biểu đồ cho dữ liệu rời rạc:
- Biểu đồ cột: đồ thị gồm các cột hình chữ nhật có chiều cao bằng tần số (tần suất) X 1 2 3 4 5
tương ứng.
Tần số 12 30 20 11 7
- Đa giác tần số : đường gấp khúc nối các điểm (x1 , n1 ), ..., (xk , nk ) trên mặt phẳng.
- Đa giác tần suất: đường gấp khúc nối các điểm (x1 , f1 ), ..., (xk , fk ) trên mặt phẳng. Tần suất 0.15 0.4 0.3 0.14 0.1
- Biểu đồ hình tròn: hình tròn được chia ra các phần có góc ở tâm tỉ lệ với tần số (tần
Hãy vẽ các biểu đồ:
suất) tương ứng.
- biểu đồ cột (tần số, tần suất)
- đa giác tần số, tần suất
- biểu đồ hình tròn

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 16/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 17/32
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 18/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 19/32

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 20/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 21/32
b. Biểu đồ cho dữ liệu liên tục:
- Tổ chức đồ (histogram): Miền giá trị được chia làm m khoảng với độ dài các khoảng
lần lượt là hi (thường ta chọn hi = h). Khi đó tổ chức đồ của mẫu dữ liệu này gồm m
hình chữ nhật:
+ Đáy hình thứ i trùng với khoảng thứ i trên trục hoành, có độ dài hi .
+ Chiều cao của hình thứ i bằng di , trong đó:
⊲ di = ni : tổ chức đồ tần số
ni
⊲ di = : tổ chức đồ tần suất
n
ni
⊲ di = : tổ chức đồ mật độ
n.hi
với ni là số lượng các giá trị nằm trong khoảng thứ i và n = n1 + n2 + ... + nm .

Ví dụ 7
Dữ liệu được khảo sát từ biến ngẫu nhiên liên tục. Miền dữ liệu được chia thành 10
khoảng đều nhau. Các tổ chức đồ được xây dựng như ở hình sau đây.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 22/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 23/32

- Biểu đồ xác suất chuẩn: Giả sử mẫu số liệu của biến ngẫu nhiên liên tục X đã sắp thứ
tự tăng dần:
x1 ≤ x2 ≤ x3 ≤ ... ≤ xn .
Với i = 1, 2, ..., n, đặt  
−1 i − 0.5
zi = Φ hay Φ(zi ) = (i − 0, 5)/n.
n

Biểu đồ xác suất chuẩn là tập hợp các điểm có tọa độ (zi ; xi ), i = 1, 2, ..., n trên hệ
trục tọa độ Descartes vuông góc Ozx.
Nếu (zi ; xi ), i = 1, 2, ..., n nằm xấp xỉ trên 1 đường thẳng thì có thể xem biến ngẫu
nhiên X có phân phối chuẩn. Đường thẳng này có phương trình: x = σ̂z + µ̂ , với
µ̂ = x̄, σ̂ = s - trung bình và độ lệch chuẩn mẫu được tính dựa trên mẫu đã cho.
Nhận xét: Ở các phần mềm thống kê, người ta còn sử dụng các cách thức khác để xây
dựng đường thẳng ở trên.
Ví dụ 8
Quan sát biểu đồ xác suất chuẩn sau đây.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 24/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 25/32
BIỂU ĐỒ XÁC SUẤT CHUẨN
4. Phân phối mẫu
6.5 a. Trường hợp tổng thể tuân theo phân phối chuẩn
Định lý 1: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
phối chuẩn N (µ; σ 2 ) thì
6.0

 σ2  √
(X − µ) n
hay
5.5

X ∼ N µ, ∼ N (0, 1).
n σ

Định lý 2: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
5.0

phối chuẩn N (µ; σ 2 ) thì:


4.5


(n − 1)S 2 2 (X − µ) n
∼ χn−1 , ∼ Tn−1
σ2 S
4.0

•1.5 •1.0 •0.5 0.0 0.5 1.0 1.5

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 26/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 27/32

Định lý 3: Nếu {X1 , X2 , ..., Xn } và {Y1 , Y2 , ..., Ym } là hai mẫu ngẫu nhiên của hai biến
ngẫu nhiên độc lập X và Y có phân phối chuẩn N (µ1 ; σ12 ) và N (µ2 ; σ22 ) tương ứng thì:
! " - Nếu X là số lượng cá thể mang dấu hiệu A có tỉ lệ là p = P (A) trong mẫu ngẫu nhiên
σ12 σ22 kích thước n, thì
X − Y ∼ N µ1 − µ2 , +
n m X ∼ B(n, p)

2 /σ 2
Theo định lý Moivre-Laplace, nếu n lớn thì X có phân phối xấp xỉ N (np, np(1 − p)).
SX 1 Do đó, tỉ lệ mẫu
∼ Fn−1,m−1 .
SY2 /σ22 X
p̂ =
n
b. Trường hợp tổng thể không tuân theo luật phân phối chuẩn  
- Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có E(X) = p(1 − p)
có phân phối xấp xỉ phân phối chuẩn N p,
µ, D(X) = σ 2 hữu hạn thì khi n lớn (n > 30) theo định lý giới hạn trung tâm: n

σ2  n(X − µ)
X có phân phối xấp xỉ N µ, và có phân phối xấp xỉ N (0, 1)
n S

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 28/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 29/32
Ví dụ 9 Ví dụ 10
Chiều cao của thanh niên tuân theo luật phân phối chuẩn với µ = 165(cm)
N (µ; σ 2 ), Để nghiên cứu về thâm niên công tác (tính tròn năm) của nhân viên ở một công ty lớn,
và σ = 5(cm). Tính xác suất chiều cao trung bình của 16 thanh niên được chọn ngẫu người ta khảo sát thâm niên của 100 nhân viên được chọn ngẫu nhiên trong công ty.
nhiên lớn hơn 167 (cm). Kết quả như sau:

Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 16. Thâm niên 5-7 8-10 11-13 14-16 17-19
Đặt X̄ = (X1 + ... + X16 )/16. Khi đó, X̄ cũng có phân phối chuẩn với trung bình Số nhân viên 8 21 36 25 10
µ = 165 và phương sai σ 2 /n = 25/16.
Xác suất cần tìm: a. Hãy tính giá trị trung bình mẫu và giá trị độ lệch chuẩn mẫu.
  b. Giả sử thâm niên công tác của nhân viên ở công ty trên là biến ngẫu nhiên X có kỳ
167 − 165
P (X̄ > 167) = 1 − P (X̄ ≤ 167) = 1 − Φ = 0.0548 vọng là 12 năm và độ lệch chuẩn là 3 năm. Tính xác suất để trung bình mẫu nhận giá
5/4 trị lớn hơn 12,5 năm.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 30/32 Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 31/32

Giải. Dạng thu gọn:

Thâm niên 6 9 12 15 18
Số nhân viên 8 21 36 25 10
XÁC SUẤT THỐNG KÊ
a. Các số đặc trưng mẫu: x̄ = 12, 24; s = 3, 27.
b. Theo định lý giới hạn trung tâm X̄ có phân phối xấp xỉ chuẩn N (12; 32 /100) =
N (12; 0, 09). Do đó: Tôn Thất Tú
 
12, 5 − 12
P (X̄ > 12, 5) = 1 − Φ √ = 0.0478
0, 09 Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 32/32 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 1/45
Chương 5. Ước lượng tham số 1.2 Phân loại ước lượng
- Ước lượng θ̂ = θ̂(X1 , ..., Xn ) được gọi là ước lượng không chệch của tham số θ nếu
E(θ̂) = θ.
1. Ước lượng điểm Trong trường hợp ngược lại thì ta gọi θ̂ được gọi là ước lượng chệch và giá trị b(θ) =
E(θ̂) − θ được gọi là độ chệch của ước lượng.
1.1 Định nghĩa - Ước lượng θ̂ = θ̂(X1 , ..., Xn ) được gọi là ước lượng không chệch tiệm cận của tham
số θ nếu
- Cho mẫu ngẫu nhiên {X1 , X2 , ..., Xn } từ tổng thể có phân phối phụ thuộc vào
lim E(θ̂) = θ.
tham số θ chưa biết. Khi đó, một hàm (thống kê) θ̂ = θ̂(X1 , ..., Xn ) được gọi là một n→+∞
ước lượng của tham số θ.
- Cho θ̂1 và θ̂2 là hai ước lượng không chệch của tham số θ.
- Với một mẫu giá trị cụ thể {x1 , x2 , ..., xn } ta thu được một giá trị cụ thể của θ̂.
Khi đó, giá trị θ̂(x1 , ..., xn ) được gọi là ước lượng điểm của tham số θ dựa trên mẫu giá D(θ̂1 ) = E(θ̂1 − E θ̂1 )2 = E(θ̂1 − θ)2 và D(θ̂2 ) = E(θ̂2 − E θ̂2 )2 = E(θ̂2 − θ)2
trị {x1 , x2 , ..., xn }.
Ta nói ước lượng θ̂1 hiệu quả hơn ước lượng θ̂2 nếu D(θ̂1 ) < D(θ̂2 ).
- Ước lượng θ̂ của θ là ước lượng không chệch và có phương sai D(θ̂) bé nhất được
gọi là ước lượng tốt nhất.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 2/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 3/45

Ước lượng không chệch của trung bình và phương sai


Định lý: Cho biến ngẫu nhiên X của một tổng thể có E(X) = µ, D(X) = σ 2 . Giả sử Ước lượng không chệch của tỉ lệ
{X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X. Khi đó:
1 Pn Định lý: Cho biến ngẫu nhiên X có phân phối Bernoulli với tham số p. Gọi
i) X = Xi là ước lượng không chệch của µ. (X1 , X2 , ..., Xn ) là mẫu ngẫu nhiên của X. Khi đó:
n i=1
1 P n
ii) S 2 = (Xi − X)2 là ước lượng không chệch của σ 2 . X1 + X2 + ... + Xn
n − 1 i=1 P̂ =
n
Nhận xét: Có thể chứng minh được rằng:
n
là một ước lượng không chệch của tham số p.
n−1 2 1X
E(S∗2 ) =
n
σ với S∗2 =
n
(Xi − X̄)2 Ý nghĩa: Nếu dấu hiệu A có tỉ lệ p chưa biết, và trong mẫu điều tra kích thước n có k
i=1 cá thể mang dấu hiệu A, thì tần suất fn = k/n là một ước lượng không chệch của p.
Điều này có nghĩa S∗2 là ước lượng chệch (không chệch tiệm cận) của σ 2 , do đó nó
«không được chọn» làm phương sai mẫu.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 4/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 5/45
Ví dụ 1
- Cho biến ngẫu nhiên X có kỳ vọng µ và phương sai σ 2 chưa biết. Để ước lượng
cho µ và σ 2 người ta tiến hành điều tra mẫu kích thước 200 và tính được trung bình và - Nếu {x1 , x2 , ..., xn } là mẫu ngẫu nhiên kích thước n của phân phối liên tục có hàm
phương sai chuẩn mẫu: mật độ xác suất f (x, θ) với θ là tham số chưa biết thì hàm hợp lí L(θ) là hàm được
x̄ = 125, 8; s2 = 2, 76
định nghĩa như sau:
n
Khi đó, ta có thể xem µ ≈ 125, 8 và σ 2 ≈ 2, 76. Y
L(θ) = f (xi , θ).
- Để ước lượng tỉ lệ p cử tri ủng hộ cho ứng cử viên A, người ta khảo sát ngẫu nhiên
i=1
4000 người thì có 2640 người ủng hộ ứng cử viên này. Như vậy, ta có thể xem tỉ lệ ủng
hộ ứng cử viên A xấp xỉ: Nhận xét: Hàm hợp lí L(θ) chính là hàm xác suất (mật độ xác suất) đồng thời của
p ≈ 2640/4000 = 0, 66 mẫu ngẫu nhiên.
1.3 Phương pháp hợp lý cực đại
Định nghĩa: Định nghĩa: Cho hàm hợp lí L(θ) với tham số θ chưa biết. Nếu θM L là giá trị tham số
- Cho {k1 , k2 , ..., kn } là mẫu ngẫu nhiên kích thước n của phân phối rời rạc X có hàm thỏa mãn L(θM L ) ≥ L(θ) với mọi θ thì θM L được gọi là ước lượng hợp lí cực đại của
xác suất p(k, θ) với θ là tham số chưa biết. Hàm hợp lí L(θ) là hàm được định nghĩa tham số θ.
như sau: Yn
L(θ) = p(ki , θ).
i=1
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 6/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 7/45

Ví dụ 2
Tìm ước lượng tham số của phân phối Poisson bằng phương pháp hợp lí cực đại.
Nhận xét:
i) Trong thực hành để tìm ước lượng hợp lý cực đại ta giải phương trình: Giải. Phân phối Poisson với tham số λ có hàm xác suất:
λx −λ
L′ (θ) = 0 hoặc [ln(L(θ))]′ = 0 f (x) = e , x = 0, 1, ...
x!
ii) Trường hợp θ là một vectơ các tham số, tức là θ = (θ1 , ..., θm ), để tìm ước lượng Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý L(λ)
hợp lý cực đại ta giải hệ phương trình sau đây: được xác định: n Pn
Y λ i=1 xi −nλ
  L(λ) = f (xi ) = Qn e .
 ∂L(θ)  ∂ ln L(θ) i=1 i=1 xi !
= 0, = 0,

 

 ∂θ1  ∂θ1 Suy ra:
 
n n
 
hoặc
X Y
··· ··· ln L(λ) = xi ln(λ) − ln( xi !) − nλ.
∂L(θ) ∂ ln L(θ)
 
i=1 i=1
 
 ∂θ = 0, = 0.

 

 
 ∂θ n n
m m Do đó: d ln L(λ) 1 X 1X
= xi − n = 0 ⇔ λ = xi .
dλ λ n
i=1 i=1
Vậy, ước lượng hợp lý cực đại λM L của λ là: λM L = n1 ni=1 xi .
P

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 8/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 9/45
Ví dụ 3 Do đó: ∂ ln L(µ, σ 2 )
Pn
(xi − µ)
= i=1 2 ,
Tìm ước lượng tham số của phân phối chuẩn N (µ; σ 2 ) bằng phương pháp ước lượng ∂µ σ
hợp lí cực đại. ∂ ln L(µ, σ 2 )
Pn 2
n i=1 (xi − µ)
= − + .
∂σ 2 2σ 2 2σ 4
Giải. Phân phối chuẩn N (µ, σ 2 ) có hàm mật độ xác suất:
Giải hệ:

 ∂ ln L(µ, σ 2 )
=0
! "
(x − µ)2

1 
∂µ
f (x) = √ exp − . 2
σ 2π 2σ 2 ∂ ln L(µ, σ )
= 0,



∂σ 2
n n
Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý theo µ, σ 2 ta được: 1X 1X
µ= xi = x̄ và σ 2 = (xi − x̄)2 .
L(µ, σ 2 ) được xác định: n n
i=1 i=1
n
! P "
n
2
Y 1 i=1 (xi − µ)2
L(µ, σ ) = f (xi ) = √ exp − . 2 ) của (µ, σ 2 ) là:
Vậy ước lượng hợp lý cực đại (µM L , σM L
σ n ( 2π)n 2σ 2 n
i=1 1X
µM L = x̄ và σM2
L = (xi − x̄)2 .
Suy ra: n
Pn
n n i=1 (xi − µ)2 i=1
ln L(µ, σ ) = − ln(σ 2 ) − ln(2π) −
2
.
2 2 2σ 2
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 10/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 11/45

Phương pháp chung xây dựng khoảng tin cậy với độ tin cây cậy 1 − α:
2. Khoảng tin cậy i) chọn hai số α1 , α2 ∈ (0, 1) sao cho α1 + α2 = α.
ii) xây dựng thống kê:
2.1 Định nghĩa Gn = Gn (X1 , ..., Xn , θ)
Cho biến ngẫu nhiên X có phân phối phụ thuộc vào tham số θ chưa biết và
sao cho phân phối của Gn hoàn toàn xác định (hoặc phân phối giới hạn của Gn khi
{X1 , X2 , ..., Xn } là một mẫu ngẫu nhiên từ phân phối này. Trên cơ sở mẫu ngẫu nhiên
n → ∞ xác định) và không phụ thuộc vào tham số θ. Ngoài ra, Gn là một hàm đơn
này ta xây dựng hai hàm L = L(X1 , ..., Xn ) và U = U (X1 , ..., Xn ) sao cho với một số
điệu theo θ.
α ∈ (0, 1) cho trước ta có:
iii) Chọn hai số a và b sao cho P (Gn ≤ a) = α1 và P (Gn < b) = 1 − α2 .
P (L < θ < U ) = 1 − α. (*) iv) Giải bất phương trình a < Gn (X1 , ..., Xn , θ) < b theo θ ta được khoảng tin cậy cần
tìm.
Khi đó, khoảng (L, U ) được gọi là khoảng tin cậy của tham số θ với độ tin cậy 1 − α.
Giá trị α được gọi là mức ý nghĩa. Hiệu số U − L được gọi là độ dài khoảng tin cậy. Nhận xét:
Ý nghĩa: Nếu ta thực hiện việc lấy mẫu nhiều lần và mỗi lần ta đều tính khoảng tin i) Trong một số trường hợp, các giá trị L, U trong định nghĩa có thể được chọn sao cho:
cậy (L, U ) dựa trên mẫu thu được, thì tỉ lệ khoảng tin cậy chứa giá trị chính xác θ xấp
P (L < θ < U ) ≥ 1 − α.
xỉ 1 − α.
ii) Nếu α1 = 0 hoặc α2 = 0 ta được các khoảng tin cậy 1 phía.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 12/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 13/45
2.2 Khoảng tin cậy cho kì vọng khi đã biết phương sai
Bài toán. Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ chưa biết và σ 2 đã biết. Tìm khoảng tin cậy cho µ với mức ý nghĩa α.
Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì

(X − µ) n
Z= ∼ N (0; 1).
σ
- Với α ∈ (0; 1), chọn α1 = α2 = α/2 và chọn zα/2 sao cho P (Z > zα/2 ) = α/2. Giá
trị zα/2 được gọi là giá trị tới hạn mức α/2 của phân phối chuẩn tắc. Sau đó, ta giải
bất phương trình:
σ σ
−zα/2 < Z < zα/2 ⇔ X − zα/2 √ < µ < X + zα/2 √
n n

ta được khoảng tin cậy đối xứng.


- Nếu chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay zα/2 bởi zα và thu được khoảng tin
cậy một phía.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 14/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 15/45

a. Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
σ σ
x − zα/2 √ < µ < x + zα/2 √ ,
n n

- Khoảng tin cậy tối đa của µ:


σ
µ < x + zα √ .
n

- Khoảng tin cậy tối thiểu của µ:


σ
µ > x − zα √ .
n

Nhận xét: Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả
trên vẫn áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu
nhiên X.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 16/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 17/45
Ví dụ 4
b. Vấn đề cỡ mẫu
Khối lượng (kg) của một thiết bị có phân phối chuẩn N (µ; σ 2 ) với σ = 0.2 (kg). Chọn
Từ công thức khoảng tin cậy cho µ ta thấy rằng sai số của ước lượng |x − µ| bé hơn
ngẫu nhiên 25 thiết bị người ta tính được trung bình mẫu x = 65, 1 (kg). Với độ tin cậy σ
hoặc bằng zα/2 √ .
95% hãy tìm khoảng tin cậy (đối xứng) cho khối lượng trung bình của thiết bị này. Cho n
biết z0,025 = 1, 96. - Sai số ước lượng:
σ
ε = zα/2 √
Giải. n
- Các số đặc trưng mẫu: n = 25; x̄ = 65, 1. - Điều kiện hạn chế: ε < ∆ với ∆ > 0 cho trước.
- Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96.
σ
- Sai số ước lượng: ε = zα/2 √ < ∆
σ 0, 2 n
ε = zα/2 √ = 1, 96 ∗ √ = 0, 0784
n 25
- Giải bất phương trình theo n:
- Khoảng tin cậy cho khối lượng trung bình µ của thiết bị này: 2
zα/2 σ

x̄ − ε < µ < x̄ + ε ⇔ 65, 02 < µ < 65, 18 n> .

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 18/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 19/45

Ví dụ 5
2.3 Khoảng tin cậy cho kì vọng khi chưa biết phương sai
Trở lại với Ví dụ 4 nếu yêu cầu sai số ước lượng không vượt quá 0,05 thì với độ tin cậy
98% ta cần chọn tối thiểu bao nhiêu thiết bị để khảo sát? Cho biết z0,01 = 2, 326. Bài toán: Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ và σ 2 chưa biết. Tìm khoảng tin cậy cho µ với độ tin cậy 1 − α.
Giải. Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì
- Sai số ước lượng: √
σ (X − µ) n
ε = zα/2 √ T = ∼ Tn−1
n S
- Điều kiện hạn chế: ε < ∆ = 0, 05. - Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị tn−1;α/2 là giá trị tới hạn của
- Suy ra: phân phối Tn−1 , tức là P (T > tn−1;α/2 ) = α/2. Sau đó, giải phương trình:
zα/2 σ 2
 
n> .
∆ S S
−tn−1;α/2 < T < tn−1;α/2 ⇔ X − tn−1;α/2 √ < µ < X + tn−1;α/2 √
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326. n n
Do đó:
2, 326 ∗ 0, 2 2
 
n> = 86, 56 - Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay tn−1;α/2 bởi tn−1;α và thu được khoảng
0, 05 tin cậy một phía.
Vậy, kích thước mẫu tối thiểu cần khảo sát: n = 87
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 20/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 21/45
Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
s s
x − tn−1;α/2 √ < µ < x + tn−1;α/2 √ ,
n n

- Khoảng tin cậy tối đa của µ:


s
µ < x + tn−1;α √ .
n

- Khoảng tin cậy tối thiểu của µ:


s
x − tn−1;α √ < µ.
n

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 22/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 23/45

Nhận xét:
i) Khi n > 30: tn−1;α/2 ≈ zα/2 . Giải. Theo giả thiết:
n = 16; x̄ = 24308; s = 727
ii) Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả trên vẫn
áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu nhiên X. Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 = t15;0,025 = 2, 1314
Lúc đó, ta thay tn−1;γ bởi zγ với γ = α hoặc γ = α/2. Sai số:
s 727
ε = tn−1;α/2 √ = 2, 1314 ∗ √ = 387, 382
Ví dụ 6 n 16

Một mẫu 16 pin dùng cho smartphone được chọn ngẫu nhiên của công ty A có tuổi thọ Khoảng tin cậy cho tuổi thọ trung bình của pin smartphone:
trung bình tính trên mẫu x = 24308 (giờ) và độ lệch chuẩn mẫu s = 727 (giờ). Giả sử
x̄ − ε < µ < x̄ + ε ⇔ 23920.618 < µ < 24695.382
rằng tuổi thọ pin smartphone có phân phối chuẩn. Với độ tin cậy 95%, hãy tìm khoảng
tin cậy cho tuổi thọ trung bình của pin smartphone được sản xuất bởi công ty A. Cho
biết t15;0,025 = 2, 1314.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 24/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 25/45
Ví dụ 7
Năng suất (tạ/ha) của một loại cây trồng tuân theo luật phân phối chuẩn. Hãy tìm ước
lượng khoảng đối xứng năng suất trung bình của một loại cây trồng này với độ tin cậy Các số đặc trưng mẫu:
95% trên cơ sở bảng số liệu điều tra sau đây: n = 36; x̄ = 56, 028; s = 5, 321
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 ≈ zα/2 = z0,025 = 1, 96
Năng suất(tạ/ha) 42-47 47-52 52-57 57-62 62-67
Sai số:
Số điểm thu hoạch 2 5 14 10 5 s 5, 321
ε = tn−1;α/2 √ = 1, 96 ∗ √ = 1, 738
n 36
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
Khoảng tin cậy cho năng suất trung bình:
Giải. Dạng thu gọn: x̄ − ε < µ < x̄ + ε ⇔ 54, 29 < µ < 57, 766

Năng suất(tạ/ha) 44,5 49,5 54,5 59,5 64,5


Số điểm thu hoạch 2 5 14 10 5

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 26/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 27/45

2.4 Khoảng tin cậy cho phương sai


Bài toán: Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ và σ 2 chưa biết. Tìm khoảng tin cậy cho σ 2 với độ tin cậy 1 − α.
Kết quả: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì biến ngẫu nhiên:

(n − 1)S 2
χ2 = ∼ χ2n−1 .
σ2

- Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị χ2n−1;α/2 , χ2n−1;1−α/2 là giá trị
tới hạn mức α/2 và 1 − α/2 của phân phối χ2n−1 , ta được khoảng tin cậy hai phía.
- Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay χ2n−1;α/2 bởi χ2n−1;α , χ2n−1;1−α/2 bởi
χ2n−1;1−α và thu được khoảng tin cậy một phía.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 28/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 29/45
Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy hai phía cho σ 2 :
Ví dụ 8
(n − 1)s2 (n − 1)s2
< σ 2
< , Một dây chuyền tự động đóng gạo vào bao được kiểm tra. Cân thử 25 bao gạo do dây
χ2n−1;α/2 χ2n−1;1−α/2 chuyền này thực hiện thì tính được độ lệch chuẩn khối lượng gạo mỗi bao s = 0, 15
(kg). Với độ tin cậy 95% tìm khoảng tin cậy cho phương sai của khối lượng gạo được
- Khoảng tin cậy tối đa cho phương sai σ 2 : đóng cho mỗi bao bởi dây chuyền này. Giả thiết khối lượng gạo được đóng cho mỗi bao
tuân theo luật phân phối chuẩn. Cho biết: χ224;0.025 = 39, 364, χ224;0.975 = 12, 401.
(n − 1)s2
0 < σ2 < .
χ2n−1;1−α
Đáp số: 0, 0137 < σ 2 < 0, 0435.
- Khoảng tin cậy tối thiểu cho phương sai σ 2 :

(n − 1)s2
< σ 2 < +∞.
χ2n−1;α

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 30/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 31/45

2.5 Khoảng tin cậy cho tỷ lệ


Bài toán: Xét dấu hiệu A trong tổng thể có tỉ lệ là p (chưa biết). Hãy tìm khoảng tin
cậy cho p với độ tin cậy 1 − α.
Kết quả:
- Tiến hành điều tra một mẫu kích thước n. Giả sử trong mẫu này có k phần tử mang
dấu hiệu A.
- Gọi X là số phần tử mang dấu hiệu A trong mẫu kích thước n, ta có X ∼ B(n, p).
Theo định lý giới hạn tích phân Moivre-Laplace, biến ngẫu nhiên:
X − np
Z=p có phân phối xấp xỉ chuẩn tắc N (0, 1).
np(1 − p)

- Với α ∈ (0; 1) cho trước, chọn α1 = α2 = α/2 ta được khoảng:


r r
p(1 − p) p(1 − p)
p̂ − zα/2 < p < p̂ + zα/2
n n

với p̂ = X/n = k/n - tỉ lệ mẫu của dấu hiệu A.


Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 32/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 33/45
Mặt khác, do p̂ là một ước lượng của p nên ta có thể xem p ≈ p̂ khi n lớn.
Điều kiện: np̂ > 5 và n(1 − p̂) > 5. Ví dụ 9
a. Kết quả Gieo 400 hạt đậu xanh thì có 50 hạt không nảy mầm. Với độ tin cậy 98%, hãy tìm:
a) Khoảng tin cậy đối xứng cho tỉ lệ hạt nảy mầm.
Với độ tin cậy 1 − α:
b) Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm.
- Khoảng tin cậy đối xứng cho p:
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
r r
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2
n
< p < p̂ + zα/2
n
. Giải.
k 400 − 50
a. - Tỉ lệ mẫu: p̂ = = = 0, 875.
- Khoảng tin cây tối đa cho p: n 400
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326
r r
p̂(1 − p̂) 0, 875 ∗ (1 − 0, 875)
r
p̂(1 − p̂) - Sai số: ε = zα/2 = 2, 326 ∗ = 0, 0385
p < p̂ + zα . n 400
n
- Khoảng tin cậy cho tỉ lệ hạt nảy mầm p:
- Khoảng tin cậy tối thiểu cho p:
r p̂ − ε < p < p̂ + ε ⇔ 0, 8365 < p < 0, 9135
p̂(1 − p̂)
p > p̂ − zα .
n
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 34/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 35/45

b. Nhận xét
b. - Tỉ lệ mẫu: i) Khoảng tin cậy cho số lượng cá thể
k 50
p̂ = = = 0, 125 Từ khoảng tin cậy cho tỉ lệ ta có thể suy ra khoảng tin cậy cho số lượng cá thể mang
n 400
dấu hiệu nghiên cứu hoặc số lượng cá thể của tổng thể. Cụ thể:
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα = z0,02 = 2, 054 - Gọi K và N lần lượt là số lượng cá thể mang dấu hiệu nghiên cứu và số lượng cá thể
- Sai số: của tổng thể. Khi đó, tỉ lệ dấu hiệu nghiên cứu:
r r
p̂(1 − p̂) 0, 125 ∗ (1 − 0, 125) K
ε = zα = 2, 054 ∗ = 0, 034 p= (1)
n 400 N
- Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm p: - Dựa trên mẫu điều tra, ta ước lượng được khoảng tin cậy cho tỉ lệ p:

p > p̂ − ε ⇔ p > 0, 091 p1 < p < p 2 (2)

Từ (1) và (2) suy ra khoảng tin cậy cho giá trị K hoặc N.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 36/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 37/45
Ví dụ 10 Ví dụ 11
Trong một cuộc bầu cử ở một địa phương có 10000 cử tri. Người ta phỏng vấn ngẫu Để ước lượng số lượng cá có trong hồ, người ta làm như sau. Bắt ngẫu nhiên 500 con
nhiên 300 cử tri thì thấy có 156 người ủng hộ cho ứng cử viên A. Với độ tin cậy 95% cá, sau đó đánh dấu vào các con cá đã được bắt và thả chúng xuống hồ. Sau đó bắt
tìm khoảng tin cậy (đối xứng) cho số lượng cử tri ở địa phương này ủng hộ cho ứng cử ngẫu nhiên 200 con cá để kiểm tra thì thấy có 30 con có đánh dấu. Với độ tin cậy 90%
viên A. tìm khoảng tin cậy đối xứng cho số lượng cá có trong hồ.

Giải. Gọi K là số lượng cử tri ở địa phương này ủng hộ ứng cử viên A. Ta có tỉ lệ ủng Giải. Gọi N là số lượng cá trong hồ. Ta có tỉ lệ cá được đánh dấu: p = 500/N .
hộ ứng cử viên A: p = K/10000. Tỉ lệ mẫu: p̂ = k/n = 30/200 = 0, 15
Tỉ lệ mẫu: p̂ = k/n = 156/300 = 0, 52 Độ tin cậy: 1 − α = 0, 9 ⇒ α = 0, 1; zα/2 = z0,05 = 1, 645
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96 Sai số: r r
Sai số: p̂(1 − p̂) 0, 15 ∗ 0, 85
ε = zα/2 = 1, 645 ∗ = 0, 0415
r r
p̂(1 − p̂) 0, 52 ∗ 0, 48 n 200
ε = zα/2 = 1, 96 ∗ = 0, 0565
n 300
Khoảng tin cậy cho tỉ lệ cá được đánh dấu:
Khoảng tin cậy cho tỉ lệ ủng hộ:
p̂ − ε < p < p̂ + ε ⇔ 0, 1085 < p < 0, 1915
p̂ − ε < p < p̂ + ε ⇔ 0, 4635 < p < 0, 5765
Từ đó, suy ra: Từ đó, suy ra:
0, 4635 < K/10000 < 0, 5765 ⇔ 4635 < K < 5765 0, 1085 < 500/N < 0, 1915 ⇔ 2610, 9 < N < 4608, 3
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 38/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 39/45

Ví dụ 12
ii) Vấn đề về cỡ mẫu
- Sai số ước lượng: Một cuộc khảo sát sức khỏe cộng đồng đang được lên kế hoạch trong một khu vực đô
thị lớn với mục đích ước tính tỷ lệ trẻ em từ 0 đến 14 tuổi chưa được tiêm chủng bại
r
p̂(1 − p̂)
ε = zα/2 liệt đầy đủ. Các nhà tổ chức của dự án muốn tỷ lệ mẫu của trẻ không được tiêm chủng
n
đầy đủ k/n phải nằm trong khoảng của tỷ lệ thực p với sai số ±0, 05 với xác suất tối
- Điều kiện hạn chế: ε ≤ ∆, ∆ > 0 cho trước. thiểu 98%. Hỏi kích thước mẫu điều tra tối thiểu là bao nhiêu?
- Giả sử giá trị p̂ không biến động lớn khi tính tính trên các mẫu khác nhau, khi đó: Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.
2
zα/2

n≥ p̂(1 − p̂). Giải. Sai số ước lượng:
∆ r
p̂(1 − p̂)
ε = zα/2
- Trong trường hợp không có dữ liệu để tính giá trị p̂, sử dụng bất đẳng thức p̂(1 − p̂) ≤ n
1/4 ta thu được bất đẳng thức: Điều kiện: ε ≤ ∆ = 0, 05. Suy ra:
2 2
zα/2 zα/2
 
1
n≥ . n≥ p̂(1 − p̂).
4 ∆ ∆

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 40/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 41/45
Ví dụ 13
Vì p̂ chưa biết nên áp dụng bất đẳng thức p̂(1 − p̂) ≤ 1/4 ta thu được: Sản lượng gạo bán ra trong 1 ngày có phân phối chuẩn. Điều tra sản lượng bán ra trong
2 120 ngày, ta được bảng số liệu sau:
zα/2

1
n≥ .
4 ∆ Sản lượng (kg) 400-440 440-480 480-520 520-560 560-600 600-640 640-680
Số ngày 4 9 15 23 30 22 17
Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326. Do đó:
 2 a) Với độ tin cậy 95% tìm khoảng tin cậy đối xứng cho số tiền bán ra trung bình trong
1 2, 326 một ngày. Biết giá mỗi kg gạo là 15.000 đồng.
n≥ = 541, 0276
4 0, 05 b) Ngày có sản lượng gạo bán ra không nhỏ hơn 560 kg được gọi là ngày cao điểm. Với
độ tin cậy 98%, tìm khoảng tin cậy đối xứng cho số ngày cao điểm trong 1000 ngày
Vậy, n = 542. bán.
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 42/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 43/45

Giải.
a. Dạng thu gọn: b. Gọi K là số ngày cao điểm trong 1000 ngày. Ta có tỉ lệ ngày cao điểm: p = K/1000.
Tỉ lệ mẫu ngày cao điểm:
Sản lượng (kg) 420 460 500 540 580 620 660
k 30 + 22 + 17
Số ngày 4 9 15 23 30 22 17 p̂ = = = 0, 575
n 120
Các số đặc trưng mẫu: n = 120; x̄ = 566, 67; s = 64 Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326.
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 = t119;0,025 ≈ z0,025 = 1, 96. Sai số: r r
Sai số: p̂(1 − p̂) 0, 575 ∗ (1 − 0, 575)
s 64 ε = zα/2 = 2, 326 ∗ = 0, 105
ε = tn−1;α/2 √ = 1, 96 ∗ √ = 11, 45 n 120
n 120
Khoảng tin cậy cho tỉ lệ ngày cao điểm p:
Khoảng tin cậy cho khối lượng gạo trung bình bán được trong 1 ngày:
x̄ − ε < µ < x̄ + ε ⇔ 555, 22 < µ < 578, 12 p̂ − ε < p < p̂ + ε ⇔ 0, 47 < p < 0, 68

Khoảng tin cậy cho số tiền T (ngàn đồng) trung bình bán được trong 1 ngày: Suy ra:
555, 22 ∗ 15 < T < 578, 12 ∗ 15 ⇔ 8328, 3 < T < 8671, 8 0, 47 < K/1000 < 0, 68 ⇔ 470 < K < 680

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 44/45 Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 45/45
Chương 6: Kiểm định giả thuyết thống kê
1. Các khái niệm

1.1 Giả thuyết thống kê

XÁC SUẤT THỐNG KÊ


- Giả thuyết thống kê là các khẳng định về phân phối của tổng thể nghiên cứu. Các
khẳng định này có thể là: về giá trị chưa biết của tham số đối với phân phối đã biết, về
dạng phân phối chưa biết, về mối quan hệ giữa các biến ngẫu nhiên,...

Ví dụ 1
Tôn Thất Tú
X Tuổi thọ người Việt tuân theo luật phân phối chuẩn N (µ, σ 2 ), với µ, σ chưa biết.
Giả thuyết thống kê có thể là: µ = 60 (tuổi) hoặc µ > 60, hoặc µ 6= 60, ...
X Nghiên cứu về chiều cao (X) của người Việt. Giả thuyết thống kê có thể là: X có
Đà Nẵng, 2021 phân phối chuẩn, X có phân phối mũ, ...
X Nghiên cứu tên của bố (X), tên của mẹ (Y ) và tên của người con thứ nhất (Z).
Giả thuyết thống kê: Z có mối quan hệ với X và Y , Z không có mối quan hệ với X và
Y , ...
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 1/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 2/47

1.2 Nguyên lý xác suất nhỏ và xác suất lớn


Khi nghiên cứu ta có thể đưa ra nhiều giả thuyết khác nhau. Trong chương này, chúng - Nguyên lí xác suất nhỏ: Một biến cố có xác suất rất nhỏ (gần bằng 0) thì có thể xem
ta chỉ khảo sát bài toán kiểm định với hai giả thuyết mà thôi. biến cố đó không xảy ra khi thực hiện phép thử một lần.
- Bài toán kiểm định giả thuyết là bài toán gồm một cặp giả thuyết thống kê mâu thuẫn - Nguyên lí xác suất lớn: Một biến cố có xác suất rất lớn (gần bằng 1) thì có thể xem
nhau được đưa ra xem xét để chọn một giả thuyết đúng. Một trong hai giả thuyết đó biến cố đó sẽ xảy ra khi thực hiện phép thử.
được giả định ban đầu là giả thuyết đúng, gọi là giả thuyết gốc và được kí hiệu là H0 .
Giả thuyết còn lại gọi là đối thuyết, được kí hiệu là H1 . 1.3 Thống kê kiểm định
Gọi {X1 , X2 , ..., Xn } là một mẫu ngẫu nhiên tùy ý. Ta xây dựng một thống kê T =
(
H0 : giả thuyết gốc
T (X1 , X2 , ..., Xn ) và sẽ sử dụng nó để đưa ra quyết định bác bỏ hay chấp nhận giả
H1 : đối thuyết
thuyết H0 . Lúc này, T được gọi là thống kê kiểm định (hay tiêu chuẩn kiểm định).
- Lưu ý: Với mỗi giả thuyết gốc H0 ta có thể xây dựng nhiều đối thuyết H1 khác nhau. Với α ∈ (0, 1) cho trước, ta có thể xây dựng miền Wα sao cho:
- Kiểm định giả thuyết là phương pháp sử dụng mẫu dữ liệu thu được để đưa ra quyết
định bác bỏ H0 hay chấp nhận H0 . P (T ∈ Wα |H0 đúng) = α

Lúc đó, miền Wα được gọi là miền bác bỏ với mức ý nghĩa α.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 3/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 4/47
1.4 Sai lầm khi kiểm định
- Sai lầm loại I: Sai lầm mắc phải khi bác bỏ H0 nhưng trong khi thực tế là H0 là giả
1.3 Các bước tiến hành thuyết đúng. Xác suất mắc sai lầm loại 1 được kí hiệu: α.
- Sai lầm loại II: Sai lầm mắc phải khi chấp nhận H0 trong khi thực tế là H0 là giả
Khi cho trước mức ý nghĩa α ta có thể sử dụng các bước gợi ý sau đây để tiến hành
thuyết sai. Xác suất mắc sai lầm loại 2 được kí hiệu: β.
giải bài toán kiểm định:
Bảng dưới đây tổng hợp lại các trường hợp:
- Xác định giả thuyết H0 , H1 và phát biểu bài toán.
- Chọn thống kê kiểm định T và tính giá trị của nó trên mẫu dữ liệu thu được (kí Thực tế
hiệu là Ts ). H0 đúng H0 sai
Quyết định
- Xác định miền bác bỏ Wα với mức ý nghĩa α cho trước.
- Kết luận: Nếu Ts ∈ Wα thì bác bỏ giả thuyết H0 . Ngược lại, ta chưa có cơ sở bác Bác bỏ H0 sai lầm loại I quyết định đúng
bỏ H0 nên tạm thời chấp nhận giả thuyết này. Chấp nhận H0 quyết định đúng sai lầm loại II

Như vậy,

α = P (bác bỏ H0 | H0 đúng), β = P (chấp nhận H0 | H0 sai)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 5/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 6/47

1.5 Phương pháp P-giá trị


Trong các phần mềm thống kê, người ta thường sử dụng phương pháp p-giá trị để ra
quyết định. Lưu ý rằng, ta có bài toán kiểm định: Diễn giải: P-giá trị là xác suất (mức độ hợp lý) thu được dữ liệu quan sát và được tính
dựa trên một thống kê kiểm định khi ta giả sử H0 là giả thuyết đúng. Do đó, nếu p-giá
trị càng nhỏ thì ta càng có cơ sở bác bỏ H0 .
(
H0 : giả thuyết gốc
Các bước thực hiện:
H1 : đối thuyết
- Xác định giả thuyết H0 , H1 và phát biểu bài toán.
- Chọn thống kê kiểm định T và tính giá trị của nó trên mẫu dữ liệu thu được (kí
P-giá trị được mô tả như sau: hiệu là Ts ).
X The p-value is the probability of obtaining test results at least as extreme as - Tính p-giá trị theo thống kê kiểm định
the results actually observed, under the assumption that the null hypothesis is correct. - So sánh p-giá trị với mức ý nghĩa α cho trước:
(https://en.wikipedia.org/wiki/P-value) i) Nếu p-giá trị ≤ α thì bác bỏ H0 .
X The P-value approach involves determining "likely" or "unlikely" by deter- ii) Nếu p-giá trị > α thì chấp nhận H0 .
mining the probability — assuming the null hypothesis were true — of observ- Khi giá trị α chưa biết thì người ta hay lấy α = 0, 05.
ing a more extreme test statistic in the direction of the alternative hypothesis
than the one observed. (https://online.stat.psu.edu/statprogram/reviews/
statistical-concepts/hypothesis-testing/p-value-approach)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 7/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 8/47
2. Kiểm định giả thuyết về kì vọng của phân phối chuẩn

2.1 Khi phương sai đã biết


Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với kì vọng µ
chưa biết và phương sai σ 2 đã biết.
• Xét bài toán kiểm định giả thuyết:
(
H0 : µ = µ 0 ,
(I)
H1 : µ 6= µ0 ,

trong đó µ0 là một số thực đã cho.


- Giả sử rằng H0 đúng, thì

(X − µ0 ) n
Z= ∼ N (0, 1)
σ

Ta sẽ bác bỏ H0 nếu X quá khác biệt so với µ0 hay nói cách khác, |Z| > c > 0 với c
là một hằng số nào đó.
- Miền bác bỏ với mức ý nghĩa α: Wα = (−∞; −zα/2 ] ∪ [zα/2 ; +∞).
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 9/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 10/47

• Đối với bài toán kiểm định giả thuyết:


(
H 0 : µ = µ0 Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 đã biết.
(II)
H 1 : µ > µ0 . Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: z =
Ta sẽ bác bỏ H0 nếu Z > c > 0 với c là một hằng số nào đó. σ
Miền bác bỏ H0 là Wα = [zα ; +∞)
Đối thuyết Miền bác bỏ H0 p-giá trị
• Đối với bài toán kiểm định giả thuyết:
( H1 : µ 6= µ0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
H0 : µ = µ 0 H 1 : µ > µ0 [zα ; +∞) 1 − Φ(z)
(III)
H1 : µ < µ0 . H 1 : µ < µ0 (−∞; −zα ] Φ(z)

Ta sẽ bác bỏ H0 nếu Z < c < 0 với c là một hằng số nào đó.


Miền bác bỏ H0 là Wα = (−∞; −zα ]

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 11/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 12/47
Ví dụ 2
Nguồn cấp điện cho máy tính đạt tiêu chuẩn là 19 volt. Đo nguồn cấp điện của một mẫu
25 sạc pin được chọn ngẫu nhiên của hãng sản xuất A người ta tính được x = 19, 25
volt. Giả sử nguồn cấp điện này có phân phối chuẩn với độ lệch chuẩn σ = 0, 5 volt. Với
mức ý nghĩa α = 0, 05 hãy kiểm định giả thuyết gốc H0 : µ = 19 (volt) với đối thuyết
H1 : µ > 19 (volt), trong đó µ là nguồn cấp điện trung bình của loại sạc pin trên.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Giải. Bài toán kiểm định:
(
H0 : µ = 19
H1 : µ > 19
Các số đặc trưng mẫu: n = 25; x̄ = 19, 25. √ √
(x̄ − µ0 ) n (19, 25 − 19) 25
Giá trị của thống kê kiểm định: z = = = 2, 5.
Bài toán II Bài toán III σ 0, 5
Mức ý nghĩa: α = 0, 05 ⇒ zα = z0,05 = 1, 645.
Miền bác bỏ: Wα = [1, 645; +∞).
Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 và chấp nhận H1 .
Cách khác: p-giá trị = 1 − Φ(2.5) = 0.0062 < α = 0.05 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 13/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 14/47

Ví dụ 3
Trong năm trước khối lượng trung bình của bò xuất chuồng ở một trang trại là 380kg.
Năm nay người ta áp dụng thử một chế độ ăn mới với hy vọng là bò sẽ tăng trọng
nhanh hơn. Sau thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con bò xuất chuồng 2.2 Khi phương sai chưa biết
đem cân và tính được khối lượng trung bình của chúng là x = 390kg. Với mức ý nghĩa Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với kì vọng µ
α = 0, 02 có thể cho rằng khối lượng trung bình của bò xuất chuồng đã tăng lên không? chưa biết và phương sai σ 2 chưa biết.
Giả sử rằng khối lượng của bò có phân phối chuẩn với độ lệch chuẩn σ = 25, 2kg. Xét bài toán kiểm định với H0 : µ = µ0 và đối thuyết H1 : µ 6= µ0 (µ > µ0 , µ < µ0 ).
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326 Khi giả thuyết H0 : µ = µ0 đúng, thống kê:
Giải. Gọi µ(kg) là khối lượng trung bình của bò xuất chuồng. Theo giả thiết, ta có bài √
toán kiểm định: (X − µ0 ) n
( T =
H0 : µ = 380 S
H1 : µ > 380
√ √ có phân phối Student n − 1 bậc tự do.
(x̄ − µ0 ) n (390 − 380) 50
Giá trị của thống kê kiểm định: z = = = 2, 806.
σ 25, 2
Mức ý nghĩa: α = 0, 02 ⇒ zα = z0,02 = 2, 054. Miền bác bỏ: Wα = [2, 054; +∞).
Vì z ∈ Wα nên ta bác bỏ H0 . Vậy, khối lượng trung bình bò xuất chuồng đã tăng lên.
Cách khác: p-giá trị = 1 − Φ(2.806) = 0.0025 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 15/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 16/47
Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 chưa biết.
Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: t =
s
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ 6= µ0 (−∞; −tn−1;α/2 ] ∪ [tn−1;α/2 ; +∞) 2P (Tn−1 > |t|)
H 1 : µ > µ0 [tn−1;α ; +∞) P (Tn−1 > t)
H 1 : µ < µ0 (−∞; −tn−1;α ] P (Tn−1 < t)

Trong trường hợp n > 30: tn−1;α ≈ zα .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 17/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 18/47

Ví dụ 4
Tuổi thọ trung bình của một loại bóng đèn do nhà máy A sản xuất khi chưa cải tiến kĩ
- Thống kê kiểm định:
thuật là 2000 giờ. Sau thời gian cải tiến kĩ thuật người ta chọn ngẫu nhiên 25 bóng đèn
cho lắp thử nghiệm. Kết quả thực nghiệm thu được tuổi thọ trung bình mẫu x = 2022 √ √
(x̄ − µ0 ) n (2022 − 2000) 25
giờ và độ lệch chuẩn mẫu s = 30 giờ. Với mức ý nghĩa 0, 025 có thể kết luận “sau khi t=
s
=
25
= 3.67
cải tiến kĩ thuật, tuổi thọ trung bình của bóng đèn có tăng lên” không? Biết tuổi thọ
bóng đèn có phân phối chuẩn. Cho biết t24;0,025 = 2, 063. - Mức ý nghĩa: α = 0, 025; tn−1;α = t24;0,025 = 2, 063
- Miền bác bỏ: Wα = [2, 063; +∞)
Giải. Gọi µ(giờ) là tuổi thọ trung bình của loại bóng đèn sau cải tiến. Ta có bài toán Vì t ∈ Wα nên ta bác bỏ H0 và chấp nhận H1 . Vậy, sau cải tiến kỹ thuật tuổi thọ trung
kiểm định: bình của bóng đèn đã tăng lên.
Cách khác: p-giá trị = 1 − P (T24 < 3.67) = 0.0006 < α = 0.025 nên bác bỏ H0 .
(
H0 : µ = 2000
H1 : µ > 2000

- Các số đặc trưng mẫu: n = 25; x̄ = 2022; s = 30

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 19/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 20/47
Ví dụ 5 Giải. a. Dạng thu gọn:
Một xí nghiệp có 5000 công nhân cùng sản xuất một loại sản phẩm. Theo dõi thời gian
hoàn thành sản phẩm của 100 công nhân, ta được bảng số liệu sau: Thời gian (ph) 29 31 33 35 37 39

Thời gian (ph) 28-30 30-32 32-34 34-36 36-38 38-40 Số công nhân 5 15 25 30 20 5

Số công nhân 5 15 25 30 20 5
Các số đặc trưng mẫu: n = 100; x̄ = 34, 2; s = 2, 494
a) Tìm khoảng tin cậy đối xứng cho thời gian hoàn thành trung bình với độ tin cậy 90%. Độ tin cậy: 1 − α = 0, 9 ⇒ α = 0, 1; tn−1;α/2 = t99;0,05 ≈ z0,05 = 1, 645
b) Công nhân có tay nghề cao nếu thời gian hoàn thành 1 sản phẩm dưới 32ph. Với Sai số: s
ε = tn−1;α/2 √ = 1, 645 ∗ √
2, 494
= 0, 41
độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số công nhân có tay nghề cao của xí n 100
nghiệp. Khoảng tin cậy cho thời gian hoàn thành trung bình:
c) Xí nghiệp quy định định mức hoàn thành trung bình 1 sản phẩm là 34 phút. Có ý
kiến cho rằng định mức này có hại cho công nhân. Với mức ý nghĩa 2% hãy nhận xét x̄ − ε < µ < x̄ + ε ⇔ 33, 79 < µ < 34, 61
về ý kiến đó.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 21/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 22/47

c. Gọi µ (ph) là thời gian hoàn thành trung bình 1 sản phâm của công nhân. Ta có bài
b. Gọi K là số công nhân có tay nghề cao. Tỉ lệ công nhân có tay nghề cao: p = K/5000. toán kiểm định: (
Tỉ lệ mẫu công nhân có tay nghề cao: H0 : µ = 34
H1 : µ > 34
p̂ = k/n = (5 + 15)/100 = 0, 2
- Thống kê kiểm định:
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96
√ √
Sai số: (x̄ − µ0 ) n (34, 2 − 34) 100
r r
p̂(1 − p̂) 0, 2 ∗ 0, 8 t= = = 0, 802
ε = zα/2 = 1, 96 ∗ = 0, 0784 s 2, 494
n 100
Khoảng tin cậy cho tỉ lệ công nhân có tay nghề cao: - Mức ý nghĩa: α = 0, 02; tn−1;α = t99;0,02 ≈ z0,02 = 2, 054
- Miền bác bỏ: Wα = [2, 054; +∞)
p̂ − ε < p < p̂ + ε ⇔ 0, 1216 < p < 0, 2784 / Wα nên ta chưa có cơ sở bác bỏ H0 . Vậy, định mức quy định không gây hại cho
Vì t ∈
công nhân.
Suy ra: 0, 1216 < K/5000 < 0, 2784 ⇔ 608 < K < 1392.
Cách khác: p-giá trị = 1 − P (T99 < 0.802) = 0.2122369 > α = 0.02 nên chưa có cơ
sở bác bỏ H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 23/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 24/47
3. So sánh hai kỳ vọng của hai mẫu độc lập
Cho X và Y biến số ngẫu nhiên của hai tổng thể độc lập nhau và lần lượt có phân phối
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết; m > 30 và
chuẩn N (µx ; σx2 ) và N (µy ; σy2 ) với phương sai σx2 , σy2 chưa biết.
n > 30.
Xét bài toán kiểm định với Giả thuyết thống kê H0 : µx − µy = ∆0
H0 : µ x − µ y = ∆0 x − y − ∆0
Giá trị thống kê kiểm định: z = r
và đối thuyết H1 : µx − µy 6= ∆0 (µx − µy > ∆0 , µx − µy < ∆0 ). s2x s2y
+
Giả sử (x1 , ..., xm ) và (y1 , ..., yn ) là các mẫu thu được từ X và Y tương ứng. m n
Chỉ xét trường hợp khi cỡ mẫu lớn (m,n>30).
Khi đó, áp dụng Định lí giới hạn trung tâm ta có: Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µx − µy 6= ∆0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
(X − Y ) − (µx − µy )
Z= r H1 : µ x − µ y > ∆0 [zα ; +∞) 1 − Φ(z)
Sx2 Sy2 H1 : µ x − µ y < ∆0 (−∞; −zα ] Φ(z)
+
m n

có phân phối xấp xỉ phân phối chuẩn tắc N (0; 1).

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 25/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 26/47

Ví dụ 6
Nhận xét: Khi ∆0 = 0, các bài toán kiểm định trên thường được viết lại dưới dạng:
Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn, kết quả thu được:
(
H0 : µ x = µ y Khu vực Số trẻ Trung bình mẫu Phương sai mẫu
(I)
H1 : µx 6= µy Nông thôn m = 60 x = 3, 0 kg s2x = 0, 4 kg2
( Thành thị n = 50 y = 3, 1 kg s2y = 0, 5 kg2
H0 : µ x = µ y
(II) Với mức ý nghĩa 0, 05 có thể coi khối lượng trung bình của trẻ sơ sinh ở hai khu vực
H 1 : µ x < µy
khác nhau không? Biết khối lượng trẻ sơ sinh ở hai khu vực có phân phối chuẩn. Cho
biết z0.025 = 1.96
(
H0 : µ x = µ y
(III)
H1 : µ x > µ y Giải. Gọi µx , µy (kg) là khối lượng trung bình của trẻ sơ sinh ở nông thôn và thành thị.
Ta có bài toán kiểm định:
(
Thống kê kiểm định trở thành: H0 : µ x = µ y
x−y H1 : µx 6= µy
z=r
s2x s2y Thống kê kiểm định: x̄ − ȳ 3, 0 − 3, 1
+ z=q =p = −0, 774
m n 0, 4/60 + 0, 5/50
s2x /m + s2y /n
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 27/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 28/47
Mức ý nghĩa: α = 0, 05; zα/2 = z0,025 = 1, 96. Giải. Gọi µx , µy (đôla/giờ) là mức lương trung bình của nữ và nam giới. Ta có bài toán
Miền bác bỏ: Wα = (−∞; −1, 96] ∪ [1, 96; +∞) kiểm định: (
/ Wα nên ta chưa có cơ sở bác bỏ giả thuyết H0 . Vậy, không có sự khác biệt về
Vì z ∈ H0 : µ x = µ y
khối lượng trung bình của trẻ sơ sinh ở hai vùng trên. H1 : µ x < µy
Cách khác: p-giá trị = 2(1 − Φ(0.774)) = 0.4389308 > α = 0.05 nên chưa có cơ sở
bác bỏ H0 . Thống kê kiểm định:
x̄ − ȳ 7, 23 − 8, 06
Ví dụ 7 z=q =p = −3, 08
2 2
sx /m + sy /n 1, 642 /100 + 1, 852 /75
Người ta tiến hành một cuộc nghiên cứu để so sánh mức lương trung bình của phụ nữ
so với mức lượng trung bình của nam giới trong một công ty lớn. Một mẫu gồm 100 phụ
nữ có mức lương trung bình 7,23 đôla/giờ với độ lệch chuẩn 1,64 đôla/giờ. Một mẫu Mức ý nghĩa: α = 0, 01; zα = z0,01 = 2, 326.
gồm 75 nam giới có mức lượng trung bình là 8,06 đôla/giờ với độ lệch chuẩn là 1,85 Miền bác bỏ: Wα = (−∞; −2, 326]
đôla/giờ. Với mức ý nghĩa 1% số liệu này có chứng minh được mức lương trung bình Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 . Vậy, lương trung bình của nữ giới thấp hơn so
của phụ nữ trong công ty là thấp hơn nam giới hay không ? Cho biết z0,01 = 2, 326. với nam giới trong công ty.
Cách khác: p-giá trị = Φ(−3.08) = 0.001035003 < α = 0.01 nên bác bỏ H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 29/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 30/47

Trường hợp mẫu nhỏ và phương sai chưa biết (đọc thêm)
Trường hợp mẫu nhỏ, phương sai chưa biết và σx2 = σy2 (đọc thêm)
X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết.
Giả thuyết thống kê H0 : µx − µy = ∆0 X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết, σx2 = σy2 .
x − y − ∆0
Giá trị thống kê kiểm định: t = r Giả thuyết thống kê H0 : µx − µy = ∆0
s2x s2y
s
+ x − y − ∆0 (m − 1)s2x + (n − 1)s2y
m n Giá trị thống kê kiểm định: t = q , với sp =
s 1
+1 m+n−2
Đối thuyết Miền bác bỏ H0 p-giá trị p m n

H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|)) Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t) H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|))
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t) H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t)
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t)
trong đó Tν là biến ngẫu nhiên có phân phối Student với ν bậc tự do và ν là giá
trị nguyên gần nhất với giá trị trong đó ν = m + n − 2.
! "2 ! "
s2x s2y . (s2x /m)2 (s2y /n)2
+ +
m n m−1 n−1
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 31/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 32/47
4. So sánh cặp hai giá trị trung bình
(đọc thêm)
Các bài toán kiểm định:
Cho (X, Y ) là một cặp biến ngẫu nhiên (nói chung phụ thuộc nhau) với E(X) =
µx , E(Y ) = µy .
( (
H0 : µ x = µ y H0 : µ d = 0
Chúng ta muốn so sánh µx và µy . ⇔
H1 : µx 6= µy H1 : µd 6= 0
Giả sử (x1 , y1 ), ..., (xn , yn ) là một mẫu kích thước n của (X, Y ). ( (
Vì X, Y có thể phụ thuộc nhau nên ta không thể áp dụng phương pháp ở trên. H0 : µ x = µ y H0 : µ d = 0

Để giải quyết bài toán này, ta đặt H1 : µ x > µy H1 : µ d > 0
( (
D =X −Y H0 : µ x = µ y H0 : µ d = 0

H1 : µ x < µy H1 : µ d < 0
và xét mẫu của D:
di = xi − yi , i = 1, n Ta đưa về bài toán kiểm định trung bình (một mẫu) đã xét.
Lúc đó,
µd = E(D) = µx − µy

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 33/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 34/47

Ví dụ 8
Để khảo sát tác dụng của việc bón thêm một loại phân bón mới (A) người ta chia mỗi
thửa ruộng thí nghiệm làm hai mảnh. Một mảnh đối chứng không có phân bón A (với Giải. Đặt D = X − Y , ta có bảng tóm tắt sau:
sản lượng X) và mảnh kia có phân bón A (với sản lượng Y ). Sản lượng của 17 thửa Thửa X Y D Thửa X Y D
ruộng được ghi lại như sau:
1 55,8 60,4 -4,6 9 53,3 58,7 -4,7
Thửa X Y Thửa X Y 2 30,1 28,9 1,2 10 51,0 48,0 -5,4
1 55,8 60,4 9 53,3 58,7 3 37,8 39,7 -1,9 11 68,6 68,8 3
2 30,1 28,9 10 51,0 48,0 4 57,7 57,5 0,2 12 59,1 70,4 -0,2
3 37,8 39,7 11 68,6 68,8 5 49,4 56,8 -7,4 13 35,4 40,6 -11,3
4 57,7 57,5 12 59,1 70,4 6 53,4 57,3 -3,9 14 42,7 44,3 -5,2
5 49,4 56,8 13 35,4 40,6 7 21,2 32,2 -11 15 28,3 47,7 -1,6
6 53,4 57,3 14 42,7 44,3 8 57,3 77,0 -19,7 16 42,4 55,1 -19,4
7 21,2 32,2 15 28,3 47,7 17 61,4 66,1 -12,7
8 57,3 77,0 16 42,4 55,1
17 61,4 66,1
Với mức ý nghĩa 5% hỏi việc bón phân có tác dụng không?
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 35/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 36/47
Gọi µx , µy lần lượt là sản lượng trung bình của mảnh đối chứng không có phân bón A 5. Kiểm định giả thuyết về tỉ lệ
và mảnh có phân bón A. Cho tính chất A có tỉ lệ là p (chưa biết) trong tổng thể. Xét bài toán kiểm định giả
Bài toán kiểm định giả thuyết: (
thuyết:
H0 : µ x = µ y
H 0 : p = p0
H1 : µ x < µ y .
và đối thuyết H1 : p 6= p0 (p > p0 , p < p0 ).
Bài toán này tương đương với bài toán Chọn một mẫu ngẫu nhiên kích thước n, đặt
( kiểm định giả thuyết:
H0 : µ D = 0
(
1, phần tử i có tính chất A
Xi =
H1 : µD < 0. 0, phần tử i không có tính chất A

Miền bác bỏ H0 là W = (−∞; −t16;0,05 ] = (−∞; −1, 753]. X1 + X2 + ... + Xn


và P̂ = - tỉ lệ phần tử có tính chất A.
Thực hiện tính toán: d = −6, 15; sD = 6, 694. n
Giá trị của thống kê kiểm định: Khi H0 đúng, với n đủ lớn, theo Định lí giới hạn trung tâm:
d − 0√ √
t= n = −3, 79 ∈ W. (P̂ − p0 ) n
sD Z= p
p0 (1 − p0 )
Do đó, ta có cơ sở bác bỏ H0 .
Cách khác: p-giá trị = P (T16 < −3.79) = 0.0008031343 < α = 0.05 nên bác bỏ H0 . có phân phối xấp xỉ phân phối chuẩn tắc N (0; 1).
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 37/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 38/47

Ví dụ 9
Giám đốc một công ty tuyên bố 90% sản phẩm của công ty đạt tiêu chuẩn quốc gia.
Một công ty kiểm định độc lập đã tiến hành kiểm tra 200 sản phẩm của công ty đó thì
Cho p̂ = k/n là một ước lượng của tỷ lệ p từ một mẫu kích thước n. thấy có 168 sản phẩm đạt yêu cầu. Với mức ý nghĩa α = 0, 1 có thể cho rằng tỷ lệ sản
Giả thuyết gốc H0 : p = p0 √ phẩm đạt tiêu chuẩn quốc gia thấp hơn 90% không? Cho biết z0,1 = 1, 282.
(p̂ − p0 ) n
Giá trị thống kê kiểm định: z = p Giải. Gọi p là tỉ lệ sản phẩm đạt tiêu
( chuẩn quốc gia của công ty. Bài toán kiểm định:
p0 (1 − p0 )
H0 : p = 0, 9
Đối thuyết Miền bác bỏ H0 p-giá trị H1 : p < 0, 9
H1 : p 6= p0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|)) Tỉ lệ mẫu: p̂ = k/n = 168/200 = 0, 84
H1 : p > p0 [zα ; +∞) 1 − Φ(z) Thống kê kiểm định: (p̂ − p )√n √
0 (0, 84 − 0, 9) 200
z=p = √ = −2, 83
H1 : p < p0 (−∞; −zα ] Φ(z) p0 (1 − p0 ) 0, 9 ∗ 0, 1

Mức ý nghĩa: α = 0, 1 ⇒ zα = z0.1 = 1.282.


Miền bác bỏ: Wα = (−∞; −1, 282].
Vì z ∈ Wα nên bác bỏ H0 . Vậy, tỷ lệ sản phẩm đạt tiêu chuẩn quốc gia thấp hơn 90%.
Cách khác: p-giá trị = Φ(−2, 83) = 0.0023274 < α = 0.1 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 39/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 40/47
Ví dụ 10
b. Gọi p là tỉ lệ hộ dùng ga của công ty A trong các hộ dùng ga. Bài toán kiểm định:
Một khu vực có 10000 hộ gia đình sinh sống và các hộ ở đây chỉ sử dụng ga của 2 công
ty A và B. Điều tra 800 hộ thì có 600 hộ dùng ga, trong đó 360 hộ dùng ga của công
(
H0 : p = 0, 5
ty A.
H1 : p > 0, 5
a) Với độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số lượng hộ dùng ga ở khu vực
này.
Tỉ lệ mẫu: p̂ = k/n = 360/600 = 0, 6
b) Có ý kiến cho rằng ga của công ty A được các hộ thích dùng hơn. Với mức ý nghĩa
Giá trị của thống kê kiểm định:
2% hãy nhận xét về ý kiến ấy.
√ √
(p̂ − p0 ) n (0, 6 − 0, 5) 600
Giải. a. Gọi K là số lượng hộ dùng ga ở khu vực này. Ta có tỉ lệ hộ dùng ga: p = K/10000. z=p = √
0, 5 ∗ 0, 5
= 4, 9
p0 (1 − p0 )
Tỉ lệ mẫu: p̂ = k/n = 600/800 = 0, 75.
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96. Mức ý nghĩa: α = 0, 02 ⇒ zα = z0.02 = 2, 054.
Sai số:
r
Miền bác bỏ: Wα = [2, 054; +∞).
r
p̂(1 − p̂) 0, 75 ∗ 0, 25
ε = zα/2 = 1, 96 ∗ = 0, 03
n 800 Vì z ∈ Wα nên bác bỏ H0 . Vậy, sản phẩm ga của công ty A được ưa thích hơn.
Cách khác: p-giá trị = 1 − Φ(4.9) = 4.791833e − 07 < α = 0.02 nên bác bỏ H0 .
Khoảng tin cậy cho tỉ lệ hộ dùng ga: p̂ − ε < p < p̂ + ε ⇔ 0, 72 < p < 0, 78
Suy ra: 0, 72 < K/10000 < 0, 78 ⇔ 7200 < K < 7500.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 41/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 42/47

6. So sánh hai tỉ lệ
Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu
Xét tính chất A có tỉ lệ là p1 và p2 chưa biết trong hai tổng thể độc lập nhau. Xét bài ngẫu nhiên độc lập.
toán kiểm định với giả thuyết gốc: - Giả thuyết gốc H0 : p1 = p2
- Giá trị thống kê kiểm định:
H 0 : p1 = p 2
p̂1 − p̂2 k1 + k2
và đối thuyết H1 : p1 6= p2 (p1 > p2 , p1 < p2 ). z=s   với p̂ = n + n
Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu ngẫu 1 1 1 2
p̂(1 − p̂) +
nhiên độc lập kích thước n1 và n2 tương ứng. n 1 n2
Khi giả thuyết H0 đúng, thống kê
p̂1 − p̂2 k1 + k2 Đối thuyết Miền bác bỏ H0 p-giá trị
Z=s  với p̂ = n + n
H1 : p1 6= p2 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))

1 1 1 2
p̂(1 − p̂) +
n1 n2 H1 : p1 > p2 [zα ; +∞) 1 − Φ(z)
H1 : p1 < p2 (−∞; −zα ] Φ(z)
có phân phối xấp xỉ phân phối chuẩn tắc N (0, 1).

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 43/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 44/47
Các tỉ lệ mẫu:
Ví dụ 11
Kiểm tra ngẫu nhiên các sản phẩm cùng loại do hai nhà máy sản xuất thu được dữ liệu: p̂1 = k1 /n1 = 25/1000 = 0, 025; p̂2 = k2 /n2 = 30/960 = 0, 03125
p̂ = (k1 + k2 )/(n1 + n2 ) = (25 + 30)/(1000 + 960) = 0, 028
Nhà máy Số sản phẩm được kiểm tra Số phế phẩm
A 1000 25 Giá trị của thống kê kiểm định:
B 960 30 p̂1 − p̂2 0, 025 − 0, 03125
z=s =p = −0, 838
0, 028 ∗ (1 − 0, 028)(1/1000 + 1/960)

Với mức ý nghĩa α = 0, 05 có thể coi tỷ lệ phế phẩm của hai nhà máy trên bằng nhau 1 1
p̂(1 − p̂) +
không? Cho biết z0.025 = 1.96 n1 n 2

Giải. Gọi p1 , p2 là tỉ lệ phế phẩm của nhà máy A, B tương ứng. Ta có bài toán kiểm Mức ý nghĩa: α = 0, 05 ⇒ zα/2 = z0.025 = 1, 96.
định: ( Miền bác bỏ: Wα = (−∞; −1, 96] ∪ [1, 96; +∞).
H0 : p1 = p2 / Wα nên chưa có cơ sở bác bỏ H0 . Vậy, tỉ lệ phế phẩm của hai nhà máy không
Vì z ∈
H1 : p1 6= p2 có sự khác biệt.
Cách khác: p-giá trị = 2(1 − Φ(0.838)) = 0.4020307 > α = 0.05 nên chưa có cơ sở
bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 45/47 Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 46/47

Ví dụ 12
Công ty nước giải khát đang nghiên cứu 2 thị trường mới là khu vực A và khu vực B.
Ở khu vực A khi cho 500 người dùng thử thì có 120 người ưa thích thức uống này. Còn
đối với khu vực B khi cho 1000 người dùng thử thì có 300 người bảo ưa thích hương vị
này. Với mức ý nghĩa 2% hãy kiểm định xem tỉ lệ người ưa thích thức uống của công ty
ở khu vực B có cao hơn ở khu vực A hay không ? Cho biết z0,02 = 2, 054.
Giải. Gọi p1 , p2 là tỉ lệ người ưa thích nước uống của công ty ở khu vực A và B. Ta có
bài toán kiểm định: (
H0 : p1 = p2
H1 : p1 < p2
Các tỉ lệ mẫu: p̂1 = 0, 24; p̂2 = 0, 3; p̂ = 0, 28.
Giá trị thống kê kiểm định: z = −2, 39
Miền bác bỏ: Wα = (−∞; −2, 054].
Vì z ∈ Wα nên bác bỏ giả thuyết H0 .
Vậy, tỉ lệ người ưa thích thức uống của công ty ở khu vực B cao hơn ở khu vực A.
Cách khác: p-giá trị = Φ(−2.39) = 0.00842 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 47/47

You might also like