You are on page 1of 97

XÁC SUẤT THỐNG KÊ

Tôn Thất Tú

Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 1: Xác suất 1/51

Học phần: Xác suất thống kê


Nội dung
* Học phần bao gồm 45 tiết, với 6 chương như sau:
- Chương 1. Xác suất
- Chương 2. Biến ngẫu nhiên
- Chương 3: Vectơ ngẫu nhiên
- Chương 4: Thống kê mô tả
- Chương 5: Ước lượng tham số
- Chương 6: Kiểm định giả thuyết thống kê
* Tài liệu tham khảo:
1. Jay L. Devore (2012), Probability and Statistics for Engineering and the Sciences,
8th Edition, Brooks/Cole, Cengage Learning.
2. Lê Văn Dũng (2016), Giáo trình Xác suất thống kê, NXB Thông tin và truyền
thông.
* Phần mềm: R, Python, Excel, Geogebra,...

Tôn Thất Tú - 2021 Chương 1: Xác suất 2/51

Chương 1: Xác suất


1. Kiến thức về tổ hợp
- Số hoán vị của một tập n phần tử:

Pn = n!

- Số cách chọn k phần tử (không thứ tự) trong tập n phần tử:

n!
Cnk =
k!(n − k)!

- Số cách chọn k phần tử (có thứ tự) trong tập n phần tử:

n!
Akn =
(n − k)!

Tôn Thất Tú - 2021 Chương 1: Xác suất 3/51


- Quy tắc cộng: Công việc A có m phương án thực hiện.
* Phương án 1: có n1 cách
* Phương án 2: có n2 cách
..............................
* Phương án m: có nm cách
Số cách thực hiện công việc A:

n1 + n2 + ... + nm

- Quy tắc nhân: Công việc A được thực hiện qua m giai đoạn liên tiếp.
* Giai đoạn 1: có n1 cách
* Giai đoạn 2: có n2 cách
..............................
* Giai đoạn m: có nm cách
Số cách thực hiện công việc A:

n1 ∗ n2 ∗ ... ∗ nm

Tôn Thất Tú - 2021 Chương 1: Xác suất 4/51

Ví dụ 1
Một nhóm có 10 học sinh, trong đó có 6 nam và 4 nữ. Hỏi có bao nhiêu cách:
a) Xếp thành 1 hàng dọc.
b) Chọn một nhóm có 4 học sinh đều có nam và nữ với số lượng khác nhau.
c) Chọn một nhóm có 4 học sinh trong đó có ít nhất một nữ.
Đáp số: a) 10! b) C61 C43 + C63 C41 c) C10
4
− C64
Ví dụ 2
Một biển số xe được cấu tạo từ 5 chữ số. Hỏi có bao nhiêu biển số có:
a) Các chữ số khác nhau.
b) Ít nhất 2 chữ số giống nhau.
c) Có đúng 3 chữ số giống nhau.
Đáp số: a) A510 b) 105 − A510
c) Được tính qua 3 giai đoạn:
- Gđ 1: Chọn 3 vị trí trong 5 vị trí: C53
- Gđ 2: Chọn 1 chữ số giống nhau cho 3 vị trí trên: C10
1

- Gđ 3: chọn 2 chữ số còn lại (không phân biệt): 9 2

Vậy, theo quy tắc nhân: C53 C10 9 cách.


1 2
Tôn Thất Tú - 2021 Chương 1: Xác suất 5/51

2. Không gian mẫu và biến cố


a. Định nghĩa
- Thí nghiệm ngẫu nhiên: thí nghiệm mà ta có thể lặp lại nhiều lần trong cùng điều kiện
nhưng kết quả không thể dự đoán trước.
- Không gian mẫu: Tập tất cả các kết quả, kí hiệu Ω.

Ví dụ 3
Gieo 1 đồng xu, rút một lá bài trong bộ bài, đo nhiệt độ không khí tại thời điểm 9h
sáng, chọn ngẫu nhiên 1 sinh viên và đo chiều cao,... là các thí nghiệm ngẫu nhiên

Ví dụ 4
X Gieo 1 đồng xu: Ω = {S, N }
X Chọn ngẫu nhiên 1 ngày trong tháng 1: Ω = {1, 2, ..., 31}
X Do nhiệt độ không khí tại thời điểm 9h sáng: Ω = (−∞, +∞)

Tôn Thất Tú - 2021 Chương 1: Xác suất 6/51


- Biến cố : hiện tượng có thể xảy ra hoặc không xảy ra trong thí nghiệm ngẫu nhiên. Kí
hiệu: A,B,C, ...
- Kết quả thuận lợi cho biến cố A: kết quả xảy ra kéo theo biến cố A xảy ra.
- Mỗi biến cố được đồng nhất với tập các kết quả thuận lợi của nó. Lúc đó, mỗi biến
cố là một tập con của không gian mẫu.
- Biến cố A được xem là xảy ra nếu có ít nhất một kết quả trong A xuất hiện.
- Biến cố sơ cấp: biến cố mà tập các kết quả thuận lợi chỉ gồm 1 phần tử.
- Không gian mẫu: Không gian các biến cố sơ cấp.

Ví dụ 5
Tung ngẫu nhiên 2 đồng xu. Lúc đó:
X Không gian mẫu: Ω = {SS, SN, N S, N N }
X Hiện tượng (sự kiện) "Có mặt sấp xuất hiện" là biến cố ngẫu nhiên. Kí hiệu A.
X Giả sử khi thực hiện, kết quả «SN» xuất hiện. Điều này kéo theo biến cố A xảy ra.
Kết quả «SN» được gọi là kết quả thuận lợi cho biến cố A.

Tôn Thất Tú - 2021 Chương 1: Xác suất 7/51

X Tập các kết quả thuận lợi cho A: {SN, N S, SS}. Lúc đó, ta biểu diễn biến cố A:

A = {SN, N S, SS},

tức A là một tập con của Ω.


X Khi thực hiện phép thử, nếu xảy ra ít nhất một trong các kết quả (của A): «SS»,
«SN», «NS» thì ta bảo biến cố A xảy ra.
X Các biến cố {SS}, {SN }, {N S}, {N N } là các biến cố sơ cấp.

Ví dụ 6
Tung ngẫu nhiên đồng xu cho đến khi có mặt sấp xuất hiện. Khi đó:

Ω = {S, N S, N N S, N N N S, ...}

Lúc đó, ta có biến cố:


- dừng sau không quá 3 lần tung: A = {S, N S, N N S}
- thực hiện ít nhất 2 lần tung: B = {N S, N N S, N N N S, N N N N S, ....}
Tôn Thất Tú - 2021 Chương 1: Xác suất 8/51

Các biến cố đặc biệt:


- Biến cố không thể (∅): là biến cố không thể xảy ra
- Biến cố chắc chắn (Ω): là biến cố luôn xảy ra
Chẳng hạn, gieo ngẫu nhiên 2 con xúc xắc. Lúc đó:
- biến cố "tổng số chấm xuất hiện lớn hơn 12" là biến cố không thể.
- biến cố "tổng số chấm xuất hiện lớn hơn 1" là biến cố chắc chắn.

b. Các phép toán trên biến cố


Cho hai biến cố A và B. Khi đó:
- Biến cố đối của A, kí hiệu Ā hoặc Ac , xác định: Ā = Ω\A (là biến cố xảy ra nếu A
không xảy ra)
- Giao của A và B, kí hiệu A ∩ B, AB, xác định AB = {x : x ∈ A, x ∈ B} (là biến cố
xảy ra nếu A và B đồng thời xảy ra).
- Giao của n biến cố Ai , kí hiệu A1 ∩ A2 ∩ ... ∩ An , là biến cố xảy ra nếu đồng thời các
biến cố Ai cùng xảy ra.
- Hợp của A và B, kí hiệu A ∪ B, xác định A ∪ B = {x : x ∈ A hoặc x ∈ B} (là biến
cố xảy ra nếu ít nhất A hoặc B xảy ra)
Tôn Thất Tú - 2021 Chương 1: Xác suất 9/51
- Hợp của n biến cố Ai , kí hiệu A1 ∪ A2 ∪ ... ∪ An , là biến cố xảy ra nếu ít nhất một
trong các biến cố Ai xảy ra.
- Hai biến cố A và B được gọi là xung khắc nếu chúng không đồng thời xảy ra.
Nhận xét:
- Hai biến cố A và B xung khắc khi và chỉ khi AB = ∅.
- Hai biến cố đối nhau thì xung khắc với nhau, nhưng điều ngược lại nói chung là không
đúng.

Ví dụ 7
Chọn ngẫu nhiên một chữ số từ 0 đến 9.
Ta có Ω = {0, 1, 2, ..., 9}.
Xét 3 biến cố A = {0, 2, 4}, B = {4, 5, 6} và C = {7, 8, 9}.
Lúc đó:
• A ∩ B = {4}, A ∪ B = {0, 2, 4, 5, 6}, Ā = {1, 3, 5, 6, 7, 8, 9}
• A và C xung khắc vì A ∩ C = ∅ nhưng A và C không phải là hai biến cố đối nhau.

Tôn Thất Tú - 2021 Chương 1: Xác suất 10/51

Ví dụ 8
Có 2 xạ thủ, mỗi người bắn 1 viên đạn vào mục tiêu. Gọi A và B tương ứng là các biến
cố: “người thứ nhất và thứ hai bắn trúng mục tiêu” tương ứng. Khi đó ta có biểu diễn
các biến cố như sau:
- Có đạn trúng đích: A ∪ B
- Có đúng 1 viên đạn trúng đích: AB̄ ∪ ĀB
- Chỉ có người thứ nhất bắn trúng: AB̄
- Có nhiều nhất một viên đạn trúng đích: ĀB̄ ∪ AB̄ ∪ ĀB hoặc AB

Luật De-Morgan về phủ định:

∪Ai = ∩Āi
∩Ai = ∪Āi

Tôn Thất Tú - 2021 Chương 1: Xác suất 11/51

3. Định nghĩa và các tính chất của xác suất


Định nghĩa (theo hệ tiên đề):
Cho trước một thí nghiệm với không gian mẫu Ω. Khi đó, xác suất của một biến cố A,
kí hiệu P (A), là số đo khả năng xảy ra biến cố A.
Ứng với mỗi biến cố A ta đặt tương ứng với giá trị P (A) thỏa các điều kiện sau:
(i) Với mọi biến cố A, P (A) ≥ 0
(ii) P (Ω) = 1
(iii) Nếu A1 , A2 , ... là các biến cố đôi một xung khắc thì
+∞
X
P (∪∞
n=1 An ) = P (An )
n=1

Lúc đó P (A) được gọi là xác suất của biến cố A.


Nhận xét: Trong một số trường hợp, tùy vào không gian mẫu cũng như các thiết lập
"tương ứng" P mà ta sẽ thu được một vài định nghĩa xác suất khác.

Tôn Thất Tú - 2021 Chương 1: Xác suất 12/51


Định nghĩa (quan điểm thống kê):
Xét biến cố A. Thực hiện phép thử n lần thì có m lần xuất hiện biến cố A. Khi đó tỉ số
fn = m/n được gọi là tần suất xuất hiện A. Khi số phép thử tăng lên vô hạn, tần suất
fn sẽ tiến đến một hằng số xác định. Hằng số này được gọi là xác suất của biến cố A.
Vì thế, trong thực tế khi số phép thử n lớn, ta có thể xem tần suất fn như là xác suất
của xuất hiện biến cố A.

Ví dụ 9
Có 1000 người có triệu chứng A đến cơ sở y tế để khám bệnh. Kết quả có thấy 700
mắc bệnh X. Ta có f = 700/1000 = 70%. Do đó, ta có cơ sở dự đoán nếu một người
có triệu chứng A thì xác suất mắc bệnh X xấp xỉ 70%.

Tôn Thất Tú - 2021 Chương 1: Xác suất 13/51

Định nghĩa (quan điểm cổ điển):


Cho thí nghiệm với n(Ω) < +∞ kết quả đồng khả năng, trong đó có n(A) kết quả
thuận lợi cho biến cố A. Khi đó, xác suất của biến cố A, kí hiệu P (A), được xác định:

n(A)
P (A) =
n(Ω)

Ví dụ 10
Trong một hộp có 6 bi đen và 4 bi trắng. Lấy ngẫu nhiên 4 viên. Tìm xác suất lấy được
cả hai loại bi.

Giải.
Gọi A là biến cố "lấy được cả hai loại bi".
Số trường hợp đồng khả năng: n(Ω) = C10 4 .

Số trường hợp thuận lợi: n(A) = C6 C4 + C62 C42 + C63 C41 .


1 3

Xác suất cần tìm:


n(A) C 1 C 3 + C62 C42 + C63 C41
P (A) = = 6 4 4
n(Ω) C10
Tôn Thất Tú - 2021 Chương 1: Xác suất 14/51

Ví dụ 11
Một đoàn tàu có 3 toa. Có 15 khách lên ngẫu nhiên 3 toa tàu. Biết mỗi toa đều chứa
được 15 khách. Tính xác suất:
a. Toa 1 có 4 khách.
b. Có 2 toa mỗi toa có 6 khách.

Giải.
a. Gọi A là biến cố "toa 1 có 4 khách".
Ta có: n(Ω) = 315 .
Giá trị n(A) được tính thông qua 2 giai đoạn:
- Gđ 1: Chọn 4 khách: C154 cách

- Gđ 2: Xếp 11 khách còn lại: 211 cách.


Suy ra: n(A) = C154 211

Xác suất cần tìm:


n(A) C 4 211
P (A) = = 1515
n(Ω) 3

Tôn Thất Tú - 2021 Chương 1: Xác suất 15/51


b. Gọi B là biến cố "có 2 toa mỗi toa có 6 khách".
Giá trị n(B) được tính thông qua các giai đoạn:
- Gđ 1: Chọn 2 toa: C32 cách
- Gđ 2: Chọn 6 khách cho mỗi toa: C15 6 C 6 cách.
9
- Gđ 3: Xếp 3 khách còn lại 1 = 1 cách
3

Suy ra: n(B) = C32 C15


6 C6
9
Xác suất cần tìm: n(B) C 2 C15
6 C6
P (B) = = 3 15 9
n(Ω) 3

Ví dụ 12
Một rổ cam gồm 12 quả, trong đó có 3 quả hỏng. Chia đều 12 quả này cho 3 người,
mỗi người 4 quả. Tính xác suất:
a. Người thứ nhất không có quả hỏng.
b. Mỗi người đều có quả hỏng.

Gợi ý. Ta có: n(Ω) = C12


4
C84 C44
a. n(A) = C9 C8 C4 b. n(B) = 3!C93 C63 C33
4 4 4

Tôn Thất Tú - 2021 Chương 1: Xác suất 16/51

Định nghĩa (quan điểm hình học):


Cho miền Ω đo được (trên đường thẳng, trong mặt phẳng, không gian ba chiều, ...) và
miền con S đo được của Ω. Ta lấy ngẫu nhiên một điểm trong miền Ω và đặt A là biến
cố M ∈ S. Khi đó, xác suất của biến cố A được xác định như sau:
m(S)
P (A) = ,
m(Ω)

trong đó m(S), m(Ω) là số đo của miền S và Ω. Cụ thể,


- Nếu Ω là đường cong hay đoạn thẳng thì m(·) là hàm chỉ độ dài.
- Nếu Ω là hình phẳng hay mặt cong thì m(·) là hàm chỉ diện tích.
- Nếu Ω là hình khối 3 chiều thì m(·) là hàm chỉ thể tích.
- ...

Tôn Thất Tú - 2021 Chương 1: Xác suất 17/51

Ví dụ 13
Tính xác suất khi lấy ngẫu nhiên một điểm M trong hình vuông có độ dài cạnh bằng
2m thì điểm này rơi vào hình tròn nội tiếp hình của vuông.

Giải. Dễ thấy:
- Diện tích hình tròn: m(S) = π(m2 )
- Diện tích của hình vuông: m(Ω) = 4(m2 )
Theo quan điểm hình học, xác suất của biến
cố A cần tìm:
m(S) π
P (A) = =
m(Ω) 4

Tôn Thất Tú - 2021 Chương 1: Xác suất 18/51


Tính chất
i) P (∅) = 0, P (Ω) = 1
ii) 0 ≤ P (A) ≤ 1, ∀A
iii) Nếu A ⊂ B thì P (A) ≤ P (B)
iv) Công thức cộng: Khi các biến cố xung khắc đôi một thì

P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + ... + P (An )

Nói riêng:
P (A) + P (Ā) = 1
Tổng quát:

P (A ∪ B) = P (A) + P (B) − P (AB)


P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (AB) − P (BC) − P (AC) + P (ABC)

Tôn Thất Tú - 2021 Chương 1: Xác suất 19/51

P (A1 ∪ A2 ∪ ... ∪ An ) = P (A1 ) + ... + P (An )


X
− P (Ai Aj )
i<j
X
+ P (Ai Aj Ak )
i<j<k

......
(−1)n−1 P (A1 A2 ...An )

Ví dụ 14
Một lô hàng có 15 thiết bị, trong đó có 6 thiết do nhà máy X sản xuất và 9 thiết bị do
nhà máy Y sản xuất. Người ta chọn ngẫu nhiên 4 thiết bị để kiểm tra. Tính xác suất:
a. Cả 4 thiết bị được chọn do cùng nhà máy sản xuất
b. Có ít nhất một thiết bị được chọn do nhà máy X sản xuất.

Tôn Thất Tú - 2021 Chương 1: Xác suất 20/51

Giải.

a. Gọi AX , AY là các biến cố các thiết bị được chọn do nhà máy X, Y sản xuất. Ta có
AX , AY xung khắc.
Xác suất cả 4 thiết bị được chọn do cùng nhà máy sản xuất:

C64 C94
P (AX ∪ AY ) = P (AX ) + P (AY ) = 4 + 4
C15 C15

b. Gọi B là biến cố có ít nhất một thiết bị được chọn do nhà máy X sản xuất. Ta có:

C94
P (B) = 1 − P (B̄) = 1 − 4
C15

Tôn Thất Tú - 2021 Chương 1: Xác suất 21/51


Ví dụ 15
Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết tiếng Anh, 12 sinh viên biết tiếng
Pháp và 7 sinh viên biết cả hai thứ tiếng. Chọn ngẫu nhiên một sinh viên. Tìm xác suất
để sinh viên đó biết ít nhất một ngoại ngữ.

Giải.
Gọi A, B là biến cố chọn được sinh viên biết tiếng Anh, Pháp.
Lúc đó, xác suất cần tìm:

P (A ∪ B) = P (A) + P (B) − P (AB) = 10/20 + 12/20 − 7/20 = 3/4

Tôn Thất Tú - 2021 Chương 1: Xác suất 22/51

Ví dụ 16
Một đội bóng bàn của 1 đơn vị gồm 2 vận động viên A và B. Xác suất A, B vượt qua
vòng bảng lần lượt là 0,7 và 0,5. Do ảnh hưởng tâm lý nên xác suất cả hai người đều
vượt qua vòng bảng là 0,4. Tính xác suất cả hai vận động viên đều không vượt qua vòng
bảng.

Giải. Gọi A, B là các biến cố vận động viên A, B vượt qua vòng bảng. Ta có:

P (A) = 0, 7; P (B) = 0, 5; P (AB) = 0, 4

Xác suất cả hai vận động viên đều không vượt qua vòng bảng:
h De Morgan
i
P (ĀB̄) = 1 − P (ĀB̄) = 1 − P (A ∪ B) = 1 − [P (A) + P (B) − P (AB)]

= 1 − (0, 7 + 0, 5 − 0, 4) = 0, 2

Tôn Thất Tú - 2021 Chương 1: Xác suất 23/51

4. Xác suất có điều kiện


Một lô hàng tivi với các số liệu sau:

LG SONY
Tốt 15 12
Bị hỏng 5 8

Chọn ngẫu nhiên 1 tivi thì được tivi LG. Vậy, khả năng nó bị hỏng là bao nhiêu?
Gợi ý.
- Khi không có thông tin, dễ thấy xác suất này là 13/40.
- Vì biết chọn được tivi LG nên ta "thu hẹp" phạm vi quan sát và chỉ tính đến loại tivi
LG. Lúc đó, khả năng chọn được tivi hỏng với "điều kiện" là tivi LG bằng 5/20=1/4.

BIẾT ĐIỀU KIỆN XẢY RA → XÁC SUẤT THAY ĐỔI

Tôn Thất Tú - 2021 Chương 1: Xác suất 24/51


Định nghĩa:
Cho hai biến cố A và B với P (B) > 0. Khi đó, xác suất có điều kiện của A với điều kiện
biến cố B đã xảy ra, kí hiệu P (A|B), xác định như sau:

P (AB)
P (A|B) =
P (B)

Tính chất:
i. 0 ≤ P (A|B) ≤ 1
ii. P (Ā|B) = 1 − P (A|B)
iii. P (A ∪ B|C) = P (A|C) + P (B|C) − P (AB|C)

Tôn Thất Tú - 2021 Chương 1: Xác suất 25/51

Ví dụ 17
Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu dự án A và B tương ứng là
0,6 và 0,7. Xác suất thắng thầu đồng thời cả 2 dự án là 0,5. Tính xác suất:
a) Công ty thắng thầu dự án A biết đã thắng thầu dự án B.
b) Công ty không thắng thầu dự án B biết đã thắng thầu dự án A.

Giải. Gọi A, B là các biến cố công ty thắng dự án A, B. Theo giả thiết:

P (A) = 0, 6; P (B) = 0, 7; P (AB) = 0, 5

a. P (A|B) = P (AB)/P (B) = 5/7


b. P (B̄|A) = 1 − P (B|A) = 1 − P (AB)/P (A) = 1 − 5/6 = 1/6.

Tôn Thất Tú - 2021 Chương 1: Xác suất 26/51

Bình luận. Ta có: P (A|B) = 5/7 > P (A) = 0, 6. Như vậy, việc biết biến cố B xảy ra
đã làm tăng xác suất xảy ra biến cố A, hay nói cách khác, việc thắng dự án B là có lợi
cho quá trình đấu thầu dự án A.

Nhận xét
Trong một số trường hợp, xác suất có điều kiện P (A|B) có thể được tính dựa vào việc
"đếm trực quan", tức là ta thu hẹp tập các kết quả sau khi biến cố B xảy ra và đếm lại
số kết quả đồng khả năng, số kết quả thuận lợi để tính xác suất có điều kiện.

Chẳng hạn, ta quay lại với ví dụ về tivi Sony và LG. Vì biết chọn được tivi LG nên tập
kết quả thu hẹp về 20 tivi LG. Chỉ có 5 tivi LG bị hỏng, nên xác suất chọn được tivi
hỏng khi biết đó là tivi bằng 5/20=1/4.

Tôn Thất Tú - 2021 Chương 1: Xác suất 27/51


Ví dụ 18
Có 15 thanh RAM, trong đó có 3 thanh bị hỏng. Chọn ngẫu nhiên 4 thanh.
a. Tính xác suất có ít nhất 1 thanh bị hỏng được chọn.
b. Biết chọn được ít nhất 1 thanh hỏng, tính xác suất chọn đúng 2 thanh bị hỏng.

Giải. Gọi A, B là các biến cố chọn được ít nhất 1 thanh hỏng, chọn được đúng 2 thanh
hỏng.
a. P (A) = 1 − P (Ā) = 1 − C124 /C 4
15
b. P (B|A) = P (AB)/P (A) = P (B)/P (A), trong đó P (B) = C32 C12 2 /C 4 .
15

Tôn Thất Tú - 2021 Chương 1: Xác suất 28/51

5. Công thức nhân xác suất


Cho hai biến cố A và B với P (A) > 0. Khi đó:

P (AB)
P (B|A) = ⇒ P (AB) = P (A)P (B|A)
P (A)

Tương tự, ta sẽ có:

P (AB) = P (A)P (B|A) = P (B)P (A|B)

Tổng quát: Cho n biến cố Ai với P (A1 A2 ...An−1 ) > 0. Khi đó:

P (A1 A2 ...An ) = P (A1 ).P (A2 |A1 ).P (A3 |A1 A2 )....P (An |A1 ...An−1 )

Tôn Thất Tú - 2021 Chương 1: Xác suất 29/51

Ví dụ 19
Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu lần lượt là 0.7 và 0.4. Nếu
dự án A đã thắng thầu thì xác suất thắng tiếp dự án B là 0.4. Tính xác suất:
a. Công ty thắng ít nhất một dự án.
b. Công ty chỉ thắng dự án A.
c. Thắng đúng 1 dự án.

Giải. Gọi A, B là biến cố công ty thắng dự án A, B. Ta có:

P (A) = 0, 7; P (B) = 0, 4, P (B|A) = 0, 4

a. P (A ∪ B) = P (A) + P (B) − P (AB) = P (A) + P (B) − P (A)P (B|A) = 0, 7 + 0, 4 −


0, 7 ∗ 0, 4 = 0, 82
b. P (AB̄) = P (A)P (B̄|A) = P (A)[1 − P (B|A)] = 0, 7[1 − 0, 4] = 0, 42
c. P (AB̄ ∪ ĀB) = P (AB̄) + P (ĀB) = . . .

Tôn Thất Tú - 2021 Chương 1: Xác suất 30/51


Ví dụ 20
Một thủ kho có một chùm chìa khóa gồm 9 chiếc, bề ngoài chúng giống hệt nhau nhưng
trong đó chỉ có đúng 2 chiếc mở được kho. Anh ta thử ngẫu nhiên từng chìa cho đến
khi mở được kho thì dừng. Tính xác suất việc làm này:
a. Dừng ở lần thử thứ 2.
b. Dừng ở lần thử thứ 3.
c. Sau nhiều nhất hai lần thử.

Giải. Gọi Ai là biến cố lần thứ i chọn đúng chìa khóa, i = 1, 2, 3, ...
a. P (Ā1 A2 ) = P (Ā1 )P (A2 |Ā1 ) = 7/9 ∗ 2/8
b. P (Ā1 Ā2 A3 ) = P (Ā1 )P (Ā2 |Ā1 )P (A3 |Ā1 Ā2 ) = 7/9 ∗ 6/8 ∗ 2/7
c. P (A1 ∪ Ā1 A2 ) = P (A1 ) + P (Ā1 A2 ) = 2/9 + 7/9 ∗ 2/8

Tôn Thất Tú - 2021 Chương 1: Xác suất 31/51

6. Biến cố độc lập


- Hai biến cố A và B được gọi là độc lập nếu P (AB) = P (A).P (B).
- Dãy n biến cố A1 , ..., An được gọi là độc lập nếu ta lấy ra một dãy bất kì các biến cố
khác nhau từ các biến cố trên thì xác suất của tích các biến cố này bằng tích xác suất
của từng biến cố thành phần, nghĩa là:
\ Y
P( Ak ) = P (Ak ), ∀I ⊂ {1, 2, ..., n}
k∈I k∈I

Nhận xét
- Hai biến cố A và B độc lập ⇔ P (A|B) = P (A) hoặc P (B|A) = P (B).
- Nếu nhóm n biến cố A1 , ..., An độc lập thì nhóm n biến cố B1 , B2 , ..., Bn cũng độc
lập, trong đó Bi là Ai hoặc Āi .
- Nếu nhóm n biến cố A1 , ..., An độc lập thì mọi nhóm con các biến cố của nó cũng
độc lập.

Tôn Thất Tú - 2021 Chương 1: Xác suất 32/51

Ví dụ 21
Một nồi hơi có 3 van bảo hiểm hoạt động độc lập với xác suất hỏng của van 1, van 2,
van 3 trong khoảng thời gian T tương ứng là 0,1; 0,2; 0,3. Nồi hơi hoạt động an toàn
nếu có ít nhất một van không hỏng. Tính xác suất để nồi hơi hoạt động an toàn trong
khoảng thời gian T.

Giải. Gọi Ai là biến cố van i bị hỏng trong khoảng thời gian T, i = 1, 2, 3.


Ta có A1 , A2 , A3 độc lập và

P (A1 ) = 0, 1; P (A2 ) = 0, 2; P (A3 ) = 0, 3

Xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T:

P (Ā1 ∪ Ā2 ∪ Ā3 ) = 1 − P (A1 A2 A3 ) = 1 − P (A1 )P (A2 )P (A3 ) = 0, 994

Tôn Thất Tú - 2021 Chương 1: Xác suất 33/51


Ví dụ 22
Nước được cấp từ E đến F qua 3 trạm
Một trạm cấp nước như hình vẽ:
bơm tăng áp A, B, C. Các trạm bơm
làm việc độc lập với nhau. Xác suất để
các trạm này có sự cố sau một thời gian
làm việc lần lượt là 0.1, 0.1, 0.05. Tính
xác suất để vùng F bị mất nước.

Giải. Gọi A,B,C là các biến cố trạm bơm A,B,C bị sự cố.


Ta có: A,B,C là các biến cố độc lập và

P (A) = 0, 1; P (B) = 0, 1; P (C) = 0, 05

Xác suất vùng F bị mất nước:

P (AB ∪ C) = P (AB) + P (C) − P (ABC) = P (A)P (B) + P (C) − P (A)P (B)P (C)

Tôn Thất Tú - 2021 Chương 1: Xác suất 34/51

Ví dụ 23
Một thiết bị có 2 bộ phận hoạt động độc lập. Xác suất bộ phận thứ nhất bị hỏng là
0,1. Xác suất có đúng 1 bộ phận bị hỏng là 0,26.
a. Tính xác suất bộ phận thứ 2 bị hỏng.
b. Biết có ít nhất 1 bộ phận hỏng, tính xác suất bộ phận 1 hỏng.

Giải. Gọi Ai là biến cố bộ phận thứ i bị hỏng, i = 1, 2. Ta có A1 , A2 độc lập.


a. Theo giả thiết:
P (A1 Ā2 ∪ Ā1 A2 ) = P (A1 Ā2 ) + P (Ā1 A2 )
= 0, 1 ∗ [1 − P (A2 )] + 0, 9P (A2 ) = 0, 1 + 0, 8P (A2 ) = 0, 26.
Suy ra: P (A2 ) = 0, 2.
P (A1 (A1 ∪ A2 )) P (A1 )
b. P (A1 |A1 ∪ A2 ) = =
P (A1 ∪ A2 ) P (A1 ∪ A2 )
P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 A2 ) = 0, 1 + 0, 2 − 0, 1 ∗ 0, 2 = 0, 28
0, 1 5
⇒ P (A1 |A1 ∪ A2 ) = =
0, 28 14

Tôn Thất Tú - 2021 Chương 1: Xác suất 35/51

7. Công thức xác suất toàn phần và công thức Bayes


Định nghĩa: Nhóm biến cố Hi , i = 1, n được gọi là đầy đủ nếu thỏa mãn 2 điều kiện:
n
i) Hi ∩ Hj = ∅, ∀i 6= j ii)
S
Hi = Ω
i=1

Ví dụ 24
a. {∅, Ω}, {A, A }, {AB, AB̄, ĀB, ĀB̄} là các nhóm biến cố đầy đủ.
b. Một hộp có 3 bi đỏ và 2 bi xanh. Lấy ngẫu nhiên 2 viên bi. Gọi Hi là biến cố lấy
được i bi xanh, i = 0, 1, 2. Ta có {H0 , H1 , H2 } là nhóm đầy đủ.

Định lý: (Công thức xác suất đầy đủ )


Cho Hi , i = 1, n là một nhóm biến cố đầy đủ và P (Hi ) > 0. Khi đó với biến cố A bất
kì liên quan đến phép thử, ta luôn có:
n
X
P (A) = P (Hi ).P (A|Hi )
i=1

Tôn Thất Tú - 2021 Chương 1: Xác suất 36/51


Công thức trên được gọi là công thức xác suất đầy đủ ( hay công thức xác suất toàn
phần).
Nói riêng, ta có P (B) = P (A).P (B|A) + P (A).(B|A) với 0 < P (A) < 1 .

Ví dụ 25
Có 2 lô sản phẩm. Lô 1 có 50 sản phẩm trong đó có 20 sản phẩm xấu. Lô 2 có 40 sản
phẩm, trong đó có 15 sản phẩm xấu. Lấy ngẫu nhiên một lô và từ đó lấy ra 1 sản phẩm.
Tìm xác suất để sản phẩm lấy ra là sản phẩm tốt.

Giải. Gọi Hi là chọn lô sản phẩm i, i = 1, 2. Gọi A là biến cố sản phẩm lấy ra là sản
phẩm tốt.
Ta có {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần:

P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 1/2 ∗ 30/50 + 1/2 ∗ 25/40 = 49/80

Tôn Thất Tú - 2021 Chương 1: Xác suất 37/51

Ví dụ 26
Một nhóm có 3 người nhưng chỉ có 2 vé xem bóng đá. Để chia vé họ làm như sau: Lấy
3 phiếu, 2 phiếu ghi số 1 và 1 phiếu ghi số 0. Sau đó thay phiên nhau bốc ngẫu nhiên
lần lượt không hoàn lại. Ai được phiếu ghi số 1 thì được vé.
a. Tính xác suất người thứ 2 được vé.
b. Hỏi việc bốc phiếu đó có công bằng hay không ?

Giải. Gọi Ai là biến cố người rút thứ i được vé,i = 1, 2, 3.


a. Ta có {A1 , Ā1 } là nhóm đầy đủ. Do đó:

P (A2 ) = P (A1 )P (A2 |A1 ) + P (Ā1 )P (A2 |Ā1 ) = 2/3 ∗ 1/2 + 1/3 ∗ 2/2 = 2/3

b. Ta có P (A1 ) = P (A2 ) = 2/3, cần tính P (A3 ). Mặt khác,

P (A3 ) = 1 − P (Ā3 ) = 1 − P (A1 A2 ) = 1 − P (A1 )P (A2 |A1 ) = 1 − 2/3 ∗ 1/2 = 2/3

Vậy, việc làm trên là công bằng.


Tôn Thất Tú - 2021 Chương 1: Xác suất 38/51

Ý nghĩa công thức xác suất toàn phần


Công thức xác suất toàn phần giúp ta tính xác suất xảy ra của một biến cố dựa vào
một nhóm đầy đủ các giả thiết chi phối nó.

Định lý (Công thức Bayes)


Cho A là một biến cố và P (A) > 0, {H1 , ..., Hn } là một nhóm biến cố đầy đủ. Lúc đó,
ta có công thức:

P (Hi ).P (A|Hi ) P (Hi ).P (A|Hi )


P (Hi |A) = = n , i = 1, n
P (A) P
P (Hj ).P (A|Hj )
j=1

Tôn Thất Tú - 2021 Chương 1: Xác suất 39/51


Ví dụ 27
Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15. Do có nhiễu
trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B; còn 1/8 tín
hiệu B bị méo và thu được như A.
a. Tìm xác suất thu được tín hiệu A.
b. Giả sử đã thu được tín hiệu A. Tìm xác suất thu được đúng tín hiệu lúc phát.

Giải. Gọi HA , HB là biến cố trạm phát tín hiệu A, B. Gọi A là biến cố trạm thu được
tín hiệu A.
a. Ta có: {HA , HB } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần:

P (A) = P (HA )P (A|HA ) + P (HB )P (A|HB ) = 0, 85 ∗ (1 − 1/7) + 0, 15 ∗ 1/8 = 0, 747

b. Theo công thức Bayes:

P (HA )P (A|HA ) 0, 85 ∗ (1 − 1/7)


P (HA |A) = = = 0, 975
P (A) 0, 747

Tôn Thất Tú - 2021 Chương 1: Xác suất 40/51

Ví dụ 28
Một cửa hàng bán bóng đèn cùng loại do 3 cơ sở sản xuất cung cấp. Cơ sở I, II, III
cung cấp lượng hàng tương ứng là 40%, 35%, 25%. Biết tỉ lệ bóng hỏng do cơ sở I, II,
III sản xuất lần lượt là 2%, 2%, 3%. Ta mua ngẫu nhiên 1 bóng của cửa hàng. Giả sử
bóng mua bị hỏng. Hỏi bóng ta mua có khả năng do cơ sở nào sản xuất nhất ?

Giải. Gọi Hi là biến cố bóng được mua do cơ sở i sản xuất, i = 1, 2, 3. Gọi A là biến
cố bóng được mua bị hỏng.
Ta có: {H1 , H2 , H3 } là nhóm biến cố đầy đủ. Theo công thức xác suất toàn phần:

P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) + P (H3 )P (A|H3 )


= 0, 4 ∗ 0, 02 + 0, 35 ∗ 0, 02 + 0, 25 ∗ 0, 03 = 0.0225
P (H1 )P (A|H1 ) 0, 4 ∗ 0, 02
Theo công thức Bayes: P (H1 |A) = = = 0.356
P (A) 0.0225
Tương tự: P (H2 |A) = 0.311, P (H3 |A) = 0.333
Vì P (H1 |A) > P (H3 |A) > P (H2 |A) nên khả năng bóng được mua do cơ sở 1 sản xuất
là lớn nhất.
Tôn Thất Tú - 2021 Chương 1: Xác suất 41/51

Ý nghĩa công thức Bayes


Các xác suất P (H1 ), ..., P (Hn ) được xác định trước khi phép thử tiến hành và do đo
chúng được gọi là các xác suất tiên nghiệm. Các xác suất P (H1 |A), ..., P (Hn |A) được
xác định sau khi phép thử được tiến hành và biến cố A đã xảy ra và do do chúng được
gọi là các xác suất hậu nghiệm. Vì thế công thức Bayes còn được gọi là công thức tính
xác suất hậu nghiệm.
* Công thức Bayes cho phép đánh giá lại xác suất xảy ra của các giả thiết sau khi đã
biết kết quả của phép thử là biến cố A đã xảy ra.

Tôn Thất Tú - 2021 Chương 1: Xác suất 42/51


Ví dụ 29
Tỉ lệ người dân ở tỉnh A nghiện thuốc lá là 30%, trong số người nghiện thuốc tỉ lệ người
bị bệnh phổi là 60%. Trong số những người không nghiện thuốc có 20% bị bệnh phổi.
Chọn ngẫu nhiên một người. Tính xác suất người đó nghiện thuốc trong hai trường hợp.
a) Biết người đó bị bệnh phổi.
b) Biết người đó không bị bệnh phổi.

Giải. Gọi H1 , H2 là các biến cố người được chọn hút và không hút thuốc lá. Gọi A là
biến cố người được chọn bị bệnh phổi.
Ta có: {H1 , H2 } là nhóm đầy đủ. Theo công thức xác suất toàn phần:

P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = 0, 3 ∗ 0, 6 + 0, 7 ∗ 0, 2 = 0, 32

P (H1 )P (A|H1 ) 0, 3 ∗ 0, 6
a. P (H1 |A) = = = 9/16
P (A) 0, 32
P (H1 )P (Ā|H1 ) 0, 3 ∗ (1 − 0, 6)
b. P (H1 |Ā) = = = 3/17
P (Ā) 1 − 0, 32
Tôn Thất Tú - 2021 Chương 1: Xác suất 43/51

Ví dụ 30
Một máy bay bắn độc lập 2 quả tên lửa vào một mục tiêu. Xác suất quả thứ nhất và
thứ 2 trúng là 0,6 và 0,7. Nếu có 1 quả trúng thì mục tiêu bị tiêu diệt với xác suất 0,7
và nếu có 2 quả trúng thì xác suất này là 0,9.
a) Tính xác suất có ít nhất 1 quả trúng. b) Tính xác suất mục tiêu bị tiêu diệt.
c) Biết mục tiêu bị tiêu diệt, tính xác suất cả 2 quả đều trúng.

Giải. Gọi Ai là biến cố quả tên lửa thứ i trúng mục tiêu, i = 1, 2. Ta có A1 , A2 độc lập.
a. P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 A2 ) = 0, 6 + 0, 7 − 0, 6 ∗ 0, 7 = 0, 88
b. Gọi Hi là biến cố có i quả tên lửa trúng, i = 0, 1, 2, và A là biến cố mục tiêu bị tiêu diệt. Ta
có {H0 , H1 , H2 } là nhóm đầy đủ.
P (H0 ) = P (Ā1 Ā2 ) = 0, 4 ∗ 0, 3 = 0, 12; P (H1 ) = P (A1 Ā2 ∪ Ā1 A2 ) = 0, 6 ∗ 0, 3 + 0, 4 ∗ 0, 7 =
0, 46; P (H2 ) = P (A1 A2 ) = 0, 6 ∗ 0, 7 = 0, 42.
Theo công thức xác suất toàn phần:
P (A) = P (H0 )P (A|H0 ) + P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )
= 0, 12 ∗ 0 + 0, 46 ∗ 0, 7 + 0, 42 ∗ 0, 9 = 0, 7
P (H2 )P (A|H2 ) 0, 42 ∗ 0, 9
c. P (H2 |A) = = = 0, 54
P (A) 0, 7
Tôn Thất Tú - 2021 Chương 1: Xác suất 44/51

Ví dụ 31
Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có
đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là p(%). Thiết bị có khả năng
phát hiện đúng sản phẩm là phế phẩm với xác suất α và phát hiện đúng sản phẩm đạt
chất lượng với xác suất β. Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho
sản phẩm này:
a. Được kết luận là phế phẩm.
b. Được kết luận là đạt chất lượng thì lại là phế phẩm.
c. Được kết luận đúng với thực chất của nó.

Gợi ý. Gọi H1 , H2 là biến cố sản phẩm được chọn là chính phẩm, phế phẩm. Gọi A
là biến cố được kết luận là phế phẩm. Ta có {H1 , H2 } là nhóm đầy đủ, P (H2 ) =
p, P (A|H2 ) = α, P (Ā|H1 ) = β.
a. P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 ) = (1 − p)(1 − β) + pα
b. P (H1 |A)
c. P (AH2 ) + P (ĀH1 )

Tôn Thất Tú - 2021 Chương 1: Xác suất 45/51


8. Dãy phép thử Bernoulli

Định nghĩa
Dãy n phép thử được gọi là dãy n phép thử Bernoulli nếu thỏa mãn các điều kiện sau:
- Các phép thử độc lập
- Trong mỗi phép thử chỉ xảy ra một trong hai biến cố, kí hiệu A (thành công) và Ā
(thất bại).
- Xác suất xuất hiện biến cố A là p = P (A) không đổi trong các phép thử.

Công thức xác suất nhị thức


Kí hiệu pn (k) là xác suất có đúng k lần xuất hiện biến cố A trong dãy n phép thử
Bernoulli. Khi đó:
pn (k) = Cnk pk (1 − p)n−k , k = 0, n.
Công thức trên còn được gọi là công thức Bernoulli.

Tôn Thất Tú - 2021 Chương 1: Xác suất 46/51

Ví dụ 32
Xác suất để 1 quả trứng đem ấp nở ra gà con là 0.85. Đem ấp 10 quả trứng. Tính xác
suất để có đúng 8 quả nở ra gà con.

Giải. Ta có mô hình dãy phép thử Bernoulli với n = 10; p = 0, 85.


Xác suất có đúng 8 quả nở ra gà con:
8
p10 (8) = C10 0, 858 0, 152

Ví dụ 33
Tín hiệu thông tin được phát đi 3 lần độc lập nhau. Xác suất thu được mỗi lần là 0.4.
a) Tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần.
b) Tìm xác suất để nguồn thu nhận được thông tin đó.
c) Nếu muốn xác suất thu được tin ≥ 0.99 thì phải phát đi ít nhất bao nhiêu lần.

Tôn Thất Tú - 2021 Chương 1: Xác suất 47/51

Giải.
Ta có mô hình dãy phép thử Bernoulli với n = 3; p = 0, 4.
a. Xác suất để nguồn thu nhận được thông tin đúng 2 lần:

p3 (2) = C32 0, 42 0, 61

b. Xác suất để nguồn thu nhận được thông tin đó:

p3 (k ≥ 1) = 1 − p3 (0) = 1 − C30 0, 40 0, 63

c. Gọi n là số tín hiệu cần phát đi. Theo giả thiết:

pn (k ≥ 1) ≥ 0, 99 ⇔ 1 − pn (0) ≥ 0, 99

ln(0, 01)
⇔ Cn0 0, 40 0, 6n ≤ 0, 01 ⇔ n ≥ = 9, 015
ln(0, 6)
Vậy, n = 10.
Tôn Thất Tú - 2021 Chương 1: Xác suất 48/51
Ví dụ 34
Trên giá có 4 cây súng loại 1 và 6 cây súng loại 2. Một xạ thủ chọn ngẫu nhiên 1 cây
súng và bắn 5 phát độc lập. Biết xác suất bắn trúng khi sử dụng súng loại 1 và 2 lần
lượt là 0,6 và 0,3. Tính xác suất có đúng 2 viên đạn trúng đích.

Giải. Gọi Hi là biến cố xạ thủ chọn được súng loại i, i = 1, 2 và A là biến cố xạ thủ
bắn trúng 2 viên. Ta có {H1 , H2 } là nhóm đầy đủ.
Theo công thức xác suất toàn phần:

P (A) = P (H1 )P (A|H1 ) + P (H2 )P (A|H2 )

trong đó:
P (H1 ) = 4/10 = 0, 4; P (H2 ) = 6/10 = 0, 6

P (A|H1 ) = p5 (2) = C52 0, 62 0, 43 ; P (A|H2 ) = p5 (2) = C52 0, 32 0, 73

Tôn Thất Tú - 2021 Chương 1: Xác suất 49/51

Ví dụ 35
Trong năm học vừa qua, ở trường đại học, tỉ lệ sinh viên thi trượt môn Toán là 34%, thi
trượt môn Lý là 20%, và trong số các sinh viên trượt môn Toán, có 50% sinh viên trượt
môn Lý. Phải chọn bao nhiêu sinh viên của trường này sao cho, với xác suất không bé
hơn 99%, trong số đó có ít nhất một sinh viên đậu cả hai môn Toán và Lý.

Giải. Gọi T, L là các biến cố sinh thi trượt môn Toán, Lý tương ứng. Ta có:
P (T ) = 0, 34; P (L) = 0, 2; P (L|T ) = 0, 5
Xác suất thi đậu cả 2 môn:
P (T̄ L̄) = 1 − P (T ∪ L) = 1 − [P (T ) + P (L) − P (T L)]
= 1 − P (T ) − P (L) + P (T )P (L|T ) = 1 − 0, 34 − 0, 2 + 0, 34 ∗ 0, 5 = 0, 63

Gọi n là số sinh viên cần khảo sát. Ta có mô hình Bernoulli với n phép thử và xác suất
p = 0, 63. Theo giả thiết:
pn (k ≥ 1) = 1 − pn (0) ≥ 0, 99 ⇔ (1 − 0, 63)n ≤ 0, 01 ⇔ n ≥ 4, 63 ⇒ n = 5
Tôn Thất Tú - 2021 Chương 1: Xác suất 50/51

Số lần có khả năng lớn nhất


Bài toán: Tìm k sao cho xác suất pn (k) đạt giá trị lớn nhất.
Kết quả: Đặt q = 1 − p và gọi K là giá trị cần tìm. Khi đó K là số nguyên thỏa điều
kiện:
np − q ≤ K ≤ np − q + 1

Ví dụ 36
Một xưởng dệt có 50 máy dệt. Xác suất mỗi máy dệt bị hỏng trong mỗi ca làm việc là
0.1. Tìm số máy hỏng với khả năng lớn nhất trong 1 ca làm việc.

Giải. Gọi K là số máy hỏng với khả năng lớn nhất. Ta có mô hình Bernoulli với n =
50; p = 0, 1.
Lại có: q = 1 − p = 0, 9. Giá trị K thỏa điều kiện:

np − q ≤ K ≤ np − q + 1 ⇔ 4, 1 ≤ K ≤ 5, 1

Vậy, K = 5.
Tôn Thất Tú - 2021 Chương 1: Xác suất 51/51
XÁC SUẤT THỐNG KÊ
Tôn Thất Tú

Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 1/88

Chương 2. Biến ngẫu nhiên


1. Định nghĩa
- Biến ngẫu nhiên X là một đại lượng có thể nhận giá trị này hay giá trị khác phụ thuộc
vào kết quả của phép thử ngẫu nhiên.
- Tập hợp tất cả các giá trị mà biến ngẫu nhiên X có thể nhận được được gọi là tập
(miền) giá trị của X, kí hiệu X(Ω).
- Về mặt toán học: Cho không gian xác suất (Ω, F, P ). Hàm X xác định trên không
gian mẫu Ω và nhận giá trị trong R được gọi là biến ngẫu nhiên nếu với mọi x ∈ R, tập
hợp các kết quả {ω : X(ω) < x} lập thành một biến cố ngẫu nhiên.
Ví dụ 1
- Gieo ngẫu nhiên 3 lần một đồng xu. Gọi X là số lần mặt sấp xuất hiện. Khi đó X là
một biến ngẫu nhiên nhận các giá trị 0, 1, 2 và 3.
- Gọi Y là số người đến đổ xăng ở cửa hàng AB trong một ngày. Khi đó Y là biến ngẫu
nhiên nhận các giá trị 0, 1, 2,. . . .
- Gọi Z là nhiệt độ trung bình trong một ngày (đơn vị: độ C). Khi đó Z là biến ngẫu
nhiên nhận các giá trị trong khoảng (−∞, +∞).
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 2/88

Phân loại
- BNN rời rạc: BNN có tập giá trị có số lượng hữu hạn hoặc vô hạn đếm được.
- BNN liên tục: BNN thỏa các điều kiện sau:
+ tập giá trị tạo thành 1 đoạn, khoảng hoặc hợp các đoạn, khoảng.
+ Với mọi c ta có P (X = c) = 0.
Chẳng hạn ở Ví dụ 1, X, Y là các BNN rời rạc, còn Z là BNN liên tục.

2. Hàm phân phối


Định nghĩa: Hàm số thực FX (x) = P (X < x), x ∈ R được gọi là hàm phân phối của
biến ngẫu nhiên X.
Nhận xét: Hàm phân phối FX (x) chính là xác suất X nhận giá trị trong khoảng
(−∞, x).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 3/88


Tính chất:
i) 0 ≤ FX (x) ≤ 1, ∀x ∈ R
ii) FX (x) đơn điệu không giảm với mọi x ∈ R
iii) FX (x) liên tục trái với mọi x, tức là

lim FX (x) = FX (x0 ), ∀x0 ∈ R


x→x−
0

iv) lim FX (x) = 1, lim FX (x) = 0


x→+∞ x→−∞

Nhận xét:
i) P (X ≥ a) = 1 − F (a)
ii) P (a ≤ X < b) = F (b) − F (a)

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 4/88

Ví dụ 2
Cho biến ngẫu nhiên X có hàm phân phối

F (x) = a + b. arctan x, x ∈ R

a) Tìm a và b.
b) Tìm x sao cho: P (X ≥ 1 − x) = 1/4

Giải. a. Ta có:

 lim F (x) = 1
( (
 bπ
x→+∞ a+ 2 =1 a = 1/2
⇔ bπ

 lim F (x) = 0
x→−∞ a− 2 =0 b = 1/π

b. P (X
 ≥ 1 − x) = 1 − P (X < 1− x) = 1 − F (1 − x)
= 1 − 1/2 + 1/π ∗ arctan(1 − x) = 1/2 − 1/π ∗ arctan(1 − x) = 1/4.
Từ đó: arctan(1 − x) = π/4 hay x = 0.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 5/88

Ví dụ 3
Cho biến ngẫu nhiên X có hàm phân phối

 0, x<0


F (x) = 2
ax + b, 0 ≤ x < 2

 1,

x≥2

a) Tìm a và b.
b) Tìm hàm phân phối của Y = 2X + 1.

Giải. a. Vì F (x) liên tục trái nên



 lim F (x) = F (0)
 ( (
x→0− 0=b a = 1/4
⇔ ⇔
 lim− F (x) = F (2)
 4a + b = 1 b=0
x→2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 6/88


b. Theo định nghĩa:
FY (y) = P (Y < y) = P (2X + 1 < y)
=P (X < (y − 1)/2) = F ((y − 1)/2)
0,
 (y − 1)/2 < 0

= 1/4 ∗ [(y − 1)/2]2 , 0 ≤ (y − 1)/2 < 2

1,

(y − 1)/2 ≥ 2

0, y<1


2
= 1/16 ∗ (y − 1) , 1 ≤ y < 5

1,

y≥5

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 7/88

3. Biến ngẫu nhiên rời rạc


Cho X là biến ngẫu nhiên rời rạc với tập giá trị X(Ω). Khi đó, hàm
(
P (X = x), x ∈ X(Ω),
p(x) =
0, x∈/ X(Ω),

được gọi là hàm khối xác suất (probability mass function).


Trong trường hợp X(Ω) = {x1 , ..., xn } hữu hạn và pi = P (X = xi ), ta có bảng phân
phối xác suất:

X x1 x2 ... xn
P p1 p2 ... pn

Nhận xét: i)
P
pi = 1
ii) Hàm phân phối của X sẽ là
X
FX (x) = P (X < x) = P (X = xi )
xi <x
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 8/88

Ví dụ 4
Một lô sản phẩm có 12 sản phẩm, trong đó có 8 chính phẩm và 4 phế phẩm. Lấy ngẫu
nhiên 2 sản phẩm. Gọi X là số chính phẩm trong 2 sản phẩm lấy ra. Tìm phân phối của
X, xác định hàm phân phối và tính xác suất P (1 ≤ X < 3).

Giải. Ta có X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1, 2.
P (X = 0) = C42 /C12
2
= 1/11

P (X = 1) = C81 C41 /C12


2
= 16/33

P (X = 2) = C82 /C12
2
= 14/33
Bảng phân phối xác suất:

X 0 1 2
P 1/11 16/33 14/33
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 9/88
Bảng phân phối xác suất:

X 0 1 2
P 1/11 16/33 14/33

Hàm phân phối: X


FX (x) = P (X < x) = P (X = xi )
xi <x
 


 0, x≤0 0,

 x≤0

1/11, 
0<x≤1 1/11, 0<x≤1
= =


 1/11 + 16/33, 1<x≤2 

 19/33, 1<x≤2

1/11 + 16/33 + 14/33, 
x>2  1, x>2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 10/88

Hình 1. Đồ thị hàm phân phối

Xác suất: P (1 ≤ X < 3) = P (X = 1) + P (X = 2) = 16/33 + 14/33 = 10/11.


Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 11/88

Ví dụ 5
Một xạ thủ có 4 viên đạn, xạ thủ đó bắn từng phát độc lập cho đến khi có phát trúng
hoặc hết đạn thì thôi. Gọi X là số viên đạn đã bắn. Lập bảng phân phối xác suất và
tìm hàm phân phối của X, biết rằng xác suất bắn trúng mỗi lần đều bằng 0,7.

Giải. Ta có X là biến ngẫu nhiên nhận các giá trị:1,2,3,4.


Gọi Ai là biến cố viên đạn thứ i trúng đích, i = 1, 2, 3, 4. Ta có các biến cố Ai độc lập.
P (X = 1) = P (A1 ) = 0, 7; P (X = 2) = P (Ā1 A2 ) = 0, 3 ∗ 0, 7 = 0, 21
P (X = 3) = P (Ā1 Ā2 A3 ) = 0, 3 ∗ 0, 3 ∗ 0, 7 = 0, 063
P (X = 4) = P (Ā1 Ā2 Ā3 ) = 0, 3 ∗ 0, 3 ∗ 0, 3 = 0, 027
Bảng phân phối xác suất và hàm phân phối:



 0, x≤1
0, 7, 1<x≤2

1 2 3 4

X

P
FX (x) = P (X = xi ) = 0, 91, 2<x≤3
P 0,7 0,21 0,063 0,027 xi <x 
0, 973, 3<x≤4





1, x>4
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 12/88
Ví dụ 6
Cho 2 hộp chứa bi. Hộp 1 chứa 2T và 8Đ. Hộp 2 chứa 3T và 6Đ. Lấy ngẫu nhiên 1
viên từ hộp 1 chuyển sang hộp 2, sau đó từ hộp 2 lấy ngẫu nhiên 1 viên. Gọi X là số bi
trắng lần 2 lấy được. Lập bảng phân phối xác suất của X.

Giải. Gọi H1 , H2 là biến cố lần 1 lấy bi trắng, đen. Ta có {H1 , H2 } là nhóm đầy đủ.
Từ giả thiết, X là biến ngẫu nhiên rời rạc nhận các giá trị: 0, 1.
P (X = 0) = P (H1 )P (X = 0|H1 ) + P (H2 )P (X = 0|H2 )
= 2/10 ∗ 6/10 + 8/10 ∗ 7/10 = 0, 68
P (X = 1) = P (H1 )P (X = 1|H1 ) + P (H2 )P (X = 1|H2 )
= 2/10 ∗ 4/10 + 8/10 ∗ 3/10 = 0, 32
Bảng phân phối xác suất:

X 0 1
P 0,68 0,32

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 13/88

4. Biến ngẫu nhiên liên tục


Cho biến ngẫu nhiên liên tục X với hàm phân phối FX (x). Khi đó tồn tại hàm f (x)
sao cho ta có biểu diễn:
Zx
FX (x) = f (t)dt, x ∈ R
−∞

Hàm f (x) được gọi là hàm mật độ của X.


Tính chất của hàm mật độ:
+∞
i) f (x) ≥ 0 ii) f (x)dx = 1 iii) f (x) = FX′ (x)
R
−∞
Ngược lại, một hàm số thực f (x) thỏa 2 điều kiện i) và ii) ở trên thì nó là hàm mật
độ của một biến ngẫu nhiên nào đó.
Nhận xét: i) P (X = c) = 0 với mọi hằng số c
Rb
ii) P (a ≤ X ≤ b) = . . . = P (a < X < b) = FX (b) − FX (a) = f (x)dx
Rx a
iii) Nếu f (x) là hàm mật độ thì hàm phân phối: FX (x) = −∞ f (t)dt.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 14/88

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 15/88


Ví dụ 7
Tuổi thọ (năm) của một thiết bị là biến ngẫu nhiên X có hàm mật độ:
(
0.6e−0.6x , x > 0
f (x) =
0, x≤0

Chọn ngẫu nhiên 1 thiết bị. Tính xác suất tuổi thọ của thiết bị này:
a) Nhỏ hơn 1 năm. b) Lớn hơn 2 năm.

Giải. a. Xác suất tuổi thọ thiết bị này nhỏ hơn 1 năm:
Z 1 Z 1
P (0 < X < 1) = f (x)dx = 0, 6e−0,6x dx = 1 − e−0,6
0 0

b. Xác suất tuổi thọ thiết bị này lớn hơn 2 năm:


Z +∞ Z +∞ +∞
P (X > 2) = f (x)dx = 0, 6e−0,6x dx = −e−0,6x = e−1,2

2 2 2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 16/88

Ví dụ 8
Cho X là biến ngẫu nhiên liên tục có hàm mật độ
(
a x, x ∈ [0, 1]
f (x) =
0, x ∈ / [0, 1]

a) Tìm hệ số a và hàm phân phối FX (x).


b) Thực hiện 10 phép thử độc lập. Tính xác suất có 3 lần xảy ra biến cố (1/2 < X < 1).

Giải. a. Theo tính chất:


R +∞ R1 a
−∞ f (x)dx = 0 axdx = 2 = 1 ⇔ a = 2.
Hàm phân phối:
R
x
R−∞ 0dt, R x<0

x
Z 
0 x
FX (x) = f (t)dt = −∞ 0dt + R0 2tdt, R x ∈ [0, 1]
−∞  0
 R 1 x
−∞ 0dt + 0 2tdt + 1 0dt, x>1

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 17/88


0, x<0


FX (x) = x2 , x ∈ [0, 1]

1,

x>1

b. Ta có mô hình Bernoulli với n = 10 và p = P (1/2 < X < 1).


Z 1 Z 1
p= f (x)dx = 2xdx = 3/4
1/2 1/2

Xác suất cần tìm:  3   7


3 3 1
p10 (3) = C10
4 4

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 18/88


Ví dụ 9
Cho biến ngẫu nhiên liên tục X có hàm phân phối:
(
1 − a/x3 , x ≥ 2,
F (x) =
0, x<2

a. Tìm a, hàm mật độ f (x). b. Tìm x thỏa P (X > x) = 1/4.

Giải. a. Vì F (x) liên tục trái tại x = 2 nên:

lim F (x) = F (2) ⇔ 1 − a/8 = 0 ⇔ a = 8


x→2−

Hàm mật độ: (


24/x4 , x ≥ 2,
f (x) = F ′ (x) =
0, x<2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 19/88

b. Ta có:

P (X > x) = 1 − P (X ≤ x) = 1 − F (x) = 1/4 ⇔ F (x) = 3/4

(
1 − 8/x3 = 3/4, √
3
⇔ ⇔x=2 4
x≥2

5. Sự độc lập của các biến ngẫu nhiên


- Hai biến ngẫu nhiên X và Y được gọi là độc lập nếu các biến cố (X < a) và (Y < b)
độc lập với mọi cặp giá trị (a, b), tức là:

P (X < a, Y < b) = P (X < a)P (Y < b)

- Nhóm n biến ngẫu nhiên {X1 , X2 , ..., Xn } được gọi là độc lập nếu các biến cố (X1 <
a1 ), ...., (Xn < an ) độc lập với mọi bộ giá trị (a1 , a2 , ..., an ).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 20/88

6. Các số đặc trưng

a. Kỳ vọng toán
Định nghĩa: Kỳ vọng toán của biến ngẫu nhiên X, kí hiệu E(X), là một số được xác
định như sau:
- Nếu X có phân phối rời rạc với phân phối xác suất P (X = xk ) = pk , k = 1, 2, ... thì
+∞
X
E(X) = x i pi
i=1

- Nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x) thì
+∞
Z
E(X) = x f (x)dx
−∞

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 21/88


+∞ +∞
Trong trường hợp |xi |pi hoặc |x| fX (x)dx phân kì thì ta nói biến ngẫu nhiên X
P R
i=1 −∞
không có kỳ vọng.
Tính chất:
i) E(c) = c với c là hằng số.
ii) E(cX) = cE(X) với c là hằng số.
iii) E(X ± Y ) = E(X) ± E(Y ) với mọi biến ngẫu nhiên X, Y .
iv) E(XY ) = E(X).E(Y ) nếu X, Y độc lập.

Ví dụ 10
Tính kỳ vọng của biến ngẫu nhiên X trong hai trường hợp sau:
a. X có phân phối rời rạc với bảng phân phối xác suất:

X 1 2 3
P 0,2 0,7 0,1

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 22/88

b. Khi X có phân phối liên tục với hàm mật độ:


(
sin x, x ∈ [0, π/2]
f (x) =
0, x∈/ [0, π/2]

Giải.
a. E(X) = i pi xi = 0, 2 ∗ 1 + 0, 7 ∗ 2 + 0, 1 ∗ 3 = 1, 9
P
b. Ta có:
+∞
Z Z π/2 Z π/2
E(X) = x f (x)dx = x sin xdx = xd(− cos x)
0 0
−∞

π/2
Z π/2
= −x cos x 0 + cos xdx = 1
0

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 23/88

Nhận xét:
i) Kì vọng của biến ngẫu nhiên thể hiện giá trị trung bình của biến ngẫu nhiên đó, tức
là khi thực hiện một số lớn lần các phép thử thì giá trị trung bình thu được của các kết
quả sẽ xấp xỉ với kì vọng.
ii) Xét trò chơi may rủi với số tiền đặt cược trong mỗi ván không đổi. Trò chơi được
gọi là công bằng (có lợi hay có hại) đối với người chơi nếu kỳ vọng số tiền nhận được
trong mỗi lần chơi bằng (lớn hơn hay bé hơn) số tiền đặt cược trong mỗi ván chơi.
iii) Nếu g(x) là hàm liên tục thì g(X) cũng là biến ngẫu nhiên và kì vọng của nó được
tính là:
+∞
g(xi ).pi nếu X là biến ngẫu nhiên rời rạc.
P
• Eg(X) =
i=1
+∞
g(x) fX (x)dx nếu X là biến ngẫu nhiên liên tục với hàm mật độ f (x).
R
• Eg(X) =
−∞

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 24/88


Ví dụ 11
Trong hộp có 7 bút xanh và 3 bút đỏ. Một sinh viên rút ngẫu nhiên 2 bút để mua. Giá
bút xanh và đỏ lần lượt 2000 đồng và 3000 đồng. Tìm số tiền trung bình sinh viên này
phải trả.

Giải. Gọi X (ngàn đồng) là số tiền sinh viên này phải trả. Ta có X nhận các giá trị: 4,
5 và 6.
P (X = 4) = C72 /C10
2 = 7/15
1 1 2 = 7/15
P (X = 5) = C7 C3 /C10
P (X = 6) = C32 /C10
2 = 1/15

Bảng phân phối xác suất của X:

X 4 5 6
P 7/15 7/15 1/15

Số tiền trung bình phải trả:


X
E(X) = pi xi = 7/15 ∗ 4 + 7/15 ∗ 5 + 1/15 ∗ 6 = 4, 6(ngàn đồng)
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 25/88

Ví dụ 12
Thời gian xếp hàng chờ mua hàng của khách hàng là 1 biến ngẫu nhiên T (phút) có
hàm mật độ: (
a.t3 , t ∈ [0, 3]
f (t) =
0, t∈/ [0, 3]
Tìm a và tính thời gian chờ trung bình của khách hàng.

Giải. Theo tính chất của hàm mật độ:


Z +∞ Z 3
f (t)dt = at3 dt = 81a/4 = 1 ⇔ a = 4/81
−∞ 0

Thời gian chờ trung bình của khách hàng:


Z +∞ 3
4 3
Z
E(T ) = tf (t)dt = t∗ t dt = 2, 4(phút)
−∞ 0 81

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 26/88

Ví dụ 13
Một người tham gia trò chơi may rủi với tiền cược mỗi ván là 10000 đồng. Người này
tung ngẫu nhiên 2 đồng xu, nếu được i mặt sấp người này thu về (i + 1) ∗ 5000 đồng,
i = 1, 2. Ngược lại, người này sẽ mất tiền. Hỏi người này có nên chơi trò này thường
xuyên hay không?

Giải. Gọi X (ngàn đồng) là số tiền người này nhận được trong 1 lần chơi. Ta có X
nhận các giá trị: 0, 10 và 15. Bảng phân phối của X:

X 0 10 15
P 1/4 1/2 1/4

Do đó: E(X) = pi xi = 8, 75 (ngàn đồng). Vì số tiền này nhỏ hơn số tiền đặt cược
P
nên nếu người này chơi càng nhiều thì thua càng lớn.
Vậy, người này không nên chơi trò này thường xuyên.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 27/88


b. Phương sai
Định nghĩa: Giả sử biến ngẫu nhiên X có kỳ vọng EX. Nếu tồn tại kỳ vọng
E(X − EX)2 thì ta gọi giá trị này là phương sai của X, kí hiệu là DX (hay
V ar(X), V (X)), tức là:
DX = E(X − EX)2

Giá trị σ(X) = DX được gọi là độ lệch chuẩn.
Tính chất:
i) D(c) = 0 với c là hằng số
ii) D(cX) = c2 D(X) với c là hằng số
iii) DX = E(X 2 ) − (EX)2
iv) D(X ± Y ) = D(X) + D(Y ) với X, Y độc lập

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 28/88

Nhận xét: Trong thực hành, ta hay sử dụng công thức sau: D(X) = E(X 2 ) − (EX)2 ,
trong đó:
P
 pi x2i ,
 nếu X là biến ngẫu nhiên rời rạc
2
E(X ) = +∞
x f (x)dx, nếu X là biến ngẫu nhiên liên tục
R 2


−∞

Ý nghĩa:
- Phương sai cũng như độ lệch chuẩn là đại lượng đặc trưng cho mức độ tập trung của
các giá trị của biến ngẫu nhiên X quanh kỳ vọng EX. Phương sai càng lớn thì các giá
trị khuếch tán càng xa so với kỳ vọng.
- Trong kỹ thuật phương sai đặc trưng cho sai số của các thiết bị hoặc của các phép
đo. Trong quản lý và kinh doanh, nó đặc trưng cho mức độ rủi ro của các quyết định.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 29/88

Ví dụ 14
Cho biến ngẫu nhiên X có phân phối

X 1 2 a
P b 0.3 0.5

a. Tìm a và b, biết E(X) = 2, 3. b. Tính D(2X − 3), D(X 2 )

Giải. a. Ta có hệ:
(P ( (
pi = 1 b + 0, 3 + 0, 5 = 1 a=3
P ⇔ ⇔
E(X) = pi xi = 2, 3 b + 0, 6 + 0, 5a = 2, 3 b = 0, 2

b. Ta có:
D(2X − 3) = D(2X) + D(3) = 4D(X) = 4[E(X 2 ) − (E(X))2 ] = 4[E(X 2 ) − 5, 29]
E(X 2 ) = pi x2i = 0, 2 ∗ 12 + 0, 3 ∗ 22 + 0, 5 ∗ 32 = 5, 9
P
D(2X − 3) = 4(5, 9 − 5, 29) = 2, 44
Tương tự: D(X 2 ) = E(X 4 ) − (E(X 2 ))2 = pi x4i − 5, 92 = 10, 69
P

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 30/88


Ví dụ 15
Một nhà đầu tư đang cân nhắc giữa việc đầu tư vào 2 dự án A và B trong 2 lĩnh vực
độc lập. Khả năng thu hồi vốn sau 2 năm (tính bằng %) của 2 dự án là các biến ngẫu
nhiên XA , XB có bảng phân phối xác suất như sau:
XA 65 67 68 69 70 71 73
P 0.04 0.12 0.16 0.28 0.24 0.08 0.08
XB 66 68 69 70 71
P 0.12 0.28 0.32 0.20 0.08

Từ các bảng phân phối trên, ta tính được:


E(XA ) = 69, 16%; D(XA ) = 3, 0944; E(XB ) = 68, 72%; D(XB ) = 1, 8016

Do đó, nếu cần chọn phương án đầu tư sao cho tỉ lệ thu hồi vốn kỳ vọng cao hơn thì
nên chọn dự án A, song nếu chọn phương án đầu tư sao cho độ rủi ro của tỉ lệ thu hồi
vốn thấp hơn (tức khả năng thu hồi vốn ổn định hơn) thì lại nên chọn dự án B.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 31/88

c. Trung vị (median)
Định nghĩa: Trung vị (hay Median) của biến ngẫu nhiên X, được kí hiệu med(X) xác
định theo hệ thức:
1 1
P (X < med(X)) ≤ và P (X > med(X)) ≤
2 2

Nhận xét: Theo định nghĩa trên thì X có thể có nhiều trung vị và trong trường hợp X
là biến ngẫu nhiên liên tục thì med(X) chính là nghiệm của phương trình
1
FX (x) =
2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 32/88


0.4

0.12
0.2

0.06

median
mean

mean
median

0.00
0.0

7 8 9 10 11 12 13 5 10 15 20 25
0.20

0.20
mean

mean
0.10

median
0.10
median
0.00

0.00

5 10 15 20 25 0 5 10 15

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 33/88


Ví dụ 16
Tìm trung vị của biến ngẫu nhiên X biết:
X 1 2 3
a. X có bảng phân phối:
P 0.4 0.3 0.3
X 1 2 3 4
b. X có bảng phân phối:
P 0.2 0.3 0.4 0.1
c. X có hàm mật độ: (
2e−2x , x>0
f (x) =
0, x ≤ 0.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 34/88

Giải. a. Ta có med(X) = 2 vì:

P (X < 2) = P (X = 1) = 0, 4 ≤ 1/2; P (X > 2) = P (X = 3) = 0, 3 ≤ 1/2

b. med(X) = x0 với x0 bất kì thuộc đoạn [2, 3].


c. Hàm phân phối:
Z x (R x (
0 2e −2t dt, x > 0 1 − e−2x , x>0
F (x) = f (t)dt = =
−∞ 0, x≤0 0, x≤0

Xét phương trình: F (x) = 1/2


(
1 − e−2x = 1/2 ln2
⇔ ⇔x=
x>0 2

Vậy, med(X) = ln2


2 .

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 35/88

d. Phân vị và giá trị tới hạn

- Phân vị mức α, 0 < α < 1 của phân phối tương ứng với biến ngẫu nhiên X là giá trị
xα thỏa P (X < xα ) = α.
- Giá trị tới hạn mức α, 0 < α < 1 của phân phối tương ứng với biến ngẫu nhiên X là
giá trị x̄α thỏa P (X > x̄α ) = α.
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 36/88
7. Một số phân phối quan trọng

7.1 Phân phối Bernoulli


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối Bernoulli với tham số p ∈
(0, 1), kí hiệu X ∼ Ber(p), nếu X có bảng phân phối xác suất:

X 0 1
P 1-p p

Tính chất: Nếu X ∼ Ber(p) thì E(X) = p và DX = p(1 − p).


Ý nghĩa: Phân phối Bernoulli thường được sử dụng để mô tả phân phối của đại lượng
chỉ nhận 2 giá trị: đạt/không đạt, đồng ý/không đồng ý, hoàn thành/chưa hoàn thành,
thư rác/không phải thư rác,...

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 37/88

7.2 Phân phối nhị thức


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối nhị thức với tham số n và p,
kí hiệu X ∼ B(n, p) nếu X nhận các giá trị {0, 1, 2, ..., n} với xác suất:

P (X = k) = pn (k) = Cnk pk (1 − p)n−k , k = 0, n

Tính chất:
i) Nếu X ∼ B(n, p) thì E(X) = np, D(X) = np(1 − p).
ii) Nếu các biến ngẫu nhiên Xi , i = 1, n độc lập và Xi ∼ Ber(p) thì

X = X1 + ... + Xn ∼ B(n, p)

Nhận xét:
i) B(1, p) chính là phân phối Ber(p).
ii) Xét dãy n phép thử Bernoulli với xác suất thành công là p. Lúc đó, nếu gọi X là biến
ngẫu nhiên chỉ số lần thành công trong dãy n phép thử này thì X ∼ B(n, p).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 38/88

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 39/88


Ví dụ 17
Một thành phố A có 70% gia đình có tivi. Chọn ngẫu nhiên 20 gia đình và gọi X là số
gia đình có tivi.
a) Tính xác suất có đúng 10 gia đình có tivi.
b) Tính xác suất để có ít nhất 2 gia đình có tivi.

Giải. Ta có mô hình Bernoulli với n = 20 và p = 0, 7. Do đó: X ∼ B(n = 20; p = 0, 7).


a. Xác suất có đúng 10 gia đình có tivi:
10
P (X = 10) = p20 (10) = C20 0, 710 0, 310

b. Xác suất có ít nhất 2 gia đình có tivi:

P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X = 0) − P (X = 1) = 1 − p20 (0) − p20 (1)

0
= 1 − C20 0, 70 0, 320 − C20
1
0, 71 0, 319

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 40/88

Ví dụ 18
Một sinh viên thi vấn đáp trả lời 5 câu hỏi một cách độc lập. Khả năng trả lời đúng
mỗi câu hỏi đều bằng 60%. Nếu trả lời đúng thì sinh viên được 4 điểm, ngược lại bị trừ
2 điểm.
a) Tìm xác suất để sinh viên đó trả lời đúng 3 câu.
b) Tìm số điểm trung bình mà sinh viên đó đạt được.
c) Một sinh viên khác vào thi với khả năng trả lời đúng mỗi câu đều như nhau và cho
rằng số điểm trung bình đạt được không ít hơn 14. Hỏi sinh viên này phán đoán khả
năng trả lời đúng mỗi câu tối thiểu là bao nhiêu ?

Giải. Mô hình Bernoulli với n = 5 và p = 0, 6. Gọi X là số câu trả lời đúng của sinh
viên này. Ta có: X ∼ B(n = 5; p = 0, 6).
a. P (X = 3) = p5 (3) = C53 0, 63 0, 42 .
b. Gọi Y là số điểm sinh viên này đạt được.
Ta có: Y = 4X − 2(5 − X) = 6X − 10.
Số điểm trung bình sinh viên này đạt được:
E(Y ) = 6E(X) − 10 = 6np − 10 = 6 ∗ 5 ∗ 0, 6 − 10 = 8 (điểm)
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 41/88

c. Gọi p là xác suất trả lời đúng mỗi câu của sinh viên mới này. Gọi Z và T là số câu
trả lời đúng và số điểm đạt được. Tương tự, ta có:

Z ∼ B(n = 5; p) và T = 6Z − 10

Theo giả thiết:


E(T ) ≥ 14

⇔ 6np − 10 = 30p − 10 ≥ 14 ⇔ p ≥ 0, 8
Vậy, sinh viên này dự đoán khả năng trả lời đúng tối thiểu mỗi câu là 80%.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 42/88


7.3 Phân phối Poisson
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ > 0,
kí hiệu X ∼ P ois(λ) nếu X nhận giá trị trong tập N = {0, 1, 2, 3, ...} với xác suất:

λk e−λ
P (X = k) = , k = 0, 1, 2, ...
k!

Tính chất:
i) Nếu X ∼ P ois(λ) thì E(X) = λ, D(X) = λ.
ii) Cho X1 , X2 độc lập và có phân phối Poisson với tham số λ1 , λ2 . Khi đó X =
X1 + X2 ∼ P ois(λ1 + λ2 ).
Nhận xét: Trong thực tế phân phối Poisson phản ánh phân phối số lượng các biến cố
xuất hiện trong một khoảng thời gian (số cuộc điện thoại gọi đến tổng đài, số khách
hàng đến rút tiền từ một ngân hàng,....) và có tham số tỉ lệ với độ dài khoảng thời gian
đó.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 43/88

Giải thích: (đọc thêm)


Gọi N (t) là số biến cố xuất hiện trong khoảng thời gian [0, t]. Giả sử 3 giả thiết sau đây
được thỏa mãn:
(i) Xác suất có đúng 1 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng
λh + o(h) với λ > 0 - hằng số.
(ii) Xác suất có ít nhất 2 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng
o(h2 ).
(iii) Số biến cố xuất hiện trong các khoảng thời gian không giao nhau là các biến
ngẫu nhiên độc lập nhau.
Khi đó, người ta chứng minh được rằng:

(λt)k e−λt
P (N (t) = k) = , k ≥ 0.
k!

Điều này có nghĩa N (t) ∼ P ois(λt). Tham số λ chính là số biến cố trung bình xuất
hiện trong một đơn vị thời gian.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 44/88

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 45/88


Ví dụ 19
Một gara cho thuê ôtô thấy rằng số đơn đặt hàng thuê ôtô vào ngày thứ 7 là một biến
ngẫu nhiên có phân phối Poisson với tham số λ = 2. Giả sử gara có 4 chiếc ôtô. Hãy
tìm xác suất để:
a) Có đúng 2 ôtô được thuê.
b) Tất cả 4 ôtô đều được thuê.
c) Gara không đáp ứng được yêu cầu.

Giải. Gọi X là số đơn đặt hàng ôtô vào ngày thứ 7. Ta có X ∼ P ois(λ = 2).
22
a. P (X = 2) = e−2 = 2e−2
2!
b. P (X ≥ 4) = 1 − P (X < 4) =!1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
20 21 22 23
= 1 − e−2 + + + = 1 − 19/3e−2
0! 1! 2! 3!
!
20 2 1 2 2 2 3 24
c. P (X > 4) = 1 − P (X ≤ 4) = 1 − e−2 + + + + = 1 − 7e−2
0! 1! 2! 3! 4!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 46/88

Ví dụ 20
Quan sát tại siêu thị A thấy 4 phút trung bình có 20 khách đến mua hàng.
a) Tính xác suất để trong 7 phút có 30 khách đến siêu thị A ?
b) Tính xác suất để trong 2 phút có từ 3 đến 5 khách đến siêu thị A ?
Giả sử số khách đến siêu thị A tuân theo luật phân phối Poisson.

Giải.
a. Gọi X là số khách đến siêu thị trong 7 phút. Lúc đó, X có phân phối Poisson với
tham số λ = 7/4 ∗ 20 = 35. Xác suất cần tìm:
3530
P (X = 30) = e−35
30!
b. Gọi Y là số khách đến siêu thị trong 2 phút. Lúc đó, Y có phân phối Poisson với
tham số λ = 2/4 ∗ 20 = 10. Xác suất cần tìm:
!
−10 103 104 105
P (3 ≤ Y ≤ 5) = P (Y = 3) + P (Y = 4) + P (Y = 5) = e + +
3! 4! 5!

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 47/88

Định lý: (Luật biến cố hiếm)


Cho X ∼ B(n; p). Khi p khá nhỏ và n khá lớn, ta có

λk e−λ
P (X = k) ≈ trong đóλ = np.
k!

Điều này có nghĩa là X có phân phối xấp xỉ phân phối Poisson với tham số λ = np.
Ví dụ 21
Xác suất mỗi trang giấy bị lỗi do in ấn là 0,009. Tính xấp xỉ xác suất trong một quyển
sách 300 trang có nhiều nhất 3 trang bị lỗi.
Giải. Gọi X là số trang bị lỗi trong quyển sách 300 trang. Ta có: X ∼ B(n = 300; p =
0, 009). Vì n khá lớn và p khá nhỏ nên X có phân phối xấp xỉ phân phối Poisson với
tham số λ = np = 2, 7. Xác suất cần tìm:
P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)
!
2, 7 0 2, 71 2, 7 2 2, 7 3
≈ e−2,7 + + +
0! 1! 2! 3!
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 48/88
7.4 Phân phối hình học
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối hình học với tham số p ∈ (0, 1)
nếu X nhận các giá trị 1,2,3,... với xác suất:

P (X = k) = (1 − p)k−1 p, k = 1, 2, 3, ...
1 1−p
Tính chất: E(X) = , D(X) =
p p2
Nhận xét: Xét phép thử và A là một biến cố ở trong phép thử đó với xác suất xảy
ra p = P (A). Thực hiện độc lập và liên tiếp các phép thử cho đến khi biến cố A xuất
hiện thì dừng. Gọi X là số phép thử đã thực hiện. Khi đó, X có phân phối hình học với
tham số p.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 49/88

7.5 Phân phối siêu bội


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối siêu bội với tham số (N, M, n)
với n ≤ M ≤ N , kí hiệu X ∼ H(N, M, n) nếu tập giá trị của X là {0, 1, 2, ..., n} và

CMk C n−k
N −M
P (X = k) = n , k = 0, 1, ..., n
CN
 
Tính chất: E(X) = n M
N , D(X) = n M
N 1 − M N −n
N N −1
Nhận xét:
i) Cho một tập có N phần tử, trong đó có M phần tử có tính chất A, M ≤ N . Chọn
ngẫu nhiên lần lượt không hoàn lại n lần, mỗi lần một phần tử trong tập hợp này và
gọi X là số phần tử được chọn có tính chất A. Khi đó X ∼ H(N, M, n).
ii) Khi giá trị N lớn và số lần lấy n nhỏ thì phương pháp lấy không hoàn lại và lấy có
hoàn lại gần như không khác nhau. Vì vậy trong trường hợp N lớn và số lần lấy n nhỏ
thì ta có thể xem phân phối H(N, M, n) xấp xỉ phân phối B(n, p) với p = M/N .

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 50/88

7.6 Phân phối đều


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối đều trên đoạn [a, b], kí hiệu
X ∼ U (a, b) nếu hàm mật độ của nó có dạng:

 1 , x ∈ [a, b]

f (x) = b − a
0, x∈/ [a, b]
2
Tính chất: EX = a+b 2 , DX =
(b−a)
12
Nhận xét: Các hàm phát sinh số ngẫu nhiên thực trong đoạn [0,1] (trên các ngôn ngữ
lập trình, Excel, may tính bỏ túi, ...) là hàm mô phỏng giá trị của biến ngẫu nhiên có
phân phối đều trên đoạn [0, 1].

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 51/88


Ví dụ 22
Xe buýt đến trạm dừng A tại một thời điểm cố định bắt đầu từ 7h, và liên tục lặp lại
trong khoảng thời gian 15ph (tức là: 7h, 7h15, 7h30,...). Giả sử một khách đến trạm
dừng A tại thời điểm có phân phối điều trên đoạn [7h, 7h30]. Tính xác suất người này
chờ xe buýt ít hơn 5ph.

Giải: Gọi X (ph) là thời gian tính từ lúc 7h người này đến trạm dừng A. Theo giả thiết
X có phân phối đều trên [0, 30]. Hàm mật độ của X:
(
1/30, x ∈ [0, 30]
f (x) =
0, x∈ / [0, 30]

Xác suất cần tìm:


15 30
1 1 1
Z Z
P (10 < X < 15) + P (25 < X < 30) = dx + dx = .
10 30 25 30 3

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 52/88

7.7 Phân phối mũ


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối mũ với tham số λ > 0, kí
hiệu X ∼ Exp(λ) nếu hàm mật độ của nó có dạng:
(
λe−λx , x > 0
f (x) =
0, x≤0

Tính chất: E(X) = 1/λ; D(X) = 1/λ2


Nhận xét: Trong thực tế, phân phối mũ thường thể hiện phân phối khoảng thời gian
chờ giữa các lần xảy ra biến cố hay thời gian sống của các đối tượng.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 53/88

Giải thích:(đọc thêm)


Gọi Tn là thời điểm mà biến cố thứ n xuất hiện và N (t) là số biến cố xuất hiện trong
khoảng thời gian [0, t]. Khi đó:
+∞ +∞
X X (λt)j
P (Tn ≤ t) = P (N (t) ≥ n) = P (N (t) = j) = e−λt .
j!
j=n j=n

Từ đó, hàm mật độ của Tn :

λe−λt (λt)n−1
fTn (t) =
(n − 1)!

X Phân phối của Tn thường được gọi là phân Gamma với tham số (n, λ) (đôi lúc còn
gọi là phân phối n - Erlang).
X Khi n = 1, T1 có phân phối mũ với tham số λ.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 54/88


Ví dụ 23
Giả sử tuổi thọ (tính bằng năm) của một mạch điện tử trong máy tính là một biến ngẫu
nhiên có phân phối mũ với tuổi thọ trung bình là 6,25 năm. Thời gian bảo hành của
mạch điện tử này là 1 năm.
a) Hỏi có bao nhiêu phần trăm mạch điện tử bán ra phải bảo hành ?
b) Một công ty mua 40 mạch điện tử loại này. Tìm số mạch trung bình công ty phải
bảo hành.

Giải. a. Gọi X (năm) là tuổi thọ của mạch điện tử. Theo giả thiết, X ∼ Exp(λ) với
E(X) = 1/λ = 6, 25 ⇒ λ = 4/25. Hàm mật độ:
(
4/25e−4/25x , x > 0
f (x) =
0, x≤0

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 55/88

Tỉ lệ mạch điện tử phải bảo hành:


Z 1 Z 1
P (0 < X < 1) = f (x)dx = 4/25e−4/25x dx = 1 − e−4/25 ≈ 0, 15
0 0

b. Ta có mô hình Bernoulli với n = 40 và p = 0, 15.


Gọi Y là số mạch công ty cần bảo hành. Ta có:

Y ∼ B(n = 40; p = 0, 15)

Số mạch trung bình công ty cần bảo hành:

E(Y ) = np = 40 ∗ 0, 15 = 6

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 56/88

7.8 Phân phối chuẩn


Định nghĩa: Biến ngẫu nhiên X được gọi là có phân phối chuẩn với tham số µ và σ 2 ,
kí hiệu X ∼ N (µ, σ 2 ) nếu hàm mật độ của nó có dạng:

1 (x−µ)2
f (x) = √ e− 2σ2 , x ∈ R
σ 2π

Khi µ = 0, σ = 1 ta bảo X có phân phối chuẩn tắc N (0, 1). Hàm mật độ ϕ(x) và
hàm phân phối Φ(x) của phân phối chuẩn tắc N(0,1) tương ứng là:
1 2
ϕ(x) = √ e−x /2 , x ∈ R

Z x
1 2
Φ(x) = √ e−t /2 dt, x ∈ R
2π −∞

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 57/88


Đường cong chuẩn (đường cong hình chuông)

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 58/88

Nhận xét:
i) Biến ngẫu nhiên có phân phối chuẩn tắc thường được kí hiệu là Z. Do đó:

Φ(x) = P (Z < x)
ii) Φ(−x) = 1 − Φ(x), ∀x ∈ R.
1 R x −t2 /2
iii) Φ(x) = 1/2 + Φ0 (x), trong đó Φ0 (x) = √ e dt - hàm Laplace.
2π 0
Một vài giá trị hay sử dụng:

Φ(0) = 0, 5; Φ(1/2) = 0, 691; Φ(1) = 0, 841; Φ(2) = 0, 977

Giá trị tới hạn: Giá trị tới hạn mức α của phân phối chuẩn tắc được kí hiệu zα , tức là:

P (Z > zα ) = α hay zα = Φ−1 (1 − α)

Giá trị zα được tra ở bảng.


Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 59/88

Phân phối chuẩn tắc và giá trị tới hạn

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 60/88


Tính Φ(x) bằng máy tính Casio
1) CASIO FX570MS:
- Vào Mode tìm SD: M ode → M ode → 1(SD)
- Shif t → 3(Distr) → 1
- Nhập x.
2) CASIO FX570ES, FX570ES - PLUS, FX570VN - PLUS:
- Vào Mode tìm 1-Var: M ode → 3(Stat) → 1(1 − V ar) → AC
- Shif t → 1(Stat) → 5(Distr) → 1
- Nhập x.
3) CASIO FX580VN:
- Setup → 6 → = → 1 → AC
- OP T N → ↓ → 4 → 1
- Nhập x.
Ví dụ 24
Tính Φ(1.96), Φ(2), Φ(3)
Đáp số. Φ(1.96) = 0, 975, Φ(2) = 0, 977, Φ(3) = 0, 998
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 61/88

Tính chất:
i)Nếu X ∼ N (µ, σ 2 ) thì E(X) = µ, D(X) = σ 2 .
ii) Nếu X ∼ N (µ, σ 2 ) thì Y = aX + b ∼ N (aµ + b, a2 σ 2 ), a 6= 0.
iii) Nếu X1 , ..., Xn là các biến ngẫu nhiên độc lập có phân phối chuẩn Xi ∼
n
N (µi , σi2 ), i = 1, n thì biến ngẫu nhiên X = λ1 X1 + ... + λn Xn + C, λ2i 6= 0
P
i=1
cũng có phân phối chuẩn với
 !

 n
P n
P
µX = E(X) = E λi X i + C = λi µi + C,



i=1 i=1
!
n n
σ 2 = D(X) = D λ2i σi2
 P P
λi Xi + C =


 X


i=1 i=1

Đặc biệt, nếu X1 , ..., Xn độc lập và có cùng phân phối chuẩn N (µ, σ 2 ) thì
X1 + ... + Xn  σ2 
X = X1 + ... + Xn ∼ N (nµ; nσ 2 ); X = ∼ N µ;
n n
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 62/88

Hệ quả: («chuẩn hóa») Nếu X ∼ N (µ, σ 2 ) thì

X −µ
Z= ∼ N (0; 1)
σ

Ứng dụng: Cho X ∼ N (µ, σ 2 ). Lúc đó:


   
a−µ a−µ
P (X < a) = P Z < =Φ
σ σ
     
a−µ b−µ b−µ a−µ
P (a < X < b) = P <Z< =Φ −Φ
σ σ σ σ
Trường hợp đặc biệt,
     
a a a
P (|X − µ| < a) = Φ −Φ − = 2Φ −1
σ σ σ

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 63/88


Ví dụ 25
Cho biến ngẫu nhiên X ∼ N (4, 32 ).
Tính xác suất: P (X < 5), P (X > 1), P (|X − 3| < 1).

Giải. Ta có: 5 − 4
P (X < 5) = Φ = 0, 63
3
1 − 4
P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 841
3
4 − 4 2 − 4
P (|X − 3| < 1) = P (2 < X < 4) = Φ −Φ = 0, 2475
3 3

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 64/88

Ví dụ 26
Giả sử số đo chiều dài của một sợi dây kim loại do một máy tự động cắt ra là một biến
ngẫu nhiên chuẩn với µ = 10mm, σ 2 = 4mm2 .
a) Tính xác suất lấy ra được một sợi dây có chiều dài lớn hơn 13mm.
b) Chọn ngẫu nhiên 10 sợi dây loại này. Tính xác suất có đúng 3 sợi có chiều dài từ
8, 5mm đến 12, 5mm.

Giải. Gọi X là số đo chiều dài sợi dây kim loại. Ta có: X ∼ N (10; 22 ).
 13 − 10 
a. P (X > 13) = 1 − P (X ≤ 13) = 1 − Φ = 0, 067
2
b. Mô hình Bernoulli với n = 10 và p = P (8, 5 < X < 12, 5). Ta có:
 12, 5 − 10   8, 5 − 10 
p=Φ −Φ = 0, 668
2 2

Xác suất cần tìm:


3
p10 (3) = C10 0, 6683 (1 − 0, 668)7

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 65/88

Ví dụ 27
Cho X là biến ngẫu nhiên có phân phối chuẩn. Biết rằng P (X > 4) = 0, 159 và P (X <
3) = 0, 309. Tính xác suất P (X > 1). Cho biết Φ(1/2) = 0, 691 và Φ(1) = 0, 841.

Giải. Giả sử X ∼ N (µ; σ 2 ). Khi đó:


4 − µ 4 − µ
P (X > 4) = 1 − Φ = 0, 159 ⇔ Φ = 0, 841 = Φ(1) ⇔ 4 − µ = σ (1)
σ σ
3 − µ  3 − µ 3 − µ
P (X < 3) = Φ = 0, 309 ⇔ Φ − = 1−Φ = 0, 691 = Φ(1/2)
σ σ σ

⇔ 3 − µ = −σ/2 (2)
Giải hệ (1),(2) ta được: µ = 10/3; σ = 2/3.
 1 − 10/3 
Vậy, P (X > 1) = 1 − P (X ≤ 1) = 1 − Φ = 0, 99976
2/3

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 66/88


Ví dụ 28
Cho X ∼ N ( 15, 4 ), Y ∼ N ( 10, 1 ), X và Y độc lập.
a) Tính P (2X > 3Y ).
b) Tìm a và b biết T = X + aY + b và E(T ) = 30, D(T ) = 5.

Giải. a. Đặt Z = 2X − 3Y . Theo tính chất của phân phối chuẩn, Z cũng có phân phối
chuẩn với tham số:
(
µZ = E(Z) = 2E(X) − 3E(Y ) = 2 ∗ 15 − 3 ∗ 10 = 0
σZ2 = D(Z) = 4D(X) + 9D(Y ) = 4 ∗ 4 + 9 ∗ 1 = 25
0 − 0
Do đó, Z ∼ N (0; 25). Vậy, P (2X > 3Y ) = P (Z > 0) = 1 − Φ = 1/2.
5
b. Sử dụng tính chất của kỳ vọng và phương sai:
( ( #
E(T ) = 30 15 + 10a + b = 30 a = 1; b = 5
⇔ ⇔
D(T ) = 5 4 + a2 = 5 a = −1; b = 25

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 67/88

Ví dụ 29
Chiều cao X (mét) của nam thanh niên trưởng thành ở quốc gia A tuân theo quy luật
phân bố chuẩn N (µ; 0, 12 ). Chọn ngẫu nhiên 100 nam thanh niên của quốc gia A. Tính
xác suất sai số tuyệt đối giữa chiều cao trung bình của 100 nam thanh niên được chọn
với µ không vượt quá 0, 03.

Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 100 và X̄ = (X1 +...+X100 )/100.
Ta có: Xi độc lập và Xi ∼ N (µ; 0, 12 ). Theo tính chất của phân phối chuẩn, X̄ cũng
có phân phối chuẩn với tham số:
(
µX̄ = E(X̄) = µ
2 = D(X̄) = 0, 12 /100 = 10−4
σX̄

Do đó, X̄ ∼ N (µ; 10−4 ). Xác suất cần tìm:


   
0, 03 0, 03
P (|X̄−µ| ≤ 0, 03) = P (µ−0, 03 ≤ X̄ ≤ µ+0, 03) = Φ −Φ − = 0, 9973
10−2 10−2

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 68/88

Qui tắc 2σ: Cho X ∼ N (µ, σ 2 ). Khi đó

P (|X − µ| < 2σ) = P (µ − 2σ < X < µ + 2σ) = Φ(2) − Φ(−2) ≈ 0, 9545

hay P (µ − 2σ < X < µ + 2σ) ≈ 0, 9545


Điều này có nghĩa xác suất X nhận giá trị trong khoảng (µ − 2σ, µ + 2σ) bằng 95,45%.

Qui tắc 3σ: Cho X ∼ N (µ, σ 2 ). Khi đó

P (|X − µ| < 3σ) = P (µ − 3σ < X < µ + 3σ) = Φ(3) − Φ(−3) ≈ 0, 9973

hay P (µ − 3σ < X < µ + 3σ) ≈ 0, 9973


Điều này có nghĩa xác suất X nhận giá trị trong khoảng (µ − 3σ, µ + 3σ) bằng 99,73%.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 69/88


Quy tắc 2σ và 3σ
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 70/88

Ứng dụng
- Khi nghiên cứu các phân phối, nếu nó thỏa quy tắc 2σ và 3σ thì điều này cung cấp
cho chúng ta cơ sở để «có thể xem» phân phối đang nghiên cứu là phân phối chuẩn.
- Ngược lại, nếu biết phân phối đang nghiên cứu là phân phối chuẩn, lúc đó các «khoảng»
2σ và 3σ lần lượt chiếm 95,45% và 99,73% các giá trị có thể.

Ví dụ 30
Thu thập dữ liệu từ 2 phân phối, thực hiện tính toán và được kết quả:

Bộ dữ liệu (x̄ − 2s, x̄ + 2s) (x̄ − 3s, x̄ + 3s)


1 94,74% 98,61%
2 80,23% 92,15%

trong đó x̄ và s lần lượt là trung bình mẫu và độ lệch chuẩn mẫu (Chương 4).
Câu hỏi: Phân phối nào có thể xem là chuẩn? 1 hay 2?

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 71/88

7.9 Phân phối χ2


Định nghĩa: Cho X1 , X2 , ..., Xn là các biến ngẫu nhiên độc lập và có cùng phân phối
N (0, 1). Khi đó, phân phối của biến ngẫu nhiên X = X12 + X22 + ... + Xn2 được gọi là
phân phối χ2 với n bậc tự do. Kí hiệu X ∼ χ2n .
Giá trị tới hạn mức α của phân phối χ2n được kí hiệu χ2n;α và được tra ở bảng.
Tính chất:
i) E(X) = n, D(X) = 2n
ii) Hàm mật độ của χ2n có dạng:
 n x
 n1 x 2 −1 e− 2 , x > 0
2 2 Γ( n )
f (x) = 2
0, x≤0

+∞
trong đó hàm gamma: Γ(a) = xa−1 e−x dx, a > 0.
R
0

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 72/88


Phân phối χ2 và giá trị tới hạn
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 73/88

7.10 Phân phối student


Định nghĩa: Cho X ∼ N (0, 1), Y ∼ χ2 n và X, Y độc lập. Khi đó, phân phối của biến
ngẫu nhiên Z = √X được gọi là phân phối student với n bậc tự do, kí hiệu X ∼ Tn .
Y /n
Giá trị tới hạn mức α của phân phối Tn được kí hiệu tn;α và được tra ở bảng. Khi
n > 30 người ta thường sử dụng công thức xấp xỉ:

tn;α ≈ zα

Tính chất:
i) E(X) = 0, D(X) = n−2n
,n>2
ii) Hàm mật độ của Tn có dạng:
  !− n+1
Γ n+12 x2 2

f (x) = √ $n 1 + , x ∈ R.
nπΓ 2 n

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 74/88

Phân phối student và giá trị tới hạn

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 75/88


7.11 Phân phối Fisher-Snedecor
Định nghĩa: Cho X, Y độc lập và X ∼ χ2 m , Y ∼ χ2 n . Khi đó, phân phối của biến
ngẫu nhiên Z = X/m nX
Y /n = mY được gọi là phân phối Fisher-Snedecor với bậc tự do m và
n, kí hiệu X ∼ Fm,n .
Tính chất:
2n2 (m+n−2)
i) E(X) = n−2n
, n > 2, D(X) = m(n−2) 2
(n−4)
, n>4
ii) Hàm mật độ của Fm,n có dạng:

 Γ( 2 ) mm/2 nn/2 x 2 −1 ,
m+n m
x>0

m+n
f (x) = Γ( 2 )Γ( 2 )
m n
(mx+n) 2
0,

x≤0

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 76/88

8. Các định lý giới hạn

8.1 Luật số lớn


Bất đẳng thức Chebyshev: Cho X là biến ngẫu nhiên có kỳ vọng hữu hạn. Khi đó với
mọi ε > 0 ta có: D(X)
P (|X − E(X)| > ε) ≤
ε2
Từ đó, dễ thấy P (|X − E(X)| > 3σ(X)) ≤ 1/9.
Định lý:(Luật yếu số lớn) Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân
phối xác suất với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì
lim P (|X̄ − µ| > ε) = 0,
n→+∞

trong đó X̄ = (X1 + ... + Xn )/n.


Ý nghĩa: Nếu X1 , ..., Xn là các biến ngẫu nhiên độc lập và cùng phân phối với X với
E(X) hữu hạn. Khi đó, với n khá lớn, ta có:
X1 + X2 + ... + Xn
X= ≈ E(X)
n
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 77/88

Hệ quả: (Định lý Bernoulli) Nếu gọi X$là số lần xuất


 hiện biến cố A trong dãy n phép
thử Bernoulli với p = P (A) thì lim P |fn − p| > ε = 0, ∀ε > 0 trong đó fn = X n.
n→∞

8.2 Định lý giới hạn trung tâm


Định lý: Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân phối xác suất
với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì:
 
Sn − nµ
lim P √ < x = Φ(x),
n→∞ σ n

trong đó Sn = X1 + X2 + ... + Xn .
Ứng dụng: Nếu {Xn , n ≥ 1} là dãy biến ngẫu nhiên độc lập, cùng phân phối xác suất
với biến X có kỳ vọng E(X) = µ và phương sai D(X) = σ 2 hữu hạn, thì với n lớn
(n ≥ 30) Sn = X1 + ... + Xn có phân phối xấp xỉ phân phối chuẩn N (nµ, nσ 2 ).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 78/88


Ví dụ 31
Tuổi thọ của một loại bóng đèn là một biến ngẫu nhiên X có E(X) = 250h và độ lệch
chuẩn σ(X) = 50h.
a) Một cửa hàng mua 30 bóng đèn để khi hỏng có thể thay thế. Tính xấp xỉ xác suất
cửa hàng có thể duy trì ánh sáng liên tục ít nhất 8750h.
b) Chủ cửa hàng phải mua dự trữ ít nhất bao nhiêu bóng đèn để duy trì ánh sáng liên
tục ít nhất 8750h với xác suất lớn hơn 0,9772. Cho biết Φ(2) = 0, 9772.

Giải. a. Gọi Xi là tuổi thọ của bóng đèn thứ i, i ≥ 1. Ta có các biến ngẫu nhiên Xi độc
lập và có cùng phân phối với X. Do đó, áp dụng định lý giới hạn trung tâm:

T = X1 + ... + X30

có phân phối xấp xỉ phân phối chuẩn N (30 ∗ 250; 30 ∗ 502 ) = N (7500; 75000)
Xác suất cần tìm:
 
8750 − 7500
P (T ≥ 8750) = 1 − P (T < 8750) ≈ 1 − Φ √ ≈0
75000
Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 79/88

b. Gọi n là số bóng đèn cần mua dự trữ. Tương tự, áp dụng định lý giới hạn trung tâm:

Tn = X1 + ... + Xn

có phân phối xấp xỉ phân phối chuẩn N (250n; 502 n).


Từ giả thiết, ta có:
 
8750 − 250n
P (Tn ≥ 8750) = 1 − P (Tn < 8750) ≈ 1 − Φ √ ≥ 0, 9772 = Φ(2)
50 n
 
8750 − 250n
⇔Φ − √ ≥ 0, 9772 = Φ(2)
50 n

Giải bất phương trình:


8750 − 250n
− √ ≥2
50 n
ta được: n ≥ 37, 44.
Vậy, n = 38.

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 80/88

Ví dụ 32
Tung ngẫu nhiên một con xúc xắc cân đối 200 lần độc lập. Tính xấp xỉ xác suất tổng
số chấm xuất hiện (ở mặt trên cùng) lớn hơn 720.

Giải. Gọi Xi là số chấm xuất hiện ở lần tung thứ i, i = 1, 200. Đặt S = X1 + ... + X200 .
Ta có: X1 , ..., X200 là các biến ngẫu nhiên độc lập cùng phân phối.

Xi 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6

Khi đó: E(Xi ) = 7/2; D(Xi ) = E(Xi2 ) − (EXi )2 = 35/12.


Theo định lý giới hạn trung tâm, S sẽ có phân phối xấp xỉ phân phối chuẩn N (200 ∗
7/2; 200 ∗ 35/12) = N (700; 1750/3). Do đó, xác suất cần tìm:
!
720 − 700
P (S > 720) = 1 − P (S ≤ 720) ≈ 1 − Φ p ≈ 0, 2
1750/3

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 81/88


Hệ quả: (Định lý giới hạn tích phân Moivre-Laplace) Cho X ∼ B(n, p). Khi n khá lớn
ta có: ! !
k2 − np k1 − np
P (k1 < X < k2 ) ≈ Φ p −Φ p .
np(1 − p) np(1 − p)

Hay nói cách khác, khi n lớn X có phân phối xấp xỉ phân phối chuẩn N (µ, σ 2 ) với
µ = E(X) = np và σ 2 = D(X) = np(1 − p).

Định lý giới hạn địa phương Moivre-Laplace (đọc thêm)


Cho X ∼ B(n, p). Khi n lớn, ta có:
!
1 k − np
P (X = k) ≈ p ϕ p ,
np(1 − p) np(1 − p)

1 2
trong đó ϕ(x) = √ e−x /2 - hàm mật độ phân phối chuẩn tắc N(0,1).

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 82/88

Điều kiện xấp xỉ


Theo quy tắc 3σ:

(µ − 3σ, µ + 3σ) ∈ (0, n)


p p
⇔ (np − np(1 − p), np + np(1 − p)) ∈ (0, n)
( p
np − np(1 − p) > 0
⇔ p
np + np(1 − p) < n
  
n > 9 1−p

⇔  p 
p
n > 9 1−p

 
1−p p
⇔ n > 9 max ,
p 1−p

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 83/88

Các định lý giới hạn Moivre-Laplace

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 84/88


Ví dụ 33
Một xạ thủ bắn độc lập 200 viên đạn vào một mục tiêu. Xác suất bắn trúng mỗi viên
là 0,6. Tính xấp xỉ xác suất có ít nhất 100 viên trúng đích.

Giải. Gọi X là số viên đạn bắn trúng. Ta có: X ∼ B(n = 200; p = 0, 6). Áp dụng định lý
Moivre-Laplace, X có phân phối xấp xỉ chuẩn với µ = np = 120; σ 2 = np(1 − p) = 48.
Do đó:
   
200 − 120 100 − 120
P (100 ≤ X ≤ 200) ≈ Φ √ −Φ √ = 0, 998
48 48

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 85/88

Ví dụ 34
Một công ty bảo hiểm xe máy có 10 000 khách hàng. Mỗi chủ xe phải nộp 120.000
đồng/1 năm và trung bình nhận lại là 1.000.000 đồng nếu xe của họ bị tai nạn giao
thông. Qua thống kê biết tỉ lệ để 1 xe máy bị tai nạn giao thông trong một năm là
0,006. Tìm xác suất để sau một năm hoạt động công ty bị thất bại.

Giải. Gọi X là số xe bị tai nạn và Y (ngàn đồng) là số tiền lãi của công ty trong 1 năm.
Ta có: X ∼ B(n = 10000; p = 0, 006) và Y = 12 ∗ 105 − 1000X.
Áp dụng định lý Moivre-Laplace, X có phân phối xấp xỉ chuẩn với tham số

µ = np = 60; σ 2 = np(1 − p) = 59, 64

Xác suất để sau một năm hoạt động công ty bị thất bại:
 
1200 − 60
P (Y < 0) = P (12 ∗ 105 − 1000X < 0) = P (X > 1200) ≈ 1 − Φ √ ≈0
59, 64

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 86/88

Nhận xét: Cho X ∼ N (n, p). Khi n khá lớn (và thỏa điều kiện nhất định) thì theo
đinh lý giới hạn tích phân Moivre-Laplace, X có phân phối xấp xỉ phân phối liên tục
là phân phối chuẩn N (np, np(1 − p)). Vì thế, khi tính xấp xỉ xác suất người ta thường
hiệu chỉnh:
!
k + 0.5 − np
P (X ≤ k) = P (X < k + 0.5) ≈ Φ p
np(1 − p)
!
k − 0.5 − np
P (X < k) = P (X ≤ k − 1) = P (X < k − 0.5) ≈ Φ p
np(1 − p)
P (k1 < X < k2 ) = P (X < k2 ) − P (X ≤ k1 )
P (k1 ≤ X < k2 ) = P (X < k2 ) − P (X < k1 )
...............

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 87/88


Ví dụ 35
Cho X ∼ B(n = 300, p = 0.2). Khi đó, n khá lớn và thỏa điều kiện
 
1−p p
n > 9 max ,
p 1−p

Tính xấp xỉ xác suất P (X ≤ 70).

Chính xác Không hiệu chỉnh Có hiệu chỉnh


0.9330245945 0.9255426634 0.9351827095

Tính xấp xỉ xác suất P (60 ≤ X ≤ 150).

Chính xác Không hiệu chỉnh Có hiệu chỉnh


0.2553341683 0.2352432110 0.2580014678

Tôn Thất Tú - 2021 Chương 2. Biến ngẫu nhiên 88/88

XÁC SUẤT THỐNG KÊ


Tôn Thất Tú

Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 1/27

Chương 3. Vectơ ngẫu nhiên


1. Định nghĩa
Giả sử X1 , ..., Xn là n biến ngẫu nhiên liên quan đến thí nghiệm đang xét. Lúc đó ta
gọi bộ gồm n biến ngẫu nhiên (X1 , ..., Xn ) là vectơ ngẫu nhiên n chiều.
Ở đây, ta hạn chế xét trường hợp n = 2.

2. Hàm phân phối đồng thời


Định nghĩa: Giả sử (X, Y ) là vectơ ngẫu nhiên 2 chiều. Khi đó hàm hai biến F (x, y)
xác định như sau:
FX,Y (x, y) = P (X < x, Y < y)
được gọi là hàm phân phối đồng thời của vectơ ngẫu nhiên (X, Y ).
Tính chất:
i) 0 ≤ FX,Y (x, y) ≤ 1, ∀x, y ∈ R ii) FX,Y (x, y) không giảm theo từng biến
iii) FX,Y (x, y) liên tục trái
iv) lim FX,Y (x, y) = 1, lim FX,Y (x, y) = 0, lim FX,Y (x, y) = 0
x→+∞ x→−∞ y→−∞
y→+∞
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 2/27
2.1 Phân phối đồng thời rời rạc
a. Bảng phân phối đồng thời: Giả sử X nhận các giá trị trong tập {xi , i ∈ I} và Y
nhận các giá trị trong tập {yj , j ∈ J}.
Đặt pij = P (X = xi , Y = yj ), i ∈ I, j ∈ J. Lúc đó ta có bảng phân phối đồng thời:
Y
y1 y2 ... yj ...
X
x1 p11 p12 ... p1j ...
x2 p21 p22 ... p2j ...
... ... ... ... ... ...
xi pi1 pi2 ... pij ...
... ... ... ... ... ...

Nhận xét: Ta cũng có: pi,j = 1 và với A ⊂ R2


P
i,j
X
P ((X, Y ) ∈ A) = P (X = xi , Y = yj )
(xi ,yj )∈A
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 3/27

Ví dụ 1
Một hộp có 2 bi trắng và 3 bi đen. Lấy ngẫu nhiên 1 viên không hoàn lại, rồi tiếp tục
lấy ngẫu nhiên 2 viên không hoàn lại. Gọi X và Y là số bi đen lấy được ở lần 1 và lần 2.
a. Lập bảng phân phối đồng thời của X và Y .
b. Tính xác suất P (X + Y < 2).

Giải. a. Ta có X nhận các giá trị: 0, 1 và Y nhận các giá trị: 0, 1, 2.


P (X = 0, Y = 0) = P (X = 0)P (Y = 0|X = 0) = 2/5 ∗ 0 = 0
C31 C11
P (X = 0, Y = 1) = P (X = 0)P (Y = 1|X = 0) = 2/5 ∗ = 1/5
C42
C2
P (X = 0, Y = 2) = P (X = 0)P (Y = 2|X = 0) = 2/5 ∗ 32 = 1/5
C4
C2
P (X = 1, Y = 0) = P (X = 1)P (Y = 0|X = 1) = 3/5 ∗ 22 = 1/10
C4
C 1C 1
P (X = 1, Y = 1) = P (X = 1)P (Y = 1|X = 1) = 3/5 ∗ 2 2 2 = 2/5
C4
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 4/27

C22
P (X = 1, Y = 2) = P (X = 1)P (Y = 2|X = 1) = 3/5 ∗ = 1/10
C42
Bảng phân phối đồng thời:

Y
0 1 2
X
0 0 1/5 1/5
1 1/10 2/5 1/10

b. Xác suất:
P (X + Y < 2) = P (X = Y = 0) + P (X = 0, Y = 1) + P (X = 1, Y = 0)
= 0 + 1/5 + 1/10 = 3/10

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 5/27


Ví dụ 2
Cho hai biến ngẫu nhiên X, Y độc lập có bảng phân phối:
X 1 2 Y 1 2 3
P 0,4 0,6 P 0,3 0,3 0,4
Lập bảng phân phối đồng thời của (X, Y ).

Giải. Vì X, Y độc lập nên:


P (X = 1, Y = 1) = 0, 4 ∗ 0, 3 = 0, 12; P (X = 1, Y = 2) = 0, 4 ∗ 0, 3 = 0, 12
P (X = 1, Y = 3) = 0, 4 ∗ 0, 4 = 0, 16; P (X = 2, Y = 1) = 0, 6 ∗ 0, 3 = 0, 18
P (X = 2, Y = 2) = 0, 6 ∗ 0, 3 = 0, 18; P (X = 2, Y = 3) = 0, 6 ∗ 0, 4 = 0, 24
Bảng phân phối đồng thời:
Y
1 2 3
X
1 0,12 0,12 0,16
2 0,18 0,18 0,24
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 6/27

b. Phân phối biên: Ta đưa vào kí hiệu


X X
pi. = P (X = xi ) = P (X = xi , Y = yj ) = pij
j j

Từ đó ta được bảng phân phối của X và được gọi là phân phối biên X:

X x1 x2 ... xi ...
P p1. p2. ... pi. ...

Nhận xét: Trong thực hành, để tìm phân phối biên ta có thể xuất phát từ bảng phân
phối đồng thời tính tổng các xác suất theo hàng hoặc theo cột như bảng minh họa sau
đây:

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 7/27

Y
y1 y2 ... yj ... P (X = xi )
X
x1 p11 p12 ... pi1 ... p1.
x2 p21 p22 ... p2j ... p2.
... ... ... ... ... ... ...
xi pi1 pi2 ... pij ... pi.
... ... ... ... ... ... ...
P (Y = yj ) p.1 p.2 ... p.j ...

Phân phối biên của Y được tìm hoàn toàn tương tự.

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 8/27


c. Phân phối có điều kiện: Kí hiệu

P (X = xi , Y = yj ) pij
P (xi |yj ) = P (X = xi |Y = yj ) = =
P (Y = yj ) p.j

được gọi là xác suất có điều kiện để X nhận giá trị xi khi biết Y = yj .
Ứng với mỗi yj cố định ta có bảng phân phối xác suất có điều kiện của X với điều kiện
Y = yj :

X|Y = yj x1 x2 ... ...


P P (x1 |yj ) P (x2 |yj ) ... ...

Tương tự ứng với mỗi xi cố định ta có bảng phân phối xác suất có điều kiện của Y với
điều kiện X = xi .

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 9/27

Ví dụ 3
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
X
1 2 3
Y
5 0.1 0.2 0.3
6 0.08 0.16 0.16

Tìm phân phối biên của X, Y và tính P (Y = 6|X = 1).


Giải. Ta có:
X
1 2 3 P (Y = yj )
Y
5 0.1 0.2 0.3 0,6
6 0.08 0.16 0.16 0,4
P (X = xi ) 0.18 0.36 0.46

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 10/27

Phân phối biên của X:

X 1 2 3
P 0,18 0,36 0,46

Phân phối biên của Y :

Y 5 6
P 0,6 0,4

Xác suất:
P (X = 1, Y = 6) 0, 08 4
P (Y = 6|X = 1) = = =
P (X = 1) 0, 18 9

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 11/27


2.2 Phân phối đồng thời liên tục
a. Định nghĩa: Vectơ ngẫu nhiên (X, Y ) được gọi là có phân phối đồng thời liên tục
nếu hàm phân phối đồng thời của (X, Y ) có thể biểu diễn ở dạng
Zx Zy
FX,Y (x, y) = fX,Y (u, v)dudv
−∞ −∞

Hàm fX,Y (u, v) được gọi là hàm mật độ đồng thời của X, Y .
Tính chất:
+∞ Z
+∞
∂ 2 FX,Y (u, v)
Z
i)fX,Y (u, v) ≥ 0, ii)fX,Y (u, v) = , iii) fX,Y (u, v)dudv = 1
∂u∂v
−∞ −∞

Nhận xét: Nếu A ⊂ R2 thì


ZZ
P ((X, Y ) ∈ A) = f (x, y)dxdy.
A

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 12/27

b. Phân phối biên: Hàm mật độ biên của X và Y được xác định như sau:
+∞
Z
fX (x) = fX,Y (x, y)dy
−∞

+∞
Z
fY (y) = fX,Y (x, y)dx
−∞

c. Phân phối có điều kiện: Hàm

fX,Y (x, y)
fX|Y (x|y) =
fY (y)

là hàm mật độ điều kiện của X với điều kiện Y = y.

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 13/27

Ví dụ 4
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
(
C(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) =
0, (x, y) ∈
/ [0, 1] × [0, 1]

Tìm C, fX (x), fY |X (y|x) và tính xác suất P (0 < X < Y < 1/2).

Giải. Theo tính chất của hàm mật độ:


Z +∞ Z +∞ Z 1Z 1
C 1 3C
Z
fX,Y (x, y)dxdy = C(x + xy)dxdy = (y + 1)dy = =1
−∞ −∞ 0 0 2 0 4

Suy ra: C = 4/3. Mật độ biên của X:


Z +∞ 1
4
Z
fX (x) = fX,Y (x, y)dy = (x + xy)dy = 2x, x ∈ [0, 1].
−∞ 0 3

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 14/27


Do đó: (
2x, x ∈ [0, 1]
fX (x) =
0, x∈/ [0, 1]

Mật độ có điều kiện:


fX,Y (x,y) 4/3(x + xy) 2
fY |X (y|x) = = = (y + 1), (x, y) ∈ [0, 1] × [0, 1]
fX (x) 2x 3

Xác suất:
1/2 Z y 1/2 Z y
4
Z Z
P (0 < X < Y < 1/2) = f (x, y)dxdy = (x + xy)dxdy
0 0 0 0 3
1/2
2
Z
= (1 + y)y 2 dy = 11/288.
0 3

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 15/27

2.3 Kỳ vọng của hàm hai biến ngẫu nhiên


- Nếu (X, Y ) có phân phối đồng thời rời rạc với pi,j = P (X = xi , Y = yj ), i ∈ I, j ∈ J
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định:
X X
Eh(X, Y ) = h(xi , yj )P (X = xi , Y = yj ) = h(xi , yj )pi,j .
i∈I,j∈J i∈I,j∈J

- Nếu (X, Y ) có phân phối đồng thời liên tục với hàm mật độ xác suất đồng thời f (x, y)
thì kỳ vọng của biến ngẫu nhiên h(X, Y ) được xác định:
Z +∞ Z +∞
Eh(X, Y ) = h(x, y)f (x, y)dxdy.
−∞ −∞

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 16/27

Ví dụ 5
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
X
1 2
Y
1 0.1 0.2
2 0.3 0.4

Tính E(2X − 3Y )

Giải: Ta có: X
E(2X − 3Y ) = (2xi − 3yj )pi,j = ....
i,j

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 17/27


Ví dụ 6
Vectơ ngẫu nhiên (X, Y ) có hàm mật độ
(
4
(x + xy), (x, y) ∈ [0, 1] × [0, 1]
fX,Y (x, y) = 3
0, (x, y) ∈
/ [0, 1] × [0, 1]

Tính E(X 2 + Y 2 ).

Giải. Ta có:
+∞ Z +∞ 1Z 1
4
Z Z
2 2 2 2
E(X +Y ) = (x +y )f (x, y)dxdy = (x2 +y 2 ) (x+xy)dxdy = ...
−∞ −∞ 0 0 3

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 18/27

2.4 Sự độc lập của các biến ngẫu nhiên


Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi:

FX,Y (x, y) = FX (x).FY (y)

- Nếu X và Y có phân phối đồng thời rời rạc thì điều kiện trên trở thành:

P (X = xi , Y = yj ) = P (X = xi ).P (Y = yj ), ∀i, j

- Nếu X và Y có phân phối đồng thời liên tục thì điều kiện trên trở thành:

fX,Y (x, y) = fX (x).fY (y)

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 19/27

3. Kỳ vọng có điều kiện


Kỳ vọng có điều kiện của biến ngẫu nhiên Y với điều kiện X = x, kí hiệu E(Y |X = x)
được xác định:
- Nếu X và Y có phân phối đồng thời rời rạc thì:
X
E(Y |X = x) = yj P (Y = yj |X = x)
j

- Nếu X và Y có phân phối đồng thời liên tục thì:


+∞
Z
E(Y |X = x) = yfY |X (y|x)dy
−∞

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 20/27


4. Hiệp phương sai và hệ số tương quan
a. Hiệp phương sai:
- Hiệp phương sai của hai biến ngẫu nhiên X và Y , kí hiệu Cov(X, Y ) được xác định
theo biểu thức:  
Cov(X, Y ) = E (X − EX)(Y − EY )
- Hai biến ngẫu nhiên X và Y được gọi là tương quan với nhau nếu Cov(X, Y ) 6= 0 và
không tương quan nếu Cov(X, Y ) = 0.
Tính chất:
i) Cov(X, Y ) = Cov(Y, X)
ii) Cov(aX + b, cY + d) = acCov(X, Y ), a, b, c, d = const
iii) Cov(X, Y ) = E(XY ) − E(X).E(Y )
iv) D(X ± Y ) = D(X) + D(Y ) ± 2Cov(X, Y )
Nhận xét:
i) Cov(X, X) = D(X)
ii) Nếu X, Y độc lập thì Cov(X, Y ) = 0. Do đó, từ "tính chất độc lập" suy ra "tính
chất không tương quan", tuy nhiên điều ngược lại nói chung không đúng.
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 21/27

iii) Trong thực hành, ta tính Cov(X, Y ) = E(XY ) − E(X).E(Y ), trong đó:
P
 xi yj pij ,
 X, Y có phân phối đồng thời rời rạc
E(XY ) = +∞ R +∞
xyfXY (x, y)dxdy, X, Y có phân phối đồng thời liên tục
R


−∞ −∞

b. Hệ số tương quan
Hệ số tương quan của hai biến ngẫu nhiên X và Y , kí hiệu ρ(X, Y ) được xác định bởi
biểu thức: Cov(X, Y )
ρ(X, Y ) = p
D(X)D(Y )
Tính chất:
i) ρ(X, Y ) = ρ(Y, X) ii) |ρ(X, Y )| ≤ 1
iii) Nếu Y = aX + b hoặc X = aY + b, a, b ∈ R, a 6= 0 (phụ thuộc tuyến tính) thì
(
1, a>0
ρ(X, Y ) =
−1, a < 0
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 22/27

Ý nghĩa hệ số tương quan: Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa
X và Y . Khi |ρ(X, Y )| càng gần 1 thì quan hệ tuyến tính giữa X và Y càng mạnh.
X Khi ρ(X, Y ) > 0: X, Y tương quan dương (thuận), tức là X, Y có xu hướng cùng
tăng hoặc cùng giảm.
X Khi ρ(X, Y ) < 0: X, Y tương quan âm (nghịch), tức là X, Y có xu hướng tăng và
giảm ngược chiều nhau.
Để đánh giá mức độ tương quan, ta có thể tham khảo bảng sau (Hopkins, 2000):

|ρ(X, Y )| Mức độ tương quan


<0.1 Rất nhỏ
0.1-0.3 Nhỏ
0.3-0.5 Trung bình
0.5-0.7 Lớn
0.7-0.9 Rất lớn
>0.9 Gần như hoàn hảo

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 23/27


−1.0
2.5

−2.0
1.5
ρ = 0.96 ρ = − 0.98

−3.0
0.6 0.8 1.0 1.2 1.4 0.6 0.8 1.0 1.2 1.4
0.2

1.0
0.0

0.0
ρ = 0.19

−1.0
ρ = − 0.13
−0.2

0.6 0.8 1.0 1.2 1.4 −2 0 2 4 6

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 24/27

Ví dụ 7
Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:

X
1 2 3
Y
1 0.1 0.1 0.2
2 0.2 0.1 0.3

Tính E(Y |X = 1), Cov(X, Y ), ρ(X, Y ).


Giải. Phân phối biên:
X 1 2 3 Y 1 2
P 0,3 0,2 0,5 P 0,4 0,6
Xác suất có điều kiện:
P (X = 1, Y = 1) 0, 1 1
P (Y = 1|X = 1) = = =
P (X = 1) 0, 3 3
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 25/27

P (X = 1, Y = 2) 0, 2 2
P (Y = 2|X = 1) = = =
P (X = 1) 0, 3 3
Phân phối có điều kiện:
Y |X = 1 1 2
P 1/3 2/3

Do đó: E(Y |X = 1) =
P
yi P (Y = yi |X = 1) = 5/3.
Hiệp phương
P sai: Cov(X, Y ) = E(XY P ) − E(X)E(Y ), trong đó:P
E(X) = pi xi = 2, 2; E(Y ) = pi yi = 1, 6; E(XY ) = pij xi yj = 3, 5
⇒ Cov(X, Y ) = 3, 5 − 2, 2 ∗ 1, 6 = −0, 02
Phương sai:
D(X) = E(X 2 ) − (EX)2 =P pi x2i − 2, 22 = 0, 76
P
D(Y ) = E(Y 2 ) − (EY )2 = pi yi2 − 1, 62 = 0, 24

Cov(X, Y ) −0, 02
⇒ ρ(X, Y ) = p =√ = −0, 0468
D(X)D(Y ) 0, 76 ∗ 0, 24
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 26/27
Ví dụ 8
Cho vectơ ngẫu nhiên (X, Y ) có hàm
( mật độ đồng thời:
x + y, (x, y) ∈ [0, 1]2
f (x, y) =
0, / [0, 1]2
(x, y) ∈

Tính P (0 < X < 1/2 < Y < 1), Cov(X, Y ), D(X + 2Y ).


Giải. Xác suất: Z 1/2 Z 1
P (0 < X < 1/2 < Y < 1) = f (x, y)dydx = ...
0 1/2

Phân phối biên: Z +∞ Z 1


fX (x) = f (x, y)dy = (x + y)dy = x + 1/2, x ∈ [0, 1]
−∞ 0
Z +∞ Z 1
fY (y) = f (x, y)dx = (x + y)dx = y + 1/2, y ∈ [0, 1]
−∞ 0
Z +∞ Z 1
E(X) = xfX (x)dx = x(x + 1/2)dx = 7/12; E(Y ) = 7/12
−∞ 0
Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 27/27

Z +∞ Z +∞ Z 1Z 1
E(XY ) = xyf (x, y)dxdy = xy(x + y)dxdy = 1/3
−∞ −∞ 0 0

Suy ra: Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 1/3 − (7/12)2 = −1/144.


Mặt khác,

D(X + 2Y ) = D(X) + D(2Y ) + 2Cov(X, 2Y ) = D(X) + 4D(Y ) + 4Cov(X, Y )


Z +∞ Z 1
2 2
E(X ) = x fX (x)dx = x2 (x + 1/2)dx = 5/12; E(Y 2 ) = 5/12
−∞ 0
D(X) = E(X 2 ) − (EX)2 = 5/12 − (7/12)2 = 11/144; D(Y ) = 11/144

Vậy, D(X + 2Y ) = 11/144 + 4 ∗ 11/144 − 4 ∗ 1/144 = 17/48

Tôn Thất Tú - 2021 Chương 3. Vectơ ngẫu nhiên 28/27

XÁC SUẤT THỐNG KÊ


Tôn Thất Tú

Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 1/32


Chương 4: Thống kê mô tả
Giới thiệu
«Statistics is the discipline that concerns the collection, organization, analysis,
interpretation, and presentation of data.»
https://en.wikipedia.org/wiki/Statistics

- Thống kê: khoa học về điều tra và thu thập dữ liệu, tổ chức và sắp xếp dữ liệu, phân
tích, diễn giải và trình bày dữ liệu.
- Mục đích: Rút ra các thông tin hữu ích về quy luật phân phối của tổng thể đang
nghiên cứu từ dữ liệu thu được.
- Thống kê được chia thành:
+ Thống kê mô tả: mô tả dữ liệu thông qua các công cụ: bảng biểu, chỉ số và các biểu
đồ thống kê.
+ Thống kê suy diễn: sử dụng dữ liệu thu được để đưa ra các nhận xét, suy đoán và
kết luận về tổng thể nghiên cứu (dựa trên cơ sở của lý thuyết xác suất).

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 2/32

1. Tổng thể và mẫu


a. Các khái niệm:
- Tổng thể : tập hợp toàn bộ các phần tử thống nhất theo dấu hiệu nghiên cứu. Tổng
thể có thể hữu hạn hoặc vô hạn.
- Mẫu: một tập con bất kì của tổng thể. Số lượng phần tử của nó được gọi là kích
thước hay cỡ mẫu.
- Phép lấy mẫu: việc chọn một tập con bất kì của tổng thể.
- Mẫu ngẫu nhiên: một mẫu là ngẫu nhiên nếu việc chọn các cá thể được tiến hành
độc lập và có xác suất chọn như nhau.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 3/32

Về mặt toán học, mẫu ngẫu nhiên được mô tả như sau:


X Xét dấu hiệu nghiên cứu được đặc trưng bởi biến X. Gọi Xi là số đo về dấu hiệu
X của đối tượng thứ i trong mẫu. Khi đó, các biến ngẫu nhiên Xi độc lập và có phân
phối như biến X.
X Một mẫu ngẫu nhiên kích thước n từ tổng thể có phân phối theo biến ngẫu nhiên
X có thể xem như một bộ n biến ngẫu nhiên {X1 , X2 , ..., Xn } độc lập và có cùng phân
phối với X.
- Cho mẫu ngẫu nhiên {X1 , X2 , ..., Xn }. Khi đó:
+ Bộ n giá trị {x1 , x2 , ..., xn } cụ thể quan thu được được gọi là mẫu thực nghiệm.
+ Một hàm (đo được) T = T(X1 , X2 , ..., Xn ) được gọi là một thống kê trên mẫu
ngẫu nhiên {X1 , X2 , ..., Xn }.

b. Phép lấy mẫu đơn giản:


- Lấy có hoàn lại: Chọn ngẫu nhiên một cá thể từ tổng thể, ghi lại các dấu hiệu cần
quan tâm và hoàn trả lại vào tổng thể trước khi chọn tiếp lần sau.
- Lấy không hoàn lại: tương tự trên, nhưng phần tử được lấy ra không trả lại vào
tổng thể trước khi chọn tiếp.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 4/32
2. Bảng tần số, tần suất
a. Mẫu không ghép lớp
- Bảng tần số:

Giá trị x1 x2 ... xm


Tần số n1 n2 ... nm

trong đó x1 , ..., xm là các giá trị khác nhau với số lần xuất hiện là n1 , ..., nm .
- Bảng tần suất:

Giá trị x1 x2 ... xm


Tần suất f1 f2 ... fm
m
trong đó fi = ni /n, n = ni . Giá trị fi được gọi là tần suất xuất hiện của xi trong
P
i=1
mẫu.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 5/32

Ví dụ 1
Khảo sát số học sinh ở các khối lớp của một trường THCS ta được bảng số liệu:

Lớp 6 7 8 9
Số học sinh 230 217 220 235

Nếu quan tâm thêm giới tính, ta được bảng 2 chiều:

Lớp
6 7 8 9
Giới tính
Nam 110 117 105 115
Nữ 120 100 115 120

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 6/32

Nếu ta quan tâm thêm tình trạng học học sinh có đeo kính hay không, ta có thể thiết
lập bảng tần số như sau:

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 7/32


b. Mẫu ghép lớp
Khi ta thu được mẫu dữ liệu với nhiều giá trị khác nhau thì người ta tiến hành chia
miền giá trị thành nhiều khoảng [ai−1 , ai ) không giao nhau.
- Bảng tần số:

Khoảng giá trị [a0 , a1 ) [a1 , a2 ) ... [am−1 , am )


Tần số n1 n2 ... nm

- Bảng tần suất:

Khoảng giá trị [a0 , a1 ) [a1 , a2 ) ... [am−1 , am )


Tần suất f1 f2 ... fm

Nhận xét: Thông thường các khoảng chia có độ dài bằng nhau. Tuy nhiên, tùy thuộc
vào mục đích nghiên cứu mà ta có thể có những cách chia khoảng khác nhau. Số khoảng

chia thường từ 5-20 khoảng, hoặc [ n], hoặc [log2 n] ([x] - số nguyên lớn nhất không
vượt quá x).
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 8/32

Ví dụ 2
Cân thử 100 trái táo vừa thu hoạch, ta được bảng số liệu sau:

Khối lượng (g) [100;120) [120;140) [140;160) [160;180) [180;200)


Số trái 12 19 31 23 15

Ví dụ 3
Khảo sát ngẫu nhiên một nhóm người từ độ tuổi 15 trở lên thường đọc tin tức thời sự
online ở một thành phố, số liệu được thể hiện ở bảng sau:

Độ tuổi [15,20) [20,30) [30,40) [40,50) ≥ 50


Số người 20 25 20 30 15

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 9/32

3. Các số đặc trưng mẫu

a. Trung bình và phương sai mẫu


Cho {x1 , x2 , ..., xn } là mẫu số liệu của biến ngẫu nhiên X.
- Trung bình mẫu, kí hiệu là x, được tính theo công thức:
n
x1 + x2 + ... + xn 1X
x= = xi
n n
i=1

- Phương sai mẫu, kí hiệu là s2 , được tính theo công thức:


 
n n
1 X 1 X
s2 = (xi − x)2 =  x2i − n(x)2 
n−1 n−1
i=1 i=1

- Độ lệch chuẩn mẫu, kí hiệu s, được tính:



s= s2
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 10/32
Nhận xét:
i) Khi mẫu được cho ở dạng bảng tần số:

X x1 x2 ... xm
ni n1 n2 ... nm

- Kích thước mẫu: n = n1 + n2 + ... + nm .


m
1 P
- Trung bình mẫu: x = ni x i .
n i=1
1 P n
- Phương sai mẫu: s2 = ni (xi − x)2 .
n√
− 1 i=1
- Độ lệch chuẩn mẫu: s = s2

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 11/32

ii) Khi mẫu ở dạng bảng ghép lớp:

X a0 − a1 a1 − a2 ... am−1 − am
ni n1 n2 ... nm

trong đó ak−1 − ak = [ak−1 ; ak ).


ak−1 + ak
Đặt xk = ta được mẫu dạng thu gọn:
2
X x1 x2 ... xm
ni n1 n2 ... nm

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 12/32

iii) Hướng dẫn sử dụng máy tính Casio:


X Tính x và s bằng máy tính CASIO FX570VN PLUS.
- Mode → 3 → 1
- Bật/tắt tần số: Shift → SETUP → REPLAY (↓) → 4(Stat)
- Nhập số liệu, kết thúc nhập: bấm AC
- Lấy x: Shift → 1 → 4 → 2 → =
- Lấy s: Shift → 1 → 4 → 4 → =

X Tính x và s bằng máy tính CASIO FX580VN.


- Setup → 6-Statistics → = → 1
- Bật/tắt tần số: Shift → SETUP → REPLAY (↓) → 3(Statistics)
- Nhập số liệu, kết thúc nhập: bấm AC
- Lấy x: OPTN → REPLAY (↓) → 2 → 1 → =
- Lấy s: OPTN → REPLAY (↓) → 2 → 5 → =

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 13/32


Ví dụ 4
Chiều cao (mét) của 10 sinh viên đại học: 1.75, 1.69, 1.70, 1.82, 1.68, 1.72, 1.70, 1.67,
1.71, 1.68. Tính trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu.
Đáp số. x̄ = 1, 712; s2 = 0.00197; s = 0.0444
Ví dụ 5
Doanh thu X (triệu đồng) trong 100 ngày được chọn ngẫu nhiên của 1 cửa hàng:
X 19,0 - 19,4 19,4 - 19,8 19,8 - 20,2 20,2 - 20,6 20,6 - 21,0
ni 15 25 30 20 10
Tìm trung bình mẫu và độ lệch chuẩn mẫu.
Giải. Dạng thu gọn:
X 19,2 19,6 20 20,4 20,8
ni 15 25 30 20 10

Các số đặc trưng mẫu: x̄ = 19, 94; s = 0, 48


Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 14/32

b. Trung vị mẫu
Sắp xếp mẫu số liệu theo thứ tự tăng dần, giả sử x1 ≤ x2 ≤ ... ≤ xn . Trung vị mẫu, kí
hiệu xmed , xác định bởi:

x n+1 ,
 nếu n lẻ,
xmed = x n2 + x n +1
 2
 2
nếu n chẵn.
2

c. Hệ số tương quan mẫu


Cho {(x1 , y1 ); (x2 , y2 ); ...; (xn , yn )} là mẫu hai chiều của vectơ ngẫu nhiên (X, Y ). Hệ
số tương quan mẫu được xác định bởi:
Pn
(xi − x)(yi − y)
r = pPn i=1 Pn
2 2
i=1 (xi − x) i=1 (yi − y)

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 15/32

3. Biểu đồ
a. Biểu đồ cho dữ liệu rời rạc:
- Biểu đồ cột: đồ thị gồm các cột hình chữ nhật có chiều cao bằng tần số (tần suất)
tương ứng.
- Đa giác tần số : đường gấp khúc nối các điểm (x1 , n1 ), ..., (xk , nk ) trên mặt phẳng.
- Đa giác tần suất: đường gấp khúc nối các điểm (x1 , f1 ), ..., (xk , fk ) trên mặt phẳng.
- Biểu đồ hình tròn: hình tròn được chia ra các phần có góc ở tâm tỉ lệ với tần số (tần
suất) tương ứng.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 16/32


Ví dụ 6
Khảo sát số lần đi chợ (X) trong một tuần của một nhóm người được chọn ngẫu nhiên
trong chợ, ta được bảng số liệu sau:

X 1 2 3 4 5
Tần số 12 30 20 11 7
Tần suất 0.15 0.4 0.3 0.14 0.1

Hãy vẽ các biểu đồ:


- biểu đồ cột (tần số, tần suất)
- đa giác tần số, tần suất
- biểu đồ hình tròn

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 17/32

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 18/32

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 19/32


Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 20/32

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 21/32

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 22/32


b. Biểu đồ cho dữ liệu liên tục:
- Tổ chức đồ (histogram): Miền giá trị được chia làm m khoảng với độ dài các khoảng
lần lượt là hi (thường ta chọn hi = h). Khi đó tổ chức đồ của mẫu dữ liệu này gồm m
hình chữ nhật:
+ Đáy hình thứ i trùng với khoảng thứ i trên trục hoành, có độ dài hi .
+ Chiều cao của hình thứ i bằng di , trong đó:
⊲ di = ni : tổ chức đồ tần số
ni
⊲ di = : tổ chức đồ tần suất
n
ni
⊲ di = : tổ chức đồ mật độ
n.hi
với ni là số lượng các giá trị nằm trong khoảng thứ i và n = n1 + n2 + ... + nm .

Ví dụ 7
Dữ liệu được khảo sát từ biến ngẫu nhiên liên tục. Miền dữ liệu được chia thành 10
khoảng đều nhau. Các tổ chức đồ được xây dựng như ở hình sau đây.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 23/32

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 24/32

- Biểu đồ xác suất chuẩn: Giả sử mẫu số liệu của biến ngẫu nhiên liên tục X đã sắp thứ
tự tăng dần:
x1 ≤ x2 ≤ x3 ≤ ... ≤ xn .
Với i = 1, 2, ..., n, đặt  
i − 0.5
zi = Φ−1 hay Φ(zi ) = (i − 0, 5)/n.
n

Biểu đồ xác suất chuẩn là tập hợp các điểm có tọa độ (zi ; xi ), i = 1, 2, ..., n trên hệ
trục tọa độ Descartes vuông góc Ozx.
Nếu (zi ; xi ), i = 1, 2, ..., n nằm xấp xỉ trên 1 đường thẳng thì có thể xem biến ngẫu
nhiên X có phân phối chuẩn. Đường thẳng này có phương trình: x = σ̂z + µ̂ , với
µ̂ = x̄, σ̂ = s - trung bình và độ lệch chuẩn mẫu được tính dựa trên mẫu đã cho.
Nhận xét: Ở các phần mềm thống kê, người ta còn sử dụng các cách thức khác để xây
dựng đường thẳng ở trên.
Ví dụ 8
Quan sát biểu đồ xác suất chuẩn sau đây.
Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 25/32
BIỂU ĐỒ XÁC SUẤT CHUẨN

6.5
6.0
5.5
5.0
4.5
4.0

•1.5 •1.0 •0.5 0.0 0.5 1.0 1.5

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 26/32

4. Phân phối mẫu


a. Trường hợp tổng thể tuân theo phân phối chuẩn
Định lý 1: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
phối chuẩn N (µ; σ 2 ) thì

σ2 
 (X − µ) n
X ∼ N µ, hay ∼ N (0, 1).
n σ

Định lý 2: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có phân
phối chuẩn N (µ; σ 2 ) thì:

(n − 1)S 2 2 (X − µ) n
∼ χn−1 , ∼ Tn−1
σ2 S

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 27/32

Định lý 3: Nếu {X1 , X2 , ..., Xn } và {Y1 , Y2 , ..., Ym } là hai mẫu ngẫu nhiên của hai biến
ngẫu nhiên độc lập X và Y có phân phối chuẩn N (µ1 ; σ12 ) và N (µ2 ; σ22 ) tương ứng thì:
!
σ12 σ22
X − Y ∼ N µ1 − µ2 , +
n m

2 /σ 2
SX 1
∼ Fn−1,m−1 .
SY2 /σ22
b. Trường hợp tổng thể không tuân theo luật phân phối chuẩn
- Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của biến ngẫu nhiên X có E(X) =
µ, D(X) = σ 2 hữu hạn thì khi n lớn (n > 30) theo định lý giới hạn trung tâm:

σ2  n(X − µ)
X có phân phối xấp xỉ N µ, và có phân phối xấp xỉ N (0, 1)
n S

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 28/32


- Nếu X là số lượng cá thể mang dấu hiệu A có tỉ lệ là p = P (A) trong mẫu ngẫu nhiên
kích thước n, thì
X ∼ B(n, p)
Theo định lý Moivre-Laplace, nếu n lớn thì X có phân phối xấp xỉ N (np, np(1 − p)).
Do đó, tỉ lệ mẫu
X
p̂ =
n
 
p(1 − p)
có phân phối xấp xỉ phân phối chuẩn N p,
n

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 29/32

Ví dụ 9
Chiều cao của thanh niên tuân theo luật phân phối chuẩn N (µ; σ 2 ), với µ = 165(cm)
và σ = 5(cm). Tính xác suất chiều cao trung bình của 16 thanh niên được chọn ngẫu
nhiên lớn hơn 167 (cm).

Giải. Gọi Xi là chiều cao của thanh niên thứ i, i = 1, 16.


Đặt X̄ = (X1 + ... + X16 )/16. Khi đó, X̄ cũng có phân phối chuẩn với trung bình
µ = 165 và phương sai σ 2 /n = 25/16.
Xác suất cần tìm:
 
167 − 165
P (X̄ > 167) = 1 − P (X̄ ≤ 167) = 1 − Φ = 0.0548
5/4

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 30/32

Ví dụ 10
Để nghiên cứu về thâm niên công tác (tính tròn năm) của nhân viên ở một công ty lớn,
người ta khảo sát thâm niên của 100 nhân viên được chọn ngẫu nhiên trong công ty.
Kết quả như sau:

Thâm niên 5-7 8-10 11-13 14-16 17-19


Số nhân viên 8 21 36 25 10

a. Hãy tính giá trị trung bình mẫu và giá trị độ lệch chuẩn mẫu.
b. Giả sử thâm niên công tác của nhân viên ở công ty trên là biến ngẫu nhiên X có kỳ
vọng là 12 năm và độ lệch chuẩn là 3 năm. Tính xác suất để trung bình mẫu nhận giá
trị lớn hơn 12,5 năm.

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 31/32


Giải. Dạng thu gọn:

Thâm niên 6 9 12 15 18
Số nhân viên 8 21 36 25 10

a. Các số đặc trưng mẫu: x̄ = 12, 24; s = 3, 27.


b. Theo định lý giới hạn trung tâm X̄ có phân phối xấp xỉ chuẩn N (12; 32 /100) =
N (12; 0, 09). Do đó:
 
12, 5 − 12
P (X̄ > 12, 5) = 1 − Φ √ = 0.0478
0, 09

Tôn Thất Tú - 2021 Chương 4: Thống kê mô tả 32/32

XÁC SUẤT THỐNG KÊ


Tôn Thất Tú

Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 1/45

Chương 5. Ước lượng tham số

1. Ước lượng điểm

1.1 Định nghĩa


- Cho mẫu ngẫu nhiên {X1 , X2 , ..., Xn } từ tổng thể có phân phối phụ thuộc vào
tham số θ chưa biết. Khi đó, một hàm (thống kê) θ̂ = θ̂(X1 , ..., Xn ) được gọi là một
ước lượng của tham số θ.
- Với một mẫu giá trị cụ thể {x1 , x2 , ..., xn } ta thu được một giá trị cụ thể của θ̂.
Khi đó, giá trị θ̂(x1 , ..., xn ) được gọi là ước lượng điểm của tham số θ dựa trên mẫu giá
trị {x1 , x2 , ..., xn }.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 2/45


1.2 Phân loại ước lượng
- Ước lượng θ̂ = θ̂(X1 , ..., Xn ) được gọi là ước lượng không chệch của tham số θ nếu
E(θ̂) = θ.
Trong trường hợp ngược lại thì ta gọi θ̂ được gọi là ước lượng chệch và giá trị b(θ) =
E(θ̂) − θ được gọi là độ chệch của ước lượng.
- Ước lượng θ̂ = θ̂(X1 , ..., Xn ) được gọi là ước lượng không chệch tiệm cận của tham
số θ nếu
lim E(θ̂) = θ.
n→+∞

- Cho θ̂1 và θ̂2 là hai ước lượng không chệch của tham số θ.

D(θ̂1 ) = E(θ̂1 − E θ̂1 )2 = E(θ̂1 − θ)2 và D(θ̂2 ) = E(θ̂2 − E θ̂2 )2 = E(θ̂2 − θ)2

Ta nói ước lượng θ̂1 hiệu quả hơn ước lượng θ̂2 nếu D(θ̂1 ) < D(θ̂2 ).
- Ước lượng θ̂ của θ là ước lượng không chệch và có phương sai D(θ̂) bé nhất được
gọi là ước lượng tốt nhất.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 3/45

Ước lượng không chệch của trung bình và phương sai


Định lý: Cho biến ngẫu nhiên X của một tổng thể có E(X) = µ, D(X) = σ 2 . Giả sử
{X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X. Khi đó:
1 Pn
i) X = Xi là ước lượng không chệch của µ.
n i=1
1 P n
ii) S 2 = (Xi − X)2 là ước lượng không chệch của σ 2 .
n − 1 i=1
Nhận xét: Có thể chứng minh được rằng:
n
n−1 2 1X
E(S∗2 ) = σ với S∗2 = (Xi − X̄)2
n n
i=1

Điều này có nghĩa S∗2 là ước lượng chệch (không chệch tiệm cận) của σ 2 , do đó nó
«không được chọn» làm phương sai mẫu.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 4/45

Ước lượng không chệch của tỉ lệ


Định lý: Cho biến ngẫu nhiên X có phân phối Bernoulli với tham số p. Gọi
(X1 , X2 , ..., Xn ) là mẫu ngẫu nhiên của X. Khi đó:

X1 + X2 + ... + Xn
P̂ =
n

là một ước lượng không chệch của tham số p.


Ý nghĩa: Nếu dấu hiệu A có tỉ lệ p chưa biết, và trong mẫu điều tra kích thước n có k
cá thể mang dấu hiệu A, thì tần suất fn = k/n là một ước lượng không chệch của p.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 5/45


Ví dụ 1
- Cho biến ngẫu nhiên X có kỳ vọng µ và phương sai σ 2 chưa biết. Để ước lượng
cho µ và σ 2 người ta tiến hành điều tra mẫu kích thước 200 và tính được trung bình và
phương sai chuẩn mẫu:
x̄ = 125, 8; s2 = 2, 76
Khi đó, ta có thể xem µ ≈ 125, 8 và σ 2 ≈ 2, 76.
- Để ước lượng tỉ lệ p cử tri ủng hộ cho ứng cử viên A, người ta khảo sát ngẫu nhiên
4000 người thì có 2640 người ủng hộ ứng cử viên này. Như vậy, ta có thể xem tỉ lệ ủng
hộ ứng cử viên A xấp xỉ:
p ≈ 2640/4000 = 0, 66
1.3 Phương pháp hợp lý cực đại
Định nghĩa:
- Cho {k1 , k2 , ..., kn } là mẫu ngẫu nhiên kích thước n của phân phối rời rạc X có hàm
xác suất p(k, θ) với θ là tham số chưa biết. Hàm hợp lí L(θ) là hàm được định nghĩa
như sau: Yn
L(θ) = p(ki , θ).
i=1
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 6/45

- Nếu {x1 , x2 , ..., xn } là mẫu ngẫu nhiên kích thước n của phân phối liên tục có hàm
mật độ xác suất f (x, θ) với θ là tham số chưa biết thì hàm hợp lí L(θ) là hàm được
định nghĩa như sau:
Yn
L(θ) = f (xi , θ).
i=1

Nhận xét: Hàm hợp lí L(θ) chính là hàm xác suất (mật độ xác suất) đồng thời của
mẫu ngẫu nhiên.

Định nghĩa: Cho hàm hợp lí L(θ) với tham số θ chưa biết. Nếu θM L là giá trị tham số
thỏa mãn L(θM L ) ≥ L(θ) với mọi θ thì θM L được gọi là ước lượng hợp lí cực đại của
tham số θ.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 7/45

Nhận xét:
i) Trong thực hành để tìm ước lượng hợp lý cực đại ta giải phương trình:

L′ (θ) = 0 hoặc [ln(L(θ))]′ = 0

ii) Trường hợp θ là một vectơ các tham số, tức là θ = (θ1 , ..., θm ), để tìm ước lượng
hợp lý cực đại ta giải hệ phương trình sau đây:
 
 ∂L(θ)  ∂ ln L(θ)
= 0, = 0,

 

 ∂θ1  ∂θ1

 

··· hoặc ···
 ∂L(θ) ∂ ln L(θ)

 

 ∂θ = 0, = 0.
 

 
 ∂θ
m m

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 8/45


Ví dụ 2
Tìm ước lượng tham số của phân phối Poisson bằng phương pháp hợp lí cực đại.

Giải. Phân phối Poisson với tham số λ có hàm xác suất:


λx −λ
f (x) = e , x = 0, 1, ...
x!
Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý L(λ)
được xác định: n Pn
Y λ i=1 xi −nλ
L(λ) = f (xi ) = Qn e .
i=1 i=1 xi !

Suy ra: n
X n
Y
ln L(λ) = xi ln(λ) − ln( xi !) − nλ.
i=1 i=1
n n
Do đó: d ln L(λ) 1 X 1X
= xi − n = 0 ⇔ λ = xi .
dλ λ n
i=1 i=1
Vậy, ước lượng hợp lý cực đại λM L của λ là: λM L = n1 ni=1 xi .
P

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 9/45

Ví dụ 3
Tìm ước lượng tham số của phân phối chuẩn N (µ; σ 2 ) bằng phương pháp ước lượng
hợp lí cực đại.

Giải. Phân phối chuẩn N (µ, σ 2 ) có hàm mật độ xác suất:


! "
1 (x − µ)2
f (x) = √ exp − .
σ 2π 2σ 2

Giả sử {x1 , ..., xn } là một mẫu ngẫu nhiên từ phân phối trên. Khi đó, hàm hợp lý
L(µ, σ 2 ) được xác định:
n
! P "
n 2
Y 1 (x i − µ)
L(µ, σ 2 ) = f (xi ) = √ exp − i=1 2 .
σ n ( 2π)n 2σ
i=1

Suy ra:
Pn
n n i=1 (xi − µ)2
ln L(µ, σ ) = − ln(σ 2 ) − ln(2π) −
2
.
2 2 2σ 2
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 10/45

Do đó:
Pn
∂ ln L(µ, σ 2 ) (xi − µ)
= i=1 2 ,
∂µ σ
n 2
∂ ln L(µ, σ 2 )
P
n i=1 (xi − µ)
= − + .
∂σ 2 2σ 2 2σ 4
Giải hệ:

 ∂ ln L(µ, σ 2 )

 =0
∂µ
∂ ln L(µ, σ 2 )
= 0,



∂σ 2
n n
theo µ, σ 2 ta được: 1X 1X
µ= xi = x̄ và σ 2 = (xi − x̄)2 .
n n
i=1 i=1

Vậy ước lượng hợp lý cực đại (µM L , σM


2 ) của (µ, σ 2 ) là:
L
n
1X
µM L = x̄ và σM2
L = (xi − x̄)2 .
n
i=1

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 11/45


2. Khoảng tin cậy

2.1 Định nghĩa


Cho biến ngẫu nhiên X có phân phối phụ thuộc vào tham số θ chưa biết và
{X1 , X2 , ..., Xn } là một mẫu ngẫu nhiên từ phân phối này. Trên cơ sở mẫu ngẫu nhiên
này ta xây dựng hai hàm L = L(X1 , ..., Xn ) và U = U (X1 , ..., Xn ) sao cho với một số
α ∈ (0, 1) cho trước ta có:

P (L < θ < U ) = 1 − α. (*)

Khi đó, khoảng (L, U ) được gọi là khoảng tin cậy của tham số θ với độ tin cậy 1 − α.
Giá trị α được gọi là mức ý nghĩa. Hiệu số U − L được gọi là độ dài khoảng tin cậy.
Ý nghĩa: Nếu ta thực hiện việc lấy mẫu nhiều lần và mỗi lần ta đều tính khoảng tin
cậy (L, U ) dựa trên mẫu thu được, thì tỉ lệ khoảng tin cậy chứa giá trị chính xác θ xấp
xỉ 1 − α.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 12/45

Phương pháp chung xây dựng khoảng tin cậy với độ tin cây cậy 1 − α:
i) chọn hai số α1 , α2 ∈ (0, 1) sao cho α1 + α2 = α.
ii) xây dựng thống kê:
Gn = Gn (X1 , ..., Xn , θ)
sao cho phân phối của Gn hoàn toàn xác định (hoặc phân phối giới hạn của Gn khi
n → ∞ xác định) và không phụ thuộc vào tham số θ. Ngoài ra, Gn là một hàm đơn
điệu theo θ.
iii) Chọn hai số a và b sao cho P (Gn ≤ a) = α1 và P (Gn < b) = 1 − α2 .
iv) Giải bất phương trình a < Gn (X1 , ..., Xn , θ) < b theo θ ta được khoảng tin cậy cần
tìm.

Nhận xét:
i) Trong một số trường hợp, các giá trị L, U trong định nghĩa có thể được chọn sao cho:

P (L < θ < U ) ≥ 1 − α.

ii) Nếu α1 = 0 hoặc α2 = 0 ta được các khoảng tin cậy 1 phía.


Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 13/45

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 14/45


2.2 Khoảng tin cậy cho kì vọng khi đã biết phương sai
Bài toán. Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ chưa biết và σ 2 đã biết. Tìm khoảng tin cậy cho µ với mức ý nghĩa α.
Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì

(X − µ) n
Z= ∼ N (0; 1).
σ
- Với α ∈ (0; 1), chọn α1 = α2 = α/2 và chọn zα/2 sao cho P (Z > zα/2 ) = α/2. Giá
trị zα/2 được gọi là giá trị tới hạn mức α/2 của phân phối chuẩn tắc. Sau đó, ta giải
bất phương trình:
σ σ
−zα/2 < Z < zα/2 ⇔ X − zα/2 √ < µ < X + zα/2 √
n n

ta được khoảng tin cậy đối xứng.


- Nếu chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay zα/2 bởi zα và thu được khoảng tin
cậy một phía.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 15/45

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 16/45

a. Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
σ σ
x − zα/2 √ < µ < x + zα/2 √ ,
n n

- Khoảng tin cậy tối đa của µ:


σ
µ < x + zα √ .
n

- Khoảng tin cậy tối thiểu của µ:


σ
µ > x − zα √ .
n

Nhận xét: Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả
trên vẫn áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu
nhiên X.
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 17/45
Ví dụ 4

Khối lượng (kg) của một thiết bị có phân phối chuẩn N (µ; σ 2 ) với σ = 0.2 (kg). Chọn
ngẫu nhiên 25 thiết bị người ta tính được trung bình mẫu x = 65, 1 (kg). Với độ tin cậy
95% hãy tìm khoảng tin cậy (đối xứng) cho khối lượng trung bình của thiết bị này. Cho
biết z0,025 = 1, 96.

Giải.
- Các số đặc trưng mẫu: n = 25; x̄ = 65, 1.
- Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96.
- Sai số ước lượng:
σ 0, 2
ε = zα/2 √ = 1, 96 ∗ √ = 0, 0784
n 25
- Khoảng tin cậy cho khối lượng trung bình µ của thiết bị này:

x̄ − ε < µ < x̄ + ε ⇔ 65, 02 < µ < 65, 18

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 18/45

b. Vấn đề cỡ mẫu
Từ công thức khoảng tin cậy cho µ ta thấy rằng sai số của ước lượng |x − µ| bé hơn
σ
hoặc bằng zα/2 √ .
n
- Sai số ước lượng:
σ
ε = zα/2 √
n
- Điều kiện hạn chế: ε < ∆ với ∆ > 0 cho trước.
σ
ε = zα/2 √ < ∆
n

- Giải bất phương trình theo n:


2
zα/2 σ

n> .

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 19/45

Ví dụ 5
Trở lại với Ví dụ 4 nếu yêu cầu sai số ước lượng không vượt quá 0,05 thì với độ tin cậy
98% ta cần chọn tối thiểu bao nhiêu thiết bị để khảo sát? Cho biết z0,01 = 2, 326.

Giải.
- Sai số ước lượng:
σ
ε = zα/2 √
n
- Điều kiện hạn chế: ε < ∆ = 0, 05.
- Suy ra:
zα/2 σ 2
 
n> .

- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326.
Do đó:
2, 326 ∗ 0, 2 2
 
n> = 86, 56
0, 05
Vậy, kích thước mẫu tối thiểu cần khảo sát: n = 87
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 20/45
2.3 Khoảng tin cậy cho kì vọng khi chưa biết phương sai
Bài toán: Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ và σ 2 chưa biết. Tìm khoảng tin cậy cho µ với độ tin cậy 1 − α.
Gợi ý. Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì

(X − µ) n
T = ∼ Tn−1
S

- Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị tn−1;α/2 là giá trị tới hạn của
phân phối Tn−1 , tức là P (T > tn−1;α/2 ) = α/2. Sau đó, giải phương trình:

S S
−tn−1;α/2 < T < tn−1;α/2 ⇔ X − tn−1;α/2 √ < µ < X + tn−1;α/2 √
n n

- Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay tn−1;α/2 bởi tn−1;α và thu được khoảng
tin cậy một phía.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 21/45

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 22/45

Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng của µ:
s s
x − tn−1;α/2 √ < µ < x + tn−1;α/2 √ ,
n n

- Khoảng tin cậy tối đa của µ:


s
µ < x + tn−1;α √ .
n

- Khoảng tin cậy tối thiểu của µ:


s
x − tn−1;α √ < µ.
n

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 23/45


Nhận xét:
i) Khi n > 30: tn−1;α/2 ≈ zα/2 .
ii) Khi kích thước mẫu lớn (n > 30) theo định lý giới hạn trung tâm kết quả trên vẫn
áp dụng được dù thiếu giả thiết về điều kiện phân phối chuẩn của biến ngẫu nhiên X.
Lúc đó, ta thay tn−1;γ bởi zγ với γ = α hoặc γ = α/2.

Ví dụ 6
Một mẫu 16 pin dùng cho smartphone được chọn ngẫu nhiên của công ty A có tuổi thọ
trung bình tính trên mẫu x = 24308 (giờ) và độ lệch chuẩn mẫu s = 727 (giờ). Giả sử
rằng tuổi thọ pin smartphone có phân phối chuẩn. Với độ tin cậy 95%, hãy tìm khoảng
tin cậy cho tuổi thọ trung bình của pin smartphone được sản xuất bởi công ty A. Cho
biết t15;0,025 = 2, 1314.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 24/45

Giải. Theo giả thiết:


n = 16; x̄ = 24308; s = 727
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 = t15;0,025 = 2, 1314
Sai số:
s 727
ε = tn−1;α/2 √ = 2, 1314 ∗ √ = 387, 382
n 16
Khoảng tin cậy cho tuổi thọ trung bình của pin smartphone:

x̄ − ε < µ < x̄ + ε ⇔ 23920.618 < µ < 24695.382

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 25/45

Ví dụ 7
Năng suất (tạ/ha) của một loại cây trồng tuân theo luật phân phối chuẩn. Hãy tìm ước
lượng khoảng đối xứng năng suất trung bình của một loại cây trồng này với độ tin cậy
95% trên cơ sở bảng số liệu điều tra sau đây:

Năng suất(tạ/ha) 42-47 47-52 52-57 57-62 62-67


Số điểm thu hoạch 2 5 14 10 5

Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.

Giải. Dạng thu gọn:

Năng suất(tạ/ha) 44,5 49,5 54,5 59,5 64,5


Số điểm thu hoạch 2 5 14 10 5

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 26/45


Các số đặc trưng mẫu:
n = 36; x̄ = 56, 028; s = 5, 321
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 ≈ zα/2 = z0,025 = 1, 96
Sai số:
s 5, 321
ε = tn−1;α/2 √ = 1, 96 ∗ √ = 1, 738
n 36
Khoảng tin cậy cho năng suất trung bình:

x̄ − ε < µ < x̄ + ε ⇔ 54, 29 < µ < 57, 766

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 27/45

2.4 Khoảng tin cậy cho phương sai


Bài toán: Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với
µ và σ 2 chưa biết. Tìm khoảng tin cậy cho σ 2 với độ tin cậy 1 − α.
Kết quả: Nếu {X1 , X2 , ..., Xn } là mẫu ngẫu nhiên của X thì biến ngẫu nhiên:

(n − 1)S 2
χ2 = ∼ χ2n−1 .
σ2

- Với mức ý nghĩa α, chọn α1 = α2 = α/2 và lấy giá trị χ2n−1;α/2 , χ2n−1;1−α/2 là giá trị
tới hạn mức α/2 và 1 − α/2 của phân phối χ2n−1 , ta được khoảng tin cậy hai phía.
- Chọn α1 = 0 hoặc α2 = 0. Lúc này ta thay χ2n−1;α/2 bởi χ2n−1;α , χ2n−1;1−α/2 bởi
χ2n−1;1−α và thu được khoảng tin cậy một phía.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 28/45

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 29/45


Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy hai phía cho σ 2 :

(n − 1)s2 2 (n − 1)s2
< σ < ,
χ2n−1;α/2 χ2n−1;1−α/2

- Khoảng tin cậy tối đa cho phương sai σ 2 :

(n − 1)s2
0 < σ2 < .
χ2n−1;1−α

- Khoảng tin cậy tối thiểu cho phương sai σ 2 :

(n − 1)s2
2 < σ 2 < +∞.
χn−1;α

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 30/45

Ví dụ 8
Một dây chuyền tự động đóng gạo vào bao được kiểm tra. Cân thử 25 bao gạo do dây
chuyền này thực hiện thì tính được độ lệch chuẩn khối lượng gạo mỗi bao s = 0, 15
(kg). Với độ tin cậy 95% tìm khoảng tin cậy cho phương sai của khối lượng gạo được
đóng cho mỗi bao bởi dây chuyền này. Giả thiết khối lượng gạo được đóng cho mỗi bao
tuân theo luật phân phối chuẩn. Cho biết: χ224;0.025 = 39, 364, χ224;0.975 = 12, 401.

Đáp số: 0, 0137 < σ 2 < 0, 0435.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 31/45

2.5 Khoảng tin cậy cho tỷ lệ


Bài toán: Xét dấu hiệu A trong tổng thể có tỉ lệ là p (chưa biết). Hãy tìm khoảng tin
cậy cho p với độ tin cậy 1 − α.
Kết quả:
- Tiến hành điều tra một mẫu kích thước n. Giả sử trong mẫu này có k phần tử mang
dấu hiệu A.
- Gọi X là số phần tử mang dấu hiệu A trong mẫu kích thước n, ta có X ∼ B(n, p).
Theo định lý giới hạn tích phân Moivre-Laplace, biến ngẫu nhiên:
X − np
Z=p có phân phối xấp xỉ chuẩn tắc N (0, 1).
np(1 − p)

- Với α ∈ (0; 1) cho trước, chọn α1 = α2 = α/2 ta được khoảng:


r r
p(1 − p) p(1 − p)
p̂ − zα/2 < p < p̂ + zα/2
n n

với p̂ = X/n = k/n - tỉ lệ mẫu của dấu hiệu A.


Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 32/45
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 33/45

Mặt khác, do p̂ là một ước lượng của p nên ta có thể xem p ≈ p̂ khi n lớn.
Điều kiện: np̂ > 5 và n(1 − p̂) > 5.
a. Kết quả
Với độ tin cậy 1 − α:
- Khoảng tin cậy đối xứng cho p:
r r
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2 < p < p̂ + zα/2 .
n n

- Khoảng tin cây tối đa cho p:


r
p̂(1 − p̂)
p < p̂ + zα .
n

- Khoảng tin cậy tối thiểu cho p:


r
p̂(1 − p̂)
p > p̂ − zα .
n
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 34/45

Ví dụ 9
Gieo 400 hạt đậu xanh thì có 50 hạt không nảy mầm. Với độ tin cậy 98%, hãy tìm:
a) Khoảng tin cậy đối xứng cho tỉ lệ hạt nảy mầm.
b) Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm.
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.

Giải.
k 400 − 50
a. - Tỉ lệ mẫu: p̂ = = = 0, 875.
n 400
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326
r r
p̂(1 − p̂) 0, 875 ∗ (1 − 0, 875)
- Sai số: ε = zα/2 = 2, 326 ∗ = 0, 0385
n 400
- Khoảng tin cậy cho tỉ lệ hạt nảy mầm p:

p̂ − ε < p < p̂ + ε ⇔ 0, 8365 < p < 0, 9135

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 35/45


b. - Tỉ lệ mẫu:
k 50
p̂ = = = 0, 125
n 400
- Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα = z0,02 = 2, 054
- Sai số:
r r
p̂(1 − p̂) 0, 125 ∗ (1 − 0, 125)
ε = zα = 2, 054 ∗ = 0, 034
n 400

- Khoảng tin cậy tối thiểu cho tỉ lệ hạt không nảy mầm p:

p > p̂ − ε ⇔ p > 0, 091

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 36/45

b. Nhận xét
i) Khoảng tin cậy cho số lượng cá thể
Từ khoảng tin cậy cho tỉ lệ ta có thể suy ra khoảng tin cậy cho số lượng cá thể mang
dấu hiệu nghiên cứu hoặc số lượng cá thể của tổng thể. Cụ thể:
- Gọi K và N lần lượt là số lượng cá thể mang dấu hiệu nghiên cứu và số lượng cá thể
của tổng thể. Khi đó, tỉ lệ dấu hiệu nghiên cứu:
K
p= (1)
N

- Dựa trên mẫu điều tra, ta ước lượng được khoảng tin cậy cho tỉ lệ p:

p1 < p < p 2 (2)

Từ (1) và (2) suy ra khoảng tin cậy cho giá trị K hoặc N.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 37/45

Ví dụ 10
Trong một cuộc bầu cử ở một địa phương có 10000 cử tri. Người ta phỏng vấn ngẫu
nhiên 300 cử tri thì thấy có 156 người ủng hộ cho ứng cử viên A. Với độ tin cậy 95%
tìm khoảng tin cậy (đối xứng) cho số lượng cử tri ở địa phương này ủng hộ cho ứng cử
viên A.

Giải. Gọi K là số lượng cử tri ở địa phương này ủng hộ ứng cử viên A. Ta có tỉ lệ ủng
hộ ứng cử viên A: p = K/10000.
Tỉ lệ mẫu: p̂ = k/n = 156/300 = 0, 52
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96
Sai số: r
p̂(1 − p̂)
r
0, 52 ∗ 0, 48
ε = zα/2 = 1, 96 ∗ = 0, 0565
n 300
Khoảng tin cậy cho tỉ lệ ủng hộ:
p̂ − ε < p < p̂ + ε ⇔ 0, 4635 < p < 0, 5765
Từ đó, suy ra:
0, 4635 < K/10000 < 0, 5765 ⇔ 4635 < K < 5765
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 38/45
Ví dụ 11
Để ước lượng số lượng cá có trong hồ, người ta làm như sau. Bắt ngẫu nhiên 500 con
cá, sau đó đánh dấu vào các con cá đã được bắt và thả chúng xuống hồ. Sau đó bắt
ngẫu nhiên 200 con cá để kiểm tra thì thấy có 30 con có đánh dấu. Với độ tin cậy 90%
tìm khoảng tin cậy đối xứng cho số lượng cá có trong hồ.

Giải. Gọi N là số lượng cá trong hồ. Ta có tỉ lệ cá được đánh dấu: p = 500/N .


Tỉ lệ mẫu: p̂ = k/n = 30/200 = 0, 15
Độ tin cậy: 1 − α = 0, 9 ⇒ α = 0, 1; zα/2 = z0,05 = 1, 645
Sai số: r
p̂(1 − p̂)
r
0, 15 ∗ 0, 85
ε = zα/2 = 1, 645 ∗ = 0, 0415
n 200
Khoảng tin cậy cho tỉ lệ cá được đánh dấu:
p̂ − ε < p < p̂ + ε ⇔ 0, 1085 < p < 0, 1915
Từ đó, suy ra:
0, 1085 < 500/N < 0, 1915 ⇔ 2610, 9 < N < 4608, 3
Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 39/45

ii) Vấn đề về cỡ mẫu


- Sai số ước lượng: r
p̂(1 − p̂)
ε = zα/2
n
- Điều kiện hạn chế: ε ≤ ∆, ∆ > 0 cho trước.
- Giả sử giá trị p̂ không biến động lớn khi tính tính trên các mẫu khác nhau, khi đó:
2
zα/2

n≥ p̂(1 − p̂).

- Trong trường hợp không có dữ liệu để tính giá trị p̂, sử dụng bất đẳng thức p̂(1 − p̂) ≤
1/4 ta thu được bất đẳng thức:
2
zα/2

1
n≥ .
4 ∆

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 40/45

Ví dụ 12
Một cuộc khảo sát sức khỏe cộng đồng đang được lên kế hoạch trong một khu vực đô
thị lớn với mục đích ước tính tỷ lệ trẻ em từ 0 đến 14 tuổi chưa được tiêm chủng bại
liệt đầy đủ. Các nhà tổ chức của dự án muốn tỷ lệ mẫu của trẻ không được tiêm chủng
đầy đủ k/n phải nằm trong khoảng của tỷ lệ thực p với sai số ±0, 05 với xác suất tối
thiểu 98%. Hỏi kích thước mẫu điều tra tối thiểu là bao nhiêu?
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.

Giải. Sai số ước lượng: r


p̂(1 − p̂)
ε = zα/2
n
Điều kiện: ε ≤ ∆ = 0, 05. Suy ra:
2
zα/2

n≥ p̂(1 − p̂).

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 41/45


Vì p̂ chưa biết nên áp dụng bất đẳng thức p̂(1 − p̂) ≤ 1/4 ta thu được:
2
zα/2

1
n≥ .
4 ∆

Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326. Do đó:


 2
1 2, 326
n≥ = 541, 0276
4 0, 05

Vậy, n = 542.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 42/45

Ví dụ 13
Sản lượng gạo bán ra trong 1 ngày có phân phối chuẩn. Điều tra sản lượng bán ra trong
120 ngày, ta được bảng số liệu sau:

Sản lượng (kg) 400-440 440-480 480-520 520-560 560-600 600-640 640-680
Số ngày 4 9 15 23 30 22 17

a) Với độ tin cậy 95% tìm khoảng tin cậy đối xứng cho số tiền bán ra trung bình trong
một ngày. Biết giá mỗi kg gạo là 15.000 đồng.
b) Ngày có sản lượng gạo bán ra không nhỏ hơn 560 kg được gọi là ngày cao điểm. Với
độ tin cậy 98%, tìm khoảng tin cậy đối xứng cho số ngày cao điểm trong 1000 ngày
bán.
Cho biết z0,05 = 1, 645; z0,025 = 1, 96; z0,02 = 2, 054; z0,01 = 2, 326.

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 43/45

Giải.
a. Dạng thu gọn:

Sản lượng (kg) 420 460 500 540 580 620 660
Số ngày 4 9 15 23 30 22 17

Các số đặc trưng mẫu: n = 120; x̄ = 566, 67; s = 64


Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; tn−1;α/2 = t119;0,025 ≈ z0,025 = 1, 96.
Sai số:
s 64
ε = tn−1;α/2 √ = 1, 96 ∗ √ = 11, 45
n 120
Khoảng tin cậy cho khối lượng gạo trung bình bán được trong 1 ngày:
x̄ − ε < µ < x̄ + ε ⇔ 555, 22 < µ < 578, 12
Khoảng tin cậy cho số tiền T (ngàn đồng) trung bình bán được trong 1 ngày:
555, 22 ∗ 15 < T < 578, 12 ∗ 15 ⇔ 8328, 3 < T < 8671, 8

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 44/45


b. Gọi K là số ngày cao điểm trong 1000 ngày. Ta có tỉ lệ ngày cao điểm: p = K/1000.
Tỉ lệ mẫu ngày cao điểm:
k 30 + 22 + 17
p̂ = = = 0, 575
n 120
Độ tin cậy: 1 − α = 0, 98 ⇒ α = 0, 02; zα/2 = z0,01 = 2, 326.
Sai số: r r
p̂(1 − p̂) 0, 575 ∗ (1 − 0, 575)
ε = zα/2 = 2, 326 ∗ = 0, 105
n 120
Khoảng tin cậy cho tỉ lệ ngày cao điểm p:

p̂ − ε < p < p̂ + ε ⇔ 0, 47 < p < 0, 68

Suy ra:
0, 47 < K/1000 < 0, 68 ⇔ 470 < K < 680

Tôn Thất Tú - 2021 Chương 5. Ước lượng tham số 45/45

XÁC SUẤT THỐNG KÊ


Tôn Thất Tú

Đà Nẵng, 2021

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 1/47

Chương 6: Kiểm định giả thuyết thống kê


1. Các khái niệm

1.1 Giả thuyết thống kê


- Giả thuyết thống kê là các khẳng định về phân phối của tổng thể nghiên cứu. Các
khẳng định này có thể là: về giá trị chưa biết của tham số đối với phân phối đã biết, về
dạng phân phối chưa biết, về mối quan hệ giữa các biến ngẫu nhiên,...

Ví dụ 1
X Tuổi thọ người Việt tuân theo luật phân phối chuẩn N (µ, σ 2 ), với µ, σ chưa biết.
Giả thuyết thống kê có thể là: µ = 60 (tuổi) hoặc µ > 60, hoặc µ 6= 60, ...
X Nghiên cứu về chiều cao (X) của người Việt. Giả thuyết thống kê có thể là: X có
phân phối chuẩn, X có phân phối mũ, ...
X Nghiên cứu tên của bố (X), tên của mẹ (Y ) và tên của người con thứ nhất (Z).
Giả thuyết thống kê: Z có mối quan hệ với X và Y , Z không có mối quan hệ với X và
Y , ...
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 2/47
Khi nghiên cứu ta có thể đưa ra nhiều giả thuyết khác nhau. Trong chương này, chúng
ta chỉ khảo sát bài toán kiểm định với hai giả thuyết mà thôi.
- Bài toán kiểm định giả thuyết là bài toán gồm một cặp giả thuyết thống kê mâu thuẫn
nhau được đưa ra xem xét để chọn một giả thuyết đúng. Một trong hai giả thuyết đó
được giả định ban đầu là giả thuyết đúng, gọi là giả thuyết gốc và được kí hiệu là H0 .
Giả thuyết còn lại gọi là đối thuyết, được kí hiệu là H1 .
(
H0 : giả thuyết gốc
H1 : đối thuyết

- Lưu ý: Với mỗi giả thuyết gốc H0 ta có thể xây dựng nhiều đối thuyết H1 khác nhau.
- Kiểm định giả thuyết là phương pháp sử dụng mẫu dữ liệu thu được để đưa ra quyết
định bác bỏ H0 hay chấp nhận H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 3/47

1.2 Nguyên lý xác suất nhỏ và xác suất lớn


- Nguyên lí xác suất nhỏ: Một biến cố có xác suất rất nhỏ (gần bằng 0) thì có thể xem
biến cố đó không xảy ra khi thực hiện phép thử một lần.
- Nguyên lí xác suất lớn: Một biến cố có xác suất rất lớn (gần bằng 1) thì có thể xem
biến cố đó sẽ xảy ra khi thực hiện phép thử.

1.3 Thống kê kiểm định


Gọi {X1 , X2 , ..., Xn } là một mẫu ngẫu nhiên tùy ý. Ta xây dựng một thống kê T =
T (X1 , X2 , ..., Xn ) và sẽ sử dụng nó để đưa ra quyết định bác bỏ hay chấp nhận giả
thuyết H0 . Lúc này, T được gọi là thống kê kiểm định (hay tiêu chuẩn kiểm định).

Với α ∈ (0, 1) cho trước, ta có thể xây dựng miền Wα sao cho:

P (T ∈ Wα |H0 đúng) = α

Lúc đó, miền Wα được gọi là miền bác bỏ với mức ý nghĩa α.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 4/47

1.3 Các bước tiến hành


Khi cho trước mức ý nghĩa α ta có thể sử dụng các bước gợi ý sau đây để tiến hành
giải bài toán kiểm định:
- Xác định giả thuyết H0 , H1 và phát biểu bài toán.
- Chọn thống kê kiểm định T và tính giá trị của nó trên mẫu dữ liệu thu được (kí
hiệu là Ts ).
- Xác định miền bác bỏ Wα với mức ý nghĩa α cho trước.
- Kết luận: Nếu Ts ∈ Wα thì bác bỏ giả thuyết H0 . Ngược lại, ta chưa có cơ sở bác
bỏ H0 nên tạm thời chấp nhận giả thuyết này.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 5/47
1.4 Sai lầm khi kiểm định
- Sai lầm loại I: Sai lầm mắc phải khi bác bỏ H0 nhưng trong khi thực tế là H0 là giả
thuyết đúng. Xác suất mắc sai lầm loại 1 được kí hiệu: α.
- Sai lầm loại II: Sai lầm mắc phải khi chấp nhận H0 trong khi thực tế là H0 là giả
thuyết sai. Xác suất mắc sai lầm loại 2 được kí hiệu: β.
Bảng dưới đây tổng hợp lại các trường hợp:

Thực tế
H0 đúng H0 sai
Quyết định
Bác bỏ H0 sai lầm loại I quyết định đúng
Chấp nhận H0 quyết định đúng sai lầm loại II

Như vậy,

α = P (bác bỏ H0 | H0 đúng), β = P (chấp nhận H0 | H0 sai)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 6/47

1.5 Phương pháp P-giá trị


Trong các phần mềm thống kê, người ta thường sử dụng phương pháp p-giá trị để ra
quyết định. Lưu ý rằng, ta có bài toán kiểm định:
(
H0 : giả thuyết gốc
H1 : đối thuyết

P-giá trị được mô tả như sau:


X The p-value is the probability of obtaining test results at least as extreme as
the results actually observed, under the assumption that the null hypothesis is correct.
(https://en.wikipedia.org/wiki/P-value)
X The P-value approach involves determining "likely" or "unlikely" by deter-
mining the probability — assuming the null hypothesis were true — of observ-
ing a more extreme test statistic in the direction of the alternative hypothesis
than the one observed. (https://online.stat.psu.edu/statprogram/reviews/
statistical-concepts/hypothesis-testing/p-value-approach)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 7/47

Diễn giải: P-giá trị là xác suất (mức độ hợp lý) thu được dữ liệu quan sát và được tính
dựa trên một thống kê kiểm định khi ta giả sử H0 là giả thuyết đúng. Do đó, nếu p-giá
trị càng nhỏ thì ta càng có cơ sở bác bỏ H0 .
Các bước thực hiện:
- Xác định giả thuyết H0 , H1 và phát biểu bài toán.
- Chọn thống kê kiểm định T và tính giá trị của nó trên mẫu dữ liệu thu được (kí
hiệu là Ts ).
- Tính p-giá trị theo thống kê kiểm định
- So sánh p-giá trị với mức ý nghĩa α cho trước:
i) Nếu p-giá trị ≤ α thì bác bỏ H0 .
ii) Nếu p-giá trị > α thì chấp nhận H0 .
Khi giá trị α chưa biết thì người ta hay lấy α = 0, 05.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 8/47
2. Kiểm định giả thuyết về kì vọng của phân phối chuẩn

2.1 Khi phương sai đã biết


Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với kì vọng µ
chưa biết và phương sai σ 2 đã biết.
• Xét bài toán kiểm định giả thuyết:
(
H0 : µ = µ 0 ,
(I)
H1 : µ 6= µ0 ,

trong đó µ0 là một số thực đã cho.


- Giả sử rằng H0 đúng, thì

(X − µ0 ) n
Z= ∼ N (0, 1)
σ

Ta sẽ bác bỏ H0 nếu X quá khác biệt so với µ0 hay nói cách khác, |Z| > c > 0 với c
là một hằng số nào đó.
- Miền bác bỏ với mức ý nghĩa α: Wα = (−∞; −zα/2 ] ∪ [zα/2 ; +∞).
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 9/47

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 10/47

• Đối với bài toán kiểm định giả thuyết:


(
H0 : µ = µ 0
(II)
H 1 : µ > µ0 .

Ta sẽ bác bỏ H0 nếu Z > c > 0 với c là một hằng số nào đó.


Miền bác bỏ H0 là Wα = [zα ; +∞)
• Đối với bài toán kiểm định giả thuyết:
(
H0 : µ = µ 0
(III)
H 1 : µ < µ0 .

Ta sẽ bác bỏ H0 nếu Z < c < 0 với c là một hằng số nào đó.


Miền bác bỏ H0 là Wα = (−∞; −zα ]

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 11/47
Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 đã biết.
Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: z =
σ
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ 6= µ0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
H 1 : µ > µ0 [zα ; +∞) 1 − Φ(z)
H 1 : µ < µ0 (−∞; −zα ] Φ(z)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 12/47

Bài toán II Bài toán III

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 13/47

Ví dụ 2
Nguồn cấp điện cho máy tính đạt tiêu chuẩn là 19 volt. Đo nguồn cấp điện của một mẫu
25 sạc pin được chọn ngẫu nhiên của hãng sản xuất A người ta tính được x = 19, 25
volt. Giả sử nguồn cấp điện này có phân phối chuẩn với độ lệch chuẩn σ = 0, 5 volt. Với
mức ý nghĩa α = 0, 05 hãy kiểm định giả thuyết gốc H0 : µ = 19 (volt) với đối thuyết
H1 : µ > 19 (volt), trong đó µ là nguồn cấp điện trung bình của loại sạc pin trên.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Giải. Bài toán kiểm định:
(
H0 : µ = 19
H1 : µ > 19
Các số đặc trưng mẫu: n = 25; x̄ = 19, 25. √ √
(x̄ − µ0 ) n (19, 25 − 19) 25
Giá trị của thống kê kiểm định: z = = = 2, 5.
σ 0, 5
Mức ý nghĩa: α = 0, 05 ⇒ zα = z0,05 = 1, 645.
Miền bác bỏ: Wα = [1, 645; +∞).
Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 và chấp nhận H1 .
Cách khác: p-giá trị = 1 − Φ(2.5) = 0.0062 < α = 0.05 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 14/47
Ví dụ 3
Trong năm trước khối lượng trung bình của bò xuất chuồng ở một trang trại là 380kg.
Năm nay người ta áp dụng thử một chế độ ăn mới với hy vọng là bò sẽ tăng trọng
nhanh hơn. Sau thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con bò xuất chuồng
đem cân và tính được khối lượng trung bình của chúng là x = 390kg. Với mức ý nghĩa
α = 0, 02 có thể cho rằng khối lượng trung bình của bò xuất chuồng đã tăng lên không?
Giả sử rằng khối lượng của bò có phân phối chuẩn với độ lệch chuẩn σ = 25, 2kg.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326
Giải. Gọi µ(kg) là khối lượng trung bình của bò xuất chuồng. Theo giả thiết, ta có bài
toán kiểm định: (
H0 : µ = 380
H1 : µ > 380
√ √
(x̄ − µ0 ) n (390 − 380) 50
Giá trị của thống kê kiểm định: z = = = 2, 806.
σ 25, 2
Mức ý nghĩa: α = 0, 02 ⇒ zα = z0,02 = 2, 054. Miền bác bỏ: Wα = [2, 054; +∞).
Vì z ∈ Wα nên ta bác bỏ H0 . Vậy, khối lượng trung bình bò xuất chuồng đã tăng lên.
Cách khác: p-giá trị = 1 − Φ(2.806) = 0.0025 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 15/47

2.2 Khi phương sai chưa biết


Cho biến ngẫu nhiên X của một tổng thể có phân phối chuẩn N (µ; σ 2 ) với kì vọng µ
chưa biết và phương sai σ 2 chưa biết.
Xét bài toán kiểm định với H0 : µ = µ0 và đối thuyết H1 : µ 6= µ0 (µ > µ0 , µ < µ0 ).
Khi giả thuyết H0 : µ = µ0 đúng, thống kê:

(X − µ0 ) n
T =
S

có phân phối Student n − 1 bậc tự do.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 16/47

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 17/47
Cho biến ngẫu nhiên X ∼ N (µ; σ 2 ) với σ 2 chưa biết.
Giả thuyết gốc H0 : µ = µ0 √
(x − µ0 ) n
Giá trị thống kê kiểm định: t =
s
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µ 6= µ0 (−∞; −tn−1;α/2 ] ∪ [tn−1;α/2 ; +∞) 2P (Tn−1 > |t|)
H 1 : µ > µ0 [tn−1;α ; +∞) P (Tn−1 > t)
H 1 : µ < µ0 (−∞; −tn−1;α ] P (Tn−1 < t)

Trong trường hợp n > 30: tn−1;α ≈ zα .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 18/47

Ví dụ 4
Tuổi thọ trung bình của một loại bóng đèn do nhà máy A sản xuất khi chưa cải tiến kĩ
thuật là 2000 giờ. Sau thời gian cải tiến kĩ thuật người ta chọn ngẫu nhiên 25 bóng đèn
cho lắp thử nghiệm. Kết quả thực nghiệm thu được tuổi thọ trung bình mẫu x = 2022
giờ và độ lệch chuẩn mẫu s = 30 giờ. Với mức ý nghĩa 0, 025 có thể kết luận “sau khi
cải tiến kĩ thuật, tuổi thọ trung bình của bóng đèn có tăng lên” không? Biết tuổi thọ
bóng đèn có phân phối chuẩn. Cho biết t24;0,025 = 2, 063.

Giải. Gọi µ(giờ) là tuổi thọ trung bình của loại bóng đèn sau cải tiến. Ta có bài toán
kiểm định: (
H0 : µ = 2000
H1 : µ > 2000

- Các số đặc trưng mẫu: n = 25; x̄ = 2022; s = 30

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 19/47

- Thống kê kiểm định:


√ √
(x̄ − µ0 ) n (2022 − 2000) 25
t= = = 3.67
s 25
- Mức ý nghĩa: α = 0, 025; tn−1;α = t24;0,025 = 2, 063
- Miền bác bỏ: Wα = [2, 063; +∞)
Vì t ∈ Wα nên ta bác bỏ H0 và chấp nhận H1 . Vậy, sau cải tiến kỹ thuật tuổi thọ trung
bình của bóng đèn đã tăng lên.
Cách khác: p-giá trị = 1 − P (T24 < 3.67) = 0.0006 < α = 0.025 nên bác bỏ H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 20/47
Ví dụ 5
Một xí nghiệp có 5000 công nhân cùng sản xuất một loại sản phẩm. Theo dõi thời gian
hoàn thành sản phẩm của 100 công nhân, ta được bảng số liệu sau:

Thời gian (ph) 28-30 30-32 32-34 34-36 36-38 38-40


Số công nhân 5 15 25 30 20 5

a) Tìm khoảng tin cậy đối xứng cho thời gian hoàn thành trung bình với độ tin cậy 90%.
b) Công nhân có tay nghề cao nếu thời gian hoàn thành 1 sản phẩm dưới 32ph. Với
độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số công nhân có tay nghề cao của xí
nghiệp.
c) Xí nghiệp quy định định mức hoàn thành trung bình 1 sản phẩm là 34 phút. Có ý
kiến cho rằng định mức này có hại cho công nhân. Với mức ý nghĩa 2% hãy nhận xét
về ý kiến đó.
Cho biết z0.1 = 1.282; z0.05 = 1.645; z0.025 = 1.96; z0.02 = 2.054, z0.01 = 2.326

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 21/47

Giải. a. Dạng thu gọn:

Thời gian (ph) 29 31 33 35 37 39


Số công nhân 5 15 25 30 20 5

Các số đặc trưng mẫu: n = 100; x̄ = 34, 2; s = 2, 494


Độ tin cậy: 1 − α = 0, 9 ⇒ α = 0, 1; tn−1;α/2 = t99;0,05 ≈ z0,05 = 1, 645
Sai số: s
ε = tn−1;α/2 √ = 1, 645 ∗ √
2, 494
= 0, 41
n 100
Khoảng tin cậy cho thời gian hoàn thành trung bình:

x̄ − ε < µ < x̄ + ε ⇔ 33, 79 < µ < 34, 61

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 22/47

b. Gọi K là số công nhân có tay nghề cao. Tỉ lệ công nhân có tay nghề cao: p = K/5000.
Tỉ lệ mẫu công nhân có tay nghề cao:

p̂ = k/n = (5 + 15)/100 = 0, 2

Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96


Sai số:
r r
p̂(1 − p̂) 0, 2 ∗ 0, 8
ε = zα/2 = 1, 96 ∗ = 0, 0784
n 100
Khoảng tin cậy cho tỉ lệ công nhân có tay nghề cao:

p̂ − ε < p < p̂ + ε ⇔ 0, 1216 < p < 0, 2784

Suy ra: 0, 1216 < K/5000 < 0, 2784 ⇔ 608 < K < 1392.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 23/47
c. Gọi µ (ph) là thời gian hoàn thành trung bình 1 sản phâm của công nhân. Ta có bài
toán kiểm định: (
H0 : µ = 34
H1 : µ > 34

- Thống kê kiểm định:


√ √
(x̄ − µ0 ) n (34, 2 − 34) 100
t= = = 0, 802
s 2, 494

- Mức ý nghĩa: α = 0, 02; tn−1;α = t99;0,02 ≈ z0,02 = 2, 054


- Miền bác bỏ: Wα = [2, 054; +∞)
Vì t ∈
/ Wα nên ta chưa có cơ sở bác bỏ H0 . Vậy, định mức quy định không gây hại cho
công nhân.
Cách khác: p-giá trị = 1 − P (T99 < 0.802) = 0.2122369 > α = 0.02 nên chưa có cơ
sở bác bỏ H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 24/47

3. So sánh hai kỳ vọng của hai mẫu độc lập


Cho X và Y biến số ngẫu nhiên của hai tổng thể độc lập nhau và lần lượt có phân phối
chuẩn N (µx ; σx2 ) và N (µy ; σy2 ) với phương sai σx2 , σy2 chưa biết.
Xét bài toán kiểm định với
H 0 : µ x − µ y = ∆0
và đối thuyết H1 : µx − µy 6= ∆0 (µx − µy > ∆0 , µx − µy < ∆0 ).
Giả sử (x1 , ..., xm ) và (y1 , ..., yn ) là các mẫu thu được từ X và Y tương ứng.
Chỉ xét trường hợp khi cỡ mẫu lớn (m,n>30).
Khi đó, áp dụng Định lí giới hạn trung tâm ta có:

(X − Y ) − (µx − µy )
Z= r
Sx2 Sy2
+
m n

có phân phối xấp xỉ phân phối chuẩn tắc N (0; 1).

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 25/47

X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết; m > 30 và
n > 30.
Giả thuyết thống kê H0 : µx − µy = ∆0
x − y − ∆0
Giá trị thống kê kiểm định: z = r
s2x s2y
+
m n

Đối thuyết Miền bác bỏ H0 p-giá trị


H1 : µx − µy 6= ∆0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
H1 : µ x − µ y > ∆0 [zα ; +∞) 1 − Φ(z)
H1 : µ x − µ y < ∆0 (−∞; −zα ] Φ(z)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 26/47
Nhận xét: Khi ∆0 = 0, các bài toán kiểm định trên thường được viết lại dưới dạng:
(
H0 : µ x = µ y
(I)
H1 : µx 6= µy
(
H0 : µ x = µ y
(II)
H1 : µ x < µ y
(
H0 : µ x = µ y
(III)
H1 : µ x > µ y

Thống kê kiểm định trở thành:


x−y
z=r
s2x s2y
+
m n

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 27/47

Ví dụ 6
Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn, kết quả thu được:
Khu vực Số trẻ Trung bình mẫu Phương sai mẫu
Nông thôn m = 60 x = 3, 0 kg s2x = 0, 4 kg2
Thành thị n = 50 y = 3, 1 kg s2y = 0, 5 kg2
Với mức ý nghĩa 0, 05 có thể coi khối lượng trung bình của trẻ sơ sinh ở hai khu vực
khác nhau không? Biết khối lượng trẻ sơ sinh ở hai khu vực có phân phối chuẩn. Cho
biết z0.025 = 1.96

Giải. Gọi µx , µy (kg) là khối lượng trung bình của trẻ sơ sinh ở nông thôn và thành thị.
Ta có bài toán kiểm định:
(
H0 : µ x = µ y
H1 : µx 6= µy
Thống kê kiểm định: x̄ − ȳ 3, 0 − 3, 1
z=q =p = −0, 774
s2x /m + s2y /n 0, 4/60 + 0, 5/50
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 28/47

Mức ý nghĩa: α = 0, 05; zα/2 = z0,025 = 1, 96.


Miền bác bỏ: Wα = (−∞; −1, 96] ∪ [1, 96; +∞)
Vì z ∈
/ Wα nên ta chưa có cơ sở bác bỏ giả thuyết H0 . Vậy, không có sự khác biệt về
khối lượng trung bình của trẻ sơ sinh ở hai vùng trên.
Cách khác: p-giá trị = 2(1 − Φ(0.774)) = 0.4389308 > α = 0.05 nên chưa có cơ sở
bác bỏ H0 .

Ví dụ 7
Người ta tiến hành một cuộc nghiên cứu để so sánh mức lương trung bình của phụ nữ
so với mức lượng trung bình của nam giới trong một công ty lớn. Một mẫu gồm 100 phụ
nữ có mức lương trung bình 7,23 đôla/giờ với độ lệch chuẩn 1,64 đôla/giờ. Một mẫu
gồm 75 nam giới có mức lượng trung bình là 8,06 đôla/giờ với độ lệch chuẩn là 1,85
đôla/giờ. Với mức ý nghĩa 1% số liệu này có chứng minh được mức lương trung bình
của phụ nữ trong công ty là thấp hơn nam giới hay không ? Cho biết z0,01 = 2, 326.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 29/47
Giải. Gọi µx , µy (đôla/giờ) là mức lương trung bình của nữ và nam giới. Ta có bài toán
kiểm định: (
H0 : µ x = µ y
H1 : µ x < µ y

Thống kê kiểm định:


x̄ − ȳ 7, 23 − 8, 06
z=q =p = −3, 08
s2x /m + s2y /n 1, 642 /100 + 1, 852 /75

Mức ý nghĩa: α = 0, 01; zα = z0,01 = 2, 326.


Miền bác bỏ: Wα = (−∞; −2, 326]
Vì z ∈ Wα nên ta bác bỏ giả thuyết H0 . Vậy, lương trung bình của nữ giới thấp hơn so
với nam giới trong công ty.
Cách khác: p-giá trị = Φ(−3.08) = 0.001035003 < α = 0.01 nên bác bỏ H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 30/47

Trường hợp mẫu nhỏ và phương sai chưa biết (đọc thêm)

X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết.
Giả thuyết thống kê H0 : µx − µy = ∆0
x − y − ∆0
Giá trị thống kê kiểm định: t = r
s2x s2y
+
m n
Đối thuyết Miền bác bỏ H0 p-giá trị
H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|))
H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t)
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t)

trong đó Tν là biến ngẫu nhiên có phân phối Student với ν bậc tự do và ν là giá
trị nguyên gần nhất với giá trị
!2 !
s2x s2y . (s2x /m)2 (s2y /n)2
+ +
m n m−1 n−1
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 31/47

Trường hợp mẫu nhỏ, phương sai chưa biết và σx2 = σy2 (đọc thêm)

X ∼ N (µx ; σx2 ) và Y ∼ N (µy ; σy2 ) trong đó σx2 và σy2 đều chưa biết, σx2 = σy2 .
Giả thuyết thống kê H0 : µx − µy = ∆0 s
x − y − ∆0 (m − 1)s2x + (n − 1)s2y
Giá trị thống kê kiểm định: t = q , với sp =
s 1
+1 m+n−2
p m n

Đối thuyết Miền bác bỏ H0 p-giá trị


H1 : µx − µy 6= ∆0 (−∞; −tν,α/2 ] ∪ [tν,α/2 ; +∞) 2(1 − P (Tν < |t|))
H1 : µ x − µ y > ∆ 0 [tν,α ; +∞) 1 − P (Tν < t)
H1 : µ x − µ y < ∆ 0 (−∞; −tν,α ] P (Tν < t)

trong đó ν = m + n − 2.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 32/47
4. So sánh cặp hai giá trị trung bình
(đọc thêm)
Cho (X, Y ) là một cặp biến ngẫu nhiên (nói chung phụ thuộc nhau) với E(X) =
µx , E(Y ) = µy .
Chúng ta muốn so sánh µx và µy .
Giả sử (x1 , y1 ), ..., (xn , yn ) là một mẫu kích thước n của (X, Y ).
Vì X, Y có thể phụ thuộc nhau nên ta không thể áp dụng phương pháp ở trên.
Để giải quyết bài toán này, ta đặt

D =X −Y

và xét mẫu của D:


di = xi − yi , i = 1, n
Lúc đó,
µd = E(D) = µx − µy

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 33/47

Các bài toán kiểm định:


( (
H0 : µ x = µ y H0 : µ d = 0

H1 : µx 6= µy H1 : µd 6= 0
( (
H0 : µ x = µ y H0 : µ d = 0

H1 : µ x > µy H1 : µ d > 0
( (
H0 : µ x = µ y H0 : µ d = 0

H1 : µ x < µy H1 : µ d < 0

Ta đưa về bài toán kiểm định trung bình (một mẫu) đã xét.

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 34/47

Ví dụ 8
Để khảo sát tác dụng của việc bón thêm một loại phân bón mới (A) người ta chia mỗi
thửa ruộng thí nghiệm làm hai mảnh. Một mảnh đối chứng không có phân bón A (với
sản lượng X) và mảnh kia có phân bón A (với sản lượng Y ). Sản lượng của 17 thửa
ruộng được ghi lại như sau:
Thửa X Y Thửa X Y
1 55,8 60,4 9 53,3 58,7
2 30,1 28,9 10 51,0 48,0
3 37,8 39,7 11 68,6 68,8
4 57,7 57,5 12 59,1 70,4
5 49,4 56,8 13 35,4 40,6
6 53,4 57,3 14 42,7 44,3
7 21,2 32,2 15 28,3 47,7
8 57,3 77,0 16 42,4 55,1
17 61,4 66,1
Với mức ý nghĩa 5% hỏi việc bón phân có tác dụng không?
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 35/47
Giải. Đặt D = X − Y , ta có bảng tóm tắt sau:

Thửa X Y D Thửa X Y D
1 55,8 60,4 -4,6 9 53,3 58,7 -4,7
2 30,1 28,9 1,2 10 51,0 48,0 -5,4
3 37,8 39,7 -1,9 11 68,6 68,8 3
4 57,7 57,5 0,2 12 59,1 70,4 -0,2
5 49,4 56,8 -7,4 13 35,4 40,6 -11,3
6 53,4 57,3 -3,9 14 42,7 44,3 -5,2
7 21,2 32,2 -11 15 28,3 47,7 -1,6
8 57,3 77,0 -19,7 16 42,4 55,1 -19,4
17 61,4 66,1 -12,7

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 36/47

Gọi µx , µy lần lượt là sản lượng trung bình của mảnh đối chứng không có phân bón A
và mảnh có phân bón A.
Bài toán kiểm định giả thuyết: (
H0 : µ x = µ y
H1 : µ x < µy .

Bài toán này tương đương với bài toán


( kiểm định giả thuyết:
H0 : µ D = 0
H1 : µD < 0.

Miền bác bỏ H0 là W = (−∞; −t16;0,05 ] = (−∞; −1, 753].


Thực hiện tính toán: d = −6, 15; sD = 6, 694.
Giá trị của thống kê kiểm định:
d − 0√
t= n = −3, 79 ∈ W.
sD

Do đó, ta có cơ sở bác bỏ H0 .
Cách khác: p-giá trị = P (T16 < −3.79) = 0.0008031343 < α = 0.05 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 37/47

5. Kiểm định giả thuyết về tỉ lệ


Cho tính chất A có tỉ lệ là p (chưa biết) trong tổng thể. Xét bài toán kiểm định giả
thuyết:
H 0 : p = p0
và đối thuyết H1 : p 6= p0 (p > p0 , p < p0 ).
Chọn một mẫu ngẫu nhiên kích thước n, đặt
(
1, phần tử i có tính chất A
Xi =
0, phần tử i không có tính chất A

X1 + X2 + ... + Xn
và P̂ = - tỉ lệ phần tử có tính chất A.
n
Khi H0 đúng, với n đủ lớn, theo Định lí giới hạn trung tâm:

(P̂ − p0 ) n
Z=p
p0 (1 − p0 )

có phân phối xấp xỉ phân phối chuẩn tắc N (0; 1).


Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 38/47
Cho p̂ = k/n là một ước lượng của tỷ lệ p từ một mẫu kích thước n.
Giả thuyết gốc H0 : p = p0 √
(p̂ − p0 ) n
Giá trị thống kê kiểm định: z = p
p0 (1 − p0 )

Đối thuyết Miền bác bỏ H0 p-giá trị


H1 : p 6= p0 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
H1 : p > p0 [zα ; +∞) 1 − Φ(z)
H1 : p < p0 (−∞; −zα ] Φ(z)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 39/47

Ví dụ 9
Giám đốc một công ty tuyên bố 90% sản phẩm của công ty đạt tiêu chuẩn quốc gia.
Một công ty kiểm định độc lập đã tiến hành kiểm tra 200 sản phẩm của công ty đó thì
thấy có 168 sản phẩm đạt yêu cầu. Với mức ý nghĩa α = 0, 1 có thể cho rằng tỷ lệ sản
phẩm đạt tiêu chuẩn quốc gia thấp hơn 90% không? Cho biết z0,1 = 1, 282.
Giải. Gọi p là tỉ lệ sản phẩm đạt tiêu
( chuẩn quốc gia của công ty. Bài toán kiểm định:
H0 : p = 0, 9
H1 : p < 0, 9

Tỉ lệ mẫu: p̂ = k/n = 168/200 = 0, 84


Thống kê kiểm định: (p̂ − p )√n √
0 (0, 84 − 0, 9) 200
z=p = √ = −2, 83
p0 (1 − p0 ) 0, 9 ∗ 0, 1

Mức ý nghĩa: α = 0, 1 ⇒ zα = z0.1 = 1.282.


Miền bác bỏ: Wα = (−∞; −1, 282].
Vì z ∈ Wα nên bác bỏ H0 . Vậy, tỷ lệ sản phẩm đạt tiêu chuẩn quốc gia thấp hơn 90%.
Cách khác: p-giá trị = Φ(−2, 83) = 0.0023274 < α = 0.1 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 40/47

Ví dụ 10
Một khu vực có 10000 hộ gia đình sinh sống và các hộ ở đây chỉ sử dụng ga của 2 công
ty A và B. Điều tra 800 hộ thì có 600 hộ dùng ga, trong đó 360 hộ dùng ga của công
ty A.
a) Với độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho số lượng hộ dùng ga ở khu vực
này.
b) Có ý kiến cho rằng ga của công ty A được các hộ thích dùng hơn. Với mức ý nghĩa
2% hãy nhận xét về ý kiến ấy.

Giải. a. Gọi K là số lượng hộ dùng ga ở khu vực này. Ta có tỉ lệ hộ dùng ga: p = K/10000.
Tỉ lệ mẫu: p̂ = k/n = 600/800 = 0, 75.
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05; zα/2 = z0,025 = 1, 96.
Sai số:
r r
p̂(1 − p̂) 0, 75 ∗ 0, 25
ε = zα/2 = 1, 96 ∗ = 0, 03
n 800
Khoảng tin cậy cho tỉ lệ hộ dùng ga: p̂ − ε < p < p̂ + ε ⇔ 0, 72 < p < 0, 78
Suy ra: 0, 72 < K/10000 < 0, 78 ⇔ 7200 < K < 7500.
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 41/47
b. Gọi p là tỉ lệ hộ dùng ga của công ty A trong các hộ dùng ga. Bài toán kiểm định:
(
H0 : p = 0, 5
H1 : p > 0, 5

Tỉ lệ mẫu: p̂ = k/n = 360/600 = 0, 6


Giá trị của thống kê kiểm định:
√ √
(p̂ − p0 ) n (0, 6 − 0, 5) 600
z=p = √ = 4, 9
p0 (1 − p0 ) 0, 5 ∗ 0, 5

Mức ý nghĩa: α = 0, 02 ⇒ zα = z0.02 = 2, 054.


Miền bác bỏ: Wα = [2, 054; +∞).
Vì z ∈ Wα nên bác bỏ H0 . Vậy, sản phẩm ga của công ty A được ưa thích hơn.
Cách khác: p-giá trị = 1 − Φ(4.9) = 4.791833e − 07 < α = 0.02 nên bác bỏ H0 .

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 42/47

6. So sánh hai tỉ lệ
Xét tính chất A có tỉ lệ là p1 và p2 chưa biết trong hai tổng thể độc lập nhau. Xét bài
toán kiểm định với giả thuyết gốc:

H 0 : p1 = p2

và đối thuyết H1 : p1 6= p2 (p1 > p2 , p1 < p2 ).


Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu ngẫu
nhiên độc lập kích thước n1 và n2 tương ứng.
Khi giả thuyết H0 đúng, thống kê
p̂1 − p̂2 k1 + k2
Z=s   với p̂ = n + n
1 1 1 2
p̂(1 − p̂) +
n 1 n2

có phân phối xấp xỉ phân phối chuẩn tắc N (0, 1).

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 43/47

Giả sử p̂1 = k1 /n1 và p̂2 = k2 /n2 lần lượt là ước lượng của p1 và p2 từ hai mẫu
ngẫu nhiên độc lập.
- Giả thuyết gốc H0 : p1 = p2
- Giá trị thống kê kiểm định:
p̂1 − p̂2 k1 + k2
z=s   với p̂ = n + n
1 1 1 2
p̂(1 − p̂) +
n1 n2

Đối thuyết Miền bác bỏ H0 p-giá trị


H1 : p1 6= p2 (−∞; −zα/2 ] ∪ [zα/2 ; +∞) 2(1 − Φ(|z|))
H1 : p1 > p2 [zα ; +∞) 1 − Φ(z)
H1 : p1 < p2 (−∞; −zα ] Φ(z)

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 44/47
Ví dụ 11
Kiểm tra ngẫu nhiên các sản phẩm cùng loại do hai nhà máy sản xuất thu được dữ liệu:

Nhà máy Số sản phẩm được kiểm tra Số phế phẩm


A 1000 25
B 960 30

Với mức ý nghĩa α = 0, 05 có thể coi tỷ lệ phế phẩm của hai nhà máy trên bằng nhau
không? Cho biết z0.025 = 1.96

Giải. Gọi p1 , p2 là tỉ lệ phế phẩm của nhà máy A, B tương ứng. Ta có bài toán kiểm
định: (
H 0 : p1 = p 2
H1 : p1 6= p2

Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 45/47

Các tỉ lệ mẫu:

p̂1 = k1 /n1 = 25/1000 = 0, 025; p̂2 = k2 /n2 = 30/960 = 0, 03125


p̂ = (k1 + k2 )/(n1 + n2 ) = (25 + 30)/(1000 + 960) = 0, 028

Giá trị của thống kê kiểm định:


p̂1 − p̂2 0, 025 − 0, 03125
z=s =p = −0, 838
0, 028 ∗ (1 − 0, 028)(1/1000 + 1/960)

1 1
p̂(1 − p̂) +
n1 n2

Mức ý nghĩa: α = 0, 05 ⇒ zα/2 = z0.025 = 1, 96.


Miền bác bỏ: Wα = (−∞; −1, 96] ∪ [1, 96; +∞).
Vì z ∈
/ Wα nên chưa có cơ sở bác bỏ H0 . Vậy, tỉ lệ phế phẩm của hai nhà máy không
có sự khác biệt.
Cách khác: p-giá trị = 2(1 − Φ(0.838)) = 0.4020307 > α = 0.05 nên chưa có cơ sở
bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 46/47

Ví dụ 12
Công ty nước giải khát đang nghiên cứu 2 thị trường mới là khu vực A và khu vực B.
Ở khu vực A khi cho 500 người dùng thử thì có 120 người ưa thích thức uống này. Còn
đối với khu vực B khi cho 1000 người dùng thử thì có 300 người bảo ưa thích hương vị
này. Với mức ý nghĩa 2% hãy kiểm định xem tỉ lệ người ưa thích thức uống của công ty
ở khu vực B có cao hơn ở khu vực A hay không ? Cho biết z0,02 = 2, 054.
Giải. Gọi p1 , p2 là tỉ lệ người ưa thích nước uống của công ty ở khu vực A và B. Ta có
bài toán kiểm định: (
H 0 : p1 = p 2
H1 : p1 < p2
Các tỉ lệ mẫu: p̂1 = 0, 24; p̂2 = 0, 3; p̂ = 0, 28.
Giá trị thống kê kiểm định: z = −2, 39
Miền bác bỏ: Wα = (−∞; −2, 054].
Vì z ∈ Wα nên bác bỏ giả thuyết H0 .
Vậy, tỉ lệ người ưa thích thức uống của công ty ở khu vực B cao hơn ở khu vực A.
Cách khác: p-giá trị = Φ(−2.39) = 0.00842 < α = 0.02 nên bác bỏ H0 .
Tôn Thất Tú - 2021 Chương 6: Kiểm định giả thuyết thống kê 47/47

You might also like