Giáo Trình Xác Suất Thống Kê

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC
BÀI GIẢNG
XÁC SUẤT THỐNG KÊ
NGUYỄN THỊ THU THỦY

BỘ MÔN TOÁN ỨNG DỤNG
HÀ NỘI - 01/2020
MỤC LỤC
Chương 1. Sự kiện ngẫu nhiên và phép tính xác suất 6

1.1 Sự kiện. Quan hệ giữa các sự kiện . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1 Phép thử. Sự kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2 Phân loại sự kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.3 Quan hệ giữa các sự kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Giải tích kết hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Quy tắc cộng. Quy tắc nhân . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Chỉnh hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Chỉnh hợp lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Hoán vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.5 Tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Khái niệm và các định nghĩa xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1 Khái niệm xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.2 Định nghĩa cổ điển về xác suất . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.3 Định nghĩa xác suất theo quan điểm hình học . . . . . . . . . . . . . . . 16
1.3.4 Định nghĩa thống kê về xác suất . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.5 Nguyên lý xác suất nhỏ, nguyên lý xác suất lớn . . . . . . . . . . . . . . 19
1.4 Công thức cộng và nhân xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.4.1 Xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.4.2 Công thức nhân xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.4.3 Công thức cộng xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.5 Công thức Béc–nu–li . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.1 Dãy phép thử độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.2 Lược đồ Béc–nu–li . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.3 Công thức Béc–nu–li . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5.4 Số có khả năng nhất trong lược đồ Béc–nu–li . . . . . . . . . . . . . . . . 29
1.5.5 Công thức xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.6 Công thức xác suất đầy đủ. Công thức Bay–ét . . . . . . . . . . . . . . . . . . . . 31
1.6.1 Công thức xác suất đầy đủ . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.6.2 Công thức Bay–ét . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1
MI2020 – KỲ 20192 – TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy
Chương 2. Biến ngẫu nhiên và quy luật phân phối xác suất 36
2.1 Định nghĩa và phân loại biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . 36
2.1.1 Định nghĩa biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.1.2 Phân loại biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Quy luật phân phối xác suất của biến ngẫu nhiên . . . . . . . . . . . . . . . . . 37
2.2.1 Bảng phân phối xác suất của biến ngẫu nhiên rời rạc . . . . . . . . . . . 37
2.2.2 Hàm phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2.3 Hàm mật độ xác suất của biến ngẫu nhiên liên tục . . . . . . . . . . . . . 42
2.3 Các tham số đặc trưng của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . 44
2.3.1 Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3.2 Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.3 Độ lệch chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.3.4 Một số đặc trưng khác . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4 Một số phân phối xác suất thông dụng . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.1 Phân phối đều . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.4.2 Phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.4.3 Phân phối Poa–xông . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.4.4 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.4.5 Phân phối khi bình phương . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4.6 Phân phối Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Chương 3. Biến ngẫu nhiên nhiều chiều 69

3.1 Khái niệm và phân loại biến ngẫu nhiên nhiều chiều . . . . . . . . . . . . . . . . 69
3.1.1 Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.1.2 Phân loại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.2 Bảng phân phối xác suất của biến ngẫu nhiên hai chiều rời rạc . . . . . . . . . . 69
3.2.1 Bảng phân phối xác suất đồng thời . . . . . . . . . . . . . . . . . . . . . . 69
3.2.2 Bảng phân phối xác suất thành phần (biên) . . . . . . . . . . . . . . . . . 71
3.2.3 Phân phối có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.3 Hàm phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3.1 Hàm phân phối xác suất đồng thời . . . . . . . . . . . . . . . . . . . . . . 74
3.3.2 Hàm phân phối xác suất thành phần (biên) . . . . . . . . . . . . . . . . . 75
3.4 Hàm mật độ xác suất của biến ngẫu nhiên hai chiều liên tục . . . . . . . . . . . 75
3.4.1 Hàm mật độ xác suất đồng thời . . . . . . . . . . . . . . . . . . . . . . . . 75
3.4.2 Hàm mật độ xác suất biên . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.4.3 Hàm mật độ xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . . 78
3.5 Tính độc lập của các biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.6 Đặc trưng của biến ngẫu nhiên hai chiều . . . . . . . . . . . . . . . . . . . . . . . 79
3.6.1 Kỳ vọng, phương sai của biến ngẫu nhiên thành phần . . . . . . . . . . . 79
MỤC LỤC 2
3.6.2 Hiệp phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.6.3 Hệ số tương quan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.7 Hàm của hai biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.8 Luật số lớn và định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . . . . . . 85
3.8.1 Luật số lớn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.8.2 Định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Chương 4. Thống kê. Ước lượng tham số 88

4.1 Lý thuyết mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.1.1 Tổng thể và mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.1.2 Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.1.3 Mô tả giá trị của mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 91
4.1.4 Đại lượng thống kê và các đặc trưng của mẫu ngẫu nhiên . . . . . . . . 92
4.1.5 Cách tính giá trị cụ thể của trung bình mẫu và phương sai mẫu . . . . . 94
4.1.6 Phân phối xác suất của các thống kê trung bình mẫu, phương sai mẫu,
tần suất mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.2 Ước điểm cho kỳ vọng, phương sai và tỷ lệ . . . . . . . . . . . . . . . . . . . . . 99
4.2.1 Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2.2 Các tiêu chuẩn lựa chọn hàm ước lượng . . . . . . . . . . . . . . . . . . . 99
4.2.3 Ước lượng điểm cho kỳ vọng, phương sai và xác suất . . . . . . . . . . . 100
4.2.4 Một số phương pháp tìm ước lượng điểm . . . . . . . . . . . . . . . . . . 100
4.3 Phương pháp ước lượng bằng khoảng tin cậy . . . . . . . . . . . . . . . . . . . . 101
4.3.1 Khoảng tin cậy của kỳ vọng của biến ngẫu nhiên phân phối chuẩn . . . 101
4.3.2 Ước lượng khoảng cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Chương 5. Kiểm định giả thuyết 109

5.1 Các khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.1.1 Giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.1.2 Tiêu chuẩn kiểm định. Mức ý nghĩa. Miền bác bỏ . . . . . . . . . . . . . 110
5.1.3 Sai lầm loại 1. Sai lầm loại 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.2 Kiểm định giả thuyết về kỳ vọng của biến ngẫu nhiên có phân phối chuẩn . . . 112
5.2.1 Trường hợp đã biết phương sai . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2.2 Trường hợp chưa biết phương sai, cỡ mẫu n < 30 . . . . . . . . . . . . . 114
5.2.3 Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30 . . . . . . . . . . . . . 115
5.3 Kiểm định giả thuyết về tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.3.1 Bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.3.2 Các bước tiến hành . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.4 So sánh hai kỳ vọng của hai biến ngẫu nhiên phân phối chuẩn . . . . . . . . . . 119
5.4.1 Trường hợp phương sai σ12 , σ22 đã biết . . . . . . . . . . . . . . . . . . . . 119
MỤC LỤC 3
5.4.2 Trường hợp phương sai σ12 , σ22 chưa biết, cỡ mẫu n1 < 30, n2 < 30 . . . . 120
5.4.3 Trường hợp phương sai σ12 , σ22 chưa biết, cỡ mẫu n1 ≥ 30, n2 ≥ 30 . . . . 122
5.5 So sánh hai tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.5.1 Bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.5.2 Các bước tiến hành . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Chương 6. Phụ lục các bảng số 127

6.1 Phụ lục các bảng số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.1.1 Phụ lục 1: Giá trị hàm Gao-xơ . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.1.2 Phụ lục 2: Giá trị hàm Láp-la-xơ . . . . . . . . . . . . . . . . . . . . . . . 127
6.1.3 Phụ lục 3: Giá trị hàm phân phối chuẩn tắc . . . . . . . . . . . . . . . . . 127
6.1.4 Phụ lục 4: Giá trị phân phối Student . . . . . . . . . . . . . . . . . . . . . 127
6.1.5 Phụ lục 5: Giá trị hàm khối lượng xác suất Poa-xông . . . . . . . . . . . . 127
6.2 Hướng dẫn sử dụng các bảng số . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.2.1 Bảng giá trị hàm Gao-xơ (Phụ lục 1) . . . . . . . . . . . . . . . . . . . . . 134
6.2.2 Bảng giá trị hàm Láp-la-xơ (Phụ lục 2) . . . . . . . . . . . . . . . . . . . . 134
6.2.3 Bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) . . . . . . . . . . . . . 134
6.2.4 Bảng giá trị t1n−α của phân phối Student (Phụ lục 4) . . . . . . . . . . . . 134
MỤC LỤC 4
Lời nói đầu
Lý thuyết xác suất và thống kê toán học là một ngành khoa học đang giữ vị trí quan trọng
trong các lĩnh vực ứng dụng rộng rãi và phong phú của đời sống con người. Cùng với sự phát
triển mạnh mẽ của khoa học và công nghệ, nhu cầu hiểu biết và sử dụng các công cụ ngẫu
nhiên trong phân tích và xử lý thông tin ngày càng trở nên đặc biệt cần thiết. Các kiến thức
và phương pháp của xác suất và thống kê đã hỗ trợ hữu hiệu các nhà nghiên cứu trong nhiều
lĩnh vực khoa học khác nhau như vật lý, hóa học, sinh học, nông học, kinh tế học, xã hội học,
ngôn ngữ học. . . Do đó "Xác suất thống kê" là học phần rất cần thiết cho sinh viên bậc đại học.
Bài giảng học phần "Xác suất thống kê", mã học phần MI2020 được biên soạn theo Đề
cương chi tiết với khối lượng 30 tiết lý thuyết, 30 tiết bài tập dành cho sinh viên hệ đại học
chính quy (không phải chuyên ngành Toán Tin) của Trường Đại học Bách khoa Hà Nội.
Mục tiêu học phần: Cung cấp cho sinh viên những kiến thức cơ bản về xác suất là các khái
niệm và quy tắc suy diễn xác suất cũng như về biến ngẫu nhiên và các phân phối xác suất
thông dụng (một và hai chiều); các khái niệm cơ bản của thống kê toán học nhằm giúp sinh
viên biết cách xử lý các bài toán thống kê về ước lượng, kiểm định giả thuyết. . . . Trên cơ sở đó
sinh viên có được một phương pháp tiếp cận với mô hình thực tế và có kiến thức cần thiết để
đưa ra lời giải đúng cho các bài toán đó.
Nội dung vắn tắt học phần: Sự kiện ngẫu nhiên và phép tính xác suất, đại lượng ngẫu
nhiên, phân phối xác suất, véc tơ ngẫu nhiên, lý thuyết ước lượng thống kê, lý thuyết quyết
định thống kê.
5
Chương 1
Sự kiện ngẫu nhiên và phép tính xác suất
Các hiện tượng trong tự nhiên hay xã hội xảy ra một cách ngẫu nhiên (không biết trước kết
quả) hoặc tất định (biết trước kết quả sẽ xảy ra). Chẳng hạn một vật nặng được thả từ trên
cao chắc chắn sẽ rơi xuống đất, trong điều kiện bình thường nước sôi ở 100∘ C. . . Đó là những
hiện tượng diễn ra có tính quy luật, tất nhiên. Trái lại, khi tung đồng xu ta không biết sẽ xuất
hiện mặt sấp hay mặt ngửa; ta không thể biết trước có bao nhiêu cuộc gọi đến tổng đài; có
bao nhiêu khách hàng đến điểm phục vụ trong khoảng thời gian nào đó; ta không thể xác
định trước chỉ số chứng khoán trên thị trường chứng khoán. . . Đó là những hiện tượng ngẫu
nhiên. Tuy nhiên, nếu tiến hành quan sát nhiều lần một hiện tượng ngẫu nhiên trong những
hoàn cảnh như nhau, thì trong nhiều trường hợp ta có thể rút ra những kết luận có tính quy
luật về những hiện tượng này. Lý thuyết xác suất nghiên cứu các quy luật của các hiện tượng
ngẫu nhiên. Việc nắm bắt các quy luật này sẽ cho phép dự báo các hiện tượng ngẫu nhiên đó
sẽ xảy ra như thế nào. Chính vì vậy các phương pháp của lý thuyết xác suất được ứng dụng
rộng rãi trong việc giải quyết các bài toán thuộc nhiều lĩnh vực khác nhau của khoa học tự
nhiên, kỹ thuật và kinh tế–xã hội.
1.1 Sự kiện. Quan hệ giữa các sự kiện
1.1.1 Phép thử. Sự kiện

Định nghĩa 1.1 (Phép thử. Sự kiện). (a) Việc thực hiện một nhóm các điều kiện cơ bản để
quan sát một hiện tượng nào đó được gọi là một phép thử (experiment).
(b) Hiện tượng, kết quả xét trong phép thử gọi là sự kiện hay biến cố (event).
(c) Sự kiện sơ cấp hay kết cục của phép thử là một kết quả mà ta không chia nhỏ hơn được,
ký hiệu là ω.
(d) Sự kiện phức hợp là sự kiện có thể phân tích thành các sự kiện nhỏ hơn.
6
(e) Tập hợp tất cả các kết cục của một phép thử tạo thành không gian các sự kiện sơ cấp, ký
hiệu là
Ω = ωi , i ∈ I ,

I là tập chỉ số.
Ví dụ 1.1. (a) Gieo một con xúc xắc (cân đối, đồng chất, trên mặt phẳng cứng) là một phép
thử. Xúc xắc xuất hiện mặt 1, 2, 3, 4, 5, 6 chấm là các sự kiện.
(b) Gieo một đồng xu (cân đối, đồng chất, trên mặt phẳng cứng) là một phép thử. Đồng xu
xuất hiện mặt sấp, mặt ngửa là các sự kiện.
Ví dụ 1.2. Gieo một con xúc xắc, khi đó
(a) Sự kiện Ai "xuất hiện mặt i chấm", i = 1, . . . , 6 là sự kiện sơ cấp.
(b) Sự kiện A "xuất hiện mặt chấm chẵn" là sự kiện phức hợp vì có thể phân tích nó thành
các sự kiện "xuất hiện mặt 2, 4, 6 chấm".
Ví dụ 1.3. (a) Phép thử gieo một đồng xu (cân đối, đồng chất, trên mặt phẳng cứng) có
không gian các sự kiện sơ cấp là Ω = {S, N }.
(b) Phép thử gieo đồng thời hai đồng xu (cân đối, đồng chất, trên mặt phẳng cứng) có không
gian các sự kiện sơ cấp là Ω = {SS, SN, NS, NN }.
Chú ý 1.1. (a) Chú ý rằng bản chất của các sự kiện sơ cấp không có vai trò đặc biệt gì trong
lý thuyết xác suất. Chẳng hạn có thể mã hóa các kết quả và xem không gian các sự kiện
sơ cấp của phép thử tung đồng xu là Ω = {0, 1}, trong đó 0 là sự kiện sơ cấp chỉ mặt
sấp xuất hiện và 1 để chỉ mặt ngửa xuất hiện.
(b) Mỗi kết cục ω của phép thử 𝒞 được gọi là kết cục thuận lợi cho sự kiện A nếu A xảy ra
khi kết cục của phép thử 𝒞 là ω.
Ví dụ 1.4. Nếu gọi sự kiện A "xuất hiện mặt chấm chẵn" trong phép thử gieo con xúc xắc thì
A có các kết cục thuận lợi là 2, 4, 6.
1.1.2 Phân loại sự kiện

Có 3 loại sự kiện.
(a) Sự kiện chắc chắn là sự kiện nhất định sẽ xảy ra khi thực hiện một phép thử. Ký hiệu là
U hoặc Ω hoặc S.
(b) Sự kiện không thể có là sự kiện nhất định không xảy ra khi thực hiện một phép thử. Ký
hiệu là V hoặc ∅.
(c) Sự kiện ngẫu nhiên là sự kiện có thể xảy ra, cũng có thể không xảy ra khi thực hiện một
phép thử. Ký hiệu là A, B, C, A1 , A2 . . .
1.1. Sự kiện. Quan hệ giữa các sự kiện 7

Ví dụ 1.5. Gieo một con xúc xắc, khi đó
(a) Sự kiện S “xuất hiện mặt có số chấm ≤ 6 và ≥ 1” là sự kiện chắc chắn.
(b) Sự kiện ∅ “xuất hiện mặt 7 chấm” là sự kiện không thể.
(c) Sự kiện A “xuất hiện mặt chấm chẵn” là sự kiện ngẫu nhiên.
1.1.3 Quan hệ giữa các sự kiện

Một cách tương ứng với các phép toán của tập hợp, trong lý thuyết xác suất người ta xét các
quan hệ sau đây cho các sự kiện trong cùng một phép thử.
(a) Quan hệ kéo theo: Sự kiện A kéo theo sự kiện B, ký hiệu A ⊂ B, nếu khi A xảy ra thì B
xảy ra.
Nếu A ⊂ B và B ⊂ A thì ta nói hai sự kiện A và B trùng nhau, viết là A = B.
(b) Tổng các sự kiện: Sự kiện A được gọi là tổng của các sự kiện A1 , A2 ,. . . , An nếu A xảy
ra khi và chỉ khi ít nhất một trong các sự kiện Ai xảy ra, i = 1, 2, . . . , n. Viết là:
A = A1 + A2 + · · · + A n
hoặc
A = A1 ∪ A2 ∪ · · · ∪ A n
Hình 1.1: Sơ đồ Venn của A ∪ B và A ∩ B
(c) Tích các sự kiện: Sự kiện B được gọi là tích của các sự kiện A1 , A2 ,. . . , An nếu B xảy ra
khi và chỉ khi tất cả các sự kiện Ai xảy ra, i = 1, 2, . . . , n. Viết là:
B = A1 A2 . . . A n
hoặc
B = A1 ∩ A2 ∩ · · · ∩ A n

Hình 1.2: Hai sự kiện xung khắc
(d) Sự kiện xung khắc: Hai sự kiện A và B được gọi xung khắc với nhau nếu chúng không
đồng thời xảy ra trong cùng một phép thử.
Như vậy, nếu A và B xung khắc thì A ∩ B = ∅.
(e) Sự kiện đối lập: Sự kiện không xảy ra sự kiện A được gọi là sự kiện đối lập của A, ký
hiệu là A hoặc Ac .
Như vậy A và A thỏa mãn tính chất: A ∪ A = S và A ∩ A = ∅.
Hình 1.3: Sự kiện đối lập
(f) Hiệu hai sự kiện: Hiệu của 2 sự kiện A và B, ký hiệu là A − B, là sự kiện xảy ra khi và
chỉ khi A xảy ra nhưng B không xảy ra.
Trường hợp hay sử dụng sự kiện hiệu: A = S − A, A = S − A.
Trường hợp tổng quát, ta biến đổi thành sự kiện tích như sau: A − B = A ∩ B.
(g) Hệ (nhóm) đầy đủ các sự kiện: Hệ (nhóm) n sự kiện A1 , A2 ,. . . , An được gọi là hệ

(nhóm) đầy đủ các sự kiện nếu nhất định phải xảy ra một và chỉ một trong các sự kiện
ấy sau phép thử. Như vậy hệ { A1 , A2 , . . . , An } là hệ đầy đủ nếu

 A ∩ A = ∅, i ̸= j,
i j
 A ∪ A ∪ · · · ∪ A = S.
1 2 n

Nhận xét 1.1. Các sự kiện trong cùng một phép thử với phép toán tổng, tích và lấy sự kiện
đối tạo thành đại số Boole, do đó các phép toán này có các tính chất như các phép toán hợp,
giao, lấy phần bù đối với các tập con của không gian các sự kiện sơ cấp. Chẳng hạn
1. A ∩ ∅ = ∅. 6. ∅ = S.
2. A ∪ ∅ = A. 7. ( A) = A.
3. A ∩ A = ∅. 8. ( A ∩ B) = A ∪ B.
4. A ∪ A = S. 9. ( A ∪ B) = A ∩ B.
5. S = ∅. 10. A ∪ B = A ∩ B; A ∩ B = A ∪ B.
11. A = A ∩ ( B ∪ B ) = ( A ∩ B ) ∪ ( A ∩ B ).
Chú ý 1.2. (a) Mọi sự kiện ngẫu nhiên đều có thể biểu diễn dưới dạng tổng của một số sự
kiện sơ cấp nào đó.
Sự kiện chắc chắn S là tổng của mọi sự kiện sơ cấp có thể. Do đó S còn được gọi là không
gian các sự kiện sơ cấp Ω.
¶ ©
(b) Đối với một sự kiện A thì ta có hệ đầy đủ A, A .
¶ ©
Đối với hai sự kiện A và B, một hệ đầy đủ là A ∩ B, A ∩ B, A ∩ B, A ∩ B .
Tính chất 1.1. (a) A ∪ B = B ∪ A, A ∩ B = B ∩ A (giao hoán).
(b) A ∪ B ∪ C = ( A ∪ B) ∪ C = A ∪ ( B ∪ C ), A ∩ B ∩ C = ( A ∩ B) ∩ C = A ∩ ( B ∩ C ) (kết
hợp).
(c) A ∩ ( B ∪ C ) = A ∩ B ∪ A ∩ C (phân phối của phép cộng và phép nhân).
Đặc biệt A + A = A; AA = A; A + S = S; AS = A; A + ∅ = A; A∅ = ∅.
Ví dụ 1.6. (a) Một mạng điện gồm ba bóng đèn mắc nối tiếp. Gọi Ai là sự kiện “bóng đèn
thứ i bị cháy”, i = 1, 2, 3. Gọi A là sự kiện “mạng mất điện”. Ta thấy rằng mạng bị mất
điện khi ít nhất một trong ba bóng bị cháy. Vậy A = A1 + A2 + A3 .
(b) Một mạng điện gồm ba bóng đèn mắc song song. Gọi Bi là sự kiện “bóng đèn thứ i bị
cháy”, i = 1, 2, 3. Gọi B là sự kiện “mạng mất điện”. Ta thấy rằng mạng bị mất điện khi
cả ba bóng bị cháy. Vậy B = B1 B2 B3 .
(c) Một nhà máy có ba phân xưởng sản xuất ra cùng một loại sản phẩm. Giả sử rằng mỗi
sản phẩm của nhà máy chỉ do một trong ba phân xưởng này sản xuất. Chọn ngẫu nhiên
một sản phẩm, gọi Ci là sự kiện "sản phẩm được chọn do phân xưởng thứ i sản xuất",
i = 1, 2, 3. Khi đó hệ ba sự kiện {C1 , C2 , C3 } là hệ đầy đủ.
Ví dụ 1.7. Ba xạ thủ A, B, C mỗi người bắn một viên đạn vào mục tiêu. Gọi A1 , A2 , A3 lần lượt
là sự kiện "A, B, C bắn trúng mục tiêu".

(a) Hãy mô tả các sự kiện A1 A2 A3 , A1 A2 A3 , A1 + A2 + A3 .
(b) Biểu diễn các sự kiện sau theo A1 , A2 , A3 :

A: Có ít nhất hai xạ thủ bắn trúng;
B: Có nhiều nhất một xạ thủ bắn trúng;
C: Chỉ có xạ thủ A bắn trúng;
D: Chỉ có một xạ thủ bắn trúng.
(c) Các sự kiện A1 , A2 , A3 có xung khắc không?
Lời giải:
(a) A1 A2 A3 : "cả ba xạ thủ đều bắn trúng";

A1 A2 A3 : "cả ba xạ thủ đều bắn trượt";
A1 + A2 + A3 : "có ít nhất một xạ thủ bắn trúng".
(b) A = A1 A2 + A1 A3 + A2 A3 ;
B = A1 A2 + A1 A3 + A2 A3 ;
C = A1 A2 A3 ;
D = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 .
(c) Các sự kiện A1 , A2 , A3 không xung khắc vì có thể cả ba xạ thủ đều bắn trúng mục tiêu.
1.2 Giải tích kết hợp
1.2.1 Quy tắc cộng. Quy tắc nhân
1.2.1a Quy tắc cộng

Định nghĩa 1.2 (Quy tắc cộng). Nếu một công việc được chia ra thành k trường hợp để thực
hiện, trường hợp một có n1 cách thực hiện xong công việc, trường hợp hai có n2 cách thực
hiện xong công việc,. . . , trường hợp k có nk cách thực hiện xong công việc và không có một
cách thực hiện nào ở trường hợp này lại trùng với một cách thực hiện ở trường hợp khác. Khi
đó ta có n = n1 + n2 + · · · + nk cách thực hiện công việc.
1.2.1b Quy tắc nhân

Định nghĩa 1.3 (Quy tắc nhân). Giả sử một công việc nào đó được chia thành k giai đoạn.
Có n1 cách thực hiện giai đoạn thứ nhất, n2 cách thực hiện giai đoạn thứ hai,. . . , nk cách thực
hiện giai đoạn thứ k. Khi đó ta có n = n1 n2 . . . nk cách thực hiện công việc.
1.2. Giải tích kết hợp 11

Ví dụ 1.8. Giả sử để đi từ A đến C có thể đi qua B, trong đó có 2 đường khác nhau đi trực tiếp
từ A đến C, có 3 đường khác nhau để đi từ A đến B và có 2 đường khác nhau để đi từ B đến
C. Hỏi có bao nhiêu cách đi từ A đến C?
Lời giải: Đi từ A đến C có 2 lựa chọn: Đi trực tiếp từ A đến C: có n1 = 2 cách; đi gián tiếp từ
A đến C thông qua B: có n2 = 3 × 2 = 6 (cách).
Tổng số cách đi từ A đến C là n = n1 + n2 = 2 + 6 = 8 (cách).
1.2.2 Chỉnh hợp

Định nghĩa 1.4 (Chỉnh hợp). Chỉnh hợp chập k của n phần tử là một nhóm có thứ tự gồm k
phần tử khác nhau lấy từ n phần tử đã cho (k ≤ n).
Ký hiệu và công thức tính:
n!
Akn = = n ( n − 1) . . . ( n − k + 1) (1.1)
(n − k)!
Ví dụ 1.9. Từ 5 chữ số 1, 2, 3, 4, 5 lập được bao nhiêu số có 3 chữ số khác nhau?
Lời giải: Số các số được lập là A35 = 5 × 4 × 3 = 60 (số).
1.2.3 Chỉnh hợp lặp

Định nghĩa 1.5 (Chỉnh hợp lặp). Chỉnh hợp lặp chập k của n phần tử là một nhóm có thứ tự
gồm k phần tử có thể giống nhau lấy từ n phần tử đã cho.

k
An = nk (1.2)
Ví dụ 1.10. Từ 5 chữ số 1, 2, 3, 4, 5 lập được bao nhiêu số có 3 chữ số?

3
Lời giải: Chọn 3 chữ số từ 5 chữ số có thứ tự và có thể lặp lại. Số các số được lập là A5 = 53 =
125 (số).
1.2.4 Hoán vị
Định nghĩa 1.6 (Hoán vị). Hoán vị của n phần tử là một nhóm có thứ tự gồm đủ mặt n phần
tử đã cho. Nói cách khác, hoán vị là một chỉnh hợp chập n của n phần tử.

Pn = Ann = n! (1.3)
Ví dụ 1.11. Có 6 người khách cần xếp vào 6 ghế trên một bàn tròn 6 chỗ.
1.2. Giải tích kết hợp 12

(a) Nếu có quan tâm đến khung cảnh xung quanh thì có bao nhiêu cách sắp xếp?
(b) Nếu chỉ quan tâm đến người ngồi xung quanh là ai thì sẽ có bao nhiêu cách?
Lời giải: (a) P6 = 6! = 720 (cách); (b) P5 = 5! = 120 (cách).
1.2.5 Tổ hợp
Định nghĩa 1.7 (Tổ hợp). Tổ hợp chập k của n phần tử là một nhóm không phân biệt thứ tự
gồm k phần tử khác nhau lấy từ n phần tử đã cho (k ≤ n).

n!
Cnk = (1.4)
k!(n − k )!
Ví dụ 1.12. Mỗi đề thi gồm 3 câu hỏi lấy trong 25 câu hỏi cho trước. Hỏi có thể lập được bao
nhiêu đề thi có nội dung khác nhau?
3 = 25 × 24 × 23
Lời giải: Số đề thi có thể lập nên là C25 = 2300 (đề).
3!
Chú ý 1.3. (a) Qui ước 0! = 1.
(b) Cnk = Cnn−k .
(c) Cnk = Cnk− 1 k

−1 + Cn−1 .
(d) Khai triển nhị thức Niu–tơn (a, b ∈ R, n ∈ N* )

n
( a + b)n = ∑ Cnk an−k bk = Cn0 an + Cn1 an−1 b + · · · + Cnn−1 abn−1 + Cnn bn .
k =0
1.3 Khái niệm và các định nghĩa xác suất
1.3.1 Khái niệm xác suất

Mọi sự kiện ngẫu nhiên đều giống nhau ở chỗ chúng không chắc chắn, nhưng khả năng xảy
ra của từng sự kiện lại có thể khác nhau. Để đặc trưng cho khả năng xảy ra (xuất hiện) của các
sự kiện người ta dùng các con số, sự kiện nào có khả năng xảy ra nhiều hơn được đặc trưng
bởi số lớn hơn. Con số đặc trưng cho khả năng xuất hiện của một sự kiện gọi là xác suất của
sự kiện đó.
Định nghĩa 1.8 (Xác suất). Xác suất (probability) của một sự kiện A là một số nằm giữa 0 và
1, số này đo lường khả năng xuất hiện của sự kiện đó khi phép thử được thực hiện.
Ký hiệu là P( A).
1.3. Khái niệm và các định nghĩa xác suất 13

1.3.2 Định nghĩa cổ điển về xác suất

Định nghĩa 1.9 (Định nghĩa cổ điển về xác suất). Giả sử trong một phép thử có n kết cục đồng
khả năng có thể xảy ra, trong đó có m kết cục thuận lợi cho sự kiện A. Khi đó,
m số kết cục thuận lợi cho A

P( A) = = (1.5)
n tổng số kết cục có thể
Từ định nghĩa này ta suy ra các tính chất sau đây của xác suất.
Tính chất 1.2. (a) 0 ≤ P( A) ≤ 1, A là sự kiện bất kỳ.
(b) P(S) = 1.
(c) P(∅) = 0.
(d) Nếu A ⊂ B thì P( A) ≤ P( B).
Ví dụ 1.13. Một người khi gọi điện thoại quên mất 2 số cuối cùng của số điện thoại cần gọi
mà chỉ nhớ được rằng chúng khác nhau. Tìm xác suất để người đó chọn ngẫu nhiên một số
để gọi thì được đúng số cần gọi.
Lời giải: Gọi A là sự kiện "chọn ngẫu nhiên một số để gọi thì được đúng số cần gọi".
Số kết cục đồng khả năng là n = A210 .
Số kết cục thuận lợi cho A là m = 1.

m 1
Vậy P( A) = = .
n 90
Ví dụ 1.14. Từ bộ bài tú-lơ-khơ 52 cây đã trộn kỹ rút ngẫu nhiên ra 2 cây. Tính xác suất xảy ra
các sự kiện sau:
(a) Hai cây rút ra đều là Át.
(b) Hai cây rút ra có 1 cây Át, 1 cây K.
2 = 1326.
Lời giải: Số kết cục đồng khả năng n = C52
(a) Số kết cục thuận lợi cho sự kiện A "hai cây rút ra đều là Át" là m A = C42 . Vậy
mA C2 1
P( A) = = 4 = .
n 1326 221
(b) Số kết cục thuận lợi cho sự kiện B "hai cây rút ra có 1 cây Át, 1 cây K" là
1 1 mB C41 × C41 8
m B = C4 × C4 , suy ra P( B) = = = .
n 1326 663

Ví dụ 1.15. Một đoàn tàu có 4 toa được đánh số I, II, III, IV đỗ ở sân ga. Có 6 hành khách từ
sân ga lên tàu. Mỗi người độc lập với nhau chọn ngẫu nhiên một toa. Tính xác suất để:
(a) toa I có 3 người, toa II có 2 người và toa III có 1 người;
(b) một toa có 3 người, một toa 2 người, một toa có 1 người;
(c) mỗi toa có ít nhất 1 người.
Lời giải: Số trường hợp đồng khả năng có thể có là n = 46 = 4096.
(a) Số trường hợp thuận lợi cho sự kiện A "toa I có 3 người, toa II có 2 người và toa III có 1
60
người" là C63 × C32 × C11 = 60, suy ra P( A) = ≃ 0, 0146.
4096
(b) Số trường hợp thuận lợi cho sự kiện B "một toa có 3 người, một toa 2 người, một toa có
1440
1 người" là C63 × 4 × C32 × 3 × C11 × 2 = 1440, suy ra P( B) = ≃ 0, 3516.
4096
(b) Gọi C là sự kiện "mỗi toa có ít nhất 1 người". Số trường hợp thuận lợi cho sự kiện C là
1560
C63 × 4 × 3! + C62 × C42 × C42 × 2! = 480 + 1080 = 1560. Do đó, P(C ) = ≃ 0, 3809.
4096
Ví dụ 1.16. Ba nữ nhân viên phục vụ A, B và C thay nhau rửa đĩa chén và giả sử ba người này
đều “khéo léo” như nhau. Trong một tháng có 4 chén bị vỡ. Tìm xác suất để:
(a) chị A đánh vỡ 3 chén và chị B đánh vỡ 1 chén;
(b) một trong ba người đánh vỡ 3 chén;
(c) một trong ba người đánh vỡ cả 4 chén.
Lời giải: Số kết cục đồng khả năng có thể có là n = 34 .
(a) Số kết cục thuận lợi cho sự kiện D "chị A đánh vỡ 3 chén và chị B đánh vỡ 1 chén" là
4
m D = C43 × 1 = 4, suy ra P( D ) = ≃ 0, 0494.
81
(b) Số kết cục thuận lợi cho sự kiện E "một trong 3 người đánh vỡ 3 chén" là
24
m E = C31 × C43 × 2 = 24, nên P( E) = ≃ 0, 2963.
81
(c) Số kết cục thuận lợi cho sự kiện F "một trong 3 người đánh vỡ 4 chén" là
3
m F = C31 × C44 = 3. Vậy P( F ) = ≃ 0, 037.
81
Nhận xét 1.2. Định nghĩa cổ điển về xác suất có ưu điểm là dễ vận dụng tuy nhiên định nghĩa
này chỉ áp dụng được với các phép thử có hữu hạn kết cục đồng khả năng xảy ra. Trong
trường hợp có vô hạn kết cục đồng khả năng ta sử dụng định nghĩa xác suất theo quan điểm
hình học.

1.3.3 Định nghĩa xác suất theo quan điểm hình học
Định nghĩa 1.10 (Định nghĩa xác suất theo quan điểm hình học). Giả sử tập hợp vô hạn các
kết cục đồng khả năng của một phép thử có thể biểu thị bởi một miền hình học G (đo được,
hữu hạn, khác 0), còn các kết cục thuận lợi cho A bởi miền con H của G. Khi đó
độ đo H
P( A) = (1.6)
độ đo G
Chú ý 1.4. Tùy theo G là đoạn thẳng, miền phẳng hay khối không gian mà độ đo được hiểu
là độ dài, diện tích hay thể tích.
Ví dụ 1.17. Hai người bạn hẹn gặp nhau ở một địa điểm trong khoảng thời gian từ 7h00 đến
8h00. Mỗi người có thể đến điểm hẹn một cách ngẫu nhiên tại một thời điểm trong khoảng
thời gian nói trên và họ quy ước rằng ai đến trước thì chỉ đợi người kia trong vòng 10 phút.
Tính xác suất để hai người gặp nhau.
Lời giải: Gọi x, y lần lượt là thời điểm đến điểm hẹn của hai người, 0 ≤ x, y ≤ 60. Vậy mỗi
cặp thời điểm đến ( x, y) của hai người là một điểm của miền
G = {( x, y) ∈ R2 : 0 ≤ x ≤ 60; 0 ≤ y ≤ 60} (hình vuông OABC).
Gọi E là sự kiện "hai người gặp nhau", khi đó E được biểu diễn bởi
H = {( x, y) ∈ G : | x − y| ≤ 10} (đa giác OMNBPQ).
Sử dụng định nghĩa xác suất theo quan điểm hình học,
diện tích H diện tích (OMNBPQ) 602 − 502 11

P( E) = = = 2
= ≃ 0, 3056.
diện tích G diện tích (OABC ) 60 36
C P B
60
N
Q
A
O M 60 x
Hình 1.4: Minh họa cho Ví dụ 1.17

Ví dụ 1.18. Cho đoạn thẳng AB có độ dài 10cm. Lấy hai điểm C, D bất kỳ trên đoạn AB (C
nằm giữa A và D). Tính xác suất độ dài AC, CD, DB tạo thành 3 cạnh của một tam giác.
Lời giải: Gọi x là độ dài đoạn AC, y là độ dài đoạn CD thì độ dài đoạn DB là 10 − x − y. Khi
đó ta có điều kiện 0 ≤ x ≤ 10, 0 ≤ y ≤ 10 và 0 ≤ x + y ≤ 10. Tập hợp các giá trị ( x, y) thỏa
mãn điều kiện này tương ứng với miền
G = {( x, y) ∈ R2 : 0 ≤ x ≤ 10, 0 ≤ y ≤ 10, 0 ≤ x + y ≤ 10} (tam giác OMN).
Độ dài các đoạn AC, CD, DB tạo thành 3 cạnh một tam giác phải thỏa mãn tính chất "tổng hai
cạnh lớn hơn một cạnh", tức là x + y > 10 − x − y, x + (10 − x − y) > y, y + (10 − x − y) > x
hay x + y > 5, x < 5 và y < 5. Tập các giá trị ( x, y) thỏa mãn điều kiện này tương ứng với
miền
H = {( x, y) ∈ G : x + y > 5, x < 5, y < 5} (tam giác PQR).
Q
R
M
O P x
diện tích tam giác ( PQR) 1

Theo định nghĩa hình học, xác suất cần tìm là p = = = 0, 25.
diện tích tam giác (OMN ) 4
Ví dụ 1.19. Trên mặt phẳng đã kẻ sẵn các đường thẳng song song cách đều nhau một khoảng
có độ dài 2a, người ta gieo ngẫu nhiên một chiếc kim dài 2b (b < a). Tính xác suất sao cho kim
cắt một đường thẳng trong số những đường thẳng đó.
Lời giải: Gọi x là khoảng cách từ trung điểm của kim đến đường thẳng song song gần
nhất và ϕ là góc mà kim tạo với các đường này. Ta có 0 ≤ x ≤ a, 0 ≤ ϕ ≤ π. Như vậy
có thể biểu diễn miền đồng khả năng bởi hình chữ nhật G = [ a, π ] × [ a, π ]. Miền thuận
lợi cho sự kiện kim cắt đường thẳng song song là H = {( x, ϕ) ∈ G : 0 ≤ x ≤ b sin ϕ;
0 ≤ ϕ ≤ π }. Do đó, Z π
b sin ϕdϕ
diện tích H 0 2b
p= = = .
diện tích G a×π aπ

Nhận xét 1.3. Định nghĩa cổ điển về xác suất và định nghĩa xác suất theo quan điểm hình học
chỉ áp dụng được với các phép thử có kết cục đồng khả năng xảy ra. Trong nhiều bài toán
thực tế, việc tính hết các kết cục của một phép thử không dễ dàng, bên cạnh đó điều kiện các
kết cục đồng khả năng trên thực tế thường khó thỏa mãn.
1.3.4 Định nghĩa thống kê về xác suất

Định nghĩa 1.11 (Tần suất). Giả sử trong một điều kiện nào đó ta có thể lặp lại n lần một phép
m
thử và thấy có m lần xuất hiện sự kiện A. Khi đó, tỷ số gọi là tần suất xuất hiện A, ký hiệu
n
là f ( A).
Như vậy
m
f ( A) = (1.7)
n
Ví dụ 1.20. Để xác định tần suất xuất hiện mặt sấp khi tung một đồng xu nhiều lần, người ta
ghi lại kết quả sau:
Người thí nghiệm Số lần tung n Số lần xuất hiện mặt sấp m Tần suất f
Buýp-phông 4040 2048 0,5080
Piêc-sơn 12000 6019 0,5016
Piêc-sơn 24000 12012 0,5005
Nhận xét 1.4. Tần suất của sự kiện A có tính chất ổn định, nghĩa là nó dao động rất ít xung
quanh một số xác định p nào đó khi số phép thử khá lớn. Số ấy gọi là xác suất của sự kiện A
theo quan điểm thống kê.
Định nghĩa 1.12 (Định nghĩa thống kê về xác suất). Nếu tần suất xuất hiện sự kiện A luôn
luôn dao động xung quanh một số xác định p nào đó và khi số phép thử tăng lên khá lớn mà
tần suất xuất hiện sự kiện A càng gần tới p thì số p được gọi là xác suất của sự kiện A theo
quan điểm thống kê.
Chú ý 1.5. Bằng định nghĩa thống kê về xác suất, người ta đã tìm được xác suất để sinh con
trai trong mỗi lần sinh là p = 0, 518, con số này hầu như không thay đổi theo thời gian, địa
phương và chủng tộc.
(a) Nhà toán học Láp–la–xơ trong 10 năm liền theo dõi ở thành phố Pê–tec–bua, Luân–đôn
và Béc–lin thấy tỷ số đó là 22/43. Ông cũng đã theo dõi 40 năm liền ở Pa–ri thấy tỷ số
đó là 25/49.
(b) Nhà toán học Crame theo dõi ở Thụy–điển năm 1935 cũng thấy tỷ số đó là 0,518.
Nhận xét 1.5. (a) Định nghĩa thống kê của xác suất khắc phục được một nhược điểm của
định nghĩa cổ điển là không dùng đến khái niệm đồng khả năng.

(b) Định nghĩa này không giúp ta tính được chính xác xác suất của một sự kiện mà chỉ tìm
được giá trị gần đúng; đồng thời số phép thử phải đủ lớn và chỉ dùng được cho các phép
thử ngẫu nhiên có thể lặp lại nhiều lần một cách độc lập trong các điều kiện giống nhau.
Các định nghĩa trên về xác suất giúp ta một cách tích cực trong việc tính xác suất, nhưng
mỗi định nghĩa đều có nhược điểm của nó. Để khắc phục các nhược điểm đó, năm 1933 nhà
toán học Xô–viết Can–mơ–gơ–rôp đã đưa ra xác suất theo phương pháp tiên đề. Tuy nhiên ta
không đề cập đến trong chương trình này.
1.3.5 Nguyên lý xác suất nhỏ, nguyên lý xác suất lớn
1.3.5a Nguyên lý xác suất nhỏ

Sự kiện không thể có có xác suất bằng 0, một sự kiện có xác suất gần bằng 0 vẫn có thể xảy ra
khi thực hiện một số lớn các phép thử. Tuy nhiên qua thực nghiệm và quan sát thực tế, người
ta thấy rằng các sự kiện có xác suất nhỏ sẽ không xảy ra khi ta chỉ thực hiện một phép thử
hay một vài phép thử. Từ đó ta thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”:
Nếu một sự kiện có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử sự kiện đó sẽ không
xảy ra".
Nhận xét 1.6. (a) Mức xác suất được coi là nhỏ tùy thuộc vào từng bài toán cụ thể và gọi là
mức ý nghĩa, ký hiệu là α.
(b) Nguyên lý xác suất nhỏ là cơ sở của phương pháp kiểm định (sẽ được đề cập ở Chương
5).
1.3.5b Nguyên lý xác suất lớn

Tương tự như trên, ta có thể đưa ra nguyên lý xác suất lớn: Nếu sự kiện A có xác suất gần bằng
1 thì trên thực tế có thể cho rằng trong một phép thử sự kiện đó sẽ xảy ra".
Nhận xét 1.7. (a) Mức xác suất đủ lớn gọi là độ tin cậy, ký hiệu là γ = 1 − α. Việc quy định
một mức xác suất thế nào là lớn sẽ tùy thuộc vào từng bài toán cụ thể.
(b) Nguyên lý xác suất lớn là cơ sở của phương pháp ước lượng bằng khoảng tin cậy (sẽ
được đề cập ở Chương 4).

1.4 Công thức cộng và nhân xác suất
1.4.1 Xác suất có điều kiện

Định nghĩa 1.13 (Xác suất có điều kiện). Giả sử trong một phép thử ta có P( B) > 0. Khi đó
xác suất có điều kiện của sự kiện A nào đó, biết rằng đã có B, là một số không âm ký hiệu là
P( AB)
P( A| B) = (1.8)
P( B)
Tương tự
P( AB)
P( B| A) = , P( A) > 0 (1.9)
P( A)
Nhận xét 1.8. (a) Xác suất điều kiện có mọi tính chất của một xác suất bình thường, chẳng
hạn P( A| B) ≥ 0, P( A| A) = 1.
(b) Ta có thể tính xác suất điều kiện bằng cách áp dụng các công thức (1.8) hoặc (1.9) hoặc
tính trực tiếp.
Ví dụ 1.21. Từ một bộ bài tú-lơ-khơ 52 cây đã trộn kỹ rút ngẫu nhiên ra một cây bài. Biết đó
là cây đen, tính xác suất đó là cây át.
Lời giải: Gọi A là sự kiện "rút được cây át" và B là sự kiện “rút được cây đen”. Xác suất cần
2
tính là P( A| B) = .
26
Ví dụ 1.22. Trong một thùng kín có N quả cầu giống nhau trong đó có M cầu trắng (M < N).
Lấy ngẫu nhiên lần lượt không hoàn lại 2 quả cầu. Tính xác suất để cầu thứ hai lấy ra là trắng,
biết rằng cầu thứ nhất lấy ra đã là trắng.
Lời giải: Gọi Ai là sự kiện "cầu thứ i lấy ra là trắng", i = 1, 2. Sử dụng công thức (1.8) ta được
M×( M−1)
P ( A1 A2 ) N ×( N −1) M−1
P ( A2 | A1 ) = = M
= .
P ( A1 ) N
N−1
1.4.2 Công thức nhân xác suất
1.4.2a Tính độc lập của các sự kiện

Định nghĩa 1.14 (Sự kiện độc lập). (a) Hai sự kiện A và B được gọi là độc lập với nhau nếu
sự kiện này xảy ra hay không xảy ra không làm ảnh hướng tới khả năng xảy ra của sự
kiện kia, nghĩa là P( A| B) = P( A| B) = P( A), P( B| A) = P( B| A) = P( B).
(b) Các sự kiện A1 , A2 , . . . , An được gọi là độc lập từng đôi với nhau nếu mỗi cặp 2 trong n
sự kiện đó độc lập với nhau.
1.4. Công thức cộng và nhân xác suất 20

(c) Các sự kiện A1 , A2 , . . . , An được gọi là độc lập trong tổng thể nếu mỗi sự kiện trong
chúng độc lập với tích của một số bất kỳ sự kiện trong các sự kiện còn lại.
Chú ý 1.6. (a) Nếu A và B độc lập thì các cặp A và B; A và B; A và B cũng độc lập.
(b) Thông thường tính độc lập của các sự kiện được suy ra từ ý nghĩa thực tế.
1.4.2b Công thức nhân xác suất

(a) Nếu A và B là hai sự kiện bất kỳ thì
P( AB) = P( A) P( B| A) = P( B) P( A| B) (1.10)
Nếu A và B là hai sự kiện độc lập thì
P( AB) = P( A) P( B) (1.11)
(b) Mở rộng cho tích n sự kiện bất kỳ A1 , A2 , . . . , An :
P ( A 1 A 2 . . . A n ) = P ( A 1 ) P ( A 2 | A 1 ) P ( A 3 | A 1 A 2 ) . . . P ( A n | A 1 A 2 . . . A n −1 ) (1.12)
Nếu A1 , A2 , . . . , An độc lập trong tổng thể, thì:
P ( A1 A2 . . . A n ) = P ( A1 ) P ( A2 ) . . . P ( A n ) (1.13)
Nhận xét 1.9. Công thức nhân (1.11) cung cấp cho ta một phương pháp dễ thực hành để kiểm
tra tính độc lập của hai sự kiện ngẫu nhiên.
Ví dụ 1.23. Có 4 que thăm, trong đó có 3 que thăm dài bằng nhau và 1 que thăm ngắn hơn.
Bốn người lần lượt lên rút ngẫu nhiên một que thăm. Tính xác suất người thứ i rút được thăm
ngắn (i = 1, 2, 3, 4).
Lời giải: Gọi Ai là sự kiện “người thứ i rút được thăm ngắn”, i = 1, 2, 3, 4. Khi đó,
1
P ( A1 ) = .
4
3 1 .1
P ( A2 ) = P ( A1 A2 ) = P A1 P A2 | A1 = × =
4 3 4
3 2 1 1
P ( A3 ) = P A1 A2 A3 = P A1 P A2 | A1 P A3 | A1 A2 = × × = .
4 3 2 4
1
P ( A4 ) = P ( A1 A2 A3 A4 ) = P A1 P A2 | A1 P A3 | A1 A2 P ( A4 | A1 A2 A3 ) = .
4
1
Vậy khả năng rút được thăm ngắn của 4 người là như nhau và bằng .
4

Ví dụ 1.24. Một tổ có 15 sinh viên trong đó có 5 sinh viên học giỏi môn Xác suất thống kê.
Chia tổ này thành 5 nhóm, mỗi nhóm 3 người. Tính xác suất để nhóm nào cũng có một sinh
viên học giỏi môn Xác suất thống kê.
Lời giải: Gọi A là sự kiện "nhóm nào cũng có một sinh viên học giỏi môn Xác suất thống kê";
Ai là sự kiện "nhóm i có một sinh viên học giỏi môn Xác suất thống kê", i = 1, . . . , 5. Khi đó
A = A1 A2 A3 A4 A5 . Sử dụng công thức nhân (1.12)
P ( A ) = P ( A1 ) P ( A2 | A1 ) P ( A3 | A1 A2 ) P ( A4 | A1 A2 A3 ) P ( A5 | A1 A2 A3 A4 ),
trong đó
C51 × C10
2
45 C41 × C82 28
P ( A1 ) = 3
= , P ( A2 | A1 ) = 3
= ,
C15 91 C12 55
C31 × C62 15 C21 × C42 3
P ( A3 | A1 A2 ) = 3
= , P ( A4 | A1 A2 A3 ) = 3
= ,
C9 28 C6 5
C11 × C22
P ( A5 | A1 A2 A3 A4 ) = = 1.
C33
81
Vậy P( A) = ≃ 0, 0809.
1001
Ví dụ 1.25 (Đề thi MI2020 kỳ 20151). Ra khỏi phòng khách, 6 người cùng xỏ ngẫu nhiên vào
một đôi giày trong bóng tối. Mỗi người chỉ có thể phân biệt chiếc giày phải với chiếc giày trái,
còn không thể phân biệt được giày của mình với giày của người khác. Tính xác suất để
(a) Mỗi người khách xỏ vào đúng đôi giày của mình.
(b) Mỗi người khách xỏ vào đúng hai chiếc giày của cùng một đôi nào đó.
Lời giải:
(a) Gọi A là sự kiện "cả 6 người khách đều xỏ đúng đôi giày của mình"; Ai là sự kiện "người
thứ i xỏ đúng đôi giày của mình", i = 1, 2, . . . , 6. Khi đó A = A1 A2 A3 A4 A5 A6 và
1 1 1 1
P ( A ) = P ( A1 ) P ( A2 | A1 ) . . . P ( A6 | A1 A2 A3 A4 A5 ) = 2
× 2 ×···× 2 = .
6 5 1 (6!)2
(b) Gọi B là sự kiện "mỗi người khách đều xỏ đúng 2 chiếc giày của cùng một đôi"; Bi là
sự kiện "người thứ i xỏ đúng 2 chiếc giày của cùng một đôi", i = 1, 2, . . . , 6. Khi đó
B = B1 B2 B3 B4 B5 B6 và
1 1 1 1
P( B) = P( B1 ) P( B2 | B1 ) . . . P( B6 | B1 B2 B3 B4 B5 ) = × ×···× = .
6 5 1 6!

Hình 1.6: Minh họa công thức cộng
1.4.3 Công thức cộng xác suất

(a) Nếu A và B là hai sự kiện bất kỳ thì
P( A + B) = P( A) + P( B) − P( AB) (1.14)
Nếu A và B là hai sự kiện xung khắc thì
P( A + B) = P( A) + P( B) (1.15)
(b) Nếu A, B và C là ba sự kiện bất kỳ thì
P( A + B + C ) = P( A) + P( B) + P(C ) − P( AB) − P( AC ) − P( BC ) + P( ABC ) (1.16)
(c) Mở rộng cho tổng n sự kiện bất kỳ A1 , A2 , . . . , An :

n n
P ∑ Ai = ∑ P ( Ai ) − ∑ P ( Ai A j ) + ∑ P ( Ai A j A k ) − . . .
i =1 i =1 i< j i < j<k
+ (−1)n−1 P( A1 A2 . . . An ). (1.17)
Nếu A1 , A2 , . . . , An xung khắc từng đôi thì

n n
P ∑ Ai = ∑ P ( Ai ) (1.18)
i =1 i =1
Đặc biệt:
n
(a) Nếu A1 , A2 , . . . , An là hệ đầy đủ các sự kiện thì ∑ P( Ai ) = 1.
i =1
(b) P( A) = 1 − P( A).
(c) P( A) = P( AB) + P( AB).
Ví dụ 1.26. Một lớp có 100 sinh viên, trong đó có 40 sinh viên giỏi ngoại ngữ, 30 sinh viên
giỏi toán xác suất, 20 sinh viên giỏi cả ngoại ngữ lẫn toán xác suất. Chọn ngẫu nhiên một sinh
viên trong lớp. Tìm xác suất để sinh viên đó giỏi ít nhất 1 trong 2 môn trên.

Lời giải: Gọi A là sự kiện "sinh viên đó giỏi ít nhất 1 trong 2 môn ngoại ngữ, toán xác suất";
N là sự kiện "sinh viên đó giỏi ngoại ngữ"; T là sự kiện "sinh viên đó giỏi toán xác suất". Khi
đó, A = T + N. Suy ra
30 40 20 50
P( A) = P( T + N ) = P( T ) + P( N ) − P( TN ) = + − = = 0, 5.
100 100 100 100
Ví dụ 1.27. Ba xạ thủ độc lập với nhau cùng bắn súng vào bia. Xác suất bắn trúng bia của xạ
thủ thứ nhất, thứ hai, thứ ba tương ứng là 0,7, 0,8 và 0,9. Tính xác suất để:
(a) có duy nhất một xạ thủ bắn trúng bia;
(b) có đúng hai xạ thủ bắn trúng bia;
(c) có ít nhất một xạ thủ bắn trúng bia;
(d) xạ thủ thứ nhất bắn trúng bia biết rằng có hai xạ thủ bắn trúng bia.
Lời giải: Gọi Ai là các sự kiện "xạ thủ A, B, C bắn trúng bia" tương ứng, i = 1, 2, 3.
(a) Gọi A là sự kiện "có duy nhất một xạ thủ bắn trúng bia". Khi đó,
A = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 .
Sử dụng công thức cộng (1.18) và công thức nhân (1.13) trong trường hợp các sự kiện
xung khắc và độc lập suy ra
P ( A ) = P ( A1 ) P ( A2 ) P ( A3 ) + P ( A1 ) P ( A2 ) P ( A3 ) + P ( A1 ) P ( A2 ) P ( A3 )
= 0, 7 × 0, 2 × 0, 1 + 0, 3 × 0, 8 × 0, 1 + 0, 3 × 0, 2 × 0, 9 = 0, 092.
(b) Gọi B là sự kiện "có đúng hai xạ thủ bắn trúng bia". Khi đó,
B = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 .
Làm tương tự ý (a), P( B) = 0, 398.
(c) Gọi C là sự kiện "ít nhất một xạ thủ bắn trúng bia", khi đó
Hoặc C = A1 + A2 + A3 ,
P ( C ) = P ( A1 ) + P ( A2 ) + P ( A3 ) − P ( A1 A2 ) − P ( A1 A3 ) − P ( A2 A3 ) + P ( A1 A2 A3 )
= 0, 994.
Hoặc C = A1 A2 A3 ,
P ( C ) = P ( A1 ) P ( A2 ) P ( A3 ), P(C ) = 1 − P(C ) = 1 − 0, 006 = 0, 994.

Hoặc C = A + B + A1 A2 A3 , P(C ) = P( A) + P( B) + P( A1 A2 A3 ) = 0, 994.
P ( A1 B ) P ( A1 A2 A3 + A1 A2 A3 ) 0, 182
(d) P( A1 | B) = = = = 0, 46.
P( B) P( B) 0, 398
Ví dụ 1.28 (Đề thi MI2020 kỳ 20182). Cho ba sự kiện A, B, C độc lập từng đôi thỏa mãn
P( A) = P( B) = P(C ) = p và P( ABC ) = 0.
(a) Tính P( ABC ); P( AB C ); P( A B C ).
(b) Tìm giá trị p lớn nhất có thể có.
Lời giải:
(a) Vì ABC + ABC = AB; ABC và ABC xung khắc; A và B độc lập, nên
P( ABC ) = P( AB) − P( ABC ) = P( A) P( B) − 0 = p2 .
Vì A = AB C + ABC + ABC + ABC, sử dụng tính xung khắc của các sự kiện,
P( AB C ) = P( A) − P( ABC ) − P( ABC ) − P( ABC ) = p − 2p2 .
Vì A B C + AB C = B C nên P( A B C ) = P( B C ) − P( AB C ) = 1 − 3p + 3p2 .
(b) Từ ý (a) và đầu bài ta có P( ABC ) = 0, P( ABC ) = P( ABC ) = P( ABC ) = p2 , P( AB C ) =

P( ABC ) = P( A BC ) = p − 2p2 , P( A B C ) = 1 − 3p + 3p2 . Khi đó p thỏa mãn hệ



 0 ≤ p2 ≤ 1,

0 ≤ p − 2p2 ≤ 1,


0 ≤ 1 − 3p + 3p2 ≤ 1.

Hệ này tương đương với 0 ≤ p ≤ 0, 5. Vậy giá trị p lớn nhất là 0, 5.
Ví dụ 1.29 (Đề thi MI2020 kỳ 20183). Có một nhóm 4 sinh viên, mỗi người có một chiếc mũ
giống hệt nhau để trên giá. Khi ra khỏi phòng, mỗi người lấy ngẫu nhiên một chiếc mũ để
đội. Tính xác suất để:
(a) Sinh viên thứ nhất và sinh viên thứ hai lấy đúng mũ của mình.
(b) Có ít nhất một sinh viên lấy đúng mũ của mình.
Lời giải: Gọi A là sự kiện "có ít nhất một sinh viên lấy đúng mũ của mình"; Ai là sự kiện "sinh
viên thứ i lấy đúng mũ của mình", i = 1, 2, 3, 4.
3! 2! 1
(a) P( A1 A2 ) = P( A1 ) P( A2 | A1 ) = × = ≃ 0, 0833.
4! 3! 12

(b)
P ( A ) = P ( A1 + A2 + A3 + A4 )
4
= ∑ P ( A i ) − P ( A1 A2 ) − P ( A1 A3 ) − P ( A1 A4 ) − P ( A2 A3 )
i =1
− P ( A2 A4 ) − P ( A3 A4 ) + P ( A1 A2 A3 ) + P ( A1 A2 A4 )
+ P ( A1 A3 A4 ) + P ( A2 A3 A4 ) − P ( A1 A2 A3 A4 )
1 1 1 1
= 4× −6× +4× − = 0, 625.
4 12 24 24
Ví dụ 1.30 (Đề thi MI2020 kỳ 20191). Lớp MI2020 có 80 sinh viên trong đó có 20 sinh viên
thuộc tổ I, 25 sinh viên thuộc tổ II và 35 sinh viên thuộc tổ III. Chọn ngẫu nhiên 10 sinh viên
trong lớp tham dự trại hè. Tính xác suất để mỗi tổ có ít nhất 1 sinh viên được chọn.
Lời giải: Gọi A là sự kiện "Mỗi tổ có ít nhất 1 sinh viên được chọn", Ai : "tổ i có ít nhất 1 sinh
viên được chọn", i = 1, 2, 3. Khi đó, A = A1 A2 A3 và
P ( A ) = P ( A1 A2 A3 ) = 1 − P ( A1 + A2 + A3 ).
Sử dụng công thức (1.16),
P ( A1 + A2 + A3 ) = P ( A1 ) + P ( A2 ) + P ( A3 ) − P ( A1 A2 ) − P ( A1 A3 ) − P ( A2 A2 ) + P ( A1 A2 A3 )
1 h 10 10 10 10 10 10
i
= 10 (C60 + C55 + C45 ) − (C35 + C25 + C20 ) + 0
C80
≃ 1 − 0, 06538 = 0, 93462.
Ví dụ 1.31 (Đề thi MI2020 kỳ 20161). Biết từ vị trí A đến B có hai đường đi với xác suất bị
ngập của mỗi con đường là p; từ B đến C cũng có hai đường đi với xác suất bị ngập của mỗi
con đường cũng là p. Biết đường đi từ A đến C bị ngập, tính xác suất để đường đi từ A đến B
không bị ngập.
Lời giải: Gọi E AB là sự kiện "đường đi từ A đến B không ngập", khi đó E AB là sự kiện "đường
đi từ A đến B bị ngập". Xác suất cần tìm là
P[( E AB )( E AC )] P[( E AB )( E BC )] P( E AB ) P( E BC )
P( E AB | E AC ) = = = .
P( E AC ) P( E AC ) P( E AC )
Đường đi từ B đến C bị ngập nếu cả hai đường đi đều bị ngập, do đó xác suất để đường
đi từ B đến C bị ngập là P( E BC ) = p2 và xác suất để đường đi từ A đến B không ngập là
P( E AB ) = 1 − p2 .
Đường đi từ A đến C không ngập nếu đường đi từ A đến B không ngập và đường đi
từ B đến C cũng không ngập, nên xác suất để đường đi từ A đến C bị ngập là P( E AC ) =
1 − (1 − p2 )2 .
Vậy
(1 − p2 ) p2
P( E AB | E AC ) = .
1 − (1 − p2 )2

1.5 Công thức Béc–nu–li
1.5.1 Dãy phép thử độc lập

Định nghĩa 1.15 (Dãy phép thử độc lập). Các phép thử được gọi là độc lập với nhau nếu xác
suất để xảy ra một sự kiện nào đó trong từng phép thử sẽ không phụ thuộc vào việc sự kiện
đó có xảy ra ở các phép thử khác hay không.
Ví dụ 1.32. Tung nhiều lần một đồng xu sẽ tạo nên các phép thử độc lập. Lấy nhiều lần sản
phẩm từ một lô sản phẩm theo phương thức có hoàn lại cũng tạo nên các phép thử độc lập.
1.5.2 Lược đồ Béc–nu–li

1. Giả sử ta tiến hành n phép thử độc lập.
2. Trong mỗi phép thử chỉ có hai trường hợp: hoặc sự kiện A xảy ra, hoặc sự kiện A không
xảy ra (tức là xảy ra A).
3. Xác suất xảy ra A trong mỗi phép thử đều bằng p (tức là P( A) = p) và xác suất không
xảy ra A trong mỗi phép thử đều bằng q = 1 − p (tức là P( A) = 1 − p).
Những bài toán thỏa mãn cả ba điều giả thiết trên được gọi là tuân theo lược đồ Béc-nu-li
(hay dãy phép thử Béc-nu-li).
1.5.3 Công thức Béc–nu–li

Định lý 1.1. Trong lược đồ Béc–nu–li (hay dãy phép thử Béc–nu–li)
(a) Xác suất để sự kiện A xuất hiện đúng k lần, ký hiệu là Pn (k ), được xác định bởi
Pn (k ) = Cnk pk qn−k , k = 0, 1, . . . , n (1.19)
(b) Xác suất để sự kiện A xuất hiện từ k1 đến k2 lần, ký hiệu là Pn (k1 , k2 ):
k2 k2
Pn (k1 , k2 ) = ∑ Pn (k) = ∑ Cnk pk qn−k (1.20)
k=k1 k=k1
Chứng minh. (a) Gọi B là sự kiện "trong dãy n phép thử Béc–nu–li, sự kiện A xuất hiện đúng
k lần". Ta thấy B có thể xảy ra nhiều phương án khác nhau miễn sao trong đó sự kiện A xuất
hiện đúng k lần. Khi đó, có Cnk phương án như vậy. Còn xác suất xảy ra một phương án sẽ là
pk qn−k do các phép thử là độc lập, sự kiện A xuất hiện k lần, sự kiện A xuất hiện n − k lần. Từ
đó ta có công thức cần chứng minh.
(b) Suy trực tiếp từ ý (a).
1.5. Công thức Béc–nu–li 27

Nhận xét 1.10. Nếu một bài toán thỏa mãn lược đồ Béc–nu–li thì việc sử dụng công thức (1.19)
hay (1.20) sẽ đơn giản hơn rất nhiều so với việc dùng các công thức nhân xác suất và cộng xác
suất. Do đó chúng có ý nghĩa thực tiễn rất lớn.
Ví dụ 1.33. Trong phân xưởng có 5 máy hoạt động độc lập. Xác suất để trong mỗi ca mỗi máy
bị hỏng đều bằng 0,1.
(a) Tìm xác suất để trong ca đó có đúng 2 máy hỏng.
(b) (Đề thi giữa kỳ 20182) Biết rằng trong một ca có đúng 2 máy hỏng. Tính xác suất để máy
thứ nhất không hỏng.
Lời giải:
(a) Coi sự hoạt động của mỗi máy là một phép thử. Ta có 5 phép thử độc lập; trong mỗi
phép thử chỉ có 2 trường hợp: hoặc máy hỏng, hoặc máy không hỏng; xác suất hỏng của
mỗi máy đều bằng 0,1. Như vậy, bài toán thỏa mãn lược đồ Béc–nu–li với n = 5, p = 0, 1
và k = 2. Áp dụng công thức Béc–nu–li (1.19) ta có xác suất cần tìm là:
P5 (2) = C52 × (0, 1)2 × (0, 9)3 = 0, 0729.
Nếu sử dụng công thức cộng và nhân xác suất với A là sự kiện "trong ca đó có đúng 2
máy hỏng", Ai là sự kiện "máy i bị hỏng trong ca", i = 1, 2, . . . , 5, ta sẽ tính xác suất của
A trên cơ sở phân tích:
A = A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5 +
+ A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5 +
+ A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5 + A1 A2 A3 A4 A5
và sử dụng tính xung khắc, tính độc lập của các sự kiện. Rõ ràng việc sử dụng công thức
(1.19) cho ví dụ này đơn giản hơn rất nhiều.
P ( A1 ) P ( A | A1 ) 0, 9 × C42 × (0, 1)2 × (0, 9)2 0, 04374

(b) P( A1 | A) = = = = 0, 6.
P( A) 0, 0729 0, 0729
Ví dụ 1.34. Hai vận động viên bóng bàn A và B đấu một trận gồm tối đa 5 ván (không có kết
quả hòa sau mỗi ván và trận đấu sẽ dừng nếu một người nào đó thắng trước 3 ván). Xác suất
để A thắng được ở một ván là 0,7.
(a) Tính các xác suất để A thắng sau x ván (x = 3, 4, 5).
(b) Tính xác suất để trận đấu kết thúc sau 5 ván.

Lời giải: (a) Việc A thắng sau x ván (x = 3, 4, 5) tương đương với sự kiện "ván thứ x người A
thắng và trong x − 1 ván đầu người A thắng 2 ván". Khi đó, xác suất cần tìm là
p x = 0, 7 × Px−1 (2) = 0, 7 × Cx2−1 × (0, 7)2 × (0, 3) x−3 ,
cụ thể:
p3 = 0, 7 × P2 (2) = 0, 7 × C22 × (0, 7)2 × (0, 3)0 = 0, 343,

p4 = 0, 7 × P3 (2) = 0, 7 × C32 × (0, 7)2 × (0, 3)1 = 0, 3087,
p5 = 0, 7 × P4 (2) = 0, 7 × C42 × (0, 7)2 × (0, 3)2 = 0, 18522.
(b) Sự kiện "trận đấu kết thúc sau 5 ván" tương đương với sự kiện "trong 4 ván đầu mỗi
người thắng 2 ván". Khi đó xác suất cần tìm là:
P4 (2) = C42 × (0, 7)2 × (0, 3)2 = 0, 2646.
Ví dụ 1.35. Tỷ lệ phế phẩm của một lô hàng là 1%. Hỏi cỡ mẫu cần chọn ra là bao nhiêu (có
hoàn lại) sao cho trong mẫu có ít nhất 1 phế phẩm với xác suất lớn hơn 0,95?
Lời giải: Giả sử mẫu chọn ra có kích cỡ là n và việc chọn ra một sản phẩm có hoàn lại là một
phép thử Béc–nu–li với p = 0, 01. Gọi A là sự kiện "trong mẫu có ít nhất một phế phẩm" thì A
sẽ là sự kiện "trong mẫu không có phế phẩm nào". Khi đó A = A1 A2 . . . A2 , với Ai là sự kiện
"sản phẩm thử i lấy ra không là phế phẩm", i = 1, 2, . . . , n. Suy ra
P( A) = 1 − P( A) = 1 − (0, 99)n .
Theo yêu cầu của đầu bài, P( A) > 0, 95 tức là 1 − (0, 99)n > 0, 95 hay 0, 05 > (0, 99)n . Từ đây
suy ra
log 0, 05
n> ≃ 298.
log 0, 99
1.5.4 Số có khả năng nhất trong lược đồ Béc–nu–li

Trong lược đồ Béc–nu–li, số x0 mà tại đó xác suất đạt giá trị lớn nhất gọi là số có khả năng
nhất (hay số lần xuất hiện chắc chắn nhất).
∙ Nếu np − q ∈ Z thì có hai số có khả năng nhất x0 = np − q và x0 = np − q + 1.
/ Z thì x0 = [np − q] + 1, ở đây [np − q] là phần nguyên của np − q.

∙ Nếu np = q ∈
Ví dụ 1.36. Tỷ lệ mắc một loại bệnh A ở một vùng là 10%. Trong đợt khám bệnh cho vùng đó
người ta đã khám 100 người. Tìm số người bị bệnh A có khả năng nhất? Tính xác suất tương
ứng.
Lời giải: Bài toán thỏa mãn lược đồ Béc–nu–li với n = 100, p = 0, 1. Theo bài ra ta có np − q =
/ Z. Vậy số người bị bệnh A có khả năng nhất khi khám 100 người là
100 × 0, 1 − 0, 9 = 9, 1 ∈
10 × (0, 1)10 × (0, 9)90 ≃ 0, 1319.
[9, 1] + 1 = 10 người và xác suất tương ứng là P100 (10) = C100

1.5.5 Công thức xấp xỉ

Khi n và k khá lớn thì việc tính toán xác suất theo (1.19) và (1.20) rất cồng kềnh và khó khăn,
vì vậy người ta tìm cách tính gần đúng các xác suất đó.
(a) Xấp xỉ Poa-xông: Nếu n rất lớn, trong khi p rất nhỏ, xác suất theo công thức (1.19) có thể
xấp xỉ bằng
(λ )k −λ
Pn (k) ≃ e (1.21)
k!
Xác suất này được tính sẵn trong bảng giá trị hàm khối lượng xác suất Poa–xông (Phụ
lục 5) với λ = np.
(b) Xấp xỉ chuẩn (định lý giới hạn địa phương Moa–vrơ–Láp–la–xơ): Nếu n lớn nhưng p
không quá bé và quá lớn ta có xấp xỉ
ϕ( x ) k − np
Pn (k ) ≃ √ k , xk = √ (1.22)
npq npq
1 x2
trong đó ϕ( x ) = √ e− 2 là hàm Gao–xơ với các giá trị được tính trong bảng giá trị
2π
hàm Gao–xơ (Phụ lục 1) đối với các giá trị x dương. Hàm ϕ( x ) là hàm chẵn, tức là
ϕ(− x ) = ϕ( x ). Khi x > 4 ta có thể lấy ϕ( x ) ≃ 0.
(c) Xấp xỉ cho công thức (1.20) (định lý giới hạn tích phân Moa–vrơ–Láp–la–xơ): Nếu n lớn
nhưng p không quá bé và quá lớn thì xác suất trong (1.20) có thể xấp xỉ bằng
k i − np
Pn (k1 ; k2 ) ≃ φ( x2 ) − φ( x1 ), xi = √ , i = 1, 2 (1.23)
npq
trong đó
Zx
1 t2
φ( x ) = √ e− 2 dt (1.24)
2π
0
là hàm Láp–la–xơ với các giá trị được tính trong bảng giá trị hàm Láp–la–xơ (Phụ lục 2)
đối với các giá trị x dương. Hàm φ( x ) là hàm lẻ, tức là φ(− x ) = −φ( x ). Khi x > 5 ta có
thể lấy φ( x ) ≃ 0, 5.
Ví dụ 1.37. Xác suất để sản phẩm sau khi sản xuất không được kiểm tra chất lượng bằng 0,2.
Tìm xác suất để trong 400 sản phẩm sản xuất ra có:
(a) 80 sản phẩm không được kiểm tra chất lượng;
(b) từ 70 đến 100 sản phẩm không được kiểm tra chất lượng.

Lời giải: Bài toán thỏa mãn lược đồ Béc–nu–li với n = 400, p = 0, 2.
(a) Ta phải tính P400 (80) theo công thức Béc–nu–li (1.19):
80
P400 (80) = C400 × (0, 2)80 × (0, 8)320 .
Việc tính xác suất theo công thức này khá phức tạp vì n = 400 khá lớn, p = 0, 2 không
quá bé hoặc quá lớn. Do đó, ta sẽ tính xấp xỉ theo (1.22):
ϕ (0)
P400 (80) ≃ ≃ 0, 04986
8
ở đây ϕ(0) = 0, 3989 được tra từ bảng giá trị hàm Gau-xơ (Phụ lục 1).
(b) Tương tự, thay việc dùng công thức (1.20) ta sử dụng xấp xỉ (1.23):
P400 (70; 100) ≃ φ(2, 5) − φ(−1, 25) ≃ 0, 49379 + 0, 39435 = 0, 88814,
ở đây φ(−1, 25) = −0, 39435, φ(2, 5) = 0, 49379 tra từ bảng giá trị hàm Láp–la–xơ (Phụ
lục 2).
Ví dụ 1.38. Vận chuyển 4000 chai rượu đến một cửa hàng. Xác suất để mỗi chai rượu bị vỡ
trong quá trình vận chuyển là 0,001. Tính xác suất để có 7 chai rượu bị vỡ trong quá trình vận
chuyển.
Lời giải: Bài toán thỏa mãn lược đồ Béc–nu–li với n = 4000, p = 0, 001. Ta phải tính P4000 (7)
theo công thức Béc–nu–li (1.19):
7
P4000 (7) = C4000 × (0, 001)7 × (0, 999)3993 .
Vì n = 4000 khá lớn, p = 0, 001 khá bé, nên ta sẽ tính xấp xỉ theo (1.21):
47
P4000 (7) ≃ (2, 71828)−4 ≃ 0, 05954.
7!
Ta có thể tính trực tiếp hoặc tra bảng giá trị hàm khối lượng Poa-xông (Phụ lục 5).
1.6 Công thức xác suất đầy đủ. Công thức Bay–ét
1.6.1 Công thức xác suất đầy đủ

Định lý 1.2. Giả sử các sự kiện A1 , A2 , . . . , An lập thành một hệ đầy đủ và H là một sự kiện
nào đó. Khi đó,
n
P( H ) = ∑ P ( Ai ) P ( H | Ai ) (1.25)
i =1
1.6. Công thức xác suất đầy đủ. Công thức Bay–ét 31
Công thức (1.25) được gọi là công thức xác suất đầy đủ (hay công thức xác suất toàn
phần). Công thức này cho phép ta tính xác suất P( H ) nếu biết các xác suất P( Ai ) và P( H | Ai ),
i = 1, 2, . . . , n.
Chứng minh. Từ giả thiết ta có H = HS = H ( A1 + A2 + · · · + A2 ). Sử dụng tính xung khắc
của các sự kiện và công thức nhân suy ra
P ( H ) = P ( H A1 ) + P ( H A2 ) + · · · + P ) H A n
= P ( A1 ) P ( H | A1 ) + P ( A2 ) P ( H | A2 ) + · · · + P ( A n ) P ( H | A n ).
1.6.2 Công thức Bay–ét

Định lý 1.3. Giả sử ta có một hệ đầy đủ A1 , A2 , . . . , An , sau đó có thêm sự kiện H nào đó. Khi
đó xác suất P( Ak | H ), k = 1, 2, . . . , n, được xác định bởi:
P( Ak ) P( H | Ak )
P( Ak | H ) = , k = 1, 2, . . . , n (1.26)
∑in=1 P ( Ai ) P ( H | Ai )
Công thức (1.26) được gọi là công thức Bay-ét.

Chứng minh. Sử dụng công thức nhân (1.10) P( Ak H ) = P( Ak ) P( H | Ak ) = P( H ) P( Ak | H ).
Suy ra
P( Ak ) P( H | Ak )
P( Ak | H ) = . (1.27)
P( H )
Từ đây sử dụng công thức xác suất đầy đủ (1.25) suy ra công thức (1.26).
Nhận xét 1.11. (a) Các xác suất P( Ai ), i = 1, 2, . . . , n đã được xác định từ trước, thường
được gọi là xác suất tiên nghiệm.
(b) Các xác suất P( Ai | H ), i = 1, 2, . . . , n được xác định sau khi đã có kết quả thí nghiệm
nào đó thể hiện qua sự xuất hiện của H, thường gọi là xác suất hậu nghiệm. Như vậy,
công thức Bay–ét cho phép đánh giá lại xác suất xảy ra các sự kiện Ai sau khi đã có thêm
thông tin về H.
Chú ý 1.7. (a) Muốn dùng công thức xác suất đầy đủ (1.25) hoặc công thức Bay–ét (1.26)
nhất định phải có hệ đầy đủ.
(b) Nếu (1.25) cho ta xác suất không có điều kiện thì (1.26) cho phép tính xác suất có điều
kiện, trong đó sự kiện Ai cần tính xác suất phải là một thành viên của nhóm đầy đủ
đang xét. Từ đó thấy rằng việc dùng công thức Bay–ét để tính xác suất có điều kiện đã
gợi ý cho ta cách chọn nhóm đầy đủ sao cho sự kiện quan tâm phải là thành viên.
(c) Trong trường hợp không có, hoặc rất khó xác định nhóm đầy đủ ta nên dùng công thức
(1.26), trong trường hợp này tính P( H ) sẽ khó hơn là dùng công thức (1.25).
Ví dụ 1.39. Một nhà máy có ba phân xưởng sản xuất ra cùng một loại sản phẩm. Xác suất để
phân xưởng 1, phân xưởng 2 và phân xưởng 3 sản xuất được sản phẩm loại một lần lượt là
0,7, 0,8 và 0,6. Từ một lô hàng gồm 20% sản phẩm của phân xưởng 1, 50% sản phẩm của phân
xưởng 2 và 30% sản phẩm của phân xưởng 3 người ta lấy ra một sản phẩm để kiểm tra.
(a) Tính xác suất để sản phẩm được kiểm tra là loại một.
(b) Biết sản phẩm được kiểm tra là loại một. Tính xác suất để sản phẩm này do phân xưởng
2 sản xuất.
Lời giải: Gọi H là sự kiện "sản phẩm được kiểm tra là loại một"; Ai là sự kiện "sản phẩm được
kiểm tra do phân xưởng i sản xuất", i = 1, 2, 3. Ta thấy A1 , A2 , A3 tạo thành một hệ đầy đủ với
P( A1 ) = 0, 2, P( A2 ) = 0, 5 và P( A3 ) = 0, 3.
(a) Áp dụng công thức xác suất đầy đủ (1.25) với P( H | A1 ) = 0, 7; P( H | A2 ) = 0, 8 và

P( H | A3 ) = 0, 6 ta nhận được
P ( H ) = P ( A1 ) P ( H | A1 ) + P ( A2 ) P ( H | A2 ) + P ( A3 ) P ( H | A3 )
= 0, 2 × 0, 7 + 0, 5 × 0, 8 + 0, 3 × 0, 6 = 0, 72 = 72%.
Ý nghĩa của xác suất này là tỷ lệ sản phẩm loại một của nhà máy.
(b) Áp dụng công thức Bay–ét (1.26) ta tính
P ( A2 ) P ( H | A2 ) 0, 5 × 0, 8 5
P ( A2 | H ) = = = .
∑3i=1 P ( Ai ) P ( H | Ai ) 0, 72 9
Ví dụ 1.40. Có hai lô sản phẩm: lô I có 7 chính phẩm 3 phế phẩm; lô II có 6 chính phẩm 2 phế
phẩm. Lấy ngẫu nhiên 2 sản phẩm từ lô I bỏ sang lô II, sau đó từ lô II lấy ngẫu nhiên ra 2 sản
phẩm.
(a) Tính xác suất để 2 sản phẩm lấy ra sau cùng là chính phẩm.
(b) Giả sử 2 sản phẩm lấy ra sau cùng là chính phẩm. Hãy tính xác suất để 2 chính phẩm
này là của lô I (ban đầu).
Lời giải:
(a) Gọi H là sự kiện "hai sản phẩm lấy ra sau cùng là chính phẩm"; Ai là sự kiện "trong 2 sản
phẩm lấy từ lô I bỏ sang lô II có i chính phẩm", i = 0, 1, 2. Khi đó A0 , A1 , A2 tạo thành
một hệ đầy đủ với
C32 1 C71 × C31 7 C72 7

P ( A0 ) = 2
= ; P ( A 1 ) = 2
= ; P ( A 2 ) = 2
= ;
C10 15 C10 15 C10 15
và
C62 15 C72 21 C82 28
P ( H | A0 ) = 2 = ; P ( H | A1 ) = 2 = ; P ( H | A2 ) = 2 = .
C10 45 C10 45 C10 45
Áp dụng công thức xác suất đầy đủ (1.25)
P ( H ) = P ( A0 ) P ( H | A0 ) + P ( A1 ) P ( H | A1 ) + P ( A2 ) P ( H | A2 )
1 15 7 21 7 28 358
= × + × + × = ≃ 0, 5304.
15 45 15 45 15 45 675
(b) Ta không thể chọn nhóm đầy đủ như trong ý (a), vì sự kiện cần tính xác suất không là
thành viên của nhóm này. Việc chọn nhóm đầy đủ thích hợp xem như là bài tập.
Ví dụ 1.41. Một người có ba chỗ ưa thích như nhau để câu cá. Xác suất để câu được cá ở mỗi
chỗ tương ứng là 0,6; 0,7 và 0,8. Biết rằng đến một chỗ người đó thả câu 3 lần và chỉ câu được
một con cá. Tính xác suất để cá câu được ở chỗ thứ nhất.
Lời giải: Gọi Ai là sự kiện "người đó chọn chỗ thứ i", i = 1, 2, 3, A là sự kiện "câu được cá".
Khi đó,
P( A) = P( A1 ) P( A| A1 ) + P( A2 ) P( A| A2 ) + P( A3 ) P( A| A3 ) = 0, 191,
trong đó
1
P ( A1 ) = P ( A2 ) = P ( A3 ) = ,
3
P( A| A1 ) = P3 (1) = C31 × (0, 6)1 × (0, 4)2 = 0, 288,
P( A| A2 ) = P3 (1) = C31 × (0, 7)1 × (0, 3)2 = 0, 189,
P( A| A3 ) = P3 (1) = C31 × (0, 8)1 × (0, 2)2 = 0, 096.
Từ đây suy ra
P ( A1 ) P ( A | A1 )
P ( A1 | A ) = = 0, 5026.
P( A)
Ví dụ 1.42. Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản
phẩm có đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là 0,01. Thiết bị có khả
năng phát hiện đúng sản phẩm là phế phẩm với xác suất 0,85 và phát hiện đúng sản phẩm
đạt chất lượng với xác suất 0,9. Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho sản
phẩm này:
(a) Được kết luận là phế phẩm.
(b) Được kết luận là đạt chất lượng thì lại là phế phẩm.
(c) Được kết luận đúng với thực chất của nó.
Lời giải: Gọi A là sự kiện "sản phẩm được chọn là phế phẩm", P( A) = 0, 01, P( A) = 0, 99.
(a) Gọi H là sự kiện "sản phẩm được kết luận là phế phẩm", khi đó H là sự kiện "sản phẩm
được kết luận là đạt chất lượng". Theo đầu bài, P( H | A) = 0, 85, P( H | A) = 0, 9. Suy ra
P( H ) = P( A) P( H | A) + P( A) P( H | A) = 0, 01 × 0, 85 + 0, 99 × 0, 1 = 0, 1075.
(b) P( H ) = 1 − 0, 1075 = 0, 8925. Suy ra

P( AH ) P( A) P( H | A) 0, 01 × 0, 15
P( A| H ) = = = = 0, 0017.
P( H ) P( H ) 0, 8925
(c) P( AH ) + P( A H ) = P( A) P( H | A) + P( A) P( H | A) = 0, 01 × 0, 85 + 0, 99 × 0, 9 = 0, 8995.
Ví dụ 1.43. Một hãng hàng không cho biết rằng 5% số khách đặt trước vé cho các chuyến đã
định sẽ hoãn không đi chuyến bay đó. Do đó hãng đã đưa ra một chính sách là sẽ bán 52 ghế
cho một chuyến bay mà trong đó mỗi chuyến chỉ trở được 50 khách hàng. Tìm xác suất để tất
cả các khách đặt chỗ trước và không hoãn chuyến bay đều có ghế. Biết rằng xác suất bán được
51 vé hoặc 52 vé là như nhau và bằng 10%.
Lời giải: Gọi A là sự kiện "bán được 52 vé", B là sự kiện "bán được 51 vé", C là sự kiện "bán
được ≤ 50 vé". Khi đó A, B, C tạo thành một nhóm đầy đủ, P( A) = P( B) = 0, 1 và P(C ) = 0, 8.
Gọi H là sự kiện "tất cả các khách hàng đặt chỗ trước và không hoãn chuyến bay đều đủ
chỗ", suy ra H là sự kiện "khách hàng không đủ chỗ". Khi đó
P ( H ) = P ( A ) P ( H | A ) + P ( B ) P ( H | B ) + P ( C ) P ( H | C ),
trong đó
P( H | A) = P52 (0) + P52 (1) = (0, 95)52 + 52 × (0, 95)51 × (0, 05)1 ,
P( H | B) = P51 (0) = (0, 95)51 ,
P( H |C ) = 0.
Từ đó P( H ) = 0, 0333, suy ra P( H ) = 0, 6667.

Ví dụ 1.44. Ba người thợ cùng may một loại áo với xác suất may được sản phẩm chất lượng
cao tương ứng là 0,9; 0,9 và 0,8. Biết một người khi may 8 áo thì có 6 sản phẩm chất lượng cao.
Tìm xác suất để người đó may 8 áo nữa thì có 6 áo chất lượng cao.
Lời giải: Gọi A là sự kiện "trong 8 áo đầu tiên có 6 áo chất lượng cao"; Ai là sự kiện "8 áo đầu
1
tiên do người thợ thứ i may", i = 1, 2, 3 với P( Ai ) = , i = 1, 2, 3. Theo công thức xác suất đầy
3
đủ
P ( A ) = P ( A1 ) P ( A | A1 ) + P ( A2 ) P ( A | A2 ) + P ( A3 ) P ( A | A3 )
1 h i
= × C86 × (0, 9)6 × (0, 1)2 + C86 × (0, 9)6 × (0, 1)2 + C86 × (0, 8)6 × (0, 2)2 ≃ 0, 2.
3
Gọi B là sự kiện "trong 8 áo sau có 6 áo chất lượng cao".
3
P( B) = ∑ P( Ai | A) P( B| Ai A) = 0, 225,
i =1
trong đó các xác suất P( A1 | A), P( A2 | A), P( A3 | A) được xác định theo công thức Bay-et.
Chương 2
Biến ngẫu nhiên và quy luật phân phối xác

suất
TUẦN 5
2.1 Định nghĩa và phân loại biến ngẫu nhiên
2.1.1 Định nghĩa biến ngẫu nhiên

Khái niệm biến ngẫu nhiên rất thông dụng trong giải tích. Vì vậy ta tìm cách đưa vào khái
niệm biến ngẫu nhiên như một đại lượng phụ thuộc vào kết cục của một phép thử ngẫu nhiên
nào đó.
Ví dụ 2.1. Gieo một con xúc sắc. Nếu ta gọi biến ngẫu nhiên là "số chấm xuất hiện" thì nó phụ
thuộc vào kết cục của phép thử và nhận các giá trị nguyên từ 1 đến 6.
Về mặt hình thức, có thể định nghĩa biến ngẫu nhiên như một hàm số có giá trị thực xác
định trên không gian các sự kiện sơ cấp.
Ký hiệu biến ngẫu nhiên là X, Y, Z, X1 , X2 , . . . . Các giá trị có thể có của chúng ký kiệu là
x, y, z, x1 , x2 , . . . .
Tập hợp tất cả các giá trị của X gọi là miền giá trị của X, ký hiệu là SX .
Nhận xét 2.1. (a) X được gọi là biến ngẫu nhiên vì trước khi tiến hành phép thử ta chưa có
thể nói một cách chắn chắc nó sẽ nhận một giá trị bằng bao nhiêu mà chỉ dự đoán điều
đó với một xác suất nhất định. Nói cách khác, việc biến ngẫu nhiên X nhận một giá trị
nào đó ( X = x1 ), ( X = x2 ), . . . , ( X = xn ) về thực chất là các sự kiện ngẫu nhiên.
(b) Nếu biến ngẫu nhiên X chỉ nhận các giá trị x1 , x2 , . . . , xn thì các sự kiện ( X = x1 ),
( X = x2 ), . . . , ( X = xn ) tạo nên một hệ đầy đủ.
(c) Hai biến ngẫu nhiên X và Y là độc lập nếu X nhận các giá trị nào đó không phụ thuộc
Y và ngược lại.
36
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
2.1.2 Phân loại biến ngẫu nhiên

Biến ngẫu nhiên được phân làm hai loại: biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục.
(a) Biến ngẫu nhiên rời rạc: X là biến ngẫu nhiên rời rạc nếu tập giá trị SX của nó là tập
hợp hữu hạn hoặc vô hạn đếm được phần tử. Nói cách khác, ta có thể liệt kê tất cả các
giá trị của biến ngẫu nhiên đó.
(b) Biến ngẫu nhiên liên tục: X là biến ngẫu nhiên liên tục nếu tập giá trị SX có thể có của
nó lấp đầy một khoảng trên trục số.
Ví dụ 2.2. (a) Gọi X là số chấm xuất hiện khi gieo một con xúc sắc cân đối đồng chất thì X
là biến ngẫu nhiên rời rạc có thể nhận một trong các giá trị 1, 2, 3, 4, 5 và 6.
(b) Một người phải tiến hành thí nghiệm cho tới khi thành công thì dừng. Gọi Y là số lần tiến
hành thí nghiệm. Khi đó Y là biến ngẫu nhiên rời rạc có thể nhận các giá trị 1, 2, . . . , n, . . . .
(c) Bắn một viên đạn vào bia có bán kính là 20cm và giả sử viên đạn trúng vào bia. Gọi Z là
khoảng cách từ tâm bia tới điểm bia trúng đạn thì Z là biến ngẫu nhiên liên tục có thể
nhận các giá trị thuộc (0; 20).
2.2 Quy luật phân phối xác suất của biến ngẫu nhiên
Định nghĩa 2.1 (Quy luật phân phối xác suất). Bất kỳ một hình thức nào cho phép biểu diễn
mối quan hệ giữa các giá trị có thể có của biến ngẫu nhiên và xác suất tương ứng để biến ngẫu
nhiên nhận các giá trị đó đều được gọi là quy luật phân phối xác suất của biến ngẫu nhiên.
Một số phương pháp mô tả quy luật phân phối xác suất
(a) Bảng phân phối xác suất (áp dụng cho biến ngẫu nhiên rời rạc).
(b) Hàm phân phối xác suất (áp dụng cho cả biến ngẫu nhiên rời rạc và liên tục).
(c) Hàm mật độ xác suất (áp dụng cho biến ngẫu nhiên liên tục).
2.2.1 Bảng phân phối xác suất của biến ngẫu nhiên rời rạc
Định nghĩa 2.2 (Hàm khối lượng xác suất). Cho biến ngẫu nhiên rời rạc X. Đặt
p X ( x ) = P ( X = x ), x∈R (2.1)
Hàm p X ( x ) được gọi là hàm khối lượng xác suất (probability mass function) của biến ngẫu
nhiên rời rạc X.
Hàm khối lượng xác suất có tính chất sau.
2.2. Quy luật phân phối xác suất của biến ngẫu nhiên 37
Tính chất 2.1. (a) p X ( xk ) > 0 với mọi xk ∈ SX ;
(b) ∑ xk ∈SX p X ( xk ) = 1;
(c) p X ( x ) = 0 với mọi xk ∈

/ SX .
Định nghĩa 2.3 (Bảng phân phối xác suất). Bảng phân phối xác suất của biến ngẫu nhiên rời
rạc X là bảng ghi sự tương ứng giữa các giá trị mà biến ngẫu nhiên nhận được với giá trị của
hàm khối lượng xác suất tương ứng.
(i) Nếu X là biến ngẫu nhiên rời rạc có hữu hạn (n) phần tử thì bảng phân phối xác suất
của biến ngẫu nhiên X là:
X x1 x2 ... xn
(2.2)
p p1 p2 ... pn
trong đó { x1 , x2 , . . . , xn } là tập các giá trị của X đã sắp xếp theo thứ tự tăng dần,
pi = p X ( xi ) = P( X = xi ), i = 1, 2 . . . , n.
(ii) Nếu X là biến ngẫu nhiên rời rạc có vô hạn đếm được phần tử thì bảng phân phối xác
suất của biến ngẫu nhiên X là:
X x1 x2 ... xn ...
(2.3)
p p1 p2 ... pn ...
trong đó { x1 , x2 , . . . , xn . . . } là tập các giá trị của X đã sắp xếp theo thứ tự tăng dần,
pn = p X ( xn ) = P( X = xn ), n = 1, 2 . . . .
Ví dụ 2.3. Một xạ thủ có 3 viên đạn được yêu cầu bắn lần lượt từng viên cho đến khi trúng
mục tiêu hoặc hết cả 3 viên thì thôi. Tìm bảng phân phối xác suất của số đạn đã bắn, biết rằng
xác suất bắn trúng đích của mỗi lần bắn là 0,8.
Lời giải: Gọi X là số đạn đã bắn, X là biến ngẫu nhiên rời rạc nhận các giá trị 1, 2, 3.
Gọi Ai là sự kiện "bắn trúng mục tiêu ở lần bắn thứ i", i = 1, 2, 3. Khi đó,
P( X = 1) = P( A1 ) = 0, 8.
P( X = 2) = P( A1 A2 ) = P( A1 ) P( A2 ) = 0, 2 × 0, 8 = 0, 16.
P( X = 3) = P( A1 A2 ( A3 + A3 )) = P( A1 ) P( A2 ) P( A3 + A3 ) = 0, 2 × 0, 2 × (0, 8 + 0, 2) = 0, 04.
Vậy bảng phân phối xác suất của X là
X 1 2 3
p 0,8 0,16 0,04
Ví dụ 2.4. Một người đem 10 nghìn VNĐ đi đánh một số đề. Nếu trúng thì thu được 700
nghìn VNĐ, nếu trượt thì không được gì. Gọi X (nghìn VNĐ) là số tiền thu được. Ta có bảng
phân phối xác suất của X
X 0 700
p 99/100 1/100
Ví dụ 2.5. Một chùm chìa khóa gồm 4 chiếc giống nhau, trong đó chỉ có một chiếc mở được
cửa. Người ta thử ngẫu nhiên từng chiếc cho đến khi mở được cửa. Gọi X là số lần thử. Tìm
phân phối xác suất của X.
Lời giải: X có thể nhận các giá trị 1, 2, 3, 4.

Gọi Ai là sự kiện "mở được cửa ở lần thử thứ i", i = 1, 2, 3, 4. Khi đó,
1
P ( X = 1) = P ( A1 ) =
4
3×1 1
P ( X = 2) = P ( A1 A2 ) = P ( A1 ) P ( A2 | A1 ) = =
4×3 4
3×2×1 1
P( X = 3) = P( A1 A2 A3 ) = P( A1 ) P( A2 |) P( A3 | A1 A2 ) = =
4×3×2 4
1
P ( X = 4) = P ( A1 A2 A3 A4 ) = P ( A1 ) P ( A2 | A1 ) P ( A3 | A1 A2 ) P ( A4 | A1 A2 A3 ) = .
4
Suy ra bảng phân phối xác suất của X
X 1 2 3 4
p 1/4 1/4 1/4 1/4
2.2.2 Hàm phân phối xác suất

Định nghĩa 2.4 (Hàm phân phối xác suất). Hàm phân phối xác suất của biến ngẫu nhiên X,
ký hiệu là FX ( x ), được định nghĩa như sau:
FX ( x ) = P( X < x ), x∈R (2.4)
Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì hàm phân phối (tích
lũy) là:




 0, x ≤ x1 ,


p , x1 < x ≤ x2 ,

 1



FX ( x ) = p1 + p2 , x2 < x ≤ x3 , (2.5)






 ...


1, x > xn .

Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.3) thì hàm phân phối (tích
lũy) là:




0, x ≤ x1 ,


p1 , x1 < x ≤ x2 ,






 p + p2 , x2 < x ≤ x3 ,

1
FX ( x ) = (2.6)



 ...

∑in=1 pi ,

x n < x ≤ x n +1 ,






. . .

Nhận xét 2.2. Hàm phân phối xác suất FX ( x ) phản ánh mức độ tập trung xác suất ở bên trái
của một số thực x nào đó.
Ví dụ 2.6. Tìm hàm phân phối xác suất của biến ngẫu nhiên ở Ví dụ 2.3.
Lời giải: Từ bảng phân phối xác suất ở Ví dụ 2.3, sử dụng (2.5) suy ra



 0, x ≤ 1,


0, 8, 1 < x ≤ 2,

FX ( x ) =



 0, 96, 2 < x ≤ 3,


1, x > 3.

Đồ thị của hàm FX ( x ) có dạng bậc thang:
1
0, 96
0, 8
O 1 2 3 x
Hình 2.1: Đồ thị hàm phân phối xác suất trong Ví dụ 2.6
Hàm phân phối có các tính chất sau.
Tính chất 2.2. (a) 0 ≤ FX ( x ) ≤ 1.
(b) FX ( x ) là hàm không giảm, liên tục bên trái, nghĩa là với mọi x1 , x2 ∈ R, x1 < x2 thì
FX ( x1 ) ≤ FX ( x2 ) và với mọi a ∈ R, FX ( a− ) = FX ( a), với FX ( a− ) = limx→a− FX ( x ).
Nếu X là biến ngẫu nhiên liên tục thì FX ( x ) là hàm liên tục.
(c) P( a ≤ X < b) = FX (b) − FX ( a);

Nếu X là biến ngẫu nhiên liên tục thì P( X = a) = 0 và
P( a ≤ X < b) = P( a ≤ X ≤ b) = P( a < X ≤ b) = P( a < X < b) = FX (b) − FX ( a).
(d) FX (−∞) = 0, FX (+∞) = 1.
Chứng minh. (a) Suy trực tiếp từ định nghĩa hàm phân phối và tính chất của xác suất.
(b) Giả sử x1 < x2 và xét sự kiện ( X < x2 ) = ( X < x1 ) + ( x1 ≤ X < x2 ). Khi đó do tính
xung khắc của các sự kiện suy ra
P ( X < x2 ) = P ( X < x1 ) + P ( x1 ≤ X < x2 ).
Từ đây kết hợp với định nghĩa hàm phân phối xác suất (2.4) suy ra
FX ( x2 ) − FX ( x1 ) = P( x1 ≤ X < x2 ) ≥ 0.
(c) Suy trực tiếp từ chứng minh tính chất (b).

(d) FX (−∞) = P( X < −∞) = P(∅) = 0, FX (+∞) = P( X < +∞) = P(S) = 1.
Ví dụ 2.7. Cho biến ngẫu nhiên liên tục X có hàm phân phối xác suất



 0, x ≤ −1,

FX ( x ) = A + B arcsin x, −1 < x < 1,



1, x ≥ 1.
Hãy xác định A và B?
Lời giải: Sử dụng Tính chất 2.2(a) của hàm phân phối xác suất, 0 ≤ A + B arcsin x ≤ 1 và theo
π π
Tính chất 2.2(b) vì FX ( x ) liên tục nên A − × B = 0, A + × B = 1.
2 2
1 1
Suy ra A = , B = .
2 π
Ví dụ 2.8. Xét phép thử ném phi tiêu vào một đĩa tròn có bán kính bằng 1(m). Ký hiệu X là
biến ngẫu nhiên đo khoảng cách từ điểm mũi phi tiêu cắm vào đĩa đến tâm của đĩa. Giả sử
mũi phi tiêu luôn cắm vào đĩa và đồng khả năng tại mọi điểm của đĩa.
(a) Tìm miền giá trị của X.
(b) Tìm hàm phân phối FX ( x ) và vẽ đồ thị của FX ( x ).
Lời giải:
(a) SX = { x ∈ R : 0 ≤ x < 1}.
(b) Sử dụng định nghĩa FX ( x ) = P( X < x ),




 0, x ≤ 0,

FX ( x ) = x2 , 0 < x ≤ 1,



1, x > 1.
Hình 2.2: Hàm phân phối xác suất của Ví dụ 2.8
TUẦN 6
2.2.3 Hàm mật độ xác suất của biến ngẫu nhiên liên tục
Định nghĩa 2.5 (Hàm mật độ). Giả sử X là một biến ngẫu nhiên liên tục có hàm phân phối
xác suất FX ( x ), x ∈ R. Nếu tồn tại hàm f X ( x ) sao cho
Zx
FX ( x ) = f X (t)dt, ∀x ∈ R (2.7)
−∞
thì f X ( x ) được gọi là hàm mật độ xác suất của biến ngẫu nhiên X (probability density func-
tion).
Như vậy, hàm mật độ xác suất của biến ngẫu nhiên liên tục X là đạo hàm bậc nhất của
hàm phân phối xác suất của biến ngẫu nhiên đó,
f X ( x ) = FX′ ( x ), x∈R (2.8)
Nhận xét 2.3. Hàm mật độ xác suất của biến ngẫu nhiên X tại mỗi điểm x cho biết mức độ
tập trung xác suất tại điểm đó.
Tính chất 2.3. (a) f X ( x ) ≥ 0 với mọi x ∈ R.

Z b
(b) P( a < X < b) = f X ( x )dx.
a
Z +∞
(c) f X ( x )dx = 1.
−∞
Chứng minh. (a) Vì f X ( x ) là đạo hàm của hàm không giảm.

(b) Được suy từ Tính chất 2.2(c).
Z +∞
(c) f X ( x )dx = FX (+∞) = 1.
−∞
Ví dụ 2.9. Hàm phân phối xác suất của biến ngẫu nhiên liên tục X có dạng
F ( x ) = a + b arctan x, (−∞ < x < +∞).
(a) Tìm a và b.
(b) Tìm hàm mật độ xác suất f X ( x ).
(c) Tìm xác suất để khi tiến hành 3 phép thử độc lập có 2 lần X nhận giá trị trong khoảng
(−1; 1).
Lời giải:
1 1
(a) Tương tự như Ví dụ 2.7 ta tìm được a = , b = .
2 π
1
(b) Sử dụng (2.8) ta được f X ( x ) = .
π (1 + x 2 )
(c) Theo Tính chất 2.3(b)
Z1
1 dx 1
p = P(−1 < X < 1) = × 2
= .
π 1+x 2
−1
Bài toán thỏa mãn lược đồ Béc–nu–li. Áp dụng công thức (1.19) ta tính được
3
P3 (2) = C32 × p2 × (1 − p)1 = .
8
Ví dụ 2.10. Biến ngẫu nhiên liên tục X có hàm mật độ xác suất là
 h π πi
a cos x,
 x∈ − ,
f X (x) = h π 2 2i
π
0,
 x∈/ − , .
2 2
(a) Tìm a.
(b) Tìm hàm phân phối xác suất tương ứng.
π
(c) Tìm xác suất để X nhận giá trị trong khoảng 0, .
4
Lời giải:
1
(a) Sử dụng Tính chất 2.3(a),(c) tính được a = .
2
(b) Áp dụng (2.7).
Z x
π
Nếu x ≤ − thì FX ( x ) = 0du = 0.
2 −∞
Z x Z x
π π 1 1
Nếu − < x ≤ thì FX ( x ) = f X (u)du = 2 cos udu = (sin x + 1).
2 2 −∞ − π2 2
Z π
π 2
1
Nếu x > thì FX ( x ) = 2 cos x = 1. Vậy
2 − π2

π

 0, x≤− ,

 2
1

π π
FX ( x ) = (sin x + 1), − <x≤ ,

 2 2 2
 π
1, x> .

2
π √
2
Z
π 4
1
(c) P(0 < X < ) = 2 cos xdx = .
4 0 4
Ví dụ 2.11 (Đề thi MI2020 giữa kỳ 20191). Biến ngẫu nhiên liên tục X có hàm mật độ xác suất

kx2 (1 − x ), nếu x ∈ [0, 1],
f (x) =
0, nếu x ∈ / [0, 1].
(a) Tìm hằng số k.
(b) Tính xác suất để sau 3 lần lặp lại phép thử một cách độc lập có đúng 1 lần X nhận giá
1
trị trong khoảng 0; .
2
Lời giải:
(a) Sử dụng Tính chất 2.3(a),(c) tính được k = 12.

1
Z2
1 5
(b) P 0 < X < = 12( x2 − x3 )dx = = 0, 3125.
2 16
0
1815
Vậy, P3 (1) = C31 × p1 × (1 − p)2 = C31 × (0, 3125)1 × (0, 6875)2 = ≃ 0, 44312.
4096
2.3 Các tham số đặc trưng của biến ngẫu nhiên

Đặc trưng quan trọng nhất của biến ngẫu nhiên là hàm phân phối của nó. Nhưng trong thực
tế nhiều khi không xác định được hàm phân phối và không phải cứ nhất thiết phải biết hàm
phân phối. Vì vậy nảy sinh vấn đề phải đặc trưng cho biến ngẫu nhiên bằng một hoặc nhiều
số, mỗi số hạng đặc trưng phản ánh được các tính chất cơ bản nhất của biến ngẫu nhiên X.
Trong mục này ta chỉ xét một vài tham số quan trọng nhất.
2.3.1 Kỳ vọng
Định nghĩa 2.6 (Kỳ vọng). Kỳ vọng (expected value) của biến ngẫu nhiên X, ký hiệu là E( X ),
được xác định như sau:
(a) Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì
n
E( X ) = ∑ xi pi (2.9)
i =1
(b) Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.3) thì
∞
E( X ) = ∑ xn pn (2.10)
n =1
nếu chuỗi vế phải hội tụ.
(c) Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ), x ∈ R thì
+∞
Z
E( X ) = x f X ( x )dx (2.11)
−∞
nếu tích phân vế phải hội tụ.
Nhận xét 2.4. (a) Kỳ vọng mang ý nghĩa là giá trị trung bình của biến ngẫu nhiên. Kỳ vọng
là số xác định.
Thật vậy, giả sử đối với biến ngẫu nhiên X, tiến hành n phép thử, trong đó n1 lần X nhận
giá trị x1 , n2 lần X nhận giá trị x2 , . . . , nk lần X nhận giá trị xk , n1 + n2 + · · · + nk = n. Giá trị
trung bình của biến ngẫu nhiên X trong n phép thử này là
n1 x2 + n2 x2 + · · · + n k x k n n n
X= = x1 1 + x2 2 + · · · + x k k
n n n n
≃ x1 p1 + x2 p2 + · · · + x k p k = E ( X ).
(b) Khái niệm kỳ vọng được áp dụng rộng rãi trong nhiều lĩnh vực. Trong kinh doanh và
quản lý, kỳ vọng được ứng dụng dưới dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng.
2.3. Các tham số đặc trưng của biến ngẫu nhiên 45

Tính chất 2.4. (a) E(C ) = C với C là hằng số.
(b) E(CX ) = CE( X ) với C là hằng số.
(c) E( X + Y ) = E( X ) + E(Y ); mở rộng E(∑in=1 Xi ) = ∑in=1 E( Xi ).
(d) E( XY ) = E( X ) E(Y ) nếu X và Y là các biến ngẫu nhiên độc lập.
Chứng minh. Ta chứng minh Tính chất 2.4(b). Giả sử X là biến ngẫu nhiên rời rạc có bảng
phân phối xác suất (2.2) Khi đó CX sẽ là một biến ngẫu nhiên rời rạc có bảng phân phối xác
suất là
CX Cx1 Cx2 ... Cxn

p p1 p2 ... pn
vì P(CX = Cxi ) = P( X = xi ) = pi , i = 1, 2, . . . , n. Áp dụng (2.9) ta được

n n
E(CX ) = ∑ Cxi pi = C ∑ xi pi = CE(X ).
i =1 i =1
Các tính chất khác được chứng minh tương tự.
Ví dụ 2.12. Theo thống kê việc một người Mỹ 25 tuổi sẽ sống thêm trên một năm có xác suất
là 0,992, còn xác suất để người đó chết trong vòng một năm tới là 0,008. Một chương trình bảo
hiểm đề nghị người đó bảo hiểm sinh mạng cho 1 năm với số tiền chi trả 1000 $, còn tiền đóng
là 10 $. Hỏi lợi nhuận trung bình của công ty bảo hiểm nhận được là bao nhiêu?
Lời giải: Gọi X là lợi nhuận của công ty bảo hiểm nhận được. Khi đó X là biến ngẫu nhiên rời
rạc có thể nhận giá trị -990, 10. Bảng phân phối xác suất của X là
X -990 10
p 0,008 0,992
Suy ra E( X ) = −990 × 0, 008 + 10 × 0, 992 = 2 $. Ta thấy lợi nhuận trung bình bằng 2 $ (một
số dương) vì vậy công ty bảo hiểm có thể làm ăn có lãi.
Ví dụ 2.13. Một người đem 10 nghìn VNĐ đi đánh một số đề. Nếu trúng thì thu được 700
nghìn VNĐ, nếu trượt thì không được gì. Gọi X (nghìn VNĐ) là số tiền thu được. Ta có bảng
phân phối xác suất của X là
X 0 700
p 99/100 1/100
Kỳ vọng của X là E( X ) = 0 × 99/100 + 700 × 1/100 = 7 nghìn VNĐ. Như vậy bỏ ra 10 nghìn
VNĐ, trung bình thu được 7 nghìn VNĐ, người chơi về lâu dài sẽ lỗ 30% tổng số tiền chơi.

Ví dụ 2.14. Xét trò chơi trả lời hai câu hỏi A và B; người chơi có quyền chọn câu hỏi nào để trả
lời đầu tiên. Câu hỏi A được trả lời đúng với xác suất 0,8 và khi đó người chơi sẽ được thưởng
100 USD, câu hỏi B được trả lời đúng với xác suất 0,6 và người chơi được thưởng 200 USD.
Nếu không trả lời đúng lần thứ nhất sẽ không được trả lời tiếp. Vậy người chơi nên chọn câu
hỏi nào trả lời đầu tiên để tiền thưởng trung bình nhận được cao hơn.
Lời giải: Gọi X là số tiền thưởng nhận được khi người chơi chọn câu hỏi A trả lời đầu tiên,
X 0 100 300
p 0, 2 0, 32 0, 48
và E( X ) = 0 × 0, 2 + 100 × 0, 32 + 300 × 0, 48 = 176 USD.

Gọi Y là số tiền thưởng nhận được khi người chơi chọn câu hỏi B trả lời đầu tiên,
Y 0 200 300
p 0, 4 0, 12 0, 48
và E(Y ) = 0 × 0, 4 + 200 × 0, 12 + 300 × 0, 48 = 168 USD.

Vậy nên chọn câu hỏi A để trả lời đầu tiên để có khả năng nhận thưởng cao hơn.
Ví dụ 2.15. Theo thống kê ở một cửa hàng đậu tương, người ta thấy số lượng đậu tương bán
ra X là một biến ngẫu nhiên rời rạc có bảng phân phối là:
X (kg) 10 13 16 19 22
p 0, 15 0, 2 0, 35 0, 2 0, 1
Nếu giá nhập là 10000 VNĐ/kg thì cửa hàng sẽ lãi 5000 VNĐ/kg, nếu đến cuối ngày không
bán được sẽ lỗ 8000 VNĐ/kg.
(a) Tìm hàm phân phối xác suất của X.
(b) Mỗi ngày cửa hàng nên nhập bao nhiêu kg để thu được lãi nhiều nhất.
Lời giải:
(a) Từ bảng phân phối xác suất ta có hàm phân phối xác suất




 0, x ≤ 10,


0, 15, 10 < x ≤ 13,






0, 35, 13 < x ≤ 16,

FX ( x ) =



 0, 7, 16 < x ≤ 19,


0, 9, 19 < x ≤ 22,






1, x > 22.


(b) Số lượng đậu tương nhập trong ngày theo các phương án 10, 13, 16, 19, 22. Gọi Ti là "số
tiền lời thu được ứng với phương án i", i = 1, 2, . . . , 5, trong đó phương án 1, 2, 3, 4, 5
tương ứng là nhập 10, 13, 16, 19, 22 (kg).
(b1) Phương án nhập 10kg: chắc chắn cửa hàng sẽ bán hết vì P( X < 10) = 0. Do đó
E( T1 ) = 1 × 50000 = 50000 VNĐ.
(b2) Phương án nhập 13kg: do không có thống kê số lượng bán 11, 12kg, nên xem như
cửa hàng đó chỉ có 2 phương án hoặc bán 10kg, hoặc bán 13kg. Do chỉ nhập 13kg
nên xem như số lượng bán trên 13kg là số lượng bán được 13kg. Suy ra
E( T2 ) = 26000 × 0, 15 + 65000 × 0, 85 = 59150 VNĐ.
(b3) Phương án nhập 16kg: số lượng bán ra có thể là 10, 13, 16 với xác suất tương ứng là
0,15; 0,2 và 0,65. Suy ra
E( T3 ) = 2000 × 0, 15 + 41000 × 0, 2 + 80000 × 0, 65 = 60500 VNĐ.
(b4) Phương án nhập 19kg: số lượng bán ra có thể là 10, 13, 16, 19 với xác suất tương
ứng là 0,15; 0,2; 0,35 và 0,3. Suy ra
E( T4 ) = (−22000) × 0, 15 + 17000 × 0, 2 + 56000 × 0, 35 + 95000 × 0, 3 = 48200 VNĐ.
(b5) Phương án nhập 22kg: số lượng bán ra có thể là 10, 13, 16, 19, 22 với xác suất tương
ứng là 0,15; 0,2; 0,35; 0,2 và 0,1. Suy ra
E( T5 ) = (−46000) × 0, 15 + (−7000) × 0, 2 + 32000 × 0, 35 + 71000 × 0, 2

+ 110000 × 0, 1 = 28100 VNĐ.
Từ các kết quả trên, ta thấy E( T3 ) là cao nhất nên phương án nhập hiệu quả nhất là 16kg.
Chú ý 2.1. Nếu trong bảng phân phối xác suất mà giá trị nào của biến ngẫu nhiên X không
được đề cập đến thì xem như xác suất tại đó bằng 0.
Ví dụ 2.16 (Đề thi MI2020 kỳ 20183). Một kiện hàng có 10 sản phẩm, trong đó có 7 sản phẩm
loại I và 3 sản phẩm loại II. Tiền lãi khi bán được mỗi sản phẩm loại I là 50 nghìn đồng, mỗi
sản phẩm loại II là 20 nghìn đồng.
(a) Ngày thứ nhất lấy ngẫu nhiên từ kiện hàng ra 3 sản phẩm và đã bán hết cả 3 sản phẩm
đó. Tìm kỳ vọng của số tiền lãi thu được.
(b) Ngày thứ hai lấy ngẫu nhiên từ kiện hàng ra 2 sản phẩm. Tính xác suất để thu được 100
nghìn đồng tiền lãi khi bán 2 sản phẩm này.
Lời giải:

(a) Gọi X là "số tiền lãi thu được", X nhận các giá trị 60, 90, 120, 150. Khi đó,
1 21 63 35
E( X ) = 60 × + 90 × + 120 × + 150 × = 123.
120 120 120 120
(b) Gọi A là sự kiện "ngày thứ hai thu được 100 nghìn đồng tiền lãi khi bán 2 sản phẩm";
Ai : "ngày thứ nhất lấy được i sản phẩm loại I", i = 0, 1, 2, 3; A0 , A1 , A2 , A3 lập thành hệ
đầy đủ và P( A) = P( A0 ) P( A| A0 ) + P( A1 ) P( A| A1 ) + P( A2 ) P( A| A2 ) + P( A3 ) P( A| A3 ).
Khi đó,
1 21 21 15 63 10 35 6 7
P( A) = × + × + × + × = ≃ 0, 4667.
120 21 120 21 120 21 120 21 15
Ví dụ 2.17. Một dây chuyền tự động khi hoạt động bình thường có thể sản xuất ra phế phẩm
với xác suất p = 0, 001 và được điều chỉnh ngay lập tức khi phát hiện có phế phẩm. Tính số
trung bình các sản phẩm được sản xuất giữa 2 lần điều chỉnh.
Lời giải: Gọi X là số sản phẩm được sản xuất giữa hai lần điều chỉnh. Khi đó X là biến ngẫu
nhiên rời rạc có thể nhận các giá trị 1, 2, . . . với xác suất tương ứng
P( X = 1) = 0, 001, P( X = 2) = 0, 999 × 0, 001, P( X = 3) = 0, 9992 × 0, 001 . . .
Vậy
E( X ) = 1 × 0, 001 + 2 × 0, 999 × 0, 001 + 3 × 0, 9992 × 0, 001 + . . .

∞
= 0, 001 × ∑ n × 0, 999n−1 = 1000,
n =1
ở đây ta sử dụng tính chất của chuỗi lũy thừa và công thức tính tổng của cấp số nhân lùi vô
hạn với x = 0, 999:
∞ ∞ ′ ∞ ′
x ′ 1
∑ nx n
= ∑ x n
= ∑x n
=
1−x
=
(1 − x )2
.
n =1 n =1 n =1
Ví dụ 2.18. Tuổi thọ của một loại côn trùng nào đó là một biến ngẫu nhiên (đơn vị là tháng)
với hàm mật độ xác suất như sau:

kx2 (4 − x ), x ∈ [0, 4],
f X (x) =
0, x∈
/ [0, 4].
Tìm tuổi thọ trung bình của loại côn trùng trên.
3
Lời giải: Vì f X ( x ) là hàm mật độ xác suất nên theo Tính chất 2.3(a),(c), k = .
64
Sử dụng công thức (2.11), tuổi thọ trung bình của loại côn trùng trên là
Z4
3 12
E( X ) = x3 (4 − x )dx = (tháng).
64 5
0


3e−3x , nếu x ≥ 0
Ví dụ 2.19 (Đề thi MI2020 kỳ 20191). Cho hàm mật độ xác suất f X ( x ) =
0, nếu x < 0
của biến ngẫu nhiên liên tục X và định nghĩa Y = [ X ] là số nguyên lớn nhất không vượt quá
X (nghĩa là [ x ] = 0 nếu 0 ≤ x < 1, [ x ] = 1 nếu 1 ≤ x < 2. . . ).
(a) Tính P(Y = 0).
(b) Tính E(Y ).

Z 1
Lời giải: (a) P(Y = 0) = P(0 ≤ X < 1) = 3e−3x dx = 1 − e−3 .
0
∞ 1
(b) Với k ≥ 0, P(Y = k) = e−3k (1 − e−3 ) và E( X ) = ∑ kP(Y = k ) = .
k =0 e3 −1
2.3.2 Phương sai

Trong thực tế nhiều khi chỉ xác định kỳ vọng toán của biến ngẫu nhiên thì chưa đủ để xác
định biến ngẫu nhiên đó. Ta còn phải xác định mức độ phân tán của các giá trị của biến ngẫu
nhiên xung quanh giá trị trung bình của nó nữa.
Định nghĩa 2.7 (Phương sai). Phương sai (variance) của biến ngẫu nhiên X, ký hiệu là V ( X ),
được định nghĩa như sau:
V ( X ) = E[ X − E( X )]2 (2.12)
Công thức tương đương của (2.12)
V ( X ) = E( X 2 ) − [ E( X )]2 (2.13)
(a) Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì
n
∑
2
V (X) = xi − E ( X ) pi (2.14)
i =1
hay
n n 2
V ( X ) = E( X 2 ) − [ E( X )]2 = ∑ xi2 pi − ∑ xi pi (2.15)
i =1 i =1
(b) Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.3) thì
∞
∑
2
V (X) = xn − E( X ) pn (2.16)
n =1
hay
∞ ∞ 2
V ( X ) = E( X 2 ) − [ E( X )]2 = ∑ xn2 pn − ∑ xn pn (2.17)
n =1 n =1
nếu chuỗi/các chuỗi vế phải hội tụ.

(c) Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ), x ∈ R thì
+∞
Z 2
V (X) = x − E( X ) f X ( x )dx (2.18)
−∞
hay
+∞
Z +∞
Z
!2
V ( X ) = E( X 2 ) − [ E( X )]2 = x2 f X ( x )dx − x f X ( x )dx (2.19)
−∞ −∞
nếu tích phân/các tích phân vế phải hội tụ.
Chú ý 2.2. Phương sai của biến ngẫu nhiên là một giá trị xác định không âm.
Nhận xét 2.5. (a) Phương sai chính là trung bình số học của bình phương các sai lệch giữa
các giá trị có thể có của biến ngẫu nhiên so với giá trị trung bình của các giá trị đó. Nó
phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị trung
tâm của nó là kỳ vọng.
(b) Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán của các chi tiết gia công hay
sai số của thiết bị. Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ
rủi ro của các quyết định.
Tính chất 2.5. (a) V (C ) = 0 với C là hằng số.
(b) V (CX ) = C2 V ( X ) với C là hằng số.
(c) V ( X + Y ) = V ( X ) + V (Y ) nếu X và Y là các biến ngẫu nhiên độc lập.

Mở rộng: nếu X1 , X2 , . . . , Xn là n biến ngẫu nhiên độc lập thì V (∑in=1 Xi ) = ∑in=1 V ( Xi ).
V ( X + C ) = V ( X ), C là hằng số.
V ( X − Y ) = V ( X ) + V (Y ) nếu X và Y là các biến ngẫu nhiên độc lập.
Chứng minh. Sử dụng định nghĩa của phương sai và tính chất của kỳ vọng ta có:
(a) V (C ) = E[C − E(C )]2 = E(C − C ) = E(0) = 0.
(b) V (CX ) = E[(CX )2 ] − [ E(CX )]2 = C2 [ E( X 2 ) − ( E( X ))2 ] = C2 V ( X ).
Các tính chất khác được chứng minh tương tự.
2.3.3 Độ lệch chuẩn

Định nghĩa 2.8 (Độ lệch chuẩn). Độ lệch chuẩn của biến ngẫu nhiên X, ký hiệu là σ ( X ), được
định nghĩa như sau:
»
σ(X ) = V (X) (2.20)

Nhận xét 2.6. Khi cần đánh giá mức độ phân tán của biến ngẫu nhiên theo đơn vị đo của nó
người ta dùng độ lệch chuẩn vì độ lệch chuẩn có cùng đơn vị đo với đơn vị đo của biến ngẫu
nhiên.
Ví dụ 2.20. Tính phương sai và độ lệch chuẩn của biến ngẫu nhiên xét trong Ví dụ (2.12).
Lời giải: E( X 2 ) = (−990)2 × 0, 008 + (10)2 × 0, 992 = 7940. Suy ra
V ( X ) = E( X 2 ) − ( E( X ))2 = 7940 − 4 = 7936,

» √
σ( X ) = V ( X ) = 7936 ≃ 89, 08.
Điều này nói lên rằng mặc dù kinh doanh bảo hiểm có lãi nhưng rủi ro khá lớn.
Ví dụ 2.21. Tính phương sai và độ lệch chuẩn của biến ngẫu nhiên xét trong Ví dụ (2.18).
Z 4
3 32 32 12 2 16 4
Lời giải: E( X 2 ) = x4 (4 − x )dx = . Suy ra V ( X ) = − = và σ ( X ) = .
64 0 5 5 5 5 5
TUẦN 7
2.3.4 Một số đặc trưng khác

2.3.4a Mốt (mode)
Định nghĩa 2.9 (Mốt). (a) Nếu X là biến ngẫu nhiên rời rạc thì mốt là giá trị của X ứng với
xác suất lớn nhất.
(b) Nếu X là biến ngẫu nhiên liên tục thì mốt là giá trị làm hàm mật độ đạt max.
Ký hiệu modX.
2.3.4b Trung vị (median)
Định nghĩa 2.10 (Trung vị). Trung vị của biến ngẫu nhiên X, ký hiệu là medX, là giá trị của
biến ngẫu nhiên X chia phân phối thành hai phần có xác suất giống nhau, nghĩa là
1
P( X < medX ) = P( X ≥ medX ) = (2.21)
2
Nhận xét 2.7. (a) Từ định nghĩa hàm phân phối, để tìm trung vị ta cần giải phương trình
1
F(x) = .
2
(b) Trong nhiều trường hợp ứng dụng, trung vị là đặc trưng vị trí tốt nhất, nhiều khi tốt
hơn cả kỳ vọng, nhất là khi trong số liệu có những sai sót. Trung vị còn có tên là phân vị
50% của phân phối.

Ví dụ 2.22. Cho hàm mật độ xác suất của biến ngẫu nhiên liên tục X:
 3 x (2 − x ),

0 ≤ x ≤ 2,
f X (x) = 4
0, nếu trái lại.

Tìm medX và modX.
Lời giải: Theo (2.7), hàm phân phối xác suất của X là



 0, x ≤ 0,

3 2 x
 3
FX ( x ) = x − , 0 < x ≤ 2,


 4 3
1, x > 2.

1
Khi đó medX là nghiệm của phương trình FX ( x ) = . Hay x3 − 3x2 + 2 = 0 với 0 < x ≤ 2.
2
Suy ra medX = 1.
Hàm mật độ xác suất f X ( x ) có




0, x ≤ 0,
3

f X′ ( x ) = (1 − x ), 0 < x < 2,


 2
0, nếu trái lại,

đổi dấu từ dương sang âm khi đi qua x = 1, do đó đạt cực đại tại điểm này, nên modX = 1.
2.4 Một số phân phối xác suất thông dụng
2.4.1 Phân phối đều
2.4.1a Phân phối đều rời rạc

Định nghĩa 2.11 (Phân phối đều rời rạc). Biến ngẫu nhiên X được gọi là tuân theo luật phân
phối đều rời rạc với tham số n, ký hiệu là X ∼ 𝒰 (n), nếu X có bảng phân phối xác suất
X 1 2 ... n
1 1 1
(2.22)
p n n ... n
Kỳ vọng, phương sai của biến ngẫu nhiên có phân phối đều rời rạc:
n+1 n2 − 1
E( X ) = , V (X) = (2.23)
2 12
2.4. Một số phân phối xác suất thông dụng 53

2.4.1b Phân phối đều liên tục

Định nghĩa 2.12 (Phân phối đều liên tục). Biến ngẫu nhiên X được gọi là tuân theo luật phân
phối đều liên tục trên [ a, b] (a < b), ký hiệu là X ∼ 𝒰 ([ a, b]), nếu X có hàm mật độ

 1 ,

x ∈ [ a, b],
f X (x) = b − a (2.24)
0, x∈ / [ a, b].

Hàm phân phối xác suất tương ứng



 0, x ≤ a,
Zx


x − a
FX ( x ) = f X (u)du = , a < x ≤ b, (2.25)
 b−a
−∞


1, x > b.

Hình 2.3: Hàm mật độ và hàm phân phối xác suất của biến ngẫu nhiên có phân phối đều
Kỳ vọng, phương sai của biến ngẫu nhiên có phân phối đều liên tục:
a+b ( b − a )2
E( X ) = , V (X) = (2.26)
2 12
Nhận xét 2.8. (a) X có khả năng nhận giá trị trong khoảng ( a, b) là "đều nhau".
(b) Phân phối đều có nhiều ứng dụng trong thống kê toán như mô phỏng thống kê, đặc biệt
trong phương pháp phi tham số.
(c) Trong một số lý thuyết kết luận thống kê người ta thường xuất phát từ quy tắc sau đây:
Nếu ta không biết gì về giá trị của tham số cần ước lượng, mỗi giá trị có thể có của tham
số đó là đồng khả năng, điều đó dẫn đến việc quan niệm tham số cần ước lượng như
một biến ngẫu nhiên có phân phối đều.
Ví dụ 2.23. Lịch chạy của xe bus tại một trạm xe bus như sau: chiếc xe bus đầu tiên trong ngày
sẽ khởi hành từ trạm này lúc 7 giờ, cứ sau 15 phút sẽ có một xe khác đến trạm. Giả sử một
hành khách đến trạm ngẫu nhiên trong khoảng thời gian từ 7 giờ đến 7 giờ 30. Tìm xác suất
để hành khách này chờ:

(a) Ít hơn 5 phút.
(b) Ít nhất 12 phút.
Lời giải: Gọi X là số phút từ 7 giờ đến 7 giờ 30 hành khách đến trạm, ta có X ∼ 𝒰 ([0, 30]).
(a) Hành khách chờ ít hơn 5 phút nếu đến trạm giữa 7 giờ 10 và 7 giờ 15 hoặc giữa 7 giờ 25
và 7 giờ 30. Do đó xác suất cần tìm là:
5 5 1
P(10 < X ≤ 15) + P(25 < X ≤ 30) = + = .
30 30 3
(b) Hành khách chờ ít nhất 12 phút nếu đến trạm giữa 7 giờ và 7 giờ 03 hoặc giữa 7 giờ 15
và 7 giờ 18. Xác suất cần tìm là:
3 3
P(0 < X ≤ 3) + P(15 < X ≤ 18) = + = 0, 2.
30 30
Ví dụ 2.24. Lấy ngẫu nhiên một điểm M trên nửa đường tròn tâm O, đường kính AB = 2a.
Biết rằng xác suất điểm M rơi vào cung CD bất kì của nửa đường tròn AMB chỉ phụ thuộc
vào độ dài cung CD. Tìm hàm phân phối xác suất của biến ngẫu nhiên Y chỉ diện tích tam
giác AMB.
D
M
A a O B
Lời giải: (a) Theo định lý hàm số sin, ta có S AMB = a2 sin ϕ, ở đây ϕ là góc giữa trục Ox và
OM. Từ giả thiết ta có ϕ là biến ngẫu nhiên liên tục có phân phối đều 𝒰 [0, π ] có hàm mật độ
xác suất 
1, x ∈ [0, π ],
π
f (x) =
0, x∈
/ [0, π ].
Do đó, hàm phân phối xác suất của ϕ là




 0, x ≤ 0,

Fϕ ( x ) = πx , 0 < x ≤ π,



1, x > π.

Biến ngẫu nhiên Y = a2 sin ϕ, nên Y là biến ngẫu nhiên liên tục nhận giá trị trong đoạn [0, a2 ].
Hàm phân phối xác suất của Y là




 0, x ≤ 0,
2 x

FY ( x ) = P(Y < x ) = arcsin 2 , 0 < x ≤ a2 ,


 π a
1, x > a2 ,

vì với x ∈ (0, a2 ],
x
FY ( x ) = P(Y < x ) = P( a2 sin ϕ < x ) = P(sin ϕ < 2 )
a
x x 2 x
= P 0 < ϕ < arcsin 2 + P π − arcsin 2 < ϕ < π = arcsin 2 .
a a π a
2.4.2 Phân phối nhị thức
2.4.2a Phân phối Béc–nu–li

Định nghĩa 2.13 (Phân phối Béc–nu–li). Biến ngẫu nhiên rời rạc X được gọi là tuân theo luật
phân phối Béc–nu–li với tham số p, ký hiệu là X ∼ ℬ(1, p), nếu X nhận hai giá trị 0, 1 với xác
suất tương ứng
p X ( k ) = P ( X = k ) = p k q 1− k , k = 0, 1,
ở đây 0 < p < 1, q = 1 − p.
Kỳ vọng, phương sai của biến ngẫu nhiên có phân phối Béc–nu–li:
E( X ) = p, V ( X ) = pq (2.27)
Nhận xét 2.9. Xét phép thử Béc–nu–li với sự thành công của phép thử là sự xuất hiện của sự
kiện A và giả sử xác suất xuất hiện A trong mỗi lần thử là p. Gọi X là số lần thành công trong
một lần thử thì X là biến ngẫu nhiên rời rạc có phân bố Béc-nu-li tham số p. Biến ngẫu nhiên
X còn được gọi là tuân theo phân phối không – một 𝒜( p).
2.4.2b Phân phối nhị thức

Định nghĩa 2.14 (Phân phối nhị thức). Biến ngẫu nhiên rời rạc X được gọi là tuân theo luật
phân phối nhị thức với tham số n và p, ký hiệu là X ∼ ℬ(n, p), nếu X có bảng phân phối xác
suất
X 0 1 ... k ... n
(2.28)
p Cn0 p0 qn Cn1 p1 qn−1 ... Cnk pk qn−k ... Cnn pn q0
ở đây p X (k ) = P( X = k ) = Cnk pk qn−k được tính bằng công thức Béc–nu–li (1.19).

Kỳ vọng, phương sai của biến ngẫu nhiên có phân phối nhị thức:
E( X ) = np, V ( X ) = npq (2.29)
Nhận xét 2.10. (a) Thực hiện n phép thử Béc–nu–li với xác suất thành công của sự kiện
A trong mỗi lần thử là p. Với mỗi i = 1, 2, . . . , n, nếu ở lần thử thứ i sự kiện A xuất
hiện ta cho Xi nhận giá trị 1, nếu sự kiện A không xuất hiện ta cho Xi nhận giá trị 0.
Như vậy Xi ∼ ℬ(1, p). Gọi X là số lần thành công trong n phép thử Béc–nu–li này thì
X = X1 + X2 + · · · + Xn ∼ ℬ(n, p).
(b) Nếu X ∼ ℬ(n1 , p) và Y ∼ ℬ(n2 , p) và nếu X, Y độc lập thì X + Y ∼ ℬ(n1 + n2 , p).
Ví dụ 2.25. Tỷ lệ phế phẩm của lô hàng là 4%. Chọn ngẫu nhiên 20 sản phẩm để kiểm tra. Gọi
X là số phế phẩm phát hiện được.
(a) X có phân phối gì?
(b) Tính xác suất có đúng 5 phế phẩm phát hiện được.
(c) Lô hàng được xem là đạt tiêu chuẩn nếu số phế phẩm phát hiện được không nhiều hơn
2. Tính xác suất để lô hàng đạt tiêu chuẩn.
Lời giải: Có thể xem việc kiểm tra chất lượng mỗi sản phẩm là thực hiện một phép thử Béc–
nu–li với sự thành công của phép thử là phát hiện ra phế phẩm. Theo giả thiết xác suất thành
công của mỗi lần thử là 0,04. Kiểm tra 20 sản phẩm là thực hiện 20 phép thử.
(a) Số phế phẩm phát hiện được là số lần thành công trong 20 phép thử này. Vậy X có phân
phối nhị thức X ∼ ℬ(n, p), với n = 20, p = 0, 04.
5 × (0, 04)5 × (0, 96)15 = 0, 0008.

(b) P( X = 5) = C20
(c) Xác suất để lô hàng đạt tiêu chuẩn là
P ( X ≤ 2) = P ( X = 0) + P ( X = 1) + P ( X = 2)
0
= C20 (0, 04)0 (0, 96)20 + C20
1
(0, 04)1 (0, 96)19 + C20
2
(0, 04)2 (0, 96)18 ≃ 0, 956.
2.4.3 Phân phối Poa–xông

Định nghĩa 2.15 (Phân phối Poa–xông). Biến ngẫu nhiên rời rạc X được gọi là tuân theo luật
phân phối Poa-xông với tham số λ = np, ký hiệu là X ∼ 𝒫 (λ), nếu X có bảng phân phối xác
suất
X 0 1 ... k ... n ...

λ0 λ1 λk λn
(2.30)
p −λ −λ ... −λ ... −λ ...
0! e 1! e k! e n! e

Kỳ vọng, phương sai của biến ngẫu nhiên có phân phối Poa–xông:
E( X ) = λ, V (X) = λ (2.31)
Nhận xét 2.11. (a) Phân phối Poa–xông xuất hiện trong dãy phép thử Béc–nu–li khi số phép
thử n khá lớn và xác xuất p khá bé (thỏa mãn λ = np < 7).
(b) Phân phối Poa–xông được ứng dụng rộng rãi trong nhiều lĩnh vực thực tế như kiểm tra
chất lượng sản phẩm, lý thuyết sắp hàng, các hệ phục vụ đám đông, các bài toán chuyển
mạch trong tổng đài . . .
(c) Nếu X1 , X2 là hai biến ngẫu nhiên độc lập có phân phối Poa–xông tham số lần lượt λ1 ,
λ2 , thì X1 + X2 cũng có phân phối Poa–xông tham số λ1 + λ2 .
(d) Trong thực tế với một số giả thiết thích hợp thì các biến ngẫu nhiên là các quá trình đếm
sau: số cuộc gọi đến một tổng đài; số khách hàng đến một điểm phục vụ; số xe cộ qua
một ngã tư; số tai nạn (xe cộ); số các sự cố xảy ra ở một địa điểm . . . trong một khoảng
thời gian xác định nào đó sẽ có phân phối Poa–xông với tham số λ, trong đó λ là tốc độ
trung bình diễn ra trong khoảng thời gian này.
Ví dụ 2.26. Xác suất để trong khi vận chuyển mỗi chai rượu bị vỡ là 0,001. Người ta tiến hành
vận chuyển 2000 chai rượu đến cửa hàng. Tìm số chai vỡ trung bình khi vận chuyển.
Lời giải: Bài toán thỏa mãn lược đồ Béc–nu–li với n = 2000 khá lớn và p = 0, 001 khá bé,
np = 2 < 7. Gọi X là số chai rượu bị vỡ khi vận chuyển thì X là biến ngẫu nhiên phân phối
theo quy luật Poa–xông.
Số chai vỡ trung bình khi vận chuyển là E( X ) = λ = np = 2000 × 0, 001 = 2.
Ví dụ 2.27. Ở một tổng đài bưu điện, các cuộc điện thoại gọi đến xuất hiện ngẫu nhiên, độc
lập với nhau với tốc độ trung bình 2 cuộc gọi trong một phút. Tìm xác suất để:
(a) Có đúng 5 cuộc điện thoại trong vòng 2 phút.
(b) Không có cuộc điện thoại nào trong khoảng thời gian 30 giây.
(c) Có ít nhất 1 cuộc điện thoại trong khoảng thời gian 10 giây.
Lời giải:
(a) Gọi X là số cuộc điện thoại xuất hiện trong vòng 2 phút. X ∼ 𝒫 (λ), λ chính là số cuộc
điện thoại trung bình đến trong vòng 2 phút, λ = 4.
5 5
P( X = 5) = e−λ λ5! = e−4 45! = 0, 156.
(b) Gọi X là số cuộc điện thoại xuất hiện trong vòng 30 giây. X ∼ 𝒫 (λ) với λ = 1.
0
P( X = 0) = e−λ λ0! = e−1 = 0, 3679.

(c) Gọi X là số cuộc điện thoại xuất hiện trong vòng 10 giây. X ∼ 𝒫 (λ) với λ = 1/3.
P( X ≥ 1) = 1 − P( X = 0) = 1 − e−1/3 = 0, 2835.
Ví dụ 2.28. Một ga ra cho thuê ôtô thấy rằng số người đến thuê ôtô vào thứ bảy cuối tuần là
một biến ngẫu nhiên tuân theo luật phân phối Poát-xông với tham số λ = 2. Giả sử gara có 4
chiếc ôtô.
(a) Tìm xác suất để tất cả 4 ôtô đều được thuê vào thứ 7.
(b) Tìm xác suất gara không đáp ứng được yêu cầu (thiếu xe cho thuê) vào thứ 7.
(c) Trung bình có bao nhiêu ôtô được thuê vào ngày thứ 7?
Lời giải: Gọi X là biến ngẫu nhiên chỉ "số người đến thuê ôtô vào thứ bảy". Theo giả thiết X
là biến ngẫu nhiên phân phối tuân theo quy luật Poát-xông 𝒫 (λ). Gọi Y là biến ngẫu nhiên
chỉ "số xe được thuê vào thứ bảy".
(a) Áp dụng công thức (2.31),
P (Y = 4 ) = P ( X ≥ 4 ) = 1 − P ( X < 4 )
= 1 − P ( X = 0) − P ( X = 1) − P ( X = 2) − P ( X = 3)
20 21 22 23
= 1 − e −2 + + + = 0, 1429.
0! 1! 2! 3!
24
(b) P( X > 4) = P( X ≥ 4) − P( X = 4) = 0, 1429 − e−2 = 0, 0527.
4!
(c) Y có thể nhận các giá trị 0, 1, 2, 3, 4, với
P(Y = 0) = P( X = 0) = 0, 1353, P(Y = 1) = P( X = 1) = 0, 2707,

P(Y = 2) = P( X = 2) = 0, 2707, P(Y = 3) = P( X = 3) = 0, 1804,
P(Y = 4) = P( X ≥ 4) = 0, 1429.
Bảng phân phối xác suất của Y là:
X 0 1 2 3 4
p 0, 1353 0, 2707 0, 2707 0, 1804 0, 1429
Khi đó, trung bình số ôtô được thuê trong ngày thứ bảy là E(Y ) = 1, 9249, tức là khoảng
2 chiếc.
Ví dụ 2.29 (Đề thi MI2020 kỳ 20191). Số khách hàng đến một cửa hàng bán lẻ là một biến
ngẫu nhiên có phân phối Poisson với trung bình 6 khách hàng đến trong vòng một giờ. Nếu
có đúng 5 khách hàng đến trong khoảng thời gian từ 10:00 đến 11:00 thì xác suất để có ít nhất
8 khách hàng đến trong khoảng thời gian từ 10:00 đến 11:30 là bao nhiêu?

Lời giải: Gọi X là "số khách hàng đến cửa hàng bán lẻ trong vòng 30 phút". X ∼ 𝒫 (λ). Xác
suất cần tìm p = P( X ≥ 3) với λ = 3. Vậy,

p = 1 − P ( X < 3) = 1 − P ( X = 0) + P ( X = 1) + P ( X = 2)
h 30 31 32 i
= 1 − e −3 + +
0! 1! 2!
= 1 − 0, 42319 = 0, 57681.
Chú ý 2.3. Giá trị xác suất của phân phối Poa–xông được tính sẵn trong bảng giá trị khối
lượng xác suất Poa–xông (Phụ lục 5).
TUẦN 8
2.4.4 Phân phối chuẩn
2.4.4a Phân phối chuẩn

Định nghĩa 2.16 (Phân phối chuẩn). Biến ngẫu nhiên liên tục X được gọi là tuân theo luật
phân phối chuẩn với tham số µ, σ2 , ký hiệu là X ∼ 𝒩 (µ, σ2 ), nếu hàm mật độ xác suất của X
có dạng
( x − µ )2
1 −
f X (x) = √ e 2σ2 , x∈R (2.32)
σ 2π
ở đây e và π được lấy xấp xỉ lần lượt là 2.71828 và 3.14159.
Nhận xét 2.12. Phân phối liên tục quan trọng nhất trong lĩnh vực thống kê là phân phối
chuẩn. Đồ thị của hàm mật độ xác suất f X ( x ) của biến ngẫu nhiên tuân theo luật phân phối
chuẩn, được gọi là đường cong chuẩn, có dạng hình chuông (xem Hình 2.5), mô tả gần đúng
nhiều hiện tượng trong tự nhiên, công nghiệp và nghiên cứu.
Hình 2.5: Đường cong chuẩn

Hình 2.6 mô tả hai đường cong chuẩn có cùng độ lệch chuẩn nhưng kỳ vọng khác nhau.
Hai đường cong giống hệt nhau về hình thức nhưng được tập trung tại các vị trí khác nhau
dọc theo trục hoành.
Hình 2.6: Đường cong chuẩn với µ1 < µ2 và σ1 = σ2
Hình 2.7 mô tả hai đường cong chuẩn có cùng kỳ vọng nhưng độ lệch chuẩn khác nhau. Hình
2.8 mô tả cho trường hợp kỳ vọng và độ lệch chuẩn khác nhau.
Hình 2.7: Đường cong chuẩn với µ1 = µ2 và σ1 < σ2
Định lý 2.1. Kỳ vọng và phương sai của biến ngẫu nhiên X có phân phối chuẩn
E( X ) = µ, V ( X ) = σ2 (2.33)
và độ lệch tiêu chuẩn là σ( X ) = σ.
Chứng minh. Để xác định kỳ vọng, trước hết ta tính

Z∞ ( x − µ )2
1 −
E[ X − µ] = √ ( x − µ)e 2σ2 dx.
σ 2π
−∞

Hình 2.8: Đường cong chuẩn với µ1 < µ2 và σ1 < σ2
Đặt z = ( x − µ)/σ và dx = σdz, ta nhận được

Z∞
1 z2
E[ X − µ] = √ ze− 2 dz = 0,
2π
−∞
vì hàm số dưới dấu tích phân là hàm lẻ của z. Do đó,
E[ X ] = µ.
Phương sai của biến ngẫu nhiên tuân theo luật phân phối chuẩn được cho bởi
Z∞ ( x − µ )2
2 1 −
E[( X − µ) ] = √ ( x − µ )2 e 2σ2 dx.
σ 2π
−∞
Đặt z = ( x − µ)/σ và dx = σdz, ta nhận được

Z∞
σ2 z2
2
E[( X − µ) ] = √ z2 e− 2 dz.
2π
−∞
Tích phân từng phần với u = z và dv = ze −z2 /2 dz suy ra du = dz và v = −e−z

2 /2
, ta tìm được
∞ Z∞
σ2 2 2
− z2

2
E[( X − µ) ] = √ − ze−z /2 + e dz = σ2 (0 + 1) = σ2 .
2π −∞
−∞
Định lý 2.2. Nếu X là biến ngẫu nhiên tuân theo luật phân phối chuẩn 𝒩 (µ, σ2 ), thì biến
ngẫu nhiên Y = aX + b tuân theo luật phân phối chuẩn 𝒩 ( aµ + b, a2 σ2 ).
Chú ý 2.4. (a) Nếu X1 , X2 là hai biến ngẫu nhiên độc lập có phân phối chuẩn X1 ∼ 𝒩 (µ1 , σ12 ),
X2 ∼ 𝒩 (µ2 , σ22 ) thì X1 + X2 cũng có phân phối chuẩn X1 + X2 ∼ 𝒩 (µ1 + µ2 , σ12 + σ22 ).
(b) Nếu n biến ngẫu nhiên độc lập Xi cùng có phân phối chuẩn 𝒩 (µ, σ2 ), i = 1, . . . , n, thì
biến ngẫu nhiên
X1 + X2 + · · · + X n σ2
X= ∼ 𝒩 µ, .
n n

2.4.4b Phân phối chuẩn tắc

Phân phối chuẩn 𝒩 (µ, σ2 ) với µ = 0 và σ = 1 gọi là phân phối chuẩn tắc 𝒩 (0, 1).
Nếu X là biến ngẫu nhiên có phân phối chuẩn 𝒩 (µ, σ2 ) thì
X−µ
U= (2.34)
σ
là biến ngẫu nhiên có phân phối chuẩn tắc 𝒩 (0, 1).
Hàm mật độ xác suất của biến ngẫu nhiên có phân phối chuẩn tắc là
1 x2
ϕ( x ) = √ e− 2 , x∈R (2.35)
2π
Đây là hàm Gau–xơ với các giá trị được tính sẵn trong Phụ lục 1.
Hình 2.9: Hàm mật độ của biến ngẫu nhiên có phân phối chuẩn tắc 𝒩 (0, 1)
Hàm phân phối xác suất của biến ngẫu nhiên U phân phối chuẩn tắc là
Zx
1 t2
ΦU ( x ) = √ e− 2 dt, x∈R (2.36)
2π
−∞
với các giá trị được tính sẵn trong Phụ lục 3.
Chú ý 2.5. (a) Mối liên hệ giữa hàm phân phối xác suất của biến ngẫu nhiên phân phối
chuẩn tắc (2.36) và hàm Láp–la–xơ (1.24) là
Φ( x ) = 0, 5 + φ( x ), x≥0 (2.37)
(b) Nếu n biến ngẫu nhiên độc lập Xi cùng có phân phối chuẩn 𝒩 (µ, σ2 ), i = 1, . . . , n, và
X + X2 + · · · + X n X − µ√
X = 1 thì biến ngẫu nhiên U = n có phân phối chuẩn tắc
n σ
𝒩 (0, 1).

2.4.4c Xác suất để biến ngẫu nhiên X có phân phối chuẩn 𝒩 (µ, σ2 ) nhận giá
trị trong khoảng (α, β)
β − µ α − µ
P(α < X < β) = φ −φ (2.38)
σ σ
trong đó φ( x ) là hàm số Láp–la–xơ xác định bởi (1.24).
x−µ
Thật vậy, sử dụng phép đổi biến t = ta nhận được
σ
2 β−µ
Zβ − ( x − µ) Zσ
1 1 t2
P(α < X < β) = √ e 2
2σ dx = √ e− 2 dt.
σ 2π 2π α−µ
α
σ
Từ đây và (1.24) ta nhận được (2.38).
2.4.4d Quy tắc 3σ

Từ (2.38) suy ra P(| X − µ| < tσ) = 2φ(t), thay t = 1, 2, 3, tra bảng hàm số Láp–la–xơ (Phụ lục
2) ta nhận được
P(| X − µ| < σ) = 2φ(1) = 0, 6827,

P(| X − µ| < 2σ ) = 2φ(2) = 0, 9545,
P(| X − µ| < 3σ ) = 2φ(3) = 0, 9973. (2.39)
Quy tắc 3σ được phát biểu như sau: Hầu chắc chắn rằng (với độ tin cậy 0,9973) X có phân phối
chuẩn 𝒩 (µ, σ2 ) lấy giá trị trong khoảng (µ − 3σ, µ + 3σ).
Trong thực tế, quy tắc 3σ được áp dụng như sau: Nếu quy luật phân phối xác suất của
biến ngẫu nhiên được nghiên cứu chưa biết, song nó thỏa mãn điều kiện của Quy tắc 3σ thì
có thể xem như nó là biến ngẫu nhiên có phân phối chuẩn.
Chú ý 2.6. (a) Phân phối chuẩn được Gao–xơ tìm ra năm 1809 nên nó còn được gọi là phân
phối Gao–xơ.
(b) Phân phối chuẩn thường được sử dụng trong các bài toán đo đạc các đại lượng vật lý,
thiên văn . . .
(c) Trong thực tế, nhiều biến ngẫu nhiên tuân theo phân phối chuẩn hoặc tiệm cận chuẩn.
Chẳng hạn, trọng lượng, chiều cao của một nhóm người nào đó; điểm thi của thí sinh;
năng suất cây trồng; mức lãi suất của một công ty; nhu cầu tiêu thụ của một mặt hàng
nào đó; nhiễu trắng trên các kênh thông tin . . . là các biến ngẫu nhiên có phân phối
chuẩn.
Ví dụ 2.30. Lãi suất (%) đầu tư vào một dự án trong năm 2018 được coi như một biến ngẫu
nhiên tuân theo quy luật chuẩn. Theo đánh giá của ủy ban đầu tư thì với xác suất 0,1587 cho

lãi suất lớn hơn 20% và với xác suất 0,0228 cho lãi suất lớn hơn 25%. Vậy khả năng đầu tư mà
không bị lỗ là bao nhiêu?
Lời giải: Gọi X là lãi suất (%) của dự án trong năm 2018. Khi đó X là biến ngẫu nhiên có phân
phối chuẩn 𝒩 (µ, σ2 ). Theo đầu bài ta có
20 − µ
P( X > 20) = P(20 < X < +∞) = 0, 5 − φ = 0, 1587
σ
và 25 − µ
P( X > 25) = P(25 < X < +∞) = 0, 5 − φ = 0, 0228.
σ
20 − µ 25 − µ
Từ bảng giá trị hàm số Láp–la–xơ (Phụ lục 2) suy ra = 1 và = 2. Hay µ = 15,
σ σ
σ = 5. Vậy khả năng đầu tư không bị lỗ là
P( X ≥ 0) = 0, 5 + φ(3) = 0, 5 + 0, 49865 = 0, 99865.
2.4.4e Xấp xỉ phân phối nhị thức bởi phân phối chuẩn
Phân phối chuẩn có thể dùng xấp xỉ khá tốt cho một số phân phối rời rạc.
Định lý 2.3. Nếu X là biến ngẫu nhiên tuân theo luật phân phối chuẩn với kỳ vọng µ = np
và phương sai σ2 = npq, thì giới hạn của phân phối xác suất của biến ngẫu nhiên
X − np
Z= √ ,
npq
khi n → ∞ tuân theo luật phân phối chuẩn tắc 𝒩 (0, 1).
Phân phối chuẩn với kỳ vọng µ = np và phương sai σ2 = npq không chỉ xấp xỉ khá tốt cho
phân phối nhị thức khi n khá lớn và xác suất p không quá gần 0 hoặc 1 mà còn cung cấp một
xấp xỉ khá tốt cho phân phối nhị thức ngay cả khi n nhỏ và p gần 1/2.
Để minh họa việc xấp xỉ phân phối chuẩn cho phân phối nhị thức, ta vẽ biểu đồ của
ℬ(15; 0, 4) và vẽ đường cong chuẩn có cùng kỳ vọng µ = np = 15 × 0, 4 = 6 và phương sai
σ2 = npq = 15 × 0, 4 × 0, 6 = 3, 6 với biến ngẫu nhiên tuân theo luật phân phối nhị thức X
(xem Hình 2.10).
Trong hình minh họa về xấp xỉ phân phối nhị thức bởi phân phối chuẩn, vì ta xấp xỉ một
phân phối rời rạc bằng một phân phối liên tục, nên cần một sự hiệu chỉnh để giảm sai số.
Định nghĩa 2.17. Cho X là biến ngẫu nhiên tuân theo luật phân phối nhị thức ℬ(n; p). Phân
phối xác suất của X được xấp xỉ bởi phân phối chuẩn 𝒩 (µ, σ2 ) với µ = np và σ2 = np(1 − p)
và
k + 0, 5 − µ k − 0, 5 − µ
n−k
P( X = k) = Cnk pk (1 − p) ≃φ −φ (2.40)
σ σ

Hình 2.10: Xấp xỉ phân phối chuẩn cho phân phối nhị thức ℬ(15; 0, 4)
k2 k + 0, 5 − µ k − 0, 5 − µ
∑
2
P(k1 ≤ X ≤ k2 ) = Cnk pk (1 − p)n−k ≃ φ −φ 1 (2.41)
k=k1
σ σ
Xấp xỉ là khá tốt nếu np ≥ 5 và n(1 − p) ≥ 5.
Nhận xét 2.13. Hình 2.11 và 2.12 biểu thị biểu đồ xác suất nhị thức với n = 25 và p = 0.5,
p = 0.1 tương ứng. Phân phối trong Hình 2.11 là hoàn toàn đối xứng.
Hình 2.11: Phân phối nhị thức với n = 25 và p = 0, 5 xấp xỉ bởi phân phối chuẩn với µ = 12, 5
và σ = 2, 5
Việc thêm +0, 5 và −0, 5 chính là yếu tố hiệu chỉnh và gọi là hiệu chỉnh liên tục.
Ví dụ 2.31. Sử dụng phân phối chuẩn xấp xỉ xác suất X = 8, 9, hoặc 10 cho biến ngẫu nhiên
X tuân theo luật phân phối nhị thức với n = 25 và p = 0, 5. So sánh với công thức tính chính
xác.

Hình 2.12: Phân phối nhị thức và xấp xỉ phân phối chuẩn với n = 25 và p = 0, 1
Lời giải: Vì X là biến ngẫu nhiên tuân theo luật phân phối nhị thức với n = 25 và p = 0, 5,
8 9 10
× (0, 5)25 ≃ 0, 190535.

P(8 ≤ X ≤ 10) = P( X = 8) + P( X = 9) + P( X = 10) = C25 + C25 + C25
√
Sử dụng công thức xấp xỉ (2.41) với µ = np = 12, 5, σ = npq = 2, 5 ta nhận được
P(8 ≤ X ≤ 10) ≃ φ(−0.8) − φ(−2) = 0, 18911.
Giá trị xấp xỉ 0,18911 với giá trị thực 0,190535 là khá gần nhau.
Ví dụ 2.32. Kiểm tra chất lượng 1000 sản phẩm với tỷ lệ chính phẩm 0,95. Tìm xác suất để số
chính phẩm trong lô kiểm tra từ 940 đến 960.
Lời giải: Gọi X là biến ngẫu nhiên chỉ số chính phẩm trong lô sản phẩm kiểm tra, ta có
X ∼ ℬ(1000; 0, 95). Với n = 1000, p = 0, 95, ta có np = 950 và np(1 − p) = 47, 5 đủ lớn nên ta
xấp xỉ bởi X ∼ 𝒩 (950; 47, 5):
960 + 0, 5 − 950 940 − 0, 5 − 950
P(940 ≤ X ≤ 960) = φ √ −φ √
47, 5 47, 5
= φ(1, 52) − φ(−1, 52) = 2φ(1, 52) = 0, 8716.
2.4.5 Phân phối khi bình phương

Định nghĩa 2.18 (Phân phối khi bình phương). Biến ngẫu nhiên liên tục X được gọi là tuân
theo luật phân phối khi bình phương với n bậc tự do, ký hiệu là X ∼ χ2n , nếu hàm mật độ xác

suất của X có dạng

n2 −1
x
1 x 2
f ( x ) = e− 2 , x>0 (2.42)
2 Γ n2
ở đây
+∞
Z
Γ( x ) = t x−1 e−t dt, x>0
0
là hàm Gamma.
Định nghĩa sau cho cách nhận biết một biến ngẫu nhiên có phân phối khi bình phương
xuất phát từ n biến ngẫu nhiên độc lập có cùng phân phối chuẩn tắc.
Định nghĩa 2.19. Nếu X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập có cùng phân phối chuẩn
tắc 𝒩 (0, 1) thì
Un = X12 + X22 + · · · + Xn2 ∼ χ2n (2.43)
Kỳ vọng và phương sai của biến ngẫu nhiên Un có phân phối khi bình phương:
E(Un ) = n, V (Un ) = 2n (2.44)
Tính chất 2.6. (a) Nếu X1 và X2 là hai biến ngẫu nhiên độc lập có phân phối khi bình
phương với n1 , n2 bậc tự do thì biến ngẫu nhiên X1 + X2 có phân phối khi bình phương
với n1 + n2 bậc tự do.
Un − n
(b) Biến ngẫu nhiên √ có phân phối xấp xỉ phân phối chuẩn tắc 𝒩 (0, 1) khi n đủ lớn.
2n
(c) Một hệ quả quan trọng được dùng nhiều trong thống kê: Nếu X1 , X2 , . . . , Xn là các biến
ngẫu nhiên độc lập có phân phối chuẩn 𝒩 (µ, σ2 ) và
1
X= X1 + X2 + · · · + X n
n
thì n 2
1
σ2 ∑ Xi − X ∼ χ2(n−1) .
i =1
2.4.6 Phân phối Student

Định nghĩa 2.20 (Phân phối Student). Biến ngẫu nhiên liên tục X được gọi là tuân theo luật
phân phối Student với n bậc tự do, ký hiệu là X ∼ 𝒯 n , nếu hàm mật độ xác suất của X có
dạng
!− n+2 1
x2 Γ n +1
2
f (x) = 1+ √ , −∞ < x < +∞ (2.45)
n nπΓ n2
ở đây Γ( x ) là hàm Gamma.

Để nhận biết một biến ngẫu nhiên có phân phối Student ta sử dụng định nghĩa sau.
Định nghĩa 2.21. Nếu X và Y là hai biến ngẫu nhiên độc lập tuân theo luật 𝒩 (0, 1) và χ2n
tương ứng thì
X
Tn = » ∼ 𝒯 n (2.46)
Y
n
Kỳ vọng và phương sai của biến ngẫu nhiên Tn có phân phối Student:
n
E( Tn ) = 0, n > 1, V ( Tn ) = , n>2 (2.47)
n−2
Tính chất 2.7. Biến ngẫu nhiên Tn có phân phối xấp xỉ phân phối chuẩn tắc 𝒩 (0, 1) khi n đủ
lớn.
Nhận xét 2.14. (a) Phân phối Student có cùng dạng và tính đối xứng như phân phối chuẩn
nhưng nó phản ánh tính biến đổi của phân phối sâu sắc hơn. Phân phối chuẩn không
thể dùng để xấp xỉ phân phối khi mẫu có kích thước nhỏ. Trong trường hợp này ta dùng
phân phối Student.
(b) Khi bậc tự do n tăng lên (n ≥ 30) thì phân phối Student tiến nhanh về phân phối chuẩn.
Do đó khi n ≥ 30 ta có thể dùng phân phối chuẩn thay thế cho phân phối Student.

Chương 3
Biến ngẫu nhiên nhiều chiều
TUẦN 9
3.1 Khái niệm và phân loại biến ngẫu nhiên nhiều chiều
3.1.1 Khái niệm

Một biến ngẫu nhiên n chiều (véc-tơ ngẫu nhiên n chiều) là một bộ có thứ tự ( X1 , X2 , . . . , Xn )
với các thành phần X1 , X2 , . . . , Xn là n biến ngẫu nhiên xác định trong cùng một phép thử.
Ký hiệu biến ngẫu nhiên hai chiều là ( X, Y ), trong đó X là biến ngẫu nhiên thành phần
thứ nhất và Y là biến ngẫu nhiên thành phần thứ hai.
3.1.2 Phân loại

Biến ngẫu nhiên n chiều ( X1 , X2 , . . . , Xn ) là liên tục hay rời rạc nếu tất cả các biến ngẫu nhiên
thành phần X1 , X2 , . . . , Xn là liên tục hay rời rạc.
Để cho đơn giản, ta nghiên cứu biến ngẫu nhiên hai chiều ( X, Y ), trong đó X, Y là các biến
ngẫu nhiên một chiều. Hầu hết các kết quả thu được đều có thể mở rộng cho trường hợp biến
ngẫu nhiên n chiều.
Trong chương này ta không xét trường hợp biến ngẫu nhiên hai chiều có một biến ngẫu
nhiên rời rạc và một biến ngẫu nhiên liên tục.
70
3.2 Bảng phân phối xác suất của biến ngẫu nhiên hai chiều
rời rạc
3.2.1 Bảng phân phối xác suất đồng thời

Định nghĩa 3.1 (Hàm khối lượng xác suất đồng thời). Hàm khối lượng xác suất đồng thời của
biến ngẫu nhiên hai chiều rời rạc ( X, Y ) là
PXY ( x, y) = P( X = x, Y = y) (3.1)
Định nghĩa 3.2 (Bảng phân phối xác suất đồng thời). Bảng phân phối xác suất đồng thời của
biến ngẫu nhiên hai chiều rời rạc ( X, Y ) là
H
HH Y
H
HH y1 ... yj ... yn ∑
X HH j
x1 p11 ... p1j ... p1n P ( X = x1 )

.. .. .. .. .. .. ..
. . . . . . .
xi pi1 ... pij ... pin P ( X = xi )
.. .. .. .. .. .. ..
. . . . . . .
xm pm1 ... pmj ... pmn P( X = xm )
∑ P (Y = y 1 ) ... P (Y = y j ) ... P (Y = y n ) 1
i
trong đó xi , i = 1, . . . , m, y j , j = 1, . . . , n là các giá trị có thể có của các thành phần X, Y tương
ứng; pij là hàm khối lượng xác suất đồng thời của biến ngẫu nhiên hai chiều rời rạc ( X, Y ) xác
định bởi
pij = P( X = xi , Y = y j ), i = 1, . . . , m; j = 1, . . . , n (3.2)
Bảng này có thể ra vô hạn nếu m, n nhận giá trị ∞.

Hàm khối lượng xác suất đồng thời PXY ( xi , y j ) có tính chất sau.
Tính chất 3.1. (a) 0 ≤ pij ≤ 1 với mọi i = 1, . . . , m, j = 1, . . . , n.
(b) ∑im=1 ∑nj=1 pij = 1.
Định nghĩa 3.3 (Biến ngẫu nhiên độc lập). Biến ngẫu nhiên hai chiều rời rạc ( X, Y ), trong đó
X nhận các giá trị x1 , x2 , . . . , xm , Y nhận các giá trị y1 , y2 , . . . , yn , với hàm khối lượng xác suất
đồng thời (3.2), là độc lập nếu
P ( X = x i , Y = y j ) = P ( X = x i ) P (Y = y j ) ∀i = 1, . . . , m; j = 1, . . . , n (3.3)
Ví dụ 3.1. Lấy ngẫu nhiên 3 viên bi từ một hộp gồm 3 bi đỏ, 5 bi xanh và 4 bi vàng. Gọi X,
Y lần lượt là số bi xanh, bi vàng trong 3 bi lấy ra. Lập bảng phân phối xác suất đồng thời cho
biến ngẫu nhiên hai chiều ( X, Y ).
3.2. Bảng phân phối xác suất của biến ngẫu nhiên hai chiều rời rạc 71
Lời giải: Bảng phân phối xác suất cần tìm là

HH
Y
0 1 2 3 P( X = i)
HH
H
X HH
H
0 1/220 12/220 18/220 4/220 35/220
1 15/220 60/220 30/220 0 105/220
2 30/220 40/220 0 0 70/220
3 10/220 0 0 0 10/220
P (Y = j ) 56/220 112/220 48/220 4/220 1
3.2.2 Bảng phân phối xác suất thành phần (biên)

Định lý 3.1. Nếu biến ngẫu nhiên hai chiều rời rạc ( X, Y ) có hàm khối lượng xác suất đồng
thời PXY ( x, y), thì hàm khối lượng xác suất biên được xác định bởi
PX ( x ) = ∑ PXY ( x, y), PY (y) = ∑ PXY ( x, y) (3.4)

y∈SY x ∈S X
Chú ý 3.1. Từ Định nghĩa 3.2 ta suy ra:
(a) Bảng phân phối xác suất của biến ngẫu nhiên thành phần X:
X x1 x2 ... xm
P P ( X = x1 ) P ( X = x2 ) ... P( X = xm )
trong đó P( X = xi ) = ∑nj=1 pij , i = 1, . . . , m.
(b) Bảng phân phối xác suất của biến ngẫu nhiên thành phần Y:
Y y1 y2 ... yn
P P (Y = y 1 ) P (Y = y 2 ) ... P (Y = y n )
trong đó P(Y = y j ) = ∑im=1 pij , j = 1, . . . , n.
Nhận xét 3.1. Từ các bảng phân phối thành phần ta có thể dễ dàng xác định các tham số đặc
trưng của các biến ngẫu nhiên thành phần X và Y.
Ví dụ 3.2. Cho biến ngẫu nhiên hai chiều rời rạc ( X, Y ) có bảng phân phối xác suất đồng thời
như sau
H
HH Y
H
HH 1 2 3
X HH
1 0,12 0,15 0,03
2 0,28 0,35 0,07
(a) Lập bảng phân phối xác suất của X và Y.
(b) Chứng minh rằng X và Y độc lập.
(c) Tìm quy luật phân phối xác suất của biến ngẫu nhiên Z = XY.
(d) Tính E( Z ) bằng hai cách và kiểm tra E( Z ) = E( X ) E(Y ).
Lời giải:
(a) Bảng phân phối xác suất của X và Y là:
X 1 2 Y 1 2 3
P 0,3 0,7 P 0,4 0,5 0,1
(b) Từ đầu bài và ý (a) ta kiểm tra được
P ( X = x i , Y = y j ) = P ( X = x i ) P (Y = y j ) , ∀i = 1, 2; j = 1, 2, 3
nên X, Y độc lập.
(c) Quy luật phân phối xác suất của Z = XY là:
Z 1 2 3 4 6
P 0,12 0,43 0,03 0,35 0,07
(d) Tính E( Z ) = E( XY ) = E( X ) × E(Y ) = 1, 7 × 1, 7 = 2, 89 vì X, Y độc lập, trong đó

E( X ) = 1 × 0, 3 + 2 × 0, 7 = 1, 7, E(Y ) = 1 × 0, 4 + 2 × 0, 5 + 3 × 0, 1 = 1, 7.
Hoặc E( Z ) = 1 × 0, 12 + 2 × 0, 43 + 3 × 0, 03 + 4 × 0, 35 + 6 × 0, 07 = 2, 89.
Ví dụ 3.3. Từ kết quả phân tích các số liệu thống kê trong tháng về doanh số bán hàng ( X ) và
chi phí cho quảng cáo (Y ) (đơn vị triệu đồng) của một công ty, thu được bảng phân phối xác
suất đồng thời như sau:
HH
X
100 200 300
H
HH
Y H
HH
1 0, 15 0, 1 0, 14
1, 5 0, 05 0, 2 0, 15
2 0, 01 0, 05 0, 15
(a) Tính giá trị trung bình và phương sai của doanh số bán hàng.
(b) Tính giá trị trung bình và phương sai của chi phí cho quảng cáo.
Lời giải: Lập bảng phân phối xác suất của X và Y:
X 100 200 300 Y 1 1,5 2

P 0,21 0,35 0,44 P 0,39 0,4 0,21
(a) Trung bình và phương sai của doanh số bán hàng là E( X ) và V ( X ):
E( X ) = 100 × 0, 21 + 200 × 0, 35 + 300 × 0, 44 = 223

E( X 2 ) = 1002 × 0, 21 + 2002 × 0, 35 + 3002 × 0, 44 = 55700
V ( X ) = E( X 2 ) − [ E( X )]2 = 55700 − (233)2 = 1411.
(b) Trung bình và phương sai của chi phí cho quảng cáo là E(Y ) và V (Y ):
E(Y ) = 1 × 0, 39 + 1, 5 × 0, 4 + 2 × 0, 21 = 1, 41
E(Y 2 ) = 12 × 0, 39 + 1, 52 × 0, 4 + 22 × 0, 21 = 2, 13
V (Y ) = E(Y 2 ) − [ E(Y )]2 = 2, 13 − (1, 41)2 = 0, 2419.
3.2.3 Phân phối có điều kiện

Từ Định nghĩa 3.2 ta suy ra:
(a) Bảng phân phối xác suất của X với điều kiện (Y = y j ):
X |(Y = y j ) x1 x2 ... xm
P p ( x1 | y j ) p ( x2 | y j ) ... p( xm |y j )
trong đó p( xi |y j ) = P[( X = xi )|(Y = y j )], i = 1, . . . , m; j = 1, . . . , n.
(b) Bảng phân phối xác suất của Y với điều kiện ( X = xi ):
Y |( X = xi ) y1 y2 ... yn
P p ( y1 | x i ) p ( y2 | x i ) ... p ( y n | xi )
trong đó p(y j | xi ) = P[(Y = y j )|( X = xi )], i = 1, . . . , m; j = 1, . . . , n.
Nhận xét 3.2. (a) Từ bảng phân phối xác suất có điều kiện ta có thể tính được kỳ vọng (có
điều kiện) của từng biến ngẫu nhiên.
(b) Các xác suất có điều kiện được tính như thông thường, tức là
P ( X = xi , Y = y j )
P X = x i |Y = y j = hoặc
P (Y = y j )
P ( X = xi , Y ∈ D )
P ( X = x i |Y ∈ D ) =
P (Y ∈ D )
và
P (Y = y j , X = x i )
P Y = y j | X = xi = hoặc
P ( X = xi )
P (Y = y j , X ∈ D )
P Y = yj |X ∈ D = .
P( X ∈ D )
Ví dụ 3.4. Với giả thiết của Ví dụ 3.3,
(a) Nếu chi phí cho quảng cáo 1,5 triệu đồng thì doanh số trung bình là bao nhiêu?
(b) Nếu muốn doanh số là 300 triệu đồng thì trung bình phải chi phí cho quảng cáo bao
nhiêu?
Lời giải: Các bảng phân phối xác suất có điều kiện là:
X |(Y = 1, 5) 100 200 300 Y |( X = 300) 1 1,5 2

14 15 15
P 0,125 0,5 0,375 P 44 44 44
(a) Nếu chỉ chi phí cho quảng cáo 1,5 triệu đồng thì doanh số trung bình là
E( X |(Y = 1, 5)) = 100 × 0, 125 + 200 × 0, 5 + 300 × 0, 375 = 225.
(b) Nếu muốn doanh số là 300 triệu đồng thì trung bình phải chi phí cho quảng cáo là
14 15 15
E(Y |( X = 300)) = 1 × + 1, 5 × +2× ≃ 1, 5136.
44 44 44
3.3 Hàm phân phối xác suất
3.3.1 Hàm phân phối xác suất đồng thời

Định nghĩa 3.4 (Hàm phân phối đồng thời). Hàm hai biến FXY ( x, y) xác định bởi:
FXY ( x, y) = P( X < x, Y < y), x, y ∈ R (3.5)
được gọi là hàm phân phối xác suất của biến ngẫu nhiên hai chiều ( X, Y ) và còn được gọi là
hàm phân phối xác suất đồng thời của các biến ngẫu nhiên X và Y.
Từ (3.5) và Định nghĩa 3.2, hàm phân phối xác suất đồng thời của biến ngẫu nhiên 2 chiều
rời rạc ( X, Y ) được xác định bởi
FXY ( x, y) = ∑ ∑ P ( X = xi , Y = y j ) (3.6)
xi < x y j < y
Ví dụ 3.5. Cho bảng phân phối xác suất đồng thời của biến ngẫu nhiên hai chiều ( X, Y ):
HH
Y
1 2 3
H
HH
X H
HH
1 0, 10 0, 25 0, 10
2 0, 15 0, 05 0, 35
Tính F (2; 3).
3.3. Hàm phân phối xác suất 75

Lời giải: Ta có F (2, 3) = ∑ ∑ P( X = xi , Y = y j ) = p11 + p12 = 0, 35.

x i <2 y j <3
Sau đây là một số tính chất của hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên
X và Y.
Tính chất 3.2. (a) 0 ≤ FXY ( x, y) ≤ 1.
(b) Nếu x < x1 , y < y1 thì FXY ( x, y) ≤ FXY ( x1 , y1 ).
(c) FXY (−∞, y) = FXY ( x, −∞) = 0; FXY (+∞, +∞) = 1 (giá trị ∞ hiểu theo nghĩa lấy giới
hạn).
(d) Với x1 < x2 , y1 < y2 ta luôn có
P( x1 ≤ X < x2 , y1 ≤ Y < y2 ) = FXY ( x2 , y2 ) − FXY ( x2 , y1 ) − FXY ( x1 , y2 ) + FXY ( x1 , y1 ).
3.3.2 Hàm phân phối xác suất thành phần (biên)

Các hàm
FX ( x ) = P( X < x ) = P( X < x, Y < +∞) = lim FXY ( x, y) = FXY ( x, +∞),

y→+∞
FY (y) = P(Y < y) = P( X < +∞, Y < y) = lim FXY ( x, y) = FXY (+∞, y)
x →+∞
gọi là các phân phối biên của biến ngẫu nhiên hai chiều ( X, Y ). Đây cũng chính là các phân
phối (một chiều) thông thường của X và Y tương ứng.
Định nghĩa 3.5 (Biến ngẫu nhiên độc lập). Hai biến ngẫu nhiên X và Y được gọi là độc lập
nếu
FXY ( x, y) = FX ( x ) FY (y), x, y ∈ R (3.7)
trong đó FX ( x ), FY (y) lần lượt là hàm phân phối xác suất của X và Y.
3.4 Hàm mật độ xác suất của biến ngẫu nhiên hai chiều liên
tục
3.4.1 Hàm mật độ xác suất đồng thời

Định nghĩa 3.6 (Hàm mật độ đồng thời). Giả sử hàm phân phối xác suất (đồng thời) của biến
ngẫu nhiên hai chiều liên tục ( X, Y ) là FXY ( x, y). Khi đó, hàm mật độ xác suất của biến ngẫu
nhiên hai chiều liên tục ( X, Y ) là hàm hai biến f XY ( x, y) ≥ 0 thỏa mãn:
Zx Zy
FXY ( x, y) = f XY (u, v)dudv (3.8)
−∞ −∞
f XY ( x, y) còn được gọi là hàm mật độ xác suất đồng thời của biến ngẫu nhiên hai chiều ( X, Y ).
3.4. Hàm mật độ xác suất của biến ngẫu nhiên hai chiều liên tục 76
Nhận xét 3.3. Về mặt hình học, hàm f X,Y ( x, y) có thể xem như là một mặt cong trong R3 và
được gọi là mặt phân phối xác suất.
Hàm mật độ xác suất của biến ngẫu nhiên hai chiều ( X, Y ) có các tính chất sau.
Tính chất 3.3. (a) f XY ( x, y) ≥ 0 với mọi ( x, y) ∈ R2 .

+∞ Z
Z +∞
(b) f XY ( x, y)dxdy = 1.
−∞ −∞
Z Z
(c) P ( X, Y ) ∈ D = f XY ( x, y)dxdy, với D ⊂ R2 , SXY là miền giá trị của biến
D ∩SXY
ngẫu nhiên hai chiều ( X, Y ).
∂2 FXY ( x, y)
(d) Nếu f XY ( x, y) liên tục theo cả hai biến thì f XY ( x, y) = .
∂x∂y
Ví dụ 3.6. Biến ngẫu nhiên liên tục X và Y có hàm mật độ xác suất đồng thời là

k, 0 ≤ x ≤ 5, 0 ≤ y ≤ 3,
f XY ( x, y) =
0, trái lại.
Hãy tìm hằng số k và tính P(2 ≤ X < 3, 1 ≤ Y < 3).
Lời giải: Sử dụng Tính chất 3.3(a),(b), ta có k ≥ 0 và

Z5 Z3
1= kdydx = 15k.
0 0
Suy ra, k = 1/15.

Sử dụng Tính chất 3.3(c) suy ra
Z3 Z3
1
P(2 ≤ X < 3, 1 ≤ Y < 3) = dxdy = 2/15.
15
2 1
Ví dụ 3.7 (Đề thi cuối kỳ 20183). Cho biến ngẫu nhiên hai chiều liên tục ( X, Y ) có hàm mật
độ xác suất là

kx2 , nếu − 1 ≤ x ≤ 1, 0 ≤ y ≤ x2 ,
f X,Y ( x, y) =
0, nếu trái lại.
(a) Tìm k.
1
(b) Tính P Y ≤ .
4
Lời giải: (a) Sử dụng Tính chất 3.3(a),(b) ta suy ra k = 5/2.
(b) Sử dụng Tính chất 3.3(c) ta tính
2
1/2 Zx Z1 1/4
1 5 2 5 2 i 19
h Z Z
P Y≤ =2 dx x dy + dx x dy = ≃ 0, 3958.
4 2 2 48
0 0 1/2 0
3.4.2 Hàm mật độ xác suất biên

Định lý 3.2. Nếu X và Y là hai biến ngẫu nhiên liên tục có hàm mật độ xác suất đồng thời
f XY ( x, y) thì hàm mật độ biên của biến ngẫu nhiên hai chiều ( X, Y ) được xác định bởi
+∞
Z +∞
Z
f X (x) = f XY ( x, y)dy, f Y (y) = f XY ( x, y)dx (3.9)
−∞ −∞
Định nghĩa 3.7 (Biến ngẫu nhiên độc lập). Giả sử biến ngẫu nhiên hai chiều liên tục ( X, Y ) có
hàm mật độ xác suất đồng thời f XY ( x, y). Khi đó X, Y độc lập nếu
f XY ( x, y) = f X ( x ) f Y (y) (3.10)
trong đó f X ( x ), f Y (y) lần lượt là hàm mật độ xác suất của X và Y.
Ví dụ 3.8. Cho biến ngẫu nhiên hai chiều liên tục ( X, Y ) có hàm mật độ xác suất đồng thời là

kx, nếu 0 < y < x < 1,
f X,Y ( x, y) =
(a) Tìm hằng số k.
(b) Tìm các hàm mật độ xác suất của X và Y.
(c) X và Y có độc lập không?
Lời giải: Ký hiệu 𝒟 = ( x, y) ∈ R2 : 0 < x < 1; 0 < y < x .

O
1 x
Hình 3.1: Miền 𝒟 của Ví dụ 3.8
(a) Theo Tính chất 3.3(a) thì k ≥ 0 và theo Tính chất 3.3(b)
+∞ Z
+∞ Z1 Zx Z1
k
Z
1= f X,Y ( x, y)dxdy = dx kxdy = k x2 dx = .
3
−∞ −∞ 0 0 0

3x, nếu ( x, y) ∈ 𝒟 ,
Suy ra k = 3 và hàm mật độ xác suất đồng thời f X,Y ( x, y) =
(b) Tìm các hàm mật độ biên từ (3.9),

 x
Z
+∞

 
Z  3xdy, 0 < x < 1, 3x2 , 0 < x < 1,

f X (x) = f X,Y ( x, y)dy = 0 =
−∞

 0, trái lại,
 0, trái lại,


Z1
+∞  3xdx, 0 < y < 1,  3 − 3 y2 , 0 < y < 1,

 
Z 
f Y (y) = f X,Y ( x, y)dx = y = 2 2
0, trái lại.
 
−∞


 0, trái lại,
(c) Vì f X,Y ( x, y) ̸= f X ( x ) × f Y (y) với ( x, y) ∈ 𝒟 nên X, Y không độc lập.
3.4.3 Hàm mật độ xác suất có điều kiện

Định lý 3.3. Hàm mật độ có điều kiện của thành phần X biết Y = y là:
f XY ( x, y) f ( x, y)
f X ( x |y) = = Z +∞XY (3.11)
f Y (y)
f ( x, y)dx
−∞
Hàm mật độ có điều kiện của thành phần Y biết X = x là:
f XY ( x, y) f ( x, y)
f Y (y| x ) = = Z +∞XY (3.12)
f X (x)
f ( x, y)dy
−∞
Ví dụ 3.9. Cho biến ngẫu nhiên hai chiều ( X, Y ) có hàm mật độ đồng thời là
1,

nếu 0 < y < x < 1,
f ( x, y) = x
0, nếu trái lại.

(a) Tìm hàm mật độ xác suất biên của X và Y.
(b) Tìm hàm mật độ xác suất có điều kiện f X ( x |y); f Y (y| x ).
Lời giải:
(a) Các hàm mật độ biên của X, Y là:

 x
1
Z
+∞

 
Z 
 dy, 0 < x < 1, 1, 0 < x < 1,
f X (x) = f X,Y ( x, y)dy = 0 x =
 0, trái lại,
−∞

0, trái lại,



Z1
+∞

 1 
Z 
 dx, 0 < y < 1, − ln y, 0 < y < 1,
f Y (y) = f X,Y ( x, y)dx = y x =
−∞



 0, trái lại.
 0, trái lại,
(b) Các hàm mật độ có điều kiện là:


1
f X,Y ( x, y) −
 , 0 < y < x < 1,
f X ( x |y) = = x ln y
f Y (y)
0, trái lại.


 1 , 0 < y < x < 1,


f X,Y ( x, y)
f Y (y| x ) = = x
f X (x) 
0, trái lại.
3.5 Tính độc lập của các biến ngẫu nhiên

Một số dấu hiệu nhận biết tính độc lập của hai biến ngẫu nhiên X và Y dựa trên tính chất của
hàm phân phối xác suất đồng thời, hàm khối lượng xác suất đồng thời, hàm mật độ xác suất
đồng thời như trong Định nghĩa 3.3, 3.5 và 3.7 với các công thức (3.3), (3.7) và (3.10) tương
ứng.
TUẦN 10
3.6 Đặc trưng của biến ngẫu nhiên hai chiều
3.6.1 Kỳ vọng, phương sai của biến ngẫu nhiên thành phần
Định nghĩa 3.8 (Kỳ vọng. Phương sai). (a) Nếu ( X, Y ) là biến ngẫu nhiên hai chiều rời rạc
có bảng phân phối xác suất đồng thời như trong Định nghĩa 3.2 thì
E( X ) = ∑ xi P(X = xi ) = ∑ ∑ xi pij ; E (Y ) = ∑ y j P(Y = y j ) = ∑ ∑ y j pij (3.13)

i i j j j i
∑ ∑ xi2 pij − (E(X )) ∑ ∑ y2j pij − (E(Y ))

2 2
V (X) = ; V (Y ) = . (3.14)
i j j i
3.5. Tính độc lập của các biến ngẫu nhiên 80

(b) Nếu ( X, Y ) là biến ngẫu nhiên hai chiều liên tục có hàm mật độ xác suất đồng thời
f XY ( x, y) thì
+∞ Z
Z +∞ +∞ Z
Z +∞
E( X ) = x f XY ( x, y)dxdy; E (Y ) = y f XY ( x, y)dxdy (3.15)
−∞ −∞ −∞ −∞
+∞ Z
Z +∞ +∞ Z
Z +∞
V (X) = x2 f XY ( x, y)dxdy − ( E( X ))2 ; V (Y ) = y2 f XY ( x, y)dxdy − ( E(Y ))2 .
−∞ −∞ −∞ −∞
(3.16)
3.6.2 Hiệp phương sai

Định nghĩa 3.9 (Hiệp phương sai). Cho biến ngẫu nhiên hai chiều ( X, Y ), hiệp phương sai
của hai thành phần X và Y, ký hiệu là cov( X, Y ) được xác định bởi
cov( X, Y ) = E [( X − E( X ))(Y − E(Y ))] (3.17)
Từ tính chất của kỳ vọng ta nhận được
cov( X, Y ) = E( XY ) − E( X ).E(Y ) (3.18)
trong đó E( XY ) được xác định theo công thức




 ∑ ∑ xi y j pij , (nếu ( X, Y ) rời rạc)
i j

E( XY ) = Z+∞ Z+∞
xy f XY ( x, y)dxdy, (nếu ( X, Y ) liên tục).





−∞ −∞
Tính chất 3.4. (a) cov( X, Y ) = cov(Y, X ).
(b) V ( X ) = cov( X, X ), V (Y ) = cov(Y, Y ).
(c) Nếu X, Y độc lập thì cov(Y, X ) = 0, điều ngược lại chưa chắc đã đúng.
(d) cov( aX, Y ) = acov( X, Y ).
(e) cov( X + Z, Y ) = cov( X, Y ) + cov( Z, Y ).
(f) cov ∑in=1 Xi , Y = ∑in=1 cov( Xi , Y ).

Nhận xét 3.4. Hiệp phương sai được dùng làm độ đo quan hệ giữa hai biến X và Y:
(a) cov( X, Y ) > 0 cho thấy xu thế Y tăng khi X tăng.
(b) cov( X, Y ) < 0 cho thấy xu thế Y giảm khi X tăng.
Ví dụ 3.10. Cho biến ngẫu nhiên hai chiều ( X, Y ) có bảng phân phối xác suất đồng thời là
3.6. Đặc trưng của biến ngẫu nhiên hai chiều 81

HH
Y
-1 0 1
H
HH
X H
HH
-1 4/15 1/15 4/15
0 1/15 2/15 1/15
1 0 2/15 0
(a) Tìm E( X ), E(Y ), cov( X, Y ).
(b) X và Y có độc lập không?
(c) Tìm bảng phân phối xác suất của X và Y.
Lời giải:
(a) Ta có
9 4 2 7
E( X ) = (−1) × +0× +1× =− .
15 15 15 15
5 5 5
E(Y ) = (−1) × +0× +1× = 0.
15 15 15
4 4
E( XY ) = (−1) × (−1) × + (−1) × (1) × + 1 × (−1) × 0 + 1 × 1 × 0 = 0.
15 15
Suy ra cov( X, Y ) = E( XY ) − E( X ) × E(Y ) = 0.
(b) Dễ kiểm tra được P( X = −1, Y = −1) ̸= P( X = −1) × P(Y = −1) nên X, Y không độc
lập.
(c) Bảng phân phối xác suất của X, Y:
X -1 0 1 Y -1 0 1
P 9/15 4/15 5/15 P 5/15 5/15 5/15
Định nghĩa 3.10 (Ma trận hiệp phương sai). Ma trận hiệp phương sai của biến ngẫu nhiên
hai chiều ( X, Y ) được xác định bởi
" # " #
cov( X, X ) cov( X, Y ) V (X) cov( X, Y )
Γ= =
cov(Y, X ) cov(Y, Y ) cov( X, Y ) V (Y )
Tính chất 3.5. (a) Ma trận hiệp phương sai là ma trận đối xứng.
(b) Ma trận hiệp phương sai là ma trận của dạng toàn phương không âm.
Nhận xét 3.5. Hiệp phương sai có hạn chế cơ bản là khó xác định được miền biến thiên, nó
thay đổi từ cặp biến thiên này sang cặp biến thiên khác. Chưa kể về mặt vật lý nó có đơn vị
đo bằng bình phương đơn vị đo của biến ngẫu nhiên X, Y (nếu chúng cùng đơn vị đo). Vì thế
cần đưa ra một số đặc trưng khác để khắc phục hạn chế này, đó là "hệ số tương quan".

3.6.3 Hệ số tương quan

Định nghĩa 3.11 (Hệ số tương quan). Hệ số tương quan của hai biến ngẫu nhiên X và Y, ký
hiệu là ρ XY , được xác định như sau:
cov( X, Y ) cov( X, Y )
ρ XY = p = (3.19)
V ( X ).V (Y ) σ ( X ) σ (Y )
Tính chất 3.6. (a) |ρ XY | ≤ 1.
(b) Nếu ρ XY = ±1 ta nói hai biến ngẫu nhiên X và Y có quan hệ tuyến tính (tức là tồn tại a
và b sao cho Y = aX + b).
(c) Nếu ρ XY = 0 ta nói hai biến ngẫu nhiên X và Y là không tương quan.
Nói chung 0 < |ρ XY | < 1, trong trường hợp này ta nói hai biến X và Y tương quan với
nhau. Chú ý rằng, hai biến tương quan thì phụ thuộc (không độc lập), nhưng không
tương quan thì chưa chắc độc lập.
Nhận xét 3.6. Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa X và Y. Khi |ρ XY | càng
gần 1 thì tính chất tương quan tuyến tính càng chặt. Khi |ρ XY | càng gần 0 thì sự phụ thuộc
tuyến tính càng ít, càng lỏng lẻo. Khi ρ XY = 0 ta nói X và Y không tương quan. Như vậy hai
biến ngẫu nhiên độc lập thì không tương quan, nhưng ngược lại chưa chắc đúng.
Ví dụ 3.11. Cho biến ngẫu nhiên hai chiều rời rạc ( X, Y ) có bảng phân bố xác suất đồng thời
là
HH
Y
1 2 3
HH
H
X HH
H
1 0,17 0,13 0,25
2 0,10 0,30 0,05
(a) Lập bảng phân phối xác suất của X, Y.
(b) Lập ma trận Covarian của X, Y.
(c) Tìm hệ số tương quan.
Lời giải:
(a) Bảng phân phối xác suất của X và Y:
X 1 2 Y 1 2 3
P 0,55 0,45 P 0,27 0,43 0,3

(b) Từ các bảng phân phối xác suất của X, Y ta có
E( X ) = 1 × 0, 55 + 2 × 0, 45 = 1, 45; V ( X ) = 1 × 0, 55 + 4 × 0, 45 − (1, 45)2 = 0, 2475.

E(Y ) = 2, 03; V (Y ) = 0, 5691.
E( XY ) = 2, 88 =⇒ cov( X, Y ) = E( XY ) − E( X ) × E(Y ) = −0, 0635.
Vậy ma trận hiệp phương sai

! !
V (X) cov( X, Y ) 0, 2475 −0, 0635
Γ= =
cov(Y, X ) V (Y ) −0, 0635 0, 5691
cov( X, Y )
(c) Hệ số tương quan ρ XY = p = −0, 1692.
V ( X ) × V (Y )
3.7 Hàm của hai biến ngẫu nhiên

Xét biến ngẫu nhiên Z = g( X, Y ), trong đó ( X, Y ) là biến ngẫu nhiên hai chiều đã biết luật
phân phối.
Định nghĩa 3.12 (Kỳ vọng). Nếu biến ngẫu nhiên hai chiều ( X, Y ) có phân phối đã biết và ta
xác định một biến mới Z = g( X, Y ) (g là hàm đo được) thì
E( Z ) = E [ g( X, Y )] = ∑ ∑ g ( xi , y j ) P ( xi , y j ) (nếu ( X, Y ) rời rạc) (3.20)

i j
+∞ Z
Z +∞
= g( x, y) f XY ( x, y)dxdy (nếu ( X, Y ) liên tục). (3.21)
−∞ −∞
Đặc biệt, khi g = X thay vào các công thức trên ta sẽ có E( X ).
Bây giờ ta sẽ xét luật phân phối xác suất của Z trong một số trường hợp đơn giản theo cách
sau:
FZ (z) = P( Z < z) = P ( g( X, Y ) < z) = P (( X, Y ) ∈ 𝒟) (3.22)
trong đó 𝒟 = {( x, y)| g( x, y) < z}.
Ví dụ 3.12. Hai người bạn hẹn gặp nhau ở công viên trong khoảng thời gian từ 17h đến 18h.
Họ hẹn nhau nếu người nào đến trước thì sẽ đợi người kia trong vòng 10 phút. Sau 10 phút
đợi nếu không gặp sẽ về. Thời điểm đến của hai người là ngẫu nhiên và độc lập với nhau
trong khoảng thời gian trên. Tính xác suất hai người gặp được nhau.
Lời giải: Quy gốc thời gian về lúc 17h. Gọi X, Y là biến ngẫu nhiên chỉ thời điểm người A, B
đến, ta có X, Y ∼ 𝒰 (0; 60). Do X, Y độc lập nên chúng có hàm mật độ đồng thời
 1 , ( x, y) ∈ [0, 60]2 ,

f X,Y ( x, y) = 3600
0, ngược lại.

3.7. Hàm của hai biến ngẫu nhiên 84

Gọi Z là biến ngẫu nhiên chỉ khoảng thời gian giữa thời điểm đến của hai người. Ta có Z =
| X − Y |. Khi đó, xác suất hai người gặp nhau là
P( Z < 10) = P (| X − Y | < 10) = P (( X, Y ) ∈ 𝒟) ,
trong đó 𝒟 là giao của miền | X − Y | < 10 và hình vuông [0, 60]2 . Vậy
S𝒟 1100 11
P( Z < 10) = = = .
3600 3600 36
Ví dụ 3.13. Cho X, Y là 2 biến ngẫu nhiên độc lập với nhau có cùng phân phối đều trên [0, 2].
(a) Tìm hàm phân phối của các biến ngẫu nhiên Z = X + Y, T = XY, U = X − Y.
(b) Tính P(−1 ≤ Y − X ≤ 1)
Lời giải: Vì X và Y độc lập nên ta có hàm mật độ đồng thời của ( X, Y ) là
 1 , ( x, y) ∈ 𝒟 ,

f X,Y ( x, y) = 4
0, trái lại,

trong đó 𝒟 := {0 ≤ x ≤ 2; 0 ≤ y ≤ 2}.
(a1) Vì Z = X + Y nên 0 ≤ Z ≤ 4. Hàm phân phối xác suất của Z:
1
ZZ ZZ
FZ (z) = P ( X + Y < z) = f X,Y ( x, y)dxdy = dxdy.
4
{ x +y<z}∩𝒟 { x +y<z}∩𝒟
Nếu z ≤ 0 thì FZ (z) = 0.
1 z2 z2
Z z Z z− x
1
Nếu 0 < z ≤ 2 thì FZ (z) = 4 dy dx = × = .
0 0 4 2 8
Nếu 2 < z ≤ 4 thì
Z2 Z2 Z2
1 1 1 2
F (z) = dy dx = (2 − z + x )dx = z − 8z + 16 .
4 4 8
z −2 z− x z −2
1
ZZ
Nếu z > 4 thì FZ (z) = dxdy = 1. Vậy
4
𝒟



 0, nếu z ≤ 0,
2

z ,


nếu 0 < z ≤ 2,

FZ (z) = 8
1
 (z2 − 8z + 16), nếu 2 < z ≤ 4,




 8

1, nếu z > 4.

(a2) Do T = XY nên ta có 0 ≤ T ≤ 4. Hàm phân phối của T được xác định như sau:
Nếu t ≤ 0, FT (t) = 0.
Z t/2 Z 2 Z 2 Z t/x
1 1 t
Nếu 0 < t ≤ 4, FT (t) = dx dy + dx dy = t + t ln 2 − t ln .
4 0 0 t/2 0 4 2
Nếu t > 4, FT (t) = 1. Vậy





 0, nếu t ≤ 0,
1 t

FT (t) = t + t ln 2 − t ln , nếu 0 < t ≤ 4,


 4 2
1, nếu t > 4.

(a3) Do U = X − Y nên ta có −2 ≤ U ≤ 2. Từ đó hàm phân phối của U được xác định như
sau:
Nếu u ≤ −2, FU (u) = 0.

Z u +2 Z 2
1 1 1 1
Nếu −2 < u ≤ 0, FU (u) = dx × (2 + u )2 = (2 + u )2 .
dy =
4 0 x −u 4 2 8
u2

1 1 2 1
Nếu 0 < u ≤ 2 thì FU (u) = 4 − (2 − u ) = − + 2u + 2 .
4 2 4 2
Nếu u > 2, FU (u) = 1. Vậy




 0, nếu u ≤ −2,

1

 (2 + u )2 ,
 nếu − 2 < u ≤ 0,
FU (u) = 81
 (−u2 + 4u + 4),
 nếu 0 < u ≤ 2,
8





1, nếu u > 2.

1 1 3
(b) P (−1 ≤ Y − X ≤ 1) = P ( X − 1 ≤ Y ≤ X + 1) = 4−2× = .
4 2 4
Ví dụ 3.14 (Đề thi cuối kỳ 20191). Cho U và V là hai biến ngẫu nhiên liên tục, độc lập với
nhau và có cùng phân phối đều trên [10; 30].
(a) Tìm hàm mật độ xác suất đồng thời f U,V (u, v) của biến ngẫu nhiên hai chiều (U, V ).
(b) Tính P(|U − V | < 10).
Lời giải:

(a) Vì U, V là hai biến ngẫu nhiên liên tục, có phân phối đều trên [10; 30] nên
1, 1,
 
u ∈ [10; 30], v ∈ [10; 30],
f U (u) = 20 f V (v) = 20
0, u∈
/ [10; 30], 0, v∈
/ [10; 30].
 
 1 ,

(u, v) ∈ [10; 20]2 ,
Mặt khác vì U và V độc lập nên f U,V (u, v) = 400
0, / [10; 20]2 .
(u, v) ∈

Z Z
(b) P(|U − V | < 10) = f U,V (u, v)dudv với D = {(u, v) ∈ R2 : |u − v| < 10}. Sử
D ∩SU,V
1 3
dụng tính chất của tích phân hai lớp suy ra P(|U − V | < 10) = (202 − 102 ) = =
400 4
0, 75.
3.8 Luật số lớn và định lý giới hạn trung tâm
3.8.1 Luật số lớn

Bất đẳng thức Trê-bư-sep
Định lý 3.4. Cho Y là biến ngẫu nhiên không âm. Khi đó với e > 0 tùy ý cho trước ta có:
E (Y 2 )
P (Y ≥ e ) < (3.23)
e2
Chứng minh. Ta chứng minh cho trường hợp Y là biến ngẫu nhiên liên tục.
+∞ +∞ +∞ +∞
1 1 1 E (Y 2 )
Z Z Z Z
2 2
P (Y ≥ ε ) = f (y)dy = 2 ε f (y)dy ≤ 2 y f (y)dy ≤ 2 y2 f (y)dy = .
ε ε ε ε2
ε ε ε 0
Dấu bằng không thể đồng thời xảy ra ở cả 2 dấu "=" và "≤" trong biểu thức trên.
Định lý 3.5. Cho X là biến ngẫu nhiên có E( X ) = µ, V ( X ) = σ2 hữu hạn. Khi đó với e > 0
tùy ý cho trước ta có:
σ2
P(| X − µ| ≥ e) < (3.24)
e2
hay tương đương
σ2
P(| X − µ| < e) ≥ 1 − (3.25)
e2
Chứng minh. Ta chứng minh cho trường hợp X là biến ngẫu nhiên liên tục. Ta chỉ cần đặt
Y = | X − µ| và áp dụng Định lý 3.4.
3.8. Luật số lớn và định lý giới hạn trung tâm 87

Luật số lớn Trê-bư-sep

1 n
Áp dụng Định lý (3.5) với X = ∑ X ta có luật số lớn Trê-bư-sep.
n i =1 i
Định lý 3.6. Nếu dãy các biến ngẫu nhiên X1 , X2 , . . . , Xn , . . . độc lập, có kỳ vọng hữu hạn và
phương sai bị chặn đều (V ( Xi ) ≤ C, ∀i = 1, 2, . . . , C là hằng số dương), khi đó với e > 0 tùy
ý cho trước ta có:
1 n 1 n
n i∑
lim P Xi − ∑ E ( Xi ) < e = 1 (3.26)
n→+∞ n i =1
=1
Hệ quả 3.1. Nếu dãy các biến ngẫu nhiên X1 , X2 , . . . , Xn , . . . độc lập, có cùng kỳ vọng hữu
hạn (E( Xi ) = µ, i = 1, 2, . . . ) và phương sai bị chặn đều (V ( Xi ) ≤ C ∀i = 1, 2, . . . , C là hằng
số dương), khi đó với e > 0 tùy ý cho trước ta có:
1 n
n i∑
lim P X i − µ < e =1 (3.27)
n→+∞
=1
Nhận xét 3.7. Kết quả này cho phép ta ước lượng kỳ vọng bằng trung bình cộng các kết quả
đo đạc độc lập của biến ngẫu nhiên có kỳ vọng đó.
Luật số lớn Béc-nu-li
Áp dụng luật số lớn Trê-bư-sep với trường hợp Xi ∼ ℬ(1, p) chính là số lần xảy ra A trong
phép thử thứ i ta có luật số lớn Béc-nu-li.
Định lý 3.7. Giả sử ta có n phép thử Béc–nu–li với P( A) = p và m là số lần xảy ra A trong n
phép thử đó. Khi đó với ε > 0 tùy ý cho trước ta có:
m
lim P −p <e =1 (3.28)
n→+∞ n
Nhận xét 3.8. Với luật số lớn Béc-nu-li ta đã chứng minh được điều thừa nhận trong phần
m
Định nghĩa xác suất theo quan điểm thống kê ở Chương 1: Khi n → +∞ thì → p.
n
3.8.2 Định lý giới hạn trung tâm

Giả sử { Xn } là dãy biến ngẫu nhiên độc lập cùng phân phối với E( Xn ) = µ, V ( Xn ) = σ2 với
1 n
mọi n. Đặt X n = ∑ Xi . Khi đó với n đủ lớn ta có:
n i =1
σ2
X n ∼ 𝒩 µ, (3.29)
n
hay
Xn − µ √
n ∼ 𝒩 (0; 1) (3.30)
σ

Nhận xét 3.9. Ý nghĩa của Định lý giới hạn trung tâm là khi có nhiều nhân tố ngẫu nhiên tác
động (sao cho không có nhân tố nào vượt trội lấn át các nhân tố khác) thì kết quả của chúng
có dạng phân phối tiệm cận chuẩn.

Chương 4
Thống kê. Ước lượng tham số
TUẦN 11
4.1 Lý thuyết mẫu

Thống kê toán là bộ môn toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên có
tính chất số lớn trên cơ sở thu thập và xử lý số liệu thống kê các kết quả quan sát về những
hiện tượng ngẫu nhiên này. Nếu ta thu thập được các số liệu liên quan đến tất cả đối tượng
cần nghiên cứu thì ta có thể biết được đối tượng này (phương pháp toàn bộ). Tuy nhiên trong
thực tế điều đó không thể thực hiện được vì quy mô của các đối tượng cần nghiên cứu quá
lớn hoặc trong quá trình nghiên cứu đối tượng nghiên cứu bị phá hủy. Vì vậy cần lấy mẫu để
nghiên cứu.
Mục này giới thiệu về phương pháp lấy mẫu ngẫu nhiên và các thống kê thường gặp của
mẫu ngẫu nhiên.
4.1.1 Tổng thể và mẫu

Khái niệm tổng thể
Khi nghiên cứu các vấn đề về kinh tế - xã hội, cũng như nhiều vấn đề thuộc các lĩnh vực vật
lý, sinh vật, quân sự . . . thường dẫn đến khảo sát một hay nhiều dấu hiệu (định tính hoặc định
lượng) thể hiện bằng số lượng trên nhiều phần tử. Tập hợp tất cả các phần tử này gọi là tổng
thể hay đám đông (population). Số phần tử trong tổng thể có thể là hữu hạn hoặc vô hạn. Cần
nhấn mạnh rằng ta không nghiên cứu trực tiếp bản thân tổng thể mà chỉ nghiên cứu dấu hiệu
nào đó của nó.
Ký hiệu N là số phần tử của tổng thể; X là dấu hiệu cần khảo sát.
Ví dụ 4.1. (a) Muốn điều tra thu nhập bình quân của các hộ gia đình ở Hà Nội thì tập hợp
cần nghiên cứu là các hộ gia đình ở Hà Nội, dấu hiệu nghiên cứu là thu nhập của từng
hộ gia đình (dấu hiệu định lượng).
96
(b) Một doanh nghiệp muốn nghiên cứu các khách hàng của mình về dấu hiệu định tính có
thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp,
còn dấu hiệu định lượng là số lượng sản phẩm của doanh nghiệp mà khách hàng có nhu
cầu được đáp ứng.
Một số lý do không thể khảo sát toàn bộ tổng thể
(a) Do quy mô của tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu toàn bộ sẽ đòi hỏi
nhiều chi phí về vật chất và thời gian, có thể không kiểm soát được dẫn đến bị chồng
chéo hoặc bỏ sót.
(b) Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên
cứu, do đó không thể tiến hành toàn bộ được.
(c) Có thể trong quá trình điều tra sẽ phá hủy đối tượng nghiên cứu. . .
Do đó thay vì khảo sát tổng thể, ta chỉ cần chọn ra một tập nhỏ để khảo sát và đưa ra quyết
định.
Khái niệm tập mẫu
Tập mẫu (sample) là tập con của tổng thể và có tính chất tương tự như tổng thể. Số phần tử
của tập mẫu được gọi là kích thước mẫu (cỡ mẫu), ký hiệu là n.
Chương 4 và Chương 5 sẽ nghiên cứu tổng thể thông qua mẫu. Nói nghiên cứu tổng thể
có nghĩa là nghiên cứu một hoặc một số đặc trưng nào đó của tổng thể. Khi đó, ta không thể
đem tất cả các phần tử trong tổng thể ra nghiên cứu mà chỉ lấy một số phần tử trong tổng thể
ra nghiên cứu và làm sao qua việc nghiên cứu này có thể kết luận được về một hoặc một số
đặc trưng của tổng thể mà ta quan tâm ban đầu.
Một số cách chọn mẫu cơ bản
Một câu hỏi đặt ra là làm sao chọn được tập mẫu có tính chất tương tự như tổng thể để các
kết luận của tập mẫu có thể dùng cho tổng thể?
Ta sử dụng một trong những cách chọn mẫu sau:
1. Chọn mẫu ngẫu nhiên có hoàn lại: Lấy ngẫu nhiên một phần tử từ tổng thể và khảo sát
nó. Sau đó trả phần tử đó lại tổng thể trước khi lấy một phần tử khác. Tiếp tục như thế
n lần ta thu được một mẫu có hoàn lại gồm n phần tử.
2. Chọn mẫu ngẫu nhiên không hoàn lại: Lấy ngẫu nhiên một phần tử từ tổng thể và khảo
sát nó rồi để qua một bên, không trả lại tổng thể. Sau đó lấy ngẫu nhiên một phần tử
khác, tiếp tục như thế n lần ta thu được một mẫu không hoàn lại gồm n phần tử.
4.1. Lý thuyết mẫu 97

3. Chọn mẫu phân nhóm: Đầu tiên ta chia tập nền thành các nhóm tương đối thuần nhất,
từ mỗi nhóm đó chọn ra một mẫu ngẫu nhiên. Tập hợp tất cả mẫu đó cho ta một mẫu
phân nhóm. Phương pháp này dùng khi trong tập nền có những sai khác lớn. Hạn chế
là phụ thuộc vào việc chia nhóm.
4. Chọn mẫu có suy luận: Dựa trên ý kiến của chuyên gia về đối tượng nghiên cứu để chọn
mẫu.
4.1.2 Mẫu ngẫu nhiên

Biến ngẫu nhiên và quy luật phân phối gốc
Giả sử ta cần nghiên cứu dấu hiệu X của tổng thể có E(X ) = µ và V (X ) = σ2 (µ và σ chưa
biết). Ta có thể mô hình hóa dấu hiệu X bằng một biến ngẫu nhiên. Thật vậy, nếu lấy ngẫu
nhiên từ tổng thể ra một phần tử và gọi X là giá trị của dấu hiệu X đo được trên phần tử lấy
ra thì X là biến ngẫu nhiên có bảng phân phối xác suất là
X x1 x2 ... xn
P P ( X = x1 ) P ( X = x2 ) ... P( X = xn )
Như vậy dấu hiệu X mà ta nghiên cứu được mô hình hóa bởi biến ngẫu nhiên X, còn cơ
cấu của tổng thể theo dấu hiệu X (tập hợp các xác suất) chính là quy luật phân phối xác suất
của X.
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc. Quy luật phân phối xác suất của X là
quy luật phân phối gốc, đồng thời E( X ) = µ, V ( X ) = σ2 .
Các đặc trưng của tổng thể
Xét tổng thể về mặt định lượng: tổng thể được đặc trưng bởi dấu hiệu X được mô hình hóa
bởi biến ngẫu nhiên X. Ta có các tham số đặc trưng sau đây:
(a) Trung bình tổng thể: E( X ) = µ.
(b) Phương sai tổng thể: V ( X ) = σ2 .
(c) Độ lệch chuẩn của tổng thể: σ( X ) = σ.
Xét tổng thể về mặt định tính: tổng thể có kích thước N, trong đó có M phần tử có tính chất
M
A. Khi đó p = gọi là tỷ lệ tính chất A của tổng thể.
N

Khái niệm mẫu ngẫu nhiên
Giả sử tiến hành n phép thử độc lập. Gọi Xi là "giá trị của dấu hiệu X đo lường được trên
phần tử thứ i của mẫu" i = 1, 2, . . . , n. Khi đó, X1 , X2 , . . . , Xn là n biến ngẫu nhiên độc lập có
cùng quy luật phân phối xác suất với X.
Định nghĩa 4.1 (Mẫu ngẫu nhiên). Cho biến ngẫu nhiên X có hàm phân phối xác suất FX ( x ).
Một mẫu ngẫu nhiên cỡ n được thành lập từ biến ngẫu nhiên X là n biến ngẫu nhiên độc lập
có cùng quy luật phân phối xác suất FX ( x ) với biến ngẫu nhiên X.
Ký hiệu mẫu ngẫu nhiên: WX = ( X1 , X2 , . . . , Xn ).

Thực hiện một phép thử đối với mẫu ngẫu nhiên WX tức là thực hiện một phép thử đối
với mỗi thành phần Xi của mẫu. Giả sử X1 nhận giá trị x1 , X2 nhận giá trị x2 , . . . , Xn nhận giá
trị xn ta thu được một mẫu cụ thể Wx = ( x1 , x2 , . . . , xn ).
Ví dụ 4.2. Gọi X là "số chấm xuất hiện khi gieo một con xúc xắc". X là biến ngẫu nhiên có
bảng phân phối xác suất
X 1 2 3 4 5 6
1 1 1 1 1 1
p 6 6 6 6 6 6
Nếu gieo con xúc xắc 3 lần và gọi Xi là "số chấm xuất hiện ở lần gieo thứ i", i = 1, 2, 3 thì ta
có 3 biến ngẫu nhiên độc lập có cùng quy luật phân phối xác suất với X. Vậy ta có một mẫu
ngẫu nhiên WX = ( X1 , X2 , X3 ) cỡ n = 3 được xây dựng từ biến ngẫu nhiên gốc X. Thực hiện
một phép thử đối với mẫu ngẫu nhiên này (tức là gieo 3 lần một con xúc xắc). Giả sử lần thứ
nhất xuất hiện mặt 6, lần thứ hai xuất hiện mặt 2, lần thứ ba xuất hiện mặt 1 thì ta có một giá
trị của mẫu ngẫu nhiên Wx = (6, 3, 1).
4.1.3 Mô tả giá trị của mẫu ngẫu nhiên

Phân loại dữ liệu
Từ tổng thể ta trích ra tập mẫu có n phần tử. Ta có n số liệu.
(a) Dạng liệt kê: Các số liệu thu được được ghi lại thành dãy x1 , x2 , . . . , xn .
(b) Dạng rút gọn: Số liệu thu được có sự lặp đi lặp lại một số giá trị thì ta có dạng rút gọn
sau:
(b1) Dạng tần số: (n1 + n2 + . . . + nk = n)
Giá trị x1 x2 ... xk

Tần số n1 n2 ... nk

(b2) Dạng tần suất: ( f k = nk /n)

Tần suất f1 f2 ... fk
(c) Dạng khoảng: Dữ liệu thu được nhận giá trị trong ( a, b). Ta chia ( a, b) thành k miền con
bởi các điểm chia: a0 = a < a1 < a2 < · · · < ak−1 < ak = b.
(c1) Dạng tần số: (n1 + n2 + . . . + nk = n)
Giá trị ( a 0 − a 1 ] ( a 1 − a 2 ] . . . ( a k −1 − a k ]
(c2) Dạng tần suất: ( f k = nk /n)
Giá trị ( a 0 , a 1 ] ( a 1 , a 2 ] . . . ( a k −1 , a k ]
Tần suất f1 f2 ... fk
Chú ý, thông thường, độ dài các khoảng chia bằng nhau. Khi đó ta có thể chuyển về dạng
rút gọn:

trong đó xi là điểm đại diện cho ( ai−1 , ai ] thường được xác định là trung điểm của đoạn
1
đó: xi = ( ai−1 + ai ).
2
Phân phối thực nghiệm
Đặt wi là tần số tích lũy của xi và Fn ( xi ) là tần suất tích lũy của xi , ta sẽ có
wi
wi = ∑ nj; Fn ( xi ) =
n
= ∑ fj
x j < xi x j < xi
thì Fn ( xi ) là một hàm của xi và được gọi là hàm phân phối thực nghiệm của mẫu hay hàm
phân phối mẫu. Chú ý rằng theo luật số lớn (Định lý Béc-nu-li) Fn ( x ) hội tụ theo xác suất về
FX ( x ) = P( X < x ), trong đó X là biến ngẫu nhiên gốc cảm sinh ra tổng thể (và cả tập mẫu).
Như vậy hàm phân phối mẫu có thể dùng để xấp xỉ luật phân phối của tổng thể.
Biểu diễn dữ liệu
Thông thường ta biểu diễn phân phối tần số, tần suất bằng đồ thị. Có hai dạng biểu diễn đồ
thị hay dùng là biểu đồ và đa giác tần số (sinh viên tự đọc).

4.1.4 Đại lượng thống kê và các đặc trưng của mẫu ngẫu nhiên
Để nghiên cứu mẫu ngẫu nhiên gốc X, nếu dừng lại ở mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn )
thì rõ ràng chưa giải quyết được vấn đề gì, bởi các biến ngẫu nhiên Xi có cùng quy luật phân
phối xác suất với X mà ta chưa biết hoàn toàn. Vì vậy ta phải liên kết hay tổng hợp các biến
ngẫu nhiên X1 , X2 , . . . , Xn lại sao cho biến ngẫu nhiên mới thu được có những tính chất mới,
có thể đáp ứng được yêu cầu giải những bài toán khác nhau về biến ngẫu nhiên gốc X.
Định nghĩa thống kê
Định nghĩa 4.2 (Thống kê). Trong thống kê toán việc tổng hợp mẫu WX = ( X1 , X2 , . . . , Xn )
được thực hiện dưới dạng hàm của các biến ngẫu nhiên X1 , X2 , . . . , Xn . Ký hiệu
G = f ( X1 , X2 , . . . , X n ) (4.1)
ở đây f là một hàm nào đó và G được gọi là một thống kê.
Khi có mẫu cụ thể Wx = ( x1 , x2 , . . . , x2 ), ta tính được giá trị cụ thể của G, ký hiệu là
g = f ( x1 , x2 , . . . , xn ), còn gọi là giá trị quan sát của thống kê.
Nhận xét 4.1. Thống kê G là một hàm của các biến ngẫu nhiên X1 , X2 , . . . , Xn nên cũng là một
biến ngẫu nhiên. Do đó ta có thể xét các đặc trưng của thống kê này.
Trung bình mẫu ngẫu nhiên
Cho mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ). Trung bình mẫu của mẫu ngẫu nhiên WX của
biến ngẫu nhiên gốc X được định nghĩa và ký hiệu
1 n
X = ∑ Xi (4.2)
n i =1
Nếu biến ngẫu nhiên gốc có kỳ vọng E( X ) = µ, phương sai V ( X ) = σ2 thì theo Tính chất
2.4(c) và Tính chất 2.5(c) của kỳ vọng và phương sai, thống kê X có kỳ vọng E( X ) = µ và
σ2
phương sai V ( X ) = nhỏ hơn phương sai của biến ngẫu nhiên gốc n lần, nghĩa là các giá
n
trị có thể có của X ổn định quanh kỳ vọng µ hơn các giá trị có thể có của X.
Phương sai mẫu ngẫu nhiên
Phương sai mẫu của mẫu ngẫu nhiên WX của biến ngẫu nhiên gốc X được ký hiệu và định
nghĩa
1 n 1 n 2
Ŝ = ∑ ( Xi − X ) = ∑ Xi − ( X )2
2 2
(4.3)
n i =1 n i =1

Độ lệch chuẩn mẫu ngẫu nhiên được ký hiệu và xác định bởi
s
p 1 n
n i∑
Ŝ = Ŝ2 = ( Xi − X ) 2 (4.4)
=1
Sử dụng Tính chất 2.4(c) của kỳ vọng, ta có

n−1 2
E(Ŝ2 ) = σ .
n
Để kỳ vọng của phương sai mẫu ngẫu nhiên trùng với phương sai của biến ngẫu nhiên
gốc ta cần một sự hiệu chỉnh. Đó là phương sai hiệu chỉnh mẫu ngẫu nhiên.
Phương sai hiệu chỉnh mẫu ngẫu nhiên
Phương sai hiệu chỉnh mẫu của mẫu ngẫu nhiên WX của biến ngẫu nhiên gốc X được ký hiệu
và định nghĩa
n
1 n
S2 = ∑
n − 1 i =1
( Xi − X ) 2 =
n−1
Ŝ2 (4.5)
Độ lệch chuẩn hiệu chỉnh mẫu ngẫu nhiên được ký hiệu và xác định bởi
s
√ 1 n
n − 1 i∑
S = S2 = ( Xi − X ) 2 (4.6)
=1
Theo Tính chất 2.4(c) của kỳ vọng ta nhận được
E ( S2 ) = σ 2 .
Tần suất mẫu ngẫu nhiên
Trường hợp cần nghiên cứu một dấu hiệu định tính A nào đó mà mỗi cá thể của tổng thể có
thể có hoặc không, giả sử p là tần suất có dấu hiệu A của tổng thể. Nếu cá thể có dấu hiệu A
ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị 0. Lúc đó dấu hiệu nghiên cứu
có thể xem là biến ngẫu nhiên X có phân phối Béc-nu-li tham số p có kỳ vọng E( X ) = p và
phương sai V ( X ) = p(1 − p).
Lấy mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ) trong đó X1 , X2 , . . . Xn là các biến ngẫu nhiên
độc lập có cùng phân phối Béc-nu-li với tham số p. Tần số xuất hiện A trong mẫu là
n
m= ∑ Xi .
i =1
Khi đó tần xuất mẫu là một thống kê ký hiệu và xác định bởi
m 1 n
f = = ∑ Xi = X (4.7)
n n i =1

Như vậy tần suất mẫu là trung bình mẫu của biến ngẫu nhiên X có phân bố Béc-nu-li tham
số p. Ngoài ra theo Tính chất 2.4(c) và Tính chất 2.5(c), ta có
p (1 − p )
E( f ) = p, V( f ) = (4.8)
n
4.1.5 Cách tính giá trị cụ thể của trung bình mẫu và phương sai mẫu
Giả sử ta có mẫu cụ thể Wx = ( x1 , x2 , . . . , xn ) cỡ n.
(a) Mẫu cho dưới dạng liệt kê. (Tần số của các xi bằng 1)
(a1) Trung bình mẫu:
1 n
n i∑
x= xi (4.9)
=1
(a2) Phương sai mẫu:

2
1 n 1 n 1 n

ŝ = ∑ ( xi − x )2 = ∑ xi2 −
n i∑
2
xi (4.10)
n i =1 n i =1 =1
(a3) Phương sai hiệu chỉnh mẫu:
n 2
s2 = ŝ (4.11)
n−1
(a4) Các độ lệch chuẩn:

√ √
ŝ = ŝ2 ; s= s2 (4.12)
Để tính các công thức (4.9)–(4.12), ta lập bảng tính toán
xi xi2
x1 x12
x2 x22
... ...
xn xn2
∑in=1 xi ∑in=1 xi2
(b) Mẫu cho ở dạng rút gọn. (Tần số của các xi là ni > 1, ∑ik=1 ni = n)

(b1) Trung bình mẫu:
1 k
x = ∑ ni xi (4.13)
n i =1
(b2) Phương sai mẫu:

2
1 k 1 k 1 k

ŝ = ∑ ni ( xi − x )2 = ∑ ni xi2 −
n i∑
2
ni xi (4.14)
n i =1 n i =1 =1
(b3) Phương sai hiệu chỉnh mẫu:
n 2
s2 = ŝ (4.15)
n−1
(b4) Các độ lệch chuẩn:

√ √
ŝ = ŝ2 ; s= s2 (4.16)
xi ni ni xi ni xi2
x1 n1 n1 x1 n1 x12
x2 n2 n2 x2 n2 x22
... ... ... ...
xk nk nk xk nk xk2
∑ik=1 ni = n ∑ik=1 ni xi ∑ik=1 ni xi2
(c) Phương pháp đổi biến. (Trong trường hợp độ dài các khoảng bằng nhau)
(c1) Trung bình mẫu:
h k
n i∑
x = x0 + hu = x0 + ni ui (4.17)
=1
(c2) Phương sai mẫu:

2
1 k 1 k

n i∑ n i∑
2 2
ŝ = h ni u2i − ni ui = h2 ŝ2u (4.18)
=1 =1
trong đó
xi là điểm giữa của khoảng thứ i, i = 1, 2, . . . , k;

x i − x0
ui = , h là độ dài các khoảng;
h
x0 = xi ứng với ni lớn nhất.
xi ni ui ni ui ni u2i
x1 n1 u1 n1 u1 n1 u21
x2 n2 u2 n2 u2 n2 u22
... ... ... ... ...
xk nk uk nk uk nk u2k
∑ik=1 ni = n ∑ik=1 ni ui ∑ik=1 ni u2i
Tính tham số đặc trưng mẫu trên máy tính CASIO FX570VN PLUS
Bước 1 Chuyển đổi máy tính về chương trình thống kê MODE → 3 → AC
Bước 2 Bật chức năng cột tần số/tần suất SHIFT → MODE → Mũi tên đi xuống → 4(STAT)
→ 1(ON)
Bước 3 Bật chế độ màn hình để nhập dữ liệu, Nhập số liệu SHIFT → 1 → 1(TYPE) → 1(1-
VAR)
Chú ý nhập xong số liệu thì bấm AC để thoát.
Bước 4 Xem kết quả:
• Trung bình mẫu (x): SHIFT → 1 → 4(VAR) → 2

• Độ lệch tiêu chuẩn mẫu hiệu chỉnh (s): SHIFT → 1 → 4 → 4
Ví dụ 4.3. Ở một địa điểm thu mua vải, kiểm tra một số vải thấy kết quả sau
Số khuyết tật ở mỗi đơn vị 0 1 2 3 4 5 6

Số đơn vị kiểm tra (10m) 8 20 12 40 30 25 15
Hãy tính kỳ vọng mẫu và độ lệch chuẩn hiệu chỉnh mẫu của mẫu trên.
Lời giải Ví dụ 4.3

Cách 1: Gọi X là số khuyết tật ở mỗi đơn vị. Lập bảng tính toán

xi ni ni xi ni xi2
0 8 0 0
1 20 20 20
2 12 24 48
3 40 120 360
4 30 120 480
5 25 125 625
6 15 90 540
∑ n = 150 ∑i ni xi = 499 ∑i ni xi2 = 2073
499 2073
Suy ra x = = 3, 3267; x2 = = 13, 82; ŝ2 = x2 − ( x )2 = 13, 82 − (3, 3267)2 = 2, 7531;
150 150
150 √
s2 = × 2, 7531 = 2, 7715; s = 2, 7715 = 1, 6648.
149
Cách 2: Sử dụng máy tính CASIO FX570VN PLUS tính được x = 3, 3267; s = 1, 6648.
4.1.6 Phân phối xác suất của các thống kê trung bình mẫu, phương sai mẫu,
tần suất mẫu ngẫu nhiên
Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như một biến ngẫu nhiên X có phân
phối chuẩn N (µ, σ2 ) với kỳ vọng E( X ) = µ và phương sai V ( X ) = σ2 . Các tham số này có
thể đã biết hoặc chưa biết. Từ tổng thể rút ra một mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ) cỡ
n. Các biến ngẫu nhiên thành phần Xi , i = 1, . . . , n, độc lập có cùng quy luật phân phối chuẩn
N (µ, σ2 ) như X.
Chú ý rằng mọi tổ hợp tuyến tính của các biến ngẫu nhiên có phân phối chuẩn là biến
ngẫu nhiên có phân phối chuẩn. Vì vậy ta có các kết quả sau.
Phân phối của thống kê trung bình mẫu

σ2

1 n
Thống kê trung bình mẫu X = ∑i=1 Xi có phân phối chuẩn N µ; và do đó thống kê
n n
X − µ√
U= n có phân phối chuẩn tắc (xem Định lý giới hạn trung tâm)
σ
σ2 X − µ√

X ∼ N µ, , U= n ∼ N (0, 1) (4.19)
n σ
Ví dụ 4.4. Một công ty điện sản xuất bóng đèn có tuổi thọ là biến ngẫu nhiên phân phối xấp
xỉ chuẩn, với tuổi thọ trung bình là 800 giờ và độ lệch chuẩn là 40 giờ. Tìm xác suất để một
mẫu ngẫu nhiên gồm 16 bóng đèn sẽ có tuổi thọ trung bình dưới 775 giờ.

Lời giải Ví dụ 4.4 Gọi X là tuổi thọ của bóng đèn. X ∼ N (800, 402 ). Khi đó, tuổi thọ trung bình
√
của mẫu ngẫu nhiên X có phân phối xấp xỉ chuẩn với µ X = 800 và σX = 40/ 16 = 10. Xác
suất cần tính là diện tích của vùng bóng mờ trong Hình 4.1.
Hình 4.1: Minh họa của Ví dụ 4.4
Vì X ∼ N (800, 102 ), nên
775 − 800

P( X < 775) = 0, 5 + φ = 0, 5 + φ(−2.5) = 0, 5 − 0, 49379 = 0.00621,
10
trong đó φ(−2, 5) = −0, 49379 tra từ bảng giá trị hàm số Láp-la-xơ (Phụ lục 2).
Phân phối của thống kê phương sai mẫu

nŜ2 ( n − 1) S2
Thống kê χ2 = = có phân phối khi bình phương với n − 1 bậc tự do
σ2 σ2
nŜ2 ( n − 1) S2
2
= 2
∼ χ2(n−1) (4.20)
σ σ
Hình 4.2: Phân phối khi bình phương
(sinh viên tự đọc phân phối này).

X − µ√ X − µ√
Phân phối của thống kê T = n hoặc T = n−1
S Ŝ
X − µ√ X − µ√
Thống kê T = n= n − 1 có phân phối Student với n − 1 bậc tự do.
S Ŝ
X − µ√ X − µ√
T= n= n − 1 ∼ T ( n −1) (4.21)
S Ŝ
X − µ√
Nhận xét 4.2. (a) Phân phối Student (của thống kê T = T = n) có cùng dạng và tính
S
X − µ√
đối xứng như phân phối chuẩn (của thống kê U = n) nhưng nó phản ánh tính
σ
biến đổi của phân phối sâu sắc hơn (do thực tế là giá trị T phụ thuộc vào sự biến động
của hai đại lượng X và S2 , trong khi U chỉ phụ thuộc vào những thay đổi của X từ mẫu
này sang mẫu khác).
(b) Phân phối chuẩn không thể dùng để xấp xỉ phân phối khi mẫu có kích thước nhỏ. Trong
trường hợp này ta dùng phân phối Student.
(c) Khi bậc tự do n tăng lên (n ≥ 30) thì phân phối Student tiến nhanh về phân phối chuẩn.
Do đó khi n ≥ 30 ta có thể dùng phân phối chuẩn thay thế cho phân phối Student.
Hình 4.3: Phân phối Student với số bậc tự do ν = 2, 5 và ∞
Chú ý 4.1. Trong thực hành khi n ≥ 30 ta có thể không cần đến giả thiết chuẩn của biến ngẫu
X − µ√
nhiên gốc, thống kê T = n xấp xỉ phân phối chuẩn tắc N (0, 1).
S
(n) (n)
Nếu T ∼ T (n) thì P( T < tα ) = α. Giá trị tα được tra từ bảng phân phối Student (Phụ
(n) (10) (10)
lục 4). Chẳng hạn với n = 10, α = 0, 5 thì t1−α/2 = t1−0,025 = t0,975 = 2, 228.

Phân phối của thống kê tần suất mẫu

f−p √
Khi n đủ lớn (np ≥ 5 và n(1 − p) ≥ 5) thì thống kê U = p n có phân phối xấp xỉ
p (1 − p )
phân phối chuẩn tắc
f−p √
U=p n ∼ N (0, 1) (4.22)
p (1 − p )
4.2 Ước điểm cho kỳ vọng, phương sai và tỷ lệ

Phương pháp ước lượng điểm chủ trương dùng giá trị quan sát của một thống kê để ước
lượng một tham số (véc tơ tham số) nào đó theo các tiêu chuẩn: vững, không chệch, hiệu quả.
4.2.1 Ước lượng điểm

Khái niệm ước lượng điểm
Cho biến ngẫu nhiên gốc X có thể đã biết hoặc chưa biết quy luật phân phối xác suất dạng
tổng quát, nhưng chưa biết tham số θ nào đó. Hãy ước lượng θ bằng phương pháp mẫu. Vì θ
là một hằng số nên có thể dùng một số nào đó để ước lượng θ. Ước lượng như vậy gọi là ước
lượng điểm.
Phương pháp hàm ước lượng
- Giả sử cần ước lượng tham số θ của biến ngẫu nhiên X. Từ X ta lập mẫu ngẫu nhiên
WX = ( X1 , X2 , . . . , Xn ) cỡ n. Chọn thống kê G = f ( X1 , X2 , . . . , Xn ). Một trong những
cách chọn dạng hàm f là tương ứng thống kê đặc trưng của mẫu ngẫu nhiên với tham
số cần ước lượng của biến ngẫu nhiên.
- Tiến hành lập mẫu cụ thể Wx = ( x1 , x2 , . . . , xn ). Tính giá trị cụ thể của G ứng với mẫu
này, tức là g = f ( x1 , x2 , . . . , xn ). Đây là ước lượng điểm của θ.
- Thống kê G = f ( X1 , X2 , . . . , Xn ) là hàm ước lượng của θ.
4.2.2 Các tiêu chuẩn lựa chọn hàm ước lượng

Cùng một mẫu ngẫu nhiên có thể xây dựng nhiều thống kê G khác nhau để ước lượng cho
tham số θ. Vì vậy ta cần lựa chọn thống kê tốt nhất để ước lượng cho tham số θ dựa vào các
tiêu chuẩn sau.
4.2. Ước điểm cho kỳ vọng, phương sai và tỷ lệ 109

Ước lượng không chệch (unbiased estimator)
Thống kê G được gọi là ước lượng không chệch của θ nếu
E( G ) = θ với mọi θ (4.23)
Nếu E( G ) 6= θ thì G là ước lượng chệch của θ.

Điều kiện (4.23) của ước lượng không chệch có nghĩa là trung bình các giá trị của G bằng
θ. Tuy nhiên, không có nghĩa là mọi giá trị của G đều trùng khít với θ mà từng giá trị của G
có thể sai lệch rất lớn so với θ. Vì vậy ta tìm ước lượng không chệch sao cho độ sai lệch trung
bình là bé nhất.
Ước lượng hiệu quả (efficient estimator)
Thống kê G được gọi là ước lượng hiệu quả (hay ước lượng phương sai bé nhất) của θ nếu G
là ước lượng không chệch của θ và phương sai của G nhỏ hơn bất kỳ phương sai của một hàm
ước lượng không chệch nào khác.
Để xét xem ước lượng không chệch G có phải là ước lượng hiệu quả của θ hay không ta
cần phải tìm một cận dưới của phương sai của các ước lượng không chệch và so sánh phương
sai của G với cận dưới này. Điều này được giải quyết bằng bất đẳng thức Cramer–Rao phát
biểu như sau: Cho mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ) cỡ n được lấy từ tổng thể có dấu hiệu
nghiên cứu được mô hình hóa bởi biến ngẫu nhiên X mà hàm mật độ xác suất (nếu là biến ngẫu nhiên
liên tục) hay bảng phân phối xác suất (nếu là biến ngẫu nhiên rời rạc) thỏa mãn một số điều kiện nhất
định (thường được thỏa mãn trong thực tế, ít ra là các phân phối xác suất đã xét trong Chương 2) và
G là ước lượng không chệch bất kỳ của θ thì
1
V (G) ≥ 2 (4.24)
∂(ln f ( X,θ ))
nE ∂θ
Ước lượng vững (consistent estimator)
Thống kê G được gọi là ước lượng vững của tham số θ nếu G hội tụ theo xác suất đến θ khi
n → +∞.
4.2.3 Ước lượng điểm cho kỳ vọng, phương sai và xác suất
1 n
- Chọn hàm G = ∑ X = X nếu ước lượng kỳ vọng E( X ) = µ. Kỳ vọng mẫu ngẫu
n i =1 i
nhiên X là ước lượng không chệch, hiệu quả và vững của kỳ vọng E( X ) = µ của biến
ngẫu nhiên gốc của tổng thể.

1
- Chọn G = ∑n ( X − X )2 = S2 nếu ước lượng phương sai V ( X ) = σ2 . Phương sai
n − 1 i =1 i
hiệu chỉnh mẫu ngẫu nhiên S2 là ước lượng không chệch, hiệu quả và vững của phương
sai V ( X ) = σ2 của biến ngẫu nhiên gốc của tổng thể.
m
- Chọn G = = f nếu ước lượng cho xác suất p. Tần suất mẫu ngẫu nhiên f là ước
n
lượng không chệch, hiệu quả và vững của xác suất p của tổng thể.
Ví dụ 4.5. Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri
thì được biết 960 người sẽ bỏ phiếu cho ứng cử viên A. Hãy chỉ ra ước lượng điểm cho tỷ lệ
phiếu thực mà ứng cử viên A sẽ thu được.
960
Lời giải Ví dụ 4.5 Ước lượng điểm cần tìm là f = = 0, 6 = 60%.
1600
4.2.4 Một số phương pháp tìm ước lượng điểm

(a) Phương pháp hợp lý cực đại (maximum-likelihood estimation)
(b) Phương pháp mô men (moment estimation)
(c) Phương pháp Bayes, phương pháp minimax, phương pháp bootstrap . . .
(Sinh viên tự đọc).

TUẦN 12
4.3 Phương pháp ước lượng bằng khoảng tin cậy

Phương pháp ước lượng điểm nói trên có nhược điểm là khi kích thước mẫu bé thì ước lượng
điểm có thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt khác phương pháp
trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó
khi kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy cho
trường hợp một tham số.
Khái niệm ước lượng khoảng
Giả sử chưa biết đặc trưng θ nào đó của biến ngẫu nhiên X. Ước lượng khoảng của θ là chỉ ra
một khoảng số ( g1 , g2 ) nào đó chứa θ, tức là có thể ước lượng g1 < θ < g2 .
Phương pháp khoảng ước lượng tin cậy
Để ước lượng tham số θ của biến ngẫu nhiên X, từ biến ngẫu nhiên này ta lập mẫu ngẫu nhiên
WX = ( X1 , X2 , . . . , Xn ) cỡ n. Chọn thống kê G ( X, θ ) sao cho mặc dù chưa biết giá trị của θ,
quy luật phân phối xác suất của G vẫn hoàn toàn xác định. Do đó, với xác suất α khá bé ta
tìm được P( G1 < θ < G2 ) = 1 − α. Vì α khá bé, nên γ = 1 − α khá lớn (thông thường yêu
cầu 1 − α = γ ≥ 0, 95 để có thể áp dụng nguyên lý xác suất lớn cho sự kiện ( G1 < θ < G2 )).
Khi đó, sự kiện ( G1 < θ < G2 ) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một
phép thử đối với mẫu ngẫu nhiên WX ta thu được mẫu cụ thể Wx = ( x1 , x2 , . . . , xn ), từ đó tính
được các giá trị của G1 , G2 , ký hiệu là g1 , g2 . Như vậy có thể kết luận: với độ tin cậy 1 − α = γ
tham số θ nằm trong khoảng ( g1 , g2 ).
(a) ( G1 , G2 ) được gọi là khoảng tin cậy của θ với độ tin cậy γ = 1 − α.
(b) 1 − α = γ được gọi là độ tin cậy của ước lượng.
(c) I = G2 − G1 được gọi là độ dài khoảng tin cậy.
4.3.1 Khoảng tin cậy của kỳ vọng của biến ngẫu nhiên phân phối chuẩn
Bài toán 4.1. Giả sử biến ngẫu nhiên X tuân theo luật phân phối chuẩn N (µ, σ2 ) với kỳ vọng
E( X ) = µ chưa biết. Hãy ước lượng E( X ).
Các bước tiến hành: Từ tổng thể, ta lập mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ) cỡ n và xét
các trường hợp sau.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 112
Trường hợp đã biết phương sai V ( X ) = σ2
Bước 1 Chọn thống kê
X − µ√
U= n (4.25)
σ
Theo Mục 4.1.6, thống kê U có phân phối chuẩn tắc N (0; 1).
Bước 2 Chọn cặp số không âm α1 , α2 thỏa mãn α1 + α2 = α, tìm các phân vị chuẩn tắc
uα1 , u1−α2 sao cho P(U < uα1 ) = α1 ; P(U < u1−α2 ) = 1 − α2 . Do tính chất của phân
phối chuẩn tắc uα1 = −u1−α1 , suy ra
P(−u1−α1 < U < u1−α2 ) = P(uα1 < U < u1−α2 )

= P(U < u1−α2 ) − P(U < uα1 ) = 1 − α2 − α1 = 1 − α.
Như vậy,
X − µ√

1 − α = P(−u1−α1 < U < u1−α2 ) = P − u1−α1 < n < u 1− α2
σ

σ σ
= P X − u 1− α2 √ < µ < X + u 1− α1 √ .
n n
Bước 3 Lập mẫu cụ thể WX = ( x1 , x2 , . . . , xn ), tính được giá trị cụ thể x của X, khi đó khoảng
tin cậy cho µ với độ tin cậy γ = 1 − α là:

σ σ
x − u 1− α2 √ ; x + u 1− α1 √ (4.26)
n n
Như vậy, với độ tin cậy γ = 1 − α cho trước, có vô số khoảng tin cậy cho µ vì có vô số cặp
α1 , α2 thỏa mãn α1 + α2 = α. Ở đây ta chỉ xét một số trường hợp đặc biệt.
(a) Khoảng tin cậy đối xứng (α1 = α2 = α/2)

σ σ
x − u1− α2 √ ; x + u1− α2 √ (4.27)
n n
trong đó u1− α2 được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ
thức
α
Φ(u1− α2 ) = 1 − (4.28)
2
σ
Sai số của ước lượng: ε = u1− α2 √ được gọi là sai số (độ chính xác) của ước lượng. Với
n
phương sai σ2 đã biết không đổi và độ tin cậy γ không đổi thì giá trị u1− α2 không đổi, do
đó sai số của ước lượng chỉ phụ thuộc vào kích thước mẫu n. Khi n càng lớn thì ε càng
bé, do đó khoảng ước lượng càng chính xác.
Tìm kích thước mẫu: Nếu muốn ước lượng kỳ vọng với độ chính xác ε 0 và độ tin cậy γ cho
trước, kích thước mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn:
σ2 u21− α
2
n≥ (4.29)
ε20
(b) Khoảng tin cậy trái (α1 = α, α2 = 0):

σ
−∞ ; x + u 1− α √ (4.30)
n
trong đó u1−α được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ
thức
Φ ( u 1− α ) = 1 − α . (4.31)
(c) Khoảng tin cậy phải (α1 = 0, α2 = α):

σ
x − u 1− α √ ; +∞ (4.32)
n
Ví dụ 4.6. Trọng lượng của một loại sản phẩm là biến ngẫu nhiên tuân theo luật phân phối
chuẩn với độ lệch tiêu chuẩn là 1 gam. Cân thử 25 sản phẩm loại này ta thu được kết quả sau:
Trọng lượng (gam) 18 19 20 21

Số sản phẩm 3 5 15 2
(a) Với độ tin cậy 1 − α = 95%, hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình
của loại sản phẩm nói trên.
(b) Không cần tính toán, nếu độ tin cậy 99% thì khoảng ước lượng trung bình sẽ rộng hơn,
hẹp hơn hay bằng như trong ý (a)?
(c) Nếu muốn độ chính xác của ước lượng tăng lên gấp đôi, độ tin cậy không đổi thì cần
nghiên cứu mẫu có kích thước là bao nhiêu?
(a) Gọi X là trọng lượng sản phẩm, X ∼ N (µ, σ2 ) với σ = 1. Trọng lượng trung bình của sản
phẩm là E( X ) = µ chưa biết cần ước lượng.
X − µ√
Bước 1: Chọn thống kê U = n. Thống kê U ∼ N (0; 1).
σ
!
σ σ
Bước 2: Áp dụng khoảng tin cậy đối xứng x − u1− α2 √ ; x + u1− α2 √ .
n n
0,05
Với α = 0, 05, Φ(u1− α2 ) = 1 − 2 = 0, 975, tra bảng giá trị hàm phân phối chuẩn tắc
(Phụ lục 3) nhận được u1− α2 = 1, 96.
Bước 3: Từ số liệu đã cho ta có n = 25,σ = 1 và tính được x = 19, 64, suy ra khoảng

1 1
tin cậy đối xứng của E( X ) = µ là 19, 64 − 1, 96 × √ 19, 64 + 1, 96 × √ hay
25 25
(19, 248 ; 20, 032).
Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại sản phẩm nói trên từ
19,248 gam đến 20,032 gam.
(b) Nếu độ tin cậy 1 − α tăng từ 95% lên 99% thì khoảng ước lượng sẽ rộng hơn khoảng ước
lượng xét trong ý (a), do giá trị của u1−α/2 tăng từ 1, 96 lên 2, 58.
σ
(c) Theo ý (a), độ chính xác của ước lượng là ε = u1− α2 √ = 0, 392. Để độ chính xác tăng lên
n
0,392
gấp đôi, tức là ε 0 = 2 = 0, 196. Theo (4.29) ta cần mẫu có kích thước nhỏ nhất là
σ 2 u2
12 × (1, 96)2

1− α2
n= = ' 100.
ε20 (0, 196)2
Chú ý 4.2. (a) Chú ý rằng không thể viết P(19, 248 < X < 20, 032) = 0, 95 vì độ tin cậy
gắn với khoảng tin cậy ngẫu nhiên chứ không gắn với mẫu cụ thể. Hơn nữa vì µ là
một hằng số nên nó chỉ có thể thuộc hoặc không thuộc khoảng (19,248; 20,032) nên
(19, 248 < µ < 20, 032) không phải là sự kiện ngẫu nhiên.
(b) Ta có thể xác định u1− α2 = 1, 96 ở ý Ví dụ 4.6(a) từ bảng giá trị hàm Láp-la-xơ (Phụ lục 2)
1−α
từ hệ thức φ(u1−α ) = .
2
(c) Từ (4.29) ta nhận thấy khi kích thước mẫu tăng và độ tin cậy giữ nguyên thì ε giảm hay
ước lượng chính xác hơn; nếu tăng độ tin cậy và giữ nguyên kích thước mẫu, do giá trị
phân vị chuẩn tăng nên sai số của ước lượng ε tăng.
Trường hợp chưa biết phương sai, cỡ mẫu n < 30
Do σ chưa biết nên ta thay thế bằng S và chọn thống kê
X − µ√
T= n (4.33)
S
Như đã biết (Mục 4.1.6) thống kê T có phân phối Student với n − 1 bậc tự do. Ta có các kết
luận sau đây.
(a) Khoảng tin cậy đối xứng

( n −1) s ( n −1) s
x − t 1− α √ ; x + t 1− α √ (4.34)
2 n 2 n
( n −1) s
Sai số của ước lượng là ε = t1− α √ . Kích thước mẫu được suy từ sai số hay độ chính
2 n
xác của ước lượng, là số tự nhiên n nhỏ nhất thỏa mãn:
2
( n −1)
t 1− α × s2
2
n≥ (4.35)
ε2
(b) Khoảng tin cậy trái

( n −1) s
−∞ ; x + t 1− α √ (4.36)
n
(c) Khoảng tin cậy phải

( n −1) s
x − t 1− α √ ; +∞ (4.37)
n
( n −1) ( n −1)
trong đó t1− α , t1−α được xác định từ bảng phân phối Student với n − 1 bậc tự do (Phụ
2
lục 4).
Ví dụ 4.7. Theo dõi mức xăng hao phí (X) cho một loại ô tô đi từ A đến B thu được bảng số
liệu sau:
Mức xăng hao phí (lít) 19-19,5 19,5-20,0 20,0-20,5 20,5-21,0

Số lần đi 2 10 8 5
Với độ tin cậy 1 − α = 95% hãy tính mức xăng hao phí trung bình tối thiểu khi đi từ A đến B
biết X tuân theo luật phân phối chuẩn.
Lời giải Ví dụ 4.7 Gọi X là lượng xăng hao phí của loại ô tô trên đoạn đường AB, X ∼ N (µ, σ2 )
với phương sai σ2 chưa biết. Mức xăng hao phí trung bình là E( X ) = µ chưa biết, cần ước
lượng.
X − µ√
Bước 1: Vì phương sai chưa biết và n = 25 < 30, chọn thống kê T = n. Thống kê T
S
có phân phối Student với n − 1 bậc tự do.
Bước 2: Sử dụng khoảng tin cậy phải cho E( X ) = µ:

( n −1) s
x − t 1− α √ ; +∞
n
( n −1) (24)
trong đó t1−α = t0,95 = 1, 711 được xác định từ bảng phân phối Student (Phụ lục 4).
Bước 3: Từ số liệu của đầu bài, tính được n = 25, x = 20, 07, s = 0, 45. Suy ra khoảng tin cậy
0, 45
phải của µ là 20, 07 − 1, 711 × √ < µ < +∞ hay (19, 92 < µ < +∞).
25
Bước 4: Kết luận mức xăng hao phí trung bình tối thiểu khi đi từ A đến B là 19,92 lít với độ
tin cậy 95%.
Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30
Khi n ≥ 30 thống kê T trong (4.33) sẽ có phân phối tiệm cận chuẩn tắc N (0, 1). Hay thống kê
X − µ√
U= n ∼ N (0, 1) (4.38)
S
Do đó,

s s
x − u1− α2 √ ; x + u1− α2 √ (4.39)
n n
s
Sai số của ước lượng là ε = u1− α2 √ . Kích thước mẫu được suy từ sai số hay độ chính
n
xác của ước lượng, là số tự nhiên n nhỏ nhất thỏa mãn:
2
u1− α2 × s2
n≥ (4.40)
ε2

s
−∞ ; x + u 1− α √ (4.41)
n

s
x − u 1− α √ ; +∞ (4.42)
n
Ví dụ 4.8. Để ước lượng trọng lượng trung bình của loại trái cây A tại một vùng, người ta thu
hoạch ngẫu nhiên 100 trái cây A của vùng đó và thu được kết quả sau
Trọng lượng (gam) 40-42 42-44 44-46 46-48 48-50 50-52

Số trái 7 13 25 35 15 5
Hãy ước lượng trọng lượng trung bình của loại trái cây A trong vùng bằng khoảng tin cậy đối
xứng với độ tin cậy 95%. Cho biết trọng lượng loại trái cây A là biến ngẫu nhiên tuân theo
luật phân phối chuẩn.
Lời giải Ví dụ 4.8 Gọi X là trọng lượng loại trái cây A, X ∼ N (µ, σ2 ) với phương sai σ2 chưa
biết. Trọng lượng trung bình của loại trái cây A là E( X ) = µ chưa biết, cần ước lượng.
X − µ√
Bước 1: Chọn thống kê U = n. Vì n = 100 > 30 nên thống kê U ∼ N (0, 1).
S
!
s s
Bước 2: Khoảng tin cậy đối xứng cho E( X ) = µ là x − u1− α2 √ ; x + u1− α2 √ trong đó,
n n
với α = 0, 05, u1− α2 = u0,975 = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc
(Phụ lục 3).
Bước 3: Từ số liệu đã
cho tính được n = 100, x = 46, 06, s = 2, 48.Suy ra khoảng tin cậy đối
2, 48 2, 48
xứng của µ là 46, 06 − 1, 96 × √ ; 46, 06 + 1, 96 × √ hay (45, 573 ; 46, 546).
100 100
Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại trái cây A ở vùng trên
từ 45,573 gam đến 46,546 gam.
4.3.2 Ước lượng khoảng cho tỷ lệ

Bài toán 4.2. Xác suất xảy ra sự kiện A là p. Do không biết p nên người ta thực hiện n phép
thử độc lập, cùng điều kiện, trong đó có m phép thử xảy ra A. Khi đó tần suất xuất hiện A là
f = m/n là ước lượng điểm không chệch cho p. Với độ tin cậy γ = 1 − α hãy ước lượng khoảng
cho p.
Phương pháp tiến hành

f−p √
Bước 1 Chọn thống kê Z = p n. Theo Mục 4.1.6, Z có phân phối chuẩn tắc N (0; 1).
p (1 − p )
Trong trường hợp n khá lớn ta có thể dùng f để thay thế cho p. Khi đó,
f−p √
Z=p n ∼ N (0; 1) (4.43)
f (1 − f )
Bước 2: Khi có mẫu cụ thể Wx = ( x1 , x2 , . . . , xn ), ta tính được giá trị cụ thể của f và suy ra
khoảng ước lượng cho p với độ tin cậy γ = 1 − α là:
f (1 − f ) f (1 − f )

f − u 1− α2 ; f + u 1− α1 (4.44)
n n
với α = α1 + α2 .
Các trường hợp ước lượng hay dùng:
f (1 − f ) f (1 − f )

f − u1− α2 ; f + u1− α2 (4.45)
n n
…
f (1 − f )
Độ chính xác của ước lượng ε = u1− α2 . Với độ tin cậy γ = 1 − α và độ chính
n
xác ε 0 cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn:
2
u1− α2 × f × (1 − f )
n≥ (4.46)
ε20
f (1 − f )

−∞ ; f + u 1− α (4.47)
n
f (1 − f )

f − u 1− α ; +∞ (4.48)
n
Chú ý 4.3. (a) Do tỷ lệ chỉ nhận giá trị từ 0 đến 1 nên ta có thể thay giá trị −∞ bằng 0 và +∞
bằng 1 trong khoảng tin cậy trái (phải).
(b) Các khoảng tin cậy trên được xây dựng khi kích thước mẫu n đủ lớn thỏa mãn n f ≥ 5 và
n(1 − f ) ≥ 5.
Ví dụ 4.9. Điều tra nhu cầu tiêu dùng loại hàng A trong 100 hộ gia đình ở khu dân cư B thấy
60 hộ gia đình có nhu cầu loại hàng trên. Với độ tin cậy 1 − α = 95% hãy tìm khoảng tin cậy
đối xứng của tỷ lệ hộ gia đình có nhu cầu loại hàng đó.
Lời giải Ví dụ 4.9 Gọi p là tỷ lệ hộ gia đình ở khu dân cư B có nhu cầu mặt hàng A. Kiểm tra
điều kiện n f = 100 × 0, 6 = 60 > 5 và n(1 − f ) = 100 × 0, 4 = 40 > 5.
f−p √
Bước 1: Chọn thống kê Z = p n. Thống kê Z ∼ N (0, 1).
f (1 − f )
Bước 2: Khoảng tin cậy đối xứng của xác suất p là
f (1 − f ) f (1 − f )

f − u1− α2 ; f + u1− α2
n n
trong đó u1− α2 = u0,975 = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ
lục 3).
m
Bước 3: Với n = 100, m = 60, f = = 0, 6, suy ra khoảng tin cậy đối xứng của p là
n
… …
0, 6 × 0, 4 0, 6 × 0, 4

0, 6 − 1, 96 ; 0, 6 − 1, 96 = (0, 504 ; 0, 696).
100 100
Bước 4: Kết luận, tỷ lệ hộ gia đình ở khu dân cư B có nhu cầu loại hàng A là từ 50,4% đến
69,6% với độ tin cậy 95%.
Chương 5
Kiểm định giả thuyết thống kê
TUẦN 13
Một dạng khác của quy nạp thống kê là kiểm định giả thuyết thống kê. Đây là một phương
pháp quan trọng cho phép giải quyết nhiều bài toán trong thực tế. Nội dung của kiểm định
giả thuyết thống kê là dựa vào mẫu cụ thể và các quy tắc hay thủ tục quyết định dẫn đến bác
bỏ hay chấp nhận giả thuyết của tổng thể.
5.1 Các khái niệm

Thông thường ta nghiên cứu biến ngẫu nhiên trong trường hợp thông tin không đầy đủ, thể
hiện ở nhiều mặt. Cụ thể là:
1. Chưa biết chính xác tham số θ, hoặc quy luật phân phối xác xuất của biến ngẫu nhiên
X, nhưng có cơ sở nào đó để nêu lên giả thuyết, chẳng hạn θ = θ0 (θ0 đã biết), hoặc X
tuân theo quy luật phân phối chuẩn.
2. Khi nghiên cứu hai hay nhiều biến ngẫu nhiên, một trong những vấn đề cần quan tâm
nhất là: các biến ngẫu nhiên này độc lập với nhau hay có sự phụ thuộc tương quan? Hơn
nữa, các tham số của chúng có bằng nhau hay không? Những câu hỏi này thường chưa
được trả lời khẳng định mà mới chỉ nêu lên như một giả thuyết.
5.1.1 Giả thuyết thống kê

Giả thuyết thống kê là giả thuyết về biến ngẫu nhiên gốc của tổng thể, bao gồm: dạng phân
phối xác suất, các đặc trưng tham số của biến ngẫu nhiên gốc hoặc giả thuyết về sự độc lập
của các biến ngẫu nhiên gốc.
121
Giả thuyết thống kê. Kiểm định giả thuyết thống kê
1. Bất kỳ giả thuyết nào nói về tham số, dạng quy luật phân phối xác suất hay tính độc lập
của các biến ngẫu nhiên, đều được gọi là giả thuyết thống kê.
2. Việc tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết
gọi là kiểm định giả thuyết thống kê.
Trong khuôn khổ của chương trình, ta chỉ đề cập đến giả thuyết về tham số của biến ngẫu
nhiên.
Giả thuyết cơ bản. Giả thuyết đối
1. Giả sử cần nghiên cứu tham số θ của biến ngẫu nhiên X và có cơ sở nào đó để nêu lên
giả thuyết θ = θ0 . Giả thuyết này ký hiệu là H0 , còn gọi là giả thuyết cần kiểm định hay
giả thuyết cơ bản hay giả thuyết không (null hypothesis).
2. Mệnh đề đối lập với giả thuyết H0 ký hiệu là H1 , còn gọi là đối thuyết (alternative
hypothesis). Dạng tổng quát nhất của H1 là θ 6= θ0 . Trong nhiều trường hợp giả thuyết
đối được phát biểu cụ thể là H1 : θ > θ0 hoặc H1 : θ < θ0 .
Như vậy, giả thuyết cơ bản hay giả thuyết đối thường được phát biểu thành cặp:
Giả thuyết H0 θ = θ0 θ = θ0 θ = θ0
Đối thuyết H1 θ 6 = θ0 θ > θ0 θ < θ0
Nhiệm vụ của lý thuyết kiểm định giả thuyết thống kê là kiểm tra bằng thực nghiệm,
thông qua mẫu cụ thể Wx = ( x1 , x2 , . . . , xn ), tính đúng sai của giả thuyết H0 .
5.1.2 Tiêu chuẩn kiểm định. Mức ý nghĩa. Miền bác bỏ

Quy tắc kiểm định dựa trên hai nguyên lý sau:
1. Nguyên lý xác suất nhỏ: "Nếu một sự kiện có xác rất nhỏ thì trong một phép thử sự kiện
đó coi như không xảy ra".
2. Phương pháp phản chứng: "Để bác bỏ A ta giả sử A đúng; nếu A đúng dẫn đến một
điều vô lý thì bác bỏ A".
Dựa vào hai nguyên lý này ta đưa ra phương pháp chung để kiểm định một giả thuyết
thống kê như sau.
Cơ sở lập luận: Giả sử giả thuyết H0 đúng. Trên cơ sở đó xây dựng một sự kiện A nào đó, sao
cho xác suất xảy ra A bằng α bé đến mức có thể sử dụng nguyên lý xác suất nhỏ, tức là có thể
coi A không xảy ra trong phép thử về sự kiện này. Thực hiện một phép thử đối với sự kiện A:
5.1. Các khái niệm 122

1. Nếu A xảy ra thì bác bỏ giả thuyết H0 ;
2. Nếu A không xảy ra thì chưa có cơ sở để bác bỏ H0 .
Các bước tiến hành:
Bước 1 Từ biến ngẫu nhiên X, lập mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ) cỡ n và chọn thống
kê
G ( X, θ ) = f ( X1 , X2 , . . . , Xn , θ ) (5.1)
sao cho nếu H0 đúng thì quy luật phân phối xác suất của G hoàn toàn xác định. Thống
kê G gọi là tiêu chuẩn kiểm định.
Bước 2 Tìm miền Wα sao cho P( G ∈ Wα ) = α (với giả thuyết H0 đúng), tức là
P( G ∈ Wα | H0 ) = α. (5.2)
Vì α nhỏ, nên theo nguyên lý xác suất nhỏ có thể coi G không nhận giá trị trong miền
Wα đối với một phép thử.
Bước 3 Thực hiện một phép thử đối với mẫu ngẫu nhiên WX ta thu được mẫu cụ thể
Wx = ( x1 , x2 , . . . , xn ) và tính được giá trị cụ thể của tiêu chuẩn kiểm định G trong (5.1),
gọi là giá trị quan sát, ký hiệu là g hay gqs .
Bước 4 Xét xem giá trị quan sát g có thuộc miền Wα hay không để kết luận.
(a) Nếu g ∈ Wα thì bác bỏ H0 thừa nhận H1 .

(b) Nếu g ∈
/ Wα thì chưa có cơ sở để bác bỏ H0 .
Xác suất α gọi là mức ý nghĩa của tiêu chuẩn kiểm định (thông thường yêu cầu α ≤ 0, 05).
Miền Wα gọi là miền bác bỏ giả thuyết H0 với mức ý nghĩa α nếu P( G ∈ Wα | H0 = α).
Chú ý 5.1. Cùng mức ý nghĩa α đối với một tiêu chuẩn kiểm định G có thể có vô số miền bác
bỏ giả thuyết H0 .
5.1.3 Sai lầm loại I. Sai lầm loại II

Sai lầm loại I: Bác bỏ giả thuyết H0 trong khi H0 đúng. Xác suất mắc sai lầm này chính bằng
α: P( G ∈ Wα | H0 ) = α.
Sai lầm loại 1 phát sinh do kích thước mẫu quá nhỏ, do phương pháp lấy mẫu . . .
Sai lầm loại 2: Thừa nhận H0 trong khi H0 sai, hay giá trị quan sát g không thuộc miền bác
bỏ Wα trong khi H1 đúng. Xác suất mắc sai lầm loại II là
β = P( G ∈
/ Wα | H1 ) = 1 − P( G ∈ Wα | H1 ). (5.3)

Suy ra xác suất bác bỏ giả thuyết H0 nếu nó sai là P( G ∈ Wα | H1 ) = 1 − β. Xác suất này gọi là
hiệu lực của kiểm định, nó chính là xác suất "không mắc sai lầm loại II".
Các tình huống có thể xảy ra trong kiểm định giả thuyết thống kê được tóm tắt trong bảng
dưới đây.
XXX
XXX Thực tế
XXX H0 đúng H0 sai
Quyết định
XXX
XXX
Bác bỏ H0 Sai lầm loại I Quyết định đúng

Xác suất bằng α Xác suất bằng 1 − β
Không bác bỏ H0 Quyết định đúng Sai lầm loại II
Xác suất bằng 1 − α Xác suất bằng β
Bảng 5.1: Các tình huống có thể xảy ra trong kiểm định giả thuyết thống kê
Mục tiêu là phải cực tiểu cả hai sai lầm. Tuy nhiên, điều đó là khó thực hiện. Người ta tìm
cách cố định sai lầm loại I và cực tiểu sai lầm loại II.
Lựa chọn miền bác bỏ để xác suất mắc sai lầm loại 2 là bé nhất: Khi kiểm định giả thuyết
thống kê, nếu mức ý nghĩa α đã chọn, cỡ mẫu n đã xác định, vấn đề còn lại là trong vô số miền
bác bỏ, ta chọn miền Wα sao cho xác suất mắc sai lầm loại II là nhỏ nhất hay hiệu lực của kiểm
định lớn nhất.
Định lý Neymann–Pearson chỉ ra rằng nhiều bài toán quan trọng trong thực tiễn có thể
tìm được miền bác bỏ Wα thỏa mãn yêu cầu trên, nghĩa là
P( G ∈ Wα | H0 ) = α và P( G ∈ Wα | H1 ) = 1 − β → max (5.4)
Trong thực hành, quy tắc được xây dựng dưới đây có miền bác bỏ thỏa mãn tính chất trên.
5.1.4 Thủ tục kiểm định giả thuyết thống kê

Qua nội dung trình bày ở trên ta có thể xây dựng một thủ tục kiểm định giả thuyết thống kê
bao gồm:
1. Phát biểu giả thuyết H0 và đối thuyết H1 .
2. Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n. Chọn tiêu chuẩn kiểm định G
và xác định quy luật phân phối xác suất của G với điều kiện giả thuyết H0 đúng.
3. Với mức ý nghĩa α, xác định miền bác bỏ giả thuyết H0 (ký hiệu là Wα ) tốt nhất tùy thuộc
vào đối thuyết H1 .
4. Từ mẫu cụ thể tính giá trị quan sát gqs của tiêu chuẩn kiểm định.
5. So sánh giá trị quan sát gqs của tiêu chuẩn kiểm định với miền bác bỏ Wα và kết luận.

5.2 Kiểm định giả thuyết về kỳ vọng của biến ngẫu nhiên có
phân phối chuẩn
Bài toán 5.1. Giả sử biến ngẫu nhiên gốc X trong tổng thể có phân phối chuẩn N (µ, σ2 ), trong
đó E( X ) = µ chưa biết nhưng có cơ sở để nêu lên giả thuyết H0 : µ = µ0 với µ0 là tham số đã
biết. Hãy kiểm định giả thuyết này với các thuyết đối H1 : µ 6= µ0 hoặc µ > µ0 hoặc µ < µ0 .
Tiêu chuẩn kiểm định và miền bác bỏ giả thuyết H0 phụ thuộc các trường hợp sau.
5.2.1 Trường hợp đã biết phương sai

Giả sử phương sai σ2 của biến ngẫu nhiên gốc X trong tổng thể có phân bố chuẩn N (µ, σ2 )
đã biết. Từ tổng thể rút ra một mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn ) kích thước n.
Bước 1 Chọn tiêu chuẩn kiểm định:
X − µ√
U= n (5.5)
σ
Nếu giả thuyết H0 đúng thì
X − µ0 √
U= n (5.6)
σ
Theo (4.19) thống kê U có phân phối chuẩn tắc N (0; 1).
Bước 2 Xây dựng miền bác bỏ Wα phụ thuộc vào thuyết đối H1 .
(a) H0 : µ = µ0 , H1 : µ 6= µ0 (bàißtoán kiểm định hai phía).

™ Với mức ý nghĩa α cho trước, giả
thuyết H0 bị bác bỏ nếu P |U | > u1−α/2 (µ = µ0 ) = α, trong đó u1−α/2 được xác định
từ hệ thức Φ(u1−α/2 ) = 1 − α/2. Do đó, miền bác bỏ giả thuyết H0 là
Wα = (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞).
(b) H0 : µ = µ0 , H1 : µ > µ0 (bàißtoán kiểm định một phía).

™ Với mức ý nghĩa α cho trước, ta
tìm giá trị u1−α sao cho P U > u1−α (µ = µ0 ) = α từ bảng giá trị hàm phân phối
chuẩn tắc (Phụ lục 3) và xác định được miền bác bỏ giả thuyết H0 là
Wα = (u1−α ; +∞).
(c) H0 : µ = µ0 , H1 : µ < µ0 (bài phía). Với mức ý nghĩa α cho trước, ta

ß toán kiểm định một ™
tìm giá trị u1−α sao cho P U < −u1−α (µ = µ0 ) = α và xác định được miền bác bỏ giả
thuyết H0 là
Wα = (−∞; −u1−α ).
Tóm lại, miền bác bỏ giả thuyết H0 được xác định như sau:
5.2. Kiểm định giả thuyết về kỳ vọng của biến ngẫu nhiên có phân phối chuẩn 125
H0 H1 Miền bác bỏ Wα
µ = µ0 µ 6 = µ0 (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞)
µ = µ0 µ > µ0 ( u 1− α ; + ∞ )
µ = µ0 µ < µ0 (−∞; −u1−α )
trong đó u1−α/2 và u1−α được xác định từ bảng giá trị hàm phân phối chuẩn tắc Φ( x )
(Phụ lục 3).
Bước 3 Lập mẫu cụ thể Wx = ( x1 , x2 , .., xn ), tính giá trị quan sát của tiêu chuẩn kiểm định:
x − µ0 √
uqs = n (5.7)
σ
Bước 4 Xét xem uqs có thuộc Wα hay không để kết luận.
(a) Nếu uqs ∈ Wα thì bác bỏ giả thuyết H0 .

(b) Nếu uqs ∈
/ Wα thì chưa có cơ sở để bác bỏ giả thuyết H0 .
Ví dụ 5.1. Một hãng bảo hiểm thông báo rằng số tiền trung bình hãng chi trả cho khách hàng
bị tai nạn ô tô là 8500 USD. Để kiểm tra lại, người ta kiểm tra ngẫu nhiên hồ sơ chi trả của 25
khách hàng thì thấy số tiền trung bình chi trả là 8900 USD. Giả sử số tiền chi trả tuân theo luật
phân phối chuẩn với độ lệch chuẩn là 2600 USD. Hãy kiểm định lại thông báo của hãng bảo
hiểm trên với mức ý nghĩa 5%.
Lời giải Ví dụ 5.1 Gọi X là số tiền hãng bảo hiểm chi trả cho khách hàng. X ∼ N (µ, σ2 ) với
σ = 2600. Số tiền trung bình hãng chi trả cho khách hàng là E( X ) = µ chưa biết. Đây là bài
toán kiểm định giả thuyết về kỳ vọng của biến ngẫu nhiên phân phối chuẩn trường hợp đã
biết phương sai.
Bước 1: Đặt giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ 6= µ0 với µ0 = 8500.
X − µ0 √
Bước 2: Chọn tiêu chuẩn kiểm định U = n nếu giả thuyết H0 đúng. U ∼ N (0, 1).
σ
Bước 3: Với α = 0, 05, u1−α/2 = u0,975 = 1, 96, tra từ bảng giá trị hàm phân phối chuẩn tắc
(Phụ lục 3). Miền bác bỏ giả thuyết H0 là
Wα = (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞) = (−∞; −1, 96) ∪ (1, 96; +∞).
Bước 4: Từ số liệu của đầu bài ta có n = 25, µ0 = 8500, x = 8900, σ = 2600 suy ra giá trị quan
sát
x − µ0 √ 8900 − 8500 √
uqs = n= 25 ' 0, 77.
σ 2600
Bước 5: Vì uqs = 0, 77 ∈
/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 . Tức là chưa có cơ sở
để bác bỏ thông báo của hãng bảo hiểm với mức ý nghĩa 5%.
Ví dụ 5.2. Nếu máy móc hoạt động bình thường thì trọng lượng sản phẩm là biến ngẫu nhiên
có phân phối chuẩn N (µ, σ2 ) với trọng lượng trung bình µ0 = 100 gam, độ lệch tiêu chuẩn
σ = 2 gam. Qua một thời gian sản xuất người ta nghi ngờ trọng lượng sản phẩm có xu hướng
tăng lên, cân thử 100 sản phẩm thì trọng lượng trung bình của chúng là 100,4 gam. Với mức ý
nghĩa α = 5% hãy kết luận về điều nghi ngờ trên.
Lời giải Ví dụ 5.2 Gọi X là trọng lượng sản phẩm thì X ∼ N (µ, σ2 ) với σ = 2. Đây là bài toán
kiểm định giả thuyết về kỳ vọng của biến ngẫu nhiên phân phối chuẩn trường hợp đã biết
phương sai.
Bước 1: Đặt giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ > µ0 với µ0 = 100.
X − µ0 √
Bước 2: Chọn tiêu chuẩn kiểm định U = n nếu giả thuyết H0 đúng. U ∼ N (0, 1).
σ
Bước 3: Với α = 0, 05, u1−α = u0,95 = 1, 65, được tra từ bảng giá trị hàm phân phối chuẩn tắc
(Phụ lục 3). Miền bác bỏ giả thuyết H0 là Wα = (u1−α ; +∞) = (1, 65; +∞).
Bước 4: Từ số liệu đầu bài với n = 100, µ0 = 100, σ = 2, x = 100, 4 suy ra giá trị quan sát
x − µ0 √ 100, 4 − 100 √
uqs = n= 100 = 2.
σ 2
Bước 5: Vì uqs = 2 ∈ Wα nên bác bỏ giả thuyết H0 . Tức là điều nghi ngờ nói trên là có cơ sở
với mức ý nghĩa 5%.
5.2.2 Trường hợp chưa biết phương sai, kích thước mẫu n < 30
X − µ√
T= n (5.8)
S
X − µ0 √
T= n (5.9)
S
Theo (4.21), T có phân phối Student với n − 1 bậc tự do.
Bước 2 Miền bác bỏ giả thuyết H0 được xây dựng phụ thuộc vào thuyết đối H1 như sau:

( n −1) ( n −1)
µ = µ0 µ 6 = µ0 − ∞; −t1−α/2 ∪ t1−α/2 ; +∞

( n −1)
µ = µ0 µ > µ0 t 1− α ; + ∞

( n −1)
µ = µ0 µ < µ0 − ∞; −t1−α
( n −1) ( n −1)
trong đó t1−α/2 và t1−α được xác định từ bảng phân phối Student (Phụ lục 4).
Bước 3 Lập mẫu cụ thể Wx = ( x1 , x2 , .., xn ), tính giá trị quan sát của tiêu chuẩn kiểm định:
x − µ0 √
tqs = n (5.10)
s
Bước 4 Xét xem tqs có thuộc Wα hay không để kết luận.
(a) Nếu tqs ∈ Wα thì bác bỏ giả thuyết H0 .

(b) Nếu tqs ∈
Ví dụ 5.3. Một công ty sản xuất hạt giống tuyên bố rằng một loại giống mới của họ có năng
suất trung bình là 21,5 tạ/ha. Gieo thử hạt giống mới này tại 16 vườn thí nghiệm và thu được
kết quả:
19, 2; 18, 7; 22, 4; 20, 3; 16, 8; 25, 1; 17, 0; 15, 8; 21, 0; 18, 6; 23, 7; 24, 1; 23, 4; 19, 8; 21, 7; 18, 9.
Dựa vào kết quả này hãy xác nhận xem quảng cáo của công ty có đúng không với mức ý
nghĩa α = 0, 05. Biết rằng năng suất giống cây trồng là một biến ngẫu nhiên tuân theo luật
phân phối chuẩn.
Lời giải Ví dụ 5.3 Gọi X là năng suất giống cây trồng. X ∼ N (µ, σ2 ). Đây là bài toán kiểm định
giả thuyết về kỳ vọng của biến ngẫu nhiên phân phối chuẩn trường hợp chưa biết phương
sai, mẫu cỡ n = 16 < 30.
Bước 1: Đặt giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ 6= µ0 với µ0 = 21, 5.

X − µ0 √
Bước 2: Chọn tiêu chuẩn kiểm định: T = n nếu giả thuyết H0 đúng. T ∼ T (n−1) .
S
( n −1) (15)
Bước 3: Với α = 0, 05 tra bảng phân phối Student được t1−α/2 = t0,975 = 2, 131. Miền bác bỏ
giả thuyết H0 là

( n −1) ( n −1)
Wα = − ∞; −t1−α/2 ∪ t1−α/2 ; +∞ = (−∞; −2, 131) ∪ (2, 131; +∞).
Bước 4: Từ số liệu đầu bài tính được n = 16, x = 20, 406, s = 3, 038 với µ0 = 21, 5 suy ra giá
trị quan sát
x − µ0 √ 20, 406 − 21, 5 √
tqs = n= 16 = −1, 44.
s 3, 038
Bước 5: Vì tqs = −1, 44 ∈
/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 , nghĩa là với số liệu
này có thể chấp nhận lời quảng cáo của công ty với mức ý nghĩa 5%.
5.2.3 Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30

Chú ý 5.2. Như đã biết phân phối Student xấp xỉ phân phối chuẩn khi n khá lớn. Trong thực
tế khi n ≥ 30 coi T có phân phối chuẩn.
X − µ√
U= n (5.11)
S
X − µ0 √
U= n (5.12)
S
Như đã biết U ∼ N (0; 1).
Bước 2 Xây dựng miền bác bỏ giả thuyết H0 phụ thuộc vào thuyết đối H1 :
µ = µ0 µ 6 = µ0 (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞)
µ = µ0 µ > µ0 ( u 1− α ; + ∞ )
µ = µ0 µ < µ0 (−∞; −u1−α )
(Phụ lục 3).
Bước 3 Lập mẫu cụ thể Wx = ( x1 , . . . , xn ), tính giá trị quan sát của tiêu chuẩn kiểm định:
x − µ0 √
uqs = n (5.13)
s

(b) Nếu uqs ∈
Ví dụ 5.4. Một công ty có một hệ thống máy tính có thể xử lý 1200 hóa đơn trong một giờ.
Công ty mới nhập một hệ thống máy tính mới. Hệ thống này khi chạy kiểm tra trong 40 giờ
cho thấy số hóa đơn được xử lý trung bình trong một giờ là 1260 với độ lệch chuẩn hiệu chỉnh
215. Với mức ý nghĩa 5% hãy nhận định xem hệ thống mới có tốt hơn hệ thống cũ hay không?
Lời giải Ví dụ 5.4 Gọi X là số hóa đơn mà hệ thống máy tính mới xử lý được trong vòng một
giờ. Ta thấy E( X ) = µ là số hóa đơn trung bình mà hệ thống máy tính mới xử lý được trong
một giờ chưa biết. Đây là bài toán kiểm định giả thuyết về kỳ vọng của biến ngẫu nhiên phân
phối chuẩn trường hợp chưa biết phương sai mẫu cỡ n = 40 > 30.
Bước 1: Kiểm tra giả thuyết H0 : µ = µ0 , đối thuyết H1 : µ > µ0 với µ0 = 1200.
X − µ0 √
Bước 2: Chọn tiêu chuẩn kiểm định: U = n nếu H0 đúng. U ∼ N (0, 1).
S
Bước 3: Với α = 0, 05 tra bảng giá trị hàm phân phối chuẩn tắc được u1−α = u0,95 = 1, 65.
Miền bác bỏ giả thuyết H0 là Wα = (u1−α ; +∞) = (1, 65; +∞).
Bước 4: Từ số liệu đầu bài ta có µ0 = 1200, n = 40, x = 1250, s = 215 suy ra giá trị quan sát
x − µ0 √ 1260 − 1200 √
uqs = n= 40 = 1, 76.
s 215
Bước 5: Vì uqs = 1, 76 ∈ Wα nên bác bỏ giả thuyết H0 , nghĩa là với số liệu này có thể coi hệ
thống máy mới tốt hơn hệ thống máy cũ với mức ý nghĩa 5%.
Nhận xét 5.1. Nếu tổng thể của biến ngẫu nhiên X không tuân theo quy luật phân phối chuẩn
thì ta có thể tiến hành chọn mẫu có kích thước lớn n ≥ 30, khi đó ta có thể tiến hành kiểm
định tương tự như tiến hành kiểm định đối với biến ngẫu nhiên có phân phối chuẩn. Do đó,
trong nhiều trường hợp người ta có thể bỏ qua giả thiết chuẩn của biến ngẫu nhiên gốc X (khi
mẫu kích thước lớn).
Do đó,
(a) Nếu kích thước mẫu n < 30 thì ta phải có điều kiện X ∼ N (µ, σ2 ).
(b) Nếu n ≥ 30 ta có thể bỏ qua giả thiết chuẩn của biến ngẫu nhiên gốc X.
TUẦN 14
5.3 Kiểm định giả thuyết về tỷ lệ hay xác suất
5.3.1 Bài toán

Bài toán 5.2. Giả sử ta quan tâm đến một đặc trưng A nào đó mà mỗi cá thể của tổng thể có
thể có tính chất này hoặc không. Gọi p là tần suất có đặc trưng A của tổng thể (p cũng là xác
suất cá thể có đặc trưng A của tổng thể). Dấu hiệu nghiên cứu này là một biến ngẫu nhiên X
tuân theo luật phân phối Béc-nu-li với kỳ vọng bằng p. Nếu p chưa biết, nhưng có cơ sở để
nêu lên giả thuyết
H0 : p = p0 với p0 là tỷ lệ đã biết.
Hãy kiểm định giả thuyết này với thuyết đối
H1 : p 6= p0 hoặc p > p0 hoặc p < p0 .
Do không biết p nên người ta thực hiện n phép thử độc lập, cùng điều kiện, trong đó có
m phép thử xảy ra A. Tần suất mẫu f = m/n là ước lượng điểm không chệch cho p. Ta có f có
p (1 − p )
phân phối xấp xỉ phân phối chuẩn với kỳ vọng E( f ) = p và phương sai V ( f ) = . Từ
n
đó bài toán kiểm định giả thuyết về tỷ lệ không có khác biệt căn bản so với bài toán kiểm định
giả thuyết về kỳ vọng.
5.3.2 Các bước tiến hành

Bước 1 Với giả thuyết H0 đúng xét thống kê
f − p0 √
U=p n (5.14)
p0 (1 − p0 )
Theo (4.22) khi n đủ lớn thống kê (5.14) xấp xỉ phân phối chuẩn tắc N (0; 1). Trong thực
tế khi np0 ≥ 5 và n(1 − p0 ) ≥ 5 thì có thể xem thống kê U trong (5.14) tuân theo luật
phân phối chuẩn tắc N (0; 1).
Bước 2 Xây dựng miền bác bỏ giả thuyết H0 phụ thuộc vào thuyết đối H1 như sau:
p = p0 p 6 = p0 (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞)
p = p0 p > p0 ( u 1− α ; + ∞ )
p = p0 p < p0 (−∞; −u1−α )
5.3. Kiểm định giả thuyết về tỷ lệ hay xác suất 131

(Phụ lục 3).
Bước 3 Lập mẫu cụ thể, tính giá trị quan sát của tiêu chuẩn kiểm định:
f − p0 √ m
uqs = p n, f = (5.15)
p0 (1 − p0 ) n

(b) Nếu uqs ∈
1
Ví dụ 5.5. Một công ty A sản xuất bánh kẹo tuyên bố rằng số trẻ em thích ăn bánh kẹo của
2
công ty. Trong một mẫu gồm 100 trẻ em được hỏi, có 47 em tỏ ra thích ăn bánh của công ty.
Với mức ý nghĩa 5%, số liệu trên có chứng tỏ là tuyên bố của công ty là đúng hay không?
Lời giải Ví dụ 5.5 Gọi p là tỷ lệ trẻ em thích bánh của công ty. Đây là bài toán kiểm định giả
thuyết về tỷ lệ của tổng thể.
Bước 1: Đặt giả thuyết H0 : p = p0 , đối thuyết H1 : p 6= p0 với p0 = 0, 5.

f − p0 √
Bước 2: Chọn tiêu chuẩn kiểm định U = p n nếu giả thuyết H0 đúng.
p0 (1 − p0 )
Vì np0 = n(1 − p0 ) = 100 × 0, 5 = 50 khá lớn nên U ∼ N (0, 1).
Bước 3: Với α = 0, 05 tra bảng giá trị hàm phân phối chuẩn tắc được u1−α/2 = u0,975 = 1, 96.
Miền bác bỏ giả thuyết H0 là
Wα = (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞) = (−∞; −1, 96) ∪ (1, 96; +∞).
m 47
Bước 4: Từ số liệu đã cho ta có n = 100, m = 47 tính được f = = = 0, 47, với p0 = 0, 5
n 100
suy ra giá trị quan sát
f − p0 √ 0, 47 − 0, 5 √
uqs = p n= √ 100 = −0, 6.
p0 × (1 − p0 ) 0, 5 × 0, 5
Bước 5: Vì uqs = −0, 6 ∈

/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 hay tuyên bố của công
ty là có cơ sở với mức ý nghĩa 5%.
TÓM TẮT về tiêu chuẩn kiểm định và miền bác bỏ giả thuyết H0 :
5.3. Kiểm định giả thuyết về tỷ lệ hay xác suất 132

Trường hợp Tiêu chuẩn kiểm định H0 H1 Miền bác bỏ Wα

nếu H0 đúng
X − µ0 √
σ2 đã biết U= n µ = µ0 µ 6 = µ0 (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞)
σ
µ > µ0 ( u 1− α ; + ∞ )
µ < µ0 (−∞; −u1−α )
X − µ0 √
( n −1)

( n −1)

σ2 chưa biết T= n µ = µ0 µ 6 = µ0 − ∞; −t1−α/2 ∪ t1−α/2 ; +∞
S
( n −1)
n < 30 µ > µ0 t 1− α ; + ∞

( n −1)
µ < µ0 − ∞; −t1−α
X − µ0 √
σ2 chưa biết U= n µ = µ0 µ 6 = µ0 (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞)
S
n ≥ 30 µ > µ0 ( u 1− α ; + ∞ )
µ < µ0 (−∞; −u1−α )
f − p0 √
np0 ≥ 5 U=p n p = p0 p 6 = p0 (−∞; −u1−α/2 ) ∪ (u1−α/2 ; +∞)
p0 (1 − p0 )
n (1 − p0 ) ≥ 5 p > p0 ( u 1− α ; + ∞ )
p < p0 (−∞; −u1−α )
5.4 So sánh hai kỳ vọng của hai biến ngẫu nhiên phân phối
chuẩn
Bài toán 5.3. Cho hai biến ngẫu nhiên phân phối chuẩn X ∼ N (µ1 , σ12 ), Y ∼ N (µ2 , σ22 ). Bài
toán đặt ra là cần so sánh giá trị kỳ vọng µ1 với µ2 :
Giả thuyết H0 µ1 = µ2 µ1 = µ2 µ1 = µ2
Đối thuyết H1 µ1 6 = µ2 µ1 > µ2 µ1 < µ2
5.4.1 Trường hợp phương sai σ12 , σ22 đã biết

Từ tổng thể rút ra hai mẫu ngẫu nhiên WX = ( X1 , X2 , . . . , Xn1 ), WY = (Y1 , Y2 , . . . , Yn2 ).
Bước 1 Chọn tiêu chuẩn kiểm định
X − Y − ( µ1 − µ2 )
U= (5.16)
σ12 σ22
+
n1 n2
5.4. So sánh hai kỳ vọng của hai biến ngẫu nhiên phân phối chuẩn 133
Nếu giả thuyết H0 đúng thì µ1 − µ2 = 0 và
X−Y
U= (5.17)
σ12 σ22
+
n1 n2
Bước 2 Miền bác bỏ giả thuyết H0 được xác định phụ thuộc vào thuyết đối H1 như sau:
µ1 = µ2 µ1 6 = µ2 (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞)
µ1 = µ2 µ1 > µ2 ( u 1− α ; + ∞ )
µ1 = µ2 µ1 < µ2 (−∞; −u1−α )
(Phụ lục 3).
Bước 3 Từ mẫu cụ thể Wx = ( x1 , x2 , . . . , xn1 ), Wy = (y1 , y2 , . . . , yn2 ), ta tính được giá trị quan
sát của tiêu chuẩn kiểm định:
x−y
uqs = (5.18)
σ12 σ22
+
n1 n2
Bước 4 Xét xem uqs có thuộc Wα hay không để kết luận:

(b) Nếu uqs ∈
5.4.2 Trường hợp phương sai σ12 , σ22 chưa biết, cỡ mẫu n1 < 30, n2 < 30
Giả sử σ12 = σ22 = σ2 .
X − Y − ( µ1 − µ2 )
T= (5.19)
(n1 − 1)S12 + (n2 − 1)S22 1

1
+
n1 + n2 − 2 n1 n2
X−Y
T= (5.20)
(n1 − 1)S12 + (n2 − 1)S22 1

1
+
n1 + n2 − 2 n1 n2
Nếu giả thiết hai biến ngẫu nhiên gốc có phương sai giống nhau thì thống kê T trong
(5.20) có phân phối Student với n1 + n2 − 2 bậc tự do, T ∼ T (n1 +n2 −2) .

( n + n −2) ( n + n −2)
µ1 = µ2 µ1 6 = µ2 − ∞; −t1−1 α 2 ∪ t1−1 α 2 ; +∞
2 2

( n1 + n2 −2)
µ1 = µ2 µ1 > µ2 t 1− α ; +∞

( n1 + n2 −2)
µ1 = µ2 µ1 < µ2 − ∞; −t1−α
( n + n2 −2) ( n + n2 −2)
trong đó t1−1 α và t1−1α được xác định từ bảng phân phối Student (Phụ lục 4).
2
x−y
tqs = (5.21)
(n1 − 1)s21 + (n2 − 1)s22 1

1
+
n1 + n2 − 2 n1 n2
Bước 4 Xét xem uqs có thuộc Wα hay không để kết luận:

(a) Nếu uqs ∈
Chú ý 5.3. Trường hợp mẫu cặp ( xi , yi ), i = 1, 2, . . . , n ta có thể thiết lập hiệu zi = xi − yi và
đưa về bài toán kiểm định giả thuyết H0 : E( Z ) = 0, ( Z = X − Y ), đối thuyết H1 : E( Z ) 6= 0
hoặc H1 : E( Z ) > 0 hoặc H1 : E( Z ) < 0.
Ví dụ 5.6. Để so sánh hai chế độ bón phân cho một loại cây trồng A, trên 8 mảnh ruộng người
ta chia mỗi mảnh thành hai nửa: nửa thứ nhất áp dụng phương pháp bón phân I, nửa thứ
hai theo phương pháp bón phân II (với các chế độ chăm sóc khác nhau). Sau khi thu hoạch ta
được số liệu về năng suất loại cây trồng A như sau:
Mảnh 1 2 3 4 5 6 7 8
Năng suất nửa thứ nhất 5 20 16 22 24 14 18 20
Năng suất nửa thứ hai 15 22 14 25 29 16 20 24
Đánh giá xem hai chế độ bón phân có giống nhau không với mức ý nghĩa 1%. Biết rằng năng
suất loại cây trồng A (sau hai phương pháp bón phân) có phân phối chuẩn và có cùng phương
sai.

Cách 1: Gọi X, Y lần lượt là năng suất loại cây trồng A ở nửa thứ nhất, thứ hai (sử dụng hai
phương pháp bón phân tương ứng). Ta có X ∼ N (µ1 , σ12 ), Y ∼ N (µ2 , σ22 ). Đây là bài toán so
sánh hai kỳ vọng của hai biến ngẫu nhiên có phân phối chuẩn trường hợp chưa biết phương
sai, mẫu cỡ n1 = n2 = 8 < 30 và σ12 = σ22 .
Bước 1: Đặt giả thuyết H0 : µ1 = µ2 , đối thuyết H1 : µ1 6= µ2 .
X−Y
Bước 2: Chọn tiêu chuẩn kiểm định T = nếu H0 đúng.
(n1 − 1)S12 + (n2 − 1)S22 1

1
+
n1 + n2 − 2 n1 n2
Vì X và Y có cùng phương sai, nên T ∼ T (n1 +n2 −2) .
( n + n2 −2) (14)
Bước 3: Với α = 0, 05 tra bảng phân phối Student được t1−1 α = t0,995 = 2, 977. Miền bác
2
bỏ giả thuyết H0 là

( n1 + n2 −2) ( n1 + n2 −2)
Wα = − ∞; −t1− α ∪ t 1− α ; +∞ = (−∞; −2, 977) ∪ (2, 977; +∞).
2 2
Bước 4: Từ số liệu đã cho tính được n1 = n2 = 8, x = 17, 375, s21 = 35, 125, y = 20, 625,
s22 = 28, 5535 suy ra giá trị quan sát
x−y −3, 25
tqs = = 2, 6391 = −1, 2314.
(n1 − 1)s21 + (n2 − 1)s22

1 1
+
n1 + n2 − 2 n1 n2
Bước 5: Vì tqs = −1, 2314 ∈

/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 , hay có thể xem hai
phương pháp bón phân cho kết quả như nhau với mức ý nghĩa 1%.
Cách 2: Đặt Z = X − Y, thiết lập hiệu zi = xi − yi , i = 1, . . . , 8 với
xi 5 20 16 22 24 14 18 20
yi 15 22 14 25 29 16 20 24
zi -10 -2 2 -3 -4 -2 -2 -2
Ta đưa về bài toán kiểm định giả thuyết H0 : µ Z = 0, đối thuyết H1 : µ Z 6= 0, µ Z = E( Z ).
5.4.3 Trường hợp phương sai σ12 , σ22 chưa biết, cỡ mẫu n1 ≥ 30, n2 ≥ 30
X − Y − ( µ1 − µ2 )
U= (5.22)
S12 S22
+
n1 n2
Nếu giả thuyết H0 đúng thì µ1 − µ2 = 0 và
X−Y
U= (5.23)
S12 S22
+
n1 n2
Bước 2 Miền bác bỏ giả thuyết H0 được xác định cho ba trường hợp như sau:
µ1 = µ2 µ1 6 = µ2 (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞)
µ1 = µ2 µ1 > µ2 ( u 1− α ; + ∞ )
µ1 = µ2 µ1 < µ2 (−∞; −u1−α )
(Phụ lục 3).
x−y
uqs = (5.24)
s21 s22
+
n1 n2

(b) Nếu uqs ∈
Ví dụ 5.7. Hai máy tự động dùng để cắt những thanh kim loại do cùng một kỹ thuật viên
phụ trách và căn chỉnh. Từ mỗi máy lấy ra 31 thanh kim loại để kiểm tra và thu được kết quả
sau:
Máy 1: Trung bình mẫu là 12 cm, độ lệch chuẩn hiệu chỉnh là 1,2 cm.
Máy 2: Trung bình mẫu là 12,3 cm, độ lệch hiệu chỉnh là 1,4 cm.
Với mức ý nghĩa α = 0, 01 có thể cho rằng chiều dài của các thanh kim loại do máy 2 sản xuất
khác chiều dài do máy 1 sản xuất hay không. Biết chiều dài thanh kim loại do các máy sản
xuất có phân phối chuẩn.
Lời giải Ví dụ 5.7 Gọi X, Y lần lượt là chiều dài các thanh kim loại do máy 1, 2 sản xuất. Khi đó
X ∼ N (µ1 , σ12 ), Y ∼ N (µ2 , σ22 ). Đây là bài toán so sánh hai kỳ vọng của hai biến ngẫu nhiên
có phân phối chuẩn trường hợp chưa biết phương sai, mẫu cỡ n1 = n2 = 31 > 30.
Bước 1: Đặt giả thuyết H0 : µ1 = µ2 , đối thuyết H1 : µ1 6= µ2 .
X−Y
Bước 2: Chọn tiêu chuẩn kiểm định U = nếu giả thuyết H0 đúng. U ∼ N (0, 1).
S12 S22
+
n1 n2
Bước 3: Với α = 0, 01 tra bảng giá trị hàm phân phối chuẩn tắc được u1− α2 = u0,995 = 2, 58.
Miền bác bỏ giả thuyết H0 là
Wα = (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) = (−∞; −2, 58) ∪ (2, 58; +∞).
Bước 4: Từ số liệu đã cho ta có n1 = n2 = 31, x = 12, s1 = 1, 2, y = 12, 3, s2 = 1, 4, suy ra giá

trị quan sát
x−y 12 − 12, 3
uqs = =… = −0, 9085.
s21 s2 1, 44 1, 94
+ 2 +
n1 n2 31 31
Bước 5: Vì uqs = −0, 9085 ∈

/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 , hay có thể xem
chiều dài các thanh kim loại do hai nhà máy sản xuất là như nhau với mức ý nghĩa 1%.
Chú ý 5.4. (a) Nếu cỡ mẫu n1 , n2 nhỏ thì ta phải thêm giả thuyết biến ngẫu nhiên gốc tuân
theo phân phối chuẩn; nếu n1 và n2 khá lớn ta có thể bỏ giả thiết chuẩn của đầu bài.
(b) Hai đối thuyết µ1 > µ2 và µ1 < µ2 dễ dàng chuyển đổi cho nhau bằng cách thay đổi thứ
tự của hai mẫu.
5.5 So sánh hai tỷ lệ
5.5.1 Bài toán

Bài toán 5.4. Giả sử p1 , p2 tương ứng là tỷ lệ các phần tử mang dấu hiệu A nào đó của tổng
thể thứ nhất và tổng thể thứ hai. Mẫu của tổng thể thứ nhất: Thực hiện n1 phép thử độc lập
cùng điều kiện, có m1 phép thử xảy ra sự kiện A. Mẫu của tổng thể thứ hai: Thực hiện n2 phép
thử độc lập cùng điều kiện, có m2 phép thử xảy ra sự kiện A. Hãy so sánh p1 với p2 .
Cặp giả thuyết đặt ra là:
Giả thuyết H0 p1 = p2 p1 = p2 p1 = p2
Đối thuyết H1 p1 6 = p2 p1 > p2 p1 < p2
5.5. So sánh hai tỷ lệ 138

5.5.2 Các bước tiến hành

Đặt
m1 + m2
f = . (5.25)
n1 + n2
( f 1 − f 2 ) − ( p1 − p2 )
U= (5.26)
1 1
f (1 − f ) +
n1 n2
Nếu giả thuyết H0 đúng thì p1 = p2 và
f1 − f2
U= (5.27)
1 1
f (1 − f ) +
n1 n2
Ta có U ∼ N (0; 1).
p1 = p2 p1 6 = p2 (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞)
p1 = p2 p1 > p2 ( u 1− α ; + ∞ )
p1 = p2 p1 < p2 (−∞; −u1−α )
(Phụ lục 3).
Bước 3 Từ mẫu thu thập, ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
f1 − f2
uqs = (5.28)
1 1
f (1 − f ) +
n1 n2
m1 m2 m + m2 n . f + n2 . f 2
với f 1 = , f2 = ,f = 1 = 1 1 .
n1 n2 n1 + n2 n1 + n2

(b) Nếu uqs ∈

Ví dụ 5.8. Từ kho đồ hộp thứ nhất lấy ngẫu nhiên 1000 hộp để kiểm tra thấy có 20 hộp bị
hỏng. Từ kho đồ hộp thứ hai lấy ngẫu nhiên 900 hộp kiểm tra thấy 30 hộp bị hỏng. Hỏi chất
lượng bảo quản của 2 kho có thực sự giống nhau hay không với mức ý nghĩa 5%.
Lời giải Ví dụ 5.8 Gọi p1 , p2 lần lượt là tỷ lệ hộp hỏng ở kho đồ hộp thứ nhất và thứ hai tương
ứng. Đây là bài toán so sánh hai tỷ lệ.
Bước 1: Đặt giả thuyết H0 : p1 = p2 , đối thuyết H1 : p1 6= p2 .

f1 − f2
Bước 2: Chọn tiêu chuẩn kiểm định U = nếu giả thuyết H0 đúng. Ta
1 1
f (1 − f ) +
n1 n2
thấy U ∼ N (0, 1).
Bước 3: Với α = 0, 05 tra bảng giá trị hàm phân phối chuẩn tắc được u1−α/2 = 1, 96. Miền bác
bỏ giả thuyết H0 là:
Wα = (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) = (−∞; −1, 96) ∪ (1, 96; +∞).
2
Bước 4: Theo đầu bài n1 = 1000, n2 = 900, m1 = 20, m2 = 30, f 1 = ,
100
3 n f + n2 f 2 20 + 30 5
f2 = ,f = 1 1 = = , suy ra
90 n1 + n2 1900 190
f1 − f2
uqs = = −1, 8129.
1 1
f (1 − f ) +
n1 n2
Bước 5: Kết luận: Vì uqs = −1, 8129 ∈

/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 , nghĩa là
có thể xem chất lượng bảo quản của hai kho hàng là như nhau với mức ý nghĩa 5%.
Ví dụ 5.9. Một bệnh viện điều trị loại bệnh A theo hai phương pháp. Sau một thời gian thấy
kết quả như sau:
Trong 102 bệnh nhân điều trị phương pháp I có 82 bệnh nhân khỏi bệnh.
Trong 98 bệnh nhân điều trị phương pháp II có 69 bệnh nhân khỏi bệnh.
Hỏi có phải phương pháp I điều trị tốt hơn phương pháp II hai hay không với mức ý nghĩa
5%.
Lời giải Ví dụ 5.9 Gọi p1 , p2 lần lượt là tỷ lệ bệnh nhân khỏi bệnh khi điều trị bằng phương
pháp I và II tương ứng. Đây là bài toán so sánh hai tỷ lệ.
Bước 1: Đặt giả thuyết H0 : p1 = p2 , đối thuyết H1 : p1 > p2 .

f1 − f2
Bước 2: Chọn tiêu chuẩn kiểm định U = nếu giả thuyết H0 đúng. Ta
1 1
f (1 − f ) +
n1 n2
thấy U ∼ N (0, 1).
Bước 3: Với α = 0, 05 tra bảng giá trị hàm phân phối chuẩn tắc được u1−α = 1, 65. Miền bác
bỏ giả thuyết H0 là Wα = (u1−α ; +∞) = (1, 65; +∞).
Bước 4: Theo đầu bài n1 = 102, n2 = 98, m1 = 82, m2 = 69,

82 69 n f + n2 f 2 82 + 69 151
f1 = , f2 = , f = 1 1 = = , suy ra
102 98 n1 + n2 102 + 98 200
f1 − f2
uqs = = 1, 641.
1 1
f (1 − f ) +
n1 n2
Bước 5: Vì uqs = 1, 641 ∈

/ Wα nên chưa có cơ sở để bác bỏ giả thuyết H0 , nghĩa là chưa thể
xem phương pháp I điều trị tốt hơn phương pháp II với mức ý nghĩa 5%.
Ví dụ 5.10 (Đề thi cuối kỳ 20191). Để điều tra doanh thu của các gia đình kinh doanh loại mặt
hàng A tại địa phương B, người ta khảo sát 100 gia đình kinh doanh loại mặt hàng này trong
một tháng của năm 2019 thu được bảng số liệu
Doanh thu (triệu VNĐ) 25 30 35 40 45 50 55 60 65

Số gia đình 4 9 17 25 20 10 8 4 3
(a) Với độ tin cậy 95% hãy ước lượng doanh thu trung bình/tháng của các gia đình kinh
doanh loại mặt hàng A tại địa phương B.
(b) Một tài liệu thống kê cho biết doanh thu trung bình/tháng của các gia đình kinh doanh
loại mặt hàng A tại địa phương B là 40 triệu VNĐ. Hãy cho kết luận về tài liệu nói trên
(c) Điều tra doanh thu của 200 gia đình kinh doanh loại mặt hàng A ở địa phương C người
ta tính được doanh thu trung bình/tháng là 43 triệu VNĐ và độ lệch tiêu chuẩn mẫu
hiệu chỉnh là 8,912 triệu VNĐ. Doanh thu trung bình loại mặt hàng A ở địa phương C
và B (với số liệu ở Câu 4) có như nhau hay không? Hãy kết luận với mức ý nghĩa 1%.
(a) Gọi X(triệu VNĐ/tháng) là biến ngẫu nhiên chỉ doanh thu của các gia đình kinh doanh
mặt hàng A của địa phương B. Ký hiệu E( X ) = µ X . Đây là bài toán ước lượng khoảng
của kỳ vọng trường hợp chưa biết phương sai, mẫu cỡ n = 100 > 30.

X − µX √
Chọn thống kê U = n. Thống kê U ∼ N (0, 1).
SX

sX sX
Áp dụng khoảng tin cậy đối xứng x − u1− α2 √ ; x + u1− α2 √ .
n n
Với γ = 95%, u1− α2 = u0,975 = 1, 96. Từ bảng số liệu tính được n = 100, x = 42, 4, sX =
9, 2245, suy ra khoảng tin cậy cần tìm (40, 592 ; 44, 208).
Vậy doanh thu trung bình của các gia đình kinh doanh loại mặt hàng A tài địa phương B là
từ 40,592 triệu đồng/tháng đến 44,208 triệu đồng/tháng với độ tin cậy 95%.
(b) Đây là bài toán kiểm định giả thuyết của kỳ vọng trường hợp chưa biết phương sai, mẫu
cỡ n = 100 > 30.
Kiểm định cặp giả thuyết H0 : µ X = µ0 , H1 : µ X 6= µ0 , µ0 = 40.
X − µ0 √
Chọn thống kê U = n. Thống kê U ∼ N (0, 1).
SX
Với α = 5%, miền bác bỏ H0 là Wα = (−∞; −u1−α/2 ) ∪ (u1−α/2;+∞ ) = (−∞; −1, 96) ∪
(1, 96; +∞).
Từ bảng số liệu tính được n = 100, x = 42, 4, sX = 9, 2245, suy ra giá trị quan sát uqs =
x − µ0 √ 42, 4 − 40, 0
n= × 10 ' 2, 6018.
sX 9, 2245
Vì uqs = 2, 6018 ∈ Wα nên bác bỏ H0 , chấp nhận H1 , nghĩa là tài liệu thống kê chưa có cơ sở
(c) Gọi Y(triệu đồng/tháng) là biến ngẫu nhiên chỉ doanh thu của các gia đình ở địa phương
C. Ký hiệu E(Y ) = µY . Đây là bài toán so sánh hai giá trị trung bình của hai tổng thể
trường hợp chưa biết phương sai, mẫu cỡ n = 100 > 30 và m = 200 > 30.
Kiểm định cặp giả thuyết H0 : µ X = µY , H1 : µ X 6= µY .
X−Y
Chọn thống kê U = q 2 2
. Thống kê U ∼ N (0, 1) khi H0 đúng.
SX SY
n + m
Với α = 5%, miền bác bỏ H0 là Wα = (−∞; −u1−α/2 ) ∪ (u1−α/2;+∞ ) = (−∞; −2, 575) ∪
(2, 575; +∞).
Từ bảng số liệu tính được n = 100, x = 42, 4, sX = 9, 2245, m = 200, y = 43, sY = 8, 912 suy
x−y
ra giá trị quan sát uqs = q 2 2
' −0, 5371.
sX sY
n + m
Vì uqs = −0, 5371 ∈

/ Wα nên chấp nhận H0 , nghĩa là doanh thu trung bình mặt hàng A ở địa
phương C và B là như nhau mức ý nghĩa 5%.

Ôn tập
TUẦN 15
Giới thiệu phần mềm xử lý số liệu thống kê thông dụng
Giới thiệu
Ứng dụng giải bài toán ước lượng tham số
Ứng dụng giải bài toán kiểm định giả thuyết
Ôn tập
143
Chương 6
Phụ lục các bảng số
6.1 Phụ lục các bảng số
6.1.1 Phụ lục 1: Giá trị hàm Gao-xơ
6.1.2 Phụ lục 2: Giá trị hàm Láp-la-xơ
6.1.3 Phụ lục 3: Giá trị hàm phân phối chuẩn tắc
6.1.4 Phụ lục 4: Giá trị phân phối Student
6.1.5 Phụ lục 5: Giá trị hàm khối lượng xác suất Poa-xông
116
−x 2
Phụ lục 1: Giá trị hàm mật độ xác suất phân phối chuẩn tắc (hàm Gao-xơ) ϕ( x ) = √1 e 2
2π
x 0 1 2 3 4 5 6 7 8 9
0,0 0,3989 3989 3989 3986 3986 3984 3982 3980 3977 3973
0,1 3970 3965 3961 3956 3951 3945 3939 3932 3925 3918
0,2 3910 3902 3894 3885 3876 3867 3857 3847 3836 3825
0,3 3814 3802 3790 3778 3765 3752 3739 3726 3712 3697
0,4 3683 3668 3653 3637 3621 3605 3589 3572 3555 3538
0,5 3521 3503 3485 3467 3448 3429 3410 3391 3372 3352
0,6 3332 3312 3292 3271 3251 3230 3209 3187 3166 3144
0,7 3123 3101 3079 3056 3034 3011 2989 2966 2943 2920
0,8 2897 2874 2850 2827 2803 2780 2756 2732 2709 2685
0,9 2661 2637 2613 2589 2565 2541 2516 2492 2468 2444
1,0 2420 2396 2371 2347 2323 2299 2275 2251 2227 2203
1,1 2197 2155 2131 2107 2083 2059 2036 2012 1989 1965
1,2 1942 1919 1895 1872 1849 1826 1804 1781 1758 1736
1,3 1714 1691 1669 1647 1626 1604 1582 1561 1539 1518
1,4 1497 1476 1456 1435 1415 1394 1374 1354 1334 1315
1,5 1295 1276 1257 1238 1219 1200 1182 1163 1145 1127
1,6 1109 1092 1074 1057 1040 1023 1006 0989 0973 0957
1,7 0940 0925 0909 0893 0878 0863 0848 0833 0818 0804
1,8 0790 0775 0761 0748 0734 0721 0707 0964 0681 0669
1,9 0656 0644 0632 0620 0608 0596 0584 0573 0562 0551
2,0 0,0540 0529 0519 0508 0498 0488 0478 0468 0459 0449
2,1 0440 0431 0422 0413 0404 0396 0388 0379 0371 0363
2,2 0355 0347 0339 0332 0325 0317 0310 0303 0297 0290
2,3 0283 0277 0270 0264 0258 0252 0246 0241 0235 0229
2,4 0224 0219 0213 0208 0203 0198 0194 0189 0184 0180
2,5 0175 0171 0167 0163 0158 0154 0151 0147 0143 0139
2,6 0136 0132 0129 0126 0122 0119 0116 0113 0110 0107
2,7 0104 0101 0099 0096 0093 0091 0088 0086 0084 0081
2,8 0079 0077 0075 0073 0071 0069 0067 0065 0063 0061
2,9 0060 0058 0056 0055 0053 0051 0050 0048 0047 0046
3,0 0044 0043 0042 0040 0039 0038 0037 0036 0035 0034
3,1 0033 0032 0031 0030 0029 0028 0027 0026 0025 0025
3,2 0024 0023 0022 0022 0021 0020 0020 0019 0018 0018
3,3 0017 0017 0016 0016 0015 0015 0014 0014 0013 0013
3,4 0012 0012 0012 0011 0011 0010 0010 0010 0009 0009
3,5 0009 0008 0008 0008 0008 0007 0007 0007 0007 0006
3,6 0006 0006 0006 0006 0006 0005 0005 0005 0005 0004
3,7 0004 0004 0004 0004 0004 0004 0003 0003 0003 0003
3,8 0003 0003 0003 0003 0003 0002 0002 0002 0002 0002
3,9 0002 0002 0002 0002 0002 0002 0002 0002 0001 0001
6.1. Phụ lục các bảng số 117

Z x
− t2
Phụ lục 2: Giá trị hàm Láp-la-xơ φ( x ) = √1 e 2 dt
2π 0
x 0 1 2 3 4 5 6 7 8 9
0,0 0,00000 00399 00798 01197 01595 01994 02392 02790 03188 03586
0,1 03983 04380 04776 05172 05567 05962 06356 06749 07142 07535
0,2 07926 08317 08706 09095 09483 09871 10257 10642 11026 11409
0,3 11791 12172 12556 12930 13307 13683 14058 14431 14803 15173
0,4 15542 15910 16276 16640 17003 17364 17724 18082 18439 18739
0,5 19146 19447 19847 20194 20194 20884 21226 21566 21904 22240
0,6 22575 22907 23237 23565 23891 24215 24537 24857 25175 25490
0,7 25804 26115 26424 26730 27035 27337 27637 27935 28230 28524
0,8 28814 29103 29389 29673 29955 30234 30511 30785 31057 31327
0,9 31594 31859 32121 32881 32639 32894 33147 33398 33646 33891
1,0 34134 34375 34614 34850 35083 35314 35543 35769 35993 36214
1,1 36433 36650 36864 37076 37286 37493 37698 37900 38100 38298
1,2 38493 38686 38877 39065 39251 39435 39617 39796 39973 40147
1,3 40320 40490 40658 40824 40988 41149 41309 41466 41621 41774
1,4 41924 42073 42220 42364 42507 42647 42786 42922 43056 43189
1,5 43319 43448 43574 43699 43822 43943 44062 44179 44295 44408
1,6 44520 44630 44738 44815 44950 45053 45154 45254 45352 45449
1,7 45543 45637 45728 45818 45907 45994 46080 46164 46246 46327
1,8 46407 46485 46562 46638 46712 46784 46856 46926 46995 47062
1,9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47670
2,0 47725 47778 47831 47882 47932 47982 48030 48077 48124 48169
2,1 48214 48257 48300 48341 48382 48422 49461 48500 48537 48574
2,2 48610 48645 48679 48713 48745 48778 48809 48840 48870 48899
2,3 48928 48956 48983 49010 49036 49061 49086 49111 49134 49158
2,4 49180 49202 49224 49245 49266 49285 49305 49324 49343 49361
2,5 49379 49396 49413 49430 49446 49261 49477 49492 49506 49520
2,6 49534 49547 49560 49573 49585 49598 49609 49621 49632 49643
2,7 49653 49664 49674 49683 49693 49702 49711 49720 49728 49763
2,8 49744 49752 49760 49767 49774 49781 49788 49795 49801 49807
2,9 49813 49819 49825 49831 49836 49841 49846 49851 49856 49861
3,0 0,49865 3,1 49903 3,2 49931 3,3 49952 3,4 49966
3,5 49977 3,6 49984 3,7 49989 3,8 49993 3,9 49995
4,0 499968
4,5 499997
5,0 49999997

Z x
− t2
Phụ lục 3: Giá trị hàm phân phối chuẩn tắc Φ( x ) = √1 e 2 dt
2π −∞
x 0 1 2 3 4 5 6 7 8 9
0,0 0,50000 50399 50798 51197 51595 51994 52392 52790 53188 53586
0,1 53983 54380 54776 55172 55567 55962 56356 56749 57142 57535
0,2 57926 58317 58706 59095 59483 59871 60257 60642 61026 61409
0,3 61791 62172 62556 62930 63307 63683 64058 64431 64803 65173
0,4 65542 65910 66276 66640 67003 67364 67724 68082 68439 68739
0,5 69146 69447 69847 70194 70544 70884 71226 71566 71904 72240
0,6 72575 72907 73237 73565 73891 74215 74537 74857 75175 75490
0,7 75804 76115 76424 76730 77035 77337 77637 77935 78230 78524
0,8 78814 79103 79389 79673 79955 80234 80511 80785 81057 81327
0,9 81594 81859 82121 82381 82639 82894 83147 83398 83646 83891
1,0 84134 84375 84614 84850 85083 85314 85543 85769 85993 86214
1,1 86433 86650 86864 87076 87286 87493 87698 87900 88100 88298
1,2 88493 88686 88877 89065 89251 89435 89617 89796 89973 90147
1,3 90320 90490 90658 90824 90988 91149 91309 91466 91621 91774
1,4 91924 92073 92220 92364 92507 92647 92786 92922 93056 93189
1,5 93319 93448 93574 93699 93822 93943 94062 94179 94295 94408
1,6 94520 94630 94738 94845 94950 95053 95154 95254 95352 95449
1,7 95543 95637 95728 95818 95907 95994 96080 96164 96246 96327
1,8 96407 96485 96562 96638 96712 96784 96856 96926 96995 97062
1,9 97128 97193 97257 97320 97381 97441 97500 97558 97615 97670
2,0 97725 97778 97831 97882 97932 97982 98030 98077 98124 98169
2,1 98214 98257 98300 98341 98382 98422 99461 98500 98537 98574
2,2 98610 98645 98679 98713 98745 98778 98809 98840 98870 98899
2,3 98928 98956 98983 99010 99036 99061 99086 99111 99134 99158
2,4 99180 99202 99224 99245 99266 99285 99305 99324 99343 99361
2,5 99379 99396 99413 99430 99446 99261 99477 99492 99506 99520
2,6 99534 99547 99560 99573 99585 99598 99609 99621 99632 99643
2,7 99653 99664 99674 99683 99693 99702 99711 99720 99728 99763
2,8 99744 99752 99760 99767 99774 99781 99788 99795 99801 99807
2,9 99813 99819 99825 99831 99836 99841 99846 99851 99856 99861
3,0 0,99865 3,1 99903 3,2 99931 3,3 99952 3,4 99966
3,5 99977 3,6 99984 3,7 99989 3,8 99993 3,9 99995
4,0 999968
4,5 999997
5,0 99999997

(n)
Phụ lục 4: Giá trị t1n−α của phân phối Student P( X < t1−α ) = 1 − α với X ∼ 𝒯 (n)
PP
P PP 1 − α 0, 90 0, 95 0, 975 0, 99 0, 995 0, 998 0,9995
P
Bậc tự do PPP
P
1 3,078 6,314 12,706 31,821 63,526 318,309 363,6
2 1,886 2,920 4,303 6,965 9,925 22,327 31,600
3 1,638 2,353 3,128 4,541 5,841 10,215 12,922
4 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 1,476 2,015 2,571 3,365 4,032 5,893 6,869
6 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 1,415 1,895 2,365 2,998 3,499 4,705 5,408
8 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 1,372 1,812 2,228 2,764 3,169 4,144 4,587
11 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 1,341 1,753 2,131 2,606 2,947 3,733 4,073
16 1,337 1,746 2,120 2,583 2,921 3,686 4,015
17 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 1,330 1,734 2,101 2,552 2,878 3,610 3,922
19 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 1,323 1,721 2,080 2,518 2,831 3,527 3,819
22 1,321 1,717 2,074 2,508 2,819 3,505 3,792
23 1,319 1,714 2,069 2,500 2,807 3,485 3,767
24 1,318 1,711 2,064 2,492 2,797 3,467 3,745
25 1,316 1,708 2,060 2,485 2,787 3,450 3,725
26 1,315 1,796 2,056 2,479 2,779 3,435 3,707
27 1,314 1,703 2,052 2,473 2,771 3,421 3,690
28 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 1,311 1,699 2,045 2,462 2,756 3,396 3,659
+∞ 1,282 1,645 1,960 2,326 2,576 3,090 3,291

λk −λ
Phụ lục 5: Giá trị hàm khối lượng xác suất Poa-xông P( X = k) = k! e
HH
λ
H
HH 0,1 0,2 0,3 0,4 0,5 0,6
k HH
0 0,904837 0,818731 0,740818 0,670320 0,606531 0,548812
1 0,090484 0,163746 0,222245 0,268128 0,303265 0,329287
2 0,004524 0,016375 0,033337 0,053626 0,075817 0,098786
3 0,000151 0,001091 0,003334 0,007150 0,012636 0,019757
4 0,000004 0,000055 0,000250 0,000715 0,001580 0,002964
5 0,000002 0,000015 0,000057 0,000158 0,000356
6 0,000001 0,000004 0,000013 0,000035
7 0,000001 0,000003
HH
λ
H
HH 0,7 0,8 0,9 1,0 2,0 3,0
k HH
0 0,496585 0,449329 0,406570 0,367877 0,135335 0,049787
1 0,347610 0,359463 0,365913 0,367789 0,270671 0,149361
2 0,121663 0,143785 0,164661 0,183940 0,270671 0,224042
3 0,028388 0,038343 0,049398 0,061313 0,180447 0,224042
4 0,004968 0,007669 0,011115 0,015328 0,090224 0,168031
5 0,000695 0,001227 0,002001 0,003066 0,036089 0,100819
6 0,000081 0,000164 0,000300 0,000511 0,012030 0,050409
7 0,000008 0,000019 0,000039 0,000073 0,003437 0,021604
8 0,000002 0,000004 0,000009 0,000859 0,008101
9 0,000001 0,000191 0,002701
10 0,000038 0,000810
11 0,000007 0,000221
12 0,000001 0,000055
13 0,000013
14 0,000003
15 0,000001

λk −λ
Phụ lục 5: Giá trị hàm khối lượng xác suất Poa-xông P( X = k) = k! e (tiếp theo)
HH
λ
H
HH 4,0 5,0 6,0 7,0 8,0 9,0
k HH
0 0,018316 0,006738 0,002479 0,000912 0,000335 0,000123
1 0,073263 0,033690 0,014873 0,006383 0,002684 0,001111
2 0,146525 0,084224 0,044618 0,022341 0,010735 0,004998
3 0,195367 0,140374 0,089235 0,052129 0,028626 0,014994
4 0,195367 0,175467 0,133853 0,191226 0,057252 0,033737
5 0,156293 0,175467 0,160623 0,127717 0,091604 0,060727
6 0,104194 0,146223 0,160623 0,149003 0,122138 0,091090
7 0,059540 0,104445 0,137677 0,149003 0,139587 0,117116
8 0,029770 0,065278 0,103258 0,130377 0,139587 0,131756
9 0,013231 0,036266 0,068838 0,011405 0,120477 0,131756
10 0,005292 0,018133 0,041303 0,070983 0,099262 0,118580
11 0,001925 0,008242 0,022529 0,045171 0,072190 0,097020
12 0,000642 0,003434 0,011262 0,026350 0,048127 0,072765
13 0,000197 0,001321 0,005199 0,014188 0,029616 0,050376
14 0,000056 0,000472 0,002228 0,007094 0,013924 0,032384
15 0,000015 0,000157 0,000891 0,003311 0,009026 0,019431
16 0,000004 0,000049 0,000334 0,001448 0,004513 0,010930
17 0,000001 0,000014 0,000118 0,000596 0,002124 0,005786
18 0,000004 0,000039 0,000232 0,000944 0,002893
19 0,000001 0,000012 0,000085 0,000397 0,001370
20 0,000004 0,000030 0,000159 0,000617
21 0,000001 0,000010 0,000061 0,000264
22 0,000003 0,000022 0,000108
23 0,000001 0,000008 0,000042
24 0,000003 0,000016
25 0,000001 0,000006
26 0,000002
27 0,000001

6.2 Hướng dẫn sử dụng các bảng số
6.2.1 Bảng giá trị hàm Gao-xơ (Phụ lục 1)

−x 2
Hàm mật độ xác suất phân phối chuẩn tắc, hay hàm Gao-xơ ϕ( x ) = √1 e 2 là hàm số chẵn,
2π
tức là ϕ( x ) = ϕ(− x ), giảm. Khi x > 3, 9 ta có thể coi ϕ( x ) = 0.
Để tra giá trị ϕ(1, 25) ta dóng hàng "1,2" với cột "5" được số "1826", suy ra ϕ(1, 25) = 0, 1826;
vì ϕ là hàm chẵn nên ϕ(−1, 25) = 0, 1826; ϕ(4, 0) = 0.
6.2.2 Bảng giá trị hàm Láp-la-xơ (Phụ lục 2)

Z x
− t2
Hàm Láp-la-xơ φ( x ) = √1 e 2 dt là hàm số lẻ, tức là φ(− x ) = −φ( x ), tăng. Khi x > 5, 0
2π 0
ta có thể coi φ( x ) = 0, 5.
Để tra giá trị φ(1, 25) ta dóng hàng "1,2" với cột "5" được số "39435", suy ra φ(1, 25) =
0, 39435; vì φ( x ) là hàm lẻ nên φ(−1, 25) = −0, 39435; φ(5, 5) = 0, 5.
6.2.3 Bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3)
Z x Z x
− t2 − t2
Hàm phân phối chuẩn tắc Φ( x ) = √1 e 2 dt và hàm Láp-la-xơ φ( x ) = √1 e 2 dt
2π −∞ 2π 0
liên hệ với nhau bởi hệ thức Φ( x ) = φ( x ) + 0, 5.
6.2.4 Bảng giá trị t1n−α của phân phối Student (Phụ lục 4)
Giả sử biến ngẫu nhiên X ∼ 𝒯 (n) . Để tìm giá trị t1n−α sao cho P( X < t1n−α ) = 1 − α ta dóng
hàng "n" với cột "1 − α" tương ứng. Chẳng hạn với n = 24, α = 0, 05 thì t24
1−0,05 = 1, 711.
Nếu n ≥ 30, thay việc tìm t1n−α từ bảng phân phối Student ta sẽ tìm u1−α từ bảng hàm số
1−2α
Láp-la-xơ từ hệ thức φ(u1−α ) = 2 . Ví dụ cho α = 0, 05, φ(u1−α ) = 0, 45, tra ngược bảng
Láp-la-xơ ta được u1−α = 1, 65. Ta cũng có thể tra bảng phân phối Student ở dòng +∞ cho
trường hợp này và nhận được u1−α = 1, 645.
6.2. Hướng dẫn sử dụng các bảng số 123

Giáo Trình Xác Suất Thống Kê

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Giáo Trình Xác Suất Thống Kê

Uploaded by

Copyright:

Available Formats

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC

XÁC SUẤT THỐNG KÊ

NGUYỄN THỊ THU THỦY

Chương 1. Sự kiện ngẫu nhiên và phép tính xác suất 6

Chương 3. Biến ngẫu nhiên nhiều chiều 69

3.6.2 Hiệp phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

Chương 4. Thống kê. Ước lượng tham số 88

Chương 5. Kiểm định giả thuyết 109

Chương 6. Phụ lục các bảng số 127

Sự kiện ngẫu nhiên và phép tính xác suất

1.1 Sự kiện. Quan hệ giữa các sự kiện

1.1.1 Phép thử. Sự kiện

Ví dụ 1.2. Gieo một con xúc xắc, khi đó

(a) Sự kiện Ai "xuất hiện mặt i chấm", i = 1, . . . , 6 là sự kiện sơ cấp.

1.1.2 Phân loại sự kiện

1.1. Sự kiện. Quan hệ giữa các sự kiện 7

Ví dụ 1.5. Gieo một con xúc xắc, khi đó

(a) Sự kiện S “xuất hiện mặt có số chấm ≤ 6 và ≥ 1” là sự kiện chắc chắn.

(b) Sự kiện ∅ “xuất hiện mặt 7 chấm” là sự kiện không thể.

1.1.3 Quan hệ giữa các sự kiện

Hình 1.1: Sơ đồ Venn của A ∪ B và A ∩ B

1.1. Sự kiện. Quan hệ giữa các sự kiện 8

Hình 1.2: Hai sự kiện xung khắc

Hình 1.3: Sự kiện đối lập

(g) Hệ (nhóm) đầy đủ các sự kiện: Hệ (nhóm) n sự kiện A1 , A2 ,. . . , An được gọi là hệ

1.1. Sự kiện. Quan hệ giữa các sự kiện 9

Tính chất 1.1. (a) A ∪ B = B ∪ A, A ∩ B = B ∩ A (giao hoán).

(c) A ∩ ( B ∪ C ) = A ∩ B ∪ A ∩ C (phân phối của phép cộng và phép nhân).

1.1. Sự kiện. Quan hệ giữa các sự kiện 10

(a) Hãy mô tả các sự kiện A1 A2 A3 , A1 A2 A3 , A1 + A2 + A3 .

(b) Biểu diễn các sự kiện sau theo A1 , A2 , A3 :

(c) Các sự kiện A1 , A2 , A3 có xung khắc không?

(a) A1 A2 A3 : "cả ba xạ thủ đều bắn trúng";

1.2 Giải tích kết hợp

1.2.1 Quy tắc cộng. Quy tắc nhân

1.2.1a Quy tắc cộng

1.2.1b Quy tắc nhân

1.2. Giải tích kết hợp 11

1.2.2 Chỉnh hợp

Ký hiệu và công thức tính:

Ví dụ 1.9. Từ 5 chữ số 1, 2, 3, 4, 5 lập được bao nhiêu số có 3 chữ số khác nhau?

Lời giải: Số các số được lập là A35 = 5 × 4 × 3 = 60 (số).

1.2.3 Chỉnh hợp lặp

Ký hiệu và công thức tính:

Ví dụ 1.10. Từ 5 chữ số 1, 2, 3, 4, 5 lập được bao nhiêu số có 3 chữ số?

Ký hiệu và công thức tính:

1.2. Giải tích kết hợp 12

Lời giải: (a) P6 = 6! = 720 (cách); (b) P5 = 5! = 120 (cách).

Ký hiệu và công thức tính:

(b) Cnk = Cnn−k .

(c) Cnk = Cnk− 1 k

(d) Khai triển nhị thức Niu–tơn (a, b ∈ R, n ∈ N* )

1.3 Khái niệm và các định nghĩa xác suất

1.3.1 Khái niệm xác suất

1.3. Khái niệm và các định nghĩa xác suất 13

1.3.2 Định nghĩa cổ điển về xác suất

m số kết cục thuận lợi cho A

Tính chất 1.2. (a) 0 ≤ P( A) ≤ 1, A là sự kiện bất kỳ.

(d) Nếu A ⊂ B thì P( A) ≤ P( B).

Số kết cục đồng khả năng là n = A210 .

Số kết cục thuận lợi cho A là m = 1.

(a) Hai cây rút ra đều là Át.