You are on page 1of 77

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC ĐẠI NAM

NGUYỄN VĂN NGỌC

XÁC SUẤT THỐNG KÊ


VÀ PHÂN TÍCH DỮ LIỆU

HÀ NỘI - 2022
Mục lục

1 Biến cố ngẫu nhiên và xác suất 1


1.1 Cơ sở của giải tích tổ hợp . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Hoán vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Chỉnh hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3 Tổ hợp và nhị thức Newton . . . . . . . . . . . . . . . . . . 4
1.2 Phép thử ngẫu nhiên và biến cố ngẫu nhiên . . . . . . . . . . . . . 6
1.2.1 Phép thử ngẫu nhiên, không gian mẫu . . . . . . . . . . . . 6
1.2.2 Biến cố ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Xác suất của biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.1 Định nghĩa xác suất cổ điển . . . . . . . . . . . . . . . . . . 9
1.3.2 Định nghĩa xác suất theo tần suất . . . . . . . . . . . . . . 12
1.3.3 Định nghĩa xác suất theo hình học . . . . . . . . . . . . . . 12
1.3.4 Các tính chất của xác suất . . . . . . . . . . . . . . . . . . 13
1.4 Xác suất có điều kiện-Công thức xác suất toàn phần- Công thức
Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1 Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.2 Xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . . 15
1.4.3 Công thức xác suất toàn phần và công thức Bayes . . . . . 17
1.5 Phép thử Bernoulli và công thức xác suất nhị thức . . . . . . . . . 18
1.5.1 Phép thử Bernoulli . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.2 Công thức xác suất nhị thức . . . . . . . . . . . . . . . . . 18

2 Biến ngẫu nhiên và hàm phân phối 22


2.1 Cơ sở của phép tính vi phân và tích phân hàm một biến . . . . . 22
2.1.1 Đạo hàm và vi phân của hàm hiển . . . . . . . . . . . . . . 22
2.1.2 Bảng đạo hàm và vi phân của các hàm số cơ bản . . . . . 23
2.1.3 Đạo hàm của hàm hợp . . . . . . . . . . . . . . . . . . . . . 23

1
2.1.4 Các phép toán của đạo hàm và vi phân . . . . . . . . . . . 24
2.1.5 Tìm cực trị của hàm khả vi . . . . . . . . . . . . . . . . . . 24
2.1.6 Định nghĩa nguyên hàm và tích phân bất định.Bảng các
tích phân bất định cơ bản . . . . . . . . . . . . . . . . . . . 24
2.1.7 Định nghĩa tích phân xác định . . . . . . . . . . . . . . . . 26
2.1.8 Công thức Newton-Leibniz . . . . . . . . . . . . . . . . . . 26
2.1.9 Tích phân với cận thay đổi . . . . . . . . . . . . . . . . . . 27
2.1.10 Tích phân suy rộng loại một . . . . . . . . . . . . . . . . . 27
2.2 Các khái niệm cơ bản của biến ngẫu nhiên và hàm phân phối . . 28
2.2.1 Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.2 Hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.3 Các tính chất của hàm phân phối . . . . . . . . . . . . . . 30
2.2.4 Phân phối rời rạc . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.5 Phân phối liên tục-mật độ xác suất . . . . . . . . . . . . . 31
2.3 Kỳ vọng toán, phương sai và độ lệch chuẩn . . . . . . . . . . . . . 31
2.3.1 Kỳ vọng toán . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.2 Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.3 Độ lệch chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4 Mode và trung vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.2 Trung vị(median) . . . . . . . . . . . . . . . . . . . . . . . . 37
2.5 Bài tập chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3 Một số quy luật phân bố xác suất thông dụng 41


3.1 Quy luật không-một A(P) . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.1 Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.2 Các tham số đặc trưng . . . . . . . . . . . . . . . . . . . . . 41
3.1.3 Các ứng dụng . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2 Phân bố nhị thức B(n, p) . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.2 Các tham số đặc trưng . . . . . . . . . . . . . . . . . . . . . 43
3.2.3 Các ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3 Phân bố Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.2 Các đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2
3.3.3 Các ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4 Phân bố chuẩn và hàm Laplace . . . . . . . . . . . . . . . . . . . . 45
3.4.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.2 Tính chất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.3 Công thức tính xác suất để biến ngẫu nhiên phân phối
chuẩn nhận gia trị trong khoảng (a, b) . . . . . . . . . . . . 46
3.4.4 Các đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4.5 Các ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.5 Phân phối khi bình phương χ2 . . . . . . . . . . . . . . . . . . . . . 48
3.5.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5.2 Các đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5.3 Tính chất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.6 Phân phối student T(n) . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6.2 Các đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6.3 Các nhận xét . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.7 Quy luật phân phối mũ E(λ) . . . . . . . . . . . . . . . . . . . . . . 50
3.7.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.2 Các đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8 Phân phối F: Fisher R. A- Snedecor G.W . . . . . . . . . . . . . . 51
3.9 Bài tập chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4 Các khái niệm cơ bản của thống kê 55


4.1 Khái niệm về thống kê . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.1.1 Khái niệm về mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . 55
4.1.2 Mô tả số liệu mẫu bằng bảng phân bố thực nghiệm . . . . 56
4.2 Các đặc trưng mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2.1 Trung bình mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2.2 Phương sai phổ dụng và phương sai mẫu . . . . . . . . . . 57
4.2.3 Độ lệch chuẩn và độ lệch chuẩn mẫu . . . . . . . . . . . . . 58
4.2.4 Trung vị và yếu vị mẫu . . . . . . . . . . . . . . . . . . . . 58
4.2.5 Hiệp phương sai . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2.6 Tương quan (correlation) . . . . . . . . . . . . . . . . . . . 59
4.2.7 Tại sao cần phân tích tương quan . . . . . . . . . . . . . . 61
4.2.8 Hàm thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3
4.3 Ví dụ-bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5 Ước lượng tham số 65


5.1 Ước lượng khoảng của các đặc trưng và độ tin cậy . . . . . . . . . 65
5.2 Ước lượng khoảng đối với phân phối chuẩn N (µ, σ 2 ) . . . . . . . . 65
5.2.1 Hàm Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2.2 Khoảng ước lượng của kỳ vọng µ trong phân phối chuẩn
khi biết σ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.3 Khoảng ước lượng của kỳ vọng µ trong phân phối chuẩn
khi chưa biết σ . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2.4 Ước lượng khoảng của phương sai σ 2 trong mẫu phân phối
chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.2.5 Ước lượng khoảng của hiệu hai trung bình của hai mẫu
độc lập từ phân phối chuẩn . . . . . . . . . . . . . . . . . . 68
5.3 Ước lượng khoảng của xác suất . . . . . . . . . . . . . . . . . . . . 70
5.3.1 Ước lượng khoảng của xác suất trong phân bố nhị thức . . 70
5.3.2 Ước lượng khoảng của hiệu hai xác suất trong hai dãy
Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.4 Bài tập và ví dụ chương 5 . . . . . . . . . . . . . . . . . . . . . . . 72

4
Chương 1

Biến cố ngẫu nhiên và xác suất

1.1 Cơ sở của giải tích tổ hợp


1.1.1 Hoán vị
• Hoán vị không lặp

Định nghĩa 1.1. Cho tập hợp M của n phần tử. Mỗi cách sắp xếp của n phần
tử của M theo một thứ tự nhất định được gọi là một hoán vị của n phần tử đã
cho. Số tất các các hoán vị của tập hợp n phần tử được ký hiệu là Pn .

Định lý 1.1. Số tất các các hoán vị của tập hợp n phần tử là Pn = n! =
1.2...n(0! = 1).

Ví dụ 1.1. Có bao nhiêu số khác nhau gồm 4 chữ số được thiết lập từ {1, 2, , 3, 4}?

Giải. Ta có P4 = 4! = 24 số. 

• Hoán vị lặp

Định nghĩa 1.2. Hoán vị trong đó mỗi phần tử xuất hiện ít nhất một lần được
gọi là hoán vị lặp.

Số hoán vị lặp của n phần tử thuộc k loại, mà mỗi phần tử loại i(1 ≤ i ≤ k)
xuất hiện ni lần ký hiệu là P (n1 , n2 , ..., nk ) và được tính bằng công thức
n!
Pn (n1 , n2 , ..., nk ) = .
n1 !n2 !...nk !

Ví dụ 1.2. Với các chữ số 0, 1, 2, 3, 4, 5 có thể lập được bao nhiêu số gồm 9
chữ số, trong đó mỗi chữ số 0, 1, 2, 3 xuất hiện đúng 1 lần, chữ số 4 xuất hiện
đúng 2 lần, chữ số 5 xuất hiện 3 lần.

1
Giải. Xét số x=140525345 và ký hiệu các vị trí của x một cách hình thức , ta
có x = a1 a2 a3 a4 a5 a6 a7 a8 a9 . Khi đó mỗi số x tương đương với một hoán vị của các
phần tử a1 , a2 , a3 , a4 , a5 , a6 , a7 , a8 , a9 . Các phần tử này được phân làm 3 nhóm:
nhóm thứ nhất gồm các chữ số 0, 1, 2, 3 mỗi chữ số xuất hiện đúng 1 lần, nhóm
thứ hai là chữ số 4 xuất hiện đúng 2 lần và nhóm thứ ba gồm chữ số 5 xuất hiện
3 lần. Do đó các số có thể lập được là
9!
S= = 30240.
1!2!3!


• Hoán vị vòng quanh

Định nghĩa 1.3. Giả sử có n người khách được mời ngồi xung quanh một chiếc
bàn tròn. Nếu ta mời một người nào đó ngồi vào vị trí bất kỳ thì số các sắp xếp
của n-1 người còn lại sẽ là (n-1)! Số hoán vị vòng quanh của n phần tử khác
nhau được tính theo công thức

Qn = (n − 1)!.

Ví dụ 1.3. Một hội nghị bàn tròn có 5 nước tham gia: Anh có 3 đại biểu, Pháp
có 5 đại biểu, Đức có 2 đại biểu, Nhật có 3 đại biểu và Mỹ có 4 đại biểu. Hỏi
có bao nhiêu cách sắp xếp chỗ ngồi cho các đại biểu, sao cho 2 người cùng một
nước thì ngồi cạnh nhau?

Giải. Đầu tiên sắp xếp khu vực cho đại biểu từng nước. Ta mời phái đoàn nào
đó ngồi vào chỗ trước. Khi đó 4 phái đoàn còn lại có 4! cách sắp xếp.
Đối với mỗi cách sắp xếp các phái đoàn lại có: 3! cách sắp xếp nội bộ đối
với phái đoàn Anh, 5! đối với phái đoàn Pháp, 2! đối với phái đoàn Đức, 3! đối
với phái đoàn Nhật và 4! cách sắp xếp nội bộ đối với phái đoàn Mỹ.
Do vậy, số cách sắp xếp chỗ ngồi cho tất cả các đại biểu để hai người cùng
một nước ngồi cạnh nhau sẽ là

4!3!5!2!3!5! = 4976640.

2
1.1.2 Chỉnh hợp
• Chỉnh hợp không lặp

Định nghĩa 1.4. Cho tập hợp M có n phần tử và k là một số nguyên dương
1 ≤ k ≤ n. Mỗi cách sắp xếp k phần tử của tập hợp M theo một thứ tự nhất định
được gọi là một chỉnh hợp không lặp chập k của n phần tử đã cho. Số các chỉnh
hợp không lặp chập k của n phần tử ký hiệu là Akn .

Định lý 1.2. Số tất cả các chỉnh hợp không lặp chập k của n phần tử được tính
theo công thức
n!
Akn = .
(n − k)!
Ví dụ 1.4. Có bao nhiêu số khác nhau gồm 3 chữ số được thiết lập từ {1, 2, 3, 4, 5}?

Giải. Một số gồm 3 chữ số được thiết lập từ {1, 2, 3, 4, 5} tương ứng với một
chỉnh hợp không lặp chập 3 của 5. Do đó ta có
5!
A35 = = 60.
(5 − 3)!


• Chỉnh hợp lặp

Định nghĩa 1.5. Cho tập hợp X gồm n phần tử. Mỗi dãy có độ dài k các phần
tử của X, mà mỗi phần tử có thể lặp lại nhiều lần và được sắp xếp theo một thứ
tự nhất định được gọi là một chỉnh hợp chập k của n phần tử thuộc X.

Nếu thế, một chỉnh hợp chập k của n có thể được xem như một phần tử
của tích Decart X k . Theo nguyên lý nhân, số tất các chỉnh hợp chập k này của
n sẽ là nk . Ta ký hiệu Akn là số các chỉnh hợp nói trên. Vậy ta có

Akn = nk .

Một cách chứng minh khác như sau. Việc lập một chỉnh hợp chập k của
một tập hợp n phần tử được coi như một công việc gồm k công đoạn. Công
đoạn 1 là chọn vào vị trí tứ nhất, công đoạn 2 là chọn phần tử vào vị trí tứ 2,
..., công đoạn k là chọn phàn tử vào vị trí thứ k. Vì các phần tử có thể được lặp
lại nhiều lần ở mỗi công đoạn, nên ở mỗi công đoạn ta đều có n cách chọn các
phần tử cho ỗi một trong k vị trí. Theo quy tắc nhân ta có

n.n...n(k lần) = nk .

3
Ví dụ 1.5. Tính số dãy nhị phân gồm n thành phần.

Giải. Mỗi dãy nhị phân độ dài n là một bộ gồm n thành phần, trong đó mỗi
thành phần chỉ nhận một trong hai giá trị 1 hoặc 0. Từ đó suy ra số các dãy
nhị phân độ dài n sẽ là 2n . 

Ví dụ 1.6. Tính số tập con của một tập n phần tử.

Giải. Giả sử tập n phần tử là X = {x1 , x2 , ..., xn }. Biểu diễn mỗi tập con A của
tập X đã cho bằng một dãy nhị phân chiều dài n: b = (b1 , b2 , ..., bn ), trong đó b= 1,
nếu phần tử xi ∈ A và bi = 0 trong trường hợp ngược lại( i=1, 2, ..., n). Từ đó
ta có số tập con của X là 2n . 

Ví dụ 1.7. Từ bốn chữ số 1, 2, 3, 5 có thể lập được bao nhiêu số chẵn gồm bốn
chữ số?

Giải. Vì tập {1, 2, 3, 5} chỉ có duy nhất một chữ số chẵn là 2, nên x = abcd với
a, b, c, d ∈ {1, 2, 3, 5} là số chẵn khi và chỉ khi d=2. Mặt khác, a, b, c có thể bằng
nhau, nên y = abc là một chỉnh hợp lặp chập 3 của bốn phần tử 1, 2, 3, 5. Do đó,
để thành lập số x ta chỉ cần lấy một số y nào đó rồi thêm 2 vào cuối. Bởi vậy,
số các số x = abc2 bằng số các số y = abc và bằng A34 = 4= 364. 

1.1.3 Tổ hợp và nhị thức Newton


• Tổ hợp không lặp

Định nghĩa 1.6. Cho tập A gồm n phần tử. Mỗi tập con(không kể thứ tự) gồm
k(0 ≤ k ≤ n) phần tử thuộc A được gọi là một tổ hợp chập k của n phần tử đã
cho.

Số các tổ hợp chập k k(0 ≤ k ≤ n) của n phần tử ký hiệu là Cnk và được


tính theo công thức
n!
Cnk = .
k!(n − k)!

Ví dụ 1.8. Có bao nhiêu cách chọn 5 người đi lao động của lớp có 50 người?

Giải. Mỗi cách chọn ngẫu nhiên 5 người trong 50 người là 1 tổ hợp chập 5 của
50. Vậy có số cách chọn là

5 50! 50!
C50 = = = 2118760.
5!(50 − 5)! 5!45!

4

Các tính chất cơ bản của Cnk :

Cn0 = Cnn = 1
Cn1 = n
Cnk = Cnn−k
Cnk + Cnk−1 = Cn+1
k

• Nhị thức Newton

n
X n
X
n
(x + y) = Cnk xn−k y k = Cnk xk y n−k
k=0 k=0

Các trường hợp đặc biệt


n
X
n
(x + 1) = Cnk xk (1.1)
k=0
n
X
x = 1 : 2x = Cnk (1.2)
k=0
Xn
x = −1 : 0 = (−1)k Cnk (1.3)
k=0
n
X
n2n−1 = kCnk . (1.4)
k=1

• Tổ hợp lặp

Định nghĩa 1.7. Cho tập hợp A = {a1 , a2 , ..., an }. Một tổ hợp lặp chập m(m
không nhất thiết phải nhỏ hơn n) của n phấn tử thuộc A là một bộ gồm m phần
tử, mà mỗi phần tử này là một trong những phần tử của A.

Ta sử dụng Cnm hay Knm để ký hiệu tổ hợp chập m của n phần tử. Khi đó
ta có
Cnm = Knm = Cn+m−1
m
.

5
Ví dụ 1.9. Giả sử có 4 loại bóng màu: Xanh, Đỏ, Tím, Vàng với số lượng mỗi
loại không hạn chế. Hai bộ bóng được coi là khác nhau, nếu có ít nhất một màu
với số lượng thuộc hai loại khác nhau. Liệu có bao nhiêu cách chọn ra các bộ
6(quả bóng) khác nhau?

Giải. Vì trong mỗi bộ 6 có thể có các quả bóng cùng màu và không phân biệt
thứ tự chọn, nên số cách chọn khác nhau bằng số tổ hợp lặp chập 6 của 4 phần
tử(tập hợp bóng cùng màu được coi như một phần tử)và được tính theo công
thức
6 9!
C46 = C4+6−1 = = 84.
6!3!


Ví dụ 1.10. Số các tổ hợp lặp chập 3 của 2 phần tử {a, b} là

{a, a, a}; {a, a, b}; {a, b, b}; {b, b, b}.

1.2 Phép thử ngẫu nhiên và biến cố ngẫu nhiên


1.2.1 Phép thử ngẫu nhiên, không gian mẫu
Đồng xu có hai mặt, trên một mặt có ghi giá trị của đồng xu, người ta gọi
đó là mặt ngửa, mặt kia là mặt sấp. Khi gieo một đồng xu, ta biết chắc rằng,
đồng xu đó hoặc lật sấp(S), hoặc lật ngửa(N), trừ khi nó không chịu ngã xuống!
Nhưng đồng xu đó lật sấp hay lật ngửa thì không một ai trong chúng ta biết
chắc chắn câu trả lời, vì kết quả (S hay N) là ngẫu nhiên. Ta gọi phép gieo đồng
xu nói trên là phép thử ngẫu nhiên(hoặc thí nghiệm ngẫu nhiên).
Những phép thử mà khi bắt đầu tiến hành thử ta biết ñược những kết quả
nào sẽ xảy ra sau khi thử được gọi là các phép thử không ngẫu nhiên. Tuy nhiên
có rất nhiều loại phép thử mà ngay khi bắt ñầu tiến hành phép thử ta không thể
biết được những kết quả nào sẽ xảy ra. Những phép thử loại này gọi là những
phép thử ngẫu nhiên.

Định nghĩa 1.8. Tập hợp các kết quả có thể xảy ra của một phép thử ngẫu
nhiên gọi là không gian ngẫu nhiên của phép thử đó.

Ví dụ 1.11. Trong phép thử ngẫu nhiên: gieo một đồng xu, thì không gian ngẫu
nhiên là
Ω = {S, N }.

6
Khi gieo con xúc xắc 6 mặt thì không gian mẫu là

Ω = {1, 2, 3, 4, 5, 6}.

Gieo một đồng xu hai lần, và ký hiệu chẳng hạn SN để chỉ lần thứ nhất được
mặt sấp, làn thứ hai được mặt ngửa. Không gian mẫu là

Ω = {SS, SN, N S, N N }.

Gieo hai con xúc xắc một xanh một đỏ và dùng ký hiệu (x, y) để chỉ con xúc
xắc xanh cho x chấm, xức xắc đỏ cho y chấm. Không gian mẫu là

Ω = {(1, 1), (1, 2)..., (1, 6); (2, 1), ..., (2, 6), ...., (6, 1), ..., (6, 6)}

1.2.2 Biến cố ngẫu nhiên


Định nghĩa 1.9. Trong một phép thử ngẫu nhiên, mỗi tập con của không gian
mẫu được gọi là một biến cố. Nếu kết quả của phép thử là một phần tử của biến
cố A, thì ta nói trong phép thử đó, biến cố A xảy ra.

Ví dụ 1.12. Với phép gieo một lần con xúc xắc, không gian mẫu là E =
{1, 2, 3, 4, 5, 6}. Các tập con A = 1, B = {1, 3, 5} là những biến cố. Biến cố A xảy
ra nếu số chấm ở mặt ngửa là 1, biến cố B xảy ra nếu số chấm hiện ra là các số
lẻ. Nếu ở mặt trên hiện ra 5 chấm, thì biến cố B xảy ra, còn biến cố A không
xảy ra

Định nghĩa 1.10. (Biến cố sơ cấp). Một biến cố sơ cấp là một tập hợp con gồm
đúng một phần tử của không gian mẫu.

Định nghĩa 1.11. (Biến cố chắc chắn, biến cố không thể có) Trong không gian
mẫu:
- Bản thân tập Ω được gọi là biến cố chắc chắn
- Tập rỗng (∅) được gọi là biến cố không thể.

Định nghĩa 1.12. (Biến cố kéo theo). Biến cố A được gọi là biến cố kéo theo
biến cố B nếu sự xảy ra của A kéo theo sự xảy ra của B và được ký hiệu A ⊂ B.

Ví dụ. Biến cố A: mặt trên của con xúc xắc có 1 chấm, biến cố B: mặt trên
của con xúc xắc có số chấm lẻ.

7
Định nghĩa 1.13. (Biến cố bằng nhau). Nếu biến cố A là biến cố kéo theo biến
cố B và biến cố B cũng là biến cố kéo theo biến cố A, thì ta nói hai biến cố bằng
nhau. A ⊂ B.

Vậy nếu A ⊂ B và B ⊂ A thì A=B.

Định nghĩa 1.14. (Biến cố hợp, biến cố giao). Một biến cố sơ cấp là một tập
hợp con gồm đúng một phần tử của không gian mẫu.
a) Tổng của hai biến cố A và B(phép cộng)là biến cố mà nó xảy ra nếu ít
nhất một trong hai biến cố A hoặc B xảy ra và ký hiệu là A ∪ B, hoặc A+B.
b) Biến cố tích(phép nhân). Tích của hai biến cố A và B là biến cố mà nó
xảy ra nếu cả A và B đồng thời xảy ra và ký hiệu là A ∩ B , hoặc AB.

Ví dụ. a) Gieo con xúc xắc và ký hiệu Bk là mặt có k chấm. Đặt A =


{B1 , B3 , B5 }, B = {B2 , B4 , B6 }. Ta có A ∪ B = {B1 , B2 , B3 , B4 , B5 , B6 }.
b) Đặt C = {3, 4, 5}, ta có A ∩ C = {3, 5}.
Các tính chất của phép cộng và phép nhân của các biến cố ngẫu nhiên:

1. A ∪ A = A, A ∩ A = A, A ∪ B = B ∪ A, A ∩ B = B ∩ A;
2. A ∪ (B ∪ C) = (A ∪ B) ∪ C, A ∩ (B ∩ C) = (A ∩ B) ∩ C;
3. A ∪ ∅ = A, A ∩ ∅ = ∅.

Định nghĩa 1.15. (Biến cố xung khắc). Hai biến cố A và B được gọi là xung
khắc, nếu A ∩ B = ∅. Dãy các biến cố B1 , B2 , ..., Bn được gọi là dãy xung khắc,
nếu đôi một các biến cố là xung khắc.

Ví dụ: Gieo con xúc xắc và ký hiệu Bk là biến cố khi mặt trên có k chấm.
Rõ ràng dãy các biến cố B1 , B2 , B3 , B4 , B5 , B6 là xung khắc.

Định nghĩa 1.16. (Biến cố hiệu). Hiệu của biến cố A với biến cố B là biến cố
được xảy ra nếu biến cố A xảy ra và biến cố B không xảy ra, và được ký hiệu là
A \ B hay A − B.

Ví dụ: A = {1, 2, 3}, B = {3, 4, 5}. Ta có A \ B = {1, 2}, B \ A = {4, 5}.

Định nghĩa 1.17. (Biến cố đối lập). Giả sử Ω là không gian mẫu. Gọi Ω \ A là
biến cố đối lập của A và ký hiệu là A.

8
Các tính chất của biến cố đối lập:

A ∪ B = A ∩ B, A ∩ B = A ∪ B.

Định nghĩa 1.18. (Hệ đầy đủ các biến cố). Dãy n biến cố B1 , B2 , ..., Bn tạo
thành một hệ đầy đủ các biến cố nếu các điều kiện sau đây được thỏa mãn:

∪ni=1 Bi = Ω, Bi ∩ Bj = ∅(i 6= j).

Ví dụ. Gieo con xúc xắc ta có các biến cố Bi (i = 1, 2, 3, 4, 5, 6) xuất hiện i


chấm trên mặt ngửa. Rõ ràng là các biến cố này làm thành một hệ đầy đủ

1.3 Xác suất của biến cố


1.3.1 Định nghĩa xác suất cổ điển
Định nghĩa 1.19. Cho không gian mẫu Ω gồm n biến cố sơ cấp đồng khả năng.
Nếu biến cố A gồm p biến số sơ cấp (0 ≤ p ≤ n) thì xác suất của A ký hiệu là
P (A), là số
p số phần tử của A
P (A) = = .
n số phần tử của Ω
Ví dụ 1.13. Gieo một con xúc xắc vô tư, không gian mẫu là Ω = {1, 2, 3, 4, 5, 6}.
Tính xác suất để được: a) một số lẻ, b) một số lớn hơn 4.
3 1
Giải. a) Biến cố được số lẻ là A = {1, 3, 5}, gồm 3 phần tử, vậy P (A) = = .
6 2
b) Biến cố để được một số lớn hơn 4 là B = {5, 6}. Vậy xác suất là P (B) =
2 1
= . 
6 3
Ví dụ 1.14. Gieo hai con xúc sắc vô tư một xanh, một đỏ không gian mẫu là

Ω = {(1, 1), (1, 2), ..., (6, 6)}.

Tính xác suất để được:


a) Tổng số các chấm ở hai mặt trên bằng 5.
b) Tổng các chấm đó bằng 8.

Giải. Vì cả hai con xúc sắc đều vô tư, nên không gian mẫu gồm n=36(= 62 )
biến cố sơ cấp đồng khả năng.

9
a) Biến cố để được tổng các chấm bằng 5 là tập con A = {(1, 4), (2, 3), (3, 2), (4, 1)}
gồm 4 phần tử. Vậy
4 1
P (A) = = .
36 9
b) Biến cố để được tổng các chấm bằng 8 là tập con B = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}
gồm 5 phần tử. Vậy
5
P (B) = .
36


Ví dụ 1.15. Một bình kín không trong suốt đựng 5 viên giống nhau, trong đó
có 3 bi xanh và 2 bi đỏ. Lấy ngẫu nhiên 2 viên bi. Tính xác suất để được 2 viên
bi xanh

Giải. Có 5 viên bi, ta muốn chọn ra 2 viên. Có n = C52 = 10 cách chọn. Đây là
số phần tử của không gian mẫu n=10. Có tất cả 3 viên bi xanh, ta muốn chọn
2. Có C32 = 3 cách chọn( đây là số phần tử của biến cố). Thành thử xác suất để
3
chọn được 2 viên bi xanh là = 0, 3. 
10
Ví dụ 1.16. Xét một đặc tính do một cặp gen A và a gây ra. TRong việc lai
tạo, bố, mẹ mỗi người cho một gen. Nếu cả hai người đều mang gen dị hợp tử,
nghĩa là Aa thì các hợp tử của con sẽ là một trong 4 loại sau: AA, aA, Aa, aa.
Tìm xác suất để con có các kiểu gen: aa, aA, AA.

Giải. Vì bốn biến cố AA, aA, Aa, aa là đồng khả năng, nên xác suất để con có
kiểu gen aa là 1/4. Tương tự, xác suất để con có kiểu gen AA cũng là 1/4. Nếu
gộp Aa và aA vào một kiểu gen thì xác xuất để con có kiểu gen aA là 2/4=1/2.


Ví dụ 1.17. Một lô sản phẩm gồm n sản phẩm trong đó có m sản phầm tốt va
n-m phế phẩm. Lấy ngẫu nhiên s sản phẩm từ lô hàng. Tìm xác suất để trong s
sản phẩm được lấy ra có đúng k sản phẩm tốt.

Giải.

Số khả năng lấy s trong n sản phẩm là Cns .


Số khả năng lấy k sản phẩm trong m sản phẩm là Cm k.

Số khả năng lấy s sản phẩm từ lô hàng trong đó có k sản phẩm tốt và s-k
phế phẩm là Cmk × C s−k .
n−m

10
Vậy xác suất cần tìm là
k × C s−k
Cm n−m
P (A) = s
.
Cn


Bài toán 1.1. 25 hành khách lên ngẫu nhiên 5 toa tàu.Tìm xác suất để:
a) Toa tàu thứ nhất có đúng 4 hành khách.
b)Mỗi toa tàu có 5 hành khách.

Giải. Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu là 525 . Số cách
phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà toa thứ nhất có 4 hành khách
là C2 54 × 421 . Xác suất phải tìm là
C2 54 × 421
P (A) = .
525
b) Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà mỗi toa có 5
hamhf khách là
5 5 5 25!
C25 × C20 × C15 × C55 =
(5!)5


Ví dụ 1.18. Lấy ngẫu nhiên 3 chữa số từ tập hợp 5 chữa số {0, 1, 2, 3, 4} xếp
tành hàng ngang từ trái qua phải. Tìm xác suất để nhận được một số gồm 3 chữ
số(không kể chữa số 0 đứng đầu)

Giải. Số các chữ số gồm 3 chữa số kể cả chữa số 0 đứng đầu là


5!
A35 = = 60.
(3 − 5)!

Số các số gồm 3 chữ số mà chữ số 0 đứng đầu là


4!
A24 = = 12.
(4 − 2)!

Số các số gồm 3 chữ số mà chữ số 0 không đứng đầu là

A35 − A24 = 60 − 12 = 48.

Xác suất phải tìm là


48 4
P (A) = = .
60 5


11
1.3.2 Định nghĩa xác suất theo tần suất
Xét phép thử nào đó. Biến cố A được quan sát trong phép thử này. Ta lặp
lại độc lập n phép thử này với điều kiện như nhau. Gọi k là số lần xuất hiện
k
biến cố A trong n lần phép thử đó. Tỷ số được gọi là tần suất xuất hiện biến
n
cố A.
k
Định nghĩa 1.20. Nếu số phép thử càng lớn thì tần suất xuất hiện biến cố A
n
sẽ sai khác số cố địn p nào đó càng bé thì ta nói biến cố A ổn định ngẫu nhiên
và số p được gọi là xác suất xuất hiện biến cố A.

Định nghĩa này có ưu điểm là nó giải quyết được vấn đề khi không gian
mẫu có vô hạn các biến cố sơ cấp và không cần giả thiết tính đồng khả năng.

1.3.3 Định nghĩa xác suất theo hình học


Định nghĩa 1.21. Cho miền Ω nào đó(trên đường thảng, trong mặt phẳng hay
trong không gian) và gọi S là miền con đo được của Ω. Ta lấy ngẫu nhiên 1 điểm
M của Ω và đặt A là biến cố: M ∈ S . Xác suất của biến cố A được xác định như
sau
Độ đo của S
P (A) = .
Độ đo của Ω
Chú ý:

- Nếu Ω là đường cong hay đoạn thẳng thì độ đo của Ω chính là độ dài của
nó.

- Nếu Ω là hình phẳng hay cong thì độ đo của nó chính là diện tích của nó.

-Nếu Ω là hình không gian thì độ đo của nó chính là thể tích của nó.

Ví dụ 1.19. Tìm xác suất để điểm M rơi vào hình tròn nội tiếp hình vuông có
cạnh 2 m.

Giải. Ta có
Diện tích hình tròn π
P (M ) = = .
Diện tích hình vuông 4


12
1.3.4 Các tính chất của xác suất
Tính chất 1.1.
1) Với mọi biến cố A ta có 0 ≤ P (A) ≤ 1.
2) P (∅) = 0, P (Ω) = 1.
3) Nếu A và B là hai biến cố xung khắc, thì

P (A ∪ B) = P (A) + P (B).

Chứng minh. Các tính chất 1) và 2 là hiển nhiên.


3) Giả sử A có a phần tử và B có b phần tử. Vì A ∩ B = ∅, nên A ∪ B có a+b
phần tử. Gọi n là số phần tử của không gian mẫu Ω. ta có
a+b a b
P (A ∪ B) = = + = P (A) + P (B).
n n n

Tính chất 1.2. Gọi A là biến cố bù của A, tức là A = Ω \ A. Ta có

P (A) = 1 − P (A).

Chứng minh. Giả sử không gian mẫu có n biến cố cơ bản còn A có r phần tử.
Khi đó A có n-r phần tử. Do đó
n−r r
P (A) = = 1 − = 1 − P (A).
n n

Ví dụ 1.20. Gieo đồng thời 3 đỗng xu vô tư. Các biến cố có: A cả 3 đồng xu
đều lật ngửa; A có:ít nhất 1 đồng xu lật sấp là các biến cố bù nhau. Xác suất
của các biến cố này là
1 1 7
P (A) = , P (A) = 1 − = .
8 8 8
Tính chất 1.3. (Công thức cộng xác suất)

P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

Chứng minh. Giả A có a phần tử, B có b phần tử, còn A ∩ B có c phần tử(c=0
nết A ∩ B = ∅). Khi đó A ∪ B có a+b-c phần tử.Nếu n là số phần tử của không
gian mẫu, thì ta có
a+b−c a b c
P (A ∪ B) = = + − = P (A) + P (B) − P (A ∩ B).
n n n n


13
Ví dụ 1.21. Một lớp có 50 học sinh, trong đó có 12 học sinh giỏi Toán, 8 học
sinh giỏi Văn và 2 học sinh giỏi cả Văn lẫn Toán. Chọn ngẫu nhiên một học
sinh. Tính xác suất đã được một học sinh giỏi Toán hay giỏi Văn(giỏi cả 2 môn
càng tốt).

Giải. Gọi A là biến cố chọn được học sinh giỏi Toán, B lf biến cố chọn được
học sinh giỏi Văn. Ta cần tính P (A ∪ B). Ta có
12 8 2
P (A) = , P (B) = , P (A ∩ B) =
50 50 50
Do đó
12 8 2 18
P (A ∪ B) = + − = = 0, 36.
50 50 50 50


Ví dụ 1.22. Gieo một lần con xúc xắc cân đối và đồng chất. Ký hiệu A là biến
cố: mặt trên có 1 chấm, hoặc 2 chấm, hoặc 3 chấm. Và B là biến cố mặt trên có
3 chấm, hoặc 4 chấm, hoặc 5 chấm. Tính xác suất của A ∪ B, A, B, A ∩ A \ B.

Giải. Ta có P (A) = 3/6 = 1/2, P (B) = 3/6 = 1/2. Ta có A ∩ B = {B3 }-mặt có


ba chấm, P (A ∩ B) = 1/6. Theo công thức tính xác suất của tổng, ta có
1 1 1 5
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = + − = .
2 2 6 6
Tương tự
1 1 1
P (A \ B) = P (A) − P (A ∩ B) = − = .
2 6 3


1.4 Xác suất có điều kiện-Công thức xác suất toàn


phần- Công thức Bayes
1.4.1 Mở đầu
Xét ví dụ sau đây. Gieo 2 con xúc xắc vô tư, một đỏ, một xanh. Không
gian mẫu gồm 36 cặp thứ tự (x, y), trong đó x là số chấm hiện ở mặt trên của
con xúc sắc đỏ, y là số chấm hiện ở mặt trên của con xúc sắc xanh.
Gọi A là biến cố, trong đó x>y, B là biến cố x+y=5. Biến cố A gồm 15
phần tử, biến cố B gồm 4 phần tử. Vậy
15 4
P (A) = , P (B) = .
36 36

14
Ngoài ra, A ∩ B gồm 2 phần tử là (3, 2) và (4, 1). Do đó
2
P (A ∩ B) = .
36
Bây giờ, giả sử chúng ta đã biết biến cố A xảy ra, và ta muốn tìm xác suất
của biến cố B trong điều kiện này.
Vì phép thử A đã xảy ra nên các kết quả của phép thử có thể được của
phép thử ngẫu nhiên bị thu hẹp trong tập con của A. Nói cách khác, không gian
mẫu mới chính là A với 15 phần tử. Không gian mẫu mới này chỉ có hai trường
hợp x+y=5, đó là hai phần tử (3, 2) và (4, 1). Như vậy, biến cố B bị thu hẹp lại
thành biến cố B ∩ A trong không gian mẫu A.
Xác suất của biến cố B ∩ A trong không gian mẫu A được gọi là xác suất
có điều kiện và được ký hiệu bởi P (B/A) và được tính theo công thức
Số phần tử củaB ∩ A
P (B/A) =
Số phần tử củaA
Số phần tử củaB ∩ A Số phần tử củaA P (B ∩ A)
= : = .
Số phần tử củaΩ Số phần tử củaΩ P (A)

1.4.2 Xác suất có điều kiện


Định nghĩa 1.22. Trong không gian mẫu Ω cho hai biến cố A và B, với P(A)>0.
Xác suất có điều kiện của B khi A đã xảy ra là số được ký hiệu là P(B/A) và
được xác định bởi công thức
P (B ∩ A)
P (B/A) = .
P (A)

Ví dụ 1.23. Gieo đồng thời 3 đồng xu vô tư. Không gian mẫu là

Ω = {SSS, SSN, SN S, SN N, N SS, N SN, N N S, N N N }.

Gọi A là biến cố(có ít nhất 2 đồng xu lật ngửa), B là biến cố( có ít nhất một
đồng xu lật sấp). Tính P(B/A).

Giải. ta có
4
A = {N N N, N N S, N SN, SN N } ⇒ P (A) = , B = Ω \ {N N N }.
8
Do đó
3
A ∩ B = {N N S, N SN, SN N } ⇒ P (A ∩ B) = .
8

15
Theo định nghĩa ta có
3 4 3
P (B/A) = : = .
8 8 4


Ví dụ 1.24. Một lô sản phẩm gồm có 12 sản phẩm, trong đó có 8 sản phẩm tốt
và 4 phế phẩm.
1. Rút ngẫu nhiên liên tiếp không hoàn lại 2 sản phẩm từ lô hàng. Tìm xác
suất để hai sản phẩm đó là sản phẩm tốt.
2. Rút ngẫu nhiên 1 sản phẩm từ lô hàng và không để ý tới sản phẩm đó.
Sau đó rút tiếp sản phẩm thứ hai. Tìm xác suất để sản phẩm lấy ra lần thứ hai
là sản phẩm tốt.

Giải.
1. Từ định nghĩa xác suất có điều kiện suy ra

P (A ∩ B) = P (A)P (B/A).

Đặt A là biến cố sản phẩm lấy ra lầ I là sản phẩm tốt và B= biến cố sản phẩm
lấy ra lần II là sản phẩm tốt. Ta có
8 7 8 7 14
P (A) = , P (B/A) = ⇒ P (A ∩ B) = × = .
12 11 12 11 33

2. Theo ký hiệu ở câu 1, ta có

B = Ω ∩ B = (A ∪ A) ∩ B = A ∩ B ∪ A ∩ B.

P (B) = P (A ∩ B) + P (A ∩ B)

P (B) = P (A)P (B/A) + P (A)P (B/A).

Ta có
8 7 4 8
P (A) = , P (B/A) = , P (A) = , P (B/A) = .
12 11 12 11
Suy ra
8 7 4 8 2
P (B) = . + . = .
12 11 12 11 3


16
1.4.3 Công thức xác suất toàn phần và công thức Bayes
1. Công thức xác suất toàn phần

Giả sử A là biến cố bất kỳ, và B1 , B2 , ..., Bn lập thành một hệ đầy đủ các
biến cố với P (Bi ) > 0, i = 1, 2, ..., n. Khi đó ta có công thức
n
X
P (A) = P (Bi )P (A/Bi ). (1.5)
i=1

2. Công thức Bayes

P (A ∩ Bk ) P (Bk )P (A/Bk )
P (Bk /A) = = n (k = 1, 2, ..., n) (1.6)
P (A) X
P (A/Bi ).P (Bi )
i=1

Ví dụ 1.25. Cho hai lô sản phẩm. Lô I có 20 sản phẩm, trong đó có 15 sản


phẩm tốt và 5 phế phẩm. Lo II có 20 sản phẩm, trong đó có 10 sản phẩm tốt và
10 phế phẩm. Lấy ngẫu nhiên 1 lô và từ đó chọn ngẫu nhiên 1 sản phẩm.
1. Tìm xác suất để sản phẩm lấy ra là sản phẩm tốt.
2. Giả sử sản phẩm được lấy ra là tốt. Tìm xác suất để sản phẩm đó của
lô thứ hai.

Giải.
1. Đặt A= là biến cố sản phẩm lấy ra là sản phẩm tốt và Bi = là biến cố sản
phẩm lấy ra ở lô thứ i( i=1, 2). Suy ra B1 , B2 lập thành một hệ đày đủ bởi vì
sản phẩm lấy ra không ở lô I thì ở lô II. Vậy,

B1 ∪ B2 = Ω.

Một sản phẩm lấy ra ở lô I thì thôi lấy ra ở lô II và ngược lại, lấy ở lô II thì thôi
lấy ở lô I. Suy ra
B1 ∩ B2 = ∅.

Theo công thức xác suất toàn phần ta có

P (A) = P (B1 )P (A/B1 ) + P (B2 )P (A/B2 ).

Theo đầu bài ta có


1 15 10
P (B1 ) = P (B2 ) = , P (A/B1 ) = , P (A/B2 ) = .
2 20 20

17
Vậy ta có
1 15 1 10 5
P (A) = . + . = .
2 20 2 20 8
2. Xác xuất phải tìm là
P (B2 )P (A/B2 ) 1/2.1/2 2
P (B2 /A) = = = .
P (A) 5/8 5


1.5 Phép thử Bernoulli và công thức xác suất nhị


thức
1.5.1 Phép thử Bernoulli
Định nghĩa 1.23. Dãy n phép thử G1 , G2 , ..., Gn được gọi là dãy phép thử
Bernoulli nếu nó thỏa mãn các điều kiện sau đây:
1. Dãy n phép thử đó là độc lập
2. Mỗi phép thử Gi tương ứng với một không gian biến cố sơ cấp Ωi = {A, A}.
3. Xác suất của biến cố A là P(A) không thay đổi trong mọi phép thử.

1.5.2 Công thức xác suất nhị thức


Mệnh đề 1.1. Đặt P (A) = p, q = 1 − p. Nếu tiến hành n phép thử độc lập, trong
mỗi phép thử xác suất xuất hiện biến cố A không thay đổi và luôn bằng p, thì
xác suất để biến cố A xuất hiện k lần trong n phép thử được tính theo công thức

pn (k) = Cnk pk q n−k .

được gọi là công thức Bernoulli.

Ví dụ 1.26. Gieo ngẫu nhiên 20 lần một đồng tiền cân đối và đồng chất. Tìm
xác suất để:
1. Có đúng 1 lần xuất hiện mặt sấp.
2. Có ít nhất 2 lần xuất hiện mặt sấp.

Giải.
1. Xem việc gieo 20 lần đồng xu như phép thử Bernoulli, biến cố xuất hiện mặt
sấp(biến cố A)luôn bằng 1/2 trong 1 lần gieo. Theo công thức Bernoulli ta có

1 1 5
P20 (1) = C20 (1/2)1 (1 − 1/2)20−1 = 20. 20
= 18 .
2 2

18
2. Ta phải tính xác suất của biến cố [k ≥ 2], k là số lần xuất hiện biến cố A
trong dãy n phép thử Bernoulli. Ta có
 1 0  1 20−0

0
P [k ≥ 2] = 1 − P [k < 2] = 1 − P20 (0) − P20 (1) = 1 − C20 1−
2 2
 1 1  1
20−1 1 5 21
1
−C20 1− =1− 20
− 18 = 1 − 20 .
2 2 20 2 2


Ví dụ 1.27. Gieo 100 hạt đậu tương. Xác suất nảy mầm của mỗi hạt là 0,9.
Tính xác suất để trong 100 hạt:
1. Có đúng 80 hạt nảy mầm.
2. Có ít nhất 1 hạt nảy mầm.
3. Có nhiều nhất 98 hạt nảy mầm.

Giải. Gieo 100 hạt đậu tương được xem như thực hiện 100 phép thử Bernoulli.
Gọi A là biến cố: hạt nảy mầm. Theo giả thiết có P(A)=0,9. Theo công thức
tính xác suất nhị thức, ta có
k
P100 (k) = C100 (0, 9)k (0, 1)100−k .

80 (0, 9)80 (0, 1)100−80 = C 80 (0, 9)80 (0, 1)20 .


1. Với k=80: P100 (80) = C100 100
2. Gọi k là số hạt nảy mầm trong 100 hạt. Ta cần tính xác suất P [k ≥ 1].
Ta có
0
P [k ≥ 1] = 1 − P [k = 0] = 1 − C100 (0, 9)0 (0, 1)100−0 = 1 − (0, 1)100 .

3.
99 100
P [k ≤ 98] = 1 − P [k > 98] = 1 − C100 (0, 1) − C100 (0, 9)100 = 1 − (0, 9)99 .

Bài tập chương 1


1.1. Gieo hai đồng xu cân đối, đồng chất và giống nhau . Tìm xác xuất để:
a) Mặt trên của các đồng xu đều là ngửa.
b) Mặt trên của các đồng xu có ít nhất 1 là ngửa.

19
Trả lời. Gọi A là biến cố: "Mặt trên của các đồng xu đều là ngửa", còn B là
biến cố: " Mặt trên của các đồng xu có ít nhất 1 là ngửa". Ta có
1
a) P (A) = .
4
3
b) P (B) = . 
4
1.2. Chọn ngẫu nhiên lần lượt 3 chữ số từ tập hợp 5 chữ số {0, 1, 2, 3, 4}, và xếp
thành hàng ngang từ trái sang phải. Tìm xác xuất để nhận được một số gồm 3
chữa số(không kể chữa số 0 đứng đầu tiên).

Giải. Số các số gồm 3 chữ số(kể cả chữ số 0 đứng đầu có thể lập được là số các
chỉnh hợp không lặp chập 3 của 5:
5!
A35 = = 60.
(5 − 3)!

Số các số gồm 3 chữ số có chữ số 0 đứng đầu bằng số bằng số các chỉnh hợp
chập 2 của 4 từ các tập hơp {1, 2, 3, 4} :
4!
A24 = = 12.
(4 − 2)!

Số các số có 3 chữ số mà không có chữ số 0 đứng đầu là

A35 − A24 = 60 − 12 = 48.

Xác suất phải tìm là


A35 − A24 48 4
P (A) = 3
= = .
P5 60 5


1.3. Tìm xác suất để điểm M của hình tròn bán kính R rơi vào:
a) Hình vuông nội tiếp nó.
b) Tam giác đều nội tiếp nó.

Trả lời. a) 2/π, b) 3 3/4π. 

1.4. Có hai lô hàng. Lô I có 12 sản phẩm, trong đó có 8 sản phẩm tốt và 4 phế
phẩm. Lô II có 10 sản phẩm, trong đó 5 sản phẩm tốt và 5 phế phẩm. Lấy ngẫu
nhiên 1 lô hàng và từ lô đó chọn ngẫu nhiên 1 sản phẩm. Hãy tìm xác suất để
sản phẩm ấy là tốt. Giả sử sản phẩm đó là tốt. Tìm xác suất để sản đó là của
lô thứ II.

20
Giải. Ký hiệu A=biến cố " sản phẩm lấy ra là sản phẩm tốt", Bi =biến cố " sản
phẩm lấy ra là ở lô thứ i". Ta có {B1 , B2 } là một hệ đầy đủ, hay B1 ∩ B2 = ∅.
Áp dụng công thức
2
X
P (A) = P (Bi )P (A/Bi ) = P (B1 )P (A/B1 ) + P (B2 )P (A/B2 ) (∗)
i=1

Ta có
1 8 2 5 1
P (B1 ) = P (B2 ) = , P (A/B1 ) = = , P (A/B2 ) = = .
2 12 3 10 2

Thay vào (*) ta được


1 2 1 1 1 1 7
P (A) = . + . = + = .
2 3 2 2 3 4 12

Vậy xác suất phải tìm là


1 1
P (B2 )P (A/B2 ) . 3
P (B2 /A) = = 2 =
2
P (A) 7 7
12
.

1.5. Cho hai hộp đựng bi, hộp thứ nhất có 3 bi đỏ, 4 bi trắng; hộp thứ ha có 5
bi đỏ và 3 bi trắng. Bốc ngẫu nhiên 1 bi từ hộp thứ nhất bỏ vào hộp thứ hai, rồi
lấy ngẫu nhiên 1 bi từ hộp thứ hai bỏ ra ngoài. Tính xác suất để viên bi lấy ra
lần 2 là trắng.

Giải. Gọi Ai là biến cố lần thứ i lấy ra bi trắng. Ta có {Ai , Ai } là một hệ đầy
đủ. Ta có
P (A2 ) = P (A1 )P (A2 /A1 ) + P (A1 )P (A2 /A1 )
4 4 3 3 25
= . + . = .
7 9 7 9 63


21
Chương 2

Biến ngẫu nhiên và hàm phân phối

2.1 Cơ sở của phép tính vi phân và tích phân hàm


một biến
2.1.1 Đạo hàm và vi phân của hàm hiển
Định nghĩa 2.1. • Cho hàm số(hiển) y=f(x), xác định trong một khoảng nào
đó. Giả sử x1 , x2 là các giá trị của x. Đặt ∆x = x2 − x1 và gọi là số gia của đối
số, ∆y = y2 − y1 = f (x2 ) − f (x1 ) được gọị là số gia tương ứng của hàm số. Đạo
hàm của hàm số y=f(x) tại x1 được xác định theo công thức
∆y f (x1 + ∆x) − f (x1 )
y 0 (x1 ) = lim , hay f 0 (x1 ) = lim .
∆x→0 ∆x ∆x→0 ∆x
• Đạo hàm cấp hai và cấp cao. y 00 = (y 0 )0 , y 000 = (y 00 )0 , ..., yhn) = (y ( n − 1)0 .
• Biểu thức dy = y 0 dx = f 0 (x)dx được gọi là vi phân của hàm số tại điểm
dy
x. Do đó ta có y 0 = .
dx
• Phép toán tìm đạo hàm và vi phân của hàm số được gọi là phép toán vi
phân.

Ví dụ 2.1. Tìm đạo hàm của hàm số y = x3 .

Giải. Ta có

∆y = (x + ∆x)3 − x3 = [(x + ∆x) − x][(x + ∆)2 + (x + ∆x)x + x2 ]


∆y
= ∆x[3x2 + 3x∆x + ∆x2 ], = 3x2 + 3x∆x + ∆x2 .
∆x
Do đó
∆y
y 0 = lim = lim [3x2 + 3x∆x + ∆x2 ] = 3x2 .
∆x→0 ∆x δx→0


22
2.1.2 Bảng đạo hàm và vi phân của các hàm số cơ bản
1. (xm )0 = mxm−1 8. (sin x)0 = cos x
√ 1
2. ( x)0 = √ 9. (cos x)0 = − sin x
 1 0 2 1x 1
3. =− 2 10. (tan x)0 =
x x cos2 x
0 1
x
4. (e ) = e x 11. (cot x)0 = − 2
sin x
1
5. (ax )0 = ax ln a 0
12. (arcsin x) = √
1 − x2
1 1
6.(ln x)0 = 13. (arccos x)0 = − √
x 1 − x2
1 1
7.(loga x)0 = 14. (arctan x)0 =
x ln a 1 + x2

2.1.3 Đạo hàm của hàm hợp


• Bảng đạo hàm của hàm hợp. Nếu y=f(u), u=u(x), nghĩa là y=f(u(x)),
trong đó f(u) và u(x) là những hàm có đạo hàm, thì

yx0 = yu0 .u0x .

Ta có bảng sau đây


1. (uα )0 = αuα−1 .u0
2. (au )0 = au ln a.u0 , (eu )0 = eu .u0
u0 u0
3. (loga u)0 = , (ln u)0 = , u > 0.
u ln a u
4. (sin u)0 = cos u.u0 .
5. (cos u)0 = − sin u.u0 .
u0
6. (tan u)0 = .
cos2 u0
u
7. (cot u)0 = − 2 .
sin u
0 u0
8. (arcsin u) = √ .
1 − u2
u0
9. (arccos u)0 = − √ .
1 − u2
u0
10. (arctan u)0 = .
1 + u2
u0
11. (arccotu)0 = − .
1 + u2

23
2.1.4 Các phép toán của đạo hàm và vi phân
• Các phép toán của đạo hàm
Giả sử c là hằng số, u=u(x), v=v(x) là các hàm số có đạo hàm. Khi đó
1. c0 = 0, x0 = 1.
2. (cu)0 = cu0 .
3. (u ± v)0 = u0 ± v 0 .
4. (uv)0 = u0 v + uv 0 .
 u 0 u0 v − uv 0
5. =
v v2
• Các phép toán của vi phân
1. d(cu) = cdu.
2. d(u ± v) = du ± dv.
3. d(uv) = u.dv + v.du.
 u  vdu − udv
4. d = .
v v2

2.1.5 Tìm cực trị của hàm khả vi


• Cho hàm số y=f(x) khả vi trong khoảng (a, b). Ta cần tìm giá trị lớn
nhất (max f) hay nhỏ nhất (min f) của f(x) trong khoảng đã cho. Tiến hành như
sau:
• Tìm điểm dừng, tức là tìm nghiệm của đạo hàm cấp 1: f 00 (x) = 0 ⇒ xd −
là một trong các điểm dừng(nếu có).
• Tìm cực trị: Tính f 00 (xd ),nếu f 00 (xd ) < 0, thì ta có maxf = f (xd ), nếu
f 00 (xd ) > 0 thì minf = f (xd ).

2.1.6 Định nghĩa nguyên hàm và tích phân bất định.Bảng các
tích phân bất định cơ bản
Định nghĩa 2.2. Hàm F(x) được gọi là nguyên hàm (Primitive function) của
hàm f(x) trên khoảng X, nếu

F 0 (x) = f (x), hay dF = f (x)dx, ∀x ∈ X

Định lý 2.1. Nếu F(x) là một nguyên hàm của f(x) thì F(x)+C cũng là một
nguyên hàm cùa f(x). Ngược lại, mọi nguyên hàm của hàm số f(x) đều biểu diễn
được ở dạng F(x)+C, với C là một hằng số.

24
Định nghĩa 2.3. Tích phân bất định(Indefinite integral) của hàm số f(x) là
biểu thức của nguyên hàm tổng quát(họ của các nguyên hàm): F(x)+C, trong
đó F(x) là một nguyên hàm của f(x) và C là một hằng số tùy ý. Để biểu diễn
tích phân bất định của hàm f(x) người ta dùng ký hiệu
Z
f (x)dx = F (x) + C

Ví dụ
x3
Z
x2 dx = +C
3

Các tính chất của tích phân bất định


Z 0 Z
1. f (x)dx = f (x) hay d f (x)dx = f (x)dx.
Z
2. F 0 (x)dx = F (x) + C
Z Z Z
3. [af (x) + bg(x)]dx = a f (x)dx + b g(x)dx.

Bảng các tích phân bất định cơ bản


Z Z
1. 1.dx = dx = x + C
xm+1
Z
2. xm dx = + C, m 6= −1
Z m+1
dx
3. dx = ln |x| + C
Z x
ax
Z
x
4. a dx = + C; ex dx = ex + C
Z ln a
5. sin xdx = − cos x + C
Z
6. cos xdx = sin x + C
Z
7. tan xdx = − ln | cos x| + C
Z
8. cot xdx = ln | sin x| + C
Z
dx
9. 2
= − cot x + C
Z sin x
dx
10. 2
= tan x + C
Z cos x
dx
11. √ = arcsin x + C
1 − x2

25
Z
dx
12. 2
= arctan x + C
Z 1+x
dx p
13. √ = ln(x + x2 ± a2 ) + C
x 2 ± a2 Z Z
14. Tích phân từng phần: vdu = uv − vdu

2.1.7 Định nghĩa tích phân xác định


Định nghĩa 2.4. Cho hàm số f(x) xác định và liên tục trên đoạn [a, b]. Chia
đoạn [a, b] thành các doạn nhỏ [xi−1 , xi ] bởi các điểm chia tùy ý(gọi là phân
hoạch):
a = x1 < x2 < ... < xn = b

Giả sử ∆xi = xi − xi−1 , ξi ∈ [xi−1 , xi ]. Theo định nghĩa ta có


Z b X n
f (x)dx = lim f (ξi )∆xi
a max∆i →0
i=1

Nếu giới hạn trên tồn tại ta nói hàm f(x) khả tích trên [a, b] hay (a, b).

Định lý 2.2. Các hàm liên tục trên đoạn [a, b], các hàm bị chặn, có một số
hữu hạn các điểm gián đoạn loại 1 trên đoạn [a, b] là những hàm khả tích trên
[a, b].

2.1.8 Công thức Newton-Leibniz


Nếu f(x) xác định và liên tục trên đoạn [a, b], và nếu F(x) là một nguyên
hàm của f(x) trên đoạn đó, thì
Z b b
f (x)dx = F (x) = F (b) − F (a)

a a

Ví dụ 2.2. Tính tích phân Z 2


I= x2 dx.
1

x3
Giải. Nguyên hàm củax2 là , do đó theo công thức Newton-Leibnitz ta có
3
x3 2 1 3 7

I= = (2 − 13 ) = .
3 1 3 3


26
2.1.9 Tích phân với cận thay đổi
• Tích phân với cận trên thay đổi
Z x
Φ(x) = f (t)dt, x∈X
a

Tính chất Z x
0
Φ (x) = f (x), Φ(x) = f (t)dt = F (x) + C,
a
trong đó F(x) là một nguyên hàm của f(x).
• Tích phân với cận dưới thay đổi
Tích phân với cận trên thay đổi
Z b
Φ(x) = f (t)dt, x∈X
x

Tính chất Z b
0
Φ (x) = −f (x), Φ(x) = f (t)dt = −F (x) + C,
x
trong đó F(x) là một nguyên hàm của f(x).

2.1.10 Tích phân suy rộng loại một


Định nghĩa 2.5. Nếu hàm y=f(x)xác định trong khoảng a ≤ x < ∞ và khả tích
trên mọi đoạn hữu hạn [a, A], thì theo định nghĩa:
Z ∞ Z A
f (x)dx = lim f (x)dx.
a A→+∞ a

Tương tự Z a Z a
f (x)dx = lim f (x)dx.
−∞ A→−∞ A
Z ∞ Z a Z ∞
f (x)dx = f (x)dx + f (x)dx.
−∞ −∞ a

Ví dụ 2.3. Tính tích phân


Z ∞
1
J= dx.
0 1 + x2

Theo định nghĩa tích phân suy rộng loại 1, ta có


Z a x=a
1 π
L = lim dx = lim arctan x = lim (arctan a − 0) = .

a→+∞ 2 1+x a→+∞ x=0 a→+∞ 2
0

27
2.2 Các khái niệm cơ bản của biến ngẫu nhiên và
hàm phân phối
2.2.1 Biến ngẫu nhiên
Xét ví dụ: Gieo ngẫu nhiên 1 là đồng xu cân đối và đồng chất.Ta xem một
lần gieo đồng xu là tiến hành một phép thử ngẫu nhiên: " gieo đồng xu". Không
gian các biến cố sơ cấp với phép thử này là Ω = {S, N }. Gọi X là " xuất hiện
mặt sấp" trong 1 lần gieo đó. Ta thấy rằng X có thể nhận hai giá trị: 0 hoặc 1.
• X=0 nếu đồng tiền xuất hiện mặt ngửa (N). Điều này có nghĩa là ứng
với phần tử N ∈ Ω cho số 0 với xác suất P (N ) = 1/2.
• X=1 nếu đồng tiền xuất hiện mặt sấp. Điều này có nghĩa là ứng với phần
tử S ∈ Ω cho số 1 với xác suất P (S) = 1/2.
Qua ví dụ trên ta thấy đại lượng X liên quan đến phép thử ngẫu nhiên mà
ứng với mỗi kết quả của phép thử cho một số với một xác suất nào đó, được
gọi là giá trị của X. Đại lượng X như thế được gọi là biến ngẫu nhiên, hay đại
lượng ngẫu nhiên.
Định nghĩa 2.6. Hàm X = X(ω) được xác định trên không gian các biến cố sơ
cấp Ω và nhận giá trị trong R, nếu với x ∈ R tập hợp {ω ∈ Ω|X(ω) < x} là biến
cố ngẫu nhiên. Ta thường ký hiệu các biến ngẫu nhiên bằng các chữ X, Y, Z,...,
giá trị của nó ký hiệu bằng các chữa thường x, y, z, ...
Xét các ví dụ.

• X là số viên đạn trúng đích khi bắn liên tiếp n viên đạn độc lập vào một
mục tiêu. Giá trị mà nó có thể nhận là 0, 1, 2, ..., n.
• X là số sản phẩm tốt trong 10 sản phẩm được chọn ngẫu nhiên từ lô sản
phẩm có 100 sản phẩm tốt và 50 phế phẩm. X là biến ngẫu nhiên và giá trị của
nó có thể nhận là 0, 1,2,..., 9, 10.
• X là số hạt nảy mầm khi gieo 100 hạt đậu tương, X là biến cố ngẫu
nhiên.
Định nghĩa 2.7. Biến ngẫu nhiên rời rạc là biến ngẫu nhiên mà các giá trị của
nó có thể nhận là tập hợp hữu hạn hoặc vô hạn đếm được.
Định nghĩa 2.8. Biến ngẫu nhiên liên tục là biến ngẫu nhiên mà giá trị có thể
nhận của nó là tất cả mọi điểm trong khoảng (a, b), trong đó a có thể là −∞,
còn b có thể là +∞.

28
2.2.2 Hàm phân phối
Ta nhận thấy tập [ω : X(ω) < x], x ∈ R thay đổi, nếu x thay đổi. Do đó
xác suất P [ω : X(ω) < x] cũng thay đổi.

Định nghĩa 2.9. Ta gọi hàm(xác suất) P [ω : X(ω) < x], x ∈ R là hàm phân phối
của biến ngẫu nhiên X và ký hiệu

F (x) = P [ω : X(ω) < x], x ∈ R.

Ví dụ 2.4. Tìm hàm phân phối của biến ngẫu nhiên X chỉ số lần xuất hiện mặt
sấp khi gieo một lần đồng xu cân đối và đồng chất.

Giải. Không gian các biến cố sơ cấp của phép thử là Ω = {S, N }. Gọi X là số
lần xuất hiện mặt sấp trong 1 lần xuất hiện mặt sấp trong 1 lần tung đồng xu
, X chỉ có thể nhận hai giá trị 0 hay 1, nên ta có bảng phân phối xác suất

X 0 1
P 1/2 1/2

Với mỗi x ∈ R ta chứng minh tập [ω : X(ω) < x] là biến cố ngẫu nhiên. Thật
vậy, ta có phân tích như sau:


∅, x ≤ 0 (không thể)
[ω : X(ω) < x] = {N }, 0 < x ≤ 1 (mặt sấp không xuất hiện)
Ω, x > 1 ( biến cố X<x ) bao giờ cũng xảy ra

Vậy hàm phân phối của biến ngẫu nhiên X là



P (∅) = 0,
 x≤0
1
F (x) = P [ω) : X(ω) < x] = P ({N }) = , 0 < x ≤ 1
 2
P (Ω) = 1, x > 1,

tức là 
0,
 x≤0
1
F (x) = P [ω) : X(ω) < x] = , 0<x≤1
2

1, x > 1.


29
2.2.3 Các tính chất của hàm phân phối
Tính chất 2.1. Hàm phân phối F (x) là hàm đơn điệu tăng, nghĩa là nếu x1 < x2

Chứng minh. Thật vậy, giả sử x1 < x2 . Ta có

[ω : X(ω) < x2 ] = [ω : X(ω) < x1 ] ∪ [ω : x1 ≤ X(ω) < x2 ].

Hai biến cố ở vế phải xung khắc nhau, nên

P [ω : X(ω) < x2 ] = P [ω : X(ω) < x1 ] + P [ω : x1 ≤ X(ω) < x2 ].

Vì xác suất của biến cố bất kỳ không âm, nên

F (x2 ) = F (x1 ) + P [ω : x1 ≤ X(ω) < x2 ] ≥ F (x1 ).

Tính chất 2.2. Hàm phân phối F (x) là hàm liên tục bên trái, nghĩa là limx→a− F (x) =
F (a).

Tính chất 2.3.


lim F (x) = 0, lim F (x) = 1.
x→−∞ x→+∞

2.2.4 Phân phối rời rạc


Giả sử X là biến ngẫu nhiên rờì rạc, nhận các giá trị có thể với các xác

X
suất tương ứng P [X = xi ] = pi ≥ 0, pi = 1. Ta có bảng phân phối xác suất
i=1

X x1 x2 ... an ...
P [X = xi ] p1 p2 ... pn ...

Ví dụ 2.5. Gieo một lần con xúc xắc cân đối và đồng chất. Ký hiệu X là biến
ngẫu nhiên chỉ số chấm mặt trên của con xúc xắc. Tìm phân phối xác suất của
X. Tính xác suât P [0 ≤ X < 3] và xác suất P [0 ≤ X < 5].

Giải. Vì con xúc xắc là cân đối và đồng chất, nên các biến cố xuất hiện các
mặt có số chấm là 1, 2, ..., 6 là đồng khả năng và bằng 1/6. Ta có bẳng phân
phối xác suất của X là:

X 1 2 3 4 5 6
p 1/6 1/6 1/6 1/6 1/6 1/6

30
Hàm phân phối xác suất là

x x≤1 1<x≤2 2<x≤3 3<x≤4 4<x≤5 5<x≤6 x>6


F(x) 0 1/6 1/3 1/2 2/3 5/6 1


Từ đây suy ra các xác suất
1 1
P [0 ≤ X < 3] = F (3) − F (0) = −0= .
3 3
2 2
P [0 ≤ X < 5] = F (5) − F (0) = −0= .
3 3

2.2.5 Phân phối liên tục-mật độ xác suất


Định nghĩa 2.10. Biến ngẫu nhiên có phân phối liên tục tuyệt đối, nếu hàm
phân phối có dạng Z x
F (x) = f (u)du, x ∈ R.
−∞

Hàm dưới dấu tích phân f(x) được gọi là mật độ xác suất của X

Các tính chất:

Tính chất 2.4. Mật độ xác suất f (x) ≥ 0, ∀x ∈ R.

Chứng minh. ta có f (x) = F 0 (x) ≥ 0 vì F(x) là hàm đơn điệu tăng 

Tính chất 2.5. Z ∞


f (x)dx = 1, vì lim F (x) = 1.
−∞ x→+∞

Tính chất 2.6. Z b


P [ω : a ≤ X(ω) < b] = f (x)dx.
a

2.3 Kỳ vọng toán, phương sai và độ lệch chuẩn


2.3.1 Kỳ vọng toán
Định nghĩa 2.11. Giả sử biến ngẫu nhiên X có phân phối xác xuất
X x1 x2 ... an ...
p p1 p2 ... pn ...

31

X
với pi = 1. Nếu
i=1

X
|xi |pi < +∞
i=1

X
thì chuỗi xi pi được gọi kỳ vọng toán học của biến ngẫu nhiên X và được ký
i=1
hiệu là E(X):

X
E(X) = xi p i .
i=1

Định nghĩa 2.12. Giả sử biến ngẫu nhiên X có hàm mật độ là f(x). Nếu tích
R +∞ R +∞
phân −∞ |x|f (x)dx < +∞ thì ta gọi tích phân −∞ xf (x)dx là kỳ vọng toán học
của biến ngẫu nhiên X và ký hiệu là E(X). Vậy
Z +∞
E(X) = xf (x)dx.
−∞

Ý nghĩa của kỳ vọng của đại lượng ngẫu nhiên X là giá trị trung bình của
đại lượng ngẫu nhiên đó. Kỳ vọng của đại lượng ngẫu nhiên X còn thường được
ký hiệu là M(X).
Về mặt hình học, kỳ vọng toán của đại lượng ngẫu nhiên X, rời rạc hay
liên tục, bằng tọa độ trọng tâm của một miền phẳng bị bao bọc bởi đường cong
hoặc được gấp khúc và trục hoành. Vì vậy khi có sự đối xứng của đường cong
qua đường thẳng song song với trục tung, kỳ vọng toán trùng với hoành độ giao
điểm của trục đối xứng với trục hoành Ox.
Điểm trên Ox, có hoành độ bằng kỳ vọng toán của đại lượng ngẫu nhiên
được gọi là tâm phân bố của đại lượng này.
Ví dụ 2.6. Cho phân phối xác suất của X là
X 0 1
p 1/2 1/2
Tìm kỳ vọng của X. Theo định nghĩa của kỳ vọng ta có
1 1 1
E(X) = 0. + 1. = .
2 2 2
Ví dụ 2.7. Phân phối xác suất của X cón hàm mật độ
( 1
, x ∈ (a, b), 0 < a < b,
f (x) = b−a
0, x ∈
/ (a, b).

32
Tính kỳ vọng của X. Theo định nghĩa ta có
Z ∞ Z b
x 1 1 2 b 1 b 2 − a2 a+b

E(X) = xf (x) = dx = . x = . = .
−∞ a b−a b−a 2 a b−a 2 2

Ví dụ 2.8. Cho hàm số



nếu x < 0,
0,
f (x) = (1/2) sin x, nếu 0 ≤ x ≤ π,
nếu x > π.

0,

Chứng minh rằng f(x) có thể là mật độ xác suất của một đại lượng ngẫu nhiên
X nào đó. Tìm kỳ vọng toán của X.

Giải. Ta có
Z ∞ Z π Z π
1 1 π

f (x)dx = f (x)dx = sin xdx = − cos x = 1.
−∞ 0 2 0 2 0

Ngoài ra f (x) ≥ 0. Do đó f(x) có thể là mật độ xác suất của một đại lượng ngẫu
nhiên nào đó.
Vì x = π/2 là trục đối xứng của đồ thị f(x), nên kỳ vọng của đại lượng ngẫu
nhiên X có mật độ xác suất f(x) bằng π/2.

Các tính chất của kỳ vọng toán
• Kỳ vọng của biến ngẫu nhiên hằng:

E(C) = C.

Biến ngẫu nhiên hằng là biến ngẫu nhiên luôn luôn nhận 1 giá trị.
• Kỳ vọng của biến ngẫu nhiên với biến ngẫu nhiên hằng

E[CX] = CE(X).

• Kỳ vọng của tổng và hiệu các biến ngẫu nhiên:

E(X ± Y ) = E(X) ± E(Y ).

• Kỳ vọng của tích các biến ngẫu nhiên: Nếu X, Y là hai biên ngẫu nhiên
độc lập(quy luật phân phối xác suất không phụ thuộc nhau) thì:

E(XY ) = E(X)E(Y ).

33
2.3.2 Phương sai
Trong thực tế nhiều khi chỉ xác định kỳ vọng toán của biến ngẫu nhiên thì
chưa đủ để xác định biến ngẫu nhiên. Ta còn phải xác định mức độ phân tán
của các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình của nó nữa.

Định nghĩa 2.13. Giả sử E(X) là kỳ vọng toán của biến ngẫu nhiên X. Khi đó
đại lượng E[X − E(X)]2 = E(X 2 ) − [E(X)]2 được gọi là phương sai và ký hiệu là
D(X).

Phương sai của một đại lượng ngẫu nhiên X cho biết độ lệch của nó so với
giá trị trung bình.
Các tính chất của phương sai
• Kỳ vọng toán của biến ngẫu nhiến rời rạc

X ∞
X
2
D(X) = pi [xi − E(X)] = x2i pi − [E(X)]2 (2.1)
i=1 i=1

• Phương sai toán của biến ngẫu nhiến liên tục X có kỳ vọng E(X) được
xác định theo công thức
Z ∞ Z ∞
2
D(X) = [x − E(X)] f (x)dx = x2 f (x)dx − [E(X)]2 . (2.2)
−∞ −∞

trong đó f(x) là mật độ xác suất.


• Đối với đại lượng ngẫu nhiên X, có công thức

D(X) = E[(X − a)2 ] − [E(X) − a]2 , (2.3)

trong đó a là số tùy ý, đặc biệt là là a=E(X):

D(X) = E[(X − E(X))2 ]. (2.4)


Công thức (2.4) thường được sử dụng để định nghĩa phương sai của đại lượng
ngẫu nhiên X.
• Phương sai của biến ngẫu nhiên hằng bằng không:

D(C) = 0.

• Với X là đại lượng ngẫu nhiên còn c là hằng số tùy ý, có công thức

D(CX) = CD(x).

34
• Nếu X, Y là hai biến ngẫu nhiên độc lập thì

D(X + Y ) = D(X) + D(Y ).

Bản chất và ý nghĩa của phương sai


• Xuất phát từ định nghĩa của phương sai, ta thấy phương sai chính là
trung bình số học của bình phương các sai lệch giữa các giá trị có thể có của
biến ngẫu nhiên so với các giá trị trung bình của các giá trị đó. Do đó nó phản
ánh mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị
trung bình của nó là kỳ vọng toán.
Ví dụ 2.9. Tung n con xúc xắc. Tìm phương sai của tổng số chấm thu được.
Giải. Gọi Xi (i = 1, n) là số chấm thu được ở con xúc xắc thứ i. Gọi X là tổng
số chấm thu được ở n con xúc xắc. Vậy
n
X
X= Xi .
i=1

Vì các Xi đọc lập với nhau, nên theo tính chất của phương sai, ta có
n
X n
X
D(X) = D( Xi ) = D(Xi )
i=1 i=1

Ta tìm D(Xi ) theo công thức

D(Xi ) = E(Xi2 ) − [E(Xi )]2 .

Mỗi biến ngẫu nhiên Xi (i = 1, n) đều có bảng phân phối xác xuất như sau
Xi 1 2 3 4 5 6
p 1/6 1/6 1/6 1/6 1/6 1/6
Do đó
1 7
E(Xi ) = (1 + 2 + 3 + 4 + 5 + 6) = = 3, 5.
6 2
1 91
E(Xi2 ) = (12 + 22 + 32 + 42 + 52 + 62 ) = .
6 6
Do đó
91 7 35
D(Xi ) = − = .
6 2 12
Suy ra
n
X 35
D(X) = D(Xi ) = n.
12
i=1


35
2.3.3 Độ lệch chuẩn
Định nghĩa 2.14. Độ lệch chuẩn của biến ngẫu nhiên X, ký hiệu là σX , là căn
bậc hai của phương sai
p
σX = D(X) (2.5)

Ta thấy đơn vị đo của phương sai bằng bình phương đơn vị đo của biến
ngẫu nhiên. Vì vậy, khi cần phải đánh giá mức độ phân tán của biến ngẫu nhiên
theo đơn vị đo của nó người ta thường dùng độ lệch chuẩn chứ không phải là
phương sai vì độ lệch chuẩn có cùng đơn vị đo với biến ngẫu nhiên cần nghiên
cứu.

2.4 Mode và trung vị


2.4.1 Mode
Định nghĩa 2.15. Mode xmod của đại lượng ngẫu nhiên rời rạc X là giá trị mà
xung quanh nó có nhiều giá trị tập trung. Chính xác hơn, xmod là giá trị tại đó
xác xuất P [X = xmod ] là lớn nhất.

Ví dụ 2.10. Cho X = {13, 18, 13, 14, 13, 16, 14, 21, 13}. Ta sắp xếp lại các giá trị
của X theo thứ tự tăng dần: X 0 = {13, 13, 13, 14, 14, 16, 18, 21}. Rõ ràng là giá trị
tập trung là 13, vậy xmod = 13.

Ví dụ 2.11. Cho phân phối xác suất của biến ngẫu nhiên X là
X −1 0 1
p 1/6 2/3 1/6

Ta có xmod = 0 vì P[ X=0]=2/3 là lớn nhất.

Định nghĩa 2.16. Mode của đại lượng nhẫu nhiên liên tục X được gọi là giá
trị của nó mà tại đó mật độ xác suất đạt giá trị cực đại

Mode có thể có vô số giá trị. Nếu đường thẳng x=a là trục đối xứng của
đường cong phân bố y=(x), thì xmod = a = E(X).

Ví dụ 2.12. Giả sử biến ngẫu nhiên X có hàm mật độ


(x − 3)2
1 −
f (x) = √ e 2σ 2 .
2πσ

36
Dễ thấy rằng f(x) đạt giá trị lớn nhất tại x=3. Do đó xmod = 3. Thật vậy, lấy
đạo hàm cấp 1 theo x, ta có
(x − 3)2
1 (x − 3)2 0 −
h i
f 0 (x) = √ . − e 2σ 2 .
2πσ 2σ 2

Dễ thấy rằng f 0 (x) = 0 ⇔ x = 3 và f 00 (3) < 0. Từ đó suy ra fmax = f (3). Vậy


xmod = 3.

Ví dụ 2.13. Mật độ xác suất của đại lượng ngẫu nhiên liên tục có dạng f (x) =
2
ae2x−x (a > 0). Có thể chứng tỏ rằng xmod = 1.

2.4.2 Trung vị(median)


Định nghĩa 2.17. Trung vị của đại lượng ngẫu nhiên rời rạc là số nằm giữa
trong một tập dữ liệu sắp xếp(từ thấp đến cao, hay ngược lại). Nếu tập dữ liệu
có số các điểm dữ liệu là lẻ thì trung vị là số nằm chính giữa. Nếu tập dữ liệu
có số các giá trị là chẵn, để tìm trung vị, ta cần tìm cặp dữ liệu ở giữa, rồi lấy
trung bình cộng tổng của chúng. Trung vị thường được ký hiệu là µd .

Ví dụ 2.14.

a = {1, 2, 3, 4, 5, 6, 7, 8, 9} : µd (a) = 5.
b = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} : µd (b) = 5, 5.

Định nghĩa 2.18. Trung vị của đại lượng ngẫu nhiên liên tục X được gọi là giá
trị µmod mà tại đó hàm phân phối F=1/2, nghĩa là

F (µd ) = P [X < µd ] = P [X > µd ] = 1/2.

Ví dụ 2.15. Cho mật độ xác suất của đại lượng ngẫu nhiên X:

0, x < 0,
f (x) = x − x3 /4, 0 ≤ x ≤ 2,
0, x > 2.

Tìm trung vị của đại lượng ngẫu nhiên này.

Giải. Trung vị µ được tìm từ điều kiện P [X < µ] < 0, 5. Trong trường hợp này
ta có Z µd 
1
 µ2 µ4
F (µd ) = P [X < µd ] = x − x3 dx = d − d .
0 4 2 16

37
Ta phải giải phương trình
µ2d µ4d 1
− = ⇔ µ4d − 8µ2d + 8 = 0.
2 16 2
p √ p √
Suy ra µd = ± 4 ± 8. Ta cần phải chọn µd ∈ (0, 2). Suy ra µd = 4 − 8 ≈
1, 09. 

2.5 Bài tập chương 2


Quy luật phân phối xác suất của biến ngẫu nhiên

2.1. Tung một con xúc xắc. Gọi X là "Số chấm xuất hiện ". Hãy tìm quy luật
phân phối xác suất của X.
Giải. Vì X là biến ngẫu nhiên rời rạc với các giá trị có thêt có X=1, 2, 3, 4, 5,
6 với các xác suất tương ứng đều bằng 1/6, nên ta có bảng phân phối xác suất
của X là
X 1 2 3 4 5 6
p 1/6 1/6 1/6 1/6 1/6 1/6
Kiểm tra
1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.

2.2. Trong hộp có 10 sản phẩm, trong đó có 6 chính phẩm(sản phẩm tốt). Lấy
ra ngẫu nhiên 2 sản phẩm. Tìm quy luật phân phối xác suất của số chính phẩm
được lấy ra.
Giải. Gọi X là ”Số chính phẩm lấy ra trong 2 sản phẩm ”. X là biến ngẫu nhiên
rời rạc với các giá trị X=0, 1, 2. Ta tìm xác suất tương ứng. Xác suât P(X=0)
chính là xác suất để 2 sản phẩm lấy ra không có chính phẩm nào(được 2 phế
phẩm). Theo định nghĩa cổ điển về xác suất ta có:
C42 6 2
P (X = 0) = 2
= = .
C10 45 15
Tương tự
C41 .C61 24 8
P (X = 1) = 2
= = ,
C10 45 15
C62 13 5
P (X = 2) = 2
= = .
C10 45 15
Như vậy, phân phối xác suất của X có dạng:

38
X 1 2 3 4 5 6
p 1/6 1/6 1/6 1/6 1/6 1/6

Kiểm tra
2/15 + 8/15 + 5/15 = 1.

Kỳ vọng toán và phương sai

2.3. Tìm kỳ vọng toán của biến ngẫu nhiên rời rạc X có bảng phân phối xác
suất như sau
X 1 3 4
p 0, 1 0, 5 0, 4

Trả lời. E(X)=3,2. 

2.4. Tìm kỳ vọng toán của biến ngẫu nhiên liên tục X có hàm mật độ xác suất
3 2
(
(x + 2x), x ∈ (0, 1),
f (x) = 4
0, x ∈/ (0, 1).

Trả lời. Z ∞
11
E(X) = xf (x)dx = .
−∞ 16


2.5. Tìm phương sai của biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
sau đây

X 1 3 4
p 0, 1 0, 5 0, 4

Giải. Trước hết ta tìm kỳ vọng toán E(X): E(X)=1.0,1+ 3.0,5+4.0,4=3,2. Kỳ


vọng toán E(X 2 ) :

E(X 2 ) = 12 .0, 1 + 32 .0, 5 + 42 .0, 4 = 11.

Suy ra
D(X) = E(X 2 ) − [E(X)]2 = 11 − (3, 2)2 = 0, 76.

39
2.6. Tìm phương sai của biến ngẫu nhiên liên tục X có hàm mật độ xác suất

2x, x ∈ (0, 1),
f (x) =
0, x ∈
/ (0, 1).

Trả lời.
1
D(X) = E(X 2 ) − [E(X)]2 = .
18


Trung vị và mode

2.7. Thu nhập của dân cư tại một vùng biển là biến ngẫu nhiên liên tục có hàm
phân bố xác suất như sau
(  x α
0
F (x) = 1 − , x ≥ x0 , α > 0,
x
0, x < x0 .

Hãy tìm mức thu nhập, sao cho một nửa số dân của vùng đó có thu nhập cao
hơn mức nói trên.

Giải. Mức thu nhập cần tìm chính là trung vị µd . Ta có


 α −α−1
αx0 x , x ≥ x0 ,
f (x) = F 0 (x) =
0, x < x0 .

Từ đó ta có Z µd
f (x)dx = 0, 5 ⇒ µd = x0 .21/α .
x0


40
Chương 3

Một số quy luật phân bố xác suất


thông dụng

3.1 Quy luật không-một A(P)


3.1.1 Khái niệm
Giả sử ta tiến hành một phép thử nào đó, trong đó biến cố A có thể xảy ra
với xác suất bằng p. Gọi X là số lần xuất hiện biến cố A trong phép thử đó. Như
vậy X là biến ngẫu nhiên rời rạc với hai giá trị có thể là 0(nếu biến cố không
xuất hiện) hoặc 1(nếu biến cố xuất hiện).
Xác suất để biến ngẫu nhiên X nhận một trong hai giá trị được cho bởi
công thức
PX = px q 1−x , q = 1 − p; x = 0; 1. (3.1)

Định nghĩa 3.1. Biến ngẫu nhiên rời rạc X nhận một trong hai giá trị có thể
X=0; 1 với các xác suất tương ứng được tính bằng công thức (3.1) được gọi là
phân phối theo quy luật không-một với tham số là p. Quy luật không-một được
ký hiệu là A(p).

Bảng phân phối xác suất:

X 0 1
P q p

3.1.2 Các tham số đặc trưng


• Kỳ vọng toán học:

E(X) = 0.q + 1.p = p.

41
• Phương sai:
D(X) = pq.
• Độ lệch chuẩn:
p √
σx = D(X) = pq.

3.1.3 Các ứng dụng


• Trong thực tế quy luật không-một thường được dùng để đặc trưng cho
các dấu hiệu nghiên cứu định tính khi có 2 phậm trù luân phiên. Chẳng hạn,
muốn nghiên cứu giới tính của khách hàng, ta có thể đặc trưng cho giới tính
bằng biến ngẫu nhiên với 2 giá trị 0(Nam) và 1(Nữ). Lúc đó xác suất p sẽ đặc
trưng cho tỷ lệ khách hàng nữ trong tập hợp khách hàng.
• Nếu dấu hiệu định tính có hơn 2 phạm trù thì có thể dùng nhiều biến
ngẫu nhiên phân phối không-một cùng một lúc. Về mặt lý thuyết quy luật
không-một có thể được dùng làm cơ sở để tìm quy luật phân phối xác suất của
các biến ngẫu nhiên khác.

3.2 Phân bố nhị thức B(n, p)


3.2.1 Định nghĩa
Chúng ta đã biết công thức Bernoulli, hay phân bố nhị thức. Nếu xác suất
xuất hiện của biến cố ngẫu nhiên trong mỗi lần thử là p không đổi, thì khi làm
n phép thử xác suất để biến cố xuất hiện x lần được xác định theo công thức
Px = P [X = x] = Cnx px (1 − p)n−x , x = 0, 1, ..., n. (3.2)
Định nghĩa 3.2. Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể
có X=0, 1, 2, ..., n với các xác suất tương ứng được cho bởi công thức (3.2) gọi
là phân phối theo quy luaaatj nhị thức với các tham số là n và p. Quy luật nhị
thức được lý hiệu là B(n, p).
Bảng phân phối xác suất
X 0 1 ... x ... n
P Cn0 p0 q n Cn1 p1 q n−1 ... Cnx px q n−x ... Cnn pn q 0
Ta có công thức
h
X
P [x ≤ X ≤ x + h] = px+k . (3.3)
k=1

42
3.2.2 Các tham số đặc trưng
• Kỳ vọng:

E(X) = np
• Phương sai:
D(X) = npq
• Độ lệch chuẩn:
p √
σX = D(X) = npq.

3.2.3 Các ví dụ
Ví dụ 3.1. Gieo 1000 hạt đậu tương. Xác xuất nảy mầm của mỗi hạt là p=0,8.
Gọi X là số hạt nảy màm trong 1000 hạt.Tìm phân phối xác suất của X. Tính
xác suất P [X ≥ 1]. Tính kỳ vọng và phương sai của X

Giải. Gieo 1000 hạt đậu tương được xem như thực hiện 1000 phép thử Bernoulli
với xác suất nảy mầm =0,8. Theo công thức xác suất nhị thức ta có
k
P [X = k] = C1000 (0, 8)k (0, 2)1000−k , k = 0, 1, 2, ..., 1000.

Đây chính là phân phối xác suất của X.


• Xác suất: P [X ≥ 1] = 1 − P [X = 0] = 1 − (0, 2)1000 .
• Kỳ vọng của X: E(X) = np = 1000.0, 8 = 800.
• Phương sai của X: D(X) = npq = 1000.0, 8.0, 2 = 160. 

Ví dụ 3.2. Một lô sản phẩm có tỷ lệ phế phẩm là 5%. lấy ngẫu nhiên liên tiếp(có
hoàn lại) 30 sản phẩm từ lô hàng. Gọi X là số sản phẩm tốt trong 30 sản phẩm
lấy ra. Tìm phân phối xác suất của X. Tính kỳ vọng và phương sai của X. Tính
số sản phẩm tốt có khả năng nhất trong 30 sản phẩm được lấy ra.

Giải. Xem việc lấy liên tiếp (có hoàn lại) 30 sản phẩm như việc thực hiện 30
phép thử Bernoulli. Xác suất để 1 sản phảm là sản phẩm tốt là p=1-0,05=0,95.
Theo công thức xác suất nhị thức ta có
k
P [X = k] = C30 (0, 95)k (0, 05)30−k , k = 0, 1, ..., 30.

Đây là phân phối xác suất của X.


Kỳ vọng của X: E(X)=np=30.0,95. 0,05=28,5
Phương sai: D(X)=npq=30.0,95.0,05=1,425. 

43
3.3 Phân bố Poisson
3.3.1 Định nghĩa
Định nghĩa 3.3. Biến ngẫu nhiên X có phân phối Poisson với tham số λ > 0
nếu phân phối của nó có dạng
λk e−λ
P [X = k] = , k = 0, 1, 2, ...
k!
Nếu phải tìm xác suất để trong n phép thử biến ngẫu nhiên X phân phối
theo quy luật Poíson nhận giá trị trong khoảng [x, x+h], trong đó h là số nguyên
dương tùy ý thì xác suất nỳ được tính theo công thức

P (x ≤ X ≤ x + h) = px + px+1 + ... + px+h . (3.4)

Giữa px và px−1 có mối quan hệ truy hồi


λ
px = px−1 . (3.5)
x

3.3.2 Các đặc trưng


Hàm phân phối:
X λk e−λ
F (x) = , x ∈ R.
k!
k<x

Kỳ vọng:
∞ ∞
X
−λ
X λk−1
E(X) = k k! = λe = λe−λ .eλ = λ.
λk e−λ (k − 1)!
k=0 k=1

Phương sai:
D(X) = λ.

Công thức xấp xỉ với n đủ lớn và p đủ bé:


λk e−λ
pn (k) ≈ , λ ≈ np (3.6)
k!

3.3.3 Các ví dụ
Ví dụ 3.3. Một bao thóc giống có tỷ lệ hạt lép là 0, 0002. Chọn ngẫu nhiên liên
tiếp có hoàn lại 10 000 hạt. Tính gần đúng xác suất để trong 10 000 hạt có đúng
5 hạt lép.

44
Giải. Xem như phép thử Bernoulli với p=0,0002, k=5. Theo công thức (3.6)
ta có λ = 104 .0, 0002 = 2, và xác suất phải tìm là
25 .e−2
p104 (5) ≈ .
5!


3.4 Phân bố chuẩn và hàm Laplace


3.4.1 Định nghĩa
Bất cứ khi nào chúng ta nhìn vào số liệu thống kê, chúng ta phải xem xét
sự phân bố. Phần lớn các lần phân bố sẽ được tập trung xung quanh giá trị
trung bình. Điều này được gọi là phân bố chuẩn. Phân bố chuẩn là phân bố
liên tục có dạng hình chuông. Trong phân bố chuẩn, các giá trị như trung bình,
trung vị và yếu vị giống nhau.

Hình 3.1: Kiểm định Tails

Định nghĩa 3.4. Biến ngẫu nhiên X có phân phối chuẩn dạng tổng quát N (µ, σ 2 )
nếu hàm mật độ của phân bố chuẩn có dạng hàm mũ:
1 2 2
f (x) = √ e−(x−µ) /(2σ ) .
σ 2π

3.4.2 Tính chất


1) Ta có
x − µ −(x−µ)2 /(2σ2 )
f 0 (x) = − √ e .
σ 3 2π

45
1
Dễ thấy rằng f(x) đạt cực đại tại µ = 3, fmax = √ . Ngoài ra có thể kiểm tra

rằng đồ thị của f(x) có các điểm uốn

1 1
   
U1 µ − σ; √ ; U2 µ + σ; √ .
σ 2πe σ 2πe
2) Trường hợp µ = 0, σ = 1 ta có
1 2
f (x) = √ e−x /2 .

3) Phân bố chuẩn dạng (0, 1) liên quan đến hàm Laplace sau đây
Z x Z x
2 −t2 1 2
Φ(x) = √ e dt, Φo (x) = √ e−t /2 dt, x ∈ R. (3.7)
π 0 2π 0

Ta có các đẳng thức

Φ(−x) = −Φ(x), Φ(0) = 0, Φ(+∞) = 1.

Φ0 (−x) = −Φ0 (x), Φ0 (0) = 0, Φ0 (+∞) = 1.


√ √
Φ0 (x) = 0, 5Φ(x/ 2) ⇔ Φ0 (x 2) = 0, 5Φ(x).

3.4.3 Công thức tính xác suất để biến ngẫu nhiên phân phối
chuẩn nhận gia trị trong khoảng (a, b)
Ta biết rằng, nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x)
thì xác suất để X nhận giá trị trong khoảng (a, b) được tính theo công thức
Z b
P (a < X < b) = f (x)dx.
a

Giả sử X có phân phối chuẩn. Lúc đó


Z b (x − µ)2
1 −
P (a < X < b) = √ e 2σ 2 dx.
σ 2π a

Thay biến mới


x−µ
z= ⇒ x = σz + µ, dx = σdz.
σ
Khi đó ta có
Z b−µ z2
1 σ −
P (a < X < b) = √
2π a − µ e 2 dz
σ

46
Z b−µ z2 Z a − µ z2
1 σ − 1 σ −
√ e 2 dz − √ e 2 dz
2π 0 2π 0
b − µ a − µ
Φ0 − Φ0 ,
σ σ
trong đó
Z x z2
1 −
Φ0 (x) = √ e 2 dz. (3.8)
2π 0

X −µ
Định lý 3.1. Nếu X có phân phối chuẩn dạng N (a, σ 2 ), thì Y = có phân
σ
phối chuẩn dạng N(0, 1). Có công thức xác suất:
b − µ a − µ
P [a ≤ X < b] = Φ0 − Φ0 . (3.9)
σ σ

3.4.4 Các đặc trưng


Có thể chứng minh được rằng
a) Kỳ vọng toán
E(X) = µ (3.10)
b) Phương sai và sai số chuẩn

D(X) = σ 2 , σx = σ. (3.11)

3.4.5 Các ví dụ
Ví dụ 3.4. Giả sử chiều cao X của trẻ em có phân phối chuẩn dạng N(1,3;
0,01). Tính xác suất để trẻ em có chiều cao trong khoảng (1,2; 1, 4).

Giải. Theo công thức (3.9) ta có


   
1, 4 − 1, 3 1, 2 − 1, 3
P [1, 2 ≤ X < 1, 4] = Φ0 √ − Φ0 √
0, 01 0, 01

= Φ0 (1) − Φ0 (−1) = 2Φ0 (1) ≈ 0, 6826.

(tra bảng Φ0 (1) = 0, 3413.) 

47
3.5 Phân phối khi bình phương χ2
3.5.1 Định nghĩa
Định nghĩa 3.5. Biến ngẫu nhiên liên tục x gọi là phân phối theo quy luật
Chi-bình phương χ2 với n bậc tự do nếu hàm mật độ xác suất của nó được xác
định theo công thức

0, x<0
f (x) = 1 −x
n/2−1 ,
 n2 n e 2 x x≥0
2 Γ( 2 )
trong đó Γ(x) là hàm Gamma
Z ∞
Γ(x) = tx−1 e−t dt, Γ(n + 1) = n!.
0

3.5.2 Các đặc trưng


Ta có công thức tính kỳ vọng và phương sai

E(χ2 ) = n, D(χ2 ) = 2n.

3.5.3 Tính chất


1). Khi số bậc tự do n tăng lên , quy luật " Khi bình phương" xấp xỉ với
quy luật chuẩn.
2). Nếu χ21 và χ22 là các biến ngẫu nhiên độc lập cùng phân phối theo quy
luật χ2 với số bậc tự do tương ứng là n1 và n2 thì tổng quả chúng là biến ngẫu
nhiên với phân bố chuẩn
χ2 = χ21 + χ22

với số bạc tự do
n = n1 + n2 .

3). Trong thực tế quy luật Khi bình phương thường được sử dụng trong
trường hợp sau đây: Giả sử có các biến ngẫu nhiên xi , i = 1, 2, ..., n độc lập và
cùng có phân phối theo quy luật chuẩn hóa, tức là có kỳ vọng toán bằng không
và độ lẹch chẩn bằng 1. Nếu xét tổng bình phương của các biến ngẫu nhiên nói
trên ta có n
X
χ2 = χ2i .
i=1

48
Khi đó biến ngẫu nhiên χ2 sẽ phân phối theo quy luật χ2 với n bậc tự do.

3.6 Phân phối student T(n)


3.6.1 Định nghĩa
Định nghĩa 3.6. Biến ngẫu nhiên X có phân phối Student với n bậc tự do, nếu
hàm mật độ có dạng

− n
x2

Γ(n/2) 2
f (x) = p . 1+
π(n − 1)Γ[(n − 1)/2] n−1

trong đó Γ(x) là tích phân


Z ∞
Γ(x) = tx−1 e−t dt, Γ(n) = n!
0

được gọi là hàm Gamma.

3.6.2 Các đặc trưng


1) Kỳ vọng:
E(T ) = 0.

2) Phương sai:

n
D(T ) = .
n−2

3.6.3 Các nhận xét


• Khi số bậc tự do n tăng lên, phân phối Student sẽ hội tụ rất nhanh
về phân phối chuẩn hóa thay thế cho phân phối chuẩn hóa. Do đó nếu n khá
lớn(n>30) có thể dùng phân phối chuẩn hóa thay thế cho phân phối Student.
• Tuy nhiên, cần phải nhấn mạnh rằng với số bậc tự do nhỏ(n<30), việc
thây thế nói trên có thể dẫn đến những sai sót.
• Trong thực tế quy luật Student thường được sử dụng trong các trường
hợp sau đây: Giả sử có U là biến ngẫu nhiên phân phối chuẩn hóa N(0, 1) và
biến ngẫu nhiên V độc lập với U, phân phối theo quy luật χ2 với n bậc tự do.

49
Nếu xét biến ngẫu nhiên
U
T =p
V /n

thì biến ngẫu nhiên T sẽ phân phối theo quy luật Student với n bậc tự do.

3.7 Quy luật phân phối mũ E(λ)


3.7.1 Định nghĩa
Định nghĩa 3.7. Biến ngẫu nhiên X được gọi là phân phối theo quy luật mũ,
nếu hàm mật độ xác suất của nó có dạng

0, x < 0
f (x) =
λe−λx , x ≥ 0.

trong đó λ là một hằng số dương.

3.7.2 Các đặc trưng


1) Hàm phân bố xác suất
Z x Z x
F (x) = f (x)dx = λe−λx = 1 − e−λx
−∞ 0

2) Kỳ vọng toán:
Z ∞ Z ∞
1
E(X) = xf (x)dx = λ xe−λx =
−∞ 0 λ

3) Phương sai
Z ∞ Z ∞
2 1 1
D(X) = 2
x f (x)dx − [E(X)] = 2
λx2 e−λx = 2
− 2 = 2.
−∞ 0 λ λ λ

4) Độ lệch chuẩn
p 1
σ(X) = D(X) = .
λ
5) Xác suất để biến ngẫu nhiên X phân phối theo quy luật mũ nhận giá trị
trong khoảng (a, b):

P [a ≤ X < b] = F (b) − F (a) = [1 − e−bλ ]− = [1 − e−aλ ] = e−aλ − e−bλ (3.12)

50
Người ta thấy rằng thời gian giữa hai lần xuất hiện 1 hiện tượng trong hệ thống
phục vụ công cộng(tắc đường chẳng hạn) có phân phối theo quy luật mũ. Trong
các hệ thống lỹ thuật, thời gian làm việc của máy móc thiết bị giữa hai lần sửa
chữa cũng thường có phân phối theo quy luật mũ.

Ví dụ 3.5. Biến ngẫu nhiên liên tục X theo quy luật mũ có hàm mật độ
 −2x
2e , x ≥ 0,
f (x) =
0, x<0

a) Hãy viết hàm xác suất F(x)


b)Tìm xác suất để trong kết quả của phép thử, X nhận giá trị trong khoảng
[0,3; 1].
c) Tìm kỳ vọng, phương sai và độ lệch chuẩn.

Giải.
a) Ta có
x
1 − e−2x , x ≥ 0
Z 
F (x) = f (x)dx =
−∞ 0, x < 0
b) Ta có

P [0, 3 < X < 1) = e−2.0,3 − e−2.1 ≈ 0, 54881 − 0, 13534 = 0, 41.

c) Kỳ vọng, phương sai và độ lệch chuẩn. Ta có


1 1 1
E(X) = = 0, 5, D(X) = 2 = 0, 25, σ(X) = = 0, 5.
λ λ λ


3.8 Phân phối F: Fisher R. A- Snedecor G.W


Định nghĩa 3.8. Biến ngẫu nhien X có phân phối F với các bận twj do là m
và n, neus hàm mật độ của nó co dạng:

 0, với x ≤ 0

 m+n
f (x) = Γ( ) xm/2−1 (3.13)
2   .mm/2 .nn/2 . , nếu x>0
 Γ m .Γ n
 
(n + mx)(m+n)/2


2 2
trong đó Γ(x) là hàm Gamma
Z ∞
Γ(x) = tx−1 e−t dt, Γ(n + 1) = n!.
0

51
Nếu X, Y là hai biến ngẫu nhiên độc lập và có phân phối khi bình phương
với số bậc tự do là m và n, thì
X/m
F =
Y /n

có phân phối với m và n bậc tự do.

3.9 Bài tập chương 3


Phân bố nhị thức

3.1. Một phân xưởng có 5 máy hoạt động độc lập. Xác suất để trong 1 ngày mỗi
máy bị hỏng đều bằng 0,1. Tìm xác suất để:
a) Trong một ngày có 2 máy hỏng,
b) Trong một ngày có không quá 2 máy hỏng.

Giải. Nếu coi sự hoạt động của mỗi máy là một phép thử thì ta có 5 phép thử
độc lập. Trong mỗi phép thử chỉ có 2 trường hợp: hoặc máy hỏng, hoặc máy
tốt. Xác suất hỏng của mỗi máy đều là 0, 1. Như vậy ta coi như có một lược
đồ Bernoulli. Gọi X là số máy hỏng trong ngày, X phân phối theo quy luật nhị
thức với các tham số n=5 và p=0, 1.
a) Xác suất để trong 1 ngày có 2 máy hỏng chính là xác suất để X=2.
Vậy ta có
P2 = C52 (0, 1)2 .(0, 9)3 = 0, 0729.

b) Xác suất để trong 1 ngày có không quá 2 máy hỏng là xác suất để X
nhận giá trị trong khoảng [0, 2]. Vậy ta có

P [0 ≤ X ≤ 2] = p0 + p1 + p2 = 0, 59049 + 0, 32805 + 0, 0729 = 0, 99144.

Phân bố Poisson

3.2. Một máy dệt có 5000 ống sợi. Xác suất để trong 1 phút một ống sợi bị đưtá
là 0, 0002. Tìm xác suất để trong 1 phút có không quá 2 ống sợi bị đứt.

Giải. Bài toán thỏa mãn lược đồ Bernoulli vì n= 5000 là rất lớn, p=0, 0002
quá nhỏ và vì tích np = 5000.0, 0002 = 1 ≈ npq không đổi. Do đó, nếu gọi X là

52
số ống sợi bị đứt trog 1 phút thì X là biế ngẫu nhiên rời rạc và có thể coi như
phân phối theo quy luật Poisson.
Xác suất để số ống sợi bị đứt trong 1 phút không quá 2 chính là xacs suất
để X để X nhận giá trị trong khoảng [0, 2]. Ta có

P [0 ≤ X ≤ 2] = p0 + p1 + p2
λ0 10
po = e−λ = (2, 71)−1 . = (2, 71)−1
0! 0!
1 1 1
p1 − p0 = (2, 71)−1 , p2 = p1 = (2, 71)−1 .
1 2 2
Do đó
P (0 ≤ X ≤ 2) = (2, 71)1 [1 + 1 + 1/2] = 0, 9225.


3.3. Xác suất để trong khi vận chuyển mỗi chai rượu bị vỡ là 0, 001. Người ta
tiến hành vận chuyển 2000 chai rượu đến cửa hàng.
a) Tìm số chai vỡ trung bình trong khi vận chuyển.
b) Tìm số chai vỡ có khả năng nhiều nhất trong khi vận chuyển.

Giải. Bài toán thỏa mãn quá trình Bernoulli. Vì n=2000 là khá lớn , p=0, 001
khá nhỏ và tích np = 2000.0, 001 = 2 không đổi, do đó, nếu gọi X là số chai bị vỡ
khi vận chuyển thì X là biến ngẫu nhiên phân phối theo quy luật Poisson.
a) Số chai vỡ trung bình chính là kỳ vọng toán của X, ta có

E(X) = λ ≈ 2.

b) Số chai bị vỡ có khả năng xảy ra nhiều nhất là giá trị M ode(xmod ). Suy
ra
λ − 1 ≤ xmod ≤ λ ⇒ xmot = 1; 2.


Phân bố chuẩn

3.4. Một nhà sản xuất cần mua một loại gioăng cao su có độ dày từ 0, 118 cm
đến 0, 122 cm.Có hai của hàng cùng bán loại hàng này với độ dày là các biến
ngẫu nhiên phân phối chuẩn với các đặc trưng cho ở bảng sau:
Cửa hàng Độ dày trung bình Độ lệch chuẩn Giá bán
Cửa hàng A 0,12 0,001 3 usd/hộp/1000c
Cửa hàng B 0,12 0,0015 2,6 usd/hộp/ 1000c

53
Hỏi nhà sản xuất nên mua gioăng của cửa hàng nào?

Giải. Gọi XA và XB tương ứng là độ dày của gioăng do cửa hàng A và B bán.
Theo giả thiết XA và XB đều phân phối chuẩn. Vì vậy tỷ lệ gioawmg dùng được
của hai cửa hàng tương ứng là
 0, 122 − 0, 12   0, 118 − 0, 12 
P (0, 118 < XA < 0, 122) = Φo −Φo = 2Φo (2) = 0, 9544
0, 001 0, 001

 0, 122 − 0, 12   0, 118 − 0, 12 
P (0, 118 < XB < 0, 122) = Φo −Φo = 2Φo (1, 33) = 0, 8164.
0, 0015 0, 0015

Giá bán đối với mỗi chiếc gioăng dùng được của cửa hàng A là:

3
= 0, 00314U SD.
954, 4
Giá bán đối với mỗi chiếc gioăng dùng được của cửa hàng B là:

2, 6
= 0, 00318U SD.
816, 4
Vậy nhà sản xuất nên mua gioăng của cửa hàng A. 

3.5. Các vòng bi do máy tự động sản xuất ra được coi là đạt tiêu chuẩn nếu
đường kính của chúng sai lệch so với đường kính thiết kế không quá 0,7mm. Biết
rằng sai lêch này là biến ngẫu nhiên phân phối chuẩn với µ = 0 và σ = 0, 4mm.
Tìm tỷ lệ vòng bi đạt tiêu chuẩn của máy đó. Cho biết Φ0 (1, 75) = 0, 4599.

Trả lời. gần bằng 92%.




54
Chương 4

Các khái niệm cơ bản của thống kê

4.1 Khái niệm về thống kê


4.1.1 Khái niệm về mẫu ngẫu nhiên
Lĩnh vực thống kê(statistic) liên quan đến việc thu thập, mô tả và giải
thích các dữ liệu. Chúng ta có thể coi dữ liệu là những sự kiện, dữ kiện và số
liệu quan sát được.
Trong thực tế thường phải nghiên cứu tập hợp các phần tử đồng nhất theo
một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phàn tử
đó. Chẳng hạn một doanh nghiệp phải nghiên cứu tập hợp khách hàng của nó
về mức độ hài lòng cũng như nhu cầu như định lượng về hàng hóa của doanh
nghiệp. Việc làm như vậy được gọi là thống kê.
Trong tự tế phương pháp nghiên cứu toàn bộ thường chỉ được thực hiện với
các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên
cứu không toàn bộ, đặc biệt là phương pháp nghiên cứu chọn mẫu. Phương pháp
này chủ trương từ tập hợp nghiên cứu chọn ra một số phần tử (gọi là mẫu),
phân tích các phần tử này, rồi dựa vào đó mà suy ra các kết luận về tập hợp
cần nghiên cứu. Đó là thống kê.
Nếu mẫu được chọn ra một cách ngẫu nhiên và xử lý bằng phương pháp
xác suất thì vừa thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà
vẫn đẩm bảo được độ chính xác cần thiết. Việc thu thập, sắp xếp và trình bày
các số liệu của tổng thể hoặc một mẫu được gọi là thống kê mô tả. Còn việc sử
dụng thông tin của mẫu để tiến hành các suy đoán, kết luận về tổng thể được
gọi là thống kê suy diễn.

Định nghĩa 4.1. Biến ngẫu nhiên kích thước n là tập hợp của n biến ngẫu

55
nhiên độc lập X1 , X2 , ..., Xn được thành lập từ biến ngẫu nhiên X trong tổng thể
nghiên cứu và cùng quy luật phân phối xác suất với X

4.1.2 Mô tả số liệu mẫu bằng bảng phân bố thực nghiệm


Định nghĩa 4.2. Giả sử trong một mẫu số liệu kích thước n, các giá trị của
biến lượng ngẫu nhiên X có m giá trị khác nhau X1 < X2 < ... < Xm . Giả sử giá
trị Xi có số lần lặp lại là ri . Khi đó ta gọi ri là tần số của xi . Tỷ số
ri
fi = , i = 1, 2, ..., m
n
được gọi là tần suất của giá trị Xi . Bảng sau đây được gọi là bảng phân bố thực
nghiệm của biến lượng X.
X X1 X2 ... Xn PTổng
Tần số r1 r2 ... rn P ri = n
Tần suất f1 f2 ... fn fi = 1

4.2 Các đặc trưng mẫu


4.2.1 Trung bình mẫu
• Giả sử X1 , X2 , ..., Xn là các giá trị của biến ngẫu nhiên X. Khi đó đại
lượng
X1 + X2 + ... + Xn
X= (4.1)
n
được gọi là trung bìnhsố học của các giá trị mẫu.
• Nếu mẫu ngẫu nhiên được cho ở dang:
X X1 X2 ... Xk PTổng
ni n1 n2 ... nk ni = n
thì giá trị trung bình tính theo công thức
n1 X1 + n2 X2 + ... + nk Xk
X= (4.2)
n1 + n2 + ... + nk
được gọi là trung bình mẫu tần suất.
• Nếu mẫu ngẫu nhiên được chở dạng khoảng

TT Khoảng h Tần số ni
1 X1 − X2 n1
2 X 2 − X3 n2
......... ....... .......
k Xk − Xk+1 nk

56
thì trung bình mẫu được tính theo công thức
n1 X1∗ + n2 X2∗ + ... + nk Xk∗ Xi + Xi+1
X= , Xi∗ = , (4.3)
n1 + n2 + ... + nk n

trong đó Xi và Xi+1 tương ứng là nút trái và nút phải của khoảng thứ i.

4.2.2 Phương sai phổ dụng và phương sai mẫu


• Phương sai(variance): là phép đo mức chênh lệch giữa các số liệu trong
một tập dữ liệu với giá trị trung bình của nó. Công thức tính phương sai
Pn n
(Xi − X)2 1X 2
σn2 = σ 2 (X) = σn2 (X) = i=1
= Xi2 − X , (4.4)
n n
i=1
Pn n
i=1 (Xi − X)2 n
h1 X
2
i
s2n = s2 (X) = s2n (X) = = Xi2 − X (4.5)
n−1 n−1 n
i=1

trong đó: n là số quan sát, X là giá trị trung bình. Phương sai còn được ký hiệu
là D(X), hay V(X).
• Ta gọi σn2 (X) được cho bởi công thức (4.4) là phương sai phổ dụng(population
variance), còn gọi s2n (X) được cho bởi công thức (4.5) là phương sai mẫu(sample
variance). Một số tài liệu tiếng Việt còn gọi phương sai mẫu là phương sai hiệu
0
chỉnh và ký hiệu nó là Sn2 (X) hay Sn∗2 (X). Cũng có tài liệu ký hiệu phương sai
phổ dụng là Sn2 (X). Các ký hiệu cho bởi các công thức (4.4) và (4.5) thường
được dùng trong các tài liệu nước ngoài.
• Xuất phát từ định nghĩa của phương sai, ta thấy phương sai chính là
trung bình số học của bình phương các sai lệch giữa các giá trị có thể có của
biến ngẫu nhiên so với giá trị trung bình của các giá trị đó. Do đó nó phản ánh
mức độ phân tán các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình,
hay kỳ vọng của nó.
• Cùng với kỳ vọng toán hay trung bình, phương sai có nhiều ứng dụng
trong thực tiễn. Nếu như trong kỹ thuật phương sai đặc trưng cho mức độ phân
tán của các chi tiết gia công hay sai số của thiết bị, thì trong quản lý và kinh
doanh nó đặc trưng cho mức độ rủi ro của các quyết định.
Trong đầu tư tài chính, phương trình phương sai là công thức để so sánh
hiệu quả của các thành phần trong danh mục đầu tư với nhau và so sánh với
giá trị hiệu quả trung bình.

57
4.2.3 Độ lệch chuẩn và độ lệch chuẩn mẫu
• Độ lệch chuẩn (standard deviation): là một đại lượng thống kê dùng để
đo mức độ phân tán của một tập dữ liệu. Công thức tính
rP
n
p (Xi − X)2 i=1
σn = σn2 = . (4.6)
n

Hai tập dữ liệu có cùng trung bình cộng, tập nào có độ lệch chuẩn lớn hơn, sẽ
có độ phân tán các số liệu lớn hơn.
• Tương tự,độ lệch chuẩn mẫu(sample standard deviation) được tính theo
công thức r Pn
2
i=1 (Xi − X)
p
sn = s2n = (4.7)
n−1
Độ lệch chuẩn đo sự biến động của giá trị mang tính thống kê. Nó cho thấy sự
chênh lệch về giá trị của từng thời điểm đánh giá so với giá trị trung bình.
• Sai số chuẩn (standard error): Sai số chuẩn là sai số của số bình quân
cho thấy các số bình quân có thể dự kiến sẽ biến thiên từ mẫu này sang mẫu
khác như thế nào, nếu các mẫu ngẫu nhiên được lặp lại. Sai số chuẩn càng nhỏ
thì thống kê sẽ gần hơn với giá trị thực tế, nên sai số chuẩn còn được coi là một
phần của thống kê mô tả. Công thức tính:
sn
SE = √ . (4.8)
n

4.2.4 Trung vị và yếu vị mẫu


• Trung vị (median). Trung vị là số nằm giữa trong một tập dữ liệu các số
được sắp xếp(từ thấp đến cao, hay ngược lại). Nếu tập dữ liệu có số các điểm
dữ liệu là lẻ thì trung vị là số nằm chính giữa. Nếu tập dữ liệu có số các điểm
là chẵn, để tìm giá trị trung vị, ta cần tìm cặp dữ liệu ở giữa, rồi lấy tổng của
chúng chia 2. Trung vị thường đươc ký hiệu là m, hay µ.
Ví dụ:
a = {1, 2, 3, 4, 5, 6, 7, 8, 9} : m(a) = 5.
5+6
b = {1, 2, 3, 4, 5, 6,7, 8, 9, 10} : m(b) = = 5, 5.
2
• Yếu vị(mode). Là phần tử có số lần xuất hiện nhiều nhất trong danh
sách.

58
Ví dụ 4.1. Cho dãy số a = {13, 18, 13, 14, 13, 16, 14, 21, 13}. Ta sắp xếp lại theo
thứ tự tăng dần chẳng hạn a = {13, 13, 13, 14, 14, 16, 18, 21}. Sử dụng excel, ta có

median(a) = 14, mode(a) = 13.

4.2.5 Hiệp phương sai


• Hiệp phương sai(Covariance): Hiệp phương sai là độ đo sự biến thiên
cùng nhau của hai biến ngẫu nhiên(phân biệt với phương sai- đo mức độ biến
thiên của một biến). Công thức của hiệp phương sai
n n
1X 1 X
ρxy = (xi − x)(yi − y), hoặc ρxy = (xi − x)(yi − y) (4.9)
n n−1
i=1 i=1

trong đó xi , yi là một giá trị của các biến ngẫu nhiên x, y trong tập dữ liệu, x, y
là trung bình của các giá trị của các biến ngẫu nhiên x, y.
Nếu hai biến có xu hướng thay đổi cùng nhau, nghĩa là khi một biến có giá
cao hơn hoặc thấp hơn giá trị kỳ vọng thì biến kia cũng có xu hướng tương tự
thì hiệp phương sai giữa hai biến này có giá trị dương. Nếu có xu hướng ngược
lại(một biến cao hơn kỳ vọng, biến kia thấp hơn kỳ vọng) thì hiệp phương sai
của chúng sẽ âm.
Trong lĩnh vực kinh tees tài chính nói chung hiệp phương sai được dùng để
tính toán khả năng nắm giữ cổ phiếu được đa dạng hóa đơn.

4.2.6 Tương quan (correlation)


• Tương quan là phép đo thống kê về mối quan hệ giữa hai biến. Các mối
tương quan có thể nằm trong khoảng từ -1 đến 1. Mối tương quan -1 cho biết
sự tương quan hoàn hảo, khi một biến tăng lên thì biến kia giảm xuống. Mối
tương quan 1 cho biết hai biến cùng tăng lên.
• Công thức hệ số tương quan:
Pn
ρxy (xi − x)(yi − y)
rxy = = pPn i=1 Pn
σ(X).σ(Y ) − 2. 2
i=1 (x i x) i=1 (yi − y)

• Để tính toán cho thuận lợi rxy có thể viết ở dạng


P P P
n( xy) − ( x)( y)
rxy = p P P p P P
n x2 − ( x) . 2 n 2
y −( y)2

59
Công thức hệ số tương quan:
1 Pn
(xi − x)(yi − y) ρxy
rxy =r n i=1 r = (4.10)
1 Pn 1 Pn ρx .ρy
(x − x)2 (y − y) 2
i i
n i=1 n i=1

trong đó ρxy là hiệp phương sai giữa các biến ngẫu nhiên x, y, còn ρx , ρy tương
ứng là phương sai của các biến này.
Trong tính toán thường dùng công thức đơn giản hơn

Pn
i=1 (xi − x)(yi − y)
rxy = pPn pPn
2 2
i − x)
i=1 (xP i=1 (yi − y)
P P
x y −y xi − x yi + nx.y Txy
= P 2 Pi i 2 1/2
P 2 P 2 1/2
= . (4.11)
( xi − 2x xi + x n) ( yi − 2y yi + y n) Mx .My

Chúng ta cũng có thể công thức tính hệ số tương quan ở dạng


P P P 0 Txy
n xi yi − ( xi )( yi )
rxy =  = (4.12)
 1/2   1/2 Mx0 .My0
n x2i − ( xi )2 . n yi2 − ( yi )2
P P P P

Ví dụ 4.2. Cho dãy các số liệu


x = {xi } = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
y = {yi } = {10, 20, 30, 40, 50, 60, 70, 80, 90, 100}
n(n + 1)
Áp dụng công thức ni=1 i =
P
, ta có
2
X X
x = 5, 5, y = 55, xi = 55, yi = 550.
Pn n(n + 1)(2n + 1)
Áp dụng công thức i2 =1 i = , ta có
6
X 10
X X 10
X
x2i = 2
i = 385, yi2 = (10.i)2 = 38500,
i=1 i=1

X 10
X 10
X
xi y i = = 10 i2 = 3850.
i=1 i=1

• Theo (4.11) ta có

Txy = 3850 − 55.55 − 5, 5.550 + 10.5, 5.55 = 3850 − 3025 = 825

60
qX X p
Mx = x2i − 2x xi + nx2 = 385 − 2.5, 5.55 + 10.(5, 5)2
p p
= 385 − 605 + 302, 5 = 82, 5

qX X p
My = yi2 − 2y yi + ny 2 = 38500 − 2.55.550 + 10.(55)2
√ √ √
= 38500 − 60500 + 30250 = 68750 − 60500 = 8250
p
Mx My = 82, 5 × 8250 = 825

Kết quả tính toán cho ta


825
rxy = = 1.
825
• Theo (4.12) ta có

0
Txy = 10.3850 − 55.550 = 38500 − 30250 = 8250 = 10Txy

Mx0 = (10.385 − 552 )1/2 = 8251/2 , My0 = 10My0 = 10.8251/2 , Mx0 My0 = 8250.

Do đó
t0xy 8250
rxy = 0 0 = = 1.
Mx My 8250

4.2.7 Tại sao cần phân tích tương quan


Hệ số tương quan là giá trị thống kê được dùng trong nhiều lĩnh vực, đặc
biệt là đầu tư tài chính. Ví dụ, hệ số tương quan giúp các nhà phân tích xác
định mối tương quan giữa giá dầu thô với giá cổ phiếu của công ty sản xuất
dầu. Có thể thấy phần lớn các công ty dầu mỏ sẽ kiếm lợi nhuận dựa vào giá
dầu tăng, làm giá cổ phiếu của công ty tăng lên. Đây là mối quan hệ tương quan
dương.
Sau khi tiến hành kiểm định, bước tiếp theochinhs là tạo biến đại diện cho
mỗi nhóm nhaan tố và tiến hành phân tích tương quan(correlation), hồi quy
(regression). Trước khi tiến hành kiểm tra hồi quy mô hình thì cần phân tích
tương quan giữa nhân tố độc lập với các nhân tố phụ thuộc. Từ đó chúng ta
chọn những nhân tố độc lập thực sự có sự tương quan với nhân tố phụ thuộc và
đưa những nhân tố đó vào hồi quy.

61
Ví dụ 4.3. Cho mẫu ngẫu nhiên với cặp biến ngẫu nhiên (x, y) là

x 2 3 4 5 6 7 8 9
y 3 7 8 9 13 15 16 17
Tìm hệ số tương quan rxy .

Giải. Ta có
P
xi = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 = 44, x = 5, 5
P
yi = 3 + 7 + 8 + 9 + 13 + 15 + 16 + 17 = 88, y = 11
P 2
x = 4 + 9 + 16 + 25 + 36 + 47 + 64 + 81 = 184
P 2i
y = 1142
P i
xi yi = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 = 568 Thực hiện tính toán ta được

rxy = 0, 98.

4.2.8 Hàm thống kê


Việc tổng hợp mẫu w = (X1 , X2 , ..., Xn ) được thực hiện dưới dạng một hàm
nào đó của các giá trị X1 , X2 , ..., Xn của mẫu, nó được gọi là hàm thống kê, hay
gọn hơn là thống kê và thường được ký hiệu là G. Như vậy

G = f (X1 , X2 , ..., Xn ).

4.3 Ví dụ-bài tập


Ví dụ 4.4. Cho mẫu ngẫu nhiên

X 1 2 3 4
ni 20 15 10 5

Hãy tìm
a) Trung bình mẫu
b) Tìm các phương sai mẫu σn2 (X), s2n (X).

Giải.
a) Ta có trung bình mẫu:
1.20 + 2.15 + 3.10 + 4.5 100
X= = = 2.
20 + 15 + 10 + 5 50

62
b) Phương sai phổ dụng: Ta có
n
1 X 2 20.12 + 15.22 + 10.32 + 5.42 250
Xi = = =5
n 50 50
i=1
n
2 1X 2
σ (X) = Xi − (X)2 = 5 − 22 = 1
n
i=1

Phương sai mẫu:


n 50 50
s2 (X) = σ 2 (X) = .1 = .
n−1 49 49


Ví dụ 4.5. Số liệu thống kê được cho ở bảng

TT Khoảng h Tần số ni
1 1−5 40
2 5−9 80
3 9 − 13 200
4 13 − 17 120
5 17 − 21 40

Tính X và σn2 (X).

Giải. Ta có
1+5 5+9 9 + 13
X1∗ = = 3, X2∗ = = 7, X3∗ = = 11
2 2 2
13 + 17 17 + 21
X4∗ = = 15, X3∗ = = 19.
2 2
40.3 + 80.7 + 22.11 + 120.15 + 40.19 5440 34
X= = = ≈ 11, 33.
40 + 80 + 200 + 120 + 40 489 3
n
1 X 2 40.32 + 89.72 + 200.112 + 120.15r + 40.192 70020 1167
Xi = = = ≈ 145, 8.
n 480 480 8
i=1
Suy ra
1167 34
 2 255
σn2 (X) = − = .
8 3 72


Ví dụ 4.6. Gặt ngẫu nhiên 365 điểm trồng lúa của một huyện người ta thu được
bảng số liệu sau:

Năng suất(tạ/ha) 25 30 33 34 35 36 37 39 40
Số điểm găt tương ứng 6 13 38 74 106 85 30 10 3

63
Tìm phương sai thông dụng, phương sai mẫu và lệch chuẩn mẫu

Giải. Với n = ki=1 ni , ta có


P

k
1X 12700
X= ni Xi = = 34, 795ta/ha
n 365
i=1

Từ đó suy ra phương sai thông dụng:


k
2 1X
σ (X) == ni Xi2 − (X)2
n
i=1

443466
= − (34, 795)2 = 1214, 975 − 1210, 692 = 4, 283.
365
Phương sai mẫu:
n 365
s2 (X) = σ 2 (X) = .4, 283 = 4, 295.
n−1 364

Độ lệch chuẩn mẫu:


p
s(X) = 4, 295 ≈ 2, 072.

Bảng tính toán các đại lượng

Xi ni Xi ni ni Xi2
25 6 150 3750
30 13 390 11700
33 38 1254 41382
34 74 2516 85544
35 106 3710 129850
36 85 3060 110160
38 30 1110 41070
39 10 390 15210
40 3 P 1200 480
ni Xi2 = 443466
P P
ni = n = 365 ni Xi = 12700

64
Chương 5

Ước lượng tham số

5.1 Ước lượng khoảng của các đặc trưng và độ tin


cậy
Giả sử X1 , X2 , ..., Xn là mẫu ngẫu nhiên độc lập từ phân phối f (X, θ), θ ∈ U.
Chẳng hạn đó là phân bố chuẩn N (µ, σ 2 ), khi đó hoặc là θ = µ, hoặc là θ = σ 2 . Có
hai loại ước lượng tham số, đó là ước lượng điểm và ước lượng khoảng. Thông
dụng và quan trọng hơn cả là ước lượng khoảng, nên chương này chỉ trình bày
về ước lượng khoảng. Ta có định nghĩa

Định nghĩa 5.1. Khoảng (θ1 (X); θ2 (X))(θ1 (X) < θ2 (X)) được gọi là khoảng ước
lượng của tham số θ với độ tin cậy 1 − α, nếu

P [θ1 (X) < θ < θ2 (X)] = 1 − α. (5.1)

Dựa vào đinh nghĩa này ta có thể tìm được các khoảng ước lượng của các
tham số trong một số phân phối thông dụng.

5.2 Ước lượng khoảng đối với phân phối chuẩn N (µ, σ 2)
5.2.1 Hàm Laplace
• Với phân bố chuẩn N (µ, σ 2 ), hàm Laplace được xác định theo công thức
Z x
1 2
/(2σ 2 )
F (x) = √ e−t dt, 0 ≤ F (x) ≤ 1. (5.2)
σ 2π −∞

• Với phân bố chuẩn N (0, 1) hàm Laplace thường được dùng là


Z x
1 2
Φ(x) = √ e−t /2
dt, 0 ≤ Φ(x) ≤ 1. (5.3)
2π −∞

65
Z 0 Z x
1 −t2 /2 1 2 1
Φ(x) = √ e dt + √ e−t /2
dt ≡ + Φ0 (x). (5.4)
2π −∞ 2π 0 2
Các tính chất của Φ(x) và Φ0 (x) :

1
Φ(−x) = 1 − Φ(x), Φ0 (−x) = −Φ0 (x), Φ(x) = Φ0 (x) + . (5.5)
2
Định lý 5.1. Giả sử X là biến ngẫu nhiên với phân bố chuẩn N (µ, σ). Khi đó
có công thức
b − µ a − µ b − µ a − µ
P (a < X < b) = Φ −Φ = Φ0 − Φ0 . (5.6)
σ σ σ σ

5.2.2 Khoảng ước lượng của kỳ vọng µ trong phân phối chuẩn
khi biết σ
• Giả sử X1 , X2 , ..., Xn là mẫu ngẫu nhiên từ phân phối chuẩn dạng N (µ, σ 2 ).
Tìm khoảng ước lượng của µ khi đã biết σ. Ký hiệu xα là nghiệm của phương
trình
1−α
Φ0 (xα ) = (5.7)
2
trong đó Φ0 (x) là hàm Laplace. Khi đó ta có đánh giá khoảng sau đây
σ σ
X − xα √ < µ < X + xα √ (5.8)
n n
Độ tin cậy cuả đánh giá trên là 1 − α, nghĩa là
σ σ
h i
P X − xα √ < µ < X + xα √ = 1 − α.
n n
(công nhận, không chứng minh).
Ví dụ 5.1. Tìm khoảng ước lượng của kỳ vọng a với độ tin cậy 0, 95. Biết rằng
mẫu (X1 , X2 , ..., Xn ) độc lập từ phân phối chuẩn N (µ, 25).
1−α
Giải. Ở đây 1 − α = 0, 95 suy ra α = 0, 05, = 0, 475 = Φ0 (xα ). Tra bảng
2
giá trị của hàm phân phối N(0; 1) tìm được xα = 1, 96. Vậy khoảng ước lượng
của µ là
5 5
14 − 1, 96. √ < µ < 14 + 1, 96. √
25 25
hay
12, 04 < µ < 15, 96.


66
5.2.3 Khoảng ước lượng của kỳ vọng µ trong phân phối chuẩn
khi chưa biết σ
• Ta cũng xét xác suất

P [|X − µ| < ε] = 1 − α.

Khoảng xác định được thiết lập là


tα sn (X) tα sn (X)
X− √ <µ<X+ √ (5.9)
n n

trong đó tα là nghiệm của phương trình


1−α
Φ0 (tα ) = . (5.10)
2
• Khi n ≥ 30, tα được tìm gần đúng bằng tra bảng đối với phân phối chuẩn
N(0; 1).
• Khi n<30, thì tra ở bảng phân phối Student với n-1 bậc tự do.

Ví dụ 5.2. Tiến hành kiểm tra ngẫu nhiên 10 học sinh bằng 1 bài vật lý. Kết
quả điểm của 10 học sinh được cho bởi bảng sau

X:5 4 3 5 6 7 6 2 8 5

Giả sử các quan sát này có phân phối dạng chuẩn tổng quát N (µ, σ 2 ). Tìm khoảng
ước lượng của µ với độ tin cây 0,95.
Giải. Ta có
5+4+3+5+6+7+6+2+8+5
X= = 5, 1
10
1
h
s2n (X) = (5 − 5, 1)2 + (4 − 5, 1)2 + (3 − 5, 1)2 + (5 − 5, 1)2 + (6 − 5, 1)2
9
i
+(7 − 5, 1)2 + (6 − 5, 1)2 + (2 − 5, 1)2 + (8 − 5, 1)2 + (5 − 5, 1)2 ) ≈ 3, 21.

Ở dây σ chưa biết, n=10<30, vì vậy tìm tα bằng tra bảng Student với n-1=9
bậc tự do và mức α = 0, 05 ta được tα = 2, 26.
Ta có √ √
3, 21 3, 21
5, 1 − 2, 26. √ < µ < 5, 1 + 2, 26. √
10 10
hay
3, 71 < µ < 6, 39.


67
5.2.4 Ước lượng khoảng của phương sai σ 2 trong mẫu phân
phối chuẩn
• Người ta tìm được khoảng ước lượng của phương sai σ 2 với độ tin cậy
1 − α là:

Pn Pn
(n − 1)s2n (X) 2 (n − 1)s2n (X) i=1 (Xi − X)2 2 i=1 (Xi − X)2
<σ < ⇔ <σ <
t2 t1 t2 t1
(5.11)
trong đó t1 , t2 tra trong bảng phân phối χ2 với n-1 bậc tự do, sao cho
α α
P [χ2 > t1 ] = 1 − , P [χ2 > t2 ] = .
2 2

Ví dụ 5.3. Trong 5.2, tìm khoảng ước lượng của tham số σ 2 với độ tin cậy 0,90.

Giải. Ta có
1 − α = 0, 90 ⇒ α = 0, 10.

Tra bảng phân phối χ2 tìm được t1 (95%; 9) = 3, 325 và t2 (5%; 9) = 16, 919. Từ đây
ta có
9.3, 21 9.3, 21
< σ2 < ⇔ 1, 5 < σ 2 < 8, 6.
16, 919 3, 325


5.2.5 Ước lượng khoảng của hiệu hai trung bình của hai mẫu
độc lập từ phân phối chuẩn
• Giả sử (X1 , X2 , ..., Xn ) là mẫu ngẫu nhiên độc lập từ phân phối chuẩn
N (µ1 , σ12 ) và (Y1 , Y2 , ..., Ym ) là mẫu ngẫu nhiên độc lập từ phân phối chuẩn
N (µ2 , σ22 ).
• Nếu σ1 và σ2 đã biết thì hiệu hai trung bình µ1 − µ2 với độ tin cậy 1 − α
được xác định theo công thức
r
σ12 σ22
µ 1 − µ 2 = X − Y ± xα + (5.12)
n m

trong đó xα tra ở bảng phân phối chuẩn N(0, 1) sao cho


1−α
Φ0 (α) = .
2

68
• Trường hợp σ1 , σ2 chưa biết để ước lượng hiệu hai kỳ vọng µ1 −µ2 ta phải
giả thiết rằng D(X) = D(Y ). Khi đó khoảng ước lượng hai trung bình µ1 − µ2
với độ tin cây 1 − α là:
r
1 1
µ1 − µ2 = X − Y ± tα .S. + (5.13)
n m

trong đó
 Pn 2
Pn 2
Pm 2
Pm 2

2 1 n i=1 Xi −( i=1 Xi ) n i=1 Yi −( i=1 Yi )
S = + (5.14)
n+m−2 n m

• Nếu m + n ≤ 60 thì tα tra ở bảng phân phối Student với n+m-2 bậc tự
do và mức α.
• Nếu n + m > 60 thì tα tra ở bảng phân phối chuẩn, sao cho
1−α
Φ0 (tα ) = .
2

Ví dụ 5.4. Cho hai mẫu ngẫu nhiên độc lập từ phân phối chuẩn

X: 15, 7 10, 3 12, 6 14, 5 12, 6 13, 8 11, 9

Y : 12, 3 13, 7 10, 4 11, 4 14, 9 12, 6.

Giả sử
E[X] = µ1 , E[Y ] = µ2 , D(X) = D(Y ), α = 0, 90.

Tìm ước lượng của hiệu µ1 − µ2 với độ tin cậy α.

Giải. Theo giả thiết ta có n = 7, m = 6, α = 0, 90. Tra bảng phân phối


Student ta tìm được tα (10%, 11) = 1, 796. Ta tính được

X = 13, 06, Y = 12, 55, S 2 = 2, 89.

Suy ra
p p p
S= 2, 89 = 1, 7, S 1/7 + 1/6 = 0, 9458, tα .S. 1/n + 1/m = 1, 699.

Ta có khoảng ước lượng cần tìm là

µ1 − µ2 = |X − Y | = 0, 51 ± 1, 600.

69
5.3 Ước lượng khoảng của xác suất
5.3.1 Ước lượng khoảng của xác suất trong phân bố nhị thức
• Xét xác suất
k − np n
h i
P [|k/n − p| < ε] = P p < ε. p =1−α

np(1 − p) np(1 − p)

Đặt
n
xα = ε. p .
np(1 − p)
Biết rằng(Định lý giới hạn trung tâm của Laplace)
h k − np i
P p < xα ≈ 2Φ(xα ) − 1.

np(1 − p)

Suy ra
α
Φ(xα ) = 1 −
2
α
Vậy xα tra ở bảng phân phối chuẩn N(0, 1)sao cho Φ(xα ) = 1 − . Thay p trong
p 2
np(1 − p) bằng tần suất p̂ = k/n và giải

k − np

p < xα
np̂(1 − p̂)

ta được r r
p̂(1 − p̂ p̂(1 − p̂
p̂ − xα < p < p̂ + xα (5.15)
n n
Ví dụ 5.5. Gieo 400 hạt giống đậu tương thấy có 5 hạt không nảy mầm. Hãy
tìm khoảng ước lượng của xác suất không nảy mầm p của mỗi hạt với độ tin cậy
0, 999.

Giải. Theo trên ta có


1−α
1 − α = 0, 999 ⇒ α = 0, 001; Φ0 (xα ) = = 0, 4995.
2
Tra bảng phân phối chuẩn N(0, 1) ta tìm được

xα = 3, 3.

Ta có
5
p̂ = .
400

70
Thay tất cả vào công thức (5.15) ta được

−0, 058 < p < 0, 0308.

Vì xác suất không âm , nên ta có khoảng phải tìm là

0 ≤ p < 0, 0308.

5.3.2 Ước lượng khoảng của hiệu hai xác suất trong hai dãy
Bernoulli
Xét hai dãy phép thử Bernoulli. Dãy thứ nhất có n phép thử, xác suất để
biến cố A xuất hiện trong mỗi phép thử của dãy I là : P (A) = p1 ; X là số lần
xuất hiện cửa biến cố A trong dãy I.
Tương tự, dãy thứ II có m phép thử, Y là số lần xuất hiện của biến cố A
trong dãy thứ II; xác suất để biến cố A suất hiện trong mỗi phép thử ở dãy thứ
II là p2 = P (A).
Người ta tìm được khoảng ước lượng của hiệu hai xác suất p1 − p2 với độ
tin cậy 1 − α là
r r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
p̂1 −p̂2 −xα . + < p1 −p2 < p̂1 −p̂2 +xα . +
n m n m
(5.16)
với xα được xác định bởi đẳng thức
1−α
Φ0 (xα ) = .
2

Ví dụ 5.6. Để đánh giá chất lượng sản phẩm do hai nhà máy sản xuất ra, người
ta kiểm tra ngẫu nhiên 200 sản phẩm ở nhà máy I thấy có 20 phế phẩm, và 300
sản phẩm của nhà máy II thấy có 15 phế phẩm.
Tìm khoảng ước lượng của hiệu hai xác suất để tìm sản phẩm là phế phẩm
của hai nhà máy với độ tin cậy 0,95.

Giải. Ở đây ta có α = 0, 05, tra bảng phân phối chuẩn N(0, 1), tìm được
xα = 1, 96. Ngoài ra ta có
X 20 15
p̂1 = = = 0, 1 p̂2 = = 0, 05.
n 200 300

71
Thay vào công thức (5.16) ta được

0, 1 − 0, 05 − 0, 0483 < p1 − p2 < 0, 1 − 0, 05 + 0, 0483

hay
0, 0017 < p1 − p2 < 0, 0983.

5.4 Bài tập và ví dụ chương 5


5.1. Trọng lượng của một loại phẩm là biến ngẫu nhiên phân phối theo quy luật
chuẩn với độ lệch chuẩn là 1 gam. Cân thử 25 sản phẩm loại này ta thu được
kết quả như sau

Trọng lượng (gam) 18 19 20 21


Số lượng 3 5 15 2

Với độ tin cậy 0,95 hãy tìm khoảng tin cậy đối xứng trọng lượng trung bình nói
trê

Giải. Gọi X là " trọng lượng sản phẩm”. Theo giả thiết, X có phân phối chuẩn
với phương sai σ 2 = 1. Như vậy trọng lượng trung bình của sản phẩm chính là
tham số µ cần ước lượng. Khoảng ước lượng là
σ σ
µ ∈ (X − √ xα , X + √ xα ).
n n

Ta có
25
1 X 3.18 + 5.19 + 15.20 + 2.21
σ = 1, n = 25, X = Xi = = 19, 64.
25 25
i=1

Độ tin cậy 1 − α = 0, 95, ta có α = 0, 05. Tra bảng tìm được xα = 1, 96. Ta có kết
quả
19, 248 < µ < 20, 032.

72

You might also like