You are on page 1of 45

Đặng Thục Hiền Bài giảng XS và TK

BÀI GIẢNG XÁC SUẤT VÀ THỐNG KÊ


(Bậc Đại học - Số tín chỉ: 3 - Số tiết: 45)
Chương 1. Xác suất
Chương 2. Biến ngẫu nhiên
Chương 3. Các quy luật phân phối xác suất
Chương 4. Lý thuyết mẫu - Ước lượng tham số
Chương 5. Kiểm định giả thuyết

Biên soạn: ThS. ĐẶNG THỤC HIỀN

TÀI LIỆU THAM KHẢO

1. Hoàng Ngọc Nhậm – Lý thuyết Xác suất và Thống kê Toán – NXB Kinh tế Tp HCM.
2. Hoàng Ngọc Nhậm – Bài tập Xác suất Thống kê – NXB Kinh tế Tp HCM.
3. Đinh Ngọc Thanh - Giáo trình Xác suất Thống kê - ĐH Tôn Đức Thắng Tp HCM.
4. Lê Sĩ Đồng - Xác suất - Thống kê và ứng dụng - NXB Giáo dục.
5. Đậu Thế Cấp - Xác suất Thống kê - Lý thuyết và các bài tập - NXB Giáo dục.
6. Nguyễn Cao Văn - Giáo trình Lý thuyết Xác suất & Thống kê - NXB Kinh tế quốc dân.
7. Đoàn Vương Nguyên – Bài giảng Xác suất và Thống kê – ĐH Công nghiệp Tp HCM.
………………………………………………

PHẦN I. LÝ THUYẾT XÁC SUẤT


Chương 1. XÁC SUẤT
Bài 1. GIẢI TÍCH TỔ HỢP
Khi chọn ngẫu nhiên k phần tử từ một tập hợp n phần tử (k, n hữu hạn), để tính số trường hợp có thể
xảy ra và số trường hợp thuận lợi, ta có thể sử dụng các khái niệm của giải tích tổ hợp như: tổ hợp, chỉnh
hợp, chỉnh hợp lặp, hoán vị.
1.1. Quy tắc nhân
Nếu đối tượng A có thể chọn bằng n1 cách và sau mỗi lần chọn A lại có n2 cách chọn đối tượng B thì
sẽ có tất cả n1n2 cách chọn cả A và B.
Quy tắc này có thể mở rộng cho k ( k ≥ 2 ) đối tượng.
Ví dụ: Có 6 quả cầu xanh đánh số từ 1-6, 5 quả cầu đỏ đánh số từ 1-5, 4 quả cầu vàng đánh số từ 1-4. Hỏi
có mấy cách lấy ra 3 quả cầu vừa khác màu vừa khác số?
Có 4 cách chọn quả cầu màu vàng. Có 4 cách chọn quả cầu màu đỏ. Có 4 cách chọn quả cầu màu
xanh. Vậy có 43 = 64 cách chọn thỏa yêu cầu bài toán.
1.2. Chỉnh hợp
• Định nghĩa: Chỉnh hợp chập k của n phần tử ( k ≤ n ), ký hiệu Ank là một nhóm có thứ tự gồm k phần tử
khác nhau chọn từ n phần tử đã cho.

Trang 1
Đặng Thục Hiền Bài giảng XS và TK

n!
• Công thức tính: Ank = , trong đó n ! = 1.2.3...n
(n − k )!
Ví dụ: Một lớp phải học 8 môn, mỗi ngày học 2 môn. Hỏi có bao nhiêu cách xếp thời khóa biểu trong 1
ngày?
8!
Số cách xếp TKB là chỉnh hợp chập 2 của 8 phần tử, A82 = = 56 cách
(8 − 2)!
1.3. Chỉnh hợp lặp
k
• Định nghĩa: Chỉnh hợp lặp chập k của n phần tử, ký hiệu Bnk hoặc An là một nhóm có thứ tự gồm k
phần tử chọn từ n phần tử đã cho. Trong đó mỗi phần tử có thể có mặt 1, 2,…, k lần trong nhóm đó.
Vì mỗi phần tử có thể xuất hiện nhiều lần trong một chỉnh hợp lặp nên k có thể lớn hơn n.
• Công thức tính: Bnk = n k
Ví dụ: Xếp 10 quyển sách vào 3 ngăn. Hỏi có bao nhiêu cách xếp?
Số cách xếp là chỉnh hợp lặp chập 10 của 3 phần tử, B310 = 310 = 59049 cách.

1.4. Hoán vị
• Định nghĩa: Hoán vị của m phần tử, ký hiệu Pm là một nhóm có thứ tự gồm đủ m phần tử đã cho.
• Công thức tính: Pm = m !
Ví dụ: Từ 9 chữ số 1-9 có thể lập được bao nhiêu số có 9 chữ số mà chữ số 6 đứng ở vị trí chính giữa?
Số cách lập là 8! = 40320 số.
1.5. Tổ hợp
• Định nghĩa: Tổ hợp chập k của n phần tử ( k ≤ n ), ký hiệu Cnk là một nhóm không phân biệt thứ tự gồm
k phần tử khác nhau chọn từ n phần tử đã cho.
n!
• Công thức tính: Cnk =
k !(n − k )!
Ví dụ: Một lớp có 50 sinh viên. Hỏi có bao nhiêu cách chọn 1 nhóm gồm 4 sinh viên?
50!
C504 = = 230300 cách.
4!46!
Ví dụ: Có bao nhiêu cách xếp 15 hành khách lên 3 toa tàu mà toa số 1 có đúng 3 hành khách?
Số cách xếp 3 hành khách lên toa số 1 là C153 .

12 hành khách lên 2 toa còn lại một cách ngẫu nhiên. Như vậy sẽ có B212 = 212 cách xếp.

Vậy: có C153 . 212 cách xếp.

1.6. Tổ hợp lặp


• Định nghĩa: Tổ hợp lặp chập k của n phần tử, ký hiệu Cnk là một nhóm không phân biệt thứ tự gồm k
phần tử (không nhất thiết khác nhau) chọn từ n phần tử đã cho.

• Công thức tính: Cnk = Cnk+ k −1


Ví dụ: Có 3 phần tử x, y, z. Các tổ hợp lặp chập 2 của 3 phần tử trên là xx, xy, xz, yy, yz, zz.
Trang 2
Đặng Thục Hiền Bài giảng XS và TK

Ví dụ: Có 4 loại bút bi: xanh, đỏ, vàng, tím. Có bao nhiêu cách để mua 6 chiếc bút bi?

Số cách chọn 6 chiếc bút bi từ 4 loại bút là tổ hợp lặp chập 6 của 4 phần tử. C46 = C46+ 6 −1 = 84 cách.

Bài 2. XÁC SUẤT


2.1. Phép thử và biến cố
2.1.1. Hiện tượng ngẫu nhiên
Người ta chia các hiện tượng xảy ra trong đời sống hàng này thành hai loại: tất nhiên và ngẫu nhiên.
Những hiện tượng mà khi được thực hiện trong cùng một điều kiện sẽ cho ra kết quả như nhau được
gọi là những hiện tượng tất nhiên. Chẳng hạn, phần mềm máy tính với cùng một bộ dữ liệu vào sẽ cho kết
quả giống nhau hay xã hội có phân chia giai cấp đối kháng thì sẽ có đấu tranh giai cấp là tất nhiên.
Những hiện tượng mà cho dù khi được thực hiện trong cùng 1 điều kiện vẫn có thể sẽ cho ra các kết
quả khác nhau được gọi là những hiện tượng ngẫu nhiên. Chẳng hạn, gieo hạt lúa ở điều kiện bình thường
thì hạt lúa có thể nảy mầm cũng có thể không nảy mầm hay một số yếu tố tác động đến tư tưởng làm cho
việc học tập kém hơn là ngẫu nhiên.
Hiện tượng ngẫu nhiên chính là đối tượng khảo sát của lý thuyết xác suất.
2.1.2. Phép thử và biến cố
• Việc thực hiện những điều kiện nhất định để quan sát, nghiên cứu một đối tượng hay một hiện tượng
ngẫu nhiên nào đó được gọi là một phép thử (test).
• Khi thực hiện một phép thử, ta không thể dự đoán được kết quả xảy ra. Tuy nhiên, ta có thể liệt kê tất cả
các kết quả có thể xảy ra.
Tập hợp tất cả các kết quả có thể xảy ra trong một phép thử được gọi là không gian các biến cố
sơ cấp (không gian mẫu) của phép thử đó, ký hiệu là Ω .
Mỗi phần tử ω ∈ Ω (kết quả đơn giản nhất) được gọi là một biến cố sơ cấp.
Mỗi tập hợp A ⊂ Ω được gọi là một biến cố.
Ví dụ: Xét một sinh viên thi hết môn XSTK, thì hành động của sinh viên này là một phép thử.
• Tập hợp tất cả các điểm số: Ω = {0; 0,5; 1; 1,5;...; 9,5; 10} mà sinh viên này có thể đạt là không gian
mẫu.
• Các biến cố sơ cấp là các phần tử: ω = 0, ω = 0,5,..., ω = 10
• Các biến cố là các tập con của Ω : A = {4; 4,5;...; 10}, B = {0; 0,5;...; 3,5},...
• Các biến cố A , B có thể được phát biểu lại là
A: “sinh viên này thi đạt môn XSTK”;
B: “sinh viên này thi hỏng môn XSTK”.
Ví dụ: Gieo một con xúc xắc (súc sắc) là thực hiện một phép thử. Không gian mẫu của phép thử này là
Ω = {ω1 , ω2 , ω3 , ω4 , ω5 , ω6 } trong đó ωi chỉ kết quả xúc xắc xuất hiện mặt i chấm (i = 1,2,3,4,5,6)

• Trong một phép thử, biến cố mà chắc chắn sẽ xảy ra được gọi là biến cố chắc chắn, ký hiệu là Ω . Biến
cố không thể xảy ra được gọi là biến cố rỗng, ký hiệu là ∅ . Biến cố đồng thời khác Ω và khác ∅ được
gọi là biến cố ngẫu nhiên.
Ví dụ: Từ nhóm có 6 nam và 4 nữ, ta chọn ngẫu nhiên ra 5 người.
Biến cố “chọn được ít nhất 1 nam” là chắc chắn.

Trang 3
Đặng Thục Hiền Bài giảng XS và TK

Biến cố “chọn được 5 người nữ” là rỗng.


Biến cố “chọn được 3 nam và 2 nữ” là ngẫu nhiên.
2.1.3. Mối quan hệ giữa các biến cố trong một phép thử
a. Định nghĩa 1: Biến cố A được gọi là kéo theo biến cố B, ký hiệu A ⊂ B nếu A xảy ra thì B cũng xảy
ra.
Ví dụ: Tung con xúc xắc, A là biến cố ra mặt 2, B là biến cố ra mặt chẵn thì A ⊂ B .
b. Định nghĩa 2: Hai biến cố A và B được gọi là tương đương, ký hiệu A = B nếu A ⊂ B và B ⊂ A .
Ví dụ: Tung con xúc xắc, A là biến cố ra mặt chẵn, B là biến cố ra mặt 2 hoặc 4 hoặc 6 thì A = B .
c. Định nghĩa 3: Tổng của hai biến cố A và B là một biến cố, ký hiệu A ∪ B hoặc A + B , biến cố này xảy
ra khi và chỉ khi có ít nhất một trong hai biến cố A, B xảy ra.
Tổng quát: Tổng của n biến cố Ai là một biến cố, biến cố này xảy ra khi có ít nhất một trong n biến cố
n n
Ai xảy ra. Ký hiệu ∪A i hay ∑A .
i =1
i
i =1

Ví dụ: Quan sát hai xạ thủ cùng bắn vào một bia, mỗi xạ thủ bắn một viên đạn. Gọi A là biến cố “xạ thủ
thứ nhất bắn trúng bia”, B: “xạ thủ thứ hai bắn trúng bia”, C: “bia trúng đạn” thì C = A + B .
d. Định nghĩa 4: Tích của hai biến cố A và B là một biến cố, ký hiệu A ∩ B hoặc A.B , biến cố này xảy ra
khi và chỉ khi cả A và B đều xảy ra.
Tổng quát: Tích của n biến cố Ai là một biến cố, biến cố này xảy ra khi tất cả các biến cố Ai xảy ra.
n n
Ký hiệu ∩ Ai hay
i =1
∏A .
i =1
i

Ví dụ: Quan sát hai xạ thủ cùng bắn vào một bia, mỗi xạ thủ bắn một viên đạn. Gọi A: “xạ thủ thứ nhất
bắn trật”, B: “xạ thủ thứ hai bắn trật”, C: “bia không trúng đạn” thì C = A.B .
e. Định nghĩa 5: Hai biến cố A và B được gọi là xung khắc nhau nếu chúng không thể đồng thời xảy ra
trong một phép thử, tức là AB = ∅ .
Các biến cố A1 , A2 ,..., An được gọi là xung khắc từng đôi nếu có bất kỳ hai trong n biến cố này xung
khắc với nhau.
Ví dụ: Hai sinh viên A và B cùng thi môn XSTK. Gọi A: “sinh viên A thi đỗ”, B: “chỉ có sinh viên B thi
đỗ”, C: “chỉ có 1 sinh viên thi đỗ”. Khi đó, A và B là xung khắc; B và C không xung khắc.
f. Định nghĩa 6: Biến cố A được gọi là biến cố đối lập (biến cố bù) với biến cố A nếu A , A xung khắc
và A ∪ A = Ω . Nói cách khác A và A gọi là đối lập nhau nếu A xảy ra thì A không xảy ra và ngược lại.
Ví dụ: Kiểm tra 3 sản phẩm chọn ngẫu nhiên từ một kiện hàng. Biến cố “có ít nhất một sản phẩm tốt trong
3 sản phẩm” và biến cố “không có sản phẩm tốt nào trong 3 sản phẩm” là hai biến cố đối lập nhau.
g. Các tính chất
A∪ B = B ∪ A
A∩ B = B ∩ A
A ∪ ( B ∪ C ) = ( A ∪ B) ∪ C = A ∪ B ∪ C
A ∩ ( B ∩ C ) = ( A ∩ B) ∩ C = A ∩ B ∩ C
A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C )
A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )
Trang 4
Đặng Thục Hiền Bài giảng XS và TK

A∪ B = A ∩ B

A∩ B = A ∪ B
2.1.4. Hệ đầy đủ các biến cố
Trong một phép thử, họ gồm n biến cố { Ai } , i = 1, 2,..., n được gọi là hệ đầy đủ khi và chỉ khi có duy
n
nhất một biến cố của họ xảy ra. Nghĩa là: Ai ∩ A j = ∅, ∀i ≠ j và ∪A =Ω .i
i =1

Ví dụ: Trộn lẫn 4 bao lúa vào nhau rồi bốc ra 1 hạt. Gọi Ai : “hạt lúa bốc được là của bao thứ i ”, i = 1, 4.
Khi đó, hệ { A1 , A2 , A3 , A4 } là đầy đủ.

{ }
Chú ý: Trong 1 phép thử, hệ A, A là đầy đủ với biến cố A tùy ý.

2.2 Xác suất


2.2.1. Khái niệm xác suất
Quan sát các biến cố đối với một phép thử, mặc dù không thể khẳng định một biến cố có xảy ra hay
không nhưng người ta có thể phỏng đoán khả năng xảy ra của các biến cố này là ít hay nhiều.
Khả năng xảy ra khách quan của một biến cố được gọi là xác suất (probability) của biến cố đó.
Xác suất của biến cố A, ký hiệu là P(A), có thể được định nghĩa bằng nhiều dạng: dạng cổ điển, dạng
thống kê, dạng hình học.
2.2.2. Định nghĩa xác suất dạng cổ điển
Xác suất xảy ra biến cố A là tỷ số giữa số trường hợp A xảy ra (k) và số trường hợp đồng khả năng có
thể xảy ra (n) khi thực hiện phép thử.
k
P ( A) =
n
VD 1. Một công ty cần tuyển 2 nhân viên. Có 4 người nữ và 2 người nam nộp đơn ngẫu nhiên (khả năng
trúng tuyển là như nhau). Tính xác suất để
a. cả hai người trúng tuyển đều là nữ; b. có ít nhất một người nữ trúng tuyển.
Giải. Gọi A: “cả hai người trúng tuyển đều là nữ”; B: “có ít nhất một người nữ trúng tuyển”.
a. Số trường hợp chọn 2 nhân viên trong số 6 người nộp đơn là C62 . Số trường hợp chọn 2 nữ trong
C42
số 4 nữ là C42 . Vậy P ( A) = = 0, 4 .
C62

C41 .C21 + C42 2


b. Tương tự, P ( B ) = =
C62 3
VD 2. Từ 1 hộp chứa 86 sản phẩm tốt và 14 phế phẩm người ta chọn ngẫu nhiên ra 25 sản phẩm. Tính xác
suất chọn được
a. cả 25 sản phẩm đều tốt; b. đúng 20 sản phẩm tốt.
Giải. Gọi A: “chọn được 25 sản phẩm tốt”, B: “chọn được đúng 20 sản phẩm tốt”.

Trang 5
Đặng Thục Hiền Bài giảng XS và TK

2.2.3. Định nghĩa xác suất dạng thống kê


Nếu khi thực hiện một phép thử nào đó n lần (đủ lớn), ta thấy có k lần biến cố A xuất hiện thì xác suất (tần
k
suất) của biến cố A theo nghĩa thống kê là P ( A) ≈
n
VD 3.
Pearson đã gieo một đồng tiền cân đối, đồng chất 12.000 lần thấy có 6.019 lần xuất hiện mặt sấp (tần
suất là 0,5016); gieo 24.000 lần thấy có 12.012 lần xuất hiện mặt sấp (tần suất là 0,5005).
Laplace đã nghiên cứu tỉ lệ sinh trai - gái ở London, Petecbua và Berlin trong 10 năm và đưa ra tần
suất sinh bé gái là 21/43.
Cramer đã nghiên cứu tỉ lệ sinh trai - gái ở Thụy Điển trong năm 1935 và kết quả có 42.591 bé gái
được sinh ra trong tổng số 88.273 trẻ sơ sinh, tần suất là 0,4825.
2.2.4. Tính chất của xác suất
1) 0 < P ( A) < 1 với mọi biến cố ngẫu nhiên A ; 2) P (∅) = 0 ;
3) P (Ω) = 1 ; 4) Nếu A ⊂ B thì P ( A) < P ( B ) ; 5) Nếu A = B thì P ( A) = P ( B )

Bài 3. CÔNG THỨC TÍNH XÁC SUẤT


3.1. Công thức cộng xác suất
Xét một phép thử, ta có các công thức cộng xác suất sau
Nếu A và B là hai biến cố tùy ý thì P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B )

Tổng quát: Nếu họ { Ai } , i = 1, 2,..., n không xung khắc thì


n
P( A1 ∪ A2 ∪ ... ∪ A n ) = ∑ P( Ai ) − ∑ P( Ai Aj ) + ∑ P( A A A ) + ... + (−1)
i j k
n −1
P( A1 A2 ... An )
i =1 i< j i< j <k

Nếu A và B là hai biến cố xung khắc thì P ( A ∪ B ) = P ( A) + P ( B )

Tổng quát: Nếu họ { Ai } , i = 1, 2,..., n xung khắc từng đôi thì

P ( A1 ∪ A2 ∪ ... ∪ A n ) = P ( A1 ) + P ( A2 ) + ... + P ( An )

Đặc biệt: P ( A) = 1 − P (A); P ( A) = P ( A.B ) + P ( A.B )


VD 1. Một nhóm có 30 nhà đầu tư các loại, trong đó có 13 nhà đầu tư vàng, 17 nhà đầu tư chứng khoán và
10 nhà đầu tư cả vàng lẫn chứng khoán. Một đối tác gặp ngẫu nhiên 1 nhà đầu tư trong nhóm. Tìm xác
suất để người đó gặp được nhà đầu tư vàng hay chứng khoán?
Giải: Gọi A: “gặp nhà đầu tư vàng”, B: “gặp nhà đầu tư chứng khoán”, C: “gặp nhà đầu tư vàng hay
chứng khoán”. Như vậy, C = A ∪ B .
13 17 10 2
P (C ) = P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = + − =
30 30 30 3
VD2. Trong một vùng dân cư, tỉ lệ người mắc bệnh tim là 9%; mắc bệnh huyết áp là 12%; mắc cả bệnh
tim và huyết áp là 7%. Chọn ngẫu nhiên 1 người trong vùng đó. Tính xác suất để người này không mắc
bệnh tim và không mắc bệnh huyết áp?
Giải. Gọi A: “người được chọn mắc bệnh tim”, B: “người được chọn mắc bệnh huyết áp”, C: “người được
chọn không mắc cả 2 bệnh”
Trang 6
Đặng Thục Hiền Bài giảng XS và TK

VD 3. Một hộp có 10 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên từ hộp ra 6 sản phẩm. Tìm xác
suất để có không quá 1 phế phẩm trong 6 sản phẩm đó.
VD 4. Một hộp phấn có 10 viên trong đó có 3 viên màu đỏ. Lấy ngẫu nhiên từ hộp ra 3 viên phấn. Tính
xác suất để lấy được ít nhất 1 viên phấn màu đỏ.
3.2. Công thức nhân xác suất
3.2.1. Xác suất có điều kiện
• Định nghĩa: Trong một phép thử, xét hai biến cố bất kỳ A và B với P(B) > 0. Xác suất của biến cố A
sau khi biến cố B đã xảy ra được gọi là xác suất của A với điều kiện B , ký hiệu P( A B) và công thức tính

P( A ∩ B)
P( A B) =
P( B)
VD 5. Từ một hộp chứa 3 bi đỏ và 7 bi xanh người ta bốc ngẫu nhiên ra 2 bi (bốc 1 lần 2 bi). Gọi A: “bốc
được bi đỏ”, B: “bốc được bi xanh”. Hãy tính P( A B) và P( B A)

Giải: Gọi Ai : “bốc được i bi đỏ”, Bi : “bốc được i bi xanh”, i = 1,2.


Suy ra, A = A1 B1 ∪ A2 ; B = A1 B1 ∪ B2 ; A ∩ B = A1 B1

C31C71 + C32 8 C31C71 + C72 14 C31C71 7


P ( A) = = ; P ( B ) = = ; P ( AB ) = =
C102 15 C102 15 C102 15
P ( AB ) P ( AB )
Vậy P ( A B ) = = 0, 5; P ( B A) = = 0,875
P( B) P ( A)
• Tính chất

1) 0 < P( A B) < 1 ; 2) Nếu A ⊂ C thì P( A B) ≤ P(C B) ; 3) P ( A B ) = 1 − P (A B )

3.2.2. Công thức nhân xác suất


3.2.2.1. Sự độc lập của hai biến cố
Trong một phép thử, hai biến cố A và B được gọi là độc lập nếu B có xảy ra hay không cũng không
ảnh hưởng đến khả năng xảy ra A và ngược lại.
Chú ý: Nếu A và B độc lập với nhau thì các cặp biến cố: A và B, A và B , A và B cũng độc lập.
3.2.2.2. Công thức nhân xác suất
Trong một phép thử
Nếu A và B là hai biến cố độc lập thì P ( AB ) = P ( A).P ( B )

Nếu A và B không độc lập (phụ thuộc) thì P( AB) = P( B).P( A B) = P( A).P( B A)

Tổng quát: Nếu n biến cố Ai phụ thuộc thì P( A1 A2 ... An ) = P( A1 ).P( A2 A1 )....P( An A1... An −1 )
VD 6. Một người có 5 bóng đèn trong đó có 2 bóng bị hỏng. Người đó thử ngẫu nhiên lần lượt từng bóng
(không hoàn lại) cho đến khi chọn được 1 bóng tốt. Tính xác suất để người đó thử đến lần thứ 2.
Giải: Gọi Ai : “bóng đèn được thử ở lần i là tốt”, i =1,5; A: “người đó thử đến lần thứ 2”

2 3
P ( A) = P ( A1 ∩ A2 ) = P ( A1 ) P ( A2 A1 ) = . = 30%
5 4

Trang 7
Đặng Thục Hiền Bài giảng XS và TK

VD 7. Một sinh viên học hệ niên chế được thi lại 1 lần nếu lần thi thứ nhất bị rớt (2 lần thi độc lập). Biết
rằng xác suất để sinh viên này thi đỗ lần 1 và lần 2 tương ứng là 60%, 80%. Tính xác suất sinh viên này
thi đỗ?
VD 8. Có hai người A và B cùng đặt lệnh (độc lập) để mua cổ phiếu của một công ty với xác suất mua
được tương ứng là 0,8 và 0,7. Biết rằng có người mua được, xác suất để người A mua được cổ phiếu này

19 12 40 10
a. b. c. d.
47 19 47 19
VD 9. Ông A bắn lần lượt 2 viên đạn vào 1 mục tiêu và mục tiêu sẽ bị phá hủy nếu bị trúng cả 2 viên đạn.
Xác suất viên đạn thứ nhất trúng mục tiêu là 0,8. Nếu viên thứ nhất trúng mục tiêu thì xác suất viên thứ
hai trúng là 0,7. Nếu viên thứ nhất không trúng thì xác suất viên thứ hai trúng mục tiêu là 0,3. Biết rằng
ông A bắn trúng, tính xác suất để mục tiêu bị phá hủy?
Giải: Gọi Ai : “viên đạn thứ i trúng mục tiêu”, i = 1,2; A: “mục tiêu bị trúng đạn”; B: “mục tiêu bị phá
hủy” thì B = A1 A2

P( A1 A2 ∩ A) P( A1 A2 ∩ A) P( A1 A2 ) P( A1 ) P( A2 A1 ) 0,8.0, 7 28
P( B A) = = = = = =
P( A) 1 − P( A) 1 − P( A1 A2 ) 1 − P( A1 ) P( A2 A1 ) 1 − 0, 2.0, 7 43

VD 10. Hai người A và B cùng chơi trò chơi như sau: Cả hai luân phiên lấy mỗi lần 1 viên bi từ một hộp
đựng 2 bi trắng và 4 bi đen (bi được lấy ra không trả lại hộp). Người nào lấy được bi trắng trước thì thắng
cuộc. Giả sử A lấy trước, tính xác suất A thắng cuộc.
3.3. Công thức Bernoulli
• Giả sử tiến hành n phép thử độc lập. Trong mỗi phép thử chỉ có thể xảy ra một trong hai trường hợp:
hoặc biến cố A xảy ra hoặc biến cố A không xảy ra. Xác suất xảy ra biến cố A trong mỗi phép thử bằng p
và xác suất A không xảy ra bằng 1-p = q. Khi đó, xác suất để trong n phép thử độc lập nói trên, biến cố A
xảy ra đúng k lần, ký hiệu là Pk ( A) được tính theo công thức Bernoulli

Pk ( A) = Cnk p k q n − k

• Xác suất để trong n phép thử A xuất hiện k lần ( 0 ≤ k1 ≤ k ≤ k2 ≤ n ) được tính theo công thức
k2
Pk ( A) = ∑ Cnk p k q n − k
k = k1

Ví dụ: Một lô hàng có tỷ lệ phế phẩm là 5%. Lấy ngẫu nhiên có hoàn lại từ lô hàng đó ra 5 sản phẩm để
kiểm tra. Tìm xác suất để có 2 phế phẩm trong 5 sản phẩm lấy ra.
Gọi A: “sản phẩm lấy ra kiểm tra là phế phẩm”. Xác suất để A xảy ra trong mỗi lần kiểm tra là 0,05.
Vì vậy, xác suất có 2 phế phẩm trong 5 sản phẩm kiểm tra là P2 ( A) = C52 (0, 05) 2 (0,95)3 = 0, 0214 .
VD 11. Xác suất tiêu thụ điện năng trong mỗi ngày không vượt quá quy định tại một công ty là 0,75. Tìm
xác suất sao cho trong 6 ngày liên tiếp có 4 ngày điện năng tiêu thụ không vượt quá quy định.
VD 12: Bắn 5 phát súng vào một mục tiêu, xác suất trúng đích của mỗi phát là 0,2. Để phá hủy mục tiêu
cần từ 3 phát súng trở lên. Tính xác suất mục tiêu bị phá hủy.
3.4. Công thức xác suất đầy đủ và Bayes
3.4.1. Công thức xác suất đầy đủ
Xét họ n biến cố đầy đủ { Ai } , i = 1, 2,..., n và B là một biến cố bất kỳ trong phép thử, ta có

Trang 8
Đặng Thục Hiền Bài giảng XS và TK

n
P ( B ) = P ( A1 ).P ( B A1 ) + P ( A2 ).P ( B A2 ) + ... + P ( An ).P ( B An ) = ∑ P ( Ai ).P ( B Ai )
i =1

VD 13. Một cửa hàng bán hai loại bóng đèn cùng kích cỡ gồm: 70 bóng màu trắng với tỉ lệ bóng hỏng là
1%, 30 bóng màu vàng với tỉ lệ hỏng 2%. Một khách hàng chọn mua ngẫu nhiên 1 bóng đèn từ cửa hàng
này. Tính xác suất để người này mua được bóng đèn tốt?
Gọi B: “khách chọn được bóng đèn tốt”, A1 : “khách chọn được bóng đèn màu trắng”, A2 : “khách
chọn được bóng đèn màu vàng”. Suy ra hệ { A1 , A2 } là đầy đủ. Ta có:

70 30
P ( B ) = P ( A1 ).P ( B A1 ) + P ( A2 ).P ( B A2 ) = .0, 99 + .0, 98 = 0,987
100 100
VD 14. Chuồng thỏ I có 3 con thỏ trắng và 4 con thỏ đen, chuồng II có 5 thỏ trắng và 3 thỏ đen. Quan sát thấy
có 1 con thỏ chạy từ chuồng I sang chuồng II, sau đó có 1 con thỏ chạy ra từ chuồng II. Tính xác suất để
con thỏ chạy ra từ chuồng II là thỏ trắng.
Giải: Gọi A1 : “con thỏ chạy từ chuồng 1 vào chuồng 2 là thỏ trắng”; A2 : “con thỏ chạy từ chuồng 1 vào
chuồng 2 là thỏ đen”; B : “con thỏ chạy ra từ chuồng 2 là thỏ trắng”.
3 6 4 5
P ( B ) = P ( A1 ).P ( B A1 ) + P ( A2 ).P ( B A2 ) = . + . = 0, 6032
7 9 7 9
VD 15. Có một kho bia kém chất lượng chứa các thùng giống nhau (24 lon/thùng) gồm 2 loại: loại I để lẫn
mỗi thùng 5 lon quá hạn sử dụng và loại II để lẫn mỗi thùng 3 lon quá hạn. Biết rằng số thùng bia loại I
bằng 1,5 lần số thùng bia loại II. Chọn ngẫu nhiên 1 thùng trong kho và từ thùng đó lấy ra 10 lon. Tính
xác suất chọn phải 2 lon bia quá hạn sử dụng.
3.4.2. Công thức Bayes
Với các giả thiết như công thức xác suất đầy đủ. Khi đó, xác suất để biến cố Ai xảy ra sau khi biến cố
B đã xảy ra là
P( Ai ) P( B Ai )
P( Ai B) =
P( B)
VD 16. Xét tiếp ví dụ 13, giả sử khách hàng mua được bóng đèn tốt, hãy tính xác suất để người đó mua
P ( A2 ) P( B A2 ) 0,3.0,98 14
được bóng đèn màu vàng. Ta có: P( A2 B) = = =
P( B ) 0,987 47
VD 17. Có 20 thùng hàng giống nhau gồm 3 loại: 8 thùng loại I, 7 thùng loại II và 5 thùng loại III. Mỗi
thùng hàng có 10 sản phẩm và số sản phẩm tốt tương ứng cho mỗi loại lần lượt là 8, 7 và 5. Chọn ngẫu
nhiên 1 thùng hàng và từ thùng đó lấy ra 3 sản phẩm.
a. Tính xác suất có 2 sản phẩm lấy ra là tốt.
b. Tính xác suất có 2 sản phẩm lấy ra là tốt và của thùng hàng loại II.
c. Giả sử có 2 sản phẩm lấy ra là tốt, tính xác suất 2 sản phẩm này là của thùng hàng loại II.
Giải: Gọi Ai : “lấy được thùng loại i”, i = 1,2,3
a. Gọi B: “2 sản phẩm lấy ra là tốt”,
P( B) = P( A1 ).P( B A1 ) + P( A2 ).P( B A2 ) + P( A3 ).P( B A3 ) =
8 C82 .C21 7 C72 .C31 5 C52 .C51
. + . 3 + . 3 =
20 C103 20 C10 20 C10

Trang 9
Đặng Thục Hiền Bài giảng XS và TK

7 C72 .C31
b. Gọi C: “2 sản phẩm tốt của thùng loại 2”, C = B ∩ A2 ⇒ P(C ) = P( A2 ).P( B A2 ) = . =
20 C103
P ( A2 ).P( B A2 )
c. P( A2 B) = =
P( B)
VD 18. Nhà máy X có 3 phân xưởng A, B, C tương ứng sản xuất ra 20%, 30% và 50% tổng sản phẩm của
nhà máy. Giả sử tỉ lệ sản phẩm hỏng do các phân xưởng A, B, C tương ứng sản xuất ra là 1%, 2%, 3%.
Chọn ngẫu nhiên 1 sản phẩm do nhà máy X sản xuất ra.
a. Tính xác suất (tỉ lệ) sản phẩm này là hỏng.
b. Tính xác suất sản phẩm này hỏng và do phân xưởng A sản xuất ra.
c. Biết rằng sản phẩm được chọn là hỏng, tính xác suất sản phẩm này là do phân xưởng A sản xuất ra.
VD 19. Tỉ lệ ôtô tải, ôtô con và xe máy đi qua đường X có trạm bơm dầu là 5:2:13. Xác suất để ôtô tải, ôtô
con và xe máy đi qua đường này vào bơm dầu lần lượt là 0,1; 0,2 và 0,15. Biết rằng có 1 xe đi qua đường
X vào bơm dầu, tính xác suất để đó là ôtô con.
11 10 8 7
a. b. c. d.
57 57 57 57
Giải: Gọi A, B, C: “xe tải, xe con, xe máy đi qua trạm bơm dầu”, Y: “có 1 xe vào bơm dầu”
P (Y ) = P ( A).P (Y A) + P ( B ).P (Y B ) + P (C ).P (Y C ) =
5 2 13 57
.0,1 + .0, 2 + .0,15 =
20 20 20 100
P( B).P(Y B) 8
P( B Y ) = =
P(Y ) 57

BÀI TẬP CHƯƠNG 1


Bài 1: Có bao nhiêu số tự nhiên gồm 3 chữ số khác nhau được lập từ các chữ số 0, 1, 2, 3, 4?
ĐS: 48 số
Bài 2: Từ 7 chữ số 0, 1, 2, 3, 4, 5, 6 có thể thành lập được bao nhiêu số chẵn, mỗi số gồm 5 chữ số khác
nhau? ĐS: 1260 số
Bài 3: Có 10 đội bóng thi đấu vòng tròn. Hỏi có bao nhiêu trận đấu? ĐS: 45 trận
Bài 4: Trong mặt phẳng cho một tập hợp P gồm 7 điểm, trong đó, không có 3 điểm nào thẳng hàng. Hỏi
có thể vẽ được bao nhiêu tam giác có đỉnh là 3 trong 7 điểm đã cho? ĐS: 35 tam giác
Bài 5: Trong tất cả các hoán vị của n số 1, 2, 3,…, n có bao nhiêu hoán vị trong đó số 3 và 4 đứng cạnh
nhau? ĐS: 2!(n-1)!
Bài 6: Một lớp có 20 bạn gồm 5 nam và 15 nữ. Có bao nhiêu cách chọn 5 bạn trong đó có đúng 2 bạn
nam? ĐS: 4550 cách
Bài 7: Có bao nhiêu số tự nhiên gồm 5 chữ số, trong đó số 0 có mặt 2 lần, số 1 có mặt 1 lần và hai chữ số
còn lại khác nhau? ĐS: 1008 số
Bài 8: Một đội thanh niên tình nguyện có 15 người gồm 12 nam và 3 nữ. Hỏi có bao nhiêu cách phân công
đội thanh niên đó về giúp đỡ 3 tỉnh miền núi, sao cho mỗi đội có 4 nam và 1 nữ? ĐS: 207900 cách
Bài 9: Một hộp đựng 3 bi đỏ và 7 bi xanh, lấy ngẫu nhiên từ hộp ra 1 bi. Nếu bi lấy ra màu đỏ thì bỏ vào
hộp một bi xanh, nếu bi lấy ra màu xanh thì bỏ vào hộp một bi đỏ. Sau đó từ hộp lấy tiếp ra 1 bi.

Trang 10
Đặng Thục Hiền Bài giảng XS và TK

a. Tìm xác suất để bi lấy ra lần sau là bi đỏ. ĐS: 0,34


b. Nếu 2 bi lấy ra cùng màu, hãy tìm xác suất để 2 bi này là màu xanh. ĐS: 0,875
Bài 10: Một phân xưởng có 60 công nhân trong đó có 40 nữ và 20 nam. Tỷ lệ nữ công nhân tốt nghiệp
THPT là 15% trong khi ở nam là 20%. Tìm xác suất để có ít nhất 1 người tốt nghiệp THPT trong số 2
công nhân gặp ngẫu nhiên của phân xưởng. ĐS: 0,3079
Bài 11: Một sinh viên thi 2 môn, xác suất để sinh viên này đạt yêu cầu môn thứ nhất là 80%. Nếu đạt môn
thứ nhất thì xác suất đạt môn thứ 2 là 60%. Nếu không đạt môn thứ nhất thì xác suất đạt môn thứ 2 là
30%. Hãy tính các xác suất
a. Sinh viên này đạt yêu cầu cả 2 môn. ĐS: 0,48
b. Sinh viên này đạt yêu cầu môn thứ 2. ĐS: 0,54
c. Sinh viên này đạt yêu cầu ít nhất 1 môn. ĐS: 0,86
d. Sinh viên này không đạt yêu cầu cả 2 môn. ĐS: 0,14
Bài 12: Một hộp đựng 10 quả cầu gồm: 2 quả màu đỏ, 3 quả vàng và 5 quả xanh.
a. Chọn ngẫu nhiên từ hộp đó ra 4 quả cầu thì thấy có 3 quả màu xanh. Tính xác suất chọn được 1
quả màu đỏ? ĐS: 0,4
b. Chọn ngẫu nhiên từ hộp đó ra 4 quả cầu thì thấy có 2 quả màu xanh. Tính xác suất chọn được ít
nhất 1 quả màu đỏ? ĐS: 0,7
Bài 13: Trong dịp tết, ông A đem bán 1 cây mai lớn và 1 cây mai nhỏ. Xác suất bán được cây mai lớn là
0,9. Nếu bán được cây mai lớn thì xác suất bán được cây mai nhỏ là 0,7. Nếu cây mai lớn không bán được
thì xác suất bán được cây mai nhỏ là 0,2. Biết rằng ông A bán được ít nhất 1 cây mai, xác suất để ông A
bán được cả hai cây mai là
a. 0,6342 b. 0,6848 c. 0,4796 d. 0,8791. ĐS: b
Bài 14: Một công nhân đứng máy xe sợi gồm 400 ống sợi. Xác suất mỗi ống bị đứt sợi trong vòng 1 giờ là
0,005. Tính xác suất để
a. Trong một giờ có 40 ống bị đứt sợi
b. Trong một giờ có không quá 40 ống bị đứt sợi.
Bài 15: Xác suất có bệnh của những người chờ khám tại bệnh viện là 12%. Khám lần lượt 20 người, tìm
xác suất để có ít hơn 2 người bị bệnh.
Bài 16: Xác suất có bệnh của những người chờ khám tại bệnh viện là 72%. Khám lần lượt 61 người, hỏi
khả năng cao nhất có mấy người bị bệnh? ĐS: 44 người
Bài 17: Phát hành 100000 vé số thì có 10000 vé trúng thưởng. Hỏi một người muốn trúng ít nhất 1 vé với
xác suất lớn hơn 95% thì cần mua tối thiểu bao nhiêu vé? ĐS: 29 vé
Bài 18: Hộp thứ nhất có 8 chai thuốc trong đó có 3 chai kém phẩm chất, hộp thứ hai có 5 chai thuốc trong
đó có 2 chai kém phẩm chất. Lấy ngẫu nhiên từ mỗi hộp ra 1 chai.
a. Tìm xác suất lấy được 2 chai thuốc tốt. ĐS: 0,375
b. Tìm xác suất lấy được 1 chai thuốc tốt và 1 chai kém phẩm chất. ĐS: 0,475
c. Nếu lấy được 1 chai tốt và 1 chai kém phẩm chất, tìm xác suất để chai kém phẩm chất là của hộp
thứ nhất. ĐS: 0,474
Bài 19: Hộp thứ nhất có 8 chai thuốc trong đó có 3 chai kém phẩm chất, hộp thứ hai có 5 chai thuốc trong
đó có 2 chai kém phẩm chất. Chọn ngẫu nhiên 1 hộp rồi lấy từ hộp đó ra 2 chai.
a. Tìm xác suất lấy được 2 chai thuốc tốt. ĐS: 23/70
b. Tìm xác suất lấy được 1 chai thuốc tốt và 1 chai kém phẩm chất. ĐS: 159/280
Trang 11
Đặng Thục Hiền Bài giảng XS và TK

c. Nếu lấy được 1 chai tốt và 1 chai kém phẩm chất, tìm xác suất hộp thứ nhất được chọn.
ĐS: 25/53
Bài 20: Hộp thứ nhất có 10 sản phẩm (trong đó có 8 sản phẩm loại A và 2 sản phẩm loại B); hộp thứ hai
có 8 sản phẩm (trong đó có 5 sản phẩm loại A và 3 sản phẩm loại B). lấy ngẫu nhiên từ mỗi hộp ra 2 sản
phẩm.
a. Tính xác suất để có 3 sản phẩm loại A trong 4 sản phẩm lấy ra. ĐS: 29/63
b. Nếu trong 4 sản phẩm lấy ra có 1 sản phẩm loại B, tìm xác suất sản phẩm loại B là của hộp thứ
nhất. ĐS: 8/145
Bài 21: Một hộp có 6 sản phẩm hoàn toàn không biết chất lượng. Mọi giả thiết về số sản phẩm tốt có trong
hộp được xem như đồng khả năng. Lấy ngẫu nhiên không hoàn lại 3 sản phẩm thì thấy có 2 sản phẩm tốt.
Hỏi có bao nhiêu sản phẩm tốt có trong 3 sản phẩm còn lại trong hộp? ĐS: 2

Chương 2. BIẾN NGẪU NHIÊN


Bài 1. BIẾN NGẪU NHIÊN VÀ HÀM MẬT ĐỘ
1.1. Khái niệm biến ngẫu nhiên
• Xét một phép thử với không gian mẫu Ω . Giả sử, ứng với mỗi biến cố sơ cấp ω ∈ Ω , ta liên kết với một
số thực X (ω ) ∈ ℝ , thì X được gọi là một biến ngẫu nhiên (hay đại lượng ngẫu nhiên). Như vậy, biến ngẫu
nhiên sẽ chỉ nhận được một và chỉ một giá trị nào đó trong tập hợp các giá trị mà nó có thể nhận.
Ví dụ: Kiểm tra 3 sản phẩm chọn ngẫu nhiên. Gọi X là số phế phẩm thì X là biến ngẫu nhiên và giá trị X
có thể nhận là 0, 1, 2, 3.
Ví dụ: Gọi Y là số sinh viên nghỉ học trong một lớp học có 50 sinh viên. Y là biến ngẫu nhiên được nhận
một trong các giá trị từ 0 đến 50.
• Nếu tập giá trị { X (ω ) / ω ∈ Ω} là hữu hạn hay đếm được thì ta nói X là biến ngẫu nhiên rời rạc. Ký hiệu
X = { x1 , x2 ,..., xn }

• Nếu tập giá trị { X (ω ) / ω ∈ Ω} lấp đầy trên một khoảng trục số thì ta gọi X là biến ngẫu nhiên liên tục.

• Cho biến ngẫu nhiên X và hàm số y = ϕ ( x) . Khi đó, Y = ϕ ( X ) được gọi là hàm của biến ngẫu nhiên và
Y cũng là một biến ngẫu nhiên.
VD 1. Một hộp chứa 3 lá thăm màu đỏ và 2 lá thăm màu đen. Một người bốc lần lượt 2 lá thăm từ hộp đó.
Nếu bốc được lá thăm đỏ thì được thưởng 100 ngàn đồng; nếu bốc lá thăm đen thì bị phạt 70 ngàn đồng.
Gọi A: “bốc được lá thăm đỏ lần thứ i ” (i = 1,2), X là số lá thăm đỏ bốc được và Y là số tiền có được, thì

{
Không gian mẫu Ω = A1 A 2 , A1A 2 , A1 A 2 ,A1A 2 }
X là biến ngẫu nhiên và X = {0,1, 2}

Y = 100 X − 70(2 − X ) là hàm của X và Y = {−140,30, 200} .


Chú ý : Trong thực nghiệm, các biến ngẫu nhiên thường là rời rạc. Khi các giá trị của biến ngẫu nhiên
rời rạc là đủ nhiều trong một khoảng của ℝ thì ta xem nó là biến ngẫu nhiên liên tục.
1.2. Hàm mật độ xác suất
1.2.1. Biến ngẫu nhiên rời rạc
Trang 12
Đặng Thục Hiền Bài giảng XS và TK

Cho BNN X = { x1 , x2 ,..., xn } , x1 < x2 < ... < xn với xác suất tương ứng là P ( X = xi ) = pi , i = 1, 2,..., n
Ta định nghĩa
• Bảng phân phối xác suất của X là
X x1 x2 ... xn

P p1 p2 ... pn

 pi khi x = xi
• Hàm mật độ của X là f ( x) =  ∀i
0 khi x ≠ xi
Chú ý
n
pi ≥ 0 ∀i và ∑p
i =1
i =1

Nếu x ∉ { x1 , x2 ,..., xn } thì P ( X = x) = 0

P ( a < X ≤ b) = ∑
a < xi ≤b
pi

VD 2. Cho X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất
X -1 0 1 3 5
P 3a a 0,1 2a 0,3
a. Tìm a và tính P (−1 < X ≤ 3)
b. Lập bảng phân phối xác suất của hàm Y = X 2
VD 3. Một xạ thủ có 4 viên đạn, bắn lần lượt vào một mục tiêu một cách độc lập. Xác suất trúng mục tiêu
ở mỗi lần bắn là 0,8. Biết rằng nếu có 1 viên trúng mục tiêu hoặc hết đạn thì dừng. Gọi X là số viên đạn xạ
thủ đã bắn, hãy lập bảng phân phối xác suất của X.
Giải: Gọi Ai : “viên đạn thứ i trúng mục tiêu”, i = 1,2,3,4.

P ( X = 1) = P ( A1 ) = 0,8 ; P( X = 2) = P( A1 A2 ) = 0, 2.0,8 = 0,16 . Tương tự

P ( X = 3) = 0, 032; P ( X = 4) = 0, 23.0,8 + 0, 24 = 0, 008


VD 4. Một hộp có 3 viên phấn trắng và 2 viên phấn đỏ. Một người lấy ngẫu nhiên không hoàn lại mỗi lần
1 viên cho đến khi lấy được 2 viên phấn đỏ. Gọi X là số lần người đó lấy phấn, hãy lập bảng phân phối
xác suất của X.
1.2.2. Biến ngẫu nhiên liên tục
• Hàm số f ( x) xác định trên ℝ được gọi là hàm mật độ của biến ngẫu nhiên liên tục X nếu thỏa mãn
f ( x) ≥ 0 ∀x ∈ ℝ
b
P (a < X < b) = ∫ f ( x)dx
a

+∞


−∞
f ( x)dx = 1

Hàm mật độ của BNN liên tục X cho biết mức độ tập trung xác suất tại điểm x

Trang 13
Đặng Thục Hiền Bài giảng XS và TK

b
Chú ý: P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) = ∫ f ( x)dx
a

+∞ +∞
+∞ +∞

−∞
f ( x)dx = F ( x) −∞ = F (+∞) − F (−∞); ∫
−∞
f ( x)dx = F ( x) −∞ = lim F ( x) − lim F ( x)
x →+∞ x →−∞

4 x3 khi x ∈ [0,1]
VD 5. Chứng tỏ f ( x) =  là hàm mật độ của BNN X và tính P (0, 5 ≤ X < 3)
0 khi x ∉ [0,1]
+∞ 1

∫ f ( x)dx = ∫ 4 x3 dx = x 4 1
Giải: f ( x) ≥ 0, ∀x ∈ ℝ và 0 = 1 nên f ( x) là hàm mật độ của X
−∞ 0

3 1

∫ ∫ 4 x dx = 15 / 16
3
P(0,5 ≤ X < 3) = f ( x)dx =
0,5 0,5

0 khi x < 2

VD 6. Cho BNN X có hàm mật độ f ( x) =  k . Tính P (−3 < X < 5)
 x 2 khi x ≥ 2

Bài 2. HÀM PHÂN PHỐI XÁC SUẤT


2.1. Định nghĩa
• Hàm phân phối xác suất của BNN X, ký hiệu là F ( x) được định nghĩa bởi biểu thức
F ( x) = P ( X < x) ∀x ∈ ℝ

• Nếu X là BNN rời rạc thì F ( x) = ∑ P( X < xi ) = ∑ pi


xi < x xi < x

• Nếu X là BNN liên tục thì F ( x) = ∫


−∞
f (t )dt

Ý nghĩa: Nếu biết hàm phân phối xác suất của X thì ta có thể tính các xác suất liên quan đến X.
P( X ≥ a) = 1 − P( X < a) = 1 − F (a)
P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) = P ( X < b) − P ( X < a ) = F (b) − F (a )

P ( X = a ) = lim+ F ( x) − F (a )
x →a

2.2. Nhận xét


0 ≤ F ( x) ≤ 1 ∀x ∈ ℝ; F (−∞) = 0, F (+∞) = 1
Hàm phân phối xác suất là hàm không giảm, tức là nếu x2 > x1 thì F ( x2 ) ≥ F ( x1 )

Giả sử BNN rời rạc X nhận các giá trị trong tập hợp { x1 , x2 ,..., xn } và có phân phối xác suất
P ( X = xi ) = pi , thì hàm phân phối xác suất của X là

Trang 14
Đặng Thục Hiền Bài giảng XS và TK

0 khi x ≤ x1
p khi x1 < x ≤ x2
 1
 p + p2 khi x2 < x ≤ x3
F ( x) =  1
.........
 p1 + p2 + pn −1 khi xn −1 < x ≤ xn

1 khi xn < x

0 x<a
x
ϕ ( x) x ∈ [a, b] 
Nếu BNN X có hàm mật độ f ( x) =  thì F ( x) =  ∫ ϕ (t )dt a≤ x≤b
0 x ∉ [a, b] a
1 x>b

0 x<a
0 x<a x
Nếu BNN X có hàm mật độ f ( x) =  thì F ( x) = 
ϕ ( x) x≥a  ∫ ϕ (t )dt x≥a
a
x
ϕ ( x) x≤a  ∫ ϕ (t )dt x≤a
Nếu BNN X có hàm mật độ f ( x) =  thì F ( x) =  −∞
0 x>a 1
 x>a
VD 1. Lập hàm phân phối xác suất của BNN X có bảng phân phối xác suất là
X -2 1 3 4
P 0,1 0,1 0,2 0,5

0 khi x ≤ −2
0,1 khi − 2 < x ≤1

F ( x) = 0, 2 khi 1< x ≤ 3
0, 4 khi 3< x ≤ 4

1 khi 4< x

0 x ∉ [0,1]
VD 2. Tìm hàm phân phối xác suất của BNN X có hàm mật độ f ( x) =  2
3 x x ∈ [0,1]

0 x<0
x 0 x<0
 2 
F ( x) =  ∫ 3t dt 0 ≤ x ≤ 1 =  x3 khi 0 ≤ x ≤ 1
0 1 x >1
1 x >1 

0 x < 100

VD 3. Tìm hàm phân phối xác suất của BNN X có hàm mật độ f ( x) = 100 và tính xác suất
 x 2 x ≥ 100

P ( X ≥ 400)

Trang 15
Đặng Thục Hiền Bài giảng XS và TK

 3 2
 x x ∈ [ − 1,3]
VD 4. X có hàm mật độ f ( x) =  28 . Tìm hàm phân phối xác suất của X.
0 x ∉ [ − 1, 3]

0 x ≤ −2
 3
VD 5. BNN X có hàm F ( x) = ax + 2b x ∈ (−2,3] .
1 x>3

a. Hãy tìm các hằng số a, b.

b. Tính P ( 2 < Y ≤ 5) với Y = X 2 + 1 .


Giải:
a. Do F ( x) liên tục ∀x ∈ ℝ nên lim+ F ( x) = F (−2) và lim+ F ( x) = F (3) .
x →−2 x →3

−8a + 2b = 0 a = 1 / 35
Từ đó có hệ phương trình  ⇒
27 a + 2b = 1 b = 4 / 35
 −2 ≤ X < −1
b. Có 2 < X 2 +1 ≤ 5 ⇔ 2 < X 2 +1 ≤ 5 ⇔ 1 < X 2 ≤ 4 ⇔ 
1 < X ≤ 2
P ( 2 < Y ≤ 5) = P (−2 ≤ X < −1) + P (1 < X ≤ 2) = F (−1) − F (−2) + F (2) − F (1) = 14 / 35

Bài 3. CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN


Những thông tin cô đọng nhất phản ánh các đặc trưng cơ bản của biến ngẫu nhiên giúp ta so sánh giữa
các đại lượng với nhau được gọi là các tham số đặc trưng (đặc trưng số) của BNN. Có 3 loại đặc trưng số

Các đặc trưng số cho xu hướng trung tâm của BNN: Trung vị, Mode, Kỳ vọng.
Các đặc trưng số độ phân tán của BNN: Phương sai, Độ lệch chuẩn.
Các đặc trưng số cho dạng phân phối xác suất.
3.1. Kỳ vọng
3.1.1. Định nghĩa
• Cho BNN rời rạc X = { x1 , x2 ,..., xn } , x1 < x2 < ... < xn với xác suất tương ứng là
P ( X = xi ) = pi , i = 1, 2,..., n . Kỳ vọng của X, ký hiệu là E ( X ) ( EX hay M ( X ) ) là tổng các tích giữa các
giá trị có thể có của X với các xác suất tương ứng.
n
E ( X ) = ∑ xi pi
i =1

+∞

• Nếu X là BNN liên tục có hàm mật độ là f ( x) thì E ( X ) = ∫ xf ( x)dx


−∞

Chú ý: Nếu X = { x1 , x2 ,...xn } thì E ( X ) ∈  min { x1 , x2 ,..., xn } , max { x1 , x2 ,..., xn }

Nếu X liên tục trên [a, b] thì E ( X ) ∈ [a, b]


VD 1. Tính kỳ vọng của BNN X có bảng phân phối xác suất là

Trang 16
Đặng Thục Hiền Bài giảng XS và TK

X -1 0 2 3
P 0,1 0,2 0,4 0,3

VD 2. Một lô hàng có 10 sản phẩm tốt và 2 phế phẩm. Gọi X là số sản phẩm tốt có trong 4 sản phẩm lấy
ngẫu nhiên từ lô hàng. Tính kỳ vọng của X.
Giải: Gọi X là số sản phẩm tốt, X = {2,3, 4} .

C102 C22
P ( X = 2) = = 3 / 33 ; P ( X = 3) = 16 / 33; P ( X = 4) = 14 / 33
C124
Vậy E ( X ) = 10 / 3

 3 2
 ( x + 2 x) x ∈ [0,1]
VD 3. Tính kỳ vọng của BNN X có hàm mật độ f ( x) =  4
0 x ∉ [0,1]

 ekx x ≤ 0
VD 4. Tính kỳ vọng của BNN X có hàm mật độ f ( x) = 
0 x>0
+∞ 0

∫ ∫e
kx
Giải: f ( x) là hàm mật độ nên f ( x)dx = 1 ⇒ dx = 1 ⇒ k = 1
−∞ −∞

+∞ 0

∫ ∫ xe dx = −1
x
E( X ) = xf ( x)dx =
−∞ −∞

VD 5. Cho X là BNN có bảng phân phối xác suất


X 1 2 4 5 7
P a 0,2 b 0,2 0,1
Tìm a và b để E(X) = 3,5
 ax + bx 2 x ∈ [0,1]
VD 6. Cho BNN có hàm mật độ f ( x) =  . Cho biết E ( X ) = 0, 6 hãy tính P ( X < 0, 5) .
0 x ∉ [0,1]
3.1.2. Tính chất
1) E (C ) = C (C là hằng số) 2) E (CX ) = CE ( X ) (C là hằng số) 3) E ( X ± Y ) = E ( X ) ± E (Y )
4) E ( XY ) = E ( X ).E (Y ) nếu X, Y độc lập.
VD 7. Một lớp có 50 sinh viên, điểm thi môn Toán cho ở bảng sau
Điểm 3 4 5 6 7 8 9
Số SV 3 7 15 10 5 6 4
Gọi X là điểm thi môn Toán của một sinh viên chọn ngẫu nhiên từ lớp này. Hãy tính E(X)
VD 8. Cho X, Y là 2 BNN độc lập có bảng phân phối xác suất

X -1 1 3 Y -1 2
P 0,3 0,1 0,6 P 0,6 0,4

Tính E ( X 2Y − 3 XY + 5Y + 7)
Trang 17
Đặng Thục Hiền Bài giảng XS và TK

3.1.3. Ý nghĩa của kỳ vọng


• Kỳ vọng của BNN X chính là giá trị trung bình (tính theo xác suất) mà X nhận được, nó phản ánh giá trị
trung tâm phân phối xác suất của X.
• Trong thực tế sản xuất hay kinh doanh, muốn chọn phương án cho năng suất hay lợi nhuận cao, người ta
thường chọn phương án sao cho kỳ vọng năng suất hay kỳ vọng lợi nhuận cao.
VD 9. Trong thành phố ABC, tỷ lệ tai nạn xe máy là 0,001. Công ty bảo hiểm A đề nghị bán loại bảo
hiểm xe máy cho ông B ở thành phố ABC trong 1 năm với số tiền phải trả là 10 triệu đồng, phí bảo hiểm
là 0,1 triệu đồng. Hỏi trung bình công ty A lãi bao nhiêu khi bán bảo hiểm cho ông B ?
Giải: Gọi X(tr đồng) là số tiền lãi của công ty sau khi bán bảo hiểm cho ông B
B không bị tai nạn thì X = 0,1 và P ( X ) = 0, 999
B bị tai nạn thì X = 0,1 − 10 = −9, 9 và P ( X ) = 0, 001
Bảng phân phối XS của X
X 0,1 -9,9
P 0,999 0,001
E ( X ) = 0, 09 (tr đồng)
VD 10. Một cửa hàng điện máy lãi 2,3 triệu đồng khi bán được 1 máy giặt, nhưng nếu máy giặt bị hỏng
trước thời hạn bảo hành thì bị lỗ 4,5 triệu. Biết rằng cửa hàng lãi trung bình 1,96 triệu đồng khi bán được
1 máy giặt. Tính tỉ lệ máy giặt phải bảo hành?
VD 11. Ông A tham gia một trò chơi đỏ, đen như sau: Trong một hộp có 4 bi đỏ và 6 bi đen, mỗi lần ông
A lấy ra 1 bi. Nếu là đỏ thì được thưởng 100 (ngàn đồng), nếu là đen thì bị mất 70 (ngàn đồng). Hỏi trung
bình mỗi lần lấy bi ông A bị mất bao nhiêu tiền?
VD 12. Người thợ chép tranh mỗi tuần chép hai bức tranh độc lập A và B với xác suất hỏng tương ứng là
0,03 và 0,05. Nếu thành công thì người thợ sẽ kiếm lời từ bức tranh A là 1,3 triệu đồng và B là 0,9 triệu
đồng, nhưng nếu hỏng thì bị lỗ do bức tranh A là 0,8 triệu đồng và do B là 0,6 triệu đồng. Hỏi trung bình
người thợ nhận được bao nhiêu tiền chép tranh mỗi tuần?
a. 2,185 triệu đồng; b. 2,148 triệu đồng; c. 2,116 triệu đồng; d. 2,062 triệu đồng.
VD 13. Nhu cầu hàng ngày của một khu phố về 1 loại thực phẩm tươi sống có bảng phân phối xác suất
Nhu cầu (kg) 31 32 33 34
P 0,15 0,25 0,45 0,15
Một cửa hàng trong khu phố nhập về mỗi ngày 34 kg loại thực phẩm này với giá 25.000 đồng/kg và bán ra
với giá 40.000 đồng/kg. Nếu bị ế, cuối ngày cửa hàng phải hạ giá còn 15.000 đồng/kg mới bán hết. Giả sử
cửa hàng luôn bán hết hàng, tính tiền lãi trung bình của cửa hàng về loại thực phẩm trên trong 1 ngày.
Giải: Gọi X (ng đồng) và a (kg) là số tiền lãi và số kg không bị ế. Khi đó X = 15a − (34 − a )10 . Từ đó, ta
có bảng phân phối xác suất của X như sau
X 435 460 485 510
P 0,15 0,25 0,45 0,15
Suy ra E(X) = 475 000đ
3.1.4. Kỳ vọng của hàm của BNN
Giả sử Y = ϕ ( X ) là hàm của BNN X
n n
• Nếu X là BNN rời rạc thì E (Y ) = ∑ yi pi = ∑ ϕ ( xi ) pi
i =1 i =1

Trang 18
Đặng Thục Hiền Bài giảng XS và TK

+∞ +∞

• Nếu X là BNN liên tục có hàm mật độ f ( x) thì E (Y ) =


−∞
∫ yf ( x)dx = ∫ ϕ ( x) f ( x)dx
−∞

VD 14. Cho X là BNN có bảng phân phối xác suất


X -1 0 1 2
P 0,1 0,3 0,35 0,25
Tìm E (Y ) biết Y = X 2 − 3 .

2
 x ∈ [1, 2] 2
VD 15. Cho BNN X có hàm mật độ f ( x) =  x 2 . Tìm E (Y ) biết Y = X 5 −
0 X
x ∉ [1, 2]

3.2. Phương sai


3.2.1. Định nghĩa: Phương sai của BNN X, ký hiệu Var(X) (VarX hay D(X)) là một số thực không âm
được xác định bởi Var ( X ) = E ( X − E ( X )) 2 = E ( X 2 ) − ( E ( X ))2
2
n
 n 
• Nếu X là BNN rời rạc thì Var ( X ) = ∑ xi pi −  ∑ xi pi 
2

i =1  i =1 
+∞ 2
 +∞ 
• Nếu X là BNN liên tục có hàm mật độ là f ( x) thì Var ( X ) = ∫ x f ( x)dx −  ∫ xf ( x)dx 
2

−∞  −∞ 
VD 16. Tính phương sai của BNN X có bảng phân phối xác suất
X 1 2 3
P 0,2 0,7 0,1
3 2
 ( x + 2 x) x ∈ [0,1]
VD 17. Tìm phương sai của X biết hàm mật độ f ( x) =  4
0 x ∉ [0,1]

3 2
 (1 − x ) x ≤1
VD 18. Cho BNN X có hàm mật độ f ( x) =  4 . Tìm Var(Y) biết Y = 2X2
0 x >1

3.2.2. Tính chất
1) Var(C) = 0 (C là hằng số) 2) Var (CX ) = C 2Var ( X )
3) Var ( X ± Y ) = Var ( X ) + Var (Y ) nếu X, Y độc lập.
3.2.3. Ý nghĩa của phương sai
• ( X − E ( X ))2 là bình phương sai biệt giữa giá trị của X và trung bình của nó. Phương sai là trung bình
của sai biệt này nên phương sai cho biết sự phân tán của các số liệu, phương sai càng nhỏ thì số liệu càng
tập trung quanh giá trị trung bình của chúng.
• Trong kỹ thuật, phương sai đặc trưng cho độ sai số của thiết bị. Trong kinh tế, phương sai đặc trưng cho
độ rủi ro của đầu tư. Trong chăn nuôi, phương sai biểu thị mức độ đồng đều của đàn gia súc còn trong
trồng trọt thì phương sai biểu thị mức độ ổn định của năng suất cây trồng...

Trang 19
Đặng Thục Hiền Bài giảng XS và TK

• Do đơn vị đo của Var(X) bằng bình phương đơn vị đo của X nên để so sánh được với các đặc trưng khác,
người ta dùng tham số độ lệch tiêu chuẩn là σ ( X ) = Var ( X )
Ví dụ: Năng suất của hai máy tương ứng là hai BNN X và Y có bảng phân phối xác suất

X 1 2 3 4 Y 2 3 4 5
P 0,3 0,1 0,5 0,1 P 0,1 0,4 0,4 0,1

Ta tính được E(X) = 2,4; Var(X) = 1,04; E(Y) = 3,5; Var(Y) = 0,65.
Do E(X) < E(Y) và Var(X) > Var(Y) nên nếu phải chọn mua 1 máy thì ta chọn mua máy Y.
 E ( X ) < E (Y )  E ( X ) > E (Y )
Chú ý: Nếu  hoặc  thì ta không so sánh được. Để giải quyết vấn đề
Var ( X ) < Var (Y ) Var ( X ) > Var (Y )
σ
này, trong thực tế người ta dùng tỉ số tương đối 100% ( µ là giá trị trung bình) để so sánh sự ổn định
µ
của các BNN X và Y. Tỉ số tương đối càng nhỏ thì độ ổn định càng cao.
Ví dụ: Điểm thi môn XSTK của 2 lớp A và B là hai BNN X và Y. Có kết quả: E(X) = 6,25; Var(X) = 1,25;
E(Y) = 5,75; Var(Y) = 0,75.
σX σY
Ta có 100% = 17,89%; 100% = 15, 06% . Vậy lớp B học ổn định (học đều) hơn lớp A.
E( X ) E (Y )
3.3. Giá trị tin chắc nhất
3.3.1. Định nghĩa: Giá trị tin chắc nhất của BNN X, ký hiệu là Mod(X) (ModX) là giá trị x0 ∈ X thỏa
mãn
• Nếu X là BNN rời rạc thì P ( X = x0 ) = max P ( X = x) nghĩa là Mod(X) là giá trị của X ứng với xác suất
x∈ X
lớn nhất trong bảng phân phối xác suất.
• Nếu X là BNN liên tục có hàm mật độ f ( x) thì f ( x0 ) = max f ( x) nghĩa là Mod(X) là giá trị của X mà
x∈ X
tại đó hàm mật độ đạt cực đại.
Ví dụ: BNN X có bảng phân phối xác suất như sau
X 7 8 9 10 11 12 14
P 0,1 0,14 0,3 0,24 0,11 0,06 0,05
Mod(X) = 9 vì P ( X = 9) = 0,3 là lớn nhất
VD 19. Tìm Mod(X) biết X có bảng phân phối xác suất
X 1 2 4 5 8
P 1-3p 0,18 0,07 0,25 p
3 2
 x (4 − x) x ∈ [0, 4]
VD 20. Tìm Mod(X) biết X có hàm mật độ f ( x) =  64
0 x ∉ [0, 4]
Chú ý: Một BNN X có thể có nhiều Mod(X)
3.3.2. Ý nghĩa của Mod(X): Mod(X) chính là giá trị có khả năng xảy ra nhiều nhất trong các giá trị mà X
có thể có.
3.4. Các tham số đặc trưng khác (Tham khảo): Trung vị, hệ số đối xứng, hệ số nhọn, mô men.
Trang 20
Đặng Thục Hiền Bài giảng XS và TK

BÀI TẬP CHƯƠNG 2


Bài 1: Một hộp có 3 viên phấn trong đó có 1 viên phấn đỏ. Lấy lần lượt từng viên cho đến khi được viên
đỏ thì dừng. Gọi X là số viên phấn đã lấy được. Tính E(X). ĐS: 2
Bài 2: Có 2 hộp, mỗi hộp có 1 bút xanh và 2 bút đỏ. Lấy ngẫu nhiên mỗi hộp ra 2 bút, gọi X là số bút đỏ
có trong 4 bút. Tính P(X = 3) ĐS: 4/9
Bài 3: Có 3 hộp, mỗi hộp đựng 10 sản phẩm, số phế phẩm có trong mỗi hộp tương ứng là 1,2,3.
a. Lấy ngẫu nhiên từ mỗi hộp ra 1 sản phẩm. Tìm phân phối xác suất của số sản phẩm tốt có trong 3
sản phẩm lấy ra.
b. Chọn ngẫu nhiên một hộp rồi từ hộp đã chọn lấy ngẫu nhiên không hoàn lại ra 3 sản phẩm. Tìm
phân phối xác suất của số phế phẩm có trong 3 sản phẩm lấy ra.
Bài 4: Tuổi thọ của một loại côn trùng là BNN liên tục X (tính bằng tháng) có hàm mật độ
 kx(4 − x) x ∈ [0,3]
f ( x) =  . Tính tỷ lệ côn trùng chết sau 1,5 tháng. ĐS: 62,5%
0 x ∉ [0, 3]
0 x ∉ [1, 2]

Bài 5: Cho BNN X có hàm mật độ f ( x) =  a . Tìm a và tính P (0 < X < 1,5) ĐS: 2/3
 x 2 x ∈ [1, 2]

Bài 6: Thời gian một khách hàng xếp hàng chờ phục vụ là BNN liên tục X có hàm phân phối xác suất
0 x≤0

F ( x) = ax 2 x ∈ (0,3)
1 x≥3

0 x ∉ (0, 3]

a. Tìm a và hàm mật độ của X. ĐS: a = 1 / 9; f ( x) = F '( x) =  2 x
 9 0 < x < 3

b. Tính xác suất để trong 3 người xếp hàng thì có 2 người phải chờ không quá 2 phút.ĐS: 0,3292
Bài 7: Một hộp có 10 sản phẩm. Gọi X là số sản phẩm loại B có trong hộp. Cho biết bảng phân phối xác
suất của X như sau
X 1 2 3
P 0,2 0,5 0,3
Lấy ngẫu nhiên không hoàn lại từ hộp ra 3 sản phẩm. Gọi Y là số sản phẩm loại B có trong 3 sản phẩm lấy
ra.
a. Tìm phân phối xác suất của Y.
b. Tính E(Y) và Var(Y). ĐS: E ( X ) = 0, 63; Var( X ) = 0, 4198
Bài 8: Có 2 kiện hàng, kiện thứ nhất có 12 sản phẩm trong đó có 4 sản phẩm loại A, kiện thứ hai có 8 sản
phẩm trong đó có 3 sản phẩm loại A. Lấy ngẫu nhiên 2 sản phẩm từ kiện thứ nhất bỏ vào kiện thứ hai, sau
đó lấy không hoàn lại từ kiện thứ hai ra 3 sản phẩm. Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy
ra. Tìm E(X), Var(X), Mod(X). ĐS: E ( X ) = 1,1; Var( X ) = 0, 5688; Mod ( X ) = 1
Bài 9: Số liệu thống kê trong 1 năm cho thấy tại một khu vực tỷ lệ tai nạn xe máy là 0,0055 (vụ/tổng số
xe). Một công ty bảo hiểm đề nghị tất cả các chủ xe phải mua bảo hiểm xe máy với số tiền là 30 000đ một
xe và số tiền bảo hiểm trung bình cho 1 vụ tai nạn là 3 000 000đ. Hỏi lợi nhuận công ty kỳ vọng thu được
Trang 21
Đặng Thục Hiền Bài giảng XS và TK

đối với mỗi hợp đồng bảo hiểm là bao nhiêu, biết rằng chi phí quản lý và các chi phí khác chiếm 30% số
tiền bán bảo hiểm? ĐS: E ( X ) = 4500

Chương 3. CÁC QUY LUẬT PHÂN PHỐI XÁC SUẤT


Bài 1. PHÂN PHỐI SIÊU BỘI – PHÂN PHỐI NHỊ THỨC –
PHÂN PHỐI POISSON – PHÂN PHỐI MŨ
1.1. Phân phối siêu bội
1.1.1. Định nghĩa
• Xét tập có N phần tử gồm N A phần tử có tính chất A và N − N A phần tử có tính chất A . Từ tập đó ta
chọn ra n phần tử. Gọi X là số phần tử có tính chất A lẫn trong n phần tử đã chọn thì X gọi là có phân phối
siêu bội, ký hiệu là X ∼ H ( N , N A , n) hay X ∈ H ( N , N A , n) .

CNk A CNn −−kN A


• Xác suất trong n phần tử đã chọn có k phần tử A là Pk = P( X = k ) =
C Nn

Trong đó, 0 ≤ k ≤ n và n − ( N − N A ) ≤ k ≤ N A
VD 1. Một hộp gồm 10 viên phấn trong đó có 7 viên phấn trắng. Lấy ngẫu nhiên 5 viên từ hộp này. Gọi X
là số viên trắng lấy được. Lập bảng phân phối xác suất và tính kỳ vọng của X.
1.1.2. Các tham số đặc trưng
N −n N
Nếu X ∼ H ( N , N A , n) thì E ( X ) = np ; Var ( X ) = npq ; trong đó p = A ; q = 1 − p
N −1 N
VD 2. Một cửa hàng bán 100 bóng đèn trong đó có 12 bóng hỏng. Một người chọn mua ngẫu nhiên 15
bóng đèn từ cửa hàng. Hỏi trung bình người đó mua được bao nhiêu bóng đèn tốt?
VD 3. Tại một công trình có 100 người đang làm việc trong đó có 70 kỹ sư. Chọn ngẫu nhiên 40 người từ
công trình, gọi X là số kỹ sư chọn được
a. Tính xác suất chọn được từ 27 đến 29 kỹ sư.
b. Tính E(X) và Var(X)
Giải: N = 100; N A = 70; n = 40 ⇒ X ∼ H (100, 70, 40)

a. P (27 ≤ X ≤ 29) = P27 + P28 + P29 = 0, 4955


b. p = 0, 7; q = 0,3 . Suy ra E ( X ) = np = 28 và Var ( X ) = 56 / 11 .

1.2. Phân phối nhị thức (Binominal Distribution)


1.2.1. Định nghĩa
• Giả sử tiến hành n phép thử độc lập. Trong mỗi phép thử chỉ có thể xảy ra một trong hai trường hợp:
hoặc biến cố A xảy ra hoặc biến cố A không xảy ra. Xác suất xảy ra biến cố A trong mỗi phép thử bằng p
và xác suất A không xảy ra bằng 1 − p = q . Gọi X là số lần xuất hiện biến cố A trong n phép thử, khi đó X
là BNN rời rạc có thể nhận các giá trị 0, 1, 2,…, n với xác suất tương ứng được tính theo công thức
Bernoulli Pk = P ( X = k ) = Cnk p k q n − k với k = 0, 1, 2,…, n.
BNN X gọi là có phân phối nhị thức với các tham số n và p. Ký hiệu X ∼ B (n, p ) hay X ∈ B (n, p )

Trang 22
Đặng Thục Hiền Bài giảng XS và TK

Ví dụ: Xác suất để một máy sản xuất được sản phẩm loại I là 0,8. Cho máy sản xuất 5 sản phẩm. Gọi X là
số sản phẩm loại I có trong 5 sản phẩm thì X ∼ B (5;0,8) . Các giá trị X có thể nhận là 0, 1, 2, 3, 4, 5 với
các xác suất tương ứng là P ( X = 0) = (0, 2)5 = 0, 00032 ; P ( X = 1) = C51 (0,8)(0, 2) 4 = 0, 0064 ;
P ( X = 2) = 0, 512 ; P ( X = 3) = 0, 2048 ; P ( X = 4) = 0, 4096 ; P ( X = 5) = 0,32768 .
• Trong thực tế, muốn tính xác suất để BNN X có phân phối nhị thức nhận giá trị trong khoảng [k, k+h]
với h nguyên dương và h ≤ n − k thì ta áp dụng công thức P (k ≤ X ≤ k + h) = Pk + Pk +1 + ... + Pk + h , trong đó
các Pk , Pk +1 ,..., Pk + h được tính theo công thức Bernoulli.
Ví dụ: Gieo ngẫu nhiên 20 lần một đồng tiền cân đối đồng chất. Tính xác suất để xuất hiện đúng 1 lần mặt
sấp.
Gọi X là xác suất xuất hiện mặt sấp, xác suất xuất hiện mặt sấp trong mỗi lần gieo là 0,5.
1 5
P ( X = 1) = C20 (0,5)(0,5)19 = 18
2
VD 4. Một phân xưởng có 5 máy hoạt động độc lập. Xác suất để trong một ngày mỗi máy bị hỏng đều
bằng 0,1. Tìm xác suất để
a. Trong một ngày có 2 máy hỏng.
b. Trong một ngày có không quá 2 máy hỏng.
VD 5. Trong một lần thi trắc nghiệm, mỗi thí sinh nhận một đề thi gồm 10 câu hỏi, mỗi câu có 4 cách trả
lời trong đó chỉ có 1 cách trả lời đúng. Kết quả các câu trả lời là độc lập. Điểm bài thi bằng tổng số câu trả
lời đúng.
a. Thí sinh A không thuộc bài và trả lời ngẫu nhiên. Tính xác suất để thí sinh A đạt yêu cầu.
b. Thí sinh B trả lời đúng được 3 câu. Các câu còn lại trả lời ngẫu nhiên. Tìm xác suất để thí sinh B
đạt yêu cầu.
VD 6. Đề thi trắc nghiệm môn XSTK gồm 20 câu hỏi, mỗi câu có 4 cách trả lời trong đó chỉ có 1 cách trả
lời đúng. Kết quả các câu trả lời là độc lập. Sinh viên C làm bài một cách ngẫu nhiên, nếu trả lời đúng 1
câu thì được 0,5 điểm, nếu trả lời sai 1 câu thì bị bị trừ 0,125 điểm. Tính xác suất để sinh viên C đạt điểm
5.
Giải:
Gọi X là số câu trả lời đúng sv C đã làm và x là số câu trả lời đúng để sv C đạt 5 điểm.
Ta có: 0,5 x − 0,125(20 − x) = 5 ⇒ x = 12 . Do X ∼ B (20;0, 25) ⇒ P ( X = 12) = 0, 0008
1.2.2. Các tham số đặc trưng
• Nếu X ∼ B (n, p ) thì E ( X ) = np ; Var ( X ) = npq ; Mod ( X ) = x0 ∈ ℕ : np − q ≤ x0 ≤ np − q + 1
VD 7. Ông A trồng 100 cây bạch đàn với xác suất cây chết là 0,02. Gọi X là số cây bạch đàn chết.
a. Tìm xác suất có từ 3 đến 5 cây bạch đàn chết.
b. Tính trung bình số cây bạch đàn chết và Var(X).
c. Ông A cần phải trồng tối thiểu bao nhiêu cây để xác suất có ít nhất 1 cây chết lớn hơn 50%?
VD 8. Một nhà vườn trồng 126 cây hoa lan, xác suất nở hoa của mỗi cây trong 1 năm là 0,67.
a. Giá bán 1 cây lan nở hoa là 2 triệu đồng. Giả sử nhà vườn bán hết những cây lan nở hoa thì mỗi
năm nhà vườn thu được chắc chắn nhất là bao nhiêu tiền?
b. Nếu muốn trung bình mỗi năm có nhiều hơn 100 cây lan nở hoa thì nhà vườn phải trồng tối thiểu
mấy cây lan?

Trang 23
Đặng Thục Hiền Bài giảng XS và TK

VD 9. Có 10 hộp phấn màu giống nhau, mỗi hộp chứa 20 viên phấn gồm hai loại: 3 hộp loại I, mỗi hộp có
12 viên phấn đỏ; 7 hộp loại II, mỗi hộp có 8 viên phấn đỏ. Chọn ngẫu nhiên 1 hộp và từ hộp đó lấy lần
lượt ra 5 viên phấn (lấy viên nào xong thì trả lại vào hộp). Tính xác suất chọn được 3 viên phấn đỏ.
Giải: Gọi X là số viên phấn đỏ chọn được X = {0,1, 2,3, 4,5}

Nếu chọn hộp loại 1 thì p = 0, 6 ⇒ X ∼ B (5; 0, 6) ⇒ P ( X = 3) = 0,3456


Nếu chọn hộp loại 2 thì p = 0, 4 ⇒ X ∼ B (5; 0, 4) ⇒ P ( X = 3) = 0, 2304
3 7
Vậy P ( X = 3) = .0,3456 + .0, 2304 = 0, 265 .
10 10
VD 10. Một lô hàng chứa 20 sản phẩm trong đó có 4 phế phẩm. Chọn liên tiếp 3 lần từ lô hàng (mỗi lần
chọn có hoàn lại), mỗi lần chọn ra 4 sản phẩm. Tính xác suất để trong 3 lần chọn có ít nhất 1 lần chọn phải
2 phế phẩm?
Giải: Gọi X là số lần chọn phải 2 phế phẩm trong 3 lần chọn và p là xác suất chọn phải 2 phế phẩm trong
mỗi lần chọn. Do chọn có hoàn lại nên p không đổi.
C42 .C162
⇒ X ∼ B (3, p ); p = 4
= 0,1486 ⇒ P ( X ≥ 1) = 1 − P0 = 1 − C30 (0,1486)0 (0,8514)3 = 0,3828 .
C20
N
Chú ý: Cho X ∼ H ( N , N A , n) . Nếu N khá lớn và n rất nhỏ so với N thì X ∼ B (n, p ) và p = A
N
VD 11. Trong kho, người ta để lẫn 500 sản phẩm loại A với 1500 sản phẩm loại B. Lấy ngẫu nhiên ra 40
sản phẩm trong kho, tính xác suất chọn được 30 sản phẩm loại B.
VD 12. Một vườn lan có 10.000 cây sắp nở hoa, trong đó có 1.000 cây hoa màu đỏ.
a. Tính xác suất để khi chọn ngẫu nhiên 50 cây lan thì được 10 cây màu đỏ.
b. Có thể tính xác suất để khi chọn ngẫu nhiên 300 cây lan thì có 45 cây hoa màu đỏ được không?
1.3. Phân phối Poisson (Poisson Distribution)
1.3.1. Định nghĩa
• Cho X có phân phối nhị thức. Trường hợp n đủ lớn và p gần bằng 0 hoặc gần bằng 1 và tích np = λ
không đổi (thường gặp là np ≤ 5 hay nq ≤ 5 ) thì ta có công thức xấp xỉ
λk
Pk = P ( X = k ) = Cnk p k q n − k ≈ e − λ . Khi đó, X gọi là có phân phối Poisson với tham số λ . Ký hiệu
k!
X ∼ P (λ ) hay X ∈ P (λ )
• Nếu X có phân phối Poisson với tham số λ thì xác suất để X nhận giá trị trong khoảng [k, k+h] với k và
h là số nguyên dương tùy ý được tính theo công thức P (k ≤ X ≤ k + h) = Pk + Pk +1 + ... + Pk + h , trong đó các
Pk , Pk +1 ,..., Pk + h được tính theo công thức xấp xỉ nói trên.
1.3.2. Các tham số đặc trưng
Cho X có phân phối Poisson thì E ( X ) = Var ( X ) = λ ; Mod ( X ) = x0 ∈ ℕ : λ − 1 ≤ x0 ≤ λ
Ví dụ: Xác suất một chai rượu bị vỡ khi vận chuyển là 0,001. Giả sử vận chuyển 4000 chai. Tìm số chai
rượu bị vỡ trung bình và số chai bị vỡ tin chắc nhất khi vận chuyển.
np = 4 nên E(X) = 4; 3 ≤ Mod ( X ) ≤ 4 nên Mod(X) = 3 hoặc Mod (X) = 4.
1.3.3. Định lý giới hạn Poisson
Định lý: Thực hiện n phép thử độc lập. Nếu trong mỗi phép thử, biến cố A xuất hiện với xác suất p (p quá
λk
gần 0 hoặc quá gần 1) sao cho np = λ không đổi thì lim Pk = e− λ
n →+∞ k!
Trang 24
Đặng Thục Hiền Bài giảng XS và TK

VD 13. Một máy dệt có 500 ống sợi. Xác suất một ống bị đứt trong 1 giờ máy làm việc là 0,004. Tìm xác
suất để trong 1 giờ không có quá 2 ống bị đứt.
VD 14. Quan sát tại siêu thị A thấy trung bình 5 phút có 18 khách đến mua hàng.
a. Tính xác suất để trong 7 phút có 25 khách đến siêu thị A.
b. Tính xác suất để trong 2 phút có từ 3 đến 5 khách đến siêu thị A.
c. Tính số khách chắc chắn nhất sẽ đến siêu thị A trong 1 giờ.
VD 15. Cứ mỗi lần đi câu cá thì ông A chọn ngẫu nhiên 1 trong 2 nơi để câu. Nếu đi câu ở địa điểm I thì
trung bình cứ 10 lần móc mồi, ông A câu được 2 con cá; câu ở địa điểm II thì trung bình cứ 12 lần móc
mồi, ông A câu được 3 con cá. Hôm nay ông A đi câu, ông đã móc mồi 20 lần và câu được 5 con cá. Tính
xác suất ông A câu được 5 con cá ở địa điểm II ?
Giải: Gọi X là số con cá ông A câu được.
45 −4
Chọn địa điểm thứ nhất: X ∼ P (4) ⇒ P5 = e = 0,1563
5!
55 −5
Chọn địa điểm thứ hai: X ∼ P (5) ⇒ P5 = e = 0,1755
5!
0,5.0,1755
Vậy P ( II X = 5) = = 0, 5289
0,5.(0,1563 + 0,1755)
VD 16. Một lô hàng thịt đông lạnh đóng gói nhập khẩu có chứa 3% bị nhiễm khuẩn. Tìm xác suất để khi
chọn ngẫu nhiên 2.000 gói thịt từ lô hàng này có từ 40 đến 42 gói bị nhiễm khuẩn ?
VD 17. Một vườn lan có 10.000 cây sắp nở hoa, trong đó có 1.000 cây hoa màu đỏ. Có thể tính xác suất
để khi chọn ngẫu nhiên 300 cây lan thì có 45 cây hoa màu đỏ được không?
1.4. Phân phối mũ (Exponential Distribution)
1.4.1. Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là có phân phối mũ, ký hiệu X ∼ E (λ ) nếu hàm
λ e − λ , x ≥ 0 1
mật độ của nó có dạng f ( x) =  , trong đó λ là một hằng số dương và λ = .
0, x<0 E( X )
1.4.2. Các tham số đặc trưng
1 1
Nếu X ∼ E (λ ) thì E ( X ) = , Var( X ) =
λ λ2
Ví dụ: Biết thời gian hoạt động của một bóng đèn điện tử là BNN có phân phối mũ. Tính xác suất sao cho
thời gian hoạt động của bóng đèn không dưới 600 giờ nếu thời gian hoạt động trung bình của mỗi bóng là
400 giờ.
Xác suất cần tìm là P ( X ≥ 600) = 1 − P ( X < 600) = 1 − F (600)
600
 −
1
600  −1,5
= 1− ∫0
λ e− λ x dx = 1 − 1 − e

400
 = e ≈ 0, 2231 .

1.5. Phân phối đều (Uniform Distribution)
1.5.1. Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a,b], ký hiệu là
 1
 , x ∈ [a, b]
X ∼ U (a, b) nếu hàm mật độ của nó có dạng f ( x) =  b − a
0, x ∉ [a, b]

Trang 25
Đặng Thục Hiền Bài giảng XS và TK

β
β −α
Nếu [α , β ] ⊆ [ a, b] thì P (α ≤ X ≤ β ) = ∫α f ( x)dx = b − a
1.5.2. Các tham số đặc trưng
a+b (b − a ) 2
Nếu X ∼ U (a, b) thì E ( X ) = , Var( X ) =
2 12
Ví dụ: Một loại sản phẩm do một nhà máy sản xuất được đóng thành từng hộp (đơn vị tính là kg). Trọng
lượng của hộp là BNN X, biết X ∼ U (1,9; 2,1) . Tính trọng lượng trung bình của một hộp và tỷ lệ hộp có
trọng lượng từ 1,95kg trở lên.
1, 9 + 2,1
Trọng lượng trung bình của một hộp là E ( X ) = = 2 kg.
2
2,1 − 1, 95
Tỷ lệ hộp có trọng lượng từ 1,95kg trở lên là P ( X ≥ 1, 95) = P (1, 95 ≤ X ≤ 2,1) = = 0, 75
2,1 − 1,9

Bài 2. PHÂN PHỐI CHUẨN


2.1. Phân phối chuẩn (Normal Distribution)
2.1.1. Định nghĩa
Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với hai tham số µ và σ 2 (σ > 0) , ký hiệu là
( x − µ )2
1 −
2σ 2
X ∼ N ( µ , σ ) hay X ∈ N ( µ , σ ) nếu hàm mật độ của nó có dạng f ( x) =
2 2
e , x∈ℝ
σ 2π
Chú ý: Đồ thị của hàm f ( x) có dạng hình chuông, đối xứng qua đường thẳng x = µ , có 2 điểm uốn
 1   1   1 
M1  µ − σ , ; M2  µ +σ ,  và đạt cực đại tại điểm  µ, 
 σ 2π e   σ 2π e   σ 2π 
2.1.2. Các tham số đặc trưng
Mod ( X ) = E ( X ) = µ ; Var ( X ) = σ 2
b b ( x − µ )2
1 −
2.1.3. Xác suất: P (a ≤ X ≤ b) = ∫ f ( x)dx = ∫e 2σ 2
dx
a σ 2π a

b−µ
σ z2
x−µ 1 −
Nhận xét: Đổi biến z =
σ
thì P (a ≤ X ≤ b) =


a−µ
e 2
dz
σ

2.2. Phân phối chuẩn tắc


2.2.1. Định nghĩa: Biến ngẫu nhiên Z có phân phối chuẩn với µ = 0 và σ 2 = 1 được gọi là có phân phối
chuẩn tắc, ký hiệu là Z ∼ N (0,1) hay Z ∈ N (0,1) .
2
1 − z2
Hàm mật độ xác suất của Z là f ( z ) = e , z ∈ ℝ . f ( z ) còn được gọi là hàm Gauss, f ( z ) là hàm

chẵn và giá trị của nó đã được tính sẵn ứng với 0 ≤ z ≤ 3,9 . Với những z > 3,9 thì ta coi f ( z ) = f (3, 9) .
2.2.2. Xác suất
Trang 26
Đặng Thục Hiền Bài giảng XS và TK

2.2.2.1. Hàm Laplace


x x t2
1 −
Hàm số ϕ ( x) = ∫ f ( z )dz = ∫e 2
dt được gọi là hàm Laplace.
0 2π 0

2.2.2.2. Tính chất hàm Laplace


Hàm ϕ ( x) đồng biến trên ℝ .
ϕ ( x) là hàm lẻ.
ϕ (−∞) = −0, 5; ϕ (+∞) = 0,5
Các giá trị của ϕ ( x) đã được tính sẵn
β

2.2.2.3. Công thức tính xác suất: P(α ≤ Z ≤ β ) = ∫ f ( z )dz = ϕ ( β ) − ϕ (α )


α

Chú ý
P ( Z < β ) = 0,5 + ϕ ( β ); P ( Z > α ) = 0,5 − ϕ (α ) .
Nếu x ≥ 4 thì ϕ ( x) ≈ 0, 5 .
X −µ
Nếu X ∼ N ( µ , σ 2 ) thì Z = ∼ N (0,1)
σ
b−µ  a−µ 
Vậy, công thức tính xác suất của phân phối chuẩn là P (a ≤ X ≤ b) = ϕ   −ϕ  
 σ   σ 
VD 1. Thời gian X (tháng) đạt chuẩn chiều cao của loại cây giống A tại một vườn ươm là biến ngẫu nhiên
có phân phối N(8,3). Tỉ lệ (xác suất) đạt chuẩn chiều cao của loại cây giống A tại vườn ươm này trong
khoảng từ 6 tháng đến 8,2 tháng là:
a. 27,65% b. 31,15% c. 42,27% d. 45,78%.
VD 2. Một kỳ thi đầu vào ở trường chuyên A quy định điểm đỗ là tổng số điểm các môn thi không được
thấp hơn 15 điểm. Giả sử tổng điểm các môn thi của học sinh là biến ngẫu nhiên có phân phối chuẩn với
trung bình 12 điểm. Biết rằng tỉ lệ học sinh thi đỗ là 25,14%. Độ lệch chuẩn là:
a. 4 điểm b. 4,5 điểm c. 5 điểm d. 5,5 điểm.
VD 3. Tốc độ chuyển dữ liệu từ máy chủ của ký túc xá đến máy tính của sinh viên vào buổi sáng chủ nhât
có phân phối chuẩn với trung bình 60Kbits/s và độ lệch chuẩn 4Kbits/s. Xác suất để tốc độ chuyển dữ liệu
lớn hơn 63Kbits/s là
a. 0,2266 b. 0,2144 c. 0,1313 d. 0,1060.
VD 4. Cho BNN X có phân phối chuẩn với E(X) = 10, P(10 < X < 20) = 0,3 . Tính P(0 < X < 15).
VD 5. Thời gian khách phải chờ để được phục vụ tại một cửa hàng là BNN X (phút), X ∼ N (4,5; 1, 21) .
a. Tính xác suất khách phải chờ từ 3,5 phút đến 5 phút.
b. Tính thời gian tối thiểu t nếu xác suất khách phải chờ vượt quá t là không quá 5%.
Giải: µ = 4,5; σ = 1,1

 5 − 4, 5   3,5 − 4,5 
a. P (3, 5 ≤ X ≤ 5) = ϕ   −ϕ   = ϕ ( 0, 45 ) − ϕ ( 0, 91) = 0, 4922
 1,1   1,1 

Trang 27
Đặng Thục Hiền Bài giảng XS và TK

 t − 4,5 
b. P ( X > t ) ≤ 0, 05 ⇒ 0, 5 − ϕ   ≤ 0, 05 ⇒ t ≥ 6, 315 .
 1,1 
Vậy, thời gian tối thiểu là 6,315 phút
VD 6. Tuổi thọ của 1 loại máy lạnh A là BNN X (năm) có phân phối N(10; 6,25). Khi bán 1 máy lạnh A
thì lãi được 1,4 triệu đồng nhưng nếu máy lạnh phải bảo hành thì lỗ 3,8 triệu đồng. Vậy để có tiền lãi
trung bình khi bán mỗi máy lạnh loại này là 1 triệu đồng thì cần phải quy định thời gian bảo hành là bao
nhiêu ?
α 
Hệ quả: Giả sử X ∼ N ( µ , σ 2 ) thì P ( X − µ < α ) = 2ϕ  
σ 
Ví dụ: Người ta tiện một loại chi tiết máy có độ dài quy định là 20cm. Biết độ dài X của chi tiết máy là
BNN có phân phối chuẩn với độ lệch chuẩn bằng 0,2cm.
a. Tính xác suất để chi tiết được sản xuất ra có độ dài lệch với độ dài quy định (dung sai) không quá
0,3cm.
b. Để tỷ lệ phế phẩm không quá 5% thì dung sai phải bằng bao nhiêu ?
 0, 3 
Giải: a. P ( X − 20 < 0, 3) = 2ϕ   = 2ϕ (1, 5 ) = 2.0, 4332 = 0,8664 . Như vậy, tỷ lệ phế phẩm là 13%
 0, 2 
nếu dung sai là 0.3cm.
b. Cần tìm dung sai α sao cho
 α   α  α
P ( X − 20 < α ) = 2ϕ   ≥ 0,95 ⇒ ϕ   ≥ 0, 475 ⇒ ≥ 1,96 ⇒ α ≥ 0, 392
 0, 2   0, 2  0, 2

2.3. Định lý Moivre – Laplace


Khi n lớn và p không quá gần 0 và không quá gần 1 thì BNN X ∼ B (n, p ) có thể coi như xấp xỉ phân phối
chuẩn với kỳ vọng µ = np và phương sai σ 2 = npq .
2.3.1. Định lý 1: Thực hiện n phép thử độc lập. Nếu trong mỗi phép thử, biến cố A xuất hiện với xác suất
p (p không quá gần 0 và không quá gần 1) thì
 
2
( k − np )
1 −
lim  Pk − e 2 npq  = 0 với q = 1 − p .
n →+∞
 2π npq 
2
1 1 − x2 k − np
Như vậy, với n khá lớn thì Pk ≈ f ( x0 ) . Trong đó, f ( x) = e là hàm Gauss, x0 = .
npq 2π npq
Ví dụ: Tính xác suất để trong 400 phép thử độc lập, biến cố A xuất hiện 80 lần biết xác suất xuất hiện A
trong mỗi phép thử là 0,2.

1  80 − 400.0, 2  1 1
P80 = f = f ( 0) = .0,3989 ≈ 0, 05
400.0, 2.0.8  400.0, 2.0.8  400.0, 2.0.8 400.0, 2.0.8
4.1.2. Định lý 2: Thực hiện n phép thử độc lập. Nếu trong mỗi phép thử, biến cố A xuất hiện với xác suất
p (p không quá gần 0 và không quá gần 1) thì
 1
x2
− 
t2
k − np
lim  Pk −
n →+∞ 2π
∫x e dt  = 0 trong đó 0 ≤ k1 ≤ k ≤ k2 ≤ n, xi = i
2

npq
i = 1, 2 .
 1 

Trang 28
Đặng Thục Hiền Bài giảng XS và TK

x2 t2
1 −
Như vậy, với n khá lớn thì Pk ≈

∫e
x1
2
dt = ϕ ( x2 ) − ϕ ( x1 ) . Trong đó, ϕ ( x) là hàm Laplace.

Ví dụ: Xác suất bắn trúng đích của một xạ thủ là 0,75. Tính xác suất để trong 100 phát có ít nhất 81 phát
trúng đích.
81 − 100.0, 75 100 − 100.0, 75
Có x1 = ≈ 1,38 ; x2 = ≈ 5, 77 .
100.0, 75.0, 25 100.0, 75.0, 25
Vậy Pk = ϕ ( x2 ) − ϕ ( x1 ) = 0, 5 − 0, 4162 = 0, 0838
VD 7. Xác suất để một máy sản xuất được sản phẩm loại A là 0,8. Tìm xác suất để trong 400 sản phẩm do
máy sản xuất ra có
a. 336 sản phẩm loại A.
b. Có từ 304 đến 328 sản phẩm loại A.
VD 8. Người ta đã phát ra 480 giấy mời dự hội nghị khách hàng. Biết sức chứa của khán phòng là 400 và
thường chỉ có 80% khách hàng đến dự. Tinh xác suất để tất cả các khách hàng đến dự đều có chỗ ngồi.

Bài 3. PHÂN PHỐI "KHI - BÌNH PHƯƠNG" VÀ PHÂN PHỐI STUDENT


3.1. Phân phối "khi – bình phương"
3.1.1. Định nghĩa
n
• Giả sử X i (i = 1, 2,..., n) là các BNN độc lập, có phân phối chuẩn tắc. Khi đó, BNN χ 2 = ∑ X i2 có phân
i =1

phối "khi – bình phương" (Chi – Square Distribution) với n bậc tự do, ký hiệu là χ ∼ χ (n) . 2 2

 − x /2 n2 −1
e x x>0

• Hàm mật độ của BNN χ 2 có dạng f n ( x) =  2 n / 2 Γ  n 
 2
0 x≤0

+∞

∫t
x −1 − t
trong đó hàm gama Γ( x) = e dt
0

• Ký hiệu χα2 là giá trị của BNN χ 2 có phân phối "khi – bình phương" với n bậc tự do thỏa mãn điều kiện
P ( χ 2 > χα2 ) = α . Các giá trị của χα2 đã được tính sẵn.
3.1.2. Các tham số đặc trưng
Nếu χ 2 ∼ χ 2 (n) thì E ( χ 2 ) = n; Var ( χ 2 ) = 2n
Chú ý: Khi số bậc tự do đủ lớn, phân phối "khi – bình phương" sẽ xấp xỉ phân phối chuẩn.
3.2. Phân phối Student
3.2.1. Định nghĩa
Z
• Giả sử Z ∼ N (0,1) , V là BNN độc lập với Z và V ∼ χ 2 (n) . Khi đó, BNN T = có phân phối
V /n
Student với n bậc tự do, ký hiệu là T ∼ T (n)

Trang 29
Đặng Thục Hiền Bài giảng XS và TK

n +1

 n +1 t 
2 2
Γ 1 + 
 2  n
• Hàm mật độ xác suất của T có dạng f n (t ) = − ∞ < t < +∞
n
Γ   nπ
2
• Ký hiệu tα là giá trị của BNN T ∼ T (n) thỏa mãn điều kiện tα > 0 và P (T > tα ) = α . Các giá trị của tα
đã được tính sẵn.
3.2.2. Các tham số đặc trưng
n
Nếu T ∼ T (n) thì E (T ) = 0; Var (T ) =
n−2
Chú ý: Khi số bậc tự do đủ lớn ( n > 30 ) ta có thể dùng phân phối chuẩn tắc thay cho phân phối Student.

BÀI TẬP CHƯƠNG 3


Bài 1. Trong một đợt thi tay nghề, mỗi công nhân dự thi sẽ chọn ngẫu nhiên một trong hai máy và dùng
máy đã chọn để sản xuất 100 sản phẩm. Nếu có từ 80 sản phẩm loại I trở lên thì được nâng bậc thợ. Giả sử
đối với công nhân A, xác suất để sản xuất được sản phẩm loại I của 2 máy tương ứng là 0,7 và 0,9. Tính
xác suất để công nhân A được nâng bậc thợ. ĐS: 0,5069
Bài 2. Một nhà máy có 3 phân xưởng cùng sản xuất ra một loại sản phẩm. Tỷ lệ sản phẩm loại II của các
phân xưởng tương ứng là 10%, 20%, 30%. Từ một lô hàng gồm 10000 sản phẩm, trong đó có 3000 sản
phẩm của phân xưởng 1, 4000 của phân xưởng 2 và 3000 của phân xưởng 3 người ta chọn ngẫu nhiên ra
100 sản phẩm để kiểm tra, nếu thấy có không quá 24 sản phẩm loại II thì mua lô hàng đó. Tính xác suất để
lô hàng được mua. ĐS: 0,8413
Bài 3. Trọng lượng của gà con do một nông trại chăn nuôi là BNN có phân phối chuẩn với kỳ vọng là
250gr và phương sai là 25. Gà con là gà loại 1 nếu trọng lượng của nó lớn hơn 245gr. Tính tỷ lệ gà loại 1
của nông trại này. ĐS: 0,8413
Bài 4: Tại một xưởng dệt, trung bình dệt 10 m vải loại B thì bị lỗi 13 chỗ. Chọn lần lượt 5 xấp vải loại B
của xưởng, mỗi xấp dài 6 m. Tính xác suất để 3 trong 5 xấp vải ấy, mỗi xấp vải có đúng 7 chỗ bị lỗi.
ĐS: 0,0214
Bài 5. Một trung tâm bưu điện nhận được trung bình 150 cuộc gọi điện thoại trong 1 giờ. Tìm xác suất để
trung tâm bưu điện này nhận được không quá 2 cuộc gọi trong 1 phút. ĐS: 0,5438
Bài 6. Quan sát thấy trung bình 2 phút có 6 ôtô đi qua trạm thu phí. Biết xác suất có ít nhất 1 ôtô đi qua
trạm thu phí trong t phút bằng 0,9. Giá trị của t (phút) là
a. 0,9082 b. 0,8591 c. 0,8514 d. 0,7675. ĐS: d
Bài 7. Quan sát thấy trung bình 1 ngày (24 giờ) có 12 chuyến tàu vào cảng A. Chọn ngẫu nhiên 6 giờ
trong 1 ngày. Tính xác suất để 2 trong 6 giờ ấy, mỗi giờ có đúng 1 tàu vào cảng A. ĐS: 0,3251
Bài 8. Hai cầu thủ bóng rổ, mỗi người ném bóng 3 lần. Xác suất ném trúng rổ trong mỗi lần ném của cầu
thủ thứ nhất là 0,7 ; với cầu thủ thứ hai là 0,8. Tính xác suất để
a. Số lần trúng rổ của hai cầu thủ bằng nhau. ĐS: 0,3633
b. Số lần trúng rổ của cầu thủ thứ nhất nhiều hơn. ĐS: 0,2148
Bài 9. Một kho chứa 10000 sản phẩm trong đó có 2000 sản phẩm không được kiểm tra chất lượng. Chọn
ngẫu nhiên từ kho ra 400 sản phẩm. Tính xác suất để trong 400 sản phẩm đó
a. Có 80 sản phẩm không được kiểm tra. ĐS: 0,05

Trang 30
Đặng Thục Hiền Bài giảng XS và TK

b. Có từ 70 đến 100 sản phẩm không được kiểm tra. ĐS: 0,8882
Bài 10. Một khách sạn nhận đặt chỗ của 325 khách hàng cho 300 phòng vào ngày 1/1 vì theo kinh nghiệm
những năm trước cho thấy có 10% khách đặt chỗ nhưng không đến. Biết mỗi khách đặt 1 phòng. Tính xác
suất
a. Có 300 khách đến và nhận phòng. ĐS: 0,0281
b. Tất cả các khách đến đều được nhận phòng. ĐS: 0,9177
Bài 11. Một khách hàng chọn ngẫu nhiên 1000 con trong 20000 con cá da trơn trong đó để lẫn 4000 con
cá tra. Tính xác suất khách hàng chọn được từ 182 đến 230 con cá tra.
a. 0,8143 b. 0,9133 c. 0,9424 d. 0,9765 ĐS: b
Bài 12. Một công nhân đứng máy xe sợi gồm 400 ống sợi. Xác suất mỗi ống bị đứt trong vòng một giờ là
0,005. Tính xác suất để trong vòng một giờ có 40 ống bị đứt. ĐS:
Bài 13. Cắt một loại chi tiết máy có độ dài qui định là 1,2m. Biết độ dài của chi tiết này được sản xuất ra
tuân theo luật phân phối chuẩn với độ lệch chuẩn là σ = 5cm. Nếu muốn đảm bảo tỷ lệ sản phẩm đạt yêu
cầu là từ 80% trở lên thì độ lệch giữa độ dài chi tiết sản xuất với độ dài qui định phải bằng bao nhiêu?
ĐS: 6,45cm
Bài 14. Độ dài một chi tiết máy tuân theo luật phân phối chuẩn với giá trị trung bình 20cm và độ lệch
chuẩn là 0,5. Hãy tính xác suất khi chọn ngẫu nhiên ra một chi tiết thì độ dài của nó lớn hơn 20cm.
ĐS: 0,5
Bài 15. Cắt một loại chi tiết máy có độ dài qui định là 1,2m. Biết độ dài của chi tiết này được sản xuất ra
tuân theo luật phân phối chuẩn với độ lệch chuẩn là σ = 5cm. Tính xác suất để độ dài chi tiết sản xuất ra
lệch với độ dài qui định không quá 4cm. ĐS: 0,5762
Bài 16. Độ dài một chi tiết máy tuân theo luật phân phối chuẩn với giá trị trung bình 20cm và độ lệch
chuẩn là 0,5. Hãy tính xác suất khi chọn ngẫu nhiên ra một chi tiết thì độ dài của nó bé hơn 19,5cm.
ĐS: 0,1587
Bài 17. Trọng lượng của một loại sản phẩm X có phân phối chuẩn với kỳ vọng là a = 10kg, độ lệch là
σ = 0,5 . Tính tỷ lệ sản phẩm có trọng lượng từ 9,5kg đến 11 kg. ĐS: 0,8185

PHẦN II. LÝ THUYẾT THỐNG KÊ TOÁN


Chương 4. MẪU THỐNG KÊ VÀ ƯỚC LƯỢNG THAM SỐ
Bài 1. LÝ THUYẾT MẪU
1.1. Tổng thể và mẫu
1.1.1. Tổng thể
• Tập hợp tất cả các đối tượng mà ta nghiên cứu được gọi là tổng thể. Số phần tử của tổng thể được gọi là
kích thước của tổng thể. Kích thước thường rất lớn và phụ thuộc vào vấn đề và phạm vi nghiên cứu.
• Dấu hiệu cần khảo sát là một hoặc nhiều đặc tính của các phần tử trong tổng thể. Khi nói nghiên cứu một
tổng thể có nghĩa là nghiên cứu dấu hiệu được thể hiện trên các phần tử của tổng thể. Các phần tử của
tổng thể là các đối tượng mang thông tin.
• Các đặc trưng của tổng thể là: trung bình ( µ ), phương sai ( σ 2 ), độ lệch chuẩn ( σ ), tỷ lệ ( p )
1.1.2. Mẫu
• Từ tổng thể, ta chọn ra n phần tử thì n phần tử đó được gọi là một mẫu có kích thước n (cỡ mẫu).
Trang 31
Đặng Thục Hiền Bài giảng XS và TK

• Mẫu được chọn ngẫu nhiên một cách khách quan gọi là mẫu ngẫu nhiên. Giá trị của mẫu ngẫu nhiên
được gọi là mẫu cụ thể. Quan hệ giữa mẫu ngẫu nhiên và mẫu cụ thể tương tự như quan hệ giữa biến ngẫu
nhiên và một giá trị có thể có của nó.
VD: Một công ty cao su có 500 000 công nhân (tổng thể), gọi X là thu nhập của công nhân trong công ty
(dấu hiệu cần khảo sát); lấy ngẫu nhiên 500 công nhân để khảo sát (mẫu ngẫu nhiên, cỡ mẫu là 500) thì
thu được số liệu ở bảng sau (mẫu cụ thể)
xi (tr đồng) 2,5 3,5 4,5 5,5 6,5 7,5 8,5

ni (người) 50 75 105 160 60 40 10

Nếu lấy ngẫu nhiên 500 công nhân khác thì có mẫu cụ thể (bảng giá trị) khác
• Có hai cách lấy mẫu ngẫu nhiên, lấy có hoàn lại và lấy không hoàn lại. Khi kích thước mẫu lớn thì
không phân biệt mẫu có hoàn lại hay không.
• Có hai loại mẫu: Mẫu định tính là mẫu lấy ra để quan sát một tính chất A nào đấy có trong các phần tử
của mẫu hay không; mẫu định lượng là mẫu lấy ra để quan sát các yếu tố về lượng (chiều dài, cân nặng,
năng suất...) của các phần tử có trong mẫu.
• Gọi X 1 , X 2 ,..., X n là những kết quả quan sát. Ta xem như đã quan sát n lần, mỗi lần ta được một biến
ngẫu nhiên X i (i = 1, 2,..., n) . X 1 , X 2 ,..., X n được xem là độc lập và có cùng phân phối xác suất.

1.2. Sắp xếp mẫu dựa vào số liệu thực nghiệm


1.2.1. Sắp xếp theo dạng bảng
Ví dụ: Điều tra thu nhập của 500 công nhân, kết quả cho ở bảng sau
X – Thu nhập (tr 3,5 4,5 5,5 6,5 7,5 8,5 9,5
đồng)
n – Số người 50 75 105 160 60 40 10

1.2.1. Sắp xếp theo dạng khoảng


Ví dụ: Khảo sát điểm trung bình cả năm của sinh viên trong trường, kết quả cho ở bảng sau
X – Điểm 0-4 4-6 6-8 8-9 9-10
n – Số người 500 1200 1000 200 100
Khi cần tính toán, người ta lấy số trung bình của mỗi khoảng để sắp xếp số liệu theo dạng bảng.
X – Điểm 2 5 7 8,5 9,5
n – Số người 500 1200 1000 200 100
Chú ý: Trường hợp số liệu được cho dưới dạng liệt kê thì ta sắp xếp lại theo dạng bảng.
1.3. Các đặc trưng mẫu: Xét mẫu ngẫu nhiên X 1 , X 2 ,..., X n , các đặc trưng của mẫu bao gồm
1.3.1. Trung bình mẫu
1 n
X = Xn = ∑ Xi
n i =1
1.3.2. Phương sai mẫu – Độ lệch chuẩn mẫu
• Phương sai mẫu

Trang 32
Đặng Thục Hiền Bài giảng XS và TK

2
1 n
( )
2 2
Sɵ = Sɵ n = ∑ X i − X
n i =1
• Phương sai mẫu hiệu chỉnh
2
1 n
2
S =S = 2
n ∑ Xi − X
n − 1 i =1
( )
• Trong tính toán, ta dùng công thức

S2 =
n
(
n −1
X2 − X ( ) ) = n n− 1 Sɵ
2 2
trong đó X 2 =
1 n 2
∑ Xi
n i =1

1  n 2  n ɵ2
( )
2
Hay S 2 = ∑ Xi − n X
n − 1  i =1  = n −1 S

• Độ lệch chuẩn

S = S2
1.3.3. Tỷ lệ mẫu
0 Nếu phần tử không có tính chất A
Xét mẫu định tính với các BNN X i (i = 1, 2,..., n) có phân phối X i = 
1 Nếu phần tử có tính chất A
m
Nếu mẫu có m phần tử có tính chất A thì tỷ lệ mẫu là F = Fn =
n
Chú ý: Các đặc trưng mẫu X , S 2 , F dùng để nghiên cứu các đặc trưng µ , σ 2 , p của tổng thể. Người ta
chứng minh được rằng F → p, X → µ , S 2 → σ 2 (theo xác suất)

Nếu có mẫu cụ thể, ta tính được một giá trị của X , ,Sɵ , S , F , ký hiệu là x, sɵ , s, f
Ví dụ: Điều tra năng suất của 100 hecta lúa trong một vùng, ta thu được số liệu ở bảng sau
Năng suất (tấn/ha) 3 - 3,5 3,5 - 4 4 - 4,5 4,5 - 5 5 - 5,5 5,5 - 6 6 - 6,5 6,5 - 7
Diện tích 7 12 18 27 20 8 5 3
Những thửa ruộng có năng suất thấp hơn 4,4 tấn/ha gọi là có năng suất thấp. Hãy tính
a. Tỷ lệ diện tích lúa có năng suất thấp.
b. Năng suất lúa trung bình, phương sai chưa hiệu chỉnh và độ lệch chuẩn mẫu có hiệu chỉnh.
Bảng số liệu được viết lại
Năng suất (tấn/ha) 3,25 3,75 4,25 4,75 5,25 5,75 6,25 6,75
Diện tích 7 12 18 27 20 8 5 3
m 7 + 12 + 18
a. f = = = 37%
n 100
2
b. x = 4, 75; sɵ = 0, 685; s = 0,8318

Trang 33
Đặng Thục Hiền Bài giảng XS và TK

Bài 2. ƯỚC LƯỢNG THAM SỐ


2.1. Khái niệm về ước lượng
• Ước lượng là phỏng đoán một giá trị chưa biết của tổng thể dựa vào quan sát trên mẫu lấy ra từ tổng thể
đó. Thông thường, ta cần ước lượng giá trị trung bình, tỷ lệ, phương sai và hệ số tương quan của tổng thể.
• Có hai hình thức ước lượng
Ước lượng điểm: Kết quả cần ước lượng được cho bởi một giá trị số cụ thể, giúp tính toán các kết quả
khác nhưng lại không cho biết sai số của ước lượng.
Ước lượng khoảng: Kết quả cần ước lượng cho bởi một khoảng, cho biết sai số của ước lượng.
2.2. Ước lượng khoảng
2.2.1. Định nghĩa
• Xét thống kê ước lượng tham số θ về một đặc tính X nào đó của tổng thể, khoảng (θ1 ,θ 2 ) được gọi là
khoảng ước lượng (khoảng tin cậy) nếu với xác suất 1 − α cho trước thì P(θ1 < θ < θ 2 ) = 1 − α .
• Xác suất (để khoảng ước lượng chứa tham số cần ước lượng) 1 − α được gọi là độ tin cậy của ước lượng,
2ε = θ 2 − θ1 được gọi là độ dài của khoảng ước lượng và ε được gọi là độ chính xác của ước lượng.

• Bài toán đi tìm khoảng ước lượng (θ1 ,θ 2 ) cho θ được gọi là bài toán ước lượng khoảng.

2.2.2. Ước lượng khoảng cho trung bình tổng thể


Xét đặc tính X có trung bình µ chưa biết của tổng thể. Với độ tin cậy 1 − α cho trước, ta tìm khoảng
( µ1 , µ2 ) sao cho P( µ1 < µ < µ2 ) = 1 − α .
Trong bài toán này, ta gặp các trường hợp sau
• Trường hợp 1: Cỡ mẫu n > 30 (hoặc n ≤ 30 và X có phân phối chuẩn) và phương sai tổng thể σ 2 đã
biết
Tính trung bình mẫu x .
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
σ
Tính độ chính xác ε = zα / 2 .
n
Khoảng ước lượng là ( x − ε , x + ε )

• Trường hợp 2: Cỡ mẫu n > 30 và phương sai tổng thể σ 2 chưa biết
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
s
Tính độ chính xác ε = zα / 2 .
n
Khoảng ước lượng là ( x − ε , x + ε )

• Trường hợp 3: Cỡ mẫu n ≤ 30 , phương sai tổng thể σ 2 chưa biết và X có phân phối chuẩn

Trang 34
Đặng Thục Hiền Bài giảng XS và TK

X −µ
Nhận xét: Nếu X là BNN có phân phối chuẩn thì BNN T = có phân phối Student với (n-1)
S/ n
bậc tự do.
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
Tra bảng tìm tαn −/ 21
s
Tính độ chính xác ε = tαn −/ 21 .
n
Khoảng ước lượng là ( x − ε , x + ε )
• Sai số chuẩn: Nếu ta chọn mẫu ngẫu nhiên N lần (N rất lớn), mỗi lần chọn n đối tượng thì ta sẽ có N số
trung bình. Độ lệch chuẩn của N số trung bình này gọi là sai số chuẩn, nó phản ánh độ dao động của các
số trung bình mẫu.
VD 1. Lượng vitamin có trong trái cây A là biến ngẫu nhiên X (mg) có độ lệch chuẩn 3,98mg. Phân tích
250 trái cây A thì thu được lượng vitamin trung bình là 20mg. Với độ tin cậy 95%, hãy ước lượng lượng
vitamin trung bình có trong mỗi trái cây A.
VD 2. Chiều cao của người là biến ngẫu nhiên X (cm) có phân phối chuẩn N ( µ ,100) . Với độ tin cậy
95%, muốn ước lượng chiều cao trung bình của dân số có độ chính xác không quá 1cm thì phải đo ít nhất
bao nhiêu người?
VD 3. Chiều cao của loại cây A là biến ngẫu nhiên có phân phối chuẩn. Người ta đo ngẫu nhiên 20 cây A
thì thấy chiều cao trung bình là 23,12m và độ lệch chuẩn của mẫu chưa hiệu chỉnh là 1,25m. Tìm khoảng
ước lượng chiều cao trung bình của loại cây A với độ tin cậy 95%.
VD 4. Nghiên cứu nhu cầu về loại hàng X ở phường A bằng cách tiến hành khảo sát 400 trong toàn bộ
2500 hộ gia đình. Kết quả khảo sát như sau
Nhu cầu (kg/tháng) 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5
Số gia đình 10 35 86 132 78 31 18 10
a. Hãy ước lượng nhu cầu trung bình về loại hàng X của toàn phường A trong 1 năm với độ tin cậy
95%.
b. Với mẫu trên, muốn ước lượng nhu cầu trung bình về loại hàng X của phường A với độ chính xác
lớn hơn 3 tấn/năm và độ tin cậy 99% thì cần khảo sát tối đa bao nhiêu gia đình?
VD 5. Theo dõi mức nguyên liệu hao phí để sản xuất một đơn vị sản phẩm người ta thu được số liệu sau
Mức ng/liệu (gr) 19 - 19,5 19,6 - 20 20,1 - 20,5 20,6 - 21
Số sản phẩm 7 12 18 27
Giả sử mức hao phí nguyên liệu này là biến ngẫu nhiên có phân phối chuẩn, hãy ước lượng mức hao phí
nguyên liệu trung bình để sản xuất 1 đơn vị sản phẩm với độ tin cậy là 95%.
2.2.4. Ước lượng khoảng cho tỷ lệ tổng thể
• Giả sử chưa biết tỷ lệ p các phần tử có tính chất A trong tổng thể. Với độ tin cậy 1 − α cho trước, khoảng
ước lượng p là ( p1 , p2 ) thỏa mãn P ( p1 < p < p2 ) = 1 − α .
• Cách tìm
m
Tính tỷ lệ f =
n

Trang 35
Đặng Thục Hiền Bài giảng XS và TK

1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2
2
f (1 − f )
Tính độ chính xác ε = zα / 2
n
Khoảng ước lượng là ( f − ε , f + ε )
NA
• Nhận xét: Nếu p ∈ ( p1 , p2 ) và p = thì
N
NA N N
N A = pN ⇒ p1 N < N A < p2 N ; N= ⇒ A <N< A
p p2 p1
VD 6. Một trại gà tây đang nuôi 250.000 con gà trống 22 tuần tuổi, cân nặng đạt chuẩn của 1 con gà là lớn
hơn 22 kg. Cân thử 160 con thì thấy có 138 con đã đạt chuẩn. Với độ tin cậy 95%, hãy ước lượng số gà
trống đạt chuẩn.
VD 7. Để ước lượng số cá có trong hồ người ta bắt lên 10.000 con, đánh dấu rồi thả lại xuống hồ. Sau một
thời gian, bắt lên 8.000 con thì thấy có 564 con được đánh dấu. Hãy ước lượng cá có đánh dấu và số cá có
trong hồ với độ tin cậy 97%.
VD 8. Chọn ngẫu nhiên 500 chiếc tivi trong một kho hàng thì thấy có 27 tivi Sony.
a. Để ước lượng tỷ lệ TV Sony trong kho có độ chính xác là 1,77% thì đảm bảo độ tin cậy của ước
lượng là bao nhiêu?
b. Nếu muốn có độ chính xác của ước lượng tỷ lệ TV Sony nhỏ hơn 0,01 với độ tin cậy 95% thì cần
chọn ít nhất bao nhiêu TV nữa?
2.2.5. Ước lượng khoảng cho phương sai tổng thể
• Giả sử biến ngẫu nhiên X có phân phối chuẩn. Với độ tin cậy 1 − α cho trước, khoảng ước lượng của
phương sai là (σ 1 , σ 2 ) thỏa mãn P(σ 1 < σ 2 < σ 2 ) = 1 − α .
Có hai trường hợp
• Trường hợp 1: µ đã biết
n
( X i − µ )2
Nhận xét: Nếu X là BNN có phân phối chuẩn N ( µ , σ ) thì BNN χ = ∑ 2 2
có phân phối khi
i =1 σ2
– bình phương với n bậc tự do.
n
Tính tổng ∑ (x − µ)
i =1
i
2

Tra bảng tìm χα2 / 2 và χ12−α / 2 với n bậc tự do.


n n

∑ ( xi − µ )2 ∑ (x − µ) i
2

Tính σ 1 = i =1
, σ2 = i =1

χα / 2
2
χ12−α /2
Khoảng ước lượng là (σ 1 , σ 2 ) .
• Trường hợp 1: µ chưa biết

(n − 1) S 2
Nhận xét: Nếu X là BNN có phân phối chuẩn thì BNN χ 2 = có phân phối khi – bình phương
σ2
với (n-1) bậc tự do.
Trang 36
Đặng Thục Hiền Bài giảng XS và TK

Tính s 2
Tra bảng tìm χα2 / 2 và χ12−α / 2 với (n-1) bậc tự do.

(n − 1) s 2 (n − 1) s 2
Tính σ 1 = , σ2 =
χα2 / 2 χ12−α /2
Khoảng ước lượng là (σ 1 , σ 2 )
VD 9. Mức hao phí nguyên liệu cho một đơn vị sản phẩm là một BNN X có phân phối chuẩn. Quan sát 25
sản phẩm, ta có số liệu sau
Mức ng/liệu (gr) 19,5 20 20,5
Số sản phẩm 5 18 2
Với độ tin cậy 95%, hãy ước lượng phương sai trong hai trường hợp
a. µ = 20 (gr) ; b. µ chưa biết.
VD 10. Một giống lúa mới được gieo trong 10 miếng đất thí nghiệm có các điều kiện giống nhau, sản
lượng (tính theo cùng 1 đơn vị) được cho như sau
25,4; 28; 20,1; 27,4; 25,6; 23,9; 24,8; 26,4; 27; 25,4
Coi sản lượng lúa là BNN X có phân phối chuẩn. Hãy ước lượng phương sai sản lượng với độ tin cậy
90%.

BÀI TẬP CHƯƠNG 4


Bài 1: Kiểm tra tuổi thọ (giờ) của 50 bóng đèn do nhà máy A sản xuất, thu được bảng số liệu sau
Tuổi thọ 3.300 3.500 3.600 4.000
Số bóng đèn 10 20 12 8
a. Hãy ước lượng tuổi thọ trung bình của loại bóng đèn do nhà máy A sản xuất với độ tin cậy 97%
b. Để ước lượng tuổi thọ trung bình của loại bóng đèn này có độ chính xác 59,02 giờ thì đảm bảo độ
tin cậy là bao nhiêu ?
c. Muốn ước lượng tuổi thọ trung bình của loại bóng đèn có độ chính xác nhỏ hơn 40 giờ với độ tin
cậy 98% thì phải kiểm tra ít nhất bao nhiêu bóng đèn nữa?
ĐS: a. (3497,2931; 3630,7069) ; b. 94,52% ; c. 111 bóng
Bài 2: Đo đường kính của 100 trục máy do một nhà máy sản xuất thì được bảng số liệu
Đường kính (cm) 9,75 9,8 9,85 9,9
Số trục máy 5 37 42 16
a. Hãy ước lượng đường kính trung bình của trục máy với độ tin cậy 97%.
b. Để ước lượng đường kính trung bình của trục máy có độ chính xác 0,006cm thì đảm bảo độ tin cậy
là bao nhiêu?
c. Muốn ước lượng đường kính trung bình của trục máy có độ chính xác lớn hơn 0,003cm với độ tin
cậy 99% thì phải đo tối đa bao nhiêu trục máy nữa?
ĐS: a. (9,8258; 9,8432) ; b. 86,64% ; c. 1083 trục
Bài 3: Tiến hành khảo sát 420 trong số 3000 gia đình ở 1 phường thì thấy có 400 gia đình dùng sản phẩm
X với bảng số liệu

Trang 37
Đặng Thục Hiền Bài giảng XS và TK

Số lượng (kg/tháng) 0,75 1,25 1,75 2,25 2,75 3,25


Số gia đình 40 70 110 90 60 30
Hãy ước lượng trung bình tổng khối lượng sản phẩm X được tiêu thụ ở phường này trong một tháng với
tin cậy 95%. ĐS: (5307; 5763)
Bài 4: Độ sâu của biển được xác định bằng một máy đo có sai số hệ thống bằng 0, còn sai số ngẫu nhiên
của nó tuân theo luật phân phối chuẩn với độ lệch chuẩn 20m. Tìm khoảng tin cậy 95% cho sai số ngẫu
nhiên trung bình. Biết rằng khi tiến hành đo ở một địa điểm xác định 25 lần người ta tính được sai số ngẫu
nhiên trung bình mẫu là 100m. ĐS: (92,16; 107,84)
Bài 5: Lấy ngẫu nhiên 200 sản phẩm trong kho hàng A thì có 21 phế phẩm.
a. Để ước lượng tỷ lệ phế phẩm có trong kho A với độ chính xác 3,5% thì đảm bảo độ tin cậy là bao
nhiêu? ĐS: 89,26%
b. Nếu muốn ước lượng tỷ lệ phế phẩm nhỏ hơn 1% với độ chính xác 93% thì cần kiểm tra ít nhất
bao nhiêu sản phẩm nữa? ĐS: 2879 sản phẩm
Bài 6: Thửa ruộng có năng suất lúa lớn hơn 5,5 (tấn/ha) gọi là có năng suất cao. Khảo sát năng suất X ở
100 ha lúa của huyện A ta thu được bảng số liệu sau
Năng suất 3,25 3,75 4,25 4,75 5,25 5,75 6,25 6,75
Diện tích 7 12 18 27 20 8 5 3
Để ước lượng tỷ lệ diện tích lúa có năng suất cao ở huyện A với độ chính xác 8,54% thì đảm bảo độ tin
cậy là bao nhiêu? ĐS: 98,02%

CHƯƠNG 5. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ


Bài 1. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
• Mô hình tổng quát của bài toán kiểm định là: ta nêu lên hai mệnh đề trái ngược nhau, một mệnh đề được
gọi là giả thuyết H 0 (H) và mệnh đề còn lại được gọi là nghịch thuyết (hay đối thuyết) H1 ( H ) .
• Giải quyết một bài toán kiểm định là: bằng cách dựa vào quan sát mẫu, ta nêu lên một quy tắc hành
động, ta chấp nhận giả thuyết H 0 hay bác bỏ giả thuyết H 0 .

• Khi ta chấp nhận giả thuyết H 0 , nghĩa là ta tin rằng H 0 đúng; khi bác bỏ H 0 , nghĩa là ta tin H 0 sai. Do
chỉ dựa trên một mẫu quan sát ngẫu nhiên, nên ta không thể khẳng định chắc chắn điều gì cho tổng thể.
• Trong chương này, ta chỉ xét loại kiểm định tham số (so sánh đặc trưng với 1 số, so sánh hai đặc trưng
của hai tổng thể).
1.1. Khái niệm chung
• Giả sử ta khảo sát tham số θ ∈ Θ chưa biết về đặc tính X của tổng thể, với Θ = Θ0 ∪ Θ1 và Θ0 ∩ Θ1 = ∅

• Đặt giả thuyết H 0 : θ ∈ Θ0 và đối thuyết H1 : θ ∈ Θ1 . Bài toán kiểm định giả thuyết là đưa ra tiêu chuẩn
khi nào thì chấp nhận H 0 , khi nào thì chấp nhận H1 .

1.2. Các loại sai lầm trong kiểm định


Trong không gian mẫu, gọi W là miền bác bỏ giả thuyết H 0 , có nghĩa là nếu mẫu lấy ra ∈ W thì ta bác bỏ
H 0 , khi đó W là phần bù của W chính là miền chấp nhận giải thuyết H 0 , có nghĩa là nếu mẫu lấy ra
∈ W thì ta chấp nhận H 0 .

Trang 38
Đặng Thục Hiền Bài giảng XS và TK

Khi thực hiện kiểm định giả thuyết, ta chỉ quan sát ngẫu nhiên một số trường hợp rồi đưa ra kết luận cho
tổng thể. Sự suy rộng này có khi đúng, có khi sai. Có hai loại sai lầm sau
• Sai lầm loại I: bác bỏ H 0 trong khi H 0 đúng và P( W | H 0 đúng) = α , α càng nhỏ thì khả năng mắc sai
lầm loại I càng ít
• Sai lầm loại II: chấp nhận H 0 trong khi H 0 sai và P( W | H 0 sai) = 1-P( W | H 0 sai) = 1- β , β càng lớn thì
xác suất mắc sai lầm loại II càng nhỏ
Mối liên hệ giữa hai loại sai lầm
• Trong kiểm định, ta luôn muốn sai lầm càng ít càng tốt. Tuy nhiên, nếu hạ thấp α thì β sẽ tăng và
ngược lại. Như vậy, trong hai loại sai lầm này, loại nào ít tác hại hơn thì ta chọn.
• Trong từng hoàn cảnh cụ thể, sai lầm này có thể tai hại hơn sai lầm kia. Chẳng hạn như, từ chối một lô
hàng tốt hay chấp nhận một lô hàng xấu đều tai hại, tuy nhiên trong lúc thiếu hàng thì việc từ chối một lô
hàng tốt (sai lầm loại 1) sẽ tai hại hơn việc chấp nhận 1 lô hàng xấu (sai lầm loại 2). Hay bệnh nhân A có
thể uống loại thuốc B, sai lầm loại 1 dẫn đến việc tìm thuốc khác cho bệnh nhân B còn sai lầm loại 2 là
cho bệnh nhân uống thuốc B, như vậy sai lầm loại 2 tai hại hơn.
• Có hai cách khống chế sai lầm, một là ấn định trước xác suất mắc sai lầm loại 1 và loại 2 rồi chọn cỡ
mẫu nhỏ nhất tương ứng với 2 mức xác suất này; hai là ấn định trước xác suất mắc sai lầm loại 1 rồi chọn
miền W sao cho xác suất mắc sai lầm loại 2 là nhỏ nhất.
• Trong thống kê, người ta thường chọn cách thứ 2 tức là chỉ xét các phép kiểm định có α không vượt
quá 1 giá trị được ấn định trước, thông thường là 1%, 3%, 5%. Giá trị α còn được gọi là mức ý nghĩa của
kiểm định.
1.3. Cơ sở lý thuyết của kiểm định
• Để giải quyết bài toán kiểm định, ta quan sát mẫu ngẫu nhiên X 1 ,..., X n và đưa ra giả thuyết H 0 .

• Từ mẫu trên, ta chọn thống kê T = f ( X 1 ,..., X n , θ0 ) sao cho khi H 0 đúng thì phân phối xác suất của T
hoàn toàn xác định.
• Với mức ý nghĩa α , ta tìm được khoảng ước lượng [a,b] cho T với độ tin cậy 1 − α .
• Khi đó
Nếu t ∈ [a, b] thì chấp nhận giả thuyết H 0 .

Nếu t ∉ [a, b] thì bác bỏ giả thuyết H 0 .

• Nếu đồ thị hàm mật độ T đối xứng qua trục xác suất thì ta chọn khoảng đối xứng [ − tα , tα ] với
α
P (T ≤ −tα ) = P (T ≥ tα ) =
2
Vậy khi xét nửa bên phải của trục xác suất thì ta được
Nếu t ≤ tα thì chấp nhận giả thuyết H 0 .

Nếu t > tα thì bác bỏ giả thuyết H 0 .


• Nếu hàm mật độ T không đối xứng thì ta chọn khoảng tin cậy [0,C] với P (T ≥ C ) = α . Khi đó
Nếu t ≤ C thì chấp nhận giả thuyết H 0 .

Nếu t > C thì bác bỏ giả thuyết H 0 .

Trang 39
Đặng Thục Hiền Bài giảng XS và TK

Bài 2. KIỂM ĐỊNH SO SÁNH ĐẶC TRƯNG CỦA TỔNG THỂ


VỚI MỘT SỐ
2.1. Kiểm định so sánh trung bình với một số
Xét đặc tính X của tổng thể. Giả sử cần so sánh trung bình µ của tổng thể về đặc tính X với một số µ0 , ta
đặt giả thuyết H 0 : µ =µ0 . Có các trường hợp sau

• Trường hợp 1: Cỡ mẫu n > 30 (hoặc n ≤ 30 và X có phân phối chuẩn) và phương sai tổng thể σ 2 đã
biết
Tính trung bình mẫu x .
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
x − µ0 x − µ0
Tính giá trị thống kê z = = n.
σ σ
n
Nếu z ≤ zα thì ta chấp nhận H 0 nghĩa là µ =µ0 ; nếu z > zα thì ta bác bỏ H 0 tức µ ≠ µ0 .
2 2

• Trường hợp 2: Cỡ mẫu n > 30 và phương sai tổng thể σ 2 chưa biết
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
x − µ0 x − µ0
Tính giá trị thống kê z = = n.
s s
n
Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .
2 2

• Trường hợp 3: Cỡ mẫu n ≤ 30 , phương sai tổng thể σ 2 chưa biết và X có phân phối chuẩn
Tính trung bình mẫu x và độ lệch chuẩn mẫu hiệu chỉnh s
Tra bảng tìm tαn −/ 21 .

x − µ0 x − µ0
Tính giá trị thống kê t = = n.
s s
n
Nếu t ≤ tαn −1 thì ta chấp nhận H 0 ; nếu t > tαn −1 thì ta bác bỏ H 0 .
2 2

• Trường hợp 4: Cỡ mẫu n > 30 và X có phân phối Poisson


Tính trung bình mẫu x .
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2

Trang 40
Đặng Thục Hiền Bài giảng XS và TK

x − µ0 x − µ0
Tính giá trị thống kê z = = n.
µ0 / n µ0
Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .
2 2

Chú ý: Trong tất cả các trường hợp bác bỏ giả thuyết H 0 , ta so sánh x và µ0

Nếu x > µ0 thì kết luận µ > µ0 .

Nếu x < µ0 thì kết luận µ < µ0 .


VD 1. Sở điện lực A báo cáo rằng: Trung bình mỗi hộ hàng tháng phải đóng 250 ngàn đồng tiền điện, với
độ lệch chuẩn là 20 ngàn. Người ta khảo sát ngẫu nhiên 500 hộ thì thấy trung bình hàng tháng mỗi hộ trả
252 ngàn đồng. Với giả thuyết “Trung bình mỗi hộ hàng tháng phải trả 250 ngàn đồng tiền điện” với mức
ý nghĩa 1%, hãy tính giá trị thống kê và kết luận.
VD 2. Để khảo sát hàm lượng Vitamin C (%) của một loại trái cam, người ta kiểm tra 100 trái và tính
được x = 9, 45%; s = 2,98496 . Với mức ý nghĩa 5%, hãy kiểm định giả thuyết “Hàm lượng Vitamin C có
trong mỗi trái cam của loại cam này là 12%”.
VD 3. Một công ty cho biết mức lương trung bình của 1 kỹ sư của công ty là 5,7 triệu đồng/tháng với độ
lêch chuẩn 0,5 triệu đồng/tháng. Kỹ sư A đã thăm dò 18 kỹ sư ở công ty này và thấy lương trung bình là
5,45 triệu đồng/tháng. Kỹ sư A quyết định: “Nếu mức lương trung bình thực sự bằng hay cao hơn mức
lương công ty đưa ra thì sẽ nộp đơn xin việc”. Với mức ý nghĩa 5%, hãy cho biết kết luận của kỹ sư A.
VD 4. Thời gian giữa hai chuyến xe bus trong thành phố là BNN X (phút) có phân phối chuẩn. Công ty xe
bus nói rằng trung bình cứ 5 phút lại có một chuyến. Người ta chọn ngẫu nhiên 8 thời điểm và ghi lại thời
gian (phút) giữa 2 chuyến xe bus là 5,3; 4,5; 4,8; 5,1; 4,3; 4,8; 4,9; 4,7. Với mức ý
nghĩa 7%, hãy kiểm định ý kiến của công ty.
VD 5. Số người đến trung tâm thương mại trong những khoảng thời gian 5 phút là BNN X có phân phối
Poisson. Trong mùa mưa, người ta xác định được số người trung bình đến trung tâm thương mại trong
những khoảng thời gian 5 phút là 4 người. Sang mùa khô, theo dõi 36 khoảng thời gian (mỗi khoảng 5
phút) người ta thấy có 174 người đến trung tâm. Với mức ý nghĩa 5%, hãy xét xem khí hậu có ảnh hưởng
đến số người đến trung tâm đó hay không?
2.2. Kiểm định so sánh tỷ lệ với một số
Giả sử ta cần so sánh tỷ lệ p về tính chất A trong tổng thể X với số p0 . Đặt giả thuyết H 0 : p = p0 .
m
Tính tỷ lệ mẫu f =
n
1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
f − p0 f − p0
Tính giá trị thống kê z = = n.
p0 (1 − p0 ) p0 (1 − p0 )
n
Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .
2 2

Trong trường hợp bác bỏ H 0 , nếu f > p0 thì p > p0 , nếu f < p0 thì p < p0 .

Trang 41
Đặng Thục Hiền Bài giảng XS và TK

VD 6. Tỷ lệ phế phẩm của một nhà máy là 5%, sau khi cải tiến kỹ thuật, người ta kiểm tra 400 sản phẩm
thì thấy có 16 phế phẩm. Với mức ý nghĩa 1%, hãy kết luận việc cải tiến kỹ thuật có làm giảm tỷ lệ phế
phẩm hay không?
VD 7. Khảo sát ngẫu nhiên 400 sinh viên về mức độ nghiêm túc trong giờ học thì thấy 13 sinh viên thừa
nhận có ngủ trong giờ học. Trong kiểm định giả thuyết H 0 : "Có 2% sinh viên ngủ trong giờ học" thì mức
ý nghĩa tối đa là bao nhiêu để H 0 được chấp nhận?

Bài 3. KIỂM ĐỊNH SO SÁNH HAI ĐẶC TRƯNG CỦA HAI TỔNG THỂ
3.1. So sánh hai trung bình của hai tổng thể
Xét hai đặc tính X và Y của hai tổng thể. Giả sử ta cần so sánh hai trung bình tương ứng là µ x và µ y , ta
đặt giả thuyết H 0 : µ x =µ y . Có các trường hợp sau

• Trường hợp 1: Cỡ mẫu nx > 30, n y > 30 (hoặc nx ≤ 30, n y ≤ 30 và X, Y có phân phối chuẩn) và phương
sai tổng thể σ x2 , σ y2 đã biết

x− y
Tính giá trị thống kê z = .
σ 2
σ y2
x
+
nx ny

Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .


2 2

• Trường hợp 2: Cỡ mẫu nx > 30, n y > 30 và phương sai tổng thể σ x2 , σ y2 chưa biết

x− y
Tính giá trị thống kê z = .
2
sx2 s y
+
nx n y

Nếu z ≤ zα thì ta chấp nhận H 0 ; nếu z > zα thì ta bác bỏ H 0 .


2 2

• Trường hợp 3: Cỡ mẫu nx ≤ 30, n y ≤ 30 , phương sai tổng thể σ x2 , σ y2 chưa biết và X, Ycó phân phối
chuẩn
(nx − 1) sx2 + (ny − 1) s y2
Tính phương sai chung của 2 mẫu s 2 =
nx + ny − 2
n + ny −2
Tra bảng tìm tα x/ 2 .

x− y
Tính giá trị thống kê t = .
1 1
s +
nx n y
n + ny − 2 n + ny −2
Nếu t ≤ tα x/ 2 thì ta chấp nhận H 0 ; nếu t > tα x/ 2 thì ta bác bỏ H 0 .
VD 1. Người ta tiến hành bón hai loại phân X, Y cho cây cà chua. Với 60 cây được bón phân X thì thu
được trung bình 32,2 quả và độ lệch chuẩn của mẫu đã hiệu chỉnh là 8,5 quả ; với 72 cây được bón phân Y

Trang 42
Đặng Thục Hiền Bài giảng XS và TK

thì thu được trung bình 28,4 quả và độ lệch chuẩn của mẫu đã hiệu chỉnh là 9,3 quả. Với mức ý nghĩa 5%,
hãy kết luận về hiệu quả của hai loại phân bón trên.
VD 2. Trọng lượng sản phẩm do hai nhà máy sản xuất là các BNN có phân phối chuẩn và có cùng độ lệch
chuẩn là 1kg. Với mức ý nghĩa 0,05, có thể xem trọng lượng trung bình của sản phẩm do hai nhà máy sản
xuất ra là như nhau hay không, nếu cân thử 25 sản phẩm của nhà máy A ta tính được trọng lượng trung
bình là 50kg, còn trọng lượng trung bình của 20 sản phẩm của nhà máy B là 50,6kg?
VD 3. Tuổi thọ của thiết bị là BNN có phân phối chuẩn. Người ta kiểm tra ngẫu nhiên tuổi thọ của 15 thiết
bị loại A thì thu được kết quả
114 ; 78 ; 96 ; 137 ; 78 ; 103 ; 126 ; 86 ; 99 ; 114 ; 72 ; 104 ; 73 ; 86; 117.
Kiểm tra tuổi thọ 17 thiết bị loại B thấy trung bình là 84 tháng và độ lệch chuẩn đã hiệu chỉnh là 19 tháng.
Hãy tìm giá trị thống kê và kết luận kiểm định giả thuyết H 0 : "Tuổi thọ trung bình của 2 loại thiết bị là
như nhau" với mức ý nghĩa 3%.
3.2. So sánh hai tỷ lệ của hai tổng thể
Xét hai tổng thể X, Y. Giả sử ta cần so sánh hai tỷ lệ tương ứng là px và p y về một tính chất A nào đó, ta
đặt giả thuyết H 0 : px = p y . Để chấp nhận hay bác bỏ H 0 , ta làm như kiểm định so sánh tỷ lệ với 1 số

mx my mx + m y
Tính tỷ lệ mẫu f x = ; fy = ; p0 =
nx ny nx + n y

1−α
Tính ϕ ( zα / 2 ) = , tra bảng tìm zα / 2 .
2
fx − fy
Tính giá trị thống kê z = .
1 1 
p0 q0  + 
n n 
 x y 

Nếu z ≤ zα thì ta chấp nhận H 0


2

Nếu z > zα thì bác bỏ H 0 và nếu f x < f y thì px < p y ; nếu f x > f y thì px > p y
2

VD 4. Từ hai tổng thể X, Y người ta tiến hành kiểm tra 2 mẫu có kích thước nx = 1000; n y = 1200 về một
tính chất A thì được f x = 0, 27; f y = 0, 3 . Với mức ý nghĩa 9% hãy so sánh px , p y của hai tổng thể.
VD 5. Một công ty điện tử nghiên cứu thị trường về sở thích xem tivi của cư dân trong thành phố. Hỏi 400
người ở quận X thì có 270 người xem tivi ít nhất 1 giờ trong ngày, 600 người ở quận Y thì thấy có 450
người. Kiểm định giả thuyết "Tỷ lệ cư dân xem tivi ít nhất 1 giờ trong 1 ngày của 2 quận X và Y là như
nhau", mức ý nghĩa tối đa để giả thuyết này được chấp nhận là bao nhiêu?
VD 6. Trước bầu cử, người ta thăm dò 1000 cử tri thì thấy có 400 người nói sẽ bỏ phiếu cho ông A ; còn 1
tuần nữa đến ngày bầu cử thì thấy có 680 người trong 1500 cử tri nói sẽ bỏ phiếu cho ông A. Kiểm định
giả thuyết "Tỷ lệ cử tri bỏ phiếu cho ông A ở hai lần khảo sát là như nhau", với mức ý nghĩa 5% có giá trị
thống kê là bao nhiêu và hãy kết luận về giả thuyết?

BÀI TẬP CHƯƠNG 5


Bài 1: Trong một nhà máy gạo, trọng lượng đóng bao theo quy định của 1 bao gạo là 50kg với độ lệch
chuẩn là 0,3kg. Cân thử 296 bao gạo của nhà máy thì thấy trọng lượng trung bình là 49,97kg. Kiểm định

Trang 43
Đặng Thục Hiền Bài giảng XS và TK

giả thuyết H 0 : “Trọng lượng trung bình mỗi bao gạo của nhà máy này là 50kg” có giá trị thống kê và kết
luận là
a. z = 1, 7205 , chấp nhận H 0 với mức ý nghĩa 6%.

b. z = 1, 7205 , bác bỏ H 0 , trọng lượng trung bình thực tế mỗi bao gạo nhỏ hơn 50kg với mức ý nghĩa 6%.

c. z = 1, 9732 , chấp nhận H 0 với mức ý nghĩa 4%.

d. z = 1, 9732 , bác bỏ H 0 , trọng lượng trung bình thực tế mỗi bao gạo nhỏ hơn 50kg với mức ý nghĩa 4%.
ĐS: a
Bài 2: Người ta kiểm tra ngẫu nhiên 38 cửa hàng của công ty A và có bảng doanh thu trong 1 tháng là
Doanh thu (triệu/tháng) 200 220 240 260
Số của hàng 8 16 12 2
Kiểm định giả thuyết H 0 : "Doanh thu trung bình hàng tháng của mỗi của hàng của công ty A là 230 triệu
đồng", mức ý nghĩa tối đa để giả thuyết H 0 được chấp nhận là bao nhiêu? ĐS: α max = 3, 4%
Bài 3: Điểm trung bình môn Toán của sinh viên năm trước là 5,72. Năm nay, theo dõi 100 sinh viên thu
được số liệu
Điểm 3 4 5 6 7 8 9
Số sv 3 5 27 43 12 6 4
Hãy tìm mức ý nghĩa tối đa để giả thuyết "Điểm trung bình môn Toán của sinh viên trong 2 năm là bằng
nhau" được chấp nhận. ĐS: α max = 13, 62%
Bài 4: Chiều cao cây giống X trong một vườn ươm là BNN có phân phối chuẩn. Người ta đo ngẫu nhiên
25 cây giống này và thu được bảng số liệu
X (m) 0,8 0,9 1 1,1 1,2 1,3
Số cây 1 2 9 7 4 2
Theo quy định của vườn ươm, khi nào chiều cao trung bình của cây hơn 1m thì đem ra trồng. Với mức ý
nghĩa 5%, kiểm định giả thuyết H 0 "Cây giống trung bình của vườn ươm cao trung bình 1m" có giá trị
thống kê là bao nhiêu và kết luận như thế nào về H 0 ? ĐS: Bác bỏ H 0 và có thể đem cây ra trồng.
Bài 5: Để kiểm tra một loại súng thể thao, người ta cho bắn 1000 viên đạn vào một tấm bia thì có 670 viên
trúng mục tiêu. Sau đó, người ta cải tiến kỹ thuật và cho kiểm tra lại thì thấy tỷ lệ bắn trúng mục tiêu lúc
này là 70%. Trong kiểm định giả thuyết H 0 "tỷ lệ bắn trúng của loại súng thể thao này trước cải tiến là
70%" với mức ý nghĩa 3% có giá trị thống kê và kết luận là
a. z = 2, 0702 và cải tiến kỹ thuật là tốt. b. z = 2, 0702 và cải tiến kỹ thuật là chưa tốt.
c. z = 2, 0716 và cải tiến kỹ thuật là tốt. d. z = 2, 0716 và cải tiến kỹ thuật là chưa tốt.
ĐS: b
Bài 6: Trọng lượng trung bình khi xuất chuồng ở một trại chăn nuôi gà công nghiệp năm trước là
2,8kg/con. Năm nay người ta sử dụng một loại thức ăn mới và cân thử 25 con khi xuất chuồng thì thu
được trọng lượng trung bình là 3,2kg/con với độ lệch chuẩn 0,5kg.
a. Với mức ý nghĩa 5%, hãy kết luận về tác dụng của loại thức ăn này (có làm tăng trọng lượng trung
bình của gà hay không)
b. Nếu trại báo cáo trọng lượng trung bình khi xuất chuồng là 3,3kg/con thì có chấp nhận được
không? (Với mức ý nghĩa 5%)
Trang 44
Đặng Thục Hiền Bài giảng XS và TK

ĐS: a. thức ăn làm tăng trọng lượng gà ; b. chấp nhận được.


Bài 7: Trọng lượng của một loại sản phẩm do một nhà máy sản xuất là BNN có phân phối chuẩn với trọng
lượng trung bình là 500gr. Sau một thời gian sản xuất, người ta nghi ngờ trọng lượng của loại sản phẩm
này đang có xu hướng giảm sút nên tiến hành cân thử 25 sản phẩm và kết quả cho ở bảng sau
Trọng lượng (gr) 480 485 490 495 500 510
Số sản phẩm 2 3 8 5 3 4
Với mức ý nghĩa 5%, hãy cho biết điều nghi ngờ trên có đúng hay không? ĐS: đúng.
Bài 8: Để so sánh mức lương trung bình của nhân viên nữ (USD/giờ) và nhân viên nam (USD/giờ) ở một
công ty A, người ta tiến hành khảo sát ngẫu nhiên 100 nữ và 75 nam thì có kết quả x = 7, 23; sx = 1, 64 và
y = 8, 06; s y = 1,85 . Với mức ý nghĩa 3%, kiểm định giả thuyết "Mức lương trung bình của nữ và nam ở
công ty này là như nhau" có giá trị thống kê là bao nhiêu và kết luận như thế nào?
ĐS: mức lương trung bình của nữ nhỏ hơn của nam.
Bài 9: Nghiên cứu trọng lượng trẻ sơ sinh của hai nhóm trẻ có mẹ không hút thuốc và hút thuốc trên 2
mẫu tương ứng, ta có:
• Nhóm không hút thuốc: n = 15; x = 3,5933 ; sx = 0, 3707 .
• Nhóm có hút thuốc: m = 14; y = 3, 2029 ; s y = 0, 4927 .
Giả sử trọng lượng trẻ ở các nhóm có phân phối chuẩn cùng phương sai. Với mức ý nghĩa bằng 0,05 có
thể cho rằng trẻ sơ sinh ở nhóm mẹ hút thuốc nhẹ cân hơn của nhóm mẹ không hút thuốc không? ĐS: có.
Bài 10: Kiểm tra 120 sản phẩm ở kho I thấy có 6 phế phẩm trong khi trong 200 sản phẩm ở kho II có 24
phế phẩm. Hỏi chất lượng hàng ở 2 kho có khác nhau không với mức ý nghĩa 5% ; 3%?
ĐS: a. chất lượng hàng ở kho 1 tốt hơn kho 2 ; b. như nhau.
Bài 11: Khảo sát 300 cử tri ở khu vực A và 200 cử tri ở khu vực B cho thấy có 56% và 48%, theo thứ tự,
ủng hộ ứng cử viên X. Ở mức ý nghĩa 5%, hãy kiểm định giả thuyết ứng cử viên X được ủng hộ hơn ở
khu vực A. ĐS: chấp nhận giả thuyết.

Trang 45

You might also like