You are on page 1of 53

[XÁC SUẤT THỐNG KÊ ] August 2020

LÝ THUYẾT TRẮC NGHIỆM


XÁC SUẤT THỐNG KÊ

GROUP: ÔN THI NEU|MENTORY NEU i


[XÁC SUẤT THỐNG KÊ ] August 2020

LỜI MỞ ĐẦU
Nhất lượng – Nhì Mar – Thứ ba Xác suất. Câu nói kinh điển của sinh viên trường
N cho thấy sự khó nhằn của một số môn học đại cương trong đó có Xác suất Thống kê.
Hệ thống bí kíp Xác suất thống kê được xây dựng nhằm giúp các bạn ôn tập một cách
nhanh nhất, hiệu quả nhất, tiết kiệm thời gian nhất,. Bí kíp xác suất thống kê phù hợp với
mọi đối tượng, bao gồm ví dụ như Các bạn không có nhiều thời gian ôn, sát thi mới ôn,
chỉ cần qua môn; Các bạn sợ học toán, ngại học toán; Các bạn đạt mục tiêu A+….
Nội dung bí kíp được xây dựng dựa trên kiến thức giáo trình, các bài tập trong
chính các đề thi của các khóa trước. Nội dung kiến thức được biên soạn sát nhất với đề thi
cuối kỳ, và đặc biệt phù hợp với hình thức thi trắc nghiệm.
Bí kíp gồm 2 quyển:
❖ Quyển 1: Lý thuyết trắc nghiệm XSTK
Quyển 1 bao gồm nội dung kiến thức – lý thuyết trọng tâm – cách làm bài tập chi
tiết của tất cả các chương. Những dạng bài hay thi nhất, mẹo làm nhanh nhất – cách nhớ
công thức ngắn gọn nhất đều được biên soạn.
❖ Quyển 2: Bài tập trắc nghiệp XSTK
Quyển 2 bao gồm bài tập dạng lý thuyết – dạng bài tập trắc nghiệm được phân
theo từng chương và 4 đề thi cực sát với đề thi cuối kỳ để bạn đọc luyện tập.
Đội ngũ tác giả tin rằng khi sở hữu 2 quyển bí kíp này trong tay, các bạn sẽ học tập
môn này một cách nhanh nhất và hiệu quả nhất.
Mặc dù rất cố gắng nhưng trong quá trình biên soạn không thể tránh khỏi sai sót,
rất mong các bạn thông cảm. Mọi ý kiến đóng góp các bạn có thể phản hồi trực tiếp trên
Group Ôn thi NEU hoặc fanpage: Mentory – Ôn thi NEU.
Chúc các bạn thi tốt.

GROUP: ÔN THI NEU|MENTORY NEU ii


[XÁC SUẤT THỐNG KÊ ] August 2020

MỤC LỤC

MỤC LỤC..................................................................................................................................... iii

PHẦN I: XÁC SUẤT .................................................................................................................... 1

CHƯƠNG 1: BIẾN CỐ - XÁC SUẤT ........................................................................................ 2

1.1. Phép thử - Biến cố .............................................................................................................. 2

1.2 Xác suất của biến cố ........................................................................................................... 2

1.3 Các phương pháp tính xác suất ......................................................................................... 2

1.4. Định lý cộng xác suất ........................................................................................................ 3

1.5. Định lý nhân xác suất ........................................................................................................ 3

1.6. Công thức Bernoulli ........................................................................................................... 6

1.7. Công thức xác suất đầy đủ. ............................................................................................... 6

CHƯƠNG 2: BIẾN NGẪU NHIÊN RỜI RẠC ........................................................................ 8

VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT .............................................................................. 8

2.1 Biến ngẫu nhiên ................................................................................................................... 8

2.2 Bảng phân phối xác suất .................................................................................................... 9

2.3 Hàm phân phối xác suất..................................................................................................... 9

2.4 Các tham số đặc trưng ...................................................................................................... 10

2.5 Quy luật không – một (Quy luật Bernoulli) – A(p) ............................................................ 12

2.5.1 Định nghĩa ........................................................................................................................ 12

2.6 Quy luật phân phối nhị thức ........................................................................................... 12

2.7. Quy luật Poisson - P( ) .................................................................................................. 13

CHƯƠNG 3: BIẾN NGẪU NHIÊN LIÊN TỤC .................................................................... 14

VÀ MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT ........................................................... 14

3.1. Biến ngẫu nhiên liên tục .................................................................................................. 14

3.2. Hàm phân phối xác suất.................................................................................................. 14

3.3 Hàm mật độ xác suất ........................................................................................................ 14

GROUP: ÔN THI NEU|MENTORY NEU iii


[XÁC SUẤT THỐNG KÊ ] August 2020

3.4 Các tham số đặc trưng ...................................................................................................... 16

3.5 Quy luật đều ...................................................................................................................... 18

3.6 Quy luật phân phối chuẩn ............................................................................................... 19

3.7. Quy luật Khi bình phương, quy luật Student, quy luật Fisher .................................. 21

CHƯƠNG 4: BIẾN NGẪU NHIÊN HAI CHIỀU ................................................................. 24

4.1. Bảng phân phối xác suất của biến ngẫu nhiên hai chiều ............................................ 24

4.2. Bảng phân phối xác suất biên......................................................................................... 24

4.3. Các tham số đặc trưng ..................................................................................................... 25

4.4 Bài toán xét sự độc lập của BNN 2 chiều....................................................................... 26

PHẦN II........................................................................................................................................ 27

THỐNG KÊ ................................................................................................................................. 27

CHƯƠNG 6: CƠ SỞ LÝ THUYẾT MẪU ............................................................................... 28

6.1. Thống kê - Tổng thế - Mẫu – Đồ thị - Biến ................................................................... 28

6.2. Các tham số đặc trưng của mẫu ..................................................................................... 30

6.3. Bài toán suy diễn.............................................................................................................. 32

CHƯƠNG 7: ƯỚC LƯỢNG ..................................................................................................... 34

7.1 Phương pháp ước lượng điểm........................................................................................... 34

7.2 Phương pháp ước lượng bằng khoảng tin cậy ............................................................... 34

7.3 Ước lượng hợp lý tối đa .................................................................................................... 37

CHƯƠNG 8: KIỂM ĐỊNH ........................................................................................................ 39

8.1 Một số khái niệm chung ................................................................................................... 39

8.2. Bài toán kiểm định ........................................................................................................... 40

8.3. Cách đọc bảng Excel. ........................................................................................................ 45

8.4. Kiểm định dùng P-value .................................................................................................. 46

GROUP: ÔN THI NEU|MENTORY NEU iv


[XÁC SUẤT THỐNG KÊ ] August 2020

PHẦN I: XÁC SUẤT

GROUP: ÔN THI NEU|MENTORY NEU 1


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 1: BIẾN CỐ - XÁC SUẤT


1.1. Phép thử - Biến cố
1.1.1 Phép thử: Phép thử là việc thực hiện một nhóm các điều kiện cơ bản để quan sát một
hiện tượng nào đó có thể xảy ra hay không.
1.1.2 Biến cố: Hiện tượng có thể xảy ra được gọi là biến cố.
1.2 Xác suất của biến cố
Định nghĩa xác suất: Xác suất của một biến cố là một con số đặc trưng khả năng
xuất hiện biến cố đó khi thực hiện một phép thử.
Ví dụ: Bạn A gieo 1 con xúc sắc. Tính xác suất để bạn A gieo được mặt 6 chấm.

1 1 1 1
A. B. C. D.
2 3 4 6

❖ Nếu A là biến cố chắc chắn, P( A) = 1 .

❖ Nếu A là biến cố không thể có, P( A) = 0 .

❖ Nếu A là một biến cố ngẫu nhiên, 0  P( A)  1.

1.3 Các phương pháp tính xác suất


1.3.1 Phương pháp dùng sơ đồ ven.
Ví dụ 1: Trong 1 lớp 50 học sinh có: 20 người chơi bóng đá, 15 người chơi bóng chuyền,
10 người chơi bóng rổ, 8 người chơi bóng đá và bóng chuyền, 5 người chơi bóng đá và bóng rổ,
3 người chơi bóng chuyền và bóng rổ, 1 người chơi cả bóng đá, bóng chuyền và bóng rổ. Lấy
ngẫu nhiên 1 bạn trong lớp. Tính xác suất để người đó chơi ít nhất 1 môn bóng.
A. 0,2 B. 0,3 C. 0,6 D. 0,8
1.3.2 Phương pháp sử dụng tổ hợp
Ví dụ 1: Một hộp có 10 sản phẩm, trong đó có 6 chính phẩm. Lấy ngẫu nhiên 3 sản
phẩm. Tính xác suất để 3 sản phẩm đều là chính phẩm.
1 1 1 1
A. B. C. D.
2 3 4 6

Ví dụ 2. Một lớp có 50 sinh viên trong đó có 10 sinh viên học lực giỏi, 40 sinh viên
khá. Chọn ngẫu nhiên 3 sinh viên đi dự thi đại hội Đoàn trường. Tính xác suất để chọn
được 2 sinh viên giỏi.
A. 0,092 B. 0,028 C. 0,676 D. 0,232
Ví dụ 3. Một lớp có 15 sinh viên nam và 35 sinh viên nữ. Chọn ngẫu nhiên 3 sinh
viên. Tìm xác suất chọn được đúng một sinh viên nữ.
A. 0,125 B. 0,1875 C. 0,676 D. 0,875

GROUP: ÔN THI NEU|MENTORY NEU 2


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 4. Một nhóm gồm 12 nữ, 8 nam. Chia ngẫu nhiên thành 2 đối với số người
bằng nhau. Tìm xác suất một đội có toàn nữ.
1 3 8395 1
A. B. C. D.
4989 8398 8398 9892

1.4. Định lý cộng xác suất


1.4.1 Biến cố tổng
Biến cố C được gọi là biến cố tổng của hai biến cố A và B, ký hiệu là C = A + B , C
xảy ra khi ít nhất có 1 trong 2 biến cố A và B xảy ra.
Ví dụ 1: Hai người cùng bắn vào 1 bia.
A là biến cố “ người thứ nhất bắn trúng”
B là biến cố “ người thứ hai bắn trúng”
C là biến cố “bia bị trúng đạn”. Biểu diễn biến cố C theo hai biến cố A và B.
1.4.2 Biến cố xung khắc
Hai biến cố A và B được gọi là 2 biến cố xung khắc khi không thể cùng đồng thời xảy
ra trong 1 phép thử.
Ví dụ 1: Một bình có 3 quả cầu trắng, 2 quả cầu xanh. Lấy ngẫu nhiên 1 quả cầu.
Gọi A là biến cố “lấy được quả cầu trắng”, B là biến cố “lấy được quả cầu xanh”. Khi lấy
ra 1 quả cầu chỉ có thể lấy được 1 trong 2 màu, do đó A và B không thể cùng xảy ra trong
1 lần lấy.
Ví dụ 2: Xác suất để bắn bia trúng 10 điểm là 0,1, trúng 9 điểm là 0,2, trúng 8 điểm
là 0,25 và ít hơn 8 điểm là 0,45. Xạ thủ ấy bắn 1 viên đạn. Tìm xác suất để xạ thủ bắn được
ít nhất 9 điểm.
A. 0,1 B.0,2 C. 0,3 D. 0,4
1.4.3 Biến cố đối lập
Ví dụ : 1 xạ thủ bắn 1 viên đạn vào bia. Gọi A là biến cố “ xạ thủ bắn trúng”. Khi
đó biến cố “ xạ thủ bắn trượt” có tính chất đối lập, trái ngược với biến cố A, và 2 biến cố
trên đã bao gồm toàn bộ các khả năng xảy ra của phép thử. 2 biến cố trên được gọi là 2
biến cố đối lập. Biến cố đối lập với biến cố A được ký hiện là A .
1.5. Định lý nhân xác suất
1.5.1 Biến cố tích
Nếu biến cố C xảy ra khi A và B cùng đồng thời xảy ra thì Biến cố C được gọi là tích
của biến cố A và B, ký hiệu: C = A.B .

GROUP: ÔN THI NEU|MENTORY NEU 3


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ: Có 2 hộp, mỗi hộp đều đựng 1 số quả cầu trắng. Lấy ngẫu nhiên từ mỗi hợp
1 quả cầu. Gọi A là biến cố “ lấy được quả cầu trắng ở hộp thứ nhất”, B là biến cố “lấy
được quả cầu trắng ở hộp thứ hai.”. C là biến cố “ lấy được 2 quả cầu trắng”. Biểu diễn
biến cố C theo hai biến cố A và B.
1.5.2 Biến cố độc lập
Ví dụ 1: Trong bình có 3 quả cầu trắng và 2 quả cầu đen. Lấy ngẫu nhiên 1 quả cầu.
3
Gọi A là biến cố “ lấy được cầu trắng”. Ta thấy P( A) = .Sau khi lấy, quả cầu được bỏ
5
trở lại vào bình, sau đó tiếp tục lấy 1 quả cầu. Gọi B là biến cố “ lần thứ hai cũng lấy được
quả cầu trắng”. Sau lần lấy thứ nhất, do quả cầu được bỏ trở lại bình nên bình vẫn có 2
3
cầu trắng 3 cầu đen, do đó . P(B) = . Việc trạng thái của bình không thay đổi cho thấy
5
biến cố A xảy ra không ảnh hưởng tới kết quả của biến cố B.
2 biến cố A và B độc lập với nhau khi việc xảy ra biến cố này không ảnh hưởng đến việc
xảy ra của biến cố kia và ngược lại.
Tính chất: nếu A và B là 2 biến cố độc lập thì P( AB) = P( A).P( B)
Ví dụ 2: Có hai hộp đựng chi tiết. Hộp thứ nhất đựng 10 cái ốc, trong đó có 6 cái tốt.
Hộp thứ hai đựng 15 cái vít, trong đó có 9 cái tốt. Lẫy ngẫu nhiên từ mỗi hộp 1 chi tiết.
Tìm xác suất để lấy được 1 bộ ốc vít tốt.
9 16 1 3
A. B. C. D.
25 25 5 10
1.5.3 Biến cố phụ thuộc
2 biến cố A và B được gọi là 2 biến cố phụ thuộc khi việc xảy ra biến cố này ảnh hưởng tới
việc xảy ra biến cố kia.
Ví dụ: Ta tiếp tục ví dụ trên, trong trường hợp quả cầu lấy ra không được bỏ trở
lại bình. Khi đó nếu biến cố A xảy ra, tức là quả cầu lấy ra là cầu trắng, thì bình còn 2 quả
1
trắng 2 quả đen, xác suất xảy ra bằng ,và nếu biến cố A không xảy ra, bình còn 3 quả
2
3
trắng 1 quả đen, xác suất xảy ra bằng . Như vậy việc xảy ra biến cố A có ảnh hưởng tới
4
việc xảy ra của biến cố B. Hai biến cố trên được gọi là 2 biến cố phụ thuộc.
1.5.4 Xác suất có điều kiện
Tiếp tục ví dụ trên, khi biến cố A xảy ra, việc lần thứ hai lấy được cầu trắng về bản
chất có thể được hiểu là : “ lần thứ hai lấy được cầu trắng trong điều kiện lấy được cầu

GROUP: ÔN THI NEU|MENTORY NEU 4


[XÁC SUẤT THỐNG KÊ ] August 2020

trắng”, hay nói cách khác; “ B xảy ra trong điều kiện A xảy ra”, ta ký hiệu là P( B / A) . Tương

tự với trường hợp còn lại, ta có ký hiệu là P( B / A) .


Tính chất: P( AB) = P( A).P( B / A)
Ví dụ: Trong hòm có 7 chính phẩm và 3 phế phẩm. Lấy ngẫu nhiên lần lượt 2 sản
phẩm. Tìm xác suất để cả hai sản phẩm lấy ra đều là chính phẩm.
8 1 5 7
A. B. C. D.
15 3 19 15
1.5.5 Hệ quả của định lý cộng và định lý nhân xác suất
Định lý: P( A + B) + P( AB) = P( A) + P( B)
Ví dụ 1: Hai máy bay ném bom một mục tiêu, mỗi máy ném 1 quả với xác suất
trúng mục tiêu tương ứng là 0,7 và 0,8. Tìm xác suất để mục tiêu bị trúng bom.
A. 0,49 B. 0,94 C. 0,12 D. 0,21
Ví dụ 2: (1.42 SGT/48) Hai người cùng bắn vào một mục tiêu. Khả năng bắn trúng
của từng người là 0,8 và 0,9. Tìm xác suất
a. Chỉ có một người bắn trúng.
b. Có người bắn trúng mục tiêu
c. Cả hai người bắn trượt.
1.5.6 Bài tập tổng hợp
Bài 1: Hai công ty A và B cùng kinh doanh một mặt hàng. Xác suất để công ty A và B
kinh doanh có lãi lần lượt là 0,7 và 0,6. Xác suất để chỉ công ty A có lãi là 0,3. Tính xác
suất để công ty B có lãi trong điều kiện công ty A có lãi.
A. 0,571 B. 0,343 C. 0,216 D. 0,342
Bài 2: Xác suất gặp đèn đỏ thứ nhất là 0,3. Nếu gặp đèn đỏ thứ nhất thì xác suất gặp đèn
đỏ thứ 2 là 0,8 nếu không gặp đèn đỏ thứ nhất thì xác suất gặp đèn đỏ thứ hai là 0,2. Tính
xác suất một người đi đường gặp đèn đỏ thứ nhất trong điều kiện có gặp đèn thứ hai.
A. 0,21 B. 0,13 C. 0,63 D. 0,36
Bài 3: Một công ty tổ chức thi tuyển nhân viên, để được chọn các ứng viên phải

vượt qua 2 vòng thi, qua vòng trước mới được thi tiếp vòng sau. Vòng 1 có 50% số người

dự thi qua, vòng 2 công ty lấy 30% của số người đã qua vòng 1. Tính tỉ lệ người trượt ở

ngay vòng 1 trong tổng số người trượt?

A. 0,588 B. 0,422 C. 0,219 D. 0,192

GROUP: ÔN THI NEU|MENTORY NEU 5


[XÁC SUẤT THỐNG KÊ ] August 2020

Bài 4: Xác suất gặp đèn đỏ thứ nhất là 0,3. Nếu gặp đèn đỏ thứ nhất thì xác suất

gặp đèn đỏ thứ hai là 0,8. Nếu không gặp đèn đỏ thứ nhất thì xác suất gặp đèn đỏ thứ hai

là 0,2. Tính xác suất một người đi đường gặp đèn đỏ thứ nhất trong điều kiện có gặp đèn

thứ hai.

A. 0,192 B. 0,258 C. 0,632 D. 0,243

1.6. Công thức Bernoulli


Ví dụ: Trong phân xưởng có 5 máy hoạt động, xác suất để trong ca mỗi máy bị
hỏng đều bằng 0,1. Tìm xác suất để trong ca đó có đúng 2 máy bị hỏng.
1.7. Công thức xác suất đầy đủ.

1.7.1 Công thức xác suất đầy đủ


Ví dụ 1: Có 2 hộp giống nhau. Hộp thứ nhất đựng 10 sản phẩm, trong đó có 6 chính
phẩm. Hộp thứ hai đựng 15 sản phẩm, trong đó có 10 chính phẩm. Lấy ngẫu nhiên một
hộp và từ đó lấy ngẫu nhiên 1 sản phẩm. Tìm xác suất để lấy được chính phẩm

11 19 4 3
A. B. C. D.
30 30 29 13
Ví dụ 2: Có 2 hộp đựng sản phẩm. Hộp thứ nhất có 10 sản phẩm trong đó có 9 chính
phẩm. Hộp thứ hai có 20 sản phẩm trong đó có 18 chính phẩm. Từ hộp thứ nhất lấy ngẫu
nhiên 1 sản phẩm bỏ sang hộp thứ hai. Tìm xác suất để lấy ngẫu nhiên 1 sản phẩm trong
hộp thứ hai được chính phẩm.
A. 0,6 B. 0,7 C. 0,8 D. 0,9
Ví dụ 3: Một lô hàng có tỉ lệ sản phẩm tốt là 80%. Trước khi đưa ra thị trường người
ta sử dụng một thiết bị kiểm tra chất lượng để loại bỏ sản phẩm xấu. Thiết bị kiểm tra
nhận biết đúng sản phẩm tốt với xác suất 0,90 và nhận đúng sản phẩm xấu với xác suất
0,95. Tính tỉ lệ sản phẩm được đưa ra thị trường.
A. 0,73 B. 0,27 C. 0,19 D. 0,81
1.7.2 Công thức Bayes.
Ví dụ 1: Trước khi đưa sản phẩm ra thị trường người ta đã phỏng vấn ngẫu nhiên
130 khách hàng về sản phẩm và thấy có 34 người trả lời sẽ mua, 96 người trả lời có thể sẽ
mua. Kinh nghiệm cho thấy tỷ lệ khách hàng thực sự sẽ mua sản phẩm tương ứng với
những cách trả lời trên lần lượt là 40%, 20%. Trong số khách hàng thực sự mua sản phẩm
thì có bao nhiêu phần trăm trả lời sẽ mua sản phẩm?
A. 0,212 B. 0,415 C. 0,229 D. 0,313

GROUP: ÔN THI NEU|MENTORY NEU 6


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 2: Hộp 1 có 8 bi đỏ, 2 bi xanh. Hộp 2 có 6 bi đỏ, 4 bi xanh. Bỏ 1 viên từ hộp 1


sang hộp 2 rồi từ hộp 2 lấy ra 1 viên. Thấy viên bi lấy ra từ hộp 2 là bi đỏ. Tính xác suất bi
chuyển từ hộp 1 sang là bi xanh.
A. 0,176 B. 0,243 C. 0,159 D. 0,932

GROUP: ÔN THI NEU|MENTORY NEU 7


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 2: BIẾN NGẪU NHIÊN RỜI RẠC


VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT
2.1 Biến ngẫu nhiên
2.1.1 Định nghĩa biến ngẫu nhiên
Ví dụ: Gieo 1 con xúc sắc. Gọi X là “ số chấm xuất hiện”. X được gọi là một biến

ngẫu nhiên. X có thể nhận các kết quả 1, 2, 3, 4, 5, 6.

Vậy một biến số được gọi là biến ngẫu nhiên nếu kết quả của phép thử nó sẽ chỉ nhận 1 và

chỉ 1 các giá trị có thể có của nó tuỳ thuộc vào sự tác động của các nhân tố ngẫu nhiên.

2.1.2 Sự khác nhau giữa biến cố và biến ngẫu nhiên

Ví dụ gieo xúc sắc đã từng được lấy ở chương 1. Biến cố A là biến cố “ gieo được

mặt 6 chấm”, còn biến ngẫu nhiên X là “ số chấm xuất hiện”.

2.1.3 Phân loại biến ngẫu nhiên

2.1.3.1 Biến ngẫu nhiên rời rạc.

Trong phép thử về xúc sắc, X nhận các giá trị từ 1 đến 6. Các giá trị của X có thể

đếm được số lượng, nằm trong 1 tập hợp hữu hạn.

Biến ngẫu nhiên rời rạc là biến ngẫu nhiên mà các giá trị của nó nằm trong 1 tập hợp hữu

hạn hoặc đếm được.

Ví dụ: Y “ số người mua hàng tại một siêu thị trong ngày”. Y là biến ngẫu nhiên rời

rạc vì số người vào siêu thị có thể đếm được. X là “ số máy bị hỏng trong 1 phân xưởng

có 6 máy”. X là biến ngẫu nhiên rời rạc vì có thể đếm được các giá trị của X (1,2,3,4,5,6)

2.1.3.2 Biến ngẫu nhiên liên tục


Một xạ thử bắn súng vào bia, gọi X là “ khoảng cách
từ điểm chạm của viên đạn đến tâm bia”, ( minh họa qua
hình vẽ). Rõ ràng không thể đếm hết các giá trị X. X là biến
ngẫu nhiên liên tục.
Biến ngẫu nhiên liên tục là biến ngẫu nhiên mà ta
không thể liệt kê hết các giá trị của nó.

GROUP: ÔN THI NEU|MENTORY NEU 8


[XÁC SUẤT THỐNG KÊ ] August 2020

2.2 Bảng phân phối xác suất


Quy luật phân phối xác suất của biến ngẫu nhiên là sự tương ứng giữa các giá trị có
thể có của nó và các xác suất tương ứng với các giá trị đó.
Tiếp tục ví dụ về gieo xúc sắc, mỗi giá trị xi của X X 1 2 3 4 5 6
1 1 1 1 1 1 1
nhận xác suất tương ứng và đều bằng . Thể hiện dưới P
6 6 6 6 6 6 6
dạng bảng, ta được bảng phân phối xác suất sau:
2.3 Hàm phân phối xác suất
2.3.1 Hàm phân phối xác suất
Hàm phân phối xác suất của biến ngẫu nhiên, ký hiệu là F(x), là xác suất để biến
ngẫu nhiên X nhận giá trị nhỏ hơn x, với x là một số thực bất kỳ.
Công thức: F ( x) = P( X  x)
Hàm phân phối xác suất F(x) phản ánh mức độ tập trung xác suất ở bên trái điểm x.

2.3.2 Hàm phân phối và đồ thị hàm phân phối xác suất
Biến ngẫu nhiên X có bảng phân phối xác suất như sau: X 1 3 4
Nếu gọi F(x) là một hàm số biểu diễn xác suất tương ứng của P 0,1 0,5 0,4
các giá trị của X. Ta thấy
Nếu x  1, biến cố X  x là biến cố không thể có. Khi đó F ( x) = 0

Nếu 1  x  3 , biến cố X  x chỉ xảy ra khi X = 1 nên F ( x) = 0,1


Nếu 3  x  4 , biến cố X  x chỉ xảy ra khi X = 1 và X = 3 nên F ( x) = 0,1 + 0,5 = 0, 6
Nếu 4  x , biến cố X  x chỉ xảy ra khi X = 1 , X = 3 , X = 4 nên F ( x) = 0,1 + 0,5 + 0, 4 = 1
Vậy hàm phân phối xác suất có dạng
 0, x  1
 0.1,1  x  3

F ( x) = 
0.6, 3  x  4
 1, 4  x

GROUP: ÔN THI NEU|MENTORY NEU 9


[XÁC SUẤT THỐNG KÊ ] August 2020

Đồ thị hàm phân phối có dạng sau:

2.3.3 Các tính chất của hàm phân phối xác suất
❖ Tính chất 1: 0  F ( x )  1

❖ Tính chất 2: F(x) là hàm không giảm: P(a  X  b) = F ( b ) − F ( a )

❖ Tính chất 3: F ( x ) = 0 nếu x  xmin , F ( x ) = 1 nếu x  xmax

2.4 Các tham số đặc trưng


2.4.1 Kỳ vọng toán
Kỳ vọng toán được ký hiệu là E(X).
Kỳ vọng phản ánh giá trị trung bình của biễn ngẫu nhiên.
Đối với biến ngẫu nhiên rời rạc, E ( X ) = x1 p1 + x2 p2 + x3 p3 + ... + xn pn ( lấy từng giá
trị nhân với xác suất tương ứng)
Ví dụ 1: Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác suất X 1 3 4
như sau.Tìm kỳ vọng toán của X P 0,1 0,5 0,4
A. 3,2 B. 5,3 C. 2,5 D. 1,7
Ví dụ 2: Một người có 1 tỷ đồng. Nếu đầu tư vào 1 dự án thành công thì một năm lãi 200

triệu, thất bại thì mất 100 triệu. Xác suất thành công của dự án là 60%. Hỏi lãi suất ngân

hàng tối thiểu là bao nhiêu thì người đó không nên đầu tư vào dự án.

A. 8,6% B. 5% C. 7,5% D. 8%

Ví dụ 3: Một người có 500 triệu đồng. Nếu gửi ngân hàng thì lãi suất là 10% một
năm. Nếu đầu tư vào một dự án thành công thì một năm có lãi 200 triệu, thất bại thì mất
100 triệu. Xác suất thành công của dự án tối thiểu phải bằng bao nhiêu thì người đó mới
đầu tư vào dự án.
A. 0,61 B. 0,5 C. 0,66 D. 0,39

GROUP: ÔN THI NEU|MENTORY NEU 10


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 4: Xạ thủ bắn 4 viên đạn độc lập với xác suất trúng mỗi viên đều là 0,8.
Nếu trúng 2 viên liên tiếp hoặc hết đạn thì dừng bắn. Lập bảng phân phối xác suất của
số viên đạn được sử dụng. Tính trung bình số đạn sử dụng.
A. 1,264 B. 2,592 C. 3,313 D. 4,158

2.4.1.2 Các tính chất của kỳ vọng toán


Với X, Y là các biến ngẫu nhiên, C là hằng số thì ta có các tính chất sau.
❖ (1) E ( C ) = C ❖ (2) E (C + X ) = C + E ( X )
❖ (3) E ( C. X ) = C.E ( X ) ❖ (4) E ( X  Y ) = E ( X )  E ( Y )
❖ (5) E ( X , Y ) = E ( X ) .E ( Y ) nếu X và Y độc lập.

2.4.2 Phương sai


Phương sai của biến ngẫu nhiên được ký hiệu là V(X)
2.4.2.1 Cách tính phương sai

Cách tính phương sai của biến ngẫu nhiên: V ( X ) = E ( X 2 ) − ( E ( X ) )


2

Ví dụ 1: Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác X 1 3 4

suất như sau. Tìm phương sai của X P 0,1 0,5 0,4

A. 0,76 B. 1,67 C. 1,23 D. 3,41


Ví dụ 2: Đề thi có 2 câu hỏi độc lập, mẫu câu hỏi 5 điểm. Xác suất học sinh trả lời
đúng câu 1, 2 tương ứng là 0,6 và 0,7. Tính phương sai của số điểm đạt được.
A. 3,35 B. 6,21 C. 10,42 D. 11,25

2.4.2.2 Các tính chất của phương sai


❖ (1) V ( C ) = 0 ❖ (2): V ( C + X ) = V ( X )

❖ (3)  V ( CX ) = C2 .V ( X )

❖ (4) Phương sai của hai biến ngẫu nhiên độc lập: V ( X + Y ) = V ( X ) + V ( Y )

2.4.3 Độ lệch chuẩn


Độ lệch chuẩn của biến ngẫu nhiên X, ký hiệu là  x , là căn bậc 2 của phương sai:

x = V (X )

GROUP: ÔN THI NEU|MENTORY NEU 11


[XÁC SUẤT THỐNG KÊ ] August 2020

2.5 Quy luật không – một (Quy luật Bernoulli) – A(p)


2.5.1 Định nghĩa
Khi tiến hành một phép thử, biến cố A có thể xảy ra với xác suất bằng p. Gọi X là
số lần xuất hiện biến cố A trong phép thử đó. X là biến ngẫu nhiên rời rạc với 2 giá trị
bằng 0 ( nếu X không xuất hiện), hoặc bằng 1 ( nếu X xuất hiện). Xác suất để biến ngẫu
nhiên X nhận một trong 2 giá trị nói trên được biểu thị bằng công thức: Px = p x (1 − p )
1− x

Bảng phân phối xác suất có dạng: X 0 1


P 1− p p

2.5.2 Các tham số đặc trưng của quy luật không – một
(1) Kỳ vọng: E ( X ) = p (2) Phương sai: V ( X ) = p (1 − p )

Ví dụ: Điều tra ý kiến của khách hàng đối với sản phẩm của doanh nghiệp thì thấy
có 60% khách hàng thích sản phẩm đó. Tìm quy luật phân phối xác suất và các tham số
đặc trưng của thái độ ưa thích của khách hàng đối với sản phẩm.

2.6 Quy luật phân phối nhị thức

2.6.1 Định nghĩa


Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X = 0,1,2, ., n với các

xác suất tương ứng được tính bằng công thức Px = Cnx p x (1 − p )
n− x
gọi lầ phân phối theo quy luật

nhị thức với các tham số là n và p.


Bảng phân phối xác suất của X có dạng
X 0 1 2 … n

Cn0 p0 (1 − p ) Cn1 p1 (1 − p ) Cn2 p2 (1 − p ) Cnn pn (1 − p )


n n −1 n −2 0
P …

2.6.2 Các tham số đặc trưng


(1) Kỳ vọng: E( X ) = np
(2) Phương sai: V( X ) = np (1 − p )

(3) Mốt m0 ( giá trị có xác suất lớn nhất ) thỏa mãn: np + p − 1  m0  np + p

Ví dụ 1: Xác suất để sản phẩm sản xuất ra bị hỏng bằng 0,1


a. Tìm xác suất để trong 5 sản phẩm sản xuất ra không có quá hai sản phẩm bị hỏng
b. Tìm số sản phẩm hỏng trung bình trong 5 sản phẩm đó
c. Tìm số sản phẩm hỏng có khả năng xảy ra cao nhất

GROUP: ÔN THI NEU|MENTORY NEU 12


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 2. Xác suất khách mua 1 sản phẩm của hãng A quay lại mua lần hai là 0,67.
Điều tra ngẫu nhiên 20 khách đã mua 1 sản phẩm của hãng A. Số khách quay lại mua lần
2 có khả năng cao nhất là mấy người.
A. 14 B. 20 C. 13,4 D. 13
2.7. Quy luật Poisson - P( )
2.7.1 Định nghĩa
Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có X=0,1,2,…,n với các xác
 x −
suất tương ứng được tính bằng công thức Px = e gọi là phân phối theo quy luật Poisson với
x!
tham số  .Bảng phân phối xác suất của X có dạng
X 0 1 2 … n
P  0 − 1 −  2 − …  n −
e e e e
0! 1! 2! n!
2.7.2 Các tham số đặc trưng
(1) E( X ) =  (2) V( X ) =  (3)  − 1  m 0  

Ví dụ 1: Số khách hàng vào một cửa hàng bách hóa trong một giờ là biến ngẫu nhiên
tuân theo quy luật Poisson với mật độ ( số khách trung bình) là 8 khách hàng trong một
giờ. Tìm xác suất để trong một giờ nào đó có hơn 4 khách hàng vào.
A. 0,6 B. 0,7 C. 0,8 D. 0,9
2.7.3 Sự liên hệ với quy luật nhị thức
Quy luật nhị thức là quy luật được đặc trưng bởi 2 tham số n và p. Khi n quá lớn
và p quá nhỏ, công thức Bernoulli có thể thay thế bằng công thức Poisson với  = np
Điều kiện áp dụng n  20 và p  0,1
Ví dụ 1: (Đề thi K60) Một cửa hàng bán đồ điện tử quy định khách hàng có thể đổi
sản phẩm mới trong vòng 3 ngày kể từ lúc mua nếu sản phẩm bị lỗi. Biết khả năng khách
đổi sản phẩm mới trong 3 ngày là 0,1 %. Một ngày hãng bán được 2000 sản phẩm. Dùng
phân phối Poisson, tìm xác suất có đúng 2 sản phẩm phải đổi mới.
A. 0,12 B. 0,24 C. 0,27 D. 0,36

GROUP: ÔN THI NEU|MENTORY NEU 13


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 3: BIẾN NGẪU NHIÊN LIÊN TỤC


VÀ MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT
3.1. Biến ngẫu nhiên liên tục
Biến ngẫu nhiên liên tục là biến ngẫu nhiên có thể nhận mọi giá trị trong một
khoảng ( a, b ) , a, b 

3.2. Hàm phân phối xác suất


3.2.1 Hàm phân phối xác suất
Hàm phân phối xác suất của biến ngẫu
nhiên X là F ( x ) = P ( X  x ) , x 

3.2.2 Tính chất của hàm phối xác suất

❖ Tính chất 1: P(a  X  b) = F(b) − F(a)


❖ Tính chất 2:Với X là biến ngẫu nhiên liên tục thì P( X = x) = 0
❖ Tính chất 3: Với X là biến ngẫu nhiên liên tục thì
P(a  X  b) = P(a  X  b) = P(a  X  b)
Ví dụ1: Biến ngẫu nhiên liên tục X có hàm phân phối xác suất như sau:

 0, x  −1

3 3 1
F ( x) =  x + , −1  x 
4 4 3
 1
 1, x 
 3
 1
Tìm xác suất để X nhận giá trị trong khoảng 0, 
 3
1 1 1 1
A. B. C. D.
3 4 5 6
3.3 Hàm mật độ xác suất
3.3.1 Định nghĩa
Đối với biến ngẫu nhiên liên tục, do không thể đếm hết các giá trị của Biến ngẫu
nhiên nên người ta dùng hàm mật độ để biểu diễn quy luật phân phối xác suất.
Hàm mật độ: Hàm mật độ xác suất của biến ngẫu nhiên X ( được ký hiệu là f(x)) là
đạo hàm bậc nhất của hàm phân bố xác suất của biến ngẫu nhiên đó: f ( x) = F '( x)

GROUP: ÔN THI NEU|MENTORY NEU 14


[XÁC SUẤT THỐNG KÊ ] August 2020

3.3.2 Các tính chất của hàm mật độ


❖ Tính chất 1: Hàm mật độ xác suất luôn không âm: f '( x)  0x

❖ Tính chất 2: Xác suất của biến ngẫu nhiên X nhận giá trị
trong khoảng (a,b) bằng tích phân của hàm mật độ trong khoảng
đó:
b
P(a  X  b) =  f ( x)dx
a

❖ Tính chất 3: Hàm phân phối F(X) bằng tích phân suy rộng
của hàm mật độ xác định trong khoảng (−, x) :
x
F ( X ) =  f ( x)dx
−

❖ Tính chất 4: Tích phân trong khoảng ( −, + ) của hàm


+
mật độ bằng 1: −
f ( x)dx = 1

Ví dụ 1 : Hàm phân phối xác suất của biến ngẫu nhiên liên
tục X có dạng
 0, x  0

F ( x) =  x 2 , 0  x  1
 1, x  1

a. Tìm hàm mật độ xác suất f ( x)


b. Tìm xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng (0,25;0,75)

GROUP: ÔN THI NEU|MENTORY NEU 15


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 2: Tuổi thọ của một loại sản phẩm là biến ngẫu nhiên liên tục có hàm mật độ
xác suất như sau ( chú ý đơn vị của x là giờ)
a
 , x  400
f ( x) =  x 2

 0, x  400
Tìm xác suất đề lấy ngẫu nhiên 1 sản phẩm thì tuổi thọ của nó kéo dài ít nhất 600 giờ.
A. 0,23 B. 0,45 C. 0,67 D. 0,89
Ví dụ 3: Điểm tổng kết môn học của sinh viên là biến ngẫu nhiên liên tục vói hàm
mật độ xác suất:
 0 ; x  0,10

f ( x ) =  0,04 x ; x  0,5
0, 4 − 0,04 x ; x  5,10

Tìm tỷ lệ sinh viên có điểm môn học từ 8 đến 9
A. 0,01 B. 0,03 C. 0,05 D. 0,06
Ví dụ 4: Thời gian hoàn thành một công việc (giờ)
có hàm mật độ xác suất như hình bên.
Tính xác suất công việc được hoàn thành trước 2 giờ.
A. 0,25 B. 0,25
C. 0,75 D. 0,95

Ví dụ 5: Cho hàm mật độ xác suất f (x ) có đồ thị


như hình dưới đây. Tìm a

A. 0,1 B. 0,2 C. 0,3 D. 0,4

3.4 Các tham số đặc trưng


3.4.1 Kỳ vọng
+
Đối với biến ngẫu nhiên liên tục: E ( X ) = −
xf ( x)dx

GROUP: ÔN THI NEU|MENTORY NEU 16


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 1: Tìm kỳ vọng toán của biến ngẫu nhiên liên tục X có hàm mật độ như sau:
3 2
 ( x + 2 x), x  ( 0,1)
f ( x) =  4

 0, x  ( 0,1)
1 2 1 1
A. B. C. D.
8 5 16 32

Ví dụ 2: Lương nhân viên của một công ty là biến ngẫu nhiên liên tục X có hàm mật
độ xác suất f (x )

 x2
 , x  (1,10)
f (x ) =  333
 0 , x  (1,10)

Lương trung bình của nhân viên công ty này xấp xỉ bằng
A. 7,5 B. 5,5 C. 10 D. 1

3.4.2 Phương sai

Cách tính phương sai đối với biến ngẫu nhiên liên tục: V ( X ) = E ( X 2 ) − ( E ( X ) )
2

+
Trong đó: E ( X 2 ) =  x 2 f ( x)dx
−

Ví dụ: Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất như sau:

2 x, x  ( 0,1)

f ( x) = 
 0, x  ( 0,1)

Tìm phương sai của X.
1 1 1 1
A. B. C. D.
18 36 16 32
3.4.3 Độ lệch chuẩn
Độ lệch chuẩn của biến ngẫu nhiên X, ký hiệu là  x , là căn bậc 2 của phương sai:

x = V (X )

GROUP: ÔN THI NEU|MENTORY NEU 17


[XÁC SUẤT THỐNG KÊ ] August 2020

3.4.4 Hệ số biến thiên


x
Hệ số biến thiên: CV = .100% dùng để đo mức độ thuần nhất của một phân
E( X )
phối. Giá trị của nó càng nhỏ thì mức độ thuần nhất càng lớn.
3.4.5 Trung vị và mốt
❖ Trung vị, ký hiệu là md, là giá trị chia phân phối xác suất
của biến ngẫu nhiên thành 2 phần bằng nhau.
❖ Mốt, ký hiệu mà m0, là giá trị tại đó f(x) đạt cực đại.
3.4.6 Giá trị tới hạn
Giá trị tới hạn mức  của biến ngẫu nhiên X, ký hiệu là
X  , là giá trị của X thỏa mãn điều kiện
P( X  X  ) = 
Giá trị tới hạn x là giá trị sao cho diện tích giới hạn bởi

trục hoành, đường cong hàm mật độ xác suất và đường thẳng
x = x bằng  .
3.5 Quy luật đều
3.5.1 Định nghĩa
Biến ngẫu nhiên liên tục X gọi là phân phối theo
quy luật đều trong khoảng (a,b) nếu hàm mật độ xác suất
 1
 , x  ( a, b )
của nó có dạng: f ( x ) =  b − a
0,
 x  ( a, b )

3.5.2 Các tham số đặc trưng

( b − a)
2
a+b
(1) Trung bình: E( X ) = (2) Phương sai: V( X ) =
2 12
Ví dụ: Thời gian hoàn thành một công
việc ( phút) có hàm mật độ xác suất như hình
bên. Sử dụng hình học tính xác suất công việc
được hoàn thành trong khoảng từ 5 đến 10 phút.
A. 0,1 B. 0,2
C. 0,5 D. 0,8

GROUP: ÔN THI NEU|MENTORY NEU 18


[XÁC SUẤT THỐNG KÊ ] August 2020

3.6 Quy luật phân phối chuẩn

3.6.1 Định nghĩa

Biến ngẫu nhiên X được gọi là phân phối theo quy luật chuẩn với các tham số 

−( x −  )2
và  2 nếu hàm mật độ có dạng: f ( x ) = e 2
1 2
. Ký hiệu X N ( ,  2 )
 2
Công thức này khó hiểu, không cần nhớ, chỉ cần

hiểu quy luật phân phối của X được biểu diễn theo 2

tham số  ( trung bình của X) và  2 (phương sai X)

Đồ thị hàm phân phối chuẩn có dạng hình quả chuông,

đối xứng qua đường thẳng x = 

3.6.2 Các tham số

E(X ) =  V (X ) =2

Khi  tăng thì đồ thị f(x) dịch sang phải. Khi  tăng thì đồ thị f(x) thấp xuống và rộng ra

GROUP: ÔN THI NEU|MENTORY NEU 19


[XÁC SUẤT THỐNG KÊ ] August 2020

3.6.3 Phân phối chuẩn hoá

3.6.3.1 Biến ngẫu nhiên phân phối chuẩn hóa


Khi biến ngẫu nhiên X tuân theo quy luật phân
X
phối chuẩn thì biến ngẫu nhiên Z tuân theo quy

luật phân phối chuẩn hoá với trung bình bằng 0 và độ


lệch chuẩn bằng 1. Ký hiệu: Z N (0,1) .

1 − Z2
2

Hàm mật độ xác suất của Z có dạng  ( Z ) = e


2
Đồ thị hàm mật độ xác suất có dạng hình quả
chuông, đối xứng qua trục tung
3.6.3.2 Hàm phân phối xác suất của biến ngẫu nhiên phân phối chuẩn hóa
Hàm phân phối xác suất chuẩn hóa của biến ngẫu nhiên Z có công thức:
−Z 2
1
( x) =   ( Z ) dZ =
x x

−
2
−
e 2
dZ

Đối với Z là biến ngẫu nhiên phân phối chuẩn hóa, ta có các tính chất của hàm  ( x )

❖  ( −x) +  ( x) = 1

❖ P(Z  b) =  ( b )

❖ P( Z  a ) = 1 −  ( a )

❖ P( Z  −a ) = P ( Z  a ) =  ( a )

❖ P(a  Z  b) =  ( b ) −  ( a )

3.6.3.3 Giá trị tới hạn chuẩn


Giá trị tới hạn Chuẩn mức  , ký hiệu là z , được xác định bởi P(Z  z ) = 

Ví dụ 1: Thời gian xem tivi trong tuần của người Việt Nam tuân theo quy luật phân
phối chuẩn với trung bình là 16 giờ và độ lệch chuẩn là 4 giờ. Chọn ngẫu nhiên một người
để hỏi, tính xác suất để thời gian xem tivi của người này nằm trong khoảng 15 giờ đến 18
giờ.
A. 0,0788 B.1,1186 C.1,0788 D.0,2902

GROUP: ÔN THI NEU|MENTORY NEU 20


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 2: Cho tuổi thọ sản phẩm ( đơn vị: tháng)là BNN phân phối Chuẩn với trung
bình là 20 và phương sai là 25. Thời gian bảo hành miễn phí là 1 năm. Tỷ lệ sản phẩm phải
bảo hành miễn phí là:
A. 5,48% B. 2,28% C. 94,52% D. 37,45%
Ví dụ 3: Tuổi thọ sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình
là 3,6 năm và độ lệch chuẩn là 1,2 năm. Khi bán được 1 sản phẩm thì cửa hàng lãi 70
nghìn đồng, nếu sản phẩm bị hỏng trong thời gian bảo hành thì cửa hàng phải chi 100
nghìn đồng cho việc bảo hành (chịu lỗ 30 nghìn đồng). Quy định thời gian bảo hành
là 1 năm. Nếu muốn tỷ lệ bảo hành là 1,2% nên quy định thời gian bảo hành là bao
lâu?
A. 0,888 B. 0,212 C. 0,76 D. 0,294
Ví dụ 4: Chi tiêu của người dân là biến ngẫu nhiên có phân phối chuẩn với mức chi
tiêu trung bình là 8 triệu/tháng. Biết có 20% người dân có mức chi tiêu nhiều hơn 11
triệu/tháng. Tính xác suất để 1 người có mức chi tiêu lớn hơn 5 triệu.
A. 0,6 B. 0,4 C. 0,5 D. 0,2
3.6.4 Hội tụ của phân phối B(n,p) về chuẩn
Với X là biến ngẫu nhiên tuân theo quy luật B(n, p)

Khi n  100 thì X N ( ,  2 ) với  = np và  2 = np(1 − p) .


Ví dụ 1: Cho biến ngẫu nhiên X phân phối nhị thức với n = 400, p = 0, 5 . Tìm xác

suất để X nhận giá trị trong khoảng (195,205) .

A. 0,383 B. 0,617 C. 0,171 D. 0,829

3.7. Quy luật Khi bình phương, quy luật Student, quy luật Fisher
Đối với 3 quy luật này, chúng ta cần biết cách tra bảng phụ lục trong tờ công thức
để làm các bài tập ở phần thống kê.

3.7.1 Quy luật Khi bình phương (  )


2

Biến ngẫu nhiên liên tục  tuân theo quy luật khi bình phương với bậc tự do n
2

được ký hiện là  2  2 ( n)
E(2 ) = n V (  2 ) = 2n

GROUP: ÔN THI NEU|MENTORY NEU 21


[XÁC SUẤT THỐNG KÊ ] August 2020

Đối với quy luật Khi bình phương, chúng ta phải tra cứu giá trị 2( n ) trong mặt sau
của tở công thức, với  là giá trị tới hạn, và n là bậc tự do.
2 ( 5)
Ví dụ, khi tra giá trị 0,05 , ta nhìn vào hàng trên cùng, tìm ô 0,05, cột ngoài cùng,
tìm ô 5 rồi dóng vào trong bảng, ta được giá trị tương ứng: 11,07

Đồ thị hàm f (  2 ) của quy luật Khi bình

phương có dạng như sau:


Công thức: p(  2  2( n ) ) = 

Mối quan hệ giữa các giá trị 2( n ) và đồ thị.


Xét trường hợp n = 5 . Đồ thị có dạng sau:
2( 5)
Ta có: 0,05 = 11,07

Xác suất để   11,07 bằng 0,05


2

Diện tích miền lớn hơn 11,07 trên đồ thị bằng 0,05

3.7.2 Quy luật Student


Biến ngẫu nhiên liên tục T tuân theo quy luật Student với n bậc tự do, ký hiệu
T T ( n)
n
E (T ) = 0,V (T ) =
n−2
Đối với quy luật Student, chúng ta tra cứu giá trị, tn . Cách tra hoàn toàn tương tự

quy luật khi bình phương.


( )
9
Chú ý: Ta có tính chất: t1n− = −t( n) .Khi tra giá trị, t0,95 , trong bảng không có dòng
( 9) ( 9) ( 9)
0,95 nên ta tìm giá trị t0,05 = 1,833 . Ta được t0,95 = −t0,05 = −1,833

Khi n  30 , ta lấy các giá trị ở dòng cuối cùng. Ví dụ t0,1


100
= 1,282 .

Ta có ký hiệu z0,1 = 1, 282

Đồ thị hàm f (t ) của quy luật Student có dạng sau:


Diện tích phần gạch chéo bằng 
Công thức: P(T  tn ) = 

GROUP: ÔN THI NEU|MENTORY NEU 22


[XÁC SUẤT THỐNG KÊ ] August 2020

Mối liên hệ giữa các giá trị t( n ) với đồ thị.


( 9)
Xét trường hợp n = 9 . Ta thấy t0,05 = 1,833

Quy luật Student trong trường hợp n = 9 có


dạng như hình bên.
• Xác suất để T  1,833 bằng 0,05
• Diện tích phần đồ thị biểu diễn miền
T  1,833 bằng 0,05

3.7.3 Quy luật Fisher


( 24,39)
Trong quy luật Fisher, chúng ta tra cứu giá trị f0,95 . Cách tra hoàn toàn tương tự.

( n1 ,n2 ) 1
Chú ý tính chất: f = ( 24,39)
( n2 ,n1 ) .Ví du: Cần tra cứu giá trị f0,95 , ta có:
f1−
(24,39 ) 1 1
f0,95 = (39,24 )
= .
f
0,05
1,800

GROUP: ÔN THI NEU|MENTORY NEU 23


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 4: BIẾN NGẪU NHIÊN HAI CHIỀU


4.1. Bảng phân phối xác suất của biến ngẫu nhiên hai chiều
Xét ví dụ sau: Trong một cuộc điều tra thu nhập của 100 cặp vợ chồng, người ta
ký hiệu X “ là thu nhập của chồng” , Y “ là thu nhập của vợ”. X,Y là các biến ngẫu nhiên.
Các mức thu nhập của vợ của trồng đều nằm trong các mức 10, 20,30, 40 triệu

đồng/tháng. Mối quan hệ giữa X và Y được biểu diễn thông qua bảng sau:
Y 10 20 30 40
X
10 0,2 0,04 0,01 0
20 0,1 0,36 0,09 0
30 0 0,05 0,1 0
40 0 0 0 0,05
4.2. Bảng phân phối xác suất biên
Ví dụ 1: Cho bảng phân phối xác suất đồng thời của biến ngẫu nhiên 2 chiều rời

rạc (X,Y) như sau. Tìm P(X = 5 / Y  1)

A. 0,05 B. 0,15 C. 0,176 D. 2/3

Ví dụ 2: X là chi phí quảng cáo (triệu), Y là Y 200 320 500

doanh thu (triệu) của một loại sản phẩm có bảng phân X

phối xác suất đồng thời như sau 10 0,2 0,1 0,1

Xác suất P(Y − X  300) bằng 20 0,15 0,2 ?

A. 0,4 B. 0,65 C. 0,45 D. 0,2

Ví dụ 3: Cho bảng phân phối xác suất đồng thời Y 1 2 3


của biến ngẫu nhiên 2 chiều rời rạc (X,Y) như sau. Tính X
E(X / Y = 2) 4 0,1 0,2 0,5
5 0,05 0,05 0,1
A. 2,5 B. 1,4 C. 4,6 D. 4,2

GROUP: ÔN THI NEU|MENTORY NEU 24


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 4: X là chi phí quảng cáo (triệu), Y là doanh Y 200 320 500


thu (triệu) của một loại sản phẩm có bảng phân phối xác X
suất đồng thời như sau 10 0,2 0,1 0,1
Doanh thu trung bình khi chi phí quảng cáo là 10 triệu 20 0,15 0,2 ?
bằng
A. 122 B. 340 C. 341 D. 305

Ví dụ 5: Cho bảng phân phối xác suất đồng thời của Y 1 2 3


biến ngẫu nhiên 2 chiều rời rạc (X,Y) như sau. Tính X
V (Y / X = 4) 4 0,1 0,2 0,5
5 0,05 0,05 0,1
A. 0,5 B. 0,55 C. 0,6 D. 0,75
4.3. Các tham số đặc trưng
4.3.1 Hiệp phương sai
Hiệp phương sai của hai biến ngẫu nhiên X , Y được ký hiệu là cov(X,Y)
cov( X ; Y ) = E( XY ) − E( X ).E(Y )

Ý nghĩa: Hiệp phương sai là tham số đo sự tương quan của X và Y


❖ Nếu cov( X , Y )  0 ta nói X, Y tương quan thuận chiều và ngược lại.

❖ Nếu cov( X , Y ) = 0 ta nói X, Y không tương quan nhau.

Chú ý: Nếu X độc lập Y thì cov( X , Y ) = 0 và X , Y không tương quan. Tuy nhiên nếu

cov( X , Y ) = 0 thì X không tương quan Y nhưng chưa chắc X, Y độc lập với nhau.

Ví dụ 1: Cho bảng phân phối xác suất đồng thời của Y 1 2 3


biến ngẫu nhiên 2 chiều rời rạc (X,Y) như sau. Tính X
cov(X,Y ) 4 0,1 0,2 0,5
5 0,05 0,05 0,1
A. 10,25 B. 0 C. -0,04 D. 0,05

GROUP: ÔN THI NEU|MENTORY NEU 25


[XÁC SUẤT THỐNG KÊ ] August 2020

4.3.2 Hệ số tương quan


Hệ số tương quan được ký hiệu là  x , y

cov( X , Y )
 x, y =
 x . y
Các tính chất
❖  x, y =  y , x

❖ −1   x, y  1

❖  x, y  0 : tương quan cùng chiều,  x, y  0 : tương quan ngược chiều.

❖ Nếu  x, y = 0 thì X và Y không tương quan

❖  x , y = 1: X, Y có quan hệ hàm số bậc 1 với nhau

Ý nghĩa: hệ số tương quan dùng để đo mức độ tương quan tuyến tính giữa X và Y.

4.3.3 Phương sai


Với X, Y là 2 biến ngẫu nhiên, ta có công thức sau
V (a X  bY ) = a 2 .V ( X ) + b2 .V (Y )  2ab.cov( X , Y )

Khi X, Y độc lập: cov( X , Y ) = 0 : V ( X + Y ) = V ( X ) + V (Y )


Ví dụ 1:Thu nhập của hộ gia đình là biến ngẫu nhiên có trung bình là 19 triệu và độ
lệch chuẩn là 4 triệu. Chi tiêu của hộ gia đình có trung bình là 14 triệu và độ lệch chuẩn là
3 triệu. Hệ số tương quan giữa thu nhập và chi tiêu là 0,6. Tính phương sai của biến tiết
kiệm của hộ gia đình.
A. 10,6 B. 5,3 C. 21,2 D. 2,8
4.4 Bài toán xét sự độc lập của BNN 2 chiều
Xét ví dụ: Cho bảng phân phối xác suất đồng thời với X là Y 6 8
X
lương của vợ (triệu đồng/ tháng) và Y là lương của chồng (triệu
6 0,24 0,36
đồng/ tháng) trong một gia đình. Lương của vợ và chồng có độc
lập với nhau hay không? 8 0,16 0,24

Định lý: Xét sự độc lập của 2 biến ngẫu nghiên X, Y.


• Với tất cả các cặp xi , y j thỏa mãn: P( X = xi ).P(Y = y j ) = P( X = xi , Y = y j ) thì X, Y

độc lập
• Chỉ cần tồn tại 1 cặp xi , y j thỏa mãn P( X = xi ).P(Y = y j )  P( X = xi , Y = y j ) thì X, Y

phụ thuộc
Trong bài trên, tất cả các cặp ra bằng nhau hết nên X, Y độc lập.

GROUP: ÔN THI NEU|MENTORY NEU 26


[XÁC SUẤT THỐNG KÊ ] August 2020

PHẦN II
THỐNG KÊ

GROUP: ÔN THI NEU|MENTORY NEU 27


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 6: CƠ SỞ LÝ THUYẾT MẪU


6.1. Thống kê - Tổng thế - Mẫu – Đồ thị - Biến
6.1.1 Thống kê – Tổng thể - Mẫu
Xét ví dụ: 1 công ty mỹ phẩm muốn điều tra nhu cầu của nữ sinh trường N về 1
loại son mới sản xuất. Trường N có rất nhiều nữ sinh, công ty không thể điều tra hết, do
đó công ty lựa chọn 1 nhóm khoảng 500 bạn nữ sinh theo năm học và thu nhập để điều
tra.
Việc điều tra, thu thập số liệu thực tế gọi là thống kê.
Năm học, thu nhập là các biến trong thống kê.
Toàn bộ nữ sinh trường N là tổng thể.
500 bạn nữ sinh tham gia khảo sát là mẫu.
Khi điều tra theo năm học, kết quả thu được như sau:
Năm Năm nhất Năm high Năm bar Năm tư Tổng
Sở thích
Thích 100 50 40 10 200

Không thích 25 50 160 115 350

Tổng 125 100 200 75 500

6.1.2 Đồ thị
Từ bảng, nếu phân theo số học sinh tham gia khảo sát theo năm học, có thể thể
hiện thông qua dạng biểu đồ như sau:

200

125
Đồ thị cột 100
75

Năm nhất Năm high Năm bar Năm tư

Năm tư 75

Năm bar 200


Đồ thị thanh ngang
Năm high 100

Năm nhất 125

GROUP: ÔN THI NEU|MENTORY NEU 28


[XÁC SUẤT THỐNG KÊ ] August 2020

Nếu phân chia theo sở thích, có thể biểu diễn thông qua biểu đồ sau:

Thích, 200,
36%
Biểu đồ tròn
Không thích,
350, 64%

6.1.3 Biến
Khi điều tra các mẫu người ta điều tra dựa trên các dấu hiệu. Các dấu hiệu được
thể hiện dưới các biến.
❖ Biến định tính: định danh và thứ bậc
Định danh ví dụ như tên, địa chỉ, ngành học
Thứ bậc: thứ hạng…
❖ Biến định lượng: có đơn vị đo lường cụ thể
Rời rạc: tuổi, thu nhập
Liên tục: thời gian, cân nặng

6.1.4 Các tham số đặc trưng của tổng thể và mẫu


Tham số Tổng thể Mẫu
Trị số trung bình của tất cả các phần Trị số trung bình của tất cả các
Trung bình tử trong tổng thể phần tử trong mẫu
Ký hiệu:  Ký hiệu: x
Trung bình của bình phương các sai Trung bình của bình phương các
Phương sai lệch giữa X và  sai lệch giữa X trong mẫu và x
Ký hiệu:  2 Ký hiệu: s 2
Tỷ số giữa phần tử trong tổng thể Tỷ số giữa phần tử trong mẫu
mang dấu hiệu nghiên cứu chia cho mang dấu hiệu nghiên cứu chia
Tần suất
tổng số phần tử của tổng thế. cho tổng số phần tử của mẫu.
Ký hiệu: p Ký hiệu: 𝑝̂

GROUP: ÔN THI NEU|MENTORY NEU 29


[XÁC SUẤT THỐNG KÊ ] August 2020

6.2. Các tham số đặc trưng của mẫu


6.2.1 Trung bình và phương sai
1 n 1 n
Trung bình của mẫu được tính theo công thức: x =  i
n i =1
X hoặc x =  ni X i với
n i =1
ni là tần suất của lớp thứ i.

Phương sai của mẫu được tính theo công thức: s 2 =


n
n −1 (
x2 − x( ))
2

Độ lệch chuẩn: s
Phương sai, độ lệch chuẩn dùng để đo giá trị dao động, mức độ biến động xung
quanh giá trị trung bình. Trong thống kê, thông thường phương sai, độ lệch chuẩn càng
nhỏ càng tốt.
Ví dụ: Kiểm tra 25 bao hàng cùng loại ta thu được kết quả.
Trọng lượng 57,5 62,5 67,5 72,5
Số bao hàng 2 3 10 10
Tính trung bình và độ lệch chuẩn của mẫu.
A. 68,1 và 4,637 B. 68,1 và 21,5
C. 25,1 và 68,1 D. 4,637 và 21,5

6.2.2 Tần suất mẫu


Trong mẫu kích thước n có X A phần tử có dấu hiệu của biến cố A.
XA
Tần suất mẫu có công thức: 𝑝̂ =
n
p (1 − p )
Nếu P( A) = p thì E ( pˆ ) = p và V ( pˆ ) =
n
6.2.3 Trung vị
Trung vị, ký hiệu là Xd, là giá trị nằm ở chính giữa chia mẫu thành hai phần bằng nhau.
Ví dụ 1
Tính trung bình và trung vị của mẫu sau w = {10,11,14,15,18, 20, 22,16}

6.2.4 Hệ số biến thiên


S
Hệ số biến thiên, ký hiệu là CV: CV = .100%
X
Hệ số biến thiên được đo bằng phần trăm và được dùng để nhận xét về độ thuần
nhất của phân phối mẫu. Nếu CV<15% thì mẫu được xem là khá thuần nhất.

GROUP: ÔN THI NEU|MENTORY NEU 30


[XÁC SUẤT THỐNG KÊ ] August 2020

6.2.5 Hệ số bất đối xứng (Skewness)


Hệ số bất đối xứng được ký hiệu là a3 . Dấu của hệ số bất đối xứng cho biết hình
dạng của đồ thị phân phối giá trị mẫu.

Trung bình < Trung vị < Mốt


Hệ số bất đối xứng <0

Phân phối lệch trái ( lệch âm)

Mốt < Trung vị < Trung bình


Hệ số bất đối xứng >0

Phân phối lệch phải ( lệch dương)

Trung bình = Trung vị = Mốt


Hệ số bất đối xứng =0

Đối xứng
6.2.6 Hệ số nhọn(Kurtosis)

Hệ số nhọn được ký hiệu là a4 . Hệ số nhọn biểu thị cho độ nhọn của đồ thị biểu

diễn các giá trị của mẫu.

6.2.7 Mốt
Mốt ký hiệu là X 0 , là giá trị có tần số lớn nhất trong dãy số liệu mẫu.

GROUP: ÔN THI NEU|MENTORY NEU 31


[XÁC SUẤT THỐNG KÊ ] August 2020

6.3. Bài toán suy diễn


Suy diễn thống kê là việc suy đoán các tính chất của một mẫu ngẫu nhiên rút ra từ tổng
thể khi đã biết các tham số đặc trưng của tổng thể.
Giả sử tổng thể nghiên cứu biến ngẫu nhiên X phân phối chuẩn với kỳ vọng toán
 và phương sai  2 đã biết. Ta có thể suy đoán về giá trị trung bình, phương sai, tần
suất của mẫu.

6.3.1 Suy diễn về giá trị trung bình của mẫu


Xét ví dụ: Tiền lương của một nhân viên phân phối Chuẩn với trung bình là
200$/tuần, độ lệch chuẩn là 50$/tuần. Chọn ngẫu nhiên 100 nhân viên để phỏng vấn. Xác
suất để lương trung bình của họ nằm trong khoảng 195 đến 205 $/tuần là bao nhiêu.
A. 0,6826 B. 0,1587 C. 1,6826 D. 0,8413

Ví dụ 2: Thời gian xem ti vi trong tuần của người Việt Nam tuân theo quy luật phân

phối chuẩn với trung bình là 16 giờ và độ lệch chuẩn là 4 giờ. Chọn ngẫu nhiên 100 người

để khảo sát, tính xác suất để thời gian xem tivi trung bình của 100 người này nằm trong

khoảng từ 15 giờ đến 18 giờ mỗi tuần?

A. 0,5 B. 1 C. 1,0062 D.0,9938

Ví dụ 3: Chi tiêu hàng tháng của sinh viên là biến ngẫu nhiên phân phối chuẩn với

chi tiêu trung bình là 5 triệu, độ lệch chuẩn là 2 triệu. Tính xác suất để chi tiêu trung bình

của 400 sinh viên lớn hơn 4,8 triệu.

A. 0,523 B. 0,0028 C. 0,0062 D.0,9772

Ví dụ 4: Độ dài sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình là

200mm và độ lệch chuẩn là 8mm. Lấy ngẫu nhiên 16 chi tiết. Với xác suất là 0,95 thì độ

dài trung bình của các chi tiết này tối thiểu bao nhiêu?

A. 196,72 B. 231,4 C. 158,6 D. 212,6

6.3.2. Suy diễn cho tần suất mẫu

Xét ví dụ: Tỷ lệ tử vong khi bị nhiễm vi-rút Corona là 4%. Với xác suất 0,95 tỷ lệ tử

vong tối thiểu từ 100 người nhiễm vi-rút Corona là bao nhiêu?

A. 0,0077 B. 0,1265 C. 0,9192 D. 0,3451

GROUP: ÔN THI NEU|MENTORY NEU 32


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 2: Theo thống kê thì tỷ lệ phế phẩm trong số các sản phẩm do một máy sản

xuất ra là 5%. Trong số 200 sản phẩm do máy sản xuất ra được chọn ngẫu nhiên thì có tối

đa bao nhiêu phế phẩm, với xác suất là 95%.

A.15 B.20 C.17 D.10

GROUP: ÔN THI NEU|MENTORY NEU 33


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 7: ƯỚC LƯỢNG


Cho biến ngẫu nhiên X với quy luật phân phối xác suất đã biết song chưa biết tham
số  nào đó. Ta ước lượng giá trị  bằng cách từ tổng thể rút ra một mẫu ngẫu nhiên,
dựa vào đó xây dựng một thống kê 𝜃̂ dùng để ước lượng 
7.1 Phương pháp ước lượng điểm
7.1.1 Các tiêu chuẩn chọn hàm ước lượng
Giả sử cần ước lượng tham số  . Lập mẫu ngẫu nhiên W. Chọn thống kê
G = f ( X 1, X 2 , X 3 ,..., X n ) Lập mẫu cụ thể w, tính được giá trị của thống kê là
ˆ = f (X1, X2, X 3,..., Xn gọi là hàm ước lượng của 
Các tiêu chuẩn chọn hàm ước lượng

❖ Ước lượng không chệch:  là ước lượng không chệch của  nếu 𝐸(𝜃̂ )= 
❖ Ước lượng hiệu quả: ước lượng có phương sai nhỏ nhất
V (ˆ1 )  V (ˆ2 ) : ˆ1 hiệu quả hơn ˆ2
Ước lượng không chệch và hiệu quả là ước lượng tốt nhất.
7.1.2 Bài tập ước lượng điểm
Ví dụ 1:Để ước lượng trung bình tổng thể m ta lập mẫu ( X 1 , X 2 , X 3 ) và sử dụng 3
1 1 1 1 1 1 2 1 3
thống kê sau: G1 = X1 + X 2 + X 3 G2 = X1 + X 2 + X 3 G3 = X1 + X 2 + X3
3 3 3 6 3 2 5 5 10
Thống kê nào là ước lượng không chệch của m. Trong các thống kê không chệch, thống
kê nào hiệu quả hơn?
Ví dụ 2: Từ tổng thể ta lập mẫu ngẫu nhiên (X1, X2, X 3, X 4 ) . Trong các thống kê sau
dùng để ước lượng trung bình thổng thể thì thống kê nào hiệu quả hơn.
X1 + 2X2 + 3X 3 + 4X 4 X1 + X 2 + X 3 + X 4
A. G2 = B. G1 =
10 4
4X1 + 3X2 + 2X 3 + 4X 4 X1 + X 2 + X 3 + X 4
C. G4 = D. G3 =
10 5
7.2 Phương pháp ước lượng bằng khoảng tin cậy
7.2.1 Định nghĩa
Khoảng ( G1 , G2 ) của thống kê G được gọi là khoảng tin cậy của tham số  nếu với
xác suất bằng 1 −  cho trước thỏa mãn điều kiện: P ( G1    G2 ) = 1 − 
Xác suất 1 −  được gọi là độ tin cậy của ước lượng.
I = G2 − G1 được gọi là độ dài khoảng tin cậy.

GROUP: ÔN THI NEU|MENTORY NEU 34


[XÁC SUẤT THỐNG KÊ ] August 2020

7.2.2 Ước lượng cho trung bình của tổng thể


7.2.2.1 Dạng bài toán ước lượng
Xét X N(, 2 ) với  và  chưa biết
s s
t( /2 )    X + t( /2 )
n −1 n −1
❖ Khoảng tin cậy đối xứng của  là X −
n n
s
t(
n −1)
❖ Khoảng tin cậy tối đa của  là   X +
n
s
t(
n −1)
❖ Khoảng tin cậy tối thiểu của  là X − 
n
Ví dụ 1: Trọng lượng của các bao hàng là biến ngẫu nhiên phân phối chuẩn. Cân 25
bao hàng, ta tính được trung bình là 68,1 (kg), độ lệch chuẩn 4,637 (kg). Với độ tin cậy 95%,
trọng lượng trung bình của các bao hàng nằm trong khoảng nào.
A. ( 66,186;70,014 ) B. ( 70,014;72,212 )
C. ( 66,186;72,212 ) D. ( 66,186;74,014 )
Ví dụ 2: Cân nặng của một loại trứng vịt là biến ngẫu nhiên có phân phối chuẩn.
Cân thử 16 quả trứng thấy cân nặng trung bình mẫu là 100 gam, phương sai mẫu là 36
gam2. Với độ tin cậy 95% cân nặng trung bình tối đa của loại trứng là bao nhiêu?
A. 102,6295 B. 103,78 C. 101,95 D. 104,13

7.2.2.2 Dạng bài toán xác định kích thước mẫu


s s
t( /2 )    X + t( /2 )
n −1 n −1
Xét khoảng tin cậy đối xứng: X −
n n
s
t( /2 ) , khi đó X −     X + 
n −1
Đặt  =
n
Khi đó khoảng tin cậy có độ dài là 2 . Ta thấy khi n thay đổi thì  thay đổi. Một
số bài toán hay cho trước điều kiện của  và yêu cầu tìm sự thay đổi của n.
Ví dụ: Trọng lượng của các bao hàng là biến ngẫu nhiên phân phối chuẩn. Cân 25
bao hàng, ta tính được trung bình là 68,1 (kg), độ lệch chuẩn 4,637 (kg). Nếu độ chính xác
của ước lượng không vượt quá 1 và vẫn giữ nguyên độ tin cậy là 95% , khi đó cần điều tra
thêm bao nhiêu bao hàng.
A. 92 B. 67 C. 18 D. 25

GROUP: ÔN THI NEU|MENTORY NEU 35


[XÁC SUẤT THỐNG KÊ ] August 2020

7.2.3 Ước lượng cho phương sai tổng thể

❖ Khoảng tin cậy 2 phía của  là: 2 ( n − 1) s 2  2



( n − 1) s 2
2(/2n−1) 12−(n−/21)

❖ Khoảng tin cậy tối đa của  là 


2 2

( n − 1) s 2
12−(n −1)

❖ Khoảng tin cậy tối thiểu là


( n − 1) s 2 2
2( n −1)

Ví dụ 1: Thu nhập hàng tháng của người dân là biến ngẫu nhiên có phân phối chuẩn.
Kiểm tra ngẫu nhiên 40 người này, thấy phương sai mẫu là 8,2. Với độ tin cậy 95%, phương
sai của người dân nằm trong khoảng.
A. (5,5024;13,522) C. (45,1198;110, 882)
B. (5, 8604;12, 4436) D. (48, 055;102, 0374)
Ví dụ 2: Doanh thu của một cửa hàng trong ngày là biến ngẫu nhiên có phân phối
chuẩn. Kiểm tra 15 ngày doanh thu của cửa hàng thấy độ lệch chuẩn của mẫu là 4. Với độ
tin cậy 90%, phương sai tối thiểu của doanh thu trong ngày của cửa hàng là bao nhiêu.
A. 10,036 B. 5.128 C. 15,242 D. 11,243
7.2.4 Ước lượng cho tần suất tổng thể
7.2.4.1 Dạng bài toán ước lượng
Xét tổng thể có tần suất p chưa biết. Lập mẫu ngẫu nhiên có kích thước n  100

pˆ(1 − pˆ) pˆ(1 − pˆ)


❖ Khoảng tin cậy đối xứng của p là pˆ − z /2  p  pˆ − z /2
n n

pˆ(1 − pˆ)
❖ Khoảng tin cậy tối đa của p là : p  pˆ + z
n

pˆ(1 − pˆ)
❖ Khoảng tin cậy tối thiểu của p là: pˆ − z p
n
Ví dụ 1 Kiểm tra ngẫu nhiên 300 người điều khiển xe máy thấy có 210 người có bảo
hiểm xe máy. Với độ tin cậy 95% tỷ lệ tối thiểu người điều kiển xe máy có bảo hiểm là bao
nhiêu phần trăm.
A. 65,65 B. 35,25 C. 40,12 D. 50,13

GROUP: ÔN THI NEU|MENTORY NEU 36


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 2: Kiểm tra ngẫu nhiên 200 khách hàng vào một siêu thị thấy có 50 người mua
thịt bò nhập khẩu. Với độ tin cậy 95%, tỷ lệ khách hàng mua thịt bò nhập khẩu tối đa là
bao nhiêu
A. 12,246 B. 30,037 C. 51,642 D. 12,234
7.2.4.2 Dạng bài toán xác định kích thước mẫu
Với bài toán tìm khoảng tin cậy đối xứng cho p:

pˆ(1 − pˆ) pˆ(1 − pˆ)


pˆ − z /2  p  pˆ − z /2
n n

pˆ(1 − pˆ)
Tương tự với bài toán ước lượng cho trung bình, đặt:  = z /2
n

pˆ(1 − pˆ)
Khi đó độ dài khoảng tin cậy là I = 2 = 2z /2
n
 là sai số ước lượng.
Ví dụ 1: Kiểm tra ngẫu nhiên 400 người sử dụng điện thoại di động thấy có 240
người sử dụng mạng Viettel. Khi ước lượng tỷ lệ người sử dụng mạng Viettel bằng khoảng
tin cậy đối xứng, để sai số ước lượng không vượt quá 0,04 thì cần điều tra thêm tối thiểu
bao nhiêu người sử dụng điện thoại nữa với độ tin cậy 95%.
A. 177 B. 145 C. 577 D. 4000
7.3 Ước lượng hợp lý tối đa

7.3.1 Hàm hợp lý và ước lượng hợp lý tối đa


Xét tham số  , mẫu cụ thể: w 0 = ( x1, x2 ,...xn ) .

L = ( x1, x2 ,...xn , ) = f ( x1, ). f ( x1, )... f ( xn ,  ) được gọi là hàm hợp lý của  .

Giá trị  làm L max được gọi là ước lượng hợp lý tối đa của  .

7.3.2 Hàm hợp lý với mẫu phân phối A(p)

Xét X A( p) , x = 0,1 . P( X = x) = p x .(1 − p)1− x .


Mẫu cụ thể w0 = ( x1, x2 ,...xn ) . Tham số p
1− x
Hàm hợp lý: L(w0 . p) = p x1 (1 − p)1− x1 . p x2 (1 − p)1− x2 ... p n (1 − p) n
x

= p x1 . p x2 ... p xn .(1 − p)1− x1 .(1 − p)1− x2 ...(1 − p)1− xn


= p x1 + x2 +....+ xn .(1 − p)(1− x1 )+(1− x2 )+....(1− xn )
= p x1 + x2 +....+ xn .(1 − p) n −( x1 + x2 +....+ xn )

GROUP: ÔN THI NEU|MENTORY NEU 37


[XÁC SUẤT THỐNG KÊ ] August 2020

Đặt x1 + x2 + .... + xn = t  L(w0 , p) = pt (1 − p)n−t

Giá trị p làm cho L max được gọi là ước lượng hợp lý tối đa.

t
Được thừa nhận kết quả khi p = thì L max.
n
Ví dụ 1. Từ tổng thể có phân phối A(p) , ta chọn ra được một mẫu sau (1,1, 0, 0,1) .
Để ước lượng cho p thì giá trị nào hợp lý hơn trong các giá trị dưới đây.
A. 0,55 B. 0,45 C. 0,6 D. 0,35
Ví dụ 2 Kiểm tra một số khách hàng vào siêu thị ta có kết quả sau (nam, nữ, nữ,
nam, nữ, nữ, nam). Để ước lượng số khách hàng nam vào siêu thị thì sử dụng giá trị nào
trong các giá rị sau sẽ hợp lý hơn. Coi nam là 1, nữ là 0 khi xét phân phối A(p)
A. 0,3 B. 0,4 C. 0,5 D. 0,6

GROUP: ÔN THI NEU|MENTORY NEU 38


[XÁC SUẤT THỐNG KÊ ] August 2020

CHƯƠNG 8: KIỂM ĐỊNH


8.1 Một số khái niệm chung
8.1.1 Cặp giả thuyết thống kê
Giả thuyết thống kê: giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên, về
các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của biến ngẫu nhiên.
Ký hiệu: H0 là giả thuyết gốc. Trong môn xác suất thống kê, giả thuyết H0 có dạng  = 0

H1 là giả thuyết đối, H1 mang mệnh đề mâu thuẫn với H0 , mang dấu , , 
H0 , H1 tạo nên cặp giả thuyết thống kê.
8.1.2 Tiêu chuẩn kiểm định
Từ biến ngẫu nhiên X trong tổng thể lập mẫu ngẫu nhiên W, chọn lập thống kê G.
Điều kiện đặt ra đối với thống kê G là nếu H0 đúng thì quy luật phân phối xác suất của
G hoàn toàn xác định. Thống kê G được gọi là tiêu chuẩn kiểm định.
8.1.3 Miền bác bỏ với mức ý nghĩa 
Sau khi đã chọn được tiêu chuẩn kiểm định G , với một xác suất bé bằng  cho
trước, có thể tìm được miền W tương ứng sao cho với điều kiện giả thuyết H0 là đúng,

xác suất để G nhận giá trị thuộc miền W bằng  : P(G  W / H0 ) = 

Giá trị  được gọi là mức ý nghĩa của kiểm định và miền W được gọi là miền bác

bỏ giả thuyết H0 với mức ý nghĩa  .


8.1.4 Giá trị quan sát của tiêu chuẩn kiểm định
Thực hiện một phép thử đối với mẫu ngẫu nhiên W, ta thu được 1 mẫu cụ thể w
và qua đó tính được một giá trị của tiêu chuẩn kiểm định G. Giá trị này được gọi là giá trị
quan sát của tiêu chuẩn kiểm định.
8.1.5 Quy tắc kiểm định giả thuyết thống kê.
Sau khi tính được giá trị quan sát Gqs , ta so sánh giá trị này với miền bác bỏ W

và kết luận theo quy tắc sau:


❖ Nếu giá trị quan sát thuộc miền bác bỏ. Gqs  W , có thể giải thích rằng H0 sai, bác

bỏ H0 , chấp nhận H1

❖ Nếu giá trị quan sát không thuộc miền bác bỏ, Gqs  W , chưa đủ cơ sở để bác bỏ

H0 , chấp nhận H0

GROUP: ÔN THI NEU|MENTORY NEU 39


[XÁC SUẤT THỐNG KÊ ] August 2020

8.1.6 Sai lầm loại một và sai lầm loại hai


❖ Sai lầm loại 1: bác bỏ H0 trong khi H0 đúng. Xác suất mắc sai lầm loại này bằng
mức ý nghĩa 
❖ Sai lầm loại 2: thừa nhận H0 trong khi H0 sai. Xác suất mắc sai lầm loại này ký hiệu
là 
8.2. Bài toán kiểm định
8.2.1 Kiểm định 1 tham số
Cặp giả thuyết Miền bác bỏ
8.2.1.1 Kiểm định trung bình
 H0 :  = 0
 T : T  t  n −1
 /2
 H1 :   0
 H0 :  = 0
( X − 0 ) n  T : T  t 
n −1

Tiêu chuẩn kiểm định: T =  H1 :   0
S
 H0 :  = 0
 T : T  −t 
n −1

 H1 :   0

Ví dụ 1: Giá chứng khoán trên mỗi phiên giao dịch là biến ngẫu nhiên có phân phối
chuẩn. Kiểm tra ngẫu nhiên 16 phiên giao dịch mã chứng khoán BID có trung bình mẫu
là 39,5 nghìn/ cổ phiếu, độ lệch chuẩn mẫu là 2 nghìn/cổ phiếu. Với mức ý nghĩa 5%, khi
kiểm định giá trung bình cổ phiếu BID là 40 nghìn/cổ phiếu thì khẳng định đúng là:
A. Tqs = 1

B. Kết luận: Giá trung bình cổ phiếu BID không lớn hơn 40 nghìn

H :  = 38, 5
C.  0
H 1 :   38, 5

D. W = T : T  2,131 
Ví dụ 2: Chi tiêu hàng tháng của sinh viên có phân phối chuẩn. Khảo sát ngẫu nhiên
20 sinh viên về mức chi tiêu hàng tháng ta có trung bình mẫu là 5,4 triệu, độ lệch chuẩn là
1,2 triệu. Với mức ý nghĩa 5%, khi kiểm định chi tiêu trung bình hàng tháng của sinh viên
ít hơn 6 triệu thì khẳng định đúng là:
A. Kết luận chi tiêu trung bình hàng tháng của sinh viên không ít hơn 6 triệu.
B. Giá trị quan sát: Tqs = 2,236


C. Miền bác bỏ H 0 : W = T : T  1,729 
D. Kết luận: chi tiêu trung bình hàng tháng của sinh viên ít hơn 6 triệu.

GROUP: ÔN THI NEU|MENTORY NEU 40


[XÁC SUẤT THỐNG KÊ ] August 2020

8.2.1.3 Kiểm định phương sai Cặp giả thuyết Miền bác bỏ
 H0 :  2 =  02    2  2(/2n −1) 
 :  2
2
2 n −1 

 H1 :    0    1−( /2) 
2 2

( n − 1) s 2 
Tiêu chuẩn kiểm định:  2
=  H0 :  2 =  02
 02   2
:  2   (
2 n −1)

 H1 :  
2 2
0

 H0 :  2 =  02
  2
:  2  1−(
2 n −1)

 H1 :  
2 2
0

Ví dụ 1: Doanh thu trong ngày tại một cửa hàng là biến ngẫu nhiên có phân phối
chuẩn, độ lệch chuẩn doanh thu trước đây là 1,5 triệu. Hiện nay, kiểm tra ngẫu nhiên 25
ngày thấy doanh thu trung bình là 5 triệu, độ lệch chuẩn là 1,2 triệu. Với mức ý nghĩa 5%,
khi kiểm định doanh thu hiện nay ổn định hơn trước đây thì khẳng định nào sau đây là
đúng?
H :  = 1, 5 H 0 :  2 = 1, 52
A.  0
H 1 :   1, 5
B.  C. qs2 = 16, 32 2

D. W =  :   36, 42
2

H 1 :   1, 5
2 2

Ví dụ 2: Thời gian mỗi lượt khám bệnh tại bệnh viện Mean 12,5
Bạch Mai là biến ngẫu nhiên có phân phối chuẩn. Khảo sát Sample Variance 2,53
ngẫu nhiên thời gian khám của một số bệnh nhân ta có:
Count 25
Với mức ý nghĩa 5%, khi kiểm định phương sai thời gian khám
bệnh ít hơn 4 thì khẳng định nào sau đây sai?
H 0 :  2 = 4
A.  = 15,18
2
C. 
H 1 :   4
qs 2

B. Kết luận: Chưa thể cho rằng phương sai ít hơn 4


2

D. W =  :   36, 45
2

8.2.1.3 Kiểm định tần suất

Cặp giả thuyết Miền bác bỏ


 H0 : p = p0
 Z : Z  z /2 
 H1 : p  p0
(pˆ − p0 ) n  H0 : p = p0
Tiêu chuẩn kiểm định: : Z =  Z : Z  z 
p0 (1 − p0 )  H1 : p  p0
 H0 : p = p0
 Z : Z  −z 
 H1 : p  p0

GROUP: ÔN THI NEU|MENTORY NEU 41


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ 1: Khảo sát ngẫu nhiên 300 người sử dụng điện thoại di động thấy có 180
người sử dụng mạng Viettel. Với mức ý nghĩa 5% khi kiểm định tỷ lệ người sử dụng mạng
di động Viettel lớn hơn 55% thì khẳng định nào sau đây đúng?
H : p = 0, 6

A. W = Z : Z  1,96  B.  0
H 1 : p  0, 6
C. Zqs = 1, 74

D. Kết luận: Chưa thể cho rằng tỷ lệ người sử dụng mạng Viettel lớn hơn 55%.
Ví dụ 2: Quan sát 200 khách hàng vào siêu thị thấy có 60 người mua thực phẩm
đông lạnh. Với mức ý nghĩa 5% khi kiểm định tỷ lệ khách hàng mua thực phẩm đông lạnh
tại siêu thị là 35% thì khẳng định nào dưới đây sai?

H : p = 0, 35

A. W = Z : Z  1,96  B.  0
H : p  0, 35
 1
C. Kết luận: chưa thể cho rằng tỷ lệ khách hàng vào siêu thị mua thực phẩm đông
lạnh là 35%.
D. Zqs = −1, 48
8.2.2 Kiểm định 2 tham số
8.2.2.1 Kiểm định trung bình 2 tổng thể Cặp giả thuyết Miền bác bỏ
Xét 2 tổng thể
 H0 : 1 = 2 T : T  z 
Tổng thể 1: X 1 ( )
N 1 , 12 
/2

 H1 : 1  2
Tổng thể 2: X 2 N (  , ) 2

T : T  z 
2 2
 H0 : 1 = 2
X1 − X 2 
Tiêu chuẩn kiểm định T =  H1 : 1  2
S12 S22
+
n1 n1  H0 : 1 = 2 T : T  −z 

Với n1 , n2  30  H1 : 1  2

Ví dụ: Điều tra chi tiêu hàng năm của 40 công nhân ở KCN A thì thấy trung bình
mẫu 40 triệu đồng và độ lệch chuẩn 4,5 triệu đồng. Còn đối với 40 công nhân ở KCN B thì
trung bình mẫu là 36,5 triệu đồng và độ lệch chuẩn mẫu là 3,6 triệu đồng. Lấy  = 0,05 .Có
thể cho rằng chi tiêu trung bình của công nhân ở 2 khu công nghiệp là như nhau hay
không. Trong bài toán kiểm định trên, đâu là mệnh đề sai:
 H :  = B X − XB
A. Cặp giả thuyết:  0 A B. Tiêu chuẩn kiểm định: T = A
 H1 :  A   B S A2 SB2
+
n A nB
C. Tqs = 3,841
D. Kết luận: với mức ý nghĩa 5%, có thể cho rằng chi tiêu trung bình của công nhân ở 2
khu công nghiệp là như nhau.

GROUP: ÔN THI NEU|MENTORY NEU 42


[XÁC SUẤT THỐNG KÊ ] August 2020

8.2.2.2 Kiểm định phương sai 2 tổng thể có phân phối chuẩn
Xét 2 tổng thể Cặp giả thuyết Miền bác bỏ
Tổng thể 1: X 1 ( )
N 1 , 12  H0 :  12 =  22  ( n1 −1,n2 −1) 
  F  f /2 
   ( n1 −1,n2 −1) 
F :
 H1 :  1   2
2 2
Tổng thể 2: X 2 N (  , )2
2
2   F  f1− /2
 

Tiêu chuẩn kiểm định F =


S12  H0 :  12 =  22
 F : F  f (
n1 −1,n2 −1)

S22  H1 :  1   2
2 2

 H0 :  12 =  22
 F : F  f ( n1 −1,n2 −1)
1− 
 H1 :  1   2
2 2

Ví dụ: Cân 25 sản phẩm do máy A sản xuất thì thấy độ lệch chuẩn là 35g. Cân 40
sản phẩm do máy B sản xuất thì thấy độ lệch chuẩn 25g. Giả thiết trọng lượng là biến ngẫu
nhiên phân phối chuẩn. Với mức ý nghĩa 5%, có thể cho rằng độ phân tán về trọng lượng
sản phẩm do 2 máy sản xuất là như nhau hay không? Chọn mệnh đề đúng.
A. Ý kiến đúng B. Ý kiến sai
C. Chưa đủ dữ kiện để kiểm định D. Cả 3 đáp án trên đều sai.

8.2.2.3 Kiểm định tần suất 2 tổng thể


Xét 2 tổng thể Cặp giả thuyết Miền bác bỏ
 H0 : p1 = p2 Z : Z  z /2 
Tổng thể 1: X 1 ( )
N 1 , 12 
 H1 : p1  p2
Tổng thể 2: X 2 N (  , )2
2
2  H0 : p1 = p2 Z : Z  z 

Tiêu chuẩn kiểm định  H1 : p1  p2
pˆ1 − pˆ2  H0 : p1 = p2 Z : Z  −z 
Z = 
1 1   H1 : p1  p2
p(1 − p)  + 
 n1 n2 
m1 m2 m1 + m2
Với pˆ1 = , pˆ2 = , p=
n1 n2 n1 + n2

GROUP: ÔN THI NEU|MENTORY NEU 43


[XÁC SUẤT THỐNG KÊ ] August 2020

Ví dụ: Kiểm tra ngẫu nhiên 400 nhân viên trong một công ty, có 220 nhân viên nữ.
Trong số nhân viên nữ có 176 người đóng bảo hiểm thất nghiệp. Trong số nhân viên nam
có 126 người đóng bảo hiểm thất nghiệp. Với mức ý nghĩa 5% có thể cho rằng tỷ lệ nhân
viên nữ đóng bảo hiểm thất nghiệp cao hơn tỷ lệ nhân viên nam đóng bảo hiểm thất
nghiệp hay không? Coi p1 , p2 lần lượt là tần suất nhân viên nữ và nam đóng bảo hiểm
trong công ty. Trong bài toán kiểm định trên, mệnh đề nào sai?
H : p = p 2
A. Cặp giả thuyết:  0 1 B. Miền bác bỏ: W = Z : Z  z 
 H1 : p1  p2
C. Zqs = 2,313 D. Chưa đủ cơ sở bác bỏ giả thuyết H 0

8.2.3 Kiểm định phi tham số


8.2.3.1 Kiểm định tính phân phối chuẩn
Khi điều tra về 1 dấu hiệu của tổng thế, muốn kiểm tra xem dấu hiện đó có phân
phối chuẩn hay không, lập mẫu ngẫu nhiên sau đó dùng kiểm định JB để kiểm định tính
phân phối chuẩn.
 H : X ph©n phèi chuÈn
Cặp giả thuyết được đưa ra là:  0
 H1 : X kh«ng ph©n phèi chuÈn
 a2 ( a4 − 3)2 
Tiêu chuẩn kiểm định: JB = n  3 +
 6 24 
 2( 2 )
 , miền bác bỏ: W = JB : JB   

Ví dụ: Có ý kiến cho rằng điểm tốt nghiệp của sinh viên trường A phân phối chuẩn.

Điều tra điểm tốt nghiệp của 40 sinh viên trường A tìm được hệ số bất đối xứng của mẫu

là 0,5 và hệ số nhọn là 2,2. Với mức ý nghĩa 5% hãy kiểm định ý kiến trên.

A. Ý kiến đúng B. Ý kiến sai

C. Chưa đủ dữ kiện để kiểm định. D. Cả 3 đáp án trên đều đúng

8.2.3.2 Kiểm định tính độc lập


Khi điều tra về 2 dấu hiệu và muốn kiểm tra xem 2 dấu hiệu đó có độc lập với nhau
hay không, người ta lập mẫu sau đó kiểm định tính độc lập.
 H : A ®éc lËp víi B
Cặp giả thuyết:  0
 H1 : A phô thuéc B
 h k nij2 
Tiêu chuẩn kiểm định:  = n  
2
− 1
 i =1 j =1 n m 
 i j 

GROUP: ÔN THI NEU|MENTORY NEU 44


[XÁC SUẤT THỐNG KÊ ] August 2020

 
Miền bác bỏ: W =  2 :  2  2 ( ( h − 1)( k − 1) )

Ví dụ: Điều tra 500 học sinh tiểu học thu được bảng kết quả dưới đây. Với mức ý
nghĩa 5%, giới tính và sự yêu thích học môn toán có độc lập với nhau hay không?
Thích học toán Không thích học toán
Nam 155 100
Nữ 110 135
Đáp án nào sai.
H : Sự yêu thích toán độc lập với giới tính
A. Cặp giả thuyết: { 0
H1 : Sự yêu thích toán phụ thuộc với giới tính
B. Giá trị quan sát:  qs2 = 12,659
2 (1)
C. Giá trị tới hạn trong miền bác bỏ:  0,05

D. Kết luận: giới tính và sự yêu thích môn toán độc lập với nhau.
8.3. Cách đọc bảng Excel.
Đề thi hiện nay sẽ cho dữ liệu là 1 bảng Excel. Bảng Excel này chứa dữ liệu khảo
sát của 2 mẫu ngẫu nhiên.
Có 2 dạng bảng Excel hay thi là T-Test Two Sample ( kiểm định về trung bình của
2 mẫu) for Means và F-Test Two Sample fof Variance (kiểm định về phương sai của 2 mẫu
8.3.1 Bảng T-Test T-Test Two Sample X Y

Bảng T-Test có dạng như sau: Mean xX xY


❖ Mean: trung bình Variance S X2 SY2
❖ Variance: phương sai
Observation nX nY
❖ Observation: kích thước mẫu
df k
❖ df: bậc tự do
T stat Tqs
❖ T stat: Giá trị quan sát
P(T<=t)one-tail
❖ T critical one-tail: giá trị tới hạn 1 phía
P(T<=t) two-tail
❖ T critical two-tail: giá trị tới hạn 2 phía
t(
df )
❖ P(T<=t)one-tail: T critical one-tail

➢ Nếu x X  xY , P(T<=t)one-tail là p của cặp t( /2)


df
Tcritical two-tail

 H :  = Y
giả thuyết:  0 X
 H1 :  X  Y
 H :  = Y
➢ Nếu x X  xY , P(T<=t)one-tail là p của cặp giả thuyết:  0 X
 H1 :  X  Y

GROUP: ÔN THI NEU|MENTORY NEU 45


[XÁC SUẤT THỐNG KÊ ] August 2020

Quan sát các đề thi hiện nay, chúng ta chủ yếu lấy 4 thông tin mean, variance,
observation, P(T<=t)one-tail trong bảng.
Ví dụ: Đề cho bảng Excel sau. T- test Two-Sample
X Y
X: giá một loại hàng hóa vào quý I for Means
Y là giá bán vào các quý khác. Mean 20,3 19,03
Các thông tin trong bảng: Variance 4,47 4,91
❖ T – test Two – Sample for Means : Kiểm định Observations 40 40
T cho 2 mẫu về trung bình. df 78
❖ Mean: trung bình mẫu: T stat 1,136
20,3 = x X ,19,03 = xY P(T<=t) one - tail 0,130
❖ Variance: phương sai mẫu t Critical one - tail 1,665
4,47 = sX2 ,4,91 = sY2 t Critical two - tail 1,991

❖ Observations: kích thước mẫu 40 = n1 ,40 = n2


❖ P(T<=t) one – tail
 H :  = Y
20,3  19,03 nên P(T<=t) one – tail là p của cặp giả thuyết  0 X
 H1 :  X  Y
Cho bảng Excel cũng tương tự như cho số liệu mẫu dạng lời văn như các ví dụ tự
luận trước.
8.3.2 Bảng F-Test
F-Test Two Sample X Y
Bảng F-Test có cấu trúc tương tự bảng T-Test.

( )
Mean xX xY
❖ Nếu x X  xY , P F = f one-tail là p của cặp giả
Variance S X2 SY2
 H :  2 =  Y2
thuyết:  0 2X Observation nX nY
 H1 :  X   Y
2

( )
df k
❖ Nếu x X  xY , P F = f one-tail là p của cặp giả
F stat Fqs
H :  = 
2 2
thuyết:  0 X Y
P(F<=f)one-tail
 H1 :   
2 2
X Y
P(F<=f) two-tail

8.4. Kiểm định dùng P-value


Kiểm định dùng P-value là 1 dạng câu hỏi mới trong đề thi hiện nay. Đây là phần

không có trong tờ công thức được mang vào, hơn nữa lý thuyết lại khá “lằng nhằng”

nhiều bạn gặp rắc rối khi học phần này, mặc dù câu hỏi và lời giải thường rất ngắn.

GROUP: ÔN THI NEU|MENTORY NEU 46


[XÁC SUẤT THỐNG KÊ ] August 2020

8.4.1 Dạng kiểm định bằng p-value thông qua số liệu ở bảng Excel.
Với bài tập dạng này, đề bài sẽ cho số liệu ở 1 bảng Excel, sau đó đưa ra 1 câu hỏi

kiểm định dùng P-value.

Bước 1: xác dịnh cặp giả thuyết trong câu hỏi

Bước 2: tính P-value thông qua các công thức sau:

❖ p − value = 2 P(T = t )one − tail đối với cặp kiểm định =, 

❖ p − value = P(T = t )one − tail đối với cặp kiểm định =,  hoặc =, 

Bước 3, sau khi tính P-value ta kết luận thông qua công thức:

❖ p − value   , bác bỏ H0 , chấp nhận H1

❖ p − value   , chưa đủ cơ sở để bác bỏ H0 , chấp nhận H0

Ví dụ 1:
T-Test: Two – Sample
Cho bảng kết quả Excel sau, với X Y
for Means
X là thu nhập lao động nữ
Mean 5,7 6,1
Y là thu nhập lao động nam
Variance 2,06 1,82
Đơn vị triệu đồng.
Observations 31 31
Các biến phân phối chuẩn, lấy α = 0,05
df 60
Có thể cho rằng thu nhập trung bình của nữ
t Stat -1,00
thấp hơn nam hay không?
P( T<=t) one tail 0,16
t Critical one-tail 1.67
t Critical two-tail 2,00

 H0 :  x =  y
Bước 1: Xét cặp giả thuyết: 
 H1 :  x   y
Bước 2: Ta có: p − value = P(T = t )one − tail = 0,16  0,05

Bước 3: chưa đủ cơ sở để bác bỏ H0 , chấp nhận H0

Kết luận: với mức ý nghĩa 5% không thể cho rằng thu nhập trung bình của nữ thấp

hơn nam.

GROUP: ÔN THI NEU|MENTORY NEU 47


[XÁC SUẤT THỐNG KÊ ] August 2020

8.4.2 Dạng bài tập tính P-value, tìm khoảng của P-value

Trong dạng bài tập kiểm định, khi tính được các giá trị quan sát, ngoài cách dùng

miền bác bỏ, chúng ta có thể tính toán p-value, so sánh p-value với  để kết luận, hoặc đề

bài có thể hỏi p-value thuộc khoảng nào.

Ví dụ 1 : Khi kiểm định giả thuyết điểm thi trung bình ít hơn 6,5; dựa trên mẫu

quan sát 100 người thì, tính được thống kê quan sát là (-1,5). Với mức ý nghĩa 10% thì kết

luận gì về giả thuyết.

Vậy đối với dạng bài này, ta cần biết công thức p − value = P( Z  Tqs ) , hay công

thức tính P-value đối với từng dạng kiểm đinh.

Các dạng bài kiểm định và công thức p-value tương ứng được liệt kê trong bảng

H1 Kiểm định T ( cho 1, 2 trung bình) Kiểm định Z( cho 1,2 tần suất)

  0 n  30 : p − value = 2 P T ( ( n −1)
 Tqs )
1  2 (
p − value = 2 P Z  Zqs )
n  30 : p − value = 2 P Z  Tqs ( )
  0 n  30 : p − value = P(T (
n −1)
 Tqs )
Hoặc p − value = P( Z  Zqs )
n  30 : p − value = P( Z  Tqs )
1  2
  0 n  30 : p − value = P(T (
n −1)
 Tqs )
Hoặc p − value = P( Z  Zqs )
n  30 : p − value = P( Z  Tqs )
1  2

Kiểm định  ( cho 1 phương sai)


2
Kiểm định F ( cho 2 phương sai)

1  2 p − value = 2 P( 
2( n −1)
  qs2 ) p − value = 2 P( F (
n1 −1,n2 −1)
 Fqs )

1  2 p − value = P( 
2( n −1)
  qs2 ) p − value = P( F (
n1 −1,n2 −1)
 Fqs )

1  2 p − value = P( 
2( n −1)
  qs2 ) p − value = P( F (
n1 −1,n2 −1)
 Fqs )

Bảng rất dài và nhiều công thức, rất khó để nhớ hết.

Mẹo: Công thức trong bảng gồm 3 dạng chính

❖ Cặp =,  : p − value = 2P G  Gqs ( )


❖ Cặp =,  p − value = P(G  Gqs )

GROUP: ÔN THI NEU|MENTORY NEU 48


[XÁC SUẤT THỐNG KÊ ] August 2020

❖ Cặp =,  p − value = P(G  Gqs )

Ví dụ 2 Khi kiểm định giả thuyết tỉ lệ khách mua hàng ít hơn 50%, dựa trên mẫu

quan sát 400 người vào cửa hàng, tính được thống kê quan sát là ( -1,99). Vậy P-value của

kiểm định nằm trong khoảng nào trong các khoảng sau:

A. (0; 0,025) B. (0,025; 0,05) C. (0,05; 0,1) D. (0,1;1)

Ví dụ 3 Năm trước độ phân tán về điểm thi của sinh viên là 1,7 điểm. Năm nay điều

tra điểm thi của 30 sinh viên thấy độ lệch chuẩn mẫu là 2,2 năm. Có ý kiến cho rằng độ

lệch chuẩn về điểm thi đã tăng lên. Biết điểm thi của sinh viên phân phối chuẩn. P – value

của kiểm định nằm trong khoảng nào?

A. (0; 0,025) B. (0,025; 0,05) C. (0,05; 0,1) D. (0,1;1)

Ví dụ 4 Mức tiêu thụ điện hàng tháng của hộ gia đình là biến ngẫu nhiên có phân
phối chuẩn. Kiểm tra ngẫu nhiên 25 hộ thấy trung bình mẫu là 220 kwh, độ lệch chuẩn
mẫu là 40kwh. Khi kiểm định mức tiêu thụ điện trung bình của hộ gia đình lớn hơn
200Kwh thì giá trị P-value thuộc khoảng nào dưới đây?
A. (0, 025; 0, 05) B. (0, 01; 0, 025) C. (0, 05; 0,1) D. (0; 0, 01)

GROUP: ÔN THI NEU|MENTORY NEU 49

You might also like