You are on page 1of 6

Mảng Học tập và NCKH REACH THE TOP

BCH LCĐ-LCH Viện Toán Ứng dụng và Tin học STOP THE F

ĐỀ THI THỬ CUỐI KÌ 20201


XÁC SUẤT THỐNG KÊ
Câu 1. (2 điểm) Cho số nguyên n ≥ 2. Xét các hoán vị (a1 , a2 , . . . , an ) của 1, 2, . . . , n.

1. Tính xác suất tìm được một hoán vị sao cho tồn tại duy nhất một chỉ số i ∈ {1, 2, . . . , n−1}
thỏa mãn ai > ai+1 .
2. Áp dụng với n = 2020.

Câu 2. (2 điểm) Bạn A làm bài trắc nghiệm môn Xác suất thống kê gồm 10 câu hỏi, mỗi câu
có 3 đáp án. Với mỗi câu hỏi, có 2 khả năng xảy ra với xác suất như nhau, độc lập với các câu
hỏi khác: Hoặc A biết đáp án, và trả lời đúng câu hỏi, hoặc A đoán đáp án với xác suất đoán
1
đúng là .
3
1. Giả sử bạn A trả lời đúng câu hỏi đầu tiên. Xác suất A biết đáp án câu hỏi này là bao
nhiêu?
2. Cho biết rằng A trả lời đúng 6 trên 10 câu, lập bảng phân phối xác suất của số câu hỏi
mà A biết đáp án.

Câu 3. (2 điểm) Bạn B ghé thăm một số nhà sách cho đến khi mua được giáo trình Thống kê
xã hội học. Mỗi nhà sách bất kì có sách với xác suất p, độc lập với các nhà sách khác. Trong
mỗi nhà sách, B mất một khoảng thời gian ngẫu nhiên, có phân phối mũ với tham số λ, cho
đến khi tìm được sách hoặc biết được nhà sách đó không có cuốn này. Giả sử B đi các nhà
sách cho đến khi mua được sách và thời gian B ở trong mỗi nhà sách độc lập với nhau. Tính
kỳ vọng, phương sai của tổng thời gian B đi các nhà sách.
Câu 4. (2 điểm) Để nghiên cứu sự phát triển của một loại cây trồng, người ta quan tâm đến
đường kính X(cm) và chiều cao Y (m) của loại cây đó. Đo chiều cao và đường kính của 100 cây
cùng độ tuổi được chọn ngẫu nhiên, kết quả thu được cho trong bảng sau:

X \Y 3 4 5 6 7
(20, 22] 5
(22, 24] 19 25 10
(24, 26] 5 17 8
(26, 28] 7 4

1. Với độ tin cậy 95% hãy ước lượng đường kính trung bình của loại cây này.
2. Nếu ước lượng chiều cao trung bình của loại cây này với độ chính xác như ý trên và độ
tin cậy 99% thì cần đo bao nhiêu cây?

Câu 5. (2 điểm) Bệnh C được điều trị theo hai phương pháp I và II. Sau một thời gian thấy
kết quả như sau:

• Trong 102 bệnh nhân điều trị phương pháp I có 82 bệnh nhân khỏi bệnh.
• Trong 98 bệnh nhân điều trị phương pháp II có 69 bệnh nhân khỏi bệnh.

Hỏi có phải phương pháp I điều trị tốt hơn phương pháp II hay không với mức ý nghĩa 5%.

Soạn tài liệu: Nguyễn Quang Huy, Nguyễn Minh Hiếu


Link group Góc học tập SAMI: http://bit.ly/gochoctapSAMI
Z x t2
1
Phụ lục. Trích Bảng hàm phân phối chuẩn Φ(x) = √ e− 2 dt
2π −∞

x 1.282 1.645 1.96 2 2.576 3


Φ(x) 0.90 0.95 0.975 0.9772 0.995 0.9987

Hàm Laplace φ(x) = Φ(x) − 0.5.

HƯỚNG DẪN GIẢI


Câu 1. (2 điểm) Cho số nguyên n ≥ 2. Xét các hoán vị (a1 , a2 , . . . , an ) của 1, 2, . . . , n.

1. Tính xác suất tìm được một hoán vị sao cho tồn tại duy nhất một chỉ số i ∈ {1, 2, . . . , n−1}
thỏa mãn ai > ai+1 .

2. Áp dụng với n = 2020.

Gợi ý:

1. Trước hết, tính Sn là số các hoán vị thỏa mãn điều kiện đề bài bằng phương pháp truy
hồi.
Để ý rằng số hoán vị mà an = n chính bằng Sn−1 , do Sn−1 là số hoán vị (a1 , a2 , . . . , an−1 )
của 1, 2, . . . , n − 1 sao cho tồn tại duy nhất một chỉ số i ∈ {1, 2, . . . , n − 2} thỏa mãn
ai > ai+1 .
Mặt khác,số hoán vị (a1 , a2 , . . . , an ) thỏa mãn điều kiện đề bài với an = n (1 ≤ i ≤ n − 1)
n−1
là .
i−1
Do đó, có
n−1  
X n−1
Sn = Sn−1 + = Sn−1 + 2n−1 − 1
i=1
i−1
0.5đ
Dễ thấy S2 = 1. Từ đó tìm được số kết cục thuận lợi

Sn = Sn−1 + 2n−1 − 1 = . . . = S2 + 2n−1 + . . . + 22 − (n − 2) = 2n − n − 1

0.5đ
Lại có số kết cục đồng khả năng là Pn = n!. 0.5đ
Như vậy xác suất cần tính bằng
2n − n − 1
P =
n!

22020 − 2021
2. Thay n = 2020 thì P = . 0.5đ
2020!

Soạn tài liệu: Nguyễn Quang Huy, Nguyễn Minh Hiếu 2


Link group Góc học tập SAMI: http://bit.ly/gochoctapSAMI
Câu 2. (2 điểm) Bạn A làm bài trắc nghiệm môn Xác suất thống kê gồm 10 câu hỏi, mỗi câu
có 3 đáp án. Với mỗi câu hỏi, có 2 khả năng xảy ra với xác suất như nhau, độc lập với các câu
hỏi khác: Hoặc A biết đáp án, và trả lời đúng câu hỏi, hoặc A đoán đáp án với xác suất đoán
1
đúng là .
3

1. Giả sử bạn A trả lời đúng câu hỏi đầu tiên. Xác suất A biết đáp án câu hỏi này là bao
nhiêu?

2. Cho biết rằng A trả lời đúng 6 trên 10 câu, lập bảng phân phối xác suất của số câu hỏi
mà A biết đáp án.

Gợi ý:

1. Gọi K là sự kiện bạn A biết đáp ánh của câu hỏi đầu tiên. Khi đó, K và K tạo thành hệ
1
đầy đủ với P (K) = P (K) = . 0.5đ
2
Gọi C là sự kiện A trả lời đúng câu hỏi, thì sự kiện cần tính xác suất là K | C. Áp dụng
công thức Bayes ta có

P (K)P (C | K) 0.5 × 1 3
P (K | C) = = = = 0.75
P (K)P (C | K) + P (K)P (C | K) 1 4
0.5 × 1 + 0.5 ×
3
0.5đ
3
2. Trong 6 câu hỏi trả lời đúng, mỗi câu hỏi, độc lập với các câu hỏi khác, có xác suất
4
1
bạn A đã biết đáp án, và xác suất bạn A đoán đúng đáp án. Do đó, nếu gọi M là số
4
câu hỏi bạn A đã biết đáp án, biết rằng đã trả lời đúng 6 câu hỏi, thì M là biến ngẫu
3
nhiên có phân phối nhị thức với tham số n = 6, p = . 0.5đ
4
Từ đó ta có bảng phân phối xác suất: 0.5đ

X 0 1 2 3 4 5 6
P (X) 1/4096 9/2048 135/4096 135/1024 1215/4096 729/2048 729/4096

Câu 3. (2 điểm) Bạn B ghé thăm một số nhà sách cho đến khi mua được giáo trình Thống kê
xã hội học. Mỗi nhà sách bất kì có sách với xác suất p, độc lập với các nhà sách khác. Trong
mỗi nhà sách, B mất một khoảng thời gian ngẫu nhiên, có phân phối mũ với tham số λ, cho
đến khi tìm được sách hoặc biết được nhà sách đó không có cuốn này. Giả sử B đi các nhà
sách cho đến khi mua được sách và thời gian B ở trong mỗi nhà sách độc lập với nhau. Tính
kỳ vọng, phương sai của tổng thời gian B đi các nhà sách.
Gợi ý: Gọi N là tổng số nhà sách bạn B ghé thăm thì N là biến ngẫu nhiên rời rạc có phân
1 1−p
phối hình học với tham số p thì E[N ] = và V [N ] = . Tiêp tục gọi X1 , X2 , . . . , XN là
p p2
khoảng thời gian B lần lượt ở trong nhà sách thứ nhất, thứ hai,. . . , thứ N thì các Xi là các
biến ngẫu nhiên độc lập cùng có phân phối mũ với tham số λ. Kí hiệu chung kỳ vọng và phương
1 1
sai của chúng là E[X] = và V [X] = 2 . 0.5đ
λ λ

Soạn tài liệu: Nguyễn Quang Huy, Nguyễn Minh Hiếu 3


Link group Góc học tập SAMI: http://bit.ly/gochoctapSAMI
Từ đó, tổng số thời gian bạn B ghé thăm các nhà sách là biến ngẫu nhiên Y có dạng

Y = X1 + X2 + . . . + XN

0.5đ
Với số nguyên không âm n bất kỳ, vì biến ngẫu nhiên X1 + X2 + . . . + Xn độc lập với N nên
cũng độc lập với {N = n}. Do đó

E[Y | N = n] = E[X1 + X2 + . . . + XN | N = n]
= E[X1 + X2 + . . . + Xn | N = n]
= E[X1 + X2 + . . . + Xn ]
= nE[X]

Vì kết quả trên đúng với mọi n không âm nên

E[Y | N ] = N E[X]

Từ đó ta suy ra
  11
E[Y ] = E[E[Y | N ]] = E N E[X] = E[N ]E[X] =

0.5đ
Tương tự ta có

V [Y | N = n] = V [X1 + X2 + . . . + XN | N = n]
= V [X1 + X2 + . . . + Xn ]
= nV [X]

Vì kết quả trên đúng với mọi n không âm nên biến ngẫu nhiên V [Y | N ] chính bằng N V [X],
từ đó ta suy ra
   
V [Y ] = E V [Y | N ] + V E[Y | N ]
   
= E N V [X] + V N E[X]
2
= E[N ]V [X] + E[X] V [N ]
1 1 1 1−p 1
= 2
+ 2 2 = 2 2
pλ λ p λp
0.5đ
Chú ý: Trong bài toán này ta đã sử dụng 2 tính chất quan trọng của biến ngẫu nhiên có điều
kiện: Với X, Y là 2 biến ngẫu nhiên, ta có
 
• Law of iterated expectations E E[X | Y ] = E[X]
   
• Law of total variance V [X] = E V [X | Y ] + V E[X | Y ]

Câu 4. (2 điểm) Để nghiên cứu sự phát triển của một loại cây trồng, người ta quan tâm đến
đường kính X(cm) và chiều cao Y (m) của loại cây đó. Đo chiều cao và đường kính của 100 cây
cùng độ tuổi được chọn ngẫu nhiên, kết quả thu được cho trong bảng sau:

Soạn tài liệu: Nguyễn Quang Huy, Nguyễn Minh Hiếu 4


Link group Góc học tập SAMI: http://bit.ly/gochoctapSAMI
X \Y 3 4 5 6 7
(20, 22] 5
(22, 24] 19 25 10
(24, 26] 5 17 8
(26, 28] 7 4

1. Với độ tin cậy 95% hãy ước lượng đường kính trung bình của loại cây này.

2. Nếu ước lượng chiều cao trung bình của loại cây này với độ chính xác như ý trên và độ
tin cậy 99% thì cần đo bao nhiêu cây?

Gợi ý:

1. Bảng phân bố tần số cho ñường kính của cây:

Đường kính X 20 − 22 22 − 24 24 − 26 26 − 28
Số lượng 5 54 30 11

X là đường kính của loại cây trồng, X ∼ N µ, σ 2 với phương sai σ 2 chưa biết. Đường
kính trung bình của loại cây trồng là E[X] = µ chưa biết cần được ước lượng. 0.5đ
X − µ√
Bước 1. Chọn thống kê U = n. Vì n = 100 > 30 nên thống kê U ∼ N (0, 1).
S
Bước 2. Khoảng tin cậy đối xứng cho E[X] = µ là
 
s s
x − u1− α √ , x + u1− α √
2 n 2 n

trong đó α = 0.05, u1− α = u0.975 = 1.96, được tra từ bảng giá trị phân phối chuẩn tắc.
2
0.5đ
Bước 3. Từ số liệu đã cho tính được n = 100, x = 23.94, s = 1.5164. Suy ra khoảng tin
cậy đối xứng của E[X] = µ là
 
1.5164 1.5164
23.94 − 1.96 × √ , 23.94 + 1.96 × √ = (23.6428, 24.2372)
100 100

Bước 4. Kết luận, với độ tin cậy 95% đường kính trung bình của loại cây trồng này từ
23.6428 cm đến 24.2372 cm. 0.5đ

2. Bảng phân bố tần số cho chiều cao của cây:

Chiều cao Y 3 4 5 6 7
Số lượng 5 24 42 25 4

Bước 1. Y là chiều cao của loại cây trồng, Y ∼ N µ, σ 2 với phương sai σ 2 chưa biết.
Chiều cao trung bình của loại cây trồng là E[Y ] = µ chưa biết cần được ước lượng.
Y − µ√
Bước 2. Chọn thống kê U = n. Vì n = 100 > 30 nên thống kê U ∼ N (0, 1).
S

Soạn tài liệu: Nguyễn Quang Huy, Nguyễn Minh Hiếu 5


Link group Góc học tập SAMI: http://bit.ly/gochoctapSAMI
Bước 3. Khoảng tin cậy đối xứng cho E[Y ] = µ là
 
s s
y − u1− α √ , y + u1− α √
2 n 2 n

trong đó α = 0.01, u1− α = u0.995 = 2.576, được tra từ bảng giá trị phân phối chuẩn tắc.
2
1.5164
Bước 4. Sai số của ước lượng là  = 1.96 × √ ≈ 0.2972. Từ số liệu đã cho tính được
100
n = 100, s = 0.9265. Suy ra kích thước mẫu cần chọn tối thiểu là
 2
u1− α s2
2 2.5762 × 0.92652
n≥ = ≈ 64.489
2 0.29722
Bước 5. Kết luận, cần đo ít nhất 65 cây. 0.5đ

Câu 5. (2 điểm) Bệnh C được điều trị theo hai phương pháp I và II. Sau một thời gian thấy
kết quả như sau:

• Trong 102 bệnh nhân điều trị phương pháp I có 82 bệnh nhân khỏi bệnh.
• Trong 98 bệnh nhân điều trị phương pháp II có 69 bệnh nhân khỏi bệnh.

Hỏi có phải phương pháp I điều trị tốt hơn phương pháp II hay không với mức ý nghĩa 5%.
Gợi ý: Gọi p1 , p2 lần lượt là tỷ lệ bệnh nhân khỏi bệnh C được điều trị theo phương pháp I và
II tương ứng. Đây là bài toán so sánh tỷ lệ.
Bước 1. Đặt giả thuyết H0 : p1 = p2 , đối thuyết H1 : p1 > p2 .
f1 − f2
Bước 2. Chọn tiêu chuẩn kiểm định U = s  nếu giả thuyết H0 đúng. Ta
  1 1
f 1−f +
n1 n2
thấy U ∼ N (0, 1). 0.5đ
Bước 3. Với α = 0.05, tra bảng giá trị hàm phân phối chuẩn tắc được u1−α = u0.95 = 1.645.
Miền bác bỏ giả thuyết H0 là

Wα = (u1−α , +∞) = (1.645, +∞)

0.5đ
44 69
Bước 4. Theo đầu bài n1 = 102, n2 = 98, f1 = , f2 = . Từ đó tính được f =
51 98
n1 f2 + n2 f2 82 + 69
= = 0.755 suy ra
n1 + n2 102 + 98
f1 − f2
uqs = s
 1  ≈ 2.6081
 1
f 1−f +
n1 n2

0.5đ
Bước 5. Vì uqs = 2.6081 ∈ Wα nên có cơ sở để bác bỏ giả thuyết H0 . Tức là có thể nói phương
pháp I điều trị tốt hơn phương pháp II với mức ý nghĩa 5%. 0.5đ

Soạn tài liệu: Nguyễn Quang Huy, Nguyễn Minh Hiếu 6


Link group Góc học tập SAMI: http://bit.ly/gochoctapSAMI

You might also like