You are on page 1of 26

SƯU TẦM: CAO SAO LIÊN

LUYỆN TẬP CUỐI KỲ


ĐỀ 1
Bài 1: Cho file HocSinh.rda
+ Lập bảng tần số chéo cho 2 cột Hình Thức và Thể Thao
+ Kiểm định tại mức ý nghĩa 5% biến hình thức có độc lập với biến thể thao hay không?

Bài 2
Giả sử rằng tuổi thọ của 1 chiếc đèn tuân theo phân phối chuẩn với trung bình là 8.2, độ
lệch chuẩn là 1.4. Thời gian bảo hành của 1 chiếc đèn là 5 năm.
+ Tính xác suất để chiếc đèn không được bảo hành.
+ Nếu quy định tỷ lệ bảo hành là 15% thì thời gian bảo hành là bao nhiêu.

Bài 3: Trong 1 vùng dân cư tỷ lệ mắc bệnh sởi của một em bé là 30%. Số dân ở vùng đó
là 120 người.
a) Tính xác suất để có trên 50 em bé mắc bệnh sởi
b) Tính xác suất để ít hơn 50 em bé mắc bệnh
c) Tính số em bé trung bình mắc bệnh sởi trong 120 em bé.

Bài 4: Công ty bán hàng online thấy rằng thời gian giao hàng X là BNN có phân phối
như sau:
X 2 3 4 5 6 7 8
P 0.01 0.04 0.28 0.42 0.21 0.02 0.02
a) Nếu công ty quảng cáo cho rằng hàng hóa được giao trong phạm vi 2 đến 6 ngày
thì xác suất giao hàng là bao nhiêu.
b) Tính thời gian giao hàng trung bình.

KHÔ NG CHO MƯỢ N TRANG 1


SƯU TẦM: CAO SAO LIÊN

Bài 5:
Cho file “SoLieuCanXuLy.rda”
a) Tìm ước lượng điểm cho tiền điện thoại tháng 1 trung bình cảu cả vùng.
b) Tính tứ phân vị cho tiền điện thoại tháng 2 của cả vùng. Nêu ý nghĩa kết quả tìm
được.
c) Kiểm định tại mức ý nghĩa 5% tiền điện thoại tháng 1 trung bình có vượt quá 100
hay không?
d) Kiểm định tại mức ý nghĩa 5% tiền điện thoại tháng 1 của các tình trạng hôn nhân
có như nhau không? (giả thuyết phân tích phương sai đều thỏa mãn)
e) Kiểm định tại mức ý nghĩa 5% tiền điện thoại tháng 2 trung bình có cao hơn tiền
điện thoại tháng 3 trung bình hay không?

Bài 6: : Cho file “ChiSoIQ.rda”


a) Tính trung bình, mode của ChiSoIQ. Nêu ý nghĩa các kết quả tìm được.
b) Tính tứ phân vị. Nêu ý nghĩa kết quả tìm được
c) Lập bảng tần số, tần số tích lũy cho phân tổ của ChiSoIQ, biết khoảng cách tổ là
10 và cấu trúc tổ có dạng (a, b]. Nêu ý nghĩa của tổ thứ 3 trong bảng tần số tích
lũy.
d) Tính tỷ lệ những người có chỉ số IQ trên 80.
e) Theo bạn biểu đồ nào mô tả phân phối tần số cho ChiSoIQ trong các biểu đồ sau:
biểu đồ hộp và râu, biểu đồ phân phối tần số, biểu đồ tròn, biểu đồ thanh.

Bài 7:
Mười bệnh nhân bị huyết áp cao cho sử dụng thử thuốc Timolol. Một loại chất được cho
là làm giảm huyết áp. Huyết áp tối đa của họ sau và trước khi dùng Timolol được ghi lại
như sau:
Trước 122 110 169 200 173 184 178 156 190 168
Sau 159 157 163 207 164 141 182 171 177 138

Tại mức ý nghĩa 5% có thể kết luận thuốc Timolol có làm giảm huyết áp hay ko ? (có
tuân theo phân phối chuẩn)

KHÔ NG CHO MƯỢ N TRANG 2


SƯU TẦM: CAO SAO LIÊN

Bài 8: Khảo sát mỗi quan hệ giữa độ tuổi ( dưới 36, 36 -50, trên 50) và phương tiện thu
thập tin tức (TiVi, Đài, Báo, Internet), người ta điều tra và thu được bảng tần số sau:

Độ tuổi
Phương tiện <36 36-50 >50
Tivi 107 119 133
Đài 75 97 127
Báo 52 79 107
Internet 120 83 76

a) Tính xác suất người có độ tuổi < 36


b) Tính xác suất người có độ tuổi từ 36 đến 50, biết rằng người đó dùng internet
c) Trong số người có độ tuổi > 50 tính tỷ lệ người đọc báo.
d) Tính xác suất người có độ tuổi < 36 và dùng tivi.

Bài 9:Số liệu sau đây là kết quả điều tra thực hiện trên 1 mẫu ngẫu nhiên gồm 152 doanh
nghiệp trong nước về sở thích khi mua sắm xe ô tô.
Xuất xứ Hàn Quốc Châu Âu Nhật Bản Hoa Kì
Số lượng 32 35 45 40
Dữ liệu trên có cho thấy các doanh nghiệp trong nước có ưa chuộng như nhau đối vs các
loại xe ô tô có xuất xứ từ 4 nơi trên không? Kết luận với mức ý nghĩa 5%

KHÔ NG CHO MƯỢ N TRANG 3


SƯU TẦM: CAO SAO LIÊN

ĐỀ 2:
Câu 1) (1 điểm) Trong một cuộc điều tra nhân viên làm việc trong các nhà hàng người ta
cho rằng 75% số người bị áp lực công việc ảnh hưởng tiêu cực tới của cuộc sống. Một
mẫu ngẫu nhiên gồm 100 nhân viên trong một chuỗi nhà hàng được chọn ra và có 68
người trả lời “Có” khi được hỏi “Áp lực công việc có ảnh hưởng tiêu cực tới cuộc sống
của bạn không?
Kiểm định xem tỷ lệ nhân viên trong chuỗi nhà hàng A trả lời “Có” cho câu hỏi trên có
khác với tỷ lệ chung là 75% không. Dùng mức ý nghĩa 5%.

Câu 2) (1.5 điểm) Khảo sát mỗi quan hệ giữa độ tuổi ( dưới 36, 36 -50, trên 50) và
phương tiện
thu thập tin tức (TiVi, Đài, Báo, Internet), người ta điều tra 1255 người và thu được bảng
tần số sau:

Độ tuổi
Phương tiện <36 36-50 >50
Tivi 107 119 133
Đài 75 97 127
Báo 52 79 107
Internet 120 83 76

a) Kiểm định tại mức ý nghĩa 5% giả thuyết không rằng: Không có mối liên hệ giữa
độ tuổi và phương tiện thu thập tin tức của người dân.
b) Lập bảng phân phối xác suất cho phương tiện thu thập tin tức.

KHÔ NG CHO MƯỢ N TRANG 4


SƯU TẦM: CAO SAO LIÊN

Câu 3) (2.5 điểm) Trong quy trình làm sạch một chất hóa học dạng dung dịch, người ta
sử dụng nhựa thông để hút các tạp chất. Một kỹ sư hóa học muốn so sánh hiệu quả của 3
loại nhựa thông, đã chia dung dịch cần làm sạch thanh 15 phần, và dùng mỗi loại nhựa
thông lần lượt làm sạch cho 5 phần trong số đó. Lượng tạp chấy sau khi cô lại từ 15 phân
dung dịch như sau:
Loại 1 Loại 2 Loại 3

0.046 0.038 0.031


0.025 0.035 0.042
0.014 0.031 0.020
0.017 0.022 0.018
0.043 0.012 0.039
Kiểm định giả thuyết rằng hiệu quả của 3 loại nhựa thông không có sự khác nhau, sử
dụng mức ý nghĩa 5%.

Câu 4 (2.5 điểm)


a) Tuổi thọ của một loại pin tuân theo phân phối chuẩn với trung bình là 20 giờ và độ
lệch chuẩn là 1 giờ.
 Tính xác suất để 1 cục pin có tuổi thọ cao hơn 21 giờ.
 .Chọn ngẫu nhiên 4 cục pin . Gọi Y là biến ngẫu nhiên chỉ số pin có tuổi thọ
cao hơn 21 giờ. Cho biết phân phối của Y
 Xác suất cả 4 cục pin có tuổi thọ trên 21 giờ là bao nhiêu.

b) Có tất cả là 6 ván cờ. Tỷ lệ An thắng Bình trong 1 ván là 0.5.


 Tính xác suất để có 3 ván cờ An thắng Bình
 Tính xác suất để có ít nhất 2 ván cờ An thắng Bình.
 Trung bình cứ trong 6 ván An thắng Bình bao nhiêu ván?

KHÔ NG CHO MƯỢ N TRANG 5


SƯU TẦM: CAO SAO LIÊN

Câu 5: (5.5 điểm)


Đo chỉ số mỡ trong sữa (%) của 130 con bò lai Hà Lan - Ấn Độ đời F1 được chọn ngẫu
nhiên từ 2 trang trại A,B. ta thu được số liệu trong file ChiSoMo.txt. Trong đó cột Mo
ghi lại chỉ số mỡ. cột TrangTrai ghi lại trang trại mà con bò đang được nuôi.
a) Phân nhóm cột Mo thành các nhóm [3.6 ,4.2) , [4.2,4.8) , [4.8 5.4), [5.4 , 6) [6,
6.6].
b) Tính trung vị, trung bình cho biến Mo. Nêu ý nghĩa trung vị của Mo. Dùng 1
biểu đồ thích hợp để mô tả phân phối cho biến Mo (Nêu tên biểu đồ bạn dùng,
viết câu lệnh để vẽ biều đồ đó, và nêu nhận xét phân phối của biến Mo)
c) Tính chỉ số mỡ trung bình của những con bò được nuôi ở trang trại A, chỉ số
mỡ trung bình của những con bò được nuôi ở trang trại B
d) Tính tỷ lệ những con bò có chỉ số mở được nuôi có lượng mỡ lơn hơn hoặc
bằng 4.8
e) Đếm số con bò có chỉ số mỡ từ 3.8 đến 4.
f) Tìm khoảng tin cậy 95% cho chỉ số mỡ trung bình trong sữa của tất cả các con
bò lai Hà Lan- Ấn Độ đời F1.
g) Kiểm định tại mức ý nghĩa 5% chỉ số mỡ trung bình của bò được nuôi ở trang
trại A có cao hơn chỉ số mỡ trung bình của bò được nuôi ở trang trại B hay
không?
h) Kiểm định độ biến động chỉ số mỡ của trang trai A có cao hơn độ biến động
chỉ số mỡ của trang trại B hay không?
i) Kiểm định chỉ số mỡ ở trang trại A có tuân theo phân phối chuẩn không?

KHÔ NG CHO MƯỢ N TRANG 6


SƯU TẦM: CAO SAO LIÊN

Đề 3:
Câu 1) Cho file dữ liệu “ChiSoMo.txt”
a) Tóm tắt dữ liệu về chỉ số mỡ của các trang trại A,B bằng bảng tần số phân tổ đều.
b) Nhận xét phân phối dữ liệu chỉ số mỡ của các trang trại.
c) Tính 1 số đo độ biến động về chỉ số mỡ của các trang trại.
(độ trải giữa, khoảng biến thiên, độ lệch chuẩn)
d) Kiểm định tại mức ý nghĩa 5% giả thuyết chỉ số mỡ trung bình của trang trại A có
cao hơn trang trại B hay không?
e) Có sự khác biết về phương sai của chỉ số mỡ của các con bò trong trang trại A và
B không tại mức ý nghĩa 5%?
Câu 2): Tỷ lệ tổng số sản phẩm của 3 nhà máy A,B,C lần lượt là 25%,45%,30%. Trong
số tổng sản phẩm của 3 nhà máy A,B,C, tỷ lệ sản phẩm bị hỏng chiếm tỷ trọng lần lượt :
5%,10%,3%. Chọn ngẫu nhiên 1 sản phẩm từ các nhà máy.
a) Tính xác suất để sản phẩm đó bị hỏng?
b) Giả sử rằng sản phẩm đó bị hỏng, tính xác suất để sản phẩm đó thuộc nhà máy B.
Câu 3) Kiểm định phân bố nhóm máu O,A,B,AB trong cộng đồng tỷ lệ: 49%,
38%,9%,4% hay không? Chọn ngẫu nhiên 170 người và thu được định lượng về nhóm
máy của họ.
Nhóm máu O A B AB
Số người 87 59 20 4
Kiểm định tại mức ý nghĩa 5%.
Câu 4)
Một sản phẩm điện tử có tuổi thọ tuân theo phân phối chuẩn với trung bình 2500 và độ
lệch chuẩn 120 giờ.
a) Tỉ lệ sản phẩm bảo hành không vượt quá 5%, đưa ra chế độ bảo hành cho những
sản phẩm có độ tuổi tối đa là bao nhiêu.
b) Một người mua 100 sản phẩm này. Trong số 100 sản phẩm này
c) Sản phẩm bảo hành tuân theo phân phối gì?
d) Tính sản phẩm bảo hành trung bình.
e) Tính tỷ lệ/xác suất số sản phẩm bảo hành tối đa 1 sản phẩm.

KHÔ NG CHO MƯỢ N TRANG 7


SƯU TẦM: CAO SAO LIÊN

Câu 5) So sánh xem ti vi của người trung tuổi ở 3 thành phố, ngoại ô, nông thôn. Chọn
ngẫu nhiên mỗi khu vực 10 người. Thời gian xem ti vi của họ được lưu lại tỏng file
TiVi.xls.
Phương pháp ANOVA được thỏa mãn. Kiểm định sự khác biệt về thời gian xem ti vi
trung bình của người trung tuổi giữa 3 khu vực hay không tại mức ý nghĩa 5%.

ĐỀ 4
Bài 1:Đo đường kính (cm) của một chi tiết máy do một máy tiện tự động sản xuất.
Người ta thu được bảng số liệu sau:
Đường 12 12.05 12.1 12.15 12.2 12.25 12.3 12.35 12.4
Kính
Số chi 2 3 7 9 10 8 6 5 3
tiết

a. Tìm một ước lượng điểm cho đường kính trung bình của các chi tiết máy tiện tự
động sản xuất.
b. Tìm khoảng tin cậy 99% cho đường kính trung bình của các chi tiết máy tiện tự
động sản xuất.
c. Tìm tứ phân vị cho đường kính của các chi tiết máy trong tập dữ liệu. Nêu ý nghĩa
của tứ phân vị thứ 1 và tứ phân vị thứ 3

Bài 2: Mười bệnh nhân bị huyết áp cao cho sử dụng thử thuốc Timolol. Một loại chất
được cho là làm giảm huyết áp. Huyết áp tối đa của họ sau và trước khi dùng Timolol
được ghi lại như sau:
Trước 185 186 170 205 174 184 178 156 190 168
Sau 159 157 163 201 164 141 170 171 177 138

Tại mức ý nghĩa 5% có thể kết luận thuốc Timolol có làm giảm huyết áp hay ko ? Biết
các tổng thể trước và sau tuân theo phân phối chuẩn và có phương sai bằng nhau.

KHÔ NG CHO MƯỢ N TRANG 8


SƯU TẦM: CAO SAO LIÊN

Bài 3: Cho file SoLieu.csv


Câu a Lập bảng tần số cho côt KhuVuc.
Câu b:Tỷ lệ dân số 4 khu vưc Hải Đảo,Thành Phố, Nông Thôn, Miền núi như mọi
năm tuân theo tỉ lệ là 5:6:3:6. Hãy kiểm định xem tỷ lệ dân số 4 khu vực này còn
như mọi năm không tại mức ý nghĩa 5%.

Bài 4: Cho file HocSinh.rda


Hãy kiểm định tại mức ý nghĩa 5%, tỷ lệ học sinh nam thích thể thao ở mức 2 có lớn hơn
tỷ lệ nữ thích thể thao ở mức 2 hay không?

Bài 5:
Điều tra sở thích xem ti vi của 500 cặp vợ chồng cho thấy 30% các bà vợ thường xem
chương trình thể thao, 50% các ông chồng thường xem chương trình thể thao, song nếu
thấy vợ xem thì tỉ lệ chồng xem cùng là 60%. Chọn ngẫu nhiên 1 cặp vợ chồng.
a. Tính xs để có ít nhất một người thường xem chương trình thể thao
b. Tính xs để nếu chồng xem thì vợ xem cùng
c. Tính xs để nếu chồng ko xem thì vợ vẫn xem
d. Hai biến cố “vợ xem chương trình thể thao” và” chồng xem chương trình thể thao
“ có độc lập với nhau không?

KHÔ NG CHO MƯỢ N TRANG 9


SƯU TẦM: CAO SAO LIÊN

Bài 6
Có 3 thương hiệu nước xà phòng nổi tiếng A,B,C,D Người ta dùng 1 phương pháp để đo
độ bền của 4 loại xà phòng và thu đc kết quả như sau. Giả thuyết phân tích phương sai “
có phân phối chuẩn và phương sai bằng nhau” đã thỏa mãn.
A B C D
281 270 218 364
220 334 244 302
274 307 225 325
242 290 273 337
251 331 249 355

a. Kiểm định xem 4 loại xà phong có độ bền như nhau không tại mức ý nghĩa 0.05?
b. Nếu độ bền của 4 loại khác nhau , hãy phân tích sâu bằng phương pháp Tukey để
xác định loại bền nhất, kém bền nhất trong số 4 xà phòng.
ĐỀ 5:
Câu 1 (11đ)
Trong file DieuTraSinhVien.txt chứa thông tin về giới tính, sắc tộc, loại trường, điểm
viết, điểm đọc, điểm toán, điểm khoa học, điểm xã hội của 1 mẫu gồm 200 sinh viên
thuộc cùng 1 khối chuyên ngành của một số trường đại học
a. Tính phân vị thứ 30 của điểm xã hội và nêu ý nghĩa
b. Tính mode cua sắc tộc và nêu ý nghĩa con số đó
c. Tính tần suất, tần suất tích lũy ứng với cách phân tổ đều dữ liệu điểm xã hội với
khoảng cách là 10. Giải thích ý nghĩa con số tần suất tích lũy của tổ 4
d. Tính tỷ lệ các loại sắc tộc được điều tra trong mẫu
e. Nêu tên 1 loại biểu đồ mô tả hình dạng phân phối của dữ liệu điểm xã hội. Vẽ và
nêu nhận xét
f. Cho thông tin người có điểm trung bình 5 môn thấp nhất trong số những người
được điều tra

KHÔ NG CHO MƯỢ N TRANG 10


SƯU TẦM: CAO SAO LIÊN

g. Kiểm định tại mức ý nghĩa 5% xem điểm trung bình môn xã hội của các sinh viên
trường công lập và tư thục có bằng nhau hay không? Biết rằng các tổng thể tuân
theo phân phối chuẩn
h. Tại mức ý nghĩa 10% hãy kiểm định xem tỷ lệ nữ sinh viên của các trường đại học
ít hơn 50% hay không
i. Từ dữ liệu trên ta có bảng tần số chéo giữa giới tính và loại trường như sau
Giới tính
Loại trường
Nam Nữ
Công lập 77 91
Tư thục 14 18
Hãy kiểm định ở mức ý nghĩa 5% xem việc chọn loại trường và giới tính có độc
lập với nhau không
j. Chọn ngẫu nhiên 1 người trong số 200 người được điều tra, từ bảng tần số chéo
của câu trên hãy tính
 Xác suất người được chọn là nữ
 Xác suất để 1 người được chọn là nữ biết người đó học trường công lập

Câu 2( 1 đ): Quan sát giới tính của 100 trẻ sắp sinh ra tại bệnh viện phụ sản Hà Nội. Giả
sử tỉ lệ trai gái ở mỗi lần sinh là như nhau
a. Tính xác suất để ít hơn nửa số trẻ là con trai
b. Số bé trai trung bình trong nhóm 100 bé sắp được sinh ra là bao nhiêu

ĐẺ 6:
Câu 1 (2đ): Giả sử tuổi thọ của một chiếc đèn hình màu trong ti vi tuân theo phân phối
chuẩn với trung bình là 9 năm và độ lệch chuẩn là 1.5 năm. Chọn ngẫu nhiên 1 chiếc đèn
hình màu
a. Tính xác suất để chiếc đèn hình màu có tuổi thọ trên 5 năm
b. Nếu quy định thời gian bảo hành là 5 năm thì tỷ lệ đèn hình phải đổi lại theo bảo
hành là bao nhiêu

KHÔ NG CHO MƯỢ N TRANG 11


SƯU TẦM: CAO SAO LIÊN

Câu 2(3đ) Trong tập SoLieu201807.csv chứa 1 số thông tin về giới tính, tuổi, khu vực
sống và tổng thu nhập ( đơn vị triệu đồng) trong 1 năm
a. Tính số nam sống ở thành phố và số nữ sống ở nông thôn trong nhóm những
người được điều tra
b. Tiến hành phân tổ cột dữ liệu về tuổi thành các tổ có các điểm chia
20,30,40,50,60,70,80 và tính tỷ lệ những người được điều tra có độ tuổi không
vượt quá 60
c. Tính tỷ lệ những người phải đóng thuế thu nhập nếu biết một người phải đóng
thuế thu nhập nếu thu nhập trong năm của người đó vượt quá 60 tr
Câu 3 (2.5 đ)
Một nhà giáo dục cho rằng điểm của sinh viên TLU phụ thuộc vào số lượng thời gian
họ tự học trong tuần. Kết quả điều tra cho bởi tệp
DiemTrungBinhVaThoiGianTuHoc007.csv
a. Với mức ý nghĩa 3% hai yếu tố trên có độc lập không
b. Hãy lập bảng phân phối tần số theo thời gian tự học

Câu 4: Giả sử TLU có tỷ lệ sinh viên sử dụng điện thoại trong giờ học là 40%, đi học
muộn là 70%, vừa đi học muộn vừa sử dụng điện thoại trong giờ học là 30%
a. Tính tỷ lệ sinh viên TLU sử dụng điện thoại trong giờ học hoặc đi học muộn
b. Trong số sinh viên TLU sử dụng điện thoại trong giờ học, tính tỷ lệ sinh viên đi
muộn
Câu 5 : Mộ nhà nghiên cứu xem có mối liên hệ kết quả điều trị với việc sử dụng
kháng sinh. Kết quả điều tra ngẫu nhiên một số bệnh nhân cho bởi tệp
DieuTri010.csv ( Trong đó kí hiệu 1: Chưa tốt, 2:Tốt, 3:Sử dụng kháng sinh phù hợp
với triệu chứng nhiễm khuẩn, 4: Sử dụng kháng sinh không phù hợp với triệu chứng
nhiễm khuẩn)
a. Với mức ý nghĩa 5% anh chị hãy cho biết có mối liên hệ giữa 2 yếu tố trên hay
không? Giải thích
b. Trong số các bệnh nhân có kết quả điều trị tốt, tính tỷ lệ bệnh nhân sử dụng kháng
sinh không phù hợp với triệu chứng nhiễm khuẩn

KHÔ NG CHO MƯỢ N TRANG 12


SƯU TẦM: CAO SAO LIÊN

Câu 6: Một giám đốc Marketing muốn đánh giá doanh thu bán hàng của mảng điện
thoại ở một số cửa hàng khu vực TP HCM. Số liệu doanh thu được thu thập trong 3
năm 2011, 2012, 2013 được cho ơ tệp DoanhThuDienThoai010.csv. Giả sử các biến
doanh thu bán hàng theo năm đều tuân theo phân phối chuẩn và có cùng phương sai
và các mẫu độc lập
a. Hãy kiểm định giả thiết rằng doanh thu trung bình của các cửa hàng điện thoại
theo các năm 2011, 2012, 2013 bằng nhau ở mức ý nghĩa 3% và lập bảng phân
tích phương sai. Phân tích sâu nếu cần thiết
b. Kiểm định giả thuyết rằng mức độ đồng đều doanh thu của các cửa hàng điện
thoại theo các năm 2011 và 2013 bằng nhau ở mức ý nghĩa 3%

KHÔ NG CHO MƯỢ N TRANG 13


SƯU TẦM: CAO SAO LIÊN

ĐỀ MỚI NHẤT (KO CÓ DỮ LIỆU THỰC HÀNH)


ĐỀ 1: ( 11.2020)
Câu 1 (2 đ) Hãy chọn đáp án đúng (có thể có nhiều đáp án đúng)
1. Các thành viên một câu lạc bộ (CLB) đang bỏ phiếu để lựa chọn màu chủ đạo cho
logo của CLB trong số ba màu: Xanh lam, Cam, Xanh lá. Có thể dùng biểu đồ nào
để mô tả phân phối của dữ liệu thu được
A. Biểu đồ thanh
B. Biểu đồ tròn
C. Biểu đồ hộp và râu
D. Biểu đồ phân phối tần số
2. Hình dưới đây là biểu đồ phân phối tần số của một tập dữ liệu

A. Trung bình nhỏ hơn trung vị


B. Trung bình lớn hơn trung vị
C. Trung bình bằng trung vị
3. Cho hai biến cố A và B thỏa mãn P(A)= 0.2 ,P(B)= 0.3, P(AB)=0.06. Khi đó
A. A, B là hai biến cố độc lập
B. A là biến cố đối của biến cố B
C. A ,B là hai biến cố xung khắc
4. Dưới đây là biểu đồ hàm mật độ của 2 biến ngẫu nhiên X1 và X2 tuân theo phân
phối chuẩn

A. X1, X2 có cùng trung bình


B. X1, X2 có cùng phương sai
C. Phương sai X1 lớn hơn của X2
D. Phương sai X2 lớn hơn của X1

KHÔ NG CHO MƯỢ N TRANG 14


SƯU TẦM: CAO SAO LIÊN

5. Trong bài toán tìm ước lượng khoảng cho trung bình tổng thể nếu giữ nguyên độ
tin cậy, tăng cỡ mẫu ( với giả sử 2 mẫu có cùng dộ lệch chuẩn) thì
A. Độ rộng của khoảng tin cậy sẽ lớn hơn
B. Độ rộng của khoảng tin cậy sẽ nhỏ đi
C. Độ rộng của khoảng tin cậy không thay đổi
6. Lương trung bình của các kỹ sư tin học là 60.000$/ năm. Bạn cho rằng lương trung
bình của các kỹ sư tin học trong lĩnh vực A1 còn cao hơn. Để kiểm định nhận
định của mình:
i. Bạn chọn biến ngẫu nhiên là:
A. Các kỹ sư tin học
B. Các kỹ sư tin học trong lĩnh vực A1
C. Lương của các kỹ sư tin học trong lĩnh vực A1
D. Lương của các kỹ sư tin học
ii. Bài toán kiểm định của bạn là
A. Đuôi trái
B. Đuôi phải
C. Hai đuôi
iii. Cho biết tổng thể đang xét tuân theo phân phối chuẩn với cỡ mẫu là 16.
Thống kê dùng trong bài toán kiểm định này tuân theo phân phối gì?
A. Phân phối chuẩn
B. Phân phối chi bình phương
C. Phân phối student
D. Phân phối Fisher
iv. Bậc tự do của phân phối trên là
A. 14 B. 15 C. 16 D. 17
Câu 2(5đ): Tập dữ liệu IgM.rda chứa dữ liệu về hàm lượng kháng thể IgM trong máu
( đơn vị g/l) của một mẫu gồm 298 trẻ em từ 6 tháng đến 6 tuổi
IgM

KHÔ NG CHO MƯỢ N TRANG 15


SƯU TẦM: CAO SAO LIÊN

1. Tính trung bình cộng, trung vị của tập dữ liệu. nêu ý nghĩa của trung vị
Trung bình = 0.7973154
Trung vị = 0.7

2. Tính tỷ lệ trẻ em có hàm lượng IgM trong máu nhỏ hơn 2g/l
Đáp án: 0.9697987

3. Từ việc vẽ biểu đồ hộp và râu của dữ liệu trên hãy nêu nhận xét cho biểu đồ đó

4. Lập bảng tần số sau khi phân tổ đều cho tập dữ liệu trên với khoảng cách tổ là 0.5
(Bảng tần số gồm các tổ, tần số và tần suất)
IgM : 0.1  3

5. Tìm khoảng tin cậy 99% cho tỷ lệ trẻ em trong lứa tuổi đang xét có hàm lượng
IgM lớn hơn 1 g/l
Số trẻ em có hàm lượng IgM lớn hơn 1 g/l là 61
Tổng số trẻ em 298
[0.1512376 , 0.2710216]

6. Kiểm định ở mức ý nghĩa 5% giả thuyết cho rằng tỷ lệ trẻ em trong lứa tuổi đang
xét có hàm lượng IgM lớn hơn 1 g/l là 20%
p- value = 0.8393

KHÔ NG CHO MƯỢ N TRANG 16


SƯU TẦM: CAO SAO LIÊN

Câu 3(1.5đ)
Bảng sau thống kê theo giới tính và khoảng tuổi của một số người có bằng lái xe ô tô
Khoảng tuổi
Giới tính <=19 20-64 >=65
Nữ 4 84 12
Nam 5 80 15
Chọn ngẫu nhiên một người trong nhóm người trên. Tính
a. Xác suất để người đó là nam và có độ tuổi trong khoảng 20-64
b. Tìm xác suất để người đó có tuổi thuộc khoảng 20-64 biết rằng người đó là
nam
c. Hai biến cố “Người đó là nam” và “Người đó có tuổi trong khoảng 20-64”
có độc lập không ? Vì sao?
Câu 4 (1.5 đ)
Có 70% sinh viên khoa Quản lý của trường thi đỗ môn Xác suất thống kê từ lần thi đầu
tiên. Chọn ngẫu nhiên 30 sinh viên khoa Quản lý của trường.
a. Tính xác suất để trong số 30 sinh viên đó có trên 20 bạn đỗ ngay từ lần thi đầu
tiên
b. Trong số 30 sinh viên đó, trung bình có bao nhiêu bạn đỗ ngay từ lần thi đầu tiên

KHÔ NG CHO MƯỢ N TRANG 17


SƯU TẦM: CAO SAO LIÊN

Câu 5 (2 đ)
File dữ liệu Route.rda chứa dữ liệu về thời gian di chuyển từ địa điểm A đến địa điểm B
theo 3 lô trình khác nhau của 12 lái xe thử nghiệm, mỗi lộ trình thử nghiệm 4 lần. Giả sử
rằng các tổng thể thời gian di chuyển theo 3 lộ trình đó đều tuân theo phân phối chuẩn và
có phương sai bằng nhau
1. Hãy lập bảng phân tích phương sai một yếu tố
2. Kiểm định giả thuyết cho rằng thời gian trung bình để di chuyển từ A đến B theo 3
lộ trình trên bằng nhau. Dùng mức ý nghĩa 5%
LoTrinh1 LoTrinh2 LoTrinh3
… … …
… … …
… … …
… … …

p-value =0.7728

KHÔ NG CHO MƯỢ N TRANG 18


SƯU TẦM: CAO SAO LIÊN

ĐỀ 2 (T1/2020)
Lưu ý khi làm bài: Với những bài toán kiểm định phải ghi rõ cặp giả thuyết, 1 câu lệnh
chính, p giá trị và kết luận của bài toán
Câu 1(0.5đ) Người ta chọn ngẫu nhiên một số căn hộ vừa được bán tại một tòa chung cư.
Một số biến và biến ngẫu nhiên được xác định. Xét xem các khẳng định sau đúng hay sai
a. Biến ngẫu nhiên chỉ giá của căn hộ là biến ngẫu nhiên liên tục
b. Biến chỉ hướng của căn hộ là biến thứ bậc
Câu 2(0.5đ) Một biến được xác định có giá trị ngoại biên. Người ta sắp xếp các đại
lượng thống kê mô tả sau theo thứ tự ít bị ảnh hưởng nhất đến bị ảnh hưởng nhiều nhất
bởi giá trị ngoại biên
Theo bạn, sắp xếp nào là đúng
A. Trung bình, Khoảng biến thiên, trung vị
B. Trung vị, trung bình, khoảng biến thiên
C. Trung vị, khoảng biến thiên, trung bình
D. Khoảng biến thiên, trung vị, trung bình
Câu 3(1 đ) Chọn ngẫu nhiên 1 số chi tiết máy và ghi lại độ dày (mm) của chúng. Biểu đồ
thân và lá cho dữ liệu về độ dày chi tiết máy như sau
(thân là phần nguyên, lá là phần thập phân sau khi làm tròn đến 1 chữ số)
Thân Lá
2 112233456
3 0012568
4 011
a. Khôi phục lại dữ liệu ban đầu. Tính trung vị của tập dữ liệu
b. Nhận xét về phân phối của dữ liệu
Câu 4 (1 đ) Một chi tiết máy đòi hỏi phải có trọng lượng trung bình ít nhất là 1kg. Một
chuyên viên vừa đi kiểm tra chất lượng, chọn ngẫu nhiên 40 chi tiết máy. Tại mức ý
nghĩa 1%, chuyên viên đó đã bác bỏ giả thuyết không trong bài toán kiểm định
a. Kết luận của chuyên viên có thể mắc sai lầm loại mấy ? giải thích rõ sai lầm đó
b. Tại mức ý nghĩa 5% nếu thực hiện lại bài toán kiểm định trên với cùng dữ liệu
mẫu ta sẽ bác bỏ hay chấp nhận giả thuyết không (có giải thích)

KHÔ NG CHO MƯỢ N TRANG 19


SƯU TẦM: CAO SAO LIÊN

Câu 5(1 đ) Tại một trường đại học, xác suất để một sinh viên vừa học môn thống kê vừa
học môn giải tích là 0.0125. Xác suất để một sinh viên học môn thống kê là 0.125
a. Tính xác suất để 1 sinh viên học môn giải tích biết rằng sinh viên này học môn
thống kê
b. Việc lựa chọn học môn thống kê và môn giải tích có liên quan gì đến nhau không?
Vì sao
Câu 6 (1đ) Theo thống kê tại 1 cơ sở thi lấy giấy phép lái xe, tỷ lệ những người được cấp
giấy phép lái xe sau 1,2,3 lần thi tương ứng là 0.7, 0.2, 0.1. Gọi X là biến ngẫu nhiên chỉ
số lần thi của 1 người dự thi tại cơ sở này đến khi được cấp giấy phép
a. Lập bảng phân phối xác suất của X
b. Trung bình một người phải thi bao nhiêu lần để được cấp giấy phép lái xe
Câu 7(7đ) File ChieuCaoVaCanNang.csv ghi lại dữ liệu về chiều cao (cm), cân nặng
(kg), giới tính và khu vực sống của 1 số bé 3 tuổi được chọn ngẫu nhiên
GioiTinh ChieuCao CanNang Khu Vuc
(HaNoi, BacNinh,
BacGiang)

a. (1đ) Phân tổ cho biến cân nặng thành các tổ có khoảng cách là 3. Viết câu lệnh.
Lập bảng tần số cho cách phân tổ trên
Câng nặng 11 21

b. (0.5đ) 90% trẻ 3 tuổi trong dữ liệu ở Hà nội có cân nặng lớn hơn bao nhiêu
Đáp án: 11.2

c. (0.5đ) Tính tỷ lệ các em bé trong dữ liệu có cân nặng lớn hơn 12 kg


Đáp án: 0.8383838

KHÔ NG CHO MƯỢ N TRANG 20


SƯU TẦM: CAO SAO LIÊN

d. (1.5đ) Tại mức ý nghĩa 5%, hãy kiểm định giả thiết tỷ lệ trẻ em 3 tuổi có cân nặng
lớn hơn 12 kg ở Hà Nội lớn hơn ở Bắc Ninh

Đáp án:
Số trẻ em ở Hà Nội là 33
Số trẻ em ở Bắc Ninh là 35
Số trẻ em ở Hà Nội cân nặng trên 12 là 27
Số trẻ em ở Bắc Ninh cân nặng trên 12 là 32
p- value= 0.8788
e. (2đ) Tại mức ý nghĩa 5%, kiểm định giả thiết cân nặng trung bình của các trẻ em 3
tuổi tại các khu vực là như nhau. Giả thiết các tổng thể tuân theo phân phối chuẩn
và có cùng phương sai. Bạn dùng phân phối gì để thực hiện kiểm định?
Đáp án: p- value = 0.8446

f. (1.5đ) Tại mức ý nghĩa 5%, kiểm định giả thiết cân nặng trung bình của các bé 3
tuổi ở Hà Nội ít nhất là 13 kg
Đáp án: p- value = 0.9996

KHÔ NG CHO MƯỢ N TRANG 21


SƯU TẦM: CAO SAO LIÊN

ĐỀ THI XÁC SUẤT THỐNG KÊ NHÓM 1 NĂM 2019-2020 – ĐỀ 3


Lưu ý khi làm bài: Với những bài toán kiểm định phải ghi rõ cặp giả thuyết, 1 câu lệnh
chính, p giá trị và kết luận của bài toán
Câu 1(0.5đ) Người ta chọn ngẫu nhiên một số căn hộ vừa được bán tại một tòa chung cư.
Một số biến và biến ngẫu nhiên được xác định. Xét xem các khẳng định sau đúng hay sai
a. Biến ngẫu nhiên chỉ diện tích của căn hộ là biến ngẫu nhiên rời rạc
b. Biến chỉ số phòng của một căn hộ là biến định lượng rời rạc
Câu 2(0.5đ) Để thực hiện một nghiên cứu của mình, một nhà nghiên cứu đã chọn mẫu
bằng cách cứ mỗi buổi sáng chọn 20 sinh viên đầu tiên đến trường. Đó là cách chọn mẫu
A. Ngẫu nhiên đơn giản
B. Ngẫu nhiên hệ thống
C. Không ngẫu nhiên
D. Ngẫu nhiên cả khối
Câu 3(1 đ) Chọn ngẫu nhiên 1 số em bé 1 tuổi, ghi lại chiều cao (cm) của các em bé
được chọn. Biểu đồ thân và lá của dữ liệu như sau ( phần thân là hàng chục, lá là hàng
đơn vị)

Thân Lá
6 055679
7 000112444569
8 012
a. Khôi phục lại dữ liệu ban đầu
b. Phân tổ dữ liệu với khoảng cách tổ là 10. Lập bảng tần số cho cách phân tổ trên
Câu 4 (1 đ) Một chi tiết máy đòi hỏi phải có trọng lượng trung bình ít nhất là 1kg. Một
chuyên viên vừa đi kiểm tra chất lượng, chọn ngẫu nhiên 40 chi tiết máy. Tại mức ý
nghĩa 5%, chuyên viên đó đã chấp nhận giả thuyết không trong bài toán kiểm định
a. Kết luận của chuyên viên có thể mắc sai lầm loại mấy ? giải thích rõ sai lầm đó
b. Tại mức ý nghĩa 1% nếu thực hiện lại bài toán kiểm định trên với cùng dữ liệu
mẫu ta sẽ bác bỏ hay chấp nhận giả thuyết không (có giải thích)

KHÔ NG CHO MƯỢ N TRANG 22


SƯU TẦM: CAO SAO LIÊN

Câu 5(1 đ)
a. Cho A và B là 2 biến cố xung khắc và P(A)= 0.2. Khi đó P(A/B)=0.2. Khẳng định
trên đúng hay sai. Hãy giải thích câu trả lời của bạn
b. Khả năng lây nhiễm khi tiếp xúc gần người mắc bệnh của 1 loại bệnh là 90%. Ba
người cùng tiếp xúc gần một cách độc lập với 1 người bị mắc bệnh này
Tính xác suất để cả 3 người này cũng bị lây bệnh
Câu 6 (1đ) Lượng cholesterol trong một quả trứng gà tuân theo phân phối chuẩn với
trung bình là 200 (mg) và độ lệch chuẩn là 15(mg)
a. Xác suất để một quả trứng gà được chọn ngẫu nhiên có lượng cholesterol cao hơn
215 (mg) là bao nhiêu
b. 5% những quả trứng gà có lượng cholesterol cao nhất nằm trong phạm vi nào

Câu 7(7đ) File ChieuCaoVaCanNang.csv ghi lại dữ liệu về chiều cao (cm), cân
nặng (kg), giới tính và khu vực sống của 1 số bé 3 tuổi được chọn ngẫu nhiên
GioiTinh ChieuCao CanNang Khu Vuc
(HaNoi, BacNinh,
BacGiang)

a. (1đ) Liệt kê tên các biểu đồ có thể dùng để mô tả phân phối cho biến giới tính.
Hãy vẽ (nêu câu lệnh) một biểu đồ và nhận xét về phân phối của biến giới tính dựa
vào biểu đồ đó

b. (0.5đ) 90% trẻ trong dữ liệu có chiều cao không vượt quá bao nhiêu
Đáp án: 101.2
c. (0.5đ) Biến chiều cao có giá trị ngoại biên không? Dựa vào đâu để bạn kết luận

KHÔ NG CHO MƯỢ N TRANG 23


SƯU TẦM: CAO SAO LIÊN

d. (1.5đ) Tại mức ý nghĩa 5%, hãy kiểm định giả thiết tỷ lệ trẻ em 3 tuổi có chiều cao
lớn hơn 95 cm là 30%
Đáp án:
Số trẻ em có chiều cao lớn hơn 95 là 33
Tổng số trẻ em là 99
p- value = 0.4692
e. (2đ) Tại mức ý nghĩa 5%, kiểm định giả thiết chiều cao trung bình của các trẻ em
3 tuổi tại Bắc Ninh và Bắc Giang là như nhau.
Đáp án: p- value = 0.01385
f. (1.5đ) Tại mức ý nghĩa 5%, kiểm định giả thiết giới tính và khu vực sống của các
bé 3 tuổi có mối liên hệ với nhau. Bạn dùng phân phối gì để thực hiện kiểm định?
Xác định bậc tự do của phân phối đó
Đáp án
Bảng tần số chéo
Gioi Tinh Ha Noi BacNinh BacGiang
Nam 20 20 17
Nu 11 15 16
P – value = 0.574

g. Tính trung bình và độ lệch chuẩn của cân nặng. Tỷ lệ các bé trong dữ liệu có cân
nặng lớn hơn trung bình một lượng bằng 2 lần độ lệch chuẩn là bao nhiêự
Đáp án:
Trung bình cân nặng 14.53434
Độ lệch chuẩn của cân nặng 2.027523

h. Tính độ trải giữa của cân nặng


Q1 =3, Q3 =16

KHÔ NG CHO MƯỢ N TRANG 24


SƯU TẦM: CAO SAO LIÊN

ĐỀ 4
Câu 1: (1 đ) Một sàn giao dịch bất động sản tổng hợp số căn hộ bán được trong 1 tháng
của 1 tòa nhà theo từng đại lý. Thông tin ghi lại trong bảng
Đại lý Số Căn
A 20
B 25
C 5
a. Dùng biểu đồ gì mô tả thông tin trong bảng trên? Vẽ phác thảo tương đối biểu đồ
đó
b. Tính tỷ lệ số căn bán được của từng đại lý. Dùng biểu đồ gì mô tả thông tin đó
Câu 2: (2đ)
a. Khẳng định sau đúng hay sai. Hãy giải thích câu trả lời của bạn.
“Nếu P(A)=0.2, P(B)=0.3 và 2 biến cố A, B xung khắc thì P(A+B)=0.06”
b. Một cửa hàng bán đầu đĩa và đĩa nhạc thống kê số lượng hàng hóa bán được từng
ngày thì thấy rằng trong 1 ngày xác suất để bán được ít nhất một đầu đĩa là 0.75, ít
nhất một đĩa nhạc là 0.6, ít nhất một đầu đĩa và ít nhất một đĩa nhạc là 0.5. Chọn
ngẫu nhiên 1 ngày. Tính xác suất để ngày đó bán được ít nhất một đầu đĩa biết
rằng cửa hàng đã bán được ít nhất một đĩa nhạc. Hai biến cố “Bán được ít nhất
một đầu đĩa” và “bán được ít nhất một đĩa nhạc” có độc lập không?
c. Trọng lượng của một loại hoa quả tuân theo phân phối chuẩn với trung bình là
200g và độ lệch chuẩn là 10g. 90% các loại quả trên có trọng lượng không vượt
quá bao nhiêu.

KHÔ NG CHO MƯỢ N TRANG 25


SƯU TẦM: CAO SAO LIÊN

KHÔ NG CHO MƯỢ N TRANG 26

You might also like