You are on page 1of 8

ÔN TẬP THỐNG KÊ HK213

Câu 1: Người ta khảo sát về thời gian dành cho việc tự học của các sinh viên năm hai trong đợt nghỉ học
phòng dịch SC2. Dưới đây là số liệu mẫu thu được:
Thời gian tự học trong 1 tuần (giờ) 0-6 6-12 12-18 18 -24 24-30 30-36 36-42
Số sinh viên tương ứng 8 32 46 40 25 18 11

(a) Hãy tìm khoảng ước lượng bên trái cho thời gian tự học trung bình của một sinh viên năm hai, với
độ tin cậy 94%.
(b) Hãy kiểm định xem có thể nói thời gian tự học trung bình của một sinh viên năm hai là lớn hơn 18
giờ/ 1 tuần hay không, xét với mức ý nghĩa 4%.
(c) Có ý kiến cho rằng 25% sinh viên năm hai có thời gian tự học trong 1 tuần từ 30 giờ trở lên. Tỷ lệ
này có cao hơn thực tế hay không, hãy kết luận với mức ý nghĩa 5% dựa vào số liệu khảo sát.
(d) Hãy kiểm định xem thời gian tự học trong tuần của mỗi sinh viên năm hai có tuân theo phân phối
chuẩn hay không, xét với mức ý nghĩa 5%? (chỉ dành cho sinh viên mã môn học MT2001)

Câu 2: Dưới đây là một mẫu thu được khi khảo sát trên 12 sinh viên. X là số giờ tự học môn học XSTK
trong 1 tuần và Y là điểm trung bình môn của sinh viên đó. Giả thiết X, Y tuân theo phân phối chuẩn.
X (giờ) 3 3 4 2 5 6 3.5 3 6 5.5 5 4.5
Y (điểm) 5 4 6.5 4 8 9 7 6 10 9.5 8.5 7.5

(a) Tìm khoảng ước lượng cho điểm số trung bình môn học XSTK của sinh viên toàn khóa, với độ tin cậy
96%.
(b) Theo một khảo sát trước đây, thời gian trung bình mỗi sinh viên dành cho việc tự học môn XSTK là
3.5 giờ/ 1 tuần. Từ số liệu mẫu trên, ta có thể cho rằng thời gian mà sinh viên dành cho môn học này
hiện đã tăng lên so với trước đây hay không?
(c) Tìm hệ số tương quan mẫu và nêu nhận xét về mối liên hệ giữa X và Y.
(d) Hãy ước lượng phương trình hồi quy tuyến tính mẫu Y theo X. Từ đó hãy dự đoán điểm thi của một
sinh viên có thời gian tự học môn XSTK hàng tuần là 4.5 giờ. Nếu thời gian tự học của sinh viên tăng
thêm 1 giờ / 1 tuần thì dự kiến điểm trung bình của sinh viên sẽ tăng thêm bao nhiêu?
(e) Tìm khoảng tin cậy 95% cho các hệ số hồi quy.

Câu 3: Người ta khảo sát về thói quen sử dụng điện thoại hàng ngày của các sinh viên trong một trường
đại học. Dưới đây là số liệu mẫu được lấy từ những sinh viên năm thứ hai của trường:

Đánh giá mức độ sử dụng điện thoại trong ngày Ít Trung Bình Nhiều
Thời gian sử dụng điện thoại trong 1 ngày (giờ) 0-2 2-3 3-4 4 -5 5-6 6-8
Số sinh viên tương ứng 14 26 46 54 42 28

(a) Hãy ước lượng thời gian sử dụng điện thoại trung bình trong ngày của một sinh viên năm 2 với độ tin
cậy 97%.
(b) Nếu muốn khoảng ước lượng cho thời gian sử dụng điện thoại trung bình trong ngày của một sinh
viên năm hai với độ tin cậy 97% có độ dài là 20 phút thì cần mẫu khảo sát có kích thước bao nhiêu?
(c) Dựa vào số liệu mẫu trên, hãy kiểm định xem có thể nói hơn 30% sinh viên năm hai có thời gian sử
dụng điện thoại hàng ngày từ 5 giờ trở lên hay không, xét với mức ý nghĩa 1%.
(d) Cũng trong đợt khảo sát này, người ta thu được số liệu từ 160 sinh viên năm thứ tư. Số sinh viên năm
tư sử dụng điện thoại ở mức độ ít, trung bình và nhiều lần lượt là 15, 65 và 80. Với mức ý nghĩa 5%,
hãy kiểm định xem mức độ sử dụng điện thoại trong ngày của sinh viên 2 khóa có phân bố tỉ lệ như
nhau hay không. (chỉ dành cho sinh viên mã môn học MT2001)

Câu 4: Chọn ngẫu nhiên 9 chi tiết do một máy tiện sản xuất tự động, người ta đo được độ dài (đơn vị:
cm) của chúng như sau:
21 21.5 22 23 22.5 21.5 22.5 21 22

Trang 1
Giả sử rằng chiều dài các chi tiết tuân theo phân phối chuẩn với phương sai 1.9 cm2 .

(a) Tìm khoảng ước lượng cho chiều dài trung bình các chi tiết với độ tin cậy 97%.
(b) Nếu muốn khoảng tin cậy 97% cho chiều dài trung bình các chi tiết có ngưỡng sai số là 0.5 cm thì cần
khảo sát bao nhiêu chi tiết?
(c) Thiết kế ban đầu cho máy tiện này là sản xuất các chi tiết có độ dài 21 cm. Số liệu khảo sát trên có
đủ để nói rằng chiều dài trung bình các chi tiết đã vượt quá so với thiết kế ban đầu hay không? Kết
luận với mức ý nghĩa 1%.

Câu 5: Cho X (cm) và Y (gram) là các biến ngẫu nhiên chỉ chiều dài và cân nặng của một loại sản phẩm
trong kho hàng. Khảo sát một mẫu, ta có bảng kết quả sau đây.
Y
X 90 100 110 120
10-12 7 2
12-14 8 4
14-16 8 15 10
16-18 17 6
18-20 7

Các sản phẩm đồng thời có cân nặng vượt quá 105 gram và chiều dài từ 16 cm trở lên được coi là sản phẩm
loại 2.

(a) Tính các đặc trưng mẫu và viết phương trình đường hồi quy tuyến tính mẫu của Y theo X. Hãy dự
đoán cân nặng trung bình của một sản phẩm có chiều dài 15.5cm.
(b) Tìm khoảng ước lượng cho hệ số góc và hệ số tự do của đường hồi quy tuyến tính Y theo X với độ
tin cậy 98%. Tìm độ lệch chuẩn σ tương ứng.
(c) Hãy tìm khoảng ước lượng 98% cho chiều dài trung bình và cân nặng trung bình của sản phẩm.
(d) Có 1 báo cáo cho rằng chỉ có 20% sản phẩm trong kho là loại 2. Dựa vào số liệu khảo sát trên, hãy cho
biết có đủ kết luận là tỉ lệ sản phẩm loại 2 trong kho cao hơn hẳn số liệu trong báo cáo hay không,
xét với mức ý nghĩa 1%.

Câu 6: Giả thiết trường B có 7000 sinh viên nam và 3000 sinh viên nữ. Người ta khảo sát ngẫu nhiên 80 sinh
viên nam và 50 sinh viên nữ về sở thích xem phim. Có 17 sinh viên nam và 10 sinh viên nữ trả lời là thường
xuyên tới rạp xem phim. Số lần tới rạp trung bình trong 1 năm của các sinh viên nam là 3.2 và số lần tới
rạp trung bình trong 1 năm của các sinh viên nữ là 2.8. Các phương sai mẫu tương ứng lần lượt là 0.9 và 0.8.

(a) Các nhà sản xuất phim dự đoán có khoảng 25% số sinh viên nam ở vùng này thường xuyên đến rạp.
Hãy kiểm định xem số liệu dự đoán đó có cao hơn tỉ lệ sinh viên nam ở trường B thường đến rạp xem
phim hay không, kết luận với mức ý nghĩa 5%.
(b) Hãy tìm khoảng tin cậy 99% cho số sinh viên nam ở trường B thường xuyên đến rạp xem phim.
(c) Số lần đến rạp trung bình của các sinh viên nam và nữ có thể coi là khác nhau hay không, hãy kiểm
định với mức ý nghĩa 5%? Giả thiết số lần đến rạp của sinh viên nam và sinh viên nữ tuân theo quy
luật chuẩn.

Câu 7: Trường THPT Bình An muốn đánh giá về hiệu quả của việc hướng nghiệp cho học sinh lớp 12
trong những năm gần đây. Nhà trường đã thu thập ý kiến đánh giá của 12 học sinh cũ hiện đang theo học
các trường ĐH, CĐ và các trường nghề. X là mức điểm thể hiện sự yêu thích của học sinh với ngành nghề
đang học khi nộp hồ sơ tuyển sinh; còn Y là mức điểm thể hiện sự yêu thích của học sinh đó với ngành
nghề đang học tại thời điểm hiện tại.

Dưới đây là bảng số liệu mẫu thu được:


X 8 7 6 5 5 6 9 9.5 8.5 7 5 6
Y 5 5 6.5 4 5 7 7 10 7 9.5 8.5 7

Trang 2
Giả sử điểm đánh giá của các học sinh, sinh viên tuân theo phân phối chuẩn.

(a) Có thể nói rằng sự yêu thích của học sinh, sinh viên với ngành mình chọn đã tăng lên so với khi nộp
hồ sơ tuyển sinh hay không? Kết luận với mức ý nghĩa 1%?
(b) Hãy tìm khoảng tin cậy 99% cho mức điểm yêu thích trung bình của các học sinh với ngành mình
đang theo học ở thời điểm hiện tại.

Câu 8: Việc áp dụng kỹ thuật để xử lý sau thu hoạch đối với các trái thanh long thương phẩm giúp thời
gian bảo quản của trái được lâu hơn. Người ta muốn tìm sự liên hệ của biến ngẫu nhiên Y là hàm lượng
vitamin C trong trái thanh long (đơn vị đo: mg%) với biến ngẫu nhiên X là thời gian bảo quản trái cây (
đơn vị đo: tuần).

Một mẫu gồm 8 trái đã được khảo sát với kết quả tính toán như sau:
X 0 0 1 1 2 2 3 3
Y 7.6 7.7 6.4 6.6 5.8 5.4 5.4 5.1

(a) Tìm hệ số tương quan mẫu rXY .


(b) Tìm các hệ số của phương trình đường hồi quy tuyến tính mẫu Y theo X. Hãy dự đoán sau mỗi tuần
bảo quản, hàm lượng vitamin C trung bình bị mất đi là bao nhiêu?
(c) Dự đoán hàm lượng vitamin C (đơn vị mg%) trong trái thanh long sau thời gian bảo quản 2.5 tuần.
(d) Tìm khoảng ước lượng 95% cho các hệ số của phương trình hồi quy tuyến tính Y theo X.

Câu 9: Một xưởng có 2 máy tiện tự động sản xuất cùng 1 loại trục máy. Từ các sản phẩm do máy thứ
nhất sản xuất ra, người ta chọn ngẫu nhiên 80 chiếc rồi đo chiều dài bán kính của các trục máy này, và có
bảng thống kê sau:
Bán kính (cm) 34-35 35-36 36-37 37-38 38-39 39-40
Số trục 3 7 14 22 28 6

Các trục máy có bán kính từ 36 cm đến 38 cm gọi là đạt chuẩn.

(a) Tìm khoảng ước lượng cho tỉ lệ trục máy đạt tiêu chuẩn với độ tin cậy 96
(b) Tìm khoảng tin cậy 95% cho chiều dài trung bình của các bán kính đạt chuẩn.
(c) Từ 15 trục máy được sản xuất bởi máy tiện thứ 2, người ta đo được bán kính trung bình là 36.3 cm
và độ lệch mẫu là 1.8 cm. Từ các số liệu trên, có thể cho rằng bán kính trung bình của các trục máy
ở 2 máy là khác nhau hay không, kết luận với mức ý nghĩa 5%. Giả thiết chiều dài bán kính các trục
máy ở 2 máy đều tuân theo phân phối chuẩn với phương sai bằng nhau.

Câu 10: Giả thiết rằng có 2000 sinh viên lựa chọn thi online cuối kỳ môn XSTK và 300 sinh viên lựa chọn
thi vấn đáp cũng môn này. Theo dõi ngẫu nhiên kết quả thi của một số sinh viên, ta có được bảng số liệu
sau:
Hình thức thi Xếp loại Khá - Giỏi Xếp loại trung bình Xếp loại không đạt Tổng số SV
Online 30 35 15 80
Vấn đáp 15 25 5 45

(a) Với độ tin cậy 99%, hãy tìm khoảng ước lượng cho tỷ lệ sinh viên đạt loại Khá - Giỏi khi thi online và
khoảng ước lượng cho số sinh viên trong trường đạt loại Khá - Giỏi khi thi online.
(b) Có ý kiến cho rằng tỷ lệ sinh viên thi đạt yêu cầu ở hình thức online là thấp hơn so với hình thức vấn
đáp. Với mức ý nghĩa 5%, hãy đánh giá về ý kiến trên.
(c) Dưới đây là số liệu thống kê về số buổi vắng trên lớp của các sinh viên lựa chọn thi vấn đáp trong
mẫu. Với mức ý nghĩa 10%, hãy cho biết có thể xem như số buổi vắng của sinh viên tuân theo phân
phối Poisson hay không? (chỉ dành cho sinh viên mã môn học MT2001)
Số buổi vắng 0 1 2 3 4
Số sinh viên tương ứng 22 11 6 4 2

Trang 3
Câu 11: Một xí nghiệp gia công sản phẩm may mặc có tỉ lệ lỗi là 20%. Sau khi thực hiện cải tiến sản xuất
với mục đích làm giảm tỉ lệ sản phẩm lỗi, bộ phận kỹ thuật đã theo dõi quá trình gia công 120 sản phẩm
và thu được các số liệu sau:
• Có 13 phế phẩm trong mẫu 120 sản phẩm.
• Thời gian gia công trung bình của các sản phẩm trong mẫu là 32 phút và phương sai là 169 phút2 .
Giả sử thời gian gia công của các sản phẩm tuân theo quy luật chuẩn.

(a) Có thể coi như việc cải tiến kỹ thuật là hiệu quả hay không, kết luận với mức ý nghĩa 5%?
(b) Tìm khoảng ước lượng cho thời gian gia công trung bình một sản phẩm ở thời điểm hiện tại, với độ
tin cậy 95%.
(c) Nếu muốn khoảng ước lượng 95% cho thời gian gia công trung bình các sản phẩm có chiều dài không
quá 3 phút thì cần khảo sát mẫu có kích thước tối thiểu là bao nhiêu?

Câu 12: Người ta tiến hành đo đường kính X (cm) và chiều cao Y (m) cho các cây cùng loại và cùng
độ tuổi được trồng trong một khu rừng để đánh giá hiệu quả của việc cải tiến phương pháp chăm sóc cây.
Những cây có đường kính từ 26 cm và chiều cao từ 7 m trở lên được coi như cây loại 1. Dưới đây là số đo
của 120 cây được lựa chọn ngẫu nhiên. Giả sử X, Y có phân phối chuẩn.
Y (m)
X (cm) 5 6 7 8 9
20 1 3
22 4 8 6
24 6 21 8
26 7 26 8
28 6 12 5

(a) Hãy tìm khoảng ước lượng bên phải cho chiều cao trung bình của các cây có đường kính 28 cm với độ
tin cậy 99%.
(b) Nếu muốn khoảng ước lượng cho tỉ lệ cây loại I trong rừng có độ dài là 0.14 và độ tin cậy là 99% thì
người ta cần khảo sát thêm bao nhiêu cây nữa?
(c) Theo một tài liệu nghiên cứu về sự sinh trưởng của cây thì ở độ tuổi này, với điều kiện chăm sóc
truyền thống thì đường kính trung bình của cây là 24 cm. Với mức ý nghĩa 3%, chúng ta có thể nói
rằng việc cải tiến phương pháp chăm sóc cây đã đem lại hiệu quả so với trước đây hay không?
(d) Tìm phương trình hồi quy tuyến tính mẫu Y theo X.
(e) Tìm khoảng tin cậy 90% của hệ số góc đường hồi quy tuyến tính Y theo X.

Câu 13: Trong một kho hàng có rất nhiều sản phẩm của xí nghiệp A. Cân ngẫu nhiên một số sản phẩm
loại này, ta thu được kết quả sau.
Trọng lượng (kg) 0.8 - 0.85 0.85 - 0.9 0.9 - 0.95 0.95 - 1.00 1.00 - 1.05 1.05 -1.10 1.10 - 1.15
Số sản phẩm 5 10 20 30 15 10 10

1. Các sản phẩm có trọng lượng từ 1.05 kg trở lên là sản phẩm loại I. Với độ tin cậy 98%, hãy ước lượng
trọng lượng trung bình của các sản phẩm loại I, biết rằng trọng lượng sản phẩm loại I của xí nghiệp
A là biến ngẫu nhiên có phân phối chuẩn.

2. Giả sử trong kho có để lẫn 1000 sản phẩm của xí nghiệp B. Lấy ngẫu nhiên từ kho ra 100 sản phẩm
thì thấy có 11 sản phẩm của xí nghiệp B và 89 sản phẩm của xí nghiệp A. Đo cân nặng của của 11
sản phẩm của xí nghiệp B, ta thu được kết quả:
0.88 ; 0.92 ; 0.85 ; 0.9 ; 0,95 ; 1.05 ; 1.12 ; 0.82 ; 0.93 ; 1.03 ; 1.07
Đo cân nặng của 89 sản phẩm của xí nghiệp A ta tính được trung bình mẫu 1.02 kg và độ lệch chuẩn
hiệu chỉnh là 0.1 kg. Nếu cân nặng các chi tiết do mỗi máy sản xuất đều tuân theo phân phối chuẩn
với cùng độ lệch chuẩn 0.05 kg, có thể kết luận các sản phẩm do hai xí nghiệp có cân nặng trung bình
khác nhau hay không?

Trang 4
(a) Hãy ước lượng số sản phẩm của kho hàng này với độ tin cậy 95%.
(b) Thực hiện kiểm định với mức ý nghĩa 1%.

Câu 14: Khảo sát số hoa hồng bán ra trong một ngày của một cửa hàng bán hoa sau một thời gian, người
ta ghi được số liệu sau:
Số hoa hồng (đoá) 12 13 15 16 17 18 19
Số ngày 3 2 7 7 3 2 1

1. Sau khi tính toán, ông chủ cửa hàng nói rằng nếu trung bình một ngày không bán được 15 đoá hoa
thì chẳng thà đóng cửa còn hơn. Dựa vào số liệu trên, hãy kết luận giúp ông chủ cửa hàng xem có nên
tiếp tục bán tiếp hay không, với mức ý nghĩa 5%.
2. Giả sử những ngày bán được từ 13 đến 17 đoá hoa hồng là những ngày bình thường.
(a) Hãy ước lượng số ngày bình thường của cửa hàng trong một năm 365 ngày ở độ tin cậy 90%.
(b) Nếu muốn cho khoảng ước lượng tỷ lệ ngày bình thường của cửa hàng có sai số là 10% thì cần
khảo sát thêm bao nhiêu ngày nữa, xét độ tin cậy là 98%?

Câu 15: Dưới đây là số liệu về chỉ số chất lượng không khí (AQI) ở Hà Nội trong 5 ngày ngẫu nhiên của
tháng 4/2021 và 5 ngày ngẫu nhiên của tháng 4/2022.

Chỉ số bụi PM 2.5 74 66 44 78 35


Tháng 4/2021
Chỉ số bụi PM 10 37 43 32 44 24
Chỉ số bụi PM 2.5 77 109 39 27 66
Tháng 4/2022
Chỉ số bụi PM 10 56 38 23 12 35

(a) Với mức ý nghĩa 5%, có thể xem như chỉ số bụi PM 2.5 trung bình mỗi ngày ở Hà Nội trong tháng
4/2022 đã tăng so với cùng thời điểm năm 2021 hay không? Giả thiết rằng số liệu trong các mẫu tuân
theo phân phối chuẩn với phương sai bằng nhau.
(b) Xét mẫu 2 chiều (X,Y), trong đó kí hiệu X là chỉ số bụi PM 2.5 và Y là chỉ số bụi PM 10 ở Hà Nội
trong mỗi ngày tháng 4/2022. Tìm hệ số tương quan mẫu, phương trình hồi quy tuyến tính mẫu, và
ước lượng độ lệch chuẩn σ.
(c) Tìm khoảng tin cậy 95% cho các hệ số của phương trình đường hồi quy.

Câu 16: (chỉ dành cho sinh viên mã môn học MT2013) Một bài báo đã mô tả một thí nghiệm để khảo sát
ảnh hưởng của kali hydroxit trong tổng hợp của dầu diesel sinh học. Người ta nghi ngờ rằng kali hydroxit
(PH) có liên quan đến các metyl este của axit béo (FAME) là nguyên tố chính trong dầu diesel sinh học.
Ba mức nồng độ PH đã được sử dụng, và sáu lần lặp lại được chạy theo thứ tự ngẫu nhiên. Dữ liệu được
hiển thị trong bảng sau.
Nồng độ PH Nồng độ FAME
0.6 84.3 84.5 86.5 86.7 86.9 86.9
0.9 89.3 89.4 88.5 88.7 89.2 89.3
0.12 90.2 90.3 88.9 89.2 90.7 90.9

(a) Thực hiện Anova một nhân tố để kết luận xem có sự khác biệt về nồng độ FAME trung bình ở các
nồng độ PH không? Xét α = 0.05.
(b) Tìm khoảng tin cậy 95% về sự khác biệt về trung bình ở các nhóm.

Câu 17: (chỉ dành cho sinh viên mã môn học MT2013) Hãy sử dụng phương pháp Anova để so sánh chất
lượng không khí ở thành phố Hồ Chí Minh trong 3 năm liên tiếp, với số liệu được lấy trong 3 tháng đầu
của mỗi năm.
Năm Số liệu AQI về chỉ số bụi mịn PM 2.5 Trung bình mẫu Phương sai mẫu s2
2022 74 96 53 74 121 83.6 668.3
2021      83.4 644.3
2020      74 506

Trang 5
Các ô vuông  trong bảng đều có số liệu nhưng đã được ẩn đi.
s2 còn được gọi là phương sai mẫu hiệu chỉnh.

(a) Kết luận với mức ý nghĩa 5%.


(b) Thực hiện so sánh bội với mức ý nghĩa 5%.

Câu 18: (chỉ dành cho sinh viên mã môn học MT2013) Các kỹ sư xây dựng quan tâm đến sự khác biệt
trong cường độ nén (đơn vị: psi) của bê tông giữa 3 kỹ thuật trộn nguyên liệu khác nhau. Bảng dưới đây
thể hiện một phần của số liệu 3 mẫu nhận được.
4
X
Kỹ thuật trộn Cường độ nén Trung bình xj Tổng bình phương (xij − xj )2
i=1
A 2689 2674 2682 2676 - -
B     2646.5 29
C     2694.75 84.75

Các ô vuông  trong bảng đều có số liệu nhưng đã được ẩn đi.


Các dấu gạch - trong bảng có thể tính được từ các số liệu đã cho.
(a) Hãy dùng phương pháp Anova để giải bài toán trên, kết luận với mức ý nghĩa 5%.
(b) Cường độ chịu nén của bê tông là ứng suất nén phá hủy của bê tông, tính bằng lực trên 1 đơn vị diện
tích. Cường độ chịu nén là đặc trưng cơ bản của bê tông nhằm phản ánh khả năng chịu lực. Hãy thực
hiện so sánh bội để giúp các kỹ sư xây dựng có thể lựa chọn kỹ thuật trộn nào tối ưu nhất trong việc
làm tăng khả năng chịu lực của bê tông, xét mức ý nghĩa 5%.

Câu 19: (chỉ dành cho sinh viên mã môn học MT2013) Để xem xét sự ảnh hưởng của hình thức thi tới
kết quả thi của sinh viên, nhà trường khảo sát về điểm thi của sinh viên môn XSTK ở 3 hình thức thi: thi
online, thi tự luận và thi vấn đáp. Bảng dưới đây thể hiện một phần của số liệu 3 mẫu nhận được.

Điểm của sinh viên theo các hình thức thi


Thi online Thi tự luận Thi vấn đáp
6 x12 x13
6.5 x22 x23
7.0 x32 x33
7.5 x42 x43
6.3 x52 x53
Trung bình từng mẫu xj − 5.22 4.94
Tổng bình phương các giá trị trong từng mẫu
X 5
x2ij − 144.07 127.99
i=1

Các dấu gạch - trong bảng có thể tính được từ các số liệu đã cho.

(a) Hãy dùng phương pháp Anova để giải bài toán trên, kết luận với mức ý nghĩa 5%.
(b) Thực hiện so sánh bội với mức ý nghĩa 5%.

Câu 20: (chỉ dành cho sinh viên mã môn học MT2013) Người ta tin rằng có sự liên quan giữa màu tóc tự
nhiên và sức chịu đau. Thế nên, 27 phụ nữ đã được chọn ngẫu nhiên để thực hiện một cuộc khảo sát. Trong
cuộc khảo sát này, các phụ nữ được ghi nhận màu tóc theo 3 gam màu: Sáng, trung và tối. Đồng thời, họ
cũng được ghi nhận sức chịu đau, với sức chịu đau được đánh giá tăng dần theo thang điểm 100. Bảng bên
dưới tóm tắt kết quả của cuộc khảo sát này:

Trang 6
Màu sáng Màu trung bình Màu tối
Số phụ nữ tham gia khảo sát 9 9 9
Điểm trung bình trong mỗi gam màu y A = 55.7778 y B = 54.2222 y C = 52.3333
Điểm trung bình trong toàn dữ liệu: y = 54.1111
X27
Tổng bình phương điểm trong toàn dữ liệu: yi2 = 79297
i=1

(a) Hãy dùng phương pháp Anova để giải bài toán trên, kết luận với mức ý nghĩa 5%.
(b) Thực hiện so sánh bội với mức ý nghĩa 5% (nếu có).

Câu 21: Một nghiên cứu được thực hiện về mối quan hệ giữa lượng đường được chuyển hoá (Y) trong một
quá trình sinh học ở các nhiệt độ (X) khác nhau được ghi lại như sau:

Lượng đường 8.86 7.79 7.62 8.75 7.91 9.14 7.9


Nhiệt độ 1.2 1.3 1.4 1.5 1.7 1.8 2

(a) Hãy dùng mô hình hồi quy tuyến tính để ước lượng trung bình lượng đường được chuyển hoá trong
quá trình sinh học ở nhiệt độ 1.6. Trình bày đầy đủ các phép tính để có được phương trình hồi quy.
(b) Tìm hệ số xác định và độ lệch chuẩn σ.
(c) Tìm khoảng tin cậy 98% cho các hệ số hồi quy.

Câu 22: Điều tra độ mòn lưỡi dao của một xưởng cơ khí, ta đo độ dày lưỡi dao (y, đơn vị: mm) theo thời
gian sử dụng (x, đơn vị: ngày) và thu được bảng số liệu:

x
y 2 3 5
2.6 1 2
2.8 1 2
3.0 3 2

(a) Tìm ước lượng điểm cho hệ số góc và tung độ giao điểm của đường hồi quy, từ đó suy ra phương trình
hồi quy mẫu.
(b) Hãy tính phần trăm độ phân tán toàn thể của độ dày lưỡi dao do mô hình hồi quy tuyến tính gây ra.
(c) Tìm khoảng tin cậy cho các hệ số của phương trình hồi quy, xét độ tin cậy 98%.

Câu 23: Để đánh giá hạn hán xảy ra vào mùa hè người ta khảo sát lượng bốc hơi Y (cm/ngày) ở một số
ao, hồ và nhiệt độ X (0 C) tương ứng trong ngày, thu được mẫu số liệu như sau:

X 34 35 36 37 38 39 40 41 42
Y 3 4 5 6 6 6 7 7 8
n 3 4 2 2 3 4 5 2 3

Giả sử nhiệt độ X và lượng bốc hơi Y đều tuân theo quy luật chuẩn.

(a) Tìm phương trình hồi quy tuyến tính thể hiện mối quan hệ giữa lượng bốc hơi theo nhiệt độ. Từ đó,
hãy dự đoán lượng lượng bốc hơi khi nhiệt độ trong ngày là 38.60 C.
(b) Tìm hệ số xác định và độ lệch chuẩn σ.
(c) Tìm khoảng tin cậy 98% cho các hệ số của phương trình hồi quy.

Câu 24: Một công ty sản xuất túi nylon họ quan tâm đến mối quan hệ giữa độ bền của túi và phần trăm
nylon trong thành phần sản xuất túi. Công ty này đã thực hiện một khảo sát trên 8 sản phẩm, ghi nhận
phần trăm nylon (X) và sức chịu nặng tối đa trong từng túi (Y ). Dựa trên bộ dữ liệu thu thập được, các nhà
nghiên cứu đã áp dụng mô hình hồi quy tuyến tính đơn và ghi nhận một số giá trị thống kê mẫu như bên dưới:

+ Trung bình mẫu của X và Y : x = 37.5, y = 339.4375

Trang 7
+ Phương sai mẫu (theo định nghĩa cũ) của X và Y : sb2X = 878.5714, sb2Y = 12107.2513
n
X
+ Tổng xi .yi .nij = 121189
i=1
(a) Tìm phương trình đường thẳng hồi quy ước lượng Y theo X.
(b) Tìm hệ số xác định và độ lệch chuẩn σ.
(c) Tìm khoảng tin cậy 95% cho các hệ số hồi quy.

Câu 25: Người ta nghiên cứu mối quan hệ giữa lượng thức uống có cồn đã sử dụng (x) và nồng độ cồn
trong máu (y) của một người. Trong một thí nghiệm, 17 người có thể trạng tương tự được cho dùng một
lượng đồ uống có cồn nhất định và kiểm tra nồng độ cồn trong máu của những người này sau 1 giờ.
17
X 17
X 17
X 17
X 17
X
Biết: xi = 71; x2i = 343; yi = 187.51; yi2 = 2291.7353 và xi yi = 878.13
i=1 i=1 i=1 i=1 i=1
(a) Tìm phương trình đường thẳng hồi quy ước lượng dự đoán nồng độ cồn trong máu theo số lượng thức
uống có cồn.
(b) Tìm hệ số xác định và độ lệch chuẩn σ.
(c) Tìm khoảng tin cậy 95% cho các hệ số hồi quy.

Trang 8

You might also like