Professional Documents
Culture Documents
2. Lý do chính cho chuyến du lịch này? (có 10 loại câu trả lời bao gồm: công tác, nghỉ
dưỡng, trăng mật…)
3. Nơi bạn sẽ ở? (có 11 loại câu trả lời bao gồm: khách sạn, nhà nghỉ nhà người quan,
lều trại…)
4. Tổng số ngày bạn ở Đà Lạt? Yêu cầu:
a. Tổng thể nghiên cứu là gì?
b. Bảng câu hỏi có phải là một cách tốt để thu thập thông tin trong trường hợp trên hay
không?
c. Dữ liệu thu thập từ các câu hỏi trên là dữ liệu định tính hay định lượng?
1.6. Tạp chí Condé Nast Traveler thực hiện một cuộc khảo sát hàng năm người đọc để xác định
nơi lưu trú tốt nhất trên toàn thế giới.
Tên nơi lưu trú Quốc gia Giá phòng Số lượng phòng Điểm đánh giá chung
Graveteye Manor Anh $$ 18 83,6
Villa d’Este Ý $$$$ 166 86,3
Hotel Prem Đức $ 54 77,8
Hotel d’Europe Pháp $$ 47 76,8
Palace Luzern Thụy Sỹ $$ 326 80,9
Royal Crescent Hotel Anh $$$ 45 73,7
Hotel Sacher Áo $$$ 120 85,5
Duc de Bourgogne Bỉ $ 10 76,9
Villa Gallici Pháp $$ 22 90,6
Nguồn: Condé Nast Traveler, tháng 2 năm 2000
a. Có bao nhiêu phần tử trong tập dữ liệu này?
b. Có bao nhiêu biến trong tập dữ liệu này?
c. Biến nào là định tính và biến nào là định lượng?
d. Thang đo của từng biến này là gì?
e. Số phòng trung bình của 9 khách sạn này là bao nhiêu?
f. Hãy tính điểm đánh giá chung toàn bộ
g. Phần trăm khách sạn nằm ở nước Anh?
h. Phần trăm khách sạn có giá phòng ở mức $$?
CHƯƠNG 2. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
2.1. Cuộc khảo sát nghiên cứu 3 loại sản phẩm A, B, C. Trong số 120 khách hàng được hỏi có
60 người chọn A, 24 người chọn B, 36 người chọn C. Thiết lập bảng phân phối tần số và tần
suất?
2.2. Một phần của bảng phân phối tần suất được cho như sau:
Tổ Tần suất
A 0,22
B 0,18
C 0,40
D
14 20 24 22 18 16 22 12
19 24 18 23 16 19 22 25
24 20 17 25 15 21 16 19
19 21 23 25 24 23 16 24
16 22 26 19 21 20 16 20
a. Xây dựng phân phối tần số với các nhóm là 12-14; 15-17; 18-20; 21-23; 24-26
b. Xây dựng phần phối tần suất và tần suất phần trăm
2. 7.Hãy xem xét phân phối tần số sau
Tổ Tần số
10-19 15
20-29 22
30-39 26
40-49 17
Hãy xây dựng phân phối tần số tích lũy và phân phối tần suất tích lũy.
2.8. Số sản phẩm bị bác bỏ của một nhà máy được ghi nhận trong thời gian 25 ngày vừa
qua như sau:
21 8 17 22 19 18 19 14 17 11 6 21 25
19 9 12 16 16 10 29 24 6 21 20 25
Xây dựng bảng phân phối tần số cho các dữ liệu này? Số lớp bằng 5.
2.9. Nhân viên của một bác sĩ nghiên cứu thời gian chờ của bệnh nhân đến văn phòng
với yêu cầu dịch vụ khẩn cấp. Các dữ liệu sau là thời gian chờ đợi tính bằng phút
được thu thập trong khoảng thời gian một tháng: 2; 5; 10; 12; 4; 4; 5; 17; 11; 8; 9;
9; 12; 21; 6; 8; 7; 13; 18; 3
Với phân nhóm 0-4; 5-9 và tiếp theo như vậy
a. Cho biết phân phối tần số, tần suất, tần số tích lũy, tần suất tích lũy?
b. Tỷ lệ bệnh nhân chờ dịch vụ khẩn ít hơn 9 phút?
2.10. Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau:
70 72 75 64 58 83 80 82
76 75 68 65 57 78 85 72
2.13. Các giá trị đơn hàng được ghi nhận như sau:
66 77 66 64 73 91 65 59 86 61 86 61 58 70
77 80 58 94 78 62 79 83 54 52 45 82 48 67 75
18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25
Thời gian chạy một phần tư dặm 0,92 0,98 1,04 0,90 0,99
Thời gian chạy một dặm 4,52 4,35 4,60 4,70 4,50
Sau khi xem thời gian chạy của mẫu này, một trong những huấn luyện viên nhận xét rằng
những người chạy một phần tư dặm có thời gian ổn định hơn. Sử dụng độ lệch chuẩn và hệ
số biến thiên để tóm tắt sự phân tán trong dữ liệu. Sử dụng hệ số biến thiên để chỉ ra rằng
tuyên bố của huấn luyện viên có đúng không?
3. 9.Xem xét một mẫu với các giá trị dữ liệu 10, 20, 12, 17 và 16. Tính giá trị z cho các quan
sát này.
3.10. Xem xét một mẫu với trung bình là 500 và độ lệch chuẩn là 100. Giá trị z tính cho
các giá trị dữ liệu sau đây: 520, 650, 500, 450 và 280.
3.11. Một mẫu có giá trị trung bình bằng 30 và độ lệch chuẩn bằng 5. Dùng định lý
Chebyshev để xác định phần trăm dữ liệu nằm trong các dải sau:
a. 20 đến 40
b. 15 đến 45
c. 22 đến 38
d. 18 đến 42
e. 12 đến 48
3.12. Giả sử dữ liệu có phân phối hình chuông với trung bình là 30 và độ lệch chuẩn là 5.
Sử dụng quy tắc thực nghiệm để xác định tỷ lệ dữ liệu trong mỗi dãy sau đây: a. 20 đến 40
b. 15 đến 45
c. 25 đến 35
3.13. Khảo sát mẫu 500 đơn hàng chúng ta có giá trị trung bình bằng 69 và độ lệch chuẩn bằng
7.
a. Tính các giá trị trong khoảng giới hạn (𝑥̅ − 𝑠; 𝑥̅ + 𝑠); (𝑥̅ − 2𝑠; 𝑥̅ + 2𝑠); (𝑥̅ −
3𝑠; 𝑥̅ + 3𝑠)
b. Nếu giá trị đơn đặt hàng có phân phối hình chuông, có khoảng bao nhiêu đơn hàng
có giá trị nằm trong các khoảng giới hạn nói trên?
3.8. Tiền lương của 1.000 nhân viên trong công ty có giá trị trung bình là 25.600 và độ
lệch chuẩn là 2.200. Giả sử tiền lương của nhân viên tuân theo phân phối hình
chuông.
a. Có bao nhiêu người nhận tiền lương trong khoảng 23.400 và 27.800?
b. Có bao nhiêu người nhận tiền lương trong khoảng 21.200 và 30.000?
c. Có bao nhiêu người nhận tiền lương trong khoảng 19.000 và 32.200?
3.9. Năm quan sát thu thập cho hai biến theo bảng sau
xi 4 6 11 3 16 yi 50 50 40 60 30
a. Xây dựng một biểu đồ phân tán với x trên trục hoành.
b. Biểu đồ phân tán xây dựng trong câu a cho thấy gì về mỗi liên hệ giữa hai biến?
c. Tính toán và giải thích hiệp phương sai mẫu.
d. Tính toán và giải thích hệ số tương quan mẫu.
3.10. Một ban nghiên cứu giao thông về tốc độ và số dặm đi được của xe ô tô cỡ trung,
kết quả cho trong bảng dữ liệu sau:
Tốc độ 30 50 40 55 30 25 60 25 50 55
Số dặm 28 25 25 23 30 32 21 35 26 25
4.2. Bảng sau là các phép thử và các biến ngẫu nhiên có liên quan. Trong mỗi trường hợp, cho
biết các giá trị mà biến ngẫu nhiên có thể nhận và cho biết đó là biến ngẫu nhiên rời rạc hay
liên tục?
Phép thử Biến ngẫu nhiên (x)
Thực hiện bài kiểm tra gồm 20 câu hỏi Số câu trả lời đúng
Quan sát xe ô tô đi qua một trạm kiểm soát Số xe đi qua trạm kiểm soát
trong vòng 1 giờ
Kiểm tra 50 bản khai thu nhập cá nhân Số lượng bản khai có lỗi
Quan sát giờ làm việc của một nhân viên Số giờ làm việc không hiệu quả trong ngày
làm việc
Cân một gói hàng Khối lượng (kg) của một gói hàng
4. 3.Cho biến ngẫu nhiên rời rạc x có phân phối xác suất như sau:
x f (x)
30 0,2
40 0,25
50 0,3
60 0,25
a. Xác suất để x nhận giá trị nhỏ hơn 40?
b. Xác suất để x nhỏ hơn hay bằng 50?
c. Xác suất để x lớn hơn 40?
4.4.Số lượng tivi bán được ở cửa hàng trong 100 ngày vừa qua thống kê như sau:
Số tivi bán trong ngày Tần số
0 5
1 25
2 35
3 20
4 15
Hỏi xác suất 1 ngày bán được ít nhất 2 tivi?
4.5. Dữ liệu sau thu thập bằng cách đếm số phòng mổ được sử dụng tại bệnh viện đa khoa
Tampa trong 20 ngày. Có 3 ngày chỉ có 1 phòng mổ được sử dụng, 5 ngày có 2 phòng được
sử dụng, 8 ngày 3 phòng được sử dụng, 4 ngày cả 4 phòng mổ đều được sử dụng.
a. Sử dụng tần số trên, xây dựng phân phối xác suất cho số phòng mổ được sử dụng
trong một ngày bất kỳ.
b. Kiểm tra xem phân phối xác suất của bạn có thỏa mãn điều kiện của phân phối xác
suất của biến ngẫu nhiên rời rạc chưa?
4.6.Cho bảng phân phối xác suất của biến x:
x 0 1 2 3 4
f(x) 0,05 0,15 0,35 0,25 0,2
x 0 1 2 3
f(x) 0,1 0,2 0,4 0,3
a. Tính lượng xe hơi trung bình bán được trong một ngày?
b. Tính xác suất một ngày bán được ít nhất 2 chiếc xe hơi?
c. Tính xác suất f(x ≥ 2,4)?
4.8. Trung tâm dịch vụ cấp cứu nhận được từ 0 đến 5 cuộc gọi hàng ngày. Phân phối xác suất
của số cuộc gọi trong ngày như sau:
Số cuộc gọi 0 1 2 3 4 5
Xác suất 0,10 0,15 0,30 0,20 0,15 0,10
4.16. Với biến x tuân theo phân phối chuẩn với giá trị trung bình bằng 60 và độ lệch
chuẩn bằng 8. Tính xác suất P (60 < x < 70).
4.17. Nếu z tuân theo phân phối chuẩn chuẩn hóa, hãy tính những xác suất sau: a. P (0 ≤
z ≤ 1)?
b. P (0 ≤ z ≤ 1,5)?
c. P (0 < z < 2)?
d. P (0 < z < 3)?
e. P (-1 ≤ z ≤ 0)?
f. P (-1 < z < 1)?
g. P (-1,5 < z < 0)?
h. P (-2 < z < 0)?
i. P ( 0 ≤ z ≤ 0,83)?
j. P ( - 1,57 ≤ z ≤ 0 )?
k. P (z > 0,44) ?
l. P (z ≥ - 0,23)?
4.18. Cho z tuân theo phân phối chuẩn hóa, tính z trong các trường hợp sau
a. Diện tích giữa 0 và z là 0,4222?
b. Diện tích giữa 0 và z là 0,2324?
c. Diện tích bên trái z là 0,6331 ?
d. Diện tích bên phải z là 0,2 ?
4.19. Giá cổ phiếu bình quân của các công ty trong danh sách S&P 500 là 30 USD và
ĐLC là 8,20USD. Giả sử giá cổ phiếu có phân phối chuẩn.
a. Xác suất để một công ty có giá cổ phiếu ít nhất 40 USD là bao nhiêu ?
b. Xác suất để một công ty có giá cổ phiếu không cao hơn 20 USD là bao nhiêu ?
c. Giá cổ phiếu phải cao bao nhiêu để một công ty được đứng trong 10% cao nhất ?
4.20. Cho một phân phối nhị thức có p = 0,20 và n = 100.
a. Giá trị trung bình và độ lệch chuẩn bằng bao nhiêu ?
b. Trong trường hợp này, các xác suất nhị thức có thể được xấp xỉ bởi phân phối xác
suất chuẩn hay không ? Giải thích
c. Xác suất có đúng 24 lần thành công là bao nhiêu ?
d. Xác suất có từ 18 đến 22 lần thành công là bao nhiêu ?
e. Xác suất có ít hơn hoặc bằng 15 lần thành công là bao nhiêu ?
4.21. Tỷ lệ thất nghiệp là 5,8%. Giả sử chọn ngẫu nhiên 100 người
a. Số lượng người thất nghiệp kỳ vọng là bao nhiêu ?
b. Phương sai và độ lệch chuẩn của số người thất nghiệp là bao nhiêu ?
c. Xác suất có đúng sáu người thất nghiệp là bao nhiêu ?
d. Xác suất có ít nhất bốn người thất nghiệp là bao nhiêu ?
4.22. Cho biến ngẫu nhiên x có phân phối đều trong khoảng từ 1,0 đến 1,5.
a. Vẽ đồ thị hàm mật độ xác suất.
b. Tính P (x = 1,25)
c. Tính P (1,0 ≤ x ≤ 1,25)
d. Tính P(1,20 < x < 1,5)
−𝑥
4.23. Xét hàm mật độ xác suất mũ như sau f(x) = , hãy tính a. P (x ≤ 6)
b. P (x ≤ 4)
c. P (x ≥ 6)
d. P (4 ≤ x ≤ 6)
CHƯƠNG 5. LẤY MẪU VÀ PHÂN PHỐI MẪU
5.1. Dữ liệu sau thu được từ một mẫu ngẫu nhiên: 3, 5, 6, 8, 9
a. Hãy tính ước lượng điểm của giá trị trung bình tổng thể
b. Hãy tính ước lượng điểm của độ lệch chuẩn tổng thể
5.2. Một bảng câu hỏi khảo sát của một mẫu gồm 150 cá nhân thu được 75 câu trả lời Có, 55
câu trả lời Không và 20 Không ý kiến.
a. Ước lượng điểm của tỷ lệ người trả lời Có trong tổng thể là bao nhiêu ?
b. Ước lượng điểm của tỷ lệ người trả lời Không trong tổng thể là bao nhiêu ?
5. 3.Một tổng thể có giá trị trung bình bằng 120 và độ lệch chuẩn bằng 20. Chúng ta chọn mẫu
có kích cỡ 100 và giá trị trung bình mẫu được sử dụng để ước lượng giá trị trung bình tổng
thể.
a. Hãy tính xác suất để giá trị trung bình mẫu sẽ nằm trong khoảng ±2 của giá trị trung
bình tổng thể.
b. Hãy tính xác suất để giá trị trung bình mẫu sẽ nằm trong khoảng ±4 của giá trị trung
bình tổng thể.
5.4. Giả sử lấy một mẫu ngẫu nhiên với kích cỡ 100 từ tổng thể với độ lệch chuẩn bằng 20. Hãy
tính độ lệch chuẩn của giá trị trung bình trong các trường hợp sau:
a. Kích cỡ tổng thể là vô hạn
b. Kích cỡ tổng thể bằng 100.000
c. Kích cỡ tổng thể bằng 10.000
d. Kích cỡ tổng thể bằng 1.000
5.5. Một tổng thể lớn có giá trị trung bình bằng 150 và độ lệch chuẩn bằng 30. Hãy tính xác
suất để cho một giá trị trung bình của mẫu nằm trong khoảng ±5 của giá trị trung bình tổng
thể với các kích cỡ mẫu như sau:
a. n = 30
b. n = 100
c. n = 200
d. Nhận định ưu điểm của trường hợp mẫu lớn
5. 6.Một mẫu có kích cỡ 100 được lấy từ tổng thể tuân theo phân phối chuẩn với µ = 500 và σ
= 100. Hãy tính:
a. P (x > 520)
b. P (x < 470)
c. P (x > 600)
5.7. Một nhà máy sản xuất sô-cô-la nhận thấy rằng trọng lượng của từng thanh sô-cô-la loại 32g
tuân theo phân phối chuẩn với giá trị trung bình là 32,2g và độ lệch chuẩn bằng 0,3g.
a. Hãy tính xác suất để một khách hàng mua một thanh sô-cô-la ngẫu nhiên có trọng
lượng nhỏ hơn 32g.
b. Hãy tính xác suất để một khách hàng mua một bao sô-cô-la gồm 4 thanh có trọng
lượng trung bình của 4 thanh nhỏ hơn 32g.
5.8. Một công ty gia công thiết bị với chiều dài lô hàng là 117cm và độ lệch chuẩn bằng 2,1cm.
a. Tính xác suất để một thiết bị được chọn ngẫu nhiên sẽ có chiều dài lớn hơn 120cm.
b. Tính xác suất để nếu chọn ngẫu nhiên 3 thiết bị thì chiều dài trung bình lớn hơn
120cm.
5.9. Một công ty khảo sát 200 người trong thành phố cho thấy có 90 người yêu thích sản phẩm
của mình, 60 người không thích và 50 người trả lời là không có ý kiến.
a. Ước lượng điểm của tỷ lệ số người yêu thích sản phẩm?
b. Ước lượng điểm của tỷ lệ số người không thích sản phẩm?
5.10. Một mẫu ngẫu nhiên với kích cỡ 100 được lấy từ tổng thể với tỷ lệ bằng 0,3. Hãy
tính:
a. Giá trị kỳ vọng của tỷ lệ mẫu?
b. Độ lệch chuẩn của tỷ lệ mẫu?
5.11. Một tổng thể có tỷ lệ tổng thể bằng 0,3. Một mẫu ngẫu nhiên có kích cỡ 150 và tỷ lệ
mẫu 𝑝̅ sẽ được sử dụng để ước lượng tỷ lệ tổng thể.
a. Hãy tính xác suất để tỷ lệ của mẫu nằm trong khoảng ±0,03 của tỷ lệ tổng thể.
b. Hãy tính xác suất để tỷ lệ của mẫu nằm trong khoảng ±0,05 của tỷ lệ tổng thể.
5.12. Với tỷ lệ tổng thể bằng 0,60, hãy tính sai số chuẩn của tỷ lệ mẫu đối với kích cỡ mẫu
bằng 100, 200, 300 và 500. Bạn có nhận định gì về độ lớn của sai số chuẩn của tỷ lệ tổng
thể khi kích cỡ mẫu tăng lên?
5.13. Theo thống kê toàn ngành du lịch thì tỷ lệ người thích du lịch sinh thái là 30% trong
tổng số khách du lịch. Nếu chúng ta chọn ngẫu nhiên 1011 khách du lịch, hãy tính xác suất
để tỷ lệ người thích du lịch sinh thái trong mẫu ≥ 32%?
60 66 62 72 73 72 57 58
70 66 60 65 70 57 64
Hãy tính ước lượng khoảng với độ tin cậy 95% cho chi tiêu trung bình của học sinh? Giả
định chi tiêu của học sinh tuân theo phân phối bình thường.
6.14. Lấy mẫu ngẫu nhiên 300 người thì 100 người thích đi du lịch biển trong kỳ nghỉ hè.
a. Hỏi ước lượng điểm của tỷ lệ tổng thể những người thích đi du lịch biển trong kỳ
nghỉ hè?
b. Hãy tính sai số chuẩn của tỷ lệ tổng thể?
c. Hãy tính ước lượng khoảng cho tỷ lệ tổng thể với độ tin cậy 95%?
6.15. Công ty tiếp thị thể thao của thành phố A dự định tổ chức một trận đấu cầu giao hữu
với tỉnh bạn. Công ty biết rằng theo thống kê mới nhất thì dân số thành phố là 500.000
người. Công ty muốn ước lượng tỷ lệ số người sẽ tham dự trận đấu. Hỏi công ty phải chọn
mẫu kích cỡ bao nhiêu để biết được tỷ lệ này với sai số dự trữ không quá 0,03% và độ tin
cậy 99%?
6.16. Trong một điều tra ở trường đại học với mẫu 1200 sinh viên thì có 290 sinh viên đi
làm them vào dịp cuối tuần.
a. Hãy ước lượng điểm của tỷ lệ sinh viên đi làm thêm cuối tuần cho toàn thể sinh viên
trong trường đại học?
b. Với độ tin cậy 95%, hãy tính dự trữ sai số tương ứng với ước lượng này?
7.13. Trong một đợt vận động tranh cử, ứng viên A tuyên bố là mình đã đạt được ít nhất
70% số cử tri ủng hộ. Để kiểm định tính xác thực của tuyên bố này, một tạp chí đã cử người
đi điều tra phỏng vấn 200 người và thu được kết quả 68% số cử tri ủng hộ ứng viên A. Hãy
dùng giá trị thống kê kiểm định và giá trị p để rút ra kết luận về tính đúng đắn của tuyên bố
của ứng viên A với độ tin cậy 95%?
7.14. Một công ty tuyên bố rằng sản phẩm của họ chiếm 25% thị trường. Thăm dò ngẫu
nhiên 300 người cho thấy 22% sử dụng sản phẩm công ty. Với mức ý nghĩa 0,05 hãy kiểm
định các giả thuyết H0: p = 0,25 và H1: p ±0,25. Hãy xác định giá trị p?
7.15. Theo quy định kỹ thuật, các tủ lạnh phải giữ được độ lạnh đã cài đặt với mức độ dao
động của nhiệt độ là ít nhất thông qua độ lệch chuẩn không quá 4 độ C. Một mẫu 16 tủ lạnh
trong kho được chọn ngẫu nhiên và qua kiểm tra thấy rằng phương sai mẫu này là s 2=24.
Chọn a = 0,05, thực hiện kiểm định phù hợp cho biết độ lệch chuẩn theo yêu cầu kỹ thuật
có bị vượt quá không.
7.16. Một hãng viễn thông tiến hành kiểm định có hay không có sự khác biệt trong thu
nhập trung bình của khách hàng nam và nữ. Họ chọn ngẫu nhiên 200 khách nam và 100
khách nữ. Trên hai mẫu ngẫu nhiên khách hàng, công ty thu thập được thu nhập trung bình
của khách hàng nam là 43.390$ và khách hàng nữ bằng 42.400$, độ lệch chuẩn thu nhập
của mẫu khách nam bằng 7.300$ và của mẫu khách nữ bằng 8.200$. Thực hiện bài toán
kiểm định với độ tin cậy 95%.
7.17. Để so sánh độ bền của hai loại sơn phản quang dùng để vẽ kí hiệu hướng dẫn giao
thông, người ta kẻ 12 lằn sơn mỗi loại trên một đoạn đường có nhiều xe lưu thông, sau một
thời gian người ta dùng máy đo cường độ phản chiếu của các lằn sơn (chỉ số càng cao thì
cường độ phản chiếu càng lớn) và ghi lại được số liệu sau đây:
Sơn 12,5 11,7 9,9 9,6 10,3 9,6 9,4 11,3 8,7 11,5 10,6 9,7
A
Sơn 9,4 11,6 9,7 10,4 6,9 7,3 8,4 7,2 7,0 8,2 12,7 9,2
B
Người ta cho rằng loại sơn A bền hơn loại sơn B, hãy kiểm định thông tin với độ tin cậy
90%.
7.18. Để thiết kế một phần mềm thử nghiệm nhằm so sánh tốc độ xử lý của hai phần mềm
thống kê, người ta chọn ra một bộ dữ liệu, đặt ra 10 yêu cầu cần xử lý trên hai bộ dữ liệu
này sau đó ghi lại thời gian xử lý từng lệnh của từng phần mề, ta có bảng dữ liệu sau:
Câu hỏi đặt ra là phần mềm mới có xử lý nhanh hơn phần mềm cũ hay không. Kiểm định
thông tin này với độ tin cậy là 95%.