You are on page 1of 21

CHƯƠNG 1.

TỔNG QUAN VỀ THỐNG KÊ HỌC


1.1. Danh sách các sinh viên được cho trong bảng sau:
Tên sinh viên Năm sinh Giới tính Quê quán Điểm thi môn TK
Nguyễn Lê Thùy An 1984 Nữ Lâm Đồng 8
Bùi Thị Trâm Anh 1985 Nữ Huế 7
Đặng Thị Ngọc Ánh 1982 Nữ Bắc Ninh 7
Trần Thị Ngọc Ánh 1981 Nữ Hà Nội 5
Phan Nhân Bảo 1985 Nam Lâm Đồng 6
Hoàng Nhân Bảo 1986 Nam Quảng Nam 6
Lục Thị Biên 1979 Nữ Hà Nội 6
a. Có bao nhiêu phần tử trong tập dữ liệu?
b. Có bao nhiêu biến trong tập dữ liệu?
c. Bao nhiêu biến định tính, bao nhiêu biến định lượng?
d. Các loại thang đo được dùng tương ứng với từng biến?
1.2. Hãy xác định loại dữ liệu trong các ví dụ sau:
a. Lương khởi điểm của sinh viên vừa tốt nghiệp
b. Tên các công ty sinh viên vừa tốt nghiệp vào làm việc
c. Mã số sinh viên
1.3. Hãy xác định các biến sau thuộc loại định lượng hay định tính và thang đo của chúng
a. Tuổi
b. Giới tính
c. Nhãn hiệu điện thoại di động
d. Số học sinh yêu thích môn học thống kê
e. Doanh số hàng năm
f. Kích cỡ nước ngọt (nhỏ, trung, lớn)
g. Phân loại sinh viên (trung bình, khá, giỏi)
h. Phương thức thanh toán học phí (tiền mặt, thẻ tín dụng)
1.4. Các cổ động viên bóng đá thường xuyên được hỏi ý kiến về môn thể thao yêu thích của họ.
Người ta chọn 100 cổ động viên và hỏi các câu sau:
a. Một năm bạn xem bao nhiêu trận đấu?
b. Bạn đánh giá mức độ hấp dẫn của các trận đấu: tuyệt vời, tốt, trung bình, kém, rất
kém?
c. Trung bình bạn chi hết bao nhiêu tiền để mua đồ ăn và thức uống cho từng trận?
d. Đánh giá chất lượng các mặt sân: tốt, trung bình, kém?
Yêu cầu: xác định loại dữ liệu thu thập và thang đo?
1.5. Sở văn hóa thông tin Lâm Đồng thu thập thông tin từ du khách đến Đà Lạt. Các câu hỏi sau
nằm trong 16 câu hỏi của một bảng câu hỏi được phát cho khách du lịch khi họ đi máy bay
tới Đà Lạt trong 6 tháng năm 2011.
1. Chuyến du lịch tới Đà Lạt này là chuyến thứ mấy của bạn?
a..............................................................................................................................................
b.............................................................................................................................................
cd. Nhiều hơn 3 .....................................................................................................................

2. Lý do chính cho chuyến du lịch này? (có 10 loại câu trả lời bao gồm: công tác, nghỉ
dưỡng, trăng mật…)
3. Nơi bạn sẽ ở? (có 11 loại câu trả lời bao gồm: khách sạn, nhà nghỉ nhà người quan,
lều trại…)
4. Tổng số ngày bạn ở Đà Lạt? Yêu cầu:
a. Tổng thể nghiên cứu là gì?
b. Bảng câu hỏi có phải là một cách tốt để thu thập thông tin trong trường hợp trên hay
không?
c. Dữ liệu thu thập từ các câu hỏi trên là dữ liệu định tính hay định lượng?
1.6. Tạp chí Condé Nast Traveler thực hiện một cuộc khảo sát hàng năm người đọc để xác định
nơi lưu trú tốt nhất trên toàn thế giới.
Tên nơi lưu trú Quốc gia Giá phòng Số lượng phòng Điểm đánh giá chung
Graveteye Manor Anh $$ 18 83,6
Villa d’Este Ý $$$$ 166 86,3
Hotel Prem Đức $ 54 77,8
Hotel d’Europe Pháp $$ 47 76,8
Palace Luzern Thụy Sỹ $$ 326 80,9
Royal Crescent Hotel Anh $$$ 45 73,7
Hotel Sacher Áo $$$ 120 85,5
Duc de Bourgogne Bỉ $ 10 76,9
Villa Gallici Pháp $$ 22 90,6
Nguồn: Condé Nast Traveler, tháng 2 năm 2000
a. Có bao nhiêu phần tử trong tập dữ liệu này?
b. Có bao nhiêu biến trong tập dữ liệu này?
c. Biến nào là định tính và biến nào là định lượng?
d. Thang đo của từng biến này là gì?
e. Số phòng trung bình của 9 khách sạn này là bao nhiêu?
f. Hãy tính điểm đánh giá chung toàn bộ
g. Phần trăm khách sạn nằm ở nước Anh?
h. Phần trăm khách sạn có giá phòng ở mức $$?
CHƯƠNG 2. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
2.1. Cuộc khảo sát nghiên cứu 3 loại sản phẩm A, B, C. Trong số 120 khách hàng được hỏi có
60 người chọn A, 24 người chọn B, 36 người chọn C. Thiết lập bảng phân phối tần số và tần
suất?
2.2. Một phần của bảng phân phối tần suất được cho như sau:
Tổ Tần suất
A 0,22
B 0,18
C 0,40
D

a. Tần suất của tổ D?


b. Tổng kích cỡ mẫu là 200. Hỏi tần số của tổ D?
2.3.Trong một cuộc điều tra có 58 câu trả lời Có, 42 câu trả lời Không, 20 câu trả lời Không ý
kiến.
a. Sử dụng đồ thị hình tròn (Pie chart), bao nhiêu độ trong hình tròn biểu thị câu trả lời
Có?
b. Sử dụng đồ thị hình tròn (Pie chart), bao nhiêu độ trong hình tròn biểu thị câu trả lời
Không?
c. Vẽ đồ thị hình tròn.
d. Vẽ đồ thị hình thanh.
2. 4.Theo thứ tự chữ cái, sáu cái tên phổ biến nhất tại Hoa Kỳ là Brown, Davis, Johnson,
Jones, Smith và Williams (The World Almanac, 2006). Giả sử một mẫu 50 người với tên
được liệt kê sau đây:

Brown Williams Williams Williams Brown


Smith Jones Smith Johnson Smith
Davis Smith Brown Williams Johnson
Johnson Smith Smith Johnson Brown
Williams Davis Johnson Williams Johnson
Williams Johnson Jones Smith Brown
Johnson Smith Smith Brown Jones
Jones Jones Smith Smith Davis
Davis Jones Williams Davis Smith
Jones Johnson Brown Johnson Davis

Tóm tắt dữ liệu bằng cách xây dựng


a. Phân phối tần số và phân phối tần suất phần trăm
b. Biểu đồ thanh
c. Biểu đồ tròn
d. Dựa vào dữ liệu, ba cái tên phổ biến nhất là gì?
2.5. Một công ty cung cấp dịch vụ cho thuê DVD hơn 50.000 tựa đề qua mail, trước khi đặt
hàng, khách hàng có thể xem mô tả của đĩa DVD, và nếu muốn sẽ có một bản tóm tắt đánh
giá. Công ty sử dụng một hệ thống đánh giá năm sao với các mô tả sau đây: 1 sao – Ghét; 2
sao – Không thích; 3 sao – Thích; 4 sao – Thực sự thích; 5 sao – Rất thích.
Có 18 nhà phê bình, cung cấp xếp hạng cho bộ phim Batman Begins (Netflix.com,
01/03/2006) như sau: 4, 2, 5, 2, 4, 3, 3, 4, 4, 3, 4, 4, 4, 2, 4, 4, 5, 4
a. Nguồn dữ liệu trên là định tính hay định lượng?
b. Xây dựng phân phối tần số và tần suất của đữ liệu
c. Xây dựng biểu đồ thanh
d. Nhận xét về đánh giá của các nhà phê bình phim Batman Begins
2.6.Cho các dữ liệu sau

14 20 24 22 18 16 22 12
19 24 18 23 16 19 22 25
24 20 17 25 15 21 16 19
19 21 23 25 24 23 16 24
16 22 26 19 21 20 16 20

a. Xây dựng phân phối tần số với các nhóm là 12-14; 15-17; 18-20; 21-23; 24-26
b. Xây dựng phần phối tần suất và tần suất phần trăm
2. 7.Hãy xem xét phân phối tần số sau
Tổ Tần số
10-19 15
20-29 22
30-39 26
40-49 17
Hãy xây dựng phân phối tần số tích lũy và phân phối tần suất tích lũy.
2.8. Số sản phẩm bị bác bỏ của một nhà máy được ghi nhận trong thời gian 25 ngày vừa
qua như sau:

21 8 17 22 19 18 19 14 17 11 6 21 25
19 9 12 16 16 10 29 24 6 21 20 25

Xây dựng bảng phân phối tần số cho các dữ liệu này? Số lớp bằng 5.
2.9. Nhân viên của một bác sĩ nghiên cứu thời gian chờ của bệnh nhân đến văn phòng
với yêu cầu dịch vụ khẩn cấp. Các dữ liệu sau là thời gian chờ đợi tính bằng phút
được thu thập trong khoảng thời gian một tháng: 2; 5; 10; 12; 4; 4; 5; 17; 11; 8; 9;
9; 12; 21; 6; 8; 7; 13; 18; 3
Với phân nhóm 0-4; 5-9 và tiếp theo như vậy
a. Cho biết phân phối tần số, tần suất, tần số tích lũy, tần suất tích lũy?
b. Tỷ lệ bệnh nhân chờ dịch vụ khẩn ít hơn 9 phút?
2.10. Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau:
70 72 75 64 58 83 80 82
76 75 68 65 57 78 85 72

2.11. Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau:


9,6 10,4 7,5 8,3 10,5 10,0
9,3 8,1 7,7 7,5 8,4 6,3 8,8

2.12. Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau:

1161 1206 1478 1300 1604 1725 1361 1422


1221 1378 1623 1426 1557 1730 1706 1689

2.13. Các giá trị đơn hàng được ghi nhận như sau:
66 77 66 64 73 91 65 59 86 61 86 61 58 70
77 80 58 94 78 62 79 83 54 52 45 82 48 67 75

a. Xây dựng đồ thị nhánh và lá cho các dữ liệu này


b. Xây dựng bảng phân phối tần số, tần suất cho dữ liệu này với số lớp bằng 6.
c. Tỷ lệ đơn đặt hàng có giá trị nhỏ hơn hay bằng 70? Lớn hơn 70?
CHƯƠNG 3. TRÌNH BÀY DỮ LIỆU BẰNG ĐẠI LƯỢNG SỐ
3.1. Một mẫu có giá trị như sau: 15, 12, 16, 20, 18. Tính giá trị trung bình và số trung vị?
3.2. Tiền lương của công nhân trong một phân xưởng được cho như sau: 26, 26, 28, 29, 30, 31,
32, 109. Tính tiền lương trung bình, số trung vị, yếu vị?
3.3. Có 14 quần tây được bán ra trong ngày với kích cỡ vòng bụng như sau (cm): 78, 85, 90, 85,
82, 70, 85, 75, 85, 80, 77, 100, 85, 70
a. Tính số trung bình, trung vị, yếu vị
b. Nếu bạn quản lý cửa hàng trên thì bạn chú trọng số liệu nào nhất?
3.4. Một mẫu với các dữ liệu sau: 15, 20, 25, 27, 30, 35, 28, 25, 34
a. Xác định khoảng biến thiên?
b. Tính số phân vị thứ 20, 25, 60, 75
c. Tính khoảng trải giữa?
3.5. Hàng triệu người Mỹ làm việc trong văn phòng tại nhà của họ. Sau đây là một mẫu dữ liệu
về tuổi của các cá nhân làm việc ở nhà:

18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25

a. Tính trung bình và mode.


b. Độ tuổi trung vị của tổng thể những người trưởng thành là 36 tuổi. Sử dụng độ tuổi
trung vị của dữ liệu trên để bình luận về việc liệu những người làm việc tại nhà có
xu hướng trẻ hơn hoặc già hơn tổng thể những người trưởng thành.
c. Tính tứ phân vị thứ nhất và thứ ba.
d. Tính và giải thích phân vị thứ 32.
3.6. Xem xét một mẫu với các giá trị dữ liệu là 10, 20, 12, 17 và 16. Tính khoảng biến
thiên và độ trải giữa.
3.7. Điểm của một người chơi bóng gỗ trong sáu lượt chơi là 182, 168, 184, 190, 170 và
174. Sử dụng các dữ liệu này như một mẫu, tính toán các thống kê mô tả sau đây.
a. Khoảng biến thiên
b. Phương sai
c. Độ lệch chuẩn
d. Hệ số biến thiên
3.8. Thời gian sau đây đã được ghi lại của những người chạy một phần tư dặm và một dặm của
một nhóm điền kinh trường đại học (thời gian được tính bằng phút):

Thời gian chạy một phần tư dặm 0,92 0,98 1,04 0,90 0,99
Thời gian chạy một dặm 4,52 4,35 4,60 4,70 4,50
Sau khi xem thời gian chạy của mẫu này, một trong những huấn luyện viên nhận xét rằng
những người chạy một phần tư dặm có thời gian ổn định hơn. Sử dụng độ lệch chuẩn và hệ
số biến thiên để tóm tắt sự phân tán trong dữ liệu. Sử dụng hệ số biến thiên để chỉ ra rằng
tuyên bố của huấn luyện viên có đúng không?
3. 9.Xem xét một mẫu với các giá trị dữ liệu 10, 20, 12, 17 và 16. Tính giá trị z cho các quan
sát này.
3.10. Xem xét một mẫu với trung bình là 500 và độ lệch chuẩn là 100. Giá trị z tính cho
các giá trị dữ liệu sau đây: 520, 650, 500, 450 và 280.
3.11. Một mẫu có giá trị trung bình bằng 30 và độ lệch chuẩn bằng 5. Dùng định lý
Chebyshev để xác định phần trăm dữ liệu nằm trong các dải sau:
a. 20 đến 40
b. 15 đến 45
c. 22 đến 38
d. 18 đến 42
e. 12 đến 48
3.12. Giả sử dữ liệu có phân phối hình chuông với trung bình là 30 và độ lệch chuẩn là 5.
Sử dụng quy tắc thực nghiệm để xác định tỷ lệ dữ liệu trong mỗi dãy sau đây: a. 20 đến 40
b. 15 đến 45
c. 25 đến 35
3.13. Khảo sát mẫu 500 đơn hàng chúng ta có giá trị trung bình bằng 69 và độ lệch chuẩn bằng
7.
a. Tính các giá trị trong khoảng giới hạn (𝑥̅ − 𝑠; 𝑥̅ + 𝑠); (𝑥̅ − 2𝑠; 𝑥̅ + 2𝑠); (𝑥̅ −
3𝑠; 𝑥̅ + 3𝑠)
b. Nếu giá trị đơn đặt hàng có phân phối hình chuông, có khoảng bao nhiêu đơn hàng
có giá trị nằm trong các khoảng giới hạn nói trên?
3.8. Tiền lương của 1.000 nhân viên trong công ty có giá trị trung bình là 25.600 và độ
lệch chuẩn là 2.200. Giả sử tiền lương của nhân viên tuân theo phân phối hình
chuông.
a. Có bao nhiêu người nhận tiền lương trong khoảng 23.400 và 27.800?
b. Có bao nhiêu người nhận tiền lương trong khoảng 21.200 và 30.000?
c. Có bao nhiêu người nhận tiền lương trong khoảng 19.000 và 32.200?
3.9. Năm quan sát thu thập cho hai biến theo bảng sau

xi 4 6 11 3 16 yi 50 50 40 60 30

a. Xây dựng một biểu đồ phân tán với x trên trục hoành.
b. Biểu đồ phân tán xây dựng trong câu a cho thấy gì về mỗi liên hệ giữa hai biến?
c. Tính toán và giải thích hiệp phương sai mẫu.
d. Tính toán và giải thích hệ số tương quan mẫu.
3.10. Một ban nghiên cứu giao thông về tốc độ và số dặm đi được của xe ô tô cỡ trung,
kết quả cho trong bảng dữ liệu sau:

Tốc độ 30 50 40 55 30 25 60 25 50 55
Số dặm 28 25 25 23 30 32 21 35 26 25

Tính toán và giải thích hệ số tương quan mẫu. 3.17.


Cho các dữ liệu và trọng số tương ứng
Xi Wi
3,5 5
4,2 3
2,8 2
3,7 4
a. Tính trung bình trọng số?
b. Tính trung bình không có trọng số, xem xét sự khác biệt giữa hai kết quả?
3.18. Cho mẫu với bảng phân phối tần số tương ứng như sau
Lớp Tần số
5-9 3
10-14 6
15-19 9
20-24 4
a. Tính trung bình mẫu?
b. Tính phương sai mẫu và độ lệch chuẩn mẫu?
3.19. Một cuộc khảo sát của các thuê bao tạp chí Fortune đã hỏi câu sau: “Bạn đã đọc bao nhiêu
số trong bốn số phát hành gần nhất?” Giả sử rằng bảng phân phối tần số sau đây tổng hợp
500 câu trả lời.
Số lượng đã đọc Tần số
0 15
1 10
2 40
3 85
4 350
Tổng 500
a. Số phát hành đã đọc trung bình của một thuê bao tạp chí Fortune là bao nhiêu?
b. Độ lệch chuẩn về số phát hành đã đọc là bao nhiêu?

CHƯƠNG 4. QUY LUẬT PHÂN PHỐI XÁC SUẤT


4.1. Quan sát một công nhân làm ra một sản phẩm
a. Định nghĩa biến ngẫu nhiên mô tả thời gian (phút) mà công nhân đó làm ra sản phẩm
b. Các giá trị mà biến ngẫu nhiên trên có thể nhận là gì?
c. Biến ngẫu nhiên trên là liên tục hay rời rạc?

4.2. Bảng sau là các phép thử và các biến ngẫu nhiên có liên quan. Trong mỗi trường hợp, cho
biết các giá trị mà biến ngẫu nhiên có thể nhận và cho biết đó là biến ngẫu nhiên rời rạc hay
liên tục?
Phép thử Biến ngẫu nhiên (x)
Thực hiện bài kiểm tra gồm 20 câu hỏi Số câu trả lời đúng
Quan sát xe ô tô đi qua một trạm kiểm soát Số xe đi qua trạm kiểm soát
trong vòng 1 giờ
Kiểm tra 50 bản khai thu nhập cá nhân Số lượng bản khai có lỗi
Quan sát giờ làm việc của một nhân viên Số giờ làm việc không hiệu quả trong ngày
làm việc
Cân một gói hàng Khối lượng (kg) của một gói hàng

4. 3.Cho biến ngẫu nhiên rời rạc x có phân phối xác suất như sau:
x f (x)
30 0,2
40 0,25
50 0,3
60 0,25
a. Xác suất để x nhận giá trị nhỏ hơn 40?
b. Xác suất để x nhỏ hơn hay bằng 50?
c. Xác suất để x lớn hơn 40?
4.4.Số lượng tivi bán được ở cửa hàng trong 100 ngày vừa qua thống kê như sau:
Số tivi bán trong ngày Tần số
0 5
1 25
2 35
3 20
4 15
Hỏi xác suất 1 ngày bán được ít nhất 2 tivi?

4.5. Dữ liệu sau thu thập bằng cách đếm số phòng mổ được sử dụng tại bệnh viện đa khoa
Tampa trong 20 ngày. Có 3 ngày chỉ có 1 phòng mổ được sử dụng, 5 ngày có 2 phòng được
sử dụng, 8 ngày 3 phòng được sử dụng, 4 ngày cả 4 phòng mổ đều được sử dụng.
a. Sử dụng tần số trên, xây dựng phân phối xác suất cho số phòng mổ được sử dụng
trong một ngày bất kỳ.
b. Kiểm tra xem phân phối xác suất của bạn có thỏa mãn điều kiện của phân phối xác
suất của biến ngẫu nhiên rời rạc chưa?
4.6.Cho bảng phân phối xác suất của biến x:

x 0 1 2 3 4
f(x) 0,05 0,15 0,35 0,25 0,2

a. Tính giá trị kỳ vọng


b. Tính phương sai
c. Độ lệch chuẩn?
4. 7.Lượng xe hơi bán trong ngày ký hiệu là x với phân phối xác suất tương ứng như sau:

x 0 1 2 3
f(x) 0,1 0,2 0,4 0,3

a. Tính lượng xe hơi trung bình bán được trong một ngày?
b. Tính xác suất một ngày bán được ít nhất 2 chiếc xe hơi?
c. Tính xác suất f(x ≥ 2,4)?
4.8. Trung tâm dịch vụ cấp cứu nhận được từ 0 đến 5 cuộc gọi hàng ngày. Phân phối xác suất
của số cuộc gọi trong ngày như sau:

Số cuộc gọi 0 1 2 3 4 5
Xác suất 0,10 0,15 0,30 0,20 0,15 0,10

a. Số cuộc gọi kỳ vọng trong ngày là bao nhiêu?


b. Phương sai của số cuộc gọi là bao nhiêu? Tính độ lệch chuẩn tương ứng?
4. 9.Cho thử nghiệm nhị thức với n = 10 và p = 0,2
a. Tính f(0) ?
b. Tính f(2) ?
c. Tính P(x ≤ 2) ?
d. Tính P(x ≥ 1) ?
e. Tính E(x)
f. Tính Var và σ?
4.10. Khi một máy mới hoạt động tốt, chỉ có 3% sản phẩm là phế phẩm. Giả sử ta chọn
ngẫu nhiên 2 sản phẩm sản xuất với máy trên và quan tâm đến số phế phẩm tìm
được.
a. Phát biểu các điều kiện để phép thử trên là dãy phép thử nhị thức.
b. Vẽ đồ thị hình cây
c. Có bao nhiêu trường hợp dẫn đến có đúng 1 phế phẩm được tìm thấy?
d. Tính các xác suất không có phế phẩm, có đúng 1 phế phẩm và đúng 2 phế phẩm?
4.11. Theo điều tra thì có 40% số dân tại thành phố có ít nhất tủ lạnh hay máy giặt. Nếu ta
phỏng vấn 15 người một cách ngẫu nhiên thì:
a. Xác suất có 3 người có tủ lạnh hay máy giặt?
b. Xác suất có 12 người sẽ không có tủ lạnh hay máy giặt?
c. Xác suất có ít nhất 3 người có tủ lạnh hay máy giặt?
4.12. Xét hàm xác suất Poisson với µ = 3
a. Viết hàm xác suất Poisson tương ứng.
b. Tính f(2).
c. Tính f(1).
d. Tính P(x≥2).
4.13. Trung bình có 48 cuộc gọi đến trong một giờ tại quầy đặt chỗ của Regional
Airways.
a. Tính xác suất nhận được 3 cuộc gọi trong 5 phút.
b. Tính xác suất nhận được đúng 10 cuộc gọi trong 15 phút.
c. Giả sự hiện không có cuộc gọi nào phải chờ máy. Nếu nhân viên mất 5 phút để hoàn
thành cuộc gọi hiện tại, bạn kỳ vọng có bao nhiêu người gọi đến phải chờ đợi tại
thời điểm này ? Xác suất không có người nào phải đợi là bao nhiêu ?
d. Nếu không có cuộc gọi nào đang được xử lý, xác suất các nhân viên có 3 phút làm
việc cá nhân mà không bị gián đoạn bởi một cuộc gọi là bao nhiêu ?
4.14. Cho biến x có phân phối đồng nhất trong khoảng 10 và 15
a. Vẽ đồ thị thể hiện phân phối mật độ xác suất
b. Tính P (x < 12)?
c. Tính P (12 ≤ x ≤13)?
d. Tính giá trị kỳ vọng của x?
e. Tính phương sai và độ lệch chuẩn?
4.15. Một biến ngẫu nhiên có phân phối chuẩn với TB = 50 và ĐLC = 5
a. Vẽ đường cong chuẩn của hàm mật độ xác suất. Ghi trên thục hoành các giá trị 35,
40, 45, 50, 55, 60, 65.
b. Xác định để biến ngẫu nhiên nhận giá trị giữa 45 và 55 là bao nhiêu?
c. Xác định để biến ngẫu nhiên nhận giá trị giữa 40 và 60 là bao nhiêu?
d.

4.16. Với biến x tuân theo phân phối chuẩn với giá trị trung bình bằng 60 và độ lệch
chuẩn bằng 8. Tính xác suất P (60 < x < 70).
4.17. Nếu z tuân theo phân phối chuẩn chuẩn hóa, hãy tính những xác suất sau: a. P (0 ≤
z ≤ 1)?
b. P (0 ≤ z ≤ 1,5)?
c. P (0 < z < 2)?
d. P (0 < z < 3)?
e. P (-1 ≤ z ≤ 0)?
f. P (-1 < z < 1)?
g. P (-1,5 < z < 0)?
h. P (-2 < z < 0)?
i. P ( 0 ≤ z ≤ 0,83)?
j. P ( - 1,57 ≤ z ≤ 0 )?
k. P (z > 0,44) ?
l. P (z ≥ - 0,23)?
4.18. Cho z tuân theo phân phối chuẩn hóa, tính z trong các trường hợp sau
a. Diện tích giữa 0 và z là 0,4222?
b. Diện tích giữa 0 và z là 0,2324?
c. Diện tích bên trái z là 0,6331 ?
d. Diện tích bên phải z là 0,2 ?
4.19. Giá cổ phiếu bình quân của các công ty trong danh sách S&P 500 là 30 USD và
ĐLC là 8,20USD. Giả sử giá cổ phiếu có phân phối chuẩn.
a. Xác suất để một công ty có giá cổ phiếu ít nhất 40 USD là bao nhiêu ?
b. Xác suất để một công ty có giá cổ phiếu không cao hơn 20 USD là bao nhiêu ?
c. Giá cổ phiếu phải cao bao nhiêu để một công ty được đứng trong 10% cao nhất ?
4.20. Cho một phân phối nhị thức có p = 0,20 và n = 100.
a. Giá trị trung bình và độ lệch chuẩn bằng bao nhiêu ?
b. Trong trường hợp này, các xác suất nhị thức có thể được xấp xỉ bởi phân phối xác
suất chuẩn hay không ? Giải thích
c. Xác suất có đúng 24 lần thành công là bao nhiêu ?
d. Xác suất có từ 18 đến 22 lần thành công là bao nhiêu ?
e. Xác suất có ít hơn hoặc bằng 15 lần thành công là bao nhiêu ?
4.21. Tỷ lệ thất nghiệp là 5,8%. Giả sử chọn ngẫu nhiên 100 người
a. Số lượng người thất nghiệp kỳ vọng là bao nhiêu ?
b. Phương sai và độ lệch chuẩn của số người thất nghiệp là bao nhiêu ?
c. Xác suất có đúng sáu người thất nghiệp là bao nhiêu ?
d. Xác suất có ít nhất bốn người thất nghiệp là bao nhiêu ?
4.22. Cho biến ngẫu nhiên x có phân phối đều trong khoảng từ 1,0 đến 1,5.
a. Vẽ đồ thị hàm mật độ xác suất.
b. Tính P (x = 1,25)
c. Tính P (1,0 ≤ x ≤ 1,25)
d. Tính P(1,20 < x < 1,5)
−𝑥

4.23. Xét hàm mật độ xác suất mũ như sau f(x) = , hãy tính a. P (x ≤ 6)
b. P (x ≤ 4)
c. P (x ≥ 6)
d. P (4 ≤ x ≤ 6)
CHƯƠNG 5. LẤY MẪU VÀ PHÂN PHỐI MẪU
5.1. Dữ liệu sau thu được từ một mẫu ngẫu nhiên: 3, 5, 6, 8, 9
a. Hãy tính ước lượng điểm của giá trị trung bình tổng thể
b. Hãy tính ước lượng điểm của độ lệch chuẩn tổng thể
5.2. Một bảng câu hỏi khảo sát của một mẫu gồm 150 cá nhân thu được 75 câu trả lời Có, 55
câu trả lời Không và 20 Không ý kiến.
a. Ước lượng điểm của tỷ lệ người trả lời Có trong tổng thể là bao nhiêu ?
b. Ước lượng điểm của tỷ lệ người trả lời Không trong tổng thể là bao nhiêu ?
5. 3.Một tổng thể có giá trị trung bình bằng 120 và độ lệch chuẩn bằng 20. Chúng ta chọn mẫu
có kích cỡ 100 và giá trị trung bình mẫu được sử dụng để ước lượng giá trị trung bình tổng
thể.
a. Hãy tính xác suất để giá trị trung bình mẫu sẽ nằm trong khoảng ±2 của giá trị trung
bình tổng thể.
b. Hãy tính xác suất để giá trị trung bình mẫu sẽ nằm trong khoảng ±4 của giá trị trung
bình tổng thể.
5.4. Giả sử lấy một mẫu ngẫu nhiên với kích cỡ 100 từ tổng thể với độ lệch chuẩn bằng 20. Hãy
tính độ lệch chuẩn của giá trị trung bình trong các trường hợp sau:
a. Kích cỡ tổng thể là vô hạn
b. Kích cỡ tổng thể bằng 100.000
c. Kích cỡ tổng thể bằng 10.000
d. Kích cỡ tổng thể bằng 1.000
5.5. Một tổng thể lớn có giá trị trung bình bằng 150 và độ lệch chuẩn bằng 30. Hãy tính xác
suất để cho một giá trị trung bình của mẫu nằm trong khoảng ±5 của giá trị trung bình tổng
thể với các kích cỡ mẫu như sau:
a. n = 30
b. n = 100
c. n = 200
d. Nhận định ưu điểm của trường hợp mẫu lớn
5. 6.Một mẫu có kích cỡ 100 được lấy từ tổng thể tuân theo phân phối chuẩn với µ = 500 và σ
= 100. Hãy tính:
a. P (x > 520)
b. P (x < 470)
c. P (x > 600)
5.7. Một nhà máy sản xuất sô-cô-la nhận thấy rằng trọng lượng của từng thanh sô-cô-la loại 32g
tuân theo phân phối chuẩn với giá trị trung bình là 32,2g và độ lệch chuẩn bằng 0,3g.
a. Hãy tính xác suất để một khách hàng mua một thanh sô-cô-la ngẫu nhiên có trọng
lượng nhỏ hơn 32g.
b. Hãy tính xác suất để một khách hàng mua một bao sô-cô-la gồm 4 thanh có trọng
lượng trung bình của 4 thanh nhỏ hơn 32g.
5.8. Một công ty gia công thiết bị với chiều dài lô hàng là 117cm và độ lệch chuẩn bằng 2,1cm.
a. Tính xác suất để một thiết bị được chọn ngẫu nhiên sẽ có chiều dài lớn hơn 120cm.
b. Tính xác suất để nếu chọn ngẫu nhiên 3 thiết bị thì chiều dài trung bình lớn hơn
120cm.
5.9. Một công ty khảo sát 200 người trong thành phố cho thấy có 90 người yêu thích sản phẩm
của mình, 60 người không thích và 50 người trả lời là không có ý kiến.
a. Ước lượng điểm của tỷ lệ số người yêu thích sản phẩm?
b. Ước lượng điểm của tỷ lệ số người không thích sản phẩm?
5.10. Một mẫu ngẫu nhiên với kích cỡ 100 được lấy từ tổng thể với tỷ lệ bằng 0,3. Hãy
tính:
a. Giá trị kỳ vọng của tỷ lệ mẫu?
b. Độ lệch chuẩn của tỷ lệ mẫu?
5.11. Một tổng thể có tỷ lệ tổng thể bằng 0,3. Một mẫu ngẫu nhiên có kích cỡ 150 và tỷ lệ
mẫu 𝑝̅ sẽ được sử dụng để ước lượng tỷ lệ tổng thể.
a. Hãy tính xác suất để tỷ lệ của mẫu nằm trong khoảng ±0,03 của tỷ lệ tổng thể.
b. Hãy tính xác suất để tỷ lệ của mẫu nằm trong khoảng ±0,05 của tỷ lệ tổng thể.
5.12. Với tỷ lệ tổng thể bằng 0,60, hãy tính sai số chuẩn của tỷ lệ mẫu đối với kích cỡ mẫu
bằng 100, 200, 300 và 500. Bạn có nhận định gì về độ lớn của sai số chuẩn của tỷ lệ tổng
thể khi kích cỡ mẫu tăng lên?
5.13. Theo thống kê toàn ngành du lịch thì tỷ lệ người thích du lịch sinh thái là 30% trong
tổng số khách du lịch. Nếu chúng ta chọn ngẫu nhiên 1011 khách du lịch, hãy tính xác suất
để tỷ lệ người thích du lịch sinh thái trong mẫu ≥ 32%?

CHƯƠNG 6. ƯỚC LƯỢNG THAM SỐ TỔNG THỂ


6.1. Một mẫu ngẫu nhiên đơn giản có 40 phần tử với trung bình của mẫu bằng 32 và độ lệch
chuẩn bằng 5.
a. Xác định khoảng tin cậy 90% cho trung bình tổng thể?
b. Như câu a nhưng khoảng tin cậy 95%?
c. Như câu a nhưng khoảng tin cậy 99%?
6.2. Trong một khảo sát cho thấy số giờ xem tivi trung bình của một hộ là 15,75 giờ/tuần. Giả
sử chúng ta khảo sát 200 hộ và có độ lệch chuẩn của mẫu là 5,45 giờ. Hãy tính ước lượng
khoảng với độ tin cậy 95% cho thời gian xem tivi trung bình của một hộ trong tuần?
6.3. Để ra quyết định về mở rộng sản xuất, công ty A muốn biết một thanh thiếu niên trung bình
mua hàng bao nhiêu đĩa nhạc trong năm. Công ty điều tra 250 thanh thiếu niên và có được
giá trị trung bình của mẫu là 4,26. Hãy ước lượng với độ tin cậy 99% cho số lượng đĩa nhạc
trung bình một thanh thiếu niên mua hàng năm? Giả sử độ lệch chuản của tổng thể đã biết
là 3.
6.4. Để tính thu nhập bình quân của các hộ trong vùng, công ty A đã điều tra 100 hộ dân.
a. Nếu độ lệch chuẩn của thu nhập tổng thể các hộ dân đã biết bằng 6$, hãy tính sai số
chuẩn của giá trị trung bình?
b. Với độ tin cậy 95%, hãy tính dự trữ sai số?
c. Nếu thu nhập trung bình của 100 hộ dân là 65$, hãy tính ước lượng khoảng cho thu
nhập trung bình của toàn hộ dân trong vùng với độ tin cậy bằng 95%?
6.5. Trong khi chọn ra 80 sinh viên từ một trường đại học, trưởng khoa đã kết luận rằng thời
gian học ở nhà trung bình của một sinh viên là 15,2 giờ với độ lệch chuẩn của mẫu là 3 giờ.
Hãy tính ước lượng thời gian học ở nhà trung bình của sinh viên trường đại học với độ tin
cậy 99%?
6.6. Với phân phối t có 10 độ tự do, hãy tính xác suất (diện tích) trong từng vùng:
a. Bên trái của 1,812
b. Bên phải của -1,372
c. Bên phải của 2,764
d. Bên trái của -1,812
e. Giữa – 2,228 và 2,228
f. Giữa – 1,372 và 1,812
6.7. Tìm giá trị t trong những trường hợp sau:
a. Diện tích đuôi trên bằng 0,05 với 16 độ tự do
b. Diện tích đuôi dưới bằng 0,1 với 20 độ tự do
c. Diện tích đuôi trên bằng 0,01 với 5 độ tự do
d. 90% diện tích nằm trong khoảng ±t với 12 độ tự do
e. 95% diện tích nằm trong khoảng ±t với 26 độ tự do
6.8. Cho một mẫu được lấy từ tổng thể có phân phối chuẩn: 10, 6, 12, 11, 13, 9, 8, 5
a. Hãy tính ước lượng điểm của trung bình tổng thể?
b. Hãy tính ước lượng điểm của độ lệch tổng thể?
c. Hãy tính ước lượng khoảng của trung bình tổng thể với độ tin cậy 99%?
6.9. Sản xuất giấy theo dây chuyền tự động: chiều dài trung bình 29,7cm; độ lệch tiêu chuẩn
của chiều dài là 0,05cm. Chọn mẫu gồm 100 tờ để kiểm tra chiều dài. Trong lần kiểm tra
gần nhất, chiều dài trung bình tính được từ mẫu là 29,698. Xác định khoảng ước lượng với
độ tin cậy 95% cho chiều dài giấy trung bình của tổng thể.
6.10. Đo trọng lượng của 25 bé trai 8 tuổi ở 1 ngôi làng, sau khi tính toán tập dữ liệu mẫu, ta có
số liệu sau: 𝑥̅=26,06kg và s = 1,61kg. Hãy ước lượng trọng lượng trung bình của trẻ em
8 tuổi ở đây với độ tin cậy 90%.
6.11. Phải chọn kích cỡ mẫu bằng bao nhiêu để có được ước lượng khoảng với độ tin cậy
95% và dự trữ sai số bằng 6 với giả định độ lệch chuẩn của tổng thể bằng 30.
6.12. Khoảng biến thiên của một tập dữ liệu bằng 24
a. Hãy xác định giá trị cho độ lệch chuẩn của tổng thể
b. Với độ tin cậy 95% hãy xác định kích cỡ mẫu để dự trữ sai số bằng 3?
c. Với độ tin cậy 95% hãy xác định kích cỡ mẫu để dự trữ sai số bằng 4?
6.13. Để nghiên cứu chi tiêu trung bình của một học sinh, một mẫu ngẫu nhiên được ghi nhận
như sau (ngàn đồng):

60 66 62 72 73 72 57 58
70 66 60 65 70 57 64

Hãy tính ước lượng khoảng với độ tin cậy 95% cho chi tiêu trung bình của học sinh? Giả
định chi tiêu của học sinh tuân theo phân phối bình thường.
6.14. Lấy mẫu ngẫu nhiên 300 người thì 100 người thích đi du lịch biển trong kỳ nghỉ hè.
a. Hỏi ước lượng điểm của tỷ lệ tổng thể những người thích đi du lịch biển trong kỳ
nghỉ hè?
b. Hãy tính sai số chuẩn của tỷ lệ tổng thể?
c. Hãy tính ước lượng khoảng cho tỷ lệ tổng thể với độ tin cậy 95%?
6.15. Công ty tiếp thị thể thao của thành phố A dự định tổ chức một trận đấu cầu giao hữu
với tỉnh bạn. Công ty biết rằng theo thống kê mới nhất thì dân số thành phố là 500.000
người. Công ty muốn ước lượng tỷ lệ số người sẽ tham dự trận đấu. Hỏi công ty phải chọn
mẫu kích cỡ bao nhiêu để biết được tỷ lệ này với sai số dự trữ không quá 0,03% và độ tin
cậy 99%?
6.16. Trong một điều tra ở trường đại học với mẫu 1200 sinh viên thì có 290 sinh viên đi
làm them vào dịp cuối tuần.
a. Hãy ước lượng điểm của tỷ lệ sinh viên đi làm thêm cuối tuần cho toàn thể sinh viên
trong trường đại học?
b. Với độ tin cậy 95%, hãy tính dự trữ sai số tương ứng với ước lượng này?

CHƯƠNG 7. KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ TỔNG THỂ


7.1. Nhà quản lý một cửa hàng thiết bị điện tử đang xem xét một kế hoạch tiếp thị để tăng sản
lượng bán ra của cửa hàng. Hiện tại, số tivi bán được trung bình trong một ngày là 6 tivi. Để
tiến hành thu thập dữ liệu trước khi tiến hành kế hoạch, một nhóm các nhân viên bán hàng
sẽ được bán thử nghiệm theo kế hoạch dự kiến trong vòng 2 tuần.
a. Hãy xây dựng giả thuyết không và giả thuyết đối phù hợp cho nghiên cứu này?
b. Cho ý kiến khi H0 bị bác bỏ?
c. Cho ý kiến khi H0 không bị bác bỏ?
7.2. Công ty nước giải khát tuyên bố loại chai nước ngọt có gaz được bán trên thị trường có
dung tích mỗi chai là 330ml. Hiệp hội người tiêu dùng muốn kiểm tra tính đúng đắn của
tuyên bố trên bằng cách kiểm tra mẫu xem giá trị trung bình dung tích trong một chai có
đáp ứng tiêu chuẩn phát biểu trên hay không.
a. Hãy xây dựng giả thuyết không và giải thuyết đối cho nghiên cứu trên?
b. Kết luận của hiệp hội người tiêu dùng khi bác bỏ hay không bác bỏ H 0?
7.3. Cho các giả thuyết: H0: µ ≥ 11
H1: µ < 11
Một mẫu có kích cỡ n = 40 có trung bình mẫu bằng 9,65 và độ lệch chuẩn bằng 3.
a. Tính giá trị tới hạn z với độ tin cậy 95%? Quy tắc bác bỏ?
b. Tính giá trị thống kê kiểm định z? Kết luận của bạn? 7.4. Cho
các giả thuyết: H0: µ ≤ 16
H1: µ > 16
Một mẫu có 50 phần tử với trung bình mẫu bằng 17 và độ lệch chuẩn của mẫu bằng 8.
a. Với α = 0,02, tính giá trị tới hạn z và nêu quy tắc bác bỏ?
b. Tính giá trị thống kê kiểm định z?
c. Tính giá trị p-value
d. Kết luận?
7.5. Cho các giả thuyết: H0: µ ≥ 30
H1: µ < 30
Lấy mẫu 120 phần tử với độ lệch chuẩn bằng 13, độ tinh cậy 95%, hãy tính giá trị thống kê
kiểm định và kết luận cho các trường hợp sau:
a. x = 26
b. x = 27
c. x = 28
d. x = 29
7.6. Một cửa hàng ăn uống nghĩ rằng việc trang bị lại cửa hàng sẽ đem lại lợi nhuận cao hơn.
Sau khi phân tích các bài toán tài chính, quản lý cửa hàng quyết định rằng điềun ày chỉ đem
lại hiệu quả kinh tế nếu hóa đơn trung bình của khách hàng lớn hơn 70$. Trước khi quyết
định đầu tư, nhà quản lý lấy mẫu ngẫu nhiên 200 hóa đơn và giá trị trung bình một hóa đơn
là 74$
với độ lệch chuẩn của mẫu là 30$. Hãy quyết định giúp nhà quản lý có nên đầu tư hay
không với độ tin cậy 95%?
7.7. Cho các giả thuyết: H0: µ ≤ 12
H1: µ > 12
Lấy mẫu 12 phần tử với trung bình mẫu bằng 13 và độ lệch chuẩn của mẫu bằng 2,5. Tổng
thể được giả định tuân theo phân phối chuẩn.
a. Với α = 0,05, hãy xác định quy tắc bác bỏ?
b. Tính giá trị thống kê kiểm định t?
c. Kết luận?
7.8. Cho các giả thuyết: H0: µ ≥ 20
H1: µ < 20
Mẫu kích cỡ 15 và độ lệch chuẩn bằng 7. Hãy tính giá trị thống kê kiểm định t và kết luận
trong các trường hợp sau với mức ý nghĩa 0,05:
a. x = 16
b. x = 19
c. x = 19,5
d. x = 21
7.9. Cho các giả thuyết: H0: p ≤ 0,4
H1: p > 0,4
Lấy mẫu 150 phần tử với tỷ lệ mẫu p = 0,45.
a. Với α = 0,05, hãy xác định quy tắc bác bỏ?
b. Tính giá trị thống kê kiểm định z? Kết luận? 7.10. Cho
các giả thuyết: H0: p = 0,3
H1: p ≠ 0,3
Lấy mẫu 350 phần tử với tỷ lệ mẫu p = 0,28.
a. Với α = 0,02, hãy xác định quy tắc bác bỏ?
b. Tính giá trị thống kê kiểm định z?
c. Tính giá trị p?
d. Kết luận?
7.11. Cho các giả
thuyết:
H0: p ≥
0,8 H1: p < 0,8
Mẫu kích cỡ 250. Với mức ý nghĩa 0,05, hãy tính giá trị p và thống kê kiểm định z tương
ứng cho các trường hợp sau:
a. p = 0,72
b. p = 0,75
c. p = 0,77
d. p = 0,83
7.12. 10 người uống bia thì chỉ có 1 người thích bia A. Sau chiến dịch quảng cáo, khảo sát
một mẫu ngẫu nhiên 200 người uống bia thì thấy có 26 người thích bia A. Thông tin này có
đủ để kết luận là có sự gia tăng tỷ lệ những người thích uống bia A không? Chọn độ tin cậy
cho bài toán kiểm định là 90%.

7.13. Trong một đợt vận động tranh cử, ứng viên A tuyên bố là mình đã đạt được ít nhất
70% số cử tri ủng hộ. Để kiểm định tính xác thực của tuyên bố này, một tạp chí đã cử người
đi điều tra phỏng vấn 200 người và thu được kết quả 68% số cử tri ủng hộ ứng viên A. Hãy
dùng giá trị thống kê kiểm định và giá trị p để rút ra kết luận về tính đúng đắn của tuyên bố
của ứng viên A với độ tin cậy 95%?

7.14. Một công ty tuyên bố rằng sản phẩm của họ chiếm 25% thị trường. Thăm dò ngẫu
nhiên 300 người cho thấy 22% sử dụng sản phẩm công ty. Với mức ý nghĩa 0,05 hãy kiểm
định các giả thuyết H0: p = 0,25 và H1: p ±0,25. Hãy xác định giá trị p?

7.15. Theo quy định kỹ thuật, các tủ lạnh phải giữ được độ lạnh đã cài đặt với mức độ dao
động của nhiệt độ là ít nhất thông qua độ lệch chuẩn không quá 4 độ C. Một mẫu 16 tủ lạnh
trong kho được chọn ngẫu nhiên và qua kiểm tra thấy rằng phương sai mẫu này là s 2=24.
Chọn a = 0,05, thực hiện kiểm định phù hợp cho biết độ lệch chuẩn theo yêu cầu kỹ thuật
có bị vượt quá không.

7.16. Một hãng viễn thông tiến hành kiểm định có hay không có sự khác biệt trong thu
nhập trung bình của khách hàng nam và nữ. Họ chọn ngẫu nhiên 200 khách nam và 100
khách nữ. Trên hai mẫu ngẫu nhiên khách hàng, công ty thu thập được thu nhập trung bình
của khách hàng nam là 43.390$ và khách hàng nữ bằng 42.400$, độ lệch chuẩn thu nhập
của mẫu khách nam bằng 7.300$ và của mẫu khách nữ bằng 8.200$. Thực hiện bài toán
kiểm định với độ tin cậy 95%.
7.17. Để so sánh độ bền của hai loại sơn phản quang dùng để vẽ kí hiệu hướng dẫn giao
thông, người ta kẻ 12 lằn sơn mỗi loại trên một đoạn đường có nhiều xe lưu thông, sau một
thời gian người ta dùng máy đo cường độ phản chiếu của các lằn sơn (chỉ số càng cao thì
cường độ phản chiếu càng lớn) và ghi lại được số liệu sau đây:

Sơn 12,5 11,7 9,9 9,6 10,3 9,6 9,4 11,3 8,7 11,5 10,6 9,7
A
Sơn 9,4 11,6 9,7 10,4 6,9 7,3 8,4 7,2 7,0 8,2 12,7 9,2
B

Người ta cho rằng loại sơn A bền hơn loại sơn B, hãy kiểm định thông tin với độ tin cậy
90%.
7.18. Để thiết kế một phần mềm thử nghiệm nhằm so sánh tốc độ xử lý của hai phần mềm
thống kê, người ta chọn ra một bộ dữ liệu, đặt ra 10 yêu cầu cần xử lý trên hai bộ dữ liệu
này sau đó ghi lại thời gian xử lý từng lệnh của từng phần mề, ta có bảng dữ liệu sau:

Câu hỏi đặt ra là phần mềm mới có xử lý nhanh hơn phần mềm cũ hay không. Kiểm định
thông tin này với độ tin cậy là 95%.

You might also like