You are on page 1of 6

Lê Bình Minh – 20172298

Bài tập chương 8 - Xử lý số liệu


Phần 8.2
8.6. Các dây chuyền sản xuất trong một nhà máy sản xuất được thiết lập để tạo ra các
ổ bi bằng thép với đường kính 1 micron. Mười ổ bi được chọn ngẫu nhiên từ hai dây
chuyền. Đường kính của các ổ bi được đo bằng micrômet là:

a. Giải thích tại sao các mẫu này độc lập:


Hai mẫu này là độc lập do số liệu thu thập được của 2 mẫu này là khác nhau
b. Đặt một biểu đồ Q- Q của dữ liệu. Một bộ đường kính ổ bi có xu hướng lớn hơn
khác?

Đường kính ổ bi theo xu hướng 2 sẽ lớn hơn đường kính ổ bi theo xu hướng đầu tiên

8.8. Ảnh hưởng của hai loại vi rút trên lá thuốc lá được nghiên cứu bằng cách xoa một
chế phẩm có chứa mỗi loại vi rút lên một nửa khác nhau của mỗi 8 lá thuốc. Số lượng
vết thương được đếm trên hai nửa của những lá này như sau

1
a. Giải thích lý do tại sao những mẫu này lại bị trùng khớp với nhau
Những mẫu này trùng khớp nhau là do 2 loại virus này đều được thực hiện trên cùng
một mẫu
b. Lập biểu đồ phân tán về số lượng vết bệnh Các cặp có xu hướng nằm trên hoặc dưới
đường 45 ° qua nguồn gốc? Một loại virus có xu hướng tạo ra nhiều vết bệnh hơn virus
kia?

Ta nhận thấy các cặp xu hướng này nằm gần sát so với đường 45o. Virus loại 1 gây
ra nhiều bệnh hơn virus loại 2.

8.10. Tham khảo dữ liệu từ Bài tập 4.22. Tính khoảng tin cậy 95% cho sự khác biệt
trung bình 1 - 2 giữa nồng độ dopamine của hai nhóm bệnh nhân với giả định  1 =  2
2 2

Có sự khác biệt có ý nghĩa thống kê ở = 0,05 giữa hai nhóm không?

Bài giải: Nhóm người loạn thần: 𝑥̅ = 0,02426; s2 = 0,005140, n1 = 11


Với nhóm người không loạn thần: 𝑦̅ = 0,01643, s1 = 0,004696, n2 = 15
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22
Ta tính được S2 = = 2,27.10-5 nên s = 4,764.10-3
𝑛1 + 𝑛2 −2

Khoảng tin cậy 95% cho sự khác biệt trung bình 1 - 2 giữa nồng độ dopamine của
hai nhóm bệnh nhân với giả định  1 =  2
2 2

1 1 1 1
𝑥̅ − 𝑦̅ − 𝑡𝑛1+𝑛2−2,𝛼∕2 ⋅ 𝑠√ + ≤ μ1 – μ2 ≤ 𝑥̅ − 𝑦̅ + 𝑡𝑛1+𝑛2−2,𝛼∕2 ⋅ 𝑠√ +
𝑛1 𝑛2 𝑛1 𝑛2

2
Thay số: 𝑥̅ = 0,02426; 𝑦̅ = 0,01643; s = 4,764.10-3; n1 = 11; n2 = 15; t24;0.025 = 2,064
Ta tính được khoảng tin cậy là [3,92.10-3; 0,01173]
Ta nhận thấy không có sự khác biệt thống kê giữa 2 nhóm.

8.12. Tham khảo dữ liệu từ Bài tập 8.5 về ảnh hưởng của tạo hạt mây đối với lượng
mưa

a. Lập các biểu đồ bình thường của dữ liệu thô và dữ liệu đã chuyển đổi loga. Nêu lý
do tại sao dữ liệu được tạo thành log nên được sử dụng để so sánh chính thức. Sử dụng
dữ liệu được chuyển đổi loga trong các phân tích sau.
Ta có bảng số liệu
i Seeded UnSeeded di = xi - yi i Seeded UnSeeded di = xi -
(xi) (yi) (xi) (yi) yi
1 4 1 3 14 243 47 196
2 8 5 3 15 255 69 186
3 18 5 13 16 275 87 188
4 31 12 19 17 275 81 194
5 33 17 16 18 303 95 208
6 41 23 18 19 334 148 186
7 92 24 68 20 430 163 267
8 115 26 89 21 489 244 245
9 118 26 92 22 703 321 382
10 119 29 90 23 978 346 632
11 130 29 101 24 1656 372 1284
12 199 37 162 25 1698 830 868
13 201 41 160 26 2746 1203 1543

Vẽ đồ thị dữ liệu ban đầu

3
Đồ thị đã chuyển đổi sang loga

Dữ liệu đã dùng chuyển đổi sang loga được dùng để so sánh chính thức là vì các
điểm phân bố của đồ thị nằm gần sát với đường tuyến tính so với đồ thị với dữ liệu ban
đầu.
b. Kiểm tra Ho: 1 =  2 với H1: 1   2 với =0.05, giả sử  12 =  22 . Kết luận của
bạn?
Đây là giả thuyết 2 chiều
Ta có 𝑡𝑛1+𝑛2−2,𝛼/2 = t50;0.025 = 2,0086; s1 = 650,82; s2 = 278,44, 𝑥̅ = 442,08; 𝑦̅ = 164,65
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22
Tính được s = √ = 460,35
𝑛1 + 𝑛2 −2
|𝑥̅ − 𝑦̅|
T= 1 1
= 2,172; ta có |t| = 2,172 > t50;0,025 = 2,0086 do đó ta từ chối H0 nên có thể
𝑠.√ +
𝑛1 𝑛2

sẽ 1   2
c. Lặp lại (a) mà không giả sử  1 =  2 . So sánh kết quả
2 2

4
|𝑥̅ − 𝑦̅|
Với 𝜎12 ≠ 𝜎22 , t =
𝑠 2
𝑠 2
√ 1+ 2
𝑛1 𝑛2

(𝜔1 +𝜔2 )2 𝑠12 𝑠22


Ta có: υ = 𝜔2 2 trong đó: 𝜔1 = ; 𝜔2 =
1 + 𝜔2 𝑛1 𝑛2
𝑛1 −1 𝑛2−1

Thay số: s1 = 650,82; s2 = 278,44; n1 = n2 = 26, tính được ω1 = 16291,02; ω2 = 2981,87


Tính được υ = 33,85 ta chọn υ = 33, nên t tυ, α/2 = t33;0,025 = 2,0345
|𝑥̅ − 𝑦̅|
Giá trị t = t = = 1,998
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2

Ta nhận thất t = 1,998 < t33;0,025 = 2,0345 do đó ta không từ chối H0

8.14. Một cửa hàng thực phẩm duy trì số liệu thống kê về doanh số bán hàng của khách
hàng trong một tuần trong tháng 8, phản ánh lượng hàng tạp hóa thông thường và một
tuần trong tháng 12 phản ánh lượng hàng tạp hóa cao hơn do kỳ nghỉ lễ. Hồ sơ về số
lượng mục được xử lý mỗi phút (IPM) và phần trăm thời gian nhàn rỗi (PIT) đã có sẵn
trong tuần thứ hai cho 25 nhân viên. Sự khác biệt (tháng 8 trừ tháng 12) cho mỗi nhân
viên đã được tính toán
a. Mức trung bình của tháng 8 của IPM là 27,5; mức trung bình của tháng 12 là 25,5.
Độ lệch chuẩn của sự khác biệt là sd = 2,0. So sánh IPM cho hai mùa sử dụng khoảng
tin cậy 95%.
Ta có: giá trị trung bình tháng 8: 𝑥̅ = 27,5
Giá trị trung bình tháng 12: 𝑦̅ = 25,5
Tính được: 𝑑̅ = 𝑥̅ − 𝑦̅ = 2,0; ta có: tn-1, α/2 = t24;0,025 = 2,064
Khoảng tin cậy 95% cho 𝜇1 − 𝜇2 là:
𝑠 𝑠
[𝑑̅ - 𝑡𝑛−1,𝛼/2 . 𝑑 ; 𝑑̅ + 𝑡𝑛−1,𝛼/2 . 𝑑 ] = [1,1744; 2,8256]
√𝑛 √𝑛
𝑑̅
Kiểm tra student: t = 𝑠𝑑 = 5; nhận thấy |t| = 5 > t24;0,025 = 2,064
√𝑛

b. Mức thuế trung bình tháng 8 của PIT là 37,3; mức trung bình của tháng 12 là 30,6.
Độ lệch chuẩn của sự khác biệt là sd = 13,0. So sánh thuế PIT cho hai mùa sử dụng
khoảng tin cậy 95%.
Ta có: giá trị trung bình tháng 8: 𝑥̅ = 37,3
Giá trị trung bình tháng 12: 𝑦̅ = 30,6
Tính được: 𝑑̅ = 𝑥̅ − 𝑦̅ = 6,7; ta có: tn-1, α/2 = t24;0,025 = 2,064, sd = 13,0
Khoảng tin cậy 95% cho 𝜇1 − 𝜇2 là:
𝑠 𝑠
[𝑑̅ - 𝑡𝑛−1,𝛼/2 . 𝑑 ; 𝑑̅ + 𝑡𝑛−1,𝛼/2 . 𝑑 ] = [1,3336; 12,0664]
√𝑛 √𝑛

5
𝑑̅
Kiểm tra student: t = 𝑠𝑑 = 2,576; nhận thấy |t| = 2,576 > t24;0,025 = 2,064
√𝑛

c. Bạn có thể kết luận gì về sự khác biệt trong việc xử lý khối lượng thông thường so
với khối lượng ngày lễ cao?
Hàng hóa thông thường có giá trị về IPM và PIT cao hơn khối lượng hang hóa với
những ngày nghỉ lễ có khối lượng cao

Phần 8.4
8.18. Một nhà hàng thêm một lò nướng thương mại mới vào nhà bếp của mình. Người
ta hy vọng rằng lò mới có nhiệt lượng phân bố đều hơn so với lò hiện tại. Lò được làm
nóng đến 350 ° F, sử dụng bộ điều khiển nhiệt và các số đọc nhiệt độ thu được từ các
nhiệt kế được đặt tại 9 vị trí trong mỗi lò, thu được dữ liệu sau:
Lò hiện tại: n1 = 9 x = 352,4 s1 = 2,3

Lò mới: n2 = 9 y = 350,2 s2 = 1.1


Kiểm tra Ho:  1 =  2 so với H1:  1   2 sử dụng =0.05. Dữ liệu có chỉ ra rằng lò
2 2 2 2

nướng mới không cung cấp nhiều sưởi ấm hơn so với hiện tại?
𝑠12
Bài giải: Ta tính được F = = 4,3719
𝑠22

Có: 𝑓𝑛1−1,𝑛2−1,𝛼 = f8;8;0,05 = 3,44:


Nhận thấy F = 4,3719 > f8;8;0,05 = 3,44 nên ta từ chối H0.

You might also like