You are on page 1of 56

Nội dung 11

PHÂN TÍCH PHƯƠNG SAI


PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ

Trương Đức An & Đặng Tiến Quang

HCM Universitity of Technology


tdan.boss@tdanclass.com

HK231
Lý thuyết cần nhớ

Nội dung Trang


1. Phân tích phương sai
(a) Khái niệm 119
(b) Ví dụ về bài toán phân tích phương sai 119
2. Phân tích phương sai một nhân tố
(a) Khái niệm 120
(b) Các giả định trong mô hình 120
(c) Giả thiết cho bài toán 120
(d) Các bước tiến hành 120
(e) Phân tích sâu Anova một nhân tố 125

Chú ý: Sinh viên xem lý thuyết trong Tài liệu ôn tập Xác suất & Thống kê

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 2 / 56


Một số ví dụ
Ví dụ 1
Một nhà sản xuất các túi giấy dùng để đựng hoa quả muốn tăng độ chịu kéo của sản
phẩm, các kỹ sư tin rằng độ chịu kéo phụ thuộc vào tỉ lệ gỗ cứng có trong bột giấy.
Nhóm kỹ sư phụ trách nghiên cứu này đã quyết định thử nghiệm ở bốn mức tỉ lệ: 5%,
10%, 15%, và 20%. Họ kiểm tra sáu mẫu ở mỗi mức tỉ lệ. Tất cả 24 mẫu được kiểm tra
độ chịu kéo với cùng một thiết bị và theo thứ tự ngẫu nhiên. Dưới đây là dữ liệu:

Tỉ lệ gỗ cứng Độ chịu kéo


5% 7 ; 8 ; 15 ; 11 ; 9 ; 10
10% 12 ; 17 ; 13 ; 18 ; 19 ; 15
15% 14 ; 18 ; 19 ; 17 ; 16 ; 18
20% 19 ; 25 ; 22 ; 23 ; 18 ; 20

+ Có sự khác biệt về độ chịu kéo giữa các sản phẩm có hàm lượng gỗ cứng trong bột
gỗ ở 4 mức khác nhau hay không? α = 0.05
+ Khoảng tin cậy 95% cho sự khác biệt trung bình về độ chịu kéo giữa các sản phẩm có
hàm lượng gỗ cứng trong bột giấy ở hai mức 10 và 15.
+ Kết quả của so sánh bội, α = 0.05.
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 3 / 56
Một số ví dụ
Ví dụ 1

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 4 / 56


Một số ví dụ
Ví dụ 1

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 5 / 56


Một số ví dụ
Ví dụ 1

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 6 / 56


Một số ví dụ
Ví dụ 1

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 7 / 56


Một số ví dụ
Ví dụ 2
Người ta tin rằng có sự liên quan giữa màu tóc tự nhiên và sức chịu đau. Thế
nên, 27 phụ nữ đã được chọn ngẫu nhiên để thực hiện một cuộc khảo sát. Trong
cuộc khảo sát này, các phụ nữ được ghi nhận màu tóc theo 3 gam màu: Sáng,
trung và tối. Đồng thời, họ cũng được ghi nhận sức chịu đau, với sức chịu đau
được đánh giá tăng dần theo thang điểm 100. Bảng bên dưới tóm tắt kết quả của
cuộc khảo sát này:

Màu sáng Màu trung bình Màu tối


Số phụ nữ tham gia khảo sát 9 9 9
Điểm trung bình trong mỗi gam màu y A = 55.7778 y B = 54.2222 y C = 52.3333
Điểm trung bình trong toàn dữ liệu: y = 54.1111
X27
Tổng bình phương điểm trong toàn dữ liệu: yi2 = 79297
i=1

Dùng ANOVA, hãy đưa ra kết luận với α = 0.01

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 8 / 56


Một số ví dụ
Ví dụ 2

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 9 / 56


Một số ví dụ
Ví dụ 2

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 10 / 56


Một số ví dụ
Ví dụ 3
Để xem xét sự ảnh hưởng của hình thức thi tới kết quả thi của sinh viên, nhà
trường khảo sát về điểm thi của sinh viên môn XSTK ở 3 hình thức thi: thi
online, thi tự luận và thi vấn đáp. Bảng dưới đây thể hiện một phần của số liệu 3
mẫu nhận được. Hãy dùng phương pháp Anova để giải bài toán trên, kết luận với
mức ý nghĩa 5%.
Điểm của sinh viên theo các hình thức thi
Thi online Thi tự luận Thi vấn đáp
6 x12 x13
5.4 x22 x23
5.4 x32 x33
6.4 x42 x43
6.3 x52 x53
Trung bình từng mẫu xj _____ 5.22 4.94
Tổng bình phương các giá trị trong từng mẫu
X5
xij2 _____ 144.07 127.99
i=1

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 11 / 56


Một số ví dụ
Ví dụ 3

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 12 / 56


Một số ví dụ
Ví dụ 3

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 13 / 56


Một số ví dụ
Ví dụ 4
Một bác sĩ phòng cấp cứu muốn tìm hiểu xem liệu có bất kỳ sự khác biệt nào về
thời gian khi dùng ba loại thuốc hít khác nhau để làm ngừng cơn hen suyễn.
Trong một khoảng thời gian hàng tuần, cô ấy đã dùng các loại thuốc này cho
những người bị hen suyễn và ghi lại số phút cần để bệnh nhân ngừng cơn hen.
Sau đó, cô dựa vào kết quả đo được từ các nhóm 12 bệnh nhân đã được điều trị
với mỗi loại thuốc, và tính được trung bình mẫu và phương sai mẫu (hiệu chỉnh).
Kết quả được biểu diễn dưới đây:

Thuốc xi si2
A 32 145
B 40 138
C 30 150

Kiểm tra giả thuyết rằng thời gian trung bình để làm ngừng cơn hen là như nhau
đối với cả ba loại thuốc. Sử dụng mức ý nghĩa 5%.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 14 / 56


Một số ví dụ
Ví dụ 4

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 15 / 56


Một số ví dụ
Ví dụ 4

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 16 / 56


Bài tập nội dung 11
BT - 01
Để so sánh chi phí quảng cáo giữa 4 tờ báo khác nhau (với các điều kiện quảng
cáo như nhau), người ta lấy mẫu 7 lần quảng cáo trên mỗi tờ báo và thu được
các kết quả như sau (đơn vị: ngàn đồng):

Báo A 57 65 50 45 70 62 48
Báo B 72 81 64 55 90 38 65
Báo C 35 42 58 59 46 60 61
Báo D 73 85 92 68 82 94 66

Hãy kiểm định xem có sự khác biệt về chi phí quảng cáo giữa các tờ báo nói trên
hay không, xét mức ý nghĩa 5%?

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 17 / 56


Bài tập nội dung 11
BT - 01

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 18 / 56


Bài tập nội dung 11
BT - 02
Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên
các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây, kết quả thu được
như sau:
A B C
24 21 16
18 26 22
27 32 19
28 25 17

Với mức ý nghĩa 5%, hãy so sánh số quả cà chua mọc trung bình khi bón 3 loại
phân A, B, C nói trên.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 19 / 56


Bài tập nội dung 11
BT - 02

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 20 / 56


Bài tập nội dung 11
BT - 03
Một công ty dược phẩm so sánh ba công thức thuốc giảm đau cho chứng đau
nửa đầu. Trong 27 người tình nguyện được chia ngẫu nhiên thành ba nhóm, mỗi
nhóm tương ứng với một công thức thuốc. Những người này sẽ uống thuốc khi bị
đau nửa đầu và phản hồi mức đau đầu sau khi uống thuốc (10 là mức đau nhất).
Dưới đây là dữ liệu thu được:

Công thức A 4 5 4 3 2 4 3 4 4
Công thức B 6 8 4 5 4 6 5 8 6
Công thức C 6 7 6 6 7 5 6 5 5

Hãy so sánh tác dụng của ba công thức thuốc trên với mức ý nghĩa 0.05.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 21 / 56


Bài tập nội dung 11
BT - 03

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 22 / 56


Bài tập nội dung 11
BT - 04
Hội chứng thiếu sắt là dạng suy dinh dưỡng phổ biến nhất ở các nước đang phát
triển. Trước đây, mọi người thường dùng nồi sắt để nấu thức ăn. Sau này, nồi
nhôm đã được sử dụng nhiều hơn vì nó rẻ hơn và nhẹ hơn. Có ý kiến cho rằng vật
liệu nồi ảnh hưởng đến hàm lượng sắt có trong thức ăn. Để kiểm chứng ý kiến
này, người ta chọn một món ăn phổ biến và lần lượt dùng một trong ba loại nồi,
nhóm, đất, và sắt để chế biến món ăn. Bốn mẫu thức ăn được chọn ngẫu nhiên
từ mỗi nồi. Dưới đây là hàm lượng sắt đo được trong các mẫu thức ăn.

Vật liệu nồi Hàm lượng sắt (mg/100g thức ăn)


Nhôm 1.77 ; 2.36 ; 1.96 ; 2.14
Đất 2.27 ; 1.28 ; 2.48 ; 2.68
Sắt 5.27 ; 5.17 ; 4.06 ; 4.22

Với mức ý nghĩa 0.01, hãy kiểm chứng nhận định trên.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 23 / 56


Bài tập nội dung 11
BT - 04

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 24 / 56


Bài tập nội dung 11
BT - 05
Nồng độ bụi (đơn vị: mg /m3 ) tại 3 giao lộ ở TP.HCM năm 2020 thể hiện trong
bảng sau:

Địa điểm Nồng độ bụi


Giao lộ 1 0.9 ; 1.2 ; 0.8 ; 2.3 ; 1.7 ; 1.5 ; 1.3 ; 2.5
Giao lộ 2 0.9 ; 0.8 ; 3.2 ; 2.5 ; 1.9 ; 1.5 ; 1.2 ; 0.8
Giao lộ 3 2.9 ; 0.8 ; 1.2 ; 3.5 ; 0.9 ; 2.1 ; 1.2 ; 1.7

Hãy so sánh nồng độ bụi trong không khí ở 3 giao lộ trên với mức ý nghĩa 5%.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 25 / 56


Bài tập nội dung 11
BT - 05

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 26 / 56


Bài tập nội dung 11
BT - 06
Chỉ số BOD (đơn vị: mg/l) tại 3 con sông trên địa bàn tỉnh Khánh Hoà được đo
vào các ngày ngẫu nhiên và kết quả được thể hiện trong bảng sau:

Sông Chỉ số BOD


Bà Triên 1 1.4 2 2.5 0.8 1.5
Tà Trục 0.8 0.8 1 1.5 1.3 1.8
Tô Giang 2 2 2.5 3 2.8 3.2

Hãy so sánh chỉ số BOD ở 3 con sông trên với mức ý nghĩa 1%.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 27 / 56


Bài tập nội dung 11
BT - 06

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 28 / 56


Bài tập nội dung 11
BT - 07
Năm 1992, trong một nghiên cứu về ảnh hưởng của trục cuốn ép lên cường độ
chịu nén của các thùng carton theo tiêu chuẩn RSC, Burgess đã tiến hành đo
cường độ chịu nén của 4 loại thùng carton khác nhau. Dưới đây là dữ liệu thu
được:

Thùng Lực nén


1 655.5 788.3 734.3 721.4 679.1 699.4
2 789.2 772.5 786.9 686.1 732.1 774.8
3 737.1 639.0 727.1 671.7 717.2 727.1
4 535.1 628.7 542.4 559.0 586.9 520.0

Hãy so sánh cường độ chịu nén của 4 loại thùng carton với mức ý nghĩa 1%.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 29 / 56


Bài tập nội dung 11
BT - 07

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 30 / 56


Bài tập nội dung 11
BT - 08
Theo giới thiệu của nhà phân phối, mức tiêu thụ nhiên liệu trung bình của 4 loại
xe ô tô là như nhau. Sau một thời gian chạy xe, người ta đo lại trên các quãng
đường như nhau thì được kết quả sau:

Loại xe Mức tiêu thụ nhiên liệu


I 20 21.2 18.7 19.5 20.1 22
II 21.2 21.2 20.4 19.6 22 21.1
III 21.5 21.2 21 21.5 22 20.7
IV 19.9 22 21 23 20.6 21.3

Có thể coi mức tiêu thụ nhiên liệu của 4 loại xe này còn giống nhau hay không,
với mức ý nghĩa 1%?

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 31 / 56


Bài tập nội dung 11
BT - 08

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 32 / 56


Bài tập nội dung 11
BT - 09
Có 3 loại sơn phản quang dùng để vẽ các ký hiệu hướng dẫn giao thông trên
đường. Để so sánh độ bền của chúng, người ta kẻ 5 vạch sơn mỗi loại trên một
đoạn đường có nhiều xe lưu thông, thứ tự sơn được chọn một cách ngẫu nhiên.
Sau một thời gian, người ta đo cường độ phản chiếu của các vạch sơn và thu được
bảng số liệu bên. Hãy dùng phương pháp Anova để so sánh độ bền của 3 loại sơn,
với mức ý nghĩa 5%. Hãy nêu các giả thiết về số liệu phù hợp cho bài toán.

Sơn loại A 11.1 11.8 9.6 9.7 10.2


Sơn loại B 12.2 11.8 10.6 12.1 10.1
Sơn loại C 9.8 10.5 10.4 10.6 10.3

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 33 / 56


Bài tập nội dung 11
BT - 09

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 34 / 56


Bài tập nội dung 11
BT - 10
Người ta tin rằng có sự liên quan giữa màu tóc tự nhiên và sức chịu đau của phụ
nữ. Do đó, 12 phụ nữ đã được chọn ngẫu nhiên để thực hiện một cuộc khảo sát.
Trong đó, màu tóc và sức chịu đau (theo thang điểm 100) của các tình nguyện
viên được ghi nhận. Bảng bên là số liệu thu được. Với mức ý nghĩa 5%, có thể
kết luận rằng màu tóc ảnh hưởng đến sức chịu đau của phụ nữ hay không?

Màu sáng 63 72 52 60
Màu trung bình 60 48 44 53
Màu tối 45 33 57 40

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 35 / 56


Bài tập nội dung 11
BT - 10

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 36 / 56


Bài tập nội dung 11
BT - 11
Một nhà sản xuất các túi giấy dùng để đựng hoa quả muốn tăng độ chịu kéo của
sản phẩm, các kỹ sư tin rằng độ chịu kéo phụ thuộc vào tỉ lệ gỗ cứng có trong
bột giấy. Nhóm kỹ sư phụ trách nghiên cứu này đã quyết định thử nghiệm ở năm
mức tỉ lệ: 5%, 8%, 11%, 14% và 17%. Họ kiểm tra 4 mẫu ở mỗi mức tỉ lệ. Tất
cả 20 mẫu được kiểm tra độ chịu kéo với cùng một thiết bị và theo thứ tự ngẫu
nhiên. Dưới đây là dữ liệu thu được:

5% 8% 11% 14% 17%


12.3 14.1 22.7 32.3 35.8
17.4 16 14.4 33.1 37
14.3 14.3 24.9 33.1 47.3
9.9 15 17.5 31.8 32.7

Giả sử các giả thuyết về phân phối chuẩn đều thoả và α = 0.01. Hãy dùng
phương pháp Anova để đưa ra kết luận phù hợp.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 37 / 56


Bài tập nội dung 11
BT - 11

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 38 / 56


Bài tập nội dung 11
BT - 12
Người ta khảo sát số giờ tự học môn XSTK trong một tuần của 4 nhóm sinh
viên: Nhóm 1 gồm những sinh viên đến lớp đầy đủ; nhóm 2 gồm những sinh viên
đến lớp tương đối đầy đủ; nhóm 3 gồm những sinh viên thỉnh thoảng đến lớp và
nhóm 4 gồm những sinh viên không đến lớp. Bảng dưới đây thể hiện một phần
của số liệu 4 mẫu nhận được. Hãy dùng phương pháp Anova để kiểm định xem
thời gian tự học trung bình của 4 nhóm sinh viên trên có như nhau hay không,
kết luận với mức ý nghĩa 1%.

Nhóm 1 Nhóm 2 Nhóm 3 Nhóm 4


12 x12 x13 x14
12 x22 x23 x24
12 x32 x33 x34
11 x42 x43 x44
Trung bình từng mẫu xj _____ 14.75 16 13.75
Tổng bình phương chênh lệch
X4
trong mỗi nhóm: (xij − xj )2 _____ 2.75 2 0.75
i=1
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 39 / 56
Bài tập nội dung 11
BT - 12

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 40 / 56


Bài tập nội dung 11
BT - 12

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 41 / 56


Bài tập nội dung 11
BT - 13
Để so sánh chất lượng sinh viên giữa 4 ngành học tại một trường đại học kinh tế,
người ta đã thực hiện khảo sát điểm trung bình học kỳ (thang điểm 10) cho 20
sinh viên được chọn ngẫu nhiên từ mỗi ngành và kết quả khảo sát được ghi nhận
như bên dưới.
Ngành học Điểm trung bình
Kế toán 7.1 6.7 6.6 6.6 7.36
Tài chính 6.7 6.8 7.0 5.6 6.2
Nhân sự 7.5 7.5 8.4 7.6 9.8
Tiếp thị 4.5 6.0 5.1 4.5 5.8

Giả sử rằng dữ liệu trên thoả các giả định của phương pháp Anova.
+ Hãy dùng phương pháp Anova để so sánh điểm trung bình học kỳ giữa 4 ngành
học trên và kết luận với mức ý nghĩa 5%.
+ Thực hiện so sánh bội bằng phương pháp LSD của Fisher và nhận xét kết quả
với α = 5%.
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 42 / 56
Bài tập nội dung 11
BT - 13

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 43 / 56


Bài tập nội dung 11
BT - 13

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 44 / 56


Bài tập nội dung 11
BT - 13

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 45 / 56


Bài tập nội dung 11
BT - 14
Biên độ ngày của nhiệt độ là chênh lệch giữa nhiệt độ cao nhất và thấp nhất
trong một ngày (24 giờ). Bảng số liệu mẫu dưới đây ghi nhận biên độ ngày của
nhiệt độ tại 3 thành phố trong 5 ngày lấy mẫu ngẫu nhiên.

Thành phố Biên độ ngày của nhiệt độ


Hà Nội 8.1 4.5 7.2 7.3 8.1
Huế 10.4 10.3 12.1 14.3 11
Hồ Chí Minh 8.8 10.1 11.1 9.1 10.0

Giả sử rằng dữ liệu trên thỏa các giả định của phương pháp Anova.
+ Hãy dùng phương pháp Anova để so sánh trung bình biên độ ngày của nhiệt độ
tại 3 tỉnh trên và kết luận với mức ý nghĩa 5%.
+ Thực hiện so sánh bội bằng phương pháp LSD của Fisher và nhận xét kết quả
với mức ý nghĩa 5%.

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 46 / 56


Bài tập nội dung 11
BT - 14

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 47 / 56


Bài tập nội dung 11
BT - 14

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 48 / 56


Bài tập nội dung 11
BT - 14

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 49 / 56


Bài tập nội dung 11
BT - 15
Ba mẫu thiết kế bao bì của một loại sản phẩm được xem xét bằng cách thu thập
doanh số (triệu đồng/năm) của mỗi loại bao bì trong một mẫu ngẫu nhiên của
các cửa hàng. Kết quả được ghi nhận trong bảng sau. Với kiểm định ANOVA ở
mức ý nghĩa 0.01, có thể kết luận rằng doanh số của sản phẩm với các mẫu bao
bì khác nhau là như nhau hay không? (Giả định doanh số các mẫu bao bì có phân
phối chuẩn và phương sai bằng nhau.)

Mẫu bao bì I Mẫu bao bì II Mẫu bao bì III


18 24 19
16 25 24
29 21 24
26 31 28
29 22 15
14 29
12 32
23
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 50 / 56
Bài tập nội dung 11
BT - 15

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 51 / 56


Bài tập nội dung 11
BT - 15

Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 52 / 56


Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 53 / 56
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 54 / 56
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 55 / 56
Trương Đức An & Đặng Tiến Quang Nội dung 11 HK231 56 / 56

You might also like