You are on page 1of 35

6.

PHÂN TÍCH PHƯƠNG SAI

Phân tích phương sai là phương pháp phân tích


sự ảnh hưởng của 1 hay nhiều yếu tố nguyên
nhân đến 1 yếu tố kết quả.

Phân tích phương sai là phương pháp kiểm định


sự bằng nhau của trung bình nhiều tổng thể.
PHÂN TÍCH PHƯƠNG SAI
6.1 Phân tích phương sai 1 nhân tố
6.2. Phân tích phương sai 2 nhân tố không lặp
6.3. Phân tích phương sai 2 nhân tố có lặp
6.1. PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN
TỐ (ONE WAY ANOVA)

Phân tích phương sai một yếu tố là phân tích ảnh


hưởng của một nhân tố nguyên nhân (định tính) đến
một yếu tố kết quả (định lượng)

Ví dụ: Thời gian làm thêm (yếu tố nguyên nhân –


định tính) ảnh hưởng đến kết quả học tập (yếu tố
kết quả - định lượng)
k ni
   (x ij  x ) 2
i 1 j1

k ni
2
   n i (x i  x)
Các kết quả trên được trình bày trong bảng sau đây gọi
là bảng ANOVA (phân tích phương sai – Analysis of
Variance)
Ví dụ 1: Ở một bệnh viện lớn, số ca cấp cứu trong 5
ngày chọn ngẫu nhiên được ghi lại như sau:
Buổi sáng : 44 53 56 49 38
Buổi chiều: 33 42 15 30 45
Buổi tối : 39 24 30 27 30
Với mức ý nghĩa 5%, có thể cho rằng số ca cấp cứu
trung bình trong ba buổi sáng, chiều, tối là như nhau
được không?

GTH: Số ca cấp cứu trung bình trong các buổi sáng,


chiều, tối khác nhau nhau không có ý nghĩa thống kê.
Buổi sáng Buổi chiều Buổi tối
44 33 39
53 42 24
56 15 30
49 30 27
38 45 30
ni 5 5 5 n = 15
Ti 240 165 150 T = 555
Nguồn Tổng độ Bậc tự Phương F – tỷ
lệch bình do (df) sai (MS) số
phương (SS)
Giữa các 930 2 465 6,270
nhóm
Trong các 890 12 74,1667
nhóm
Tổng số 1820 14
Ví dụ 2. Nghiên cứu về doanh số bán thuốc của các cửa hàng ở ngoại
thành, người ta chia ngoại thành thành 7 địa bàn dân cư khác nhau.
Chọn ngẫu nhiên các cửa hàng trong từng địa bàn và ghi nhận doanh
số. Địa bàn dân cư thứ ba có 13 cửa hàng được chọn, các địa bàn còn
lại đều chọn 19 cửa hàng. Kết quả ANOVA như sau:

Nguồn Tổng độ Bậc tự do Phương sai F – tỷ số


lệch bình (df) (MS)
phương (SS)
Giữa các 187,2649 ? ? ?
nhóm
Trong các ? ? ?
nhóm
Tổng số 1269,6891

Ở mức ý nghĩa 1% có thể kết luận rằng doanh số trung bình của các
cửa hàng ở các địa bàn dân cư khác nhau là như nhau không?
6.2. PHÂN TÍCH PHƯƠNG SAI 2 NHÂN TỐ
(TWO WAYS ANOVA)
6.2.1. Phân tích phương sai 2 nhân tố không lặp
Giả sử ta muốn phân tích nhằm đánh giá sự ảnh
hưởng của hai nhân tố A và B trên một đặc tính định
lượng được mô tả bằng biến ngẫu nhiên X nào đó.
Nhân tố A có n mức a1, a2, …, an và nhân tố B có m
mức b1, b2, …, bm.
b b1 b2 …. bm

a
a1 x11 x12 x1m
a2 x21 x22 x2m
….. …. …. ….
an xn1 xn2 xnm

Bài toán đặt ra: Phân tích để biết sự khác biệt về giá trị
trung bình của X trong các nhóm được xác định bới nhân tố
A có ý nghĩa thống kê hay không và sự khác biệt về giá trị
trung bình của X trong các nhóm được xác định bới nhân tố
B có ý nghĩa thống kê hay không?
Giả thuyết H0: Trung bình nhân tố cột bằng nhau
Trung bình nhân tố hàng bằng nhau
Bảng ANOVA
Tổng độ lệch bình Bậc tự do
Nguồn Phương sai (MS) F – tỷ số
phương (SS) (df)

2
 Ti* SSA MSA
Yếu tố A i T2 n-1 MSA  FA 
SSA   n -1 MSW
m m.n

2
 T* j SSB MSB
Yếu tố B j T2 m-1 MSB  FB 
SSB   m -1 MSW
n m.n

SSW
Sai số SSW=SST-SSA-SSB (n-1)(m-1) MSW 
(n - 1)(m - 1)

T2
Tổng SST   x ij2  nm - 1
i, j m.n

Nếu FA > Fn-1; (n-1)(m-1); ∝ thì bác bỏ yếu tố A hàng


Nếu FB > Fm-1; (n-1)(m-1); ∝ thì bác bỏ yếu tố B cột
Ví dụ 1. Đánh giá về một chất X được chiết xuất từ một
loại được liệu bằng 4 phương pháp chiết xuất và 5 loại
dung môi được kết quả như trong hình 5. Hãy cho kết
luận thích hợp?
GTH0: Giả sử Kết quả chiết suất của 4 phương pháp chiết suất là
như nhau. Kết quả chiết suất của 5 dung môi là như nhau.
6.2. PHÂN TÍCH PHƯƠNG SAI 2 NHÂN TỐ
(TWO WAYS ANOVA)
6.2.2. Phân tích phương sai 2 nhân tố có lặp
Tương tự như bài toán phân tích phương sai 2 nhân
tố không lặp, chỉ khác mỗi mức (ai , bj ) đều có sự lặp
lại r lần thí nghiệm.
Cần khảo sát thêm sự tương tác FAB giữa 2 nhân tố
A và B.
A B B1 B2 …. Bm
x111 x121 …. x1m1
x112 x122 …. x1m2
A1
...... ...... …. ......
x11r x12r …. x1mr
x211 x221 …. x2m1
x212 x222 …. x2m2
A2
...... ...... …. ......
x21r x22r …. x2mr
….. ….. ….. ….. …..
xn11 xn21 …. xnm1
xn12 xn22 …. xnm2
An
...... ...... …. ......
xn1r xn2r …. xnmr
W
Bảng ANOVA
Tổng độ lệch
Bậc tự do
Nguồn bình phương Phương sai (MS) F – tỷ số
(df)
(SS)
SSA MSA
Yếu tố A SSA n-1 MSA  FA 
n -1 MSW
SSB MSB
Yếu tố B SSB m-1 MSB  FB 
m -1 MSW
SSAB MSAB
MSAB  FAB 
Tương tác AB SSAB (n-1)(m-1) (n - 1)(m - 1) MSW

SSW
Sai số SSW nm(r-1) MSW 
nm(r - 1)

Tổng SST nmr-1

Nếu FA > Fn -1; nm(r -1); ∝ thì bác bỏ yếu tố A hàng.


Nếu FB > Fn-1; nm(r -1); ∝ thì bác bỏ yếu tố B cột.
Nếu FAB > F(n -1)(m -1); nm(r - 1); ∝ thì có sự tương tác giữa A và B
Ví dụ: Hàm lượng saponin (mg) của cùng một loại
dược liệu được thu hoạch trong hai mùa (khô và mưa,
trong mỗi mùa lấy mẫu 3 lần: đầu mùa, giữa mùa và cuối
mùa) và từ ba miền (Nam, Trung, Bắc) được kết quả như
bảng sau:

Hãy cho biết hàm lượng saponin có khác nhau theo mùa
hay miền không? Nếu có thì hai nhân tố mùa và miền có sự
tương tác với nhau hay không?
GTH0: Giả sử hàm lượng saponin không khác nhau theo mùa
Giả sử hàm lượng saponin không khác nhau theo miền
Giả sử 2 yếu tố mùa và miền không tương tác
FA > F1; 12; 0,95 = 4,75 : Hàm lượng saponin khác nhau theo mùa
FB > F2; 12; 0,95 = 3,89 : Hàm lượng saponin khác nhau theo miền
FAB < F2; 12; 0,95 = 3,89 : Chấp nhận GTH (không tương tác)

You might also like