You are on page 1of 64

ANOVA hai yếu tố

Các thiết kế khối


Mô hình ngẫu nhiên
được sử (Randomized block design)
dụng để
phân tích Thử nghiệm thừa số
hai xử lý
(Two-factor design)
Randomized block design

Mô hình thiết kế ngẫu nhiên hoàn


toàn có ích khi các đơn vị thử nghiệm là đồng
nhất, nếu các đơn vị thử nghiệm không đồng
nhất (phức tạp) thì khối (blocking) thường sử
dụng để tạo thành các nhóm đồng nhất.
Mục đích thiết kế khối ngẫu nhiên là kiểm
soát một vài nguồn biến thiên ngoại lai
(extraneous sources of variation) bằng cách chia
biến thiên do sai số thành biến thiên:
 Do sự khác nhau giữa các khối và
 Biến thiên do sai số ngẫu nhiên và khối
đóng vai trò biến độc lập thứ hai.
□ Như vậy, trong thiết kế này chúng ta phân
các đơn vị thử vào các khối và tiến hành xử lý
từng khối một.
Chú ý là, khác với mô hình ngẫu nhiên
hoàn toàn, trong đó các mẫu được chọn độc
lập với nhau, còn trong mô hình khối ngẫu
nhiên, các mẫu được chọn theo các tập
tương xứng (matched sets) (giống như trong
trường hợp mẫu cặp trong so sánh 2 trung
bình).
Ở đây số trung bình cần so sánh nhiều
hơn hai nên gọi là tập tương xứng, nghĩa là
chúng tương xứng với nhau.
Tương xứng không có nghĩa là các quan sát
luôn phụ thuộc lẫn nhau.
Ví dụ, nếu chúng ta chọn một người đánh
giá 3 chương trình đào tạo A, B và C. Ba số đo
này phụ thuộc nhau vì một người trả lời đánh giá
cả 3 chương trình.
Nếu chúng ta có một biến thứ hai và xem nó
là biến ngoại lai cần kiểm soát nó. Ba người nam
khác nhau đánh giá 3 chương trình khác nhau, 3 nữ
khác nhau đánh giá 3 chương trình khác nhau.
Trong trường hợp này cũng là tập tương xứng
nhưng các số đo (quan sát) độc lập nhau.
Ví dụ về tập tương xứng

Quan sát phụ thuộc Quan sát độc lập


(về đánh giá 3 chương trình) (về đánh giá 3 chương trình)
A B C A B C
Nam 1 Nam 1 Nam 1 Nam 1 Nam 2 Nam 3
Nữ 1 Nữ 1 Nữ 1 Nữ 1 Nữ 2 Nữ 3

Chú ý: trong tập tương xứng, kích thước mẫu của


các nhóm như nhau: n1 = n2 = …= nk
Như vậy, trong mô hình thiết kế khối ngẫu nhiên,
chúng ta chia tổng biến thiến thiên thành 3
nguồn biến thiên:
SST = SSTR + SSBL + SSE
Giả sử mẫu có các giá trị quan sát với k
nhóm (xét theo yếu tố nghiên cứu hay còn gọi
Treatment) và b khối {xét theo khối (Blocks)} –
còn gọi là biến ngoại lai}, hình thành nên ( k × b =
n) ô giá trị quan sát.

□ Trước hết, ta xem xét mỗi ô chỉ có một giá trị


quan sát (đơn quan sát).
Mẫu các giá trị quan sát trong phân tích
phương sai 2 yếu tố: trường hợp có một quan sát
trong một ô.

Khối Nhóm (xử lý/Treatments) Trung bình theo


(Blocks) 1 2 j k khối

1 x11 x12 x1j x1k


x1g
2 x21 x22 x2j x2k x 2g
i xi1 xi2 xij xik xi g
b xb1 xb2 xbj xbk xb g
Trung bình x· 1 x g2 x g j x gk x Trung bình
theo nhóm tổng thể
Trong đó: k
Trung bình của tất
cả các giá trị quan sát
å
j= 1
xij
trong khối xi g = (i = 1,2,.., b)
(x i ) (ith block) b
k
Trung bình của tất cả các å
i= 1
xij
giá trị quan sát trong nhóm xg j = ( j = 1,2,.., k )
(x  j ) (jth cột - treatments) b
k b

Trung bình của tất cả các


å å
j = 1 i= 1
xij
giá trị : (x)
x=
kb
Các tính toán
Tổng biến thiên trong thiết kế khối ngẫu
nhiên (Total sum of squares):
b k
SST = å å
i= 1 j = 1
( xij - x) 2

Sum of squares due to treatments


k
SSTR = b å ( x g j - x ) 2
j= 1

SSTR – Còn gọi biến thiên giữa các nhóm


trong thiết kế khối ngẫu nhiên. Thể hiện biến thiên
do sự khác nhau giữa các nhóm/Treatment (cột)
Sum of squares due to blocks
b
SSBL  k  (x i  x) 2

i 1
SSBL - Thể hiện biến thiên do sự khác nhau giữa
các khối (hàng).
Sum of squares due to error (SSE)
SSE –Sai số do yếu tố không nghiên cứu
SSE = SST – SSTR – SSBL
Hoặc: b k
SSE = å å
i= 1 j = 1
( xij - x i· - x· j + x) 2
Bảng ANOVA 2 chiều:
Nguồn Tổng các Bậc tự Trung bình F
biến thiên bình phương do bình phương

Giữa các SSB


Nhóm / (SSTR) k -1 SSTR MSTR
(Treatments)
MSTR  MSE
k 1
Giữa các SSBL b -1
Khối MSBL
SSBL
MSBL  MSE
(Blocks) b 1

Sai số SSE (k-1)(b-1)


SSE
(Error) MSE 
(k  1)(b  1)
Tổng SST kb -1
Ở mức ý nghĩa α, bác bỏ H0 về sự bằng nhau
giữa trung bình tổng thể các nhóm/treatments,
H0: μ1= μ2 =…= μk nếu:

MSTR
> Fk - 1,( k - 1)( b- 1),a
MSE

với Fk-1,(k-1)(b-1) có phân phối F với


(k-1) và (k-1)(b-1) bậc tự do tương ứng ở tử và
mẫu số
Ở mức ý nghĩa α, giả thuyết H0 về sự bằng nhau
giữa trung bình tổng thể các khối,
H0: μ1= μ2 =…= μb
Bác bỏ H0 , nếu:
MSBL
> Fb- 1,( k - 1)( b- 1),a
MSE
với Fb-1,(k-1)(b-1) có phân phối F với (b-1) và
(k-1)(b-1) bậc tự do tương ứng ở tử và mẫu số
Bài tập tại lớp: Xét kết quả thử nghiệm đối với
thiết kế khối ngẫu nhiên. Tính các bước cần thiết.
Với mức ý nghĩa 0.05 kiểm định tất cả sự khác
nhau có ý nghĩa
Treatments (Nhóm)
A B C
1 10 9 8
Blocks
(Khối)
2 12 6 5
3 18 15 14
4 20 18 18
5 8 7 8
Yêu cầu: 1. Tính SST, SSTR, SSBL, SSE
2. Thiết lập bảng phân tích phương sai
3. Kiểm định với mức ý nghĩa 0.05 sự bằng nhau
trung bình tổng thể theo các nhóm, khối
Ví dụ 2.2: Sản lượng với 4 loại phân bón và 3 loại thuốc
trừ sâu cho trong bảng dưới đây:
Thuốc trừ Thuốc trừ Thuốc trừ Trung
sâu 1 sâu 2 sâu 3 bìnhkhối
Phân bón 1 21 13 8
x1· = 14
Phân bón 2 12 10 8
x 2· = 10
Phân bón 3 9 8 7
x3· = 8
Phân bón 4 6 5 1
x 4· = 4
Trung bình
nhóm x· 1 = 12 x· 2 = 9 x· 3 = 6 x= 9
4 3
SST = å å
i= 1 j= 1
( xij - x) 2

= (21- 9) 2 + (13 - 9) 2 + ... + (1- 9) 2 = 266


3
SSTR = 4å ( x· j - x) 2 = 4[(12 - 9) 2 + (9 - 9) 2 + (6 - 9) 2 ] = 72
j= 1
4
𝑆𝑆𝐵𝐿=3 ∑ ( 𝑥 𝑖• − 𝑥 ¿ =3 [ ( 14 −9 ) +...+ ( 4 −9 ) ]=156
2 2 2

𝑖=1

SSE = SST – SSTR – SSBL


= 266 – 72 – 156 = 38
Xử lý bằng SPSS: Nhập dữ liệu

Tương tự cho
phân bón
Analyze General linear models Univariate
□ Dependent List: san luong
□ Fix factors: pb, tts
Từ Model  nhấn Custom  đưa 2 biến
pb, tts vào model
Từ Interraction (lặp lại, ảnh hưởng lẫn
nhau) bằng Main effects (vì chỉ có 1 quan sát cho
mỗi ô nên không thể tách hỗ tương ra khỏi sai số)
□ Continue  Options
□ Vào Descriptive stat. nếu muốn biết
thông tin mô tả
□ Homogeneity test (kiểm định tính đồng
nhất của sai số phương sai  Continue  OK
Kết quả xử lý bằng SPSS 20.0
Kết quả xử lý bằng SPSS 20.0
Kiểm định TUKEY

Kiểm định Tukey trường hợp này cũng giống


như trường hợp 1 yếu tố về nguyên tắc.
Ở đây, để so sánh từng cặp trung bình theo
nhóm (treatment):
T được tính: MSE
T = qa ,k ,( k - 1)(b- 1)
b
Từ ví dụ, ta có: xg1 = 12; xg2 = 9; xg3 = 6

Do do:D1 = xg1 - xg2 = 3; D2 = xg1 - xg3 = 6;

D3 = xg2 - xg3 = 3
MSE 6,33
T = qa ,k ,( k - 1)( b- 1) = q0.05,3,(2´ 3)
b 4
= 4,34´ 1, 25797 = 5, 03

Chỉ có D2 > T  Bác bỏ μ1 = μ3


Kết quả như đã tính thủ công
Phân tích tương tự
ANOVA n chiều: Thử nghiệm thừa số
(Factorial Experiment)

Giả sử chúng ta có 2 xử lý A và B: Xử
lý A có a mức độ và xử lý B có b mức độ.
Như vậy, trong thử nghiệm này chúng ta có
tổng cộng axb mức xử lý kết hợp. Trong
mỗi xử lý kết hợp ta tiến hành nhiều (r)
quan sát.
Với: a = Số mức độ của yếu tố A
b = Số mức độ của yếu tố B
r = Số giá trị trong mỗi ô
n = Tổng số quan sát trong thử
nghiệm n=abr
Tổng biến thiên (độ lệch bình
phương) toàn bộ SST phân chia theo
nguồn biến thiên:

SST =SSA+SSB+SSAB+SSE
Dữ liệu thử nghiệm thừa số
Factor B (j=1,…,b) Trung bình
theo cột A
x111 x112 x113
x211 x212 x213

Factor A
(i=1,..,a) xijk xijk xijk
xi11 xi12 xi13 k = 1,..,r x i
(r=3)

xa11 xa12 xa13


Trung bình
theo cột B x j
Tính các giá trị trung bình:
xi· (xét theo hàng – yếu tố A)
x· j (xét theo cột – yếu tố B),
x ij Trung bình của từng ô (ij)
và x là trung bình của tất cả các quan sát
(theo cả hàng và cột).
Với: i= 1, 2,…, a và j = 1, 2, …, b
b r

å å
j= 1 k = 1
xijk Mean of the ith Ievel
of factor A (i=1, 2,
x i· = …., a)
br
𝑎 𝑟

∑ ∑ 𝑥 𝑖𝑗𝑘
𝑖=1 𝑘=1
𝑥• 𝑗 =
𝑎𝑟

Mean of the jth Ievel of factor B (j=1, 2, ….,b)


r a b r

å xijk å å å
i= 1 j= 1 k = 1
xijk
k= 1
x ij = &x=
r abr
Trong đó:

x ij - Trung bình của ô ij, the


combination of the ith level of factor A
and the jth level of the factor B
Step 1: Tính tổng biến thiên trong Anova hai yếu tố
(total sum of squares):

𝑎 𝑏 𝑟
𝑆𝑆𝑇 =∑ ∑ ∑ ( 𝑥 𝑖𝑗𝑘 −𝑥 ) 2

𝑖=1 𝑗=1 𝑘=1


Step 2: Tổng bình phương do nhân tố A (The
sum of squares for factor A – Biến thiên của
nhân tố A):
a
SSA  br  (x i  x) 2

i 1
Step 3: Tổng bình phương do nhân tố B (The
sum of squares for factor B – Biến thiên của nhân
tố B):
b
SSB  ar  (x  j  x) 2

j1

SSB – Đại diện cho các khác nhau giữa các mức
độ khác nhau của yếu tố B với trung bình của tất
cả quan sát.
Step 4: Tính tổng bình phương cho sự tương tác
SSAB a b
SSAB  r  (x ij  x i  x  j  x) 2
i 1 j1

SSAB – Cho thấy ảnh hưởng tương tác của tổ hợp


cụ thể của yếu A và yếu tố B
Step 5: Tính tổng bình do sai số (SSE)
a b r
SSE = å å å
i= 1 j = 1 k
( xijk - x ij ) 2

hoac : SSE = SST - SSA - SSB - SSAB


SSE –thể hiện sự biến thiên do các yếu tố
khác không nghiên cứu
Step 6: Tính:
SSA SSB SSAB
MSA = ; MSB = ; MSAB =
a- 1 b- 1 ( a - 1)(b - 1)
SSE
& MSE =
ab(r - 1)

Step 7: Kiểm định giả thuyết về ảnh hưởng của


yếu tố thứ nhất, thứ hai và tương tác giữa 2 yếu
tố:
MSA MSB MSAB
F1 = ; F2 = & F3 =
MSE MSE MSE
Kết quả phân tích phương sai 2 yếu tố:
Nguồn Tổng các độ Bậc tự Trung bình Giá trị kiểm
biến thiên lệch bình Do các độ lệch định
phương bình phương F

Yếu tố A SSA a-1 MSA MSA


MSE
Yếu tố B SSB b–1 MSB MSB
MSE
Tác động qua SSAB (a-1)(b-1) MSAB MSAB
lại(Tương tác) MSE
Sai số SSE ab(r-1) MSE

Tổng cộng SST n -1


Ví dụ tại lớp
Giám đốc vùng quyết định không chỉ đánh
giá sự khác nhau của những người vận chuyển
mà còn xác định trọng lượng của gói bưu kiện
< 10 kg và ≥ 10 kg. Ông ta thực hiện một cuộc
thử nghiệm trong đó 4 người vận chuyển khác
nhau theo hợp đồng vận chuyển 5 gói bưu kiện
khác nhau trong mỗi 2 biến định danh về trọng
lượng
Thời gian vận chuyển bưu kiện với 2 dạng
trọng lượng
Trọng lượng Người vận chuyển
1 2 3 4
20.6 22.6 27.7 21.5
18.0 24.6 18.6 20.0
Dưới 10 kg 19.0 19.6 20.8 21.1
21.3 23.8 25.1 23.9
13.2 27.1 17.7 16.0

18.5 26.3 20.6 25.4


24.0 25.3 25.2 19.9
≥ 10 kg 17.2 24.0 20.8 22.6
19.9 21.2 24.7 17.5
18.0 24.5 22.9 20.4

Yêu cầu:
1. Thiết lập bảng phân tích phương sai
2. Kiểm định mức ý nghĩa 0.05 về các giả thuyết
1 2 3 4
20.6 22.6 27.7 21.5
18.0 24.6 18.6 20.0
19.0 19.6 20.8 21.1 422,2
< 10 kg 21.3 23.8 25.1 23.9 x1 
13.2 27.1 17.7 16.0 20
  109,9   102, 5  21,11
  92.1   117, 7
x11  18, 42 x12  23, 54 x13  21,98 x14  20, 5
18.5 26.3 20.6 25.4
24.0 25.3 25.2 19.9
17.2 24.0 20.8 22.6 438,9
≥ 10 kg 19.9 21.2 24.7 17.5 x 2 
18.0 24.5 22.9 20.4 20
 21,945
  97, 6   121, 3   114, 2   105,8
x 21  19, 52 x 22  24, 26 x 23  22,84 x 24  21,16
189, 7 239 224,1 208,3 861,1
x 1  x 2  x 3  x 4  x
10 10 10 10 40
 18,97  23,9  22, 41  20,83  21,5275
Ví dụ có bài giải: Nghiên cứu nhằm xem xét mối
liên hệ giữa năng suất (tạ/ha), loại phân bón và
giống lúa
Loại Giống lúa
phân bón A B C

1 65 68 62 69 71 67 75 75 78

2 74 79 76 72 69 69 70 69 65

3 64 72 65 68 73 75 78 82 80

4 83 82 84 78 78 75 76 77 75
Xử lý bằng SPSS 20.0:

Nhập dữ liệu
Analyze General linear models 
 Univariate:
Dependent List: nang suat
Fix Factors: pbon, glua (model mặc định là full
factorial với interaction
 Option để biết thống kê mô tả và
Homogeneity test (kiểm định tính đồng nhất của
phương sai)  Continue OK
Từ kết quả trên cho thấy:
1. Giả thuyết H0 cho rằng năng suất lúa là bằng
nhau với các giống lúa khác nhau bị bác bỏ ở
mức ý nghĩa lớn hơn 1,9%.

2. Giả thuyết H0 cho rằng năng suất lúa là bằng


nhau với các loại phân bón khác nhau bị bác bỏ
(giá trị p xem như bằng 0)
3. Giả thuyết H0 cho rằng không có sự tương tác
giữa giống lúa và loại phân bón bị bác bỏ (giá
trị p xem như bằng 0)
Kiểm định TUKEY
Kiểm định Tukey ở đây được dùng để xác định các
cặp trung bình tổng thể khác nhau theo yếu tố thứ
nhất (k nhóm) và yếu tố thứ hai (m nhóm).
Theo yếu tố A (a hàng):
MSE
T = qa ,a ,ab ( r- 1) ´
br
Theo yếu tố B (b cột):

MSE
T = qa ,b ,ab ( r - 1) ´
ar
Từ ví dụ trên, với: α=0,05; a=4;b=3; r=3,
MSE=6,111, tính tiêu chuẩn so sánh Tukey theo
giống lúa: 6,111
T = q0,05,3,24 ´ = 2, 519
12
x A = 72,8333; x B = 72 & x C = 75
Do đó:
D1 = x A - x B = 0,8333; D2 = x A - x C = 2,1667;

D3 = x B - x C = 3;
Chỉ có D3 > T, do đó có thể nói là giống lúa B và
C có năng suất khác nhau.
Sinh viên diễn giải kết quả trên
Sinh viên diễn giải kết quả trên
MANOVA
MANOVA tương tự ANOVA. Điểm khác biệt
là thay vì chỉ có một, Manova có từ hai biến phụ
thuộc định lượng trở lên.
MANOVA thích hợp khi 2 hay nhiều biến phụ thuộc
có mối liên hệ với nhau.
Nếu các biến phụ thuộc không có mối tương quan với
nhau, áp dụng ANOVA cho từng biến phụ thuộc là thích
hợp.
Manova cũng sẽ không thích hợp khi giữa các biến
phụ thuộc có mối tương quan quá mạnh vì gặp phải vấn đề
đa cộng tuyến.
Các giả định và điều kiện sử dụng MANOVA
(Multivariate Analysis of Variance)
- Biến độc lập là định tính, với ít nhất 2 trạng
thái (2 nhóm)
- Biến phụ thuộc là định lượng (thang đo
khoảng hoặc tỷ lệ), có phân phối chuẩn.
- Không có quá nhiều trị số bất thường.
- Phương sai giữa các nhóm là đồng nhất
(homogeneity of variance)
- Tương quan giữa các biến phụ thuộc là bằng
nhau giữa các nhóm.
- Không nên có quá nhiều biến phụ thuộc.
Phân tích MANOVA với SPSS
Analyze → General Linear Model → Multivariate
Từ Dependent Variables: Đưa vào 2 biến phụ thuộc
Từ Fixed Factors: Đưa vào 1 biến độc lập.
Từ Model: Chọn Full factorial (mặc định) → Continue
Chọn Post Hoc chuyển các biến độc lập sang hộp Post
Hoc Test for Tukey hay Bonferroni
Từ Aqual Variances Assumed (hay Games-Howell ở
Equal Variances Not Assumed, nếu kết quả kiểm định
cho thấy phương sai không bằng nhau) → Continue
Vào Options → Homogeneity Test → Continue → OK

You might also like