You are on page 1of 34

CHƯƠNG

PHÂN TÍCH PHƯƠNG SAI

GV: Nguyễn Thảo Nguyên 1


Phân tích phương sai – Analysis of
Variance (ANOVA)
* Mđ cuối cùng : xem xét 1 hoặc 2 tiêu thức
nguyên nhân có ảnh hưởng hay không ảnh
hưởng đến 1 nhân tố kết quả.
• + 1 biến nguyên nhân ( định tính )   1 biến
ah

kết quả (định lượng ) : Phân tích phương sai 1


yếu tố (Anova single - factor)
• + 2 biến nguyên nhân ( định tính )   1 biến
ah

kết quả ( định lượng ) : Phân tích phương sai 2


yếu tố (Anova two - factor)

GV: Nguyễn Thảo Nguyên 2


Phân tích phương sai một yếu tố

Đặt giả thiết số trung bình mẫu của k tổ


bằng nhau
• H0 : µ1 = µ2 = … = µk
H1: Tồn tại một cặp trung bình tổng thể
có sự khác biệt
• Nếu bác bỏ H0 : biến nguyên nhân có ảnh
hưởng đến biến kết quả.
• Ngược lại.

GV: Nguyễn Thảo Nguyên 3


Phân tích phương sai một yếu tố
(One – way ANOVA)
TRÖÔØNG HÔÏP k TOÅNG THEÅ COÙ PHAÂN PHOÁI
CHUAÅN VAØ PHÖÔNG SAI BAÈNG NHAU
GOÏI n1, n2, ..., nk LAØ SOÁ QUAN SAÙT TÖØ k
TOÅNG THEÅ KHAÙC NHAU COÙ PHAÂN PHOÁI
CHUAÅN.
 1,  2 ,...,  k LAØ TRUNG BÌNH CUÛA CAÙC
TOÅNG THEÅ. MOÂ HÌNH PHAÂN TÍCH PHÖÔNG
SAI MOÄT YEÁU TOÁ MOÂ TAÛ DÖÔÙI DAÏNG KIEÅM
ÑÒNH GIAÛ THUYEÁT NHÖ SAU:
H0:  1 =  2 = . . . = k
GV: Nguyễn Thảo Nguyên 5
THÖÏC HIEÄN CAÙC BÖÔÙC SAU:
BÖÔÙC 1: TÍNH CAÙC TRUNG BÌNH MAÃU
BAÛNG SOÁ LIEÄU TOÅNG QUAÙT THÖÏC HIEÄN PHAÂN
TÍCH PHÖÔNG SAI:

TOÅNG THEÅ
1 2 ... k
x11 x21 ... Xk1
x12 x22 ... xk1
... ... ... ...
x1n1 x2n2 ... xknk

GV: Nguyễn Thảo Nguyên 6


TÍNH TRUNG BÌNH MAÃU x1 , x 2 ,......, xk :
ni
 xij
j 1
xi  (i = 1,2,....,k)
ni
VAØ TRUNG BÌNH CHUNG CUÛA k MAÃU:
k
 n i xi
x  i k1
 ni
i 1

GV: Nguyễn Thảo Nguyên 7


BÖÔÙC 2 : TÍNH CAÙC TOÅNG CAÙC ÑOÄ LEÄCH BÌNH PHÖÔNG
 TOÅNG CAÙC ÑOÄ LEÄCH BÌNH PHÖÔNG TRONG NOÄI BOÄ
NHOÙM SSW:
ÑOÄ LEÄCH BÌNH PHÖÔNG CUÛA TÖØNG NHOÙM:
n1
NHOÙM 1: SS1 =  ( x1j  x1 ) 2
j 1
n2
NHOÙM 2: SS2 =  ( x 2j  x 2 ) 2
j 1
…………………

SSW = SS1 + SS2 + ... + SSk


k ni
Hay :SSW =   ( x ij  xi )
2
i  1 j 1

GV: Nguyễn Thảo Nguyên 8


 TOÅNG CAÙC ÑOÄ LEÄCH BÌNH PHÖÔNG GIÖÕA CAÙC
NHOÙM SSG :
k
SSG =  n i ( x i  x) 2
i 1
 TOÅNG CAÙC ÑOÄ LEÄCH BÌNH PHÖÔNG TOAØN BOÄ SST:
k ni
SST =   ( x ij x ) 2
i 1j1

SST = SSW + SSG

GV: Nguyễn Thảo Nguyên 9


BÖÔÙC 3: TÍNH CAÙC PHÖÔNG SAI (TRUNG BÌNH
CUÛA CAÙC ÑOÄ LEÄCH BÌNH PHÖÔNG)
 TÍNH PHÖÔNG SAI TRONG NOÄI BOÄ NHOÙM
SSW
MSW: MSW =
nk
 TÍNH PHÖÔNG SAI GIÖÕA CAÙC NHOÙM MSG:
SSG
MSG =
k 1
BÖÔÙC 4: KIEÅM ÑÒNH GIAÛ THUYEÁT
MSG
TÍNH: F=
MSW
NEÁU : F > F k  1, n  k ,  TA BAÙC BOÛ HO
GV: Nguyễn Thảo Nguyên 10
Phân tích phương sai một yếu tố
(One – way ANOVA)
Ví duï: Tröôøng phoå thoâng cô sôû A môøi 3
giaùo vieân boài döôõng cho 100 hoïc sinh döï
thi hoïc sinh gioûi tin hoïc. Choïn maãu 21
hoïc sinh trong 100 hs treân thi thöû vôùi keát
quaû nhö sau (thang ñieåm 100).
• Vôùi möùc yù nghóa 5% haõy kieåm ñònh xem
ñieåm thi cuûa hoïc sinh theo hoïc vôùi 3 giaùo
vieân treân coù khaùc?

GV: Nguyễn Thảo Nguyên 11


Phân tích phương sai một yếu tố
(One – way ANOVA)

ví dụ 1 Điểm
STT GV 1 GV 2 GV 3
1 79 71 83
2 86 77 69
3 94 81 71
4 89 83 77
5 90 79 55
6 85 76 68
7 87 82 73
GV: Nguyễn Thảo Nguyên 12
Phân tích phương sai một yếu tố
(One – way ANOVA)

• Ñaët giaû thuyeát: H0 : A = B = C :


điểm trung bình của các học sinh do
các giáo viên khác nhau hướng dẫn
là như nhau.
H1 : Tồn tại một cặp
trung bình tổng thể khác nhau

GV: Nguyễn Thảo Nguyên 13


Phân tích phương sai một yếu tố
(One – way ANOVA)
GV A GV B GV C Chung 3
(x1i) (x2i) (x3i) nhóm
Số mẫu quan 7 7 7 21
sát (ni)
Trug bình mẫu 87.143 78.429 70.857 78.810
(x )
i

Chênh lệch 130.86 103.71 452.86 687.43


bình phương SSW
nội bộ nhóm
(SSi)
Chênh lệch 486.11 1.02 442.68 929.81
bình phương SSG
giữa các nhóm
(SSGi)

GV: Nguyễn Thảo Nguyên 14


Baûng keát quaû ANOVA:
Nguoàn Toång caùc
bieán bình phöông
Baäc töï do
thieân ñoä leäch Phöông sai Tæ soá F
(Degree of
(Source ( Sum of (Mean Squares) (F ratio)
Freedom)
of Squares)
variation)
Giöõa caùc 929.81 2 464.90 12.17
nhoùm SSG (k-1) MSG 
SSG
k 1
F
MSG
MSW
(Between-
groups)
Noäi boä 687.43 18 38.19
nhoùm SSW (n - k) MSW 
SSW
nk
(Within-
groups)
Toaøn boä 1617.24 20
(Total) SST (n - 1)

GV: Nguyễn Thảo Nguyên 15


Phân tích phương sai một yếu tố
(One – way ANOVA)
• * Kieåm ñònh :
• F = 12.17 > F2, 18, 0.05 = 3.55
•  Keát luaän: Baùc boû H0

• Nhö vaäy, keát quaû ñieåm thi cuûa hs vôùi 3 giaùo


vieân khaùc nhau seõ khaùc nhau.

GV: Nguyễn Thảo Nguyên 16


Phân tích phương sai một yếu tố
(One – way ANOVA)
• ** Höôùng daãn: Phaân tích ANOVA baèng
coâng cuï Excel: Vaøo Tools – Data Analysis
 Anova: single factor

GV: Nguyễn Thảo Nguyên 17


Baûng keát quaû:
Anova: Single Factor

SUMMARY

Groups Count Sum Average Variance

GV A 7 610 87 22

GV B 7 549 78 17

GV C 7 496 71 75

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 929.81 2 465 12 0 3.6

Within Groups 687.429 18 38


Total 1617.24 20
GV: Nguyễn Thảo Nguyên 18
Phân tích phương sai một yếu tố
PHÂN TÍCH SÂU ANOVA
• Tröôøng hôïp baùc boû giaû thuyeát Ho, nghóa laø
trung bình cuûa caùc toång theå khoâng baèng
nhau. Vì vaäy, vaán ñeà tieáp theo laø phaân tích
saâu hôn ñeå xaùc ñònh nhoùm (toång theå) naøo
khaùc nhoùm naøo.

GV: Nguyễn Thảo Nguyên 19


PHÖÔNG PHAÙP TUKEY:
NEÁU COÙ k NHOÙM THÌ SOÁ LÖÔÏNG CAËP LAØ:
k! k (k  1)
Ck2  
2! (k  2)! 2
VÍ DUÏ: TA COÙ K = 3, THÌ SOÁ CAËP SO SAÙNH
TRONG KIEÅM ÑÒNH LAØ 3.
3!
C 23  3
2! ( 3  2)!
CAÙC GIAÛ THUYEÁT CAÀN KIEÅM ÑÒNH LAØ:
1. H0: 1   2 2. H0:  2   3 3. H0: 1   3
H1: 1   2 H1:  2   3 H1: 1   3

GV: Nguyễn Thảo Nguyên 20


GIAÙ TRÒ GIÔÙI HAÏN TUKEY ÑÖÔÏC TÍNH THEO
MSW
COÂNG THÖÙC: T  q, k , n  k
ni
TRONG ÑOÙ:
 q , k , n  k LAØ GIAÙ TRÒ TRA BAÛNG PHAÂN PHOÁI KIEÅM
ÑÒNH TUKEY (STUDENTIZED RANGE DISTRIBUTION)
 n LAØ TOÅNG SOÁ QUAN SAÙT MAÃU ( n   n i )
 MSW LAØ PHÖÔNG SAI TRONG NOÄI BOÄ NHOÙM
 ni LAØ SOÁ QUAN SAÙT TRONG 1 NHOÙM (TOÅNG THEÅ),
TRONG TRÖÔØNG HÔÏP MOÃI NHOÙM COÙ SOÁ QUAN SAÙT ni
KHAÙC NHAU, SÖÛ DUÏNG GIAÙ TRÒ ni NHOÛ NHAÁT

GV: Nguyễn Thảo Nguyên 21


Xét ví dụ trên
CAÙC GIAÛ THUYEÁT CAÀN KIEÅM ÑÒNH LAØ:
1.H0 : A = B 2.H0 : A = C 3.H0 : B = C
A≠ B A≠C B≠C

Tra bảng phân phối q (Phân phối Tukey)


q ;k ;n  k  q0.05;3;18  3.61
Tính giá trị tới hạn Tukey

MSW 38.19
T  q ;k ;n  k  3.61  8.43
ni 7
GV: Nguyễn Thảo Nguyên 22
Độ lệch tuyệt đối các cặp trung bình
mẫu

x A  xB  87.14  78.43  8.71  T

x A  xC  87.14  70.86  16.25  T

xB  xC  78.43  70.86  7.57  T

GV: Nguyễn Thảo Nguyên 23


TRÖÔØNG HÔÏP CAÙC TOÅNG THEÅ ÑÖÔÏC GIAÛ
ÑÒNH COÙ PHAÂN PHOÁI BAÁT KYØ (PHÖÔNG
PHAÙP PHI THAM SOÁ)
TRONG TRÖÔØNG HÔÏP NAØY TA COÙ THEÅ
CHUYEÅN ÑOÅI DÖÕ LIEÄU YEÁU TOÁ KEÁT QUAÛ TÖØ
DAÏNG ÑÒNH LÖÔÏNG VEÀ DAÏNG ÑÒNH TÍNH
(DÖÕ LIEÄU THÖÙ BAÄC) VAØ AÙP DUÏNG MOÄT KIEÅM
ÑÒNH PHI THAM SOÁ PHUØ HÔÏP LAØ KRUSKAL -
WALLIS.

GV: Nguyễn Thảo Nguyên 24


GIAÛ SÖÛ RAÈNG CHUÙNG TA COÙ CAÙC MAÃU NGAÃU
NHIEÂN ÑOÄC LAÄP GOÀM n1, n2...., nk QUAN SAÙT
TÖØ k TOÅNG THEÅ COÙ PHAÂN PHOÁI BAÁT KYØ. TA SÖÛ
DUÏNG KIEÅM ÑÒNH KRUSKAL –WALLIS BAÈNG
CAÙCH XEÁP HAÏNG CAÙC QUAN SAÙT MAÃU. MAËC DUØ
SOÁ QUAN SAÙT CUÛA nk MAÃU LAØ KHAÙC NHAU
NHÖNG KHI XEÁP HAÏNG THÌ ÑÖÔÏC SAÉP XEÁP MOÄT
CAÙCH LIEÂN TUÏC TÖØ NHOÛ ÑEÁN LÔÙN, NEÁU GIAÙ TRÒ
QUAN SAÙT TRUØNG NHAU THÌ HAÏNG GIOÁNG NHAU
BAÈNG CAÙCH DUØNG SOÁ TRUNG BÌNH COÄNG CAÙC
HAÏNG CUÛA CHUÙNG ÑEÅ CHIA ÑEÀU.
GV: Nguyễn Thảo Nguyên 25
ÑAËT n = n1+ n2 +.... + nk LAØ TOÅNG CAÙC QUAN SAÙT
THUOÄC CAÙC MAÃU, VAØ R1, R2, ...., RK LAØ TOÅNG CUÛA CAÙC
HAÏNG ÔÛ TÖØNG MAÃU ÑÖÔÏC XEÁP THEO THÖÙ TÖÏ CUÛA K
MAÃU. KIEÅM ÑÒNH GIAÛ THUYEÁT ÔÛ MÖÙC YÙ NGHÓA 
CHO TRÖÔØNG HÔÏP NAØY LAØ:
H0 :  1 =  2 = ... =  k : TRUNG BÌNH CUÛA K TOÅNG THEÅ
ÑEÀU BAÈNG NHAU. ÔÛ ÑAÂY TA SÖÛ DUÏNG BIEÁN W THAY
CHO TÆ SOÁ F TRONG PHAÀN TÍNH TOAÙN GIAÙ TRÒ KIEÅM
ÑÒNH.
12 k R2
W=  i  3(n  1)
n(n  1) i 1 n i
GIAÛ THUYEÁT H0 BÒ BAÙC BOÛ KHI:

W >  k  1, 
2

GV: Nguyễn Thảo Nguyên 26


STT GV A Hạng GV B Hạng GV C Hạng
1 79 11.5 71 17.5 83 7.5
2 86 5 77 13.5 69 19
3 94 1 81 10 71 17.5
4 89 3 83 7.5 77 13.5
5 90 2 79 11.5 55 21
6 85 6 76 15 68 20
7 87 4 82 9 73 16
Ri 32.5 84 114.5
GV: Nguyễn Thảo Nguyên 27
KHI GIAÛ THUYEÁT VEÀ TRUNG BÌNH CUÛA K TOÅNG THEÅ GIOÁNG
NHAU BÒ BAÙC BOÛ. TA DUØNG PHÖÔNG PHAÙP SO SAÙNH TÖÔNG
TÖÏ NHÖ PHÖÔNG PHAÙP TUKEY TRONG PHAÀN TRÖÔÙC. SAU
ÑAÂY LAØ TOÙM TAÉT CAÙC BÖÔÙC THÖÏC HIEÄN:

BÖÔÙC 1: TRÖÔÙC HEÁT CHUÙNG TA TÍNH HAÏNG TRUNG BÌNH


CHO TÖØNG NHOÙM MUOÁN SO SAÙNH THEO COÂNG THÖÙC
TOÅNG QUAÙT SAU :
Ri
Ri 
ni
BÖÔÙC 2: TIEÁP THEO CHUÙNG TA TÍNH CHEÂNH LEÄCH VEÀ
HAÏNG TRUNG BÌNH GIÖÕA 2 NHOÙM CAÀN SO SAÙNH
D ij  R i  R j
D ÑÖÔÏC COI NHÖ GIAÙ TRÒ ÑEÅ KIEÅM ÑÒNH GIAÛ THUYEÁT VEÀ
SÖÏ BAÈNG NHAU CUÛA TRUNG BÌNH HAI TOÅNG THEÅ i VAØ j
GV: Nguyễn Thảo Nguyên 28
BÖÔÙC 3 : TÍNH GIAÙ TRÒ GIÔÙI HAÏN CK THEO COÂNG
THÖÙC:
 1)  1
 n(n 1 
CK  ( k2  1,  )   
 12  n i n j 

TRONG ÑOÙ  k2  1,  LAØ GIAÙ TRÒ ÑAÕ SÖÛ DUÏNG KHI


THÖÏC HIEÄN KIEÅM ÑÒNH KRUSKAL –WALLIS
TRONG PHAÀN TRÖÔÙC.

BÖÔÙC 4 : NGUYEÂN TAÉC QUYEÁT ÑÒNH : BAÙC BOÛ


GIAÛ THUYEÁT H0 VEÀ SÖÏ BAÈNG NHAU CUÛA HAI
TRUNG BÌNH TOÅNG THEÅ KHI D > CK

GV: Nguyễn Thảo Nguyên 29


Xét ví dụ trên:
Giả sử tổng thể mẫu có phân phối bất kỳ, ta
sử dụng kiểm định Kruskal Wallis:
Ñaët giaû thuyeát: H0 : A = B = C : điểm
trung bình của các học sinh do các
giáo viên khác nhau hướng dẫn là
như nhau.
H1 : Tồn tại một cặp
trung bình tổng thể khác nhau
GV: Nguyễn Thảo Nguyên 30
STT GV A Hạng GV B Hạng GV C Hạng
1 79 11.5 71 17.5 83 7.5
2 86 5 77 13.5 69 19
3 94 1 81 10 71 17.5
4 89 3 83 7.5 77 13.5
5 90 2 79 11.5 55 21
6 85 6 76 15 68 20
7 87 4 82 9 73 16
Ri 32.5 84 115
GV: Nguyễn Thảo Nguyên 31
Tính đại lượng W:
12 k
Ri2
W  
n(n  1) i 1 ni
 3(n  1)

12  32.5 2
84 2
115 
2
W       3(21  1)  13.173
21(21  1)  7 7 7 
Tra bảng phân phối chi bình phương:
 2
k 1;  2
2; 0.05  5.99

Kết luận:
W  13.173   2
2; 0.05  5.99 Bác bỏ H0
GV: Nguyễn Thảo Nguyên 32
CAÙC GIAÛ THUYEÁT CAÀN KIEÅM ÑÒNH LAØ:
1.H0 : A = B 2.H0 : A = C 3.H0 : B = C
A≠ B A≠C B≠C

Tính hạng trung bình của từng nhóm:


R A 32.5
RA    4.64
nA 7
R B 84
RB    12
nB 7
RC 115
RC    16.4
nC 7

GV: Nguyễn Thảo Nguyên 33


Chênh lệch hạng trung bình từng nhóm
D A, B  4.64  12  7.36
D A,C  4.64  16.4  11.76
DB ,C  12  16.4  4.4
Tính giá trị tới hạn Ck:
 nn  1  1 1 
CK   2
K 1; 
   
 12  ni n j 

Vì số mẫu n của 3 nhóm bằng nhau:


 21(21  1  1 1 
C K  5.99     65.89  8.11
 12  7 7 

GV: Nguyễn Thảo Nguyên 34


Kết luận:

D A, B  7.36  C K  Chấp nhận H0


D A,C  11.76  C K Bác bỏ H0
DB ,C  4.4  C K  Chấp nhận H0

GV: Nguyễn Thảo Nguyên 35

You might also like