You are on page 1of 69

Analiza varijance

ANaliys Of VAriance

ANOVA
Analiza varijance
Upotrebljava se kada elimo utvrditi
postoji li razlika izmeu nekoliko
aritmetikih sredina
Primjenjiva kada imamo vie od dva
uzorka.
Normalnost raspodjele
ispituje se Kolmogorov-Smirnovljevim
testom ili nekim drugim ponuenim testom
P0,05 raspodjela je normalna
P0,05 raspodjela nije normalna
Homogenost varijanci
(homoscedascitet)
Varijanca = S2
varijance u ispitivanim skupinama moraju
biti sline
ispituje se statistikim testom Levenov test
P0,05 varijance su homogene
P0,05 varijance nisu homogene
Odabir statistikog testa?????
parametrijski testovi neparametrijski testovi

veliki uzorci mali uzorci (30)


normalna distribucija distribucija nije normalna
homogene varijance varijance nisu homogene
Analiza varijance
ANOVA

Jednosmjerna Dvosmjerna
(one-way) (two-way)
ANOVA ANOVA

Za nezavisne Za zavisne skupine


skupine (repeated measures ANOVA)
Uvjeti
Mjerena varijabla je normalno
distribuirana u svakoj populaciji
Distribucije populacija podjednako
variraju (homogenost varijance)
Uzorci izabrani iz populacija su
nezavisni
Razdvajanje varijabilnosti u dva dijela

Ukupna varijabilnost

Varijabilnost meu skupinama Varijabilnost unutar skupina


Between-group variation Within-group variation
izmeu grupa < unutar grupa
izmeu grupa > unutar grupa
izmeu grupa > unutar grupa
signifikantno!
Nul hipoteza

Aritmetike sredine populacija iz koje su uzeti uzorci su jednake.

H 0 : 1 2 3 ... n
H 0 : x1 x2 x3 ... xn
Postupak
Najprije treba izraunati aritmetike
sredine uzorka i totalnu aritmetiku
sredinu
Zatim varijabilnosti izmeu skupina
(uzoraka) i unutar skupina.
Vidjeti koja je varijabilnost vea i
izvesti zakljuak
Zadatak
Dvadeset uenika jednog razreda I II III IV
podijeljeno je u etiri skupine po
pet uenika. Svaka skupina
koristila je razliitu metodu u 1. 2 3 6 5
savladavanju gradiva kvadratne
funkcije. Prvoj skupini je 2. 3 4 8 5
objanjavao nastavnik, druga je
sama uila iz udbenika, trea 3. 1 3 7 5
skupina je koristila raunalni
program, a etvrtoj je prikazan
4. 3 5 4 3
video materijal. Nakon
savladavanja gradiva uenici su
rijeili ispit u kojem su pokazali 5. 1 0 10 2
to su nauili.
U slijedeoj tablici su dani bodovi 10 15 35 20
na testu. Moe li se prihvatiti
pretpostavka kako ne postoji
razlika meu metodama uenja?
GRAND TOTAL (GT)

GT
X
2

N
N = 20

X 10 15 35 20 80
2
80
GT 320
20
TOTALNA SUMA KVADRATA (SStot) i
STUPNJEVI SLOBODE (dftot )
S S to t X 2
GT
I II III IV
d f to t N 1 X1 X12 X2 X22 X3 X32 X4 X42
1. 2 4 3 9 6 36 5 25
2. 3 9 4 16 8 64 5 25
3. 1 1 3 9 7 49 5 25
4. 3 9 5 25 4 16 3 9
5. 1 1 0 0 10 100 2 4
10 24 15 59 35 265 20 88
X 2
24 59 265 88 436
SS tot 436 320 116

d f to t N 1 2 0 1 1 9
SUMA KVADRATA MEU GRUPAMA
(SSbg) i STUPNJEVI SLOBODE (dfbg)

SS bg
X X
1
2
2
2

...
X n
2

GT
N1 N2 Nn
d f bg k 1
SS Effect i df Effect
SUMA KVADRATA MEU GRUPAMA (SSbg)

2 2 2 2
10 15 35 20
SS bg 320
5 5 5 5
100 225 1225 400
320
5 5 5 5
20 45 245 80 320 70
d fbg 4 1 3
SUMA KVADRATA UNUTAR GRUPA
(SSwg) I STUPNJEVI SLOBODE (dfwg)
za prvu grupu SS wg1 X 2

X 1
2

1
N1

za drugu grupu SS wg2 X 2



X 2
2

2
N2

za n - tu grupu SS wgn X 2

X n
2

n
Nn

df wg N k
SS wg1 X 2

X 1
2

24
102
4
1
N1 5

SS wg2 X 2

X 2
2

59
152
14
2
N2 5

SS wg3 X 2

X 3
2

265
35 2
20
3
N3 5

SS wg4 X 2

X 4
2

88
202
8
4
N4 5
SS wg 4 14 20 8 46
df wg 20 4
VARIJANCA

sum a k v adrata
v arijanca
stupnjev i slobode
SS bg
varijancabg
df bg
SS wg
varijancawg
df wg
SS bg 70
varijancabg 23,33
df bg 3
SS wg 46
varijancawg 2,875
df wg 16
Varijabilitet meu grupama vei je od
varijabiliteta unutar grupa. Je li razlika
statistiki znaajna??
SNEDECOROVE F-tablice

varijancabg
F F
23 ,3
8 ,11
varijanca wg 2 ,875
Usporedimo F sa Fg iz tablice L.
3
16 3,24
F > Fg grupe ne pripadaju istoj populaciji P < 0,05.
Odbacujemo nul hipotezu.
F Fg grupe pripadaju istoj populaciji P 0,05.
Prihvaamo nul hipotezu.
F je vee od Fg iz ega slijedi da nae grupe
ne pripadaju istoj populaciji.
Jedino u to moemo biti sigurni da se
barem dvije grupe razlikuju statistiki
znaajno.
Kako bi odredili koje se sredine razlikuju
znaajno upotrijebiti emo post hoc
Scheffeov test
Levene Test of Homogeneity of Variance s (Spreadsheet1)
Marked effects are significant at p < ,0500 0
SS df MS SS df MS F p
Variable Effect Effect Effect Error Error Error
bodovi 1,600000 3 0,533333 15,60000 16 0,975000 0,547009 0,657259

Tests of Normality (podaci)


N max D K-S Lilliefors
Variable p p
1 5 0,241345 p > .20 p > .20
2 5 0,300000 p > .20 p < ,15
3 5 0,127360 p > .20 p > .20
4 5 0,360250 p > .20 p < ,05
suma
kvadrata stupnjevi suma varijanca
stupnjevi
meu slobode varijanca kvadrata slobode
grupama unutar
grupa
Grafiki prikaz
10

6
BODOVI

0 Mean
1 2 3 4
MeanSE
GRUPE Mean1,96*SE
POST HOC
SCHEFFE TEST
Ne dolazi u obzir upotreba niza t
testova jer se poveava vjerojatnost
pojavljivanja sluajno znaajnih t-
omjera
Za svaki par aritmetikih sredina

F
X
Xba
2

v arijanca wg N a N b / N a N b
X 1 i X 2 F12
2 3 2

1
0,86
2,9 10 / 25 1,16

X 1 i X 3 F13
2 7
2

25
21,55*
2,9 10 / 25 1,16

X 1 i X 4 F14
2 4 2
4
3,45
2,9 10 / 25 1,16

X 2 i X 3 F23
3 7 2
16
13,79 *
2,9 10 / 25 1,16

X 2 i X 4 F24
3 4 2
1
0,86
2,9 10 / 25 1,16

X 3 i X 4 F34
7 4 2
9
7 ,76
2,9 10 / 25 1,16
Iz F-raspodjele (tablica L) oitavamo granini F
za eljenu razinu znaajnosti

SS brojnika
3
SS nazivnika 16 3,24
Oitani F pomnoi se sa (k-1) i tako se dobije
nova granina vrijednost F'
3,24*(4 - 1)=9,72
Usporedimo F koji smo izraunali sa F'
F > F' razlika je znaajna
F F' razlika je sluajna
Znaajne su razlike izmeu prve i
tree , kao i druge i tree
aritmetike sredine P<0,05

Scheffe Test; Variable: BODOVI (ANOV A.sta)


Marked differences are significant at p < ,05000
{1} {2} {3} {4}
GRUP E M=2,0000 M=3,0000 M=7,0000 M=4,0000
1 {1} 0,832074 0,002749 0,355850
2 {2} 0,832074 0,016180 0,832074
3 {3} 0,002749 0,016180 0,087381
4 {4} 0,355850 0,832074 0,087381
Analiza varijance
ANOVA

Jednosmjerna Dvosmjerna
(one-way) (two-way)
ANOVA ANOVA

Za nezavisne Za zavisne skupine


skupine (repeated measures ANOVA)
Jednosmjerna analiza varijance
primjenjuje se kada usporeujemo rezultate
jedne zavisne varijable unutar jedne nezavisne
varijable koja ima vie kategorija
primjer: provedeno je istraivanje o utjecaju
puenja cigareta majki na masu novoroene
djece;
majke su, s obzirom na broj popuenih cigareta,
podijeljene u tri skupine: ne pue, pue malo,
pue puno
zavisna varijabla
nezavisna varijabla
(3 kategorije puaa)
masa djece
ne pue
(grama)
malo pue
puno pue
Odnos majke prema puenju u trudnoi F(2, 33)=9,1824, p=,00068
4000
ne pui pui malo pui puno
R.br. masa djeteta/g masa djeteta/g masa djeteta/g 3800

1. 3515 3444 2608


3600
2. 3420 3827 2509
3. 3400

Masa djeteta / g
3175 3884 3600
4. 3586 3515 1730 3200
5. 3232 3416 3175
3000
6. 3884 3742 3459
7. 3856 3062 3288 2800

8. 3941 3076 2920


2600
9. 3232 2835 3020
2400
10. 4054 2750 2778 ne pui pui malo pui puno
11. 3459 3460 2466 Odnos majke prema puenju u trudnoi

12. 3998 3340 3260

F = 9,1824 P < 0,001

zakljuak: postoji statistiki znaajna razlika u masi djece s


obzirom na to jesu li njihove majke puile u trudnoi puno, malo ili
nisu puile
Deskriptivni podatci

odnos prema puenju; Unweighted Means (trudnice.sta)


Current effect: F(2, 33)=9,1824, p=,00068
Effective hypothesis decomposition
odnos prema masa djeteta masa djeteta masa djeteta masa djeteta N
Cell No. puenju Mean Std.Err. -95,00% +95,00%
1 ne pui 3612,667 119,1285 3370,298 3855,035 12
2 pui malo 3362,583 119,1285 3120,215 3604,952 12
3 pui puno 2901,083 119,1285 2658,715 3143,452 12
Post-hoc
Scheffe test; variable masa djeteta (trudnice.sta)
Probabilities for Post Hoc T ests
Error: Between MS = 1703E2, df = 33,000
odnos prema {1} {2} {3}
Cell No. puenju 3612,7 3362,6 2901,1
1 ne pui 0,344206 0,000800
2 pui malo 0,344206 0,034025
3 pui puno 0,000800 0,034025

Bonferroni tes t; variable mas a djeteta (trudnice.s ta)


Probabilities for Pos t Hoc Tes ts
Error: Between MS = 1703E2, df = 33,000
odnos prema {1} {2} {3}
Cell No. pu enju 3612,7 3362,6 2901,1
1 ne pu i 0,441570 0,000533
2 pu i malo 0,441570 0,029557
3 pu i puno 0,000533 0,029557
Zavisni uzorci
primjer: Istraivan je uinak novog lijeka kod anksioznih
poremeaja. Mjerenja su izvrena na 7 pacijenata prije,
nakon tjedan dana i nakon dva tjedna uzimanja lijeka.
Anksioznost je ocjenjivana na skali od 1 do 10.
nakon nakon
rb. prije tjedan dva
dana tjedna
1. 9 7 4
2. 8 6 3
3. 7 6 2
4. 8 7 3
5. 8 8 4
6. 9 7 3
7. 8 6 2
Mora biti zadovoljena
sferinost - varijance razlike
izmeu svih skupina su
podjednake
Mauchley Sphericity Test (Spreadsheet1)
Sigma-restricted parameterization
Effective hypothesis decomposition
Effect W Chi-Sqr. df p
R1 0,750000 1,438410 2 0,487139
Repeated Measures Analysis of Variance (Spreadsheet1) Bonferroni test; variable DV_1 (Spreadsheet1)
Sigma-restricted parameterization Probabilities for Post Hoc T ests
Effective hypothesis decomposition Error: Within MS = ,22222, df = 12,000
R1 {1} {2} {3}
SS Degr. of MS F p Cell No. 8,1429 6,7143 3,0000
Effect Freedom 1 1 0,000312 0,000000
Intercept 744,0476 1 744,0476 585,9375 0,000000 2 2 0,000312 0,000000
Error 7,6190 6 1,2698 3 3 0,000000 0,000000

MJER 98,6667 2 49,3333 222,0000 0,000000


Error 2,6667 12 0,2222
F = 222 P << 0,001

zakljuak: postoji statistiki znaajna razlika u ocijeni


anksioznosti kod promatrane skupine pacijenata s
obzirom na vrijeme koritenja novog lijeka
Dvosmjerna analiza varijance
pripada multivarijatnoj analizi podataka
koristi se u istraivanjima koja imaju vie od
jedne nezavisne varijable ispituje njihov
utjecaj na zavisnu varijablu koja je kvantitativna
ispituje se i meusobna interakcija izmeu
nezavisnih varijabli
primjer:
provedeno je istraivanje utjee li puenje na masu
novoroenadi (majke: ne pue, pue malo, pue puno)
istovremeno se istrauje postoji li moda utjecaj mase
trudnica prije poroda na masu novoroenadi
trudnice su podijeljene u tri skupine s obzirom na masu
prije poroda
Primjer
nezavisna varijabla- puenje
odnos majke prema puenju u trudnoi

masa trudnice ne pui pui malo pui puno


/ kg
masa djeteta/g masa djeteta/g masa djeteta/g

3 175 2 750 1 730


3232 3 076 2608
45-54
3420 3062 2509
nezavisna 3 232 2 835 2 466
varijabla 3 515 3460 3175
masa
trudnice 3586 3340 2920
55-64
3856 3416 3020
3 459 3444 2778
3 884 3827 3600
3941 3884 3459
65-74
4054 3515 3288
3998 3742 3260
REZULTATI
F = 44,073 P < 0,05
Faktor 1 (nezavisna varijabla)-puenje utjee statistiki znaajno na
masu djeteta
odnos prema puenju; LS Means
Current effect: F(2, 27)=44,073, p=,00000
3900

3800

3700

3600

3500

3400
masa djeteta

3300

3200

3100

3000

2900

2800

2700

2600
ne pui pui malo pui puno
odnos prema puenju
F = 63,362 P < 0,05
Faktor 2 (nezavisna varijabla) - masa majke takoer utjee
znaajno na masu djeteta

masa trudnica; LS Means


Current effect: F(2, 27)=63,362, p=,00000
4000

3800

3600
masa djeteta

3400

3200

3000

2800

2600
45-54 55-64 65-74
masa trudnica
F = 1,166 P > 0,05
Faktor interakcije nije statistiki znaajan
odnos prema puenju*masa trudnica;
Current effect: F(4, 27)=1,1663, p=,34758
4500

4000

3500
masa djeteta

3000

2500

2000
masa trudnica
45-54
1500 masa trudnica
ne pui pui malo pui puno 55-64
masa trudnica
odnos prema puenju 65-74
Anova

PARAMETRIJSKI NEPARAMETRIJSKI
TESTOVI TESTOVI

NEZAVISNI ANOVA ( one-way) Kruskal-Wallis test

ZAVISNI ANOVA RM Friedman test


Friedman ANOVA
Ispitivanjem brzine obrade numerikih postupaka (A, B, C, D)
pomou pet razliitih programskih paketa istog tipa dobiveni su
rezultati (s) koji su navedeni u tablici

program A B C D
I 19 21 18 16
II 20 17 22 19
III 21 18 20 15
IV 17 15 24 24
V 17 22 25 19

Ispitajte razliku u efikasnosti obrade.


Rezultat i grafiki prikaz
Friedman ANOV A and Kendall Coeff. of Concordance (Spreadsheet1)
ANOV A Chi S qr. (N = 5, df = 3) = 3,367347 p = ,33838
Coeff. of Concordance = ,22449 Aver. rank r = ,03061
Average Sum of Mean Std.Dev.
Variable Rank Ranks
A 2,600000 13,00000 18,80000 1,788854
B 2,200000 11,00000 18,60000 2,880972
C 3,300000 16,50000 21,80000 2,863564
D 1,900000 9,50000 18,60000 3,507136

Box & Whisker Plot


26

24

22

20

18

16

Median
14 25%-75%
A B C D Min-Max
post-hoc analiza
post-hoc analizom se utvruje izmeu
kojih skupina postoji znaajna razlika
koristi se Wilcoxonov test uz podeavanje
razine statistike znaajnosti
P se korigra ovisno o broju skupina

0,05
P
N
Kruskal-Wallis test
Vrijednosti Vrijednosti Vrijednosti Vrijednosti
skupine skupine skupine skupine
VEGF R2 VEGF R2 VEGF R2 VEGF R2
1 118,347 1 658,06 2 133,55 3 52,539
1 189,453 1 395,16 2 135,16 3 78,172
1 268,921 1 358,19 2 52,12 3 49,35
1 885,681 1 621,13 2 65,11 3 90,65
1 425,659 1 220,43 2 88,35 3 44,84
1 777,1 2 103,21 2 81,12 3 99,83
1 108,032 2 49,68 2 550,65 3 94,52
1 320,411 2 78,39 2 227,42 3 40,01
1 520,75 2 100,32 2 257,42 3 71,34
1 300,111 2 57,74 2 521,29 3 29,11
1 658,39 2 18,71 3 2,172 3 95,17
1 879,35 2 86,77 3 84,412
1 230,65 2 94,19 3 82,336
1 394,19 2 160,65 3 31,995
1 314,52 2 88,71 3 65,805
Krus kal-Wallis ANOVA by Ranks ; vrijednos ti VEGEF R2 (tablica.sta)
Independent (grouping) variable: s kupine
Krus kal-Wallis tes t: H ( 2, N= 56) =33,53722 p =,0000
Depend.: Code Valid Sum of Mean
vrijednosti VEGEF R2 N Ranks Rank
1 1 20 887,0000 44,35000
2 2 20 493,0000 24,65000
3 3 16 216,0000 13,50000

Multiple Comparis ons p values (2-tailed); vrijednos ti VEGEF R2 (tablica.s ta)


Independent (grouping) variable: s kupine
Krus kal-Wallis tes t: H ( 2, N= 56) =33,53722 p =,0000
Depend.: 1 2 3
vrijednosti VEGEF R2 R:44,350 R:24,650 R:13,500
1 0,000401 0,000000
2 0,000401 0,124574
3 0,000000 0,124574
RM ANOVA
Primjer
Kod deset ispitanika koji su svrstani u dvije skupine
(1 i 2) uinjena su tri mjerenja u razmaku od pola
sata. Postoji li znaajna razlika meu skupinama
u rezultatima koji su ovisni o vremenu?
mjerenje 1 mjerenje 2 mjerenje 3 skupine
1814,29 1331,67 2,172 1
1630,71 945,01 84,412 1
545,71 421,67 82,336 1
1997,14 1864,34 31,995 1
1982,14 1346,67 65,805 2
1411,43 438,33 52,539 2
1997,14 1865,01 78,172 2
1120,12 975,34 49,35 2
1125,34 634,34 90,65 1
980,11 723,99 44,84 1
1. Za nenumerike podatke vrijedi:
A. mjerljivi su
B. imaju mjernu jedinicu
C. mogu biti kontinuirani i diskontinuirani
D. opisani su bez mjerne jedinice
E. mogu biti samo diskretni
(2)

2. Student je uz pomo mikrometarskog vijka mjerio debljinu vlasi. Dobio je slijedei niz
mjerenja izraenih u mikrometrima: 8; 8,5; 8,5; 9; 9; 9; 9; 9,5;9,5;10. Odredite mod i raspon.
A. 16
B. 8
C. 9
D. 2
E. 9,5
(2)

3. Sto studenata je testirano testom znanja koji se rasporeuje po normalnoj raspodjeli.


Aritmetika sredina bodova na testu je 340, dok standardna devijacija iznosi 16. Zaokruite
interval u kojem se nalaze bodovi za 95% studenata.
A. 324-354
B. 292-288
C. 308-372
D. 300-400
E. 310-380
(1)
4. t testom za aritmetiku sredinu emo provjeriti znaajnost razlike:
A. u bodovima dobivenim na ovom testu izmeu studenata i studentica
B. u prolaznosti ovog ispita izmeu studenata i studentica
C. uestalosti tonog odgovora na ovo pitanje izmeu studenata i studentica
D. u dobi izmeu studenata koji su pali i onih koji su proli
E. u prolaznosti ovog testa izmeu starijih i mlaih od 21 godinu
(2)

5. U jednom ispitivanju djelovanja vitamina C na pojavu prehlade kod djece zapaeno je da od 57


djece koja su redovito primala vitamin C od prehlade je oboljelo njih 36. U kontrolnoj skupini od 46
uenika iz iste kole, kojoj je umjesto C vitamina davana neaktivna tvar, od prehlade je oboljelo njih
35. Kako bi ispitali razlikuje li se broj djece oboljele od prehlade znaajno koristiti emo
A. t test za zavisne male uzorke
B. t test za nezavisne uzorke
C. hi kvadrat test za nezavisne uzorke
D. Test razlike proporcija
E. korelaciju
(2)

6. Kada je korelacija nepotpuna i negativna vrijedi (r je oznaka za koeficijent korelacije, a R za


koeficijent determinacije)
A. koeficijent smjera pravca regresije je pozitivan
B. koeficijent smjera pravca regresije je negativan
C. sve toke u scatter dijagramu lee na pravcu
D. r = -1
E. R>0
(2)
Hvala na pozornosti!

andrica.lekic@medri.uniri.hr

You might also like