Professional Documents
Culture Documents
Analiza rasipanja
Analiza rasipanja ili analiza disperzija ili disperziona analiza ili analiza varijansi ili
analiza odstupanja je metod za razlučivanje ostvarenih (opserviranih) variranja (odstu-
panja, rasturanja,rasipanja, disperzije) u eksperimentalnim podacima u odnosu na izvore
variranja. Metod se sastoji u tome što se ukupne varijacije predstavljaju kao zbir vari-
jacija za koje se može odrediti izvor, odnosno uzrok ili faktor koji ih prouzrokuje i onih
za koje se ne može odrediti izvor.
Ako već treba dovesti u vezu različite delove sveukupne varijacije sa uzročnicima,
onda eksperiment mora da bude projektovan tako da se ovo povezivanje obavi na logički
strog način.
Metod je razvio Fišer i izložio ga 1923. godine.
Okosnica ovog metoda je statistika Q koja se koristi u ocenjivanju disperzije obeležja:
n
X
Q= (Xi − X n )2
i=1
Primer 9. Na tržištu se nude tri kvaliteta kafe: minas, santos i afrička vrsta. Statistič-
kim postupkom na osnovu eksperimenta sprovedenog u više gradova treba utvrditi da li
27
28 GLAVA 2. ANALIZA RASIPANJA
će vrsta kafe uticati na prihod ostvaren prodajom kafe (ukoliko je cena svih vrsta kafe
ista).
Dakle, posmatra se jedan kvalitativni faktor – vrsta kafe (na tri različita nivoa), na
slučajni ishod eksperimenta – prihod.4
Primer 10. Eksperimentom treba utvrditi dozu leka u mg koju treba primenjivati u
terapiji odredjene bolesti kod pacijenata.
Ovde posmatramo kvantitativni faktor – doza leka, na slučajni ishod eksperimenta
– poboljšanje stanja pacijenta u posmatranoj bolesti.4
H0 (µ1 = µ2 = . . . = µk = 0)
ili direktno
H0 (m1 = m2 = . . . = mk ),
protiv alternative
H1 (∃j; j ∈ {1, 2, . . . , k}, µj 6= 0)
odnosno
H1 (∃j, l; j, l ∈ {1, 2, . . . , k}, mj 6= ml ).
Kako se matematičko očekivanje može da oceni sredinom uzorka, uvode se statistike:
(n − k)Qs
Fk−1, n−k =
(k − 1)Qu
ima Fišerovu raspodelu sa (k −1, n−k) stepeni slobode. Ako se za realizovani uzorak (xj1 ,
xj2 , . . ., xjnj ), j = 1, 2, . . . , k realizovana vrednost statistike Fk−1, n−k označi sa fk−1, n−k ,
a kvantil reda 1 − α slučajne promenljive sa Fk−1, n−k raspodelom označi sa Fk−1, n−k; 1−α ,
najbolja kritična oblast veličine α je
H0 H1 C
µ1 = µ2 = . . . = µk = 0 ∃j, j ∈ {1, 2, . . . , k}, fk−1, n−k ≥ .
µj 6= 0 Fk−1, n−k; 1−α
Primer 11. Data je tabela uspeha 20 ispitanika koji su bili podeljeni u 4 grupe. Svaku
od grupa podučavao je po jedan instruktor. Po obavljenoj obuci ispitanici su bili testirani,
a rezultati koje su pokazali predstavljeni su tabelom:
postupkom o kome je bilo reči u delu 2, poglavlje ??, da bi se utvrdilo koji nivoi posma-
tranog faktora utiču na obeležje X. Treba napomenuti da postoje i preciznije metode za
proveru ovih relacija od t–testa obradjenog u pomenutom poglavlju.
Primer 12. Prilikom ispitivanja da li buka utiče na pamćenje, učenici jednog odeljenja su
dobili da uče jedan tekst koji je trebalo da reprodukuju posle izvesnog vremena. Dobijeni
su sledeći rezultati procenata zapamćenog materijala:
A ↓ \B → 1 2 ... l
1 X11 X12 ... X1l X 1•
2 X21 X22 ... X2l X 2•
.. .. .. .. .. ..
. . . . . .
k Xk1 Xk2 ... Xkl X k•
X •1 X •2 ... X •l X
gde je Xij vrednost obeležja X na elementu uzorka izloženom i–tom nivou faktora A i
j–tom nivou faktora B. Dakle, svaki ukršteni nivo (i, j) ispitivanih faktora primenjuje se
na tačno jedan element uzorka.
Za definisanje modela koriste se sledeće oznake. Kao i kod jednofaktorskog problema,
m = E(X), a zatim, mi• = E(Xij ), j = 1, 2, . . . , l, m•j = E(Xij ), i = 1, 2, . . . , k, tj. mi•
je matematičo očekivanje obeležja X u populaciji koja je od faktora A izložena samo
i–tom nivou, a m•j je matematičko očekivanje obeležja X u populaciji koja je od faktora
B izložena samo j–tom nivou. Sa µi = mi• − m označava se efekat i–tog nivoa faktora A,
a sa νj = m•j − m efekat j–tog nivoa faktora B.
Matematički linearni model dvofaktorske analize disperzija na prostom uzorku je
Xij = m + µi + νj + εij ,
gde su εij nezavisne identički raspodeljene N (0, σ 2 ) slučajne promenljive, pri čemu je σ 2
nepoznato. U okviru ovog modela testiraju se sledeće nulte hipoteze:
32 GLAVA 2. ANALIZA RASIPANJA
• H1AB (∃(i, j) tako da (i, j) ∈ {1, 2, . . . , k} × {1, 2, . . . , l}, (µi , νj ) 6= (0, 0)).
Za sprovodjenje testova potrebne su sledeće statistike:
• sredina (celog) uzorka
k X l
1 X
X= Xij ,
kl i=1 j=1
(k − 1)(l − 1)QA
Fk−1,(k−1)(l−1) = ,
(k − 1)QS
(k − 1)(l − 1)QB
Fl−1,(k−1)(l−1) = ,i
(l − 1)QS
(k − 1)(l − 1)(QA + QB )
Fk+l−2,(k−1)(l−1) = ,
(k + l − 2)QS
imaju Fišerove raspodele sa naznačenim brojem stepeni slobode. Ako se, kao i kod jed-
nofaktorske analize, koriste oznake
H0 H1 C
µ1 = µ2 = . . . ∃i, i ∈ {1, 2, . . . , k}, fk−1,(k−1)(l−1) ≥
. . . = µk = 0 µi 6= 0 Fk−1,(k−1)(l−1); 1−α
ν1 = ν2 = . . . ∃j, j ∈ {1, . . . , l}, fl−1,(k−1)(l−1) ≥
.
. . . = νl = 0 νj 6= 0 Fl−1,(k−1)(l−1); 1−α
∃(i, j), (i, j) ∈
µ1 = . . . = µk = {1, . . . , k} × {1, . . . , l} fk+l−2,(k−1)(l−1) ≥
= ν1 = . . . = νl = 0 ∧(µi , νj ) 6= (0, 0) Fk+l−2,(k−1)(l−1); 1−α
Primer 13. Ispituje se da li buka i vrsta teksta utiču na pamćenje učenika. Dobijeni su
sledeći procenti zapamćenog materijala:
Suma kvadrata f
QA = 1922 80,083
QB = 949, 5 13,188
QS = 72 ///
34 GLAVA 2. ANALIZA RASIPANJA
Za prag značajnosti 0,05 granica kritične oblasti je kvantil F1,3;0,95 = 10, 1. S obzirom na
realizovanu vrednost test statistike 80,083 , H0A se odbacuje, tj. može se zaključiti da
buka utiče na pamćenje učenika.
Što se tiče druge nulte hipoteze vezane za vrstu teksta, zna se da je F3,3;0,95 = 9, 28
i kako je realizovana vrednost test statistike jednaka 13,188 , to se i druga nulta hipoteza
odbacuje, tj. može da se zaključi da pamćenje učenika zavisi i od vrste materijala koji se
uči.
Za treću hipotezu je F4,3;0,95 = 9, 12 i kako je realizovana vrednost odgovarajuće test
statistike jednaka 29,911 , to se i treća nulta hipoteza odbacuje, tj. zaključuje se da buka
i vrsta materijala koji se uči itekako utiču na pamćenje učenika.
Zadržaćemo se ovde kratko na redosledu kojim smo vršili testiranje. U radu smo
koristili redosled navodjenja hipoteza u prethodnom tekstu, medjutim, u praksi treba
činiti upravo obrnuto. Dakle, kod modela dvofaktorske analize na prostom uzorku, najpre
treba proveriti hipotezu H0AB , jer njenim prihvatanjem bismo istovremeno utvrdili da će
i H0A i H0B biti prihvaćene. Drugim rečima, H0A i H0B se proveravaju tek pošto se utvrdi
da H0AB treba odbaciti. 4
Dvofaktorski problem ispitivan na prostom uzorku ne omogućava ispitivanje med-
juzavisnosti dva ispitivana faktora. Testiranje medjuzavisnosti dva ispitivana kontrolisana
faktora vrši se na uzorku sa ponavljanjem.
A ↓ \B → 1 2 ... l
1 X111 X121 ... X1l1
X112 X122 ... X1l2
.. .. ..
. . ... .
X11r X12r ... X1lr
2 X211 X221 ... X2l1
X212 X222 ... X2l2
.. .. ... .. .
. . .
X21r X22r ... X2lr
.. .. .. .. ..
. . . . .
k Xk11 Xk21 ... Xkl1
Xk12 Xk22 ... Xkl2
.. .. ... ..
. . .
Xk1r Xk2r ... Xklr
2.2. DVOFAKTORSKI PROBLEM 35
ηij = mij − (m + µi + νj )
i važi
k
X l
X k
X l
X
µi = νj = ηij = ηij = 0.
i=1 j=1 i=1 j=1
k X
X l
=r (X ij − X i• − X •j + X)2 ,
i=1 j=1
Očigledno je
Q = QA + QB + QI + QS .
Pod uslovom da su nulte hipoteze tačne, statistike
kl(r − 1)QA
Fk−1,kl(r−1) = ,
(k − 1)QS
kl(r − 1)QB
Fl−1,kl(r−1) = i
(l − 1)QS
kl(r − 1)QI
F(k−1)(l−1),kl(r−1) =
(k − 1)(l − 1)QS
imaju Fišerove raspodele sa naznačenim brojem stepeni slobode. Za realizovane vrednosti
poslednjih statistika, najbolje kritične oblasti veličine α su:
2.2. DVOFAKTORSKI PROBLEM 37
H0 H1 C
µ1 = µ2 = . . . ∃i, i ∈ {1, 2, . . . , k}, fk−1,kl(r−1) ≥
. . . = µk = 0 µi 6= 0 Fk−1,kl(r−1); 1−α
ν1 = ν2 = . . . ∃j, j ∈ {1, 2, . . . , l}, fl−1,kl(r−1) ≥
. . . = νl = 0 νj 6= 0 Fl−1,kl(r−1); 1−α .
∀(i, j), ∃(i, j),
i = 1, 2, . . . , k; i ∈ {1, 2, . . . , k}, f(k−1)(l−1),kl(r−1) ≥
j = 1, 2, . . . , l, j ∈ {1, 2, . . . , l}, F(k−1)(l−1),kl(r−1); 1−α
ηij = 0 ηij 6= 0