You are on page 1of 9

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/304898221

Statistički putokazi: Analiza varijanse (ANOVA) ili planirana komparacija-


kako interpretirati podatke? Statistical guidelines: ANOVA vs planned
contrasts

Article · July 2016

CITATIONS READS

0 7,073

2 authors:

Haris Memisevic Inga Ibralic Biscevic


University of Sarajevo Herzegovina University
70 PUBLICATIONS   168 CITATIONS    26 PUBLICATIONS   30 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Executive functions in early primary school children View project

Risk factors for the occurrence of obesity among children with intellectual disabilities View project

All content following this page was uploaded by Haris Memisevic on 06 July 2016.

The user has requested enhancement of the downloaded file.


Statistički putokazi: Analiza varijanse (ANOVA) ili planirana komparacija- kako
interpretirati podatke?

dr.sc. Haris Memišević1


mr.sc. Inga Biščević2

Sažetak

Analiza varijanse (ANOVA) je jedna od najčešće korištenih statističkih metoda u društvenim


znanostima. Koristi se za utvrđivanje statistički značajnih razlika između tri ili više grupa
ispitanika na nekoj zavisnoj varijabli. Međutim, ponekad su ograničenja u Anovi prejaka da bi
se otkrile određene razlike u srednjim vrijednostima grupa. Alternativno, kada postoji a priori
predikcija gdje bi određene razlike između ispitanika mogle biti, može se koristiti planirana
komparacija. Cilj ovog rada je uporediti dva metoda za komparaciju srednjih vrijednosti
između tri i više grupa ispitanika, i to Anovu i planiranu komparaciju. Istraživačima se daju
preporuke koji je metod bolji i u kojim situacijama. Također, prikazan je i jedan primjer
baziran na fiktivnim podacima koji najbolje ilustruje razlike između dva pristupa problemu.
Kada istraživač ima ranije postavljenu hipotezu o trendu u razlikama tada je bolje koristi
planiranu komparaciju, a kada nema logički utemeljene pretpostavke u pravcima razlika tada
se preporučuje ANOVA, praćena post-hoc testovima.

Ključne riječi: Analiza varijanse (ANOVA), planirana komparacija, post-hoc testovi

UVOD

Kada želimo uporediti srednje vrijednosti dvije grupe ispitanika na nekoj kontinuiranoj
varijabli koristimo t-test, koji nam pokazuje da li postoje statistički značajne razlike u
srednjim vrijednostima ispitanika. No, šta uraditi kada imamo tri i više grupa ispitanika čije
srednje vrijednosti želimo uporediti i utvrditi postoje li statistički značajne razlike među
njima? Teoretski bi mogli uraditi više t-testova i tako doći do odgovora. No, na taj način
povećavamo vjerovatnoću da ćemo naći razlike i tamo gdje ih nema (Greška 1 u statistici-
više o ovom kasnije), tako da je upotreba t-testa u ovoj situaciji neprimjerena. Dakle, u
situaciji kada imamo tri ili više grupa ispitanika koje želimo da uporedimo na nekoj zavisnoj

1Dr.sc. Haris Memišević, docent, Pedagoški fakultet, Univerzitet u Sarajevu, Skenderija 72, Sarajevo,
hmemisevic@gmail.com
2Mr.sc. Inga Biščević, viši asistent, Fakultet Humanističkih Znanosti, Sveučilište Hercegovina, Kraljice mira 3,

Bijakovići, ibralic.inga@yahoo.com
varijabli tada je ispravno koristiti Analizu Varijanse (ANOVA). Anova je, uz t-test, najčešće
korištena parametrijska statistička metoda za testiranje hipoteza i najveći broj istraživanja u
oblasti društvenih znanosti upravo koristi Anovu. Tehnički govoreći analiza varijanse ispituje
veličinu varijabilnosti u zavisnoj varijabli i pokušava objasniti odakle dolazi taj varijabilitet
(3). Analiza varijanse (ANOVA) je uobičajen metod za poređenje srednjih vrijednosti za tri ili
više grupa ispitanika. Sam termin Analiza varijanse potiče od najpoznatijeg statističara 20-og
stoljeća Ronalda Fišera, koji ju je definisao kao odvajanje ukupne varijanse u sustavne
dijelove tako da se može odrediti udio svake komponente u ukupnoj varijansi (2). Rezultat
koji se dobije u Anovi označava se F-omjerom, i što je F-omjer veći, veća je vjerovatnoća da
srednje razlike u rezultatima nisu dobijene slučajno (4).
Postoje i određeni statistički preduslovi za korištenje Anove. Da bi se koristila Anova
potrebno je zadovoljiti određene preduvjete. Oni su opisani na web stranici
www.statistics.laerd.com:
1. Podaci za zavisnu varijablu moraju biti kontinuirani (mjereni na intervalnim ili
omjernim skalama). Ovdje želimo naglasiti da ima puno istraživača koji koriste Anovu
na ordinalnim podacima i stavovi statističara po ovom pitanju se razlikuju. Siguran
izbor je intervalna ili omjerna skala!
2. Nezavisna varijabla treba biti kategorijalna
3. Nezavisnost opservacija (različiti ispitanici u svakoj grupi)
4. Nema značajnih ekstremnih vrijednosti. Vrijednosti koje značajno odstupaju od
srednjih vrijednosti, preko 3 i više standardnih devijacija mogu značajno uticati na
Anovu.
5. Zavisna varijabla mora biti približno normalno distribuisana. Približna normalna
distribucija mora biti zastupljena u svim grupama nezavisne varijable.
6. Homogenost varijanse. Mora postojati približno jednak varijabilitet u rezultatima u
svim grupama ispitanika.

Iz ove liste se može vidjeti da postoji da za ispravno izvođenje Anove treba zadovoljiti brojne
kriterije. S pozitivne strane, uz pomoć većine statističkih paketa za obradu podataka (poput
SPSS, Statistica, SAS), veoma lako se izračunava provjera za pretpostavke 4,5 i 6.
Ranije je rečeno da nam Anova daje F-omjer i ako je taj omjer statistički značajan (p<0,05)
možemo zaključiti da između grupa ispitanika postoji statistički značajna razlika u srednjoj
vrijednosti zavisne varijable. Međutim ANOVA nam ne govori koje se grupe ispitanika
statistički razlikuju. Za to je potrebno uraditi tzv. Post-hoc testove. Ovi posthoc testovi su
slični t-testu, s tim što imaju puno strožiji kriterij za određivanje p vrijednosti. Navešćemo
kao primjer jednan od najpoznatijih post-hoc testova- Bonferroni testi (ili Bonferroni
korekcija). Bonferroni test „postrožava“ kriterij za vjerovatnoću tako što p vrijednost nije
postavljena na 0,05 nego 0,05/broj komparacija. Tako naprimjer ako ispitujemo razlike u
srednjim vrijednostima na zavisnoj varijabli između tri nezavisne grupe ispitanika,
Bonferroni postavlja limit statističke značajnosti na p<0,017 (0,05/3). Jasno je da se u ovim
situacijama povećava i mogućnost takozvane Greške 2 (Type 2 error) tj. pogrešan zaključak
istraživača da nema razlika tamo gdje one postoje. Na dodiplomskim studijama, u okviru
kolegija statistika, ovom konceptu Grešaka 1 i 2 se pridaje veliki značaj. Čitaoce ovog rada
ilustrativno podsjećamo šta su to greške 1 i 2 u statistici (Type 1 i Type 2 Errors) (Slika 1).

Slika 1. Primjer grešaka tipa 1 i 2 u statistici

Jedan od načina da smanjimo vjerovatnoću greške 2 u ovoj situaciji je taj da koristimo


planirano poređenje. Planirano poređenje se koristi kada unaprijed predvidimo gdje bi razlike
između grupa mogle da budu. Dakle ova vrsta testa se koristi kada želimo da ispitamo
potencijalne razlike među grupama ispitanika, koristeći unaprijed definisane kriterije za
komparaciju. Ovaj test je puno osjetljiviji za detekciju razlika među grupama, a istovremeno
puno bolje od t-testa smanjuje mogućnost Greške 1 (1).

S obzirom da se najbolje uči kroz primjere, ovdje ćemo ilustrirati jedan (fiktivni) primjer koji
pokazuje superiornost planirane komparacije u odnosu na Anovu u utvrđivanju razlika između
ispitanika na zavisnoj varijabli.

Predavače Memišević i Biščević zanima da li se studenti prve tri godine fakulteta razlikuju u
znanju iz predmeta Specijalna edukacija (koji se sluša na prvoj i drugoj godini studija) i da li
postoje statističke razlike u rezultatima na testu iz pomenutog kolegija.
Dakle, cilj istraživanja je utvrditi da li postoje statistički značajne razlike u znanju iz predmeta
Specijalne edukacije između studenata prve, druge i treće godine fakulteta. Zavisna varijabla
u ovom istraživanju je broj osvojenih bodova na testu iz Specijalne edukacije, a nezavisna
varijabla je godina studija. S obzirom da poredimo tri grupe ispitanika, nezavisna varijabla
ima tri kategorije (studenti prve, druge i treće godine studija). Ispravno zaključujemo da bi za
ovaj tip ispitivanja trebalo koristiti Anovu.
Nulta hipoteza u ANOVI je da se različite grupe ispitanika ne razlikuju u srednjoj vrijednosti.
Na primjer, na testu iz predmeta Specijalna edukacija, nulta hipoteza je da se studenti prve,
druge i treće godine studija neće razlikovati u srednjem broju bodova osvojenih na testu.
Radna hipoteza bi bila da postoje statistički značajne razlike na rezultatima testa iz Specijalne
edukacije između ove tri grupe ispitanika. I sada krećemo u ekploraciju dobijenih podataka.

METOD

Ispitanici

Uzorak čine studenti prve, druge i treće godine Odsjeka za edukaciju i rehabilitaciju. Ukupan
uzorak čini 75 studenata (25 studenata prve godine, 25 studenata druge godine i 25 studenata
treće godine studija).
Instrument i procedura

Za potrebe ovog istraživanja korišten je Test iz Specijalne Edukacije. Sastoji se od 25 pitanja


od kojih svako pitanje nosi po jedan bod. Maksimalan skor na testu je 25 bodova. Studenti su
u isto vrijeme u tri odvojene učionice radili test (da bi spriječili eventualno prepisivanje,
studente su nadzirali naši vrijedni asistenti).

REZULTATI I DISKUSIJA

Došli smo i do najinteresantnijeg dijela našeg istraživanja i ovog rada. Srednji rezultati na
testu iz Specijalne edukacije su prikazani u tabeli 1.

Tabela 1. Srednji rezultati na testu iz Specijalne edukacije

Godina studija Srednji rezultat Standardna


devijacija
Prva godina 17,44 1,7

Druga godina 18,04 1,4

Treća godina 18,36 1,6

Prema rezultatima Analize varijanse, između ispitanika prve, druge i treće godine studija ne
postoje statistički značajne razlike na testu iz Specijalne edukacije, F(2,72)=2,27; p=0,11.
Posthoc test Tukey test također pokazuje da razlike među grupama ispitanika ne postoje
(Tabela 2).

Tabela 2. Rezultati Tukey posthoc testa između srednjih vrijednosti

Tukey posthoc Test Srednja razlika P < 0,05? 95% CI


prva godina vs druga godina -0,6000 Ne -1,651 to 0,4507
prva godina vs treća godina -0,9200 Ne -1,971 to 0,1307
druga godina vs treća godina -0,3200 Ne -1,371 to 0,7307

Dakle, i prema rezultatima Tukey posthoc testa ne postoje razlike između grupa na testu iz
Specijalne Edukacije. Većina istraživača koja bi išla ovim načinom ispitivanja bi (pogrešno)
zaključila da predavači Memišević i Biščević nisu baš nešto uspješni u prenošenju gradiva i
da studenti ne povećavaju svoje znanje iz predmeta Specijalna Edukacija. Bonferroni posttest,
pomenut ranije, također ukazuje da studenti ne pokazuju veći napredak i da nema razlika
među grupama. Rezultati Bonferroni testa su prikazani u tabeli 3 (needitovana tabela iz SPSS
programa).

Tabela 3. Bonferroni test razlika među grupama

Čak ni ovi rezultati ne obeshrabruju pomenute predavače jer su oni uvjereni da napredak ipak
postoji i da ovaj način ispitivanja razlika nije adekvatan, tako da ponovo gledaju dobijene
rezultate ovaj put prikazane grafički na slici 2.

Slika 2. Srednji rezultati na testu iz Specijalne edukacije


22
21
20
19
18
17
rezultat na testu SPED

16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
na

na
na

0
di

di
di

go

go
go

a
va

ug


pr

dr

tr

Zaključuju (ispravno) da se ipak trebalo ići sa planiranim poređenjem između grupa, tj. da se
studenti prve godine razlikuju od studenata druge i treće godine na testu. I uz pomoć svog
omiljenog programa za statističku obradu podataka uradili su planiranu komparaciju između
grupa. Prva komparacija je između studenata prve godine i studenata druge i treće godine, a
drugi je između studenata druge godine i studenata treće godine.

Rezultati su prikazani u tabeli 4.

Tabela 4. Rezultati planirane komparacije između grupa

Kontrast Vrijednost St. t df p


kontrasta greška
Test_SP 1 1,52 0,76 2,0 72 0,049
ED 2 0,32 0,44 0,73 72 0,468

Eureka! Kontrast 1 (rezultati studenata prve godine naspram rezultata studenata druge i treće
godine) pokazuje statistički značajnu razliku između grupa. Instrukcije koje pružaju predavači
su ipak efikasne i služiće kao „materijalni dokaz“ studentima (a i menadžmentu njihovih
fakulteta!) da su njihova predavanja korisna za povećanje znanja i da imaju „dokazanu
efikasnost“.

ZAKLJUČAK

U ovom radu su opisani neki od načina poređenja srednjih rezultata tri ili više grupa
ispitanika. Upoređena je Analiza varijanse, kao jedna od najčešće korištenih statističkih
metoda za testiranje hipoteza i planirana komparacija, koja se nešto rijeđe koristi. Na jednom
fiktivnom primjeru pokazana je superiornost planiranog poređenja u odnosu na Anovu u
detekciji statistički značajnih razlika među grupama. Ovdje je važno napomenuti da se
planirana komparacija radi kada imamo neku a priori hipotezu o mogućem pravcu razlika
između grupa (kao što je prikazano u primjeru). Ako ne postoji neka logička osnova za
pravljenje kontrasta, onda treba ići sa regularnom analizom varijanse praćenu post-hoc
testovima.

P.S. Istraživači Memišević i Biščevič su napravili grešku jer su nakon uvida u dobijene
podatke uradili planiranu komparaciju. Planirana komparacija grupa se definira prije analize
podataka.

LITERATURA:

1. Field, A., & Hole, G. (2002). How to design and report experiments. Sage.
2. Landau, S., & Everitt, B. (2004). A handbook of statistical analyses using SPSS (Vol.
1). Boca Raton, FL: Chapman & Hall/CRC.
3. Rumsey, D. (2009). Statistics II for dummies. John Wiley & Sons.
4. Salkind, N. J. (2012). Statistics for people who (think they) hate statistics: Excel 2010
edition. Sage.

Web site: www.statistics.laerd.com (pristup 05.05.2016).

View publication stats

You might also like