You are on page 1of 21

Fakultet elektrotehnike i raunarstva Zagreb

STATISTIKA ANALIZA ANKETA


seminarski rad
Andrija Lonar

Predmet: Statistiko uenje


Nastavnik: prof. dr. sc. Bojana Dalbelo Bai
Smjer: Primijenjeno raunarstvo
k. god. 2010 / 2011

Zagreb, kolovoz 2011.

Statistiko uenje Statistika analiza anketa

Sadraj

Uvod ........................................................................................................................................... 3
Dizajn anketa .............................................................................................................................. 4
Tipovi skala, Likertova skala ..................................................................................................... 6
Nominalna skala ................................................................................................................. 6
Ordinalna skala ................................................................................................................... 6
Intervalna skala .................................................................................................................. 6
Proporcijska skala .............................................................................................................. 7
Likertova skala ................................................................................................................... 7
Statistike veliine u analizi anketa ........................................................................................... 9
Mod .................................................................................................................................... 9
Medijan............................................................................................................................... 9
Srednja vrijednost (aritmetika sredina) .......................................................................... 10
Standardna devijacija ....................................................................................................... 10
Ostale veliine bitne za statistiku analizu anketa ........................................................... 11
Grupiranje i napredne analitike metode ................................................................................. 12
Grupiranje pitanja u anketi ............................................................................................... 12
Grupiranje ispitanika ........................................................................................................ 12
Regresijska analiza ........................................................................................................... 12
Hi-kvadrat test .................................................................................................................. 14
Ostale statistike metode za naprednu analizu anketa ..................................................... 15
Primjer online sustava za dizajn anketa, anketiranje i analizu anketnih rezultata ................... 16
Zakljuak i rezultati .................................................................................................................. 20
Literatura .................................................................................................................................. 21

Statistiko uenje Statistika analiza anketa

Uvod

Jedan od najee koritenih alata za istraivanje i prikupljanje statistikih podataka je anketa.


Ankete se razlikuju po prirodi i sadraju no za openitu definiciju ankete moemo rei da se
radi o skupu pitanja ili izjava na koje populacija ispitanika daje odgovore. Odgovori
prikupljeni anketiranjem niza ispitanika se prikupljaju i analiziraju, te se iz analize izvlae
zakljuci.
Jedan od pionira koritenja anketa kao alata u istraivake svrhe je bio Sir Frances Galton koji
ih je intenzivno koristio tijekom druge polovice 19-tog u svrhu prouavanja nasljednih
osobina i utjecaja odgoja i okolia na ljude [1].
Pristupi u dizajnu i namjeni anketa su mnogobrojni, a mnogobrojni su i naini izvoenja i
prikupljanja rezultata kao i odabira ispitanika. Samim tim problematika analize anketa
predstavlja vrlo iroko podruje.
Neke od potekoa pri izradi i analizi anketa su neiskrenost i subjektivnost ispitanika te
problemi sa ispravnim razumijevanjem pitanja. Ispravnost metodologije koritene u pojedinim
anketama je esto predmet diskusija, a zakljuci dobiveni analizom provedenih anketa mogu
biti pristrani. Ankete takoer mogu biti tako formulirane da je statistika analiza prikupljenih
podataka nemogua, te se analiza obavlja na nivou ispitanika.
Statistiki alati koriteni u analizi anketa su obino neke od osnovnih statistikih vrijednosti
poput srednje vrijednosti, moda, medijana, standardne devijacije i sl., no znaaj pojedine
statistike uvelike ovisi o tipu pitanja i setu ponuenih vrijednosti.
Prilikom analize dobivenih podataka nerijetko se koriste regresijske metode kojima
ustanovljavamo stupanj korelacije izmeu podataka prikupljenih u anketi.

Statistiko uenje Statistika analiza anketa

Dizajn anketa

Prilikom oblikovanja ankete mora se obratiti panja na cijeli niz parametara, posebno u
sluaju da se podaci dobiveni anketom trebaju statistiki obraivati. Iz toga je razloga
potrebno odabrati pogodan oblik pitanja i ponuenih odgovora. Ispitaniku se moe ponuditi
ogranien set odgovora (closed-ended) ili mu dozvoliti slobodu vlastitog formuliranja
odgovora (open-ended). Za statistiku analizu se uglavnom koriste pitanja sa predefiniranim
odgovorima, te meu njima razlikujemo [1]:

Dihotomne u kojima su ponuene samo dvije opcije

Nominalne politomne u kojima je ponueno vie meusobno neureenih opcija

Ordinalne politomne u kojima je ponueno vie meusobno ureenih opcija

Intervalne politomne u kojima je ponueno vie opcija sa pridruenom vrijednou

Kontinuirane u kojima je ponuen kontinuirani niz opcija

Ovisno o pristupu, u ordinalne politomne ili intervalne politomne izjave odnosno pitanja
spada i Likertova skala u kojoj ispitanik na odreenu izjavu treba odgovoriti odabirom izjave
o slaganju ili neslaganju iz predefiniranog ordinalnog seta odgovora.
Prilikom konstruiranja ankete treba paziti da grupe pitanja tvore logike cjeline, da unutar
cjeline pitanja idu od openitijih do specifinijih i od objektivnih do subjektivnih. Kao ope
pravilo, treba koristiti jasne i jednostavne forme pitanja razumljive svim ispitanicima, a
pitanja trebaju biti konstruirana tako da kod ljudi sa razliitim stavovima ili karakteristikama
rezultiraju razliitim odgovorima.
Postoji vei broj naina za provoenje ankete:

Provoenje ankete osobno je metoda koja ima vrlo visoku cijenu te se odvija relativno
sporo, a nazonost ispitivaa moe utjecati na iskrenost ispitanika. S druge strane
postotak odgovorenih pitanja je obino visok kod ove metode.

Potanska anketa je relativno povoljna cijenom, te prua visok stupanj anonimnosti


ispitanika, no s druge strane zahtjeva dosta vremena za provoenje.

Telefonsko anketiranje je vrlo esto koritena metoda u kojoj ispitiva postavlja


pitanja ispitaniku putem telefona. Metoda relativno brzo daje rezultate, a ispitiva
moe pojasniti pitanja ispitaniku ako ima nekih nejasnoa. Negativna strana je slab

Statistiko uenje Statistika analiza anketa

stupanj anonimnosti ispitanika i samim time esti neiskreni odgovori kod osjetljivih
tema.

Provoenje ankete elektronikim putem je novija metoda koja nudi cijeli niz
pogodnosti u odnosu na ostale formate. Kao negativnu karakteristiku obino se izdvaja
injenica da cijela ciljana populacija ne moe biti dobro obuhvaena anketom zbog
tehnike neobrazovanosti ili nedostupnosti raunala. S druge strane elektronike
odnosno raunalne metode za provoenje ankete daju vrlo brze rezultate uz niske
trokove provoenja i statistike analize podataka. Ispunjavanje je obino brzo i
lagano a stupanj anonimnosti moe biti vrlo visok. Pitanja mogu sadravati
pojanjenja a odgovori se mogu lako ograniiti na ponuene.

Iako sve navedene metode imaju prednosti i mane, za mnoga podruja se raunalne ankete
pokazuju kao najbolja platforma. Najee koritena forma raunalno provoene ankete je
web anketa. Web anketa je web aplikacija koja se obino sastoji od klijentskog dijela koji
kombinacijom HTML-a i drugih klijentskih tehnologija prua vizualni prikaz i interakciju s
anketom dok se odgovori klijenta pohranjuju u bazu podataka smjetenu na udaljenom
posluitelju. Sa strane ispitanika je za obavljanje web ankete potreban samo web preglednik i
veza prema Internetu.
Prilikom izvoenja ankete ispitanici trebaju imati dovoljno vremena da proitaju i razumiju
sva pitanja. Nadalje, njihovi odgovori trebaju biti dobrovoljni a okoli u kojem ispunjavaju
anketu treba biti oputen i ulijevati povjerenje. Loe tretiranje ispitanika e u pravilu
rezultirati neobjektivnim rezultatima. Ispitanici moraju imati povjerenja u anonimnost
vlastitih podataka da bi iskreno odgovorili na pitanja.
Pretpostavka za statistiku obradu podataka prikupljenih kroz anketu je da se radi sa pitanjima
koja koriste predefinirani set odgovora (closed-ended). Ukoliko elimo raditi naprednije
statistike analize nad grupama pitanja vezanim za jednu cjelinu potrebno je rabiti pitanja sa
odgovorima koji koriste ordinalnu skalu. Tada se odgovor ispitanika pretvara u numeriku
vrijednost pogodnu za statistiku obradu

Statistiko uenje Statistika analiza anketa

Tipovi skala, Likertova skala

Mjerne skale se razlikuju po tipu te se za razliite skale mogu koristi samo odreeni tipovi
statistikih veliina. Prema psihologu Stanleyu Smithu Stevensu postoje sljedei tipovi skala i
njima pridruene statistike veliine [2]:
Nominalna skala
Nominalna odnosno kategorijska skala svrstava podatke u grupe koje se ne mogu
kvantitativno usporeivati. Mada se pojedinom tipu za potrebe obrade podataka moe
pridruiti podatak u obliku broja, agregirani podaci se sa statistike strane mogu predstaviti
samo sa statistikom veliinom moda odnosno dominantnog tipa u skupu podataka. Podaci
poput srednje vrijednosti ili medijana su besmisleni za podatke predstavljene u ovoj skali.
Ordinalna skala
Ordinalna skala opisuje poredak podataka. Dakle, ordinalna skala dijeli vrijednosti u grupe za
koje imamo podatke o meusobnom odnosu grupa ali ne i kvantificirane podatke o odnosu
veliina, odnosno stupnju razlike izmeu grupa. Ordinalni podaci se statistiki mogu prikazati
putem veliina poput moda, medijana ili percentila, no poto nemamo informaciju o stupnju
razliitosti izmeu susjednih elemenata na skali veliine poput srednje vrijednosti ili
standardne devijacije nemaju smisla za ovaj tip skale. Podatke se bez utjecaja na njihov
poredak moe mijenjati bilo kojom monotonom funkcijom. Veina psihometriskih podataka
se predstavlja ordinalnim skalama.
Intervalna skala
Intervalna skala predstavlja podatke koji su mjerljivi te se njihov meusobni odnos moe
kvantificirati. Intervalna skala ukazuje na konstantnu i mjerljivu veliinu intervala no ne i na
odnos izmeu pridruene vrijednosti na skali i apsolutne vrijednosti mjerene veliine.
Intervalna skala je pogodnija za statistiku obradu od ordinalne jer se veliine popust
aritmetike srednje vrijednosti ili standardne devijacije mogu raunati za podatke smjetene
na intervalnoj skali. S druge strane usporedba omjera vrijednosti na intervalnoj skali nema
smisla jer nemamo podatak o izvorinoj vrijednosti. Ukoliko bi za primjer uzeli Celsiusovu
skalu za temperature koja je intervalna lako je dokazati da je besmislena tvrdnja da je
temperatura od 20 stupnjeva Celsiusa dvostruko vea od temperature od 10 stupnjeva
6

Statistiko uenje Statistika analiza anketa

Celsiusa. Mnoge se psihometrijske veliine koje su formalno ordinalne obrauju kao


intervalne s pretpostavkom da su podaci na ordinalnoj skali uglavnom sloeni u jednakim
intervalima. Takav pristup ponekad rezultira sa krivo kvantificiranim zakljucima dobivenim
kroz statistiku analizu.
Proporcijska skala
Proporcijska skala je skala koja podatke kvantificira prema njihovoj apsolutnoj vrijednosti.
Podaci su predstavljeni omjerom veliine mjerenog podatka i jedinice mjere, a glavna razlika
u odnosu na intervalnu skalu je stvarna a ne proizvoljna nulta vrijednost. Svaka vrijednost
predstavljena na proporcijskoj skali se moe prikazati kao omjer druge vrijednosti na istoj
skali i skalara. Veina statistikih veliina se moe izraunati za podatke predstavljene
proporcijskom skalom, no psihometrijske vrijednosti bitne za analizu anketa rijetko moemo
stavljati na tu skalu.
Likertova skala
Likertova skala nazvana po izumitelju, psihologu Rensisu Likertu, je psihometrijska skala
koja se vrlo esto koristi u anketama i upitnicima. Pitanja su u sluaju Likertove skale
postavljena u obliku izjava a ispitanik treba ocijeniti svoje slaganje odnosno neslaganje s
navedenom izjavom koristei simetrinu skalu. Skala ocrtava smjer i intenzitet osjeaja
ispitanika prema ponuenoj izjavi.
Skala obino kree od "uope se ne slaem" a zavrava sa "potpuno se slaem". Broj
ponuenih odgovora je obino izmeu 5 i 9 pri emu su prema provedenim istraivanjima
skale sa manjim brojem ponuenih odgovora rezultirale sa neto viim srednjim rezultatima
[2]. Tipini set ponuenih odgovora u Likertovoj skali bi bio "uope se ne slaem", "ne
slaem se", "nemam stav", "slaem se", "potpuno se slaem". Pri tome je srednja vrijednost na
skali neutralna u odnosu na postavljenu izjavu. Ukoliko se eli ukloniti opcija ispitanika da ne
zauzima stav o odreenoj izjavi koristi se skala sa parnim brojem odgovora. Kao i kod svake
druge metode valoriziranja u anketama pojavljuju se odreeni problemi. Primjerice, ispitanici
mogu izbjegavati koritenje ekstremnih vrijednosti ili davati suglasne odgovore zbog
potvrdnog oblika izjava.
Likertova skala je u osnovi ordinalna skala poto se slaganje ili neslaganje ne moe
predstaviti kao jedan kontinuirani fenomen a ponuene razine se ne mogu jednostavno

Statistiko uenje Statistika analiza anketa

proglasiti ekvidistantnima. Pa ipak, za potrebe analize se esto podaci prikupljeni uz pomo


upitnika koji koriste Likertovu skalu interpretiraju kao intervalno skalirani podaci.
Opravdanje za takav pristup je ponovno pretpostavka da je relativna distanca izmeu toaka
na skali priblino jednaka te da je osjeaj neslaganja slaganja dovoljno slian osjeaju
slaganja samo suprotnog polariteta. Interpretiranjem podataka prikupljenih uz pomo upitnika
koji koriste Likertovu skalu kao intervalnih dobivamo mogunost za analizu nekih korisnih
statistikih veliina. Tako moemo govoriti o srednjoj vrijednosti podataka koja moe biti
korisna za donoenje odluka ili o standardnoj devijaciji koja e ukazati na koliinu razilaenja
miljenja ispitanika.
Ispitna pitanja koja koriste Likertovu skalu se esto grupiraju u tematske cjeline.
Analiziranjem dobivenih podataka po grupama moemo dobiti korisne informacije o tome
kako populacija ispitanika reagira na pojedine teme. Nadalje, grupiranjem pitanja i analizom
po temama se mogu stvoriti i stavovi o meusobnim odnosima izmeu pojedinih tema to
moe biti osobito korisno. Grupiranjem tema i analizom po grupama se smanjuje mogunost
da neke manje bitne informacije koje prilikom analize pokazuju znaajna odstupanja odvuku
panju sa vanijih informacija. Statistike analize poput analize varijance se tada mogu
izvoditi uz pretpostavku linearnosti modela. Da bi se pitanja odnosno izjave mogle grupirati
potrebno ih je postavljati sa istim, pozitivnim predznakom, te se potrebno potruditi da budu
logiki ispravno grupirani, da se tematske cjeline to manje preklapaju te da je broj pitanja po
tematskoj cjelini dovoljan za grupnu analizu.
Ovaj rad e se primarno baviti anketama i analizom anketa koje koriste Likertovu skalu.
Razlog za to je injenica da se radi o jednoj od najpopularnijih skala koritenih u
psihometrijskim ispitivanjima kao i to to su ankete koje koriste Likertovu skalu pogodnije za
statistiku analizu od drugih vrsta anketa.

Statistiko uenje Statistika analiza anketa

Statistike veliine u analizi anketa

Kao to je ranije spomenuto, u analizi anketa moemo raditi sa nizom statistikih veliina no
bitno je da se podaci ispravno smjeste u odgovarajuu skalu, te da se izraunavaju samo
statistike veliine koje imaju smisla za koritenu skalu.
Mod
Mod je statistika veliina koja daje podatak o tome koji se element najee pojavljuje u
nekoj populaciji [3]. Da bi neki element bio mod mora se pojaviti barem jedan put. Anketa
koja se koristi nominalnom skalom nema drugih bitnih statistika osim moda naime u skupu
nominalnih podataka moemo samo ustanoviti koji se podatak najee pojavljuje te podatke
predstaviti npr. stupastim grafom sa postotnim udjelima pojedinih odgovora. Mod moemo
koristiti za sve vrste anketnih upitnika osim za odgovore koji korisnici slobodno formiraju
(open ended). Primjer anketnih podataka kod kojeg je mod bitna statistika bi mogle biti
predizborne ankete kod kojih e se s modom rezultata upitnika predvidjeti pobjednika izbora.
Medijan
Medijan je pojam koji odreuje sredinu distribucije. Medijan ima smisla za bilo koje podatke
prikupljene koritenjem ankete sa ordinalnom skalom [3]. Zovemo ga jo i 50-tim percentilom
jer je 50% vrijednosti u skupu podataka iznad a 50% ispod njega.
Za izraunavanje medijana u nekom skupu podataka potrebno je prvo sortirati podatke po
veliini a zatim odabrati sredinji element kao medijan. Ukoliko je broj podataka paran kao
medijan se uzima prosjena vrijednost dva sredinja elementa. {
Za skup od n ordinalnih podataka Y kod kog vrijedi:

Y1 Y2 Yn1 Yn
Tada je medijan definiran kao:

Y( n 1)/2 kada je n neparan

x 1

(Yn /2 Y( n 1)/2 ) kada je n paran

Statistiko uenje Statistika analiza anketa

Medijan je kao statistika veliina manje znaajan od srednje vrijednosti no za razliku od


srednje vrijednosti, medijan je uglavnom neosjetljiv na ekstremne vrijednosti, te je za razliku
od srednje vrijednosti smislena statistika veliina i za ordinalne podatke.
Srednja vrijednost (aritmetika sredina)
Aritmetika sredina ili srednja vrijednost je vrijednost koju dobijemo ako zbrojimo sve
izmjerene vrijednosti i podijelimo ih sa brojem mjerenja, odnosno u sluaju anketa , kada
sumiramo rezultate i sumu podijelimo s brojem ispitanika. Aritmetiku sredinu oznaavamo
sa te je izraunavamo sa:

1 n
x xi
n i 1
pri emu je n broj mjerenja a xi i-to mjerenje iz skupa mjerenja od 1 do n.
S obzirom da se kod anketa pokuava doznati stvarna vrijednost neke psihometrijske veliine
moemo rei da e srednja vrijednost kao statistika veliina najbolje oslikati traenu
vrijednost. S druge strane, srednja vrijednost ima smisla samo kod intervalnih podataka. Jedna
od negativnih karakteristika aritmetike sredine je njena osjetljivost na ekstreme unutar
populacije.
Mali broj odgovora koji su na jednom ili drugom kraju skale i znaajno odstupaju od ostatka
odgovora moe bitno utjecati na aritmetiku sredinu. Neke statistike metode poput skraene
aritmetike sredine (truncated mean) mogu utjecati na to da se ekstremne vrijednosti odbace,
no kod anketa i ekstremne vrijednosti mogu imati smisao, te se njihov utjecaj radije treba
oslikati nekim drugim metodama a ne u potpunosti odbaciti [3].
Standardna devijacija
Standardna devijacija je statistika veliina kojom se sluimo da bi oslikali rasprenost
podataka u mjerenom skupu [3]. Obino se rauna uz pomo izraza:

1 N
( xi x )2

N i 1

10

Statistiko uenje Statistika analiza anketa

Pri emu je N broj mjerenja, xi pojedino mjerenje a srednja vrijednost (aritmetika sredina).
Vrijednost standardne devijacije je uvijek pozitivna veliina
Standardna devijacija je jedna od najee koritenih statistikih veliina. Ona je
dimenzionalna i ima istu mjernu jedinicu kao i podaci. Zbog toga informacija o standardnoj
devijaciji nije potpuna bez informacije o srednjoj vrijednosti. Podaci sa veom rasprenou
e imati veu standardnu devijaciju od podataka sa manjom rasprenou, no za procjenu
rasprenosti se u obzir se mora uzeti i mjerna veliina odnosno aritmetika sredina mjerenog
skupa.
Koeficijent varijacije je veliina koja oslikava omjer izmeu standardne devijacije i apsolutne
vrijednosti aritmetike sredine. Oznaava se s cv:

| |
Valja primijetiti da iako standardna devijacija i aritmetika sredina imaju smisla za bilo kakve
intervalne podatke koeficijent varijacije ima smisla samo za proporcijske podatke. Ukoliko su
podaci doista na proporcijskoj skali rasprenost mjerenog skupa tada moemo dobro oslikati
koeficijentom varijacije, obino u postotcima.
U statistikoj analizi anketa standardna devijacija moe biti koritena da se ilustrira koliko
variraju stavovi o nekoj temi unutar skupa ispitanika. Teme sa velikom standardnom
devijacijom moemo nazvati spornim temama. Ukoliko je standardna devijacija osobito
velika, rezultate prikazane kroz srednju vrijednost trebamo smatrati nepouzdanim. Kada
procjenjujemo standardnu devijaciju unutar rezultata ankete njenu veliinu treba usporeivati
sa rasponom unutar kojeg se odgovori nalaze.

Ostale veliine bitne za statistiku analizu anketa


Osim navedenih za kvalitetnu analizu rezultata ankete potrebno je analitiaru pruiti uvid i u
podatke o maksimalnoj i minimalnoj ocjeni pojedinog pitanja, stupnju odnosno postotku
ispitanika koji su na pojedino pitanje dali odgovor, koliini vremena koja im je trebala da
odgovore na pojedino pitanje i slino. Svi navedeni podatci zajedno sa prethodno navedenim
statistikim veliinama mogu posluiti analitiaru da iz rezultata ankete donese ispravne
zakljuke.

11

Statistiko uenje Statistika analiza anketa

Grupiranje i napredne analitike metode

Grupiranje pitanja u anketi


Za detaljnu analizu nad podacima prikupljenim kroz anketne upitnike esto je potrebno
prilikom dizajna ankete formirati grupe pitanja, odnosno cjeline koje se veu za odreene
teme. Tako ureene ankete mogu dati realnije rezultate te bitno smanjiti utjecaj ekstrema
unutar grupe pitanja. Naime, za detaljnu procjenu pojedinih psihometrijskih vrijednosti jedno
pitanje esto nije dovoljno. Tema moe biti kompleksna, a grupe pitanja mogu ilustrirat
stavove ispitanika cijeloj temi, ali i dati informacije o stavovima vezanim uz pojedina pitanja.
Takve grupe pitanja mogu u kasnijoj fazi kroz kumulativnu obradu rezultata pruiti smjernice
za strategijsko djelovanje. Tematski povezana pitanja se mogu ali i ne moraju predstaviti
ispitanicima kao grupirane cjeline.
Grupiranje ispitanika
Ispitanici se takoer esto dijele u skupine koje mogu dobiti upitnike prilagoene znanjima
odnosno atributima vezanim upravo za svoju skupinu. Grupiranje se moe raditi sukladno sa
demografskim podacima ali i prema nekim drugim parametrima. Grupiranje ispitanika je
korisno za naknadnu analizu jer nam nudi mogunost da ustanovimo postojanje korelacije
izmeu stavova i grupa ispitanika. U idealnom sluaju bi svi demografski i drugi bitni podaci
vezani uz pojedinog ispitanika trebali biti dostupni analitiaru. Ovo se moe kositi sa
zahtjevom da anketa bude anonimna pa je ponekad skup raspoloivih podataka ogranien na
one koji ne kompromitiraju anonimnost ispitanika.
Regresijska analiza
Ukoliko je cilj ankete otkrivanje uzroka za pojedine stavove ispitanika moemo se koristiti
tehnikom regresijske analize odnosno utvrivanjem korelacije nad anketnim podacima. Za
ovu vrstu analize odgovore na jedno pitanje promatramo kao ovisnu varijablu a odgovore na
drugo pitanje kao neovisnu varijablu. Kao ovisnu varijablu moemo promatrati i ukupnu
prosjenu vrijednost svih odgovora u anketi ili ukupnu prosjenu vrijednost odgovora za
jednu grupu pitanja. Kao neovisnu varijablu moemo uzeti i neki od demografskih podataka
ili grupu kojoj je ispitanik pridruen.

12

Statistiko uenje Statistika analiza anketa

Kroz regresijsku analizu pokuavamo utvrditi da li postoji veza izmeu ovisne i neovisne
varijable. Valja primijetiti da postojanje korelacije ili povezanosti izmeu ovisne i neovisne
varijable ne ukazuje nuno na uzrono-posljedinu vezu izmeu tih varijabli. Za dokazivanje
uzrono posljedine povezanosti nuno je odbaciti mogunost da neka dodatna varijabla
uzrokuje korelaciju te je potrebno dokazati da je neovisna varijabla ona koja djeluje na ovisnu
a ne suprotno.
Za ispitivanje korelacijske povezanosti moemo koristiti Pearsonov koeficijent korelacije
(obino oznaen s ili r) koji dobivamo kao kvocijent kovarijancije dviju varijabli i umnoka
njihove standardne devijacije[3].

rX ,Y corr( X , Y )

cov( X , Y )

XY

iz ega dobivamo da je:


n

rxy

( xi x )( yi y )
i 1

(n 1) sx s y

( x x )( y y )
i

i 1

(x x ) ( y y)
2

i 1

i 1

gdje su sx i sy standardne devijacije za x i y, dok su i srednje vrijednosti varijabli x i y u


uzorku. Daljnjim razvojem dolazimo do izraza:

rxy

x y nxy
i

(n 1) sx s y

n xi yi xi yi

n xi2 ( xi )2 n yi2 ( yi ) 2

Vrijednosti koeficijenta korelacije padaju u podruje [-1, 1], pri emu vrijednosti blizu -1
ukazuju na negativnu vezu, vrijednosti blizu 1 ukazuju na izravnu povezanost, a vrijednosti
koje se kreu oko nule ukazuju na nepostojanje povezanosti izmeu varijabli.
Treba napomenuti da je Pearsonov koeficijent korelacije namijenjen podacima na linearnoj
intervalnoj skali, te da pretpostavlja normalnu razdiobu unutar populacije. Ukoliko se anketni
podaci ne mogu smatrati takvima mogue je koristiti neke druge pokazatelje korelacije poput
Spearmanovog ili Kendallovog rang koeficijenta. Takoer treba napomenuti da je za

13

Statistiko uenje Statistika analiza anketa

kompletnu analizu potrebno utvrditi i s kolikom sigurnou koeficijent korelacije moe


oslikati povezanost izmeu varijabli.
Korelacija moe biti izvrstan alat analitiaru koji pokuava utvrditi povezanost i stei dublja
saznanja o predmetu ankete, no mora se koristiti s oprezom te se njeni rezultati trebaju
ilustrirati uz napomenu o njenim ogranienjima.
Hi-kvadrat test
Hi-kvadrat (Chi square, 2) test je jedan od statistikih testova prilagodbe. On se koristi za
ispitivanje nezavisnosti dviju varijabli, sluajnosti te dobrote prilagodbe. Za potrebe analize
anketnih podataka kao varijable moemo uzeti odgovore na pitanja, demografske podatke ili
kumulativne prosjene odgovore na grupe pitanja.
Hi kvadrat test se koristi frekvencijama pojavljivanja odreenih dogaaja koje se usporeuju
sa teoretski predvienim frekvencijama sukladno nul hipotezi. Obino se koristi formula [4]:

( f 0 ft )2

ft
2

Pri emu je f0 izmjerena frekvencija dogaaja a ft oekivana frekvencija sukladno nulhipotezi. U sluaju anketnih podataka kao dogaaje iju frekvenciju mjerimo moemo uzeti
kombinacije u vrijednostima meu varijablama koje mjerimo. Pri tom je bitno da nul-hipoteze
budu smislene i u skladu s dobivenim kumulativnim rezultatima. Obino se za nul-hipotezu
uzima pretpostavka da varijable nisu meusobno povezane. Zbrajanjem kvocijenta oekivane
frekvencije i kvadrata odstupanja od oekivane frekvencije dobivamo vrijednost koja se
oznaava s 2 odnosno hi-kvadrat. S obzirom na broj stupnjeva slobode, dakle broj moguih
ishoda dogaaja, te s obzirom na sigurnost kojom elimo utvrditi da li su izmjerene
vrijednosti u skladu s nul-hipotezom, 2 vrijednost nam daje podatak da li je nul-hipoteza
ispravna. Konkretno za ankete to znai da ukoliko 2 vrijednost prelazi zadanu granicu nulhipoteza o nepovezanosti ne stoji, te se moe rei da su varijable povezane.
Iako i korelaciju i Hi kvadrat koristimo za ispitivanje povezanosti varijabli treba primijetiti da
je korelacija namijenjena utvrivanju stupnja povezanosti dok Hi-kvadrat test opisuje stupanj
sigurnosti kojim moemo tvrditi da povezanost postoji [4].

14

Statistiko uenje Statistika analiza anketa

Kao i korelacija, Hi-kvadrat test moe biti koristan alat analitiaru ankete no panju valja
obratiti na to da se podaci dobiveni izvoenjem ovog testa prezentiraju bez pristranosti i s
adekvatnim informacijama o ogranienjima navedene statistike metode.
Ostale statistike metode za naprednu analizu anketa
Uz navedene metode za analizu rezultata anketa mogue je koristiti i druge poput metoda
deskriptivne statistike koje kvantificiraju dobivene rezultate, ordinalne regresije koja
regresijske metode proiruje i na podatke koji se koriste ordinalnom skalom, vierazinskim
modeliranjem koje analizira vie-parametarske podatke i mnogih drugih.
Uz to se pri analizi anketa moe koristiti i statistike metode poput t-testa ili ANOVA analize
varijance za utvrivanje statistike validnosti podataka izmeu grupa i slino [5].
Sve statistike metode upotrjebljene pri analizi anketa treba koristiti uz oprez s obzirom na to
da se radi o psihometrijskim podacima koji se esto ne mogu svrstati ak ni na ordinalnu
skalu, a informacije dobivene navedenim metodama trebaju biti predstavljene uz napomene o
ogranienjima koritenih metoda jer se u suprotnom pogreno interpretirani podaci mogu
koristiti za donoenje strategijskih odluka.

15

Statistiko uenje Statistika analiza anketa

Primjer online sustava za dizajn anketa, anketiranje i analizu


anketnih rezultata

U ovom dijelu rada e biti opisan jedan on-line sustav za dizajn anketa, anketiranje i analizu
anketnih rezultata. Navedeni anketni sustav je dio sustava za strateko planiranje i voenje
procesa u nabavi, te se koristi za prikupljanje podataka o stavovima razliitih grupa djelatnika
veih tvrtki vezanim za nabavu. Sustav pitanja predstavlja u vidu izjavnih reenica na koja
ispitanici trebaju odgovoriti kroz stupanj slaganja. Koristi se Likertova skala sa 5 stupnjeva od
uope se ne slaem do u potpunosti se slaem.
Proces poinje kreiranjem seta pitanja namijenjenih pojedinim grupama ispitanika. Pitanja su
podijeljena u grupe koje tvore logiku osnovu za daljnju analizu, usporedbu i donoenje
odluka. Poto sva pitanja nisu namijenjena svim djelatnicima, za svako pitanje se biraju grupe
djelatnika koje e ih odgovarati. Dizajner ankete moe odluiti koja e predefinirana pitanja
koristiti te moe konstruirati dodatna pitanja. Na slici 1. je vidljiv izgled suelja za
dizajniranje ankete.

Slika 1. Suelje za dizajn ankete

16

Statistiko uenje Statistika analiza anketa

Nakon to je dizajn ankete zavren, pozivnice za sudjelovanje u anketi se alju listi ispitanika.
Pozivnice se alju u obliku e-mail poruka koje sadre Internet poveznicu link. Klikom na
link u e-mail-u ispitanik pristupa svojoj anketi. Lista pitanja je prilagoena grupi kojoj je
ispitanik dodijeljen. Zbog lakoe i jednostavnosti koritenja ankete ispitanici se ne trebaju
prijavljivati sa korisnikim imenom i lozinkom. Podaci koji identificiraju pojedinog ispitanika
su sadrani u pozivnom linku. Takoer, zbog jednostavnosti koritenja, sve se promjene koje
ispitanik napravi automatski spremaju. Ispitanik moe nastaviti ili modificirati svoju anketu u
bilo kojem trenutku otvarajui link iz pozivnog e-mail-a. Sve navedene funkcionalnosti su
poeljne jer pojednostavljuju pristup i rad na anketi ispitanicima koji ponekad imaju tek
elementarno znanje koritenja raunala, te uz to smanjuju vrijeme koje ispitanik mora utroiti
ispunjavajui anketu. Uz svako pitanje ispitanik moe ostaviti i komentar. Ovi komentari
mogu biti izuzetno korisni analitiarima pri izdvajanju konkretnih uzroka nekih pojava
uoenih u anketi, a takoer daju ispitanicima mogunost da svoje utiske prenesu i izvan
okvira ponuene Likertove skale. U dosadanjem koritenju sustava se pokazalo da ispitanici
dodaju komentare na gotovo 10% pitanja. Na slici 2. je predstavljen primjer izgleda anketnog
upitnika.

Slika 2. Anketni upitnik.

17

Statistiko uenje Statistika analiza anketa

Odgovor na postavljeno pitanje korisnik daje na obojanoj skali koja ide od jarko naranaste
do jarko zelene, te se ne koriste brojevi ili slova za ocjenjivanje. Razlog za to je drugaije
poimanje pojedinih simbola u raznim krajevima svijeta gdje se sustav koristi.
Po isteku krajnjeg roka za zavravanje ankete analitiar onemoguava daljnje unose te vri
analizu prikupljenih podataka. Za analitiara bi analiza svih odgovora ispitanika bila vrlo
veliki posao ukoliko ne bi koristio neke statistike alate koje sustav nudi. Naime, konkretni
sustav unutar jedne ankete obino obuhvaa vie od stotinu ispitanika, te pojedinim grupama
ispitanika postavlja i po dvije stotine pitanja. Na slici 3. prikazan je izgled suelja za analizu
rezultata ankete.

Slika 3. Suelje za analizu rezultata ankete

Poto je pred analitiarom velika koliina podataka koji se trebaju interpretirati rezultati se
prikazuju kao prosjene vrijednosti za pojedinu grupu ispitanika, ali i kao ukupna prosjena
vrijednost za sve ispitanike. Prosjene osjene su prikazane bojama radi pojednostavljenja i
jednostavnijeg interpretiranja velike koliine podataka. Dovoenjem pokazivaa na pojedini
kvadrat s prosjenom ocjenom analitiaru se prikazuju dodatne statistike vrijednosti bitne za
evaluaciju pojedinog pitanja, te podaci o broju ispitanika koji su odgovorili na pitanje. To su

18

Statistiko uenje Statistika analiza anketa

srednja vrijednost zaokruena na dvije decimale, standardna devijacija, maksimalna i


minimalna vrijednost odgovora, mod i medijan. Navedene statistike veliine se lako raunaju
jer baza podataka kojom se sustav koristi ima ugraene funkcije za brzo raunanje svih
navedenih vrijednosti. Sve navedene vrijednosti mogu imati odreeno znaenje za analitiara
i pomoi mu da rezultate interpretira, no aritmetika sredina svih odgovora je obino
najkorisnija vrijednost. Minimalna vrijednost moe ponekad upozoriti na postojanje problema
koji obuhvaaju tek mali dio populacije ispitanika te je kao takva takoer neto na to
analitiar treba obratiti panju. Standardna devijacija e kroz veliku vrijednost ilustrirati
znaajne razlike u stavovima ispitanika nepostojanje jedinstvenog stava. Valja primijetiti i
da upoznavanje analitiara s bilo kojom od ovih vrijednosti ne naruava anonimnost ankete
analitiar ne moe znati koji je ispitanik dao koji odgovor. U svrhu analize i interpretacije
rezultata ankete komentari ispitanika mogu biti veoma korisni. Zbog toga su predstavljeni
analitiaru ispod grupe pitanja, sa oznaenom grupom kojoj ispitanik koji je ostavio komentar
pripada te s ocjenom koju je ispitanik dao identitet ispitanika je skriven u svrhu osiguranja
anonimnosti ankete.
Analitiar stvara stavove o pojedinim pitanjima te ih biljei u prostor za komentare. On
takoer za svrhu daljnje analize daje ukupnu vlastitu ocjenu pojedinog pitanja temeljenu na
rezultatima ankete te definira vanost pojedinog pitanja na razini lokalne poslovne
organizacije kao i na razini poslovne grupe. Daljnja analiza se provodi usporeivanjem
rezultata anketa svih lokalnih poslovnih grupa. Za to se koristi suelje predstavljeno na slici 4.

Slika 4. Suelje za usporedbu rezultata anketa

19

Statistiko uenje Statistika analiza anketa

Zakljuak i rezultati

Detaljno prouavanje literature vezane za tematiku statistike analize anketa pokazuje da


nema jedinstvenog znanstvenog stava oko statistikih metoda i analiza koje bi se trebale
primijeniti. Takoer, ne postoji jasan konsenzus oko tema vezanih uz dizajn anketa, a rezultati
anketa se stavljaju na razliite skale. U veini sluajeva se prilikom znanstvene analize anketa
teme poput dizajna, metoda provoenja anketa i statistike analize prilagoavaju onome to
istraiva smatra najboljim za konkretnu anketu, konkretne podatke i konkretne tipove
ispitanika. Odreeni standardi ipak postoje tako da moemo govoriti o statistikim veliinama
poput srednje vrijednosti, standardne devijacije, moda, medijana i sl. kao osnovnim podacima
koji analitiaru daju podlogu za stvaranje pojedinih zakljuaka. Naini primjene i metode iza
naprednijih statistikih analiza su ipak vezani pojedinu anketu, a njihovi rezultati se trebaju
uzimati s dozom opreza jer je u pitanju mjerenje psihometrijskih vrijednosti koje imaju svoje
specifinosti. Na kraju se rezultati analize ankete i tvrdnje koje iz njih proizlaze trebaju uvijek
uzeti s rezervom jer su izvori podataka nepouzdani, a dizajn ankete i statistike veliine koje
se predstavljaju kao rezultati ankete mogu biti namjerno ili sluajno prilagoene favoriziranju
pojedinih rezultata
U dananje vrijeme se anketiranje bazirano na on-line sustavima za distribuiranje, provoenje
i obradu podataka ankete ine vrlo privlanima za dobar dio primjena. Prednosti poput brzine
stupnja kontrole i niske cijene ovakvih sustava ih stavljaju jasno ispred klasinih sustava
temeljenih na telefonskim ili potanskim anketama. Prilikom dizajniranja sustava za analizu
sloenih anketa s tematski grupiranim pitanjima susreo sam se s cijelim nizom izazova. Na
prvom mjestu su to pitanja vezana uz korisniko suelje koje mora biti u stanju pruiti
korisniku sve potrebne informacije na to jednostavniji nain. Daljnji izazovi su se pokazali
pri evaluaciji grupiranih rezultata ankete koji su pod znaajnim utjecajem kulturolokih,
edukacijskih i mnogih drugih razliitosti kod ispitanika. Statistika analiza je takoer
predstavila svoje izazove jer su pojedine znaajne vrijednosti uoene tek usporedbom
razliitih statistikih veliina, a neke su zanimljive vrijednosti dobivene provoenjem
regresijske analize nad dobivenim podacima.

20

Statistiko uenje Statistika analiza anketa

Literatura
[1]
Cliff, N. & Keats, J. A. (2003). Ordinal Measurement in the Behavioral Sciences.
ISBN 0-8058-2093-0

[2]
Chambers, R.L., C.J. Skinner (2003) Analysis of Survey Data. / ISBN-13: 9780471899877
[3]
Kandethody M. Ramachandran, Chris P. Tsokos. (2009) Mathematical statistics with
applications / ISBN 978-0-12-374848-5

[4]

Shirley Dowdy, Stanley Weardon, Daniel Chilko. (2004 3rd Edition) Statistics for

research / ISBN 0-471-26735-X

[5]
Chau-Kuang Chen, John Hughes, Jr., Using Ordinal Regression Model to Analyze
Student Satisfaction Questionnaires (2004)

21

You might also like