Professional Documents
Culture Documents
Mersad Bukva
Jasmin Čolić
Alma Dizdarević
Firdeus Kadrić
Belinda Kikić
Jasmina Kokić
Ediba Kondo
Selma Korlat
Boris Lovrinović
Tomislav Lučić
Aljoša Lješić
Smirna Malkoč
Lejla Mehić
Misala Rašić
Muamer Ušto
SPSS
PRIRUČNIK
Mart, 2013.
Sadržaj
I DIO – UVOD U SPSS
1. Dizajniranje istraživanja ..................................................................................................... 2
1.1 Planiranje istraživanja ................................................................................................... 2
1.2 Odabir pravih skala i mjera ........................................................................................... 4
1.3 Pripremanje upitnika ..................................................................................................... 5
2. Pripremanje codebooka ...................................................................................................... 7
2.1 Imena varijabli .............................................................................................................. 7
2.2 Kodiranje odgovora ...................................................................................................... 8
2.3 Kodiranje otvorenih pitanja .......................................................................................... 9
3. Upoznavanje sa SPSS-om................................................................................................. 10
3.1 Pokretanje SPSS-a ...................................................................................................... 10
3.2 Otvaranje postojeće baze podataka ............................................................................. 10
3.3 Rad sa bazama podataka ............................................................................................. 11
3.4 SPSS prozori ............................................................................................................... 12
3.5 SPSS meniji ................................................................................................................ 16
3.6 Dijaloški okviri ........................................................................................................... 16
3.7 Zatvaranje SPSS-a ...................................................................................................... 18
3.8 Upotreba help-a........................................................................................................... 18
1.
DIZAJNIRANJE STUDIJE
Iako na prvi pogled djeluje čudno da se govori o dizajniranju studije u priručniku za SPSS,
pravljenje nacrta je neizostavan dio istraživačkog procesa i ima važne implikacije na kvalitet
prikupljenih i analiziranih podataka. Prije svega, i podaci koje unosimo u SPSS-bazu moraju
doći odnekud. To mogu biti: odgovori na upitniku, informacije prikupljene iz intervjua,
kodirani odgovori iz opažanja, ili druge objektivne mjere određenih sposobnosti ili
performansi.
Dobro istraživanje u velikoj mjeri zavisi od pažljivog planiranja. Postoji nekoliko savjeta koje
je korisno slijediti prilikom dizajniranja istraživanja:
Prije svega, potrebno je razmotriti koji istraživački nacrt treba da upotrijebite (npr.
eksperiment, anketa, opažanje). Odaberite najbolji pristup, imajući u vidu njihove
prednosti i nedostatke u odnosu na vaše istraživačko pitanje. Kao dobar oslonac mogu
poslužiti istraživanja koja su se već bavila vašim istraživačkim pitanjem.
Ako odaberete eksperiment, odlučite da li nacrt „između grupa“ (različiti ispitanici u
svakom eksperimentalnom uvjetu) ili nacrt „ponovljenih mjerenja“ (isti ispitanici u
svim uvjetima) bolje odgovara vašem istraživačkom pitanju.
U eksperimentalnim studijima nastojte uključiti dovoljno nivoa nezavisne varijable.
Korištenje samo dva nivoa (ili dvije grupe) možda znači da je potrebno manje
ispitanika, ali ta odluka ograničava zaključke koje možete izvući.
Uvijek odaberite više ispitanika nego što vam je potrebno, posebno ako koristite
uzorak koji čine ljudi. Ljudi su ozloglašeno nepouzdani - ne pojave se na vrijeme,
razbole se, otkažu ili ne ispune upitnike pravilno.
U eksperimentalnim studijama, provjerite da li imate dovoljno ispitanika u svakoj od
grupa (i nastojte da ih izjednačite što je više moguće). U malim grupama teško je
detektirati statistički značajne razlike između grupa. Postoje načini na koje možete
izračunati koja je odgovarajuća veličina uzorka za vašu studiju.
2
SPSS PRIRUČNIK
3
SPSS PRIRUČNIK
Postoji mnogo različitih načina za prikupljanje podataka, ovisno o prirodi vašeg istraživanja.
Ovo može uključivati: mjerenje uratka na nekom objektivnom kriteriju, ili ocjenjivanje
ponašanja prema setu specificiranih kriterija. Također može uključiti upotrebu skala koje su
dizajnirane da operacionaliziraju neke konstrukte ili atribute koji nisu direktno mjerljivi (npr.
samopoštovanje). Postoji mnogo valjanih skala koje se mogu upotrijebiti u studiji. Ali, nekad
je teško pronaći skalu koja odgovara vašoj svrsi. Mjesto gdje treba početi je temeljiti pregled
literature o vašoj temi. Koje mjere su upotrebljavali drugi istraživači u toj oblasti? Ponekad su
itemi koji čine skale uključeni u prilog članka, a ponekad morate naći originalni članak koji
opisuje dizajn i validaciju skale za koju ste zainteresirani. Neke skale možete upotrebljavati
samo ako kupite ''zvanične'' kopije od izdavača, dok su druge objavljene u potpunosti u
člancima, i smatra se da su ''u javnoj domeni'', što znači da ih istraživači mogu koristiti
besplatno. Vrlo je važno, međutim, da se navede naziv skale koju koristite, uz potpuno
detaljne reference.
Pri odabiru odgovarajućih skala postoje dvije karakteristike kojih morate biti svjesni:
pouzdanost i valjanost. Oba faktora mogu utjecati na kvalitetu podataka koje prikupite. Stoga
je potrebno da prilikom pregleda potencijalnih skala prikupite informacije i o njihovoj
pouzdanosti i valjanosti. Bez obzira koliko su dobri izvještaji o valjanosti i pouzdanosti vaših
skala, važno ih je testirati u pilot studiji sa vašim uzorkom. Jer, ponekad su skale pouzdane za
neke grupe (npr. odrasli ljudi koji govore engleski),ali su potpuno nepouzdane kad se koriste
na drugim grupama (npr. djeca iz ne-engleskih govornih područja).
Pouzdanost
Pouzdanost skale pokazuje koliko je ona slobodna od slučajne pogreške. Dva često korištena
indikatora pouzdanosti skale su test-retest pouzdanost i unutrašnja konzistencija.
4
SPSS PRIRUČNIK
Drugi aspekt pouzdanosti koji se može procijeniti je unutrašnja konzistencija. Ovo se odnosi
na stepen u kojem svi itemi skale mjere isti atribut (tj. stepen u kojem se ''drže skupa'').
Unutrašnja konzistencija može biti mjerena na više načina. Najčešće korišten način je
računanje Cronbachovog alfa koeficijenta (što je dostupno korištenjem SPSS-a). Ovaj
statistički pokazatelj odražava prosječne korelacije među itemima koji čine skalu. Vrijednosti
se kreću od 0 do 1, pri čemu više vrijednosti označavaju veću pouzdanost. Cronbachov alfa
koeficijent, također, ovisi o broju itema u skali. Tako npr., kad je mali broj itema u skali
(manje od 10), Cronbachov alfa-koeficijent može biti prilično nizak.
Valjanost
Valjanost skale odnosi se na stepen u kojem ona mjeri ono što treba da mjeri. Nažalost, nema
jasnog indikatora valjanosti skale. Osnovne vrste valjanosti su:
Sadržajna valjanost – Da li test sadrži reprezentativan uzorak ponašanja iz domene
koja se mjeri.
Kriterijska valjanost – Da li je test u korelaciji sa nekom eksternom varijablom –
kriterijem.
Konstruktna valjanost – Da li test meri onu osobinu za koju je namijenjen.
Vrste pitanja
Većina pitanja mogu biti podijeljena u dvije grupe: zatvorena ili otvorena. Zatvoreni tip
pitanja uključuje nuđenje ispitaniku više različitih, prethodno definiranih odgovora. Izbori
mogu biti jednostavni: Da/Ne, Muškarac/Žena,ili mogu imati više različitih opcija.
5
SPSS PRIRUČNIK
Primjer:
Koji je Vaš nivo obrazovanja? (molimo označite)
1. Osnovna škola
2. Nešto srednje škole
3. Srednja škola
4. Zanat
5. Dodiplomski studij
6. Postdiplomski studij
Zatvorena pitanja je uglavnom jednostavno pretvoriti u numerički format koji zahtijeva SPSS.
Na primjer, Da može biti kodirano sa 1, a Ne može biti kodirano sa 2.
U gore navedenom primjeru se može unijeti broj koji odgovara rednom broju odgovora. Na
primjer, ako je ispitanik označio Dodiplomski studij, ovo bi bilo kodirano sa 5. Numerisanje
svakog od mogućih odgovora pomaže procesu kodiranja. Odlučite se za jedan način
numerisanja i držite ga se tokom cijelog upitnika.
Ponekad ne možete predvidjeti sve odgovore koje vam ispitanici mogu dati, pa su zato
potrebna otvorena pitanja. Njihova prednost je u tome što ispitanici imaju slobodu da
odgovore na svoj način, a nisu ograničeni izborima koje je obezbijedio istraživač.
___________________________________________________________________________
Odgovori na otvorena pitanja mogu biti sumirani u veći broj kategorija u SPSS-u. Ove
kategorije su obično identificirane nakon što pregledamo različite nivoe odgovara ispitanika.
Neke mogućnosti također mogu biti prikupljene pregledom prethodnih istraživanja tog
područja. Svakoj od ovih kategorija odgovora je dodijeljen broj (npr. posao=1, financije=2,
veza=3) i ovaj broj se unosi u SPSS.
6
SPSS PRIRUČNIK
2.
PRIPREMANJE CODEBOOKA
Prije nego što počnete unositi podatke u SPSS, potrebno je pripremiti 'codebook'. Codebook je
sažetak uputa koje koristite da biste konvertirali informacije dobivene od svakog ispitanika ili
slučaja (case) u format koji SPSS razumije. Pripremanje codebooka uključuje odluku kako
ćete:
1. definirati i označiti svaku od varijabli; i
2. dodijeliti brojke svakom od mogućih odgovora.
Sve ove informacije trebale bi biti zabilježene u knjigu ili kompjutersku bazu podataka
(codebook). Ovo držite na sigurnom mjestu kako biste lakše pristupili podacima sljedeći put.
U vaš codebook trebali biste navesti sve varijable iz vašeg upitnika, skraćena imena varijabli
koja ćete koristiti u SPSS-u i način na koji možete kodirati odgovore.
Primjer: U prvoj koloni Tabele 2.1. navedete imena varijabli. U drugoj koloni napišete
skraćeno ime za varijable koje će se pojaviti u SPSS-u, a u trećoj pojasnite detaljno kako ćete
kodirati prikupljene odgovore.
Svako od pitanja ili itema u vašem upitniku mora imati svoje jedinstveno ime varijable. Neka
od ovih će biti jasna (npr. spol, dob), dok drugi itemi, mogu biti imenovaniskraćenicama (npr.
op1, op2, op3 se koriste da se identificiraju itemi koji čine skalu Optimizma).
7
SPSS PRIRUČNIK
Svakom od odgovora mora biti dodijeljen numerički kod prije nego što ga unesemo u SPSS.
Neke od informacija će već biti u ovom formatu (npr. dob u godinama). Druge varijable,
poput spola, će morati biti pretvorene u brojeve (npr. 1=muškarci, 2=žene).
8
SPSS PRIRUČNIK
Primjer:
Da biste kodirali odgovore gore: ako je osoba označila da je slobodna, taj odgovor kodirate sa
1, ako je u vezi to kodirate sa 2, ako je u braku 3, a ako je razveden/a to je 4.
Za otvorena pitanja – gdje ispitanici mogu odgovoriti kako oni žele – kodiranje je nešto
složenije. Na primjer, da biste kodirali pitanje„Šta je glavni izvor stresa u vašem životu, u
ovom trenutku?“, morat ćete proći kroz upitnik i potražiti uobičajene teme. Moguće je da ćete
primijetiti kako mnogo ispitanika navodi da su izvori njihovog stresa vezani s poslom,
financijama, vezama, zdravljem ili manjkom vremena. U vašem codebooku navedite ove veće
grupe odgovora pod ime varijable stres i dodijelite broj svakoj od njih (posao=1,
supružnik/partner=2, itd.). Također trebate dodati drugi numerički kod za odgovore koji nisu
upali u navedene kategorije (drugo=99).
Nakon što pripremite codebook, skoro ste spremni unijeti vaše podatke. Postoje dvije stvari
koje prvo trebate uraditi:
1. upoznati se sa SPSS-om, kako otvoriti i zatvoriti podatke, upoznati se sa različitim
prozorima i dijaloškim okvirima
2. pripremiti bazu podataka, koristeći informacije koje ste spremili u vašem
codebooku
Ponekad je najbolja kombinacija zatvorenih i otvorenih pitanja. Ovo se postiže tako što, pored
već navedenih kategorija, dodamo i kategorijuDrugo, kroz koju ispitanicima omogućavamo
da daju neki odgovor koji nije ponuđen. Obezbijedite jednu ili dvije linije na koju mogu
zapisati svoj odgovor. Ova kombinacija je posebno korisna u ranim stadijima istraživanja,
pošto daje informaciju o tome da li smo našim pitanjima adekvatno pokrili područje odgovora
koje ispitanici mogu dati.
9
SPSS PRIRUČNIK
3.
UPOZNAVANJE SA SPSS-OM
Postoji nekoliko ključnih stvari koje treba da znate o SPSS-u prije nego što počnete. Kao
prvo, SPSS koristi više različitih prozora, dizajniranih za različite svrhe. Prije nego što
pristupite ovim prozorima, morate otvoriti postojeću bazu podataka ili kreirati novu.
Ako želite da otvorite postojeću bazu podataka (npr. survey3ED), kliknite na File iz menija
na vrhu ekrana, odaberiteOpen, a zatimData. Open file dijaloški okvir će vam dopustiti da
pretražite različite foldere na vašem računaru kako biste pronašli mjesto gdje je vaša baza
pohranjena. Uvijek biste trebali otvarati baze sa hard diska na vašem kompjuteru. Ako imate
podatke na memory stick-u, prebacite ih u folder na hard disk vašeg računara prije nego što ga
otvorite. Pronađite bazu podataka u kojoj želite raditi i kliknite na Open. Upamtite, sve SPSS
baze podataka imaju .sav ekstenziju. Baza će se pojaviti pred vama u Data Editor prozoru.
10
SPSS PRIRUČNIK
U SPSS-u, dozvoljeno vam je da u isto vrijeme imate više od jedne baze podataka otvoreno.
Ovo može biti korisno, ali i zbunjujuće. Morate držati bar jednu bazu podataka otvorenu sve
vrijeme. Ako zatvorite neku bazu podataka, SPSS će vas upitati da li je želite spasiti prije
zatvaranja. Ukoliko ne spasite, izgubit ćete sve podatke koje ste unijeli i sve obrade koje ste
vršili na novim varijablama, otkako ste otvorili bazu.
11
SPSS PRIRUČNIK
Glavni prozori koje ćete koristiti u SPSS- u su Data Editor, Viewer, Pivot Table Editor,
Chart Editor i Syntax Editor.
Kada počnete s analizom podataka, imatćete više ovih prozora otvoreno u isto vrijeme, što na
početku nekim studentima može djelovati zbunjuće. Uvijek će biti otvoren Data Editorjer on
sadrži bazu podataka koju analizirate. Kada počnete raditi neku analizu, otvorit će vam se
prozor Viewer, jer su tu prikazani rezultati svih vaših analiza, poredani u onom redoslijedu po
kojem ste ih izvršavali. Ipak, ovo se ne otvara dok vi ne pokrenete neki proces analize.
Ovi prozori su poput papira na vašem stolu - možete ih premještati, tako da su nekada jedni na
vrhu, a nekada drugi. Svaki od otvorenih prozora biće naveden na dnu vašeg ekrana. Da biste
promijenili prozor, samo kliknite na onaj na kojem želite raditi. Također možete kliknuti na
komanduWindow na gornjoj meni traci (u gornjem desnom dijelu ekrana). Tu će se izlistati
svi otvoreni prozori i moći ćete odabrati onaj na kojem želite raditi.
Ponekad prozori koje SPSS pokazuje ne popune čitav ekran. Mnogo je lakše kada imate
prozor Viewer (na kojem su pokazani rezultati) na čitavom ekranu. Kako biste ovo postigli,
maksimizirajte prozor klikom na srednje dugme, u gornjem desnom uglu ekrana. Da bi prozor
opet smanjili, ponovo kliknite na to dugme.
12
SPSS PRIRUČNIK
Viewer prozor
Kada počnete raditi analize, Viewer prozor će se otvoriti automatski. Ovaj prozor pokazuje
rezultate analize koje ste provodili, uključujući i tabele i grafikone. U ovom prozoru možete
modificirati output, izbrisati ga, kopirati ga, spasiti ga, ili ga čak prenijeti u Word dokument.
Kada spasite output u SPSS-u, spašen je zasebno sa .spo ekstenzijom, kako bi se razlikovao
od baza podataka koje imaju .sav ekstenziju. Viewer ekran se sastoji od dva dijela. Na lijevom
je outline, koji vam daje puni pregled analiza koje ste sproveli. Možete iskoristiti ovu stranu
da biste navigirali kroz vaš output (ponekad može postati jako dugačak). Samo kliknite na dio
na koji želite preći i on će se pojaviti na desnoj strani ekrana. Na desnoj strani Viewer prozora
su rezultati vaših analiza, koji mogu uključivati tabelarne i grafičke prikaze rezultata.
Spašavanje output-a
Da biste spasili rezultate vaših analiza morate ispred sebe imati Viewer prozor. Kliknite na
Filena vrhu ekrana, te potom kliknite na Save. Odaberite folder u koji želite spasiti vaš
output, a potom ukucajte ime koje jedinstveno identificira vaš output. Kliknite na Save. Da
bismo imenovali baze, koristimo skraćenicekoje sadrže ime baze podataka na kojoj radimo i
datum kada smo provodili analizu. Naprimjer, baza survey8may2006.spo sadržavat će analizu
koju smo proveli osmog maja 2006. koristeći bazu survey3ED. Neki autori čuvaju zapise svih
imena baza, zajedno sa detaljima analiza koje su izvedene. Ovako je lakše vratiti se na
rezultate jedne specifične analize.Kada započnete vlastito istraživanje, vidjet ćete kako
možete vrlo brzo akumulirati mnogo različitih baza koje sadrže rezultate različitih analiza.
13
SPSS PRIRUČNIK
Stoga, kako bi izbjegli konfuziju i frustracije, održavajte zapise analiza koje ste uradili i
mjesta na kojima ste ih sačuvali.
14
SPSS PRIRUČNIK
prozoru možete modificirati izgled i format vašeg grafikona, promijeniti font, boje, šablone, i
markere linija.
15
SPSS PRIRUČNIK
U svakom od prozora koje otvorite SPSS vam nudi vrlo veliki izbor menija. Ovi meniji su
prikazani u vidu malih ikona (ili slika), i također u podmenijima na vrhu ekrana. Da vam ne bi
bilo previše, na početku naučite one ključne, a kada steknete više iskustva možete
eksperimentirati s drugima.
Nakon što odaberete opciju na meniju, svi upiti za daljnje informacije o odabranoj opciji će se
vršiti u dijaloškim okvirima. Sljedeći korak je, potom, da nominirate varijable koje želite
koristiti.
16
SPSS PRIRUČNIK
Odatle možete otvoriti više dodatnih poddijaloških okvira, u kojima je moguće specificirati
statistiku koju želite upotrijebiti, grafikone koje želite generirati i format u kojem želite da
rezultati budu prikazani. Ovisno o proceduri ili analizi koja se izvršava,dostupne su različite
opcije, ali osnovni principi korištenja dijaloških okvira su uvijek isti. Kako biste indicirali
koje varijable želite upotrijebiti, trebate označiti odabrane varijable na listi u lijevom dijelu
dijaloškog okivra (tako što kliknete na njih), a zatim kliknete na strelicu da ih premjestite u
prazan okvir Variable(s). Varijable možete selektirati jednu po jednu ili tako što odaberete
veću grupu varijabli i premjestite ih klikom na strelica. Ako su varijable koje želite da
odaberete sve navedene skupa, samo kliknite na prvu, držite Shift tipku na tastaturi i pritisnite
tipku za dolje na tastaturi, dok ne označite sve željene varijable. Potom kliknite na strelicu i
sve će se selektirane varijable pomjeriti u okvir Variable(s). Ako se varijable koje želite
selektirati nalaze na različitim mjestima na listi, prvo kliknite na prvu varijablu koju želite, a
potom držećiCtrl tipku kliknete na ostale željene varijable. Nakon što označite sve željene
varijable, kliknite na strelicu kako bi ih premjestili u okvir. Da biste uklonili varijable iz
okvira, samo obrnite proces. Odaberite varijable koje želite ukloniti u okviru Variable(s),
kliknite na strelicu, i to će premjestiti varijable nazad u originalnu listu. Primijetit ćete da se
pravac strelice promijeni ovisno o tome da li varijable ubacujete ili uklanjate iz Variable(s)
okvira.
17
SPSS PRIRUČNIK
U većini dijaloških okvira primijetit ćete više standardnih dugmadi (OK, Paste, Reset,
Cancel, i Help).Ova dugmad služe za:
OK: Kliknite na ovo dugme kada selektirate vaše varijable i kada ste spremni da
pokrenete analizu ili proceduru.
Paste: Ovo dugme se koristi da bi se prebacile komande koje je SPSS generirao u
ovom dijaloškom okviru na Syntax Editor. Ovo je korisno ako želite da zadržite
zapise o komandi ili da ponovite neku analizu više puta.
Reset: Ovo dugme se koristi da bi se očistio dijaloški okvir i otkazuje sve komande
koje ste možda zadali, a koje su u vezi sa određenom procedurom.
Help: Kliknite na ovo dugme da biste dobili informacije o tehnikama ili procedurama
koje ćete izvršiti.
Kada završite s radom u SPSS-u i želite da zatvorite program, kliknite na Filena lijevom vrhu
ekrana, pa onda kliknite na Exit. SPSS će vas podsjetiti da spasite podatke i bazu koja sadži
vaš output. SPSS dodaje svakoj bazi ekstenziju da bi indicirala vrstu informacije koje sadrži.
Baza podataka će imati .sav ekstenziju, output će imati .spo ekstenziju, a baza sintakse će
imati .sps ekstenziju.
Ako vam je potrebna pomoć dok koristite SPSS ili ne znate šta neke opcije znače, možete
koristiti ugrađeni Help meni. Kliknite naHelp na meni traci i ponudit će vam se više izbora.
Možete pitati za različite teme, proći kroz Tutorial, ili se konsultirati sa Statistc Coach. Ova
zadnja opcija vas vodi korak po korak kroz proces donošenja odluka uključen u odabir pravih
statističkih postupaka. U svakom od glavnih dijaloških okvira postoji dodatni Help meni koji
će vam pomoći sa procedurama koje odaberete. Pored toga, možete tražiti informacije o
različitim opcijama koje se nalaze u poddijaloškim okvirima. Pomjerite kursor na opcije za
koje niste sigurni i kliknite jedanput desnim klikom. Na ovaj način će se prikazati mali okvir
koji ukratko objašnjava određenu opciju.
18
II DIO
PRIPREMANJE BAZE PODATAKA
SPSS PRIRUČNIK
4.
PRAVLJENJE BAZE PODATAKA I UNOS PODATAKA
Za pripremu baze, unošenje i analizu podataka potrebno je proći kroz nekoliko koraka. U
ovom poglavlju ćete proći kroz te korake.
20
SPSS PRIRUČNIK
Prije nego podesite bazu, bilo bi dobro provjeriti opcije u SPSS-u koje određuju kako se
podaci prikazuju. Opcije dozvoljavaju podešavanje načina na koji su varijable prikazane, vrste
tabela koje će biti prikazane u rezultatima i mnoge druge aspekte programa. Neke od ovih
stvari se mogu činiti zbunjujućim u početku, ali kada unesete podatke i izvršite analize možda
ćete se htjeti vratiti na ovo poglavlje.
21
SPSS PRIRUČNIK
Da otvorite Options prozor, kliknite na Edit na glavnom meniju i odaberite Options. Trebali
biste vidjeti prozor kao na slici. Imate mnogo opcija, ali većinu od njih nećete morati
podešavati. Ključne opcije su opisane ispod i organizirane su po tabovima u kojima se nalaze.
Nemojte klikati na OK dok niste završili sa podešavanjem svih opcija koje želite podesiti u
svakom od tabova.
General tab
Kada radite analizu možete željeti da varijable budu prikazane po abecednom redu ili po
redoslijedu kako su unešene u bazu. U odjeljku Variable Lists odaberite File ako želite da
budu po redoslijedu u kom su unesene.
U Output odjeljku na desnoj strani, označite No scientific notation for small numbers in
tables. Ovo će spriječiti da dobijete nepotrebne brojeve u rezultatima analize. U odjeljku
22
SPSS PRIRUČNIK
Notification označite Raise viewer window i Scroll to new output opcije. Ove opcije znače
da će SPSS prilikom analize podataka otvoriti Viewer prozor u kojem će prikazati rezultate.
Data tab
Kliknite na Data tab da podesite način na koji će podaci biti prikazani. Ako vaše varijable
nemaju decimalnih mjesta, trebali biste promijeniti način prikazivanja varijabli. U odjeljku
Display Format for New Numeric Variables promijenite opciju Decimal Places na 0. Ovo
znači da će sve nove varijable biti prikazane bez decimalnih mjesta što smanjuje veličinu baze
i poboljšava preglednost.
Charts tab
Kliknite na Charts tab da podesite izgled grafika. Možete promijeniti Chart Aspect Ratio,
ako želite, ili podesiti način na koji se grafici prikazuju (npr. font, boje, linije).
Stil tabele možete mijenjati onoliko često koliko to želite, međutim, nakon što ste proveli
analizu nećete moći promijeniti stil tabele u rezultatima (osim ukoliko ne zanemarite
rezultate, promijenite stil tabele i ponovo provedete analizu podataka).
Nakon provedene analize ne možete mijenjati stil tabele, ali možete koristiti Pivot Table
Editor da promijenite neke dijelove tabele poput veličine fonta ili širine kolona. Da otvorite
Pivot Table Editor kliknite dvaput na tabelu koju želite podesiti.
23
SPSS PRIRUČNIK
Kada ste završili sa podešavanjem svih opcija u svim tabovima, kliknite OK. Sada možete
definirati varijable i unijeti podatke.
Prije nego unesete podatke morate reći SPSS-u kako se vaše varijable zovu i kako ih pravilno
kodirati. To se zove definiranje varijabli, a uradit ćete to u Data Editor prozoru. Data Editor
prozor se sastoji od dva preglednika: Data View i Variable View. Da odaberete aktivni
preglednik kliknite u donjem lijevom uglu na odgovarajući tab.
U Data View pregledniku, svaka kolona je označena sa var u početku. Ovi nazivi će biti
zamijenjeni nazivima vaših varijabli kada ih unesete. Sa lijeve strane su brojevi 1,2,3... Ovo
su brojevi ispitanika koje SPSS dodjeljuje svakom skupu rezultata u linijama. Ovi brojevi nisu
isti kao ID brojevi i mogu se promijeniti ako napravite drugačiji redoslijed u bazi ili je
podijelite na dijelove.
24
SPSS PRIRUČNIK
Vaš posao je da definirate svaku varijablu tako što ćete unijeti potrebne informacije za svaku
varijablu u vašem kodu. Neke od informacija ćete morati unijeti vi (poput naziva varijable), a
neke druge karakteristike će biti popunjene automatski koristeći unaprijed definirane
vrijednosti. Ukoliko je potrebno, unaprijed definirane vrijednosti je moguće izmijeniti. U
nastavku slijedi jednostavna procedura koja će vas korak po korak provesti kroz karakteristike
varijabli, a kada se bolje upoznate sa programom otkrit ćete način za brže popunjavanje svih
karakteristika što je objašnjeno kasnije u ovom poglavlju u odjeljku ''Opcionalne prečice''.
Naziv (Name)
U ovu kolonu unesite kratak naziv za vašu varijablu koji će vam pomoći da lahko pronađete
varijablu u bazi. Imena bi trebala biti što kraća. Svaki naziv mora biti unikatan, mora počinjati
sa slovom i ne može sadržavati simbole i prazne prostore. Ukoliko naziv varijable nije
pravilno unesen, SPSS neće dozvoliti da radite sa tom varijablom dok ispravno ne unesete
naziv varijable.
Vrsta (Type)
Unaprijed definirana vrijednost za vrstu varijable je Numeric, što znači da SPSS posmatra
varijablu kao numeričku i u većini slučajeva to je vrijednost koju trebate koristiti. U slučaju
da vaša varijabla nije numerička, već ima tekstualne vrijednosti, trebate odabrati vrijednost
String. Također, postoji i vrijednost Date ukoliko vrijednosti vaših rezultata uključuju
datume. Da promijenite vrstu varijable kliknite na vrijednost i mala kocka sa tri tačke će se
pojaviti na koju zatim trebate kliknuti. U ovom prozoru također možete podesiti širinu
varijable i broj decimalnih mjesta.
Širina (Width)
Unaprijed definirana vrijednost za širinu je 8, što znači da kao rezultat možete unijeti 8
brojeva ili slova. U većini slučajeva ne morate mijenjati ovu vrijednost, osim ako imate
veoma velike vrijednosti ili varijabla ima tekstualne vrijednosti.
25
SPSS PRIRUČNIK
Oznaka (Label)
Kolona sa oznakavam omogućava da unesete duži opis vaše varijable u odnosu na kratki opis
u koloni za naziv. Ovaj opis SPSS koristi prilikom predstavljanja rezultata analize. Npr. ovdje
možete dati oznaku „Ukupni Optimizam“ za varijablu kojoj ste dali ime UKOPT.
Vrijednosti (Values)
U koloni vrijednost možete definisati značenje vrijednosti koje ste koristili za kodiranje vaših
varijabli. Demonstrirat ćemo ovaj proces koristeći varijablu Spol.
Kada kasnije budete unosili vrijednosti, u bazu unosite vrijednosti 1 ili 2 za varijablu spol, a
SPSS to prepoznaje kao „Muški“ ili „Ženski“ spol, jer ste u prethodnim koracima to definirali
za vašu varijablu.
Nedostajuće (Missing)
Ponekad istraživači definišu posebne vrijednosti za varijable kojima nedostaju vrijednosti.
Ovo nije neophodno, jer SPSS svaku praznu ćeliju prepoznaje kao nedostajuću vrijednost.
Ukoliko planirate na mjestu gdje nedostaju podaci ostaviti prazne ćelije, ne morate podešavati
ovu vrijednost.
Međutim, ako na mjestima gdje vam nedostaju podaci planirate unositi neku specifičnu
vrijednost (npr. 99 = Nije primjenjivo), onda morate specifirati ovu vrijednost u Missing
koloni, jer će u suprotnom SPSS vašu vrijednost „99“ smatrati stvarnim rezultatom koji će
uvrstiti u analizu. Kliknite unutar ćelije, zatim na tri tačke. U novom prozoru odaberite opciju
Discrete missing values i unesite vrijednost (npr. 99). Možete definirati maksimalno tri
vrijednosti, zatim kliknite na OK. Ako koristite ove vrijednosti, bilo bi dobro dodijeliti im i
vrijednosti u Value koloni.
26
SPSS PRIRUČNIK
Kolona (Columns)
Unaprijed definirana vrijednost je 8, što je dovoljno za većinu varijabli. Promijenite samo u
slučaju da je potrebno prilagoditi vašim vrijednostima ili dugim nazivima varijabli.
Poravnanje (Align)
Varijable su obično podešene na desno poravnanje i nema potrebe mijenjati ovu vrijednost.
Skala (Measure)
Kolona označena sa Measure se odnosi na skalu mjerenja koju koristi vaša varijabla.
Unaprijed definirana vrijednost je Scale što znači da su podaci kontinuirani i mjereni na
intervalnoj ili racio skali. Ukoliko vaša varijabla mjeri kategorije (npr. Spol), kliknite u ćeliju,
zatim na strelicu i odaberite Nominal (za kategorijalne varijable) ili Ordinal (ukoliko vaši
podaci uključuju rangiranje, npr. nivo završenog obrazovanja).
Opcionalne prečice
Proces opisan iznad može biti zamoran ukoliko imate veliki broj varijabli. Postoji mnogo
načina da ubrzate ovaj proces. Ako imate veliki broj varijabli koje imaju iste atribute (vrstu,
širinu, broj decimala, itd.), možete podesiti sve atribute za jednu varijablu, a zatim ih kopirati
na sve druge varijable koje imaju iste atribute.
27
SPSS PRIRUČNIK
Ovaj postupak će napraviti 5 novih varijabli (Optim2, Optim3, Optim4, Optim5, Optim6). Da
podesite sve ostale iteme na drugim skalama jednostavno ponovite proces opisan iznad.
Zapamtite, ova procedura se može koristiti samo ako varijable imaju sve iste atribute. Ukoliko
neke od varijabli imaju različite skale mjerenja ili neke druge atribute, ova procedura nije
pogodna, iako možete nakon provođenja procedure promijeniti pojedinačne atribute čime
ubrzavate proces pojedinačnog podešavanja svih atributa za svaku od varijabli.
28
SPSS PRIRUČNIK
Nakon što ste definirali sve varijable i podesili njihove atribute, spremni ste za unos rezultata.
Nakon što ste definirali varijable i unijeli podatke, vaš Data Editor bi trebao izgledati kao na
slici 3.1. Ako ste za vaše varijable definisali oznake (npr. Spol: 1=Muški, 2=Ženski), onda
možete odabrati da umjesto brojeva Data Editor prikazuje oznake. Da to uradite, otvorite
View meni i odaberite opciju Value Labels. Ovu opciju također možete uključiti i tokom
unosa rezultata.U tom slučaju ne morate unostiti rezultate tipkanjem, već klikom na ćeliju
možete odabrati jednu od unaprijed definiranih vrijednosti. Da isključite ovu opciju opet odite
na View meni i kliknite Value Labels.
Nakon što ste definirali varijable i unijeli podatke, vaš Data Editor bi trebao izgledati kao na
slici 3.1. Ako ste za vaše varijable definisali oznake (npr. Spol: 1=Muški, 2=Ženski), onda
možete odabrati da umjesto brojeva Data Editor prikazuje oznake. Da to uradite, otvorite
View meni i odaberite opciju Value Labels.
29
SPSS PRIRUČNIK
Nakon što ste kreirali bazu možda ćete htjeti da je izmijenite (npr. da dodate nove varijable,
izbrišete ispitanike, itd.). Otvorite Data View.
Brisanje ispitanika
Označite cijeli red tako što kliknete na redni broj ispitanika na lijevom kraju tabele. Zatim
pritisnite tipku Delete na tastaturi ili otvorite Edit meni, a zatim odaberite Clear.
Brisanje Varijable
Slično kao sa ispitanicima, jednim klikom na vrh kolone koja sadrži vašu varijablu možete
označiti cijelu kolonu, a zatim pritisnite Delete na tastaturi ili odaberite opciju Clear iz Edit
menija da biste obrisali željenu varijablu.
Baze podataka se mogu napraviti i u Microsoft Excel-u, a zatim prenijeti u SPSS kako bi se
provela analiza. Procedura za pravljenje baze je opisana ispod, međutim, da bi koristili ovu
metodu morate već posjedovati osnovno znanje o radu sa Excelom, jer ovaj priručnik neće
sadržavati upute vezane za Excel.
Napomena: Excel može imati maksimalno 256 kolona podataka (varijabli). Ukoliko vaši
podaci zahtijevaju veći broj varijabli, u tom slučaju je preporučljivo bazu praviti u SPSS-u.
30
SPSS PRIRUČNIK
Baza će biti otvorena a varijable će biti ispisane na vrhu tabele. Sada trebate spasiti bazu kao
SPSS fajl.
31
SPSS PRIRUČNIK
Kada kasnije budete ponovo otvarali ovu bazu, otvarajte verziju sa oznakom .sav a ne
originalnu Excelovu verziju sa oznakom .xls ili .xlsx.
Ponekad je potrebno spojiti dvije ili više baza u jednu.SPSS vam omogućava da spojite baze
dodavanjem ispitanika na kraju baze ili dodatnih varijabli za postojeće ispitanike (npr. kada
imate rezultate drugog mjerenja). Ova opcija je također pogodna kada imate Excel fajlove sa
podacima u nekoliko tabela koje treba spojiti prema ID-u.
Procedura:
1. Otvorite prvu bazu koju želite spojiti.
2. Iz Data menija odaberite Merge Files, a zatim Add Cases.
3. U prozoru koji se otvori kliknite na An external SPSS data file i odaberite bazu sa kojom
želite spojiti (ukoliko je i druga baza istovremeno otvorena u SPSS-u bit će ispisana iznad u
opciji An open dataset).
4. Kliknite na Continue,a zatim na OK. Spasite novu bazu koristeći novo ime (File – Save
As).
32
SPSS PRIRUČNIK
Procedura:
1. Poredajte obje baze po ID brojevima od najmanjeg prema najvećem tako što ćete iz Data
menija odabrati Sort Cases, a zatim opciju ID.
2. Iz Data menija odaberite opciju Merge Files,potomAdd Variables.
3. U prozoru koji se otvori kliknite na An external SPSS data file i odaberite bazu sa kojom
želite spojiti (ukoliko je i druga baza istovremeno otvorena u SPSS-u bit će ispisana iznad u
opciji An open dataset).
4. U Excluded Variables listi ćete vidjeti ID varijablu (automatski je isključena iz procesa
spajanja zato što se nalazi u obje baze i nema potrebe za spajanjem). Ako na ovoj listi imate i
neke druge varijable osim ID, morat će te ih preimenovati koristeći Rename funkciju kako bi
imale unikatno ime.
5. Kliknite na ID varijablu, a zatim označite Match cases on key variables, te potom kliknite
na strelicu da prebacite ID varijablu u Key Variables listu. Ovo znači da će svi podaci biti
upareni prema ID broju. Kliknite Continue, zatim OK.
6. Spasite novu bazu koristeći novo ime ( File – Save As).
SPSS sadrži mnoge korisne funkcije koje možete koristiti prilikom analize kako bi uštedjeli
vrijeme. Neke od najbitnijih su objašnjene u nastavku.
Sortiranje ispitanika
Možete sortirati bazu prema vrijednostima u vašim podacima (npr. prema spolu, dobi..).
33
SPSS PRIRUČNIK
Kada izvršite statističku analizu, nakon uključenja ove opcije, dobit ćete odvojene analize za
ispitanike u svakoj od grupa. ZAPAMTITE: Kada završite sa analizom isključite ovu opciju.
Analize koje provedete nakon uključivanja ove opcije će pokazati rezultate samo za odabranu
grupu ispitanika.
34
SPSS PRIRUČNIK
ZAPAMTITE: Kada završite sa analizom isključite ovu opciju, jer će u suprotnom SPSS svaku
sljedeću analizu provesti samo na odabranoj skupini ispitanika.
Kada radite sa velikim bazama podataka može postati zamorno da prolazite kroz sve varijable
da dođete do onih koje vas zanimaju u tom trenutku. SPSS, stoga, dozvoljava kreiranje setova
varijabli. Ovu opciju možete isprobati u survey3ED.sav bazi koja sadrži veliki broj
individualnih varijabli koje čine finalni skor. U primjeru ispod ćemo napraviti set varijabli
koji uključuje samo demografske podatke i finalni skor.
Procedura:
1. Kliknite na Utilities meni i odaberite Define Variable Sets opciju.
2. Odaberite varijable koje želite staviti u set. Za ovaj primjer odaberite ID, sve demografske
varijable (od Spola sve do Edukacije) a zatim i sve ukupne skorove na kraju baze od Ukupnog
Optimizma, pa do kraja. Premjestite ove varijable u Variables in Set listu.
3. U Set Name prostoru unesite odgovarajuće ime za vaš set.
4. Kliknite na Add Set dugme, zatim na Close.
Kada je set aktiviran, samo varijable koje pripadaju tom setu će biti prikazane u bazi i u
opcijama za provođenje analiza.
35
SPSS PRIRUČNIK
36
SPSS PRIRUČNIK
5.
PROVJERA ISPRAVNOSTI BAZE PODATAKA
Prije nego što pređete na statističke analize, veoma je bitno provjeriti da li u bazi ima grešaka.
Prilikom unosa podataka može se desiti da nehotice unesete pogrešan broj što može utjecati
na rezultate, posebno kod nekih analiza koje su veoma osjetljive na ''outliere'', odnosno
vrijednosti koje su veće ili manje od ostatka rezultata. Stoga je neophodno proći kroz proces
traženja grešaka u vašoj bazi prije nego što krenete sa bilo kakvim analizama. Vježbu možete
proći koristeći bazu error3ED.sav.
Prije nego što počnete sa ovim, iz Edit menija odaberite Options, a zatim u Output Labels
tabu pronađite Variable values in labels shown as: i odaberite Values and Labels. Ovo će
omogućiti istovremeno prikazivanje i oznaka i vrijednosti varijabli, što će traženje grešaka
učiniti lakšim.
Kada tražite greške, prvo na što trebate obratiti pažnju su vrijednosti koje odstupaju od
mogućih (npr. ukoliko za varijablu Spol imate moguće rezultate 1=Muško i 2=Žensko, onda
se bilo koji drugi rezultat osim 1 i 2 smatra greškom).
Ispod su objašnjena dva načina provjere grešaka, prvi je pogodniji za kategorijalne varijable, a
drugi za kontinuirane varijable.
37
SPSS PRIRUČNIK
Statistics
Frequency Table
sex
PRIMARY 2 ,5 ,5 ,5
COMPLETED
Valid 123 28,0 28,0 87,0
UNDERGRADUATE
POSTGRADUATE
56 12,8 12,8 99,8
COMPLETED
22 1 ,2 ,2 100,0
38
SPSS PRIRUČNIK
U outputu ćete dobiti nekoliko tabela kao što je prikazano. Prva tabela daje osnovne
informacije o svim označenim varijablama, a ostale tabele daju detaljne informacije sa
rezultatima i frekvencijama za sve varijable pojedinačno.
39
SPSS PRIRUČNIK
Ukoliko ste utvrdili da postoje rezultati koji ne spadaju u vaše očekivane rezultate, potrebno
ih je pronaći i ispraviti. S obzirom da baze mogu biti velike, traženje analiziranjem svakog
ispitanika bi moglo potrajati. Stoga postoje prečice.
U Data View tabu su vaši ispitanici sada poredani poredani od najvećih na vrhu tabele do
najmanjih na dnu, u željenoj varijabli. Vrijednosti koje su prelazile preko maksimalne
vrijednosti će sada biti na vrhu. Utvrdite za koje ispitanike ste pogrešno unijeli rezultate
provjerom njihovog ID-broja, te pronađite sirove podatke i unesite tačan rezultat.
40
SPSS PRIRUČNIK
Još jedan bitan aspekt SPSS-a je analiza ispitanika. Ovo vam omogućava da pogledate
specifične informacije za svakog ispitanika.
Zadaci za vježbu:
2. Sve promjene u opcijama iz prethodnog zadatka poništi (odnosno vrati sve opcije na
početne)!
3. Definirajte varijable:
a) Definiraj varijablu id (identification number)
b) Definiraj varijablu koja dijeli ispitanike na muškarce i žene
c) Definiraj varijablu: Dob ispitanika
d) Definiraj varijablu: Visina ispitanika
41
SPSS PRIRUČNIK
4. Sortiranje ispitanika:
a) U bazi podataka depress3ED poredati ispitanike po varijabli dob (age) od najstarijeg
do najmlađeg .
b) U bazi podataka survey3ED poredati ispitanike po varijabli smoke, tako da nam se
najprije izlistaju nepušači, zatim pušači.
c) U bazi podataka sleep3ED poredati ispitanike po težini (weight) od najtežih do
najlakših.
d) U bazi podataka sleep3ED poredati ispitanike od najnižeg do najvišeg (height).
e) U bazi podataka sleep3ED poredati ispitanike tako da nam najprije budu izlistani
muškarci zatim žene.
7. Korištenje setova:
a) U bazi podataka survey3ED analizirati total skorove isključivo za varijable ID i sex.
b) U bazi podataka survey3ED analizirati total skorove samo za varijable smoke i age.
c) U bazi podataka survey 3ED usporediti vrijednosti varijable problem, varijable liteslp
i varijable sex.
8. U bazi error3ED.sav:
a) Provjeri greške u varijablama: spol, bračni status, izvor stresa, konzumiranje cigareta
(pušenje), djeca.
9. U bazi error3ED.sav:
a) Pronađi greške u varijablama spol, izvor stresa, optimizam, samopouzdanje,
prepoznati stres preko opcije „Sort cases“.
43
SPSS PRIRUČNIK
44
SPSS PRIRUČNIK
45
SPSS PRIRUČNIK
46
III DIO
PRELIMINARNE ANALIZE
SPSS PRIRUČNIK
6.
DESKRIPTIVNA STATISTIKA
Varijable kojima jednostavno klasificiramo pojave u jednu od grupa ili kategorija (npr. spol)
nazivamo kategorijalnim varijablama. Kategorijalne varijable su varijable koje koriste
nominalnu skalu mjerenja. Način na koji koristimo deskriptivnu statistiku na kategorijalnim
varijablama je preko frekvencija. Frekvencije nam govore o učestalosti pojedinih odgovora
(npr. broj muškaraca) u uzorku. Za ilustraciju koraka koristit će se baza survey3ED.sav.
48
SPSS PRIRUČNIK
2. Klikni na varijablu koju želiš prikazati i prebaci je u Variable box. Obrati pažnju na to
da to bude kategorijalna varijabla (npr. spol).
3. Klikni na Continue, zatim OK ( ili Paste za spremiti u Syntax Editor.)
Statistics
Sex
Valid 439
N
Missing 0
sex
Interpretacija outputa:
Output iznad prikazuje uzorak od 439 ispitanika (185 muškaraca, 254 žene). Također, u tabeli
su vidljivi postoci muškaraca (42.1%) i žena (57.9%) u ukupnom uzorku. Zbog analiza koje
će se koristiti vrlo je važno poznavati broj ispitanika u određenim podgrupama. Za neke
analize (npr. ANOVA) je lakše imati približno jednake veličine grupa. Ako imamo
neujednačene veličine grupa, naročito ako su grupe male, neprikladno je provođenje
određenih analiza.
49
SPSS PRIRUČNIK
Kontinuirane varijable se odnose na varijable koje, teorijski, mogu poprimiti bilo koju
vrijednost iz određenog intervala.
Deskriptivna statistika na kontinuiranim varijablama se uglavnom sastoji od pregleda mjera
centralne tendencije i mjera varijabiliteta, tj. statističkih veličina kao što su: aritmetička
sredina, mod, medijana, standardna devijacija, te varijanca.
Medijana (centralna vrijednost) je vrijednost koja distribuciju dijeli na dva jednaka dijela, tj.
vrijednost koja se u nizu podataka poredanih po veličini nalazi tačno u sredini. Npr. u skupu
podataka X= (2,7,4,5,6,7,2), položaj medijane je (7+1)/2= 4, što znači da se centralna
vrijednost nalazi na četvrtom mjestu niza rezultata poredanih po veličini, X= 2, 2, 4, 5, 6, 7,
7), C= 5.
Aritmetička sredina je suma svih rezultata podijeljenja brojem rezultata. Aritmetička sredina
predstavlja težište rezultata i stoga je osjetljiva na ekstremne vrijednosti rezultata. U gornjem
skupu podataka – X= (2,7,4,5,6,7,2) – aritmetička sredina iznosi M= 4,71.
50
SPSS PRIRUČNIK
distribucija podataka normalna ili barem simetrična, i kada je korištena intervalna ili racio
skala mjerenja.
Za ilustraciju koristit će se baza survey3ED.sav.
Total perceived
433 12 46 26,73 5,848 ,245 ,117 ,182 ,234
stress
Age 439 18 82 37,44 13,202 ,606 ,117 -,203 ,233
Total Optimism 435 7 30 22,12 4,429 -,494 ,117 ,214 ,234
Total Mastery 436 8 28 21,76 3,970 -,613 ,117 ,285 ,233
Valid N (listwise) 432
Interpretacija outputa:
Output iznad prikazuje sumirane informacije koje su tražene o varijablama. Npr., što se tiče
varijable dob (sex), vidimo prikaz od 439 ispitanika, opseg godina od 18 do 82, aritmetičku
sredinu 37,44 i standardnu devijaciju 13,20. Ovi podaci mogu biti iskorišteni u dijelu
izvještaja Metodologija kako bi opisali karakteristike uzorka.
Opisi podataka, pružaju informacije i o distribuciji rezultata na kontinuiranim varijablama
(skewness i kurtosis). Ove informacije mogu poslužiti ukoliko se koriste parametrijski
statistički postupci (npr. t-test, ANOVA).
51
SPSS PRIRUČNIK
Kada radimo istraživanje, naročito sa ljudskim bićima, rijetko možemo dobiti potpune
podatke za svakog ispitanika. Zbog toga je važno provjeriti bazu na nedostajuće podatke.
Pokretanjem opcije Descriptives može se provjeriti koji procenat vrijednosti nedostaje za
svaku od varijabli. Ukoliko bude pronađena varijabla sa dosta neočekivanih nedostajućih
podataka, potrebno je razmotriti da li se nedostajuća vrijednost pojavljuje slučajno ili je u
pitanju neki sistematski faktor.
Također treba uzeti u obzir kako se nositi sa nedostajućim podacima kada se dođe do
statističke analize. U funkciji Options u SPSS-u možemo odabrati kako želimo da se SPSS
nosi sa nedostajućim podacima.
Treba biti oprezan u izboru, jer može imati dramatične efekte na rezultate. Ovo je izuzetno
važno ako uključujete listu varijabli i ponavljate listu analiza za sve varijable.
Opcija Exclude cases listwise uključuje slučajeve (cases) u analizu samo ako imaju
potpune podatke o svim varijablama navedenim u odjeljku Variables za taj slučaj.
Case će biti totalno isključen iz analize čak ako jedan dio informacije nedostaje. Ovo
može ozbiljno i nepotrebno ograničiti veličinu uzorka.
Exclude cases pairwise isključuje slučajeve (ispitanike, cases) jedino ako nedostaju
podaci potrebni za specifičnu analizu. Oni će i dalje biti uključeni u neku od analiza za
koje postoje neophodne informacije.
Replace with mean opcija, izračunava srednju vrijednost varijabli, i daje svakom
nedostajućem podatku tu vrijednost. Ova opcija ne bi trebala biti korištena, jer može
ozbiljno iskriviti rezultate naše analize, naročito ako imamo dosta nedostajućih
vrijednosti.
Uvijek je korisno provjeriti u Options koja od ovih opcija je označena. Najčešće se
preporučuje opcija pairwise exclusion za nedostajuće podatke.
52
SPSS PRIRUČNIK
53
SPSS PRIRUČNIK
Cases
Descriptives
Median 26,00
Variance 34,194
Minimum 12
Maximum 46
Range 34
Interquartile Range 8
54
SPSS PRIRUČNIK
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
55
SPSS PRIRUČNIK
56
SPSS PRIRUČNIK
Interpretacija outputa:
Kao što je vidljivo, SPSS je generirao mnogo outputa. Međutim, ukoliko se zna na koje
dijelove treba obratiti pažnju, interpretacija nije toliko teška:
Prva tabela Descriptives sadrži informacije vezane za deskriptivnu statistiku
(aritmetičku sredinu, medijanu, standardnu devijaciju, minimum, maksimum, skjunis,
kurtozis, itd.). Značajan podatak iz tabele predstavlja 5% Trimmed mean. Kako bi
izračunao ovu vrijednost, SPSS je iz uzorka izbacio 5% gornjih i donjih rezultata, i
zatim ponovo izračunao aritmetičku sredinu. Uporedbom prave aritmetičke sredine
(Mean = 26.73) i aritmetičke sredine bez ekstremnih vrijednosti (5% Trimmed mean
= 26.64), možemo vidjeti koliki utjecaj na aritmetičku sredinu imaju ekstremni
rezultati.
U tabeli koja se naziva Tests of normality, pokazani su rezultati Kolmogorov-
Smirnovog testa. Na osnovu njega možemo vidjeti da li oblik distribucije statistički
značajno odstupa od normalnosti. Kao što vidimo, statistička značajnost od .000
pokazuje da distribucija zaista značajno odstupa od normalne. Ovaj podatak nas ne bi
trebao iznenaditi s obzirom da je ovakva pojava česta kod većih uzoraka.
Stvarni oblik distribucije vidljiv je na osnovu histograma, gdje se u ovom konkretnom
primjeru zaista oslikava normalna krivulja. Ovaj zaključak donekle podržavaju i
Normal Q-Q plot i Detrended Normal Q-Q plot. Dijagrami se temelje na
odstupanju dobivene distribucije od teorijski savršene distribucije. U ovom primjeru se
krugovi samo kod prvog dijagrama relativno čitavom dužinom pozicioniraju oko
središnje linije što indicira normalnost.
U gornjem primjeru, distribucija podataka je poprilično normalnog oblika. Ipak, vrlo često
ovo nije slučaj. Mnoge skale i varijable u socijalnim znanostima imaju distribucije koje su
asimetričnog oblika. Uzrok tome je mnogo više priroda mjerenog konstrukta nego problem sa
korištenom skalom. Tako je skala zadovoljstva životom većinom negativno asimetrična, iz
razloga što su mnogi ljudi uglavnom zadovoljni svojim životima, dok su, na primjer, kliničke
mjere anksioznog ili depresivnog poremećaja uglavnom pozitivno asimetrične u općoj
populaciji, s obzirom da je primjetan veoma mali broj simptoma ovih poremećaja kod većine
ljudi.
57
SPSS PRIRUČNIK
Ekstremni rezultati mogu imati dramatične efekte na koeficijent korelacije, naročito na malim
uzorcima. U nekim okolnostima ekstremni rezultati mogu da učine vrijednost korelacije
mnogo većom, nego što ona zapravo jest, dok u drugim okolnostima mogu doprinijeti znatno
manjem koeficijentu korelacije. Ekstremni rezultati se pojavljuju najčešće zbog greške
prilikom unosa podataka, neopreznog odgovora ispitanika ili to može ipak biti prava
vrijednost prilično specifičnog pojedinca. Ako se pronađe ekstremni rezultat, potrebno je
provjeriti greške i ispraviti ih ako je prikladno. Također se u obzir može uzeti uklanjanje ili
rekodiranje neodgovarajućih vrijednosti, kako bi se smanjio utjecaj koji te vrijednost imaju na
korelaciju.
58
SPSS PRIRUČNIK
(26.73 i 26.64) su dosta slične. S obzirom na ovo, uključit ćemo krajnje vrijednosti u
analize.
Jedan od načina da se pronađu ekstremne vrijednosti jest da se preko funkcije Sort -
koja se nalazi u meniju Data na vrhu SPSS-a – vrijednosti u varijabli od interesa
poredaju uzlaznim (od najmanje ka najvećoj) ili silaznim (od najveće ka najmanjoj
vrijednosti) redoslijedom. Na taj način će se vrijednosti koje je potrebno detaljnije
razmotriti naći na vrhu podataka u navedenoj varijabli.
Zadaci za vježbu:
Biznis
Zdravlje
59
SPSS PRIRUČNIK
7.
GRAFIČKO I VIZUALNO PREDSTAVLJANJE
PODATAKA
7.1. HISTOGRAM
60
SPSS PRIRUČNIK
želite dva grafika jedan iznad drugog, ili Column ako želiš da budu smješteni jedan
pored drugog. U ovom primjeru, stavit ćemo varijablu spol u prostor Column.
4. Za izvršenje komande kliknite na OK.
Interpretacija outputa:
Histogram nam pruža informacije o obliku distribucije. Iz gornjeg primjera vidimo da su
distribucije podataka poprilično normalno distribuirane, što možemo vidjeti po tome da je
najveći broj rezultata smješten oko sredine distribucije. Ipak, u stvarnim uslovima ne
dobivamo uvijek ovakav slučaj, gdje distribucije mogu biti pozitivno ili negativno
asimetrične.
61
SPSS PRIRUČNIK
62
SPSS PRIRUČNIK
Interpretacija outputa:
Iz prikazanog stupčastog dijagrama možemo vidjeti da razina stresa raste u skladu sa
porastom broja godina. Također, kod sve tri dobne skupine, razina stresa je veća kod
muškaraca. Ali, njena statistička značajnost nam je nepoznanica.
Ono što treba naglasiti kod stupčastih dijagrama jest obraćanje pažnje na vrijednosti na Y-osi.
Iako se razlike među stupcima grupa nekad mogu činiti velikima, uvijek treba obraćati pažnju
na numeričke vrijednosti. Tako i u ovom primjeru, u dobnoj skupini „18-29“ imamo veću
razinu stresa kod muškaraca.
63
SPSS PRIRUČNIK
Skater dijagram se prikazuje na sljedeći način: Vrijednosti jedne varijable nanose se na X-osu,
a druge na Y-osu. Svaki ispitanik se prikazuje kao tačka u koordinatnom sistemu [uređeni par,
(x, y)]. Prediktorska varijabla nanosi se na apscisu, a kriterijska na ordinatu.
U skater dijagram unosi se tzv. „pravac regresije“. Stupanj u kojem se tačke „okupljaju” oko
pravca pokazuje veličinu povezanosti tj. korelacije između X i Y. Ukoliko se sve tačke nalaze
na pravcu regresije, radi se o savršenoj, odnosno maksimalno mogućoj, povezanosti.
64
SPSS PRIRUČNIK
Interpretacija outputa:
Iz dobivenog scatterplota (skater dijagrama) možemo vidjeti da postoji negativna korelacija
između razine stresa i kontrole untrašnjih stanja. Ispitanici sa visokim rezultatima na PCOISS-
u (Perceived Control od Internal State Scale) imaju niske rezultate na Total Perceived Stress
skali. To znači da osobe koje imaju višu razinu kontrole untrašnjih stanja imaju manje stresa.
7.4. BOX-PLOT
Box-plot prikaz nam može poslužiti za brzu provjeru normalnosti distribucija rezultata (bez
zaključka), ali i ukazati na moguće razlike među varijancama.
Pomoću box-plot prikaza možemo izvršiti i tzv. „sumiranje s 5 vrijednosti“. Važne
informacije o distribuciji možemo dobiti tako što navodimo pet vrijednosti koje nam pružaju
65
SPSS PRIRUČNIK
važne informacije. Tih pet vrijednosti su: medijana, prvi kvartil, treći kvartil, minimalna i
maksimalna vrijednost. Sumiranje skupa podataka s tih pet vrijednosti može se transformirati
u grafički prikaz upravo pomoću box-plot prikaza.
66
SPSS PRIRUČNIK
Interpretacija outputa:
Gornji box-plot prikaz daje nam mnogo informacija o distribuciji kontinuirane varijable te o
mogućem utjecaju kategorijalne varijable.
Svaka distribucija rezultata je predstavljena „kutijom“ i linijama (engl. whiskers). Dužina
kutije označava interkvartilni raspon varijable i sadrži 50% slučajeva. Linija koja ide
horizontalno preko „kutije“ označava aritmetičku sredinu, a linija koja vertikalno prolazi kroz
„kutiju“ ide do najniže i najviše vrijednosti u distribuciji.
Svaki rezultat za kojeg SPSS „smatra“ da izlazi van okvira označen je kružićem i on je
pokazan ranije spomenutim ID brojem slučaja. Ovi brojevi (engl. outliers) predstavljaju
slučajeve (ispitanike, cases) čiji se rezultati prilično razlikuju od ostatka distribucije, bilo da
se radi o jako visokim ili jako niskim rezultatima. SPSS smatra rezultate ekstremnim onda
kada su od „kutije“ udaljeni 1.5 dužina „kutije“ od njenog ruba.
Box-plot prikaz nam, također, daje uvid u varijabilitet rezultata svake grupe i omogućava nam
vizualni prkaz razlika između grupa.
Ponekad je potrebno uraditi naknadne ili dodatne modifikacije grafika kako bismo ga mogli
printati ili koristiti u nekim izvještajima. Najčešće je potrebno urediti naslov, nazive varijabli,
markere, itd.
Da bi se uređivao grafik ili tablica, potrebno je otvoriti Chart Editor. To se radi tako da se na
grafik koji se želi urediti klikne dvostrukim klikom. Nakon toga će se otvoriti prozor u kojem
će biti ponuđene opcije na gornjem meniju. Prvo se klikne na Edit, a zatim odabere
Properties. Pored toga se u Chart Editor-u može uređivati još mnogo toga:
Ako se žele mijenjati nazivi varijabli, potrebno je kliknuti jednom na naziv željene
varijable (pojavi se zlatni okvir oko riječi), a zatim kliknuti ponovno da se upiše druga
riječ. Kada se završi, potrebno je pritisnuti Enter.
Da bi se promijenila pozicija naziva varijabli, potrebno je dvostrukim klikom kliknuti
na naziv varijable, zatim u otvorenom prozoru odabrati opciju Text Layout te nakon
toga opciju Justify. Pomoću nje se naziv može centrirati ili pomjerati lijevo ili desno.
Da bi se uređivali drugi dijelovi grafika, nužno je (jednom) kliknuti na željeni aspekt
ili dio grafika, a zatim otvoriti Edit pa Properties. Opcija Properties će se automatski
67
SPSS PRIRUČNIK
prilagoditi onom dijelu na kojeg je kliknuto i tako će se moći uređivati željeni dio
grafika.
68
SPSS PRIRUČNIK
Zadaci za vježbu:
Biznis
Baza podataka: staffsurvey3ED.sav.Vidi dodatak za detalje o bazama podataka.
1. Napravite histogram da bi ispitali distribuciju skorova skale Zadovoljstvo zaposlenika
(totsatis).
2. Napravite grafik da bi prikazali nivoe zadovoljstva onih zaposlenika koji su zaposleni
na stalno i onih koji nisu, u trajanju od 2, 3 do 5 godina i više od 6 godina. Varijable
koje će trebati su totsatis, employstatus and servicegp3.
3. Napravite skater dijagram da bi prikazali vezu između vremena zaposlenosti u
godinama i zadovoljstva zaposlenika (totsatis). Pokušajte prvo da koristite varijablu
service, a zatim pokušajte sa varijablom koja se nalazi pri dnu liste varijabli
(logservice). Ova nova varijabla je matematička transformacija (log 10) originalne
varijable (service).
4. Napravite boxplot da bi pokazali distribuciju skorova na skali Zadovoljstvo
zaposlenika (totsastis) za različite dobi (age).
Zdravlje
Baza podataka: sleep3ED.sav. Vidi dodatak za detalje o bazama podataka.
69
SPSS PRIRUČNIK
8.
MANIPULACIJA PODATAKA
Jednom kada su podaci uneseni i njihova tačnost provjerena, sljedeći korak uključuje
manipulaciju sirovim podacima kako bi se dobio oblik na kojem se mogu izvršavati analize i
testirati hipoteze. U zavisnosti od varijabli od interesa i vrste istraživačkih pitanja, proces
manipuliranja podacima može uključivati jedan od sljedeća četiri koraka:
zbrajanje skorova pojedinih stavki koje čine određenu skalu/ljestvicu kako bi se dobio
ukupni skor za tu skalu, kao što je npr. samopoštovanje, optimizam, itd.
transformacija varijabli koje nisu normalno distribuirane za analize koje zahtijevaju
normalno distribuirane skorove.
pretvaranje kontinuiranih varijabli (npr. dob) u kategorijalne varijable (npr. mlada,
srednja, starija dob).
smanjivanje broja kategorija kod kategorijalne varijable (npr. smanjiti kategorije kod
varijable bračni status tako da imamo samo dvije kategorije: oni koji su u vezi i oni
koji nisu).
Kada provodimo istraživanje i koristimo veći broj mjerenja trebamo voditi računa o tome na
koji način formiramo rezultat svakog ispitanika. Ukupni skorovi u kompozitnim psihološkim
mjerenjima se formiraju pomoću linearnih kombinacija. Dijelovi tog kompozita mogu biti
zadaci, subtestovi i slično, a varijable dihotomne (one koje mogu poprimiti dvije vrijednosti),
politomne, kontinuirane, standardizirane i dr.
Tako je npr. ukupni rezultat na testu iz matematike linearna kombinacija uratka u pojedinim
zadacima.
Razlikujemo aditivne i supstraktivne linearne kombinacije, zavisno od toga da li sabiramo
brojeve ili oduzimamo. Kod aditivnih linearnih kombinacija ukupni rezultat je formiran
zbrajanjem rezultata na pojedinim mjerenjima (npr. u nekom testu znanja, kao u gornjem
primjeru). Tada linearna kombinacija ima sljedeći oblik:
70
SPSS PRIRUČNIK
Kod supstraktivnih linearnih kombinacija ukupni uradak se izražava kao razlika rezultata u,
najčešće, dva pojedina mjerenja. Naprimjer, ako mjerimo konstrukt opterećenost na poslu u
organizacijskoj pihologiji, ukupni skor svakog ispitanika možemo definirati kao količinu
zahtjeva koju ona ima na poslu umanjenu za količinu njegove autonomije na poslu. Ukoliko
bismo u tom slučaju koristili aditivnu linearnu kombinaciju za formiranje ukupnog uratka,
broj koji bismo dobili za određenog ispitanika ne bi imao smisla. Supstraktivna linearna
kombinacija ima sljedeći oblik:
U slučajevima kada svaki zadatak mjeri istu stvar, ali ne u istoj mjeri, tada se ukupni uradak
formira pomoću diferencijalno ponderiranih linearnih kombinacija. Svaki zadatak se množi
odgovarajućim brojem, ponderom, odnosno koeficijentom važnosti. Na taj način se svakom
zadatku pridaje različiti značaj, odnosno važnost. Diferencijalno ponderirana linearna
kombinacija ima sljedeći oblik:
Na primjer, pet zadataka na testu iz matematike ne mjere u istoj mjeri znanje iz matematike.
Neki zadaci su lakši a drugi teži, tako da ćemo teže zadatke množiti s većim ponderom, a
lakše s manjim. Na taj način povećavamo broj različitih rezultata koji su postignuti u
određenom testu, odnosno povećavamo diskriminativnost ili razlikovanje ispitanika.
71
SPSS PRIRUČNIK
72
SPSS PRIRUČNIK
RECODE op2 op4 op6 (1=5) (2=4) (3=3) (4=2) (5=1) INTO Revop2 Revop4 Revop6.
VARIABLE LABELS Revop2 'Reverse optimism 2' /Revop4 'Reverse optimism 4'
/Revop6 'Reverse optimism 6'.
EXECUTE.
Interpretacija outputa:
Nove varijable s novim skorovima su, nakon izvršene procedure, prikazane na kraju liste
varijabli. To možeš provjeriti u prozoru Data Editor, odnosno Variable View, gdje su na
kraju same liste nove varijable Revop2, Revop4, Revop6. To su varijable koje, ukoliko su
slijeđene upute, promijenjene iz negativno u pozitivno formulirane. Poželjno je također
provjeriti u prozoru Data View da li su dobivene željene vrijednosti, odnosno da li je željeni
73
SPSS PRIRUČNIK
74
SPSS PRIRUČNIK
Interpretacija outputa:
Kao konačni ishod će se na kraju liste varijabli pojaviti nova varijabla pod nazivom T_opt.
Ukupni skor svakog ispitanika je u T_opt definiran kao suma njegovih skorova na pojedinim
stavkama skale optimizma (od op1 do op6), pri čemu su skorovi određenih stavki
promijenjeni (2,4,6). Ako u pojedinim stavkama nedostaju podaci, također neće biti prikazan
ni totalni skor te skale. Nakon formiranja nove varijable važno je provjeriti i oblik distribucije
i ostale deskriptivne karakteristike, kao npr:
Provjeri na osnovu upitnika: koji je mogući raspon rezultata? Za skalu koja sadrži 10
stavki, pri čemu su za svaku moguća četiri odgovora (odnosno skala od 1-4), najmanja
vrijednost koju ispitanik može postići je 10, a najveća 40. Ukoliko je osoba zaokružila
1 za svaku stavku, ukupni skor je 10 x 1 = 10. Ako je osoba samo zaokruživala 4, njen
ukupni uradak je 4 x 10 = 40.
Uporedi aritmetičku sredinu skale sa vrijednostima koje se navode u literaturi. Da li je
vrijednost izračunate aritmetičke sredine slična onima koje su dobivene u prethodnim
studijama? Ukoliko nije, zašto nije? Možda je napravljena greška prilikom
rekodiranja? Ili se uzorci razlikuju? Kako bi takva usporedba bila moguća, važno je i
da je test normiran. Tako da pri kupovini testa treba obratiti pažnju na to da li on ima
norme, te da li su te norme prikupljene na dovoljno velikom i reprezentativnom
uzorku.
Provjeri kako izgleda distribucija nove varijable koristeći skewness i kurtosis.
Prikaži rezultate u obliku histograma. Da li su podaci normalno distribuirani? Ako
nisu, možda je neophodna transformacija podataka, prikazana u nastavku.
75
SPSS PRIRUČNIK
rasponu skorova. Kako generalizirati rezultate dobivene na različitim testovima koji mjere isti
konstrukt?
Također, često želimo porediti rezultat ispitanika na jednom testu koji mjeri jedan konstrukt s
njegovim rezultatom na drugom testu koji mjeri neku drugu varijablu. Generalizacija mogućih
rezultata na jednom konkretnom mjerilu izvodi se pretvaranjem, odnosno transformacijom
sirovih skorova na neku opće prihvaćenu skalu ili standard. Neke od tih skala su: Skala z-
vrijednosti, Skala devijacionog koeficijenta inteligencije (DQI-skala), T-skala, C-skala i dr.
Sve navedene skale imaju definisanu aritmetičku sredinu i standardnu devijaciju. Ova vrsta
transformacije, odnosno transformacija na skalu sa zadanim parametrima, se naziva višestruka
linearna transformacija. Transformacija na skalu z-vrijednosti, na primjer, nam govori o tome
koliko je ispitanikov rezultat iznad- ili ispodprosječan, te koliko je on udaljen od aritmetičke
sredine u jedinicama standardne devijacije.
Transformacije se dijele na linearne i nelinearne. Linearne Transformacije su one kod kojih su
razlike u tranformiranim skorovima iste kao i razlike u sirovim skorovima. Razmotrimo
efekat linearnih transformacija na vrijednosti aritmetičke sredine i standardne devijacije:
1. Kada dodamo konstantu određenom skupu podataka (ili oduzmemo od tog skupa),
aritmetička sredina se povećava, odnosno smanjuje za vrijednost konstante. Pošto
dodajemo, odnosno oduzimamo određenu konstantu, mi drugim riječima samo
pomjeramo distribuciju u desnu ili lijevu stranu, dok variranje rezultata ostaje isto.
Prema tome, dodavanjem ili oduzimanjem kontante od određenog skupa podataka,
varijanca – standardna devijacija ostaje nepromijenjena:
M’ = M+a; v’=v
M’ = M-a; v’=v
M’ = Ma; v’ = va2; s’ = sa
M’ = M/a; v’ = v/a2; s’ = s/a
76
SPSS PRIRUČNIK
77
SPSS PRIRUČNIK
Formulu koja je prikazana pored slike treba unijeti u SPSS, i pomoću te formule će SPSS
normalizirati odgovarajuću distribuciju.
Kvadratni korijen
Formula: nova varijabla = SQRT(stara varijabla)
Logaritam
Inverz
Formula: nova varijabla = 1 / (stara varijabla)
Refleksija i logaritam
Formula: nova varijabla = LG10 (K – stara varijabla);
gdje je K = najveća moguća vrijednost +1
78
SPSS PRIRUČNIK
Refleksija i inverz
Formula: nova varijabla = 1 / (K – stara varijabla);
gdje je K = najveća moguća vrijednost +1
To također vidimo na osnovu vrijednosti skewnessa, koja nije 0 kao kod simetričnih
distribucija, niti negativna kao kod negativno asimetričnih, već iznosi 2,686, što ukazuje na
pozitivnu asimetriju. Uporedit ćemo distribuciju varijable length of service sa slikama iznad.
79
SPSS PRIRUČNIK
80
SPSS PRIRUČNIK
COMPUTE logloservice=LG10(service).
EXECUTE.
81
SPSS PRIRUČNIK
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Logarithm Transformation of
.091 471 .000 .978 471 .000
the variable length of service
Distribucija odstupa neznačajno od normalne ukoliko je dobivena vrijednost veća od 0.05 (ili
obratno: ukoliko se dobije da je Sig<0.05, distribucija značajno odstupa od normalne). Sa
tabele možemo očitati da transformirana distribucija varijable length of service značajno
odstupa od normalne (Sig=0.000). Ova transformacija nam, dakle, nije omogućila da pri
analizi podataka koristimo parametrijske testove, već moramo pribjeći neparametrijskim
testovima. Kod asimetričnih distribucija možemo također upotrijebiti kolapsiranje
kontinuirane varijable u kategorijalnu. Procedura i pojašnjenje vezano uz kolapsiranje
kontinuirane varijable u kategorijalnu je prikazana u nastavku. Ukoliko to nije slučaj, odnosno
ukoliko izvršena transformacija uspješno normalizira distribuciju (na što bi ukazala vrijednost
veća od .05 nakon izvršenog Kolmogorov-Smirnovog testa), možemo koristiti parametrijske
testove.
82
SPSS PRIRUČNIK
83
SPSS PRIRUČNIK
Interpretacija outputa:
Ovom komandom je napravljena varijabla dobgp3 – smještena na kraju liste varijabli – koja
predstavlja varijablu dob (age) podijeljenu u tri kategorije: <=29, 30-44 i 45+.
Postoje situacije u kojima želimo da smanjimo ili kolapsiramo broj kategorija kategorijalne
varijable. Ovo radimo zbog potreba istraživanja ili teoretskih razloga (npr. kolapsiranja
bračnog statusa u dvije kategrije u kojima su ljudi „u vezi“/„nisu u vezi“). Na primjer, može
se desiti da imamo samo nekoliko ljudi u našem uzorku koji spadaju u određenu kategoriju –
kao što u bazi survey3ED, za varijablu edukacija, imamo samo dvoje ljudi u prvoj kategoriji,
„osnovna škola“ (primary school). Ova varijabla se ne može na pravi način koristiti u mnogim
statističkim analizama. Možemo odlučiti da samo uklonimo ove ljude iz uzorka, ili možemo
varijablu rekodirati tako da ih kombiniramo sa sljedećemo kategorijom, „nešto srednje škole“
(some secondary). Jako je važno napomenuti da se stvara nova dodatna varijabla (znači
održavaju se originalni podaci).
84
SPSS PRIRUČNIK
Interpretacija outputa:
Ovom komandom smo spojili kategorije primary school i some secondary u kategoriju
primary_and_secondary u novoj varijabli coleduc. Takođe smo i očuvali staru varijablu educ.
Nakon rekodiranja varijable, korisno je pokrenuti Frequencies na obje varijable – staroj
(educ) i novokreiranoj varijabli (coleduc, koja se pojavi na kraju liste varijabli) – i provjeriti
da li su tačne frekvencije koje su dobijene za novu varijablu. Na primjer, za novokreiranu
coleduc, trebali bismo sada imati 2+53=55 ispitanika u prvoj grupi. Ovo predstavlja 2 ljudi
koji su označeni sa 1 u originalnoj varijabli (primary school) i 53 ljudi koji su označeni sa
brojem 2 (some secondary).
85
SPSS PRIRUČNIK
Zadaci za vježbu:
POSAO
Baza podataka: staffsurvey3ED.sav. Vidite prilog za detalje o bazi podataka.
1. Vježbajte postupak objašnjen u ovom poglavlju kako da zbrojite ukupni rezultat za
skalu, tako što koristite iteme koji čine Staff Satisfaction Survey (istraživanje
zadovoljstva osoblja). Morat ćete sabrati iteme-e koji procjenjuju agreement
(slaganje) sa svakim item-om na skali (tj. Q1a+Q2a+Q3a....DO Q10a). Imenujte novu
varijablu sa staffsatis.
2. Provjerite deskriptivnu statistiku za novi ukupni rezultat (staffsatis) i usporedite je sa
deskriptivnim vrijednostima za varijablu totsatis, koja se već nalazi u bazi podataka.
Ovaj ukupni rezultat je već izračunat.
3. Koji su najmanji mogući i najviši mogući rezultati za ovu novu varijablu? Savjet:
provjerite broj itema na skali i broj bodova za odgovor na svakoj tački. (vidi Dodatak
na kraju knjige)
4. Provjerite distribuciju varijable service tako što ćete napraviti histogram. Vidjet ćete
kako je histogram veoma asimetričan, većina se nalazi na dnu ( sa manje od 2 godine
pružanja usluga) a nekoliko je ljudi je rašireno na vrlo viskom kraju ( sa više od 30
godina pružanja usluga). Provjerite kakav je oblik ditribucije u usporedbi sa onim koji
je prikazan i pokušajte napraviti nekoliko transformacija. Ne zaboravite provjeriti
distribucije novih transformiranih varijabli koje kreirate. Je li ijedna od njih normalno
distribuirana?
5. Raspodijelite varijablu: godine pružanja usluga (service) u tri različite grupe koristeći
se postupkom Visual Binning koja se nalazi na meniju Transform. Koristite Make
Cutpoints dugme i tražite Equal Percentiles. U dodjeljku Number of Cutpoints,
odredite 2. Nazovite vašu novu varijablu gp3service da biste je mogli razlikovati od
varijable koja se već nalazi u bazi podataka koja je napravljena koristeći se ovim
postupkom (service3gp). Pokrenite Frequencies na novoj varijabli kako biste
provjerili koliko je slučajeva u svakoj grupi.
ZDRAVLJE
Baza podatka: sleep3ED.sav. Vidite Prilog za detalje o bazi podataka.
1. Vježbate postupke opisane u ovom poglavlju da biste zbrojili ukupne rezultate za
skale koristeći se itemima koji čine skalu Sleepines i Associate Sensations Sacale
86
SPSS PRIRUČNIK
(Pospanost i Skala Povezanih osjeta). Morat ćete zbrojiti iteme fatigue, lethargy, tired,
sleepy, energy (zamor, letargija, umor, pospanost, energija.). Nazovite vašu novu
varijablu sleeptot. Zapamite: nijedan od ovih itema ne mora biti obrnut prije nego
bude dodan.
2. Provjerite deskriptivnu statistiku za vaš novi ukupni rezultat (sleeptot) i uporedite je sa
deskriptivima za varijablu totSAS, koja se već nalazi u bazi podataka. Ovo je ukupni
rezultat koji je već izračunat.
3. Koji su najmanji mogući i najveći mogući rezultati za ovu novu varijablu? Savjet:
Provjerite broj itema u skali i broj bodova za odgovor na svakom itemu. (vidi
Dodatak)
4. Provjerite distribuciju (tako što napravite histogram) varijable koja mjeri broj cigareta
koji dnevno ispuše pušači u uzorku (smokenum). Vidjet ćete kako je veoma
asimetričan jer se većina ljudi nalazi na donjem kraju (sa manje od 10 dnevno) i
nekoliko ljudi je na samom vrhu gornjeg kraja (sa više od 70 dnevno). Uporedite oblik
distribucije i pokušajte napraviti nekoliko različitih transformacija. Ne zaboravite
provjeriti distribucije novih transformiranih varijabli koje ste napravili. Da li je ijedna
od novih transformiranih varijabli 'normalnije' distribuirana.
5. Raspodjelite varijablu dob (age) u tri grupe koristeći se Visual Binning postupkom iz
menija Transform. Koristite Make Cutpoint dugme i tražite Equal Percentiles. U
odjeljku označenom sa Number of Cutpoints odredite 2. Nazovite vašu novu
varijablu gp3 da biste je razlikovali od varijable koja se već nalazi u bazi podataka,
koja je napravljena koristeći se ovim postupkom (age3gp). Pokrenite Frequencies, na
vašoj nanovo napravljenoj varijabli kako biste provjerili koliko slučajeva ima u svakoj
grupi.
87
SPSS PRIRUČNIK
9.
POUZDANOST
Kada postavljamo skale u svoju studiju, važno je pronaći one koje su pouzdane. Postoji više
aspekata pouzdanosti. Jedan od glavnih problema vezan je za unutarnju konzistenciju skale.
Ovo se odnosi na stepen povezanosti između stavki unutar skale. Jedan od najčešće korištenih
indikatora za unutarnju konzistenciju je Cronbachov alfa koeficijent. Idealno, Cronbachov
alfa koeficijent skale bi trebao biti iznad 0,7 (DeVellis 2003). Međutim, vrijednosti
Cronbachovog alfa koeficijenta su poprilično osjetljive na broj stavki na skali. Na kratkim
skalama (onima koje imaju manje od 10 stavki), uobičajeno je da alfa koeficijent bude nizak
(npr. 0,5).
Pouzdanost skale može da varira zavisno od uzorka na kojem je korištena. Također je
potrebno da se provjeri da je svaka skala pouzdana na određenom uzorku. Ova informacija se
inače nalazi u metodološkom dijelu. Ukoliko skala sadrži neke stavke koje su negativno
sročene, ove stavke bi trebale biti obrnute prije provjeravanja pouzdanosti.
U sljedećem primjeru, istražit ćemo unutarnju konzistenciju jedne od skala iz baze
survey3ED, skalu „Zadovoljstvo životom“, koja je sastavljena od 5 stavki. U bazi podataka,
ove stavke su označene kao lifsat1, lifsat2, lifsat3, lifsat4, lifsat5.
Važno: prije početka, trebao bi provjeriti da su sve negativno sročene stavke u skali obrnute.
Ako se ne uradi ovo, doći će do jako niske (i netačne) vrijednosti Cronbachovog alfa
koeficijenta. U ovom primjeru, nijedna od ovih stavki ne treba da bude preokrenuta.
88
SPSS PRIRUČNIK
N %
Reliability Statistics
.890 .895 5
Item Statistics
89
SPSS PRIRUČNIK
Item-Total Statistics
Scale Statistics
Interpretacija outputa:
Na pregledu outputa vidi se da je broj ispitanika tačan (u tabeli Case Processing
Summary) i da je broj stavki tačan (u tabeli Reliability Statistics).
Provjeri negativne vrijednosti u Inter-Item Correlation Matrix. Sve vrijednosti bi
trebale biti pozitivne, upućujući na to da stavke mjere istu karakteristiku. Prisustvo
negativnih vrijednosti bi moglo pokazivati da neke od stavki nisu bile kako treba
preokrenute. Netačni skorovi će se, takođe, prikazati u tabeli Item-Total Statistics sa
negativnim vrijednostima u Corrected-Item Total Correlation. To treba provjeriti
ukoliko dobijeni Cronbachov alfa koeficijent bude niži od očekivanog.
Vrijednosti u Corrected Item-Total Correlation u tabeli Item-Total Statistics
indiciraju na stepen korelacije svake stavke sa ukupnom vrijednošću. Niske vrijednosti
(niže od 0,3) ovdje indiciraju da stavka mjeri nešto drugo od cijele skale. Ako je
Cronbachov alfa koeficijent cijele skale prenizak (niži od 0,7), a sve provjerene stavke
su tačne, možda je potrebno izbaciti stavke koje imaju niske korelacije sa ukupnom
vrijednošću.
90
SPSS PRIRUČNIK
Za skale sa malim brojem stavki (npr. manje od 10), ponekad je teško da se dobije
odgovarajuća vrijednost Cronbachovog Alfa-koeficijenta i možda bi se trebala
provjeriti prosječna vrijednost korelacije unutar stavki, koja je pokazana u tabeli
Summary Item Statistics. U ovom slučaju, ona iznosi 0,63, sa rasponom od 0,48 do
0,76. Ovo ukazuje na jaku povezanost između stavki, što za mnoge skale nije slučaj.
Prema Pavotu, Dieneru, Colvinu i Sandviku (1991), skala Zadovoljstvo životom ima dobru
unutarnju konzistenciju, sa Cronbachovim alfa koeficijentom koji iznosi 0,85. U navedenoj
studiji, Cronbachov alfa koeficijent je bio 0,89.
Zadaci za vježbu:
POSAO
Baza podataka: staffsurvey3ED.sav. Vidi Dodatak za detalje o bazi podataka.
1. Provjerite pouzdanost ispitivanja zadovoljstva osoblja, koje je načinjeno iz itema
agreement (slaganje) u bazi podataka: od Q1a DO Q10a. Nijedan od itema u ovoj skali
ne mora biti obrnut.
ZDRAVLJE
Baza podataka: sleep3ED.sav. Vidi Dodatak za detalje o bazi podataka.
1. Provjerite pouzdanost skala Sleepiness i Associated Sensations Scale koja je načinjena
od itema: fatigue, lethargy, tired, sleepy, energy (zamor, letargija, umor, pospanost,
energija). Nijedan od itema u ovoj skali ne mora biti obrnut.
91
SPSS PRIRUČNIK
10.
IZBOR PRAVOG STATISTIČKOG POSTUPKA
Jedna od najtežih stvari prilikom provedbe istraživanja jeste odabir prave statističke analize za
obradu i analizu prikupljenih podataka. Izbor odgovarajuće statističke tehnike ovisi o prirodi
istraživačkog pitanja, kao i podataka kojima se raspolaže. Stoga je veoma bitno dobro
poznavati osnove različitih statističkih analiza, istraživačko pitanje i problem kojim se
bavimo, te postavljene hipoteze. Izbor određene statističke analize u radovima drugih autora
može biti od koristi u izboru analize u vlastitom radu, te ih je korisno proučiti. U ovom
poglavlju osvrnut ćemo se na različite statističke tehnike, te ćemo korak po korak proći kroz
proces donošenja odluke o izboru prave statističke analize.
Korelacija
Pearsonov ili Spearmanov koeficijent korelacije računa se kada želimo ispitati snagu
povezanosti između 2 kontinuirane varijable. Govori nam o smjeru (pozitivna i negativna),
kao i o snazi povezanosti. Pozitivna korelacija: porastom vrijednosti jedne varijable raste i
92
SPSS PRIRUČNIK
Parcijalna korelacija
Parcijalna korelacija je nastavak bivarijatne korelacije. Kontrolira mogući utjecaj neke
konfundirajuće varijable (npr. društveno poželjnog odgovaranja), pružajući tako bolji uvid u
povezanost između dvije varijable od interesa. (Detaljnije u poglavlju 13 – IV dio)
Multipla regresija
Multipla regresija je sofisticiran nastavak korelacije i koristi se kada želimo ispitati udio
varijance objašnjen pojedinačnim prediktorima. Omogućava predočavanje onog prediktora
koji je najbolji za predviđanje kriterija. (Detaljnije u poglavlju 14 – IV dio)
Drugi dio oblasti statističkih tehnika sadrži analize koje se koriste kada želimo utvrditi da li
postoji statistički značajna razlika između dvije ili više grupa. Parametrijske verzije testova
koje su prikladne kada imamo intervalne skale podataka i normalnu distribuciju skorova
prezentirane su ispod, sa neparametrijskim alternativama.
T-test
T-test koristi se kada postoje dvije grupe (npr. muškarce i žene), ili dva seta podataka (prije i
poslije) i želimo porediti njihove aritmetičke sredine na nekoj kontinuiranoj varijabli. Postoje
dvije glavne vrste t-testova:
t-test za zavisne uzorke (koristi se kada nas interesuju promjene u skorovima istih
ispitanika testiranih u dvije vremenske tačke, najčešće prije i poslije neke intervencije
ili tretmana)
t-test za nezavisne uzorke (koristi se kada imamo dvije različite nezavisne grupe
ispitanika, npr. muškarce i žene, i zanima nas razlika između njih, tj. između njihovih
aritmetičkih sredina. U ovom slučaju koristimo informacije prikupljene samo jednim
testiranjem, ali na različitim grupama ispitanika). Detaljnije u poglavlju 17.
Neparametrijske alternative za t-test su Mann-Whitney U test i Wilcoxonov test ekvivalentnih
parova ili rangova.(Detaljnije u poglavlju 16 – V dio)
93
SPSS PRIRUČNIK
U odabiru prave statističke analize potrebno je uzeti u obzir i sagledati različite faktore:
vrstu pitanja i problema koji se istražuje, vrstu itema i skala korištenih za ispitivanje, prirodu
podataka kojima raspolažemo za svaku od varijabli, kao i pretpostavke koje moraju biti
zadovoljene za svaku različitu statističku tehniku.
94
SPSS PRIRUČNIK
95
SPSS PRIRUČNIK
Bitno je također znati i nivo mjerenja svako varijable. Različite statističke analize su potrebne
za kategorijalne i kontinuirane, pa je jako važno znati koje su varijable u pitanju. Da li su
varijable:
Kategorijalne ( naziva se još i nominalni nivo ili skala, npr. spol- muškarci i žene)
Ordinalne (rang: prvi, drugi, treći)
Kontinuirane (intervalna skala ili nivo, npr. dob u godinama, ili rezultat na skali
optimizma)
Postoje načini za promjenu nivoa mjerenja određene varijable. Možemo preinačiti odgovore
kontinuirane varijable u manje brojčane kategorije (vidi poglavlje 8). Npr. dob možemo suziti
na manje kategorije (npr. ispod 35/preko 35). To može biti korisno kada želimo provesti
ANOVA-u ili kada kontinuirane varijable ne ispunjavaju pretpostavke za neke analize
(npr.asimetrična distribucija). Pri sumiranju podataka može doći do propusta, čak i do gubitka
informacija. Potrebno je pažljivo izvagati prednosti i nedostatke!
96
SPSS PRIRUČNIK
Varijable:
Dob Optimizam
Varijable:
Dijagram:
Muškarci
Spol Optimizam
Žene
97
SPSS PRIRUČNIK
Dob
Ispod Preko
30 31-49 50
Spol
M
Optimizam
Ž
Pitanje 4: Koliko varijance zadovoljstva životom može biti objašnjeno faktorima ličnosti
(samopoštovanjem, optimizmom, percipirana kontrole)?
Varijable:
Samopoštovanje
Percipirana kontrola
98
SPSS PRIRUČNIK
samopoštovanje). Ako nisu zadovoljeni uslovi statističke metode koja se želi koristiti postoje
opcije.
Opcija 1:
Može se koristiti parametrijska statistika i nadati se da neće ozbiljno narušiti vrijednost i
važnost rezultata ili pronalazaka. Statističari tolerišu manje prekršaje, osobito ako je uzorak
odgovarajuće veličine. Ako se odluči ići dalje sa analizom, potrebno je to opravdati u
raspravi, potkrijepiti argumentima, prijašnjim istraživanjima, itd.
Provjeri istraživanja iz područja teme kojom se baviš, naročito ona u kojima je korištena ista
skala. Da li su oni pomenuli slične probleme? Ako jesu, šta su ti autori uradili?
Opcija 2:
Moguće je manipulirati podacima, tako da ih se prilagodi uslovima, npr. normalnosti
distribucije. S tim u vezi, moguće je transformirati varijable ako nisu normalno distribuirane.
Postoje neslaganja oko ovog pristupa, stoga je potrebno to činiti opravdano.
Opcija 3:
Treća alternativa je korištenje neparametrijskih tehnika. Za većinu parametrijskih tehnika
postoje odgovarajuće neparametrijske alternative. Oni također zahtijevaju ispunjavanje
određenih uslova, ali su manje strogi. Ove alternative (npr. Kruskal-Wallis Test, Man-
Whitney U Test, Hi-kvadrat) nisu tako snažne, tj. manje su osjetljive na otkrivanje
povezanosti među varijablama, ili razlika među grupama.
99
SPSS PRIRUČNIK
statističke analize), stoga izuči literaturu i budi siguran da dobro poznaješ materiju o kojoj se
radi.
100
IV DIO
STATISTIČKI POSTUPCI ZA
ISTRAŽIVANJE POVEZANOSTI MEĐU
VARIJABLAMA
SPSS PRIRUČNIK
11.
POVEZANOST MEĐU VARIJABLAMA: PRETPOSTAVKE I
PREDUSLOVI
Korelacija se koristi kada želimo izračunamo snagu i smjer povezanosti između dvije
varijable.
Koeficijent korelacije
Stepen povezanosti izražava se koeficijentom korelacije (r). Vrijednost koeficijenta korelacije
kreće se u granicama od -1, potpuno negativna povezanost (dok jedna varijabla raste, druga
opada), do +1, potpuno pozitivna povezanost (obje varijable su u porastu).
102
SPSS PRIRUČNIK
2. Smanjeni raspon
Treba biti oprezan u interpretaciji koeficijenta korelacije, naročito kada dolaze iz malih
uzoraka rezultata.
Koeficijent korelacije sa ograničenim rasponom u studiji drugačiji je od koeficijenta
korelacije gdje je čitav niz mogućih rezultata uzorkovan. Kako bi osigurali tačnost i
pouzdanost pokazatelja snage veze između dvije varijable, upotrebljavamo po mogućnosti
širok raspon rezultata za svaku od te dvije varijable.
103
SPSS PRIRUČNIK
Koeficijent determinacije
označava se sa R =
R je pokazatelj zajedničkih faktora - udjela kod dva obilježja X i Y koja su uključena
u korelacijsku analizu. Npr. r = 0,3² = 0,09 = R ili npr. r = 0.6² = 0,36 = R
što je korelacija manja npr. ± 0,3, koeficijent determinacije je značajno manji nego
kad je korelacija veća npr. ± 0,6 ( R = 9%, odnosno 36%).
Preduslovi za korištenje:
Skale mjerenja – za mnoga mjerenja kod korelacije, od skala bi trebale biti korištene
intervalna ili racio skala. Jedini izuzetak je kada imamo dihotomne nezavisne varijable
(samo dvije vrijednosti) i jednu stalnu zavisnu varijablu.
Mjere na obje varijable – svaki ispitanik mora imati rezultat na obje varijable: X i Y.
Normalnost – rezultati svake varijable trebaju biti normalno distribuirani. To može
biti provjereno, između ostalog, uvidom u rezultate svake varijable na histogramu.
Linearnost – veza između dvije varijable treba biti linearna. To znači, kada pogledate
na rezultate u skater dijagramu trebali bi vidjeti ravnu liniju, ne krivulju.
Homoscedascitet – varijabilitet rezultata za varijablu X treba biti sličan varijabilitetu
vrijednosti varijable Y.
104
SPSS PRIRUČNIK
12.
BIVARIJATNA KORELACIJA
1. Sa gornjeg menu-a odabrati Analyze, nakon toga kliknuti na Correlate, zatim odabrati
Bivariate.
2. Umetnuti dvije varijable u prostor Variables.
3. Ovisno od toga da li je distribucija rezultata normalna (parametrijska statistika) ili nije
(neparametrijska statistika), u prostoru Correlation Coefficients odabrati Pearsonov ili
Spearmanov koeficijent.
4. Kliknuti na Options. Za nedostajuće vrijednosti (vrijednosti koje nedostaju) kliknuti na
Exclude cases pairwise. Unutar Options možete, ako želite, odabrati aritmetičku sredinu i
standardnu devijaciju.
5. Kliknuti na Continue, a zatim na OK.
105
SPSS PRIRUČNIK
N 430 426
**
Pearson Correlation -.581 1
N 426 433
Nonparametric Correlations
Correlations
N 430 426
Spearman's rho **
Correlation Coefficient -.556 1.000
N 426 433
Interpretacija outputa:
Kao što se može primijetiti, iznad outputa na kojem je prikazan Pearsonov r koeficijent
korelacije naznačeno je Correlations, a iznad outputa na kojem je prikazan Spearmanov rho
koeficijent korelacije stoji naslov Nonparametric Correlations, što jasno pokazuje u kojem se
slučaju radi o parametrijskoj, a u kojem o neparametrijskoj statistici.
106
SPSS PRIRUČNIK
Exclude cases listwise, svaki ispitanik za kojeg nedostaje podatak za bilo koju
varijablu, nije uključen u analizu. U ovom primjeru za 426 ispitanika smo imali
podatke za obje skale. Svaki ispitanik za kojeg je nedostajao skor bilo koje od dvije
korištene skale je isključen iz analize.
107
SPSS PRIRUČNIK
korelacije iznosi r = .2. Koeficijent determinacije je stoga .2 x .2 = .04. Ako taj broj
pomnožimo sa 100, dobit ćemo postotak varijance koju ove varijable dijele (4%).
5. Procjena značajnosti
Značajnost dobivenog koeficijenta korelacije ovisi u velikoj mjeri od veličine uzorka.
Ako je u istraživanju korišten mali uzorak (npr. N = 25), čak i visoke korelacije mogu
biti neznačajne na nivou 5%, dok kod velikih uzoraka od nekoliko stotina i veoma
niska povezanost između varijabli može biti statistički značajna.
Iz prikaza rezultata jasno se vidi da su sve korelacije statistički značajne na razini značajnosti
od 1% (jer se pored rezultata nalaze dvije zvjezdice). Također, vidljivo je da su sve korelacije
negativne što je znak da se mijenjaju u suprotnim smjerovima.
108
SPSS PRIRUČNIK
Kao što je moguće izračunati povezanost između dvije varijable, tako je moguće izračunati i
povezanosti između grupa varijabli:
Procedura:
1. Sa gornjeg menija klikni na Analyze, nakon toga klikni na Correlate, zatim odaberi
Bivariate.
2. Varijable koje nas zanimaju premjesti u okvir Variables. Pri tome, prvo premjesti cijelu
prvu grupu varijabli (tposaff, tnegaff, tlifesat), a zatim drugu (tmast, tpcoiss).
3. Prva grupa varijabli će se pojaviti u redovima, a druga grupa u kolonama.
4. Prilikom premještanja varijabli u okvir Variables, obrati pažnju na to da u prvoj grupi
varijabli treba da se nalazi više varijabli nego u drugoj. Prebacivanje grupe sa više
varijabli prvo će spriječiti da tabela u output-u bude previše široka.
5. Klikni na Paste. To će otvoriti Syntax Editor.
6. Postavi kursor između prve grupe varijabli (tposaff, tnegaff, tlifesat) i druge grupe
varijabli (tmast, tpcoiss). Ovim ćeš načinom izračunati korelaciju između tmast i tpcoiss i
svake varijable iz druge grupe pojedinačno (tlifesat, tnegaff, tposaff).
7. Kako bi novi Syntax bio pokrenut, označi tekst od CORRELATIONS do tačke, odnosno
do /MISSING=PAIRWISE. Obrati pažnju na to da je i tačka označena!
8. S označenim tekstom, klikni na Run Selection u izborniku (>) ili sa gornjeg menija klikni
na Run, te odaberi Selection.
109
SPSS PRIRUČNIK
Correlations
N 436 429
** **
Pearson Correlation -.464 -.484
Total negative affect Sig. (2-tailed) .000 .000
N 435 428
** **
Pearson Correlation .432 .456
N 436 429
2. korak:
1. Zatraži od SPSS-a da izračuna korelaciju kao što je prethodno objašnjeno, za vaše dvije
varijable od interesa (npr. Total Optimism i Total negative affect).
110
SPSS PRIRUČNIK
ZAPAMTI: Nakon što izvršiš analizu, vrlo je važno da isključiš opciju Split File jer će se i sve
naknadne analize vršiti odvojene za dvije grupe podataka ukoliko se to ne učini.
Correlations
N 184 184
MALES **
Pearson Correlation -.220 1
N 184 185
**
Pearson Correlation 1 -.394
N 251 250
FEMALES **
Pearson Correlation -.394 1
N 250 250
Interpretacija outputa:
Iz output-a možemo vidjeti da je korelacija između ukupnih skorova dobivenih na skalama
koje mjere optimizam i negativni afekt za muškarce r = -.22, a za žene je nešto veća, odnosno
r = -.394.
Zadaci za vježbu:
111
SPSS PRIRUČNIK
13.
PARCIJALNA KORELACIJA
112
SPSS PRIRUČNIK
Significance Correlations
Total PCOISS . .000
(2-tailed)
Df 424 426
Df 425 0
Correlation 1.000
Significance
Total PCOISS .
(2-tailed)
Total social Df 0
desirability Correlation -.552 1.000
Df 423 0
Interpretacija outputa:
U gornjoj polovini tabele je prikazana korelacija između dvije varijable od interesa (tpcoiss i
tpstress), bez kontrole treće varijable (Total social desirability) i ta korelacija iznosi r =-.581.
U drugoj polovini tabele je prikazana korelacija između osjećaja kontrole (tpcoiss) i stresa
(tpstress) uz kontrolu treće varijable, i u ovom slučaju nova parcijalna korelacija iznosi r = -
.552. Uporedbom ova dva koeficijenta korelacije (r = -.581 i r = -.552) donosi se zaključak o
tome da li je socijalno poželjno odgovaranje doprinijelo korelaciji između osjećaja kontrole
nad unutrašnjim stanjima (tpcoiss) i doživljenog stresa (tpstress). U ovom slučaju
kontroliranje socijalno poželjnog odgovaranja je dovelo samo do malog pada u koeficijentu
korelacije, što upućuje na to da povezanost između osjećaja kontrole i stresa nije bila pod
utjecajem davanja socijalno poželjnih odgovora.
113
SPSS PRIRUČNIK
Zadaci za vježbu:
114
SPSS PRIRUČNIK
14.
MULTIPLA REGRESIJSKA ANALIZA
Često se u praksi ne računa korelacija samo između jednog prediktora i kriterija, već se
pojavljuje više prediktora. Na primjer, ako prilikom selekcije na radno mjesto koristimo test
inteligencije i dobijemo da korelacija između rezultata na testu inteligencije i uspjeha na
radnom mjestu iznosi 0.4. Ako tu vrijednost kvadriramo i pomnožimo sa 100, dobit ćemo
postotak varijance u varijabli uspjeh na radnom mjestu, koji se može objasniti pomoću
inteligencije. Tada inteligencija uposlenika objašnjava 16% (0.42 = 0.16, odnosno 16%)
njegovog uspjeha na poslu. A šta je s ostalih 84%? Ta vrijednost predstavlja postotak
varijance uspjeha na poslu koji nije objašnjen. Kako bi objasnili što veću proporciju varijance
u uspjehu na poslu, koristit ćemo pored testa inteligencije i druge testove (za koje
pretpostavljamo da su povezani s uspjehom na poslu) i pokušati pronaći one varijable koje će
nam pomoći u selekciji radnika, odnosno odabiru testova i osobina koje su značajne za tu
selekciju. U tu svrhu će psiholog, pored testa inteligencije, upotrijebiti npr. i test
psihomotorike i izračunati korelaciju između rezultata u ta dva testa i uspjeha na poslu.
Ukoliko je rezultat na testu iz psihomotorike povezan sa uspjehom u poslu i ta korelacija
iznosi r = 0.35, proporcija objašnjene varijance će biti veća, odnosno selekcija na radno
mjesto uspješnija. Pritome je važna i korelacija između samih prediktora (inteligencija i
psihomotorika). Ukoliko je ona 0, postotak objašnjene varijance je 0.16 + 0.12 = 0.28,
odnosno 28%. Proporcija objašnjene varijance odgovara kvadriranom koeficijentu multiple
korelacije i označava se sa R2. Međutim, u stvarnosti često dobijemo korelaciju između
prediktora koja je različita od 0. Što je korelacija između tih prediktora veća, odnosno
preklapanje između njih, to je proporcija objašnjene varijance u kriteriju manja. Dobar
regresijski model je, dakle, onaj kod kojeg je korelacija između prediktora (nezavisnih
varijabli) mala, a njihova korelacija s kriterijem visoka. Jedan od iznimno važnih problema
koji se pojavljuju kod multiple regresijske analize je određivanje pojedinačnihdoprinosa
prediktora u ukupnoj multiploj korelaciji. U prethodnom slučaju, pošto je korelacija između
prediktora 0, jedinstveni doprinos varijabli objašnjenju varijance u kriteriju je jednak
kvadriranoj korelaciji prediktora sa kriterijem (Za inteligenciju to je 0.16, za psihomotoriku
0.12). Tada nema preklapanja kružnica X1 i X2 u Vennovom dijagramu:
115
SPSS PRIRUČNIK
Y 0.72
0.12
X1 0.16
X2
116
SPSS PRIRUČNIK
Postoji nekoliko vrsta multiple regresijske analize u zavisnosti od istraživačkih pitanja na koja
želiš odgovoriti: Standardna ili simultana, Hijerarhijska ili sekvencijalna i Postepena. U ovom
priručniku ćemo se samo osvrnuti na Standardnu multiplu regresiju, odnosno na njenu
proceduru za izvršavanje u SPSS-u i odgovarajuću interpretaciju.Postoji nekoliko
pretpostavki, odnosno preduslova koji moraju biti ispunjeni kako bi upotreba multiple
regresijske analize bila moguća. Nije preporučljivo koristiti ovu statističku analizu ukoliko je
uzorak koji je korišten u istraživanju mali, te je i distribucija skorova asimetrična. Kod malih
uzoraka je problem u generalizaciji, jer se rezultat koji je dobiven na takvim uzorcima ne
može ponoviti na drugim uzorcima. Pitanje potrebne veličine uzorka je diskutabilno. Stevens
(1996) preporučuje oko 15 ispitanika po prediktoru kako bi se dobio pouzdan rezultat.
Tabachnick i Fidell (2007) nude formulu za računanje potrebne veličine uzorka, koja uzima u
obzir broj nezavisnih varijabli, odnosno prediktora: N > 50 + 8m; gdje je m = broj prediktora.
Ako je broj prediktora npr. četiri, tada je veličina uzorka 50+32 = 82.Pored pitanja veličine
uzorka, također postoji i problem multikolinearnosti i singularnosti. Multikolinearnost znači,
odnosno postoji kada je korelacija između prediktora snažna. Za multiplu regresijsku analizu
je to bolje što je korelacija između nezavisnih varijabli manja, jer je cilj objasniti što veću
proporciju varijance kriterija. U suprotnom, odnosno u slučaju kada prediktori visoko
koreliraju, proporcija objašnjene varijance u kriteriju pomoću prediktora je mala. Singularnost
postoji kada je jedna nezavisna varijabla ustvari kombinacija drugih nezavisnih varijabli, što
opet vodi ka lošem regresijskom modelu iz istog, prethodno navedenog razloga. U tom
slučaju ta nezavisna varijabla je potpuno nepotrebna. Prije korištenja multiple regresijske
analize treba, dakle, provjeriti da li postoji multikolinearnost ili singularnost. Veoma visoki ili
niski skorovi također predstavljaju problem zato što je multipla regresijska analiza osjetljiva
na ekstremne vrijednosti. Prema tome, treba provjeriti da li postoje ekstremne vrijednosti kod
nezavisnih varijabli, kao i kod zavisne. Te vrijednosti, ukoliko postoje, mogu biti ili obrisane
ili zamijenjene nekom drugom vrijednošću (npr. Aritmetičkom sredinom). Pored toga,
117
SPSS PRIRUČNIK
Varijable:
1. Total perceived stress (tpstress) - Ukupni skorovi skale „Doživljaj stresa“, pri čemu veći
skor upućuje na veći nivo stresa.
2. Total Perceived Control of Interal States scale (tpcoiss) – Ukupni skorovi skale koja
mjeri stupanj u kojem osobe imaju osjećaj da imaju kontrolu nad svojim unutrašnjim
stanjem. Veći skor odgovara većem osjećaju kontrole.
3. Total Mastery (tmast) - Totalni skorovi skale koja mjeri stupanj u kojem osobe osjećaju
da imaju kontrolu nad životnim događajima i okolnostima.
4. Total Social Desirability (tmarlow): Ukupni skorovi Marlow-Crowne Social Desirability
skale, koja mjeri stupanj u kojem osobe pokušavaju, odnosno nastoje, da se prikažu u
najboljem svjetlu.
5. Age – Dob (u godinama).
118
SPSS PRIRUČNIK
npr. Spol. Nakon izvršene multiple regresijske analize dobivamo informacije o količini
varijance u zavisnoj varijabli koja može biti objašnjena pomoću određenih nezavisnih
varijabli. Također nam daje informaciju o relativnom doprinosu svake nezavisne varijable
zasebno objašnjenju varijance. Pomoću multiple regresijske analize, konkretno u ovom
primjeru, možemo, dakle, odgovoriti na sljedeća istraživačka pitanja:
1. U kojoj mjeri se na osnovu korištenih mjera kontrole (Mastery i PCOISS) može predvidjeti
doživljaj stresa? Koliki postotak varijance doživljenog stresa može biti objašnjen skorovima
na te dvije skale koje mjere osjećaj kontrole (Mastery i PCOISS)?
2. Koji je najbolji prediktor stresa? Osjećaj kontrole nad životnim događajima (Mastery) ili
osjećaj kontrole nad mislima, emocijama itd. (PCOISS)?
3. Ako uklonimo mogući utjecaj dobi i davanje socijalno poželjnih odgovora na količinu
doživljenog stresa, da li će prediktori (mjere kontrole) i dalje moći objasniti značajan dio
varijance kriterija?
U ovom primjeru, koristeći standardnu multiplu regresiju, odgovorit ćemo na sljedeća dva
pitanja:
2. Pitanje: Koji je najbolji prediktor percipiranog stresa? Osjećaj kontrole nad životnim
događajima (Mastery) ili osjećaj kontrole nad mislima, emocijama itd. (PCOISS)?
119
SPSS PRIRUČNIK
Descriptive Statistics
Mean Std. N
Deviation
Total perceived
26.73 5.848 433
stress
Total PCOISS 60.63 11.985 430
Total Mastery 21.76 3.970 436
120
SPSS PRIRUČNIK
Correlations
Total Total Total
perceived PCOISS Mastery
stress
Total perceived
1.000 -.581 -.612
Pearson stress
Correlation Total PCOISS -.581 1.000 .521
Total Mastery -.612 .521 1.000
Total perceived
. .000 .000
stress
Sig. (1-tailed)
Total PCOISS .000 . .000
Total Mastery .000 .000 .
Total perceived
433 426 433
stress
N
Total PCOISS 426 430 429
Total Mastery 433 429 436
Variables Entered/Removeda
Mode Variables Variables Method
l Entered Removed
Total
Mastery,
1 . Enter
Total
PCOISSb
a. Dependent Variable: Total perceived
stress
b. All requested variables entered.
Model Summaryb
Mode R R Adjusted R Std. Error of
l Square Square the
Estimate
a
1 .684 .468 .466 4.274
a. Predictors: (Constant), Total Mastery, Total
PCOISS
b. Dependent Variable: Total perceived stress
121
SPSS PRIRUČNIK
ANOVAa
Model Sum of Df Mean F Sig.
Squares Square
Regressio
6806.728 2 3403.364 186.341 .000b
n
1
Residual 7725.756 423 18.264
Total 14532.484 425
a. Dependent Variable: Total perceived stress
b. Predictors: (Constant), Total Mastery, Total PCOIS
a
Coefficients
(Constant 48.4
50.971 1.273 40.03 .00 53.474
) 69
Total
-.175 .020 -.360 -8.66 .00 -.215 -.136 -.581 -.388 -.30 .729 1.372
PCOISS
Total
-.625 .061 -.424 -10.2 .00 -.745 -.505 -.612 -.445 -.36 .729 1.372
Mastery
Casewise Diagnosticsa
122
SPSS PRIRUČNIK
Residuals Statisticsa
Minimu Maximu Mean Std. N
m m Deviation
Predicted Value 18.03 41.31 26.74 4.001 429
Std. Predicted Value -2.174 3.644 .002 1.000 429
Standard Error of
.207 .800 .341 .111 429
Predicted Value
Adjusted Predicted
18.04 41.39 26.75 4.009 426
Value
Residual -14.849 12.612 -.002 4.268 426
Std. Residual -3.475 2.951 .000 .999 426
Stud. Residual -3.514 2.969 .000 1.003 426
Deleted Residual -15.190 12.765 -.001 4.306 426
Stud. Deleted
-3.562 2.997 -.001 1.006 426
Residual
Mahal. Distance .004 13.897 1.993 2.234 429
Cook's Distance .000 .094 .003 .008 426
Centered Leverage
.000 .033 .005 .005 429
Value
a. Dependent Variable: Total perceived stress
Collinearity Diagnosticsa
Mode Dimensio Eigenvalu Condition Variance Proportions
l n e Index (Constan Total Total
t) PCOISS Mastery
1 2.965 1.000 .00 .00 .00
1 2 .019 12.502 .62 .80 .01
3 .016 13.780 .38 .20 .99
a. Dependent Variable: Total perceived stress
123
SPSS PRIRUČNIK
124
SPSS PRIRUČNIK
Interpretacija outputa:
U interpretaciji ćemo se samo osvrnuti na evaluciju modela i na evaluaciju nezavisnih
varijabli pojedinačno, iako u outputu dobivamo informacije i o tome da li su određene
pretpostavke korištenja multiple regresijske analize (ranije spomenute), poput
multikolinearnosti, ispunjeni. U tabeli pod nazivom Model Summary box vrijednost R-
square (= vrijednost kvadriranog koeficijenta multiple korelacije) nam govori o tome koliko
je varijance u kriteriju (stress) objašnjeno modelom (PCOISS, Mastery). Vrijednost
kvadriranog koeficijenta multiple korelacije je u ovom slučaju 0.468, što znači da je 46, 8%
varijance u kriteriju objašnjeno pomoću ova dva testa (Koeficijent multiple korelacije
pomnožen sa 100 daje postotak objašnjene varijance – 0.486x100=46.8%). Ako je uzorak koji
je korišten u istraživanju mali, vrijednost R-square predstavlja precjenu stvarne proporcije
objašnjene varijance, te se u tom slučaju navodi korigovana vrijednost koja je također
prikazana u tabeli pod nazivom Adjusted R-square. Tabela pod nazivom ANOVA, nam daje
informaciju o statističkoj značajnosti našeg modela, koji u ovom primjeru jest statistički
značajan (Sig=.000; p<0.05).
Kako bi odgovorili na pitanje koliko je svaka od nezavisnih varijabli pridonijela objašnjenju
varijance kriterija, pogledat ćemo tabelu pod nazivom Coefficients. Usporedbu prediktora
nam omogućuje standardizirani regresijski koeficijent, odnosno beta-ponder. U tabeli Beta,
koja se nalazi ispod Standardized Coefficients, dati su nam beta-ponderi za prediktore
Mastery (-.0424) i PCOISS (-.360). Za tu usporedbu se koriste samo stanardizirani
koeficijenti, jer to znači da su transformirani na istu skalu kako bi se mogli porediti. Prema
tome, nema potrebe da se posmatraju vrijednosti Beta, navedene ispod Unstandardised
Coefficients. Kod beta-pondera, bitno je samo provjeriti koji standardizirani regresijski
koeficijent je najveći, pritom ne obraćajući pažnju na predznake, već samo na vrijednost. U
našem primjeru to je -.0424 (Mastery), što znači da je skala koja mjeri osjećaj kontrole nad
životnim događajima bolji prediktor za stres nego skala koja mjeri osjećaj kontrole nad
unutrašnjim stanjima.
Takođe, za svaku od nezavisnih varijabli provjerite vrijednost označenu kao Sig. Ona daje
informaciju o tome da li određena varijabla statistčki značajno pridonosi objašnjenju
varijance. To u velikoj mjeri ovisi o preklapanju između nezavisnih varijabli. Ako je
vrijednost Sig > 0.05, ta varijabla ne doprinosi značajno objašnjenju varijance, no u ovom
slučaju i Mastery i PCOISS skala čine jedinstven i statistički značajan doprinos. U stupcu
Part, dati su semiparcijalni koeficijenti korelacije (PCOISS=-.307; Mastery=-.362). Ukoliko
125
SPSS PRIRUČNIK
Zadaci za vježbu:
Baza podataka: sleep3ED.sav. Vidite dodatak za podatke o bazi podataka
1. Sprovedite standardnu multiplu regresijsku analizu da bi saznali koji faktori utječu
na količinu svakodevne potrebe za spavanjem. Za svoju zavisnu varijablu uzmite
ukupni skor skale Sleepiness and Associated Sensations (totSAS). Za nezavisnu
varijablu, koristi spol, dob, fizičku spremnost (fitrate) i skorove na skali HADS
Depression (depress). Prikažite koliki je postotak varijance sa ukupnih rezultata na
skali Sleepiness objašnjeno setovima varijabli. Koja varijabla daje najveći
doprinos?
126
V DIO
STATISTIČKI POSTUPCI ZA USPOREDBU
GRUPA
SPSS PRIRUČNIK
15.
HIPOTEZE, OBLAST ODBACIVANJA, STATISTIČKA
ZNAČAJNOST
Testiranje hipoteza
U svom općem značenju, hipoteze su misaone pretpostavke o nekoj pojavi, odnosima među
pojavama ili među činiocima jedne pojave koja je predmet istraživanja. U statistici, testiranje
hipoteze je postupak kojim se donosi odluka o stanju stvari u populaciji na osnovu podataka
prikupljenih na uzorku (npr. da li se aritmetička sredina uzorka statistički značajno razlikuje
od aritmetičke sredine populacije, te da li se aritmetičke sredine dva ili više uzoraka statistički
značajno razlikuju). Hipoteze se formiraju na osnovu prethodnih teorijskih saznanja,
novootkrivenih empirijskih činjenica, svakodnevnog iskustva ili općih vjerovanja.
Statistička hipoteza uključuje tvrdnju ili pretpostavku o parametru ili parametrima populacije.
Tvrdnja prema kojoj je populacijski parametar jednak određenoj vrijednosti ili da su
populacijski parametri dvije ili više grupa jednaki naziva se nul-hipoteza (H0). Tvrdnja
prema kojoj populacijski parametar nije jednak određenoj vrijednosti ili da su populacijski
parametri dvije ili više grupa različiti naziva se alternativna hipoteza (H1). Općenito prema
ovoj hipotezi se očekuje neki efekt, odnosno postojanje razlika.
128
SPSS PRIRUČNIK
Ako želimo dokazati neku tvrdnju uvijek polazimo od suprotne tvrdnje, odnosno polazimo od
nulte hipoteze (deductio ab absurdum – dovođenje do proturiječnosti ako se pretpostavi
suprotna tvrdnja).
Statistički test je postupak pomoću kojeg se dolazi do odluke o prihvatanju ili odbacivanju
nulte hipoteze. Zasniva se na slučajnoj varijabli X kojom se matematički definira distribucija
statistika uzoraka (npr. aritmetička sredina, razlika između dvije aritmetičke sredine,
varijanca, medijana i sl.). Statistik uzorka je vrijednost koja se nalazi u određenom rasponu.
Skup vrijednosti statistika za koje odbacujemo hipotezu H0 nazivamo oblast odbacivanja ili
kritična oblast. Veličina oblasti odbacivanja H0 određena je vjerovatnoćom (α) pojavljivanja
statistika uzorka u kritičnoj oblasti. Ova vjerovatnoća se naziva nivo značajnosti testa i
određuje se kao vjerovatnoća da će vrijednost slučajne varijable X pasti u kritičnu oblast.
Nivo značajnosti može biti određen arbitrarno, npr. 0,05 ili 0,01.
Na osnovu unaprijed određenog nivoa značajnosti (tj. kritičke oblasti) određujemo i kritične
vrijednosti statistika, tj. granične vrijednosti kritične oblasti.
Na osnovu vrijednosti statistika i kritične oblasti, donosimo zaključak. Ako statistik testa
pada u oblast odbacivanja, odbacujemo H0. Ako statistik testa nije u oblasti odbacivanja,
prihvatamo H0 (drugim riječima, ako pada u oblast prihvatanja H0). Praktično kada je p<α
test sugerira odbacivanje H0 („statistički značajno“).
Izbor statističkog testa zavisi od skale mjerenja i oblika raspodjele podataka. Zapravo
statističke testove dijelimo na parametrijske i neparametrijske. Parametrijski testovi koriste
se za provjeru hipoteza o nepoznatoj vrijednosti parametra populacije; preduvjet za njihovo
korištenje je intervalni/racio nivo mjerenja. Parametrijski testovi se vrše na osnovu nekih od
teorijskih raspodjela: normalne, Studentove t-raspodjele, F-raspodjele, binomne raspodjele
itd. Kada su podaci prikupljeni korištenjem nominalne ili rang skale mjerenja i kada podaci
prikupljeni intervalnom ili racio skalom mjerenja ne zadovoljavaju određene karakteristike
distribucije, koristimo neparametrijske testove.
129
SPSS PRIRUČNIK
130
SPSS PRIRUČNIK
16.
T-TEST
Kada želimo porediti aritmetičke sredine neke kontinuirane varijable, dvije grupe, odnosno
dva uzorka, tada koristimo t-test za nezavisne uzorke. Kod velikih uzoraka, t-raspodjela je
normalna raspodjela razlika između svih mogućih parova aritmetičkih sredina svih mogućih
uzoraka iste veličine koji se mogu izvući iz početne (teorijski beskonačno velike) populacije.
Teorijski, aritmetička sredina t-raspodjele iznosi:
µM1-M2=0
Prema H0 razlika između dvije aritmetičke sredine neće biti statistički značajna, odnosno u
raspodjeli će se pozicionirati oko aritmetičke sredine. Nasuprot tome, prema alternativnoj
hipotezi, razlika između dvije aritmetičke sredine će biti dovoljno velika (u apsolutnim
t=
131
SPSS PRIRUČNIK
nivoa: muškarci i žene) i jedna kontinuirana, zavisna varijabla (u ovom slučaju – rezultati na
upitniku samopoštovanja).
Procedura za izračunavanje t-testa za nezavisne uzorke:
1. U izborniku koji se nalazi na vrhu ekrana kliknite Analyze, zatim kliknite na
Compare means i odaberite Independent Samples T test.
2. Premjestite zavisnu (kontinuiranu) varijablu (npr. total self esteem) u Test variable
dio.
3. Premjestite nezavisnu (kategorijalnu) varijablu (npr. sex) u dio koji se naziva
Grouping variable.
4. Kliknite Define groups i u Grupu 1 ukucajte 1, a u Grupu 2 ukucajte 2. 1=muškarci,
2=žene. A ako se ne možete sjetiti korištenog koda, onda desnim klikom pritisnite na
variable name i izaberite Variable information. Ovo će izlistati sve kodove i oznake
za iste.
5. Kliknite Continue i onda OK.
Lower Upper
Equal
variances 3,506 ,062 1,622 434 ,105 ,847 ,522 -,179 1,873
Total assumed
Self Equal
esteem variances
1,661 422,349 ,098 ,847 ,510 -,156 1,850
not
assumed
132
SPSS PRIRUČNIK
2. Provjera pretpostavki
Prvi dio Independent Samples Test output-a pokazuje rezultate na testu (upitniku)
samopoštovanja. Također testira da li je varijanca rezultata u te dvije grupe približno
jednaka.
Ako je Sig. vrijednost veća od 0,05 trebao bi se koristiti prvi dio tabele Equal
variances assumed.
Ako je vrijednost 0,05 ili manja od 0,05 varijance ove dvije grupe nisu iste. U
ovom slučaju SPSS nudi mogućnost biranja alternativne t-vrijednosti: Equal
variances not assumed.
U navedenom primjeru koristimo prvi dio Equal variances assumed.
Ako je vrijednost u Sig. (2 tailed) jednaka ili manja od 0,05, postoji statistički
značajna razlika između grupa.
Ako je vrijednost u Sig. (2 tailed) veća od 0,05, onda nema statistički značajne
razlike među grupama. U našem primjeru vidimo da nema statistički značajne
razlike između aritmetičkih sredina grupa.
T-test za zavisne uzorke koristimo kada se mjerenja, u obje situacije koje želimo porediti, vrše
na istim ispitanicima. Isti ispitanici se podvrgavaju mjerenju u dvije vremenske tačke nakon
izlaganja eksperimentalnom postupku. Moguće je korištenje t-testa za zavisne uzorke kada
133
SPSS PRIRUČNIK
imamo „spojeni“ par ispitanika (to su ispitanici koji su slični po nekoj karakteristici). Jedan
ispitanik će biti podvrgnut jednom ispitivanju, a drugi ispitanik drugom ispitivanju.
Standardna pogreška razlike između aritmetičkih sredina se smanjuje. To se događa zbog toga
što se ovakvim istraživačkim nacrtima iz greške mjerenja isključuje varijabilitet između
ispitanika.
N Correlation Sig.
134
SPSS PRIRUČNIK
Lower Upper
Interpretacija outputa:
1. Određivanje cjelokupne značajnosti
U dijelu tabele koji je označen sa Paired Sample Test trebate pogledati finalnu
kolonu Sig. (tailed) – to je vaša vjerovatna vrijednost. Ako je ova vrijednost manja od
0,05, možete zaključiti da postoji statistički značajna razlika između dva rezultata u
dva mjerenja. U navedenom primjeru nivo značajnosti je 0,0005 i on je mnogo manji
od α koje iznosi 0.5. Na osnovu ovoga možemo zaključiti da postoji statistički
značajna razlika u rezultatima na testu koji mjeri strah od statistike u dva mjerenja
(time1 i time2).
135
SPSS PRIRUČNIK
17.
ANALIZA VARIJANCE
136
SPSS PRIRUČNIK
Ovaj postupak koristimo kada imamo jednu nezavisnu varijablu sa dva ili više nivoa i jednu
zavisnu kontinuiranu varijablu. U jednostavnoj analizi varijance postoji samo jedna nezavisna
varijabla i jedna zavisna varijabla, pri čemu „between-groups“ (između grupa) znači da
postoje različiti subjekti ili slučajevi u svakoj grupi.
Posmatrat ćemo sljedeći primjer: da li postoji statistički značajna razlika rezultata na testu
optimizma kod mladih osoba, osoba srednjih godina i starih osoba? Trebaju nam dvije
varijable: jedna kategorijalna, nezavisna (u ovom slučaju dob sa tri nivoa: mlada, srednja i
starija dob) i jedna kontinuirana, zavisna varijabla (u ovom slučaju je to rezultat na testu,
odnosno upitniku optimizma). ANOVA će nam pokazati da li postoji statistički značajna
razlika između aritmetičkih sredina rezultata dobivenih na skali optimizma kod ispitanika
različite dobi (mlade, srednje i starije dobi). Post-hoc test nam govori gdje su zapravo te
razlike; između kojih grupa se nalaze razlike.
137
SPSS PRIRUČNIK
ANOVA
Total Optimism
a. Asymptotically F distributed.
Multiple Comparisons
Dependent Variable: Total Optimism
Tukey HSD
(I) age 3 groups (J) age 3 groups Mean Std. Error Sig. 95% Confidence Interval
Difference (I-J) Lower Bound Upper Bound
138
SPSS PRIRUČNIK
Total Optimism
Tukey HSD
1 2
18 – 29 147 21,36
30 – 44 153 22,10 22,10
45+ 135 22,96
Sig. ,321 ,227
Interpretacija outputa:
Descriptives
Ova tabela vam daje informaciju o svakoj grupi.
139
SPSS PRIRUČNIK
ANOVA
Ova tabela pokazuje sumu kvadrata između grupa, unutar grupa kao i stepene slobode. Ako je
Sig. vrijednost manja ili jednaka 0,05, postoji statistički značajna razlika negdje između
grupa, odnosno između aritmetičkih sredina rezultata na testu optimizma. Ali ovo nam ne
govori o tome koja grupa (koja aritmerička sredina) se razlikuje od ostalih. U tabeli Multiple
Comparison to možemo vidjeti, jer ova tabela daje rezultate Post-hoc testa.
Multiple Comparison
Ovu tabelu je potrebno gledati samo ako je pronađena statistički značajna razlika u tabeli
ANOVA, tj. ako je Sig. vrijednost manja ili jednaka 0,05. Post-hoc test u ovoj tabeli će nam
tačno reći između kojih grupa postoji statistički značajna razlika. U našem primjeru samo se
grupa 1 i grupa 3 (mladi i stariji) međusobno razlikuju po rezultatima na testu optimizma.
140
SPSS PRIRUČNIK
a
Multivariate Tests
a. Design: Intercept
Within Subjects Design: time
141
SPSS PRIRUČNIK
b. Exact statistic
a
Mauchly's Test of Sphericity
Measure: MEASURE_1
b
Within Subjects Mauchly's Approx. Chi- df Sig. Epsilon
Effect W Square Greenhouse- Huynh- Lower-
Geisser Feldt bound
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent
variables is proportional to an identity matrix.
a. Design: Intercept
Within Subjects Design: time
b. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are
displayed in the Tests of Within-Subjects Effects table.
Pairwise Comparisons
Measure: MEASURE_1
b
(I) time (J) time Mean Difference Std. Error Sig. 95% Confidence Interval for
b
(I-J) Difference
Interpretacija outputa:
Descriptive statistics
Iz prve tabele outputa možemo iščitati statistike za tri seta rezultata (aritmetička sredina =
Mean; standardna devijacija = Std. Deviaton; broj ispitanika = N). Dobro bi bilo provjeriti
imaju li smisla ove kolone. Da li postoji jednak broj ispitanika u svakom uvjetu? Da li
dobivene vrijednosti imaju smisla ako uzmemo u obzir skalu koju smo upotrebljavali? U gore
navedenom primjeru možemo primjetiti da je najmanji rezultat za uvjet Time 1, a najviši u
uvjetu Time 3.
142
SPSS PRIRUČNIK
Multivariate tests
U ovoj tabeli vrijednost koja nas zanima je Wilks' Lambda, a njenu vjerovatnoću
provjeravamo u koloni Sig. U ovom primjeru vrijednost Wilks' Lambda je .25, sa
vjerovatnoćom pojavljivanja od .000 (što znači p<0.0005). Obzirom da je p manje od .05,
možemo zaključiti da postoji statistički značajan efekat vremena. Ovo nam sugeriše da postoji
promjena rezultata povjerenja kroz određene vremenske periode.
Pairwise comparisons
Ako utvrdimo statistički značajnu razliku između grupa od interesa, ne možemo odmah znati
između kojih tačno grupa postoji pomenuta razlika. Ovu informaciju možemo vidjeti iz
Pairwise comparisons tabele. U njoj su upoređene različite vremenske tačke i možemo
vidjeti da li je razlika među istima značajna. U našem primjeru svaka razlika je značajna (sve
vrijednosti u koloni Sig. su manje od .05).
Prezentacija rezultata:
Tabela 1
Deskriptivna statistika za skalu Povjerenje u součavanju mjerena za tri vremenska uvjeta
(Time 1, Time 2, Time 3)
Vremenski period N M SD
143
SPSS PRIRUČNIK
Nezavisne varijable čiji utjecaj testiramo pri analizi varijace nazivamo faktorima (odakle i
sam naziv „faktorijalna ANOVA“). Faktorijalna (još je nazivamo i složena) analiza varijance
zahtijeva dvije ili više nezavisnih varijabli. Kada imamo prisutne dvije nezavisne varijable
radi se o dvosmjernoj analizi varijance, tri nezavisne varijable govorimo o trosmjernoj, itd.
Važno je napomenuti da je, uz sam naziv „faktorijalna analiza varijance”, potrebno navesti
informacije o broju nezavisnih varijabli i njihovih nivoa.
Npr. Faktorijalna ANOVA 2 x 5 podrazumijeva da se radi o dva faktora, od kojih prvi ima
dva nivoa, a drugi pet nivoa.
Pri korištenju faktorijalne analize varijance, osim učinka glavnih efekata možemo vidjeti i
učinke efekata interakcije, što predstavlja veliku spoznajnu nadmoć nad jednostavnom
analizom varijance ili t-testom. Samim tim, izbor faktorijane analize varijance omogućava viši
stepen eksperimentalne kontrole, veću ekonomičnost kao i veću mogućnost generalizacije
dobivenih rezultata.
U prethodnom poglavlju smo koristili jednostavnu analizu varijance da bismo uporedili
učinke na testu triju dobnih skupina. Post-hoc testom smo utvrdili da starija dobna skupina
ima više učinke na testu optimizma u odnosu na druge dvije. No, da li postoji razlika u učinku
testa optimizma u starijoj dobnoj skupini između muškaraca i žena? Općenito, koji je utjecaj
dobi i spola na optimizam?
Da bismo odgovorili na ova pitanja neophodno je koristiti faktorijalnu dvosmjernu analizu
varijance 3 x 2.
144
SPSS PRIRUČNIK
Descriptive Statistics
Dependent Variable: Total Optimism
18 - 29 21.38 4.330 60
30 - 44 22.38 3.549 68
MALES
45+ 22.23 4.090 56
145
SPSS PRIRUČNIK
a
Levene's Test of Equality of Error Variances
Dependent Variable: Total Optimism
Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared
a
Corrected Model 238.647 5 47.729 2.475 .032 .028
Intercept 206790.069 1 206790.069 10721.408 .000 .962
sex 5.717 1 5.717 .296 .586 .001
agegp3 150.863 2 75.431 3.911 .021 .018
sex * agegp3 55.709 2 27.855 1.444 .237 .007
Error 8274.374 429 19.288
Total 221303.000 435
Corrected Total 8513.021 434
Multiple Comparisons
Dependent Variable: Total Optimism
Tukey HSD
(I) age 3 groups (J) age 3 groups Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval
Lower Bound Upper Bound
146
SPSS PRIRUČNIK
Interpretacija outputa:
Interakcija
Kao što smo rekli, interakcija koju možemo utvrditi putem složene analize varijance je njena
najveća prednost. Stoga je prvenstveno potrebno provjeriti da li postoji statistički značajan
efekat interakcije (npr. da li će se utjecaj dobi na optimizam razlikovati u zavisnosti od toga
da li ste muško ili žensko). Ukoliko utvrdimo postojanje statistički značajnog efekta
interakcije, sa lahkoćom možemo interpretirati glavne efekte. U gore prikazanom SPSS
output-u red koji trebamo gledati naziva se agegp3*sex. Da bismo utvrdili da li postoji
statistički značajan efekt interakcije, potrebno je provjeriti Sig. kolonu za istoimeni red;
ukoliko je ona jednaka ili manja od .05, ne postoji statistički značajan efekt interakcije. U
našem primjeru efekt interakcije nije statistički značajan (agegp3*sex: Sig.= 0.237). Ovaj
podatak nam govori da ne postoji statistički značajna razlika u efektu dobi na optimizam
između muškaraca i žena.
147
SPSS PRIRUČNIK
Glavni efekti
Glavni efekti predstavljaju efekte jedne nezavisne varijable na zavisnu (npr. efekt spola ljudi
svih dobnih skupina). U lijevoj koloni pronađite varijablu koja vas interesuje (npr. agegp3).
Da bismo odredili da li postoji glavni efekat neke nezavisne varijable, trebamo pogledati u
kolonu označenu sa Sig. pored svake varijable. Ako je vrijednost jednaka ili manja od .05,
postoji značajan glavni efekt za tu nezavisnu varijablu. U gore prikazanom primjeru postoji
značajan glavni efekt varijable dob (agegp3: Sig.=.021), ali ne postoji značajan glavni efekt
varijable spol (sex: Sig.=.586). Ovo znači da se žene i muškarci statistički značajno ne
razlikuju u rezultatu na testu optimizma, ali postoji statistički značajna razlika u rezultatima
optimizma između mlade, srednje i stare dobi.
Post-hoc analiza
Iako znamo da se gore navedene dobne skupine statistički značajno razlikuju u rezultatima
postignutima na testu optimizma, mi ne možemo odrediti između kojih skupina ova razlika
postoji bez post-hoc analize. Post-hoc analizu upotrebljavamo ako imamo više od dva nivoa
nezavisne varijable od interesa. Putem ove analize sistematski poredimo sve nivoe nezavisne
varijable da bismo utvrdili između kojih postoji statistički značajna razlika. U SPSS-u je
prikazana post-hoc analiza kao dio outputa ANOVA-e. No, svejedno prvenstveno trebamo
pogledati značajnost efekta interakcije i glavnih efekata, a tek zatim post-hoc analizu. U
našem primjeru pronašli smo statistički značajan glavni efekt varijable agegp3, stoga možemo
detaljnije proučiti post-hoc analizu za istoimenu varijablu.
Prezentacija rezultata:
148
SPSS PRIRUČNIK
utvrđeno da je glavni rezultat Grupe 1 bio značajno drugačiji od glavnog rezultata Grupe 3.
Grupa 2 se nije značajno razlikovala u odnosu na ostale dvije grupe. Glavni efekat varijable
spol, F(1,429)= .30 , p= .59, nije bio statistički značajan.
Zadaci za vježbu:
149
SPSS PRIRUČNIK
150
SPSS PRIRUČNIK
DODATAK
151
SPSS PRIRUČNIK
152
SPSS PRIRUČNIK
153
SPSS PRIRUČNIK
154
SPSS PRIRUČNIK
155
SPSS PRIRUČNIK
156
SPSS PRIRUČNIK
157
SPSS PRIRUČNIK
158
SPSS PRIRUČNIK
159
SPSS PRIRUČNIK
160
SPSS PRIRUČNIK
161