You are on page 1of 168

Napisala Istraživačka sekcija Udruženja studenata psihologije SINAPSA:

Mersad Bukva
Jasmin Čolić
Alma Dizdarević
Firdeus Kadrić
Belinda Kikić
Jasmina Kokić
Ediba Kondo
Selma Korlat
Boris Lovrinović
Tomislav Lučić
Aljoša Lješić
Smirna Malkoč
Lejla Mehić
Misala Rašić
Muamer Ušto

Zahvaljujemo se profesorima i asistentima Odsjeka za psihologiju, posebno doc. dr. Maidi


Koso-Drljević, ass. Nini Hadžiahmetović, doc. dr. Indiri Fako i sa Odsjeka za pedagogiju,
prof. dr. Lidiji Pehar.
Udruženje studenata psihologije „SINAPSA“
Istraživačka sekcija

SPSS
PRIRUČNIK

Mart, 2013.
Sadržaj
I DIO – UVOD U SPSS
1. Dizajniranje istraživanja ..................................................................................................... 2
1.1 Planiranje istraživanja ................................................................................................... 2
1.2 Odabir pravih skala i mjera ........................................................................................... 4
1.3 Pripremanje upitnika ..................................................................................................... 5
2. Pripremanje codebooka ...................................................................................................... 7
2.1 Imena varijabli .............................................................................................................. 7
2.2 Kodiranje odgovora ...................................................................................................... 8
2.3 Kodiranje otvorenih pitanja .......................................................................................... 9
3. Upoznavanje sa SPSS-om................................................................................................. 10
3.1 Pokretanje SPSS-a ...................................................................................................... 10
3.2 Otvaranje postojeće baze podataka ............................................................................. 10
3.3 Rad sa bazama podataka ............................................................................................. 11
3.4 SPSS prozori ............................................................................................................... 12
3.5 SPSS meniji ................................................................................................................ 16
3.6 Dijaloški okviri ........................................................................................................... 16
3.7 Zatvaranje SPSS-a ...................................................................................................... 18
3.8 Upotreba help-a........................................................................................................... 18

II DIO – PRIPREMANJE BAZE PODATAKA

4. Pravljenje baze podataka i unos podataka ........................................................................ 20


4.1 Mijenjanje SPSS-ovih opcija ...................................................................................... 21
4.2 Definiranje varijabli .................................................................................................... 24
4.3 Unošenje podataka ...................................................................................................... 29
4.4 Modifikovanje podataka ............................................................................................. 30
4.5 Unošenje podataka pomoću Excel-a ........................................................................... 30
4.6 Spajanje baza .............................................................................................................. 32
4.7 Korisne SPSS funkcije ................................................................................................ 33
4.8 Korištenje skupina ...................................................................................................... 35
5. Provjera ispravnosti baze podataka .................................................................................. 37
5.1 Prvi korak: traženje grešaka ........................................................................................ 37
5.2 Drugi korak: pronalaženje i ispravljanje grešaka........................................................ 40
5.3 Analiza ispitanika ....................................................................................................... 41

III DIO – PRELIMINARNE ANALIZE

6. Deskriptivna statistika ...................................................................................................... 48


6.1 Kategorijalne varijable ................................................................................................ 48
6.2 Kontinuirane varijable ................................................................................................ 49
6.3 Nedostajući podaci ...................................................................................................... 52
6.4 Procjena normalnosti .................................................................................................. 53
6.5 Provjera ekstremnih rezultata ..................................................................................... 58
7. Grafičko i vizualno predstavljanje .................................................................................... 60
7.1 Histogram .................................................................................................................... 60
7.2 Stupčasti dijagram ....................................................................................................... 62
7.3 Scatter plot .................................................................................................................. 63
7.4 Box-plot ...................................................................................................................... 65
7.5 Modifikacija grafika ................................................................................................... 67
7.6 Prebacivanje grafika i tabela u Word .......................................................................... 68
8. Manipulacija podacima ..................................................................................................... 70
8.1 Formiranje ukupnog skora .......................................................................................... 70
8.2 Transformiranje podataka ........................................................................................... 75
8.3 Kolapsiranje kontinuiranih varijabli u kategorije ....................................................... 82
8.4 Smanjenje broja kategorija u kategorijalnoj varijabli ................................................. 84
9. Pouzdanost ........................................................................................................................ 88
10. Izbor pravog statističkog postupka ................................................................................. 92
10.1 Pregled različitih statističkih tehnika ........................................................................ 92
10.2 Istraživanje povezanosti između varijabli ................................................................. 92
10.3 Istraživanje razlika između grupa ............................................................................. 93
10.4 Proces donošenja odluke ........................................................................................... 94

IV DIO – STATISTIČKI POSTUPCI ZA ISTRAŽIVANJE POVEZANOSTI MEĐU


VARIJABLAMA

11. Povezanost među varijablama: pretpostavke i preduslovi ............................................ 102


12. Bivarijatna korelacija .................................................................................................... 105
12.1 Računanje korelacije između grupa varijabli .......................................................... 109
12.2 Upoređivanje koeficijenata korelacije između dvije grupe .................................... 110
13. Parcijalna korelacija...................................................................................................... 112
14. Multipla regresijska analiza .......................................................................................... 115

V DIO – STATISTIČKI POSTUPCI ZA USPOREDBU GRUPA

15. Hipoteze, oblast odbacivanja, statistička značajnost .................................................... 128


16. T-test ............................................................................................................................. 131
16.1 T-test za nezavisne uzorke ...................................................................................... 131
16.2 T-test za zavisne uzorke .......................................................................................... 133
17. Analiza varijance .......................................................................................................... 136
17.1 Jednosmjerna analiza varijance .............................................................................. 137
17.2 RM ANOVA (repeated measures) .......................................................................... 140
17.3 Faktorijalna ANOVA .............................................................................................. 144
DODATAK ............................................................................................................................ 151
I DIO
UVOD U SPSS
SPSS PRIRUČNIK

1.
DIZAJNIRANJE STUDIJE

Iako na prvi pogled djeluje čudno da se govori o dizajniranju studije u priručniku za SPSS,
pravljenje nacrta je neizostavan dio istraživačkog procesa i ima važne implikacije na kvalitet
prikupljenih i analiziranih podataka. Prije svega, i podaci koje unosimo u SPSS-bazu moraju
doći odnekud. To mogu biti: odgovori na upitniku, informacije prikupljene iz intervjua,
kodirani odgovori iz opažanja, ili druge objektivne mjere određenih sposobnosti ili
performansi.

1.1. PLANIRANJE ISTRAŽIVANJA

Dobro istraživanje u velikoj mjeri zavisi od pažljivog planiranja. Postoji nekoliko savjeta koje
je korisno slijediti prilikom dizajniranja istraživanja:
 Prije svega, potrebno je razmotriti koji istraživački nacrt treba da upotrijebite (npr.
eksperiment, anketa, opažanje). Odaberite najbolji pristup, imajući u vidu njihove
prednosti i nedostatke u odnosu na vaše istraživačko pitanje. Kao dobar oslonac mogu
poslužiti istraživanja koja su se već bavila vašim istraživačkim pitanjem.
 Ako odaberete eksperiment, odlučite da li nacrt „između grupa“ (različiti ispitanici u
svakom eksperimentalnom uvjetu) ili nacrt „ponovljenih mjerenja“ (isti ispitanici u
svim uvjetima) bolje odgovara vašem istraživačkom pitanju.
 U eksperimentalnim studijima nastojte uključiti dovoljno nivoa nezavisne varijable.
Korištenje samo dva nivoa (ili dvije grupe) možda znači da je potrebno manje
ispitanika, ali ta odluka ograničava zaključke koje možete izvući.
 Uvijek odaberite više ispitanika nego što vam je potrebno, posebno ako koristite
uzorak koji čine ljudi. Ljudi su ozloglašeno nepouzdani - ne pojave se na vrijeme,
razbole se, otkažu ili ne ispune upitnike pravilno.
 U eksperimentalnim studijama, provjerite da li imate dovoljno ispitanika u svakoj od
grupa (i nastojte da ih izjednačite što je više moguće). U malim grupama teško je
detektirati statistički značajne razlike između grupa. Postoje načini na koje možete
izračunati koja je odgovarajuća veličina uzorka za vašu studiju.

2
SPSS PRIRUČNIK

 Kad god je to moguće, randomizacijom podijelite ispitanike u svaki od


eksperimentalnih uvjeta, radije nego da koristite postojeće grupe. Ovo smanjuje
problem nejednakih grupa povezanih u nacrtima „između grupa“. Također bi dobro
bilo izvršiti dodatna mjerenja grupa kako bi postigli da se one ne razlikuju značajno
jedna od druge. Razlike koje na taj način identificirate možda budete u mogućnosti
statistički kontrolirati.
 Odaberite nezavisne varijable koje su valjane i pouzdane. Dobra ideja je uključiti više
različitih mjera – neke mjere su osjetljivije od drugih. Ne stavljate sve u isti koš.
 Pokušajte predvidjeti mogući utjecaj relevantnih ili konfundirajućih varijabli. Ovo su
varijable koje mogu pružiti alternativno objašnjenje za vaše rezultate. Da bi pronašli
potencijalne relevantne faktore, možete zamoliti kolege da pregledaju vaš istraživački
nacrt prije nego ga provedete. Moguće je da oni uoče neku konfundirajuću varijablu
koja je vama promakla. Pored toga, poznavanje teme koju istražujete će vam također
pomoći identificirati potencijalnu konfundirajuću varijablu. Ako ove dodatne varijable
ne možete kontrolisati, provjerite da li ih možete mjeriti. Ako možete, onda ih možete
kontrolisati statistički (npr. korištenjem analize kovarijance).
 Ako dijelite upitnike, obavite pilot istraživanje kako biste osigurali da su upute, pitanja
i skale jasne. Kad god je to moguće, pilot istraživanje obavite na istoj populaciji ljudi,
koja će biti testirana u glavnoj studiji (npr. adolescente, nezaposlene mlade,
zatvorenike itd.). Ovo radimo da bismo osigurali da ispitanici razumiju pitanja i
odgovore na pravilan način. Također, pilot istraživanja otkrivaju pitanja ili iteme koji
bi mogli biti nejasni ispitanicima.
 Ako provodite eksperiment dobra ideja je da u pilot studiji testirate i eksperimentalnu
manipulaciju i zavisne mjere koje ćete koristiti. Ako koristite neku opremu, pobrinite
se da radi pravilno. Ako koristite različite eksperimentatore ili intervjuere, pobrinite se
da su oni pravilno istrenirani i da znaju šta trebaju činiti. Ako različiti opažači treba da
ocjenjuju ponašanje, pobrinite se da znaju kako će pravilno kodirati ono što uoče.
Provjerite i usaglašenost procjenjivača (koliko su konzistentni rezultati različitih
procjenjivača). Pilot istraživanje vam omogućava da identificirate bilo šta što bi moglo
krenuti po zlu, te svaki dodatni kontaminirajući faktor koji može utjecati na rezultate.
Neke od njih ne možete predvidjeti (npr. buku ispred prozora laboratorije), ali
pokušajte kontrolirati faktore koje možete.

3
SPSS PRIRUČNIK

1.2. ODABIR PRAVIH SKALA I MJERA

Postoji mnogo različitih načina za prikupljanje podataka, ovisno o prirodi vašeg istraživanja.
Ovo može uključivati: mjerenje uratka na nekom objektivnom kriteriju, ili ocjenjivanje
ponašanja prema setu specificiranih kriterija. Također može uključiti upotrebu skala koje su
dizajnirane da operacionaliziraju neke konstrukte ili atribute koji nisu direktno mjerljivi (npr.
samopoštovanje). Postoji mnogo valjanih skala koje se mogu upotrijebiti u studiji. Ali, nekad
je teško pronaći skalu koja odgovara vašoj svrsi. Mjesto gdje treba početi je temeljiti pregled
literature o vašoj temi. Koje mjere su upotrebljavali drugi istraživači u toj oblasti? Ponekad su
itemi koji čine skale uključeni u prilog članka, a ponekad morate naći originalni članak koji
opisuje dizajn i validaciju skale za koju ste zainteresirani. Neke skale možete upotrebljavati
samo ako kupite ''zvanične'' kopije od izdavača, dok su druge objavljene u potpunosti u
člancima, i smatra se da su ''u javnoj domeni'', što znači da ih istraživači mogu koristiti
besplatno. Vrlo je važno, međutim, da se navede naziv skale koju koristite, uz potpuno
detaljne reference.
Pri odabiru odgovarajućih skala postoje dvije karakteristike kojih morate biti svjesni:
pouzdanost i valjanost. Oba faktora mogu utjecati na kvalitetu podataka koje prikupite. Stoga
je potrebno da prilikom pregleda potencijalnih skala prikupite informacije i o njihovoj
pouzdanosti i valjanosti. Bez obzira koliko su dobri izvještaji o valjanosti i pouzdanosti vaših
skala, važno ih je testirati u pilot studiji sa vašim uzorkom. Jer, ponekad su skale pouzdane za
neke grupe (npr. odrasli ljudi koji govore engleski),ali su potpuno nepouzdane kad se koriste
na drugim grupama (npr. djeca iz ne-engleskih govornih područja).

Pouzdanost
Pouzdanost skale pokazuje koliko je ona slobodna od slučajne pogreške. Dva često korištena
indikatora pouzdanosti skale su test-retest pouzdanost i unutrašnja konzistencija.

Test-retest pouzdanost skale se procjenjuje provodeći mjerni instrument na istim ljudima u


dvije različite prilike, i računajući korelacije između rezultata koje dobijemo. Visoke test-
retest korelacije indiciraju skalu koja je više pouzdana. Također, morate uzeti u obzir prirodu
konstrukta koji skala mjeri kada razmatrate ovaj tip pouzdanosti. Skala koja mjeri trenutna
stanja raspoloženja vjerovatno neće ostati stabilna tijekom perioda od nekoliko sedmica.
Stoga, test-retest pouzdanost skale raspoloženja će vjerovatno biti niska.

4
SPSS PRIRUČNIK

Drugi aspekt pouzdanosti koji se može procijeniti je unutrašnja konzistencija. Ovo se odnosi
na stepen u kojem svi itemi skale mjere isti atribut (tj. stepen u kojem se ''drže skupa'').
Unutrašnja konzistencija može biti mjerena na više načina. Najčešće korišten način je
računanje Cronbachovog alfa koeficijenta (što je dostupno korištenjem SPSS-a). Ovaj
statistički pokazatelj odražava prosječne korelacije među itemima koji čine skalu. Vrijednosti
se kreću od 0 do 1, pri čemu više vrijednosti označavaju veću pouzdanost. Cronbachov alfa
koeficijent, također, ovisi o broju itema u skali. Tako npr., kad je mali broj itema u skali
(manje od 10), Cronbachov alfa-koeficijent može biti prilično nizak.

Valjanost
Valjanost skale odnosi se na stepen u kojem ona mjeri ono što treba da mjeri. Nažalost, nema
jasnog indikatora valjanosti skale. Osnovne vrste valjanosti su:
 Sadržajna valjanost – Da li test sadrži reprezentativan uzorak ponašanja iz domene
koja se mjeri.
 Kriterijska valjanost – Da li je test u korelaciji sa nekom eksternom varijablom –
kriterijem.
 Konstruktna valjanost – Da li test meri onu osobinu za koju je namijenjen.

1.3. PRIPREMANJE UPITNIKA

U današnjim istraživanjima prikupljaju se različite vrste podataka od ispitanika. Nekad je za


te svrhe potrebno dizajnirati i novi upitnik. U pripremi upitnika, potrebno je imati na umu
nekoliko stvari: kako koristiti ove podatke, koji statistički postupci su najprikladniji, te ovisno
o tome, možda je potrebnopostaviti pitanja na neki poseban način ili obezbjediti različite
formate odgovora.Loše isplaniran i dizajniran upitnik neće dati dobre podatke pomoću kojih
možete obraditi istraživačko pitanje.

Vrste pitanja
Većina pitanja mogu biti podijeljena u dvije grupe: zatvorena ili otvorena. Zatvoreni tip
pitanja uključuje nuđenje ispitaniku više različitih, prethodno definiranih odgovora. Izbori
mogu biti jednostavni: Da/Ne, Muškarac/Žena,ili mogu imati više različitih opcija.

5
SPSS PRIRUČNIK

Primjer:
Koji je Vaš nivo obrazovanja? (molimo označite)
1. Osnovna škola
2. Nešto srednje škole
3. Srednja škola
4. Zanat
5. Dodiplomski studij
6. Postdiplomski studij

Zatvorena pitanja je uglavnom jednostavno pretvoriti u numerički format koji zahtijeva SPSS.
Na primjer, Da može biti kodirano sa 1, a Ne može biti kodirano sa 2.
U gore navedenom primjeru se može unijeti broj koji odgovara rednom broju odgovora. Na
primjer, ako je ispitanik označio Dodiplomski studij, ovo bi bilo kodirano sa 5. Numerisanje
svakog od mogućih odgovora pomaže procesu kodiranja. Odlučite se za jedan način
numerisanja i držite ga se tokom cijelog upitnika.

Ponekad ne možete predvidjeti sve odgovore koje vam ispitanici mogu dati, pa su zato
potrebna otvorena pitanja. Njihova prednost je u tome što ispitanici imaju slobodu da
odgovore na svoj način, a nisu ograničeni izborima koje je obezbijedio istraživač.

Naprimjer:Koji je glavni izvor stresa u vašem životu trenutno?

___________________________________________________________________________

Odgovori na otvorena pitanja mogu biti sumirani u veći broj kategorija u SPSS-u. Ove
kategorije su obično identificirane nakon što pregledamo različite nivoe odgovara ispitanika.
Neke mogućnosti također mogu biti prikupljene pregledom prethodnih istraživanja tog
područja. Svakoj od ovih kategorija odgovora je dodijeljen broj (npr. posao=1, financije=2,
veza=3) i ovaj broj se unosi u SPSS.

6
SPSS PRIRUČNIK

2.
PRIPREMANJE CODEBOOKA

Prije nego što počnete unositi podatke u SPSS, potrebno je pripremiti 'codebook'. Codebook je
sažetak uputa koje koristite da biste konvertirali informacije dobivene od svakog ispitanika ili
slučaja (case) u format koji SPSS razumije. Pripremanje codebooka uključuje odluku kako
ćete:
1. definirati i označiti svaku od varijabli; i
2. dodijeliti brojke svakom od mogućih odgovora.

Sve ove informacije trebale bi biti zabilježene u knjigu ili kompjutersku bazu podataka
(codebook). Ovo držite na sigurnom mjestu kako biste lakše pristupili podacima sljedeći put.
U vaš codebook trebali biste navesti sve varijable iz vašeg upitnika, skraćena imena varijabli
koja ćete koristiti u SPSS-u i način na koji možete kodirati odgovore.
Primjer: U prvoj koloni Tabele 2.1. navedete imena varijabli. U drugoj koloni napišete
skraćeno ime za varijable koje će se pojaviti u SPSS-u, a u trećoj pojasnite detaljno kako ćete
kodirati prikupljene odgovore.

2.1. IMENA VARIJABLI

Svako od pitanja ili itema u vašem upitniku mora imati svoje jedinstveno ime varijable. Neka
od ovih će biti jasna (npr. spol, dob), dok drugi itemi, mogu biti imenovaniskraćenicama (npr.
op1, op2, op3 se koriste da se identificiraju itemi koji čine skalu Optimizma).

7
SPSS PRIRUČNIK

Tabela 2.1 Primjer codebook-a

Postoji više pravila koja se odnose na imenovanje varijabli. Imena varijabli:


 moraju biti jedinstvena (tj. svaka varijabla u setu podataka mora imati drugačije ime)
 mora započeti slovom (ne brojem)
 ne smije uključivati tačku, razmak, ili simbole (!,",*,˝)
 ne smije uključivati riječi korištene kao komande SPSS-a (all, ne, eq, to le, lt, by, or,
gl, and, ge, with)
 ne smije prelaziti 64 znaka (neke verzije SPSS-a ne dozvoljavaju više od 8 znakova,
pa je preporučljivo koristiti manje znakova, ako biste morali raditi na nekoj drugoj
verziji, koja se razlikuje od one na kojoj ste prvobitno radili).
Prva varijabla u svakom setu podataka treba biti ID – to je jedinstveni broj koji identificira
svaki slučaj. Prije početka unosa podataka, prođite kroz upitnike ili podatke i dodijelite im
broj. Napišite broj jasno na naslovnoj stranici. Kasnije, ako nađete grešku u nekom setu
podataka možete se vratiti na taj upitnik ili set podataka.

2.2. KODIRANJE ODGOVORA

Svakom od odgovora mora biti dodijeljen numerički kod prije nego što ga unesemo u SPSS.
Neke od informacija će već biti u ovom formatu (npr. dob u godinama). Druge varijable,
poput spola, će morati biti pretvorene u brojeve (npr. 1=muškarci, 2=žene).

8
SPSS PRIRUČNIK

Primjer:

Koji je Vaš bračni status? (molimo označite)

slobodan/na u vezi u braku razveden/a

Da biste kodirali odgovore gore: ako je osoba označila da je slobodna, taj odgovor kodirate sa
1, ako je u vezi to kodirate sa 2, ako je u braku 3, a ako je razveden/a to je 4.

2.3. KODIRANJE OTVORENIH PITANJA

Za otvorena pitanja – gdje ispitanici mogu odgovoriti kako oni žele – kodiranje je nešto
složenije. Na primjer, da biste kodirali pitanje„Šta je glavni izvor stresa u vašem životu, u
ovom trenutku?“, morat ćete proći kroz upitnik i potražiti uobičajene teme. Moguće je da ćete
primijetiti kako mnogo ispitanika navodi da su izvori njihovog stresa vezani s poslom,
financijama, vezama, zdravljem ili manjkom vremena. U vašem codebooku navedite ove veće
grupe odgovora pod ime varijable stres i dodijelite broj svakoj od njih (posao=1,
supružnik/partner=2, itd.). Također trebate dodati drugi numerički kod za odgovore koji nisu
upali u navedene kategorije (drugo=99).
Nakon što pripremite codebook, skoro ste spremni unijeti vaše podatke. Postoje dvije stvari
koje prvo trebate uraditi:
1. upoznati se sa SPSS-om, kako otvoriti i zatvoriti podatke, upoznati se sa različitim
prozorima i dijaloškim okvirima
2. pripremiti bazu podataka, koristeći informacije koje ste spremili u vašem
codebooku
Ponekad je najbolja kombinacija zatvorenih i otvorenih pitanja. Ovo se postiže tako što, pored
već navedenih kategorija, dodamo i kategorijuDrugo, kroz koju ispitanicima omogućavamo
da daju neki odgovor koji nije ponuđen. Obezbijedite jednu ili dvije linije na koju mogu
zapisati svoj odgovor. Ova kombinacija je posebno korisna u ranim stadijima istraživanja,
pošto daje informaciju o tome da li smo našim pitanjima adekvatno pokrili područje odgovora
koje ispitanici mogu dati.

9
SPSS PRIRUČNIK

3.
UPOZNAVANJE SA SPSS-OM

Postoji nekoliko ključnih stvari koje treba da znate o SPSS-u prije nego što počnete. Kao
prvo, SPSS koristi više različitih prozora, dizajniranih za različite svrhe. Prije nego što
pristupite ovim prozorima, morate otvoriti postojeću bazu podataka ili kreirati novu.

3.1. POKRETANJE SPSS-A

Postoji više načina za pokretanje SPSS-a:


 Najjednostavniji način je da potražite SPSS ikonu na vašem desktopu. Postavite kursor
na ikonu i kliknite dvaput.
 Također možete pokrenuti SPSS tako što kliknete naStart,postavite kursor na
Programs,i onda pronađete i kliknete na SPSS for Windows.
 SPSS će se također pokrenuti ako kliknete dvaput na SPSS bazu podataka u Windows
Explorer-u. Ove baze imaju .sav ekstenziju.
Kada otvorite SPSS, možda naiđete na sivi prednji ekran koji vas pita ''What would you like to
do?''. Jednostavnije je zatvoriti ovaj ekran i naviknuti se na korištenje drugih SPSS menija.
Kada zatvorite ovaj ekran, vidjet ćete praznu matricu. Da biste otvorili postojeću SPSS bazu
podataka, klinite na File, a potom Open, u meniju na vrhu ekrana.

3.2. OTVARANJE POSTOJEĆE BAZE PODATAKA

Ako želite da otvorite postojeću bazu podataka (npr. survey3ED), kliknite na File iz menija
na vrhu ekrana, odaberiteOpen, a zatimData. Open file dijaloški okvir će vam dopustiti da
pretražite različite foldere na vašem računaru kako biste pronašli mjesto gdje je vaša baza
pohranjena. Uvijek biste trebali otvarati baze sa hard diska na vašem kompjuteru. Ako imate
podatke na memory stick-u, prebacite ih u folder na hard disk vašeg računara prije nego što ga
otvorite. Pronađite bazu podataka u kojoj želite raditi i kliknite na Open. Upamtite, sve SPSS
baze podataka imaju .sav ekstenziju. Baza će se pojaviti pred vama u Data Editor prozoru.

10
SPSS PRIRUČNIK

3.3. RAD SA BAZAMA PODATAKA

U SPSS-u, dozvoljeno vam je da u isto vrijeme imate više od jedne baze podataka otvoreno.
Ovo može biti korisno, ali i zbunjujuće. Morate držati bar jednu bazu podataka otvorenu sve
vrijeme. Ako zatvorite neku bazu podataka, SPSS će vas upitati da li je želite spasiti prije
zatvaranja. Ukoliko ne spasite, izgubit ćete sve podatke koje ste unijeli i sve obrade koje ste
vršili na novim varijablama, otkako ste otvorili bazu.

Spašavanje baze podataka


Kada napravite bazu podataka, ili napravite promjene na postojećoj bazi (npr. dodate nove
varijable), morate spasiti svoju bazu podataka. Ovo se ne dešava automatski kao kod nekih
programa za tekstualnu obradu. Ako ne spašavate redovito, i nestane struje ili pritisnete
pogrešnu tipku, izgubit ćete sav svoj rad. Prilikom unosa podataka ćete ovo možda trebati
raditi skoro svakih deset minuta ili nakon svakih pet ili deset upitnika. Kako biste spasili bazu
podataka na kojoj radite, idite na File meni (gornji lijevi ugao) i odaberite Save. Također
možete kliknuti na ikonu koja izgleda kao floppy disk, koja se nalazi na alatnoj traci na
lijevom vrhu ekrana. Vaša baza podataka će se spasiti na disk u kojem trenutno radite, a to bi,
kao što je ranije spomenuto, uvijek trebao biti hard disk. Kada tek spasite novu bazu
podataka, pitat će vas da specificirate naziv za bazu i da označite folder ili mapu u koju će biti
spašena. Prvo odaberite folder, a onda ukucajte naziv baze. SPSS automatski dodaje svim
bazama podataka .sav ekstenziju, tako da bi ih mogla prepoznati kao SPSS baze podataka.
Nemojte mijenjati ovu ekstenziju, inače SPSS neće moći prepoznati bazu kada je pokušate
opet otvoriti.

Otvaranje druge baze podataka


Ako želite otvoriti drugu bazu podataka, kliknite na File i potom Open, i pronađite folder u
kojem je vaša druga baza podataka smještena. U dijaloškom okviru, odaberite željenu bazu i
zatim kliknite na Open dugme. Prva baza podataka će i dalje biti otvorena u drugom prozoru.
Preporučljivo je da zatvorite baze na kojima ne radite trenutno, jer može postati zbunjujuće
imati više baza otvoreno.

11
SPSS PRIRUČNIK

Pokretanje nove baze podataka


Kliknite na File, a potom u podmeniju na New, te onda na Data. Odavde možete početi
definirati vaše varijable i unositi podatke.

3.4. SPSS PROZORI

Glavni prozori koje ćete koristiti u SPSS- u su Data Editor, Viewer, Pivot Table Editor,
Chart Editor i Syntax Editor.

Kada počnete s analizom podataka, imatćete više ovih prozora otvoreno u isto vrijeme, što na
početku nekim studentima može djelovati zbunjuće. Uvijek će biti otvoren Data Editorjer on
sadrži bazu podataka koju analizirate. Kada počnete raditi neku analizu, otvorit će vam se
prozor Viewer, jer su tu prikazani rezultati svih vaših analiza, poredani u onom redoslijedu po
kojem ste ih izvršavali. Ipak, ovo se ne otvara dok vi ne pokrenete neki proces analize.

Ovi prozori su poput papira na vašem stolu - možete ih premještati, tako da su nekada jedni na
vrhu, a nekada drugi. Svaki od otvorenih prozora biće naveden na dnu vašeg ekrana. Da biste
promijenili prozor, samo kliknite na onaj na kojem želite raditi. Također možete kliknuti na
komanduWindow na gornjoj meni traci (u gornjem desnom dijelu ekrana). Tu će se izlistati
svi otvoreni prozori i moći ćete odabrati onaj na kojem želite raditi.
Ponekad prozori koje SPSS pokazuje ne popune čitav ekran. Mnogo je lakše kada imate
prozor Viewer (na kojem su pokazani rezultati) na čitavom ekranu. Kako biste ovo postigli,
maksimizirajte prozor klikom na srednje dugme, u gornjem desnom uglu ekrana. Da bi prozor
opet smanjili, ponovo kliknite na to dugme.

Data Editor prozor


Ovaj prozor pokazuje sadržaje vaše baze podataka, i u ovom prozoru možete otvarati,
spašavati i zatvarati postojeće baze podataka, kreirati novu bazu podataka, unositi podatke,
napraviti izmjene na postojećoj bazi podatka i pokrenuti statističke analize.

12
SPSS PRIRUČNIK

Slika 3.1Primjer Data Editor prozora

Viewer prozor
Kada počnete raditi analize, Viewer prozor će se otvoriti automatski. Ovaj prozor pokazuje
rezultate analize koje ste provodili, uključujući i tabele i grafikone. U ovom prozoru možete
modificirati output, izbrisati ga, kopirati ga, spasiti ga, ili ga čak prenijeti u Word dokument.
Kada spasite output u SPSS-u, spašen je zasebno sa .spo ekstenzijom, kako bi se razlikovao
od baza podataka koje imaju .sav ekstenziju. Viewer ekran se sastoji od dva dijela. Na lijevom
je outline, koji vam daje puni pregled analiza koje ste sproveli. Možete iskoristiti ovu stranu
da biste navigirali kroz vaš output (ponekad može postati jako dugačak). Samo kliknite na dio
na koji želite preći i on će se pojaviti na desnoj strani ekrana. Na desnoj strani Viewer prozora
su rezultati vaših analiza, koji mogu uključivati tabelarne i grafičke prikaze rezultata.

Spašavanje output-a
Da biste spasili rezultate vaših analiza morate ispred sebe imati Viewer prozor. Kliknite na
Filena vrhu ekrana, te potom kliknite na Save. Odaberite folder u koji želite spasiti vaš
output, a potom ukucajte ime koje jedinstveno identificira vaš output. Kliknite na Save. Da
bismo imenovali baze, koristimo skraćenicekoje sadrže ime baze podataka na kojoj radimo i
datum kada smo provodili analizu. Naprimjer, baza survey8may2006.spo sadržavat će analizu
koju smo proveli osmog maja 2006. koristeći bazu survey3ED. Neki autori čuvaju zapise svih
imena baza, zajedno sa detaljima analiza koje su izvedene. Ovako je lakše vratiti se na
rezultate jedne specifične analize.Kada započnete vlastito istraživanje, vidjet ćete kako
možete vrlo brzo akumulirati mnogo različitih baza koje sadrže rezultate različitih analiza.

13
SPSS PRIRUČNIK

Stoga, kako bi izbjegli konfuziju i frustracije, održavajte zapise analiza koje ste uradili i
mjesta na kojima ste ih sačuvali.

Slika 3.2 Primjer Viewer prozora

Pivot Table Editor prozor


Tabele koje vidite u Viewer prozoru (koje SPSS zove Pivot tabele) mogu biti modificirane
kako bi odgovarale vašim potrebama. Da biste modificirali tabele, trebate dvaput kliknuti na
njih, što vas uvodi u Pivot Table Editor. Možete koristiti ovaj editor, kako biste promjenili
izgled tabele, njenu veličinu, font, dimenzije kolona, a možete promijeniti prezentaciju
varijabli (transponovati redove i kolone).

Chart Editor prozor


Kada zatražite od SPSS-a da napravi histogram, stupčasti dijagram ili skaterplot, u početku ih
pokaže u Viewer prozoru. Ako želite napraviti izmjene u vrsti ili prezentaciji grafika, to
možete izvršiti u prozoruChart Editor tako što ćete dvaput kliknuti na vaš grafik. U ovom

14
SPSS PRIRUČNIK

prozoru možete modificirati izgled i format vašeg grafikona, promijeniti font, boje, šablone, i
markere linija.

Slika 3.3 Primjer Chart Editor prozora

Syntax Editor prozor


Nekada su SPSS komande radile na principu korištenja specijalnog komandnog jezika
odnosno sintakse. SPSS još uvijek u pozadini izvršava ovaj set komandi kako bi pokrenuo
svaki od programa, no mi uglavnom vidimo samo menije u Windowsu koji ''pišu'' komande za
nas. Iako su opcije koje su dostupne na SPSS menijima, uglavnom sve što treba studentima
dodiplomskog studija, postoje neke situacije u kojima je korisno znati šta se dešava ''iza
scene'' i preuzeti veću kontrolu nad analizom koju želite provesti. Ovo je moguće koristeći
Syntax Editor.
Sintaksa je dobar način da održavate zapise o tome koju komandu ste koristili, posebno kada
trebate raditi mnogo rekodiranja ili transformiranja varijabli. Syntax Editor možete koristiti i
kada trebate ponoviti više analiza ili generirati više sličnih grafikona. Pored toga, možete
koristiti normalne SPSS menije da biste prvo namjestili osnovne komande jedne zasebne
statističke tehnike, a potom da ih ''zalijepite'' na Syntax Editor. Prilično složene komande
također mogu biti ispisane da bi dopustile sofisticiranije rekodiranje i manipulaciju podacima.
SPSS ima Command Syntax Reference u Help meniju ako biste željeli neke dodatne
informacije. Sintakse su pohranjene u zasebnim tekstnim bazama sa .sps ekstenzijom.
Komande kopirane uSyntax Editor se ne izvode dok vi ne odaberete da ih otvorite. Da biste
pokrenuli ovu komandu, označite specifičnu komandu (obavezno uključite i tačku na kraju), a
potom kliknite na Run opciju iz menija ili na ikonu koja liči na strijelu na meni traci. Dodatni
komentari mogu biti dodani u bazu sintakse, tako što ih označite asteriskom.

15
SPSS PRIRUČNIK

3.5. SPSS MENIJI

U svakom od prozora koje otvorite SPSS vam nudi vrlo veliki izbor menija. Ovi meniji su
prikazani u vidu malih ikona (ili slika), i također u podmenijima na vrhu ekrana. Da vam ne bi
bilo previše, na početku naučite one ključne, a kada steknete više iskustva možete
eksperimentirati s drugima.

Slika 3.4Primjer Syntax Editor prozora

3.6. DIJALOŠKI OKVIRI

Nakon što odaberete opciju na meniju, svi upiti za daljnje informacije o odabranoj opciji će se
vršiti u dijaloškim okvirima. Sljedeći korak je, potom, da nominirate varijable koje želite
koristiti.

16
SPSS PRIRUČNIK

Slika 3.5 Primjer dijaloškog okvira Frekvencije

Odatle možete otvoriti više dodatnih poddijaloških okvira, u kojima je moguće specificirati
statistiku koju želite upotrijebiti, grafikone koje želite generirati i format u kojem želite da
rezultati budu prikazani. Ovisno o proceduri ili analizi koja se izvršava,dostupne su različite
opcije, ali osnovni principi korištenja dijaloških okvira su uvijek isti. Kako biste indicirali
koje varijable želite upotrijebiti, trebate označiti odabrane varijable na listi u lijevom dijelu
dijaloškog okivra (tako što kliknete na njih), a zatim kliknete na strelicu da ih premjestite u
prazan okvir Variable(s). Varijable možete selektirati jednu po jednu ili tako što odaberete
veću grupu varijabli i premjestite ih klikom na strelica. Ako su varijable koje želite da
odaberete sve navedene skupa, samo kliknite na prvu, držite Shift tipku na tastaturi i pritisnite
tipku za dolje na tastaturi, dok ne označite sve željene varijable. Potom kliknite na strelicu i
sve će se selektirane varijable pomjeriti u okvir Variable(s). Ako se varijable koje želite
selektirati nalaze na različitim mjestima na listi, prvo kliknite na prvu varijablu koju želite, a
potom držećiCtrl tipku kliknete na ostale željene varijable. Nakon što označite sve željene
varijable, kliknite na strelicu kako bi ih premjestili u okvir. Da biste uklonili varijable iz
okvira, samo obrnite proces. Odaberite varijable koje želite ukloniti u okviru Variable(s),
kliknite na strelicu, i to će premjestiti varijable nazad u originalnu listu. Primijetit ćete da se
pravac strelice promijeni ovisno o tome da li varijable ubacujete ili uklanjate iz Variable(s)
okvira.

17
SPSS PRIRUČNIK

Dugmadi u dijaloškim okvirima

U većini dijaloških okvira primijetit ćete više standardnih dugmadi (OK, Paste, Reset,
Cancel, i Help).Ova dugmad služe za:
 OK: Kliknite na ovo dugme kada selektirate vaše varijable i kada ste spremni da
pokrenete analizu ili proceduru.
 Paste: Ovo dugme se koristi da bi se prebacile komande koje je SPSS generirao u
ovom dijaloškom okviru na Syntax Editor. Ovo je korisno ako želite da zadržite
zapise o komandi ili da ponovite neku analizu više puta.
 Reset: Ovo dugme se koristi da bi se očistio dijaloški okvir i otkazuje sve komande
koje ste možda zadali, a koje su u vezi sa određenom procedurom.
 Help: Kliknite na ovo dugme da biste dobili informacije o tehnikama ili procedurama
koje ćete izvršiti.

3.7. ZATVARANJE SPSS-A

Kada završite s radom u SPSS-u i želite da zatvorite program, kliknite na Filena lijevom vrhu
ekrana, pa onda kliknite na Exit. SPSS će vas podsjetiti da spasite podatke i bazu koja sadži
vaš output. SPSS dodaje svakoj bazi ekstenziju da bi indicirala vrstu informacije koje sadrži.
Baza podataka će imati .sav ekstenziju, output će imati .spo ekstenziju, a baza sintakse će
imati .sps ekstenziju.

3.8. UPOTREBA HELP-A

Ako vam je potrebna pomoć dok koristite SPSS ili ne znate šta neke opcije znače, možete
koristiti ugrađeni Help meni. Kliknite naHelp na meni traci i ponudit će vam se više izbora.
Možete pitati za različite teme, proći kroz Tutorial, ili se konsultirati sa Statistc Coach. Ova
zadnja opcija vas vodi korak po korak kroz proces donošenja odluka uključen u odabir pravih
statističkih postupaka. U svakom od glavnih dijaloških okvira postoji dodatni Help meni koji
će vam pomoći sa procedurama koje odaberete. Pored toga, možete tražiti informacije o
različitim opcijama koje se nalaze u poddijaloškim okvirima. Pomjerite kursor na opcije za
koje niste sigurni i kliknite jedanput desnim klikom. Na ovaj način će se prikazati mali okvir
koji ukratko objašnjava određenu opciju.

18
II DIO
PRIPREMANJE BAZE PODATAKA
SPSS PRIRUČNIK

4.
PRAVLJENJE BAZE PODATAKA I UNOS PODATAKA

Za pripremu baze, unošenje i analizu podataka potrebno je proći kroz nekoliko koraka. U
ovom poglavlju ćete proći kroz te korake.

Za pripremanje baze morate proći tri ključna koraka:


1. korak: Prvi korak je da provjerite, i podesite ukoliko je to potrebno, opcije koje SPSS
koristi za prikazivanje podataka i rezultata.
2. korak: Naredni korak je da podesite strukturu baze tako što ćete definisati varijable.
3. korak: Posljednji korak je unošenje podataka – tj. vrijednosti svakog ispitanika za svaku od
varijabli.

Za ilustraciju ćemo koristiti bazu survey3ED.sav, koja je ranije opisana.


Baze podataka je također moguće prenijeti iz drugih programa koji koriste tabele (npr. Excel).
Ovo vam može učiniti proces unošenja lakšim ukoliko nemate instaliran SPSS na nekom od
kompjutera. Nakon kompletiranja baze možete je prenijeti u SPSS i nastaviti sa
manipulacijom i analizom podataka. Instrukcije za korištenje Excela za unos podataka su
opisane u nastavku ovog poglavlja.

20
SPSS PRIRUČNIK

Shematski prikaz procesa analize podataka

Pripremanje codebook (2. poglavlje)

Pripremanje baze (4. poglavlje)

Unošenje podataka (4. poglavlje)

Traženje i ispravljanje grešaka (5. poglavlje)

Analiziranje podataka korištenjem deskriptivne statiske i grafika


(6. i 7. poglavlje)

Modificiranje varijabli za daljnje analize (8. poglavlje)

Provođenje statističkih analiza za Provođenje statističkih analiza za


utvrđivanje odnosa među varijablama upoređivanje grupa (5. dio)
(4. dio)

Korelacija (11. poglavlje)


T-test (17. poglavlje)
Parcijalna korelacija (12. poglavlje)
Analize varijance (18., 19. i 20.
Multipla regresija (13. poglavlje) poglavlje)

4.1. MIJENJANJE SPSS-OVIH OPCIJA

Prije nego podesite bazu, bilo bi dobro provjeriti opcije u SPSS-u koje određuju kako se
podaci prikazuju. Opcije dozvoljavaju podešavanje načina na koji su varijable prikazane, vrste
tabela koje će biti prikazane u rezultatima i mnoge druge aspekte programa. Neke od ovih
stvari se mogu činiti zbunjujućim u početku, ali kada unesete podatke i izvršite analize možda
ćete se htjeti vratiti na ovo poglavlje.

21
SPSS PRIRUČNIK

Da otvorite Options prozor, kliknite na Edit na glavnom meniju i odaberite Options. Trebali
biste vidjeti prozor kao na slici. Imate mnogo opcija, ali većinu od njih nećete morati
podešavati. Ključne opcije su opisane ispod i organizirane su po tabovima u kojima se nalaze.
Nemojte klikati na OK dok niste završili sa podešavanjem svih opcija koje želite podesiti u
svakom od tabova.

Slika 4.1 Primjer prozora opcija

General tab
Kada radite analizu možete željeti da varijable budu prikazane po abecednom redu ili po
redoslijedu kako su unešene u bazu. U odjeljku Variable Lists odaberite File ako želite da
budu po redoslijedu u kom su unesene.
U Output odjeljku na desnoj strani, označite No scientific notation for small numbers in
tables. Ovo će spriječiti da dobijete nepotrebne brojeve u rezultatima analize. U odjeljku

22
SPSS PRIRUČNIK

Notification označite Raise viewer window i Scroll to new output opcije. Ove opcije znače
da će SPSS prilikom analize podataka otvoriti Viewer prozor u kojem će prikazati rezultate.

Data tab
Kliknite na Data tab da podesite način na koji će podaci biti prikazani. Ako vaše varijable
nemaju decimalnih mjesta, trebali biste promijeniti način prikazivanja varijabli. U odjeljku
Display Format for New Numeric Variables promijenite opciju Decimal Places na 0. Ovo
znači da će sve nove varijable biti prikazane bez decimalnih mjesta što smanjuje veličinu baze
i poboljšava preglednost.

Output labels tab


Opcije u ovom tabu omogućuju da odredite kako će biti prikazana imena varijabli i oznake
vrijednosti u rezultatima. U odjeljku na dnu za Variable values in labels are shown as:
odaberite Values and Labels sa liste. Ovo će omogućiti da vidite numeričke vrijednosti, kao i
eksplanatorne nazive u tabelama koje dobijete u Viewer prozoru nakon analize.

Charts tab
Kliknite na Charts tab da podesite izgled grafika. Možete promijeniti Chart Aspect Ratio,
ako želite, ili podesiti način na koji se grafici prikazuju (npr. font, boje, linije).

Pivot tables tab


SPSS većinu rezultata statističke analize predstavlja u tabelama koje se nazivaju pivot tabele.
U Pivot Tables tabu možete odabrati format tabele koji želite koristiti. Izbor vrste tabele je
stvar potrebe. Za obične rezultate koje planirate printati možete koristiti CompactBoxed, jer
ćete uštedjeti na veličini i papiru. Međutim, ovaj stil nije odgovarajući za zvanične dokumente
koji se šalju za objavljivanje, jer sadrži vertikalne linije. Za takve potrebe je najbolje koristiti
Academic.

Stil tabele možete mijenjati onoliko često koliko to želite, međutim, nakon što ste proveli
analizu nećete moći promijeniti stil tabele u rezultatima (osim ukoliko ne zanemarite
rezultate, promijenite stil tabele i ponovo provedete analizu podataka).

Nakon provedene analize ne možete mijenjati stil tabele, ali možete koristiti Pivot Table
Editor da promijenite neke dijelove tabele poput veličine fonta ili širine kolona. Da otvorite
Pivot Table Editor kliknite dvaput na tabelu koju želite podesiti.

23
SPSS PRIRUČNIK

Kada ste završili sa podešavanjem svih opcija u svim tabovima, kliknite OK. Sada možete
definirati varijable i unijeti podatke.

4.2. DEFINIRANJE VARIJABLI

Prije nego unesete podatke morate reći SPSS-u kako se vaše varijable zovu i kako ih pravilno
kodirati. To se zove definiranje varijabli, a uradit ćete to u Data Editor prozoru. Data Editor
prozor se sastoji od dva preglednika: Data View i Variable View. Da odaberete aktivni
preglednik kliknite u donjem lijevom uglu na odgovarajući tab.
U Data View pregledniku, svaka kolona je označena sa var u početku. Ovi nazivi će biti
zamijenjeni nazivima vaših varijabli kada ih unesete. Sa lijeve strane su brojevi 1,2,3... Ovo
su brojevi ispitanika koje SPSS dodjeljuje svakom skupu rezultata u linijama. Ovi brojevi nisu
isti kao ID brojevi i mogu se promijeniti ako napravite drugačiji redoslijed u bazi ili je
podijelite na dijelove.

Postupak za definiranje varijabli


Da definirate varijable koje čine vašu bazu, prvo morate kliknuti na Variable View tab u
donjem lijevom uglu. U ovom prozoru varijable su poredane u redovima, a njihove
karakteristike u kolonama (naziv, vrsta, širina, broj decimala, oznaka itd.).

Slika 4.2 Data Editor prozor

24
SPSS PRIRUČNIK

Vaš posao je da definirate svaku varijablu tako što ćete unijeti potrebne informacije za svaku
varijablu u vašem kodu. Neke od informacija ćete morati unijeti vi (poput naziva varijable), a
neke druge karakteristike će biti popunjene automatski koristeći unaprijed definirane
vrijednosti. Ukoliko je potrebno, unaprijed definirane vrijednosti je moguće izmijeniti. U
nastavku slijedi jednostavna procedura koja će vas korak po korak provesti kroz karakteristike
varijabli, a kada se bolje upoznate sa programom otkrit ćete način za brže popunjavanje svih
karakteristika što je objašnjeno kasnije u ovom poglavlju u odjeljku ''Opcionalne prečice''.

Naziv (Name)
U ovu kolonu unesite kratak naziv za vašu varijablu koji će vam pomoći da lahko pronađete
varijablu u bazi. Imena bi trebala biti što kraća. Svaki naziv mora biti unikatan, mora počinjati
sa slovom i ne može sadržavati simbole i prazne prostore. Ukoliko naziv varijable nije
pravilno unesen, SPSS neće dozvoliti da radite sa tom varijablom dok ispravno ne unesete
naziv varijable.

Vrsta (Type)
Unaprijed definirana vrijednost za vrstu varijable je Numeric, što znači da SPSS posmatra
varijablu kao numeričku i u većini slučajeva to je vrijednost koju trebate koristiti. U slučaju
da vaša varijabla nije numerička, već ima tekstualne vrijednosti, trebate odabrati vrijednost
String. Također, postoji i vrijednost Date ukoliko vrijednosti vaših rezultata uključuju
datume. Da promijenite vrstu varijable kliknite na vrijednost i mala kocka sa tri tačke će se
pojaviti na koju zatim trebate kliknuti. U ovom prozoru također možete podesiti širinu
varijable i broj decimalnih mjesta.

Širina (Width)
Unaprijed definirana vrijednost za širinu je 8, što znači da kao rezultat možete unijeti 8
brojeva ili slova. U većini slučajeva ne morate mijenjati ovu vrijednost, osim ako imate
veoma velike vrijednosti ili varijabla ima tekstualne vrijednosti.

Decimalna mjesta (Decimals)


Unaprijed definirana vrijednost za decimalna mjesta je 2 (osim ako niste promijenili u
Opcijama, što je objašnjeno ranije u ovom poglavlju). Ako vaša varijabla ima decimalna
mjesta, podesite vrijednost da odgovara vašoj varijabli.

25
SPSS PRIRUČNIK

Oznaka (Label)
Kolona sa oznakavam omogućava da unesete duži opis vaše varijable u odnosu na kratki opis
u koloni za naziv. Ovaj opis SPSS koristi prilikom predstavljanja rezultata analize. Npr. ovdje
možete dati oznaku „Ukupni Optimizam“ za varijablu kojoj ste dali ime UKOPT.

Vrijednosti (Values)
U koloni vrijednost možete definisati značenje vrijednosti koje ste koristili za kodiranje vaših
varijabli. Demonstrirat ćemo ovaj proces koristeći varijablu Spol.

Definiranje vrijednosti neke varijable:


1. Kliknite na tri tačke na desnoj strani ćelije, i tako otvoriteValue Label prozor.
2. Kliknite u prostor označen sa Value i unesite 1.
3. Kliknite u prostor označen sa Label i unesite Muški.
4. Kliknite na Add. U Summary dijelu ćete vidjeti 1=Muški.
5. Ponovite korake za Ženski spol: Value: 2, Label: Ženski, Add.
6. Kada završite definiranje svih mogućih vrijednosti kliknite na OK.

Kada kasnije budete unosili vrijednosti, u bazu unosite vrijednosti 1 ili 2 za varijablu spol, a
SPSS to prepoznaje kao „Muški“ ili „Ženski“ spol, jer ste u prethodnim koracima to definirali
za vašu varijablu.

Nedostajuće (Missing)
Ponekad istraživači definišu posebne vrijednosti za varijable kojima nedostaju vrijednosti.
Ovo nije neophodno, jer SPSS svaku praznu ćeliju prepoznaje kao nedostajuću vrijednost.
Ukoliko planirate na mjestu gdje nedostaju podaci ostaviti prazne ćelije, ne morate podešavati
ovu vrijednost.
Međutim, ako na mjestima gdje vam nedostaju podaci planirate unositi neku specifičnu
vrijednost (npr. 99 = Nije primjenjivo), onda morate specifirati ovu vrijednost u Missing
koloni, jer će u suprotnom SPSS vašu vrijednost „99“ smatrati stvarnim rezultatom koji će
uvrstiti u analizu. Kliknite unutar ćelije, zatim na tri tačke. U novom prozoru odaberite opciju
Discrete missing values i unesite vrijednost (npr. 99). Možete definirati maksimalno tri
vrijednosti, zatim kliknite na OK. Ako koristite ove vrijednosti, bilo bi dobro dodijeliti im i
vrijednosti u Value koloni.

26
SPSS PRIRUČNIK

Kolona (Columns)
Unaprijed definirana vrijednost je 8, što je dovoljno za većinu varijabli. Promijenite samo u
slučaju da je potrebno prilagoditi vašim vrijednostima ili dugim nazivima varijabli.

Poravnanje (Align)
Varijable su obično podešene na desno poravnanje i nema potrebe mijenjati ovu vrijednost.

Skala (Measure)
Kolona označena sa Measure se odnosi na skalu mjerenja koju koristi vaša varijabla.
Unaprijed definirana vrijednost je Scale što znači da su podaci kontinuirani i mjereni na
intervalnoj ili racio skali. Ukoliko vaša varijabla mjeri kategorije (npr. Spol), kliknite u ćeliju,
zatim na strelicu i odaberite Nominal (za kategorijalne varijable) ili Ordinal (ukoliko vaši
podaci uključuju rangiranje, npr. nivo završenog obrazovanja).

Opcionalne prečice
Proces opisan iznad može biti zamoran ukoliko imate veliki broj varijabli. Postoji mnogo
načina da ubrzate ovaj proces. Ako imate veliki broj varijabli koje imaju iste atribute (vrstu,
širinu, broj decimala, itd.), možete podesiti sve atribute za jednu varijablu, a zatim ih kopirati
na sve druge varijable koje imaju iste atribute.

Kopiranje atributa varijable na jednu drugu varijablu


1. U Variable View prozoru kliknite na atribut koji želite kopirati.
2. U Edit meniju kliknite na Copy.
3. Kliknite na isti atribut u varijabli na koju želite kopirati.
4. Iz Edit menija odaberite Paste.

Kopiranje atributa varijable na veći broj varijabli:


1. U Variable View prozoru odaberite atribut varijable koji želite kopirati.
2. Iz Edit menija odaberite Copy.
3. Kliknite na vrijednost tog atributa za prvu varijablu na koju želite kopirati, a zatim nastavite
držati lijevi klik i vucite miš prema dolje da označite sve varijable na koje želite kopirati taj
atribut.
4. Iz menija Edit odaberite Paste.

27
SPSS PRIRUČNIK

Podešavanje novih varijabli tako da koriste iste atribute


Ako se vaši podaci sastoje od skala sačinjenih od niza individualnih itema, možete kreirati
nove varijable i definirati atribute za sve njih odjednom. Procedura je opisana ispod, koristeći
6 itema na skali optimizma kao primjer. Ako želite proći ovu vježbu, napravite novi fajl (File-
New-Data).

Kreiranje većeg broja varijabli sa istim atributima:


1. U Variable View definišite atribute prve varijable prateći ranije objašnjenje upute. Ovo
uključuje i definiranje vrijednosti i njihovih oznaka kao 1=Uopće se ne slažem, 2=Ne slažem
se, 3=Neutralno, 4=Slažem se, 5=U potpunosti se slažem.
2. U Variable View prozoru kliknite na redni broj reda što će označiti čitav red.
3. Iz Edit menija odaberite Copy.
4. Kliknite na redni broj reda u slijedećem praznom redu.
5. Iz Edit menija odaberite Paste Variables.
6. U prozoru koji se otvori unesite broj dodatnih varijabli koje želite da dodate (u ovom
slučaju 5). Ukoliko želite, unesite prefiks sa kojim će počinjati varijable (npr. Optim) i također
unesite broj sa kojim želite da počinju nove varijable, u ovom slučaju 2. Kliknite OK.

Ovaj postupak će napraviti 5 novih varijabli (Optim2, Optim3, Optim4, Optim5, Optim6). Da
podesite sve ostale iteme na drugim skalama jednostavno ponovite proces opisan iznad.
Zapamtite, ova procedura se može koristiti samo ako varijable imaju sve iste atribute. Ukoliko
neke od varijabli imaju različite skale mjerenja ili neke druge atribute, ova procedura nije
pogodna, iako možete nakon provođenja procedure promijeniti pojedinačne atribute čime
ubrzavate proces pojedinačnog podešavanja svih atributa za svaku od varijabli.

28
SPSS PRIRUČNIK

4.3. UNOŠENJE PODATAKA

Nakon što ste definirali sve varijable i podesili njihove atribute, spremni ste za unos rezultata.

Postupak za unošenje podataka:


1. Da unesete podatke morate biti u Data View tabu. Ukoliko već niste, kliknite na Data
View u donjem lijevom uglu. U Data View pregledu ćete vidjeti tabelu sa varijablama na
vrhu.
2. Kliknite na prvu ćeliju u tabeli (prvi red, prva kolona).
3. Unesite broj (Ako je ovo kolona za ID varijable, onda bi trebali unijeti 1).
4. Pritisnite strelicu desno, program će preći na sljedeću ćeliju u koju unosite rezultat prve
varijable.
5. Nastavite ići desno i u svaku ćeliju unesite odgovarajući rezultat za varijablu kojoj ćelija
pripada.
6. Da se vratite na početak pritisnite tipku Home na tastaturi ili mišem kliknite na prvu ćeliju.
Zatim pritisnite strelicu dolje da pređete u donji red i unesete podatke za drugog ispitanika.
7. Ukoliko pogriješite prilikom unosa, kliknite na ćeliju u koju ste unijeli pogrešan rezultat i
ukucajte ispravan.

Nakon što ste definirali varijable i unijeli podatke, vaš Data Editor bi trebao izgledati kao na
slici 3.1. Ako ste za vaše varijable definisali oznake (npr. Spol: 1=Muški, 2=Ženski), onda
možete odabrati da umjesto brojeva Data Editor prikazuje oznake. Da to uradite, otvorite
View meni i odaberite opciju Value Labels. Ovu opciju također možete uključiti i tokom
unosa rezultata.U tom slučaju ne morate unostiti rezultate tipkanjem, već klikom na ćeliju
možete odabrati jednu od unaprijed definiranih vrijednosti. Da isključite ovu opciju opet odite
na View meni i kliknite Value Labels.

Nakon što ste definirali varijable i unijeli podatke, vaš Data Editor bi trebao izgledati kao na
slici 3.1. Ako ste za vaše varijable definisali oznake (npr. Spol: 1=Muški, 2=Ženski), onda
možete odabrati da umjesto brojeva Data Editor prikazuje oznake. Da to uradite, otvorite
View meni i odaberite opciju Value Labels.

29
SPSS PRIRUČNIK

4.4. MODIFIKOVANJE BAZE PODATAKA

Nakon što ste kreirali bazu možda ćete htjeti da je izmijenite (npr. da dodate nove varijable,
izbrišete ispitanike, itd.). Otvorite Data View.

Brisanje ispitanika
Označite cijeli red tako što kliknete na redni broj ispitanika na lijevom kraju tabele. Zatim
pritisnite tipku Delete na tastaturi ili otvorite Edit meni, a zatim odaberite Clear.

Unošenje novog ispitanika između postojećih


Kursorom označite početnu ćeliju u redu gdje želite dodati novog ispitanika. Otvorite Edit
meni i odaberite Insert Cases. Na mjestu gdje ste označili,pojavit će se prazan red za
unošenje podataka novog ispitanika.

Brisanje Varijable
Slično kao sa ispitanicima, jednim klikom na vrh kolone koja sadrži vašu varijablu možete
označiti cijelu kolonu, a zatim pritisnite Delete na tastaturi ili odaberite opciju Clear iz Edit
menija da biste obrisali željenu varijablu.

Dodavanje nove varijable između postojećih


Kliknite na ćeliju u koloni gdje želite dodati novu varijablu, a zatim iz Edit menija odaberite
Insert Variable. Na mjestu gdje ste kliknuli pojavit će se nova kolona.

4.5. UNOŠENJE PODATAKA POMOĆU EXCEL-A

Baze podataka se mogu napraviti i u Microsoft Excel-u, a zatim prenijeti u SPSS kako bi se
provela analiza. Procedura za pravljenje baze je opisana ispod, međutim, da bi koristili ovu
metodu morate već posjedovati osnovno znanje o radu sa Excelom, jer ovaj priručnik neće
sadržavati upute vezane za Excel.
Napomena: Excel može imati maksimalno 256 kolona podataka (varijabli). Ukoliko vaši
podaci zahtijevaju veći broj varijabli, u tom slučaju je preporučljivo bazu praviti u SPSS-u.

30
SPSS PRIRUČNIK

1. korak: Unošenje naziva varijabli


Napravite Excel dokument i unesite varijable u prvom redu dokumenta, tako da svaka
varijabla ima svoju kolonu.

2. korak: Unošenje podataka


1. Unesite podatke za prvog ispitanika u prvom slobodnom redu, unoseći rezultat na
svakoj varijabli u odgovarajuću kolonu.
2. Ponovite proces za sve ostale ispitanike. Nemojte koristiti Excelove formule ili druge
funkcije.
3. Iz File menija odaberite Save As i odaberite Microsoft Excel Workbook kao vrstu
fajla.

3. korak: Konvertovanje u SPSS


1. Nakon što ste unijeli podatke spasite fajl.
2. Otvorite SPSS i odaberite File – Open – Data sa glavnog menija.
3. U dijelu označenom Files of type, odaberite Excel. Excel fajlovi imaju nastavak .xls
ili xlsx. Pronađite vaš fajl i kliknite na njega.
4. Kliknite Open, otvoriće se ekran sa natpisom Opening Excel Data Source. Označite
opciju Read variable names from the first row of data ukoliko već nije označena i
kliknite OK.

Baza će biti otvorena a varijable će biti ispisane na vrhu tabele. Sada trebate spasiti bazu kao
SPSS fajl.

4. korak: Spašavanje baze u SPSS formatu


1. Iz File menija odaberite Save As.
2. Unesite odgovarajuće ime za bazu i odaberite SPSS Statistics (*.sav) u Save as Type
odjeljku ukoliko nije već odabrana ta opcija.
3. U Variable View tabu sada trebate definirati Oznaku, Vrijednost i Mjernu skalu za
svaku varijablu (što je objašnjeno ranije u ovom poglavlju) i po potrebi smanjiti širinu
kolone koju Excel obično stavlja na 11, dok SPSS, osim u slučaju potrebe zbog
specifičnosti varijable, koristi širinu 8.

31
SPSS PRIRUČNIK

Kada kasnije budete ponovo otvarali ovu bazu, otvarajte verziju sa oznakom .sav a ne
originalnu Excelovu verziju sa oznakom .xls ili .xlsx.

4.6. SPAJANJE BAZA

Ponekad je potrebno spojiti dvije ili više baza u jednu.SPSS vam omogućava da spojite baze
dodavanjem ispitanika na kraju baze ili dodatnih varijabli za postojeće ispitanike (npr. kada
imate rezultate drugog mjerenja). Ova opcija je također pogodna kada imate Excel fajlove sa
podacima u nekoliko tabela koje treba spojiti prema ID-u.

Spajanje baza dodavanjem ispitanika


Ovaj postupak vam omogućava da spojite dvije baze koje imaju iste varijable, ali različite
ispitanike (npr., kada ste podatke prikupili na dvije lokacije ili kada su ih unosile dvije osobe).
Obje baze bi trebale sadržavati iste varijable.
Ako su ID brojevi u obje baze isti (počinju sa ID=1, 2, 3..), onda ćete morati promijeniti ID
brojeve u jednoj od baza prije spajanja kako bi zadržali sve ispitanike. Kako bi to uradili,
otvorite jednu od baza, odaberite Transform iz menija, zatim Compute Varijable. Unesite
ID u Target Variable, a zatim ID + 1000 u Numeric Expression prostor (umjesto 1000 to
može biti bilo koji broj, a da je veći od broja ispitanika u bazi sa kojom želite spojiti novu
bazu). Kliknite OK, a zatim ponovo OK u prozoru koji vas pita da li želite promijeniti
varijablu. Ovo će promijeniti ID ispitanika tako da počinju sa 1001, 1002, 1003, itd. Sada
možete spojiti baze.

Procedura:
1. Otvorite prvu bazu koju želite spojiti.
2. Iz Data menija odaberite Merge Files, a zatim Add Cases.
3. U prozoru koji se otvori kliknite na An external SPSS data file i odaberite bazu sa kojom
želite spojiti (ukoliko je i druga baza istovremeno otvorena u SPSS-u bit će ispisana iznad u
opciji An open dataset).
4. Kliknite na Continue,a zatim na OK. Spasite novu bazu koristeći novo ime (File – Save
As).

32
SPSS PRIRUČNIK

Spajanje baza dodavanjem varijabli


Ova opcija je korisna kada dodajete dodatne informacije za postojeće ispitanike sa istim ID
brojevima.

Procedura:
1. Poredajte obje baze po ID brojevima od najmanjeg prema najvećem tako što ćete iz Data
menija odabrati Sort Cases, a zatim opciju ID.
2. Iz Data menija odaberite opciju Merge Files,potomAdd Variables.
3. U prozoru koji se otvori kliknite na An external SPSS data file i odaberite bazu sa kojom
želite spojiti (ukoliko je i druga baza istovremeno otvorena u SPSS-u bit će ispisana iznad u
opciji An open dataset).
4. U Excluded Variables listi ćete vidjeti ID varijablu (automatski je isključena iz procesa
spajanja zato što se nalazi u obje baze i nema potrebe za spajanjem). Ako na ovoj listi imate i
neke druge varijable osim ID, morat će te ih preimenovati koristeći Rename funkciju kako bi
imale unikatno ime.
5. Kliknite na ID varijablu, a zatim označite Match cases on key variables, te potom kliknite
na strelicu da prebacite ID varijablu u Key Variables listu. Ovo znači da će svi podaci biti
upareni prema ID broju. Kliknite Continue, zatim OK.
6. Spasite novu bazu koristeći novo ime ( File – Save As).

4.7. KORISNE SPSS-FUNKCIJE

SPSS sadrži mnoge korisne funkcije koje možete koristiti prilikom analize kako bi uštedjeli
vrijeme. Neke od najbitnijih su objašnjene u nastavku.

Sortiranje ispitanika
Možete sortirati bazu prema vrijednostima u vašim podacima (npr. prema spolu, dobi..).

Procedura za sortiranje ispitanika:


1. Kliknite na Data meni, zatim na Sort Cases i odaberite u kojoj varijabli želite poredati
vaše podatke. Također možete odabrati smjer, od najmanje ka najvećoj vrijednosti ili obrnuto.
2. Da vratite bazu na originalni raspored ponovite proces i odaberite ID varijablu.

33
SPSS PRIRUČNIK

Dijeljenje baze podataka


Nekad je potrebno podijeliti bazu i izvršiti analize na određenim dijelovima (npr. odvojene
analize za muškarce i žene). Ova opcija ne mijenja trajno vašu bazu i možete je uključiti ili
isključiti kada god želite. Međutim, ova opcija će promijeniti raspored po kojem su poredani
ispitanici u bazi.

Procedura za dijeljenje baze podataka:


1. Kliknite na Data meni i odaberite Split File opciju.
2. Kliknite na Compare Groups i odaberite varijablu po kojoj želite grupirati ispitanike (npr.
Spol). Kliknite OK.

Kada izvršite statističku analizu, nakon uključenja ove opcije, dobit ćete odvojene analize za
ispitanike u svakoj od grupa. ZAPAMTITE: Kada završite sa analizom isključite ovu opciju.

Procedura za poništavanja dijeljenja baze podataka:


1. Kliknite na Data meni i odaberite Split File opciju.
2. Kliknite na prvu stavku Analyze all cases, do not create groups. Kliknite OK.

Odabiranje grupe ispitanika


Za neke analize ćete možda trebati provesti analizu na samo jednoj od grupa među vašim
ispitanicima (npr. Muškarci).

Procedura za odabir grupe ispitanika:


1. Kliknite na Data meni i odaberite Select Cases opciju.
2. Kliknite na If condition is satisfied dugme.
3. Kliknite na dugme označeno sa IF.
4. Odaberite varijablu koja označava grupu koja vas zanima (npr. Spol).
5. Kliknite na strelicu da prebacite odabranu varijablu u okvir.
6. Unesite vrijednost varijable koja vas zanima. (npr. ako ste Muškarce kodirali sa 1, onda
unesite vrijednost 1. Komandna linija bi trebala izgledati ovako Spol=1.)
7. Kliknite na Continue, a zatim na OK.

Analize koje provedete nakon uključivanja ove opcije će pokazati rezultate samo za odabranu
grupu ispitanika.
34
SPSS PRIRUČNIK

ZAPAMTITE: Kada završite sa analizom isključite ovu opciju, jer će u suprotnom SPSS svaku
sljedeću analizu provesti samo na odabranoj skupini ispitanika.

Procedura za poništavanja izbora grupe ispitanika:


1. Kliknite na Data meni, zatim odaberite Select Cases opciju.
2. Kliknite na prvu opciju All cases option. Kliknite OK.

4.8. KORIŠTENJE SKUPINA

Kada radite sa velikim bazama podataka može postati zamorno da prolazite kroz sve varijable
da dođete do onih koje vas zanimaju u tom trenutku. SPSS, stoga, dozvoljava kreiranje setova
varijabli. Ovu opciju možete isprobati u survey3ED.sav bazi koja sadrži veliki broj
individualnih varijabli koje čine finalni skor. U primjeru ispod ćemo napraviti set varijabli
koji uključuje samo demografske podatke i finalni skor.

Procedura:
1. Kliknite na Utilities meni i odaberite Define Variable Sets opciju.
2. Odaberite varijable koje želite staviti u set. Za ovaj primjer odaberite ID, sve demografske
varijable (od Spola sve do Edukacije) a zatim i sve ukupne skorove na kraju baze od Ukupnog
Optimizma, pa do kraja. Premjestite ove varijable u Variables in Set listu.
3. U Set Name prostoru unesite odgovarajuće ime za vaš set.
4. Kliknite na Add Set dugme, zatim na Close.

Da biste koristili set koji ste upravo napravili, morate ga aktivirati.

Procedura za poništavanje opcije korištenja skupina:


1. Kliknite na Utilities, a zatim na Use Variable Sets.
2. Sa liste setova varijabli odaberite vaš set koji ste upravo napravili, te iznad odznačite
opciju ALLVARIABLES (jer bi u tom slučaju bile prikazane sve varijable). Opciju
NEWVARIABLES ostavite označenu. Kliknite na OK.

Kada je set aktiviran, samo varijable koje pripadaju tom setu će biti prikazane u bazi i u
opcijama za provođenje analiza.
35
SPSS PRIRUČNIK

Isključivanje aktivnih setova:


1. Kliknite na Utilities, zatim na Use Variable Sets.
2. Označite ALLVARIABLES opciju i kliknite OK.

Bilješke u bazi podataka


U Utilities meniju SPSS vam dozvoljava da spasite bilješke zajedno sa bazom.

Procedura za dodavanje bilješki:


1. Odaberite Utilities, potom Data File Comments.
2. Unesite vaše zabilješke, a ako želite da budu prikazane i među rezultatima analiza kliknite
na Display comments in output opciju.

Prikazivanje oznaka vrijednosti varijabli u bazi


Kada u Data Editoru posmatrate bazu, obično su prikazane numeričke vrijednosti svih
varijabli. Ako želite da umjesto toga SPSS pokazuje oznake varijabli (npr. Muško, Žensko,
umjesto 1, 2), onda iz View menija odaberite Value Labels. Da isključite ovu opciju ponovno
iz View menija odaberite Value Labels.

36
SPSS PRIRUČNIK

5.
PROVJERA ISPRAVNOSTI BAZE PODATAKA

Prije nego što pređete na statističke analize, veoma je bitno provjeriti da li u bazi ima grešaka.
Prilikom unosa podataka može se desiti da nehotice unesete pogrešan broj što može utjecati
na rezultate, posebno kod nekih analiza koje su veoma osjetljive na ''outliere'', odnosno
vrijednosti koje su veće ili manje od ostatka rezultata. Stoga je neophodno proći kroz proces
traženja grešaka u vašoj bazi prije nego što krenete sa bilo kakvim analizama. Vježbu možete
proći koristeći bazu error3ED.sav.
Prije nego što počnete sa ovim, iz Edit menija odaberite Options, a zatim u Output Labels
tabu pronađite Variable values in labels shown as: i odaberite Values and Labels. Ovo će
omogućiti istovremeno prikazivanje i oznaka i vrijednosti varijabli, što će traženje grešaka
učiniti lakšim.

5.1. PRVI KORAK: TRAŽENJE GREŠAKA

Kada tražite greške, prvo na što trebate obratiti pažnju su vrijednosti koje odstupaju od
mogućih (npr. ukoliko za varijablu Spol imate moguće rezultate 1=Muško i 2=Žensko, onda
se bilo koji drugi rezultat osim 1 i 2 smatra greškom).
Ispod su objašnjena dva načina provjere grešaka, prvi je pogodniji za kategorijalne varijable, a
drugi za kontinuirane varijable.

Provjeravanje kategorijalnih varijabli:


1. Kliknite Analyze,Descriptive Statistics, zatim Frequencies.
2. Odaberite varijable koje želite provjeriti (kategorijalne varijable poput Spol, Bračni status,
itd).
3. Kliknite na strelicu da ih uvrstite na listu.
4. Kliknite na Statistics dugme. Označite Minimum i Maximum u Dispersion odjeljku.
5. Kliknite Continue, a zatim OK.

37
SPSS PRIRUČNIK

Prikaz dobivenog outputa:

Statistics

Sex highest educ


completed

Valid 439 439


N
Missing 0 0
Minimum 1 1
Maximum 3 22

Frequency Table
sex

Frequency Percent Valid Percent Cumulative


Percent
MALES 185 42,1 42,1 42,1

FEMALES 253 57,6 57,6 99,8


Valid
3 1 ,2 ,2 100,0

Total 439 100,0 100,0

highest educ completed

Frequency Percent Valid Percent Cumulative


Percent

PRIMARY 2 ,5 ,5 ,5

SOME SECONDARY 52 11,8 11,8 12,3

COMPLETED HIGHSCHOOL 85 19,4 19,4 31,7

SOME ADDITIONAL TRAINING 120 27,3 27,3 59,0

COMPLETED
Valid 123 28,0 28,0 87,0
UNDERGRADUATE

POSTGRADUATE
56 12,8 12,8 99,8
COMPLETED

22 1 ,2 ,2 100,0

Total 439 100,0 100,0

38
SPSS PRIRUČNIK

U outputu ćete dobiti nekoliko tabela kao što je prikazano. Prva tabela daje osnovne
informacije o svim označenim varijablama, a ostale tabele daju detaljne informacije sa
rezultatima i frekvencijama za sve varijable pojedinačno.

U prvoj tabeli provjerite vrijednosti Minimum i Maximum i da li imaju smisla. Ukoliko za


spol imate maksimalnu vrijednost veću od 2, ili minimalnu vrijednost manju od 1, onda to
ukazuje na grešku.
Provjerite Valid i Missing ispitanike. Ukoliko imate previše nedostajućih (missing)
vrijednosti, zapitajte se šta bi mogao biti uzrok tome. Da li zaista imate takve rezultate ili je
uzrok greška prilikom unosa podataka. Može se desiti da ste slučajno unijeli veći broj
ispitanika od stvarnog broja. Kako bi provjerili da li je tu izvor pogreške, vratite se u Data
Editor prozor, a zatim idite na kraj vaših rezultata i izbrišite suvišne ispitanike, ukoliko ih
ima.
U tabelama sa detaljnim prikazom možete vidjeti sve moguće rezultate koje ste unijeli za
određenu varijablu i njihove frekvencije, što će vam omogućiti da znate u koliko slučajeva ste
napravili pogrešku (međutim, treba obratiti pažnju na to da ukoliko ste za muškog ispitanika
unijeli rezultat 2 i time ga označili kao žensko, ili obrnuto, SPSS to ne može prepoznati kao
grešku. Stoga pogledajte ukupan broj ispitanika za svaki spol i uporedite sa stvarnim brojem
ispitanika po spolu).

Provjeravanje kontinuiranih varijabli:


1. Sa menija odaberite Analyze -- Descriptive Statistics – Descriptives.
2. Kliknite na varijable koje želite provjeriti (u ovom slučaju odaberite kontinuirane
varijable).
3. Kliknite na Options. Možete odabrati raspone koje želite prikazati, glavni u ovoj fazi
su aritmetička sredina, standardna devijacija, minimum i maksimum. Kliknite na
statistike koje želite da budu prikazani.
4. Kliknite Continue, a zatim OK.

39
SPSS PRIRUČNIK

5.2. DRUGI KORAK: PRONALAŽENJE I ISPRAVLJANJE GREŠAKA

Ukoliko ste utvrdili da postoje rezultati koji ne spadaju u vaše očekivane rezultate, potrebno
ih je pronaći i ispraviti. S obzirom da baze mogu biti velike, traženje analiziranjem svakog
ispitanika bi moglo potrajati. Stoga postoje prečice.

Procedura preko Sort Cases:


1. Iz Data menija odaberite Sort Cases.
2. U prozoru koji se otvori odaberite varijablu za koju ste utvrdili da ima pogrešno unesene
vrijednosti, zatim kliknite na strelicu da je prebacite na Sort By listu. Kliknite na
ascending ili descending u zavisnosti od smjera u kom želite da poredate rezultate.
Ukoliko imate rezultat veći od maximalnog mogućeg, kliknite descending da poredate
rezultate od najvećeg ka najmanjem. Kliknite OK.

U Data View tabu su vaši ispitanici sada poredani poredani od najvećih na vrhu tabele do
najmanjih na dnu, u željenoj varijabli. Vrijednosti koje su prelazile preko maksimalne
vrijednosti će sada biti na vrhu. Utvrdite za koje ispitanike ste pogrešno unijeli rezultate
provjerom njihovog ID-broja, te pronađite sirove podatke i unesite tačan rezultat.

Procedura preko Find:


1. Otvorite Data View.
2. Kliknite na ime varijable u kojoj ste u prvom koraku pronašli grešku.
3. Kliknite jednom da označite kolonu.
4. Kliknite na Edit, zatim na Find.
5. U Find prostoru unesite vrijednost koju želite pronaći (vrijednost koju ste vidjeli u
tabelama, a koja ne bi trebala biti među rezultatima).
6. Kliknite Find Next. SPSS će proći kroz bazu i stati na prvoj vrijednosti koja odgovara
ukucanoj. Zabilježite ID ispitanika na kojem je greška da biste pronašli njegov stvarni
rezultat.
7. Kliknite Find Next i ukoliko SPSS pronađe još rezultata zabilježite svaki ID.Kliknite
Close kada ste završili sa traženjem.

40
SPSS PRIRUČNIK

Nakon što završite sa ispravljanjem, ponovite Frequencies proceduru sa početka kako bi


utvrdili da više nema grešaka.

5.3. ANALIZA ISPITANIKA

Još jedan bitan aspekt SPSS-a je analiza ispitanika. Ovo vam omogućava da pogledate
specifične informacije za svakog ispitanika.

Procedura za analizu ispitanika:


1. Kliknite Analyze, idite na Reports, a zatim odaberite Case Summaries.
2. Odaberite ID varijablu i druge varijable koje vas zanimaju. Odznačite opciju Limit
cases to first 100.
3. Kliknite Statistics dugme i uklonite Number of cases sa Cell Statistics liste. Kliknite
Continue.
4. Kliknite na Options dugme i odznačite opciju Subheadings for totals. Kliknite
Continue, pa OK.

Zadaci za vježbu:

1. Otvori file sleep3ED.sav. Promijeni opcije tako da :


a) su varijable poredane po abecednom redu.
b) u outputu nisu prikazana imena varijabli (samo label)
c) da je izgled tabela u outputu drugačiji (Academic, a ne System Default). Odgovoriti
zašto je važan ovaj korak?
d) da sve nove numeričke varijable imaju tri decimale.

2. Sve promjene u opcijama iz prethodnog zadatka poništi (odnosno vrati sve opcije na
početne)!

3. Definirajte varijable:
a) Definiraj varijablu id (identification number)
b) Definiraj varijablu koja dijeli ispitanike na muškarce i žene
c) Definiraj varijablu: Dob ispitanika
d) Definiraj varijablu: Visina ispitanika

41
SPSS PRIRUČNIK

e) Definiraj varijablu: Težina ispitanika


f) Definiraj varijablu koja ispitanike dijeli prema bračnom statusu (slobodan, u vezi, u
braku, rezveden, udovac)
g) Definiraj varijablu koja ispitanike dijeli prema stepenu obrazovanja
h) Definiraj varijablu koja ispitanike dijeli na one koji su zaposleni i one koji nisu.
i) Definiraj varijablu koja kategorizira grupu ispitanika u pušače i nepušače
j) Definiraj stavke Skale samopoštovanja (10 stavki od 1=uopće se ne slažem; 5 = u
potpunosti se slažem)
k) Definiraj stavke upitnika: Oxford Happiness Questionnaire (29 stavki) – od 1-6
(1=uopće se ne slažem, 6= u potpunosti se slažem)
l) Definiraj stavke skale koja mjeri zadovljstvo životom (10 stavki od 1=uopće se ne
slažem; 5 = u potpunosti se slažem)
m) Definiraj stavke skale optimizma (8 stavki) od 1-5; gdje je 1= uopće se ne slažem, a 5
= u potpunosti se slažem.
n) Unesi (izmisli) podatke za varijable spol, dob i bračni status (kako su u prethodnim
zadacima definirani) za 10 ispitanika.
o) Obrisi 3. Ispitanika
p) Ubaci jednog ispitanika između 7. I 8. i unesi podatke za njega.
q) Obriši varijablu stepen obrazovanja.
r) Ispod varijable bračni status definiraj varijablu koji ispitanike dijeli na one sa i bez
djece.
s) Pomjeri varijablu koja dijeli ispitanike na pušače i nepušače tako da se nalazi između
varijabli težina i bračni status.

4. Sortiranje ispitanika:
a) U bazi podataka depress3ED poredati ispitanike po varijabli dob (age) od najstarijeg
do najmlađeg .
b) U bazi podataka survey3ED poredati ispitanike po varijabli smoke, tako da nam se
najprije izlistaju nepušači, zatim pušači.
c) U bazi podataka sleep3ED poredati ispitanike po težini (weight) od najtežih do
najlakših.
d) U bazi podataka sleep3ED poredati ispitanike od najnižeg do najvišeg (height).
e) U bazi podataka sleep3ED poredati ispitanike tako da nam najprije budu izlistani
muškarci zatim žene.

5. Djeljenje baze podataka:

a) U bazi podataka sleep3ED odvojiti i usporediti muškarce i žene.


b) U bazi podataka survey3ED odvojiti i usporediti ispitanike na osnovu bračnog statusa.
c) U bazi podataka depress3ED odvojiti i usporediti ispitanike na osnovu stepena
edukacije.
42
SPSS PRIRUČNIK

6. Odabir grupe varijabli:

a) Iz baze podataka survey3ED selektirati samo muške ispitanike (isključiti ženske).


b) Isključiti pušače iz baze podataka survey3ED.
c) Iz baze podataka depress3ED isključiti ispitanike koji imaju manje od 35 godina.
d) Isključiti ispitanike koji nemaju djece iz baze podataka survey3ED.
e) Isključiti ispitanike koji imaju problema sa spavanjem iz baze sleep3ED.

7. Korištenje setova:
a) U bazi podataka survey3ED analizirati total skorove isključivo za varijable ID i sex.
b) U bazi podataka survey3ED analizirati total skorove samo za varijable smoke i age.
c) U bazi podataka survey 3ED usporediti vrijednosti varijable problem, varijable liteslp
i varijable sex.

8. U bazi error3ED.sav:
a) Provjeri greške u varijablama: spol, bračni status, izvor stresa, konzumiranje cigareta
(pušenje), djeca.

b) Provjeri greške u varijablama: dob, optimizam (op1), zadovoljstvo životom (lifsat1),


samopouzdanje (sest1), prepoznati stres (pss1).

9. U bazi error3ED.sav:
a) Pronađi greške u varijablama spol, izvor stresa, optimizam, samopouzdanje,
prepoznati stres preko opcije „Sort cases“.

b) Pronađi greške u varijablama bračni status, konzumiranje cigareta, djeca, dob,


zadovoljstvo životom preko opcije „Find“.

10. U nastavku je prikazan protokol za 18 ispitanika, odnosno informacije o njihovom


spolu, dobi,stručnoj spremi, o dužini staža i bračnom statusu. Na osnovu ovih matrica
napravi bazu u Excel-u, odnosno unesi za svakog ispitanika odgovarajuće podatke.
Zatim otvori i spasi bazu u SPSS-u.

43
SPSS PRIRUČNIK

ID spol dob Stručna Staž(godina) Bračni status


sprema
1 M 20 SSS 3 Neoženjen
2 Ž 23 OŠ 5 Neudata
3 M 24 SSS 3 Oženjen
4 Ž 28 SSS 7 Udata
5 M 32 VSS 8 Oženjen
6 M 29 SSS 5 Oženjen

ID spol dob Stručna Staž(godine) Bračni status


sprema
7 Ž 33 SSS 8 Udata
8 M 28 VSS 5 Neoženen
9 Ž 26 SSS 1 Neudata
10 Ž 20 SSS 2 Neudata
11 M 23 SSS 2 Neoženjen
12 Ž 30 VSS 4 Udata

ID spol dob Stručna Staž(godine) Bračni status


sprema
13 M 35 VSS 10 Oženjen
14 M 38 VSS 18 Neoženjen
15 Ž 44 SSS 17 Udata
16 Ž 52 OŠ 30 Udata
17 M 48 SSS 28 Oženjen
18 Ž 51 VSS 26 Udata

a) Koristeći se gornjim matricama unesi podatke za prvih 6 ispitanika u Excel, zatim ih


otvori u SPSS-u i spasi. Učini isto za 2. i 3. matricu. Na kraju ih spoji u jednu bazu i
spasi u SPSS-u.
b) Pored informacija prikazanih u gornjim matricama dobiveni su, također, i podaci o
visini, težini i godini studija svih ispitanika. Te nove varijable treba dodati
prethodnim. U tu svrhu unesi prvo podatke za stare varijable za prvih 6 ispitanika u
excelu, te za nove varijable za tih 6 ispitanika (odvojeno). Zatim ih spoji u jednu bazu
preko add variables. Isto učini i za ispitanike 7-12 i 13-18. Na kraju spoji sve baze u
jednu preko add cases. Informacije o visini, težini i godini studija su prikazane u
sljedećim matricama:

44
SPSS PRIRUČNIK

ID Visina(cm) Težina(kg) Godina studije


1 175 74 I
2 183 80 I
3 193 95 III
4 190 87 IV
5 178 79 II
6 174 75 V

ID Visina(cm) Težina(kg) Godina studija


7 167 70 II
8 158 59 IV
9 179 80 I
10 184 85 III
11 161 63 II
12 189 93 V

ID Visina(cm) Težina(kg) Godina studija


13 188 91 V
14 168 70 II
15 170 75 I
16 192 95 IV
17 159 60 III
18 176 80 II

45
SPSS PRIRUČNIK

46
III DIO
PRELIMINARNE ANALIZE
SPSS PRIRUČNIK

6.
DESKRIPTIVNA STATISTIKA

Deskriptivna statistika uključuje numeričke i grafičke postupke pomoću kojih organiziramo


i reprezentiramo podatke na jasan, ekonomičan i razumljiv način. Numeričkim postupcima
izračunavamo određene vrijednosti kojima opisujemo uzorak; i te izračunate vrijednosti
nazivamo statisticima. Numerički postupci pružaju precizne i objektivne informacije o
podacima. Grafičkim postupcima vizuelno predstavljamo podatke. Za razliku od numeričkih
postupaka, oni uključuju detaljnije informacije o nekim karakteristikama podataka, kao što je,
npr. oblik distribucije.
Neke svrhe korištenja deskriptivne statistike su opisivanje karakteristika uzorka u dijelu
izvještaja Metodologija, te imenovanje specifičnih istraživačkih pitanja.
U studijama u kojima su ispitanici ljudska bića, vrlo korisno je poznavati broj ispitanika u
uzorku, udio muškaraca i žena u uzorku, aritmetičke sredine dobi, nivo obrazovanja i druge
relevantne podatke. Prije statističkih analiza (npr. t-test, ANOVA..) važno je uvjeriti se da ne
narušavamo pretpostavke donesene na temelju pojedinačnih testiranja. Testiranje pretpostavki
obično uključuje korištenje deskriptivne statistike na našim varijablama. To, između ostalog,
uključuje računanje: aritmetičke sredine, standardne devijacije, opsega rezultata, skjunisa i
kurtozisa. No, različite procedure ovise od toga o kojim varijablama se radi, da li
kategorijalnim ili kontinuiranim.

6.1. KATEGORIJALNE VARIJABLE

Varijable kojima jednostavno klasificiramo pojave u jednu od grupa ili kategorija (npr. spol)
nazivamo kategorijalnim varijablama. Kategorijalne varijable su varijable koje koriste
nominalnu skalu mjerenja. Način na koji koristimo deskriptivnu statistiku na kategorijalnim
varijablama je preko frekvencija. Frekvencije nam govore o učestalosti pojedinih odgovora
(npr. broj muškaraca) u uzorku. Za ilustraciju koraka koristit će se baza survey3ED.sav.

Procedura za korištenje deskriptivne statistike na kategorijalnim varijablama:

1. Sa gornjeg menija klikni Analyze, zatim Descriptive Statistics, i odaberi


Frequencies.

48
SPSS PRIRUČNIK

2. Klikni na varijablu koju želiš prikazati i prebaci je u Variable box. Obrati pažnju na to
da to bude kategorijalna varijabla (npr. spol).
3. Klikni na Continue, zatim OK ( ili Paste za spremiti u Syntax Editor.)

Prikaz dobivenog outputa:

Statistics
Sex

Valid 439
N
Missing 0

sex

Frequency Percent Valid Percent Cumulative


Percent

MALES 185 42,1 42,1 42,1

Valid FEMALES 254 57,9 57,9 100,0

Total 439 100,0 100,0

Interpretacija outputa:
Output iznad prikazuje uzorak od 439 ispitanika (185 muškaraca, 254 žene). Također, u tabeli
su vidljivi postoci muškaraca (42.1%) i žena (57.9%) u ukupnom uzorku. Zbog analiza koje
će se koristiti vrlo je važno poznavati broj ispitanika u određenim podgrupama. Za neke
analize (npr. ANOVA) je lakše imati približno jednake veličine grupa. Ako imamo
neujednačene veličine grupa, naročito ako su grupe male, neprikladno je provođenje
određenih analiza.

6.2. KONTINUIRANE VARIJABLE

Varijable kojima određujemo količinu nečega nazivamo kvantitativnim varijablama. One


mogu biti diskretne i kontinuirane. Diskretne varijable su one varijable koje mogu poprimiti
samo neke vrijednosti iz određenog intervala, pri čemu su vrijednosti jasno odijeljene.

49
SPSS PRIRUČNIK

Kontinuirane varijable se odnose na varijable koje, teorijski, mogu poprimiti bilo koju
vrijednost iz određenog intervala.
Deskriptivna statistika na kontinuiranim varijablama se uglavnom sastoji od pregleda mjera
centralne tendencije i mjera varijabiliteta, tj. statističkih veličina kao što su: aritmetička
sredina, mod, medijana, standardna devijacija, te varijanca.

Mjere centralne tendencije


Mjere centralne tendencije su vrijednosti koje odražavaju centralno mjesto distribucije
podataka; vrijednosti koje reprezentiraju skup podataka. Tri najvažnije mjere centralne
tendencije su: mod, medijana i aritmetička sredina.

Mod (dominantna vrijednost) je najučestalija vrijednost u distribuciji. Ako se u distribuciji


podataka nalazi jedna dominantna vrijednost, takvu distribuciju nazivamo unimodalna. Ako
su u distribuciji dvije dominantne vrijednosti, distribucija je bimodalna, itd.
Naprimjer, u skupu podataka X= (2,4,3,4,5,6,7), vrijednost koja se najčešće pojavljuje je 4,
stoga je: MOD= 4.

Medijana (centralna vrijednost) je vrijednost koja distribuciju dijeli na dva jednaka dijela, tj.
vrijednost koja se u nizu podataka poredanih po veličini nalazi tačno u sredini. Npr. u skupu
podataka X= (2,7,4,5,6,7,2), položaj medijane je (7+1)/2= 4, što znači da se centralna
vrijednost nalazi na četvrtom mjestu niza rezultata poredanih po veličini, X= 2, 2, 4, 5, 6, 7,
7), C= 5.

Aritmetička sredina je suma svih rezultata podijeljenja brojem rezultata. Aritmetička sredina
predstavlja težište rezultata i stoga je osjetljiva na ekstremne vrijednosti rezultata. U gornjem
skupu podataka – X= (2,7,4,5,6,7,2) – aritmetička sredina iznosi M= 4,71.

Standardna devijacija i varijanca


Standardna devijacija i varijanca su mjere varijabiliteta koje se temelje na udaljenosti
svakog rezultata od aritmetičke sredine. Varijanca skupa podataka je prosjek kvadriranih
odstupanja rezultata od aritmetičke sredine. Standardna devijacija je jednaka drugom
korijenu iz varijance. Standardnu devijaciju je statistički opravdano računati kada je

50
SPSS PRIRUČNIK

distribucija podataka normalna ili barem simetrična, i kada je korištena intervalna ili racio
skala mjerenja.
Za ilustraciju koristit će se baza survey3ED.sav.

Procedura za korištenje deskriptivne statistike na kontinuiranim varijablama:


1. Sa gornjeg menija klikni Analyze, zatim Descriptive Statistics, i odaberi Descriptives.
2. Klikni na varijablu koju želiš prikazati i prebaci je u Variable box. Obrati pažnju da to
treba da bude kontinuirana varijabla (npr. total percieved stress, age, total optimism, total
mastery, itd.).
3. Klikni na Options, zatim na Mean, Standard deviation, Minimum, Maximum,
Skewness, Kurtosis.
4. Klikni na Continue, zatim OK (ili Paste za spremiti u Syntax Editor).

Prikaz dobivenog outputa:


Descriptive Statistics

N Minimum Maximum Mean Std. Skewness Kurtosis


Deviation

Statistic Statistic Statistic Statistic Statistic Statistic Std. Statistic Std.


Error Error

Total perceived
433 12 46 26,73 5,848 ,245 ,117 ,182 ,234
stress
Age 439 18 82 37,44 13,202 ,606 ,117 -,203 ,233
Total Optimism 435 7 30 22,12 4,429 -,494 ,117 ,214 ,234
Total Mastery 436 8 28 21,76 3,970 -,613 ,117 ,285 ,233
Valid N (listwise) 432

Interpretacija outputa:
Output iznad prikazuje sumirane informacije koje su tražene o varijablama. Npr., što se tiče
varijable dob (sex), vidimo prikaz od 439 ispitanika, opseg godina od 18 do 82, aritmetičku
sredinu 37,44 i standardnu devijaciju 13,20. Ovi podaci mogu biti iskorišteni u dijelu
izvještaja Metodologija kako bi opisali karakteristike uzorka.
Opisi podataka, pružaju informacije i o distribuciji rezultata na kontinuiranim varijablama
(skewness i kurtosis). Ove informacije mogu poslužiti ukoliko se koriste parametrijski
statistički postupci (npr. t-test, ANOVA).

51
SPSS PRIRUČNIK

Skewness je veličina koja govori o simetričnosti distribucije, a kurtosis je veličina koja


govori o spljoštenosti distribucije. Ukoliko je distribucija savršeno normalna, skewness i
kurtosis će iznositi 0.
Pozitivan skewness prikazuje pozitivnu asimetričnost (u distribuciji se nalazi više podataka s
nižim vrijednostima), a negativan skewness negativnu asimetričnost (u distribuciji se nalazi
više podataka s višim vrijednostima).

6.3. NEDOSTAJUĆI PODACI

Kada radimo istraživanje, naročito sa ljudskim bićima, rijetko možemo dobiti potpune
podatke za svakog ispitanika. Zbog toga je važno provjeriti bazu na nedostajuće podatke.
Pokretanjem opcije Descriptives može se provjeriti koji procenat vrijednosti nedostaje za
svaku od varijabli. Ukoliko bude pronađena varijabla sa dosta neočekivanih nedostajućih
podataka, potrebno je razmotriti da li se nedostajuća vrijednost pojavljuje slučajno ili je u
pitanju neki sistematski faktor.
Također treba uzeti u obzir kako se nositi sa nedostajućim podacima kada se dođe do
statističke analize. U funkciji Options u SPSS-u možemo odabrati kako želimo da se SPSS
nosi sa nedostajućim podacima.
Treba biti oprezan u izboru, jer može imati dramatične efekte na rezultate. Ovo je izuzetno
važno ako uključujete listu varijabli i ponavljate listu analiza za sve varijable.
 Opcija Exclude cases listwise uključuje slučajeve (cases) u analizu samo ako imaju
potpune podatke o svim varijablama navedenim u odjeljku Variables za taj slučaj.
Case će biti totalno isključen iz analize čak ako jedan dio informacije nedostaje. Ovo
može ozbiljno i nepotrebno ograničiti veličinu uzorka.
 Exclude cases pairwise isključuje slučajeve (ispitanike, cases) jedino ako nedostaju
podaci potrebni za specifičnu analizu. Oni će i dalje biti uključeni u neku od analiza za
koje postoje neophodne informacije.
 Replace with mean opcija, izračunava srednju vrijednost varijabli, i daje svakom
nedostajućem podatku tu vrijednost. Ova opcija ne bi trebala biti korištena, jer može
ozbiljno iskriviti rezultate naše analize, naročito ako imamo dosta nedostajućih
vrijednosti.
Uvijek je korisno provjeriti u Options koja od ovih opcija je označena. Najčešće se
preporučuje opcija pairwise exclusion za nedostajuće podatke.

52
SPSS PRIRUČNIK

6.4. PROCJENA NORMALNOSTI

Normalna distribucija grafički opisuje kontinuiranu raspodjelu rezultata. Normalna


distribucija je u potpunosti determinirana vrijednostima aritmetičke sredine i standardne
devijacije. Aritmetička sredina nalazi se u centru raspodjele, tj. tjemenu krive, i iste je
vrijednosti kao i medijana. Normalna distribucija ima i sljedeće karakteristike:
 zvonolikog je oblika i unimodalna;
 simetrična oko aritmetičke sredine;
 ukoliko se povećava vrijednost aritmetičke sredine, krivulja se pomiče udesno, a
ukoliko se vrijednost aritmetičke sredine smanjuje, krivulja se pomiče ulijevo (uz
pretpostavku jednake varijance);
 ukoliko se vrijednost varijance poveća, krivulja se snižava i širi, a ukoliko se
vrijednost varijance smanjuje krivulja se povećava i sužava (uz nepromijenjenu
aritmetičku sredinu);
Ukoliko znamo vrijednosti aritmetičke sredine i standardne devijacije, tada možemo odrediti
broj rezultata unutar nekog opsega. Odnosno vrijedi da se u:

intervalu µ + σ nalazi se 68,26% svih rezultata;


intervalu µ + 2σ nalazi se 95,44% svih rezultata;
intervalu µ + 3σ nalazi se 99,73% svih rezultata.

53
SPSS PRIRUČNIK

Procedura za kreiranje normalne distribucije:


1. Sa menija na vrhu, odaberi Analyze, zatim Descriptive statistics i klikni na Explore.
2. Klikni na varijablu koju želiš prikazati (npr. total perceived stress). Zatim klikni na
strelicu kako bi prebacio navedenu varijablu u prostor Dependent list.
3. Zatim u prostor Label cases by prebaci ID varijablu.
4. U dijelu Display označi Both.
5. U opciji Statistics klikni na Descriptives i Outliers.
6. Zatim klikni na Plots. U opciji Descriptives klikni na Histogram, a u opciji Boxplot
klikni na Factor levels together. Također klikni na opciju Normality plots with
tests.
7. Klikni na dugme Options. U Missing Values sekciji odaberi Exclude cases pairwise.
8. Klikni na Continue i OK (ili na Paste kako bi pohranio u Syntax Editor).

Prikaz dobivenog outputa:

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

Total perceived stress 433 98,6% 6 1,4% 439 100,0%

Descriptives

Statistic Std. Error

Mean 26,73 ,281

95% Confidence Interval for Lower Bound 26,18


Mean Upper Bound 27,28

5% Trimmed Mean 26,64

Median 26,00

Variance 34,194

Total perceived stress Std. Deviation 5,848

Minimum 12

Maximum 46

Range 34

Interquartile Range 8

Skewness ,245 ,117

Kurtosis ,182 ,234

54
SPSS PRIRUČNIK

Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Total perceived stress ,069 433 ,000 ,992 433 ,021

a. Lilliefors Significance Correction

55
SPSS PRIRUČNIK

56
SPSS PRIRUČNIK

Interpretacija outputa:
Kao što je vidljivo, SPSS je generirao mnogo outputa. Međutim, ukoliko se zna na koje
dijelove treba obratiti pažnju, interpretacija nije toliko teška:
 Prva tabela Descriptives sadrži informacije vezane za deskriptivnu statistiku
(aritmetičku sredinu, medijanu, standardnu devijaciju, minimum, maksimum, skjunis,
kurtozis, itd.). Značajan podatak iz tabele predstavlja 5% Trimmed mean. Kako bi
izračunao ovu vrijednost, SPSS je iz uzorka izbacio 5% gornjih i donjih rezultata, i
zatim ponovo izračunao aritmetičku sredinu. Uporedbom prave aritmetičke sredine
(Mean = 26.73) i aritmetičke sredine bez ekstremnih vrijednosti (5% Trimmed mean
= 26.64), možemo vidjeti koliki utjecaj na aritmetičku sredinu imaju ekstremni
rezultati.
 U tabeli koja se naziva Tests of normality, pokazani su rezultati Kolmogorov-
Smirnovog testa. Na osnovu njega možemo vidjeti da li oblik distribucije statistički
značajno odstupa od normalnosti. Kao što vidimo, statistička značajnost od .000
pokazuje da distribucija zaista značajno odstupa od normalne. Ovaj podatak nas ne bi
trebao iznenaditi s obzirom da je ovakva pojava česta kod većih uzoraka.
 Stvarni oblik distribucije vidljiv je na osnovu histograma, gdje se u ovom konkretnom
primjeru zaista oslikava normalna krivulja. Ovaj zaključak donekle podržavaju i
Normal Q-Q plot i Detrended Normal Q-Q plot. Dijagrami se temelje na
odstupanju dobivene distribucije od teorijski savršene distribucije. U ovom primjeru se
krugovi samo kod prvog dijagrama relativno čitavom dužinom pozicioniraju oko
središnje linije što indicira normalnost.

U gornjem primjeru, distribucija podataka je poprilično normalnog oblika. Ipak, vrlo često
ovo nije slučaj. Mnoge skale i varijable u socijalnim znanostima imaju distribucije koje su
asimetričnog oblika. Uzrok tome je mnogo više priroda mjerenog konstrukta nego problem sa
korištenom skalom. Tako je skala zadovoljstva životom većinom negativno asimetrična, iz
razloga što su mnogi ljudi uglavnom zadovoljni svojim životima, dok su, na primjer, kliničke
mjere anksioznog ili depresivnog poremećaja uglavnom pozitivno asimetrične u općoj
populaciji, s obzirom da je primjetan veoma mali broj simptoma ovih poremećaja kod većine
ljudi.

57
SPSS PRIRUČNIK

6.5. PROVJERA EKSTREMNIH REZULTATA

Ekstremni rezultati mogu imati dramatične efekte na koeficijent korelacije, naročito na malim
uzorcima. U nekim okolnostima ekstremni rezultati mogu da učine vrijednost korelacije
mnogo većom, nego što ona zapravo jest, dok u drugim okolnostima mogu doprinijeti znatno
manjem koeficijentu korelacije. Ekstremni rezultati se pojavljuju najčešće zbog greške
prilikom unosa podataka, neopreznog odgovora ispitanika ili to može ipak biti prava
vrijednost prilično specifičnog pojedinca. Ako se pronađe ekstremni rezultat, potrebno je
provjeriti greške i ispraviti ih ako je prikladno. Također se u obzir može uzeti uklanjanje ili
rekodiranje neodgovarajućih vrijednosti, kako bi se smanjio utjecaj koji te vrijednost imaju na
korelaciju.

 Prvo je potrebno pogledati Histogram i obratiti pažnju na krajeve distribucije. Da li se


rezultati nalaze na njihovim krajevima distribucije? Ako je tako, to je onda
potencijalni ekstremni rezultat.
 Drugo, potrebno je pogledati Box plot. Sve rezultate koje SPSS smatra ekstremnim
rezultatima, pojavljuju se kao mali krugovi sa brojevima u prilogu. SPSS smatra
rezultate ekstremnim onda kada su krugovi od „kutije“ udaljeni za 1.5 dužina „kutije“
od njenog ruba.
 Također, bitno je provjeriti da li se kod ekstremnog rezultata radi o stvarnom
odgovoru ispitanika, a ne samo o pogrešci prilikom unosa. Potrebno je provjeriti
rezultat i da li je unutar ranga (ili kategorija) uopće moguć takav rezultat za tu
varijablu. Ako je u pitanju zaista pravi rezultat, treba odlučiti kako postupiti s tim
podatkom. Neki statističari predlažu uklanjanje svih ekstremnih rezultata iz skupa
podataka. Drugi predlažu promjenu rezultata na manje ekstremnu vrijednost, dakle
uključujući osobe u analizu, ali ne dozvoljavajući da previše iskrive rezultate dobivene
statističkim analizama.
 Informacija iz okvira Descriptives (u gornjem primjeru u poglavlju Procjena
normalnosti distribucije) ukazuje na to koliko ekstremni rezultati mogu iskriviti
deskriptivne parametre. Vrijednost koja vas interesuje jeste 5%-Trimmed Mean. Ako
su trimmed mean i dobivena aritmetička sredina veoma različiti, potrebno je istražiti
skup podataka na ekstremne vrijednosti. U ovom primjeru dvije srednje vrijednosti

58
SPSS PRIRUČNIK

(26.73 i 26.64) su dosta slične. S obzirom na ovo, uključit ćemo krajnje vrijednosti u
analize.
 Jedan od načina da se pronađu ekstremne vrijednosti jest da se preko funkcije Sort -
koja se nalazi u meniju Data na vrhu SPSS-a – vrijednosti u varijabli od interesa
poredaju uzlaznim (od najmanje ka najvećoj) ili silaznim (od najveće ka najmanjoj
vrijednosti) redoslijedom. Na taj način će se vrijednosti koje je potrebno detaljnije
razmotriti naći na vrhu podataka u navedenoj varijabli.

Zadaci za vježbu:

Biznis

Baza podataka: staffsurvey3EDsav. Vidite dodatak za detalje o raznim bazama podataka.

1. Slijedi proceduru koja je pomenuta u ovom poglavlju kako bi generirao odgovarajuću


deskriptivnu statistiku i da bi mogao odgovoriti na sljedeća pitanja:
a) Koliko posto zaposlenika u ovoj organizaciji su stalni zaposlenici? (Koristi
varijablu employstatus.)
b) Koja je prosječna dužina zaposlenosti u organizaciji? (Koristi varijablu service.)
c) Koliko posto ispitanika bi preporučilo organizaciju drugima kao dobro mjesto
za rad? (Koristi varijablu recommend.)
2. Prikaži distribuciju skorova na ukupnoj skali Zadovoljstvo s poslom (totsatis) za
zaposlenike koji su stalni nasuprot onima koji nisu (employstatus).
a) Postoji li ekstremni rezultat na ovoj skali zbog kojeg bi se mogao zabrinuti?
b) Jesu li skorovi normalno distribuirani za svaku grupu?

Zdravlje

Baza podataka: sleep3ED.sav. Vidite dodatak za detalje o bazama podataka.

1. Slijedi proceduru koja je pomenuta u ovom poglavlju kako bi generirao odgovarajuću


deskriptivnu statistiku i da bi mogao odgovoriti na sljedeća pitanja:
a) Koliko posto ispitanika je ženskog spola?
b) Koji je prosjek dobi ovog uzorka?
c) Koliko posto uzorka indicira da su imali problema sa spavanjem (problem)?
d) Koliki je medijan za broj prespavanih sati po danu u sedmici (hourwnit)?

2. Prikaži distribuciju skorova na skalama Pospanost i Povezane senzacije (totSAS) za


ljude koji se osjećaju kao da imaju/nemaju problem sa spavanjem (problem).
a) Postoji li ekstremni rezultat na ovoj skali zbog kojeg bi se mogao zabrinuti?
b) Jesu li skorovi normalno distribuirani u svakoj grupi?

59
SPSS PRIRUČNIK

7.
GRAFIČKO I VIZUALNO PREDSTAVLJANJE
PODATAKA

Podatke je potrebno organizirati i prikazati tako da ih možemo opisati, analizirati,


interpretirati. Grafički prikazi nam služe da vizualno predstavljamo podatke, a daju nam i
detaljnije informacije o nekim karakteristikama podataka npr. o obliku distribucije.
Izbor načina prikazivanja podataka ovisi o korištenoj skali mjerenja. Kategorijalne podatke
grafički predstavljamo u stupčastim i torta dijagramima. Numeričke podatke, s druge strane,
možemo predstavljati preko tabelarnog prikaza distribucije frekvencija, „stablo i listovi“
(engl. steam and leaf) i box-plot prikaza, a grafički prikazati pomoću histograma i
procentualne kumulativne krive (ogive).

Grafički prikazi podataka mogu biti različiti, a najvažniji su:


 Histogram
 Stupčasti dijagram
 Scatterplot
 Box-plot

Za ilustraciju koraka koristit ćemo bazu survey3ED.sav.

7.1. HISTOGRAM

Histogram služi za prikaz distribucije podataka u jednoj varijabli.

Procedura za kreiranje histograma:


1. Sa gornjeg menija kliknite Graphs, zatim Legacy Dialogs, i odaberite Histogram.
2. Kliknite na varijablu koju želite prikazati i prebacite je u odjeljak Variable. Obratite
pažnju na to da varijabla treba biti kontinuirana (npr. total percieved stress).
3. Ukoliko želite generirati odvojene histograme za različite grupe (npr. muški i ženski),
možete staviti dodatnu varijablu (npr. spol) u sekciju Panel by:. Izaberite Rows ako

60
SPSS PRIRUČNIK

želite dva grafika jedan iznad drugog, ili Column ako želiš da budu smješteni jedan
pored drugog. U ovom primjeru, stavit ćemo varijablu spol u prostor Column.
4. Za izvršenje komande kliknite na OK.

Prikaz dobivenog outputa:

Interpretacija outputa:
Histogram nam pruža informacije o obliku distribucije. Iz gornjeg primjera vidimo da su
distribucije podataka poprilično normalno distribuirane, što možemo vidjeti po tome da je
najveći broj rezultata smješten oko sredine distribucije. Ipak, u stvarnim uslovima ne
dobivamo uvijek ovakav slučaj, gdje distribucije mogu biti pozitivno ili negativno
asimetrične.

61
SPSS PRIRUČNIK

7.2. STUPČASTI DIJAGRAM

Stupčastim dijagramima se mogu prikazivati kategorijalne, ali i kontinuirane varijable,


odnosno, njima se može prikazivati broj slučajeva (cases) u nekoj kategoriji ili se može
pokazivati rezultat na nekoj kontinuiranoj varijabli.

Procedura za kreiranje stupčastog dijagrama:


1. Sa gornjeg menija kliknite Graphs, zatim odaberite LegacyDialogs odaberite Bar te
kliknite na Clustered.
2. U odjeljku Data in Chart are odaberite Summaries for groups of cases. Zatim
kliknite na Define.
3. U Bars represent odjeljku odaberite Other statistic.
4. Odaberite kontinuiranu varijablu (npr. total perceived stress) i povucite je u
novootvoreni prostor u Bars represent odjeljku. Ona će se pojaviti kao MEAN (total
perceived stress). To nam govori da će biti prikazane aritmetičke sredine za različite
grupe.
5. Kliknite zatim, na prvu kategorijalnu varijablu (npr. dob) te je premjestite u odjeljak
Category axis. Ova varijabla će se pojaviti na X-osi.
6. Zatim odaberite i drugu varijablu (npr. spol) te je premjestite u odjeljak Define
clusters by:. Ova varijabla će biti prikazana u legendi.
7. Kliknite OK.

62
SPSS PRIRUČNIK

Prikaz dobivenog outputa:

Interpretacija outputa:
Iz prikazanog stupčastog dijagrama možemo vidjeti da razina stresa raste u skladu sa
porastom broja godina. Također, kod sve tri dobne skupine, razina stresa je veća kod
muškaraca. Ali, njena statistička značajnost nam je nepoznanica.
Ono što treba naglasiti kod stupčastih dijagrama jest obraćanje pažnje na vrijednosti na Y-osi.
Iako se razlike među stupcima grupa nekad mogu činiti velikima, uvijek treba obraćati pažnju
na numeričke vrijednosti. Tako i u ovom primjeru, u dobnoj skupini „18-29“ imamo veću
razinu stresa kod muškaraca.

7.3. SCATTER PLOT (SKATER DIJAGRAM)

Skater-dijagram se koristi za prikazivanje povezanosti između dvije varijable. On nam može


pokazati način na koji su varijable povezane (pozitivno ili negativno), te snagu njihove
povezanosti. Ako su varijable slabo povezane, rezultati su „razbacani“ po dijagramu. Pored
toga, on nam pokazuje i oblik povezanosti (linearan, inverzno U ili neki drugi).

63
SPSS PRIRUČNIK

Skater dijagram se prikazuje na sljedeći način: Vrijednosti jedne varijable nanose se na X-osu,
a druge na Y-osu. Svaki ispitanik se prikazuje kao tačka u koordinatnom sistemu [uređeni par,
(x, y)]. Prediktorska varijabla nanosi se na apscisu, a kriterijska na ordinatu.
U skater dijagram unosi se tzv. „pravac regresije“. Stupanj u kojem se tačke „okupljaju” oko
pravca pokazuje veličinu povezanosti tj. korelacije između X i Y. Ukoliko se sve tačke nalaze
na pravcu regresije, radi se o savršenoj, odnosno maksimalno mogućoj, povezanosti.

Procedura za kreiranje skater-dijagrama:


1. Sa gornjeg menija kliknite na Graphs, zatim na Legacy Dialogs, te odaberite
Scatter/Dot.
2. Kliknite na Simple Scatter, a zatim kliknite na Define.
3. Odaberite prvu varijablu, uglavnom je to ona koju smatrate kriterijskom (npr. total
perceived stress).
4. Odabranu varijablu prebacite u odjeljak Y axis. Ona će se pojaviti na horizontalnoj
osi.
5. Zatim odaberite drugu varijablu (npr. Total PCOISS) te je prebacite u odjeljak X axis.
Ona će se pojaviti na vertikalnoj osi.
6. Ovim dvjema varijablama možete dodati i još jednu varijablu (npr. sex). Tu varijablu
odaberite i prebacite je u odjeljak Set Markers by:. Muški i ženski spol će biti
označeni u legendi različitim simbolima.
7. ID varijablu prebacite u odjeljak Label Cases by:.
8. Kliknite na OK.

64
SPSS PRIRUČNIK

Prikaz dobivenog outputa:

Interpretacija outputa:
Iz dobivenog scatterplota (skater dijagrama) možemo vidjeti da postoji negativna korelacija
između razine stresa i kontrole untrašnjih stanja. Ispitanici sa visokim rezultatima na PCOISS-
u (Perceived Control od Internal State Scale) imaju niske rezultate na Total Perceived Stress
skali. To znači da osobe koje imaju višu razinu kontrole untrašnjih stanja imaju manje stresa.

7.4. BOX-PLOT

Box-plot prikaz nam može poslužiti za brzu provjeru normalnosti distribucija rezultata (bez
zaključka), ali i ukazati na moguće razlike među varijancama.
Pomoću box-plot prikaza možemo izvršiti i tzv. „sumiranje s 5 vrijednosti“. Važne
informacije o distribuciji možemo dobiti tako što navodimo pet vrijednosti koje nam pružaju
65
SPSS PRIRUČNIK

važne informacije. Tih pet vrijednosti su: medijana, prvi kvartil, treći kvartil, minimalna i
maksimalna vrijednost. Sumiranje skupa podataka s tih pet vrijednosti može se transformirati
u grafički prikaz upravo pomoću box-plot prikaza.

Procedura za kreiranje box-plota:


1. Sa gornjeg menija kliknite na Graphs, zatim na Legacy Dialogs, te odaberite
Boxplot.
2. U novootvorenom prozoru, kliknite na Simple. U odjeljku Data in Chart Are
odaberite Summaries for groups of cases. Zatim kliknite na Define.
3. Zatim odaberite vašu kontinuiranu varijablu (npr. Total Positive Affect – tposaff).
Premjestite varijablu u odjeljak Variable.
4. Nakon toga, odaberite kategorijalnu varijablu (npr. sex). Prebacite varijablu u odjeljak
Category axis.
5. Kliknite na ID varijablu i premjestite je u odjeljak Label cases. Ovo će vam omogućiti
da identificirate ID brojeve bilo kojeg slučaja sa ektremnim vrijednostima.
6. Kliknite na OK.

Prikaz dobivenog outputa:

66
SPSS PRIRUČNIK

Interpretacija outputa:
Gornji box-plot prikaz daje nam mnogo informacija o distribuciji kontinuirane varijable te o
mogućem utjecaju kategorijalne varijable.
Svaka distribucija rezultata je predstavljena „kutijom“ i linijama (engl. whiskers). Dužina
kutije označava interkvartilni raspon varijable i sadrži 50% slučajeva. Linija koja ide
horizontalno preko „kutije“ označava aritmetičku sredinu, a linija koja vertikalno prolazi kroz
„kutiju“ ide do najniže i najviše vrijednosti u distribuciji.
Svaki rezultat za kojeg SPSS „smatra“ da izlazi van okvira označen je kružićem i on je
pokazan ranije spomenutim ID brojem slučaja. Ovi brojevi (engl. outliers) predstavljaju
slučajeve (ispitanike, cases) čiji se rezultati prilično razlikuju od ostatka distribucije, bilo da
se radi o jako visokim ili jako niskim rezultatima. SPSS smatra rezultate ekstremnim onda
kada su od „kutije“ udaljeni 1.5 dužina „kutije“ od njenog ruba.
Box-plot prikaz nam, također, daje uvid u varijabilitet rezultata svake grupe i omogućava nam
vizualni prkaz razlika između grupa.

7.5. MODIFIKACIJA GRAFIKA

Ponekad je potrebno uraditi naknadne ili dodatne modifikacije grafika kako bismo ga mogli
printati ili koristiti u nekim izvještajima. Najčešće je potrebno urediti naslov, nazive varijabli,
markere, itd.
Da bi se uređivao grafik ili tablica, potrebno je otvoriti Chart Editor. To se radi tako da se na
grafik koji se želi urediti klikne dvostrukim klikom. Nakon toga će se otvoriti prozor u kojem
će biti ponuđene opcije na gornjem meniju. Prvo se klikne na Edit, a zatim odabere
Properties. Pored toga se u Chart Editor-u može uređivati još mnogo toga:
 Ako se žele mijenjati nazivi varijabli, potrebno je kliknuti jednom na naziv željene
varijable (pojavi se zlatni okvir oko riječi), a zatim kliknuti ponovno da se upiše druga
riječ. Kada se završi, potrebno je pritisnuti Enter.
 Da bi se promijenila pozicija naziva varijabli, potrebno je dvostrukim klikom kliknuti
na naziv varijable, zatim u otvorenom prozoru odabrati opciju Text Layout te nakon
toga opciju Justify. Pomoću nje se naziv može centrirati ili pomjerati lijevo ili desno.
 Da bi se uređivali drugi dijelovi grafika, nužno je (jednom) kliknuti na željeni aspekt
ili dio grafika, a zatim otvoriti Edit pa Properties. Opcija Properties će se automatski

67
SPSS PRIRUČNIK

prilagoditi onom dijelu na kojeg je kliknuto i tako će se moći uređivati željeni dio
grafika.

Primjer Chart Editor menija:

7.6. PREBACIVANJE GRAFIKA I TABELA U WORD

SPSS omogućava da se napravljene tablice i grafici prebace direktno u Microsoft Word. To


može biti jako korisno ukoliko se radi neki izvještaj o znanstvenom radu. Međutim, jako je
važno napomenuti da grafik u SPSS-u treba biti u potpunosti uređen kako bi, prebačen u
Word, mogao jasno prikazati podatke.
Za prijenos grafika iz SPSS-a u Word potrebno je uraditi nekoliko koraka.

Procedura za prebacivanja grafika u Word:


Windows omogućava da bude više programa uključeno u isto vrijeme. Na taj način prenosimo
grafike iz SPSS-a u Word. Uključe se istovremeno oba programa i klikom miša se prelazi
jednog u drugi.
1. Pokrenite Word i odaberite dokument (file) u koji želite staviti grafik. Zatim kliknete
na ikonu SPSS-a da vratite (maksimizirate) SPSS.
2. U SPSS-u se vratite na Viewer prozor u kojem vidite grafik.
3. Kliknite jednom na grafik, a zatim otvorite Edit sa gornjeg menija i odaberite Copy.
4. Vratite se u Word, kojeg ste ranije minimizirali.
5. Kursorom odaberite mjesto za grafik i sa gornjeg menija otvorite Edit i kliknite Paste.
6. Kliknite na File i zatim na Save.
7. Možete se ponovno vratiti u SPSS i nastaviti sa statističkim analizama te nove grafike
na isti način premještati u Word.

68
SPSS PRIRUČNIK

Zadaci za vježbu:
Biznis
Baza podataka: staffsurvey3ED.sav.Vidi dodatak za detalje o bazama podataka.
1. Napravite histogram da bi ispitali distribuciju skorova skale Zadovoljstvo zaposlenika
(totsatis).
2. Napravite grafik da bi prikazali nivoe zadovoljstva onih zaposlenika koji su zaposleni
na stalno i onih koji nisu, u trajanju od 2, 3 do 5 godina i više od 6 godina. Varijable
koje će trebati su totsatis, employstatus and servicegp3.
3. Napravite skater dijagram da bi prikazali vezu između vremena zaposlenosti u
godinama i zadovoljstva zaposlenika (totsatis). Pokušajte prvo da koristite varijablu
service, a zatim pokušajte sa varijablom koja se nalazi pri dnu liste varijabli
(logservice). Ova nova varijabla je matematička transformacija (log 10) originalne
varijable (service).
4. Napravite boxplot da bi pokazali distribuciju skorova na skali Zadovoljstvo
zaposlenika (totsastis) za različite dobi (age).

Zdravlje
Baza podataka: sleep3ED.sav. Vidi dodatak za detalje o bazama podataka.

1. Napravi histogram da bi ispitao distribuciju skorova na skali Epworth Sleepiness (ess).


2. Napravite stupčasti dijagram da bi uporedili skorove na skali Sleepiness and
Associated Sensations (totSAS) kroz 3 starosne skupine (agegp3) za muškarce i žene
(gender).
3. Napravite skater dijagram da bi ispitali vezu između skorova na skali Epworth
Sleepiness i na skali Sleepiness and Associated Sensations. Napravite različite oznake
za muškarce i žene (gender).
4. Napravite box-plot da bi ispitali distribuciju skorova na skali Sleepiness and
Associated Sensations (totSAS) za ljude koji su se izjasnili da imaju ili nemaju
problema sa spavanjem (problem).

69
SPSS PRIRUČNIK

8.
MANIPULACIJA PODATAKA

Jednom kada su podaci uneseni i njihova tačnost provjerena, sljedeći korak uključuje
manipulaciju sirovim podacima kako bi se dobio oblik na kojem se mogu izvršavati analize i
testirati hipoteze. U zavisnosti od varijabli od interesa i vrste istraživačkih pitanja, proces
manipuliranja podacima može uključivati jedan od sljedeća četiri koraka:

 zbrajanje skorova pojedinih stavki koje čine određenu skalu/ljestvicu kako bi se dobio
ukupni skor za tu skalu, kao što je npr. samopoštovanje, optimizam, itd.
 transformacija varijabli koje nisu normalno distribuirane za analize koje zahtijevaju
normalno distribuirane skorove.
 pretvaranje kontinuiranih varijabli (npr. dob) u kategorijalne varijable (npr. mlada,
srednja, starija dob).
 smanjivanje broja kategorija kod kategorijalne varijable (npr. smanjiti kategorije kod
varijable bračni status tako da imamo samo dvije kategorije: oni koji su u vezi i oni
koji nisu).

8.1. FORMIRANJE UKUPNOG SKORA

Kada provodimo istraživanje i koristimo veći broj mjerenja trebamo voditi računa o tome na
koji način formiramo rezultat svakog ispitanika. Ukupni skorovi u kompozitnim psihološkim
mjerenjima se formiraju pomoću linearnih kombinacija. Dijelovi tog kompozita mogu biti
zadaci, subtestovi i slično, a varijable dihotomne (one koje mogu poprimiti dvije vrijednosti),
politomne, kontinuirane, standardizirane i dr.
Tako je npr. ukupni rezultat na testu iz matematike linearna kombinacija uratka u pojedinim
zadacima.
Razlikujemo aditivne i supstraktivne linearne kombinacije, zavisno od toga da li sabiramo
brojeve ili oduzimamo. Kod aditivnih linearnih kombinacija ukupni rezultat je formiran
zbrajanjem rezultata na pojedinim mjerenjima (npr. u nekom testu znanja, kao u gornjem
primjeru). Tada linearna kombinacija ima sljedeći oblik:

70
SPSS PRIRUČNIK

Ui = Xi1 + Xi2 + Xi3 +...+ Xik; pri čemu je i = 1..N

Kod supstraktivnih linearnih kombinacija ukupni uradak se izražava kao razlika rezultata u,
najčešće, dva pojedina mjerenja. Naprimjer, ako mjerimo konstrukt opterećenost na poslu u
organizacijskoj pihologiji, ukupni skor svakog ispitanika možemo definirati kao količinu
zahtjeva koju ona ima na poslu umanjenu za količinu njegove autonomije na poslu. Ukoliko
bismo u tom slučaju koristili aditivnu linearnu kombinaciju za formiranje ukupnog uratka,
broj koji bismo dobili za određenog ispitanika ne bi imao smisla. Supstraktivna linearna
kombinacija ima sljedeći oblik:

Uisup= Xi1 - Xi2

Linearne kombinacije se također dijele na jednostavne i diferencijalno ponderirane. Ukoliko


govorimo o testu u kojem svaki zadatak u istoj količini mjeri određenu osobinu, govorimo o
jednostavnim linearnim kombinacijama. Tada se radi o jednostavnom zbrajanju ili
oduzimanju originalnih bruto rezultata u pojedinim mjerenjima (Npr. multiple choice – test od
20 pitanja, svako pitanje nosi po jedan bod. Ukupni rezultat svakog ispitanika je suma
rezultata na pojedinim pitanjima). Jednostavna linearna kombinacija ima sljedeći oblik:

Ui = Xi1 - Xi2 - Xi3 -...- Xik


Ui = Xi1 + Xi2 + Xi3 +...+ Xik; pri čemu je i = 1..N

U slučajevima kada svaki zadatak mjeri istu stvar, ali ne u istoj mjeri, tada se ukupni uradak
formira pomoću diferencijalno ponderiranih linearnih kombinacija. Svaki zadatak se množi
odgovarajućim brojem, ponderom, odnosno koeficijentom važnosti. Na taj način se svakom
zadatku pridaje različiti značaj, odnosno važnost. Diferencijalno ponderirana linearna
kombinacija ima sljedeći oblik:

UiDP= Xi1*W1+Xi2*W2+..+Xik*Wk,; pri čemu je W oznaka za ponder

Na primjer, pet zadataka na testu iz matematike ne mjere u istoj mjeri znanje iz matematike.
Neki zadaci su lakši a drugi teži, tako da ćemo teže zadatke množiti s većim ponderom, a
lakše s manjim. Na taj način povećavamo broj različitih rezultata koji su postignuti u
određenom testu, odnosno povećavamo diskriminativnost ili razlikovanje ispitanika.

71
SPSS PRIRUČNIK

Za ispravno formiranje ukupnog uratka potrebno je dakle dobro poznavanje konstrukta i


mjerenja kako bi se odabrala odgovarajuća linearna kombinacija pomoću koje će se za svakog
ispitanika formirati ukupni rezultat. Važnost ovog koraka ogleda se u tome što se korelacije i
druge statističke analize uvijek računaju na ukupnim skorovima jedne varijable, a ne na
sirovim rezultatima. Formiranje totalnih skorova uključuje dva koraka:

1. Rekodiranje negativno formuliranih pitanja/ stavki


2. Zadavanje SPSS-u da zbroji skorove svih stavki ili pitanja koje čine određenu skalu ili
subskalu.

1. korak: Rekodiranje negativno formuliranih pitanja ili stavki


Za izvođenje 1. koraka potrebno je dobro poznavanje skale i mjera koje se koriste u
istraživanju. To podrazumijeva prepoznavanje onih stavki u skalama koje su negativno
formulirane i koje se ne mogu tek tako zbrajati kako bi se dobio ukupni skor, već se prvo
moraju preobraziti u pozitivno formulirane stavke. Na primjer, na skali ekstraverzije od 1 do 5
( 1= ”uopće se ne slažem”; 5= „u potpunosti se slažem”) za većinu pitanja veći broj odgovara
većoj ekstraveziji, no neka pitanja su formulirana obratno: „Volim više čitati neku dobru
knjigu, nego izaći s prijateljima” – u ovom primjeru očigledno osoba koja zaokruži jedan
(odnosno ona koja se ne slaže s izjavom) je ekstravertnija od osobe koja zaokruži broj 2 ili 3.
Upravo iz tog razloga jednostavno zbrajanje bruto rezultata dobivenih od ispitanika na svim
stavkama skale ekstraverzije ne bi imalo smisla. Rezultat koji bi se dobio na taj način bi bio
pogrešan, te je potrebno prethodno identificiranje i rekodiranje takvih stavki.
Na skali optimizma, koju ćemo koristiti kao primjer, prva stavka je pozitivno formulirana
(veći skor = više optimizma): „U nesigurnim vremenima obično očekujem najbolje”.
Međutim, druga stavka je obratno formulirana, tako da veći skor odgovara manjem
optimizmu: „Ako nešto može da krene za mene po zlu, onda i hoće”. Pored ove, također su i
4. i 6. stavka negativno formulirane, te se njihov skor treba promijeniti prije formiranja
ukupnog uratka kako bi osigurali da u svim stavkama veći broj odgovara većem optimizmu.
Procedura za rekodiranje 2., 4. i 6. stavke na skali optimizma (1-5; pri čemu je 1= uopće se ne
slažem, a 5= u potpunosti se slažem) prikazana je u primjeru slijedi. Otvorite survey3ED.sav.

72
SPSS PRIRUČNIK

Procedura za rekodiranje negativno formuliranih stavki, odnosno pitanja

1. Sa gornjeg menija klikni Transform, zatim Recode i odaberi: Into Different


Variables.
2. Izaberi stavke čiji skor želiš promijeniti (op2, op4 i op6) i prebaci ih u Input
Variable-Output Variable (klikni na strelicu nakon što ih označiš).
3. Klikni na prvu varijablu (op2) i unesi novo ime u Output Variable (npr. Revop2).
Ponovi postupak za stavke op4 i op6.
4. Klikni na Old and new variables. U polje Old value unesi 1 ispod Value box. U
polje ispod New value unesi 5 u Value box. (to će promijeniti skor jedan u pet).
5. Klikni na Add. Pojavit će se uputa 1->5 u Old --> New box-u.
6. Ponovi istu proceduru za ostale skorove:
Old value – unesi 2; New value – unesi 4
Old value – unesi 3; New value – unesi 3
Old value – unesi 4; New value – unesi 2
Old value – unesi 5; New value – unesi 1
Uvijek provjeri broj stavki koje je potrebno rekodirati, kao i nove i stare vrijednosti
koje unosiš. Ne koriste svi testovi skalu, odnosno numerički sistem od jedan do pet.
Neke imaju četiri moguća odgovora, druge šest, a treće sedam kako bi se validirao
neki mjereni konstrukt.
7. Klikni Continue, te zatim OK.

Prikaz dobivenog outputa:

RECODE op2 op4 op6 (1=5) (2=4) (3=3) (4=2) (5=1) INTO Revop2 Revop4 Revop6.
VARIABLE LABELS Revop2 'Reverse optimism 2' /Revop4 'Reverse optimism 4'
/Revop6 'Reverse optimism 6'.
EXECUTE.

Interpretacija outputa:
Nove varijable s novim skorovima su, nakon izvršene procedure, prikazane na kraju liste
varijabli. To možeš provjeriti u prozoru Data Editor, odnosno Variable View, gdje su na
kraju same liste nove varijable Revop2, Revop4, Revop6. To su varijable koje, ukoliko su
slijeđene upute, promijenjene iz negativno u pozitivno formulirane. Poželjno je također
provjeriti u prozoru Data View da li su dobivene željene vrijednosti, odnosno da li je željeni

73
SPSS PRIRUČNIK

efekt postignut. Kako bi se to provjerilo trebaju se usporediti originalne vrijednosti (odnosno


vrijednosti varijabli op2, op4 i op6) sa novim vrijednostima (Revop2, Revop4 i Revop6).

2. korak: Formiranje totalnih skorova skale


Nakon što su dobiveni novi skorovi za pojedine stavke određene skale (u našem slučaju to su
stavke op2, op4 i op6), mogu se računati totalni skorovi pomoću linearnih kombinacija. U
našem slučaju ukupni uradak je definiran kao: U = op1+ Revop2 + op3 + Revop4 + op5 +
Revop6. Totalni skorovi se računaju samo ukoliko su potpuni podaci, odnosno ukoliko ne
postoje nedostajuće vrijednosti. Procedura za formiranje ukupnog skora je prikazana u
nastavku.

Procedura za formiranje totalnih skorova skale:

1. Sa gornjeg menija klikni Transform, zatim Compute.


2. U polju ispod Target variable unesi novo ime kojim želiš označiti totalni skor
određene skale. Preporučljivo je koristiti T kao prefiks, kako bi se totalni skorovi lakše
mogli pronaći u listi varijabli (koje su poredane po abecednom redu) kada koristiš
određene analize. Važno: Provjeri da li je ranije korišteno to ime, jer ukoliko jeste,
izgubit će se originalni podaci, što može biti katastrofalno.
3. Klikni na Type and Label. Pored Label treba unijeti opis skale (npr. Total optimism).
Klikni na Continue.
4. Na lijevoj strani se nalazi lista varijabli. Klikni na prvu stavku skale (opt1).
5. Klikni na strelicu > kako bi prebacio opt1 u polje ispod „Numeric Expression”.
6. Klikni na „+” na kalkulatoru.
7. Ponovi postupak za sve ostale stavke skale. U ovom primjeru dodat ćemo prvo one
stavke u skali koje nisu izmijenjene (op3 i op5), a nakon toga i one sa novim
skorovima, koje se nalaze na kraju liste varijabli (Revop2, Revop4 i Revop6).
8. Kompletni numerički izraz bi trebao ovako izgledati:
op1+op3+op5+Revop2+Revop4+Revop6.
9. Provjeri da li su sve stavke skale prisutne u izrazu, te da li stoje plusevi između njih.
10. Klikni OK.
Prikaz dobivenog outputa:
COMPUTE T_opt=op1 + op3 + op5 + Revop2 + Revop4 + Revop6.
EXECUTE.

74
SPSS PRIRUČNIK

Interpretacija outputa:
Kao konačni ishod će se na kraju liste varijabli pojaviti nova varijabla pod nazivom T_opt.
Ukupni skor svakog ispitanika je u T_opt definiran kao suma njegovih skorova na pojedinim
stavkama skale optimizma (od op1 do op6), pri čemu su skorovi određenih stavki
promijenjeni (2,4,6). Ako u pojedinim stavkama nedostaju podaci, također neće biti prikazan
ni totalni skor te skale. Nakon formiranja nove varijable važno je provjeriti i oblik distribucije
i ostale deskriptivne karakteristike, kao npr:

 Provjeri na osnovu upitnika: koji je mogući raspon rezultata? Za skalu koja sadrži 10
stavki, pri čemu su za svaku moguća četiri odgovora (odnosno skala od 1-4), najmanja
vrijednost koju ispitanik može postići je 10, a najveća 40. Ukoliko je osoba zaokružila
1 za svaku stavku, ukupni skor je 10 x 1 = 10. Ako je osoba samo zaokruživala 4, njen
ukupni uradak je 4 x 10 = 40.
 Uporedi aritmetičku sredinu skale sa vrijednostima koje se navode u literaturi. Da li je
vrijednost izračunate aritmetičke sredine slična onima koje su dobivene u prethodnim
studijama? Ukoliko nije, zašto nije? Možda je napravljena greška prilikom
rekodiranja? Ili se uzorci razlikuju? Kako bi takva usporedba bila moguća, važno je i
da je test normiran. Tako da pri kupovini testa treba obratiti pažnju na to da li on ima
norme, te da li su te norme prikupljene na dovoljno velikom i reprezentativnom
uzorku.
 Provjeri kako izgleda distribucija nove varijable koristeći skewness i kurtosis.
 Prikaži rezultate u obliku histograma. Da li su podaci normalno distribuirani? Ako
nisu, možda je neophodna transformacija podataka, prikazana u nastavku.

8.2. TRANSFORMIRANJE PODATAKA

Transformacije podataka daju smisao i omogućavaju interpretaciju rezultata. Šta to znači?


Bruto rezultat ispitanika na testu sam po sebi ne govori mnogo o tome koliko on posjeduje
određenu osobinu koja se mjeri. Njegov rezultat nam samo pruža informaciju o tome da li je
on bolji ili gori od drugih ispitanika na tom testu. Njegov skor govori samo o učinku na
jednom konkretnom testu koji ima određen broj pitanja, odnosno stavki i određeni raspon
rezultata. Drugi testovi koji mjere istu osobinu mogu se razlikovati i po broju stavki, i po

75
SPSS PRIRUČNIK

rasponu skorova. Kako generalizirati rezultate dobivene na različitim testovima koji mjere isti
konstrukt?
Također, često želimo porediti rezultat ispitanika na jednom testu koji mjeri jedan konstrukt s
njegovim rezultatom na drugom testu koji mjeri neku drugu varijablu. Generalizacija mogućih
rezultata na jednom konkretnom mjerilu izvodi se pretvaranjem, odnosno transformacijom
sirovih skorova na neku opće prihvaćenu skalu ili standard. Neke od tih skala su: Skala z-
vrijednosti, Skala devijacionog koeficijenta inteligencije (DQI-skala), T-skala, C-skala i dr.
Sve navedene skale imaju definisanu aritmetičku sredinu i standardnu devijaciju. Ova vrsta
transformacije, odnosno transformacija na skalu sa zadanim parametrima, se naziva višestruka
linearna transformacija. Transformacija na skalu z-vrijednosti, na primjer, nam govori o tome
koliko je ispitanikov rezultat iznad- ili ispodprosječan, te koliko je on udaljen od aritmetičke
sredine u jedinicama standardne devijacije.
Transformacije se dijele na linearne i nelinearne. Linearne Transformacije su one kod kojih su
razlike u tranformiranim skorovima iste kao i razlike u sirovim skorovima. Razmotrimo
efekat linearnih transformacija na vrijednosti aritmetičke sredine i standardne devijacije:

1. Kada dodamo konstantu određenom skupu podataka (ili oduzmemo od tog skupa),
aritmetička sredina se povećava, odnosno smanjuje za vrijednost konstante. Pošto
dodajemo, odnosno oduzimamo određenu konstantu, mi drugim riječima samo
pomjeramo distribuciju u desnu ili lijevu stranu, dok variranje rezultata ostaje isto.
Prema tome, dodavanjem ili oduzimanjem kontante od određenog skupa podataka,
varijanca – standardna devijacija ostaje nepromijenjena:

M’ = M+a; v’=v
M’ = M-a; v’=v

2. Množenjem ili dijeljenjem skupa podataka kontantom, aritmetička sredina se


miltiplicira, odnosno dijeli za vrijednost konstante. Varijanca se multiplicira, odnosno
dijeli kvadratom konstante (standardna devijacija samom konstantom).

M’ = Ma; v’ = va2; s’ = sa
M’ = M/a; v’ = v/a2; s’ = s/a

76
SPSS PRIRUČNIK

Prednost linearnih transformacija je upravo ta što su razlike u standardnim rezultatima


jednake razlikama u bruto rezultatima. Stoga je također jednaka i upotreba korelacija i drugi
statističkih postupaka onoj na sirovim podacima. No, postoje i određeni nedostaci:
Rezultati su neinterpretabilni ako distribucija odstupa od normalne. Od načina na koji se
distribuiraju podaci ovisi izbor statističkih postupaka. Parametrijski testovi se mogu koristiti
samo ukoliko su određeni preduvjeti za njenu upotrebu ispunjeni. Pored intervalne ili racio-
omjerne skale i velikog uzorka, jedan od preduvjeta je normalnost distribucije. Ukoliko je
distribucija normalna, simetrična, možemo koristiti t-test, ANOVU, Pearsonov koeficijent
korelacije i druge parametrijske testove (ako su i ostali uvjeti ispunjeni). Međutim, često kod
računanja skewness-a ili kod vizuelnog predstavljanja određenog skupa podataka (npr.
rezultati skale samopoštovanja) dobijemo da se skorovi ne distribuiraju normalno. Nekada
distribucija koju čine je pozitivno asimetrična, što znači da se većina podataka okuplja oko
nižih vrijednosti (kao što je to slučaj kod depresije). Tada je vrijednost skewness-a pozitivna.
Dobivena distribucija može također biti i negativno asimetrična, odnosno distribucija u kojoj
se većina skorova nalazi na desnoj strani distribucije, a vrijednost skewness-a je negativna
(npr. kod samopoštovanja – većina osoba ima visoko samopoštovanje). Kao što je već rečeno,
parametrijska statistika (Pearsonov koeficijent korelacije, Analiza varijance) se može koristiti
samo kod podataka koji su normalno distribuirani. Stoga, ukoliko podaci koje smo dobili nisu
normalno distribuirani, postoje dvije alternative:
Možemo koristiti neparametrijsku statistiku ili pak transformirati podatke. Takva vrsta
transformacija se naziva nelinearna, jer mijenja oblik distribucije (U ovom slučaju je treba
normalizirati, no možemo i npr. koristiti percentilnu transformaciju, koja također spada u
nelinearne, a nakon koje dobivamo distribuciju koja je „ravnija“ u odnosu na normalnu. Ona
se koristi kada nam treba poredak ispitanika).
Ukoliko se odlučimo za prvu opciju (upotreba neparametrijske statistike), a trebamo korelirati
uratke, nećemo koristiti Pearsonov koeficijent korelacije, već Spearmanov, kao i Mann-
Whitney U test umjesto t-testa za nezavisne uzorke itd. (SPSS sadrži također i neke
neparametrijske testove).
Druga opcija podrazumijeva transformaciju podataka. To uključuje modificiranje skorova
pomoću formula u svrhu normaliziranja te distribucije. U zavisnosti od oblika distribucije
postoji nekoliko vrsta transformacija. Na slici ispod su prikazane uobičajene asimetrične
distribucije, te i odgovarajuća vrsta transformacije koju su predložili Tabachnick i Fidell
(2007). Dakle, ukoliko distribucija podataka odstupa od normalne, potrebno ju je uporediti sa
distribucijama prikazanim na slikama, te pri tome odlučiti koja slika najviše sliči dobivenoj.

77
SPSS PRIRUČNIK

Formulu koja je prikazana pored slike treba unijeti u SPSS, i pomoću te formule će SPSS
normalizirati odgovarajuću distribuciju.

Kvadratni korijen
Formula: nova varijabla = SQRT(stara varijabla)

Logaritam

Formula: nova varijabla = LG10(stara varijabla)

Inverz
Formula: nova varijabla = 1 / (stara varijabla)

Refleksija i kvadratni korijen


Formula: nova varijabla = SQRT (K – stara varijabla);
gdje je K = najveća moguća vrijednost +1

Refleksija i logaritam
Formula: nova varijabla = LG10 (K – stara varijabla);
gdje je K = najveća moguća vrijednost +1

78
SPSS PRIRUČNIK

Refleksija i inverz
Formula: nova varijabla = 1 / (K – stara varijabla);
gdje je K = najveća moguća vrijednost +1

Procedura za izvršavanje odgovarajuće transformacije je prikazana ispod. Ukoliko želiš da


slijediš upute, otvori staffsurvey3ED.sav.
Prvo ćemo vizuelno predstaviti podatke pomoću histograma (Analyze, Descriptive Statistics
– kod Charts, odaberi Histogram), te pri tom odaberi i skewness. Na taj način dobivamo
detaljnije informacije o nekim karakteristikama podataka, kao što je oblik distribucije. Na
osnovu dobivenog outputa očigledno vidimo da varijabla length of service nije normalno
distribuirana, odnosno da je pozitivno asimetrična:

To također vidimo na osnovu vrijednosti skewnessa, koja nije 0 kao kod simetričnih
distribucija, niti negativna kao kod negativno asimetričnih, već iznosi 2,686, što ukazuje na
pozitivnu asimetriju. Uporedit ćemo distribuciju varijable length of service sa slikama iznad.

79
SPSS PRIRUČNIK

U našem slučaju, najviše odgovara transformacija Logarithm. Za izvršavanje odgovarajuće


transformacije, slijedi upute prikazane u nastavku. Pored transformacije Logarithm prikazana
je i procedura za ostale vrste transformacija.

Procedura za transformaciju podataka:


1. Sa gornjeg menija klikni Transform, zatim Compute Variable.
2. Ispod Target variable napiši novo ime varijable. Pri tome obrati pažnju na to da to
ime treba da upućuje na vrstu transformacije i originalno ime varijable. Naprimjer,
ukoliko je originalno ime varijable tnegaff, novo ime je sqtnegaff ukoliko je korištena
tranformacija square root. U našem slučaju možemo koristiti ime logloservice.
3. Functions – Lista koja je prikazana sadrži velik broj mogućih operacija koje možeš
poduzeti. Treba odabrati onu transformaciju koja najviše odgovara tvojoj varijabli.
Pogledaj oblik distribucije te varijable i prepoznaj distribuciju kojoj je najbliža po
obliku. Obrati pažnju na formulu koja se nalazi pored slike. Tu formulu ćeš koristiti za
transformaciju podataka. U ovom slučaju to je: LG10 (old variable).
4. Za transformacije koje sadrže kvadratni korijen ili logaritam. Kod Function
group odaberi Arithmetic, i potraži na listi koja se pojavi formulu koja ti je potrebna
(SQRT ili LG10). Označi formulu koju želiš i klikni na strelicu. Formula će se
pojaviti u prostoru ispod Numeric Expression. (u datom primjeru to je
LG10(service).
5. Za transformacije koje sadrže refleksiju. Potrebno je prvo odrediti koliko iznosi K
za tvoju varijablu. To je najveća vrijednost koju tvoja varijabla može poprimiti + 1. Tu
vrijednost K unesi u polje ispod Numeric Expression. Dovrši ostatak formule
koristeći Functions.
6. Za transformacije koje uključuju inverz. U polje ispod Numeric Expression unesi
1, /, te varijablu ili ostatak formule.
7. Provjeri da li je formula ispravna.
8. Klikni na Type i Label, pored Label unesi opis nove varijable. Također možeš kao
opis unijeti formulu koju si koristio/la. (U datom primjeru to je Logarithm
transformation of the variable length of service ili LG10(service))
9. Provjeri da li novo ime stoji ispod Target variable – ne originalno već novo ime (zato
što će se inače izgubiti originalni podaci).
10. Klikni na OK. Nova varijabla (logloservice) će biti prikazana na kraju liste varijabli.

80
SPSS PRIRUČNIK

(U prozoru Data Editor, Variable View).


11. Prikaz dobivenog output-a:

COMPUTE logloservice=LG10(service).
EXECUTE.

12. Provjeri oblik distribucije tranformirane varijable (logloservice): Klikni sa gornjeg


menija na Analyse, zatim Descriptive statistics i odaberi Explore.
13. Klikni na varijablu od interesa (u ovom slučaju logloservice) i prebaci je u polje
Dependent list.
14. Označi varijablu ID i klikni na strelicu kako bi je prebacio/la u polje Label cases by.
15. Ispod Display označi Both.
16. Klikni na Plots i odaberi Histogram (i show normal curve ukoliko želiš) i Normality
plots with tests. Klikni na Continue.
17. Klikni na Options, te odaberi Exclude cases pairwise.
18. Klikni na Continue, zatim OK.

Prikaz dobivenog histograma i testa normalnosti:

81
SPSS PRIRUČNIK

Tests of Normality

a
Kolmogorov-Smirnov Shapiro-Wilk

Statistic Df Sig. Statistic df Sig.

Logarithm Transformation of
.091 471 .000 .978 471 .000
the variable length of service

a. Lilliefors Significance Correction

Na osnovu dobivenog outputa vidimo da je logaritamska transformacija (u određenoj mjeri)


normalizirala prethodno asimetričnu distribuciju. Također vidimo da transformirana
distribucija odstupa od savršene normalne distribucije. Iz tog razloga je potrebno procijeniti
da li je to odstupanje od normalne distribucije statistički značajno, što nam pokazuje
Kolmogorov-Smirnov test prikazan u nastavku:

Distribucija odstupa neznačajno od normalne ukoliko je dobivena vrijednost veća od 0.05 (ili
obratno: ukoliko se dobije da je Sig<0.05, distribucija značajno odstupa od normalne). Sa
tabele možemo očitati da transformirana distribucija varijable length of service značajno
odstupa od normalne (Sig=0.000). Ova transformacija nam, dakle, nije omogućila da pri
analizi podataka koristimo parametrijske testove, već moramo pribjeći neparametrijskim
testovima. Kod asimetričnih distribucija možemo također upotrijebiti kolapsiranje
kontinuirane varijable u kategorijalnu. Procedura i pojašnjenje vezano uz kolapsiranje
kontinuirane varijable u kategorijalnu je prikazana u nastavku. Ukoliko to nije slučaj, odnosno
ukoliko izvršena transformacija uspješno normalizira distribuciju (na što bi ukazala vrijednost
veća od .05 nakon izvršenog Kolmogorov-Smirnovog testa), možemo koristiti parametrijske
testove.

8.3. KOLAPSIRANJE KONTINUIRANIH VARIJABLI U KATEGORIJE

Za neke analize (npr. analizu varijance) potrebno je da podijelimo uzorak na nekoliko


jednakih grupa prema odgovarajućim rezultatima na nekim varijablama (npr. da ih podijelimo
u grupe sa niskim, srednjim i visokim rezultatima).
Novije verzije SPSS-a imaju opciju (Visual Binning) u meniju Transform koja obavlja tu
funkciju. Za ilustraciju procesa koristit će se baza survey3ED.

82
SPSS PRIRUČNIK

Procedura kolapsiranja kontinuirane varijable u kategorije:


1. Iz menija na vrhu ekrana, klikni na Transform i izaberi Visual Binning.
2. Selektiraj kontinuiranu varijablu koju želiš koristiti (npr. dob). Prenesi je u okvir
Variables to Bin. Pritisni dugme Continue.
3. U prozoru Visual Binning koji se otvori, klikni na varijablu da bi je označio.
Histogram koji pokazuje distribuciju podataka varijable dob bi se trebao pokazati.
4. U dijelu na vrhu označenim kao Binned Variable, unesi ime nove kategorijalne
varijable koju želiš stvoriti (npr. dobgp3). Možeš također promijeniti u oznaku koja ti
je ponuđena (npr. dob u 3 grupe)
5. Klikni na dugme označeno kao Make Cutpoints, zatim OK u dijaloškom prozoru koji
se otvori, klikni na opciju Equal Percentiles Based on Scanned Cases. U okviru
Number of Cutpoints, odredi broj jedan manje od broja grupa koje želiš (npr. ako
želiš tri grupe, utipkaj broj 2 za cutpoints). Ispod u odjeljku Width (%), vidjet ćeš da
će se pojaviti broj 33,33. Ovo znači da će SPSS pokušati da stavi 33,33 % uzorka u
svaku grupu. Klikni na dugme Apply.
6. Klikni na dugme Make Labels u glavnom dijaloškom prozoru. Ovo će automatski
generirati vrijednosti za svaku od novih kreiranih grupa. Ovo se može modificirati,
ako želiš time što klikneš na ćelije na gridu.
7. Klikni OK (ili Paste ako želiš da zalijepiš ovu naredbu na prozor Syntax Editor). Da
bi je izdvojili nakon što je zalijepimo na Syntax Editor, označi komandu i postavi
Run na meniju. Nova varijabla (dobgp3) bi se trebala pojaviti na kraju foldera s
podacima. (Vrati se na prozor Data Editor, odaberi opciju Vabriable View, trebala bi
da bude na dnu.)
8. Pokreni Descriptives, Frequencies na svojoj novokreiranoj varijabli (dobgp3) da bi
provjerio broj podataka u svakoj kategoriji.

Prikaz dobivenog outputa:


* Visual Binning.
*age.
RECODE age (MISSING=COPY) (LO THRU 29.0=1) (LO THRU 44.0=2) (LO THRU HI=3)
(ELSE=SYSMIS) INTO dobgp3.
VARIABLE LABELS dobgp3 'age (Binned)'.
FORMATS dobgp3 (F5.0).
VALUE LABELS dobgp3 1 '<= 29' 2 '30 - 44' 3 '45+'.
VARIABLE LEVEL dobgp3 (ORDINAL).
EXECUTE.

83
SPSS PRIRUČNIK

Interpretacija outputa:
Ovom komandom je napravljena varijabla dobgp3 – smještena na kraju liste varijabli – koja
predstavlja varijablu dob (age) podijeljenu u tri kategorije: <=29, 30-44 i 45+.

8.4. SMANJENJE BROJA KATEGORIJA U KATEGORIJALNOJ


VARIJABLI

Postoje situacije u kojima želimo da smanjimo ili kolapsiramo broj kategorija kategorijalne
varijable. Ovo radimo zbog potreba istraživanja ili teoretskih razloga (npr. kolapsiranja
bračnog statusa u dvije kategrije u kojima su ljudi „u vezi“/„nisu u vezi“). Na primjer, može
se desiti da imamo samo nekoliko ljudi u našem uzorku koji spadaju u određenu kategoriju –
kao što u bazi survey3ED, za varijablu edukacija, imamo samo dvoje ljudi u prvoj kategoriji,
„osnovna škola“ (primary school). Ova varijabla se ne može na pravi način koristiti u mnogim
statističkim analizama. Možemo odlučiti da samo uklonimo ove ljude iz uzorka, ili možemo
varijablu rekodirati tako da ih kombiniramo sa sljedećemo kategorijom, „nešto srednje škole“
(some secondary). Jako je važno napomenuti da se stvara nova dodatna varijabla (znači
održavaju se originalni podaci).

Procedura za smanjenje broja kategorija:

1. Iz menija sa vrha ekrana, klikni na Transform, zatim na Recode, zatim na Into


Different Variables. (Pobrini se da si postavio different variables da bi zadržao
originalne varijable za druge analize).
2. Postavi varijablu koju želiš rekodirati (npr. educ). U okviru Name, unesi ime za novu
varijablu koju ćeš kreirati (npr. coleduc). Unesi i produženu oznaku u dijelu Label,
ako želiš. Klikni na dugme označeno sa Change.
3. Klikni na dugme označeno kao Old and New Values.
4. U odjeljku Old Value vidjet ćeš okvir označen kao Value. Utipkaj prvi kod ili svoju
trenutnu varijablu (npr. 1). U odjeljku New Value, utipkaj novu vrijednost koja će se
koristiti (ili ako će se koristiti ista, unesi tu vrijednost). U ovom slučaju, ja ću ih
rekodirati u istu vrijednost pa ću utipkati 1 u oba odjeljka Old Value i New Value.
Klikni na dugme Add.
5. Za drugu vrijednost, utipkao bih 2 u odjeljak Old Value, ali u odjeljku New Value

84
SPSS PRIRUČNIK

utipkao bih 1. Ovo će rekodirati obje vrijednosti 1 i 2 iz originalnog koda u jednu


grupu nove varijable koja bi bila kreirana sa vrijednošću 1.
6. Za treću vrijednost originalne varijable, utipkao bih 1 u odjeljak Old Value i 2 u
odjeljak New Value. Ovo radimo da bismo zadržali vrijednosti u novoj varijabli.
Klikni na Add. Ponovi isto za ostale varijednosti originalne vrijednosti. U tabeli Old>
New, trebao bi vidjeti iduće kodove za ovaj primjer 1→1; 2→1; 3→2; 4→3; 5→4;
6→5.
7. Klikni na Continue, zatim OK (ili na Paste ako želiš da zaliješiš ovu naredbu na
prozor Syntax Editor). Da bi je izostavio nakon što je zalijepiš na Syntax Editor,
označi naredbu i postavi Run na meniju.
8. Idi na prozor Data Editor i odaberi opciju Variable View. Utipkaj odgovarajuće
oznake vrijednosti koje predstavljaju vrijednosti (1= nije završio osnovnu školu, 2=
završio srednju školu, 3= dodatno obrazovanje, 4= završena viša škola, 5= završen
fakultet). Zapamti, ove vrijednosti će biti drugačije od kodova koje koritimo za
originalnu varijablu, važno je da ih ne pomiješaš.

Prikaz dobivenog outputa:


RECODE educ (1=1) (2=1) (3=3) (4=4) (5=5) INTO coleduc.
VARIABLE LABELS coleduc 'collapsed education'.
EXECUTE.

Interpretacija outputa:
Ovom komandom smo spojili kategorije primary school i some secondary u kategoriju
primary_and_secondary u novoj varijabli coleduc. Takođe smo i očuvali staru varijablu educ.
Nakon rekodiranja varijable, korisno je pokrenuti Frequencies na obje varijable – staroj
(educ) i novokreiranoj varijabli (coleduc, koja se pojavi na kraju liste varijabli) – i provjeriti
da li su tačne frekvencije koje su dobijene za novu varijablu. Na primjer, za novokreiranu
coleduc, trebali bismo sada imati 2+53=55 ispitanika u prvoj grupi. Ovo predstavlja 2 ljudi
koji su označeni sa 1 u originalnoj varijabli (primary school) i 53 ljudi koji su označeni sa
brojem 2 (some secondary).

85
SPSS PRIRUČNIK

Zadaci za vježbu:
POSAO
Baza podataka: staffsurvey3ED.sav. Vidite prilog za detalje o bazi podataka.
1. Vježbajte postupak objašnjen u ovom poglavlju kako da zbrojite ukupni rezultat za
skalu, tako što koristite iteme koji čine Staff Satisfaction Survey (istraživanje
zadovoljstva osoblja). Morat ćete sabrati iteme-e koji procjenjuju agreement
(slaganje) sa svakim item-om na skali (tj. Q1a+Q2a+Q3a....DO Q10a). Imenujte novu
varijablu sa staffsatis.
2. Provjerite deskriptivnu statistiku za novi ukupni rezultat (staffsatis) i usporedite je sa
deskriptivnim vrijednostima za varijablu totsatis, koja se već nalazi u bazi podataka.
Ovaj ukupni rezultat je već izračunat.
3. Koji su najmanji mogući i najviši mogući rezultati za ovu novu varijablu? Savjet:
provjerite broj itema na skali i broj bodova za odgovor na svakoj tački. (vidi Dodatak
na kraju knjige)
4. Provjerite distribuciju varijable service tako što ćete napraviti histogram. Vidjet ćete
kako je histogram veoma asimetričan, većina se nalazi na dnu ( sa manje od 2 godine
pružanja usluga) a nekoliko je ljudi je rašireno na vrlo viskom kraju ( sa više od 30
godina pružanja usluga). Provjerite kakav je oblik ditribucije u usporedbi sa onim koji
je prikazan i pokušajte napraviti nekoliko transformacija. Ne zaboravite provjeriti
distribucije novih transformiranih varijabli koje kreirate. Je li ijedna od njih normalno
distribuirana?
5. Raspodijelite varijablu: godine pružanja usluga (service) u tri različite grupe koristeći
se postupkom Visual Binning koja se nalazi na meniju Transform. Koristite Make
Cutpoints dugme i tražite Equal Percentiles. U dodjeljku Number of Cutpoints,
odredite 2. Nazovite vašu novu varijablu gp3service da biste je mogli razlikovati od
varijable koja se već nalazi u bazi podataka koja je napravljena koristeći se ovim
postupkom (service3gp). Pokrenite Frequencies na novoj varijabli kako biste
provjerili koliko je slučajeva u svakoj grupi.

ZDRAVLJE
Baza podatka: sleep3ED.sav. Vidite Prilog za detalje o bazi podataka.
1. Vježbate postupke opisane u ovom poglavlju da biste zbrojili ukupne rezultate za
skale koristeći se itemima koji čine skalu Sleepines i Associate Sensations Sacale

86
SPSS PRIRUČNIK

(Pospanost i Skala Povezanih osjeta). Morat ćete zbrojiti iteme fatigue, lethargy, tired,
sleepy, energy (zamor, letargija, umor, pospanost, energija.). Nazovite vašu novu
varijablu sleeptot. Zapamite: nijedan od ovih itema ne mora biti obrnut prije nego
bude dodan.
2. Provjerite deskriptivnu statistiku za vaš novi ukupni rezultat (sleeptot) i uporedite je sa
deskriptivima za varijablu totSAS, koja se već nalazi u bazi podataka. Ovo je ukupni
rezultat koji je već izračunat.
3. Koji su najmanji mogući i najveći mogući rezultati za ovu novu varijablu? Savjet:
Provjerite broj itema u skali i broj bodova za odgovor na svakom itemu. (vidi
Dodatak)
4. Provjerite distribuciju (tako što napravite histogram) varijable koja mjeri broj cigareta
koji dnevno ispuše pušači u uzorku (smokenum). Vidjet ćete kako je veoma
asimetričan jer se većina ljudi nalazi na donjem kraju (sa manje od 10 dnevno) i
nekoliko ljudi je na samom vrhu gornjeg kraja (sa više od 70 dnevno). Uporedite oblik
distribucije i pokušajte napraviti nekoliko različitih transformacija. Ne zaboravite
provjeriti distribucije novih transformiranih varijabli koje ste napravili. Da li je ijedna
od novih transformiranih varijabli 'normalnije' distribuirana.
5. Raspodjelite varijablu dob (age) u tri grupe koristeći se Visual Binning postupkom iz
menija Transform. Koristite Make Cutpoint dugme i tražite Equal Percentiles. U
odjeljku označenom sa Number of Cutpoints odredite 2. Nazovite vašu novu
varijablu gp3 da biste je razlikovali od varijable koja se već nalazi u bazi podataka,
koja je napravljena koristeći se ovim postupkom (age3gp). Pokrenite Frequencies, na
vašoj nanovo napravljenoj varijabli kako biste provjerili koliko slučajeva ima u svakoj
grupi.

87
SPSS PRIRUČNIK

9.
POUZDANOST

Kada postavljamo skale u svoju studiju, važno je pronaći one koje su pouzdane. Postoji više
aspekata pouzdanosti. Jedan od glavnih problema vezan je za unutarnju konzistenciju skale.
Ovo se odnosi na stepen povezanosti između stavki unutar skale. Jedan od najčešće korištenih
indikatora za unutarnju konzistenciju je Cronbachov alfa koeficijent. Idealno, Cronbachov
alfa koeficijent skale bi trebao biti iznad 0,7 (DeVellis 2003). Međutim, vrijednosti
Cronbachovog alfa koeficijenta su poprilično osjetljive na broj stavki na skali. Na kratkim
skalama (onima koje imaju manje od 10 stavki), uobičajeno je da alfa koeficijent bude nizak
(npr. 0,5).
Pouzdanost skale može da varira zavisno od uzorka na kojem je korištena. Također je
potrebno da se provjeri da je svaka skala pouzdana na određenom uzorku. Ova informacija se
inače nalazi u metodološkom dijelu. Ukoliko skala sadrži neke stavke koje su negativno
sročene, ove stavke bi trebale biti obrnute prije provjeravanja pouzdanosti.
U sljedećem primjeru, istražit ćemo unutarnju konzistenciju jedne od skala iz baze
survey3ED, skalu „Zadovoljstvo životom“, koja je sastavljena od 5 stavki. U bazi podataka,
ove stavke su označene kao lifsat1, lifsat2, lifsat3, lifsat4, lifsat5.

Procedura za računanje pouzdanosti skale:

Važno: prije početka, trebao bi provjeriti da su sve negativno sročene stavke u skali obrnute.
Ako se ne uradi ovo, doći će do jako niske (i netačne) vrijednosti Cronbachovog alfa
koeficijenta. U ovom primjeru, nijedna od ovih stavki ne treba da bude preokrenuta.

1. Iz menija na vrhu ekrana, klikni na Analyze, zatim klikni na Scale, zatim na


Reliability Analysis.
2. Klikni na induvidualne stavke koje čine skalu (npr. lifsat1, lifsat2, lifsat3, lifsat4,
lifsat5), pomjeri ih u okvir označen kao Items.
3. U dijelu Model, pobrini se da postaviš Alpha.
4. U okviru Scale label, unesi ime skale ili podskale (Zadovoljstvo životom).
5. Klikni na dugme Statistics. U dijelu Descriptives for, klikni na Item, Scale i Scale if

88
SPSS PRIRUČNIK

item deleted. U dijelu Inter-Item, čekiraj Correlations, u dijelu Summaries klikni


na Correlations.
6. Klikni na Continue i zatim OK (ili na Paste da bi spremili na Syntax Editor).

Prikaz dobivenog outputa:

Case Processing Summary

N %

Valid 436 99.3


a
Cases Excluded 3 .7

Total 439 100.0

a. Listwise deletion based on all variables in the


procedure.

Reliability Statistics

Cronbach's Cronbach's N of Items


Alpha Alpha Based on
Standardized
Items

.890 .895 5

Item Statistics

Mean Std. Deviation N

lifsat1 4.37 1.528 436


lifsat2 4.57 1.554 436
lifsat3 4.69 1.519 436
lifsat4 4.75 1.641 436
lifsat5 3.99 1.855 436

Inter-Item Correlation Matrix

lifsat1 lifsat2 lifsat3 lifsat4 lifsat5

lifsat1 1.000 .763 .720 .573 .526


lifsat2 .763 1.000 .727 .606 .481
lifsat3 .720 .727 1.000 .721 .587
lifsat4 .573 .606 .721 1.000 .594
lifsat5 .526 .481 .587 .594 1.000

89
SPSS PRIRUČNIK

Summary Item Statistics

Mean Minimum Maximum Range Maximum / Minimum Variance N of Items

Inter-Item Correlations .630 .481 .763 .282 1.587 .009 5

Item-Total Statistics

Scale Mean if Scale Variance Corrected Item- Squared Cronbach's


Item Deleted if Item Deleted Total Multiple Alpha if Item
Correlation Correlation Deleted

lifsat1 18.00 30.667 .758 .649 .861


lifsat2 17.81 30.496 .752 .654 .862
lifsat3 17.69 29.852 .824 .695 .847
lifsat4 17.63 29.954 .734 .574 .866
lifsat5 18.39 29.704 .627 .421 .896

Scale Statistics

Mean Variance Std. Deviation N of Items

22.38 45.827 6.770 5

Interpretacija outputa:
 Na pregledu outputa vidi se da je broj ispitanika tačan (u tabeli Case Processing
Summary) i da je broj stavki tačan (u tabeli Reliability Statistics).
 Provjeri negativne vrijednosti u Inter-Item Correlation Matrix. Sve vrijednosti bi
trebale biti pozitivne, upućujući na to da stavke mjere istu karakteristiku. Prisustvo
negativnih vrijednosti bi moglo pokazivati da neke od stavki nisu bile kako treba
preokrenute. Netačni skorovi će se, takođe, prikazati u tabeli Item-Total Statistics sa
negativnim vrijednostima u Corrected-Item Total Correlation. To treba provjeriti
ukoliko dobijeni Cronbachov alfa koeficijent bude niži od očekivanog.
 Vrijednosti u Corrected Item-Total Correlation u tabeli Item-Total Statistics
indiciraju na stepen korelacije svake stavke sa ukupnom vrijednošću. Niske vrijednosti
(niže od 0,3) ovdje indiciraju da stavka mjeri nešto drugo od cijele skale. Ako je
Cronbachov alfa koeficijent cijele skale prenizak (niži od 0,7), a sve provjerene stavke
su tačne, možda je potrebno izbaciti stavke koje imaju niske korelacije sa ukupnom
vrijednošću.
90
SPSS PRIRUČNIK

 Za skale sa malim brojem stavki (npr. manje od 10), ponekad je teško da se dobije
odgovarajuća vrijednost Cronbachovog Alfa-koeficijenta i možda bi se trebala
provjeriti prosječna vrijednost korelacije unutar stavki, koja je pokazana u tabeli
Summary Item Statistics. U ovom slučaju, ona iznosi 0,63, sa rasponom od 0,48 do
0,76. Ovo ukazuje na jaku povezanost između stavki, što za mnoge skale nije slučaj.

Prezentacija rezultata pouzdanosti:


Uobičajeno je da se podaci pouzdanosti skale prezentiraju u dijelu „Metodologija“ u
izvještaju, pod naslovom „Instrumentarij“. Nakon što se opiše skala (broj stavki koje su
korištene, broj kategorija u raznim skalama), potrebno je uključiti kratak sadržaj pouzdanosti
koje je odredio autor ili istraživač, a zatim rečenicu koja upućuje na rezultat uzorka.

Prema Pavotu, Dieneru, Colvinu i Sandviku (1991), skala Zadovoljstvo životom ima dobru
unutarnju konzistenciju, sa Cronbachovim alfa koeficijentom koji iznosi 0,85. U navedenoj
studiji, Cronbachov alfa koeficijent je bio 0,89.

Zadaci za vježbu:

POSAO
Baza podataka: staffsurvey3ED.sav. Vidi Dodatak za detalje o bazi podataka.
1. Provjerite pouzdanost ispitivanja zadovoljstva osoblja, koje je načinjeno iz itema
agreement (slaganje) u bazi podataka: od Q1a DO Q10a. Nijedan od itema u ovoj skali
ne mora biti obrnut.

ZDRAVLJE
Baza podataka: sleep3ED.sav. Vidi Dodatak za detalje o bazi podataka.
1. Provjerite pouzdanost skala Sleepiness i Associated Sensations Scale koja je načinjena
od itema: fatigue, lethargy, tired, sleepy, energy (zamor, letargija, umor, pospanost,
energija). Nijedan od itema u ovoj skali ne mora biti obrnut.

91
SPSS PRIRUČNIK

10.
IZBOR PRAVOG STATISTIČKOG POSTUPKA

Jedna od najtežih stvari prilikom provedbe istraživanja jeste odabir prave statističke analize za
obradu i analizu prikupljenih podataka. Izbor odgovarajuće statističke tehnike ovisi o prirodi
istraživačkog pitanja, kao i podataka kojima se raspolaže. Stoga je veoma bitno dobro
poznavati osnove različitih statističkih analiza, istraživačko pitanje i problem kojim se
bavimo, te postavljene hipoteze. Izbor određene statističke analize u radovima drugih autora
može biti od koristi u izboru analize u vlastitom radu, te ih je korisno proučiti. U ovom
poglavlju osvrnut ćemo se na različite statističke tehnike, te ćemo korak po korak proći kroz
proces donošenja odluke o izboru prave statističke analize.

10.1. PREGLED RAZLIČITIH STATISTIČKIH TEHNIKA

Oblast statističkih tehnika podijeljena je na dva glavna dijela:


 tehnike korištene za istraživanje povezanost između varijabli (npr. između dobi i
optimizma).
 tehnike korištene za istraživanje razlika među grupama (npr. spolne razlike u
rezultatima na skali optimizma).
Podjelom ove oblasti na dva dijela teži se naglašavanju umjetnih razlika među njima.
Zapravo, postoji mnogo sličnosti između različitih statističkih tehnika koje na prvi pogled
nisu uočljive.

10.2. ISTRAŽIVANJE POVEZANOSTI IZMEĐU VARIJABLI

Za istraživanje snage povezanosti među varijablama koristi se niz tehnika:

Korelacija
Pearsonov ili Spearmanov koeficijent korelacije računa se kada želimo ispitati snagu
povezanosti između 2 kontinuirane varijable. Govori nam o smjeru (pozitivna i negativna),
kao i o snazi povezanosti. Pozitivna korelacija: porastom vrijednosti jedne varijable raste i

92
SPSS PRIRUČNIK

vrijednost druge varijable. Negativna korelacija: porastom vrijednosti jedne varijable


vrijednost druge varijable opada. (Detaljnije u poglavljima 11 i 12 – IV dio)

Parcijalna korelacija
Parcijalna korelacija je nastavak bivarijatne korelacije. Kontrolira mogući utjecaj neke
konfundirajuće varijable (npr. društveno poželjnog odgovaranja), pružajući tako bolji uvid u
povezanost između dvije varijable od interesa. (Detaljnije u poglavlju 13 – IV dio)

Multipla regresija
Multipla regresija je sofisticiran nastavak korelacije i koristi se kada želimo ispitati udio
varijance objašnjen pojedinačnim prediktorima. Omogućava predočavanje onog prediktora
koji je najbolji za predviđanje kriterija. (Detaljnije u poglavlju 14 – IV dio)

10.3. ISTRAŽIVANJE RAZLIKA IZMEĐU GRUPA

Drugi dio oblasti statističkih tehnika sadrži analize koje se koriste kada želimo utvrditi da li
postoji statistički značajna razlika između dvije ili više grupa. Parametrijske verzije testova
koje su prikladne kada imamo intervalne skale podataka i normalnu distribuciju skorova
prezentirane su ispod, sa neparametrijskim alternativama.

T-test
T-test koristi se kada postoje dvije grupe (npr. muškarce i žene), ili dva seta podataka (prije i
poslije) i želimo porediti njihove aritmetičke sredine na nekoj kontinuiranoj varijabli. Postoje
dvije glavne vrste t-testova:
 t-test za zavisne uzorke (koristi se kada nas interesuju promjene u skorovima istih
ispitanika testiranih u dvije vremenske tačke, najčešće prije i poslije neke intervencije
ili tretmana)
 t-test za nezavisne uzorke (koristi se kada imamo dvije različite nezavisne grupe
ispitanika, npr. muškarce i žene, i zanima nas razlika između njih, tj. između njihovih
aritmetičkih sredina. U ovom slučaju koristimo informacije prikupljene samo jednim
testiranjem, ali na različitim grupama ispitanika). Detaljnije u poglavlju 17.
Neparametrijske alternative za t-test su Mann-Whitney U test i Wilcoxonov test ekvivalentnih
parova ili rangova.(Detaljnije u poglavlju 16 – V dio)

93
SPSS PRIRUČNIK

Jednosmjerna analiza varijance


ANOVA je slična t-testu, ali se koristi kada želimo porediti aritmetičke sredine dvije ili više
grupa. Naziva se jednosmjerna jer se posmatra efekat samo jedne nezavisne na zavisnu
varijablu. Jednosmjernom analizom varijance možemo ustanoviti da li je razlika među
grupama značajna, ali ne možemo znati koje se grupe značajno razlikuju (gp1/gp2, gp2/gp3,
itd.). Post-hock analizom može se utvditi značajnost razlike između tačno određenih grupa.
Također se može računati test za utvrđivanje različitosti između samo određenih grupa,
umjesto da se porede sve grupe, ali to se mora uraditi na temelju planirane usporedbe. Slično
kao kod t-testa postoje dvije vrste jednosmjerne analiza varijance:
 Analiza varijance za nezavisne uzorke
 Analiza varijace za zavisne uzorke
Neparametrijske alternative za ANOVA-u su Kruskall-Wallisov Test i Friedmanov Test.
(Detaljnije u poglavlju 17 – V dio)

Dvosmjerna analiza varijance


Omogućava testiranje efekata dvije nezavisne varijable na jednu zavisnu varijablu. Prednost
korištenja dvosmjerne analize varijance ogleda se u testiranju efekta interakcije koji pokazuje
da li je efekat jedne nezavisne varijable na zavisnu varijablu pod utjecajem druge nezavisne
varijable. Također se testiraju i glavni efekti, tj. globalni ili ukupan učinak jedne nezavisne na
zavisnu varijablu. Postoje dvije vrste dvosmjernih analiza varijace:
 Dvosmjerna analiza varijance za nezavisne uzorke
 Dvosmjerna analiza varijance za zavisne uzorke
Neka istraživanja dizajnirana su tako da kombinuju testiranje između grupa i ponovljenih
mjerenja u jednoj studiji. To se naziva „Miješani između-unutar dizajni“ ili „Split Plot“.
(Detaljnije u poglavlju 18 – V dio)

10.4. PROCES DONOŠENJA ODLUKE

U odabiru prave statističke analize potrebno je uzeti u obzir i sagledati različite faktore:
vrstu pitanja i problema koji se istražuje, vrstu itema i skala korištenih za ispitivanje, prirodu
podataka kojima raspolažemo za svaku od varijabli, kao i pretpostavke koje moraju biti
zadovoljene za svaku različitu statističku tehniku.

94
SPSS PRIRUČNIK

Korak 1: Pitanja na koja želimo odgovoriti


Na samom početku potrebno je napraviti listu pitanja na koja se istraživanjem nastoji
odgovoriti. Pitanja mogu biti postavljana na različite načine. Zavisno od načina na koji je
pitanje postavljeno može zavisiti odabir statističke analize. Npr. ukoliko se istražuje utjecaj
dobi na optimizam brojni su načini na koje se može postaviti istraživačko pitanje:
 Postoji li veza između dobi i nivoa optimizma?
 Jesu li stariji ljudi optimističniji od mlađih ljudi?
Ova dva različita pitanja zahtijevaju različite statističke tehnike. Prikladnost pitanja može
zavisiti od prikupljenih podataka.

Korak 2: Pronalazak itema i skala za odgovore


Vrsta itema i skala uključenih u studiju igraju važnu ulogu u određivanju prikladne statističke
tehnike za ispitivanje istraživačkog problema. Zato je veoma u bitno razmotriti analizu koja se
planira koristiti u istraživanju. Npr. način na koji prikupljamo informacije o ispitanikovim
godinama (pogledaj primjer u koraku 1) odredit će koju statističku analizu smo u mogućnosti
koristiti. Ako dadnemo ispitanicima na izbor jednu od dvije ponuđene opcije (ispod 35/ iznad
35 godina) izbor statističke analize bit će ograničen jer imamo samo dvije moguće vrijednosti
za varijablu dob. Ako, s druge strane, pitamo ispitanike za njihovu dob u godinama, izbor se
širi zato što imamo skorove koji variraju u širokom rasponu, od 18 do 80+. U tom slučaju
možemo suziti raspon dobi u manje kategorije za neke analize (ANOVA), ali imamo i cijeli
raspon skorovo za neke druge analize (npr. korelacija). Ako se primjenjuje upitnik ili anketa u
studiji, potrebno je vratiti se na iteme i codebook za pronalazak svakog pojedinačnog pitanja
(npr. dob) i skale totalnih skorova (npr. optimizam) koja će se koristiti u analizi. Potrebno je
identifikovati svaku varijablu, način na koji je mjerena, razmotriti koliko opcija odgovora
postoji, kao i mogući raspon skorova.
Ako studija uključuje eksperiment, potrebno je provjeriti kako je svaka nezavisna i zavisna
varijabla izmjerena. Da li se razultati na varijablama sastoje od broja tačnih odgovora, ocjene
posmatrača nekog specifičnog ponašanja, ili dužine vremena koju ispitanik provede
obavljajući određenu aktivnost? Kakva god priroda studije bila, bitno je znati kako je svaka
od varijabli izmjerena!

95
SPSS PRIRUČNIK

Korak 3: Identifikacija prirode svake varijable i mjernih skala


U trećem koraku potrebno je odrediti zavisne i nezavisne varijable. Ovu informaciju ne
dobivamo od samih prikupljenih podataka, već iz poznavanja područja istraživačke teme,
relevantnih teorija, i prethodnih studija. Osnovno je imati predstavu o vezi među varijablama:
koja vrši utjecaj (nezavisna), a koja je pod utjecajem (zavisna). U nekim analizama nije
neophodno da se zna koja je nezavisna, a koja zavisna (npr. korelacija). Za druge analize je to
neophodno, npr. ANOVA. Crtanje dijagrama ili modela povezanosti varijabli je često od
koristi (vidi korak 4).

Bitno je također znati i nivo mjerenja svako varijable. Različite statističke analize su potrebne
za kategorijalne i kontinuirane, pa je jako važno znati koje su varijable u pitanju. Da li su
varijable:
 Kategorijalne ( naziva se još i nominalni nivo ili skala, npr. spol- muškarci i žene)
 Ordinalne (rang: prvi, drugi, treći)
 Kontinuirane (intervalna skala ili nivo, npr. dob u godinama, ili rezultat na skali
optimizma)

Postoje načini za promjenu nivoa mjerenja određene varijable. Možemo preinačiti odgovore
kontinuirane varijable u manje brojčane kategorije (vidi poglavlje 8). Npr. dob možemo suziti
na manje kategorije (npr. ispod 35/preko 35). To može biti korisno kada želimo provesti
ANOVA-u ili kada kontinuirane varijable ne ispunjavaju pretpostavke za neke analize
(npr.asimetrična distribucija). Pri sumiranju podataka može doći do propusta, čak i do gubitka
informacija. Potrebno je pažljivo izvagati prednosti i nedostatke!

Za kontinuiranu varijablu potrebno je poznavati distribuciju rezultata (da li je normalna ili


asimetrična), kakav je raspon rezultata? (Detaljnije u poglavlju 6).
Ako varijabla obuhvata kategorije potrebno je utvrditi koliko ljudi spada u svaku kategoriju
(da li su izjednačene ili neujednačene). Da li je možda neka od kategorija prazna? Sve te
informacije o varijablama koristit će kasnije u izboru statističke analize.

96
SPSS PRIRUČNIK

Korak 4: Dijagram za istraživačko pitanje


Lakše je i jasnije sažeti poentu studije u dijagram. Ideja je predstaviti informacije prikupljene
u koraku 1 i 2 u jednostavnom formatu koji će pomoći u izboru prave statističke analie. Jedno
od ključnih pitanja jeste: Da li sam zainteresiran za povezanost između dvije varijable ili za
poređenje dvije grupe ili subjekta? Sažimanje informacija i crtanje dijagrama za svako pitanje
može ovo razjasniti. Npr.

Pitanje 1: Postoji li veza između dobi i nivoa optimizma?

Varijable:

 Dob- kontinuirana: dob u godinama 18-80+


 Optimizam- kontinuirana: rezultat na skali optimizma, u rasponu od 6-30.

Dijagram možemo ilustrirati ovako:

Dob Optimizam

Pitanje 2: Da li su muškarci optimističniji od žena?

Varijable:

 Spol: nezavisna, kategorijalna (dvije grupe): muškarci i žene


 Optimizam- kontinuirana: rezultat na skali optimizma, u rasponu od 6-30.

Dijagram:
Muškarci

Spol Optimizam

Žene

Pitanje 3: Da li je efekat dobi na optimizam različit kod žena i kod muškaraca?

Dob možemo podijeliti na kategorije.


Varijable:

 Spol: nezavisna, kategorijalna (dvije grupe): muškarci i žene


 Dob: kategorijalna, nezavisna (3 grupe): ispod 30, 31-49, preko 50

97
SPSS PRIRUČNIK

 Optimizam- kontinuirana: rezultat na skali optimizma, u rasponu od 6-30

To možemo ilustrirati pomoću matrice:

Dob
Ispod Preko
30 31-49 50
Spol

M
Optimizam
Ž

Pitanje 4: Koliko varijance zadovoljstva životom može biti objašnjeno faktorima ličnosti
(samopoštovanjem, optimizmom, percipirana kontrole)?

Varijable:

 Samopoštovanje- nezavisna, kontinuirana


 Optimizam- nezavisna, kontinuirana
 Percipirana kontrola- nezavisna kontinuirana
 Zadovoljstvo životom- zavisna, kontinuirana

Samopoštovanje

Optimizam Zadovoljstvo životom

Percipirana kontrola

Korak 5: Odluka o parametrijskim ili neparametrijskim statističkim tehnikama


Parametrijska statistika je snažnija, ali ograničenija, npr. preduslov za korištenje
parametrijskih statističkih tehnika je normalnost distribucije populacije iz koje izvlačimo
uzorak. Svaka parametrijska tehnika (t-test, ANOVA, Pearsonova korelacija) ima i druge
dodatne uslove. Bitno je provjeriti ih PRIJE provođenja analize. Specifični uslovi za svaku
tehniku izlistani su u ostalim poglavljima ove knjige. Šta ako ne uspijem zadovoljiti uslove
statističke tehnike koju želim koristiti? Nažalost, u društvenim naučnim istraživanjima to je
čest slučaj. Mnoge osobine i atributi koje želimo mjeriti nisu normalno distribuirani. Neke su
izrazito pozitivno asimetrične sa padom rezultata i uskim krajem (npr. depresija); druge su
negativno asimetrične tako da je većina rezultata najviša na kraju distribucije (npr.

98
SPSS PRIRUČNIK

samopoštovanje). Ako nisu zadovoljeni uslovi statističke metode koja se želi koristiti postoje
opcije.

Opcija 1:
Može se koristiti parametrijska statistika i nadati se da neće ozbiljno narušiti vrijednost i
važnost rezultata ili pronalazaka. Statističari tolerišu manje prekršaje, osobito ako je uzorak
odgovarajuće veličine. Ako se odluči ići dalje sa analizom, potrebno je to opravdati u
raspravi, potkrijepiti argumentima, prijašnjim istraživanjima, itd.
Provjeri istraživanja iz područja teme kojom se baviš, naročito ona u kojima je korištena ista
skala. Da li su oni pomenuli slične probleme? Ako jesu, šta su ti autori uradili?

Opcija 2:
Moguće je manipulirati podacima, tako da ih se prilagodi uslovima, npr. normalnosti
distribucije. S tim u vezi, moguće je transformirati varijable ako nisu normalno distribuirane.
Postoje neslaganja oko ovog pristupa, stoga je potrebno to činiti opravdano.

Opcija 3:
Treća alternativa je korištenje neparametrijskih tehnika. Za većinu parametrijskih tehnika
postoje odgovarajuće neparametrijske alternative. Oni također zahtijevaju ispunjavanje
određenih uslova, ali su manje strogi. Ove alternative (npr. Kruskal-Wallis Test, Man-
Whitney U Test, Hi-kvadrat) nisu tako snažne, tj. manje su osjetljive na otkrivanje
povezanosti među varijablama, ili razlika među grupama.

Korak 6: Donošenje konačne odluke


Onda kada se skupe sve potrebne informacije vezane za istraživačko pitanje, odrede nivoi
mjerenja za svaku varijablu i karakteristike skupa podataka kojim se raspolaže , konačno je
moguće sagledati opcije. U tekstu ispod, sažete su glavni elementi neke od glavnih statističkih
pristupa s kojima se susreće. Pređi listu, pronađi primjer vrste istraživačkog pitanja koje želiš
ispitivati i provjeri da li imaš sve potrebne podatke. Razmotri da li postoje drugi načini da se
pitanje postavi i koriste različite statističke analize. Traži dodatne informacije o izabranim
tehnikama kako bi bio siguran da poznaješ osnovne principe i pretpostavke. Dobro je koristiti
više izvora za ovaj proces: različiti autori imaju različita mišljenja. Potrebno je poznavati
različita sporna pitanja i probleme (ponekad je potrebno opravdati korištenje određene

99
SPSS PRIRUČNIK

statističke analize), stoga izuči literaturu i budi siguran da dobro poznaješ materiju o kojoj se
radi.

100
IV DIO
STATISTIČKI POSTUPCI ZA
ISTRAŽIVANJE POVEZANOSTI MEĐU
VARIJABLAMA
SPSS PRIRUČNIK

11.
POVEZANOST MEĐU VARIJABLAMA: PRETPOSTAVKE I
PREDUSLOVI

Korelacija se koristi kada želimo izračunamo snagu i smjer povezanosti između dvije
varijable.

4 stvari za koje može biti upotrijebljena korelacija:

1. Parcijalna korelacija – se koristi kada želimo da istražimo vezu između dvije


varijable, statistički kontrolišući treću varijablu. Ova korelacija je korisna kada
sumnjamo da je veza između dvije varijable od interesa pod uticajem
djelovanja treće varijable. Parcijalna korelacija „statistički uklanja“ uticaj
treće varijable, pružajući jasniju sliku stvarne veze između dvije varijable.
2. Multipla regresijska analiza – se koristi za testiranje snage predviđanja seta
varijabli i za procjenu doprinosa svake pojedine varijable.
3. Logistička regresija – se koristi umjesto multiple regresijske analize kada je
zavisna varijabla kategorijalna.
4. Faktorijalna analiza – se koristi kada imamo veliki broj povezanih varijabli i
kada želimo da istražimo unutrašnje strukture ovih varijabli. Korisno je u
smanjivanju velikog broja povezanih varijabli u manje, te za rukovanje većim
brojem dimenzija ili komponenti.

Koeficijent korelacije
Stepen povezanosti izražava se koeficijentom korelacije (r). Vrijednost koeficijenta korelacije
kreće se u granicama od -1, potpuno negativna povezanost (dok jedna varijabla raste, druga
opada), do +1, potpuno pozitivna povezanost (obje varijable su u porastu).

U opisivanju povezanosti koristimo grafičke i numeričke metode. Grafička metoda


podrazumijeva grafički prikaz povezanosti između dvije varijable preko skater – dijagrama
(eng. scatter plot). Vrijednosti jedne varijable nanose se na X osu, a druge na Y osu. Svaki
ispitanik se prikazuje kao tačka u koordinatnom sistemu [uređeni par, (x, y)]. Prediktorska
varijabla nanosi se na apscisu, a kriterijska na ordinatu.

102
SPSS PRIRUČNIK

Skater dijagram omogućava da:


 odredimo smjer povezanosti;
 procjenimo da li je povezanost visoka, umjerena ili niska;
 utvrdimo kakvog je oblika povezanost (linearna, inverzna U, ili neka druga);
 detektiramo ekstremne rezultate.
U skater dijagram unosi se pravac kojeg nazivamo “pravac regresije“ Y na X. On predstavlja
najbolju predikciju Yi za datu vrijednost Xi. Stupanj u kojem se tačke “okupljaju” oko pravca
odražava veličinu povezanosti tj. korelacije između X i Y. Ukoliko se sve tačke nalaze na
pravcu regresije, radi se o perfektnoj povezanosti, tj. maksimalno mogućoj povezanosti.

Faktori koji mogu uticati na korelaciju:


1. Ekstremni rezultat
Ekstremni rezultati mogu imati dramatične efekte na koeficijent korelacije, naročito na malim
uzorcima. U nekim okolnostima ekstremni rezultati mogu da učine vrijednost korelacije
mnogo većom, nego što ona zapravo jest, dok u drugim okolnostima mogu doprinijeti znatno
manjem koeficijentu korelacije. Ekstremni rezultati se pojavljuju najčešće zbog greške
prilikom unosa podataka, neopreznog odgovora ispitanika ili to može ipak biti prava
vrijednost prilično specifičnog pojedinca. Ako se pronađe ekstremni rezultat, potrebno je
provjeriti greške i ispraviti ih ako je prikladno. Također se u obzir može uzeti uklanjanje ili
rekodiranje neodgovarajućih vrijednosti, kako bi se smanjio utjecaj koji te vrijednost imaju na
korelaciju.

2. Smanjeni raspon
Treba biti oprezan u interpretaciji koeficijenta korelacije, naročito kada dolaze iz malih
uzoraka rezultata.
Koeficijent korelacije sa ograničenim rasponom u studiji drugačiji je od koeficijenta
korelacije gdje je čitav niz mogućih rezultata uzorkovan. Kako bi osigurali tačnost i
pouzdanost pokazatelja snage veze između dvije varijable, upotrebljavamo po mogućnosti
širok raspon rezultata za svaku od te dvije varijable.

3. Kauzalnost protiv korelacije


Korelacija osigurava indikaciju da postoji veza između dvije varijable. To međutim ne
ukazuje na to da jedna varijabla uzrokuje drugu varijablu. Korelacija između dvije varijable

103
SPSS PRIRUČNIK

(A i B ) može biti s obzirom na činjenicu da A uzrokuje B, da B uzrokuje A ili da dodatna


varijabla (C) uzrokuje i varijablu A i varijablu B. Mogućnost postojanja treće varijable koja
može uticati na obje varijable treba uvijek uzeti u obzir.

4. Statistička i praktična značajnost


U velikim uzorcima čak i vrlo mala korelacija može preći statističku značajnost, te je zbog
toga značajnost korelacije ograničena. Korisnije se fokusirati na stvarnu veličinu
Pearsonovog koeficijenta i iznos podijeljene varijance između dvije varijable. Da bi se
interpretirala snaga korelacije, također treba uzeti u obzir izvještaj ostalih istraživanja koji su
provedeni u određenom području teme. Ako su ostala istraživanja u tom području, u
mogućnosti predvidjeti samo 9% varijance, onda je vaša studija koja objašnjava 25%
impresivna u poređenju sa tom studijom. Međutim, u ostalim područjima 25% objašnjene
varijance može se činiti malim i irelevantnim.

Koeficijent determinacije

 označava se sa R =
 R je pokazatelj zajedničkih faktora - udjela kod dva obilježja X i Y koja su uključena
u korelacijsku analizu. Npr. r = 0,3² = 0,09 = R ili npr. r = 0.6² = 0,36 = R
 što je korelacija manja npr. ± 0,3, koeficijent determinacije je značajno manji nego
kad je korelacija veća npr. ± 0,6 ( R = 9%, odnosno 36%).

Preduslovi za korištenje:
 Skale mjerenja – za mnoga mjerenja kod korelacije, od skala bi trebale biti korištene
intervalna ili racio skala. Jedini izuzetak je kada imamo dihotomne nezavisne varijable
(samo dvije vrijednosti) i jednu stalnu zavisnu varijablu.
 Mjere na obje varijable – svaki ispitanik mora imati rezultat na obje varijable: X i Y.
 Normalnost – rezultati svake varijable trebaju biti normalno distribuirani. To može
biti provjereno, između ostalog, uvidom u rezultate svake varijable na histogramu.
 Linearnost – veza između dvije varijable treba biti linearna. To znači, kada pogledate
na rezultate u skater dijagramu trebali bi vidjeti ravnu liniju, ne krivulju.
 Homoscedascitet – varijabilitet rezultata za varijablu X treba biti sličan varijabilitetu
vrijednosti varijable Y.

104
SPSS PRIRUČNIK

12.
BIVARIJATNA KORELACIJA

Kao što je objašnjeno u prethodnom poglavlju, korelacija je postupak kojim se određuje


povezanost između dvije varijable, bez poznavanja uzročno-posljedične veze. Korelacijom
saznajemo da li su dvije varijable međusobno povezane, ali ne znamo koja varijabla utječe na
koju i u kojem stepenu. Koeficijent korelacije može biti od -1 do +1. Ukoliko je koeficijent
korelacije 0, korelacije nema. Što je veći koeficijent korelacije, veća je povezanost i obratno.
Parametrijska korelacija se određuje Pearsonovim r koeficijentom korelacije, a
neparametrijska korelacija se određuje Spearmanovim rho koeficijentom.

Procedura za izračunavanje Pearsonovog r-koeficijenta ili Spearmanovog rho-


koeficijenta:

1. Sa gornjeg menu-a odabrati Analyze, nakon toga kliknuti na Correlate, zatim odabrati
Bivariate.
2. Umetnuti dvije varijable u prostor Variables.
3. Ovisno od toga da li je distribucija rezultata normalna (parametrijska statistika) ili nije
(neparametrijska statistika), u prostoru Correlation Coefficients odabrati Pearsonov ili
Spearmanov koeficijent.
4. Kliknuti na Options. Za nedostajuće vrijednosti (vrijednosti koje nedostaju) kliknuti na
Exclude cases pairwise. Unutar Options možete, ako želite, odabrati aritmetičku sredinu i
standardnu devijaciju.
5. Kliknuti na Continue, a zatim na OK.

105
SPSS PRIRUČNIK

Prikaz dobivenog output-a:


Correlations
Correlations

Total PCOISS Total perceived


stress
**
Pearson Correlation 1 -.581

Total PCOISS Sig. (2-tailed) .000

N 430 426
**
Pearson Correlation -.581 1

Total perceived stress Sig. (2-tailed) .000

N 426 433

**. Correlation is significant at the 0.01 level (2-tailed).

Nonparametric Correlations
Correlations

Total PCOISS Total perceived


stress
**
Correlation Coefficient 1.000 -.556

Total PCOISS Sig. (2-tailed) . .000

N 430 426
Spearman's rho **
Correlation Coefficient -.556 1.000

Total perceived stress Sig. (2-tailed) .000 .

N 426 433

**. Correlation is significant at the 0.01 level (2-tailed).

Interpretacija outputa:
Kao što se može primijetiti, iznad outputa na kojem je prikazan Pearsonov r koeficijent
korelacije naznačeno je Correlations, a iznad outputa na kojem je prikazan Spearmanov rho
koeficijent korelacije stoji naslov Nonparametric Correlations, što jasno pokazuje u kojem se
slučaju radi o parametrijskoj, a u kojem o neparametrijskoj statistici.

1. Provjera informacija o uzorku


Prvo što treba provjeriti u tabeli je vrijednost N koja označava broj ispitanika. Da li je
ta vrijednost odgovarajuća? Ako puno podataka nedostaje, treba provjeriti zašto. Da li
je odabrana opcija Exclude cases pairwise? Ukoliko je u missing data opciji izabrano

106
SPSS PRIRUČNIK

Exclude cases listwise, svaki ispitanik za kojeg nedostaje podatak za bilo koju
varijablu, nije uključen u analizu. U ovom primjeru za 426 ispitanika smo imali
podatke za obje skale. Svaki ispitanik za kojeg je nedostajao skor bilo koje od dvije
korištene skale je isključen iz analize.

2. Utvrđivanje smjera povezanosti


Sljedeće što treba provjeriti je smjer povezanosti varijabli, na što upućuje predznak
„+“ ili „-“. Ako je predznak koeficijenta korelacije negativan, to znači da veći skor u
jednoj varijabli odgovara manjem skoru u drugoj varijabli. Varijable su, dakle, u
negativnoj korelaciji. Kada je predznak koeficijenta korelacije pozitivan, varijable se
mijenjaju u istom smjeru. Drugim riječima, veći skor u jednoj varijabli odgovara
većem skoru u drugoj varijabli. U ovom primjeru koeficijenti korelacije (Spearmanov
rho = -.556 i Pearsonov r = -.581) su negativni: Što osoba doživljava veći osjećaj
kontrole, to je količina stresa koju doživljava manja.

3. Utvrđivanje snage povezanosti


Koeficijent korelacija se kreće od -1 do +1. Ako je korelacija između dvije varijable
nulta, ne možemo na osnovu rezultata u jednoj varijabli predvidjeti rezultate u drugoj.
Drugim riječima, da li osoba ima veći ili manji skor na jednoj skali nema nikakve veze
s njenim skorom na drugoj skali. Pojedini teoretičari, poput Cohena, objašnjavaju da je
korelacija mala ako je vrijednost koeficijenta korelacije između .10 i .29, srednja
između .30 i .49 i visoka između .50 i 1.0.
Povezanost od .5 i -.5 je u potpunosti ista, odnosno velika, jer predznak određuje samo
smjer povezanosti, a ne i snagu te povezanosti. U prvom slučaju (ako je korelacija r =
0.5), porastom vrijednosti u jednoj varijabli, raste i vrijednost druge varijable. Drugim
riječima, pozitivna korelacija znači da se varijable mijenjaju u istom smjeru. U
drugom slučaju (ako je korelacija r = -.05) varijable se mijenjaju u suprotnom smjeru:
ako vrijednost jedne varijable raste, vrijednost druge varijable opada.

4. Izračunavanje koeficijenta determinacije


Kvadriranjem vrijednosti koeficijenta korelacije dobiva se koeficijent determinacije, i
ako potom dobiveni koeficijent determinacije pomnožimo sa 100, dobit ćemo broj koji
nam govori koliki postotak varijance obuhvaćaju određene varijable. Npr. Koeficijent

107
SPSS PRIRUČNIK

korelacije iznosi r = .2. Koeficijent determinacije je stoga .2 x .2 = .04. Ako taj broj
pomnožimo sa 100, dobit ćemo postotak varijance koju ove varijable dijele (4%).

5. Procjena značajnosti
Značajnost dobivenog koeficijenta korelacije ovisi u velikoj mjeri od veličine uzorka.
Ako je u istraživanju korišten mali uzorak (npr. N = 25), čak i visoke korelacije mogu
biti neznačajne na nivou 5%, dok kod velikih uzoraka od nekoliko stotina i veoma
niska povezanost između varijabli može biti statistički značajna.

Prezentiranje rezultata korelacije:


Ispitali smo Pearsonovim r koeficijentom i Spearmanovim rho koeficijentom korelacije da li
postoji povezanost između doživljenog osjećaja kontrole i količine doživljenog stresa. Iz
outputa se jasno vidi da je povezanost između ove dvije varijable negativna i statistički
značajna. Rezultati korelacije se mogu prikazati na ovaj način (na način kao što je prikazano u
dolje navedenoj tabeli):

Iz prikaza rezultata jasno se vidi da su sve korelacije statistički značajne na razini značajnosti
od 1% (jer se pored rezultata nalaze dvije zvjezdice). Također, vidljivo je da su sve korelacije
negativne što je znak da se mijenjaju u suprotnim smjerovima.

108
SPSS PRIRUČNIK

12.1. RAČUNANJE KORELACIJE IZMEĐU GRUPA VARIJABLI

Kao što je moguće izračunati povezanost između dvije varijable, tako je moguće izračunati i
povezanosti između grupa varijabli:

Procedura:
1. Sa gornjeg menija klikni na Analyze, nakon toga klikni na Correlate, zatim odaberi
Bivariate.
2. Varijable koje nas zanimaju premjesti u okvir Variables. Pri tome, prvo premjesti cijelu
prvu grupu varijabli (tposaff, tnegaff, tlifesat), a zatim drugu (tmast, tpcoiss).
3. Prva grupa varijabli će se pojaviti u redovima, a druga grupa u kolonama.
4. Prilikom premještanja varijabli u okvir Variables, obrati pažnju na to da u prvoj grupi
varijabli treba da se nalazi više varijabli nego u drugoj. Prebacivanje grupe sa više
varijabli prvo će spriječiti da tabela u output-u bude previše široka.
5. Klikni na Paste. To će otvoriti Syntax Editor.
6. Postavi kursor između prve grupe varijabli (tposaff, tnegaff, tlifesat) i druge grupe
varijabli (tmast, tpcoiss). Ovim ćeš načinom izračunati korelaciju između tmast i tpcoiss i
svake varijable iz druge grupe pojedinačno (tlifesat, tnegaff, tposaff).
7. Kako bi novi Syntax bio pokrenut, označi tekst od CORRELATIONS do tačke, odnosno
do /MISSING=PAIRWISE. Obrati pažnju na to da je i tačka označena!
8. S označenim tekstom, klikni na Run Selection u izborniku (>) ili sa gornjeg menija klikni
na Run, te odaberi Selection.

109
SPSS PRIRUČNIK

Prikaz dobivenog outputa:

Correlations

Total Mastery Total PCOISS


** **
Pearson Correlation .444 .373

Total life satisfaction Sig. (2-tailed) .000 .000

N 436 429
** **
Pearson Correlation -.464 -.484
Total negative affect Sig. (2-tailed) .000 .000
N 435 428
** **
Pearson Correlation .432 .456

Total positive affect Sig. (2-tailed) .000 .000

N 436 429

**. Correlation is significant at the 0.01 level (2-tailed).

12.2. UPOREĐIVANJE KOEFICIJENATA KORELACIJE IZMEĐU DVIJE


GRUPE

Ponekad želimo usporediti koeficijente korelacije za dvije grupeodvojeno. Npr. želimo


izračunati povezanost između optimizma i negativnog afekta kod muškaraca s jedne, i žena s
druge strane. Jedan od načina na koji to možeš uraditi je prikazan ispod.

Procedura za upoređivanje koeficijenata korelacije između dvije grupe varijabli:


1. korak:
1. Otvori Data Editor prozor na ekranu.
2. Sa menu-a na vrhu odaberi Data, a zatim klikni na Split File.
3. Klikni na Compare Groups.
4. Premjesti varijablu na osnovu koje kategoriziraš ispitanike (npr. spol) u okvir Groups
based on. Klikni na OK.
5. Ova procedura će podijeliti bazu podataka po spolu i ponoviti sve slijedeće statističke
analize koje slijede za dobivene dvije grupe (muškarci i žene) odvojeno.

2. korak:
1. Zatraži od SPSS-a da izračuna korelaciju kao što je prethodno objašnjeno, za vaše dvije
varijable od interesa (npr. Total Optimism i Total negative affect).

110
SPSS PRIRUČNIK

ZAPAMTI: Nakon što izvršiš analizu, vrlo je važno da isključiš opciju Split File jer će se i sve
naknadne analize vršiti odvojene za dvije grupe podataka ukoliko se to ne učini.

Prikaz dobivenog outputa:

Correlations

Sex Total Optimism Total negative


affect
**
Pearson Correlation 1 -.220

Total Optimism Sig. (2-tailed) .003

N 184 184
MALES **
Pearson Correlation -.220 1

Total negative affect Sig. (2-tailed) .003

N 184 185
**
Pearson Correlation 1 -.394

Total Optimism Sig. (2-tailed) .000

N 251 250
FEMALES **
Pearson Correlation -.394 1

Total negative affect Sig. (2-tailed) .000

N 250 250

**. Correlation is significant at the 0.01 level (2-tailed).

Interpretacija outputa:
Iz output-a možemo vidjeti da je korelacija između ukupnih skorova dobivenih na skalama
koje mjere optimizam i negativni afekt za muškarce r = -.22, a za žene je nešto veća, odnosno
r = -.394.

Zadaci za vježbu:

Baza podataka sleep3ED.sav. Vidi Prilog za detalje o bazi podataka.

1. Provjerite snagu korelacije između rezultata na skalama Sleepines i Associated


Sensations (totSAS) i Epworth Sleepiness Scale (ess).
2. Preko komande Syntax procijenite korelaciju između Epworth Sleepiness Scale (ess)
i svakog itema koji čini skalu Sleepiness i Associated Sensations: fatigue, lethargy,
tired, sleepy, energy (zamor, letargija, umor, pospanost, energija).

111
SPSS PRIRUČNIK

13.
PARCIJALNA KORELACIJA

Pomoću ovog dijagrama je najjednostavnije objasniti parcijalnu korelaciju. Između dvije


varijable može postojati povezanost, ali tako da su i jedna i druga varijabla pod utjecajem
neke treće varijable. Računanjem koeficijenta parcijalne korelacije se oslobađamo doprinosa
treće varijable, tj. držimo ga pod kontrolom.

Procedura za izračunavanje parcijalne korelacije:


1. Sa menija na vrhu klikni na Analyze, te na Correlate, pa zatim odaberi Partial.
2. Klikni na dvije varijable koje želiš međusobno korelirati (npr. total PCOISS i total
perceived stress) i prebaci ih u okvir Variables.
3. Potom klikni na varijablu čiji doprinos toj korelaciji želiš kontrolirati (npr. tmarlow, koja
mjeri socijalnu poželjnost) i prebaci je u okvir Controlling for.
4. Klikni na Options.
 U sekciji Missing Values, odaberi Exclude Cases Pairwise.
 U sekciji Statistics, odaberi Zero Order Correlations.
5. Klikni na Continue, zatim na OK.

112
SPSS PRIRUČNIK

Prikaz dobivenog outputa:

Total Total perceived stress Total social


PCOISS desirability

Correlation 1.000 -.581 .295

Significance Correlations
Total PCOISS . .000
(2-tailed)

Df 0 Control Variables 425


a
Correlation -.581 -none- -.228

Total perceived Significance


.000 .000
stress (2-tailed)

Df 424 426

Correlation .295 1.000

Total social Significance


.000 .
desirability (2-tailed)

Df 425 0
Correlation 1.000

Significance
Total PCOISS .
(2-tailed)

Total social Df 0
desirability Correlation -.552 1.000

Total perceived Significance


.000 .
stress (2-tailed)

Df 423 0

a. Cells contain zero-order (Pearson) correlations.

Interpretacija outputa:
U gornjoj polovini tabele je prikazana korelacija između dvije varijable od interesa (tpcoiss i
tpstress), bez kontrole treće varijable (Total social desirability) i ta korelacija iznosi r =-.581.
U drugoj polovini tabele je prikazana korelacija između osjećaja kontrole (tpcoiss) i stresa
(tpstress) uz kontrolu treće varijable, i u ovom slučaju nova parcijalna korelacija iznosi r = -
.552. Uporedbom ova dva koeficijenta korelacije (r = -.581 i r = -.552) donosi se zaključak o
tome da li je socijalno poželjno odgovaranje doprinijelo korelaciji između osjećaja kontrole
nad unutrašnjim stanjima (tpcoiss) i doživljenog stresa (tpstress). U ovom slučaju
kontroliranje socijalno poželjnog odgovaranja je dovelo samo do malog pada u koeficijentu
korelacije, što upućuje na to da povezanost između osjećaja kontrole i stresa nije bila pod
utjecajem davanja socijalno poželjnih odgovora.

113
SPSS PRIRUČNIK

Zadaci za vježbu:

Baza podataka: sleep3ED.sav. Vidi Prilog za detalje o bazi podataka.


1. Provjerite snagu korelacije između rezultata na skali Sleepines i Associated Sensations
(totSAS) i utjecaja problema sa spavanjem na opće dobrostanje (impact6), dok
kontrolirate varijablu dob. Uporedite Pearsonovu korelaciju sa koeficijentom
parcijalne korelacije. Da li ima razlike u visini korelacije ako kontrolišete varijablu
dob?

114
SPSS PRIRUČNIK

14.
MULTIPLA REGRESIJSKA ANALIZA

Često se u praksi ne računa korelacija samo između jednog prediktora i kriterija, već se
pojavljuje više prediktora. Na primjer, ako prilikom selekcije na radno mjesto koristimo test
inteligencije i dobijemo da korelacija između rezultata na testu inteligencije i uspjeha na
radnom mjestu iznosi 0.4. Ako tu vrijednost kvadriramo i pomnožimo sa 100, dobit ćemo
postotak varijance u varijabli uspjeh na radnom mjestu, koji se može objasniti pomoću
inteligencije. Tada inteligencija uposlenika objašnjava 16% (0.42 = 0.16, odnosno 16%)
njegovog uspjeha na poslu. A šta je s ostalih 84%? Ta vrijednost predstavlja postotak
varijance uspjeha na poslu koji nije objašnjen. Kako bi objasnili što veću proporciju varijance
u uspjehu na poslu, koristit ćemo pored testa inteligencije i druge testove (za koje
pretpostavljamo da su povezani s uspjehom na poslu) i pokušati pronaći one varijable koje će
nam pomoći u selekciji radnika, odnosno odabiru testova i osobina koje su značajne za tu
selekciju. U tu svrhu će psiholog, pored testa inteligencije, upotrijebiti npr. i test
psihomotorike i izračunati korelaciju između rezultata u ta dva testa i uspjeha na poslu.
Ukoliko je rezultat na testu iz psihomotorike povezan sa uspjehom u poslu i ta korelacija
iznosi r = 0.35, proporcija objašnjene varijance će biti veća, odnosno selekcija na radno
mjesto uspješnija. Pritome je važna i korelacija između samih prediktora (inteligencija i
psihomotorika). Ukoliko je ona 0, postotak objašnjene varijance je 0.16 + 0.12 = 0.28,
odnosno 28%. Proporcija objašnjene varijance odgovara kvadriranom koeficijentu multiple
korelacije i označava se sa R2. Međutim, u stvarnosti često dobijemo korelaciju između
prediktora koja je različita od 0. Što je korelacija između tih prediktora veća, odnosno
preklapanje između njih, to je proporcija objašnjene varijance u kriteriju manja. Dobar
regresijski model je, dakle, onaj kod kojeg je korelacija između prediktora (nezavisnih
varijabli) mala, a njihova korelacija s kriterijem visoka. Jedan od iznimno važnih problema
koji se pojavljuju kod multiple regresijske analize je određivanje pojedinačnihdoprinosa
prediktora u ukupnoj multiploj korelaciji. U prethodnom slučaju, pošto je korelacija između
prediktora 0, jedinstveni doprinos varijabli objašnjenju varijance u kriteriju je jednak
kvadriranoj korelaciji prediktora sa kriterijem (Za inteligenciju to je 0.16, za psihomotoriku
0.12). Tada nema preklapanja kružnica X1 i X2 u Vennovom dijagramu:

115
SPSS PRIRUČNIK

Y 0.72

0.12
X1 0.16
X2

Kružnice X1 i X2 predstavljaju prediktore, a Y kriterij. Mjesto preklapanja kružnice


X1(inteligencija) i Y je proporcija varijance u Y koju jedinstveno objašnjava X1. Isto vrijedi i
za drugi prediktor, a dio neobjašnjene varijance je 1-0.28 = 0.72. Kada je ta korelacija između
prediktora veća od 0 odnos između varijabli u Vennovu dijagamu možemo prikazati na
sljedeći način:

Suma površina a, b, i c predstavljaju varijancu kriterija koja je objašnjena prediktorima (=R2),


a površina je dio neobjašnjene varijance u kriteriju (tzv. Rezidualna varijanca). Mjesto
preklapanja između kružnica X1 i X2 ( =odnosno površina c) je količina varijance u Y koja je
objašnjena i jednim i drugim prediktorom. Jedinstveni doprinos prediktora X1 u objašnjenju
varijance u kriteriju je proporcija a, a površina b je onaj dio varijance koji jedinstveno
objašnjava prediktor X2. Ta proporcija (a ili b) odgovara kvadratnom korijenu iz
semiparcijalnog koeficijenta korelacije. Semiparcijalni koeficijent korelacije je, dakle,
varijanca kriterija koju jedinstveno objašnjava pojedinačni prediktor. Ta se korelacija naziva
semiparcijalna, jer su učinci jednog prediktora odstranjeni iz drugog, ali ne i iz kriterija. Što je
korelacija između prediktora veća, to je mjesto preklapanja kružnica X1 i X2 veće, a
proporcije a i b (jedinstveni doprinosi prediktora) manji. Treba razlikovati parcijalni od

116
SPSS PRIRUČNIK

semiparcijalnog koeficijenta korelacije. Kvadrirani parcijalni koeficijent korelacije upućuje na


udio varijance objašnjiv na temelju pojedinog prediktora onog dijela zavisne varijable koji
nije povezan s drugim prediktorom. Kod parcijalnog koeficijenta korelacije parcijalizira se
efekat drugog prediktora i na kriterij i na drugi prediktor, dok se kod semiparcijalne korelacije
parcijalizira samo efekat drugog prediktora na prvi. Na udio prediktorske varijable u prognozi
rezultata kriterijske varijable upućuje standardizirani regresijski koeficijent, odnosno beta
ponder.

Postoji nekoliko vrsta multiple regresijske analize u zavisnosti od istraživačkih pitanja na koja
želiš odgovoriti: Standardna ili simultana, Hijerarhijska ili sekvencijalna i Postepena. U ovom
priručniku ćemo se samo osvrnuti na Standardnu multiplu regresiju, odnosno na njenu
proceduru za izvršavanje u SPSS-u i odgovarajuću interpretaciju.Postoji nekoliko
pretpostavki, odnosno preduslova koji moraju biti ispunjeni kako bi upotreba multiple
regresijske analize bila moguća. Nije preporučljivo koristiti ovu statističku analizu ukoliko je
uzorak koji je korišten u istraživanju mali, te je i distribucija skorova asimetrična. Kod malih
uzoraka je problem u generalizaciji, jer se rezultat koji je dobiven na takvim uzorcima ne
može ponoviti na drugim uzorcima. Pitanje potrebne veličine uzorka je diskutabilno. Stevens
(1996) preporučuje oko 15 ispitanika po prediktoru kako bi se dobio pouzdan rezultat.
Tabachnick i Fidell (2007) nude formulu za računanje potrebne veličine uzorka, koja uzima u
obzir broj nezavisnih varijabli, odnosno prediktora: N > 50 + 8m; gdje je m = broj prediktora.
Ako je broj prediktora npr. četiri, tada je veličina uzorka 50+32 = 82.Pored pitanja veličine
uzorka, također postoji i problem multikolinearnosti i singularnosti. Multikolinearnost znači,
odnosno postoji kada je korelacija između prediktora snažna. Za multiplu regresijsku analizu
je to bolje što je korelacija između nezavisnih varijabli manja, jer je cilj objasniti što veću
proporciju varijance kriterija. U suprotnom, odnosno u slučaju kada prediktori visoko
koreliraju, proporcija objašnjene varijance u kriteriju pomoću prediktora je mala. Singularnost
postoji kada je jedna nezavisna varijabla ustvari kombinacija drugih nezavisnih varijabli, što
opet vodi ka lošem regresijskom modelu iz istog, prethodno navedenog razloga. U tom
slučaju ta nezavisna varijabla je potpuno nepotrebna. Prije korištenja multiple regresijske
analize treba, dakle, provjeriti da li postoji multikolinearnost ili singularnost. Veoma visoki ili
niski skorovi također predstavljaju problem zato što je multipla regresijska analiza osjetljiva
na ekstremne vrijednosti. Prema tome, treba provjeriti da li postoje ekstremne vrijednosti kod
nezavisnih varijabli, kao i kod zavisne. Te vrijednosti, ukoliko postoje, mogu biti ili obrisane
ili zamijenjene nekom drugom vrijednošću (npr. Aritmetičkom sredinom). Pored toga,

117
SPSS PRIRUČNIK

potrebno je da podaci u svim varijablama (prediktorima i kriteriju) budu normalno


distribuirani te da je odnos između varijabli linearan, tj. da promjeni (porastu ili smanjenju)
odgovara linearna promjena u drugim varijablama (povećanje ili smanjenje).

U svrhu ilustracije korištenja multiple regresijske analize koristit ćemo survey3ED.sav.


Primjer: Istraživanje je provedeno u svrhu identifikacije faktora koji utječu na psihološku
dobrobit i prilagodbu ispitanika. Istražit ćemo kako utječe osobna percepcija kontrole na
stupanj doživljenog stresa. Literatura na ovu temu upućuje na to da za osobe koje osjećaju da
imaju kontrolu nad svojim životom, manje je vjerovatno da doživljavaju stres. Korištene su
dvije mjere nezavisne varijable (kontrola): Mastery scale i Perceived Control of Internal
States Scale (PCOISS).Mastery skala mjeri stupanj u kojem osobe osjećaju da imaju kontrolu
nad životnim događajima, dok PCOISS mjeri stupanj u kojem osobe osjećaju da imaju
kontrolu nad svojim unutrašnjim stanjem (odnosno nad emocijama, mislima i fizičkim
reakcijama). U ovom primjeru, nastojimo utvrditi u kojem stupnju rezultati na Mastery i
PCOISS skalama mogu predvidjeti rezultat na nekoj mjeri stresa. Varijable korištene u
istraživanju su prezentirane u nastavku.

Varijable:
1. Total perceived stress (tpstress) - Ukupni skorovi skale „Doživljaj stresa“, pri čemu veći
skor upućuje na veći nivo stresa.
2. Total Perceived Control of Interal States scale (tpcoiss) – Ukupni skorovi skale koja
mjeri stupanj u kojem osobe imaju osjećaj da imaju kontrolu nad svojim unutrašnjim
stanjem. Veći skor odgovara većem osjećaju kontrole.
3. Total Mastery (tmast) - Totalni skorovi skale koja mjeri stupanj u kojem osobe osjećaju
da imaju kontrolu nad životnim događajima i okolnostima.
4. Total Social Desirability (tmarlow): Ukupni skorovi Marlow-Crowne Social Desirability
skale, koja mjeri stupanj u kojem osobe pokušavaju, odnosno nastoje, da se prikažu u
najboljem svjetlu.
5. Age – Dob (u godinama).

Dakle, za korištenje ovog statističkog postupka potrebno je da posjedujemo jednu


kontinuiranu zavisnu varijablu (u ovom slučaju to je tpstress) i dvije ili više kontinuiranih
nezavisnih varijabli (tpmast, tpcoiss). Pored kontinuiranih nezavisnih varijabli mogu se
koristiti i dihotomne varijable, odnosno varijable koje mogu poprimiti dvije vrijednosti, kao

118
SPSS PRIRUČNIK

npr. Spol. Nakon izvršene multiple regresijske analize dobivamo informacije o količini
varijance u zavisnoj varijabli koja može biti objašnjena pomoću određenih nezavisnih
varijabli. Također nam daje informaciju o relativnom doprinosu svake nezavisne varijable
zasebno objašnjenju varijance. Pomoću multiple regresijske analize, konkretno u ovom
primjeru, možemo, dakle, odgovoriti na sljedeća istraživačka pitanja:
1. U kojoj mjeri se na osnovu korištenih mjera kontrole (Mastery i PCOISS) može predvidjeti
doživljaj stresa? Koliki postotak varijance doživljenog stresa može biti objašnjen skorovima
na te dvije skale koje mjere osjećaj kontrole (Mastery i PCOISS)?
2. Koji je najbolji prediktor stresa? Osjećaj kontrole nad životnim događajima (Mastery) ili
osjećaj kontrole nad mislima, emocijama itd. (PCOISS)?
3. Ako uklonimo mogući utjecaj dobi i davanje socijalno poželjnih odgovora na količinu
doživljenog stresa, da li će prediktori (mjere kontrole) i dalje moći objasniti značajan dio
varijance kriterija?

U ovom primjeru, koristeći standardnu multiplu regresiju, odgovorit ćemo na sljedeća dva
pitanja:

1. Pitanje: U kojoj mjeri se na osnovu korištenih mjera kontrole (mastery i PCOISS)


može predvidjeti percipirani stres?Koliki postotak varijance doživljenog stresa može
biti objašnjen skorovima na te dvije skale koje mjere osjećaj kontrole (Mastery i
PCOISS)?

2. Pitanje: Koji je najbolji prediktor percipiranog stresa? Osjećaj kontrole nad životnim
događajima (Mastery) ili osjećaj kontrole nad mislima, emocijama itd. (PCOISS)?

Upotreba standardne multiple regresije podrazumijeva uključivanje svih nezavisnih varijabli


istodobno, a krajnji rezultat pokazuje koji postotak varijance u kriteriju (nivo stresa) ovaj skup
varijabli može objasniti, te koja od varijabli najviše doprinosi tome. Ukoliko želiš da slijediš
upute, otvori bazu survey3ED.sav. Prije nego počneš, sa gornjeg menija klikni na Edit,
zatim na Options pa odaberi No scientific notation for small numbers in tables.

119
SPSS PRIRUČNIK

Procedura za Standardnu multiplu regresiju:

1. Sa gornjeg menu-a klikni na Analyze, zatim na Regression i odaberi Linear.


2. Označi kontinuiranu zavisnu varijablu (u ovom slučaju: total perceived stress, odnosno
tpstress) i prebaci je u Dependent polje.
3. Označi nezavisne varijable (Total mastery – tmast; total PCOISS – tpcoiss) i prebaci ih u
polje Independent.
4. Kod Method, odaberi Enter (što daje Standardnu multiplu regresiju).
5. Klikni na Statistics.
Odaberi Estimates, Confidence Intervals, Model fit, Descriptives, Part and partial
correlations i Colinearity diagnostics.
Kod Residuals, odaberi Casewise diagnostics i Outliers outside 3 standard deviations.
Klikni na Continue.
6. Klikni na Options.
Ispod Missing values klikni na Exclude cases pairwise. Klikni na Continue.
7. Klikni na Plots.
Označi 'ZRESID, te klikni na stijelicu kako bi ga prebacio u polje Y.
Označi 'ZPRED, te klikni na strijelicu kako bi se pojavilo u polju X.
Ispod naslova Standardized Residual Plots odaberi Normal probability plot. Klikni
na Continue.
8. Klikni na Save.
U polju pod nazivom Distances odaberi Mahalanobis i Cook's.
Klikni na Continue, te zatim OK.

Prikaz dobivenog outputa:

Descriptive Statistics
Mean Std. N
Deviation
Total perceived
26.73 5.848 433
stress
Total PCOISS 60.63 11.985 430
Total Mastery 21.76 3.970 436

120
SPSS PRIRUČNIK

Correlations
Total Total Total
perceived PCOISS Mastery
stress
Total perceived
1.000 -.581 -.612
Pearson stress
Correlation Total PCOISS -.581 1.000 .521
Total Mastery -.612 .521 1.000
Total perceived
. .000 .000
stress
Sig. (1-tailed)
Total PCOISS .000 . .000
Total Mastery .000 .000 .
Total perceived
433 426 433
stress
N
Total PCOISS 426 430 429
Total Mastery 433 429 436

Variables Entered/Removeda
Mode Variables Variables Method
l Entered Removed
Total
Mastery,
1 . Enter
Total
PCOISSb
a. Dependent Variable: Total perceived
stress
b. All requested variables entered.

Model Summaryb
Mode R R Adjusted R Std. Error of
l Square Square the
Estimate
a
1 .684 .468 .466 4.274
a. Predictors: (Constant), Total Mastery, Total
PCOISS
b. Dependent Variable: Total perceived stress

121
SPSS PRIRUČNIK

ANOVAa
Model Sum of Df Mean F Sig.
Squares Square
Regressio
6806.728 2 3403.364 186.341 .000b
n
1
Residual 7725.756 423 18.264
Total 14532.484 425
a. Dependent Variable: Total perceived stress
b. Predictors: (Constant), Total Mastery, Total PCOIS

a
Coefficients

Model Unstandardized Standardized T Sig. 95.0% Correlations Collinearity


Coefficients Coefficients Confidence Statistics
Interval for B

B Std. Beta Low Upper Zero- Partial Part Tolerance VIF


Error er Bound order
Boun
d

(Constant 48.4
50.971 1.273 40.03 .00 53.474
) 69

Total
-.175 .020 -.360 -8.66 .00 -.215 -.136 -.581 -.388 -.30 .729 1.372
PCOISS

Total
-.625 .061 -.424 -10.2 .00 -.745 -.505 -.612 -.445 -.36 .729 1.372
Mastery

a. Dependent Variable: Total perceived stress

Casewise Diagnosticsa

Case Std. Total Predicted Residua


Number Residual
perceived Value l
stress
55 -3.475 14 28.85 -14.849
a. Dependent Variable: Total perceived stress

122
SPSS PRIRUČNIK

Residuals Statisticsa
Minimu Maximu Mean Std. N
m m Deviation
Predicted Value 18.03 41.31 26.74 4.001 429
Std. Predicted Value -2.174 3.644 .002 1.000 429
Standard Error of
.207 .800 .341 .111 429
Predicted Value
Adjusted Predicted
18.04 41.39 26.75 4.009 426
Value
Residual -14.849 12.612 -.002 4.268 426
Std. Residual -3.475 2.951 .000 .999 426
Stud. Residual -3.514 2.969 .000 1.003 426
Deleted Residual -15.190 12.765 -.001 4.306 426
Stud. Deleted
-3.562 2.997 -.001 1.006 426
Residual
Mahal. Distance .004 13.897 1.993 2.234 429
Cook's Distance .000 .094 .003 .008 426
Centered Leverage
.000 .033 .005 .005 429
Value
a. Dependent Variable: Total perceived stress

Collinearity Diagnosticsa
Mode Dimensio Eigenvalu Condition Variance Proportions
l n e Index (Constan Total Total
t) PCOISS Mastery
1 2.965 1.000 .00 .00 .00
1 2 .019 12.502 .62 .80 .01
3 .016 13.780 .38 .20 .99
a. Dependent Variable: Total perceived stress

123
SPSS PRIRUČNIK

124
SPSS PRIRUČNIK

Interpretacija outputa:
U interpretaciji ćemo se samo osvrnuti na evaluciju modela i na evaluaciju nezavisnih
varijabli pojedinačno, iako u outputu dobivamo informacije i o tome da li su određene
pretpostavke korištenja multiple regresijske analize (ranije spomenute), poput
multikolinearnosti, ispunjeni. U tabeli pod nazivom Model Summary box vrijednost R-
square (= vrijednost kvadriranog koeficijenta multiple korelacije) nam govori o tome koliko
je varijance u kriteriju (stress) objašnjeno modelom (PCOISS, Mastery). Vrijednost
kvadriranog koeficijenta multiple korelacije je u ovom slučaju 0.468, što znači da je 46, 8%
varijance u kriteriju objašnjeno pomoću ova dva testa (Koeficijent multiple korelacije
pomnožen sa 100 daje postotak objašnjene varijance – 0.486x100=46.8%). Ako je uzorak koji
je korišten u istraživanju mali, vrijednost R-square predstavlja precjenu stvarne proporcije
objašnjene varijance, te se u tom slučaju navodi korigovana vrijednost koja je također
prikazana u tabeli pod nazivom Adjusted R-square. Tabela pod nazivom ANOVA, nam daje
informaciju o statističkoj značajnosti našeg modela, koji u ovom primjeru jest statistički
značajan (Sig=.000; p<0.05).
Kako bi odgovorili na pitanje koliko je svaka od nezavisnih varijabli pridonijela objašnjenju
varijance kriterija, pogledat ćemo tabelu pod nazivom Coefficients. Usporedbu prediktora
nam omogućuje standardizirani regresijski koeficijent, odnosno beta-ponder. U tabeli Beta,
koja se nalazi ispod Standardized Coefficients, dati su nam beta-ponderi za prediktore
Mastery (-.0424) i PCOISS (-.360). Za tu usporedbu se koriste samo stanardizirani
koeficijenti, jer to znači da su transformirani na istu skalu kako bi se mogli porediti. Prema
tome, nema potrebe da se posmatraju vrijednosti Beta, navedene ispod Unstandardised
Coefficients. Kod beta-pondera, bitno je samo provjeriti koji standardizirani regresijski
koeficijent je najveći, pritom ne obraćajući pažnju na predznake, već samo na vrijednost. U
našem primjeru to je -.0424 (Mastery), što znači da je skala koja mjeri osjećaj kontrole nad
životnim događajima bolji prediktor za stres nego skala koja mjeri osjećaj kontrole nad
unutrašnjim stanjima.

Takođe, za svaku od nezavisnih varijabli provjerite vrijednost označenu kao Sig. Ona daje
informaciju o tome da li određena varijabla statistčki značajno pridonosi objašnjenju
varijance. To u velikoj mjeri ovisi o preklapanju između nezavisnih varijabli. Ako je
vrijednost Sig > 0.05, ta varijabla ne doprinosi značajno objašnjenju varijance, no u ovom
slučaju i Mastery i PCOISS skala čine jedinstven i statistički značajan doprinos. U stupcu
Part, dati su semiparcijalni koeficijenti korelacije (PCOISS=-.307; Mastery=-.362). Ukoliko

125
SPSS PRIRUČNIK

ih kvadriramo, dobit ćemo proporciju varijance u kriteriju koju svaki od prediktora


pojedinačno objašnjava. Osjećaj kontrole nad životnim događajima objašnjava 13% varijance
kriterija (0.3622 = 0.13; odnosno 13%), dok osjećaj kontrole nad unutrašnjima stanjima
objašnjava 9% (0.3072 = 0.09, odnosno 9%). Primjećujemo da jedinstven doprinos varijabli
zajedno (0.09+0.13=0.22) nije jednak ukupnoj varijanci koja je objašnjena (vrijednost
kvadriranog koeficijenta multiple korelacije je 0.468). Razlog tome je što su nezavisne
varijable u prilično visokoj korelaciji (r=0.52), radi čega je i mjesto preklapanja te dvije
varijable veći.

Zadaci za vježbu:
Baza podataka: sleep3ED.sav. Vidite dodatak za podatke o bazi podataka
1. Sprovedite standardnu multiplu regresijsku analizu da bi saznali koji faktori utječu
na količinu svakodevne potrebe za spavanjem. Za svoju zavisnu varijablu uzmite
ukupni skor skale Sleepiness and Associated Sensations (totSAS). Za nezavisnu
varijablu, koristi spol, dob, fizičku spremnost (fitrate) i skorove na skali HADS
Depression (depress). Prikažite koliki je postotak varijance sa ukupnih rezultata na
skali Sleepiness objašnjeno setovima varijabli. Koja varijabla daje najveći
doprinos?

126
V DIO
STATISTIČKI POSTUPCI ZA USPOREDBU
GRUPA
SPSS PRIRUČNIK

15.
HIPOTEZE, OBLAST ODBACIVANJA, STATISTIČKA
ZNAČAJNOST

Testiranje hipoteza

Istraživanja u psihologiji se provode na uzorcima ispitanika. Međutim, cilj istraživanja je


donošenje zaključaka o populaciji. Na osnovu rezultata koje smo dobili na uzorku ispitanika,
donosimo zaključke o populaciji. Standardna pogreška aritmetičke sredine (standardna
pogreška aritmetičke sredine uzoraka je standardna devijacija aritmetičkih sredina uzoraka
oko prave aritmetičke sredine populacije; s tim da standardna devijacija predstavlja
prosječno odstupanje od aritmetičke sredine i to u apsolutnom iznosu) omogućava utvrđivanje
intervala u kojem se uz određenu pouzdanost (p) nalazi aritmetička sredina populacije. Na
osnovu statistika uzorka (procjena prave aritmetičke sredine i prave standardne devijacije)
zaključujemo o parametru populacije (prave vrijednosti populacije) - (µ). Dio statistike koji
se bavi procjenama parametara populacije i testiranjem hipoteza se naziva inferencijalna
statistika.

U svom općem značenju, hipoteze su misaone pretpostavke o nekoj pojavi, odnosima među
pojavama ili među činiocima jedne pojave koja je predmet istraživanja. U statistici, testiranje
hipoteze je postupak kojim se donosi odluka o stanju stvari u populaciji na osnovu podataka
prikupljenih na uzorku (npr. da li se aritmetička sredina uzorka statistički značajno razlikuje
od aritmetičke sredine populacije, te da li se aritmetičke sredine dva ili više uzoraka statistički
značajno razlikuju). Hipoteze se formiraju na osnovu prethodnih teorijskih saznanja,
novootkrivenih empirijskih činjenica, svakodnevnog iskustva ili općih vjerovanja.
Statistička hipoteza uključuje tvrdnju ili pretpostavku o parametru ili parametrima populacije.
Tvrdnja prema kojoj je populacijski parametar jednak određenoj vrijednosti ili da su
populacijski parametri dvije ili više grupa jednaki naziva se nul-hipoteza (H0). Tvrdnja
prema kojoj populacijski parametar nije jednak određenoj vrijednosti ili da su populacijski
parametri dvije ili više grupa različiti naziva se alternativna hipoteza (H1). Općenito prema
ovoj hipotezi se očekuje neki efekt, odnosno postojanje razlika.

128
SPSS PRIRUČNIK

Ako želimo dokazati neku tvrdnju uvijek polazimo od suprotne tvrdnje, odnosno polazimo od
nulte hipoteze (deductio ab absurdum – dovođenje do proturiječnosti ako se pretpostavi
suprotna tvrdnja).
Statistički test je postupak pomoću kojeg se dolazi do odluke o prihvatanju ili odbacivanju
nulte hipoteze. Zasniva se na slučajnoj varijabli X kojom se matematički definira distribucija
statistika uzoraka (npr. aritmetička sredina, razlika između dvije aritmetičke sredine,
varijanca, medijana i sl.). Statistik uzorka je vrijednost koja se nalazi u određenom rasponu.
Skup vrijednosti statistika za koje odbacujemo hipotezu H0 nazivamo oblast odbacivanja ili
kritična oblast. Veličina oblasti odbacivanja H0 određena je vjerovatnoćom (α) pojavljivanja
statistika uzorka u kritičnoj oblasti. Ova vjerovatnoća se naziva nivo značajnosti testa i
određuje se kao vjerovatnoća da će vrijednost slučajne varijable X pasti u kritičnu oblast.
Nivo značajnosti može biti određen arbitrarno, npr. 0,05 ili 0,01.
Na osnovu unaprijed određenog nivoa značajnosti (tj. kritičke oblasti) određujemo i kritične
vrijednosti statistika, tj. granične vrijednosti kritične oblasti.
Na osnovu vrijednosti statistika i kritične oblasti, donosimo zaključak. Ako statistik testa
pada u oblast odbacivanja, odbacujemo H0. Ako statistik testa nije u oblasti odbacivanja,
prihvatamo H0 (drugim riječima, ako pada u oblast prihvatanja H0). Praktično kada je p<α
test sugerira odbacivanje H0 („statistički značajno“).
Izbor statističkog testa zavisi od skale mjerenja i oblika raspodjele podataka. Zapravo
statističke testove dijelimo na parametrijske i neparametrijske. Parametrijski testovi koriste
se za provjeru hipoteza o nepoznatoj vrijednosti parametra populacije; preduvjet za njihovo
korištenje je intervalni/racio nivo mjerenja. Parametrijski testovi se vrše na osnovu nekih od
teorijskih raspodjela: normalne, Studentove t-raspodjele, F-raspodjele, binomne raspodjele
itd. Kada su podaci prikupljeni korištenjem nominalne ili rang skale mjerenja i kada podaci
prikupljeni intervalnom ili racio skalom mjerenja ne zadovoljavaju određene karakteristike
distribucije, koristimo neparametrijske testove.

Testiranje razlika između dvije aritmetičke sredine


U znanstvenim istraživanjima vrlo često postavljamo pitanje: „Da li se aritmetičke sredine
dva uzorka statistički značajno razlikuju?“. Da bismo odgovorili na ovo pitanje, moramo
razumjeti izraz „statistički značajna razlika“. Statistički rečeno, razlika između dvije
aritmetičke sredine je statistički značajna ako je po slučaju očekujemo u manje od 5%
slučajeva distribucije svih mogućih razlika (s tim da prihvatimo stepen rizika od 5%; a ako
govorimo o stepenu rizika od 1%, onda tu razliku po slučaju očekujemo u manje od 1%

129
SPSS PRIRUČNIK

slučajeva). Drugim riječima, razliku koju proglašavamo „statistički značajnom“ po slučaju


očekujemo u proporciji manjoj od postavljenog α nivoa.
Pored statističkog određenja „statističke značajnosti razlike između dvije aritmetičke sredine“
možemo govoriti i o „znanstveno-istraživačkom“ određenju tj. ako „statistički značajnu
razliku“ po slučaju očekujemo u veoma malom procentu slučajeva (dakle, manjem od α), a u
našem istraživanju dobijemo upravo tu razliku, onda možemo zaključiti da ona
najvjerovatnije nije rezultat slučaja, već je rezultat djelovanja nekog sistematskog faktora.
U znanstvenim istraživanjima mi se sistematski trudimo da razliku između dvije aritmetičke
sredine učinimo što većom, tj. značajnijom, ili provjeravamo razlike između dvije grupe u
slučajevima kada pretpostavljamo postojanje nekog sistematskog faktora koji dovodi do tih
razlika. Prilikom izvlačenja slučajnih uzoraka iz populacije, aritmetičke sredine tih uzoraka
obavezno variraju. Dakle, mi uvijek unaprijed očekujemo da ćemo prilikom formiranja dva
različita uzorka iz iste populacije dobiti manje ili više različite vrijednosti njihovih
aritmetičkih sredina. Postavlja se pitanje: da li je ta razlika rezultat slučajnih variranja uzoraka
ili je to rezultat djelovanja nekog sistematskog faktora? Donošenje odluke o statističkoj
značajnosti razlike između dvije aritmetičke sredine zapravo znači testirati tu razliku.

Obzirom da se kriterij za proglašavanje statističke (ne)značajnosti temelji na vjerovatnoći, tj.


α vrijednosti, ovu razliku moramo pozicionirati u neku distribuciju koja bi nam omogućila
„očitavanje“ vjerovatnoće njenog javljanja po slučaju (dakle, uz važenje H0). Ta teorijska
distribucija, u situacijama kada testiramo značajnost razlika između dvije aritmetičke sredine,
se naziva t-raspodjela. Zapravo govorimo o porodici t-raspodjela jer je oblik ove raspodjele
matematički određen veličinom uzorka; t-raspodjela, kao i normalna raspodjela, je
unimodalna, zvonolikog oblika i simetrična. Što je uzorak veći, t-raspodjela je sličnija
normalnoj.

130
SPSS PRIRUČNIK

16.
T-TEST

Praktično diferenciramo testiranje razlika između aritmetičkih sredina za velike nezavisne i


zavisne, te za male nezavisne i zavisne uzorke. Govorit ćemo o t-testu za nezavisne uzorke i t-
testu za zavisne uzorke. U oba slučaja vrši se poređenje neke kontinuirane varijable za dvije
grupe ili dvije situacije. Ako postoji više grupa onda koristimo postupak analize varijance.

16.1. T-TEST ZA NEZAVISNE UZORKE

Kada želimo porediti aritmetičke sredine neke kontinuirane varijable, dvije grupe, odnosno
dva uzorka, tada koristimo t-test za nezavisne uzorke. Kod velikih uzoraka, t-raspodjela je
normalna raspodjela razlika između svih mogućih parova aritmetičkih sredina svih mogućih
uzoraka iste veličine koji se mogu izvući iz početne (teorijski beskonačno velike) populacije.
Teorijski, aritmetička sredina t-raspodjele iznosi:

µM1-M2=0
Prema H0 razlika između dvije aritmetičke sredine neće biti statistički značajna, odnosno u
raspodjeli će se pozicionirati oko aritmetičke sredine. Nasuprot tome, prema alternativnoj
hipotezi, razlika između dvije aritmetičke sredine će biti dovoljno velika (u apsolutnim

vrijednostima) da će u t-distribuciji izlaziti izvan intervala µM1-M2+/-1,96SM1-M2, uz nivo

značajnosti od 5% ili intervala µM1-M2+/-2,58SM1-M2, uz nivo značajnosti od 1% (ovo vrijedi


za velike uzorke, odnosno n>40). Statistički postupak koji nam omogućava da utvrdimo
razlike između dvije aritmetičke sredine i standardne pogreške te razlike se naziva t-test i
računa se prema formuli:

t=

Posmatrat ćemo sljedeći primjer: da li će razlike između aritmetičkih sredina rezultata na


upitniku samopoštovanja kod muškaraca i žena biti statistički značajne. Trebaju nam dvije
varijable: jedna kategorijalna, odnosno nezavisna varijabla (u ovom slučaju - spol sa dva

131
SPSS PRIRUČNIK

nivoa: muškarci i žene) i jedna kontinuirana, zavisna varijabla (u ovom slučaju – rezultati na
upitniku samopoštovanja).
Procedura za izračunavanje t-testa za nezavisne uzorke:
1. U izborniku koji se nalazi na vrhu ekrana kliknite Analyze, zatim kliknite na
Compare means i odaberite Independent Samples T test.
2. Premjestite zavisnu (kontinuiranu) varijablu (npr. total self esteem) u Test variable
dio.
3. Premjestite nezavisnu (kategorijalnu) varijablu (npr. sex) u dio koji se naziva
Grouping variable.
4. Kliknite Define groups i u Grupu 1 ukucajte 1, a u Grupu 2 ukucajte 2. 1=muškarci,
2=žene. A ako se ne možete sjetiti korištenog koda, onda desnim klikom pritisnite na
variable name i izaberite Variable information. Ovo će izlistati sve kodove i oznake
za iste.
5. Kliknite Continue i onda OK.

Prikaz dobivenog outputa:


Group Statistics

sex N Mean Std. Std. Error


Deviation Mean

Total Self MALES 184 34,02 4,911 ,362


esteem FEMALES 252 33,17 5,705 ,359

Independent Samples Test

Levene's Test t-test for Equality of Means


for Equality of
Variances
F Sig. t Df Sig. Mean Std. Error 95% Confidence
(2- Difference Difference Interval of the
tailed) Difference

Lower Upper

Equal
variances 3,506 ,062 1,622 434 ,105 ,847 ,522 -,179 1,873
Total assumed
Self Equal
esteem variances
1,661 422,349 ,098 ,847 ,510 -,156 1,850
not
assumed

132
SPSS PRIRUČNIK

Interpretacija outputa t-testa za nezavisne uzorke:

1. Provjera informacija o grupama


U Group Statistics dijelu, SPSS pokazuje aritmetičke sredine i standardne devijacije
za svaku grupu (u ovom slučaju: muškarci/žene). Također nam daje informaciju o
broju ljudi u svakoj grupi (N). Uvijek treba prvo pogledati ove vrijednosti. Da li je
broj muškaraca i žena ispravan, odnosno da li je N tačno?

2. Provjera pretpostavki
Prvi dio Independent Samples Test output-a pokazuje rezultate na testu (upitniku)
samopoštovanja. Također testira da li je varijanca rezultata u te dvije grupe približno
jednaka.
 Ako je Sig. vrijednost veća od 0,05 trebao bi se koristiti prvi dio tabele Equal
variances assumed.
 Ako je vrijednost 0,05 ili manja od 0,05 varijance ove dvije grupe nisu iste. U
ovom slučaju SPSS nudi mogućnost biranja alternativne t-vrijednosti: Equal
variances not assumed.
U navedenom primjeru koristimo prvi dio Equal variances assumed.

3. Procjena razlika među grupama


Da li postoji statistički značajna razlika između dvije grupe pozivajući se na vrijednost
Sig. (2 tailed)?

 Ako je vrijednost u Sig. (2 tailed) jednaka ili manja od 0,05, postoji statistički
značajna razlika između grupa.
 Ako je vrijednost u Sig. (2 tailed) veća od 0,05, onda nema statistički značajne
razlike među grupama. U našem primjeru vidimo da nema statistički značajne
razlike između aritmetičkih sredina grupa.

16.2. T-TEST ZA ZAVISNE UZORKE

T-test za zavisne uzorke koristimo kada se mjerenja, u obje situacije koje želimo porediti, vrše
na istim ispitanicima. Isti ispitanici se podvrgavaju mjerenju u dvije vremenske tačke nakon
izlaganja eksperimentalnom postupku. Moguće je korištenje t-testa za zavisne uzorke kada

133
SPSS PRIRUČNIK

imamo „spojeni“ par ispitanika (to su ispitanici koji su slični po nekoj karakteristici). Jedan
ispitanik će biti podvrgnut jednom ispitivanju, a drugi ispitanik drugom ispitivanju.
Standardna pogreška razlike između aritmetičkih sredina se smanjuje. To se događa zbog toga
što se ovakvim istraživačkim nacrtima iz greške mjerenja isključuje varijabilitet između
ispitanika.

Razmotrimo sljedeći primjer: da li postoji statistički značajna promjena u rezultatima (koji


pokazuju u kolikoj mjeri je strah od statistike prisutan kod ispitanika) prije intervencije (koja
za cilj ima ukloniti strah ispitanika i povećati samopouzdanje vezano za statistiku) i poslije
intervencije. Treba nam jedna grupa ispitanika. Svaki ispitanik će raditi test koji mjeri
prisutstvo straha od statistike u dvije vremenske tačke. Također nam trebaju dvije varijable:
jedna kategorijalna, nezavisna (u ovom slučaju – vrijeme sa dva nivoa: prije i poslije
intervencije) i jedna kontinuirana, zavisna (u ovom slučaju – rezultati testa koji mjeri strah od
statistike).

Procedura za izračunavanje t-testa za zavisne uzorke:


1. Iz gornjeg izbornika kliknite Analyze, zatim Compare Means, pa onda Paired
Sample T test.
2. Izaberite dvije varijable koje želite porediti (npr. fost1: fear of statistics time1; fost2:
fear of statistics time2).
3. Obje varijable premjestite u desni gornji dio Paired Variables, tako što ćete kliknuti
na strelicu. Kliknite OK.

Prikaz dobivenog outputa:


Paired Samples Correlations

N Correlation Sig.

fear of stats time1 & fear of


Pair 1 30 ,862 ,000
stats time2

134
SPSS PRIRUČNIK

Paired Samples Test

Paired Differences t df Sig. (2-

Mean Std. Std. Error 95% Confidence tailed)

Deviation Mean Interval of the


Difference

Lower Upper

fear of stats time1


Pair
- fear of stats 2,667 2,708 ,494 1,655 3,678 5,394 29 ,000
1
time2

Interpretacija outputa:
1. Određivanje cjelokupne značajnosti
U dijelu tabele koji je označen sa Paired Sample Test trebate pogledati finalnu
kolonu Sig. (tailed) – to je vaša vjerovatna vrijednost. Ako je ova vrijednost manja od
0,05, možete zaključiti da postoji statistički značajna razlika između dva rezultata u
dva mjerenja. U navedenom primjeru nivo značajnosti je 0,0005 i on je mnogo manji
od α koje iznosi 0.5. Na osnovu ovoga možemo zaključiti da postoji statistički
značajna razlika u rezultatima na testu koji mjeri strah od statistike u dva mjerenja
(time1 i time2).

2. Upoređivanje aritmetičkih sredina


Kada smo utvrdili da postoji statistički značajna razlika između ova dva mjerenja,
trebamo još utvrditi koji su rezultati na testu (koji mjeri strah iz statistike) veći: oni
kod prvog mjerenja ili oni kod drugog (odnosno utvrđujemo koja je aritmetička
sredina veća). Da bi ovo vidjeli pogledajte u dio tabele označen kao Paired Sample
Statistics. Ovaj dio tabele nam daje vrijednosti aritmetičkih sredina za svako mjerenje:
za dva mjerenja (time1 i time2 – prije i poslije intervencije). U našem slučaju
aritmetička sredina rezultata na testu koji mjeri strah od statistike prije intervencije
iznosi 40,17, a aritmetička sredina rezultata nakon intervencije iznosi 37,50. I na
osnovu ovoga možemo zaključiti da postoji smanjenje straha, koje je posljedica
intervencije.

135
SPSS PRIRUČNIK

17.
ANALIZA VARIJANCE

Analiza varijance je postupak koji se koristi za ispitivanje statističke značajnosti razlika


između aritmetičkih sredina kada imamo više od dvije grupe (odnosno kada poredimo više od
dvije aritmetičke sredine). Za razliku od t-testa, ANOVA-om možemo testirati razlike između
bilo kojeg broja aritmetičkih sredina. Ovim postupkom se upoređuju aritmetičke sredine
analiziranjem i uspoređivanjem varijabiliteta tj. varijanci između različitih grupa (MSbg) sa
varijancama unutar grupa (MSwg). Najjednostavniji primjer analize varijance je jednostavna
ili jednosmjerna (one way) analiza varijance, kod koje imamo jednu nezavisnu varijablu,
odnosno faktor i jednu zavisnu varijablu. Faktor je kategorijalna varijabla, a vrijednosti
varijable su određeni nivoi. Kao što smo koristili t-test u cilju donošenja odluke o prihvatanju
ili odbacivanju nulte hipoteze, kod ANOVA-e koristimo F-test. Obzirom da se kod F-omjera
radi o omjeru varijanci, njegova vrijednost ne može biti manja od nule. F-distribucija je
pozitivno asimetrična, a samo u slučaju ekstremno velikih uzoraka, F-distribucija se
približava normalnoj. Kritičnu vrijednost F-omjera očitavamo iz tablice na osnovu stupnjeva
slobode brojnika i nazivnika. Ako je izračunati F-omjer veći od kritične vrijednosti F (uz
određene stupnjeve slobode), onda je varijabilitet između grupa statistički značajno veći od
varijabiliteta unutar grupa, odnosno utvrđena je statistički značajna razlika između
aritmetičkih sredina.

Preduvjeti za korištenje ANOVA-e:


 Homogenost varijanci tj. populacije svake grupe imaju jednake varijance
 Normalna distribucija
 Nezavisni uzorci tj. uzorci (grupe) trebaju biti formirani metodom slučajnog odabira.
Postoji više tipova ANOVA-e, a jedni od njih su: jednostavna analiza varijance (kada postoje
dvije ili više nezavisnih grupa) i analiza varijance za zavisne uzorke (kada se mjere isti
subjekti pod različitim okolnostima i tada se varijabilitet unutar ispitanika dijeli na dvije
komponente: varijabilitet između tretmana i rezidual ili ostatak koji se ne može objasniti
efektom tretmana).

136
SPSS PRIRUČNIK

17.1. JEDNOSMJERNA ANOVA

Ovaj postupak koristimo kada imamo jednu nezavisnu varijablu sa dva ili više nivoa i jednu
zavisnu kontinuiranu varijablu. U jednostavnoj analizi varijance postoji samo jedna nezavisna
varijabla i jedna zavisna varijabla, pri čemu „between-groups“ (između grupa) znači da
postoje različiti subjekti ili slučajevi u svakoj grupi.

Posmatrat ćemo sljedeći primjer: da li postoji statistički značajna razlika rezultata na testu
optimizma kod mladih osoba, osoba srednjih godina i starih osoba? Trebaju nam dvije
varijable: jedna kategorijalna, nezavisna (u ovom slučaju dob sa tri nivoa: mlada, srednja i
starija dob) i jedna kontinuirana, zavisna varijabla (u ovom slučaju je to rezultat na testu,
odnosno upitniku optimizma). ANOVA će nam pokazati da li postoji statistički značajna
razlika između aritmetičkih sredina rezultata dobivenih na skali optimizma kod ispitanika
različite dobi (mlade, srednje i starije dobi). Post-hoc test nam govori gdje su zapravo te
razlike; između kojih grupa se nalaze razlike.

Procedura za izračunavanje jednostavne ANOVA-e:


1. Prvo iz gornjeg izbornika izaberite Analyze, zatim kliknite Compare Means, a onda
One-way ANOVA
2. Kliknite na zavisnu, kontinuiranu varijablu koju želite (npr. Total optimism), a zatim je
prebacite u desni dio Dependent List, tako što ćete kliknuti strelicu.
3. Izaberite nezavisnu, kategorijalnu varijablu koju želite (npr. agegp3 – dob sa tri nivoa)
i prebacite je u desni donji dio označen kao Factor.
4. Kliknite na Options i izaberite Descriptive, Homogenity of variance test, Brown-
Forsythe, Welsh i Means Plot.
5. U Missing values kliknite opciju Exclude cases analysis by analysis, te kliknite
Continue.
6. Kliknite na Post-hoc i označite Tukey.
7. Pritisnite Continue, a zatim OK.

137
SPSS PRIRUČNIK

Prikaz dobivenog outputa:

Test of Homogeneity of Variances


Total Optimism

Levene Statistic df1 df2 Sig.

,746 2 432 ,475

ANOVA
Total Optimism

Sum of Squares df Mean Square F Sig.

Between Groups 179,069 2 89,535 4,641 ,010


Within Groups 8333,951 432 19,292
Total 8513,021 434

Robust Tests of Equality of Means


Total Optimism
a
Statistic df1 df2 Sig.

Welch 4,380 2 284,508 ,013


Brown-Forsythe 4,623 2 423,601 ,010

a. Asymptotically F distributed.

Multiple Comparisons
Dependent Variable: Total Optimism
Tukey HSD

(I) age 3 groups (J) age 3 groups Mean Std. Error Sig. 95% Confidence Interval
Difference (I-J) Lower Bound Upper Bound

30 – 44 -,744 ,507 ,308 -1,94 ,45


18 – 29 *
45+ -1,595 ,524 ,007 -2,83 -,36
18 – 29 ,744 ,507 ,308 -,45 1,94
30 – 44
45+ -,851 ,519 ,230 -2,07 ,37
*
18 – 29 1,595 ,524 ,007 ,36 2,83
45+
30 – 44 ,851 ,519 ,230 -,37 2,07

138
SPSS PRIRUČNIK

1*. The mean difference is significant at the 0.05 level.

Total Optimism
Tukey HSD

age 3 groups N Subset for alpha = 0.05

1 2

18 – 29 147 21,36
30 – 44 153 22,10 22,10
45+ 135 22,96
Sig. ,321 ,227

Interpretacija outputa:

Descriptives
Ova tabela vam daje informaciju o svakoj grupi.

139
SPSS PRIRUČNIK

Test of homogenity of variances


Omogućava provjeru vrijednosti (Sig.) za test optimizma. Ako je ovaj broj veći od 0,05, niste
prekršili pretpostavku o homogenosti varijanci. Ukoliko je pretpostavka prekršena, onda se
treba gledati tabela Robust Tests of Equality of Means gdje su prikazana dva testa: Welsh
and Brown-Forsythe.

ANOVA
Ova tabela pokazuje sumu kvadrata između grupa, unutar grupa kao i stepene slobode. Ako je
Sig. vrijednost manja ili jednaka 0,05, postoji statistički značajna razlika negdje između
grupa, odnosno između aritmetičkih sredina rezultata na testu optimizma. Ali ovo nam ne
govori o tome koja grupa (koja aritmerička sredina) se razlikuje od ostalih. U tabeli Multiple
Comparison to možemo vidjeti, jer ova tabela daje rezultate Post-hoc testa.

Multiple Comparison
Ovu tabelu je potrebno gledati samo ako je pronađena statistički značajna razlika u tabeli
ANOVA, tj. ako je Sig. vrijednost manja ili jednaka 0,05. Post-hoc test u ovoj tabeli će nam
tačno reći između kojih grupa postoji statistički značajna razlika. U našem primjeru samo se
grupa 1 i grupa 3 (mladi i stariji) međusobno razlikuju po rezultatima na testu optimizma.

17.2. RM-ANOVA (REPEATED MEASURES)

Repeated measures („ponovljena mjerenja“) ANOVA podrazumijeva da se svaki ispitanik


nađe u dva ili više eksperimentalnih uvjeta ili mjerenje rezultata ispitanika na nekoj
kontinuiranoj skali tri ili više puta. Također, RM analiza varijance se može koristiti da bi
uporedili odgovore jednog ispitanika na dva ili više različitih pitanja ili tema. Pomenuta
pitanja se strogo moraju mjeriti na istoj skali (npr. 1=potpuno se ne slažem ; 5=potpuno se
slažem).

Primjer: Da li postoji promjena u rezultatima na testu povjerenja jednog ispitanika u tri


različita vremenska perioda?

140
SPSS PRIRUČNIK

Procedura za izračunavanje RM-ANOVA-e:


1. Iz gornjeg menija izaberite opciju Analyze, zatim kliknite na General Linear Model,
zatim na opciju Repeated Measures.
2. U okvir Whitin Subject Factor Name ukucajte ime koje predstavlja vašu nezavisnu
varijablu (npr. Time ili Condition). Ovo nije stvarno ime varijable već samo naziv koji
vi dajete određenoj nezavisnoj varijabli.
3. U okvir Number of Levels ukucajte broj razina ili grupa (npr. tri vremenska perioda)
nezavisne varijable od interesa.
4. Kliknite Add.
5. Kliknite opciju Define, koja se nalazi sa vaše desne strane.
6. Izaberite uvjete koji označavaju nezavisnu varijablu čija mjerenja ponavljamo (npr.
confid1, confid2, confid3). Pomjerite ih u okvir Within Subjects Variables.
7. Kliknite na Options koja se nalazi zadnja u koloni s vaše desne strane.
8. Označite Descriptive Statistic i Estimates of effect size u području Display. Ako
želite post hoc analizu izaberite svoju nezavisnu varijablu (npr. Time) koja se nalazi u
odjeljku Factor and Factor Interactions i pomjerite je u okvir Display Means for.
Označite Compare main effects. U odjeljku Confidence interval adjusment
izaberite opciju Bonferroni.
9. Kliknite Continue, zatim OK.

Prikaz dobivenog outputa:


Descriptive Statistics

Mean Std. Deviation N

confidence time1 19.00 5.369 30


confidence time2 21.87 5.594 30
confidence time3 25.03 5.203 30

a
Multivariate Tests

Effect Value F Hypothesis df Error df Sig. Partial Eta


Squared
b
Pillai's Trace .749 41.711 2.000 28.000 .000 .749
b
Wilks' Lambda .251 41.711 2.000 28.000 .000 .749
time b
Hotelling's Trace 2.979 41.711 2.000 28.000 .000 .749
b
Roy's Largest Root 2.979 41.711 2.000 28.000 .000 .749

a. Design: Intercept
Within Subjects Design: time

141
SPSS PRIRUČNIK

b. Exact statistic

a
Mauchly's Test of Sphericity
Measure: MEASURE_1
b
Within Subjects Mauchly's Approx. Chi- df Sig. Epsilon
Effect W Square Greenhouse- Huynh- Lower-
Geisser Feldt bound

time .592 14.660 2 .001 .710 .737 .500

Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent
variables is proportional to an identity matrix.
a. Design: Intercept
Within Subjects Design: time
b. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are
displayed in the Tests of Within-Subjects Effects table.

Pairwise Comparisons
Measure: MEASURE_1
b
(I) time (J) time Mean Difference Std. Error Sig. 95% Confidence Interval for
b
(I-J) Difference

Lower Bound Upper Bound


*
2 -2.867 .868 .008 -5.072 -.661
1 *
3 -6.033 .833 .000 -8.149 -3.918
*
1 2.867 .868 .008 .661 5.072
2 *
3 -3.167 .447 .000 -4.304 -2.030
*
1 6.033 .833 .000 3.918 8.149
3 *
2 3.167 .447 .000 2.030 4.304

Based on estimated marginal means


*. The mean difference is significant at the ,05 level.
b. Adjustment for multiple comparisons: Bonferroni.

Interpretacija outputa:

Descriptive statistics

Iz prve tabele outputa možemo iščitati statistike za tri seta rezultata (aritmetička sredina =
Mean; standardna devijacija = Std. Deviaton; broj ispitanika = N). Dobro bi bilo provjeriti
imaju li smisla ove kolone. Da li postoji jednak broj ispitanika u svakom uvjetu? Da li
dobivene vrijednosti imaju smisla ako uzmemo u obzir skalu koju smo upotrebljavali? U gore
navedenom primjeru možemo primjetiti da je najmanji rezultat za uvjet Time 1, a najviši u
uvjetu Time 3.

142
SPSS PRIRUČNIK

Multivariate tests
U ovoj tabeli vrijednost koja nas zanima je Wilks' Lambda, a njenu vjerovatnoću
provjeravamo u koloni Sig. U ovom primjeru vrijednost Wilks' Lambda je .25, sa
vjerovatnoćom pojavljivanja od .000 (što znači p<0.0005). Obzirom da je p manje od .05,
možemo zaključiti da postoji statistički značajan efekat vremena. Ovo nam sugeriše da postoji
promjena rezultata povjerenja kroz određene vremenske periode.

Pairwise comparisons
Ako utvrdimo statistički značajnu razliku između grupa od interesa, ne možemo odmah znati
između kojih tačno grupa postoji pomenuta razlika. Ovu informaciju možemo vidjeti iz
Pairwise comparisons tabele. U njoj su upoređene različite vremenske tačke i možemo
vidjeti da li je razlika među istima značajna. U našem primjeru svaka razlika je značajna (sve
vrijednosti u koloni Sig. su manje od .05).

Prezentacija rezultata:

RM ANOVA je provedena da bismo uporedili rezultate povjerenja u suočavanju mjerena


statističkim testom kroz tri eksperimentalna uvjeta (Time 1, Time 2, Time 3). Aritmetičke
sredine i standardne devijacije su prezentirane u Tabeli 1. Postoji značajan efekt vremena,
Wilks' Lambda =.25, F (2,28) = 41.17, p < .0005.

Tabela 1
Deskriptivna statistika za skalu Povjerenje u součavanju mjerena za tri vremenska uvjeta
(Time 1, Time 2, Time 3)

Vremenski period N M SD

Time 1 30 19.00 5.37


Time 2 30 21.87 5.59
Time 3 30 25.03 5.20

143
SPSS PRIRUČNIK

17.3. FAKTORIJALNA ANOVA

Nezavisne varijable čiji utjecaj testiramo pri analizi varijace nazivamo faktorima (odakle i
sam naziv „faktorijalna ANOVA“). Faktorijalna (još je nazivamo i složena) analiza varijance
zahtijeva dvije ili više nezavisnih varijabli. Kada imamo prisutne dvije nezavisne varijable
radi se o dvosmjernoj analizi varijance, tri nezavisne varijable govorimo o trosmjernoj, itd.
Važno je napomenuti da je, uz sam naziv „faktorijalna analiza varijance”, potrebno navesti
informacije o broju nezavisnih varijabli i njihovih nivoa.

Npr. Faktorijalna ANOVA 2 x 5 podrazumijeva da se radi o dva faktora, od kojih prvi ima
dva nivoa, a drugi pet nivoa.

Pri korištenju faktorijalne analize varijance, osim učinka glavnih efekata možemo vidjeti i
učinke efekata interakcije, što predstavlja veliku spoznajnu nadmoć nad jednostavnom
analizom varijance ili t-testom. Samim tim, izbor faktorijane analize varijance omogućava viši
stepen eksperimentalne kontrole, veću ekonomičnost kao i veću mogućnost generalizacije
dobivenih rezultata.
U prethodnom poglavlju smo koristili jednostavnu analizu varijance da bismo uporedili
učinke na testu triju dobnih skupina. Post-hoc testom smo utvrdili da starija dobna skupina
ima više učinke na testu optimizma u odnosu na druge dvije. No, da li postoji razlika u učinku
testa optimizma u starijoj dobnoj skupini između muškaraca i žena? Općenito, koji je utjecaj
dobi i spola na optimizam?
Da bismo odgovorili na ova pitanja neophodno je koristiti faktorijalnu dvosmjernu analizu
varijance 3 x 2.

Procedura za izračunavanje složene analize varijance:


1. Iz gornjeg izbornika izaberite Analyze, zatim kliknite General Linear Model, a onda
Univariate.
2. Kliknite na zavisnu, kontinuiranu varijablu koju želite (npr. Total optimism), a zatim je
prebacite u desni dio Dependent List, tako što ćete kliknuti strelicu.
3. Kliknite na zavisne varijabe (npr. sex, agegp3) i premjestite ih u okvir Fixed Factors.
4. Kliknite na Options.
5. Kliknite na Descriptive Statistics, Estimates of effect size i Homogeneity tests.

144
SPSS PRIRUČNIK

6. Zatim kliknite na Continue.


7. Kliknite na Post hoc.
8. Iz opcije Factors (na lijevoj strani) izaberite nezavisne varijable koje vas interesiraju
(npr. age; varijabla bi trebala imati tri ili više nivoa).
9. Kliknite na strelicu da prebacite varijablu u okvir Post Hoc Tests for.
10. Izaberite test kojeg želite koristiti (u ovom slučaju Tukey).
11. Kliknite na Continue.
12. Kliknite na Plots.
 U Horizontal okvir stavite nezavisnu varijablu sa najviše nivoa (npr. agegp3)
 U okvir Separate Lines stavite drugu nezavisnu varijablu (npr. sex)
 Kliknite na Add.
 U odjeljku Plots sada trebate vidjeti dvije varijable (npr. agegp3 i sex)
13. Kliknite Continue, zatim OK (ili na Paste sačuvajte u Syntax Editor).

Prikaz dobivenog outputa:

Descriptive Statistics
Dependent Variable: Total Optimism

sex age 3 groups Mean Std. Deviation N

18 - 29 21.38 4.330 60

30 - 44 22.38 3.549 68
MALES
45+ 22.23 4.090 56

Total 22.01 3.985 184


18 - 29 21.34 4.722 87
30 - 44 21.88 4.578 85
FEMALES
45+ 23.47 4.704 79
Total 22.20 4.734 251
18 - 29 21.36 4.551 147

30 - 44 22.10 4.147 153


Total
45+ 22.96 4.485 135

Total 22.12 4.429 435

145
SPSS PRIRUČNIK

a
Levene's Test of Equality of Error Variances
Dependent Variable: Total Optimism

F df1 df2 Sig.

1.083 5 429 .369

Tests the null hypothesis that the error variance


of the dependent variable is equal across groups.
a. Design: Intercept + sex + agegp3 + sex *
agegp3

Tests of Between-Subjects Effects


Dependent Variable: Total Optimism

Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared
a
Corrected Model 238.647 5 47.729 2.475 .032 .028
Intercept 206790.069 1 206790.069 10721.408 .000 .962
sex 5.717 1 5.717 .296 .586 .001
agegp3 150.863 2 75.431 3.911 .021 .018
sex * agegp3 55.709 2 27.855 1.444 .237 .007
Error 8274.374 429 19.288
Total 221303.000 435
Corrected Total 8513.021 434

a. R Squared = .028 (Adjusted R Squared = .017)

Multiple Comparisons
Dependent Variable: Total Optimism
Tukey HSD

(I) age 3 groups (J) age 3 groups Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval
Lower Bound Upper Bound

30 - 44 -.74 .507 .308 -1.94 .45


18 - 29 *
45+ -1.60 .524 .007 -2.83 -.36
18 - 29 .74 .507 .308 -.45 1.94
30 - 44
45+ -.85 .519 .230 -2.07 .37
*
18 - 29 1.60 .524 .007 .36 2.83
45+
30 - 44 .85 .519 .230 -.37 2.07

Based on observed means.


The error term is Mean Square(Error) = 19,288.
*. The mean difference is significant at the ,05 level.

146
SPSS PRIRUČNIK

Interpretacija outputa:
Interakcija
Kao što smo rekli, interakcija koju možemo utvrditi putem složene analize varijance je njena
najveća prednost. Stoga je prvenstveno potrebno provjeriti da li postoji statistički značajan
efekat interakcije (npr. da li će se utjecaj dobi na optimizam razlikovati u zavisnosti od toga
da li ste muško ili žensko). Ukoliko utvrdimo postojanje statistički značajnog efekta
interakcije, sa lahkoćom možemo interpretirati glavne efekte. U gore prikazanom SPSS
output-u red koji trebamo gledati naziva se agegp3*sex. Da bismo utvrdili da li postoji
statistički značajan efekt interakcije, potrebno je provjeriti Sig. kolonu za istoimeni red;
ukoliko je ona jednaka ili manja od .05, ne postoji statistički značajan efekt interakcije. U
našem primjeru efekt interakcije nije statistički značajan (agegp3*sex: Sig.= 0.237). Ovaj
podatak nam govori da ne postoji statistički značajna razlika u efektu dobi na optimizam
između muškaraca i žena.

147
SPSS PRIRUČNIK

Upozorenje: prilikom iščitavanja statističke značajnosti u outputu povedite računa o tome da


čitate ispravnu kolonu (mnogi studenti griješe čitajući kolonu Partial Eta Squared umjesto
kolone Sig.)

Glavni efekti
Glavni efekti predstavljaju efekte jedne nezavisne varijable na zavisnu (npr. efekt spola ljudi
svih dobnih skupina). U lijevoj koloni pronađite varijablu koja vas interesuje (npr. agegp3).
Da bismo odredili da li postoji glavni efekat neke nezavisne varijable, trebamo pogledati u
kolonu označenu sa Sig. pored svake varijable. Ako je vrijednost jednaka ili manja od .05,
postoji značajan glavni efekt za tu nezavisnu varijablu. U gore prikazanom primjeru postoji
značajan glavni efekt varijable dob (agegp3: Sig.=.021), ali ne postoji značajan glavni efekt
varijable spol (sex: Sig.=.586). Ovo znači da se žene i muškarci statistički značajno ne
razlikuju u rezultatu na testu optimizma, ali postoji statistički značajna razlika u rezultatima
optimizma između mlade, srednje i stare dobi.

Post-hoc analiza
Iako znamo da se gore navedene dobne skupine statistički značajno razlikuju u rezultatima
postignutima na testu optimizma, mi ne možemo odrediti između kojih skupina ova razlika
postoji bez post-hoc analize. Post-hoc analizu upotrebljavamo ako imamo više od dva nivoa
nezavisne varijable od interesa. Putem ove analize sistematski poredimo sve nivoe nezavisne
varijable da bismo utvrdili između kojih postoji statistički značajna razlika. U SPSS-u je
prikazana post-hoc analiza kao dio outputa ANOVA-e. No, svejedno prvenstveno trebamo
pogledati značajnost efekta interakcije i glavnih efekata, a tek zatim post-hoc analizu. U
našem primjeru pronašli smo statistički značajan glavni efekt varijable agegp3, stoga možemo
detaljnije proučiti post-hoc analizu za istoimenu varijablu.

Prezentacija rezultata:

Faktorijalna ANOVA je provedena da bi se utvrdio učinak spola i dobi na nivo optimizma,


mjerenog Life Orientation Test-om (LOT). Subjekti su podjeljeni u tri skupine prema dobi
(Grupa 1: 18-29, Grupa 2: 30-44 , Grupa 3: od 45 nadalje). Efekat interakcije između spola i
dobi nije bio statistički značajan F(2,429) = 1.44, p= .24. Pronađen je statistički značajan
glavni efekat dobi F(2,429) = 3,91, p= .02; no veličina efekta bila je mala. Post-hoc testom je

148
SPSS PRIRUČNIK

utvrđeno da je glavni rezultat Grupe 1 bio značajno drugačiji od glavnog rezultata Grupe 3.
Grupa 2 se nije značajno razlikovala u odnosu na ostale dvije grupe. Glavni efekat varijable
spol, F(1,429)= .30 , p= .59, nije bio statistički značajan.

Zadaci za vježbu:

Baza podataka: staffsurvey3ED.sav. Pogledajte dodatak za više informacija o bazi.


1. Koristeći procedure o t-testu za nezavisne uzorke, opisane u poglavlju, uporedi
aritmetičke sredine stalno zaposlenih i privremeno zaposlenih ispitanika
(employstatus) na zavisnoj varijabli „Zadovoljstvo poslom“ (totsatis). Da li postoji
statistički značajna razlika?

Baza podataka: sleep3ED.sav. Pogledajte dodatak za više informacija o bazi.


2. Koristeći procedure opisane o t-testu u prethodnom poglavlju, uporedi aritmetičke
sredine muškaraca i žena na „Sleepiness and Associated Sensations Scale“ (totSAS).
Da li postoji statistički značajna razlika?

Baza podataka: staffsurvey3ED.sav. Pogledajte dodatak za više informacija o bazi.


3. Sprovedite analizu varijance sa post-hoc testovima (ukoliko budu potrebni) kako bi
uporedili kategorije varijable „length of service“ (servicegp3) na rezultatima
postignutim na varijabli „Staff satisfaction“ (totsatis).

Baza podataka: sleep3ED.sav. Pogledajte dodatak za više informacija o bazi.


4. Sprovedite analizu varijance sa post-hoc testovima (ukoliko budu potrebni) kako bi
uporedili kategorije varijable agegp3 (<=37; 38-50; 51+) na rezultatima postignutim
na varijabli „Sleepiness and Associated Sensations“ (totSAS).

Baza podataka: staffsurvey3ED.sav. Pogledajte dodatak za više informacija o bazi.


5. Sprovedite dvosmjernu analizu varijance sa post-hoc testovima (ukoliko budu
potrebni) kako bi ispitali učinak varijabli servicegp3 i employstatus na varijablu
totsatis.

149
SPSS PRIRUČNIK

Baza podataka: sleep3ED.sav. Pogledajte dodatak za više informacija o bazi.


6. Sprovedite dvosmjernu analizu varijance sa post-hoc testovima (ukoliko budu
potrebni) kako bi ispitali učinak varijabli „Spol“ (gender) i „Dob“ (agegp3) na
varijabli „Sleepiness and Associated Sensations“ (totSAS).

150
SPSS PRIRUČNIK

DODATAK

151
SPSS PRIRUČNIK

152
SPSS PRIRUČNIK

153
SPSS PRIRUČNIK

154
SPSS PRIRUČNIK

155
SPSS PRIRUČNIK

156
SPSS PRIRUČNIK

157
SPSS PRIRUČNIK

158
SPSS PRIRUČNIK

159
SPSS PRIRUČNIK

160
SPSS PRIRUČNIK

161

You might also like