You are on page 1of 140

Osnovne statistike metode i tehnike u SPSS-u

Vladimir Turjaanin

ore ekrlija

OSNOVNE STATISTIKE METODE I


TEHNIKE U SPSS-U

Primjena SPSS-a u drutvenim naukama

Osnovne statistike metode i tehnike u SPSS-u

Sadraj
PREDGOVOR...........................................................................................4
UVOD.........................................................................................................5
O PSIHOLOKIM ISTRAIVANJIMA ............................................................5
O NIVOIMA MJERENJA (TIPOVIMA PODATAKA) .........................................9
Nominalni nivo....................................................................................9
Ordinalni nivo.....................................................................................9
Intervalni nivo...................................................................................10
Nivo razmjere (racio)........................................................................10
Log-intervalni nivo ...........................................................................11
Aditivni nivo ......................................................................................11
Apsolutni nivo ...................................................................................11
NEKI OSNOVNI POJMOVI ISTRAIVANJA U PSIHOLOGIJI ...........................12
Varijabla ...........................................................................................12
Vrste varijabli ...................................................................................13
Indikator............................................................................................15
O VRSTAMA STATISTIKIH ANALIZA ......................................................17
NIVOI ZNAAJNOSTI PRI STATISTIKOM ZAKLJUIVANJU I TIPOVI
STATISTIKIH GREAKA .........................................................................19
SPSS PROGRAMSKI PAKET .............................................................21
RAD SA PROGRAMOM .............................................................................22
PRIPREMA PODATAKA ZA UNOENJE I OBRADU ......................................23
Kodiranje ..........................................................................................23
SPECIFINOSTI KOMPJUTERSKE OBRADE ................................................24
DEFINISANJE VARIJABLI .........................................................................25
UNOENJE PODATAKA ............................................................................28
Unoenje podataka u SPSS-u............................................................28
Unoenje podataka u Notepad-u ......................................................30
Unoenje podataka u Microsoft Excel-u ..........................................37
UVANJE PODATAKA .............................................................................40
Otvaranje datoteka ...........................................................................41
MANIPULISANJE PODACIMA ...................................................................42
Spajanje datoteka..............................................................................42
Spajanje podataka tako da grupe ispitanika ine jedan zbirni sluaj
...........................................................................................................44
GRUPISANJE I SELEKCIJA PODATAKA ......................................................46
Grupisanje podataka.........................................................................46
Selekcija podataka ............................................................................47
TRANSFORMACIJA PODATAKA ................................................................50
Izraunavanja ...................................................................................50

Osnovne statistike metode i tehnike u SPSS-u

Prebrojavanja ...................................................................................51
Rekodiranje .......................................................................................52
Rangovanje podataka .......................................................................55
Kreiranje vremenskih serija .............................................................56
Tretiranje nedostajuih podataka.....................................................57
DESKRIPTIVNE STATISTIKE MJERE.........................................58
FREKVENCIJE I PROCENTI .......................................................................58
MJERE CENTRALNE TENDENCIJE.............................................................64
MJERE VARIJABILNOSTI .........................................................................66
DESKRIPTIVNE MJERE ZA DVA ILI VIE UZORAKA ...................................75
TESTIRANJE NORMALNOSTI DISTRIBUCIJE PODATAKA ............................78
Kolmogorov-Smirnov test .................................................................79
TESTIRANJE ZNAAJNOSTI RAZLIKA ARITMETIKIH
SREDINA.................................................................................................83
TESTIRANJE ZNAAJNOSTI RAZLIKE IZMEU DVA UZORKA ....................84
T test za nezavisne uzorke..............................................................84
Mann Whitneyjev U-test ................................................................87
T test za zavisne uzorke..................................................................89
Test predznaka ..................................................................................92
ZNAAJNOSTI RAZLIKA IZMEU VIE UZORAKA.................94
ANALIZA VARIJANSE ..............................................................................94
JEDNOFAKTORSKA UNIVARIJATNA ANALIZA VARIJANSE ZA NEZAVISNE
UZORKE ..................................................................................................97
Kruskal Wallis test ..........................................................................101
DVOFAKTORSKA UNIVARIJATNA ANALIZA VARIJANSE .........................103
ANALIZE KATEGORIKIH VARIJABLI .....................................108
HI-KVADRAT TEST................................................................................108
KORELACIJE ......................................................................................113
Koeficijent linearne korelacije .......................................................114
Koeficijent rang korelacije .............................................................118
Biserijska i point-biserijska korelacija...........................................120
Korelacije kategorikih varijabli....................................................122
POUZDANOST.....................................................................................126
KRATAK PREGLED OPCIJA PROGRAMA .................................130
LITERATURA......................................................................................140

Osnovne statistike metode i tehnike u SPSS-u

Predgovor
Ovaj tekst koji je pred Vama, pokuae da Vas uvede u osnovne
primjene statistikih procedura u okviru statistikog programa SPSS.
Danas se svi statistiki poslovi obavljaju primjenom vie ili manje
sloenih kompjuterskih programa, te smo mi pokuali da uvedemo
itaoca u svijet kvantitativne analize podataka u praksi, kroz jednostavan
korak-po-korak pristup koritenja statistikih analiza i programa SPSS.
Svako poglavlje smo pokuali da ilustrujemo praktinim primjerom, tako
da je itaocima lake da savladaju logiku metodologije i statistike u
konkretnom sluaju. Svako poglavlje koje se bavi odreenom
statistikom operacijom koncipirano je tako da prvo prui uvid, u
najkraim crtama, u matematiku pozadinu operacije, a nakon toga i u
primjenu operacije kroz primjer u SPSS-u. Knjiga je zasnovana je kako
na viegodinjim iskustvima autora u radu sa praktinim statistikim
problemima, tako i sa uvidom u edukativne potrebe studenata drutvenih
nauka. Namijenjena je prvenstveno studentima socijalnih nauka, kao tu
su psihologija, sociologija, pedagogija i socijalni rad, ali mogu je koristiti
i profesionalci koji nemaju iskustva u radu sa statistikim programima.
Iako postoji i drugi programi za statistike analize, mi smo se odluili za
SPSS iz prostog razloga jer je najrasprostranjeniji i najdostupniji paket ne
samo kod nas ve i u svijetu, ali logika rada u svim programima za
statistike analize je slina, tako da su znanja potpuno prenosiva. Treba
napomenuti da knjiga ne pretenduje da bude udbenik iz statistike, ve da
poslui kao vodi za primijenjenu statistiku. Za detaljniji uvid u statistiku
kao nauku (bar onaj dio koji je obuhvaen ovim prirunikom),
preporuujemo Vam da obratite panju na osnovne udbenike kao to su
Statistika za psihologe edomira Dragievia (1991) i Osnovne
statistike metode za nematematiare Borisa Petza (1985). to se tie
daljeg usavravanja u baratanju statistikim programom SPSS
preporuujemo udbenik Statistika u psihologiji - prirunik Lazara
Tenjovia (2002).

Osnovne statistike metode i tehnike u SPSS-u

Uvod
O psiholokim istraivanjima
U istraivanjima u psihologiji, kao i u ostalim drutvenim naukama,
se nastoji operisati sa to je mogue vie objektivnih i mjerljivih
injenica. Takvo nastojanje, koje se ostvaruje kroz primjenu i
pridravanje metodolokih standarda u istraivanjima, omoguava razvoj
nauke na empirijski dobijenim, provjerljivim podacima. Iz toga proizlazi
da psihologija kroz metodoloki korektna istraivanja ostvaruje dvostruku
korist. Kao prvo, mogunost stalnog razvoja i kumulacije psiholokih
saznanja baziranih na empirijskim podacima i argumentima koje oni
pruaju. I kao drugo, mogunost primjene sofisticiranih statistikih
metoda u razmatranju velikog broja fenomena i njihovih meusobnih
odnosa. Stoga je potpuno jasno zato se insistira na potivanju
metodolokih naela u psiholokim istraivanjima.
Kroz svakodnevni ivot ljudi se susreu sa brojnim psiholokim
pojavama. Opaaju ih, interpretiraju i o njima donose zakljuke i sudove.
Takva saznanja se nazivaju zdravorazumskim. Iako ponekad interesantna,
obuhvatna ili prihvatljiva, zdravorazumska znanja su mnogo ee
povrna i diskutabilna. Kako nisu nauno zasnovana, njihova glavna
karakteristika ostaje nepouzdanost. Nauna znanja, sa druge strane,
bazirana su na korektnim empirijskim istraivanjima. Takva saznanja
imaju daleko veu naunu teinu i znaaj u rasvjetljavanju fenomena
kojima se psihologija bavi. Stoga je bitno poznavati aspekte istraivanja
koji ih ine naunim. Todorovi (1995) kao osnovne karakteristike
naunih istraivanja navodi:
1)

2)

sistematinost kao kakakteristika istraivanja se odnosi na


prijeku potrebu da istraivanje bude sistematski osmiljeno,
pripremljeno, sprovedeno i statistiki obraeno. Drugim
rijeima, neophodno je da potpuno precizno bude odreen
predmet ispitivanja, uslovi i nain ispitivanja, uzorak ispitanika
i nain obrade dobijenih podataka.
objektivnost svako istraivanje zapoinje sa odreenom
pretpostavkom istraivaa. Pri njenoj provjeri neophodno je
potpuno objektivno razmatranje injenica. To znai da ni u kom
sluaju nije dozvoljen razvoj takve istraivake strategije koja

Osnovne statistike metode i tehnike u SPSS-u

3)

4)

5)

6)

7)
8)
9)

e omoguiti rezultate kakve sam istraiva zbog neeg


favorizuje.
kumulativnost ogromna veina istraivanja u psihologiji
danas je bazirana na postojeim saznanjima (vrlo su rijetka
podruja koja su u istraivakom smislu tabula rasa). Iz toga
slijedi da je istraivaima omogueno da na osnovu radova
preanjih autora i rezultata koji su iz njih proizali,
obuhvatnije i preciznije ispita odreenu pojavu. Istovremeno se
time namee i zahtjev da se istraiva podrobno uputi u
postojea saznanja o onome to istrauje.
temeljnost - zakljuci doneseni na osnovu malog broja
sluajeva se ne mogu pohvaliti svojom pouzdanosti. Nauna
saznanja zato poivaju na veem broju sluajeva (npr, veem
broju osoba, vie ponavljanja istraivanja,...).
kontrolisanost Sa obzirom na to da na svaku pojavu djeluje
veliki broj faktora, neophodno je poznavanje tih faktora i
odnosa koje oni ostvaruju (kako sa mjerenom pojavom, tako i
meusobnog). Vei stepen kontrole nad uslovima u kojima se
istraivanje sprovodi, jasno omoguava i vei stepen
preciznosti dobijenih podataka i povjerenja u njim.
preciznost nezaobilazna stavka ukoliko istraiva eli da
njegovo istraivanje bude nauno. Da bi se izbjegli
nerazumijevanje, neprovjerljivost istraivanja i nerjeitost
rezultata nuno je da pojmovi sa kojima se barata, uslovi u
kojima se istraivanje sprovodi, hipoteze koje se razmatraju i
rezultati koji proizlaze iz istraivanja budu to preciznije
izreeni.
loginost kao osobina istraivanja odnosi se na zahtjev da se
prate logika i pravila naunog istraivanja.
kritinost sva istraivanja i sistemi znanja koji na njima
poivaju podlijeu kritikom razmatranju. Ukoliko prou
sistematske kritike i opstanu mogu se uzeti kao prihvatljiva.
obraenost U razmatranju podataka dobijenih istraivanjem
primjenjuju se razliiti postupci. Ova osobina naunih
istraivanja se odnosi na upuenost istraivaa u matematike i
statistike metode obrade podataka i primjenu onih koji
odgovaraju datom istraivanju.

Klasifikacije naunih istraivanja poivaju na karakteristikama samih


istraivanja prema kojima se ona meusobom razlikuju. Izraenost ili
stepen prisustva razliitih osobina istraivanja predstavlja osnovu na
kojoj ih autori razlikovuju i klasifikuju. Odmah treba istai da ne postoji
opta saglasnost kada se radi o klasifikaciji istraivanja. Insistiranje na

Osnovne statistike metode i tehnike u SPSS-u

pojedinim kriterijima ili broj kriterijuma na osnovu kojih je mogue


izvriti klasifikaciju naunih istraivanja se znaajno razlikuju meu
razliitim autorima (Baker, 1994; Todorovi 1995, Halmi, 1999,). Zato je
neophodno prije uputanja u svrstavanje istraivanja u neku od moguih
klasa navesti na osnovu ega (koje karakteristike istraivanja) je
svrstavanje bazirano. Neki od kriterija prema kojima se istraivanja
klasifikuju su:
a) Prema uslovima u kojima se sprovode istraivanja se mogu
podijeliti na terenska (prirodna) i laboratorijska. Terenska istraivanja
se sprovode u prirodnim uslovima, gdje istraiva najee nema
nikakvu kontrolu nad uslovima u kojima se istraivanje odvija.
Laboratorijska se, pak, odlikuju visokim stepenom kontrole nad
uslovima istraivanja. Vre se u opremljenim laboratorijama to prua
mogunost razmatranja i manipulacije velikim brojem faktora bitnih
za istraivanje.
b) Prema stepenu kontrole mogu biti eksperimentalna i
neeksperimentalna (deskriptivna). Eksperimentalna istraivanja imaju
vei stepen kontrole, to proizlazi iz mogunosti manipulacije
varijablama i uslovima istraivanja. Neeksperimentalna istraivanja
karakterie znatno manji stepen kontrole i minimalna ili ak gotovo
nikakva kontrola nad varijablama i uslovima istraivanja. Sljedstveno
tome, istraivanja eksperimentalnog tipa su preciznija i omoguavaju
pouzdanije zakljuke.
c) Ako je namjena istraivanja ono ime se rukovodimo pri
klasifikaciji tada razlikujemo: bazina (temeljna, fundamentalna)
istraivanja, aplikativna (primijenjena, akciona) i evaluativna
(procjenjivaka) istraivanja. Namjena bazinih istraivanja je
unapreenje i razvoj naunih saznanja, pri emu je pragmatiki aspekt
istraivanja potpuno nebitan. Sa druge strane aplikativna istraivanja
su orjentisana otkrivanju mogunosti da se rijee neki praktini
problemi. I konano evaluativna istraivanja bave se procjenom
najrazliitijih efekata neke pojave.
d) Sa obzirom na cilj istraivanja mogu se razlikovati
eksplorativna, replikativna i parametarska istraivanja. Eksplorativna
se istraivanja odnose na prva ispitivanja nekog fenomena,
replikativna su ponavljanje ranije izvedenih istraivanja dok su
parametarska istraivanja usmjerena na pojave koje su u odreenoj
mjeri istraene uz nastojanje da se pojedini aspekti date pojave
detaljnije ispitaju.

Osnovne statistike metode i tehnike u SPSS-u

e) Klasifikacija prema vrsti podataka sa kojima u istraivanju


operiemo, (Mason & Bramble, 1997), je za ovu knjigu najzgodnija.
To je podjela istraivanja na kvantitativna i kvalitativna. U okviru
kvantitativnih istraivanja se primijenjuju matematiki i statistiki
principi mjerenja i modeli koji se koriste u prirodnim naukama. U
kvalitativnim istraivanjima se susreemo sa opaanjima, utiscima i
interpretacijama koji su znatno tei za objektivno analiziranje i
mjerenje. Budui da se ova knjiga prvenstveno bavi analizama
podataka, nau panju emo usmjeriti na kvantitativna istraivanja i
podatke koje dobijamo iz njih.
Da bi psiholoka istraivanja mogla obezbijediti kvantitativne
podatke nuno je da za pojave koje su predmet interesovanja postoji
mjerni instrument za koji je istraiva siguran da mjeri ono emu je
namijenjen. Ovo je vrlo bitno zbog same injenice da u psihologiji ne
postoji mjerni instrument ija je mjerna jedinica precizno definisana
vrijednost svojstva koje se mjeri. Drugim rijeima, ne deava se da su
mjerna jedinica i predmet mjerenja isto svojstvo odreenih vrijednosti
(predmet mjerenja sa varijabilnom vrijednosti svojstva i mjerna jedinica
kao precizno definisana vrijednost datog svojstva). Iz takve injenice, da
zakljuivanje o vrijednosti jednog donosimo preko vrijednosti drugog
svojstva, proizlazi osnovna karakteristika mjerenja u psihologiji, a to je
indirektnost mjerenja. Ovakav tip mjerenja je vrlo est (razlog je u
nevelikom broju svojstava koja se neposredno mogu svesti na mjerila
koja posjeduju mjereno svojstvo). Npr, jedna od mogunosti izraavanja
intenziteta zemljotresa je preko Merkalijeve skale, koja se u stvari
zasniva na stepenu promjene zemljita i oteenja objekata u podruju
epicentra. Temperatura vazduha se izraava brojem Celzijusevih stepeni,
koji se zasniva na svojstvu ive da se pravlino skupljanja ili iri sa
promjenom temperature. Indirektni tip mjerenja se u psiholokoj praksi
svakodnevno susree pri mjerenju inteligencije. Tu se zakljuivanje o
neijim intelektualnim sposobnostima zasniva na uspjenosti u rjeavanju
problema i snalaenju u datim situacijama.
Iako se iz navedenog moe zakljuiti suprotno, nema mjesta miljenju
da korektna mjerenja i valjana istraivanja nije mogue sprovesti u
psihologiji. Imajui u vidu definiciju mjerenja koju je dao Campbell,
(1953); mjerenje predstavlja pridruivanje brojeva pojavama ili
svojstvima prema precizno odreenim pravilima, slijedi da je za mjerenje
u psihologiji potrebno utvrditi pravilan i postojan odnos izmeu
vrijednosti za razliite pojave ili svojstava. Takvo e mjerenje biti
korektno, saglasno sa metodolokim naelima i samim tim primjenjivo u
istraivanjima.

Osnovne statistike metode i tehnike u SPSS-u

O nivoima mjerenja (tipovima podataka)


Podatke koji se u istraivanjima razmatraju mogu se skupiti putem
posmatranja, upitnika, intervjua ili eksperimenta. U okviru kvantitativnog
istraivanje prikupljenim podacima se prema odreenim pravilima
pridruuju odgovarajui brojevi. Znaenje tih brojeva zavisi od
karakteristika samih podataka, to je opet neodvojivo vezano za vrstu
skale sa koje podaci potiu. Stoga je za u okviru statistikog razmatranja
vrlo bitno da znamo sa koje skale potiu podaci. Znai, tip skale koja je
primjenjena, odnosno, nivo mjerenja, uslovljava karakteristike
numerikih podataka koje dobijamo, a time neposredno odreuje i
statistike metode i postupke koje moemo koristiti. Stoga emo ukratko
predstaviti postojee nivoe mjerenja.
Nominalni nivo
Brojane vrijednosti sa ove skale nisu nita drugo do zamjena za neki
naziv. Npr. kada odreujemo vrijednosti za, recimo, pol ispitanika,
moemo izvrti sljedee pridruivanje: numeriku vrijednost 1 pridruiti
mukom polu, a vrijednost 2 enskom (moe i obrnuto, potpuno je
svejedno). Ukoliko pogledamo igrae nekog fudbalskog tima
primijetiemo da se oni meusobno razlikuju prema brojevima na svojim
dresovima. Tako recimo golman ima na leima broj jedan a centarfor
(najee) broj devet. To nikako ne oznaava da je centarfor za osam
jedinica ili devet puta bolji igra od golmana, ve samo pokazuje pozicije
ovih igraa u timu. Osnovna operacija koja se primijenjuje na podatke je
klasifikacija, a statistiki postupci koji se mogu primijeniti na podatke sa
nominalne skale su: prebrojavanje, utvrivanje koeficijenta kontigencije i
koeficijenta (kao koeficijenata korelacije) i utvrditi koeficijent
razdiobe.
Ordinalni nivo
Ordinalne skale omoguavaju meusobna poreenje pojedinanih
vrijednosti svojstva koje je predmet mjerenja. To daje mogunost
rangovanja dobijenih vrijednosti po nekom kriterijumu. Recimo da
nastavnik na asu fizikog reda uenike po visini. Najvii uenik e biti
na poetku reda a dalje sve nii do posljednjeg u nizu. U ovom sluaju
nastavnik e bez problema moi da uporedi koji je uenik vii od drugog

Osnovne statistike metode i tehnike u SPSS-u

10

(ili drugih). Meutim ono to ne moe znati je stvarna visina bilo kog od
uenika i kolika je razlika u visini izmeu pojedinih uenika. Znai u
radu sa podacima dobijenim sa ordinalne skale ne raspolaemo je
informacija o koliini mjerenog svojstva u pojedinanim sluajevima, kao
ni vrijednosti razlike izmeu pojedinanih mjera. Operacija primjenjiva
na ovom nivou mjerenja je rangovanje (odreivanje redosljeda na osnovu
poreenja sluajeva prema vrijednosti svojstva), a od statistikih
postupaka se koriste percentili, rang-korelacija i kao mjera centralne
tendencije medijana.
Intervalni nivo
Podaci sa intervalnih skala nam govore neto o veliini svojstva koje
je predmet mjerenja (npr. da je 4 vee od 3, ali manje od 5). Takoe nam
govore o tome da je razlika izmedju brojanih vrijednosti jednaka (npr. da
je razmak izmeu 17 i 18 jednak onome izmeu 108 i 109). To znai da
skale ovog nivoa mjerenja imaju tano definisanu mjernu jedinicu na
osnovu koje je mogue precizno utvrivanje razlika izmeu pojedinih
mjera (izraeno preko broja mjernih jedinica). Ono to je osnovni
nedostatak intervalnih skala je nedostatak prirodne (apsolutne nule). Nula
je na ovim skalama arbitrarna, odnosno dogovorom odreena. Tako
oznaavanje neke vrijednosti sa 0 ne znai odsustvo mjerenog svojstva.
Npr, temperatura od 0 Celzijusovih stepeni ne znai nepostojanje
temperature, ve njenu vrijednost na kojoj voda prelazi u led. Najpoznati
primjer primjene intervalnih skala u psihologiji imamo pri mjerenje
koeficijenta inteligencije. Na ovom nivou mjerenja dozvojene su sve
numerike operacije peracije i odgovarajui statistici izuzimajui
razmatranje odnosa proporcija vrijednosti mjera toga to one ne
predstavljaju apsolutnu vrijednost samih mjera.
Nivo razmjere (racio)
Racio skala (skala realnih brojeva) ima sve osobine intervalne skale,
uz dodatak realne nule. Obino su to podaci kojima se opisuju fizike
pojave: vrijeme, prostorne dimenzije, masa,... gdje nula kao broj
oznaava nepostojanje svojstva koje je predmet mjerenja itd. Osnovna
karakteristika skala razmjere je ta da je mjerna jedinica precizno odreena
vrijednost svojstva koje se mjeri. Kao oznake za vrijednosti svojstava
koja se mjere brojevi se na ovom nivou mjerenja upotrebljavaju u svom
potpunom znaenju. To znai da pri razmatranju odnosa dvaju mjera koje
potiu sa skale razmjere moemo rei koja je od mjera vea i za koliko

Osnovne statistike metode i tehnike u SPSS-u

11

jedinica. Unapreenje u odnosu na skale intervalnog nivoa se ogleda u


mogunosti da se odnos dvije mjere moe izraziti kolinikom (prema
tome je skala razmjere i dobila ime). Svi statistiki postupci su
primjenjivi na ovom nivou mjerenja jer izmeu koritenih brojeva i
svojstava koje oni oznaavaju postoji potpuna saglasnost Mjerenja u
psihologiji ne dostiu ovaj nivo.
Poevi od Stevensa (1946) mnogi autori metodolokih i statistikih
udbenika i prirunika navode ova etiri nivoa mjerenja. (Naim
studentima psihologije od tih autora najpoznatiji su: Petz, 1985;
Dragievi, 1991; Bukvi, 1988; Baker, 1994; Mason & Bramble, 1997;
Levin & Fox, 1997). Meutim pored njih postoje i drugi nivoi mjerenja.
Tako Fajgelj (2003) pored navedenih kao nivoe mjerenja predstavlja:
Log-intervalni nivo
Mjerenje na ovom nivou se zasniva na dodjeljivanju brojeva
objektima tako da se razlomci izmeu vrijednosti svojstva odraavaju
preko razlomaka brojeva. Primjer ovog nivo mjerenja potronja goriva
izraena u broju litara po preenim kilometrima.
Aditivni nivo
Pridruivanje brojeva osobinama koje su predmet mjerenja se na
aditivnom nivou mjerenja ostvaruje tako da svojstva brojeva odraavaju
istovrsna svojstva atributa, izuzimajui nultu taku. Takav nivo mjerenja
imamo kod pitanja koliko dugo radite ili koliko imate prijatelja. Na
osnovu primjera se moe zakljuiti da se ovakvim mjerenjem dobijaju
odreene vrijednosti atributa koje su razliite od nule.
Apsolutni nivo
Dodjeljivanje brojeva pojedinanim sluajevima se vre tako da
svojstva brojeva odraavaju istovrsna svojstva atributa. Za razliku od
prethodnog nivoa mjerenja ovdje je postoji mogunosti pridruivanja
nulte take. Prednost u odnosu na nivo razmjereje u tome da skale ovog
nivoa imaju prirodnu mjernu jedinicu, a to je jedan prebrojani element.
Primjeri mjerenja na ovom nivou su: broj zapamenih besmislenih
slogova, broj studenata II godine psihologije koji su dali uslov u junu.

Osnovne statistike metode i tehnike u SPSS-u

12

Neki osnovni pojmovi istraivanja u psihologiji


Varijabla
U psihologiji varijablu esto definiemo kao psiholoko svojstvo koje
je predmet mjerenja. Sam termin je preuzet iz statistike i puni naziv je
sluajna varijabla. Pod sluajnom varijablom se podrazumijeva pravilo ili
funkcija koja svakom ishodu u uzorku pridruuje jednu vrijednost
(Fajgelj, 2003). U tom smislu varijablu preciznije moemo definisati kao
rezultat mjerenja nekog psiholokog svojstva na uzorku ispitanika
svojstvo objekta, osobe, pojave, stanja, procesa, dogaaja i dr. koje moe
uzeti ma koju vrijednost iz odreenog skupa vrijednosti (Risti, 1983).
Pored ovog termina kao sinonim se koristi termin promjenjiva. Nerijetko
se kao sinonim za varijablu se koristi i termin varijat, meutim ovaj
termin se prije odnosi na odreenu vrijednost bilo koje varijable (Reber &
Reber, 2001).
Mjerenje jedne varijable pretpostavlja poznavanje karakteristika
varijable, oblika i uslova ispoljavanja. Drugim rijeima prije istraivanja
nuno je precizno definisati varijable koje namjeravamo mjeriti. Sam
metod definisanja varijabli moe da bude razliit. Neke od metoda
definisanja navodi Bukvi (1988):
1.

2.
3.
4.

Metod sinonima kod primjene ovog metoda definisanja


odreen termin se tumai na osnovu ekvivalentnog izraza koji
bi trebao biti najrazumljiviji datoj sredini. esto se primjenjuje
u psihologiji.
Genetiki metod u ovom sluaju aspekti svojstva na koje se
ukazuje su njeno porijeklo, nastanak i razvoj.
Sintetiki metod definisanje svojstva prema ovom metodu
obuhvata ukazivanje na permanentne i nune odnose
definisanog svojstva sa nekim grugim svojstvom.
Operacionalno definisanje najeksploatisaniji metod
definisanja varijabli u empirijskoj psihologiji. Operacionalnim
definicaijama se upuuje na vidljive strane varijabli, navodei
pri tome kako se one opaaju, izazivaju i mjere.

Precizne definicije, bez obzira na primijenjenu metodu, omoguavaju


preglednost u polju naunih saznanja. Nepridravanjem pravila
definisanja pojmova, proizvoljnim davanjem naziva pojavama, davanjem
novih imena odve poznatom, dolazi do stvaranja konfuzije u nauci.
Prevelik broj pojmova se meusobno preplie ili sukobljava, uz

Osnovne statistike metode i tehnike u SPSS-u

13

nemogunost njihovih poreenja, provjera i mjerenja. Iz tog razloga u


psihologiji je najzastupljenije operacionalno definisanje, koje preko
vidljivih strana varijabli omoguava njihovo precizno odreivanje.
Insistiranje na preciznom odreenju pojmova dovelo je do uvoenja
pojma hipotetiki konstrukt. On predstavlja nepotpun nauni pojam.
Pojavu objanjava na osnovu provjerenih i dokazanih injenica, ali i
neprovjerenih pretpostavki. Oznaavanjem neke pojave hipotetikim
konstruktom mi je, u stvari, objanjavamo na osnovu neega za ta ne
znamo da li je stvarno njeno svojstvo. Time ukazujemo da se radi o
neem nepotpunom i neprovjerenom to ne treba uzimati zdravo za
gotovo.

Vrste varijabli
to se tie razlikovanja i razvrstavanja varijabli, ovdje e biti
navedeno nekoliko klasifikacija sa kojima se studenti najee susreu.
Numerike i kategorike varijable.
Ova podjela varijabli se zasniva na nainu izraavanja njihovih
vrijednosti. Vrijednosti numerikih varijabli se izraavaju brojem koji
predstavlja stepen u kome je neko njegovo svojstvo izraeno. Kategorike
varijable svoje vrijednosti izraavaju pripadnou nekoj od postojeih
kategorija mjerenog svojstva. Pored ovih, za numerike varijablu se jo
koristi naziv kvantitativne, i za kategorike varijable kvalitativna. Primjer
numerike varijable bi bio, recimo, skor na testu opte informisanosti, a
kategorike polna pripadnost.
Kontinulne i diskretne varijable
Ova podjela varijabli se nerijetko izjednaava sa prethodnom
podjelom. Dok mjere kontinualnih varijabli predstavljaju neprekidan niz,
gdje izmeu svake dvije vrijednosti moe da postoji jo jedna vrijednost,
mjere diskretnih varijabli su uvijek odreene vrijednosti meu kojima ne
postoji niti jedna meuvrijednost. Kao primjer kontinualne varijable
moe se navesti duina, a kao primjer diskretne broj uteva na gol u toku
jedne utakmice.

Osnovne statistike metode i tehnike u SPSS-u

14

Eksperimentalne, selektivne i registrovane varijable


Ova klasifikacija se zasniva na stepenu kontrole koju istraiva
ostvaruje nad varijablama u istraivanju. Visok stepen kontrole odlikuje
eksperimentalne varijable, koje se jo nazivaju i manipulativnim.
Mjerama ovih varijabli istraiva aktivno manipulie i odreuje ih u
zavisnosti od zahtjeva koji su postavljeni u istraivanju. Takva je
varijabla broj itanja liste besmislenih slogova. Srednji stepen kontrole
nad varijablama karakterie selektivne varijable. Kako se moe zakljuiti
iz njihovog naziva, vrijednosti varijabli istraiva moe samo da odabere
od onih koje su mu dostupne. Primjer selektivne varijable je duina
puakog staa kod provjere uticaja puenja na pamenje. Konano,
registrovane varijable imaju najnii stepen kontrole i njihove se
vrijednosti samo mogu zabiljeiti. primjer varijable ovog tipa je skor na
testu inteligencije.
Nezavisne i zavisne varijable
U nastojanju da se utvrdi da li promjene vrijednosti jedne ili vie
varijabli dovode do promjena jedne ili vie varijabli, koriste se termini
nezavisna i zavisna varijabla. Ovaj tip varijabli se javlja usluaju kada se
radi o kauzalnom odnosu, gdje se varijabla ije promjene vrijednosti
dovode do promjena druge naziva nezavisnom, dok je zavisna varijabla
ona ije su promjene vrijednosti posljedica djelovanja nezavisne
varijable. Nezavisna i zavisna varijabla se jo mogu nazvati kao
prediktorska i kriterijska varijabla. Primjer bi bio stepen obrazovanja za
nezavisnu, i preferencija politike partije za zavisnu varijablu pri
istraivanju uticaja obrazovanja na politiku orijentaciju.

Osnovne statistike metode i tehnike u SPSS-u

15

Indikator
Indikator predstavlja znak u ispoljavanju varijable na osnovu ijeg
prisustva, kao i stepena njegovog prisustva, zakljuujemo o postojanju
odreene varijable. Sinonimi koji se koriste su pokazatelj i znak varijable.
Znai na osnovu razliitih pokazatelja se donose sudovi o jednoj varijabli.
Svaka varijabla ima vei broj indikatora na osnovu kojih se ona razmatra
i koji omoguavaju donoenje zakljuaka o njoj. Iz toga slijedi da je pri
istraivanju svih varijabli poeljno imati u vidu to vie njenih indikatora
da bi zakljuak koji se donosi bio to potpuniji iprecizniji. Utvrivanje
indikatora jedne varijable se odvija tako to se razliiti aspekti pojave ili
svojstva koje je predmet istraivanja ralenjuju na sve konkretnije
pokazatelje do one take kada se oni dalje ne mogu razlagati ili kada bi
njihovo dalje cjepkanje bilo besmisleno. Pri konstruisanju psiholokih
testova, se tako ide od nekog konstrukta ili ponaanje, recimo, koje se
ralanjuje sve do konkretnih situacija i oblika u kome se predmet
istraivanja ispoljava. Te konkretne situacije se dalje formuliu u vidu
tvrdnji (iskaza) sa kojima se ispitanika slae ili ne slae u odreenoj
mjeri1.
Pri donoenju zakljuaka o pojavi koja je predmet istraivanja,
reeno je, treba u obzir uzeti sve indikatore te pojave. Meutim, nee se
pri tome podjednaka panja pokloniti svim indikatorima, ve e se neki
odreeni u veoj mjeri uzeti u obzir. Na osnovu karakteristika svakog od
pokazatelja varijabli se odreuje u kojoj je on mjeri znaajan u donoenju
konanog zakljuka. Te karakteristike su:
1. Vremenske dimenzije indikatora odnosi se na uestalost, trajanje
i brzinu u ispoljavanju indikatora varijable u njenom ispoljavanju.
Jasno, to se jedan indikator ee javlja, ima due trajanje i to se
bre ispoljava, to je njegova vanost uea u konanom
zakljuivanju o datoj varijabli vea.
2. Obim indikatora indikator sa veim obimom se jednostavno
odnosi na vei dio varijable na koju ukazuje. Istovremeno obim
varijable govori i o koliini indikatora nieg reda koje on
obuhvata.
3. Intenzitet idikatora sa obzirom na to da se indikator varijable
moe pokazati slabijim ili jaim, on ukazuje na jednu varijablu u
veoj ili manjoj mjeri. Jasno je da panja prije poklanja onim koji
su izraenijeg stepena ispoljavanja.

1 To bi ujedno bio i put od pojave koja se eli istraivati preko njenih indikatora (od irih pa do sve
uih) do seta na osnovu kojih bi se mogao konstruisati psiholoki test.

Osnovne statistike metode i tehnike u SPSS-u

16

4. kvalitet indikatora - ova karakteristika govori da su neki


pokazatelji precizniji i sigurniji od drugih. Stoga im se u
zakljuivanju o varijabli na koju se odnose poklanja vee panja.
Sa obzirom na to se testovi kao psiholoki mjerni instrumenti, kako
je spomenuto ranije, konstruiu na osnovu mree indikatora, neophodno
je znati da se ne moe staviti znak jednakosti izmeu indikatora varijable
i ajtema u testu. Naime postoji vei broj razlika koje pokazuju njihov
odnos. Kao prvo, indikator varijable je definisan strunim jezikom, dok je
ajtem formulisan tako da je razumljiv ispitanicima koji se ispituju testom.
Drugo, indikator je iri pojam od ajtema, i najee je od jednog ajtema
mogue formirati vie ajtema. Tree, indikator predstavlja jedan aspekt
varijable koja se ispituje, dok su ajtemi stimulusi kojima kod ispitanika
izazivamo varijablu koju mjerimo. Pored toga, nije svaki pokazatelj
pogodan za prevoenje u ajtem.

Osnovne statistike metode i tehnike u SPSS-u

17

O vrstama statistikih analiza


U istraivanjima esto treba da se barata sa velikim brojem
podataka da bi se ostvario nekakav uvid u njihovu prirodu, ili pak, da se
donesu zakljuci o ispitivanim pojavama ili njihovim meuodnosima. Da
bi ovo rezimiranje i zakljuivanje ouvalo sutinu originalnih pojava (to
je i osnovni zahtjev u primjeni statistike u psihologiji) mora se potruditi
da se izaberu oni statistiki postupci koji odgovaraju samim podacima i
koji e omoguiti najpreciznije i najpotpunije zakljuke o predmetu
istraivanja.
Razlikuju se dvije osnovne grupe statistikih operacija:
1. Deskriptivna statistika obuhvata postupke i metode kojima na
osnovu dobijenih podataka opisujemo grupu ispitanika ili neke
pojave. Postupcima iz okvira deskriptivne statistike dobijaju se
parametri kao to su statistike mjere prebrojavanja, centralne
tendencije, disperzije, itd. Pri izboru ovih mjera treba voditi rauna
o tipu podataka kojim se raspolae i shodno tome primijeniti
odgovarajue statistike postupke (npr. ne moemo raunati
aritmetika sredina ili standardna devijacija za varijable pol, ili
stepen strune spreme).
2. Statistika zakljuivanja obuhvata procedure pomou kojih se
izvlae odreene zakljuke iz dobijeni podataka. U okviru ovih
procedura se testiraju odreene postavljene hipoteze. To mogu biti
hipoteze o povezanosti nekih pojava ili razlikama u izraenosti
nekih pojava, a primjenom odgovarajuih statistikih analiza se
dolazi do nekog pokazatelja koji govori da li se postavljena
hipoteza pokazala ispravnom ili ne. Ovaj pokazatelj (rezultat
statistikog testa) to govori sa odreenim stepenom statistike
vjerovatnoe uobiajeno su to nivoi znaajnosti 0.05 i 0.01. Za
vjerovatnoe manje od ovih vrijednosti zakljuak glasi: statistiki
znaajno na nivou 0.05 ili 0.01 (to znai da je vjerovatnoa da se
donese pogrean zakljuak o statistikoj znaajnosti dobivenog
razulata manja od 5% ili 1%).
U okviru procedura statistike zakljuivanja, se mogu
razlikovati dvije vrste statistikih testova:
Parametrijski testovi se primjenjuju na podacima koji
zadovoljavaju sljedee kriterijume:
1. da podaci budu sa intervalne ili racio skale
2. da se podaci normalno raspodijeljuju.

Osnovne statistike metode i tehnike u SPSS-u

18

Neparametrijski testovi se rade na podacima koji ne mogu da


zadovolje ove kriterijume. Parametrijski testovi imaju veu
snagu (precizniji su) u odnosu na neparametrijske, i treba im
dati prednost ukoliko nam podaci dozvoljavaju.

Osnovne statistike metode i tehnike u SPSS-u

19

Nivoi znaajnosti pri statistikom zakljuivanju i


tipovi statistikih greaka
Svaki put kad radimo statistike testove, mi u stvari testiramo
istraivake hipoteze. Uopteno, moemo razlikovati dvije vrste hipoteza:
nulta hipoteza (oznaava se sa H0) sadri tvrdnju o nepostojanju
statistike znaajnosti pojave naene na uzorku, dok afirmativnih
hipoteza moe biti vie (oznaavaju se sa Hn, gdje je n = redni broj
hipoteze) i one govore o nekakvim potvrdnim pretpostavkama koje
donosimo.
Prilikom primjene statistikih testova, obino se koristimo
terminom "nivo znaajnosti" kad govorimo o nekim granicama statistike
znaajnosti. Pri tom se uglavnom koristimo nivoima znaajnosti p=0.05
(ili 5% nivo) i p=0.01 (1% nivo znaajnosti). Ti nivoi znaajnosti se
interpretiraju kao: "...postoji 5% vjerovatnoe da pogrijeimo kad tvrdimo
da ... ", odnosno "...to tvrdimo sa 95% sigurnosti... " Isto vai i za nivo
znaajnosti p=0.01. Nivo znaajnosti od p=0.01 je stroiji od nivoa
p=0.05, jer podrazumijeva veu sigurnost kod odreenih tvrdnji.
Treba rei da su ova dva nivoa znaajnosti sasvim arbitrarno
prihvaena, i da nas nita ne spreava da se sluimo blaim kriterijumima
(npr. p=0.10), ili stroijim (npr. p=0.001), pri donoenju statistikih
zakljuaka. Ove granice su ustanovljene da bi se ujednaili kriterijumi
prilikom donoenja odluka, a takoe i da bi se istraivaima olakalo
donoenje statistikih odluka. U stvarnosti, nivo znaajnosti postavljamo
u zavisnosti od toga kakva je priroda pojave koju ispitujemo i znaajnosti
zakljuka koji donosimo. Kad, na primjer, istraivai ispituju lijek koji se
primjenjuje na dotad neizljeivim bolesnicima, oni se odluuju za blae
kriterijume znaajnosti, jer u takvim situacijama ak i 50% vjerovatnoe
dejstva takvog lijeka govori o vjerovatnoi da se spasi 50% ljudskih
ivota koji su bili suoeni sa izvjesnom skorom smrti. S druge strane, kad
se ispituju lijekovi koji imaju potencijalno opasne pratee pojave,
kriterijumi sigurnosti se moraju poveati na najvii nivo, jer u sluaju
pogreke u zakljuivanju mogu dovesti do fatalnih posljedica.
U skladu sa prethodnom priom o nivoima znaajnosti, govori se o
dva tipa greaka pri generalizaciji statistikih zakljuaka sa uzorka na
populaciju. Greka tipa I, koja se naziva i "greka alfa tipa", nastaje kad
donosimo zakljuak o statistikoj znaajnosti vjerovatnoe neke pojave
(npr.o postojanju znaajne razlike izmeu pojava, ili znaajne korelacije),
a ona u stvari ne postoji. Greka tipa II (greka beta tipa), nastaje u
obrnutom sluaju, kad odbacujemo tvrdnju o znaajnosti vjerovatnoe

Osnovne statistike metode i tehnike u SPSS-u

20

neke pojave a ona u stvari postoji. ematski prikazano, tipovi greaka


izgledaju ovako:
Stanje u populaciji
Donesena odluka
Prihvaena afirmativna hipoteza
Prihvaena nulta hipoteza

Nulta hipoteza ispravna

Afirmativna hipoteza ispravna

Greka tipa I (alfa)

Ispravna odluka

Ispravna odluka

Greka tipa II (beta)

Svaki put kad donosimo odluku na osnovu nekog od postavljenih


kriterijuma znaajnosti, souavamo se sa mogunou da nainimo neku
od navedenih greaka, ali to je rizik koji prihvatamo u statistici.

Osnovne statistike metode i tehnike u SPSS-u

21

SPSS programski paket


Programski paket SPSS ini vie zasebnih modula (dijelova
programa). U zavisnosti od toga koje statistike procedure su nam
potrebne, odrediemo i koje module emo moi priutiti, budui da se
svaki modul zasebno kupuje. Mi emo se ovdje dotai upotrebe svakog
od modula programskog paketa SPSS 11.5, a sve navedeno o emu
budemo govorili moe se upotrijebiti za sve verzije programa, poevi od
verzije 8 pa navie, budui da se proceduralno vrlo malo razlikuju (vie
su u pitanju "kozmetike" izmjene).
U SPSS-u svaku proceduru moemo obaviti na dva naina: pomou
biranja opcija putem menija, ili runo koritenjem posebnog
programskog jezika u okviru procedure koja se zove Syntax. Syntax
omoguava mnogo veu fleksibilnost od koritenja ve ponuenih opcija,
omoguava i programiranje novih statistikih procedura koje nisu
predviene u osnovnom paketu SPSS-a, pogotovo kad su u pitanju
napredne statistike procedure2, ali s druge strane, u velikoj mjeri je
obiman i komplikovan da to prevazilazi okvire naih zanimanja i
zahtijeva zaseban udbenik. Mi emo se, u naim objanjenjima, zadrati
na predvienim funkcijama, i to e nam biti vie nego dovoljno.
Podeavanja svih opcija programa, do najsitnijih detalja, mogu se
obaviti kroz meni Edit/Options.

2 Tako na primjer, u SPSS-u nije predviena mogunost da se radi statistika procedura kanonika
korelaciona analiza ve je ponuena samo u obliku potprograma koji moemo nai u SPSS-ovom
direktorijumu pod nazivom Canonical correlation.sps. Tim rjeenjem nisu bili zadovoljni dvojica
autora iz Beograda (psiholozi G.Kneevi i K.Momirovi), te su napravili sopstvenu verziju
potprograma uz pomo kojeg se ta procedura moe obaviti. Slino tome, praktino je mogue
programiranjem u Syntaxu napraviti drugaije verzije gotovo svih statistikih operacija predvienih u
SPSS-u.

Osnovne statistike metode i tehnike u SPSS-u

22

Rad sa programom

U radu sa SPSS-om postoje tri glavna podruja: unoenje podataka,


analiza podataka, i pregled dobijenih rezultata.
Nakon startovanja programa SPSS saekae vas uvodni ekran koji
moete vidjeti na slici. To je takozvani Data Editor, tj matrica za unoenje
i manipulaciju podacima. Uoimo da u donjem lijevom uglu postoje dva
jezika: jedan na kome pie Data View (pregled podataka), i drugi, na
kojem pie Variable View (pregled varijabli).
Za poetak, uoimo da je izgled programa karakteristian za sve
Windows programe: u gornjem dijelu ekrana postoji niz menija - od File
do Help, ispod njega Toolbar (traka sa alatkama) - dugmad sa
skraenicama za naredbe koje moemo izvriti i uz pomo gornjih
menija, a donji dio je rezervisan za unoenje podataka.

Osnovne statistike metode i tehnike u SPSS-u

23

Priprema podataka za unoenje i obradu


Kodiranje
Da bismo preli na unoenje podataka, prvo moramo da kodiramo
instrument koji smo koristili (upitnik, test itd.). Kodiranje vrimo tako to
svakom od ponudjenih odgovora dodijelimo neku brojanu vrijednost.
Ako imamo pitanja otvorenog tipa, onda je poeljno da pregledamo sve
odgovore i kategoriemo ih u nekoliko kategorija koje emo, takodje,
oznaiti brojanim oznakama. Ako radimo sa skalama procjene, onda
kodiramo tako da odgovoru koji izraava najvei stepen dajemo najvei
broj (moe i obrnuto, program ne pravi pitanja, ali e nam biti neloginije
u pregledu obradjenih podataka).
Korisno je i numerisati sve upitnike koje smo upotrebljavali,
ukoliko se ispitanici nisu potpisivali, da bi kasnije mogli lake da vrimo
ispravke ako pogrijeimo pri unoenju podataka.

Osnovne statistike metode i tehnike u SPSS-u

24

Specifinosti kompjuterske obrade


Kompjuterska obrada ima neke specifinosti koje je potrebno
potovati. Iako u projektovanju naeg instrumenta pitanja nazivamo
ajtemima, a grupe ajtema varijablama, kompjuterski program tretira
svaku unijetu kolonu u matricu podataka kao varijablu. Znai, svako
pitanje emo oznaiti nekim imenom i to emo nazivati varijablom.
Ukoliko radimo sa nekom skalom procjene koja ima vie tvrdnji sa
kojima ispitanik pokazuje slaganje ili neslaganje, moemo odmah sabrati
brojane oznake i te zbirne podatke za itavu skalu unositi u samo jednu
varijablu koja nam govori o izraenosti nekog stava. Ili ako imamo test
znanja moemo odmah sabrati tane odgovore i onda sve te podatke
staviti u samo jednu varijablu - varijablu zbira tanih odgovora. Ovakvi
postupci su mogui, ali se ne preporuuju, budui da time u daljoj obradi
gubimo podatke o tome kako su ispitanici odgovarali na pojedinane
odgovore. tavie, uz pomo kompjutera moemo ta raunanja i
transformacije obaviti kasnije i bez gubitaka podataka, tako da imamo i
pojedinane i zbirne podatke.
Kodni plan moemo napraviti tako to emo uzeti jedan
nepopunjen primjerak upitnika koji smo koristili, i na njemu oznaiti sve
varijable (naziv varijable moe imati samo 8 slova odnosno brojeva) i sve
mogue kodne vrijednosti varijabli. Taj papir treba da nam je u blizini,
tako da imamo brzi uvid u kodni proces dok ga ne zapamtimo.

Osnovne statistike metode i tehnike u SPSS-u

25

Definisanje varijabli
Kada otvorimo program SPSS nai emo se pred praznom tabelom
podataka. Vidjeemo da svaki red poinje sa brojevima, a svaka kolona
oznakom "var". SPSS podrazumijeva da svaki red sadri podatke o
pojedinom ispitaniku (sluaju), a u kolonama se nalaze vrijednosti
varijabli.
Za poetak emo definisati sve varijable koje imamo. To radimo
tako to odaberemo Variable View jeziak u donjem lijevom uglu
glavnog prozora za unos podataka. Izgled ekrana e se promijeniti i
dobiemo sljedei prozor:

Za razliku od matrice za unoenje podataka, ovdje (u matrici


varijabli) redovi oznaavaju varijable (u matrici podataka redovi su
sluajevi), a kolone opisuju karakteristike varijabli. Jednostavno treba
kliknuti na praznu eliju koju elimo da definiemo i odredimo eljene
osobine.
U koloni gdje pie Name upisujemo ime varijable. Ime moe
sadravati slova i brojeve, i neke znakove interpunkcije (razmak se ne
moe upotrebiti) i ne smije biti due od 8 znakova. Kad zavrimo sa
upisivanjem imena varijable, program e nam automatski upisati

Osnovne statistike metode i tehnike u SPSS-u

26

pretpostavljene osobine varijable u ostale kolone, ali mi bez problema


moemo da ih izmijenimo.
Sljedea osobinaje Type i tu moemo da biramo izmedju vie
tipova podataka koje varijabla sadri: za nas najzanimljiviji i uglavnom
emo taj oblik koristiti - Numeric - brojani oblik. Ostali tipovi definiu
neke posebne varijante matematikih, datumskih ili novanih podataka,
dok nam String daje za pravo da piemo slovne sadraje. Opcije Width
(cijeli brojevi) i Decimal Places (decimalna mjesta) definiu irinu
kolone koju upotrebljavamo. Ako je varijabla kategorika, ili ako sadri
samo cjelobrojne podatke, moemo u kuicu Decimal Places da upiemo
0.
Labels nam daje mogunost da upiemo dui opis varijable (mogu
se upisati i itave reenice). Ovo je veoma korisna opcija kad imamo
veliki broj varijabli kojima moramo smiljati kratka imene. Opis varijable
e nam kasnije dati ideju o tome ta sadre vrijednosti nae varijable
ukoliko zaboravimo.
U kolonu Value definiemo kod (brojanu oznaku koju unosimo
kao jednu od vrijednosti varijable). Value je brojana vrijednost koju
emo unositi, a pod Value Label unosimo naziv te vrijednosti (npr. u
potpunosti se slaem ako smo kodirali neku skalu procjene). Onda
pritisnemo dugme Add, vrijednost i njen opis bivaju ubaene donji
prozori i tako oslobadjamo prostor za definisanje nove vrijednosti na
isti nain. Dugme Change omoguava da mijenjamo ve definisane
vrijednosti i oznake, a dugme Remove da odstranimo neeljene
vrijednosti i oznake.
Opcija Missing nam otvara mogunosti da odredimo koje unijete
vrijednosti nee biti uzimane u obzir pri obradi podataka. Znai, te
vrijednosti emo vidjeti u tabeli podataka ali se nee obradjivati. Opcija
Discrete Missing Values nam omoguava da unesemo pojedinane
vrijednosti (3 kuice za 3 vrijednosti). Drugi nain je Range of missing
values, koji nam omoguava da definiemo najniu (Low) i najviu
(High) vrijednost raspona koji e se tretirati kao nevaljani podatak
(odnosno, nee se tretirati u obradi). Range plus one discrete missing
value predstavlja kombinaciju prve dve spomenute opcije.
U kolonama Columns i Align odredjujemo irinu (u brojanim
podacima) i poravnanje (lijevo, desno ili centralno) kolone za unos
podataka - kako e biti prikazana na ekranu.
Posljednja kolona ima naziv Measure i tu odreujemo nivo
podataka koji unosimo: Scale (brojani podaci), Ordinal
(ordinalni/rangovani podaci) i Nominal (nominalni/kategoriki podaci).
Kad definiemo prvu varijablu, moemo kliknuti na Data View u
donjem lijevom uglu ekrana, i time emo otii na matricu podataka. Sad
emo vidjeti da ime nae nove varijable stoji u zaglavlju prve kolone

Osnovne statistike metode i tehnike u SPSS-u

27

matrice podataka. Svaku sljedeu varijablu moemo definisati na slian


nain: treba da odemo na Variable View prikaz (dole lijevo odaberemo) i
definiemo osobine varijabli kako je ve opisano.
Ukoliko elimo da ubacimo varijablu izmedju dve ve definisane
varijable, kliknemo (desnim dugmetom mia) na ime varijable ispred koje
hoemo da ubacimo novu varijablu, i odabremo opciju Insert Variable.
Dalji postupak definisanja se odvija kako je na prethodnim stranicama
opisano.

Osnovne statistike metode i tehnike u SPSS-u

28

Unoenje podataka
Podatke moemo unositi u okviru razliitih programa i na razliite
naine. Ovdje emo opisati samo kako se podaci unose u okviru
programa SPSS, kako se unose uz pomo Windows alatke Notepad, i uz
pomo programa Microsoft Excel.
Unoenje podataka u SPSS-u
Nakon to smo definisali varijble, kao to je u prethodnom
poglavlju opisano, poinjemo sa unosom podataka u SPSS. Poeljno je da
odmah nakon definisanja varijable snimite fajl pod odreenim imenom.
To, naravno, uradite tako to ete ii na meni File/Save as..., odrediti
ciljni direktorijum za snimanje, i zadati odreeno ime fajlu:

U gornjem dijelu dijalog okvira, gdje pie Save in odrediemo


ciljni direktorijum u koji elimo snimiti nae podatke. U donjem dijelu,
tamo gdje pie File name unosimo ime naeg fajla. Na kraju potvrdimo
pritisnuvi tipku Save, i definisane varijable su snimljene.
Podatke uvijek unosimo po redovima, odnosno po sluajevima,
ispitanicima ili upitnicima. Poinjemo sa prvim ispitanikom i prvom
varijablom, dakle prva prazna elija u gornjem lijevom uglu tabele
(matrice) podataka. Inae, po tabeli se moemo slobodno kretati uz
pomo kursorskih strelica, tasterom Tab (jedno polje u desno), tasterom

Osnovne statistike metode i tehnike u SPSS-u

29

Enter (na dole). Kad unesete prvu vrijednost, dovoljno je da pritisnete


strelicu desno, ili Tab pa da se pomjerite na sljedeu eliju (sljedeu
varijablu). Tako radite sve dok ne stignete do posljednje definisane
varijable desno. Onda se vratite na poetak, uz pomo strelica ili mia, i
predjete na novi red.
Na sljedeoj slici moete da vidite kako to izgleda u procesu
unoenja:

Ovdje imamo primjer unoenja podataka iz istraivanja u kojem je


ispitivano znanje iz informatike tehnologije u nekoliko razliitih
gradova. Varijable koje smo definisali, bile su:
- redbroj (redni broj upitnika, 1-500)
- mjesto (1 Banja Luka, 2 Prijedor, 3 Doboj),
- pol (1 enski, 2 muki),
- starost (starost ispitanika, 15-65 godina),
- informat (skor na testu znanja, 10-50 bodova).
Preporuka: redovno (to ee) snimajte unesene podatke, jer u
sluaju da nestane struje ili se kompjuter "zaglavi" moraete ponovo
unositi izvjesnu koliinu podataka (onoliko koliko ste ih unijeli od
prolog snimanja fajla). Skraenica na tastaturi za snimanje podataka
(Save funkciju) je kombinacija tipki Ctrl + S.

Osnovne statistike metode i tehnike u SPSS-u

30

Unoenje podataka u Notepad-u


Podatke moemo unositi i uz pomo drugih programa, da bismo ih
naknadno uvezli u SPSS, i obraivali. Sve verzije Windows operativnih
sistema imaju instaliran jednostavan program za kreiranje tekstualnih
datoteka, koji se zove Notepad. Moemo ga pronai ukoliko idemo na
Start/Programs/Accessories meni Windows-a.
Izgled Notepad-a po otvaranju:

Prednost Notepad-a jeste njegova jednostavnost i rasprostranjenost


moe se nai na svakom kompjuteru sa instaliranim Windows-ima.
Podatke u Notepad unosimo jednostavno kao redove brojeva. Svaki
red predstavlja jedan upitnik, a svaka kolona (ili vie kolona) moe da
predstavlja varijablu. Ukoliko varijabla sadri dvocifrene brojeve, onda ih
treba pisati u formatu: 00, 01, 02 itd., a ukoliko ima trocifrene, onda: 001,
002, 003 itd. Time osiguravamo fiksnu irinu kolona, to nam olakava
neke stvari. Izmeu grupa varijabli koje unosimo zgodno je da stavimo
jednu praznu kolonu, tako da imamo jednostavan vizuelni uvid u tanost
koliine unesenih podataka: ukoliko na kraju unoenja jedne grupe
varijabli vidimo da imamo brojku vie ili manje od predvienih
moemo odmah izvriti provjeru podataka. Pri unoenju, tabela podataka
moe izgledati otprilike ovako:

Osnovne statistike metode i tehnike u SPSS-u

31

gdje imamo unesene podatke o ocjenama deset uenika neke kole na


prvom i drugom tromjeseju. U prvoj i drugoj koloni nam se nalazi redni
broj uenika, sljedeih devet kolona su nam devet ocjena na prvom, a
narednih devet su ocjene na drugom tromjeseju. Podatke snimimo kao
obinu tekstualnu datoteku.
Sljedei korak nam je uvoz ovako kreirane baze podataka u SPSS.
Novije verzije SPSS-a imaju jednostavan postupak za uvoz ovakvih
podataka. Nakon to otvorimo SPSS, idemo na meni File/Open/Data, i
dolazimo do prozora za odabir datoteke:

Osnovne statistike metode i tehnike u SPSS-u

32

Pod Look in: odaberemo direktorijum gdje smo snimili datoteku, a


pod Files of type: odaberemo tip datote u naem sluaju to je Text
(*.txt) tip. Selektujemo datoteku i kliknemo na Open i otvara nam se
procedura koja nas kroz est koraka vodi kroz uvoz podataka:

Tu moemo ostaviti sve kako jeste, potvrdimo sa Next, i dolazimo


do sljedeeg koraka:

Osnovne statistike metode i tehnike u SPSS-u

33

U drugom koraku treba da selektujemo kuicu Fixed width, jer smo


unosili podatke tako da broj kolona bide fiksan. Poto nismo jo definisali
imena varijabli, odgovor na pitanje Are variable names included at the
top of your file? e biti No. Potvrdimo sa Next, i dolazimo do treeg
koraka:

Poto smo podatke unosili poevi sa prvim redom, u prvoj kuici


ostaje upisano 1. Takoe, rekli smo da svaki red predstavlja jedan upitnik
(odnosno jednog ispitanika), te i u drugoj kuici ostaje upisano 1. Kroz
tree pitanje treba da odredimo koliko podataka uvozimo, i tu treba da
ostane selektovano All of the cases, jer mi uvozimo sve podatke.
Kliknemo na Next, i idemo na etvrti korak:

Osnovne statistike metode i tehnike u SPSS-u

34

Ovde treba da definiemo koje kolone e predstavljati varijable, a


to emo uiniti tako to kliknemo na prostor izmeu dvije kolone brojeva
i pojavie se crna linija na tom mjestu. Na slici moemo vidjeti kako smo
mi to uinili. Kad definiemo sve linije koje dijele varijable, potvrdimo sa
Next i idemo na peti korak:

U petom koraku imamo jednostavan uvid u to kako e izgledati


podaci u SPSS-u. Ukoliko smo neto pogrijeili, ili nam se ne svia,
jednostavno se vratimo na prethodni korak sa Back. Ako smo zadovoljni
ishodom potvrdimo sa Next, i idemo na poslednji korak:

Osnovne statistike metode i tehnike u SPSS-u

35

esti korak je formalan, i treba da sve ostavimo kako jeste, i


potvrdimo sa Finish. Po zavretku imamo podatke u SPSS-u:

Budui da vidimo kako imena varijabli nisu definisana, ve samo


piu oznake v1 do v19, moemo otii na Variable View, i definisati imena
varijabli i tipove podataka kako je to ve ranije opisano:

Osnovne statistike metode i tehnike u SPSS-u

36

Kad zavrimo definisanje ovako uvezene baze podataka, ostalo je


jo da snimimo sve to pod nekim imenom kao SPSS-ov fajl (tip *.sav), i
imamo gotovu bazu podataka u SPSS-u.

Osnovne statistike metode i tehnike u SPSS-u

37

Unoenje podataka u Microsoft Excel-u


Microsoft Excel je jo jedan program koji je iroko zastupljen, i u
naim uslovima se nalazi instaliran na skoro svim kompjuterima u okviru
paketa Microsoft Office. Zbog toga emo opisati postupak unoenja
podataka i pomou ovog programa. Excel je sposoban i za brojne
matematike i statistike procedure, ali time se neemo baviti na ovom
mjestu.
Nakon to otvorimo Excel, nai emo se pred velikom praznom
tabelom kod koje brojevi oznaavaju redove, a slova kolone:

Sve podatke moemo upisivati u tabelu poevi sa prvom elijom


tabele koja je oznaena sa podebljanim kvadratom (A1). Ako za primjer
uzmemo isti sluaj upisivanja ocjena kod uenika na prvom i drugom
tromjeseju, odluiemo da odmah definiemo i imena naih varijabli
tako da prvi red kolone nosi ime varijable. Prva kolona (A) e nam biti
varijabla sa rednim brojem ispitanika. Druga kolona (B) e biti varijabla u
kojoj e se nalaziti ocjena iz prvog predmeta na prvom polugoditu
(nazvaemo je oc1t1), i tako dalje.

Osnovne statistike metode i tehnike u SPSS-u

38

Kad zavrimo sa unoenjem podataka, tabela e izgledati ovako:

Podatke, naravno, snimimo (moemo mu dati ime ocjene.xls).


Sljedei korak je da te podatke uvezemo u SPSS. U SPSS-u idemo na
meni File/Open/Data, i dolazimo do sljedeeg dijalog prozora:

Pod opcijom Files of type odaberemo Excel tip fajlova, kliknemo


na fajl ocjene, i potvrdimo sa Open.

Osnovne statistike metode i tehnike u SPSS-u

39

Dolazimo do sljedeeg dijalog prozora:

Ovdje sve treba da ostavimo kako jeste, a to znai da program


iitava imena varijabli iz prvog reda, a automatski prepoznaje i koliinu
unesenih podataka. Potvrdimo sa OK, i imamo podatke unesene u SPSS:

Ostaje jo da snimimo podatke pod odgovarajuim imenom, i


moemo da radimo sa podacima kao i sa drugim podacima unesenim u
okviru SPSS-a.

Osnovne statistike metode i tehnike u SPSS-u

40

uvanje podataka
U SPSS-u imamo vie vrsta snimanja i izvoza podataka i rezultata
naih statistikih obrada. Sve te operacije obavljamo u glavnom meniju
File.
Save - snimanje podataka. Koristimo ako smo ve ranije dali ime
fajlu.
Ukoliko nismo ranije odredili ime i tip fajla, koristiemo
Save As... - snimanje novih podataka sa odredjivanjem imena i tipa
fajla. Kad izaberemo ovu opciju dobiemo prozor gotovo identian
onom sa Open opcijom: pod "Save in" odrediemo direktorijum u
koji snimamo, pod "File Name" upisaemo naziv fajla, a pod "Files
of type" odrediemo tip fajla. Za kraj pritisnemo dugme "Save".
Export - snimanje tabela, grafikona i rezultata obrade u drugim
formatima, tako da ih moemo otvoriti u drugim programima. Ovu
opciju imamo na raspolaganju kad je aktivan prozor Output.
Pod opcijom "Export" biramo ta e sve biti u eksportovanom
fajlu:
Output Document - sve se eksportuje
Output Document (No Charts) - sve sem grafikona se
eksportuje
Charts Only - samo grafikoni se eksportuju
Pod "File Name" odredjujemo ime fajla i putanju do direktorijuma
gdje e biti snimljen.
Pod "Export What" moemo izabrati "All Objects" ukoliko elimo
da se sve eksportuje u fajl, "All Visible Objects" ako elimo da
eksportujemo samo vidljive sadraje, i "Selected Objects" ako
elimo da eksportujemo samo selektovane objekte.
Pod "File Type" biramo tip fajla pod kojim e se snimiti naa
datoteka:
htm - HTML fajl, itljiv u internet itaima, ali i u veini
novih programa za obradu teksta (Word 97 i noviji)
txt - tekstualni fajl, itljiv u veini programa i na veini
kompjutera, ali sadri samo tekst - bez grafikona

Osnovne statistike metode i tehnike u SPSS-u

41

Otvaranje datoteka
Pod otvaranjem datoteka u SPSS-u podrazumijeva se svako
otvaranje ili uvoz baza podataka koji su kreirani bilo u okviru samog
SPSS-a, ili nekog drugog programa (Excel, Access, Statistica itd).
Takoe, moemo otvarati i rezultate ranije napravljenih ispisa ili
komandnih procedura.
Open - koristimo za otvaranje ranije snimljenih fajlova (baza
podataka, ispisa rezultata, komandnih programa).
Kad izaberemo ovu opciju dobijamo sljedei prozor:
Tamo gdje pie "Look in" odredjujemo direktorijum u kome se
nalaze nai fajlovi. Opcija "Files of type" je veoma bitna: SPSS e
nam prikazati samo fajlove one vrste koja je definisana u okviru
"Files of type", a druge nee. to znai da ako elimo da otvorimo
(ili vidimo) fajlove drugog tipa, moraemo da promijenimo tip
fajlova.
Tipovi fajlova (neki):
sav - standardni SPSS sirovi podaci
spo - ispisi rezultata obrade
sps - komandni program
sbs - skript
xls - Excel datoteka
por - prenosivi (medju razliitim programima) tip sa sirovim
podacima
all files - vidjeemo sve tipove fajlova koje Windows
poznaju
Na kraju izaberemo odredjeni fajl i pritisnemo dugme "Open".
Read ASCII Data - otvaranje fajlova sa sirovim podacima koji su
snimljeni u tekstualnom obliku. Imamo dvije podopcije:
Freefield - varijable se idu po istom redoslijedu za svaki red,
ali se ne nalaze nuno uvijek u istim kolonama za svaki red
(ili su odvojene nekim znakovima, kao to su taka ili zarez)
Fixed Columns - ita tekstualne datoteke kod kojih su kolone
fiksne - varijable se nalaze na istom mjestu (u istoj koloni)
za svaki red

Osnovne statistike metode i tehnike u SPSS-u

42

Manipulisanje podacima

Spajanje datoteka
Ako elimo da spojimo vie datoteka, obaviemo to po menijem
Data/Merge Files. Tu imamo mogunosti da dodajemo nove ispitanike
(Add Cases) ili da dodajemo nove varijable (Add Variables) ve
otvorenoj datoteci. Ovo je korisno kad se podaci unose na vie razliitih
mjesta, pa na kraju mogu da se spoje svi u jednu veliku datoteku, za
finalnu analizu podataka.
Dodavanje novih ispitanika (sluajeva):
Ako smo elimo da spojimo fajlove koji sadre iste varijable,
ali dodatne ispitanike, izabraemo opciju Add Cases, i
dobiemo prvi dijalog prozor koji nam omoguava da
izaberemo datoteku u kojoj se nalaze novi ispitanici. Dakle,
treba da izaberemo eljeni fajl i pritisnemo Open.

Ukoliko nova datoteka sadri sve iste varijable kao i stara, u


prozoru s lijeve strane (Unpaired Variables) se nee nalaziti
ni jedna varijabla. U prozoru s desne strane se nalaze imena
varijabli u novokreiranoj datoteci. Ukoliko ne elimo da
zadrimo neke varijable u novom fajlu, dovoljno je da ih
selektujemo u prozoru Variables in New Data File i izbacimo
(pritisnemo strelicu koja pokazuje lijevo).

Osnovne statistike metode i tehnike u SPSS-u

Dodavanje novih varijabli:


Ako smo elimo da spojimo fajlove koji sadre iste ispitanike,
ali dodatne varijable, izabraemo opciju Add Variables, i
dobiemo prvi dijalog prozor koji nam omoguava da
izaberemo datoteku u kojoj se nalaze novi ispitanici.
Izaberemo eljeni fajl i pritisnemo Open.

U okviru s lijeve strane (Excluded Variables) nalaze se imena


varijabli koje nee biti ubaene u novu datoteku - sve varijable
koje se ve nalaze u staroj datoteci. Sa (+) su oznaene sve
varijable iz datoteke koju dodajemo, a sa (*) sve varijable u
datoteci kojoj dodajemo. U prozoru s desne strane (New
Working Data File) vidimo koje e sve varijable biti ukljuene
u novu datoteku. U naem sluaju dodajemo samo jednu
varijablu koja se ne nalazi u staroj datoteci - "novavar".

43

Osnovne statistike metode i tehnike u SPSS-u

44

Spajanje podataka tako da grupe ispitanika ine jedan zbirni sluaj


Ovu proceduru moemo obaviti pod opcijom Data/Aggregate.
U prozori sa natpisom Break Variable(s) upisujemo varijablu
na osnovu ijih vrijednosti se saimaju podaci iz varijabli koje
upiemo u prozori Aggregate Variable(s). Znai, za sve
ispitanike koji imaju zajedniku vrijednost na Break Variable
program rauna neku zbirnu funkciju (na primjer aritmetiku
sredinu) na Aggregate Variable. Pod dugmetom Name&Label
odredjujemo imena novih varijabli, a pod Function odredjujemo
funkciju saimanja podataka. Ime novog fajla odredjujemo ako je
ukljuena opcija Create new data file, u suprotnom - otvara se
nova radna matrica (tabela) podataka.

Osnovne statistike metode i tehnike u SPSS-u

45

Najjednostavniji primjer za ovu proceduru je kad elimo da


izraunamo prosjean skor na nekoj varijabli za mukarce i ene.
Onda nam je pol Break, a varijabla iji prosjek elimo je
Aggregate, i pod Function izaberemo Mean.

Osnovne statistike metode i tehnike u SPSS-u

46

Grupisanje i selekcija podataka


Grupisanje podataka

Data/Split File opcija grupie ispitanike po vrijednostima


varijable koju odredimo (Groups Based on). Ako izaberemo
vie varijabli, prva na spisku e biti primarna, i u okviru njenih
kategorija e biti izvrena grupisanja za drugu varijablu. Kad je
ukljuena opcija Split File, sav ispis e biti organizovan po
ovim kategorijama. Opcija Compare groups znai da e ispis
biti zajedniki, tj. grupe e se nalaziti u istoj tabeli radi
medjusobnih poredjenja. Opcija Organize output by groups
dovodi do zasebnog ispisa za svaku kategoriju varijable koja
grupie.

Osnovne statistike metode i tehnike u SPSS-u

47

Selekcija podataka
Data/Select Cases selektuje ispitanike prema vrijednostima neke
varijable, oni koji nisu selektovani izbaeni su iz dalje analize ili su
potpuno izbrisani iz datoteke.
U dnu prozora, pod "Unselected Cases Are" biramo da li e
neselektovani ispitanici biti samo filtrirani (Filtered), tj nee se
uzimati u obzir pri statistikim operacijama, ili e biti trajno
izbrisani iz datoteke (Deleted).
Ukoliko je ukljuena opcija "All cases" znai da su selektovani
svi ispitanici.

Kad ukljuimo opciju If condition is satisfied i pritisnemo


dugme If... dobijamo mogunosti da odredimo uslove selekcije.
U gornji prozori upisujemo uslov: u naem sluaju uslov je
da ispitanici imaju vrijednost 1 na varijabli "pol", to znai da
e u dalju obradu biti ukljuene samo ene (u naem sluaju je
tako kodirano da ene imaju oznaku 1, a mukarci 2). Ukoliko
elimo viestruke uslove, npr. elimo da u dalju obradu
ukljuimo ene koje pohadjaju odredjenu kolu, izmedju dve
jednakosti (pol=1 i skola=2) stavimo logiko I (znak "&").
Znak "|" je logiko ILI. U podopcijama imamo jo mnogo
matematikih funkcija koje neemo nabrajati. Naravno treba da
potvrdimo sa Continue na ovom, i OK na prethodnom
prozoru.

Osnovne statistike metode i tehnike u SPSS-u

48

Moemo da selektujemo ispitanike na bazi sluajnog izbora,


ako ukljuimo opciju Random sample of cases, i u okviru toga
podesimo eljeni procenat ili broj ispitanika koji nam treba.

Na osnovu ranga (odnosno redoslijeda u datoteci) ih


selektujemo pod Based on time or case range, gdje podesimo
prvi i posljednji redni broj koji elimo da selektujemo.

Use filter variable iz dalje obrade izbacuje ispitanike koji na


datoj varijabli imaju vrijednost 0 ili im nedostaje podatak.

Osnovne statistike metode i tehnike u SPSS-u

49

Data/Weight Cases - ponderisanje (opereivanje) ispitanika.


Simulira se replikacija ispitivanja, i to u zavisnosti od
vrijednosti izabrane varijable. Vrijednosti ponder varijable
govore o navodnom broju opservacija. Iz dalje obrade se
izbacuju ispitanici koji imaju 0, negativnu vrijednost ili
nedostajui podatak.

Osnovne statistike metode i tehnike u SPSS-u

50

Transformacija podataka
Izraunavanja
Transform/Compute opcija nam omoguava da kreiramo
novu varijablu razliitim oblicima izraunavanja na osnovu
vrijednosti ve postojeih varijabli.
Na mjesto gdje pie Target Variable upisujemo ime nove
varijable koju kreiramo. Tamo gdje stoji Numeric Expression
upisujemo formulu na osnovu koje raunamo vrijednosti nove
varijable. Opet imamo na raspolaganju sve raunske operacije,
kao i mnogo matematikih i statistikih funkcija. U naem
primjeru (na slici gore) kreiramo novu varijablu zbirsekc ije
vrijednosti se dobijaju sabiranjem vrijednosti varijabli sekc1,
sekc2 i sekc3. Takodje, imamo i dugme If... kojim dolazimo do
mogunosti postavljanja uslova za raunanje vrijednosti
varijable (detaljnije pod Data/Select Cases).

Osnovne statistike metode i tehnike u SPSS-u

51

Prebrojavanja
Data/Count kreira varijablu u okviru koje se nalaze prebrojane
iste vrijednosti koje se nalaze u okviru raznih varijabli. Npr.
ukoliko imamo nekoliko varijabli koje govore o tome da li
ispitanici gledaju ili ne gledaju neke TV stanice (npr. 1 znai
da, a 0 ne), pa na kraju elimo da znamo koliko ispitanik
ukupno gleda TV stanica, iskoristiemo Count.
U okviru Target Variable upisujemo naziv nove zbirne
varijable, a u Target Label detaljnije pojanjenje sadraja
varijable. U okviru Numeric Variables ubacimo varijable koje
elimo da prebrojavamo. Obavezno je da se u okviru opcije
Define Values specifikuju vrijednosti ije prebrojavanje se eli
(u prethodnom primjeru sa TV stanicama, tu emo
specifikovati da elimo prebrojavanje pojavljivanja vrijednosti
1). Tu je i postavljanje uslova pod opcijom If...

Osnovne statistike metode i tehnike u SPSS-u

52

Rekodiranje
Rekodiranje radimo u ukviru menija Data/Recode.
Ako izaberemo podopciju Recode/Into Same Variables
mijenjamo vrijednosti u okviru varijable koju izaberemo.
Moemo unijeti i vie varijabli ukoliko ih rekodiramo na isti
nain.

U okvir Numeric Variables unesemo varijablu koju elimo da


rekodiramo, i pritisnemo dugme Old and New Values. Recimo
da smo mi eljeli da rekodiramo varijablu starost tako da
ispitanici uzrasta 15 25 godina ine kategoriju 1, 26 35
godina kategoriju 2, 36 45 kategoriju 3 itd.

Osnovne statistike metode i tehnike u SPSS-u

53

Pod Old and New Values definiemo kako vrimo to


rekodiranje, tj. koje vrijednosti e, i kako, biti izmijenjene. A tu
je i uslov If...
S lijeve strane definiemo koje vrijednosti emo mijenjati.
Moemo da unesemo pojedinane vrijednosti (Value),
nedostajue podatke (System-missing, System-or user-missing),
ili nizove vrijednosti (Range). S desne strane definiemo nove
vrijednosti, i to tako to u prozoriu gdje pie Value upiemo
novu vrijednost, i pritisnemo dugme Add. U naem primjeru
moemo vidjeti da smo mi mijenjali nizove vrijednosti u
pojedinane vrijednosti.
Za kraj, naravno, potvrdimo sa Continue.
Ako izaberemo podopciju Recode/Into Different Variables
rekodirane vrijednosti e biti zapisane pod novom varijablom
koju kreiramo.
Bitno je da izaberemo varijablu koju rekodiramo (pod Numeric
Variable), pod Output Variable definiemo ime nove varijable
(pod Label njeno pojanjenje), i pritisnemo dugme Change.
Pod Old and New Values definiemo kako vrimo to
rekodiranje, tj. koje vrijednosti e, i kako, biti izmijenjene.
Prozor za to redefinisanje je gotovo identian kao i u sluaju
opcije Into Same Variables.

Osnovne statistike metode i tehnike u SPSS-u

54

Automatsko rekodiranje - Transform/Automatic Recode


kreira novu varijablu i automatski rekodira sadraj neke string
(slovne) ili brojane varijable u sekvencijalne vrijednosti.
U prozor s desne strane ubacimo varijablu ije vrijednosti
elimo da rekodiramo, a u prozori dole unesemo ime nove
varijable, i pritisnemo dugme New Name. Moemo i da
definiemo da li e kodiranje poeti od najnie (Lowest value)
ili najvie vrijednosti.
String varijable se kodiraju po abecednom redu.

Osnovne statistike metode i tehnike u SPSS-u

55

Rangovanje podataka
Opcija Transform/Rank Cases nam omoguava da kreiramo novu
varijablu koja sadri rangovane vrijednosti izabrane varijable.
Program sam odredjuje ime nove varijable, na osnovu imena
izabrane varijable. Varijablu ije vrijednosti elimo da
rangujemo ubacimo u okvir Variable(s). U okvir By moemo
da ubacimo neku varijablu na osnovu koje e organizovati
rangovanje izabrane varijable (rangovaemo sluajeve zasebno
u okviru svake vrijednosti organizacione varijable). Moemo
da definiemo rangove u uzlaznom ili silaznom rasporedu
(Assign Rank 1 to). Pod Rank Types moemo izabrati
viestruke metode rangovanja, a pod Ties metod dodjeljivanja
rangova istovjetnim vrijednostima.

Osnovne statistike metode i tehnike u SPSS-u

56

Kreiranje vremenskih serija


Create Time Series - kreira novu varijablu transformacijom postojee
varijable bazirane kao vremenski serijal (gdje svaka sljedea vrijednost u
koloni predstavlja opservaciju u sljedeem ekvidistantnom vremenskom
periodu).
U okvir gdje pie New Variable(s) ubacimo vremensku
varijablu koju elimo da transformiemo. Tamo gdje pie Name
moemo da unesemo ime nove varijable, mada se automatski
upisuje podrazumijevano ime - prvih est slova stare varijable
plus brojana oznaka. Ispod natpisa Function moemo izabrati
funkciju transformacije.

Osnovne statistike metode i tehnike u SPSS-u

57

Tretiranje nedostajuih podataka


Replace Missing Values - popunjava elije kod kojih postoji nedostajui
podatak.
U okvir New Variable(s) ubacimo varijablu kod koje elimo da
eliminiemo prazne elije. Tamo gdje pie Name moemo da
unesemo ime nove varijable, mada se automatski upisuje
podrazumijevano ime - prvih est slova stare varijable plus
brojana oznaka. Ispod natpisa Method moemo izabrati
funkciju na osnovu koje se vri popunjavanje nedostajuih
podataka.

Od metoda za zamjenu nedostajuih podataka ponuene


sljedee opcije:
- Series mean zamijenjuje nedostajue podatke prosjenom
vrijednou itavog niza podataka.
- Mean of nearby points zamijenjuje nedostajue podatke
prosjenom vrijednou bliskih (okruujuih) podataka.
- Median of nearby points zamijenjuje nedostajue podatke
medijanom bliskih (okruujuih) podataka.
- Linear interpolation zamijenjuje nedostajue podatke
interpolacijom prosjekom na osnovu veliine mjere ispred i
iza nedostajue mjere.
- Linear trend at point zamijenjuje nedostajue podatke na
osnovu odreenih analiza trenda za datu varijablu.

Osnovne statistike metode i tehnike u SPSS-u

58

Deskriptivne statistike mjere


Deskriptivne statistike mjere, kao to smo to ve rekli u uvodu,
predstavljaju osnovne mjere kojima na osnovu dobijenih podataka
opisujemo na uzorak. To mogu biti najjednostavnija prebrojavanja, tako
da postignua ispitanika sumarno prikaemo u obliku broja sluajeva u
okviru pojedinih kategorija (razreda distribuiranih rezultata), procentualni
prikazi, ili razliite mjere centralne tendencije i mjere idsperzije
(rasprenja, odstupanja rezultata).

Frekvencije i procenti
Prostim frekvencijskim prikazom se predstavlja frekvencija (broj)
ispitanika koji su postigli odreeni rezultat na nekom mjernom
instrumentu koji smo zadali (test, upitnik, anketa, opservacija itd.). Time
dobijamo najbri uvid u raspodjelu skorova ispitanika koje oni postiu pri
datom mjerenju. Meutim kada se radi o mjernim instrumentima koji
imaju veliki raspon moguih rezultata (npr. test informisanosti koji se
sastoji od 85 ajtema i gdje konaan rezultat moe da se kree od 0 do 85
bodova) prosti frekvencijski prikaz (nazivamo ga i frekvencijskim
prikazom sirovih rezultata) moe biti veoma nezgodan, kako za
razmatranje rezultata, tako i za prikazivanje.
Problem pri razmatranju raspodjele skorova u navedenom primjeru
se ogleda u tome to se vrlo esto frekvencije pojedinih rezultata koje se
meusobom vrlo malo razlikuju. Sa druge strane frekvencijski prikaz
sirovih rezultata dobijen mjernim instrumentom sa veim rasponom
dobijenih rezultata je esto vrlo nepregledan. Zbog toga se onda
distribucija rezultata dijeli u manji broj kategorija, koje nazivamo
intervalnim razredima, tako da tada frekvencijski prikaz ima vie smisla.
Samo razvrstavanje rezultata koje ispitanici ostvaruju u manji broj
kategorija obavlja se prema prema odreenim kriterijumima koji koje
postavlja sam istraiva prema zahtjevima koji su postavljeni odreenom
statistikom metodom koja se primjenjuje3 ili teorijskom idejom na kojoj
3 Kao primjer raspodjele ispitanika u kategorije prema zahtjevima odreene statistike metode koja se
primjenjuje moemo navesti sluaj kada elimo utvrditi postoji li statistiki znaajna razlika izmeu
ispitanika koji su poloili ispit iz Psihometrije ili ne, prema uspjehu na testu informisanosti. Ukoliko
elimo da eventualno postojanje znaajne razlike ispitamo putem t-testa, prvo je potrebno ispitanike
razvrstati na osnovu ukupnog broja bodova postignutih na testu iz Psihometrije u dvije kategorije,
poloili i nisu poloili ispit. Zatim utvrditi da li postoji razlika izmeu aritmetikih sredina tako
formiranih grupa prema uspjehu na testu informisanosti i da li je eventualna razlika izmeu grupa
statistiki znaajna na nekom od nivoa znaajnosti ili ne.

Osnovne statistike metode i tehnike u SPSS-u

59

je istraivanje zasnovano4. Pojmovi kojima se barata pri razmatranju


raspodjele ispitanika po kategorijama su:
R - raspon dobijenih skorova; ija je vrijednost razlika izmeu
najvieg i najnieg skora dobijenog pri jednom mjerenju,
i - interval; brojna vrijednost koja pokazuje opseg jednog razreda.
Vrijednost intervala dodana na najniu mjeru jednog razreda
jednaka je najnioj mjeri sljedeeg razreda. Interval moe biti
bilo koji pozitivan cijeli broj5,
r - razred; jedna od kategorija u koju spadaju ispitanici iji je
dobijeni rezultat jednak ili vei od njegove najmanje mjere i
jednak ili manji od njegove najvee mjere. Broj rezreda u
jednoj distribuciji jednak je koliniku raspona i intervala
(ukoliko vrijednost kolinika nije cijeli broj, broj razreda
jednak je vrijednosti cijolog broja uveanoj za 1)6,
f - frekvencija; broj sluajeva (ispitanika) koji prema ostvarenoj
vrijednosti date varijable pripadaju jednoj i samo jednoj
kategoriji kategoriji te varijable.
U opisu rezultata istraivanja se pored frekvencija, koje se mogu
oznaiti apsolutnim mjerama prebrojavanja, koriste i procenti i
proporcije, koje se nazivaju relativnim mjerama prebrojavanja. Razlika
izmeu frekvencija sa jedne, i procenata i proporcija sa druge strane, je u
tome to frekvencije ukazuju na broj sluajeva koji pripadaju samo jednoj
kategoriji, dok procenati i proporcije govore o odnosu broja sluajeva
(ispitanika) jedne kategorije sa ukupnim brojem sluajeva.
Procenat tako kao relativna mjera prebrojavanja pokazuje odnos
broja sluajeva jedne kategorije prema ukupnom broju ispitanika
pomnoenom sa 100.

P=

f
100 ,
N

gdje je

P - procenat ispitanika koji postie odreen rezultat (pripada


odreenoj kategoriji),
f - frekvencija date kategorije,
4 Studentima psihologije najpoznatiji primjer raspodjele ispitanika u kategorije zasnovan na odreenoj
teorijskoj ideji je razvrstavanje ispitanika u kategorije prema postognutom koeficijentu inteligencije.
Tako koeficijentu inteligencije, numerikoj varijabli dobijenoj na testu inteligencije VITI ispitanici se
razvrstavaju u kategorije prema Vekslerovoj teoriji inteligencije (Biro, 1996).
5 Za intervale se najee uzimaju neparni brojevi (u objanjenju izbora neparnog broja bi
najjednostavnijebilo rei da je to esnafski obiaj).
6 Raspon i interval je jedino mogue utvrditi kada se barat sa podacima sa najmanje intervalne skale.

Osnovne statistike metode i tehnike u SPSS-u

60

N - ukupan broj ispitanika u uzorku.


Proporcija je takoe relativna mjera i jednaka je odnosu broja
sluajeva jedne kategorije prema ukupnom broju ispitanika.

p=

f
,
N

gdje je

p - proporcija ispitanika koji postie odreen rezultat (pripada


odreenoj kategoriji),
f - frekvencija date kategorije,
N - ukupan broj ispitanika u uzorku.
Rezultate u obliku frekvencija moemo dati predstaviti preko
tabele ili grafikona. Grafikoni frekvencija koje naee primjenjujemo su
histogram (ili stupasti dijagram) i poligon frekvencija. I tabele i
grafikoni kojima se rezultati prikazuju preko frekvnecija kao mjera
prebrojavanja su vrlo jednostavni i pregledni7.
Histogram

Poligon frekvencija

40

30

30

20

20

10

0
17.0 18.0 19.0 20.0 21.0 22.0 23.0 24.0 25.0 26.0 27.0 28.0 29.0 30.0

Count

10

0
16.5

18.0 19.5

20.5 21.5

22.5

23.5 24.5

25.5 26.5

27.5 28.5

29.5

I kod histograma i kod poligona frekvencija se na apscici nalaze


rezultati koje ispitanici postiu pri nekom mjerenju, u obliku pojedinanih
rezultata koje ispitanici postiu ili formiranih kategorija, dok su na
ordinati frekvencije postignutih rezultata ili razreda ispitanika.
Procentni prikaz bi bio neto naprednija verzija, gdje
relativizovanje frekvencija omoguava najelementarnija poreenja
razliitih grupa ispitanika po odreenim razredima distribucije. Na
7 Mislimo da nije zgoreg pomenuti da nije potrebno da se rezutati predstavljaju na oba naina, i u
tabelama i putem grafikona. Time se samo bespotrebno ponavljaju dobijeni rezultati i njihove
interpretacije. Takav pleonazam samo razvodnjava rezultate istraivanja koji se prikazuju.

Osnovne statistike metode i tehnike u SPSS-u

61

primjerima histograma i poligona frekvencija je prikazana razlika izmeu


pripadnika mukog i enskog pola ispitanika na testu informisanosti.
Histogram

Poligon frekvencija

12

12

10

10

POL

2
muski

zenski

16.5

19.5
18.0

Rezultat testa

21.5
20.5

23.5
22.5

25.5
24.5

27.5
26.5

29.5
28.5

Percent

Percent

POL
2

muski
zenski

0
16.5

19.5
18.0

21.5
20.5

23.5
22.5

25.5
24.5

27.5
26.5

29.5
28.5

Rezultat testa

Sad se prvi put susreemo sa analizama podataka. Kad prvi put


uradimo analizu podataka SPSS e ih prikazati u zasebnom prozoru koji
se zove Output (ili prozor za ispis). On e nam biti aktivan u donjoj traci
radne povrine i prikazivae se kao zaseban program.
Deskriptivne analize kategorikih varijabli obino radimo tako
da rezultate prikaemo u vidu frekvencija i procenata. U SPSSu
emo
tu
mogunost
ostvariti
preko
menija
Analyze/Descriptive
Statistics/Frequencies.
Dobiemo
prozor sa opcijama koji izgleda kao na slici: stics/Frequencies.

U donjem dijelu slike vidimo tri tastera koja nas vode do razliitih
mogunosti. U ovom trenutku za nas e biti interesantna opcija
iscrtavanja grafikona (opcija Charts), u okviru koje moemo potvrditi

Osnovne statistike metode i tehnike u SPSS-u

62

opciju Bar charts (histogram ili stupasti prikaz). Kad unesemo u prostor
s desne strane unesemo varijable (mi smo unijeli varijablu pol) i
potvrdimo sa OK, dobiemo sljedei ispis:

Frequencies
Statistics

pol
N

Valid
Missing

507
1

pol

Frequency
Valid

Missing

Percent

Valid Percent

Cumulative
Percent

muski

229

45.1

45.2

45.2

zenski

278

54.7

54.8

100.0

Total

507

99.8

100.0

.2

508

100.0

System

Total

pol
300

200

Frequency

100

0
muski

zenski

pol

Prva tabela nam govori koliki je ukupan uzorak ispitanika. Vidimo


da smo u ovom primjeru imali ukupno 508 ispitanika, od kojih je 507
uzeto u obradu (ispitanici sa valjanim podacima - Valid), i jedan za koga
nismo registrovali polnu pripadnost (Missing).
Druga tabela nam je najinformativnija, i u njoj se nalaze za nas
najbitniji i najzanimljiviji podaci. U prvoj koloni tabele (Frequencies) se
nalaze oznake kategorija za koje su utvrene frekvencije (kategorije
varijable pol, muki i enski) i pored njih ukupna veliina uzorka, broj

Osnovne statistike metode i tehnike u SPSS-u

63

valjanih podataka i podataka koji izostaju iz obrade. Druga kolona nam


govori o vrijednostima opaenih (empirijskih) frekvencija za kategorije
date varijable. Kolona Percent nam govori o procentualnoj zastupljenosti
mukih i enskih ispitanika u odnosu na ukupan broj ispitanika (508 u
naem sluaju), ukljuujui i jednog iji pol nismo registrovali. Kolona
Valid Percent nam govori o procentualnoj zastupljenosti mukih i enskih
ispitanika, ali ovaj put u odnosu na valjani broj ispitanika (507 u naem
sluaju), i uglavnom koristimo ovaj procentualni prikaz. Konano,
posljednja kolona (Cumulative Percent) nam daje kumulativne procente,
odnosno predstvlja zbir procenata datog razreda sa procentima prethodnih
razreda. Red tabele u kojoj pie Missing nam (opet) govori o broju i
procentu ispitanika sa nedostajuim podacima.
Na kraju imamo i grafiki prikaz podataka, ovaj put u stupastom
grafikonu (histogramu), mada smo mogli izabrati i neki drugi prikaz
(pitasti ili histogram sa normalnom krivom).

Osnovne statistike metode i tehnike u SPSS-u

64

Mjere centralne tendencije


Mjere centralne tendencije nam ukazuju na tendencije grupisanja
oko neke centralne vrijednosti u distribuciji rezultata mjerenja. Njihovim
koritenjem se najbre, najjednostavije i najuoptenije mogu opisati
mjerene pojave na datom uzorku. Najee mjere centralne tendencije
koje se koriste su: aritmetika sredina, medijana i mod.
Aritmetika sredina je mjera sa kojom se najee susreemo u
statistikim izvjetajima, i govori nam koji je prosjean skor u naoj
distribuciji. U odnosu na medijanu i mod mnogo je pouzdanija. Pored
oznake M, aritmetika sredina se jo moe oznaiti i sa AS i X .
Matematiki se izraava kao kolinik zbira svih dobijenih rezultata i
ukupnog broja rezultata.
M =

M
X
N

X ,
N

gdje je

aritmetika sredina,
pojedinani skor ispitanika,
ukupan broj sluajeva mjerenja (broj rezultata),
oznaka za sumu.

Za raunanje aritmetiku sredinu, moraju biti ispunjena dva uslova:


1. da rezultati mjerenja potiu sa intervalne ili racio skale
2. da postoji pretpostavka o normalnoj raspodjeli tih mjera u
populaciji.
Medijana nam govori koji je centralni rezultat u distribuciji,
odnosno ukazuje na skor koji dijeli distribuciju na dva jednaka dijela.
Znai, ako rezultate mjerenja poredamo po veliini, medijanu emo dobiti
tako to emo izdvojiti rezultat koji se nalazi na samoj sredini (u sluaju
kada distribucija ima paran broj rezultata, to e biti sredina izmeu dva
srednja skora). Formula za odreivanje medijane iz niza podataka
poredanih po veliini je:
Mdn =

N
,
2

gdje je

Osnovne statistike metode i tehnike u SPSS-u

65

Mdn - medijana,
N - ukupan broj rezultata.
Mod, konano, predstavlja najgrublju, odnosno statistiki
najneprecizniju, mjeru centralne tendencije neke distribucije. Govori nam
koji se rezultat u jednoj distribuciji podataka najee pojavljuje.
Nedostatak moda kao mjere centralne temdecije uoavamo kad se
sretnemo sa distribucijom u kojoj imamo dva ili vie najea rezultata
(bimodalne, odnosno polimodalne distribucije). U takvim sluajevima ne
moe se uzeti samo jedna najfrekventnija vrijednost jer se time znaajno
naruava dobijena distribucija podataka i jer se tada interpretacije i
zakljuci baziraju na netanim rezultatima rezultata
Iako je statistiki pouzdanija od moda i medijane, i treba je koristiti
uvijek kad je to mogue, aritmetika sredina ima svojih nedostataka
osjetljiva je na ekstremne rezultate. Ako za primjer uzmemo firmu u kojoj
imamo sedam zaposlenih koji primaju sljedee plate: radnici primaju 200,
210, 220, 230, 240 i 250 KM, dok direktor prima 5000 KM. Ako
izraunamo aritmetiku sredinu, rei emo da prosjena plata u toj firmi
iznosi 907.14 KM. Primjetiemo da nam ta cifra ne odslikava pravo
stanje u toj firmi. S druge strane, ako uzmemo medijanu (centralnu
vrijednost u nizu), to e biti 230 KM, to je ve realniji podatak kojim
bismo oslikali nau priu8.

8 Kako aritmetika sredina kao mjera centralne tendencije moe biti nepouzdan parametar koji
predstavlja skup vrijednosti jedne varijable moe se vidjeti iz sljedeeg primjera. Petorica mladia, od
kojih svaki ima 20 godina su provodili popodne na zabaenoj plai. Od jednog prolaznika su uli da na
se na drugoj plai nalazi pet enskih osoba, ija je aritmetika sredina godina takoe 20. Bez ikakvog
razmiljanja, njih petorica su krenuli prema drugoj plai, meutim tamo nisu nali ba onakav prizor
kakav su oekivali. Naime tu se zaista nalazilo pet enskih osoba, ali su to bile etiri djevojice, koje su
imale po 5, 5, 7 i 8 godina, sa svojom bakom koja je imala 75 godina. Iz primjera je jasno da postoje
situacije gdje je mod pouzdanije mjere centralne tendencije od aritmetike sredine.

Osnovne statistike metode i tehnike u SPSS-u

66

Mjere varijabilnosti
Za potpunije opisivanje mjerenih pojava, pored mjera centralne
tendencije, navodimo i mjere variranja (odstupanja, rasprenja, disperzije)
od centralnih mjera. Ako su vrijednosti nekog niza mjera gusto grupisane
oko srednje vrijednosti, onda ta srednja vrijednost dosta vjerno
reprezentuje mjerenu pojavu. S druge strane, ukoliko su odstupanja
rezultata velika, onda smo u situaciji da nam ta srednja vrijednost ne
govori mnogo o tendencijama mjerene pojave. Od statistikih mjera
varijabilnosti se najee koriste raspon, kvartilna devijacija, standardna
devijacija, standardna greka aritmetike sredine, varijansa, skjunis i
kurtozis.
Najjednostavnija mjera varijabilnosti rezultata je raspon, i govori
nam kolika je razlika izmeu najvee i najmanje mjere u nizu. Raspon je
prilino gruba mjera odstupanja, ali se moe koristiti kao dodatni opis
mjerene pojave. Formula za utvrivanje ove mjere disperzije je:
R = Xmax - Xmin,

gdje je

R - raspon,
Xmax - najvei dobijeni rezultat,
Xmin - najmanji dobijeni rezultat.
Kvartilnu devijaciju koristimo kad opisujemo distribucije koje
odstupaju od normalne raspodjele. To mogu biti razliite asimetrine
distribucije, ili polimodalne distribucije rezultata. Matematiki se
izraava kao:

Q=

Q3 Q1
,
2

Q - kvartilna devijacija,
Q 3 - trei kvartil,
Q1 - prvi kvartil.

gdje je

Osnovne statistike metode i tehnike u SPSS-u

67

Pri tome treba rei da je


Q1

P25

Q3

P75,

gdje je

P25 - percentil 25 i
P75 - percentil 75,
odnosno da je prvi kvartil jednak percentilu 25 i trei kvartil jednak
percentilu 75. Percentil predstavlja mjesto u distribuciji mjera ispod kojeg
se nalazi odreen procenat sluajeva, tako da je percentil 25, odnosno
prvi kvartil, mjesto u distribuciji podataka ispod koga se nalazi 25% i
percentil 75, odnosno trei kvartil, mjesto u distribuciji podataka ispod
koga se nalazi 75% ukupnih sluajeva.
Standardna devijacija za najpreciznija i najpouzdanija mjera
varijabilnosti pojava. Definie se kao mjera varijabiliteta koja pokazuje
koliko je odstupanje skorova distribucije od njene aritmetike sredine. Sa
obzirom da se standardna devijacija rauna u odnosu na aritmetiku
sredinu (nikad medijanu ili mod) i za nju vae uslovi: da dobijeni podaci
potiu sa intervalne ili racio skale, i pretpostavka o normalnoj raspodjeli
mjera u populaciji. Imajui u vidu vanost standardne devijacije
Sprinthall (1990) je opisuje kao srce i duu koncepta varijabilnosti.
Standardna devijacija je specifina mjera varijabilnosti, i moe se opisati
kao kvadratni korijen iz prosjenog zbira kvadrata odstupanja.
Matematiki prikazano, formula za izraunavanje izgleda ovako:

(X M )
N 1

- standardna devijacija,

X
M
N

pojedinani skor ispitanika,


aritmetika sredina,
ukupan broj sluajeva mjerenja,
oznaka za sumu.

gdje je:

Osnovne statistike metode i tehnike u SPSS-u

68

Standardna devijacija nam slui ne samo za prosti opis mjerene


pojave, nego i za statistici zakljuivanja, to nam onda prua vee
mogunosti generalizacije zakljuaka, ali time emo se pozabaviti
kasnije.
Kada su zakljuci koji se donose vezani za aritmetiku sredinu, u
stvari se koristi aritmetiku sredinu dobijenu na odreenom uzorku da bi
se procijenila aritmetiku sredinu populacije. Greka koju se ini prilikom
te procjene naziva se standardna greka aritmetike sredine.
Zakljuivanje o populacijskoj aritmetikoj sredini e biti utoliko tanije
to je vei uzorak i to je mjerena pojava manje varijabilna. Poto se na
varijabilnost neke pojave ne moe uticati, ukoliko se ne moe da obaviti
mjerenje na svim lanovima populacije (a to se gotovo nikad ne moe),
greka procjene se moe smanjiti veim brojem mjerenja. Oznaka za
standardnu graku aritmetike sredine je M ili SE M, a formula za njeno
izraunavanje:

M =

ili
M =

N 1

(za uzorke manje od 100),

gdje je

- standardna greka aritmetike sredine


- standardna devijacija
- ukupan broj sluajeva mjerenja,

Varijansu je najjednostavnije predstaviti kao mjeru varijabilnosti


koja je jednaka kvadriranoj vrijednosti standardne devijacije, pa je njena
formula:
V= ,
2

gdje je

Osnovne statistike metode i tehnike u SPSS-u

- varijansa
- standardna devijacija,

ili

V
X
M
N

69

V=

( X M ) 2
,
N 1

gdje je

varijansa,
pojedinani skor ispitanika,
aritmetika sredina,
ukupan broj sluajeva mjerenja,
oznaka za sumu.

U osnovi varijansa i standardna devijacija predstavljaju istu mjeru


varijabilnosti. Meutim, postoje situacije u kojima statistike operacije sa
varijansom dozvoljavaju analize koje bez uea varijanse ne bi bile
mogue.
Pored navedenih, kao mjera varijabilnosti su vrlo vane i skjunis
(skewness) i kurtozis (kurtosis). Na osnovu njihovih vrijednosti se donose
zakljuci o odstupanja empirijske raspodjele od normalne krive. Na
osnovu vrijednosti skjunisa se vri zakljuivanje o pozitivnom ili
negativnom odstupanju dobijene raspodjele podataka u odnosu na
normalnu (horizontalno odstupanje), dok se na osnovu poznavanja
vrijednosti kurtozisa zakljuuje o odstupanju dobijene raspodjele po
visini (vertikalno odstupanje).
Kako je navedeno skjunis je statistik na osnovu kojeg se donosi
zakljuak o tome da li je empirijska raspodjela podataka pozitivno ili
negativno asimetrina (iji jednostavnije reeno da li distribucija podataka
grafki predstavljeno skree u lijevu ili desnu stranu. Formula za
izraunavanja skjunisa je:

Sk =

P90 + P10
P50 ,
2

Sk - skjunis
P90 - precentil 90
P10 - percentil 10

gdje je

Osnovne statistike metode i tehnike u SPSS-u

70

P50 - percentil 50
Svojom vrijednosti skjunis izraava veliinu asimetrije, dok svojim
predznakom ukazuje na smjer asimetrije, pozitivan ili negativan.
ematski prikazane, asimetrine distribucije izgledaju ovako:

Kao to je ve reeno prilikom izraunavanja kurtozisa se utvruje


eventualno vertikalno odstupanje dobijene distribucije od normalne. Na
osnovu raspodjele podataka i vrijednosti kurtozisa se utvruje da li
postoji tendecija grupisanja podataka oko aritmetike sredine ili se podaci
raspruju podjednako du apscise. Formula za izraunavanje kurosisa je:
Ku =

Q
Ku
P90
P10

Q
,
P90 P10

kvartilna devijacija,
kurtozis,
precentil 90,
percentil 10

Pri tome je:

Q=

Q - kvartilna devijacija
P915 - precentil 15,
P25 - percentil 25.

P75 P25
,
2

gdje je

Osnovne statistike metode i tehnike u SPSS-u

71

Vrijednost kurtozisa koja se izraunava je uvijek manja od jedan.


Dobijenu vrijednost se uvijek poredi sa vrijednosti 0.263 koliko iznosi
kurtosis za normalnu krivu. Ukoliko je dobijena vrijednost kurtozisa vea
od 0.263 onda je distribucija platikurtina, tj. spljotena. Ako je dobijena
vrijednost manja od 0.263, onda je distribucija leptokurtina, tj.
izduenog oblika. ematski prikazano, te distribucije izgledaju kao na
slici:

Ku < .263 - leptokurtina kriva,


Ku = .263 - normalna kriva,
Ku > .263 - platikurtina kriva.
Sad treba da vidimo kako emo raunanja ovih mjera centralne
tendencije i varijabilnosti obaviti u SPSS-u. Znai, zanimaju nas mod,
medijana i aritmetika sredina, a od mjera odstupanja tu su standardna
devijacija, kvartilna odstupanja i mjere zakrivljenosti dobijene
distribucije podataka. Nije zgoreg napomenuti da aritmetiku sredinu i
standardnu devijaciju koristimo ukoliko imamo podatke koji
zadovoljavaju uslove intervalne ili racio skale. Za primjer emo uzeti

Osnovne statistike metode i tehnike u SPSS-u

72

rezultate sa skale autoritarnosti kao osobine linosti, koja je primijenjena


na uzorku od 496 ispitanika.
Ukoliko radimo na podacima sa ordinalne skale, mjere
centralne tendencije i odstupanja emo traiti na slian nain
kao
i
kod
frekvencijskih
tabela: preko menija
Analyze/Descriptive Statistics/Frequencies, i moemo da
iskljuimo kuicu Display frequency tables da na bismo gledali
neeljeno velike frekvencijske tabele...

...a zatim emo pritisnuti dugme Statistics, i zabraemo neke


od mjera koje elimo.

Osnovne statistike metode i tehnike u SPSS-u

73

Ako elimo prikaz aritmetike sredine i standardne devijacije


za intervalne ili racio podatke, kao i drugih mjera opisa, idemo
na meni Analyze/Descriptive Statistics/Descriptives i
unesemo u desni prozor eljenu varijablu (u naem sluaju to je
skor na skali autoritarnosti).

Da bi vidjeli koje statistike mjere su nam na raspolaganju,


kliknemo na dugme Options i dolazimo do izbora mjera. Za
poetak su oznaene aritmetika sredina (Mean), standardna
devijacija, minimum i maksimum, raspon Range), standardna
greka aritmetike sredine (S.E. mean). Ukoliko elimo da
vidimo zakrivljenost nae distribucije moemo ukljuiti i mjere
zakrivljenja (Kurtosis i Skewness), da bismo vidjeli da li
znaajno odstupa od normalne raspodjele mjera.

Kad na kraju potvrdimo sa OK, dobiemo sljedei ispis:

Osnovne statistike metode i tehnike u SPSS-u

74

Descriptives
Descriptive Statistics
N

Range

Statistic Statistic
SKOR.AUT

495

Valid N (listwise)

495

Minimum Maximum
Statistic

50

Statistic
18

Mean
Statistic

68

47.991

Std. Deviation

Std. Error

Statistic
0.389

Skewness
Statistic

8.663

-0.325

Kurtosis
Statistic
-0.0193

Iz tabele moemo vidjeti da imamo 495 ispitanika iji su rezultati


uzeti u obradu, da je raspon rezultata 50, da je minimalni skor 18, a
maksimalni 68. Vrijednost aritmetike sredine je 47.98, a njena
standardne greke 0.389, dok standardna devijacija iznosi 8.66. Skewness
je 0.325 to znai da je naa distribucija negativno asimetrina (skree
na lijevu stranu). Kurtosis je manji od 0.263 na onsnovu ega
zakljuujemo da je kriva empirijske distribucije izduena u odnosu na
normalnu, tj. leptokurtina.

Osnovne statistike metode i tehnike u SPSS-u

75

Deskriptivne mjere za dva ili vie uzoraka


esto se javlja potreba za uporeenjem deskriptivnih mjera dvaju
ili vie poduzoraka u okviru jednog istraivanja. To recimo moe biti
sluaj kad se ele uopteno uporediti postignua mukih i enskih
ispitanika na nekom testu, ili da se uporede prosjeci uenikih ocjena po
razredima osnovne kole. Mi emo za primjer uzeti jedno ispitivanje koje
se bavilo znanjem iz oblasti informatickih tehnologija, gdje je predmet
interesovanja stepen posjedovanja informatickih znanja kod ljudi
razliitih uzrasnih skupina. Postoji vie naina da se ovo uradi u SPSS-u.
Najjednostavniji je sljedei:
Idemo na meni Analyze/Compare Means/Means, i u okvir
iznad kojeg pie Dependent List ubacimo varijablu ije skorove
elimo porediti (u naem sluaju to je rezultat na testu znanja iz
informatike). U Independent List ubacimo kategoriku
varijablu u kojoj se nalaze informacije o naim poduzorcima (u
naem sluaju to je varijabla starost). Da bismo odabrali
deskriptivne mjere koje elimo vidjeti, pritisnemo dugme
Options.

Time se dobija prozor na ijoj lijevoj strani se nalaze mjere


koje su na raspolaganju, a s desne strane je okvir u koji se
unose parametri koje elimo da razmotrimo. Za poetak su
odabrane aritmetike sredine (Means), standardne devijacije
(Standard Deviation) i broj sluajeva (Number of Cases) i, ali
nas nita ne sprijeava da izaberemo bilo koju drugu mjeru koja
nas zanima, te smo mi odabrali jo i medijanu (Median) i
minimalan i maksimalan rezultat na testu.

Osnovne statistike metode i tehnike u SPSS-u

76

Kao rezultat dobijamo sljedei ispis:


Means
Case Processing Summary
Cases
Included
N
znanje iz informatike *
STAROST

Excluded
Percent

401

98.8%

Total
Percent

1.2%

Percent
406

100.0%

Report

znanje iz informatike
STAROST
18 - 20 godina

Mean

Std. Deviation

Median

Minimum

Maximum

26.1882

85

5.62201

26.0000

14.00

38.00

21 - 29 godina

24.7458

177

6.97217

24.0000

14.00

41.00

30 - 39 godina

20.0000

37

7.43117

15.0000

14.00

38.00

40 - 49 godina

17.1127

71

6.63443

14.0000

14.00

41.00

preko 50 godina

15.0323

31

4.49061

14.0000

14.00

39.00

Total

22.5112

401

7.57532

21.0000

14.00

41.00

Osnovne statistike metode i tehnike u SPSS-u

77

Prva tabela (Case Processing Summary) nas, ve uobiajeno,


izvjetava o tome koje varijable se ukrtaju (u naem sluaju to su znanje
iz informatike i starost), i koliko ispitanika je imalo valjane podatke.
Druga tabela (Report) nam daje deskriptivne statistike mjere koje
smo traili. Poto vidimo da su sve na broju (AS, N, , medijana, min i
max), moemo obaviti i uvid u dobijene rezultate. U koloni Means
vidimo da stepen poznavanja oblasti informatike vei kod mlaih
ispitanika i da progresivno opada sa porastom starosne dobi ispitanika.
Pored toga, tu su i ostali rezultati koje smo traili, ali da bi smo izbjegli
pretjerano detaljno razmatranje naeg primjera njih neemo posebno
interpretirati.

Osnovne statistike metode i tehnike u SPSS-u

78

Odstupanje distribucije podataka od normalne


raspodjele
Ve smo vidjeli da je za veliki broj statistikih analiza neophodno
ustanoviti da li distribucija dobijenih podataka zadovoljava uslov
normalnosti, tj. da li u dovoljnoj mjeri podraava normalnu raspodjelu
(npr. za odluku da li e se u razmatranju odreenih podataka primijeniti
neki parametrijski ili neparametrijski test). Provjera eventualnog
odstupanja empirijske od normalne distribucije se moe izvriti na vie
naina.
Jedan od naina je da se (ve predstavljene) deskriptivne mjere
odstupanja, skjunis i kurtozis podijele sa njihovim standardnim grekama.
Ukoliko bilo koja od dobijenih vrijednosti bude vea od 1.96 ili 2.58,
zakljuuje se da empirijska distribucija znaajno (na nivou 0.05, odnosno
0.01) odstupa od normalne krive. Znai,
Sk
2.58
SESk

Ku
2.58
SEKu

p .05

p .01,

i
Sk
1.96
SESk

Ku
1.96
SEKu

gdje je
Sk
- skjunis
SESk - standardna greka skjunisa
Ku
- kurtozis
SEKu - standardna greka kurtozis a
p
- oznaka za statistiku znaajnost
2.58 - vrijednost sa kojom se poreenje vri na nivou
znaajnosti .05
1.96 - vrijednost sa kojom se poreenje vri na nivou
znaajnosti .01

Osnovne statistike metode i tehnike u SPSS-u

79

Kolmogorov-Smirnov test
Kolmogorov-Smirnov test je jo jedan od moguih naina
provjeravanja empirijske distribucije. U okviru Kolmogorov-Smirnov
testa se vri poreenje empirijske i teorijske distribucije. U ovom
postupku se uzima u obzir ono mjesto u kome se dvije raspodjele najvie
razlikuju, a zatim ispituje da li ta najvea vrijednost razlike empirijske i
teorijske distribucije (Dmax) statistiki znaajno odstupa od normalne, van
granica sluajnosti. Mi emo za primjer uzeti na ve opisani sluaj sa
skalom autoritarnosti.
Potrebno je za poetak otii na meni Analyze/Descriptive
Statistics/Explore i da varijablu iju distribuciju elimo da
testiramo ubacimo u okvir gdje pie Dependent List (u naem
sluaju to je varijabla skor.aut koja je rezultat na nekoj skali
autoritarnosti).
Sljedei korak je da idemo na opciju Plots u donjem dijelu
prozora.

Treba da potvrdimo opcije Histogram i Normality plots with


tests. Ovo e nam dati grafiki prikaz raspodjele naih rezultata
u formi histograma, a dobiemo i statistike testove
normalnosti.

Osnovne statistike metode i tehnike u SPSS-u

80

Dobiemo sljedei ispis:


Explore
Case Processing Summary
Cases
Valid
N
SKOR.AUT

Missing
Percent

495

Total
Percent

97.6%

12

2.4%

Percent
507

100.0%

Descriptives
Statistic
SKOR.AUT

Mean

Std. Error

47.9919

95% Confidence
Interval for Mean

Lower Bound

.38942

47.2268

Upper Bound

48.7570

5% Trimmed Mean

48.1768

Median

48.0000

Variance

75.065

Std. Deviation

8.66399

Minimum

18.00

Maximum

68.00

Range

50.00

Interquartile Range

12.0000

Skewness

-.326

.110

Kurtosis

-.019

.219

Tests of Normality
Kolmogorov-Smirnov(a)
Statistic
SKOR.AUT

.048

a Lilliefors Significance Correction

df

Shapiro-Wilk
Sig.

495

Statistic
.008

.991

df

Sig.
495

.005

Osnovne statistike metode i tehnike u SPSS-u

81

Histogram
120

100

80

60

Frequency

40
Std. Dev = 8.66

20

Mean = 48.0
N = 495.00

0
20.0

30.0
25.0

40.0
35.0

50.0
45.0

60.0
55.0

70.0
65.0

SKOR.AUT

Prva tabela nam govori o broju valjanih podataka uzetih u obradu,


a druga o generalnim deskriptivnim podacima za nau skalu. Dok se u
drugoj tabeli nalaze deskriptivne statistike mjere razmatrane distribucije
koje smo odabrali o okviru opcije Statistics, u treoj (onoj koja nas
najvie zanima) dobijamo izvjetaj o distribuciji koju testiramo. U okviru
te tabele, pod nazivom Test of Normality, prve tri kolone predstavljaju
izvjetaj o obavljenom Kolmogorov-Smirnov testu. Kolona Statistic kae
kolika je izraunata mjera odstupanja nae distribucije od normalne (u
naem sluaju 0.048), a kolona Sig. nam govori o znaajnosti utvrenog
odstupanja (u naem sluaju 0.008). Budui da je p (odnosno Sig. u
SPSS-u) manje od 0.01, a hipoteza je bila da naa distribucija ne odstupa
znaajno od normalne, odbacujemo postavljenu hipotezu, i donosimo
zakljuak da naa distribucija statistiki znaajno (na nivou znaajnosti
od 0.01) odstupa od normalne. Tabela takoe pokazuje da je radjen i
drugi test eventualnog odstupanja empirijske raspodjele od normalne
krive i da on takoe ukazuje na statistiki znaajno odstupanje testirane
raspodjele od normalne (Shapiro-Wilk). No, budui da je on predvien za
uzorke od 50 ili manje ispitanika (u naem sluaju ih ima 495), on nam
zasad nije potreban.

Osnovne statistike metode i tehnike u SPSS-u

82

Takoe, ukoliko skewness podijelimo sa njegovom standardnom


grekom dobijamo: -0.326/0.110 = -2.96, gdje takoe potvrujemo
znaajno odstupanje dobijene od normalne raspodjele.
Histogram koji smo dobili nam moe poneto rei o dobijenim
podacima. Vidimo da se vei broj ispitanika gomila na gornjem dijelu
nae skale, to znai da su rezultati za nau ispitivanu populaciju
negativno asimetrini, odnosno varijabilnost negativne strane je
poveana.

Osnovne statistike metode i tehnike u SPSS-u

83

Testiranje znaajnosti razlika aritmetikih


sredina
Jedna od najeih razmatranja s kojima se istraivai bave u
okviru analize podataka jesu testiranja znaajnosti razlika aritmetikih
sredina izmeu uzoraka. Ukoliko se ele uporediti aritmetike sredine
dobijene na dva uzorka iz iste populacije, gotovo sigurno e njihove
vrijednosti biti razliite. Da bi se utvrdio da li te razlike potiu od nekih
sistematskih faktora, ili su, pak, rezultat sluajnih inilaca, posluiemo
se nekim od statistikih testova konstruisanih u tu svrhu. Na osnovu
rezultata testiranja razlika, u zavisnosti od toga da li rezultat bude
znaajan ili ne, mogu se izvesti dva zakljuka:
1. Ukoliko test ne pokae statistiki znaajnu razliku izmeu
aritmetikih sredina uzoraka, zakljuuje se sa mogunosti greke
manjom od 1% ili 5%, da su uzorci homogeni (pripadaju istoj
populaciji), odnosno da su nastale razlike rezultat sluajnih faktora.
2. Ukoliko test pokae znaajnu razliku izmeu aritmetikih
sredina, uz mogunost prisustva greke manjom od 1% ili 5%
donosi se zakljuak da su uzorci heterogeni, odnosno da su nastale
razlike rezultat dejstva nekog sistematskog faktora.
U pozadini ovog postupka testiranja znaajnosti razlika izmeu
aritmetikih sredina, lei procjenjivanje njene standardne greke,
definisanja intervala pouzdanosti oko te razlike i procjene znaajnosti te
razlike.
Da bismo radili testiranje znaajnosti razlika izmeu izraenosti
pojava potrebno je da znamo nekoliko stvari:
Da li podaci zadovoljavaju uslove primjene parametrijskih testova?
- da podaci sa kojima se barata potiu bar sa intervalne skale
- da podaci podravaju normalno raspodjeljuju
Da li se radi o nezavisnim ili zavisnim uzorcima?
Da li postoji dvije ili vie grupa ispitanika?
Ovi podaci e odrediti vrste statistikih testova koji se mogu
koristiti, a vidjeemo da ih ima mnogo.

Osnovne statistike metode i tehnike u SPSS-u

84

Testiranje znaajnosti razlike izmeu dva uzorka

T test za nezavisne uzorke

Kao prvo treba rei da se pod nezavisnim uzorcima podrazumijevaju se


oni uzorci koji nakog izvrenog mjerenja ne stoje ni u kakvom pravilnom
odnosu, odnosno nisu u korelaciji. Ukoliko postoji potreba da se izvri
testiranje razlika izmeu aritmetikih sredina dvaju nezavisnih uzoraka,
pod uslovom da su zadovoljaeni uslovi za primjenu parametrijskih
testova, onda koristimo t-test za nezavisne uzorke. Formula za njegovo
izraunavanje je:

t=

DM

gdje je:

t
DM = M 1 M 2

- t-test
- (apsolutna razlika izmeu AS)
- standardna greka razlike izmeu AS, gdje je

D = M 2 +M
M

2
2

pri emu je
M =
1

1
N1

M2 =

2
N2

Dobijene vrijednost t-testa se mogu porediti sa vrijednostima


intervala pouzdanosti .05 i .01, koje iznose 1.98 i 2.63 za velike uzorke, i
ukoliko izlazi izvan okvira neke od ovih vrijednosti, prihvata se hipoteza
o postojanju znaajnih razlika izmeu uzoraka.
Za primjer emo uzeti testiranja znaajnosti polnih razlika u
postignuu na testu iz engleskog jezika na vie raznih fakulteta. Imaemo

Osnovne statistike metode i tehnike u SPSS-u

85

jednu kategoriku varijablu pol, i drugu numeriku (intervalnog nivoa),


skor na testu znanja iz engleskog jezika.
Potrebno je da idemo na opciju Analyze/Compare
Means/Independent-Samples T Test. Test Varijable je naa
zavisna varijabla (skor na testu iz engleskog jezika u naem
sluaju), a Grouping Variable je nezavisna varijabla (u naem
sluaju to je pol).

Moraemo da definiemo koje grupe poredimo, jer SPSS


podrazumijeva da nezavisna varijabla koja je kategorika, moe imati
vie od dva modaliteta. Kliknemo na dugme Define i moi emo da
nastavimo.
Poto smo mi definisali modalitete nae varijable tako da 1
oznaava enski, a 2 muki pol, te vrijednosti emo upisati u
kuice. Potvrdimo sa Continue.

Osnovne statistike metode i tehnike u SPSS-u

86

Kad smo definisali grupe i potvrdili sve, dobijamo sljedei ispis


kao rezultat naeg testiranja:
T-Test
Group Statistics

Rezultat testa iz
engleskog

POL
muski

zenski

Mean

Std. Deviation

Std. Error Mean

88

22.648

2.3843

.2542

128

23.992

2.8416

.2512

Independent Samples Test


Levene's Test for
Equality of
Variances
F

Sig.

t-test for Equality of Means


t

df

Sig. (2tailed)

Mean
Difference

Std. Error
Difference

95% Confidence
Interval of the
Difference
Lower

Rezultat testa iz
engleskog

Equal
variances
assumed
Equal
variances
not
assumed

2.641

.106

Upper

-3.643

214

.000

-1.344

.3691

-2.0719

-.6170

-3.763

205.582

.000

-1.344

.3573

-2.0490

-.6400

Prva tabela (Group Statistics) koju smo dobili daje nam


deskriptivne mjere za naa dva uzorka. Vidimo da ukupno ima 88 mukih
i 128 enskih ispitanika. Takoe vidimo da je prosjeni rezultat na testu
iz engleskog manji kod mukih nego kod enskih ispitanika (kolona
Mean), ali i da je varijabilnost rezultata vea kod enskih ispitanika
(kolona Std. Deviation).
Druga tabela (Independent Samples Test) je neto sloenija. Prvo
treba da pogledamo rezultate Levenovog testa jednakosti varijansi. Kad je
vjerovatnoa vea od .05 (u naem sluaju to je 0.106), onda
zakljuujemo da se pretpostavljaju jednake varijanse u okviru naih
subpopulacija i oitavamo rezultate iz prvog reda (Equal variances
assumed). Da je znaajnost Levenovog testa bila manja od .05, rezultate
bismo oitavali iz drugog reda (Equal variances not assumed).
Ve smo vidjeli iz prve tabele da djevojke postiu neto bolje
rezultate od mladia (za 1.344 poena u prosjeku), ali da li je ta razlika
statistiki znaajna? Veliina statistika t od 3.643 (predznak nam nije
bitan, u obzir se uzima apsolutna veliina) i njegova znaajnost od .000
(znai manje od .05 i od .01), nam govori da su razlike izmeu
aritmetikih sredina statistiki znaajne.
Testiranje t-testom moemo obaviti na vie naina u SPSS-u, ali za
sad emo ostati kod ovoga.

Osnovne statistike metode i tehnike u SPSS-u

87

Mann Whitneyjev U-test


U sluaju kad imamo dva nezavisna uzorka koji ne zadovoljavaju
uslove za primjenu parametrijskog t testa, za testiranje znaajnosti razlike
koristimo neparametrijski ekvivalent, a to je Mann-Whitneyjev test.
Potrebno je da imamo podatke koji potiu bar sa ordinalne skale. Mi
emo za primjer uzeti polne razlike u osobini autoritarnosti (ta varijabla,
pokazalo se ranije, ne zadovoljava uslov normalnosti za primjenu
parametrijskih testova).
Idemo na meni Analyze/Nonparametric Tests/2 Independent
Samples, i ubacimo zavisnu varijablu u okvir gdje pie Test
Variable List, a nezavisnu varijablu u okvir Grouping Variable.
Moramo definisati grupe u okviru nezavisne varijable na isti
nain kao to smo to opisali kod t testa.

Osnovne statistike metode i tehnike u SPSS-u

88

Kad smo sve uradili, potvrdimo sa OK, i dobijamo sljedei ispis:


NPar Tests
Mann-Whitney Test
Ranks

SKOR.AUT

pol
muski

Mean Rank

Sum of Ranks

220

252.55

55562.00

zenski

275

244.36

67198.00

Total

495

Test Statistics(a)
SKOR.AUT
Mann-Whitney U

29248.000

Wilcoxon W

67198.000

Z
Asymp. Sig. (2-tailed)

-.634
.526

a Grouping Variable: pol

Ono to nas zanima je u drugoj tabeli (Test statistics), i to je


veliina Mann-Whitney U statistika (u naem sluaju 29248.00) i njegova
znaajnost (u naem sluaju 0.526). Znai ustanovili smo da kod naih
ispitanika ne postoje statistiki znaajne razlike u autoritarnosti izmeu
mukaraca i ena.
Ovaj test nam nije prikazao deskriptivne mjere koje nas zanimaju,
mjere rasprenja i centralnih tendencija, ali te podatke moemo dobiti na
nain kako je to opisano u poglavlju Deskriptivne mjere za dva ili vie
uzoraka.

Osnovne statistike metode i tehnike u SPSS-u

89

T test za zavisne uzorke

Zavisnim uzorcima smatramo one uzorke ije mjere su na neki


nain u korelaciji. U praksi se sa ovakvim uzorcima najee sreemo kad
projektujemo neku od dvije osnovne vrste eksperimentalnih nacrta. Prvi
sluaj takvog nacrta nazivamo "metodom iste grupe", gdje ispitivanje
pojave obavljamo na istoj grupi ispitanika prije i poslije uvoenja dejstva
nezavisne varijable. Drugi sluaj nazivamo "metodom ekvivalentnih
grupa", gdje formiramo dvije grupe ispitanika koje ujednaavamo po
nekom relevantnom kriterijumu, a dejstvo nezavisne varijable uvodimo
obino samo u jednu grupu (koju nazivamo eksperimentalnom grupom), i
nakon toga vrimo mjerenje pojave. U oba sluaja rezultati mjerenja su u
korelaciji, bilo zato to su u pitanju isti ispitanici, bilo zato to su razliite
grupe ispitanika ujednaene po nekom (za mjerenu varijablu)
relevantnom kriterijumu.
Kod zavisnih uzoraka standardnu greku razlika izmeu
aritmetikih sredina dobijamo na sljedei nain:
D = M 2 + M 2 2 * r1, 2 * M * M 2 ,
M

gdje je

D - standardna greka razlika izmeu aritmetikih sredina,


M

mjera linearne korelacije izmeu dva uzorka,


M - standardna greka aritmetike sredine prvog uzorka (moe se
jo oznaiti i sa SE1)
M 2 - standardna greka aritmetike sredine drugog uzorka (moe
se jo oznaiti i sa SE2)

r1,2

Statistik t dobijamo na isti nain kao i kod nezavisnih uzoraka:


t=

DM

gdje je

t - t-test
DM - razlika aritmetikih sredina,
D - standardna greka razlika izmeu aritmetikih sredina
M

Ukoliko imamo posla sa velikim grupama, dobijeni rezultat


poredimo sa granicama 1.96 i 2.58, a ukoliko imamo manje grupe onda

Osnovne statistike metode i tehnike u SPSS-u

90

granice intervala pouzdanosti oitavamo iz odgovarajuih tablica, pri


emu broj stepeni slobode dobijamo po obrascu: df = N-1.
Recimo da smo imali sluaj da trebamo provjeriti znanje iz
engleskog jezika prije i poslije kursa iz engleskog jezika koga su studenti
sluali na fakultetima. Ista grupa od 216 studenata , znai, radila je dva
puta isti test, prije i poslije kursa, i mi treba da uporedimo te rezultate i
zakljuimo da li je nastava iz jezika doprinijela boljem znanju.
Treba da idemo na meni Analyze/Compare Means/PairedSamples T Test, selektujemo dvije varijable ije rezultate
elimo da poredimo, i unesemo ih u okvir gdje pie Paired
Variables. U naem sluaju to su rezultati na testu prije
(skor.eng) i poslije kursa (sk.eng2).

Kad smo na kraju potvrdili svoj izbor, dobijamo sljedei ispis:


T-Test
Paired Samples Statistics
Mean
Pair 1

Rezultat testa iz
engleskog prije
kursa
Rezultat testa iz
engleskog poslije
kursa

Std. Deviation

23.444

216

2.7402

.1864

25.3194

216

2.83988

.19323

Paired Samples Correlations


N
Pair 1

Rezultat testa iz
engleskog prije
kursa & Rezultat
testa iz engleskog
poslije kursa

Std. Error Mean

Correlation

216

.982

Sig.

.000

Osnovne statistike metode i tehnike u SPSS-u

91

Paired Samples Test

Mean

Paired Differences
Std.
Std. Error
95% Confidence Interval
Deviation
Mean
of the Difference
Lower

Pair 1

Rezultat testa iz
engleskog prije
kursa - Rezultat
testa iz engleskog
poslije kursa

-1.8750

.53538

.03643

-1.9468

df

Sig. (2tailed)

Upper

-1.8032

-51.472

215

.000

Prva tabela (Paired Samples Statistics) nam daje deskriptivne


statistike mjere za nae zavisne uzorke. Iz nje moemo vidjeti kolika su
prosjena postignua na testu prije i poslije kursa (Mean), kao i druge
podatke (broj ispitanika, standardnu devijaciju). Vidimo da su na prvom
testu ispitanici postizali u prosjeku 23.444 bodova, a na drugom testu
(poslije kursa) u prosjeku 25.319, to znai da su ostvarili napredak od
1.87 poena u prosjeku.
Druga tabela (Paired Samples Correlations) nam govori kolika je
povezanost izmeu rezultata na prvom i drugom testu. U naem sluaju ta
korelacija iznosi veoma visokih 0.982, to bi znailo da je gotovo svaki
ispitanik popravio svoje znanje iz engleskog za istu koliinu. U realnosti
gotovo nikad neete naii na povezanosti ovoe veliine, ali, budui da su
nai rezultati izmiljeni to je prihvatljivo :-)
U treoj tabeli (Paired SamplesTest) nas zanima prvenstveno
statistik t i njegova vjerovatnoa (Sig.). Moemo vidjeti da u naem
sluaju veliina t iznosi -51.472 (opet nam predznak nije bitan), a da je
njegova vjerovatnoa 0.000. Znai, moemo rei da se prosjeni rezultati
znaajno razlikuju, odnosno da su studenti (najvjerovatnije) zbog
pohaanja kursa engleskog jezika, unaprijedili svoje znanje.

Osnovne statistike metode i tehnike u SPSS-u

92

Test predznaka
Kad imamo dva zavisna uzorka, a koji ne zadovoljavaju uslove za
primjenu parametrijskog testa za testiranje znaajnosti razlike, koristimo
neparametrijski ekvivalent, a to je test predznaka (Sign Test). Ovaj test ne
postavlja uslove u pogledu normalnosti distribucije, a mi emo za primjer
uzeti isto ispitivanje kao i u poglavlju T test za zavisne uzorke, znai
testiranje razlika u postignuu na testu engleskog prije i poslije kursa
engleskog jezika na fakultetu.
Izabraemo opciju Analyze/Nonparametric Tests/2 Related
Samples, i u okvir Test Pair List unijeemo par varijabli ije
vrijednosti poredimo (u naem sluaju to su skor.eng i
sk.eng2). Sljedei korak je da odaberemo odgovarajui test, i to
inimo tako to u donjem dijelu prozora izaberemo opciju Sign,
a iskljuimo ostale opcije.

Nakon to potvrdimo svoj izbor sa OK, dobijamo sljedei ispis:


NPar Tests
Sign Test
Frequencies
N
Rezultat testa iz engleskog
poslije kursa - Rezultat testa
iz engleskog prije kursa

Negative Differences(a)
Positive Differences(b)
Ties(c)
Total

6
209
1
216

a Rezultat testa iz engleskog poslije kursa < Rezultat testa iz engleskog prije kursa
b Rezultat testa iz engleskog poslije kursa > Rezultat testa iz engleskog prije kursa
c Rezultat testa iz engleskog poslije kursa = Rezultat testa iz engleskog prije kursa

Osnovne statistike metode i tehnike u SPSS-u

93

Test Statistics(a)

Rezultat testa iz
engleskog
poslije kursa Rezultat testa iz
engleskog prije
kursa
Z
Asymp. Sig. (2-tailed)

-13.776
.000

a Sign Test

Prva tabela (Frequencies) nas izvjetava o detaljima naih


podataka. Poto se ovaj test bazira na poreenju veliina dvije varijable
kod ispitanika, i sabiranju broja pozitivnih i negativnih razlika, u naem
primjeru tabela nam govori sljedee:
- sluajeva kad druga varijabla (u naem sluaju to su rezultati na
testu poslije kursa) ima manju vrijednost (Negative Differences)
ima 6
- sluajeva kad druga varijabla ima veu vrijednost (Positive
Differences) ima 209
- jednakih vrijednosti obe varijable (Ties) ima 1
Druga Tabela nam govori o veliini statistika Z, koji uzima u obzir
zbir razlika predznaka, (u naem sluaju 13.776) i njegovu vjerovatnou
(u naem sluaju 0.000). Znai, moemo rei da su rezultati na testu iz
engleskog kod naih ispitanika poslije kursa znaajno vei nego prije
kursa.

Osnovne statistike metode i tehnike u SPSS-u

94

Znaajnosti razlika izmeu vie uzoraka


Analiza varijanse
Analiza varijanse je statistika procedura koja nam omoguava da
testiramo razlike izmeu aritmetikih sredina dvaju ili vie uzoraka. Kao
primjer moemo uzeti sluaj kada elimo da poredimo postignua na
nekom testu kod vie nezavisnih grupa ispitanika, to u naem sluaju
moe biti postignue na testu iz engleskog jezika kod studenata tri
razliita fakulteta. Ukoliko smo ve upoznati sa t-testom kao statistikom
mjerom za poreenje aritmetikih sredina, mogli bismo zakljuiti da
testiranje moemo obaviti i na taj nain, ali u sluaju kad imamo vie
nezavisnih grupa broj poreenja t-testom moe biti veliki: ako imamo
tri grupe, dobijamo tri para za poreenje, za etiri grupe tu je est parova
za poreenje, i tako dalje. Reenica kojom bismo saeli ideju analize
varijanse glasi: da li su varijacije izmeu grupa vee od varijacija unutar
grupa koje poredimo? Statistika mjera variranja koju emo upotrijebiti u
ovom sluaju je varijansa, koju dobijamo kad kvadriramo standardnu
devijaciju:
v =2

Primjer sluaja kad je varijansa izmeu grupa vea od


unutargrupne varijanse, to bi znailo da grupe ne pripadaju istoj
populaciji:

Primjer sluaja kad je varijansa izmeu grupa manja od


unutargrupne varijanse, to bi znailo da grupe pripadaju istoj populaciji:

Osnovne statistike metode i tehnike u SPSS-u

95

Znaajnost razlika izmeu aritmetikih razlika utvrujemo uz


pomo F-testa, kojim utvrujemo odnos izmeu dviju varijansi:

Varijansa izmeu grupa


F= Varijansa unutar grupa
Analizu varijanse radimo uz pomo razlaganja ukupne varijanse na
komponente, a sve to emo dobiti preko suma kvadrata odstupanja
rezultata od aritmetikih sredina:
SS T = SS w + SS b , gdje je:

SST ukupna suma kvadrata odstupanja


SSw - suma kvadrata odstupanja unutar grupa
SSb - suma kvadrata odstupanja izmeu grupa
Ako za primjer uzmemo sluaj testiranja razlika u postignuu na
testu iz engleskog jezika izmeu 216 studenata tri fakulteta (naknadno
emo isti ovaj primjer uraditi uz pomo SPSS-a):

Izmeugrupna
varijansa (b)
Unutargrupna
varijansa (w)
Total (T)

df

Sume kvadrata
odstupanja
(SS)

Varijansa
(v = SS/df)

2 (df =broj grupa 1)

145.007

72.503

215 (broj ispitanika 1)

1469.326

6.898

217

1614.333

Osnovne statistike metode i tehnike u SPSS-u

Na kraju izraunavamo F kroz formulu: F =

96
72.503
= 10.51
6.898

Na osnovu odgovarajue tabele, koju moemo nai u osnovnim


udbenicima iz statistike, oitavamo granice znaajnosti i donosimo
zakljuak o statistikoj znaajnosti razlika.
U sluaju da ustanovimo da je F statistik znaajan, onda trebamo
utvrditi izmeu kojih grupa postoje znaajne razlike, da li izmeu svih
moguih parova, ili samo izmeu nekih? Tada se koristimo t-testom, ili
nekim od SPSS-ovih post-hoc testova za detekciju razlika izmeu
pojedinanih parova poduzoraka.

Osnovne statistike metode i tehnike u SPSS-u

97

Jednofaktorska univarijatna analiza varijanse za


nezavisne uzorke
Jednofaktorskau univarijatna analiza varijanse se radi kad imamo
jednu kategoriku varijablu (faktor) sa dva ili vie modaliteta, i drugu
varijablu intervalnog nivoa i normalne raspodjele rezultata. Sada emo
vidjeti kako emo statistiko testiranje obaviti uz pomo SPSS-a. Mi
emo za primjer uzeti opet na test iz engleskog; porediemo postignue
na testu iz engleskog jezika studenata razliitih fakulteta.
Najjednostavniji nain da to uinimo jeste na sljedei nain:
Idemo na Analyze/Compare Means/One Way ANOVA i u
Dependent List unesemo nau zavisnu varijablu (skor na testu
engleskog u naem sluaju), a pod Factorunesemo nezavisnu
varijablu (fakultet u naem sluaju).

Specifinost analize varijanse jeste to da e za rezultat pokazati


postoji li izmeu nekih grupa statistiki znaajna razlika, ali nam ne moe
rei izmeu koji grupa. U naem primjeru varijabla fakultet ima 3
modaliteta ili nivoa varijable (filozofski, medicinski i tehnoloki), i mogu
se praviti do tri poreenja na osnovu kojih donosimo zakljuak o
statistikoj znaajnosti razlika izmeu grupa. No, ii emo korak po
korak pa emo vidjeti ta emo dobiti.
Kao ispis naeg primjera analize varijanse dobijamo:

Osnovne statistike metode i tehnike u SPSS-u

98

Oneway
Descriptives

Rezultat testa iz engleskog


N

Mean

Std. Deviation

Std. Error

95% Confidence Interval for


Mean
Lower Bound

Minimum

Maximum

Upper Bound

tehnoloski

72

23.174

2.6071

.3072

22.561

23.786

16.5

27.5

medicinski

72

22.604

2.6122

.3078

21.990

23.218

17.0

28.0

filozofski

72

24.556

2.6598

.3135

23.931

25.181

19.0

29.5

216

23.444

2.7402

.1864

23.077

23.812

16.5

29.5

Total

ANOVA

Rezultat testa iz engleskog


Sum of Squares
Between Groups

df

Mean Square

145.007

72.503

Within Groups

1469.326

215

6.898

Total

1614.333

216

F
10.510

Sig.
.000

Kao to smo navikli, prva tabela (Descriptives) daje deskriptivne


podatke o poduzorcima. N je broj ispitanika, Mean je aritmetika sredina,
a Std.Deviation standardna devijacija. U naem primjeru moemo vidjeti
da su studenti filozofskog fakulteta postigli najvie, studenti tehnolokog
fakulteta neto manje, a studenti medicinskog fakulteta najmanje rezultate
na testu iz engleskog jezika.
Druga tabela (ANOVA) daje pregled rezultata F-testa: oitavamo
vrijednost mjere F i njenu statistiku znaajnost. U naem sluaju
F=10.510, a znaajnost je 0.000 (znai statistiki znaajno na nivou 0.01).
Moemo rei da se statistiki znaajno razlikuju studenti ova tri fakulteta
po postignuu na testu iz engleskog jezika.
Ako elimo znati izmeu kojih fakulteta konkretno postoje razlike,
to moemo uiniti uz pomo t-testa. Trebali bi se vratiti na poglavlje Ttest za nezavisne uzorke i uraditi sve kako je tamo opisano, s tim da nam
je nezavisna varijabla ovaj put fakultet, ije modalitete upisujemo pod
Define Groups. Imaemo tri mogua poreenja: filozofski-medicinski,
filozofski-tehnoloki i medicinski-tehnoloki.
Ipak, za brzi uvid u te razlike posluiemo se opcijom Post Hoc
kad radimo analizu varijanse (dugme pod tim nazivom u
donjem dijelu prozora).

Osnovne statistike metode i tehnike u SPSS-u

99

Ovde se nalazi grupa posthok testova za ispitivanje


meugrupnih razlika. Iako se zasnivaju na razliitim
matematikim procedurama, veina e nam dati sline
rezultate. Mi emo izabrati LSD test i potvrditi na izbor sa
Continue.

Kao rezultat emo dobiti iste dve tabele kao to je prethodno


opisano za analizu varijanse, ali dobiemo i jednu dodatnu:
Post Hoc Tests
Multiple Comparisons

Dependent Variable: Rezultat testa iz engleskog


LSD
95% Confidence Interval
(I) FAKULTET

(J) FAKULTET

tehnoloski

medicinski
filozofski

medicinski

tehnoloski

Mean Difference
(I-J)

filozofski
filozofski

tehnoloski
medicinski

* The mean difference is significant at the .05 level.

Std. Error

Sig.

.569
-1.382(*)

.4377
.4377

.195
.002

Lower Bound
-.293
-2.245

Upper Bound
1.432
-.519

-.569

.4377

.195

-1.432

.293

-1.951(*)
1.382(*)
1.951(*)

.4377
.4377
.4377

.000
.002
.000

-2.814
.519
1.089

-1.089
2.245
2.814

Osnovne statistike metode i tehnike u SPSS-u

100

Ova tabela e nam pokazati koji parovi fakulteta se porede (kolona


Fakultet), kolika je razlika u prosjenom postignuu na testu (Mean
Difference), i znaajnosti tih razlika (Sig.). U naem sluaju, vidimo da
postoje znaajne razlike izmeu filozofskog i tehnolokog, filozofskog i
medicinskog fakulteta, i to obe razlike znaajne na nivou 0.05. Razlika
izmeu medicinskog i tehnolokog fakulteta nije statistiki znaajna.
Naglaavamo da se u okviru ove tabele dva puta javlja poreenje istih
parova. Razlog je banalan

Osnovne statistike metode i tehnike u SPSS-u

101

Kruskal Wallis test


Ovaj test se primjenjuje za utvrivanje znaajnosti razlika izmeu
dvije ili vie mjerenih osobina u onim sluajevima kad podaci ne
zadovoljavaju uslove za primjenu analize varijanse. Potrebno je da
imamo jednu kategoriku varijablu sa dva ili vie modaliteta, i drugu
varijablu bar ordinalnog tipa. Mi emo kao primjer uzeti istraivanje u
kojem je predmet ispitivanja prihvatanje socijalnih odnosa sa Italijanima
u odnosu sa razliitim socio-demografskim varijablama. Nezavisna
varijabla u ovom primjeru e biti stepen obrazovanja majke sa tri
modaliteta (zavrena osnovna kola, zavrena srednja kola i zavrena
via/visoka kola), a zavisna varijabla e biti broj prihvaenih odnosa sa
Italijanima (ponueno je 7).
Idemo
na
meni
Analyze/Nonparametric
Tests/K
Independent Samples, i pod Test Variable List unesemo
zavisnu varijablu, a pod Grouping Variable unesemo nezavisnu
varijablu. Nakon toga je potrebno kliknuti na dugme Define
Range i definisati koji je raspon vrijednosti nezavisne
varijable. U naem sluaju to je od 1 do 3. Pod okvirom Test
Typeimamo ponuena tri testa, ali mi biramo Kruskal-Wallis H
test.

Osnovne statistike metode i tehnike u SPSS-u

102

Nakon to smo sve obavili, dobijamo sljedei ispis u Output prozoru:


NPar Tests
Kruskal-Wallis Test
Ranks

Prihvatanje odnosa sa
Italijanima

strucna sprema majke


OS

Mean Rank
51

209.82

SS

231

198.44

VS ili VSS

123

208.73

Total

405

Test Statistics(a,b)

Prihvatanje
odnosa sa
Italijanima
Chi-Square
df
Asymp. Sig.

.839
2
.657

a Kruskal Wallis Test


b Grouping Variable: strucna sprema majke

Prva tabela (Ranks) nas izvjetava o broju ispitanika u pojedinim


grupama naeg uzorka, i prosjenim rangovima zavisne varijable.
Druga tabela (Test Statistics) nam daje mjeru 2 (hi-kvadrat, ChiSquare) i njenu znaajnost (Asymp. Sig.). U naem sluaju vidimo da je
vrijednost 2 =0.839 i da nije statistiki znaajna (vjerovatnoa vea od
0.05 i 0.01 dobijena vrijednost Asymp. Sig=.657), to bi znailo da ne
postoje statistiki znaajne razlike u pogledu prihvatanja socijalnih
odnosa sa Italijanima izmeu grupa ispitanika ije su majke su razliito
obrazovane.

Osnovne statistike metode i tehnike u SPSS-u

103

Dvofaktorska univarijatna analiza varijanse


Dvofaktorska univarijatna analiza varijanse se primjenjujemo kad
su kao nezavisne varijable prisutne dvije kategorike varijable, i jedna
zavisnu kvantitativnu varijablu. Mi emo kao primjer uzeti fiktivno
istraivanje u kojem je za zavisnu varijablu uzeta izraenost osobine
depresivnosti, a za zavisne su uzeti pol i zaposlenost. Znai, pitanja su: da
li izraenost depresivnost zavisi od pola, zaposlenja ili od kombinacije
ova dva faktora? Kombinacija faktora u analizi varijanse naziva se
interakcija faktora. Potrebno je rei da su uzeti faktori neponovljeni, to
znai da svaki ispitanik ima kombinaciju ove dvije odlike: odreenog je
pola i ima odreen radni status (zaposlen ili nezaposlen). Vidjeemo da
postoji i analiza varijanse za ponovljene faktore.
Idemo na meni Analyze/General Linear Model/Univariate, i
pod Dependent Variable unosimo zavisnu varijablu
(depresivnost u naem sluaju), a pod Fixed Factor(s) unosimo
nezavisne varijable.

Sljedei korak nam da idemo na dugme Options s desne strane


prozora, i tu treba da meu opcijama u okviru Display
odaberemo descriptives. Time emo dobiti osnovne
deskriptivne mjere za podgrupe naeg uzorka.

Osnovne statistike metode i tehnike u SPSS-u

104

Dalje, zgodno je da imamo i nekakav grafiki prikaz naih


rezultata, jer e nam to pomoi pri tumaenju. To emo uraditi
pomou tastera Plots. Dolazimo do prozora gdje trebamo
odrediti varijable koje e odrediti na grafikon. Ukoliko imamo
dve varijable, upisujemo ih u okvire Horizontal Axis i Separate
Lines (gdje e ii koja varijabla zavisi od potreba ili elja
samog istraivaa). Na kraju je neophodno da pritisnemo
dugme Add (nakon toga bi se trebale pojaviti ove varijable u
donjem okviru Plots) inae SPSS nee upamtiti na izbor.

Nakon to smo obavili sve, dobijamo sljedei ispis:

Osnovne statistike metode i tehnike u SPSS-u

105

Univariate Analysis of Variance


Between-Subjects Factors
Value Label
POL
ZAPOSLEN

muski

88

zenski

128

1.00

zaposlen

99

2.00

nezaposlen

117

Descriptive Statistics

Dependent Variable: depresivnost


POL
muski

zenski

Total

ZAPOSLEN
zaposlen

Mean

Std. Deviation

22.2969

2.16340

64

nezaposlen

23.5833

2.72535

24

Total

22.6477

2.38429

88

zaposlen

23.3143

2.38896

35

nezaposlen

24.2473

2.96595

93

Total

23.9922

2.84161

128

zaposlen

22.6566

2.28644

99

nezaposlen

24.1111

2.91925

117

Total

23.4444

2.74017

216

Tests of Between-Subjects Effects

Dependent Variable: depresivnost


Source
Corrected Model

Type III Sum of


Squares

df

Mean Square

Sig.

145.286(a)

48.429

6.989

.000

90372.098

90372.098

13041.706

.000

POL

29.261

29.261

4.223

.041

ZAPOSLEN

50.987

50.987

7.358

.007

1.293

1.293

.187

.666

Error

1469.047

212

6.929

Total

120337.000

216

1614.333

215

Intercept

POL * ZAPOSLEN

Corrected Total

a R Squared = .090 (Adjusted R Squared = .077)

Osnovne statistike metode i tehnike u SPSS-u

106

Profile Plots
Estimated Marginal Means of depresivnost
24.5

Estimated Marginal Means

24.0

23.5

23.0

ZAPOSLEN
22.5
zaposlen

22.0

nezaposlen

muski

zenski

POL

Iz prve tabele (Between-Subjects Factors) vidimo kako se


rasporeuju ispitanici po kategorijama nezavisnih varijabli, odnosno
koliko je ispitanika mukog, a koliko enskog pola i koliko je ispitanika
zaposleno, a koliko ne.
Sljedea tabela (Descriptive Statistics) nam ve daje podatke bitne
za analizu koja je odabrana. Iz nje ve vidimo da (kolona Means)
nezaposleni muki ispitanici imaju izraeniju izraenu depresivnost od
zaposlenih mukaraca, da enski nezaposleni ispitanici imaju izraeniju
depresivnost od enskih zaposlenih ispitanika. Dalje, ene imaju imaju
vii skor depresivnosti od mukaraca, a nezaposleni od zaposlenih
ispitanika. Takoe, u koloni N moemo vidjeti i da je u okviru mukih
ispitanika vei procenat zaposlen, a u okviru enskih vei procenat je
nezaposlen.
Sljedea tabela (Tests of Between-Subjects Effects) daje podatke o
statistikim znaajnostima. Nas zanimaju redovi u kojima pie POL,
ZAPOSLEN i POL*ZAPOSLEN, kao i kolone F i Sig. U okviru reda POL
vidimo da je mjera
F =4.223 i da je statistiki znaajna na nivou
0.05, a u redu ZAPOSLEN da je
F =7.358 uz statistiku znaajnost
na nivou 0.01. Ovo su glavni efekti pola i zaposlenja na depresivnost i,
kao to vidimo, oba su znaajna: u naem uzorku ene su depresivnije, i
nezaposleni su depresivniji. Red ispod njih nalazi se interakcija pola i
zaposlenosti (POL*ZAPOSLEN) ija je vrijednost statistika F =0.187, i
njegova znaajnost vea od 0.05, to bi za nas znailo da nema interakcije
izmeu pola i zaposlenosti u pogledu uticaja na depresivnost.
Grafikon na kraju (Estimated Marginal Means of depresivnost)
prua grafiki prikaz onoga to smo imali u tabeli Descriptive Statistics.
Sa vremenom, kako kako se kroz primjenu analize varijanse bude

Osnovne statistike metode i tehnike u SPSS-u

107

poveavalo i znanje o ovoj statistikoj analizi, vidjeemo da paralelnost


linija govori o tome da ne postoji interakcija faktora (kad su ukrtene
postoji), dok razmaknutost i nagib linija govore o glavnim efektima
(uticaju pojedinih nezavisnih varijabli).

Osnovne statistike metode i tehnike u SPSS-u

108

Analize kategorikih varijabli


U psihologiji, kao i ostalim drutvenim naukama, koliko god se
trudili mjeriti pojave bar na nivou intervalne skale, to nije uvijek mogue.
Postoji, naime, velika koliina pojava koje pokuavamo registrovati koje
imaju diskretni (isprekidani, kategorijalni) karakter. Tako veliki broj
podataka koje skupimo u istraivanju sainjavaju upravo kategoriki
podaci: sociodemografski podaci kao to su pol, uzrasne ili obrazovne
skupine, a i razni podaci prikupljeni putem anketa.

Hi-kvadrat test
Za podatke koji potiu sa nominalne skale postoje posebne
statistike procedure osloboene striktnih pretpostavki o distribuciji
mjera (kao npr. Pretpostavka o normalnoj raspodjeli mjera). Najrairenija
je upotreba mjere 2 (grko slovo hi, na engleskom Chi Square). 2 nam
slui za testiranje odstupanja dobijenih (empirijskih) frekvencija od nekih
oekivanih (teorijskih) vrijednosti.
2 =

( f o f e )2
fe

, gdje je

2 hi kvadrat
fo teorijske (oekivane) frekvencije,
fe- empirijske (empirijske) frekvencije,
oznaka za sumu.
Ovo je matematiki izraz za izraunavanje hi-kvadrata, gdje fo
predstavlja dobijene frekvencije (o skraeno od observed na engleskom),
dok fe predstavlja teorijski pretpostavljene, odnosno oekivane
frekvencije (e skraeno od expected na engleskom). Te oekivane
vrijednosti mogu biti zadate po nekom ranije zamiljenom modelu, to
moe biti pretpostavka o jednakoj raspodjeli podataka u elijama tabele,
ili o normalnoj raspodjeli, ili o bilo kakvoj drugaijoj raspodjeli
frekvencija. Znai, kad imamo jednu varijablu sa vie modaliteta, onda
moramo dati neku pretpostavku o tome kako mislimo da e se
rasporeivati frekvencije po modalitetima varijable. Na kraju emo, na

Osnovne statistike metode i tehnike u SPSS-u

109

osnovu rezultata hi-kvadrat testa, zakljuiti da li opaene frekvencije


odstupaju od oekivanih, odnosno da li je ispravna naa hipoteza.
Vidjeemo kako to izgleda na primjeru analize jednog zamiljenog
anketnog rezultata, gdje 60 ispitanika odgovaralo na pitanje: Da li se
zalaete za civilno sluenje vojnog roka?, a ponueni su odgovori: da,
nisam siguran i ne. Mi smo pretpostavili da e se odgovori ispitanika
podjednako raspodijeliti u sve tri kategorije.
Da
Nisam siguran
Ne

fo
30
15
15

fe
20
20
20

(fo- fe)
10
-5
-5

(fo- fe)2
100
25
25

(fo- fe)2 /fe


5
1.25
1.25
2=7.5

Broj stepeni slobode se rauna po obrascu: df = (broj kolona 1) x


(broj redova 1), i u naem sluaju to je: (2-1) x (3-1) = 2. Iz tablica
oitavamo granine vrijednosti odgovarajuih intervala sigurnosti: 5.99
(p=0.05) i 9.21 (p=0.01). Na osnovu datih granica i veliine dobijenog hikvadrata moemo zakljuiti da dobijene frekvencije odstupaju znaajno
od oekivanih na nivou 0.05.
U tabelama ukrtanja vie varijabli (u daljem tekstu emo tabele
podataka nastale ukrtanjem kategorikih varijabli nazivati
kontingencijskim tabelama) oekivane vrijednosti se obino raunaju
putem kalkulisanja sa zbirovima redova i kolona. Ukoliko se pokae da je
koliina odstupanja dovoljno velika, prihvatamo hipotezu o znaajnom
odstupanju od oekivanih vrijednosti. Postoje situacije kad primjena hi
kvadrata ne daje pouzdane rezultate, a to je sluaj kad u kontingencijskoj
tabeli postoji preko 20% elija sa oekivanim frekvencijama 5 ili manje,
ili kad je jedna od oekivanih frekvencija manja od 1. U tim sluajevima
se obino radi saimanje veeg broja kategorija varijable na manji broj, ili
ako je u pitanju tabela 2x2 (znai, ne moe se vie smanjivati), onda se
radi statistiki postupak nazvan Yates-ova korekcija.
Idemo na Analyze/Descriptive Statistics/Crosstabs i u okvire
Row(s) i Column(s) unesemo nae varijable. Trei okvir Layer
nam slui za prikaze ukrtanja vie od dvije varijable. Poniene
su nam i opcije za grafiki prikaz (Display clustered bar
charts) i opcija za eliminisanje frekvencijskih tabela iz prikaza
(Suppress tables) tako da vidimo samo statistike mjere i
grafikone. Za nas e biti znaajna dva dugmeta u donjem dijelu
prozora: Statistics i Cells.

Osnovne statistike metode i tehnike u SPSS-u

Pritisnuvi dugme Statistics dolazimo do prozora za izbor


statistikih mjera koje eli. Na poetku nije odabrana ni jedna,
pa treba da se odluimo. Tu su razne vrste statistikih mjera za
nominalne i ordinalne mjere. Mi emo izabrati Chi-square (hikvadrat) jer je to mjera koja nas sada zanima.

Dugme Cells nas vodi do prozora za izbor onoga to e biti


prikazano u kontingencijskim tabelama. U okviru Counts
biramo Observed (dobijene frekvencije), a ponuen je i prikaz
oekivanih frekvencija (Expected). U okviru Percentages
moemo da biramo da li emo vidjeti prikaz procenata, i koji
tip prikaza: u odnosu na red (Row), kolonu (Column), ili
ukupan broj (Total). U naem primjeru odluili smo se za
procentualni prikaz po redovima.

110

Osnovne statistike metode i tehnike u SPSS-u

111

Kad smo sve potvrdili sa Continue i OK i dobijamo sljedei ispis:


Crosstabs
POL * ZAPOSLEN Crosstabulation
ZAPOSLEN
zaposlen
POL

muski

Count

zenski

% within
POL
Count

Total

% within
POL
Count
% within
POL

nezaposlen

Total

64

24

88

72.7%

27.3%

100.0%

35

93

128

27.3%

72.7%

100.0%

99

117

216

45.8%

54.2%

100.0%

Chi-Square Tests

Value
Pearson Chi-Square

Asymp. Sig. (2sided)

df

43.264(b)

.000

Continuity Correction(a)

41.455

.000

Likelihood Ratio

44.628

.000

43.063

.000

Fisher's Exact Test


Linear-by-Linear Association
N of Valid Cases

Exact Sig. (2sided)

Exact Sig. (1sided)

.000

.000

216

a Computed only for a 2x2 table


b 0 cells (.0%) have expected count less than 5. The minimum expected count is 40.33.

Prva tabela (POL * ZAPOSLEN Crosstabulation) nas izvjetava o


distribuciji frekvencija u pojedinim elijama tabele. Takoe, tu su i
procentualni podaci dati za redove tabele. U naem primjeru, ve na prvi
podgled vidimo da se zaposlenost distribuira nejednako po kategorijama
pola: kod ena je vie nezaposlenih, a kod mukaraca vie zaposlenih.
Moemo da pogledamo sljedeu tabelu (Chi-Square Tests) i oitamo
veliinu hi kvadrata (Pearson Chi-square): 43.264. Njegova znaajnost
(Asymp. Sig 2-sided) nam kazuje da je znaajan na nivou 0.01. Znai na

Osnovne statistike metode i tehnike u SPSS-u

112

osnovu veliine hi kvadrata zakljuujemo da su odstupanja dobijenih


podataka od teorijski oekivanih znaajna na nivou 0.01, a da bismo
vidjeli da li postoji neka pravilnost u tim odstupanjima, odnosno
korelacije to emo vidjeti u poglavlju o korelacijama za kategorike
varijable.

Osnovne statistike metode i tehnike u SPSS-u

113

Korelacije
Za korelaciju je najjednostavnije rei da predstavlja povezanost
izmeu varijabli, a koeficijent korelacije mjeru osnovu koje se zakljuuje
o stepenu njihove povezanosti. Pri razmatranju korelacija neophodno je
imati na umu da one predstavljaju stepen zajednikog pravilnog variranja
vrijednosti varijabli, odnosno da koeficijent korelacije pokazuje u kojoj
mjeri su promjene vrijednosti jedne varijable praene promjenom (ili
promjenama) vrijednosti druge (ili drugih) varijabli. Korelacije se nipoto
ne smiju brkati sa kauzalnim (uzrono-posljedinim) odnosom koja moe
da postoji izmeu varijabli, mada je to najea greka koja se sree u
interpretacijama rezultata istraivanja. Naime, kauzalni odnos govori o
takvom odnosu meu varijablama gdje promjene vrijednosti jedne
varijable (koja se moe oznaiti kao nezavisna varijabla) uzrokuju
promjene vrijednosti druge varijable (koja se predstavlja kao zavisna
varijabla), dok se kod korelacija radi o simultanoj pravilnoj promjeni
vrijednosti varijabli i gdje ne postoji mogunost utvrivanja koja je
varijabla nezavisna a koja zavisna. Znai, ukoliko su dvije varijable u
korelaciji, to nikako ne znai da promjene jedne varijabla uzrokuju
promjene druge varijable.
Karakteristike korelacije koje treba poznavati su njihova visina ili
intezitet i statistika znaajnost. to se tie visine korelacija, prvo treba
rei da one mogu da budu pozitivnog ne(od 0 do 1), smijer (+ ili -),:
Visine korelacije aproksimativno ocjenjujemo kao:
r od 0.00 do 0.20 nikakva do neznatna povezanost
r od 0.20 do 0.40 niska povezanost
r od 0.40 do 0.60 povezanost srednjeg intenziteta
r od 0.60 do 0.80 visoka povezanost
r od 0.80 do 1.00 veoma visoka do apsolutna povezanost

Osnovne statistike metode i tehnike u SPSS-u

114

Koeficijent linearne korelacije


Pearsonov koeficijent linearne korelacije predstavlja parametrijski
test, i stoga mora da zadovolji uslove intervalnosti podataka, normalnosti
raspodjele, i linearnosti odnosa izmeu varijabli. Osnovna formula za
izraunavanje Pearsonovog koeficijenta je:
x

rXY =

N 1

, gdje su: x = X MX i y = Y MY (odstupanja od

AS)
Odreenim transformacijama osnovne formule dolazimo do
sljedee formule za izraunavanje korelacije iz sirovih skorova,
takozvane mainske formule:
rXY =

N XY ( X )( Y )

[N X

][

( X ) N Y 2 ( Y )
2

Prednost ove formule je u tome to je jedino potrebno da znamo


sirove skorove X i Y, i nisu nam potrebne standardne devijacije.
Linearnost veze izmeu varijabli do sada nismo sretali, a najlake
ga utvrujemo uvidom u grafiki prikaz rasprenja parova taaka (skater
grafikon). Ukoliko vidimo da se odnos izmeu varijabli ne moe
priblino predstaviti pravom linijom, onda je bolje da ne koristimo
koeficijent linearne korelacije.
Ako za primjer uzmemo nae podatke o rezultatima testa
znanja iz engleskog jezika (za koje smo ve vidjeli da
ispunjavaju uslov normalnosti raspodjele), da bismo grafiki
ustanovili linearnost odnosa, idemo na meni Graphs/Scatter,
izaberemo opciju Simple i kliknemo na dugme Define.

Osnovne statistike metode i tehnike u SPSS-u

115

Tako smo doli do dijalog prozora u kojem treba da odredimo


dvije varijable iji grafikon emo vidjeti. Nae varijable
ubacujemo u polja Y Axis i X Axis (u naem sluaju to su
varijable sk.eng2 i sk.eng), i sve to treba da uradimo je da
potvrdimo sa OK.

Dobijamo grafikon na kojem vidimo kako se distribuiraju


rezultati na dva testa koje analiziramo. Vidimo da nema velikih
odstupanja, i da rezultati ine priblino ravnu liniju, to nam
govori da ima smisla da raunamo koeficijent linearne
korelacije. Primjeri odstupanja od linearnosti bi bile krive koje
izgledaju kao , , , , , ili na druge naine razliito od ravne
linije.

Rezultat testa iz engleskog poslije kursa

40

30

20

10
16

18

20

22

24

Rezultat testa iz engleskog prije kursa

26

28

30

Osnovne statistike metode i tehnike u SPSS-u

116

Da bismo izraunali Pearsonov koeficijent, idemo na


Analyze/Correlate/Bivariate. Za poetak je ve oznaena
kuica Pearson i Two-tailed significance, i tako treba i da
ostavimo. Varijable ije korelacije elimo da vidimo
ubacujemo u desni okvir (u naem sluaju to su varijable
sk.eng2 i sk.eng), i potvrdimo sa OK.

Za ispis dobijamo sljedeu tabelu:


Correlations

SKOR.ENG Rezultat
testa iz engleskog
prije kursa

Pearson Correlation

SK.ENG2 Rezultat
testa iz engleskog
poslije kursa

Pearson Correlation

SKOR.ENG
Rezultat testa
iz engleskog
prije kursa
1

SK.ENG2
Rezultat testa
iz engleskog
poslije kursa
.914(**)

.000

Sig. (2-tailed)
N

216

216

.914(**)

Sig. (2-tailed)

.000

216

216

** Correlation is significant at the 0.01 level (2-tailed).

Poto moemo odjednom da ubacimo u obradu vie od dvije


varijable, program nam daje ispis tabele sa svim moguim korelacijama,
pa tako i svake varijable sa samom sobom, to nam daje korelaciju 1, tako
da dijagonalu tabele moemo da ignoriemo. Pored visine korelacije date
u redu Pearson Correlation, dobijamo i znaajnost korelacije u redu Sig.
(2-tailed), i broj ispitanika uzetih u obradu N. Znaajnost korelacije nam
je prikazana i u formi zvjezdica pored same korelacije. Po obiaju, jedna
zvjezdica znai da je korelacija znaajna na nivou 0.05, a dvije zvjezdice
govore o znaajnosti na nivou 0.01.

Osnovne statistike metode i tehnike u SPSS-u

117

U naem primjeru vidimo da je korelacija pozitivna i veoma


visoka, itavih 0.914. Znajui da su u pitanju rezultati testa iz engleskog
jezika prije i poslije kursa, zakljuujemo da su studenti linearno
napredovali, i to tako da su oni koji su bili bolji na prvom testu bivali
bolji i na drugom, a i oni koji su bili srednji i loiji takoe su napredovali.
Sam koeficijent korelacije i njegova znaajnost nam ne govore da postoji
bilo kakav napredak, ali to moemo vidjeti iz grafikona, jer u sluaju da
napretka nema, skater (takasti prikaz korelacije) bi kretao iz nule i iao
po dijagonali dijagrama, to bi govorilo o slinim rezultatima na oba
testa.

Osnovne statistike metode i tehnike u SPSS-u

118

Koeficijent rang korelacije


Spearmanov koeficijent rang korelacije (, ita se: ro) je
neparametrijski test i ne postavlja zahtjeve u pogledu distribucije, jedino
to treba da imamo jesu podaci koji potiu bar sa ordinalne skale, tj.
rangovani podaci. Znai, ovaj test moemo upotrebljavati kad u poetku
imamo rangovane podatke, a tako i kada imamo podatke koji nisu
rangovani, ali ne zadovoljavaju uslove normalne raspodjele. Kao
posljedicu nieg mjernog nivoa, imamo to da je ova mjera korelacije
nepreciznija od r koeficijenta korelacije. Raunanje koeficijenta se
zasniva na razlikama u rangovima rezultata dva niza brojeva, a formula
po kojoj se rauna je:
= 1

6 D 2

N N 2 1

gdje je: D razlika izmeu rangova na prvoj i drugoj varijabli


N ukupan broj sluajeva
Za primjer emo uzeti situaciju kad je nastavnik jednog razreda
srednje kole elio da vidi da li postoje povezanosti izmeu uspjeha iz
predmeta Matemetika, Fizika i Istorija. On je uenike rangirao po
uspjesima iz ova tri predmeta i poredio ih meusobno, a mi emo to
uraditi u SPSS-u na sljedei nain:
Kao i kod sluaja linearne korelacije idemo na
Analyze/Correlate/Bivariate, u desni okvir ubacimo varijable,
ali ovaj put oznaimo kuicu Spearman. Mi smo ubacili tri
varijable, to znai da emo imati tri mogua poreenja. Na
kraju emo, naravno, potvrditi sa OK, i idemo ka analizi ispisa.

Osnovne statistike metode i tehnike u SPSS-u

119

Correlations
MATEMATI
Spearman's rho

MATEMATI

Correlation
Coefficient
Sig. (2-tailed)
N

FIZIKA

Correlation
Coefficient
Sig. (2-tailed)
N

ISTORIJA

Correlation
Coefficient
Sig. (2-tailed)
N

FIZIKA

ISTORIJA

1.000

.759(**)

-.007

.000

.967

35

35

35

.759(**)

1.000

.113

.000

.517

35

35

35

-.007

.113

1.000

.967

.517

35

35

35

** Correlation is significant at the 0.01 level (2-tailed).

Sve vai kao i u sluaju linearne korelacije: program nam je dao


sve mogue korelacije, a mi gledamo one tri koje nas zanimaju. Iz tabele
vidimo da korelacija izmeu uspjeha u matematici i fizici iznosi 0.759, i
da je statistiki znaajna na nivou 0.01. Takoe, vidimo da korelacije
izmeu uspjeha iz matematike i istorije gotovo da nema (iznosi 0.007), a
da izvjesne pozitivne korelacije izmeu uspjeha u fizici i istoriji ima
(iznosi 0.113), ali da nije statistiki znaajna.

Osnovne statistike metode i tehnike u SPSS-u

120

Biserijska i point-biserijska korelacija


U sluajevima kada raspolaemo sa jednom numerikom i jednom
kategorikom, dihitomiziranom varijablom, (varijablom koja ima dva
nivoa, npr. muki-enski pol, punoljetan-maloljetan, zaposlennezaposlen, pua-nepua), bira se odgovarajui test korelacije meu
varijablama koji se zasniva na tome da li su varijable prirodno ili
vjetaki dihitomizirane. U zavisnosti od toga primijenjuje se biserijska
ili point-biserijska korelacija. Biserijska korelacija se rauna u sluaju
kada se raspolae sa jednom varijablom kvantitativnog tipa (intervalni
nivo podataka), i drugom je vjetaki dihotomizirana u varijablu sa samo
dva modaliteta. Kao primjer nam moe posluiti imaginarni sluaj kad
elimo da vidimo da li postoji veza izmeu optih intelektualnih
sposobnosti (inteligencije) i prolaznosti na ispitu iz matematike.
Point-biserijska korelacija, sa druge strane, je vrlo sliana,
meutim ovaj put je kategorika varijabla prirodno podijeljena u dvije
kategorije (npr. pol), dok je druga varijabla kao i u sluaju izraunavanja
biserijske korelacije intervalnog nivoa.
U oba sluaja, najlake je da u okviru SPSS-a ovu proceduru
radimo kao i koeficijent linearne korelacije. Za primjer koji emo
razmotriti uzeli smo sluaj korelacije izmeu optih sposobnosti i
prolaznosti na ispitu iz matematike. Varijable su operacionalizovane tako
to su sposobnosti mjerene jednim standardizovanim testom inteligencije,
a na ispitu iz matematike je registrovano ko je proao a ko nije, (odnosno
ispitanici su podjeljeni u dvije kategorije; proli i pali).
Kao i u sluajevima prethodne dvije korelacije, idemo na
Analyze/Correlate/Bivariate, i moemo da ostavimo
oznaenu kuicu Pearson. Unesemo u desni okvir nae dvije
varijable i potvrdimo sa OK.

Osnovne statistike metode i tehnike u SPSS-u

121

Nakon toga dobijamo sljedeu tabelu sa rezultatima:


Correlations

MATEMAT

Pearson
Correlation
Sig. (2-tailed)
N

SPOSOBNO

Pearson
Correlation
Sig. (2-tailed)
N

MATEMAT

SPOSOBNO

.416(**)

.000

100

100

.416(**)

.000

100

100

** Correlation is significant at the 0.01 level (2-tailed).

U naem fiktivnom primjeru, na uzorku od 100 studenata traili


smo vezu izmeu optih sposobnosti i prolaznosti na ispitu iz
matematike. Iz tabele moemo vidjeti da korelacija iznosi 0.416,
pozitivna je i statistiki znaajna na nivou 0.01. Znai, mogli bismo rei
da postoji srednja pozitivna i statistiki znaajna korelacija izmeu optih
sposobnosti i prolaznosti na ispitu iz matematike.

Osnovne statistike metode i tehnike u SPSS-u

122

Korelacije kategorikih varijabli


Kao to smo vidjeli, 2 nam moe posluiti za testiranje znaajnosti
odstupanja, ali da bismo vidjeli kolika je povezanost izmeu dvije
kategorike varijable posluiemo se koeficijentom korelacije za tabele
veliine 2x2, i C koeficijentom kontingencije za vee tabele. Obe ove
mjere korelacije se mogu izraunati posebnim postupcima, ili uz pomo
odreenih matematikih transformacija, na osnovu hi-kvadrata.
Osnovni matematiki izraz za izraunavanje koeficijenta bio bi:
=

ad bc
(a + b)(a + c)(b + d )(c + d )

gdje se sa a, b, c i d oznaavaju elije tabele 2x2. Princip


obiljeavanja elija je da se sa a i d oznaavaju kategorije dijagonale u
kojoj su vee opaene frekvencije.
Uzmimo za primjer isti sluaj koji emo uraditi i uz pomo SPSSa, a to moe da bude primjer korelacije izmeu pola i zaposlenosti.
Imamo, znai, sljedeu tabelu frekvencija:
Total

ZAPOSLENOST
zaposlen
POL

nezaposlen

muski
64 (a)

24 (b)

88 (a+b)

35 (c)

93 (d)

128 (c+d)

99 (a+c)

117 (b+d)

zenski

Kad sve uvrstimo u formulu, imamo sljedei izraz:


=

64 x93 24 x35
88 x99 x117 x128

= 0.45

Vidimo da je dobijena korelacija 0.45. Poto je ovo bio nain


raunanja iz sreenih podataka, poslije emo vidjeti (u SPSS-u) kako
emo to isto izraunati iz sirovih podataka.
Alternativni obrazac moemo primijeniti ukoliko ve znamo
veliinu hi-kvadrata, i taj obrazac glasi:
=

2
N

Osnovne statistike metode i tehnike u SPSS-u

123

Koeficijent kontingencije (C koeficijent) raunamo kad imamo


tabele koje su vee od 2x2, mada ga moemo raunati i za tabele 2x2.
Matematika formula je sljedea:
2

C=

f
SN
, dok S raunamo kao S = o
fe
S

Sa N je oznaen ukupan broj sluajeva, fo su opaene frekvencije (o


od observed opaene na engleskom), a fe su teorijski oekivane
frekvencije (e od expected oekivane na engleskom). Opaene
frekvencije su dobijene mjerenjem, odnosno prebrojavanjem sluajeva za
svaku kategoriju, dok oekivane frekvencije za svaku eliju tabele
dobijamo po formuli:
fe =

KxR
, gdje je
N

K suma kolone
R suma reda
N ukupan broj sluajeva
Takoe, kao i u sluaju koeficijenta, i C koeficijent moemo
lako izraunati ukoliko ve znamo veliinu hi-kvadrata:
C=

2
N + 2

Kao primjer kojim emo sve ovo ilustrovati u SPSS-u, moemo


uzeti vezu izmeu pola i zaposlenosti u nekom fiktivnom ispitivanju. Obe
varijable imaju po dva modaliteta: muko-ensko i zaposlen-nezaposlen.

Osnovne statistike metode i tehnike u SPSS-u

Idemo na Analyze/Descriptive Statistics/Crosstabs...

Nakon to u okvir Row(s) ubacimo jednu varijablu, i u okvir


Column(s) drugu, kliknemo na dugme Statistics da bismo
odabrali statistike procedure koje elimo.

Naravno, poto nas zanima korelacija, sad emo izabrati opciju


Phi and Cramers V, potvrdiemo sve sa Continue i OK, i
dobiemo sljedei ispis:

124

Osnovne statistike metode i tehnike u SPSS-u

125

Crosstabs
POL * ZAPOSLEN Crosstabulation
Count
ZAPOSLEN
POL

Total

muski

zaposlen
64

nezaposlen
24

zenski

35

93

128

99

117

216

Total

88

Symmetric Measures

Value
Nominal by
Nominal

Phi
Cramer's V

N of Valid Cases

Approx. Sig.

.448

.000

.448

.000

216

a Not assuming the null hypothesis.


b Using the asymptotic standard error assuming the null hypothesis.

Vidimo da prva tabela izgleda isto onako kako smo imali u


primjeru sa sreenim podacima, to je i logino. Tu vidimo koliko
sluajeva ima u svakoj od kategorija. Na prvi pogled vidimo da u naem
uzorku meu mukarcima ima vie zaposlenih, dok meu enama ima
vie nezaposlenih.
Sljedea tabela nam daje mjeru korelacije koju smo traili:
gledamo red u kojem pie Phi, to je na koeficijent, dok red u kojem
pie Cramers V za sada moemo zanemariti. Veliina koeficijent je
0.448, i vidimo da je ta korelacija znaajna na nivou 0.01. Znai, sad
moemo zakljuiti da u naem uzorku postoji statistiki znaajna
povezanost srednje veliine izmeu pola i zaposlenosti, i to tako da meu
mukarcima ima vie zaposlenih, dok meu enama ima vie
nezaposlenih.

Osnovne statistike metode i tehnike u SPSS-u

126

Pouzdanost
Pouzdanost testa, odnosno upitnika, je jedna od karakteristika
mjernog instrumenta koja se neizostavno navodi u svakom naunoistraivakom izvjetaju. Ova metrijska karakteristika testa treba da
pokae stepen neprciznosti, odnosno da utvrdi veliinu greke mjerenja
koje je ukljuena u skor dobijen mjerenjem putem datog testa. Naravno,
treba imati na umu da test mora biti sumacionog tipa, odnosno mora imati
jedan krajnji skor, inae nema smisla raditi ovu proceduru. Ukratko,
pouzdanost treba da nam kae koliko je na test precizan, odnosno da li
e, ukoliko ga zadajemo vie puta, svaki put dati priblino sline
rezultate. Svaki test e, ipak, pokazivati izvjesnu nepreciznost i to je
neminovno, ali ukoliko zadajemo jedan test vie puta istoj grupi
ispitanika ustanoviemo da mora postojati i izvjesno slaganje izmeu
rezultata na ponovljenim mjerenjima.
U teoriji, prema klasinim psihometrijskim pristupima postoje etiri
grupe metoda za procjenjivanje koeficijenta pouzdanosti koji se baziraju
na nekim statistikim analizama podataka dobijenih na testovima
(korelacije ili drugo):
1. Metod ponovnog zadavanja testa (retest metod) kada jedan test
zadajemo istoj grupi ispitanika vie puta.
2. Metod paralelnih formi testa kada imamo dvije forme testa koji
mjere istu varijablu.
3. Metod dijeljenja testa na dva ili vie dijelova kada se po
odreenim principima jedan test podijeli na podtestove.
4. Metod analize stavki testa ili metod interne konzistentnosti
kada se mjere svojstva svih stavki testa.
Mi emo se ovde baviti alfa koeficijentom kao statistikom koji
govori o pouzdanosti testa, a koji spada u metode interne konzistentnosti i
u strunim lancima je ubjedljivo najzastupljeniji. Zbog komplikovanije
matematike procedure, kojom se dolazi do izvoenja formula za ovaj tip
pouzdanosti, ograniiemo se iskljuivo na tehniku izvoenja ovog
postupka u okviru SPSS-a.
Za primjer emo uzeti jedan upitnik za mjerenje osobine linosti
autoritarnosti koji se koristi u psihologiji, a zove se skala autoritarnosti.
Primjenjena skala je se sastoji od 15 tvrdnji na kojima se ispitanici
izjanjavaju u kojoj mjeri se slau sa svakom ponuenom tvrdnjom. Na
kraju se izraunava neki skor koji nam govori u kojoj mjeri je kod
ispitanika izraena ta osobina linosti.

Osnovne statistike metode i tehnike u SPSS-u

Za poetak idemo na Analyze/Scale/Reliability Analysis.

Kad smo u lijevom okviru selektovali 15 varijabli (u naem


sluaju to su varijable f.1 do f.15), treba da odaberemo model,
odnosno metod mjerenja pouzdanosti. Ukoliko kliknemo na
kuicu Model, dobiemo ponuenih pet matematikih modela:
Alpha, Split-half, Guttman, Parallel i Strict parallel. Poto smo
rekli da emo se odluiti za alfa koeficijent, njega emo i
izabrati.
Sljedee to moemo uraditi jeste da kliknemo na dugme
Statistics gdje dobijamo dosta opcija koje moemo izabrati:

I pored velikog broja opcija koje se tiu deskripcije testa,


nama je najzanimljivija opcija Scale if item deleted koja e

127

Osnovne statistike metode i tehnike u SPSS-u

128

nam pokazati koliko bi iznosila pouzdanost testa ukoliko


pojedinu stavku izbacimo. Time brzo moemo da vidimo koje
stavke nam znaajno remete pouzdanost testa. Kad sve to
potvrdimo sa Continue i OK, dobijamo sljedei ispis:
Reliability
R E L I A B I L I T Y

A N A L Y S I S

S C A L E

(A L P H A)

Item-total Statistics

F.1
F.2
F.3
F.4
F.5
F.6
F.7
F.8
F.9
F.10
F.11
F.12
F.13
F.14
F.15

Scale
Mean
if Item
Deleted

Scale
Variance
if Item
Deleted

43.9576
45.0586
45.2889
45.3414
44.1333
45.2848
44.5980
43.9859
44.0869
44.0061
45.6545
44.5576
45.5313
45.9313
44.4707

65.4699
62.7759
67.4123
63.4642
69.0713
69.0098
65.3219
68.9613
67.4074
66.1963
69.0160
66.5508
64.3710
70.1572
65.2213

Corrected
ItemTotal
Correlation
.4637
.4512
.3058
.4703
.2255
.1753
.3589
.2263
.2991
.3851
.2319
.3435
.3670
.1667
.3861

Alpha
if Item
Deleted
.6932
.6907
.7085
.6895
.7167
.7243
.7024
.7167
.7092
.7003
.7160
.7044
.7014
.7228
.6994

Reliability Coefficients
N of Cases =
Alpha =

495.0

N of Items = 15

.7208

Na samom kraju vidimo koliki je koeficijent alfa, i to je glavni


podatak koji smo traili. Za pouzdanost psiholokih testova nema strogih
pravila o tome ta su granice koje se moraju ispotovati. Kad su u pitanju
testovi znanja, ta granica je neto via, dok kad su u pitanju testovi
linosti zahtjevi su manji. Neka arbitrarna granica iznad koje bi se test
mogao nazvati pouzdanim moe biti alfa=0.80, dok se pouzdanost iznad
0.90 tretira kao vrlo visoka pouzdanost. Generalna zakonitost je ta da to
test ima vie stavki to koeficijent pouzdanosti tei da bude vei.
Moemo vidjeti da naa skala autoritarnosti ima alfa=0.72, to bi bilo
neto ispod odreene granice pouzdanosti, ali poto imamo na umu da je

Osnovne statistike metode i tehnike u SPSS-u

129

u pitanju test linosti i da ima mali broj stavki, moglo bi se rei da je


pouzdanost ipak prihvatljiva.
Dalje, u krajnjoj koloni ispisa (Alpha if Item Deleted) moemo
vidjeti koliki bi bio koeficijent alfa kad bi izbrisali neku od tvrdnji. U
naem sluaju moemo zakljuiti da nikakvim izbacivanjima tvrdnji ne
bismo poveali pouzdanost skale, tako da to ne bi imalo smisla.
Pored toga, iz ispisa imamo i vrlo vane podatke o
diskriminativnosti svake stavke. oni se nalaze u koloni Corrected ItemTotal Correlation. U ovoj koloni su date korelacije svake pojedinane
stavke sa ukupnim testom bez te stavke. Diskriminativnost stavke
predstavlja stepen u kome stavka moe da diskriminie ispitanike.
Ukoliko se na stavku dobijaju uniformni odgovori, to nam onemoguava
da zakljuujemo o individualnim razlikama izmeu ispitanika. U
istraivanjima se kao stavke sa loom idskriminativnosti tretiraju sve one
ija je vrijednost korigovane ajtem-total korelacije negativna, kao i one
koje ije su vrijednosti nie od 0.15. Te stavke svojim prisustvom ne
doprinose kvalitetu testa, ve upravo suprotno sniavaju njegovu
pouzdanost.
Kao to smo to ve na poetku naglasili, navoenje koeficijenta
pouzdanosti prilikom psiholokih ispitivanja je neophodna prilikom
pisanja bilo kakvog ozbiljnijeg naunog izvjetaja.

Osnovne statistike metode i tehnike u SPSS-u

130

Kratak pregled opcija programa


U menijima koji su prikazani, trenutno dostupne opcije su ispisane
crnom bojom, dok su zasivljene opcije koje trenutno nisu dostupne.
Znai, kad nemamo otvorene podatke - nemamo na raspolaganju opcije
Save ili Save As, tj nemamo ta da snimimo.
File meni
U file meniju se nalazi skup naredbi za otvaranje i uvanje fajlova sa
podacima. Opcije koje postoje su:
New, sa podopcijama Data, Syntax, Output i Script - slui nam za
otvaranje novog prozora za razne tipove podataka.
Data - sirovi podaci koje unosimo u matricu podataka
Syntax - komandni reim u kojem unosimo niz naredbi za
manipulaciju podacima - znai, SPSS ima i poseban
komandni jezik
Output - prozor za prikaz rezultata obrade podataka
Script - slino Syntax reimu, ali ovaj put je u pitanju skript
za automatizaciju niza nekih procesa koje esto redom
obavljamo
Open - koristimo za otvaranje ranije snimljenih fajlova (baza
podataka, ispisa rezultata, komandnih programa).
Read ASCII Data - otvaranje fajlova sa sirovim podacima koji su
snimljeni u tekstualnom obliku.
Close - zatvaranje prozora.
Save - snimanje podataka. Koristimo ako smo ve ranije dali ime
fajlu.
Save As... - snimanje novih podataka sa odredjivanjem imena i tipa
fajla.
Export - snimanje tabela, grafikona i rezultata obrade u drugim
formatima, tako da ih moemo otvoriti u drugim programima.

Osnovne statistike metode i tehnike u SPSS-u

131

Display Data Info... - prikazuje informacije o fajlu koji izaberemo.


Apply Data Dictionary - prebacuje ve postojee definicije
podataka (varijable, kategorije...) na nove datoteke.
Print - tampanje. Kad izaberemo ovu opciju moi emo da
biramo izmedju tampanja svega (All) ili samo onog to
selektujemo (Selection). Ovde, takodje, odredjujemo i broj kopija
koje tampamo.
Stop SPSS Processor - prekida proces obrade koji je aktivan, koji
se u tom trenutku odvija.
Exit SPSS - izlazak iz programa.
Edit meni

U ovom meniju se nalaze opcije za operacije sa tekstom i podeavanje


programa naim potrebama.
Undo - ponitava zadnju obavljenu operaciju.
Cut, Copy, Paste, Clear - standardne Windows operacije za
isjecanje, kopiranje, lijepljenje i brisanje selektovanih sadraja.
Find... - pronalaenje podataka ili teksta.
Options... (u nekim verzijama programa "Preferences") podeavanje opcija programa.
Za nas e u ovom trenutku biti zanimljivo jedino da se pod opcijom
General, pa u okviru nje pod "Display Order for Variable Names"
moe podesiti redoslijed varijabli koje smo unosili (alfabetski ili
onako kako smo ih unosili), i da se pod opcijom Pivot Tables
podeava tip tabela u kojima se prikazuju rezultati (uvijek je
korisno smanjiti veliinu tabela, jer su esto prevelike da bi stale na
jedan ekran).
Kad radimo u prozoru Output, imamo jo neke opcije u meniju
Edit (Copy Objects, Paste After, Paste Special...), ali to su neke
naprednije opcije, te ih ovde neemo detaljnije razmatrati.

Osnovne statistike metode i tehnike u SPSS-u

132

View meni
Pod ovim menijem biramo opcije za ono ta emo vidjeti na ekranu.
Status Bar - odredjuje da li emo u dnu ekrana imati ispisan
trenutni status programa. Kad nita ne radimo od operacija, tu
obino pie "SPSS Processor is ready", a kad je neka operacija
aktivna obino pie "Running..." i vrsta operacije.
Toolbars - pod ovom opcijom definiemo ta e od brojnih
mogunosti programa biti dostupno u vidu dugmia ispod menija.
Fonts, Grid Lines i Value Labels - odredjuju izgled matrice
podataka.
Kad je aktiviran prozor Output, imamo jo opcije Expand, Collapse,
Show i Hide koje se odnose na vidljivost objekata u Output prozoru
(takodje i Outline Size i Outline Font).
Data meni
U Data meniju imamo niz opcija za definisanje varijabli i manipulaciju
podacima.
Define Variable - definisanje varijabli. U odjeljku Unos podataka
e biti detaljnije obradjene podopcije.
Define Dates - definiemo format datuma (ukoliko unosimo
podatke vezane za vrijeme).
Templates - ukoliko imamo ranije napravljene ablone za
definisanje varijabli, ovde ih biramo.
Insert Variable - umee novu varijablu ispred one koja je trenutno
selektovana.
Insert Case - umee novi red (sluaj, ispitanik...) iznad trenutno
selektovanog.
Go to Case - odvodi nas na traeni sluaj.

Osnovne statistike metode i tehnike u SPSS-u

133

Sort Cases - sortira redove (uzlazno ili silazno) po vrijednostima


neke varijable.
Transpose - pravi novu matricu podataka tako to redove pretvara
u kolone.
Merge Files - spajanje datoteka. Podopcije su "Add Cases" (dodaje
ispitanike, sluajeve) i "Add Variables" (dodaje varijable).
Aggregate - spajanje podataka tako da grupe ispitanika ine jedan
zbirni sluaj u okviru nove datoteke.
Orthogonal Design - (tie se faktorske analize i spada u napredne
statistike operacije)
Generate - pravi novu datoteku koja sadri dizajn
ortogonalnih glavnih efekata koji dozvoljava statistiko
testiranje nekoliko faktora bez testiranja svih kombinacija
faktorskih nivoa.
Display - prikazuje eksperimentalni nacrt koji je napravljen
uz pomo Generate, ili bilo koji drugi nacrt u okviru radne
datoteke.
Split File - pravi podjelu u okviru datoteke (grupie ispitanike) po
vrijednostima varijable koju odredimo.
Select Cases - selektuje ispitanike prema vrijednostima neke
varijable, oni koji nisu selektovani izbaeni su iz dalje analize.
Weight Cases - ponderisanje (opereivanje) ispitanika. Simulira se
replikacija ispitivanja, i to u zavisnosti od vrijednosti izabrane
varijable. Vrijednosti ponder varijable govore o navodnom broju
opservacija. Iz dalje obrade se izbacuju ispitanici koji imaju 0,
negativnu vrijednost ili nedostajui podatak.
Transform meni
Ovaj meni nam omoguava razne transformacije podataka.
Compute - kreira novu varijablu razliitim oblicima izraunavanja
na osnovu vrijednosti ve postojeih varijabli.

Osnovne statistike metode i tehnike u SPSS-u

134

Random Number Seed - podeavanje generatora sluajnih


brojeva.
Count - kreira varijablu u okviru koje se nalaze prebrojane iste
vrijednosti koje se nalaze u okviru raznih varijabli. Npr. ukoliko
imamo nekoliko varijabli koje govore o tome da li ispitanici
gledaju ili ne gledaju neke TV stanice (npr. 1 znai da, a 0 ne), pa
na kraju elimo da znamo koliko ispitanik ukupno gleda TV
stanica, iskoristiemo Count.
Recode - rekodiranje (ponovno kodiranje na drugaiji nain)
vrijednosti varijable.
Rank Cases - kreira novu varijablu koja sadri rangovane
vrijednosti izabrane varijable.
Automatic Recode - kreira novu varijablu i automatski rekodira
sadraj neke string (slovne) ili brojane varijable u sekvencijalne
vrijednosti.
Replace Missing Values - popunjava elije kod kojih postoji
nedostajui podatak.

Analyze meni
Budui da je SPSS modularno organizovan program (sastavljen je iz vie
dijelova koje moete instalirati - prema vaim potrebama, a u zavisnosti
od toga bie dostupan razliit broj statistikih procedura), broj statistikih
operacija koje moete vidjeti u Statistics meniju moe da varira. Ja u u
ovom trenutku samo nabrojati koje su to operacije dostupne kad su
instalirani svi moduli:
Summarize - sumarne procedure
Frequences - prikazuje frekvencije, procente i osnovne mjere
devijacija i centralnih tendencija
Descriptives - prikazuje deskriptivne mjere (minimalnu i
maksimalnu vrijednost, neke od mjera devijacija i aritmetiku
sredinu)
Explore - razne zbirne mjere i grafiki prikazi, za sve ispitanike ili
za podgrupe ispitanika

Osnovne statistike metode i tehnike u SPSS-u

135

Crosstabs - krostabulacije, tabelarni prikazi ukrtanja varijabli - uz


to idu i brojne deskriptivne i statistike procedure
Case Summaries - statistike mjere za podgrupe ispitanika
grupisanih po kategorijama neke varijable
Report Summaries in Rows - prikazuje ispis gdje se sumarne
mjere pojavljuju u redovima
Report Summaries in Columns - prikazuje ispis gdje se sumarne
mjere pojavljuju u kolonama
Custom Tables - razne vrste tabelarnih prikaza rezultata
Basic Tables - krostabelarni prikazi i statistike mjere
General Tables - krostabelarni prikazi i statistike mjere
Tables of Frequencies - krostabelarni prikazi frekvencija i
procenata
Compare Means - poredjenje aritmetikih sredina
Means - rauna aritmetike sredine (i druge statistike mjere) za
zavisne varijable unutar grupa koje odredimo kategorijama
nezavisne varijable. Opciono moemo da dobijemo i univarijatnu
analizu varijanse.
One-Sample T Test - testira da li aritmetika sredina jedne
varijable znaajno odstupa od konstante koju odredimo
Independent-Samples T Test - t test za nezavisne uzorke (testira
znaajnost razlika izmedju aritmetikih sredina dvaju nezavisnih
uzoraka)
Paired-Samples T Test - t test za zavisne uzorke (testira
znaajnost razlika izmedju aritmetikih sredina dvaju zavisnih
uzoraka - usti uzorak u dva mjerenja ili upareni ispitanici)
One-Way ANOVA - univarijata analiza varijanse (testira
znaajnost razlika izmedju aritmetikih sredina dvaju ili vie
uzoraka)
General Linear Model - analiza varijanse (ANOVA) i analiza
kovarijanse (ANCOVA)
Simple Factorial - analiza varijanse za faktorijalni dizajn
GLM-General Factorial - regresiona analiza i analiza varijanse
GLM-Multivariate - regresiona analiza i analiza varijanse vie
zavisnih varijabli
GLM-Repeated Measures - analiza grupe zavisnih varijabli koje
sadre razliita mjerenja istog atributa

Osnovne statistike metode i tehnike u SPSS-u

136

Correlate - korelacije
Bivariate - rauna Pirsonov, Spirmanov i Kendalov koeficijent
korelacije
Partial - daje koeficijent korelacije uz kontrolu jedne ili vie
dodatnih varijabli
Distances - daje statistike mjere mjerei slinosti ili razlike
parova varijabli ili ispitanika
Regression - daje regresione koeficijente
Linear - rauna koeficijent linearne regresije koji najbolje
predvidja vrijednost zavisne varijable, poznavajui vrijednosti
jedne ili vie nezavisnih varijabli
Curve Estimation - ova procedura daje procjene regresijskih
mjera za 11 razliitih modela procjene regresionih funkcija
Logistic - koristimo kad hoemo da predvidimo prisustvo ili
odsustvo neke karakteristike na osnovu grupe prediktorskih
varijabli
Probit - mjeri povezanost izmedju jaine stimulusa i proporcije
sluajeva istovjetnih odgovora na stimulus
Nonlinear - nalazi nelinearni model povezanosti izmedju zavisne i
nezavisnih varijabli
Weight Estimation - kad se ne pretpostavlja konstantna veliina
varijanse unutar populacije koju tretiramo
2-Stage Least Squares - kad se pretpostavlja da greke unutar
zavisne varijable koreliraju sa nezavisnim varijablama
Loglinear - viestruke frekvencijske analize
General - opta viestruka frekvencijska analiza
Logit - kad jednu od kategorikih varijabli smatramo za zavisnu, a
ostale za nezavisne
Model Selection - analizira viestruke kontingencijske tabele i
pomae u pronalaenju povezanosti izmedju kategorikih varijabli
Classify - pronalazi grupisanja u okviru podataka
K-Means Cluster - identifikuje homogene grupe na bazi izabranih
karakteristika, koristei algoritam za baratanje velikim brojem
sluajeva
Hierarchical Cluster - identifikuje homogene grupe na bazi
izabranih karakteristika, koristei algoritam koji zapoinje sa
svakim sluajem u odvojenom klasteru i kombinuje klastere sve
dok ne ostane samo jedan
Discriminant - predvidja pripadnost odredjenoj grupi na osnovu
grupe varijabli (karakteristika)

Osnovne statistike metode i tehnike u SPSS-u

137

Data Reduction - redukcija podataka


Factor - faktorska analiza za grupu kvantitativnih varijabli
Correspondence Analysis - analiza povezanosti dve kategorike
varijable grafiki
Optimal Scaling - slino faktorskoj analizi, ali moemo da radimo
sa razliitim tipovima varijabli: kvantitativnim, ordinalnim ili
nominalnim
Scale - analize mjernih skala
Reliability Analysis - analiza pouzdanosti mjerne skale
Multidimensional Scaling - analiza distanci izmedju objekata ili
sluajeva
Nonparametric Tests - neparametrijski testovi
Chi Square - 2 test
Binomial - testira binomnu raspodjelu jedne dihotomne varijable
Runs - da li je redoslijed pojavljivanja dve vrijednosti jedne
varijable sluajan
1-Sample K-S - Kolmogorov-Smirnov test odstupanja raspodjele
od zadate teorijske raspodjele vrijednosti
2 Independent Samples - poredi dve grupe ispitanika
K Independent Samples - poredi dve ili vie grupa ispitanika
2 Related Samples - poredi distribucije dve varijable
K Related Samples - poredi distribucije dve ili vie varijabli
Time Series - analiza podataka u vremenskim serijama
Exponential Smoothing - ispravlja neregularne komponente
podataka u vremenskim serijama
Survival
Life Tables - poseban nain rada sa vremenskim periodima koji
jo nisu okonani (npr. duina zaposlenja u nekoj firmi za ljude
koji jo uvijek rade), dijeljenjem na manje vremenske periode
Kaplan-Meier - Kaplan-Majerov model rada sa vremenskim
periodima koji jo nisu okonani
Cox Regression - predvidjanje duine vremenskih perioda na
osnovu podataka (takodje ukljuuje rad sa vremenskim periodima
koji jo nisu okonani)
Cox w/ Time-Dep Cov - Koksov regresioni model sa raunanjem
vrmenski zavisne kovarijanse
Multiple Response - rad sa spojenim varijablama

Osnovne statistike metode i tehnike u SPSS-u

138

Define Sets - spajanje vie osnovnih varijabli u jednu varijablu sa


vie kategorija. Tek kad definiemo setove varijabli moemo da
pristupimo opcijama Frequencies i Crosstabs.
Graphs meni
U okviru Graphs menija moemo da pravimo razne vrste grafikih
reprezentacija podataka koje imamo.
Bar - stupasti grafikoni
Line - linijski dijagrami
Area - dijagrami sa popunjenim povrinama
Pie - kruni ("pita") dijagram
High-Low - grafikoni sa reprezentacijom koja se zasniva na vertikalnim
visinskim razlikama ("visoko-nisko" grafikon)
Pareto - kombinovani histogramski i kumulativni linijski prikaz
Control - grafikoni sa kontrolnim linijama
Boxplot - grafikoni u obliku kutije
Error Bar - grafikoni za prikaz mjera disperzije
Scatter - takasti prikaz raspodjela dve ili tri varijable u
dvodimenzionalnom ili trodimenzionalnom prostoru
Histogram - histogrami
P-P - grafikoni kumulativnih proporcija
Q-Q - grafikoni centila
Sequence - grafikoni sekvencijalnih sluajeva
Time Series - grafikoni podataka u vremenskim serijama

Utilities meni
Ovaj meni sainjavaju razni alati.
Variables - prikazuje nam podatke o varijablama koje odaberemo
File Info - daje podatke o svim varijablama
Define Sets - definiemo zajednike skupove varijabli
Use Sets - definiemo koje skupove varijabli emo koristiti u obradama,
tako da samo njih vidimo pri izboru
Run Script - startuje skriptni program koji smo ranije snimili
Menu Editor - podeavamo menije koje koristimo, ubacujemo nove ili
izbacujemo opcije koje ne koristimo

Osnovne statistike metode i tehnike u SPSS-u

139

Windows i Help meniji su standardni meniji za sve windows programe,


te neemo ulaziti u njihovo opisivanje.

Osnovne statistike metode i tehnike u SPSS-u

Literatura
Dragievi,
Bukvi, 1986,
Baker, 1994,
Mason at al, 1997,
Levin & Fox, 1997
Halmi, 1999
Halmi
Todorovi (1995
Campbell (1953
Risti, 1983
G.Kneevi i K.Momirovi

Campbell (1953

140

You might also like