SPSS Najnovije Izdanje II

SPSS za psihologe i pedagoge
Predgovor Ovaj tekst koji je pred Vama, pokuae da Vas uvede u osnovne primjene statistikih procedura u okviru statistikog programa SPSS. Danas se svi statistiki poslovi obavljaju primjenom vie ili manje sloenih kompjuterskih programa, te smo mi pokuali da uvedemo itaoca u svijet kvantitativne analize podataka u praksi, kroz jednostavan korak-po-korak pristup koritenja statistikih analiza i programa SPSS. Svako poglavlje smo pokuali da ilustrujemo praktinim primjerom, tako da je itaocima lake da savladaju logiku metodologije i statistike u konkretnom sluaju. Svako poglavlje koje se bavi odreenom statistikom operacijom koncipirano je tako da prvo prui uvid, u najkraim crtama, u matematiku pozadinu operacije, a nakon toga i u primjenu operacije kroz primjer u SPSS-u. Knjiga je zasnovana je kako na viegodinjim iskustvima autora u radu sa praktinim statistikim problemima, tako i sa uvidom u edukativne potrebe studenata drutvenih nauka. Namijenjena je prvenstveno studentima socijalnih nauka, kao tu su psihologija, sociologija, pedagogija i socijalni rad, ali mogu je koristiti i profesionalci koji nemaju iskustva u radu sa statistikim programima. Iako postoji i drugi programi za statistike analize, mi smo se odluili za SPSS iz prostog razloga jer je najrasprostranjeniji i najdostupniji paket ne samo kod nas ve i u svijetu, ali logika rada je toliko slina u veini programa, da su znanja potpuno prenosiva. Treba napomenuti da knjiga ne pretenduje da bude udbenik iz statistike, ve da poslui kao vodi za primijenjenu statistiku. Za detaljniji uvid u statistiku kao nauku (bar onaj dio koji je obuhvaen ovim prirunikom), preporuujemo Vam da obratite panju na osnovne udbenike kao to su Statistika za psihologe edomira Dragievia i Osnovne statistike metode za nematematiare Borisa Petza. to se tie daljeg usavravanja u baratanju statistikim programom SPSS preporuujemo udbenik Statistika u psihologiji - prirunik Lazara Tenjovia.
UVOD
1
O psiholokim istraivanjima U istraivanjima u psihologiji, kao i u ostalim drutvenim naukama, se nastoji operisati sa to je mogue vie objektivnih i mjerljivih injenica. Takvo nastojanje, koje se ostvaruje kroz primjenu i pridravanje metodolokih standarda u istraivanjima, omoguava razvoj nauke na empirijski dobijenim, provjerljivim, podacima. Iz toga proizlazi da psihologija kroz metodoloki korektna istraivanja ostvaruje dvostruku korist. Kao prvo, mogunost stalnog razvoja i kumulacije psiholokih saznanja baziranih na empirijskim podacima i argumentima koje oni pruaju. I kao drugo, mogunost primjene sofisticiranih statistikih metoda u razmatranju velikog broja fenomena i njihovih meusobnih odnosa. Stoga je potpuno jasno zato se insistira na potivanju metodolokih naela u psiholokim istraivanjima. Kroz svakodnevni ivot ljudi se susreu sa brojnim psiholokim pojavama. Opaaju ih, interpretiraju i o njima donose zakljuke i sudove. Takva saznanja se nazivaju zdravorazumskim. Iako ponekad interesantna, obuhvatna ili prihvatljiva, zdravorazumska znanja su mnogo ee povrna i diskutabilna. Kako nisu nauno zasnovana, njihova glavna karakteristika ostaje nepouzdanost. Nauna znanja, sa druge strane, bazirana su na korektnim empirijskim istraivanjima. Takva saznanja imaju daleko veu naunu teinu i znaaj u rasvjetljavanju fenomena kojima se psihologija bavi. Stoga je bitno poznavati aspekte istraivanja koji ih ine naunim. Todorovi (1995) kao osnovne karakteristike naunih istraivanja navodi: 1) sistematinost ova kakakteristika se odnosi na prijeku potrebu da istraivanje bude sistematski osmiljeno, pripremljeno, sprovedeno i obraeno. Drugim rijeima, neophodno je da potpuno precizno bude odreen predmet ispitivanja, uslovi i nain ispitivanja, uzorak ispitanika i nain obrade dobijenih podataka. 2) objektivnost svako istraivanje zapoinje sa odreenom pretpostavkom istraivaa. Pri njenoj provjeri neophodno je potpuno objektivno razmatranje injenica. To znai da ni u kom sluaju nije dozvoljen razvoj takve istraivake strategije koja e omoguiti rezultate koje sam istraiva zbog neeg favorizuje. 3) kumulativnost ogromna veina istraivanja u psihologiji danas je bazirana na postojeim saznanjima (vrlo su rijetka podruja koja su u istraivakom smislu tabula rasa). Iz toga slijedi da je istraivaima omogueno da na osnovu radova preanjih autora i rezultata koji su iz njih proizali, obuhvatnije i preciznije ispita odreenu pojavu. Istovremeno se time namee i zahtjev da se istraiva podrobno uputi u postojea saznanja o onome to istrauje. 4) temeljnost - zakljuci doneseni na osnovu malog broja sluajeva se ne mogu pohvaliti svojom pouzdanosti. Nauna saznanja zato poivaju na veem broju sluajeva (npr, veem broju osoba, vie ponavljanja istraivanja,...). 5) kontrolisanost Sa obzirom na to da na svaku pojavu djeluje veliki broj faktora, neophodno je poznavanje tih faktora i odnosa kojkoje oni ostvaruju (kako sa mjerenom pojavom, tako i meusobnog). Vei stepen kontrole nad uslovima u kojima se istraivanje sprovodi, jasno omoguava i vei stepen preciznosti dobijenih podataka i povjerenja u njim.
SPSS za psihologe i pedagoge 6)
7) 8) 9)
preciznost nezaobilazna stavka ukoliko istraiva eli da njegovo istraivanje bude nauno. Da bi se izbjegli nerazumijevanje, neprovjerljivost istraivanja i nerjeitost rezultata nuno je da pojmovi sa kojima se barata, uslovi u kojima se istraivanje sprovodi, hipoteze koje se razmatraju i rezultati koji proizlaze iz istraivanja budu to preciznije izreeni. loginost kao osobina istraivanja odnosi se na zahtjev da se prate logika i pravila naunog istraivanja. kritinost sva istraivanja i sistemi znanja koji na njima poivaju podlijeu kritikom razmatranju. Ukoliko prou sistematske kritike i opstanu mogu se uzeti kao prihvatljiva. obraenost U razmatranju podataka dobijenih istraivanjem primjenjuju se razliiti postupci. Ova osobina naunih istraivanja se odnosi na upuenost istraivaa u matematike i statistike metode obrade podataka i primjenu onih koji odgovaraju datom istraivanju.
Klasifikacije naunih istraivanja poivaju na karakteristikama samih istraivanja prema kojima se ona meusobom razlikuju. Izraenost ili stepen prisustva razliitih osobina istraivanja predstavlja osnovu na kojoj ih autori razlikovuju i klasifikuju. Odmah treba istai da ne postoji opta saglasnost kada se radi o klasifikaciji istraivanja. Insistiranje na pojedinim kriterijima ili broj kriterijuma na osnovu kojih je mogue izvriti klasifikaciju naunih istraivanja se znaajno razlikuju meu razliitim autorima (Todorovi 1995, Halmi, 1999, Baker 1994,). Zato je neophodno prije uputanja u svrstavanje istraivanja u neku od moguih klasa navesti na osnovu ega (koje karakteristike istraivanja) je svrstavanje bazirano. Neki od kriterija prema kojima se istraivanja klasifikuju su: a) Prema uslovima u kojima se sprovode istraivanja se mogu podijeliti na terenska (prirodna) i laboratorijska. Terenska istraivanja se sprovode u prirodnim uslovima, gdje istraiva najee nema nikakvu kontrolu nad uslovima u kojima se istraivanje odvija. Laboratorijska se, pak, odlikuju visokim stepenom kontrole nad uslovima istraivanja. Vre se u opremljenim laboratorijama to prua mogunost razmatranja i manipulacije velikim brojem faktora bitnih za istraivanje. b) Prema stepenu kontrole mogu biti eksperimentalna i neeksperimentalna (deskriptivna). Eksperimentalna istraivanja imaju vei stepen kontrole, to proizlazi iz mogunosti manipulacije varijablama i uslovima istraivanja. Neeksperimentalna istraivanja karakterie znatno manji stepen kontrole i minimalna ili ak gotovo nikakva kontrola nad varijablama i uslovima istraivanja. Sljedstveno tome, istraivanja eksperimentalnog tipa su preciznija i omoguavaju pouzdanije zakljuke. c) Ako je namjena istraivanja ono ime se rukovodimo pri klasifikaciji tada razlikujemo: bazina (temeljna, fundamentalna) istraivanja, aplikativna (primijenjena, akciona) i evaluativna (procjenjivaka) istraivanja. Namjena bazinih istraivanja je unapreenje i razvoj naunih saznanja, pri emu je pragmatiki aspekt istraivanja potpuno nebitan. Sa druge strane aplikativna istraivanja su orjentisana otkrivanju mogunosti da se rijee neki praktini
problemi. I konano evaluativna istraivanja bave se procjenom najrazliitijih efekata neke pojave. d) Sa obzirom na cilj istraivanja mogu se razlikovati eksplorativna, replikativna i parametarska istraivanja. Eksplorativna se istraivanja odnose na prva ispitivanja nekog fenomena, replikativna su ponavljanje ranije izvedenih istraivanja dok su parametarska istraivanja usmjerena na pojave koje su u odreenoj mjeri istraene uz nastojanje da se pojedini aspekti date pojave detaljnije ispitaju. e) Klasifikacija prema vrsti podataka sa kojima u istraivanju operiemo, (Emanuel J Mason & William J. Bramble, 1997), je za ovu knjigu najzgodnija. To je podjela istraivanja na kvantitativna i kvalitativna. U okviru kvantitativnih istraivanja se primijenjuju matematiki i statistiki principi mjerenja i modeli koji se koriste u prirodnim naukama. U kvalitativnim istraivanjima se susreemo sa opaanjima, utiscima i interpretacijama koji su znatno tei za objektivno analiziranje i mjerenje. Budui da se ova knjiga prvenstveno bavi analizama podataka, nau panju emo usmjeriti na kvantitativna istraivanja i podatke koje dobijamo iz njih. Da bi psiholoka istraivanja mogla obezbijediti kvantitativne podatke nuno je da za pojave koje su predmet interesovanja postoji mjerni instrument za koji je istraiva siguran da mjeri ono emu je namijenjen. Ovo je vrlo bitno zbog same injenice da u psihologiji ne postoji mjerni instrument ija je mjerna jedinica precizno definisana vrijednost svojstva koje se mjeri. Drugim rijeima, ne deava se da su mjerna jedinica i predmet mjerenja isto svojstvo odreenih vrijednosti (predmet mjerenja sa varijabilnom vrijednosti svojstva i mjerna jedinica kao precizno definisana vrijednost datog svojstva). Iz takve injenice, da zakljuivanje o vrijednosti jednog donosimo preko vrijednosti drugog svojstva, proizlazi osnovna karakteristika mjerenja u psihologiji, a to je indirektnost mjerenja. Ovakav tip mjerenja je vrlo est (razlog je u nevelikom broju svojstava koja se neposredno mogu svesti na mjerila koja posjeduju mjereno svojstvo). Npr, jedna od mogunosti izraavanja intenziteta zemljotresa je preko Merkalijeve skale, koja u stvari pokazuje stepen promjene zemljita i oteenja objekata u podruju epicentra. Temperatura vazduha se izraava prema broju Celzijusevih stepeni koji je rezultat skupljanja ili irenja ive. Indirektni tip mjerenja se u psiholokoj praksi svakodnevno susree pri mjerenju inteligencije. Tu se zakljuivanje o neijim intelektualnim sposobnostima zasniva na uspjenosti u rjeavanju problema i snalaenju u datim situacijama. Iako se iz navedenog moe zakljuiti suprotno, nema mjesta miljenju da korektna mjerenja i valjana istraivanja nije mogue sprovesti u psihologiji. Imajui u vidu definiciju mjerenja koju je dao (Campbell, N.,1953); mjerenje predstavlja pridruivanje brojeva pojavama ili svojstvima prema precizno odreenim pravilima, slijedi da je za mjerenje u psihologiji potrebno utvrditi pravilan i postojan odnos vrijednosti razliitih svojstava. Takvo e mjerenje biti korektno, saglasno sa metodolokim naelima i samim tim primjenjivo u istraivanjima.
O nivoima mjerenja (tipovima podataka)

Podatke koji se u istraivanjima razmatraju mogu se skupiti putem posmatranja, upitnika, intervjua ili eksperimenta. U okviru kvantitativnog istraivanje prikupljenim
podacima se prema odreenim pravilima pridruuju odgovarajui brojevi. Znaenje tih brojeva zavisi od karakteristika samih podataka, to je opet neodvojivo vezano za vrstu skale sa koje podaci potiu. Stoga je za u okviru statistikog razmatranja vrlo bitno da znamo sa koje skale potiu podaci. Znai, tip skale koja je primjenjena, odnosno, nivo mjerenja, uslovljava karakteristike numerikih podataka koje dobijamo, a time neposredno odreuje i statistike metode i postupke koje moemo koristiti. Stoga emo ukratko predstaviti postojee nivoe mjerenja. (Radi potpunijeg prikazivanja karakteristika pojedinih skala u prilozima se nalaze i karakteristike brojeva koje je pri razvijanju definicije mjerenja naveo Campbell (1953). Nominalni nivo Brojane vrijednosti sa ove skale nisu nita drugo do zamjena za neki naziv. Npr. kada odreujemo vrijednosti za, recimo, pol ispitanika, moemo izvrti sljedee pridruivanje: numeriku vrijednost 1 pridruiti mukom polu, a vrijednost 2 enskom (moe i obrnuto, potpuno je svejedno). Ukoliko pogledamo igrae nekog fudbalskog tima primijetiemo da se oni meusobno razlikuju prema brojevima na svojim dresovima. Tako recimo golman ima na leima broj jedan a centarfor (najee) broj devet. To nikako ne oznaava da je centarfor za osam jedinica ili devet puta bolji igra od golmana, ve samo pokazuje pozicije ovih igraa u timu. Osnovna operacija koja se primijenjuje na podatke je klasifikacija, a statistiki postupci koji se mogu primijeniti na podatke sa nominalne skale su: prebrojavanje, utvrivanje koeficijenta kontigencije i koeficijenta (kao koeficijenata korelacije) i utvrditi koeficijent razdiobe. Ordinalni nivo Ordinalne skale omoguavaju meusobna poreenje pojedinanih vrijednosti svojstva koje je predmet mjerenja. To daje mogunost rangovanja dobijenih vrijednosti po nekom kriterijumu. Recimo da nastavnik na asu fizikog reda uenike po visini. Najvii uenik e biti na poetku reda a dalje sve nii do posljednjeg u nizu. U ovom sluaju nastavnik e bez problema moi da uporedi koji je uenik vii od drugog (ili drugih). Meutim ono to ne moe znati je stvarna visina bilo kog od uenika i kolika je razlika u visini izmeu pojedinih uenika. Znai u radu sa podacima dobijenim sa ordinalne skale ne raspolaemo je informacija o koliini mjerenog svojstva u pojedinanim sluajevima, kao ni vrijednosti razlike izmeu pojedinanih mjera. Operacija primjenjiva na ovom nivou mjerenja je rangovanje (odreivanje redosljeda na osnovu poreenja sluajeva prema vrijednosti svojstva), a od statistikih postupaka se koriste percentili, rang-korelacija i kao mjera centralne tendencije medijana.
Intervalni nivo Podaci sa intervalnih skala nam govore neto o veliini svojstva koje je predmet mjerenja (npr. da je 4 vee od 3, ali manje od 5). Takoe nam govore o tome da je razlika izmedju brojanih vrijednosti jednaka (npr. da je razmak izmeu 17 i 18 jednak onome izmeu 108 i 109). To znai da skale ovog nivoa mjerenja imaju tano definisanu mjernu jedinicu na osnovu koje je mogue precizno utvrivanje razlika izmeu pojedinih mjera (izraeno preko broja mjernih jedinica). Ono to je osnovni nedostatak intervalnih skala je nedostatak prirodne (apsolutne nule). Nula je na ovim skalama arbitrarna, odnosno dogovorom odreena. Tako oznaavanje neke vrijednosti sa 0 ne znai odsustvo mjerenog svojstva. Npr, temperatura od 0 Celzijusovih stepeni ne znai nepostojanje temperature, ve njenu vrijednost na kojoj voda prelazi u led.
Najpoznati primjer primjene intervalnih skala u psihologiji imamo pri mjerenje koeficijenta inteligencije. Na ovom nivou mjerenja dozvojene su sve numerike operacije peracije i odgovarajui statistici izuzimajui razmatranje odnosa proporcija vrijednosti mjera toga to one ne predstavljaju apsolutnu vrijednost samih mjera. Nivo razmjere (racio) Racio skala (skala realnih brojeva) ima sve osobine intervalne skale, uz dodatak realne nule. Obino su to podaci kojima se opisuju fizike pojave: vrijeme, prostorne dimenzije, masa,... gdje nula kao broj oznaava nepostojanje svojstva koje je predmet mjerenja itd. Osnovna karakteristika skala razmjere je ta da je mjerna jedinica precizno odreena vrijednost svojstva koje se mjeri. Kao oznake za vrijednosti svojstava koja se mjere brojevi se na ovom nivou mjerenja upotrebljavaju u svom potpunom znaenju. To znai da pri razmatranju odnosa dvaju mjera koje potiu sa skale razmjere moemo rei koja je od mjera vea i za koliko jedinica. Unapreenje u odnosu na skale intervalnog nivoa se ogleda u mogunosti da se odnos dvije mjere moe izraziti kolinikom (prema tome je skala razmjere i dobila ime). Svi statistiki postupci su primjenjivi na ovom nivou mjerenja jer izmeu koritenih brojeva i svojstava koje oni oznaavaju postoji potpuna saglasnost Mjerenja u psihologiji ne dostiu ovaj nivo. Mnogi autori metodolokih i statistikih udbenika i prirunika (Dragievi, Bukvi, 1986, Baker, 1994, Mason at al, 1997, Levin & Fox, 1997 Halmi, 1999,) navode ova etiri nivoa mjerenja, to uglavnom zadovoljava akademske potrebe studenata. Meutim pored njih postoje i drugi nivoi mjerenja. Tako Fajgelj (2003) pored navedenih kao nivoe mjerenja predstavlja: Log-intervalni nivo Mjerenje na ovom nivou se zasniva na dodjeljivanju brojeva objektima tako da se razlomci izmeu vrijednosti svojstva odraavaju preko razlomaka brojeva. Primjer ovog nivo mjerenja potronja goriva izraena u broju litara po preenim kilometrima. Aditivni nivo Pridruivanje brojeva osobinama koje su predmet mjerenja se na aditivnom nivou mjerenja ostvaruje tako da svojstva brojeva odraavaju istovrsna svojstva atributa, izuzimajui nultu taku. Takav nivo mjerenja imamo kod pitanja koliko dugo radite ili koliko imate prijatelja. Na osnovu primjera se moe zakljuiti da se ovakvim mjerenjem dobijaju odreene vrijednosti atributa koje su razliite od nule. Apsolutni nivo Dodjeljivanje brojeva pojedinanim sluajevima se vre tako da svojstva brojeva odraavaju istovrsna svojstva atributa. Za razliku od prethodnog nivoa mjerenja ovdje je postoji mogunosti pridruivanja nulte take. Prednost u odnosu na nivo razmjereje u tome da skale ovog nivoa imaju prirodnu mjernu jedinicu, a to je jedan prebrojani element. Primjeri mjerenja na ovom nivou su: broj zapamenih besmislenih slogova, broj studenata II godine psihologije koji su dali uslov u junu.
Neki osnovni pojmovi istraivanja u psihologiji

Varijabla
U psihologiji varijablu esto definiemo kao psiholoko svojstvo koje je predmet mjerenja. Sam termin je preuzet iz statistike i puni naziv je sluajna varijabla. Pod sluajnom varijablom se podrazumijeva pravilo ili funkcija koja svakom ishodu u uzorku pridruuje jednu vrijednost (Fajgelj, 2003). U tom smislu varijablu preciznije moemo definisati kao rezultat mjerenja nekog psiholokog svojstva na uzorku ispitanika svojstvo objekta, osobe, pojave, stanja, procesa, dogaaja i dr. koje moe uzeti ma koju vrijednost iz odreenog skupa vrijednosti (Risti, 1983). Pored ovog termina kao sininom se koristi termin promjenjiva. Nerijetko se kao sinonim za varijablu se koristi i termin varijat, meutim ovaj termin se prije odnosi na odreenu vrijednost bilo koje varijable. Mjerenje jedne varijable pretpostavlja poznavanje karakteristika varijable, oblika i uslova ispoljavanja. Drugim rijeima prije istraivanja nuno je precizno definisati varijable koje namjeravamo mjeriti. Sam metod definisanja varijabli moe da bude razliit. Neke od metoda definisanja navodi Bukvi (1988): 1. 2. 3. 4. Metod sinonima Kod primjene ovog metoda definisanja odreen termin se tumai na osnovu ekvivalentnog izraza koji bi trebao biti najrazumljiviji datoj sredini. esto se primjenjuje u psihologiji. Genetiki metod U ovom sluaju aspekti svojstva na koje se ukazuje su njeno porijeklo, nastanak i razvoj. Sintetiki metod Definisanje svojstva prema ovom metodu obuhvata ukazivanje na permanentne i nune odnose definisanog svojstva sa nekim grugim svojstvom. Operacionalno definisanje Najeksploatisaniji metod definisanja varijabli u empirijskoj psihologiji. Operacionalnim definicaijama se upuuje na vidljive strane varijabli, navodei pri tome kako se one opaaju, izazivaju i mjere.
Precizne definicije, bez obzira na primijenjenu metodu, omoguavaju preglednost u polju naunih saznanja. Nepridravanjem pravila definisanja pojmova, proizvoljnim davanjem naziva pojavama, davanjem novih imena odve poznatom, dolazi do stvaranja konfuzije u nauci. Prevelik broj pojmova se meusobno preplie ili sukobljava, uz nemogunost njihovih poreenja, provjera i mjerenja. Iz tog razloga u psihologiji je najzastupljenije operacionalno definisanje, koje preko vidljivih strana varijabli omoguava njihovo precizno odreivanje. Insistiranje na preciznom odreenju pojmova dovelo je do uvoenja pojma hipotetiki kinstrukt. On predstavlja nepotpun nauni pojam. Pojavu objanjava na osnovu provjerenih i dokazanih injenica, ali i neprovjerenih pretpostavki. Oznaavanjem neke pojave hipotetikim konstruktom mi je, u stvari, objanjavamo na osnovu neega za ta ne znamo da li stvarno njeno svojstvo. Time ukazujemo da se radi o neem nepotpunom i neprovjerenom to ne treba uzimati zdravo za gotovo. vrste varijabli
Indikator Indikator je znak u ispoljavanju varijable na osnovu ijeg prisustva, kao i stepena njegovog prisustva, zakljuujemo o postojanju odreene varijable. Sinonimi koji se koriste su pokazatelj i znak varijable. vrste indikatora i njihove karakteristike
SPSS za psihologe i pedagoge Ajtem (stavka, estica) Jedna tvrdnja ili pitanje u testu. ???????????????????vrste ajtema?????????????????????? razlike indikator - ajtem od varijable do ajtema
O vrstama statistikih analiza esto treba da rezimiramo velike koliine podataka da bismo imali nekakav uvid u njihovu prirodu, ili, pak, da donosimo zakljuke u vezi sa dobijenim podacima. Da bi ovo rezimiranje i zakljuivanje ouvalo sutinu originalnih pojava (to je i smisao statistike) moramo se potruditi da izaberemo odgovarajue statistike postupke koji e nam najbolje posluiti. Razlikujemo dvije grupe statistikih operacija: 1. Deskriptivna statistika obuhvata procedure kojima opisujemo podatke. To su mjere poput frekvencija, procenata, prosjeka, odstupanja, zakrivljenja itd. Pri izboru ovih mjera treba voditi rauna o tipu podataka kojim raspolaemo (npr. ne moemo raunati prosjek iz varijable pol). 2. Statistika zakljuivanja obuhvata procedure kojimja izvlaimo odreene zakljuke iz naih podataka. U okviru ovih procedura testiramo odreene hipoteze koje smo postavili. To mogu biti hipoteze o povezanosti nekih pojava ili razlikama u izraenosti nekih pojava, a statistika operacija e nas dovesti do nekog pokazatelja koji e nam rei da li se naa hipoteza pokazala ispravnom ili ne. Ovaj pokazatelj (rezultat statistikog testa) e nam to rei sa nekim stepenom statistike vjerovatnoe uobiajeno su to nivoi 0.05 i 0.01. Za vjerovatnoe manje od od ovih vrijednosti kaemo: statistiki znaajno na nivou 0.05 ili 0.01 (to znai da su vjerovatnoe da pogrijeimo kad tvrdimo da postoje statistike znaajnosti 5% ili 1%). U okviru procedura statistike zakljuivanja, takoe, imamo dvije vrste statistikih testova. Parametrijski testovi se rade nad podacima koji zadovoljavaju sljedee kriterijume: 1. da podaci budu sa intervalne ili racio skale i 2. da podaci budu normalno raspodijeljeni. Neparametrijski testovi se rade na podacima koji ne mogu da zadovolje ove kriterijume. Parametrijski testovi imaju veu snagu (precizniji su) u odnosu na neparametrijske, i treba im dati prednost ukoliko nam podaci dozvoljavaju.
Nivoi znaajnosti pri statistikom zakljuivanju i tipovi statistikih greaka Svaki put kad radimo statistike testove, mi u stvari testiramo istraivake hipoteze. Uopteno, moemo razlikovati dvije vrste hipoteza: nulta hipoteza (oznaava se sa H0) sadri tvrdnju o nepostojanju statistike znaajnosti pojave naene na uzorku, dok afirmativnih hipoteza moe biti vie (oznaavaju se sa Hn, gdje je n = redni broj hipoteze) i one govore o nekakvim potvrdnim pretpostavkama koje donosimo.
Prilikom primjene statistikih testova, obino se koristimo terminom "nivo znaajnosti" kad govorimo o nekim granicama statistike znaajnosti. Pri tom se uglavnom koristimo nivoima znaajnosti p=0.05 (ili 5% nivo) i p=0.01 (1% nivo znaajnosti). Ti nivoi znaajnosti se interpretiraju kao: "...postoji 5% vjerovatnoe da pogrijeimo kad tvrdimo da ... ", odnosno "...to tvrdimo sa 95% sigurnosti... " Isto vai i za nivo znaajnosti p=0.01. Nivo znaajnosti od p=0.01 je stroiji od nivoa p=0.05, jer podrazumijeva veu sigurnost kod odreenih tvrdnji. Treba rei da su ova dva nivoa znaajnosti sasvim arbitrarno prihvaena, i da nas nita ne spreava da se sluimo blaim kriterijumima (npr. p=0.10), ili stroijim (npr. p=0.001), pri donoenju statistikih zakljuaka. Ove granice su ustanovljene da bi se ujednaili kriterijumi prilikom donoenja odluka, a takoe i da bi se istraivaima olakalo donoenje statistikih odluka. U stvarnosti, nivo znaajnosti postavljamo u zavisnosti od toga kakva je priroda pojave koju ispitujemo i znaajnosti zakljuka koji donosimo. Kad, na primjer, istraivai ispituju lijek koji se primjenjuje na dotad neizljeivim bolesnicima, oni se odluuju za blae kriterijume znaajnosti, jer u takvim situacijama ak i 50% vjerovatnoe dejstva takvog lijeka govori o vjerovatnoi da se spasi 50% ljudskih ivota koji su bili suoeni sa izvjesnom skorom smrti. S druge strane, kad se ispituju lijekovi koji imaju potencijalno opasne pratee pojave, kriterijumi sigurnosti se moraju poveati na najvii nivo, jer u sluaju pogreke u zakljuivanju mogu dovesti do fatalnih posljedica. U skladu sa prethodnom priom o nivoima znaajnosti, govori se o dva tipa greaka pri generalizaciji statistikih zakljuaka sa uzorka na populaciju. Greka tipa I, koja se naziva i "greka alfa tipa", nastaje kad donosimo zakljuak o statistikoj znaajnosti pojave (npr.o postojanju znaajne razlike izmeu pojava, ili znaajne korelacije), a ona u stvari ne postoji. Greka tipa II (greka beta tipa), nastaje u obrnutom sluaju, kad odbacujemo tvrdnju o znaajnosti pojave a ona u stvari postoji. ematski prikazano, tipovi greaka izgledaju ovako: Donesena odluka
Prihvaena afirmativna hipoteza Prihvaena nulta hipoteza
Stanje u populaciji
Nulta hipoteza ispravna Greka tipa I (alfa) Ispravna odluka Afirmativna hipoteza ispravna Ispravna odluka Greka tipa II (beta)
Svaki put kad donosimo odluku na osnovu nekog od postavljenih kriterijuma znaajnosti, souavamo se sa mogunou da nainimo neku od navedenih greaka, ali to je rizik koji prihvatamo u statistici.
SPSS programski paket Programski paket SPSS ini vie zasebnih modula (dijelova programa). U zavisnosti od toga koje statistike procedure su nam potrebne, odrediemo i koje module emo moi priutiti, budui da se svaki modul zasebno kupuje. Mi emo se ovdje dotai upotrebe svakog od modula programskog paketa SPSS 11.5, a sve navedeno o emu budemo govorili moe se upotrijebiti za sve verzije programa,
10
poevi od verzije 8 pa navie, budui da se proceduralno vrlo malo razlikuju (vie su u pitanju "kozmetike" izmjene). U SPSS-u svaku proceduru moemo obaviti na dva naina: pomou biranja opcija putem menija, ili runo koritenjem posebnog programskog jezika u okviru procedure koja se zove Syntax. Syntax omoguava mnogo veu fleksibilnost od koritenja ve ponuenih opcija, omoguava i programiranje novih statistikih procedura koje nisu predviene u osnovnom paketu SPSS-a, pogotovo kad su u pitanju napredne statistike procedure1, ali s druge strane, u velikoj mjeri je obiman i komplikovan da to prevazilazi okvire naih zanimanja i zahtijeva zaseban udbenik. Mi emo se, u naim objanjenjima, zadrati na predvienim funkcijama, i to e nam biti vie nego dovoljno. Podeavanja svih opcija programa, do najsitnijih detalja, mogu se obaviti kroz meni Edit/Options.
Tako na primjer, u SPSS-u nije predviena mogunost da se radi statistika procedura kanonika korelaciona analiza ve je ponuena samo u obliku potprograma koji moemo nai u SPSS-ovom direktorijumu pod nazivom Canonical correlation.sps. Tim rjeenjem nisu bili zadovoljni dvojica autora iz Beograda (psiholozi G.Kneevi i K.Momirovi), te su napravili sopstvenu verziju potprograma uz pomo kojeg se ta procedura moe obaviti. Slino tome, praktino je mogue programiranjem u Syntaxu napraviti drugaije verzije gotovo svih statistikih operacija predvienih u SPSS-u.
10
11
Rad sa programom
U radu sa SPSS-om postoje tri glavna podruja: unoenje podataka, analiza podataka, i pregled dobijenih rezultata. Nakon startovanja programa SPSS saekae vas uvodni ekran koji moete vidjeti na slici. To je takozvani Data Editor, tj matrica za unoenje i manipulaciju podacima. Uoimo da u donjem lijevom uglu postoje dva jezika: jedan na kome pie Data View (pregled podataka), i drugi, na kojem pie Variable View (pregled varijabli). Za poetak, uoimo da je izgled programa karakteristian za sve Windows programe: u gornjem dijelu ekrana postoji niz menija - od File do Help, ispod njega Toolbar (traka sa alatkama) - dugmad sa skraenicama za naredbe koje moemo izvriti i uz pomo gornjih menija, a donji dio je rezervisan za unoenje podataka.
11
12
Priprema podataka za unoenje i obradu Kodiranje

Da bismo preli na unoenje podataka, prvo moramo da kodiramo instrument koji smo koristili (upitnik, test itd.). Kodiranje vrimo tako to svakom od ponudjenih odgovora dodijelimo neku brojanu vrijednost. Ako imamo pitanja otvorenog tipa, onda je poeljno da pregledamo sve odgovore i kategoriemo ih u nekoliko kategorija koje emo, takodje, oznaiti brojanim oznakama. Ako radimo sa skalama procjene, onda kodiramo tako da odgovoru koji izraava najvei stepen dajemo najvei broj (moe i obrnuto, program ne pravi pitanja, ali e nam biti neloginije u pregledu obradjenih podataka). Korisno je i numerisati sve upitnike koje smo upotrebljavali, ukoliko se ispitanici nisu potpisivali, da bi kasnije mogli lake da vrimo ispravke ako pogrijeimo pri unoenju podataka.
Specifinosti kompjuterske obrade

Kompjuterska obrada ima neke specifinosti koje je potrebno potovati. Iako u projektovanju naeg instrumenta pitanja nazivamo ajtemima, a grupe ajtema varijablama, kompjuterski program tretira svaku unijetu kolonu u matricu podataka kao varijablu. Znai, svako pitanje emo oznaiti nekim imenom i to emo nazivati varijablom. Ukoliko radimo sa nekom skalom procjene koja ima vie tvrdnji sa kojima ispitanik pokazuje slaganje ili neslaganje, moemo odmah sabrati brojane oznake i te zbirne podatke za itavu skalu unositi u samo jednu varijablu koja nam govori o izraenosti nekog stava. Ili ako imamo test znanja moemo odmah sabrati tane odgovore i onda sve te podatke staviti u samo jednu varijablu - varijablu zbira tanih odgovora. Ovakvi postupci su mogui, ali se ne preporuuju, budui da time u daljoj obradi gubimo podatke o tome kako su ispitanici odgovarali na pojedinane odgovore. tavie, uz pomo kompjutera moemo ta raunanja i transformacije obaviti kasnije i bez gubitaka podataka, tako da imamo i pojedinane i zbirne podatke. Kodni plan moemo napraviti tako to emo uzeti jedan nepopunjen primjerak upitnika koji smo koristili, i na njemu oznaiti sve varijable (naziv varijable moe imati samo 8 slova odnosno brojeva) i sve mogue kodne vrijednosti varijabli. Taj papir treba da nam je u blizini, tako da imamo brzi uvid u kodni proces dok ga ne zapamtimo.
12
13
Definisanje varijabli
Kada otvorimo program SPSS nai emo se pred praznom tabelom podataka. Vidjeemo da svaki red poinje sa brojevima, a svaka kolona oznakom "var". SPSS podrazumijeva da svaki red sadri podatke o pojedinom ispitaniku (sluaju), a u kolonama se nalaze vrijednosti varijabli. Za poetak emo definisati sve varijable koje imamo. To radimo tako to odaberemo Variable View jeziak u donjem lijevom uglu glavnog prozora za unos podataka. Izgled ekrana e se promijeniti i dobiemo sljedei prozor:
Za razliku od matrice za unoenje podataka, ovdje (u matrici varijabli) redovi oznaavaju varijable (u matrici podataka redovi su sluajevi), a kolone opisuju karakteristike varijabli. Jednostavno treba kliknuti na praznu eliju koju elimo da definiemo i odredimo eljene osobine. U koloni gdje pie Name upisujemo ime varijable. Ime moe sadravati slova i brojeve, i neke znakove interpunkcije (razmak se ne moe upotrebiti) i ne smije biti due od 8 znakova. Kad zavrimo sa upisivanjem imena varijable, program e nam automatski upisati pretpostavljene osobine varijable u ostale kolone, ali mi bez problema moemo da ih izmijenimo. Sljedea osobinaje Type i tu moemo da biramo izmedju vie tipova podataka koje varijabla sadri: za nas najzanimljiviji i uglavnom emo taj oblik koristiti Numeric - brojani oblik. Ostali tipovi definiu neke posebne varijante matematikih, datumskih ili novanih podataka, dok nam String daje za pravo da piemo slovne sadraje. Opcije Width (cijeli brojevi) i Decimal Places (decimalna mjesta) definiu irinu kolone koju upotrebljavamo. Ako je varijabla kategorika, ili ako sadri samo cjelobrojne podatke, moemo u kuicu Decimal Places da upiemo 0.
13
14
Labels nam daje mogunost da upiemo dui opis varijable (mogu se upisati i itave reenice). Ovo je veoma korisna opcija kad imamo veliki broj varijabli kojima moramo smiljati kratka imene. Opis varijable e nam kasnije dati ideju o tome ta sadre vrijednosti nae varijable ukoliko zaboravimo. U kolonu Value definiemo kod (brojanu oznaku koju unosimo kao jednu od vrijednosti varijable). Value je brojana vrijednost koju emo unositi, a pod Value Label unosimo naziv te vrijednosti (npr. u potpunosti se slaem ako smo kodirali neku skalu procjene). Onda pritisnemo dugme Add, vrijednost i njen opis bivaju ubaene donji prozori i tako oslobadjamo prostor za definisanje nove vrijednosti na isti nain. Dugme Change omoguava da mijenjamo ve definisane vrijednosti i oznake, a dugme Remove da odstranimo neeljene vrijednosti i oznake. Opcija Missing nam otvara mogunosti da odredimo koje unijete vrijednosti nee biti uzimane u obzir pri obradi podataka. Znai, te vrijednosti emo vidjeti u tabeli podataka ali se nee obradjivati. Opcija Discrete Missing Values nam omoguava da unesemo pojedinane vrijednosti (3 kuice za 3 vrijednosti). Drugi nain je Range of missing values, koji nam omoguava da definiemo najniu (Low) i najviu (High) vrijednost raspona koji e se tretirati kao nevaljani podatak (odnosno, nee se tretirati u obradi). Range plus one discrete missing value predstavlja kombinaciju prve dve spomenute opcije. U kolonama Columns i Align odredjujemo irinu (u brojanim podacima) i poravnanje (lijevo, desno ili centralno) kolone za unos podataka - kako e biti prikazana na ekranu. Posljednja kolona ima naziv Measure i tu odreujemo nivo podataka koji unosimo: Scale (brojani podaci), Ordinal (ordinalni/rangovani podaci) i Nominal (nominalni/kategoriki podaci). Kad definiemo prvu varijablu, moemo kliknuti na Data View u donjem lijevom uglu ekrana, i time emo otii na matricu podataka. Sad emo vidjeti da ime nae nove varijable stoji u zaglavlju prve kolone matrice podataka. Svaku sljedeu varijablu moemo definisati na slian nain: treba da odemo na Variable View prikaz (dole lijevo odaberemo) i definiemo osobine varijabli kako je ve opisano. Ukoliko elimo da ubacimo varijablu izmedju dve ve definisane varijable, kliknemo (desnim dugmetom mia) na ime varijable ispred koje hoemo da ubacimo novu varijablu, i odabremo opciju Insert Variable. Dalji postupak definisanja se odvija kako je na prethodnim stranicama opisano.
14
15
Unoenje podataka
Podatke moemo unositi u okviru razliitih programa i na razliite naine. Uvoz u SPSS tih podataka opisan je na drugom mjestu, i ovdje emo opisati samo unoenje podataka u okviru programa SPSS. Podatke unosimo po redovima, odnosno po sluajevima, ispitanicima ili upitnicima. Poinjemo sa prvim ispitanikom i prvom varijablom, dakle prva prazna elija u gornjem lijevom uglu tabele (matrice) podataka. Inae, po tabeli se moemo slobodno kretati uz pomo kursorskih strelica, tasterom Tab (jedno polje u desno), tasterom Enter (na dole). Kad unesete prvu vrijednost, dovoljno je da pritisnete strelicu desno, ili Tab pa da se pomjerite na sljedeu eliju (sljedeu varijablu). Tako radite sve dok ne stignete do posljednje definisane varijable desno. Onda se vratite na poetak, uz pomo strelica ili mia, i predjete na novi red. Preporuka: redovno snimajte unijete podatke, jer u sluaju da nestane struje ili se kompjuter "zaglavi" - ponovo ete unositi izvjesnu koliinu podataka (onoliko koliko ste ih unijeli od prolog snimanja fajla). Unoenje podataka u Notepad-u Podatke moemo unositi i uz pomo drugih programa, da bismo ih naknadno uvezli u SPSS, i obraivali. Sve verzije Windows operativnih sistema imaju instaliran jednostavan program za kreiranje tekstualnih datoteka, koji se zove Notepad. Moemo ga pronai ukoliko idemo na Start/Programs/Accessories meni Windows-a. Izgled Notepad-a po otvaranju:
Prednost Notepad-a jeste njegova jednostavnost i rasprostranjenost moe se nai na svakom kompjuteru sa instaliranim Windows-ima.
15
16
Podatke u Notepad unosimo jednostavno kao redove brojeva. Svaki red predstavlja jedan upitnik, a svaka kolona (ili vie kolona) moe da predstavlja varijablu. Ukoliko varijabla sadri dvocifrene brojeve, onda ih treba pissti u formatu: 00, 01, 02 itd., a ukoliko ima trocifrene, onda: 001, 002, 003 itd. Time osiguravamo fiksnu irinu kolona, to nam olakava neke stvari. Izmeu grupa varijabli koje unosimo zgodno je da stavimo jednu praznu kolonu, tako da imamo jednostavan vizuelni uvid u tanost koliine unesenih podataka: ukoliko na kraju unoenja jedne grupe varijabli vidimo da imamo brojku vie ili manje od predvienih moemo odmah izvriti provjeru podataka. Pri unoenju, tabela podataka moe izgledati otprilike ovako:
gdje imamo unesene podatke o ocjenama deset uenika neke kole na prvom i drugom tromjeseju. U prvoj i drugoj koloni nam se nalazi redni broj uenika, sljedeih devet kolona su nam devet ocjena na prvom, a narednih devet su ocjene na drugom tromjeseju. Podatke snimimo kao obinu tekstualnu datoteku. Sljedei korak nam je uvoz ovako kreirane baze podataka u SPSS. Novije verzije SPSS-a imaju jednostavan postupak za uvoz ovakvih podataka. Nakon to otvorimo SPSS, idemo na meni File/Open/Data, i dolazimo do prozora za odabir datoteke:
16
17
Pod Look in: odaberemo direktorijum gdje smo snimili datoteku, a pod Files of type: odaberemo tip datote u naem sluaju to je Text (*.txt) tip. Selektujemo datoteku i kliknemo na Open i otvara nam se procedura koja nas kroz est koraka vodi kroz uvoz podataka:
Tu moemo ostaviti sve kako jeste, potvrdimo sa Next, i dolazimo do sljedeeg koraka:
17
18
U drugom koraku treba da selektujemo kuicu Fixed width, jer smo unosili podatke tako da broj kolona bide fiksan. Poto nismo jo definisali imena varijabli, odgovor na pitanje Are variable names included at the top of your file? e biti No. Potvrdimo sa Next, i dolazimo do treeg koraka:
Poto smo podatke unosili poevi sa prvim redom, u prvoj kuici ostaje upisano 1. Takoe, rekli smo da svaki red predstavlja jedan upitnik (odnosno jednog ispitanika), te i u drugoj kuici ostaje upisano 1. Kroz tree pitanje treba da odredimo koliko podataka uvozimo, i tu treba da ostane selektovano All of the cases, jer mi uvozimo sve podatke. Kliknemo na Next, i idemo na etvrti korak:
18
19
Ovde treba da definiemo koje kolone e predstavljati varijable, a to emo uiniti tako to kliknemo na prostor izmeu dvije kolone brojeva i pojavie se crna linija na tom mjestu. Na slici moemo vidjeti kako smo mi to uinili. Kad definiemo sve linije koje dijele varijable, potvrdimo sa Next i idemo na peti korak:
U petom koraku imamo jednostavan u to kako e izgledati podaci u SPSS-u. Ukoliko smo neto pogrijeili, ili nam se ne svia, jednostavno se vratimo na prethodni korak sa Back. Ako smo zadovoljni ishodom potvrdimo sa Next, i idemo na poslednji korak:
19
20
esti korak je formalan, i treba da sve ostavimo kako jeste, i potvrdimo sa Finish. Po zavretku imamo podatke u SPSS-u:
Budui da vidimo kako imena varijabli nisu definisana, ve samo piu oznake v1 do v19, moemo otii na Variable View, i definisati imena varijabli i tipove podataka kako je to ve ranije opisano:
20
21
Kad zavrimo definisanje ovako uvezene baze podataka, ostalo je jo da snimimo sve to pod nekim imenom kao SPSS-ov fajl (tip *.sav), i imamo gotovu bazu podataka u SPSS-u.
21
SPSS za psihologe i pedagoge Unoenje podataka u Microsoft Excel-u
22
Microsoft Excel je jo jedan program koji je iroko zastupljen, i u naim uslovima se nalazi instaliran na skoro svim kompjuterima u okviru paketa Microsoft Office. Zbog toga emo opisati postupak unoenja podataka i pomou ovog programa. Excel je sposoban i za brojne matematike i statistike procedure, ali time se neemo baviti na ovom mjestu. Nakon to otvorimo Excel, nai emo se pred velikom praznom tabelom kod koje brojevi oznaavaju redove, a slova kolone:
Sve podatke moemo upisivati u tabelu poevi sa prvom elijom tabele koja je oznaena sa podebljanim kvadratom (A1). Ako za primjer uzmemo isti sluaj upisivanja ocjena kod uenika na prvom i drugom tromjeseju, odluiemo da odmah definiemo i imena naih varijabli tako da prvi red kolone nosi ime varijable. Prva kolona (A) e nam biti varijabla sa rednim brojem ispitanika. Druga kolona (B) e biti varijabla u kojoj e se nalaziti ocjena iz prvog predmeta na prvom polugoditu (nazvaemo je oc1t1), i tako dalje.
22
SPSS za psihologe i pedagoge Kad zavrimo sa unoenjem podataka, tabela e izgledati ovako:
23
Podatke, naravno, snimimo (moemo mu dati ime ocjene.xls). Sljedei korak je da te podatke uvezemo u SPSS. U SPSS-u idemo na meni File/Open/Data, i dolazimo do sljedeeg dijalog prozora:
Pod opcijom Files of type odaberemo Excel tip fajlova, kliknemo na fajl ocjene, i potvrdimo sa Open. Dolazimo do sljedeeg dijalog prozora:
23
24
Ovdje sve treba da ostavimo kako jeste, a to znai da program iitava imena varijabli iz prvog reda, a automatski prepoznaje i koliinu unesenih podataka. Potvrdimo sa OK, i imamo podatke unesene u SPSS:
Ostaje jo da snimimo podatke pod odgovarajuim imenom, i moemo da radimo sa podacima kao i sa drugim podacima unesenim u okviru SPSS-a.
24
25
Snimanje podataka
U SPSS-u imamo vie vrsta snimanja i izvoza podataka i rezultata naih statistikih obrada. Sve te operacije obavljamo u glavnom meniju File. Save - snimanje podataka. Koristimo ako smo ve ranije dali ime fajlu. Ukoliko nismo ranije odredili ime i tip fajla, koristiemo Save As... - snimanje novih podataka sa odredjivanjem imena i tipa fajla. Kad izaberemo ovu opciju dobiemo prozor gotovo identian onom sa Open opcijom: pod "Save in" odrediemo direktorijum u koji snimamo, pod "File Name" upisaemo naziv fajla, a pod "Files of type" odrediemo tip fajla. Za kraj pritisnemo dugme "Save". Export - snimanje tabela, grafikona i rezultata obrade u drugim formatima, tako da ih moemo otvoriti u drugim programima. Ovu opciju imamo na raspolaganju kad je aktivan prozor Output. Pod opcijom "Export" biramo ta e sve biti u eksportovanom fajlu: Output Document - sve se eksportuje Output Document (No Charts) - sve sem grafikona se eksportuje Charts Only - samo grafikoni se eksportuju Pod "File Name" odredjujemo ime fajla i putanju do direktorijuma gdje e biti snimljen. Pod "Export What" moemo izabrati "All Objects" ukoliko elimo da se sve eksportuje u fajl, "All Visible Objects" ako elimo da eksportujemo samo vidljive sadraje, i "Selected Objects" ako elimo da eksportujemo samo selektovane objekte. Pod "File Type" biramo tip fajla pod kojim e se snimiti naa datoteka: htm - HTML fajl, itljiv u internet itaima, ali i u veini novih programa za obradu teksta (Word 97 i noviji) txt - tekstualni fajl, itljiv u veini programa i na veini kompjutera, ali sadri samo tekst - bez grafikona
Otvaranje datoteka
Pod otvaranjem datoteka u SPSS-u podrazumijeva se svako otvaranje ili uvoz baza podataka koji su kreirani bilo u okviru samog SPSS-a, ili nekog drugog programa (Excel, Access, Statistica itd). Takoe, moemo otvarati i rezultate ranije napravljenih ispisa ili komandnih procedura. Open - koristimo za otvaranje ranije snimljenih fajlova (baza podataka, ispisa rezultata, komandnih programa). Kad izaberemo ovu opciju dobijamo sljedei prozor: Tamo gdje pie "Look in" odredjujemo direktorijum u kome se nalaze nai fajlovi. Opcija "Files of type" je veoma bitna: SPSS e nam prikazati samo fajlove one vrste koja je definisana u okviru "Files of type", a druge nee. to
25
26
znai da ako elimo da otvorimo (ili vidimo) fajlove drugog tipa, moraemo da promijenimo tip fajlova. Tipovi fajlova (neki): sav - standardni SPSS sirovi podaci spo - ispisi rezultata obrade sps - komandni program sbs - skript xls - Excel datoteka por - prenosivi (medju razliitim programima) tip sa sirovim podacima all files - vidjeemo sve tipove fajlova koje Windows poznaju Na kraju izaberemo odredjeni fajl i pritisnemo dugme "Open". Read ASCII Data - otvaranje fajlova sa sirovim podacima koji su snimljeni u tekstualnom obliku. Imamo dvije podopcije: Freefield - varijable se idu po istom redoslijedu za svaki red, ali se ne nalaze nuno uvijek u istim kolonama za svaki red (ili su odvojene nekim znakovima, kao to su taka ili zarez) Fixed Columns - ita tekstualne datoteke kod kojih su kolone fiksne varijable se nalaze na istom mjestu (u istoj koloni) za svaki red
26
27
Manipulisanje podacima Spajanje datoteka

Ako elimo da spojimo vie datoteka, obaviemo to po menijem Data/Merge Files. Tu imamo mogunosti da dodajemo nove ispitanike (Add Cases) ili da dodajemo nove varijable (Add Variables) ve otvorenoj datoteci. Ovo je korisno kad se podaci unose na vie razliitih mjesta, pa na kraju mogu da se spoje svi u jednu veliku datoteku, za finalnu analizu podataka. Dodavanje novih ispitanika (sluajeva): Ako smo elimo da spojimo fajlove koji sadre iste varijable, ali dodatne ispitanike, izabraemo opciju Add Cases, i dobiemo prvi dijalog prozor koji nam omoguava da izaberemo datoteku u kojoj se nalaze novi ispitanici. Dakle, treba da izaberemo eljeni fajl i pritisnemo Open.
Ukoliko nova datoteka sadri sve iste varijable kao i stara, u prozoru s lijeve strane (Unpaired Variables) se nee nalaziti ni jedna varijabla. U prozoru s desne strane se nalaze imena varijabli u novokreiranoj datoteci. Ukoliko ne elimo da zadrimo neke varijable u novom fajlu, dovoljno je da ih selektujemo u prozoru Variables in New Data File i izbacimo (pritisnemo strelicu koja pokazuje lijevo).
Dodavanje novih varijabli:
27
28
Ako smo elimo da spojimo fajlove koji sadre iste ispitanike, ali dodatne varijable, izabraemo opciju Add Variables, i dobiemo prvi dijalog prozor koji nam omoguava da izaberemo datoteku u kojoj se nalaze novi ispitanici. Izaberemo eljeni fajl i pritisnemo Open.
U okviru s lijeve strane (Excluded Variables) nalaze se imena varijabli koje nee biti ubaene u novu datoteku - sve varijable koje se ve nalaze u staroj datoteci. Sa (+) su oznaene sve varijable iz datoteke koju dodajemo, a sa (*) sve varijable u datoteci kojoj dodajemo. U prozoru s desne strane (New Working Data File) vidimo koje e sve varijable biti ukljuene u novu datoteku. U naem sluaju dodajemo samo jednu varijablu koja se ne nalazi u staroj datoteci - "novavar".
28
SPSS za psihologe i pedagoge Spajanje podataka tako da grupe ispitanika ine jedan zbirni sluaj Ovu proceduru moemo obaviti pod opcijom Data/Aggregate.
29
U prozori sa natpisom Break Variable(s) upisujemo varijablu na osnovu ijih vrijednosti se saimaju podaci iz varijabli koje upiemo u prozori Aggregate Variable(s). Znai, za sve ispitanike koji imaju zajedniku vrijednost na Break Variable program rauna neku zbirnu funkciju (na primjer aritmetiku sredinu) na Aggregate Variable. Pod dugmetom Name&Label odredjujemo imena novih varijabli, a pod Function odredjujemo funkciju saimanja podataka. Ime novog fajla odredjujemo ako je ukljuena opcija Create new data file, u suprotnom - otvara se nova radna matrica (tabela) podataka.
Najjednostavniji primjer za ovu proceduru je kad elimo da izraunamo prosjean skor na nekoj varijabli za mukarce i ene. Onda nam je pol Break, a varijabla iji prosjek elimo je Aggregate, i pod Function izaberemo Mean.
29
30
Grupisanje i selekcija podataka

Grupisanje podataka Data/Split File opcija grupie ispitanike po vrijednostima varijable koju odredimo (Groups Based on). Ako izaberemo vie varijabli, prva na spisku e biti primarna, i u okviru njenih kategorija e biti izvrena grupisanja za drugu varijablu. Kad je ukljuena opcija Split File, sav ispis e biti organizovan po ovim kategorijama. Opcija Compare groups znai da e ispis biti zajedniki, tj. grupe e se nalaziti u istoj tabeli radi medjusobnih poredjenja. Opcija Organize output by groups dovodi do zasebnog ispisa za svaku kategoriju varijable koja grupie.
30
SPSS za psihologe i pedagoge Selekcija podataka
31
Data/Select Cases selektuje ispitanike prema vrijednostima neke varijable, oni koji nisu selektovani izbaeni su iz dalje analize ili su potpuno izbrisani iz datoteke. U dnu prozora, pod "Unselected Cases Are" biramo da li e neselektovani ispitanici biti samo filtrirani (Filtered), tj nee se uzimati u obzir pri statistikim operacijama, ili e biti trajno izbrisani iz datoteke (Deleted). Ukoliko je ukljuena opcija "All cases" znai da su selektovani svi ispitanici.
Kad ukljuimo opciju If condition is satisfied i pritisnemo dugme If... dobijamo mogunosti da odredimo uslove selekcije. U gornji prozori upisujemo uslov: u naem sluaju uslov je da ispitanici imaju vrijednost 1 na varijabli "pol", to znai da e u dalju obradu biti ukljuene samo ene (u naem sluaju je tako kodirano da ene imaju oznaku 1, a mukarci 2). Ukoliko elimo viestruke uslove, npr. elimo da u dalju obradu ukljuimo ene koje pohadjaju odredjenu kolu, izmedju dve jednakosti (pol=1 i skola=2) stavimo logiko I (znak "&"). Znak "|" je logiko ILI. U podopcijama imamo jo mnogo matematikih funkcija koje neemo nabrajati. Naravno treba da potvrdimo sa Continue na ovom, i OK na prethodnom prozoru.
31
SPSS za psihologe i pedagoge Moemo da selektujemo ispitanike na bazi sluajnog izbora, ako ukljuimo opciju Random sample of cases, i u okviru toga podesimo eljeni procenat ili broj ispitanika koji nam treba.
32
Na osnovu ranga (odnosno redoslijeda u datoteci) ih selektujemo pod Based on time or case range, gdje podesimo prvi i posljednji redni broj koji elimo da selektujemo.
Use filter variable iz dalje obrade izbacuje ispitanike koji na datoj varijabli imaju vrijednost 0 ili im nedostaje podatak.
Data/Weight Cases - ponderisanje (opereivanje) ispitanika. Simulira se replikacija ispitivanja, i to u zavisnosti od vrijednosti izabrane varijable. Vrijednosti ponder varijable govore o navodnom broju opservacija. Iz dalje obrade se izbacuju ispitanici koji imaju 0, negativnu vrijednost ili nedostajui podatak.
32
33
33
34
Transformacija podataka
Izraunavanja Transform/Compute opcija nam omoguava da kreiramo novu varijablu razliitim oblicima izraunavanja na osnovu vrijednosti ve postojeih varijabli. Na mjesto gdje pie Target Variable upisujemo ime nove varijable koju kreiramo. Tamo gdje stoji Numeric Expression upisujemo formulu na osnovu koje raunamo vrijednosti nove varijable. Opet imamo na raspolaganju sve raunske operacije, kao i mnogo matematikih i statistikih funkcija. U naem primjeru (na slici gore) kreiramo novu varijablu zbirsekc ije vrijednosti se dobijaju sabiranjem vrijednosti varijabli sekc1, sekc2 i sekc3. Takodje, imamo i dugme If... kojim dolazimo do mogunosti postavljanja uslova za raunanje vrijednosti varijable (detaljnije pod Data/Select Cases).
34
SPSS za psihologe i pedagoge Prebrojavanja Data/Count kreira varijablu u okviru koje se nalaze prebrojane iste vrijednosti koje se nalaze u okviru raznih varijabli. Npr. ukoliko imamo nekoliko varijabli koje govore o tome da li ispitanici gledaju ili ne gledaju neke TV stanice (npr. 1 znai da, a 0 ne), pa na kraju elimo da znamo koliko ispitanik ukupno gleda TV stanica, iskoristiemo Count. U okviru Target Variable upisujemo naziv nove zbirne varijable, a u Target Label detaljnije pojanjenje sadraja varijable. U okviru Numeric Variables ubacimo varijable koje elimo da prebrojavamo. Obavezno je da se u okviru opcije Define Values specifikuju vrijednosti ije prebrojavanje se eli (u prethodnom primjeru sa TV stanicama, tu emo specifikovati da elimo prebrojavanje pojavljivanja vrijednosti 1). Tu je i postavljanje uslova pod opcijom If...
35
Rekodiranje Rekodiranje radimo u ukviru menija Data/Recode. Ako izaberemo podopciju Into Same Variables mijenjamo vrijednosti u okviru varijable koju izaberemo. Pod Old and New Values definiemo kako vrimo to rekodiranje, tj. koje vrijednosti e, i kako, biti izmijenjene. A tu je i uslov If... S lijeve strane definiemo koje vrijednosti emo mijenjati. Moemo da unesemo pojedinane vrijenosti (Value), nedostajue podatke (Systemmissing, System-or user-missing), ili nizove vrijednosti (Range). S desne strane definiemo nove vrijednosti, i to tako to u prozoriu gdje pie Value upiemo novu vrijednost, i pritisnemo dugme Add. Za kraj, naravno, Continue. U gornjem primjeru moemo vidjeti da smo mi obrnuli vrijednosti nek varijable, tako da rekodiramo 1 u 5, 2 u 4 itd.
35
36
Ako izaberemo podopciju Into Different Variables rekodirane vrijednosti e biti zapisane pod novom varijablom koju kreiramo. Bitno je da izaberemo varijablu koju rekodiramo (pod Numeric Variable), pod Output Variable definiemo ime nove varijable (pod Label njeno pojanjenje), i pritisnemo dugme Change. Pod Old and New Values definiemo kako vrimo to rekodiranje, tj. koje vrijednosti e, i kako, biti izmijenjene. Prozor za to redefinisanje je gotovo identian kao i u sluaju opcije Into Same Variables.
Automatsko rekodiranje - Transform/Automatic Recode kreira novu varijablu i automatski rekodira sadraj neke string (slovne) ili brojane varijable u sekvencijalne vrijednosti. U prozor s desne strane ubacimo varijablu ije vrijednosti elimo da rekodiramo, a u prozori dole unesemo ime nove varijable, i pritisnemo dugme New Name. Moemo i da definiemo da li e kodiranje poeti od najnie (Lowest value) ili najvie vrijednosti. String varijable se kodiraju po abecednom redu.
36
37
Rangovanje podataka Opcija Transform/Rank Cases nam omoguava da kreiramo novu varijablu koja sadri rangovane vrijednosti izabrane varijable. Program sam odredjuje ime nove varijable, na osnovu imena izabrane varijable. Varijablu ije vrijednosti elimo da rangujemo ubacimo u okvir Variable(s). U okvir By moemo da ubacimo neku varijablu na osnovu koje e organizovati rangovanje izabrane varijable (rangovaemo sluajeve zasebno u okviru svake vrijednosti organizacione varijable). Moemo da definiemo rangove u uzlaznom ili silaznom rasporedu (Assign Rank 1 to). Pod Rank Types moemo izabrati viestruke metode rangovanja, a pod Ties metod dodjeljivanja rangova istovjetnim vrijednostima.
Kreiranje vremenskih serija Create Time Series - kreira novu varijablu transformacijom postojee varijable bazirane kao vremenski serijal (gdje svaka sljedea vrijednost u koloni predstavlja opservaciju u sljedeem ekvidistantnom vremenskom periodu).
37
SPSS za psihologe i pedagoge U okvir gdje pie New Variable(s) ubacimo vremensku varijablu koju elimo da transformiemo. Tamo gdje pie Name moemo da unesemo ime nove varijable, mada se automatski upisuje podrazumijevano ime - prvih est slova stare varijable plus brojana oznaka. Ispod natpisa Function moemo izabrati funkciju transformacije.
38
Tretiranje nedostajuih podataka Replace Missing Values - popunjava elije kod kojih postoji nedostajui podatak. U okvir New Variable(s) ubacimo varijablu kod koje elimo da eliminiemo prazne elije. Tamo gdje pie Name moemo da unesemo ime nove varijable, mada se automatski upisuje podrazumijevano ime - prvih est slova stare varijable plus brojana oznaka. Ispod natpisa Method moemo izabrati funkciju na osnovu koje se vri popunjavanje nedostajuih podataka.
38
39
39
40
Deskriptivne statistike mjere

Deskriptivne statistike mjere, kao to smo to ve rekli u uvodu, predstavljaju osnovne mjere kojima na osnovu dobijenih podataka opisujemo na uzorak. To mogu biti najjednostavnija prebrojavanja, tako da postignua ispitanika sumarno prikaemo u obliku broja sluajeva u okviru pojedinih kategorija (razreda distribuiranih rezultata), procentualni prikazi, ili razliite mjere centralne tendencije i mjere idsperzije (rasprenja, odstupanja rezultata). Frekvencije i procenti Prostim frekvencijskim prikazom se predstavlja frekvencija (broj) ispitanika koji su postigli odreeni rezultat na nekom mjernom instrumentu koji smo zadali (test, upitnik, anketa, opservacija itd.). Time dobijamo najbri uvid u raspodjelu skorova ispitanika koje oni postiu pri datom mjerenju. Meutim kada se radi o mjernim instrumentima koji imaju veliki raspon moguih rezultata (npr. test informisanosti koji se sastoji od 85 ajtema i gdje konaan rezultat moe da se kree od 0 do 85 bodova) prosti frekvencijski prikaz (nazivamo ga i frekvencijskim prikazom sirovih rezultata) moe biti veoma nezgodan, kako za razmatranje rezultata, tako i za prikazivanje. Problem pri razmatranju raspodjele skorova u navedenom primjeru se ogleda u tome to se vrlo esto frekvencije pojedinih rezultata koje se meusobom vrlo malo razlikuju. Sa druge strane frekvencijski prikaz sirovih rezultata dobijen mjernim instrumentom sa veim rasponom dobijenih rezultata je esto vrlo nepregledan. Zbog toga se onda distribucija rezultata dijeli u manji broj kategorija, koje nazivamo intervalnim razredima, tako da tada frekvencijski prikaz ima vie smisla. Samo razvrstavanje rezultata koje ispitanici ostvaruju u manji broj kategorija obavlja se prema prema odreenim kriterijumima koji koje postavlja sam istraiva prema zahtjevima koji su postavljeni odreenom statistikom metodom koja se primjenjuje2 ili teorijskom idejom na kojoj je istraivanje zasnovano3. Pojmovi kojima se barata pri razmatranju raspodjele ispitanika po kategorijama su: R - raspon dobijenih skorova; ija je vrijednost razlika izmeu najvieg i najnieg skora dobijenog pri jednom mjerenju, i - interval; brojna vrijednost koja pokazuje opseg jednog razreda. Vrijednost intervala dodana na najniu mjeru jednog razreda jednaka je najnioj mjeri sljedeeg razreda. Interval moe biti bilo koji pozitivan cijeli broj4, r - razred; jedna od kategorija u koju spadaju ispitanici iji je dobijeni rezultat jednak ili vei od njegove najmanje mjere i jednak ili manji od njegove
2
Kao primjer raspodjele ispitanika u kategorije prema zahtjevima odreene statistike metode koja se primjenjuje moemo navesti sluaj kada elimo utvrditi postoji li statistiki znaajna razlika izmeu ispitanika koji su poloili ispit iz Psihometrije ili ne, prema uspjehu na testu informisanosti. Ukoliko elimo da eventualno postojanje znaajne razlike ispitamo putem t-testa, prvo je potrebno ispitanike razvrstati na osnovu ukupnog broja bodova postignutih na testu iz Psihometrije u dvije kategorije, poloili i nisu poloili ispit. Zatim utvrditi da li postoji razlika izmeu aritmetikih sredina tako formiranih grupa prema uspjehu na testu informisanosti i da li je eventualna razlika izmeu grupa statistiki znaajna na nekom od nivoa znaajnosti ili ne. 3 Studentima psihologije najpoznatiji primjer raspodjele ispitanika u kategorije zasnovan na odreenoj teorijskoj ideji je razvrstavanje ispitanika u kategorije prema postognutom koeficijentu inteligencije. Tako koeficijentu inteligencije, numerikoj varijabli dobijenoj na testu inteligencije VITI ispitanici se razvrstavaju u kategorije prema Vekslerovoj teoriji inteligencije (Biro, 1996). 4 Za intervale se najee uzimaju neparni brojevi (u objanjenju izbora neparnog broja bi najjednostavnijebilo rei da je to esnafski obiaj).
40
41
najvee mjere. Broj rezreda u jednoj distribuciji jednak je koliniku raspona i intervala (ukoliko vrijednost kolinika nije cijeli broj, broj razreda jednak je vrijednosti cijolog broja uveanoj za 1)5, f - frekvencija; broj sluajeva (ispitanika) koji prema ostvarenoj vrijednosti date varijable pripadaju jednoj i samo jednoj kategoriji kategoriji te varijable. U opisu rezultata istraivanja se pored frekvencija, koje se mogu oznaiti apsolutnim mjerama prebrojavanja, koriste i procenti i proporcije, koje se nazivaju relativnim mjerama prebrojavanja. Razlika izmeu frekvencija sa jedne, i procenata i proporcija sa druge strane, je u tome to frekvencije ukazuju na broj sluajeva koji pripadaju samo jednoj kategoriji, dok procenati i proporcije govore o odnosu broja sluajeva (ispitanika) jedne kategorije sa ukupnim brojem sluajeva. Procenat tako kao relativna mjera prebrojavanja pokazuje odnos broja sluajeva jedne kategorije prema ukupnom broju ispitanika pomnoenom sa 100. f 100 , N
P= P -
gdje je
procenat ispitanika koji postie odreen rezultat (pripada odreenoj kategoriji), f - frekvencija date kategorije, N - ukupan broj ispitanika u uzorku. Proporcija je takoe relativna mjera i jednaka je odnosu broja sluajeva jedne kategorije prema ukupnom broju ispitanika. f , N
p=
gdje je
p - proporcija ispitanika koji postie odreen rezultat (pripada odreenoj kategoriji), f - frekvencija date kategorije, N - ukupan broj ispitanika u uzorku. Rezultate u obliku frekvencija moemo dati predstaviti preko tabele ili grafikona. Grafikoni frekvencija koje naee primjenjujemo su histogram (ili stupasti dijagram) i poligon frekvencija. I tabele i grafikoni kojima se rezultati prikazuju preko frekvnecija kao mjera prebrojavanja su vrlo jednostavni i pregledni6. Histogram
5 6
Poligon frekvencija
Raspon i interval je jedino mogue utvrditi kada se barat sa podacima sa najmanje intervalne skale. Mislimo da nije zgoreg pomenuti da nije potrebno da se rezutati predstavljaju na oba naina, i u tabelama i putem grafikona. Time se samo bespotrebno ponavljaju dobijeni rezultati i njihove interpretacije. Takav pleonazam samo razvodnjava rezultate istraivanja koji se prikazuju.
41

40
42
30
30
20
20
10
10
0 17.0 18.0 19.0 20.0 21.0 22.0 23.0 24.0 25.0 26.0 27.0 28.0 29.0 30.0
Count
0 16.5 18.0 19.5 20.5 21.5 22.5 23.5 24.5 25.5 26.5 27.5 28.5 29.5
I kod histograma i kod poligona frekvencija se na apscici nalaze rezultati koje ispitanici postiu pri nekom mjerenju, u obliku pojedinanih rezultata koje ispitanici postiu ili formiranih kategorija, dok su na ordinati frekvencije postignutih rezultata ili razreda ispitanika. Procentni prikaz bi bio neto naprednija verzija, gdje relativizovanje frekvencija omoguava najelementarnija poreenja razliitih grupa ispitanika po odreenim razredima distribucije. Na primjerima histograma i poligona frekvencija je prikazana razlika izmeu pripadnika mukog i enskog pola ispitanika na testu informisanosti. Histogram
12
Poligon frekvencija
12 10
10
POL Percent
muski 0 16.5 18.0 19.5 20.5 21.5 22.5 23.5 24.5 25.5 26.5 27.5 28.5 29.5 zenski
POL Percent
2 muski zenski 19.5 18.0 20.5 21.5 22.5 23.5 24.5 25.5 26.5 27.5 28.5 29.5
0 16.5
Rezultat testa
Rezultat testa
Sad se prvi put susreemo sa analizama podataka. Kad prvi put uradimo analizu podataka SPSS e ih prikazati u zasebnom prozoru koji se zove Output (ili prozor za
42
43
ispis). On e nam biti aktivan u donjoj traci radne povrine i prikazivae se kao zaseban program. Deskriptivne analize kategorikih varijabli obino radimo tako da rezultate prikaemo u vidu frekvencija i procenata. U SPSS-u emo tu mogunost ostvariti preko menija Analyze/Descriptive Statistics/Frequencies. Dobiemo prozor sa opcijama koji izgleda kao na slici: stics/Frequencies.
U donjem dijelu slike vidimo tri tastera koja nas vode do razliitih mogunosti. U ovom trenutku za nas e biti interesantna opcija iscrtavanja grafikona (opcija Charts), u okviru koje moemo potvrditi opciju Bar charts (histogram ili stupasti prikaz). Kad unesemo u prostor s desne strane unesemo varijable (mi smo unijeli varijablu pol) i potvrdimo sa OK, dobiemo sljedei ispis:
Frequencies
Statistics
pol
N Valid Missing 507 1 pol Cumulative Percent 45.2 100.0
Frequency Valid muski zenski Total Missing Total System 229 278 507 1 508
Percent 45.1 54.7 99.8 .2 100.0
Valid Percent 45.2 54.8 100.0
43
44
pol
300
200
100
Frequency
0 muski zenski
pol
Prva tabela nam govori koliki je ukupan uzorak ispitanika. Vidimo da smo u ovom primjeru imali ukupno 508 ispitanika, od kojih je 507 uzeto u obradu (ispitanici sa valjanim podacima - Valid), i jedan za koga nismo registrovali polnu pripadnost (Missing). Druga tabela nam je najinformativnija, i u njoj se nalaze za nas najbitniji i najzanimljiviji podaci. U prvoj koloni tabele (Frequencies) se nalaze oznake kategorija za koje su utvrene frekvencije (kategorije varijable pol, muki i enski) i pored njih ukupna veliina uzorka, broj valjanih podataka i podataka koji izostaju iz obrade. Druga kolona nam govori o vrijednostima opaenih (empirijskih) frekvencija za kategorije date varijable. Kolona Percent nam govori o procentualnoj zastupljenosti mukih i enskih ispitanika u odnosu na ukupan broj ispitanika (508 u naem sluaju), ukljuujui i jednog iji pol nismo registrovali. Kolona Valid Percent nam govori o procentualnoj zastupljenosti mukih i enskih ispitanika, ali ovaj put u odnosu na valjani broj ispitanika (507 u naem sluaju), i uglavnom koristimo ovaj procentualni prikaz. Konano, posljednja kolona (Cumulative Percent) nam daje kumulativne procente, odnosno predstvlja zbir procenata datog razreda sa procentima prethodnih razreda. Red tabele u kojoj pie Missing nam (opet) govori o broju i procentu ispitanika sa nedostajuim podacima. Na kraju imamo i grafiki prikaz podataka, ovaj put u stupastom grafikonu (histogramu), mada smo mogli izabrati i neki drugi prikaz (pitasti ili histogram sa normalnom krivom).
44
SPSS za psihologe i pedagoge Mjere centralne tendencije
45
Mjere centralne tendencije nam ukazuju na tendencije grupisanja oko neke centralne vrijednosti u distribuciji rezultata mjerenja. Njihovim koritenjem se najbre, najjednostavije i najuoptenije mogu opisati mjerene pojave na datom uzorku. Najee mjere centralne tendencije koje se koriste su: aritmetika sredina, medijana i mod. Aritmetika sredina je mjera sa kojom se najee susreemo u statistikim izvjetajima, i govori nam koji je prosjean skor u naoj distribuciji. U odnosu na medijanu i mod mnogo je pouzdanija. Pored oznake M, aritmetika sredina se jo moe oznaiti i sa AS i X . Matematiki se izraava kao kolinik zbira svih dobijenih rezultata i ukupnog broja rezultata. M =
X ,
N
gdje je
M X N
aritmetika sredina, pojedinani skor ispitanika, ukupan broj sluajeva mjerenja (broj rezultata), oznaka za sumu.
Za raunanje aritmetiku sredinu, moraju biti ispunjena dva uslova: 1. da rezultati mjerenja potiu sa intervalne ili racio skale 2. da postoji pretpostavka o normalnoj raspodjeli tih mjera u populaciji. Medijana nam govori koji je centralni rezultat u distribuciji, odnosno ukazuje na skor koji dijeli distribuciju na dva jednaka dijela. Znai, ako rezultate mjerenja poredamo po veliini, medijanu emo dobiti tako to emo izdvojiti rezultat koji se nalazi na samoj sredini (u sluaju kada distribucija ima paran broj rezultata, to e biti sredina izmeu dva srednja skora). Formula za odreivanje medijane iz niza podataka poredanih po veliini je: Mdn = N , 2 gdje je
Mdn - medijana, N - ukupan broj rezultata. Mod, konano, predstavlja najgrublju, odnosno statistiki najneprecizniju, mjeru centralne tendencije neke distribucije. Govori nam koji se rezultat u jednoj distribuciji podataka najee pojavljuje. Nedostatak moda kao mjere centralne temdecije uoavamo kad se sretnemo sa distribucijom u kojoj imamo dva ili vie najea rezultata (bimodalne, odnosno polimodalne distribucije). U takvim sluajevima ne moe se uzeti samo jedna najfrekventnija vrijednost jer se time znaajno naruava
45
46
dobijena distribucija podataka i jer se tada interpretacije i zakljuci baziraju na netanim rezultatima rezultata Iako je statistiki pouzdanija od moda i medijane, i treba je koristiti uvijek kad je to mogue, aritmetika sredina ima svojih nedostataka osjetljiva je na ekstremne rezultate. Ako za primjer uzmemo firmu u kojoj imamo sedam zaposlenih koji primaju sljedee plate: radnici primaju 200, 210, 220, 230, 240 i 250 KM, dok direktor prima 5000 KM. Ako izraunamo aritmetiku sredinu, rei emo da prosjena plata u toj firmi iznosi 907.14 KM. Primjetiemo da nam ta cifra ne odslikava pravo stanje u toj firmi. S druge strane, ako uzmemo medijanu (centralnu vrijednost u nizu), to e biti 230 KM, to je ve realniji podatak kojim bismo oslikali nau priu7. Mjere varijabilnosti Za potpunije opisivanje mjerenih pojava, pored mjera centralne tendencije, navodimo i mjere variranja (odstupanja, rasprenja, disperzije) od centralnih mjera. Ako su vrijednosti nekog niza mjera gusto grupisane oko srednje vrijednosti, onda ta srednja vrijednost dosta vjerno reprezentuje mjerenu pojavu. S druge strane, ukoliko su odstupanja rezultata velika, onda smo u situaciji da nam ta srednja vrijednost ne govori mnogo o tendencijama mjerene pojave. Od statistikih mjera varijabilnosti se najee koriste raspon, kvartilna devijacija, standardna devijacija, standardna greka aritmetike sredine, varijansa, skjunis i kurtozis. Najjednostavnija mjera varijabilnosti rezultata je raspon, i govori nam kolika je razlika izmeu najvee i najmanje mjere u nizu. Raspon je prilino gruba mjera odstupanja, ali se moe koristiti kao dodatni opis mjerene pojave. Formula za utvrivanje ove mjere disperzije je: R = Xmax - Xmin, R - raspon, Xmax - najvei dobijeni rezultat, Xmin - najmanji dobijeni rezultat. Kvartilnu devijaciju koristimo kad opisujemo distribucije koje odstupaju od normalne raspodjele. To mogu biti razliite asimetrine distribucije, ili polimodalne distribucije rezultata. Matematiki se izraava kao:
7
gdje je
Kako aritmetika sredina kao mjera centralne tendencije moe biti nepouzdan parametar koji predstavlja skup vrijednosti jedne varijable moe se vidjeti iz sljedeeg primjera. Petorica mladia, od kojih svaki ima 20 godina su provodili popodne na zabaenoj plai. Od jednog prolaznika su uli da na se na drugoj plai nalazi pet enskih osoba, ija je aritmetika sredina godina takoe 20. Ne asei ni asa njih petorica su krenuli prema drugoj plai, meutim tamo nisu nali ba onakav prizor kakav su oekivali. Naime tu se zaista nalazilo pet enskih osoba, ali su to bile etiri djevojice, koje su imale po 5, 5, 7 i 8 godina, sa svojom bakom koja je imala 65 godina. Iz primjera je jasno da postoje situacije gdje je mod pouzdanije mjere centralne tendencije od aritmetike sredine. teta je jedino to ga i Halmi (1999) pri navoenju nije iskoristio u istu svrhu, ve je na osnovu njega nezgrapno pokuao objasniti statistike lai.
46
47
Q=
Q3 Q1 , 2
gdje je
Q - kvartilna devijacija, Q 3 - trei kvartil, Q1 - prvi kvartil. Pri tome treba rei da je Q1 P25 i Q3 P75, gdje je
P25 - percentil 25 i P75 - percentil 75, odnosno da je prvi kvartil jednak percentilu 25 i trei kvartil jednak percentilu 75. Percentil predstavlja mjesto u distribuciji mjera ispod kojeg se nalazi odreen procenat sluajeva, tako da je percentil 25, odnosno prvi kvartil, mjesto u distribuciji podataka ispod koga se nalazi 25% i percentil 75, odnosno trei kvartil, mjesto u distribuciji podataka ispod koga se nalazi 75% ukupnih sluajeva. Standardna devijacija za najpreciznija i najpouzdanija mjera varijabilnosti pojava. Definie se kao mjera varijabiliteta koja pokazuje koliko je odstupanje skorova distribucije od njene aritmetike sredine. Sa obzirom da se standardna devijacija rauna u odnosu na aritmetiku sredinu (nikad medijanu ili mod) i za nju vae uslovi: da dobijeni podaci potiu sa intervalne ili racio skale, i pretpostavka o normalnoj raspodjeli mjera u populaciji. Imajui u vidu vanost standardne devijacije Sprinthall (1990) je opisuje kao srce i duu koncepta varijabilnosti. Standardna devijacija je specifina mjera varijabilnosti, i moe se opisati kao kvadratni korijen iz prosjenog zbira kvadrata odstupanja. Matematiki prikazano, formula za izraunavanje izgleda ovako:
( X M )
N 1
gdje je:
- standardna devijacija, X - pojedinani skor ispitanika, M - aritmetika sredina,
47
SPSS za psihologe i pedagoge N - ukupan broj sluajeva mjerenja, - oznaka za sumu.
48
Standardna devijacija nam slui ne samo za prosti opis mjerene pojave, nego i za statistici zakljuivanja, to nam onda prua vee mogunosti generalizacije zakljuaka, ali time emo se pozabaviti kasnije. Kada su zakljuci koji se donose vezani za aritmetiku sredinu, u stvari se koristi aritmetiku sredinu dobijenu na odreenom uzorku da bi se procijenila aritmetiku sredinu populacije. Greka koju se ini prilikom te procjene naziva se standardna greka aritmetike sredine. Zakljuivanje o populacijskoj aritmetikoj sredini e biti utoliko tanije to je vei uzorak i to je mjerena pojava manje varijabilna. Poto se na varijabilnost neke pojave ne moe uticati, ukoliko se ne moe da obaviti mjerenje na svim lanovima populacije (a to se gotovo nikad ne moe), greka procjene se moe smanjiti veim brojem mjerenja. Oznaka za standardnu graku aritmetike sredine je M ili SE M, a formula za njeno izraunavanje:
M =
ili
M =
(za uzorke manje od 100), N 1
gdje je
M N
- standardna greka aritmetike sredine - standardna devijacija - ukupan broj sluajeva mjerenja,
Varijansu je najjednostavnije predstaviti kao mjeru varijabilnosti koja je jednaka kvadriranoj vrijednosti standardne devijacije, pa je njena formula: V= 2, V - varijansa - standardna devijacija,
gdje je
ili
V=
( X M ) 2 , N 1
gdje je
48
SPSS za psihologe i pedagoge V X M N varijansa, pojedinani skor ispitanika, aritmetika sredina, ukupan broj sluajeva mjerenja, oznaka za sumu.
49
U osnovi varijansa i standardna devijacija predstavljaju istu mjeru varijabilnosti. Meutim, postoje situacije u kojima statistike operacije sa varijansom dozvoljavaju analize koje bez uea varijanse ne bi bile mogue. Pored navedenih, kao mjera varijabilnosti su vrlo vane i skjunis (skewness) i kurtozis (kurtosis). Na osnovu njihovih vrijednosti se donose zakljuci o odstupanja empirijske raspodjele od normalne krive. Na osnovu vrijednosti skjunisa se vri zakljuivanje o pozitivnom ili negativnom odstupanju dobijene raspodjele podataka u odnosu na normalnu (horizontalno odstupanje), dok se na osnovu poznavanja vrijednosti kurtozisa zakljuuje o odstupanju dobijene raspodjele po visini (vertikalno odstupanje). Kako je navedeno skjunis je statistik na osnovu kojeg se donosi zakljuak o tome da li je empirijska raspodjela podataka pozitivno ili negativno asimetrina (iji jednostavnije reeno da li distribucija podataka grafki predstavljeno skree u lijevu ili desnu stranu. Formula za izraunavanja skjunisa je:
Sk = Sk P90 P10 P50 skjunis precentil 90 percentil 10 percentil 50
P90 + P10 P50 , 2
gdje je
Svojom vrijednosti skjunis izraava veliinu asimetrije, dok svojim predznakom ukazuje na smjer asimetrije, pozitivan ili negativan. ematski prikazane, asimetrine distribucije izgledaju ovako:
49
50
Kao to je ve reeno prilikom izraunavanja kurtozisa se utvruje eventualno vertikalno odstupanje dobijene distribucije od normalne. Na osnovu raspodjele podataka i vrijednosti kurtozisa se utvruje da li postoji tendecija grupisanja podataka oko aritmetike sredine ili se podaci raspruju podjednako du apscise. Formula za izraunavanje kurosisa je: Ku = Q Ku P90 P10 kvartilna devijacija, kurtozis, precentil 90, percentil 10 P75 P25 , 2 Q , P90 P10
Pri tome je:
Q=
gdje je
Q - kvartilna devijacija P915 - precentil 15, P25 - percentil 25. Vrijednost kurtozisa koja se izraunava je uvijek manja od jedan. Dobijenu vrijednost se uvijek poredi sa vrijednosti 0.263 koliko iznosi kurtosis za normalnu krivu. Ukoliko je dobijena vrijednost kurtozisa vea od 0.263 onda je distribucija platikurtina, tj. spljotena. Ako je dobijena vrijednost manja od 0.263, onda je distribucija leptokurtina, tj. izduenog oblika. ematski prikazano, te distribucije izgledaju kao na slici:
50
51
Ku < .263 - leptokurtina kriva, Ku = .263 - normalna kriva, Ku > .263 - platikurtina kriva. Sad treba da vidimo kako emo raunanja ovih mjera centralne tendencije i varijabilnosti obaviti u SPSS-u. Znai, zanimaju nas mod, medijana i aritmetika sredina, a od mjera odstupanja tu su standardna devijacija, kvartilna odstupanja i mjere zakrivljenosti dobijene distribucije podataka. Nije zgoreg napomenuti da aritmetiku sredinu i standardnu devijaciju koristimo ukoliko imamo podatke koji zadovoljavaju uslove intervalne ili racio skale. Za primjer emo uzeti rezultate sa skale autoritarnosti kao osobine linosti, koja je primijenjena na uzorku od 496 ispitanika. Ukoliko radimo na podacima sa ordinalne skale, mjere centralne tendencije i odstupanja emo traiti na slian nain kao i kod frekvencijskih tabela: preko menija Analyze/Descriptive Statistics/Frequencies, i moemo da iskljuimo kuicu Display frequency tables da na bismo gledali neeljeno velike frekvencijske tabele...
51
52
...a zatim emo pritisnuti dugme Statistics, i zabraemo neke od mjera koje elimo.
Ako elimo prikaz aritmetike sredine i standardne devijacije za intervalne ili racio podatke, kao i drugih mjera opisa, idemo na meni Analyze/Descriptive Statistics/Descriptives i unesemo u desni prozor eljenu varijablu (u naem sluaju to je skor na skali autoritarnosti).
52
53
Da bi vidjeli koje statistike mjere su nam na raspolaganju, kliknemo na dugme Options i dolazimo do izbora mjera. Za poetak su oznaene aritmetika sredina (Mean), standardna devijacija, minimum i maksimum, raspon Range), standardna greka aritmetike sredine (S.E. mean). Ukoliko elimo da vidimo zakrivljenost nae distribucije moemo ukljuiti i mjere zakrivljenja (Kurtosis i Skewness), da bismo vidjeli da li znaajno odstupa od normalne raspodjele mjera.
Kad na kraju potvrdimo sa OK, dobiemo sljedei ispis:

Descriptives
Descriptive Statistics N Range Minimum Statistic 50 18 Maximum Statistic 68 Statistic 47.991 Mean Std. Error 0.389 Std. Deviation Statistic 8.663 Skewness Statistic -0.325 Kurtosis Statistic -0.0193
Statistic Statistic SKOR.AUT Valid N (listwise) 495 495
Iz tabele moemo vidjeti da imamo 495 ispitanika iji su rezultati uzeti u obradu. Raspon rezultata iznosi 50, vrijednost minimalnog skora je 18, a maksimalnog 68. Vrijednost aritmetike sredine je 47.98, a njena standardne greke 0.389, dok standardna devijacija iznosi 8.66. Skewness iznosi 0.325 to znai da je naa distribucija negativno asimetrina (skree na lijevu stranu). Kurtosis je manji od 0.263 na onsnovu ega zakljuujemo da je kriva empirijske distribucije izduena u odnosu na normalnu, tj. leptokurtina.
53
SPSS za psihologe i pedagoge Deskriptivne mjere za dva ili vie uzoraka
54
esto se javlja potreba za uporeenjem deskriptivnih mjera dvaju ili vie poduzoraka u okviru jednog istraivanja. To recimo moe biti sluaj kad se ele uopteno uporediti postignua mukih i enskih ispitanika na nekom testu, ili da se uporede prosjeci uenikih ocjena po razredima osnovne kole. Mi emo za primjer uzeti jedno ispitivanje koje se bavilo znanjem iz oblasti informatickih tehnologija, gdje je predmet interesovanja razlika u stepenu informatickih znanja kod ljudi razliitih uzrasnih skupina. Postoji vie naina da se ovo uradi u SPSS-u. Najjednostavniji je sljedei: Idemo na meni Analyze/Compare Means/Means, i u okvir iznad kojeg pie Dependent List ubacimo varijablu ije skorove elimo porediti (u naem sluaju to je rezultat na testu znanja iz informatike). U Independent List ubacimo kategoriku varijablu u kojoj se nalaze informacije o naim poduzorcima (u naem sluaju to je varijabla starost). Da bismo odabrali deskriptivne mjere koje elimo vidjeti, pritisnemo dugme Options.
Time se dobija prozor na ijoj lijevoj strani se nalaze mjere koje su na raspolaganju, a s desne strane je okvir u koji se unose parametri koje elimo da razmotrimo. Za poetak su odabrane aritmetike sredine (Means), standardne devijacije (Standard Deviation) i broj sluajeva (Number of Cases) i, ali nas nita ne sprijeava da izaberemo bilo koju drugu mjeru koja nas zanima, te smo mi odabrali jo i medijanu (Median) i minimalan i maksimalan rezultat na testu.
54
55
Kao rezultat dobijamo sljedei ispis:

Means
Case Processing Summary Cases Included N znanje iz informatike * STAROST 401 Percent 98.8% N 5 Excluded Percent 1.2% N 406 Total Percent 100.0%
Report
znanje iz informatike
STAROST 18 - 20 godina 21 - 29 godina 30 - 39 godina 40 - 49 godina preko 50 godina Total Mean 26.1882 24.7458 20.0000 17.1127 15.0323 22.5112 N 85 177 37 71 31 401 Std. Deviation 5.62201 6.97217 7.43117 6.63443 4.49061 7.57532 Median 26.0000 24.0000 15.0000 14.0000 14.0000 21.0000 Minimum 14.00 14.00 14.00 14.00 14.00 14.00 Maximum 38.00 41.00 38.00 41.00 39.00 41.00
Prva tabela (Case Processing Summary) nas, ve uobiajeno, izvjetava o tome koje varijable se ukrtaju (u naem sluaju to su znanje iz informatike i starost), i koliko ispitanika je imalo valjane podatke, odnosno koliko je ispitanika uzeto u obradu. Druga tabela (Report) daje prikaz deskriptivnih statistikih mjera koje smo traili. Poto vidimo da su sve na broju (AS, N, , medijana, min i max), moemo obaviti i uvid u dobijene rezultate. U koloni Means vidimo da je stepen poznavanja
55
56
oblasti informatike vei kod mlaih ispitanika i da progresivno opada sa porastom starosne dobi ispitanika. Poreenje se dalje moe vriti i na osnovu drugih dobivenih statistikih mjera. Tako vrijednosti medijane, naravno, prate vrijednosti aritmetikih sredina po kategorijama ispitanika. Dalje se, recimo, moe zakljuiti da je najvee prosjeno odstupanje rezultata prisutno u grupi ispitanika starosti izmeu 30 i 39 godina, dok su najvei skorovi dobijeni u grupama ispitanika starosti od 21 do 29 i od 40 do 49 godina. najmanji dobijeni skor je jednak u svim grupama. Na kraju (samo po redoslijedu navoenja, nikako i vanosti podataka koje sadri), kolona N pokazuje broj ispitanika po kategorijama, to je vrlo vano ne samo jer prua informaciju o brojnosti kategorija, ve prije svega ukazuje na to da li je smisleno porediti grupe (ako su razlike u broju lanova poduzoraka velike, npr. u kategoriji starosti od 30 do 39 148 ispitanika i u u kategoriji starosti od 40 do 49 njih 17). Testiranje normalnosti distribucije podataka Ve smo vidjeli da je za veliki broj statistikih analiza neophodno ustanoviti da li distribucija dobijenih podataka zadovoljava uslov normalnosti, tj. da li u dovoljnoj mjeri podraava normalnu raspodjelu (npr. za odluku da li e se u razmatranju odreenih podataka primijeniti neki parametrijski ili neparametrijski test). Provjera eventualnog odstupanja empirijske od normalne distribucije se moe izvriti na vie naina. Jedan od naina je da se (ve predstavljene) deskriptivne mjere odstupanja, skjunis i kurtozis podijele sa njihovim standardnim grekama. Ukoliko bilo koja od dobijenih vrijednosti bude vea od 1.96 ili 2.58, zakljuuje se da empirijska distribucija znaajno (na nivou 0.05, odnosno 0.01) odstupa od normalne krive. Znai, Sk 2.58 SESk Ku 2.58 SE Ku i Sk .96 1 SESk Ku 1.96 SE Ku gdje je Sk SESk Ku SEKu p 2.58 1.96 skjunis standardna greka skjunisa kurtozis standardna greka kurtozis a oznaka za statistiku znaajnost vrijednost sa kojom se poreenje vri na nivou znaajnosti p<.05 vrijednost sa kojom se poreenje vri na nivou znaajnosti p<.01 p .01,
p .05
56
57
Sljedei nain testiranja eventualnog odstupanja empirijske raspodjele od normalne bi bio uz pomo Hi-kvadrat (2) testa, ali poto je to dosta komplikovano uraditi u okviru SPSS-a, ovaj put neemo to objanjavati.
Kolmogorov-Smirnov test je jo jedan od moguih naina provjeravanja empirijske distribucije. U okviru Kolmogorov-Smirnov testa se vri poreenje empirijske i teorijske distribucije. U ovom postupku se uzima u obzir ono mjesto u kome se dvije raspodjele najvie razlikuju, a zatim ispituje da li ta najvea vrijednost razlike empirijske i teorijske distribucije (Dmax) statistiki znaajno odstupa od normalne, van granica sluajnosti. Mi emo za primjer uzeti na ve opisani sluaj sa skalom autoritarnosti. Potrebno je za poetak otii na meni Analyze/Descriptive Statistics/Explore i da varijablu iju distribuciju elimo da testiramo ubacimo u okvir gdje pie Dependent List (u naem sluaju to je varijabla skor.aut koja je rezultat na nekoj skali autoritarnosti). Sljedei korak je da idemo na opciju Plots u donjem dijelu prozora.
Treba da potvrdimo opcije Histogram i Normality plots with tests. Ovo e nam dati grafiki prikaz raspodjele naih rezultata u formi histograma, a dobiemo i statistike testove normalnosti.
57
58
Dobiemo sljedei ispis:

Explore
Case Processing Summary Cases Valid N SKOR.AUT 495 Percent 97.6% Descriptives Statistic SKOR.AUT Mean 95% Confidence Interval for Mean Lower Bound Upper Bound 47.9919 47.2268 48.7570 48.1768 48.0000 75.065 8.66399 18.00 68.00 50.00 12.0000 -.326 -.019 Tests of Normality Kolmogorov-Smirnov(a) Statistic SKOR.AUT .048 a Lilliefors Significance Correction df 495 Sig. .008 Statistic .991 Shapiro-Wilk df 495 Sig. .005 .110 .219 Std. Error .38942 N 12 Missing Percent 2.4% N 507 Total Percent 100.0%
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis
58
59
Histogram
120 100
80
60
40
Frequency
20 0 20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0 70.0
Std. Dev = 8.66 Mean = 48.0 N = 495.00
SKOR.AUT
Prva tabela nam govori o broju valjanih podataka uzetih u obradu, a druga o generalnim deskriptivnim podacima za nau skalu. Dok se u drugoj tabeli nalaze deskriptivne statistike mjere razmatrane distribucije koje smo odabrali o okviru opcije Statistics, u treoj (onoj koja nas najvie zanima) dobijamo izvjetaj o distribuciji koju testiramo. U okviru te tabele, pod nazivom Test of Normality, prve tri kolone predstavljaju izvjetaj o obavljenom Kolmogorov-Smirnov testu. Kolona Statistic kae kolika je izraunata mjera odstupanja nae distribucije od normalne (u naem sluaju 0.048), a kolona Sig. nam govori o znaajnosti utvrenog odstupanja (u naem sluaju 0.008). Budui da je p (odnosno Sig. u SPSS-u) manje od 0.01, a hipoteza je bila da naa distribucija ne odstupa znaajno od normalne, odbacujemo postavljenu hipotezu, i donosimo zakljuak da naa distribucija statistiki znaajno (na nivou znaajnosti od 0.01) odstupa od normalne. Tabela takoe pokazuje da je radjen i drugi test eventualnog odstupanja empirijske raspodjele od normalne krive i da on takoe ukazuje na statistiki znaajno odstupanje testirane raspodjele od normalne (Shapiro-Wilk). No, budui da je on predvien za uzorke od 50 ili manje ispitanika (u naem sluaju ih ima 495), on nam zasad nije potreban. Takoe, ukoliko skewness podijelimo sa njegovom standardnom grekom dobijamo: -0.326/0.110 = -2.96, gdje takoe potvrujemo znaajno odstupanje dobijene od normalne raspodjele. Histogram koji smo dobili nam moe poneto rei o dobijenim podacima. Vidimo da se vei broj ispitanika gomila na gornjem dijelu nae skale, to znai da su rezultati za nau ispitivanu populaciju negativno asimetrini, odnosno varijabilnost negativne strane je poveana.
59
60
Testiranje znaajnosti razlika aritmetikih sredina

Jedna od najeih razmatranja s kojima se istraivai bave u okviru analize podataka jesu testiranja znaajnosti razlika aritmetikih sredina izmeu uzoraka. Ukoliko se ele uporediti aritmetike sredine dobijene na dva uzorka iz iste populacije, gotovo sigurno e njihove vrijednosti biti razliite. Da bi se utvrdio da li te razlike potiu od nekih sistematskih faktora, ili su, pak, rezultat sluajnih inilaca, posluiemo se nekim od statistikih testova konstruisanih u tu svrhu. Na osnovu rezultata testiranja razlika, u zavisnosti od toga da li rezultat bude znaajan ili ne, mogu se izvesti dva zakljuka: 1. Ukoliko test ne pokae statistiki znaajnu razliku izmeu aritmetikih sredina uzoraka, zakljuuje se sa mogunosti greke manjom od 1% ili 5%, da su uzorci homogeni (pripadaju istoj populaciji), odnosno da su nastale razlike rezultat sluajnih faktora. 2. Ukoliko test pokae znaajnu razliku izmeu aritmetikih sredina, uz mogunost prisustva greke manjom od 1% ili 5% donosi se zakljuak da su uzorci heterogeni, odnosno da su nastale razlike rezultat dejstva nekog sistematskog faktora. U pozadini ovog postupka testiranja znaajnosti razlika izmeu aritmetikih sredina, lei procjenjivanje njene standardne greke, definisanja intervala pouzdanosti oko te razlike i procjene znaajnosti te razlike. Da bismo radili testiranje znaajnosti razlika izmeu izraenosti pojava potrebno je da znamo nekoliko stvari: Da li podaci zadovoljavaju uslove primjene parametrijskih testova? - da podaci sa kojima se barata potiu bar sa intervalne skale - da podaci podravaju normalno raspodjeljuju Da li se radi o nezavisnim ili zavisnim uzorcima? Da li postoji dvije ili vie grupa ispitanika? Ovi podaci e odrediti vrste statistikih testova koji se mogu koristiti, a vidjeemo da ih ima mnogo.
Testiranje znaajnosti razlike izmeu dva uzorka T test za nezavisne uzorke Kao prvo treba rei da se pod nezavisnim uzorcima podrazumijevaju se oni uzorci koji nakog izvrenog mjerenja ne stoje ni u kakvom pravilnom odnosu, odnosno nisu u korelaciji. Ukoliko postoji potreba da se izvri testiranje razlika izmeu aritmetikih sredina dvaju nezavisnih uzoraka, pod uslovom da su zadovoljaeni uslovi za primjenu parametrijskih testova, onda koristimo t-test za nezavisne uzorke. Formula za njegovo izraunavanje je:
60
SPSS za psihologe i pedagoge DM , DM
61
t=
gdje je:
t - t-test DM = M 1 M 2 - (apsolutna razlika izmeu AS)
DM
- standardna greka razlike izmeu AS, gdje je
DM = M 1 2 + M 2 2 ,
pri emu je
M1 =
1 N1
M2 =
2 N2
Dobijenu vrijednost t-testa se mogu porediti sa vrijednostima intervala pouzdanosti .05 i .01, koje iznose 1.96 i 2.58 za velike uzorke, i ukoliko izlazi izvan okvira neke od ovih vrijednosti, prihvata se hipoteza o postojanju znaajnih razlika izmeu uzoraka. Za primjer emo uzeti testiranja znaajnosti polnih razlika u postignuu na testu iz engleskog jezika na vie raznih fakulteta. Imaemo jednu kategoriku varijablu pol, i drugu numeriku (intervalnog nivoa), skor na testu znanja iz engleskog jezika. Potrebno je da idemo na opciju Analyze/Compare Means/IndependentSamples T Test. Test Varijable je naa zavisna varijabla (skor na testu iz engleskog jezika u naem sluaju), a Grouping Variable je nezavisna varijabla (u naem sluaju to je pol).
Moraemo da definiemo koje grupe poredimo, jer SPSS podrazumijeva da nezavisna varijabla koja je kategorika, moe imati vie od dva modaliteta. Kliknemo na dugme Define i moi emo da nastavimo.
61
62
Poto smo mi definisali modalitete nae varijable tako da 1 oznaava enski, a 2 muki pol, te vrijednosti emo upisati u kuice. Potvrdimo sa Continue.
Kad smo definisali grupe i potvrdili sve, dobijamo sljedei ispis kao rezultat naeg testiranja:
T-Test
Group Statistics POL muski zenski N 88 128 Mean 22.648 23.992 Std. Deviation 2.3843 2.8416 Std. Error Mean .2542 .2512
Rezultat testa iz engleskog
Independent Samples Test Levene's Test for Equality of Variances F Sig. t df
t-test for Equality of Means Sig. (2tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -.6170
Equal variances assumed Equal variances not assumed
2.641
.106
-3.643
214
.000
-1.344
.3691
-2.0719
-3.763
205.582
.000
-1.344
.3573
-2.0490
-.6400
Prva tabela (Group Statistics) koju smo dobili daje nam deskriptivne mjere za naa dva uzorka. Vidimo da ukupno ima 88 mukih i 128 enskih ispitanika. Takoe vidimo da je prosjeni rezultat na testu iz engleskog manji kod mukih nego kod enskih ispitanika (kolona Mean), ali i da je varijabilnost rezultata vea kod enskih ispitanika (kolona Std. Deviation). Druga tabela (Independent Samples Test) je neto sloenija. Prvo treba da pogledamo rezultate Levenovog testa jednakosti varijansi. Kad je vjerovatnoa vea od .05 (u naem sluaju to je 0.106), onda zakljuujemo da se pretpostavljaju jednake varijanse u okviru naih subpopulacija i oitavamo rezultate iz prvog reda (Equal variances assumed). Da je znaajnost Levenovog testa bila manja od .05, rezultate bismo oitavali iz drugog reda (Equal variances not assumed). Ve smo vidjeli iz prve tabele da djevojke postiu neto bolje rezultate od mladia (za 1.344 poena u prosjeku), ali da li je ta razlika statistiki znaajna? Veliina statistika t od 3.643 (predznak nam nije bitan, u obzir se uzima apsolutna veliina) i
62
63
njegova znaajnost od .000 (znai manje od .05 i od .01), nam govori da su razlike izmeu aritmetikih sredina statistiki znaajne. Testiranje t-testom moemo obaviti na vie naina u SPSS-u, ali za sad emo ostati kod ovoga. Mann Whitneyjev U-test U sluaju kad imamo dva nezavisna uzorka koji ne zadovoljavaju uslove za primjenu parametrijskog t testa, za testiranje znaajnosti razlike koristimo neparametrijski ekvivalent, a to je Mann-Whitneyjev test. Potrebno je da imamo podatke koji potiu bar sa ordinalne skale. Mi emo za primjer uzeti polne razlike u osobini autoritarnosti (ta varijabla, pokazalo se ranije, ne zadovoljava uslov normalnosti za primjenu parametrijskih testova). Idemo na meni Analyze/Nonparametric Tests/2 Independent Samples, i ubacimo zavisnu varijablu u okvir gdje pie Test Variable List, a nezavisnu varijablu u okvir Grouping Variable. Moramo definisati grupe u okviru nezavisne varijable na isti nain kao to smo to opisali kod t testa.
Kad smo sve uradili, potvrdimo sa OK, i dobijamo sljedei ispis:

NPar Tests Mann-Whitney Test
Ranks pol muski zenski Total N 220 275 495 Mean Rank 252.55 244.36 Sum of Ranks 55562.00 67198.00
SKOR.AUT
63
64
Test Statistics(a) SKOR.AUT Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) a Grouping Variable: pol 29248.000 67198.000 -.634 .526
Ono to nas zanima je u drugoj tabeli (Test statistics), i to je veliina MannWhitney U statistika (u naem sluaju 29248.00) i njegova znaajnost (u naem sluaju 0.526). Znai ustanovili smo da kod naih ispitanika ne postoje statistiki znaajne razlike u autoritarnosti izmeu mukaraca i ena. Ovaj test nam nije prikazao deskriptivne mjere koje nas zanimaju, mjere rasprenja i centralnih tendencija, ali te podatke moemo dobiti na nain kako je to opisano u poglavlju Deskriptivne mjere za dva ili vie uzoraka.
T test za zavisne uzorke Zavisnim uzorcima smatramo one uzorke ije mjere su na neki nain u korelaciji. U praksi se sa ovakvim uzorcima najee sreemo kad projektujemo neku od dvije osnovne vrste eksperimentalnih nacrta. Prvi sluaj takvog nacrta se naziva metodom iste grupe", gdje se ispitivanje pojave obavlja na istoj grupi ispitanika prije i poslije uvoenja dejstva nezavisne varijable. Drugi sluaj se naziva "metodom ekvivalentnih grupa", gdje se formiraju dvije grupe ispitanika koje se ujednaavaju po nekim, za to istraivanje, relevantnim kriterijumima (npr. uzrast, kolske ocjene, da limaju brace i sestara,...). Dejstvo nezavisne varijable uvodi se u jednu grupu, koju nazivamo eksperimentalnom grupom, dok u drugoj, kontrolnoj grupi izostaje djelovanje nezavisne varijable. Nakon toga se vri mjerenje pojave. U oba sluaja rezultati mjerenja su u korelaciji, bilo zato to su u pitanju isti ispitanici, bilo zato to su razliite grupe ispitanika ujednaene po nekom (za mjerenu varijablu) relevantnom kriterijumu. Kod zavisnih uzoraka standardnu greku razlika izmeu aritmetikih sredina se rauna na sljedei nain:
DM = M 1 2 + M 2 2 2 * r1, 2 * M1 * M 2 ,
gdje je
- standardna greka razlika izmeu aritmetikih sredina, r1,2 - mjera linearne korelacije izmeu dva uzorka, - standardna greka aritmetike sredine prvog uzorka (moe se jo oznaaiti i sa SE1) - standardna greka aritmetike sredine prvog uzorka (moe se jo o oznaaiti i sa SE1) Statistik t se rauna na isti nain kao i kod nezavisnih uzoraka:
64
SPSS za psihologe i pedagoge DM , DM
65
t=
gdje je
t t-test - razlika aritmetikih sredina, - standardna greka razlika izmeu aritmetikih sredina Ukoliko se istraiva susree sa velikim grupama, dobijeni rezultat se poredi sa granicama 1.96 i 2.58, a ukoliko su grupe manje onda se granice intervala pouzdanosti oitavaju iz odgovarajuih tablica, pri emu broj stepeni slobode dobija po obrascu: df = N-1. Recimo da smo imali sluaj da trebamo provjeriti znanje iz engleskog jezika prije i poslije kursa iz engleskog jezika koga su studenti sluali na fakultetima. Ista grupa od 216 studenata , znai, radila je dva puta isti test, prije i poslije kursa, i mi treba da uporedimo te rezultate i zakljuimo da li je nastava iz jezika doprinijela boljem znanju. Treba da idemo na meni Analyze/Compare Means/Paired-Samples T Test, selektujemo dvije varijable ije rezultate elimo da poredimo, i unesemo ih u okvir gdje pie Paired Variables. U naem sluaju to su rezultati na testu prije (skor.eng) i poslije kursa (sk.eng2).
Kad smo na kraju potvrdili svoj izbor, dobijamo sljedei ispis:

T-Test
Paired Samples Statistics Mean Pair 1 Rezultat testa iz engleskog prije kursa Rezultat testa iz engleskog poslije kursa 23.444 25.3194 N 216 216 Std. Deviation 2.7402 2.83988 Std. Error Mean .1864 .19323
Paired Samples Correlations
65

N Pair 1 Rezultat testa iz engleskog prije kursa & Rezultat testa iz engleskog poslije kursa 216 Correlation .982 Sig. .000
66
Paired Samples Test Paired Differences Std. Std. Error 95% Confidence Interval Deviation Mean of the Difference Lower Pair 1 Rezultat testa iz engleskog prije kursa - Rezultat testa iz engleskog poslije kursa -1.8750 .53538 .03643 -1.9468 Upper -1.8032 -51.472 215 .000 t df Sig. (2tailed)
Mean
Prva tabela (Paired Samples Statistics) nam daje deskriptivne statistike mjere za nae zavisne uzorke. Iz nje moemo vidjeti kolika su prosjena postignua na testu prije i poslije kursa (Mean), kao i druge podatke (broj ispitanika, standardnu devijaciju). Vidimo da su na prvom testu ispitanici postizali u prosjeku 23.444 bodova, a na drugom testu (poslije kursa) u prosjeku 25.319, to znai da su ostvarili napredak od 1.87 poena u prosjeku. Druga tabela (Paired Samples Correlations) nam govori kolika je povezanost izmeu rezultata na prvom i drugom testu. U naem sluaju ta korelacija iznosi veoma visokih 0.982, to bi znailo da je gotovo svaki ispitanik popravio svoje znanje iz engleskog za istu koliinu. U realnosti gotovo nikad neete naii na povezanosti ovoe veliine, ali, budui da su nai rezultati izmiljeni to je prihvatljivo :-) U treoj tabeli (Paired SamplesTest) nas zanima prvenstveno statistik t i njegova vjerovatnoa (Sig.). Moemo vidjeti da u naem sluaju veliina t iznosi -51.472 (opet nam predznak nije bitan), a da je njegova vjerovatnoa 0.000. Znai, moemo rei da se prosjeni rezultati znaajno razlikuju, odnosno da su studenti (najvjerovatnije) zbog pohaanja kursa engleskog jezika, unaprijedili svoje znanje.
66
SPSS za psihologe i pedagoge Test predznaka
67
Kad imamo dva zavisna uzorka, a koji ne zadovoljavaju uslove za primjenu parametrijskog testa za testiranje znaajnosti razlike, koristimo neparametrijski ekvivalent, a to je test predznaka (Sign Test). Ovaj test ne postavlja uslove u pogledu normalnosti distribucije, a mi emo za primjer uzeti isto ispitivanje kao i u poglavlju T test za zavisne uzorke, znai testiranje razlika u postignuu na testu engleskog prije i poslije kursa engleskog jezika na fakultetu. Izabraemo opciju Analyze/Nonparametric Tests/2 Related Samples, i u okvir Test Pair List unijeemo par varijabli ije vrijednosti poredimo (u naem sluaju to su skor.eng i sk.eng2). Sljedei korak je da odaberemo odgovarajui test, i to inimo tako to u donjem dijelu prozora izaberemo opciju Sign, a iskljuimo ostale opcije.
Nakon to potvrdimo svoj izbor sa OK, dobijamo sljedei ispis:

NPar Tests Sign Test
Frequencies N Rezultat testa iz engleskog poslije kursa - Rezultat testa iz engleskog prije kursa Negative Differences(a) Positive Differences(b) Ties(c) Total 6 209 1 216
a Rezultat testa iz engleskog poslije kursa < Rezultat testa iz engleskog prije kursa b Rezultat testa iz engleskog poslije kursa > Rezultat testa iz engleskog prije kursa c Rezultat testa iz engleskog poslije kursa = Rezultat testa iz engleskog prije kursa Test Statistics(a)
Rezultat testa iz engleskog poslije kursa - Rezultat testa iz engleskog prije kursa Z Asymp. Sig. (2-tailed) -13.776 .000
67

a Sign Test
68
Prva tabela (Frequencies) nas izvjetava o detaljima naih podataka. Poto se ovaj test bazira na poreenju veliina dvije varijable kod ispitanika, i sabiranju broja pozitivnih i negativnih razlika, u naem primjeru tabela nam govori sljedee: - sluajeva kad druga varijabla (u naem sluaju to su rezultati na testu poslije kursa) ima manju vrijednost (Negative Differences) ima 6 - sluajeva kad druga varijabla ima veu vrijednost (Positive Differences) ima 209 - jednakih vrijednosti obe varijable (Ties) ima 1 Druga Tabela nam govori o veliini statistika Z, koji uzima u obzir zbir razlika predznaka, (u naem sluaju 13.776) i njegovu vjerovatnou (u naem sluaju 0.000). Znai, moemo rei da su rezultati na testu iz engleskog kod naih ispitanika poslije kursa znaajno vei nego prije kursa.
68
SPSS za psihologe i pedagoge Znaajnosti razlika izmeu vie uzoraka Analiza varijanse
69
Analiza varijanse je statistika procedura koja nam omoguava da testiramo razlike izmeu aritmetikih sredina dvaju ili vie uzoraka. Kao primjer moemo uzeti sluaj kada elimo da poredimo postignua na nekom testu kod vie nezavisnih grupa ispitanika, to u naem sluaju moe biti postignue na testu iz engleskog jezika kod studenata tri razliita fakulteta. Ukoliko smo ve upoznati sa t-testom kao statistikom mjerom za poreenje aritmetikih sredina, mogli bismo zakljuiti da testiranje moemo obaviti i na taj nain, ali u sluaju kad imamo vie nezavisnih grupa broj poreenja ttestom moe biti veliki: ako imamo tri grupe, dobijamo tri para za poreenje, za etiri grupe tu je est parova za poreenje, i tako dalje. Reenica kojom bismo saeli ideju analize varijanse glasi: da li su varijacije izmeu grupa vee od varijacija unutar grupa koje poredimo? Statistika mjera variranja koju emo upotrijebiti u ovom sluaju je varijansa, koju dobijamo kad kvadriramo standardnu devijaciju: v =2 Primjer sluaja kad je varijansa izmeu grupa vea od unutargrupne varijanse, to bi znailo da grupe ne pripadaju istoj populaciji:
Primjer sluaja kad je varijansa izmeu grupa manja od unutargrupne varijanse, to bi znailo da grupe pripadaju istoj populaciji:
Znaajnost razlika izmeu aritmetikih razlika utvrujemo uz pomo F-testa, kojim utvrujemo odnos izmeu dviju varijansi:
69
70
Varijansa izmeu grupa F= Varijansa unutar grupa Analizu varijanse radimo uz pomo razlaganja ukupne varijanse na komponente, a sve to emo dobiti preko suma kvadrata odstupanja rezultata od aritmetikih sredina: SS T = SS w + SS b gdje su: SST ukupna suma kvadrata odstupanja SSw - suma kvadrata odstupanja unutar grupa SSb - suma kvadrata odstupanja izmeu grupa
Ako za primjer uzmemo sluaj testiranja razlika u postignuu na testu iz engleskog jezika izmeu 216 studenata tri fakulteta (naknadno emo isti ovaj primjer uraditi uz pomo SPSS-a): df Izmeu grupa (b) Unutar grupa (w) Ukupno (T)
2 (df =broj grupa 1) 215 (broj ispitanika 1) 217
Sume kvadrata odstupanja (SS)

145.007 1469.326 1614.333
Varijansa (v = SS/df)
72.503 6.898
72.503 = 10.51 6.898 Na osnovu odgovarajue tabele, koju moemo nai u osnovnim udbenicima iz statistike, oitavamo granice znaajnosti i donosimo zakljuak o statistikoj znaajnosti razlika. U sluaju da ustanovimo da je F statistik znaajan, onda trebamo utvrditi izmeu kojih grupa postoje znaajne razlike, da li izmeu svih moguih parova, ili samo izmeu nekih? Tada se koristimo t-testom, ili nekim od SPSS-ovih post-hoc testova za detekciju razlika izmeu pojedinanih parova poduzoraka. Na kraju izraunavamo F kroz formulu: F =
70
SPSS za psihologe i pedagoge Jednofaktorska univarijantna analiza varijanse za nezavisne uzorke Jednofaktorsku univarijantnu analizu varijanse radimo kad imamo jednu kategoriku varijablu (faktor) sa dva ili vie modaliteta, i drugu varijablu intervalnog nivoa i normalne raspodjele rezultata. Sada emo vidjeti kako emo statistiko testiranje obaviti uz pomo SPSS-a. Mi emo za primjer uzeti opet na test iz engleskog; porediemo postignue na testu iz engleskog jezika studenata razliitih fakulteta. Najjednostavniji nain da to uinimo jeste na sljedei nain: Idemo na Analyze/Compare Means/One Way ANOVA i u Dependent List unesemo nau zavisnu varijablu (skor na testu engleskog u naem sluaju), a pod Factorunesemo nezavisnu varijablu (fakultet u naem sluaju).
71
Specifinost analize varijanse jeste to da e nam ona za rezultat pokazati postoji li izmeu nekih grupa statistiki znaajna razlika, ali nam ne moe rei izmeu koji grupa. U naem primjeru varijabla fakultet ima 3 modaliteta (filozofski, medicinski i tehnoloki), i moe pojaviti do tri razlika (tri su mogua poreenja). No, ii emo korak po korak pa emo vidjeti ta emo dobiti. Kao ispis nae analize varijanse dobijamo:
Oneway
Descriptives

N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Lower Bound tehnoloski medicinski filozofski Total 72 72 72 216 23.174 22.604 24.556 23.444 2.6071 2.6122 2.6598 2.7402 .3072 .3078 .3135 .1864 22.561 21.990 23.931 23.077 Upper Bound 23.786 23.218 25.181 23.812 16.5 17.0 19.0 16.5 27.5 28.0 29.5 29.5 Minimum Maximum
ANOVA

Sum of Squares Between Groups Within Groups 145.007 1469.326 df 2 215 Mean Square 72.503 6.898 F 10.510 Sig. .000
71

Total 1614.333 216
72
Kao to smo navikli, prva tabela (Descriptives) nam daje deskriptivne podatke o naim poduzorcima. N je broj ispitanika, Mean je aritmetika sredina, a Std.Deviation standardna devijacija. U naem primjeru moemo vidjeti da su studenti filozofskog fakulteta postigli najvie, studenti tehnolokog fakulteta neto manje, a studenti medicinskog fakulteta najmanje rezultate na testu iz engleskog jezika. Druga tabela (ANOVA) nam daje rezultate testa: oitavamo vrijednost mjere F i njenu znaajnost. U naem sluaju F=10.510, a znaajnost je 0.000 (znai statistiki znaajno na nivou 0.01). Moemo rei da se statistiki znaajno razlikuju studenti ova tri fakulteta po postignuu na testu iz engleskog jezika. Ako elimo da znamo izmeu kojih fakulteta konkretno postoje razlike, to moemo uiniti uz pomo t-testa. Trebali bi se vratiti na poglavlje T-test za nezavisne uzorke i uraditi sve kako je tamo opisano, s tim da nam je nezavisna varijabla ovaj put fakultet, ije modalitete upisujemo pod Define Groups. Imaemo tri mogua poreenja: filozofski-medicinski, filozofski-tehnoloki i medicinski-tehnoloki. Ipak, za brzi uvid u te razlike posluiemo se opcijom Post Hoc kad radimo analizu varijanse (dugme pod tim nazivom u donjem dijelu prozora).
Ovde se nalazi grupa posthok testova za ispitivanje meugrupnih razlika. Iako se zasnivaju na razliitim matematikim procedurama, veina e nam dati sline rezultate. Mi emo izabrati LSD test i potvrditi na izbor sa Continue.
72
73
Kao rezultat emo dobiti iste dve tabele kao to je prethodno opisano za analizu varijanse, ali dobiemo i jednu dodatnu:
Post Hoc Tests
Multiple Comparisons
Dependent Variable: Rezultat testa iz engleskog LSD

95% Confidence Interval (I) FAKULTET tehnoloski medicinski filozofski (J) FAKULTET medicinski filozofski tehnoloski filozofski tehnoloski medicinski Mean Difference (I-J) .569 -1.382(*) -.569 -1.951(*) 1.382(*) 1.951(*) Std. Error .4377 .4377 .4377 .4377 .4377 .4377 Sig. .195 .002 .195 .000 .002 .000 Lower Bound -.293 -2.245 -1.432 -2.814 .519 1.089 Upper Bound 1.432 -.519 .293 -1.089 2.245 2.814
* The mean difference is significant at the .05 level.
Ova tabela e nam pokazati koji parovi fakulteta se porede (kolona Fakultet), kolika je razlika u prosjenom postignuu na testu (Mean Difference), i znaajnosti tih razlika (Sig.). U naem sluaju, vidimo da postoje znaajne razlike izmeu filozofskog i tehnolokog, filozofskog i medicinskog fakulteta, i to obe razlike znaajne na nivou 0.05. Razlika izmeu medicinskog i tehnolokog fakulteta nije statistiki znaajna. Kruskal Wallis test Ovaj test nam slui za utvrivanje znaajnosti razlika izmeu dve ili vie mjerenih osobina, kad podaci ne zadovoljavaju uslove za primjenu analize varijanse. Potrebno je da imamo jednu kategoriku varijablu sa dva ili vie modaliteta, i drugu varijablu bar ordinalnog tipa. Mi emo kao primjer istraivanje u kojem je ispitivano prihvatanje socijalnih odnosa sa Italijanima u vezi sa razliitim socio-demografskim varijablama. Nezavisna varijabla e nam biti stepen obrazovanja majke sa tri modaliteta (zavrena osnovna kola, srednja kola i via/visoka kola), a zavisna varijabla e nam biti broj prihvaenih odnosa sa Italijanima (ponueno je 7). Idemo na meni Analyze/Nonparametric Tests/K Independent Samples, i pod Test Variable List unesemo zavisnu varijablu, a pod Grouping Variable unesemo nezavisnu varijablu. Nakon toga je potrebno kliknuti na dugme Define Range i definisati koji je raspon vrijednosti nezavisne varijable. U naem sluaju to je od 1 do 3. Pod okvirom Test Typeimamo ponuena tri testa, ali mi biramo Kruskal-Wallis H test.
73
74
Nakon to smo sve obavili, dobijamo sljedei ispis u Output prozoru:

NPar Tests Kruskal-Wallis Test
Ranks strucna sprema majke OS SS VS ili VSS Total N 51 231 123 405 Mean Rank 209.82 198.44 208.73
Prihvatanje odnosa sa Italijanima
Test Statistics(a,b) Prihvatanje odnosa sa Italijanima Chi-Square df Asymp. Sig. .839 2 .657
a Kruskal Wallis Test b Grouping Variable: strucna sprema majke
Prva tabela (Ranks) nas izvjetava o broju ispitanika u pojedinim grupama naeg uzorka, i prosjenim rangovima zavisne varijable. Druga tabela (Test Statistics) nam daje mjeru 2 (hi na kvadrat, Chi-Square) i njenu znaajnost (Asymp. Sig.). U naem sluaju vidimo da je 2 =0.839 i da nije statistiki znaajno (vjerovatnoa vea od 0.05 i 0.01), to bi znailo da ne postoje znaajne razlike u pogledu prihvatanja socijalnih odnosa sa Italijanima izmeu grupa ispitanika iji oevi su razliito obrazovani. Dvofaktorska univarijantna analiza varijanse Dvofaktorsku univarijantnu analizu varijanse primjenjujemo kad za nezavisne varijable imamo dve kategorike varijable, i jednu zavisnu kvantitativnu varijablu. Mi emo kao primjer uzeti fiktivno istraivanje u kojem je za zavisnu varijablu uzeta izraenost osobine depresivnosti, a za zavisne su uzeti pol i zaposlenost. Znai, pitanja su: da li izraenost depresivnost zavisi od pola, zaposlenja ili od kombinacije ova dva
74
75
faktora? Kombinacija faktora u analizi varijanse naziva se interakcija faktora. Potrebno je rei da su nai faktori neponovljeni, to znai da svaki ispitanik ima kombinaciju ove dvije odlike: odreenog je pola i ima odreeno radno stanje (zaposlen ili nezaposlen) Vidjeemo da postoji i analiza varijanse za ponovljene faktore.. Idemo na meni Analyze/General Linear Model/Univariate, i pod Dependent Variable unosimo zavisnu varijablu (depresivnost u naem sluaju), a pod Fixed Factor(s) unosimo nezavisne varijable.
Sljedei korak nam da idemo na dugme Options s desne strane prozora, i tu treba da meu opcijama u okviru Display odaberemo descriptives. Time emo dobiti osnovne deskriptivne mjere za podgrupe naeg uzorka.
75
SPSS za psihologe i pedagoge Dalje, zgodno je da imamo i nekakav grafiki prikaz naih rezultata, jer e nam to pomoi pri tumaenju. To emo uraditi kroz dugme Plots. Dolazimo do prozora gdje trebamo odrediti varijable koje e odrediti na grafikon. Ukoliko imamo dve varijable, upisujemo ih u okvire Horizontal Axis i Separate Lines (gdje e ii koja varijabla zavisi od istraivakih potreba). Na kraju je neophodno da pritisnemo dugme Add (nakon toga bi se trebale pojaviti ove varijable u donjem okviru Plots) inae SPSS nee upamtiti na izbor.
76
Nakon to smo obavili sve, dobijamo sljedei ispis:

Univariate Analysis of Variance
Between-Subjects Factors Value Label POL ZAPOSLEN 1 2 1.00 2.00 muski zenski zaposlen nezaposlen N 88 128 99 117
Descriptive Statistics
Dependent Variable: depresivnost

POL muski ZAPOSLEN zaposlen nezaposlen Total zenski zaposlen nezaposlen Total Total zaposlen nezaposlen Total Mean 22.2969 23.5833 22.6477 23.3143 24.2473 23.9922 22.6566 24.1111 23.4444 Std. Deviation 2.16340 2.72535 2.38429 2.38896 2.96595 2.84161 2.28644 2.91925 2.74017 N 64 24 88 35 93 128 99 117 216
Tests of Between-Subjects Effects
76

Dependent Variable: depresivnost
Source Corrected Model Intercept POL ZAPOSLEN POL * ZAPOSLEN Error Total Corrected Total Type III Sum of Squares 145.286(a) 90372.098 29.261 50.987 1.293 1469.047 120337.000 1614.333 df 3 1 1 1 1 212 216 215 Mean Square 48.429 90372.098 29.261 50.987 1.293 6.929 F 6.989 13041.706 4.223 7.358 .187 Sig. .000 .000 .041 .007 .666
77
a R Squared = .090 (Adjusted R Squared = .077)
Profile Plots
Estimated Marginal Means of depresivnost

24.5
24.0
Estimated Marginal Means
23.5
23.0
ZAPOSLEN
22.5 zaposlen 22.0 muski zenski nezaposlen
POL
Iz prve tabele (Between-Subjects Factors) vidimo kako se rasporeuju ispitanici po kategorijama pojedinih varijabli. Sljedea tabela (Descriptive Statistics) nam ve daje bitnije podatke. Iz nje ve vidimo da (kolona Means) muki nezaposleni imaju vie izraenu depresivnost od mukih zaposlenih, da enski nezaposleni imaju vie izraenu depresivnost od enskih zaposlenih, da ene imaju imaju viu depresivnost od mukih, a nezaposleni veu od zaposlenih. Takoe, u koloni N moemo vidjeti i da je u okviru mukih vei procenat ispitanika zaposlen, a u okviru enskih vei procenat je nezaposlen. Sljedea tabela (Tests of Between-Subjects Effects) nam daje podatke o statistikim znaajnostima. Nas zanimaju redovi u kojima pie POL, ZAPOSLEN i POL*ZAPOSLEN, i kolone F i Sig. U okviru reda POL vidimo da je mjera F=4.223 i da je statistiki znaajno na nivou 0.05, a u redu ZAPOSLEN da je F=7.358 i da je znaajno na nivou 0.01. Ovo su glavni efekti pola i zaposlenja na depresivnost i, kao to vidimo, oba su znaajna: u naem uzorku ene su depresivnije, i nezaposleni su depresivniji. Red ispod njih je interakcija pola i zaposlenosti (POL*ZAPOSLEN) i F je 0.187 a njegova znaajnost vea od 0.05, to bi za nas znailo da nema interakcije izmeu pola i zaposlenosti u pogledu uticaja na depresivnost. Grafikon na kraju (Estimated Marginal Means of depresivnost) nam daje grafiki prikaz onoga to smo imali u tabeli Descriptive Statistics. Sa vremenom, kako budemo primjenjivali analize varijanse, vidjeemo da nam paralelnost linija govori o
77
78
tome da ne postoji interakcija faktora (kad su ukrtene postoji), dok nam razmaknutost i nagib linija govore o glavnim efektima (uticaju pojedinih nezavisnih varijabli).
78
79
Analize kategorikih varijabli

U psihologiji, kao i ostalim drutvenim naukama, veina pojava koje pokuavamo da registrujemo ima diskretni (isprekidani, kategorijalni) karakter. Tako veina podataka koje skupimo u istraivanju sainjavaju upravo takvi podaci: sociodemografski podaci kao to su pol, uzrasne ili obrazovne skupine, a i razni anketni podaci. Hi-kvadrat test Za podatke koji potiu sa nominalne skale postoje posebne statistike procedure osloboene od striktnih pretpostavki o distribuciji mjera (kao npr. Pretpostavka o normalnoj raspodjeli mjera). Najrairenija je upotreba mjere 2 (grko slovo hi, na engleskom Chi Square). 2 nam slui da testiramo odstupanje dobijenih frekvencija od nekih oekivanih (teorijskih) vrijednosti.
fe Ovo je matematiki izraz za izraunavanje hi-kvadrata, gdje fo predstavlja dobijene frekvencije (o skraeno od observed na engleskom), dok fe predstavlja teorijski pretpostavljene, odnosno oekivane frekvencije (e skraeno od expected na engleskom). Te oekivane vrijednosti mogu biti zadate po nekom ranije zamiljenom modelu, to moe biti pretpostavka o jednakoj raspodjeli podataka u elijama tabele, ili o normalnoj raspodjeli, ili o bilo kakvoj drugaijoj raspodjeli frekvencija. Znai, kad imamo jednu varijablu sa vie modaliteta, onda moramo dati neku pretpostavku o tome kako mislimo da e se rasporeivati frekvencije po modalitetima varijable. Na kraju emo, na osnovu rezultata hi-kvadrat testa, zakljuiti da li opaene frekvencije odstupaju od oekivanih, odnosno da li je ispravna naa hipoteza. Vidjeemo kako to izgleda na primjeru analize jednog zamiljenog anketnog rezultata, gdje 60 ispitanika odgovaralo na pitanje: Da li se zalaete za civilno sluenje vojnog roka?, a ponueni su odgovori: da, nisam siguran i ne. Mi smo pretpostavili da e se odgovori ispitanika podjednako raspodijeliti u sve tri kategorije. fo Da Nisam siguran Ne 30 15 15 20 20 20 fe 10 -5 -5 (fo- fe) (fo- fe)2 100 25 25 (fo- fe)2 /fe 5 1.25 1.25 2=7.5
=
2
( fo fe ) 2
Broj stepeni slobode se rauna po obrascu: df = (broj kolona 1) x (broj redova 1), i u naem sluaju to je: (2-1)x(3-1) = 2. Iz tablica oitavamo granine vrijednosti odgovarajuih intervala sigurnosti: 5.99 (p=0.05) i 9.21 (p=0.01). Na osnovu datih granica i veliine dobijenog hi-kvadrata moemo zakljuiti da dobijene frekvencije odstupaju znaajno od oekivanih na nivou 0.05. U tabelama ukrtanja vie varijabli (u daljem tekstu emo tabele podataka nastale ukrtanjem kategorikih varijabli nazivati kontingencijskim tabelama) oekivane vrijednosti se obino raunaju putem kalkulisanja sa zbirovima redova i kolona. Ukoliko se pokae da je koliina odstupanja dovoljno velika, prihvatamo
79
80
hipotezu o znaajnom odstupanju od oekivanih vrijednosti. Postoje situacije kad primjena hi kvadrata ne daje pouzdane rezultate, a to je sluaj kad u kontingencijskoj tabeli postoji preko 20% elija sa oekivanim frekvencijama 5 ili manje, ili kad je jedna od oekivanih frekvencija manja od 1. U tim sluajevima se obino radi saimanje veeg broja kategorija varijable na manji broj, ili ako je u pitanju tabela 2x2 (znai, ne moe se vie smanjivati), onda se radi statistiki postupak nazvan Yates-ova korekcija. Korelacije kategorikih varijabli Kao to smo vidjeli, 2 nam moe posluiti za testiranje znaajnosti odstupanja, ali da bismo vidjeli kolika je povezanost izmeu dvije kategorike varijable posluiemo se koeficijentom korelacije za tabele veliine 2x2, i C koeficijentom kontingencije za vee tabele. Obe ove mjere korelacije se izraunavaju na osnovu hikvadrata, i to po sljedeim formulama:
2 N 2 N + 2
C=
Kao primjer kojim emo sve ovo ilustrovati u SPSS-u, moemo uzeti vezu izmeu pola i radnog statusa (posjedovanja zaposlenja) u nekom fiktivnom ispitivanju. Obe varijable imaju po dva modaliteta: muko-ensko i zaposlen-nezaposlen. Idemo na Analyze/Descriptive Statistics/Crosstabs i u okvire Row(s) i Column(s) unesemo nae varijable. Trei okvir Layer nam slui za prikaze ukrtanja vie od dvije varijable. Poniene su nam i opcije za grafiki prikaz (Display clustered bar charts) i opcija za eliminisanje frekvencijskih tabela iz prikaza (Suppress tables) tako da vidimo samo statistike mjere i grafikone. Za nas e biti znaajna dva dugmeta u donjem dijelu prozora: Statistics i Cells.
80
81
Pritisnuvi dugme Statistics dolazimo do prozora za izbor statistikih mjera koje eli. Na poetku nije odabrana ni jedna, pa treba da se odluimo. Tu su razne vrste statistikih mjera za nominalne i ordinalne mjere. Biramo Chisquare i Phi and Cramer's V jer imamo tabelu tipa 2x2. Kad imamo veu tabelu, rekli smo, kao mjeru korelacije uzimamo C koeficijent (Contingency coefficient).
Dugme Cells nas vodi do prozora za izbor onoga to e biti prikazano u kontingencijskim tabelama. U okviru Counts biramo Observed (dobijene frekvencije), a ponuen je i prikaz oekivanih frekvencija (Expected). U okviru Percentages moemo da biramo da li emo vidjeti prikaz procenata, i koji tip prikaza: u odnosu na red (Row), kolonu (Column), ili ukupan broj (Total). U naem primjeru odluili smo se za procentualni prikaz po redovima.
Kad smo sve potvrdili sa Continue i OK i dobijamo sljedei ispis:

Crosstabs
POL * ZAPOSLEN Crosstabulation ZAPOSLEN zaposlen POL muski Count 64 nezaposlen 24 Total 88
81

% within POL Count % within POL Count % within POL 72.7% 35 27.3% 99 45.8% 27.3% 93 72.7% 117 54.2% 100.0% 128 100.0% 216 100.0%
82
zenski
Total
Chi-Square Tests Asymp. Sig. (2sided) 1 1 1 1 .000 .000 .000 .000 43.063 216 .000 .000 Exact Sig. (2sided) Exact Sig. (1sided)
Value Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases 43.264(b) 41.455 44.628
df
a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 40.33. Symmetric Measures
Value Nominal by Nominal N of Valid Cases Phi Cramer's V .448 .448 216
Approx. Sig. .000 .000
a Not assuming the null hypothesis. b Using the asymptotic standard error assuming the null hypothesis.
Prva tabela (POL * ZAPOSLEN Crosstabulation) nas izvjetava o distribuciji frekvencija u pojedinim elijama tabele. Takoe, tu su i procentualni podaci dati za redove tabele. U naem primjeru, ve na prvi podgled vidimo da se zaposlenost distribuira nejednako po kategorijama pola: kod ena je vie nezaposlenih, a kod mukaraca vie zaposlenih. Moemo da pogledamo sljedeu tabelu (Chi-Square Tests) i oitamo veliinu hi kvadrata (Pearson Chi-square): 43.264. Njegova znaajnost (Asymp. Sig 2-sided) nam kazuje da je znaajan na nivou 0.01. Znai na osnovu veliine hi kvadrata zakljuujemo da su odstupanja dobijenih podataka znaajna na nivou 0.01, a da bismo vidjeli da li postoji neka pravilnost u tim odstupanjima pogledaemo brojke u sljedeoj tabeli (Symmetric Measures). Tu oitavamo veliinu Phi i vidimo da iznosi 0.448 i da je znaajno na nivou 0.01. To je mjera povezanosti vrijednosti ove dvije varijable (pola i zaposlenosti) i za nju moemo rei da je srednjeg intenziteta. Pol i zaposlenost, u naem primjeru, koreliraju u srednjoj mjeri, ali statistiki znaajno na nivou 0.01.
82
83
Mjere korelacije
Korelacija predstavlja mjeru povezanosti izmeu varijabli. Karakteristike korelacije koje treba poznavati su visina ili jaina (od 0 do 1), smijer (+ ili -), i statistika znaajnost. Visine korelacije aproksimativno ocjenjujemo kao: r od 0 do 0.20 nikakva do neznatna povezanost r od 0.20 do 0.40 niska povezanost r od 0.40 do 0.60 povezanost srednjeg intenziteta r od 0.60 do 0.80 visoka povezanost r od 0.80 do 1 veoma visoka do apsolutna povezanost Svakako treba imati na umu da korelaciju ne treba mijeati sa uzrono posljedinom vezom, mada je to najea greka koja se sree u interpretacijama rezultata istraivanja: ukoliko su dvije varijable u korelaciji, to nikako ne znai da promjene jedne varijabla uzrokuju promjene druge varijable. Ve smo imali priliku da se u poglavlju sa opisom analize kategorikih varijabli sretnemo sa koeficijentima korelacije izmeu kategorikih varijabli: bili su to i C koeficijenti korelacija. Vidjeemo jo kako moemo dobiti Pearsonov koeficijent linearne korelacije, Spearmanov koeficijent rang korelacije, i koeficijent biserijske korelacije. Koeficijent linearne korelacije Pearsonov koeficijent linearne korelacije predstavlja parametrijski test, i stoga mora da zadovolji uslove intervalnosti podataka, normalnosti raspodjele, i linearnosti odnosa izmeu varijabli. Osnovna formula za izraunavanje Pearsonovog koeficijenta je:
rXY =
x
X
y Y
N 1
, gdje su: x = X MX i y = Y MY (odstupanja od AS)
Odreenim transformacijama osnovne formule dolazimo do sljedee formule za izraunavanje korelacije iz sirovih skorova, takozvane mainske formule: rXY =
[N X
N XY ( X )( Y )
2 2
( X ) N Y 2 (Y )
][
Prednost ove formule je u tome to je jedino potrebno da znamo sirove skorove X i Y, i nisu nam potrebne standardne devijacije. Linearnost veze izmeu varijabli do sada nismo sretali, a najlake ga utvrujemo uvidom u grafiki prikaz rasprenja parova taaka (skater grafikon). Ukoliko vidimo da se odnos izmeu varijabli ne moe priblino predstaviti pravom linijom, onda je bolje da ne koristimo koeficijent linearne korelacije.
83
SPSS za psihologe i pedagoge Ako za primjer uzmemo nae podatke o rezultatima testa znanja iz engleskog jezika (za koje smo ve vidjeli da ispunjavaju uslov normalnosti raspodjele), da bismo grafiki ustanovili linearnost odnosa, idemo na meni Graphs/Scatter, izaberemo opciju Simple i kliknemo na dugme Define.
84
Tako smo doli do dijalog prozora u kojem treba da odredimo dvije varijable iji grafikon emo vidjeti. Nae varijable ubacujemo u polja Y Axis i X Axis (u naem sluaju to su varijable sk.eng2 i sk.eng), i sve to treba da uradimo je da potvrdimo sa OK.
Dobijamo grafikon na kojem vidimo kako se distribuiraju rezultati na dva testa koje analiziramo. Vidimo da nema velikih odstupanja, i da rezultati ine priblino ravnu liniju, to nam govori da ima smisla da raunamo koeficijent linearne korelacije. Primjeri odstupanja od linearnosti bi bile krive koje izgledaju kao , , , , , ili na druge naine razliito od ravne linije.
84

40
85
Rezultat testa iz engleskog poslije kursa
30
20
10 16 18 20 22 24 26 28 30
Rezultat testa iz engleskog prije kursa
Da bismo izraunali Pearsonov koeficijent, idemo na Analyze/Correlate/Bivariate. Za poetak je ve oznaena kuica Pearson i Two-tailed significance, i tako treba i da ostavimo. Varijable ije korelacije elimo da vidimo ubacujemo u desni okvir (u naem sluaju to su varijable sk.eng2 i sk.eng), i potvrdimo sa OK.
Za ispis dobijamo sljedeu tabelu:

Correlations SKOR.ENG Rezultat testa iz engleskog prije kursa 1 . 216 .914(**) .000 216 SK.ENG2 Rezultat testa iz engleskog poslije kursa .914(**) .000 216 1 . 216
SKOR.ENG Rezultat testa iz engleskog prije kursa SK.ENG2 Rezultat testa iz engleskog poslije kursa
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
** Correlation is significant at the 0.01 level (2-tailed).
85
86
Poto moemo odjednom da ubacimo u obradu vie od dvije varijable, program nam daje ispis tabele sa svim moguim korelacijama, pa tako i svake varijable sa samom sobom, to nam daje korelaciju 1, tako da dijagonalu tabele moemo da ignoriemo. Pored visine korelacije date u redu Pearson Correlation, dobijamo i znaajnost korelacije u redu Sig. (2-tailed), i broj ispitanika uzetih u obradu N. Znaajnost korelacije nam je prikazana i u formi zvjezdica pored same korelacije. Po obiaju, jedna zvjezdica znai da je korelacija znaajna na nivou 0.05, a dvije zvjezdice govore o znaajnosti na nivou 0.01. U naem primjeru vidimo da je korelacija pozitivna i veoma visoka, itavih 0.914. Znajui da su u pitanju rezultati testa iz engleskog jezika prije i poslije kursa, zakljuujemo da su studenti linearno napredovali, i to tako da su oni koji su bili bolji na prvom testu bivali bolji i na drugom, a i oni koji su bili srednji i loiji takoe su napredovali. Sam koeficijent korelacije i njegova znaajnost nam ne govore da postoji bilo kakav napredak, ali to moemo vidjeti iz grafikona, jer u sluaju da napretka nema, skater (takasti prikaz korelacije) bi kretao iz nule i iao po dijagonali dijagrama, to bi govorilo o slinim rezultatima na oba testa. Koeficijent rang korelacije Spearmanov koeficijent rang korelacije (, ita se: ro) je neparametrijski test i ne postavlja zahtjeve u pogledu distribucije, jedino to treba da imamo jesu podaci koji potiu bar sa ordinalne skale, tj. rangovani podaci. Znai, ovaj test moemo upotrebljavati kad u poetku imamo rangovane podatke, a tako i kada imamo podatke koji nisu rangovani, ali ne zadovoljavaju uslove normalne raspodjele. Kao posljedicu nieg mjernog nivoa, imamo to da je ova mjera korelacije nepreciznija od r koeficijenta korelacije. Raunanje koeficijenta se zasniva na razlikama u rangovima rezultata dva niza brojeva, a formula po kojoj se rauna je:
= 1
N N 2 1
6 D 2
gdje je: D razlika izmeu rangova na prvoj i drugoj varijabli N ukupan broj sluajeva Za primjer emo uzeti situaciju kad je nastavnik jednog razreda srednje kole elio da vidi da li postoje povezanosti izmeu uspjeha iz predmeta Matemetika, Fizika i Istorija. On je uenike rangirao po uspjesima iz ova tri predmeta i poredio ih meusobno, a mi emo to uraditi u SPSS-u na sljedei nain: Kao i kod sluaja linearne korelacije idemo na Analyze/Correlate/Bivariate, u desni okvir ubacimo varijable, ali ovaj put oznaimo kuicu Spearman. Mi smo ubacili tri varijable, to znai da emo imati tri mogua poreenja. Na kraju emo, naravno, potvrditi sa OK, i idemo ka analizi ispisa.
86
87
Correlations MATEMATI Spearman's rho MATEMATI Correlation Coefficient Sig. (2-tailed) N FIZIKA Correlation Coefficient Sig. (2-tailed) N ISTORIJA Correlation Coefficient Sig. (2-tailed) N ** Correlation is significant at the 0.01 level (2-tailed). 1.000 . 35 .759(**) .000 35 -.007 .967 35 FIZIKA .759(**) .000 35 1.000 . 35 .113 .517 35 ISTORIJA -.007 .967 35 .113 .517 35 1.000 . 35
Sve vai kao i u sluaju linearne korelacije: program nam je dao sve mogue korelacije, a mi gledamo one tri koje nas zanimaju. Iz tabele vidimo da korelacija izmeu uspjeha u matematici i fizici iznosi 0.759, i da je statistiki znaajna na nivou 0.01. Takoe, vidimo da korelacije izmeu uspjeha iz matematike i istorije gotovo da nema (iznosi 0.007), a da izvjesne pozitivne korelacije izmeu uspjeha u fizici i istoriji ima (iznosi 0.113), ali da nije statistiki znaajna. Biserijska i point-biserijska korelacija Biserijsku korelaciju raunamo kad imamo dvije varijable od kojih je jedna kvantitativnog tipa (intervalni nivo podataka), a druga je vjetaki dihotomizirana u varijablu sa samo dva modaliteta. Kao primjer nam moe posluiti imaginarni sluaj kad elimo da vidimo da li postoji veza izmeu optih intelektualnih sposobnosti (inteligencije) i prolaznosti na ispitu iz matematike. Point-biserijska korelacija je vrlo slian sluaj, ali ovaj put jedna varijabla je intervalnog nivoa, a druga je prirodno podijeljena u dvije kategorije (npr. pol). U oba sluaja, najlake je da u okviru SPSS-a ovu proceduru radimo kao i koeficijent linearne korelacije. Za primjer smo uzeli sluaj korelacije izmeu optih sposobnosti i prolaznosti na ispitu iz matematike. Sposobnosti smo mjerili jednim
87
88
standardizovanim testom inteligencije, a onda smo na ispitu iz matematike registrovali ko je proao a ko nije. Kao i u sluajevima prethodne dvije korelacije, idemo na Analyze/Correlate/Bivariate, i moemo da ostavimo oznaenu kuicu Pearson. Unesemo u desni okvir nae dvije varijable i potvrdimo sa OK.
Nakon toga dobijamo sljedeu tabelu sa rezultatima:

Correlations MATEMAT MATEMAT Pearson Correlation Sig. (2-tailed) N SPOSOBNO Pearson Correlation Sig. (2-tailed) N 1 . 100 .416(**) .000 SPOSOBNO .416(**) .000 100 1 . 100
100 ** Correlation is significant at the 0.01 level (2-tailed).
U naem fiktivnom primjeru, na uzorku od 100 studenata traili smo vezu izmeu optih sposobnosti i prolaznosti na ispitu iz matematike. Iz tabele moemo vidjeti da korelacija iznosi 0.416, pozitivna je i statistiki znaajna na nivou 0.01. Znai, mogli bismo rei da postoji srednja pozitivna i statistiki znaajna korelacija izmeu optih sposobnosti i prolaznosti na ispitu iz matematike.
***********************************************************
88
89
Kratak pregled opcija programa

U menijima koji su prikazani, trenutno dostupne opcije su ispisane crnom bojom, dok su zasivljene opcije koje trenutno nisu dostupne. Znai, kad nemamo otvorene podatke - nemamo na raspolaganju opcije Save ili Save As, tj nemamo ta da snimimo.
File meni
U file meniju se nalazi skup naredbi za otvaranje i uvanje fajlova sa podacima. Opcije koje postoje su: New, sa podopcijama Data, Syntax, Output i Script - slui nam za otvaranje novog prozora za razne tipove podataka. Data - sirovi podaci koje unosimo u matricu podataka Syntax - komandni reim u kojem unosimo niz naredbi za manipulaciju podacima - znai, SPSS ima i poseban komandni jezik Output - prozor za prikaz rezultata obrade podataka Script - slino Syntax reimu, ali ovaj put je u pitanju skript za automatizaciju niza nekih procesa koje esto redom obavljamo Open - koristimo za otvaranje ranije snimljenih fajlova (baza podataka, ispisa rezultata, komandnih programa). Read ASCII Data - otvaranje fajlova sa sirovim podacima koji su snimljeni u tekstualnom obliku. Close - zatvaranje prozora. Save - snimanje podataka. Koristimo ako smo ve ranije dali ime fajlu. Save As... - snimanje novih podataka sa odredjivanjem imena i tipa fajla. Export - snimanje tabela, grafikona i rezultata obrade u drugim formatima, tako da ih moemo otvoriti u drugim programima. Display Data Info... - prikazuje informacije o fajlu koji izaberemo. Apply Data Dictionary - prebacuje ve postojee definicije podataka (varijable, kategorije...) na nove datoteke. Print - tampanje. Kad izaberemo ovu opciju moi emo da biramo izmedju tampanja svega (All) ili samo onog to selektujemo (Selection). Ovde, takodje, odredjujemo i broj kopija koje tampamo.
89
90
Stop SPSS Processor - prekida proces obrade koji je aktivan, koji se u tom trenutku odvija. Exit SPSS - izlazak iz programa.
Edit meni
U ovom meniju se nalaze opcije za operacije sa tekstom i podeavanje programa naim potrebama. Undo - ponitava zadnju obavljenu operaciju. Cut, Copy, Paste, Clear - standardne Windows operacije za isjecanje, kopiranje, lijepljenje i brisanje selektovanih sadraja. Find... - pronalaenje podataka ili teksta. Options... (u nekim verzijama programa "Preferences") - podeavanje opcija programa.
Za nas e u ovom trenutku biti zanimljivo jedino da se pod opcijom General, pa u okviru nje pod "Display Order for Variable Names" moe podesiti redoslijed varijabli koje smo unosili (alfabetski ili onako kako smo ih unosili), i da se pod opcijom Pivot Tables podeava tip tabela u kojima se prikazuju rezultati (uvijek je korisno smanjiti veliinu tabela, jer su esto prevelike da bi stale na jedan ekran). Kad radimo u prozoru Output, imamo jo neke opcije u meniju Edit (Copy Objects, Paste After, Paste Special...), ali to su neke naprednije opcije, te ih ovde neemo detaljnije razmatrati.
View meni
Pod ovim menijem biramo opcije za ono ta emo vidjeti na ekranu. Status Bar - odredjuje da li emo u dnu ekrana imati ispisan trenutni status programa. Kad nita ne radimo od operacija, tu obino pie "SPSS Processor is ready", a kad je neka operacija aktivna obino pie "Running..." i vrsta operacije. Toolbars - pod ovom opcijom definiemo ta e od brojnih mogunosti programa biti dostupno u vidu dugmia ispod menija. Fonts, Grid Lines i Value Labels - odredjuju izgled matrice podataka.
90
91
Kad je aktiviran prozor Output, imamo jo opcije Expand, Collapse, Show i Hide koje se odnose na vidljivost objekata u Output prozoru (takodje i Outline Size i Outline Font).
Data meni
U Data meniju imamo niz opcija za definisanje varijabli i manipulaciju podacima. Define Variable - definisanje varijabli. U odjeljku Unos podataka e biti detaljnije obradjene podopcije. Define Dates - definiemo format datuma (ukoliko unosimo podatke vezane za vrijeme). Templates - ukoliko imamo ranije napravljene ablone za definisanje varijabli, ovde ih biramo. Insert Variable - umee novu varijablu ispred one koja je trenutno selektovana. Insert Case - umee novi red (sluaj, ispitanik...) iznad trenutno selektovanog. Go to Case - odvodi nas na traeni sluaj. Sort Cases - sortira redove (uzlazno ili silazno) po vrijednostima neke varijable. Transpose - pravi novu matricu podataka tako to redove pretvara u kolone. Merge Files - spajanje datoteka. Podopcije su "Add Cases" (dodaje ispitanike, sluajeve) i "Add Variables" (dodaje varijable). Aggregate - spajanje podataka tako da grupe ispitanika ine jedan zbirni sluaj u okviru nove datoteke. Orthogonal Design - (tie se faktorske analize i spada u napredne statistike operacije) Generate - pravi novu datoteku koja sadri dizajn ortogonalnih glavnih efekata koji dozvoljava statistiko testiranje nekoliko faktora bez testiranja svih kombinacija faktorskih nivoa. Display - prikazuje eksperimentalni nacrt koji je napravljen uz pomo Generate, ili bilo koji drugi nacrt u okviru radne datoteke. Split File - pravi podjelu u okviru datoteke (grupie ispitanike) po vrijednostima varijable koju odredimo. Select Cases - selektuje ispitanike prema vrijednostima neke varijable, oni koji nisu selektovani izbaeni su iz dalje analize.
91
92
Weight Cases - ponderisanje (opereivanje) ispitanika. Simulira se replikacija ispitivanja, i to u zavisnosti od vrijednosti izabrane varijable. Vrijednosti ponder varijable govore o navodnom broju opservacija. Iz dalje obrade se izbacuju ispitanici koji imaju 0, negativnu vrijednost ili nedostajui podatak.
Transform meni
Ovaj meni nam omoguava razne transformacije podataka.
Compute - kreira novu varijablu razliitim oblicima izraunavanja na osnovu vrijednosti ve postojeih varijabli. Random Number Seed - podeavanje generatora sluajnih brojeva. Count - kreira varijablu u okviru koje se nalaze prebrojane iste vrijednosti koje se nalaze u okviru raznih varijabli. Npr. ukoliko imamo nekoliko varijabli koje govore o tome da li ispitanici gledaju ili ne gledaju neke TV stanice (npr. 1 znai da, a 0 ne), pa na kraju elimo da znamo koliko ispitanik ukupno gleda TV stanica, iskoristiemo Count. Recode - rekodiranje (ponovno kodiranje na drugaiji nain) vrijednosti varijable. Rank Cases - kreira novu varijablu koja sadri rangovane vrijednosti izabrane varijable. Automatic Recode - kreira novu varijablu i automatski rekodira sadraj neke string (slovne) ili brojane varijable u sekvencijalne vrijednosti. Replace Missing Values - popunjava elije kod kojih postoji nedostajui podatak.
Analyze meni
Budui da je SPSS modularno organizovan program (sastavljen je iz vie dijelova koje moete instalirati - prema vaim potrebama, a u zavisnosti od toga bie dostupan razliit broj statistikih procedura), broj statistikih operacija koje moete vidjeti u Statistics meniju moe da varira. Ja u u ovom trenutku samo nabrojati koje su to operacije dostupne kad su instalirani svi moduli: Summarize - sumarne procedure Frequences - prikazuje frekvencije, procente i osnovne mjere devijacija i centralnih tendencija
92
93
Descriptives - prikazuje deskriptivne mjere (minimalnu i maksimalnu vrijednost, neke od mjera devijacija i aritmetiku sredinu) Explore - razne zbirne mjere i grafiki prikazi, za sve ispitanike ili za podgrupe ispitanika Crosstabs - krostabulacije, tabelarni prikazi ukrtanja varijabli - uz to idu i brojne deskriptivne i statistike procedure Case Summaries - statistike mjere za podgrupe ispitanika grupisanih po kategorijama neke varijable Report Summaries in Rows - prikazuje ispis gdje se sumarne mjere pojavljuju u redovima Report Summaries in Columns - prikazuje ispis gdje se sumarne mjere pojavljuju u kolonama Custom Tables - razne vrste tabelarnih prikaza rezultata Basic Tables - krostabelarni prikazi i statistike mjere General Tables - krostabelarni prikazi i statistike mjere Tables of Frequencies - krostabelarni prikazi frekvencija i procenata Compare Means - poredjenje aritmetikih sredina Means - rauna aritmetike sredine (i druge statistike mjere) za zavisne varijable unutar grupa koje odredimo kategorijama nezavisne varijable. Opciono moemo da dobijemo i univarijantnu analizu varijanse. One-Sample T Test - testira da li aritmetika sredina jedne varijable znaajno odstupa od konstante koju odredimo Independent-Samples T Test - t test za nezavisne uzorke (testira znaajnost razlika izmedju aritmetikih sredina dvaju nezavisnih uzoraka) Paired-Samples T Test - t test za zavisne uzorke (testira znaajnost razlika izmedju aritmetikih sredina dvaju zavisnih uzoraka - usti uzorak u dva mjerenja ili upareni ispitanici) One-Way ANOVA - univarijanta analiza varijanse (testira znaajnost razlika izmedju aritmetikih sredina dvaju ili vie uzoraka) General Linear Model - analiza varijanse (ANOVA) i analiza kovarijanse (ANCOVA) Simple Factorial - analiza varijanse za faktorijalni dizajn GLM-General Factorial - regresiona analiza i analiza varijanse GLM-Multivariate - regresiona analiza i analiza varijanse vie zavisnih varijabli GLM-Repeated Measures - analiza grupe zavisnih varijabli koje sadre razliita mjerenja istog atributa Variance Components Correlate - korelacije Bivariate - rauna Pirsonov, Spirmanov i Kendalov koeficijent korelacije Partial - daje koeficijent korelacije uz kontrolu jedne ili vie dodatnih varijabli Distances - daje statistike mjere mjerei slinosti ili razlike parova varijabli ili ispitanika Regression - daje regresione koeficijente Linear - rauna koeficijent linearne regresije koji najbolje predvidja vrijednost zavisne varijable, poznavajui vrijednosti jedne ili vie nezavisnih varijabli
93
94
Curve Estimation - ova procedura daje procjene regresijskih mjera za 11 razliitih modela procjene regresionih funkcija Logistic - koristimo kad hoemo da predvidimo prisustvo ili odsustvo neke karakteristike na osnovu grupe prediktorskih varijabli Probit - mjeri povezanost izmedju jaine stimulusa i proporcije sluajeva istovjetnih odgovora na stimulus Nonlinear - nalazi nelinearni model povezanosti izmedju zavisne i nezavisnih varijabli Weight Estimation - kad se ne pretpostavlja konstantna veliina varijanse unutar populacije koju tretiramo 2-Stage Least Squares - kad se pretpostavlja da greke unutar zavisne varijable koreliraju sa nezavisnim varijablama Loglinear - viestruke frekvencijske analize General - opta viestruka frekvencijska analiza Logit - kad jednu od kategorikih varijabli smatramo za zavisnu, a ostale za nezavisne Model Selection - analizira viestruke kontingencijske tabele i pomae u pronalaenju povezanosti izmedju kategorikih varijabli Classify - pronalazi grupisanja u okviru podataka K-Means Cluster - identifikuje homogene grupe na bazi izabranih karakteristika, koristei algoritam za baratanje velikim brojem sluajeva Hierarchical Cluster - identifikuje homogene grupe na bazi izabranih karakteristika, koristei algoritam koji zapoinje sa svakim sluajem u odvojenom klasteru i kombinuje klastere sve dok ne ostane samo jedan Discriminant - predvidja pripadnost odredjenoj grupi na osnovu grupe varijabli (karakteristika) Data Reduction - redukcija podataka Factor - faktorska analiza za grupu kvantitativnih varijabli Correspondence Analysis - analiza povezanosti dve kategorike varijable grafiki Optimal Scaling - slino faktorskoj analizi, ali moemo da radimo sa razliitim tipovima varijabli: kvantitativnim, ordinalnim ili nominalnim Scale - analize mjernih skala Reliability Analysis - analiza pouzdanosti mjerne skale Multidimensional Scaling - analiza distanci izmedju objekata ili sluajeva Nonparametric Tests - neparametrijski testovi Chi Square - 2 test Binomial - testira binomnu raspodjelu jedne dihotomne varijable Runs - da li je redoslijed pojavljivanja dve vrijednosti jedne varijable sluajan 1-Sample K-S - Kolmogorov-Smirnov test odstupanja raspodjele od zadate teorijske raspodjele vrijednosti 2 Independent Samples - poredi dve grupe ispitanika K Independent Samples - poredi dve ili vie grupa ispitanika 2 Related Samples - poredi distribucije dve varijable K Related Samples - poredi distribucije dve ili vie varijabli
94
95
Time Series - analiza podataka u vremenskim serijama Exponential Smoothing - ispravlja neregularne komponente podataka u vremenskim serijama Autoregression ARIMA X11 ARIMA Seasonal Decomposition Survival Life Tables - poseban nain rada sa vremenskim periodima koji jo nisu okonani (npr. duina zaposlenja u nekoj firmi za ljude koji jo uvijek rade), dijeljenjem na manje vremenske periode Kaplan-Meier - Kaplan-Majerov model rada sa vremenskim periodima koji jo nisu okonani Cox Regression - predvidjanje duine vremenskih perioda na osnovu podataka (takodje ukljuuje rad sa vremenskim periodima koji jo nisu okonani) Cox w/ Time-Dep Cov - Koksov regresioni model sa raunanjem vrmenski zavisne kovarijanse Multiple Response - rad sa spojenim varijablama Define Sets - spajanje vie osnovnih varijabli u jednu varijablu sa vie kategorija. Tek kad definiemo setove varijabli moemo da pristupimo opcijama Frequencies i Crosstabs.
Graphs meni
U okviru Graphs menija moemo da pravimo razne vrste grafikih reprezentacija podataka koje imamo. Bar - stupasti grafikoni Line - linijski dijagrami Area - dijagrami sa popunjenim povrinama Pie - kruni ("pita") dijagram High-Low - grafikoni sa reprezentacijom koja se zasniva na vertikalnim visinskim razlikama ("visoko-nisko" grafikon) Pareto - kombinovani histogramski i kumulativni linijski prikaz Control - grafikoni sa kontrolnim linijama Boxplot - grafikoni u obliku kutije Error Bar - grafikoni za prikaz mjera disperzije Scatter - takasti prikaz raspodjela dve ili tri varijable u dvodimenzionalnom ili trodimenzionalnom prostoru Histogram - histogrami P-P - grafikoni kumulativnih proporcija Q-Q - grafikoni centila Sequence - grafikoni sekvencijalnih sluajeva Time Series - grafikoni podataka u vremenskim serijama
95
96
Utilities meni
Ovaj meni sainjavaju razni alati. Variables - prikazuje nam podatke o varijablama koje odaberemo File Info - daje podatke o svim varijablama Define Sets - definiemo zajednike skupove varijabli Use Sets - definiemo koje skupove varijabli emo koristiti u obradama, tako da samo njih vidimo pri izboru Run Script - startuje skriptni program koji smo ranije snimili Menu Editor - podeavamo menije koje koristimo, ubacujemo nove ili izbacujemo opcije koje ne koristimo Windows i Help meniji su standardni meniji za sve windows programe, te neemo ulaziti u njihovo opisivanje.
Literatura Dragievi, Bukvi, 1986, Baker, 1994, Mason at al, 1997, Levin & Fox, 1997 Halmi, 1999 Todorovi (1995 Campbell (1953
Risti, 1983 G.Kneevi i K.Momirovi
Campbell (1953
96

SPSS Najnovije Izdanje II

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS Najnovije Izdanje II

Uploaded by

Copyright:

Available Formats

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge 6)

SPSS za psihologe i pedagoge

O nivoima mjerenja (tipovima podataka)

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Neki osnovni pojmovi istraivanja u psihologiji

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Priprema podataka za unoenje i obradu Kodiranje

Specifinosti kompjuterske obrade

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge Unoenje podataka u Microsoft Excel-u

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Manipulisanje podacima Spajanje datoteka

Dodavanje novih varijabli:

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Grupisanje i selekcija podataka

SPSS za psihologe i pedagoge Selekcija podataka

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Deskriptivne statistike mjere

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Percent 45.1 54.7 99.8 .2 100.0

Valid Percent 45.2 54.8 100.0

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge Mjere centralne tendencije

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

- standardna devijacija, X - pojedinani skor ispitanika, M - aritmetika sredina,

SPSS za psihologe i pedagoge N - ukupan broj sluajeva mjerenja, - oznaka za sumu.

(za uzorke manje od 100), N 1

Sk = Sk P90 P10 P50 skjunis precentil 90 percentil 10 percentil 50

P90 + P10 P50 , 2

SPSS za psihologe i pedagoge

Pri tome je:

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

SPSS za psihologe i pedagoge

Kad na kraju potvrdimo sa OK, dobiemo sljedei ispis:

Statistic Statistic SKOR.AUT Valid N (listwise) 495 495