Professional Documents
Culture Documents
Statistika U Psihologiji PDF
Statistika U Psihologiji PDF
Statistika u psihologiji
Prirunik za studente
Sarajevo, 2012
Statistika u psihologiji, prirunik za studente
ii
Statistika u psihologiji, prirunik za studente
Nermin apo
Ratko oki
Urednik:
Prof. dr. Ivo Komi
Recenzenti:
Prof. dr. Valentin Bucik
Doc. dr. Denana Husremovi
Izdanje:
Prvo
Izdava:
Filozofski fakultet u Sarajevu
Sarajevo, 2012
Elektronsko izdanje
-------------------------------------------------
CIP - Katalogizacija u publikaciji
Nacionalna i univerzitetska biblioteka
Bosne i Hercegovine, Sarajevo
159.9:519.2(075.8)(076)
APO, Nermin
Statistika u psihologiji : prirunik za
studente [Elektronski izvor] / Nermin apo, Ratko
oki. - Sarajevo : Filozofski fakultet, 2012. - 1
elektronski optiki disk (CD-ROM) : tekst, slike ;
12 cm
ISBN 978-9958-625-22-0
1. oki, Ratko
COBISS.BH-ID 19349510
-------------------------------------------------
iii
Statistika u psihologiji, prirunik za studente
iv
Statistika u psihologiji, prirunik za studente
Statistika u psihologiji
Prirunik za studente
Sarajevo, 2012
ii
Statistika u psihologiji, prirunik za studente
Predgovor
Na kraju, elimo se zahvaliti svima koji su na razliite naine doprinijeli nastanku ovog teksta. U
prvom redu, to su generacije studenata Odsjeka za psihologiju Filozofskog fakulteta u Sarajevu
kojima je Prirunik i namjenjen. Njih smo najvie oslukivali dok smo radili na ovom tekstu.
Statistikim rjenikom reeno, udio njihove varijance u objanjenju nastanka ovog Prirunika je
najvei. Nadalje, zahvaljujemo se i kolegama sa Odsjeka na podrci da posao zapoet prije nekoliko
godina dovedemo do kraja. Posebnu zahvalnost dugujemo Jadranki Kolenovi-apo koja je prva
proitala rukopis, dala vrijedne savjete i sugestije i nesebino pomogla u tehnikom dijelu posla
vanom za nastanak Prirunika. Zahvaljujemo se Marijani Gali, koja je s znatieljom i strpljenjem
proitala rukopis te iz pozicije strunjaka ekonomskih nauka dala korisne sugestije.
iii
Statistika u psihologiji, prirunik za studente
Sadraj
1. Uvod ......................................................................................................................... 1
2. Grafiko i tabelarno predstavljanje podataka ........................................................... 8
3. Mjere centralne tendencije ..................................................................................... 29
4. Mjere varijabiliteta ................................................................................................. 49
5. Osnovni koncepti vjerovatnoe .............................................................................. 70
6. Normalna raspodjela ............................................................................................... 82
7. Standardna pogreka aritmetike sredine ............................................................... 99
8. Testiranje hipoteza................................................................................................ 117
9. Testiranje razlika izmeu dvije aritmetike sredine ............................................. 131
10. Analiza varijance ................................................................................................ 147
11. Korelacija i regresija........................................................................................... 179
12. Rjeenja .............................................................................................................. 220
iii
Statistika u psihologiji, prirunik za studente
1. Uvod
Pojam statistika ima najmanje dva znaenja. Prema jednom znaenju, statistika oznaava
numerike vrijednosti kojima se opisuje skup podataka (npr. prosjeni kolski uspjeh uenika jedne
kole, ili raspon rezultata koje ispitanici postiu na testu znanja iz nastavnog predmeta Statistika u
psihologiji). Prema drugom znaenju, statistika je grana matematike i predstavlja skup postupaka
koje koristimo za prikupljanje, prezentaciju, analizu i interpretaciju podataka. Na studiju psihologije
izuava se primijenjena statistika, odnosno metode za deskripciju i analizu podataka izvedene iz
osnovnih matematikih principa. Naini kojim se do njih dolo predmetom su izuavanja teorijske
statistike.
Postupci koje koristimo u opisu podataka (npr. odreivanje broj kategorija, centralne
vrijednosti, aritmetike sredine, itd.) dio su deskriptivne statistike, dok je donoenje zakljuaka o
populaciji na osnovu podataka dobivenih na uzorku dio inferencijalne statistike. Deskriptivne
statistike postupke koristimo, npr., kada elimo opisati jednu ili vie grupa ispitanika, a
inferencijanu statistiku kako bi pokazali da li je razlika dobivena na ogranienom skupu podataka
vjerovatna i na populacijama.
Statistika je sastavni dio istraivakog procesa jer provedba istraivanja ukljuuje
prikupljanje, obradu i analizu podataka. Stoga predmet Statistika u psihologiji pripada metodolokoj
grupi predmeta, u koju ubrajamo i Metodologiju psiholokih istraivanja i Psihometriju.
Statistika je vana i u svakodnevnom ivotu. Poznavanje statistikih pojmova i koncepata,
vjetine i sposobnosti njihovog koritenja ine statistiku pismenost. Obzirom da smo svakodnevno
izloeni podacima na osnovu kojih donosimo odluke, statistika pismenost pomae nam da bolje
razumijemo svijet u kojem ivimo. Ponekad podaci ne odraavaju realnost i mogu nas navesti na
donoenje pogrene odluke. Statistika nam pomae da izmeu nekoliko odluka izaberemo najbolju.
Varijabla, mjerenje, populacija, uzorak, parametar i statistik dio su osnovnog vokabulara
statistike. Stoga emo u ovom poglavlju navest osnovne definicije ovih pojmova.
Varijabla (promjenljiva) je svojstvo pojave (osobe, objekta ili dogaaja) koje se mijenja.
Nekim varijablama jednostavno klasificiramo pojave u jednu od grupa ili kategorija (npr. spol
osoba je mukog spola; boja kose osoba ima kosu plave boje); ove varijable nazivamo
kategorijalnim varijablama. Drugim varijablama odreujemo koliinu neega, i nazivamo ih
kvantitativnim varijablama. Kvantitativne varijable mogu biti diskretne (vrijednosti varijable
mogu poprimiti samo neke vrijednosti iz odreenog intervala, pri emu su vrijednosti jasno
odijeljene) i kontinuirane (teorijski, ove varijable mogu poprimiti bilo koju vrijednost iz odreenog
intervala; izmeu pojedinih vrijednosti ne postoji skokovit prijelaz kao kod diskretnih varijabli).
Zavisne varijable se mijenjaju zbog promjene drugih varijabli. One nisu pod kontrolom istraivaa.
Njihovu promjenu objanjavamo, opisujemo ili klasificiramo pomou drugih varijabli. Obino se
oznaavaju slovom Y. Nezavisne varijable su pod kontrolom istraivaa. Njima se objaanjavaju,
opisuju ili klasificiraju promjene zavisne varijable. Obino se oznaavaju slovom X.
1
Statistika u psihologiji, prirunik za studente
1
Campbell, N. (1953). What is science. New York: Dover Publication.
2
Statistika u psihologiji, prirunik za studente
PRIMJER 1.1
PRIMJER 1.2
Rezultati nekih istraivanja ukazuju da uenici nieg socio-ekonomskog statusa postiu nii
kolski uspjeh. Uenici koji ive u ekonomski nepovoljnijim uslovima, imaju manje mogunosti za
kvalitetnije kolovanje. kolski psiholog odluio je istraiti povezanost izmeu odreenih socio-
ekonomskih karakteristika i kolskog uspjeha uenika srednjih kola.
Umjesto na populaciji koju ine svi uenici srednjih kola, istraivanje je provedeno na
uzorku. Obzirom da istraiva namjerava zakljuivati o populaciji na osnovu podataka prikupljenih
na uzorku, nuno je na pravilan nain formirati uzorak. U protivnom, mogunost generalizacije
rezultata istraivanja bit e ograniena. Uzorak je mogao biti formiran tako da svaki uenik iz
populacije ima podjednake anse da bude ukljuen u istraivanje. Meutim, istraiva se odluio da
metodom sluajnog odabira izabere odreeni broj kola iz itave drave, i da u tako izabranim
kolama ispita sve uenike.
Istraiva je, izmeu ostalih podataka, prikupio podatke o stepenu strune spreme majke,
radnom statusu majke i broju lanova porodice, te o dobi i spolu uenika. U tabeli 1.2.1. prikazani su
podaci za pet uenika. Spol, kola, stepen strune spreme, radni status i broj lanova domainstva su
diskretne (diskontinuirane) varijable. Vrijednosti varijable radni status jasno su odijeljene u tri
kategorije: zaposlen, nezaposlen i penzioner. Dob i prosjeni kolski uspjeh su kontinuirane
varijable. Dob ispitanika moe biti 16,7 (to odgovara uzrastu od 16 godina i 8 mjeseci), ali se moe
jo preciznije izraziti vrijednou 16,69. Mjerni (kvantitativni) podaci su dob, prosjeni kolski
uspjeh, broj lanova domainstva, dok su spol, kola, struna sprema i radni status kategorijalni
podaci. Vrijednosti kategorijalnih podataka izraavamo frekvencijama ili procentima za svaku
kategoriju (npr. u istraivanju je uestovalo 52% djevojica i 48% djeaka). Nominalne varijable su
kola, spol i radni status. Dob je jedina varijabla mjerena racio skalom mjerenja. kolski uspjeh i
broj lanova domainstva predstavljaju varijable mjerene rang skalom mjerenja.
3
Statistika u psihologiji, prirunik za studente
PROSJENI STEPEN
RADNI BROJ LANOVA
UENIK KOLA SPOL DOB KOLSKI STRUNE
STATUS DOMAINSTVA
USPJEH SPREME
1 A M 15,2 2,5 SSS zaposlen 3
2 C 14,5 3,7 VSS nezaposlena 4
50 C 15,0 4,0 OS zaposlena 5
275 B M 16,7 2,0 SSS penzioner 4
350 D 17,1 4,7 SSS nezaposlena 3
4
Statistika u psihologiji, prirunik za studente
ZADACI
1. U tabeli ispod prikazan je dio podataka dobivenih u hipotetikom istraivanju. Koje varijable su
kategorijalne, a koje kvantitativne? Koje su vrijednosti svake od varijabli?
TRAJANJE
VRSTA TERAPIJE
PACIJENT SPOL DOB DIJAGNOZA
TERAPIJE (U
MJESECIMA)
AB M Srednja dob Anksiozni poremeaj Kbt 10
CR Starija dob Fobija Kbt 4
NT Starija dob Anksiozni poremeaj Getalt 3
SQ M Mlaa dob Depresivnost Getalt 9
TW Starija dob Depresivnost Taa 15
3. U primjerima datim ispod: a) identificirajte varijable i b) za svaku varijablu odredite njen tip
(kategorijalna ili kvantitativna).
a. Za svako od 150 novoroenadi utvreni su: spol, poroajna teina, datum i vrijeme roenja.
b. Stomatolog je za potrebe istraivanja izmjerio duine (u mm) zadnjeg donjeg molara kod 10
pacijenata.
c. Tokom kontrole 250 vozila policija je utvrdila da u 50 sluajeva voza nije vezan sigurnosnim
pojasom, u 10 sluajeva vozilo je bilo u tehniki neispravnom stanju, dok u 30 vozila nije
naena prva pomo. Za sva vozila zabiljeene su registarske tablice, brizna kojom se vozilo
kretao prema kontrolnoj taki i spol vozaa.
d. Na sistematskom pregledu djeci je izmjerena visina i teina, uraen pregled plua, abdomena,
ekstremiteta, oftalmoloki pregled, te laboratorijski nalazi (sedimentacija, broj eritrocita i broj
leukocita). Djeca su na pregled dola u pratnji jednog ili oba roditelja.
e. Prije nego to je zapoeo sa rezanjem, Edvin je pet puta izmjerio dimenzije obrisa kocke
ucrtanih na kartonu.
f. Biolog je prebrojao listove na svakoj od 20 biljaka.
g. Emir je deset puta u toku dana mjerio krvni pritisak. Svaki put dobio je drugaije vrijednosti.
5
Statistika u psihologiji, prirunik za studente
6
Statistika u psihologiji, prirunik za studente
d. Na omjernim skalama, vei broj uvijek znai vie pojave koja se mjeri. DA NE
7
Statistika u psihologiji, prirunik za studente
8
Statistika u psihologiji, prirunik za studente
PRIMJER 2.1
Na grupi od 100 ispitanika primjenjen je Test ope informiranosti. Podaci (broj tanih
odgovora) prikazani su ispod.
24 27 32 20 20 15 20 20 19 22
18 22 27 28 15 20 14 24 24 19
24 9 30 25 19 21 13 20 22 20
19 20 25 24 26 21 19 16 22 22
14 12 25 25 12 17 19 21 18 14
15 17 18 18 17 15 20 19 22 16
19 12 24 17 10 21 21 14 19 22
16 8 21 20 22 15 21 22 16 18
22 30 27 21 17 25 19 20 19 19
15 27 20 24 21 16 18 16 19 16
Podatake emo poredati po veliini, a zatim za svaki odrediti koliko se puta pojavljuje.
Uvrtavanjem ovih vrijednosti u tabelu, podatke emo urediti u vidu tabele distribucije frekvencija
negrupiranih podataka (tabela 2.1.1).
9
Statistika u psihologiji, prirunik za studente
10
Statistika u psihologiji, prirunik za studente
razred f
6-9 2
10-13 5
14-17 22
18-21 40
22-25 22
26-29 6
30-33 3
total 100
11
Statistika u psihologiji, prirunik za studente
12
Statistika u psihologiji, prirunik za studente
PRIMJER 2.2
Tabela 2.2.4: Podaci za dob, spol, tjelesnu teinu TTEZ (u kg), puls i sistolni krvni pritisak SKP
r/br. DOB SPOL TTEZ PULS SKP r/br DOB SPOL TTEZ PULS SKP
1 0,3 1 4 90 65 16 5,4 2 22 100 100
2 0,2 1 3 178 65 17 6,5 2 23 96 99
3 0,3 2 4 140 87 18 12,7 1 51 79 109
4 0,3 1 5 120 60 19 10,1 1 24 93 104
5 0,3 1 5 155 65 20 16,2 2 52 74 101
6 0,3 1 5 150 70 21 15,6 1 35 100 128
7 0,3 2 4 156 65 22 9,4 2 28 88 86
8 0,6 1 8 163 88 23 15,3 2 45 90 100
9 0,9 1 8 128 105 24 9,1 2 45 110 112
10 1,1 2 7 110 95 25 9,7 1 30 90 110
11 5,1 1 28 160 99 26 9,4 2 20 160 99
12 1,5 1 10 110 86 27 12,2 2 25 100 112
13 2,2 2 12 110 95 28 6,0 2 20 117 115
14 1,5 1 10 110 86 29 16,0 2 47 81 128
15 1,5 2 12 110 86
Varijabla SPOL je kategorijalna, i stoga su podaci prikazani u obliku torta dijagrama (slika
2.2.3). Kategorije varijable spol (djevojice i djeaci) oznaene su na razliit nain. Pored svake
kategorije naveden je broj podataka.
14
15
djevojice djeaci
13
Statistika u psihologiji, prirunik za studente
0 2 3 3 3 3 3 3 6 9 (9)
1 1 5 5 5 (4)
2 2 (1)
5 1 4 (2)
6 0 5 (2)
9 1 4 4 7 (4)
10 1 (1)
12 2 7 (2)
15 3 6 (2)
16 0 2 (2)
U zagradama su prikazane frekvencije listova, tj. broj podataka za svaku vrijednost stabla.
Stablo i listovi prikaz omoguava vizuelnu impresiju o distribuciji podataka. Ako zamislimo da
prikaz rotiramo za 90 u smjeru obrnutom od smjera kazaljke na satu, dobit emo prikaz koji je
veoma slian ipkastom dijagramu. Iz prikaza moemo vidjeti da je najvei broj pacijenata mlaih
od godinu dana (ukupno devet), zatim onih sa devet godina (4 pacijenta) itd.
Varijabla TJELESNA TEINA je kontinuirana. Stoga distribuciju podataka ove varijable
moemo predstaviti pomou stablo i listovi prikaza. Vrijednosti varijable izraene su kao cijeli
brojevi sa jednom ili dvije cifre. Stoga u stablo i listovi prikazu 2|4 znai 24 kg, dok 0|6 znai 6
kg. U tabeli 2.2.6 dat je stablo i listovi prikaz vrijednosti tjelesne teine.
0 3 4 4 4 5 5 5 7 8 8 (10)
1 0 0 2 2 (4)
2 0 0 2 3 4 5 8 8 (8)
3 0 5 (2)
4 5 5 7 (3)
5 1 2 (2)
0 3 znai 3 kg
2 0 znai 20 kg
14
Statistika u psihologiji, prirunik za studente
Podaci dobiveni mjerenjem pulsa ispitanika najprije su grupirani u razrede. Formirano je est
razreda (prvi od 61 do 80, zadnji od 161 do 180), nakon ega su odreeni podaci koji pripadaju
svakom razredu. Tabelarni prikaz distribucije frekvencija rezultata grupiranih u razrede prikazan je u
tabeli 2.2.7). Na slian nain formirana je distribucija frekvencija rezultata grupiranih u razrede
varijable sistolni krvni pritisak (tabela 2.2.8).
Razred f
61-80 2
81-100 10
101-120 8
121-140 2
141-160 5
161-180 2
PRIMJER 2.3
Trei razred 1. Osnovne kole broji ukupno 25 uenika. Na pitanje Koji vam je omiljeni
kolski predmet?, troje uenika navelo je biologiju, petoro geografiju, estoro historiju, dvoje
matematiku, etvoro tjelesni odgoj, troje fiziku, jedno likovnu kulturu i jedno hemiju. Dobivene
podatke naprije emo tabelarno prikazati (tabela 2.3.9). U prvi stupac tabele unijeti su predmeti, a u
drugi broj uenika koji su navedene predmete naveli kao omiljene.
15
Statistika u psihologiji, prirunik za studente
Tabela 2.3.9: Podjela uenika IIIc odjeljenja prema preferiranom kolskom predmetu
Preferirani kolski predmet f
Biologija 3
Geografija 5
Historija 6
Matematika 2
Tjelesni odgoj 4
Fizika 3
Likovna kultura 1
Hemija 1
total 25
f 8
6
6 5
4
4 3 3
2
2 1 1
0
L ikovno v.
Matematika
F iz i ko v.
F iz ika
H emija
G eografija
Is torija
B iologija
P referirani predmet
16
Statistika u psihologiji, prirunik za studente
13 1 (1)
13 2 2 (2)
13 3 (1)
13 4 4 4 4 (4)
13 5 5 5 5 5 5 5 (7)
13 6 6 6 6 6 (5)
13 7 7 7 (3)
13 8 (1)
13 9 (1)
13 1 znai 131 cm
13 8 znai 138 cm
Iz Tabele 2.3.10 moemo vidjeti da je najnii uenik u razredu visok 131 cm, a najvii 139
cm. Dakle utvreni raspon rezultata je 8 (139 131). Obzirom da je utvreni raspon rezultata mali,
te da imamo relativno mali broj ispitanika (N=25), tj. da ve na temelju tabele 2.3.10 imamo dobar
pregled distribucije, rezultate nije potrebno grupirati u razrede. Tabeli 2.3.10 dodat emo vrijednosti
relativnih i kumulativnih frekvencija [rf, rf (%), cf, rcf i rcf (%)] koje e nam omoguiti dodatne
informacija o distribuciji visina uenika (tabela 2.3.12).
Iz tabele 2.3.12 mogli bismo izvui zakljuak da je 20% uenika visoko 136 cm procenat
rezultata u tom razredu [rf(%)] je upravo 20. Ipak, preciznije bi bilo rei da je 20% uenika visoko
17
Statistika u psihologiji, prirunik za studente
izmeu 135,5 i 136,5 cm. Naime, zbog nepreciznosti naeg mjerenja (tj. zaokruivanja rezultata na
cijeli cm), visina uenika koji su visoki izmeu 135,5 i 136,5 cm bit e registrirana kao visina od
136 cm. Dakle, iako je prikazani rezultat 136 cm, stvarni rezultat kree se u intervalu omeenom
stvarnom donjom granicom 135,5 cm i stvarnom gornjom granicom 136,5 cm.
Nadalje, iz tabele 2.3.12 moemo zakljuiti da je 40% uenika visoko najmanje 136 cm
(preciznije 135,5 cm) ukoliko saberemo procenat uenika sa visinom jednakom ili veom od 136
cm dobit emo upravo 40 procenata distribucije.
Podatke moemo predstaviti i pomou ogive (slika 2.3.5)
S lika 2.3.5. D is tribuc ije relativ nih kumulativ nih frekv enc ija (u
proc entima)
rc f (% )
100 96 %100 %
92 %
80 80 %
60 60 %
40
32 %
20
12 % 16 %
0 0% 4%
130,5 131,5 132,5 133,5 134,5 135,5 136,5 137,5 138,5 139,5
Vis ina u enika IIIc odjeljenja (c m)
18
Statistika u psihologiji, prirunik za studente
PRIMJER 2.4
Odreivanje centila i decila ilustrirat emo na primjeru 2.1. Odredit emo: a) u koji centil
pada rezultat 22, b) rezultat koji pada na 25 centil, c) centil rezultata 19, d) rezultat koji odgovara 60
centilu i e) granice 7. decila. Za odreivanje zadatih vrijednosti koristit emo tabelu 2.1.3 i grafiki
prikaz distribucije relativnih kumulativnih frekvencija (slika 2.1.2).
Npr. ako je meu 90 rezultata neki rezultat 40 po redu, onda se taj rezultat nalazi u: (40/90) x
100 = 44. centilu.
RFR
centil RKFD (X D)
i
gdje je:
X rezultat za koji traimo centil,
RKFD relativna kumulativna frekvencija (%) rezultata ispod razreda u kojem je
rezultat X,
D prava donja granica razreda u kojem se nalazi rezultat X,
i interval,
RFR relativna frekvencija (%) rezultata u razredu u kojem se nalazi rezultat X.
Nakon to odredimo poznate vrijednosti: X=22; RKFD=69,0; D=21,5; i=4; RFR=22,0, i uvrstimo
ih u izraz, izraunat emo centil rezultata X=22:
RFR 22,0
centil RKFD (X D) 69,0 (22 21,5) 71,75
i 4
Moemo zakljuiti da se ispod rezultata X=22 (ukljuujui i rezultat 22) nalazi 71,75% rezultata
(tj. ispitanika), dok se iznad ovog rezultata nalazi 28,25% rezultata (tj. ispitanika).
19
Statistika u psihologiji, prirunik za studente
centil N i
X D fD
100 fR
gdje je:
Centil zadati centil
D prava donja granica razreda u kojem je rezultat X,
fD ukupan broj rezultata ispod razreda u kojem je rezultat X,
fR broj rezultata u razredu u kojem je rezultat X,
i interval.
Nakon to odredimo poznate vrijednosti: Centil=25; D=13,5; fD=7; fR=22; i=4, i uvrstimo ih u
izraz, izraunat emo rezultat koji pada na 25 centil:
centil N i 25 100 4
X D fD 13,5 7 16,77
100 fR 100 22
Rezultat 16,77 dijeli distribuciju na dva dijela, tako da je ispod ovog rezultata 25% rezultata (tj.
ispitanika), a iznad 75%.
Za odreivanje centila rezultata X=25 koristi emo grafiki prikaz distribucije relativnih
kumulativnih frekvencija (slika 2.4.7) Sa apscise emo povui okomitu liniju od take koja pada na
X=25, do mjesta presjeka za procentualnom ogivom. Zatim emo od ove take povui liniju
paralelnu sa apscisom, do ordinate. Taka u kojoj ova linija sjee ordinatu odgovara traenom
centilu. Tako je Centil 90%
Za odreivanje rezultata koji odgovara 60. centilu koristi emo procentualnu ogivu (slika 2.4.7).
Sa ordinate emo povui okomitu liniju od take koja pada na rcf%=60, do mjesta presjeka sa
procentualnom ogivom. Zatim emo od ove take povui liniju paralelnu sa ordinatom, do apscise.
Taka u kojoj ova linija sjee apscisu odgovara traenom rezultatu. Tako je X 20.
20
Statistika u psihologiji, prirunik za studente
Sedmi decil poinje sa 60-im a zavrava sa 69,99-im centilom. Stoga je potrebno odrediti
rezultate koji padaju u 60 i 69,99 centil.
centil N i 60 100 4
X 60 centil D fD 17,5 29 20,6
100 Rf 100 40
PRIMJER 2.5
21
Statistika u psihologiji, prirunik za studente
54% 46%
ene Mu karc i
Naredni skup podataka odnosi se na starosnu strukturu pacijenata. Starosna strukura ispitanika
je kvantitativna varijabla iako ispitanike razvrstavamo u jednu od kategorija prema njihovoj
starosnoj dobi, na temelju pripadnosti odreenoj kategoriji, ispitanici mogu dobiti i odgovarajui
rang. Tako, npr., svi ispitanici mlai od 30 godina e dobiti rang 1, ispitanici starosti od 31 do 40
godina rang 2, ispitanici u narednoj starosnoj skupini rang 3...
%
35
30
25
20
15
10
5
0
Is pod 30 od 31 do O d 41 do O d 51 do O d 61 do O d 71 do P reko 81
god. 40 god. 50 god. 60 god. 70 god. 80 god. god.
D obna kategorija
Prilikom utvrivanja procenata pacijenata pojedinih starosnih uzrasta koji su upueni lijeniku
specijalisti (slika 2.5.9) ponovo smo se koristili mjerenjem na nominalnoj skali ispitanici su
svrstani u jednu od dvije kategorije: Upuen specijalisti/ Nije upuen specijalisti, a potom je u
svakoj od kategorija utvren broj ispitanika.
22
Statistika u psihologiji, prirunik za studente
80
60
40
20
0
Is pod 30 od 31 do O d 41 do O d 51 do O d 61 do O d 71 do P reko 81
god. 40 god. 50 god. 60 god. 70 god. 80 god. god.
D obna kategorija
158.69 m m /H g
P ac ijent je
upud en 94,31 m m /H g P ros je na
s pec ijalis ti vrijednos t
s is toli kog
pritis ka
143.21 m m /H g
P ac ijent nije
upud en 89,43 m m /H g P ros je na
s pec ijalis ti vrijednos t
dijas toli kog
pritis ka
0,00 50,00 100,00 150,00 200,00
mm/Hg
23
Statistika u psihologiji, prirunik za studente
ZADACI
9,2 9,7 9,7 10,3 10,9 10,9 11,4 11,4 11,4 11,7
11,9 12,1 12,4 12,6 12,8 13 13,1 13,2 13,7 13,8
14 14,1 14,5 14,6 14,6 14,8 14,9 15,1 15,1 15,3
15,6 15,9 16 16,4 16,5 16,6 16,7 16,8 16,8 16,9
4. U tabeli ispod prikazana je distribucija kolskih ocjena 520 uenika petih razreda.
kolski uspjeh 1 2 3 4 5
Broj uenika (f) 2 35 240 150 93
24
Statistika u psihologiji, prirunik za studente
5. U dva kruga grupnog nadmetanja Lige ampiona postignuta su 72 gola. U tabeli ispod prikazan je
broj pogodaka tokom razliitih perioda utakmice. Grafiki prikaite podatke iz tabele.
7. VIa razred Osnovne kole Sigmund Freud broji ukupno 25 uenika. Na pitanje Koji vam je
omiljeni kolski predmet?, uenici su dali sljedee odgovore: njih troje navelo je maternji jezik,
etvoro hemiju, petoro tjelesni odgoj, dvoje matematiku, estoro historiju, dvoje fiziku, jedno
tehniki odgoj i dvoje geografiju.
25
Statistika u psihologiji, prirunik za studente
9. Kompanija eli zaposliti 10 novih radnika na poziciji istraivaa trita te je u novinama objavila
oglas na koji se javilo ukupno 46 kanditata. Svi kandidati su pozvani na test namjenjen
utvrivanju nivoa njihovog znanja iz statistike (maksimalni rezultat na testu iznosio je 40).
19 25 26 27 28 29 30 31 32 39
20 25 26 27 28 29 30 31 32
23 25 26 27 28 29 30 32 35
24 25 27 27 29 29 30 32 35
25 26 27 27 29 29 31 32 35
26
Statistika u psihologiji, prirunik za studente
a. Koji rezultat (otprilike) dijeli distribuciju na 50% gornjih i donjih rezultata (50% slabijih i
50% boljih kandidata).
b. Kompanija e zaposliti one kandidate koji su na testu iz statistike skupili najmanje 34 boda.
Koliko kandidata e odmah dobiti ponudu za posao? Koliko je to procenata ukupno
prijavljenih kandidata?
c. Kako kompaniji treba ukupno 10 novih uposlenika, odlueno je se na dodatni trening iz
statistike pozove duplo vie kandidata nego to ima preostalih upranjenih radnih mjesta.
Kandidat koji e biti pozvani na trening su oni koji imaju najbolje rezultate na testu kada se
iskljue oni kandidati koji su ve dobili ponudu za posao. Koliko kandidata e biti pozvano na
dodatni trening? Koji su granini rezultati (donji i gornji) koji odreuju ovu skupinu? Koji je
to procenat ukupnog broja prijavljenih kandidata?
10. Kliniki centar registovao je uestalost prijema pacijenata koji su se alili na probleme sa
respiratornim sistemom tokom godine dana. Tokom te godine zabiljeeno je 1500 prijema.
Ukoliko se eli saznati u kojem godinjem dobu je vei broj prijema, na koji nain e se podaci
prikazati? Koji e se grafiki prikaz koristiti?
11. U prodavnici tehnikih ureaja kupci su u knjigu utisaka mogli upisivati primjedbe koje imaju na
pruene usluge. Primjedbe su razvrstane u pet grupa. Tokom godinu dana registrovano je 500
albi. Na koji nain se grafiki mogu prikazati registrirane primjedbe? Ukoliko nas zanima u
kojem mjesecu je zabiljeen najvei broj primjedbi (bez obzira na vrstu primjedbe), koji emo
grafiki prikaz izabrati?
12. Telefonska kompanija prikupila je podatke o dobi i spolu svojih korisnika. Najmlai ima 14
godina, a najstariji 75. Na koji nain se prikupljeni podaci mogu prikazati?
13. U istraivanju su prikupljeni podaci o spolu, tjelesnoj teini i dnevnoj koliini unesenih kalorija.
Na koji nain se podaci mogu prikazati?
14. Ukoliko elimo uporediti procenat podataka koji pripadaju jednoj kategoriji, u odnosu na
procenat podataka koji pripadaju drugoj kategoriji, koji prikaz emo koristiti?
15. Psiholog je prikupio podatke o verbalnim sposobnostima mukaraca i ena. Koji naini
prikazivanja podataka e koristiti ukoliko eli uporediti distribucije rezultata ove dvije grupe?
16. Nastavnici osnovnih kola predlagali su uenike za program za poticanje nadarenosti. Za svakog
uenika predloili su oblast za koju smatraju da je uenik nadaren. Na slici ispod prikazani su
dobiveni rezultati.
27
Statistika u psihologiji, prirunik za studente
32
30
28
26
24
22
broj uenika
20
18
djeaci
16
14 djevojice
12
10
8
6
4
2
0
Prirodne Matematika Drutvene Jezik i Umjetnost Sport Ostalo
nauke nauke knjievnost
oblasti
Koliko je djeaka, a koliko djevojica predloeno za pojedine oblasti? Za koju oblast je bilo
najvie prijedloga, a za koju najmanje?
17. Studenti su tokom mjesec dana vodili dnevnik spavanja. Izmeu ostalih vrijednosti, u dnevnik su
unosili podatke o vremenu kada idu na spavanje, vremenu kada se bude, duini spavanja, broju
snova i vrsti snova (radi jednostavnosti, pretpostavimo da su trebali odrediti da li je san bio
prijatan ili neprijatan). Na koji nain se prikupljeni podaci mogu prikazati?
28
Statistika u psihologiji, prirunik za studente
U skupu podataka: x=(2,4,5,4,6,3), vrijednost koja se najee pojavljuje je 4; stoga je: Mod=4.
Medijana (centralna vrijednost) je vrijednost koja distribuciju dijeli na dva jednaka dijela, tj.
vrijednost koja se u nizu podataka poredanih po veliini nalazi tano u sredini. Poloaj medijane
odreujemo preko izraza:
Poloaj medijane = (N+1)/2
Aritmetika sredina je suma svih rezultata podijeljena brojem rezultata. Aritmetika sredina
predstavlja teite rezultata i stoga je osjetljiva na ekstremne vrijednosti rezultata. Aritmetika
sredina odreuje se prema izrazu:
M= X/N
29
Statistika u psihologiji, prirunik za studente
Kod simetrine, unimodalne distribucije mod, medijana i aritmetika sredina bit e priblino
jednake vrijednosti.
Izbor mjera centralne tendencije zavisi od skale mjerenja i oblika distribucije. Ako je
koritena nominalna skala mjerenja kao mjeru centralne tendencije koristimo mod, dok kod
ordinalnih skala mjerenja koristimo medijanu. Kada su podaci dobiveni na intervalnoj ili racio skali
mjerenja, kao mjeru centralne tendencije koristimo aritmetiku sredinu, ali samo ukoliko je
distribucija simetrina; u protivnom koristimo medijanu. Ispod je dat shematski prikaz izbor mjera
centralne tendencije.
Koja skala
mjerenja je
koritena?
Intervalna
Nominalna Ordinalna ili racio
ne Da li je
Mod Medija distribucija
na simetrina?
da
Aritmetika sredina
Distribucija je asimetrina ako je vei broj podataka koncentriran na jednoj strani skale, a
manji broj na drugoj strani. Kod pozitivno asimetrine distribucije relativno je vei broj niih
vrijednosti, a kod negativno asimetrine distribucije relativno je vei broj viih vrijednosti.
30
Statistika u psihologiji, prirunik za studente
8 8
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 1 2 3 4 5 6 7 8 9 10 11 12 13
skjunis
N
(Xi M) 3
N - 2 (N 1) s 3
31
Statistika u psihologiji, prirunik za studente
PRIMJER 3.1
24 27 32 20 20 15 20 20 19 22
18 22 27 28 15 20 14 24 24 19
Podatke treba najprije urediti. Koristit emo distribuciju negrupiranih rezultata, prikazanu u
tabeli 3.1.1.
rezultat f
14 1
15 2
18 1
19 2
20 5
22 2
24 3
27 2
28 1
32 1
total 20
1. Mod
Mod = 20
32
Statistika u psihologiji, prirunik za studente
2. Medijana
Medijana se nalazi na 10,5 mjestu, tj. na polovini rastojanja izmeu 10 i 11 mjesta. Rezultat
19 nalazi se na estom mjestu, a rezultat 20 od sedmog do jedanaestog mjesta (ukupno je pet
rezultata 20). Na dvanaestom i trinaestom mjestu je rezultat 22, itd. Budui da 10. i 11. mjesto
zauzima jedan te isti rezultat, X=20, medijana iznosi upravo toliko, tj.
C = 20
3. Aritmetika sredina
M
X
N
S obzirom da se pojedini rezultati pojavljuju vie puta, gornjem izrazu dodat emo vrijednosti
frekvencija i dobiti sljedeu formulu:
M
fX i i
14 1 15 2 18 1 19 2 20 5 22 2 24 3 27 2 28 1 32 1
M
20
33
Statistika u psihologiji, prirunik za studente
PRIMJER 3.2
razred f X fX
6-9 2 7,5 15
10-13 5 11,5 57,5
14-17 22 15,5 341
18-21 40 19,5 780
22-25 22 23,5 517
26-29 6 27,5 165
30-33 3 31,5 94,5
fi= 100 f iXi=1970
M
fX i i
1970
19,7
N 100
(napomena: fi = N)
Medijanu moemo odrediti na dva naina: raunskim postupkom ili oitavanjem iz grafikog
prikaza.
Za izraunavanje medijane potrebno je formirati distribucije kumulativne i procentualne
relativne kumulativne frekvencije (tabela 3.2.2).
34
Statistika u psihologiji, prirunik za studente
centil N i
X D fD
100 fR
Medijana se nalazi u razredu 18-21 jer se do prave gornje granice ovog razreda nalazi 69%
rezultata. Prava donja granica ovog razreda je D=17,5; u ovom razredu nalazi se fR=40 rezultata; do
razreda 18-21 ukupno je fD=29 rezultata; interval razreda iznosi i=4. Centil centralne vrijednosti je
50-i.
50 100 4
C 17,5 29
100 40
Grafiko odreivanje medijane radimo pomou procentualne ogive (slika 3.2.1). Obzirom da
medijana dijeli distibuciju na dva jednaka dijela, potrebno je na apscisi (x) oitati rezultat koji
odgovara 50-om procentu na ordinati (rcf %).
35
Statistika u psihologiji, prirunik za studente
Rezultat koji odgovara 50-om centilu iznosi neto malo vie od 19,5. itav postupak radi se na
milimetarskom papiru na kojem moemo oitati tanu vrijednost. Kada bi tako uradili, uvjerili
bismo se da se radi o rezultatu C=19,6, kojeg smo dobili i raunskim putem.
Obzirom da su vrijednosti aritmetike sredine i medijane podjednake (MC), moemo
zakljuiti da je distribucija rezultata simetrina. Zaista, uvidom u oblik histograma primjeujemo da
je oblik distribucije simetrian (slika 2.1.1).
PRIMJER 3.3
Za varijablu DOB iz primjera 2.2 odredit emo mod, medijanu i aritmetiku sredinu. Za
odreivanje mjera centralne tendencije koristit emo stablo i listovi prikaz (tabela 3.3.1).
0 2 3 3 3 3 3 3 6 9 (9)
1 1 5 5 5 (4)
2 2 (1)
5 1 4 (2)
6 0 5 (2)
9 1 4 4 7 (4)
10 1 (1)
12 2 7 (2)
15 3 6 (2)
16 0 2 (2)
= 29
36
Statistika u psihologiji, prirunik za studente
1. Mod
Iz stablo i listovi prikaza odredit emo rezultat koji se javlja najvei broj puta. Za vrijednost
stabla 0, frekvencija je 9. Vrijednost lista 3 javlja se est puta. Moemo zakljuiti da je:
Mod = 0,3
2. Medijana
U prikazu rezultati su poredani po veliini (od 0,2 do 16,2). Poloaj medijane odreujemo
preko izraza (N+1)/2. Medijana se nalazi na 15 mjestu. Petnaesto mjesto odredit emo
sabiranjem broja listova za pojedine vrijednosti stabla, sve dok zbir ne bude 15 ili dok ne
preemo vrijednost 15. Dakle, 9 (za 0) + 4 (za 1) + 1 (za 2) + 2 (za 5), to iznosi 16. Na 16.
mjestu nalazi se vrijednost 5,4. Jedno mjesto ispod, tj. na 15. mjestu, nalazi se vrijednost 5,1.
Dakle:
C = 5,1
3. Aritmetika sredina
M = 5,9
Izraunate vrijednosti mjera centralne tendencije se razlikuju. Najvea razlika je izmeu moda
i ostale dvije mjere. Koju emo mjeru centralne tendencije izabrati ako skup podataka elimo
numeriki opisati? Iz stem and leaf prikaza moemo vidjeti da je oblik distribucije asimetrian.
Dakle, aritmetika sredina nije najbolji izbor. Mod takoer ne bi adekvatno reprezentirao skup
podataka jer se vrijednost 0,3 javlja samo est puta, to je malo u odnosu na ukupan broj podataka.
Najbolji reprezentant podataka je medijana.
PRIMJER 3.4
Za visine uenika IIIc odjeljenja, potrebno je utvrditi deskripitive vrijednosti mod, medijanu i
aritmetiku sredinu. U tu svrhu koristit emo tabelu 3.4.1.
37
Statistika u psihologiji, prirunik za studente
1. Mod
Mod = 135
2. Medijana
Obzirom da su u Tabeli 3.4.1 rezultati poredani prema veliini (od 131 cm do 139 cm),
vrijednost medijane moemo utvrditi prema formuli za utvrivanje njenog poloaja u skupu
podataka (N+1)/2. Medijana se nalazi na 13. mjestu u nizu podataka poredanih prema veliini.
Uvidom u distribuciju kumulativnih frekvencija (cf) vidimo da rezultat 135 zauzima pozicije
od 9. do 15. mjesta. Prema tome, rezultat koji se nalazi na 13. mjestu i koji predstavlja
medijanu distribucije takoer iznosi 135 cm.
Do istog zakljuka smo mogli doi i uvidom u distribuciju kumulativnih relativnih frekvencija
u procentima [crf (%)]. Vidimo da je zakljuno sa rezultatom 134 u distribuciji akumulirano
32% rezultata. Ukljuenjem rezultata 135 akumulira se dodatnih 28%, tj. ukupno 60%
rezultata. Dakle, rezultat koji dijeli distribuciju na pola (50% donjih i 50% gornjih rezultata) je
upravo rezultat 135.
38
Statistika u psihologiji, prirunik za studente
3. Aritmetika sredina
M
fX
i i
3377
135,08
N 25
39
Statistika u psihologiji, prirunik za studente
PRIMJER 3.5
Nastavnik je odluio izraunati mjeru centralne tendencije koja najbolje reprezentira prosjenu
vrijednost. Izraunao je medijanu i aritmetiku sredinu.
1. Medijana
40
Statistika u psihologiji, prirunik za studente
dijeli na pola je negdje u intervalu izmeu rezultata 75 i 79). Na taj nain dobijamo vrijednosti
potrebne za formulu za odreivanje centralne vrijednosti (tj. 50. centila).
50 98 5
C 74,5 29 76,14
100 61
2. Aritmetika sredina
Kako bi izraunao aritmetiku sredinu rezultata, nastavnik je svaki pojedini razred u grupiranoj
distribuciji predstavio njegovom srednjom vrijednou, koju je potom pomnoio sa
frekvencijom razreda, konano sumirajui dobivene vrijednosti.
razred X f Xf
0-4 2 7 14
5-9 7 0 0
10-14 12 0 0
15-19 17 0 0
20-24 22 0 0
25-29 27 0 0
30-34 32 0 0
35-39 37 0 0
40-44 42 0 0
45-49 47 0 0
50-54 52 0 0
55-59 57 0 0
60-64 62 0 0
65-69 67 9 603
70-74 72 13 936
75-79 77 61 4697
80-84 82 7 574
85-89 87 1 87
total 98 6911
41
Statistika u psihologiji, prirunik za studente
Koristei formulu:
M
fX i i
42
Statistika u psihologiji, prirunik za studente
ZADACI
20 10 14 20 15 15 15 15 15 23
16 16 17 17 18 21 18 19 19 20
8 20 20 14 21 18 21 23 23 16
4 0 5 0 4 1 13 1 6 2
2 2 2 2 2 2 3 3 3 3
0 4 1 4 0 5 6 1 6 1
Razred f
0-4 1
5-9 14
10-14 12
15-19 2
20-24 1
4. Na slici je prikazan histogram rezultata koje je grupa uenika postigla na testu znanja iz
matematike. Na osnovu histograma formirajte distibuciju grupiranih rezultata (veliina intervala
i=5), a zatim, iz grupiranih podataka, odredite medijanu i aritmetiku sredinu.
43
Statistika u psihologiji, prirunik za studente
f 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 2 7 12 17 22 27 32 37
x
5. Na osnovu distibucije grupiranih rezultata iz zadatka 3.4 grafikim putem odredite medijanu.
44
Statistika u psihologiji, prirunik za studente
Koliko iznosi prosjena duina toka gore navedenih rijeka? Izraunajte aritmetiku sredinu i
medijanu. Koju mjeru centralne tendencije biste izabrali za odgovor na pitanje o prosjenoj
duini toka gore navedenih rijeka?
11. Koristei stablo i listovi prikaz iz zadatka 2.6 odredite mod i medijanu za ene i mukarce.
12. Nastavnik fizike u O Sigmund Freud je uenicima estih razreda (ukljuujui i VIa razred)
zadao test. Uenici su ostvarili sljedee rezultate (izraene kao broj skupljenih bodova;
maksimalan broj bodova iznosio je 50):
45
Statistika u psihologiji, prirunik za studente
Broj bodova na
testu iz fizike f
0 4
1 2
3 1
25 2
26 1
27 1
28 1
29 4
30 4
33 4
34 5
35 7
36 10
37 19
38 19
39 6
40 4
41 3
45 1
total 98
13. Nastavno vijee O Sigmund Freud je roditeljima uenika estih razreda potom poslalo
anketni upitnik sa ciljem da prikupi preciznije informacije o socijalno-ekonomskom statusu
porodica iz kojih dolaze njihovi uenici. Upitnik je sadravao i pitanja o mjesenim primanjima
svakog od roditelja uenika (pri tome je roditeljima garantirana stroga diskrecija datih odgovora).
Ispod su prikazani prikupljeni odgovori o mjesenim primanjima majki uenika, zaokrueni na
jedinice od 50 KM (N=98).
46
Statistika u psihologiji, prirunik za studente
121 132 119 126 110 122 121 130 113 123
114 123 117 124 120 129 114 123 117 124
119 125 116 124 118 125 120 128 119 127
47
Statistika u psihologiji, prirunik za studente
Ispitanik 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Prije 43 20 17 30 25 19 34 28 23 41 26 40 16 23 34
poslije 45 16 20 33 30 19 33 25 26 40 28 36 15 26 32
48
Statistika u psihologiji, prirunik za studente
4. Mjere varijabiliteta
Pored tendencije grupiranja podataka oko neke srednje vrijednosti, postoji i tendencija
variranja tj. rasprenja podataka oko srednje vrijednosti. Stoga u numerikoj deskripciji skupa
podataka, pored mjere centralne tendencije koristimo i mjere varijabiliteta. Sljedei primjer ilustrira
nunost da pored mjere centralne tendencije treba odrediti i mjeru varijabiliteta.
Za skup podataka: x=(53,62,70,70,75,78,82), razlika izmeu najvieg i najnieg rezultata je: 82 53 = 29.
Dakle, raspon rezultata iznosi 29.
Na osnovu raspona rezultata ne moemo saznati nita o raspodjeli podataka unutar raspona
jer se raspon rauna samo preko ekstremnih vrijednosti.
U skupovima podataka A i B raspon je jednak i iznosi 70. U skupu B vei broj rezultata grupiran je oko
centralne vrijednosti.
A: 10 20 50 60 70 80
B: 10 50 50 50 50 80
Interkvartilni raspon (ili rasprenje) je raspon u kojem se nalazi 50% sredinjih rezultata.
Za razliku od raspona rezultata interkvartilni raspon nije osjetljiv na ekstremne rezultate. Za
49
Statistika u psihologiji, prirunik za studente
IQR= Q3 - Q1
SQR=( Q3 - Q1)/2,
i predstavlja grubu procjenu prosjene udaljenosti izmeu medijane i prvog kvartila i izmeu
medijane i treeg kvartila.
v
(X i - M)2
N-1
50
Statistika u psihologiji, prirunik za studente
s
(X i M)2
N1
v
(X i - M) 2
(1 4) 2 (2 4) 2 (3 4) 2 (5 4) 2 (6 4) 2 (7 4) 2
5,6
N-1 6 1
v=5,6; s=2,37
Standardnu devijaciju statistiki je opravdano raunati kada je: distribucija rezultata normalna
ili barem simetrina i kada je koritena intervalna ili racio skala mjerenja.
Platokurtina leptokurtina
Kao mjeru spljotenosti (ili izduenosti) distribucije koristimo kurtozis (eng. kurtosis):
kurtozis
N(N - 1)
(Xi M)4 3(N 1)2
(N - 2)(N - 3) (N 1) s 4 (N 2)(N 3)
Koristan nain numerikog sumiranja podataka je navoenje pet vrijednosti koje pruaju
vane informacije o distribuciji. Te vrijednosti su: medijana, prvi kvartil, trei kvartili, minimalna i
maksimalna vrijednost. Ovaj nain numerike deskripcije podakata naziva se sumiranje sa pet
brojeva. Sumiranje skupa podataka sa pet brojeva moe se transformisati u grafiki prikaz kojeg
nazivamo box-plot prikaz.
51
Statistika u psihologiji, prirunik za studente
8
Maksimalna vrijednost
7
6 Trei kvartil, Q3
5
Medijana, C
4
3 Prvi kvartil, Q1
2
1
Minimalna vrijednost
Kao i kod mjera centralne tendencije, izbor mjera varijabiliteta zavisi od skale mjerenja i
oblika distribucije. Ako je koritena nominalna skala mjerenja kao mjeru varijabiliteta koristimo broj
kategorija. Kod podataka dobivenih ordinalnom skalom mjerenja koristimo poluinterkvartilni raspon
(SQI). Kada su podaci dobiveni na intervalnoj ili racio skali mjerenja, kao mjeru varijabiliteta
koristimo varijancu, tj. standardnu devijaciju (ali samo ukoliko je distribucija simetrina); u
protivnom koristimo poluinterkvartilni raspon. Ispod je dat shematski prikaz izbora mjera
varijabiliteta.
52
Statistika u psihologiji, prirunik za studente
Mjera varijabiliteta
Koja skala
mjerenja je
koritena?
ne Da li je
Broj SQR distribucija
kategorija simetrina?
da
Varijanca,
standardna devijacija
53
Statistika u psihologiji, prirunik za studente
PRIMJER 4.1
Za podatke iz primjera 1.3 izraunat emo interkvartilni raspon i standardnu devijaciju, a skup
podataka opisat emo sa pet brojeva. Rezultati (broj tanih odgovora na Testu znanja iz statistike)
prikazani su ispod.
24 27 32 20 20 15 20 20 19 22
18 22 27 28 15 20 14 24 24 19
Kao i kod izraunavanja mjera centralne tendencije, podatke emo najprije urediti koristei
distribuciju negrupiranih rezultata (prikazanu u tabeli ispod).
rezultat f
14 1
15 2
18 1
19 2
20 5
22 2
24 3
27 2
28 1
32 1
total 20
a. Interkvartilni raspon
Skup podataka sastoji se od 20 rezultata. Ovaj skup podijelit emo na dva jednaka dijela:
Rezultat koji distribuciju prvog dijela skupa dijeli na dva jednaka dijela iznosi 19 to je prvi
kvartil; rezultat koji drugi dio skupa dijeli na dva jednaka dijela iznosi 24 to je trei kvartil.
Odnosno, Q1=19; Q3=24. Interkvartilni raspon iznosi:
54
Statistika u psihologiji, prirunik za studente
QR= Q3 - Q1=24-19=5
IQR=5
b. Standardna devijacija
s
(X i M)2
N1
S obzirom da se pojedini rezultati pojavljuju vie puta, gornjem izrazu dodat emo vrijednosti
frekvencija i dobiti sljedeu formulu:
s
fX i
2
M2
f i
rezultat f fX f X2
14 1 14 196
15 2 30 450
18 1 18 324
19 2 38 722
20 5 100 2000
22 2 44 968
24 3 72 1728
27 2 54 1458
28 1 28 784
32 1 32 1024
fi=20 fiX=430 fi X2=9654
55
Statistika u psihologiji, prirunik za studente
c. Pet brojeva
Ispod je dat box-plot prikaz. Iz grafikog prikaza moemo proitati gore navedene vrijednosti,
ali i neke informacije o distribuciji rezultata. Najprije, uoit emo krui, kojim se oznaava
ekstremna vrijednost. Ekstremne vrijednosti potrebno je posebno tretirati, te je njihova
detekcija u deskripciji rezultata izuzetno vana. Linija koja oznaava medijanu smjetena je
znatno blie prvom kvartilu i oigledno je da distribucija nije simetrina. Od prvog kvartila do
medijane udaljenost je: C-Q1=20-19=1. Udaljenost od medijane do treeg kvartila iznosi: Q3-
C=24-20=4. U rasponu od 19 do 20 nalazi se 25% rezultata (ispod medijane), a isti broj
rezultata nalazi se u rasponu od 20 do 24 (iznad medijane). Dakle, raspon od 4 obuhvata
jednak broj rezultata kao i raspon od 1.
33
32
31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
56
Statistika u psihologiji, prirunik za studente
PRIMJER 4.2
razred f X fX f X2
6-9 2 7,5 15 112,5
10-13 5 11,5 57,5 661,3
14-17 22 15,5 341 5286
18-21 40 19,5 780 15210
22-25 22 23,5 517 12150
26-29 6 27,5 165 4538
30-33 3 31,5 94,5 2977
fi =100 fi X2 =40933
s
fX i
2
M2
f i
s= 4,61
razred f cf rcf(%)
6-9 2 2 2%
10-13 5 7 7%
14-17 22 29 29%
18-21 40 69 69%
22-25 22 91 91%
26-29 6 97 97%
30-33 3 100 100%
total 100
57
Statistika u psihologiji, prirunik za studente
centil N i
X D fD
100 fR
odnosno,
25 N i 75 N i
Q1 D fD Q3 D fD
100 fR 100 fR
gdje je:
Q1, Q3 traeni rezultati (prvi i trei kvartil)
D prava donja granica razreda u kojem je prvi i trei kvartil,
fD ukupan broj rezultata ispod razreda u kojem je prvi i trei kvartil,
fR broj rezultata u razredu u kojem je prvi i trei kvartil,
i interval.
Prvi kvartil nalazi se u razredu 14-17. Prava donja granica ovog razreda je D=13,5; u razredu
se nalazi fR=22 rezultata; do razreda 14-17 ukupno je fD =7 rezultata; interval razreda iznosi i=4.
25 100 4
Q 1 13,5 7 16,77
100 22
Trei kvartil nalazi se u razredu 22-25. Prava donja granica ovog razreda je D=21,5; u razredu
se nalazi fR=22 rezultata; do razreda 14-17 ukupno je fD =69 rezultata; interval razreda iznosi i=4.
75 100 4
Q 3 21,5 69 22,23
100 22
IQR=22,23-16,77; IQR=5,45
Udaljenost od medijane do prvog kvartila iznosi: 19,6 16,77 = 2,83, slino kao i udaljenost
od medijane do treeg kvartila: 22,23 19,6 = 2,63. Ovakve vrijednosti mogli smo i oekivati
obzirom na simetrinost distribucije. U sluaju idealno simetrine distribucije, ove dvije udaljenosti
bile bi identine.
Grafiko odreivanje kvartila radimo pomou procentualne ogive (slika ispod). Obzirom da
prvi kvartil dijeli distibuciju na dva dijela, tako da je ispod 25%, a iznad 75% rezultata, potrebno je
na apscisi (x) oitati rezultat koji odgovara 25-om procentu na ordinati (rcf %). Slino tome, kako
58
Statistika u psihologiji, prirunik za studente
trei kvartil dijeli distibuciju na dva dijela, tako da je ispod 75%, a iznad 25% rezultata, potrebno je
na apscisi (x) oitati rezultat koji odgovara 75 procentu na ordinati (rcf %). Na apscisi oitavamo da
je Q1=16,7 i Q3=22,2. Kao i kod odreivanja medijane, itav postupak radi se na milimetarskom
papiru na kojem moemo oitati tanu vrijednost.
80
70 21,5; 69
60
50
40
30 17,7; 29
20
10
13,5; 7
0 5,5; 0
9,5; 2
PRIMJER 4.3
Brzina (km/h) fA fB
0 - 20 14 2
21 - 40 18 5
41 - 60 20 7
61 - 80 13 30
81 - 100 5 20
101 - 120 2 6
totali 70 70
U ovom primjeru elimo numeriki opisati podatke. Stoga se nuno nameu dva pitanja, a to
su: (1) Koje mjere centralne tendencije i varijabiliteta je potrebno odrediti? i (2) ta moemo
zakljuiti na osnovu dobivenih rezultata?
Prvo to uoavamo iz tabelarnog prikaza jeste da su distribucije frekvencija asimetrine, pa je
u ovom sluaju opravdano izraunati medijanu, uz koju se kao mjera varijabiliteta izraunava
interkvartilni raspon.
59
Statistika u psihologiji, prirunik za studente
Iz grafikog prikaza procentualnih ogiva odredit emo medijanu, prvi i trei kvartil za dvije
lokacije.
100%
rcf% 90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0 20,5 40,5 60,5 80,5 100,5 120,5
X
Lokacija A Lokacija B
Vrijednosti medijane, prvog i treeg kvartila koje smo oitali iz grafika navedene su u tabeli
ispod.
A B
Q1 25,1 62,9
C 46,0 75,2
Q3 65,8 89,4
PRIMJER 4.4
Na slici ispod dati su box-plot prikazi rezultata koje je jedna grupa ispitanika postigla na tri
testa (T1, T2 i T3). Svaki test sadri 20 zadataka, tako da je ispitanik mogao osvojiti maksimalno 20
bodova. Na osnovu grafikog prikaza odredit emo teine testova.
60
Statistika u psihologiji, prirunik za studente
20
18
16
14
12
10
0
T1 T2 T3
T1 T2 T3
Teinu testa moemo odrediti prema broju ispitanika koji tano rjeavaju zadatke. to je vei
broj ispitanika koji tano rjeavaju zadatke, to je test laki, i obratno, to je manji broj ispitanika koji
tano rjeavaju zadatke, to je test tei. Kod testa prosjene teine, podjednak je broj ispitanika ispod
i iznad prosjene vrijednosti.
Kako bi odredili teine testova, posmatrat emo razlike u distribuciji rezultata na tri testa, te
utvrditi vrijednosti medijane, prvog i treeg kvartila. Iz box-plot prikaza oitat emo vrijednosti
medijane te prvog i treeg kvartila.
T1 T2 T3
Q1 5,25 2,0 5,25
C 10,5 6,5 14,0
Q3 15,75 14,75 19,0
I duine linija koje spajaju pravougaonik sa graninikom koji predstavlja najvii, odnosno
najnii rezultat, ukazuju na simetrinost tj. asimetrinost rezultata. Ako je gornja linija dua od
donje, vjerovatno se radi o pozitivno asimetrinoj distribuciji. Ukoliko je donja linija dua od
gornje, onda je distribucija rezultata vjerovatno negativno asimetrina. Upravo takve odnose
uviamo i u naem primjeru.
Na osnovu distribucije rezultata moemo zakljuiti da je test 2 tei u odnosu na test 3, dok za
test 1 moemo tvrditi da je prosjene teine. Na testu 2 postignut je vei broj niih rezultata, dok je
na testu 3 postignut vei broj viih rezultata.
PRIMJER 4.5
Za utvrene visine uenika naeg IIIc odjeljenja, nakon to su utvrene mjere centralne
tendencije, potrebno je utvrditi i pokazatelje varijabiliteta. Obzirom da je rije o distribuciji koja se
svojim oblikom pribliava simetrinoj, u ovom sluaju mogu se izraunati sve mjere varijabiliteta.
Mi smo se odluili za utvrivanje interkvartilnog i poluinterkvartilnog raspona, standardne
devijacije te varijance. U tu svrhu ponovo e nam posluiti tabelarni prikaz distribucije visina
uenika:
Visina uenika
f rf(%) cf rcf(%)
(cm)
131 1 4 1 4
132 2 8 3 12
133 1 4 4 16
134 4 16 8 32
135 7 28 15 60
136 5 20 20 80
137 3 12 23 92
138 1 4 24 96
139 1 4 25 100
25 100
Iako se radio o negrupiranoj distribuciji rezultata, postupak raunanja kvartila praktino je isti
kao i kod grupiranih frekvencija rezultata.
62
Statistika u psihologiji, prirunik za studente
25 N i 75 N i
Q1 D fD Q3 D fD
100 fR 100 fR
25 25 1 75 25 1
Q 1 133,5 4 Q 3 135,5 15
100 4 100 5
Q1 = 134,06; Q3 = 136,25.
IQR = Q3 Q1
Interkvartilni raspon obuhvata 50% sredinjih rezultata. U naem primjeru, 50% uenika
visoki su izmeu 134,06 i 136,25.
s
fXi
2
M2
f i
Od ranije nam je poznato da aritmetika sredina distribucije iznosi 135,08 cm. Tabelarnom
prikazu distribucije podataka dodat emo stupce koji e nam posluiti za odreivanje standardne
devijacije:
63
Statistika u psihologiji, prirunik za studente
Visina uenika
f X-M (X-M)2 (X-M)2xf
(cm)
131 1 -4,08 16,65 16,65
132 2 -3,08 9,49 18,97
133 1 -2,08 4,33 4,33
134 4 -1,08 1,17 4,67
135 7 -0,08 0,01 0,04
136 5 0,92 0,85 4,23
137 3 1,92 3,69 11,06
138 1 2,92 8,53 8,53
139 1 3,92 15,37 15,37
25 83,84
v = s2 = 1,832 = 3,35 cm
Jasniju predstavu o varijanci rezultata oko njihove aritmetike sredine, tj. o izraenosti
variranja vrijednosti u distribuciji moe nam pruiti i grafiki prikaz. Na slici ispod svaki od uenika
IIIc odjeljenja predstavljen je kruiem.
64
Statistika u psihologiji, prirunik za studente
PRIMJER 4.6
0-4 7 7 7 2 4 28
5-9 0 7 7 7 49 0
10-14 0 7 7 12 144 0
15-19 0 7 7 17 289 0
20-24 0 7 7 22 484 0
25-29 0 7 7 27 729 0
30-34 0 7 7 32 1024 0
35-39 0 7 7 37 1369 0
40-44 0 7 7 42 1764 0
45-49 0 7 7 47 2209 0
50-54 0 7 7 52 2704 0
55-59 0 7 7 57 3249 0
60-64 0 7 7 62 3844 0
65-69 9 16 16 67 4489 40401
70-74 13 29 30 72 5184 67392
75-79 61 90 92 77 5929 361669
80-84 7 97 99 82 6724 47068
85-89 1 98 100 87 7569 7569
98 524127
65
Statistika u psihologiji, prirunik za studente
25 N i 75 N i
Q1 D fD Q3 D fD
100 fR 100 fR
Iz kolone rcf (%) oitavamo da se 25% distribucije formiralo u razredu 70 74, a 75%
distribucije odmah u narednom razredu 75 79 (iz ega je odmah jasno da nije rije o simetrinoj
distribuciji). Prema tome:
25 98 5
Q 1 69,5 16 72,77
100 13
75 98 5
Q 3 74,5 29 78,15
100 61
SQR=IQR/2=2,69
s
fXi
2
M2
524127
70,522 19,37 (bodova)
f i 98
66
Statistika u psihologiji, prirunik za studente
ZADACI
A 7 1 14 1 36 6 2 16 4 2
1 10 12 13 1 15 3 17 19 2
B 13 12 12 1 14 25 15 19 16 19
17 20 18 15 16 19 17 25 14 25
Najprije odredite koju mjeru varijabiliteta treba izraunati (s obzirom na distribucije rezultata), a
zatim ih izraunajte.
10. Na grupi od 20 studenata primjenjen je upitnik kojim se mjeri srameljivost. Dobiveni rezultati
prikazani su ispod.
1 1 1 1 2 2 2 2 4 6
7 10 10 13 13 15 16 16 17 40
67
Statistika u psihologiji, prirunik za studente
11. Za pet grupa podataka izraunate su vrijednosti prvog kvartila, centralne vrijednosti i treeg
kvartila. Na osnovu prikazanih vrijednosti, ta moete zakljuiti o obliku distribucije? Da li su
distribucije simetrine, ako nisu o kojoj se simetriji radi? U kojoj grupi podataka je najvea
varijabilnost rezultata?
I II III IV V
Q1 3 4 5 7 1
C 10 6 6 8 10
Q3 13 8 15 9 20
12. Ispod su prikazani histogrami distribucije rezultata ispitanika na etiri testa (A, B, C, D).
20 20
18 18
A B
16 16
14 14
12 12
f 10 f 10
8 8
6 6
4 4
2 2
0 0
0 4 8 12 16 20 24 28 32 36 40 0 4 8 12 16 20 24 28 32 36 40
20
20
18
18
16
16 C D
14
14
12
12 f 10
f 10
8
8 6
6 4
4 2
2 0
0 0 4 8 12 16 20 24 28 32 36 40
0 4 8 12 16 20 24 28 32 36 40
68
Statistika u psihologiji, prirunik za studente
42
40
38
36
34
32
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
0
T1 T2 T3 T4
T1 T2 T3 T4
13. Izraunajte interkvartilni raspon, varijancu i standardnu devijaciju za podatke iz zadatka 3.10 i
3.11.
14. Izraunajte interkvartilni raspon, standardnu devijaciju i varijancu za podatke iz zadatka 3.12.
Imajui u vidu dobivene vrijednosti varijance i standardne devijacije, jo jednom razmislite o
najpogodnijoj mjeri centralne tendencije distribucije.
15. Izraunajte interkvartilni raspon, varijancu i standardnu devijaciju za podatke iz zadatka 3.13.
16. Izraunajte mjere varijabiliteta za podatke iz primjera 2.2 i 2.9. Koju mjeru varijabiliteta trebamo
koristiti za adekvatnu deskripciju podataka svake od varijabli.
69
Statistika u psihologiji, prirunik za studente
Ako je sluajni eksperiment bacanje igrae kocke, skup svih moguih ishoda bit e = {1,2,3,4,5,6}. Dogaaj
za kojeg elimo utvrditi vjerovatnou je pojava parnog broja. Stoga je podskupa A={2,4,6}. Postoji n=6 svih
moguih ishoda, od kojih je m=3 povoljnih za dogaaj A. Tada je P(A) =3/6
P(A)=0,5
Vjerovatnoa dogaaja A iznosi 0,5
Kada je skup svih moguih ishoda beskonaan skup, klasina definicija vjerovatnoe nije
primjenljiva.
70
Statistika u psihologiji, prirunik za studente
Ako se sluajni eksperiment sastoji od bacanja igrae kocke, onda se uzastopno bacanje smatra ponavljanjem
sluajnog eksperimenta (u istim uvjetima). Neka je pojava parnog broja dogaaj A. Ako se nakon 100 uzasto-
pnih bacanja kocke dogaaj A ostvari 45 puta, kaemo da je frekvencija m=45. Tada je fA=45/100.
fA=0,45
1. Aditivna teorema
Za meusobno iskljuive dogaaje A1 i A2 vjerovatnoa da e se dogoditi ili A1 ili A2, jednaka
je sumi vjerovatnoa za svaki dogaaj posebno:
U kutiji se nalaze tri bijele, sedam crvenih i jedna crna kuglica. Kolika je vjerovatnoa da emo iz kutije
izvaditi bijelu/ crvenu/ crnu kuglicu?Kolika je vjerovatnoa da emo iz kutije izvaditi ili bijelu ili crvenu
kuglicu?
71
Statistika u psihologiji, prirunik za studente
P (A1) = 3/11
P (A2) = 7/11
P (A3) = 1/11
P(A1 A2) = P(A1) + P (A2) = 3/11 + 7/11 = 10/11
2. Multiplikaciona teorema
Vjerovatnoa istovremenog dogaanja dva ili vie nezavisnih dogaaja jednaka je produktu
pojedinanih vjerovatnoa tih dogaaja:
P(A1 A2) = P(A1) x P(A2)
Ako bacamo dvije kocke, kolika je vjerovatnoa da e i na jednoj i na drugoj kocki pasti broj 6?
P(A1 A2) = P(A1) x P(A2) = 1/6 x 1/6 = 1/36
Elementi skupa S={1,2,3,4,5,6} su ishodi sluajnog eksperimenta bacanja igrae kocke. Sa X oznaavamo
sluajnu varijablu za koju je S skup moguih vrijednosti. U sluaju idealne kocke, svakom ishodu sluajnog
eksperimenta pripada vjerovatnoa 1/6, tj. P(X=1)=1/6. Takoer vrijedi P(X=2)=1/6, itd., P(X=6)=1/6.
Vjerovatnoe svakog ishoda moemo prikazati na sljedei nain:
Vrijednosti 1 2 3 4 5 6
Vjerovatnoe 1/6 1/6 1/6 1/6 1/6 1/6
72
Statistika u psihologiji, prirunik za studente
Ako eksperiment radimo sa kockom koja nije idealna (jer je npr. pomaknuto teite), tada ishodi ne bi bili
jednako vjerovatni, ve bi im pripadale razliite vjerovatnosti (pi0, pi=1).
Binomna distribucija (situacije u kojima svaki broj nezavisnih pokuaja rezultira jednim od
dva mogua ishoda, pri emu pojavljivanje jednog ishoda iskljuuje mogunost pojavljivanja drugog
ishoda primjer bacanja novia) i Poissonova distribucija (raspodjela rijetkih dogaaja)
predstavljaju diskretne distribucije vjerovatnoa.
73
Statistika u psihologiji, prirunik za studente
PRIMJER 5.1
Neka su baene dvije kocke. Kolika je vjerovatnoa da je zbir brojeva koji se pojave na
kockama 7?
Svi mogui ishodi eksperimenta, tj. potpuni skup sastoji se od svih ureenih parova (i, j). U
svakom ureenom paru prvi element predstavlja broj koji se pojavljuje na gornjoj strani prve kocke,
a drugi element u paru predstavlja broj koji se pojavljuje na gornjoj strani druge kocke. Skup u
ovom primjeru ima 36 elemenata.
Dogaaj A, da je zbir brojeva koji se pojave na kockama 7, jeste sljedei podskup od :
= {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
Vjerovatnoa dogaaja A, jednaka je:
P(A) = 7 / 36=0,194
PRIMJER 5.2
U kutiji se nalaze pet bijelih, etiri ute i dvije crne kuglice. Kolika je vjerovatnoa da emo iz
kutije izvaditi svijetlu (bijelu ili utu) kuglicu?
Primjenit emo aditivnu teoremu, prema kojoj za meusobno iskljuive dogaaje A1 i A2
vjerovatnoa da e se dogoditi ili A1 ili A2 jednaka je sumi vjerovatnoa svakog pojedinanog
dogaaja. Dogaaj A1 je izvlaenje bijele, a dogaaj A2 je izvlaenje ute kuglice. Vjerovatnoe
dogaaja A1, A2 i A3 iznose:
P (A1) = 5/11
P (A2) = 4/11
P (A3) = 2/11.
Vjerovatnoa izvlaenja svijetle kuglice (ili bijele ili ute) iznosi:
PRIMJER 5.3
Ako bacamo dvije kocke, kolika je vjerovatnoa da e i na jednoj i na drugoj kocki pasti broj
1?
Prema multiplikacionoj teoremi, vjerovatnoa istovremenog dogaanja dva ili vie nezavisnih
dogaaja jednaka je produktu pojedinanih vjerovatnoa tih dogaaja. Vjerovatnoa dogaaja A 1
74
Statistika u psihologiji, prirunik za studente
PRIMJER 5.4
75
Statistika u psihologiji, prirunik za studente
PRIMJER 5.5
Tabela 5.5.1. Kombinacije brojeva i odgovarajui rezultati koji se mogu dobiti bacanjem dvije kocke
Kocka II
Kocka II
Kocka II
Kocka II
Kocka II
Kocka II
Rezultat
Rezultat
Rezultat
Rezultat
Rezultat
Rezultat
Kocka I
Kocka I
Kocka I
Kocka I
Kocka I
Kocka I
1 1 2 2 1 3 3 1 4 4 1 5 5 1 6 6 1 7
1 2 3 2 2 4 3 2 5 4 2 6 5 2 7 6 2 8
1 3 4 2 3 5 3 3 6 4 3 7 5 3 8 6 3 9
1 4 5 2 4 6 3 4 7 4 4 8 5 4 9 6 4 10
1 5 6 2 5 7 3 5 8 4 5 9 5 5 10 6 5 11
1 6 7 2 6 8 3 6 9 4 6 10 5 6 11 6 6 12
76
Statistika u psihologiji, prirunik za studente
77
Statistika u psihologiji, prirunik za studente
Gornja distribucija ima M=7 i s=2,42, te ima oblik normalne distribucije, to se moe vidjeti i
na slici 5.2.2.
S lika 5.2.2. T eorijs ka (o ekiv ana) dis tribuc ija rez ultata bac anja
dv ije koc ke 900 puta
160 0,18
140 0,16
0,14
120
0,12
100
0,1
f 80
0,08
60
0,06
40
0,04
20 0,02
0 0
1 2 3 4 5 6 7 8 9 10 11 12 13
R ez ultat
Sada moemo prei na empirijski dio eksperimenta. Studenti su prilikom 900 stvarnih bacanja
kocki dobili frekvencije prikazane u tabeli 5.5.4.
Opaena
Rezultat
frekvencija
2 21
3 57
4 66
5 83
6 126
7 147
8 139
9 97
10 81
11 54
12 29
900
78
Statistika u psihologiji, prirunik za studente
S lika 5.2.3. E mpirijs ka (opa ena) dis tribuc ija rez ultata bac anja
dv ije koc ke 900 puta
160 0,18
140 0,16
0,14
120
0,12
100
0,1
f 80
0,08
60
0,06
40
0,04
20 0,02
0 0
1 2 3 4 5 6 7 8 9 10 11 12 13
R ez ultat
PRIMJER 5.6
Posmatrajmo eksperiment bacanja dvije kocke. Kolika je vjerovatnoa da je zbir brojeva koji
se pojavljuju na kockama 6, uz uvjet da je drugi broj paran?
Neka je E dogaaj takav da je zbir brojeva koji se pojavljuju na kockama 6, tj. E = {(1,5),
(2,4), (3,3), (4,2), (1,5)}. Neka je F dogaaj da je broj koji se pojavljuje na drugoj kocki paran, tj.
F={(1,2), (2,2), (3,2), (4,2), (5,2), (6,2),(1,4), (2,4), (3,4), (4,4), (5,4), (6,4), (1,6), (2,6), (3,6), (4,6),
(5,6), (6,6)}.
79
Statistika u psihologiji, prirunik za studente
PRIMJER 5.7
Provedena su tri eksperimenta sa tri igrae kocke. U svakom eksperimentu igrau kocku bacali
smo 600 puta. Ispod su prikazane uestalosti pojavljivanja brojeva 1, 2, 3, 4, 5, 6.
Strana
Eksperiment 1 Eksperiment 2 Eksperiment 3
kocke
pe pt pe pt pe pt
1 0,167 0,167 0,083 0,167 0,168 0,167
2 0,163 0,167 0,117 0,167 0,165 0,167
3 0,170 0,167 0,217 0,167 0,170 0,167
4 0,155 0,167 0,133 0,167 0,168 0,167
5 0,183 0,167 0,250 0,167 0,163 0,167
6 0,162 0,167 0,200 0,167 0,165 0,167
total 1 1 1 1 1 1
80
Statistika u psihologiji, prirunik za studente
81
Statistika u psihologiji, prirunik za studente
6. Normalna raspodjela
Na slici 6.1 prikazan je histogram rezultata 100 ispitanika na testu X. Mnogi podaci, prikupljeni
od relativno velikog broja ispitanika, rasporeuju se slino kao to je prikazano na slici. Moemo
primjetiti da su krajevi histograma jednako udaljeni od jednog vrha pozicioniranog tano u sredini.
20
10
0
25,0 35,0 45,0 55,0 65,0 75,0
30,0 40,0 50,0 60,0 70,0
Krivulja nacrtana kroz histogram predstavlja matematiki model raspodjele rezultata i prua
kompaktnu sliku cjelokupne raspodjele rezultata (obzirom da je matematiki model idealizirana slika
raspodjele rezultata, zanemaruju se eventualna mala odstupanja).
Krivulja prikazana na slici je normalna krivulja i grafiki opisuje kontinuiranu raspodjelu
koju zovemo normalna raspodjela. Normalna raspodjela je zvonolikog oblika, simetrina i
unimodalna.
Matematiki je definirana izrazom:
82
Statistika u psihologiji, prirunik za studente
standardne devijacije. Aritmetika sredina nalazi se u centru raspodjele, tj. tjemenu krive, i iste je
vrijednosti kao i medijana.
Normalna raspodjela je vana u statistici jer:
vrijednosti mnogih psiholokih varijabli u populaciji se rasporeuju normalno,
osnova je za mnoge statistike testove, i
pod odreenim uvjetima, predstavlja aproksimaciju razliitih diskretnih raspodjela (binomne
i Poissonove).
Ukoliko znamo vrijednosti aritmetike sredine i standardne devijacije, tada moemo odrediti
broj rezultata unutar nekog opsega2. Odnosno vrijedi da se u...
intervalu nalazi se 68,26% svih rezultata
intervalu 2 nalazi se 95,44% svih rezultata
intervalu 3 nalazi se 99,73% svih rezultata
2
Odreivanje broja podataka unutar zadatog intervala provodi se integriranjem funkcije: , u intervalu od X1 do X2. U
statistikim tablicama koje se nalaze na kraju svakog udbenika iz statistike, unijete su vrijednosti na osnovu kojih moemo odrediti broj
podataka unutar nekog intervala.
83
Statistika u psihologiji, prirunik za studente
84
Statistika u psihologiji, prirunik za studente
85
Statistika u psihologiji, prirunik za studente
PRIMJER 6.1
Raspodjela vrijednosti holesterola u krvi u populaciji osoba iste dobne grupe i spola priblino
je normalna. Za 14-godinje djeake prosjena vrijednost u populaciji iznosi = 170 mg/dl, a
standardna devijacija = 30 mg/dl. Vrijednosti iznad 240 mg/dl zahtijevaju medicinski tretman.
Zanima nas postotak 14-godinjih djeaka koji imaju vrijednost holesterola veu od 240 mg/dl?
Potrebno je odrediti postotak djeaka sa X>240 mg/dl. U raspodjeli rezultata odreivanje
postotka djeaka sa X>240 mg/dl podrazumijevalo bi odreivanje proporcije, tj. povrine pod
normalnom krivuljom pomou formule koja matematiki definira normalnu krivulju. Umjesto toga,
koristit emo standardnu normalnu raspodjelu za koju su vrijednosti povrina pod krivuljom
izraunate i sistematizirane u tablici. Stoga emo najprije izraunati z-vrijednost za X=240, a zatim
iz tabele A oitati povrinu koja korespondira izraunatoj z-vrijednosti.
= 170 mg/dl
= 30 mg/dl
X = 240 mg/dl
XM 240 170
z= z=
s 30
z = 2,33
p=0,0099
z=2,33
Iz tablice emo oitati da povrina od z=2,33 do kraja krivulje iznosi p=0.0099, tj p0,01.
Pretvoreno u procente, povrina iznosi 1%.
Na kraju zakljuujemo da u populaciji moemo oekivati 1% djeaka dobi od 14 godina koji
imaju vrijednost holesterola u krvi veu od 240 mg/dl.
86
Statistika u psihologiji, prirunik za studente
PRIMJER 6.2
Prosjeno vrijeme trajanja trudnoe (od zaea do poroda) u populaciji iznosi =266 dana uz
varijabilnost od =16 dana. Raspodjela je priblino normalna.
a. Osoba A.B porodila se 282. dan. Koji postotak ena ima vrijeme trajanja trudnoe vee od osobe
A.B.?
= 266 dana
= 16 dana
X=282 dana
z=? XM 282 266
z= z=
s 16
z=1
p=0,1587
z=1
Iz tablice emo oitati da povrina od z=1 do kraja krivulje iznosi p=0,1587. Pretvoreno u
procente, povrina iznosi 15,87%. Na kraju, zakljuujemo da u populaciji moemo oekivati 15,87%
ena kod kojih trudnoa traje vie od 282 dana.
b. Osoba C.D. porodila se 250-ti dan trudnoe. Koji postotak ena ima vrijeme trudnoe vee od
osobe C.D.?
= 266 dana
= 16 dana
X = 250 dana
XM 250 266
z=? z= z=
s 16
z = -1
87
Statistika u psihologiji, prirunik za studente
p=0,1587
z=-1
Iz tablice emo oitati da povrina od z=-1 do blieg kraja krivulje iznosi p=0,1587.
Pretvoreno u procente povrina iznosi 15,68%. Meutim, povrina koja nas interesira nalazi se od z
do desnog kraja krivulje. Stoga emo zakljuiti da u populaciji moemo oekivati 100% - 15,87 % =
84,17 % ena kod kojih trudnoa traje vie od 250 dana.
88
Statistika u psihologiji, prirunik za studente
Iz izraza:
XM
z= slijedi da je: X = M + zs,
s
Dakle, u intervalu od 218 314 dana nalazi se 99,73% vrijednosti trajanja trudnoe.
Dakle, u intervalu od 298 234 dana nalazi se 95,44% sredinjih vrijednosti trajanja trudnoe.
Za p = 0,25, z = 0,68
X = M + zs
X = 266 + (-0,68)x16 = 255,12
Zakljuujemo da za ene koje se nalaze u prvom kvartilu vrijeme trajanja trudnoe iznosi
maksimalno 255 dana.
89
Statistika u psihologiji, prirunik za studente
PRIMJER 6.3
a. Koji postotak uenika postie rezultate vee od 600? Drugim rijeima, koliko iznosi centilni rang
rezultata 600?
XM
z=
s
z = (600 500)/100 = 1
p = 0,1587 P = 15,87%.
15,87% uenika postie rezultat vei od 600. Dakle, rezultat 600 lei na 84-om centilu (100-
15,87=84,1384).
b. Koji postotak uenika postie rezultate manje ili jednake 400? Drugim rijeima, koliko iznosi
centilni rang rezultata 400?
XM
z=
s
z = (400 500)/100 = -1
p = 0,1587
P = 15,87%,
Dakle, 15,87% uenika postie rezultat manji ili jednak 400. Rezultat 400 lei na 16-om
centilu (ispod ovog rezultata nalazi se oko 16% rezultata).
c. Koji rezultat je jednak manji od 75% rezultata postignutih na testu? Drugim rijeima, koliko
iznosi 25 centil?
p = 0,25
z = - 0,67
X = M + zs = 500 - 0,67x100 = 433
Rezultat 433 nalazi se na 25 centilu (ovaj rezultat je jednak ili manji od 75% postignutih
rezultata).
90
Statistika u psihologiji, prirunik za studente
500 500
z1 = =0
100
500 550
z2 = = -0,55
90
PRIMJER 6.4
91
Statistika u psihologiji, prirunik za studente
d. MENSA je organizacija koja okuplja ljude sa visokim IQ. lanovima ove organizacije moe
postati samo 2% osoba sa najviim IQ rezultatima. Koliko iznosi najmanji rezultat koji prua
mogunost ulanjenja u MENSA-u? Zapravo, interesira nas koja z vrijednost odgovara postotku od
2% najviih rezultata ispod standardne normalne krive. Iz tabele oitavamo da je to z=2,05.
X = M + zs
X = 100 + 2,05x16
X = 132,8
Dakle, najmanji IQ rezultat koji prua mogunost ulanjenja u MENSA-u iznosi 132,8.
PRIMJER 6.5
U primjeru 2.3 raspodjele visina uenika IIIc odjeljenja smo prikazivali tabelarno i grafiki te
smo ilustrovali vrste informacija koje moemo ekstrahirati iz ovih prikaza. Na ovom mjestu emo
pokazati da do istih informacija moemo doi sluei se standardnom normalnom raspodjelom
(obzirom da je i originalna raspodjela visina uenika takoer normalna) te pripadajuom tablicom p
vrijednosti pod krivom standardne normalne raspodjele. U primjerima 3.4 i 4.5 utvrdili smo
prosjenu vrijednost i pripadajuu standardnu devijaciju za raspodjelu visina 25 uenika IIIc
odjeljenja: M = 135,08 cm i s = 1,83 cm.
XM 135,5 135,08
z= = = 0,23
s 1,83
XM 136,5 135,08
z= = = 0,78
s 1,83
92
Statistika u psihologiji, prirunik za studente
0,25
Iz tablic e o itavamo da s e od z = 0.23 do kra ja
distribuc ije nalaz i 40,90% povr ine dis tribuc ije (tj.
40,90% rez ultata u dis tribuc iji). O vaj dio dis tribuc ije z vat
d emo povr inom 1 (P 1). 0,2
Meutim, mi elimo z nati proc enat dis tribuc ije iz meu ove
0,05
dvije vrijednos ti (taj dio dis tribuc ije oz na en je kos im linijama).
Taj dio dis tribuc ije odgovara upravo ra z lic i iz meu P 1 i P 2 pa
d emo ga tako i utvrditi:
P 1 - P 2 = 40,90 - 21,77 = 19,13.
Dakle, 19,13% 0 u enika IIIc odjeljenja vis oko je iz meu 135,5 i
-4 -3 -2 -1 0 1 2 3 136,5 c m. 4
z = 0,23 z = 0,78
Granini z rezultat koji odvaja 40% najniih uenika takoer moemo dobiti vrlo jednostavno
samo emo tablicu p vrijednosti ispod standardne normalne krive korsititi u obratnom smjeru:
proporciji od 0,4000 povrine ispod krive odgovara priblina z-vrijednost od - 0,25 (z vrijednost je
negativna obzirom da se nalazi ispod aritmetike sredine).
Jo jednom, izraavajui formulu za z rezultate preko X dolazimo do jednaine:
X = M + zs = 135,08 + (-0,25)x1,83 = 134,62
40% uenika IIIc odjeljenja nie je od 134,62 cm (na osnovu ogive u primjeru 2.3 mi smo
ovu granicu postavili na visinu od oko 134,75 cm).
93
Statistika u psihologiji, prirunik za studente
0,2
0,15
O d z = 1,05 do bli eg kraja
dis tribuc ije nalaz i s e 14,69%
dis tribuc ije.
0,1
0,05
0
-4 -3 -2 -1 0 1 2 3 4
z = 1,05
0,15
O d z = 1,05 do bli eg kraja
Sa prethodnog grafika vidimo da je 14,69% uenika vie dis tribuc ije nalaz i s e 14,69%
dis tribuc ije (P 2).
z = 0,18 z = 1,05
42,45% uenika IIIc odjeljenja (ili njih 11) visoko je P roc enat dis tribuc ije iz meu z = 0,18 i
izmeu 134,75 cm i 137 cm. z = 1,05 dobid emo tako to d emo od ukupne
povr ine (tj. 100% ) dis tribuc ije oduz eti one
dijelove koji nam "ne trebaju", tj. P 1 i P 2:
100% - 42,86% - 14,69% = 42,45% .
94
Statistika u psihologiji, prirunik za studente
ZADACI
1. U primjerima 2.3, 3.4 i 4.5 utvrdili smo karakteristike distribucije visina uenika IIIc odjeljenja
(izmeu ostalog i to da distribucija ima M = 135,08 cm i s = 1,83 cm). Utvrdite u kojem rasponu
rezultata se u ovoj raspodjeli nalazi:
2. Iste raspone utvrdite i za distribucije iz zadataka: 2.1, 2.3, 3.1, 3.2, 3.3 i 3.4.
a. X = 28.
b. X = 32.
c. X = 36.
d. X = 24.
e. X = 16.
4. Distribucija rezultata ima M = 95 i s = 12. Utvrdite vrijednosti sirovih rezultata kojima u ovoj
distribuciji odgovaraju sljedee z-vrijednosti:
a. z = 2,5.
b. z = -1,8.
c. z = 0.
d. z = 1.
e. z = 2.
f. z = -3.
Obratite panju na rezultate koje ste dobili u zadacima c., d., e. i f. Objasnite zato ste dobili
upravo te sirove vrijednosti.
5. Distribucija rezultata ima s = 9. Ako rezultatu X = 36 u ovoj distribuciji odgovara z = -2,2, koliko
iznosi aritmetika sredina distribucije?
6. Distribucija ima M = 41. Ako rezultatu X = 28 u ovoj distribuciji odgovara z = - 3,2, koliko
iznosi standardna devijacija distribucije?
95
Statistika u psihologiji, prirunik za studente
a. X = 26.
b. X = 21.
c. X = 40.
d. X = 55.
e. X = 63.
f. X = 30.
a. X = 48
b. X = 41
c. X = 54
d. X = 57
e. X = 62
f. X = 65
Za svaki od navedenih rezultata utvrdite procenat rezultata izmeu datog rezultata i aritmetike
sredine distribucije.
9. Distribuciju visina uenika IIIc odjeljenja (iz primjera 2.3, 3.4 i 4.5) predstavite pomou
histograma. Zatim sve rezultate iz distribucije pretvorite u z-rezultate te dobivenu z-distribuciju
prikaite na histogramu. Da li se oblik distribucije promijenio? Objasnite.
10. Obratite panju na predznak odgovarajuih z-rezultata za visine dva najnia i dva najvia uenika
u IIIc odjeljenju. ta vam govori predznak utvrenih z-rezultata?
11. Za potrebe regrutiranja novih vojnika, Ministarstvo odbrane je testom inteligencije testiralo
ukupno 1350 ispitanika. Dobivena je normalna distribucija rezultata sa sljedeim deskriptivnim
vrijednostima: M = 202 i s = 38. Utvrdite z-vrijednosti za ispitanike sa sljedeim rezultatima:
a. X1 = 115
b. X2 = 236
c. X3 = 302
d. X4 = 345
e. X5 = 98
f. X6 = 152
g. Za svakog od navedenih ispitanika utvrdite broj ispitanika koji su ostvarili bolji rezultat.
h. Utvrdite broj ispitanika koji se po rezultatu na testu inteligencije nalaze izmeu ispitanika 1 i
4; 2 i 5; 2 i 4; 1 i 6.
i. Utvrdite koji (sirovi) rezultat dijeli distribuciju na 50% slabijih i 50% boljih ispitanika.
96
Statistika u psihologiji, prirunik za studente
j. Ukoliko Ministarstvo odbrane eli regrutovati samo 250 najboljih ispitanika, koji (sirovi)
granini rezultat e koristiti prilikom selekcije kandidata?
k. Ukoliko Ministarstvo odbrane eli regrutovati 35% najboljih kandidata, koji (sirovi) granini
rezultat e koristiti prilikom selekcije kandidata?
12. Velika programerska kompanija eli zaposliti 25 novih radnika. Na konkurs se prijavilo ukupno
89 kandidata. Svi kandidati su testirani na Testu matematike i Testu informatike. Distribucije
utvrenih rezultata na ova dva testa imaju sljedee deskriptivne pokazatelje:
a. Na intervju za posao bie pozvani svi kadidati koji su na Testu matematike ostvarili najmanje
145 bodova. Koliko kandidata e biti pozvano na intervju?
b. Kompanija je zaposlila sve intervjuirane kandidate. Obzirom da je ostao odreeni broj
nepopunjenih radnih mjesta, rukovodioci sektora za ljudske resurse odluili su organizirati
informatiku obuku za najbolje meu preostalim (nezaposlenim) kandidatima. Na trening su
odluili pozvati 20% kandidata koji su na Testu matematike ostvarili najbolje rezultate kada
se iz poetne skupine iskljue kandidati koji su ve dobili posao. Koji rezultat na Testu
matematike e biti koriten kao granini prilikom odluivanja koga pozvati na trening?
c. Kandidat A je na Testu matematike ostvario rezultat 120, a na Testu informatike 48. Kandidat
B je na Testu matematike ostvario 131 bodova, a na Testu informatike 42 boda. Ako
kompanija oba testa smatra jednako vanim, koji od ova dva kandidata bi trebao imati
prednost pri zapoljavanju?
13. U medicini se smatra da je normalna vrijednost sistolikog krvnog pritiska kod odraslih
mukaraca 120 mm/Hg. U velikom epidemiolokom istraivanju (provedenom na podruju cijele
drave) na reprezentativnom uzorku od N = 3.500 odraslih mukaraca utvreno je da se
vrijednosti sistolikog krvnog pritiska normalno distribuiraju sa M = 126 mm/Hg i s = 11
mm/Hg.
a. Koji procenat odraslog mukog stanovnitva ima sistoliki krvni pritisak vei od normalnog?
Ako u datoj dravi ivi ukupno 4.250.827 odraslih mukih stanovnika, koliko njih ima
sistoliki krvni pritisak vei od normalnog?
b. Ako je drava u lijeenju pacijenata sa sistolikim krvnim pritiskom veim od 160 mm/Hg
duna uestvovati sa 3.80 Eur mjeseno po pacijentu, kolike mjesene trokove lijeenja ove
bolesti moe oekivati ministar zdravstva date drave?
14. Prema novom zakonu o socijalnoj pomoi, domainstva u dravi podijeljenja su u 6 kategorija
prema visini mjesenih primanja:
97
Statistika u psihologiji, prirunik za studente
Prema istom zakonu, domainstva Kategorije I mjeseno e dobivati socijalnu pomo u iznosu od
150 KM; domainstva Kategorije II mjeseno e dobivati 95 KM; domainstva kategorije III
mjeseno e dobivati 50 KM socijalne pomoi.
Ako u dravi ima ukupno 2.256.897 registriranih domainstava te ako se njihova mjesena
primanja rasporeuju u obliku normalne raspodjele sa M = 1.486 KM i s = 365 KM, koliko novca
e drava mjeseno plaati socijalno ugroenim domainstvima?
15. Utvrdite vrijednosti skjunisa i kurtozisa za distribuciju visina uenika IIIc odjeljenja (primjeri
2.3, 3.4 i 4.5)? ta moete zakljuiti o obliku ove distribucije na temelju dobivenih vrijednosti?
11 4 9 7 5 8
3 5 2 2 1 12
5 4 6 11 9 5
6 5 7 5 6 4
8 3 7 6 8
98
Statistika u psihologiji, prirunik za studente
1. Populacija
2. Uzorak
3. Deskripcija i
analiza
4. Statistiko podataka iz
zakljuivanje uzorka
Populaciju ine svi lanovi neke grupe s odreenom karakteristikom koju mjerimo.
Deskriptivne vrijednosti populacije nazivamo parametrima: aritmetika sredina populacije i
standardna devijacija populacije.
Uzorak je podskup populacije na kojem se vri istraivanje. Da bi se rezultati dobiveni
istraivanjem na uzorku mogli generalizirati na populaciju iz koje je uzorak izvuen, uzorak mora
biti reprezentativan. Deskriptivne statistike vrijednosti (M i s) koje smo dobili na uzorku
99
Statistika u psihologiji, prirunik za studente
100
Statistika u psihologiji, prirunik za studente
M =
2M =2 / N
3. Varijance uzoraka ine takvu raspodjelu oko prave varijance da im aritmetika sredina
odgovara pravoj varijanci:
s2 = 2
4. Standardna devijacija aritmetikih sredina uzoraka oko prave aritmetike sredine populacije
je standardna pogreka aritmetike sredine.
sM = M
101
Statistika u psihologiji, prirunik za studente
PRIMJER 7.1
Istraiva je u jednom manjem mjestu zaposlene graane pitao o visini njihove mjesene
zarade. Na taj nain dobio je bazu podataka sa iznosima mjesenih plata za N=10000 ispitanika
[obzirom da se u ovom skupu nalaze sve zaposlene osobe koje ive u tom mjestu, ovaj skup
nazivamo populacijom (zaposlenih osoba tog mjesta), a vrijednosti koje utvrdimo na ovim podacima
parametrima]. U tabeli 7.1.1 prezentirane su vrijednosti parametara ove populacije.
1600
1400
1200
1000
f 800
600
400
200
0
201 - 300,5
301 - 400,5
401 - 500,5
501 - 600,5
601 - 700,5
701 - 800,5
801 - 900,5
901 - 1000,5
1001 - 1100,5
1101 - 1200,5
1201 - 1300,5
1301 - 1400,5
1401 - 1500,5
1501 - 1600,5
1601 - 1700,5
1701 - 1800,5
1801 - 1900,5
1901 - 2000,5
2001 - 2100,5
2101 - 2200,5
102
Statistika u psihologiji, prirunik za studente
aritmetikih sredina. Dobivene aritmetike sredine i standardne devijacije za svaki formirani uzorak
prezentirane su u tabeli 7.1.2.
Redni broj
M s
uzorka
1 1159,21 237,79
2 1214,20 239,18
3 1195,01 268,70
4 1278,40 238,58
5 1161,32 217,88
6 1240,94 212,18
7 1215,48 247,92
8 1176,50 211,59
9 1221,17 214,70
10 1200,65 253,94
11 1216,56 262,68
12 1217,22 235,36
13 1278,56 273,00
14 1199,91 273,00
15 1155,46 300,92
16 1206,81 257,02
17 1183,36 269,74
18 1149,56 262,79
19 1193,08 216,72
20 1252,95 251,02
21 1228,54 246,04
22 1232,06 268,92
23 1164,10 269,81
24 1227,48 252,53
25 1193,44 237,11
26 1255,06 215,68
27 1171,73 211,25
28 1221,07 252,71
29 1296,07 240,02
30 1280,11 301,00
31 1191,20 228,79
32 1237,17 282,83
33 1281,10 165,10
34 1207,93 225,83
35 1174,78 252,89
36 1185,07 265,55
37 1187,82 285,36
38 1174,19 274,89
39 1264,19 234,01
40 1239,55 257,59
41 1126,24 288,01
42 1265,88 291,30
43 1201,25 324,63
44 1245,73 287,20
45 1202,71 284,12
46 1140,33 194,30
47 1093,32 223,49
48 1213,18 238,48
49 1149,27 266,60
50 1255,80 279,99
M 1208,45 251,81
s 44,10
Prije svega, primjeujemo da niti jedna od utvrenih aritmetikih sredina formiranih uzoraka
ne odgovara (u potpunosti) aritmetikoj sredini populacije. Sve aritmetike sredine uzoraka vie ili
manje variraju oko prave populacijske aritmetike sredine. Ova pojava je sasvim oekivana
aritmetiku sredinu uzorka koja u potpunosti odgovara aritmetikoj sredini populacije po sluaju
moemo oekivati iznimno rijetko.
Ipak, ukoliko populacijska distribucija ima oblik normalne raspodjele te ukoliko iz te
populacije po sluaju formiramo dovoljan broj uzoraka iste veliine i izraunamo njihove
103
Statistika u psihologiji, prirunik za studente
aritmetike sredine, primjetiemo da se te aritmetike sredine uzoraka grupiraju oko jedne centralne
vrijednosti u obliku normalne raspodjele. Centralna vrijednost oko koje se te aritmetike sredine
grupiraju odgovara pravoj populacijskoj aritmetikoj sredini (vidi pravilo 1 u uvodnom dijelu).
Kako smo mi iz nae poetne, normalne populacije od 10000 lanova formirali relativno
veliki broj uzoraka (50) iste veliine (n=30), moemo empirijski provjeriti gornju tvrdnju. Dakle, iz
tabele 7.1.2 vidimo da zajednika aritmetika sredina aritmetikih sredina svih uzoraka, tj.
aritmetika sredina distribucije aritmetikih sredina uzoraka iznosi M=1208,453. Ova
vrijednost bliska je populacijskoj aritmetikoj sredini od =1200,47. Slika 7.1.2 ilustrira kako se
aritmetike sredine uzoraka distribuiraju oko svoje zajednike aritmetike sredine.
12
10
f 6
0
1091 - 1110,5
1111 - 1130,5
1131 - 1150,5
1151 - 1170,5
1171 - 1190,5
1191 - 1210,5
1211 - 1230,5
1231 - 1250,5
1251 - 1270,5
1271 - 1290,5
1291 - 1310,5
Aritmetike sredine uzoraka (mjesena primanja u KM)
Prema pravilu 2, varijanca distribucije aritmetikih sredina uzoraka jednaka je varijanci originalne
populacije, podjeljenoj s veliinom uzorka, tj:
s2M = 2 / N
3
U uvodnom dijelu, za oznaavanje deskriptivnih vrijednosti distribucije aritmetikih sredina uzoraka koriteni su simboli za oznaavanje
populacijskih vrijednosti ( i ) obzirom da se misli na teoretsku, beskonano veliku populaciju aritmetikih sredina beskonano velikog
broja uzoraka iste veliine koji se mogu izvui iz beskonano velike poetne populacije. Obzirom da u ovom primjeru radimo sa
konkretnom distribucijom aritmetikih sredina 50 uzoraka (to je, u sutini, samo uzorak svih moguih aritmetikih sredina uzoraka koji
se mogu izvui iz poetne populacije), za oznaavanje deskriptivnih vrijednosti ove distribucije koristiemo se oznakama koje se i inae
koriste za uzorke M i s.
104
Statistika u psihologiji, prirunik za studente
s2M = 2 / N
tj.
sM = / N
sM = 259,63/ 30 = 47,40
Ms2 = 2
Ms = ,
tj. prosjek standardnih devijacija uzoraka jednak je standardnoj devijaciji populacije. Provjerimo to
na naem primjeru u tabeli 7.1.2 moemo vidjeti da je prosjena standardna devijacija 50 uzoraka
Ms=251,81 to je vrijednost slina populacijskoj standardnoj devijaciji = 259,63.
Primjetili ste da u dosadanjem dijelu ovog Proglavlja kada govorimo o odnosu populacijskih
vrijednosti i vrijednosti koje izraunavamo za distribuciju aritmetikih sredina uzoraka esto
koristimo odrednice priblino, blisko, slino, tj. da nije demonstrirana apsolutna tanost tri
razmatrana pravila. Razlog za to je to ova pravila vrijede za teoretske, beskonano velike populacije
iz kojih po sluaju izvlaimo beskonano veliki broj uzoraka iste veliine. Ipak, i kada radimo sa
realnim populacijama i brojem uzoraka koji je relativno mali (u naem primjeru samo 50) vidimo da
navedena pravila prilino dobro funkcioniraju.
Jedan od naina da se jo vie pribliimo populacijskim vrijednostima (pored izvlaenja veeg
broja uzoraka iz populacije) jeste da iz populacije izvlaimo vee uzorke. Slino kao i u uvodnom
dijelu, to emo demonstrirati tako to emo iz nae populacije izvui po 50 sluajnih uzoraka
veliine n=300, odnosno n=800.
105
Statistika u psihologiji, prirunik za studente
Populacijske vrijednosti:
1200,47
259,63
106
Statistika u psihologiji, prirunik za studente
najue grupiraju oko svoje zajednike aritmetike sredine (koja je, jo jednom, vrlo bliska
populacijskoj aritmetikoj sredini razlika je samo 0,27 KM).
Razlike izmeu distribucija aritmetikih sredina uzoraka razliite veliine jo su uoljivije
na slici 7.1.3.
Slika 7.1.3.: Usporedba distribucija 50 aritmetikih sredina uzoraka veliina n=30, n=300 i n=800
n = 30 n = 300
12 25
10
20
8
15
f 6 f
10
4
2 5
0
0
1091 - 1110,5
1111 - 1130,5
1131 - 1150,5
1151 - 1170,5
1171 - 1190,5
1191 - 1210,5
1211 - 1230,5
1231 - 1250,5
1251 - 1270,5
1271 - 1290,5
1291 - 1310,5
1091 - 1110,5
1111 - 1130,5
1131 - 1150,5
1151 - 1170,5
1171 - 1190,5
1191 - 1210,5
1211 - 1230,5
1231 - 1250,5
1251 - 1270,5
1271 - 1290,5
1291 - 1310,5
Aritmetike sredine uzoraka (mjesena primanja u KM) Aritmetike sredine uzoraka (mjesena primanja u KM)
n = 800
40
35
30
25
f 20
15
10
0
1091 - 1110,5
1111 - 1130,5
1131 - 1150,5
1151 - 1170,5
1171 - 1190,5
1191 - 1210,5
1211 - 1230,5
1231 - 1250,5
1251 - 1270,5
1271 - 1290,5
1291 - 1310,5
sM =s / N
1. na uzorak samo je jedan od svih moguih uzoraka veliine n=800 koji se mogu izvui iz
nae populacije;
2. dakle, aritmetika sredina naeg uzorka je samo jedna od svih moguih aritmetikih
sredina svih moguih uzoraka veliine n=800 koji se mogu izvui iz nae populacije, a
koje ine teoretsku distribuciju aritmetikih sredina uzoraka;
M = / N
108
Statistika u psihologiji, prirunik za studente
moemo doi jeste ona preko standardne devijacije uzorka, a koja se naziva standardna
pogreka aritmetike sredine i koja se rauna prema formuli:
sM = s / N
1 sM: 68,26 % rezultata
2 sM: 95,44 % rezultata
3 sM: 99,73 % rezultata
Postotak rezultata koji se nalaze u naznaenim intervalima oko aritmetike sredine raspodjele
(a to je populacijska aritmetika sredina) nije nita drugo do vjerovatnoama da emo kada po
sluaju izvlaimo jedan rezultat iz ove raspodjele dobiti rezultat ba iz tog intervala.
Prilikom izvlaenja sluajnog uzorka iz populacije i raunanja njegove aritmetike sredine mi
radimo upravo to iz distribucije aritmetikih sredina uzoraka po sluaju izvlaimo jednu
aritmetiku sredinu. Pri tome imamo vjerovatnou od 68,26, 95,44, odnosno 99,73% da emo
izvui aritmetiku sredinu koja je od populacijske aritmetike sredine () udaljena manje od jedne,
dvije, odnosno tri standardne pogreke aritmetike sredine (sM).
Koristei se obratnom logikom ako naoj aritmetikoj sredini uzorka (M) dodamo i
oduzmemo jednu, dvije, odnosno tri standardne pogreke aritmetike sredine (sM) imaemo ansu od
68,26, 95,44, odnosno 99,73% da emo u istom tom intervalu obuhvatiti i pravu populacijsku
aritmetiku sredinu. U svrhu ilustracije ta je situacija prikazana na slici 7.3.
109
Statistika u psihologiji, prirunik za studente
Slika 7.1.4.a.
M
M 1 sM: 68,26 % rezultata
M 2 sM: 95,44 % rezultata
M 3 sM: 99,73 % rezultata
Ako ovu vrijednost jednom, dva, odnosno tri puta dodamo i oduzmemo vrijednosti M dobit emo
sljedee intervale:
Interval I: 1193,36 - 1211,72
Interval II: 1184,17 - 1220,91
Interval III: 1174,99 - 1230,09
Kao to vidite, svi ovi intervali sadre vrijednost populacijske aritmetike sredine,
=1200,47 KM. Dakle, u stvarnim istraivanjima provedenim na uzorcima mi nikada neemo znati
tanu vrijednost populacijske aritmetike sredine; najvie to emo moi uiniti jeste odrediti
interval u kojem se sa odreenim stepenom sigurnosti ta aritmetika sredina nalazi. Ti intervali
nazivaju se intervalima pouzdanosti i vezuju se uz odreeni stupanj sigurnosti da se u njima
nalazi traena vrijednost populacijske aritmetike sredine. Tako, za interval I sa 68,26% sigurnosti
tvrdimo da se u njemu nalazi populacijska aritmetika sredina; za interval II to tvrdimo sa 95,44%
sigurnosti; za interval III sa 99,73% sigurnosti.
110
Statistika u psihologiji, prirunik za studente
PRIMJER 7.3
U primjeru 5.6 opisali smo eksperiment studenata psihologije sa bacenjem para igraih
kockica 900 puta. Sada emo iste dobivene rezultate iskoristiti za ilustraciju principa uzorkovanja i
distribuiranja aritmetikih sredina uzoraka oko prave (populacijske) aritmetike sredine .
Pri tome emo, naravno, krenuti od populacije. Nau populaciju u ovom sluaju ini 900
rezultata dobivenih bacanjem para kocaka (mogui rezultati kreu se u rasponu od 2 do 12).
Prisjetimo se i izgleda raspodjele rezultata koje dobijemo bacajui par kocaka 900 puta (vidi sliku
5.2.3). Ta je raspodjela ponovo prikazana na slici 7.1.1 i ovaj put je nazvana populacijskom
raspodjelom (obzirom da predstavlja nau populaciju od N=900 rezultata). Ve znamo da ova
distribucija ima =7,13 i =2,43.
160 0,18
140 0,16
120 0,14
0,12
100
0,1
f 80
0,08
60
0,06
40 0,04
20 0,02
0 0
1 2 3 4 5 6 7 8 9 10 11 12 13
Rezultat
Svaki par studenata dvije kockice je bacao po 20 puta. Ukupno je bilo 45 parova studenata,
ime dobivamo nau populaciju od ukupno 900 rezultata. Obzirom da rezultati svakog pojedinog
para studenata mogu predstavljati jedan od moguih uzoraka koji se moe izvui iz nae populacije,
ove skupove od po 20 rezultata koje su dobili pojedinani parovi studenata od sada emo nazivati
uzorcima. Vano je napomenuti da su svi uzorci iste veliine, n=20. U tabeli 7.1.1 prikazane su
aritmetike sredine za 45 uzoraka.
Na osnovu aritmetikih sredina pojedinanih uzoraka moemo izraunati zajedniku
aritmetiku sredinu, odnosno aritmetiku sredinu aritmetikih sredina uzoraka te standardnu
devijaciju ove distribucije aritmetikih sredina uzoraka. Kako bismo ovu zajedniku aritmetiku
sredinu razlikovali od aritmetike sredine populacije () i aritmetikih sredina pojedinanih uzoraka
(M), oznait emo je sa X. Standardnu devijaciju aritmetikih sredina uzoraka oko njihove
zajednike aritmetike sredine oznait emo sa s.
111
Statistika u psihologiji, prirunik za studente
N 45
X' 7,127
s' 0,597
Dakle, aritmetika sredina pojedinanih uzoraka iznosi X=7,13. Kao to vidite, aritmetika
sredina distribucije aritmetikih sredina uzoraka iste veliine koji su po sluaju izvueni iz
populacije istovjetna je populacijskoj (pravoj) aritmetikoj sredini.
Aritmetike sredine pojedinih uzoraka distribuiraju se oko ove zajednike (tj. populacijske)
aritmetike sredine u obliku normalne distribucije.
Iako gornja tvrdnja vrijedi za veliki broj uzoraka (teoretski, za beskonano veliki broj uzoraka
iste veliine koji se izvlae iz beskonano velike populacije), tendencija normalnog distribuiranja
aritmetikih sredina uzoraka oko populacijske aritmetike sredine primjetna je i na grafikom
prikazu distribucije naih 45 aritmetikih sredina (slika 7.1.2). [Ukoliko bismo iz nae populacije od
N=900 nastavili izvlaiti nove i nove uzorke veliine n=20, donja distribucija bi sve vie nalikovala
normalnoj distribuciji].
14
12
10
8
f
6
4
2
0
6 6,5 7 7,5 8 8,5
Vrijednost aritmetikih sredina
s
sM =
113
Statistika u psihologiji, prirunik za studente
0
M= 7,73
0 X' = =7,13
0
4,50
4,75
5,00
5,25
5,50
5,75
6,00
6,25
6,50
6,75
7,00
7,25
7,50
7,75
8,00
8,25
8,50
8,75
9,00
9,25
9,50
X's M 68,26%
X'1,96s M 95,44%
X'2,58s M 99,73%
Ako sada jo jednom primjenimo istu logiku samo u obratnom smjeru moemo zakljuiti
sljedee: ako aritmetikoj sredini jednog uzorka dodamo i oduzmemo jednu, dvije, odnosno tri
standardne pogreke aritmetike sredine, imat emo 68,26%, 95,44%, odnosno 99,73% anse da u
dobivenim intervalima obuhvatimo i vrijednost prave aritmetike sredine (vidi gornju sliku).
Razlog zato aritmetikoj sredini uzorka dodajemo i oduzimamo standardnu pogreku
aritmetike sredine jeste taj to mi ne znamo koja je vrijednost standardne devijacije u distribuciji
aritmetikih sredina uzoraka (podsjeamo, iz populacije izvlaimo samo jedan uzorak). Standardna
pogreka aritmetike sredine slui nam kao procijena vrijednosti standardne devijacije
distribucije aritmetikih sredina uzoraka!
Prema tome, koristei formulu za standardnu pogreku aritmetike sredine:
s
sM =
2,28
sM = = 0,51
20
Kao to se moe vidjeti, rije je o vrlo bliskoj vrijednosti standardne pogreke koju smo
izraunali kao standardnu devijaciju distribucije aritmetikih sredina 45 uzoraka (sM = 0,60).
114
Statistika u psihologiji, prirunik za studente
PRIMJER 7.3
Ljekar ope prakse eli doi do informacije o prosjenoj visini populacije djeaka izmeu 10 i
12 godina Kantona Sarajevo. Meutim zbog praktine neizvodljivosti, ljekar niti ne razmilja o
provoenju istraivanja na cjelokupnoj populaciji. Umjesto toga, svoje e istraivanje provesti na
reprezentativnom (sluajnom) uzorku uenika sarajevskih osnovnih kola koji imaju izmeu 8 i 10
godina. Uzorak broji 350 uenika. Vrijednosti utvrene na uzorku su:
M = 139,36 cm
s = 26,22 cm
Na temelju ovih vrijednosti mogue je procijeniti prosjenu visinu muke djece ovog uzrasta u
pripadajuoj populaciji (i uz svaku procjenu mogue je navesti i stupanj sigurnosti da je tana).
Prvo to je ljekar uradio sa dobivenim statisticima jeste da je izraunao standardnu pogreku
aritmetike sredine:
s 26,22
sM = = = 1,40
N 350
U svom zavrnom izvjetaju ljekar je naveo da sa 95% sigurnosti tvrdi da se prava prosjena
visina (svih) djeaka izmeu 10 i 12 godina u Kantonu Sarajevo nalazi u intervalu od 136,56 do
142,16 cm.
Dakle, intervale koje dobijemo kada aritmetikoj sredini uzorka na jednoj strani oduzmemo i na
drugoj strani dodamo jednu, dvije, odnosno tri standardne pogreke aritmetike sredine nazivamo
intervalima pouzdanosti aritmetike sredine. Uz svaki interval pouzdanosti vezuje se odreeni
stepen sigurnosti da se u njemu nalazi prava (populacijska) aritmetika sredina (ti odgovarajui
stupanj sigurnosti su 68%, 95%, odnosno 99%).
115
Statistika u psihologiji, prirunik za studente
ZADACI
2. Za koliko bismo trebali promijeniti veliinu uzorka da bismo standardnu pogreku aritmetike
sredine smanjili za pola; da bismo standardnu pogreku aritmetike sredine smanjili za 4 puta?
8. Iz tabele 7.1.3 po sluaju odaberite jedan uzorak veliine n=30. Na temelju tog uzorka
procijenite populacijsku aritmetiku sredinu mjesenih primanja u populaciji. Da li vrijede
pravila navedena u uvodnom dijelu?
Ponovite isti postupak kao u prethodnom zadatku, sa jednim uzorkom veliine n=300 koji ste
ponovo po sluaju izvukli iz tabele 7.1.3 Objasnite kako veliina uzorka utie na tanost
procjene populacijske aritmetike sredine.
116
Statistika u psihologiji, prirunik za studente
8. Testiranje hipoteza
Npr., elimo dokazati da je novi lijek efikasan u tretiranju neke bolesti. Tvrdnja prema kojoj lijek ima efekta je
alternativna hipoteza. Da bi dokazali ovu hipotezu, polazimo od suprotne, prema kojoj lijek nema efekta.
Tvrdnja prema kojoj lijek nema efekta je nulta hipoteza. Da bi se dokazala poetna tvrdnja, mora se oboriti
suprotna (provjeravamo ima li dokaza protiv H0, a u korist H1).
117
Statistika u psihologiji, prirunik za studente
Statistiki test je postupak pomou kojeg se dolazi do odluke o prihvatanju ili odbacivanje
nulte hipoteze. Zasniva se na sluajnoj varijabli X kojom se matematiki definira distribucija
statistika uzoraka (npr. aritmetikih sredina, razlika izmeu dvije aritmetike sredine, varijanci,
medijana). Statistik uzorka (aritmetika sredina, razlika izmeu aritmetikih sredina, varijanca) je
vrijednost koja se nalazi u odreenom rasponu. Skup vrijednosti statistika za koje odbacujemo
hipotezu H0 nazivamo oblast odbacivanja ili kritina oblast. Veliina oblasti odbacivanja H0
odreena je vjerovatnoom () pojavljivanja statistika uzorka u kritinoj oblasti. Ova vjerovatnoa
naziva se nivo znaajnosti testa i odreuje se kao vjerovatnoa da e vrijednost sluajne varijable X
pasti u kritinu oblast. Nivo znaajnosti moe biti odreen arbitrarno, npr. 0,05 ili 0,01. Na osnovu
unaprijed odreenog nivoa znaajnosti (tj. kritine oblasti) odreujemo i kritine vrijednosti
statistika, tj. granine vrijednosti kritine oblasti.
Na osnovu vrijednosti statistika i kritine oblasti, donosimo zakljuak. Ako statistik testa
pada u oblast odbacivanja, odbacujemo H0. Ako statistik testa nije u oblasti odbacivanja, prihvatamo
H0 (drugim rijeima, ako pada u oblast prihvatanja H0). Praktino, kada je p<, test sugerira
odbacivanje H0 (statistiki znaajno).
Neka je nulta hipoteza da izmeu aritmetike sredine uzorka podataka i aritmetike sredine populacije nema
razlike. Zamislimo da provodimo sljedei eksperiment: iz ciljne populacije metodom sluajnog odabira
formiramo uzorak iste veliine kao i uzorak za iju aritmetiku sredinu testiramo nultu hipotezu. Za ovaj
uzorak izraunamo aritmetiku sredinu. Zatim podatke uzorka vratimo u populaciju i ponovimo isti
postupak: formiramo novi uzorak, izraunamo njegovu aritmetiku sredinu i podatke vratimo u populaciju.
Opisani postupak ponovimo veliki broj puta. Na ovaj nain dobit emo veliki broj aritmetikih sredina
uzoraka. Distribucija aritmetikih sredina uzoraka opisana je sluajnom varijablom X ije se vrijednosti
normalno distribuiraju. Ova distribucija zapravo je distribucija statistika uzoraka. Aritmetika sredina
statistika uzoraka jednaka je aritmetikoj sredini populacije. Standardna devijacija statistika uzoraka zapravo
je standardna pogreka aritmetikih sredina uzoraka. Region odbacivanja H0, granine vrijednosti i region
prihvatanja H0 odreujemo arbitrarno. Distribucija statistika uzoraka, granine vrijednosti i regioni
prihvatanja i odbacivanja H0 prikazani su ispod.
118
Statistika u psihologiji, prirunik za studente
Izbor statistikog testa zavisi i od skale mjerenja i oblika raspodjele podataka. Zapravo,
statistike testove dijelimo na parametrijske i neparametrijske. Parametrijski testovi koriste se za
provjeru hipoteza o nepoznatoj vrijednosti parametara populacije; preduvjet za njihovo koritenje je
intervalni/ racio nivo mjerenja. Parametrijski testovi se vre na osnovu nekih od teorijskih
raspodjela: normalne, Studentove t-raspodjele, F-raspodjele, binomne raspodjele, itd. Kada su
podaci prikupljeni koritenjem nominalne ili rang skale mjerenja i kada podaci prikupljeni
intervalnom ili racio skalom mjerenja ne zadovoljavaju odreene karakteristike distribucije,
koristimo neparametrijske testove.
Ispod je dat shematski prikaz izbora statistikog testa zavisno od istraivakog problema,
skale mjerenja i odreenih preduvjeta potrebnih za pojedine testove, prema Barry Cohenu4.
4
Cohen, B. (2011). Explaining Psychological Statistics (1 edition). Wiley, New York
119
Statistika u psihologiji, prirunik za studente
120
Statistika u psihologiji, prirunik za studente
Ukoliko nam istraivaki nacrt nalae da ispitamo razlike u verbalnim sposobnostima izmeu
mukaraca i ena (tj. izmeu dva nezavisna uzorka), a da smo pri tom podatke prikupili koristei
intervalni nivo mjerenja, i da su podaci normalno rasporeeni, onda emo koristiti t-test. Meutim,
ukoliko su podaci izrazito asimetrine raspodjele, onda e odgovarajui statistiki test biti Mann-
Whitneyev test, a ne t-test.
Kada testiramo hipotezu prolazimo odreene korake. Zavisno od problema istraivanja
postavljamo statistiku nultu hipotezu, te biramo odgovarajui test. Nadalje, na osnovu prihvaenog
nivoa znaajnosti odreujemo granine vrijednost (definiramo oblast prihvatanja H0), odreujemo
statistik testa i poredimo izraunati statsitik s graninom vrijednosu. Na kraju donosimo odluku.
121
Statistika u psihologiji, prirunik za studente
Ako se statistik testa nalazi u kritinoj oblasti odbacujemo H0, ako ne, prihvatamo H0. Shematski
prikaz koraka u testiranju hipoteza dat je ispod.
Problem istraivanja
Odabir uzorka
Deskriptivne vrijednosti
NE
Statistik testa u
kritinoj Prihvata se H0
oblasti?
DA
Odbacuje se H0
koristimo z-test ili t-test za jedan uzorak. Prvi test koristimo kada je poznata populacijska vrijednost
varijance, a t-test kada nam ova vrijednost nije poznata, pa o njoj zakljuujemo na osnovu varijance
uzorka.
Postupak testiranja hipoteze s jednim uzorkom temelji se na central-limit teoremi (eng.
central limit theorem), jednoj od najpoznatijih teorema u statistici. Prema ovoj teoremi, raspodjela
aritmetikih sredina uzoraka pribliava se normalnoj distribuciji s poveanjem veliine uzorka.
Nadalje, u populaciji sa aritmetikom sredinom i varijancom 2, distribucija aritmetikih sredina
uzoraka imat e aritmetiku sredinu M= i varijancu jednaku 2M= 2/N. Na osnovu central-limit
teoreme, poznate su nam sve vane karakteristike raspodjele (oblik, aritmetika sredina i varijanca),
to nam omoguava testiranje hipoteza o aritmetikim sredinama.
Na grupi uenika (N=100) primjenjen je test inteligencije. Dobivena je aritmetika sredina M=105. Da li se
ova grupa uenika prema mjerenom svojstvnu razlikuje od populacije? Pretpostavimo da nam je poznata
aritmetika sredina populacije, =100.
- Nulta hipoteza: Grupa uenika ne razlikuje se statistiki znaajno od populacije u intelektualnim
sposobnostima.
- Alternativna hipoteza: Grupa uenika razlikuje se statistiki znaajno od populacije u intelektualnim
sposobnostima.
Kako bi utvrdili lokaciju na koju pada statistik uzorka (aritmetika sredina grupe) dobiveni rezultat, tj.
aritmetiku sredinu treba pretvoriti u z-vrijednost. Kada smo odredili z-vrijednost, koristei tabelu za
standardnu normalnu distribuciju, moemo jednostavno odrediti oblast ispod ili iznad z-vrijednosti.
Dakle, koristit emo izraz:
M
z
M
gdje je M aritmetika sredina uzorka, aritmetika sredina populacije, M standardna devijacija distribucije
uzoraka.
Kako bi odredili standardnu devijaciju distribucije uzoraka trebamo poznavati standardnu devijaciju
populacije. Ovaj parametar obino ne poznajemo, ali za neke varijable (kao to je IQ) standardna devijacija
je poznata (jer se rezultati standardiziraju na velikim uzorcima). Pretpostavimo da je =20. Odredit emo z-
vrijednost:
M 105 100
z 2,5
sM 20
100
z-vrijednost iznosi 2,5. Sada moemo odrediti oblasti ispod i iznad izraunate z-vrijednosti. Iz tablice moemo
odrediti da je povrina od z=2,5 do kraja krivulje p=0,0062. Prema tome, vjerovatnoa da emo dobiti
vrijednost veu od M=105 (uz uvjet da je uzorak veliine N=100) je veoma mala. Ako bi zamiljeni
eksperiment formiranja velikog broja uzoraka i odreivanja distribucije statistika uzoraka ponovili 1000 puta,
123
Statistika u psihologiji, prirunik za studente
tek bi u est sluajeva dobili aritmetiku sredinu uzorka veu od 105. Da li nam je ovo dovoljno za tvrdnju da
je razlika statistiki znaajna? Odgovor na ovo pitanje zavisi od unaprijed definirane kritine oblasti. Uz uvjet
da je nivo znaajnosti =0,05 statistik pada u oblast odbacivanja nulte hipoteze. Odnosno, trebamo uporediti
p-vrijednost i nivo znaajnosti =0,05. Obzirom da je p<,, test sugerira odbacivanje H0.
Statistiki zakljuak mogli smo izvui i na osnovu uporeivanja dobivenog statistika sa kritinom vrijednosti.
Uz nivo znaajnosti od =0,05, granina vrijednost iznosi zgr=1,66. Graninu vrijednost oitavamo iz tablice
za standardnu normalnu distribuciju.
Obzirom da je:
z > zgr,
zakljuujemo da statistik pada u oblast odbacivanja nulte hipoteze. Ispod je ilustrirana distribucija statistika i
poloaj statistika grupe uenika.
region prihvatanja
zgr=1,66 z=2,5 region odbacivanja
Vrijednost u zagradi predstavlja korigirani broj rezultata ili stepene slobode (SS).
M
t
sM
124
Statistika u psihologiji, prirunik za studente
Na grupi uenika (N=25) primjenjen je test inteligencije. Dobivena je aritmetika sredina M=105. Da li se
ova grupa uenika prema mjerenom svojstvu razlikuje od populacije? Pretpostavimo da nam je poznata
aritmetika sredina populacije, =100.
Nulta hipoteza: Grupa uenika ne razlikuje se od populacije u intelektualnim sposobnostima.
Alternativna hipoteza: Grupa uenika razlikuje se od populacije u intelektualnim sposobnostima.
Izraunat emo t-vrijednost:
M 105 100 5
t 1,66
sM 15 3
25
Iz tabele t-vrijednosti oitat emo graninu t-vrijednost za SS=24 uz nivo rizika od =0,05:
tgr=1,711.Obzirom da je:
t<tgr,
125
Statistika u psihologiji, prirunik za studente
126
Statistika u psihologiji, prirunik za studente
PRIMJER 8.1
PRIMJER 8.2
Pretpostavimo da smo proveli istraivanje u kojem smo pitali studente koliko sati spavaju.
Obzirom na obaveze prema studiju, te njihov stil ivota, oekujemo da u prosjeku studenti spavaju
manje od prosjeka populacije. Kako bi ispitali ovu tvrdnju provedeno je istraivanje, prikupljeni su
podaci i testirana je hipoteza.
Nulta hipoteza: Studenti spavaju isto kao i prosjek populacije:
Mgrupe=populacije
M 6,5 8 1,5
z 6
sM 2,5 0,25
100
PRIMJER 8.3
Da li djeca koja su bila izloena traumatskim dogaajima ispoljavaju statistiki znaajno vie
problema u ponaanju u odnosu na djecu koja nisu bila izloena traumatskim dogaajima? Na grupi
od 120 djece koja su bila izloena traumatskim dogaajima primjenjen je upitnik pomou kojeg se
ispituju problemi u ponaanju djece i mladih. Aritmetika sredina ove grupe djece na ovom upitniku
iznosi M = 55,0 uz s=10. Da li je aritmetika sredina grupe djece koja su bila izloena velikom broju
traumatskih iskustava statistiki znaajno vea od aritmetike sredine populacije? Poznat nam je
parametar populacije: = 50.
Nulta hipoteza: Broj problema u ponaanju djece koja su bila izloena traumatskim iskustvima
ne razlikuje se statistiki znaajno od broja problema u populaciji njihovih vrnjaka:
Mgrupe=populacije.
Nultu hipotezu mogli smo formulirati i kao: Grupa djece koja su uestvovala u istraivanju
pripada populaciji ija je aritmetika sredina =50.
Alternativna hipoteza: Djeca koja su doivjela traumatska iskustva iskazuju statistiki
znaajno vei broj problema u ponaanju od djece iz populacije njihovih vrnjaka bez traumatskih
iskustava:
Mgrupe>populacije.
Obzirom da nam nije poznata standardna devijacija populacije, hipotezu emo testirati t-
testom za jedan uzorak. Neka je nivo znaajnosti p=0,05, a testiranje dvosmjerno.
55 50 5
t 5,49
s 10 0,91
120
Granina t-vrijednost za SS=119 iznosi zgr=1,96. Poreenjem izraunate t-vrijednosti i
granine t-vrijednosti moemo zakljuiti da je z>zgr, odnosno da t-vrijednost pada u oblast
odbacivanja H0. Prema tome, grupa djece koja je uestvovala u istraivanju u prosjeku postie
statistiki znaajno vie vrijednosti od prosjeka populacije.
Hipotezu moemo testirati i na nivou znaajnosti od p=0,01. Granina vrijednost iznosi
tgr=2,576. Prema tome, H0 se odbacuje i na nivou od p=0,01. Nadalje, hipotezu testiramo i na nivou
p=0,001. Granina vrijednost iznosi tgr=3,291. Zakljuujemo da se H0 odbacuje i na nivou
znaajnosti od p=0,001. Dakle, tvrdnju statistiki izraavamo na sljedei nain:
t(100)=5,49; p<0,001.
128
Statistika u psihologiji, prirunik za studente
ZADACI
1. Pretpostavimo da direktor jedne osnovne kole tvrdi da uenici te kole u prosjeku dnevno ue
6 sati. Opiite postupak kojim bi smo provjerili tvrdnju direktora.
a. Testirajte nultu hipotezu prema kojoj se ova grupa studenata statistiki znaajno ne
razlikuje od populacije (nivo znaajnosti p=0,05).
b. U ovom sluaju, kojem tipu pogreke se izlaete kod zakljuivanja?
129
Statistika u psihologiji, prirunik za studente
7. Jednu osnovnu kolu pohaa 500 uenika. Direktor te kole smatra da su uenici te kole
iznadprosjenih intelektualnih sposobnosti. Prema njegovom miljenju, prosjeni kvocijent
inteligencije (IQ ) iznosi najmanje 110. U cilju provjere ove tvrdnje, provedeno je ispitivanje
inteligencije na sluajno odabranom uzorku od 40 uenika. Prosjena vrijednost na testu
inteligencije iznosila je M=107, a standardna devijacija 10. Na osnovu dobivenih rezultata
izvedite zakljuak o prihvatanju ili odbacivanju tvrdnje direktora. Hipotezu testirajte uz nivo
znaajnosti od 0,01.
a. Testirajte nultu hipotezu prema kojoj se ova grupa studenata ne razlikuje od populacije
(p=0,05).
b. Testirajte nultu hipotezu prema kojoj se ova grupa studenata ne razlikuje od populacije
(p=0,01).
10. Trener lokalnog koarkakog kluba eli znati da li se prosjean broj koeva koje igrai
njegovog kluba postignu tokom sezone takmienja znaajno razlikuje od dravnog prosjeka.
Pretpostavimo da na nivou drave prosjean broj ubaenih koeva iznosi =65, a standardna
devijacija =8. Prosjean broj koeva njegovog tima je M=68. Da li ovaj tim postie vie
koeva od dravnog prosjeka? Testirajte hipotezu uz nivo znaajnosti od 0,05.
130
Statistika u psihologiji, prirunik za studente
Zamislimo da imamo dvije identine populacije sa identinim parametrima (ili da smo jednu populaciju
klonirali pa njen klon posmatrali kao drugu populaciju). Iz prve populacije metodom sluajnog odabira
formiramo uzorak i izraunamo aritmetiku sredinu. Zatim iz druge populacije metodom sluajnog odabira
formiramo uzorak, iste veliine kao i prvi uzorak, i izraunamo aritmetiku sredinu. Zatim podatke uzoraka
vratimo u populacije. Opisani postupak ponovimo veliki broj puta, i svaki put izraunamo i razliku izmeu
dvije aritmetike sredine. Na ovaj nain dobit emo veliki broj razlika izmeu aritmetikih sredina uzoraka.
Distribucija razlika aritmetikih sredina uzoraka opisana je sluajnom varijablom X ije se vrijednosti
rasporeuju prema t-raspodjeli. Aritmetika sredina razlika izmeu aritmetikih sredina parova uzoraka
jednaka je razlici izmeu aritmetikih sredina populacija, odnosno jednaka je 0. Standardna devijacija razlika
aritmetikih sredina zapravo je standardna pogreka razlike aritmetikih sredina uzoraka.
2 2
s1 s
sM1-M2 2
N1 N2
Prema H0 razlika izmeu dvije aritmetike sredine nee biti statistiki znaajna, tj. u
raspodjeli e se pozicionirati oko aritmetike sredine (preciznije, oko vrijednosti M1-M2=0) (u tom
sluaju zakljuujemo, npr., da novi antidepresiv nije znaajno efikasniji od klasinog; nova metoda
poduavanja iz fizike nije bolja od stare).
132
Statistika u psihologiji, prirunik za studente
Nasuprot tome, prema alternativnoj hipotezi, razlika izmeu dvije aritmetike sredine e biti
dovoljno velika (u apsolutnim vrijednostima) da e u t-distribuciji izlaziti izvan intervala M1-M2
1,96sM1-M2 , uz nivo znaajnosti od 5% ili intervala M1-M2 2,58sM1-M2 , uz nivo znaajnosti od 1%
(ovo vrijedi za velike uzorke, tj. n>40). Dakle, da bismo je proglasili statistiki znaajnom na nivou
znaajnosti od 5%, odnosno od 1%, razlika izmeu dvije aritmetike sredine mora biti 1,96, odnosno
2,58 puta vea od svoje pogreke. U tom sluaju iz naih primjera zakljuujemo: da je novi
antidepresiv u suzbijanju simptoma depresije efikasniji od klasinog; uenici koji su uili fiziku po
novoj metodi postiu bolje rezultate od uenika koji su uili po staroj metodi itd.
Statistiki postupak koji nam omoguava da utvrdimo odnos razlike izmeu dvije aritmetike
sredine i standardne pogreke te razlike se naziva t-test i rauna se prema formuli:
tj.:
M1 M2
t
sM1-M2
M1 M2
t
sM1 sM2 2r1,2sM1sM2
2 2
133
Statistika u psihologiji, prirunik za studente
t-test za male nezavisne uzorke temelji se na zajednikoj standardnoj devijaciji za oba uzorka.
Ovu vrijednost smijemo koristiti samo ako smo sigurni da se standardne devijacije uzoraka znaajno
ne razlikuju. Kako bismo to provjerili moramo izraunati F-test prema sljedeoj formuli:
vea s2
F=
manja s2
Ako je gornji F-omjer statistiki neznaajan (to opet utvrujemo pomou tablice graninih F
vrijednosti za testiranje razlika meu varijancama) izraunavanje t-testa emo nastaviti prema
sljedeoj proceduri:
(X - M1)2 + (X - M2)2
Zajednika s =
(N1 - 1) + (N2 - 1)
N1 + N2
sM1-M2 = Zajednika s
N1N2
M1 - M2
t=
sM1-M2
SS = (N1 1) + (N2 1)
134
Statistika u psihologiji, prirunik za studente
PRIMJER 9.1
U primjeru 7.1 smo iz poetne populacije od 10000 zaposlenih graana zamiljenog malog
mjesta formirali distribuciju aritmetikih sredina 50 uzoraka veliine n=800. Na osnovu ovih
aritmetikih sredina moemo vrlo jednostavno formirati distribuciju razlika aritmetikih sredina ovih
uzoraka: izraunat emo razlike za sve mogue parove ovih aritmetikih sredina (M1-M2, M1-M3,
M1-M4,... M2-M3, M2-M4, M2-M5... M49-M50). Kako se ukupno moe nainiti 12255 ovakvih parova,
tako emo dobiti i distribuciju od ukupno 1225 razlika izmeu aritmetikih sredina.
50
45
40
35
30
f 25
20
15
10
5
0
-9,29
-6,29
-3,29
-0,29
2,71
5,71
8,71
-30,29
-27,29
-24,29
-21,29
-18,29
-15,29
-12,29
11,71
14,71
17,71
20,71
23,71
26,71
29,71
M
Razlika izmeu dvije aritmetike sredine
5
Broj moguih parova rauna se prema formuli k(k-1)/2, pri emu je k broj aritmetikih sredina.
135
Statistika u psihologiji, prirunik za studente
nam je beskonano velika poetna distribucija iz koje formiramo beskonano veliki broj razliitih
uzoraka iste veliine; za potrebe nae demonstracije i ovaj primjer e biti sasvim zadovoljavajui.
Ono to u sutini radimo kada testiramo znaajnost razlike izmeu aritmetikih sredina dva
uzorka jeste da iz teorijske distribucije razlika izmeu aritmetikih sredina (koja ima M1-M2=0 i
ija je standardna devijacija standardna pogreka razlike izmeu aritmetikih sredina) izvlaimo
jednu razliku izmeu dvije aritmetike sredine (naih konkretnih uzorka) i procjenjujemo
vjerovatnou javljanja te razlike po sluaju. Ako je ta vjerovatnoa vea od 5%, odnosno od 1% -
razliku neemo proglasiti statistiki znaajnom na nivou znaajnosti od 5%, odnosno 1%. Ako je,
pak, ta vjerovatnoa mala, tj. manja od 5%, odnosno 1%, onda tu razliku proglaavamo statistiki
znaajnom na nivou od 5%, odnosno od 1%.
Zamislimo da smo iz nae poetne populacije izvukli dva sluajna uzorka, npr. uzorke pod
rednim brojem 7 i 12 sa sljedeim deskriptivnim vrijednostima:
Prema H0 smatramo da je razlika izmeu ova dva uzorka rezultat sluajnih varijacija, tj. da
ona nije statistiki znaajna; drugim rijeima, prema H0 smatramo da ova dva uzorka pripradaju
istoj populaciji.
Prema alternativnoj hipotezi (H1), razlika izmeu ova dva uzorka je statistiki znaajna, tj.
posljedica je djelovanja nekog sistematskog (sistematskih) faktora. Drugim rijeima, ova dva uzorka
reprezentiraju dvije razliite populacije.
Obzirom da znamo da su oba uzorka izvuena iz iste populacije (zaposlenih osoba koje ive
u istom mjestu) pretpostavljamo da razlika nee biti statistiki znaajna. Ipak, da bismo bili sigurni
da uoena razlika izmeu aritmetikih sredina nije statistiki znaajna nuno je provesti t-test:
M1 M2 M1 M2
t= =
sM1-M2 s12 s22
+
N1 N2
-8,39
t= = -0,65
12,92
136
Statistika u psihologiji, prirunik za studente
Dakle, i statistiki smo potvrdili da naa dva uzorka dolaze iz iste poetne populacije: t-test
(t-omjer) nam pokazuje da razlika izmeu dvije aritmetike sredine nije dva puta vea od svoje
pogreke, tako da je neemo proglasiti statistiki znaajnom na nivou od 5% znaajnosti.
Obzirom da su oba uzorka relativno velika i iste veliine, u ovom primjeru ne moramo
konsultirati tablice za oitanje znaajnosti rezultata t-testova. Ipak, standardna procedura za
zakljuivanje o statistikoj znaajnosti nekog t-testa podrazumijeva konsultiranje graninih
vrijednosti t uz zadani broj stupnjeva slobode. Stupnjevi slobode u sluaju velikih nezavnisnih
uzoraka raunaju se prema formuli:
SS = (n1 1) + (n2 1)
SS = 799 + 799 = 1598
Zamislimo sada malo realniju situaciju. Istraivaa interesira da li postoji statistiki znaajna
razlika u prosjenim mjesenim primanjima mukaraca i ena. Kako bi to utvrdio, istraiva je u
istoj anketi u kojoj je ispitanike pitao o njihovim primanjima zabiljeio i spol ispitanika. Anketirano
je ukupno 436 ena i 312 mukaraca iz poetne populacije od 10000 zaposlenih graana.
Deskriptivne vrijednosti prikazane su u tabeli 9.1.3.
Spol n M s
436 1367,68 232,40
M 312 1051,89 198,73
total 1235,96
315,79
t= = 19,95
15,83
SS = 746
Obzirom da je granina t-vrijednost za zadate stupnjeve slobode na nivou rizika od 5%
tgr=1,96, odnosno za 1% rizika tgr=2,58, zakljuujemo da je utvrena razlika izmeu prosjenih
primanja mukaraca i ena statistiki znaajna (tj. ene u prosjeku mjeseno zarauju statistiki
137
Statistika u psihologiji, prirunik za studente
znaajno vie novca). Drugim rijeima, po svojim mjesenim primanjima ene i mukarci ine dvije
razliite populacije, to izraavamo na sljedei nain:
PRIMJER 9.2
Mjerenje M s
Prije treninga 1150,00 181,21
Nakon treninga 1320,00 236,43
-170,00
t= = -13,17
12,91
SS = n 1 = 259
138
Statistika u psihologiji, prirunik za studente
PRIMJER 9.3
Prema jednoj od teorija koje objanjavaju poremeaj deficita panje (PDP) kod djece, djeca
sa ovim poremeajem imaju ouvanu sposobnost selektivne panje sposobna su usmjeravati
panju na ciljne podraaje uz istovremeno zanemarivanje drugih, irelevantnih podraaja, ali imaju
potekoa u odravanju panje na ciljnom podraaju dui vremenski period koji je potreban za
uspjeno rjeavanje odreenog zadatka (dakle, oslabljena im je sposobnost tzv. odravane panje).
Kako bi testirao ovu hipotezu, psiholog je testirao grupu od 6 djece sa PDP i 9 djece bez ove
dijagnoze na testu odravane panje. [Ispitanici na testu odravane panje imaju zadatak da reagiraju
na svaku promjenu prezentiranog stimulusa na ekranu; mjeri se broj pogreaka, tj. broj proputenih
reakcija]. Rezultati za ove dvije skupine djece predstavljeni su u tabeli ispod:
Tabela 9.3.1: Broj pogreaka i deskriptivne vrijednosti djece sa i bez PDP na testu odravane panje
M 7,89 16,00
s 2,03 3,35
Da bismo provjerili moemo li u ovom sluaju raunati nekorigirani t-test, u prvom koraku
moramo utvrditi da li su varijance ova dva uzorka homogene:
3,352
F= = 0,37
2,032
32,89 + 56
Zajednika s =
8+5
Zajednika s = 0,73
9+6
sM1-M2 = 0,73
9x6
sM1-M2 = 0,38
7,89 - 16,00
t=
0,38
t = -21,08
SS = 8 + 5 = 13
Na osnovu dobivenog t-omjera moemo zakljuiti da djeca sa PDP, u odnosu na djecu bez ovog
poremeaja, imaju statistiki znaajno slabiju sposobnost odravanja panje kroz due vremenske
intervale.
PRIMJER 9.4
Grupa ispitanika uila je seriju besmislenih slogova. Poslije dva ponavljanja serije, broj
slogova koji su lanovi grupe tano reproducirali naveden je u koloni Prije u tabeli ispod. Nakon
toga, ispitanici su, tri dana po jedan sat, uili serije besmislenih slogova iste duine kao i u prvoj
seriji, ali su dobili nove instrukcije o metodama uspjenog pamenja. Poslije tri dana zadata je nova
serija besmislenih slogova iste duine i teine kao i prva serija i ponovljena je dva puta. Ispitanicu su
tada postigli rezultate predstavljene u koloni Poslije .
140
Statistika u psihologiji, prirunik za studente
D = -14
d2 = 12,22
MD = -1,56
sD = 1,24
141
Statistika u psihologiji, prirunik za studente
sD
sMD =
N
1,24
sMD =
9
sMD = 0,41
MD
t=
sMD
-1,56
t=
0,41
t = -3,78
Stupnjeve slobode raunamo prema formuli: SS=N-1, to u naem primjeru iznosi 8. Kako
je tgr=2,36 (za nivo od 5% rizika), odnosno tgr=3,36 (za nivo od 1% rizika), izraunati t-test pro-
glaavamo statistiki znaajnim:
142
Statistika u psihologiji, prirunik za studente
ZADACI
1. Pacijenti koji se lijee od depresije podijeljeni su u dvije skupine. Prvu skupinu ini 50
pacijenata koji su tokom dvije sedmice uzimali novi lijek za koji se smatra da umanjuje broj
simptoma. Druga skupina od 43 pacijenta za to vrijeme je bila bez medikamentoznog tretmana.
Nakon dvije sedmice ponovo je izmjeren broj simptoma kod obje skupine pri emu su
dobiveni sljedei rezultati:
2. Istraivaa je interesiralo da li djeca koja ive u gradu itaju bre od djece koja ive na selu. U
tu svrhu po sluaju je formirao dvije skupine djece. Prvu skupinu od 150 djece inila su djeca
iz grada. Drugu skupinu od 139 djece inila su djeca sa sela. Na temelju zadatka brzog itanja,
istraiva je dobio sljedee rezultate: djeca iz grada zadati tekst su u prosjeku itala za 93 sek.,
uz standardnu devijaciju od 6,5 sek.; djeci iz sela za itanje istog odlomka teksta u prosjeku je
trebala 91 sek., uz standardnu devijaciju od 7,1 sek. Da li je utvrena razlika u brzini itanja
izmeu dvije navedene grupe statistiki znaajna?
3. Psiholog je elio testirati uinkovitost novog programa edukacije vozaa koji prave veliki broj
prekraja u saobraaju. Da bi to uinio, iz generalne populacije vozaa selektirao je (na temelju
podataka u MUP-u) 120 vozaa koji su u periodu od proteklih 12 mjeseci napravili vie od 20
prekraja. Statistiki pokazatelji za ovu grupu vozaa su sljedei:
Ovi vozai su upueni na novi program edukacije. Nakon zavrene edukacije, psiholog je u
periodu od 12 mjeseci pratio navedenu grupu vozaa i registrirao broj prekraja koji je svaki
od njih nainio. Utvrdio je sljedee statistike pokazatelje:
Korelacija izmeu broja prekraja nainjenih u dva perioda (prije i poslije edukacije) je r=0,69.
Da li je novi program edukacije uinkovit u smanjenju broja saobraajnih prekraja?
143
Statistika u psihologiji, prirunik za studente
4. Test linosti ABC primjenjen je na dvije grupe uenika: prvoj grupi uenika koji se u koli
ponaaju neupadljivo, i drugoj grupi uenika sa odreenim problemima u ponaanju. Dobivene
su sljedee deskriptivne vrijednosti:
I grupa II grupa
N 8 5
M 105,5 113
s 6,87 3,08
Da li se ove dvije grupe uenika znaajno razlikuju po prosjenim rezultatima na testu linosti?
5. Na testu verbalnih sposobnosti, grupa ispitanika iji roditelji imaju visoko ili vie obrazovanje
i grupa ispitanika iji roditelji imaju osnovno ili srednje obrazovanje postigle su sljedee
rezultate:
OBRAZOVANJE RODITELJA
Osnovno i Visoko i vie
srednje
N 28 24
M 16,92 17,90
s 4,94 4,21
Utvrdite da li ove dvije grupe ispitanika imaju statistiki znaajno razliit prosjean uspjeh na
testu verbalnih sposobnosti.
144
Statistika u psihologiji, prirunik za studente
BROJ POGRENIH
PREPOZNAVANJA
SAOBRAAJNIH ZNAKOVA
ISP. I mjerenje II mjerenje
1 6 9
2 8 15
3 5 7
4 12 15
5 8 8
6 2 6
7 10 13
8 8 14
9 4 8
10 9 15
11 10 11
12 7 9
GRUPA
kontrolna eksperimentalna
N 77 57
M 17,4 24
s 3,7 4,5
8. U jednom istraivanju testirana je hipoteza prema kojoj stariji ispitanici, s obzirom da slabije
procesiraju verbalne informacije, imaju slabije pamenje za rijei od mlaih ispitanika.
Zadatak ispitanka bio je da zapamte to vie rijei. Nakon neutralnog zadatka utvren je broj
145
Statistika u psihologiji, prirunik za studente
rijei kojih su se ispitanici mlae i starije dobi mogli dosjetiti. Dobivene su sljedee prosjene
vrijednosti i rasprenja:
GRUPA
mlai stariji
N 10 10
M 19,3 12
s 7,1 14
Da li je hipoteza potvrena?
9. Dvije grupe uenika rjeavale su test znanja iz matematike. Dobivene su sljedee deskriptivne
statistike vrijednosti:
GRUPA
I II
N 100 100
M 100 110
s 20 40
10. Pretpostavimo da e denjaci znaajno bre prepoznati predmete koji se nalaze u njihovoj
desnoj ruci, od predmeta koji se nalaze u njihovoj lijevoj ruci (ispitivanje se izvodi s povezom
preko oiju ili s nepropusnim naoalima). U sljedeoj tabeli prikazan je broj predmeta koje
ispitanici prepoznaju za lijevu i desnu ruku u vremenu od 2 minute.
146
Statistika u psihologiji, prirunik za studente
Analiza varijance (eng. analysis of variance) ili skraeno ANOVA, je postupak koji se koristi
za ispitivanje statistike znaajnosti razlika izmeu aritmetikih sredina vie grupa. Za razliku od t-
testa, kojeg koristimo kada testiramo statistiku znaajnost razlike izmeu dvije aritmetike sredine,
ANOVA-om moemo testirati razlike izmeu bilo kojeg broja aritmetikih sredina.
Naziv postupka ne ukazuje da se ispituju razlike izmeu aritmetikih sredina. Meutim, neka
vas naziv postupka ne navodi na pogrean zakljuak.Zaista, analizom varijance varijabilitet rezultata
se razlae na odreene dijelove jer se totalni varijabilitet zavisne varijable razlae na manje dijelove,
i to na dio varijance koji se pripisuje nezavisnoj varijabli i dio koji predstavlja ostatak, tj. rezidual, ili
varijancu pogreke. No, premda se analizira varijabilitet, ipak nas procedura vodi ka zakljuku o
razlikama izmeu aritmetikih sredina. Razlog zbog kojeg se koristi naziv analiza varijance, a ne
multigrupna analiza aritmetikih sredina, je taj da se ovim postupkom zaista uporeuju aritmetike
sredine, ali analiziranjem i uporeivanjem varijabiliteta, tj. varijanci.
Razumno pitanje je zato ne koristiti t-test za svaki par AS? Nekoliko je razloga zbog kojih se
ne koriste t-testovi. Najprije, koritenje veeg broja t-testova nije ekonomino. Sa poveanjem broja
grupa znaajno se poveava posao! Ukoliko imamo tri aritmetike sredine broj parova za koje treba
primjeniti t-test je 3, za etiri aritmetike sredine 6, a za npr. est potrebno je primjeniti 15 t-testova.
Nadalje, pitamo se da li su razlike izmeu vie AS statistiki znaajne, a ne da li je razlika izmeu
dvije AS statistiki znaajna. Najvaniji razlog je da se s poveanjem broja t-testova, poveava i
vjerovarnoa javljanja pogreke tipa I. Na kraju, u sluajevima kada imamo dvije ili vie nezavisnih
varijabli istovremeno, elimo znati ne samo o efektima pojedine varijable ve i o efektu interakcije
dvije ili vie varijabli.
Najjednostavniji primjer analize varijance je jednostavna ili jednosmjerna (one-way) analiza
varijance, kod koje imamo jednu nezavisnu varijablu, tj. faktor i jednu zavisnu varijablu. Faktor je
kategorijalna varijabla, a vrijednosti varijable nazivaju se nivoi. Ukoliko imamo dva ili tri faktora,
govorimo o dvo- ili tro-smjernoj analizi varijance. Ako su isti ispitanici ukljueni u sve nivoe
nezavisne varijable, koristimo analizu varijance za zavisne uzorke (RM ANOVA, od engl.
repeated measures ANOVA). Analiza varijance sa jednom zavisnom varijablom naziva se
univarijatna, a s dvije ili vie zavisnih varijabli, multivarijatna tj. MANOVA-a.
147
Statistika u psihologiji, prirunik za studente
A B C
10 17 20
14 19 19
12 18 23
13 20 26
11 16 22
Pokuajmo o podacima razmiljati na neto drugaiji nain. Neka X i,j oznaava rezultat
ispitanika i u grupi j (npr. X1C se odnosi na rezultat prvog ispitanika u grupi C). Rezultat bilo kojeg
ispitanika u testu matematikih zadataka u funkciji je tri komponente: prosjene vrijednosti svih
ispitanika koji bi teoretski mogli uestvovati u eksperimentu bez obzira na grupnu pripadnost (),
odstupanja prosjene vrijednosti rezultata grupe (j) od ( = j ), i odstupanja rezultata
ispitanika i u grupi j od prosjene vrijednosti svoje grupe (eij = Xij j). Odnosno:
Xij = + (j - ) + eij = + j + eij.
Svaki rezultat odstupa od aritmetike sredine svih podataka (bez obzira na grupu), aritmetike
sredine podataka grupe kojoj pripada i odstupanja aritmetike sredine grupe kojoj podatak pripada
od sredine svih podataka (bez obzira na grupu). Na slici 2 prikazana su odstupanja rezultata prvog
ispitanika grupe C (X1C) od aritmetike sredine svih podataka (X-Mtot), zatim od aritmetike sredine
podataka grupe kojoj pripada (X-Mj) i odstupanje aritmetike sredine grupe kojoj ispitanik pripada
od aritmetike sredine svih podataka (Mj-Mtot).
148
Statistika u psihologiji, prirunik za studente
Grupa C
MC=22
1
X=20 3
Grupa B 2 3
Mtot=17,3 1 1
Grupa A
Za svaki rezultat mogu se izraunati navedena odstupanja. Kada kvadriramo ova odstupanja
dobit emo sume kvadrata. Tako imamo:
1. Sumu kvadrata totala (SStot)
2. Sumu kvadrata unutar grupa (SSwg), i
3. Sumu kvadrata izmeu grupa (SSbg).
SS ( x M )
2
s v MS
2
df N 1
149
Statistika u psihologiji, prirunik za studente
MSbg = n x s2M,
MS bg
F
MS wg
Kao to smo koristili t-test u cilju donoenja odluke o prihvatanju ili odbacivanju nulte
hipoteze, kod ANOVA-e koristimo F-test. Postoji porodica F-distribucija, zavisno od vrijednosti
stupnjeva slobode brojnika i nazivnika. Obzirom da je F-omjer omjer varijanci, njegova vrijednost
ne moe biti manja od nula. F-distribucija je pozitivno asimetrina; samo u sluaju ekstremno
velikih uzoraka, oblik F-distribucije pribliava se normalnoj (tanije kada dfbg i dfwg tee ka
beskonanoj vrijednosti).
Kritinu vrijednost F-omjera oitavamo iz tablica na osnovu stupnjeva slobode brojnika i
nazivnika. Ako je izraunati F vei od kritine vrijednosti F (uz odreene stupnjeva slobode), onda
je varijabilitet izmeu grupa statistiki znaajno vei od varijabiliteta unutar grupa, tj. utvrena je
statistiki znaajna razlika izmeu aritmetikih sredina.
150
Statistika u psihologiji, prirunik za studente
Za testiranje statistike znaajnosti razlika izmeu varijanci koristi se npr. Levenov F-test
homogenosti varijanci. U praksi se esto koristi princip prema kojem najvea standardna devijacija
ne smije biti dva puta vea od najmanje standardne devijacije, te smatramo da su varijance
najvjerovatnije homogene. Osim toga, kada su grupe jednake ili podjednake veliine, najvjerovatnije
su varijance homogene.
2. Normalna distribucija
Distribucije rezultata zavisne varijable u svakoj grupi trebaju biti priblino normalne.
3. Nezavisni uzorci
Uzorci (grupe) trebaju biti formirani metodom sluajnog odabira, tj. rezultati jednog uzorka su
nezavisni od rezultata drugog uzorka.
151
Statistika u psihologiji, prirunik za studente
Totalni varijabilitet
SStot
152
Statistika u psihologiji, prirunik za studente
Totalni varijabilitet
SStot
153
Statistika u psihologiji, prirunik za studente
PRIMJER 10.1
Odreivanje Namjerno
Prebrojavanje Rimovanje Imaginacija Total
pridjeva uenje
9 7 11 12 10
8 9 13 11 19
6 6 8 16 14
8 6 6 11 5
10 6 14 9 10
4 11 11 23 11
6 6 13 12 14
5 3 13 10 15
7 8 10 19 11
7 7 11 11 11
Da li postoji statistiki znaajna razlika izmeu aritmetikih sredina pet grupa? Ako postoji,
koja grupa je najbolje rjeavala zadatak upamivanja? Koji nain procesiranja je najefikasniji?
Najprije emo grafiki prikazati aritmetike sredine. Najviu vrijednost AS postigli su ispitanici koji
su tokom nenamjernog uenja koristili imaginaciju (M=13,5), zatim ispitanici koji su dobili
eksplicitnu instrukciju da ue material (M=12) i ispitanici koji su odreivali pridjeve (M=11).
154
Statistika u psihologiji, prirunik za studente
16
14 13,4
12
12 11
10
8 7 6,9
0
prebrojavanje rimovanje pridjevi imaginacija namjerno
ucenje
Raunski postupak provodi se u nekoliko koraka i logiki odgovara smislu analize varijance.
Najprije izraunamo pomone vrijednosti veliki total (GT) i sumu kvadriranih vrijednosti svih
rezultata (X2), a zatim sume kvadrata totala, izmeu grupa i unutar grupa. U sljedeim koracima
potrebno je odrediti stupnjeve slobode, a zatim izraunati prosjene kvadrate (MSbg i MSwg). Na
kraju, izaunat emo F-omjer i uporediti izraunatu vrijednost s kritinom, koju smo oitali iz
tablice.
PROVJERA:
Ako su tano izraunate vrijednosti SStot, SSbg i SSwg, tada mora biti zadovoljena jednakost:
Izraunati F:
F = MSbg / MSwg
F = 87,88 / 9,67 = 9,08
Moemo zakljuiti da postoji statistiki znaajna razlika izmeu ispitanika pet grupa.
Meutim, jo uvijek ne znamo izmeu kojih grupa postoji statistiki znaajna razlika. Kako bi
odgovorili na ovo pitanje, provodimo tzv. post-hock postupak. Prilikom izraunavanja razlika
izmeu aritmetikih sredina nakon zavrenog F-testa (a posteriori) moe se koristiti neki od testova:
Scheffeov test, LSD, Bonferroni. U nastavku prikazat emo postupak u kojem se koristi Scheffeov
test.
Scheffeov test
Nakon izraunatog F-omjera u analizi varijance, za svaki par aritmetikih sredina koje elimo
usporediti primjeniti sljedeu formulu:
Za utvrivanje parova AS za koje postoji statistiki znaajna razlika upotrijebit emo Scheffeov
test.
Razlike izmeu AS F p
M1 - M2 0,005 > 0,05
M1 - M3 8,27 > 0,05
M1 - M4 21,18 < 0,01
M1 - M5 12,93 < 0,05
M2 - M3 8,69 >0,05
M2 - M4 21,85 <0,01
M2 - M5 13,45 >0,05
M3 - M4 2,98 >0,05
M3 - M5 0,52 >0,05
M4 - M5 1,01 >0,05
158
Statistika u psihologiji, prirunik za studente
PRIMJER 10.2
A B C
12 17 20
14 24 19
12 18 23
13 20 26
11 24 22
17 18 17
19 23 19
18 20 18
20 20 20
16 16 16
Najprije emo provjeriti da li distribucije rezultata tri grupe znaajno odstupaju od normalne i
da li su varijance homogene. Box-plot prikaz distribucije rezultata moe nam posluiti za brzu
provjeru normalnosti distribucija rezultata (bez zakljuka), ali i ukazati na mogue razlike u
varijancama. Na osnovu box-plot prikaza moemo zakljuiti da su distribucije priblino simetrine, i
da se varijance znaajno ne razliku. Uporeujui standardne devijacije takoer moemo zakljuiti da
je zadovoljen preduvjet homogenosti varijanci.
A B C
Ti 152 200 200
M 15,2 20 20
s 3,2 2,9 3,0
159
Statistika u psihologiji, prirunik za studente
1. GT = (X)/ N GT = 10156,80
2. X SumX = 10558
3. SStot = X - GT SStot = 401,20
4. SSbg = T2j / n GT SSbg = 153,60
5. SSwg = X-(T2j / nj) SSwg = 247,6
6. df bg = (k-1) dfbg = 2
df wg = (N-k) dfwg = 27
df tot = dfbg + dfwg dftot = 29
9. Tabela ANOVA
160
Statistika u psihologiji, prirunik za studente
PRIMJER 10.3
161
Statistika u psihologiji, prirunik za studente
162
Statistika u psihologiji, prirunik za studente
1. GT = (SX)/ N GT = 131.250.651,04
2. SumX SumX = 321.287.500,00
3. SStot = SX - GT SStot = 190.036.848,96
4. SSbg = ST2j / n GT SSbg = 35.886.536,46
5. SSwg = SX - S(T2j / nj) SSwg = 154.150.312,50
6. dfbg = (k - 1) dfbg = 3
dfwg = (N - k) dfwg = 92
dftot = dfbg + dfwg dftot = 95
Tabela ANO-
9. VA
Analiza varijance pokazuje da meu grupama (definiranim na temelju strune spreme) postoji
statistiki znaajna razlika u visini mjesenih primanja (to znai da nul-hipotezu treba odbaciti).
Meutim, naknadnom provjerom poetne distribucije rezultata, nastavnik matematike (koji je
provodio analizu) uvidio je da postoji osnova za sumnju da etiri grupne distribucije nisu normalno
distribuirane (ime ne bi bio ispunjen jedan od osnovnih uvjeta za provoenje analize varijance
163
Statistika u psihologiji, prirunik za studente
normalnost distribucija). Osim toga, varijabilitet rezultata grupa znaajno se razlikuje (najnia
s=50,9, najvia s=2.585,20). Kako bi provjerio svoju pretpostavku, nastavnik je za svaku grupu
izraunao veliinu odstupanja distribucije mjesenih primanja od normalne distribucije (drugim
rijeima, izraunao je skjunis za svaku grupu). Dobio je sljedee rezultate:
Struna sprema
NSS SSS VS VSS
Skjunis -,364 -,988 ,339 2,600
Std. greka skjunisa ,472 ,472 ,472 ,472
Kako se iz tabele vidi, sve distribucije vie ili manje odstupaju od normalne (distribucije za
NSS i SSS su negativno asimetrine, a distribucije za VS i VSS pozitivno asimetrine). Meutim,
samo za VSS distribucija mjesenih primanja znaajno odstupa od normalne distribucije. To je
mogue zakljuiti na osnovu toga to je skjunis za ovu distribuciju vei od svoje standardne
pogreke za vie od tri puta.
Razlog asimetrinosti distribucije za grupu VSS jesu tri ekstremna rezultata, kako je to
ilustrirano u dolje priloenom box-plotu. Ovi rezultati (kako se vidi na grafikonu) pripadaju
ispitanicama pod rednim brojem 75, 76 i 77 u bazi podataka, odnosno to su rezultati od 7.750, 8.000
i 10.600 KM i svojom veliinom distribuciju pomjeraju u desnu stranu.
da se ovi podaci nigdje nee povezati sa njihovim linim informacijama, sve su ispitanice potvrdile
da su to zaista njihova tana primanja. Meutim, kako su ovakvi sluajevi zaista ekstremni u
populaciji, nastavnik je jo uvijek elio biti siguran da su utvrene razlike meu grupama znaajne i
bez ovako rijetkih vrijednosti. Kako bi to uinio, nastavnik je odluio iskljuiti ova tri ekstremna
rezultata iz analize varijance. Na taj nain grupa VSS bi imala 21 ispitanicu, ime veliina grupa
ukljuenih u analizu ne bi bila jednaka (to moe naruiti pretpostavku o homogenosti varijanci u
grupama). Zbog toga je nastavnik odluio iz svake od tri preostale grupe po sluaju iskljuiti po tri
ispitanice. Konano, dobio je sljedee distribucije rezultata:
165
Statistika u psihologiji, prirunik za studente
1. GT = (SX)/ N GT = 73173333,33
2. SumX SumX = 78325000
3. SStot = SX - GT SStot = 5151666,667
4. SSbg = S T2j / n GT SSbg = 4639761,905
5. SSwg = SX-S(T2j / nj) SSwg = 511904,7619
6. dfbg = (k 1) dfbg = 3
dfwg = (N k) dfwg = 80
dftot = dfbg + dfwg dftot = 83
166
Statistika u psihologiji, prirunik za studente
9. Tabela ANOVA
Kao to vidimo, dobiveni F omjer je ponovo statistiki znaajan; meutim u ovoj analizi je
mnogo vei od onog dobivenog u prvom postupku (7,14 prema 241,70).
Nakon zakljuka da se grupe razliitih nivoa obrazovanja statistiki znaajno razlikuju prema
visini mjesenih primanja, nastavniku matematike ostalo je da utvrdi koje tano grupe se meusobno
razlikuju (odnosno u kojim parovima aritmetikih sredina se pojavljuje statistiki znaajna razlika).
Da bi to utvrdio, nastavnik je proveo post-hoc analizu razlika meu aritmetikim sredinama, sluei
se Scheffe-ovim postupkom:
Razlike izmeu AS F p
M1 - M2 91,17 <0,05
M1 - M3 256,33 <0,05
M1 - M4 683,17 <0,05
M2 - M3 41,76 <0,05
M2 - M4 275,20 <0,05
M3 - M4 102,56 <0,05
Kako se sve aritmetike sredine statistiki znaajno razlikuju jedna od druge, moemo
zakljuiti da struna sprema (na svim nivoima) utie na mjesena primanja ispitanica.
167
Statistika u psihologiji, prirunik za studente
PRIMJER 10.4
168
Statistika u psihologiji, prirunik za studente
Odreivanje F-vrijednosti
F = MStr / MSrez = 14 / 1 = 14
169
Statistika u psihologiji, prirunik za studente
PRIMJER 10.5
Faktorijalnom analizom varijance provjeriti emo glavne efekte i efekat interakcije Spol x
Doza.
Odreivanje F-vrijednosti
FA = MSA / MSwg = 37,56 / 6,17 = 6,09
FB = MSB / MSwg = 48,72 / 6,17 = 7,90
FAB = MSAB / MSwg = 72,38 / 6,17 = 11,73
171
Statistika u psihologiji, prirunik za studente
Granine F-vrijednosti:
A: F0,05 (1/12) =4,75
B: F0,05 (2/12) = 3,89
A x B: F0,05 (2/12) = 3,89
Glavni efekti
Ako posmatramo razliku izmeu mukaraca i ena, bez obzira na tretman, govorimo o
glavnom efektu varijable Spol.
Mm = 32,56, M = 29,67
F = 6,09; p < 0,05
Takoer, ako posmatramo razliku izmeu tretmana, bez obzira na spol, govorimo o glavnom
efektu varijable Tretman.
172
Statistika u psihologiji, prirunik za studente
Interakcija
Kako bi se razumjela interakcija, korisno je odrediti aritmetike sredine za svaku eliju.
Nakon odreivanja AS, potrebno je napraviti grafiki prikaz i interpretirati interakciju. Zavisnu
varijablu (Depresija) nanosimo na Y osu, jednu od nezavisnih varijabli na X osu (Tretman), a
posebnim linijama oznaavamo dva nivoa druge nezavisne varijable (Spol).
173
Statistika u psihologiji, prirunik za studente
ZADACI
A B C
90 100 86
92 79 91
87 114 120
110 89 115
115 93 79
A B C
9 10 14
10 10 13
12 11 17
13 17 22
11 9 18
17 17 17
19 11 19
14 19 15
20 18 20
16 17 24
A B C D
10 12 10 14
13 14 14 10
12 10 12 12
14 13 11 13
11 11 13 11
174
Statistika u psihologiji, prirunik za studente
SS df MS F p
Izmeu grupa (bg) 300
Unutar grupa (wg) 20 20
Total 700 22
a. Na osnovu rezultata prikazanih u tabeli, odredite vrijednosti koje nedostaju (SSwg, dfbg i
MSbg) i upiite ih u tabelu u odgovarajua polja.
b. Koliko je ispitanika uestvovalo u istraivanju?
c. ta moemo zakljuiti na osnovu dobivene F-vrijednosti?
d. Da li se aritmetike sredine statistiki znaajno razlikuju? DA NE
e. ta biste uradili nakon to odgovorite na pitanje da li se aritmetike sredine statistiki
znaajno razlikuju?
175
Statistika u psihologiji, prirunik za studente
6. Tri grupe ispitanika mukog i enskog spola uestvovale su u tri razliita eksperimentalna
uvjeta zapamivanja besmislenih rijei. Rezultati za svaku situaciju prikazani su u donjoj tabeli
kao i broj upamenih rijei za svakog ispitanika.
I II III
10 11 19
11 13 17
m 14 15 18
13 10 15
SPOL
18 14 14
11 10 20
11 14 16
14 15 18
14 10 15
17 15 14
Ispitati statistiku znaajnost efekata faktora SPOL, GRUPA te interakcije SPOL X GRUPA.
7. U tabeli ispod navedite vrijednosti koje nedostaju te grafiki prikaite glavne efekte i efekat
interakcije varijabli A i B (nije potrebno raunski provoditi analizu varijance) (na graficima na
odgovarajui nain oznaite X ose te, ukoliko je potrebno formirajte legendu).
B1 B2 B3 MA
A1 2 4 14
A2 6 8 9
A3 12 2 6
MB
176
Statistika u psihologiji, prirunik za studente
8. Tri grupe od po 9 ispitanika su uili gradivo razliitim metodama (metode A, B i C). Uspjenost
uenja izmjerena je testom znanja. Vrijednosti u bodovima navedene su za svakog ispitanika u
svakoj grupi u tabeli ispod.
A B C Suma Stepeni
Izvor vari- Varijanca
kvadrata slobode F p
10 jabiliteta (MS)
(SS) (df)
11 izmeu grupa 0,00 2 0,00 0,000 1,000
12 unutar grupa 8,40 12 0,70
11
Total 8,4 14
10
177
Statistika u psihologiji, prirunik za studente
10. U sljedeoj tabeli prikazani su rezultati analize varijance nekog hipotetikog eksperimenta u
kojem su ispitanici rjeavali matematike zadatke na etiri nivoa teine i bili kanjeni za
pogrena rjeenja sa pet razliitih tipova kazne. Neke vrijednosti u tabeli su izbrisane, ali sve to
je izbrisano moe se izraunati na osnovu datih rezultata. Kompletirajte tabelu tako to ete
upisati odgovarajue vrijednosti!
Izvor variranja SS df MS F p
Izmeu grupa
Teina zadatka (A) 100
Tip kazne (B) 150
AXB 5
Unutar grupa 90
Total 1190
178
Statistika u psihologiji, prirunik za studente
Korelacija je statistika mjera povezanosti izmeu dvije ili vie varijabli. Korelacijom
opisujemo odnos izmeu dvije ili vie varijable: kakvog je oblika (npr.: linearan, kvadratian,
logaritamski, obrnuto U) i koliko iznosi. Npr., konzumiranje cigareta povezano je sa razliitim
oboljenjima; sa poveanjem konzumiranja cigareta poveava se uestalost razliitih oboljenja.
Sposobnost odgaanja zadovoljenja odreenih potreba u ranom djetinjstvu povezano je sa
socijalnom kompetencijom u odrasloj dobi ili s poveanjem sposobnosti odgaanja zadovoljenja
potreba u ranoj dobi, poveava se socijalna kompetencija u odrasloj dobi. U medicinskim
istraivanjima utvrena je povezanost izmeu tjelesne visine i uestalosti sranog udara kod ena:
to je visina vea, uestalost sranog udara je manja. U svakodnevnom ivotu esto koristimo
koncept povezanosti. Npr., ako na parkingu ispred trnog centra vidite veliki broj parkiranih
automobila, oekujete da e u centru biti guva; ako je na parkingu mali broj automobila, ne
oekujete guvu. Na osnovu ovih oekivanja (predvianja) donosite odgovarajuu odluku.
Korelacija moe biti pozitivna (porastu jedne odgovara porast druge varijable), negativna
(porastu jedne odgovara opadanje druge varijable), maksimalna, perfektna (vee slaganje ne moe
postojati) i nulta (izmeu dvije varijable ne postoji povezanost).
Ako su dvije varijable u korelaciji, to znai da na osnovu jedne varijable moemo, manje ili
vie precizno, predvidjeti rezultate druge varijable. Konceptu korelacije, blizak je koncept regresije
(tanije, regresijske analize). Regresijskom analizom predviamo vrijednosti jedne varijable, koju
nazivamo kriterijska, na osnovu informacija koje imamo o drugoj varijabli, koju nazivamo
prediktorska varijabla.
U tekstu koji slijedi najprije emo opisati koncept korelacije, a zatim koncept regresije.
Korelacija
U opisivanju povezanosti koristimo grafike i numerike metode.
Grafika metoda podrazumijeva grafiki prikaz povezanosti izmedu dvije varijable preko
skater dijagrama (eng. scatter diagram). Vrijednosti jedne varijable nanose se na X osu, a
druge na Y osu. Svaki ispitanik se prikazuje kao taka u koordinatnom sistemu [ureeni par, (x, y)].
Prediktorska varijabla nanosi se na apscisu, a kriterijska na ordinatu. Skater dijagram omoguava da:
odredimo smjer povezanosti; procjenimo da li je povezanost visoka, umjerena ili niska; utvrdimo
kakvog je oblika povezanost (linearna, inverzna U, ili neka druga); detektiramo ekstremne rezultate.
U skater dijagram unosi se pravac kojeg nazivamo pravac regresija Y na X. Predstavlja
najbolju predikciju Yi za datu vrijednost Xi. Stupanj u kojem se take okupljaju oko pravca
odraava veliinu povezanosti tj. korelacije izmeu X i Y. Ukoliko se sve take nalaze na pravcu
regresije, radi se o perfektnoj povezanosti, tj. maksimalno moguoj povezanosti.
179
Statistika u psihologiji, prirunik za studente
A 4 5 13
11
B 6 8
9
C 8 9
7
D 10 11
5
E 12 12 3
1
1 3 5 7 9 11 13 15
X
Skater dijagram u ovom sluaju opisuje pozitivnu povezanost izmeu dvije varijable.
Povezanost nije perfektna (take ne lee tano na pravcu regresije). S obzirom da su take blizu
pravca, povezanost je visoka.
U skater-dijagramu ispod, opisani su sluajevi kada take nisu toliko blizu pravca regresije.
Povezanost nije toliko visoka.
15 15
Y Y
13 13
11 11
9 9
7 7
5 5
3 3
1 1
1 3 5 7 9 11 13 15 1 3 5 7 9 11 13 15
X X
180
Statistika u psihologiji, prirunik za studente
2. Uenici koji su inteligentniji, postizat e nii kolski uspjeh (nee se dovoljno truditi jer gradivo
smatraju jednostavnim, moda i dosadnim). Povezanost je negativna. Ispitanici koji na jednoj
varijabli postiu vie rezultate, na drugoj varijabli postiu nie rezultate, i obratno, oni koji
postiu nie rezultate na jednoj varijabli, postiu vie rezultate na drugoj varijabli.
ispitanik x y
15
Y
A 4 12
13
B 6 11 11
C 8 8 9
D 10 5 7
5
E 12 3
3
1
1 3 5 7 9 11 13 15
X
Skater dijagram opisuje negativnu povezanost izmeu dvije varijable. Kao i u prethodnom
sluaju, povezanost nije perfektna (take ne lee tano na pravcu regresije), ali je visoka.
3. Uenici koji su visoko inteligentni ili manje inteligentni, postizat e nii kolski uspjeh u
poreenju sa prosjeno inteligentnim uenicima, koji e postizati visok kolski uspjeh.
Povezanost izmeu dvije varijable je nelinearna (zakrivljena). Ispitanici koji na jednoj varijabli
postiu vie i nie rezultate, postiu nie rezultate na drugoj varijabli, za razliku od ispitanika
koji na prvoj varijabli postiu prosjene vrijednosti, a na drugoj visoke.
ispitanik x y
15
Y
A 4 3 13
B 6 5 11
C 8 8 9
7
D 10 5
5
E 12 3
3
1
1 3 5 7 9 11 13 15
X
Povezanost izmeu dvije varijable je nelinearna (zakrivljena). Pravac ne opisuje najbolje odnos
izmeu ove dvije varijable!
181
Statistika u psihologiji, prirunik za studente
ispitanik x y
15
Y
A 4 6
13
B 6 12 11
C 8 8 9
D 10 4 7
5
E 12 10
3
1
1 3 5 7 9 11 13 15
X
Povezanost izmeu dvije varijable ne postoji (nulta povezanost). Bilo gdje da ucrtamo pravac,
neemo adekvatno opisati nultu povezanost. Zapravo, ne postoji pravac koji najbolje opisuje ovakvu
povezanost.
cov xy
rxy
sx sy
182
Statistika u psihologiji, prirunik za studente
cov xy 5,6
rxy 1
sx sy 5,6
rxy
z x zy
N1
183
Statistika u psihologiji, prirunik za studente
ISPITANICI X Y zx zy zx x z y
1 3 10 -1,52 -1,52 2,31
2 4 11 -1,10 -1,10 1,21
3 5 12 -0,68 -0,68 0,46
4 5 12 -0,68 -0,68 0,46
5 6 13 -0,25 -0,25 0,06
6 7 14 0,17 0,17 0,03
7 8 15 0,59 0,59 0,35
8 9 16 1,01 1,01 1,03
9 9 16 1,01 1,01 1,03
10 10 17 1,44 1,44 2,06
M= 6,6 13,6 =9
S= 2,4 2,4
rxy
z x zy
9
1
N1 9
184
Statistika u psihologiji, prirunik za studente
ISPITANICI X Y X Y XY
1 3 10 9 100 30
2 4 11 16 121 44
3 5 12 25 144 60
4 5 12 25 144 60
5 6 13 36 169 78
6 7 14 49 196 98
7 8 15 64 225 120
8 9 16 81 256 144
9 9 16 81 256 144
10 10 17 100 289 170
( X)= 4356
( Y)= 18496
N XY ( X)( Y)
rxy
N X X N Y Y
2 2 2 2
10 948 66 136
1
(10 486 4356) (10 1900 18496)
Testiranje znaajnosti r
Vrijednost dobivenog koeficijenta korelacije mogla je biti rezultat sluaja. Stoga je potrebno
testirati statistiku znaajnost dobivenog koeficijenta korelacije. Matematiki model (uz nultu
hipotezu, tj. da ne postoji povezanost izmeu dvije varijable) ukljuuje distribuciju svih
koeficijenata korelacije od -1 do +1, sa aritmetikom sredinom M=0 (r=0).
Statistiku znaajnost koeficijenta korelacije moemo provesti na dva naina: preko t-
vrijednosti i uporeivanjem dobivenog r sa graninom vrijednou r oitanom iz tablice. t-vrijednost
se izraunava koritenjem izraza:
r N2
t
1 r2
185
Statistika u psihologiji, prirunik za studente
Pravac regresije
Pravac ucrtan u skater-dijagram je pravac koji najbolje odgovara podacima i predstavlja
najbolju moguu predikciju vrijednosti Yi za datu vrijednost Xi. Uz pomo pravca regresije moemo
za bilo koju vrijednost X najtanije prognozirati vrijednost varijable Y.
Prognoziranu vrijednost Y oznaavamo sa Y. Pravac regresije definiran je nagibom i
odsjekom na osi Y (kada je X=0), tj. izrazom:
Y = a + bX
gdje je:
Y prognozirani rezultat
a odsjeak na osi Y kada je X=0
b nagib pravca
X vrijednost prediktora
Nagib pravca govori nam koliko se mijenja vrijednost Y varijable uz jedininu promjenu
vrijednosti X varijable. Odsjeak na Y osi je prognozirani rezultata kada je X=0.
Vrijednosti a i b odreuju se izrazima:
a = My bMx
cov xy sy
b 2 ili b rxy
sx sx
186
Statistika u psihologiji, prirunik za studente
ispitanik x y
A 4 5
B 10 8
C 8 9
D 6 11
E 12 12
(x-Mx)(y-My) = 22
(X Mx)(Y My) 22
cov xy 5,5
N1 4
s x 10
2
cov xy 5,5
b 2
0,55
sx 10
Kada znamo jednainu pravca regresije, koristei samo dvije vrijednosti X, u skater dijagramu
moemo nacrtati pravac regresije. Odredimo Y za, npr., X1=5 i X2=11.
187
Statistika u psihologiji, prirunik za studente
Ako kroz dvije take, A i B, povuemo liniju, dobit emo pravac regresije (slika ispod).
15
Y
13
11
1
1 3 5 7 9 11 13 15
X
Pored pravca regresije Y na X, moemo odrediti i regresijski pravac X na Y. Ova dva pravca
sjeku se u taki Mx, My. Pravci su identini samo u sluaju perfektne korelacije (r=1).
Na istom primjeru pokazat emo i logiku odreivanja pravca regresije. U koordinatnom sistemu
moemo ucrtati beskonano mnogo pravaca, ali samo jedan pravac je optimalan, i to onaj koji je
tako definiran vrijednostima a i b da minimizira sumu kvadriranih YY odstupanja. Ova metoda
odreivanja pravca naziva se metoda najmanje sume kvadrata odstupanja. U skater-dijagramu
(slika 11.2) oznaena su YY odstupanja za svaku Y vrijednost.
188
Statistika u psihologiji, prirunik za studente
15
Y
13
YC- YC= 9 9
12 YE- YE= 12 11,2
11 11
YA- YA=
7
5 - 6,8
5 5
1
1 3 5 7 9 11 13 15
X
Koristei jednainu pravca regresije moemo prognozirati rezultat Y na osnovu bilo kojeg
rezultata X. Prognoza rezultata moe se provesti grafikom (koristei skater-dijagram i pravac
regresije) ili numerikom metodom (koristei jednainu pravca regresije).
Koji je najvjerovatniji rezultat na varijabli Y ispitanika koji je na varijabli X postigao rezultat
x=15?
Y = 4,6 + 0,55X,
Y = 4,6 + 0,55 x 15
Dakle, najvjerovatniji rezultat, tj. prognozirani rezultat je:
Y = 12,85.
s
Y' r y X Mx My
sx
189
Statistika u psihologiji, prirunik za studente
Iako bi se na osnovu pojma prognoza moglo zakljuiti da varijabla X ima efekat na varijablu
Y, to je pogreno. Prognoza rezultata Y ne znai da smo utvrdili efekat jedne varijable na drugu!
Povezanost izmeu dvije varijable ne znai da jedna varijabla objanjava drugu!
Pogreka prognoze
U samo jednom sluaju, prognoza rezultata Y je maksimalno precizna: kada je povezanost
izmeu dvije varijable maksimalna mogua. Kada je r=1, sve take u skater-dijagramu nalaze se na
pravcu regresije, to znai da su odstupanja YY jednaka nuli, tj. rezidual je 0. U svim drugim
sluajevima postoji odreena odstupanja izmeu utvrenog i prognoziranog rezultata.
Izraz (YY)2 nazivamo suma kvadrata reziduala i oznaavamo sa SSrez. Pogreka
prognoze je to vea to je suma kvadrata reziduala vea. SSrez predstavlja varijabilitet koji ostaje
kada na osnovu X prognoziramo Y (kaemo da se radi o varijabilitetu koji se ne moe objasniti
prognoziranjem Y na osnovu X).
ispitanik x y y y- y (yy)2
A 4 5 6,8 -2 4
B 10 8 10,1 -2 4
C 8 9 9 0 0
D 6 11 7,9 3 9
E 12 12 11,2 1 1
2
(YY) = 18
Y Y
2
Kvadrirana vrijednost sy,x naziva se rezidualna varijanca ili varijanca pogreke. U naem
primjeru, standardna pogreka prognoze iznosi:
2
Y Y 18
s N2 2,45
y, x 3
190
Statistika u psihologiji, prirunik za studente
N1
sy, x sy (1 r 2 )
N2
sy, x sy (1 r 2 )
5,05 Y 20,65
(t/2 oitavamo iz tablice graninih vrijednosti t, za npr. 95% pouzdanost)
Meutim, kada pravac regresije odreujemo na osnovu relativno malog broja podataka,
koristimo sljedei izraz:
1 (X Mx )2
Y s y,x t /2 1
N (N1)s x 2
191
Statistika u psihologiji, prirunik za studente
Koeficijent determinacije
Iz dva izraza za odreivanje standardne pogreke prognoze slijedi:
SSrez
sy, x sy 1 r 2 , s y,x SSrez SS y (1 r 2 )
N2
odnosno:
SSrez = SSY SSY r2,
U gornjem izrazu SSy je totalna suma kvadrata rezultata Y (totalno variranje rezultata Y) i
sadrava totale:
1. sume kvadrata Y objanjen sa X - SSy(r2), i
2. sume kvadrata Y koji je nezavisan od X - SSrez.
U naem primjeru, totalna suma kvadrata rezultata kolskog uspjeha dijeli se na dio koji se
moe objasniti inteligencijom i dio (ostatak) koji objanjavaju druge varijable (ne znamo koje). SS rez
je suma kvadrata Y koja je nezavisna od X i predstavlja mjeru pogreke nakon to preko X
prognoziramo Y.
Nekoliko izvora varijabiliteta mogu se sumirati na sljedei nain:
1. SSX = (X MX)2; varijabilitet inteligencije;
2. SSY = (Y MY)2; varijabilitet kolskog uspjeha;
3. SSY = (Y My)2; varijabilitet kolskog uspjeha objanjen varijabilitetom inteligencije i
4. SSrez = (Y Y)2 = SSY SSY`; varijabilitet kolskog uspjeha koji se ne moe objasniti
varijabilitetom inteligencije.
192
Statistika u psihologiji, prirunik za studente
Kako je ve reeno, jedan dio varijabiliteta kolskog uspjeha objanjen je inteligencijom (SS Y),
a jedan nije (SSrez). Bilo bi korisno da odredimo procenat ukupnog varijabiliteta kolskog uspjeha
koji se moe objasniti varijabilitetom inteligencije, tj. potrebna nam je mjera koja predstavlja odnos:
SS y SS y SSrez
SS y SS y
SS y
r2
SS y
D = r2 = 0,493.
193
Statistika u psihologiji, prirunik za studente
PRIMJER 11.1
Na koji nain se mjenja potronja goriva s poveanjem brzine automobila? Ispod su prikazani
fiktivni podaci (koji oslikavaju realnu situaciju) koliine potroenog goriva na rastojanju od 100 km,
pri razliitim brzinama za automobil marke ASD.
Prikazat emo grafiki povezanost izmeu brzine automobile i koliine potroenog goriva, a
zatim opisati oblik povezanosti.
Slika 7
18
Skater dijagram prikazan je na slici 3.
16
Jasno se vidi da povezanost nije linearna.
Do vrijednosti brzine x=60 km/h potronja 14
PRIMJER 11. 2
195
Statistika u psihologiji, prirunik za studente
MX = 38,63; sX = 6,63
MY = 15,87; sY = 4,66
r N2 30 2 5,29
t 0,528 0,528 3,29
1r 2
1 0,528 2 0,849
Granina vrijednost t za df=28 iznosi tgr= 2,048. Dakle, moemo zakljuiti da je izraunati
koeficijent korelacije statistiki znaajan na nivou p=0,05. tj:
cov xy
a = My b Mx i b 2
sx
196
Statistika u psihologiji, prirunik za studente
Y = 1,58 + 0,37X
Za crtanje pravca potrebne su dvije take. Odredit emo ih preko jednaine pravca regresije.
Za X = 35, Y = 1,58 + 0,37 x 35 = 14,53
Za X = 45, Y = 1,58 + 0,37 x 45 = 18,23
Y 30
25
20
15
10
0
10 20 30 40 50 60
Zakljuit emo da se 27,89% proporcije varijance ope informiranosti moe objasniti verbalnom
inteligencijom.
4. Odredit emo najvjerovatniji rezultat na testu ope informiranosti ispitanika koji na testu
verbalne inteligencije postie rezultat X=42. Odredit emo i 95% interval pouzdanosti
prognoziranog rezultata.
197
Statistika u psihologiji, prirunik za studente
sy
X Mx My 0,528 42 38,63 15,87 17,12
4,66
Y ' r
sx 6,63
9,00 25,23
Uz 95% sigurnost moemo tvrditi da se prognozirani rezultat nalazi u intervalu od 9 do 25,23.
PRIMJER 11.3
ISPITANIK X Y ISPITANIK X Y
1 29 15 16 26 29
2 34,5 15 17 23 29
3 30 19 18 24,5 29
4 35 20 19 25,5 30
5 30,5 20 20 20 30
6 37 20,5 21 28 31
7 31 21 22 25 32
8 37 21 23 28 33
9 37,5 22 24 28,5 33,5
10 39 22 25 32,5 37,5
11 19 23 26 24,5 39
12 27 23 27 18 40
13 40 25 28 27 40,5
14 22 27 29 21 41
15 22 28 30 28 41
198
Statistika u psihologiji, prirunik za studente
Oblik distribucije rezultata obje varijble ispitat emo grafikom i numerikom metodom,
preko box-plot prikaza i skjunisa.
matematike sposobnosti
spacijalne sposobnosti
45.0
40.0
40.0
35.0
35.0
30.0
30.0
25.0
25.0
20.0
20.0
15.0 15.0
Varijabla KS-Z p
Spacijalne sposobnosti ,492 ,969
Matematike ,737 ,649
sposobnosti
Linearnost odnosa izmeu varijabli utvrdit emo grafikim putem, preko skater-dijagrama i
pravca regresije.
199
Statistika u psihologiji, prirunik za studente
50
30
20
10
0
0 10 20 30 40 50
spacijalne sposobnosti (X)
N XY ( X)( Y)
rxy
X 2
X
2
Y 2
Y
2
200
Statistika u psihologiji, prirunik za studente
ISPITANIK X Y X Y XY
1 29 15 841 225 435
2 34,5 15 1190,25 225 517,5
3 30 19 900 361 570
4 35 20 1225 400 700
5 30,5 20 930,25 400 610
6 37 20,5 1369 420,25 758,5
7 31 21 961 441 651
8 37 21 1369 441 777
9 37,5 22 1406,25 484 825
10 39 22 1521 484 858
11 19 23 361 529 437
12 27 23 729 529 621
13 40 25 1600 625 1000
14 22 27 484 729 594
15 22 28 484 784 616
16 26 29 676 841 754
17 23 29 529 841 667
18 24,5 29 600,25 841 710,5
19 25,5 30 650,25 900 765
20 20 30 400 900 600
21 28 31 784 961 868
22 25 32 625 1024 800
23 28 33 784 1089 924
24 28,5 33,5 812,25 1122,25 954,75
25 32,5 37,5 1056,25 1406,25 1218,75
26 24,5 39 600,25 1521 955,5
27 18 40 324 1600 720
28 27 40,5 729 1640,25 1093,5
29 21 41 441 1681 861
30 28 41 784 1681 1148
( X)= 722500
( Y)= 700569
rxy=-0,509
201
Statistika u psihologiji, prirunik za studente
r2 = -0,5092 = 0,259
cov xy
a = My bMx b 2
sx
cov xy - 24,31
b 2
0,651
sx 37,33
Y = 46,35 0,651X
202
Statistika u psihologiji, prirunik za studente
19,55 47,11
Y = 39,42 - 0,3975X
a. U sluaju kada je pogreka prognoze jednaka nuli, korelacija bi bila maksimalno mogua, tj.
r=1. Tada vrijedi:
s 7,82
Y' r y X Mx My 1 35 28,33 27,9 27,9 8,54
x
s 6,11
Y = 19,36 i Y = 36,44
b. Kod maksimalno mogue pogreke prognoze korelacija je jednaka nuli, tj. r=0. Tada vrijedi:
s s
Y' r y X Mx My 0 y X Mx My My
sx sx
Y = My = 27,9
204
Statistika u psihologiji, prirunik za studente
PRIMJER 11.4
Pretpostavimo da je u prethodnom primjeru (10.3) ispitanik pod rednim brojem 27. na testu iz
matematike napravio samo jednu pogreku (y=1). Izraunajte koeficijent korelacije.
Koeficijent korelacije iznosi r=-0,191, to je znatno manje u odnosu na vrijednost izraunatu u
prethodnom primjeru (r=-0,509). Vidimo kako jedan podatak, koji znaajno odstupa od prosjeka,
znaajno mijenja vrijednost koeficijenta korelacije. Ekstremna vrijednost je podatak koji u
znaajnoj mjeri odstupa od drugih. Koeficijent korelacije osjetljiv je na ekstremne vrijednosti i stoga
njihova pojava moe znaajno izmjeniti realnu sliku povezanosti izmeu varijabli.
Na skater dijagramu (slika ispod) moemo uoiti u kojoj mjeri ovaj podatak odstupa od ostalih.
z = -3,19,
to nam pokazuje da ova vrijednost znaajno odstupa od aritmetike sredine (za 3,19 SD).
U praksi se koristi nekoliko postupaka za eliminaciju efekata ekstremnih vrijednosti (npr.
ekstremna vrijednost se iskljui ili zamijeni aritmetikom sredinom).
205
Statistika u psihologiji, prirunik za studente
PRIMJER 11.5
Pretpostavimo da su na grupi uenika prvog razreda nekoliko srednjih kola prikupljeni podaci
o kolskom uspjehu na kraju polugodita i da je primjenjen test matematikih sposobnosti. Stupanj
povezanost izmeu matematikih sposobnosti i kolskog uspjeha utvren je preko Pearsonovog
koeficijenta korelacije koji je iznosio r=0,659.
Nadalje, pretpostavimo da su iz grupe podataka izdvojeni oni koji pripadaju uenicima
matematike gimnazije. Ponovo je izraunat Pearsonov koeficijent korelacije. Ovaj put iznosio je
r=0,388. Kako moemo objasniti razliku u dobivenim koeficijentima korelacije? Zato je u drugom
sluaju dobiven gotovo dva puta manji koeficijent korelacije?
Za odgovor na postavljena pitanja trebamo znati da su uenici matematike gimnazije
selekcionirana grupa. Naime, jedan od kriterija za pohaanje matematike gimnazije su razvijene
matematike sposobnosti. Tako je kriterij za upis u ovu kolu bio rezultat jednak ili vei medijani na
testu matematikih sposobnosti (pretpostavimo da u ovom hipotetskom primjeru iznosi C=28). Stoga
u grupi uenika iz matematike gimnazije uope nema uenika ispodprosjenih matematikih
sposobnosti. Prema tome, opseg rezultata na testu matematikih sposobnosti uenika matematike
gimnazije manji je od opsega rezultata svih uenika koji su uestvovali u istraivanju. Kao
posljedica restrikcije opsega rezultata dobivena je nia vrijednost koeficjenta korealcije na grupi
uenika iz matematike gimnazije.
Na slici 10.5 vidimo kako je povezanost izmeu dvije varijable vea za cjelokupnu grupu
podataka u odnosu na podatke uenika matematike gimnazije. Isprekidanom linijom oznaena je
donja granica rezultata na testu matematikih sposobnosti uenika matematike gimnazije (X=28).
Ako prekrijemo take koje se nalaze ispod X=28, vidjet emo da je grupiranje oko zamiljenog
pravca manje u odnosu na grupiranje takaka svih uenika.
Najee, restrikcija opsega uzrokuje smanjenje koeficijenta korelacije, ali je mogue i da
dovede do njegovog poveanja.
r=0,659
r=0,388
206
Statistika u psihologiji, prirunik za studente
PRIMJER 11.6
Jedna od mjera za poveanje profita koju kompanija M planira poduzeti je poveati ulaganja u
reklamiranje svojih proizvoda. Kako bi ispitala isplativost ovog poslovnog poteza, prikupljeni su
podaci o ulaganju u reklame i ostvarenoj dobiti 20 kompanija koje se bave prodajom razliitih
proizvoda. Odreene su regresijske jednaine za proizvode A, B i C. Podaci su prikazani u tabeli
ispod.
Na osnovu navedenog, moemo zakljuiti da se najveu dobit moe oekivati ako se ulae u
reklamiranje proizvoda C.
207
Statistika u psihologiji, prirunik za studente
ZADACI
A B C D
x y x y x y x y
2 3 9 3 4 3 1 2
5 6 5 2 5 5 3 4
3 4 3 4 3 4 5 6
7 7 7 7 7 3 7 4
6 8 6 9 2 7 9 2
a. Na osnovu podataka odredite, bez raunanja i crtanja skater dijagrama, smjer povezanosti
izmeu varijabli x i y.
b. Nacrtajte skater-dijagram i odredite kakvog smjera su povezanosti izmeu varijabli.
c. Izraunajte Pearsonov koeficijent korelacije za svaki skup podataka.
10 10
10 10
5 5
5 5
0 0 0 0
0 5 10 0 5 10 0 5 10 0 5 10
A B C
x y x y x y
2 3 15 10 2 6
5 6 5 0 3 5
3 4 8 3 4 4
7 8 10 5 5 3
6 7 6 1 6 2
208
Statistika u psihologiji, prirunik za studente
A B
x y x y
1,55 1,55 -1,25 1,25
-0,95 -0,95 -0,625 0,625
-0,2 -0,2 0 0
0,3 0,3 0,625 -0,625
-0,7 -0,7 1,25 -1,25
A B C D
x y x y x y x y
2 3 4 3 4 1 3 2
5 6 5 5 5 2 5 4
3 4 3 4 6 3 4 6
7 7 7 3 7 4 3 8
4 3 2 7 2 5 3 6
5 7 8 4 8 6 6 4
3 4 7 2 3 7 4 2
6 8 3 7 2 8 7 1
4 3 2 3 4 5 3 2
5 5 5 6 5 3 5 5
3 4 3 4 3 7 4 3
7 3 7 7 7 4 3 7
2 7 4 3 2 5 7 4
8 4 5 7 8 3 4 5
7 2 3 4 7 6 2 3
3 7 6 8 3 8 7 6
209
Statistika u psihologiji, prirunik za studente
X Y X Y
1 31 4 16 33 4
2 25 2,8 17 28 3,6
3 20 2,3 18 29 3,8
4 21 2,6 19 23 1,6
5 22 2,6 20 29 2,6
6 29 4,1 21 30 2,8
7 24 2 22 18 2
8 32 4,1 23 30 4,6
9 25 2,6 24 31 3,2
10 30 3 25 17 2,8
11 26 2,1 26 32 4
12 26 2,3 27 27 2,9
13 24 2,7 28 32 4
14 27 3 29 33 1,8
15 28 3,8
7. Ako je korelacija izmeu tjelesne teine (mjerene u kilogramima) i visine (mjerene u metrima)
r=0,60, koliko e iznositi korelacija izmeu teine (mjerene u kN) i visine (mjerene u inima)?
210
Statistika u psihologiji, prirunik za studente
8. Na grupi od 20 uenika prikupljeni su podaci o broju sati provedenih u pripremi za test znanja iz
fizike (X) i rezultatu kojeg su postigli na testu (Y).
X Y
1 5 35
2 14 58
3 10 60
4 9 65
5 4 41
6 7 53
7 12 60
8 15 79
9 4 35
10 9 50
11 8 59
12 11 64
13 5 45
14 6 52
15 10 65
16 11 69
17 16 69
18 13 72
19 15 73
20 12 50
211
Statistika u psihologiji, prirunik za studente
9. Nastavnik je ispitivao povezanost izmeu vremena rjeavanja testa (X) i broja tanih odgovora
koje uenik postigne na testu (Y). Dobiveni podaci prikazani su ispod.
X Y
1 30 75
2 45 100
3 60 54
4 36 81
5 39 94
6 54 65
7 56 79
8 46 79
9 37 95
10 51 82
11 62 54
12 47 82
212
Statistika u psihologiji, prirunik za studente
X Y
1 11 8
2 4 4
3 19 9
4 8 10
5 9 6
6 9 11
7 10 7
8 2 4
9 13 9
10 15 6
11 7 7
12 15 9
13 16 5
14 4 6
15 17 8
16 18 11
17 14 12
18 20 12
19 15 9
20 18 7
11. U istraivanju djetetove percepcije roditeljskog ponaanja primjenjen je instrument koji izmeu
ostalog mjeri psiholoku kontrolu. Ispod su prikazane procjene koje su djeca dala o ponaanju
svojih oeva (X) i majki (Y) na subskali psiholoke kontrole.
x y
1 1,3 0,7
2 2,4 2,1
3 0,8 1,5
4 2,1 2
5 1,8 1
6 0,9 0,9
7 1,8 1,5
8 2,8 2,1
9 1,1 1,8
10 1,3 0,9
11 0,7 1
12 1,7 1,8
213
Statistika u psihologiji, prirunik za studente
x y
1 27 13
2 36 13
3 30 7
4 27 15
5 24 7
6 22 10
7 20 9
8 27 5
9 29 11
10 32 14
11 25 8
12 37 6
13. Provedeno je istraivanje s ciljem ispitivanja povezanosti izmeu koliine uzimanja vitamina B-
12 (X) i kognitivnih funkcija kod starijih osoba (Y). Ispitanici su vitamin B-12 konzumirali u
razliitim dozama (1-preporuena dnevna doza; 1,5-jedna i pol preporuena dnevna doza; 2- dva
puta vea; 2,5- dva i pol puta vea; 3- tri puta vea; 3,5- tri i pol puta vea; 4- etiri puta vea
doza od preporuene dnevne). Dobiveni podaci prikazani su ispod.
214
Statistika u psihologiji, prirunik za studente
x y
1 1 79
2 2,5 81
3 2 82
4 4 89
5 3 92
6 3,5 94
7 4 95
8 1 95
9 2 95
10 1,5 110
11 3 110
12 2,5 115
x y
1 160 75
2 175 65
3 176 67
4 177 75
5 180 72
6 182 74
7 183 79
8 186 85
9 189 80
10 193 86
215
Statistika u psihologiji, prirunik za studente
15. Na poetku nastave iz statistike studenti su rjeavali test matematikih sposobnosti (X). Na kraju
nastave utvren je uspjeh iz statistike (Y).
x y
1 50 90
2 23 85
3 52 95
4 40 90
5 33 87
6 21 77
7 18 74
8 31 79
9 38 80
10 45 92
16. Ispravne konice na automobilu vane su za sigurnu vonju. S vremenom snaga konica slabi.
Kako bi ispitali povezanost izmeu starosti automobila i snage konice provedeno je istraivanje
u kojem je automobilima razliite starosti (X) mjerena distanca zaustavljanja (y) pri brzini od
120 km/h. Starost automobila izraena je u mjesecima a distanca zaustavljanja u metrima.
Podaci su prikazani u tabeli ispod.
x y
1 12 25,40
2 17 30,30
3 25 39,60
4 31 37,20
5 38 36,50
6 45 35,30
7 56 36,20
8 61 45,10
9 65 44,80
10 74 50,20
216
Statistika u psihologiji, prirunik za studente
17. Pretpostavimo da elimo ispitati povezanost izmeu tjelesne teine (X) i tjelesnog selfa (Y). U
istraivanju je uestvovalo deset mlaih adolescenata i deset starijih osoba. Tjelesna teina
izraena je u kilogramima. Tjelesni self izmeren je skalom tjelesnog selfa. Prikupljeni su podaci
od ispitanika mukog spola. Podaci su prikazani ispod.
a. Izraunajte Pearsonov koeficijent korelacije za sve podatke (bez obzira na dob ispitanika)
b. Izraunajte Pearsonove koeficijente korelacije za mlae adolescente i starije osobe.
c. Uporedite izraunate koeficijente korelacije. ta moete zakljuiti?
217
Statistika u psihologiji, prirunik za studente
18. Grupa od 14 ispitanika rjeavala je dva testa, iz geografije (X) i matematike (Y). U tabeli ispod
navedeni su rezultati (bodovi na testu) za svakog uenika u oba testa.
X Y
1 30 15
2 35 12
3 37 8
4 28 7
5 33 12
6 37 14
7 39 6
8 40 15
9 42 16
10 44 13
11 50 17
12 31 7
13 18 10
14 15 9
19. Grupa od 100 ispitanika rjeavala je dva testa, iz hemije i biologije. Povezanost izmeu ova dva
testa iznosi r=0,70. Dobivene su sljedee deskriptivne statistike vrijednosti:
Mh = 50 Mb =60
Sh = 10 sb =10
a. Kolika je pogreka prognoze ako na osnovu rezultata u testu hemije prognoziramo neki
rezultat u testu biologije?
b. Koliko treba iznositi koeficijent korelacije da se standardna pogreka prognoze smanji za
50%?
c. Koji je najvjerovatniji rezultat uenika u testu biologije koji u testu hemije postie rezultat
50?
218
Statistika u psihologiji, prirunik za studente
x y
1 40 10
2 20 3
3 10 1
4 15 2
5 18 4
6 35 6
7 27 9
8 16 8
9 4 5
10 33 7
11 35 8
12 15 4
13 5 2
14 10 5
15 13 6
219
Statistika u psihologiji, prirunik za studente
12. Rjeenja
2.
a. KATEGORIJALNA/ NOMINALNA
b. KONTINUIRANA/ RACIO-OMJERNA
c. KATEGORIJALNA/ NOMINALNA
d. KONTINUIRANA/ RACIO
e. KONTINUIRANA/ RACIO
f. KONTINUIRANA/ RACIO
g. KATEGORIJALNA / NOMINALNA
h. KONTINUIRANA/ INTERVALNA
i. KONTINUIRANA/ RACIO
j. KATEGORIJALNA/ NOMINALNA
3.
a. Broj novoroenadi - RACIO; spol NOM.; poroajna teina RAC.; datum i vrijeme roenja RAC.
b. Duine (u mm) zadnjeg donjeg molara RACIO; broj pacijenata - RACIO.
c. Brok kontrolisanih vozila RACIO; vrsta prekraja NOM.; registarske tablice NOM.; brizna kretanja vozla RACIO; spol
vozaa NOM.
d. Visina djece racio; teina djece RACIO; stanje plua NOM.; stanje abdomena NOM.; stanje ekstremiteta NOM.;
stanje oiju NOM.; visina sedimentacije RACIO; broj eritrocita RACIO; broj leukocita RACIO; broj roditelja u pratnji
djeteta - RACIO.
e. Broj mjerenja RACIO; dimenzije obrisa kocke ucrtanih na kartonu - RACIO.
f. Broj listova na biljci RACIO; broj biljaka - RACIO.
g. Broj mjerenja krvnog pritiska RACIO; Visina krvnog pritiska RACIO.
h. Broj razreda; broj odjeljenja; broj uenika - RACIO.
i. Broj opaane djece RACIO; vremensko trajanje igre - RACIO.
j. Broj atletiara RACIO; Poredak atletiara na cilju RANG.
220
Statistika u psihologiji, prirunik za studente
7.
a. INTERVALNA SKALA
a.1.
1 - NIJE POLOIO IPIT: Ren
2 POLOIO ISPIT: Ben, Den, Ken, Jen, Wen.
Rezultati izraeni na nominalnoj skali: 1, 2, 2, 2, 2, 2
a.2. Rezultati izraeni na rang skali:
1. Wen, 2. Ken, 3. Ben, 4. Jen, 5. Den, 6. Ren
b. RACIO SKALA
b.1.
1 NIJE ZAVRIO TRKU: Asaffa Powell
2 ZAVRIO TRKU: Carl Lewis, Tyson Gay, Donovan Bailey, Usain Bolt, Leroy Burrell, Maurice Green
Rezultati izraeni na nominalnoj skali: 1, 2, 2, 2, 2, 2, 2
2.
a. Distribucija frekvencija rezultata grupiranih u 8 razreda.
Razredi f
67-76 7
77-86 5
87-96 6
97-106 4
107-116 5
117-126 2
127-136 0
137-146 1
total 30
b. 136,5 146,5
221
Statistika u psihologiji, prirunik za studente
c. Stem-and-leaf prikaz
6 8 9 (2)
7 0 0 3 4 6 9 (6)
8 2 3 4 5 9 (5)
9 1 3 3 5 6 7 (6)
10 0 0 4 9 (4)
11 0 3 4 6 (4)
12 1 6 (2)
14 2 (1)
8 2 znai 8,2
e.
100,0% 100,0%
96,7% 96,7%
90,0% 90,0%
80,0%
73,3%
70,0%
60,0% 60,0%
50,0%
40,0% 40,0%
30,0%
23,3%
20,0%
10,0%
0,0% 0,0%
56,5
66,5
76,5
86,5
96,5
106,5
116,5
126,5
136,5
5.
25
20
broj golova
15
10
0
1-15 16-30 31-45 d.v. (1) 46-60 61-75 76-90 d.v. (2)
minuta susreta
6.
ene 61 61 61 62 63 63 72 72 73 73 74 76
81 83 83 89 92 93 95 95
mukarci 64 68 72 75 75 79 81 81 81 81 83 84 85
85 86 86 86 88 89 89 92 92 93 96 98
222
Statistika u psihologiji, prirunik za studente
10.Histogram
11. Torta ili stupasti dijagram. Histogram.
12. Histogram ili stablo i list prikaz.
14.Stupasti dijagram.
15.Histogram ili stablo i list prikaz.
C=17
M=17
3.5.
100,0%
90,0%
80,0%
70,0%
60,0%
50,0%
40,0%
30,0%
20,0%
10,0%
0,0%
0 4,5 9,5 14,5 19,5 24,5 29,5 34,5 x
9. C=77; M=125,26
Distribucija rezultata je izrazito asimetrina. Stoga je medijana reprezentativnija mjera centralne tendencije.
10. C=12,4; M=14,07
U nizu podataka jedna vrijednost je ekstremna (55,8). Stoga je medijana reprezentativnija mjera centralne tendencije.
4. MJERE VARIJABILITETA
1. Q1=15; C=18; Q3=20; IQR=5; s=3,59
2. Q1=1; C=2; Q3=4; IQR=3; s=2,64
4. Q1=12,63; Q3=21,38; IQR=8,75; s=6,24
7. Q1=11,75; Q3=15,525; IQR=3,775; s=2,25
10. M1=8,95; s1= 9,41
M2= 7,32; s2=6,09
Vrijednost aritemtike sredine i standardne devijacije manja je nakon to je iskljuena ekstremna vrijednost.
11. Na osnovu kvartila i centralne vrijednosti ne moemo odrediti o kojem rezultatu se radi.
Koristei M i s, odredit emo da je u pitanju rezultat 16.
12. A-T1; B-T4;C-T2; D-T3.
13. Interkvarilni raspon:
Q1 = 32,33
Q3 = 39,34
IQR = 7,01
v = 89,68
s = 9,47
4.14.
Q1 = 749,75
Q3 = 1.149,80
IQR = 400,05
s = 1.387,535
v = 1.925.254
6. NORMALNA RASPODJELA
1.
68,26% sredinjih vrijednosti: M s = 135,08 1,83: 133,25 - 136,91
95,44% sredinjih vrijednosti: M 2s = 135,08 2*1,83: 131,42 - 138,74
99,73% sredinjih vrijednosti: M 3*s =135,08 3*1,83:129,59 - 140,57
224
Statistika u psihologiji, prirunik za studente
3.
a. z=0
b. z=1
c. z=2
d. z = -1
e. z = -3
4.
a. X = 125
b. X = 73,4
c. X = 95
d. X = 107
e. X = 119
f. X = 59
5.
M = 55,8
7.
a. z = -3,29
% niih rez.: 0,06 % viih rez.: 99,94
b. z = -4,00
% niih rez.: 0 % viih rez.: 100
c. z = -1,29
% niih rez.: 9,85 % viih rez.: 90,15
d. z = 0,86
% niih rez.: 80,51 % viih rez.: 19,49
e. z = 2,00
% niih rez.: 97,72 % viih rez.: 2,28
f. z = -2,71
% niih rez.: 0,34 % viih rez.: 99,66
11.
a. z1 = -2,29
b. z2 = 0,89
c. z3 = 2,63
d. z4 = 3,76
e. z5 = -2,74
f. z6 = -1,32
g. 1335; 252; 6; 0; 1346; 1224
h. 1334; 1094; 252; 111
i. X = 202
j. X 236,20
k. X 216,82
12.
a. 11 kandidata.
b. X 133
c. Kandidat A.
225
Statistika u psihologiji, prirunik za studente
8. TESTIRANJE HIPOTEZA
10. ANOVA
1
Izvor varijabiliteta Suma kvadrata (SS) Stepeni slobode (df) Varijanca (MS) F p
izmeu grupa 41,73 2 20,87 0,094 0,911
unutar grupa 2659,60 12 221,63
Total 2701,33 14
2
Izvor varijabiliteta Suma kvadrata (SS) Stepeni slobode (df) Varijanca (MS) F p
izmeu grupa 101,60 2 50,80 3,603 0,041
unutar grupa 380,70 27 14,10
Total 482,30 29
226
Statistika u psihologiji, prirunik za studente
1.
2.
10 10
10 10
5 5
5 5
0 0 0 0
0 5 10 0 5 10 0 5 10 0 5 10
c.
x y x y x y x y
2 3 4 3 4 3 1 2
5 6 5 5 5 5 2 4
3 4 3 4 6 4 3 6
7 7 7 3 7 3 4 8
4 3 2 7 2 3 5 6
5 7 8 4 8 6 6 4
3 4 7 2 3 4 7 2
6 8 3 7 2 7 8 1
8.a.b.
c. r=0,835
d. y = 2,7445x + 30,804
227
Statistika u psihologiji, prirunik za studente
e. y=72 sata
f. y=58 sata
g. y = 0,2542x - 4,8646; y=1,5 sati
9.
a.
b. y = -0,9497x + 122,89
c. r=-0,64838
10.
a.
b. y = 0,241x + 5,0444
c. r= 0,528271
11.
a.
b. y = 0,5223x + 0,6278
c. r=0,661921
12.
a.
b. y = 0,4116x - 1,6071
c. r=0,670059
228
Statistika u psihologiji, prirunik za studente
13.
a.
b. r=0,085
14.
a. r=0,598; koeficijent korelacije trebao bi biti vei
b. Na skater dijagramu jasno je uoljiv ekstremni rezultata.
b. r=0,844
c. y = 0,4966x + 67,468
d. y=77,4
e. z=0, X=M+zs=35,1; y=84,9
16.
b. r=0,864
c. y = 0,2965x + 25,489
d. x=0; y=25,489 m
e. x=120; y=61,1 m
229
Statistika u psihologiji, prirunik za studente
a. r=0,136
b. za mlae adolescente r=0,526; za starije ispitanike r=0,251
c. U istraivanju su sudjelovali ispitanici razliite dobi (heterogene grupe ispitanika)
17.
a.r=0,500
b. y = 0,1931x + 4,8944
c. sy=3,67; sy,x=3,18
d. y=14,55
e.i. Ako je sy=0, onda je r=+/- 1. y=+/-1 x (3,67/9,52) x (40-34,21) + 11,5 = +/-2,23 + 11,5= 9,27 i 13,73
e.ii. Ako je sy=max, onda je r=0; y=My=11,5
18.
a. sy,x=7
b. sy,x=3,5; sy,x2=sy2(1-r2) r2=(sy2-sy,x2)/sy2=0,8775: r=0,937
230
Statistika u psihologiji, prirunik za studente
i
Statistika u psihologiji, prirunik za studente
ii
Statistika u psihologiji, prirunik za studente
iii
Statistika u psihologiji, prirunik za studente
pretpostavki. Autor na poetku poglavlja vrlo struno i za studente prihvatljivo objanjava zato su
hipoteze vane i kako se one definiraju, te u poglavljima devet i deset daje prikaz osnovnih testova
za ispitivanje znaajnosti razlika artimetikih sredina (t-testova i analizi varijanci). U posljednjem
jedanaestom poglavlju studenti imaju priliku proitati i nauiti to je to povezanost izmeu dvije
varijable, te nauiti kako se testira znaajnost korelacije.
Ovaj prirunik predstavlja jedinstveno djelo po pristupu u objanjavanju statistikih koncepata. Na
prvo itanje je jasno da je napisan od strane autora koja ima viegodinje iskustvo u poduavanju
studenata statistici. Autor pie tako da prati misaoni tok studenta i daje mu upravo onoliko
informacija koliko je potrebno da se shvati sutina. Autor potuje sve principe logikog izlaganja i
ide od jednostavnijih ka teim stvarima, a apstraktne koncepte objanjava kroz razumljive praktine
primjere i slikovne prikaze koji omoguavaju studentima da u potpunosti razumiju to se, u stvari
krije iza formula. Na kraju svakog poglavlja autor daje zadatke za vjebanje kako bi studenti
izgradili znanje i vjetinu obrade podataka, te tako postali samostalni i kompetentni za budui rad.
Ovaj prirunik je usmjeren prema studentu i napisan je za studenta i moe sluiti kao primjer
metodiki adekvatnog i psiholoki motivirajueg materijala. Autor je uspio pokazati da je kao
strunjak i naunik vrsni poznavalac statistike, a da je kao nastavnik okrenut prema studentu i
sposoban vrlo sloene stvari objasniti tako da ga razumiju i oni koji ne vole matematiku.
Koritenje ovog prirunika kod studenata e zasigurno umanjiti anksioznost od pripreme ispita, te
razbiti predrasude o statistici kao matematici rezerviranoj samo za odabrane. Ovaj prirunik e
omoguiti svim zainteresiranim studentima da doive statistiku kao temelj istraivanja, zakljuivanja
i predvianja u psihologiji.
v
Statistika u psihologiji, prirunik za studente
Biografija
Nermin apo roen je 14. 1. 1970. godine u Mrkonji Gradu. Diplomirao je na Filozofskom
fakultetu u Sarajevu, Odsjek za psihologiju. Od 1997. godine zaposlen je na Odsjeku za psihologiju,
naprije kao asistenta na predmetima Statistika u psihologiji i Metodologija istraivanja u psihologiji,
zatim kao vii asistenta na predmetima Statistika u psihologiji i Opa psihologija II, a od 2007.
godine kao docenta na predmetima Statistika u psihologiji i Kognitivna psihologija. Na Filozofskom
fakultetu u Zagrebu 2001. godine odbranio je magistarsku radnju pod naslovom Kompozitno
pamenje i kohezija memorijskih tragova. Doktorsku disertaciju Interna i eksterna validacija
dinamikog testiranja inteligencije odbranio je 2006. na Odsjeku za psihologiju Filozofskog
fakulteta u Sarajevu. U okviru strunog i naunog usavravanja boravio je na LMU u Minhenu,
Njemaka i Institutu za psihologiju u Geteborgu, vedska. Podruje strunog i naunog rad su
primijenjena statistika, inteligencija i nadarenost. Objavio je vie naunih i strunih lanaka, u
autorstvu i koautorstvu, u domaim i internacionalnim asopisima (Naa kola, Didaktiki putokazi,
Psihologijske teme, Group Dynamics: Theory, Research and Practice, Journal of the American
Academy of Child and Adolescent Psychiatry, Mankind Quarterly, Personality and Individual
Differences, Temas em Psicologia). Sudjelovao je kao voditelj ili konsultant na vie istraivakih i
aplikativnih projekata. Uestvovao je na domaim i meunarodnim naunim i strunim skupovima i
seminarima.
Ratko oki roen je 3. 1. 1979. godine u Sarajevu. 2002. godine diplomirao je na Odsjeku za
psihologiju Filozofskog fakulteta u Sarajevu. Od 2001. do danas uestvovao u ili vodio niz projekata
socijalnih, trinih i medijskih istraivanja te istraivanja javnih politika (za klijente kao to su
UNICEF, BBC World Service Trust, Intermedia Washington, Unilever, UNDP, Save the Children
UK, Vijee za tampu BiH...). Od 2007. godine radi na Odsjeku za psihologiju Filozofskog fakulteta
u Sarajevu gdje je kao asistent angaovan na predmetima Statistika u psihologiji I i II, Metodologija
eksperimentalne psihologije i Metodologija neeksperimentalne psihologije. Trenutno pohaa
Doktorski studij psihologije u Zagrebu.
vi