You are on page 1of 264

Nakladnik: Sveuilite u Splitu Filozofski fakultet Za nakladnika: prof. dr.

Josip Milat, dekan Biblioteka: Suvremena nastava Knjiga br. 1 Recenzentice: prof. dr. Elza Jurun prof. dr. Ani Leburi doc. dr. Mirjana imeija Lektorica: Sonja Krvavica, prof. Dizajn naslovnice: Baldo Leburi Grafika obrada: doc. dr. Snjeana Pivac

CIP - Katalogizacija u publikaciji SVEUILINA KNJINICA U SPLITU UDK 311.1(075.8) PIVAC, Snjeana Statistika za socioloka istraivanja / Snjeana Pivac, Ante Rozga. - Split : Filozofski fakultet Sveuilita, 2006. - (Biblioteka Suvremena nastava ; knj. 1) Bibliografija. ISBN 953-7395-01-4 1. Rozga, Ante 120625059
ISBN 953-7395-01-4

SNJEANA PIVAC ANTE ROZGA

za socioloka istraivanja

STATISTIKA

Split, 2006.

SADRAJ
Predgovor ............................................................................... 1. Uvod .................................................................................... 1.1. Pojam i zadaa statistike ................................................... 1.2. Predmet prouavanja statistike ......................................... 1.3. Vrste varijabli - statistika obiljeja ................................. 1.4. Izvori podataka i metode njihova pribavljanja ................. 1.5. Sekundarni podaci ............................................................ 1.6. Primarni podaci ................................................................ 1.7. Naini prikupljanja podataka ........................................... 1.8. Priprema podataka za statistiku analizu ......................... 1.9. Uzorak .............................................................................. 2. Ureivanje i prikazivanje podataka ................................. 2.1. Grupiranje podataka .......................................................... 2.1.1. Nizovi kvalitativnih podataka ............................ 2.1.2. Numeriki niz ..................................................... 2.2. Tabeliranje ........................................................................ 2.3. Relativni brojevi strukture ................................................ 2.4. Grafiko prikazivanje statistikih nizova ......................... 2.5. Relativni brojevi koordinacije i indeksi ........................... 3. Srednje vrijednosti .............................................................. 3.1. Srednje vrijednosti ............................................................. 3.2. Aritmetika sredina ........................................................... 3.3. Mod ................................................................................... 3.4. Harmonijska sredina ......................................................... 3.5. Medijan ............................................................................. 3.5.1.Kvantili ................................................................ 4. Mjere disperzije, asimetrija i zaobljenost ......................... 4.1. Mjere disperzije .................................................................. 4.1.1. Apsolutne mjere disperzije .................................. 4.1.2. Relativne mjere disperzije ................................... 7 9 9 10 11 12 13 14 23 24 25 35 35 36 37 40 43 46 71 103 103 104 107 118 121 124 133 133 133 139

4.1.3. Momenti numerikih nizova ................................ 151 4.2. Mjere asimetrije .................................................................. 152 4.3. Mjera zaobljenosti .............................................................. 156 5. Vjerojatnost .......................................................................... 5.1. Klasina definicija vjerojatnosti .......................................... 5.2. Teorem o zbrajanju vjerojatnosti ......................................... 5.3. Teorem o mnoenju vjerojatnosti ........................................ 5.4. Uvjetna vjerojatnost ............................................................ 5.5. Diskontinuirana sluajna varijabla ...................................... 5.6. Teorijske distribucije diskontinuirane sluajne varijable .... 5.6.1. Binomna distribucija ............................................. 5.6.2. Poissonova distribucija ......................................... 5.6.3. Dvodimenzionalna diskontinuirana distribucija ... 5.6.4. Marginalne distribucije diskontinuirane sluajne varijable ......................................................................... 5.6.5. Uvjetne distribucije diskontinuirane sluajne varijable ......................................................................... 5.7. Kontinuirana sluajna varijabla .......................................... 5.8. Teorijske distribucije kontinuirane sluajne varijable ........ 5.8.1. Normalna distribucija ........................................... 5.8.2. Studentova distribucija ......................................... 6. Ocjene parametara osnovnog skupa na osnovi uzorka ... 6.1. Uzorak ................................................................................. 6.2. Procjena aritmetike sredine osnovnog skupa .................... 6.3. Procjena proporcije osnovnog skupa .................................. 167 167 168 169 170 176 177 177 183 189 190 191 195 196 196 198 201 201 202 209

7. Analitiki primjeri za vjebu .............................................. 217 8. Tablice odabranih statistikih distribucija ........................ 257 A. Povrine ispod normalne krivulje .......................................... 257 B. Kritine vrijednosti t, Studentove distribucije ....................... 258 9. Literatura .............................................................................. 259 Biljeka o autorici i autoru ...................................................... 264

PREDGOVOR
Ovaj udbenik namijenjen je prvenstveno studentima Odsjeka za sociologiju Filozofskog fakulteta u Splitu, ali i svim drugim zainteresiranim korisnicima koji u svom strunom i znanstvenom radu, bavei se drutvenim istraivanjima, primjenjuju statistike metode i tehnike. Rad obuhvaa teorijske osnove i objanjenja za svako u ovaj rad ukljueno podruje statistike. Kroz rjeavanje velikog broja konkretnih analitikih primjera daju se objanjenja dobivenih rezultata i njihovo kritiko vrednovanje. Na kraju udbenika u sklopu posljednjeg poglavlja nalazi se odreeni broj analitikih primjera koji su ostavljeni korisniku za samostalno rjeavanje. Svaki primjer sadri i rjeenja u svrhu kontrole valjanosti usvojenoga gradiva. Na taj nain se studentima ne ostavlja dvojbenim ni nain pismene provjere znanja te ih se osposobljava da samostalno statistiki analiziraju odreene pojave na struno zadovoljavajui nain. Primjeri u udbeniku obraeni su u SPSS - Statistical Package for the Social Sciences, koji je upravo prilagoen sociolokim istraivanjima. Ovaj program prua puno mogunosti za provoenje statikih metoda i tehnika na konkretnim analizama. Naime, upotrebom statistikih paketa, poevi ve od pripremne faze statistikog istraivanja, znatno se skrauje i pojednostavljuje vrijeme potrebno za primjenu statistikih metoda i tehnika. Na taj se nain statistiki postupci pribliavaju mnogim korisnicima. Svaki analitiki primjer rijeen u SPSS-u u tekstu udbenika ima oznaku u obliku slike CD-a. Takovi primjeri su priloeni u elektronikom obliku u dokumentu SPSS i svaki od njih ima i konkretno rjeenje u dokumentu Output programa SPSS. Potrebno je napomenuti da e studenti koji nastave obrazovanje na poslijediplomskim studijima biti pripremljen za struni i znanstveni rad u svojim istraivanjima, gdje se redovito koristi SPSS. Dio studenata koji e se nakon diplomiranja neposredno ukljuiti u poslovnu praksu, takoer e imati koristi, jer je danas SPSS redovito najzastupljenija programska potpora u drutvenim analizama.

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOGIJU

Potrebno je napomenuti da je SPSS kompatibilan s Microsoft Excelom, pa se ve postojei podaci iz jednog programa mogu jednostavno kopirati u drugi. Microsoft Excel je jedan od najrairenijih i programa za tabline izraune te je lako dostupan veini korisnika. U radu su koritene oznake i simboli, koji su preuzeti iz standardne statistike literature. Ako se, pak, u literaturi koriste razliite oznake, upotrijebljena je ee spominjana verzija. Na kraju istaknimo, ovaj udbenik je nastao kao rezultat viegodinjeg iskustva autora kod primjene statistikih metoda u izradi brojnih znanstvenih i strunih radova, studija i analiza te kao rezultat predavakog iskustva pri prenoenju znanja iz podruja statistike na mnoge generacije studenata splitskoga Ekonomskog fakulteta i drugih drutvenih znanosti. Za suradnju i niz korisnih sugestija zahvaljujemo recenzenticama prof. dr. Elzi Jurun, prof. dr. Ani Leburi i doc. dr. Mirjani imeija.
Split, rujan 2006. Autori

Uvod

1. UVOD
1.1. Pojam i zadaa statistike Statistika je posebna znanstvena disciplina koja u svrhu realizacije postavljenih ciljeva istraivanja na organiziran nain prikuplja, odabire, grupira, prezentira i vri analizu informacija ili podataka te interpretira rezultate provedene analize. Statistika se kao znanstvena disciplina moe podijeliti na: 1. deskriptivnu statistiku i 2. inferencijalnu statistiku. 1. Deskriptivna ili opisna statistika temelji se na potpunom obuhvatu statistikog skupa iju masu podataka organizirano prikuplja, odabire, grupira, prezentira i interpretira dobivene rezultate analize. Na taj nain se, izraunavanjem razliitih karakteristika statistikog skupa, sirova statistika graa svodi na lake razumljivu i jednostavniju formu. Ako se statistike metode i tehnike primjenjuju na itav statistiki skup, dakle ako su istraivanjem obuhvaeni svi elementi skupa, oni tvore statistiku populaciju. 2. Inferencijalna statistika temelji se na dijelu (uzorku) jedinica izabranih iz cjelovitoga statistikog skupa pomou kojeg se uz primjenu odgovarajuih statistikih metoda i tehnika donose zakljuci o itavom statistikom skupu.

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Uvijek je prisutan odgovarajui stupanj rizika kada se koriste rezultati iz uzorka, za koji je poeljno da bude izabran na sluajan nain i da bude reprezentativan. Inferencijalna statistika pripada skupini induktivnih metoda, kojima se izvode zakljuci polazei od opega prema posebnome. 1.2. Predmet prouavanja statistike Statistike metode i tehnike temelj su za provoenje statistike analize drutvenih (i prirodnih) pojava. Predmet prouavanja statistike su odreene zakonitosti koje se javljaju u masovnim pojavama. Zadaa statistike je da uoi zakonitosti u masovnim i sluajnim pojavama te da ih iskae brojano. Masovne pojave su skupine istovrsnih elemenata koji imaju jedno ili vie zajednikih svojstava. Takvu skupinu nazivamo statistikom masom ili statistikim skupom.

Statistiki skup potrebno je definirati pojmovno, prostorno i vremenski. Pojmovno odrediti statistiki skup podrazumijeva odrediti pojam ili svojstvo svakog elementa promatranog skupa. Prostorno odrediti statistiki skup znai odrediti prostor na koji se odnosi ili kojemu pripadaju elementi statistikog skupa. Vremenski odrediti statistiki skup znai odrediti vremenski trenutak ili razdoblje kojim e se obuhvatiti svi elementi koji ulaze u statistiki skup. Analitiki primjer 1.1: Statistiki skup, "studenti 1. godine Filozofskoga fakulteta Odsjeka za sociologiju u Splitu u Republici Hrvatskoj u akademskoj godini 2006./07., na dan 10. 10. 2006. godine", vrlo je precizno odreen i iz takve njegove definicije mogu se odrediti svi njegovi elementi.

10

Uvod

Svojstvo svakog elementa odnosno studenta definirano je najprije pojmovno, tj. jasno je da se radi o studentima 1. godine Filozofskoga fakulteta - Odsjeka za sociologiju. Elementi ovog skupa odreeni su i prostorno, tj. nalaze se u Splitu na podruju Republike Hrvatske. Vremenska definicija toga statistikog skupa upuuje na vremenski interval s kojim su elementi skupa obuhvaeni, tj. akademsku godinu 2006./07. i trenutak u kojem su studenti selektirani, tj. 10. 10. 2006. godine. 1.3. Vrste varijabli - statistika obiljeja Statistika obiljeja su ope karakteristike elemenata statistikog skupa po kojima su ti elementi meusobno slini i po kojima se meusobno razlikuju. Analitiki primjer 1.2: Statistiki skup, "studenti 1. godine Filozofskoga fakulteta Odsjeka za sociologiju u Splitu u Republici Hrvatskoj u akademskoj godini 2006./07., na dan 10. 10. 2006. godine", promatran je prema obiljeju "spol". Sasvim je jasno da je spol jedna od karakteristika svakog studenta. Postoji muki i enski spol. Neki studenti su jednakog spola, a neki se razlikuju po spolu. Potrebno je napomenuti da je u programskom paketu SPSS oznaka za statistika obiljeja: Variable Type. Openito se statistika obiljeja mogu podijeliti: na 1. kvalitativna statistika obiljeja, koja mogu poprimiti razliite oblike, ali se izraavaju opisno. Ako se modalitetima ovog obiljeja sluajno pridrue brojevi, s njima nisu doputene nikakve raunske operacije (u SPSS-u: Variable Type: String).

11

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

2. kvantitativna statistika obiljeja koja se izraavaju brojano. (u SPSS-u: Variable Type: Numeric). Kvalitativna statistika obiljeja mogu se podijeliti: na a) nominalna statistika obiljeja i na b) redoslijedna statistika obiljeja. a) Nominalna statistika obiljeja izraavaju se opisno. b) Redoslijedna statistika obiljeja mijenjajuse prema intenzitetu ili rangu. Na primjer: uspjeh na ispitu iz predmeta Statistika u sociologiji I (ovdje se javljaju modaliteti obiljeja od 1 do 5, ali se njima ne vre nikakve raunske operacije, ve se pomou njih elementi skupa, odnosno studenti, mogu rangirati). Kvantitativna statistika obiljeja jo se nazivaju i numerika statistika obiljeja, a mogu se podijeliti: na a) neprekidna ili kontinuirana statistika obiljeja i na b) prekidna ili diskontinuirana statistika obiljeja. a) Neprekidna ili kontinuirana statistika obiljeja takva su numerika obiljeja koja mogu poprimiti neprebrojivo beskonano mnogo vrijednosti. Primjeri takvog obiljeja su: visina, teina, duljina, dob itd. b) Prekidna ili diskontinuirana statistika obiljeja takva su numerika obiljeja koja mogu poprimiti prebrojivo beskonano mnogo vrijednosti. Primjeri takvog obiljeja su: broj djece, broj uenika u razredu, starost u godinama, visina plae u kunama itd. 1.4. Izvori podataka i metode njihova pribavljanja Osnovne faze statistikog istraivanja su: a) statistiko promatranje b) grupiranje (tabelarno i grafiko prikazivanje statistikih podataka)
12

Uvod

c) statistika analiza i interpretacija rezultata provedene analize. Statistiko promatranje statistikih podataka. je organizirano prikupljanje

Nakon precizne definicije zadatka, cilja i predmeta istraivanja, tj. statistikog skupa, pristupa se organiziranom prikupljanju statistikih podataka. Uspjenost i objektivnost ovog prvog koraka uvjetuje kvalitetu rezultata ostalih faza statistikog istraivanja. Nepotpune i neistinite prikupljene informacije do kojih bi se dolo u ovoj fazi znaile bi da konaan rezultat statistikog istraivanja sadri greku. Pri tom greka moe biti sistematska i sluajna. Sistematsku greku je lake uoiti jer se ona ponavlja (npr. neispravnost odreenoga mjernog instrumenta, neistinito izjanjavanje ispitanika). Sluajnu greku je teko precizno identificirati, jer se ona ne javlja kod svakog mjerenja i ne javlja se istim intenzitetom. Stoga se kod sluajne greke esto vee pretpostavka o ponitavanju njezin utjecaja na globalnoj razini promatranja. U ovisnosti o karakteru izvora podataka, statistiki podaci se dijele: na a) sekundarne podatke i na b) primarne podatke. 1.5. Sekundarni podaci Sekundarni podaci su oni koji se pribavljaju iz ve postojeih baza podataka razliitih dravnih ustanova. Takvi se podaci prikupljaju sustavno na odgovarajui nain, a njihov opseg ne ovisi o donoenju neke poslovne odluke ili zadanom cilju nekakvog istraivanja. Takve podatke u Hrvatskoj prikupljaju: Dravni zavod za statistiku, Hrvatska narodna banka, Hrvatska gospodarska komora, te neke druge specijalizirane agencije. Jedan od najee koritenih sekundarnih izvora podataka u Hrvatskoj je Statistiki ljetopis Hrvatske u izdanju Hrvatskog zavoda za statistiku. U svjetskim okvirima poznat je World Statistical Yearbook, a internetom su danas dostupne mnoge baze sekundarnih podataka (na primjer: Eurostat, U.S. Census Bureau i

13

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

slino). Na razini poduzea raznovrsna specifina izvjea o poslovanju i zaposlenicima imaju sekundarni karakter. Sekundarni podaci su uglavnom brojani. Predoeni su tablicama, a vrlo esto i grafikim prikazima. 1.6. Primarni podaci Primarni podaci prikupljaju se neposrednim promatranjem svojstava elemenata statistikog skupa u skladu s unaprijed definiranim ciljevima statistikog istraivanja. Prikupljanje tih podataka zahtijeva definiranje statistikog skupa, izbor obiljeja koja se ele istraiti, odreivanje modaliteta promatranog obiljeja, pripremanje anketnih upitnika i/ili prateih formulara te organiziranje i provoenje samog prikupljanja podataka. Ako se podaci prikupljaju za sve lanove nekog skupa, takvo promatranje naziva se census. Primjer takvog prikupljanja je popis stanovnitva. Vrlo esto su takva istraivanja skupa, pa se podaci prikupljaju za podskup osnovnog skupa, odnosno za uzorak. Takvo promatranje se naziva reprezentativno promatranje. Prema vremenu promatranje moe se podijeliti na jednokratno, periodino i tekue. Jednokratno promatranje provodi se jedanput i nema ponavljanja. Periodino promatranje se ponavlja nakon jednakih perioda (npr. bilanca uspjeha u poduzeu). Za tekue promatranje mjerenje je kontinuirano (npr. proizvodnja mlijeka). Prikupljanje primarnih podataka moe se vriti i pomou statistikih pokusa. Statistikim pokusom se vri mjerenje vrijednosti obiljeja nastalih u kontroliranim uvjetima. Vrlo estu primjenu statistiki pokus ima u marketinkom istraivanju trita. Na primjer, eli se istraiti kako boja pakiranja deterdenta za rublje utjee na kupnju. U takvom sluaju istraiva e u pokusu odrediti razliite boje pakiranja (vrijednosti kontroliranog obiljeja) i u njima e izloiti proizvod. U odreenom vremenu vriti e se mjerenje opsega prodaje. Na taj nain dobiveni statistiki podaci su primarni.

14

Uvod

Statistiki podaci prikupljeni nekom od navedenih metoda predstavljaju "sirovu" statistiku grau koju je potrebno na odgovarajui nain urediti i pripremiti za analizu. Danas se statistiki podaci uglavnom obrauju prikladnim programima za raunalo. Postoje suvremeni statistiki programski paketi koji omoguavaju, uz vrlo jednostavno rukovanje, unos, pripremu i obradu prikupljenih statistikih podataka. Primjeri suvremenih statistikih paketa su: STATISTICA, SAS, SPSS. Kratica SPSS odgovara engleskom nazivu programa Statistical Package for the Social Sciences, koji je upravo prilagoen sociolokim istraivanjima. Spomenuti statistiki paketi se koriste za sloenije statistike analize. Potrebno je napomenuti da je jedan od najpopularnijih softwarea (programskih jezika) za tabline proraune u provoenju razliitih aspekata statistike analize i Microsoft Excel. U podruju programa koji su namijenjeni prvenstveno tablinim proraunima su Lotus 1-2-3 i QuatroPro, ali upotreba MS Excela je najrairenija. MS Excel je u funkciji svih bitnih faza procesa statistike analize od formiranja baze podataka, sreivanja i grupiranja podataka, grafikog prikazivanja statistikih nizova, izrauna temeljnih karakteristika statistikog niza pa sve do sloenijih statistikih analiza i procedura i analize vremenskih nizova. Ovaj program je kompatibilan sa SPSS-om, pa se ve postojei podaci iz jednog programa mogu jednostavno kopirati u drugi. Upotrebom statistikih paketa, poevi ve od pripremne faze statistikog istraivanja, znatno se skrauje i pojednostavljuje vrijeme potrebno za primjenu statistikih metoda i tehnika. Na taj se nain statistiki postupci pribliavaju mnogim korisnicima. Prikupljene statistike podatke potrebno je unijeti i pohraniti u odgovarajuu datoteku odabranog statistikog paketa. Kada se unose podaci kvalitativnog ili opisnog karaktera, potrebno je izvriti ifriranje ili kodiranje vrijednosti takvih obiljeja. U bilo kojem statistikom programskom paketu, pa tako i u SPSSu, potrebno je za svaku varijablu odabrati odgovarajuu skalu mjerenja. U SPSS-u oznaka za skalu mjerenja je Measure i postoje 3 vrste skale mjerenja:
15

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Nominal: nominalne skale, za koje se umjesto imena predmeta navodi njegov broj. Brojevi slue samo za identifikaciju. Ordinal: ordinalne skale koje slue za oznaavanje redoslijeda (odreuju je li neto vee ili manje od drugoga). Scale: numerika statistika obiljeja su vezana za intervalnu i omjernu skalu.

Intervalna skala nema apsolutnu nulu (nula u ovom sluaju ne znai nepostojanje promatrane pojave). Na primjer: obiljeje "temperatura zraka" 00C ne upuuje na nepostojanje temperature. Vrijednosti ove skale ne mogu se dijeliti, (50C na nekom podruju u odnosu na 150C na nekom drugom podruju ne znai da je na jednom mjestu bilo tri puta hladnije u odnosu na to drugo). Omjerna skala ima apsolutnu nulu (nula podrazumijeva nepostojanje svojstva). Omjeri znae i jednake odnose u mjerenom svojstvu. Na primjer: duina, teina, visina uteevine na raunu u banci. Analitiki primjer 1.3: Zaposleni u poduzeu "P" u mjestu "M" na dan 30. 09. 2006. godine statistiki su skup. Promatrani su prema sljedeim obiljejima: - dob, godine staa, spol, struna sprema, plaa u kunama, visina, teina, brano stanje, stambena situacija, broj lanova u obitelji, mjesto roenja. a) Zadatak je utvrditi kojim vrstama statistikih obiljeja pripadaju navedena obiljeja? Rjeenje 1.3: Navedena obiljeja pripadaju sljedeim vrstama: - dob: numeriko (kontinuirano) obiljeje - godine staa: numeriko (diskontinuirano) obiljeje - spol: nominalno obiljeje - struna sprema: redoslijedno obiljeje - plaa: numeriko (diskontinuirano) obiljeje

16

Uvod

- visina: numeriko (kontinuirano) obiljeje - teina: numeriko (kontinuirano) obiljeje - brano stanje: nominalno obiljeje - stambena situacija: nominalno obiljeje - broj lanova u obitelji: numeriko (diskontinuirano) obiljeje - mjesto roenja: nominalno (zemljopisno) obiljeje. Analitiki primjer 1.4: Na odabranom podruju izvrena je analiza zainteresiranosti uenika i studenata za poduke iz razliitih predmeta upitnikom u kojem su izmeu ostalih bila sljedea pitanja:
1. Iz kojih predmeta ste pohaali poduke? a) Matematika b) Fizika c) Engleski jezik d) Hrvatski jezik e) Ostalo 2. eljeli biste pohaati: a) Individualne poduke b) Grupne poduke c) Svejedno mi je 3. Spol a) ensko b) muko

a)

Zadatak je izvriti kodiranje odabranih pitanja?

Rjeenje 1.4: Tablica 1.1.


Kodna lista
OBILJEJE poduke iz eljenog predmeta(V1) OBLICI OBILJEJA Matematika Fizika Engleski jezik Hrvatski jezik Ostalo Individualne poduke Grupne poduke Nije bitno enski muki KOD A B C D E A B C 1 2

eljena vrsta poduka (V2) spol (V3)

Izvor: Simulirani podaci. 17

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U tablici 1.1. vidi se da obiljeje "poduka iz eljenog predmeta" moe poprimiti 5 oblika: Matematika, Fizika, Engleski jezik, Hrvatski jezik i ostalo. Svakom obliku obiljeja dodijeljena je ifra ili kod: A, B, C, D i E. Na taj nain pri unosu podataka umjesto da se piu itave rijei upisuje se ifra, ime se postie velika uteda vremena. Kodovi ne moraju biti slova, pa se kod obiljeja spol za "enski" unosi 1, a za "muki" 2. Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja unesenih podataka u razliitim eljenim varijantama u tablice, to opet ovisi o vrsti istraivanja i postavljenim ciljevima statistikog istraivanja. Analitiki primjer 1.5: Kodirana pitanja iz 1.4 potrebno je za 10 ispitanika unijeti u tablicu! Rjeenje 1.5: U tablici 1.2. prikazana su kodirana pitanja za 10 ispitanika: Tablica 1.2. Tablica s kodiranim podacima (ili matrica podataka)
Ispitanici 1 2 3 4 5 6 7 8 9 10 V1 A C A B A A D E B A V2 A A B C A B A C A A V3 1 2 1 1 2 1 2 1 2 2

Izvor: Simulirani podaci.

U tablici 1.2 vrste statistikih obiljeja smjetene su u stupce. U drugom stupcu tablice obiljeje V1, prema kodnoj listi u tablici 1.1., znai "poduke iz eljenog predmeta". Stupac V2 podrazumijeva "eljenu vrstu poduke", a V3 znai "spol".

18

Uvod

Ako se pogledaju podaci za 3. ispitanika u tablici 2, A u stupcu obiljeja V1 (poduke iz eljenog predmeta) znai da taj ispitanik eli poduku iz Matematike. Oznaka B u stupcu V2 (eljena vrsta poduka) istog ispitanika podrazumijeva da on preferira grupnu poduku, a njegova oznaka 1 u stupcu V3 (spol) kae nam da je taj ispitanik enskog spola.

Analitiki primjer 1.6: Na odabranom podruju izvrena je analiza stanovnitva upitnikom u kojem su izmeu ostalih bila sljedea pitanja: 1. Spol: a) Muki b) enski 2. Visina: ............................... Tablica 1.3: Kodna lista
OBILJEJE spol (V1) visina u cm (V2) OBLICI OBILJEJA Muki enski .......... KOD 1 2 ........

Izvor: Simulirani podaci.

a) Kodirana pitanja iz tablice 1.3. potrebno je unijeti u dokument programa SPSS! b) Za 20 ispitanika potrebno je u SPSS unijeti konkretne podatke o spolu i visini u cm! Rjeenje 1.6: a) U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana (slika 1.1.)

19

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.1. Variable view za definiranje varijabli u programu SPSS

Izvor: Iz programa SPSS.

Slika 1.2. Prikaz definiranih varijabli u programu SPSS

Izvor: Simulirani podaci.

Prema slici 1.2 vidi se da su varijable nazvane (Name) V1 i V2. Radi lakeg rada s podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label oznaeno je da je varijabla V1: Spol, a varijabla V2: Visina u cm. Zadnji stupac definira skalu mjerenja (Measure), gdje je za V1-Spol oznaena opisna, tj. Nominal skala, a za V2-Visinu u cm numerika, tj. Scale skala. U stupcu Values za varijablu V1-Spol uneseni su kodovi prema tablici 1.3. Klikom mia u prvo polje stupca Values otvara se prozor Value Labels, u kojem se definira konkretno kodiranje. To je za ovaj primjer prikazano na slici 1.3. Na slici 1.3 vidi se da muki spol ima kod 1, a enski spol kod 2. Potrebno je napomenuti da pri unosu objanjenja i vrijednosti treba izbjegavati slova koja ne pripadaju engleskoj abecedi jer ih SPSS nee prepoznati.

20

Uvod

Slika 1.3. Prikaz definiranih varijabli u programu SPSS

Izvor: Prema podacima autora.

b) U programu SPSS podaci se prema definiranim varijablama unose u dijelu Data view koji se bira u donjem lijevom kutu ekrana (slika 1.4). Slika 1.4. Data view za unoenje podataka u programu SPSS

Izvor: Iz programa SPSS.

Na slici 1.5 prikazani su podaci o spolu i visini u cm za 20 ispitanika (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom.

21

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.5. Prikaz podataka o varijablama V1 i V2 za 20 ispitanika u programu SPSS

Izvor: Simulirani podaci.

Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja unesenih podataka u razliitim eljenim varijantama u tablice, to opet ovisi o vrsti istraivanja i postavljenim ciljevima statistikog istraivanja. Takav nain obrade podataka olakava rad s masom statistikih podataka i omoguava veliku utedu vremena.

22

Uvod

1.7. Naini prikupljanja podataka Pojedinane metode statistikog promatranja su: a) b) c) d) e) mjerenje brojenje ocjenjivanje evidentiranje i anketiranje.

Jedan od naina statistikog promatranja i prikupljanja podataka je mjerenje. Mjeri se na primjer urod penice po jedinici poljoprivredne povrine. Moe se mjeriti teina proizvoda, kao i visina stanovnitva nekog podruja. Brojenjem se moe doi do podataka o broju zaposlenih u pojedinim organizacijskim jedinicama poduzea, o broju upisanih uenika u srednje kole. Broje se i noenja turista u turistikoj sezoni pa se na taj nain dobivaju podaci relevantni za analizu uspjenosti sezone. Ocjenjivanjem kao metodom prikupljanja statistikih podataka odreuje se kvaliteta provoenja odreenih radnji, stoga se taj postupak obino vee za redoslijedna obiljeja statistikog skupa. Ocjenjuju se i rangiraju studenti na testu iz statistike, ocjenjuje se usluga nekog hotelskog poduzea i slino. Evidentiranje podataka podrazumijeva kontinuirano praenje kretanja neke pojave u duljem ili kraem razdoblju. Za potrebe evidencije esto se ureuju odgovarajui obrasci. Na primjer, za promatranje izostanaka i broja ostvarenih radnih sati djelatnika u nekom poduzeu postoji obrazac za evidenciju gdje zaposlenici upisuju: ime i prezime, vrijeme dolaska i odlaska s radnog mjesta, vrijeme izostanka, razlog izostanka. Evidentiranje se moe vriti i tehnikim ureajima. To su umreena raunala, optiki itai, ureaji za brojenje npr. putnika i slino. Anketa i/ili intervju je metoda kojom se prikupljaju podaci uz pomo unaprijed pripremljenih upitnika na kojima ispitanici svojim
23

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

odgovorima daju informacije o promatranim obiljejima statistikog skupa. Da bi anketa uspjela, potrebno je veliku pozornost obratiti sastavljanju upitnika. Anketu sastavlja statistiar, koji se esto konzultira i sa psihologom. Upiti moraju biti kratki, precizni i jasni. Moraju biti postavljeni tako da ne sugeriraju odgovor. Broj pitanja ne smije biti velik da ne zamara one koji odgovaraju. Pri provoenju ankete pristup ispitaniku, odnosno jedinici statistikog skupa moe biti izravan i neizravan. Izravan pristup ostvaruje se kada osoba ili tim koji anketiraju izlaze na teren i u direktnom kontaktu s ispitanicima prikupljaju odgovore na pitanja iz upitnika. Neizravan pristup ostvaruje se potom, telefonom, elektronikom potom i web-om. Na taj nain smanjuju se trokovi prikupljanja podataka (npr. putni trokovi osoba koje provode anketu, tj. anketara). Iako se i neizravnim nainom ispitanicima prezentira tko istrauje i koja mu je svrha, praksa je pokazala da je tim pristupom anketiranja prisutan velik postotak neodaziva, kao i esto velik postotak nevaljano i nepotpuno popunjenih upitnika. Naravno, razloge treba traiti u injenici da ispitaniku nije na raspolaganju osoba koja e mu pojasniti nejasna pitanja. Ovisno o obimu istraivanja organizaciju prikupljanja podataka moe provoditi jedna osoba, skupina istraivaa ili osoblje specijalizirane ustanove kojoj je to osnovna djelatnost. Ako se radi o manjem istraivanju, u prikupljanju podataka e sudjelovati manji broj istraivaa, dok e vee istraivanje zahtijevati rad veeg broja istraivaa. 1.8. Priprema podataka za statistiku analizu Prije poetka obrade prikupljenih podataka potrebno je izvriti kontrolu sirove statistike grae. Kontrola se moe vriti u tijeku ili na kraju postupka prikupljanja podataka, to ovisi i o razliitim metodama prikupljanja. Preventivna kontrola obavlja se ve u tijeku samog postupka prikupljanja statistikih podataka. Kod provoenja ankete to
24

Uvod

podrazumijeva kontrolu upitnika pri njegovu preuzimanju od ispitanika. Kontrolira se jesu li dani odgovori na sva pitanja i jesu li pravilno popunjena predviena mjesta za traene odgovore. Naknadna kontrola prikupljenih podataka obavlja se nakon postupka prikupljanja. Formalnom kontrolom se usporeuje realizirani broj prikupljenih podataka s onim planiranim obuhvatom statistikog skupa. Ako je anketa vrena neizravnim putem, na primjer potom, usporeuje se broj odaslanih upitnika s brojem vraenih upitnika. Materijalnom kontrolom ispituje se potpunost i tonost sadraja prikupljenih podataka. Na primjeru ankete to podrazumijeva kontrolu potpunosti i loginosti danih odgovora. 1.9. Uzorak Uzorak je podskup osnovnoga statistikog skupa, a uzima se u svrhu ispitivanja obiljeja elemenata osnovnog skupa (ili populacije). Poeljno je da uzorak bude to vei, ali u konkretnim istraivanjima moe se dogoditi da: poveavanjem uzorka istraivanje postaje sve skuplje katkada se uzorci unitavaju (npr. kemijska analiza nekih prehrambenih artikala).

Kad god je mogue, poeljno je izabrati sluajni uzorak. U takvom uzorku svaka jedinica populacije (osnovnog skupa) ima jednaku vjerojatnost da bude izabrana. Uzorak treba biti reprezentativan, a ne selekcioniran (npr. potrebno je obuhvatiti istraivanjem i gradsko i seosko stanovnitvo, zatim u nekom medicinskom istraivanju nije cilj samo analizirati i donositi zakljuke za "dobrovoljce"). Ako neki lanovi populacije imaju veu ansu od drugih da budu izabrani, takav uzorak se naziva pristrani uzorak (biased sample). Sluajni uzorak sastavlja se prema odreenim principima, koji odgovaraju zakonu sluaja. Najbolji nain je upotreba "tablice sluajnih

25

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

brojeva" ili koritenje raunalnog sustava sluajnog izbora (generator sluajnih brojeva). Pri izradi tablice sluajnih brojeva koristi se deseterostrana prizma s brojevima od 0 do 9. Analitiki primjer 1.7: Nakon 40 bacanja deseterostrane prizme dobije se na sluajan nain 40 brojeva; skupljeni u skupine od po 4: 7766 7520 1607 6048 2771 4733 8558 8681 5204 3806 a) Zadatak je izabrati uzorak veliine 350 iz osnovnog skupa veliine 790. (Prije poetka odabira svakoj osobi iz osnovnog skupa dodjeljuje se broj od 1 do 790!). Rjeenje 1.7: a) Najprije je potrebno otvoriti tablicu sluajnih brojeva sluajno! Pretpostavka je da se tablica otvorila na stranicu na kojoj je u prvom retku prikazan niz od 40 brojeva. Kako je u osnovnom skupu ukupno 790 osoba, potrebno je itati troznamenkaste brojeve iz tablice (u redovima, u stupcima ili dijagonalno). Ako se brojevi itaju po redovima, prvi troznamenkasti broj iz prezentiranog retka, tj. prva odabrana osoba je ona oznaena brojem 776, zatim 675, pa 201 itd. Ako se naie na broj vei od 790, on se odbacuje, jer u osnovnom skupu nema vie od 790 osoba. Ako se dogodi da se neki broj ponavlja, on se opet odbacuje, jer se jedna osoba u uzorak ne moe odabrati dva puta. Uzorak moe biti i sistematski ako se jedinice iz osnovnog skupa biraju sistematski. Na primjer, ako se po redu u uzorak bira svaki 10. element iz osnovnog skupa. Stratificirani ili slojeviti uzorak je takav uzorak koji se dobije na nain da se populacija podijeli u slojeve ili stratume prema nekim

26

Uvod

karakteristikama, te da se iz svake od grupa uzme sluajni uzorak. Na primjer, u sociolokim istraivanjima stratumi se mogu birati prema dobnim skupinama. Klaster uzorci su loija varijanta sluajnog uzorka i koriste se u velikim trinim, ekonomskim ili politikim istraivanjima. Na primjer, pri ispitivanju miljenja stanovnika nekog grada o nekoj problematici, grad se moe prema planu podijeli na 50-ak blokova, odnosno kvartova. Tada se na sluaj biraju neki blokovi u kojima anketari detaljno intervjuiraju sve stanovnike. ak se vraaju na adrese dok ne dobiju intervju od svakog stanovnika u odabranim blokovima. Kvotni uzorci su jo loiji jer predstavljaju nesluajni stratificirani uzorak. Koriste se kod ad hoc organiziranih istraivanja za potrebe trita, za prikupljanje miljenja graana o nekom pitanju i slino. Istraiva unaprijed izabere broj ljudi (kvotu) svakog pojedinog stratuma koje mora intervjuirati, stoga se ti uzorci nazivaju kvotni. Prigodni uzorak je onaj koji se "nae pri ruci" jer je drugi nedostupan. Na primjer, dostupni bolesnici na odjelu u bolnici, prisutni studenti neke godine studija i slino. Pri istraivanju se mogu dogoditi pogreke koje mogu biti: a) pogreke izvan uzorka (zbog pogreno odabrane metode istraivanja, zbog pogrene obrade rezultata i slino) b) pogreke uzorka. Veliinu uzorka nije mogue openito definirati, jer to ovisi o varijabilnosti pojave koja se mjeri i o preciznosti kojom se pojava eli izmjeriti. Za uzorak je najvanije da bude reprezentativan, tj. kad god je to mogue sluajno sakupljen. Frakcija odabiranja (f) omjer je jedinica u uzorku i broja jedinica u osnovnom skupu:
f = n N

(1.1)

gdje je :
n - broj jedinica u uzorku

27

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

N - broj jedinica u osnovnom skupu.

Korak izbora je reciprona vrijednost frakcije odabiranja ( 1 f ) i upotrebljava se kod sistematskog izbora jedinica u uzorak. To znai da ako je korak izbora jednak 20, da se u uzorak iz osnovnog skupa odabire svaki 20. element. Broj svih moguih uzoraka (bez ponavljanja) veliine n iz osnovnog skupa veliine N jednak je broju kombinacija bez ponavljanja n -tog razreda:
N K = . n

(1.2)

Pomou uzorka vri se procjena odreenih parametara osnovnog skupa i testiraju se hipoteze o nepoznatim parametrima osnovnog skupa. Analitiki primjer 1.8: Na odabranom podruju izvrena je analiza studentske populacije upitnikom u kojem su izmeu ostalih bila sljedea pitanja: Anketni upitnik:
1. Spol: 2. Visina u cm: 3. Teina u kg: 4. Prosjena ocjena u srednjoj koli: 5. Koliki deparac dobivate na mjesec u kunama? 6. Financijske prilike u obitelji: 1. Nedovoljno novca za normalni standard 2. Zadovoljavamo osnovne potrebe 3. Nema materijalnih problema 4. ivimo odlino. 1. Muki 2. enski

a) Kodirana pitanja iz anketnog upitnika potrebno je unijeti u dokument programa SPSS! b) Za svakog ispitanika potrebno je u SPSS unijeti konkretne podatke o postavljenim pitanjima iz ankete!
28

Uvod

Rjeenje 1.8: a) U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana (slika 1.1.). Slika 1.6. Prikaz definiranih varijabli u programu SPSS

Izvor: Simulirani podaci.

Prema slici 1.6. vidi se da su varijable nazvane (Name) od v1 do v2. Radi lakeg rada s podacima, naznaena je vrsta podataka za sve varijable (Type) Numeric. U stupcu Label oznaeno je da je varijabla V1: Spol, a varijabla V2: Visina u cm, itd. Zadnji stupac definira skalu mjerenja (Measure). Slika 1.7. Prikaz definirane varijable v6-Financijske prilike u obitelji u programu SPSS

Izvor: Simulirani podaci.

29

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U stupcu Values za varijable v1-Spol i v6-Financijske prilike u obitelji uneseni su odgovarajui kodovi prema odgovarajuim pitanjima iz ankete. Na slici 1.7 prikazani su kodovi za varijablu v6-Financijske prilike u obitelji. Na slici 1.7 vidi se da odgovor "Nema novca za normalan standard" kod 1, odgovor "Zadovoljavamo osnovne potrebe" kod 2 itd.. b) U programu SPSS podaci prema definiranim varijablama unose se u dijelu Data view koji se bira u donjem lijevom kutu ekrana (slika 1.4). Slika 1.8. Prikaz dijela podataka o varijablama v1 - v6 za odabrane ispitanike u programu SPSS

Izvor: Simulirani podaci.

Na slici 1.8 prikazan je dio podataka o ispitanicima za varijable v1 - v6 (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovom padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom.

30

Uvod

Analitiki primjer 1.9: Prema podacima iz analitikog primjera 1.8: a) Za sve ispitanike potrebno je izraunati indeks kojim se odreuje idealna tjelesna teina u skladu s visinom ispitanika. To je Body Mass Index (BMI) - (v7) koji se rauna prema sljedeem izrazu:
BMI = tezina u kg vi sin a u m 2

b) Zadatak je za sve ispitanike od numerike varijable deparac (v6) formirati novu varijablu grupirani deparac (v8) po principu koji je prikazan u tablici 1.4. Tablica 1.4. Princip formiranja nove varijable grupirani deparac (v8)
Grupe Visina deparca 0 - 200 201 - 400 401 - 600 601 - 800 800 - 1000 1001 - 3500 Nova vrijednost 200 400 600 800 1000 3500

1 2 3 4 5 6

Izvor: Simulirani podaci.

Rjeenje 1.9: a) Da bi se pomou postojeih numerikih varijabli izraunala nova numerika varijabla, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku Compute. Na ekranu se pojavi prozor Compute Variable koji je prikazan na slici 1.9.

31

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.9. Prozor Compute Variable u kojem se kreira nova numerika varijabla v7

Izvor: Simulirani podaci.

Prema slici 1.9 vidi se da je u polje Target Variable potrebno unijeti ime nove varijable BMI -v7, dok se u Numeric Expression unosi izraz po kojem se iz postojeih varijabli kreira nova varijabla. Pritom treba voditi rauna o tome da su postojei podaci o visini ispitanika izraeni u cm te da bi se dobila visina izraena u metrima, potrebno je centimetre podijeliti sa 100. To se moe vidjeti na slici 1.9 pod Numeric Expression. Nakon to se klikne ikona OK, nova varijabla v7 automatski se formira u dodatnom stupcu u Data View programa SPSS. Nova varijabla se moe vidjeti na slici 1.10. U Variable View potrebno je na odgovarajui nain definirati tu novu varijablu te u stupcu Label naznaiti da se radi o Body Mass Index. Ta nova varijabla je numerika i ima skalu mjerenja Scale.

32

Uvod

Slika 1.10. Data view s novom varijablom v7

Izvor: Simulirani podaci.

b) Da bi se pomou varijable v6 - deparac formirala nova varijabla grupirani deparac po principu koji je prikazan u tablici 1.4, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovom izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v6 - "Koliki deparac dobivate", a u Outut Variable, Name je v8, a Label Grupirani deparac. Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range upisuju se odgovarajue grupe visine deparca, kako je zadano u tablici 1.4. Nakon upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View kreirat e se nova varijabla Grupirani deparac, odnosno v8. Na slici 1.11. prikazani su prozori Recode into Different Variables i Old and New Values.

33

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.11. Prozori Recode into Different Variables pomou kojih se kreira nova varijabla v8 - Grupirani deparac

Izvor: Simulirani podaci.

34

Ureivanje i prikazivanje podataka

2. UREIVANJE I PRIKAZIVANJE PODATAKA


2.1. Grupiranje podataka Ako se urede prikupljeni statistiki podaci prema nekom obiljeju ili karakteristici, dobiva se statistiki niz. Grupiranje statistikih podataka je postupak diobe statistikog skupa na odreeni broj podskupova prema prethodno utvrenim modalitetima promatranog obiljeja i uz potivanje principa iskljuivosti i iscrpnosti. Princip iskljuivosti podrazumijeva da svaki element osnovnog skupa istovremeno moe pripadati samo jednoj grupi, tj. podskupu. Princip iscrpnosti podrazumijeva da postupkom grupiranja trebaju biti obuhvaeni svi elementi osnovnog skupa. Statistika obiljeja, odnosno ope karakteristike elemenata statistikog skupa openito se oznaavaju: sa Xi, i = 1, 2, , N. (2.1) Prema tome postoji N modaliteta, tj. pojavnih oblika promatranih obiljeja. Broj elemenata statistikog skupa koji pripadaju odreenoj grupi, tj. jednom modalitetu ili pojavnom obliku promatranog obiljeja, naziva se apsolutna frekvencija. Oznaka za apsolutnu frekvenciju je fi, i = 1, 2, ,N. (2.2) Zbroj svih elemenata statistikog skupa naziva se opseg statistikog skupa. Zbog principa iskljuivosti i iscrpnosti taj broj

35

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

odgovara i zbroju svih apsolutnih frekvencija kako je prikazano izrazom (2.3).1


f1 + f 2 + f 3 + . .. + f N = f i
i =1 N

(2.3)

Moe se definirati da je skup ureenih parova modaliteta promatranog obiljeja i njima pripadajuih apsolutnih frekvencija statistiki niz. 2.1.1. Nizovi kvalitativnih podataka Kvalitativni statistiki nizovi su nominalni (atributivni i zemljopisni) i redoslijedni.

U izrazu (2.3) dan je znak zbrajanja f i koji se ita: zbroj apsolutnih frekvencija f i ,
i =1

gdje i ide od 1 do N. Neke od karakteristika znaka zbrajanja su sljedee: 1. 2. 3.


i =1 N i =1 N

X i = X 1 + X 2 + . . . + X N , gdje je i = indeks zbrajanja; ( X i Yi Z i . . .) = X i Yi Z i . . . ;


i =1 i =1 N N N i =1 N

i =1

X i Yi = X 1Y1 + X 2 Y2 + . . . + X N Y N X i Yi (ovdje se za desni dio


i =1 i =1

nejednakosti, primjenom izraza 1., moe zakljuiti da suma produkta nije jednaka produktu suma); 4.
Xi X X X = 1 + 2 + ... + N Y1 Y2 YN i =1 Yi
N i =1 N

Xi

(ovdje se moe zakljuiti da je suma

i =1 N

Yi
N

kvocijenta razliita od kvocijenta suma); 5.


i =1 N

aX i = aX 1 + aX 2 + . . . + aX N = a( X 1 + X 2 + . . . + X N ) = a X i , gdje je "a"
i =1 N N N

konstanta, jer ne ovisi o indeksu zbrajanja i; 6.


i =1

(aX i bYi cZ i . . . ) = a X i b Yi c Z i . . . , gdje su a, b, c,


i =1 i =1 i =1

konstante. 36

Ureivanje i prikazivanje podataka

Nominalni statistiki nizovi formiraju se grupiranjem elemenata osnovnog skupa prema modalitetima odgovarajueg nominalnog obiljeja. Modaliteti nominalnog obiljeja izraavaju se pomou atributa, kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, prema veliini apsolutnih frekvencija, te dogovorno ili zakonski utvrenim popisima. Na primjer, slubena statistika koristi: SMTK ili Standardnu meunarodnu trgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju djelatnosti. Zemljopisni statistiki nizovi formiraju se grupiranjem elemenata osnovnog skupa prema modalitetima odgovarajuega zemljopisnog ili prostornog obiljeja. Modaliteti prostornog obiljeja najee odgovaraju teritorijalnoadministrativnoj podjeli odreenog geografskog prostora, kao na primjer: gradovi, upanije, regije, drave, kontinenti. Grupe toga obiljeja mogu biti poredane po abecednom redu, po veliinama apsolutnih frekvencija ili po geografskom poloaju. Ako se zbog vee preglednosti nekoliko modaliteta stavi zajedno u grupu "ostalo", ona obino dolazi na kraju statistikog niza. Redoslijedni statistiki nizovi formiraju se grupiranjem elemenata osnovnog skupa prema modalitetima odgovarajueg redoslijednog obiljeja. Grupiranje podataka statistikog skupa prema redoslijednom obiljeju vri se slino kao kod nominalnih obiljeja, ali je redoslijed grupa ovdje odreen rangom koji pojedina grupa obiljeja predstavlja. Rangiranje se moe vriti polazei od najnieg ranga prema najviem ili obrnuto. 2.1.2. Numeriki niz Grupiranjem elemenata statistikog skupa prema numerikom ili kvantitativnom obiljeju nastaje numeriki statistiki niz.
37

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Grupiranje i ureivanje elemenata numerikog statistikog skupa ovisi o broju podataka i o njihovoj vrsti, odnosno o tome radi li se o neprekidnim (kontinuiranim) ili prekidnim (diskontinuiranim) numerikim statistikim obiljejima. Ako numeriko obiljeje moe poprimiti samo mali broj numerikih vrijednosti, tada ta svaka vrijednost moe biti posebna grupa u nizu. To je najee sluaj kod prekidnog ili diskontinuiranog numerikog obiljeja. Ureen negrupiran prekidni numeriki statistiki niz ima karakteristiku da su njegove vrijednosti sloene po veliini poevi, najee, od najmanje:
X 1 , X 2 , ..., X N ; X i 1 < X i , i = 2,3, ..., N .

(2.4)

Openito je pojedini oblik (modalitet) obiljeja: X i , i = 1,2, ..., k , a pripadajua apsolutna frekvencija: f i , i = 1,2, ..., k . Skup ureenih parova:
( X i , f i ), i = 1,2,3, ..., k

(2.5)

je distribucija frekvencija promatranog prekidnog numerikog obiljeja. Takoer vrijedi da je suma svih apsolutnih frekvencija jednaka opsegu statistikog odnosno osnovnog skupa:
i =1

fi = N .

(2.6)

Za vrijednosti koje se pojavljuju manje puta formiraju se zajednike grupe ili "razredi". U razredima se nalaze elementi skupa s vrijednostima obiljeja koje se nalaze izmeu donje i gornje granice razreda. Na taj se nain formiranjem razreda postie vea preglednost, ali se gubi na preciznosti i potpunosti informacija. U sluaju diskontinuiranog numerikog obiljeja donja granica sljedeeg (i+1) razreda razlikuje se od gornje granice prethodnog (i) razreda za jedinicu mjere promatranog obiljeja.

38

Ureivanje i prikazivanje podataka

Te originalne granice razreda nazivaju se jo i nominalne granice. Prije provoenja statistike analize potrebno je nominalne granice zamijeniti preciznim ili pravim granicama, to ovisi o nainu mjerenja promatranog svojstva. To se najee radi na nain da se donja granica sljedeeg (i+1) nominalnog razreda umanji, a gornja granica prethodnog (i) nominalnog razreda uvea za polovicu razlike izmeu tih granica. Ponekad se precizne granice formiraju jednostavno na nain da se sve gornje granice uveaju za 1 jedinicu obiljeja i tako izjednae sa svojom sljedeom donjom granicom ili da se sve donje granice umanje za 1 jedinicu obiljeja i tako izjednae sa svojom prethodnom gornjom granicom. Kontinuirano ili neprekidno statistiko obiljeje moe poprimiti vrijednosti iz nekog intervala, pa se njegovi modaliteti formiraju kao razredi. Skup ureenih parova razreda obiljeja i njima pripadajuih frekvencija2
( DGi X i < GGi , f i ), i = 1,2,3, ..., k

(2.7)

je distribucija frekvencija promatranog neprekidnog numerikog obiljeja. U sluaju kontinuiranog numerikog obiljeja donja granica sljedeeg (i+1) razreda jednaka je gornjoj granici prethodnog (i) razreda, pa ovdje nije potrebno raunati precizne ili prave granice. Ako nije definirana najmanja vrijednost obiljeja za neki skup, donja granica poetnog razreda pri grupiranju se moe ostaviti otvorena. Isto tako ako nije definirana najvea vrijednost obiljeja za neki skup, gornja granica posljednjeg razreda moe se ostaviti otvorena. Meutim prije poetka same statistike analize, te je otvorene granice potrebno zatvoriti takozvanim procijenjenim granicama, koje se stavljaju u zagrade, jer njima istraiva procjenjuje da nijedan element skupa nema vrijednost manju od prve donje ili veu od zadnje gornje procijenjene granice. Veliina razreda (i) razlika je izmeu gornje i donje granice razreda (kada je rije o diskontinuiranom numerikom obiljeju radi se s preciznim ili pravim granicama).
2

gdje je DGi donja granica i-tog razreda, a GGi gornja granica i-tog razreda. 39

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

i = GGi DGi , i = 1,2, ..., k .

(2.8.)

Sredina razreda (sredXi) je prosjek (odnosno jednostavna aritmetika sredina) izmeu donje i gornje (prave ili precizne) granice razreda:
sredX i = DGi + GGi , i = 1,2, ..., k . 2

(2.9)

Ako vrijednosti promatranog numerikog niza nisu ravnomjerno rasporeene, veliine koje se izraunavaju pomou sredine razreda sadre tzv. greku grupiranja. 2.2. Tabeliranje Tabeliranje je postupak svrstavanja grupiranih prikupljenih statistikih podataka u tablice. Statistike tablice kao jedan od oblika prikazivanja statistikih podataka prisutne su u literaturi svuda oko nas. Tablica nastaje crtanjem okomitih i vodoravnih linija prema odreenim pravilima. Svaka statistika tablica mora imati: naslov, broj tablice (ako ih ima vie), tekstualni dio, numeriki ili brojani dio i izvor podataka te po potrebi napomenu. Tablica 2.1.
Naslov tablice
Zaglavlje Oznake stupca 0 Pred- Oznake sturetka pac Zbirni redak:
i =1

Zbirni stupac:
n j =1

1 stupac

2 redak

polje polje

Izvor podataka: 40

Ureivanje i prikazivanje podataka

Tablica 2.1. prikazuje opi oblik statistike tablice. Naslov tablice mora biti jasan i kratak, a istovremeno u sebi mora sadravati pojmovnu, prostornu i vremensku definiciju statistikog skupa da bi onaj tko je ita mogao precizno odrediti njezine elemente. Tekstualni dio statistike tablice sastoji se od dva dijela: zaglavlja i predstupca. U zaglavlju ili tumau stupaca opisuje se i objanjava sadraj stupaca. U predstupcu ili tumau redaka opisuje se i objanjava sadraj redaka. To su najee oblici statistikog obiljeja po kojemu je promatran statistiki niz. Uz tekstualni dio svaki stupac moe biti oznaen i odgovarajuim brojem. Kako se vidi u tablici 2.1, predstupac se esto oznaava nulom, a numeriranje dalje ide po redu: 1, 2, , n. Brojani ili numeriki dio tablice sastoji se od polja u koja se unose frekvencije, odnosno rezultati grupiranja statistikih podataka. Zbirni ili marginalni stupac sadri zbrojeve pojedinih redaka. Njegova suma zbraja elemente svakog retka po j - stupcima. Zbirni ili
j =1 n

marginalni redak sadri zbrojeve pojedinih stupaca. Njegova suma


i =1

zbraja elemente svakog stupca po i- redcima.

Izvor podataka se navodi ispod tablice. On omoguuje provjeru ispravnosti prikupljenih podataka u tablici, kao i eventualnu dopunu podataka, ako to zahtijeva statistiko istraivanje (posebno ako su podaci u tablici preuzeti iz sekundarnih izvora). Zbog vee preglednosti tablice, esto se zaglavlje, predstupac, zbirni redak i zbirni stupac odvajaju debljim crtama od brojanog dijela kao to se moe vidjeti u tablici 2.1. Dakle, statistika tablica mora potivati 3 naela: preglednost, potpunost i jasnou. Statistike tablice mogu se podijeliti: na 1) ope ili izvjetajne statistike tablice i na 2) analitike ili sumarne statistike tablice.

41

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Ope statistike tablice prikazuju jako velik broj statistikih podataka o nekome promatranom statistikom skupu. Analitike statistike tablice se konstruiraju za neku posebnu analizu i one su u pravilu preglednije. U ovisnosti o tome prikazuju li se prikupljeni statistiki podaci u tablici prema jednom ili vie statistikih obiljeja i prikazuje li se jedan ili vie statistikih nizova razlikuju se: 1) jednostavne statistike tablice i 2) sloene statistike tablice, koje se mogu podijeliti: na skupne statistike tablice i na kombinirane statistike tablice. Jednostavne statistike tablice prikazuju jedan statistiki skup grupiran u jedan statistiki niz, tj. grupiran prema jednom obiljeju. Skupne statistike tablice prikazuju dva ili vie statistika skupa grupirana u dva ili vie statistika niza prema jednom obiljeju. Tablica 2.2. Naslov tablice: Dvostruka (sloena) statistika tablica
Zaglavlje Oznake stupca Predstupac 0 Oznake retka 1 x11 x21 xm1 Zbirni redak:
i =1 Izvor podataka: m

Zbirni stupac:
n j =1

2 x12 x22 xm2


m

n x1n x2n

j =1 n

x1 j

j =1

x2 j
n

xmn
m

j =1 m

xmj

i =1

xi1

i =1

xi 2

i =1

xin

i =1 j =1

xij

m m

42

Ureivanje i prikazivanje podataka

Kombinirane statistike tablice (tablice kontigence) prikazuju jedan statistiki skup grupiran u dva ili vie statistikih nizova prema dva ili vie obiljeja. Ako kod kombinirane tablice s dva obiljeja jedno obiljeje ulazi u tablicu iz predstupca, a drugo iz zaglavlja, kae se da je to tablica s dva ulaza. U skladu s tim postoje kombinirane tablice s vie ulaza, ali pri njihovu kreiranju gubi se jasnoa i preglednost. Tablica 2.2 prikazuje jednu opu dvostruku statistiku tablicu s odgovarajuim sumama u zbirnom retku i zbirnom stupcu. Jednadba (2.10) pokazuje da je zbroj zbirnog retka jednak zbroju zbirnog stupca, odnosno ako kod dvostruke sume one zamijene svoja mjesta, nita se nee promijeniti:
i =1 j =1

x ij = x ij .
j =1i =1

m n

n m

(2.10)

2.3. Relativni brojevi strukture Relativni brojevi su "neimenovani", stoga se pomou njih mogu usporeivati i analizirati pojave koje imaju razliitu jedinicu mjere ili razliit broj elemenata. Na taj nain dobije se relativna vanost dijela ili cjeline statistikog niza. Relativni brojevi nastaju dijeljenjem dviju veliina. Veliina s kojom se dijeli zove se osnova relativnog broja i po njoj se relativni brojevi meusobno razlikuju. Relativni brojevi strukture pokazuju odnos dijela prema cjelini, i njima se olakava analiza rasporeda podataka prema modalitetima obiljeja u jednom statistikom nizu, odnosno njihova struktura. Najee se izraavaju u postocima, a mogu i u promilima. Ako relativni brojevi strukture (Pi) pokazuju odnos apsolutnih frekvencija prema opsegu statistikog skupa (tj. ukupnom broju elemenata statistikog skupa), zovu se relativne frekvencije (fri).

43

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pi =

f dio ; fri = n i cjelina fi


i =1

(2.11)

Pi =

f dio 100 (u %); fri = n i 100 (u %) cjelina fi


i =1

(2.12)

Pi =

f dio 1000 (u ); fri = n i 1000 (u ) cjelina fi


i =1

(2.13)

Zbroj svih relativnih brojeva u jednom statistikom nizu je 1 ili 100, ili 1000, u ovisnosti o tome kako je relativni broj izraen. Relativni brojevi strukture se grafiki mogu prikazivati pomou strukturnih stupaca, strukturnih krugova, polukrugova ili nekim drugim geometrijskim likom. Pri tom se za usporedbu dvaju ili vie statistikih nizova konstruiraju geometrijski likovi jednakih povrina, jer je zbroj relativnih frekvencija uvijek isti. Analitiki primjer 2.1. Statistiki nizovi "prosjean broj nezaposlenih osoba u RH, 1995. i 2002. godine" prema redoslijednom obiljeju "struna sprema", prikazani su u tablici 2.2. a) Zadatak je izraunati strukturu nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu. b) Zadatak je strukturu nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu prikazati na grafikonu pomou strukturnih stupaca uz sve potrebne oznake. Rjeenje 2.1. a) U tablici 2.3. u posljednja 2 stupca prikazana je struktura nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu. Na primjer: fr11 =
f 11
i =1

f 1i

100 =

51367 100 = 20,62% , 249070

44

Ureivanje i prikazivanje podataka

to znai da je 1995. godine udio niskokvalificiranih radnika (NKV) u ukupnom broju nezaposlenih bio 20,62%. Tablica 2.3. Prosjean broj nezaposlenih osoba u RH prema strunoj spremi, 1995. i 2003. godine
Prosjean broj Struktura u % nezaposlenih osoba Struna sprema 1995. god. 2003. god. 1995. god. 2002. god. f1i f2i fr1i fr2i NKV 51367 58939 20,62352 18,4945 PKV;NSS 36453 56957 14,63564 17,87256 KV,VKV 87172 105728 34,999 33,17644 SSS 57276 76087 22,99594 23,87537 VS 7346 9891 2,949372 3,103701 VSS 9456 11082 3,796523 3,477426 Ukupno: 249070 318684 100 100 Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 177.

b) Na slici 2.1. prikazana je struktura nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu. Slika 2.1.
Prosjean broj nezaposlenih u RH prema strunoj spremi
100%

80% V SS struktura u % 60% V S SSS KV ,V KV PKV ;NSS NKV

40%

20%

0% 1995. god. 2002. god.

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 177.

45

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

2.4. Grafiko prikazivanje statistikih nizova Uz statistike tablice pomono sredstvo u analizi statistikih nizova su grafiki prikazi. Grafikonima se na jednostavan i pregledan nain uz pomo razliitih geometrijskih likova prezentiraju osnovne karakteristike statistikih nizova. Grafiki prikazi statistikih podataka su pregledniji i razumljiviji u odnosu na njihovo prikazivanje statistikom tablicom. Grafikoni omoguuju jednostavnije uoavanje glavnih karakteristika promatranih pojava, ali vrlo esto ta preglednost ide na tetu preciznosti statistikih informacija. Stoga je poeljno uz grafiki prikaz prezentirati i tablicu s originalnim vrijednostima statistikog niza. Suvremeni statistiki programski paketi, a izmeu njih i SPSS, naravno u skladu sa statistikom teorijom, imaju mnotvo mogunosti kreiranja grafikih prikaza. Pomou njih se mogu odabrati razliite boje, oblici i linije na grafikonu, to omoguuje jo zorniji prikaz promatrane pojave. Oznake na grafikonu moraju biti takve da onaj tko ita grafikon moe jasno raspoznati koji su elementi i koja je pojava prikazana. Stoga i grafikon mora imati naslov, jedinice mjere promatranog obiljeja, oznake modaliteta obiljeja, izvor podataka i po potrebi kazalo ili tuma oznaka. Postoje tri skupine grafikih prikaza: 1) povrinski grafikoni 2) linijski grafikoni i 3) kartogrami. Analitiki primjer 2.2. Statistiki skup "Zaposleni u pravnim osobama u RH, stanje 31. oujka 2004. god.", prema redoslijednom obiljeju "stupanj strunog obrazovanja" prikazan je u tablici 2.3. a) Zadatak je zaposlene u pravnim osobama u RH prema stupnju strunog obrazovanja za 2004. godinu prikazati na grafikonu pomou jednostavnih stupaca uz sve potrebne oznake.
46

Ureivanje i prikazivanje podataka

Tablica 2.4. Zaposleni u pravnim osobama u RH prema stupnju strunog obrazovanja, stanje 31. oujka 2004. god.
Stupanj strunog Broj obrazovanja zaposlenih NKV 97516 PKV 35948 KV 146161 VKV 30626 nie 36510 srednje 453710 vie 82283 visoko 163417 Ukupno: 1046171 Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 136.-137.

Rjeenje 2.2. a) Na slici 2.2 prikazani su zaposleni u pravnim osobama u RH prema stupnju strunog obrazovanja za 2004. godinu. Slika 2.2.
Zaposleni u pravnim osobama u RH pre ma stupnju strunog obra zovanja, stanje 31.03.2004.
500000 400000 300000 200000 100000 0 NKV PKV KV V KV nie srednje vie visoko Stupanj s trunog obrazovanja

Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 136.-137.

Na slici 2.2 jasno se vidi da je u Republici Hrvatskoj u pravnim osobama, na dan 31. 03. 2004., najvie bilo zaposlenih sa srednjim

Broj zaposlenih

47

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

stupnjem obrazovanja, dok je onih u kategoriji VKV, odnosno visokokvalificiranih radnika bilo najmanje. Analitiki primjer 2.3. Statistiki skup, "Stanovnitvo Republike Hrvatske, popis 2001. godine" prema obiljejima "spol i aktivnost" podijeljen je na grupe i zadan je u tablici 2.5. a) Zadatak je napraviti strukturne krugove za stanovnitvo mukog i enskog spola prema obiljeju "aktivnost". Tablica 2.5. Mukarci i ene u RH prema aktivnosti, popis 2001. godine
Stanovnitvo (u 000) Mukarci ene f2i f1i Stupnjevi struktur. kruga Mukarci ene 0 S 1i S02i

Aktivnost Aktivno stanovnitvo 1005,4 819,8 178,3854 132,9885 Osobe ss osobnim prihodima 490,6 639 87,04584 103,659 Uzdravano stanovnitvo 533 760,4 94,56875 123,3526 Ukupno 2029 2219,2 360 360 Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 100.

Rjeenje 2.3. a) U tablici 2.5 uz originalne apsolutne frekvencije dani su i stupnjevi strukturnoga kruga. Stupnjevi strukturnoga kruga raunaju se na sljedei nain:
S 0i = fi
i =1

fi

360 0 .

(2.14)

Na slici 2.3 pomou strukturnih krugova prikazani su mukarci i ene u Republici Hrvatskoj prema aktivnosti (popis 2001.). U stupcu tablice 2.5. za muki spol:

48

Ureivanje i prikazivanje podataka

S 0 11 =

f 11
i =1

f 1i

360 0 =

1005,4 360 0 = 178,385 0 , 2029

to odgovara odreenom dijelu 1. strukturnoga kruga na lici 2.3. U stupcu tablice 2.5. za enski spol:
S 0 22 = f 22
i =1

f 2i

360 0 =

639 360 0 = 103,659 0 , 2219,2

to odgovara odreenom dijelu 2. strukturnoga kruga na slici 2.3. Slika 2.3. Mukarci i ene u Republici Hrvatskoj prema aktivnosti (popis 2001.)

Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 100.

Iz slike 2.3. jasno se vidi da je kod mukaraca bilo najvie aktivnog stanovnitva, dok je kod ena aktivno stanovnitvo samo malo vee od uzdravanog stanovnitva. Analitiki primjer 2.4. Zadan je statistiki skup, "Zasijane povrine u oranicama" prema prostornom obiljeju "upanije u RH". a) Zadatak je zadani skup prikazati pomou statistike karte.

49

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 2.4. a) Statistiki skup, "Zasijane povrine u oranicama" prema prostornom obiljeju "upanije u RH" prikazan je na slici 2.4. Slika 2.4. Udio zasijanih povrina u oranicama po upanijama u RH, 2002. god.

Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 673.

Na slici 2.4 vidi se udio zasijanih povrina u oranicama u Republici Hrvatskoj prikazan po upanijama. Na zemljovidu su sjenanjem prikazani intenziteti vrijednosti pojave po modalitetima obiljeja, tj. po upanijama. Tako su one upanije s manjim udjelom zasijane povrine u oranicama slabije osjenane, dok su one s veim udjelom zasijane povrine jae osjenane.

50

Ureivanje i prikazivanje podataka

Analitiki primjer 2.5. Zadani su podaci o spolu i deparcu uzorka studentske populacije na jednom sveuilitu. a) Zadatak je formirati i komentirati apsolutne frekvencije varijabli: - spol, - "grupirani" deparac. Rjeenje 2.5. a) U programskom paketu SPSS apsolutne frekvencije se mogu formirati na 2 naina. I. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Tables. Dalje se bira Tables of Frequencies. Najprije se varijabla v1 - Spol prebaci u polje Frequencies for:. Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema obiljeju, odnosno varijabli spol. Rezultat je prikazan u tablici 2.6. Tablica 2.6. Ispitanici prema spolu
Spol Count Musko Zensko 94 144

Izvor: Simulirani podaci.

Prva frekvencija u tablici 2.6. znai da je meu ispitanicima bilo 94 studenta. Druga frekvencija u tablici 2.6. znai da je meu ispitanicima bilo 144 studentice. II. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. U ovom sluaju se mogu obje varijable v1 - Spol i v2 -

51

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Grupirani deparac prebaciti u polje Variable(s). Konani izgled prozora Frequencies s odabranim varijablama prikazan je na slici 2.5. Slika 2.5. Prozor "Frequencies" iz izbornika "Descriptive Statistics" s odabranim varijablama v1 i v2

Izvor: Simulirani podaci.

Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranim obiljejima, odnosno varijablama. Rezultat je prikazan u tablicama 2.7 i 2.8. Tablica 2.7. Ispitanici prema obiljeju: Spol
Valid Musko Zensko Total Missing Total System Frequency 94 144 238 1 239 Percent 39,3 60,3 99,6 ,4 100,0 Valid Percent 39,5 60,5 100,0 Cumulative Percent 39,5 100,0

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.7. znai da je meu ispitanicima bilo 94 studenta. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 144 studentice. Na postavljeno pitanje je
52

Ureivanje i prikazivanje podataka

odgovorilo 238 ispitanika, dok frekvencija 1 iz retka Missing System znai da 1 ispitanik nije dao odgovor na pitanje o njegovom spolu. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje originalne valjane frekvencije u postotcima. Prvi podatak iz tog stupca pokazuje da je meu onima koji su odgovorili na pitanje o spolu bilo 39,5% mukog spola, a 60,5 enskog spola. Tablica 2.8. Ispitanici prema obiljeju: Grupirani dzeparac
Frequency 73 52 30 6 7 5 173 66 239 Percent 30,5 21,8 12,6 2,5 2,9 2,1 72,4 27,6 100,0 Valid Percent 42,2 30,1 17,3 3,5 4,0 2,9 100,0 Cumulative Percent 42,2 72,3 89,6 93,1 97,1 100,0

Valid

200,00 400,00 600,00 800,00 1000,00 3500,00 Total

Missing Total

System

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.8 znai da je meu ispitanicima bilo 73 studenta s deparcem od 200 kn ili manje. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 52 studenta s deparcem izmeu 201 kn i 400 kn itd. Na postavljeno pitanje je odgovorilo 173 ispitanika, dok frekvencija 66 iz retka Missing System znai da 66 ispitanika nije dalo odgovor na pitanje o njihovu deparcu. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje originalne valjane frekvencije u postocima. Prvi podatak iz tog stupca pokazuje da je meu onima koji su odgovorili na pitanje o deparcu bilo 42,2% studenata s deparcem od 200 kn ili manje itd. Ovaj II nain prikaza frekvencija u programu SPSS je detaljniji, jer osim apsolutnih prikazuje i relativne frekvencije.

53

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 2.6. Zadatak je za sve ispitanike od varijable "Prosjena ocjena u srednjoj koli" (v1) formirati novu varijablu "Grupirana ocjena u srednjoj koli" (v2) po principu koji je prikazan u tablici 2.9. Tablica 2.9. Princip formiranja nove varijable grupirana ocjena u srednjoj koli (v2)
Grupe

1 2 3 4

Prosj. ocjena u sred. koli 2,00-2,49 2,50-3,49 3,50-4,49 4,50-5,00

Nova vrijednost 2 3 4 5

Izvor: Simulirani podaci.

Rjeenje 2.6: Da bi se pomou varijable v1 - "Prosjena ocjena u srednjoj koli" formirala nova varijabla v2 - "Grupirana ocjena u srednjoj koli" po principu koji je prikazan u tablici 2.8, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v1 - "Prosjena ocjena u srednjoj koli", a u Outut Variable, Name je v2, a Label "Grupirana ocjena u srednjoj koli". Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range upisuju se odgovarajue grupe ocjena, kako je zadano u tablici 2.8. Nakon upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View, kreirat e se nova varijabla "Grupirana ocjena u srednjoj koli", odnosno v2. (Princip je slian kao u analitikom primjeru 1.9.)

54

Ureivanje i prikazivanje podataka

Na slici 2.6 prikazan je prozor Recode into Different Variables: Old and New Values. Slika 2.6. Prozor "Recode into Different Variables: Old and New Values", pomou kojih se kreira nova varijabla v2 - Grupirana ocjena u srednjoj koli

Izvor: Simulirani podaci.

Analitiki primjer 2.7. Zadatak je komentirati apsolutne i relativne frekvencije varijable: Grupirana ocjena u srednjoj koli (v2). Rjeenje 2.7: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v2 - Grupirana ocjena u srednjoj koli. Konani izgled prozora Frequencies s odabranom varijablom prikazan je na slici 2.7.

55

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.7. Prozor "Frequencies" iz izbornika "Descriptive Statistics" s odabranom varijablom v2

Izvor: Simulirani podaci.

Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 2.10. Tablica 2.10. Ispitanici prema: Grupirana ocjena u srednjoj skoli
Valid 2,00 3,00 4,00 5,00 Total Missing Total System Frequency 1 34 113 90 238 1 239 Percent ,4 14,2 47,3 37,7 99,6 ,4 100,0 Valid Percent ,4 14,3 47,5 37,8 100,0 Cumulative Percent ,4 14,7 62,2 100,0

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.10 znai da je meu ispitanicima bio 1 student s ocjenom 2 u srednjoj koli. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 34 studenta s

56

Ureivanje i prikazivanje podataka

ocjenom 3, ... itd. Na postavljeno pitanje je odgovorilo 238 ispitanika, dok frekvencija 1 iz retka Missing System znai da 1 ispitanik nije dao odgovor na pitanje o ocjeni u srednjoj koli. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje originalne valjane frekvencije u postotcima. Trei podatak iz tog stupca pokazuje da je 47,5% studenata imalo prosjenu ocjenu u srednjoj koli 4.

Analitiki primjer 2.8. Zadatak je izmeu svih ispitanika odabrati samo one koji su enskog spola. Rjeenje 2.8: U glavnom izborniku bira se Data, a na njegovu padajuem izborniku Select Cases, gdje je potrebno aktivirati opciju If condition is satisfied kako je prikazano na slici 2.8. Slika 2.8. Prozor "Select Cases" s aktiviranom opcijom "If condition is satisfied"

Izvor: Simulirani podaci. 57

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Klikom na ikonu If... otvara se novi prozor Select cases: If, kako je prikazano na slici 2.9. Slika 2.9. Prozor "Select Cases: If" s naznaenim uvjetom v1=2

Izvor: Simulirani podaci.

Strelicom se varijabla v1 prebaci u odgovarajue polje i izjednai s 2, jer je uvjet da se biraju samo oni ispitanici enskog spola, a enski spol je pri kodiranju oznaen s 2. Klikom na Continue i OK, u dodatnom stupcu Data View javlja se nova varijabla filter_$, gdje su s 1 oznaena polja ispitanika enskog spola, a s 0 polja ispitanika mukog spola. Naravno, dok je filter aktivan program SPSS u svim svojim analizama uvaava samo polja oznaena u filteru s 1, odnosno ispitanike enskog spola. Stupac filter_$ moe se vidjeti na slici 2.10. Slika 2.10. "Data View" sa stupcem "filter_$"

Izvor: Simulirani podaci. 58

Ureivanje i prikazivanje podataka

Analitiki primjer 2.9. Zadatak je komentirati apsolutne i relativne frekvencije varijable: Grupirana ocjena u srednjoj koli (v2) samo za enski spol. Rjeenje 2.9: Nakon to je izvrena selekcija ispitanika enskog spola (kako je objanjeno u 2.8), potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v2 - Grupirana ocjena u srednjoj koli. Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 2.11 gdje su dani rezultati samo za enski spol. Tablica 2.11. Ispitanici prema: Grupirana ocjena u srednjoj skoli (enski spol)
Valid 3,00 4,00 5,00 Total Frequency 20 59 65 144 Percent 13,9 41,0 45,1 100,0 Valid Percent 13,9 41,0 45,1 100,0 Cumulative Percent 13,9 54,9 100,0

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.11 znai da je meu ispitanicima enskog spola bilo 20 njih s ocjenom 3 u srednjoj koli. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 59 studentica s ocjenom 4, a njih 65 s ocjenom 5. U analizi je ukupno bilo 144 ispitanika enskog spola. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke. Kako se vidi iz tablice, njegove vrijednosti odgovaraju onima iz stupca Valid Percent. Trea proporcija ili relativna frekvencija pokazuje da su 45,1% studentica u odnosu na sve 144 studentice imala prosjenu ocjenu u srednjoj koli 5.

59

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 2.10. Zadatak je iz postojee baze podataka svih ispitanika odabrati sluajni uzorak od 60% ispitanika. Rjeenje 2.10: U glavnom izborniku bira se Data, a na njegovu padajuem izborniku Select Cases, gdje je potrebno aktivirati opciju Random sample of cases kako je prikazano na slici 2.11. Slika 2.11. Prozor "Select Cases" s aktiviranom opcijom "Random sample of cases"

Izvor: Simulirani podaci.

Klikom na ikonu Sample... otvara se novi prozor Select Cases: Random Sample, kako je prikazano na slici 2.12. U tom prozoru potrebno je aktivirati Approximately i naznaiti 60% of all cases. Klikom na Continue i OK, u dodatnom stupcu Data View javlja se nova varijabla filter_$, gdje su s 1 oznaena polja sluajno odabranih 60% ispitanika, a sa 0 polja 40% ispitanika koji nee biti ukljueni u daljnju analizu. Naravno, dok je filter aktivan program SPSS u svim svojim analizama uvaava samo polja oznaena u filteru s 1.

60

Ureivanje i prikazivanje podataka

Slika 2.12. Prozor "Select Cases: If" s naznaenim uvjetom v1=2

Izvor: Simulirani podaci.

Analitiki primjer 2.11. Zadatak je komentirati apsolutne i relativne frekvencije varijable : Grupirana ocjena u srednjoj koli (v2) za 60% sluajno odabranih ispitanika. Rjeenje 2.11: Nakon to je izvrena sluajna selekcija 60% ispitanika (kako je objanjeno u 2.10), potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v2 - Grupirana ocjena u srednjoj koli. Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 2.10, gdje su dani rezultati samo za 60% sluajno odabranih ispitanika. Prva frekvencija u stupcu Frequency u tablici 2.12 znai da je izmeu 60% sluajno odabranih ispitanika bio 1 s ocjenom 2 u srednjoj koli. Druga frekvencija istog stupca znai da je meu tim ispitanicima bilo 17 s ocjenom 3, njih 75 s ocjenom 4, a 49 s ocjenom 5. Sluajno odabranih 60% ispitanika ima 143, a od toga 1 nije odgovorio na postavljeno pitanje.

61

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 2.12. Ispitanici prema: Grupirana ocjena u srednjoj skoli


Valid 2,00 3,00 4,00 5,00 Total Missing Total System Frequency 1 17 75 49 142 1 143 Percent ,7 11,9 52,4 34,3 99,3 ,7 100,0 Valid Percent ,7 12,0 52,8 34,5 100,0 Cumulative Percent ,7 12,7 65,5 100,0

Izvor: Simulirani podaci.

Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke. Druga proporcija ili relativna frekvencija pokazuje da je od 60% ispitanika njih 12% imalo prosjenu ocjenu u srednjoj koli 3.

Analitiki primjer 2.12. Zadatak je formirati grafikon jednostavnih stupaca za varijablu: Spol (v1). Rjeenje 2.12: Grafikon jednostavnih stupaca za odabranu varijablu u programu SPSS moe se nacrtati na dva naina: I. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v1 Spol. Odabirom ikone Charts otvara se novi prozor Frequencies: Charts, gdje je potrebno aktivirati Bar charts. Klikom na Continue i OK u Outputu programa SPSS uz sve frekvencije dobije se i traeni grafikon.

62

Ureivanje i prikazivanje podataka

Slika 2.13. Prozori "Frequencies" i "Frequencies: Charts" s odabranim "Bar Charts" i varijablom Spol (v1)

Izvor: Simulirani podaci.

Slika 2.14. Ispitanici prema spolu (v1)

150

120

Frequency

90

60

30

0 Musko Zensko

Spol

Izvor: Simulirani podaci.

63

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema slici 2.14 vidi se da je meu ispitanicima vie onih enskog spola, preciznije njih 144, a onih mukog spola ima 94. II. nain: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar chart, na kojem se aktivira ikona Simple. To je prikazano na slici 2.15. Slika 2.15. Prozori "Bar Charts" s aktiviranim "Simple" grafikonima

Izvor: Simulirani podaci.

Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Spol (v1). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je identian onome prikazanom na slici 2.14.

Analitiki primjer 2.13. Zadatak je formirati grafikon strukturni krug za varijablu: Spol (v1).

64

Ureivanje i prikazivanje podataka

Rjeenje 2.13: Grafikon strukturnoga kruga za odabranu varijablu u programu SPSS moe se nacrtati na dva naina: I. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v1 Spol. Odabirom ikone Charts otvara se novi prozor Frequencies: Charts, gdje je potrebno aktivirati Pie charts. Klikom na Continue i OK u Outputu programa SPSS uz sve frekvencije dobije se i traeni grafikon. Slika 2.16. Ispitanici prema spolu (v1)
Spol

Musko Zensko Missing

Izvor: Simulirani podaci.

Prema slici 2.16 vidi se da je meu ispitanicima vie onih enskog spola. Moe se vidjeti da su na ovom grafikom prikazu ukljueni svi ispitanici, pa i oni koji nisu dali odgovor na pitanje o spolu.

65

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

II. nain: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Pie chart, na kojem se aktivira Summaries of groups of case. To je prikazano na slici 2.17. Slika 2.17. Prozor "Pie Charts" s aktiviranim "Summaries of groups of case"

Izvor: Simulirani podaci.

Odabirom ikone Define otvara se prozor Define Pie: Summaries for Groups of Cases, gdje se u prostor Define Slices by prebaci eljena varijabla, to je u ovom sluaju Spol (v1). Grafikonu se moe definirati i naslov, na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je slian onome prikazanom na slici 2.16, samo to ne sadri ispitanike koji nisu odgovorili na pitanje o spolu (Missing).

Analitiki primjer 2.14. Za sve ispitanike zadatak je: a) Izraunati ukupan deparac po obitelji (v4) ako sva djeca u jednoj obitelji dobivaju jednak iznos novca. b) Prikazati varijablu grupiranog deparca (v2) grafiki pomou jednostavnih stupaca. c) Objasniti grafikon pod (b)!

66

Ureivanje i prikazivanje podataka

Rjeenje 2.14: a) Za sve ispitanike potrebno je izraunati ukupan deparac po obitelji uz pretpostavku da sva djeca u jednoj obitelji imaju jednak deparac. Dakle, da bi se dobio ukupan deparac po obitelji za svakog ispitanika, potrebno je deparac ispitanika (v1) pomnoiti s brojem djece u svakoj obitelji (v3). Da bi se pomou postojeih numerikih varijabli izraunala nova numerika varijabla, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku Compute. Na ekranu se pojavi prozor Compute Variable. U polje Target Variable potrebno je unijeti ime nove varijable v4, dok se u Numeric Expression unosi izraz po kojem se iz postojeih varijabli kreira nova varijabla na sljedei nain:
v 4 = v1 v3 .

(2.15)

Nakon to se klikne ikona OK, nova varijabla v4 automatski se formira u dodatnom stupcu u Data View programa SPSS. Nova varijabla se moe vidjeti na slici 2.18. Slika 2.18. "Data view" s novom varijablom v4

Izvor: Simulirani podaci. 67

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U Variable View potrebno je na odgovarajui nain definirati tu novu varijablu te u stupcu Label naznaiti da je to "Ukupan deparac po obitelji". Ta nova varijabla je numerika i ima skalu mjerenja Scale. b) Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar char, na kojem se aktivira ikona Simple. Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Grupirani deparac (v2). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 2.19. Slika 2.19.
Ispitanici prema grupiranom dzeparcu

80

60

Count

40

20

0 200,00 400,00 600,00 800,00 1000,00 3500,00

Grupirani dzeparac

Izvor: Simulirani podaci.

68

Ureivanje i prikazivanje podataka

c) Na grafikonu se moe vidjeti da najvei broj ispitanika ima deparac do 200 kn. Kako raste visina deparca, smanjuje se broj ispitanika koji ima toliki deparac.

Analitiki primjer 2.15. Za sve ispitanike potrebno je: a) Grupirati varijablu Visina u cm (v2) u Grupiranu visinu (v3) po principu: - 160 160
- 170 - 180 - 190 - 200 - 210

170 180 190 200 210.

b) Prikazati varijablu grupirane visine (v3) grafiki pomou linijskog grafikona. c) Objasniti grafikon pod (b)! Rjeenje 2.15: a) Da bi se pomou varijable v2 - "Visina u cm" formirala nova varijabla v3 - "Grupirana visina " po principu koji je prikazan u zadatku pd (a), potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v2 "Visina u cm", a u Output Variable, Name je v3, a Label "Grupirana visina". Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range: Lowest through upisuju se odgovarajue grupe ocjena kako je prikazano na slici 2.20.

69

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.20. Prozor "Recode into Different Variables: Old and New Values", pomou kojih se kreira nova varijabla v3 - Grupirana visina

Izvor: Simulirani podaci.

Nakon upisivanja svakog pojedinog Range: Lowest through, upisuje se i odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View, kreirat e se nova varijabla "Grupirana visina", odnosno v3. b) Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Line chart na kojem se aktivira ikona Simple. Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Grupirana visina (v3). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 2.21.

70

Ureivanje i prikazivanje podataka

Slika 2.21.
Ispitanici prema "grupiranoj visini"

120

100

80

Count

60

40

20

0 160,00 170,00 180,00 190,00 200,00 210,00

Grupirana visina

Izvor: Simulirani podaci.

c) Na grafikonu se moe vidjeti da najvei broj ispitanika ima visinu 180 cm. Kako se visina smanjuje ili poveava, smanjuje se broj ispitanika koji ima toliku visinu. 2.5. Relativni brojevi koordinacije i indeksi Relativni brojevi koordinacije pokazuju odnos dviju pojava ili frekvencija u razliitim statistikim nizovima, koje mogu imati razliitu jedinicu mjere, a koje ima smisla usporeivati. Raunaju se:
Ri = Ai , i = 1,2,..., k Bi

(2.16)

gdje je:
71

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Ai - veliina koja se usporeuje Bi - veliina s kojom se Ai usporeuje. Grafiki prikaz relativnih brojeva koordinacije je tzv. Varzarov znak. To su stupci, odnosno pravokutnici, ija baza na apscisi odgovara nazivniku (Bi), a visina relativnom broju koordinacije (Ri). Ako se zna da je povrina stupca (pravokutnika) baza visina, moe se zakljuiti da povrina odgovara brojniku (Ai), tj. veliini koja se usporeuje. Analitiki primjer 2.16. Statistiki nizovi "povrine i stanovnitvo u odabranim zemljama 2001. godine" prema nominalnom prostornom obiljeju "zemlje", prikazani su u tablici 2.13. Zadatak je izraunati broj stanovnika po km2. Tablica 2.13. Povrine i stanovnitvo u odabranim zemljama 2001. godine
Stanovnitvo Povrina u 000 u km2 Br.stan./km2 Ai Bi Ri Hrvatska 4437 56594 78,40054 Slovenija 1930 20273 95,20051 Austrija 8151 83871 97,18496 Maarska 10106 93032 108,6293 Bosna i Hercegovina 3922 51197 76,60605 Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 743. Zemlje

Rjeenje 2.16. U posljednjem stupcu tablice 2.13 izraunat je broj stanovnika po km za svaku zemlju, odnosno izraunati su relativni brojevi koordinacije.
2

Na primjer, za Republiku Hrvatsku:


R1 = A1 4437000 2 = = 78,40 stan/km . 56594 B1

Rezultat se moe komentirati: u Republici Hrvatskoj je po km2 bilo prosjeno 78,40 stanovnika u 2001. godini. Najveu gustou naseljenosti
72

Ureivanje i prikazivanje podataka

od promatranih zemalja imala je Maarska (108,63 stan/km2), a najniu Bosna i Hercegovina (76,61 stan/km2). Potrebno je napomenuti da je stanovnitvo u tablici dano u tisuama, pa su kod raunanja za vrijednosti Ai dodane tisue. Indeksima niza kvalitativnih podataka usporeuje se smjer i intenzitet varijacija frekvencija nekog statistikog niza s takvim varijacijama drugoga statistikog niza. Raunaju se tako da se svaki lan promatranog niza stavi u odnos prema odabranoj bazi, koja moe biti jedan od lanova niza ili neka druga zadana veliina.
Ii = fi 100, i = 1,2,..., k . B

(2.17)

Dakle, prema izrazu (2.17) indeksi se raunaju kao omjer frekvencije promatranog niza i odabrane baze (B). Grafiki prikaz indeksa kvalitativnih nizova su jednostavni stupci koji imaju jednake baze, jer se ovdje lanovi niza usporeuju uvijek s istom veliinom. Specifinost ovog grafikona jest da se stupci naslanjaju na bazu koja je jednaka 100. Analitiki primjer 2.17. Statistiki niz "prosjena godinja osobna potronja po kuanstvu u kunama, RH, 2002. godine" prema nominalnom obiljeju "vrsta potronje" prikazani su u tablici 2.14. Zadatak je izraunati indekse potronje s bazom "potronja na rekreaciju i kulturu". Rjeenje 2.17. U tablici 2.14. izraunati su indeksi za svaki pojedini modalitet vrste potronje, a baza tih indeksa je potronja na rekreaciju i kulturu. Indeksi su izraunati tako da je svaka apsolutna frekvencija niza stavljena u odnos prema zadanoj bazi. Indeks uz bazu je uvijek = 100. Na primjer, indeks za potronju na hranu i bezalkoholna pia je:

73

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

I1 =

f1 20816 100 = 100 = 500,99 . B 4155

Tablica 2.14. Prosjena godinja osobna potronja po kuanstvu u kunama, RH, 2002. god.
Potronja Indeksi Vrsta potronje fi (Rekr. i kult.=100) Hrana i bezalk. pia 20816 500,9868 Alkohol i duhan 2575 61,97353 Odjea i obua 5736 138,0505 Stanovanje 8875 213,5981 Pokustvo i odravanje 3573 85,99278 Zdravstvo 1442 34,70517 Rekreacija i kultura 4155 100 Hoteli i restorani 2049 49,31408 Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 185. i 186.

Indeksi se tumae u %, tako da se od njih oduzme 100. Moe se zakljuiti da je potronja na hranu i bezalkoholna pia bila ( I 1 100 = 500,99 100 = 400,99% ) za 400,99% vea u odnosu na bazu, odnosno na potronju za rekreaciju i kulturu. Isto tako indeks za potronju na odjeu i obuu je:
I3 = f3 5736 100 = 100 = 138,05 . 4155 B

Moe se zakljuiti da je potronja na odjeu i obuu bila ( I 3 100 = 138,05 100 = 38,05% ) za 38,05% vea u odnosu na bazu, odnosno na potronju za rekreaciju i kulturu. Na isti nain indeks za potronju na zdravstvo je:
I6 = f6 1442 100 = 100 = 34,71 . 4155 B

Moe se zakljuiti da je potronja na zdravstvo bila ( I 6 100 = 34,71 100 = 65,29% ) za 65,29% manja u odnosu na potronju za rekreaciju i kulturu.

74

Ureivanje i prikazivanje podataka

Slika 2.21.
Indeksi prosjene godinje osobne potronje(Rekr. i kult.=100)
600 500 400

Indeksi

300 200 100 0 Hrana i bezalk. odravanje Stanovanje Pokustvo i Odjea i Alkohol i duhan obua pia

Zdravstvo

Rekreacija i

Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 185. i 186.

Na slici 2.21 prikazani su izraunati indeksi. Na slici se vidi da su to stupci naslonjeni na bazu 100. Ako je indeks vei od 100, stupac se nalazi iznad baze, a ako je manji od 100, stupac je ispod baze. Tako se iz grafikona jasno vidi za koliki postotak su pojedine kategorije prosjene godinje osobne potronje vee ili manje od baze 100, tj. potronje na rekreaciju i kulturu.

Analitiki primjer 2.18. Ako je prosjeni deparac 372 kn, potrebno je za sve ispitanike: a) Izraunati indekse varijable deparac (v3) uzimajui za bazu indeksa prosjeni deparac po ispitaniku. Rjeenje 2.18: Za sve ispitanike potrebno je izraunati indekse varijable deparac (v3) uzimajui za bazu indeksa prosjeni deparac po ispitaniku koji
75

kultura

restorani

Hoteli i

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

iznosi 372. Dakle, da bi se dobili ovi indeksi, potrebno je deparac ispitanika (v2) podijeliti s bazom koja iznosi 372 i sve to prema jednadbi (2.17) pomnoiti sa 100. Da bi se pomou postojeih numerikih varijabli izraunala nova numerika varijabla, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku Compute. Na ekranu se pojavi prozor Compute Variable. U polje Target Variable potrebno unijeti ime nove varijable v3, dok se u Numeric Expression unosi izraz po kojem se iz postojeih varijabli kreira nova varijabla na sljedei nain:
v3 = (v 2 / 372) 100 .

Nakon to se klikne ikona OK, nova varijabla v3 automatski se formira u dodatnom stupcu u Data View programa SPSS. U Variable View potrebno je na odgovarajui nain definirati tu novu varijablu te u stupcu Label naznaiti da su to "Indeksi deparca po ispitaniku". Ta nova varijabla je numerika i ima skalu mjerenja Scale.

Analitiki primjer 2.19. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) spol (v1) mijenja po redcima (row), a varijabla (obiljeje) grupirani deparac (v2) po stupcima (column): a) Formirati dvostruku statistiku tablicu bez zbirnih redaka i stupaca. b) Formirati dvostruku statistiku tablicu sa zbirnim redcima i stupcima. c) Nacrtati grafikon viestrukih varijablama i komentirati sliku! stupaca prema odabranim

76

Ureivanje i prikazivanje podataka

Rjeenje 2.19: a) Da bi se formirala dvostruka statistika tablica bez zbirnih redaka i stupaca, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Tables, i General Tables. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Rows, a druga varijabla v2 - Grupirani deparac u polje Columns. To je prikazano na slici 2.23. Slika 2.23. "General Tables" s varijablama v1 u redcima i v2 u stupcima

Izvor: Simulirani podaci.

Klikom na OK, u Outputu se za rezultat dobije traena tablica koja je prikazana u sljedeoj tablici 2.15. Tablica 2.15. Ispitanici prema spolu i grupiranom deparcu
Grupirani deparac 200,00 Spol Muko ensko 28 45 400,00 18 34 600,00 10 20 800,00 4 2 1000,00 4 3 3500,00 4 1

Izvor: Simulirani podaci. 77

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U tablici 2.15. vidi se da najvie ispitanika ima deparac do 200 kn. Iako je u analizi vie ispitanika enskog spola, pokazalo se da vei deparac imaju oni mukog spola. b) Da bi se formirala dvostruka statistika tablica sa zbirnim redcima i stupcima, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Row(s), a druga varijabla v2 - Grupirani deparac u polje Column(s). To je prikazano na slici 2.24. Slika 2.24. "Crosstabs" s varijablama v1 u redcima i v2 u stupcima

Izvor: Simulirani podaci.

Klikom na OK u Outputu se za rezultat dobije traena tablica sa zbirnim stupcima i redcima koja je prikazana u sljedeoj tablici 2.16.

78

Ureivanje i prikazivanje podataka

Tablica 2.16. Ispitanici prema spolu i grupiranom deparcu


Spol * Grupirani dzeparac Crosstabulation Count Grupirani dzeparac Spol Total
Musko
Zensko

200,00 28 45 73

400,00 18 34 52

600,00 10 20 30

800,00 4 2 6

1000,00 4 3 7

3500,00 4 1 5

Total 68 105 173

Izvor: Simulirani podaci.

Za razliku od tablice 2.15 u tablici 2.16 postoje zbirni stupci i zbirni redci. U njima se nalaze marginalne frekvencije koje kau koliko ispitanika ima po jednoj grupi obiljeja bez obzira na drugo obiljeje. Na primjer, prvi podatak u zbirnom stupcu kae da je 68 ispitanika mukog spola bez obzira na deparac. Trei podatak u zbirnom retku kae da je 30 ispitanika imalo deparac izmeu 400 i 600 kn bez obzira na spol. c) Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs (slika 2.24), potrebno je aktivirati Display clustered bar charts. Slika 2.25. Viestruki stupci visine deparca prema spolu
Bar Chart

50

Grupirani dzeparac
200,00 400,00 600,00

40

800,00 1000,00 3500,00

Count

30

20

10

0 Musko Zensko

Spol

Izvor: Simulirani podaci. 79

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Traeni grafikon prikazan je na slici 2.25. Moe se vidjeti da se prvi viestruki stupac odnosi na ispitanike mukog spola, a drugi na ispitanike enskog spola. I u jednom i u drugom dijelu grafikona najvei stupci su oni koji prikazuju nii deparac, dok oni manji stupci pokazuju vii iznos deparca.

Analitiki primjer 2.20. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) spol (v1) mijenja po stupcima (column), a varijabla (obiljeje) grupirani deparac (v2) po redcima (row): a) Formirati dvostruku statistiku tablicu bez zbirnih redaka i stupaca. b) Formirati dvostruku statistiku tablicu sa zbirnim redcima i stupcima. c) Nacrtati grafikon dvostrukih varijablama i komentirati sliku! Rjeenje 2.20: a) Da bi se formirala dvostruka statistika tablica bez zbirnih redaka i stupaca, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Tables i General Tables. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Columns, a druga varijabla v2 - Grupirani deparac u polje Rows. Princip je kao to je prikazano na slici 2.20, samo to odabrane varijable po stupcima i po redcima mijenjaju svoje mjesto. Klikom na OK, u Outputu se za rezultat dobije traena tablica koja je prikazana u sljedeoj tablici 2.17. stupaca prema odabranim

80

Ureivanje i prikazivanje podataka

Tablica 2.17. Ispitanici prema spolu i grupiranom deparcu


Spol Grupirani dzeparac 200,00 400,00 600,00 800,00 1000,00 3500,00 Musko 28 18 10 4 4 4 Zensko 45 34 20 2 3 1

Izvor: Simulirani podaci.

Ako se napravi usporedba tablice 2.17 s tablicom 2.15, moe se vidjeti da se sada varijabla spol mijenja po stupcima, a varijabla grupirani deparac po redcima. I iz ove tablice jasno je da najvei broj ispitanika i jednog i drugog spola imaju najmanju kategoriju deparca, tj. do 200 kn na mjesec. b) Da bi se formirala dvostruka statistika tablica s zbirnim redcima i stupcima, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Column(s), a druga varijabla v2 - Grupirani deparac u polje Row(s). Tablica 2.18. Ispitanici prema spolu i grupiranom deparcu
Grupirani dzeparac * Spol Crosstabulation Count Spol Grupirani dzeparac 200,00 400,00 600,00 800,00 1000,00 3500,00 Total Musko 28 18 10 4 4 4 68 Zensko 45 34 20 2 3 1 105 Total 73 52 30 6 7 5 173

Izvor: Simulirani podaci. 81

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slian je princip kao to je prikazano na slici 2.24, samo to odabrane varijable po stupcima i po redcima mijenjaju svoje mjesto. Klikom na OK u Outputu se za rezultat dobije traena tablica sa zbirnim stupcima i redcima koja je prikazana u tablici 2.18. Za razliku od tablice 2.17 u tablici 2.18 postoje zbirni stupci i zbirni redci. U njima se nalaze marginalne frekvencije koje kau koliko ispitanika ima po jednoj grupi obiljeja bez obzira na drugo obiljeje. Na primjer, prvi podatak u zbirnom retku kae da je 68 ispitanika mukog spola bez obzira na deparac. Trei podatak u zbirnom stupcu kae da je 30 ispitanika imalo deparac izmeu 400 i 600 kn bez obzira na spol. c) Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs (slika 2.24), potrebno je aktivirati Display clustered bar charts. Slika 2.26. Dvostruki stupci spola ispitanika prema visini deparca
Bar Chart

50

Spol
Musko Zensko

40

Count

30

20

10

0 200,00 400,00 600,00 800,00 1000,00 3500,00

Grupirani dzeparac

Izvor: Simulirani podaci.

Traeni grafikon prikazan je na slici 2.26. Moe se vidjeti da se svaki dvostruki stupac odnosi na razliitu kategoriju visine deparca. U prva tri dvostruka stupca veu zastupljenost imaju ispitanici enskog
82

Ureivanje i prikazivanje podataka

spola, a prema posljednja tri stupca moe se zakljuiti da je muki spol u veini. Dakle, openito ispitanici enskog spola imaju nii iznos deparca, dok ispitanici mukog spola imaju vei iznos deparca.

Analitiki primjer 2.21. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) kolska sprema oca (v1) mijenja po redcima (row), a varijabla (obiljeje) prikljuenje EU (v2) po stupcima (column): a) Tablica sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.21: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Tablica 2.19. Ispitanici prema kolskoj spremi oca i miljenju o prikljuenju EU
Skolska sprema oca * Jeste li za prikljucenje RH u EU Crosstabulation Count Jeste li za prikljucenje RH EU Da Skolska sprema oca Osnovna skola Srednja cetverogodisnja Srednja trogodisnja Visa Visoka Magisterij Doktorat Total 22 67 27 39 53 4 2 214 Ne 0 6 2 5 4 1 1 19 Total 22 73 29 44 57 5 3 233

Izvor: Simulirani podaci.

83

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pomou odgovarajuih strelica varijabla v1 - kolska sprema oca se prebacuje u polje Row(s), a druga varijabla v2 - Prikljuenje EU u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica, koja je prikazana tablicom 2.19 i grafikon, prikazan na slici 2.27. Slika 2.27. Ispitanici prema kolskoj spremi oca i miljenju o prikljuenju EU
Bar Chart

70

Jeste li za prikljucenje RH EU
Da Ne

60

50

Count

40

30

20

10

0
Osnovna skola Srednja Srednja cetverogodis... trogodisnja Visa Visoka Magisterij Doktorat

Skolska sprema oca

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.19 i slici 2.27 moe se zakljuiti da je veina ispitanika iz odabranog uzorka za prikljuenje Republike Hrvatske Europskoj uniji, bez obzira na kolsku spremu njihova oca. Isto tako moe se primijetiti da je u uzorku najvei broj ispitanika kojima otac ima srednju strunu spremu (to je zaista i openita situacija u Republici Hrvatskoj - prema podacima u SLJH, razne godine - pa bi se u tom smislu moglo komentirati o sluajnosti izabranog uzorka).
84

Ureivanje i prikazivanje podataka

Analitiki primjer 2.22. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) prikljuenje EU (v1) mijenja po redcima (row), a varijabla (obiljeje) vjenanje sa osobom druge vjere (v2) po stupcima (column): a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.22: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Prikljuenje EU u polje Row(s), a druga varijabla v2 - Vjenanje sa osobom druge vjere u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.20 i grafikon prikazan na slici 2.28. Tablica 2.20. Ispitanici prema miljenju o prikljuenju EU i o vjenanju sa osobom druge vjere
Jeste li za prikljucenje RH EU * Biste li se vjencali sa osobom druge vjere Crosstabulation Count Biste li se vjencali sa osobom druge vjere Da Jeste li za prikljucenje RH EU Total Da Ne 105 10 115 Ne 95 9 104 Total 200 19 219

Izvor: Simulirani podaci.

85

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.28 Ispitanici prema miljenju o prikljuenju EU i o vjenanju sa osobom druge vjere
Bar Chart

120

Biste li se vjencali sa osobom druge vjere


Da Ne

100

80

Count

60

40

20

0 Da Ne

Jeste li za prikljucenje RH EU

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.20 i slici 2.28 moe se zakljuiti da je veina ispitanika iz odabranog uzorka za prikljuenje Republike Hrvatske Europskoj uniji, to se vidi prema marginalnim frekvencijama u zbirnom stupcu tablice i prema prvom dvostrukom stupcu grafikona. Isto tako moe se primijetiti da je u uzorku broj ispitanika koji bi se vjenao sa osobom druge vjere malo vei od onih koji to ne bi napravili, te da su otprilike ravnomjerno rasporeeni bez obzira na miljenje o tome jesu li za prikljuenje Republike Hrvatske Europskoj uniji.

Analitiki primjer 2.23. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) odnosi u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) uivate li drogu (v2) po stupcima (column). Potrebno je:

86

Ureivanje i prikazivanje podataka

a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.23: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v2 - Odnosi u obitelji prebacuje se u polje Row(s), a druga varijabla v1 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica, koja je prikazana tablicom 2.21 i grafikon prikazan na slici 2.29. Tablica 2.21. Ispitanici prema odnosima u njihovoj obitelji i konzumiranju droge
Odnosi u obitelji * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Odnosi u obitelji Vlada sklad i razumijevanje Povremene svadje i sukobi Ucestale svadje i sukobi Total 6 6 1 13 Ne 147 70 0 217 Total 153 76 1 230

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.21 i slici 2.29 moe se zakljuiti da veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema prvoj marginalnoj frekvenciji u zbirnom stupcu, te prvom dvostrukom stupcu grafikona, moe se vidjeti da u obiteljima kod veine ispitanika vlada sklad i razumijevanje. Samo 1 ispitanik izjasnio se da u obitelji ima uestale svae i sukobe i on konzumira drogu (trei dvostruki stupac grafikona).

87

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.29. Ispitanici prema odnosima u njihovoj obitelji i konzumiranju droge


Bar Chart

150

Uzivate li drogu
Da Ne

120

Count

90

60

30

0 Vlada sklad i razumijevanje Povremene svadje i sukobi Ucestale svadje i sukobi

Odnosi u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.24. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) kolska sprema oca (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.24: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
88

Ureivanje i prikazivanje podataka

Pomou odgovarajuih strelica varijabla v1 - kolska sprema oca Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica, koja je prikazana tablicom 2.22 i grafikon prikazan na slici 2.30. Tablica 2.22. Ispitanici prema kolskoj spremi oca i konzumiranju droge
Skolska sprema oca * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Skolska sprema oca Osnovna skola Srednja cetverogodisnja Srednja trogodisnja Visa Visoka Magisterij Doktorat Total 1 2 2 3 5 0 0 13 Ne 20 69 28 41 53 5 2 218 Total 21 71 30 44 58 5 2 231

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.22 i slici 2.30 moe se zakljuiti da veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema zadnje dvije marginalne frekvencije u zbirnom stupcu, te zadnja dva dvostruka stupca grafikona, moe se vidjeti da samo 5 ispitanika ima oca s titulom magistra, a 2 ispitanika imaju oca s doktoratom. Meu njima nitko ne konzumira drogu.

89

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.30. Ispitanici prema kolskoj spremi oca i konzumiranju droge


Bar Chart

70

Uzivate li drogu
Da Ne

60

50

Count

40

30

20

10

0
Osnovna skola Srednja Srednja cetverogodis... trogodisnja Visa Visoka Magisterij Doktorat

Skolska sprema oca

Izvor: Simulirani podaci.

Analitiki primjer 2.25. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) Broj djece u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.25: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
90

Ureivanje i prikazivanje podataka

Pomou odgovarajuih strelica varijabla v1 - Broj djece u obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.23 i grafikon prikazan na slici 2.31. Tablica 2.23. Ispitanici prema broju djece u obitelji i konzumiranju droge
Broj djece u obitelji * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Broj djece u obitelji 1 2 3 4 5 6 7 Total 1 8 4 0 0 0 0 13 Ne 20 130 51 11 5 1 1 219 Total 21 138 55 11 5 1 1 232

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.23 i slici 2.31 moe se zakljuiti da veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema zadnje dvije marginalne frekvencije u zbirnom stupcu, te zadnja dva dvostruka stupca grafikona, moe se vidjeti da samo po 1 ispitanik u obitelji ima 6ero i 7-ero djece. Meu njima nitko ne konzumira drogu.

91

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.31. Ispitanici prema broju djece u obitelji i konzumiranju droge


Bar Chart

140

Uzivate li drogu
Da Ne

120

100

Count

80

60

40

20

0 1 2 3 4 5 6 7

Broj djece u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.26. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Financijske prilike u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) Broj djece u obitelji (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.26: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Financijske prilike u obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Broj djece u
92

Ureivanje i prikazivanje podataka

obitelji u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.24 i grafikon prikazan na slici 2.32. Tablica 2.24. Ispitanici prema financijskim prilikama i broju djece u obitelji
Financijske prilike u obitelji * Broj djece u obitelji Crosstabulation Count Broj djece u obitelji 1 Financijske prilike u obitelji Nema novca za normalan standard Zadovoljavamo osnovne potrebe Nema materijalnih problema Zivimo odlicno 0 2 3 3 0 4 0 5 1 6 0 7 0 4 Total

12

56

29

104

9 0 21

78 5 142

25 1 55

5 1 11

2 0 5

1 0 1

1 0 1

121 7 236

Total

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.24 i slici 2.32 moe se zakljuiti da kod veine ispitanika iz odabranog uzorka ima 2 djece u obitelji. Ispitanika koji su se izjasnili da nemaju novca za normalan standard te onih koji ive odlino ima znatno manje u odnosu na ostale kategorije (prvi i zadnji viestruki stupac grafikona na slici 2.32).

93

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.32. Ispitanici prema financijskim prilikama i broju djece u obitelji


Bar Chart

80

Broj djece u obitelji


1 2 3 4 5 6 7

60

Count

40

20

0 Nema novca za normalan standard Zadovoljavamo osnovne potrebe Nema materijalnih problema Zivimo odlicno

Financijske prilike u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.27. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Financijske prilike u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b)
94

Komentirati sliku i izraunate frekvencije!

Ureivanje i prikazivanje podataka

Rjeenje 2.27: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Financijske prilike u obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.25 i grafikon prikazan na slici 2.33. Tablica 2.25. Ispitanici prema financijskim prilikama u obitelji i konzumiranju droge
Financijske prilike u obitelji * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Financijske prilike u obitelji Nema novca za normalan standard Zadovoljavamo osnovne potrebe Nema materijalnih problema Zivimo odlicno Total 1 7 4 1 13 Ne 3 96 114 5 218 Total 4 103 118 6 231

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.25 i slici 2.33 moe se zakljuiti da veina ispitanika iz odabranog uzorka ipak ne konzumira drogu. Ispitanika koji su se izjasnili da nemaju novca za normalan standard te onih koji ive odlino ima znatno manje u odnosu na ostale kategorije (prvi i zadnji viestruki stupac grafikona na slici 2.33).

95

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.33. Ispitanici prema financijskim prilikama u obitelji i konzumiranju droge


Bar Chart

120

Uzivate li drogu
Da Ne

100

80

Count

60

40

20

0 Nema novca za Zadovoljavamo normalan standard osnovne potrebe Nema materijalnih problema Zivimo odlicno

Financijske prilike u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.28. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Grupirana ocjena u srednjoj koli (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.28: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs.

96

Ureivanje i prikazivanje podataka

Tablica 2.26. Ispitanici prema ocjeni iz srednje kole i konzumiranju droge


Grupirana ocjena u srednjoj skoli * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Grupirana ocjena u srednjoj skoli Total 2,00 3,00 4,00 5,00 0 4 5 4 13 Ne 1 30 104 84 219 Total 1 34 109 88 232

Izvor: Simulirani podaci.

Slika 2.34. Ispitanici prema ocjeni iz srednje kole i konzumiranju droge


Bar Chart

120

Uzivate li drogu
Da Ne

100

80

Count

60

40

20

0 2,00 3,00 4,00 5,00

Grupirana ocjena u srednjoj skoli

Izvor: Simulirani podaci.

Pomou odgovarajuih strelica varijabla v1 - Grupirana ocjena u srednjoj koli prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.26. i grafikon prikazan na slici 2.34.
97

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

b) Prema podacima u tablici 2.26 i slici 2.34 moe se zakljuiti da veina ispitanika u srednjoj koli ima prosjenu ocjenu 4. S obzirom na ukupan broj ispitanika koji su u srednjoj koli imali prosjenu ocjenu 3, broj onih koji izmeu njih konzumiraju drogu je 4, a to je relativno najvei udio (drugi dvostruki stupac grafikona na slici 2.34).

Analitiki primjer 2.29. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Uivate li drogu (v2) mijenja po redcima (row), a varijabla (obiljeje) Spol (v1) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.29: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v2 - Uivate li drogu premjestiti u polje Row(s), a drugu varijablu v1 - Spol u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Tablica 2.27. Ispitanici prema konzumiranju droge i spolu
Uzivate li drogu * Spol Crosstabulation Count Spol Musko Uzivate li drogu Total Da NE 7 84 91 Zensko 6 136 142 Total 13 220 233

Izvor: Simulirani podaci. 98

Ureivanje i prikazivanje podataka

Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.27 i grafikon prikazan na slici 2.35. Slika 2.35. Ispitanici prema konzumiranju droge i spolu
Bar Chart

140

Spol
Musko Zensko

120

100

Count

80

60

40

20

0 Da NE

Uzivate li drogu

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.27 i slici 2.35 moe se zakljuiti da je veina ispitanika u odabranom uzorku enskog spola. Prvi dvostruki stupac grafikona odnosi se na one ispitanike koji konzumiraju drogu. Moe se vidjeti da meu njima prevladavaju oni mukog spola (i prema prvom retku tablice 2.27).

Analitiki primjer 2.30. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) Puite li cigarete (v1) mijenja po redcima (row), a varijabla (obiljeje) Grupirana ocjena u srednjoj koli (v2) po stupcima (column). Potrebno je:

99

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.30: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Puite li cigarete prebacuje se u polje Row(s), a druga varijabla v2 - Grupirana ocjena u srednjoj koli u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Tablica 2.28. Ispitanici prema puenju cigareta i ocjeni iz srednje kole
Pusite li cigarete * Grupirana ocjena u srednjoj skoli Crosstabulation Count Grupirana ocjena u srednjoj skoli 2,00 Pusite li cigarete Ne Do 10 cigareta na dan Do 1 kutije na dan Vise od 1 kutije na dan 0 0 1 0 1 3,00 18 4 11 1 34 4,00 83 14 8 7 112 5,00 72 7 9 2 90 Total 173 25 29 10 237

Total

Izvor: Simulirani podaci.

Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.28 i grafikon prikazan na slici 2.36. b) Prema podacima u tablici 2.28 i slici 2.36 moe se zakljuiti da veina ispitanika ne pui cigarete. U svim kategorijama puaa cigareta najvei je broj onih s prosjenom ocjenom iz srednje kole vrlo dobar, tj. 4, osim kod onih koji pue do 1 kutije na dan, gdje prevladavaju ispitanici s prosjenom ocjenom iz srednje kole dobar, tj. 3 (trei viestruki stupac grafikona na slici 2.36).

100

Ureivanje i prikazivanje podataka

Slika 2.36. Ispitanici prema puenju cigareta i ocjeni iz srednje kole


Bar Chart

100

Grupirana ocjena u srednjoj skoli


2,00 3,00

80

4,00 5,00

Count

60

40

20

0 Ne Do 10 cigareta na Do 1 kutije na dan Vise od 1 kutije na dan dan

Pusite li cigarete

Izvor: Simulirani podaci.

101

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

102

Srednje vrijednosti

3. SREDNJE VRIJEDNOSTI
3.1. Srednje vrijednosti Prikupljeni statistiki podaci u svom izvornom obliku esto zbog svog obujma nemaju razumljivu formu. Zbog toga se i vri njihovo grupiranje, odnosno formiranje statistikih nizova. Na taj se nain dobiva detaljniji uvid u svojstva promatranoga statistikog niza. Raunanjem srednjih vrijednosti dolazi se do informacija o vrijednostima statistikog obiljeja oko kojih se rasporeuju elementi statistikog niza. Srednja vrijednost je vrijednost statistikog obiljeja oko koje se grupiraju podaci statistikog niza. Jo se zove i "mjera centralne tendencije". Srednje vrijednosti mogu se podijeliti: na 1. Poloajne srednje vrijednosti odreuju se poloajem podataka u nizu. Najvanije poloajne srednje vrijednosti su : a) mod b) medijan. 2. Potpune srednje vrijednosti raunaju se upotrebom svih podataka u statistikom nizu. Potpune srednje vrijednost su: a) aritmetika sredina b) harmonijska sredina c) geometrijska sredina (koja nema svoju primjenu u sociolokim istraivanjima).

103

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

3.2. Aritmetika sredina Aritmetika sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu. To je najvanija i najee koritena srednja vrijednost (ali ne i uvijek najbolja srednja vrijednost). Aritmetika sredina je omjer zbroja svih vrijednosti numerikog obiljeja jednog niza i broja elemenata tog niza. Ako se radi o negrupiranom statistikom numerikom nizu, rauna se jednostavna aritmetika sredina:
X =
i =1

Xi N

X 1 + X 2 + ... + X N N

(3.1)

Ako se radi o grupiranom statistikom numerikom nizu, rauna se sloena, vagana ili ponderirana aritmetika sredina. Poznato je da apsolutne frekvencije oznaavaju broj elemenata skupa koji pripadaju odreenom modalitetu promatranoga statistikog obiljeja. Iz toga se moe zakljuiti da je vanost svake vrijednosti obiljeja ovisna o frekvenciji jer vea frekvencija znai vei udio tog oblika obiljeja u promatranom skupu. Zato se frekvencija jo naziva teinski faktor ili ponder kod grupiranih nizova. Vagana ili ponderirana aritmetika sredina rauna se prema izrazu:
X=
i =1 k

f i xi
i =1

fi

f 1 x1 + f 2 x 2 + ... + f k x k f 1 + f 2 + ... + f k

(3.2)

U jednadbi (3.2) k predstavlja broj grupa, odnosno modaliteta promatranog numerikog obiljeja. Nazivnik ovog izraza, kao suma svih apsolutnih frekvencija, odgovara opsegu statistikog skupa. Ako su veliine razreda grupiranog numerikog niza razliite od 1, za raunanje vagane ili ponderirane aritmetike sredine

104

Srednje vrijednosti

potrebno je izvriti aproksimaciju pomou sredine razreda. Sredina razreda, kako je ve reeno, dobije se kao jednostavan prosjek donje i gornje granice razreda. Na taj nain ona predstavlja sve vrijednosti obiljeja koje se javljaju u jednoj grupi. Stoga je, u ovom sluaju, aritmetika sredina procjena stvarne aritmetike sredine numerikog niza. Analitiki primjer 3.1. Statistiki skup "Zaposlene ene u graevinarstvu u RH, 31. 03. 2002. godine" promatran prema neprekidnom numerikom obiljeju "dob" dan je u tablici 3.1.. Zadatak je izraunati aritmetiku sredinu. Tablica 3.1. Zaposlene ene u graevinarstvu u RH, 31. 03. 2004. godine
Dob xi (18)-25 25-30 30-35 35-40 40-45 45-50 50-65 Ukupno: Broj ena fi 712 1367 1277 1417 1580 1557 1322 9232 Sredina razreda xi 21,5 27,5 32,5 37,5 42,5 47,5 57,5 fixi 15308 37592,5 41502,5 53137,5 67150 73957,5 76015 364663

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godine, str. 145.

Rjeenje 3.1: Zadani niz je grupiran prema modalitetima obiljeja. Razredi nisu jednake veliine, a ima ih 7. Kod grupiranih nizova s veliinom razreda razliitom od 1, u izrazu za aritmetiku sredinu, xi predstavlja sredinu i-tog razreda. Stoga je aproksimacija aritmetike sredine sljedea:
= X = i =1 7 fi
i =1

f i xi

f 1 x1 + f 2 x 2 + ... + f 7 x 7 364663 = = 39,5 godina 9232 f 1 + f 2 + ... + f 7

105

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Dakle priblino, prosjena je dob ena zaposlenih graevinarstvu RH (stanje 31. 03. 2004. god.) 39,5 godina.

Aritmetika sredina izraava se u originalnim jedinicama mjere promatranoga numerikog obiljeja, obuhvaa sve elemente nekog skupa, te se pomou nje mogu usporeivati nizovi koji su grupirani po jednakom obiljeju. Uz ove, aritmetika sredina zadovoljava i sljedee kriterije: a) Aritmetika sredina nalazi su izmeu najvee i najmanje vrijednosti promatranoga numerikog obiljeja:
xmin X xmax

(3.3)

b) Zbroj odstupanja vrijednosti numerikog obiljeja od aritmetike sredine u jednoj distribuciji je uvijek nula.
i =1
k

( xi X ) = 0 , za negrupirani niz,
f i ( xi X ) = 0 , za grupirani niz.

(3.4) (3.5)

i =1

c) Zbroj kvadrata odstupanja vrijednosti numerikog obiljeja od aritmetike sredine u jednoj distribuciji je manji ili jednak zbroju kvadrata odstupanja vrijednosti numerikog obiljeja u istoj distribuciji od bilo koje druge vrijednosti (a).
i =1 2 2 ( xi X ) ( xi a) , za negrupirani niz, i =1 N N

(3.6) (3.7)

i =1

2 2 f i ( xi X ) f i ( xi a) , za grupirani niz. i =1

Ako neki numeriki niz sadri ekstremno male ili velike vrijednosti obiljeja, aritmetika sredina kao prosjena vrijednost gubi na svojoj reprezentativnosti. Taj problem je dodatno izraen kada u distribuciji postoje razredi s otvorenom donjom, odnosno gornjom granicom razreda, i kada nije mogue te granice objektivno procijeniti.

106

Srednje vrijednosti

3.3. Mod Mod je vrijednost statistikog obiljeja koja se najee javlja u nekom nizu, tj. vrijednost obiljeja kojoj pripada najvea frekvencija. Mod se moe primijeniti na kvalitativne i kvantitativne statistike nizove, a spada u poloajne srednje vrijednosti. Kod nominalnih obiljeja mod se odreuje brojenjem na nain da se trai koja se vrijednost obiljeja u nizu najee javlja. Ako je niz grupiran, trai se najvea apsolutna frekvencija. Vrijednost obiljeja kojoj pripada ta najvea apsolutna frekvencija je mod. Analitiki primjer 3.2. Statistiki skup "prodane cipele u prodavaonici "K" na dan 05. 05. 2005. god." grupiran je prema nominalnom obiljeju "boja". Modaliteti toga obiljeja su: crna (C), bijela (B), ruiasta (R), smea (S). Ureeni podaci dobiveni evidencijom na odreeni dan su: CCCCCBRRRS Zadatak je odrediti mod. Rjeenje 3.2: Dakle, na dan 05. 05. 2005. god. u prodavaonici "K" je prodano 10 cipela. Od toga 5 crnih, 1 bijele, 3 ruiaste i 1 smee. Vrijednost obiljeja "boja" koja se u ovom nizu najee javlja je crna, pa se moe zakljuiti da je mod, Mo = crna boja . Statistiki niz grupiran u razrede prikazan je u tablici 3.2. Kod grupiranih nizova mod se odreuje prema najveoj apsolutnoj frekvenciji: f max = 5 . Modalitet obiljeja koji odgovara toj frekvenciji je crno, to znai da je: Mo = crna boja .

107

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 3.2. Prodane cipele u prodavaonici "K" na dan 05. 05. 2005. god. prema boji
Boja cipela Xi crna bijela ruiasta smea Ukupno: Broj prodanih cipela fi 5 1 3 1 10

Izvor: Evidencija prodavaonice "K", svibanj 2005. godine

Ovo je primjer tzv. unimodalnih nizova koji imaju samo jedan mod. Postoje statistiki nizovi u kojima se dvije ili vie vrijednosti obiljeja mogu pojavljivati ee u odnosu na ostale modalitete obiljeja. U tom sluaju kae se su to bimodalni ili multimodalni nizovi. Kod bimodalne distribucije, koja ima dva vrha, postoji glavni mod i lokalni mod. Kada je u nizu prisutno vie od jednog moda, potrebno je statistiki skup podijeliti na vie podskupova, od kojih e svaki imati svoja karakteristina svojstva, te izvriti analizu svakoga podskupa posebno.

Analitiki primjer 3.3. Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti: a) b) c) d) Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Komentirati rezultate! Rjeenje 3.3: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies.

108

Srednje vrijednosti

U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - visina u cm se prebacuje u polje Variable(s, kako je prikazano na slici 3.1. Slika 3.1. Prozor "Frequencies" sa izabranom varijablom (obiljejem) visina u cm (v2)

Izvor: Simulirani podaci.

Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v2). Da bi se u izlaznim rezultatima dobila najmanja i najvea vrijednost niza, u spomenutom prozoru se aktivira Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Prozor Frequencies Statistics s potrebnim aktiviranim veliinama prikazan je na slici 3.2.

109

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 3.2. Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim veliinama

Izvor: Simulirani podaci.

Da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.3. Tablica 3.3. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Mean Mode Minimum Maximum Valid Missing 235 4 175,77 172 154 206

Izvor: Simulirani podaci.

Prema podacima iz tablice 3.3. moe se vidjeti da je 325 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije odgovorilo na to pitanje.

110

Srednje vrijednosti

Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 175,77 cm. Mod, odnosno najea visina ispitanika je 172 cm. Najmanja visina ispitanika u uzorku je 154 cm. Najvea visina ispitanika u uzorku je 206 cm.

Analitiki primjer 3.4. Za varijablu (obiljeje) prosjena ocjena u srednjoj koli (v3)3 potrebno je odrediti: a) b) c) d) Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Komentirati rezultate! Rjeenje 3.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - Prosjena ocjena u srednjoj koli se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu prosjena ocjena u srednjoj koli (v3). Da bi se u izlaznim rezultatima dobila najmanja i najvea vrijednost niza, u spomenutom prozoru se aktivira Minimum i
3

Aritmetika sredina se po definiciji izraunava samo za numerika obiljeja, ali se za cjelovitu analizu esto primjenjuje i za redoslijedno obiljeje.

111

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Da bi se u Outputu programa SPSS dobili eljeni podaci o prosjenoj ocjeni u srednjoj koli ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.4. Tablica 3.4. Statistiki podaci o prosjenoj ocjeni ispitanika u srednjoj koli
Statistics Prosjecna ocjena u srednjoj skoli N Valid Missing Mean Mode Minimum Maximum 238 1 4,1773 4,00 2,00 5,00

Izvor: Simulirani podaci.

Prema podacima iz tablice 3.4. moe se vidjeti da je 238 ispitanika dalo odgovor o svojoj prosjenoj ocjeni u srednjoj koli, dok 1 ispitanik nije odgovorio na to pitanje. Prosjena ocjena u srednjoj koli za sve ispitanike u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 4,177. Mod, odnosno najea prosjena ocjena ispitanika u srednjoj koli je 4. Najmanja prosjena ocjena ispitanika u srednjoj koli u uzorku je 2. Najvea prosjena ocjena ispitanika u srednjoj koli u uzorku je 5.

Analitiki primjer 3.5. Za varijablu (obiljeje) grupirana ocjena u srednjoj koli (v4) potrebno je odrediti: a) b)
112

Tablicu frekvencija; Najmanju i najveu vrijednost obiljeja;

Srednje vrijednosti

c) d) e)

Aritmetiku sredinu; Mod; Komentirati rezultate! Rjeenje 3.5:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v4 - Grupirana ocjena u srednjoj koli se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu grupirana ocjena u srednjoj koli (v4). S obzirom na to da se u ovom primjeru trai i tablica frekvencija, potrebno je aktivirati Display Frequency Tables. Da bi se u izlaznim rezultatima dobila najmanja i najvea vrijednost niza u spomenutom prozoru se aktivira Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Da bi se u Outputu programa SPSS dobili eljeni podaci o grupiranoj ocjeni ispitanika u srednjoj koli, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.5. Tablica 3.5. Statistiki podaci o grupiranoj ocjeni ispitanika u srednjoj koli
N Statistics Grupirana ocjena u srednjoj skoli Valid 238 Missing Mean Mode Minimum Maximum 1 4,2269 4,00 2,00 5,00

Izvor: Simulirani podaci.

113

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema podacima iz tablice 3.5. moe se vidjeti da je 238 ispitanika dalo odgovor o svojoj prosjenoj ocjeni u srednjoj koli, dok 1 ispitanik nije odgovorio na to pitanje. Prosjena ocjena u srednjoj koli za sve ispitanike u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 4,23. Mod, odnosno najea prosjena ocjena u srednjoj koli ispitanika je 4. Najmanja prosjena ocjena ispitanika u srednjoj koli u uzorku je 2. Najvea prosjena ocjena ispitanika u srednjoj koli u uzorku je 5. U Outputu je dana i tablica frekvencija prema grupiranoj ocjeni u srednjoj koli. Prikazana je u tablici 3.6. Tablica 3.6.
Grupirana ocjena u srednjoj skoli Frequency 1 34 113 90 238 1 239 Percent ,4 14,2 47,3 37,7 99,6 ,4 100,0 Valid Percent ,4 14,3 47,5 37,8 100,0 Cumulative Percent ,4 14,7 62,2 100,0

Valid

2,00 3,00 4,00 5,00 Total

Missing Total

System

Izvor: Simulirani podaci.

U stupcu Frequency moe se vidjeti da je od 238 ispitanika koji su dali odgovor na postavljeno pitanje ocjenu 2 imao samo 1, ocjenu 3 njih 34, ocjenu 4 njih 113, dok je ocjenu 5 imalo 90 ispitanika.

Analitiki primjer 3.6. Potrebno je dokazati 3 svojstva aritmetike sredine za anketirane ispitanike prema varijabli (obiljeju) prosjena ocjena u srednjoj koli (v2) .
114

Srednje vrijednosti

a) b) c)

Provjeriti 1. svojstvo da je: x min X x max . Provjeriti 2. svojstvo da je: ( x i X ) = 0 , (za negrupirani niz).
i =1 N

Provjeriti 3. svojstvo da je:

i =1

2 2 ( xi X ) ( xi a) ,
i =1

(za

negrupirani niz) ako je npr. a = 3 . Rjeenje 3.6: a) Da bi se dokazalo 1. svojstvo da se aritmetika sredina nalazi izmeu najvee i najmanje vrijednosti obiljeja, treba izraunati X , x min i x max . Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Prosjena ocjena u srednjoj koli se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati Minimum, Maximum i Mean. Dalje je potrebno kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.7. Tablica 3.7.
Statistics Prosjecna ocjena u srednjoj skoli N Valid 238 Missing Mean Minimum Maximum 1 4,1773 2,00 5,00

Izvor: Simulirani podaci.

Iz podataka u tablici 3.7. vidi se da je aritmetika sredina 4,1773 i vrijedi da je izmeu najmanje (2) i najvee (5) vrijednosti obiljeja: 2 4,1773 5 .

115

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

b) Da bi se dokazalo 2. svojstvo aritmetike sredine da je zbroj odstupanja vrijednosti obiljeja od prosjeka jednak 0, potrebno je formirati novi stupac (varijablu) gdje e se izraunati ta odstupanja. Zbroj svih podataka iz tog novog stupca mora biti 0. Na glavnom izborniku potrebno je odabrati Transform, a na njegovu padajuem izborniku se bira Compute. Na taj nain se otvori prozor Compute Variable koji je prikazan na slici 3.3. Slika 3.3. Prozor "Compute Variable" gdje se raunaju odstupanja od prosjeka kao nova varijabla v3

Izvor: Simulirani podaci.

Pod Target Variable upisuje se novo ime v3, a u Numeric Expression se upisuje: v 2 4,773 , odnosno da se od svih vrijednosti varijable v2 oduzme njihov prosjek 4,773. Potrebno je napomenuti da se decimalni zarez u programu SPSS oznaava tokom. Klikom na OK u prostoru Data View formira se nova varijabla v3.
116

Srednje vrijednosti

Da bi se vidio zbroj podataka u stupcu na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njenzinu padajuem izborniku Descriptive Statistics i Descriptives. Varijabla v3 prebacuje se u Variable(s). U Options potrebno je aktivirati Sum (dok se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne). Tablica 3.8. Zbroj odstupanja vrijednosti obiljeja od prosjeka
Descriptive Statistics N v3 Valid N (listwise) 238 238 Sum ,00

Izvor: Simulirani podaci.

Suma vrijednosti novoformirane varijable v3 u zadnjem stupcu tablice 3.8 je 0, ime je dokazano 2. svojstvo aritmetike sredine. Da bi se dokazalo 3. svojstvo aritmetike sredine da je zbroj kvadrata odstupanja vrijednosti obiljeja od prosjeka manje ili jednako zbroju kvadrata odstupanja vrijednosti obiljeja od bilo kojeg drugog broja, npr. 3, potrebno je formirati nove stupce gdje e se izraunati ti kvadrati odstupanja. Usporedbom zbroja tih stupaca dokazat e se svojstvo 3. Na glavnom izborniku potrebno je odabrati Transform, a na njegovu padajuem izborniku bira se Compute. Na taj nain se otvori prozor Compute Variable.
c)

Pod Target Variable upisuje se novo ime v4, a u Numeric Expression se upisuje: (v 2 4,773) * *2 , odnosno da se od svih vrijednosti varijable v2 oduzme njihov prosjek 4,773 i sve se kvadrira. Potrebno je napomenuti da se potencija u programu SPSS oznaava dvjema zvjezdicama. Klikom na OK u prostoru Data View formira se nova varijabla v4. Zatim se ponovo u Target Variable upisuje novo ime v5, a u Numeric Expression se upisuje: (v 2 3) * *2 , odnosno od svih se vrijednosti varijable v2 oduzme 3 i sve se kvadrira. Klikom na OK u prostoru Data View formira se nova varijabla v5. Da bi se vidio zbroj podataka u ova dva nova stupca v4 i v5 na glavnom izborniku, potrebno je izabrati ikonu Analyze, a na njezinu

117

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

padajuem izborniku Descriptive Statistics i Descriptives. Varijable v4 i v5 prebacuju se u Variable(s). U Options potrebno je aktivirati Sum (dok se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne). Tablica 3.9. Zbroj kvadrata odstupanja vrijednosti obiljeja od prosjeka i od vrijednosti 3
Descriptive Statistics N v4 v5 Valid N (listwise) 238 238 238 Sum 103,84 433,72

Izvor: Simulirani podaci.

Sume vrijednosti novoformiranih varijabli v4 i v5 prikazane su u zadnjem stupcu tablice 3.9, ime je dokazano 3. svojstvo aritmetike sredine, tj. da je: ( x i X ) 2 ( x i a ) 2 , odnosno da je: 103,84 433,72 .
i =1 i =1 N N

3.6. Harmonijska sredina Harmonijska sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu. Harmonijska sredina je reciprona vrijednost aritmetike sredine recipronih vrijednosti numerikog obiljeja u jednom nizu. Ako se radi o negrupiranom statistikom numerikom nizu, rauna se jednostavna harmonijska sredina:
H = N 1 i =1 xi
N

(3.7)

Ako se radi o grupiranom statistikom numerikom nizu, rauna se sloena ili vagana harmonijska sredina:

118

Srednje vrijednosti
k

H =

f i i =1 xi

i =1 k

fi

(3.8)

Ponderi su i ovdje apsolutne frekvencije. Ako su veliine razreda razliite od 1, i za harmonijsku sredinu se radi aproksimacija na nain da se raunaju sredine razreda xi. Harmonijska sredina rijetko se primjenjuje u praksi. Specifino podruje njezine primjene je izraunavanje srednjih vrijednosti relativnih brojeva koordinacije. Relativni brojevi koordinacije (Ri), kako je ve reeno, pokazuju odnos dviju pojava koje ima smisla usporeivati (Ai i Bi).
Ri = Ai Bi

(3.9)

Openito srednja vrijednost relativnih brojeva koordinacije je omjer zbroja svih vrijednosti veliine koja se usporeuje ( Ai ) i
i =1 k

zbroja svih vrijednosti veliine s kojom se usporeuje veliina iz brojnika ( Bi ):


i =1 k

R=

i =1 k i =1

Ai Bi

(3.10)

Katkada u konkretnom statistikom istraivanju nisu dostupni podaci o veliinama sadranim u relativnom broju koordinacije, pa su pri izraunavanju njegove srednje vrijednosti mogue 3 situacije: a) Ako su dostupni podaci o relativnom broju koordinacije (Ri) i o veliini s kojom se usporeuje veliina iz brojnika (Bi), srednja e se vrijednost ( R ) izraunati pomou izraza za sloenu ili vaganu aritmetiku sredinu:

119

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA


k

R=

i =1 k

Ri Bi
i =1

(3.11)

Bi

Na temelju osnovne relacije (3.10) jasno je da vrijedi da je veliina iz brojnika: Ai = Ri Bi . Ponderi su ovdje vrijednosti
i =1 i =1 k k

veliine s kojom se usporeuje veliina iz brojnika: Bi. b) Ako su dostupni podaci o relativnom broju koordinacije (Ri), bez informacija o veliinama u brojniku (Ai) i nazivniku (Bi), srednju vrijednost R nije mogue izraunati. Pokuaj aproksimacije ove srednje vrijednosti ne daje vjerodostojan rezultat. c) Ako su dostupni podaci o relativnom broju koordinacije (Ri) i o veliini koja se usporeuje (Ai), srednja e se vrijednost ( R ) izraunati pomou izraza za sloenu ili vaganu harmonijsku sredinu:
R=
i =1 k A i

Ai

(3.12)

i =1 Ri

Na temelju osnovne relacije (3.10) jasno je da vrijedi da je veliina iz nazivnika: Bi = Ai Ri . Ponderi su ovdje vrijednosti
i =1 i =1 k k

veliine koja se usporeuje iz brojnika: Ai. Analitiki primjer 3.7. Za nekoliko odabranih fakulteta u RH dani su podaci o broju studenata i broju studenata po 1 nastavniku u akademskoj godini 2004/05. Zadatak je izraunati prosjean broj studenata po 1 nastavniku za sve promatrane fakultete zajedno, odnosno prosjek relativnih brojeva koordinacije ( R ).

120

Srednje vrijednosti

Tablica 3.10. Broj studenata i broj studenata po 1 nastavniku u nekim odabranim fakultetima u RH u akademskoj godini 2004/05.
Fakulteti Broj studenata (Ai) Broj studenata po 1 nastavniku (Ri) Broj nastavnika (Ai/Ri)=Bi

PMF 3562 8,62469734 413 Graevinski fakulteti 2761 9,17275748 301 Fakult. el. stroj. i brod. 7704 10,1102362 762 Medicinski fakulteti 3315 3,64285714 910 Ekonomski fakulteti 14247 33,0556845 431 31589 64,6062326 2817 Ukupno: Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 492, 495, 496, 497.

Rjeenje 3.7: S obzirom na to da je u navedenom primjeru poznata (Ai) veliina koja se usporeuje i relativni brojevi koordinacije (Ri), njihov se prosjek rauna pomou izraza za sloenu ili vaganu harmonijsku sredinu gdje su ponderi (Ai):
H=
i =1

fi
k

fi i =1 x i

R=

i =1

Ai
k

Ai i =1 Ri

31589 = 11,214 . 2817

Prosjean broj studenata po jednom nastavniku za sve promatrane fakultete u akademskoj godini 2004/05. zajedno iznosi 11,214 studenata po nastavniku. 3.5. Medijan Medijan je vrijednost statistikog obiljeja koja ureeni statistiki niz dijeli na dva jednakobrojna dijela. Medijan se moe primijeniti na redoslijedne i kvantitativne statistike nizove, a spada u poloajne srednje vrijednosti. Medijan se ne primjenjuje kod nominalnih nizova jer poredak oblika ovog obiljeja moe biti proizvoljan.

121

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja), medijan je vrijednost obiljeja koja pripada elementu statistikog niza koji se nalazi u sredini niza. Ako je broj elemenata statistikog niza paran, onda se za medijan uzima jednostavan prosjek vrijednosti obiljeja dvaju lanova koji se nalaze na sredini statistikog niza. Ako je statistiki niz grupiran u razrede, prije raunanja medijana potrebno je izraunati frekvencije kumulativnog niza "manje od" ili "vie od", te se u takvom nizu trai sredinji lan. Ako se raunaju frekvencije kumulativnog niza "manje od", trai se prva frekvencija niza koja sadri N 2 . Razred koji odgovara ovoj frekvenciji kumulativnog niza "manje od" je medijalni razred. Ako su veliine razreda obiljeja jednake 1, vrijednost obiljeja koja odgovara odabranoj frekvenciji kumulativnog niza je medijan. Ako su veliine razreda obiljeja razliite od 1, medijan se rauna po izrazu:
N m fi 2 i =1 i , Me = L1 + f med

(3.13)

gdje je:
L1 - donja prava ili precizna granica medijalnog razreda N 2 - polovica elemenata statistikog niza
i =1

f i - zbroj svih apsolutnih frekvencija do medijalnog razreda, ne

ukljuujui medijalni razred (tj. kumulativna frekvencija ispred kumulativne frekvencije medijalnog razreda)
f med - apsolutna frekvencija medijalnog razreda i - veliina medijalnog razreda.

122

Srednje vrijednosti

Analitiki primjer 3.8. Statistiki skup "Sklopljeni brakovi u RH u 2002. godini" prema kontinuiranom numerikom obiljeju "dob nevjeste", prikazan je u tablici 3.3. Zadatak je izraunati medijan, odnosno dob nevjeste koja promatrani statistiki niz dijeli na dva jednaka dijela. Tablica 3.11. Sklopljeni brakovi u RH u 2004. godini prema nevjestinoj dobi
Nevjestina dob Sklopljeni brakovi Kumulativni niz "manje od" Veliine razreda

Xi fi i 15-20 1903 1903 5 20-25 8104 10007 5 25-30 7335 17342 5 30-35 2820 20162 5 35-45 1516 21678 10 45-(80) 894 22572 35 Ukupno: 22572 Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 124.

Rjeenje 3.8. U tablici 3.11 vidi se da grupirani niz ima veliine razreda razliite od 1. Stoga je za izraunavanje medijana potrebno odrediti frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju apsolutne frekvencije odozgo prema dolje. Trai se prva frekvencija kumulativnog niza koja u sebi sadri: N 2 = 22572 2 = 11286 jedinicu. To je frekvencija 17342, a razred koji odgovara toj frekvenciji je medijalni razred. Njegova donja granica je L1 = 25 .
N m fi 2 i =1 i = 25 + 11286 10007 5 = 25,87 godina Me = L1 + f med 7335

Dakle, kod polovice sklopljenih brakova u Republici Hrvatskoj u 2002. godini nevjesta je bila mlaa od 25,87 godina, dok je kod preostale polovice brakova nevjesta bila starija od 25,87 godina.
123

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U statistikim distribucijama postoji samo jedan medijan i on se nalazi izmeu najvee i najmanje vrijednosti obiljeja. Prednost medijana je da na njega ne utjeu ekstremno male ili velike vrijednosti obiljeja, pa je primjerena srednja vrijednost i kod izrazito asimetrinih distribucija. 3.5.1. Kvantili Kvantili su vrijednosti statistikog obiljeja koje ureeni statistiki niz dijele na q jednakobrojnih dijelova. Kod analize statistikih nizova vrlo su esto u upotrebi kvartili. Kvartili su vrijednosti statistikog obiljeja koje statistiki niz dijele na 4 jednakobrojna dijela. Kvartili se mogu podijeliti: na a) donji kvartil (Q1) i na b) gornji kvartil (Q3)4 . Donji kvartil dijeli ureeni statistiki niz na etiri jednaka dijela u omjeru 1:3, odnosno 25% elemenata statistikog skupa ima vrijednost obiljeja manju ili jednaku donjem kvartilu, a 75% elemenata statistikog skupa ima vrijednost obiljeja veu od donjeg kvartila. Gornji kvartil dijeli ureeni statistiki niz na etiri jednaka dijela u omjeru 3:1, odnosno 75% elemenata statistikog skupa ima vrijednost obiljeja manju ili jednaku donjem kvartilu, a 25% elemenata statistikog skupa ima vrijednost obiljeja veu od gornjeg kvartila. Kvartili se, slino kao i medijan, mogu primijeniti na redoslijedne i kvantitativne statistike nizove, a odreuju se poloajem u nizu. Ni oni se ne primjenjuju kod nominalnih nizova jer, kako je ve naglaeno, poredak oblika ovog obiljeja moe biti proizvoljan.

Vrijedi da je medijan: Me = Q2 .

124

Srednje vrijednosti

Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja), donji kvartil je vrijednost obiljeja koja pripada elementu statistikog niza iji rang (r), tj. mjesto u nizu odgovara:
Q1 = xr , gdje je r = INT ( N 4) + 1 , ako N nije djeljiv s 4;
Q1 =
5

xr + xr +1 , gdje je r = N 4 , (r + 1) = N 4 + 1 , ako je N djeljivo 2

s 4, rauna se prosjek obiljeja koji se nalaze na mjestu u nizu: r i (r + 1) . Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja), gornji kvartil je vrijednost obiljeja koja pripada elementu statistikog niza iji rang, tj. mjesto u nizu odgovara:
Q3 = xr , gdje je r = INT (3 N 4) + 1 , ako N nije djeljiv s 4;
Q3 = xr + xr +1 , gdje je r = 3N 4 , (r + 1) = 3 N 4 + 1 , ako je N 2

djeljivo s 4, rauna se prosjek obiljeja koji se nalaze na mjestu u nizu: r i (r + 1) . Ako je statistiki niz grupiran u razrede, prije raunanja kvartila potrebno je izraunati frekvencije kumulativnog niza "manje od" ili "vie od", te se u takvom nizu trai odgovarajui lan. Ako se raunaju frekvencije kumulativnog niza "manje od", za donji kvartil se trai prva frekvencija niza koja sadri N 4 . Za gornji kvartil se trai prva frekvencija niza koja sadri 3 N 4 . Razred koji odgovara odabranoj frekvenciji kumulativnog niza "manje od" je razred donjeg, odnosno gornjeg kvartila. Ako su veliine razreda obiljeja jednake 1, vrijednost obiljeja koja odgovara odabranoj frekvenciji kumulativnog niza je donji, odnosno gornji kvartil. Ako su veliine razreda obiljeja razliite od 1, donji kvartil se rauna po izrazu:
5

INT predstavlja cijeli dio decimalnog broja dobivenog dijeljenjem (eng. integer). npr.
INT (6,3) = 6, INT (6,7) = 6.

125

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

N q fi Q1 = L1 + 4 i =1 i , f k var t

(3.14)

gdje je:
L1 - donja prava ili precizna granica donje kvatilnog razreda N 4 - etvrtina elemenata statistikog niza f i - zbroj svih apsolutnih frekvencija do donje kvartilnog razreda, ne
q

i =1

ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne frekvencije donje kvartilnog razreda)
f k var t - apsolutna frekvencija donje kvartilnog razreda
i - veliina kvartilnog razreda.

Ako su veliine razreda obiljeja razliite od 1, gornji kvartil se rauna po izrazu:


3N q fi Q3 = L1 + 4 i =1 i , f k var t

(3.15)

gdje je:
L1 - donja prava ili precizna granica gornje kvatilnog razreda 3N 4 - tri etvrtine elemenata statistikog niza f i - zbroj svih apsolutnih frekvencija do gornje kvartilnog razreda, ne
q

i =1

ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne frekvencije gornje kvartilnog razreda)
f k var t - apsolutna frekvencija gornje kvartilnog razreda
i - veliina kvartilnog razreda.

Sve srednje vrijednosti se, uz prikazane izraune pomou apsolutnih frekvencija, na isti nain mogu raunati koritenjem relativnih frekvencija (proporcija i postotaka).
126

Srednje vrijednosti

Analitiki primjer 3.9. Statistiki skup "sklopljeni brakovi u RH u 2002. godini" prema kontinuiranom numerikom obiljeju "nevjestina dob", prikazan je u tablici 3.12 (ve je prezentiran u analitikom primjeru 3.8). Zadatak je izraunati donji i gornji kvartil. Tablica 3.12. Sklopljeni brakovi u RH u 2004. godini prema nevjestinoj dobi
Nevjestina dob Sklopljeni brakovi Kumulativni niz "manje od" Veliine razreda

Xi fi i 15-20 1903 1903 5 20-25 8104 10007 5 25-30 7335 17342 5 30-35 2820 20162 5 35-45 1516 21678 10 45-(80) 894 22572 35 Ukupno: 22572 Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 124.

Rjeenje 3.9. U tablici 3.12 vidi se da grupirani niz ima veliine razreda razliite od 1. Stoga je za izraunavanje kvartila potrebno odrediti frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju apsolutne frekvencije odozgo prema dolje. Za donji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
N 22572 = = 5643 jedinice. 4 4

To je frekvencija 10007, a

razred koji odgovara toj frekvenciji je donje kvarilni razred. Njegova donja granica je L1 = 20 .
N q fi 4 i =1 i = 20 + 5643 1903 5 = 22,31 godina Q1 = L1 + f k var t 8104

Dakle, kod jedne etvrtine (tj. 25%) sklopljenih brakova u R. Hrvatskoj u 2002. godini nevjesta je bila mlaa od 22,31 godine, dok je

127

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

kod preostale tri etvrtine (tj. 75%) brakova nevjesta bila starija od 22,31 godine. Za gornji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
3N 3 22572 = = 16929 jedinica. To je frekvencija 17342, a 4 4

razred koji odgovara toj frekvenciji je gornje kvarilni razred. Njegova donja granica je L1 = 25 .
3N q fi 16929 10007 = L1 + 4 i =1 i = 25 + 5 = 27,72 godina Q3 f k var t 7335

Dakle, kod tri etvrtine (tj. 75%) sklopljenih brakova u R. Hrvatskoj u 2002. godini nevjesta je bila mlaa od 29,48 godina, dok je kod preostale etvrtine (tj. 25%) brakova nevjesta bila starija od 29,48 godina.

Analitiki primjer 3.10. Za varijablu (obiljeje) teina u kg (v2) potrebno je odrediti: a) b) c) d) e) f) Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Medijan; Donji i gornji kvartil; Komentirati rezultate! Rjeenje 3.10: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - teina u kg se prebacuje u polje Variable(s).
128

Srednje vrijednosti

Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v2). Da bi se u izlaznim rezultatima dobile najmanja i najvea vrijednost niza, u spomenutom se prozoru aktivira Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Medijan se dobije aktiviranjem Median, a donji i gornji kvartil oznaavanjem Quartiles. Prozor Frequencies Statistics s potrebnim aktiviranim veliinama prikazan je na slici 3.4. Slika 3.4. Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim veliinama

Izvor: Simulirani podaci.

Da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.13. Prema tim podacima moe se vidjeti da je 324 ispitanika dalo odgovor o svojoj teini, dok ih 5 nije odgovorilo na to pitanje. Prosjena teina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 67,18 kg.

129

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 3.13. Statistiki podaci o teini ispitanika


Statistics Tezina u kg N Mean Median Mode Minimum Maximum Percentiles 25 50 75 Valid Missing 234 5 67,1795 64,0000 52,00 46,00 110,00 56,0000 64,0000 75,0000

Izvor: Simulirani podaci.

Medijan, odnosno teina koja odabrani uzorak dijeli na 2 jednakobrojna dijela je Me = 64 kg , to znai da je polovica ispitanika imala teinu manju ili jednaku 64 kg, dok je preostala polovica ispitanika imala teinu veu od 64 kg. Mod, odnosno najea teina ispitanika je 52 kg. Najmanja teina ispitanika u uzorku je 46 kg. Najvea teina ispitanika u uzorku je 110 kg. Donji i gornji kvartil dani su meu Percentiles. Donji kvaril Q1 = 56 kg , to znai da je etvrtina ispitanika imala teinu manju ili jednaku 56 kg, dok je preostalih tri etvrtine ispitanika imalo teinu veu od 56 kg. Gornji kvaril Q3 = 75 kg , to znai da je tri etvrtine ispitanika imalo teinu manju ili jednaku od 75 kg, dok je preostala etvrtina ispitanika imala teinu veu od 75 kg.

Analitiki primjer 3.11. Za varijablu (obiljeje) dobiveni deparac (v3) potrebno je odrediti:

130

Srednje vrijednosti

a) b) c) d) e) f)

Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Medijan; Donji i gornji kvartil; Komentirati rezultate! Rjeenje 3.11:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - Koliki deparac dobivate prebacuje se u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu deparca (v3). Da bi se u izlaznim rezultatima dobile najmanja i najvea vrijednost niza, u spomenutom prozoru aktivira se Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Medijan se dobije aktiviranjem Median, a donji i gornji kvartil oznaavanjem Quartiles. Da bi se u Outputu programa SPSS dobili eljeni podaci o deparcu ispitanika potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.14. Prema podacima iz tablice 3.14 moe se vidjeti da je 173 ispitanika dalo odgovor o svom deparcu, dok ih 66 nije odgovorilo na to pitanje. Prosjeni deparac ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 371,55 kn. Medijan, odnosno deparac koji odabrani uzorak dijeli na 2 jednakobrojna dijela je Me = 300 kn , to znai da je polovica ispitanika imala deparac manji ili jednak 300 kn, dok je preostala polovica ispitanika imala deparac vei od 300 kn.

131

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 3.14. Statistiki podaci o deparcu ispitanika


Statistics Koliki dzeparac dobivate N Valid Missing Mean Median Mode Minimum Maximum Percentiles 25 50 75 173 66 371,5491 300,0000 200,00(a) ,00 3500,00 150,0000 300,0000 500,0000

a Multiple modes exist. The smallest value is shown

Izvor: Simulirani podaci.

Mod, odnosno najei deparac ispitanika je 200 kn. Moe se vidjeti napomena ispod tablice koja se odnosi na mod. Zadana distribucija uzorka ima vie od 1 moda, a u tablici Outputa dana je najmanja vrijednost. Ako se u Outputu jo zatrai i prikaz tablice frekvencija (aktivira se Display frequency tables), moe se vidjeti da je 26 ispitanika imalo deparac od 200 kn i a da ih je isto toliko imalo deparac od 300 kn. Dakle ovo je jedna bimodalna distribucija. Jedan mod je 200 kn, a drugi mod je 300 kn. Najmanji deparac ispitanika u uzorku je 0,00 kn. Najvei deparac ispitanika u uzorku je 3500,00 kn. Donji i gornji kvartil dani su meu Percentiles. Donji kvaril
Q1 = 150 kn , to znai da je etvrtina ispitanika imala deparac manji od

500 kn ili jednak tom iznosu, dok je preostalih tri etvrtine ispitanika imalo deparac vei od 150 kn. Gornji kvaril Q3 = 500 kn , to znai da je tri etvrtine ispitanika imalo deparac manji od 500 kn ili jednak tom iznosu, dok je preostala etvrtina ispitanika imala deparac vei od 500 kn.

132

Mjere disperzije, asimetrija i zaobljenost

4. MJERE DISPERZIJE, ASIMETRIJA I ZAOBLJENOST


4.1. Mjere disperzije Moe se dogoditi da neki statistiki skupovi imaju jednake npr. aritmetike sredine, a da su njihovi elementi potpuno razliiti. To znai da je raspored elemenata u tim skupovima razliit. Informaciju o rasporedu elemenata daju mjere rasprenosti ili disperzije elemenata numerikog statistikog niza. Postoje apsolutne i relativne mjere rasprenosti. Apsolutni pokazatelji izraeni su u originalnim jedinicama mjere i omoguavaju usporedbu nizova prema istom obiljeju. Apsolutni pokazatelji rasprenosti su: raspon varijacije, interkvartil, varijanca i standardna devijacija. Usporedbu rasprenosti elemenata nizova s razliitom mjernom jedinicom omoguuju relativni pokazatelji, koji su najee izraeni u postotcima. Relativni pokazatelji rasprenost su: koeficijent kvartilne devijacije i koeficijent varijacije. 4.1.1. Apsolutne mjere disperzije Raspon varijacije je najjednostavnija mjera disperzije, a predstavlja razliku izmeu najvee i najmanje vrijednosti numerikog obiljeja promatranog niza.
R = xmax xmin

(4.1)

Ovaj apsolutni pokazatelj rasprenosti izraen je u originalnim jedinicama mjere numerikog obiljeja. Moe poprimiti vrijednost 0. To se dogaa kada svi elementi niza imaju jednaku vrijednost obiljeja.

133

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Najvea vrijednost toga pokazatelja nije ograniena jer ona ovisi o konkretnoj rasprenosti promatranih vrijednosti obiljeja. Raspon varijacije je nepotpuna mjera disperzije jer se rauna samo na temelju dvije vrijednosti obiljeja, odnosno na temelju najvee i najmanje vrijednosti. Moe se rei da to nije precizna mjera rasprenosti elemenata niza, pogotovo u sluaju postojanja ekstremno malih i/ili ekstremno velikih vrijednosti obiljeja. Tada se dobije veliki raspon varijacije, a moda je veina elemenata skupa rasprena usko oko srednjih vrijednosti. Taj problem interkvartil. preciznosti rjeava interkvartilni raspon ili

Interkvartil je apsolutna, nepotpuna mjera rasprenosti koja pokazuje disperziju srednjih 50% elemenata ureenoga numerikog niza.
I q = Q3 Q1

(4.2)

Interkvartil predstavlja razliku gornjeg i donjeg kvartila. Na taj nain se eliminira 25% ekstremno malih i 25% ekstremno velikih vrijednosti obiljeja u nizu. Slika 4.1. Simetrina distribucija s oznaenim gornjim i donjim kvartilom
fi

50% 25% 25%

Q1 Izvor: Konstrukcija autora.

Q3

xi

Slika 4.1. prikazuje jednu simetrinu distribuciju gdje su elementi skupa ravnomjerno rasporeeni oko srednjih vrijednosti. Poznato je da
134

Mjere disperzije, asimetrija i zaobljenost

donji kvartil (Q1) dijeli distribuciju u omjeru 1:3, tj. da 25% elemenata skupa ima vrijednost obiljeja manju od donjeg kvartila, a 75% elemenata skupa ima vrijednost obiljeja veu od donjeg kvartila. Isto tako gornji kvartil (Q3) dijeli distribuciju u omjeru 3:1, tj. da 75% elemenata skupa ima vrijednost obiljeja manju od gornjeg kvartila, a 25% elemenata skupa ima vrijednost obiljeja veu od gornjeg kvartila. Na taj nain interkvartil pokazuje disperziju srednjih 50% elemenata skupa. Varijanca spada u potpune mjere rasprenosti jer obuhvaa sve elemente odabranoga numerikog statistikog niza. Ovaj pokazatelj mjeri odstupanja, tj. rasprenost elemenata skupa od aritmetike sredine. S obzirom na poznato svojstvo aritmetike sredine da je zbroj odstupanja vrijednosti obiljeja od aritmetike sredine u jednoj distribuciji uvijek nula, tj. da je: ( xi X ) = 0 (za negrupirani niz) i
i =1 N

i =1

f i ( xi X ) = 0 (za grupirani niz), varijanca se izraava preko kvadrata

ovih odstupanja. Varijanca je prosjeno kvadratno odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.
2 =
i =1

xi X N

i =1

xi N

X2,

(4.3)

za negrupirani niz i
2 =
i =1

f i xi X
i =1

fi

i =1 k

2 f i xi

X2,

(4.4)

i =1

fi

za grupirani niz. Varijanca je mjera rasprenosti izraena u drugom stupnju, pa kao rezultat daje jedinice mjere numerikog obiljeja na kvadrat. Stoga je oteana njezina interpretacija. Standardna devijacija je pozitivan korijen iz varijance i izraena je u originalnim jedinicama mjere. Stoga je kao potpuna i

135

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

apsolutna mjera disperzije vrlo esto u upotrebi. Moe se definirati kao prosjeno odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.
=+ 2 =+
i =1

(xi X )
N

=+

i =1

xi N

X2 ,

(4.5)

za negrupirani niz.
=+ =+
2 i =1

f i (x i X )
k i =1

fi

=+

i =1 k

f i xi
i =1

X2 ,

(4.6)

fi

za grupirani niz. Pomou standardne devijacije u originalnim mjernim jedinicama obiljeja moe se usporeivati rasprenost oko aritmetike sredine nizova koji su grupirani po jednakom obiljeju. Analitiki primjer 4.1. Zadan je statistiki numeriki niz "Zaposleni u sektoru Obrazovanje u RH prema dobi, stanje 31. oujka 2004. god.". Zadatak je izraunati raspon varijacije obiljeja, interkvartil, varijancu i standardnu devijaciju vrijednosti ovog obiljeja. Tablica 4.1. Zaposleni u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god.
Dob xi Br. zaposlenih fi Kum.niz "<" Veli. razreda i

(18)-30 30-35 35-40 40-45 45-50 50-55 55-60 60-(70) Ukupno:

10172 11082 12430 14130 12830 12040 10039 5990 88713

9779 20861 33291 47421 60251 72291 82330 88320 -

12 5 5 5 5 5 5 10 -

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 144.

136

Mjere disperzije, asimetrija i zaobljenost

Rjeenje 4.1: Raspon varijacije obiljeja:


R = x max x min = 70 18 = 52 godine

Raspon varijacije ovog numerikog obiljeja dobije se kao razlika najvee i najmanje vrijednosti obiljeja, a iznosi 52 godine. Interkvartil: U tablici 4.1. prikazan je grupirani niz koji ima veliine razreda razliite od 1. Stoga je za izraunavanje kvartila potrebno odrediti frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju apsolutne frekvencije odozgo prema dolje. Za donji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
N 88713 = = 22178,25 jedinica. To je frekvencija 33291, a razred 4 4

koji odgovara toj frekvenciji je donje kvarilni razred. Njegova donja granica je L1 = 35 .
N q fi 22178,25 20861 5 = 35,53 Q1 = L1 + 4 i =1 i = 35 + 12430 f k var t

Dakle, jedna etvrtina (tj. 25%) zaposlenih u Obrazovanju u Republici Hrvatskoj u 2004. godini je bilo mlae od 35,53 godina, dok je preostalih tri etvrtine zaposlenih (tj. 75%) bilo starije od 35,53 godina. Za gornji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
3 N 3 88713 = = 66534,75 jedinica. To je frekvencija 72291, 4 4

a razred koji odgovara toj frekvenciji je gornje kvarilni razred. Njegova donja granica je L1 = 50 .
3N q fi 4 i =1 i = 50 + 66534,75 60251 5 = 52,61 Q3 = L1 + 12040 f k var t

137

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Dakle, tri etvrtine (tj. 75%) zaposlenih u Obrazovanju u R Hrvatskoj u 2002. godini je bilo mlae od 52,61 godina, dok je preostala etvrtina zaposlenih (tj. 25%) bilo starije od 52,61 godina. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 52,61 35,53 = 17,08 godina

Dakle, dob srednjih 50% zaposlenih u Obrazovanju u ovoj distribuciji varira u rasponu od 17,08 godina. Da bi se izraunala varijanca i standardna devijacija vrijednosti ovog obiljeja, prikazani su podaci u tablici 4.2. Tablica 4.2. Zaposleni u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god.
Dob xi Broj zaposlenih fi Sredina razreda xi
f i xi
f i ( xi X ) 2 f i xi 2

(18)-30 30-35 35-40 40-45 45-50 50-55 55-60 60-(70) Ukupno:

10172 11082 12430 14130 12830 12040 10039 5990 88713

24 32,5 37,5 42,5 47,5 52,5 57,5 65 -

244128 360165 466125 600525 609425 632100 577242,5 389350 3879061

3958060 5859072 1396576 11705363 481817,8 17479688 21236,85 25522313 182743,2 28947688 926886,1 33185250 1904643 33191444 2710985 25307750 11582947 181198566

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 144.

Zadatak je izraunati varijancu i standardnu devijaciju vrijednosti zadanog obiljeja. Ovo je grupirani niz. Varijanca i standardna devijacija raunaju se po izrazima od (4.3) do (4.6). Najprije je potrebno izraunati sloenu aritmetiku sredinu za negrupirane nizove.
X=
i =1 k

f i xi
i =1

fi

3879061 = 43,726 godina 88713

138

Mjere disperzije, asimetrija i zaobljenost

Dakle, prosjena dob zaposlenih u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god., 43,726 je godina. Varijanca je:
2 = i =1
f i (xi X )
k i =1 2

fi

11582947 2 = 130,57 godina . 88713


k 2

Vrijednosti iz brojnika, f i (xi X ) , u izrazu za varijancu su


i =1

izraunate u 5. stupcu tablice, a njihova suma je dana u zbirnom retku. Isti rezultat se moe dobiti i preko izvedene formule za varijancu grupiranih nizova (4.6):
=
2 i =1 k

f i xi
i =1

X2 =

fi

181198566 2 43,726 2 = 130,57 godina . 88713

Zbroj fi xi 2 dan je u tablici 4.2. u posljednjem retku. Varijanca je mjera rasprenosti vrijednosti obiljeja u drugom stupnju pa je izraena u jedinicama mjere na kvadrat. Dalje se rauna standardna devijacija koja se izraava u originalnim mjernim jedinicama. Standardna devijacija je pozitivan korijen iz varijance:
= + 2 = + 130,57 = 11,43 godina.

Dakle, prosjeno odstupanje vrijednosti ovog numerikog obiljeja od aritmetike sredine je 11,43 godina. 4.1.2. Relativne mjere disperzije Koeficijent varijacije spada u potpune relativne mjere rasprenosti jer obuhvaa sve elemente odabranog numerikoga statistikog niza, a izraava se u postotcima (%). Koeficijent varijacije je postotak standardne devijacije od aritmetike sredine.

139

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

V =

100 .

(4.7)

Vrijednost koeficijenta varijacije se kree u intervalu 0 V < + . Vrijednost od 0% e poprimiti samo u sluaju kada su sve vrijednosti numerikog obiljeja u jednom nizu jednake, odnosno kada nema disperzije. Vea vrijednost ovog pokazatelja upuuje na veu disperziju elemenata promatranog niza. Taj pokazatelj rasprenosti je izraen u postotcima, pa omoguuje usporedbu disperzije numerikih nizova s razliitim jedinicama mjere. Koeficijent kvartilne devijacije je relativna nepotpuna mjera rasprenosti. Predstavlja relativnu disperziju srednjih 50% elemenata numerikog niza. Rauna se na temelju samo dviju vrijednosti obiljeja, a to su donji i gornji kvartil.
Vq = Q3 Q1 Q3 + Q1

(4.8)

Koeficijent kvartilne devijacije se rauna kao omjer interkvarila (razlika kvartila) i zbroja donjeg i gornjeg kvartila. Vrijedi da je:
0 Vq < 1

(4.9)

Ovaj pokazatelj je jednak 0 samo kada nema disperzije. Ako se njegova vrijednost pribliava 1, to znai da je rasprenost vrijednosti obiljeja vea. S obzirom na to da je to relativni pokazatelj, pomou njega je mogue usporeivati rasprenost srednjih 50% elemenata razliitih numerikih distribucija s razliitim jedinicama mjere. Analitiki primjer 4.2. Prema podacima o statistikom numerikom nizu "Zaposleni u sektoru Obrazovanje u RH prema dobi, stanje 31. oujka 2004. god.", koji su dani u analitikom primjeru 4.1., zadatak je izraunati koeficijent varijacije i koeficijent kvartilne devijacije.

140

Mjere disperzije, asimetrija i zaobljenost

Rjeenje 4.2: Koeficijent varijacije:


V=

100 =

11,4266 100 = 26,132% 43,72595

Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 26,132%. Koeficijent kvartilne devijacije.
Vq = Iq Q3 Q1 17,08 = = = 0,194 Q3 + Q1 Q3 + Q1 52,61 + 35,53

Dakle, dob srednjih 50% zaposlenih u Obrazovanju u ovoj distribuciji pokazuje slabu rasprenost 0,194 (s obzirom na to da se pokazatelj kree u intervalu izmeu 0 i 1).

Analitiki primjer 4.3. Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti: a) b) c) d) e) f) Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;

g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate!

141

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 4.3: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visine u cm (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.3. Tablica 4.3. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Mean Std. Deviation Variance Range Percentiles 25 50 75 Valid Missing 235 4 175,77 8,749 76,539 52 170,00 174,00 182,00

Izvor: Simulirani podaci.

Prema podacima iz tablice 4.3. moe se vidjeti da je 235 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije odgovorilo na to pitanje. Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 175,77 cm.

142

Mjere disperzije, asimetrija i zaobljenost

Razlika izmeu najvee i najmanje visine ispitanika u uzorku, tj. raspon varijacije obiljeja je 52 cm. Donji i gornji kvartil dani su kao Percentiles. Donji kvaril
Q1 = 170 cm , to znai da je etvrtina ispitanika imala visinu manju od

170 cm ili jednaku toj visinu, dok je preostalih tri etvrtine ispitanika bilo s visinom veom od 170 cm. Gornji kvartil Q3 = 182 cm , to znai da je tri etvrtine ispitanika bilo s visinom manjom od 182 cm ili jednakom toj visini, dok je preostala etvrtina ispitanika imala visinu veu od 182 cm. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 76,539 cm2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 8,749 cm. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 182 170 = 12 cm.

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 12 cm. Koeficijent varijacije je:
V=

100 =

8,749 100 = 4,98% . 175,77

Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 4,98% i upuuje na vrlo malu disperziju i veliku reprezentativnost aritmetike sredine. Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 12 = = = 0,034 . Q3 + Q1 Q3 + Q1 182 + 170

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje izrazito slabu rasprenost 0,034 (s obzirom na to da se pokazatelj kree u intervalu izmeu 0 i 1).

143

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 4.4. Za varijablu (obiljeje) teina u kg (v2) potrebno je odrediti: a) b) c) d) e) f) Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;

g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate! Rjeenje 4.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Teina u kg se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teine u kg (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.4. Prema podacima iz tablice 4.4. moe se vidjeti da je 234 ispitanika dalo odgovor o svojoj teini, dok ih 5 nije odgovorilo na to pitanje.
144

Mjere disperzije, asimetrija i zaobljenost

Prosjena teina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 67,1795 kg. Razlika izmeu najvee i najmanje teine ispitanika u uzorku, tj. raspon varijacije obiljeja je 64 kg. Tablica 4.4. Statistiki podaci o teini ispitanika
Statistics Tezina u kg N Mean Std. Deviation Variance Range Percentiles 25 50 75 Valid Missing 234 5 67,1795 13,52735 182,989 64,00 56,0000 64,0000 75,0000

Izvor: Simulirani podaci.

Donji i gornji kvartil dani su kao Percentiles. Donji kvaril Q1 = 56 kg , to znai da je etvrtina ispitanika imala teinu manju od 56 kg ili jednaku toj teini, dok je preostalih tri etvrtine ispitanika bilo s teinom veom od 56 kg. Gornji kvartil Q3 = 75 kg , to znai da je tri etvrtine ispitanika bilo s teinom manjom od 75 kg ili jednakom tom teinom, dok je preostala etvrtina ispitanika imala teinu veu od 75 kg. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 182,989 kg2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 13,53 kg. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 75 56 = 19 kg.

145

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Dakle, teina srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 19 kg. Koeficijent varijacije je:
V=

100 =

13,52735 100 = 20,136% 67,1795

Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 20,136%. Reprezentativnost je velika, a disperzija mala. Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 19 = = = 0,145 Q3 + Q1 Q3 + Q1 75 + 56

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje slabu rasprenost 0,145.

Analitiki primjer 4.5. Za varijablu (obiljeje) dobiveni deparac (v2) potrebno je odrediti: a) b) c) d) e) f) Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;

g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate! Rjeenje 4.5: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies.
146

Mjere disperzije, asimetrija i zaobljenost

U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Dobiveni deparac se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu dobiveni deparac (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o dobivenom deparcu ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.5. Tablica 4.5. Statistiki podaci o deparcu ispitanika
Statistics Dobiveni dzeparac N Valid Missing Mean Std. Deviation Variance Range Percentiles 25 50 75 173 66 371,5491 401,30549 161046,098 3500,00 150,0000 300,0000 500,0000

Izvor: Simulirani podaci.

Prema podacima iz tablice 4.5. moe se vidjeti da je 173 ispitanika dalo odgovor o svojom deparcu, dok ih 66 nije odgovorilo na to pitanje. Prosjeni deparac ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 371,55 kn. Razlika izmeu najvee i najmanje teine ispitanika u uzorku, tj. raspon varijacije obiljeja je 3500 kn. Donji i gornji kvartil dani su kao Percentiles. Donji kvaril
Q1 = 150 kn , to znai da je etvrtina ispitanika imala deparac manji od

147

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

150 kn ili jednak tom iznosu, dok je preostalih tri etvrtine ispitanika bilo s deparcem veim od 150 kn. Gornji kvartil Q3 = 500 kn , to znai da je tri etvrtine ispitanika bilo s deparcem manjim od 500 kn ili jednakim tom iznosu, dok je preostala etvrtina ispitanika imala deparac vei od 500 kn. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 161046,1 kn2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 401,31 kn. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 500 150 = 350 kn.

Dakle, deparac srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 350 kn. Koeficijent varijacije je:
V=

100 =

401,30549 100 = 108,01% . 371,5491

Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 108,01%, to ukazuje na jako veliku disperziju deparca izmeu promatranih ispitanika i malu reprezentativnost X . Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 350 = = = 0,538 . Q3 + Q1 Q3 + Q1 500 + 150

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje prilinu rasprenost od 0,538.

Analitiki primjer 4.6. Za varijablu (obiljeje) broj djece u obitelji (v2) potrebno je odrediti:

148

Mjere disperzije, asimetrija i zaobljenost

a) b) c) d) e) f)

Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;

g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate! Rjeenje 4.6: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Broj djece u obitelji se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu broj djece u obitelji (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o broju djece u obitelji ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.6. Prema podacima iz tablice 4.6. moe se vidjeti da je 238 ispitanika dalo odgovor o broju djece u obitelji, dok 1 nije odgovorio na to pitanje. Prosjeni broj djece u obitelji ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 2,34. S obzirom na

149

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

to da broj djece spada u diskontinuirana numerika obiljeja, ovaj rezultat se moe komentirati kao prosjeno 2 djece po obitelji ispitanika. Tablica 4.6. Statistiki podaci o broju djece u obitelji ispitanika
Statistics Broj djece u obitelji N Valid Missing Mean Std. Deviation Variance Range Percentiles 25 50 75 238 1 2,34 ,870 ,757 6 2,00 2,00 3,00

Izvor: Simulirani podaci.

Razlika izmeu najveeg i najmanjeg broja djece u obitelji ispitanika u uzorku, tj. raspon varijacije obiljeja je 6 djece. Donji i gornji kvartil dani su kao Percentiles. Donji kvaril Q1 = 2 djece, to znai da je etvrtina ispitanika imala broj djece u obitelji manji od 2 ili jednak 2, dok je preostalih tri etvrtine ispitanika bilo s vie od 2 djece u obitelji. Gornji kvartil Q3 = 3 djece, to znai da je tri etvrtine ispitanika bilo s brojem djece u obitelji manjim od 3 ili jednakim 3, dok je preostala etvrtina ispitanika imala vie od 3 djece u obitelji. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 0,757 djece2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 0,87 djece. Obje vrijednosti se mogu zaokruiti na 1, s obzirom na to da se radi o diskontinuiranom numerikom obiljeju. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 3 2 = 1 dijete.

150

Mjere disperzije, asimetrija i zaobljenost

Dakle, broj djece u obitelji srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 1 djeteta. Koeficijent varijacije je:
V=

100 =

0,870 100 = 37,18% . 2,34

Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 37,18%. Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 1 = = = 0,2 . Q3 + Q1 Q3 + Q1 3 + 2

Dakle, broj djece srednjih 50% ispitanika u ovoj distribuciji pokazuje slabu rasprenost od 0,2. 4.1.3. Momenti numerikih nizova Momenti su prosjena odstupanja vrijednosti numerikog obiljeja od aritmetike sredine ili neke druge vrijednosti podignuti na rtu potenciju. Momenti numerikih nizova mogu biti glavni i pomoni. Glavni ili centralni momenti numerikih nizova su momenti oko aritmetike sredine:
r = i =1
k

(x i X )
N

,
r

r = 0,1,2,...

- za negrupirani niz. (4.9)

r = i =1

f i (x i X )
i =1

fi

r = 0,1,2,...

- za grupirani niz.

(4.10)

Centralni moment nultog reda: 0 = 1 . Centralni moment prvog reda: 1 = 0 .


151

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pomoni momenti numerikih nizova su momenti oko nule6:


mr =
i =1

xi N
k

r = 0,1,2,...

- za negrupirani niz. (4.11)

mr =

i =1 k

r f i xi

r = 0,1,2,...

- za grupirani niz.

(4.12)

i =1

fi

Pomoni moment nultog reda: m0 = 1 . Pomoni moment prvog reda: m1 = X . Centralni momenti oko aritmetike sredine mogu se izraziti preko pomonih momenata. Centralni moment drugog reda:
2 = m 2 m12 .

(4.13)

Centralni moment treeg reda:


3 3 = m3 3m1 m 2 + 2m1 .

(4.14)

Centralni moment etvrtog reda:


4 = m 4 4m3 m1 + 6m 2 m12 3m14 .

(4.15)

4.2. Mjere asimetrije Asimetrija distribucije podrazumijeva nagnutost distribucije na lijevu ili desnu stranu. Pearsonov koeficijent asimetrije je:
3 = 3 , 3

(4.16)

Postoje pomoni momenti i oko neke konstante a.

152

Mjere disperzije, asimetrija i zaobljenost

gdje je:
3 - centralni moment treeg reda, 3 - standardna devijacija na treu potenciju.

Interval u kojem se uobiajeno kree vrijednost tog koeficijenta je: 2 3 2 . U sluaju izrazito asimetrinim distribucijama ovaj koeficijent moe poprimiti i vrijednosti izvan intervala: [ 2,2] . Ako je:
3 = 0 3 > 0 3 < 0

simetrina distribucija pozitivna ili desnostrana asimetrija negativna ili ljevostrana asimetrija.

U programskom paketu SPSS mjera asimetrije ima oznaku Skewness i vrijedi da ako je vrijednost ovog pokazatelja:
=0
>0 <0

simetrina distribucija pozitivna ili desnostrana asimetrija negativna ili ljevostrana asimetrija.

Pearsonova mjera asimetrije, koja se uobiajeno kree u intervalu [ 3,3] , je:


Sk =

( X Mo)

(4.17)

gdje je:
X - aritmetika sredina

Mo - mod

- standardna devijacija.

Za umjereno asimetrine distribucije vrijedi da je Pearsonova mjera asimetrije:

153

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Sk =

3 ( X Me)

(4.18)

gdje je:
X - aritmetika sredina

Me - medijan

- standardna devijacija.

Ako je:
Sk = 0 Sk > 0 Sk < 0

simetrina distribucija pozitivna ili desnostrana asimetrija negativna ili ljevostrana asimetrija.

Odnosi meu srednjim vrijednostima kod razliitih distribucija: a) simetrina distribucija ima jednake aritmetiku sredinu, medijan i mod:
X = Me = Mo .

b) pozitivno ili desnostrano asimetrina distribucija ima aritmetiku sredinu veu od medijana koji je vei od moda:
X > Me > Mo .

c) negativno ili ljevostrano asimetrina distribucija ima aritmetiku sredinu manju od medijana koji je manji od moda:
X < Me < Mo .

Bowleyeva mjera asimetrije (uobiajeno se kree u intervalu [ 1,1] ) zasnovana je na odnosu medijana i kvartila:
S kq = Q3 + Q1 2Me , Q3 Q1

(4.19)

gdje je:
Me - medijan

Q1 - donji kvartil
154

Mjere disperzije, asimetrija i zaobljenost

Q3 - gornji kvartil.

Vrijedi da ako je:


S kq = 0 (Q3 + Q1 ) = 2Me (Q3 Me) = ( Me Q1 ) simetrina distribucija Sk > 0 (Q3 + Q1 ) > 2Me (Q3 Me) > ( Me Q1 )

pozitivna

ili

desnostrana

asimetrija
Sk < 0 (Q3 + Q1 ) < 2 Me (Q3 Me) < ( Me Q1 )

negativna

ili

ljevostrana

asimetrija. Raspored srednjih vrijednosti kod razliitih distribucija prikazan je na slici 4.2. Slika 4.2. Distribucije s razliitom asimetrijom
fi fi fi

X Me Mo
a) Simetrina distribucuja

xi

MoMeX

xi

X MeMo xi

b) Pozitivna ili desnostrana asimetrija

c) Negativna ili ljevostrana asimetrija

Izvor: Konstrukcija autora.

Prikazana su 3 sluaja rasprenosti podataka oko srednjih vrijednosti. Na dijelu slike 4.2. pod (a) prikazana je jedna savreno simetrina distribucija u kojoj su aritmetika sredina (prosjek),

155

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

medijan (vrijednost obiljeja koja skup dijeli na dva jednaka dijela) i mod (najea vrijednost obiljeja koja odgovara vrhu krivulje) u istoj toki, odnosno jednaki: X = Me = Mo . Na dijelu slike pod (b) prikazana je jedna pozitivno ili desnostrano asimetrina distribucija (vidi se rasipanje vrijednosti obiljeja na desnu stranu) u kojoj je aritmetika sredina vea od medijana koji je vei od moda: X > Me > Mo . Na dijelu slike pod (c) prikazana je jedna negativno ili ljevostrano asimetrina distribucija (vidi se rasipanje vrijednosti obiljeja na lijevu stranu) u kojoj je aritmetika sredina manja od medijana koji je manji od moda: X < Me < Mo . 4.3. Mjera zaobljenosti Mjera zaobljenosti distribucije frekvencija:
4 = 4 4

predstavlja

zaobljenost

vrha

krivulje (4.20)

gdje je:
4 - centralni moment etvrtog reda 4 - standardna devijacija na etvrtu potenciju.

Vrijedi da ako je:


4 = 3 4 > 3 4 < 3

normalno zaobljena distribucija iljatiji vrh od normalno zaobljene distribucije tupi oblik distribucije.

U programskom paketu SPSS mjera zaobljenosti ima oznaku Kurtosis ( Kurtosis = k ; k = 3 3 ) i vrijedi da ako je vrijednost ovog pokazatelja:
=0

normalno zaobljena distribucija

156

Mjere disperzije, asimetrija i zaobljenost

>0 <0

iljatiji vrh od normalno zaobljene distribucije tupi oblik distribucije.

Analitiki primjer 4.7. Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti: a) Asimetriju distribucije (Skewness); b) Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan, standardna devijacija); c) d) e) f) Bowleyevu mjeru asimetrije (kvartili); Zaobljenost distribucije (Kurtosis); Na histogram distribucije ucrtati i normalnu krivulju; Komentirati rezultate! Rjeenje 4.7: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v2). Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera zaobljenosti aktiviranjem veliine Kurtosis. Odabrane veliine u programu SPSS prikazane su na slici 4.3.
157

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 4.3. Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim veliinama

Izvor: Simulirani podaci.

Tablica 4.7. Statistiki podaci o visini ispitanika


N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 Valid Missing 235 4 175,77 174,00 172 8,749 ,485 ,159 ,184 ,316 170,00 174,00 182,00

Izvor: Simulirani podaci.

Da bi se u izlaznim rezultatima dobio histogram zadane distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies: Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve).

158

Mjere disperzije, asimetrija i zaobljenost

Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.7. Prema podacima iz tablice 4.7 moe se vidjeti da je 235 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane distribucije je 0,485, to upuuje na pozitivu ili desnostranu asimetriju. Pearsonova mjera asimetrije je:
Sk =

( X Mo)

(175,77 172) = 0,431 , 8,749

to opet upuuje da se radi o desnostranoj asimetriji. Bowleyeva mjera asimetrije je:


S kq = Q3 + Q1 2Me 182 + 170 2 174 = = 0,333 , 182 170 Q3 Q1

to potvruje prethodne zakljuke da je zadana distribucija visine ispitanika pozitivno ili desnostrano asimetrina. Slika 4.4. Histogram s normalnom krivuljom distribucije ispitanika prema visini
Histogram

50

40

Frequency

30

20

10

0 150 160 170 180 190 200 210

Mean = 175,77 Std. Dev. = 8,749 N = 235

Visina u cm

Izvor: Simulirani podaci. 159

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi 0,184, to upuuje na iljatiji vrh distribucije u odnosu na normalno zaobljenu distribuciju. Histogram zadane distribucije s ucrtanom normalnom krivuljom prikazan je na slici 4.4. te se na osnovi njega moe opet zakljuiti da zadana distribucija pokazuje blagu asimetriju na desnu stranu i iljatiji vrh od normalne distribucije.

Analitiki primjer 4.8. Za varijablu (obiljeje) mjeseni deparac (v2) potrebno je odrediti: a) Asimetriju distribucije (Skewness); b) Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan, standardna devijacija); c) d) e) f) Bowleyevu mjeru asimetrije (kvartili); Zaobljenost distribucije (Kurtosis); Na histogram distribucije ucrtati i normalnu krivulju; Komentirati rezultate! Rjeenje 4.8: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Mjeseni deparac se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu mjeseni deparac (v2). Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno
160

Mjere disperzije, asimetrija i zaobljenost

oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera zaobljenosti aktiviranjem veliine Kurtosis. Da bi se u izlaznim rezultatima dobio histogram zadane distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies: Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve). Tablica 4.8. Statistiki podaci o deparcu ispitanika
Statistics Mjesecni dzeparac N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 a Multiple modes exist. The smallest value is shown Valid Missing 173 66 371,5491 300,0000 200,00(a) 401,30549 4,314 ,185 26,422 ,367 150,0000 300,0000 500,0000

Izvor: Simulirani podaci.

Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.8. Prema podacima iz tablice 4.8. moe se vidjeti da je 173 ispitanika dalo odgovor o svojem mjesenom deparcu, dok ih 66 nije odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane distribucije je 4,314, to upuuje na izrazitu pozitivu ili desnostranu asimetriju. Pearsonova mjera asimetrije je:
Sk = ( X Mo)

(371,5491 200) = 0,4275 , 401,30549

161

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

to opet upuuje da se radi o desnostranoj asimetriji. Ovaj rezultat treba uzeti s rezervom jer zadana distribucija nije unimodalna, tj. nema samo jedan mod. Bowleyeva mjera asimetrije je:
S kq = Q3 + Q1 2 Me 500 + 150 2 300 = = 0,143 , 500 150 Q3 Q1

to potvruje prethodne zakljuke da je zadana distribucija deparca ispitanika pozitivno ili desnostrano asimetrina. Ovaj pokazatelj ne mjeri konkretnu asimetriju ekstremnih 25% najveih i najmanjih vrijednosti distribucije, koji u ovom sluaju prema Skewness pokazatelju upuuju na izrazito desnu tj. pozitivnu asimetriju. Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi 26,422, to upuuje na izrazito iljatiji vrh distribucije u odnosu na normalno zaobljenu distribuciju. Slika 4.5. Histogram s normalnom krivuljom distribucije ispitanika prema visini
Histogram

80

60

Frequency

40

20

0 0,00 1000,00 2000,00 3000,00 4000,00

Mean = 371,5491 Std. Dev. = 401,30549 N = 173

Mjesecni dzeparac

Izvor: Simulirani podaci.

162

Mjere disperzije, asimetrija i zaobljenost

Histogram zadane distribucije s ucrtanom normalnom krivuljom prikazan je na slici 4.5. te se na osnovi njega potvruju ranije doneseni zakljuci da zadana distribucija pokazuje veliku asimetriju na desnu stranu i izrazito iljatiji vrh od normalne distribucije.

Analitiki primjer 4.9. Za varijablu (obiljeje) broj cipela (v2) potrebno je odrediti: a) Asimetriju distribucije (Skewness); b) Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan, standardna devijacija); c) d) e) f) Bowleyevu mjeru asimetrije (kvartili); Zaobljenost distribucije (Kurtosis); Na histogram distribucije ucrtati i normalnu krivulju; Komentirati rezultate! Rjeenje 4.9: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Broj cipela se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu broj cipela (v2). Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera zaobljenosti aktiviranjem veliine Kurtosis.

163

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Da bi se u izlaznim rezultatima dobio histogram zadane distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies: Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o broju cipela ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.9. Tablica 4.9. Statistiki podaci o broju cipela ispitanika
Statistics Broj cipela N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 Valid Missing 237 2 40,86 40,00 39 3,078 ,511 ,158 -,334 ,315 39,00 40,00 43,00

Izvor: Simulirani podaci.

Prema podacima iz tablice 4.9. moe se vidjeti da je 237 ispitanika dalo odgovor o svom broju cipela, dok ih 2 nije odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane distribucije je 0,511, to upuuje na blagu pozitivu ili desnostranu asimetriju. Pearsonova mjera asimetrije je:
Sk =

( X Mo)

( 40,86 39) = 0,604 , 3,078

to opet upuuje da se radi o desnostranoj asimetriji. Bowleyeva mjera asimetrije je:

164

Mjere disperzije, asimetrija i zaobljenost

S kq =

Q3 + Q1 2 Me 43 + 39 2 40 = = 0,5 , 43 39 Q3 Q1

to potvruje prethodne zakljuke da je zadana distribucija o broju cipela ispitanika pozitivno ili desnostrano asimetrina. Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi -0,334, to upuuje na blago tupi vrh distribucije u odnosu na normalno zaobljenu distribuciju. Slika 4.6. Histogram s normalnom krivuljom distribucije ispitanika prema broju cipela

Histogram

50

40

Frequency

30

20

10

0 35 40 45 50

Mean = 40,86 Std. Dev. = 3,078 N = 237

Broj cipela

Izvor: Simulirani podaci.

Histogram zadane distribucije s ucrtanom normalnom krivuljom prikazan je na slici 4.6 te se na osnovi njega moe opet zakljuiti da zadana distribucija pokazuje laganu asimetriju na desnu stranu i blago tupi vrh u odnosu na normalnu distribuciju.

165

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

166

Vjerojatnost

5. VJEROJATNOST
5.1. Klasina definicija vjerojatnosti Sluajni dogaaj je takav dogaaj koji se moe, ali ne mora realizirati, tj. realizira se uz odreenu vjerojatnost. Vjerojatnost realizacije sluajnog dogaaja "A" jednaka je omjeru broja povoljnih ishoda i svih moguih ishoda:
P ( A) = m( A) , 0 P 1, n

(5.1)

gdje je:
m( A) - broj svih povoljnih ishoda za dogaaj A

- broj svih moguih ishoda. Za siguran dogaaj:


P = 1 (obrat ne vrijedi).

Za nemogu dogaaj: P = 0 (obrat ne vrijedi). Vjerojatnost da se sluajni dogaaj "A" ne realizira jednaka je omjeru broja nepovoljnih ishoda i svih moguih ishoda:
P( A ) = n m( A) , 0 P 1, n

(5.2)

gdje je:
n m( A)

- broj svih nepovoljnih ishoda za dogaaj A - broj svih moguih ishoda.

Vrijedi da je:
P ( A) + P ( A ) = 1 .

(5.3)

167

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Za ovakav sluaj kada je unaprijed poznat broj svih povoljnih/nepovoljnih i ukupnih ishoda izraunata vjerojatnost se naziva vjerojatnost "a priori". Ako vjerojatnost realizacije sluajnog dogaaja A nije poznata unaprijed, moe se izraunati tzv. vjerojatnost "a posteriori":
P( A) = p lim m( A) , n

(5.4)

gdje je:
p lim - ita se "granina vrijednost po vjerojatnosti" (da se razlikuje od

limesa u linearnoj algebri). 5.2. Teorem o zbrajanju vjerojatnosti Za meusobno iskljuive dogaaje (tj. one dogaaje koji ne mogu nastupiti istodobno, odnosno iji su pripadni skupovi elementarnih dogaaja disjunktni), vjerojatnost realizacije jednog ili drugog dogaaja jednaka je zbroju vjerojatnosti realizacije jednog i vjerojatnosti realizacije drugog dogaaja.
P ( A ili B) = P( A) + P ( B ) .

(5.5)

Za dogaaje koji se meusobno ne iskljuuju, vjerojatnost realizacije jednog ili drugog dogaaja je:
P ( A ili B ) = P( A) + P ( B ) P( AB ) ,

(5.6)

gdje je:
P ( AB) -vjerojatnost da sluajni dogaaji A i B nastupe istovremeno.

Analitiki primjer 5.1. U posudi se nalazi 400 kuglica, od toga 100 crvenih, 140 plavih i 160 zelenih. a) Kolika je vjerojatnost da e sluajnim izvlaenjem 1 kuglice biti izvuena kuglica zelena boje?

168

Vjerojatnost

b) Kolika je vjerojatnost da e sluajno izvuena kuglica biti crvena ili zelena? Rjeenje 5.1: U ovom primjeru zadano je:
n = 400 ; to predstavlja broj ukupnih ishoda; m(C ) = 100 ; to predstavlja broj povoljnih ishoda za crvenu kuglicu; m( P) = 140 ; to predstavlja broj povoljnih ishoda za plavu kuglicu; m( Z ) = 160 ; to predstavlja broj povoljnih ishoda za zelenu kuglicu.

a) Traena vjerojatnost da e sluajnim izvlaenjem 1 kuglice biti izvuena kuglica zelena boje jednaka je omjeru broja povoljnih ishoda, tj. broja zelenih kuglica i svih moguih ishoda, tj. svih kuglica:
P(Z ) = m( Z ) 160 = = 0,4 . n 400

b) Za traenu vjerojatnost da e sluajno izvuena kuglica biti crvena ili zelena primjenjuje se teorem o zbrajanju vjerojatnosti za meusobno iskljuive dogaaje jer na 1 izvlaenje ne moe istovremeno biti izvuena kuglica crvene i zelene boje (dogaaji ne mogu nastupiti istodobno):
P(C ili Z ) = m(C ) m( Z ) 100 160 + = + = 0,65 . n n 400 400

5.3. Teorem o mnoenju vjerojatnosti Ako se dogaaji A i B meusobno ne iskljuuju, tj. vjerojatnost realizacije jednog ne ovisi o vjerojatnosti realizacije drugog dogaaja (nezavisni dogaaji), tada je vjerojatnost istovremene realizacije dogaaja A i B jednaka produktu vjerojatnosti realizacije dogaaja A i dogaaja B:
P( A i B) = P( A) P( B) .

(5.7)

169

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

5.4. Uvjetna vjerojatnost Ako je realizacija dogaaja A uvjetovana prethodnom realizacijom dogaaja B, vrijedi da je uvjetna ili kondicionalna vjerojatnost dogaaja A:
P( A / B) = P ( AB ) , P( B) P( B) > 0 ,

(5.8)

odnosno:
P ( B / A) = P ( AB) , P ( A) P ( A) > 0 .

(5.9)

Ako su dogaaji nezavisni, vrijedi da je:


P ( AB) = P ( A) P ( B ) P( A / B ) = P ( A) P( B) = P ( A) P ( A)

(5.10)

Bayesov teorem: Ako se dogaaj B realizira istovremeno kada nastupi jedan od n disjunktnih dogaaja A1 , A2 ,..., An za koje je P( Ai ) = 1 onda se
i =1 n

vjerojatnost dogaaja B dobiva po formuli potpune vjerojatnosti:


P( B) = P( Ai ) P( B / Ai )
i =1 n

(5.11) , P( Ai ) = 1 .
i =1 n

P( Ai / B) =

P ( Ai ) P( B / Ai )

P( A ) P( B / A )
i =1 i i

(5.12)

Analitiki primjer 5.2. Potrebno je izraunati vjerojatnost da odabrani ispitanik bude enskog spola (varijabla: Spol (v1)).

170

Vjerojatnost

Rjeenje 5.2: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - Spol se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o spolu ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.1. Tablica 5.1. Podaci o spolu ispitanika
Spol Frequency 94 144 238 1 239 Percent 39,3 60,3 99,6 ,4 100,0 Valid Percent 39,5 60,5 100,0 Cumulative Percent 39,5 100,0

Valid

Musko Zensko Total

Missing Total

System

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.1. u stupcu Valid Percent moe se vidjeti da je 60,5% ispitanika enskog spola, odnosno vjerojatnost da ispitanik bude enskog spola je 0,605.

Analitiki primjer 5.3. Za varijablu grupirana visina (v1) na sljedei nain: Range: Lowest through - 160 - 170 - 180 - 190 - 200 - 210

160 170 180 190 200 210


171

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

potrebno je izraunati vjerojatnost da ispitanik bude visok izmeu 171 i 180 cm. Rjeenje 5.3: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - Grupirana visina se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.2. Tablica 5.2. Podaci o visini ispitanika
Grupirana visina Frequency 7 62 103 50 11 2 235 4 239 Percent 2,9 25,9 43,1 20,9 4,6 ,8 98,3 1,7 100,0 Valid Percent 3,0 26,4 43,8 21,3 4,7 ,9 100,0 Cumulative Percent 3,0 29,4 73,2 94,5 99,1 100,0

Valid

160,00 170,00 180,00 190,00 200,00 210,00 Total

Missing Total

System

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.2. u stupcu Valid Percent moe se vidjeti da je 43,8% ispitanika s visinom izmeu 171 i 180 cm, odnosno vjerojatnost da ispitanik bude visok izmeu 171 i 180 cm je 0,438.

172

Vjerojatnost

Analitiki primjer 5.4. Potrebno je izraunati vjerojatnost da se sluajno odabere osoba kojoj su roditelji u braku. Rjeenje 5.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - Brano stanje roditelja se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o branom stanju roditelja ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.3. Tablica 5.3. Podaci o branom stanju roditelja ispitanika
Bracno stanje roditelja
Frequency Percent Valid Percent Cumulative Percent

Valid

U braku Rastavljeni Umro jedan od roditelja Ostalo Total

215 10 11 3 239

90,0 4,2 4,6 1,3 100,0

90,0 4,2 4,6 1,3 100,0

90,0 94,1 98,7 100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.3. u stupcu Valid Percent moe se vidjeti da 90% ispitanika ima roditelje u braku, odnosno vjerojatnost da ispitanik ima roditelje u braku je 0,9.

Analitiki primjer 5.5. Potrebno je izraunati vjerojatnost da se sluajno odabere osoba koja pije alkoholna pia samo u posebnim prigodama.

173

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 5.5: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - o Konzumiranju alkohola se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o konzumaciji alkohola ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.4. Tablica 5.4. Podaci o konzumiranju alkohola ispitanika
Konzumirate li alkohol
Frequency Percent Valid Percent Cumulative Percent

Valid

Missing Total

Nikada Samo uz obroke U posebnim prilikama Cesto i u svakoj prigodi Total System

54 9 165 9 237 2 239

22,6 3,8 69,0 3,8 99,2 ,8 100,0

22,8 3,8 69,6 3,8 100,0

22,8 26,6 96,2 100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.4. u stupcu Valid Percent moe se vidjeti da 69,6% ispitanika pije alkohol samo u posebnim prilikama, odnosno vjerojatnost da ispitanik pije alkohol samo u posebnim prilikama je 0,696.

Analitiki primjer 5.6. a) Potrebno je izraunati vjerojatnost da ispitanik ne pije nikada alkoholna pia. b) Potrebno je izraunati vjerojatnost da ispitanik enskog spola ne pije nikada alkoholna pia.

174

Vjerojatnost

Rjeenje 5.6: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - o Konzumiranju alkohola se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o konzumaciji alkohola ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.4. Prema podacima iz tablice 5.4. u stupcu Valid Percent moe se vidjeti da 22,8% ispitanika ne pije nikada alkohol, odnosno vjerojatnost da ispitanik ne pije alkohol nikada je 0,228. b) Da bi se izraunala vjerojatnost da ispitanik enskog spola ne pije nikada alkoholna pia, potrebno je ostaviti u analizi samo ispitanike enskog spola, odnosno filtrirati eljeni uzorak. Na glavnom izborniku potrebno je izabrati ikonu Data, a na njezinu padajuem izborniku Select Cases. U prozoru Select Cases potrebno je aktivirati opciju If conditions is satisfied. Klikom na ikonu if otvara se prozor Select Cases:If gdje je potrebno odabrati varijablu v2 i postaviti uvjet da je v 2 = 2 , odnosno da je spol 2, to oznaava enski spol. Konano, da bi se filtrirali samo ispitanici enskog spola, potrebno je kliknuti na Continue i OK. Daljnja analiza se sada odnosi samo na enski spol. Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - o Konzumiranju alkohola se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o konzumaciji alkohola ispitanika enskog spola, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.5.

175

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 5.5. Podaci o konzumiranju alkohola ispitanika enskog spola


Konzumirate li alkohol
Frequency Percent Valid Percent Cumulative Percent

Valid

Missing

Nikada Samo uz obroke U posebnim prilikama Cesto i u svakoj prigodi Total System

37 3 94 8 142 2 144

25,7 2,1 65,3 5,6 98,6 1,4 100,0

26,1 2,1 66,2 5,6 100,0

26,1 28,2 94,4 100,0

Total

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.5 u stupcu Valid Percent moe se vidjeti da 26,1% od ispitanika enskog spola ne pije nikada alkohol, odnosno vjerojatnost da ispitanik enskog spola nikada ne pije alkohol je 0,261. 5.5. Diskontinuirana sluajna varijabla Diskontinuirana ili diskretna sluajna varijabla je takva varijabla koja na sluaj moe poprimiti najvie prebrojivo mnogo vrijednosti i svaku od njih s odreenom vjerojatnou. Zadovoljava uvjete: normativnost: P( xi ) = 1
i =1

nenegativnost: P( xi ) 0, i .

Skup svih ureenih parova vrijednosti sluajne varijable i njoj pripadajuih vjerojatnosti naziva se distribucija vjerojatnosti sluajne varijable X :

{[xi ; P( xi )], i = 1,2, ..., } .

(5.13)

176

Vjerojatnost

Zakon po kojem svakoj vrijednosti sluajne varijable X pripada vjerojatnost P( xi ) naziva se zakon vjerojatnosti sluajne varijable X. Funkcija distribucije sluajne varijable X je funkcija koja daje vjerojatnost da e sluajna varijabla X poprimiti vrijednost jednaku ili manju od nekog realnog broja x k :
F ( x k ) = P( X x k ) = P( xi )
i =1 k

(5.14)

Moe se rei da je to kumulativ vjerojatnosti od F ( X = 0) do F ( X = x k ) . Funkcija distribucije sluajne varijable X je monotono neopadajua funkcija. Parametri distribucije: Oekivanje sluajne varijable je zbroj umnoaka vrijednosti varijable X i njoj pripadajuih odgovarajuih vjerojatnosti P( x i ) :
E ( X ) = xi P( xi ) = .
i =1

(5.15)

Varijanca sluajne varijable je oekivanje kvadratnog odstupanja vrijednosti varijable X od njezina oekivanja:
V ( X ) = E ( X 2 ) [E ( X )] = E ( X ) 2 = x i2 P( x i ) 2 .
2 i =1

(5.16)

5.6. Teorijske distribucije diskontinuirane sluajne varijable 5.6.1. Binomna distribucija Ako sluajni pokus koji se ponavlja n puta ima dva mogua ishoda: uspjeh i neuspjeh, i ako je vjerojatnost nastupa ishoda uspjeh poznata, unaprijed utvrena i konstantna tijekom cijelog istraivanja (iznosi p ), kae se da se diskontinuirana sluajna varijabla X ravna prema tzv. binomnoj distribuciji.

177

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Vjerojatnost da se neki sluajni dogaaj X u n pokusa realizira x puta prema binomnom zakonu vjerojatnosti je:
n n P ( X = x) = p x (1 p ) n x = p x q n x , x = 0,1,2,..., n (5.17) x x

gdje je:
n
p q
x

- broj ponavljanja pokusa - vjerojatnost realizacije sluajnog dogaaja (povoljnog ishoda) - vjerojatnost da se sluajni dogaaj ne realizira - broj povoljnih ishoda u n ponavljanja sluajnog pokusa - broj nepovoljnih ishoda u n ponavljanja sluajnog pokusa. Oekivanje sluajne varijable X kod binomne distribucije:
E( X ) = n p .

nx

(5.18)

Varijanca sluajne varijable X kod binomne distribucije:


2 = n pq .

(5.19)

Koeficijent asimetrije sluajne varijable X kod binomne distribucije:


3 =
q p n pq

(5.20)

Koeficijent zaobljenosti sluajne varijable X kod binomne distribucije:


4 = 3+
1 6 p q . n pq

(5.21)

Openito se kae da se sluajna varijabla X ravna po binomnoj distribuciji koja je odreena parametrima n i p:
X

B(n, p) .

(5.22)

178

Vjerojatnost

U programskom paketu SPSS postoje funkcije gustoe vjerojatnosti i kumulativne funkcije distribucije vjerojatnosti Binomne distribucije. Funkcije gustoe vjerojatnosti (Probability Density Functions) Transform; Compute; Function group (izabrati: PDF & Noncentral PDF); izabrati: Pdf.Binom u Numeric Expression: PDF.BINOM(quant,n,prob) Rezultat ove funkcije su vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , budu jednake nekom broju x = quant . U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu. Kumulativne funkcije Distribution Functions) distribucije vjerojatnosti (Cumulative

Transform; Compute; Function group (izabrati: CDF & Noncentral CDF); izabrati: Cdf.Binom u Numeric Expression: CDF.BINOM(quant,n,prob) Rezultat ove funkcije je kumulativ vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , bude manji ili jednak nekom broju x = quant . U Target Variable: potrebno je imenovati novu varijablu izraunatih kumulativa vjerojatnosti po Binomnom zakonu. Analitiki primjer 5.7. Vjerojatnost da je student Odsjeka za sociologiju Filozofskoga fakulteta u Splitu mukog spola je: p =
m( M ) 7 = = 0,225806451 (gdje je 31 n n ukupan broj studenata Odjeka za sociologiju, a m( M ) broj je povoljnih

ishoda, odnosno broj studenata mukog spola).

179

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

a) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu 3 studenta mukog spola? b) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 2 studenta mukog spola? c) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 4 ili najmanje 3 studenta mukog spola? d) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata bude barem 1 student mukog spola? e) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu svi studenti mukog spola? Rjeenje 5.7: Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable, koji je prikazan na slici 5.1. Da bi se aktivirala naredba za izraun vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Binom i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: PDF.BINOM(?,?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi upitnik funkcije predstavlja n, odnosno veliinu odabranog uzorka. Trei upitnik je prob, tj. p vjerojatnost realizacije sluajnog dogaaja. U ovom primjeru je zadano:
quant = X 1 ; n = 7 ; prob = 0,225806451 ,

pa vrijedi da je:
PDF.BINOM(X1,7,0.225806451), to je i prikazano u prozoru Numeric Expression na slici 5.1.

U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru nazvana je X1Bin.
180

Vjerojatnost

Slika 5.1. Prozor u SPSS-u za izraunavanje vjerojatnosti diskontinuirane sluajne varijable po Binomnom zakonu

Izvor: Simulirani podaci.

Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X1 po Binomnoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.6. Prema rezultatima iz tablice 5.6. mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu 3 studenta mukog spola je:
p( X 1 = 3) = 0,144769 .

b) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 2 studenta mukog spola je:

181

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

p ( X 1 2) = p( X 1 = 0) + p( X 1 = 1) + p ( X 1 = 2) = = 0,166704 + 0,340355 + 0,297810 = 0,805.

Tablica 5.6. Podaci u SPSS-u vrijednosti i vjerojatnosti diskontinuirane sluajne varijable po Binomnom zakonu

Izvor: Simulirani podaci.

c) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 4 ili najmanje 3 studenta mukog spola je:
p ( X 1 4 ili X 1 3) = 1 .

Ovom vjerojatnosti su obuhvaene sve vrijednosti sluajne varijable X1, a zbroj svih vjerojatnosti u jednoj distribuciji je 1. d) Vjerojatnost da izmeu 7 sluajno odabranih studenata bude barem 1 student mukog spola je:
p ( X 1 1) = p( X 1 = 1) + p( X 1 = 2) + ... + p ( X 1 = 7) = = 1 p ( X 1 = 0) = 1 0,166704 = 0,8333.

e) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu svi studenti mukog spola je:
p ( X 1 = 7) = 0,00003 .

182

Vjerojatnost

5.6.2. Poissonova distribucija Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed utvrena, konstantna i jako mala tijekom cijelog istraivanja (iznosi p ), te broj pokusa tei u beskonanost ( n ) umjesto binomne distribucije, upotrebljava se Poissonova distribucija. U praksi vrijedi da ako je:
n 50 i p 0,10

(5.23)

vrijedi Poissonova distribucija. Moe se rei da je ta distribucija definirana za rijetke dogaaje, odnosno one dogaaje koji imaju veliki uzorak i malu vjerojatnost. Zakon vjerojatnosti po Poissonovoj distribuciji je:
P( X = x) = (np) x e np ( ) x e = , x = 0,1,2,..., , x! x!

(5.24)

jer je: = n p ; gdje je:


n
p x

- broj pokusa - vjerojatnost realizacije sluajnog dogaaja - broj povoljnih ishoda u n pokusa. Oekivanje sluajne varijable X kod Poissonove distribucije:
E( X ) = n p = .

(5.25)

Varijanca sluajne varijable X kod Poissonove distribucije:


2 = n p = .

(5.26)

Koeficijent asimetrije sluajne varijable X kod Poissonove distribucije:


3 =
1

(5.27)

183

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Koeficijent zaobljenosti sluajne varijable X kod Poissonove distribucije:


4 = 3+
1

(5.28)

Openito se kae da se sluajna varijabla X ravna po Poissonovoj distribuciji koja je odreena parametrom :
X

P( ) .

(5.29)

U programskom paketu SPSS postoje funkcije gustoe vjerojatnosti i kumulativne funkcije distribucije vjerojatnosti Poissonove distribucije. Funkcije gustoe vjerojatnosti (Probability Density Functions) Transform; Compute; Function group (izabrati: PDF & Noncentral PDF); izabrati: Pdf.Poisson u Numeric Expression: PDF.POISSON(quant,mean) Rezultat ove funkcije su vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , budu jednake nekom broju x = quant . Vrijedi da je oekivanje mean = = n p . U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu. Kumulativne funkcije Distribution Functions) distribucije vjerojatnosti (Cumulative

Transform; Compute; Function group (izabrati: CDF & Noncentral CDF); izabrati: Cdf.Poisson u Numeric Expression: CDF.POISSON(quant,mean) Rezultat ove funkcije je kumulativ vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , bude manji ili jednak nekom broju x = quant . Vrijedi da je oekivanje mean = = n p .

184

Vjerojatnost

U Target Variable: potrebno je imenovati novu varijablu izraunatih kumulativa vjerojatnosti po Poissonovu zakonu.

Analitiki primjer 5.8. Vjerojatnost da se meu studentskom populacijom konzumira droga je: p = 0,056 . a) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata budu 2 studenta koja konzumiraju drogu? b) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata barem 1 student konzumira drogu? c) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata najvie 10 studenata konzumira drogu? Rjeenje 5.8: Zadana vjerojatnost sluajnog dogaaja da se meu studentskom populacijom konzumira droga je manja od 0,10, a uzorak je u svim sluajevima vei od 50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X2 ravna po Poissonovu zakonu. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na slijedei nain: PDF.POISSON(?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable koja se po Poissonovu zakonu rauna na sljedei nain:
n = 60 ; prob = 0,056 : = n p = 60 0,056 = 3,36 .
185

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U ovom primjeru vrijedi da je:


quant = X 2 ; = 3,36 ,

pa se moe upisati: PDF.POISSON(X2,3.36), to je i prikazano u prozoru Numeric Expression na slici 5.2. Slika 5.2. Prozor u SPSS-u za izraunavanje vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Simulirani podaci.

U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X2Poiss.

186

Vjerojatnost

Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X2 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.7. Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti slian postupak. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku Function and Special Variables: bira Cdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: CDF.POISSON(?,?). Slika 5.3. Prozor u SPSS-u za izraunavanje kumulativnih vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Simulirani podaci. 187

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable:
quant = X 2 ; = 3,36 ,

pa se moe upisati: CDF.POISSON(X2,3.36), to je i prikazano u prozoru Numeric Expression na slici 5.3. U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X2CumPoiss. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci kumulativnih vjerojatnosti sluajne varijable X2 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.7. Tablica 5.7. Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Simulirani podaci.

188

Vjerojatnost

Prema rezultatima iz tablice 5.7. (prikazano je samo 13 vrijednosti od ukupno 60 vrijednosti zadane diskontinuirane sluajne varijable X2) mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 60 sluajno odabranih studenata budu 2 studenta koja konzumiraju drogu je:
p ( X 1 = 2) = 0,196074 .

b) Vjerojatnost da izmeu 60 sluajno odabranih studenata barem 1 student konzumira drogu je:
p ( X 1 1) = p ( X 1 = 1) + p ( X 1 = 2) + ... + p ( X 1 = 60) = = 1 p ( X 1 = 0) = 1 0,034735 = 0,9653.

Ovdje je iskoriteno svojstvo da je zbroj svih vjerojatnosti u distribuciji 1. c) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata najvie 10 studenata konzumira drogu?
p ( X 1 10) = p ( X 1 = 0) + p( X 1 = 1) + ... + p( X 1 = 10) = = 0,999263.

Ovdje je traena vjerojatnost jednostavno oitana iz rezultata stupca kumulativnih vjerojatnosti Poissonove distribucije. Jednak rezultat bi se dobio postupnim zbrajanjem vjerojatnosti iz stupca vjerojatnosti Poissonove distribucije. 5.6.3. Dvodimenzionalna diskontinuirana distribucija Diskontinuirana sluajna varijabla X moe poprimiti vrijednosti
x1 , x 2 , x3 ,..., x n , a diskontinuirana sluajna varijabla Y moe istovremeno poprimiti vrijednosti y1 , y 2 , y 3 ,..., y m .

Vjerojatnost da sluajna varijabla X poprimi vrijednost xi , a istovremeno sluajna varijabla Y poprimi vrijednost y j je:
P( X = xi , Y = y j ) = P( xi , y j )

(5.30)

189

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Za svaku distribuciju vjerojatnosti mora biti ispunjen uvjet normativnosti:


i =1 j =1

P( xi , y j ) = 1
i j i j

n m

(5.31)

Skup svih ureenih parova

{(x , y ); P( x , y )} dvodimenzionalna

je distribucija vjerojatnosti sluajnih varijabli ( X , Y ) . 5.6.4. Marginalne distribucije diskontinuirane sluajne varijable Marginalna distribucija sluajne varijable X skup je ureenih parova odgovarajuih vrijednosti varijable X i njima pripadajuih vjerojatnosti da sluajna varijabla X poprimi neku vrijednost xi bez obzira na to koju e vrijednost poprimiti sluajna varijabla Y. Marginalna distribucija sluajne varijable Y skup je ureenih parova odgovarajuih vrijednosti varijable Y i njima pripadajuih vjerojatnosti da sluajna varijabla Y poprimi neku vrijednost y j bez obzira na to koju e vrijednost poprimiti sluajna varijabla X. Marginalna vjerojatnost sluajne varijable X je:
P ( x i ) = P ( xi , y j ) ,
j =1 m

(5.32)

i obino se u dvostrukoj statistikoj tablici nalazi u zbirnom stupcu (ako se sluajna varijabla X mijenja po redcima). Marginalna vjerojatnost sluajne varijable Y je:
P ( y j ) = P ( x i , y j ) ,
i =1 n

(5.33)

i obino se u dvostrukoj statistikoj tablici nalazi u zbirnom retku (ako se sluajna varijabla Y mijenja po stupcima).

190

Vjerojatnost

5.6.5. Uvjetne distribucije diskontinuirane sluajne varijable Vjerojatnost da sluajna varijabla X poprimi neku vrijednost xi pod uvjetom da je varijabla Y poprimila neku vrijednost y j uvjetna je ili kondicionalna vjerojatnost:
P( xi / y j ) = P( xi , y j ) P( y j ) , P( y j ) > 0 .

(5.34)

Slino, vjerojatnost da sluajna varijabla Y poprimi neku vrijednost y j pod uvjetom da je varijabla X poprimila neku vrijednost xi uvjetna je ili kondicionalna vjerojatnost:
P( y j / xi ) = P( xi , y j ) P( xi )
, P( xi ) > 0 .

(5.35) nezavisne, primjenjuje se

Ako su sluajne multiplikacijski teorem:

varijable

P( xi , y j ) = P( xi ) P( y j ) ,

(5.36)

pa vrijedi da je:
P( xi / y j ) = P( xi ) , P( y j / xi ) = P( y j ) .

(5.37) (5.38)

Analitiki primjer 5.9. a) za Zadatak je izraunati dvodimenzionalnu distribuciju vjerojatnosti:

- varijablu (obiljeje) grupirani deparac (v1) koja se mijenja po redcima (row) i za - varijablu (obiljeje) grupirana ocjena u srednjoj koli (v2) koja se mijenja po stupcima (column). b) Komentirati distribucije! izraunate vjerojatnosti dvodimenzionalne

191

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

c)

Komentirati izraunate vjerojatnosti marginalne distribucije!

d) Uz pretpostavku da promatrane sluajne varijable nisu nezavisne potrebno je izraunati uvjetnu distribuciju vjerojatnosti: P( p 4 / p3 = 400) ! Rjeenje 5.9: a) Na glavnom izborniku potrebno je odabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Nakon toga otvara se prozor Crosstabs. Slika 5.4. Prozor Crosstabs za izraunavanje dvodimenzionalnih vrijednosti zadanih sluajnih varijabli

Izvor: Simulirani podaci.

Odgovarajuim strelicama prema zahtjevu zadatka potrebno je varijablu (obiljeje) grupirani deparac (v1) prebaciti u prozor za retke
192

Vjerojatnost

Row(s) i varijablu (obiljeje) grupirana ocjena u srednjoj koli (v2) prebaciti u prozor za stupce Column(s) kako je prikazano na slici 5.4. Klikom na ikonu Cells... otvara se prozor Crosstabs: Cell Display gdje je uz postojee originalne frekvencije (Counts) potrebno aktivirati Percentages; Total kako je prikazano na slici 5.5. Da bi se u Outputu programa SPSS dobili traeni podaci potrebno je kliknuti na Continue i OK. Slika 5.5.

Izvor: Simulirani podaci.

Rezultati su prikazani u tablici 5.8. b) Izraunate vjerojatnosti dvodimenzionalne distribucije u tablici 5.8. izraene su u postotcima. Vjerojatnost u prvom retku i prvom stupcu numerikog dijela tablice iznosi 3,5%, to znai da vjerojatnost da ispitanik ima deparac do 200 kn i ocjenu iz srednje kole 3 iznosi 0,035. Vjerojatnost u prvom retku i drugom stupcu numerikog dijela tablice iznosi 22,1%, to znai da vjerojatnost da ispitanik ima deparac do 200 kn i ocjenu iz srednje kole 4 iznosi 0,221.

193

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 5.8. Dvostruka tablica obiljeja deparca i prosjene ocjene u srednjoj koli
grupirani dzeparac * grupirana ocjena u srednjoj skoli Crosstabulation grupirana ocjena u srednjoj skoli 3,00 4,00 5,00 6 38 29 3,5% 22,1% 16,9% 14 20 18 8,1% 11,6% 10,5% 5 14 10 2,9% 8,1% 5,8% 1 3 2 ,6% 1,7% 1,2% 0 2 5 ,0% 1,2% 2,9% 0 3 2 ,0% 1,7% 1,2% 26 80 66 15,1% 46,5% 38,4%

Total 73 42,4% 52 30,2% 29 16,9% 6 3,5% 7 4,1% 5 2,9% 172 100,0%

grupirani dzeparac

200,00 400,00 600,00 800,00 1000,00 3500,00

Total

Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total

Izvor: Simulirani podaci.

Vjerojatnost u etvrtom retku i drugom stupcu numerikog dijela tablice iznosi 1,7%, to znai da vjerojatnost da ispitanik ima deparac izmeu 600 kn i 800 kn i ocjenu iz srednje kole 4 iznosi 0,071. Posljednja vjerojatnost numerikog dijela tablice, tj. vjerojatnost u estom retku i treem stupcu iznosi 2,9%, to znai da vjerojatnost da ispitanik ima deparac izmeu 1000 kn i 3500 kn i ocjenu iz srednje kole 5 iznosi 0,012. c) Izraunate vjerojatnosti marginalne distribucije nalaze se u zbirnom retku i zbirnom stupcu tablice 5.8. Na primjer, druga marginalna vjerojatnost u zbirnom stupcu iznosi 30,2%, tj. vjerojatnost da ispitanik ima deparac izmeu 200 kn i 400 kn bez obzira na prosjenu ocjenu u srednjoj koli iznosi 0,302. Isto tako trea marginalna vjerojatnost u zbirnom retku iznosi 38,4%, tj. vjerojatnost da ispitanik ima prosjenu ocjenu u srednjoj koli 5 bez obzira na visinu deparca iznosi 0,384.

194

Vjerojatnost

Zbroj svih vjerojatnosti u izraunatoj distribuciji vjerojatnosti je 1, odnosno 100%.

dvodimenzionalnoj

d) Uz pretpostavku da promatrane sluajne varijable nisu nezavisne, uvjetna distribucija vjerojatnosti: P(v 2 / v1 = 400) izraunata je na sljedei nain i prikazana je u tablici 5.9:
P (v 2 = 3 / v1 = 400) = P (v 2 = 3, v1 = 400) 0,081 = = 0,2682 , P(v1 = 400) 0,302

P(v 2 = 4 / v1 = 400) =
P (v 2 = 5 / v1 = 400) =

P(v 2 = 4, v1 = 400) 0,116 = = 0,3841 , 0,302 P(v1 = 400)


P (v 2 = 5, v1 = 400) 0,105 = = 0,3477 . P (v1 = 400) 0,302

Tablica 5.9. Uvjetna distribucija vjerojatnosti


v2 P (v 2 / v1 = 400)
3
0,2682

4
0,3841

5
0,3477

Izvor: Izraunato prema podacima u tablici 5.8.

Druga izraunata vjerojatnost u tablici 5.9. znai da vjerojatnost da ispitanik ima prosjenu ocjenu iz srednje kole 4 uz uvjet da mu je deparac izmeu 200 kn i 400 kn, iznosi 0,3841. 5.7. Kontinuirana sluajna varijabla Kontinuirana ili diskretna sluajna varijabla X takva je varijabla koja moe poprimiti neprebrojivo beskonano mnogo vrijednosti. Zato se za kontinuiranu sluajnu varijablu ne rauna vjerojatnost u odreenoj toki, nego nad odreenim intervalom. Funkcija vjerojatnosti ili funkcija kontinuirane sluajne varijable X ima svojstva:
f ( x) 0, x ,

gustoe

vjerojatnosti

195

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA


+

f ( x)dx = 1 , (povrina ispod krivulje funkcije vjerojatnosti je 1),


x2 x1

P ( x1 < X x 2 ) = f ( x)dx, [x 2 > x1 ] , (vjerojatnost da sluajna

varijabla X poprimi vrijednost veu od x1 i manju ili jednaku x 2 , jednaka je odreenom integralu funkcije vjerojatnosti f ( x) na tom intervalu, odnosno povrini koju krivulja funkcije vjerojatnosti na tom intervalu zatvara s pozitivnim smjerom osi x). Funkcija distribucije sluajne varijable X je funkcija koja daje vjerojatnost da e sluajna varijabla X poprimiti vrijednost jednaku ili manju od nekog realnog broja x :
F ( x) = P ( X x) = f ( x)dx

(5.39)

Parametri distribucije: Oekivanje sluajne varijable (ako integral konvergira):


E ( X ) = x f ( x) dx = .
+

(5.40)

Varijanca sluajne varijable:


V ( X ) = ( x ) 2 f ( x)dx .
+

(5.41)

5.8. Teorijske distribucije kontinuirane sluajne varijable 5.8.1. Normalna distribucija Normalna distribucija je simetrina ( 3 = 0 ), unimodalna i ima oblik zvona. Normalno je zaobljena ( 4 = 3 ):

196

Vjerojatnost

Slika 5.6. Normalna krivulja

Izvor: Konstrukcija autora.

Prema slici 5.6 moe se uoiti da normalna krivulja u istoj toki tono na sredini ima aritmetiku sredinu, medijan i mod. Funkcija vjerojatnosti ili funkcija gustoe vjerojatnosti kod normalne distribucije je:
f ( x) = 1

1 x 2 ) ( 2

x < ,+ > .

(5.42)

Openito se kae da se kontinuirana sluajna varijabla X ravna po normalnoj distribuciji koja je odreena parametrima (oekivanje) i 2 (varijanca):
X

N ( , 2 ) .
x

(5.43)

Za standardiziranu varijablu Z:
Z=

(5.44)

funkcija vjerojatnosti je:


f (Z ) =
1 2

1 Z2 2

(5.45)

Ova normalna distribucija se naziva standardizirana ili jedinina normalna distribucija s oekivanjem 0 i jedininom varijancom, pa vrijedi da je:
X N (0,1) .

(5.46)

197

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 5.7. Povrina ispod normalne krivulje


P(Z)

Z 0 Izvor: Konstrukcija autora.

Jedinina normalna distribucija ima uvijek iste vrijednosti parametara, pa se vrijednosti za intervale vrijednosti varijable Z, od 0 do z kako je prikazano na slici 5.7, (u statistikoj literaturi ima i drugaije koncipiranih tablica), mogu prikazati u jedinstvenoj tablici povrina (vjerojatnosti) ispod normalne krivulje. Na primjer:
x x P ( x1 < X x 2 ) = P2 2 P1 1 = P2 (Z 2 ) P1 (Z 1 ) . (5.47)

5.8.2. Studentova distribucija Studentova distribucija jo se naziva t-distribucija. Ima svoju primjenu u statistici kod procjene parametara osnovnog skupa i kod testiranja hipoteza na osnovi uzorka. Varijabla "t" je definirana na podruju: < ,+ > . Studentova distribucija je simetrina s obzirom na t = 0 . Ako je Z N (0,1) i 2 varijabla tzv. hi-kvadrat ili gamadistribucije s (ili df - degree of freedom) stupnjevima slobode i ako su one nezavisne sluajne varijable, tada je:
t = z

(5.48)

t - varijabla Studentove distribucije sa stupnjevima slobode (ili df).

198

Vjerojatnost

Slika 5.8. Studentova distribucija za razliite stupnjeve slobode


Z~N (0,1) =5 =2 0 t

Izvor: Konstrukcija autora.

Na slici 5.8 se vidi da se s poveanjem stupnjeva slobode , studentova distribucija pribliava normalnoj distribuciji. Ve za = 30 u praksi se umjesto t - distribucije upotrebljava normalna distribucija (pogreka aproksimacije u tom je sluaju manja od 0,03).

199

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

200

Ocjene parametara osnovnog skupa na osnovu uzorka

6. OCJENE PARAMETARA OSNOVNOG SKUPA NA OSNOVI UZORKA


6.1. Uzorak Uzorak je podskup osnovnoga statistikog skupa, a uzima se u svrhu ispitivanja obiljeja elemenata osnovnog skupa (ili populacije). Uzorak treba biti reprezentativan i sluajan. Sluajan izbor jedinica osnovnog skupa u uzorak moe se postii pomou tablice sluajnih brojeva. Jedinice u uzorak mogu se birati sistematski (npr. svaki 10. element osnovnog skupa). Frakcija odabiranja (f) omjer je jedinica u uzorku i broja jedinica u osnovnom skupu:
f = n , N

(6.1)

gdje je :
n
N

- broj jedinica u uzorku, - broj jedinica u osnovnom skupu.

Korak izbora je reciprona vrijednost frakcije odabiranja ( 1 f ) i upotrebljava se kod sistematskog izbora jedinica u uzorak. Broj svih moguih uzoraka (bez ponavljanja) veliine n iz osnovnog skupa veliine N jednak je broju kombinacija bez ponavljanja n -tog razreda:
N K = . n

(6.2)

Pomou uzorka vri se procjena odreenih parametara osnovnog skupa i testiraju se hipoteze o nepoznatim parametrima osnovnog skupa.

201

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Ako se iz osnovnog skupa veliine N izaberu svi mogui uzorci veliine n , te se za svaki uzorak izrauna neki odgovarajui parametar, distribucija tih parametara naziva se sampling distribucija. Pristranost je razlika izmeu oekivane vrijednosti nekog parametra iz sampling distribucije i tog istog parametra iz osnovnog skupa:
E () .

(6.3)

Ako izmeu oekivane vrijednosti nekog parametra iz sampling distribucije i tog istog parametra iz osnovnog skupa ne postoji razlika, onda se to svojstvo naziva nepristranost:
E () = .

(6.4)

Standardna devijacija sampling distribucije naziva se standardna greka. 6.2. Procjena aritmetike sredine osnovnog skupa Ako veliina uzorka tei prema beskonano sampling distribucija aritmetikih sredina, tei normalnom obliku. Kod malih uzoraka sampling distribucija aritmetikih sredina ima oblik Studentove ili t-distribucije. Stoga vrijedi da ako je:
n > 30 n 30

koristi se Normalna distribucija i koristi se Studentova ili t-distribucija. je (standardna

Standardna greka aritmetike sredine devijacija sampling distribucije aritmetike sredine):


Se( X ) = n
N n Se( X ) = N 1 n

ako je f 0,05 i ako je f > 0,05 .

202

Ocjene parametara osnovnog skupa na osnovu uzorka

Ako nije poznata standardna devijacija osnovnog skupa , rauna se nepristrana (tokasta) ocjena varijance osnovnog skupa na osnovi uzorka S 2 :
n S 2 = n 1

ako je n 30 i ako je n > 30 .

S2 =

Tokasta procjena (procjena jednim brojem) aritmetike sredine osnovnog skupa na osnovi uzorka je:
X.

Intervalna procjena aritmetike sredine osnovnog skupa na osnovi uzorka je:


Pr X Z Se( X ) < X < X + Z Se( X ) = 1 ,

(6.5)

gdje je:
X

- aritmetika sredina izraunata na osnovi uzorka

Z - ako je ( n > 30 ) rauna se vrijednost iz tablice povrina Normalne distribucije (pomou Z 1 )


2

- ako je ( n 30 ) umjesto ( Z ) rauna se vrijednost iz tablice

povrina Studentove ili t-distribucije (pomou t [df2=n 1] )


Se(X )

- standardna greka aritmetike sredine

1 - nivo pouzdanosti procjene (ako nije odreeno drukije, najee se uzima de je 1 = 95% ).

Veliina uzorka uz zadani nivo pouzdanosti i maksimalnu greku odreuje se na sljedei nain:
Z n' = greka
2

ako je f 0,05 ili

(6.6)

203

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

n=

n' n' 1+ N

ako je f > 0,05 ,

(6.7)

gdje je:
Z - vrijednost iz tablice povrina Normalne distribucije (pomou Z 1 )
2

- standardna devijacija iz osnovnog skupa

greka - maksimalna greka.

Ako je maksimalna greka odreena u relativnom izrazu umjesto (standardne devijacije), veliina uzorka se rauna pomou V (koeficijenta varijacije):
V=

100 .

(6.8)

Analitiki primjer 6.1. Za zadani uzorak ispitanika potrebno je: a) Izraunati prosjenu visinu ispitanika u uzorku (varijabla v1)! b) Izraunati interval procjene za prosjenu visinu ispitanika osnovnog skupa uz pouzdanost procjene od 95%! c) Izraunati interval procjene za prosjenu visinu ispitanika osnovnog skupa uz pouzdanost procjene od 99%! Rjeenje 6.1: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Explore. U otvorenom prozoru Explore potrebno je zadanu numeriku varijablu v1 - visina u cm pomou odgovarajue strelice prebaciti u Dependent List. U prostoru Display potrebno je aktivirati Statistics.

204

Ocjene parametara osnovnog skupa na osnovu uzorka

Klikom na ikonu Statistics otvara se novi prozor Explore: Statistics koji je prikazan na slici 6.1. Slika 6.1. Odabrani nivo pouzdanosti procjene za aritmetiku sredinu od 95%

Izvor: Simulirani podaci.

Prema zahtjevu zadatka od (b) ovdje je izabran nivo pouzdanosti procjene od 95%. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.1. Tablica 6.1. Podaci o visini ispitanika
Descriptives Visina u cm Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 175,77 174,64 176,89 175,54 174,00 76,539 8,749 154 206 52 12 ,485 ,184 Std. Error ,571

Lower Bound Upper Bound

,159 ,316

Izvor: Simulirani podaci.

205

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema podacima iz tablice 6.1. moe se vidjeti da je prosjena visina ispitanika u uzorku 175,77cm. b) Intervalna procjena aritmetike sredine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 95% je:
Pr{ ,64 < X < 176,89} = 95% . 174

Uz traenu intervalnu procjenu u izlaznoj tablici Descriptives u Outputu programa SPSS dobiju se i sljedei podaci uzorka ispitanika: Median (medijan), Variance (varijanca), Std. Deviation (standardna devijacija), Minimum (najmanja vrijednost varijable), Maximum (najvea vrijednost varijable), Range (raspon varijacije obiljeja), Interquartile Range (interkvartil), Skewness (mjera asimetrije), Kurtosis (mjera zaobljenosti), Std. Error Mean (standardna greka aritmetike sredine),Std. Error Skewness (standardna greka mjere asimetrije) i Std. Error Kurtosis (standardna greka mjere zaobljenosti). c) Da bi se dobila intervalna procjena aritmetike sredine visine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 99%, potrebno je ponoviti slian postupak, samo se u prozor Explore: Statistics upie novi nivo pouzdanosti procjene 99%. Tablica 6.2. Podaci o visini ispitanika
Descriptives Visina u cm Mean 99% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 175,77 174,28 177,25 175,54 174,00 76,539 8,749 154 206 52 12 ,485 ,184 Std. Error ,571

Lower Bound Upper Bound

,159 ,316

Izvor: Simulirani podaci.

206

Ocjene parametara osnovnog skupa na osnovu uzorka

Rezultat je prikazan u tablici 6.2. Intervalna procjena aritmetike sredine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{ ,28 < X < 177,25} = 99% . 174

Moe se zakljuiti da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.

Analitiki primjer 6.2. Za zadani uzorak ispitanika potrebno je: a) Izraunati prosjenu teinu ispitanika u uzorku (varijabla v1)! b) Izraunati interval procjene za prosjenu teinu ispitanika osnovnog skupa uz pouzdanost procjene od 95%! c) Izraunati interval procjene za prosjenu teinu ispitanika osnovnog skupa uz pouzdanost procjene od 99%! Rjeenje 6.2: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Explore. U otvorenom prozoru Explore potrebno je zadanu numeriku varijablu v1 - teina u kg pomou odgovarajue strelice prebaciti u Dependent List. U prostoru Display potrebno je aktivirati Statistics. Klikom na ikonu Statistics otvara se novi prozor Explore: Statistics. Prema zahtjevu zadatka od (b) ovdje izabran nivo pouzdanosti procjene od 95%. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.3. Prema podacima iz tablice 6.3 moe se vidjeti da je prosjena teina ispitanika u uzorku 61,18 kg.

207

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 6.3. Podaci o teini ispitanika


Descriptives Tezina u kg Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 67,1795 65,4372 68,9218 66,3257 64,0000 182,989 13,52735 46,00 110,00 64,00 19,00 ,840 ,214 Std. Error ,88431

Lower Bound Upper Bound

,159 ,317

Izvor: Simulirani podaci.

b) Intervalna procjena aritmetike sredine teine u osnovnom skupu pomou zadanog uzorka uz nivo pouzdanosti procjene od 95% je:
Pr{65,44 < X < 68,92} = 95% .

c) Da bi se dobila intervalna procjena aritmetike sredine teine populacije osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 99%, potrebno je ponoviti slian postupak, samo se u prozor Explore: Statistics upie novi nivo pouzdanosti procjene 99%. Rezultat je prikazan u tablici 6.4. Intervalna procjena aritmetike sredine teine stanovnika u osnovnom skupu pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{64,88 < X < 69,48} = 99% .

Moe se opet zakljuiti da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.

208

Ocjene parametara osnovnog skupa na osnovu uzorka

Tablica 6.4. Podaci o teini ispitanika


Descriptives Tezina u kg Mean 99% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 67,1795 64,8829 69,4761 66,3257 64,0000 182,989 13,52735 46,00 110,00 64,00 19,00 ,840 ,214 Std. Error ,88431

Lower Bound Upper Bound

,159 ,317

Izvor: Simulirani podaci.

6.3. Procjena proporcije osnovnog skupa Ako veliina uzorka tei prema beskonano, sampling distribucija proporcija tei normalnom obliku. Kod malih uzoraka sampling distribucija proporcija ima oblik Studentove ili t-distribucije. Stoga vrijedi da ako je:
n > 30 n 30

koristi se Normalna distribucija i koristi se Studentova ili t-distribucija.

Standardna greka proporcije (standardna devijacija sampling distribucije proporcije) je: ako je f 0,05 :
Se( p ) = pq n ako je n > 30 i

209

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Se( p) =

pq n 1

ako je n 30 .

ako je f > 0,05 :


Se( p ) = Se( p ) = pq N n n N 1 pq N n n 1 N 1

ako je n > 30 i ako je n 30 .

Tokasta procjena (procjena jednim brojem) proporcije osnovnog skupa na osnovi uzorka je: p , odnosno to je proporcija uzorka. Intervalna procjena proporcije osnovnog skupa na osnovi uzorka je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1

(6.9)

gdje je:
p
Z

- proporcija izraunata na osnovi uzorka; ( q = 1 p )

- ako je ( n > 30 ) rauna se vrijednost iz tablice povrina Normalne distribucije (pomou Z 1 )


2

- ako je ( n 30 ) umjesto ( Z ) rauna se vrijednost iz tablice

povrina Studentove ili t-distribucije (pomou t [df2= n 1] )


Se( p ) - standardna greka proporcije 1 - nivo pouzdanosti procjene (ako nije odreeno drugaije, najee se uzima da je 1 = 95% ).

Veliina uzorka uz zadani nivo pouzdanosti i maksimalnu greku odreuje se na sljedei nain:
Z P Q n' = greka
2

ako je f 0,05 ili

(6.10)

210

Ocjene parametara osnovnog skupa na osnovu uzorka

n=

n' n' 1+ N

ako je f > 0,05 ,

(6.11)

gdje je:
Z - vrijednost iz tablice povrina Normalne distribucije (pomou Z 1 )
2

PQ

- varijanca osnovnog skupa

greka - maksimalna greka.

Ako je maksimalna greka odreena u relativnom izrazu umjesto P Q (standardne devijacije), veliina uzorka se rauna pomou V (koeficijenta varijacije osnovnog skupa):
V= Q , P

(6.12)

pa vrijedi da je:
Q Z P . n' = greka
2

(6.13)

Analitiki primjer 6.3. Za zadani uzorak ispitanika (koji su odgovorili na postavljeno pitanje) potrebno je: a) Izraunati proporciju uzorka ispitanika kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe (varijabla v1)! b) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe uz pouzdanost procjene od 95%!

211

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

c) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe uz pouzdanost procjene od 99%! Rjeenje 6.3: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - financijske prilike u obitelji pomou odgovarajue strelice prebaciti u Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o financijskim prilikama obitelji ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.5. Tablica 6.5 Podaci o financijskim prilikama u obitelji ispitanika
Financijske prilike u obitelji Frequency Valid Nema novca za normalan standard Zadovoljava osnovne potrebe Nema materijalnih problema Zivi odlicno Total System 4 104 122 7 237 2 239 Percent 1,7 43,5 51,0 2,9 99,2 ,8 100,0 Valid Percent 1,7 43,9 51,5 3,0 100,0 Cumulative Percent 1,7 45,6 97,0 100,0

Missing Total

Izvor: Simulirani podaci.

Prema podacima u tablici 6.5. proporcija uzorka ispitanika kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p=

m 104 = = 0,439 ; q = 1 p = 1 0,439 = 0,561 . n 237

212

Ocjene parametara osnovnog skupa na osnovu uzorka

S obzirom na to da je veliina uzorka 237 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija; b) Potrebno je napomenuti da program SPSS nema mogunost direktnog izrauna intervalne procjene proporcije osnovnog skupa na osnovi uzorka. Intervalna procjena proporcije osnovnog skupa na osnovi uzorka uz pouzdanost procjene od 95% je:
Pr{p Z Se( p) < P < p + Z Se( p)} = 1 , n > 30 Se( p) = pq = n 0,439 0,561 = 0,032235879 237

Pomou tablica odgovarajuih povrina ispod normalne krivulje vrijedi da je:


Z 1
0 , 95 = = 0 , 475 2 2

Z = 1,96

tab

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne procjene dobije se:


Pr{0,439 1,96 0,032235879 < P < 0,439 + 1,96 0,032235879} = 95% ,

Konano je intervalna procjena proporcije ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe na osnovi zadanog uzorka uz pouzdanost procjene od 95%:
Pr{0,3758 < P < 0,50218} = 95% .

c) Na slian nain intervalna procjena proporcije ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe na osnovi uzorka uz pouzdanost procjene od 99% je:
Z 1
2
=

0 , 99 = 0 , 495 2

Z = 2,58

tab

Pr{0,439 2,58 0,032235879 < P < 0,439 + 2,58 0,032235879} = 99% ,

213

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pr{0,35583 < P < 0,52217} = 99% .

Moe se zakljuiti da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.

Analitiki primjer 6.4. Za zadani uzorak ispitanika (koji su odgovorili na postavljeno pitanje) potrebno je: a) Izraunati proporciju uzorka ispitanika kojima su roditelji razvedeni (varijabla v1)! b) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su roditelji razvedeni uz pouzdanost procjene od 95%! c) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su roditelji razvedeni uz pouzdanost procjene od 98%! Rjeenje 6.4: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - brano stanje roditelja pomou odgovarajue strelice prebaciti u Variable(s). Tablica 6.6 Podaci o branom stanju roditelja ispitanika
Bracno stanje roditelja Frequency 215 10 11 3 239 Percent 90,0 4,2 4,6 1,3 100,0 Valid Percent 90,0 4,2 4,6 1,3 100,0 Cumulative Percent 90,0 94,1 98,7 100,0

Valid

U braku Rastavljeni Umro jedan od roditelja Ostalo Total

Izvor: Simulirani podaci. 214

Ocjene parametara osnovnog skupa na osnovu uzorka

Da bi se u Outputu programa SPSS dobili eljeni podaci o branom stanju roditelja ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.6. Prema podacima u tablici 6.6. proporcija uzorka ispitanika kojima su roditelji razvedeni omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p= m 10 = = 0,042 ; q = 1 p = 1 0,042 = 0,958 . n 239

S obzirom na to da je veliina uzorka 239 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija. b) Intervalna procjena proporcije u osnovnom skupu onih stanovnika kojima su roditelji razvedeni na osnovi uzorka uz pouzdanost procjene od 95% je:
Pr{p Z Se( p) < P < p + Z Se( p )} = 1 , n > 30 Se( p) = pq = n 0,042 0,958 = 0,012975032 239

Pomou tablica odgovarajuih povrina ispod normalne krivulje vrijedi da je:


Z 1
0 ,95 = = 0 , 475 2 2

Z = 1,96

tab

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne procjene dobije se:


Pr{0,042 1,96 0,012975032 < P < 0,042 + 1,96 0,012975032} = 95% .

Konano je intervalna procjena proporcije ispitanika osnovnog skupa kojima su roditelji razvedeni na osnovi zadanog uzorka uz pouzdanost procjene od 95%:
Pr{0,0166 < P < 0,0674} = 95% .

c) Na slian nain intervalna procjena proporcije ispitanika osnovnog skupa kojima su roditelji razvedeni na osnovi uzorka uz pouzdanost procjene od 98% je:

215

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA


tab

Z 1

0 , 98 = = 0, 49 2 2

Z = 2,33 ,

Pr{0,042 2,33 0,032235879 < P < 0,042 + 2,33 0,032235879} = 98% , Pr{0,01177 < P < 0,07223} = 98% .

I ovdje vrijedi jednak zakljuak da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.

216

Analitiki primjeri za vjebu

7. ANALITIKI PRIMJERI ZA VJEBU

Analitiki primjer 7.1. Nakon provedene ankete potrebno je u dokument (Variable View) programa SPSS upisati varijablu (obiljeje): Brano stanje (v3) i kodirati je prema zadanoj tablici 7.1. Tablica 7.1. Kodna lista za varijablu Brano stanje
OBILJEJE bracno stanje (v3) OBLICI OBILJEJA neozenjen (neudana) ozenjen (udana) razveden (razvedena) udovac (udovica) KOD 1 2 3 4

Izvor: Podaci su simulirani.

Nakon kodiranja zadatak je unijeti konkretne podatke za 50 ispitanika zadane u tablici 7.2. u navedeni dokument (Data View). Tablica 7.2. Tablica s kodiranim podacima za varijablu Brano stanje
(1) (2) 2 1 2 1 1 2 1 2 1 1 1 1 1 3 2 1 2 2 2 1 Izvor: Podaci su simulirani. Brano stanje (3) 1 4 1 1 2 2 1 1 3 1 (4) 1 1 1 1 2 2 2 2 3 1 (5) 2 2 2 1 2 2 1 1 1 2

217

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 7.1: U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana. Varijablu je potrebno nazvati (Name) v3. Radi lakeg rada s podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label oznaeno je da je varijabla v3: Brano stanje. Zadnji stupac definira skalu mjerenja (Measure), gdje je za v3 - Brano stanje oznaena opisna, tj. Nominal skala. U stupcu Values za varijablu v3 - Brano stanje uneseni su kodovi prema tablici 7.1. Klikom mia u polje stupca Values otvara se prozor Value Labels u kojem se definira konkretno kodiranje. To je za ovaj primjer prikazano na slici 7.1. Slika 7.1. Prikaz definiranih varijabli u programu SPSS

Izvor: Podaci su simulirani.

U programu SPSS podaci prema definiranim varijablama se unose u dijelu Data view koji se bira u donjem lijevom kutu ekrana. Na slici 7.2 prikazani su podaci o branom stanju dijela ispitanika prema zadanim podacima u tablici 7.2 (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu
218

Analitiki primjeri za vjebu

padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom. Slika 7.2. Prikaz podataka varijable v3 - Brano stanje za dio ispitanika u programu SPSS

Izvor: Podaci su simulirani.

Analitiki primjer 7.2. Zadatak je formirati statistiku tablicu prema obiljeju "Brano stanje". Komentirajte drugu apsolutnu frekvenciju! Komentirajte prvi relativni broj strukture (Percent)!

219

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 7.2: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. Varijabla v3 - Brano stanje se prebacuje u polje Variable(s). Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablicama 7.3. Tablica 7.3.
Bracno stanje
Frequency Percent Valid Percent Cumulative Percent

Valid

neozenjen (neudana) ozenjen (udana) razveden (razvedena) udovac (udovica) Total

26 20 3 1 50

52,0 40,0 6,0 2,0 100,0

52,0 40,0 6,0 2,0 100,0

52,0 92,0 98,0 100,0

Izvor: Podaci su simulirani.

Druga apsolutna frekvencija je 20 i ona u prvom sluaju znai da je od 50 odabranih ispitanika njih 20 bilo oenjenih (udanih). Prvi relativni broj strukture je 52 i on znai da je meu odabranim ispitanicima njih 52% neoenjenih (neudanih).

Analitiki primjer 7.3. Zadatak je 50 anketiranih ispitanika prikazati jednostavnim stupcima prema obiljeju "Brano stanje" (upisati naslov grafikona)! Komentirajte sliku! Rjeenje 7.3: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar chart na kojem se aktivira ikona Simple.
220

Analitiki primjeri za vjebu

Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Brano stanje (v3). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.3. Slika 7.3.
Ispitanici prema bracnom stanju

30

25

20

Count

15

10

0 neozenjen (neudana) ozenjen (udana) razveden (razvedena) udovac (udovica)

Bracno stanje

Izvor: Podaci su simulirani.

Prema grafikonu jednostavnih stupaca moe se vidjeti da je meu odabranim ispitanicima najvie neoenjenih (neudanih), a najmanje onih koji su udovac ili udovica. Razvedenih ima manje u odnosu na broj oenjenih (udanih) u odabranom uzorku.

221

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 7.4. Za ispitanike prema obiljeju "Visina u cm" izraunajte: aritmetiku sredinu, medijan i mod! Komentirajte sve tri srednje vrijednosti na konkretnom primjeru!

Rjeenje 7.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v2). Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode, a za medijan Median. Da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.4. Tablica 7.4. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Valid Missing Mean Median 50 0 175,5800 174,5000

Mode 172,00(a) a Multiple modes exist. The smallest value is shown

Izvor: Podaci su simulirani.

222

Analitiki primjeri za vjebu

Prema podacima iz tablice 3.3. moe se vidjeti da je u analizi 50 ispitanika. Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 175,58 cm. Medijan je 174,5 cm, to znai da je polovica ispitanika s visinom manjom od 174,5 cm ili jednakom tom visinom, a preostala polovica ispitanika je s visinom veom od 174,5 cm. Mod, odnosno najea visina ispitanika, 172 je cm. Ispod tablice je naznaka da u ovoj distribuciji to nije jedini mod, dakle ovo nije unimodalna distribucija.

Analitiki primjer 7.5. Zadatak je za samo ispitanike "mukog spola" formirati tablicu frekvencija prema varijabli (obiljeju) "kolska sprema". Komentirajte 4. apsolutnu frekvenciju i opseg ovoga izabranog statistikog skupa! Rjeenje 7.5: Nakon odabira (filtriranja) ispitanika mukog spola (Data; Select cases; If condition is satisfied: v1 = 2 ) koji je u obiljeju spol kodiran s 2, potrebno je na glavnom izborniku odabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - kolska sprema se prebacuje u polje Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o kolskoj spremi odabranih ispitanika mukog spola, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.5. Prema podacima iz tablice 7.5 moe se vidjeti da su u analizi 22 ispitanika mukog spola. etvrta apsolutna frekvencija je 13, to znai da je 13 ispitanika u analizi bilo sa srednjom strunom spremom.

223

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 7.5. Statistiki podaci o kolskoj spremi ispitanika


Skolska sprema
Frequency Percent Valid Percent Cumulative Percent

Valid

Nisam pohadjao skolu Osnovna skola Neka zanatska skola Srednja skola Visa skola Visoka skola Magisterij Total

1 1 1 13 1 4 1 22

4,5 4,5 4,5 59,1 4,5 18,2 4,5 100,0

4,5 4,5 4,5 59,1 4,5 18,2 4,5 100,0

4,5 9,1 13,6 72,7 77,3 95,5 100,0

Izvor: Podaci su simulirani.

Analitiki primjer 7.6. Svih 50 anketiranih ispitanika prema varijabli (obiljeju) "kolska sprema" prikaite grafiki pomou strukturnoga kruga (upisati naslov grafikona)! Komentirajte sliku! Rjeenje 7.6: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Pie chart, na kojem se aktivira Summaries of groups of case. Odabirom ikone Define otvara se prozor Define Pie: Summaries for Groups of Cases gdje se u prostor Define Slices by prebaci eljena varijabla, to je u ovom sluaju kolska sprema (v2). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.4.

224

Analitiki primjeri za vjebu

Slika 7.4.
Ispitanici prema skolskoj spremi

Skolska sprema
Nisam pohadjao skolu Osnovna skola Neka zanatska skola Srednja skola Visa skola Visoka skola Magisterij Doktorat

Izvor: Podaci su simulirani.

Prema grafikonu strukturnoga kruga moe se vidjeti da je meu odabranim ispitanicima najvie onih sa srednjom strunom spremom, zatim slijede oni s zavrenom visokom i viom kolom. Ostale kategorije strune spreme u ovom su uzorku manje zastupljene.

Analitiki primjer 7.7. Ispitanike prema obiljeju "teina u kg" potrebno je grupirati na
sljedei nain: 41 51 61 71 81 - 50 - 60 - 70 - 80 - 90

50 60 70 80 90

225

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

91 101

- 100 - 110

100 110.

Nova varijabla je v4, a predstavlja "Grupiranu teinu". Za ovu varijablu "Grupirana teina" formirajte tablicu frekvencija i komentirajte 3. relativni broj strukture (Percent)! Rjeenje 7.7: Da bi se pomou varijable v3 - "Teina u kg" formirala nova varijabla v4 - "Grupirana teina" po principu koji je zadan u ovom primjeru, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v3 - " Teina u kg ", a u Output Variable, Name je v4, a Label "Grupirana teina". Tablica 7.6. Statistiki podaci o kolskoj spremi ispitanika
Grupirana tezina Frequency 4 14 15 7 5 4 1 50 Percent 8,0 28,0 30,0 14,0 10,0 8,0 2,0 100,0 Valid Percent 8,0 28,0 30,0 14,0 10,0 8,0 2,0 100,0 Cumulative Percent 8,0 36,0 66,0 80,0 90,0 98,0 100,0

Valid

50,00 60,00 70,00 80,00 90,00 100,00 110,00 Total

Izvor: Podaci su simulirani.

Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range upisuju se odgovarajue grupe ocjena, kako je zadano. Nakon upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve

226

Analitiki primjeri za vjebu

grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View kreirat e se nova varijabla "Grupirana teina", odnosno v4. Trei relativni broj strukture iznosi 30 i znai da je 30% ispitanika u uzorku s teinom izmeu 61 kg i 70 kg.

Analitiki primjer 7.8. Za sve ispitanike prema varijabli "teina u kg" izraunajte medijan, donji i gornji kvartil! Komentirajte sve 3 karakteristine vrijednosti niza!

Rjeenje 7.8: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v3). Da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.7. Tablica 7.7. Statistiki podaci o teini ispitanika
N Median Percentiles Valid Missing 25 50 75 Statistics 50 0 63,5000 55,7500 63,5000 77,2500

Izvor: Podaci su simulirani.

227

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema podacima iz tablice 7.7. moe se vidjeti da je u analizi bilo 50 ispitanika. Medijan je 63,5 kg, to znai da je polovica ispitanika s teinom manjom od 63,5 kg ili jednakom teinom, a preostala polovica ispitanika je s teinom veom od 63,5 kg. Donji kvartil je 55,75 kg, to znai da je 25% ispitanika s teinom manjom od 55,75 cm ili jednakom teinom, a preostalih 75% ispitanika je s teinom veom od 55,75 kg. Gornji kvartil je 77,25 kg, to znai da je 75% ispitanika s teinom manjom od 77,25 kg ili jednakom teinom, a preostalih 25% ispitanika je s teinom veom od 77,25 kg.

Analitiki primjer 7.9. Nakon provedene ankete potrebno je u dokument (Variable View) programa SPSS upisati varijablu (obiljeje): Materijalno stanje (v3) i kodirati je prema zadanoj tablici 7.8. Tablica 7.8. Kodna lista za varijablu Materijalno stanje
OBILJEJE materijalno stanje (P3) OBLICI OBILJEJA Vrlo dobro Dobro Skromno, ali dovoljno Slabo Veoma slabo KOD 1 2 3 4 5

Izvor: Podaci su simulirani.

Nakon kodiranja zadatak je unijeti konkretne podatke za 50 ispitanika zadane u tablici 7.8. u navedeni dokument (Data View).

228

Analitiki primjeri za vjebu

Tablica 7.9. Tablica s kodiranim podacima za varijablu Materijalno stanje


(1) (2) Materijalno stanje (3) 1 4 1 1 2 (4) (5)

2 2 2 3 3 2 2 2 2 2

2 2 2 2 1 1 4 2 2 2

5 2 2 5 2

2 4 5 2 3 5 2 2 2 2

2 3 3 2 4 3 2 2 3 2

Izvor: Podaci su simulirani.

Rjeenje 7.9: U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana. Slika 7.5. Prikaz definiranih varijabli u programu SPSS

Izvor: Podaci su simulirani.

Varijablu je potrebno nazvati (Name) v3. Radi lakeg rada s podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label
229

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

oznaeno je da je varijabla v3: Materijalno stanje. Zadnji stupac definira skalu mjerenja (Measure) gdje je za v3 - Materijalno stanje oznaena opisna, tj. Nominal skala. U stupcu Values za varijablu v3 - Materijalno stanje uneseni su kodovi prema tablici 7.8. Klikom mia u polje stupca Values otvara se prozor Value Labels u kojem se definira konkretno kodiranje. To je za ovaj primjer prikazano na slici 7.5. U programu SPSS podaci prema definiranim varijablama unose se u dijelu Data view koji se bira u donjem lijevom kutu ekrana. Na slici 7.6 prikazani su podaci o materijalnom stanju dijela ispitanika prema zadanim podacima u tablici 7.9 (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom. Slika 7.6. Prikaz podataka varijable v3 - Materijalno stanje za dio ispitanika u programu SPSS

Izvor: Podaci su simulirani.

230

Analitiki primjeri za vjebu

Analitiki primjer 7.10. Zadatak je formirati statistiku tablicu prema obiljeju "Materijalno stanje". Komentirajte drugu apsolutnu frekvenciju! Komentirajte etvrti i peti relativni broj strukture (Percent)! Rjeenje 7.10: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. Varijabla v3 - Materijalno stanje se prebacuje u polje Variable(s). Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 7.10. Tablica 7.10.
Materijalno stanje
Frequency Percent Valid Percent Cumulative Percent

Valid

Vrlo dobro Dobro Skromno, ali dovoljno Slabo Veoma slabo Total

2 32 8 4 4 50

4,0 64,0 16,0 8,0 8,0 100,0

4,0 64,0 16,0 8,0 8,0 100,0

4,0 68,0 84,0 92,0 100,0

Izvor: Podaci su simulirani.

Druga apsolutna frekvencija je 32 i ona u ovom sluaju znai da je od 50 odabranih ispitanika njih 32 s dobrim materijalnim stanjem. etvrti i peti relativni brojevi strukture su 8, to znai da je meu odabranim ispitanicima njih po 8% sa slabim i veoma slabim materijalnim stanjem.

231

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 7.11. Zadatak je 50 anketiranih ispitanika prikazati strukturnim krugom prema obiljeju "Materijalno stanje" (upisati naslov grafikona)! Komentirajte sliku! Rjeenje 7.11: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Pie chart na kojem se aktivira Summaries of groups of case. Odabirom ikone Define otvara se prozor Define Pie: Summaries for Groups of Cases gdje se u prostor Define Slices by prebaci eljena varijabla, to je u ovom sluaju Materijalno stanje (v3). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.7. Slika 7.7.
Ispitanici prema materijalnom stanju

Materijalno stanje
Vrlo dobro Dobro Skromno, ali dovoljno Slabo Veoma slabo

Izvor: Podaci su simulirani.

232

Analitiki primjeri za vjebu

Prema grafikonu strukturnog kruga moe se vidjeti da je meu odabranim ispitanicima najvie onih s dobrim materijalnim stanjem, zatim slijede oni koji su se izjasnili da im je materijalno stanje skromno, ali dovoljno. Ostale kategorije materijalnog stanja u ovom su uzorku manje zastupljene, a moe se uoiti da onih ije je materijalno stanje vrlo dobro ima najmanje.

Analitiki primjer 7.12. Za ispitanike prema obiljeju "Teina u kg" izraunajte: aritmetiku sredinu i medijan! Komentirajte te dvije srednje vrijednosti na konkretnom primjeru! Pokaite da vrijedi svojstvo aritmetike sredine
da je: xmin X xmax .

Rjeenje 7.12: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - teina u kg se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v3). Tablica 7.11. Statistiki podaci o teini ispitanika
Statistics Tezina u kg N Mean Median Minimum Maximum Valid Missing 50 0 67,5400 63,5000 46,00 102,00

Izvor: Podaci su simulirani.

233

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.11. Prema podacima iz tablice 7.11. moe se vidjeti da je u analizi bilo 50 ispitanika. Aritmetika sredina, ispitanika je 67,54 kg. odnosno prosjena teina odabranih

Medijan je 63,5 kg, to znai da je polovica ispitanika s teinom manjom od 63,5 ili jednakom tom teinom, a preostala polovica ispitanika je s teinom veom od 63,5 kg. Da bi se dokazalo svojstvo aritmetike sredine da se ona nalazi izmeu najmanje i najvee vrijednosti niza, potrebno je pronai najmanju i najveu vrijednost. Prema podacima u tablici 7.11 vrijedi da je:
x min X x max 46 kg X 102 kg .

Analitiki primjer 7.13. Zadatak je za samo ispitanike "enskog spola" formirati tablicu frekvencija prema varijabli (obiljeju) "Abortus". Komentirajte 2. apsolutnu frekvenciju i 3. relativni broj strukture (Percent) ovog izabranoga statistikog skupa! Rjeenje 7.13: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. Varijabla v2 - Abortus se prebacuje u polje Variable(s). Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 7.12. Druga apsolutna frekvencija je 17 i ona u ovom sluaju znai da od 50 odabranih ispitanika njih 17 smatra da je abortus doputen u sluajevima silovanja. Trei relativni brojevi strukture je 4, to znai da je
234

Analitiki primjeri za vjebu

meu odabranim ispitanicima njih 4% koji su se izjasnili da su za to da abortus bude doputen onda kada znaajno remeti obiteljski ivot. Tablica 7.12.
Abortus
Frequency Percent Valid Percent Cumulative Percent

Valid

Ubojstvo Dopusten u slucajevima silovanja Dopusten kada znacajno remeti obiteljski zivot Iskljuciva odluka zene Total

26 17 2 5 50

52,0 34,0 4,0 10,0 100,0

52,0 34,0 4,0 10,0 100,0

52,0 86,0 90,0 100,0

Izvor: Podaci su simulirani.

Analitiki primjer 7.14. Svih 50 anketiranih ispitanika prema varijabli (obiljeju) "Abortus" prikaite grafiki pomou jednostavnih stupaca (upisati naslov grafikona)! Komentirajte sliku!

Rjeenje 7.14: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar chart na kojem se aktivira ikona Simple. Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Abortus (v2). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.8. Prema grafikonu jednostavnih stupaca moe se vidjeti da je meu odabranim ispitanicima najvie onih koji smatraju da je abortus ubojstvo, a najmanje onih koji smatraju da je abortus doputen kada znaajno
235

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

remeti obiteljski ivot. Veliki dio ispitanika smatra da je abortus doputen u sluajevima silovanja. Slika 7.8.

Ispitanici prema misljenju o abortusu

30

25

20

Count

15

10

0 Ubojstvo Dopusten u slucajevima Dopusten kada znacajno silovanja remeti obitelski zivot Iskljuciva odluka zene

Abortus

Izvor: Podaci su simulirani.

Analitiki primjer 7.15. Za sve ispitanike prema varijabli "visina u cm" izraunajte aritmetiku sredinu! Komentirajte izraunatu srednju vrijednost! Pokaite da vrijedi svojstvo aritmetike sredine da je: ( xi X ) = 0 (za negrupirani
i =1 N

niz). (Neka to bude preko nove varijable v4, a trai se njezin zbroj: Sum = 0 ).

236

Analitiki primjeri za vjebu

Rjeenje 7.15: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v3). Da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.13. Tablica 7.13. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Valid Missing Mean 50 0 175,0400

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.13 moe se vidjeti da je u analizi bilo 50 ispitanika. Aritmetika sredina odnosno prosjena visina odabranih ispitanika je 175,04 cm. Da bi se dokazalo svojstvo aritmetike sredine da je zbroj odstupanja vrijednosti obiljeja od prosjeka jednak 0, potrebno je formirati novi stupac (varijablu) gdje e se izraunati ta odstupanja. Zbroj svih podataka iz toga novog stupca mora biti 0. Na glavnom izborniku potrebno je odabrati Transform, a na njegovu padajuem izborniku bira se Compute. Na taj se nain otvori prozor Compute Variable gdje se raunaju odstupanja od prosjeka kao nova varijabla v4. Pod Target Variable upisuje se novo ime v4, a u Numeric Expression se upisuje: v3 175,04 , odnosno da se od svih vrijednosti
237

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

varijable v3 oduzme njihov prosjek 175,04. Potrebno je napomenuti da se decimalni zarez u programu SPSS oznaava tokom. Klikom na OK u prostoru Data View formira se nova varijabla v4. Da bi se vidio zbroj podataka u ovom stupcu na glavnom izborniku, potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Descriptives. Varijabla v4 prebacuje se u Variable(s). U Options je potrebno aktivirati Sum (dok se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne). Tablica 7.14. Zbroj odstupanja vrijednosti obiljeja od prosjeka
Descriptive Statistics N v4 Valid N (listwise) 50 50 Sum ,00

Izvor: Podaci su simulirani.

Suma vrijednosti novoformirane varijable v4 u zadnjem stupcu tablice 7.14 je 0, ime je dokazano navedeno svojstvo aritmetike sredine.

Analitiki primjer 7.16. Za varijablu (obiljeje) prosjena ocjena na I. godini studija (v1) odredite: standardnu devijaciju i asimetriju distribucije (Skewness). Komentirajte izraunate vrijednosti na konkretnom primjeru! Rjeenje 7.16: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - prosjena ocjena na I. godini studija prebacuje se u polje Variable(s).

238

Analitiki primjeri za vjebu

Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Da bi se u Outputu programa SPSS dobili eljeni podaci o varijabli prosjena ocjena na I. godini studija ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.15. Tablica 7.15.
Statistics PROSJECNA OCJENA NA I.GODINI N Valid Missing Std. Deviation Skewness Std. Error of Skewness 40 0 ,88252 -,018 ,374

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.15 moe se vidjeti da je u analizi 40 ispitanika. Standardna devijacija, odnosno prosjeno odstupanje vrijednosti zadanog obiljeja od aritmetike sredine je 0,88. Prema pokazatelju asimetrije (Skewness) moe se zakljuiti da je zadana distribucija lagano negativno ili ljevostrano asimetrina.

Analitiki primjer 7.17. Izraunati dvodimenzionalnu distribuciju vjerojatnosti: za - varijablu (obiljeje) prosjena ocjena na I godini studija (v1) koja se mijenja po redcima (row) i za - varijablu (obiljeje) grupirani dzeparac (v2) koja se mijenja po stupcima (column). a) Komentirajte marginalnu vjerojatnost da je deparac 400 kn u izraunatoj dvodimenzionalnoj distribuciji!

239

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

b) Komentirajte vjerojatnost da ispitanik ima deparac 400 kn i prosjenu ocjenu na I. godini studija 4 prema izraunatoj dvodimenzionalnoj distribuciji!

Rjeenje 7.17: a) Na glavnom izborniku potrebno je odabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Nakon toga otvara se prozor Crosstabs. Odgovarajuim strelicama prema zahtjevu zadatka potrebno je varijablu (obiljeje) prosjena ocjena na I godini studija (v1) prebaciti u prozor za retke Row(s) i varijablu (obiljeje) grupirani dzeparac (v2) prebaciti u prozor za stupce Column(s). Klikom na ikonu Cells... otvara se prozor Crosstabs: Cell Display gdje je uz postojee originalne frekvencije (Counts) potrebno aktivirati Percentages; Total. Tablica 7.16. Dio dvostruke tablice obiljeja prosjena ocjena na I. godini studija i grupirani deparac

Izvor: Podaci su simulirani.

240

Analitiki primjeri za vjebu

Da bi se u Outputu programa SPSS dobili traeni podaci, potrebno je kliknuti na Continue i OK. Rezultati su prikazani u tablici 7.16. Izraunate vjerojatnosti marginalne distribucije nalaze se u zbirnom retku i zbirnom stupcu (koji nije prikazan u tablici) tablice 7.16. Trea marginalna vjerojatnost u zbirnom retku iznosi 20%, tj. vjerojatnost da ispitanik ima deparac 400 kn, bez obzira na prosjenu ocjenu na I. godini studija iznosi 0,2. b) Vjerojatnost da ispitanik ima deparac 400 kn i prosjenu ocjenu na I. godini studija 4 prema izraunatoj dvodimenzionalnoj distribuciji u tablici 7.16 je 12,5%, odnosno 0,125. Analitiki primjer 7.18. Uz pretpostavku da promatrane sluajne varijable prosjena ocjena na I. godini studija (v1) i grupirani dzeparac (v2) nisu nezavisne, izraunajte uvjetnu distribuciju vjerojatnosti: P(v1 / v 2 = 200) ! Rjeenje 7.18: Uz pretpostavku da promatrane sluajne varijable nisu nezavisne, uvjetna distribucija vjerojatnosti P(v1 / v 2 = 200) pomou podataka u tablici 7.16 izraunata je na sljedei nain i prikazana je u tablici 7.17:
P(v1 = 1 / v 2 = 200) = P(v1 = 1, v 2 = 200) 0,025 = = 0,052632 , P(v 2 = 200) 0,475
P(v1 = 5, v 2 = 200) 0,000 = = 0,000 . P(v 2 = 200) 0,475

..................
P(v1 = 5 / v 2 = 200) =

Zbroj vjerojatnosti u ovoj marginalnoj distribuciji vjerojatnosti jednak je 1.

241

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 7.17. Uvjetna distribucija vjerojatnosti


v1 P(v1 / v 2 = 200) 1 0,05263 2 0,21053 3 0,52632 4 0,21053 5 0,000

Izvor: Izraunato prema podacima u tablici 7.16.

Analitiki primjer 7.19. Za zadani uzorak ispitanika izraunajte aritmetiku sredinu prosjena ocjena na I godini studija (v1). Za izraunatu srednju vrijednost potrebno je izraunati interval procjene za prosjek osnovnog skupa uz pouzdanost procjene od 99%! Komentirajte rezultate! Rjeenje 7.19: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Explore. U otvorenom prozoru Explore potrebno je zadanu numeriku varijablu v1 - prosjena ocjena na I godini studija pomou odgovarajue strelice prebaciti u Dependent List. U prostoru Display potrebno je aktivirati Statistics. Klikom na ikonu Statistics otvara se novi prozor Explore: Statistics. Prema zahtjevu zadatka ovdje je izabran nivo pouzdanosti procjene od 99%. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o prosjena ocjena na I. godini studija ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.18. Prema podacima iz tablice 7.18 moe se vidjeti da je prosjena ocjena na I. godini studija ispitanika u uzorku 3,125.

242

Analitiki primjeri za vjebu

Tablica 7.18. Podaci o je prosjenoj ocjeni na I. godini studija ispitanika


Descriptives PROSJECNA OCJENA NA I GODINI Mean 99% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 3,1250 2,7471 3,5029 3,1111 3,0000 ,779 ,88252 1,00 5,00 4,00 1,00 -,018 -,071 Std. Error ,13954

Lower Bound Upper Bound

,374 ,733

Izvor: Podaci su simulirani.

Intervalna procjena aritmetike sredine teine u osnovnom skupu pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{2,75 < X < 3,50} = 99% .

Analitiki primjer 7.20. Za varijablu (obiljeje) dob ispitanika (v1) odredite: koeficijent kvartilne devijacije. Komentirajte izraunatu vrijednost na konkretnom primjeru! Rjeenje 7.20: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - dob ispitanika se prebacuje u polje Variable(s).

243

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Tablica 7.19.
Statistics Dob ispitanika (grupirano) N Valid Missing Percentiles 25 50 75 50 21 20,00 30,00 40,00

Izvor: Podaci su simulirani.

Da bi se u Outputu programa SPSS dobili eljeni podaci o ispitanicima, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.19. Prema podacima iz tablice 7.19 moe se vidjeti da je u analizi 50 ispitanika. Koeficijent kvartilne devijacije je:
Vq = Q3 Q1 40 20 = = 0,333 . Q3 + Q1 40 + 20

Analitiki primjer 7.21. Vjerojatnost da se meu studentskom populacijom konzumira alkohol samo u posebnoj prigodi je: p = 0,038 . a) Kolika je vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) budu 2 studenta koji konzumiraju alkohol samo u posebnoj prigodi? b) Kolika je vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) najvie 15 studenata konzumira alkohol samo u posebnoj prigodi?

244

Analitiki primjeri za vjebu

Rjeenje 7.21: Zadana vjerojatnost sluajnog dogaaja da se meu studentskom populacijom konzumira alkohol je manja od 0,10, a uzorak je vei od 50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X1 ravna po Poissonovu zakonu. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: PDF.POISSON(?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable koja se po Poissonovu zakonu rauna na sljedei nain:
n = 70 ; prob = 0,038 : = n p = 70 0,038 = 2,66 .

U ovom primjeru vrijedi da je:


quant = X 1 ; = 2,66 ,

pa se moe upisati: PDF.POISSON(X1,2.66). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X1Poiss. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X1 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti slian postupak.

245

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku Function and Special Variables: bira Cdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: CDF.POISSON(?,?). U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable:
quant = X 1 ; = 2,66 ,

pa se moe upisati: CDF.POISSON(X1,2.66). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X1CumPoiss. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci kumulativnih vjerojatnosti sluajne varijable X1 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 7.20. Prema rezultatima iz tablice 7.20. (prikazano je samo 13 vrijednosti od ukupno 70 vrijednosti zadane diskontinuirane sluajne varijable X1) mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) budu 2 studenta koji konzumiraju alkohol samo u posebnoj prigodi je:
p( X 1 = 2) = 0,2474628 .

b) Vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) najvie 15 studenata konzumira alkohol samo u posebnoj prigodi je:
p ( X 1 15) = p( X 1 = 0) + p( X 1 = 1) + ... + p ( X 1 = 15) 1.

246

Analitiki primjeri za vjebu

Izraunata vjerojatnost je priblino jednaka 1 jer je zbroj svih 71 vjerojatnosti 1, ali zbog manjeg broja decimalnih mjesta ovaj je rezultat izjednaen s 1. Tablica 7.20. Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Podaci su simulirani.

Analitiki primjer 7.22. Za zadani uzorak ispitanika (onih koji su odgovorili na postavljeno pitanje) potrebno je izraunati proporciju uzorka ispitanika koji nikada ne konzumiraju alkohol (varijabla v1) i izraunati interval procjene za proporciju ispitanika osnovnog skupa koji nikada ne konzumiraju alkohol uz pouzdanost procjene od 95%!

247

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 7.22: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - Konzumirate li alkoholna pia pomou odgovarajue strelice prebaciti u Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o konzumiranju alkohola ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.21. Tablica 7.21 Podaci o konzumiranju alkohola
Konzumirate li alkoholna pica Frequency NIKADA 15 SAMO UZ OBROKE 3 U POSEBNIM PRILIKAMA 32 Total 50 System 21 71 Percent 21,1 4,2 45,1 70,4 29,6 100,0 Valid Percent 30,0 6,0 64,0 100,0 Cumulative Percent 30,0 36,0 100,0

Valid

Missing Total

Izvor: Podaci su simulirani.

Prema podacima u tablici 7.21 proporcija uzorka ispitanika koji nikada ne konzumiraju alkohol omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p= m 15 = = 0,3 ; q = 1 p = 1 0,3 = 0,7 . n 50

S obzirom na to da je veliina uzorka 50 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija. Intervalna procjena proporcije u osnovnom skupu onih stanovnika koji nikada ne konzumiraju alkohol na osnovi uzorka uz pouzdanost procjene od 95% je:
Pr{p Z Se( p) < P < p + Z Se( p)} = 1 ,
248

Analitiki primjeri za vjebu

n > 30

Se( p ) =

pq 0,3 0,7 = = 0,064807406 n 50

Pomou tablica odgovarajuih povrina ispod normalne krivulje vrijedi da je:


Z 1
2

0 ,95 = 0 , 475 2

Z = 1,96

tab

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne procjene dobije se:


Pr{0,3 1,96 0,064807406 < P < 0,3 + 1,96 0,064807406} = 95% ,

Konano je intervalna procjena proporcije ispitanika osnovnog skupa koji nikada ne konzumiraju alkohol na osnovi zadanog uzorka uz pouzdanost procjene od 95%:
Pr{0,17298 < P < 0,427} = 95% .

Analitiki primjer 7.23. Za varijablu (obiljeje) prosjena ocjena na I godini studija (p1) odredite: interkvartil i zaobljenost distribucije (Kurtosis). Komentirajte izraunate vrijednosti na konkretnom primjeru! Rjeenje 7.23: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - prosjena ocjena na I godini studija prebacuje se u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Da bi se u Outputu programa SPSS dobili eljeni podaci o prosjenoj ocjeni na I. godini studija ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.22.
249

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 7.22.
N Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 PROSJECNA OCJENA NA I. GODINI Valid Missing 40 0 -,071 ,733 3,0000 3,0000 4,0000

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.22 moe se vidjeti da je u analizi 40 ispitanika. Interkvartil zadane distribucije moe se izraunati pomou donjeg i gornjeg kvartila:
I q = Q3 Q1 = 4 3 = 1 .

Rasprenost prosjene ocjene na I. godini za srednjih 50% ispitanika je 1 ocjena. Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi -0,071, to upuuje na blago tupi vrh distribucije u odnosu na normalno zaobljenu distribuciju.

Analitiki primjer 7.24. Za varijablu (obiljeje) dob ispitanika (v1) odredite: varijancu. Komentirajte izraunatu vrijednost na konkretnom primjeru! Rjeenje 7.24: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - dob ispitanika prebacuje se u polje Variable(s).

250

Analitiki primjeri za vjebu

Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Da bi se u Outputu programa SPSS dobili eljeni podaci o dobi ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.23. Tablica 7.23.
Statistics Dob ispitanika (grupirano) N Valid Missing Variance 50 0 138,612

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.23 moe se vidjeti da je u analizi 50 ispitanika. Varijanca, odnosno prosjeno kvadratno ispitanika od aritmetike sredine je 138,612 god 2 . odstupanje dobi

Analitiki primjer 7.25. Vjerojatnost da se meu studentskom populacijom ne konzumira alkohol je: p = 0,228 . a) Kolika je vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) budu 2 studenta koji ne konzumiraju alkohol? b) Kolika je vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) najvie 3 studenta ne konzumiraju alkohol? Rjeenje 7.25: Zadana vjerojatnost sluajnog dogaaja da se meu studentskom populacijom ne konzumira alkohol je vea od 0,10, a uzorak je manji od 50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X1 ravna po Binomom zakonu.

251

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Binom i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: PDF.BINOM(?,?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi upitnik funkcije predstavlja veliinu uzorka n , a trei upitnik je vjerojatnost realizacije sluajnog dogaaja p :
quant = X 1 ; n = 6 ; prob = 0,228 ,

pa se moe upisati: PDF.BINOM(X1,6,0.228). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru nazvana je X1Bin. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X1 po Binomnoj distribuciji, potrebno je kliknuti na OK. Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti slian postupak. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku Function and Special Variables: bira Cdf.Binom i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: CDF.BINOM(?,?,?). U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi
252

Analitiki primjeri za vjebu

upitnik funkcije predstavlja veliinu uzorka n , a trei upitnik je vjerojatnost realizacije sluajnog dogaaja p :
quant = X 1 ; n = 6 ; prob = 0,228 ,

pa se moe upisati: CDF.BINOM(X1,6,0.228). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru nazvana je X1CumBin. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci kumulativnih vjerojatnosti sluajne varijable X1 po Binomnoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 7.24. Tablica 7.24. Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti diskontinuirane sluajne varijable po Binomnom zakonu

Izvor: Podaci su simulirani.

Prema rezultatima iz tablice 7.24 mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) budu 2 studenta koji ne konzumiraju alkohol je:
p ( X 1 = 2) = 0,277 .

b) Vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) najvie 3 studenta ne konzumiraju alkohol je:
253

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

p ( X 1 3) = p ( X 1 = 0) + p ( X 1 = 1) + ... + p ( X 1 = 3) = = 0,973.

Analitiki primjer 7.26. Za zadani uzorak ispitanika (onih koji su odgovorili na postavljeno pitanje) potrebno je izraunati proporciju uzorka ispitanika koji konzumiraju alkohol samo u posebnoj prigodi (varijabla v1) i izraunati interval procjene za proporciju ispitanika osnovnog skupa koji konzumiraju alkohol samo u posebnoj prigodi uz pouzdanost procjene od 99%! Rjeenje 7.26: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - Konzumirate li alkoholna pia pomou odgovarajue strelice prebaciti u Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o konzumiranju alkohola ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.25. Tablica 7.25 Podaci o konzumiranju alkohola
Konzumirate li alkoholna pica Frequency NIKADA 15 SAMO UZ OBROKE 3 U POSEBNIM PRILIKAMA 32 Total 50 Percent 30,0 6,0 64,0 100,0 Valid Percent 30,0 6,0 64,0 100,0 Cumulative Percent 30,0 36,0 100,0

Valid

Izvor: Podaci su simulirani.

Prema podacima u tablici 7.25 proporcija uzorka ispitanika koji konzumiraju alkohol samo u posebnoj prigodi omjer je povoljnih i svih
254

Analitiki primjeri za vjebu

moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p= m 32 = = 0,64 ; q = 1 p = 1 0,64 = 0,36 . n 50

S obzirom na to da je veliina uzorka 50 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija. Intervalna procjena proporcije u osnovnom skupu onih stanovnika koji konzumiraju alkohol samo u posebnim prigodama na osnovi uzorka uz pouzdanost procjene od 99% je:
Pr{p Z Se( p) < P < p + Z Se( p )} = 1 , n > 30 Se( p ) =
pq 0,64 0,36 = = 0,0678822 n 50

Pomou tablica odgovarajuih povrina ispod normalne krivulje vrijedi da je:


Z 1
0 , 99 = = 0 , 495 2 2

Z = 2,58

tab

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne procjene dobije se:


Pr{0,64 2,58 0,0678822 < P < 0,64 + 2,58 0,0678822} = 99% ,

Konano je intervalna procjena proporcije ispitanika osnovnog skupa koji konzumiraju alkohol samo u posebnoj prigodi na osnovi zadanog uzorka uz pouzdanost procjene od 99%:
Pr{0,46846 < P < 0,815136} = 99% .

255

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

256

Tablice odabranih statistikih distribucija

8. TABLICE ODABRANIH STATISTIKIH DISTRIBUCIJA


A. Povrine ispod normalne krivulje
P(Z)

257

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

B. Kritine vrijednosti t, Studentove distribucije

258

9. LITERATURA
1. Anderson, D. R. et al. (2002). Statistics for Business and Economics. 8th. Edt. St Paul: West. 2. Anderson, D. R. et al. (1998). Quantitative Methods for Business. 7th. Edt. South-Western College Publishing. 3. Babbie, E. Halley, F. Zaino, J. (2000). Adventures in Social Research. Data Analysis Using SPSSX for Windows 95/98. USA: Pine Forge Press. 4. Beter, M.i Bregar, L. (1986). Ekonomska statistika. Ljubljana. Ekonomska fakulteta. 5. Blejec, M. (1976). Statistike metode za ekonomiste. Ljubljana: Ekonomska fakulteta. 6. Canavos, G. C. and Miller, D. M. (1993). An Introduction to Modern Business Statistics. Belmont. Wadsworth. 7. Cochran, W. G. (1977). Sampling Techniques. New York: Wiley. 8. Dillon, W. R. and Goldstein, M. (1984). Multivariate Analysis, Methods and Applications. New York: Wiley. 9. Dodge, M., Kinata, C. i Stison, C. (1997). Kako koristiti Microsoft Excel 97, Zagreb: Znak. 10. Everit, B. S. (1996). Making Sense of Statistics in Psychology, Oxford: Oxford University Press. 11. Feller, W. (1971). An Introduction to Probability Theory and its Applications. Vol. I and Vol. II, New York:Wiley.

259

12. Fisher, R. A. (1950). Statistical Methods for Research Workers. 11 th Edt. Edinburgh: Oliver and Boyd. 13. Fisher, R. A. (1993). Statistical Methods, Eksperimental Design and Scientific Inference. Oxford: Oxford University Press. 14. Frye, C. (2003). Microsoft Excel 2002 Korak po korak. Zagreb: Algoritam. 15. Fulton, J. (1997). Vodi kroz Excel 97. Zagreb: Znak. 16. Halmi, A. (2003). Multivarijatna analiza u drutvenim znanostima. Alinea. Zagreb 17. Hadivukovi, S. (1975). Tehnika metoda uzorka. Beograd: Nauna knjiga 18. Heij, C. et. al.( 2004). Econometrisc Methods with Applications in Business and Economics, New York : Oxford University Press. 19. Kendall, M. and Stuart, A. (1973). The Advanced Theory of Statistics. Vol I. London: Griffin. 20. Kendall, M. and Stuart, A. (1974). The Advanced Theory of Statistics. Vol II. London: Griffin. 21. Kendall, M. and Stuart, A. (1976). The Advanced Theory of Statistics. Vol III. London: Griffin. 22. Kish, L. (1965). Survey Sampling. New Yor: Wiley. 23. Kolesari, V. i Petz. B. (2003). Statistiki rjenik. Tuma statistikih pojmova. Naklada Slap. 24. Leburi, A. i Krneta, M. (2004). Profil poduzetnika u Hrvatskoj. Socio-ekonomsko istraivanje 2003. Split: Naklada Bokovi.

260

25. de Levie, R. (2004). Advanced Excel for Scientific Data Analysis. Oxford: Oxford University Press. 26. Marti, Lj. (1986). Mjere nejednakosti i siromatva. Zagreb. Birotehnika. 27. Mason, D. R. and Lind, D. A. (1993). Statistical Techniques in Business and Economics. Boston, Masachussetts: IRVIN Publishing. 28. Metre, J. G. and Gilbreath, G. H. (1983). Statistics for Business and Economics. Plano. Texas: Business Publications. 29. Milton, J. S. et al. (1986). Introduction to Statistics. Lexington: D. C. Heath. 30. Momirovi, K. (1998). Uvod u analizu nominalnih varijabli. Metodoloke sveske 2. Ljubljana: JUS. 31. Mood, A. M. and Graybill, F. P. (1963). Introduction to the Theory of Statistics. New York: McGraw-Hill. 32. Neter, J. et al. (1993). Applied Statistics. 4th Edt. Boston: Allyn and Bacon. 33. Newbold, P. (1991). Statistics for Business and Economics. Englewood Cliffs: Prentice-Hall. 34. Paue, . (2003). Vjerojatnost, informacija, stohastiki procesi. Zagreb: kolska knjiga. 35. Pavli, I. (1971). Statistika teorija i primjena. Zagreb: Tehnika knjiga. 36. Pivac, S. and Jurun, E. (2005). Parameter Estimation in Excel, Proceedings of the 28th Internationl Convention MIPRO 2005. Computers in Education, Opatija, pp 168-173.

261

37. Pivac, S. Jurun, E. and Jujnovi, I. (2006). Ocjena parametara nelinearnih funkcija u programskom paketu Statistica na primjeru nezaposlenosti, Proceedings of the 29th Internationl Convention MIPRO 2006. Computers in Education, Opatija, pp 241-245. 38. Pivac, S. Jurun, E. and Jerak. N. (2006). Rjeavanje simultanih jednadbi kao ekonometrijskog modela pomou programskog paketa Excel, Proceedings of the 29th Internationl Convention MIPRO 2006. Computers in Education, Opatija, pp 246-251. 39. Pivac, S. i ego, B. (2005). Statistika, udbenik sa zbirkom zadataka za IV. razred srednje Ekonomske kole, Zagreb: Alkascript. 40. Rozga, A. (2003). Statistika za ekonomiste, Sveuilite u Splitu. Ekonomski fakultet Split. 41. Rozga, A. i Gri, B. (2003). Poslovna statistika, Ekonomski fakultet Split. 42. Seplaki, L. (1991). Atorneys' Dictionary and Handbook of Economics and Statistics, New York: Professional Horizons Press. 43. Siegel, A. F. (1994). Practical Business Statistics. Boston, Masachussetts: IRVIN Publishing. 44. oi, I. (1983). Metode statistike analize. Zagreb: Sveuilina naklada Liber. 45. oi, I. (1985). Zbirka zadataka iz osnova statistike. Zagreb: Sveuilina naklada Liber. 46. oi, I. i Serdar, V. (2002). Uvod u statistiku. XII. izdanje, Zagreb: kolska knjiga. 47. oi, I. (2004). Primijenjena statistika. Zagreb: kolska knjiga.

262

48. Tenjovi, L. (2002). Statistika u psihologiji. Beograd: Centar za primenjenu psihologiju. 49. arkovi, S. S. (1965). Sampling Methods and Censuses. Rim:FAO 50. Whigham, D. (1998). Quantitative Business Methods Using Excel. Oxford University Press. 51. Wonnacott, T. H. and Wonnacott, R. J. (1990). Introductory Statistics for Business and Economics (fourth edition). New York: Wiley. 52. The Central Bureau of Statistics. Republic of Croatia: URL: http:// www.dzs.hr

263

BILJEKA O AUTORICI I AUTORU


SNJEANA PIVAC, roena 1972. u Splitu, gdje je zavrila osnovnu i srednju kolu. Nakon studija na Ekonomskom fakultetu u Splitu, gdje je kao izvrstan student diplomirala u roku od tri godine, magistrira i doktorira pri Ekonomskom fakultetu u Zagrebu u znanstvenom polju ekonomije, grani kvantitativna ekonomija. Trenutno radi kao docentica na katedri kvantitativnih metoda u ekonomiji, na Ekonomskom fakultetu Sveuilita u Splitu. Istrauje i objavljuje znanstvene radove iz ekonomske statistike, ekonometrije, ocjene parametara nelinearnih funkcija, modelske analize racionalnih oekivanja, modeliranja u uvjetima naruenih osnovnih pretpostavki, statistike u drutvenim istraivanjima i kvantitativnih financija. Koautorica je knjige: Statistika, udbenik sa zbirkom zadataka za IV. razred srednje Ekonomske kole, (Zagreb,Alkascript, 2005.). Trenutno sudjeluje u meunarodnom projektu The impact of the current and future Europe enlargement on a financial integrated market, Facolta di Economia, Udine, Italija, i projektu MZOS R Hrvatske Matematiki modeli u financijskom upravljanju. Tajnica je Hrvatskog drutva za operacijska istraivanja i lanica American Statistical Association. e-mail: spivac@efst.hr ANTE ROZGA, roen 1951. u Splitu. Diplomirao statistiku na Sveuilitu u Zagrebu. Poslijediplomske studije pohaao na Ekonomskom fakultetu u Zagrebu i The London School of Economics. Magistrirao i doktorirao iz vremenskih nizova. Izabran kao izvanredni profesor na Ekonomskom fakultetu u Splitu i Medicinskom fakultetu u Zagrebu. Predaje na Ekonomskom fakultetu, FESB-u, Filozofskom fakultetu, te studiju farmacije. Izmeu ostalih drao pozvana predavanja u Hrvatskoj narodnoj banci i na PMF-u Splitu. Gostovao na Sveuilitima u Padovi, Veneciji, Londonu i Cambridgeu. Sudjelovao na vie znanstvenih skupova. lan je: American Statistical Association, Royal Statistical Society, International Association for Statistical Education, Statistical Society of Canada, Bernoulli Society for Mathematical Statistics and Probability. Podruje interesa: ekonomska statistika, ekonometrija, biostatistika, vremenski nizovi, statistika u zatiti ovjekove okoline, multivarijantna analiza. e-mail: rozga@efst.hr
264

You might also like