Professional Documents
Culture Documents
Josip Milat, dekan Biblioteka: Suvremena nastava Knjiga br. 1 Recenzentice: prof. dr. Elza Jurun prof. dr. Ani Leburi doc. dr. Mirjana imeija Lektorica: Sonja Krvavica, prof. Dizajn naslovnice: Baldo Leburi Grafika obrada: doc. dr. Snjeana Pivac
CIP - Katalogizacija u publikaciji SVEUILINA KNJINICA U SPLITU UDK 311.1(075.8) PIVAC, Snjeana Statistika za socioloka istraivanja / Snjeana Pivac, Ante Rozga. - Split : Filozofski fakultet Sveuilita, 2006. - (Biblioteka Suvremena nastava ; knj. 1) Bibliografija. ISBN 953-7395-01-4 1. Rozga, Ante 120625059
ISBN 953-7395-01-4
za socioloka istraivanja
STATISTIKA
Split, 2006.
SADRAJ
Predgovor ............................................................................... 1. Uvod .................................................................................... 1.1. Pojam i zadaa statistike ................................................... 1.2. Predmet prouavanja statistike ......................................... 1.3. Vrste varijabli - statistika obiljeja ................................. 1.4. Izvori podataka i metode njihova pribavljanja ................. 1.5. Sekundarni podaci ............................................................ 1.6. Primarni podaci ................................................................ 1.7. Naini prikupljanja podataka ........................................... 1.8. Priprema podataka za statistiku analizu ......................... 1.9. Uzorak .............................................................................. 2. Ureivanje i prikazivanje podataka ................................. 2.1. Grupiranje podataka .......................................................... 2.1.1. Nizovi kvalitativnih podataka ............................ 2.1.2. Numeriki niz ..................................................... 2.2. Tabeliranje ........................................................................ 2.3. Relativni brojevi strukture ................................................ 2.4. Grafiko prikazivanje statistikih nizova ......................... 2.5. Relativni brojevi koordinacije i indeksi ........................... 3. Srednje vrijednosti .............................................................. 3.1. Srednje vrijednosti ............................................................. 3.2. Aritmetika sredina ........................................................... 3.3. Mod ................................................................................... 3.4. Harmonijska sredina ......................................................... 3.5. Medijan ............................................................................. 3.5.1.Kvantili ................................................................ 4. Mjere disperzije, asimetrija i zaobljenost ......................... 4.1. Mjere disperzije .................................................................. 4.1.1. Apsolutne mjere disperzije .................................. 4.1.2. Relativne mjere disperzije ................................... 7 9 9 10 11 12 13 14 23 24 25 35 35 36 37 40 43 46 71 103 103 104 107 118 121 124 133 133 133 139
4.1.3. Momenti numerikih nizova ................................ 151 4.2. Mjere asimetrije .................................................................. 152 4.3. Mjera zaobljenosti .............................................................. 156 5. Vjerojatnost .......................................................................... 5.1. Klasina definicija vjerojatnosti .......................................... 5.2. Teorem o zbrajanju vjerojatnosti ......................................... 5.3. Teorem o mnoenju vjerojatnosti ........................................ 5.4. Uvjetna vjerojatnost ............................................................ 5.5. Diskontinuirana sluajna varijabla ...................................... 5.6. Teorijske distribucije diskontinuirane sluajne varijable .... 5.6.1. Binomna distribucija ............................................. 5.6.2. Poissonova distribucija ......................................... 5.6.3. Dvodimenzionalna diskontinuirana distribucija ... 5.6.4. Marginalne distribucije diskontinuirane sluajne varijable ......................................................................... 5.6.5. Uvjetne distribucije diskontinuirane sluajne varijable ......................................................................... 5.7. Kontinuirana sluajna varijabla .......................................... 5.8. Teorijske distribucije kontinuirane sluajne varijable ........ 5.8.1. Normalna distribucija ........................................... 5.8.2. Studentova distribucija ......................................... 6. Ocjene parametara osnovnog skupa na osnovi uzorka ... 6.1. Uzorak ................................................................................. 6.2. Procjena aritmetike sredine osnovnog skupa .................... 6.3. Procjena proporcije osnovnog skupa .................................. 167 167 168 169 170 176 177 177 183 189 190 191 195 196 196 198 201 201 202 209
7. Analitiki primjeri za vjebu .............................................. 217 8. Tablice odabranih statistikih distribucija ........................ 257 A. Povrine ispod normalne krivulje .......................................... 257 B. Kritine vrijednosti t, Studentove distribucije ....................... 258 9. Literatura .............................................................................. 259 Biljeka o autorici i autoru ...................................................... 264
PREDGOVOR
Ovaj udbenik namijenjen je prvenstveno studentima Odsjeka za sociologiju Filozofskog fakulteta u Splitu, ali i svim drugim zainteresiranim korisnicima koji u svom strunom i znanstvenom radu, bavei se drutvenim istraivanjima, primjenjuju statistike metode i tehnike. Rad obuhvaa teorijske osnove i objanjenja za svako u ovaj rad ukljueno podruje statistike. Kroz rjeavanje velikog broja konkretnih analitikih primjera daju se objanjenja dobivenih rezultata i njihovo kritiko vrednovanje. Na kraju udbenika u sklopu posljednjeg poglavlja nalazi se odreeni broj analitikih primjera koji su ostavljeni korisniku za samostalno rjeavanje. Svaki primjer sadri i rjeenja u svrhu kontrole valjanosti usvojenoga gradiva. Na taj nain se studentima ne ostavlja dvojbenim ni nain pismene provjere znanja te ih se osposobljava da samostalno statistiki analiziraju odreene pojave na struno zadovoljavajui nain. Primjeri u udbeniku obraeni su u SPSS - Statistical Package for the Social Sciences, koji je upravo prilagoen sociolokim istraivanjima. Ovaj program prua puno mogunosti za provoenje statikih metoda i tehnika na konkretnim analizama. Naime, upotrebom statistikih paketa, poevi ve od pripremne faze statistikog istraivanja, znatno se skrauje i pojednostavljuje vrijeme potrebno za primjenu statistikih metoda i tehnika. Na taj se nain statistiki postupci pribliavaju mnogim korisnicima. Svaki analitiki primjer rijeen u SPSS-u u tekstu udbenika ima oznaku u obliku slike CD-a. Takovi primjeri su priloeni u elektronikom obliku u dokumentu SPSS i svaki od njih ima i konkretno rjeenje u dokumentu Output programa SPSS. Potrebno je napomenuti da e studenti koji nastave obrazovanje na poslijediplomskim studijima biti pripremljen za struni i znanstveni rad u svojim istraivanjima, gdje se redovito koristi SPSS. Dio studenata koji e se nakon diplomiranja neposredno ukljuiti u poslovnu praksu, takoer e imati koristi, jer je danas SPSS redovito najzastupljenija programska potpora u drutvenim analizama.
Potrebno je napomenuti da je SPSS kompatibilan s Microsoft Excelom, pa se ve postojei podaci iz jednog programa mogu jednostavno kopirati u drugi. Microsoft Excel je jedan od najrairenijih i programa za tabline izraune te je lako dostupan veini korisnika. U radu su koritene oznake i simboli, koji su preuzeti iz standardne statistike literature. Ako se, pak, u literaturi koriste razliite oznake, upotrijebljena je ee spominjana verzija. Na kraju istaknimo, ovaj udbenik je nastao kao rezultat viegodinjeg iskustva autora kod primjene statistikih metoda u izradi brojnih znanstvenih i strunih radova, studija i analiza te kao rezultat predavakog iskustva pri prenoenju znanja iz podruja statistike na mnoge generacije studenata splitskoga Ekonomskog fakulteta i drugih drutvenih znanosti. Za suradnju i niz korisnih sugestija zahvaljujemo recenzenticama prof. dr. Elzi Jurun, prof. dr. Ani Leburi i doc. dr. Mirjani imeija.
Split, rujan 2006. Autori
Uvod
1. UVOD
1.1. Pojam i zadaa statistike Statistika je posebna znanstvena disciplina koja u svrhu realizacije postavljenih ciljeva istraivanja na organiziran nain prikuplja, odabire, grupira, prezentira i vri analizu informacija ili podataka te interpretira rezultate provedene analize. Statistika se kao znanstvena disciplina moe podijeliti na: 1. deskriptivnu statistiku i 2. inferencijalnu statistiku. 1. Deskriptivna ili opisna statistika temelji se na potpunom obuhvatu statistikog skupa iju masu podataka organizirano prikuplja, odabire, grupira, prezentira i interpretira dobivene rezultate analize. Na taj nain se, izraunavanjem razliitih karakteristika statistikog skupa, sirova statistika graa svodi na lake razumljivu i jednostavniju formu. Ako se statistike metode i tehnike primjenjuju na itav statistiki skup, dakle ako su istraivanjem obuhvaeni svi elementi skupa, oni tvore statistiku populaciju. 2. Inferencijalna statistika temelji se na dijelu (uzorku) jedinica izabranih iz cjelovitoga statistikog skupa pomou kojeg se uz primjenu odgovarajuih statistikih metoda i tehnika donose zakljuci o itavom statistikom skupu.
Uvijek je prisutan odgovarajui stupanj rizika kada se koriste rezultati iz uzorka, za koji je poeljno da bude izabran na sluajan nain i da bude reprezentativan. Inferencijalna statistika pripada skupini induktivnih metoda, kojima se izvode zakljuci polazei od opega prema posebnome. 1.2. Predmet prouavanja statistike Statistike metode i tehnike temelj su za provoenje statistike analize drutvenih (i prirodnih) pojava. Predmet prouavanja statistike su odreene zakonitosti koje se javljaju u masovnim pojavama. Zadaa statistike je da uoi zakonitosti u masovnim i sluajnim pojavama te da ih iskae brojano. Masovne pojave su skupine istovrsnih elemenata koji imaju jedno ili vie zajednikih svojstava. Takvu skupinu nazivamo statistikom masom ili statistikim skupom.
Statistiki skup potrebno je definirati pojmovno, prostorno i vremenski. Pojmovno odrediti statistiki skup podrazumijeva odrediti pojam ili svojstvo svakog elementa promatranog skupa. Prostorno odrediti statistiki skup znai odrediti prostor na koji se odnosi ili kojemu pripadaju elementi statistikog skupa. Vremenski odrediti statistiki skup znai odrediti vremenski trenutak ili razdoblje kojim e se obuhvatiti svi elementi koji ulaze u statistiki skup. Analitiki primjer 1.1: Statistiki skup, "studenti 1. godine Filozofskoga fakulteta Odsjeka za sociologiju u Splitu u Republici Hrvatskoj u akademskoj godini 2006./07., na dan 10. 10. 2006. godine", vrlo je precizno odreen i iz takve njegove definicije mogu se odrediti svi njegovi elementi.
10
Uvod
Svojstvo svakog elementa odnosno studenta definirano je najprije pojmovno, tj. jasno je da se radi o studentima 1. godine Filozofskoga fakulteta - Odsjeka za sociologiju. Elementi ovog skupa odreeni su i prostorno, tj. nalaze se u Splitu na podruju Republike Hrvatske. Vremenska definicija toga statistikog skupa upuuje na vremenski interval s kojim su elementi skupa obuhvaeni, tj. akademsku godinu 2006./07. i trenutak u kojem su studenti selektirani, tj. 10. 10. 2006. godine. 1.3. Vrste varijabli - statistika obiljeja Statistika obiljeja su ope karakteristike elemenata statistikog skupa po kojima su ti elementi meusobno slini i po kojima se meusobno razlikuju. Analitiki primjer 1.2: Statistiki skup, "studenti 1. godine Filozofskoga fakulteta Odsjeka za sociologiju u Splitu u Republici Hrvatskoj u akademskoj godini 2006./07., na dan 10. 10. 2006. godine", promatran je prema obiljeju "spol". Sasvim je jasno da je spol jedna od karakteristika svakog studenta. Postoji muki i enski spol. Neki studenti su jednakog spola, a neki se razlikuju po spolu. Potrebno je napomenuti da je u programskom paketu SPSS oznaka za statistika obiljeja: Variable Type. Openito se statistika obiljeja mogu podijeliti: na 1. kvalitativna statistika obiljeja, koja mogu poprimiti razliite oblike, ali se izraavaju opisno. Ako se modalitetima ovog obiljeja sluajno pridrue brojevi, s njima nisu doputene nikakve raunske operacije (u SPSS-u: Variable Type: String).
11
2. kvantitativna statistika obiljeja koja se izraavaju brojano. (u SPSS-u: Variable Type: Numeric). Kvalitativna statistika obiljeja mogu se podijeliti: na a) nominalna statistika obiljeja i na b) redoslijedna statistika obiljeja. a) Nominalna statistika obiljeja izraavaju se opisno. b) Redoslijedna statistika obiljeja mijenjajuse prema intenzitetu ili rangu. Na primjer: uspjeh na ispitu iz predmeta Statistika u sociologiji I (ovdje se javljaju modaliteti obiljeja od 1 do 5, ali se njima ne vre nikakve raunske operacije, ve se pomou njih elementi skupa, odnosno studenti, mogu rangirati). Kvantitativna statistika obiljeja jo se nazivaju i numerika statistika obiljeja, a mogu se podijeliti: na a) neprekidna ili kontinuirana statistika obiljeja i na b) prekidna ili diskontinuirana statistika obiljeja. a) Neprekidna ili kontinuirana statistika obiljeja takva su numerika obiljeja koja mogu poprimiti neprebrojivo beskonano mnogo vrijednosti. Primjeri takvog obiljeja su: visina, teina, duljina, dob itd. b) Prekidna ili diskontinuirana statistika obiljeja takva su numerika obiljeja koja mogu poprimiti prebrojivo beskonano mnogo vrijednosti. Primjeri takvog obiljeja su: broj djece, broj uenika u razredu, starost u godinama, visina plae u kunama itd. 1.4. Izvori podataka i metode njihova pribavljanja Osnovne faze statistikog istraivanja su: a) statistiko promatranje b) grupiranje (tabelarno i grafiko prikazivanje statistikih podataka)
12
Uvod
c) statistika analiza i interpretacija rezultata provedene analize. Statistiko promatranje statistikih podataka. je organizirano prikupljanje
Nakon precizne definicije zadatka, cilja i predmeta istraivanja, tj. statistikog skupa, pristupa se organiziranom prikupljanju statistikih podataka. Uspjenost i objektivnost ovog prvog koraka uvjetuje kvalitetu rezultata ostalih faza statistikog istraivanja. Nepotpune i neistinite prikupljene informacije do kojih bi se dolo u ovoj fazi znaile bi da konaan rezultat statistikog istraivanja sadri greku. Pri tom greka moe biti sistematska i sluajna. Sistematsku greku je lake uoiti jer se ona ponavlja (npr. neispravnost odreenoga mjernog instrumenta, neistinito izjanjavanje ispitanika). Sluajnu greku je teko precizno identificirati, jer se ona ne javlja kod svakog mjerenja i ne javlja se istim intenzitetom. Stoga se kod sluajne greke esto vee pretpostavka o ponitavanju njezin utjecaja na globalnoj razini promatranja. U ovisnosti o karakteru izvora podataka, statistiki podaci se dijele: na a) sekundarne podatke i na b) primarne podatke. 1.5. Sekundarni podaci Sekundarni podaci su oni koji se pribavljaju iz ve postojeih baza podataka razliitih dravnih ustanova. Takvi se podaci prikupljaju sustavno na odgovarajui nain, a njihov opseg ne ovisi o donoenju neke poslovne odluke ili zadanom cilju nekakvog istraivanja. Takve podatke u Hrvatskoj prikupljaju: Dravni zavod za statistiku, Hrvatska narodna banka, Hrvatska gospodarska komora, te neke druge specijalizirane agencije. Jedan od najee koritenih sekundarnih izvora podataka u Hrvatskoj je Statistiki ljetopis Hrvatske u izdanju Hrvatskog zavoda za statistiku. U svjetskim okvirima poznat je World Statistical Yearbook, a internetom su danas dostupne mnoge baze sekundarnih podataka (na primjer: Eurostat, U.S. Census Bureau i
13
slino). Na razini poduzea raznovrsna specifina izvjea o poslovanju i zaposlenicima imaju sekundarni karakter. Sekundarni podaci su uglavnom brojani. Predoeni su tablicama, a vrlo esto i grafikim prikazima. 1.6. Primarni podaci Primarni podaci prikupljaju se neposrednim promatranjem svojstava elemenata statistikog skupa u skladu s unaprijed definiranim ciljevima statistikog istraivanja. Prikupljanje tih podataka zahtijeva definiranje statistikog skupa, izbor obiljeja koja se ele istraiti, odreivanje modaliteta promatranog obiljeja, pripremanje anketnih upitnika i/ili prateih formulara te organiziranje i provoenje samog prikupljanja podataka. Ako se podaci prikupljaju za sve lanove nekog skupa, takvo promatranje naziva se census. Primjer takvog prikupljanja je popis stanovnitva. Vrlo esto su takva istraivanja skupa, pa se podaci prikupljaju za podskup osnovnog skupa, odnosno za uzorak. Takvo promatranje se naziva reprezentativno promatranje. Prema vremenu promatranje moe se podijeliti na jednokratno, periodino i tekue. Jednokratno promatranje provodi se jedanput i nema ponavljanja. Periodino promatranje se ponavlja nakon jednakih perioda (npr. bilanca uspjeha u poduzeu). Za tekue promatranje mjerenje je kontinuirano (npr. proizvodnja mlijeka). Prikupljanje primarnih podataka moe se vriti i pomou statistikih pokusa. Statistikim pokusom se vri mjerenje vrijednosti obiljeja nastalih u kontroliranim uvjetima. Vrlo estu primjenu statistiki pokus ima u marketinkom istraivanju trita. Na primjer, eli se istraiti kako boja pakiranja deterdenta za rublje utjee na kupnju. U takvom sluaju istraiva e u pokusu odrediti razliite boje pakiranja (vrijednosti kontroliranog obiljeja) i u njima e izloiti proizvod. U odreenom vremenu vriti e se mjerenje opsega prodaje. Na taj nain dobiveni statistiki podaci su primarni.
14
Uvod
Statistiki podaci prikupljeni nekom od navedenih metoda predstavljaju "sirovu" statistiku grau koju je potrebno na odgovarajui nain urediti i pripremiti za analizu. Danas se statistiki podaci uglavnom obrauju prikladnim programima za raunalo. Postoje suvremeni statistiki programski paketi koji omoguavaju, uz vrlo jednostavno rukovanje, unos, pripremu i obradu prikupljenih statistikih podataka. Primjeri suvremenih statistikih paketa su: STATISTICA, SAS, SPSS. Kratica SPSS odgovara engleskom nazivu programa Statistical Package for the Social Sciences, koji je upravo prilagoen sociolokim istraivanjima. Spomenuti statistiki paketi se koriste za sloenije statistike analize. Potrebno je napomenuti da je jedan od najpopularnijih softwarea (programskih jezika) za tabline proraune u provoenju razliitih aspekata statistike analize i Microsoft Excel. U podruju programa koji su namijenjeni prvenstveno tablinim proraunima su Lotus 1-2-3 i QuatroPro, ali upotreba MS Excela je najrairenija. MS Excel je u funkciji svih bitnih faza procesa statistike analize od formiranja baze podataka, sreivanja i grupiranja podataka, grafikog prikazivanja statistikih nizova, izrauna temeljnih karakteristika statistikog niza pa sve do sloenijih statistikih analiza i procedura i analize vremenskih nizova. Ovaj program je kompatibilan sa SPSS-om, pa se ve postojei podaci iz jednog programa mogu jednostavno kopirati u drugi. Upotrebom statistikih paketa, poevi ve od pripremne faze statistikog istraivanja, znatno se skrauje i pojednostavljuje vrijeme potrebno za primjenu statistikih metoda i tehnika. Na taj se nain statistiki postupci pribliavaju mnogim korisnicima. Prikupljene statistike podatke potrebno je unijeti i pohraniti u odgovarajuu datoteku odabranog statistikog paketa. Kada se unose podaci kvalitativnog ili opisnog karaktera, potrebno je izvriti ifriranje ili kodiranje vrijednosti takvih obiljeja. U bilo kojem statistikom programskom paketu, pa tako i u SPSSu, potrebno je za svaku varijablu odabrati odgovarajuu skalu mjerenja. U SPSS-u oznaka za skalu mjerenja je Measure i postoje 3 vrste skale mjerenja:
15
Nominal: nominalne skale, za koje se umjesto imena predmeta navodi njegov broj. Brojevi slue samo za identifikaciju. Ordinal: ordinalne skale koje slue za oznaavanje redoslijeda (odreuju je li neto vee ili manje od drugoga). Scale: numerika statistika obiljeja su vezana za intervalnu i omjernu skalu.
Intervalna skala nema apsolutnu nulu (nula u ovom sluaju ne znai nepostojanje promatrane pojave). Na primjer: obiljeje "temperatura zraka" 00C ne upuuje na nepostojanje temperature. Vrijednosti ove skale ne mogu se dijeliti, (50C na nekom podruju u odnosu na 150C na nekom drugom podruju ne znai da je na jednom mjestu bilo tri puta hladnije u odnosu na to drugo). Omjerna skala ima apsolutnu nulu (nula podrazumijeva nepostojanje svojstva). Omjeri znae i jednake odnose u mjerenom svojstvu. Na primjer: duina, teina, visina uteevine na raunu u banci. Analitiki primjer 1.3: Zaposleni u poduzeu "P" u mjestu "M" na dan 30. 09. 2006. godine statistiki su skup. Promatrani su prema sljedeim obiljejima: - dob, godine staa, spol, struna sprema, plaa u kunama, visina, teina, brano stanje, stambena situacija, broj lanova u obitelji, mjesto roenja. a) Zadatak je utvrditi kojim vrstama statistikih obiljeja pripadaju navedena obiljeja? Rjeenje 1.3: Navedena obiljeja pripadaju sljedeim vrstama: - dob: numeriko (kontinuirano) obiljeje - godine staa: numeriko (diskontinuirano) obiljeje - spol: nominalno obiljeje - struna sprema: redoslijedno obiljeje - plaa: numeriko (diskontinuirano) obiljeje
16
Uvod
- visina: numeriko (kontinuirano) obiljeje - teina: numeriko (kontinuirano) obiljeje - brano stanje: nominalno obiljeje - stambena situacija: nominalno obiljeje - broj lanova u obitelji: numeriko (diskontinuirano) obiljeje - mjesto roenja: nominalno (zemljopisno) obiljeje. Analitiki primjer 1.4: Na odabranom podruju izvrena je analiza zainteresiranosti uenika i studenata za poduke iz razliitih predmeta upitnikom u kojem su izmeu ostalih bila sljedea pitanja:
1. Iz kojih predmeta ste pohaali poduke? a) Matematika b) Fizika c) Engleski jezik d) Hrvatski jezik e) Ostalo 2. eljeli biste pohaati: a) Individualne poduke b) Grupne poduke c) Svejedno mi je 3. Spol a) ensko b) muko
a)
U tablici 1.1. vidi se da obiljeje "poduka iz eljenog predmeta" moe poprimiti 5 oblika: Matematika, Fizika, Engleski jezik, Hrvatski jezik i ostalo. Svakom obliku obiljeja dodijeljena je ifra ili kod: A, B, C, D i E. Na taj nain pri unosu podataka umjesto da se piu itave rijei upisuje se ifra, ime se postie velika uteda vremena. Kodovi ne moraju biti slova, pa se kod obiljeja spol za "enski" unosi 1, a za "muki" 2. Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja unesenih podataka u razliitim eljenim varijantama u tablice, to opet ovisi o vrsti istraivanja i postavljenim ciljevima statistikog istraivanja. Analitiki primjer 1.5: Kodirana pitanja iz 1.4 potrebno je za 10 ispitanika unijeti u tablicu! Rjeenje 1.5: U tablici 1.2. prikazana su kodirana pitanja za 10 ispitanika: Tablica 1.2. Tablica s kodiranim podacima (ili matrica podataka)
Ispitanici 1 2 3 4 5 6 7 8 9 10 V1 A C A B A A D E B A V2 A A B C A B A C A A V3 1 2 1 1 2 1 2 1 2 2
U tablici 1.2 vrste statistikih obiljeja smjetene su u stupce. U drugom stupcu tablice obiljeje V1, prema kodnoj listi u tablici 1.1., znai "poduke iz eljenog predmeta". Stupac V2 podrazumijeva "eljenu vrstu poduke", a V3 znai "spol".
18
Uvod
Ako se pogledaju podaci za 3. ispitanika u tablici 2, A u stupcu obiljeja V1 (poduke iz eljenog predmeta) znai da taj ispitanik eli poduku iz Matematike. Oznaka B u stupcu V2 (eljena vrsta poduka) istog ispitanika podrazumijeva da on preferira grupnu poduku, a njegova oznaka 1 u stupcu V3 (spol) kae nam da je taj ispitanik enskog spola.
Analitiki primjer 1.6: Na odabranom podruju izvrena je analiza stanovnitva upitnikom u kojem su izmeu ostalih bila sljedea pitanja: 1. Spol: a) Muki b) enski 2. Visina: ............................... Tablica 1.3: Kodna lista
OBILJEJE spol (V1) visina u cm (V2) OBLICI OBILJEJA Muki enski .......... KOD 1 2 ........
a) Kodirana pitanja iz tablice 1.3. potrebno je unijeti u dokument programa SPSS! b) Za 20 ispitanika potrebno je u SPSS unijeti konkretne podatke o spolu i visini u cm! Rjeenje 1.6: a) U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana (slika 1.1.)
19
Prema slici 1.2 vidi se da su varijable nazvane (Name) V1 i V2. Radi lakeg rada s podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label oznaeno je da je varijabla V1: Spol, a varijabla V2: Visina u cm. Zadnji stupac definira skalu mjerenja (Measure), gdje je za V1-Spol oznaena opisna, tj. Nominal skala, a za V2-Visinu u cm numerika, tj. Scale skala. U stupcu Values za varijablu V1-Spol uneseni su kodovi prema tablici 1.3. Klikom mia u prvo polje stupca Values otvara se prozor Value Labels, u kojem se definira konkretno kodiranje. To je za ovaj primjer prikazano na slici 1.3. Na slici 1.3 vidi se da muki spol ima kod 1, a enski spol kod 2. Potrebno je napomenuti da pri unosu objanjenja i vrijednosti treba izbjegavati slova koja ne pripadaju engleskoj abecedi jer ih SPSS nee prepoznati.
20
Uvod
b) U programu SPSS podaci se prema definiranim varijablama unose u dijelu Data view koji se bira u donjem lijevom kutu ekrana (slika 1.4). Slika 1.4. Data view za unoenje podataka u programu SPSS
Na slici 1.5 prikazani su podaci o spolu i visini u cm za 20 ispitanika (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom.
21
Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja unesenih podataka u razliitim eljenim varijantama u tablice, to opet ovisi o vrsti istraivanja i postavljenim ciljevima statistikog istraivanja. Takav nain obrade podataka olakava rad s masom statistikih podataka i omoguava veliku utedu vremena.
22
Uvod
1.7. Naini prikupljanja podataka Pojedinane metode statistikog promatranja su: a) b) c) d) e) mjerenje brojenje ocjenjivanje evidentiranje i anketiranje.
Jedan od naina statistikog promatranja i prikupljanja podataka je mjerenje. Mjeri se na primjer urod penice po jedinici poljoprivredne povrine. Moe se mjeriti teina proizvoda, kao i visina stanovnitva nekog podruja. Brojenjem se moe doi do podataka o broju zaposlenih u pojedinim organizacijskim jedinicama poduzea, o broju upisanih uenika u srednje kole. Broje se i noenja turista u turistikoj sezoni pa se na taj nain dobivaju podaci relevantni za analizu uspjenosti sezone. Ocjenjivanjem kao metodom prikupljanja statistikih podataka odreuje se kvaliteta provoenja odreenih radnji, stoga se taj postupak obino vee za redoslijedna obiljeja statistikog skupa. Ocjenjuju se i rangiraju studenti na testu iz statistike, ocjenjuje se usluga nekog hotelskog poduzea i slino. Evidentiranje podataka podrazumijeva kontinuirano praenje kretanja neke pojave u duljem ili kraem razdoblju. Za potrebe evidencije esto se ureuju odgovarajui obrasci. Na primjer, za promatranje izostanaka i broja ostvarenih radnih sati djelatnika u nekom poduzeu postoji obrazac za evidenciju gdje zaposlenici upisuju: ime i prezime, vrijeme dolaska i odlaska s radnog mjesta, vrijeme izostanka, razlog izostanka. Evidentiranje se moe vriti i tehnikim ureajima. To su umreena raunala, optiki itai, ureaji za brojenje npr. putnika i slino. Anketa i/ili intervju je metoda kojom se prikupljaju podaci uz pomo unaprijed pripremljenih upitnika na kojima ispitanici svojim
23
odgovorima daju informacije o promatranim obiljejima statistikog skupa. Da bi anketa uspjela, potrebno je veliku pozornost obratiti sastavljanju upitnika. Anketu sastavlja statistiar, koji se esto konzultira i sa psihologom. Upiti moraju biti kratki, precizni i jasni. Moraju biti postavljeni tako da ne sugeriraju odgovor. Broj pitanja ne smije biti velik da ne zamara one koji odgovaraju. Pri provoenju ankete pristup ispitaniku, odnosno jedinici statistikog skupa moe biti izravan i neizravan. Izravan pristup ostvaruje se kada osoba ili tim koji anketiraju izlaze na teren i u direktnom kontaktu s ispitanicima prikupljaju odgovore na pitanja iz upitnika. Neizravan pristup ostvaruje se potom, telefonom, elektronikom potom i web-om. Na taj nain smanjuju se trokovi prikupljanja podataka (npr. putni trokovi osoba koje provode anketu, tj. anketara). Iako se i neizravnim nainom ispitanicima prezentira tko istrauje i koja mu je svrha, praksa je pokazala da je tim pristupom anketiranja prisutan velik postotak neodaziva, kao i esto velik postotak nevaljano i nepotpuno popunjenih upitnika. Naravno, razloge treba traiti u injenici da ispitaniku nije na raspolaganju osoba koja e mu pojasniti nejasna pitanja. Ovisno o obimu istraivanja organizaciju prikupljanja podataka moe provoditi jedna osoba, skupina istraivaa ili osoblje specijalizirane ustanove kojoj je to osnovna djelatnost. Ako se radi o manjem istraivanju, u prikupljanju podataka e sudjelovati manji broj istraivaa, dok e vee istraivanje zahtijevati rad veeg broja istraivaa. 1.8. Priprema podataka za statistiku analizu Prije poetka obrade prikupljenih podataka potrebno je izvriti kontrolu sirove statistike grae. Kontrola se moe vriti u tijeku ili na kraju postupka prikupljanja podataka, to ovisi i o razliitim metodama prikupljanja. Preventivna kontrola obavlja se ve u tijeku samog postupka prikupljanja statistikih podataka. Kod provoenja ankete to
24
Uvod
podrazumijeva kontrolu upitnika pri njegovu preuzimanju od ispitanika. Kontrolira se jesu li dani odgovori na sva pitanja i jesu li pravilno popunjena predviena mjesta za traene odgovore. Naknadna kontrola prikupljenih podataka obavlja se nakon postupka prikupljanja. Formalnom kontrolom se usporeuje realizirani broj prikupljenih podataka s onim planiranim obuhvatom statistikog skupa. Ako je anketa vrena neizravnim putem, na primjer potom, usporeuje se broj odaslanih upitnika s brojem vraenih upitnika. Materijalnom kontrolom ispituje se potpunost i tonost sadraja prikupljenih podataka. Na primjeru ankete to podrazumijeva kontrolu potpunosti i loginosti danih odgovora. 1.9. Uzorak Uzorak je podskup osnovnoga statistikog skupa, a uzima se u svrhu ispitivanja obiljeja elemenata osnovnog skupa (ili populacije). Poeljno je da uzorak bude to vei, ali u konkretnim istraivanjima moe se dogoditi da: poveavanjem uzorka istraivanje postaje sve skuplje katkada se uzorci unitavaju (npr. kemijska analiza nekih prehrambenih artikala).
Kad god je mogue, poeljno je izabrati sluajni uzorak. U takvom uzorku svaka jedinica populacije (osnovnog skupa) ima jednaku vjerojatnost da bude izabrana. Uzorak treba biti reprezentativan, a ne selekcioniran (npr. potrebno je obuhvatiti istraivanjem i gradsko i seosko stanovnitvo, zatim u nekom medicinskom istraivanju nije cilj samo analizirati i donositi zakljuke za "dobrovoljce"). Ako neki lanovi populacije imaju veu ansu od drugih da budu izabrani, takav uzorak se naziva pristrani uzorak (biased sample). Sluajni uzorak sastavlja se prema odreenim principima, koji odgovaraju zakonu sluaja. Najbolji nain je upotreba "tablice sluajnih
25
brojeva" ili koritenje raunalnog sustava sluajnog izbora (generator sluajnih brojeva). Pri izradi tablice sluajnih brojeva koristi se deseterostrana prizma s brojevima od 0 do 9. Analitiki primjer 1.7: Nakon 40 bacanja deseterostrane prizme dobije se na sluajan nain 40 brojeva; skupljeni u skupine od po 4: 7766 7520 1607 6048 2771 4733 8558 8681 5204 3806 a) Zadatak je izabrati uzorak veliine 350 iz osnovnog skupa veliine 790. (Prije poetka odabira svakoj osobi iz osnovnog skupa dodjeljuje se broj od 1 do 790!). Rjeenje 1.7: a) Najprije je potrebno otvoriti tablicu sluajnih brojeva sluajno! Pretpostavka je da se tablica otvorila na stranicu na kojoj je u prvom retku prikazan niz od 40 brojeva. Kako je u osnovnom skupu ukupno 790 osoba, potrebno je itati troznamenkaste brojeve iz tablice (u redovima, u stupcima ili dijagonalno). Ako se brojevi itaju po redovima, prvi troznamenkasti broj iz prezentiranog retka, tj. prva odabrana osoba je ona oznaena brojem 776, zatim 675, pa 201 itd. Ako se naie na broj vei od 790, on se odbacuje, jer u osnovnom skupu nema vie od 790 osoba. Ako se dogodi da se neki broj ponavlja, on se opet odbacuje, jer se jedna osoba u uzorak ne moe odabrati dva puta. Uzorak moe biti i sistematski ako se jedinice iz osnovnog skupa biraju sistematski. Na primjer, ako se po redu u uzorak bira svaki 10. element iz osnovnog skupa. Stratificirani ili slojeviti uzorak je takav uzorak koji se dobije na nain da se populacija podijeli u slojeve ili stratume prema nekim
26
Uvod
karakteristikama, te da se iz svake od grupa uzme sluajni uzorak. Na primjer, u sociolokim istraivanjima stratumi se mogu birati prema dobnim skupinama. Klaster uzorci su loija varijanta sluajnog uzorka i koriste se u velikim trinim, ekonomskim ili politikim istraivanjima. Na primjer, pri ispitivanju miljenja stanovnika nekog grada o nekoj problematici, grad se moe prema planu podijeli na 50-ak blokova, odnosno kvartova. Tada se na sluaj biraju neki blokovi u kojima anketari detaljno intervjuiraju sve stanovnike. ak se vraaju na adrese dok ne dobiju intervju od svakog stanovnika u odabranim blokovima. Kvotni uzorci su jo loiji jer predstavljaju nesluajni stratificirani uzorak. Koriste se kod ad hoc organiziranih istraivanja za potrebe trita, za prikupljanje miljenja graana o nekom pitanju i slino. Istraiva unaprijed izabere broj ljudi (kvotu) svakog pojedinog stratuma koje mora intervjuirati, stoga se ti uzorci nazivaju kvotni. Prigodni uzorak je onaj koji se "nae pri ruci" jer je drugi nedostupan. Na primjer, dostupni bolesnici na odjelu u bolnici, prisutni studenti neke godine studija i slino. Pri istraivanju se mogu dogoditi pogreke koje mogu biti: a) pogreke izvan uzorka (zbog pogreno odabrane metode istraivanja, zbog pogrene obrade rezultata i slino) b) pogreke uzorka. Veliinu uzorka nije mogue openito definirati, jer to ovisi o varijabilnosti pojave koja se mjeri i o preciznosti kojom se pojava eli izmjeriti. Za uzorak je najvanije da bude reprezentativan, tj. kad god je to mogue sluajno sakupljen. Frakcija odabiranja (f) omjer je jedinica u uzorku i broja jedinica u osnovnom skupu:
f = n N
(1.1)
gdje je :
n - broj jedinica u uzorku
27
Korak izbora je reciprona vrijednost frakcije odabiranja ( 1 f ) i upotrebljava se kod sistematskog izbora jedinica u uzorak. To znai da ako je korak izbora jednak 20, da se u uzorak iz osnovnog skupa odabire svaki 20. element. Broj svih moguih uzoraka (bez ponavljanja) veliine n iz osnovnog skupa veliine N jednak je broju kombinacija bez ponavljanja n -tog razreda:
N K = . n
(1.2)
Pomou uzorka vri se procjena odreenih parametara osnovnog skupa i testiraju se hipoteze o nepoznatim parametrima osnovnog skupa. Analitiki primjer 1.8: Na odabranom podruju izvrena je analiza studentske populacije upitnikom u kojem su izmeu ostalih bila sljedea pitanja: Anketni upitnik:
1. Spol: 2. Visina u cm: 3. Teina u kg: 4. Prosjena ocjena u srednjoj koli: 5. Koliki deparac dobivate na mjesec u kunama? 6. Financijske prilike u obitelji: 1. Nedovoljno novca za normalni standard 2. Zadovoljavamo osnovne potrebe 3. Nema materijalnih problema 4. ivimo odlino. 1. Muki 2. enski
a) Kodirana pitanja iz anketnog upitnika potrebno je unijeti u dokument programa SPSS! b) Za svakog ispitanika potrebno je u SPSS unijeti konkretne podatke o postavljenim pitanjima iz ankete!
28
Uvod
Rjeenje 1.8: a) U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana (slika 1.1.). Slika 1.6. Prikaz definiranih varijabli u programu SPSS
Prema slici 1.6. vidi se da su varijable nazvane (Name) od v1 do v2. Radi lakeg rada s podacima, naznaena je vrsta podataka za sve varijable (Type) Numeric. U stupcu Label oznaeno je da je varijabla V1: Spol, a varijabla V2: Visina u cm, itd. Zadnji stupac definira skalu mjerenja (Measure). Slika 1.7. Prikaz definirane varijable v6-Financijske prilike u obitelji u programu SPSS
29
U stupcu Values za varijable v1-Spol i v6-Financijske prilike u obitelji uneseni su odgovarajui kodovi prema odgovarajuim pitanjima iz ankete. Na slici 1.7 prikazani su kodovi za varijablu v6-Financijske prilike u obitelji. Na slici 1.7 vidi se da odgovor "Nema novca za normalan standard" kod 1, odgovor "Zadovoljavamo osnovne potrebe" kod 2 itd.. b) U programu SPSS podaci prema definiranim varijablama unose se u dijelu Data view koji se bira u donjem lijevom kutu ekrana (slika 1.4). Slika 1.8. Prikaz dijela podataka o varijablama v1 - v6 za odabrane ispitanike u programu SPSS
Na slici 1.8 prikazan je dio podataka o ispitanicima za varijable v1 - v6 (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovom padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom.
30
Uvod
Analitiki primjer 1.9: Prema podacima iz analitikog primjera 1.8: a) Za sve ispitanike potrebno je izraunati indeks kojim se odreuje idealna tjelesna teina u skladu s visinom ispitanika. To je Body Mass Index (BMI) - (v7) koji se rauna prema sljedeem izrazu:
BMI = tezina u kg vi sin a u m 2
b) Zadatak je za sve ispitanike od numerike varijable deparac (v6) formirati novu varijablu grupirani deparac (v8) po principu koji je prikazan u tablici 1.4. Tablica 1.4. Princip formiranja nove varijable grupirani deparac (v8)
Grupe Visina deparca 0 - 200 201 - 400 401 - 600 601 - 800 800 - 1000 1001 - 3500 Nova vrijednost 200 400 600 800 1000 3500
1 2 3 4 5 6
Rjeenje 1.9: a) Da bi se pomou postojeih numerikih varijabli izraunala nova numerika varijabla, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku Compute. Na ekranu se pojavi prozor Compute Variable koji je prikazan na slici 1.9.
31
Slika 1.9. Prozor Compute Variable u kojem se kreira nova numerika varijabla v7
Prema slici 1.9 vidi se da je u polje Target Variable potrebno unijeti ime nove varijable BMI -v7, dok se u Numeric Expression unosi izraz po kojem se iz postojeih varijabli kreira nova varijabla. Pritom treba voditi rauna o tome da su postojei podaci o visini ispitanika izraeni u cm te da bi se dobila visina izraena u metrima, potrebno je centimetre podijeliti sa 100. To se moe vidjeti na slici 1.9 pod Numeric Expression. Nakon to se klikne ikona OK, nova varijabla v7 automatski se formira u dodatnom stupcu u Data View programa SPSS. Nova varijabla se moe vidjeti na slici 1.10. U Variable View potrebno je na odgovarajui nain definirati tu novu varijablu te u stupcu Label naznaiti da se radi o Body Mass Index. Ta nova varijabla je numerika i ima skalu mjerenja Scale.
32
Uvod
b) Da bi se pomou varijable v6 - deparac formirala nova varijabla grupirani deparac po principu koji je prikazan u tablici 1.4, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovom izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v6 - "Koliki deparac dobivate", a u Outut Variable, Name je v8, a Label Grupirani deparac. Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range upisuju se odgovarajue grupe visine deparca, kako je zadano u tablici 1.4. Nakon upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View kreirat e se nova varijabla Grupirani deparac, odnosno v8. Na slici 1.11. prikazani su prozori Recode into Different Variables i Old and New Values.
33
Slika 1.11. Prozori Recode into Different Variables pomou kojih se kreira nova varijabla v8 - Grupirani deparac
34
35
(2.3)
Moe se definirati da je skup ureenih parova modaliteta promatranog obiljeja i njima pripadajuih apsolutnih frekvencija statistiki niz. 2.1.1. Nizovi kvalitativnih podataka Kvalitativni statistiki nizovi su nominalni (atributivni i zemljopisni) i redoslijedni.
U izrazu (2.3) dan je znak zbrajanja f i koji se ita: zbroj apsolutnih frekvencija f i ,
i =1
i =1
nejednakosti, primjenom izraza 1., moe zakljuiti da suma produkta nije jednaka produktu suma); 4.
Xi X X X = 1 + 2 + ... + N Y1 Y2 YN i =1 Yi
N i =1 N
Xi
i =1 N
Yi
N
aX i = aX 1 + aX 2 + . . . + aX N = a( X 1 + X 2 + . . . + X N ) = a X i , gdje je "a"
i =1 N N N
konstante. 36
Nominalni statistiki nizovi formiraju se grupiranjem elemenata osnovnog skupa prema modalitetima odgovarajueg nominalnog obiljeja. Modaliteti nominalnog obiljeja izraavaju se pomou atributa, kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, prema veliini apsolutnih frekvencija, te dogovorno ili zakonski utvrenim popisima. Na primjer, slubena statistika koristi: SMTK ili Standardnu meunarodnu trgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju djelatnosti. Zemljopisni statistiki nizovi formiraju se grupiranjem elemenata osnovnog skupa prema modalitetima odgovarajuega zemljopisnog ili prostornog obiljeja. Modaliteti prostornog obiljeja najee odgovaraju teritorijalnoadministrativnoj podjeli odreenog geografskog prostora, kao na primjer: gradovi, upanije, regije, drave, kontinenti. Grupe toga obiljeja mogu biti poredane po abecednom redu, po veliinama apsolutnih frekvencija ili po geografskom poloaju. Ako se zbog vee preglednosti nekoliko modaliteta stavi zajedno u grupu "ostalo", ona obino dolazi na kraju statistikog niza. Redoslijedni statistiki nizovi formiraju se grupiranjem elemenata osnovnog skupa prema modalitetima odgovarajueg redoslijednog obiljeja. Grupiranje podataka statistikog skupa prema redoslijednom obiljeju vri se slino kao kod nominalnih obiljeja, ali je redoslijed grupa ovdje odreen rangom koji pojedina grupa obiljeja predstavlja. Rangiranje se moe vriti polazei od najnieg ranga prema najviem ili obrnuto. 2.1.2. Numeriki niz Grupiranjem elemenata statistikog skupa prema numerikom ili kvantitativnom obiljeju nastaje numeriki statistiki niz.
37
Grupiranje i ureivanje elemenata numerikog statistikog skupa ovisi o broju podataka i o njihovoj vrsti, odnosno o tome radi li se o neprekidnim (kontinuiranim) ili prekidnim (diskontinuiranim) numerikim statistikim obiljejima. Ako numeriko obiljeje moe poprimiti samo mali broj numerikih vrijednosti, tada ta svaka vrijednost moe biti posebna grupa u nizu. To je najee sluaj kod prekidnog ili diskontinuiranog numerikog obiljeja. Ureen negrupiran prekidni numeriki statistiki niz ima karakteristiku da su njegove vrijednosti sloene po veliini poevi, najee, od najmanje:
X 1 , X 2 , ..., X N ; X i 1 < X i , i = 2,3, ..., N .
(2.4)
Openito je pojedini oblik (modalitet) obiljeja: X i , i = 1,2, ..., k , a pripadajua apsolutna frekvencija: f i , i = 1,2, ..., k . Skup ureenih parova:
( X i , f i ), i = 1,2,3, ..., k
(2.5)
je distribucija frekvencija promatranog prekidnog numerikog obiljeja. Takoer vrijedi da je suma svih apsolutnih frekvencija jednaka opsegu statistikog odnosno osnovnog skupa:
i =1
fi = N .
(2.6)
Za vrijednosti koje se pojavljuju manje puta formiraju se zajednike grupe ili "razredi". U razredima se nalaze elementi skupa s vrijednostima obiljeja koje se nalaze izmeu donje i gornje granice razreda. Na taj se nain formiranjem razreda postie vea preglednost, ali se gubi na preciznosti i potpunosti informacija. U sluaju diskontinuiranog numerikog obiljeja donja granica sljedeeg (i+1) razreda razlikuje se od gornje granice prethodnog (i) razreda za jedinicu mjere promatranog obiljeja.
38
Te originalne granice razreda nazivaju se jo i nominalne granice. Prije provoenja statistike analize potrebno je nominalne granice zamijeniti preciznim ili pravim granicama, to ovisi o nainu mjerenja promatranog svojstva. To se najee radi na nain da se donja granica sljedeeg (i+1) nominalnog razreda umanji, a gornja granica prethodnog (i) nominalnog razreda uvea za polovicu razlike izmeu tih granica. Ponekad se precizne granice formiraju jednostavno na nain da se sve gornje granice uveaju za 1 jedinicu obiljeja i tako izjednae sa svojom sljedeom donjom granicom ili da se sve donje granice umanje za 1 jedinicu obiljeja i tako izjednae sa svojom prethodnom gornjom granicom. Kontinuirano ili neprekidno statistiko obiljeje moe poprimiti vrijednosti iz nekog intervala, pa se njegovi modaliteti formiraju kao razredi. Skup ureenih parova razreda obiljeja i njima pripadajuih frekvencija2
( DGi X i < GGi , f i ), i = 1,2,3, ..., k
(2.7)
je distribucija frekvencija promatranog neprekidnog numerikog obiljeja. U sluaju kontinuiranog numerikog obiljeja donja granica sljedeeg (i+1) razreda jednaka je gornjoj granici prethodnog (i) razreda, pa ovdje nije potrebno raunati precizne ili prave granice. Ako nije definirana najmanja vrijednost obiljeja za neki skup, donja granica poetnog razreda pri grupiranju se moe ostaviti otvorena. Isto tako ako nije definirana najvea vrijednost obiljeja za neki skup, gornja granica posljednjeg razreda moe se ostaviti otvorena. Meutim prije poetka same statistike analize, te je otvorene granice potrebno zatvoriti takozvanim procijenjenim granicama, koje se stavljaju u zagrade, jer njima istraiva procjenjuje da nijedan element skupa nema vrijednost manju od prve donje ili veu od zadnje gornje procijenjene granice. Veliina razreda (i) razlika je izmeu gornje i donje granice razreda (kada je rije o diskontinuiranom numerikom obiljeju radi se s preciznim ili pravim granicama).
2
gdje je DGi donja granica i-tog razreda, a GGi gornja granica i-tog razreda. 39
(2.8.)
Sredina razreda (sredXi) je prosjek (odnosno jednostavna aritmetika sredina) izmeu donje i gornje (prave ili precizne) granice razreda:
sredX i = DGi + GGi , i = 1,2, ..., k . 2
(2.9)
Ako vrijednosti promatranog numerikog niza nisu ravnomjerno rasporeene, veliine koje se izraunavaju pomou sredine razreda sadre tzv. greku grupiranja. 2.2. Tabeliranje Tabeliranje je postupak svrstavanja grupiranih prikupljenih statistikih podataka u tablice. Statistike tablice kao jedan od oblika prikazivanja statistikih podataka prisutne su u literaturi svuda oko nas. Tablica nastaje crtanjem okomitih i vodoravnih linija prema odreenim pravilima. Svaka statistika tablica mora imati: naslov, broj tablice (ako ih ima vie), tekstualni dio, numeriki ili brojani dio i izvor podataka te po potrebi napomenu. Tablica 2.1.
Naslov tablice
Zaglavlje Oznake stupca 0 Pred- Oznake sturetka pac Zbirni redak:
i =1
Zbirni stupac:
n j =1
1 stupac
2 redak
polje polje
Izvor podataka: 40
Tablica 2.1. prikazuje opi oblik statistike tablice. Naslov tablice mora biti jasan i kratak, a istovremeno u sebi mora sadravati pojmovnu, prostornu i vremensku definiciju statistikog skupa da bi onaj tko je ita mogao precizno odrediti njezine elemente. Tekstualni dio statistike tablice sastoji se od dva dijela: zaglavlja i predstupca. U zaglavlju ili tumau stupaca opisuje se i objanjava sadraj stupaca. U predstupcu ili tumau redaka opisuje se i objanjava sadraj redaka. To su najee oblici statistikog obiljeja po kojemu je promatran statistiki niz. Uz tekstualni dio svaki stupac moe biti oznaen i odgovarajuim brojem. Kako se vidi u tablici 2.1, predstupac se esto oznaava nulom, a numeriranje dalje ide po redu: 1, 2, , n. Brojani ili numeriki dio tablice sastoji se od polja u koja se unose frekvencije, odnosno rezultati grupiranja statistikih podataka. Zbirni ili marginalni stupac sadri zbrojeve pojedinih redaka. Njegova suma zbraja elemente svakog retka po j - stupcima. Zbirni ili
j =1 n
Izvor podataka se navodi ispod tablice. On omoguuje provjeru ispravnosti prikupljenih podataka u tablici, kao i eventualnu dopunu podataka, ako to zahtijeva statistiko istraivanje (posebno ako su podaci u tablici preuzeti iz sekundarnih izvora). Zbog vee preglednosti tablice, esto se zaglavlje, predstupac, zbirni redak i zbirni stupac odvajaju debljim crtama od brojanog dijela kao to se moe vidjeti u tablici 2.1. Dakle, statistika tablica mora potivati 3 naela: preglednost, potpunost i jasnou. Statistike tablice mogu se podijeliti: na 1) ope ili izvjetajne statistike tablice i na 2) analitike ili sumarne statistike tablice.
41
Ope statistike tablice prikazuju jako velik broj statistikih podataka o nekome promatranom statistikom skupu. Analitike statistike tablice se konstruiraju za neku posebnu analizu i one su u pravilu preglednije. U ovisnosti o tome prikazuju li se prikupljeni statistiki podaci u tablici prema jednom ili vie statistikih obiljeja i prikazuje li se jedan ili vie statistikih nizova razlikuju se: 1) jednostavne statistike tablice i 2) sloene statistike tablice, koje se mogu podijeliti: na skupne statistike tablice i na kombinirane statistike tablice. Jednostavne statistike tablice prikazuju jedan statistiki skup grupiran u jedan statistiki niz, tj. grupiran prema jednom obiljeju. Skupne statistike tablice prikazuju dva ili vie statistika skupa grupirana u dva ili vie statistika niza prema jednom obiljeju. Tablica 2.2. Naslov tablice: Dvostruka (sloena) statistika tablica
Zaglavlje Oznake stupca Predstupac 0 Oznake retka 1 x11 x21 xm1 Zbirni redak:
i =1 Izvor podataka: m
Zbirni stupac:
n j =1
n x1n x2n
j =1 n
x1 j
j =1
x2 j
n
xmn
m
j =1 m
xmj
i =1
xi1
i =1
xi 2
i =1
xin
i =1 j =1
xij
m m
42
Kombinirane statistike tablice (tablice kontigence) prikazuju jedan statistiki skup grupiran u dva ili vie statistikih nizova prema dva ili vie obiljeja. Ako kod kombinirane tablice s dva obiljeja jedno obiljeje ulazi u tablicu iz predstupca, a drugo iz zaglavlja, kae se da je to tablica s dva ulaza. U skladu s tim postoje kombinirane tablice s vie ulaza, ali pri njihovu kreiranju gubi se jasnoa i preglednost. Tablica 2.2 prikazuje jednu opu dvostruku statistiku tablicu s odgovarajuim sumama u zbirnom retku i zbirnom stupcu. Jednadba (2.10) pokazuje da je zbroj zbirnog retka jednak zbroju zbirnog stupca, odnosno ako kod dvostruke sume one zamijene svoja mjesta, nita se nee promijeniti:
i =1 j =1
x ij = x ij .
j =1i =1
m n
n m
(2.10)
2.3. Relativni brojevi strukture Relativni brojevi su "neimenovani", stoga se pomou njih mogu usporeivati i analizirati pojave koje imaju razliitu jedinicu mjere ili razliit broj elemenata. Na taj nain dobije se relativna vanost dijela ili cjeline statistikog niza. Relativni brojevi nastaju dijeljenjem dviju veliina. Veliina s kojom se dijeli zove se osnova relativnog broja i po njoj se relativni brojevi meusobno razlikuju. Relativni brojevi strukture pokazuju odnos dijela prema cjelini, i njima se olakava analiza rasporeda podataka prema modalitetima obiljeja u jednom statistikom nizu, odnosno njihova struktura. Najee se izraavaju u postocima, a mogu i u promilima. Ako relativni brojevi strukture (Pi) pokazuju odnos apsolutnih frekvencija prema opsegu statistikog skupa (tj. ukupnom broju elemenata statistikog skupa), zovu se relativne frekvencije (fri).
43
Pi =
(2.11)
Pi =
(2.12)
Pi =
(2.13)
Zbroj svih relativnih brojeva u jednom statistikom nizu je 1 ili 100, ili 1000, u ovisnosti o tome kako je relativni broj izraen. Relativni brojevi strukture se grafiki mogu prikazivati pomou strukturnih stupaca, strukturnih krugova, polukrugova ili nekim drugim geometrijskim likom. Pri tom se za usporedbu dvaju ili vie statistikih nizova konstruiraju geometrijski likovi jednakih povrina, jer je zbroj relativnih frekvencija uvijek isti. Analitiki primjer 2.1. Statistiki nizovi "prosjean broj nezaposlenih osoba u RH, 1995. i 2002. godine" prema redoslijednom obiljeju "struna sprema", prikazani su u tablici 2.2. a) Zadatak je izraunati strukturu nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu. b) Zadatak je strukturu nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu prikazati na grafikonu pomou strukturnih stupaca uz sve potrebne oznake. Rjeenje 2.1. a) U tablici 2.3. u posljednja 2 stupca prikazana je struktura nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu. Na primjer: fr11 =
f 11
i =1
f 1i
100 =
44
to znai da je 1995. godine udio niskokvalificiranih radnika (NKV) u ukupnom broju nezaposlenih bio 20,62%. Tablica 2.3. Prosjean broj nezaposlenih osoba u RH prema strunoj spremi, 1995. i 2003. godine
Prosjean broj Struktura u % nezaposlenih osoba Struna sprema 1995. god. 2003. god. 1995. god. 2002. god. f1i f2i fr1i fr2i NKV 51367 58939 20,62352 18,4945 PKV;NSS 36453 56957 14,63564 17,87256 KV,VKV 87172 105728 34,999 33,17644 SSS 57276 76087 22,99594 23,87537 VS 7346 9891 2,949372 3,103701 VSS 9456 11082 3,796523 3,477426 Ukupno: 249070 318684 100 100 Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 177.
b) Na slici 2.1. prikazana je struktura nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu. Slika 2.1.
Prosjean broj nezaposlenih u RH prema strunoj spremi
100%
40%
20%
45
2.4. Grafiko prikazivanje statistikih nizova Uz statistike tablice pomono sredstvo u analizi statistikih nizova su grafiki prikazi. Grafikonima se na jednostavan i pregledan nain uz pomo razliitih geometrijskih likova prezentiraju osnovne karakteristike statistikih nizova. Grafiki prikazi statistikih podataka su pregledniji i razumljiviji u odnosu na njihovo prikazivanje statistikom tablicom. Grafikoni omoguuju jednostavnije uoavanje glavnih karakteristika promatranih pojava, ali vrlo esto ta preglednost ide na tetu preciznosti statistikih informacija. Stoga je poeljno uz grafiki prikaz prezentirati i tablicu s originalnim vrijednostima statistikog niza. Suvremeni statistiki programski paketi, a izmeu njih i SPSS, naravno u skladu sa statistikom teorijom, imaju mnotvo mogunosti kreiranja grafikih prikaza. Pomou njih se mogu odabrati razliite boje, oblici i linije na grafikonu, to omoguuje jo zorniji prikaz promatrane pojave. Oznake na grafikonu moraju biti takve da onaj tko ita grafikon moe jasno raspoznati koji su elementi i koja je pojava prikazana. Stoga i grafikon mora imati naslov, jedinice mjere promatranog obiljeja, oznake modaliteta obiljeja, izvor podataka i po potrebi kazalo ili tuma oznaka. Postoje tri skupine grafikih prikaza: 1) povrinski grafikoni 2) linijski grafikoni i 3) kartogrami. Analitiki primjer 2.2. Statistiki skup "Zaposleni u pravnim osobama u RH, stanje 31. oujka 2004. god.", prema redoslijednom obiljeju "stupanj strunog obrazovanja" prikazan je u tablici 2.3. a) Zadatak je zaposlene u pravnim osobama u RH prema stupnju strunog obrazovanja za 2004. godinu prikazati na grafikonu pomou jednostavnih stupaca uz sve potrebne oznake.
46
Tablica 2.4. Zaposleni u pravnim osobama u RH prema stupnju strunog obrazovanja, stanje 31. oujka 2004. god.
Stupanj strunog Broj obrazovanja zaposlenih NKV 97516 PKV 35948 KV 146161 VKV 30626 nie 36510 srednje 453710 vie 82283 visoko 163417 Ukupno: 1046171 Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 136.-137.
Rjeenje 2.2. a) Na slici 2.2 prikazani su zaposleni u pravnim osobama u RH prema stupnju strunog obrazovanja za 2004. godinu. Slika 2.2.
Zaposleni u pravnim osobama u RH pre ma stupnju strunog obra zovanja, stanje 31.03.2004.
500000 400000 300000 200000 100000 0 NKV PKV KV V KV nie srednje vie visoko Stupanj s trunog obrazovanja
Na slici 2.2 jasno se vidi da je u Republici Hrvatskoj u pravnim osobama, na dan 31. 03. 2004., najvie bilo zaposlenih sa srednjim
Broj zaposlenih
47
stupnjem obrazovanja, dok je onih u kategoriji VKV, odnosno visokokvalificiranih radnika bilo najmanje. Analitiki primjer 2.3. Statistiki skup, "Stanovnitvo Republike Hrvatske, popis 2001. godine" prema obiljejima "spol i aktivnost" podijeljen je na grupe i zadan je u tablici 2.5. a) Zadatak je napraviti strukturne krugove za stanovnitvo mukog i enskog spola prema obiljeju "aktivnost". Tablica 2.5. Mukarci i ene u RH prema aktivnosti, popis 2001. godine
Stanovnitvo (u 000) Mukarci ene f2i f1i Stupnjevi struktur. kruga Mukarci ene 0 S 1i S02i
Aktivnost Aktivno stanovnitvo 1005,4 819,8 178,3854 132,9885 Osobe ss osobnim prihodima 490,6 639 87,04584 103,659 Uzdravano stanovnitvo 533 760,4 94,56875 123,3526 Ukupno 2029 2219,2 360 360 Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 100.
Rjeenje 2.3. a) U tablici 2.5 uz originalne apsolutne frekvencije dani su i stupnjevi strukturnoga kruga. Stupnjevi strukturnoga kruga raunaju se na sljedei nain:
S 0i = fi
i =1
fi
360 0 .
(2.14)
Na slici 2.3 pomou strukturnih krugova prikazani su mukarci i ene u Republici Hrvatskoj prema aktivnosti (popis 2001.). U stupcu tablice 2.5. za muki spol:
48
S 0 11 =
f 11
i =1
f 1i
360 0 =
to odgovara odreenom dijelu 1. strukturnoga kruga na lici 2.3. U stupcu tablice 2.5. za enski spol:
S 0 22 = f 22
i =1
f 2i
360 0 =
to odgovara odreenom dijelu 2. strukturnoga kruga na slici 2.3. Slika 2.3. Mukarci i ene u Republici Hrvatskoj prema aktivnosti (popis 2001.)
Iz slike 2.3. jasno se vidi da je kod mukaraca bilo najvie aktivnog stanovnitva, dok je kod ena aktivno stanovnitvo samo malo vee od uzdravanog stanovnitva. Analitiki primjer 2.4. Zadan je statistiki skup, "Zasijane povrine u oranicama" prema prostornom obiljeju "upanije u RH". a) Zadatak je zadani skup prikazati pomou statistike karte.
49
Rjeenje 2.4. a) Statistiki skup, "Zasijane povrine u oranicama" prema prostornom obiljeju "upanije u RH" prikazan je na slici 2.4. Slika 2.4. Udio zasijanih povrina u oranicama po upanijama u RH, 2002. god.
Na slici 2.4 vidi se udio zasijanih povrina u oranicama u Republici Hrvatskoj prikazan po upanijama. Na zemljovidu su sjenanjem prikazani intenziteti vrijednosti pojave po modalitetima obiljeja, tj. po upanijama. Tako su one upanije s manjim udjelom zasijane povrine u oranicama slabije osjenane, dok su one s veim udjelom zasijane povrine jae osjenane.
50
Analitiki primjer 2.5. Zadani su podaci o spolu i deparcu uzorka studentske populacije na jednom sveuilitu. a) Zadatak je formirati i komentirati apsolutne frekvencije varijabli: - spol, - "grupirani" deparac. Rjeenje 2.5. a) U programskom paketu SPSS apsolutne frekvencije se mogu formirati na 2 naina. I. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Tables. Dalje se bira Tables of Frequencies. Najprije se varijabla v1 - Spol prebaci u polje Frequencies for:. Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema obiljeju, odnosno varijabli spol. Rezultat je prikazan u tablici 2.6. Tablica 2.6. Ispitanici prema spolu
Spol Count Musko Zensko 94 144
Prva frekvencija u tablici 2.6. znai da je meu ispitanicima bilo 94 studenta. Druga frekvencija u tablici 2.6. znai da je meu ispitanicima bilo 144 studentice. II. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. U ovom sluaju se mogu obje varijable v1 - Spol i v2 -
51
Grupirani deparac prebaciti u polje Variable(s). Konani izgled prozora Frequencies s odabranim varijablama prikazan je na slici 2.5. Slika 2.5. Prozor "Frequencies" iz izbornika "Descriptive Statistics" s odabranim varijablama v1 i v2
Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranim obiljejima, odnosno varijablama. Rezultat je prikazan u tablicama 2.7 i 2.8. Tablica 2.7. Ispitanici prema obiljeju: Spol
Valid Musko Zensko Total Missing Total System Frequency 94 144 238 1 239 Percent 39,3 60,3 99,6 ,4 100,0 Valid Percent 39,5 60,5 100,0 Cumulative Percent 39,5 100,0
Prva frekvencija u stupcu Frequency u tablici 2.7. znai da je meu ispitanicima bilo 94 studenta. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 144 studentice. Na postavljeno pitanje je
52
odgovorilo 238 ispitanika, dok frekvencija 1 iz retka Missing System znai da 1 ispitanik nije dao odgovor na pitanje o njegovom spolu. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje originalne valjane frekvencije u postotcima. Prvi podatak iz tog stupca pokazuje da je meu onima koji su odgovorili na pitanje o spolu bilo 39,5% mukog spola, a 60,5 enskog spola. Tablica 2.8. Ispitanici prema obiljeju: Grupirani dzeparac
Frequency 73 52 30 6 7 5 173 66 239 Percent 30,5 21,8 12,6 2,5 2,9 2,1 72,4 27,6 100,0 Valid Percent 42,2 30,1 17,3 3,5 4,0 2,9 100,0 Cumulative Percent 42,2 72,3 89,6 93,1 97,1 100,0
Valid
Missing Total
System
Prva frekvencija u stupcu Frequency u tablici 2.8 znai da je meu ispitanicima bilo 73 studenta s deparcem od 200 kn ili manje. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 52 studenta s deparcem izmeu 201 kn i 400 kn itd. Na postavljeno pitanje je odgovorilo 173 ispitanika, dok frekvencija 66 iz retka Missing System znai da 66 ispitanika nije dalo odgovor na pitanje o njihovu deparcu. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje originalne valjane frekvencije u postocima. Prvi podatak iz tog stupca pokazuje da je meu onima koji su odgovorili na pitanje o deparcu bilo 42,2% studenata s deparcem od 200 kn ili manje itd. Ovaj II nain prikaza frekvencija u programu SPSS je detaljniji, jer osim apsolutnih prikazuje i relativne frekvencije.
53
Analitiki primjer 2.6. Zadatak je za sve ispitanike od varijable "Prosjena ocjena u srednjoj koli" (v1) formirati novu varijablu "Grupirana ocjena u srednjoj koli" (v2) po principu koji je prikazan u tablici 2.9. Tablica 2.9. Princip formiranja nove varijable grupirana ocjena u srednjoj koli (v2)
Grupe
1 2 3 4
Nova vrijednost 2 3 4 5
Rjeenje 2.6: Da bi se pomou varijable v1 - "Prosjena ocjena u srednjoj koli" formirala nova varijabla v2 - "Grupirana ocjena u srednjoj koli" po principu koji je prikazan u tablici 2.8, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v1 - "Prosjena ocjena u srednjoj koli", a u Outut Variable, Name je v2, a Label "Grupirana ocjena u srednjoj koli". Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range upisuju se odgovarajue grupe ocjena, kako je zadano u tablici 2.8. Nakon upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View, kreirat e se nova varijabla "Grupirana ocjena u srednjoj koli", odnosno v2. (Princip je slian kao u analitikom primjeru 1.9.)
54
Na slici 2.6 prikazan je prozor Recode into Different Variables: Old and New Values. Slika 2.6. Prozor "Recode into Different Variables: Old and New Values", pomou kojih se kreira nova varijabla v2 - Grupirana ocjena u srednjoj koli
Analitiki primjer 2.7. Zadatak je komentirati apsolutne i relativne frekvencije varijable: Grupirana ocjena u srednjoj koli (v2). Rjeenje 2.7: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v2 - Grupirana ocjena u srednjoj koli. Konani izgled prozora Frequencies s odabranom varijablom prikazan je na slici 2.7.
55
Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 2.10. Tablica 2.10. Ispitanici prema: Grupirana ocjena u srednjoj skoli
Valid 2,00 3,00 4,00 5,00 Total Missing Total System Frequency 1 34 113 90 238 1 239 Percent ,4 14,2 47,3 37,7 99,6 ,4 100,0 Valid Percent ,4 14,3 47,5 37,8 100,0 Cumulative Percent ,4 14,7 62,2 100,0
Prva frekvencija u stupcu Frequency u tablici 2.10 znai da je meu ispitanicima bio 1 student s ocjenom 2 u srednjoj koli. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 34 studenta s
56
ocjenom 3, ... itd. Na postavljeno pitanje je odgovorilo 238 ispitanika, dok frekvencija 1 iz retka Missing System znai da 1 ispitanik nije dao odgovor na pitanje o ocjeni u srednjoj koli. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje originalne valjane frekvencije u postotcima. Trei podatak iz tog stupca pokazuje da je 47,5% studenata imalo prosjenu ocjenu u srednjoj koli 4.
Analitiki primjer 2.8. Zadatak je izmeu svih ispitanika odabrati samo one koji su enskog spola. Rjeenje 2.8: U glavnom izborniku bira se Data, a na njegovu padajuem izborniku Select Cases, gdje je potrebno aktivirati opciju If condition is satisfied kako je prikazano na slici 2.8. Slika 2.8. Prozor "Select Cases" s aktiviranom opcijom "If condition is satisfied"
Klikom na ikonu If... otvara se novi prozor Select cases: If, kako je prikazano na slici 2.9. Slika 2.9. Prozor "Select Cases: If" s naznaenim uvjetom v1=2
Strelicom se varijabla v1 prebaci u odgovarajue polje i izjednai s 2, jer je uvjet da se biraju samo oni ispitanici enskog spola, a enski spol je pri kodiranju oznaen s 2. Klikom na Continue i OK, u dodatnom stupcu Data View javlja se nova varijabla filter_$, gdje su s 1 oznaena polja ispitanika enskog spola, a s 0 polja ispitanika mukog spola. Naravno, dok je filter aktivan program SPSS u svim svojim analizama uvaava samo polja oznaena u filteru s 1, odnosno ispitanike enskog spola. Stupac filter_$ moe se vidjeti na slici 2.10. Slika 2.10. "Data View" sa stupcem "filter_$"
Analitiki primjer 2.9. Zadatak je komentirati apsolutne i relativne frekvencije varijable: Grupirana ocjena u srednjoj koli (v2) samo za enski spol. Rjeenje 2.9: Nakon to je izvrena selekcija ispitanika enskog spola (kako je objanjeno u 2.8), potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v2 - Grupirana ocjena u srednjoj koli. Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 2.11 gdje su dani rezultati samo za enski spol. Tablica 2.11. Ispitanici prema: Grupirana ocjena u srednjoj skoli (enski spol)
Valid 3,00 4,00 5,00 Total Frequency 20 59 65 144 Percent 13,9 41,0 45,1 100,0 Valid Percent 13,9 41,0 45,1 100,0 Cumulative Percent 13,9 54,9 100,0
Prva frekvencija u stupcu Frequency u tablici 2.11 znai da je meu ispitanicima enskog spola bilo 20 njih s ocjenom 3 u srednjoj koli. Druga frekvencija istog stupca znai da je meu ispitanicima bilo 59 studentica s ocjenom 4, a njih 65 s ocjenom 5. U analizi je ukupno bilo 144 ispitanika enskog spola. Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke. Kako se vidi iz tablice, njegove vrijednosti odgovaraju onima iz stupca Valid Percent. Trea proporcija ili relativna frekvencija pokazuje da su 45,1% studentica u odnosu na sve 144 studentice imala prosjenu ocjenu u srednjoj koli 5.
59
Analitiki primjer 2.10. Zadatak je iz postojee baze podataka svih ispitanika odabrati sluajni uzorak od 60% ispitanika. Rjeenje 2.10: U glavnom izborniku bira se Data, a na njegovu padajuem izborniku Select Cases, gdje je potrebno aktivirati opciju Random sample of cases kako je prikazano na slici 2.11. Slika 2.11. Prozor "Select Cases" s aktiviranom opcijom "Random sample of cases"
Klikom na ikonu Sample... otvara se novi prozor Select Cases: Random Sample, kako je prikazano na slici 2.12. U tom prozoru potrebno je aktivirati Approximately i naznaiti 60% of all cases. Klikom na Continue i OK, u dodatnom stupcu Data View javlja se nova varijabla filter_$, gdje su s 1 oznaena polja sluajno odabranih 60% ispitanika, a sa 0 polja 40% ispitanika koji nee biti ukljueni u daljnju analizu. Naravno, dok je filter aktivan program SPSS u svim svojim analizama uvaava samo polja oznaena u filteru s 1.
60
Analitiki primjer 2.11. Zadatak je komentirati apsolutne i relativne frekvencije varijable : Grupirana ocjena u srednjoj koli (v2) za 60% sluajno odabranih ispitanika. Rjeenje 2.11: Nakon to je izvrena sluajna selekcija 60% ispitanika (kako je objanjeno u 2.10), potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v2 - Grupirana ocjena u srednjoj koli. Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 2.10, gdje su dani rezultati samo za 60% sluajno odabranih ispitanika. Prva frekvencija u stupcu Frequency u tablici 2.12 znai da je izmeu 60% sluajno odabranih ispitanika bio 1 s ocjenom 2 u srednjoj koli. Druga frekvencija istog stupca znai da je meu tim ispitanicima bilo 17 s ocjenom 3, njih 75 s ocjenom 4, a 49 s ocjenom 5. Sluajno odabranih 60% ispitanika ima 143, a od toga 1 nije odgovorio na postavljeno pitanje.
61
Stupac Percent prikazuje relativne frekvencije u postotcima za valjane podatke. Druga proporcija ili relativna frekvencija pokazuje da je od 60% ispitanika njih 12% imalo prosjenu ocjenu u srednjoj koli 3.
Analitiki primjer 2.12. Zadatak je formirati grafikon jednostavnih stupaca za varijablu: Spol (v1). Rjeenje 2.12: Grafikon jednostavnih stupaca za odabranu varijablu u programu SPSS moe se nacrtati na dva naina: I. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v1 Spol. Odabirom ikone Charts otvara se novi prozor Frequencies: Charts, gdje je potrebno aktivirati Bar charts. Klikom na Continue i OK u Outputu programa SPSS uz sve frekvencije dobije se i traeni grafikon.
62
Slika 2.13. Prozori "Frequencies" i "Frequencies: Charts" s odabranim "Bar Charts" i varijablom Spol (v1)
150
120
Frequency
90
60
30
0 Musko Zensko
Spol
63
Prema slici 2.14 vidi se da je meu ispitanicima vie onih enskog spola, preciznije njih 144, a onih mukog spola ima 94. II. nain: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar chart, na kojem se aktivira ikona Simple. To je prikazano na slici 2.15. Slika 2.15. Prozori "Bar Charts" s aktiviranim "Simple" grafikonima
Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Spol (v1). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je identian onome prikazanom na slici 2.14.
Analitiki primjer 2.13. Zadatak je formirati grafikon strukturni krug za varijablu: Spol (v1).
64
Rjeenje 2.13: Grafikon strukturnoga kruga za odabranu varijablu u programu SPSS moe se nacrtati na dva naina: I. nain: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v1 Spol. Odabirom ikone Charts otvara se novi prozor Frequencies: Charts, gdje je potrebno aktivirati Pie charts. Klikom na Continue i OK u Outputu programa SPSS uz sve frekvencije dobije se i traeni grafikon. Slika 2.16. Ispitanici prema spolu (v1)
Spol
Prema slici 2.16 vidi se da je meu ispitanicima vie onih enskog spola. Moe se vidjeti da su na ovom grafikom prikazu ukljueni svi ispitanici, pa i oni koji nisu dali odgovor na pitanje o spolu.
65
II. nain: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Pie chart, na kojem se aktivira Summaries of groups of case. To je prikazano na slici 2.17. Slika 2.17. Prozor "Pie Charts" s aktiviranim "Summaries of groups of case"
Odabirom ikone Define otvara se prozor Define Pie: Summaries for Groups of Cases, gdje se u prostor Define Slices by prebaci eljena varijabla, to je u ovom sluaju Spol (v1). Grafikonu se moe definirati i naslov, na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je slian onome prikazanom na slici 2.16, samo to ne sadri ispitanike koji nisu odgovorili na pitanje o spolu (Missing).
Analitiki primjer 2.14. Za sve ispitanike zadatak je: a) Izraunati ukupan deparac po obitelji (v4) ako sva djeca u jednoj obitelji dobivaju jednak iznos novca. b) Prikazati varijablu grupiranog deparca (v2) grafiki pomou jednostavnih stupaca. c) Objasniti grafikon pod (b)!
66
Rjeenje 2.14: a) Za sve ispitanike potrebno je izraunati ukupan deparac po obitelji uz pretpostavku da sva djeca u jednoj obitelji imaju jednak deparac. Dakle, da bi se dobio ukupan deparac po obitelji za svakog ispitanika, potrebno je deparac ispitanika (v1) pomnoiti s brojem djece u svakoj obitelji (v3). Da bi se pomou postojeih numerikih varijabli izraunala nova numerika varijabla, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku Compute. Na ekranu se pojavi prozor Compute Variable. U polje Target Variable potrebno je unijeti ime nove varijable v4, dok se u Numeric Expression unosi izraz po kojem se iz postojeih varijabli kreira nova varijabla na sljedei nain:
v 4 = v1 v3 .
(2.15)
Nakon to se klikne ikona OK, nova varijabla v4 automatski se formira u dodatnom stupcu u Data View programa SPSS. Nova varijabla se moe vidjeti na slici 2.18. Slika 2.18. "Data view" s novom varijablom v4
U Variable View potrebno je na odgovarajui nain definirati tu novu varijablu te u stupcu Label naznaiti da je to "Ukupan deparac po obitelji". Ta nova varijabla je numerika i ima skalu mjerenja Scale. b) Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar char, na kojem se aktivira ikona Simple. Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Grupirani deparac (v2). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 2.19. Slika 2.19.
Ispitanici prema grupiranom dzeparcu
80
60
Count
40
20
Grupirani dzeparac
68
c) Na grafikonu se moe vidjeti da najvei broj ispitanika ima deparac do 200 kn. Kako raste visina deparca, smanjuje se broj ispitanika koji ima toliki deparac.
Analitiki primjer 2.15. Za sve ispitanike potrebno je: a) Grupirati varijablu Visina u cm (v2) u Grupiranu visinu (v3) po principu: - 160 160
- 170 - 180 - 190 - 200 - 210
b) Prikazati varijablu grupirane visine (v3) grafiki pomou linijskog grafikona. c) Objasniti grafikon pod (b)! Rjeenje 2.15: a) Da bi se pomou varijable v2 - "Visina u cm" formirala nova varijabla v3 - "Grupirana visina " po principu koji je prikazan u zadatku pd (a), potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v2 "Visina u cm", a u Output Variable, Name je v3, a Label "Grupirana visina". Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range: Lowest through upisuju se odgovarajue grupe ocjena kako je prikazano na slici 2.20.
69
Slika 2.20. Prozor "Recode into Different Variables: Old and New Values", pomou kojih se kreira nova varijabla v3 - Grupirana visina
Nakon upisivanja svakog pojedinog Range: Lowest through, upisuje se i odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View, kreirat e se nova varijabla "Grupirana visina", odnosno v3. b) Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Line chart na kojem se aktivira ikona Simple. Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Grupirana visina (v3). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 2.21.
70
Slika 2.21.
Ispitanici prema "grupiranoj visini"
120
100
80
Count
60
40
20
Grupirana visina
c) Na grafikonu se moe vidjeti da najvei broj ispitanika ima visinu 180 cm. Kako se visina smanjuje ili poveava, smanjuje se broj ispitanika koji ima toliku visinu. 2.5. Relativni brojevi koordinacije i indeksi Relativni brojevi koordinacije pokazuju odnos dviju pojava ili frekvencija u razliitim statistikim nizovima, koje mogu imati razliitu jedinicu mjere, a koje ima smisla usporeivati. Raunaju se:
Ri = Ai , i = 1,2,..., k Bi
(2.16)
gdje je:
71
Ai - veliina koja se usporeuje Bi - veliina s kojom se Ai usporeuje. Grafiki prikaz relativnih brojeva koordinacije je tzv. Varzarov znak. To su stupci, odnosno pravokutnici, ija baza na apscisi odgovara nazivniku (Bi), a visina relativnom broju koordinacije (Ri). Ako se zna da je povrina stupca (pravokutnika) baza visina, moe se zakljuiti da povrina odgovara brojniku (Ai), tj. veliini koja se usporeuje. Analitiki primjer 2.16. Statistiki nizovi "povrine i stanovnitvo u odabranim zemljama 2001. godine" prema nominalnom prostornom obiljeju "zemlje", prikazani su u tablici 2.13. Zadatak je izraunati broj stanovnika po km2. Tablica 2.13. Povrine i stanovnitvo u odabranim zemljama 2001. godine
Stanovnitvo Povrina u 000 u km2 Br.stan./km2 Ai Bi Ri Hrvatska 4437 56594 78,40054 Slovenija 1930 20273 95,20051 Austrija 8151 83871 97,18496 Maarska 10106 93032 108,6293 Bosna i Hercegovina 3922 51197 76,60605 Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 743. Zemlje
Rjeenje 2.16. U posljednjem stupcu tablice 2.13 izraunat je broj stanovnika po km za svaku zemlju, odnosno izraunati su relativni brojevi koordinacije.
2
Rezultat se moe komentirati: u Republici Hrvatskoj je po km2 bilo prosjeno 78,40 stanovnika u 2001. godini. Najveu gustou naseljenosti
72
od promatranih zemalja imala je Maarska (108,63 stan/km2), a najniu Bosna i Hercegovina (76,61 stan/km2). Potrebno je napomenuti da je stanovnitvo u tablici dano u tisuama, pa su kod raunanja za vrijednosti Ai dodane tisue. Indeksima niza kvalitativnih podataka usporeuje se smjer i intenzitet varijacija frekvencija nekog statistikog niza s takvim varijacijama drugoga statistikog niza. Raunaju se tako da se svaki lan promatranog niza stavi u odnos prema odabranoj bazi, koja moe biti jedan od lanova niza ili neka druga zadana veliina.
Ii = fi 100, i = 1,2,..., k . B
(2.17)
Dakle, prema izrazu (2.17) indeksi se raunaju kao omjer frekvencije promatranog niza i odabrane baze (B). Grafiki prikaz indeksa kvalitativnih nizova su jednostavni stupci koji imaju jednake baze, jer se ovdje lanovi niza usporeuju uvijek s istom veliinom. Specifinost ovog grafikona jest da se stupci naslanjaju na bazu koja je jednaka 100. Analitiki primjer 2.17. Statistiki niz "prosjena godinja osobna potronja po kuanstvu u kunama, RH, 2002. godine" prema nominalnom obiljeju "vrsta potronje" prikazani su u tablici 2.14. Zadatak je izraunati indekse potronje s bazom "potronja na rekreaciju i kulturu". Rjeenje 2.17. U tablici 2.14. izraunati su indeksi za svaki pojedini modalitet vrste potronje, a baza tih indeksa je potronja na rekreaciju i kulturu. Indeksi su izraunati tako da je svaka apsolutna frekvencija niza stavljena u odnos prema zadanoj bazi. Indeks uz bazu je uvijek = 100. Na primjer, indeks za potronju na hranu i bezalkoholna pia je:
73
I1 =
Tablica 2.14. Prosjena godinja osobna potronja po kuanstvu u kunama, RH, 2002. god.
Potronja Indeksi Vrsta potronje fi (Rekr. i kult.=100) Hrana i bezalk. pia 20816 500,9868 Alkohol i duhan 2575 61,97353 Odjea i obua 5736 138,0505 Stanovanje 8875 213,5981 Pokustvo i odravanje 3573 85,99278 Zdravstvo 1442 34,70517 Rekreacija i kultura 4155 100 Hoteli i restorani 2049 49,31408 Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 185. i 186.
Indeksi se tumae u %, tako da se od njih oduzme 100. Moe se zakljuiti da je potronja na hranu i bezalkoholna pia bila ( I 1 100 = 500,99 100 = 400,99% ) za 400,99% vea u odnosu na bazu, odnosno na potronju za rekreaciju i kulturu. Isto tako indeks za potronju na odjeu i obuu je:
I3 = f3 5736 100 = 100 = 138,05 . 4155 B
Moe se zakljuiti da je potronja na odjeu i obuu bila ( I 3 100 = 138,05 100 = 38,05% ) za 38,05% vea u odnosu na bazu, odnosno na potronju za rekreaciju i kulturu. Na isti nain indeks za potronju na zdravstvo je:
I6 = f6 1442 100 = 100 = 34,71 . 4155 B
Moe se zakljuiti da je potronja na zdravstvo bila ( I 6 100 = 34,71 100 = 65,29% ) za 65,29% manja u odnosu na potronju za rekreaciju i kulturu.
74
Slika 2.21.
Indeksi prosjene godinje osobne potronje(Rekr. i kult.=100)
600 500 400
Indeksi
300 200 100 0 Hrana i bezalk. odravanje Stanovanje Pokustvo i Odjea i Alkohol i duhan obua pia
Zdravstvo
Rekreacija i
Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 185. i 186.
Na slici 2.21 prikazani su izraunati indeksi. Na slici se vidi da su to stupci naslonjeni na bazu 100. Ako je indeks vei od 100, stupac se nalazi iznad baze, a ako je manji od 100, stupac je ispod baze. Tako se iz grafikona jasno vidi za koliki postotak su pojedine kategorije prosjene godinje osobne potronje vee ili manje od baze 100, tj. potronje na rekreaciju i kulturu.
Analitiki primjer 2.18. Ako je prosjeni deparac 372 kn, potrebno je za sve ispitanike: a) Izraunati indekse varijable deparac (v3) uzimajui za bazu indeksa prosjeni deparac po ispitaniku. Rjeenje 2.18: Za sve ispitanike potrebno je izraunati indekse varijable deparac (v3) uzimajui za bazu indeksa prosjeni deparac po ispitaniku koji
75
kultura
restorani
Hoteli i
iznosi 372. Dakle, da bi se dobili ovi indeksi, potrebno je deparac ispitanika (v2) podijeliti s bazom koja iznosi 372 i sve to prema jednadbi (2.17) pomnoiti sa 100. Da bi se pomou postojeih numerikih varijabli izraunala nova numerika varijabla, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku Compute. Na ekranu se pojavi prozor Compute Variable. U polje Target Variable potrebno unijeti ime nove varijable v3, dok se u Numeric Expression unosi izraz po kojem se iz postojeih varijabli kreira nova varijabla na sljedei nain:
v3 = (v 2 / 372) 100 .
Nakon to se klikne ikona OK, nova varijabla v3 automatski se formira u dodatnom stupcu u Data View programa SPSS. U Variable View potrebno je na odgovarajui nain definirati tu novu varijablu te u stupcu Label naznaiti da su to "Indeksi deparca po ispitaniku". Ta nova varijabla je numerika i ima skalu mjerenja Scale.
Analitiki primjer 2.19. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) spol (v1) mijenja po redcima (row), a varijabla (obiljeje) grupirani deparac (v2) po stupcima (column): a) Formirati dvostruku statistiku tablicu bez zbirnih redaka i stupaca. b) Formirati dvostruku statistiku tablicu sa zbirnim redcima i stupcima. c) Nacrtati grafikon viestrukih varijablama i komentirati sliku! stupaca prema odabranim
76
Rjeenje 2.19: a) Da bi se formirala dvostruka statistika tablica bez zbirnih redaka i stupaca, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Tables, i General Tables. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Rows, a druga varijabla v2 - Grupirani deparac u polje Columns. To je prikazano na slici 2.23. Slika 2.23. "General Tables" s varijablama v1 u redcima i v2 u stupcima
Klikom na OK, u Outputu se za rezultat dobije traena tablica koja je prikazana u sljedeoj tablici 2.15. Tablica 2.15. Ispitanici prema spolu i grupiranom deparcu
Grupirani deparac 200,00 Spol Muko ensko 28 45 400,00 18 34 600,00 10 20 800,00 4 2 1000,00 4 3 3500,00 4 1
U tablici 2.15. vidi se da najvie ispitanika ima deparac do 200 kn. Iako je u analizi vie ispitanika enskog spola, pokazalo se da vei deparac imaju oni mukog spola. b) Da bi se formirala dvostruka statistika tablica sa zbirnim redcima i stupcima, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Row(s), a druga varijabla v2 - Grupirani deparac u polje Column(s). To je prikazano na slici 2.24. Slika 2.24. "Crosstabs" s varijablama v1 u redcima i v2 u stupcima
Klikom na OK u Outputu se za rezultat dobije traena tablica sa zbirnim stupcima i redcima koja je prikazana u sljedeoj tablici 2.16.
78
200,00 28 45 73
400,00 18 34 52
600,00 10 20 30
800,00 4 2 6
1000,00 4 3 7
3500,00 4 1 5
Za razliku od tablice 2.15 u tablici 2.16 postoje zbirni stupci i zbirni redci. U njima se nalaze marginalne frekvencije koje kau koliko ispitanika ima po jednoj grupi obiljeja bez obzira na drugo obiljeje. Na primjer, prvi podatak u zbirnom stupcu kae da je 68 ispitanika mukog spola bez obzira na deparac. Trei podatak u zbirnom retku kae da je 30 ispitanika imalo deparac izmeu 400 i 600 kn bez obzira na spol. c) Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs (slika 2.24), potrebno je aktivirati Display clustered bar charts. Slika 2.25. Viestruki stupci visine deparca prema spolu
Bar Chart
50
Grupirani dzeparac
200,00 400,00 600,00
40
Count
30
20
10
0 Musko Zensko
Spol
Traeni grafikon prikazan je na slici 2.25. Moe se vidjeti da se prvi viestruki stupac odnosi na ispitanike mukog spola, a drugi na ispitanike enskog spola. I u jednom i u drugom dijelu grafikona najvei stupci su oni koji prikazuju nii deparac, dok oni manji stupci pokazuju vii iznos deparca.
Analitiki primjer 2.20. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) spol (v1) mijenja po stupcima (column), a varijabla (obiljeje) grupirani deparac (v2) po redcima (row): a) Formirati dvostruku statistiku tablicu bez zbirnih redaka i stupaca. b) Formirati dvostruku statistiku tablicu sa zbirnim redcima i stupcima. c) Nacrtati grafikon dvostrukih varijablama i komentirati sliku! Rjeenje 2.20: a) Da bi se formirala dvostruka statistika tablica bez zbirnih redaka i stupaca, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Tables i General Tables. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Columns, a druga varijabla v2 - Grupirani deparac u polje Rows. Princip je kao to je prikazano na slici 2.20, samo to odabrane varijable po stupcima i po redcima mijenjaju svoje mjesto. Klikom na OK, u Outputu se za rezultat dobije traena tablica koja je prikazana u sljedeoj tablici 2.17. stupaca prema odabranim
80
Ako se napravi usporedba tablice 2.17 s tablicom 2.15, moe se vidjeti da se sada varijabla spol mijenja po stupcima, a varijabla grupirani deparac po redcima. I iz ove tablice jasno je da najvei broj ispitanika i jednog i drugog spola imaju najmanju kategoriju deparca, tj. do 200 kn na mjesec. b) Da bi se formirala dvostruka statistika tablica s zbirnim redcima i stupcima, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Prema zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u polje Column(s), a druga varijabla v2 - Grupirani deparac u polje Row(s). Tablica 2.18. Ispitanici prema spolu i grupiranom deparcu
Grupirani dzeparac * Spol Crosstabulation Count Spol Grupirani dzeparac 200,00 400,00 600,00 800,00 1000,00 3500,00 Total Musko 28 18 10 4 4 4 68 Zensko 45 34 20 2 3 1 105 Total 73 52 30 6 7 5 173
Slian je princip kao to je prikazano na slici 2.24, samo to odabrane varijable po stupcima i po redcima mijenjaju svoje mjesto. Klikom na OK u Outputu se za rezultat dobije traena tablica sa zbirnim stupcima i redcima koja je prikazana u tablici 2.18. Za razliku od tablice 2.17 u tablici 2.18 postoje zbirni stupci i zbirni redci. U njima se nalaze marginalne frekvencije koje kau koliko ispitanika ima po jednoj grupi obiljeja bez obzira na drugo obiljeje. Na primjer, prvi podatak u zbirnom retku kae da je 68 ispitanika mukog spola bez obzira na deparac. Trei podatak u zbirnom stupcu kae da je 30 ispitanika imalo deparac izmeu 400 i 600 kn bez obzira na spol. c) Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs (slika 2.24), potrebno je aktivirati Display clustered bar charts. Slika 2.26. Dvostruki stupci spola ispitanika prema visini deparca
Bar Chart
50
Spol
Musko Zensko
40
Count
30
20
10
Grupirani dzeparac
Traeni grafikon prikazan je na slici 2.26. Moe se vidjeti da se svaki dvostruki stupac odnosi na razliitu kategoriju visine deparca. U prva tri dvostruka stupca veu zastupljenost imaju ispitanici enskog
82
spola, a prema posljednja tri stupca moe se zakljuiti da je muki spol u veini. Dakle, openito ispitanici enskog spola imaju nii iznos deparca, dok ispitanici mukog spola imaju vei iznos deparca.
Analitiki primjer 2.21. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) kolska sprema oca (v1) mijenja po redcima (row), a varijabla (obiljeje) prikljuenje EU (v2) po stupcima (column): a) Tablica sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.21: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Tablica 2.19. Ispitanici prema kolskoj spremi oca i miljenju o prikljuenju EU
Skolska sprema oca * Jeste li za prikljucenje RH u EU Crosstabulation Count Jeste li za prikljucenje RH EU Da Skolska sprema oca Osnovna skola Srednja cetverogodisnja Srednja trogodisnja Visa Visoka Magisterij Doktorat Total 22 67 27 39 53 4 2 214 Ne 0 6 2 5 4 1 1 19 Total 22 73 29 44 57 5 3 233
83
Pomou odgovarajuih strelica varijabla v1 - kolska sprema oca se prebacuje u polje Row(s), a druga varijabla v2 - Prikljuenje EU u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica, koja je prikazana tablicom 2.19 i grafikon, prikazan na slici 2.27. Slika 2.27. Ispitanici prema kolskoj spremi oca i miljenju o prikljuenju EU
Bar Chart
70
Jeste li za prikljucenje RH EU
Da Ne
60
50
Count
40
30
20
10
0
Osnovna skola Srednja Srednja cetverogodis... trogodisnja Visa Visoka Magisterij Doktorat
b) Prema podacima u tablici 2.19 i slici 2.27 moe se zakljuiti da je veina ispitanika iz odabranog uzorka za prikljuenje Republike Hrvatske Europskoj uniji, bez obzira na kolsku spremu njihova oca. Isto tako moe se primijetiti da je u uzorku najvei broj ispitanika kojima otac ima srednju strunu spremu (to je zaista i openita situacija u Republici Hrvatskoj - prema podacima u SLJH, razne godine - pa bi se u tom smislu moglo komentirati o sluajnosti izabranog uzorka).
84
Analitiki primjer 2.22. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) prikljuenje EU (v1) mijenja po redcima (row), a varijabla (obiljeje) vjenanje sa osobom druge vjere (v2) po stupcima (column): a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.22: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Prikljuenje EU u polje Row(s), a druga varijabla v2 - Vjenanje sa osobom druge vjere u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.20 i grafikon prikazan na slici 2.28. Tablica 2.20. Ispitanici prema miljenju o prikljuenju EU i o vjenanju sa osobom druge vjere
Jeste li za prikljucenje RH EU * Biste li se vjencali sa osobom druge vjere Crosstabulation Count Biste li se vjencali sa osobom druge vjere Da Jeste li za prikljucenje RH EU Total Da Ne 105 10 115 Ne 95 9 104 Total 200 19 219
85
Slika 2.28 Ispitanici prema miljenju o prikljuenju EU i o vjenanju sa osobom druge vjere
Bar Chart
120
100
80
Count
60
40
20
0 Da Ne
Jeste li za prikljucenje RH EU
b) Prema podacima u tablici 2.20 i slici 2.28 moe se zakljuiti da je veina ispitanika iz odabranog uzorka za prikljuenje Republike Hrvatske Europskoj uniji, to se vidi prema marginalnim frekvencijama u zbirnom stupcu tablice i prema prvom dvostrukom stupcu grafikona. Isto tako moe se primijetiti da je u uzorku broj ispitanika koji bi se vjenao sa osobom druge vjere malo vei od onih koji to ne bi napravili, te da su otprilike ravnomjerno rasporeeni bez obzira na miljenje o tome jesu li za prikljuenje Republike Hrvatske Europskoj uniji.
Analitiki primjer 2.23. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) odnosi u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) uivate li drogu (v2) po stupcima (column). Potrebno je:
86
a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.23: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v2 - Odnosi u obitelji prebacuje se u polje Row(s), a druga varijabla v1 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica, koja je prikazana tablicom 2.21 i grafikon prikazan na slici 2.29. Tablica 2.21. Ispitanici prema odnosima u njihovoj obitelji i konzumiranju droge
Odnosi u obitelji * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Odnosi u obitelji Vlada sklad i razumijevanje Povremene svadje i sukobi Ucestale svadje i sukobi Total 6 6 1 13 Ne 147 70 0 217 Total 153 76 1 230
b) Prema podacima u tablici 2.21 i slici 2.29 moe se zakljuiti da veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema prvoj marginalnoj frekvenciji u zbirnom stupcu, te prvom dvostrukom stupcu grafikona, moe se vidjeti da u obiteljima kod veine ispitanika vlada sklad i razumijevanje. Samo 1 ispitanik izjasnio se da u obitelji ima uestale svae i sukobe i on konzumira drogu (trei dvostruki stupac grafikona).
87
150
Uzivate li drogu
Da Ne
120
Count
90
60
30
Odnosi u obitelji
Analitiki primjer 2.24. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) kolska sprema oca (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.24: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
88
Pomou odgovarajuih strelica varijabla v1 - kolska sprema oca Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica, koja je prikazana tablicom 2.22 i grafikon prikazan na slici 2.30. Tablica 2.22. Ispitanici prema kolskoj spremi oca i konzumiranju droge
Skolska sprema oca * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Skolska sprema oca Osnovna skola Srednja cetverogodisnja Srednja trogodisnja Visa Visoka Magisterij Doktorat Total 1 2 2 3 5 0 0 13 Ne 20 69 28 41 53 5 2 218 Total 21 71 30 44 58 5 2 231
b) Prema podacima u tablici 2.22 i slici 2.30 moe se zakljuiti da veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema zadnje dvije marginalne frekvencije u zbirnom stupcu, te zadnja dva dvostruka stupca grafikona, moe se vidjeti da samo 5 ispitanika ima oca s titulom magistra, a 2 ispitanika imaju oca s doktoratom. Meu njima nitko ne konzumira drogu.
89
70
Uzivate li drogu
Da Ne
60
50
Count
40
30
20
10
0
Osnovna skola Srednja Srednja cetverogodis... trogodisnja Visa Visoka Magisterij Doktorat
Analitiki primjer 2.25. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) Broj djece u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.25: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
90
Pomou odgovarajuih strelica varijabla v1 - Broj djece u obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.23 i grafikon prikazan na slici 2.31. Tablica 2.23. Ispitanici prema broju djece u obitelji i konzumiranju droge
Broj djece u obitelji * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Broj djece u obitelji 1 2 3 4 5 6 7 Total 1 8 4 0 0 0 0 13 Ne 20 130 51 11 5 1 1 219 Total 21 138 55 11 5 1 1 232
b) Prema podacima u tablici 2.23 i slici 2.31 moe se zakljuiti da veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema zadnje dvije marginalne frekvencije u zbirnom stupcu, te zadnja dva dvostruka stupca grafikona, moe se vidjeti da samo po 1 ispitanik u obitelji ima 6ero i 7-ero djece. Meu njima nitko ne konzumira drogu.
91
140
Uzivate li drogu
Da Ne
120
100
Count
80
60
40
20
0 1 2 3 4 5 6 7
Analitiki primjer 2.26. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Financijske prilike u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) Broj djece u obitelji (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.26: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Financijske prilike u obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Broj djece u
92
obitelji u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.24 i grafikon prikazan na slici 2.32. Tablica 2.24. Ispitanici prema financijskim prilikama i broju djece u obitelji
Financijske prilike u obitelji * Broj djece u obitelji Crosstabulation Count Broj djece u obitelji 1 Financijske prilike u obitelji Nema novca za normalan standard Zadovoljavamo osnovne potrebe Nema materijalnih problema Zivimo odlicno 0 2 3 3 0 4 0 5 1 6 0 7 0 4 Total
12
56
29
104
9 0 21
78 5 142
25 1 55
5 1 11
2 0 5
1 0 1
1 0 1
121 7 236
Total
b) Prema podacima u tablici 2.24 i slici 2.32 moe se zakljuiti da kod veine ispitanika iz odabranog uzorka ima 2 djece u obitelji. Ispitanika koji su se izjasnili da nemaju novca za normalan standard te onih koji ive odlino ima znatno manje u odnosu na ostale kategorije (prvi i zadnji viestruki stupac grafikona na slici 2.32).
93
80
60
Count
40
20
0 Nema novca za normalan standard Zadovoljavamo osnovne potrebe Nema materijalnih problema Zivimo odlicno
Analitiki primjer 2.27. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Financijske prilike u obitelji (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b)
94
Rjeenje 2.27: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Financijske prilike u obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.25 i grafikon prikazan na slici 2.33. Tablica 2.25. Ispitanici prema financijskim prilikama u obitelji i konzumiranju droge
Financijske prilike u obitelji * Uzivate li drogu Crosstabulation Count Uzivate li drogu Da Financijske prilike u obitelji Nema novca za normalan standard Zadovoljavamo osnovne potrebe Nema materijalnih problema Zivimo odlicno Total 1 7 4 1 13 Ne 3 96 114 5 218 Total 4 103 118 6 231
b) Prema podacima u tablici 2.25 i slici 2.33 moe se zakljuiti da veina ispitanika iz odabranog uzorka ipak ne konzumira drogu. Ispitanika koji su se izjasnili da nemaju novca za normalan standard te onih koji ive odlino ima znatno manje u odnosu na ostale kategorije (prvi i zadnji viestruki stupac grafikona na slici 2.33).
95
120
Uzivate li drogu
Da Ne
100
80
Count
60
40
20
0 Nema novca za Zadovoljavamo normalan standard osnovne potrebe Nema materijalnih problema Zivimo odlicno
Analitiki primjer 2.28. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Grupirana ocjena u srednjoj koli (v1) mijenja po redcima (row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.28: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
96
120
Uzivate li drogu
Da Ne
100
80
Count
60
40
20
Pomou odgovarajuih strelica varijabla v1 - Grupirana ocjena u srednjoj koli prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.26. i grafikon prikazan na slici 2.34.
97
b) Prema podacima u tablici 2.26 i slici 2.34 moe se zakljuiti da veina ispitanika u srednjoj koli ima prosjenu ocjenu 4. S obzirom na ukupan broj ispitanika koji su u srednjoj koli imali prosjenu ocjenu 3, broj onih koji izmeu njih konzumiraju drogu je 4, a to je relativno najvei udio (drugi dvostruki stupac grafikona na slici 2.34).
Analitiki primjer 2.29. Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla (obiljeje) Uivate li drogu (v2) mijenja po redcima (row), a varijabla (obiljeje) Spol (v1) po stupcima (column). Potrebno je: a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.29: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v2 - Uivate li drogu premjestiti u polje Row(s), a drugu varijablu v1 - Spol u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Tablica 2.27. Ispitanici prema konzumiranju droge i spolu
Uzivate li drogu * Spol Crosstabulation Count Spol Musko Uzivate li drogu Total Da NE 7 84 91 Zensko 6 136 142 Total 13 220 233
Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.27 i grafikon prikazan na slici 2.35. Slika 2.35. Ispitanici prema konzumiranju droge i spolu
Bar Chart
140
Spol
Musko Zensko
120
100
Count
80
60
40
20
0 Da NE
Uzivate li drogu
b) Prema podacima u tablici 2.27 i slici 2.35 moe se zakljuiti da je veina ispitanika u odabranom uzorku enskog spola. Prvi dvostruki stupac grafikona odnosi se na one ispitanike koji konzumiraju drogu. Moe se vidjeti da meu njima prevladavaju oni mukog spola (i prema prvom retku tablice 2.27).
Analitiki primjer 2.30. Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla (obiljeje) Puite li cigarete (v1) mijenja po redcima (row), a varijabla (obiljeje) Grupirana ocjena u srednjoj koli (v2) po stupcima (column). Potrebno je:
99
a) Formirati tablicu sa zbirnim redcima i stupcima te nacrtati grafikon viestrukih stupaca! b) Komentirati sliku i izraunate frekvencije! Rjeenje 2.30: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Pomou odgovarajuih strelica varijabla v1 - Puite li cigarete prebacuje se u polje Row(s), a druga varijabla v2 - Grupirana ocjena u srednjoj koli u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display clustered bar charts. Tablica 2.28. Ispitanici prema puenju cigareta i ocjeni iz srednje kole
Pusite li cigarete * Grupirana ocjena u srednjoj skoli Crosstabulation Count Grupirana ocjena u srednjoj skoli 2,00 Pusite li cigarete Ne Do 10 cigareta na dan Do 1 kutije na dan Vise od 1 kutije na dan 0 0 1 0 1 3,00 18 4 11 1 34 4,00 83 14 8 7 112 5,00 72 7 9 2 90 Total 173 25 29 10 237
Total
Klikom na OK u Outputu se za rezultat dobije traena dvostruka tablica koja je prikazana tablicom 2.28 i grafikon prikazan na slici 2.36. b) Prema podacima u tablici 2.28 i slici 2.36 moe se zakljuiti da veina ispitanika ne pui cigarete. U svim kategorijama puaa cigareta najvei je broj onih s prosjenom ocjenom iz srednje kole vrlo dobar, tj. 4, osim kod onih koji pue do 1 kutije na dan, gdje prevladavaju ispitanici s prosjenom ocjenom iz srednje kole dobar, tj. 3 (trei viestruki stupac grafikona na slici 2.36).
100
100
80
4,00 5,00
Count
60
40
20
Pusite li cigarete
101
102
Srednje vrijednosti
3. SREDNJE VRIJEDNOSTI
3.1. Srednje vrijednosti Prikupljeni statistiki podaci u svom izvornom obliku esto zbog svog obujma nemaju razumljivu formu. Zbog toga se i vri njihovo grupiranje, odnosno formiranje statistikih nizova. Na taj se nain dobiva detaljniji uvid u svojstva promatranoga statistikog niza. Raunanjem srednjih vrijednosti dolazi se do informacija o vrijednostima statistikog obiljeja oko kojih se rasporeuju elementi statistikog niza. Srednja vrijednost je vrijednost statistikog obiljeja oko koje se grupiraju podaci statistikog niza. Jo se zove i "mjera centralne tendencije". Srednje vrijednosti mogu se podijeliti: na 1. Poloajne srednje vrijednosti odreuju se poloajem podataka u nizu. Najvanije poloajne srednje vrijednosti su : a) mod b) medijan. 2. Potpune srednje vrijednosti raunaju se upotrebom svih podataka u statistikom nizu. Potpune srednje vrijednost su: a) aritmetika sredina b) harmonijska sredina c) geometrijska sredina (koja nema svoju primjenu u sociolokim istraivanjima).
103
3.2. Aritmetika sredina Aritmetika sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu. To je najvanija i najee koritena srednja vrijednost (ali ne i uvijek najbolja srednja vrijednost). Aritmetika sredina je omjer zbroja svih vrijednosti numerikog obiljeja jednog niza i broja elemenata tog niza. Ako se radi o negrupiranom statistikom numerikom nizu, rauna se jednostavna aritmetika sredina:
X =
i =1
Xi N
X 1 + X 2 + ... + X N N
(3.1)
Ako se radi o grupiranom statistikom numerikom nizu, rauna se sloena, vagana ili ponderirana aritmetika sredina. Poznato je da apsolutne frekvencije oznaavaju broj elemenata skupa koji pripadaju odreenom modalitetu promatranoga statistikog obiljeja. Iz toga se moe zakljuiti da je vanost svake vrijednosti obiljeja ovisna o frekvenciji jer vea frekvencija znai vei udio tog oblika obiljeja u promatranom skupu. Zato se frekvencija jo naziva teinski faktor ili ponder kod grupiranih nizova. Vagana ili ponderirana aritmetika sredina rauna se prema izrazu:
X=
i =1 k
f i xi
i =1
fi
f 1 x1 + f 2 x 2 + ... + f k x k f 1 + f 2 + ... + f k
(3.2)
U jednadbi (3.2) k predstavlja broj grupa, odnosno modaliteta promatranog numerikog obiljeja. Nazivnik ovog izraza, kao suma svih apsolutnih frekvencija, odgovara opsegu statistikog skupa. Ako su veliine razreda grupiranog numerikog niza razliite od 1, za raunanje vagane ili ponderirane aritmetike sredine
104
Srednje vrijednosti
potrebno je izvriti aproksimaciju pomou sredine razreda. Sredina razreda, kako je ve reeno, dobije se kao jednostavan prosjek donje i gornje granice razreda. Na taj nain ona predstavlja sve vrijednosti obiljeja koje se javljaju u jednoj grupi. Stoga je, u ovom sluaju, aritmetika sredina procjena stvarne aritmetike sredine numerikog niza. Analitiki primjer 3.1. Statistiki skup "Zaposlene ene u graevinarstvu u RH, 31. 03. 2002. godine" promatran prema neprekidnom numerikom obiljeju "dob" dan je u tablici 3.1.. Zadatak je izraunati aritmetiku sredinu. Tablica 3.1. Zaposlene ene u graevinarstvu u RH, 31. 03. 2004. godine
Dob xi (18)-25 25-30 30-35 35-40 40-45 45-50 50-65 Ukupno: Broj ena fi 712 1367 1277 1417 1580 1557 1322 9232 Sredina razreda xi 21,5 27,5 32,5 37,5 42,5 47,5 57,5 fixi 15308 37592,5 41502,5 53137,5 67150 73957,5 76015 364663
Rjeenje 3.1: Zadani niz je grupiran prema modalitetima obiljeja. Razredi nisu jednake veliine, a ima ih 7. Kod grupiranih nizova s veliinom razreda razliitom od 1, u izrazu za aritmetiku sredinu, xi predstavlja sredinu i-tog razreda. Stoga je aproksimacija aritmetike sredine sljedea:
= X = i =1 7 fi
i =1
f i xi
105
Dakle priblino, prosjena je dob ena zaposlenih graevinarstvu RH (stanje 31. 03. 2004. god.) 39,5 godina.
Aritmetika sredina izraava se u originalnim jedinicama mjere promatranoga numerikog obiljeja, obuhvaa sve elemente nekog skupa, te se pomou nje mogu usporeivati nizovi koji su grupirani po jednakom obiljeju. Uz ove, aritmetika sredina zadovoljava i sljedee kriterije: a) Aritmetika sredina nalazi su izmeu najvee i najmanje vrijednosti promatranoga numerikog obiljeja:
xmin X xmax
(3.3)
b) Zbroj odstupanja vrijednosti numerikog obiljeja od aritmetike sredine u jednoj distribuciji je uvijek nula.
i =1
k
( xi X ) = 0 , za negrupirani niz,
f i ( xi X ) = 0 , za grupirani niz.
(3.4) (3.5)
i =1
c) Zbroj kvadrata odstupanja vrijednosti numerikog obiljeja od aritmetike sredine u jednoj distribuciji je manji ili jednak zbroju kvadrata odstupanja vrijednosti numerikog obiljeja u istoj distribuciji od bilo koje druge vrijednosti (a).
i =1 2 2 ( xi X ) ( xi a) , za negrupirani niz, i =1 N N
(3.6) (3.7)
i =1
2 2 f i ( xi X ) f i ( xi a) , za grupirani niz. i =1
Ako neki numeriki niz sadri ekstremno male ili velike vrijednosti obiljeja, aritmetika sredina kao prosjena vrijednost gubi na svojoj reprezentativnosti. Taj problem je dodatno izraen kada u distribuciji postoje razredi s otvorenom donjom, odnosno gornjom granicom razreda, i kada nije mogue te granice objektivno procijeniti.
106
Srednje vrijednosti
3.3. Mod Mod je vrijednost statistikog obiljeja koja se najee javlja u nekom nizu, tj. vrijednost obiljeja kojoj pripada najvea frekvencija. Mod se moe primijeniti na kvalitativne i kvantitativne statistike nizove, a spada u poloajne srednje vrijednosti. Kod nominalnih obiljeja mod se odreuje brojenjem na nain da se trai koja se vrijednost obiljeja u nizu najee javlja. Ako je niz grupiran, trai se najvea apsolutna frekvencija. Vrijednost obiljeja kojoj pripada ta najvea apsolutna frekvencija je mod. Analitiki primjer 3.2. Statistiki skup "prodane cipele u prodavaonici "K" na dan 05. 05. 2005. god." grupiran je prema nominalnom obiljeju "boja". Modaliteti toga obiljeja su: crna (C), bijela (B), ruiasta (R), smea (S). Ureeni podaci dobiveni evidencijom na odreeni dan su: CCCCCBRRRS Zadatak je odrediti mod. Rjeenje 3.2: Dakle, na dan 05. 05. 2005. god. u prodavaonici "K" je prodano 10 cipela. Od toga 5 crnih, 1 bijele, 3 ruiaste i 1 smee. Vrijednost obiljeja "boja" koja se u ovom nizu najee javlja je crna, pa se moe zakljuiti da je mod, Mo = crna boja . Statistiki niz grupiran u razrede prikazan je u tablici 3.2. Kod grupiranih nizova mod se odreuje prema najveoj apsolutnoj frekvenciji: f max = 5 . Modalitet obiljeja koji odgovara toj frekvenciji je crno, to znai da je: Mo = crna boja .
107
Tablica 3.2. Prodane cipele u prodavaonici "K" na dan 05. 05. 2005. god. prema boji
Boja cipela Xi crna bijela ruiasta smea Ukupno: Broj prodanih cipela fi 5 1 3 1 10
Ovo je primjer tzv. unimodalnih nizova koji imaju samo jedan mod. Postoje statistiki nizovi u kojima se dvije ili vie vrijednosti obiljeja mogu pojavljivati ee u odnosu na ostale modalitete obiljeja. U tom sluaju kae se su to bimodalni ili multimodalni nizovi. Kod bimodalne distribucije, koja ima dva vrha, postoji glavni mod i lokalni mod. Kada je u nizu prisutno vie od jednog moda, potrebno je statistiki skup podijeliti na vie podskupova, od kojih e svaki imati svoja karakteristina svojstva, te izvriti analizu svakoga podskupa posebno.
Analitiki primjer 3.3. Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti: a) b) c) d) Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Komentirati rezultate! Rjeenje 3.3: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies.
108
Srednje vrijednosti
U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - visina u cm se prebacuje u polje Variable(s, kako je prikazano na slici 3.1. Slika 3.1. Prozor "Frequencies" sa izabranom varijablom (obiljejem) visina u cm (v2)
Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v2). Da bi se u izlaznim rezultatima dobila najmanja i najvea vrijednost niza, u spomenutom prozoru se aktivira Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Prozor Frequencies Statistics s potrebnim aktiviranim veliinama prikazan je na slici 3.2.
109
Da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.3. Tablica 3.3. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Mean Mode Minimum Maximum Valid Missing 235 4 175,77 172 154 206
Prema podacima iz tablice 3.3. moe se vidjeti da je 325 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije odgovorilo na to pitanje.
110
Srednje vrijednosti
Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 175,77 cm. Mod, odnosno najea visina ispitanika je 172 cm. Najmanja visina ispitanika u uzorku je 154 cm. Najvea visina ispitanika u uzorku je 206 cm.
Analitiki primjer 3.4. Za varijablu (obiljeje) prosjena ocjena u srednjoj koli (v3)3 potrebno je odrediti: a) b) c) d) Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Komentirati rezultate! Rjeenje 3.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - Prosjena ocjena u srednjoj koli se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu prosjena ocjena u srednjoj koli (v3). Da bi se u izlaznim rezultatima dobila najmanja i najvea vrijednost niza, u spomenutom prozoru se aktivira Minimum i
3
Aritmetika sredina se po definiciji izraunava samo za numerika obiljeja, ali se za cjelovitu analizu esto primjenjuje i za redoslijedno obiljeje.
111
Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Da bi se u Outputu programa SPSS dobili eljeni podaci o prosjenoj ocjeni u srednjoj koli ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.4. Tablica 3.4. Statistiki podaci o prosjenoj ocjeni ispitanika u srednjoj koli
Statistics Prosjecna ocjena u srednjoj skoli N Valid Missing Mean Mode Minimum Maximum 238 1 4,1773 4,00 2,00 5,00
Prema podacima iz tablice 3.4. moe se vidjeti da je 238 ispitanika dalo odgovor o svojoj prosjenoj ocjeni u srednjoj koli, dok 1 ispitanik nije odgovorio na to pitanje. Prosjena ocjena u srednjoj koli za sve ispitanike u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 4,177. Mod, odnosno najea prosjena ocjena ispitanika u srednjoj koli je 4. Najmanja prosjena ocjena ispitanika u srednjoj koli u uzorku je 2. Najvea prosjena ocjena ispitanika u srednjoj koli u uzorku je 5.
Analitiki primjer 3.5. Za varijablu (obiljeje) grupirana ocjena u srednjoj koli (v4) potrebno je odrediti: a) b)
112
Srednje vrijednosti
c) d) e)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v4 - Grupirana ocjena u srednjoj koli se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu grupirana ocjena u srednjoj koli (v4). S obzirom na to da se u ovom primjeru trai i tablica frekvencija, potrebno je aktivirati Display Frequency Tables. Da bi se u izlaznim rezultatima dobila najmanja i najvea vrijednost niza u spomenutom prozoru se aktivira Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Da bi se u Outputu programa SPSS dobili eljeni podaci o grupiranoj ocjeni ispitanika u srednjoj koli, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.5. Tablica 3.5. Statistiki podaci o grupiranoj ocjeni ispitanika u srednjoj koli
N Statistics Grupirana ocjena u srednjoj skoli Valid 238 Missing Mean Mode Minimum Maximum 1 4,2269 4,00 2,00 5,00
113
Prema podacima iz tablice 3.5. moe se vidjeti da je 238 ispitanika dalo odgovor o svojoj prosjenoj ocjeni u srednjoj koli, dok 1 ispitanik nije odgovorio na to pitanje. Prosjena ocjena u srednjoj koli za sve ispitanike u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 4,23. Mod, odnosno najea prosjena ocjena u srednjoj koli ispitanika je 4. Najmanja prosjena ocjena ispitanika u srednjoj koli u uzorku je 2. Najvea prosjena ocjena ispitanika u srednjoj koli u uzorku je 5. U Outputu je dana i tablica frekvencija prema grupiranoj ocjeni u srednjoj koli. Prikazana je u tablici 3.6. Tablica 3.6.
Grupirana ocjena u srednjoj skoli Frequency 1 34 113 90 238 1 239 Percent ,4 14,2 47,3 37,7 99,6 ,4 100,0 Valid Percent ,4 14,3 47,5 37,8 100,0 Cumulative Percent ,4 14,7 62,2 100,0
Valid
Missing Total
System
U stupcu Frequency moe se vidjeti da je od 238 ispitanika koji su dali odgovor na postavljeno pitanje ocjenu 2 imao samo 1, ocjenu 3 njih 34, ocjenu 4 njih 113, dok je ocjenu 5 imalo 90 ispitanika.
Analitiki primjer 3.6. Potrebno je dokazati 3 svojstva aritmetike sredine za anketirane ispitanike prema varijabli (obiljeju) prosjena ocjena u srednjoj koli (v2) .
114
Srednje vrijednosti
a) b) c)
Provjeriti 1. svojstvo da je: x min X x max . Provjeriti 2. svojstvo da je: ( x i X ) = 0 , (za negrupirani niz).
i =1 N
i =1
2 2 ( xi X ) ( xi a) ,
i =1
(za
negrupirani niz) ako je npr. a = 3 . Rjeenje 3.6: a) Da bi se dokazalo 1. svojstvo da se aritmetika sredina nalazi izmeu najvee i najmanje vrijednosti obiljeja, treba izraunati X , x min i x max . Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Prosjena ocjena u srednjoj koli se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati Minimum, Maximum i Mean. Dalje je potrebno kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.7. Tablica 3.7.
Statistics Prosjecna ocjena u srednjoj skoli N Valid 238 Missing Mean Minimum Maximum 1 4,1773 2,00 5,00
Iz podataka u tablici 3.7. vidi se da je aritmetika sredina 4,1773 i vrijedi da je izmeu najmanje (2) i najvee (5) vrijednosti obiljeja: 2 4,1773 5 .
115
b) Da bi se dokazalo 2. svojstvo aritmetike sredine da je zbroj odstupanja vrijednosti obiljeja od prosjeka jednak 0, potrebno je formirati novi stupac (varijablu) gdje e se izraunati ta odstupanja. Zbroj svih podataka iz tog novog stupca mora biti 0. Na glavnom izborniku potrebno je odabrati Transform, a na njegovu padajuem izborniku se bira Compute. Na taj nain se otvori prozor Compute Variable koji je prikazan na slici 3.3. Slika 3.3. Prozor "Compute Variable" gdje se raunaju odstupanja od prosjeka kao nova varijabla v3
Pod Target Variable upisuje se novo ime v3, a u Numeric Expression se upisuje: v 2 4,773 , odnosno da se od svih vrijednosti varijable v2 oduzme njihov prosjek 4,773. Potrebno je napomenuti da se decimalni zarez u programu SPSS oznaava tokom. Klikom na OK u prostoru Data View formira se nova varijabla v3.
116
Srednje vrijednosti
Da bi se vidio zbroj podataka u stupcu na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njenzinu padajuem izborniku Descriptive Statistics i Descriptives. Varijabla v3 prebacuje se u Variable(s). U Options potrebno je aktivirati Sum (dok se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne). Tablica 3.8. Zbroj odstupanja vrijednosti obiljeja od prosjeka
Descriptive Statistics N v3 Valid N (listwise) 238 238 Sum ,00
Suma vrijednosti novoformirane varijable v3 u zadnjem stupcu tablice 3.8 je 0, ime je dokazano 2. svojstvo aritmetike sredine. Da bi se dokazalo 3. svojstvo aritmetike sredine da je zbroj kvadrata odstupanja vrijednosti obiljeja od prosjeka manje ili jednako zbroju kvadrata odstupanja vrijednosti obiljeja od bilo kojeg drugog broja, npr. 3, potrebno je formirati nove stupce gdje e se izraunati ti kvadrati odstupanja. Usporedbom zbroja tih stupaca dokazat e se svojstvo 3. Na glavnom izborniku potrebno je odabrati Transform, a na njegovu padajuem izborniku bira se Compute. Na taj nain se otvori prozor Compute Variable.
c)
Pod Target Variable upisuje se novo ime v4, a u Numeric Expression se upisuje: (v 2 4,773) * *2 , odnosno da se od svih vrijednosti varijable v2 oduzme njihov prosjek 4,773 i sve se kvadrira. Potrebno je napomenuti da se potencija u programu SPSS oznaava dvjema zvjezdicama. Klikom na OK u prostoru Data View formira se nova varijabla v4. Zatim se ponovo u Target Variable upisuje novo ime v5, a u Numeric Expression se upisuje: (v 2 3) * *2 , odnosno od svih se vrijednosti varijable v2 oduzme 3 i sve se kvadrira. Klikom na OK u prostoru Data View formira se nova varijabla v5. Da bi se vidio zbroj podataka u ova dva nova stupca v4 i v5 na glavnom izborniku, potrebno je izabrati ikonu Analyze, a na njezinu
117
padajuem izborniku Descriptive Statistics i Descriptives. Varijable v4 i v5 prebacuju se u Variable(s). U Options potrebno je aktivirati Sum (dok se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne). Tablica 3.9. Zbroj kvadrata odstupanja vrijednosti obiljeja od prosjeka i od vrijednosti 3
Descriptive Statistics N v4 v5 Valid N (listwise) 238 238 238 Sum 103,84 433,72
Sume vrijednosti novoformiranih varijabli v4 i v5 prikazane su u zadnjem stupcu tablice 3.9, ime je dokazano 3. svojstvo aritmetike sredine, tj. da je: ( x i X ) 2 ( x i a ) 2 , odnosno da je: 103,84 433,72 .
i =1 i =1 N N
3.6. Harmonijska sredina Harmonijska sredina spada u potpune srednje vrijednosti i rauna se upotrebom svih podataka u statistikom nizu. Harmonijska sredina je reciprona vrijednost aritmetike sredine recipronih vrijednosti numerikog obiljeja u jednom nizu. Ako se radi o negrupiranom statistikom numerikom nizu, rauna se jednostavna harmonijska sredina:
H = N 1 i =1 xi
N
(3.7)
Ako se radi o grupiranom statistikom numerikom nizu, rauna se sloena ili vagana harmonijska sredina:
118
Srednje vrijednosti
k
H =
f i i =1 xi
i =1 k
fi
(3.8)
Ponderi su i ovdje apsolutne frekvencije. Ako su veliine razreda razliite od 1, i za harmonijsku sredinu se radi aproksimacija na nain da se raunaju sredine razreda xi. Harmonijska sredina rijetko se primjenjuje u praksi. Specifino podruje njezine primjene je izraunavanje srednjih vrijednosti relativnih brojeva koordinacije. Relativni brojevi koordinacije (Ri), kako je ve reeno, pokazuju odnos dviju pojava koje ima smisla usporeivati (Ai i Bi).
Ri = Ai Bi
(3.9)
Openito srednja vrijednost relativnih brojeva koordinacije je omjer zbroja svih vrijednosti veliine koja se usporeuje ( Ai ) i
i =1 k
R=
i =1 k i =1
Ai Bi
(3.10)
Katkada u konkretnom statistikom istraivanju nisu dostupni podaci o veliinama sadranim u relativnom broju koordinacije, pa su pri izraunavanju njegove srednje vrijednosti mogue 3 situacije: a) Ako su dostupni podaci o relativnom broju koordinacije (Ri) i o veliini s kojom se usporeuje veliina iz brojnika (Bi), srednja e se vrijednost ( R ) izraunati pomou izraza za sloenu ili vaganu aritmetiku sredinu:
119
R=
i =1 k
Ri Bi
i =1
(3.11)
Bi
Na temelju osnovne relacije (3.10) jasno je da vrijedi da je veliina iz brojnika: Ai = Ri Bi . Ponderi su ovdje vrijednosti
i =1 i =1 k k
veliine s kojom se usporeuje veliina iz brojnika: Bi. b) Ako su dostupni podaci o relativnom broju koordinacije (Ri), bez informacija o veliinama u brojniku (Ai) i nazivniku (Bi), srednju vrijednost R nije mogue izraunati. Pokuaj aproksimacije ove srednje vrijednosti ne daje vjerodostojan rezultat. c) Ako su dostupni podaci o relativnom broju koordinacije (Ri) i o veliini koja se usporeuje (Ai), srednja e se vrijednost ( R ) izraunati pomou izraza za sloenu ili vaganu harmonijsku sredinu:
R=
i =1 k A i
Ai
(3.12)
i =1 Ri
Na temelju osnovne relacije (3.10) jasno je da vrijedi da je veliina iz nazivnika: Bi = Ai Ri . Ponderi su ovdje vrijednosti
i =1 i =1 k k
veliine koja se usporeuje iz brojnika: Ai. Analitiki primjer 3.7. Za nekoliko odabranih fakulteta u RH dani su podaci o broju studenata i broju studenata po 1 nastavniku u akademskoj godini 2004/05. Zadatak je izraunati prosjean broj studenata po 1 nastavniku za sve promatrane fakultete zajedno, odnosno prosjek relativnih brojeva koordinacije ( R ).
120
Srednje vrijednosti
Tablica 3.10. Broj studenata i broj studenata po 1 nastavniku u nekim odabranim fakultetima u RH u akademskoj godini 2004/05.
Fakulteti Broj studenata (Ai) Broj studenata po 1 nastavniku (Ri) Broj nastavnika (Ai/Ri)=Bi
PMF 3562 8,62469734 413 Graevinski fakulteti 2761 9,17275748 301 Fakult. el. stroj. i brod. 7704 10,1102362 762 Medicinski fakulteti 3315 3,64285714 910 Ekonomski fakulteti 14247 33,0556845 431 31589 64,6062326 2817 Ukupno: Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 492, 495, 496, 497.
Rjeenje 3.7: S obzirom na to da je u navedenom primjeru poznata (Ai) veliina koja se usporeuje i relativni brojevi koordinacije (Ri), njihov se prosjek rauna pomou izraza za sloenu ili vaganu harmonijsku sredinu gdje su ponderi (Ai):
H=
i =1
fi
k
fi i =1 x i
R=
i =1
Ai
k
Ai i =1 Ri
Prosjean broj studenata po jednom nastavniku za sve promatrane fakultete u akademskoj godini 2004/05. zajedno iznosi 11,214 studenata po nastavniku. 3.5. Medijan Medijan je vrijednost statistikog obiljeja koja ureeni statistiki niz dijeli na dva jednakobrojna dijela. Medijan se moe primijeniti na redoslijedne i kvantitativne statistike nizove, a spada u poloajne srednje vrijednosti. Medijan se ne primjenjuje kod nominalnih nizova jer poredak oblika ovog obiljeja moe biti proizvoljan.
121
Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja), medijan je vrijednost obiljeja koja pripada elementu statistikog niza koji se nalazi u sredini niza. Ako je broj elemenata statistikog niza paran, onda se za medijan uzima jednostavan prosjek vrijednosti obiljeja dvaju lanova koji se nalaze na sredini statistikog niza. Ako je statistiki niz grupiran u razrede, prije raunanja medijana potrebno je izraunati frekvencije kumulativnog niza "manje od" ili "vie od", te se u takvom nizu trai sredinji lan. Ako se raunaju frekvencije kumulativnog niza "manje od", trai se prva frekvencija niza koja sadri N 2 . Razred koji odgovara ovoj frekvenciji kumulativnog niza "manje od" je medijalni razred. Ako su veliine razreda obiljeja jednake 1, vrijednost obiljeja koja odgovara odabranoj frekvenciji kumulativnog niza je medijan. Ako su veliine razreda obiljeja razliite od 1, medijan se rauna po izrazu:
N m fi 2 i =1 i , Me = L1 + f med
(3.13)
gdje je:
L1 - donja prava ili precizna granica medijalnog razreda N 2 - polovica elemenata statistikog niza
i =1
ukljuujui medijalni razred (tj. kumulativna frekvencija ispred kumulativne frekvencije medijalnog razreda)
f med - apsolutna frekvencija medijalnog razreda i - veliina medijalnog razreda.
122
Srednje vrijednosti
Analitiki primjer 3.8. Statistiki skup "Sklopljeni brakovi u RH u 2002. godini" prema kontinuiranom numerikom obiljeju "dob nevjeste", prikazan je u tablici 3.3. Zadatak je izraunati medijan, odnosno dob nevjeste koja promatrani statistiki niz dijeli na dva jednaka dijela. Tablica 3.11. Sklopljeni brakovi u RH u 2004. godini prema nevjestinoj dobi
Nevjestina dob Sklopljeni brakovi Kumulativni niz "manje od" Veliine razreda
Xi fi i 15-20 1903 1903 5 20-25 8104 10007 5 25-30 7335 17342 5 30-35 2820 20162 5 35-45 1516 21678 10 45-(80) 894 22572 35 Ukupno: 22572 Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 124.
Rjeenje 3.8. U tablici 3.11 vidi se da grupirani niz ima veliine razreda razliite od 1. Stoga je za izraunavanje medijana potrebno odrediti frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju apsolutne frekvencije odozgo prema dolje. Trai se prva frekvencija kumulativnog niza koja u sebi sadri: N 2 = 22572 2 = 11286 jedinicu. To je frekvencija 17342, a razred koji odgovara toj frekvenciji je medijalni razred. Njegova donja granica je L1 = 25 .
N m fi 2 i =1 i = 25 + 11286 10007 5 = 25,87 godina Me = L1 + f med 7335
Dakle, kod polovice sklopljenih brakova u Republici Hrvatskoj u 2002. godini nevjesta je bila mlaa od 25,87 godina, dok je kod preostale polovice brakova nevjesta bila starija od 25,87 godina.
123
U statistikim distribucijama postoji samo jedan medijan i on se nalazi izmeu najvee i najmanje vrijednosti obiljeja. Prednost medijana je da na njega ne utjeu ekstremno male ili velike vrijednosti obiljeja, pa je primjerena srednja vrijednost i kod izrazito asimetrinih distribucija. 3.5.1. Kvantili Kvantili su vrijednosti statistikog obiljeja koje ureeni statistiki niz dijele na q jednakobrojnih dijelova. Kod analize statistikih nizova vrlo su esto u upotrebi kvartili. Kvartili su vrijednosti statistikog obiljeja koje statistiki niz dijele na 4 jednakobrojna dijela. Kvartili se mogu podijeliti: na a) donji kvartil (Q1) i na b) gornji kvartil (Q3)4 . Donji kvartil dijeli ureeni statistiki niz na etiri jednaka dijela u omjeru 1:3, odnosno 25% elemenata statistikog skupa ima vrijednost obiljeja manju ili jednaku donjem kvartilu, a 75% elemenata statistikog skupa ima vrijednost obiljeja veu od donjeg kvartila. Gornji kvartil dijeli ureeni statistiki niz na etiri jednaka dijela u omjeru 3:1, odnosno 75% elemenata statistikog skupa ima vrijednost obiljeja manju ili jednaku donjem kvartilu, a 25% elemenata statistikog skupa ima vrijednost obiljeja veu od gornjeg kvartila. Kvartili se, slino kao i medijan, mogu primijeniti na redoslijedne i kvantitativne statistike nizove, a odreuju se poloajem u nizu. Ni oni se ne primjenjuju kod nominalnih nizova jer, kako je ve naglaeno, poredak oblika ovog obiljeja moe biti proizvoljan.
Vrijedi da je medijan: Me = Q2 .
124
Srednje vrijednosti
Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja), donji kvartil je vrijednost obiljeja koja pripada elementu statistikog niza iji rang (r), tj. mjesto u nizu odgovara:
Q1 = xr , gdje je r = INT ( N 4) + 1 , ako N nije djeljiv s 4;
Q1 =
5
s 4, rauna se prosjek obiljeja koji se nalaze na mjestu u nizu: r i (r + 1) . Kod negrupiranog, a ureenog niza (po veliini vrijednosti obiljeja), gornji kvartil je vrijednost obiljeja koja pripada elementu statistikog niza iji rang, tj. mjesto u nizu odgovara:
Q3 = xr , gdje je r = INT (3 N 4) + 1 , ako N nije djeljiv s 4;
Q3 = xr + xr +1 , gdje je r = 3N 4 , (r + 1) = 3 N 4 + 1 , ako je N 2
djeljivo s 4, rauna se prosjek obiljeja koji se nalaze na mjestu u nizu: r i (r + 1) . Ako je statistiki niz grupiran u razrede, prije raunanja kvartila potrebno je izraunati frekvencije kumulativnog niza "manje od" ili "vie od", te se u takvom nizu trai odgovarajui lan. Ako se raunaju frekvencije kumulativnog niza "manje od", za donji kvartil se trai prva frekvencija niza koja sadri N 4 . Za gornji kvartil se trai prva frekvencija niza koja sadri 3 N 4 . Razred koji odgovara odabranoj frekvenciji kumulativnog niza "manje od" je razred donjeg, odnosno gornjeg kvartila. Ako su veliine razreda obiljeja jednake 1, vrijednost obiljeja koja odgovara odabranoj frekvenciji kumulativnog niza je donji, odnosno gornji kvartil. Ako su veliine razreda obiljeja razliite od 1, donji kvartil se rauna po izrazu:
5
INT predstavlja cijeli dio decimalnog broja dobivenog dijeljenjem (eng. integer). npr.
INT (6,3) = 6, INT (6,7) = 6.
125
N q fi Q1 = L1 + 4 i =1 i , f k var t
(3.14)
gdje je:
L1 - donja prava ili precizna granica donje kvatilnog razreda N 4 - etvrtina elemenata statistikog niza f i - zbroj svih apsolutnih frekvencija do donje kvartilnog razreda, ne
q
i =1
ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne frekvencije donje kvartilnog razreda)
f k var t - apsolutna frekvencija donje kvartilnog razreda
i - veliina kvartilnog razreda.
(3.15)
gdje je:
L1 - donja prava ili precizna granica gornje kvatilnog razreda 3N 4 - tri etvrtine elemenata statistikog niza f i - zbroj svih apsolutnih frekvencija do gornje kvartilnog razreda, ne
q
i =1
ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne frekvencije gornje kvartilnog razreda)
f k var t - apsolutna frekvencija gornje kvartilnog razreda
i - veliina kvartilnog razreda.
Sve srednje vrijednosti se, uz prikazane izraune pomou apsolutnih frekvencija, na isti nain mogu raunati koritenjem relativnih frekvencija (proporcija i postotaka).
126
Srednje vrijednosti
Analitiki primjer 3.9. Statistiki skup "sklopljeni brakovi u RH u 2002. godini" prema kontinuiranom numerikom obiljeju "nevjestina dob", prikazan je u tablici 3.12 (ve je prezentiran u analitikom primjeru 3.8). Zadatak je izraunati donji i gornji kvartil. Tablica 3.12. Sklopljeni brakovi u RH u 2004. godini prema nevjestinoj dobi
Nevjestina dob Sklopljeni brakovi Kumulativni niz "manje od" Veliine razreda
Xi fi i 15-20 1903 1903 5 20-25 8104 10007 5 25-30 7335 17342 5 30-35 2820 20162 5 35-45 1516 21678 10 45-(80) 894 22572 35 Ukupno: 22572 Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 124.
Rjeenje 3.9. U tablici 3.12 vidi se da grupirani niz ima veliine razreda razliite od 1. Stoga je za izraunavanje kvartila potrebno odrediti frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju apsolutne frekvencije odozgo prema dolje. Za donji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
N 22572 = = 5643 jedinice. 4 4
To je frekvencija 10007, a
razred koji odgovara toj frekvenciji je donje kvarilni razred. Njegova donja granica je L1 = 20 .
N q fi 4 i =1 i = 20 + 5643 1903 5 = 22,31 godina Q1 = L1 + f k var t 8104
Dakle, kod jedne etvrtine (tj. 25%) sklopljenih brakova u R. Hrvatskoj u 2002. godini nevjesta je bila mlaa od 22,31 godine, dok je
127
kod preostale tri etvrtine (tj. 75%) brakova nevjesta bila starija od 22,31 godine. Za gornji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
3N 3 22572 = = 16929 jedinica. To je frekvencija 17342, a 4 4
razred koji odgovara toj frekvenciji je gornje kvarilni razred. Njegova donja granica je L1 = 25 .
3N q fi 16929 10007 = L1 + 4 i =1 i = 25 + 5 = 27,72 godina Q3 f k var t 7335
Dakle, kod tri etvrtine (tj. 75%) sklopljenih brakova u R. Hrvatskoj u 2002. godini nevjesta je bila mlaa od 29,48 godina, dok je kod preostale etvrtine (tj. 25%) brakova nevjesta bila starija od 29,48 godina.
Analitiki primjer 3.10. Za varijablu (obiljeje) teina u kg (v2) potrebno je odrediti: a) b) c) d) e) f) Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Medijan; Donji i gornji kvartil; Komentirati rezultate! Rjeenje 3.10: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - teina u kg se prebacuje u polje Variable(s).
128
Srednje vrijednosti
Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v2). Da bi se u izlaznim rezultatima dobile najmanja i najvea vrijednost niza, u spomenutom se prozoru aktivira Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Medijan se dobije aktiviranjem Median, a donji i gornji kvartil oznaavanjem Quartiles. Prozor Frequencies Statistics s potrebnim aktiviranim veliinama prikazan je na slici 3.4. Slika 3.4. Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim veliinama
Da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.13. Prema tim podacima moe se vidjeti da je 324 ispitanika dalo odgovor o svojoj teini, dok ih 5 nije odgovorilo na to pitanje. Prosjena teina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 67,18 kg.
129
Medijan, odnosno teina koja odabrani uzorak dijeli na 2 jednakobrojna dijela je Me = 64 kg , to znai da je polovica ispitanika imala teinu manju ili jednaku 64 kg, dok je preostala polovica ispitanika imala teinu veu od 64 kg. Mod, odnosno najea teina ispitanika je 52 kg. Najmanja teina ispitanika u uzorku je 46 kg. Najvea teina ispitanika u uzorku je 110 kg. Donji i gornji kvartil dani su meu Percentiles. Donji kvaril Q1 = 56 kg , to znai da je etvrtina ispitanika imala teinu manju ili jednaku 56 kg, dok je preostalih tri etvrtine ispitanika imalo teinu veu od 56 kg. Gornji kvaril Q3 = 75 kg , to znai da je tri etvrtine ispitanika imalo teinu manju ili jednaku od 75 kg, dok je preostala etvrtina ispitanika imala teinu veu od 75 kg.
Analitiki primjer 3.11. Za varijablu (obiljeje) dobiveni deparac (v3) potrebno je odrediti:
130
Srednje vrijednosti
a) b) c) d) e) f)
Najmanju i najveu vrijednost obiljeja; Aritmetiku sredinu; Mod; Medijan; Donji i gornji kvartil; Komentirati rezultate! Rjeenje 3.11:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - Koliki deparac dobivate prebacuje se u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu deparca (v3). Da bi se u izlaznim rezultatima dobile najmanja i najvea vrijednost niza, u spomenutom prozoru aktivira se Minimum i Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Medijan se dobije aktiviranjem Median, a donji i gornji kvartil oznaavanjem Quartiles. Da bi se u Outputu programa SPSS dobili eljeni podaci o deparcu ispitanika potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 3.14. Prema podacima iz tablice 3.14 moe se vidjeti da je 173 ispitanika dalo odgovor o svom deparcu, dok ih 66 nije odgovorilo na to pitanje. Prosjeni deparac ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 371,55 kn. Medijan, odnosno deparac koji odabrani uzorak dijeli na 2 jednakobrojna dijela je Me = 300 kn , to znai da je polovica ispitanika imala deparac manji ili jednak 300 kn, dok je preostala polovica ispitanika imala deparac vei od 300 kn.
131
Mod, odnosno najei deparac ispitanika je 200 kn. Moe se vidjeti napomena ispod tablice koja se odnosi na mod. Zadana distribucija uzorka ima vie od 1 moda, a u tablici Outputa dana je najmanja vrijednost. Ako se u Outputu jo zatrai i prikaz tablice frekvencija (aktivira se Display frequency tables), moe se vidjeti da je 26 ispitanika imalo deparac od 200 kn i a da ih je isto toliko imalo deparac od 300 kn. Dakle ovo je jedna bimodalna distribucija. Jedan mod je 200 kn, a drugi mod je 300 kn. Najmanji deparac ispitanika u uzorku je 0,00 kn. Najvei deparac ispitanika u uzorku je 3500,00 kn. Donji i gornji kvartil dani su meu Percentiles. Donji kvaril
Q1 = 150 kn , to znai da je etvrtina ispitanika imala deparac manji od
500 kn ili jednak tom iznosu, dok je preostalih tri etvrtine ispitanika imalo deparac vei od 150 kn. Gornji kvaril Q3 = 500 kn , to znai da je tri etvrtine ispitanika imalo deparac manji od 500 kn ili jednak tom iznosu, dok je preostala etvrtina ispitanika imala deparac vei od 500 kn.
132
(4.1)
Ovaj apsolutni pokazatelj rasprenosti izraen je u originalnim jedinicama mjere numerikog obiljeja. Moe poprimiti vrijednost 0. To se dogaa kada svi elementi niza imaju jednaku vrijednost obiljeja.
133
Najvea vrijednost toga pokazatelja nije ograniena jer ona ovisi o konkretnoj rasprenosti promatranih vrijednosti obiljeja. Raspon varijacije je nepotpuna mjera disperzije jer se rauna samo na temelju dvije vrijednosti obiljeja, odnosno na temelju najvee i najmanje vrijednosti. Moe se rei da to nije precizna mjera rasprenosti elemenata niza, pogotovo u sluaju postojanja ekstremno malih i/ili ekstremno velikih vrijednosti obiljeja. Tada se dobije veliki raspon varijacije, a moda je veina elemenata skupa rasprena usko oko srednjih vrijednosti. Taj problem interkvartil. preciznosti rjeava interkvartilni raspon ili
Interkvartil je apsolutna, nepotpuna mjera rasprenosti koja pokazuje disperziju srednjih 50% elemenata ureenoga numerikog niza.
I q = Q3 Q1
(4.2)
Interkvartil predstavlja razliku gornjeg i donjeg kvartila. Na taj nain se eliminira 25% ekstremno malih i 25% ekstremno velikih vrijednosti obiljeja u nizu. Slika 4.1. Simetrina distribucija s oznaenim gornjim i donjim kvartilom
fi
Q3
xi
Slika 4.1. prikazuje jednu simetrinu distribuciju gdje su elementi skupa ravnomjerno rasporeeni oko srednjih vrijednosti. Poznato je da
134
donji kvartil (Q1) dijeli distribuciju u omjeru 1:3, tj. da 25% elemenata skupa ima vrijednost obiljeja manju od donjeg kvartila, a 75% elemenata skupa ima vrijednost obiljeja veu od donjeg kvartila. Isto tako gornji kvartil (Q3) dijeli distribuciju u omjeru 3:1, tj. da 75% elemenata skupa ima vrijednost obiljeja manju od gornjeg kvartila, a 25% elemenata skupa ima vrijednost obiljeja veu od gornjeg kvartila. Na taj nain interkvartil pokazuje disperziju srednjih 50% elemenata skupa. Varijanca spada u potpune mjere rasprenosti jer obuhvaa sve elemente odabranoga numerikog statistikog niza. Ovaj pokazatelj mjeri odstupanja, tj. rasprenost elemenata skupa od aritmetike sredine. S obzirom na poznato svojstvo aritmetike sredine da je zbroj odstupanja vrijednosti obiljeja od aritmetike sredine u jednoj distribuciji uvijek nula, tj. da je: ( xi X ) = 0 (za negrupirani niz) i
i =1 N
i =1
ovih odstupanja. Varijanca je prosjeno kvadratno odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.
2 =
i =1
xi X N
i =1
xi N
X2,
(4.3)
za negrupirani niz i
2 =
i =1
f i xi X
i =1
fi
i =1 k
2 f i xi
X2,
(4.4)
i =1
fi
za grupirani niz. Varijanca je mjera rasprenosti izraena u drugom stupnju, pa kao rezultat daje jedinice mjere numerikog obiljeja na kvadrat. Stoga je oteana njezina interpretacija. Standardna devijacija je pozitivan korijen iz varijance i izraena je u originalnim jedinicama mjere. Stoga je kao potpuna i
135
apsolutna mjera disperzije vrlo esto u upotrebi. Moe se definirati kao prosjeno odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.
=+ 2 =+
i =1
(xi X )
N
=+
i =1
xi N
X2 ,
(4.5)
za negrupirani niz.
=+ =+
2 i =1
f i (x i X )
k i =1
fi
=+
i =1 k
f i xi
i =1
X2 ,
(4.6)
fi
za grupirani niz. Pomou standardne devijacije u originalnim mjernim jedinicama obiljeja moe se usporeivati rasprenost oko aritmetike sredine nizova koji su grupirani po jednakom obiljeju. Analitiki primjer 4.1. Zadan je statistiki numeriki niz "Zaposleni u sektoru Obrazovanje u RH prema dobi, stanje 31. oujka 2004. god.". Zadatak je izraunati raspon varijacije obiljeja, interkvartil, varijancu i standardnu devijaciju vrijednosti ovog obiljeja. Tablica 4.1. Zaposleni u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god.
Dob xi Br. zaposlenih fi Kum.niz "<" Veli. razreda i
12 5 5 5 5 5 5 10 -
136
Raspon varijacije ovog numerikog obiljeja dobije se kao razlika najvee i najmanje vrijednosti obiljeja, a iznosi 52 godine. Interkvartil: U tablici 4.1. prikazan je grupirani niz koji ima veliine razreda razliite od 1. Stoga je za izraunavanje kvartila potrebno odrediti frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju apsolutne frekvencije odozgo prema dolje. Za donji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
N 88713 = = 22178,25 jedinica. To je frekvencija 33291, a razred 4 4
koji odgovara toj frekvenciji je donje kvarilni razred. Njegova donja granica je L1 = 35 .
N q fi 22178,25 20861 5 = 35,53 Q1 = L1 + 4 i =1 i = 35 + 12430 f k var t
Dakle, jedna etvrtina (tj. 25%) zaposlenih u Obrazovanju u Republici Hrvatskoj u 2004. godini je bilo mlae od 35,53 godina, dok je preostalih tri etvrtine zaposlenih (tj. 75%) bilo starije od 35,53 godina. Za gornji kvartil se trai prva frekvencija kumulativnog niza koja u sebi sadri:
3 N 3 88713 = = 66534,75 jedinica. To je frekvencija 72291, 4 4
a razred koji odgovara toj frekvenciji je gornje kvarilni razred. Njegova donja granica je L1 = 50 .
3N q fi 4 i =1 i = 50 + 66534,75 60251 5 = 52,61 Q3 = L1 + 12040 f k var t
137
Dakle, tri etvrtine (tj. 75%) zaposlenih u Obrazovanju u R Hrvatskoj u 2002. godini je bilo mlae od 52,61 godina, dok je preostala etvrtina zaposlenih (tj. 25%) bilo starije od 52,61 godina. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 52,61 35,53 = 17,08 godina
Dakle, dob srednjih 50% zaposlenih u Obrazovanju u ovoj distribuciji varira u rasponu od 17,08 godina. Da bi se izraunala varijanca i standardna devijacija vrijednosti ovog obiljeja, prikazani su podaci u tablici 4.2. Tablica 4.2. Zaposleni u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god.
Dob xi Broj zaposlenih fi Sredina razreda xi
f i xi
f i ( xi X ) 2 f i xi 2
3958060 5859072 1396576 11705363 481817,8 17479688 21236,85 25522313 182743,2 28947688 926886,1 33185250 1904643 33191444 2710985 25307750 11582947 181198566
Zadatak je izraunati varijancu i standardnu devijaciju vrijednosti zadanog obiljeja. Ovo je grupirani niz. Varijanca i standardna devijacija raunaju se po izrazima od (4.3) do (4.6). Najprije je potrebno izraunati sloenu aritmetiku sredinu za negrupirane nizove.
X=
i =1 k
f i xi
i =1
fi
138
Dakle, prosjena dob zaposlenih u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god., 43,726 je godina. Varijanca je:
2 = i =1
f i (xi X )
k i =1 2
fi
izraunate u 5. stupcu tablice, a njihova suma je dana u zbirnom retku. Isti rezultat se moe dobiti i preko izvedene formule za varijancu grupiranih nizova (4.6):
=
2 i =1 k
f i xi
i =1
X2 =
fi
Zbroj fi xi 2 dan je u tablici 4.2. u posljednjem retku. Varijanca je mjera rasprenosti vrijednosti obiljeja u drugom stupnju pa je izraena u jedinicama mjere na kvadrat. Dalje se rauna standardna devijacija koja se izraava u originalnim mjernim jedinicama. Standardna devijacija je pozitivan korijen iz varijance:
= + 2 = + 130,57 = 11,43 godina.
Dakle, prosjeno odstupanje vrijednosti ovog numerikog obiljeja od aritmetike sredine je 11,43 godina. 4.1.2. Relativne mjere disperzije Koeficijent varijacije spada u potpune relativne mjere rasprenosti jer obuhvaa sve elemente odabranog numerikoga statistikog niza, a izraava se u postotcima (%). Koeficijent varijacije je postotak standardne devijacije od aritmetike sredine.
139
V =
100 .
(4.7)
Vrijednost koeficijenta varijacije se kree u intervalu 0 V < + . Vrijednost od 0% e poprimiti samo u sluaju kada su sve vrijednosti numerikog obiljeja u jednom nizu jednake, odnosno kada nema disperzije. Vea vrijednost ovog pokazatelja upuuje na veu disperziju elemenata promatranog niza. Taj pokazatelj rasprenosti je izraen u postotcima, pa omoguuje usporedbu disperzije numerikih nizova s razliitim jedinicama mjere. Koeficijent kvartilne devijacije je relativna nepotpuna mjera rasprenosti. Predstavlja relativnu disperziju srednjih 50% elemenata numerikog niza. Rauna se na temelju samo dviju vrijednosti obiljeja, a to su donji i gornji kvartil.
Vq = Q3 Q1 Q3 + Q1
(4.8)
Koeficijent kvartilne devijacije se rauna kao omjer interkvarila (razlika kvartila) i zbroja donjeg i gornjeg kvartila. Vrijedi da je:
0 Vq < 1
(4.9)
Ovaj pokazatelj je jednak 0 samo kada nema disperzije. Ako se njegova vrijednost pribliava 1, to znai da je rasprenost vrijednosti obiljeja vea. S obzirom na to da je to relativni pokazatelj, pomou njega je mogue usporeivati rasprenost srednjih 50% elemenata razliitih numerikih distribucija s razliitim jedinicama mjere. Analitiki primjer 4.2. Prema podacima o statistikom numerikom nizu "Zaposleni u sektoru Obrazovanje u RH prema dobi, stanje 31. oujka 2004. god.", koji su dani u analitikom primjeru 4.1., zadatak je izraunati koeficijent varijacije i koeficijent kvartilne devijacije.
140
100 =
Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 26,132%. Koeficijent kvartilne devijacije.
Vq = Iq Q3 Q1 17,08 = = = 0,194 Q3 + Q1 Q3 + Q1 52,61 + 35,53
Dakle, dob srednjih 50% zaposlenih u Obrazovanju u ovoj distribuciji pokazuje slabu rasprenost 0,194 (s obzirom na to da se pokazatelj kree u intervalu izmeu 0 i 1).
Analitiki primjer 4.3. Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti: a) b) c) d) e) f) Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;
g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate!
141
Rjeenje 4.3: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visine u cm (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.3. Tablica 4.3. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Mean Std. Deviation Variance Range Percentiles 25 50 75 Valid Missing 235 4 175,77 8,749 76,539 52 170,00 174,00 182,00
Prema podacima iz tablice 4.3. moe se vidjeti da je 235 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije odgovorilo na to pitanje. Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 175,77 cm.
142
Razlika izmeu najvee i najmanje visine ispitanika u uzorku, tj. raspon varijacije obiljeja je 52 cm. Donji i gornji kvartil dani su kao Percentiles. Donji kvaril
Q1 = 170 cm , to znai da je etvrtina ispitanika imala visinu manju od
170 cm ili jednaku toj visinu, dok je preostalih tri etvrtine ispitanika bilo s visinom veom od 170 cm. Gornji kvartil Q3 = 182 cm , to znai da je tri etvrtine ispitanika bilo s visinom manjom od 182 cm ili jednakom toj visini, dok je preostala etvrtina ispitanika imala visinu veu od 182 cm. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 76,539 cm2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 8,749 cm. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 182 170 = 12 cm.
Dakle, visina srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 12 cm. Koeficijent varijacije je:
V=
100 =
Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 4,98% i upuuje na vrlo malu disperziju i veliku reprezentativnost aritmetike sredine. Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 12 = = = 0,034 . Q3 + Q1 Q3 + Q1 182 + 170
Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje izrazito slabu rasprenost 0,034 (s obzirom na to da se pokazatelj kree u intervalu izmeu 0 i 1).
143
Analitiki primjer 4.4. Za varijablu (obiljeje) teina u kg (v2) potrebno je odrediti: a) b) c) d) e) f) Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;
g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate! Rjeenje 4.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Teina u kg se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teine u kg (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.4. Prema podacima iz tablice 4.4. moe se vidjeti da je 234 ispitanika dalo odgovor o svojoj teini, dok ih 5 nije odgovorilo na to pitanje.
144
Prosjena teina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 67,1795 kg. Razlika izmeu najvee i najmanje teine ispitanika u uzorku, tj. raspon varijacije obiljeja je 64 kg. Tablica 4.4. Statistiki podaci o teini ispitanika
Statistics Tezina u kg N Mean Std. Deviation Variance Range Percentiles 25 50 75 Valid Missing 234 5 67,1795 13,52735 182,989 64,00 56,0000 64,0000 75,0000
Donji i gornji kvartil dani su kao Percentiles. Donji kvaril Q1 = 56 kg , to znai da je etvrtina ispitanika imala teinu manju od 56 kg ili jednaku toj teini, dok je preostalih tri etvrtine ispitanika bilo s teinom veom od 56 kg. Gornji kvartil Q3 = 75 kg , to znai da je tri etvrtine ispitanika bilo s teinom manjom od 75 kg ili jednakom tom teinom, dok je preostala etvrtina ispitanika imala teinu veu od 75 kg. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 182,989 kg2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 13,53 kg. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 75 56 = 19 kg.
145
Dakle, teina srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 19 kg. Koeficijent varijacije je:
V=
100 =
Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 20,136%. Reprezentativnost je velika, a disperzija mala. Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 19 = = = 0,145 Q3 + Q1 Q3 + Q1 75 + 56
Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje slabu rasprenost 0,145.
Analitiki primjer 4.5. Za varijablu (obiljeje) dobiveni deparac (v2) potrebno je odrediti: a) b) c) d) e) f) Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;
g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate! Rjeenje 4.5: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies.
146
U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Dobiveni deparac se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu dobiveni deparac (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o dobivenom deparcu ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.5. Tablica 4.5. Statistiki podaci o deparcu ispitanika
Statistics Dobiveni dzeparac N Valid Missing Mean Std. Deviation Variance Range Percentiles 25 50 75 173 66 371,5491 401,30549 161046,098 3500,00 150,0000 300,0000 500,0000
Prema podacima iz tablice 4.5. moe se vidjeti da je 173 ispitanika dalo odgovor o svojom deparcu, dok ih 66 nije odgovorilo na to pitanje. Prosjeni deparac ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 371,55 kn. Razlika izmeu najvee i najmanje teine ispitanika u uzorku, tj. raspon varijacije obiljeja je 3500 kn. Donji i gornji kvartil dani su kao Percentiles. Donji kvaril
Q1 = 150 kn , to znai da je etvrtina ispitanika imala deparac manji od
147
150 kn ili jednak tom iznosu, dok je preostalih tri etvrtine ispitanika bilo s deparcem veim od 150 kn. Gornji kvartil Q3 = 500 kn , to znai da je tri etvrtine ispitanika bilo s deparcem manjim od 500 kn ili jednakim tom iznosu, dok je preostala etvrtina ispitanika imala deparac vei od 500 kn. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 161046,1 kn2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 401,31 kn. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 500 150 = 350 kn.
Dakle, deparac srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 350 kn. Koeficijent varijacije je:
V=
100 =
Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 108,01%, to ukazuje na jako veliku disperziju deparca izmeu promatranih ispitanika i malu reprezentativnost X . Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 350 = = = 0,538 . Q3 + Q1 Q3 + Q1 500 + 150
Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje prilinu rasprenost od 0,538.
Analitiki primjer 4.6. Za varijablu (obiljeje) broj djece u obitelji (v2) potrebno je odrediti:
148
a) b) c) d) e) f)
Tablicu frekvencija; Raspon varijacije obiljeja; Aritmetiku sredinu; Donji i gornji kvartil; Varijancu; Standardnu devijaciju;
g) Na temelju toga izraunati: interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije; h) Komentirati rezultate! Rjeenje 4.6: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Broj djece u obitelji se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu broj djece u obitelji (v2). Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o broju djece u obitelji ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.6. Prema podacima iz tablice 4.6. moe se vidjeti da je 238 ispitanika dalo odgovor o broju djece u obitelji, dok 1 nije odgovorio na to pitanje. Prosjeni broj djece u obitelji ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 2,34. S obzirom na
149
to da broj djece spada u diskontinuirana numerika obiljeja, ovaj rezultat se moe komentirati kao prosjeno 2 djece po obitelji ispitanika. Tablica 4.6. Statistiki podaci o broju djece u obitelji ispitanika
Statistics Broj djece u obitelji N Valid Missing Mean Std. Deviation Variance Range Percentiles 25 50 75 238 1 2,34 ,870 ,757 6 2,00 2,00 3,00
Razlika izmeu najveeg i najmanjeg broja djece u obitelji ispitanika u uzorku, tj. raspon varijacije obiljeja je 6 djece. Donji i gornji kvartil dani su kao Percentiles. Donji kvaril Q1 = 2 djece, to znai da je etvrtina ispitanika imala broj djece u obitelji manji od 2 ili jednak 2, dok je preostalih tri etvrtine ispitanika bilo s vie od 2 djece u obitelji. Gornji kvartil Q3 = 3 djece, to znai da je tri etvrtine ispitanika bilo s brojem djece u obitelji manjim od 3 ili jednakim 3, dok je preostala etvrtina ispitanika imala vie od 3 djece u obitelji. Varijanca zadanog niza, prosjeno kvadratno odstupanje vrijednosti zadanog obiljeja od prosjeka je 0,757 djece2. Korijen iz varijance, tj. standardna devijacija zadanog niza je 0,87 djece. Obje vrijednosti se mogu zaokruiti na 1, s obzirom na to da se radi o diskontinuiranom numerikom obiljeju. Na temelju ovih podataka iz Outputa programa SPSS moe se izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne devijacije. Interkvartil je razlika kvartila:
I q = Q3 Q1 = 3 2 = 1 dijete.
150
Dakle, broj djece u obitelji srednjih 50% ispitanika u ovoj distribuciji varira u rasponu od 1 djeteta. Koeficijent varijacije je:
V=
100 =
Postotak standardne devijacije od aritmetike sredine u zadanom nizu je 37,18%. Koeficijent kvartilne devijacije je:
Vq = Iq Q3 Q1 1 = = = 0,2 . Q3 + Q1 Q3 + Q1 3 + 2
Dakle, broj djece srednjih 50% ispitanika u ovoj distribuciji pokazuje slabu rasprenost od 0,2. 4.1.3. Momenti numerikih nizova Momenti su prosjena odstupanja vrijednosti numerikog obiljeja od aritmetike sredine ili neke druge vrijednosti podignuti na rtu potenciju. Momenti numerikih nizova mogu biti glavni i pomoni. Glavni ili centralni momenti numerikih nizova su momenti oko aritmetike sredine:
r = i =1
k
(x i X )
N
,
r
r = 0,1,2,...
r = i =1
f i (x i X )
i =1
fi
r = 0,1,2,...
- za grupirani niz.
(4.10)
xi N
k
r = 0,1,2,...
mr =
i =1 k
r f i xi
r = 0,1,2,...
- za grupirani niz.
(4.12)
i =1
fi
Pomoni moment nultog reda: m0 = 1 . Pomoni moment prvog reda: m1 = X . Centralni momenti oko aritmetike sredine mogu se izraziti preko pomonih momenata. Centralni moment drugog reda:
2 = m 2 m12 .
(4.13)
(4.14)
(4.15)
4.2. Mjere asimetrije Asimetrija distribucije podrazumijeva nagnutost distribucije na lijevu ili desnu stranu. Pearsonov koeficijent asimetrije je:
3 = 3 , 3
(4.16)
152
gdje je:
3 - centralni moment treeg reda, 3 - standardna devijacija na treu potenciju.
Interval u kojem se uobiajeno kree vrijednost tog koeficijenta je: 2 3 2 . U sluaju izrazito asimetrinim distribucijama ovaj koeficijent moe poprimiti i vrijednosti izvan intervala: [ 2,2] . Ako je:
3 = 0 3 > 0 3 < 0
simetrina distribucija pozitivna ili desnostrana asimetrija negativna ili ljevostrana asimetrija.
U programskom paketu SPSS mjera asimetrije ima oznaku Skewness i vrijedi da ako je vrijednost ovog pokazatelja:
=0
>0 <0
simetrina distribucija pozitivna ili desnostrana asimetrija negativna ili ljevostrana asimetrija.
( X Mo)
(4.17)
gdje je:
X - aritmetika sredina
Mo - mod
- standardna devijacija.
153
Sk =
3 ( X Me)
(4.18)
gdje je:
X - aritmetika sredina
Me - medijan
- standardna devijacija.
Ako je:
Sk = 0 Sk > 0 Sk < 0
simetrina distribucija pozitivna ili desnostrana asimetrija negativna ili ljevostrana asimetrija.
Odnosi meu srednjim vrijednostima kod razliitih distribucija: a) simetrina distribucija ima jednake aritmetiku sredinu, medijan i mod:
X = Me = Mo .
b) pozitivno ili desnostrano asimetrina distribucija ima aritmetiku sredinu veu od medijana koji je vei od moda:
X > Me > Mo .
c) negativno ili ljevostrano asimetrina distribucija ima aritmetiku sredinu manju od medijana koji je manji od moda:
X < Me < Mo .
Bowleyeva mjera asimetrije (uobiajeno se kree u intervalu [ 1,1] ) zasnovana je na odnosu medijana i kvartila:
S kq = Q3 + Q1 2Me , Q3 Q1
(4.19)
gdje je:
Me - medijan
Q1 - donji kvartil
154
Q3 - gornji kvartil.
pozitivna
ili
desnostrana
asimetrija
Sk < 0 (Q3 + Q1 ) < 2 Me (Q3 Me) < ( Me Q1 )
negativna
ili
ljevostrana
asimetrija. Raspored srednjih vrijednosti kod razliitih distribucija prikazan je na slici 4.2. Slika 4.2. Distribucije s razliitom asimetrijom
fi fi fi
X Me Mo
a) Simetrina distribucuja
xi
MoMeX
xi
X MeMo xi
Prikazana su 3 sluaja rasprenosti podataka oko srednjih vrijednosti. Na dijelu slike 4.2. pod (a) prikazana je jedna savreno simetrina distribucija u kojoj su aritmetika sredina (prosjek),
155
medijan (vrijednost obiljeja koja skup dijeli na dva jednaka dijela) i mod (najea vrijednost obiljeja koja odgovara vrhu krivulje) u istoj toki, odnosno jednaki: X = Me = Mo . Na dijelu slike pod (b) prikazana je jedna pozitivno ili desnostrano asimetrina distribucija (vidi se rasipanje vrijednosti obiljeja na desnu stranu) u kojoj je aritmetika sredina vea od medijana koji je vei od moda: X > Me > Mo . Na dijelu slike pod (c) prikazana je jedna negativno ili ljevostrano asimetrina distribucija (vidi se rasipanje vrijednosti obiljeja na lijevu stranu) u kojoj je aritmetika sredina manja od medijana koji je manji od moda: X < Me < Mo . 4.3. Mjera zaobljenosti Mjera zaobljenosti distribucije frekvencija:
4 = 4 4
predstavlja
zaobljenost
vrha
krivulje (4.20)
gdje je:
4 - centralni moment etvrtog reda 4 - standardna devijacija na etvrtu potenciju.
normalno zaobljena distribucija iljatiji vrh od normalno zaobljene distribucije tupi oblik distribucije.
U programskom paketu SPSS mjera zaobljenosti ima oznaku Kurtosis ( Kurtosis = k ; k = 3 3 ) i vrijedi da ako je vrijednost ovog pokazatelja:
=0
156
>0 <0
Analitiki primjer 4.7. Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti: a) Asimetriju distribucije (Skewness); b) Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan, standardna devijacija); c) d) e) f) Bowleyevu mjeru asimetrije (kvartili); Zaobljenost distribucije (Kurtosis); Na histogram distribucije ucrtati i normalnu krivulju; Komentirati rezultate! Rjeenje 4.7: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v2). Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera zaobljenosti aktiviranjem veliine Kurtosis. Odabrane veliine u programu SPSS prikazane su na slici 4.3.
157
Da bi se u izlaznim rezultatima dobio histogram zadane distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies: Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve).
158
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.7. Prema podacima iz tablice 4.7 moe se vidjeti da je 235 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane distribucije je 0,485, to upuuje na pozitivu ili desnostranu asimetriju. Pearsonova mjera asimetrije je:
Sk =
( X Mo)
to potvruje prethodne zakljuke da je zadana distribucija visine ispitanika pozitivno ili desnostrano asimetrina. Slika 4.4. Histogram s normalnom krivuljom distribucije ispitanika prema visini
Histogram
50
40
Frequency
30
20
10
Visina u cm
Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi 0,184, to upuuje na iljatiji vrh distribucije u odnosu na normalno zaobljenu distribuciju. Histogram zadane distribucije s ucrtanom normalnom krivuljom prikazan je na slici 4.4. te se na osnovi njega moe opet zakljuiti da zadana distribucija pokazuje blagu asimetriju na desnu stranu i iljatiji vrh od normalne distribucije.
Analitiki primjer 4.8. Za varijablu (obiljeje) mjeseni deparac (v2) potrebno je odrediti: a) Asimetriju distribucije (Skewness); b) Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan, standardna devijacija); c) d) e) f) Bowleyevu mjeru asimetrije (kvartili); Zaobljenost distribucije (Kurtosis); Na histogram distribucije ucrtati i normalnu krivulju; Komentirati rezultate! Rjeenje 4.8: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Mjeseni deparac se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu mjeseni deparac (v2). Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno
160
oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera zaobljenosti aktiviranjem veliine Kurtosis. Da bi se u izlaznim rezultatima dobio histogram zadane distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies: Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve). Tablica 4.8. Statistiki podaci o deparcu ispitanika
Statistics Mjesecni dzeparac N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 a Multiple modes exist. The smallest value is shown Valid Missing 173 66 371,5491 300,0000 200,00(a) 401,30549 4,314 ,185 26,422 ,367 150,0000 300,0000 500,0000
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.8. Prema podacima iz tablice 4.8. moe se vidjeti da je 173 ispitanika dalo odgovor o svojem mjesenom deparcu, dok ih 66 nije odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane distribucije je 4,314, to upuuje na izrazitu pozitivu ili desnostranu asimetriju. Pearsonova mjera asimetrije je:
Sk = ( X Mo)
161
to opet upuuje da se radi o desnostranoj asimetriji. Ovaj rezultat treba uzeti s rezervom jer zadana distribucija nije unimodalna, tj. nema samo jedan mod. Bowleyeva mjera asimetrije je:
S kq = Q3 + Q1 2 Me 500 + 150 2 300 = = 0,143 , 500 150 Q3 Q1
to potvruje prethodne zakljuke da je zadana distribucija deparca ispitanika pozitivno ili desnostrano asimetrina. Ovaj pokazatelj ne mjeri konkretnu asimetriju ekstremnih 25% najveih i najmanjih vrijednosti distribucije, koji u ovom sluaju prema Skewness pokazatelju upuuju na izrazito desnu tj. pozitivnu asimetriju. Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi 26,422, to upuuje na izrazito iljatiji vrh distribucije u odnosu na normalno zaobljenu distribuciju. Slika 4.5. Histogram s normalnom krivuljom distribucije ispitanika prema visini
Histogram
80
60
Frequency
40
20
Mjesecni dzeparac
162
Histogram zadane distribucije s ucrtanom normalnom krivuljom prikazan je na slici 4.5. te se na osnovi njega potvruju ranije doneseni zakljuci da zadana distribucija pokazuje veliku asimetriju na desnu stranu i izrazito iljatiji vrh od normalne distribucije.
Analitiki primjer 4.9. Za varijablu (obiljeje) broj cipela (v2) potrebno je odrediti: a) Asimetriju distribucije (Skewness); b) Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan, standardna devijacija); c) d) e) f) Bowleyevu mjeru asimetrije (kvartili); Zaobljenost distribucije (Kurtosis); Na histogram distribucije ucrtati i normalnu krivulju; Komentirati rezultate! Rjeenje 4.9: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - Broj cipela se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu broj cipela (v2). Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera zaobljenosti aktiviranjem veliine Kurtosis.
163
Da bi se u izlaznim rezultatima dobio histogram zadane distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies: Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o broju cipela ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 4.9. Tablica 4.9. Statistiki podaci o broju cipela ispitanika
Statistics Broj cipela N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 Valid Missing 237 2 40,86 40,00 39 3,078 ,511 ,158 -,334 ,315 39,00 40,00 43,00
Prema podacima iz tablice 4.9. moe se vidjeti da je 237 ispitanika dalo odgovor o svom broju cipela, dok ih 2 nije odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane distribucije je 0,511, to upuuje na blagu pozitivu ili desnostranu asimetriju. Pearsonova mjera asimetrije je:
Sk =
( X Mo)
164
S kq =
Q3 + Q1 2 Me 43 + 39 2 40 = = 0,5 , 43 39 Q3 Q1
to potvruje prethodne zakljuke da je zadana distribucija o broju cipela ispitanika pozitivno ili desnostrano asimetrina. Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi -0,334, to upuuje na blago tupi vrh distribucije u odnosu na normalno zaobljenu distribuciju. Slika 4.6. Histogram s normalnom krivuljom distribucije ispitanika prema broju cipela
Histogram
50
40
Frequency
30
20
10
0 35 40 45 50
Broj cipela
Histogram zadane distribucije s ucrtanom normalnom krivuljom prikazan je na slici 4.6 te se na osnovi njega moe opet zakljuiti da zadana distribucija pokazuje laganu asimetriju na desnu stranu i blago tupi vrh u odnosu na normalnu distribuciju.
165
166
Vjerojatnost
5. VJEROJATNOST
5.1. Klasina definicija vjerojatnosti Sluajni dogaaj je takav dogaaj koji se moe, ali ne mora realizirati, tj. realizira se uz odreenu vjerojatnost. Vjerojatnost realizacije sluajnog dogaaja "A" jednaka je omjeru broja povoljnih ishoda i svih moguih ishoda:
P ( A) = m( A) , 0 P 1, n
(5.1)
gdje je:
m( A) - broj svih povoljnih ishoda za dogaaj A
Za nemogu dogaaj: P = 0 (obrat ne vrijedi). Vjerojatnost da se sluajni dogaaj "A" ne realizira jednaka je omjeru broja nepovoljnih ishoda i svih moguih ishoda:
P( A ) = n m( A) , 0 P 1, n
(5.2)
gdje je:
n m( A)
Vrijedi da je:
P ( A) + P ( A ) = 1 .
(5.3)
167
Za ovakav sluaj kada je unaprijed poznat broj svih povoljnih/nepovoljnih i ukupnih ishoda izraunata vjerojatnost se naziva vjerojatnost "a priori". Ako vjerojatnost realizacije sluajnog dogaaja A nije poznata unaprijed, moe se izraunati tzv. vjerojatnost "a posteriori":
P( A) = p lim m( A) , n
(5.4)
gdje je:
p lim - ita se "granina vrijednost po vjerojatnosti" (da se razlikuje od
limesa u linearnoj algebri). 5.2. Teorem o zbrajanju vjerojatnosti Za meusobno iskljuive dogaaje (tj. one dogaaje koji ne mogu nastupiti istodobno, odnosno iji su pripadni skupovi elementarnih dogaaja disjunktni), vjerojatnost realizacije jednog ili drugog dogaaja jednaka je zbroju vjerojatnosti realizacije jednog i vjerojatnosti realizacije drugog dogaaja.
P ( A ili B) = P( A) + P ( B ) .
(5.5)
Za dogaaje koji se meusobno ne iskljuuju, vjerojatnost realizacije jednog ili drugog dogaaja je:
P ( A ili B ) = P( A) + P ( B ) P( AB ) ,
(5.6)
gdje je:
P ( AB) -vjerojatnost da sluajni dogaaji A i B nastupe istovremeno.
Analitiki primjer 5.1. U posudi se nalazi 400 kuglica, od toga 100 crvenih, 140 plavih i 160 zelenih. a) Kolika je vjerojatnost da e sluajnim izvlaenjem 1 kuglice biti izvuena kuglica zelena boje?
168
Vjerojatnost
b) Kolika je vjerojatnost da e sluajno izvuena kuglica biti crvena ili zelena? Rjeenje 5.1: U ovom primjeru zadano je:
n = 400 ; to predstavlja broj ukupnih ishoda; m(C ) = 100 ; to predstavlja broj povoljnih ishoda za crvenu kuglicu; m( P) = 140 ; to predstavlja broj povoljnih ishoda za plavu kuglicu; m( Z ) = 160 ; to predstavlja broj povoljnih ishoda za zelenu kuglicu.
a) Traena vjerojatnost da e sluajnim izvlaenjem 1 kuglice biti izvuena kuglica zelena boje jednaka je omjeru broja povoljnih ishoda, tj. broja zelenih kuglica i svih moguih ishoda, tj. svih kuglica:
P(Z ) = m( Z ) 160 = = 0,4 . n 400
b) Za traenu vjerojatnost da e sluajno izvuena kuglica biti crvena ili zelena primjenjuje se teorem o zbrajanju vjerojatnosti za meusobno iskljuive dogaaje jer na 1 izvlaenje ne moe istovremeno biti izvuena kuglica crvene i zelene boje (dogaaji ne mogu nastupiti istodobno):
P(C ili Z ) = m(C ) m( Z ) 100 160 + = + = 0,65 . n n 400 400
5.3. Teorem o mnoenju vjerojatnosti Ako se dogaaji A i B meusobno ne iskljuuju, tj. vjerojatnost realizacije jednog ne ovisi o vjerojatnosti realizacije drugog dogaaja (nezavisni dogaaji), tada je vjerojatnost istovremene realizacije dogaaja A i B jednaka produktu vjerojatnosti realizacije dogaaja A i dogaaja B:
P( A i B) = P( A) P( B) .
(5.7)
169
5.4. Uvjetna vjerojatnost Ako je realizacija dogaaja A uvjetovana prethodnom realizacijom dogaaja B, vrijedi da je uvjetna ili kondicionalna vjerojatnost dogaaja A:
P( A / B) = P ( AB ) , P( B) P( B) > 0 ,
(5.8)
odnosno:
P ( B / A) = P ( AB) , P ( A) P ( A) > 0 .
(5.9)
(5.10)
Bayesov teorem: Ako se dogaaj B realizira istovremeno kada nastupi jedan od n disjunktnih dogaaja A1 , A2 ,..., An za koje je P( Ai ) = 1 onda se
i =1 n
(5.11) , P( Ai ) = 1 .
i =1 n
P( Ai / B) =
P ( Ai ) P( B / Ai )
P( A ) P( B / A )
i =1 i i
(5.12)
Analitiki primjer 5.2. Potrebno je izraunati vjerojatnost da odabrani ispitanik bude enskog spola (varijabla: Spol (v1)).
170
Vjerojatnost
Rjeenje 5.2: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - Spol se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o spolu ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.1. Tablica 5.1. Podaci o spolu ispitanika
Spol Frequency 94 144 238 1 239 Percent 39,3 60,3 99,6 ,4 100,0 Valid Percent 39,5 60,5 100,0 Cumulative Percent 39,5 100,0
Valid
Missing Total
System
Prema podacima iz tablice 5.1. u stupcu Valid Percent moe se vidjeti da je 60,5% ispitanika enskog spola, odnosno vjerojatnost da ispitanik bude enskog spola je 0,605.
Analitiki primjer 5.3. Za varijablu grupirana visina (v1) na sljedei nain: Range: Lowest through - 160 - 170 - 180 - 190 - 200 - 210
potrebno je izraunati vjerojatnost da ispitanik bude visok izmeu 171 i 180 cm. Rjeenje 5.3: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - Grupirana visina se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.2. Tablica 5.2. Podaci o visini ispitanika
Grupirana visina Frequency 7 62 103 50 11 2 235 4 239 Percent 2,9 25,9 43,1 20,9 4,6 ,8 98,3 1,7 100,0 Valid Percent 3,0 26,4 43,8 21,3 4,7 ,9 100,0 Cumulative Percent 3,0 29,4 73,2 94,5 99,1 100,0
Valid
Missing Total
System
Prema podacima iz tablice 5.2. u stupcu Valid Percent moe se vidjeti da je 43,8% ispitanika s visinom izmeu 171 i 180 cm, odnosno vjerojatnost da ispitanik bude visok izmeu 171 i 180 cm je 0,438.
172
Vjerojatnost
Analitiki primjer 5.4. Potrebno je izraunati vjerojatnost da se sluajno odabere osoba kojoj su roditelji u braku. Rjeenje 5.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - Brano stanje roditelja se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o branom stanju roditelja ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.3. Tablica 5.3. Podaci o branom stanju roditelja ispitanika
Bracno stanje roditelja
Frequency Percent Valid Percent Cumulative Percent
Valid
215 10 11 3 239
Prema podacima iz tablice 5.3. u stupcu Valid Percent moe se vidjeti da 90% ispitanika ima roditelje u braku, odnosno vjerojatnost da ispitanik ima roditelje u braku je 0,9.
Analitiki primjer 5.5. Potrebno je izraunati vjerojatnost da se sluajno odabere osoba koja pije alkoholna pia samo u posebnim prigodama.
173
Rjeenje 5.5: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - o Konzumiranju alkohola se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o konzumaciji alkohola ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.4. Tablica 5.4. Podaci o konzumiranju alkohola ispitanika
Konzumirate li alkohol
Frequency Percent Valid Percent Cumulative Percent
Valid
Missing Total
Nikada Samo uz obroke U posebnim prilikama Cesto i u svakoj prigodi Total System
Prema podacima iz tablice 5.4. u stupcu Valid Percent moe se vidjeti da 69,6% ispitanika pije alkohol samo u posebnim prilikama, odnosno vjerojatnost da ispitanik pije alkohol samo u posebnim prilikama je 0,696.
Analitiki primjer 5.6. a) Potrebno je izraunati vjerojatnost da ispitanik ne pije nikada alkoholna pia. b) Potrebno je izraunati vjerojatnost da ispitanik enskog spola ne pije nikada alkoholna pia.
174
Vjerojatnost
Rjeenje 5.6: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - o Konzumiranju alkohola se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o konzumaciji alkohola ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.4. Prema podacima iz tablice 5.4. u stupcu Valid Percent moe se vidjeti da 22,8% ispitanika ne pije nikada alkohol, odnosno vjerojatnost da ispitanik ne pije alkohol nikada je 0,228. b) Da bi se izraunala vjerojatnost da ispitanik enskog spola ne pije nikada alkoholna pia, potrebno je ostaviti u analizi samo ispitanike enskog spola, odnosno filtrirati eljeni uzorak. Na glavnom izborniku potrebno je izabrati ikonu Data, a na njezinu padajuem izborniku Select Cases. U prozoru Select Cases potrebno je aktivirati opciju If conditions is satisfied. Klikom na ikonu if otvara se prozor Select Cases:If gdje je potrebno odabrati varijablu v2 i postaviti uvjet da je v 2 = 2 , odnosno da je spol 2, to oznaava enski spol. Konano, da bi se filtrirali samo ispitanici enskog spola, potrebno je kliknuti na Continue i OK. Daljnja analiza se sada odnosi samo na enski spol. Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - o Konzumiranju alkohola se prebacuje u polje Variable(s). Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o konzumaciji alkohola ispitanika enskog spola, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.5.
175
Valid
Missing
Nikada Samo uz obroke U posebnim prilikama Cesto i u svakoj prigodi Total System
37 3 94 8 142 2 144
Total
Prema podacima iz tablice 5.5 u stupcu Valid Percent moe se vidjeti da 26,1% od ispitanika enskog spola ne pije nikada alkohol, odnosno vjerojatnost da ispitanik enskog spola nikada ne pije alkohol je 0,261. 5.5. Diskontinuirana sluajna varijabla Diskontinuirana ili diskretna sluajna varijabla je takva varijabla koja na sluaj moe poprimiti najvie prebrojivo mnogo vrijednosti i svaku od njih s odreenom vjerojatnou. Zadovoljava uvjete: normativnost: P( xi ) = 1
i =1
nenegativnost: P( xi ) 0, i .
Skup svih ureenih parova vrijednosti sluajne varijable i njoj pripadajuih vjerojatnosti naziva se distribucija vjerojatnosti sluajne varijable X :
(5.13)
176
Vjerojatnost
Zakon po kojem svakoj vrijednosti sluajne varijable X pripada vjerojatnost P( xi ) naziva se zakon vjerojatnosti sluajne varijable X. Funkcija distribucije sluajne varijable X je funkcija koja daje vjerojatnost da e sluajna varijabla X poprimiti vrijednost jednaku ili manju od nekog realnog broja x k :
F ( x k ) = P( X x k ) = P( xi )
i =1 k
(5.14)
Moe se rei da je to kumulativ vjerojatnosti od F ( X = 0) do F ( X = x k ) . Funkcija distribucije sluajne varijable X je monotono neopadajua funkcija. Parametri distribucije: Oekivanje sluajne varijable je zbroj umnoaka vrijednosti varijable X i njoj pripadajuih odgovarajuih vjerojatnosti P( x i ) :
E ( X ) = xi P( xi ) = .
i =1
(5.15)
Varijanca sluajne varijable je oekivanje kvadratnog odstupanja vrijednosti varijable X od njezina oekivanja:
V ( X ) = E ( X 2 ) [E ( X )] = E ( X ) 2 = x i2 P( x i ) 2 .
2 i =1
(5.16)
5.6. Teorijske distribucije diskontinuirane sluajne varijable 5.6.1. Binomna distribucija Ako sluajni pokus koji se ponavlja n puta ima dva mogua ishoda: uspjeh i neuspjeh, i ako je vjerojatnost nastupa ishoda uspjeh poznata, unaprijed utvrena i konstantna tijekom cijelog istraivanja (iznosi p ), kae se da se diskontinuirana sluajna varijabla X ravna prema tzv. binomnoj distribuciji.
177
Vjerojatnost da se neki sluajni dogaaj X u n pokusa realizira x puta prema binomnom zakonu vjerojatnosti je:
n n P ( X = x) = p x (1 p ) n x = p x q n x , x = 0,1,2,..., n (5.17) x x
gdje je:
n
p q
x
- broj ponavljanja pokusa - vjerojatnost realizacije sluajnog dogaaja (povoljnog ishoda) - vjerojatnost da se sluajni dogaaj ne realizira - broj povoljnih ishoda u n ponavljanja sluajnog pokusa - broj nepovoljnih ishoda u n ponavljanja sluajnog pokusa. Oekivanje sluajne varijable X kod binomne distribucije:
E( X ) = n p .
nx
(5.18)
(5.19)
(5.20)
(5.21)
Openito se kae da se sluajna varijabla X ravna po binomnoj distribuciji koja je odreena parametrima n i p:
X
B(n, p) .
(5.22)
178
Vjerojatnost
U programskom paketu SPSS postoje funkcije gustoe vjerojatnosti i kumulativne funkcije distribucije vjerojatnosti Binomne distribucije. Funkcije gustoe vjerojatnosti (Probability Density Functions) Transform; Compute; Function group (izabrati: PDF & Noncentral PDF); izabrati: Pdf.Binom u Numeric Expression: PDF.BINOM(quant,n,prob) Rezultat ove funkcije su vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , budu jednake nekom broju x = quant . U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu. Kumulativne funkcije Distribution Functions) distribucije vjerojatnosti (Cumulative
Transform; Compute; Function group (izabrati: CDF & Noncentral CDF); izabrati: Cdf.Binom u Numeric Expression: CDF.BINOM(quant,n,prob) Rezultat ove funkcije je kumulativ vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , bude manji ili jednak nekom broju x = quant . U Target Variable: potrebno je imenovati novu varijablu izraunatih kumulativa vjerojatnosti po Binomnom zakonu. Analitiki primjer 5.7. Vjerojatnost da je student Odsjeka za sociologiju Filozofskoga fakulteta u Splitu mukog spola je: p =
m( M ) 7 = = 0,225806451 (gdje je 31 n n ukupan broj studenata Odjeka za sociologiju, a m( M ) broj je povoljnih
179
a) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu 3 studenta mukog spola? b) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 2 studenta mukog spola? c) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 4 ili najmanje 3 studenta mukog spola? d) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata bude barem 1 student mukog spola? e) Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata budu svi studenti mukog spola? Rjeenje 5.7: Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable, koji je prikazan na slici 5.1. Da bi se aktivirala naredba za izraun vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Binom i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: PDF.BINOM(?,?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi upitnik funkcije predstavlja n, odnosno veliinu odabranog uzorka. Trei upitnik je prob, tj. p vjerojatnost realizacije sluajnog dogaaja. U ovom primjeru je zadano:
quant = X 1 ; n = 7 ; prob = 0,225806451 ,
pa vrijedi da je:
PDF.BINOM(X1,7,0.225806451), to je i prikazano u prozoru Numeric Expression na slici 5.1.
U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru nazvana je X1Bin.
180
Vjerojatnost
Slika 5.1. Prozor u SPSS-u za izraunavanje vjerojatnosti diskontinuirane sluajne varijable po Binomnom zakonu
Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X1 po Binomnoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.6. Prema rezultatima iz tablice 5.6. mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu 3 studenta mukog spola je:
p( X 1 = 3) = 0,144769 .
b) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 2 studenta mukog spola je:
181
Tablica 5.6. Podaci u SPSS-u vrijednosti i vjerojatnosti diskontinuirane sluajne varijable po Binomnom zakonu
c) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu najvie 4 ili najmanje 3 studenta mukog spola je:
p ( X 1 4 ili X 1 3) = 1 .
Ovom vjerojatnosti su obuhvaene sve vrijednosti sluajne varijable X1, a zbroj svih vjerojatnosti u jednoj distribuciji je 1. d) Vjerojatnost da izmeu 7 sluajno odabranih studenata bude barem 1 student mukog spola je:
p ( X 1 1) = p( X 1 = 1) + p( X 1 = 2) + ... + p ( X 1 = 7) = = 1 p ( X 1 = 0) = 1 0,166704 = 0,8333.
e) Vjerojatnost da izmeu 7 sluajno odabranih studenata budu svi studenti mukog spola je:
p ( X 1 = 7) = 0,00003 .
182
Vjerojatnost
5.6.2. Poissonova distribucija Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed utvrena, konstantna i jako mala tijekom cijelog istraivanja (iznosi p ), te broj pokusa tei u beskonanost ( n ) umjesto binomne distribucije, upotrebljava se Poissonova distribucija. U praksi vrijedi da ako je:
n 50 i p 0,10
(5.23)
vrijedi Poissonova distribucija. Moe se rei da je ta distribucija definirana za rijetke dogaaje, odnosno one dogaaje koji imaju veliki uzorak i malu vjerojatnost. Zakon vjerojatnosti po Poissonovoj distribuciji je:
P( X = x) = (np) x e np ( ) x e = , x = 0,1,2,..., , x! x!
(5.24)
- broj pokusa - vjerojatnost realizacije sluajnog dogaaja - broj povoljnih ishoda u n pokusa. Oekivanje sluajne varijable X kod Poissonove distribucije:
E( X ) = n p = .
(5.25)
(5.26)
(5.27)
183
(5.28)
Openito se kae da se sluajna varijabla X ravna po Poissonovoj distribuciji koja je odreena parametrom :
X
P( ) .
(5.29)
U programskom paketu SPSS postoje funkcije gustoe vjerojatnosti i kumulativne funkcije distribucije vjerojatnosti Poissonove distribucije. Funkcije gustoe vjerojatnosti (Probability Density Functions) Transform; Compute; Function group (izabrati: PDF & Noncentral PDF); izabrati: Pdf.Poisson u Numeric Expression: PDF.POISSON(quant,mean) Rezultat ove funkcije su vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , budu jednake nekom broju x = quant . Vrijedi da je oekivanje mean = = n p . U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu. Kumulativne funkcije Distribution Functions) distribucije vjerojatnosti (Cumulative
Transform; Compute; Function group (izabrati: CDF & Noncentral CDF); izabrati: Cdf.Poisson u Numeric Expression: CDF.POISSON(quant,mean) Rezultat ove funkcije je kumulativ vjerojatnosti da broj uspjeha u n pokuaja, uz vjerojatnost realizacije p = prob , bude manji ili jednak nekom broju x = quant . Vrijedi da je oekivanje mean = = n p .
184
Vjerojatnost
U Target Variable: potrebno je imenovati novu varijablu izraunatih kumulativa vjerojatnosti po Poissonovu zakonu.
Analitiki primjer 5.8. Vjerojatnost da se meu studentskom populacijom konzumira droga je: p = 0,056 . a) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata budu 2 studenta koja konzumiraju drogu? b) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata barem 1 student konzumira drogu? c) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata najvie 10 studenata konzumira drogu? Rjeenje 5.8: Zadana vjerojatnost sluajnog dogaaja da se meu studentskom populacijom konzumira droga je manja od 0,10, a uzorak je u svim sluajevima vei od 50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X2 ravna po Poissonovu zakonu. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na slijedei nain: PDF.POISSON(?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable koja se po Poissonovu zakonu rauna na sljedei nain:
n = 60 ; prob = 0,056 : = n p = 60 0,056 = 3,36 .
185
pa se moe upisati: PDF.POISSON(X2,3.36), to je i prikazano u prozoru Numeric Expression na slici 5.2. Slika 5.2. Prozor u SPSS-u za izraunavanje vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu
U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X2Poiss.
186
Vjerojatnost
Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X2 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.7. Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti slian postupak. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku Function and Special Variables: bira Cdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: CDF.POISSON(?,?). Slika 5.3. Prozor u SPSS-u za izraunavanje kumulativnih vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu
U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable:
quant = X 2 ; = 3,36 ,
pa se moe upisati: CDF.POISSON(X2,3.36), to je i prikazano u prozoru Numeric Expression na slici 5.3. U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X2CumPoiss. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci kumulativnih vjerojatnosti sluajne varijable X2 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.7. Tablica 5.7. Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu
188
Vjerojatnost
Prema rezultatima iz tablice 5.7. (prikazano je samo 13 vrijednosti od ukupno 60 vrijednosti zadane diskontinuirane sluajne varijable X2) mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 60 sluajno odabranih studenata budu 2 studenta koja konzumiraju drogu je:
p ( X 1 = 2) = 0,196074 .
b) Vjerojatnost da izmeu 60 sluajno odabranih studenata barem 1 student konzumira drogu je:
p ( X 1 1) = p ( X 1 = 1) + p ( X 1 = 2) + ... + p ( X 1 = 60) = = 1 p ( X 1 = 0) = 1 0,034735 = 0,9653.
Ovdje je iskoriteno svojstvo da je zbroj svih vjerojatnosti u distribuciji 1. c) Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata najvie 10 studenata konzumira drogu?
p ( X 1 10) = p ( X 1 = 0) + p( X 1 = 1) + ... + p( X 1 = 10) = = 0,999263.
Ovdje je traena vjerojatnost jednostavno oitana iz rezultata stupca kumulativnih vjerojatnosti Poissonove distribucije. Jednak rezultat bi se dobio postupnim zbrajanjem vjerojatnosti iz stupca vjerojatnosti Poissonove distribucije. 5.6.3. Dvodimenzionalna diskontinuirana distribucija Diskontinuirana sluajna varijabla X moe poprimiti vrijednosti
x1 , x 2 , x3 ,..., x n , a diskontinuirana sluajna varijabla Y moe istovremeno poprimiti vrijednosti y1 , y 2 , y 3 ,..., y m .
Vjerojatnost da sluajna varijabla X poprimi vrijednost xi , a istovremeno sluajna varijabla Y poprimi vrijednost y j je:
P( X = xi , Y = y j ) = P( xi , y j )
(5.30)
189
P( xi , y j ) = 1
i j i j
n m
(5.31)
{(x , y ); P( x , y )} dvodimenzionalna
je distribucija vjerojatnosti sluajnih varijabli ( X , Y ) . 5.6.4. Marginalne distribucije diskontinuirane sluajne varijable Marginalna distribucija sluajne varijable X skup je ureenih parova odgovarajuih vrijednosti varijable X i njima pripadajuih vjerojatnosti da sluajna varijabla X poprimi neku vrijednost xi bez obzira na to koju e vrijednost poprimiti sluajna varijabla Y. Marginalna distribucija sluajne varijable Y skup je ureenih parova odgovarajuih vrijednosti varijable Y i njima pripadajuih vjerojatnosti da sluajna varijabla Y poprimi neku vrijednost y j bez obzira na to koju e vrijednost poprimiti sluajna varijabla X. Marginalna vjerojatnost sluajne varijable X je:
P ( x i ) = P ( xi , y j ) ,
j =1 m
(5.32)
i obino se u dvostrukoj statistikoj tablici nalazi u zbirnom stupcu (ako se sluajna varijabla X mijenja po redcima). Marginalna vjerojatnost sluajne varijable Y je:
P ( y j ) = P ( x i , y j ) ,
i =1 n
(5.33)
i obino se u dvostrukoj statistikoj tablici nalazi u zbirnom retku (ako se sluajna varijabla Y mijenja po stupcima).
190
Vjerojatnost
5.6.5. Uvjetne distribucije diskontinuirane sluajne varijable Vjerojatnost da sluajna varijabla X poprimi neku vrijednost xi pod uvjetom da je varijabla Y poprimila neku vrijednost y j uvjetna je ili kondicionalna vjerojatnost:
P( xi / y j ) = P( xi , y j ) P( y j ) , P( y j ) > 0 .
(5.34)
Slino, vjerojatnost da sluajna varijabla Y poprimi neku vrijednost y j pod uvjetom da je varijabla X poprimila neku vrijednost xi uvjetna je ili kondicionalna vjerojatnost:
P( y j / xi ) = P( xi , y j ) P( xi )
, P( xi ) > 0 .
varijable
P( xi , y j ) = P( xi ) P( y j ) ,
(5.36)
pa vrijedi da je:
P( xi / y j ) = P( xi ) , P( y j / xi ) = P( y j ) .
(5.37) (5.38)
- varijablu (obiljeje) grupirani deparac (v1) koja se mijenja po redcima (row) i za - varijablu (obiljeje) grupirana ocjena u srednjoj koli (v2) koja se mijenja po stupcima (column). b) Komentirati distribucije! izraunate vjerojatnosti dvodimenzionalne
191
c)
d) Uz pretpostavku da promatrane sluajne varijable nisu nezavisne potrebno je izraunati uvjetnu distribuciju vjerojatnosti: P( p 4 / p3 = 400) ! Rjeenje 5.9: a) Na glavnom izborniku potrebno je odabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Nakon toga otvara se prozor Crosstabs. Slika 5.4. Prozor Crosstabs za izraunavanje dvodimenzionalnih vrijednosti zadanih sluajnih varijabli
Odgovarajuim strelicama prema zahtjevu zadatka potrebno je varijablu (obiljeje) grupirani deparac (v1) prebaciti u prozor za retke
192
Vjerojatnost
Row(s) i varijablu (obiljeje) grupirana ocjena u srednjoj koli (v2) prebaciti u prozor za stupce Column(s) kako je prikazano na slici 5.4. Klikom na ikonu Cells... otvara se prozor Crosstabs: Cell Display gdje je uz postojee originalne frekvencije (Counts) potrebno aktivirati Percentages; Total kako je prikazano na slici 5.5. Da bi se u Outputu programa SPSS dobili traeni podaci potrebno je kliknuti na Continue i OK. Slika 5.5.
Rezultati su prikazani u tablici 5.8. b) Izraunate vjerojatnosti dvodimenzionalne distribucije u tablici 5.8. izraene su u postotcima. Vjerojatnost u prvom retku i prvom stupcu numerikog dijela tablice iznosi 3,5%, to znai da vjerojatnost da ispitanik ima deparac do 200 kn i ocjenu iz srednje kole 3 iznosi 0,035. Vjerojatnost u prvom retku i drugom stupcu numerikog dijela tablice iznosi 22,1%, to znai da vjerojatnost da ispitanik ima deparac do 200 kn i ocjenu iz srednje kole 4 iznosi 0,221.
193
Tablica 5.8. Dvostruka tablica obiljeja deparca i prosjene ocjene u srednjoj koli
grupirani dzeparac * grupirana ocjena u srednjoj skoli Crosstabulation grupirana ocjena u srednjoj skoli 3,00 4,00 5,00 6 38 29 3,5% 22,1% 16,9% 14 20 18 8,1% 11,6% 10,5% 5 14 10 2,9% 8,1% 5,8% 1 3 2 ,6% 1,7% 1,2% 0 2 5 ,0% 1,2% 2,9% 0 3 2 ,0% 1,7% 1,2% 26 80 66 15,1% 46,5% 38,4%
grupirani dzeparac
Total
Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total
Vjerojatnost u etvrtom retku i drugom stupcu numerikog dijela tablice iznosi 1,7%, to znai da vjerojatnost da ispitanik ima deparac izmeu 600 kn i 800 kn i ocjenu iz srednje kole 4 iznosi 0,071. Posljednja vjerojatnost numerikog dijela tablice, tj. vjerojatnost u estom retku i treem stupcu iznosi 2,9%, to znai da vjerojatnost da ispitanik ima deparac izmeu 1000 kn i 3500 kn i ocjenu iz srednje kole 5 iznosi 0,012. c) Izraunate vjerojatnosti marginalne distribucije nalaze se u zbirnom retku i zbirnom stupcu tablice 5.8. Na primjer, druga marginalna vjerojatnost u zbirnom stupcu iznosi 30,2%, tj. vjerojatnost da ispitanik ima deparac izmeu 200 kn i 400 kn bez obzira na prosjenu ocjenu u srednjoj koli iznosi 0,302. Isto tako trea marginalna vjerojatnost u zbirnom retku iznosi 38,4%, tj. vjerojatnost da ispitanik ima prosjenu ocjenu u srednjoj koli 5 bez obzira na visinu deparca iznosi 0,384.
194
Vjerojatnost
dvodimenzionalnoj
d) Uz pretpostavku da promatrane sluajne varijable nisu nezavisne, uvjetna distribucija vjerojatnosti: P(v 2 / v1 = 400) izraunata je na sljedei nain i prikazana je u tablici 5.9:
P (v 2 = 3 / v1 = 400) = P (v 2 = 3, v1 = 400) 0,081 = = 0,2682 , P(v1 = 400) 0,302
P(v 2 = 4 / v1 = 400) =
P (v 2 = 5 / v1 = 400) =
4
0,3841
5
0,3477
Druga izraunata vjerojatnost u tablici 5.9. znai da vjerojatnost da ispitanik ima prosjenu ocjenu iz srednje kole 4 uz uvjet da mu je deparac izmeu 200 kn i 400 kn, iznosi 0,3841. 5.7. Kontinuirana sluajna varijabla Kontinuirana ili diskretna sluajna varijabla X takva je varijabla koja moe poprimiti neprebrojivo beskonano mnogo vrijednosti. Zato se za kontinuiranu sluajnu varijablu ne rauna vjerojatnost u odreenoj toki, nego nad odreenim intervalom. Funkcija vjerojatnosti ili funkcija kontinuirane sluajne varijable X ima svojstva:
f ( x) 0, x ,
gustoe
vjerojatnosti
195
varijabla X poprimi vrijednost veu od x1 i manju ili jednaku x 2 , jednaka je odreenom integralu funkcije vjerojatnosti f ( x) na tom intervalu, odnosno povrini koju krivulja funkcije vjerojatnosti na tom intervalu zatvara s pozitivnim smjerom osi x). Funkcija distribucije sluajne varijable X je funkcija koja daje vjerojatnost da e sluajna varijabla X poprimiti vrijednost jednaku ili manju od nekog realnog broja x :
F ( x) = P ( X x) = f ( x)dx
(5.39)
(5.40)
(5.41)
5.8. Teorijske distribucije kontinuirane sluajne varijable 5.8.1. Normalna distribucija Normalna distribucija je simetrina ( 3 = 0 ), unimodalna i ima oblik zvona. Normalno je zaobljena ( 4 = 3 ):
196
Vjerojatnost
Prema slici 5.6 moe se uoiti da normalna krivulja u istoj toki tono na sredini ima aritmetiku sredinu, medijan i mod. Funkcija vjerojatnosti ili funkcija gustoe vjerojatnosti kod normalne distribucije je:
f ( x) = 1
1 x 2 ) ( 2
x < ,+ > .
(5.42)
Openito se kae da se kontinuirana sluajna varijabla X ravna po normalnoj distribuciji koja je odreena parametrima (oekivanje) i 2 (varijanca):
X
N ( , 2 ) .
x
(5.43)
Za standardiziranu varijablu Z:
Z=
(5.44)
1 Z2 2
(5.45)
Ova normalna distribucija se naziva standardizirana ili jedinina normalna distribucija s oekivanjem 0 i jedininom varijancom, pa vrijedi da je:
X N (0,1) .
(5.46)
197
Jedinina normalna distribucija ima uvijek iste vrijednosti parametara, pa se vrijednosti za intervale vrijednosti varijable Z, od 0 do z kako je prikazano na slici 5.7, (u statistikoj literaturi ima i drugaije koncipiranih tablica), mogu prikazati u jedinstvenoj tablici povrina (vjerojatnosti) ispod normalne krivulje. Na primjer:
x x P ( x1 < X x 2 ) = P2 2 P1 1 = P2 (Z 2 ) P1 (Z 1 ) . (5.47)
5.8.2. Studentova distribucija Studentova distribucija jo se naziva t-distribucija. Ima svoju primjenu u statistici kod procjene parametara osnovnog skupa i kod testiranja hipoteza na osnovi uzorka. Varijabla "t" je definirana na podruju: < ,+ > . Studentova distribucija je simetrina s obzirom na t = 0 . Ako je Z N (0,1) i 2 varijabla tzv. hi-kvadrat ili gamadistribucije s (ili df - degree of freedom) stupnjevima slobode i ako su one nezavisne sluajne varijable, tada je:
t = z
(5.48)
198
Vjerojatnost
Na slici 5.8 se vidi da se s poveanjem stupnjeva slobode , studentova distribucija pribliava normalnoj distribuciji. Ve za = 30 u praksi se umjesto t - distribucije upotrebljava normalna distribucija (pogreka aproksimacije u tom je sluaju manja od 0,03).
199
200
(6.1)
gdje je :
n
N
Korak izbora je reciprona vrijednost frakcije odabiranja ( 1 f ) i upotrebljava se kod sistematskog izbora jedinica u uzorak. Broj svih moguih uzoraka (bez ponavljanja) veliine n iz osnovnog skupa veliine N jednak je broju kombinacija bez ponavljanja n -tog razreda:
N K = . n
(6.2)
Pomou uzorka vri se procjena odreenih parametara osnovnog skupa i testiraju se hipoteze o nepoznatim parametrima osnovnog skupa.
201
Ako se iz osnovnog skupa veliine N izaberu svi mogui uzorci veliine n , te se za svaki uzorak izrauna neki odgovarajui parametar, distribucija tih parametara naziva se sampling distribucija. Pristranost je razlika izmeu oekivane vrijednosti nekog parametra iz sampling distribucije i tog istog parametra iz osnovnog skupa:
E () .
(6.3)
Ako izmeu oekivane vrijednosti nekog parametra iz sampling distribucije i tog istog parametra iz osnovnog skupa ne postoji razlika, onda se to svojstvo naziva nepristranost:
E () = .
(6.4)
Standardna devijacija sampling distribucije naziva se standardna greka. 6.2. Procjena aritmetike sredine osnovnog skupa Ako veliina uzorka tei prema beskonano sampling distribucija aritmetikih sredina, tei normalnom obliku. Kod malih uzoraka sampling distribucija aritmetikih sredina ima oblik Studentove ili t-distribucije. Stoga vrijedi da ako je:
n > 30 n 30
202
Ako nije poznata standardna devijacija osnovnog skupa , rauna se nepristrana (tokasta) ocjena varijance osnovnog skupa na osnovi uzorka S 2 :
n S 2 = n 1
S2 =
Tokasta procjena (procjena jednim brojem) aritmetike sredine osnovnog skupa na osnovi uzorka je:
X.
(6.5)
gdje je:
X
1 - nivo pouzdanosti procjene (ako nije odreeno drukije, najee se uzima de je 1 = 95% ).
Veliina uzorka uz zadani nivo pouzdanosti i maksimalnu greku odreuje se na sljedei nain:
Z n' = greka
2
(6.6)
203
n=
n' n' 1+ N
(6.7)
gdje je:
Z - vrijednost iz tablice povrina Normalne distribucije (pomou Z 1 )
2
Ako je maksimalna greka odreena u relativnom izrazu umjesto (standardne devijacije), veliina uzorka se rauna pomou V (koeficijenta varijacije):
V=
100 .
(6.8)
Analitiki primjer 6.1. Za zadani uzorak ispitanika potrebno je: a) Izraunati prosjenu visinu ispitanika u uzorku (varijabla v1)! b) Izraunati interval procjene za prosjenu visinu ispitanika osnovnog skupa uz pouzdanost procjene od 95%! c) Izraunati interval procjene za prosjenu visinu ispitanika osnovnog skupa uz pouzdanost procjene od 99%! Rjeenje 6.1: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Explore. U otvorenom prozoru Explore potrebno je zadanu numeriku varijablu v1 - visina u cm pomou odgovarajue strelice prebaciti u Dependent List. U prostoru Display potrebno je aktivirati Statistics.
204
Klikom na ikonu Statistics otvara se novi prozor Explore: Statistics koji je prikazan na slici 6.1. Slika 6.1. Odabrani nivo pouzdanosti procjene za aritmetiku sredinu od 95%
Prema zahtjevu zadatka od (b) ovdje je izabran nivo pouzdanosti procjene od 95%. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.1. Tablica 6.1. Podaci o visini ispitanika
Descriptives Visina u cm Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 175,77 174,64 176,89 175,54 174,00 76,539 8,749 154 206 52 12 ,485 ,184 Std. Error ,571
,159 ,316
205
Prema podacima iz tablice 6.1. moe se vidjeti da je prosjena visina ispitanika u uzorku 175,77cm. b) Intervalna procjena aritmetike sredine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 95% je:
Pr{ ,64 < X < 176,89} = 95% . 174
Uz traenu intervalnu procjenu u izlaznoj tablici Descriptives u Outputu programa SPSS dobiju se i sljedei podaci uzorka ispitanika: Median (medijan), Variance (varijanca), Std. Deviation (standardna devijacija), Minimum (najmanja vrijednost varijable), Maximum (najvea vrijednost varijable), Range (raspon varijacije obiljeja), Interquartile Range (interkvartil), Skewness (mjera asimetrije), Kurtosis (mjera zaobljenosti), Std. Error Mean (standardna greka aritmetike sredine),Std. Error Skewness (standardna greka mjere asimetrije) i Std. Error Kurtosis (standardna greka mjere zaobljenosti). c) Da bi se dobila intervalna procjena aritmetike sredine visine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 99%, potrebno je ponoviti slian postupak, samo se u prozor Explore: Statistics upie novi nivo pouzdanosti procjene 99%. Tablica 6.2. Podaci o visini ispitanika
Descriptives Visina u cm Mean 99% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 175,77 174,28 177,25 175,54 174,00 76,539 8,749 154 206 52 12 ,485 ,184 Std. Error ,571
,159 ,316
206
Rezultat je prikazan u tablici 6.2. Intervalna procjena aritmetike sredine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{ ,28 < X < 177,25} = 99% . 174
Moe se zakljuiti da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.
Analitiki primjer 6.2. Za zadani uzorak ispitanika potrebno je: a) Izraunati prosjenu teinu ispitanika u uzorku (varijabla v1)! b) Izraunati interval procjene za prosjenu teinu ispitanika osnovnog skupa uz pouzdanost procjene od 95%! c) Izraunati interval procjene za prosjenu teinu ispitanika osnovnog skupa uz pouzdanost procjene od 99%! Rjeenje 6.2: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Explore. U otvorenom prozoru Explore potrebno je zadanu numeriku varijablu v1 - teina u kg pomou odgovarajue strelice prebaciti u Dependent List. U prostoru Display potrebno je aktivirati Statistics. Klikom na ikonu Statistics otvara se novi prozor Explore: Statistics. Prema zahtjevu zadatka od (b) ovdje izabran nivo pouzdanosti procjene od 95%. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.3. Prema podacima iz tablice 6.3 moe se vidjeti da je prosjena teina ispitanika u uzorku 61,18 kg.
207
,159 ,317
b) Intervalna procjena aritmetike sredine teine u osnovnom skupu pomou zadanog uzorka uz nivo pouzdanosti procjene od 95% je:
Pr{65,44 < X < 68,92} = 95% .
c) Da bi se dobila intervalna procjena aritmetike sredine teine populacije osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene od 99%, potrebno je ponoviti slian postupak, samo se u prozor Explore: Statistics upie novi nivo pouzdanosti procjene 99%. Rezultat je prikazan u tablici 6.4. Intervalna procjena aritmetike sredine teine stanovnika u osnovnom skupu pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{64,88 < X < 69,48} = 99% .
Moe se opet zakljuiti da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.
208
,159 ,317
6.3. Procjena proporcije osnovnog skupa Ako veliina uzorka tei prema beskonano, sampling distribucija proporcija tei normalnom obliku. Kod malih uzoraka sampling distribucija proporcija ima oblik Studentove ili t-distribucije. Stoga vrijedi da ako je:
n > 30 n 30
Standardna greka proporcije (standardna devijacija sampling distribucije proporcije) je: ako je f 0,05 :
Se( p ) = pq n ako je n > 30 i
209
Se( p) =
pq n 1
ako je n 30 .
Tokasta procjena (procjena jednim brojem) proporcije osnovnog skupa na osnovi uzorka je: p , odnosno to je proporcija uzorka. Intervalna procjena proporcije osnovnog skupa na osnovi uzorka je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1
(6.9)
gdje je:
p
Z
Veliina uzorka uz zadani nivo pouzdanosti i maksimalnu greku odreuje se na sljedei nain:
Z P Q n' = greka
2
(6.10)
210
n=
n' n' 1+ N
(6.11)
gdje je:
Z - vrijednost iz tablice povrina Normalne distribucije (pomou Z 1 )
2
PQ
Ako je maksimalna greka odreena u relativnom izrazu umjesto P Q (standardne devijacije), veliina uzorka se rauna pomou V (koeficijenta varijacije osnovnog skupa):
V= Q , P
(6.12)
pa vrijedi da je:
Q Z P . n' = greka
2
(6.13)
Analitiki primjer 6.3. Za zadani uzorak ispitanika (koji su odgovorili na postavljeno pitanje) potrebno je: a) Izraunati proporciju uzorka ispitanika kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe (varijabla v1)! b) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe uz pouzdanost procjene od 95%!
211
c) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe uz pouzdanost procjene od 99%! Rjeenje 6.3: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - financijske prilike u obitelji pomou odgovarajue strelice prebaciti u Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o financijskim prilikama obitelji ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.5. Tablica 6.5 Podaci o financijskim prilikama u obitelji ispitanika
Financijske prilike u obitelji Frequency Valid Nema novca za normalan standard Zadovoljava osnovne potrebe Nema materijalnih problema Zivi odlicno Total System 4 104 122 7 237 2 239 Percent 1,7 43,5 51,0 2,9 99,2 ,8 100,0 Valid Percent 1,7 43,9 51,5 3,0 100,0 Cumulative Percent 1,7 45,6 97,0 100,0
Missing Total
Prema podacima u tablici 6.5. proporcija uzorka ispitanika kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p=
212
S obzirom na to da je veliina uzorka 237 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija; b) Potrebno je napomenuti da program SPSS nema mogunost direktnog izrauna intervalne procjene proporcije osnovnog skupa na osnovi uzorka. Intervalna procjena proporcije osnovnog skupa na osnovi uzorka uz pouzdanost procjene od 95% je:
Pr{p Z Se( p) < P < p + Z Se( p)} = 1 , n > 30 Se( p) = pq = n 0,439 0,561 = 0,032235879 237
Z = 1,96
tab
Konano je intervalna procjena proporcije ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe na osnovi zadanog uzorka uz pouzdanost procjene od 95%:
Pr{0,3758 < P < 0,50218} = 95% .
c) Na slian nain intervalna procjena proporcije ispitanika osnovnog skupa kojima su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe na osnovi uzorka uz pouzdanost procjene od 99% je:
Z 1
2
=
0 , 99 = 0 , 495 2
Z = 2,58
tab
213
Moe se zakljuiti da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.
Analitiki primjer 6.4. Za zadani uzorak ispitanika (koji su odgovorili na postavljeno pitanje) potrebno je: a) Izraunati proporciju uzorka ispitanika kojima su roditelji razvedeni (varijabla v1)! b) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su roditelji razvedeni uz pouzdanost procjene od 95%! c) Izraunati interval procjene za proporciju ispitanika osnovnog skupa kojima su roditelji razvedeni uz pouzdanost procjene od 98%! Rjeenje 6.4: a) Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - brano stanje roditelja pomou odgovarajue strelice prebaciti u Variable(s). Tablica 6.6 Podaci o branom stanju roditelja ispitanika
Bracno stanje roditelja Frequency 215 10 11 3 239 Percent 90,0 4,2 4,6 1,3 100,0 Valid Percent 90,0 4,2 4,6 1,3 100,0 Cumulative Percent 90,0 94,1 98,7 100,0
Valid
Da bi se u Outputu programa SPSS dobili eljeni podaci o branom stanju roditelja ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 6.6. Prema podacima u tablici 6.6. proporcija uzorka ispitanika kojima su roditelji razvedeni omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p= m 10 = = 0,042 ; q = 1 p = 1 0,042 = 0,958 . n 239
S obzirom na to da je veliina uzorka 239 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija. b) Intervalna procjena proporcije u osnovnom skupu onih stanovnika kojima su roditelji razvedeni na osnovi uzorka uz pouzdanost procjene od 95% je:
Pr{p Z Se( p) < P < p + Z Se( p )} = 1 , n > 30 Se( p) = pq = n 0,042 0,958 = 0,012975032 239
Z = 1,96
tab
Konano je intervalna procjena proporcije ispitanika osnovnog skupa kojima su roditelji razvedeni na osnovi zadanog uzorka uz pouzdanost procjene od 95%:
Pr{0,0166 < P < 0,0674} = 95% .
c) Na slian nain intervalna procjena proporcije ispitanika osnovnog skupa kojima su roditelji razvedeni na osnovi uzorka uz pouzdanost procjene od 98% je:
215
Z 1
0 , 98 = = 0, 49 2 2
Z = 2,33 ,
Pr{0,042 2,33 0,032235879 < P < 0,042 + 2,33 0,032235879} = 98% , Pr{0,01177 < P < 0,07223} = 98% .
I ovdje vrijedi jednak zakljuak da s poveanjem nivoa pouzdanosti procjene interval procjene postaje iri, odnosno procjena postaje manje precizna.
216
Analitiki primjer 7.1. Nakon provedene ankete potrebno je u dokument (Variable View) programa SPSS upisati varijablu (obiljeje): Brano stanje (v3) i kodirati je prema zadanoj tablici 7.1. Tablica 7.1. Kodna lista za varijablu Brano stanje
OBILJEJE bracno stanje (v3) OBLICI OBILJEJA neozenjen (neudana) ozenjen (udana) razveden (razvedena) udovac (udovica) KOD 1 2 3 4
Nakon kodiranja zadatak je unijeti konkretne podatke za 50 ispitanika zadane u tablici 7.2. u navedeni dokument (Data View). Tablica 7.2. Tablica s kodiranim podacima za varijablu Brano stanje
(1) (2) 2 1 2 1 1 2 1 2 1 1 1 1 1 3 2 1 2 2 2 1 Izvor: Podaci su simulirani. Brano stanje (3) 1 4 1 1 2 2 1 1 3 1 (4) 1 1 1 1 2 2 2 2 3 1 (5) 2 2 2 1 2 2 1 1 1 2
217
Rjeenje 7.1: U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana. Varijablu je potrebno nazvati (Name) v3. Radi lakeg rada s podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label oznaeno je da je varijabla v3: Brano stanje. Zadnji stupac definira skalu mjerenja (Measure), gdje je za v3 - Brano stanje oznaena opisna, tj. Nominal skala. U stupcu Values za varijablu v3 - Brano stanje uneseni su kodovi prema tablici 7.1. Klikom mia u polje stupca Values otvara se prozor Value Labels u kojem se definira konkretno kodiranje. To je za ovaj primjer prikazano na slici 7.1. Slika 7.1. Prikaz definiranih varijabli u programu SPSS
U programu SPSS podaci prema definiranim varijablama se unose u dijelu Data view koji se bira u donjem lijevom kutu ekrana. Na slici 7.2 prikazani su podaci o branom stanju dijela ispitanika prema zadanim podacima u tablici 7.2 (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu
218
padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom. Slika 7.2. Prikaz podataka varijable v3 - Brano stanje za dio ispitanika u programu SPSS
Analitiki primjer 7.2. Zadatak je formirati statistiku tablicu prema obiljeju "Brano stanje". Komentirajte drugu apsolutnu frekvenciju! Komentirajte prvi relativni broj strukture (Percent)!
219
Rjeenje 7.2: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. Varijabla v3 - Brano stanje se prebacuje u polje Variable(s). Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablicama 7.3. Tablica 7.3.
Bracno stanje
Frequency Percent Valid Percent Cumulative Percent
Valid
26 20 3 1 50
Druga apsolutna frekvencija je 20 i ona u prvom sluaju znai da je od 50 odabranih ispitanika njih 20 bilo oenjenih (udanih). Prvi relativni broj strukture je 52 i on znai da je meu odabranim ispitanicima njih 52% neoenjenih (neudanih).
Analitiki primjer 7.3. Zadatak je 50 anketiranih ispitanika prikazati jednostavnim stupcima prema obiljeju "Brano stanje" (upisati naslov grafikona)! Komentirajte sliku! Rjeenje 7.3: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar chart na kojem se aktivira ikona Simple.
220
Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Brano stanje (v3). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.3. Slika 7.3.
Ispitanici prema bracnom stanju
30
25
20
Count
15
10
Bracno stanje
Prema grafikonu jednostavnih stupaca moe se vidjeti da je meu odabranim ispitanicima najvie neoenjenih (neudanih), a najmanje onih koji su udovac ili udovica. Razvedenih ima manje u odnosu na broj oenjenih (udanih) u odabranom uzorku.
221
Analitiki primjer 7.4. Za ispitanike prema obiljeju "Visina u cm" izraunajte: aritmetiku sredinu, medijan i mod! Komentirajte sve tri srednje vrijednosti na konkretnom primjeru!
Rjeenje 7.4: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v2). Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode, a za medijan Median. Da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.4. Tablica 7.4. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Valid Missing Mean Median 50 0 175,5800 174,5000
222
Prema podacima iz tablice 3.3. moe se vidjeti da je u analizi 50 ispitanika. Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali odgovor), odnosno aritmetika sredina je 175,58 cm. Medijan je 174,5 cm, to znai da je polovica ispitanika s visinom manjom od 174,5 cm ili jednakom tom visinom, a preostala polovica ispitanika je s visinom veom od 174,5 cm. Mod, odnosno najea visina ispitanika, 172 je cm. Ispod tablice je naznaka da u ovoj distribuciji to nije jedini mod, dakle ovo nije unimodalna distribucija.
Analitiki primjer 7.5. Zadatak je za samo ispitanike "mukog spola" formirati tablicu frekvencija prema varijabli (obiljeju) "kolska sprema". Komentirajte 4. apsolutnu frekvenciju i opseg ovoga izabranog statistikog skupa! Rjeenje 7.5: Nakon odabira (filtriranja) ispitanika mukog spola (Data; Select cases; If condition is satisfied: v1 = 2 ) koji je u obiljeju spol kodiran s 2, potrebno je na glavnom izborniku odabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v2 - kolska sprema se prebacuje u polje Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o kolskoj spremi odabranih ispitanika mukog spola, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.5. Prema podacima iz tablice 7.5 moe se vidjeti da su u analizi 22 ispitanika mukog spola. etvrta apsolutna frekvencija je 13, to znai da je 13 ispitanika u analizi bilo sa srednjom strunom spremom.
223
Valid
Nisam pohadjao skolu Osnovna skola Neka zanatska skola Srednja skola Visa skola Visoka skola Magisterij Total
1 1 1 13 1 4 1 22
Analitiki primjer 7.6. Svih 50 anketiranih ispitanika prema varijabli (obiljeju) "kolska sprema" prikaite grafiki pomou strukturnoga kruga (upisati naslov grafikona)! Komentirajte sliku! Rjeenje 7.6: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Pie chart, na kojem se aktivira Summaries of groups of case. Odabirom ikone Define otvara se prozor Define Pie: Summaries for Groups of Cases gdje se u prostor Define Slices by prebaci eljena varijabla, to je u ovom sluaju kolska sprema (v2). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.4.
224
Slika 7.4.
Ispitanici prema skolskoj spremi
Skolska sprema
Nisam pohadjao skolu Osnovna skola Neka zanatska skola Srednja skola Visa skola Visoka skola Magisterij Doktorat
Prema grafikonu strukturnoga kruga moe se vidjeti da je meu odabranim ispitanicima najvie onih sa srednjom strunom spremom, zatim slijede oni s zavrenom visokom i viom kolom. Ostale kategorije strune spreme u ovom su uzorku manje zastupljene.
Analitiki primjer 7.7. Ispitanike prema obiljeju "teina u kg" potrebno je grupirati na
sljedei nain: 41 51 61 71 81 - 50 - 60 - 70 - 80 - 90
50 60 70 80 90
225
91 101
- 100 - 110
100 110.
Nova varijabla je v4, a predstavlja "Grupiranu teinu". Za ovu varijablu "Grupirana teina" formirajte tablicu frekvencija i komentirajte 3. relativni broj strukture (Percent)! Rjeenje 7.7: Da bi se pomou varijable v3 - "Teina u kg" formirala nova varijabla v4 - "Grupirana teina" po principu koji je zadan u ovom primjeru, potrebno je na glavnom izborniku odabrati Transform, a u njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira se Into Different Variables (jer bi se odabirom Into Same Variables izgubila postojea varijabla). U polje Numeric Variable bira se v3 - " Teina u kg ", a u Output Variable, Name je v4, a Label "Grupirana teina". Tablica 7.6. Statistiki podaci o kolskoj spremi ispitanika
Grupirana tezina Frequency 4 14 15 7 5 4 1 50 Percent 8,0 28,0 30,0 14,0 10,0 8,0 2,0 100,0 Valid Percent 8,0 28,0 30,0 14,0 10,0 8,0 2,0 100,0 Cumulative Percent 8,0 36,0 66,0 80,0 90,0 98,0 100,0
Valid
Odabirom ikone Old and New Values otvara se novi prozor Recode into Different Variables. Aktiviranjem opcije Range upisuju se odgovarajue grupe ocjena, kako je zadano. Nakon upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve
226
grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View kreirat e se nova varijabla "Grupirana teina", odnosno v4. Trei relativni broj strukture iznosi 30 i znai da je 30% ispitanika u uzorku s teinom izmeu 61 kg i 70 kg.
Analitiki primjer 7.8. Za sve ispitanike prema varijabli "teina u kg" izraunajte medijan, donji i gornji kvartil! Komentirajte sve 3 karakteristine vrijednosti niza!
Rjeenje 7.8: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v3). Da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.7. Tablica 7.7. Statistiki podaci o teini ispitanika
N Median Percentiles Valid Missing 25 50 75 Statistics 50 0 63,5000 55,7500 63,5000 77,2500
227
Prema podacima iz tablice 7.7. moe se vidjeti da je u analizi bilo 50 ispitanika. Medijan je 63,5 kg, to znai da je polovica ispitanika s teinom manjom od 63,5 kg ili jednakom teinom, a preostala polovica ispitanika je s teinom veom od 63,5 kg. Donji kvartil je 55,75 kg, to znai da je 25% ispitanika s teinom manjom od 55,75 cm ili jednakom teinom, a preostalih 75% ispitanika je s teinom veom od 55,75 kg. Gornji kvartil je 77,25 kg, to znai da je 75% ispitanika s teinom manjom od 77,25 kg ili jednakom teinom, a preostalih 25% ispitanika je s teinom veom od 77,25 kg.
Analitiki primjer 7.9. Nakon provedene ankete potrebno je u dokument (Variable View) programa SPSS upisati varijablu (obiljeje): Materijalno stanje (v3) i kodirati je prema zadanoj tablici 7.8. Tablica 7.8. Kodna lista za varijablu Materijalno stanje
OBILJEJE materijalno stanje (P3) OBLICI OBILJEJA Vrlo dobro Dobro Skromno, ali dovoljno Slabo Veoma slabo KOD 1 2 3 4 5
Nakon kodiranja zadatak je unijeti konkretne podatke za 50 ispitanika zadane u tablici 7.8. u navedeni dokument (Data View).
228
2 2 2 3 3 2 2 2 2 2
2 2 2 2 1 1 4 2 2 2
5 2 2 5 2
2 4 5 2 3 5 2 2 2 2
2 3 3 2 4 3 2 2 3 2
Rjeenje 7.9: U programu SPSS pitanja, odnosno varijable se definiraju u dijelu Variable view koji se bira u donjem lijevom kutu ekrana. Slika 7.5. Prikaz definiranih varijabli u programu SPSS
Varijablu je potrebno nazvati (Name) v3. Radi lakeg rada s podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label
229
oznaeno je da je varijabla v3: Materijalno stanje. Zadnji stupac definira skalu mjerenja (Measure) gdje je za v3 - Materijalno stanje oznaena opisna, tj. Nominal skala. U stupcu Values za varijablu v3 - Materijalno stanje uneseni su kodovi prema tablici 7.8. Klikom mia u polje stupca Values otvara se prozor Value Labels u kojem se definira konkretno kodiranje. To je za ovaj primjer prikazano na slici 7.5. U programu SPSS podaci prema definiranim varijablama unose se u dijelu Data view koji se bira u donjem lijevom kutu ekrana. Na slici 7.6 prikazani su podaci o materijalnom stanju dijela ispitanika prema zadanim podacima u tablici 7.9 (podaci su simulirani). Naravno, nakon to su se podaci unijeli u program SPSS, potrebno ih je snimiti na standardan nain kako se to radi kod veine klasinih programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim imenom. Slika 7.6. Prikaz podataka varijable v3 - Materijalno stanje za dio ispitanika u programu SPSS
230
Analitiki primjer 7.10. Zadatak je formirati statistiku tablicu prema obiljeju "Materijalno stanje". Komentirajte drugu apsolutnu frekvenciju! Komentirajte etvrti i peti relativni broj strukture (Percent)! Rjeenje 7.10: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. Varijabla v3 - Materijalno stanje se prebacuje u polje Variable(s). Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 7.10. Tablica 7.10.
Materijalno stanje
Frequency Percent Valid Percent Cumulative Percent
Valid
Vrlo dobro Dobro Skromno, ali dovoljno Slabo Veoma slabo Total
2 32 8 4 4 50
Druga apsolutna frekvencija je 32 i ona u ovom sluaju znai da je od 50 odabranih ispitanika njih 32 s dobrim materijalnim stanjem. etvrti i peti relativni brojevi strukture su 8, to znai da je meu odabranim ispitanicima njih po 8% sa slabim i veoma slabim materijalnim stanjem.
231
Analitiki primjer 7.11. Zadatak je 50 anketiranih ispitanika prikazati strukturnim krugom prema obiljeju "Materijalno stanje" (upisati naslov grafikona)! Komentirajte sliku! Rjeenje 7.11: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Pie chart na kojem se aktivira Summaries of groups of case. Odabirom ikone Define otvara se prozor Define Pie: Summaries for Groups of Cases gdje se u prostor Define Slices by prebaci eljena varijabla, to je u ovom sluaju Materijalno stanje (v3). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.7. Slika 7.7.
Ispitanici prema materijalnom stanju
Materijalno stanje
Vrlo dobro Dobro Skromno, ali dovoljno Slabo Veoma slabo
232
Prema grafikonu strukturnog kruga moe se vidjeti da je meu odabranim ispitanicima najvie onih s dobrim materijalnim stanjem, zatim slijede oni koji su se izjasnili da im je materijalno stanje skromno, ali dovoljno. Ostale kategorije materijalnog stanja u ovom su uzorku manje zastupljene, a moe se uoiti da onih ije je materijalno stanje vrlo dobro ima najmanje.
Analitiki primjer 7.12. Za ispitanike prema obiljeju "Teina u kg" izraunajte: aritmetiku sredinu i medijan! Komentirajte te dvije srednje vrijednosti na konkretnom primjeru! Pokaite da vrijedi svojstvo aritmetike sredine
da je: xmin X xmax .
Rjeenje 7.12: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - teina u kg se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v3). Tablica 7.11. Statistiki podaci o teini ispitanika
Statistics Tezina u kg N Mean Median Minimum Maximum Valid Missing 50 0 67,5400 63,5000 46,00 102,00
233
Da bi se u Outputu programa SPSS dobili eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.11. Prema podacima iz tablice 7.11. moe se vidjeti da je u analizi bilo 50 ispitanika. Aritmetika sredina, ispitanika je 67,54 kg. odnosno prosjena teina odabranih
Medijan je 63,5 kg, to znai da je polovica ispitanika s teinom manjom od 63,5 ili jednakom tom teinom, a preostala polovica ispitanika je s teinom veom od 63,5 kg. Da bi se dokazalo svojstvo aritmetike sredine da se ona nalazi izmeu najmanje i najvee vrijednosti niza, potrebno je pronai najmanju i najveu vrijednost. Prema podacima u tablici 7.11 vrijedi da je:
x min X x max 46 kg X 102 kg .
Analitiki primjer 7.13. Zadatak je za samo ispitanike "enskog spola" formirati tablicu frekvencija prema varijabli (obiljeju) "Abortus". Komentirajte 2. apsolutnu frekvenciju i 3. relativni broj strukture (Percent) ovog izabranoga statistikog skupa! Rjeenje 7.13: Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu padajuem izborniku odabrati Descriptive Statistics. Dalje se bira Frequencies. Varijabla v2 - Abortus se prebacuje u polje Variable(s). Klikom na OK u Outputu programa SPSS dobije se tablica frekvencija uzorka prema odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici 7.12. Druga apsolutna frekvencija je 17 i ona u ovom sluaju znai da od 50 odabranih ispitanika njih 17 smatra da je abortus doputen u sluajevima silovanja. Trei relativni brojevi strukture je 4, to znai da je
234
meu odabranim ispitanicima njih 4% koji su se izjasnili da su za to da abortus bude doputen onda kada znaajno remeti obiteljski ivot. Tablica 7.12.
Abortus
Frequency Percent Valid Percent Cumulative Percent
Valid
Ubojstvo Dopusten u slucajevima silovanja Dopusten kada znacajno remeti obiteljski zivot Iskljuciva odluka zene Total
26 17 2 5 50
Analitiki primjer 7.14. Svih 50 anketiranih ispitanika prema varijabli (obiljeju) "Abortus" prikaite grafiki pomou jednostavnih stupaca (upisati naslov grafikona)! Komentirajte sliku!
Rjeenje 7.14: Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu padajuem izborniku Bar chart na kojem se aktivira ikona Simple. Odabirom ikone Define otvara se prozor Define Simple Bar: Summaries for Groups of Cases gdje se u prostor Category Axis prebaci eljena varijabla, to je u ovom sluaju Abortus (v2). Grafikonu se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan na slici 7.8. Prema grafikonu jednostavnih stupaca moe se vidjeti da je meu odabranim ispitanicima najvie onih koji smatraju da je abortus ubojstvo, a najmanje onih koji smatraju da je abortus doputen kada znaajno
235
remeti obiteljski ivot. Veliki dio ispitanika smatra da je abortus doputen u sluajevima silovanja. Slika 7.8.
30
25
20
Count
15
10
0 Ubojstvo Dopusten u slucajevima Dopusten kada znacajno silovanja remeti obitelski zivot Iskljuciva odluka zene
Abortus
Analitiki primjer 7.15. Za sve ispitanike prema varijabli "visina u cm" izraunajte aritmetiku sredinu! Komentirajte izraunatu srednju vrijednost! Pokaite da vrijedi svojstvo aritmetike sredine da je: ( xi X ) = 0 (za negrupirani
i =1 N
niz). (Neka to bude preko nove varijable v4, a trai se njezin zbroj: Sum = 0 ).
236
Rjeenje 7.15: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v3 - visina u cm se prebacuje u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm (v3). Da bi se u Outputu programa SPSS dobili eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.13. Tablica 7.13. Statistiki podaci o visini ispitanika
Statistics Visina u cm N Valid Missing Mean 50 0 175,0400
Prema podacima iz tablice 7.13 moe se vidjeti da je u analizi bilo 50 ispitanika. Aritmetika sredina odnosno prosjena visina odabranih ispitanika je 175,04 cm. Da bi se dokazalo svojstvo aritmetike sredine da je zbroj odstupanja vrijednosti obiljeja od prosjeka jednak 0, potrebno je formirati novi stupac (varijablu) gdje e se izraunati ta odstupanja. Zbroj svih podataka iz toga novog stupca mora biti 0. Na glavnom izborniku potrebno je odabrati Transform, a na njegovu padajuem izborniku bira se Compute. Na taj se nain otvori prozor Compute Variable gdje se raunaju odstupanja od prosjeka kao nova varijabla v4. Pod Target Variable upisuje se novo ime v4, a u Numeric Expression se upisuje: v3 175,04 , odnosno da se od svih vrijednosti
237
varijable v3 oduzme njihov prosjek 175,04. Potrebno je napomenuti da se decimalni zarez u programu SPSS oznaava tokom. Klikom na OK u prostoru Data View formira se nova varijabla v4. Da bi se vidio zbroj podataka u ovom stupcu na glavnom izborniku, potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Descriptives. Varijabla v4 prebacuje se u Variable(s). U Options je potrebno aktivirati Sum (dok se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne). Tablica 7.14. Zbroj odstupanja vrijednosti obiljeja od prosjeka
Descriptive Statistics N v4 Valid N (listwise) 50 50 Sum ,00
Suma vrijednosti novoformirane varijable v4 u zadnjem stupcu tablice 7.14 je 0, ime je dokazano navedeno svojstvo aritmetike sredine.
Analitiki primjer 7.16. Za varijablu (obiljeje) prosjena ocjena na I. godini studija (v1) odredite: standardnu devijaciju i asimetriju distribucije (Skewness). Komentirajte izraunate vrijednosti na konkretnom primjeru! Rjeenje 7.16: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - prosjena ocjena na I. godini studija prebacuje se u polje Variable(s).
238
Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Da bi se u Outputu programa SPSS dobili eljeni podaci o varijabli prosjena ocjena na I. godini studija ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.15. Tablica 7.15.
Statistics PROSJECNA OCJENA NA I.GODINI N Valid Missing Std. Deviation Skewness Std. Error of Skewness 40 0 ,88252 -,018 ,374
Prema podacima iz tablice 7.15 moe se vidjeti da je u analizi 40 ispitanika. Standardna devijacija, odnosno prosjeno odstupanje vrijednosti zadanog obiljeja od aritmetike sredine je 0,88. Prema pokazatelju asimetrije (Skewness) moe se zakljuiti da je zadana distribucija lagano negativno ili ljevostrano asimetrina.
Analitiki primjer 7.17. Izraunati dvodimenzionalnu distribuciju vjerojatnosti: za - varijablu (obiljeje) prosjena ocjena na I godini studija (v1) koja se mijenja po redcima (row) i za - varijablu (obiljeje) grupirani dzeparac (v2) koja se mijenja po stupcima (column). a) Komentirajte marginalnu vjerojatnost da je deparac 400 kn u izraunatoj dvodimenzionalnoj distribuciji!
239
b) Komentirajte vjerojatnost da ispitanik ima deparac 400 kn i prosjenu ocjenu na I. godini studija 4 prema izraunatoj dvodimenzionalnoj distribuciji!
Rjeenje 7.17: a) Na glavnom izborniku potrebno je odabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Nakon toga otvara se prozor Crosstabs. Odgovarajuim strelicama prema zahtjevu zadatka potrebno je varijablu (obiljeje) prosjena ocjena na I godini studija (v1) prebaciti u prozor za retke Row(s) i varijablu (obiljeje) grupirani dzeparac (v2) prebaciti u prozor za stupce Column(s). Klikom na ikonu Cells... otvara se prozor Crosstabs: Cell Display gdje je uz postojee originalne frekvencije (Counts) potrebno aktivirati Percentages; Total. Tablica 7.16. Dio dvostruke tablice obiljeja prosjena ocjena na I. godini studija i grupirani deparac
240
Da bi se u Outputu programa SPSS dobili traeni podaci, potrebno je kliknuti na Continue i OK. Rezultati su prikazani u tablici 7.16. Izraunate vjerojatnosti marginalne distribucije nalaze se u zbirnom retku i zbirnom stupcu (koji nije prikazan u tablici) tablice 7.16. Trea marginalna vjerojatnost u zbirnom retku iznosi 20%, tj. vjerojatnost da ispitanik ima deparac 400 kn, bez obzira na prosjenu ocjenu na I. godini studija iznosi 0,2. b) Vjerojatnost da ispitanik ima deparac 400 kn i prosjenu ocjenu na I. godini studija 4 prema izraunatoj dvodimenzionalnoj distribuciji u tablici 7.16 je 12,5%, odnosno 0,125. Analitiki primjer 7.18. Uz pretpostavku da promatrane sluajne varijable prosjena ocjena na I. godini studija (v1) i grupirani dzeparac (v2) nisu nezavisne, izraunajte uvjetnu distribuciju vjerojatnosti: P(v1 / v 2 = 200) ! Rjeenje 7.18: Uz pretpostavku da promatrane sluajne varijable nisu nezavisne, uvjetna distribucija vjerojatnosti P(v1 / v 2 = 200) pomou podataka u tablici 7.16 izraunata je na sljedei nain i prikazana je u tablici 7.17:
P(v1 = 1 / v 2 = 200) = P(v1 = 1, v 2 = 200) 0,025 = = 0,052632 , P(v 2 = 200) 0,475
P(v1 = 5, v 2 = 200) 0,000 = = 0,000 . P(v 2 = 200) 0,475
..................
P(v1 = 5 / v 2 = 200) =
241
Analitiki primjer 7.19. Za zadani uzorak ispitanika izraunajte aritmetiku sredinu prosjena ocjena na I godini studija (v1). Za izraunatu srednju vrijednost potrebno je izraunati interval procjene za prosjek osnovnog skupa uz pouzdanost procjene od 99%! Komentirajte rezultate! Rjeenje 7.19: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Explore. U otvorenom prozoru Explore potrebno je zadanu numeriku varijablu v1 - prosjena ocjena na I godini studija pomou odgovarajue strelice prebaciti u Dependent List. U prostoru Display potrebno je aktivirati Statistics. Klikom na ikonu Statistics otvara se novi prozor Explore: Statistics. Prema zahtjevu zadatka ovdje je izabran nivo pouzdanosti procjene od 99%. Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o prosjena ocjena na I. godini studija ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.18. Prema podacima iz tablice 7.18 moe se vidjeti da je prosjena ocjena na I. godini studija ispitanika u uzorku 3,125.
242
,374 ,733
Intervalna procjena aritmetike sredine teine u osnovnom skupu pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{2,75 < X < 3,50} = 99% .
Analitiki primjer 7.20. Za varijablu (obiljeje) dob ispitanika (v1) odredite: koeficijent kvartilne devijacije. Komentirajte izraunatu vrijednost na konkretnom primjeru! Rjeenje 7.20: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - dob ispitanika se prebacuje u polje Variable(s).
243
Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Tablica 7.19.
Statistics Dob ispitanika (grupirano) N Valid Missing Percentiles 25 50 75 50 21 20,00 30,00 40,00
Da bi se u Outputu programa SPSS dobili eljeni podaci o ispitanicima, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.19. Prema podacima iz tablice 7.19 moe se vidjeti da je u analizi 50 ispitanika. Koeficijent kvartilne devijacije je:
Vq = Q3 Q1 40 20 = = 0,333 . Q3 + Q1 40 + 20
Analitiki primjer 7.21. Vjerojatnost da se meu studentskom populacijom konzumira alkohol samo u posebnoj prigodi je: p = 0,038 . a) Kolika je vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) budu 2 studenta koji konzumiraju alkohol samo u posebnoj prigodi? b) Kolika je vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) najvie 15 studenata konzumira alkohol samo u posebnoj prigodi?
244
Rjeenje 7.21: Zadana vjerojatnost sluajnog dogaaja da se meu studentskom populacijom konzumira alkohol je manja od 0,10, a uzorak je vei od 50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X1 ravna po Poissonovu zakonu. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: PDF.POISSON(?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable koja se po Poissonovu zakonu rauna na sljedei nain:
n = 70 ; prob = 0,038 : = n p = 70 0,038 = 2,66 .
pa se moe upisati: PDF.POISSON(X1,2.66). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X1Poiss. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X1 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti slian postupak.
245
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku Function and Special Variables: bira Cdf.Poisson i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: CDF.POISSON(?,?). U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable:
quant = X 1 ; = 2,66 ,
pa se moe upisati: CDF.POISSON(X1,2.66). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru nazvana je X1CumPoiss. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci kumulativnih vjerojatnosti sluajne varijable X1 po Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 7.20. Prema rezultatima iz tablice 7.20. (prikazano je samo 13 vrijednosti od ukupno 70 vrijednosti zadane diskontinuirane sluajne varijable X1) mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) budu 2 studenta koji konzumiraju alkohol samo u posebnoj prigodi je:
p( X 1 = 2) = 0,2474628 .
b) Vjerojatnost da izmeu 70 sluajno odabranih studenata (X1) najvie 15 studenata konzumira alkohol samo u posebnoj prigodi je:
p ( X 1 15) = p( X 1 = 0) + p( X 1 = 1) + ... + p ( X 1 = 15) 1.
246
Izraunata vjerojatnost je priblino jednaka 1 jer je zbroj svih 71 vjerojatnosti 1, ali zbog manjeg broja decimalnih mjesta ovaj je rezultat izjednaen s 1. Tablica 7.20. Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti diskontinuirane sluajne varijable po Poissonovu zakonu
Analitiki primjer 7.22. Za zadani uzorak ispitanika (onih koji su odgovorili na postavljeno pitanje) potrebno je izraunati proporciju uzorka ispitanika koji nikada ne konzumiraju alkohol (varijabla v1) i izraunati interval procjene za proporciju ispitanika osnovnog skupa koji nikada ne konzumiraju alkohol uz pouzdanost procjene od 95%!
247
Rjeenje 7.22: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - Konzumirate li alkoholna pia pomou odgovarajue strelice prebaciti u Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o konzumiranju alkohola ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.21. Tablica 7.21 Podaci o konzumiranju alkohola
Konzumirate li alkoholna pica Frequency NIKADA 15 SAMO UZ OBROKE 3 U POSEBNIM PRILIKAMA 32 Total 50 System 21 71 Percent 21,1 4,2 45,1 70,4 29,6 100,0 Valid Percent 30,0 6,0 64,0 100,0 Cumulative Percent 30,0 36,0 100,0
Valid
Missing Total
Prema podacima u tablici 7.21 proporcija uzorka ispitanika koji nikada ne konzumiraju alkohol omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p= m 15 = = 0,3 ; q = 1 p = 1 0,3 = 0,7 . n 50
S obzirom na to da je veliina uzorka 50 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija. Intervalna procjena proporcije u osnovnom skupu onih stanovnika koji nikada ne konzumiraju alkohol na osnovi uzorka uz pouzdanost procjene od 95% je:
Pr{p Z Se( p) < P < p + Z Se( p)} = 1 ,
248
n > 30
Se( p ) =
0 ,95 = 0 , 475 2
Z = 1,96
tab
Konano je intervalna procjena proporcije ispitanika osnovnog skupa koji nikada ne konzumiraju alkohol na osnovi zadanog uzorka uz pouzdanost procjene od 95%:
Pr{0,17298 < P < 0,427} = 95% .
Analitiki primjer 7.23. Za varijablu (obiljeje) prosjena ocjena na I godini studija (p1) odredite: interkvartil i zaobljenost distribucije (Kurtosis). Komentirajte izraunate vrijednosti na konkretnom primjeru! Rjeenje 7.23: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - prosjena ocjena na I godini studija prebacuje se u polje Variable(s). Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Da bi se u Outputu programa SPSS dobili eljeni podaci o prosjenoj ocjeni na I. godini studija ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.22.
249
Tablica 7.22.
N Kurtosis Std. Error of Kurtosis Percentiles 25 50 75 PROSJECNA OCJENA NA I. GODINI Valid Missing 40 0 -,071 ,733 3,0000 3,0000 4,0000
Prema podacima iz tablice 7.22 moe se vidjeti da je u analizi 40 ispitanika. Interkvartil zadane distribucije moe se izraunati pomou donjeg i gornjeg kvartila:
I q = Q3 Q1 = 4 3 = 1 .
Rasprenost prosjene ocjene na I. godini za srednjih 50% ispitanika je 1 ocjena. Zaobljenost zadane distribucije moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer iznosi -0,071, to upuuje na blago tupi vrh distribucije u odnosu na normalno zaobljenu distribuciju.
Analitiki primjer 7.24. Za varijablu (obiljeje) dob ispitanika (v1) odredite: varijancu. Komentirajte izraunatu vrijednost na konkretnom primjeru! Rjeenje 7.24: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U prozoru Frequencies pomou odgovarajue strelice varijabla v1 - dob ispitanika prebacuje se u polje Variable(s).
250
Klikom na ikonu Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1). Da bi se u Outputu programa SPSS dobili eljeni podaci o dobi ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.23. Tablica 7.23.
Statistics Dob ispitanika (grupirano) N Valid Missing Variance 50 0 138,612
Prema podacima iz tablice 7.23 moe se vidjeti da je u analizi 50 ispitanika. Varijanca, odnosno prosjeno kvadratno ispitanika od aritmetike sredine je 138,612 god 2 . odstupanje dobi
Analitiki primjer 7.25. Vjerojatnost da se meu studentskom populacijom ne konzumira alkohol je: p = 0,228 . a) Kolika je vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) budu 2 studenta koji ne konzumiraju alkohol? b) Kolika je vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) najvie 3 studenta ne konzumiraju alkohol? Rjeenje 7.25: Zadana vjerojatnost sluajnog dogaaja da se meu studentskom populacijom ne konzumira alkohol je vea od 0,10, a uzorak je manji od 50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X1 ravna po Binomom zakonu.
251
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function group: odabrati PDF & Noncentral PDF. Nakon toga se u izborniku Function and Special Variables: bira Pdf.Binom i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: PDF.BINOM(?,?,?). U navedenoj funkciji prvi upitnik predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi upitnik funkcije predstavlja veliinu uzorka n , a trei upitnik je vjerojatnost realizacije sluajnog dogaaja p :
quant = X 1 ; n = 6 ; prob = 0,228 ,
pa se moe upisati: PDF.BINOM(X1,6,0.228). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru nazvana je X1Bin. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci vjerojatnosti sluajne varijable X1 po Binomnoj distribuciji, potrebno je kliknuti na OK. Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti slian postupak. Na glavnom izborniku potrebno je odabrati ikonu Transform, a na njezinu padajuem izborniku Compute. Nakon toga otvara se prozor Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku Function and Special Variables: bira Cdf.Binom i klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei nain: CDF.BINOM(?,?,?). U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi
252
upitnik funkcije predstavlja veliinu uzorka n , a trei upitnik je vjerojatnost realizacije sluajnog dogaaja p :
quant = X 1 ; n = 6 ; prob = 0,228 ,
pa se moe upisati: CDF.BINOM(X1,6,0.228). U Target Variable: potrebno je imenovati novu varijablu izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru nazvana je X1CumBin. Konano, da bi se u dodatnom stupcu programa SPSS dobili eljeni podaci kumulativnih vjerojatnosti sluajne varijable X1 po Binomnoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 7.24. Tablica 7.24. Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti diskontinuirane sluajne varijable po Binomnom zakonu
Prema rezultatima iz tablice 7.24 mogu se oitati i/ili izraunati traene vjerojatnosti. a) Vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) budu 2 studenta koji ne konzumiraju alkohol je:
p ( X 1 = 2) = 0,277 .
b) Vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) najvie 3 studenta ne konzumiraju alkohol je:
253
p ( X 1 3) = p ( X 1 = 0) + p ( X 1 = 1) + ... + p ( X 1 = 3) = = 0,973.
Analitiki primjer 7.26. Za zadani uzorak ispitanika (onih koji su odgovorili na postavljeno pitanje) potrebno je izraunati proporciju uzorka ispitanika koji konzumiraju alkohol samo u posebnoj prigodi (varijabla v1) i izraunati interval procjene za proporciju ispitanika osnovnog skupa koji konzumiraju alkohol samo u posebnoj prigodi uz pouzdanost procjene od 99%! Rjeenje 7.26: Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na njezinu padajuem izborniku Descriptive Statistics i Frequencies. U otvorenom prozoru Frequencies potrebno je zadanu numeriku varijablu v1 - Konzumirate li alkoholna pia pomou odgovarajue strelice prebaciti u Variable(s). Da bi se u Outputu programa SPSS dobili eljeni podaci o konzumiranju alkohola ispitanika, potrebno je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.25. Tablica 7.25 Podaci o konzumiranju alkohola
Konzumirate li alkoholna pica Frequency NIKADA 15 SAMO UZ OBROKE 3 U POSEBNIM PRILIKAMA 32 Total 50 Percent 30,0 6,0 64,0 100,0 Valid Percent 30,0 6,0 64,0 100,0 Cumulative Percent 30,0 36,0 100,0
Valid
Prema podacima u tablici 7.25 proporcija uzorka ispitanika koji konzumiraju alkohol samo u posebnoj prigodi omjer je povoljnih i svih
254
moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p= m 32 = = 0,64 ; q = 1 p = 1 0,64 = 0,36 . n 50
S obzirom na to da je veliina uzorka 50 , vrijedi da je n > 30 , pa se za intervalnu procjenu koristi normalna distribucija. Intervalna procjena proporcije u osnovnom skupu onih stanovnika koji konzumiraju alkohol samo u posebnim prigodama na osnovi uzorka uz pouzdanost procjene od 99% je:
Pr{p Z Se( p) < P < p + Z Se( p )} = 1 , n > 30 Se( p ) =
pq 0,64 0,36 = = 0,0678822 n 50
Z = 2,58
tab
Konano je intervalna procjena proporcije ispitanika osnovnog skupa koji konzumiraju alkohol samo u posebnoj prigodi na osnovi zadanog uzorka uz pouzdanost procjene od 99%:
Pr{0,46846 < P < 0,815136} = 99% .
255
256
257
258
9. LITERATURA
1. Anderson, D. R. et al. (2002). Statistics for Business and Economics. 8th. Edt. St Paul: West. 2. Anderson, D. R. et al. (1998). Quantitative Methods for Business. 7th. Edt. South-Western College Publishing. 3. Babbie, E. Halley, F. Zaino, J. (2000). Adventures in Social Research. Data Analysis Using SPSSX for Windows 95/98. USA: Pine Forge Press. 4. Beter, M.i Bregar, L. (1986). Ekonomska statistika. Ljubljana. Ekonomska fakulteta. 5. Blejec, M. (1976). Statistike metode za ekonomiste. Ljubljana: Ekonomska fakulteta. 6. Canavos, G. C. and Miller, D. M. (1993). An Introduction to Modern Business Statistics. Belmont. Wadsworth. 7. Cochran, W. G. (1977). Sampling Techniques. New York: Wiley. 8. Dillon, W. R. and Goldstein, M. (1984). Multivariate Analysis, Methods and Applications. New York: Wiley. 9. Dodge, M., Kinata, C. i Stison, C. (1997). Kako koristiti Microsoft Excel 97, Zagreb: Znak. 10. Everit, B. S. (1996). Making Sense of Statistics in Psychology, Oxford: Oxford University Press. 11. Feller, W. (1971). An Introduction to Probability Theory and its Applications. Vol. I and Vol. II, New York:Wiley.
259
12. Fisher, R. A. (1950). Statistical Methods for Research Workers. 11 th Edt. Edinburgh: Oliver and Boyd. 13. Fisher, R. A. (1993). Statistical Methods, Eksperimental Design and Scientific Inference. Oxford: Oxford University Press. 14. Frye, C. (2003). Microsoft Excel 2002 Korak po korak. Zagreb: Algoritam. 15. Fulton, J. (1997). Vodi kroz Excel 97. Zagreb: Znak. 16. Halmi, A. (2003). Multivarijatna analiza u drutvenim znanostima. Alinea. Zagreb 17. Hadivukovi, S. (1975). Tehnika metoda uzorka. Beograd: Nauna knjiga 18. Heij, C. et. al.( 2004). Econometrisc Methods with Applications in Business and Economics, New York : Oxford University Press. 19. Kendall, M. and Stuart, A. (1973). The Advanced Theory of Statistics. Vol I. London: Griffin. 20. Kendall, M. and Stuart, A. (1974). The Advanced Theory of Statistics. Vol II. London: Griffin. 21. Kendall, M. and Stuart, A. (1976). The Advanced Theory of Statistics. Vol III. London: Griffin. 22. Kish, L. (1965). Survey Sampling. New Yor: Wiley. 23. Kolesari, V. i Petz. B. (2003). Statistiki rjenik. Tuma statistikih pojmova. Naklada Slap. 24. Leburi, A. i Krneta, M. (2004). Profil poduzetnika u Hrvatskoj. Socio-ekonomsko istraivanje 2003. Split: Naklada Bokovi.
260
25. de Levie, R. (2004). Advanced Excel for Scientific Data Analysis. Oxford: Oxford University Press. 26. Marti, Lj. (1986). Mjere nejednakosti i siromatva. Zagreb. Birotehnika. 27. Mason, D. R. and Lind, D. A. (1993). Statistical Techniques in Business and Economics. Boston, Masachussetts: IRVIN Publishing. 28. Metre, J. G. and Gilbreath, G. H. (1983). Statistics for Business and Economics. Plano. Texas: Business Publications. 29. Milton, J. S. et al. (1986). Introduction to Statistics. Lexington: D. C. Heath. 30. Momirovi, K. (1998). Uvod u analizu nominalnih varijabli. Metodoloke sveske 2. Ljubljana: JUS. 31. Mood, A. M. and Graybill, F. P. (1963). Introduction to the Theory of Statistics. New York: McGraw-Hill. 32. Neter, J. et al. (1993). Applied Statistics. 4th Edt. Boston: Allyn and Bacon. 33. Newbold, P. (1991). Statistics for Business and Economics. Englewood Cliffs: Prentice-Hall. 34. Paue, . (2003). Vjerojatnost, informacija, stohastiki procesi. Zagreb: kolska knjiga. 35. Pavli, I. (1971). Statistika teorija i primjena. Zagreb: Tehnika knjiga. 36. Pivac, S. and Jurun, E. (2005). Parameter Estimation in Excel, Proceedings of the 28th Internationl Convention MIPRO 2005. Computers in Education, Opatija, pp 168-173.
261
37. Pivac, S. Jurun, E. and Jujnovi, I. (2006). Ocjena parametara nelinearnih funkcija u programskom paketu Statistica na primjeru nezaposlenosti, Proceedings of the 29th Internationl Convention MIPRO 2006. Computers in Education, Opatija, pp 241-245. 38. Pivac, S. Jurun, E. and Jerak. N. (2006). Rjeavanje simultanih jednadbi kao ekonometrijskog modela pomou programskog paketa Excel, Proceedings of the 29th Internationl Convention MIPRO 2006. Computers in Education, Opatija, pp 246-251. 39. Pivac, S. i ego, B. (2005). Statistika, udbenik sa zbirkom zadataka za IV. razred srednje Ekonomske kole, Zagreb: Alkascript. 40. Rozga, A. (2003). Statistika za ekonomiste, Sveuilite u Splitu. Ekonomski fakultet Split. 41. Rozga, A. i Gri, B. (2003). Poslovna statistika, Ekonomski fakultet Split. 42. Seplaki, L. (1991). Atorneys' Dictionary and Handbook of Economics and Statistics, New York: Professional Horizons Press. 43. Siegel, A. F. (1994). Practical Business Statistics. Boston, Masachussetts: IRVIN Publishing. 44. oi, I. (1983). Metode statistike analize. Zagreb: Sveuilina naklada Liber. 45. oi, I. (1985). Zbirka zadataka iz osnova statistike. Zagreb: Sveuilina naklada Liber. 46. oi, I. i Serdar, V. (2002). Uvod u statistiku. XII. izdanje, Zagreb: kolska knjiga. 47. oi, I. (2004). Primijenjena statistika. Zagreb: kolska knjiga.
262
48. Tenjovi, L. (2002). Statistika u psihologiji. Beograd: Centar za primenjenu psihologiju. 49. arkovi, S. S. (1965). Sampling Methods and Censuses. Rim:FAO 50. Whigham, D. (1998). Quantitative Business Methods Using Excel. Oxford University Press. 51. Wonnacott, T. H. and Wonnacott, R. J. (1990). Introductory Statistics for Business and Economics (fourth edition). New York: Wiley. 52. The Central Bureau of Statistics. Republic of Croatia: URL: http:// www.dzs.hr
263