You are on page 1of 11

Veleuilite u Rijeci Poslovni odjel Struni studij informatike Struni studij poduzetnitva Akademska godina 2009/10

VJEROJATNOST I STATISTIKA STATISTIKA ZA PODUZETNIKE (skraena predavanja)

mr. sc. Sanja Raspor, asistentica

Rijeka, studeni 2009.

1. Temeljni pojmovi u statistici


Statistika je znanstvena disciplina koja se bavi prikupljanjem, analizom i tumaenjem podataka o masovnim pojavama. Statistika na organiziran nain pristupa prikupljanju, selekciji, grupiranju, prezentaciji i analizi informacija ili podataka, te interpretiranju rezultata provedene analize, a u svrhu realizacije postavljenih istraivakih ciljeva. Statistika se kao znanstvena metoda dijeli na: (1) opisnu ili deskriptivnu, (2) inferencijalnu, induktivnu ili analitiku statistiku. Opisna ili deskriptivna statistika sastoji se od primjene postupaka kojima se podaci ureuju, te tabelarno i grafiki prikazuju, kako bi bili pregledniji i razumljiviji za interpretaciju i daljnju analizu. Pritom je obuhvaen statistiki skup u potpunosti. Inferencijalna statistika sastoji se od primjene postupaka kojima se pomou podataka iz uzorka donose zakljuci o karakteristikama cijelog statistikog skupa. Inferencijalna statistika se, dakle, temelji na parcijalnom, tj. nepotpunom obuhvatu statistikog skupa ili populacije. Osnova inferencijalne statistike je uzorak, tj. dio jedinica promatranog osnovnog skupa (populacije). Statistiki skup je temeljni pojam u statistici. Sastoji se od jedinica (npr. osobe, stvari, poslovni subjekti, drave) koje imaju slina, zajednika svojstva. Opseg statistikog skupa je broj njegovih jedinica (elemenata). Podaci o danoj varijabli za svaki element statistikog skupa tvore skup podataka koji se zove statistika populacija ili osnovni skup. Podskup statistikog skupa zove se uzorak. Uzorkom se dakle smatraju podaci o dijelu statistike populacije. Svaki statistiki skup definira se pojmovno, prostorno i vremenski. Pojmovnom definicijom utvruje se pripadnost skupu s obzirom na pojam jedinice. Prostornom definicijom oznaava se prostor kojemu pripadaju sve jedinice statistikog skupa. Vremenskom definicijom odreuje se vremenski interval ili vremenska toka za koju su vezane sve jedinice skupa. Primjer: U 2006. godini u RH bilo je 257 838 korisnika internet bankarstva. Opseg skupa: 257 838 Pojmovna definicija skupa: korisnici internet bankarstva Prostorna definicija skupa: RH Vremenska definicija skupa: 2006. godina. Svojstva jedinica po kojima se lanovi statistikog skupa razlikuju ili jedni drugima nalikuju nazivaju se statistika obiljeja ili statistike varijable. Razlikujemo dvije osnovne kategorije (vrste) statistikih obiljeja: (1) kvalitativna obiljeja (2) kvantitativna obiljeja. Kvalitativna obiljeja se obino izraavaju opisno, te s njima nisu doputene raunske operacije. Meu kvalitativna obiljeja ubrajaju se nominalna obiljeja i redoslijedna (ureajna ili rang) obiljeja. Nominalna obiljeja dijele se na atributivna i geografska obiljeja. Atributivno obiljeje izraava svojstvo (atribut) elementa skupa (npr. vrsta prijevoza, narodnost, spol, nain plaanja rauna, vrsta automobila). Geografsko obiljeje oznaava mjesto (prostor) s kojim su elementi statistikog skupa u vezi (npr. mjesto roenja, drava dolaska turista, sjedite poduzea, drava s kojom se vri robna razmjena). Redoslijedno obiljeje izraava stupanj (rang) nekog svojstva (npr. ocjena, ostvareni bodovi na kolokviju, struna sprema, stupanj zadovoljstva gostiju). Kvantitativna ili numerika obiljeja izraavaju se brojevima, te se dijele na diskretna, diskontinuirana ili prekidna obiljeja i kontinuirana ili neprekidna obiljeja. Diskretno ili diskontinuirano numeriko obiljeje moe poprimiti prebrojivo mnogo vrijednosti (teoretski i beskonano) izmeu kojih postoji neki razmak (npr. broj soba u stanu, broj djece u obitelji, visina plae, broj studenata na predavanju). Vrijednost diskretnog obiljeja obino se utvruje brojenjem. Kontinuirano numeriko obiljeje moe teoretski poprimiti beskonano neprebrojivo mnogo vrijednosti, odnosno bilo koju vrijednost unutar nekog specifinog intervala omjerne numerike skale (npr. visina, teina, duljina, stopa nezaposlenosti). Vrijednost kontinuiranog obiljeja obino se utvruje mjerenjem.

Pored kvalitativnih i kvantitativnih obiljeja esto se koristi i vremensko obiljeje koje oznaava trenutak ili vremenski interval s kojim su elementi statistikog skupa u vezi (npr. godina, mjesec, tjedan, vikend, sat). Podaci e se smatrati statistikim ako su prikupljeni prema odreenom planu prikupljanja, odnosno poznatom nacrtu eksperimenta, ako su varijabilni i ako ih je dovoljan broj. S obzirom na izvor, podaci se dijele na primarne i sekundarne. Primarni podaci se prikupljaju neposrednim promatranjem svojstava elemenata statistikog skupa, u skladu s predmetom i svrhom istraivanja. Prikupljaju se na temelju plana promatranja ili eksperimenta, a njihov opseg i struktura ovise o zadacima odreenog istraivanja. Sekundarni podaci se pribavljaju iz ve postojeih baza podataka, te su rezultat djelatnosti drugih institucija, odnosno subjekata (npr. dravne ustanove, poduzea). Suvremeni je pristup podacima preko informacijskih sustava (internet).

2. Ureivanje i grafiko prikazivanje podataka


Ureivanje statistikih podataka provodi se nakon prikupljanja podataka. Ureivanje podataka provodi se na razliite naine. Podaci se navode prema nekom pravilu ili se grupiraju. Grupiranje je postupak kojim se statistiki skup ralanjuje na odreeni broj podskupova prema oblicima obiljeja, i to tako da se u svaki podskup rasporede jedinice s jednakim, odnosno jednakim i slinim oblikom obiljeja. Broj jedinica statistikog skupa koje imaju isti oblik obiljeja naziva se frekvencijom . Primjer: na ispitu iz kolegija Statistika za poduzetnike est studenata dobilo je ocjenu vrlo dobar. U promatranom skupu ocjena vrlo dobar je obiljeje, a est studenata je frekvencija. Ureivanjem podataka nastaje statistiki niz. To je skup parova razliitih oblika obiljeja s pripadajuim frekvencijama. Statistikih nizova ima onoliko vrsta i podvrsta koliko ima vrsta i podvrsta obiljeja atributivni, geografski, redoslijedni, vremenski, numeriki nizovi. Statistiki nizovi pregledno se prikazuju u tabelama i grafikonima. Tabeliranje je postupak svrstavanja podataka u tablice prema odreenom pravilu. Na taj se nain olakava praenje statistikih podataka. Postoji vie vrsta tabela izvjetajna (sadri sve prikupljene podatke), analitika (sadri dio ureenih podataka izdvojenih za analizu), jednostavna (sadri jedan statistiki niz), skupna (sadri dva ili vie statistikih nizova, ureenih prema oblicima istog obiljeja), kombinirana (sadri podatke grupirane istodobno prema dva ili vie obiljeja). Elementi statistike tabele su: naslov, tekstualni dio (zaglavlje i pretkolona), brojani dio (polja s frekvencijama, zbirni redak i zbirni stupac), izvor podataka. Grafiko prikazivanje je jednostavan i pregledan nain prikazivanja osnovnih karakteristika promatranih pojava pomou razliitih geometrijskih likova. Razlikujemo: (1) povrinske grafikone (2) linijske grafikone. Povrinski grafikoni mogu biti: jednostavni stupci, dvostruki stupci, viestruki stupci, razdijeljeni stupci, strukturni stupci, strukturni krug i polukrug, histogram, Varzarov znak, kartogrami (dijagramska karta, statistika karta, piktogram). Linijski grafikoni su poligon frekvencija i linijski grafikon. Elementi grafikona: naslov, legenda (ako je potrebno), izvor podataka (treba odgovarati izvoru podataka u tabeli po kojoj su podaci grafiki prikazani).

3. Relativni brojevi i njihovo grafiko prikazivanje


Relativni brojevi su brojevi koji nastaju dijeljenjem dviju veliina. Veliina s kojom se dijeli zove se osnovom relativnog broja. Relativni se brojevi razlikuju jedan od drugog ovisno o tome to im je osnova. Razlikujemo tri vrste relativnih brojeva: (1) relativni brojevi strukture: postoci i promili (2) relativni brojevi dinamike: individualni indeksi (bazni i verini) i skupni indeksi (koliine, cijene i vrijednosti) (3) relativni brojevi koordinacije. Postotak je omjer postotnog iznosa (dio) i postotne osnovice (cjelina), pomnoen sa 100. Grafiki se prikazuje strukturnim stupcima. Indeksi niza kvalitativnih podataka su relativni brojevi koji nastaju dijeljenjem vrijednosti lanova niza s baznom veliinom i mnoenjem omjera sa 100. Bazna veliina je odabrana vrijednost niza ili neka druga prikladna veliina. Indeksi se grafiki prikazuju jednostavnim stupcima ili linijskim grafikonom. Relativni brojevi koordinacije (statistiki pokazatelji, omjerni brojevi) nastaju diobom dviju veliina koje ima smisla usporeivati. Primjer: usporeivanje uvoza i izvoza (koliko jedinica izvoza dolazi na jedinicu uvoza), gustoa napuenosti na odreenom podruju (odnos broja stanovnika i povrine podruja), stupanj gospodarske razvijenosti (odnos narodnog dohotka i broja stanovnika) itd. Relativni brojevi grafiki se mogu prikazivati jednostavnim stupcima i Varzarovim znakom (pravokutnici).

4. Numeriki niz: srednje vrijednosti


Numeriki niz nastaje ureenjem vrijednosti numerikog obiljeja. Ako skup ima mali broj lanova, vrijednosti numerikog obiljeja se ne grupiraju (negrupirani podaci). Ako se diskontinuirano numeriko obiljeje pojavljuje samo u nekoliko oblika, a broj podataka je velik, ureenje se provodi postupkom grupiranja (grupirani podaci). Elementi skupa mogu se grupirati prema istoj vrijednosti numerikog obiljeja (grupirani podaci bez razreda) ili prema slinim vrijednostima numerikog obiljeja tj. razredima (grupirani podaci s razredima). Ureenjem vrijednosti numerikog obiljeja i pripadajuih frekvencija nastaje distribucija frekvencija. Pomou distribucije frekvencija izvodi se kumulativni niz. On nastaje postupnim zbrajanjem frekvencija od prve do posljednje. Ureivanje velikog broja podataka provodi se grupiranjem podataka po razredima. Razredi imaju donju (L1) i gornju (L2) granicu razreda. Mogu biti jednakih ili razliitih veliina. Ako su razredi nejednakih veliina, potrebno je korigirati njihove frekvencije. Veliina razreda (i) jednaka je razlici njegove gornje i donje granice. Razredna sredina (xsi) je poluzbroj donje i gornje granice razreda. Numeriki nizovi se grafiki prikazuju povrinskim (histogram) i linijskim grafikonom (poligon frekvencija). Srednja vrijednost numerikog niza je konstanta kojom se prikazuje niz statistikih podataka. Razlikujemo: (1) potpune srednje vrijednosti: aritmetika sredina, harmonijska sredina, geometrijska sredina (2) poloajne srednje vrijednosti: mod i medijan. Aritmetika sredina ( x ) je najvanija srednja vrijednost. To je prosjena vrijednost koja se odreuje tako da se zbroj svih vrijednosti podjeli s njihovim brojem. Harmonijska sredina (H) je reciprona vrijednost aritmetike sredine njezinih recipronih vrijednosti. Koristi se npr. za izraunavanje prosjenog vremena potrebnog za izradu jedinice proizvoda, prosjenog vremena prijeene jedinice puta i sl. Geometrijska sredina (G) je N-ti korijen iz produkta N numerikih vrijednosti. Koristi se u analizi vremenskih nizova, za izraunavanje prosjene stope promjene pojave.

Medijan (Me) je poloajna srednja vrijednost koja numeriki niz ureen po veliini dijeli na dva jednaka dijela 50% jedinica u nizu ima vrijednost numerikog obiljeja jednaku ili manju od medijana, a preostalih 50% jedinica vrijednost jednaku ili veu od medijana. Mod (Mo) je vrijednost obiljeja koja se najee pojavljuje u nizu, tj. vrijednost obiljeja s najveom frekvencijom.

5. Numeriki niz: mjere disperzije


Mjere disperzije (rasprenosti) opisuju stupanj varijabilnosti statistikih podataka, tj. raspored elemenata u skupu. Razlikujemo: (1) apsolutne mjere disperzije: raspon varijacije, interkvartil, varijanca, standardna devijacija (2) relativne mjere disperzije: koeficijent kvartilne devijacije i koeficijent varijacije. Raspon varijacije (R) je razlika izmeu najvee i najmanje vrijednosti numerikog obiljeja. Interkvatil (IQ) je razlika izmeu gornjeg i donjeg kvartila. To je raspon varijacije sredinjih 50% lanova niza ureenih podataka. Donji kvartil (Q1) dijeli ureeni niz na dva dijela - prvih 25% lanova niza ima vrijednosti manje od Q1, a preostalih 75% ima vrijednosti vee od Q1. Gornji kvartil (Q3) dijeli niz na dva dijela prvih 75% lanova niza imaju vrijednost manju od Q3, a preostalih 25% ima vrijednosti vee od Q3. Varijanca (2 ili 2) je prosjeno kvadratno odstupanje od prosjeka, tj. od aritmetike sredine. Standardna devijacija () je prosjeno odstupanje vrijednosti numerike varijable od aritmetike sredine, tj. pozitivni drugi korijen iz varijance. To je u praksi najee upotrebljavana apsolutna mjera disperzije. Koeficijent kvartilne devijacije (VQ) je omjer interkvartila i zbroja kvartila. Moe poprimiti vrijednosti iz intervala od 0 do 1. Koeficijent varijacije (V) je omjer standardne devijacije i aritmetike sredine pomnoen sa 100. Predstavlja postotni udio standardne devijacije u odnosu na vrijednost aritmetike sredine.

6. Numeriki niz: mjere asimetrije i mjere zaobljenosti


Mjera asimetrije je brojana karakteristika naina rasporeda podataka numerikog niza oko neke srednje vrijednosti (najee aritmetike sredine). Pokazuje je li numeriki niz simetrian ili ne, te koji je smjer i veliina asimetrije. Razlikujemo tri mjere asimetrije: (1) koeficijent asimetrije (2) Pearsonove mjere asimetrije (3) Bowleyjeva mjera asimetrije. Koeficijent asimetrije (3) omjer je treeg momenta oko sredine i standardne devijacije podignute na treu potenciju. To je u praksi najee koritena mjera asimetrije. Moe poprimiti vrijednosti iz intervala 2. Distribucija moe biti simetrina (3 = 0), desnostrano asimetrina (3 > 0) ili lijevostrano asimetrina (3 < 0). Pearsonova mjera asimetrije (Sk) predstavlja standardizirano odstupanje medijana ili moda od aritmetike sredine. Moe poprimiti vrijednosti iz intervala 3. Bowleyjeva mjera asimetrije (Skq) se temelji na odnosima kvartila i medijana. Moe poprimiti vrijednosti iz intervala 1. Mjera zaobljenosti je brojani pokazatelj zaobljenosti promatranog numerikog niza, tj. vrha krivulje distribucije frekvencija. Najee se koristi koeficijent zaobljenosti (4). To je omjer etvrtog momenta oko sredine i standardne devijacije na etvrtu potenciju. Promatrana distribucija moe biti plosnatija (manje zaobljena) od normalne distribucije (4 < 3) ili iljastija (vie zaobljena) od normalne distribucije (4 > 3).

7. Kombinatorika
Kombinatorika je matematika grana koja se bavi rasporedom elemenata na prazna mjesta u nizu. Uglavnom prouava konane skupove i strukture. Javljaju se dva tipa problema: (1) egzistencija razmjetaja i prouavanje poznatih razmjetaja (2) prebrojavanje i klasifikacija razmjetaja. Skup sadri n elemenata. Ako se u niz rasporede svi elementi skupa, radi se o permutacijama. Kada su elementi u nizu meusobno razliiti, broj moguih rasporeda n elemenata rauna se pomou permutacija bez ponavljanja. Skup od n elemenata moe imati grupe jednakih elemenata r1, r2,..., rk (gdje je r1+r2+...+rk=n). Ako skup od n elemenata sadri r jednakih elemenata, tada se mogui naini rasporeda svih elemenata skupa raunaju pomou permutacija s ponavljanjem. Kod varijacija se iz skupa od n elemenata bira njih r, jer u nizu ima r praznih mjesta. Broj varijacija rtog razreda od n razliitih elemenata rauna se pomou varijacija bez ponavljanja. Ako se elementi u skupu ponavljaju, tada se mogui naini razmjetaja r elemenata od ukupno n elemenata raunaju pomou varijacija s ponavljanjem. Kod varijacija je bitan redoslijed rasporeivanja elemenata na slobodna mjesta u nizu. Kod kombinacija se iz skupa od n elemenata bira njih r, ali nije vaan poredak elemenata unutar niza. Ako niz mora sadravati razliite elemente, radi se o kombinacijama bez ponavljanja. Ako se elementi smiju ponavljati, broj moguih poredaka elemenata rauna se pomou kombinacija s ponavljanjem.

8. Vjerojatnost
Vjerojatnost, sluajna varijabla i distribucije vjerojatnosti temeljni su pojmovi inferencijalne statistike. Pri definiranju vjerojatnosti polazi se od pojma sluajnog pokusa te sluajnog dogaaja. Sluajni pokus je svaki pokus za koji se mogu odrediti svi mogui ishodi. Kod sluajnog pokusa ishodi se ne mogu predvidjeti sa sigurnou, a pokus se u definiranim uvjetima moe ponavljati. Rezultat pokusa je dogaaj ili ishod. Dogaaji se oznaavaju velikim slovima A, B... Siguran dogaaj je dogaaj koji e se dogoditi u svakom ponavljanju pokusa, tj. onaj koji e uvijek nastati. Nemogu dogaaj se nikada ne dogodi tj. ne moe nastati. Ostali dogaaji su sluajni dogaaji, tj. oni se mogu ili ne moraju dogoditi. Vjerojatnost je brojana mjera nastanka sluajnih dogaaja. Vjerojatnost nastanka dogaaja A oznaka P(A) je mogunost da e se dogaaj A dogoditi. Vjerojatnost nekog dogaaja moe poprimiti vrijednosti izmeu 0 i 1, tj. 0 P(A) 1. Vjerojatnost nastanka nemogueg dogaaja jednaka je 0, a vjerojatnost sigurnog dogaaja je 1. Klasina definicija ili vjerojatnost a priori: polazi se od pretpostavke da su svi dogaaji (ishodi) sluajnog pokusa jednako mogui. Tada je vjerojatnost nastanka dogaaja A jednaka omjeru broja za njega povoljnih ishoda (m) i ukupnog broja ishoda (n). Statistika definicija ili vjerojatnost a posteriori: vjerojatnost dogaaja odreuje se naknadno, promatranjem ponaanja relativnih frekvencija povoljnog ishoda dogaaja A, ako se broj ponavljanja pokusa poveava u beskonanost. Statistika se vjerojatnost aproksimira relativnom frekvencijom tj. omjerom apsolutne frekvencije (nA) i opsega statistikog skupa (n).

Tri aksioma vjerojatnosti (Kolmogorov, 1933.): (1) Vjerojatnost sluajnog dogaaja je nenegativna funkcija: P(A) 0. (2) Vjerojatnost je aditivna funkcija, tj. vjerojatnost dva meusobno iskljuiva dogaaja jednaka je zbroju njihovih vjerojatnosti: P(AB) = P(A) + P(B). (3) Vjerojatnost je normirana funkcija, tj. vjerojatnost sigurnog dogaaja jednaka je 1: P() = 1. Vjerojatnost da se dogaaj A nee dogoditi zove se suprotna vjerojatnost - Q(A). Zbroj vjerojatnosti i suprotne vjerojatnosti nekog dogaaja jednaka je 1, tj. P(A)+Q(A)=1. Zbrajanje vjerojatnosti (vjerojatnost ili-ili i ekskluzivnom smislu): ako su A i B dva meusobno iskljuiva dogaaja, vjerojatnost da e nastupiti dogaaj A ili dogaaj B (ali ne oba) jednaka je zbroju njihovih vjerojatnosti. Mnoenje vjerojatnosti (vjerojatnost i-i): pretpostavlja se da se dogaaji A i B meusobno ne iskljuuju, to znai da se mogu istovremeno dogoditi. Dogaaji A i B su nezavisni ako je vjerojatnost da e se dogoditi dogaaj A i dogaaj B jednaka produktu njihovih vjerojatnosti. Vjerojatnost da e se dogoditi dogaaj A ili dogaaj B ili oba dogaaja zove se vjerojatnost barem jedan. Vjerojatnost da e se dogoditi barem jedan od dogaaja A ili B je suprotna vjerojatnost da se nee dogoditi niti jedan od dogaaja A ili B. Vjerojatnost samo jedan: neka su dogaaji A i B nezavisni i poznate su vjerojatnosti da e se ti dogaaji dogoditi P(A) i P(B). Vjerojatnost da e se dogoditi samo jedan od ta dva dogaaja je suma vjerojatnosti dvaju sloenih dogaaja. Vjerojatnost da e se dogoditi dogaaj A, uz uvjet da se dogodio dogaaj B, zove se uvjetna vjerojatnost.

9. Teorijske distribucije
Distribucije koje su formirane grupiranjem opaanja ili elemenata skupa prema nekom obiljeju, zovu se originalne, empirijske ili opaene distribucije. Distribucije koje se mogu oekivati u skladu s naim iskustvom ili na temelju nekih teorijskih postavki zovu se teorijske distribucije. Pretpostavljamo ih u nekom statistikom modelu ili ih postavljamo kao hipotezu koju treba ispitati. Teorijske distribucije zadane su analitiki. Sluajna varijabla je numerika vrijednost obiljeja, a njezino pojavljivanje ovisi o sluaju. Teorijska sluajna varijabla moe poprimiti vrijednosti na brojnom pravcu od - do +. Diskontinuirana (diskretna) sluajna varijabla poprima vrijednosti prirodnih brojeva. Kontinuirana sluajna varijabla moe poprimiti i bilo koju vrijednost u intervalu od jednog do drugog cijelog broja. Kontinuirane teorijske distribucije: (1) Normalna ili Gaussova distribucija (2) Studentova ili t-distribucija (3) Gama distribucija ( 2-test). Diskontinuirane teorijske distribucije: (1) Binomna distribucija (2) Poissonova distribucija (3) Hipergeometrijska distribucija. Svaka teorijska distribucija ima svoj zakon vjerojatnosti po kojem su distribuirane tekue vrijednosti sluajne varijable X. Osim funkcije vjerojatnosti, te distribucije imaju: oekivanje (Ex), varijancu (Vx), koeficijent asimetrije (3) i koeficijent zaobljenosti (4).

Binomna distribucija
Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed utvrena i konstantna tijekom cijelog istraivanja (iznosi p), kae se da se diskontinuirana sluajna varijabla X ravna prema tzv. binomnoj distribuciji B(n; p).

Poissonova distribucija
Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed utvrena, konstantna i jako mala tijekom cijelog istraivanja (iznosi p), te broj pokusa tei u beskonanost (n) umjesto binomne distribucije, koristi se Poissonova distribucija P( ). U praksi se Poissonova distribucija koristi ako je n 50 i p 0,10. Ova distribucija je definirana za rijetke dogaaje, odnosno za one dogaaje koji imaju veliki uzorak i malu vjerojatnost.

Normalna (Gaussova) distribucija


Normalna distribucija je odreena parametrima (oekivanje) i 2 (varijanca) - N(; 2). Ona je simetrina (3=0), unimodalna i ima oblik zvona. Normalno je zaobljena (4=0). Na sredini distribucije u istoj toki nalaze se mjere centralne tendencije: aritmetika sredina, medijan i mod. Kod binomne distribucije ako je p=q, a n, binomna distribucija tei normalnoj distribuciji. Standardizirana ili jedinina normalna distribucija ima oekivanje 0 i varijancu 1.

10. Metoda uzorka: procjena parametara osnovnog skupa


Metoda uzorka ili reprezentativna metoda je metoda kojom se pomou uzorka procjenjuju karakteristike osnovnog skupa, te se odreuje pouzdanost i preciznost te procjene. Dvije su osnovne zadae metode uzoraka: (1) procjenjivanje nepoznatih parametara osnovnog skupa na temelju uzorka (2) testiranje pretpostavki (hipoteza) o parametrima i oblicima rasporeda osnovnih skupova. Osnovni skup ili populacija (N) je skup svih jedinica (lanova, elemenata) koje se promatraju, tj. ije se karakteristike istrauju (npr. svi turisti na Opatijskoj rivijeri, svi studenti na odabranom fakultetu). Osnovni skup moe biti konaan (broj elemenata moe se odrediti u trenutku istraivanja) ili beskonaan (broj elemenata u skupu ne moe se odrediti u trenutku istraivanja). Uzorak (n) je dio jedinica (lanova, elemenata) osnovnog skupa. Pomou uzorka se istrauje osnovni skup (npr. ako svi studenti na fakultetu ine osnovni skup, tada uzorak mogu biti studenti prve godine, izvanredni studenti i sl.). Uzorak treba biti reprezentativan. To znai da je po svojim karakteristikama nalik osnovnom skupu, tj. da predstavlja osnovni skup u malom. S obzirom na nain izbora jedinica iz osnovnog skupa razlikuju se: (1) namjerni uzorak (2) sluajni uzorak. Namjerni uzorak ine elementi koje je odabrao istraiva prema vlastitoj odluci. Namjerni uzorci mogu biti prigodni (trenutno dostupni lanovi skupa npr. miljenja kupaca u trgovakom centru) i kvotni (odreeni broj elemenata koji se moraju ispitati; odabir elemenata (kvote) ovisi o anketaru). Sluajni uzorak je uzorak u kojem svaki element osnovnog skupa ima jednaku vjerojatnost biti odabran u uzorak. Na taj se nain moe odabrati reprezentativan uzorak. Razlikujemo jednostavni sluajni uzorak (svaki element ima jednaku vjerojatnost izbora), stratificirani uzorak (odabir elemenata iz pojedinih podgrupa (stratuma) osnovnog skupa) i sistematski uzorak (odabir svakog ntog elementa s popisa ureenog po abecedi).

Na koeficijent pouzdanosti (t) utjee veliina uzorka i postotak pouzdanosti (odreuje ga istraiva). S obzirom na veliinu, razlikujemo velike uzorke (vie od 30 elemenata) i male uzorke (manje od 30 elemenata). n>30 : - kod 95% pouzdanosti: t = 1,96 - kod 99% pouzdanosti: t = 2,58 n30 : raunaju se stupnjevi slobode formula: k = n 1; Koeficijent pouzdanosti (t) odredi se pomou tablice Vrijednosti t za Studentovu razdiobu. Frakcija izbora (f) je odnos veliine uzorka i veliine osnovnog skupa. Pomou nje se odreuje veliina uzorka u odnosu na populaciju. Vrijednost frakcije izbora utjee na izraunavanje standardne greke procjene. Faktor korekcije koristi se kod izraunavanja standardne greke procjene ako je frakcija izbora (f) vea od 0,05. U tom sluaju se formula za standardnu greku mnoi faktorom korekcije.

Procjena aritmetike sredine osnovnog skupa pomou uzorka


Interval procjene aritmetike sredine koristi se kod procjene prosjene veliine promatranog osnovnog skupa. Primjer: procjena prosjenih mjesenih prihoda; procjena prosjene izvanpansionske potronje turista; procjena prosjenog broja zaposlenih u malim poduzeima itd.

Procjena totala osnovnog skupa pomou uzorka


Interval procjene totala koristi se kod procjene ukupne vrijednosti promatranog osnovnog skupa. Primjer: procjena ukupnog vremena potrebnog za izradu nekog proizvoda; procjena ukupne potronje turista... Total je zbroj svih vrijednosti numerikog obiljeja.

Procjena proporcije osnovnog skupa pomou uzorka


Interval procjene proporcije koristi se kod procjene postotka elemenata s traenim obiljejem u promatranom osnovnom skupu. Primjer: procjena biraa kandidata A na izborima; procjena neispravnih proizvoda u poiljci; procjena zadovoljnih studenata nainom izvoenja nastave itd. Proporcija je omjer broja elemenata s odreenim (traenim) oblikom obiljeja i ukupnog broja elemenata.

11. Korelacijska i regresijska analiza


Regresijska analiza se sastoji u primjeni metoda kojima se analitiki (jednadbom) objanjava statistika veza izmeu promatranih pojava. U okviru regresijske analize istrauje se uzronoposljedini karakter veze. Modelom jednostavne linearne regresije analitiki se izraava odnos izmeu dviju pojava (zavisna i nezavisna varijabla). Karakteristika ovog modela je da promjenu jedne pojave prati priblino jednaka linearna promjena druge pojave. Analiza jednostavne linearne regresije sastoji se u utvrivanju jednadbe regresijskog pravca i pripadajuih mu parametara (odreuju se dva pravca, jedan za zavisnu, drugi za nezavisnu varijablu). Korelacijska analiza sastoji se u primjeni metoda kojima se utvruje stupanj (jakost i smjer) povezanosti izmeu promatranih pojava. Korelacija moe biti pozitivna (porast/pad jedne pojave prati porast/pad druge pojave) ili negativna (porast jedne pojave prati pad druge pojave i obrnuto). Korelacijska analiza ukljuuje grafiki prikaz (dijagram rasipanja) i utvrivanje brojanog pokazatelja jakosti i smjera veze izmeu varijabli (koeficijent korelacije).

Dijagram rasipanja ili oblak rasprenosti je grafiki prikaz pomou kojeg se uoava priroda odnosa izmeu promatranih pojava. Sastoji se od toaka koje su odreene parovima vrijednosti varijabli X i Y. Koeficijent korelacije je brojani pokazatelj stupnja statistike povezanosti meu pojavama. Koeficijent korelacije moe poprimiti vrijednosti iz intervala od -1 do +1. Predznak pokazuje smjer (pozitivna ili negativna veza), a veliina koeficijenta pokazuje jakost veze (jaka, slaba, srednja, potpuna). Koeficijent linearne korelacije (Pearsonov koeficijent linearne korelacije) (r) je brojana mjera kojom se mjeri jakost i smjer povezanosti dviju pojava koje su u linearnom statistikom odnosu. Stupanj povezanosti izmeu pojava koje su izraene modalitetima redoslijednog obiljeja (npr. ocjena, broj bodova) mjeri se koeficijentom korelacije ranga. Spearmanov koeficijent korelacije ranga (rs) izraunava se kod ispitivanja korelacije dviju varijabli ranga.

12. Osnovna analiza vremenskih nizova


Vremenski niz je skup kronoloki ureenih vrijednosti neke pojave. Razlikujemo dvije vrste vremenskih nizova: (1) intervalni vremenski niz (2) trenutani vremenski niz. Vrijednosti lanova (frekvencije) intervalnog vremenskog niza nastaju zbrajanjem vrijednosti pojave po vremenskim intervalima. Interval promatranja moe biti dan, tjedan, mjesec, godina itd. Primjer intervalnog vremenskog niza: broj registriranih osobnih automobila u RH u razdoblju od 2000. do 2006. godine; broj posjeta odabranoj web-stranici po mjesecima u 2006. godini; prosjene dnevne temperature u primorskim gradovima po mjesecima. Vrijednosti lanova (frekvencije) trenutanog vremenskog niza nastaju promatranjem pojave u odreenom trenutku. Primjer trenutanog vremenskog niza: korisnici internet bankarstva u razdoblju od 2001. do 2006. godine (stanje krajem godine); broj stanovnika po odabranim upanijama u RH (stanje-popis 2001.); dolasci turista prema zemlji podrijetla (stanje 31.5.2006.). Vremenski se nizovi grafiki prikazuju povrinskim i linijskim grafikonima. Povrinski grafikon VN crta se kao i histogram (meusobno spojeni stupci jednakih osnovica). Linijski grafikon VN nastaje spajanjem toaka ucrtanih u pravokutni koordinatni sustav. Indeksi vremenskog niza su relativni brojevi koji izraavaju odnos stanja jedne pojave ili skupine pojava u razliitim razdobljima ili vremenskim tokama. Razlikujemo dvije vrste indeksa: (1) individualni indeksi (2) skupni indeksi. Individualni indeksi su relativni pokazatelji dinamike kretanja vrijednosti pojave vremenskog niza. Javljaju se u dva oblika: (1) verini indeksi (Vt): pokazuju relativne promjene pojave u tekuem razdoblju u odnosu na prethodno razdoblje (2) bazni indeksi ili indeksi na stalnoj bazi (It): pokazuju relativne promjene pojave u tekuem razdoblju u odnosu na bazno razdoblje. Stopa promjene (st) je relativna promjena vrijednosti neke pojave u tekuem razdoblju u odnosu na odabrano razdoblje. Skupni indeksi su relativni brojevi koji slue za istodobno praenje razvoja u vremenu dviju ili vie pojava. Osnovne vrste skupnih indeksa su skupni indeks cijena, skupni indeks koliina i skupni indeks vrijednosti.

10

Trend je dinamina srednja vrijednost koja pokazuje opu tendenciju kretanja pojave u vremenu. Razlikujemo sljedee vrste trendova: (1) linearni trend (2) parabolian trend (3) eksponencijalni trend. Model linearnog trenda objanjava linearno kretanje vrijednosti promatranog vremenskog niza kroz vrijeme. Grafiki se prikazuje linijskim grafikonom.

Preuzeto iz: Markovi, S., Raspor, S., Statistika Prirunik, Veleuilite u Rijeci, 2008.

11

You might also like