You are on page 1of 10

STATISTIKA

je znanstvena disciplina koja na organiziran nain pristupa


prikupljanju, selekciji, grupiranju, prezentaciji i analizi informacija ili podataka
masovnih pojava, te interpretiranju rezultata provedene analize.
Poznavanje statistike potrebno je:
-

zbog praenja strune i znanstvene literature


pri obradi rezultata, prikupljenih istraivanjem ili eksperimentom, radi
deskripcije i analize tih rezultata
radi zakljuivanja iz konkretnog sluaja na opi zakon
pri planiranju istraivanja i eksperimenata

Izvori podataka mogu biti primarni i sekundarni. Primarni podaci su novi,


neposredno prikupljeni podaci za potrebe nekog istraivanja. Najee nisu
praktini za izravno koritenje. Sekundarni podaci su gotove, istraene i
objavljene informacije specijaliziranih institucija (DZS, NY Stock Exchange,
Statistika moe biti:
Deskriptivna - Zadaa joj je da opie rezultate dobivene nekim istraivanjem,
da ih sredi i same kako bi bili pregledniji i razumljiviji za daljnju analizu. Tj. koristi
brojane i grafike metode kako bi opisala populaciju.
Inferencijalna - Na temelju rezultata dobivenih na dijelu (uzorku) statistikog
skupa ili populacije zakljuujemo o karakteristikama cijelog statistikog skupa.
Faze statistike djelatnosti:
1. Statistiko promatranje faza prikupljanja informacija o statistikim
jedinicama promatrane statistike mase.
2. Grupiranje (klasifikacija) - faza grupiranja prema jednom ili vie odabranih
obiljeja, rezultat su statistiki podaci. Statistiki podatak je obraena
informacija koja predstavlja broj statistikih jedinica (frekvenciju) koja
pripada pojedinom obiljeju.
3. Statistika analiza faza u kojoj se na dobivene podatke primjenjuju
odgovarajue metode da bi odredili znaajke tih pojava.
Statistiki skup je skup podataka iji su elementi (objekti,osobe,pojave) predmet
statistike analize. S obzirom na broj elemenata moe biti konaan i
beskonaan.
-

tvore ga statistike jedinice koje imaju slina zajednika svojstva


mora biti precizno definiran pojmovno (npr.redoviti studenti), prostorno
(redoviti studenti 1.god. Veleuilita u ibeniku) i vremenski (intervalni
broj studenata u akademskoj godini 2009/2010, trenutani broj studenata
na dan 30.10.2010.)

Obiljeja (varijable) su svojstva po kojima su jedinice statistikog skupa


meusobno sline ili po kojima se razlikuju (npr. spol, godine, visina, ocjene).
Svako se obiljeje (varijabla) javlja u vie modaliteta (npr. Spol ima dva
modaliteta, mukarci i ene).
1

Varijable mogu biti kvalitativne i kvantitativne, a njihova svojstva se mjere prema


odreenim pravilima koja su dana mjernim skalama.

Vrste obiljeja (razine mjerenja):


-

Nominalna:
o Atributivna (npr. vrsta proizvoda, proizvoa, boja proizvoda,
zanimanje),
o Zemljopisna (npr. mjesto roenja, podruje prodaje, sjedite firme)
- Redosljedna ili ordinalna (npr. ocjena razvijenosti zemlje, struna
sprema)
- Intervalna (npr. temperaturne skale, Likertova skala)
- Numerika ili omjerna:
o Diskretna (npr. broj proizvedenih komada, broj vrata na automobilu,
broj reklamacija, navrene godine ivota)
o Kontinuirana (npr. starost, visina, teina, cijene)
Statistikim nizom zovemo niz frekvencija koje nastaju grupiranjem s obzirom na
njihova svojstva u statistikom skupu.
Vrste nizova:
o
o

nominalni, ordinalni, numeriki i intervalni


negrupirani (podatci su zapisani redoslijedom kako su prikupljeni),
grupirani (podaci se prikazuju u tablicama distribucije frekvencija)

Veliina razreda (i) jednaka je razlici gornje i donje granice tog razreda. Razredi su
u pravilu zatvoreni tj.imaju donju i gornju granicu. No, postoje i otvoreni, za
potrebe analize nedostajue granice se moraju procijeniti i te vrijednosti
stavljamo u zagrade.
Ako su veliine razreda meusobno razliite, moramo korigirati frekvencije.
Veliina najmanjeg razreda se oznai kao jedinina (njezina fi se prepisuje), te se
sve veliine drugih razreda podijela s tom. Frekvencije se obavezno korigiraju pri
crtanju poligona frekvencija (linijski graf) i histograma te pri izraunavanju Mo.
Kumulativni niz (emprijska funkcija distribucije) nastaje postupnim zbrajanjem
originalnih frekvencija. Moe se formirati prema dolje i prema gore. Treba
nam za izraun nekih srednjih vrijednosti i za grafiko prikazivanje distribucije
frekvencija.
Tabelarni prikaz statistikih podataka:
Jednostavne tablice sadre podatke samo jednog obiljeja razliitih modaliteta i
jedan statistiki niz (njihove frekvencije).
Skupne ili sloene tablice su grupirane prema jednom obiljeju razliitih
modaliteta i dva ili vie nizova (npr. obiljeje je kola, modaliteti su osnovna,
srednja i faks; nizovi su koliina uenika i profesora).
Kombinirane statistike tablice sadre jedan statistiki niz promatran prema dva
ili vie obiljeja (npr. obiljeje su akadm. godine studija, a niz prikazuje studente
koji se dijeli na izvanredne i redovite studente).

Svaka tablica mora biti obiljeena brojem i imati naslov, a u biljeci naveden izvor
podataka.

Grafiko prikazivanje statistikih podataka


a) Kartogrami geografske karte na kojima se na razliite naine prikazuje
prostorna rasprostranjenost statistikog skupa. Moe biti nacrtan kao
dijagramska karta, piktogram ili statistika karta)
b) Linijski graf (poligon frekvencija) se koristi za prikazivanje numerikih i
vremenskih nizova. Statistiki niz je prikazan linijama. Moe se nacrtati
temeljem apsolutnih ili relativnih frekvencija. (xi te fi ili fci)
c) Povrinski grafikoni - povrine su upravno razmjerne brojevima koji se tim
ovrinama prikazuju. Jednostavni stupci, razdjeljeni stupci, dvostruki
stupci, strukturni krug, histogram.
Grafiko prikazivanje negrupiranih numerikih nizova:
a) Dijagram toaka (dot dijagram)
b) S-l dijagram (stablo list )
Srednje vrijednosti su sredinje vrijednosti oko kojih se gomilaju podaci,
pa ih zovemo jo i mjere centralne tendencije.
Aritmetika sredina je najvanija, najpoznatija i najvie upotrebljavana srednja
vrijednost. Naziv koji se koristi za aritmetiku sredinu u svakodnevnom ivotu je
prosjekili prosjena vrijednost. Ona predstavlja omjer zbroja svih vrijednosti
numerike varijable i broja njenih vrijednosti.
Razlikuju se jednostavna aritm.sr.(koristi se kada podaci nisu grupirani);
vagana (ponderirana) aritmetika sredina (kada su podaci grupirani, za
distribucije frekvencija); preko odstupanja u jedinicama intervala (za
distribucije).
Kronoloka sredina je specifina po tome to se utvruje sredina za vremenski
trenutani niz te ona nema svoju formu ve rjeavanje zadatka upotrebljava se
formulom za vaganu aritmetiku sredinu.
Harmonijska sredina se definira kao reciprona vrijednost aritmetike sredine
recipronih vrijednosti numerikih obiljeja.
Geometrijska sredina - U analizi vremenskih nizova esto se upotrebljava
geometrijska sredina. U literaturi se susree i pod nazivom prosjeni tempo
rasta ili pada, odnosno prosjena stopa rasta ili pada neke pojave.
Medijan numerika vrijednost koja niz dijeli na dva jednaka dijela, na nain da
polovina elemenata imaju vrijednost numerikog obiljeja jednaku ili manju od
medijana, dok druga polovina ima vrijednost jednaku ili veu od medijana. U
statistikim distribucijama postoji samo jedan medijan i on se nalazi izmeu
najvee i najmanje vrijednosti obiljeja.
Karakteristike medijana:
4

1. postoji samo jedan medijan (kao i u sluaju aritmetike sredine);


2. nalazi se izmeu najmanje i najvee vrijednosti obiljeja u distribuciji;
3. na njegovu vrijednost ne utjeu ekstremne vrijednosti obiljeja u
distribuciji;
4. moe se izraunati bez tekoa u distribucijama s otvorenim razredima,
osim u sluaju kada je medijalni razred otvoren;
5. osobito je primjerena srednja vrijednost u sluaju izrazito asimetrinih
distribucija.
Kvantili su vrijednosti numerikog obiljeja koje niz ureen po veliini dijele na q
jednakih dijelova. Kvantili su kvartili, decili i precentili.
- Kvartili dijele numeriki niz na etiri jednaka dijela. Postoji prvi ili
donji kvartil (Q1) koji dijeli niz u omjeru 1:3, drugi kvartil ili
medijan, te trei ili gornji kvartil (Q3) koji niz dijeli u omjeru 3:1.
- Decili su kvantili koji niz dijele na 10 jednakih dijelova, a ima ih 9.
- Percentili su kvantili koji niz dijele na 100 jednakih dijelova, a ima ih
99. Podaci moraju biti ureeni po veliini.
Mod je vrijednost ili modalitet varijable koji se najee pojavljuje u nizu, tj.
vrijednost obiljeja s najveom frekvencijom. U odnosu na aritmetiku sredinu i
medijan, mod je najmanje osjetljiv na izrazito velike i izrazito male vrijednosti
obiljeja.
S obzirom na mod razlikuju se slijedee distibucije:
a) unimodalna ima samo 1 mod
b) bimodalna ima 2 moda,
c) multimodalna ima vie od 2 moda.
Karakteristike najvanijih srednjih vrijednosti:
Srednja
vrijednost
Aritmetika
sredina
Medijan

Mod

Nain izrauna

Specifinosti

Zbroj svih vrijednosti


podijeljen s brojem podataka
Podatak koji skup ureen po
veliini dijeli na dva jednaka
dijela

Pri izraunu se koriste svi podatci,


osjetljivost na izdvojenice
Ne koriste se svi podatci prilikom
izrauna, neosjetljivost na
izvedenice
Ne mora uope postojati, a
distribucija moe biti i
multimodalna

Vrijednost koja se najvie


puta pojavljuje

Mjere disperzije su vrijednosti numerikog obiljeja koji variraju oko aritmetike


sredine. Ta variranja nazivaju se DISPERZIJA ili RASPRENOST.
Apsolutne mjere
disperzije
Raspon varijacije
Interkvartil
Varijanca
Standardna devijacija

Relativne mjere
disperzije
Koeficijent varijacije
Koeficijent kvartilne
devijacije

Raspon varijacije je najjednostavnija mjera odstupanja, a predstavlja razliku


izmeu najvee i najmanje vrijednosti niza. Rv = x max x min.
-

prednost ove apsolutne mjere disperzije je u njenom jednostavnom


raunanju i interpretaciji
- ne moe se rei da je rije o pouzdanoj mjeri disperzije budui da se
odreuje pomou samo dvije krajnje vrijednosti u nizu
- u sluaju postojanja ekstremno malih i/ili ekstremno velikih vrijednosti
obiljeja, raspon varijacije nije precizna mjera rasprenosti
- preporua se koristiti u mjerenju varijabilnosti cijena, praenju valutnih
teajeva, vrijednosti dionica i sl.
Interkvartil pokazuje raspon varijacije sredinjih 50% jedinica niza, a raunamo
ga kao razliku gornjeg i donjeg kvartila: Iq = Q3 Q1 .
-

nije potpuna mjera disperzije budui da se, kao i raspon varijacije, odreuje
pomou samo dvije vrijednosti
prednost u odnosu na raspon varijacije je to se primjenom ove mjere
disperzije iz razmatranja iskljuuju ekstremne vrijednosti (eliminira se 25%
najmanjih i 25% najveih vrijednosti obiljeja u nizu)

Raspon varijacije i interkvartilni raspon prikazuju se grafiki B-P dijagramom (BoxPlot).


Uz B-P dijagram koji istie pet vrijednosti: poloaj medijana, oba kvartila te
najmanje i najvee vrijednosti, obino se prikazuje tablica tih kljunih pet
pokazatelja, tzv. five number summary
Brojka
Xmin
Q1
Medija
n
Q3
Xmax
Varijanca i standardna devijacija su najee koritene apsolutne mjere
disperzije, a budui da obuhvaaju sve jedinice niza svrstavamo ih u potpune
mjere disperzije.
Varijanca - aritmetika sredina kvadrata odstupanja od aritmetike sredine
skupa tj. prosjeno kvadratno odstupanje od prosjeka.
Standardna devijacija
se definira kao prosjeno odstupanje vrijednosti
numerikog obiljeja od aritmetike sredine.
Koeficijent varijacije predstavlja relativan omjer standardne devijacije i
aritmetike sredine pomnoen sa sto.
- Spada u potpune mjere disperzije
- Izraava se u postotcima
- Omoguava usporedbu disperzije u razliitim skupovima podataka
Koeficijent kvartilne devijacije je omjer interkvartila i zbroja kvartila. Moe
poprimiti vrijednost od 0 do 1. to je koeficijent blii nuli, disperzija je manja i
obrnuto.
- Predstavlja relativnu mjer disperzije srednjih 50% jedinica u nizu.
6

Standardizirano obiljeje - pokazuje za koliko se standardnih devijacija


originalno obiljeje razlikuje od aritmetike sredine. Svojstva standardiziranog
obiljeja:
Aritmetika sredina standardiziranog obiljeja jednaka je nuli,
Standardna devijacija standardiziranog obiljeja jednaka je 1.
Vremenski niz je skup kronoloki ureenih podataka o vrijednosti promatrane
pojave.
1. Intervalni niz nastaje promatranjem pojave u odreenim vremenskim
intervalima (godina, kvartal, mjesec, dan i dr.), podatci se kumulativno
zbrajaju, prikazuju se linijskim ili povrinskim grafikonom.
2. Trenutani niz nastaje promatranjem pojave u odreenom vremenskom
trenutku (npr. stanje na tekuem raunu, broj zaposlenih u poduzeu i dr.),
podatke (fi) nema smisla zbrajati, prikazuju se linijskim grafom
Srednje vrijednosti vremenskih nizova:
Intervalni niz aritmetika i geometrijska sredina
Trenutni niz kronoloka i geometrijska sredina
Metoda relativnih brojeva je vrlo jednostavna i temelji se na osnovnim
matematikim operacijama. U statistikoj se analizi najee primjenjuju:
postotni brojevi, relativni brojevi koordinacije te indeksni brojevi.
Postotni brojevi se primjenjuju kada se eli usporediti udio odreenog dijela u
masi. Pokazuju strukturu odnosno sastav statistikog skupa u stotim dijelovima
cjeline.
Relativni brojevi koordinacije pokazuju odnose frekvencija dvaju statistikih
nizova, grupiranih prema istom obiljeju.
Indeksi vremenskog niza relativni su brojevi koji izraavaju odnos stanja jedne
pojave (individualni indeksi) ili skupine pojava (skupni indeksi) u razliitim
razdobljima ili vremenskim tokama.
Individualni indeksi:
verini (lanani)
- indeksi na stalnoj bazi (bazni indeksi)
Skupni indeksi:
- Indeksi cijene
- Indeksi koliine
- Indeksi vrijednosti
Skupni indeksi su mjere relativne promjene skupine pojava. Uspjeno se koriste
kod izraunavanja indeksa trokova ivota, indeksa cijena na veliko i na malo, kod
postupka deflacioniranja itd.
Verini indeksi (Vt) pokazuju relativne promjene pojave u tekuem razdoblju u
odnosu na prethodno razdoblje. Omjer tekue i prethodne vrijednosti vremenskog
niza nepomnoen sa 100 naziva se koeficijentom dinamike.
Bazni indeksi (It) pokazuju relativne promjene u tekuem razdoblju u odnosu na
neko odabrano bazno razdoblje.
Trend je dinamika srednja vrijednost koja pokazuje tendenciju promjena neke
pojave u zavisnosti od vremena.
Prema obliku funkcije razlikujemo:
- Linearni trend
7

Paraboliki trend
Eksponencijalni trend
Logaritamski trend.

METODE ZA MJERENJE SEZONSKIH UTJECAJA


Sezonski utjecaj moe se izmjeriti brojnim metodama, a najee su:
- metoda grubih sezonskih indeksa,
- metoda postupaka s linearnim trendom i
- metoda verinih indeksa.

Vjerojatnost je brojana mjera nastupa neizvjesnih, odnosno sluajnih dogaaja.


Sluajni dogaaji su oni dogaaji koji se mogu, ali ne moraju dogoditi.
Postoje tri osnovne definicije vjerojatnosti:
- klasina (a priori),
- statistika illi empirijska (a posteriori) i
- subjektivna.
Svi sluajevi vjerojatnosti nalaze se izmeu apsolutne sigurnosti i apsolutne
nemogunosti ( 0p1).
Korelacija je povezanost ili uzajamni odnos izmeu dviju ili vie masovnih
pojava.
Korelacijskom analizom utvrujemo:
postojanje veze meu pojavama (koefi cijent korelacije),
- jainu i smjer veze meu pojavama (koefi cijent korelacije i njegov
predznak),
- za koliko e se vrijednost jedne pojave promijeniti ako se druga promijeni
za jednu jedinicu (parametar b) itd.
Koeficijent linearne korelacije odreuje jakost veze izmeu pojava, a njegov
predznak odreuje smjer. Kree se u intervalu od -1 do 1.
- Kada je vrijednost koeficijenta jednaka 0 onda ne postoji korelacija izmeu
pojava.
- to je vrijednost blia 1 ili -1, linearna povezanost promatranih pojava je
sve jaa.
Negativna vrijednost ukazuje da rast jedne pojave uzrokuje smanjenje
druge, i obratno.
HI2 TEST - Osnovno pitanje na koje nam daje odgovor HI2 test je da li su nastale
razlike izmeu opaanih i teorijskih frekvencija i suvie velike da bi se nalazile
izvan podruja od 0,95, a rjee od 0,99 vrijednosti pripadajuih vrijednosti
analizirane razdiobe.
Metoda uzoraka je dio statistike to na dijelu statistike mase omoguuje
izraunavanje parametara statistike mase. Svaki statistiki skup koji se analizira
sadri tzv. greku mjerenja. Razlikuje se vie metoda izbora uzoraka, a najee
su jednostavni sluajni izbor uzorka s ponavljanjem i bez ponavljanja te
stratificirani uzorak.
Sluajna varijabla je numeriki rezultat sluajnih eksperimenata. Mogu biti
kontinuirane i diskretne.
Distribucija kontinuirane sluajne varijable:
- Uniformna, Normalna, Eksponencijalna
Distribucija diskretne sluajne varijable:
- Binomna
- Poissonova
- Hipergeometrijska
Binomna distribucija:
- postoji n jednakih pokuaja,
- svaki pokus ima dva mogua ishoda (uspjeh/neuspjeh),
9

- vjerojatnost uspjeha jedna je p, a neuspjeha q=1-p


- rezultat svakog dogaaja je neovisan od ostalih
- broj uspjeha p moe biti vrlo malen
- broj pokusa moe biti vrlo velik
- prosjean broj uspjeha moe biti poznat i ne biti velik (7)
Poissonova distribucija se koristi za opis rijetkih dogaaja i kao priblina
vrijednost binomne distribucije .
Karakteristike:
- vjerojatnosti nastupa dogaaja jednake su za svaku mjernu (jednaku)
jedinicu;
- ishodi pokusa u mjernim jedinicama su neovisni
Normalna (Gaussova) distribucija je najpoznatija teorijska distribucija
vjerojatnosti kontinuirane sluajne varijable :
ima iroku primjenu u donoenju poslovnih odluka
- zvonastog je oblika, simetrina
- centar je odreen aritmetikom sredinom (oekivanjem) , rasprenost je
odreena standardnom devijacijom

10

You might also like