Professional Documents
Culture Documents
Biljan Pivac Stambuk Uporaba2
Biljan Pivac Stambuk Uporaba2
+ + + =
=
=
=
N
i
i
N
i
i
N
N
N
i
i
i
Y
X
Y
X
Y
X
Y
X
Y
X
1
1
2
2
1
1
1
. . . (ovdje se moe zakljuiti da je suma
kvocijenta razliita od kvocijenta suma)
5. ( ) = + + + = + + + =
= =
N
i
i N N
N
i
i
X a X X X a aX aX aX aX
1
2 1 2 1
1
. . . . . . , gdje je "a"
konstanta jer ne ovisi o indeksu zbrajanja i.
6. ( ) . . . . . .
1 1 1 1
=
= = = =
N
i
i
N
i
i
N
i
i
N
i
i i i
Z c Y b X a cZ bY aX , gdje su a, b, c,
konstante.
11
Grupiranjem statistikih podataka veliki se broj pojedinanih podataka
razvrstava u manji broj, ovisno o broju grupa obiljeja. Ako se podaci grupiraju
prema modalitetima samo jednog obiljeja, tada je rije o
jednodimenzionalnom grupiranju, a ako se statistiki podaci grupiraju prema
modalitetima dvaju ili vie obiljeja radi se o dvodimenzionalnom i
viedimenzionalnom grupiranju.
Primjer 1.3.2.
Statistiki skup, "studenti I. godine Ekonomskog fakulteta u Rijeci u
Republici Hrvatskoj u akademskoj godini 2007./2008., na dan 30.10.2007.
godine" grupira se prema dva statistika obiljeja: spol i visina.
Rije je o dvodimenzionalnom grupiranju statistikog skupa prema dva
statistika obiljeja.
Grupiranjem elemenata statistikog skupa gube se pojedinane
informacije o njima, stoga pri grupiranju, tj. formiranju, statistikih nizova
istraiva treba biti odgovoran i paljivo voditi rauna o postavljenim ciljevima
istraivanja.
1.3.2. Nizovi kvalitativnih podataka
Kvalitativni statistiki nizovi su nominalni (atributivni i zemljopisni) i
redoslijedni.
Nominalni statistiki nizovi formiraju se grupiranjem elemenata
statistikog skupa prema modalitetima odgovarajueg nominalnog
obiljeja.
Modaliteti nominalnog obiljeja izraavaju se pomou atributa,
kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, prema
veliini apsolutnih frekvencija, dogovorno ili zakonski utvrenim popisima. Na
primjer slubena statistika koristi: SMTK ili Standardnu meunarodnu
trgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju djelatnosti.
Zemljopisni statistiki nizovi formiraju se grupiranjem elemenata
statistikog skupa prema modalitetima odgovarajueg zemljopisnog ili
prostornog obiljeja.
Modaliteti prostornog obiljeja najee odgovaraju teritorijalno-
administrativnoj podjeli odreenog geografskog prostora, na primjer: gradovi,
upanije, regije, drave, kontinenti. Grupe ovog obiljeja mogu biti poredane po
12
abecednom redu, po veliinama apsolutnih frekvencija ili po geografskom
poloaju. Ako se zbog vee preglednosti nekoliko modaliteta stavi zajedno u
grupu "ostalo", ona obino dolazi na kraju statistikog niza.
Geografski statistiki nizovi se vrlo esto pojavljuju u slubenim
statistikim publikacijama. Na primjer, u Statistikom ljetopisu Republike
Hrvatske sadrana je cjelina "Meunarodni pregled" u kojem je prikazan veliki
broj geografskih statistikih nizova prema prostornim obiljejima: drave,
specifine svjetske regije, kontinenti i slino.
Primjer 1.3.3.
Statistiki skup, "Zaposleni u poslovnim subjektima u Republici
Hrvatskoj, stanje 31.03.2007. godine" podijeljen je na grupe prema
prostornom obiljeju, odnosno po "upanijama".
Tablica 1.1.
Modaliteti obiljeja "upanije"
upanije u Republici Hrvatskoj
Zagrebaka upanija
Krapinsko-zagorska upanija
Sisako-moslavaka upanija
Karlovaka upanija
Varadinska upanija
Koprivniko-krievaka upanija
Bjelovarsko-bilogorska upanija
Primorsko-goranska upanija
Liko-senjska upanija
Virovitiko-podravska upanija
Poeko-slavonska upanija
Brodsko-posavska upanija
Zadarska upanija
Osjeko-baranjska upanija
ibensko-kninska upanija
Vukovarsko-srijemska upanija
Splitsko-dalmatinska upanija
Istarska upanija
Dubrovako-neretvanska upanija
Meimurska upanija
Grad Zagreb
Izvor: Statistiki ljetopis Republike Hrvatske, 2008. godine, str. 652.
U tablici 1.1. dani su modaliteti, odnosno grupe prostornog ili zemljopisnog
obiljeja "upanije u Republici Hrvatskoj". Ovo obiljeje ima 21 modalitet.
Redoslijedni statistiki nizovi formiraju se grupiranjem elemenata
statistikog skupa prema modalitetima odgovarajueg redoslijednog
obiljeja.
13
Grupiranje podataka statistikog skupa prema redoslijednom obiljeju
vri se slino kao kod nominalnih obiljeja, ali je redoslijed grupa ovdje
odreen rangom koji pojedina grupa obiljeja predstavlja. Rangiranje se moe
vriti polazei od najnieg ranga prema najviem ili obrnuto.
Primjer 1.3.4.
Statistiki skup, "Diplomirani studenti Ekonomskog fakulteta u Rijeci
akademske godine 2007./2008." prema obiljeju "prosjeni uspjeh tijekom
studiranja" podijeljen je na grupe prema redoslijednom obiljeju.
Tablica 1.2.
Modaliteti obiljeja "prosjean uspjeh tijekom studiranja"
Prosjean uspjeh
dovoljan
dobar
vrlo dobar
odlian
Izvor: Knjiga matine evidencije Ekonomskog fakulteta u Rijeci 2007./2008. godine
U tablici 1.2. dane su grupe, odnosno modaliteti redoslijednog obiljeja
"prosjean uspjeh tijekom studiranja" od najnieg prema najviem rangu. Ovim
grupama obuhvaeni su svi pojavni oblici promatranog obiljeja.
1.3.3. Tabeliranje
Tabeliranje je postupak svrstavanja grupiranih prikupljenih
statistikih podataka u tablice.
Statistike tablice kao jedan od oblika prikazivanja statistikih
podataka prisutne su u literaturi svuda oko nas.
Tablica nastaje crtanjem okomitih i vodoravnih linija prema odreenim
pravilima. Svaka statistika tablica mora imati: naslov, broj tablice (ako ih
ima vie), tekstualni dio, numeriki ili brojani dio i izvor podataka.
14
Tablica 1.3.
Naslov tablice
Zaglavlje
Oznake
stupca
Zbirni
stupac:
=
n
j 1
0 1 2 n
Oznake redak
retka stu-
pac polje
Pred
stu-
pac
polje
Zbirni redak:
=
m
i 1
Izvor podataka
Tablica 1.3. prikazuje opi oblik statistike tablice.
Naslov tablice mora biti jasan i kratak, a istovremeno u sebi mora
sadravati pojmovnu, prostornu i vremensku definiciju statistikog skupa, da bi
onaj tko je ita mogao precizno odrediti njezine elemente.
Tekstualni dio statistike tablice sastoji se od dva dijela: zaglavlja i
predstupca. U zaglavlju ili tumau stupaca opisuje se i objanjava sadraj
stupaca. U predstupcu ili tumau redaka opisuje se i objanjava sadraj redaka.
To su najee oblici statistikog obiljeja po kojemu je promatran statistiki
niz. Uz tekstualni dio svaki stupac moe biti oznaen i odgovarajuim brojem.
Kako se vidi u tablici 1.3., predstupac se esto oznaava s nulom, a numeriranje
dalje ide po redu: 1, 2, , n.
Brojani ili numeriki dio tablice sastoji se od polja u koja se unose
frekvencije, odnosno rezultati grupiranja statistikih podataka. Zbirni ili
marginalni stupac sadri zbrojeve pojedinih redaka. Njegova suma
=
n
j 1
zbraja
elemente svakog retka po j - stupcima. Zbirni ili marginalni redak sadri
zbrojeve pojedinih stupaca. Njegova suma
=
m
i 1
zbraja elemente svakog stupca
po i - redcima.
Izvor podataka se navodi ispod tablice. On omoguuje provjeru
ispravnosti prikupljenih podataka u tablici kao i eventualnu dopunu podataka,
naravno, ako to zahtjeva statistiko istraivanje.
Zbog vee preglednosti tablice, esto se zaglavlje, predstupac, zbirni
redak i zbirni stupac odvajaju debljim crtama od brojanog dijela, kao to se
moe vidjeti u tablici 1.3..
15
Dakle, statistika tablica mora potivati 3 naela: preglednost,
potpunost i jasnou.
U skladu s tim naelima pri sastavljanju tablice treba voditi rauna o
tome da ona sadri to manje redaka i stupaca. Pri upisivanju brojanih
podataka, kod decimalnih brojeva potrebno je smanjiti decimalna mjesta, a kod
velikih brojeva odvojiti svake 3 znamenke poevi od decimalnog zareza u
lijevo (tisue, milijune, ...). U tablici treba biti popunjeno svako polje, da onaj
koji je ita ne bi bio u dilemi je li neki podatak moda zaboravljen. U
statistikim publikacijama postoje posebne oznake za neke kategorije posebnih
ili nedostupnih podataka:
* ispravljen podatak
- nema pojave
ne raspolae se podatkom
() nepotpun, odnosno nedovoljno provjeren podatak
0 podatak je manji od 0,5 upotrijebljene jedinice mjere
0,0 podatak je manji od 0,05 upotrijebljene jedinice mjere
1)
oznaka za napomenu ispod tablice
Ovi znakovi upotrebljavaju se i u izvjeima i publikacijama Dravnog
zavoda za statistiku Republike Hrvatske (Stat. ljetop. Repub. Hrvat. 2008., str.
33).
Statistike tablice mogu se podijeliti na:
1) ope ili izvjetajne statistike tablice i
2) analitike ili sumarne statistike tablice.
Ope statistike tablice prikazuju ogroman broj statistikih podataka o
nekome promatranom statistikom skupu.
Analitike statistike tablice se konstruiraju za neku posebnu analizu i
one su u pravilu preglednije.
U ovisnosti o tome prikazuju li se prikupljeni statistiki podaci u tablici
prema jednom ili vie statistikih obiljeja i prikazuje li se jedan ili vie
statistikih skupova razlikuju se:
1) jednostavne statistike tablice i
2) sloene statistike tablice koje se mogu podijeliti na:
skupne statistike tablice, i
kombinirane statistike tablice.
16
Jednostavne statistike tablice prikazuju jedan statistiki skup,
grupiran u jedan statistiki niz, prema jednom obiljeju.
Skupne statistike tablice prikazuju dva ili vie statistika skupa,
grupiran u dva ili vie statistika niza prema jednom obiljeju.
Kombinirane statistike tablice prikazuju jedan statistiki skup,
grupiran u dva ili vie statistikih nizova prema dva ili vie obiljeja. Ako kod
kombinirane tablice s dva obiljeja, jedno obiljeje ulazi u tablicu iz predstupca,
a drugo iz zaglavlja za nju se kae da je tablica s dva ulaza. U skladu s tim
postoje kombinirane tablice s vie ulaza, ali pri njihovom kreiranju gubi se
jasnoa i preglednost.
Primjer 1.3.5.
Statistiki skup, "Diplomirani studenti Fakulteta "E" u Rijeci
akademske godine 2007./2008." prema obiljeju "prosjeni uspjeh tijekom
studiranja" podijeljen je na grupe prema redoslijednom obiljeju.
Tablica 1.4.
Diplomirani studenti Fakulteta "E" u Rijeci godine 2007./2008. prema
prosjenom uspjehu tijekom studiranja
Prosjean uspjeh Broj studenata
X
i
f
i
dovoljan 42
dobar 65
vrlo dobar 34
odlian 6
Ukupno:
=
4
1 i
147
Izvor: Knjiga matine evidencije Fakulteta "E" u Rijeci 2007./2008. godine, (simulirani podaci)
U tablici 1.4. prikazan je statistiki skup "Diplomirani studenti Fakulteta "E" u
Rijeci godine 2007./2008." grupiran prema redoslijednom obiljeju "prosjeni
uspjeh tijekom studiranja". U predstupcu su navedene grupe obiljeja. Zaglavlje
opisuje sadraj stupaca. U drugom stupcu su dane apsolutne frekvencije,
odnosno broj elemenata skupa koji pripadaju pojedinoj grupi obiljeja. Suma 2.
stupca je zbroj apsolutnih frekvencija i odgovara opsegu statistikog skupa:
147
4
1
=
= i
i
f . Ovo je primjer jednostavne statistike tablice.
17
1.3.4. Numeriki niz
Grupiranjem elemenata statistikog skupa prema numerikom ili
kvantitativnom obiljeju nastaje numeriki statistiki niz.
Grupiranje i ureivanje elemenata numerikog statistikog skupa ovisi
o broju podataka i o njihovoj vrsti, odnosno o tome radi li se o neprekidnim
(kontinuiranim) ili prekidnim (diskontinuiranim) numerikim statistikim
obiljejima.
Ako numeriko obiljeje moe poprimiti samo mali broj numerikih
vrijednosti, tada svaka vrijednost moe biti posebna grupa u nizu. To je
najee sluaj kod prekidnog ili diskontinuiranog numerikog obiljeja.
Ureen negrupiran prekidni numeriki statistiki niz ima karakteristiku
da su njegove vrijednosti sloene po veliini poevi, najee, od najmanje:
. ..., , 3 , 2 , ; ..., , ,
1 2 1
N i X X X X X
i i N
= <
(1.3.4)
Openito je pojedina vrijednost obiljeja: k i X
i
..., , 2 , 1 , = , a pripadajua
apsolutna frekvencija: k i f
i
..., , 2 , 1 , = .
Skup ureenih parova:
k i f X
i i
..., , 3 , 2 , 1 ), , ( = (1.3.5)
je distribucija frekvencija promatranog prekidnog numerikog obiljeja.
Takoer vrijedi da je suma svih apsolutnih frekvencija jednaka opsegu
statistikog skupa: N f
k
i
i
=
=1
.
Za vrijednosti koje se pojavljuju manje puta formiraju se
zajednike grupe ili "razredi". U razredima se nalaze elementi skupa s
vrijednostima obiljeja koje se nalaze izmeu donje i gornje granice
razreda.
Na taj nain formiranjem razreda postie se vea preglednost, ali se
gubi na preciznosti i potpunosti informacija. U sluaju diskontinuiranog
numerikog obiljeja donja granica slijedeeg (i+1) razreda razlikuje se od
gornje granice prethodnog (i) razreda za jedinicu mjere promatranog
obiljeja.
Ove originalne granice razreda nazivaju se jo i nominalne granice.
Prije provoenja statistike analize potrebno je nominalne granice zamijeniti
preciznim ili pravim granicama. To se najee radi na nain da se donja
granica slijedeeg (i+1) nominalnog razreda umanji, a gornja granica
prethodnog (i) nominalnog razreda uvea za polovinu razlike izmeu tih
granica. Ponekad se precizne granice formiraju jednostavno na nain da se sve
18
gornje granice uveaju za jednu jedinicu obiljeja i tako izjednae sa svojom
sljedeom donjom granicom ili da se sve donje granice umanje za jednu
jedinicu obiljeja i tako izjednae sa svojom prethodnom gornjom granicom.
Kontinuirano ili neprekidno statistiko obiljeje moe poprimiti
vrijednosti iz nekog intervala, pa se njegovi modaliteti formiraju kao razredi.
Skup ureenih parova razreda obiljeja i njima pripadajuih frekvencija
k i f GG X DG
i i i i
..., , 3 , 2 , 1 ), , ( = < (1.3.6)
je distribucija frekvencija promatranog neprekidnog numerikog obiljeja.
U sluaju kontinuiranog numerikog obiljeja donja granica sljedeeg (i+1)
razreda jednaka je gornjoj granici prethodnog (i) razreda, pa ovdje nije
potrebno raunati precizne ili prave granice.
Ako nije definirana najmanja vrijednost obiljeja za neki skup, donja
granica poetnog razreda pri grupiranju moe se ostaviti otvorena. Isto tako
ako nije definirana najvea vrijednost obiljeja za neki skup gornja granica
posljednjeg razreda moe se ostaviti otvorena. Meutim prije poetka same
statistike analize, ove otvorene granice potrebno je zatvoriti takozvanim
procijenjenim granicama, koje se stavljaju u zagrade, jer njima istraiva
procjenjuje da niti jedan element skupa nema vrijednost manju od prve donje ili
veu od zadnje gornje procijenjene granice.
Veliina razreda (i) je razlika izmeu gornje i donje granice
razreda (kada je rije o diskontinuiranom numerikom obiljeju radi se s
preciznim ili pravim granicama).
. ..., , 2 , 1 , k i DG GG i
i i
= = (1.3.7)
Sredina razreda (sredX
i
)
je prosjek, odnosno jednostavna aritmetika
sredina, izmeu donje i gornje granice razreda.:
. ..., , 2 , 1 ,
2
k i
GG DG
sredX
i i
i
=
+
= (1.3.8)
Ako vrijednosti promatranog numerikog niza nisu ravnomjerno
rasporeene, veliine koje se izraunavaju pomou sredine razreda sadre tzv.
greku grupiranja.
Ponekad se u statistikoj analizi statistikih nizova eli utvrditi koliko
elemenata (apsolutno i/ili relativno) promatranog statistikog numerikog niza
ima vrijednost obiljeja manju ili veu od neke vrijednosti. Odgovor na to
pitanje moe se dobiti formiranjem odgovarajuih nizova kumulativnih
apsolutnih i relativnih frekvencija. Postoje:
a) Kumulativni niz apsolutnih frekvencija "manje od"
b) Kumulativni niz apsolutnih frekvencija "vie od"
c) Kumulativni niz relativnih frekvencija "manje od"
19
d) Kumulativni niz relativnih frekvencija "vie od".
Kumulativni niz apsolutnih frekvencija "manje od" dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencija
poevi od prve u nizu prema posljednjoj. Frekvencije kumulativnog niza
apsolutnih frekvencija "manje od" pokazuju koliki broj elemenata promatranog
statistikog skupa ima vrijednost obiljeja manju od gornje granice
pripadajueg razreda.
Kumulativni niz apsolutnih frekvencija "vie od" dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencija
poevi od posljednje u nizu prema prvoj. Frekvencije kumulativnog niza
apsolutnih frekvencija "vie od" pokazuju koliki broj elemenata promatranog
statistikog skupa ima vrijednost obiljeja viu ili jednaku od donje granice
pripadajueg razreda.
Kumulativni niz relativnih frekvencija "manje od" dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija poevi
od prve u nizu prema posljednjoj. Frekvencije kumulativnog niza relativnih
frekvencija "manje od" pokazuju koliki udio (ili postotak ako su izraene u %)
elemenata promatranog statistikog skupa ima vrijednost obiljeja manju od
gornje granice pripadajueg razreda.
Kumulativni niz relativnih frekvencija "vie od" dobije se
postupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija poevi
od posljednje u nizu prema prvoj. Frekvencije kumulativnog niza relativnih
frekvencija "vie od" pokazuju koliki udio (ili postotak ako su izraene u %)
elemenata promatranog statistikog skupa ima vrijednost obiljeja viu ili
jednaku od donje granice pripadajueg razreda.
1.4. Statistika grafika
Uz statistike tablice, pomono sredstvo u analizi statistikih nizova su
grafiki prikazi.
Grafikonima se na jednostavan i pregledan nain uz pomo
razliitih geometrijskih likova prezentiraju osnovne karakteristike
statistikih nizova.
Grafiki prikazi statistikih podataka su pregledniji i razumljiviji u
odnosu na njihovo prikazivanje statistikom tablicom. Grafikoni omoguuju
jednostavnije uoavanje glavnih karakteristika promatranih pojava, ali vrlo
esto ta preglednost ide na tetu preciznosti statistikih informacija. Stoga je
poeljno uz grafiki prikaz prezentirati i tablicu s originalnim vrijednostima
20
statistikog niza. Suvremeni statistiki programski paketi, naravno u skladu sa
statistikom teorijom, imaju mnotvo mogunosti kreiranja grafikih prikaza.
Pomou njih se mogu odabrati razliite boje, oblici i linije na grafikonu, to
omoguuje jo zorniji prikaz promatrane pojave.
Oznake na grafikonu moraju biti takve da onaj tko ita sliku moe jasno
raspoznati koji su elementi i koja je pojava prikana. Stoga i grafikon mora imati
naslov, jedinice mjere promatranog obiljeja, oznake modaliteta obiljeja,
izvor podataka i po potrebi kazalo ili tuma oznaka.
Postoje tri skupine grafikih prikaza:
1) povrinski grafikoni
2) linijski grafikoni
3) kartogrami.
1.4.1. Grafiko prikazivanje kvalitativnih nizova
Nominalni atributivni statistiki nizovi grafiki se prikazuju
povrinskim grafikonima. Povrinski grafikoni mogu biti: jednostavni stupci,
dvostruki i razdijeljeni stupci, strukturni stupci, proporcionalni strukturni
krugovi i polukrugovi. Osim nabrojenih mogu se koristiti i neki drugi
geometrijski likovi (trokuti, kvadrati i slino), raznih veliina i strukture u
skladu s frekvencijama promatranog statistikog niza.
Grafikon ima naslov i izvor podataka, koji odgovara izvoru podataka u
tablici po kojoj je konstruiran. Ako se grafikon nalazi na istoj stranici gdje je i
njegova tablica, na njemu se moe izostaviti izvor podataka.
Pri konstrukciji jednostavnih stupaca na apscisi se oznaavaju svi
modaliteti obiljeja, a na ordinati je skala apsolutnih frekvencija s aritmetikim
mjerilom, dakle s originalnim jedinicama. Jednostavni stupci imaju jednake
baze i jednako su udaljeni jedan od drugog i razlikuju se samo po visini koja
odgovara veliini apsolutnih frekvencija. Stoga vrijedi da je i povrina stupaca
proporcionalna apsolutnim frekvencijama (baza visina).
Dvostruki i razdijeljeni stupci upotrebljavaju se za grafiko
prikazivanje dvaju ili vie statistikih skupova koji su grupirani prema
modalitetima istog obiljeja. I ovdje vrijedi da se na apscisi oznaavaju svi
modaliteti obiljeja, a na ordinati skala apsolutnih frekvencija.
21
Strukturni stupci takoer slue za prikazivanje vie statistikih
skupova podijeljenih na iste grupe prema jednom obiljeju. Oni su jednake
veliine, a razlikuju se po strukturi.
Proporcionalni strukturni krugovi i polukrugovi takoer prikazuju
dva ili vie skupova podijeljena na jednake grupe. Krugovi, odnosno
polukrugovi, mogu biti iste veliine i razlikovati se samo po strukturi, a mogu
biti i razliitih polumjera, tj. proporcionalni veliinama promatranih statistikih
skupova.
Izraz za povrinu kruga je:
2
r P = , a ona je proporcionalna opsegu
skupa, tj. sumi svih apsolutnih frekvencija:
=
n
i
i
f
1
.
U skladu s tim rauna se polumjer ili radijus kruga:
=
=
n
i
i
f
r
1
(1.4.1)
Na taj nain se statistiki skupovi mogu usporeivati po obujmu.
Strukturni krugovi razlikuju se po strukturi koja odgovara frekvencijama
modaliteta obiljeja skupa. Dijelovi strukturnog kruga mogu se izraziti u
postotcima (%) ili u stupnjevima (
0
). Postotci odgovaraju relativnim
frekvencijama:
= =
=
n
i
i
i
i
f
f
cjelina
dio
fr
1
ili %) ( 100 100
1
u
f
f
cjelina
dio
fr
n
i
i
i
i
= =
=
(1.4.2)
Relativne frekvencije imaju svojstva:
a) 1 , 1 0
1
=
=
n
i
i i
fr fr ili
b) 100 , 100 0
1
=
=
n
i
i i
fr fr . (1.4.3)
Stupnjevi strukturnog kruga (S
0
i
) raunaju se:
0
1
0 0
360 360
= =
=
n
i
i
i
i
f
f
cjelina
dio
S (1.4.4)
Ako se konstruiraju strukturni polukrugovi, njegovi se stupnjevi
raunaju prema (1.4.5):
0
1
0 0
180 180
= =
=
n
i
i
i
i
f
f
cjelina
dio
S (1.4.5)
22
Nominalni prostorni statistiki nizovi, uz navedene grafikone, mogu
se prikazivati kartogramima.
Kartogrami su zemljovidi na kojima se na razliite naine
(tokama, geometrijskim likovima, slikama i bojama) prikazuje prostorna
rasprostranjenost elemenata statistikog skupa.
Postoje tri vrste kartograma:
a) dijagramske karte
b) statistike karte
c) piktogrami.
Dijagramske karte crtaju se spajanjem zemljovida i povrinskih
grafikona, na primjer, kvadrata, trokuta, krugova, i slino. Povrinski grafikoni,
odnosno likovi, moraju biti proporcionalni apsolutnim frekvencijama skupa,
ime se izraava intenzitet promatranog obiljeja ili pojave. Likovi se ucrtavaju
unutar granica povrine na zemljovidu koja predoava odgovarajui modalitet
prostornog statistikog obiljeja, ime se izraava prostorna rasprostranjenost
elemenata statistikog skupa. Primjer dijagramske karte:
Grafikon 1.
Europske zemlje prema pretplatnicima
telefona i mobitela na 100 stanovnika
160
80
16
Telefon
Mobitel
Izvor: Human Developmemnt Report, 2003., str. 274.-277.
23
Statistike karte crtaju se tako da se na zemljovidu razliitim bojama
ili sjenanjem po pojedinim dijelovima nekog podruja pokazuje intenzitet neke
pojave koji je najee izraen relativnim brojevima. Primjer statistike karte:
Grafikon 2.
Europske zemlje prema
% ena u parlamentu
35 do 45 (9)
30 do 34 (6)
25 do 29 (2)
20 do 24 (6)
15 do 19 (5)
10 do 14 (7)
3 do 9 (6)
Izvor: Human Developmemnt Report, 2003.god., str. 314.-317.
Piktogrami prostornu rasprostranjenost i intenzitet elemenata
statistikog skupa prikazuju gue ili rjee rasporeenim tokama (ili nekim
drugim znakovima) na odgovarajuem zemljovidu. Primjer piktograma:
24
Grafikon 3.
Europske zemlje prema broju
korisnika Interneta na 100 stanovnika
1 toka = 1korisnik na 100 ljudi
Izvor: Human Developmemnt Report, 2003.god., str. 274.-277.
Redoslijedni statistiki nizovi grafiki se najee prikazuju
jednostavnim stupcima, a u obzir dolaze i ostali povrinski grafikoni
(strukturni stupci, strukturni polukrugovi, krugovi i slino). Primjer
jednostavnih stupaca:
Grafikon 4.
25
Studenti prema ocjenama iz "Statistike"
20.02.2006. god.
0
20
40
Ocjena
S
t
u
d
e
n
t
i
Broj studenata 20 33 50 18 10
1 2 3 4 5
Izvor: Podaci su simulirani.
1.4.2. Grafiko prikazivanje numerikih nizova
Ako je prekidni numeriki statistiki skup negrupiran, moe se
grafiki prikazati pomou dvije vrste grafikona:
a) dijagram s tokama
b) dijagram "stablo-list" (ili "Stem and Leaf" dijagram).
Primjer 1.4.1.
Na podruju "Z" anketiranjem 20 stanova dobiveni su podaci o broju
djece po obitelji na dan 31.12.2008. godine:
2 2 0 3 1 1 0 2 1 4 2 1 1 2 5 0 2 1 2 1
Ovaj skup potrebno je urediti, ali zbog malog broja numerikih vrijednosti nee
se grupirati, ve e se podaci sloiti od najmanjih vrijednosti obiljeja "broj
djece" prema najveima. Dakle vrijednosti obiljeja X
i
su sljedee:
0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 4 5
Zadatak je ovaj negrupirani diskontinuirani numeriki niz prikazati
na dijagramu s tokama:
26
Grafikon 5:
Obitelji na podruju "Z" prema broju djece, stanje 31. 12. 2008. god.
Izvor: Podaci su simulirani.
Dijagram s tokama na grafikonu 10 zorno prikazuje raspored podataka, u
ovom sluaju broj djece, u ovih 10 promatranih obitelji.
Primjer 1.4.2.
U poduzeu "Z" pri donoenju organizacijskih odluka 31.01.2009. god.
izvrena je analiza djelatnika prema navrenim godinama radnog staa. Prema
matinoj evidenciji svakog od 25 zaposlenika dobiveni su sljedei podaci:
2 5 14 1 7 10 2 3 4 5 1 3 10 6 3 2 14 9 12 22 5 25 23 2 18
Skup je potrebno urediti, poevi od najmanjih vrijednosti obiljeja "navrene
godine radnog staa".
1 1 2 2 2 2 3 3 3 4 5 5 5 6 7 9 10 10 12 14 14 18 22 23 25
Zadatak je ovaj negrupirani diskontinuirani numeriki niz prikazati na
grafikonu "stablo-list":
Grafikon 6.
Djelatnici poduzea "Z" prema navrenim godinama radnog staa, stanje
31. 01. 2009. god.
Stablo (Stem) List (Leaf)
0 1 1 2 2 2 2 3 3 3 4 5 5 5 6 7 9
1 0 0 2 4 4 8
2 2 3 5
Izvor: Podaci su simulirani.
Grafikon "stablo-list" nastaje tako da se svaka znamenka podijeli na dva dijela.
Prvi dio predstavlja "stablo", a drugi dio "list". U ovom primjeru znamenke na
mjestu desetica oznaavaju "stablo", dok "list" predstavljaju znamenke na
mjestu jedinica. U prvom retku grafikona 11 prikazano je 16 brojeva i to: 01,
01, 02, 02, 02, , 09. U drugom retku prikazano je 6 podataka: 10, 10, 12, ,
18., a u treem 3 podatka: 22, 23, 25.
Broj djece u obitelji
0 1 2 3 4 5
27
Grupirani numeriki (prekidni i neprekidni) statistiki nizovi,
odnosno njihove distribucije frekvencija grafiki se prikazuju pomou:
a) histograma (povrinski grafikoni)
b) linijski grafikoni ili poligoni frekvencija.
Histogram se konstruira pomou stupaca koji su naslonjeni jedan na
drugi, a njihova visina je proporcionalna s odgovarajuim frekvencijama
numerikog niza. Baze stupaca naslonjene su na os apscisu na kojoj je
aritmetiko mjerilo promatranog obiljeja X.
Pri konstrukciji histograma mogua su dva sluaja. Prvi, kada su
razredi ili grupe promatranog obiljeja jednake veliine, tada su i baze
stupaca grafikona takoer jednake, a visine stupaca su proporcionalne
originalnim apsolutnim frekvencijama. U drugom sluaju, veliine razreda
obiljeja nisu jednake, stoga ni baze stupaca histograma nisu jednake, a za
visinu stupaca potrebno je korigirati originalne apsolutne frekvencije,
dakle izraunati korigirane frekvencije fc
i
.
i
f
fc
i
i
= (1.4.6)
Korigirane frekvencije (1.4.6) su omjer apsolutnih frekvencija i
veliine razreda. Pri tom veliina razreda (i) moe biti originalna, ili toj
veliini proporcionalna vrijednost.
Linijski grafikon ili poligon frekvencija konstruira se spajanjem
sredina vrhova histograma.
Grafiki prikaz kumulativnih nizova jest primjena linijskog
grafikona, tj. poligona kumulativnih frekvencija.
Primjer 1.4.3.
Numeriki niz Zaposleni u trgovakom centru Z prema starosti
prikazan je u tablici 1.5.
Tablica 1.5.
Broj zaposlenih u trgovakom centru Z prema starosti, 2008. god.
Godine starosti
(X
i
)
Broj zaposlenih
(f
i
)
Veliine razreda
(i)
Sredine razreda
(X
i
)
20-25 5 5 22,5
25-30 7 5 27,5
30-35 24 5 32,5
35-40 18 5 37,5
40-45 6 5 42,5
45-50 4 5 47,5
28
50-55 3 5 52,5
Izvor: Podaci su simulirani.
Zadatak je podatke iz tablice 1.5. prikazati grafiki.
S obzirom da su veliine razreda (i) jednake grafiki se prikazuju originalne
frekvencije (f
i
), koje se ucrtavaju iznad sredine razreda:
Grafikon 7.
Broj zaposlenih u trgovakom centru Z prema starosti, 2008. god.
0
5
10
15
20
25
30
22,5 27,5 32,5 37,5 42,5 47,5 52,5
Godine starosti
B
r
o
j
z
a
p
o
s
l
e
n
i
h
Izvor: Podaci su simulirani.
1.5. Relativni brojevi i njihova primjena
Relativni brojevi su neimenovani, stoga se pomou njih mogu
usporeivati i analizirati pojave koje imaju razliitu jedinicu mjere ili
razliit broj elemenata. Na taj nain dobije se relativna vanost dijela ili
cjeline statistikog niza.
Relativni brojevi nastaju dijeljenjem dviju veliina. Veliina s
kojom se dijeli zove se osnova relativnog broja i po njoj se relativni brojevi
meusobno razlikuju.
Openito se relativni brojevi mogu podijeliti na:
a) relativne brojeve strukture
b) relativne brojeve koordinacije
c) indekse (niza kvalitativnih podataka).
Relativni brojevi strukture pokazuju odnos dijela prema cjelini, i
njima se olakava analiza rasporeda podataka prema modalitetima obiljeja u
jednom statistikom nizu, odnosno njihova struktura. Najee se izraavaju u
postotcima, a mogu i u promilima.
29
Ako relativni brojevi strukture (P
i
) pokazuju odnos apsolutnih
frekvencija prema opsegu statistikog skupa (tj. ukupnom broju elemenata
statistikog skupa) tada se zovu relativne frekvencije (fr
i
).
= =
=
n
i
i
i
i i
f
f
fr
cjelina
dio
P
1
; (1.5.1)
%) ( 100 %); ( 100
1
u
f
f
fr u
cjelina
dio
P
n
i
i
i
i i
= =
=
(1.5.2)
.) ( 1000 .); ( 1000
1
prom u
f
f
fr prom u
cjelina
dio
P
n
i
i
i
i i
= =
=
(1.5.3)
Zbroj svih relativnih brojeva u jednom statistikom nizu je 1 ili 100 ili
1000, ovisno o tome na koji je nain relativni broj izraen.
Relativni brojevi strukture grafiki se mogu prikazivati pomou
strukturnih stupaca, strukturnih krugova, polukrugova, ili nekim drugim
geometrijskim likom. Pri tom se konstruiraju geometrijski likovi jednakih
povrina jer je zbroj relativnih frekvencija uvijek isti. Likovi e se razlikovati
samo po strukturi.
Primjer 1.5.1.
Statistiki niz Stanovnitvo RH prema aktivnosti prikazan je u tablici
1.6.
Tablica 1.6.
Stanovnitvo RH prema aktivnosti, popis 2001. god.
Aktivnost Broj stanovnika Postoci
(P
i
)
Aktivno stanovnitvo 1.952.619 44%
Osobe s osobnim prihodom 1.147.554 26%
Uzdravano stanovnitvo 1.337.287 30%
Ukupno 4.437.460 100%
Izvor: www.dzs.hr.
Zadatak je izraunati postotak stanovnitva RH prema aktivnosti i dobivene
relativne brojeve strukture prikazati grafiki strukturnim krugom:
30
Grafikon 8.
Struktura stanovnitva RH prema aktivnosti, popis 2001. god.
Osobe s
osobnim
prihodom
26%
Aktivno
stanovnitvo
44%
Uzdravano
stanovnitvo
30%
Izvor: www.dzs.hr.
Relativni brojevi koordinacije pokazuju odnos dviju pojava ili
frekvencija u razliitim statistikim nizovima koje mogu imati razliitu
jedinicu mjere, a koje ima smisla usporeivati. Na primjer, to je broj
stanovnika po km
2
.
Raunaju se:
i
i
i
B
A
R = , (1.5.4)
gdje je:
A
i
- veliina koja se usporeuje
B
i
- veliina s kojom se A
i
usporeuje.
Grafiki prikaz relativnih brojeva koordinacije je tzv. Varzarov znak.
To su stupci, odnosno pravokutnici, ija baza na apscisi odgovara nazivniku
(B
i
), a visina samom omjeru relativnog broja koordinacije (R
i
). Ako se zna da je
povrina stupca (pravokutnika) baza visina, moe se zakljuiti da povrina
odgovara brojniku (A
i
), tj. veliini koja se usporeuje.
Primjer 1.5.2.
Statistiki nizovi "povrine i stanovnitvo u odabranim zemljama 2001.
godine" prema nominalnom prostornom obiljeju "zemlje", prikazani su u
tablici 1.7.
31
Tablica 1.7.
Povrine i stanovnitvo u odabranim zemljama 2001. godine
Stanovnitvo u
000
Povrina u
km
2
Br.stan./km
2
Zemlje A
i
B
i
R
i
Hrvatska 4437 56594 78,40054
Slovenija 1930 20273 95,20051
Austrija 8151 83871 97,18496
Maarska 10106 93032 108,6293
Bosna i Hercegovina 3922 51197 76,60605
Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godine, str. 743.
Tablica 1.7. prikazuje 2 razliita statistika skupa; povrine i stanovnitvo u
nekim odabranim europskim zemljama. Pomou tih podataka eljela se
prikazati gustoa naseljenosti u tim zemljama, odnosno broj stanovnika po km
2
.
Te vrijednosti su prikazane u posljednjem stupcu tablice. Na primjer, za
Republiku Hrvatsku:
40 , 78
56594
4437000
1
1
1
= = =
B
A
R stan/km
2
Rezultat se moe komentirati: u Republici Hrvatskoj je po km
2
bilo prosjeno
78,40 stanovnika u 2001. godini. Najveu gustou naseljenosti od promatranih
zemalja imala je Maarska (108,63 stan/km
2
), a najniu Bosna i Hercegovina
(76,61 stan/km
2
).
Ovdje je potrebno napomenuti da je stanovnitvo u tablici dano u tisuama,
stoga su kod raunanja za vrijednosti A
i
dodane tisue.
32
Grafikon 9.
Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godine, str. 743.
Pri konstrukciji Varzarovog znaka na grafikonu 9 na apscisi se baza stupca crta
proporcionalno povrinama odabranih zemalja, odnosno nazivniku (B
i
)
relativnog broja koordinacije. U skladu s tim moe se uzeti mjerilo da je
1cm=40000km
2
. Visina stupaca odgovara broju stanovnika po km
2
, tj.
vrijednosti (R
i
). Povrina stupaca je proporcionalna broju stanovnika (A
i
).
Indeksima niza kvalitativnih podataka usporeuje se smjer i
intenzitet varijacija frekvencija nekog statistikog niza s takvim
varijacijama drugog statistikog niza.
Raunaju se tako da se svaki lan promatranog niza stavi u odnos prema
odabranoj bazi koja moe biti jedan od lanova niza ili neka druga zadana
veliina.
100 =
B
f
I
i
i
(1.5.5)
Dakle, prema izrazu (1.5.5), indeksi se raunaju kao omjer frekvencije
promatranog niza i odabrane baze (B).
Grafiki prikaz indeksa kvalitativnih nizova su jednostavni stupci koji
imaju jednake baze jer se ovdje lanovi niza usporeuju uvijek s istom
Zemlje
Povrina i br.st./km
2
za odabrane zemlje, 2001. god.
S
t
a
n
o
v
n
i
k
a
n
a
k
m
2
0
20
40
60
80
100
120
56594 20273 83871 93032 51197
33
veliinom. Specifinost ovog grafikona jest da se stupci naslanjaju na bazu koja
je jednaka 100.
Primjer 1.5.3.
Statistiki niz GDP po stanovniku u zemljama EU i RH prikazan je u
tablici 1.8.
Tablica 1.8.
GDP po stanovniku prema kupovnoj moi (PPP)
u zemljama EU i RH, 2003. god.
Zemlja
(Geonomenklatura EU)
GDP po stanovniku
(PPP US$)
Indeksi
(EU=100)
Belgija (BE) 28.335 119,9
eka (CZ) 16.357 69,2
Danska (DK) 31.465 133,2
Njemaka (GE) 27.756 117,5
Estonija (EE) 13.539 57,3
Grka (EL) 19.954 84,4
panjolska (ES) 22.391 94,8
Francuska (FR) 27.677 117,1
Irska (IE) 37.738 159,7
Italija (IT) 27.119 114,8
Cipar ((CY) 18.776 79,5
Latvija (LV) 10.270 43,5
Litva (LT) 11.702 49,5
Luksemburg (LU) 62.298 263,7
Maarska (HU) 14.584 61,7
Malta (MT) 17.633 74,6
Nizozemska (NL) 29.371 124,3
Austrija (AT) 30.094 127,4
Poljska (PL) 11.379 48,2
Portugal (PT) 18.126 76,7
Slovenija (SI) 19.150 81,0
Slovaka (SK) 13.494 57,1
Finska (FI) 27.619 116,9
vedska (SE) 26.750 113,2
Ujedinjeno Kraljevstvo (UK) 27.147 114,9
EU25
23.629 100,0
Hrvatska (HR) 11.080 46,9
Izvor: Human Development Report, 2005. god., UN, str. 219.-222.; http://epp.eurostat.ec.
Zadatak je izraunati indekse GDP po stanovniku na bazi prosjeka EU i
dobivene indekse prikazati grafiki stupcima:
34
Grafikon 10.
Indeksi GDP po stanovniku prema kupovnoj moi u zemljama EU i RH,
2003. god. (EU=100)
Izvor: Human Development Report, 2005., UN, str. 219.-222.; http://epp.eurostat.ec.
1.6. Programska potpora za statistiku analizu
Prikupljeni statistiki podaci nekom od navedenih metoda predstavljaju
"sirovu" statistiku grau koju je potrebno na odgovarajui nain urediti i
pripremiti za analizu. Danas se statistiki podaci uglavnom obrauju prikladnim
programima za raunalo. Postoje suvremeni statistiki programski paketi koji
omoguavaju, uz vrlo jednostavno rukovanje, unos, pripremu i obradu
prikupljenih statistikih podataka. Primjeri suvremenih statistikih paketa su:
STATISTICA, SAS, SPSS (Statistical Package for the Social Sciences). Oni se
koriste za sloenije statistike analize.
Jedan od najpopularnijih softwarea (programskih jezika) za tabline
proraune u provoenju razliitih aspekata statistike analize je Microsoft
Excel. U podruju programa koji su namijenjeni prvenstveno tablinim
proraunima su Lotus 1-2-3 i QuatroPro, ali upotreba MS Excela je
najrairenija.
40
60
80
100
120
140
160
180
200
220
240
260
280
B
e
l
g
i
j
a
k
a
D
a
n
s
k
a
N
j
e
m
a
k
a
E
s
t
o
n
i
j
a
G
r
k
a
p
a
n
j
o
l
s
k
a
F
r
a
n
c
u
s
k
a
I
r
s
k
a
I
t
a
l
i
j
a
C
i
p
a
r
L
a
t
v
i
j
a
L
i
t
v
a
L
u
k
s
e
m
b
u
r
g
M
a
a
r
s
k
a
M
a
l
t
a
N
i
z
o
z
e
m
s
k
a
A
u
s
t
r
i
j
a
P
o
l
j
s
k
a
P
o
r
t
u
g
a
l
S
l
o
v
e
n
i
j
a
S
l
o
v
a
k
a
F
i
n
s
k
a
v
e
d
s
k
a
U
K
H
r
v
a
t
s
k
a
35
MS Excel je u funkciji svih bitnih faza procesa statistike analize od
formiranja baze podataka, sreivanja i grupiranja podataka, grafikog
prikazivanja statistikih nizova, izrauna temeljnih karakteristika statistikog
niza pa sve do sloenijih statistikih analiza i procedura i analize vremenskih
nizova. Upotrebom statistikih paketa, poevi ve od pripremne faze
statistikog istraivanja, znatno se skrauje i pojednostavljuje vrijeme potrebno
za primjenu statistikih metoda i tehnika. Na taj se nain statistiki postupci
pribliavaju mnogim korisnicima.
Prikupljene statistike podatke potrebno je unijeti i pohraniti u
odgovarajuu datoteku odabranog statistikog paketa. Kada se unose podaci
kvalitativnog ili opisnog karaktera, potrebno je izvriti ifriranje ili kodiranje
vrijednosti takvih obiljeja.
Primjer 1.6.1.
Iz ankete u Primjeru 1.2.1. kodirana su pitanja 3., 7. i 9:
3. Iz kojih ste predmeta pohaali poduke?
a) Matematika
b) Fizika
c) Engleski jezik
d) Hrvatski jezik
e) Ostalo
7. eljeli biste pohaati:
a) Individualne poduke
b) Grupne poduke
c) Svejedno mi je
9. Spol
a) ensko
b) muko
Tablica 1.9.
Kodna lista
OBILJEJE OBLICI OBILJEJA KOD
poduke iz eljenog predmeta(V1) Matematika A
Fizika B
Engleski jezik C
Hrvatski jezik D
Ostalo E
eljena vrsta poduka (V2) Individualne poduke A
Grupne poduke B
Nije bitno C
spol (V3) enski 1
muki 2
U tablici 1.9. vidi se da obiljeje "poduka iz eljenog predmeta" moe poprimiti
5 oblika: Matematika, Fizika, Engleski jezik, Hrvatski jezik i ostalo. Svakom
36
obliku obiljeja dodijeljena je ifra ili kod: A, B, C, D i E. Na taj nain, pri
unosu podataka, umjesto da se ispisuju itave rijei, upisuje se ifra ime se
postie velika uteda vremena.
Kodovi ne moraju biti slova, stoga se kod obiljeja spol za "enski" unosi 1, a
za "muki" 2.
Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja
unesenih podataka u razliitim eljenim varijantama u tablice, to opet ovisi o
vrsti istraivanja i postavljenim ciljevima statistikog istraivanja.
Primjer 1.6.2.
Kodirana pitanja iz Primjera 1.6.1. potrebno je za 10 ispitanika unijeti u
tablicu:
Tablica 1.10.
Tablica s kodiranim podacima:
Ispitanici V1 V2 V3
1 A A 1
2 C A 2
3 A B 1
4 B C 1
5 A A 2
6 A B 1
7 D A 2
8 E C 1
9 B A 2
10 A A 2
U tablici 1.10. vrste statistikih obiljeja smjetene su u stupce. U drugom
stupcu tablice obiljeje V1, prema kodnoj listi u tablici 1, znai "poduke iz
eljenog predmeta". Stupac V2 podrazumijeva "eljenu vrstu poduke", a V3
znai "spol".
Ako se pogledaju podaci za 3 ispitanika u tablici 2, A u stupcu obiljeja V1
(poduke iz eljenog predmeta) znai da taj ispitanik eli poduku iz Matematike.
Oznaka B u stupcu V2 (eljena vrsta poduka) istog ispitanika podrazumijeva da
on preferira grupnu poduku, a njegova oznaka 1 u stupcu V3 (spol) pokazuje da
je taj ispitanik enskog spola.
Takav nain obrade podataka olakava rad s masom statistikih
podataka i omoguava veliku utedu vremena.
Upotreba paketa Statistica u statistikoj analizi prikazana je u Privitku.
37
1.7. Analiza podataka metodama deskriptivne statistike
Kako je ve definirano deskriptivna ili opisna statistika temelji se na
potpunom obuhvatu statistikog skupa, iju masu podataka organizirano
prikuplja, odabire, grupira, prezentira i interpretira dobivene rezultate analize.
Ako se podaci prikupljaju za sve lanove nekog skupa, takovo
promatranje naziva se census. Primjer takvog prikupljanja je popis
stanovnitva.
Prema samoj definiciji statistike, kao posebne znanstvene discipline
koja u svrhu realizacije postavljenih ciljeva istraivanja na organiziran nain
koristi svoje metode i tehnike, mogu se definirati koraci pri statistikom
istraivanju:
1. Definiranje zadatka, cilja i predmeta istraivanja, tj. statistikog skupa
U ovoj poetnoj fazi istraivanja, u skladu s postavljenim ciljem,
definira se statistiki skup, njegove karakteristike ili obiljeja. Donosi se i
odluka hoe li se koristiti primarni ili sekundarni izvori podataka, tj. hoe li se
vriti neposredno promatranje svojstava elemenata statistikog skupa ili e se
pribavljati iz ve postojeih baza podataka.
2. Promatranje i analiza prikupljenih podataka
U ovoj fazi vri se konkretno prikupljanje podataka iz odabranih izvora,
te se ocjenjuje kvaliteta takve "sirove" statistike grae. Nakon toga potrebno je
prikupljene statistike podatke unijeti i pohraniti u odgovarajuu datoteku
odabranog statistikog paketa.
3. Grupiranje, tabelarno i grafiko prikazivanje podataka
U ovom koraku statistikog istraivanja vri se grupiranje prikupljenih
statistikih podataka. Tabelarnim i grafikim prikazivanjem postie se jasnija i
preglednija prezentacija grupiranih podataka. Uz vizualnu prezentaciju
statistikih informacija, tablice i grafikoni slue i kao pomono sredstvo
istraivanja i analize prikupljenih podataka.
4. a Za podatke koji potpuno obuhvaaju statistiki skup koriste se metode
i tehnike deskriptivne ili opisne statistike
U ovoj fazi kada su prikupljeni svi podaci itavog statistikog skupa,
raunaju se apsolutni i relativni pokazatelji odnosa unutar jedne ili vie pojava.
4. b Za podatke koji obuhvaaju dio tj. sluajni uzorak statistikog skupa
koriste se metode i tehnike inferencijalne statistike
Kada se pri statistikom istraivanju raspolae samo podacima iz
uzorka, raunaju se procjene parametara iz itavog osnovnog statistikog skupa
te se vri testiranje hipoteza o tim parametrima.
38
5. Interpretacija rezultata i zakljuci provedene analize
Nakon deskriptivne analize itavog statistikog skupa vri se tumaenje
dobivenih brojanih rezultata i statistikih tablica te se donose zakljuci u
skladu s postavljenim ciljem statistikog istraivanja.
Nakon inferencijalne analize statistikog skupa na bazi uzorka, opet u
skladu s postavljenim ciljevima istraivanja, donosi se izvjee o procijenjenim
parametrima iz itavog osnovnog statistikog skupa i rezultatima postavljenih
hipoteza o tim parametrima.
1.8. Mjere centralne tendencije, disperzije, koncentracije,
asimetrije i zaobljenost
1.8.1. Mjere centralne tendencije
Raunanjem srednjih vrijednosti dolazi se do informacija o
vrijednostima statistikog obiljeja oko kojih se rasporeuju elementi
statistikog niza.
Srednja vrijednost je vrijednost statistikog obiljeja oko koje se
grupiraju podaci statistikog niza. Jo se zove i "mjera centralne
tendencije".
Srednje vrijednosti mogu se podijeliti na:
1. Potpune srednje vrijednosti raunaju se upotrebom svih podataka u
statistikom nizu. Potpune srednje vrijednost su:
a) aritmetika sredina
b) harmonijska sredina
c) geometrijska sredina.
2. Poloajne srednje vrijednosti odreuju se poloajem podataka u nizu.
Najvanije poloajne srednje vrijednosti su :
a) medijan
b) mod.
39
1.8.1.1. Aritmetika sredina
Aritmetika sredina spada u potpune srednje vrijednosti i rauna se
upotrebom svih podataka u statistikom nizu.
Aritmetika sredina je omjer zbroja svih vrijednosti numerikog
obiljeja jednog niza i broja elemenata tog niza.
Ako se radi o negrupiranom statistikom numerikom nizu rauna
se jednostavna aritmetika sredina:
N
X X X
N
X
X
N
N
i
i
+ + +
=
=
=
...
2 1 1
(1.8.1)
Primjer 1.8.1.
Statistiki skup "odabrani studenti II. godine Ekonomskog fakulteta
Rijeka akademske godine 2006./2007." promatrani su prema prekidnom
numerikom obiljeju "zavrna ocjena iz kolegija Statistika"
2
. Dobiveni su
sljedei podaci:
2 3 4 3 2 3 3 5 4 3 3 4 2 3 4
2 3 5 3 3 2 2 4 3 4 3 2 2 3 4
Zadatak je izraunati aritmetiku sredinu.
U izabranom skupu ima 30 studenata. Prosjek se rauna na poznati nain, tako
da se zbroje ocjene svih uenika, te da se njihov zbroj podijeli s brojem koliko
ih ima, odnosno s 30.
1 , 3
30
93
30
4 3 ... 3 4 3 2
1
= =
+ + + + + +
=
=
=
N
X
X
N
i
i
Dakle, prosjena zavrna ocjena iz predmeta Statistika za izabranih 30 studenata
je 3,1.
Ako se radi o grupiranom statistikom numerikom nizu rauna se
sloena, vagana ili ponderirana aritmetika sredina.
Poznato je da apsolutne frekvencije oznaavaju broj elemenata skupa
koji pripadaju odreenom modalitetu promatranog statistikog obiljeja. Iz toga
se moe zakljuiti da je vanost svake vrijednosti obiljeja ovisna o frekvenciji
2
Statistiko obiljeje "zavrna ocjena iz predmeta Statistika" izraava se brojevima, u
ovom sluaju: 2,3,4 i 5, stoga je ovo prekidno numeriko obiljeje, iako se moe svrstati
i u redoslijedna obiljeja jer se elementi skupa (tj. uenici) po njemu mogu rangirati.
40
jer vea frekvencija znai vei udio tog oblika obiljeja u promatranom skupu.
Zato se frekvencija jo naziva teinski faktor ili ponder kod grupiranih nizova.
Vagana ili ponderirana aritmetika sredina rauna se prema
izrazu:
=
+ + +
=
+ + +
+ + +
=
=
=
k
i
i
k
i
i i
k k
k
k k
f
x f
N
x f x f x f
f f f
x f x f x f
X
1
1 2 2 1 1
2 1
2 2 1 1
...
...
...
(1.8.2)
U jednadbi (1.8.2), k predstavlja broj grupa, odnosno modaliteta
promatranog numerikog obiljeja. Nazivnik ovog izraza, kao suma svih
apsolutnih frekvencija, odgovara opsegu statistikog skupa.
S obzirom da su relativne frekvencije upravno proporcionalne
apsolutnim frekvencijama, aritmetika sredina se moe izraunati i pomou
njih:
=
+ + +
+ + +
=
=
=
k
i
i
k
i
i i
k
k k
fr
x fr
fr fr fr
x fr x fr x fr
X
1
1
2 1
2 2 1 1
...
...
(1.8.3)
Nazivnik jednadbe (1.8.3) moe biti 1 ili 100, to ovisi o tome jesu li
relativne frekvencije dane u decimalnom obliku ili u postotcima.
Ako su veliine razreda grupiranog numerikog niza razliite od 1,
za raunanje vagane ili ponderirane aritmetike sredine, potrebno je
izvriti aproksimaciju pomou sredine razreda. Sredina razreda, kako je ve
reeno, dobije se kao jednostavan prosjek donje i gornje granice razreda. Na taj
nain ona predstavlja sve vrijednosti obiljeja koje se javljaju u jednoj grupi.
Stoga je, u ovom sluaju, aritmetika sredina procjena stvarne aritmetike
sredine numerikog niza.
Aritmetika sredina izraava se u originalnim jedinicama mjere
promatranog numerikog obiljeja, obuhvaa sve elemente nekog skupa te se
pomou nje mogu usporeivati nizovi koji su grupirani po jednakom obiljeju.
Uz ove, aritmetika sredina zadovoljava i sljedee kriterije:
a) aritmetika sredina nalazi su izmeu najvee i najmanje vrijednosti
promatranog numerikog obiljeja:
max min
x X x (1.8.4)
b) zbroj odstupanja vrijednosti numerikog obiljeja od aritmetike
sredine u jednoj distribuciji je uvijek nula.
0 ) (
1
=
=
X x
N
i
i
, za negrupirani niz (1.8.5)
41
0 ) (
1
=
=
X x f
i
k
i
i
, za grupirani niz (1.8.6)
c) zbroj kvadrata odstupanja vrijednosti numerikog obiljeja od
aritmetike sredine u jednoj distribuciji je manji ili jednak zbroju
kvadrata odstupanja vrijednosti numerikog obiljeja u istoj distribuciji
od bilo koje druge vrijednosti (a).
2
1
2
1
) ( ) ( a x X x
N
i
i
N
i
i
= =
, za negrupirani niz (1.8.7)
2
1
2
1
) ( ) ( a x f X x f
i
k
i
i i
k
i
i
= =
, za grupirani niz (1.8.8)
Ako neki numeriki niz sadri ekstremno male ili velike vrijednosti
obiljeja, aritmetika sredina kao prosjena vrijednost gubi na svojoj
reprezentativnosti. Taj problem je dodatno izraen kada u distribuciji postoje
razredi s otvorenom donjom, odnosno gornjom granicom obiljeja, i kada nije
mogue te granice objektivno procijeniti.
1.8.1.2. Harmonijska sredina
Harmonijska sredina spada u potpune srednje vrijednosti i rauna
se upotrebom svih podataka u statistikom nizu.
Harmonijska sredina je reciprona vrijednost aritmetike sredine
recipronih vrijednosti numerikog obiljeja u jednom nizu.
Ako se radi o negrupiranom statistikom numerikom nizu rauna
se jednostavna harmonijska sredina:
=
+ + +
=
+ + +
=
=
= =
N
i
i N N
N
i
i
x
N
x x x
N
N
x x x
N
x
H
1
2 1 2 1
1
1 1
...
1 1 1
...
1 1
1
1
1
(1.8.9)
Ako se radi o grupiranom statistikom numerikom nizu rauna se
sloena ili vagana harmonijska sredina:
=
+ + +
+ + +
=
=
=
= =
= =
=
k
i
i
i
k
i
i
k
k
k
i
i
k
i
i
k
k
k
i
i
k
i
i
i
x
f
f
x
f
x
f
x
f
f
f
x
f
x
f
x
f
f
x
f
H
1
1
2
2
1
1
1
1
2
2
1
1
1
1
... ...
1 1
(1.8.10)
42
Ponderi su i ovdje apsolutne frekvencije. Ako su veliine razreda
razliite od 1, i za harmonijsku sredinu se radi aproksimacija na nain da se
raunaju sredine razreda x
i
.
Harmonijska sredina rijetko se primjenjuje u praksi. Specifino
podruje njene primjene je izraunavanje srednjih vrijednosti relativnih
brojeva koordinacije.
Relativni brojevi koordinacije (R
i
) pokazuju odnos dviju pojava
koje ima smisla usporeivati (A
i
i B
i
).
i
i
i
B
A
R = (1.8.11)
Openito srednja vrijednost relativnih brojeva koordinacije je
omjer zbroja svih vrijednosti veliine koja se usporeuje (
=
k
i
i
A
1
) i zbroja
svih vrijednosti veliine s kojom se usporeuje veliina iz brojnika (
=
k
i
i
B
1
):
=
=
=
k
i
i
k
i
i
B
A
R
1
1
(1.8.12)
Ponekad u konkretnom statistikom istraivanju nisu dostupni podaci
o veliinama sadranim u relativnom broju koordinacije, stoga su pri
izraunavanju njegove srednje vrijednosti mogue 3 situacije:
a) ako su dostupni podaci o relativnom broju koordinacije (R
i
) i o veliini
s kojom se usporeuje veliina iz brojnika (B
i
), srednja vrijednost ( R )
izraunat e se pomou izraza za sloenu ili vaganu aritmetiku
sredinu:
=
=
=
k
i
i
k
i
i i
B
B R
R
1
1
(1.8.13)
Na temelju osnovne relacije (1.8.12) jasno je da vrijedi, da je veliina iz
brojnika:
i
k
i
i
k
i
i
B R A =
= = 1 1
. Ponderi su ovdje vrijednosti veliine s kojom se
usporeuje veliina iz brojnika: B
i
b) ako su dostupni podaci o relativnom broju koordinacije (R
i
), bez
informacija o veliinama u brojniku (A
i
) i nazivniku (B
i
), srednju
vrijednost R nije mogue izraunati. Pokuaj aproksimacije ove srednje
vrijednosti ne daje vjerodostojan rezultat
43
c) ako su dostupni podaci o relativnom broju koordinacije (R
i
) i o veliini
koja se usporeuje (A
i
), srednja vrijednost ( R ) izraunat e se pomou
izraza za sloenu ili vaganu harmonijsku sredinu:
=
=
=
k
i
i
i
k
i
i
R
A
A
R
1
1
(1.8.14)
Na temelju osnovne relacije (1.8.12) jasno je da vrijedi, da je veliina iz
nazivnika: =
= =
k
i
i i
k
i
i
R A B
1 1
. Ponderi su ovdje vrijednosti veliine koja se
usporeuje iz brojnika: A
i
.
Primjer 1.8.2.
Za nekoliko odabranih fakulteta u Republici Hrvatskoj dani su podaci o
broju studenata i broju studenata po nastavniku u akademskoj godini
2002./2003.
Tablica 1.11.
Broj studenata i broj studenata po nastavniku u nekim odabranim
fakultetima, u RH u akademskoj godini 2002./2003.
Fakulteti Broj studenata
(A
i
)
Broj studenata po
nastavniku (R
i
)
Broj nastavnika
(A
i
/R
i
)=B
i
PMF 3238 11,64748200 278
Graevinski fakulteti 2480 8,70175439 285
Fakult. el. stroj. i brod. 7603 10,20536910 745
Medicinski fakulteti 3116 3,72281959 837
Ekonomski fakulteti 12217 36,03834810 339
Ukupno: 28654 70,3157732 2484
Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godine, str. 447., 448., 450.
Zadatak je izraunati prosjean broj studenata po nastavniku za sve promatrane
fakultete zajedno, odnosno prosjek relativnih brojeva koordinacije ( R ).
S obzirom da je u ovom primjeru poznata (A
i
) veliina koja se usporeuje i
relativni brojevi koordinacije (R
i
), njihov se prosjek rauna pomou izraza za
sloenu ili vaganu harmonijsku sredinu, gdje su ponderi (A
i
):
5354 , 11
2484
28654
1
1
1
1
= =
=
=
=
=
=
k
i
i
i
k
i
i
k
i
i
i
k
i
i
R
A
A
R
x
f
f
H
Prosjean broj studenata po nastavniku za sve promatrane fakultete zajedno
iznosi 11,5354 studenata po nastavniku.
44
1.8.1.3. Geometrijska sredina
Geometrijska sredina spada u potpune srednje vrijednosti i rauna
se upotrebom svih podataka u statistikom nizu.
Geometrijska sredina je N-ti korijen umnoka
3
svih vrijednosti
negrupiranog numerikog obiljeja jednog niza.
N
N
N
N
i
i
x x x x G = =
=
...
2 1
1
(1.8.15)
U izrazu (1.8.15) dana je jednostavna geometrijska sredina koja se
koristi za negrupirane statistike numerike nizove. Ako su nizovi grupirani po
razredima rauna se sloena ili vagana geometrijska sredina:
N
N N
N
N
i
i i
x f x f x f x f G = =
=
...
2 2 1 1
1
(1.8.16)
Ponderi su i ovdje apsolutne frekvencije. Ako su veliine razreda
razliite od 1, i za geometrijsku sredinu se radi aproksimacija na nain da se
raunaju sredine razreda x
i
.
Geometrijska sredina kod numerikih nizova nema neku loginu
interpretaciju. U poslovnoj i makroekonomskoj statistici geometrijska
sredina se najee upotrebljava u analizi vremenskih nizova.
1.8.1.4. Medijan
Medijan je vrijednost statistikog obiljeja koja statistiki niz dijeli
na dva jednaka dijela.
Medijan se moe primijeniti na redoslijedne i kvantitativne statistike
nizove, a spada u poloajne srednje vrijednosti. Medijan se ne primjenjuje kod
nominalnih nizova jer poredak oblika ovog obiljeja moe biti proizvoljan.
Kod negrupiranog, a ureenog niza (po veliini vrijednosti
obiljeja), medijan je vrijednost obiljeja koja pripada elementu statistikog
niza koji se nalazi u sredini niza. Ako je broj elemenata statistikog niza paran,
onda se za medijan uzima jednostavan prosjek vrijednosti obiljeja dvaju
lanova koji se nalaze na sredini statistikog niza. (Npr. za niz s 10 podataka,
3
Znak produkta ili umnoka niza vrijednosti je:
N
N
i
i
x x x x =
=
...
2 1
1
45
nakon to se vrijednosti obiljeja poredaju po veliini medijan je prosjek 5. i 6.
vrijednosti obiljeja.)
Ako je statistiki niz grupiran u razrede, prije raunanja medijana
potrebno je izraunati frekvencije kumulativnog niza "manje od" ili "vie od", te
se u takvom nizu trai sredinji lan. Ako se raunaju frekvencije
kumulativnog niza "manje od" trai se prva frekvencija niza koja sadri
2 N . Razred koji odgovara ovoj frekvenciji kumulativnog niza "manje od"
je medijalni razred.
Ako su veliine razreda obiljeja jednake 1, vrijednost obiljeja
koja odgovara odabranoj frekvenciji kumulativnog niza je medijan.
Ako su veliine razreda obiljeja razliite od 1, medijan se rauna
po izrazu:
i
f
f
N
L Me
med
m
i
i
+ =
=1
1
2
, (1.8.17)
gdje je:
1
L - donja prava ili precizna granica medijalnog razreda
2 N - polovina elemenata statistikog niza
=
m
i
i
f
1
- zbroj svih apsolutnih frekvencija do medijalnog razreda, ne ukljuujui
medijalni razred (tj. kumulativna frekvencija ispred kumulativne frekvencije
medijalnog razreda)
med
f - apsolutna frekvencija medijalnog razreda
i - originalna veliina medijalnog razreda.
Ako je statistiki niz zadan pomou relativnih frekvencija, medijalna
vrijednost ili razred se odreuje pomou prve frekvencije kumulativnog niza
koja u sebi sadri 0,5 ili 50%.
U statistikim distribucijama postoji samo jedan medijan i on se nalazi
izmeu najvee i najmanje vrijednosti obiljeja. Prednost medijana jest da na
njega ne utjeu ekstremno male ili velike vrijednosti obiljeja, stoga je
primjerena srednja vrijednost i kod izrazito asimetrinih distribucija.
46
1.8.1.4.1. Kvantili
Kvantili su vrijednosti statistikog obiljeja koje statistiki niz
dijele na q jednakih dijelova.
Kvartili su vrijednosti statistikog obiljeja koje statistiki niz
dijele na 4 jednaka dijela. Kvartili se mogu podijeliti na:
a) donji kvartil (Q
1
)
b) gornji kvartil (Q
3
) .
Donji kvartil dijeli statistiki niz na etiri jednaka dijela u omjeru
1:3, odnosno 25% elemenata statistikog skupa ima vrijednost obiljeja
manju od donjeg kvartila, a 75% elemenata statistikog skupa ima
vrijednost obiljeja veu od donjeg kvartila.
Gornji kvartil dijeli statistiki niz na etiri jednaka dijela u omjeru
3:1, odnosno 75% elemenata statistikog skupa ima vrijednost obiljeja
manju od donjeg kvartila, a 25% elemenata statistikog skupa ima
vrijednost obiljeja veu od gornjeg kvartila.
Kvartili se, slino kao i medijan, mogu primijeniti na redoslijedne i
kvantitativne statistike nizove, a odreuju se poloajem u nizu. Ni oni se ne
primjenjuju kod nominalnih nizova jer kako je ve naglaeno poredak oblika
ovog obiljeja moe biti proizvoljan.
Kod negrupiranog, a ureenog niza (po veliini vrijednosti
obiljeja), donji kvartil je vrijednost obiljeja koja pripada elementu
statistikog niza iji rang (r) tj. mjesto u nizu odgovara:
r
x Q =
1
, gdje je 1 ) 4 ( + = N INT r , ako N nije djeljiv s 4;
4
2
1
1
+
+
=
r r
x x
Q , gdje je 4 N r = , 1 4 ) 1 ( + = + N r , ako je N djeljivo s 4,
rauna se prosjek obiljeja koji se nalaze na mjestu u nizu: ) 1 ( + r i r .
Kod negrupiranog, a ureenog niza (po veliini vrijednosti
obiljeja), gornji kvartil je vrijednost obiljeja koja pripada elementu
statistikog niza iji rang tj. mjesto u nizu odgovara:
r
x Q =
3
, gdje je 1 ) 4 3 ( + = N INT r , ako N nije djeljiv s 4;
4
INT predstavlja cijeli dio decimalnog broja dobivenog dijeljenjem (eng. integer). npr.:
. 5 ) 7 , 5 (
, 5 ) 3 , 5 (
=
=
INT
INT
47
2
1
3
+
+
=
r r
x x
Q , gdje je 4 3N r = , 1 4 3 ) 1 ( + = + N r , ako je N djeljivo s 4,
rauna se prosjek obiljeja koji se nalaze na mjestu u nizu: ) 1 ( + r i r .
Ako je statistiki niz grupiran u razrede, prije raunanja kvartila
potrebno je izraunati frekvencije kumulativnog niza "manje od" ili "vie od", te
se u takvom nizu trai odgovarajui lan. Ako se raunaju frekvencije
kumulativnog niza "manje od" za donji kvartil se trai prva frekvencija
niza koja sadri 4 N . Za gornji kvartil se trai prva frekvencija niza koja
sadri 4 3N . Razred koji odgovara odabranoj frekvenciji kumulativnog
niza "manje od" je razred donjeg, odnosno gornjeg kvartila.
Ako su veliine razreda obiljeja jednake 1, vrijednost obiljeja
koja odgovara odabranoj frekvenciji kumulativnog niza je donji, odnosno
gornji kvartil.
Ako su veliine razreda obiljeja razliite od 1, donji kvartil se
rauna po izrazu:
i
f
f
N
L Q
t k
q
i
i
+ =
=
var
1
1 1
4
, (1.8.18)
gdje je:
1
L - donja prava ili precizna granica razreda donjeg kvartila
4 N - etvrtina elemenata statistikog niza
=
q
i
i
f
1
- zbroj svih apsolutnih frekvencija do razreda donjeg kvartila, ne
ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne
frekvencije razreda donjeg kvartila)
t k
f
var
- apsolutna frekvencija razreda donjeg kvartila
i - originalna veliina kvartilnog razreda.
Ako su veliine razreda obiljeja razliite od 1, gornji kvartil se
rauna po izrazu:
i
f
f
N
L Q
t k
q
i
i
+ =
=
var
1
1 3
4
3
, (1.8.19)
gdje je:
1
L - donja prava ili precizna granica razreda gornjeg kvartila
4 3N - tri etvrtine elemenata statistikog niza
48
=
q
i
i
f
1
- zbroj svih apsolutnih frekvencija do razreda gornjeg kvartila, ne
ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne
frekvencije razreda gornjeg kvartila)
t k
f
var
- apsolutna frekvencija razreda gornjeg kvartila
i - originalna veliina kvartilnog razreda.
1.8.1.5. Mod
Mod je vrijednost statistikog obiljeja koja se najee javlja u
nekom nizu, tj. vrijednost obiljeja kojoj pripada najvea frekvencija.
Mod se moe primijeniti na kvalitativne i kvantitativne statistike
nizove, a spada u poloajne srednje vrijednosti.
Kod nominalnih obiljeja mod se odreuje brojanjem, trai se
vrijednost obiljeja u nizu koja se najee javlja. Ako je niz grupiran, trai se
najvea apsolutna frekvencija. Vrijednost obiljeja kojoj pripada ta najvea
apsolutna frekvencija je mod.
Primjer 1.8.3.
Statistiki skup "prodane cipele u prodavaonici "K" na dan 30.05. 2006.
god." grupiran je prema nominalnom obiljeju "boja". Modaliteti ovog
obiljeja su: crna (C), bijela (B), ruiasta (R), smea (S).
Zadatak je odrediti mod.
Ureeni podaci dobiveni evidencijom na odreeni dan su:
C C C C B R R R S S
Dakle na dan 30.05.2006. god. u prodavaonici "K" je prodano 10 cipela. Od
toga 4 crne, 1 bijele, 3 ruiaste i 2 smee. Vrijednost obiljeja "boja" koja se u
ovom nizu najee javlja je crna, pa se moe zakljuiti da je mod,
boja crna Mo = .
Statistiki niz prikazan je u tablici 1.12.
49
Tablica 1.12.
Prodane cipele u prodavaonici "K" na dan 30.05. 2008. god. prema boji
Boja cipela Broj prodanih
cipela
X
i
f
i
crna 4
bijela 1
ruiasta 3
smea 2
Ukupno: 10
Izvor: Evidencija prodavaonice "K", svibanj 2008. godine
Kod negrupiranih nizova mod se odreuje prema najveoj apsolutnoj
frekvenciji: 4
max
= f . Modalitet obiljeja koji odgovara ovoj frekvenciji
je: boja crna Mo = .
Kod kvantitativnih statistikih obiljeja vrijednost moda odgovara
vrijednosti obiljeja kojoj pripada najvea korigirana frekvencija (
i
fc ). Ako su
veliine razreda ili grupa numerikog obiljeja jednake nije potrebno korigirati
frekvencije, ve se radi s originalnim apsolutnim frekvencijama. Ukoliko se
vrijednost moda ne moe tono odrediti primjenjuje se sljedei izraz za
izraunavanje moda:
( )
( ) ( )
i
c b a b
a b
L Mo
+
+ =
1
, (1.8.20)
gdje je:
1
L - donja prava ili precizna granica modalnog razreda
b - najvea korigirana frekvencija (tj. frekvencija modalnog razreda)
a - korigirana frekvencija ispred frekvencije modalnog razreda
c - korigirana frekvencija iza frekvencije modalnog razreda
i - veliina modalnog razreda.
U izrazu (1.8.20) frekvencije ispred ( a ) i iza ( c ) modalnog razreda
( b ) slue kao ponderi koji pomiu mod od sredine odgovarajueg modalnog
razreda prema njegovoj donjoj ili gornjoj granici.
Osim unimodalnih nizova koji imaju samo jedan mod, postoje
statistiki nizovi u kojima se dvije ili vie vrijednosti obiljeja mogu pojavljivati
ee u odnosu na ostale modalitete obiljeja. U tom sluaju kae se da su to
bimodalni ili multimodalni nizovi. Kod bimodalne distribucije koja ima dva
vrha postoji glavni mod i lokalni mod. U takvom sluaju kada je u nizu prisutno
vie od jednog moda potrebno je statistiki skup podijeliti na vie podskupova,
50
od kojih e svaki imati svoja karakteristina svojstva, te izvriti analizu svakog
podskupa posebno.
1.8.1.6. Odnosi meu srednjim vrijednostima
Srednje vrijednosti oko kojih se grupiraju podaci statistikog niza ili
mjere centralne tendencije odreuju se poloajem podataka u statistikom nizu
kao i obuhvatom svih podataka niza. Izbor srednje vrijednosti u nekom
skupu ovisi o svojstvima elemenata skupa i o vrsti statistikog obiljeja po
kojem se ti elementi promatraju:
a) za nominalna obiljeja moe se raunati: mod (Mo)
b) za redoslijedna obiljeja moe se raunati: mod (Mo) i medijan (Me)
c) za numerika obiljeja moe se raunati: mod (Mo), medijan (Me)
aritmetika sredina ( X ), geometrijska sredina (G) i harmonijska
sredina (H).
Elementi numerikog statistikog niza mogu biti i negativni. U tom
sluaju moe se raunati samo geometrijska (G) i harmonijska (H) sredina.
Kod numerikih statistikih nizova sa strogo pozitivnim
vrijednostima vrijedi sljedei odnos izmeu harmonijske, geometrijske i
aritmetike sredine:
max min
x X G H x (1.8.21)
Dakle, harmonijska, geometrijska i aritmetika sredina se nalaze
izmeu najvee i najmanje vrijednosti numerikog obiljeja, a aritmetika
sredina ima najveu srednju vrijednost. Njihove veliine se poklapaju samo
onda kada u jednom nizu svi elementi imaju jednake vrijednosti obiljeja.
Prema rasporedu po veliini srednjih vrijednosti u jednom nizu moe se
zakljuiti kakav je raspored elemenata skupa. Naime elementi skupa mogu biti
ravnomjerno ili simetrino rasporeeni oko srednjih vrijednosti, a mogu biti
raspreni pozitivno tj. na desnu stranu ili negativno tj. na lijevu stranu.
51
Slika 1.1.
Simetrina Pozitivna ili desnostrana Negativna ili lijevostrana
distribucija asimetrija asimetrija
Na slici 1.1. prikazana su 3 sluaja rasprenosti podataka oko srednjih
vrijednosti. Na dijelu slike pod (a) prikazana je jedna savreno simetrina
distribucija u kojoj su aritmetika sredina (prosjek), medijan (vrijednost
obiljeja koja skup dijeli na dva jednaka dijela) i mod (najea vrijednost
obiljeja, koja odgovara vrhu krivulje) u istoj toki, odnosno jednaki:
Mo Me X = = . (1.8.22)
Na dijelu slike pod (b) prikazana je jedna pozitivno ili desnostrano
asimetrina distribucija (vidi se rasipanje vrijednosti obiljeja na desnu
stranu) u kojoj je aritmetika sredina vea od medijana koji je vei od
moda.
Mo Me X > > . (1.8.23)
Na dijelu slike pod (c) prikazana je jedna negativno ili lijevostrano
asimetrina distribucija (vidi se rasipanje vrijednosti obiljeja na lijevu stranu)
u kojoj je aritmetika sredina manja od medijana koji je manji od moda.
Mo Me X < < . (1.8.24)
Ako promatrani numeriki niz sadri neke ekstremno male i/ili velike
vrijednosti, razumljivo ja da aritmetika sredina kao srednja vrijednost nije
dobar pokazatelj. Aritmetika sredina je potpuna srednja vrijednost koja
obuhvaa sve elemente skupa, stoga ekstremno velike ili male vrijednosti
obiljeja mogu znatno utjecati na njenu veliinu. U takvom sluaju, da bi se
utvrdile karakteristike skupa, treba odrediti i poloajne srednje vrijednosti mod i
medijan.
f
i
f
i
f
i
x
i
x
i
x
i
a) b) c)
X
M
e
M
o
M
o
M
e
X X M
e
M
o
52
1.8.2. Mjere disperzije
Moe se dogoditi da neki statistiki skupovi imaju jednake npr.
aritmetike sredine, a da su njihovi elementi potpuno razliiti. To znai da je
raspored elemenata u tim skupovima razliit. Informaciju o rasporedu
elemenata daju mjere rasprenosti ili disperzije elemenata numerikog
statistikog skupa.
Postoje apsolutne i relativne mjere rasprenosti. Apsolutni pokazatelji
izraeni su u originalnim jedinicama mjere i omoguavaju usporedbu nizova
prema istom obiljeju (apsolutni pokazatelji su: raspon varijacije,
interkvartil, varijanca i standardna devijacija).
Usporedbu rasprenosti elemenata nizova s razliitom mjernom
jedinicom omoguuju relativni pokazatelji, koji su najee izraeni u
postocima (relativni pokazatelji su: koeficijent kvartilne devijacije i
koeficijent varijacije).
Neke mjere rasprenosti temelje se na dijelu podataka, a neke
obuhvaaju sve elemente promatranog statistikog niza. Stoga se razlikuju:
a) nepotpune mjere rasprenosti: raspon varijacije,
interkvartil i koeficijent kvartilne devijacije
b) potpune mjere rasprenosti: varijanca, standardna
devijacija i koeficijent varijacije.
1.8.2.1. Raspon varijacije, interkvartilni raspon i koeficijent
kvartilne devijacije
Raspon varijacije je najjednostavnija mjera disperzije, a
predstavlja razliku izmeu najvee i najmanje vrijednosti numerikog
obiljeja promatranog niza.
min max
x x R = (1.8.25)
Ovaj apsolutni pokazatelj rasprenosti izraen je u originalnim
jedinicama mjere numerikog obiljeja. Moe poprimiti vrijednost 0. To se
dogaa u sluaju kada svi elementi niza imaju jednaku vrijednost obiljeja.
Najvea vrijednost ovog pokazatelja nije ograniena jer ona ovisi o konkretnoj
rasprenosti promatranih vrijednosti obiljeja.
53
Raspon varijacije je nepotpuna mjera disperzije jer se rauna samo na
temelju dvije vrijednosti obiljeja, odnosno na temelju najvee i najmanje
vrijednosti. Moe se rei da ovo nije precizna mjera rasprenosti elemenata
niza, osobito u sluaju postojanja ekstremno malih i/ili ekstremno velikih
vrijednosti obiljeja. Tada se dobije veliki raspon varijacije, a moda je veina
elemenata skupa rasprena usko oko srednjih vrijednosti.
Taj problem preciznosti rjeava interkvartilni raspon ili interkvartil.
Interkvartil je apsolutna, nepotpuna mjera rasprenosti, koja
pokazuje disperziju srednjih 50% elemenata ureenog numerikog niza.
1 3
Q Q I
q
= (1.8.26)
Interkvartil predstavlja razliku gornjeg i donjeg kvartila. Na taj
nain se eliminira 25% ekstremno malih i 25% ekstremno velikih vrijednosti
obiljeja u nizu.
Slika 1.2.
Slika 1.2. prikazuje jednu simetrinu distribuciju, gdje su elementi
skupa ravnomjerno rasporeeni oko srednjih vrijednosti. Poznato je da donji
kvartil (Q
1
) dijeli distribuciju u omjeru 1:3, tj. da 25% elemenata skupa ima
vrijednost obiljeja manju od donjeg kvartila, a 75% elemenata skupa ima
vrijednost obiljeja veu od donjeg kvartila. Isto tako gornji kvartil (Q
3
) dijeli
distribuciju u omjeru 3:1, tj. da 75% elemenata skupa ima vrijednost obiljeja
manju od gornjeg kvartila, a 25% elemenata skupa ima vrijednost obiljeja veu
od gornjeg kvartila. Na taj nain interkvartil pokazuje disperziju srednjih 50%
elemenata skupa.
Koeficijent kvartilne devijacije je relativna nepotpuna mjera
rasprenosti. Predstavlja relativnu disperziju srednjih 50% elemenata
numerikog niza. Rauna se na temelju samo dvije vrijednosti obiljeja, a to su
donji i gornji kvartil.
1 3
1 3
Q Q
Q Q
V
q
+
= (1.8.27)
f
i
x
i
25%
Q
3
Q
1
25%
50%
54
Koeficijent kvartilne devijacije se rauna kao omjer interkvartila
(razlika kvartila) i zbroja donjeg i gornjeg kvartila. Vrijedi da je:
1 0 <
q
V (1.8.28)
Ovaj pokazatelj je jednak 0 samo u sluaju kada nema disperzije. Ako
se njegova vrijednost pribliava 1, to znai da je rasprenost vrijednosti
obiljeja vea.
S obzirom da je ovo relativni pokazatelj, pomou njega je mogue
usporeivati rasprenost srednjih 50% elemenata razliitih numerikih
distribucija s razliitim jedinicama mjere.
1.8.2.2. Varijanca, standardna devijacija i koeficijent
varijacije
Varijanca spada u potpune mjere rasprenosti jer obuhvaa sve
elemente odabranog numerikog statistikog niza. Ovaj pokazatelj mjeri
odstupanja, tj. rasprenost elemenata skupa od aritmetike sredine.
S obzirom na poznato svojstvo aritmetike sredine da je zbroj
odstupanja vrijednosti obiljeja od aritmetike sredine u jednoj distribuciji
uvijek nula, tj. da je: 0 ) (
1
=
=
X x
N
i
i
(za negrupirani niz) i 0 ) (
1
=
=
X x f
i
k
i
i
(za
grupirani niz), varijanca se izraava preko kvadrata ovih odstupanja.
Varijanca je prosjeno kvadratno odstupanje vrijednosti
numerikog obiljeja od aritmetike sredine.
( )
2 1
2
1
2
2
X
N
x
N
X x
N
i
i
N
i
i
=
=
= =
, za negrupirani niz (1.8.29)
( )
2
1
1
2
1
1
2
2
X
f
x f
f
X x f
k
i
i
k
i
i i
k
i
i
k
i
i i
=
=
=
=
=
, za grupirani niz (1.8.30)
Varijanca je mjera rasprenosti izraena u drugom stupnju, zato kao
rezultat daje jedinice mjere numerikog obiljeja na kvadrat, stoga je oteana
njena interpretacija.
Standardna devijacija je pozitivan korijen iz varijance i izraena je
u originalnim jedinicama mjere. Moe se definirati kao prosjeno
odstupanje vrijednosti numerikog obiljeja od aritmetike sredine.
55
( )
2 1
2
1
2
2
X
N
x
N
X x
N
i
i
N
i
i
+ =
+ = + =
= =
, za negrupirani niz (1.8.31)
( )
2
1
1
2
1
1
2
2
X
f
x f
f
X x f
k
i
i
k
i
i i
k
i
i
k
i
i i
+ =
+ = + =
=
=
=
=
, za grupirani niz (1.8.32)
Pomou standardne devijacije u originalnim mjernim jedinicama
obiljeja moe se usporeivati rasprenost oko aritmetike sredine nizova koji
su grupirani po jednakom obiljeju.
Varijanca i standardna devijacija kao apsolutne mjere disperzije ne
omoguuju usporedbu disperzije vrijednosti obiljeja koje imaju razliitu
jedinicu mjere. Takoer mogu uputiti na pogrean zakljuak pri usporedbi
disperzije obiljeja nizova s razliitim pojedinanim vrijednostima obiljeja. U
tom sluaju se moe raunati:
a) standardizirano obiljeje
b) relativni pokazatelji disperzije
Standardizirano obiljeje (z
i
) je linearna transformacija originalnih
vrijednosti numerikog obiljeja x
i
, a pokazuje odstupanje vrijednosti
obiljeja od aritmetike sredine u standardnim devijacijama.
. , ... , 3 , 2 , 1 , N i
X x
z
i
i
=
(1.8.33)
Vrijede sljedea svojstva standardiziranog obiljeja:
a) aritmetika sredina standardiziranog obiljeja je uvijek jednaka
nuli: 0 = Z
b) standardna devijacija standardiziranog obiljeja je jednaka
jedinici: 1 =
z
.
Ova svojstva omoguuju usporedbu relativnih poloaja elemenata
numerikih nizova.
Ruski matematiar P. L. ebiev (1821.-1894.) utvrdio je teorem koji
definira najmanju proporciju vrijednosti numerike varijable koja pripada
odreenom intervalu oko aritmetike sredine.
Teorem ebieva: Najmanja proporcija vrijednosti numerike
varijable koje pripadaju intervalu ) ( k X , gdje je 1 > k , iznosi: | |
2
) 1 ( 1 k .
Prema ovom Teoremu vrijedi da se:
u intervalu ) ( X nalazi najmanje 68% svih vrijednosti
numerike varijable
56
u intervalu ) 2 ( X nalazi najmanje 95% svih vrijednosti
numerike varijable
u intervalu ) 3 ( X nalazi najmanje 99,7% svih vrijednosti
numerike varijable
Ako se definira jedna savreno simetrina distribucija zvonastog oblika
ovi odnosi aritmetike sredine i standardne devijacije mogu se prikazati kao na
slici 1.3..
Slika 1.3.
Koeficijent varijacije spada u potpune relativne mjere rasprenosti
jer obuhvaa sve elemente odabranog numerikog statistikog niza, a izraava
se u postotcima (%).
Koeficijent varijacije je postotak standardne devijacije od
aritmetike sredine.
100 =
X
V
(1.8.34)
Vrijednost koeficijenta varijacije se kree u intervalu + < 0 0 .
Vrijednost od 0% e poprimiti samo u sluaju kada su sve vrijednosti
numerikog obiljeja u jednom nizu jednake, odnosno kada nema disperzije.
Vea vrijednost ovog pokazatelja upuuje na veu disperziju elemenata
promatranog niza.
Ovaj pokazatelj rasprenosti je izraen u postotcima, pa omoguuje
usporedbu disperzije numerikih nizova s razliitim jedinicama mjere.
f
i
x
i
68%
X-3
X-2
X-
X+3
X+2
X+
95%
99.7%
57
1.8.3. Mjere koncentracije
Pomou pokazatelja koncentracije mjeri se nain raspodjele zbroja
vrijednosti numerike varijable (ili neke druge veliine) po elementima
statistikog skupa ili po modalitetima promatranog statistikog obiljeja.
Mjere koncentracije se mogu podijeliti na:
a) apsolutne mjere koncentracije
b) relativne mjere koncentracije.
Apsolutne mjere koncentracije su:
koncentracijski omjer i
Herfindahlov (Hischmanov) indeks.
Relativna mjera koncentracije je:
Ginijev koeficijent koncentracije.
Koncentracijski omjer rauna se za ureen statistiki niz po
veliini vrijednosti promatranog obiljeja poevi od najvee
vrijednosti prema najmanjoj:
N i
X X X X ... ...
2 1
, (1.8.35)
uz pretpostavku da su sve vrijednosti obiljeja pozitivne.
Koncentracijski omjer reda r je:
=
=
=
N
i
i
r
i
i
r
X
X
C
1
1
, (1.8.36)
ili
=
=
r
i
i
r
X
X
N
C
1
1
, (1.8.37)
gdje je:
i
X - vrijednosti promatranog obiljeja
r - red koncentracijskog omjera
N - broj modaliteta promatranog obiljeja
X - (jednostavna) aritmetika sredina promatranog obiljeja.
58
Vrijednost koncentracijskog omjera kree se na
intervalu: 1
1
r
C
N
. Ako su sve vrijednosti promatranog obiljeja
jednake, omjer iznosi: N 1 . Ako su sve vrijednosti obiljeja, osim
posljednje u nizu jednake 0, omjer iznosi: 1.
Koncentracijski omjer r -tog reda se tumai na nain da r prvih
elemenata skupa zauzima odgovarajui postotak u cijelom statistikom
skupu. U skladu s tim u ekonomiji se ovaj omjer esto koristi u
odreivanju stupnja monopola na nekom tritu.
Herfindahlov indeks je:
2
1
1
2
|
\
|
=
=
=
N
i
i
N
i
i
X
X
H , (1.8.38)
a vrijedi i da je:
( )
|
|
\
|
+ = + = 1
1
1
1
2
2
2
X
N
V
N
H
(1.8.39)
gdje je:
i
X - vrijednosti promatranog obiljeja
N - broj modaliteta promatranog obiljeja
V - koeficijent varijacije zadanog niza (nepomnoen sa 100)
2
- varijanca zadanog niza
X - aritmetika sredina promatranog obiljeja.
Vrijednost Herfindahlov indeksa kree se na intervalu:
1
1
H
N
. Ako su sve vrijednosti promatranog obiljeja jednake omjer
iznosi: N 1 . Ako su sve vrijednosti obiljeja, osim posljednje u nizu
jednake 0, omjer iznosi: 1 (koncentracija je najvea).
Herfindahlov indeks ne moe se numeriki usporeivati s
koncentracijskim omjerom jer se temelje na razliitim polazitima.
Ginijev koeficijent koncentracije je relativna mjera
koncentracije. U konanoj interpretaciji ovaj pokazatelj se spaja s
Lorenzovom krivuljom koja nastaje u prvom kvadrantu koordinatnog
sustava spajanjem toaka od toke ) 0 , 0 ( do toke ) 1 , 1 ( na sljedei
nain:
59
( ) ( ). 1 , 1 ; ... ; , ; ... ; ,
1
; 0 , 0
1
1
1
1
|
|
|
|
\
|
|
|
|
|
\
|
=
=
=
N
i
i
I
i
i
N
i
i
X
X
N
I
X
X
N
(1.8.40)
Dakle druga koordinata svake toke dobije se tako da se svaki
lan kumulativnog niza manje od podijeli s totalom.
Pretpostavlja se da su vrijednosti obiljeja za koje se mjeri
koncentracija pomou ovog pokazatelja nenegativne i poredane po
veliini na nain:
i X X X X X
i N i
, 0 , ... ...
2 1
. (1.8.41)
Na istu sliku se ucrtava i pravac jednolike distribucije koji
prolazi tokama ) 0 , 0 ( i ) 1 , 1 ( i koji ustvari predstavlja dijagonalu
spomenutog kvadrata. Taj pravac dijeli povrinu kvadrata na dva
jednaka dijela, stoga se moe rei da je polovina te povrine ispod
pravca jednaka 0,5.
to je koncentracija u promatranom statistikom skupu vea, to
je Lorenzova krivulja udaljenija od pravca. Ako se od 0,5 oduzme
povrina ispod Lorenzove krivulje dobiva se temelj ove mjere
koncentracije.
Povrina ispod Lorenzove krivulje moe se razdijeliti na 1
trokut i N-1 trapez, pa se ukupna povrina ispod krivulje rauna kao
zbroj povrina trokuta i trapeza.
Povrina izmeu pravca jednolike distribucije i Lorenzove
krivulje varira izmeu | | 5 . 0 , 0 . Ako se dobiveni rezultat pomnoi s 2,
tada on varira u intervalu | | 1 , 0 . Za zadani niz Ginijev koeficijent se
rauna:
+
=
=
= =
N
i
i
N
i
i
N
i
i
X N
X N X i
G
1
1 1
) 1 ( 2
, (1.8.42)
a nakon normiranja vrijedi da je:
1 * 0 ,
1
*
= G
N
N
G G , (1.8.43)
gdje je:
60
i
X - vrijednosti promatranog obiljeja
N - broj modaliteta promatranog obiljeja.
1.8.4. Momenti numerikih nizova
Momenti numerikih nizova mogu biti glavni i pomoni.
1.8.4.1. Glavni momenti numerikih nizova
Glavni ili centralni momenti numerikih nizova su momenti oko
aritmetike sredine:
( )
,... 2 , 1 , 0 ,
1
=
=
=
r
N
X x
N
i
r
i
r
- za negrupirani niz. (1.8.44)
( )
,... 2 , 1 , 0 ,
1
1
=
=
=
=
r
f
X x f
k
i
i
k
i
r
i i
r
- za grupirani niz. (1.8.45)
Centralni moment nultog reda: 1
0
= .
Centralni moment prvog reda: 0
1
= .
Centralni momenti oko aritmetike sredine mogu se izraziti preko
pomonih momenata.
Centralni moment drugog reda:
2
1 2 2
m m = . (1.8.46)
Centralni moment treeg reda:
3
1 2 1 3 3
2 3 m m m m + = . (1.8.47)
Centralni moment etvrtog reda:
4
1
2
1 2 1 3 4 4
3 6 4 m m m m m m + = . (1.8.48)
61
1.8.4.2. Pomoni momenti numerikih nizova
Pomoni momenti numerikih nizova su momenti oko nule:
,... 2 , 1 , 0 ,
1
=
=
=
r
N
x
m
N
i
r
i
r
- za negrupirani niz. (1.8.49)
,... 2 , 1 , 0 ,
1
1
=
=
=
=
r
f
x f
m
k
i
i
k
i
r
i i
r
- za grupirani niz. (1.8.50)
Pomoni moment nultog reda: 1
0
= m .
Pomoni moment prvog reda: X m =
1
.
1.8.5. Mjere asimetrije
Asimetrija distribucije podrazumijeva nagnutost distribucije na lijevu ili
desnu stranu.
1.8.5.1. Pearsonov koeficijent asimetrije
Pearsonov koeficijent asimetrije je:
3
3
3
= , (1.8.51)
gdje je:
3
- centralni moment treeg reda
3
- standardna devijacija na treu potenciju.
Interval u kojem se kree vrijednost ovog koeficijenta:
2 2
3
. (1.8.52)
62
U sluaju izrazito asimetrinih distribucija ovaj koeficijent moe
poprimiti i vrijednosti izvan intervala: | | 2 , 2 .
Ako je:
0
3
= simetrina distribucija
2 0
3
< pozitivna ili desnostrana asimetrija
0 2
3
< negativna ili ljevostrana asimetrija.
1.8.5.2. Pearsonova mjera asimetrije
Pearsonova mjera asimetrije je:
) ( Mo X
S
k
= , (1.8.53)
gdje je:
X - aritmetika sredina
Mo - mod
- standardna devijacija.
Za umjereno asimetrine distribucije vrijedi da je Pearsonova mjera
asimetrije:
) ( 3 Me X
S
k
= , (1.8.54)
gdje je:
X - aritmetika sredina
Me - medijan
- standardna devijacija.
Ako je:
0 =
k
S simetrina distribucija
0 >
k
S pozitivna ili desnostrana asimetrija
0 <
k
S negativna ili ljevostrana asimetrija.
63
Odnosi meu srednjim vrijednostima kod razliitih distribucija:
a) simetrina distribucija ima jednaku aritmetiku sredinu, medijan i
mod:
Mo Me X = = (1.8.55)
b) pozitivno ili desnostrano asimetrina distribucija ima
aritmetiku sredinu veu od medijana koji je vei od moda.
Mo Me X > > (1.8.56)
c) negativno ili ljevostrano asimetrina distribucija ima aritmetiku
sredinu manju od medijana, koji je manji od moda.
Mo Me X < < . (1.8.57)
1.8.5.3. Bowleyeva mjera asimetrije
Bowleyeva mjera asimetrije zasnovana je na odnosu medijana i
kvartila:
1 3
1 3
2
Q Q
Me Q Q
S
kq
+
= , (1.8.58)
gdje je:
Me - medijan
1
Q - donji kvartil
3
Q - gornji kvartil.
Ako je:
0 =
kq
S Me Q Q 2 ) (
1 3
= +
) ( ) (
1 3
Q Me Me Q = simetrina distribucija
0 >
k
S Me Q Q 2 ) (
1 3
> +
) ( ) (
1 3
Q Me Me Q > pozitivna ili desnostrana asimetrija
0 <
k
S Me Q Q 2 ) (
1 3
< +
) ( ) (
1 3
Q Me Me Q < negativna ili ljevostrana asimetrija.
64
1.8.6. Mjera zaobljenosti
Mjera zaobljenosti predstavlja zaobljenost vrha krivulje distribucije
frekvencija:
4
4
4
= , (1.8.59)
gdje je:
4
- centralni moment etvrtog reda
4
- standardna devijacija na etvrtu potenciju.
Ako je:
3
4
= normalno zaobljena distribucija
3
4
> iljatiji vrh od normalno zaobljene distribucije
3 8 , 1
4
< < tupi oblik distribucije
8 , 1
4
= pravokutni oblik distribucije
8 , 1
4
< U - distribucija.
Primjer 1.8.4.
Prodaja kruha u trgovini Z tijekom radnih dana jednog tjedna u
srpnju 2008. god. bila je sljedea:
Tablica 1.13.
Prodaja kruha u trgovini Z
Radni dani Prodano kruha
u kg (x
i
)
X x
i
( )
2
X x
i
Ponedjeljak 56 9,9 98,01
Utorak 39 -7,1 50,41
Srijeda 61 14,9 222,01
etvrtak 44 -2,1 4,41
Petak 52 5,9 34,81
Subota 48 1,9 3,61
Nedjelja 23 -23,1 533,61
Ukupno 323 - 946,87
Izvor: Evidencija trgovine Z, srpanj 2008.god.
65
Zadatak je izraunati:
a) prosjenu prodaju kruha u tom tjednu i disperziju od prosjeka
b) medijalnu prodaju kruha
c) raspon varijacije, interkvartil i koeficijent kvartilne devijacije.
Rjeenja:
a) S obzirom da se radi o negrupiranom nizu raunat e se jednostavna
aritmetika sredina:
1 , 46
7
323
1
= = =
=
N
X
X
N
i
i
Prosjena dnevna prodaja kruha u analiziranom tjednu iznosila je 46,1 kg.
Mjere disperzije od aritmetike sredine su varijanca, standardna devijacija i
koeficijent varijacije.
Varijanca za negrupirani niz rauna se na sljedei nain:
( )
27 , 135
7
87 , 946
1
2
2
= =
=
=
N
X x
N
i
i
Standardna devijacija pokazuje da prosjena odstupanja prodanih koliina
kruha od aritmetike sredine iznose 11,63 kg:
63 , 11 27 , 135
2
= = + =
Koeficijent varijacije pokazuje da relativna odstupanja prodanih koliina
kruha od aritmetike sredine u prosjeku iznose 25,23%, a to znai da je
disperzija umjerena:
% 23 , 25 100
1 , 46
63 , 11
100 = = =
X
V
b) Da bi se mogla odrediti vrijednost medijana, niz treba prvo urediti po veliini
vrijednosti obiljeja (od x
min
do x
max
):
Prodano kruha
u kg (X
i
)
23
39
44
48
52
56
61
66
Kod negrupiranog, a ureenog niza, medijan je vrijednost obiljeja koja
pripada jedinici koja se nalazi u sredini niza. Stoga medijalna prodaja kruha
iznosi:
Me = 48 kg.
c) Raspon varijacije je:
R = x
max
x
min
= 61 23 =38 kg.
Interkvartil predstavlja razliku gornjeg i donjeg kvartila:
I
q
= Q
3
Q
1
= 56 39 = 17 kg.
Vrijednosti kvartila:
S obzirom da N nije djeljiv s 4 (N/4=7/4=1,75) donji kvartil iznosi:
Q
1
= x
r
= x
2
= 39
r=INT(N/4)+1=1+1=2
S obzirom da N nije djeljiv s 4 (3N/4=37/4=5,25) gornji kvartil iznosi:
Q
3
= x
r
= x
6
= 56
r=INT(N/4)+1=5+1=6
Koeficijent kvartilne devijacije relativna je mjera disperzije srednjih 50%
elemenata u nizu:
18 , 0
39 56
39 56
1 3
1 3
=
+
=
+
=
Q Q
Q Q
V
q
stoga je disperzija umjerena.
Primjer 1.8.5.
Prodaja vozila u autosalonu Z tijekom ranih dana u rujnu 2008. god.
bila je sljedea:
Tablica 1.14.
Prodaja vozila u autosalonu Z
Broj prodanih
vozila (x
i
)
Broj radnih
dana (f
i
)
i i
x f
2
i i
x f
0 4 0 0
1 6 6 6
2 9 18 36
3 4 12 36
4 2 8 32
5 1 5 25
Ukupno 26 49 135
Izvor: Evidencija autosalona Z, studeni 2008.god.
67
Zadatak je izraunati:
a) prosjenu prodaju vozila u tom mjesecu i disperziju od prosjeka
b) medijalnu prodaju vozila
c) raspon varijacije, interkvartil i koeficijent kvartilne devijacije
d) mod
e) Pearsonov koeficijent asimetrije
f) Pearsonovu mjeru asimetrije
g) Bowleyevu mjeru asimetrije
h) mjeru zaobljenosti.
Rjeenja:
a) S obzirom da se radi o grupiranom nizu raunat e se vagana aritmetika
sredina:
2 88 , 1
26
49
1
1
= = =
=
=
k
i
i
k
i
i i
f
x f
X
Prosjena dnevna prodaja vozila u analiziranom mjesecu iznosila je oko 2
automobila.
Mjere disperzije od aritmetike sredine su varijanca, standardna devijacija i
koeficijent varijacije.
Varijanca za grupirani niz rauna se na sljedei nain:
66 , 1 88 , 1
26
135
2 2
1
1
2
2
= = =
=
=
X
f
x f
k
i
i
k
i
i i
Standardna devijacija pokazuje da prosjena odstupanja prodanih vozila od
aritmetike sredine iznose 1,29.
29 , 1 77 , 1
2
= = + =
Koeficijent varijacije pokazuje da relativna odstupanja statistikih obiljeja od
aritmetike sredine u prosjeku iznose 68,62%, znai da je stupanj disperzije
prodaje vozila velik:
% 62 , 68 100
88 , 1
29 , 1
100 = = =
X
V
b) Da bi se mogla odrediti vrijednost medijana potrebno je prvo izraunati
frekvencije kumultivnog niza:
68
Broj prodanih
vozila (x
i
)
Broj radnih
dana (f
i
)
Kumulativni niz
manje od
0 4 4
1 6 10
2 9 19
3 4 23
4 2 25
5 1 26
Ukupno 26 -
Medijan je vrijednost obiljeja koja pripada jedinici koja se nalazi u sredini
niza, stoga se trai sredinji lan:
N/2 = 26/2 = 13
Prva frekvencija kumulativnog niza manje od koja sadri N/2 odreuje
poloaj medijana, u ovom primjeru to je 19, pa je medijalna vrijednost
numerikog obiljeja uz tu frekvenciju:
Me = 2 vozila
c) Raspon varijacije je:
R = x
max
x
min
= 5 0 = 5 vozila.
Interkvartil predstavlja razliku gornjeg i donjeg kvartila:
I
q
= Q
3
Q
1
= 56 39 = 17
Vrijednosti kvartila:
Prva frekvencija kumulativnog niza manje od koja sadri N/4 odreuje
poloaj donjeg kvartila (N/4=26/4=6,5), stoga je donji kvartil vrijednost
numerikog obiljeja uz tu frekvenciju:
Q
1
= 1
Prva frekvencija kumulativnog niza manje od koja sadri 3N/4 odreuje
poloaj gornjeg kvartila (3N/4=326/4=19,5), stoga je gornji kvartil vrijednost
numerikog obiljeja uz tu frekvenciju:
Q
3
=3
Koeficijent kvartilne devijacije relativna je mjera disperzije srednjih 50%
elemenata u nizu i iznosi:
5 , 0
1 3
1 3
1 3
1 3
=
+
=
+
=
Q Q
Q Q
V
q
d) Mod je vrijednost statistikog obiljeja kojem pripada najvea frekvencija,
stoga mod iznosi 2 prodana vozila dnevno:
69
M
o
= 2 vozila
e) Pearsonov koeficijent asimetrije je:
42 , 0
29 , 1
898 , 0
3 3
3
3
= = =
Centralni moment treeg reda izraunan preko pomonih momenata iznosi:
898 , 0 88 , 1 2 19 , 5 88 , 1 3 88 , 16 2 3
3 3
1 2 1 3 3
= + = + = m m m m
Za grupirani niz izraz za pomone momente oko nule je:
=
=
=
k
i
i
k
i
i i
r
f
x f
m
1
1
2
Za pomone momente potrebni su sljedei izrauni:
Broj prodanih
vozila (x
i
)
Broj radnih
dana (f
i
)
i i
x f
2
i i
x f
3
i i
x f
4
i i
x f
0 4 0 0 0 0
1 6 6 6 6 6
2 9 18 36 72 144
3 4 12 36 108 324
4 2 8 32 128 512
5 1 5 25 125 625
Ukupno 26 49 135 439 1611
88 , 1
26
49
1
1
1
= = =
=
=
k
i
i
k
i
i i
f
x f
m
19 , 5
26
135
1
1
2
2
= = =
=
=
k
i
i
k
i
i i
f
x f
m
88 , 16
26
439
1
1
3
3
= = =
=
=
k
i
i
k
i
i i
f
x f
m
96 , 61
26
1611
1
1
4
4
= = =
=
=
k
i
i
k
i
i i
f
x f
m
70
e) Pearsonova mjera asimetrije pomou moda je:
( ) ( )
0
29 , 1
2 2
=
o
k
M X
S
Pearsonova mjera asimetrije pomou medijana iznosi:
( ) ( )
0
29 , 1
2 2 3 3
=
e
k
M X
S
f) Bowleyeva mjera asimetrije iznosi:
0
1 3
1 2 2 3 2
1 3
1 3
=
+
=
+
=
Q Q
Q M Q
S
e
kq
g) Mjera zaobljenosti je:
75 , 2
29 , 1
6 , 7
4 4
4
4
= = =
6 , 7 88 , 1 3 88 , 1 19 , 5 6 88 , 16 88 , 1 4 96 , 61 3 6 4
4 2 4
1
2
1 2 1 3 4 4
= + = + = m m m m m m
Distribucija je zaobljenija od normalne.
Primjer 1.8.6.
Broj zaposlenih prema godinama starosti u trgovakom drutvu Z
prikazan je u tablici 1.15.:
Tablica 1.15.
Zaposleni prema godinama starosti u trgovakom drutvu Z,
stanje 31.03.2009. god.
Godine starosti
(x
i
)
Broj zaposlenih
(f
i
)
Raz. sred.
x
i
i i
x f
2
i i
x f
18-25 8 21,5 172,0 3698,0
25-30 12 27,5 330,0 9075,0
30-35 19 32,5 617,5 20068,7
35-40 30 37,5 1125,0 42187,5
40-50 18 45,0 810,0 36450,0
50-60 10 55,0 550,0 30250,0
60-65 3 62,5 187,5 11718,8
Ukupno 100 - 3792,0 153448,0
Izvor: Evidencija trgovakog drutva Z, travanj 2009.god.
Zadatak je izraunati:
71
a) prosjenu starost zaposlenih i disperziju od prosjeka
b) medijalnu starost zaposlenih
c) raspon varijacije, interkvartil i koeficijent kvartilne devijacije
d) mod
e) Pearsonov koeficijent asimetrije
f) Pearsonovu mjeru asimetrije
g) Bowleyevu mjeru asimetrije
h) mjeru zaobljenosti.
Rjeenja:
a) Veliine razreda grupiranog numerikog niza razliite su od 1 pa je za
izraunavanje prosjeka potrebno izvriti aproksimaciju pomou sredina razreda.
Razredna sredina jednostavan je prosjek donje i gornje granice razreda (vidi
trei stupac gornje tablice). S obzirom da se radi o grupiranom statistikom nizu
raunat e se vagana aritmetika sredina:
92 , 37
100
3792
1
1
= = =
=
=
k
i
i
k
i
i i
f
x f
X
Prosjena starost zaposlenih u trgovakom drutvu Z bila je oko 38 godina.
Mjere disperzije od aritmetike sredine su varijanca, standardna devijacija i
koeficijent varijacije.
Varijanca za grupirani niz rauna se na sljedei nain:
55 , 96 92 , 37
100
153448
2 2
1
1
2
2
= = =
=
=
X
f
x f
k
i
i
k
i
i i
Standardna devijacija pokazuje da prosjena odstupanja starosti zaposlenih od
aritmetike sredine iznose 9,83 godina:
83 , 9 55 , 96
2
= = + =
Koeficijent varijacije pokazuje da relativna odstupanja statistikih obiljeja od
aritmetike sredine u prosjeku iznose 25,9%, a to nisu znaajna odstupanja:
% 9 , 25 100
92 , 37
83 , 9
100 = = =
X
V
b) Da bi se mogla odrediti vrijednost medijana potrebno je prvo izraunati
frekvencije kumulativnog niza:
72
Godine starosti
(x
i
)
Broj zaposlenih
(f
i
)
Kumulativni niz
manje od
Veliine
razreda (i)
18-25 8 8 7
25-30 12 20 5
30-35 19 39 5
35-40 30 69 5
40-50 18 87 10
50-60 10 97 10
60-65 3 100 5
Ukupno 100 - -
Medijan je vrijednost obiljeja koja pripada jedinici koja se nalazi u sredini
niza, stoga se prvo trai sredinji lan:
N/2 = 100/2 = 50
Prva frekvencija kumulativnog niza manje od koja sadri N/2 odreuje
poloaj medijan, u ovom primjeru to je 69 i ona odreuje medijalni razred.
Vrijednost medijana odreuje se pomou sljedee formule:
83 , 36 5
30
39 50
35
2
1
1
=
+ =
+ =
=
i
f
f
N
L M
med
m
i
i
e
Me =36,83 godina.
c) Raspon varijacije je:
R = x
max
x
min
=65 18 = 47 godina.
Interkvartil predstavlja razliku gornjeg i donjeg kvartila:
I
q
= Q
3
Q
1
= 43,33 31,32 = 12,01
Vrijednosti kvartila:
Prva frekvencija kumulativnog niza manje od koja sadri N/4 odreuje
poloaj donjeg kvartila (N/4=100/4=25), u ovom primjeru to je 39 i ona
odreuje razred donjeg kvartila. Vrijednost donjeg kvartila je sljedea:
32 , 31 5
19
20 25
30
4
var
1
1 1
=
+ =
+ =
=
i
f
f
N
L Q
t k
q
i
i
Prva frekvencija kumulativnog niza manje od koja sadri N/4 odreuje
poloaj gornjeg kvartila (3N/4=3100/4=75), u ovom primjeru to je 87 i ona
odreuje razred donjeg kvartila. Vrijednost gornjeg kvartila je sljedea:
73
33 , 43 10
18
69 75
40
4
3
var
1
1 3
=
+ =
+ =
=
i
f
f
N
L Q
t k
q
i
i
Koeficijent kvartilne devijacije relativna je mjera disperzije srednjih 50%
elemenata u nizu i pokazuje da disperzija nije velika:
16 , 0
32 , 31 33 , 43
32 , 31 33 , 43
1 3
1 3
=
+
=
+
=
Q Q
Q Q
V
q
d) Mod je vrijednost statistikog obiljeja kojem pripada najvea frekvencija.
Ako veliine razreda nisu jednake uzima se najvea korigirana frekvencija (fc
i
),
stoga je potrebno frekvencije korigirati:
Godine starosti
(x
i
)
Broj zaposlenih
(f
i
)
Veliine
razreda (i)
Korigirane
frekvencije (fc
i
)
18-25 8 7 1,1
25-30 12 5 2,4
30-35 19 5 3,8
35-40 30 5 6,0
40-50 18 10 1,8
50-60 10 10 1,0
60-65 3 5 0,6
Ukupno 100 - -
Najvia korigirana frekvencija iznosi 6 i odreuje modalni razred, a vrijednost
moda iznosi:
( )
( ) ( )
( )
( ) ( )
72 , 36 5
8 , 1 6 8 , 3 6
8 , 3 6
35
1
=
+
+ =
+
+ = i
c b a b
a b
L M
o
M
o
= 36,72 godine.
Modalna, najea starost iznosila je oko 37 godina.
e) Pearsonov koeficijent asimetrije je:
51 , 0
83 , 9
46 , 478
3 3
3
3
= = =
i pokazuje da je distribucija pozitivno asimetrina.
Centralni moment treeg reda izraunan preko pomonih momenata iznosi:
46 , 487 92 , 37 2 48 , 1534 92 , 37 3 6 , 65997 2 3
3 3
1 2 1 3 3
= + = + = m m m m
74
Za grupirani niz izraz za pomone momente oko nule je:
=
=
=
k
i
i
k
i
r
i i
r
f
x f
m
1
1
Za pomone momente potrebno je numerika obiljeja potencirati i pomnoiti s
frekvencijama:
Raz. sred.
x
i
Broj zaposlenih
(f
i
)
i i
x f
2
i i
x f
3
i i
x f
4
i i
x f
21,5 8 172,0 3698,0 79507,0 1709400,5
27,5 12 330,0 9075,0 249562,5 6862968,8
32,5 19 617,5 20068,7 652234,4 21197617,2
37,5 30 1125,0 42187,5 1582031,3 59326171,9
45,0 18 810,0 36450,0 1640250,0 73811250,0
55,0 10 550,0 30250,0 1663750,0 91506250,0
62,5 3 187,5 11718,8 732421,8 45776367,2
Ukupno 100 3792,0 153448,0 6599757,0 300190026,6
92 , 37
100
3792
1
1
1
= = =
=
=
k
i
i
k
i
i i
f
x f
m
48 , 1534
100
153448
1
1
2
2
= = =
=
=
k
i
i
k
i
i i
f
x f
m
6 , 65997
100
6599757
1
1
3
3
= = =
=
=
k
i
i
k
i
i i
f
x f
m
3001900
100
300190026
1
1
4
4
= = =
=
=
k
i
i
k
i
i i
f
x f
m
75
e) Pearsonova mjera asimetrije pomou moda je:
( ) ( )
12 , 0
83 , 9
72 , 36 92 , 37
=
o
k
M X
S
Pearsonova mjera asimetrije pomou medijana iznosi:
( ) ( )
33 , 0
83 , 9
83 , 36 92 , 37 3 3
=
e
k
M X
S
f) Bowleyeva mjera asimetrije iznosi:
08 , 0
32 , 31 33 , 43
32 , 31 83 , 36 2 33 , 43 2
1 3
1 3
=
+
=
+
=
Q Q
Q M Q
S
e
kq
Sve mjere asimetrija pokazuju isto: distribucija je pozitivno asimetrina.
g) Mjera zaobljenosti je:
93 , 2
83 , 9
7 , 27308
4 4
4
4
= = =
4
1
2
1 2 1 3 4 4
3 6 4 m m m m m m + =
7 , 27308 92 , 37 3 92 , 37 48 , 1534 6 92 , 37 6 , 65997 4 3001900
4 2
4
= + =
Distribucija je neznatno zaobljenija od normalne.
77
2. REGRESIJSKA I KORELACIJSKA ANALIZA
2.1. Pojam regresijske i korelacijske analize
Poslovna i makroekonomska statistika esto, uz analizu kretanja jedne
ekonomske pojave, imaju potrebu istraiti ovisnosti dviju ili vie pojava,
odnosno numerikih nizova, zajedno.
Prvi korak u istraivanju ovisnosti varijabli jeste crtanje grafikog
prikaza koji se naziva dijagram rasipanja.
Dijagram rasipanja u pravokutnom koordinatnom sustavu
tokama ) , (
i i
y x prikazuje parove vrijednosti dviju promatranih
numerikih varijabli.
Na osnovi takve slike mogu se odmah uoiti osnovne veze meu
promatranim varijablama.
Slika 2.1.
Na slici 2.1. prikazana su 2 dijagrama rasipanja. Slika (a) prikazuje
funkcionalnu vezu izmeu 2 varijable X i Y. Zamiljena linija koja povezuje
sve toke na slici je pravac. Matematiki oblik veze, ovih dviju promatranih
varijabli, je jednadba pravca. Od te linije nema nikakvog odstupanja, stoga se
kae da je ova veza strogo funkcionalna. Zamiljeni pravac je rastui, odnosno
porast vrijednosti jedne varijable prati porast vrijednosti druge promatrane
varijable zato je ova veza pozitivna.
est sluaj u praksi prikazan je na slici (b). Ako se izmeu toaka ovog
dijagrama zamisli krivulja, to bi opet bio pravac. Meutim ovdje su prisutna
pozitivna i negativna odstupanja od linije pravca, a to se tumai raznim
utjecajima drugih varijabli iz prakse. Stoga ova veza vie nije strogo
funkcionalna, ve se za nju kae da je statistika (stohastika ili sluajna) veza.
y
i
x
i
(a) pozitivna funkcionalna
veza
y
i
x
i
(b) pozitivna statistika
veza
78
Porast vrijednosti jedne varijable u prosjeku prati porast druge varijable, pa je i
ova veza pozitivna.
Slika 2.2.
Na slici 2.2. prikazana su opet 2 dijagrama rasipanja. Slika (a) prikazuje
funkcionalnu vezu izmeu 2 varijable X i Y, a zamiljena linija koja povezuje
sve toke na slici je opet pravac. Matematiki oblik veze ovih dviju promatranih
varijabli je jednadba pravca od ije linije nema nikakvog odstupanja, pa je i
ova veza strogo funkcionalna. Zamiljeni pravac je padajui, odnosno porast
vrijednosti jedne varijable prati pad vrijednosti druge promatrane varijable, pa
je ova veza negativna.
est sluaj u praksi prikazan je na slici (b). Ako se izmeu toaka ovog
dijagrama zamisli krivulja, to bi opet bio pravac. Meutim ovdje su prisutna
pozitivna i negativna odstupanja od linije pravca, a to se, kako je ve reeno,
tumai raznim utjecajima drugih varijabli iz prakse. Stoga ova veza vie nije
strogo funkcionalna, ve se za nju kae da je statistika (stohastika ili sluajna)
veza. Porast vrijednosti jedne varijable u prosjeku prati pad druge varijable,
stoga je i ova veza negativna.
Veza izmeu promatranih varijabli ne mora uvijek odgovarati jednadbi
pravca.
(a) negativna funkcionalna
veza
y
i
x
i
y
i
x
i
(b) negativna statistika
veza
79
Slika 2.3.
Na slici 2.3. su 2 dijagrama rasipanja. Slika (a) prikazuje funkcionalnu
krivolinijsku pozitivnu vezu izmeu 2 varijable X i Y. Zamiljena linija koja
povezuje sve toke na slici je krivulja. Matematiki oblik veze ovih dviju
promatranih varijabli je neka eksponencijalna jednadba od ije linije nema
nikakvog odstupanja, pa je ova veza strogo funkcionalna. I ovdje vrijedi da
porast vrijednosti jedne varijable prati porast vrijednosti druge promatrane
varijable zato je ova veza pozitivna.
5
U praksi se ee dogaa sluaj prikazan na slici (b). Ako se izmeu
toaka ovog dijagrama zamisli linija to bi opet bila krivulja. Meutim ovdje su
prisutna pozitivna i negativna odstupanja zbog utjecaja drugih varijabli iz
prakse. Ova veza je statistika (stohastika ili sluajna). I ovdje porast
vrijednosti jedne varijable u prosjeku prati porast druge varijable, stoga je i ova
veza pozitivna.
5
U poslovnoj i makroekonomskoj statistici promatra se samo prvi kvadrant
koordinatnog sustava jer su u ekonomiji varijable uglavnom pozitivne.
(a) pozitivna funkcionalna
krivolinijska veza
y
i
x
i
y
i
x
i
(b) pozitivna statistika
krivolinijska veza
80
Slika 2.4.
Na slici 2.4. prikazan je dijagram rasipanja koji upuuje na zakljuak da
nema povezanosti meu promatranim pojavama. Naime zamiljena krivulja
koja prolazi izmeu toaka na ovom grafikonu ne postoji i ne moe se definirati
prati li porast jedne pojave rast ili pad druge promatrane pojave, jer se pri jednoj
vrijednosti varijable x
i
moe dogoditi vie razliitih vrijednosti druge varijable
y
i
.
Pod pojmom korelacija podrazumijeva se meuzavisnost ili
povezanost sluajnih varijabli. Po smjeru korelacija moe biti pozitivna i
negativna. Pozitivna korelacija je prisutna kada rast jedne varijable prati
rast druge promatrane varijable, odnosno kada pad jedne prati pad druge
varijable. Negativna korelacija prisutna je kada rast jedne varijable prati
pad druge varijable i obratno.
Za razliku od korelacijske analize zadaa regresijske analize je da
pronae analitiko-matematiki oblik veze izmeu jedne ovisne ili
regresand varijable i jedne ili vie neovisnih ili regresorskih varijabli.
Osim objanjavanja prirode ovisnosti promatranih pojava na temelju tog
analitikog oblika moe se vriti predvianje vrijednosti ovisne varijable pri
odreenim vrijednostima neovisne-ih varijabli.
2.2. Regresijski model
U sluaju postojanja samo jedne ovisne ili regresand, i samo jedne
neovisne ili regresorske varijable kae se da je to jednostavni, jednostruki ili
jednodimenzionalni regresijski model. Ako se uz jednu ovisnu ili regresand
(a) nema veze meu
pojavama
y
i
x
i
81
varijablu u analizi jave dvije ili vie neovisnih ili regresorskih varijabli kae
se da je to sloeni, viestruki ili viedimenzionalni model.
Regresijska analiza se moe postaviti na sljedei nain:
1. Potpuno, precizno i koncizno definiranje predmeta i ciljeva
istraivanja, te postavljanje osnovnih pretpostavki
2. Crtanje dijagrama rasipanja, izbor modela i definiranje varijabli
(na primjer aditivni model
6
)
e X f Y + = ) ( , (2.2.1)
gdje je: Y- ovisna ili regresand varijabla
X - neovisna ili regresorska varijabla
e - sluajna komponenta.
Svaki model ima sluajnu komponentu e , koja upuuje da veze izmeu
pojava u praksi nisu funkcionalne nego su statistike ili stohastike, odnosno
oko linije konkretnog aditivnog modela postoje pozitivna i/ili negativna
odstupanja originalnih vrijednosti.
U ovom koraku bitno je formirati statistiko-dokumentacijsku osnovu iz
primarnog (direktno) i/ili sekundarnog (literatura) izvora vodei rauna da
promatrani podaci budu usporedivi i da njihova usporedba zadovoljava
ekonomske kriterije.
3. Odabir konkretnog regresijskog modela, njegova specifikacija i
pretpostavke (na primjer linearni model: e X Y + + =
1 0
.)
Slika 2.5.
6
Modeli u praksi ne moraju biti aditivni: na primjer, multiplikativni model
e X f Y = ) ( ,
gdje je: Y- ovisna ili regresand varijabla, X - neovisna ili regresorska varijabla , e -
sluajna komponenta.
y
x
82
Na slici 2.5. prikazan je dijagram rasipanja koji upuuje na postojanje
pozitivne statistike veze izmeu dviju varijabli X i Y. Povlaenjem linije
pravca izmeu toaka dijagrama rasipanja pretpostavlja se aditivna linearna
veza meu varijablama.
4. Statistika analiza modela: ocjena parametara i pokazatelja
reprezentativnosti modela
U ovoj fazi regresijske analize ocjenjuju se parametri konkretnog
izabranog regresijskog modela, te se raunaju odgovarajui pokazatelji
reprezentativnosti modela, koji ukazuju na to zadovoljava li model statistike
kriterije.
5. Testiranje hipoteza o modelu i statistiko teorijskih pretpostavki
a) DA - ako su ispunjene pretpostavke, vri se sinteza rezultata i donose
se sudovi o predmetu istraivanja
b) NE -ako nisu ispunjene pretpostavke: vri se modifikacija modela i
vraa se na korak 2., tj. na izbor novog modela i definiranje varijabli.
Regresijskom analizom trae se i ocjenjuju parametri funkcije koja na
najbolji mogui nain opisuje vezu izmeu varijabli X i Y.
2.3. Model jednostavne linearne regresije
Ako su u analizi prisutne samo dvije varijable tada se radi o
jednostavnoj regresiji. Na temelju uzorka parova vrijednosti varijabli X i Y:
( ) ( ) ( )
n n
y x y x y x , , . . . , , , ,
2 2 1 1
crta se dijagram rasipanja koji je prikazan na slici 2.6..
Slika 2.6.
y
x
x
i
y
i
83
Dijagram rasipanja pokazuje pozitivnu statistiku vezu izmeu pojava
X i Y.
Slika 2.7.
Ako se na dijagramu rasipanja povue pravac on je openito oblika:
X Y
1 0
+ = (2.3.1)
Svaka toka dijagrama rasipanja zadovoljava jednadbu:
i i i
e X Y + + =
1 0
, (2.3.2)
odnosno svaka toka Y
i
odstupa od linije pravca za pozitivnu ili negativnu
razliku
i
e .
Regresijska analiza trai parametre
1 0
i , tako da pravac Y
prolazi
izmeu stvarnih toaka promatranih varijabli i da najbolje tumai vezu izmeu
njih, odnosno pravac mora biti takav da odstupanja
i
e budu najmanja.
Postoji vie razliitih metoda za ocjenu ovih parametara, a najee
rabljena metoda je metoda najmanjih kvadrata koja upravo procjenjuje
parametre
1 0
i tako da odstupanja e
i
budu najmanja.
7
Ona daje najbolje
7
Pri formiranju modela postavljaju se i pretpostavke sluajne greke
i
e (tzv. Gauss-
Markovljevi uvjeti):
I. i e E
i
= , 0 ) ( (oekivanje sluajne pogrjeke je nula za svaku opservaciju)
II.
.
) , (
2
const
j i za e e E
e j i
=
= + < =
(homoskedastinost varijance reziduala, tj.
pretpostavlja se da je varijanca reziduala konana i vrsta)
III.
j i e e Cov
tj j i e e E
j i
j i
=
=
, 0 ) , (
. , , 0 ) , (
(pogrjeka je sluajna i nema korelacije izmeu varijabli
s pomakom od e
i
)
y
x
x
i
y
i
e
i
X Y
1 0
+ =
84
linearne nepristrane ocjene i vrlo je esto primjenjivana metoda za ocjenu
parametara.
i i i
e Y Y + =
(2.3.3)
Odstupanja originalnih vrijednosti od ocijenjenih vrijednosti
i
e mogu
biti pozitivna i negativna, stoga da se ne bi meusobno ponitile te pozitivne i
negativne vrijednosti, ova metoda minimizira sumu kvadrata od
i
e .
| | + = =
= = =
n
i
i i
n
i
i i
n
i
i
X Y Y Y e
1
2
1 0
1
2
1
2
)
( min )
( (2.3.5)
Nakon primjene matematikog postupka traenja minimuma dobiju se
dvije jednadbe s dvije nepoznanice tj. parametri regresijskog modela
1 0
i .
= +
= =
n
i
i
n
i
i
Y X n
1 1
1 0
(2.3.6)
= +
= = =
n
i
i i
n
i
i
n
i
i
Y X X X
1 1
2
1
1
0
(2.3.7)
Sustav (2.3.6), (2.3.7) uvijek ima rjeenja i vrijedi da je:
X b Y i
X n X
Y X n Y X
n
i
i
n
i
i i
0
2
1
2
1
1
=
=
=
=
(2.3.8)
gdje su:
n
Y
Y i
n
X
X
n
i
i
n
i
i
=
=
= = 1 1
(2.3.9)
jednostavne aritmetike sredine varijabli X i Y.
Konano je ocijenjeni model:
X Y
1 0
+ = (2.3.10)
IV. 0 ) , ( =
i i
X e E (sluajna pogrjeka je distribuirana nezavisno od regresorske
varijable X)
Vrijedi da je sluajna pogrjeka e distribuirana normalnom distribucijom: ) , 0 (
2
< N .
85
gdje je
0
=
=
(2.3.12)
Matrinim putem regresijska jednadba moe se napisati:
X Y = ; (2.3.13)
gdje su matrice:
(
(
=
(
(
(
(
=
(
(
(
(
=
1
0
2
1
2
1
;
1
.. ..
1
1
;
..
n n
X
X
X
X
Y
Y
Y
Y (2.3.14)
) ( ) (
1
Y X X X
T T
=
(2.3.15)
gdje su:
(
(
(
(
=
(
(
(
(
=
=
=
= =
=
n
i
i i
n
i
i
T
n
i
i
n
i
i
n
i
i
T
Y X
Y
Y X i
X X
X n
X X
1
1
1
2
1
1
) ( ) ( . (2.3.16)
86
2.4. Linearna korelacija i procjena koeficijenta korelacije
2.4.1 Linearna korelacija
Najpoznatija mjera linearne korelacije izmeu sluajnih varijabli je
Pearsonov koeficijent linearne korelacije (r):
,
) ( ) (
) ( ) (
1 1
2 2
1
=
= =
=
n
i
n
i
i i
n
i
i i
Y Y X X
Y Y X X
r ili
y x
n
i
i i
n
Y X n Y X
r
=
=1
(2.4.1)
gdje su
x
i
y
jednostavne standardne devijacije promatranih varijabli:
2 1
2
X
n
x
n
i
i
x
=
=
i
2 1
2
Y
n
y
n
i
i
y
=
=
(2.4.2)
Vrijednost koeficijenta linearne korelacije kree se u intervalu:
1 1 r (2.4.3)
U skladu s veliinom ovog koeficijenta moe se zakljuiti smjer i
intenzitet linearne korelacije meu promatranim varijablama:
1 = r ; 1 = r funkcionalna negativna/pozitivna korelacija
8 , 0 1 < r ; 1 8 , 0 < r jaka negativna/pozitivna korelacija
5 , 0 8 , 0 < r ; 8 , 0 5 , 0 < r srednje jaka negativna/pozitivna korelacija
0 5 , 0 < < r ; 5 , 0 0 < < r slaba negativna/pozitivna korelacija
0 = r nema korelacije.
Koeficijent parcijalne korelacije je pokazatelj korelacije izmeu dvije
varijable uz istodobno iskljuenje utjecaja drugih varijabli.
Ako se rauna parcijalna korelacija izmeu triju varijabli u
kombinaciji vrijedi da je:
korelacija izmeu 1. i 2. varijable uz iskljuenje utjecaja 3.
varijable:
) 1 ( ) 1 (
) (
2
23
2
13
23 13 12
3 . 12
r r
r r r
= (2.4.4)
korelacija izmeu 1. i 3. varijable uz iskljuenje utjecaja 2.
varijable:
87
) 1 ( ) 1 (
) (
2
32
2
12
32 12 13
2 . 13
r r
r r r
= (2.4.5)
korelacija izmeu 2. i 3. varijable uz iskljuenje utjecaja 1.
varijable:
) 1 ( ) 1 (
) (
2
31
2
21
31 21 23
1 . 23
r r
r r r
= , (2.4.6)
gdje su
ij
r odgovarajui koeficijenti korelacije promatranih varijabli.
Matrica koeficijenata korelacije openito je:
(
(
(
(
(
(
=
1 ..
.. .. .. .. ..
.. 1
.. 1
.. 1
3 2 1
3 32 31
2 23 21
1 13 12
k k k
k
k
k
r r r
r r r
r r r
r r r
R ,
gdje je k broj promatranih varijabli. S obzirom da za korelaciju vrijedi da je
jk ij
r r = , matrica R je simetrina matrica.
Koeficijent parcijalne korelacije izmeu 2. varijable, uz iskljuenje
utjecaja ostalih promatranih varijabli je openito:
) (
.... .
jj ii
ij
klm ij
R R
R
= , (2.4.7)
gdje je
ij
R kofaktor, tj. algebarski komplement matrice koeficijenata korelacije
R :
ij
j i
ij
M R =
+
) 1 ( , (2.4.8)
a
ij
M je odgovarajui minor (subdeterminanta) matrice koeficijenata korelacije
R .
2.4.2. Procjena koeficijenta korelacije
Ako je vrijednost koeficijenta korelacije blia 1, njegova sampling
distribucija (distribucija iz uzoraka) je asimetrina i nema normalni oblik. Stoga
88
se procjena vri Fisherovom transformacijom (r u Z) - pomou odgovarajuih
tablica ili raunom:
r tgh ar Z
= (2.4.9)
Interval povjerenja procjene za Z je:
{ } = + < < 1 ) (
) (
Pr Z Se Z Z Z Z Se Z Z (2.4.10)
gdje je:
Z - odgovarajua vrijednost iz tablica normalne distribucije
1 - odgovarajui nivo pouzdanosti procjene (najee 95%)
3
1
) (
=
n
Z Se . (2.4.11)
Nakon izraunavanja intervala pouzdanosti za Z potrebno je donju i
gornju granicu za Z transformirati natrag u r (Z u r) - pomou odgovarajuih
tablica ili raunom:
Z tgh r = (2.4.12)
Kod negativne korelacije prilikom transformiranja treba voditi rauna o
negativnom predznaku koeficijenta korelacije r.
Napomena: Fisherova transformacija se ne koristi za male uzorke.
2.5. Spearmanov koeficijent korelacije
Ako se eli istraiti meuovisnost pojava koje su izraene modalitetima
redoslijednog obiljeja, odnosno ako su im modaliteti pridrueni na temelju
ordinalne skale rauna se korelacija ranga.
Najpoznatija mjera korelacije ranga izmeu dviju varijabli je
Spearmanov koeficijent korelacije ranga (r
S
):
N N
d
r
N
i
i
S
=
=
3
1
2
6
1 , (2.5.1)
gdje je:
N - broj parova vrijednosti varijabli X i Y,
) ( ) (
i i i
y r x r d = - razlika rangova vrijednosti varijabli X i Y.
89
Svakoj vrijednosti varijabli X i Y dodjeljuje se rang iskazan prvim N
prirodnim brojevima. Pri tome se rangiranje moe zapoeti rangom 1, poevi
od najmanje vrijednosti obiljeja ili poevi od najvee vrijednosti obiljeja. Pri
tom se rangiranje mora provesti na jednak nain za obje promatrane varijable.
Ako se javi vie jednakih vrijednosti jedne varijable mora im se dodijeliti
jednak rang na nain da se izrauna aritmetika sredina njihovih rangova.
Spearmanov koeficijent korelacije ranga moe poprimiti vrijednosti u
intervalu:
1 1
S
r (2.5.2)
Kada ovaj koeficijent poprimi vrijednosti -1 i 1, rije je o potpunoj
korelaciji ranga meu varijablama. Vrijednost ovog koeficijenta 0 znai da
nema nikakve korelacije ranga meu pojavama. Najee se vrijednost
Spearmanovog koeficijenta kree u rasponu 1 1 < <
s
r . Koeficijent blii
rubovima ovog intervala, tj. -1 i 1 upuuje na veu korelaciju ranga promatranih
dviju varijabli.
Primjer 2.5.1.
Vlasnik velikog salona automobila Z eli utvrditi odnos izmeu postignutih
bodova na testu koji su prodavai ispunjavali prilikom prijema na posao i
prodanih automobila, koje su ti prodavai uspjeli prodati tijekom svoje prve
godine rada u tom salonu. Sluajni uzorak od 10 prodavaa dao je sljedee
rezultate:
Tablica 2.1.
Bodovi postignuti na testu i broj prodanih automobila 10 prodavaa
autosalona Z, 2008. god.
Rangirane
varijable
Prodava Bodovi na
testu
(x
i
)
Broj prodanih
automobila
(y
i
) r(x
i
) r(y
i
)
d
i
=r(x
i
)-r(y
i
)
2
i
d
A 51 35 8 8 0 0
B 65 46 6 5 1 1
C 49 33 10 9 1 1
D 66 45 5 6 -1 1
E 50 29 9 10 -1 1
F 64 42 7 7 0 0
G 68 47 4 4 0 0
H 72 50 3 3 0 0
I 77 52 1 2 -1 1
J 75 53 2 1 1 1
Izvor: Podaci autosalona Z, 2009.god.
Zadatak je izraunati Spearmanov koeficijent korelacije ranga.
90
96 , 0
10 10
6 6
1
6
1
3 3
1
2
=
=
=
N N
d
r
N
i
i
s
Oita je jaka veza izmeu postignutih bodova na testu i broja prodanih
automobila.
2.6. Regresijska dijagnostika
Nakon ocjene parametara regresijskog modela postavlja se pitanje
reprezentativnosti, odnosno sposobnosti modela da objasni kretanje ovisne
varijable Y uz pomo odabrane neovisne varijable X.
U tu svrhu koriste se neki apsolutni i relativni pokazatelji. Ovi
pokazatelji temelje se na raspodjeli odstupanja vrijednosti ovisne varijable
i
Y u
regresijskom modelu od njene aritmetike sredine Y i njenih oekivanih
vrijednosti
i
Y
.
Slika 2.8.
Na slici 2.8. prikazan je dijagram rasipanja varijabli X i Y s ucrtanim
ocijenjenim modelom pravca Y
=
n
SR
Y
(2.6.5)
Izraz (2.6.5) je standardna pogrjeka regresije jednostrukog modela.
Ovaj pokazatelj izraen je u originalnim jedinicama mjere ovisne varijable Y.
Stoga je na temelju standardne pogrjeke regresije teko usporeivati
reprezentativnost modela s razliitim mjernim jedinicama.
Taj problem eliminira relativni pokazatelj koeficijent varijacije
regresije, koji predstavlja postotak standardne pogrjeke regresije od
aritmetike sredine varijable Y.
100
=
Y
V
Y
Y
(2.6.6)
Najmanja vrijednost koeficijenta varijacije je 0%, a najvea nije
definirana. to je koeficijent varijacije regresijskog modela blii nuli, to je
model reprezentativniji. esto se uzima dogovorena granica reprezentativnosti
od 10%. Dakle ako je koeficijent varijacije manji od 10% kae se da je model
dobar.
Koeficijent determinacije je pokazatelj reprezentativnosti regresijskog
modela koji se temelji na analizi varijance. On se definira kao omjer sume
92
kvadrata odstupanja protumaenih regresijom i sume kvadrata ukupnih
odstupanja.
ST
SP
r =
2
(2.6.7)
Koeficijent determinacije kae koliko % je sume kvadrata
odstupanja vrijednosti varijable Y od aritmetike sredine protumaeno
regresijskim modelom.
Prema (2.6.4), vrijedi da je:
ST
SR
r = 1
2
(2.6.8)
Vrijednost koeficijenta determinacije kree se u intervalu 1 0
2
r .
Regresijski model je reprezentativniji ako je ovaj pokazatelj blii 1.
Teorijska granica reprezentativnosti modela je 0,9. U praksi je ponekad vrlo
teko pronai varijablu koja dobro objanjava ovisnu pojavu, pa se ta granica
reprezentativnosti sputa i do 0,6.
Korigirani koeficijent determinacije:
) 1 (
) 1 (
1
1
2 2
r
k n
n
r
+
= (2.6.9)
je asimptotski nepristrana ocjena koeficijenta determinacije.
Za jednostruku linearnu regresiju vrijedi da je koeficijent linearne
korelacije:
2
r r = ,
gdje predznak koeficijenta linearne korelacije odgovara predznaku parametara
ocijenjenog jednostrukog linearnog modela:
1
i
1
.
Jo vrijedi da je:
Y
X
X
Y
r i r
= =
1 1
,
gdje su
Y X
i standardne devijacije varijabli X i Y.
Primjer 2.6.1.
Ispituje se veza izmeu obrazovanja i visina plaa u trgovini Z u kojoj je
zaposleno 10 djelatnika:
93
Tablica 2.2.
Godine obrazovanja i prosjene plae zaposlenika u trgovini Z u 2008. god.
Obrazovanje
- godine (x
i
)
Prosjena neto
mjesena plaa u kn (y
i
)
i i
y x
2
i
x
2
i
y
6 3.500 21000 36 12250000
8 3.600 28800 64 12960000
10 3.600 36000 100 12960000
12 4.100 49200 144 16810000
12 4.200 50400 144 17640000
14 4.900 68600 196 24010000
14 4.700 65800 196 22090000
15 4.900 73500 225 24010000
16 5.800 92800 256 33640000
18 6.500 117000 324 42250000
125 45.800 603100 1685 218620000
Izvor: Podaci trgovine Z, 2009.god.
Zadatak je:
a) nacrtati dijagram rasipanja
b) ocijeniti parametre jednadbi pravaca linearne regresije
c) izraunati Pearsonov koeficijent linearne korelacije i koeficijent
determinacije
d) izraunati koeficijent varijacije regresije
Rjeenja:
a) Grafikon 11.
Dijagram rasipanja
0
1.000
2.000
3.000
4.000
5.000
6.000
7.000
5 7 9 11 13 15 17 19
Godine obrazovanja
M
j
e
s
e
n
a
p
l
a
a
Izvor: Podaci trgovine Z, 2009.god.
94
b) Jednadba prvog pravca regresije glasi:
X X Y 8 , 249 5 , 1457
1 0
+ = + =
) ) )
8 , 249
5 , 12 10 1685
4580 5 , 12 10 603100
2
1
2 2
1
1
=
=
=
=
n
i
i
n
i
i i
X n X
Y X n Y X
)
6 , 1457 5 , 12 8 , 249 4580
1 0
= = = X Y
) )
Regresijski koeficijent (
1
)
) pokazuje da se mjesena neto plaa poveava u
prosjeku za 249,8 kn kada se duina obrazovanje produi za 1 godinu.
Jednadba drugog pravca regresije glasi:
Y Y X 0035 , 0 53 , 3
1 0
+ = + =
) )
)
0035 , 0
4580 10 218620000
4580 5 , 12 10 603100
2
1
2 2
1
1
=
=
=
=
n
i
i
n
i
i i
Y n Y
Y X n Y X
)
53 , 3 4580 0035 , 0 5 , 12
1 0
= = = Y X
) )
Regresijski koeficijent (
1
)
) pokazuje da se obrazovanje produilo u prosjeku za
0,0035 godine ukoliko se mjesena neto plaa poveala za 1 kn.
c) Pearsonov koeficijent korelacije (r) iznosi:
93 , 0
941 5 , 3 10
4580 5 , 12 10 603100
1
=
=
=
=
y x
n
i
i i
n
Y X n Y X
r
5 , 3 5 , 12
10
1685
2 2 1
2
= = =
=
X
n
x
n
i
i
x
941 4580
10
218620000
2 2 1
2
= = =
=
Y
n
y
n
i
i
y
Izmeu obrazovanja i plaa postoji jaka i pozitivna korelacija.
95
Koeficijent determinacije glasi:
86 , 0
8856000
7648460
2
= = =
ST
SP
r
7648460 4580 10 603100 8 , 249 45800 6 , 1457
2
1 1
2
1 0
= + = + =
= =
n
i
n
i
i i i
Y n Y X Y SP
) )
=
= = =
n
i
i
Y n Y ST
1
2 2 2
8856000 4580 10 218620000
Koeficijent determinacije pokazuje da je 86% sume kvadrata odstupanja
vrijednosti varijable Y od aritmetike sredine protumaeno regresijskim
modelom.
Koeficijent linearne korelacije pomou koeficijenta determinacije iznosi:
93 , 0 86 , 0
2
= = = r r
d) Koeficijent varijacije regresije glasi:
48 , 8 100
4580
5 , 388
100 = = =
Y
V
Y
Y
)
)
)
)
Koeficijent varijacije regresije manji je od 10% pa je ocijenjeni model regresije
reprezentativan.
Standardna pogrjeka regresije je:
5 , 388
2 10
1207540
2
=
=
n
SR
Y
)
)
= = =
= = =
n
i
i i
n
i
n
i
i i
Y X Y Y SR
1 1 1
1 0
2
1207540 603100 8 , 249 45800 6 , 1457 218620000
) )
97
3. ANALIZA VREMENSKIH SERIJA
3.1. Definicija vremenskog niza
Praenje razliitih ekonomskih pojava u vremenu veoma je vano za
poslovnu i gospodarsku politiku, stoga u poslovnoj i makroekonomskoj
statistici obrada vremenskih nizova zauzima vano mjesto.
Vremenski niz je skup kronoloki ureenih vrijednosti pojave.
Vrijednosti promatrane varijable vremenskog niza oznaavaju se:
{ } N t Y
t
..., , 2 , 1 , = ,
8
(3.1.1)
i zovu se frekvencije.
3.2. Vrste nizova
S obzirom na vrijeme opaanja vrijednosti pojave postoje dvije
vrste vremenskog niza:
1. intervalni vremenski niz
2. trenutani vremenski niz.
Kod intervalnog vremenskog niza vrijednost pojave mjeri se u
vremenskom intervalu.
Kod trenutanog vremenskog niza vrijednost pojave mjeri se u
trenutku vremena.
3.3. Grafiko prikazivanje i usporeivanje vremenskih
nizova
Grafikim prikazom vremenskih nizova postie se jasnija i
preglednija slika kretanja vrijednosti promatrane pojave kroz vrijeme.
Slika grafikona, kao i svi prikazi u statistici, mora biti jasna i potpuna.
Kod vremenskih nizova vrijeme se uvijek nanosi na apscisu dok se na ordinatu
nanose vrijednosti pojave Y
t
. Grafiki prikaz treba imati sve potrebne oznake:
8
Indeks "t" ovdje znai: time (eng.) - vrijeme.
98
naslov grafikona, izvor grafikona, oznake na ordinati, oznake na apscisi i kazalo
ako se na istom grafikonu prikazuje vie razliitih vremenskih nizova.
Na jednom grafikom prikazu moe se usporeivati vie vremenskih
nizova s istom jedinicom mjere. Broj vremenskih nizova na jednom grafikonu
ogranien je samo zbog tehnikih mogunosti jer kod velikog broja nizova
usporeivanje postaje nepregledno. To su grafikoni s aritmetikim mjerilom
na osi ordinata.
Postoje grafikoni s logaritamskim mjerilom na osi ordinata. Oni
omoguuju prikazivanje i usporeivanje vremenskih nizova s razliitom
jedinicom mjere na istom grafikonu. Ovim grafikonom mogu se prikazivati i
usporeivati i vremenski nizovi s istom mjernom jedinicom, ali koji imaju
velike razlike meu vrijednostima pojave.
Njihova konstrukcija danas je olakana u raznim statistikim paketima
za raunalo (Statistica, SPSS i slino).
Ako je omjer najvee i najmanje frekvencije vremenskog niza:
10
min
max
Y
Y
, dovoljan je 1 logaritamski ciklus
100 10
min
max
<
Y
Y
, dovoljna su 2 logaritamska ciklusa
1000 100
min
max
<
Y
Y
, dovoljna su 3 logaritamska ciklusa... itd.
Karakteristika logaritamske skale na osi ordinata je da se za vrijednost s
kojom poinje jedan logaritamski ciklus uveava svaka sljedea vrijednost u
ciklusu. S vrijednou kojom zavrava prvi logaritamski ciklus poinje drugi i
uveavanje na skali se sada nastavlja s tom veliinom i tako redom dalje.
Intervalni vremenski nizovi mogu se prikazivati:
linijskim grafikonom
povrinskim grafikonom (obino su to stupci koji su naslonjeni jedan na
drugi jer vrijeme tee kontinuirano).
Kod linijskog grafikona za intervalne vremenske nizove (koji prikazuju
vrijednost pojave u vremenskim intervalima) vrijednost pojave se nanosi na
sredinu svakog promatranog razdoblja (mjesec, kvartal, godina i slino.)
Stupci povrinskog grafikona naslonjeni su na os apscisu, imaju
jednake baze, a visina im odgovara vrijednostima vremenskog niza za odreeno
razdoblje. Dakle povrine ovih stupaca su proporcionalne vrijednostima niza, a
razlike u njihovoj veliini upuuju na apsolutne razlike vrijednosti promatranih
razdoblja.
99
Ako intervalni vremenski niz prikazuje vrijednosti pojave za razliite
jedinice vremena, kod grafikog prikaza radi se aproksimacija kojom se
raunaju prosjene vrijednosti pojave za manju ili veu vremensku jedinicu. Na
primjer, ako jedan niz tvore godinji i mjeseni podaci, onda se sve svodi ili na
godinje ili na mjesene vrijednosti pojave ( 12 /
. . god mjes
Y Y = jer godina ima 12
mjeseci).
Trenutani vremenski nizovi mogu se prikazivati:
linijskim grafikonom.
Kod linijskog grafikona za trenutane vremenske nizove (koji prikazuju
vrijednost pojave u trenutku vremena) vrijednost pojave se nanosi u trenutku
mjerenja vrijednosti promatrane pojave (poetak, sredina, kraj ili neki drugi
precizan datum izabranih vremenskih razdoblja) i ovdje se za nizove ije toke
promatranja u vremenu nisu jednako udaljene ne treba vriti korekcija
vrijednosti pojave.
Ako su na ordinati sve vrijednosti (Y
t
) promatranog vremenskog niza
velike, doputeno je napraviti vodoravan prekid grafikona na ordinati, na
nain, da se apscisa priblii tim velikim vrijednostima niza prema gore da
bi se izbjegao prazni prostor na grafu. Ovaj vodoravan prekid grafikona moe se
napraviti samo za linijski grafikon.
Okomiti prekid grafikona radi se na apscisi, ako nisu poznate
vrijednosti vremenskog niza za sva promatrana vremenska razdoblja (na
primjer, ratne godine).
Primjer 3.3.1.
Tablica 3.1.
Odobreni krediti i tedni ulozi banke Z u razdoblju od 1995. do
2005. god.
Godina Odobreni krediti
u milijunima kn
tedni ulozi u
milijunima kn
1995. 11 1
1996. 15 1,5
1997. 19 2,2
1998. 28 3
1999. 33 3,8
2000. 37 4,5
2001. 43 6
2002. 51 7,4
2003. 62 8,6
2004. 78 9,1
2005. 93 9,9
Izvor: Podaci banke Z, travanj 2006. god.
100
Zadatak je zadane vremenske nizove prikazati grafiki s 2 logaritamska ciklusa
na os ordinate.
Grafikon 12.
Odobreni krediti i tedni ulozi banke Z u razdoblju od 1995. do
2005. god.
1
10
100
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
U
m
i
l
i
j
u
n
i
m
a
k
n
Odobreni krediti tedni ulozi
Izvor: Podaci banke Z, travanj 2006. god.
3.4. Pokazatelji dinamike
Kretanje vrijednosti pojave vremenskog niza jasno se moe vidjeti iz
grafikog prikaza. Meutim u statistikoj analizi esto se javlja potreba
preciznijeg definiranja kretanja vrijednosti neke pojave u vremenu. U tu svrhu
slue apsolutni i relativni pokazatelji.
Apsolutni pokazatelji raunaju se obinim oduzimanjem vrijednosti
pojave u jednom vremenskom razdoblju od vrijednosti iste pojave u drugom
razdoblju i izraavaju se u originalnim jedinicama mjere.
Pojedinane apsolutne promjene od razdoblja do razdoblja
raunaju se tako da se od vrijednosti pojave u tekuem razdoblju oduzme
vrijednost pojave u prethodnom razdoblju:
n t Y Y Y
t t t
,..., 2 , 1 ,
1
= =
(3.4.1)
Tumae se kao promjena vrijednosti pojave promatranog
vremenskog niza u originalnim jedinicama mjere u tekuem razdoblju u
odnosu na prethodno razdoblje.
101
Pojedinane apsolutne promjene u tekuem razdoblju u odnosu
prema nekom baznom razdoblju raunaju se tako da se od vrijednosti pojave
u tekuem razdoblju oduzme vrijednost pojave u odabranom baznom razdoblju:
n t Y Y Y
b t t
,..., 2 , 1 , = = (3.4.2)
Tumae se kao promjena vrijednosti pojave promatranog
vremenskog niza u originalnim jedinicama mjere u tekuem razdoblju u
odnosu na odabrano bazno razdoblje.
Relativni pokazatelji, za razliku od apsolutnih, omoguuju usporedbu
kretanja pojava s razliitim jedinicama mjere.
Individualni indeksi su relativni pokazatelji dinamike kretanja
vrijednosti pojave vremenskog niza i njima se usporeuje stanje jedne
pojave u razliitim vremenskim intervalima ili momentima.
Individualni indeksi dijele se na:
verine indekse
bazne indekse.
3.5. Verini indeksi i indeksi na stalnoj bazi
3.5.1. Verini indeksi
Verini indeksi pokazuju relativne promjene (u %) pojave u
tekuem razdoblju u odnosu na prethodno razdoblje, odnosno pokazuju za
koliko % se vrijednost pojave u jednom razdoblju promijenila u odnosu na
prethodno razdoblje.
Verini indeksi se raunaju:
. ,.... 3 , 2 , 100
1
N t
Y
Y
V
t
t
t
= =
(3.5.1)
Iz izraza (3.5.1) vidi se da se verini indeks rauna tako da se stavi u
odnos vrijednost pojave iz tekueg razdoblja s vrijednou pojave iz prethodnog
razdoblja i sve se mnoi sa 100. S obzirom da vrijednost vremenskog niza za
prethodno razdoblje od prvog nije poznata, ne moe se izraunati prvi verini
indeks u jednom nizu. Verini indeksi se jo nazivaju i lanani indeksi jer
pokazuju promjene pojave u uzastopnim vremenskim razdobljima i nadovezuju
se jedan na drugi.
102
Verini indeksi tumae se u postotcima preko stope promjene tako
da se od njih oduzme 100.
100 =
t t
V S (3.5.2)
Grafiki prikaz verinih indeksa je specifian. Crta se u
pravokutnom sustavu gdje je apscisa pomaknuta do veliine 100 na osi ordinata.
Ordinata se povlai za svako novo razdoblje. Za svaki novi vremenski period
ucrtava se poseban linijski grafikon s ishoditem uvijek u prethodnom
razdoblju. Tako se na grafikonu odmah moe uoiti promjena vrijednosti
promatrane pojave u jednom u odnosu na prethodno razdoblje.
Kako je ve naglaeno pomou verinih indeksa rauna se stopa
promjene vrijednosti promatrane pojave iz razdoblja u razdoblje.
Stopa promjene je relativna (postotna) promjena vrijednosti neke
pojave u tekuem u odnosu na prethodno razdoblje.
Rauna se prema izrazu (3.5.3):
. ,..., 3 , 2 , 100 1
1
N t
Y
Y
S
t
t
t
=
|
|
\
|
=
(3.5.3)
Ako se u gornjoj jednadbi vrijednosti u zagradama pomnoe sa 100,
vrijedi da je:
. ,..., 3 , 2 , 100 N t V S
t t
= = , (3.5.4)
to je ve dano izrazom (3.5.2).
Jednako kao kod verinih indeksa stopa promjene ne rauna se za prvo
razdoblje, u nizu, jer vrijednost promatrane pojave ispred prve obino nije
poznata.
Osim ovakve pojedinane stope promjene iz razdoblja u razdoblje,
statistika analiza esto zahtijeva raunanje prosjene stope promjene za itavo
promatrano razdoblje.
Prosjena stopa promjene je prosjena relativna (u %) promjena
vrijednosti neke pojave kroz razdoblja u ukupnom promatranom
vremenskom periodu.
Pretpostavka je da se vrijednost promatrane pojave u svakom razdoblju
mijenja (raste ili pada) za jednak postotak kroz neki izabrani, dulji vremenski
period.
Prosjena stopa promjene za neki dulji period rauna se pomou
geometrijske sredine verinih indeksa. Kako verinih indeksa ima (N-1), jer
se prvi u nizu ne rauna, geometrijska sredina bit e (N-1) korijen od njihovih
umnoaka:
103
1
1 2
1
3
4
2
3
1
2
1
1 4 3 2
... ...
/
/
/
/
/
/
/
= = N
N
N
N
N
N
N N
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
V V V V V G . (3.5.5)
Iz desnog dijela jednakosti (3.5.5) moe se vidjeti da se mogu kratiti
sve vrijednosti pojave osim Y
1
i Y
N
, stoga vrijedi da je geometrijska sredina
verinih indeksa:
1
1
= N
N
Y
Y
G , (3.5.6)
dakle, pod korijenom ostaje omjer posljednje i prve frekvencije vremenskog
niza.
Prosjena stopa promjene rauna se prema (3.5.7):
100 ) 1 ( = G S . (3.5.7)
Ako su zadani godinji podaci onda je to prosjena godinja stopa
promjene, ako su podaci dani po mjesecima, rije je o prosjenoj mjesenoj
stopi promjene i slino.
Moe se vriti i preraunavanje prosjene stope promjene s duljeg
na krae i s kraeg na dulje vremensko razdoblje. Na primjer, ako se eli
izraunati prosjena mjesena stopa promjene od prosjene godinje stope bit
e:
100 ) 1 ( ,
12
= =
mj mj god mj
G S G G , (3.5.8)
dakle, rauna se dvanaesti korijen od godinje geometrijske sredine jer godina
ima 12 mjeseci.
Na primjer, ako se eli izraunati prosjena godinja stopa promjene od
prosjene polugodinje stope bit e:
100 ) 1 ( ,
.
2
. .
= =
polug polug polug god
G S G G , (3.5.9)
odnosno rauna se na drugu potenciju od polugodinje geometrijske sredine jer
godina ima 2 polugodita.
Uz pretpostavku da e se vrijednosti neke pojave nastaviti kretati i
u budunosti na isti nain, odnosno prema izraunatoj prosjenoj stopi
promjene kao i u promatranom razdoblju preko geometrijske sredine moe
se, poevi od posljednjeg elementa (Y
N
) u nizu, vriti prognoza njenog
kretanja:
t
N t N
G Y Y =
+
, (3.5.10)
gdje je:
104
t N
Y
+
t
t
t
V
I
I , (3.5.16)
za razdoblja poslije baznog (b=100), rauna se unaprijed:
100
1
=
t t
t
I V
I . (3.5.17)
107
Primjer 3.5.2.
Tablica 3.3.
Uvoz banana na podruju Z u razdoblju od 1996. do 2005. god.
Godina Uvezene koliine
banana u tisuama t
Bazni indeksi
1996.=100 (I
t
)
Stope promjene
(S
t
)
1996. 21 100,0 0,0
1997. 19 90,5 -9,5
1998. 25 119,0 19,0
1999. 20 95,2 -4,8
2000. 18 85,7 -14,3
2001. 23 109,5 9,5
2002. 25 119,0 19,0
2003. 28 133,3 33,3
2004. 24 114,3 14,3
2005. 27 128,6 28,6
Izvor: Statistika podruja Z, 2006. god.
Zadatak je izraunati bazne indekse (1996.=100) i pripadajue stope promjene
te indekse prikazati linijskim grafikonom.
Vrijednosti baznih indeksa navedene su u treem stupcu tablice, a pripadajue
stope promjene u etvrtom stupcu. Posljednji izraunani bazni indeks iznosi
128,6 i pokazuje da je na svakih 100 t uvezenih banana u 1996. godini dolazilo
128,6 t uvezenih u 2005. godini, ili za 28,6% vie.
Grafiki prikaz baznih indeksa linijskim grafikonom je sljedei:
Grafikon 14.
Bazni indeksi uvoza banana na podruju Z, 1996.=100
80
90
100
110
120
130
140
1996. 1997. 1998. 1999. 2000. 2001. 2002. 2003. 2004. 2005.
Izvor: Statistika podruja Z, 2006. god.
108
3.6. Skupni indeksi
Skupni indeksi su relativni pokazatelji dinamike kretanja
vrijednosti skupine pojava vremenskog niza koje su na neki nain
povezane ili su meusobno sline po nekim karakteristikama.
Razdoblje u kojem se iskazuje dinamika skupine pojava naziva se
tekue ili izvjetajno razdoblje (esto se oznaava s 1), dok se razdoblje s
kojim se usporeuje dinamika naziva bazno ili poetno razdoblje (esto se
oznaava s 0).
Najee se raunaju:
skupni indeks cijena
skupni indeks koliina
skupni indeks vrijednosti.
U praksi postoji problem raunanja ovih skupnih indeksa jer nema
jedinstvenog izraza kojim bi se oni mogli izraunavati. U upotrebi su
Laspeyresov i Paascheov
9
oblik skupnih indeksa. Osnovna razlika je u tome
da Laspeyresovi indeksi imaju pondere iz baznog (0) razdoblja, a
Paascheovi indeksi imaju pondere iz tekueg (1) razdoblja.
Postoje jo i neki posebni pojavni oblici ovih indeksa, na primjer
indeksi potroakih cijena su posebni oblici indeksa cijena koje ulaze u
potroake cijene.
3.6.1. Skupni indeksi cijena
Skupni indeks cijena je relativni pokazatelj dinamike kretanja
cijena skupine pojava u tekuem razdoblju u odnosu na bazno razdoblje.
Oblici ovog indeksa su:
a) Laspeyresov skupni indeks cijena i
b) Paascheov skupni indeks cijena.
9
Prezimena poznatih statistiara.
109
Laspeyresov skupni indeks cijena je vagana aritmetika sredina
individualnih indeksa cijena, gdje su ponderi koliine iz baznog, odnosno
nultog razdoblja.
Laspeyresov skupni indeks cijena pokazuje za koliko posto su se
promijenile cijene skupine pojava zajedno u izvjetajnom u odnosu na
bazno razdoblje, raunajui uz neizmijenjene koliine iz baznog razdoblja.
Agregatni oblik ovog indeksa je:
100 ) (
1
0 0
1
0 1
0 01
=
=
=
k
i
i i
k
i
i i
q p
q p
q P , (3.6.1)
gdje je:
=
k
i
i i
q p
1
0 1
- suma umnoaka cijena iz izvjetajnog i koliina iz nultog razdoblja
=
k
i
i i
q p
1
0 0
- suma umnoaka cijena iz nultog i koliina iz nultog razdoblja.
Paascheov skupni indeks cijena je vagana aritmetika sredina
individualnih indeksa cijena, gdje su ponderi koliine iz izvjetajnog,
odnosno tekueg razdoblja.
Paascheov skupni indeks cijena pokazuje za koliko posto su se
promijenile cijene skupine pojava zajedno u izvjetajnom u odnosu na
bazno razdoblje, raunajui uz neizmijenjene koliine iz izvjetajnog
razdoblja.
Agregatni oblik ovog indeksa je:
100 ) (
1
1 0
1
1 1
1 01
=
=
=
k
i
i i
k
i
i i
q p
q p
q P , (3.6.2)
gdje je:
=
k
i
i i
q p
1
1 1
- suma umnoaka cijena iz izvjetajnog i koliina iz izvjetajnog
razdoblja
=
k
i
i i
q p
1
1 0
- suma umnoaka cijena iz nultog i koliina iz izvjetajnog razdoblja.
Odreene ekonomske analize esto u praksi zahtijevaju posebne oblike
skupnog indeksa cijena. Od posebne je vanosti indeks potroakih cijena
10
10
Do kraja 2003. godine u Republici Hrvatskoj je u slubenim statistikama u istoj
funkciji bio indeks trokova ivota. Indeks potroakih cijena uveden je od 2004.
110
koji odraava promjene cijena dobara i usluga koje koristi referentno
stanovnitvo radi finalne potronje.
Indeks potroakih cijena slui za mjerenje inflacije (odnosno
porasta cijena) u privredi, za ouvanje vrijednosti kod ugovora s indeksnim
klauzulama kao osnova za deflacioniranje (uklanjanje utjecaja inflacije, tj.
porasta cijena) odreenih vrijednosnih pokazatelja i slino.
Dravni zavod za statistiku Republike Hrvatske ovaj indeks rauna na
osnovi reprezentativne koarice koju ini oko 540 proizvoda. Svaki mjesec
prikuplja se vie od 25 000 cijena na unaprijed definiranom uzorku prodajnih
mjesta na devet lokacija u zemlji (Zagreb, Slavonski Brod, Osijek, Sisak,
Rijeka, Pula, Split, Dubrovnik i Varadin), odabranih prema kriteriju broja
stanovnika i reprezentativnosti za pojedinu statistiku regiju.
Pomou ovog indeksa mjeri se utjecaj potroakih cijena na nominalne
plae, odnosno raunaju se realne plae.
Realne plae 100
cijena potr. Indeksi
pl. Nominalne
= , (3.6.3)
gdje su indeksi u nazivniku izraza bazni po nekom odabranom razdoblju.
Vrijedi da je:
100
. .
. . min .
. . . =
cijena potr Ind
pl no Ind
pl real Ind , (3.6.4)
gdje su svi indeksi bazni po nekom (istom) odabranom razdoblju radi
usporedivosti podataka.
1.6.2. Skupni indeksi koliina
Skupni indeks koliina je relativni pokazatelj dinamike kretanja
koliina skupine pojava u tekuem razdoblju u odnosu na bazno razdoblje.
Oblici ovog indeksa su:
a) Laspeyresov skupni indeks koliina
b) Paascheov skupni indeks koliina.
godine da bi se slubena statistika izvjea u Hrvatskoj uskladila sa svjetskim
obraunima i pokazateljima.
111
Laspeyresov skupni indeks koliina je vagana aritmetika sredina
individualnih indeksa koliina, gdje su ponderi cijene iz baznog, odnosno
nultog razdoblja.
Laspeyresov skupni indeks koliina pokazuje za koliko posto su se
promijenile koliine skupine pojava zajedno u izvjetajnom u odnosu na
bazno razdoblje, raunajui uz neizmijenjene cijene iz baznog razdoblja.
Agregatni oblik ovog indeksa je:
100 ) (
1
0 0
1
0 1
0 01
=
=
=
k
i
i i
k
i
i i
p q
p q
p Q , (3.6.5)
gdje je:
=
k
i
i i
p q
1
0 1
- suma umnoaka koliina iz izvjetajnog i cijena iz nultog razdoblja
=
k
i
i i
p q
1
0 0
- suma umnoaka koliina iz nultog i cijena iz nultog razdoblja.
Paascheov skupni indeks koliina je vagana aritmetika sredina
individualnih indeksa koliina, gdje su ponderi cijene iz izvjetajnog,
odnosno tekueg razdoblja.
Paascheov skupni indeks koliina pokazuje za koliko posto su se
promijenile koliine skupine pojava zajedno u izvjetajnom u odnosu na
bazno razdoblje, raunajui uz neizmijenjene cijene iz izvjetajnog
razdoblja.
Agregatni oblik ovog indeksa je:
100 ) (
1
1 0
1
1 1
1 01
=
=
=
k
i
i i
k
i
i i
p q
p q
p Q , (3.6.6)
gdje je:
=
k
i
i i
p q
1
1 1
- suma umnoaka koliina iz izvjetajnog i cijena iz izvjetajnog
razdoblja
=
k
i
i i
q p
1
1 0
- suma umnoaka cijena iz nultog i koliina iz izvjetajnog razdoblja.
Posebni oblik skupnog indeksa koliina je skupni indeks fizikog
obujma.
112
Najprije se pomou skupnog indeksa cijena vri postupak
deflacioniranja vrijednosnih pokazatelja. Na taj nain se iz vrijednosnih
pokazatelja odstranjuje utjecaj cijena (najee inflacije, tj. porasta cijena).
Vrijed. u stalnim cijenama 100
cijena Indeksi
cijenama tek. u Vrijed.
= , (3.6.7)
gdje su indeksi u nazivniku izraza bazni po nekom odabranom razdoblju.
Nakon toga se moe sagledati kretanje vrijednosnih pokazatelja u
fizikom obujmu:
100
. . . .
. . =
cijena Indeks
cij tek u vrijed Ind
obujma fiz Ind , (3.6.8)
gdje su svi indeksi bazni po nekom (istom) odabranom razdoblju, radi
usporedivosti podataka.
3.6.3. Skupni indeksi vrijednosti
Skupni indeks vrijednosti je relativni pokazatelj dinamike kretanja
vrijednosti skupine pojava u tekuem razdoblju u odnosu na bazno
razdoblje.
Vrijednost je umnoak koliine i cijene nekog proizvoda (i):
i i i
p q V = (3.6.9)
Skupni indeks vrijednosti je omjer vrijednosti skupine pojava u
izvjetajnom i vrijednosti skupine pojava u baznom razdoblju.
Skupni indeks vrijednosti pokazuje za koliko posto su se
promijenile vrijednosti skupine pojava zajedno u izvjetajnom u odnosu na
bazno razdoblje.
Rauna se:
100
1
0 0
1
1 1
01
=
=
=
k
i
i i
k
i
i i
p q
p q
V , (3.6.10)
gdje je:
=
k
i
i i
p q
1
1 1
- suma umnoaka koliina i cijena iz izvjetajnog razdoblja
113
=
k
i
i i
p q
1
0 0
- suma umnoaka koliina i cijena iz nultog razdoblja.
Isti rezultat moe se dobiti i mnoenjem Laspeyresovog
skupnog indeksa cijena i Paascheovog skupnog indeksa koliina:
100
100
100 100
100
) ( ) (
1
0 0
1
1 1
1
1 0
1
1 1
1
0 0
1
0 1
1 01 0 01
01
=
=
=
= =
=
=
=
k
i
i i
k
i
i i
k
i
i i
k
i
i i
k
i
i i
k
i
i i
p q
p q p q
p q
q p
q p
p Q q P
V
(3.6.11)
ili mnoenjem Paascheovog skupnog indeksa cijena i Laspeyresovog
skupnog indeksa koliina:
100
100
100 100
100
) ( ) (
1
0 0
1
1 1
1
0 0
1
0 1
1
1 0
1
1 1
0 01 1 01
01
=
=
=
= =
=
=
=
k
i
i i
k
i
i i
k
i
i i
k
i
i i
k
i
i i
k
i
i i
p q
p q p q
p q
q p
q p
p Q q P
V
(3.6.12)
Primjer 3.6.1.
Treba izraunati indekse koliina i cijena po Laspeyresovom i
Paascheovom obrascu za jedinicu koja proizvodi tri razliita proizvoda. Podaci
o proizvodnji tri proizvoda u 2007. i 2008. godini su sljedei:
Tablica 3.4.
Proizvod Mjerna
jedinica
Koliine
2007.
q
0
Koliine
2008.
q
1
Cijene
2007.
p
0
Cijene
2008.
p
1
A komad 10 12 25 30
B litra 30 40 40 40
C m
2
20 15 60 72
Izvor: Podaci su simulirani
Zadatak je izraunati:
a) za koliko % su se u prosjeku promijenile cijene u 2008. godini u odnosu na
2007. godinu?
b) za koliko % su se u prosjeku promijenile proizvedene koliine u 2008. godini
u odnosu na 2007. godinu?
c) za koliko % se u prosjeku promijenila vrijednost proizvodnje u 2008. godini
u odnosu na 2007. godinu?
114
Za izraun navedenih indeksa potrebni su sljedei izrauni:
Proizvod Mjerna
jedinica
q
1
p
1
q
0
p
0
q
0
p
1
q
1
p
0
A komad 360 250 300 300
B litra 1600 1200 1200 1600
C m
2
1080 1200 1440 900
Ukupno 3040 2650 2940 2800
a) Laspeyresovom skupni indeks koliina glasi:
( ) 7 , 105 100
2650
2800
100
1
0 0
1
0 1
0 01
= = =
=
=
k
i
i i
k
i
i i
p q
p q
p Q
Paascheovom skupni indeks koliina iznosi:
( ) 4 , 103 100
2940
3040
100
1
1 0
1
1 1
1 01
= = =
=
=
k
i
i i
k
i
i i
p q
p q
p Q
Indeks koliina izraunan po Laspeyresovom obrascu pokazuje da su se
proizvedene koliine tri proizvoda 2008. godine u odnosu na 2007. godinu u
prosjeku poveale za 5.7%, dok su upotrebom Paascheovog obrasca poveane u
prosjeku za 3.4%.
b) Laspeyresovom skupni indeks cijena glasi:
( ) 9 , 110 100
2650
2940
100
1
0 0
1
0 1
0 01
= = =
=
=
k
i
i i
k
i
i i
q p
q p
q P
Paascheovom skupni indeks cijena iznosi:
( ) 6 , 108 100
2800
3040
100
1
1 0
1
1 1
1 01
= = =
=
=
k
i
i i
k
i
i i
q p
q p
q P
Indeks cijena izraunan po Laspeyresovom obrascu pokazuje da su se cijene tri
proizvoda 2008. godine u odnosu na 2007. godinu u prosjeku poveale za
10.9%. Upotrebom Paascheovog obrasca indeks cijena pokazuje porast od 8.6%
u prosjeku.
115
c) Skupni indeks vrijednosti proizvodnje iznosi:
7 , 114 100
2650
3040
100
1
0 0
1
1 1
01
= = =
=
=
k
i
i i
k
i
i i
p q
p q
V
Indeks vrijednosti proizvodnje pokazuje da se vrijednost proizvodnje tri
proizvoda 2008. godine u odnosu na 2007. godinu u prosjeku poveala za
14,7%.
3.7. Modeli trendova
Najee su u upotrebi trend-modeli:
1. Trend polinomi k-tog stupnja
2. Eksponencijalni trend modeli
3. Hiperboliki trend modeli
4. Asimptotski trend modeli.
3.7.1. Trend polinomi k-tog stupnja
k
k
X X X Y
...
2
2 1 0
+ + + + = (3.7.1)
Ocjena parametara najee se dobije metodom najmanjih kvadrata
zbog njenih optimalnih svojstava. Kae se da se tom metodom dobiju najbolje
linearne nepristrane ocjene parametara (BLUE), naravno uz uvjet da su
ispunjene sve pretpostavke koje ova metoda zahtijeva.
Ako je stupanj polinoma 1, tj. =1 k ocjenjuje se model linearnog
trenda (odnosno kada se vrijednost pojave u svakoj vremenskoj jedinici
mijenja za priblino isti apsolutni iznos
1 1
= =
t t t
Y Y Y )
116
Ako je stupanj polinoma k ocjenjuje se model trend polinoma k-tog
stupnja, (odnosno ako su k-te diferencije vrijednosti vremenskog niza
priblino konstantne ocjenjuje se (k+1) parametar trend polinoma):
. const y
t
k
(3.7.2)
3.7.1.1. Model linearnog trenda
Model linearnog trenda objanjava linearno kretanje (pozitivno ili
negativno) vrijednosti promatranog vremenskog niza kroz vrijeme. Osim
prikaza linearnog kretanja pojave vremenskog niza na temelju ocijenjenog
modela moe se vriti predvianje vrijednosti pojave za neka budua
razdoblja.
Model linearnog trenda openito je oblika:
t t t
e X Y + + =
1 0
, (3.7.3)
gdje je:
Y- ovisna varijabla, tj. vrijednosti vremenskog niza
X - neovisna varijabla, tj. vrijeme (treba napomenuti da se kod trend
modela mora izabrati ishodino razdoblje kojemu se dodjeljuje vrijednost 0.
Ako nula nije prva u nizu onda razdoblja prije nultog unatrag imaju vrijednosti:
-1,-2,-3,, a prema naprijed su vrijednosti: 1,2,3,)
e - sluajna komponenta.
Model ima sluajnu komponentu e , koja upuuje da veze izmeu
vrijednosti pojave vremenskog niza i vremena u praksi nisu funkcionalne, nego
su statistike ili stohastike, odnosno oko linije konkretnog linearnog trend
modela postoje pozitivna i/ili negativna odstupanja originalnih vrijednosti.
Ocijenjeni linearni trend model je:
X Y
1 0
+ = . (3.7.4)
Parametri
1 0
i ocjenjuju se tako da pravac Y
prolazi izmeu
stvarnih toaka vremenskog niza i da najbolje tumai vezu izmeu njih,
odnosno pravac mora biti takav da odstupanja
t
e budu najmanja.
Postoji vie razliitih metoda za ocjenu ovih parametara, a najee
koritena metoda je metoda najmanjih kvadrata, koja upravo procjenjuje
parametre
1 0
i tako da odstupanja e
t
budu najmanja. Ona kao i kod
117
regresije daje najbolje linearne nepristrane ocjene i vrlo je esto primjenjivana
metoda za ocjenu parametara.
t t t
e Y Y + =
(3.7.5)
Odstupanja originalnih vrijednosti od ocijenjenih vrijednosti
t
e mogu
biti pozitivna i negativna. Da se meusobno ne bi ponitile pozitivne i negativne
vrijednosti, metoda minimalizira sumu kvadrata od
t
e .
| | + = =
= = =
n
t
t t
n
t
t t
n
t
t
X Y Y Y e
1
2
1 0
1
2
1
2
)
( min )
=
= = 1 1
, (3.7.8)
jednostavne aritmetike sredine varijabli X i Y.
Konano je ocijenjeni model:
...... , 0
.....
.....
,
1 0
=
=
=
+ =
X
Y za jedinica
X za jedinica
X Y
, (3.7.9)
gdje je
0
kada
je X=0).
Regresijski koeficijent
1
.
Vrijedi da je:
( )
2
1
1
1
0
2
1
Y n Y X Y Y Y SP
n
t
t t
n
t
t
n
t
t
+ = =
= = =
(3.7.10)
Dakle SP je suma kvadrata protumaenog dijela, odstupanja
vrijednosti varijable vremenskog niza Y od aritmetike sredine, odnosno suma
kvadrata odstupanja ocijenjenih vrijednosti varijable Y od aritmetike
sredine.
( ) = =
= = = =
n
t
t t
n
t
t
n
t
t
n
t
t t
Y X Y Y Y Y SR
1
1
1
0
1
2
2
1
(3.7.11)
SR je suma kvadrata neprotumaenog dijela, odstupanja vrijednosti
varijable Y od aritmetike sredine, odnosno suma kvadrata odstupanja
originalnih ili empirijskih vrijednosti varijable Y od ocijenjenih
vrijednosti. Ova odstupanja su u stvari sluajne pogrjeke
t
e .
( )
2
1
2
2
1
Y n Y Y Y ST
n
t
t
n
t
t
= =
= =
(3.7.12)
ST je suma kvadrata ukupnih odstupanja vrijednosti varijable
vremenskog niza Y od aritmetike sredine.
Vrijedi da je:
ST SR SP = + , (3.7.13)
Ovaj izraz zove se jednadba analize varijance i predstavlja temelj
analize reprezentativnosti trend modela.
Standardna pogrjeka trend modela je apsolutni pokazatelj
reprezentativnosti trend modela, a pokazuje prosjeni stupanj varijacije
stvarnih vrijednosti ovisne varijable u odnosu na oekivane trend
vrijednosti.
2
=
n
SR
Y
(3.7.14)
Izraz (3.7.14) je standardna pogrjeka linearnog trend modela. Ovaj
pokazatelj izraen je u originalnim jedinicama mjere varijable vremenskog niza
Y. Stoga je na temelju standardne pogrjeke trend modela teko usporeivati
reprezentativnost modela s razliitim mjernim jedinicama.
119
Taj problem eliminira relativni pokazatelj - koeficijent varijacije
trend modela, koji predstavlja postotak standardne pogrjeke trenda od
aritmetike sredine varijable Y.
100
=
Y
V
Y
Y
(3.7.15)
Najmanja vrijednost koeficijenta varijacije je 0%, a najvea nije
definirana. to je koeficijent varijacije trend modela blii nuli, to je model
reprezentativniji.
Koeficijent determinacije je pokazatelj reprezentativnosti trend
modela koji se temelji na analizi varijance. On se definira kao omjer sume
kvadrata odstupanja protumaenih trend modelom i sume kvadrata
ukupnih odstupanja.
ST
SP
r =
2
(3.7.16)
Koeficijent determinacije pokazuje koliko % je sume kvadrata
odstupanja vrijednosti varijable Y od aritmetike sredine protumaeno
trend modelom.
Vrijedi da je:
ST
SR
r = 1
2
(3.7.17)
Vrijednost koeficijenta determinacije kree se u intervalu 1 0
2
r .
Trend model je reprezentativniji ako je ovaj pokazatelj blii 1. Teorijska
granica reprezentativnosti modela je 0,9. U praksi je ponekad vrlo teko pronai
varijablu koja dobro objanjava kretanje vremenskog niza u vremenu, stoga se
ta granica reprezentativnosti sputa i nie.
120
Primjer 3.7.1.
Tablica 3.5.
Zaposlenost u Hrvatskoj u razdoblju od 1995. do 2004. god.,
godinji prosjek u tisuama
Godina Broj
zaposlenih
(y
t
)
Varijabla
vrijeme
(x
t
)
t t
y x
2
t
x
2
t
y
Trend
vrijednosti
(
t
y
)
)
1995. 1196 0 0 0 1430416 1183,1
1996. 1195 1 1195 1 1428025 1200,6
1997. 1187 2 2374 4 1408969 1218,1
1998. 1272 3 3816 9 1617984 1235,5
1999. 1263 4 5052 16 1595169 1253,0
2000. 1258 5 6290 25 1582564 1270,4
2001. 1272 6 7632 36 1617984 1287,9
2002. 1289 7 9023 49 1661521 1305,3
2003. 1330 8 10640 64 1768900 1322,8
2004. 1355 9 12195 81 1836025 1340,3
Ukupno 12617 45 58217 285 15947557 12617
Izvor: Statistiki ljetopis Republike Hrvatske 2005. god., str. 132.
Zadatak je ocijeniti model linearnog trenda s ishoditem na poetku
vremenskog razdoblja i njegovu reprezentativnost te izraunati trend
vrijednosti.
Ocijenjeni model linearnog trenda glasi:
:
1 0
X Y
) ) )
+ = X Y 46 , 17 1 , 1183 + =
)
X=0, 1995. godine
Jedinica za X je jedna godina
Jedinica za Y je tisuu zaposlenih
46 , 17
5 , 4 10 285
7 , 1261 5 , 4 10 58217
2
1
2 2
1
1
=
=
=
=
n
t
t
n
t
t t
X n X
Y X n Y X
)
5 , 4
10
45
1
= = =
=
n
X
X
n
t
t
1 , 1183 5 , 4 46 , 17 7 , 1261
1 0
= = = X Y
) )
7 , 1261
10
12617
1
= = =
=
n
Y
Y
n
t
t
121
Koeficijent
1
)
pokazuje da se broj zaposlenih u Hrvatskoj, u analiziranom
razdoblju, poveavao prosjeno godinje za 17.460 zaposlenika.
Reprezentativnost ocijenjenog modela linearnog trenda izvodi se iz rezidualnih
odstupanja. Varijanca trenda je:
6 , 353
10
58217 46 , 17 12617 1 , 1183 15947557
1 1 1
1 0
2
2
=
=
=
= = =
n
Y X Y Y
n
t
n
t
n
t
t t t t
Y
) )
)
Standardna devijacija trenda iznosi:
8 , 18 6 , 353
2
= = =
Y Y
) )
Koeficijent varijacije trenda pokazuje da postotak standardne devijacije trenda
od aritmetike sredine varijable Y iznosi 1,49% (manji je od 10%) i ukazuje na
dobru reprezentativnost ocijenjenog linearnog trend modela:
49 , 1 100
7 , 1261
8 , 18
100 = = =
Y
V
Y
Y
)
)
Trend vrijednosti (
t
Y
)
), izraunane ocijenjenom jednadbom linearnog trenda,
pokazane su u posljednjem stupcu tablice 3.5.
3.7.1.2. Trend polinom drugog stupnja
Ako su 2. diferencije vrijednosti vremenskog niza priblino konstantne
ocjenjuje se (2+1) parametar trend polinoma:
.
2
const y
t
, (3.7.18)
iji je openiti oblik:
2
2 1 0
X X Y + + = (3.7.19)
Ocjenom parametara metodom najmanjih kvadrata trai se
minimum zbroja kvadrata empirijskih odstupanja u odnosu na trend vrijednosti:
Rauna se sustav od 3 jednadbe s 3 nepoznata parametra:
3 2 1
,
i .
= + +
= = =
n
i
i
n
i
i
n
i
i
Y X X N
1 1
2
2
1
1 0
(3.7.20)
122
= + +
= = = =
n
i
i i
n
i
i
n
i
i
n
i
i
Y X X X X
1 1
3
2
1
2
1
1
0
(3.7.21)
= + +
= = = =
n
i
i i
n
i
i
n
i
i
n
i
i
Y X X X X
1
2
1
4
2
1
3
1
1
2
0
. (3.7.22)
Rjeenje ovog sustava po parametrima
j
( Y n Y X Y X Y Y Y SP
n
t
t t
n
t
t t
n
t
t
n
t
t
+ + = =
= = = =
(3.7.23)
= =
= = = = =
n
t
t t
n
t
t t
n
t
t
n
t
t
n
t
t t
Y X Y X Y Y Y Y SR
1
2
2
1
1
1
0
1
2
1
2
)
( (3.7.24)
2
1
2
1
2
) ( Y n Y Y Y ST
n
t
t
n
t
t
= =
= =
(3.7.25)
Vrijedi da je:
ST SR SP = + , (3.7.26)
to predstavlja jednadbu analize varijance i predstavlja temelj analize
reprezentativnosti trend modela.
Standardna pogrjeka trenda je apsolutni pokazatelj
reprezentativnosti trend modela, a pokazuje prosjeni stupanj varijacije
stvarnih vrijednosti ovisne varijable u odnosu na oekivane trend
vrijednosti.
1
=
k n
SR
Y
(3.7.27)
Ovaj izraz je standardna pogrjeka trenda. Izraen je u originalnim
jedinicama mjere ovisne varijable Y.
Taj problem eliminira relativni pokazatelj - koeficijent varijacije
trenda, koji predstavlja postotak standardne pogrjeke trenda od
aritmetike sredine vremenskog niza Y.
100
=
Y
V
Y
Y
(3.7.28)
Najmanja vrijednost koeficijenta varijacije je 0%, a najvea nije
definirana. to je koeficijent varijacije modela blii nuli to je model
reprezentativniji. esto se uzima dogovorena granica reprezentativnosti od
10%. Dakle ako je koeficijent varijacije manji od 10% kae se da je model
dobar.
123
Koeficijent determinacije za model regresijskog polinoma 2.
stupnja:
ST
SP
r =
2
(3.7.29)
Korigirani koeficijent determinacije:
) 1 (
) 1 (
1
1
2 2
r
k n
n
r
+
= , (3.7.30)
je asimptotski nepristrana ocjena koeficijenta determinacije.
Primjer 3.7.2.
Tablica 3.6.
Prijevoz robe u eljeznikom prometu na podruju Z u razdoblju
od 1998. do 2008. god.
Godina Prevezeno
robe u
tisuama t
(y
t
)
Varijabla
vrijeme
(x
t
)
t t
y x
2
t
x
4
t
x
t t
y x
2
t
y
)
( )
2
t t
y y
)
1998. 336 -5 -1680 25 625 8400 289,6 2155,3
1999. 247 -4 -988 16 256 3952 251,2 17,6
2000. 185 -3 -555 9 81 1665 231,9 2199,5
2001. 181 -2 -362 4 16 724 231,7 2568,9
2002. 243 -1 -243 1 1 243 250,6 57,0
2003. 311 0 0 0 0 0 288,5 506,3
2004. 385 1 385 1 1 385 345,5 1557,8
2005. 450 2 900 4 16 1800 421,6 804,1
2006. 523 3 1569 9 81 4707 516,8 38,0
2007. 612 4 2448 16 256 9792 631,1 365,4
2008. 750 5 3750 25 625 18750 764,5 209,5
Ukupno 4223 0 5224 110 1958 50418 4223,0 10479,3
Izvor: Statistika podruja Z, 2009. god.
Zadatak je ocijeniti model trend polinoma drugog stupnja i koeficijent varijacije
trenda.
Ocijenjeni model trend polinoma drugog stupnja s ishoditem u sredini
vremenskog razdoblja glasi:
:
2
2 1 0
X X Y
) ) ) )
+ + =
2
54 , 9 49 , 47 5 , 288 X X Y + + =
)
X=0, 2003. godine
Jedinica za X je jedna godina
Jedinica za Y je 1000 t
124
5 , 288
110 110 1958 11
50418 110 1958 4223
1 1
2
1
2 4
1 1
2
1
2 4
1
0
=
=
=
= = =
= = = =
n
t
n
t
t
n
t
t t
n
t
n
t
t t
n
t
t t
n
t
t
X X X n
X Y X X Y
)
49 , 47
110
5224
1
2
1
1
= = =
=
=
n
t
t
n
t
t t
X
Y X
)
54 , 9
110 110 1958 11
4223 110 50418 11
1 1
2
1
2 4
1 1
2 2
1
2
=
=
=
= = =
= = =
n
t
n
t
t
n
t
t t
n
t
n
t
t t t
n
t
t
X X X n
Y X X Y n
)
Reprezentativnost ocijenjenog modela trend polinoma drugog stupnja ispitat e
se koeficijentom varijacije trenda:
4 , 9 100
9 , 383
2 , 36
100 = = =
Y
V
Y
Y
)
)
)
)
9 , 383
11
4223
1
= = =
=
n
Y
Y
n
t
t
2 , 36
1 2 11
3 , 10479
1
=
=
=
k n
SR
Y
)
)
k = 2 (stupanj polinoma)
3 , 10479 ) (
2
1
= =
=
t
n
t
t
Y Y SR
)
Koeficijent varijacije trend modela pokazuje da postotak standardne pogrjeke
trenda od aritmetike sredine varijable Y iznosi 9,4% i potvruje
reprezentativnost ocijenjenog modela trend polinoma drugog stupnja.
125
3.7.2. Eksponencijalni trend modeli
Eksponencijalni trend modeli su oblika:
k
x
k
x x
Y
...
2
2 1 0
= (3.7.31)
ili
k
X
k
X X
e Y
...
2
2
+ + + / +
= (3.7.32)
Ocjena parametara se najee dobije metodom najmanjih kvadrata.
=1 k
1
100 ) 1
(
1
= S - prosjena stopa promjene vrijednosti
vremenskog niza u jedinici vremena u %.
0
log
log
log (3.7.35)
Trai se minimum sume kvadrata neprotumaenih ili rezidualnih
odstupanja:
| | + = =
= =
n
t
t t
n
t
t t
X Y Y Y SR
1
2
1 0
1
2
)
log
log log
log
log log
log =
=
=
=
, (3.7.37)
gdje su:
n
Y
Y i
n
X
X
n
t
t
n
t
t
=
=
= = 1 1
log
log , (3.7.38)
jednostavne aritmetike sredine varijabli X i Y log .
Transformacijom:
1
log
1
0
log
0
10
10
= = i , (3.7.39)
dobiju se originalne vrijednosti parametara modela.
Parametar
0
(
1
u S = (3.7.40)
Jednadbe analize varijance kod modela jednostavnog
eksponencijalnog trenda transformiraju se na slian nain logaritmiranjem:
( )
2
1
1
1
0
2
1
log log
log log
log log
log Y n Y X Y Y Y SP
n
t
t t
n
t
t
n
t
t
+ = =
= = =
(3.7.41)
( ) = =
= = = =
n
t
t t
n
t
t
n
t
t
n
t
t t
Y X Y Y Y Y SR
1
1
1
0
1
2
2
1
log
log log
log log
log
=
n
SR
Y
(3.7.45)
Relativni pokazatelj, koeficijent varijacije trenda je:
100
log
log
log
=
Y
V
Y
Y
(3.7.46)
Ako je koeficijent varijacije manji od 10% kae se da je model dobar.
Koeficijent determinacije je pokazatelj reprezentativnosti modela koji
se temelji na analizi varijance. On se definira kao omjer sume kvadrata
odstupanja protumaenih trendom i sume kvadrata ukupnih odstupanja.
ST
SP
r =
2
(3.7.47)
Koeficijent determinacije pokazuje koliko % je sume kvadrata
odstupanja logaritama vrijednosti niza Y od aritmetike sredine njenih
logaritamskih vrijednosti protumaeno trend modelom.
Vrijedi da je:
ST
SR
r = 1
2
(3.7.48)
Vrijednost koeficijenta determinacije kree se u intervalu 1 0
2
r .
Trend model je reprezentativniji ako je ovaj pokazatelj blii 1. Teorijska
granica reprezentativnosti modela je 0,9. U praksi je ponekad vrlo teko pronai
varijablu koja dobro objanjava ovisnu pojavu pa se ta granica
reprezentativnosti sputa i do 0,6.
Korigirani koeficijent determinacije:
) 1 (
) 1 (
1
1
2 2
r
k n
n
r
+
= ,
je asimptotski nepristrana ocjena koeficijenta determinacije.
128
Primjer 3.7.3.
Tablica 3.7.
Krediti odobreni stanovnitvu u banci Z
u razdoblju od 1999. do 2008. god.
Godina Krediti u
mil. kn (Y
t
)
Varijabla
vrijeme (X
t
)
t
Y log
2
t
X
t t
Y X log
t
Y
)
log
1999. 10,5 0 1,02119 0 0,00000 0,94280
2000. 9,8 1 0,99123 1 0,99123 1,08466
2001. 18,3 2 1,26245 4 2,52490 1,22652
2002. 24,8 3 1,39445 9 4,18336 1,36838
2003. 28,4 4 1,45332 16 5,81327 1,51024
2004. 41,6 5 1,61909 25 8,09547 1,65210
2005. 62,5 6 1,79588 36 10,77528 1,79396
2006. 88,8 7 1,94841 49 13,63889 1,93582
2007. 125,1 8 2,09726 64 16,77806 2,07768
2008. 169,2 9 2,22840 81 20,05560 2,21954
Ukupno 579,0 45 15,81168 285 82,85606 15,81168
Izvor: Podaci banke Z, 2009. god.
Zadatak je ocijeniti model jednostavnog eksponencijalnog trenda i koeficijent
varijacije trenda.
Model jednostavnog eksponencijalnog trenda glasi:
X
Y 1
0
) ) )
=
Za ocjenu parametara metodom najmanjih kvadrata model je potrebno
logaritamski linearizirati:
X Y + =
1 0
log log
) ) )
Ocjena parametara je sljedea:
14186 , 0
5 , 4 10 285
58117 , 1 5 , 4 10 85606 , 82
log log
log
2
1
2 2
1
1
=
=
=
=
n
t
t
n
t
t t
X n X
Y X n Y X
)
94280 , 0 5 , 4 14186 , 0 58117 , 1 log log log
1 0
= = = X Y
) )
5 , 4
10
45
1
= = =
=
n
X
X
n
t
t
58117 , 1
10
81168 , 15
log
log
1
= = =
=
n
Y
Y
n
t
t
Ocijenjeni logaritamski linearizirani model je:
X Y + = 14186 , 0 94280 , 0 log
)
129
Transformacijom:
766 , 8 10 10
94280 , 0 log log
0
0
= = =
) )
386 , 1 10 10
14186 , 0 log log
1
1
= = =
) )
dobiju se vrijednosti parametara modela, stoga ocijenjeni model jednostavnog
eksponencijalnog trenda glasi:
X
Y 386 , 1 766 , 8 =
)
X=0, 1999. godine
Jedinica za X je jedna godina
Jedinica za Y je 1 milijun kn
Parametar
1
)
pokazuje ocjenu prosjene stope promjene varijable Y u jedinici
vremena X:
% 6 , 38 100 ) 1 386 , 1 ( 100 ) 1 (
1
= = =
)
S
znai da su se krediti odobreni stanovnitvu u analiziranom razdoblju u prosjeku
poveavali po stopi od 38,6% godinje.
Reprezentativnost ocijenjenog modela ispitat e se koeficijentom varijacije
trenda:
3 , 3 100
58117 , 1
05220 , 0
100
log
log
log
= = =
Y
V
Y
Y
)
)
)
)
05220 , 0
2 10
02180 , 0
2
log
=
=
n
SR
Y
)
)
02180 , 0 ) log (log
2
1
= =
=
t
n
t
t
Y Y SR
)
Potreban je sljedei izraun:
Godina
t
Y log
t
Y
)
log
2
) log (log
t t
Y Y
)
1999. 1,02119 0,94280 0,00615
2000. 0,99123 1,08466 0,00873
2001. 1,26245 1,22652 0,00129
2002. 1,39445 1,36838 0,00068
2003. 1,45332 1,51024 0,00324
2004. 1,61909 1,65210 0,00109
2005. 1,79588 1,79396 0,00000
2006. 1,94841 1,93582 0,00016
2007. 2,09726 2,07768 0,00038
2008. 2,22840 2,21954 0,00008
Ukupno 15,81168 15,81168 0,02180
130
Koeficijent varijacije trend modela iznosi 3,3% i potvruje dobru
reprezentativnost ocijenjenog jednostavnog eksponencijalnog modela trenda.
3.7.3. Hiperboliki trend modeli
Hiperboliki trend modeli su oblika:
k
k
X X X
Y
...
1
2
2 1 0
+ + + +
= (3.7.49)
Ocjena parametara najee se dobije metodom najmanjih kvadrata
(BLUE).
k ako su k-te diferencije recipronih vrijednosti vremenskog niza
priblino konstantne ocjenjuje se (k+1) parametar hiperbolikog trenda:
. )
1
( const
Y
t
k
(3.7.50)
3.7.3.1. Jednostavni hiperboliki trend
Jednostavni hiperboliki trend model je openito oblika:
X
Y
+
=
1 0
1
(3.7.51)
Da bi se za ocjenu parametara upotrijebila metoda najmanjih
kvadrata, potrebno je poetni model invertnom transformacijom prevesti u
linearni oblik:
X
Y
+ =
1 0
1
(3.7.52)
Nakon primjene matematikog postupka traenja minimuma sume
kvadrata neprotumaenih ili rezidualnih odstupanja dobije se da je:
131
X
Y
i
X n X
Y
nX
Y
X
t
n
t
t
t
n
t
t
t
1 0
2
1
2
1
1
)
1
(
)
1
( )
1
(
=
=
=
=
, (3.7.53)
gdje su:
n
Y
Y
i
n
X
X
n
t
t
n
t
t
=
=
= = 1 1
1
)
1
( . (3.7.54)
Parametar
0
, tj.
iznositi e
0
jedinica.
Parametar
1
=
=
n
t
t
n
t
t t t
X n X
Y X n Y X
)
116817 , 0 7 ) 003143 , 0 ( 09481 , 0 ) / 1 (
1 0
= = = X Y
t
) )
133
7
15
105
1
= = =
=
n
X
X
n
t
t
09481 . 0
15
42222 , 1
/ 1
) / 1 (
1
= = =
=
n
Y
Y
n
t
t
t
Ocijenjeni jednostavni hiperboliki model glasi:
X
Y
003143 , 0 116817 , 0
1
=
)
X=0, 1994. godine
Jedinica za X je jedna godina
Jedinica za Y je 1 tisua t
Trend vrijednosti prikazane su u posljednjem stupcu tablice 3.8.
3.7.4. Asimptotski trend modeli
Asimptotski trend modeli spadaju u skupinu pravih nelinearnih trend
modela. Koriste se za opisivanje razvojne tendencije pojava koje se na dugi rok
pribliavaju nekoj graninoj vrijednosti - asimptoti.
Ocjene parametara ne mogu se dobiti metodom najmanjih kvadrata, jer
ove modele nije mogue transformirati da budu linearni u parametrima. Spadaju
u funkcionalne modele (nisu stohastiki ili statistiki modeli).
Tri najee koritena asimptotska trend modela:
1. Modificirani eksponencijalni trend
2. Logistiki trend
3. Gompertzov trend
Jo se zovu globalni modeli ocjene prisutnosti trend komponente u
odgovarajuem vremenskom nizu. (Zasnivaju se na primjeni svih frekvencija
vremenskog niza koje imaju isto znaenje ili ponder pri prognozi, bez obzira
da li se nalaze na poetku vremenskog niza ili su blie tekuem razdoblju).
Parametri ovih modela ocjenjuju se specifinim metodama ocjena:
a) iterativne metode
b) aproksimativna ocjena parametara
Iterativne metode rade se putem raunala pomou suvremenih
statistikih paketa.
134
Aproksimativne metode ocjene parametara su:
1. metoda parcijalnih suma
2. metoda triju odabranih toaka.
3.7.4.1. Modificirani eksponencijalni trend
Modificirani eksponencijalni trend je oblika:
x
B A L Y + =
. (3.7.55)
Mogui oblici modela modificiranog eksponencijalnog trenda u
ovisnosti o parametrima A, B i L prikazani su na slici 3.1.:
Slika 3.1.
Modificirani eksponencijalni trend model upotrebljava se za prikaz
trend komponente vremenskog niza kojemu su omjeri prvih diferencija
vremenskog niza priblino konstantne:
.
1
const
Y
Y
t
t
(3.7.56)
A>0, B>1
0
L
A<0, B>1
0
L
A>0, B<1
0
L
A<0, B<1
0
L
135
Ocjena parametara modificiranog eksponencijalnog trenda:
1. metodom parcijalnih suma
3
,
1 2
2 3
N
r
S S
S S
B r =
= , (3.7.57)
2
1 2
) 1 (
1
) (
=
r
B
B
S S A , (3.7.58)
|
|
\
|
+
=
2 3 1
2
2 3 1
2
1
S S S
S S S
r
L , (3.7.59)
gdje su:
1
S - parcijalna suma prve treine vrijednosti vremenskog niza
2
S - parcijalna suma druge treine vrijednosti vremenskog niza
3
S - parcijalna suma tree treine vrijednosti vremenskog niza.
2. metodom triju odabranih toaka
2
1
,
=
=
N
r
Y Y
Y Y
B r
I II
II III
, (3.7.60)
1
=
r
I II
B
Y Y
A , (3.7.61)
A Y L
I
= , (3.7.62)
gdje su:
I
Y - vrijednost pojave na poetku vremenskog niza
II
Y - vrijednost pojave u sredini vremenskog niza
III
Y - vrijednost pojave na kraju vremenskog niza.
136
Primjer 3.7.5.
Tablica 3.9.
Izvoz podruja Z u razdoblju od 2000. do 2008. god.
Godina Izvoz u milijunima
USD (Y
t
)
Varijabla
vrijeme (X
t
)
t
Y
)
2000. 100 0 98
2001. 102 1 103
2002. 109 2 110
2003. 119 3 119
2004. 130 4 130
2005. 145 5 145
2006. 168 6 165
2007. 191 7 191
2008. 222 8 225
Ukupno 1286 36 1286
Izvor: Statistika podruja Z, 2009. god.
Zadatak je ocijeniti model modificiranog eksponencijalnog trenda i trend
vrijednosti.
Model modificiranog eksponencijalnog trenda glasi:
X
B A L Y + =
)
Ocjena parametara modificiranog eksponencijalnog trenda metodom parcijalnih
suma je sljedea:
31 , 1
311 394
394 581
3
1 2
2 3
=
= r
S S
S S
B 3
3
9
3
= = =
n
r
44 , 16
) 1 31 , 1 (
1 31 , 1
) 311 394 (
) 1 (
1
) (
2 3 2 1 2
=
=
r
B
B
S S A
59 , 81
394 2 581 311
394 581 311
3
1
2
1
2
2 3 1
2
2 3 1
=
|
|
\
|
+
=
|
|
\
|
+
=
S S S
S S S
r
L
311 109 102 100
1
= + + = S
394 145 130 119
2
= + + = S
581 222 191 168
3
= + + = S
137
Ocijenjeni model modificiranog eksponencijalnog trenda glasi:
X
Y 31 , 1 44 , 16 59 , 81 + =
)
X=0, 2000. godine
Jedinica za X je jedna godina
Jedinica za Y je 1 milijun USD-a
Trend vrijednosti prikazane su u posljednjem stupcu tablice 3.9.
3.7.4.2. Logistiki trend
Logistiki trend je oblika:
x
B A L
Y
+
=
1
(3.7.63)
Oblik modela logistikog trenda prikazan je na slici 3.2.:
Slika 3.2.
U ekonomiji se krivulja logistikog trenda upotrebljava kod
opisivanja ivotnog vijeka nekog proizvoda (faza uhodavanja, faza ekspanzije
i faza stagnantnog razvoja).
Logistiki trend model upotrebljava se za prikaz trend komponente
vremenskog niza kojemu su omjeri prvih diferencija recipronih vrijednosti
vremenskog niza priblino konstantne:
.
) 1 (
) 1 (
1
const
Y
Y
t
t
(3.7.64)
xt
0
yt
138
Ocjena parametara logistikog trenda:
1. metodom parcijalnih suma
3
,
1 2
2 3
N
r
S S
S S
B r =
= (3.7.65)
2
1 2
) 1 (
1
) (
=
r
B
B
S S A (3.7.66)
|
|
\
|
+
=
2 3 1
2
2 3 1
2
1
S S S
S S S
r
L (3.7.67)
gdje su:
1
S - parcijalna suma prve treine recipronih vrijednosti vremenskog
niza
2
S - parcijalna suma druge treine recipronih vrijednosti vremenskog
niza
3
S - parcijalna suma tree treine recipronih vrijednosti
vremenskog niza.
2. metodom triju odabranih toaka
2
1
,
)
1
( )
1
(
)
1
( )
1
(
=
=
N
r
Y Y
Y Y
B r
I II
II III
(3.7.68)
1
)
1
( )
1
(
=
r
I II
B
Y Y
A (3.7.69)
A
Y
L
I
= )
1
( (3.7.70)
gdje su:
)
1
(
I
Y
- reciprona vrijednost pojave na poetku vremenskog niza
)
1
(
II
Y
- reciprona vrijednost pojave u sredini vremenskog niza
)
1
(
III
Y
- reciprona vrijednost pojave na kraju vremenskog niza.
139
Primjer 3.7.6.
Tablica 3.10.
Prodaja proizvoda Z u razdoblju od 2000. do 2008. god.
Godina Prodano tisua t
(Y
t
)
Varijabla
vrijeme (X
t
)
t
Y / 1
t
Y
)
2000. 56 0 0,017857 45,5
2001. 65 1 0,015384 74,1
2002. 88 2 0,011364 109,5
2003. 133 3 0,007519 145,1
2004. 186 4 0,005376 174,0
2005. 204 5 0,004902 193,9
2006. 210 6 0,004762 206,0
2007. 211 7 0,004739 212,8
2008. 214 8 0,004673 216,5
Ukupno 1367 36 0,076576 1377,4
Izvor: Podaci su simulirani.
Zadatak je ocijeniti model logistikog trenda i trend vrijednosti.
Model logistikog trenda glasi:
X
AB L
Y
+
=
1
)
Ocjena parametara logistikog trenda metodom parcijalnih suma je sljedea:
513174 , 0
044605 , 0 017797 , 0
017797 , 0 014174 , 0
3
1 2
2 3
=
= r
S S
S S
B 3
3
9
3
= = =
n
r
017448 , 0
) 1 513174 , 0 (
1 513174 , 0
) 044605 , 0 017797 , 0 (
) 1 (
1
) (
2 3 2 1 2
=
=
r
B
B
S S A
004536 , 0
017797 , 0 2 014174 , 0 044605 , 0
017797 , 0 014174 , 0 044605 , 0
3
1
2
1
2
2 3 1
2
2 3 1
=
|
|
\
|
+
=
|
|
\
|
+
=
S S S
S S S
r
L
044605 , 0 011364 , 0 015384 , 0 017857 , 0
1
= + + = S
017797 , 0 004902 , 0 005376 , 0 007519 , 0
2
= + + = S
014174 , 0 004673 , 0 004739 , 0 004762 , 0
3
= + + = S
140
Ocijenjeni model logistikog trenda glasi:
X
Y
513174 , 0 017448 , 0 004536 , 0
1
+
=
)
X=0, 2000. godine
Jedinica za X je jedna godina
Jedinica za Y je 1 tisua t
Trend vrijednosti prikazane su u posljednjem stupcu tablice 3.10.
3.7.4.3. Gompertzov trend
Gompertzov trend je oblika:
x
B
A L Y =
(3.7.71)
Mogui oblici modela Gompertzovog trenda u ovisnosti o parametrima
A, B i L prikazani su na slici 3.3.:
Slika 3.3.
U ekonomiji se krivulja Gompertzovog trenda upotrebljava
kod opisivanja ekonomskih pojava (faza uhodavanja, faza ekspanzije,
faza regresivnog rasta i faza stagnantnog razvoja)
logA>0, B>1
0
L
logA<0, B>1
0
L
logA>0, B<1
0
L
logA<0, B<1
0
L
141
Gompertzov trend model upotrebljava se za prikaz trend komponente
vremenskog niza kojemu su omjeri prvih diferencija logaritama vrijednosti
vremenskog niza priblino konstantne:
.
log
log
1
const
Y
Y
t
t
(3.7.72)
Ocjena parametara Gompertzovog trenda:
1. metodom parcijalnih suma
3
,
1 2
2 3
N
r
S S
S S
B r =
= , (3.7.73)
2
1 2
) 1 (
1
) ( log
=
r
B
B
S S A , (3.7.74)
|
|
\
|
+
=
2 3 1
2
2 3 1
2
1
log
S S S
S S S
r
L , (3.7.75)
gdje su:
1
S - parcijalna suma prve treine logaritamskih vrijednosti vremenskog
niza
2
S - parcijalna suma druge treine logaritamskih vrijednosti vremenskog
niza
3
S - parcijalna suma tree treine logaritamskih vrijednosti vremenskog
niza.
2. metodom triju odabranih toaka
2
1
,
log log
log log
=
=
N
r
Y Y
Y Y
B r
I II
II III
, (3.7.76)
1
log log
log
=
r
I II
B
Y Y
A , (3.7.77)
A Y L
I
= log log , (3.7.78)
gdje su:
I
Y log - logaritam vrijednosti pojave na poetku vremenskog niza
II
Y log - logaritam vrijednosti pojave u sredini vremenskog niza
III
Y log - logaritam vrijednosti pojave na kraju vremenskog niza.
142
Primjer 3.7.7.
Tablica 3.11.
Pretplatnici Interneta na podruju Z
u razdoblju od 2000. do 2008. god.
Godina Broj pretplatnika
Interneta (Y
t
)
Varijabla
vrijeme (X
t
)
t
Y log
2000. 4 0 0,852060
2001. 7 1 0,987955
2002. 8 2 1,028090
2003. 12 3 1,162515
2004. 20 4 1,351030
2005. 32 5 1,536400
2006. 68 6 1,847215
2007. 151 7 2,185599
2008. 393 8 2,596937
Ukupno 695 36 13,547801
Izvor: Statistika podruja Z, 2009. god.
Zadatak je ocijeniti Gompertzov trend.
Gompertzov trend ima oblik:
X
B
A L Y =
)
Ocjena parametara Gompertzovog trenda metodom parcijalnih suma je sljedea:
297208 , 1
868105 , 2 049945 , 4
040045 , 4 629751 , 6
3
1 2
2 3
=
= r
S S
S S
B 3
3
9
3
= = =
n
r
251039 , 0
) 1 297208 , 1 (
1 297208 , 1
) 868105 , 2 049945 , 4 (
) 1 (
1
) ( log
2 3 2 1 2
=
=
r
B
B
S S A
622993 , 0
049945 , 4 2 629751 , 6 868105 , 2
049945 , 4 629751 , 6 868105 , 2
3
1
2
1
log
2
2 3 1
2
2 3 1
=
|
|
\
|
+
=
|
|
\
|
+
=
S S S
S S S
r
L
868105 , 2 028090 , 1 987955 , 0 852060 , 0
1
= + + = S
049945 , 4 536400 , 1 351030 , 1 162515 , 1
2
= + + = S
629751 , 6 596937 , 2 185599 , 2 847215 , 1
3
= + + = S
Transformacijom:
782540 , 1 10 10
251039 , 0 log log
= = =
A
A 197526 , 4 10 10
622993 , 0 log log
= = =
L
L
143
dobiju se vrijednosti parametara modela, stoga ocijenjeni model Gompertzovog
trenda glasi:
X
Y
297208 , 1
782540 , 1 197526 , 4 =
)
X=0, 2000. godine
Jedinica za X je jedna godina
Jedinica za Y je 1 pretplatnik Internata
3.8. Procjene parametara
Intervalna procjena parametra
j
trend modela ocijenjenog metodom
najmanjih kvadrata uz odgovarajui nivo pouzdanosti procjene ) 1 ( je:
{ } = + < < 1 )
Pr
j j j j j
Se t Se t (3.8.1)
gdje je:
t - odgovarajua vrijednost iz tablica Studentove distribucije
1 - odgovarajui nivo pouzdanosti procjene (najee se uzima da je
95%),
)
(
j
Se - standardna pogrjeka ocijenjenog parametra koja se
izraunava:
jj
Y
j
s Se =
( , (3.8.2)
gdje
jj
s predstavlja vrijednost odgovarajueg dijagonalnog elementa u matrici
1
) (
X X
T
.
3.9. Pomini prosjeci
"Lokalni" trend modeli ili metode izglaivanja vremenskih nizova
izmeu ostalih su pomini prosjeci. Spadaju u neparametrijske metode za
utvrivanje trend komponente.
144
Pomini prosjeci su aritmetike sredine M uzastopnih frekvencija
vremenskog niza (pri emu je M<N). Mogu biti jednostavni i vagani pomini
prosjeci u ovisnosti o tome da li se pri njihovom izraunavanju rabi jednostavna
ili vagana aritmetika sredina M uzastopnih frekvencija vremenskog niza.
Neka su:
n t
Y Y Y Y ..., , ..., , ,
2 1
(3.9.1)
frekvencije vremenskog niza.
Jednostavni pomini prosjeci za M=2m+1 (neparan broj lanova
pominog prosjeka):
) ( ..., , 2 , 1 ,
1
*
m n m m t Y
M
Y
m
m s
s t t
+ + = =
=
+
, (3.9.2)
npr.: M=3: =
=
+
1
1
*
3
1
s
s t t
Y Y .
U ovom sluaju kod neparnog broja lanova pominog prosjeka,
vrijednost izraunatog prosjeka se pridruuje sredinjem lanu od njih M.
Jednostavni pomini prosjeci za M=2m (paran broj lanova
pominog prosjeka):
) ( ,..., 2 , 1 ,
2
1
2
1 1
) 1
) 1 (
*
m n m m t Y Y Y
M
Y
m t
m
m s
s t m t t
+ + =
(
+ + =
+
=
+
, (3.9.3)
npr.: M=4:
(
+ + =
+
=
+ 2
1
1
2
*
2
1
2
1
4
1
t
s
s t t t
Y Y Y Y .
Gornji izraz kod parnog broja lanova pominog prosjeka omoguuje
tzv. Centriranje jer bi se u suprotnom pomini prosjeci nali izmeu dvije
susjedne vremenske toke.
Jednostavni pomini prosjeci najee se primjenjuju kod odstranjivanja
sezonskih (do jedne godine) i ciklikih (vie od jedne godine) komponenti iz
strukture vremenskog niza. Primjenjuje se i u sluaju kada se pojava razvija
priblino po linearnom trendu. U suprotnom pomini e prosjeci
(izglaivanjem) sistematski precjenjivati ili podcjenjivati prisutni trend u
vremenskom nizu. U takvoj situaciji se umjesto jednostavnih mogu koristiti
vagani pomini prosjeci.
Vagani pomini prosjeci (ponderi W
s
obino su unaprijed poznati i
tabelirani):
) ( ,..., 2 , 1 ,
*
m n m m t Y W Y
m
m s
s t s t
+ + = =
=
+
. (3.9.4)
145
Pri izraunavanju vaganih pominih prosjeka uzima se neparan broj
frekvencija vremenskog niza (M=2m+1), ponderi su simetrini u odnosu na
sredinji, a njihov zbroj je jednak nuli.
Primjer 3.9.1.
Tablica 3.12.
Instalirana raunala u poslovnici Z
u razdoblju od 1997. do 2005. god.
Godina Broj instaliranih
raunala (Y
t
)
Pomini prosjek
M=3
Pomini prosjek
M=4
1996. 45 * *
1997. 64 49 *
1998. 37 43 47
1999. 29 45 49
2000. 69 52 48
2001. 58 53 53
2002. 33 54 56
2003. 72 52 52
2004. 50 56 *
2005. 46 * *
Izvor: Podaci poslovnice Z, 2006. god.
Zadatak je izraunati trogodinje i etverogodinje pomine prosjeke i grafiki
ih prikazati.
Izraz za jednostavne pomine prosjeke glasi:
=
+
=
m
m s
s t t
Y
M
Y
1
*
)
t=m+1, m+2,,(n-m)
Trogodinji pomini prosjeci (M=3, m=1) iznose:
=
+
=
1
1
*
3
1
s
s t t
Y Y
)
t=2,3,9
pa su vrijednosti sljedee:
| | | | 49 37 64 45
3
1
3
1
3 2 1
*
2
= + + = + + = Y Y Y Y
)
| | | | 56 46 50 72
3
1
3
1
10 9 8
*
9
= + + = + + = Y Y Y Y
)
etverogodinji centrirani pomini prosjeci (M=4, m=2) iznose:
146
(
+ + =
=
+ +
1
1
2 2
*
2
1
2
1
4
1
s
t s t t t
Y Y Y Y
)
t=3,4,8
vrijednosti su sljedee:
47 69
2
1
29 37 64 45
2
1
4
1
2
1
2
1
4
1
5 4 3 2 1
*
3
=
(
+ + + + =
(
+ + + + = Y Y Y Y Y Y
)
52 46
2
1
50 72 33 58
2
1
4
1
2
1
7
2
1
4
1
10 9 8 9 6
*
8
=
(
+ + + + =
(
+ + + + = Y Y Y Y Y Y
)
Grafikon 15.
Instalirana raunala u poslovnici Z, trogodinji i etverogodinji
pomini prosjeci
0
20
40
60
80
100
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
M=3 M=4 Yt
Izvor: Tablica 3.12.
3.10. Standardna dekompozicija vremenske serije
Svaka pojava ije je kretanje predstavljeno u obliku vremenskog niza
sastoji se od vie komponenata, koje su ponekad vidljive na prvi pogled (na
primjer iz grafikog prikaza), a ponekad je potrebna sloenija statistika analiza
da bi se te komponente utvrdile i analizirale. Najea dekompozicija
vremenskog niza je:
147
a) trend komponenta
b) sezonska komponenta
c) ciklika komponenta
d) sluajna komponenta.
Vrijedi da je vremenski niz:
e C S T Y
t
+ + + = , (3.10.1)
gdje je: T -trend komponenta, S -sezonska komponenta, C -ciklika
komponenta i e -sluajna komponenta. Ovdje se pretpostavlja da je djelovanje
svih komponenti na vremenski niz aditivno, tj. njihovo djelovanje na pojavu u
apsolutnom iznosu je isto bez obzira na tijek vremena.
Svaki vremenski niz ne mora sadravati sve ove komponente. S
obzirom na sloenost vremenskog niza nije uvijek mogue strogo razluiti
pojedine komponente vremenskog niza jer se moe dogoditi da jedna
komponenta priguuje drugu.
Trend komponenta pretpostavlja da vrijednosti promatranog
vremenskog niza imaju dugoronu tendenciju rasta ili pada kroz vrijeme. Takvo
kretanje se u statistikoj obradi vremenskih nizova moe izraziti trend-
modelima koji mogu biti rastui ili padajui i linearni ili nelinearni, ovisno o
tendenciji kretanja vremenskog niza.
Sezonska komponenta pretpostavlja sistematsko kretanje vrijednosti
pojave unutar jedne godine, koje se onda ponavlja u svakoj narednoj godini.
Takvo kretanje je u praksi najee uzrokovano neekonomskim faktorima, kao
to su, na primjer klimatske prilike i dravni praznici. Sezonska komponenta
moe biti prisutna kod vremenskih nizova ije su frekvencije, odnosno
vrijednosti pojave, mjerene mjeseno ili kvartalno. Na primjer ako je vremenski
niz broj turista na nekom podruju, on e biti vei u ljetnim i zimskim
mjesecima zbog praznika i godinjih odmora. Ta kretanja imaju sezonski
karakter i ponavljaju se u svakoj godini.
Ciklika komponenta pretpostavlja period obnavljanja sistematskog
kretanja vrijednosti pojave koji je dui od jedne godine. U praksi je ponekad
teko pratiti cikliku komponentu jer se esto ne raspolae s dovoljno dugim
vremenskim serijama. Ciklika kretanja su u praksi izraena u raznim granama
privrede, kao to su graevinarstvo, stoarstvo i slino, a uzroci takvih kretanja
su ciklike gospodarske aktivnosti. Ponekad ciklusi kretanja pojave nisu jasno
izraeni, ve su prigueni trend komponentom odnosno dugoronom
tendencijom kretanja. Po nekim autorima trend komponenta je ciklika
komponenta vremenske serije s veoma dugim periodom obnavljanja.
Sluajna (ili nesistematska) komponenta predstavlja sve ostale
utjecaje na vrijednosti promatrane pojave iji uinak nije sistematski, ve se ti
148
utjecaji javljaju s nepredvidivim djelovanjem u nekim vremenskim razdobljima.
Na primjer mogu se javiti zbog nepredvidivosti prirode poslovnih i
gospodarskih pojava, zbog iznenadne vremenske nepogode i slino.
Primjer 3.10.1.
Tablica 3.13.
Prevezeni putnici pomorskim prometom na podruju Z,
2001.-2005. god.
Prevezeni putnici
Godina I. kvartal II. kvartal III. kvartal IV. kvartal
2001. 642 2369 3856 913
2002. 688 2174 4211 1052
2003. 579 2422 4196 863
2004. 727 2519 4327 986
2005. 825 2631 4528 1094
Izvor: Statistika podruja Z, oujak 2006. god.
Zadatak je izraunati etverogodinje pomine prosjeke, sezonske faktore,
rezidualne faktore (trend i cikliku komponentu) i seriju desezonirati te grafiki
prikazati zadani niz i desezoniranu pojavu.
Rjeenje:
Model glasi:
t St t t
I T Y = pri emu je:
T
t
trend komponenta, odnosno pomini prosjeci
I
St
sezonska komponenta
t
rezidualna komponenta
149
Godina,
kvartal
Broj
putnika
(Y
t
)
Pomini
prosjeci
M=4
Prve procjene
sezonskih
faktora
Sezonski
faktori
Desezonirana
serija
Rezidualni
faktori
2001.: I. 642 * * 0,3387364 1895,28 *
II. 2369 * * 1,1570488 2047,45 *
III. 3856 1950,75 1,976676 2,0382841 1891,79 0,969774
IV. 913 1932,13 0,472537 0,4659307 1959,52 1,014178
2002.: I. 688 1952,13 0,352436 0,3387364 2031,08 1,040445
II. 2174 2013,88 1,079511 1,1570488 1878,92 0,932987
III. 4211 2017,63 2,087107 2,0382841 2065,95 1,023953
IV. 1052 2035,00 0,516953 0,4659307 2257,85 1,109507
2003.: I. 579 2064,13 0,280506 0,3387364 1709,29 0,828096
II. 2422 2038,63 1,188056 1,1570488 2093,26 1,026798
III. 4196 2033,50 2,063437 2,0382841 2058,59 1,012340
IV. 863 2064,13 0,418095 0,4659307 1852,21 0,897333
2004.: I. 727 2092,63 0,347411 0,3387364 2146,21 1,025607
II. 2519 2124,38 1,185761 1,1570488 2177,09 1,024815
III. 4327 2152,00 2,010688 2,0382841 2122,86 0,986461
IV. 986 2178,25 0,452657 0,4659307 2116,19 0,971511
2005.: I. 825 2217,38 0,372062 0,3387364 2435,52 1,098381
II. 2631 2256,00 1,166223 1,1570488 2273,89 1,007929
III. 4528 * * 2,0382841 2221,48 *
IV. 1094 * * 0,4659307 2347,99 *
etverogodinji centrirani pomini prosjeci (M=4, m=2) iznose:
(
+ + =
=
+ +
1
1
2 2
*
2
1
2
1
4
1
s
t s t t t
Y Y Y Y
)
t=3,4,18
i prikazani su u treem stupcu tablice.
U etvrtom stupcu tablice dane su prve procjene sezonskih faktora kao omjer
odgovarajuih vrijednosti vremenskog niza i pominih prosjeka. S obzirom da
procjene sezonskih faktora za iste kvartale variraju treba izraunati prosjek za
iste kvartale, a to je uinjeno u sljedeoj tablici:
150
Prve procjene sezonskih faktora
Godina I. kvartal II. kvartal III. kvartal IV. kvartal
2001. * * 1,9766756 0,4725367
2002. 0,3524364 1,0795109 2,0871074 0,5169533
2003. 0,2805063 1,1880557 2,0634374 0,4180948
2004. 0,3474105 1,1857605 2,0106877 0,4526569
2005. 0,3720616 1,1662234 * *
Prosjek 0,3381037 1,1548876 2,0344770 0,4650605
Sezonski faktori 0,3387364 1,1570488 2,0382841 0,4659307
Sezonski indeksi 33,873640 115,70488 203,82841 46,593072
Prosjek je raunan kao jednostavna aritmetika sredina prvih procjena
sezonskih faktora istih kvartala. S obzirom da zbroj sezonskih faktora mora biti
jednak sezonskom periodu (podaci su kvartalni, pa je to 4), a zbroj prosjeka
iznosi: 3,9925288=0,3381037+1,1548876+2,0344770+0,4650605, stoga
prosjeke treba korigirati tako da njihov zbroj bude 4. U tu svrhu rabi se
korektivni faktor: 1,001871=4/3,9925288 kojim se mnoi svaki izraunati
prosjek te pomnoi sa 100. Na taj su se nain dobili sezonski indeksi po
kvartalima koji su prikazani u posljednjem retku gornje tablice. Tako npr.
sezonski indeks 203,82841 pokazuje da je razina pojave u III. kvartalu svake
godine u prosjeku za 103,82841% via zbog sezonskih utjecaja.
Desezonirana serija, odnosno vrijednosti oiene od sezonskih utjecaja
dobivene su dijeljenjem vrijednosti vremenskog niza sa sezonskim faktorima.
Rezidualni faktori dobiju se dijeljenjem desezoniranih vrijednosti s pominim
prosjecima kao procjenama trenda. Indeks rezidualnih odstupanja jednak je
umnoku rezidualnog faktora i 100, npr. indeks rezidualnih odstupanja u III.
kvartalu 2001. godine iznosi 96,9774 a to znai da je razina pojave u tom
kvartalu bila nia za 3,026% zbog rezidualnih utjecaja.
Analizirani vremenski niz moe se ralaniti na komponente, tako npr.
vrijednost frekvencije vremenskog niza u III. kvartalu 2001. godine iznosi 3856
(trea u nizu), a rastavljena na faktore glasi:
3856 969774 , 0 0382841 , 2 1951
3 3 3 3
= = = I T Y
151
Grafikon 16.
Prevezeni putnici i desezonirana pojava
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
2001.:
I
II
III
IV
2002.:
I
II
III
IV
2003.:
I
II
III
IV
2004.:
I
II
III
IV
2005.:
I
II
III
IV
Prevezeni put nici Desezonirana pojava
Izvor: Tablica 3.13.
153
Literatura
1. Aczel, A. D., Complete Business Statistics, 4
th
edt., Irving McGraw-Hill,
New York, 1999.
2. Allen, M. V. and Myddelton, D. R., Essential Management Accounting,
Prentice Hall, London, 1992.
3. Anderson, D. R., et. al., Statistics for Business and Economics., 2
nd
edt.,
West, St. Paul, 1981.
4. Anderson, D. R. et al. Quantitative Methods for Business. 7
th
edt. South-
Western College Publishing, 1998.
5. Anderson, R. E., Black, W., Hair, J. F. and Tatham, R. L., Multivariate Data
Analysis, Prentice Hall, 1998.
6. Anderson, T. W., An Introduction to Multivariate Statistical Analysis
(Wiley Series in Probability and Statistics), Wiley-Interscience, 2003.
7. Arnold, J. A. and Hope, A. J. B., Accounting for Management Decisions,
Prentice Hall, London, 1990.
8. Babbie, E., Halley, F., Zaino, J., Adventures in Social Research, Data
Analysis Using SPSS
X
for Windows 95./98., Pine Forge Press, USA, 2000.
9. Basilevsky, A. T., Statistical Factor Analysis and Related Methods:
Theory and Applications, John Wiley and Sons Inc., 1994.
10. Beter, M. i Bregar, L., Ekonomska statistika, Ekonomski fakultet
Ljubljana, Ljubljana, 1986.
11. Blejec, M., Statistike metode za ekonomiste, Ekonomski fakultet
Ljubljana, Ljubljana, 1976.
12. Box, G.E.P. and Pierce, D.A., Distributions of Residual Autocorrelations in
Autoregressive Integrated Moving Average Models, Journal of the
American Statistical Association, 65, 1970., pp. 1509.-1526.
13. Brooks, C. GARCH, Modelling in Finance: A Review of the Software
Options, Economics Journal, 107 (443), 1997., pp. 1271.-1276.
14. Brooks, C., Forecasting Stock Return Volatility: Does Volume Help?,
Journal of Forecasting, 17, 1998., pp. 59.-80.
15. Brooks, C., Introductory econometrics for finance, University Press,
Cambridge, 2002.
16. Canavos, G. C. and Miller, D. M., An Introduction to Modern Business
Statistics, Belmont, Wadsworth, 1993.
154
17. Charniak, E., Statistical Language Learning, A Bradford Book, The MIT
Press, Cambridge and Massachusetts, 1993.
18. Chiang, A. C., Osnovne metode matematike ekonomije. Mate, Zagreb,
1994.
19. Cochran, W. G., Sampling Techniques, Wiley, New York, 1977.
20. Dicky, D.A. and Fuller, W.A., Distribution of Estimators for Time Series
Regressions with a Unit Root, Journal of the American Statistical
Association, 74, 1979., pp. 427.-431.
21. Dillon, W. R. and Goldstein, M., Multivariate Analysis, Methods and
Applications, Wiley, New York, 1984.
22. Dodge, M., Kinata, C. i Stison, C., Kako koristiti Microsoft Excel 97, Znak,
Zagreb, 1997.
23. Enders, W., Applied Econometric Time Series, 2
nd
edt., Wiley, Alabama,
2004.
24. Engle, R.F., Autoregressive Conditional Heteroscedasticity with Estimates
of the Variance of United Kingdom Inflation, Econometrica, 50 (4), 1982.,
pp. 987.-1007.
25. Feller, W., An Introduction to Probability Theory and its Applications, Vol.
I. and Vol. II., Wiley, New York, 1971.
26. Fisher, R. A., Statistical Methods for Research Workers, 11
th
edt., Oliver
and Boyd, Edinburgh, 1950.
27. Fisher, R. A., Statistical Methods, Experimental Design and Scientific
Inference, Oxford University Press, Oxford, 1993.
28. Fruk, M., Sezonalnost prinosa dionica na Zagrebakoj burzi, Financijska
teorija i praksa, 28 (4), 2004. pp. 435.-444.
29. Frye, C., Microsoft Excel 2002. Korak po korak, Algoritam, Zagreb, 2003.
30. Fulton, J., Vodi kroz Excel 97., Znak, Zagreb, 1997.
31. GaYnor, P. and Kirkpatrick, R. C., Introduction to Time-Series Modelling
and Forecasting in Business and Modelling, McGraw-Hill, Inc., New York,
1994.
32. Gujarati, D. N., Basic Econometrics, McGraw-Hill, Inc., New York, 1995.
33. Hadivukovi, S., Tehnika metoda uzorka, Nauna knjiga, Beograd, 1975.
34. Harrell, F. E. Jr., Regression Modelling Strategies, With Applications to
Linear Models, Logistic Regression, and Survival Analysis, Springer, New
York, 2001.
155
35. Heij, C., et. al. Econometrics Methods with Applications in Business and
Economics, Oxford University Press, New York, 2004.
36. Horvati, K., Linearna algebra, Golden marketing-Tehnika knjiga, Zagreb,
2004.
37. Johnson, R. A. and Wichern, D. W., Applied Multivariate Statistical
Analysis, Prentice Hall, London, 2002.
38. Jolliffe, I.T., Principal Component Analysis, Springer, Berlin, New York:
2002.
39. Jovii, M., Ekonometrijski metodi, Savremena administracija, Beograd,
1981.
40. Jurun, E. and Pivac, S., Macroeconomic Modelling Relaxing Theoretic
Assumptions in the Croatian Financial Sphere, Proceedings of the 8
th
International Symposium on Operational Research, SOR'05, Nova Gorica,
Slovenia, 2005., pp. 285.-290.
41. Kaplan, R. S., The Evaluation of Management Accounting, The Accounting
Review, 59 (3), 1984., pp. 95.-101.
42. Karatzas, I. and Shreve, S E., Methods of Mathematical Finance, Springer,
Berlin, New York, 2001
43. Kazmier, L. J., Business Statistics, Schaums, Outline Series, McGraw-Hill,
1996.
44. Kendall, M. and Stuart, A., The Advanced Theory of Statistics, Vol I.,
Griffin, London, 1973.
45. Kendall, M. and Stuart, A., The Advanced Theory of Statistics, Vol II.,
Griffin, London, 1974.
46. Kendall, M. and Stuart, A., The Advanced Theory of Statistics, Vol III.,
Griffin, London.1976.
47. Kish, L., Survey Sampling, Wiley, New York, 1965.
48. Kmenta, J., Poela ekonometrije, MATE d.o.o., Zagreb, 1997.
49. Kolesari, V. i Petz, B., Statistiki rjenik, Tuma statistikih pojmova,
Naklada Slap, Zagreb, 2003.
50. De Levie, R., Advanced Excel for Scientific Data Analysis, Oxford
University Press, Oxford, 2004.
51. Ljung, G.M., and Box G.E.P., On a Measure of Lack of Fit in Time Series
Models, Biometrica, 65 (2), 1978., pp. 297.-303.
52. Lucey, T., Management Information Systems, DP Publication LTD,
London, 1989.
156
53. Mason, D. R. and Lind, D. A., Statistical Techniques in Business and
Economics, Boston, IRVIN Publishing, Massachusetts, 1993.
54. Metre, J. G. and Gilbreath, G. H., Statistics for Business and Economics,
Plano, Business Publications, Texas, 1983.
55. Mills, T. C., The Econometric Modelling of Financial Time Series, 2
nd
edt.,
University Press, Cambridge, 1999.
56. Milton, J. S., et al., Introduction to Statistics, D. C. Heath, Lexington, 1986.
57. Momirovi, K., Uvod u analizu nominalnih varijabli, Metodoloke sveske
2, JUS, Ljubljana, 1998.
58. Mood, A. M. and Graybill, F. P., Introduction to the Theory of Statistics,
McGraw-Hill, New York, 1963.
59. Mott, G. Management Accounting for Decision Makers, Pitman Publishing,
London, 1991.
60. Neter, J., et al., Applied Linear Regression Models, IRWIN, Boston, 1989.
61. Neter, J., et al., Applied Statistics, 4
th
edt., Allyn and Bacon, Boston, 1993.
62. Newbold, P., Statistics for Business and Economics, Prentice-Hall,
Englewood Cliffs, 1991.
63. Patterson, K., An Introduction to Applied Econometrics, a time series
approach, Palgrave, Hampshire, 2000.
64. Paue, ., Vjerojatnost, informacija, stohastiki procesi, kolska knjiga,
Zagreb, 2003.
65. Pavli, I., Statistika teorija i primjena, Tehnika knjiga, Zagreb, 1971.
66. Petz, B., Osnovne statistike metode za nematematiare, Naklada Slap,
Zagreb, 2004.
67. Pivac, S. and Jurun, E., Parameter Estimation in Excel, Proceedings of the
28
th
International Convention MIPRO 2005. Computers in Education,
Opatija, 2005., pp. 168.-173.
68. Pivac, S., Jurun, E. and Jujnovi, I., Ocjena parametara nelinearnih funkcija
u programskom paketu Statistica na primjeru nezaposlenosti, Proceedings
of the 29
th
International Convention MIPRO 2006. Computers in Education,
Opatija, 2006., pp. 241.-245.
69. Pivac, S. Jurun, E. and Jerak. N., Rjeavanje simultanih jednadbi kao
ekonometrijskog modela pomou programskog paketa Excel, Proceedings
of the 29
th
International Convention MIPRO 2006. Computers in Education,
Opatija, 2006., pp. 246-251.
70. Pivac, S. i ego, B., Statistika, udbenik sa zbirkom zadataka za IV. razred
srednje ekonomske kole, Alkascript, Zagreb, 2005.
157
71. Rozga, A., Statistika za ekonomiste, Sveuilite u Splitu, Ekonomski
fakultet Split, 2003.
72. Rozga, A. i Gri, B., Poslovna statistika, Ekonomski fakultet Split, 2003.
73. Seddighi, H., R., Lawler, K. A. and Katos, A. V., Econometrics, A practical
approach, Routledge, London and New York, 2006.
74. Seplaki, L., Atorneys' Dictionary and Handbook of Economics and
Statistics, Professional Horizons Press, New York, 1991.
75. Serdar, V. i oi, I., Uvod u statistiku, kolska knjiga, Zagreb, 1994.
76. Siegel, A. F., Practical Business Statistics, IRVIN Publishing, Boston,
Massachusetts, 1994.
77. StatSoft, Statistica System Reference, StatSoft Inc., Tulsa, 2001
78. Studenmund, A. H., Using Econometrics, A Practical Guide, Pearson
International Edition, Boston, New York, 2006.
79. oi, I., Metode statistike analize, Sveuilina naklada Liber, Zagreb,
1983.
80. oi, I., Zbirka zadataka iz osnova statistike, Sveuilina naklada Liber,
Zagreb, 1985.
81. oi, I., Primijenjena statistika, kolska knjiga, Zagreb, 2004.
82. Taylor, S.J., Modelling Financial Time Series, John Wiley & Sons, New
York, 1986.
83. Tenjovi, L., Statistika u psihologiji, Centar za primenjenu psihologiju,
Beograd, 2002.
84. The Central Bureau of Statistics. Republic of Croatia, http:// www.dzs.hr,
2006.
85. Vujkovi, T., Ekonometrijske metode i tehnike, Informator, Zagreb, 1976.
86. arkovi, S. S., Sampling Methods and Censuses, FAO, Rim, 1965.
87. Weisberg, H.F., Krosnick, J.A. and Bowen, B.D., Survey research, Polling
and Data Analysis, 3
rd
edt., Ohio State University, Assessment Systems
Corporation, USA, 2005.
88. Whigham, D., Quantitative Business Methods Using Excel, Oxford
University Press, Oxford, 1998.
89. Wonnacott, T. H. and Wonnacott, R. J., Introductory Statistics for Business
and Economics, 4
th
edt., Wiley, New York, 1990.
159
PRIVITAK UPORABA PROGRAMSKOG PAKETA
STATISTICA
1. Uvod
S razvojem raunala, statistiki programski paketi postali su osnovni
alat statistike analize. Neki od programa koji su namijenjeni statistikoj obradi
su Statistica, SPSS, SAS i razni drugi programski paketi. U nastavku je
objanjena uporaba programskog sustava Statistica.
Veina zadataka u Statistici moe se rijeiti na vie naina, a naveden je
u pravilu najjednostavniji nain. U zadacima u kojima rjeenje ovisi o razini
znaajnosti ostavljena je razina signifikantnosti 0,05, koja je postavljena kao
pretpostavka u Statistici. Vrijednost je mogue promijeniti.
U Statistici se zadaci rjeavaju otvaranjem odgovarajuih prozora u
kojima se izabiru potrebne varijable i izrauni. Kada se u prozoru oznai sve
potrebno izabere se ponuena tipka, u pravilu SUMMARY ili OK nakon ega
se dobiju rezultati ili se otvara novi prozor.
Kada se biraju varijable otvara se prozor s ponuenim varijablama
Za svaku varijablu pie redni broj i kratki naziv varijable. Varijabla se
izabire klikom mia, a za varijablu se upie redni broj varijable u polju:
Select variables:
160
Primjer: izabrana je varijabla y, pod rednim brojem 2.
Ako se eli izabrati vie varijabli koje su poredane jedna ispod druge,
tada se oznai prva varijabla, pritisne se tipka SHIFT , a nakon toga oznai se
posljednja varijabla. Ukoliko se ele izabrati varijable koje nisu jedna iza
druge, tada se prije izbora sljedee varijable izabere tipka CTRL.
Primjer: izbor varijabli od 1 do 3 Primjer: izbor varijabli 1 i 3
161
1.1. Pokretanje programa Statistica
Program se pokree klikom na tipku Start te izborom odgovarajuih
menija kojim se dolazi do programa Statistica. Najee se nalazi u meniju
Programs i pod meniju Statistica 7.
START / PROGRAMS / STATISTICA 7 / STATISTICA
Drugi nain pokretanja programa je pomou ikone: koja se moe
nalaziti na radnoj povrini (desktopu) ili radnoj traci (task baru).
Kada se Statistica pokrene pokazuju se dva prozora:
Manji prozor nudi izbor koji se dio sustava Statistica eli otvoriti.
Izborom predloene opcije Open a STATISTICA Data File, otvara se
posljednji koriteni dokument.
162
Radni list (Spreadsheet) namijenjen je unosu, ureivanju, prikazu i
pohrani podataka, a ima oblik tablice. Osnovni element radnog lista je polje
(cell) u koje se unosi pojedini podatak. Polje se moe odrediti kao presjek
stupca koji predstavlja varijablu (variable) i retka koji predstavlja pojedini
sluaj (case). Polje se selektira klikom na lijevu tipku mia ili navigacijom
pomou tastature. Polje koje je selektirano je aktivno polje, a koordinate tog
polja prikazane su u statusnoj traci (status baru). Adresa polja oznaava se s C i
rednim brojem retka te s V i rednim brojem stupca, tako npr. adresa (C3, V8)
oznaava polje u osmoj varijabli i treem retku. Varijabla odnosno redak
selektira se klikom na zaglavlje varijable odnosno na odgovarajue polje u
pred stupcu.
U naslovnoj traci nalazi se naziv dokumenta (radnog lista), a u zagradi
je naveden broj varijabli (v) i redaka (c).
Prilikom unosa podataka iz tablice naslov se zapisuje u informativno
polje (info box) i u zaglavlje (header). Klikom na informativno polje selektira
se cijeli radni list, a dvostrukim klikom selektira se polje i omoguuje unos i
promjenu podatka. Zaglavlje je mogue selektirati jednim klikom mia, a
podaci se, takoer, mogu unositi nakon dvostrukog klika lijevom tipkom mia.
163
U pojedino polje mogue je unijeti niz znakova; dokumente sa zvunim
ili video zapisima, grafovima, animacijama ili bilo koje dokumente kojima je
ActiveX kompatibilan.
1.2. Stvaranje novog dokumenta
Primjer 1.1.
Starost i spol izabranih studenata upisanih na prvu godinu studija,
akademske godine 2008./2009., na Ekonomski fakultet u Rijeci
Student/ica Godine Spol
A 18 enski
B 19 Muki
C 18 enski
D 25 enski
E 20 Muki
Izvor: Informacijski sustav visokih uilita (simulirani podaci)
Treba kreirati novi dokument za unos podataka iz gornje tablice.
FILE / NEW
ili
<Crtl> + N
ili
Ikona
Nakon toga otvara se sljedei prozor:
164
Ponueno je staranje novog radnog lista (Spreadsheet), izvjea
(Report), makroa (Macro (SVB) Program), Radnih zapisa (Workbook) i
otvaranje internetske stranice (Browser Window).
Radni list kreira se izborom opcije:
Spreadsheet
Number of variables Broj varijabli. Unosi se broj stupaca, moe se
predvidjeti vei broj stupaca u kojima e biti rezultati izrauna.
Number of cases Broj redaka. Upisuje se broj redaka u tablici.
Moe se ostaviti ponueni broj stupaca i redaka (1010), a broj
varijabli i broj redaka moe se na jednostavan nain promijeniti tijekom rada.
165
1.3. Unos podataka
Podatke iz primjera 1.1. treba unijeti u dokument.
U zaglavlje dokumenta upisuje se naziv tablice:
Starost i spol izabranih studenata upisanih na prvu godinu studija,
akademske godine 2008./2009., na Ekonomski fakultet u Rijeci
U informativno polje upisuje se naziv pred stupca:
Student/ica
Prije poetka unosa podataka potrebno je definirati varijable.
Definiranje varijabli mogue je izvesti na vie naina. U Statistici se veina
zadataka moe izraditi na vie naina, a svejedno je koji se nain koristi.
Definiraju se dvije varijable: godine i spol izabranih studenata. Nakon
pozicioniranja na polje u odreenoj varijabli moe se izabrati:
DATA / VARIABLE SPECS...
ili
2 puta kliknuti na zaglavlje varijable
ime se otvara prozor za specifikaciju varijable:
166
Name Kratki naziv varijable Praktino je ako je kratko ime.
Treba izbjegavati - i razmak te rabiti samo slova engleske abecede.
Premda program prihvaa i druge znakove, neke operacije ne mogu se
izvoditi, ako se upotrebljavaju ti znakovi.
1. varijabla: upisati Godine
2. varijabla: upisati Spol
167
Long name (label or formula with Functions ) Dugi naziv varijable
(ili formula) Unosi se dugi naziv, nema ogranienja duine, stoga
treba dati to bolji opis
1. varijabla: upisati Godine starosti izabranih studenata
2. varijabla: upisati Spol izabranih studenata
U ovu rubriku moe se upisati i formula kojom se izraunavaju vrijednosti
varijable. Formula zapoinje znakom jednakosti (=). Dugi naziv varijable u
tom sluaju dolazi nakon formule, a izmeu se stavlja znak (;) toka sa
zarezom.
Type Tip varijable
Predvieni tip je Double. To je jedini tip varijable koji podrava
decimale. Mogue je unositi brojeve, slova i ostale znakove. Najbolje
je ostaviti ovaj tip varijable.
Umjesto otvaranja prozora za specifikaciju svake varijable posebno, mogue je
izabrati opciju za specificiranje svih varijabli na sljedee naine:
Na ve otvorenom prozoru za specifikaciju varijable izabere se:
168
ALL SPECS...
ili se preko sustava menija izabere
DATA / ALL VARIABLE SPECS
Nakon ega se otvara prozor za specifikaciju svih varijabli.
Ukoliko varijabla moe poprimiti neke odreene vrijednosti modaliteta,
tada se mogu kodirati vrijednosti. Varijabla Spol moe poprimiti dvije
vrijednosti: enski i Muki.
Pozicionirati se na drugoj varijabli i otvoriti prozor za specifikaciju
varijable ukoliko ve nije otvoren
DATA / VARIABLE SPECS...
Izabrati tipku
Text Labels
te se otvara prozor za kodiranje varijabli.
169
Text label Modalitet varijable unosi se vrijednost koju varijabla
moe poprimiti
Numeric Brojana ifra izabire se broj, brojana ifra, koja
predstavlja vrijednost modaliteta
Description Opis modaliteta ovdje se moe staviti dugi naziv ili
opis kodiranog modaliteta, nije obavezan unos
Nakon definiranja varijabli unose se vrijednosti. Kod unosa pred stupca
i varijable godine prepisuju se vrijednosti zadane u tablici, a kod unosa spola
unose se ifre: 1 i 2, a vidi se enski i Muki.
170
1.4. Spremanje dokumenta
Kod prvog spremanja
FILE / SAVE ili SAVE AS
ili
<Crtl> + S
ili
Ikona
Ako se dokument snima prvi put, otvara prozor Save As u koji se unosi
naziv dokumenta i izabere direktorij u koji e biti spremljen. Radni list ima
nastavak .sta, izvjee ima nastavak .str, nastavak makroa je .svb, radni zapisi
oznaavaju se s .stw.
Ukoliko se u rubrici Save as type izabere neki drugi nastavak, tada se
dokument snima u nekom drugom formatu, npr. Excelu, SPSS-u i sl.
Kad je dokument jednom snimljen, za spremanje izmjena vie se ne
koristi Save As, nego samo Save. Promjene se tada snimaju u ve postojeu
datoteku.
171
1.5. Otvaranje dokumenta
Postojei dokument otvara se:
FILE / OPEN
ili
<Crtl> + O
ili
Ikona
Prikazuje se prozor u kojem se izabere direktorij i dokument koji ima
neki od ponuenih nastavaka. U rubrici Files of Type moe se izabrati neki
drugi tip dokumenta.
1.6. Prikazivanje rezultata obrade
Rezultati statistikih izrauna prikazuju se u prozoru radnih zapisa
(Workbook), a mogue ih je dobiti i u obliku izvjea.
Da bi se pokrenulo zapisivanje rezultata u izvjee, potrebno je putem
menija izabrati:
TOOLS / OPTIONS...
Nakon otvaranja prozora izabere se rubrika:
OUTPUT MANAGER
172
i oznai se:
ALSO SEND TO REPORT WINDOW
173
Zapisivanje rezultata u izvjee moe se izvriti na vie naina:
Multiple Reports (one for each Analysis/graph) stvaranje vie
prozora, po jedan prozor za svaku analizu ili grafiki prikaz
Single Report (common for all Analysis/graphs) kreira se jedno
izvjee, zajedniko za sve analize i grafikone
Existing Report rezultati se unose u neko ve postojee izvjee
Uz to mogue je izabrati i:
Display supplementary information:
Brief kratke
Medium srednje
Long duge
Comprehensive iscrpne
prikazuju se dodatne informacije
174
1.7. Definiranje varijable formulom
Varijabla se moe definirati formulom. Tada se u rubrici dugi naziv
varijable, upisuje znak = , a nakon toga slijedi formula. Mogue je koristiti
standardne matematike operacije ili neku od ponuenih funkcija koja se dobije
pritiskom na tipku Functions .
Ako se nakon formule upie ; moe se u nastavku upisati dugi naziv
varijable.
175
1.8. Ureivanje
Dio dokumenta koji se eli ureivati mora se prvo selektirati. Polje se
selektira miem ili navigacijom pomou tastature. Varijabla se selektira klikom
mia na zaglavlje varijable, redak se selektira klikom mia na naziv retka u pred
stupcu. Blok podataka se izabere klikom na gornji lijevi kut bloka podataka i
pritiskom na lijevu tipku mia dok se mi povlai do donjeg desnog kuta.
Nakon selektiranja izabranog dijela moe se pristupiti ureivanju.
Na slici je prikazan dokument u kojem su vrijednosti varijable
Godine centrirane, vrijednosti varijable Spol napisane su kurzivom (Italic),
podaci u retku A su podcrtani, blok podataka od C2V1 do C3V2 je osjenan, a
polje C5V1 ima veu veliinu slova.
176
Osim mijenjanja izgleda, mogue je i dodavanje ili brisanje pojedinog
stupca ili retka.
Dodavanje novih stupaca:
INSERT / ADD VARIABLES
Otvara se prozor za dodavanje varijabli:
177
How many broj novih stupaca
After nakon koje varijable se unose nove
Dodavanje novih redaka:
INSERT / ADD CASES
Otvara se prozor za dodavanje redaka:
178
How many broj novih redaka
Insert after case nakon kojeg retka se unose novi
Brisanje stupaca:
EDIT / DELETE / VARIABLES
Otvara se prozor za brisanje varijabli:
From variable od koje varijable
To variable do koje varijable
Brisanje redaka:
EDIT / DELETE / CASES
Otvara se prozor za brisanje redaka:
From cases od kojeg retka
To cases do kojeg retka
179
2. Grafiko prikazivanje nominalnih (atributivnih) nizova
U Statistici je mogue napraviti razne vrste grafikona kao i njihove
kombinacije. Prikazani su jednostavni stupci, dvostruki stupci i strukturni krug.
Primjer 2.1.
Stanovnitvo prema spolu u jadranskim upanijama, popis 2001. god.
upanija ene Mukarci
Istarska 106.375 99.969
Primorsko goranska 158.290 147.215
Liko senjska 27.182 26.495
Zadarska 82.404 79.641
ibensko kninska 58.225 54.666
Splitsko dalmatinska 237.545 226.131
Dubrovako neretvanska 63.492 59.378
Izvor: Popis stanovnitva 2001, DZS, str. 86. 97.
a) Prikaite grafiki jednostavne stupce za ene
b) Prikaite grafiki dvostruke stupce
c) Strukturnim krugom prikaite raspodjelu mukaraca po upanijama
Rjeavanje zadatka zapoinje kreiranjem novog dokumenta.
U zaglavlje dokumenta upisati:
Stanovnitvo prema spolu u jadranskim upanijama, popis
2001. god.
180
Definirati pred stupac:
U informativno polje upisati upanija
Upisati vrijednosti u pred stupac:
upanija
Istarska
Primorsko goranska
Liko senjska
Zadarska
ibensko kninska
Splitsko dalmatinska
Dubrovako - neretvanska
Definirati varijable:
Kratki naziv: Zene, dugi naziv: ene
Unijeti vrijednosti (unositi brojke bez toke i bez razmaka):
ene
106375
158290
27182
82404
58225
237545
63492
Kratki naziv: Muskarci, dugi naziv: Mukarci
Unijeti vrijednosti:
Mukarci
99969
147215
26495
79641
54666
226131
59378
181
a) Prikaz jednostavnih stupaca za ene
GRAPHS / 2D GRAPHS / BAR/COLUMN PLOTS
QUICK
Graph type: Regular
Orientation: Vertical
Varijablu koja se prikazuje grafiki potrebno je oznaiti:
Izabere se tipka: Variables
Otvara se prozor za izbor varijable te se izabere varijabla Zene.
182
Variables: 1 Zene
183
OPTIONS 1
184
Case labels: Case names
Display Default Title ukloniti oznaku
Custom Title:
Broj ena u jadranskim upanijama, popis 2001. god.
Show on Top
Footnote: Izvor: Popis stanovnitva 2001, str. 86. 97.
Dobije se grafikon:
185
Ukoliko se eli promijeniti neto na grafikonu, potrebno je prvo
selektirati eljeni dio klikom mia. Nakon toga se izabere:
FORMAT / SELECTION
ili
2 puta kliknuti
186
Promjena formata ispisa vrijednosti na ordinati:
Selektirati os y
FORMAT / SELECTION ili 2 puta kliknuti
SCALE VALUES
Automatic at major tickmarks
Value Format: General
187
Na apscisu staviti naziv upanija :
Selektirati os x
FORMAT / SELECTION ili 2 puta kliknuti
TITLE:
upanija
Poravnati na desno
188
Ukloniti legendu:
Selektirati legendu
FORMAT / SELECTION ili 2 puta kliknuti
DISPLAY ukloniti oznaku
Graf sada izgleda:
189
190
b) Prikaz dvostrukih stupaca
GRAPHS / 2D GRAPHS / BAR/COLUMN PLOTS
QUICK
Graph type: Multiple
Orientation: Vertical
Variables
1-Zene
2-Muskarci
191
OPTIONS 1
Case labels: Case Names
Display Default Title ukloniti oznaku
Custom Title:
Stanovnitvo prema spolu u jadranskim upanijama, popis
2001. god.
Show on Top
Footnote: Izvor: Popis stanovnitva 2001, DZS, str. 86. 97.
192
Dobije se grafikon:
193
Moe se po elji promijeniti izgled nekog stupca.
Selektirati ene (kliknuti na bilo koji stupac koji predstavlja
ene selektirat e se stupci za ene u svim upanijama)
FORMAT / SELECTION ili 2 puta kliknuti
Promijeniti po elji:
Width
Area
194
Area pattern
Foreground color
Background color
Area style
Type
Automatski se promijeni legenda.
Isto se moe napraviti za mukarce. Sljedei grafikon je primjer s
promijenjenim izgledom stupaca i promijenjenim formatom ispisa vrijednosti
na ordinati.
195
c) Strukturnim krugom treba prikazati raspodjelu mukaraca po upanijama
GRAPHS / 2D GRAPHS / PIE CHARTS
QUICK
Graph type: Pie Chart Values
Variables: 2 Muskarci
OPTIONS 1
196
Case labels: Case Names
Display Default Title ukloniti oznaku
Custom Title:
Raspodjela mukaraca u jadranskim upanijama
prema popisu stanovnitva 2001. god.
Show on Top
Footnote: Izvor: Popis stanovnitva 2001, DZS, str. 86. 97.
Dobije se grafikon:
197
Ukloniti natpis Muskarci na grafikonu:
Selektirati natpis Muskarci
FORMAT / SELECTION ili 2 puta kliknuti
198
DISPLAY ukloniti oznaku
Za svaki kruni isjeak moe se napisati naziv upanije, broj mukaraca
u upaniji te udio u ukupnom broju mukaraca jadranskih upanija
Selektirati nazive upanija
FORMAT / SELECTION ili 2 x kliknuti
PROPERTIES
Text labels
(prikazuje se naziv pojedinog krunog
isjeka upanije)
Counts (vrijednost varijable broj mukaraca)
Counts format
Value Format: General
Percentage (udio u ukupnom zbroju varijable)
Percentage format
Decimal Places: 2 (Broj prikazanih
decimala)
199
Moe se mijenjati izgled pojedinog krunog isjeka ili cijelog
strukturnog kruga.
Selektirati strukturni krug
200
FORMAT / SELECTION ili 2 puta kliknuti
SLICES DISPLAY (izgled pojedinog krunog isjeka)
Area
Exploded
SHAPE (oblik)
TYPE (dodavanje tree dimenzije)
PLACEMENT (smjetaj grafa)
Grafikon s promijenjenim izgledom:
201
3. Numeriki nizovi
Primjer 3.1.
Zaposleni u ustanovi A prema pripadajuem broju dana
godinjeg odmora, na dan 31.12. 2008.
Dani godinjeg odmora Broj zaposlenih
X
i
f
i
25 7
26 12
27 14
28 18
29 13
30 11
Ukupno 75
Izvor: Kadrovska sluba (simulirani podaci)
Zadatak je:
a) izraunati srednje vrijednosti
b) odrediti ukupan broj dana godinjih odmora svih zaposlenih
c) izraunati mjere disperzije
d) odrediti kvartile
e) izraunati najmanju i najveu vrijednost
f) odrediti asimetriju
g) odrediti zaobljenost.
Prisutne su dvije varijable: varijabla Dani godinjeg odmora koja
predstavlja numeriko obiljeje i oznaava se s X
i
i varijabla Broj zaposlenih
koja predstavlja frekvenciju odnosno ponder to se oznaava s f
i
.
Kreira se novi dokument:
U zaglavlje dokumenta upisati:
Zaposleni u ustanovi A prema pripadajuem broju dana
godinjeg odmora, na dan 31.12. 2008. godine.
202
Definirati varijable:
Kratki naziv: Xi, dugi naziv: Dani godinjeg odmora
Kratki naziv: fi, dugi naziv: Broj zaposlenih
Nakon toga unesu se vrijednosti.
Ako postoji stupac s frekvencijama potrebno je prije poetka raunanja
ponderirati. Ponderirati se moe na sljedei nain:
TOOLS / WEIGHT
Otvara se prozor za ponderiranje:
WEIGHT VARIABLE fi
STATUS On .
Nakon ukljuivanja ponderiranja pojavljuje se obavijest da je izvreno
ponderiranje, a u statusnoj traci pojavi se natpis: Weight: ON to znai da je
ponderiranje ukljueno. Kada je ponderiranje iskljueno natpis je Weight OFF.
203
Funkcije deskriptivne statistike mogue je pokrenuti putem menija:
STATISTICS / BASIC STATISTIC/TABLES
U rubrici QUICKzabere se:
DESCRIPTIVE STATISTICS
ADVANCED
ime se otvara prozor s mjerama deskriptivne statistike.
204
Prilikom raunanja potrebno je oznaiti na koju se varijablu odnose
izrauni:
Izabere se tipka: Variable
Otvara se prozor za izbor varijable te se izabere varijabla koja
predstavlja numeriko obiljeje: Xi.
205
Sada je mogue pristupiti izraunu mjera deskriptivne statistike.
Za kontrolu unosa podataka mogu se rabiti funkcije:
Valid N zbroj frekvencija
Sum zbroj vrijednosti numerikog obiljeja
Mjere centralne tendencije koje su ponuene za izraun su:
Mean aritmetika sredina
Median medijan
Mode mod
Geom. mean geometrijska sredina
Ham. mean harmonijska sredina
Mogue je izraunati i neke potpune mjere rasprenosti:
Standard Deviation standardna devijacija uzorka prilikom
izrauna polazi se od pretpostavke da se radi o uzorku, a ne o osnovnom
skupu. Vrijednost standardne devijacije i mjera koje iz toga proizlaze,
za osnovni skup neto se razlikuju od vrijednosti za uzorak.
Variance varijanca uzorka varijanca osnovnog skupa razlikuje se
od varijance uzorka.
206
Raunati se mogu i neke nepotpune mjere rasprenosti, kao i mjere koje
su potrebne za njihovo raunanje:
Range raspon varijacije
Quartile range interkvartil
Minimum & maximum najmanja i najvea vrijednost
Lower & upper quartiles donji i gornji kvartil
Ponueno je odreivanje asimetrije i zaobljenosti:
Skewness koeficijent asimetrije uzorka
Kurtosis eksces uzorka Gleda se je li mjera manja ili vea od 0, a
ne od 3.
Mogu se oznaiti funkcije koje se trae ili oznaiti:
Select all stats
ime se pokree izraun svih funkcija.
U primjeru 3.1. za kontrolu unosa moe se oznaiti:
a) Izraunajte srednje vrijednosti
MEAN, MEDIAN, MODE
b) Odredite ukupan broj dana
godinjih odmora svih
zaposlenih
SUM
c) Izraunajte mjere disperzije
STANDARD DEVIATION,
VARIANCE, RANGE,
QUARTILE RANGE
d) Odredite kvartile
LOWER & UPPER
QUARTILES
e) Izraunajte najmanju i najveu
vrijednost
MINIMUM & MAXIMIM
f) Odredite asimetriju
SKEWNESS
g) Odredite zaobljenost
KURTOSIS
207
Osim toga za kontrolu unosa moe se izabrati :
Valid N
Pritiskom na tipku SUMMARY pokree se raunanje.
Otvara se prozor za prikaz rezultata:
208
209
Provjera: ukupan broj zaposlenih (zbroj frekvencija) je 75 kao to je
zadano (Valid N).
a) Izraun srednjih vrijednosti:
8 88 8= 27,68 dana
M
e
= 28 dana
M
o
= 28 dana
Prosjean broj dana godinjeg odmora zaposlenih u ustanovi A iznosi
27,68 dana.
Meu zaposlenima u ustanovi A 50% ima 28 ili manje dana godinjeg
odmora, odnosno 50% zaposlenih ima 28 dana godinjeg odmora ili vie.
Najei broj dana godinjeg odmora je 28, to je sluaj kod 18 radnika.
b) Odreivanje ukupnog broja dana godinjih odmora svih zaposlenih (total):
X = 2076 dana
Ukupan broj dana godinjeg odmora svih zaposlenih je 2076 dana.
c) Izraun mjera disperzije:
= 1,534821 dana*
2
= 2,355676 dana*
R
x
= 5 dana
I
Q
= 3 dana
* Pretpostavlja se da se radi o uzorku, a ne o cijelom osnovnom
skupu. Standardna devijacija i mjere koje iz toga proizlaze neto se razlikuju
od stvarnih.
Razlika izmeu najdueg i najkraeg godinjeg odmora je 5 dana.
Raspon varijacija sredinjih 50% jedinica je 3 dana. Prosjeno odstupanje od
prosjeka je 1,534821 dana (ovo je priblina vrijednost).
210
d) Odreivanje kvartila:
Q
1
= 26 dana
Q
3
= 29 dana
U 25% sluajeva zaposleni imaju 26 ili manje dana godinjeg odmora, a
75% zaposlenih ima 26 ili vie dana godinjeg odmora.
Zaposleni u 75% sluajeva imaju 29 ili manje dana godinjeg odmora, a
u 25% sluajeva odmor traje 29 ili vie dana.
e) Izraun najmanje i najvee vrijednosti:
X
min
= 25 dana
X
max
= 30 dana
Zaposleni u ustanovi A imaju najmanje 25, a najvie 30 dana godinjeg
odmora.
f) Odredite asimetriju
Skewness =
3
= -0,108270
Mjera asimetrije
3
iznosi -0,108270, a to znai da je raspodjela blago
negativno ili lijevostrano asimetrina.
g) Odreivanje zaobljenosti:
Kurtosis = Eksces = = -0,965234
Eksces je -0,9652342, a to znai da je raspodjela zaobljenija od
normalne.
211
Primjer 3.2.
Proizvodnja stakla 2005. godine u tvornici B bila je po pogonima sljedea:
128, 245, 333, 199 i 275 t. Zadatak je:
a) izraunati prosjenu proizvodnju po pogonu
b) izraunati ukupnu proizvodnju u tvornici B
c) odrediti srednje vrijednosti
d) izraunati mjere odstupanja od prosjeka
e) odrediti najmanju i najveu proizvodnju u pogonu te raspon varijacija
f) odrediti kvartile i interkvartil.
Sve vrijednosti proizvodnje imaju frekvenciju 1, tj. svaka vrijednost
pojavljuje se samo jedanput te nije potrebno ponderirati vrijednosti. Iz tog
razloga unosi se samo varijabla Xi proizvodnja stakla u tonama, a nema
varijable frekvencija.
S obzirom da je uestalost svih obiljeja jednaka (svaka vrijednost
pojavljuje se jedanput) ne postoji mod najee obiljeje. Takoer se ne
raunaju asimetrija i zaobljenost.
Rjeenja:
a) izraun prosjene proizvodnje po pogonu:
8 88 8 = 236 t
b) izraun ukupne proizvodnje u tvornici B:
X = 1180 t
c) odreivanje srednjih vrijednosti:
8 88 8 = 236 t
M
e
= 245 t
M
o
= NEMA MODA
212
d) izraun mjera odstupanja od prosjeka:
2
= 6011
= 77,53064 t
e) odreivanje najmanje i najvee proizvodnje po pogonu i raspon varijacija:
X
min
= 128 t
X
max
= 333 t
R
x
= 205 t
f) odreivanje kvartila i interkvartila:
Q
1
= 199 t
Q
3
= 275 t
I
Q
= 76 t
4. Regresijska i korelacijska analiza
4.1. Jednostavna linearna regresija
Primjer 4.1.
Brodarska kompanija C vri isporuke na udaljenosti do 1000
nautikih milja. Upravu zanima odnos izmeu udaljenosti koje teret mora
prijei i vremena isporuke u danima. U tu svrhu sluajno je izabrano 10
isporuka izvrenih u oujku 2006. godine. Udaljenosti u nautikim miljama i
vrijeme isporuke u danima prikazani su u sljedeoj tablici:
213
Isporuka Udaljenost
(nautike milje)
Vrijeme isporuke
(dani)
1 751 7
2 532 3
3 632 2
4 917 12
5 503 2
6 732 4
7 830 6
8 866 8
9 601 5
10 763 4
Izvor: Podaci brodarskog drutva C
Zadatak je:
a) odrediti jednadbu jednostavne linearne regresije
b) prikazati dijagram rasipanja
c) u dijagramu rasipanja prikazati pravac regresije
d) izvriti interpolaciju
e) procijeniti vrijeme trajanja isporuke za udaljenost od 600
nautikih milja.
a) Izraun srednjih vrijednosti:
U zaglavlje dokumenta upisati:
Udaljenosti i vrijeme isporuke u brodarskom drutvu C za izabrane
isporuke
214
Definirati varijable:
Kratki naziv: Udaljenost, dugi naziv:
Udaljenost u nautikim miljama
Kratki naziv: Vrijeme, dugi naziv:
Vrijeme isporuke u danima
Unijeti vrijednosti
Ocjenjeni model jednostavne linearne regresije glasi:
X Y
1 0
+ =
Parametri
0
i
1