Professional Documents
Culture Documents
Statistika
Statistika
ZAVRNI
( Z E L E N A K NJ I G A )
wr0ng
/SKRIPTA/
Utvrivanje zakonitosti I pravilnosti koje vladaju izmeu masovnih pojava, te trasiranje puta
za kreiranje odgovarajueg modela, zadatak je regresione analize.
Regresija je zapravo skraeni naziv od regresija prema aritmetikoj sredini, koja dolazi od
pte statistike zakonitosti da je rezultat jedne varij.blii aritmetikoj sredini nego to je
rezultatu varijable koja je sluila za predvianje.
U uem smislu, regresiona analiza podrazumijeva skup statistikih metoda koji omoguuju
utrvivanje zavisnoti izmeu pojava I procjenjivanje jedne varijable na osnovu vrijednosti
neke druge ili vie drugih varijabli.
U irem smislu, ova analiza obuhvata, pored navedenih metoda I statistike metode koji
moguavaju praenje kovarijacije izmeu pojava I utvrivanje meuzavisnosti izmeu dvije
ili vie pojava.
KOVARIJANSAOPvjLMes E(sOD seteset tOt)vs)OMEsgs(sO svt(sBt(sO vt(jLGMetOGftE(jZ(sO
posmatranih pojava.
Regresioni model omoguava da se s odreenim stepenom pouzdanosti procjenjuju I
predviaju vrijednosti zavisne varijable na osnovu vrijednosti nezavisne varijable.
Meuzavisnost pojava se utvruje primjenom korelacione analize. Korelacionim modelom
se utvruje da li su dvije pojave povezane , tj da li se mjenjaju zajedno, da li im je pravac
mjenjanja isti, koji je stepen povezanosti i sl.
Regresiona analiza moe se odnosti na posmatranje osnovnog skupa ili na njegov uzorak.
ei je sluaj da se analiza izvodi na osnovu uzorka.
Iz osnovnog skupa uzima se reprezentativan uzorak i na osnovu njega donosi se zakljuak o
parametrima skupa.
Za ovu analizu mogu se koristiti 2 vrste podataka:
a)podaci koji izraavaju stanje odreenog momenta
b)podaci koji se dobivaju na osnovu posmatranja neke pojave u vremenskim intervalima i
takvi podaci se obrazuju u vremenski niz.
Nuno je upozoriti na opasnost formalne interpretacije rezulatat, koji proizilaze iz primjene
regres.analize.
Validnost i pouzdanost rezultata reg.analize zavise od stvarnog poznavanja materije koju
na treba interpretirati.
-KOVARIJACIJAZa utvrivanje kvantitativnog izraza slaganja varijacija vrijednosti obiljeja posmatrane
pojave korsitimo kovarijaciju.Postoje slijedei pokazatelji kovarijacije:
a) KZVRN(VKERLRZJKG)/ZR(PU)LKG)JKGR:
rauna se na osnovu predznaka varijacija kao razlika meu modalitetima obiljeja u
utvrenom nizu njihovih podataka. Nedostatak mu je u tome to uzima u obzir samo
predznak varijacija od jednog do drugog modaliteta, a zanemaruje intenzitet zabiljeenih
varijacija.
b)(tPZVRLKN)ZK(KZVRN(VKERLRZJKG)/ZR(PU)LKG)JKGR
je obuhvatniji od prethodnog indeksa jer uzima u obzir i predznake i intenzitet zabiljeenih
varijacija. Rauna se kao odnos razlike i zbira pozitivnih i negativnih proizvoda varijacija.
c) PREKJKGRZv(VKERLRZJKG)/ZR(PU)LKG)JKGR
Rauna se kao odnos izmeu razlike pozitivnih i negativnih proizvoda varijacija prema
geometriskoj sredini kvadrata uzastopnih varijacija.
d)PREKJKGRZv(vRZVRZJKGR
je kompleksan izraz uzajamnosti varijacija obiljeja posmatranih pojava. On obuhvata i
dstupanja oko aritmetike sredine. Uzima vrijednost iz intervala [-1,+1], pri emu
neg.vrijednosti oznaavaju suprotnosmjerno slaganje varijacija, a pozitivne, istosmjerno
slaganje. to je njegova apsolutna vrije.blia 1, izmeu varijacija obiljeja pojava postoji vii
stepen istosmjernog ili suprotnosmjernog kvantit.slaganja.
-KOVARIJANSApredstavlja prosjean stepen varijacija obiljeja posmatrane pojave i pomou nje nije
mogue direktno mjerenje stepena kovarijacije, tj stepena jaine veze izmeu posmatranih
pojava. Kovarijansom procjenjujemo postoji li kovarijacija izmeu pojava, ali ne i stepen.
Ona je neka vrsta prosjeka, odnosno ukupnosti odstupanja svih podataka od aritmetikih
sredina posmatranih serija. Izraunava se kao prosjeno istovremeno odstupanje
vrijednosti obiljeja od svojih aritmetikih sredina. Jednaka je nuli ako je stand.devijacija
barem jedne varij.jednaka nuli. Ako postoji tendencija da iznadprosjena vrijednost jedne
varijable dolazi sa iznadprosjenom vrijednou druge varijable, onda je kovarijansa
pozitivna i obrnuto. Kovarijansa je negativna ako iznadprosjene vrijenosti jedne varijable
prate ispodprosjene vrijednosti druge varijable.
Zadatak regresione analize je da utvrdi zakonitosti u varijacijama zavisne varijable Y, koje su
dreene varijacijama nezavisne varijable X, s ciljem da se predvide nepoznate vrijednosti
varijable Y kada je poznata X.
Nezavisna varijabla je ona varijabla od koje na neki nain zavisi ono to istraujemo. To je
na varijabla koju istraiva namjerno mjenja da bi ustanovio kako e te promjene djelovati
na zavisnu varijablu koju on istrauje.
Zavisna varijabla je ona varijabla koju istraujemo i elimo rastumaiti zbog ega ona
poprima razliite vrijednosti i koju moemo predvidjeti iz vrijednosti neke druge varijable. U
sluajevima kada istraiva ne moe svojevoljno manipulisati X on prati promjene na Y u
vezi sa spontanim promjenama na X.
Regresija kvantificira vezu izmeu pojava, neophodno je kvalitativnom analizom ispravno
identifikovati varijablu/e koja stvarno uzrokuje promjene u zavisnoj varijabli.
Veze kod kojih poveanju(smanjenju) vrijednosti nezavisne varijable X istovremeno
dgovara poveanje(smanjenje) zavisne varijable Y nazivamo pozitivnim(istosmjernim)
vezama. Ako poveanju jedne varijable odgvara smanjenje druge varijable radi se o
negativnom (suprotnosmjernim) vezama.
Prema jaini veze izmeu pojava mogu biti FUNKCIONALNE I STATISTIKE.
Funkcionalne vezKOMjO(s E(s(TOTOMETbs(TODsLsO(jLGdO vt(jLGMetOj)s tMjOPvGd(j(t jOxO
dgovara samo jedna, tano odreena vrijednost zavisne promjenjive Y. Karakteristino je
da im se pri zajednikom mjenjanju veliina promjene uvijek podudaraju i da u svakoj
vrijednosti jedne pojave odgovara uvijek ista vrijednost druge pojave. Oznaava se sa
izrazom Y=f(x), pri emu svakoj vrijednosti X odgovara tano odreena vrijednost Y.
Slika a) prikazuje funkcionalnu vezu izmeu nezavisne i zavisne varijable. Zamiljena linija
koja povezuje sve take na slici je pravac, od koje nema odstupanja. Zbog toga se kae da je
va veza funkcionalna i pozitivna jer je pravac rastui.
U praksi gotovo nikad ne postoji ovakav primjer, nego je ei sluaj na slici b). Zamiljena
linija izmeu taaka na slici je take pravac, ali su prisutna odreena odstupanja. Pozitiva i
negativna odstupanja od pravca se tumae uticajima drugih varijabli iz prakse. Zbog toga
kaemo da je veza statistika. I ova veza je pozitivna jer je zamiljeni pravac rastui.
Slika c) pokazuje funkcionalnu vezu izmeu zavisne i nezavisne varijable a zamiljena linija
koja povezuje sve take na slici je opet prava. Pored toga to je veza funkcionalna porast
jedne varijable prati pad druge varijable, pa kaemo da je veza negativna.
U praksi je gotovo nemogue sresti ovakav primjer, ali est je primjer slika d). Zamiljena
linija izmeu taaka je pravac, a pozitivna i negativna odstupanja od pravca tumae se
uticajima drugih varijabli. Veza je statistika, a kako je zamiljeni pravac opadajui, veza je
negativna.
gdje lijeva strana predstavlja zbir kvadrata odstupanja empirijskih vrijednosti zavisne
varijable od njene aritm.sredine( ukupni varijabilitet). Prvi lan sa desne strane je zbir
kvadrata odstupanja regresionih vrijednosti od njene aritm.sredine ( protumaeni
varijabilitet). Odstupanja empirijskih vrijednosti zavisne varijable od regresijskih vrijednosti
predstavlja drugi lan s desna( neprotupaeni varijabilitet)
Visina korelacije nije samo odraz stepena povezanosti izmeu dvije varijable, nego moe
biti posljedica razliitih uticaja, od kojih su najvaniji:
-nelinearna veza
-simetrina i unimodalna dustribucija posmatranih varijabli
-grupisanje rezultata
-kauzalna interpretacija korelacije
-uticaj raspona
-eliminisanje vrijednosti oko aritmetike sredine
-podskupovi s razliitim aritmetikim sredinama
U praksi se ponekad javlja potreba za raunanjem korelacije izmeu dvije kontinuirane
varijable, po pretpostavci normalno distribuirane u osnovnom skupu, s tim da je jedna od
varijabli namjerno dihotomizirana.
Dihotomija varijabli ( podjela na 2 modaliteta) predstavlja najgrublje mogue mjerenje, jer
posmatranu pojavu razlikujemo samo u dvije kategorije. Svoenje na 2 modaliteta je obino
posljedica jedinog naina na koji se mogu dobiti podaci. Za raunanje korelacije izmeu
kontinuirane i dihotomizirane varijable koriste se slijedei koeficijenti: biserijski koeficijent i
point biserijski koeficijent.
BISERIJSKI KOEFICIJENT KORELACIJE
Za primjenu ovog koeficijenta neophodno je da se ispune 2 uslova. Prvi se odnosi ba
pretpostavku da se prva varijabla normalno rasporeuje u osnovnom skupu i da njene
mjere potiu s intervalne mjerne skale.
Drugi uslov podrazumjeva namjernu podjelu druge varijable na 2 modaliteta.
Mjera povezanosti dvije kontinuirane varijable, od kojih ni jedna po svojoj prirodi nije
dihotomna, ali se podaci jedne varijable djele u 2 kategorije, iskazuje se koeficijentom
biserijske korelacije. Primjena koef je opravdana kada je varijabla Y kontinuirano mjerena,
ali postoje nepravilnosti koje onemoguavaju primjenu koeficijenta r.
Postupak za izraunavanje biserijskog koeficijenta:
a)prvo se rauna aritm.sredina -)onih rezultata varijable x kod kojih se u varijabli y nalazi
prva dihotomna oznaka i --)onih rezultata varijable x kod kojih se u varijabli y nalazi druga
dihotomna oznaka.
b) proporcija p i q se dobija na osnovu mjera frekvencija svakog od dihotomnih modaliteta
varijable Y.
c) nakon toga se rauna standardna devijacija varijable x
d)u tabeli se nae vrijednost proporcije p ili q u koloni s tim nazivom,a zatim se u istom
redu potrai odgovarajua vrijednost izraza pq/y
e) vrijednost biserijskog koeficijenta se dobija uvrtavanjem prethodnih izraunatih
vrijednosti u izraz 2.11
KOEFICIJENTI ASOCIJACIJE
-se korsite za mjerenje povezanosti dvije ili vie nominalnih varijabli. Mjerenje stepena
povezanosti izmeu modaliteta nominalne varijable nije mogue na isti nain kao i za
modalitete numerikih i ordinalnih nizova. Neophodan je drugaiji pristup, jer nominalne
varijable nemaju potrebna metrika svojstva modaliteta numerike ili rang varijable.
Nominalna skla je najnepreciznija skala i slui samo za klasifikaciju.
Ovi koeficijenti daju samo priblinu indikaciju asocijacije izmeu posmatranih pojava, pa je
potrebno posebnu panju posvetiti kvantitativnom mjerenju stepena i smjera, te
tumaenje njihove veze.
Podaci se unose u kontigencijsku tabelu. Upotrebom izraza kontigencija, umjesto
korelacija, eli se naglasiti oblik povezanosti koji se javlja izmeu diskontinuiranih
nominalnih varijabli.
Manje se radi o odnosu modaliteta posmatranih pojava, a vie o meusobnom stanju
modaliteta posmatranih varijabli. U literaturi se navode slijedei koeficijenti asocijacije:
Pearsonov koeficijent kontigencije C, Cramerov koeficijent K i koeficijent fi.
Pearsonov koeficijent kontigencije
Kontigencijom C se utvruje zavisnost dva obiljeja u dvodimenzionalnoj tabeli
kontigencije. Koeficijent C ne zahtjeva simetrinu raspodjelu posmatranih varijabli.
Asocijcija izmeu nominalnih varijabli je slabija kada su razlike izmeu empirijskih i
ekivanih frekvencija manje. Koeficijent kontigencije C se zasniva na hi-kvadart testu.
C=
Hi kvadrat test se koristi kada trebamo utvrditi da li neke opaene frekencije zajedno
dstupaju od oekivanih vrijednosti. Kree se u zatvorenom intervalu od 0 do 1. Min vrijed
je 0, a max zavisi od broja posmatranih modaliteta, ali nikad nie vea od 1. Vrijednost koef.
ukazuje na postojanje povezanosti, ali ne i na smijer, odnosno da li je veza pozitivna ili
negativna. Istraiva odreuje smijer na osnovu kretanja podataka u tabeli kontigencije.
Ovaj koef se koristi za diskontinuirane podatke, njegovo poreenje sa koefi r obino nie
pravdano. Koef C nie pouzdana mjera onda kada se u tabeli kontigencije jave suvie male
ekivane vrijednosti. Moe se poboljpati smanjenjem tabele.
Cramerov koeficijent asocijacije K
Zbog tekoa u interpretaciji koeficijenta kontigencije C u praksi se sve vie koristi
koeficijent K. Polaznu osnovu za raunanje C koeficijenta ine razlike izmeu empirijskih i
ekivanih frekvencija, odnosno testova vrijednost hi kvadrata.
K=
Kree se u zatvorenom intervalu od 0 do 1. Koef poprima vrijednost 0 u sluaju nezavisnih
nominalnih varijabli. Koeficijent uzima max vrijednost 1, u sluaju potpunog slaganja
posmatranih varijabli. Ovom koeficijentu se ne pridruuje predznak.
Koeficijent fi
-mjeri se povezanost dvije varijable koje su obje po svojoj prirodi dihotomne ili je jedna
takva, a druga dihotomna samo po obliku( a po prirodi numerika i kontinuirana). Za
raunanje ovog koef neophodno je da da bar jedna varijabla bude prirodno podjeljena na
dva modaliteta. Koeficijent fi se esto upotrebljava i u sluajevima kada je jedna od varijabli
po prirodi kontunuirana, a samo se prikazuje dihotomno zbog razgranienja na odeenom
mjestu kontiniuma. Radi se o parametarskoj metodi, jer se ne moe pretpostaviti normalna
distribucija kod dihotomnih varijabli. Rauna se dir iz tabele kontigencije a i moe se izvesti
iz hi-kvadrata.
Fi koeficijent varira od -1 do 1. Vrijednost 1 postie samo ako je(a+b)=(a+c), odnosno -1
postie ako je (a+b)=(b+d). [ a,b,c,d pojedine frekencije iz 4 elije tabele. a i d na jednoj
dijagonali a, b i c na drugoj dijagonali. ]
KORELACIJA IZMEU NOMINALNE I RANG VARIJABLE
U praksi se ponekad javlja potreba za mjerenjem stepena povezanosti izmeu pojava datih
u obliku nominalne varijable i rang varijable. Potreban je drugaiji pristup, jer nominalna i
rang varijabla nemaju poterbna metrika svojstva modaliteta numerike varijable.
Tu korelaciju raunamo najee Kendelovim tau koeficijentom i Freemanovim teta
koeficijentom.
Kendelov tau koeficijent
-koristimo kada elimo da utvrdimo povezanost varijabli od kojih je jedna rang varijabla a
druga dihotomna nominalna varijabla. U koliko nie svejedno da li jedinica pripada jednoj ili
drugoj grupi, onda to znai da postoji povezanost izmeu posmatranih pojava.
(formula)
Freemanov teta koeficijent
-koristimo kada elimo da mjerimo povezanost pojava koje su predstavljene rang
varijablom i dihotomnom nominalnom varijablom. Koef tau i teta se znaajno razlikuju, a
prednost ide Freemanovom teta koeficijentu, jer kod potpune povezanosti koeficijent teta
daje oekivani maximalnu rezultat 1, bez obzira na vel uzorka, dok se koef tau smanjuje to
je uzorak vei.
(formula)
Ris predstavlja zbir rangova ispod prilikom poreenja ranga svake jedinice prvog podskupa
sa rangovima svih jedinica drugog podskupa, a Riz , zbir rangova iznad.
Moemo ga koristiti i kada nema vezanih rangova.
PARCIJALNA KORELACIJA
Zakon jedne varijable poretpostavlja eliminisanje djelovanja svih drugih varijabli da bi se
utvrdila povezanost varijabli koje su predmet posmatranja. U tom sluaju e se primjeniti
postupak kojim se uvtruje povezanost dvije varijable uz eliminisanje tree varijable. Ovim
postupkom se od ukupne korelacije oduzima onaj dio koji je nastao djelovanjem tree
varijable. Tako dobiveni dio ukupne korelacije naziva se os apsmAs(hn umsaps.
(formula 2.40)
Koeficijent parcijalne korelacije uzima vrijednosti od -1 do 1.
Parcijalna korelacija moe biti linearna i nelinearna. U praksi se u glavnom koristi metom
linerane parcijalne korelacije.
Individualni indeksi
-pruaju sintetiki pogled na evoluciju u odnosu na bazni period i omoguavaju praenje
promjena analiziranih veliina izmeu svih posmatranih perioda. Individualni indeksi se
djele na indekse po stalnoj bazi (PL)v)LmtJa)z i indekse sa promjenjivom bazom ( UPLnPL)v
indeksii
Bazni indeksi
raunamo kao omjer izmeu veliine pojave u posmatranom i baznom periodu.rOs-bphrj-slir
kojem se vri poreenje, naziva se bazni period i oznaava se sa 100. Kako se sve
frekvencije niza dijele s nivm pojave u baznom periodu, bazni indeksi su proporcionalni
veliinama iz kojih su izraunati. Prvi korak u konstrukciji ovog indeksa je izbor baznog
perioda. U praksi se esto uzima prvi ili zadnji period u nizu kao bazni, i to ima odreeni
smisio. U sliajevima kada je izbor baznog perioda otean, ili onemoguen, preporuuje se
da se za bazu odabere neka druga veliina, npr aritmetika sredina freksvencija niza ili neka
druga vrijednost. Za bazni period treba odabrati period u kojem pojava pokazuje relativno
stabilan nivo, ili onaj period u kojem pojava nie bila izloena neubiajnim uticajima.
Bazni indeks pokazuje koliko jedinica pojave u vremenu t tolazi na svakih 100 jedinica
pojave u periodu b. Uvijek su pozitivni brojevi, mogu biti vei, manji ili jednaki 100. Razlika
izmeu 2 bazna indeksa pokazuje )LmtJaLtv/m/rt, koji pokazuju apsolutnu a ne relativnu
razliku opaenih podataka. Ako od baznog indeksa oduzmemo 100, dobit emo ai/fEv
promjene G tsOPG(s jOTOGLGMTOsOfs)tOPjvtGL
Lanani indeksi
raunamo ih tako to za bazu uzimamo svaki put podatke iz prethodnog perioda. Ovi
indeksi nazivaju se i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene
posmatrane pojave u odnosu na prethodni period.
Lanani indeksi pokazuju koliko jedinica pojave u periodu t dlazi na svakih 100 jedinica
pojave u periodu t-1. Kod lananih indeksa broj 100 ne oznaava bazu, nego stagnaciju
razvoja neke pojave. Vrijednost iznad 100 pokazuje da je u tekuem periodu pojava
zabiljeila rast, dok vrijednost ispod 100 pokazuje da je dolo do smanjenja novoa razvoja
pojave u odnosu na prethodni period.
OSOBINE INDEKSA:
Osibina identitetayOtLjDMOGMes(jOjPvGd(j(jOsDOMjOPGMdsevssO jEtbtsOjO
mjenja.
Osobina tranzitivnosti-G TOGMGftTO)sL GE(s s(TOtLjDMtObt(tO(jOPvGt) GLO(jLsDO
dnosu veliine pojave u posmatranom i baznom periodu.
Osibina recipronostiyOMjOdGZjOLjpttMsetOTOGLGMTOsO vt(jdjrOsOgG GvtOLsO(jO
reciproan indeks neutralan u odnosu na vrijeme.
Osobina cirkularnosti-ODsLsO(jO)sL GE(jsOGMGftsOevs)tet GMettOvjBtPvGbGMetrO
moe se rei i da je zadovoljena osobina cirkularnosti.
rupni indeksiOdGgTOftetOfs)tOtEtOEsbstOJsOvsbTs(jOgvTPt.OtLjDMsODvtMetdGOdjeGLO
srednjih vrijednosti i metod agregata.
Prema metodu srednjih vrijednosti grupni indeksi se raunaju tako to se odredi
aritmetika sredina, harmonijska ili geometrijska sredina individualnih indeksa vremenskih
nizova. Prema drugom metodu grupni indeksi se raunaju tako to se zbir podataka
sastavljenih nizova u tekuem periodu stavi u odnos prema zbiru podataka tih nizova u
baznom periodu. Zajednika vrijednost na koju se svode razliite pojave predstavlja sloenu
veliinu ( agregat), pa otuda i sam naziv postupka.
Primjena metoda srednjh vrijednosti i metoda agregata u izraunavanju neponderisanih
rupnih
g
indeksa opravdana je samo u sluaju kada sastavni nizovi imaju priblino isti znaaj.
U praksi je najee sluaj da sastavni nizovi agregata za koje raunamo grupni indeks
nemaju isti znaaj. Zato ove indekse ponderiemo u cilju obezbjeivanja njihove vee
reprezentativnosti kao pokazatelja dinamike vie srodnih vremenskih nizova. U stati praksi
najee koriteni metodi ponderisanja su Laspeyresov i Paascheov metod.
rupni indeks cijena
-je relativan pokazatelj dinamije kretanja cijena grupe pojava u tekuem peridu u odnosu na
bazni period. Za raunanje koristimo metod srednjih vrijednosti i metod agregata.
Prema prvom metodu, grupni indeksi se raunaju tako to se odredi sredina individualnih
indeksa vremenskih nizova. Prema metodu agregata grupni indeksi se raunaju tako to se
zbir podataka sastavljenih nizova u tekuem periodu stavi u odnos prema zbiru podataka
sastavljenih nizova u tekuem periodu.
Metod srednjih vrijednosti ne polazi od orginalnih podataka, nego od njihovih individualnih
indeksa, izaunatih na isti bazni period.
U praksi se najee upotrebljavaju aritmetiki i geometrijski indeksi, dok je harmonijski
indeks koristi za specifina istraivanja dinamike cijena. Nedostatak ovakvog raunanja
grupnog indeksa cijena jeste taj to se daje svim nizovima jednak znaaj. U praksi je rijedak
sluaj da svaka cijena ima jedan ponder. izraunata vrijednost nee biti adevatna ako se u
grupi pojavi neke ekstrem, koji na promjeniti indeks na zjanano visok ili nizak nivo.
Ponderisanje ima cilj da istakne relativni znaaj pojedinih sastavnih nizova u skupu. Na ovaj
nain, poveava se reprezentativnost grupnih indeksa kao pokazatelja dinamike
vremenskih nizova.
Laspeyresov grupni indeks cijenaOPGDs)T(jO)sODEtDGOPvGBjsesOMTOMjOPvGd(jtEjOBt(jjO
grupe pojava zajedno u tekuem u odnosu na bazi period, raunajui uz neizmjenjene
koliine iz baznog perioda.( ponderise uzimaju iz baznog perioda)
Paascheov grupni indeks cijenaOPGDs)T(jO)sODEtDOPvGBjsesOMTOMjOPvGd(jtEjOBt(jjOgvTPjO
pojava zajedno u tekuem u odnosu na bazni period, raunajui uz neizmjenjene koliine iz
baznog perioda.( ponderi se uzimaju iz trekueg perioda)
Laspeyresov i Paascheov indeks su jednaki samo u dva sluaja: prvi, kada koliine u tekuem
periodu ostanu nepromjenjene, i drugi, kada promjena koliina ne znai i promjenu
strukture u tekuem u odnosu na bazni period. Nemaju osobinu tranzitivnosti, ali se
pretpostavlja da imaju, jer je numeriki skoro zadovoljena. Ponderi Laspeyresovog indeksa
su stalni, dok se ponderi Paascheova indeksa mjenjaju za svaki period za koji se rauna taj
indeks. Nedostatak grupnih indeksa raunatih ponderima iz tekueg perioda je esto
mjenjanje pondera, pri emu rezultirajui indeksi nisu meusobno uporedivi. Jedan od
razloga zbog koji se ovaj indeks rjee koristi od Laspeyresovog je i to to u praksi esto ne
raspolaemo adekvatnim tekiim/izvjetajnim podacima za odreivanje pondera.
Zbog navedenih problema mogua je kombinacija pondera iz baznog i tekieg perioda.
Fisherov "idealni" grupni indeksOBt(jsOvsbTsOMjODsGOgjGdjevt(MDsOMvjLtsOnsMPj,vjMG GgOtO
Paascheovog indeksa cijena. Meutim, u praksi nalazi manju primjenu zbog komplikovanos.
Za izraunavanje grupnog indeksa cijena koristi je i sP,aG1PUUlmgt]/,i1/rv)LmtJa, kod
kojeg se za ponderisanje koristi zbir ponderacionih faktora iz baznog i tekueg perioda. Ako
su svi proizvodi iskazani u istim mjernim jedinicama za ponderisanje aritimetike sredine
individualnih indeksa cijena koristimo koliine, a ako mjerne jedinice nisu iste za ponder,
koristimo vrijednost.
rupni indeks koliina
-pokazuje relativne promjene fizikog obima grupe pojava. Pri konstrukciji ovih indeksa
javljaju se isti problemi kao i kod indeksa cijena. Za svaki vremenski niz u grupi moemo
izraunati individualne indekse koliina, kojima se uporeuju relativne promjene koliina u
grupi. Nedostatak ovakvog raunanja indeksa( srednji aritmetiki gruoni indeks koliina)
koliina je razliit znaaj koliina u praktinim primjenama. Dobivena vrijednost nee biti
adekvatna, ako se pojave ekstremne vrijednosti. Raunanje agregatnog neponderisanog
grunog indeksa koliina je dato kao omjer zbira koliina u tekuem i baznom periodu,
takoe nije dobar pokazatelj dinamike grupe, s obzirom na prisustvo razliitih mjernih
jedinica lanova zbira ili razliite raspone varijacije. Rjeenje se nalazi u ponderisanju
koliina cijenama, odnosno u vrijednosnom izraavanju. Izborom stalnih cijena
nemoguava se uticaj promjena cijena na koliine u obraunu indeksa. Za pondere
moemo uzeti koliine iz baznog ili iz tekueg perioda. Za pondere se u praksi mogu
koristiti i neke druge veliine ( najee prosjene ili neke druge cijene). I Laspeyresov i
Paascheov grupni indeks koliina javljaju se u agregatnom obliku, gdje se mjere promjene
fizikog obima, jer su cijene nepromjenjene.
Laspeyresov indeks koliinaOPGDs)T(jO)sODEtDGOPvGBjsesOMTOMjOPvGd(jtEjODEtbtjOgvTPjO
pojava zajedno u tekuem u odnosu na bazni period, raunajui uz neizmjenjene cijene iz
baznog perioda.
Paascheov indeks koliinaOPGDs)T(jO)sODEtDGOPvGBjsesOMTOMjOPvGd(jtEjODEtbtjOgvTPjO
pojava zajedno u tekuem u odnosu na bazni period, raunajui uz neizmjenjene cijene iz
tekueg perioda.
Kada metod srednjih vrijednosti uzima za pondere vrijednosti iz baznog perioda, onda
dobijamo isti rezultat kao i primjenom metoda agregata sa ponderima iz baznog perioda.
Bayesov metod
Bayesov pristup prognoziranju moe se posmatrati kao stohatika verzija Holt-Wintersovog
metoda izglaivanja. Omoguava definisanje ne jednog, nego itavog skupa modela sa
apriornim vjerovatnoama koje analitiar pridruuje svakom modelu iz tog skupa, odnosno
koje pridruuje njegovim koeficijentima. Zatim se koeficijenati modela ponovo izraunavaju
im nova opservacija postane dostupna, odnosno odreuju se apriorne vjerovatnoe. U
praksi je ograniena prijmena ovog metoda zbog raunske sloenosti i potekoa koje
korisnici imaju u razumijevanju dobivenih rezultata.
KLASINA DEKOMPOZICIJA VREMENSKOG NIZA
oDekompozicija vremenskog niza podrazumijeva njegovo ralanjivanje na sastavne
komponente. Cilj dekompozicije vremenskog niza je identifikovanje uticaja svake
komponente pojedinano. Ova identifikacija je posebno znaajna kod pojava sa izraenim
periodinim varijacijama, koje mogu da zamagle pravu sliku o njenom osnovnom kretanju.
Na osnovu empirijskog niza i izraunatih nekih od komponenti moemo utvrditi uticaj
stalih faktora sadranih u nepoznatim komponentama. Brojni faktori koji odreuju
kretanje vremenskih pojava, prema prirodi svog djelovanja, mogu podjeliti na sistematske i
nesistematske. Kodo a)a)itPiaJ)1ovkomponenti prisutne su odreene pravilnosti u
djelovanju na posmatrane pojave. One su u stat literaturi detaljno razraene i pronaeni su
adekvatni postupci za njihovo kvantificiranje. U ove komponente ubrajamo : trend, ciklinu i
sezonsku komponentu. Za razliku od njih, rezidualna( sluajna, iregularna, stohastika)
komponenta je Lta)aitPiaJPh
Vremenski niz moe sadravati nijednu, jednu ili sve tri sistematske komponente, meutim
u analizi je uvijek prisutna rezidualna komponenta.
Opti model vremenske pojave javlja se u Pm)i)rL/v)U)vEUi)fU)JPi)rL/ obliku, a rijetko je
kombinovanog( mjeovitog) oblika. Meusobna veza datih komponenti moe biti aditivna,
multiplikavitna ili kombinovana.
Kod aditivnog modela svako zapaanje vremenskog niza jednako je zbiru 4 komponente,
dnosno:
Y=T+C+S+R
Y-vremenski niz; T-trend; C-ciklinu; S-sezonsku; R-sluajnu(rezidualnu) komponentu.
U aditivnom modelu M jODdPGjejOMTOt)vsZjjOTOtMetdOd(jvtdO(jLttBsdsODsGOtOGvgtsEtO
niz. Kod ovog modela pretpostavlja se da sezonska i rezidualna komponenta ne zavise od
trenda, da se amplituda sezonskih varjacija ne mijenja s vremenom, te da je tokom godine
prosjek sezonskih fluktuacija jednak nuli. Model se koristi kada sa smanjenjem(poveanjem)
nivoa pojave tokom vremena uticaj sezonske komponente ostaje nepromjenjen. Treba
napomenuti da se trend i ciklina komponenta esto ne razdvajaju i zajedniki oznaavaju
sa T.
Multiplikativni model predstavlja proizvod 4 komponente i dat je slijedeim izrazom:
Y= T * Ic * Is * Ir
gdje je trend komponenta data u orginalnim mjernim jedinicama, a ostale 3 komponente
izraene su kao indeksi.
LINEARNI TREND
Ako se analizirana pojava mjenja na priblino isti apsolutni iznos tokom cijelog
buhvaenog perioda tada e linearni trend najbolje odraavati dugoronu razvojnu
tendenciju. Odsjeak kod linearnog trenda predstavlja prosjek vremenskog niza u
posmatranom periodu, dok nagib pokazuje prosjenu promjenu vremenskog niza u
sukcesivnim vremenskim intervalima odgovarajueg perioda. Parametri su nepoznate
veliine i jedino moemo da ih procjenimo pomou uzorka.
Model linearnog trenda predstavlja model trend-polinoma prvog stepena, jer je njegov
deterministiki dio linearna f-ja vremena.
Konstantni lan a predstavlja vrijednost trenda za vremenski period koji prethodi
prvom(x=0), dok b pokazuje prosjenu linearnu promjenu posmatrane pojave pri jedininoj
promjeni varijable vrijeme.
Ekstrapolacija trenda predstavlja produivanje linije trenda izvan intervala obuhvaenog
vremenskim nizom. Cilj ekstrapolacije je prognoziranje nivoa posmatrane pojave u
budunosti. Na kvalitet prognoziranja utie mnogo faktora: duina posmatranog
vremenskog niza, relativna drutveno-ekonomska stabilnost i sl. Model sa ocjenjenim
parametrima moe se koristiti u prognostike svrhe ako pretpostavimo da e trend biti
postojan u prognostikom horizontu.
PARABOLIKI TREND
Kada su druge diferencije (razlike prvih diferencija) priblino jednake umjesto linearnog
trenda koristi se paraboliki trend. Druge diferencije vrijednosti polinima drugog stepena
su konstantne, pa je to razlog njegovog izbora kao f-je vremena u modelu trenda.
Radi se o onim pojavama ije se kretanje u posmatranom periodu odvija na disharmonino,
dnosno na poetku bre, a zatim kasnie sporije i obratno. Ovaj model treba tretirati kao
analitiki izraz dinamike pojave i posmatrati ga kao cjelovit izraz.
Parametar a kod parabolikog trenda predstavlja vrijednost trenda u periodu oznaenom 0.
Kada je predznak parametra b2 negativan, onda je otvor parabole okrenut prema dole,
dnosno ako je parametar b2 pozitivan, otvor parabole je okrenut prema gore.
Pri ekstrapolaciji parabolikog trenda treba biti veoma oprezan, jer pojava koja je u
posmatranom periodu imala rast i opadanje moe ponovo obrnuto smjer svog kretanja. U
prognoziranje kretanja pojave za udaljenije periode ne treba se uputati.
EKSPONENCIJALNI TREND
-pripada grupi nelinearnih f-ja i koristimo ga kada vremenski niz pokazuje karakteristike
geometrijske progresije. Osnovna karakteristika ovakvih kretanja se moe uoiti ve na
grafikom prikazu gdje empirijske vrijednosti na poetku sporije rastu a kasnije sve bre i
bre. Ovaj trend se najbolje prilagoava empirijskim podacima vremenskog niza kada
pojava pokazuje priblino jednaku ralativnu promjenu (rast ili pad), odnosno kada su
apsolutne razlike logaritmovanih podataka priblino iste. Ovaj trend je najbolje prilagoen
vremenskom nizu ako se u polulogaritamskom grafikonu podaci grupiu priblino oko prave
linije. Konstantni lan a predstavlja vrijednost trenda za vremenski period u kojem je x=0,
dok na osnovu b moemo raunati prosjenu stopu promjene. Eksponencijalna prosjena
stopa promjene pokazuje za koliko procenata pojava, u prosjeku, raste ili opada u
posmatranom periodu. Rjeavanje eksponencijalne f-je se vri pomou logaritmovanja.
Logaritmiranjem eksponencijalni trend smo transformovali u model linearnog trenda. U
literaturi se za ovaj model koristi i ime log-lin model, jer je vremenski niz y logaritamovan a
na desnoj strani su orginalne vrijednosti var vrijeme x.Do procjene param.dolazimo
antilogaritmovanjem prethodno dobivenih vrijednosti.
CIKLINA KOMPONENTA
Da bi se kod vremenskih pojava ustanovila prisutnost ciklinih kretanja neophodan je
vremenski niz sa dovoljno obuhvaenim obnavljanjima. Meutim, u praksi se ne raspolae
vremenskim nizovima sa dovoljno lanova, pa se trend i ciklina komponenta posmatraju
zajedno.
Ciklinu komponentu j-shaPiTvdiderYiuPp-brupdbraTpdblrhdsvpTiodslroirjpaliP-iosrjpdiTsr
dovode do njihovih oscilacija iznad ili ispod utvrene prosjene razvojne tendencije u
trajanju od nekoliko godina. Kada se pojava obnavlja napriblino jednak nain s periodom
d dvije ili vie godina, kaemo da su prisutne cikline varijacije. tnuzsh(ahmkes oznaava
relativno nizak nivo pojave, koja se u sa( sezs poveava do nekog maksimuma, nakon kojeg
slijedi osj(onpslu. Poslije minimuma, slijedi rast i obnavljanje puta na priblino jednak nain.
Kod prognoziranja javljaju se velike potekoe, jer se kod posmatranih pojava mijenja i
trajanje i (duina) ciklusa i indenzitet odstupanja (amplituda).
Testiranje znaajnostir,buvbfosrupljposoPsritb-ioprdsroir-iajp-sherY-suTso,bdsrhe:bosr
pojedinih faza, tj razmaka izmeu prevojnih taaka. Ove take u stvari pokazuju momente
kada niz prestaje da raste i poinje da opada i obrnuto. Kada su cikline varijacije znaajne,
broj dugotrajnih faza bie vei.
METODE IZGLAIVANJA
U svakom vremenskom nizu prisutna su odreena kolebanja vrijednosti pojedinanih
frekvencija, koja nekada mogu oteati ouavanje osnovne razvojne tendencije posmatrane
pojave. Da bismo rijeili taj problem, potrebno je reducirati sluajne varijacije primjenom
postupaka izglaivanja vremenskog niza. Izglaivanje vremenskog niza podrazumijeva
izaunavanje aritimetikih sredina za posmatranu pojavu. Na ovaj nain se reducira uticaj
sezonske i rezidualne komponente, dok se trend i ciklina komponenta manifestuju u neto
jasnijem obliku.
Metoda pominih prosjeka i metoda jednostavnog eksponencijalnog izglaivanja
predstavljaju najee koritene metode pomou kojih se vri izglaivanje vremenskih
nizova.
Metoda pominih prosjeka
Pomini prosjeci predstavljaju transforamaciju orginalnog vremenskog niza gdje se svaka
frekvencija zamjenjuje prosjekom. Prosjek se rauna na osnovu odreenog broja narednih i
isto toliko prethodnih frekvencija. S obzirom na to da se primjenom ove metode
pomjeramo od poetka niza sve do njenog kraja, ova metoda je dobila naziv pomini
prosjek. Izglaivanje se bazira na ideji da e svaka neregularna komponenta u svakom
vremenskom trenutku prouzrokovati manji efekat ako je u toj taki uprosjeimo s njenim
susjednim veliinama. to vie lanova niza uzmemo za raunanje prosjeka, linija e biti
izglaenija, ali e nam nedostajati vie prosjeka u odnosu na broj orginalnih podataka.
U praksi koristimo 2 oblika ove metode: jednostavni i ponderisani(vagani).
Jednostavni pomini prosjeci predstavljaju prosjeke m uzastopnih frekvencija posmatranog
vremenskog niza. Ako je broj lanova pominog prosjeka M neparan, tada e ukupno M-1
rginalnih podataka ostati bez svog pominog prosjeka. Ovaj nedostatak metode je sve
vie izraen to uzimamo grupe sa veim brojem lanova. Ako je broj lanova pominog
prosjeka M paran, onda ce ukupno M orginalnih podataka ostati bez svog pominog
prosjeka.
U sluaju kada je broj lanova pominog prosjeka M paran, aritmetika sredina nee se
uklapati u neki tano odreen period, nego izmeu 2 perioda za koja raspolaemo
empirijskim podacima. Kako su ovako dobiveni prosjeci nepodesni za koritenje, provodimo
postupak centriranja. Ovaj postupak se provodi na razliite naine i omoguava da se
centrirani prosjeci raunaju kao aritmetika sredina prethodno izraunatih pominih
prosjeka od 2 lana.
Prednost metode pominih prosjeka ogleda se u jednostavnom izraunavanju. Potekoe u
primjeni ove metode javljaju se kod izbora duine pominog prosjeka M i pondera
frekvencija. U praksi se obino za vee fluktuacije oko trenda koristi prosjek vee duine i
bratno. Nedostatak je i manjak podataka o trendu u poetnim i zavrnim vremenskim
periodima.
Oscilacije nisu pravilne i nemaju stalan period obnavljanja. Pomini prosjeci, ustvari,
sugeriu da postoji ciklino kretanje i ta se pojava naziva Slutcky-Yuleov efekat.
Metoda jednostavnog eksponencijalnog izglaivanja
Cilj ove metode je ozglaivanje empirijskih podataka, kako bi se eliminisali ili reducirali
sluajni uticaji kod posmatrane pojave.
Ova metoda nudi kompromis, nudei prognoze koje se baziraju na ponderisanom prosjeku
sadanjih i ranijih vrijednosti. Metoda bazirana na ideji o kvalitetu raspoloivih podataka,
koji u najveoj mjeri zavise od njihove starosti. Stariji podaci su manje korisni, pa im je
potrebno dati manju vanost. Noviji podaci zadravaju najvjerovatnije informacije o onome
t je za realno oekivati da e se dogoditiu budunosti. U izraunavanju tog prosjeka,
najvei ponder pridaje se najnovijem podatku, neto manji podatku koji mu neposredno
prethodi, jo manji njemu prethodnom podatku.
Jednostavno eksponencijalno izglaivanje podrazumijeva transforamaciju vremenskog niza
gdje su orginalni podaci zamjenjeni ponderisanim prosjekom svih prethodnih podataka, sa
ponderima koji se eksponencijalno smanjuju sa starou podataka.
Ovaj metod je primjeren za izglaivanje vremenskih nizova bez sistematskih komponenti.
Koristi se za pojave koje karakteriu sluajne varijacije oko prosjeka, odnosno one koje
nemaju izraen trend. Sadri li trend, koristit emo model dvostrukog, trostrukog odnosno
viestrukog eksponencijalnog izglaivanja. Prisutnost sezonske komponente takoe e
upuivati na koritenej odg modela izglaivanja.
Ulogu pondera ima konstanta izglaivanja koja moe uzeti vrijednost izmeu 0 i 1.
Ponderi predstavljaju geometrijski red, a njihov zbir je jednak 1. Konstanta izglaivanja
dreuje brzinu kojom protekle vrijednosti gube svoj uticaj na izglaenu vrijednost u
vremenu t. Vea vrijednost konstante izglaivanja znai bri gubitak uticaja i obrnuto. to je
vrijednost konstante manja, vremenski niz e biti vie izglaen. Ne postoji egzaktan nain
dreivanja konstante izglaivanja. U praksi se najee uzimaju vrijednosti izmeu 0.2 i
0.3. Jedna od mogunosti odreivanja konstante jeste i lino iskustvo.
Uspjenost izglaivanja utvruje se na osnovu razlike izmeu orginalnih podataka i
izglaenih vrijednosti. Bira se ona vrijednost konstante koja minimizira vrijednost srednje
kvadratne greke. Najvanije prednosti ove metode su : uzima u obzir sve prole podatke,
zahtjeva mali broj podataka, vei znaaj daje novijim podacima, predstavlja osnovu nekim
razraenijim metodama prognoziranja. Nedostaci metode: izbor konstante izglaivanje nije
jednostavan, ne moe se koristiti u analizi pojava sa izraenim trendom i sezonalom,
najee nie dobar metod za srednjerono i dugorono prognoziranje, velike sluajne
fluktuacije mogu jako uticati na kvaltiet prognoziranja.
SEZONSKA KOMPONENTA
utie na kretanje pojave tako da ona odstupa od svoje osnovne tendencije utvrene
trendom na vie ili na nie. Prisustvo sezonskih varijacija zamagljuje uoavanje osnovne
razvojne tendencije pojave, pa se samo njihovim iskljuivanjem moe sagledati osnovni
razvojni tok. Postupak iskljuivanja sezonskih varijacija iz vremenskog niza naziva se
desezoniranje ili sezonsko izglaivanje. Kj)MDtOTetBs(O(jOt)vsZjOTOeTvt)dTrOMsGfvsms(TrO
graevini..
Sezonske varijacije pokazuju promjene odreene pojave, koje se ponavljaju tokom vie
g dina u isto doba, u istom smjeru i priblino istim intenzitetom. Kod nekih ekonomskih i
drutvenih pojava sezonske varijacije se izraavaju na isti nain tokom vremena. Kada se
sezonal ispoljava na priblino na isti nain iz godine u godinu, kaemo da je djelovanje
sezonskih faktora stabilno. Tada za sezonsku komponentu kaemo da je deterministike
prirode, jer se njena priroda ne mjenja tokom vie godina. Ako sezonske varijacije mjenjaju
intenzitet i periodinost ponavljanja u svakom narednom periodu onda govorimo o
nestabilnom sezonskom ritmu. U tom sluaju sezonska komponenta je stohastike prirode.
Smjer i intenzitet sezonskog varijabiliteta mjeri se sezonskim indeksima. Sezonski indeksi
su relativni brojevi koji mjere jainu sezonskog uticaja u odreenom mjesecu(kvartalu)
tokom vie godina. Tipini indeksi predstavljaju uopten intenzitet sezonskog varijabiliteta
za vie godina. Preko specifinih izraunavaju se tipini sezonski indeksi, koji treba da
reprezentuju sezonska odstupanja tokom cjeog posmatranog perioda. Indeksi ija je
vrijednost preko 100 pokazuju da posmatrana pojava zbog sezonskih uticaja raste. Indeksi
ija je vrijednost ispod 100 pokazuju da pojava opada pod uticajem sezone. S obzirom na to
da sezonski indeksi variraju oko 100 njihov zbir kod kvadratnog niza mora biti jednak 400,
tj. kod mjesenog niza mora iznositi 1200. Kod oba niza prosjek je jednak 100.
Prve informacije u analizi sezonskog karaktera pojave najlake je dobiti iz grafikog prikaza.
Najjednostavniji je linijski grafikon sa ucrtanim podacima svih posmatranih perioda, jer on
moguava ouavanje sezonskih kolebanja.
Osnov za numeriko izraavanje sezonskih uticaja je model. Iskustva pokazuju da u procesu
analize vremenskih nizova multiplikativni modeli daju bolje rezultate.
Za cikline pojave je karakteristino da se obnavljaju u periodu od najmanje dvije godine, ali
se u praksi javlja problem vremenskih nizova odgovarajue duine. Jedno od moguih
rjeenja za prevazilaenje ovog problema je spajanje trenda i cikline komponente u jednu
komponentu. ( Y= T * Is * Ir )
Postoje 2 pristupa mjerenju sezonskih varijacija: empirijski(tradiocionalni) i regresioni
(modelski) pristup. Mod modelskog pristupa sezonska priroda se mjeri ukljuivanjem
sezonskih nezavisnih varijabli u regresioni model vremenskog niza ili posebnom vrstom
modela tzv. ARIMA modelima.
Mjerenje sezonskih varijacija po metodu pominih prosjeka zasniva se na njihovom
izdvajanju od ostalih komponenti. Osnovna ideja je da ovi prosjeci obuhvate zajedno trend i
ciklinu komponentu, te da se djeljenjem orginalnih frekvencija s pripadajuim pominim
prosjecima iskljui njihov uticaj. Na ovaj nain ostaju jo sezonska i rezidualna komponenta.
Specifini sezonski koeficijenti, osim sezonskih, u sebi sadre i neregularne uticaje, koji se
iskljuuju tako to se izraunavaju prosjeci svih specifinih sezonskih koeficijenata za
istoimene kvartale(mjesece). Mnoenjem tih prosjeka sa 100 dobijamo sezonske indekse.
Da bismo u analizi vremenskog niza dobili ist uticaj sezone, neophodne je podjeliti
rginalne frekvencije sa trend, ciklus i rezidualnom komponentom.
izraunati prosjek ili medijan izraunatih omjera u preth koraku za istoimene kvartale