You are on page 1of 75

Sveučilište Jurja Dobrile u Puli

Odjel za ekonomiju i turizam


„Dr. Mijo Mirković“

Alen Belullo

UVOD U EKONOMETRIJU
Sveučilište Jurja Dobrile u Puli
Odjel za ekonomiju i turizam
„Dr. Mijo Mirković“

UVOD U EKONOMETRIJU

Sveučilišni udžbenik

Autor: Doc. dr. sc. Alen Belullo


Copyright © Belullo, Alen

Nakladnik:
Sveučilište Jurja Dobrile u Puli
Odjel za ekonomiju i turizam
„Dr. Mijo Mirković“

Za nakladnika:
Prof. dr. sc. Robert Matijašić, rektor

Recenzenti:
Dr. sc. Goran Buturac
Prof. dr. sc. Ante Rozga

Lektura:
Marija Belullo, prof.

Objavljivanje ove knjige odobrio je Senat Sveučilišta Jurja Dobrile u Puli


odlukom Klasa: 003-08/11-02/70-01, Ur. broj: 380/11-01/-1 od 15. prosinca
2011. godine sukladno Zaključku Povjerenstva za izdavačku djelatnost
Sveučilišta Jurja Dobrile u Puli od 28. studenog 2011. godine.

UVOD U EKONOMETRIJU/ Alen Belullo. – Pula:


Sveučilište Jurja Dobrile u Puli, Odjel za ekonomiju i
turizam „Dr. Mijo Mirković“, 2011.

Bibliografija.

ISBN 978-953-7498-50-4

1. Belullo, A.
Sadrµzaj

Predgovor iii

1 Uvod u regresijsku analizu 1


1.1 Pojam ekonometrije . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Koraci u ekonometrijskoj analizi . . . . . . . . . . . . . . . . 2
1.2.1 Odre†ivanje teorije ili hipoteze . . . . . . . . . . . . . 2
1.2.2 Speci…kacija matematiµckog modela . . . . . . . . . . . 2
1.2.3 Speci…kacija ekonometrijskog modela . . . . . . . . . . 3
1.2.4 Prikupljanje podataka . . . . . . . . . . . . . . . . . . 5
1.2.5 Procjena ekonometrijskog modela . . . . . . . . . . . . 9
1.2.6 Testiranje hipoteza . . . . . . . . . . . . . . . . . . . . 10
1.2.7 Prognoziranje i predvi†anje . . . . . . . . . . . . . . . 10
1.3 Regresijska funkcija populacije i regresijska funkcija uzorka . 11

2 Parametri modela dobiveni metodom najmanjih kvadrata 18


2.1 Procjena parametara . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Svojstva regresijskog pravca . . . . . . . . . . . . . . . . . . . 26
2.3 Svojstva procjenitelja . . . . . . . . . . . . . . . . . . . . . . 28

3 Pokazatelji kvalitete regresije 32


3.1 Koe…cijent determinacije . . . . . . . . . . . . . . . . . . . . . 33
3.2 Znaµcajnost procjenitelja . . . . . . . . . . . . . . . . . . . . . 39
3.2.1 Standardna greška procjenitelja . . . . . . . . . . . . . 39
3.2.2 Testiranje hipoteza nad procjeniteljima . . . . . . . . 42

A Izvodi i dokazi 57
A.1 Izvod parametara modela s jednom nezavisnom varijablom
metodom najmanjih kvadrata . . . . . . . . . . . . . . . . . . 57

B Matematika P 59
B.1 Neka svojstva operatora zbrajanja . . . . . . . . . . . . . . 59

i
C Statistika 61
C.1 Distribucije vjerojatnosti izvedene iz normalne distribucije . . 61

D Podaci 62
D.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

E Statistiµcke tablice 63

ii
Predgovor

Ovaj udµzbenik nastaje iz potrebe da studenti lakše shvate teorijske pretpos-


tavke na kojima se temelji metoda najmanjih kvadrata. Cilj je bio napisati
rad koji polazi od osnovnih ekonometrijskih pojmova, tj. namijenjen je µci-
tatelju koji nema nikakvog predznanja iz tog podruµcja, ali je ipak pisan u
strogoj matematiµckoj formi, kako bi se izbjegle zamke nedoreµcenosti, u koje
upadaju mnogi udµzbenici iz ekonometrije, pisani za poµcetnu razinu. Ka-
ko ne bi prosjeµcnom µcitatelju opterećivali tekst sloµzeniji matematiµcki dokazi
i osnove teorije distribucije vjerojatnosti, dani su u dodacima. Matema-
tiµcka notacija konzistentna je kroz cijeli rad (npr. populacijske vrijednosti
su uvijek oznaµcene grµckim alfabetom, dok vrijednosti uzoraka uvijek latin-
skom abecedom, velikim podebljanim slovima oznaµcene su matrice, malim
podebljanim slovima vektori, nepodebljani izrazi su skalari, varijable u de-
vijacijskoj formi su uvijek prikazane tildom itd.).
U knjizi se nadalje, zbog potreba poopćavanja, paralelno koristi obiµcna
algebra, karakteristiµcna za poµcetniµcke udµzbenika, i matriµcna algebra, karak-
teristiµcna za napredne udµzbenike iz ekonometrije. Na taj se naµcin pokušao
premostiti jaz, koji postoji izme†u poµcetnih udµzbenika i naprednih udµzbe-
nika iz ekonometrije, tj. da se zorno prikaµze na koji se naµcin mogu poopćiti
« obiµcne» jednadµzbe kojima se prikazuju jednostavniji modeli (npr. modeli s
jednom nezavisnom varijablom) putem matriµcnog zapisa istih ekonometrij-
skih izraza koji vrijede za sloµzenije modele (npr. s k 1 nezavisnih varijabli).
Na taj se naµcin moµze dobiti dojam elegancije i kompaktnosti matriµcnog za-
pisa, a korištenjem matriµcno orijentiranih softwarea brzo i e…kasno rješavati
zadatke prikazane u knjizi.
U knjizi su prikazani mnogobrojni primjeri i zadaci te su dani svi poda-
ci potrebni µcitatelju da bi mogao sam jednostavno reproducirati prikazane
dobivene rezultate.
Osim studentima, koji slušaju predmet Ekonometrija, Analiza vremen-
skih nizova, Ekonometrija II, namijenjen je i istraµzivaµcima koji µzele dobiti
µcvrste temelje, kako bi shvatili samu bit regresijske analize pomoću metode
najmanjih kvadrata. Što se tiµce potrebnog predznanja, da bi se knjiga mogla
lako µcitati, potrebno je samo osnovno znanje iz matriµcne algebre.
Knjiga je podijeljena u tri poglavlja: u prvom dijelu objašnjava se po-

iii
jam ekonometrije, koraci u ekonometrijskoj analizi te regresijska funkcija
populacije i uzorka; u drugom dijelu objašnjava se na koji se naµcin dobiva-
ju parametri metodom najmanjih kvadrata, svojstva regresijskog pravaca i
procjenitelja, da bi se u zadnjem dijelu prikazali pokazatelji kvalitete regre-
sije.
Budući da je ova knjiga proizašla iz dijelova priprema za predavanja iz
predmeta Ekonometrija µzelio bih se zahvaliti svim studentima koji su svojim
komentarima i pitanjima tijekom predavanja doprinijeli da se knjiga pribliµzi
njihovim potrebama i boljem razumijevanju gradiva, kao i svim onim stu-
dentima koji su uspješno detektirali tiskarske greške u radnim verzijama
ovog rada, jer sam svjestan da je rat s tiskarskim greškama bespovratno
izgubljen, ali poneka je bitka dobivena, zahvaljujući njima. Nadalje, poseb-
no bih se zahvalio profesorici Mariji Bušelić i Sanji Blaµzević koje su svojom
beskrajnom upornošću i altruizmom doprinijele da ova knjiga uopće ugleda
svjetlost dana. Za tehniµcku podršku zahvalio bih se Ðaniju Buriću. Na kraju
volio bih reći jedno veliko hvala bliµzim µclanovima moje obitelji na njihovim
sugestijama i lekturi, te za uvijek prisutnu podršku kada su s dubokim ra-
zumijevanjem µcesto morali podnositi moja prevrtljiva raspoloµzenja tijekom
njezinog nastajanja.

iv
Poglavlje 1

Uvod u regresijsku analizu

1.1 Pojam ekonometrije


Ekonometrija doslovno znaµci ekonomsko mjerenje. Ekonometriju moµzemo
de…nirati kao znanstvenu disciplinu koja se bavi empiriµckim dokazivanjem
ekonomskih zakona de…niranih u ekonomskoj teoriji. Usko je vezana uz
discipline: ekonomska teorija, matematiµcka ekonomija i ekonomska
statistika.
Ekonomska teorija postavlja svoje zakone uglavnom na kvalitativnoj ra-
zini, tj. odre†uje smjer kretanja zavisnosti odre†enih ekonomskih pojava,
bez odre†ivanja veliµcine i znaµcajnosti tih veza.
Matematiµcka ekonomija izraµzava ekonomsku teoriju u odre†enoj mate-
matiµckoj formi (jednadµzbe), bez osvrtanja na empiriµcku provjeru tih teorija.
Ekonomska statistika bavi se prikupljanjem, obradom i prezentiranjem
ekonomskih pokazatelja u obliku tablica i slika. Ekonomska statistika ne bavi
se provjerom ekonomskih teorija na temelju tako prikupljenih podataka.
Znaµci, ekonometrijom se provjeravaju, koristeći se metodama matema-
tiµcke ekonomije i podacima dobivenim iz statistike, jesu li valjane ekonomske
teorije za odre†eni uzorak (populaciju).
Ekonometriju moµzemo podijeliti u dvije glavne skupine: teorijska eko-
nometrija i primijenjena ekonometrija. Teorijska ekonometrija bavi se
razvijanjem ekonometrijskih metoda, dok se primijenjena ekonometrija bavi
primjenjivanjem ekonometrijskih metoda koje je razvila teorijska ekonome-
trija na konkretnim ekonomskim problemima.
Teorijska i primijenjena ekonometrija mogu koristiti ili Bayesov ili kla-
siµcni pristup statistiµckom zakljuµcivanju. Glavna je razlika izme†u ova dva
pristupa u njihovom poimanju vjerojatnosti. Po Bayesovom pristupu vjero-
jatnost se odnosi na stupanj razumno prihvatljivog uvjerenja; vjerojatnost je
vezana za stupnjeve pouzdanosti koje istraµzivaµc unaprijed ima o nekom em-
piriµckom fenomenu (prije samog promatranja podataka). Drugim rijeµcima
po Bayesu imamo subjektivni pristup konceptu vjerojatnosti. Po klasiµcnom

1
pristupu vjerojatnost se odnosi na frekvenciju pojavljivanja odre†enog do-
ga†aja u ponovljenim izvlaµcenjima, ili imamo objektivni pristup konceptu
vjerojatnosti.

1.2 Koraci u ekonometrijskoj analizi


Ekonometrijska analiza slijedi odre†en put, a to je:

1. Odre†ivanje teorije ili hipoteze

2. Speci…kacija matematiµckog modela

3. Speci…kacija ekonometrijskog modela

4. Prikupljanje podataka

5. Procjena ekonometrijskog modela

6. Testiranje hipoteza

7. Predvi†anje i prognoziranje

1.2.1 Odre†ivanje teorije ili hipoteze


Svoje teorije i hipoteze ekonometrija uglavnom preuzima, kao što smo rekli,
iz ekonomske teorije. Tako je npr., J. M. Keynes rekao da ako se raspoloµziv
dohodak stanovništva poveća, tada će se, uz ostale nepromijenjene uvjete,
povećati potrošnja stanovništva, ali za manje od povećanja raspoloµzivog do-
hotka. Ne govori nam ništa u prilog tome koliko će se potrošnja povećati za
jediniµcno povećanje raspoloµzivog dohotka, već nam govori samo o smjeru za-
visnog kretanja tih varijabli i da je graniµcna sklonost potrošnji stanovništva
izme†u 0 i 1.

1.2.2 Speci…kacija matematiµckog modela


Iako je Keynes pretpostavio pozitivnu vezu izme†u potrošnje i raspoloµzi-
vog dohotka, nije speci…cirao precizni oblik funkcionalne veze izme†u tih
varijabli. Matematiµcka ekonomija sugerira sljedeću funkcionalnu formu:

y= 0 + 1x 0< 1 <1 (1.1)


gdje:
y = potrošnja
x = raspoloµziv dohodak
0 = autonomna potrošnja
1 = graniµcna sklonost potrošnji

2
y

y = β 0 + β1 x
Potrošnja

β1
1

β0

Raspoloživ dohodak
x

Slika 1.1: Deterministiµcki model

Jednadµzba (1.1) govori nam da je potrošnja linearno ovisna o dohotku jer


imamo linearnu funkciju (polinom prvog stupnja). To je matematiµcki model
izme†u potrošnje i dohotka koji se u ekonomiji zove funkcija potrošnje.
Općenito modelom zovemo skup matematiµckih jednadµzbi. Jednadµzbe ne
moraju biti linearne već mogu poprimiti razliµcite funkcionalne forme (logari-
tamske, eksponencijalne, itd.). U prikazanom sluµcaju model µcini samo jedna
linearna jednadµzba. y i x zovemo varijablama modela. Varijablu x, koja
ne ovisi o drugim varijablama u modelu, zovemo nezavisnom ili egzoge-
nom varijablom, dok varijablu y, koja u našem sluµcaju ovisi o varijabli x
zovemo zavisnom ili endogenom varijablom. 0 i 1 zovu se parametri
ili koe…cijenti modela. O vrijednostima parametara ovisi izgled funkcije.
0 odre†uje odsjeµcak na ordinati, koji se u ekonomiji interpretira kao auto-
nomna potrošnja, dok 1 odre†uje nagib ili smjer funkcije, što se u ekonomiji
interpretira kao graniµcna sklonost potrošnji.

1.2.3 Speci…kacija ekonometrijskog modela


Jednadµzba 1.1 prikazuje egzaktnu ili deterministiµcku vezu izme†u vari-
jable x i varijable y. Me†utim, veze izme†u ekonomskih varijabli uglavnom
nisu egzaktne stoga se pojavljuje potreba za ukljuµcivanjem stohastiµckog ele-
menta " u matematiµcki model. Ukljuµcivanjem stohastiµckog elementa "
matematiµcki se model 1.1 pretvara u ekonometrijski (stohastiµcki) mo-

3
del:
y= 0 + 1x +" 0< 1 < 1: (1.2)
Stohastiµcki element " zovemo i sluµcajno odstupanje, sluµcajna greška
ili rezidual.

y = β 0 + β1 x
y
Potrošnja

ε+ ε−

x
Raspoloživ dohodak

Slika 1.2: Ekonometrijski model

Na Slici 1.2 prikazan je ekonometrijski model funkcije potrošnje. Iz Slike


1.2 vidimo da svaku toµcku moµzemo odrediti deterministiµckim dijelom y =
0 + 1 x kojemu dodajemo sluµcajno odstupanje ". Sluµcajno odstupanje
moµze biti pozitivno (iznad pravca) ili negativno (ispod pravca). Sluµcajno
odstupanje preuzima na sebe vrijednosti svih varijabli koje su izostavljene
iz modela, a koje utjeµcu na ponašanje y i greške koje se pojavljuju uslijed
krive funkcionalne forme. Moµzemo reći da se sluµcajna greška " pojavljuje
zbog:

1. Neodre†enosti teorije: ekonomska teorija teµzi pojednostavljivanju stvar-


nog svijeta i stoga u teorijske modele ne ulaze sve varijable koje bi
mogle utjecati na y, već samo one koje se smatraju vaµznijima, kako bi
se ekonomski modeli zadrµzali jednostavnima.

2. Nedostupnosti podataka: npr. moµzemo smatrati da na potrošnju po-


jedinaca utjeµce, osim njihovog raspoloµzivog dohotka, i njihovo bogat-
stvo. Dok je raspoloµziv dohodak dostupna informacija, bogatstvo je
µcesto nedostupan podatak.

4
3. Manje vaµznih varijabli : pretpostavimo da, osim raspoloµzivog dohot-
ka, na potrošnju utjeµcu i sljedeće varijable: broj djece, spol, vjera,
obrazovanje i zemljopisni poloµzaj. Moguće je pretpostaviti da je nji-
hov utjecaj na potrošnju slab, nesustavan i stoga sluµcajan. Stoga se iz
praktiµcnih razloga te varijable izostavljaju, a njihov zajedniµcki utjecaj
na zavisnu varijablu y ulazi u sluµcajnu grešku ".
4. Sluµcajnosti koje su svojstvene ljudskom ponašanju: kada bismo i us-
pjeli ukljuµciti u model sve relevantne varijable, uvijek postoji u pona-
šanju pojedinca odre†ena doza sluµcajnosti koja se ne moµze racionalno
objasniti, ma koliko mi to pokušavali.
5. Loših zamjenskih varijabli : µcesto varijable koje predlaµze ekonomska
teorija nisu neposredno mjerljive. U poznatoj funkciji potrošnje Milto-
na Friedmana permanentna potrošnja ovisi o permanentnom dohotku.
Me†utim, niti je permanentni dohodak, niti je permanentna potrošnja
neposredno mjerljiva veliµcina, već se procjenjuju na temelju njihovih
tekućih vrijednosti. U tom sluµcaju moµze doći do greške u njihovoj pro-
cjeni. Ovu će mjernu grešku tako†er na sebe preuzeti sluµcajna greška
".
6. Krive funkcionalne forme: iako smo ispravno u model ukljuµcili rele-
vantne varijable moguće je da smo pogriješili u odabiru funkcionalne
forme. Npr. pretpostavimo da je umjesto y = 0 + 1 x + " ispravan
model y = 0 + 1 x + 2 x2 + ". U modelu sa samo dvije varijable lako
je na temelju izgleda dijagrama disperzije odrediti funkcionalnu formu.
Me†utim, u modelima s više nezavisnih varijabli to postaje vrlo teško
jer nije moguće prikazati višestruko dimenzionalni dijagram disperzije.
Greška, koja se pojavljuje uslijed odabira krive funkcionalne forme, ući
će u sluµcajnu grešku ".

1.2.4 Prikupljanje podataka


Parametre 0 i 1 modela 1.2 procjenjuju se na temelju opaµzanja varijabli
x i y koji se dobiju iz statistike. Opaµzanja o varijablama mogu se prikup-
ljati za vremenska razdoblja, pa govorimo o vremenskim nizovima (eng.
time series). Osim toga mogu se prikupljati za pojedince, grupe pojedinaca,
predmete ili za geografska podruµcja, pa govorimo o podacima vremenskog
presjeka (eng. cross section). Obje se vrste podataka mogu kombinira-
ti da bi se dobili zdruµzeni podaci vremenskih nizova i vremenskih
presjeka (eng. pooled cross sections).

Vremenski nizovi
Vremenski se nizovi sastoje od opaµzanja jedne ili više varijabli kroz vrijeme.
Takvi se podaci mogu prikupljati dnevno (npr. cijene dionica), tjedno

5
(npr. ponuda novca), mjeseµcno (npr. indeks cijena, stopa nezaposlenosti),
kvartalno (npr. BDP), godišnje (npr. drµzavni proraµcun), desetogodiš-
nje (npr. popis stanovništva).

Tablica 1.1: Potrošnja i BDP u Hrvatskoj od 1997. do 2005. godine

Potrošnja (C) BDP (Y)


Godina u milijardama kuna u milijardama kuna
1997. 79.023 123.811
1998. 82.741 137.604
1999. 83.336 141.579
2000. 109.500 152.519
2001. 99.611 165.639
2002. 100.139 181.231
2003. 115.081 198.422
2004. 122.100 212.826
2005. 130.576 229.031
Izvor: International Financial Statistics (IFS), Međunarodni monetarni fond, veljača 2007.

U Tablici 1.1 prikazani su podaci o hrvatskoj potrošnji i BDP-u za raz-


doblje od 1997. do 2005. godine na temelju kojih moµzemo izraµcunati hr-
vatsku funkciju potrošnje. Vidimo da se radi o dva vremenska niza izraµzena
na godišnjoj frekvenciji. Svi podaci koji ulaze u odre†enu ekonometrijsku
analizu moraju biti izraµzeni u istoj vremenskoj frekvenciji (svi moraju biti
godišnji, kao u gornjem sluµcaju, kvartalni, itd.) Podatke iz viših frekven-
cija moµzemo pretvoriti u niµze frekvencije (npr. kvartalne u godišnje)
pomoću prosjeka za varijable koje prikazuju stanja (npr. cijene, kamat-
njaci), ili pomoću zbrajanja za varijable koje prikazuju tokove (npr. BDP,
potrošnja, investicije). S niµzih frekvencija na više frekvencije moguće
je transformirati varijable pomoću statistiµckih metoda interpolacije (za sta-
nja) i distribucije vrijednosti (za tokove). Vremenske nizove karakteriziraju
trend i sezonska odstupanja (za frekvencije više od godišnjih) a njima
se bavi jedan posebni dio ekonometrije koji se zove Analiza vremenskih
nizova ili Ekonometrija vremenskih nizova. Na slici 1.3 prikazan je
hrvatski BDP izraµzen u kvartalima (tromjeseµcno) gdje se jasno vidi da u
promatranom razdoblju BDP ima znaµcajan trend rasta i velika sezonska od-
stupanja; BDP je najveći u 3. kvartalu a najmanji u 1. kvartalu1 . Drugim
rijeµcima, vremenski nizovi µcesto nisu stacionarni procesi2 , a stacionarnost
je jedna od pretpostavki na kojima leµze ekonometrijski modeli.
1
Jasno se vidi da je 1995. godine "podbacila" sezona uslijed redarstvenih akcija Bljeska
i Oluje.
2
Kaµze se da je vremenski niz stacionaran ako se njegova sredina i varijanca asimptotski
ne mijenjaju tijekom vremena.

6
BDP
bazni indeks 2000.= 100
150

125

100

75
1993 1995 1997 1999 2001 2003 2005

Slika 1.3: Hrvatski kvartalni BDP od 1993:1-2006:3

Vremenski presjeci
Podaci vremenskog presjeka su podaci jedne ili više varijabli prikupljeni u
zadanoj vremenskoj toµcki. Kada bismo na taj naµcin htjeli prikupiti podatke
na temelju kojih bismo mogli procijeniti funkciju potrošnje u Hrvatskoj,
morali bismo prikupiti npr. opaµzanja o dohotku i potrošnji po gradovima ili
µzupanijama.
U Tablici 1.2 prikazan je vremenski presjek (za 2004. g.) potrošnje i
BDP-a za tranzicijske zemlje. Vidimo da se skup opaµzanja u ovom sluµcaju
ne sastoji od razliµcitih godina, već od podataka za razliµcite zemlje za 2004.
godinu. Ako ne bismo imali na raspolaganju podatke za sve zemlje za 2004.
g., mogli bismo koristiti za neke zemlje i podatke iz 2003. ili 2005. godi-
ne, ako smatramo da nije došlo do strukturnih promjena u tim godinama.
Drugim rijeµcima, u analizi vremenskih presjeka moµzemo zanemariti manje
razlike u vremenu prikupljanja podataka. Kao što vremenski nizovi imaju
svoje speci…µcne probleme (stacionarnost), tako i vremenski presjeci imaju
svoje speci…µcne probleme, me†u kojima je najznaµcajniji heterogenost po-
dataka.
Dijagramom disperzije na slici 1.4 prikazan je odnos izme†u BDP-a i po-
trošnje u tranzicijskim zemljama. Imamo male zemlje s malim BDP-om kao
što su Makedonija, Bugarska, Hrvatska, Slovenija i Slovaµcka, zemlje sa sred-

7
Tablica 1.2: Potrošnja i BDP 2004. godine u tranzicijskim zemljama

Potrošnja (C) BDP (Y)


Zemlja u milijardama US $ u milijardama US $
Bugarska 16.518 24.225
Hrvatska 20.249 35.295
Češka 54.818 108.212
Mađarska 68.572 102.157
Makedonija 4.182 5.368
Poljska 161.921 252.254
Rumunjska 51.277 75.574
Slovačka 23.833 42.011
Slovenija 17.874 32.601
Izvor: International Financial Statistics (IFS), Međunarodni monetarni fond, veljača 2007.

njim BDP-om kao Rumunjska, Ceš µ ka i Ma†arska, i na kraju imamo Poljsku


koja znatno odskaµce po svojoj veliµcini. U tom sluµcaju, imamo heterogene
podatke i zato moramo voditi raµcuna o tzv. efektu razmjera ili efektu
opsega.

Zdruµzeni podaci i panel (uzduµzni) podaci


Ako kombiniramo vremenske nizove s vremenskim presjecima dobijemo zdru-
µzene podatke.
Posebna vrsta zdruµzenih podataka, u kojima se kroz razliµcite vremenske
toµcke pojavljuju iste vremenski presjeµcne jedinice (iste obitelji, iste zemlje,
itd.), zovu se panel ili uzduµzni (longitudinalni) podaci. Tablica 1.3 pri-
kazuje uzduµzne podatke o potrošnji i BDP-u za tranzicijske zemlje. U tom
sluµcaju imamo za svaku vremenski presjeµcnu jedinicu (zemlju) niz vremen-
skih toµcaka (od 1997. do 2005. godine). Ako gledamo tablicu kroz njezine
retke, vidimo vremenski presjek, ali ako je gledamo kroz stupce, vidimo vre-
menski niz. Znaµci, uzduµzni podaci su kombinacija vremenskih presjeka i
vremenskih nizova za iste vremenski presjeµcne jedinice.
Pretpostavimo, me†utim, da se u dvije razliµcite godine (2000. i 2005.)
istraµzivala funkcija potrošnje hrvatskih obitelji s pitanjima o njihovim do-
hocima i potrošnji. Kada bismo ukljuµcili samo opaµzanja iz 2000. godine, ili
samo opaµzanja iz 2005. godine, radilo bi se o vremenskom presjeku. Me†u-
tim, kako bi se povećao broj opaµzanja moµzemo zdruµziti podatke iz 2000. i
2005. godine i tako dobiti zdruµzene podatke iz obje godine. Budući da su
se obitelji za istraµzivanje birale sluµcajno, vrlo je mala vjerojatnost da je ista
obitelj sudjelovala u istraµzivanju 2000. i 2005. godine. Stoga za razliµcite vre-
menske toµcke imamo razliµcite vremenski presjeµcne jedinice (obitelji). U tom
sluµcaju ne govorimo o uzduµznim (panel) podacima nego samo o zdruµzenim
(pooled) podacima.

8
Slika 1.4: Odnos BDP-a i potrošnje u tranzicijskim zemljama 2004. godine.

1.2.5 Procjena ekonometrijskog modela


Kada imamo podatke, moµzemo procijeniti parametre funkcije potrošnje 1.2
na temelju vrijednosti prikazanih u Tablici 1.1. Na Slici 1.5 prikazana je
hrvatska funkcija potrošnje za razdoblje od 1997. do 2005. godine.
Pravac koji prolazi kroz toµcke dijagrama disperzije nacrtali smo na naµcin
da minimiziramo sumu kvadrata odstupanja. O toj metodi bit će više rijeµci
u sljedećem poglavlju. Dobiveni koe…cijenti prikazanog pravca su:

yb = 21:42 + 0:47x: (1.3)

Kapica nad y oznaµcava da se radi o procijenjenoj vrijednosti (prika-


zanoj pravcem) stvarne zavisne varijable y (prikazana toµckama). Iz procije-
njene funkcije potrošnje prikazane u jednadµzbi 1.3 vidimo da je koe…cijent
nagiba 0.47, što znaµci da bi u promatranom razdoblju povećanje BDP-a u
Hrvatskoj za 1 kunu povećalo u prosjeku potrošnju stanovništva za 47 lipa.
Iz Slike 1.5 vidimo da smo provukli regresijski pravac kroz dijagram
disperzije. Kada se, me†utim, priµca o linearnoj regresiji, ne misli se na
linearnost u varijablama, već na linearnost u parametrima. Mogli smo
kroz toµcke dijagrama disperzije povući i neki drugi oblik funkcije, kao npr.

9
Tablica 1.3: Potrošnja i BDP u tranzicijskim zemljama u razdoblju od 1997.
do 2005. g. (u milijardama US dolara)

Godina
1997. 1998. 1999. 2000. 2001. 2002. 2003. 2004. 2005.
C 7.57 8.60 9.22 8.73 9.47 10.69 13.73 16.52 18.71
Bugarska
Y 10.38 12.74 12.93 12.62 13.63 15.55 19.97 24.22 26.72
C 12.83 13.01 11.72 13.22 11.94 13.60 17.18 20.25 21.95
Hrvatska
Y 20.10 21.64 19.91 18.42 19.86 23.03 29.62 35.29 38.49
C 30.72 32.58 31.84 29.77 32.08 38.56 47.23 54.82 61.50
Češka
Y 57.13 61.85 60.19 56.71 61.84 75.27 91.35 108.21 123.97
C 28.28 29.37 30.67 30.25 34.22 44.00 57.59 68.57 75.10
Mađarska
Y 45.72 47.05 48.04 47.96 53.32 66.71 84.42 102.16 110.37
C 2.71 2.59 2.56 2.67 2.41 2.92 3.53 4.18
Makedonija
Y 3.72 3.58 3.67 3.59 3.44 3.79 4.63 5.37
C 98.56 107.86 106.00 109.65 123.65 132.28 141.95 161.92 190.32
Poljska
Y 157.12 172.67 167.84 171.18 190.51 198.00 216.48 252.25 302.67
C 26.06 31.81 26.49 25.95 28.10 31.56 39.29 51.28 73.16
Rumunjska
Y 35.13 42.00 35.67 37.04 40.13 45.76 59.51 75.57 97.25
C 11.67 12.38 11.72 11.57 12.25 14.20 18.70 23.83 27.21
Slovačka
Y 21.56 22.43 20.60 20.45 21.11 24.52 32.98 42.01 47.43
C 11.45 12.12 12.50 11.08 11.20 12.38 15.66 17.87 18.87
Slovenija
Y 19.72 21.04 21.56 19.31 19.77 22.29 28.07 32.60 34.35
Izvor: International Financial Statistics (IFS), Međunarodni monetarni fond, veljača 2007. ¸

y = 0 + 1 x2 , ili ln y = 0 + 1 ln x, tj. nelinearan model u varijablama,


me†utim, i dalje govorimo o linearnoj regresiji jer su prikazani
p modeli li-
nearni u parametrima. Modeli tipa y = 0 + 21 x, y = 0 + 1 x; iako
su linearni u varijablama, nisu linearni u parametrima i stoga govorimo o
nelinearnim (u parametrima) regresijskim modelima.

1.2.6 Testiranje hipoteza


Kao što smo ranije rekli Keynes je oµcekivao da je graniµcna sklonost potrošnji
izme†u 0 i 1. U sluµcaju Hrvatske procijenili smo u jednadµzbi 1.3 da je
graniµcna sklonost potrošnji u Hrvatskoj u promatranom razdoblju bila 0.47.
Kako bismo zakljuµcili da je dobiveni rezultat za Hrvatsku u suglasju sa
Keynesijanskom ekonomskom teorijom, i da se ne radi o sluµcajnosti, moramo
dodatno testirati je li ova vrijednost statistiµcki znaµcajno razliµcita od 0 i
mogućnost da nije veća od 1.

1.2.7 Prognoziranje i predvi†anje


Na temelju jednadµzbe 1.3 moµzemo predvidjeti vrijednosti varijable y za zada-
ne vrijednosti varijable x. Npr. moµzemo predvidjeti kolika će biti potrošnja
stanovništva u Hrvatskoj ako BDP dosegne vrijednost od 250 milijardi kuna

10
140

130
Potrošnja u milijardama kuna

120

110

100

90

80

70
100 120 140 160 180 200 220 240

BDP u milijardama kuna

Slika 1.5: Hrvatska funkcija potrošnje za razdoblje od 1997. do 2005. godine

na sljedeći naµcin:

yb250 = 21:42 + 0:47(250) = 138:92:

Drugim rijeµcima, na temelju vrijednosti naših parametara prognoziramo


da će potrošnja stanovništva biti 138:92 milijarde kuna, kada će BDP u
Hrvatskoj iznositi 250 milijardi kuna.

1.3 Regresijska funkcija populacije i regresijska funk-


cija uzorka
Pretpostavimo da smo iz hipotetiµcke populacije studenata prikupili podat-
ke o njihovom mjeseµcnom dohotku i o njihovoj mjeseµcnoj potrošnji. Studente
smo podijelili na 10 dohodovnih razreda (od 100 kn do 1000 kn) i u Tablici
1.4 prikazali njihove mjeseµcne potrošnje. Stoga imamo 10 …ksnih vrijednos-
ti varijable x kojima odgovaraju razliµcite vrijednosti y. Drugim rijeµcima
imamo 10 dohodovnih podpopulacija.

Iz Tablice 1.4 jasno se vidi da se u svakoj dohodovnoj grupi studenti


razliµcito ponašaju (imamo one sklonije štednji i one manje sklone štednji);
tako npr. pojedini studenti koji imaju dohodak 300 kn troše više (250 kn

11
Tablica 1.4: Mjeseµcna potrošnja i dohodak studenata (u kunama)
Dohodak
100 200 300 400 500 600 700 800 900 1000
80 120 190 240 290 350 460 500 600 700
85 145 200 260 330 410 480 520 620 710
90 150 230 300 365 445 490 540 640 750
Potrošnja

95 160 240 310 370 460 500 550 660


100 165 250 330 375 480 510 590 680
180 270 360 390 495 520 620 700
200 410 530 650
430 540 670
560
Ukupno 450 1120 1380 1800 2960 2640 4590 4640 3900 2160
E (y | xi ) 90 160 230 300 370 440 510 580 650 720

i 270 kn) nego pojedini studenti koji imaju dohodak 400 kn (240 kn i 260
kn). Moµzemo, me†utim, primijetiti da unatoµc tim varijabilnostima postoji
odre†eno pravilo da u prosjeku studenti koji imaju veći dohodak više i troše.
To se jasno vidi iz aritmetiµckih sredina (ili prosjeka) svake podpopulacije
koje su prikazane u zadnjem retku Tablice 1.4 koje zovemo vrijednostima
uvjetnog oµcekivanja jer su uvjetovane zadanim vrijednostima varijable x.
Uvjetno oµcekivanje oznaµcavamo s E (yjxi ) te µcitamo oµcekivana vrijednost
y za zadanu vrijednost x. Tako npr. oµcekivana potrošnja studenata, koji
imaju dohodak od 200 kn, iznosi 160 kn, dok je kod studenata, koji imaju
800 kn, oµcekivana potrošnja 580 kn.
Uvjetno oµcekivanje razlikuje se od matematiµckog (neuvjetnog) oµceki-
vanja E (y) koji prikazuje prosjeµcnu potrošnju svih 64 studenata populacije,
neovisno o njihovom dohodovnom razredu. U našem bi sluµcaju matematiµcko
oµcekivanje bilo E (y) = 450+1120+ 64
+2160
= 400:625.
Na slici 1.6 prikazan je dijagram disperzije na temelju Tablice 1.4. Spa-
janjem svih uvjetnih oµcekivanja za sve …ksne vrijednosti dohotka dobili smo
regresijsku funkciju populacije (RFP)3 koja u našem sluµcaju poprima
oblik pravca. Sve toµcke kojima prolazi regresijski pravac populacije oznaµca-
va oµcekivanu potrošnju odre†enog dohodovnog razreda; tako npr. za razred
200 kn oµcekivana potrošnja je 160 kn, za razred 500 kn oµcekivana potrošnja
je 370 kn, itd. Općenito moµzemo reći da regresijska funkcija populacije pred-
stavlja sve toµcke uvjetnih oµcekivanja zavisne varijable y za …ksne vrijednosti
nezavisne varijable x.
Na temelju tako de…nirane regresijske funkcije populacije moµzemo odre-
diti pojedinaµcnu potrošnju svakog studenta kao odstupanje od uvjetnog oµce-
3
Na slici je oznaµcena sa E (yjxi ).

12
y
800
E (y | xi )

700

600

510
500
Potrošnja

400
370

300

200
160

100

0 x
0 100 200 300 400 500 600 700 800 900 1000 1100
Dohodak

Slika 1.6: Regresijska funkcija populacije izvedena iz Tablice 1.4

kivanja dohodovnog razreda kojemu pripada

"i = yi E (yjxi ) :

Stvarna potrošnja bit će

yi = E (yjxi ) + "i : (1.4)


Znaµci, potrošnja i tog studenta sastoji se od dva dijela: jedan je de-
terministiµcki ili sustavni dio E (yjxi ) kojeg moµzemo predvidjeti na temelju
dohodovnog razreda kojemu student pripada te od "i što predstavlja slu-
µcajno odstupanje ili nesustavni dio. Sluµcajno se odstupanje pojavljuje zbog
utjecaja ostalih varijabli na potrošnju studenata a koje nisu ukljuµcene u mo-
del, kao npr. spol, stanuje li student s roditeljima ili je podstanar, društvo
u kojemu se kreće, navike, itd4 . Ako pretpostavimo da imamo linearnost
E (yjxi ) u varijabli xi kao na slici 1.6 tada se jednadµzba 1.4 pretvara u

yi = 0 + 1 xi + "i : (1.5)

Naµzalost, u praksi nemamo na raspolaganju cjelokupnu populaciju već


samo uzorak iz te populacije. Stoga je problem, s kojim smo suoµceni, da na
4
Glavni razlozi pojavljivanja sluµcajne greške "i objašnjeni su u naslovu Speci…kacija
ekonometrijskog modela na stranici 4.

13
temelju poznavanja samo vrijednosti uzorka, izvuµcenog iz neke populacije,
moramo procijeniti nama nepoznatu funkciju populacije prikazanu jednadµz-
bom 1.5. Pretpostavimo da smo iz populacije prikazane u Tablici 1.4 izvukli
jedan sluµcajan uzorak (Uzorak 1) potrošnje studenata za svaku dohodovnu
grupu, prikazan u Tablici 1.5

Tablica 1.5: Sluµcajni uzorci iz Tablice populacije

Dohodak Potrošnja: uzorak 1 Potrošnja: uzorak 2


100 80 95
200 145 200
300 270 240
400 310 330
500 375 390
600 480 460
700 530 500
800 520 550
900 700 640
1000 750 700

Moµzemo primijetiti da za svaku dohodovnu grupu (…ksna vrijednost x)


imamo samo jednu vrijednost potrošnje (y), za razliku od populacije kada
smo za svaku vrijednost x imali više vrijednosti y. Vrijednosti iz Tablice
1.5 (Potrošnja: uzorak 1) prikazali smo na Slici 1.7 i provukli kroz toµcke
regresijsku funkciju uzorka (RFU1 ) koja u našem sluµcaju poprima izgled
pravca kojeg ćemo oznaµciti

y^i = b0 + b1 xi + ei (1.6)

gdje je:
y^i = procjenitelj E (yjxi )
b0 = procjenitelj 0
b1 = procjenitelj 1
ei = sluµcajno odstupanje uzorka koje interpretiramo kao procjenitelj "i :
Cilj regresijske funkcije uzorka y^i = b0 +b1 xi +ei je procijeniti nepoznatu
regresijsku funkciju populacije yi = 0 + 1 xi + "i .
Iz naše populacije, prikazane u Tablici 1.4, moµzemo izvući i drugi uzorak
(Uzorak 2 koji je prikazan u Tablici 1.5). Na slici 1.7 vidimo da, iako izvuµce-
ni iz iste populacije, regresijske funkcije uzoraka (RFU1 i RFU2 ) me†usobno
se razlikuju zbog ‡uktuacije populacije oko regresijske funkcije populacije.
Jedino u specijalnom sluµcaju, kada bi se sve toµcke populacije prikazane na
slici 1.6 nalazile na regresijskom pravcu populacije, tada bi regresijski pravci
uzoraka prikazani na slici 1.7 bili potpuno jednaki. Što je veća disperzija
toµcaka oko regresijske funkcije populacije, to je vjerojatnost da su regre-
sijske funkcije uzoraka me†usobno razliµcitije. Postavlja se, dakle, pitanje

14
RFU1
800
RFU2
700

600

500
Potrošnja

400

300

200

100

0
0 100 200 300 400 500 600 700 800 900 1000 1100

Dohodak

Slika 1.7: Regresijske funkcije uzoraka temeljene na populaciji iz Tablice 1.4

jesu li i pod kojim uvjetima regresijske funkcije uzoraka dobri procjenitelji


regresijske funkcije populacije?
Odgovor glasi da će regresijska funkcija uzorka biti dobar procjenitelj
"nevidljive" regresijske funkcije populacije ako vrijede sljedeće pretpos-
tavke o RFP, koje zovemo i pretpostavkama klasiµcnog linearnog re-
gresijskog modela:

1. Linearnost u parametrima: već smo rekli da kada govorimo o linearnim


modelima govorimo o linearnosti u parametrima. Neki modeli mogu
izgledati nelinearno u parametrima kao na primjer Cobb-Douglasova
funkcija proizvodnje5
y = 0 K 1 L 2 e" (1.7)
koju, me†utim, moµzemo jednostavno linearizirati ako je logaritmiramo

ln y = + 1 ln K + 2 ln L +" (1.8)

gdje je a = ln 0 : Vidimo da je jednadµzba 1.8 nelinearna u varijablama


(zbog logaritama), ali linearna u parametrima. U tom sluµcaju govori-
mo da je model prikazan jednadµzbom 1.7 suštinsko linearan model,
5
Napomena: e u jednadµzbi (1.7) odnosi se na bazu prirodnog logaritma a ne na sluµcajno
odstupanje uzorka.

15
jer ga moµzemo odre†enim transformacijama pretvoriti u model line-
aran u parametrima. S druge strane, da je Cobb-Douglasova funkcija
bila de…nirana kao
y = 0 K 1 L 2 + "; (1.9)
ne bi je bilo moguće nikakvom transformacijom linearizirati. U tom
sluµcaju govorimo da je model suštinsko nelinearan model i da ne
zadovoljava pretpostavku o linearnosti u parametrima.
2. Nestohastiµcnost varijable x: vrijednosti varijable x …ksirane su u po-
novljenom uzorkovanju, kao na primjeru u Tablici 1.4 kada imamo
razliµcite vrijednosti potrošnje (y) za …ksne (iste) vrijednosti dohotka
(x).
3. Sredina sluµcajne greške "i je jednaka nuli ili simboliµcki E ("i jxi ) = 0.
Budući da regresijska funkcija populacije predstavlja uvjetno matema-
tiµcko oµcekivanje E (yjxi ), tj. sredinu (prosjek) y za zadani xi , to znaµci
da je zbroj pozitivnih i negativnih odstupanja "i za svaki zadani xi
jednak nuli.

Primjer 1.1 Zbrajanjem odstupanja od uvjetnog matematiµcko oµceki-


vanja za dohodovnu grupu 100 kn u Tablici 1.4 dobijemo (80 90) +
(85 90) + + (100 90) = 10 + ( 5) + + 10 = 0. Isto vrijedi
i za sve ostale dohodovne grupe.

4. Homoskedastiµcnost: jednaka varijanca za sva opaµzanja ili simboliµcki


V ar ("i jxi ) = E ["i E ("i jxi )]2 = 2
:
Razumno bi bilo oµcekivati, u našem hipotetiµckom primjeru, osim da
studenti s većim dohotkom troše apsolutno više u odnosu na studente
s manjim dohotkom, da varijanca odstupanja (rasipanje oko RFP, va-
rijabilnost potrošnje unutar dohodovne grupe) bude veća za studente s
višim dohocima u odnosu na one koji imaju manji dohodak i stoga ma-
nji "manevarski" prostor za potrošnju. Ako varijanca sluµcajne greške
nije ista za sva opaµzanja, već ovisi o nekoj od nezavisnih varijabli (u
našem sluµcaju raste s rastom dohotka) govorimo o heteroskedastiµcnos-
ti, koju simboliµcki oznaµcavamo s Var("i jxi ) = 2i , gdje nam subskript
i govori da varijanca sluµcajnog odstupanja "i nije konstantna.
5. Odsutnost autokorelacije sluµcajnih odstupanja: za dvije …ksne vrijed-
nosti xi i xj za (i 6= j), kovarijanca (korelacija) izme†u dva sluµcajna
odstupanja "i i "j za bilo koji (i 6= j) je nula, ili simboliµcki
Cov ("i ; "j jxi ; xj ) = E f["i E ("i )] jxi g f["j E ("j )] jxj g = 0:
To znaµci da je odstupanje " sluµcajno, tj. da nema sustavni obrazac
(kao npr. isti predznak s prethodnim opaµzanjem).

16
6. Odsutnost multikolinearnosti : izme†u nezavisnih varijabli (kada ih
imamo više) ne smije postojati savršena linearna veza. Ako postoji
znaµcajna veza izme†u nezavisnih varijabli, vrlo je teško izolirati utje-
caj pojedinih varijabli na zavisnu varijablu y.

7. Kovarijanca izme†u "i i xi je nula, ili simboliµcki

Cov ("i ; xi ) = E ["i E ("i )] [xi E (xi )] = 0:

Kada smo de…nirali RFP u jednadµzbi 1.5 pretpostavili smo da x i "


imaju zasebne utjecaje na y (deterministiµcki i nesustavni dio). Me†u-
tim, kada bi oni bili me†usobno korelirani, takvi se zasebni utjecaji x
i " na y ne bi mogli pravilno identi…cirati.

8. Broj opaµzanja mora biti ve´ci od broja parametara koji se procjenjuju:


na temelju jednog opaµzanja (jedna toµcka u dvodimenzionalnom pros-
toru) ne moµzemo procijeniti pravac na tom prostoru; potrebne su nam
minimalno dvije toµcke da odredimo parametre pravca 0 i 1 , drugim
rijeµcima potrebna su nam barem dva opaµzanja.

9. Varijabilnost vrijednosti x : vrijednosti varijable x ne smiju biti sve


iste. Bolje je ako varijabla x ima veće ‡uktuacije jer se u tom sluµcaju
varijablom x mogu bolje objasniti ‡uktuacije zavisne varijable y.

10. Pravilno speci…ciran regresijski model : kada govorimo o pravilno speci-


…ciranom modelu, govorimo o pravilno speci…ciranoj funkcionalnoj
formi, pravilno speci…ciranim nezavisnim varijablama i pravilno
speci…ciranim pretpostavkama o vjerojatnosti y, x, i ".

17
Poglavlje 2

Parametri modela dobiveni


metodom najmanjih
kvadrata

U prethodnom poglavlju objasnili smo da ako vrijede pretpostavke o RFP-u


mogu se donositi zakljuµcci o regresijskoj funkciji populacije (RFP)

yi = 0 + 1 xi + "i

na temelju regresijske funkcije uzorka (RFU)

y^i = b0 + b1 xi + ei :

Postavlja se, me†utim, pitanje kako procijeniti parametre b0 i b1 regresijske


funkcije uzorka.

2.1 Procjena parametara

Tablica 2.1: Mjeseµcna potrošnja i dohodak studenata (u kunama)


Student Potrošnja Dohodak
Marko 100 150
Ivan 250 300
Mira 300 500
Maja 210 400
Ana 160 200

Pretpostavimo da smo izabrali jedan reprezentativni uzorak studenata


koji su nam dali podatke o njihovim mjeseµcnim potrošnjama i dohocima.
Prikupljeni podaci prikazani su u Tablici 2.1. Ako vrijednosti iz Tablice

18
350

300

250

200
Potrošnja

150

100

50

0
0 100 200 300 400 500 600

Dohodak

Slika 2.1: Dijagram disperzije mjeseµcnog dohotka i potrošnje studenata (u


kunama)

2.1 prikaµzemo dijagramom disperzije, u kojemu svakom opaµzanju odgovara


jedna toµcka u dvodimenzionalnom prostoru dobijemo Sliku 2.1.
Iz prikazanih toµcaka vidimo da kada se vrijednost dohotka studenata
povećava, povećava se i njihova potrošnja . Me†utim na temelju prikaza-
nih toµcaka ne moµzemo toµcno kvanti…cirati npr.: koliko će studenti povećati
potrošnju, ako im se dohodak poveća za 100 kn, kolika je vjerojatnost po-
trošnje studenta koji ima 450 kn dohotka, kolika je autonomna (koja ne
ovisi o dohotku) potrošnja studenata, itd. Odgovore na ova pitanja moguće
je dobiti ako kroz toµcke dijagrama disperzije provuµcemo odre†enu matema-
tiµcku funkciju. Na temelju pozicioniranja toµcaka na dijagramu disperzije
prikazanom na Slici 2.1 moµzemo pretpostaviti da je prikladni funkcionalni
oblik regresijske funkcije pravac kojim bismo mogli objasniti vezu izme†u
dohotka i potrošnje studenata. Problem koji se sada nameće je kako odrediti
parametre pravca koji će ga de…nirati. Razumno bi bilo da pravacP odredimo
tako da minimiziramo zbroj svih odstupanja (greške), tj. min ei :
Iz Slike 2.2 vidimo da pravac P1 prolazi bliµze toµckama dijagrama dis-
perzije od pravca P2. S druge strane ako zbrojimo
P odstupanja za P1 (-
35+0+60+(-30)+10) vidimo da je rezultat ei = 5, dok
P ako zbrojimo
odstupanja za P2 (-180+(-120)+60+50+190) rezultat je ei = 0. Drugim
rijeµcima po kriteriju minimizacije odstupanja bolji je pravac P2 u odnosu

19
350

P1
∑e i =5
300
+10 ∑e 2
i = 5825

250
+60 -30
+190
200 -120
-180 +50
Potrošnja

150
-35
P2 ∑e i =0
100
∑ ei2 = 89000
50

0
0 100 200 300 400 500 600

Dohodak

Slika 2.2: Kriterij minimalnih kvadrata odstupanja

na pravac, koji "na oko" izgleda bolji, P1. Zašto? Vrijednosti odstupanja ei
poprimaju pozitivne i negativne vrijednosti tako da se u njihovom zbraja-
nju me†usobno poništavaju. Tako u sluµcaju pravca P2, u kojemu su velika
odstupanja, imamo u zbroju veće (potpuno) poništavanje vrijednosti odstu-
panja u odnosu na pravac P1, koji ima vidno manja odstupanja, ali koja se u
zbroju ne poništavaju u cijelosti. Poništavanje vrijednosti u zbroju moµzemo
izbjeći tako
P da2 kvadriramo vrijednosti ei : Iz Slike 2.2 vidimo da je za pravac
P1 zbroj ei = ( 35)2 + 02 + + 102 = 5825 znatno manji u odnosu
P 2
na pravac P2 gdje je ei = (( 180)2 + ( 120)2 + + 1902 ) = 89000.
Ako nam kriterijP za vuµcenja pravca kroz toµcke dijagrama disperzije posta-
ne minimizacija e2i ; tada vidimo da pravac, koji "na oko" izgleda bolji,
bolji je i na temelju našeg postavljenog kriterija minimizacije kvadrata
odstupanja koji sprjeµcava poništavanje pozitivnih i negativnih vrijednosti
odstupanja. Metodu, koja se temelji na kriteriju minimizacije kvadrata od-
stupanja, zovemo Obiµcnom metodom najmanjih kvadrata (eng. OLS
- Ordinary Least Square).
Kvadriranjem odstupanja, osim što pretvaramo odstupanja u pozitivne
vrijednosti, dajemo veću teµzinu većim (udaljenijim od regresijskog prav-
ca) odstupanjima u odnosu na manja, budući da su vrijednosti kvadrirane.
Problem se u tom sluµcaju moµze pojaviti u prisutnosti izuzetno udaljenih

20
odstupanja (eng. outliers), µcija prisutnost moµze bitno promijeniti izgled
regresijskog pravca, budući da je metoda najmanjih kvadrata izuzetno osjet-
ljiva na takve udaljene toµcke. Uobiµcajeno je rješenje tog problema da se
opaµzanja vezana za udaljene toµcke jednostavno izbace iz analize. Pri tome
se me†utim mora pristupiti vrlo paµzljivo jer ponekad te udaljene toµcke u
sebi mogu sadrµzavati bitne informacije o vezi izme†u analiziranih varijabli.
Na temelju kriterija minimizacije kvadrata odstupanja iz Slike 2.2 vidi-
mo da je pravac P1 bolji od pravca P2. Ali nitko nam ne jamµci da je pravac
P1 najbolji izme†u svih mogućih pravaca koje moµzemo potegnuti kroz di-
jagram disperzije po kriteriju minimizacije kvadrata odstupanja. Moramo
li na temelju reµcenoga potegnuti kroz toµcke dijagrama disperzije veliki broj
pravaca i na temelju njihovog zbroja kvadrata odstupanja
P 2 odluµciti koji je od
njih najbolji, ili drugim rijeµcima koji ima minimalni ei ? Takav bi pristup
bio sigurno vremenski jako rastrošan i na kraju ne bismo imali konaµcan od-
govor, tj. ne bismo imali nikakvu sigurnost da je naš pravac, najbolji me†u
onima koje smo testirali, i najbolji me†u onima koje nismo testirali. Ovaj
problem riješio je njemaµcki matematiµcar Carl Friedrich Gauss na sljedeći
naµcin. Za model s jednom nezavisnom varijablom
yi = b0 + b1 xi + ei (2.1)
P
moramo izabrati parametre b0 i b1 tako da minimiziraju e2i : Da bismo
P 2
dobili parametri s tim svojstvima moramo parcijalno derivirati izraz ei
po b0 i b1 i izjednaµciti prve derivacije s nulom kako bismo dobili ekstreme
funkcija (minimum).
Kriterij najmanjih kvadrata moµzemo de…nirati kao
n
X n
X
Min e2i = Min (yi b0 b1 xi )2 (2.2)
i=1 i=1

gdje yi oznaµcava stvarnu vrijednost y za i-to opaµzanje, a n oznaµcava broj


opaµzanja.
Parcijalnim deriviranjem izraza 2.2 po parametrima b0 i b1 i izjednaµca-
vanjem prve derivacije s nulom dobivamo jednadµzbe
@ P P
(yi b0 b1 xi )2 = 2 (yi b0 b1 xi ) = 0 (2.3)
@b0
@ P P
(yi b0 b1 xi )2 = 2 xi (yi b0 b1 xi ) = 0: (2.4)
@b1

Simultanim rješavanjem jednadµzbi 2.3 i 2.4 po parametrima b0 i b1 (cje-


loviti izvod prikazan je u Dodatku A.1) dobijemo vrijednosti parametara
koje imaju svojstvo minimizacije sume kvadrata odstupanja prikazanih u
jednadµzbi 2.2 koje glase
P P
(xi x) (yi y) x
~i y~i
b1 = P 2 = P 2 (2.5)
(xi x) x
~i

21
b0 = y b1 x (2.6)
gdje y i x prikazuju sredine uzoraka, a x
~ i y~ oznaµcavaju varijable x i y u
njihovoj devijacijskoj formi 1

x
~i = xi x y~ = yi y:

Korištenjem Gaussovih jednadµzbi 2.5 i 2.6 moµzemo dobiti parametre


(procjenitelje) modela na temelju obiµcne metode najmanjih kvadrata u slu-
µcaju jedne nezavisne varijable.
Ako imamo više nezavisnih varijabli procjenitelje, temeljene na Ga-
ussovoj metodi najmanjih kvadrata (OLS), moµzemo jednostavno dobiti ko-
rištenjem matriµcne algebre.
Model sa (k 1) brojem nezavisnih varijabli

yi = b0 + b1 x1i + b2 x2i + + b(k 1) x(k 1)i + ei (2.7)

moµzemo prikazati u matriµcnoj formi

y = Xb + e (2.8)

u kojoj
2 3 2 3 2 3 2 3
y1 1 x11 x(k 1)1 b0 e1
6 y2 7 6 1 x12 x(k 7 6 b1 7 6 e2 7
6 7 6 1)2 7 6 7 6 7
y =6 . 7 X =6 .. .. .. .. 7 b =6 .. 7 e =6 .. 7
4 .. 5 4 . . . . 5 4 . 5 4 . 5
yn 1 x1n x(k 1)n bk 1 en

gdje

y = n 1 vektor stupac s opaµzanjima zavisne varijable


X = n k matrica s opaµzanjima nezavisnih varijabli
b = k 1 vektor stupac nepoznatih parametara
e = n 1 vektor stupac odstupanja.

Svaki element matrice X ima dva subskripta; prvi se odnosi na varijablu


(stupac), dok se drugi odnosi na opaµzanje (redak). Tako npr. element x24
oznaµcava µcetvrto opaµzanje varijable x2 . Interesantno je primijetiti da je prvi
redak u matrici X ispunjen jedinicama. Ovaj redak odraµzava konstantni
µclan koji se veµze za parametar b0 .
Našje cilj, kao i u sluµcaju sa samo jednom nezavisnom varijablom, mini-
mizirati sumu kvadrata odstupanja koju u matriµcnoj algebri moµzemo pisati
P
n
min e2i = min(e0 e): (2.9)
i=1
1
Neka svojstva devijacijskih formi prikazana su u Dodatku A.1

22
Iz jednadµzbe 2.8 imamo

e=y Xb; (2.10)

što sumu kvadrata odstupanja pretvara u

e0 e = (y Xb)0 (y Xb)
0 0 0
= yy bXy y0 Xb + b0 X0 Xb
= y0 y 2b0 X0 y + b0 X0 Xb: (2.11)

Zadnji je korak moguć jer su b0 X0 y i y0 Xb me†usobno jednaki skalari.


Minimizirati sumu kvadrata odstupanja po parametrima modela moµzemo
ako deriviramo e0 e po parametrima i izjednaµcimo prvu derivaciju s nulom
@
y0 y 2b0 X0 y + b0 X0 Xb = 2X0 y+2X0 Xb = 0; (2.12)
@b
iz µcega slijedi da
1
b = X0 X X0 y: (2.13)
Za dobivanje jednadµzbe 2.13 nismo koristili nikakve pretpostavke o na-
µcinu na koji se podaci generiraju. Jedino što pretpostavljamo je da postoji
inverzna matrica (X0 X) 1 , tj. da matrica X0 X nije singularna matrica,
što podrazumijeva da niti jedan redak (stupac) te matrice ne smije bi-
ti egzaktna linearna kombinacija ostalih redaka, što znaµci da nema
multikolinearnosti (linearne veze izme†u nezavisnih varijabli).

Tablica 2.2: Izraµcun vrijednosti procjenitelja (parametara) na temelju obiµcne


metode najmanjih kvadrata odstupanja
yi xi ~y ~
xi ~
xi ~
yi ~
xi2 yˆi ei e i2
Student i

Marko 100 150 -104 -160 16640 25600 126.34 -26.34 693.87
Ivan 250 300 46 -10 -460 100 199.15 50.85 2586.09
Mira 300 500 96 190 18240 36100 296.22 3.78 14.29
Maja 210 400 6 90 540 8100 247.68 -37.68 1420.00
Ana 160 200 -44 -110 4840 12100 150.61 9.39 88.18
∑ 1020 1550 0 0 39800 82000 1020 0 4802.44
Sredina 204 310 204 960.49

Primjer 2.1 Iz jednadµzbi za parametre 2.5 i 2.6 i Tablice 2.2 moµzemo iz-
raµcunati: P
x
~i y~i 39800
b1 = P 2 = = 0:48537 (2.14)
x
~i 82000
b0 = y b1 x = 204 0:48537 310 = 53: 535: (2.15)

23
Isti smo rezultat mogli dobiti i korištenjem matriµcne forme iz jednadµzbe
2.13 koja vrijedi za broj k nezavisnih varijabli pa stoga vrijedi i za sluµcaj
samo jedne nezavisne varijable, kao u našem primjeru:
1
b = X0 X X0 y

gdje su 2 3 2 3
1 150 100
6 1 300 7 6 250 7
6 7 6 7
X=6
6 1 500 7; y = 6
7 6 300 7
7
4 1 400 5 4 210 5
1 200 160
Ako izraµcunamo2 da 2 3
1 150
6 1 300 7
1 1 1 1 1 6 7 5 1550
0
XX= 6 1 500 7=
150 300 500 400 200 6 7 1550 562 500
4 1 400 5
1 200
i da 2 3
100
6 250 7
1 1 1 1 1 6 7 1020
X0 y = 6 300 7 = ;
150 300 500 400 200 6 7 356 000
4 210 5
160
u konaµcnici imamo
1
0 1 0 5 1550 1020 53: 535
b= XX Xy= = :
1550 562 500 356 000 0:485 37
(2.16)

Vidljivo je da smo u 2.16 dobili identiµcni rezultat kao i u jednadµzbama


2.14 i 2.15, tj. da je b0 = 53:535, a b1 = 0:48537. Drugim rijeµcima naš
regresijski pravac uzorka (zaokruµzen na dvije decimale) dobiven metodom
najmanjih kvadrata je
y^i = 53:54 + 0:49xi : (2.17)
P 2
Iz Tablice 2.2 vidimo da je ei = 4802:44 ovog pravca manja nego za
pravce iz Slike 2.2. Ne samo to, već znamo da ne postoji pravac, me†u
testiranima i ne testiranima do sada, koji bi imao manju sumu kvadrata
odstupanja. Regresijski pravac iz 2.17 moµzemo gra…µcki prikazati kao na Slici
2.3. Vidimo da za prvo opaµzanje (Marko iz Tablice 2.2) imamo dohodak od
150; stvarnu potrošnju y1 = 100 i Markovu procijenjenu potrošnju našim
regresijskim pravcem od y^1 = 126:34. Stoga odstupanje regresijskog pravca
2
Manipuliranje matricama olakšavaju matriµcno orijentirani raµcunalni paketi kao što su
Matlab ili Scilab

24
od stvarne vrijednosti (greška) u Markovom sluµcaju je (y1 y^1 ) = e1 =
26:34. Ostale stvarne i procijenjene vrijednosti nisu prikazane na Slici 2.3
nego ih moµzemo naći u Tablici 2.2.

Potrošnja yˆi = 53 .54 + 0.49 xi

yˆp = 274 .04

y = 204

yˆ1 = 126 .34


e1 = −26 .34
y1 = 100

53.54

0 x1 = 150 x = 310 x p = 450 Dohodak

Slika 2.3: Regresijski pravac uzorka

Na temelju ovog dobivenog pravca moµzemo odgovoriti na pitanja na koje


nismo mogli odgovoriti na temelju samo dijagrama disperzije kao što su:

Koliko će studenti povećati potrošnju ako im se dohodak poveća za


100 kn? Prva derivacija potrošnje po dohotku dobivenog pravca je
d^
y
dx = 0:49, što znaµci da je graniµcna sklonost potrošnji reprezentativnog
studenta 0:49, što nam govori da će od dodatne dobivene kune potrošiti
49 lipa, ili ako dobije dodatnih 100 kuna, 49 kuna će potrošiti, a 51
kunu uštedjeti. Gra…µcki 0:49 predstavlja koe…cijent smjera (nagib)
regresijskog pravca na Slici 2.3.

Kolika je vjerojatnost potrošnje studenta koji ima 450 kn dohotka? Iz


našeg pravca imamo

y^450 = 53:54 + 0:49(450) = 274: 04;

iz µcega moµzemo prognozirati da student koji ima 450 kn dohotka trebao


bi trošiti 274:04 kn, kao što se jasno vidi iz regresijskog pravca na Slici
2.3.

25
Kolika je autonomna (koja ne ovisi o dohotku) potrošnja studenata?
Potrošnja, koja ne ovisi o dohotku, u našem primjeru je 53:54 kn. To
je i minimalna potrošnja našeg reprezentativnog studenta kada nema
dohotka (x = 0; radi se o minimumu jer za dohodak vrijedi uvjet o ne-
negativnosti). Gra…µcki, kao što je prikazana na Slici 2.3, ta vrijednost
oznaµcava odsjeµcak na ordinati regresijskog pravca.

2.2 Svojstva regresijskog pravca


Regresijski pravac dobiven metodom najmanjih kvadrata ima sljedeća svoj-
stva:

1. Regresijski pravac prolazi kroz sredinu uzoraka (x i y) kao što


se jasno vidi na Slici 2.3. Ovo svojstvo proizlazi iz jednadµzbe 2.6 za
izraµcunavanje parametra b0 . Naime, ako je

b0 = y b1 x (2.18)

tada vrijedi da je
y = b0 + b 1 x (2.19)
što nam govori da kada x poprima vrijednost svoje sredine x procije-
njena vrijednost y^ je y: Drugim rijeµcima regresijski pravac prolazi kroz
toµcku (x; y).

Primjer 2.2 Lako moµzemo provjeriti da za x = 310

y^310 = 53:54 + 0:49(310) = 204 (2.20)

y^ poprima vrijednost3 svoje sredine y = 204, kao što se vidi iz Tablice


2.2.

2. Sredina stvarnog y jednaka je sredini procijenjenog y^. Svojstvo


y = y^ proizlazi iz4

y^i = b0 + b1 xi
= (y b1 x) + b1 xi
= y + b1 (xi x) : (2.21)

Zbrajanjem lijeve i desne strane jednadµzbe 2.21 dobijemo


P P
y^i = ny + b1 (xi x) : (2.22)
3
Mala se greška pojavljuje u ovome izraµcunu uslijed zaokruµzivanja na dvije decimale.
4
Napomena: ovo svojstvo vrijedi samo ako regresija ima konstantni µclan b0 , jer bez
konstantnog µclana, kao što se jasno vidi iz izvoda, ne moµze se izvesti jednadµzba 2.21.

26
Iz
P Svojstva B.4 operatora zbrajanja (vidi Dodatak B.1) znamo da
(xi x) = 0; što 2.22 pretvara u
P
y^i = ny: (2.23)
Ako lijevu i desnu stranu jednadµzbe 2.23 podijelimo s n; dobijemo
P
y^i ny
=
n n
y^ = y: (2.24)

Primjer 2.3 Iz Tablice 2.2 vidimo da je sredina stvarnog y = 204


jednaka sredini procijenjenog y^ = 204.
P
3. Suma odstupanja je nula5 ( ei = 0), što se jasno vidi iz Tablice
2.2. Ovo svojstvo proizlazi iz uvjeta minimizacije kvadrata odstupanja
po b0 prikazanog u jednadµzbi 2.3
@ P P P
(yi b0 b1 xi )2 = 2 (yi b0 b1 xi ) = 2 ei = 0
@b0
P (2.25)
što povlaµci ei = 0: Iz toga proizlazi da je i sredina odstupanja
P
ei
e= = 0: (2.26)
n
4. Odstupanja ei i procijenjeni y^i me†usobno su neovisni. Kova-
rijancu izme†u ei i y^i moµzemo izraziti
1 Pn
Cov (^
y i ; ei ) = y^i y^ (ei e) (2.27)
n i=1
Iz Svojstva 3. regresijskog pravca znamo da je e = 0; stoga da
bi
P izraz 2.27 bio nula (neovisnost izme†u ovih dviju varijabli) tada
y^i y^ ei mora biti jednak nuli, ili ako pišemo u devijacijskoj for-
Pe
mi y^i ei = 0: Regresijski pravac za dvije varijable u devijacijskoj
formi moµzemo pisati bez konstantnog µclana
e
y^i = b1 x
~i : (2.28)
Varijable u devijacijskoj formi imaju sredinu nula, stoga regresijski
pravac prolazi kroz ishodište (vidi Svojstvo 1. regresijskog pravca),
iz µcega proizlazi da je odsjeµcak na ordinati tog pravca jednak nuli, ili
drugim rijeµcima b0 = 0: Na temelju jednadµzbe 2.28 moµzemo pisati
Pe P
y^i ei = b1 x ~i ei
P
= b1 x ~i (~y b1 x
~i )
P 2P 2
= b1 x ~i y~ b1 x ~i : (2.29)
5
Napomena: ovo svojstvo ne vrijedi kada nemamo konstantnog µclana b0 u regresiji.

27
Na temelju jednadµzbe 2.5 moµzemo pisati
P P 2
x~i y~ = b1 x~i (2.30)
što 2.29 pretvara u
Pe P 2 P
y^i ei = b21 x
~i b21 ~2i
x
= 0: (2.31)
Na ovaj smo naµcin dokazali da ne postoji linearna veza izme†u odstu-
panja i procijenjene zavisne varijable.
P U našem primjeru iz Tablice 2.2
lako se moµze provjeriti da vrijedi y^i y^ ei = 0.
P
5. Odstupanja ei i xi me†usobno su neovisni, drugim rijeµcima xi ei =
0. Ovaj zakljuµcak proizlazi iz uvjeta minimizacije kvadrata odstupanja
po b1 prikazanog u jednadµzbi 2.4
@ P P P
(yi b0 b1 xi )2 = 2 xi (yi b0 b1 xi ) = 2 xi ei = 0
@b1
P (2.32)
što povlaµci xi ei = 0. Ovo svojstvo regresijskog pravca, tako†er se
moµze lako provjeriti na primjeru iz Tablice 2.2.

2.3 Svojstva procjenitelja


Ako vrijede pretpostavke o regresijskoj funkciji populacije koje smo
naveli na stranici 15 tada procjenitelji dobiveni metodom najmanjih kva-
drata imaju odre†ena poµzeljna svojstva navedena u Gauss-Markovljevom
teoremu:
Gauss-Markovljev teorem: Ako vrijede pretpostavke kla-
siµcnog linearnog regresijskog modela, procjenitelji dobiveni me-
todom najmanjih kvadrata najbolji (naje…kasniji) su linearni ne-
pristrani procjenitelji, tj. imaju minimalnu varijancu u klasi li-
nearnih nepristranih procjenitelja.
1. Linearnost: znaµci da je procjenitelj linearna funkcija sluµcajne varija-
ble jer se moµze napisati kao linearna kombinacija pojedinih opaµzanja
y.

Primjer 2.4 Iz Tablice 2.2 moµzemo dobiti vektor b iz


1
b = X0 X X0 y
2 3
100
6 250 7
33 39 85 23 101 6 7
= 41 164 164 164 164 6 300 7
2 1 19 9 11 6 7
1025 8200 8200 8200 8200 4 210 5
160

28
ili b0 moµzemo dobiti iz linearne kombinacije 33 39
41 100 + 164 250
85
164 300
23 101
164 210 + 164 160 = 53: 537. Na sliµcan naµcin moµzemo dobiti vrijednost
b1 iz linearne kombinacije elemenata vektora y s drugim redom matrice
(X0 X) 1 X0 .

Stoga su procjenitelji dobiveni na taj naµcin, linearna kombinacija vri-


jednosti zavisne varijable y pa ih zovemo linearnim procjeniteljima.

2. Nepristranost: znaµci da u ponovljenom uzorkovanju moµzemo oµce-


kivati da je procjenitelj u prosjeku jednak stvarnom populacijskom
procjenitelju , što moµzemo pisati

E(b) = : (2.33)

Na slici 2.4 moµzemo vidjeti dvije distribucije dobivene ponovljenim

Nepristrana Pristrana
Distribucija frekvencija

E(b)=β E(b)≠β

Slika 2.4: Nepristranost i pristranost


E(b)= β
procjenitelja

uzorkovanjem iz iste populacije.

Propozicija 2.1 Procjenitelj dobiven pomo´cu metode najmanjih kva-


drata je nepristran, ili sredina distribucije bit ´ce E(b) = .

29
Dokaz.
h i h i
1 1
E (b) = E X0 X X0 y = E X0 X X0 (X + ")
h i h i
1 1 0 1
= E X0 X X0 X + X0 X X " = E I + X0 X X0 "
h i
1 0
= + E X0 X X" = : (2.34)

Zadnji korak slijedi iz


h i h i
1 0 1
E X0 X X " = E X0 X X0 E ["] = 0 (2.35)

zato jer su X i " nezavisni i E ["] = 0.


Interesantno je primijetiti da u tom dokazu nismo koristili pretpostav-
ke da nema autokorelacije i heteroskedastiµcnosti. To ukazuje da pro-
cjenitelji dobiveni metodom najmanjih kvadrata i u sluµcaju postojanja
heteroskedastiµcnosti i autokorelacije reziduala su nepristrani
sve dok sluµcajna greška ima sredinu nula i dok je neovisna od egzo-
genih varijabli. Izraz (X0 X) 1 X0 " iz jednadµzbe 2.34 moµzemo gledati
kao regresija " na X. To ukazuje da će procjenitelji biti nepristra-
ni, i u sluµcaju da smo zanemarili unijeti u model neku nedostajuću
varijablu, sve dok je ta varijabla neovisna o ostalim X i ima sredinu
0. Znaµci, pristranost procjenitelja, uslijed nedostajuće objasnidbene
varijable, imat ćemo samo u sluµcaju ako je ona zavisna o drugim ne-
zavisnim varijablama i ako ima sredinu razliµcitu od nule. Procjenitelj
dobiven metodom najmanjih kvadrata normalno je distribuiran
budući da je b linearna funkcija ", a " je normalno distribuiran6 .
3. E…kasnost: znaµci da procjenitelj dobiven metodom najmanjih kva-
drata ima minimalnu varijancu izme†u svih linearnih procjenitelja koji
su nepristrani. Na slici 2.5 prikazan je e…kasan i nee…kasan procjeni-
telj. Vidimo da su oba procjenitelja nepristrana, me†utim, e…kasan
ima manje odstupanja (minimalno) oko sredine u odnosu na nee…kas-
nog procjenitelja. Gauss-Markovljev teorem ne odnosi se na neline-
arne procjenitelje. Nelinearni procjenitelj moµze biti nepristran i
imati manju varijancu u odnosu na procjenitelja dobivenog metodom
najmanjih kvadrata.
4. Konzistentnost: prethodna svojstva procjenitelja odnose se na svoj-
stva konaµcnih uzoraka. Kada se veliµcina uzorka beskonaµcno poveća
tada procjenitelji imaju odre†ena poµzeljna statistiµcka svojstva. Ta se
svojstva zovu svojstva velikih uzoraka ili asimptotska svojstva.
Konzistentnost je jedno takvo poµzeljno svojstvo, koje ima procjeni-
telj dobiven metodom najmanjih kvadrata. Kaµzemo da je procjeni-
telj konzistentan kada procjenitelj b povećanjem uzorka konvergira
6
Vidi o tome više na stranici 42.

30
Efikasan
Distribucija frekvencija

Neefikasan

E(b)=β

Slika 2.5: E…kasan i nee…kasan procjenitelj

stvarnoj vrijednosti . Drugim rijeµcima kada je uzorak jako velik,


vjerojatnost da je b razliµcit od veoma je mala ili formalno

lim Pr fjb j > g = 0 za sve >0 (2.36)


n!1

što znaµci, asimptotski gledano, da je vjerojatnost da procjenitelj, do-


biven metodom najmanjih kvadrata, odstupa više od proizvoljne pozi-
tivne vrijednosti od stvarnog parametra jednaka nuli. U tom sluµcaju
kaµzemo da limes vjerojatnosti b je i pišemo

plim b = : (2.37)

µ
Cesto se ne moµze dokazati da je neki procjenitelj nepristran; moguće je
da u odre†enim nelinearnim i dinamiµckim modelima nepristran procje-
nitelj uopće ne postoji. U tim sluµcajevima konzistentnost je minimalni
uvjet, koji se postavlja pred procjenitelja, kako bi bio koristan. Sto-
ga su ekonometriµcari µcesto više zabrinuti konzistentnošću procjenitelja
nego li njihovom (ne)pristranošću.

31
Poglavlje 3

Pokazatelji kvalitete regresije

Nakon što smo procijenili parametre modela postavlja se pitanje koliko do-
bro tako dobiveni regresijski pravac pristaje opaµzanjima? Na slici 3.1 prika-

y y

yˆ= 20 + 0.8 x yˆ= 20 + 0.8 x

0 x 0 x
a) b)

Slika 3.1: Pristajanje regresijskog pravca opaµzanjima

zana su dva istovjetna regresijska pravca uzorka izvuµcena iz dvije razliµcite


populacije
y^ = 20 + 0:8x:
U sluµcaju 3.1a) toµcke (opaµzanja) se grupiraju vrlo blizu regresijskom pravcu,
dok se u sluµcaju 3.1b) grupiraju daleko od regresijskog pravca. Jasno je da
gore navedeni regresijski pravac bolje pristaje sluµcaju a) nego sluµcaju b).

32
3.1 Koe…cijent determinacije
Uobiµcajen pokazatelj pristajanja regresijskog pravca nekim opaµzanjima je
koe…cijent determinacije kojeg ćemo oznaµciti sa R2 . Koe…cijent deter-
minacije pokazuje koliko je varijance uzorka y objašnjeno našim modelom
ili matematiµcki koe…cijent determinacije moµzemo de…nirati kao
1 Pn Pn
2 Var (^
y) n 1 yi y)2
i=i (^ yi y)2
i=i (^
R = = 1 Pn = P (3.1)
Var (y) n 1 i=i (yi y)2 n
i=i (yi y)2
P
gdje n 1 1 ni=i (^
yi y)2 pokazuje "objašnjenu" varijancu y regresijskim prav-
P
cem a n 1 1 ni=i (yi y)2 "ukupnu" varijancu y. Drugim rijeµcima, nakon
skraćivanja, koe…cijent determinacije regresijskog modela prikazuje dio ukup-
ne varijance y koju smo objasnili regresijskim modelom.
Na slici 3.2 prikazano1 je za odre†enu vrijednost xi :

ukupno odstupanje y od njegove sredine (yi y)

regresijskim pravcem objašnjeno odstupanje y; (^


yi y)

regresijskim pravcem neobjašnjeno odstupanje y; (yi y^) kojeg


smo do sada oznaµcavali kao rezidual ei .

Propozicija 3.1 Kada je u modelu, dobiven metodom najmanjih kva-


drata, prisutan konstantni µclan b0 za yi = y^i + ei vrijedi

Var (yi ) = Var (^


yi ) + Var (ei ) :

Dokaz. Stvarnu vrijednost yi moµzemo izraµcunati na temelju zbroja proci-


jenjene vrijednosti y^i i sluµcajnog odstupanja ei

yi = y^i + ei : (3.2)

Jednadµzbu 3.2 moµzemo pisati u devijacijskoj formi

(yi y) = y^i y^ + (ei e) (3.3)

Iz Svojstva 3. regresijskog pravca, iz jednadµzbe 2.26 znamo da vrijedi

e=0
1
Napomena: pogrešno bi bilo iz ove slike zakljuµciti da je ukupno odstupanje jednako
zbroju objašnjenog odstupanja i neobjašnjenog odstupanja. Na slici je stvarna vrijednost
postavljena tako da se mogu zornije prikazati te veliµcine, ali uoµcljivo je da kada bi se toµcka
koja prikazuje stvarnu vrijednost y nalazila, recimo, izme†u regresijskog pravca i sredine
y da bi ukupno odstupanje bilo manje od objašnjenog odstupanja.

33
y

yi yˆi = b0 + b1 xi

(yi − yˆi )
(yi − y )
(yˆi − y )
y

0 xi x

Slika 3.2: Ukupno, objašnjeno i neobjašnjeno odstupanje y od svoje sredine.

a iz Svojstva 2. regresijskog pravca, jednadµzba 2.24 znamo da vrijedi2

y^ = y

Na temelju navedenih svojstava 3.3 moµzemo pisati

(yi y) = (^
yi y) + ei :

Ako pre†emo operatorom sume i kvadriramo obje strane jednadµzbe dobijemo


n
X n
X n
X n
X
(yi y)2 = (^
yi y)2 + 2 (^
yi y) ei + e2i : (3.4)
i=1 i=1 i=1 i=1

Izraz
n
X
(^
yi y) ei
i=1
predstavlja kovarijancu izme†u procijenjenog y i reziduala, što iz Svojstva
4. regresijskog pravca, jednadµzba 2.31 znamo da je 0. Stoga 3.4 moµzemo
pisati
Xn Xn Xn
(yi y)2 = yi y)2 +
(^ e2i (3.5)
i=1 i=1 i=1
2
Napomena: Svojstva 2. i 3. regresijskog pravca dobivena metodom najmanjih kva-
drata ne vrijede kada u modelu nije prisutan konstantni µclan b0 :Vidi izvod tih Svojstava
na stranici 27.

34
i kada podijelimo s (n 1) dobijemo
Pn Pn Pn 2
i=1 (yi y)2 yi y)2
i=1 (^ e
= + i=1 i
n 1 n 1 n 1
ili
Var (yi ) = Var (^
yi ) + Var (ei )
µcime smo dokazali Propoziciju 3.1.
Koristeći se ovim svojstvom koe…cijent determinacije moµzemo izvesti ta-
ko da podijelimo cijelu jednadµzbu s Var(yi ) te nakon skraćivanja za (n 1)
dobijemo
Pn Pn 2 Pn 2
i=1 (^yi y)2 i=1 ei 2 i=1 ei
1 = Pn 2 + Pn 2 = R + Pn (3.6)
i=1 (yi y) i=1 (yi y) i=1 (yi y)2

iz µcega slijedi da je koe…cijent deteminacije R2 jednak


Pn 2
2 e
R = 1 Pn i=1 i 2 : (3.7)
i=1 (yi y)

Iz 3.7 vidimo da su vrijednosti koje R2 moµze poprimiti izme†u 0 i 1.


Jedino ako su sva odstupanja od regresijskog pravca jednaka nuli ei = 0
tada je R2 = 1. U tom sluµcaju sva opaµzanja leµze na regresijskom pravcu
i govorimo o deterministiµckom, a ne više o stohastiµckom modelu. Ako je
R2 = 0 to znaµci da model ne objašnjava kretanje y ništa bolje od sredine
uzorka y. Stoga moµzemo na R2 gledati kao na pokazatelj koliko regresijski
model bolje opisuje kretanje zavisne varijable u odnosu na trivijalni model
koji sadrµzava samo konstantni µclan.
Budući da R2 mjeri objašnjenu varijaciju varijable y , on je osjetljiv na
de…niciju te varijable. Na primjer objasniti potrošnju studenata u našem
primjeru razliµcito je od objašnjenja kretanja logaritma potrošnje studenata,
stoga niti koe…cijenti determinacije iz modela, koji imaju kao zavisnu varija-
blu potrošnju, nisu usporedivi s koe…cijentima deteminacije koji imaju zavis-
nu varijablu ln(potrošnja): Da bi koe…cijenti determinacije bili usporedivi
izme†u razliµcitih modela, ti modeli moraju imati istu zavisnu varijablu.
Budući da koe…cijent determinacije nema u svojem temelju odre†enu
hipotezu koju testiramo, već pokazuje nam samo odnos objašnjene i ukupne
varijance y, nemamo graniµcne vrijednosti na temelju kojih moµzemo zakljuµciti
je li neka pojava dovoljno dobro objašnjena našim modelom. Što je veći
R2 , znaµci da smo veći dio pojave objasnili, ali teško je odrediti i što je
to "veliki" koe…cijent determinacije. Vrijednost R2 = 0:5 moµze biti niska
u sluµcajevima kada analiziramo vremenske nizove, dok u sluµcaju analize
vremenskih presjeka moµze biti zadovoljavajuće visoka, budući da je lakše
objasniti agregatnu potrošnju zemlje kroz vrijeme (vremenski niz) u odnosu
na potrošnju pojedinih kućanstava u zemlji (vremenski presjek).

35
Primjer 3.1 Na temelju podataka iz Tablice 2.2 moµzemo izraµcunati koe…-
cijent determinacije
Pn
2 yi y)2
(^ 19317:56
R = Pi=i
n 2 = 24120:00 = 0:800 89:
i=i (yi y)

Budu´ci da su jednadµzbe 3.1 i 3.7 istovjetne za model procijenjen pomo-


´cu metode najmanjih kvadrata s konstantnim µclanom, R2 moµzemo dobiti i
pomo´cu
Pn 2
e 4802:44
R2 = 1 Pn i=1 i 2 = 1 = 0:800 89:
i=1 (yi y) 24120:00
Ovaj nam koe…cijent determinacije govori da smo 80% varijacije potroš-
nje studenata uspjeli objasniti pomo´cu kretanja njihovog raspoloµzivog dohot-
ka.

Koe…cijenta determinacije, kao što je de…niran u 3.7 prate tri problema:

1. Ne vrijedi za regresijske modele koji su izraµcunati metodom najma-


njih kvadrata bez konstantnog µclana b0 : Jednadµzbu 3.7 dobili smo iz
pretpostavki
e = 0 , y^ = y (3.8)
koje ne vrijede kada nemamo konstantni µclan u modelu3 . U tom slu-
µcaju dobiveni koe…cijent determinacije iz 3.7 nije isti koe…cijentu de-
terminacije iz 3.1. Kada nemamo konstantni µclan u modelu koristimo
tzv. necentriranim koe…cijentom determinacije koji glasi
Pn Pn 2
2 y^i2 e
necentrirani R = Pni=1
2 = 1 Pni=1 i2 : (3.9)
i=1 yi i=1 yi

Ovaj se pokazatelj zove necentrirani jer varijable nisu centrirane oko


sredine ili nisu u devijacijskoj formi kao u sluµcaju obiµcnog koe…cijenta
determinacije iz 3.1 koji stavlja u odnos centrirane varijable oko svojih
sredina, pa se stoga µcesto zove i centrirani koe…cijent determina-
cije. Za raµcunanje necentriranog koe…cijenta determinacije, budući
da ne koristi devijacijske forme, nije potrebno zadovoljavati svojstva
iz 3.8.

Primjer 3.2 Ako za procjenu potrošnje studenata iz Tablice 2.1 ko-


ristimo model bez konstantnog µclana b0

y^i = b1 xi + ei
3
Vidi Svojstvo 2 i 3 regresijskog pravca na stranici 27.

36
centrirani R2 izraµcunat pomo´cu jednadµzbe 3.1 je
Pn
2 yi y)2
i=i (^ 33149:51
R = Pn 2 = 24120:00 = 1: 374 4
i=i (yi y)

dok izraµcunat pomo´cu 3.7 je


Pn 2
2 e 6891:56
R = 1 Pn i=1 i 2 = 1 = 0:714 28:
i=1 (yi y) 24120:00

Necentrirani R2 je
Pn
2 y^i2 225308:44
necentrirani R = Pi=1
n 2 = = 0:970 32
i=1 yi 232200:00

îli alternativno
Pn 2
2 e 6891:56
necentrirani R = 1 Pni=1 i2 = 1 = 0:970 32:
i=1 yi 232200:00

Iz gonjeg primjera vidimo da su centrirani R2 ; izraµcunati na temelju


3.1 i 3.7, razliµciti
Pn Pn 2
yi y)2
i=i (^ e
Pn 2 6= 1 Pn i=1 i 2
i=i (yi y) i=1 (yi y)

i da je R2 ; izraµcunat na temelju 3.1 veći od 1, što ukazuje da u tom


sluµcaju ne vrijedi Var(yi ) =Var(^ yi ) +Var(ei ). Jasno je da je tako iz-
2
raµcunat R pogrešno izraµcunat jer nisu zadovoljene pretpostavke iz
3.8. S druge strane iz primjera 3.2 proizlazi da je necentrirani koe…-
cijent determinacije ekvivalentan i kada nemamo konstantnog µclana u
modelu. Odnosno, i dalje vrijedi
Pn Pn 2
y^i2 i=1 ei
Pi=1
n 2 = 1 P n 2:
y
i=1 i i=1 yi

2. Ne vrijedi za regresijske modele koji nisu izraµcunati pomo´cu metode


najmanjih kvadrata (OLS). Budući da smo koe…cijent determinacije
izraµcunali na temelju Svojstava regresijskog pravca, izvedenog pomoću
metode najmanjih kvadrata, tada, ako koristimo metodu najmanjih
kvadrata, imat ćemo jednakost izme†u 3.1 i 3.7, no ako je regresijski
pravac izraµcunat pomoću neke druge metode tada ta jednakost više
ne vrijedi, stoga i tako izraµcunat R2 ne vrijedi. Postoji alternativni
naµcin raµcunanja koe…cijenta determinacije R2 ; koji u sluµcaju metode
najmanjih kvadrata ostaje isti kao u 3.1 i 3.7, a za ostale metode

37
(ne OLS) procjenjivanja regresijskog pravca kreće se uvijek izme†u
vrijednosti 0 i 1. Taj koe…cijent determinacije moµzemo izraµcunati kao
Pn !2
i=1 (yi y) y^i y^
R2 = corr2 (yi ; y^i ) = P Pn ; (3.10)
( ni=1 (yi y)) i=1 y^i y^

tj. izraµcunavamo ga na temelju kvadriranog koe…cijenta korelacije iz-


me†u stvarnih y i procijenjenih y^. Ovako de…niran R2 govori koliko se
dobro mogu varijacije u y objasniti varijacijama u y^; ili pokazuje jaµci-
nu linearne veze izme†u ovih dviju varijabli. Budući da se koe…cijent
korelacije uobiµcajeno oznaµcava s r, zato se koe…cijent determinacije oz-
naµcava s R2 da bi se naglasilo da je koe…cijent determinacije kvadrat
koe…cijenta korelacije.

Primjer 3.3 Na temelju podataka iz Tablice 2.2 imamo

R2 = corr2 (yi ; y^i ) = 0:89492 = 0:800 85:

Iz gornjeg primjera proizlazi da je tako izraµcunat koe…cijent determi-


nacije istovjetan koe…cijentima deteminacije koje smo izraµcunali na
temelju 3.1 i 3.7. Interesantno je primijetiti da u sluµcaju samo jedne
nezavisne varijable, kao u gornjem primjeru, budući da je procije-
njeni y^ linearna kombinacija samo x, moµzemo dobiti isti koe…cijent
determinacije ako kvadriramo koe…cijent korelacije izme†u x i y; što
se jasno vidi u sljedećem primjeru.

Primjer 3.4

R2 = corr2 (yi ; xi ) = 0:89492 = 0:800 85:

3. R2 nikada ne opada s pove´canjem broja nezavisnih varijabli i kada do-


datne varijable ne objašnjavaju kretanje zavisne varijable. Uobiµcajeni
naµcin rješavanja tog problema je ukljuµcivanje u izraµcun koe…cijenta
determinacije stupnjeve slobode, što nam daje tzv. korigirani R2
kojeg oznaµcavamo s
1 Pn 2
(n k) i=1 ei
R2 = 1 P n : (3.11)
1
(n 1) i=1 (yi y)2
P
Var(yi ) je neovisna od broja nezavisnih varijabli x, dok ni=1 e2i ovisi
oPbroju nezavisnih varijabli x, jer što je veći broj x-ova, smanjit će se
n 2
i=1 ei . Da bi se efekt smanjenja sume kvadrata reziduala pri uklju-
µcivanju novih varijabli "kaznio", suma kvadrata reziduala dijeli se sa

38
stupnjevima slobode (n k). U tom se sluµcaju koe…cijent determina-
cije ne povećava automatski s povećanjem broja regresora,
P već ovisi
o tome je li nova varijabla više doprinijela smanjenju ni=1 e2i svojim
ulaskom u model ili više štetila smanjenjem stupnjeva slobode (n k).
Korigirani R2 je uvijek manji od nekorigiranog R2 , osim u sluµcaju ka-
da model ukljuµcuje samo konstantni µclan pa su oba jednaka nuli. U
ekstremnim sluµcajevima korigirani R2 moµze biti negativan.

Primjer 3.5 Na temelju podataka iz Tablice 2.2 korigirani koe…cijent


determinacije bit ´ce
P
2 1= (n k) ni=1 e2i 1= (5 2) 4802:44
R =1 Pn 2 = 1 1= (5 = 0:734 53:
1= (n 1) i=1 (yi y) 1) 24120:00

3.2 Znaµcajnost procjenitelja


3.2.1 Standardna greška procjenitelja
Na temelju jednadµzbe 2.13 procijenili smo vrijednosti parametara populacije
na temelju jednog uzorka iz te populacije. Budući da se podaci mijenjaju
u ovisnosti o uzorku kojeg vuµcemo iz neke populacije, mijenjaju se i pa-
rametri uzorka b kojima procjenjujemo parametre populacije . Postavlja
se stoga pitanje koliko bi me†usobno odstupali parametri razliµcitih uzoraka
s istim brojem opaµzanja koje vuµcemo iz iste populacije, ili koliko moµzemo
biti sigurni da dobiveni parametri na temelju nekog uzorka precizno opisuju
"nevidljive" parametre populacije? Zato što ne znamo stvarne vrijednos-
ti populacije, zakljuµcke o odstupanjima u populaciji donosimo na temelju
odstupanja u uzorku. Ako uzorak ima velika odstupanja oko regresijske
funkcije, kao na Slici 3.1b); zakljuµcujemo da je taj uzorak izvuµcen iz neke
populacije koja tako†er ima velika odstupanja. Ako su odstupanja velika,
tada se iz populacije mogao izvući jedan drugi uzorak koji ima bitno razliµci-
te vrijednosti parametara regresijske funkcije uzorka u odnosu na naš prvo
izvuµceni uzorak. U tom sluµcaju dobiveni parametri iz jednadµzbe 2.13 nisu
pouzdani za opisivanje parametara populacije, ili drugim rijeµcima: ne mo-
µzemo biti sigurni da parametri dobiveni iz uzorka precizno opisuju stvarne
"nevidljive" parametre populacije. S druge strane ako su odstupanja oko
regresijske funkcije uzorka mala, kao na Slici 3.1a), tada pretpostavljamo da
je taj uzorak izvuµcen iz neke populacije koja ima mala odstupanja, i da bi
parametri, koje bismo dobili iz ostalih uzoraka iste veliµcine, izvuµceni iz iste
populacije, bili vrlo sliµcni parametrima regresijskog pravca iz prvog uzorka.
Preciznost (pouzdanost) procjenitelja mjerimo standardnom devija-
cijom, koju zovemo i standardnom greškom procjenitelja i raµcunamo
je na temelju varijance procjenitelja. Varijancu procjenitelja moµzemo
izraziti
Var (b) = E (b E [b]) (b E [b])0 : (3.12)

39
Na temelju svojstva nepristranosti procjenitelja dobivenih metodom najma-
njih kvadrata imamo
E [b] = (3.13)
što 3.12 pretvara u

Var (b) = E (b ) (b )0
2 2 3
E [b1 1] E [(b1 1 ) (b2 2 )] E [(b1 1 ) (bk k )]
6 E [(b2 2 7
6 2 ) (b1 1 )] E [b2 2] E [(b2 2 ) (bk k )] 7
=6 .. .. .. .. 7
4 . . . . 5
2
E [(bk k ) (b0 0 )] E [(bk k ) (b2 2 )] E [bk k]
(3.14)

što moµzemo pisati


2 3
Var (b1 ) Cov (b1 ; b2 ) Cov (b1 ; bk )
6 Cov (b2 ; b1 ) Var (b2 ) Cov (b2 ; bk ) 7
6 7
Var (b) = 6 .. .. .. .. 7: (3.15)
4 . . . . 5
Cov (bk ; b1 ) Cov (bk ; b2 ) Var (bk )

Vidimo da je matrica Var(b) simetriµcna matrica s varijancama parameta-


ra na glavnoj dijagonali i kovarijancama izme†u parametara na pozicijama
izvan glavne dijagonale.
Iz jednadµzbe 2.13 znamo da
1 1
b = X0 X X0 y = X0 X X0 (X + ")
1 1
= X0 X X0 X + X0 X X0 "
1
= I + X0 X X0 "
1
+ X0 X X0 " (3.16)

iz µcega imamo
1
(b ) = X0 X X0 ": (3.17)
Vrijednosti matrice Var(b) moµzemo stoga izraµcunati na temelju

Var (b) = E (b ) (b )0
h 0
i
1 0 1
= E X0 X X "" X X0 X
1 1
= X0 X X0 2
In X X 0 X
2 1 1
= X0 X X0 X X0 X
2 1
= X0 X : (3.18)

40
Iz 3.18 poznata nam je vrijednost matrice (X0 X) 1 . Me†utim skalar 2
predstavlja varijancu regresijskog modela populacije koja nam je ne-
poznata. Moµzemo je procijeniti pomoću nepristranog procjenitelja va-
rijance populacije izraµcunatog iz odstupanja uzorka4
e0 e
s2 = (3.19)
n k
što 3.18 pretvara u
e0 e 1
Var (b) = X0 X : (3.20)
n k
Standardne devijacije (greške) procjenitelja moµzemo izraµcunati tako da ko-
rjenujemo varijance ili
p
sd (b) = Var (b)
r
e0 e
= (X0 X) 1 : (3.21)
n k
Iz jednadµzbe 3.18 vidimo da što je veća varijanca modela populacije
2 (veća raspršenost oko regresijske funkcije populacije) da je veća i vari-

janca procjenitelja Var(b). Znaµci, ako imamo vrlo raspršenu populaciju oko
regresijske funkcije populacije tada i regresijske funkcije uzoraka, koje su
izvedene iz te populacije, mogu se me†usobno jako razlikovati. U sluµcaju
da imamo malu raspršenost populacije oko regresijske funkcije populacije
tada će uzorci izvedeni iz te populacije davati sliµcne vrijednosti parametara
regresijskih funkcija uzoraka.
Budući da ne znamo 2 , nju smo procijenili iz varijance uzorka s2 (jed-
nadµzba 3.19), pretpostavljajući da ako uzorak ima velika odstupanja oko
regresijske funkcije uzorka da i populacija iz koje je taj uzorak izvuµcen ima
velika odstupanja oko regresijske funkcije populacije.
Primjer 3.6 Na temelju jednadµzbe 3.21 moµzemo izraµcunati Var(b) za pa-
rametre iz primjera 2.1 na sljede´ci naµcin:
1
4802:44 5 1550
Var (b) =
5 2 1550 562 500
4802:44 225 31
= 164 8200
31 1
3 8200 82 000
2196: 2 6: 051 9
= :
6: 051 9 0:01 952 2
Vidimo da je Var(b0 ) = 2196:2, Var(b1 ) = 0:019522, te kovarijanca Cov(b0 ; b1 ) =
6:0519. Standardna devijacija procjenitelja bit ´ce
p p
sd (b0 ) = Var (b0 ) = 2196:2 = 46: 864
p p
sd (b1 ) = Var (b1 ) = 0:019522 = 0:139 72:
4
Dokaz da se radi o nepristranom procijenitelju varijance populacije moµze se naći u [3],
str. 48-49. ili [5], str. 30-31.

41
Do sada nismo imali nikakvu pretpostavku vezanu za oblik distribuci-
je odstupanja "i , osim što smo pretpostavili da su me†usobno nekorelirani,
neovisni o X, da imaju sredinu nula i konstantnu varijancu. Me†utim da bi
se moglo statistiµcki zakljuµcivati i testirati hipoteze moramo eksplicitno de-
…nirati pretpostavku o distribuciji odstupanja. Uobiµcajena je pretpostavka
da su odstupanja "i normalno distribuirana, tj.
2
" N 0; In : (3.22)

Drugim rijeµcima, vektor " normalno je distribuiran sa sredinom nula i s


kovarijanµcnom matricom 2 In . Iz jednadµzbe 3.16 vidimo da su procjenitelji
b linearna funkcija vektora odstupanja " iz µcega slijedi da su procjenitelji
dobiveni metodom najmanjih kvadrata tako†er normalno distribuirani sa
sredinama i kovarijanµcnom matricom 2 (X0 X) 1 tj.

2 1
b N ; X0 X (3.23)

iz µcega slijedi da je svaki element vektora b normalno distribuiran ili


2 1
bk N k; X0 X kk
(3.24)

1
gdje (k; k) predstavlja element na glavnoj dijagonali matrice (X0 X) :

3.2.2 Testiranje hipoteza nad procjeniteljima


Pri statistiµckom testiranju hipoteza moµzemo uµciniti dvije vrste greške: mo-
µzemo odbaciti hipotezu koja je istinita ili moµzemo ne odbaciti hipotezu koja
je kriva. Odbacivanje istinite hipoteze u statistici se zove greška I. tipa,
dok se neodbacivanje krive hipoteze zove greška II. tipa. Vjerojatnost nas-
tanka greške I. tipa neposredno kontrolira istraµzivaµc proizvoljnim odabirom
razine znaµcajnosti koja se u statistici oznaµcava s : Uobiµcajeno je testi-
rati na razini znaµcajnosti od 5%, tj. s "ugra†enom" vjerojatnošću greške I.
tipa od 5%. Postavlja se pitanje zašto dodatno ne smanjiti tu vjerojatnost
greške, pa testirati na razini znaµcajnosti od 1% ili manje? Naµzalost na tim
razinama znaµcajnosti dodatno smanjenje vjerojatnosti greške I. tipa dras-
tiµcno povećava vjerojatnost da se uµcini greška II. tipa (koja se u statistici
uobiµcajeno oznaµcava sa ), tj. da se ne odbaci hipoteza koja je kriva. Vje-
rojatnost da se ne uµcini greška II. tipa zove se snaga testa (1 ); odnosno
snaga testa pokazuje sposobnost testa da odbaci krivu hipotezu.
Ekonometrijski paketi pri testiranju razliµcitih hipoteza izraµcunavaju tzv.
p vrijednost (p iz eng. probability) ili toµcnu razinu znaµcajnosti testa
koja prikazuje najmanju razinu znaµcajnosti pri kojoj moµzemo odbaciti H0 :
Ako je p vrijednost manja od razine znaµcajnosti ; moµzemo odbaciti H0 .
Ona, tako†er, pokazuje osjetljivost odluke o odbacivanju nul hipoteze u
odnosu na razinu znaµcajnosti. Tako npr. vrijednost p = 0:07 ukazuje da

42
moµzemo odbaciti nul hipotezu na razini znaµcajnosti od 10%, ali ne i na
razini znaµcajnosti od 5%. Kada moµzemo odbaciti H0 , kaµzemo da su rezultati
statistiµcki znaµcajni, a kada ne moµzemo odbaciti H0 , kaµzemo da rezultati
nisu statistiµcki znaµcajni.
Za testiranje hipoteza o parametrima (procjeniteljima) modela koristit
ćemo dva testa: t-test za testiranje zasebnih hipoteza i F-test za testiranje
zajedniµckih hipoteza.

t-test
Iz jednadµzbe 3.24 slijedi da varijabla
bk k
z= 1=2
(3.25)
2 (X0 X) 1
kk

ima standardnu normalnu distribuciju, tj. sredinu nula i varijancu 1. Bu-


dući da nam nije poznata varijanca populacije 2 , zamijenit ćemo je pro-
cijenjenom Pnepristranom varijancom na temelju uzorka iz jednadµzbe 3.19,
s2 = n 1 k e2i : Budući da su reziduali uzorka ei normalno distribuirani, nji-
P 2
hova suma kvadrata ei ima 2 distribuciju5 . Od tuda sluµcajna varijabla

bk k
tk = 1=2
(3.26)
s2 (X0 X)kk1

predstavlja odnos standardizirane normalne varijable i drugog korijena va-


rijable s 2 distribucijom. Budući da su ove dvije varijable i me†usobno
nezavisne, tada sluµcajna varijabla tk ima Studentovu t distribuciju s (n k)
stupnjeva slobode6 . Studentova distribucija sliµcna je normalnoj distribuci-
ji. Ima nešto deblje krakove u odnosu na normalnu distribuciju kada imamo
mali broj stupnjeva slobode, no povećanjem broja stupnjeva slobode postaju
sliµcnije i za dovoljan velik broj stupnjeva slobode postaju identiµcne.
Slijedom gore reµcenog moµzemo konstruirati t-test kojim moµzemo testirati
hipoteze o parametru populacije k pomoću

bk k
tk = (3.27)
sd (bk )

koji ima t distribuciju s (n k) stupnjeva slobode. Vidimo da su nam u 3.27


poznate sve veliµcine: parametar uzorka bk , standardna greška parametra
uzorka sd(bk ) i vrijednost parametra populacije koju proizvoljno testiramo
k:
5
Vidi Dodatak C.1, teorem C.3.
6
Vidi Dodatak C.1, teorem C.5.

43
Dvostrani t-test Na temelju jednadµzbe 3.27 moµzemo testirati hipotezu
da k poprima vrijednost k , tj. H0 : k = k nasuprot alternativnoj
hipotezi H1 : k 6= k . Velika razlika u vrijednostima parametara uzorka bk ;
kojeg smo procijenili pomoću metode najmanjih kvadrata i testne veliµcine k
podrazumijeva malu vjerojatnost da su te dvije veliµcine iste. U tom sluµcaju
moµzemo lakše odbaciti H0 . Nadalje iz brojnika jednadµzbe 3.27 moµzemo
uoµciti da se povećanjem razlike izme†u bk i k testna statistika tk povećava
u apsolutnoj vrijednosti. Stoga moµzemo lako zakljuµciti kako veća vrijednost
jtk j implicira lakše odbacivanje H0 .
Interesantno je dalje primijetiti da povećanje veliµcine uzorka smanjuje
standardnu grešku procjenitelja. Budući da se standardna greška procjeni-
telja nalazi u nazivniku jednadµzbe 3.27 to povećava t vrijednost. Veća t vri-
jednost podrazumijeva lakše odbacivanje H0 što kod velikih uzoraka znatno
smanjuje vjerojatnost greške II. tipa. Kako bi kompenzirali taj efekt, istra-
µzivaµci uobiµcajeno smanjuju vjerojatnost greške I. tipa tako što smanje razinu
znaµcajnosti njihovih testova. To objašnjava zašto je kod velikih uzoraka
opravdano birati razinu znaµcajnosti od 1%, umjesto uobiµcajenih 5%, a kod
vrlo malih uzoraka razinu znaµcajnosti od 10%.
Budući da alternativna hipoteza H1 : k 6= k dozvoljava vrijednosti
koje su veće ali i manje od k , tada se takav test zove dvostrani test
(testira se na oba kraka distribucije) µcije se kritiµcne vrijednosti t =2;(n k)
de…niraju kao vjerojatnost

Pr jtk j > t =2;(n k) = : (3.28)


Odbacujemo H0 ako je apsolutna vrijednost jtk j veća od kritiµcne vri-
jednosti t =2;(n k) gdje oznaµcava razinu znaµcajnosti a (n k) stupnjeve
slobode.

Primjer 3.7 Pretpostavimo da µzelimo testirati, s razinom znaµcajnosti od


5%; hipotezu da je graniµcna sklonost potrošnji studenata, iz Tablice 2.1,
0:6:Na temelju parametra kojeg smo izraµcunali u primjeru 2.1 i standardne
devijacije koju smo izraµcunali u primjeru 3.6 moµzemo testirati H0 : 1 = 0:6
nasuprot alternativnoj hipotezi H1 : 1 6= 0:6 pomo´cu t-testa na sljede´ci
naµcin:
b1 1 0:485 0:6
t1 = = = 0:823:
sd (b1 ) 0:1397
U tablici Studentove distribucije vjerojatnosti E.2, prikazanoj u Dodatku,
moµzemo na´ci kritiµcnu vrijednost t0:025;3 = 3:1824: Budu´ci da je u našem
primjeru jt1 j < t =2;(n k) , tj. 0:823 < 3:1824 zakljuµcujemo da ne moµzemo
odbaciti nul hipotezu H0 = 0:6 :
Umjesto tablice Studentove distribucije mogli smo koristiti toµcnu razi-
nu znaµcajnosti testa (p vrijednost) za dvostranu t distribuciju, s 3 stupnja

44
slobode i testnom veliµcinom od 0:823, koju uobiµcajeno izraµcunavaju ekono-
metrijski paketi. U našem primjeru ona iznosi p = 0:4707, što nam govori
da ne moµzemo odbaciti nul hipotezu jer vjerojatnost da smo uµcinili grešku
ako odbacimo H0 = 0:6 je 47:07%; mnogo ve´ca od razine znaµcajnosti od 5%
na kojoj testiramo. Budu´ci da imamo vrlo mali uzorak (n = 5) opravdano
bi bilo testirati na razini znaµcajnosti od 10%. Ali na temelju p vrijednosti
od 47:07% odmah moµzemo zakljuµciti da i na razini od 10% ne moµzemo od-
baciti nul hipotezu. Lako se moµze uoµciti da p vrijednost pokazuje "graniµcnu"
razinu znaµcajnosti testa, ili najmanju razinu znaµcajnosti pri kojoj se moµze
odbaciti nul hipoteza (u našem primjeru nul hipotezu moµzemo odbaciti tek za
razine znaµcajnosti 47:07%). Statistiµcko zakljuµcivanje na temelju p vri-
jednosti identiµcno je zakljuµcivanju na temelju tablice Studentove distribucije
vjerojatnosti.

U prethodnom primjeru 3.7 vidjeli smo da rezultati testiranja nisu bi-


li statistiµcki znaµcajni, ili da nismo mogli odbaciti H0 = 0:6, što ne znaµci
da automatski prihvaćamo vrijednost testiranog parametra 1 = 0:6 kao
istinitu. U našem smo primjeru mogli testirati cijeli skup razliµcitih hipote-
za koje ne moµzemo odbaciti na razini znaµcajnosti od 5%, kao što su npr.
H0 : 1 = 0:5; H0 : 1 = 0:3; H0 : 1 = 0:75: Bilo bi neozbiljno tvrditi da su
sve te hipoteze istovremeno istinite, ili da ih sve istovremeno prihvaćamo.
Stoga je jedini prikladni zakljuµcak da se gore navedene hipoteze ne mogu
odbaciti. Drugim rijeµcima hipoteze u klasiµcnoj statistici ne prihvaćaju se,
već se odbacuju ili ne odbacuju.
Ekonometrijski paketi uobiµcajeno automatski prikazuju, pokraj vrijed-
nosti parametara i njihovih standardnih devijacija, t vrijednosti kojima se
testira hipoteza H0 : k = 0, nasuprot hipotezi H0 : k 6= 0. Budući da je u
tom sluµcaju k = 0; t-test jednadµzbe 3.27 pretvara se u
bk k bk 0 bk
tk = = = ; (3.29)
sd (bk ) sd (bk ) sd (bk )
kojeg uobiµcajeno zovemo t-omjer. Ako je procijenjeni parametar znaµcajno
razliµcit od 0; tada moµzemo reći da varijabla xk , koja se veµze za taj parametar,
ima znaµcajan utjecaj na zavisnu varijablu y: Drugim rijeµcima, ako moµzemo
odbaciti H0 : k = 0, tada kaµzemo da je utjecaj varijable xk na y znaµcajan.

Primjer 3.8 Je li utjecaj raspoloµzivog dohotka na potrošnju studenata iz


Tablice 2.1 znaµcajan, moµzemo testirati pomo´cu
b1 0:485
t1 = = = 3: 472:
sd (b1 ) 0:1397
Toµcna razina znaµcajnost testa iznosi p = 0:04; na temelju koje moµzemo sa
znaµcajnoš́cu od 5 i 10% odbaciti H0 : 1 = 0: S druge strane, ako odabe-
remo razinu testiranja od 1% znaµcajnosti, tada ne moµzemo odbaciti tu istu

45
nul hipotezu. Moµzemo stoga zakljuµciti da je utjecaj raspoloµzivog dohotka na
potrošnju studenata statistiµcki znaµcajan ako testiramo sa znaµcajnoš́cu od 5 i
10%, no ako testiramo sa znaµcajnoš́cu od 1%, ne moµzemo odbaciti hipotezu
da raspoloµziv dohodak studenata ne utjeµce na njihovu potrošnju.

Jednostrani t test Ponekad moramo testirati hipoteze nad parametri-


ma koje imaju jednostranu alternativnu hipotezu. Ako testiramo hipotezu
H0 : k k , vidimo da će alternativna hipoteza H1 : k > k biti jednos-
trana budući da uzima u obzir samo vrijednosti koje su veće od k . Ako
razmotrimo jednadµzbu 3.27 vidimo da velika pozitivna razlika brojnika vo-
di ka velikoj pozitivnoj tk vrijednosti (standardna greška procjenitelja koja
se nalazi u nazivniku izraza uvijek je pozitivna), a velika negativna razlika
brojnika vodi ka velikoj negativnoj vrijednosti tk . Velika pozitivna razli-
ka vodi ka odbacivanju H0 , dok je velika negativna razlika u skladu s nul
hipotezom H0 : k k i ne vodi ka njezinom odbacivanju. Analogno,
mogli smo konstruirati hipotezu H0 : k k , sa H1 : k < k : Kritiµcnu
vrijednost za jednostrani test moµzemo stoga izraziti kao

Pr tk > t ;(n k) = (3.30)

za H0 : k k nasuprot H1 : k > k te

Pr tk < t ;(n k) = (3.31)

za H0 : k k nasuprot H1 : k < k:

Primjer 3.9 Pretpostavimo da µzelimo testirati, s razinom znaµcajnosti od


5%, hipotezu da je graniµcna sklonost studenata iz Tablice 2.1 jednaka ili
ve´ca od 0:6, ili H0 : 1 0:6, nasuprot hipotezi H0 : 1 < 0:6. Na temelju
jednadµzbe 3.27 dobit ´cemo

b1 1 0:485 0:6
t1 = = = 0:823;
sd (b1 ) 0:1397

istu vrijednost koju smo dobili u primjeru 3.7 kada smo testirali dvostranim
testom hipotezu H0 : 1 = 0:6: Kritiµcna vrijednost za jednostrani test7 s 5%
znaµcajnosti i 3 stupnja slobode iznosi t0:05;3 = 2:3534, dok je za dvostrani
test iz primjera 3.7 bila t0:025;3 = 3:1824: Budu´ci da je u našem primjeru
t1 > t0:025;3 , tj. 0:823 > 2:3534; na temelju jednadµzbe 3.31 ne moµzemo
odbaciti s 5% znaµcajnosti hipotezu H0 : 1 0:6: Ekonometrijski paketi uobi-
µcajeno prikazuju p vrijednosti za dvostrane testove, koji su µceš́ci u praksi.
Ako koristimo za statistiµcko zakljuµcivanje p vrijednosti umjesto tablica Stu-
dentove distribucije za jednostrani t-test, moramo dobivenu p vrijednost za
dvostrani test podijeliti s 2. Tako u našem sluµcaju imamo p=2 = 0:4707=2 =
7
Vidi Dodatak, Tablica E.2

46
0:235 4, što ukazuje da je vjerojatnost da smo pogriješili 23:54%, ako od-
bacimo H0 . Drugim rijeµcima ako testiramo s 5% znaµcajnosti, ne moµzemo
odbaciti hipotezu da je graniµcna sklonost potrošnji studenata iz našeg pri-
mjera jednaka ili ve´ca od 0:6:

Primjer 3.10 Pretpostavimo da µzelimo testirati, sa znaµcajnoš́cu od 5%, hi-


potezu da je graniµcna sklonost potrošnji studenata iz Tablice 2.1 jednaka ili
manja od 0:1, ili H0 : 1 0:1, nasuprot hipotezi H1 : 1 > 0:1. Na temelju
jednadµzbe 3.27 imamo

b1 1 0:485 0:1
t1 = = = 2: 756: (3.32)
sd (b1 ) 0:1397

Iz Studentove tablice imamo t0:05;3 = 2:3534. Budu´ci da t1 > t0:025;3 ; ili


2:756 > 2:3534 na temelju jednadµzbe 3.30 moµzemo odbaciti H0 : Do istog
zakljuµcka moµzemo do´ci koriste´ci se p vrijednoš́cu koja za ovaj test iznosi
p=2 = 0:070=2 = 0:035 :Drugim rijeµcima vjerojatnost da smo uµcinili grešku
je 3:5%, ako odbacimo nul hipotezu. Zato što je vjerojatnost da smo uµcinili
grešku, kada odbacujemo H0 , manja od "dopuštene" vjerojatnosti greške od
5%, hipotezu H0 : 1 0:1 moµzemo odbaciti.

Interval pouzdanosti parametara Interval pouzdanosti parametra mo-


µzemo de…nirati kao raspon svih vrijednosti k za koje se H0 : k = k ne
moµze odbaciti t-testom. Vjerojatnost da se t statistika na†e izme†u kritiµcnih
t vrijednosti iznosi

Pr t =2;(n k) tk t =2;(n k) =1 : (3.33)

Supstitucijom jednadµzbe 3.27 u 3.33 dobijemo

bk k
Pr t =2;(n k) t =2;(n k) =1 : (3.34)
sd (bk )

Nakon sre†ivanja po k imamo

Pr bk sd (bk ) t =2;(n k) k bk + sd (bk ) t =2;(n k) =1 ; (3.35)

ili kompaktno interval pouzdanosti populacijskog parametra k moµzemo


pisati kao
bk sd (bk ) t =2;(n k) : (3.36)
Iz jednadµzbe 3.36 vidimo da interval pouzdanosti izraµcunavamo na temelju
poznatih veliµcina koje smo izvukli iz uzorka te populacije, a to su: parametar
bk i njegova standardna devijacija sd(bk ). Što je veća standardna devijacija
procjenitelja, to će biti širi interval pouzdanosti. Širi interval pouzdanosti

47
znaµci veću neizvjesnost u procjenjivanju populacijskog nepoznatog parame-
tra k . Stoga se na standardnu grešku procjenitelja gleda kao na mjeru pre-
ciznosti procjenitelja koja nam govori koliko precizno procjenitelj bk opisuje
stvarnu vrijednost populacijskog k .
Populacijski parametar k je nepoznata, ali …ksna vrijednost, zato izraz
3.35 ne moµzemo interpretirati kao "(1 ) je vjerojatnost da se populacijski
parametar k nalazi u granicama bk sd (bk ) t =2;(n k) " jer bi to impliciralo
da je interval pouzdanosti …ksan, a populacijski parametar sluµcajna vrijed-
nost. Budući da je populacijski parametar k …ksna vrijednost, kada bi
interval pouzdanosti tako†er bio …ksan, vrijednost populacijskog parametra
leµzala bi, ili ne bi leµzala, u …ksnom intervalu pouzdanosti. U tom sluµcaju
imali bismo samo dvije vjerojatnosti: ako leµzi, vjerojatnost je 1 (100%);
ako ne leµzi u intervalu pouzdanosti je 0. Me†utim interval pouzdanosti ni-
je …ksan već sluµcajan jer ovisi o izvuµcenom uzorku iz populacije. Stoga
jedini pravilan naµcin interpretacije intervala pouzdanosti parametra je da
u ponovljenom uzorkovanju, 100 (1 ) % izraµcunatih sluµcajnih intervala
pouzdanosti, na temelju izvuµcenih uzoraka iz iste populacije, ukljuµcivat će
stvarni populacijski …skni parametar k: Drugim rijeµcima kada bi se iz neke
populacije izvuklo 100 uzoraka i na temelju njih izraµcunalo, koristeći izraz
3.36, 100 sluµcajnih 95 postotnih intervala pouzdanosti za …ksni populacij-
ski parametar k , u 95 od 100 intervala pouzdanosti našli bismo vrijednost
populacijskog …ksnog parametra k :
Primjer 3.11 Na temelju jednadµzbe 3.36 moµzemo izraµcunati 95 postotne
intervale pouzdanosti za parametre modela izraµcunatih u primjeru 2.1. Da
bismo dobili 95 postotni interval pouzdanosti biramo razinu znaµcajnosti od
= 0:05 jer 100 (1 ) % = 100 (1 0:05) % = 95%: Kritiµcna vrijednost
t =2;(n k) iznosi t0:025;3 = 3:1824 (vidi Tablica E.2 u Dodatku). Na temelju
izraza 3.36 moµzemo izraµcunati 95 postotni interval pouzdanosti za parametar
0

b0 sd (b0 ) t =2;(n k)
= 53: 535 46:864 3:1824
= 53:535 149: 14
što moµzemo pisati
95: 605 0 202:675:
Za parametar 1 95 postotni interval pouzdanosti bit ´ce
b1 sd (b1 ) t =2;(n k)
= 0:48537 0:139 72 3:1824
= 0:48537 0:444 6
što moµzemo pisati
0:04077 1 :0:92997:

48
F -test
Na temelju t-testa moµzemo testirati pojedinaµcne hipoteze nad jednim koe…-
cijentom. Postavlja se pitanje kako testirati zajedniµcke hipoteze nad koe…-
cijentima kao što su na primjer
H0 : 1 = 2 = 0 ili H0 : 1 + 2 4 = 1:
U tom sluµcaju moµzemo konstruirati ograniµceni model koji će u sebi sadr-
zµ avati ograniµcenja nad parametrima i testirati razliku izme†u neobjašnjena
odstupanja ograniµcenog modela i neograniµcenog modela. Kod neograniµce-
nog modela ne forsiramo da parametri poprime odre†ene vrijednosti, već
dopuštamo da poprime bilo koju vrijednost koja, u sluµcaju da rabimo meto-
du najmanjih kvadrata, minimizira zbroj kvadrata odstupanja. Kod ogra-
niµcenog modela, s druge strane, forsiramo da odre†eni parametri poprime
a priori zadane vrijednosti koje ne minimiziraju zbroj kvadrata odstupanja.
Jasno je stoga da zbroj kvadrata neobjašnjenih odstupanja bit će uvijek veći
kod ograniµcenog modela u odnosu na neograniµceni model. Nadalje, što se
forsirani parametar u neograniµcenom modelu udaljava svojom vrijednošću
od parametra koji minimizira sumu kvadrata odstupanja (dobiven neogra-
niµcenim modelom) to će biti veća razlika izme†u sume kvadrata odstupanja
ograniµcenog i neograniµcenog modela. Na taj naµcin prirodno se nameće test
koji uspore†uje zbrojeve kvadrata neobjašnjenih odstupanja ograniµcenog i
neograniµcenog modela. Ako je razlika velika, tada će se nul hipoteza mo-
ći odbaciti, ako je razlika mala,Ptada se nul hipoteza neće moći odbaciti.
Ako sumu kvadrata odstupanja (yi y^i )2 oznaµcimo s RSS, tada F test
moµzemo pisati
(RSSR RSSU R ) =J
F = (3.37)
RSSU R = (n k)
gdje RSSR oznaµcava sumu kvadrata odstupanja ograniµcenog modela, RSSU R
sumu kvadrata odstupanja neograniµcenog modela, J broj ograniµcenja i (n k)
stupnjeve slobode neograniµcenog modela. Budući da je RSSR uvijek veći
od RSSU R , gornji izraz uvijek će biti pozitivan.
Ako
P vrijedi pretpostavka da su odstupanja
P 2 ei normalno distribuirana,
tada (yi y^i )2 ; što skraćeno pišemo ei , iz Teorema8 C.3 ima 2 distri-
buciju. Na temelju Teorema C.4 znamo da zbrajanje i oduzimanje varijabli
s 2 distribucijom daju varijablu s 2 distribucijom. Stoga će i razlika
RSSR RSSU R , tako†er, imati 2 distribuciju. Iz Teorema C.6 znamo da
će odnos dviju sluµcajnih varijabli s 2 distribucijom xx12 =n 1
=n2 imati F distribu-
ciju s (n1 ; n2 ) stupnjeva slobode, ili kao u sluµcaju naše jednadµzbe 3.37 F -test
ima F distribuciju sa (J; n k) stupnjeva slobode. F -test je jednostrani test
µciju kritiµcnu vrijednost F J;(n k) moµzemo de…nirati kao
n o
Pr F > F J;(n k) = (3.38)
8
Vidi Dodatak C.1

49
gdje predstavlja razinu znaµcajnosti testa. Drugim rijeµcima velika razlika
izme†u RSSR i RSSU R vodit će k velikim vrijednostima F statistike iz
3.37, a velike vrijednosti F statistike vodit će na temelju 3.38 odbacivanju
nul hipotez· e.
Ekonometrijski paketi µcesto automatski pokraj vrijednosti parametara,
standardnih devijacija koe…cijenata, t vrijednosti, koe…cijenata determina-
cije itd. prikazuju i rezultate F -testa kojim se za model

y= 0 + 1 x1 + 2 x2 + + k 1 xk 1

testira zajedniµcka hipoteza

H0 : 1 = 2 = = k 1 = 0; (3.39)

odnosno, testira se zajedniµcka hipoteza da su svi parametri, koji se veµzu za


nezavisne varijable, jednaki nula, što znaµci da niti jedna nezavisna varijabla
nije znaµcajna za objašnjenje zavisne varijable y. U tom se sluµcaju ograniµceni
model svodi na trivijalan model koji sadrµzi samo konstantni µclan 0

y= 0: (3.40)

Iz Propozicije 3.1 znamo da za model s konstantnim µclanom vrijedi

Var (yi ) = Var (^


yi ) + Var (ei ) :

Ako pomnoµzimo s (n 1) dobijemo jednadµzbu 3.5


n
X n
X n
X
2 2
(yi y) = (^
yi y) + e2i
i=1 i=1 i=1

koju moµzemo pojednostavljeno pisati

T SS = ESS + RSS; (3.41)

gdje T SS oznaµcava ukupnu sumu kvadrata odstupanja, ESS objašnjenu


sumu kvadrata odstupanja, a RSS neobjašnjenu sumu kvadrata odstupanja
od sredine uzorka. Budući da u ograniµcenom modelu 3.40 nemamo ni jednu
nezavisnu varijablu, tada će njegova objašnjena suma kvadrata odstupanja
biti ESSR = 0, a iz 3.41 slijedi da za tako ograniµceni model vrijedi

RSSR = T SS: (3.42)

Taj rezultat pretvara F -test, kojim moµzemo testirati hipotezu 3.39, u

(RSSR RSSU R ) =J (T SS RSSU R ) = (k 1) ESSU R = (k 1)


F = = =
RSSU R = (n k) RSSU R = (n k) RSSU R = (n k)
(3.43)

50
ili u odnos objašnjene i neobjašnjene varijance neograniµcenog mo-
dela. Broj ograniµcenja J je (k 1), tj. broj parametara koji se procjenjuju
u modelu manje jedan (konstantni µclan koji nije ograniµcen). Interesantno
je primijetiti da ograniµceni model 3.40 ima koe…cijent
P determinacije (kori-
girani kao i nekorigirani) jednak nuli jer je ESS = yi yi )2 = 0: Stoga
(^
je testirati nul hipotezu 3.39 ekvivalentno testiranju nul hipoteze da je po-
pulacijski koe…cijent determinacije R2 = 0: Drugim rijeµcima F -test iz 3.43
moµzemo interpretirati i kao test kojim se testira znaµcajnost koe…cijenta
determinacije R2 .
Kada imamo skup linearnih ograniµcenja u obliku

r11 1 + r12 2 + + r1k k = q1


r21 1 + r22 2 + + r2k k = q2
..
.
rJ1 1 + rJ2 2 + + rjk k = qJ

zgodno ih je prikazati u kompaktnoj matriµcnoj formi

R = q: (3.44)

Matrica R ima k stupaca koji odgovaraju broju parametara, koji se procje-


njuju i J redaka, koji odgovaraju broju linearnih ograniµcenja nad parametri-
ma. Broj stupaca mora biti manji od broja redaka (J < k); drugim rijeµcima
moramo imati manje ograniµcenja od procijenjenih parametara. Testiranje
nul hipoteze jednog skupa od J linearnih ograniµcenja moµzemo de…nirati sa

H0 : R q=0 (3.45)

nasuprot alternativnoj hipotezi

H1 : R q 6= 0: (3.46)

Na ovaj naµcin lako moµzemo de…nirati zajedniµcku nul hipotezu koja se


sastoji od mnogih linearnih ograniµcenja kao npr.

H0 : 2 = 2; 3 = 7; 4 + 5 6 =1

putem 2 3 2 3
0 1 0 0 0 0 0 2
R=4 1 0 0 0 0 0 1 5, q = 4 0 5
0 0 0 1 1 1 0 1
ili hipotezu 3.39 da su svi parametri u modelu osim konstantnog µclana jed-
naki nuli
R = [0 : Ik 1 ] ; q = 0:

51
Za zadane parametre uzorka, dobivene metodom najmanjih kvadrata, mo-
µzemo de…nirati vektor nepodudarnosti (eng. discrepancy vector) s

m = Rb q (3.47)

gdje vektor Rb prikazuje procijenjeno stanje, a q veliµcine koje µzelimo testi-


rati. Na temelju Waldovog kriterija

W = m0 Var (m) m (3.48)

nakon supstituiranja varijance populacije 2 procijenjenom varijancom po-


pulacije s2 , moµzemo dobiti F statistiku9 za testiranje linearne hipoteze 3.45
n h i o 1
1
m0 R s2 (X0 X) R0 m
F = : (3.49)
J
F statistika izraµcunata ovim naµcinom, s (J; n k) stupnjeva slobode, is-
tovjetna je F statistici, koju dobijemo koristeći jednadµzbu 3.37, tj. daju
potpuno isti rezultat. Prednost 3.49 nad 3.37 je relativno jednostavno de…-
niranje skupa linearnih ograniµcenja koja ulaze u nul hipotezu.

Primjer 3.12 Pretpostavimo da µzelimo nad parametrima modela10


2
RU R = 0:9989
y = 410:81 33:75 x1 + 3:23 x2 + 9:71 x3 31:57 x4 + 38:39 x5 RSSU R = 6808:58
(162:830) (26:134) (0:989) (0:727) (1:162) (10:793)
ESSU R = 6394831
(3.50)

testirati s 5% znaµcajnosti sljede´ce hipoteze:

a)
H0 : 1 = 2 = 3 = 4 = 5 =0 (3.51)
drugim rijeµcima µzelimo testirati zajedniµcku hipotezu da su svi parametri
vezani za nezavisne varijable jednaki nula nasuprot hipotezi H1 : 1 =
2 = 3 = 4 = 5 6= 0: U našem sluµcaju model iz jednadµzbe 3.50
je neograniµceni model, dok ´ce ograniµceni model, u kojeg ugra†ujemo
nul hipotezu 3.51, biti model samo s konstantnim µclanom, ili u našem
sluµcaju
RR2 = 0:0000
y = 3067:82 : (3.52)
RSSR = 6401640
Budu´ci da u ograniµcenom modelu nemamo nezavisnih varijabli, koe…-
cijent determinacije R2 ; kao i korigirani koe…cijent determinacije R2
9
Vidi detaljan izvod u [3] str. 96-97.
10
Podaci za ovaj model prikazani su u Dodatku D.1.

52
su nula. Vidimo da RSSR ograniµcenog modela 3.52 znatno je ve´ci od
RSSU R neograniµcenog modela 3.50. Hipotezom smo ograniµcili 5 para-
metara, zato je broj ograniµcenja J = 5, i imamo (n k) = (25 6) =
19 stupnjeva slobode. Prema tome F test kojim testiramo nul hipotezu
3.51 bit ´ce
(RSSR RSSU R ) =J (6401640 6808:58) =5
F = = = 3569: 1:
RSSU R = (n k) (6808:58) =19

Kritiµcna vrijednost F distribucije za 5% znaµcajnosti prikazana je u


5
Dodatku, Tablica E.3, i iznosi F0:05;19 = 2:740. Budu´ci da je u našem
J
sluµcaju F > F ;(n k) , moµzemo na razini od 5% znaµcajnosti odbaciti
nul hipotezu 3.51. Na temelju Tablice E.4, iz Dodatka, vidimo da nul
hipotezu moµzemo odbaciti i s 1% znaµcajnosti, tj. s vjerojatnoš́cu da
smo pri odbacivanju hipoteze uµcinili grešku od samo 1%; budu´ci da je
5
kritiµcna vrijednost F0:01;19 = 4:171 manja od testne veliµcine 3569:1.
Kada testiramo hipotezu da su svi parametri vezani za nezavisne va-
rijable jednaki nula, tada F vrijednost moµzemo dobiti koriste´ci se i
jednadµzbom 3.43

ESSU R = (k 1) 6394831=5
F = = = 3569:1
RSSU R = (n k) 6808:58=19

u koju ulaze podaci samo neograniµcenog modela. Ekonometrijski paketi


pokraj parametara modela µcesto automatski prikazuju ovu F vrijednost,
kojom se testira hipoteza da su svi parametri modela vezani za neza-
visne varijable jednaki nula (hipoteza 3.51). U matriµcnoj formi gornju
hipotezu moµzemo testirati pomo´cu Waldovog kriterija ako de…niramo

R = [0 : I5 ] ; q = 0:

Vidimo da matricom R ne ograniµcavamo samo konstantni µclan (prvi


stupac). Broj ograniµcenja je J = 5 dok je broj parametara k = 6; što
zadovoljava uvjet J < k, pa moµzemo izraµcunati vektor nepodudarnosti
koji ´ce u našem primjeru biti
2 3
2 3 410:81 2 3 2 3
0 1 0 0 0 0 6 7 0 33: 75
6 0 0 1 0 0 0 7 6 33:75 7 6 0 7 6 3: 23 7
6 76 3:23 7 6 7 6 7
6
m = Rb q = 6 0 0 0 1 0 0 7 6 7 6 7 6 7 6 7:
9:71 7 6 0 7=6 9: 71 7
4 0 0 0 0 1 0 56 7 4 0 5 4 31: 57 5
4 31:57 5
0 0 0 0 0 1 0 38: 39
38:39

Vektor nepodudarnosti prikazuje razliku izme†u vrijednosti parameta-


ra uzorka i vrijednosti koje testiramo. Budu´ci da u našem primjeru
testiramo hipotezu da su populacijski parametri vezani za nezavisne

53
varijable jednaki nula, vektor nepodudarnosti svodi se na vrijednosti
procijenjenih parametara na temelju uzorka koji su vezani za neza-
visne varijable. Što su ve´ce, u apsolutnoj veliµcini, vrijednosti vektora
nepodudarnosti, lakše ´ce biti odbaciti nul hipotezu. Kada znamo da je
procijenjena varijanca populacije našeg modela s2 = 358:35; i da je
simetriµcna matrica
2 3
73:9891 9:4129 0:2885 0:1717 0:2869 1:2070
6 9:4129 1:9059 0:0182 0:0049 0:0404 0:1452 7
6 7
1 6 0:2885 0:0182 0:0027 0:0019 0:0004 0:0030 7
X0 X =66 0:1717
7;
7
6 0:0049 0:0019 0:0015 0:0003 0:0014 7
4 0:2869 0:0404 0:0004 0:0003 0:0038 0:0100 5
1:2070 0:1452 0:0030 0:0014 0:0100 0:3251

imamo sve elemente za izraµcunavanje F vrijednosti pomo´cu jednadµzbe


n h i o 1
m0 R s2 (X0 X) 1 R0 m
F = = 3569:1:
J

b)
H0 : 1 = 15 (3.53)
nasuprot H1 : 1 6= 15. U prethodnom smo poglavlju vidjeli da hi-
poteze nad jednim parametrom testiramo t-testom. F -test je op´cenit,
stoga, osim testiranja nad više parametara, dopušta nam testiranje i
nad jednim parametrom. Obje metode morale bi dovesti do istog za-
kljuµcka. Ako gornju hipotezu testiramo pomo´cu t-testa imamo
b1 1 33:75 ( 15)
t1 = = = 0:71746 :
sd (b1 ) 26:134 (p=0:4818)

Ograniµceni model bit ´ce

y = 0 15x1 + 2 x2 + 3 x3 + 4 x4 + 5 x5
(y + 15x1 ) = 0 + 2 x2 + 3 x3 + 4 x4 + 5 x5

koji procijenjen izgleda

R2 = 0:9989
(y + 15x1 ) = 318:21+ 3:05 x2 + 9:76 x3 31:17 x4 + 36:97 x5 :
(98:061) (0:945) (0:715) (1:008) (10:478) RSSR = 6993:03

Prema tome F -test, kojim testiramo hipotezu 3.53, bit ´ce


(RSSR RSSU R ) =J (6993:03 6808:58) =1
F = = = 0:514 73 :
RSSU R = (n k) 6808:58=19 (p=0:4818)

Jasno je da t i F vrijednosti nisu iste, budu´ci da proizlaze iz razliµcitih


distribucija. Me†utim, toµcne razine znaµcajnosti testa p su identiµcne u

54
oba sluµcaja, p = 0:4818, što upu´cuje na identiµcan statistiµcki zakljuµcak,
tj. da ne moµzemo odbaciti nul hipotezu. Waldovim kriterijem moµzemo
testirati hipotezu 3.53 na temelju matrica ograniµcenja

R= 0 1 0 0 0 0 , q= 15

koje daju vektor nepodudarnosti m = 18: 75. Kada ukljuµcimo ove


vrijednosti u jednadµzbu 3.49 dobijemo vrijednost F = 0:514 73; koja je
istovjetna F vrijednosti dobivenu prethodnom metodom (RSS).

c)
H0 : 4 + 5 =0 (3.54)
nasuprot hipotezi H1 : 4 + 5 6= 0. Iz gornje jednadµzbe slijedi da je
4 = 5 ili 5 = 4 . Neovisno o tome koristimo li za ograniµcenje
modela 3.50 jednakost 4 = 5 ili 5 = 4 , moramo dobiti istu
vrijednost RSSR . Ako koristimo 4 = 5 ; imamo

y = 0 + 1 x1 + 2 x2 + 3 x3 5 x4 + 5 x5
= 0 + 1 x1 + 2 x2 + 3 x3 + 5 (x5 x4 )

i kada procijenimo parametre dobijemo ograniµceni model

R2 = 0:9989
y = 392:81 31:70 x1 + 3:30 x2 + 9:74 x3 +31:84 (x5 x4 ) :
(157:61) (25:508) (0:970) (0:714) (1:058) RSSR = 6942:08

Ako koristimo 5 = 4 imamo

y = 0 + 1 x1 + 2 x2 + 3 x3 + 4 x4 4 x5
= 0 + 1 x1 + 2 x2 + 3 x3 + 4 (x4 x5 )

i kada procijenimo parametre modela dobijemo ograniµceni model

R2 = 0:9989
y = 392:81 31:70 x1 + 3:30 x2 + 9:74 x3 31:84 (x4 x5 )
(157:61) (25:508) (0:970) (0:714) (1:058) RSSR = 6942:08

s identiµcnim RSSR . Stoga, neovisno o jednakosti koju koristimo za


ograniµcenje modela, dobijemo istu F vrijednost
(RSSR RSSU R ) =J (6942:08 6808:58) =1
F = = = 0:372 6 :
RSSU R = (n k) (6808:58) =19 (p=0:5489)

Iz razine znaµcanost testa p = 0:5489 zakljuµcujemo da ne moµzemo odba-


citi ovu hipotezu. Interesantno je primijetiti da pri testiranju ove hi-
poteze, iako se u hipotezi pojavljuju dva parametra, imamo samo jedno
ograniµcenje. Jedno ograniµcenje bilo bi i kada bismo testirali hipotezu:
H0 : 1 + 2 2 4 + 5 = 0, unatoµc tome što se pojavljuju 4 para-
metra, dok s druge strane, ako npr. testiramo H0 : 1 = 0; 4 = 30;

55
imamo dva ograniµcenja. Znaµci, pri raµcunanju broja ograniµcenja nije
vaµzan broj parametara koji se pojavljuje u hipotezi ve´c broj jednadµz-
bi. Ako µzelimo dobiti F vrijednost pomo´cu Waldovog kriterija matrice
ograniµcenja, kojima opisujemo hipotezu 3.54, glase

R= 0 0 0 0 1 1 , q=0

koje daju vrijednost m =6:8241 i F = 0:3726; identiµcnu vrijednost


koju smo dobili i metodom usporedbe RSS ograniµcenog i neograniµcenog
modela.

d)
H0 : 1 = 4; 2 = 3; 4 + 5 =0 (3.55)
nasuprot alternativnoj hipotezi H1 : 1 6= 4 ; 2 6= 3; 4 + 5 6= 0. Ka-
da imamo skup linearnih ograniµcenja, (kao u ovom primjeru) supstitu-
cija tih ograniµcenja u neograniµceni model bit ´ce sloµzen posao da bismo
dobili ograniµceni model na temelju kojeg moµzemo izraµcunati RSSR ,
dok ´ce to isto matriµcnom metodom, na temelju Waldovog kriterija, bi-
ti lakše izvedivo. Matrice ograniµcenja za testiranje gornje hipoteze bit
´ce 2 3 2 3
0 1 0 0 1 0 0
R =4 0 0 1 0 0 0 5 , q=4 3 5
0 0 0 0 1 1 0
koje daju vektor nepodudarnosti
2 3
2:1789
m =4 0:2314 5 :
6:8241

Na temelju jednadµzbe 3.49 za broj ograniµcenja J = 3 dobit ´cemo F


vrijednost od 0:1578 kojoj odgovara razina znaµcajnosti testa p = 0:9233.
Drugim rijeµcima ovu hipotezu ne moµzemo odbaciti.

56
Dodatak A

Izvodi i dokazi

A.1 Izvod parametara modela s jednom nezavis-


nom varijablom metodom najmanjih kvadra-
ta

Za model
yi = b0 + b1 xi + ei (A.1)
P
treba izabrati parametre b0 i b1 tako da minimiziraju e2i : Da P
bi se dobili
parametri s tim svojstvima, mora se parcijalno derivirati izraz e2i po b0
i b1 i izjednaµciti prve derivacije s nulom kako bi se dobili ekstremi funkcija
(minimum)

@ P 2 @ P P
ei = (yi b0 b1 xi )2 = 2 (yi b0 b1 xi ) = 0 (A.2)
@b0 @b0

@ P 2 @ P P
ei = (yi b0 b1 xi )2 = 2 xi (yi b0 b1 xi ) = 0: (A.3)
@b1 @b1
Ako jednadµzbe A.2 i A.3 podijelimo s 2 i napišemo u obliku tzv. normal-
nih jednadµzbi, imamo
P P
yi = b0 n + b1 xi (A.4)
P P P 2
xi yi = b0 xi + b1 xi : (A.5)

Sada
P moµzemo simultano riješiti po b0 i b1 tako da jednadµzbu A.4 pomnoµzimo
s xi ; a jednadµzbu A.5 s n

P P P P
xi yi = b0 n xi + b1 ( xi )2 (A.6)
P P P
n xi yi = b0 n xi + b1 n x2i : (A.7)

57
Oduzimanjem jednadµzbe A.6 od jednadµzbe A.7 dobijemo
P P P h P P i
n xi yi xi yi = b1 n x2i ( xi )2 (A.8)

iz µcega slijedi P P P
n xi yi xi yi
b1 = P 2 P 2 : (A.9)
n xi ( xi )
Jednadµzba A.9 moµze se jednostavnije napisati, ako pretpostavimo speci-
jalni sluµcaj da je sredina uzoraka jednaka nuli. U tom specijalnom sluµcaju
moµzemo dobiti koe…cijent smjera regresijskog pravca (b1 ) tako da brojnik i
nazivnik izraza A.9 podijelimo s n2
P P P P
xi yi xi yi xi yi
n n n xy
b1 = P P 2 = Pn : (A.10)
x2i x2i
xi
n x2
n n

Budući da u našem specijalnom sluµcaju po pretpostavci vrijedi x = y = 0


jednadµzba A.10 postaje
P
xi y i P
n xi yi
b1 = P = P 2 : (A.11)
x2i xi
n

Pojednostavljena jednadµzba A.11 vrijedi samo za specijalni sluµcaj kada


varijabla x i varijabla y imaju sredinu nula. Me†utim, bilo koju varijablu
moµzemo transformirati tako da ima sredinu nula, ako je izrazimo u njezinoj
devijacijskoj formi1
x
~i = xi x y~ = yi y:
Ovom transformacijom paralelno pomiµcemo regresijski pravac na ishodište
koordinatnog sustava mijenjajući odsjeµcak na ordinati, ali ostavljajući nagib
pravca nepromijenjenim, stoga se koe…cijent nagiba regresijskog pravca b1
moµze izraziti u devijacijskoj formi varijabli
P P
(xi x) (yi y) x
~i y~i
b1 = P 2 = P 2 : (A.12)
(xi x) x
~i

Kada imamo b1 ; iz jednadµzbe A.4 jednostavno moµzemo dobiti


P P
yi xi
b0 = b1 = y b1 x: (A.13)
n n

P P P
1 e
x (xi x) xi
Dokaz: xe= n i = n
= n
x=x x = 0; vidi Svojstvo B.4. operatora
zbrajanja u Dodatku B.1.

58
Dodatak B

Matematika
P
B.1 Neka svojstva operatora zbrajanja
P
Operator zbrajanja vrijednosti varijable x
n
X
xi = x1 + x2 + + xn
i=1

ima sljedeća svojstva:


Svojstvo 1
n
X n
X
kxi = k xi (B.1)
i=1 i=1
gdje je k konstanta jer

n
X
kxi = kx1 + kx2 + + kxn
i=1
n
X
= k (x1 + x2 + + xn ) = k xi :
i=1

Svojstvo 2
n
X n
X n
X
(xi + yi ) = xi + yi (B.2)
i=1 i=1 i=1
zato jer
n
X
(xi + yi ) = x1 + y1 + x2 + y2 + + xn + yn
i=1
= (x1 + x2 + + xn ) + (y1 + y2 + + yn )
Xn n
X
= xi + yi :
i=1 i=1

59
Svojstvo 3
n
X
k =k+k+ + k = kn (B.3)
i=1

Svojstvo 4
n
X
(xi x) = 0 (B.4)
i=1
1 Pn
gdje je x = n i=1 xi .

Dokaz.
Pn Pn
i=1 (xi x) i=1 xi nx
=
n n n
n
X
1
= xi x=x x=0
n
i=1

iz µcega slijedi
Pn n
X
i=1 (xi x)
= 0 () (xi x) = 0:
n
i=1

60
Dodatak C

Statistika

C.1 Distribucije vjerojatnosti izvedene iz normal-


ne distribucije
Teorem C.1 Ako su z1 ; z2 ; : : : ; zn normalno i nezavisno distribuirane
P slu-
µcajne varijable takve da zi N i ; 2i , tada je linearna kombinacija ki zi ;
gdje su kiPkonstante koje nisu P sve nula, tako†er normalno distribuirana sa
sredinom ki i i varijancom ki2 2i :

Teorem C.2 Ako su z1 ; z2 ; : : : ; zn normalno i zavisno distribuirane sluµ


Pcajne
varijable takve da zi 2
N i ; i , tada je linearna kombinacija ki zi ;
gdje su kiPkonstante koje nisu sve P 2 2nula, tako†er
P normalno distribuirana sa
sredinom ki i i varijancom ki i + 2 ki kj cov (xi ; xj ) :

Teorem C.3 Ako su z1 ; z2 ; : : : ; zn normalno i nezavisno distribuirane slu-


µcajneP
varijable takve da zi N (0; 1), tj. standardizirane normalne varijable,
tada ni=1 zi2 ima 2 distribuciju s n stupnjeva slobode.

Teorem C.4 Ako su x1 ; x2 ; : : : ; xn nezavisno distribuirane sluµcajne


P varija-
ble koje imaju 2 distribuciju
P s n i stupnjeva slobode, tada zbroj xi ima
tako†er 2 distribuciju sa ni stupnjeva slobode.

Teorem C.5 Ako je z standardizirana normalna varijabla [z1 N (0; 1)] a


x ima 2 distribuciju s n stupnjeva slobode i nezavisna je od z, tada odnos
p z ima Studentovu t distribuciju s n stupnjeva slobode.
x=n

Teorem C.6 Ako su x1 i x2 dvije nezavisne varijable s 2 distribucijom s


odnosnim n1 i n2 stupnjevima slobode, tada odnos xx12 =n1
=n2 ima F distribuciju
s n1 i n2 stupnjeva slobode.

61
Dodatak D

Podaci

D.1

y x1 x2 x3 x4 x5
2835.9 4.49 287.80 496.1 100.00 0.3202
2615.0 4.26 292.12 509.2 112.93 -0.1125
2556.2 3.83 296.12 510.2 115.61 -0.3275
2510.9 3.89 297.14 514.2 117.82 -0.3974
2582.6 3.79 298.66 527.9 119.16 -0.3392
2586.4 3.79 301.11 527.1 119.16 -0.8013
2608.4 3.98 306.48 529.9 119.06 -1.3413
2542.7 3.97 310.93 524.6 119.59 -1.1790
2598.7 4.02 316.30 528.9 120.79 -0.8171
2662.4 3.87 322.14 539.9 122.94 -0.4666
2704.3 3.99 327.57 550.3 124.90 -0.2619
2767.3 3.90 333.33 563.4 127.73 -0.4310
2894.1 3.89 340.24 576.8 129.21 -0.0325
2980.6 3.96 347.41 583.9 129.93 -0.0507
3022.8 4.03 352.85 591.0 130.56 0.3994
3088.2 4.12 359.90 594.4 130.60 0.4184
3207.4 4.18 367.92 603.4 130.60 0.6175
3360.1 4.20 375.92 612.1 130.22 0.7757
3513.9 4.19 383.57 624.9 130.46 0.7226
3641.5 4.17 391.03 634.3 129.69 0.6831
3840.1 4.20 397.53 650.4 128.74 0.7747
3888.3 4.21 404.34 659.6 130.12 0.5136
3920.2 4.25 413.47 671.2 133.57 0.5501
3816.3 4.47 421.96 676.3 138.70 0.7459
3951.2 4.77 430.39 696.5 142.58 0.8152

62
Dodatak E

Statistiµcke tablice

Tablica E.1: Kumulativna površina ispod standardne normalne distribucije


z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
Izvor: Vrijednosti su izračunate koristeći Excel funkciju NORMSDIST

63
Tablica E.2: Jednostrane kritiµcne vrijednosti Studentove t distribucije
®

n¡ k 0.10 0.05 0.25 0.001 0.005


1 3.0777 6.3137 12.7062 31.8210 63.6559
2 1.8856 2.9200 4.3027 6.9645 9.9250
3 1.6377 2.3534 3.1824 4.5407 5.8408
4 1.5332 2.1318 2.7765 3.7469 4.6041
5 1.4759 2.0150 2.5706 3.3649 4.0321
6 1.4398 1.9432 2.4469 3.1427 3.7074
7 1.4149 1.8946 2.3646 2.9979 3.4995
8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
11 1.3634 1.7959 2.2010 2.7181 3.1058
12 1.3562 1.7823 2.1788 2.6810 3.0545
13 1.3502 1.7709 2.1604 2.6503 3.0123
14 1.3450 1.7613 2.1448 2.6245 2.9768
15 1.3406 1.7531 2.1315 2.6025 2.9467
16 1.3368 1.7459 2.1199 2.5835 2.9208
17 1.3334 1.7396 2.1098 2.5669 2.8982
18 1.3304 1.7341 2.1009 2.5524 2.8784
19 1.3277 1.7291 2.0930 2.5395 2.8609
20 1.3253 1.7247 2.0860 2.5280 2.8453
21 1.3232 1.7207 2.0796 2.5176 2.8314
22 1.3212 1.7171 2.0739 2.5083 2.8188
23 1.3195 1.7139 2.0687 2.4999 2.8073
24 1.3178 1.7109 2.0639 2.4922 2.7970
25 1.3163 1.7081 2.0595 2.4851 2.7874
26 1.3150 1.7056 2.0555 2.4786 2.7787
27 1.3137 1.7033 2.0518 2.4727 2.7707
28 1.3125 1.7011 2.0484 2.4671 2.7633
29 1.3114 1.6991 2.0452 2.4620 2.7564
30 1.3104 1.6973 2.0423 2.4573 2.7500
40 1.3031 1.6839 2.0211 2.4233 2.7045
60 1.2958 1.6706 2.0003 2.3901 2.6603
120 1.2886 1.6576 1.9799 2.3578 2.6174
1 1.2816 1.6449 1.9600 2.3264 2.5758

Izvor: Vrijednosti su izračunate koristeći Excel funkciju TINV

64
Tablica E.3: Jednostrane kritiµcne vrijednosti F distribucije za 5 posto znaµcajnosti
n1
n2 1 2 3 4 5 6 7 8 9 10 12 15 20 25
1 161.446 199.499 215.707 224.583 230.160 233.988 236.767 238.884 240.543 241.882 243.905 245.949 248.016 249.260
2 18.513 19.000 19.164 19.247 19.296 19.329 19.353 19.371 19.385 19.396 19.412 19.429 19.446 19.456
3 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.785 8.745 8.703 8.660 8.634
4 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964 5.912 5.858 5.803 5.769
5 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735 4.678 4.619 4.558 4.521
6 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060 4.000 3.938 3.874 3.835
7 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637 3.575 3.511 3.445 3.404
8 5.318 4.459 4.066 3.838 3.688 3.581 3.500 3.438 3.388 3.347 3.284 3.218 3.150 3.108
9 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.179 3.137 3.073 3.006 2.936 2.893
10 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 3.020 2.978 2.913 2.845 2.774 2.730
11 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854 2.788 2.719 2.646 2.601
12 4.747 3.885 3.490 3.259 3.106 2.996 2.913 2.849 2.796 2.753 2.687 2.617 2.544 2.498
13 4.667 3.806 3.411 3.179 3.025 2.915 2.832 2.767 2.714 2.671 2.604 2.533 2.459 2.412
14 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.646 2.602 2.534 2.463 2.388 2.341
15 4.543 3.682 3.287 3.056 2.901 2.790 2.707 2.641 2.588 2.544 2.475 2.403 2.328 2.280

65
16 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.538 2.494 2.425 2.352 2.276 2.227
17 4.451 3.592 3.197 2.965 2.810 2.699 2.614 2.548 2.494 2.450 2.381 2.308 2.230 2.181
18 4.414 3.555 3.160 2.928 2.773 2.661 2.577 2.510 2.456 2.412 2.342 2.269 2.191 2.141
19 4.381 3.522 3.127 2.895 2.740 2.628 2.544 2.477 2.423 2.378 2.308 2.234 2.155 2.106
20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348 2.278 2.203 2.124 2.074
21 4.325 3.467 3.072 2.840 2.685 2.573 2.488 2.420 2.366 2.321 2.250 2.176 2.096 2.045
22 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297 2.226 2.151 2.071 2.020
23 4.279 3.422 3.028 2.796 2.640 2.528 2.442 2.375 2.320 2.275 2.204 2.128 2.048 1.996
24 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.355 2.300 2.255 2.183 2.108 2.027 1.975
25 4.242 3.385 2.991 2.759 2.603 2.490 2.405 2.337 2.282 2.236 2.165 2.089 2.007 1.955
26 4.225 3.369 2.975 2.743 2.587 2.474 2.388 2.321 2.265 2.220 2.148 2.072 1.990 1.938
27 4.210 3.354 2.960 2.728 2.572 2.459 2.373 2.305 2.250 2.204 2.132 2.056 1.974 1.921
28 4.196 3.340 2.947 2.714 2.558 2.445 2.359 2.291 2.236 2.190 2.118 2.041 1.959 1.906
29 4.183 3.328 2.934 2.701 2.545 2.432 2.346 2.278 2.223 2.177 2.104 2.027 1.945 1.891
30 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165 2.092 2.015 1.932 1.878
31 4.160 3.305 2.911 2.679 2.523 2.409 2.323 2.255 2.199 2.153 2.080 2.003 1.920 1.866
32 4.149 3.295 2.901 2.668 2.512 2.399 2.313 2.244 2.189 2.142 2.070 1.992 1.908 1.854
33 4.139 3.285 2.892 2.659 2.503 2.389 2.303 2.235 2.179 2.133 2.060 1.982 1.898 1.844
34 4.130 3.276 2.883 2.650 2.494 2.380 2.294 2.225 2.170 2.123 2.050 1.972 1.888 1.833
35 4.121 3.267 2.874 2.641 2.485 2.372 2.285 2.217 2.161 2.114 2.041 1.963 1.878 1.824
36 4.113 3.259 2.866 2.634 2.477 2.364 2.277 2.209 2.153 2.106 2.033 1.954 1.870 1.815
37 4.105 3.252 2.859 2.626 2.470 2.356 2.270 2.201 2.145 2.098 2.025 1.946 1.861 1.806
38 4.098 3.245 2.852 2.619 2.463 2.349 2.262 2.194 2.138 2.091 2.017 1.939 1.853 1.798
39 4.091 3.238 2.845 2.612 2.456 2.342 2.255 2.187 2.131 2.084 2.010 1.931 1.846 1.791
40 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077 2.003 1.924 1.839 1.783
Izvor: Vrijednosti su izračunate koristeći Excel funkciju FINV. n 1=stupnjevi slobode brojnika, n 2=stupnjevi slobode nazivnika
Tablica E.4: Jednostrane kritiµcne vrijednosti F distribucije za 1 posto znaµcajnosti
n1
n2 1 2 3 4 5 6 7 8 9 10 12 15 20
1 4052.185 4999.340 5403.534 5624.257 5763.955 5858.950 5928.334 5980.954 6022.397 6055.925 6106.682 6156.974 6208.662
2 98.502 99.000 99.164 99.251 99.302 99.331 99.357 99.375 99.390 99.397 99.419 99.433 99.448
3 34.116 30.816 29.457 28.710 28.237 27.911 27.671 27.489 27.345 27.228 27.052 26.872 26.690
4 21.198 18.000 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546 14.374 14.198 14.019
5 16.258 13.274 12.060 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.888 9.722 9.553
6 13.745 10.925 9.780 9.148 8.746 8.466 8.260 8.102 7.976 7.874 7.718 7.559 7.396
7 12.246 9.547 8.451 7.847 7.460 7.191 6.993 6.840 6.719 6.620 6.469 6.314 6.155
8 11.259 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.911 5.814 5.667 5.515 5.359
9 10.562 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.351 5.257 5.111 4.962 4.808
10 10.044 7.559 6.552 5.994 5.636 5.386 5.200 5.057 4.942 4.849 4.706 4.558 4.405
11 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539 4.397 4.251 4.099
12 9.330 6.927 5.953 5.412 5.064 4.821 4.640 4.499 4.388 4.296 4.155 4.010 3.858
13 9.074 6.701 5.739 5.205 4.862 4.620 4.441 4.302 4.191 4.100 3.960 3.815 3.665
14 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.140 4.030 3.939 3.800 3.656 3.505
15 8.683 6.359 5.417 4.893 4.556 4.318 4.142 4.004 3.895 3.805 3.666 3.522 3.372

66
16 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.890 3.780 3.691 3.553 3.409 3.259
17 8.400 6.112 5.185 4.669 4.336 4.101 3.927 3.791 3.682 3.593 3.455 3.312 3.162
18 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.597 3.508 3.371 3.227 3.077
19 8.185 5.926 5.010 4.500 4.171 3.939 3.765 3.631 3.523 3.434 3.297 3.153 3.003
20 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.457 3.368 3.231 3.088 2.938
21 8.017 5.780 4.874 4.369 4.042 3.812 3.640 3.506 3.398 3.310 3.173 3.030 2.880
22 7.945 5.719 4.817 4.313 3.988 3.758 3.587 3.453 3.346 3.258 3.121 2.978 2.827
23 7.881 5.664 4.765 4.264 3.939 3.710 3.539 3.406 3.299 3.211 3.074 2.931 2.780
24 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168 3.032 2.889 2.738
25 7.770 5.568 4.675 4.177 3.855 3.627 3.457 3.324 3.217 3.129 2.993 2.850 2.699
26 7.721 5.526 4.637 4.140 3.818 3.591 3.421 3.288 3.182 3.094 2.958 2.815 2.664
27 7.677 5.488 4.601 4.106 3.785 3.558 3.388 3.256 3.149 3.062 2.926 2.783 2.632
28 7.636 5.453 4.568 4.074 3.754 3.528 3.358 3.226 3.120 3.032 2.896 2.753 2.602
29 7.598 5.420 4.538 4.045 3.725 3.499 3.330 3.198 3.092 3.005 2.868 2.726 2.574
30 7.562 5.390 4.510 4.018 3.699 3.473 3.305 3.173 3.067 2.979 2.843 2.700 2.549
31 7.530 5.362 4.484 3.993 3.675 3.449 3.281 3.149 3.043 2.955 2.820 2.677 2.525
32 7.499 5.336 4.459 3.969 3.652 3.427 3.258 3.127 3.021 2.934 2.798 2.655 2.503
33 7.471 5.312 4.437 3.948 3.630 3.406 3.238 3.106 3.000 2.913 2.777 2.634 2.482
34 7.444 5.289 4.416 3.927 3.611 3.386 3.218 3.087 2.981 2.894 2.758 2.615 2.463
35 7.419 5.268 4.396 3.908 3.592 3.368 3.200 3.069 2.963 2.876 2.740 2.597 2.445
36 7.396 5.248 4.377 3.890 3.574 3.351 3.183 3.052 2.946 2.859 2.723 2.580 2.428
37 7.374 5.229 4.360 3.873 3.558 3.334 3.167 3.036 2.930 2.843 2.707 2.564 2.412
38 7.353 5.211 4.343 3.858 3.542 3.319 3.152 3.021 2.915 2.828 2.692 2.549 2.397
39 7.333 5.194 4.327 3.843 3.528 3.305 3.137 3.006 2.901 2.814 2.678 2.535 2.382
40 7.314 5.178 4.313 3.828 3.514 3.291 3.124 2.993 2.888 2.801 2.665 2.522 2.369
Izvor: Vrijednosti su izračunate koristeći Excel funkciju FINV. n 1=stupnjevi slobode brojnika, n 2=stupnjevi slobode nazivnika
Tablica E.5: Jednostrane kritiµcne vrijednosti 2 distribucije
®
n¡ k 0.995 0.990 0.975 0.95 0.9 0.5 0.1 0.05 0.025 0.01 0.005

1 0.000 0.000 0.001 0.004 0.016 0.455 2.706 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 1.386 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 2.366 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 3.357 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 4.351 9.236 11.070 12.832 15.086 16.750
6 0.676 0.872 1.237 1.635 2.204 5.348 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 6.346 12.017 14.067 16.013 18.475 20.278
8 1.344 1.647 2.180 2.733 3.490 7.344 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 8.343 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 9.342 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 10.341 17.275 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 11.340 18.549 21.026 23.337 26.217 28.300
13 3.565 4.107 5.009 5.892 7.041 12.340 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 13.339 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 14.339 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 15.338 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 16.338 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 17.338 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 18.338 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 19.337 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 20.337 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.041 21.337 30.813 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 22.337 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 23.337 33.196 36.415 39.364 42.980 45.558
25 10.520 11.524 13.120 14.611 16.473 24.337 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 25.336 35.563 38.885 41.923 45.642 48.290
27 11.808 12.878 14.573 16.151 18.114 26.336 36.741 40.113 43.195 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 27.336 37.916 41.337 44.461 48.278 50.994
29 13.121 14.256 16.047 17.708 19.768 28.336 39.087 42.557 45.722 49.588 52.335
30 13.787 14.953 16.791 18.493 20.599 29.336 40.256 43.773 46.979 50.892 53.672
31 14.458 15.655 17.539 19.281 21.434 30.336 41.422 44.985 48.232 52.191 55.002
32 15.134 16.362 18.291 20.072 22.271 31.336 42.585 46.194 49.480 53.486 56.328
33 15.815 17.073 19.047 20.867 23.110 32.336 43.745 47.400 50.725 54.775 57.648
34 16.501 17.789 19.806 21.664 23.952 33.336 44.903 48.602 51.966 56.061 58.964
35 17.192 18.509 20.569 22.465 24.797 34.336 46.059 49.802 53.203 57.342 60.275
36 17.887 19.233 21.336 23.269 25.643 35.336 47.212 50.998 54.437 58.619 61.581
37 18.586 19.960 22.106 24.075 26.492 36.336 48.363 52.192 55.668 59.893 62.883
38 19.289 20.691 22.878 24.884 27.343 37.335 49.513 53.384 56.895 61.162 64.181
39 19.996 21.426 23.654 25.695 28.196 38.335 50.660 54.572 58.120 62.428 65.475
40 20.707 22.164 24.433 26.509 29.051 39.335 51.805 55.758 59.342 63.691 66.766
Izvor: Vrijednosti su izračunate koristeći Excel funkciju CHIINV.

67
Bibliogra…ja

[1] Baltagi, B.H., (2011), Econometrics, peto izdanje, Springer Text in Bu-
siness and Economics.

[2] Davidson, R., J.G. MacKinnon, (2004), Econometric Theory and Met-
hods, Oxford University Press, New York.

[3] Greene, W.H., (2003), Econometric Analysis, peto izdanje, Prentice Hall,
New Jersey.

[4] Gujarati, D.N., (2004), Basic Econometrics, µcetvrto izdanje, McGraw-


Hill, New York.

[5] Hayashi, F., (2000), Econometrics, Princenton University Press, New


Jersey.

[6] Kennedy, P., (2003), A Guide to Econometrics, peto izdanje, MIT Press,
Cambridge, Massachusetts.

[7] Pindyck R.S., D.C. Rubenfeld, (1998), Econometric Models and Econo-
mic Forecasts, µcetvrto izdanje, McGraw-Hill, New York.

[8] Verbeek, M., (2005), A Guide to Modern Econometrics, drugo izdanje,


John Wiley & sons, West Sussex, England.

[9] Wooldridge, J., (2006), Introductory Econometrics: A Modern Approach,


treće izdanje, South-Western Pub.

68

You might also like