You are on page 1of 75

Sveuilite Jurja Dobrile u Puli

Odjel za ekonomiju i turizam


Dr. Mijo Mirkovi

Alen Belullo

UVOD U EKONOMETRIJU

Sveuilite Jurja Dobrile u Puli


Odjel za ekonomiju i turizam
Dr. Mijo Mirkovi

UVOD U EKONOMETRIJU
Sveuilini udbenik

Autor: Doc. dr. sc. Alen Belullo

Copyright Belullo, Alen


Nakladnik:
Sveuilite Jurja Dobrile u Puli
Odjel za ekonomiju i turizam
Dr. Mijo Mirkovi

Za nakladnika:
Prof. dr. sc. Robert Matijai, rektor

Recenzenti:
Dr. sc. Goran Buturac
Prof. dr. sc. Ante Rozga
Lektura:
Marija Belullo, prof.

Objavljivanje ove knjige odobrio je Senat Sveuilita Jurja Dobrile u Puli


odlukom Klasa: 003-08/11-02/70-01, Ur. broj: 380/11-01/-1 od 15. prosinca
2011. godine sukladno Zakljuku Povjerenstva za izdavaku djelatnost
Sveuilita Jurja Dobrile u Puli od 28. studenog 2011. godine.

UVOD U EKONOMETRIJU/ Alen Belullo. Pula:


Sveuilite Jurja Dobrile u Puli, Odjel za ekonomiju i
turizam Dr. Mijo Mirkovi, 2011.
Bibliografija.
ISBN 978-953-7498-50-4
1. Belullo, A.

Sadrzaj
Predgovor

iii

1 Uvod u regresijsku analizu


1.1 Pojam ekonometrije . . . . . . . . . . . . . . . . . . . . . .
1.2 Koraci u ekonometrijskoj analizi . . . . . . . . . . . . . . .
1.2.1 Odreivanje teorije ili hipoteze . . . . . . . . . . . .
1.2.2 Specikacija matematickog modela . . . . . . . . . .
1.2.3 Specikacija ekonometrijskog modela . . . . . . . . .
1.2.4 Prikupljanje podataka . . . . . . . . . . . . . . . . .
1.2.5 Procjena ekonometrijskog modela . . . . . . . . . . .
1.2.6 Testiranje hipoteza . . . . . . . . . . . . . . . . . . .
1.2.7 Prognoziranje i predvianje . . . . . . . . . . . . . .
1.3 Regresijska funkcija populacije i regresijska funkcija uzorka

.
.
.
.
.
.
.
.
.
.

1
1
2
2
2
3
5
9
10
10
11

2 Parametri modela dobiveni metodom najmanjih kvadrata 18


2.1 Procjena parametara . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Svojstva regresijskog pravca . . . . . . . . . . . . . . . . . . . 26
2.3 Svojstva procjenitelja . . . . . . . . . . . . . . . . . . . . . . 28
3 Pokazatelji kvalitete regresije
3.1 Koecijent determinacije . . . . . . . . . . . . .
3.2 Znacajnost procjenitelja . . . . . . . . . . . . .
3.2.1 Standardna greka procjenitelja . . . . .
3.2.2 Testiranje hipoteza nad procjeniteljima

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

32
33
39
39
42

A Izvodi i dokazi
57
A.1 Izvod parametara modela s jednom nezavisnom varijablom
metodom najmanjih kvadrata . . . . . . . . . . . . . . . . . . 57
B Matematika
59
P
B.1 Neka svojstva operatora zbrajanja
. . . . . . . . . . . . . . 59

C Statistika
61
C.1 Distribucije vjerojatnosti izvedene iz normalne distribucije . . 61
D Podaci
62
D.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
E Statisticke tablice

63

ii

Predgovor
Ovaj udzbenik nastaje iz potrebe da studenti lake shvate teorijske pretpostavke na kojima se temelji metoda najmanjih kvadrata. Cilj je bio napisati
rad koji polazi od osnovnih ekonometrijskih pojmova, tj. namijenjen je citatelju koji nema nikakvog predznanja iz tog podrucja, ali je ipak pisan u
strogoj matematickoj formi, kako bi se izbjegle zamke nedorecenosti, u koje
upadaju mnogi udzbenici iz ekonometrije, pisani za pocetnu razinu. Kako ne bi prosjecnom citatelju opterecivali tekst slozeniji matematicki dokazi
i osnove teorije distribucije vjerojatnosti, dani su u dodacima. Matematicka notacija konzistentna je kroz cijeli rad (npr. populacijske vrijednosti
su uvijek oznacene grckim alfabetom, dok vrijednosti uzoraka uvijek latinskom abecedom, velikim podebljanim slovima oznacene su matrice, malim
podebljanim slovima vektori, nepodebljani izrazi su skalari, varijable u devijacijskoj formi su uvijek prikazane tildom itd.).
U knjizi se nadalje, zbog potreba poopcavanja, paralelno koristi obicna
algebra, karakteristicna za pocetnicke udzbenika, i matricna algebra, karakteristicna za napredne udzbenike iz ekonometrije. Na taj se nacin pokuao
premostiti jaz, koji postoji izmeu pocetnih udzbenika i naprednih udzbenika iz ekonometrije, tj. da se zorno prikaze na koji se nacin mogu poopciti
obicne jednadzbe kojima se prikazuju jednostavniji modeli (npr. modeli s
jednom nezavisnom varijablom) putem matricnog zapisa istih ekonometrijskih izraza koji vrijede za slozenije modele (npr. s k 1 nezavisnih varijabli).
Na taj se nacin moze dobiti dojam elegancije i kompaktnosti matricnog zapisa, a koritenjem matricno orijentiranih softwarea brzo i ekasno rjeavati
zadatke prikazane u knjizi.
U knjizi su prikazani mnogobrojni primjeri i zadaci te su dani svi podaci potrebni citatelju da bi mogao sam jednostavno reproducirati prikazane
dobivene rezultate.
Osim studentima, koji sluaju predmet Ekonometrija, Analiza vremenskih nizova, Ekonometrija II, namijenjen je i istrazivacima koji zele dobiti
cvrste temelje, kako bi shvatili samu bit regresijske analize pomocu metode
najmanjih kvadrata. to se tice potrebnog predznanja, da bi se knjiga mogla
lako citati, potrebno je samo osnovno znanje iz matricne algebre.
Knjiga je podijeljena u tri poglavlja: u prvom dijelu objanjava se poiii

jam ekonometrije, koraci u ekonometrijskoj analizi te regresijska funkcija


populacije i uzorka; u drugom dijelu objanjava se na koji se nacin dobivaju parametri metodom najmanjih kvadrata, svojstva regresijskog pravaca i
procjenitelja, da bi se u zadnjem dijelu prikazali pokazatelji kvalitete regresije.
Buduci da je ova knjiga proizala iz dijelova priprema za predavanja iz
predmeta Ekonometrija zelio bih se zahvaliti svim studentima koji su svojim
komentarima i pitanjima tijekom predavanja doprinijeli da se knjiga priblizi
njihovim potrebama i boljem razumijevanju gradiva, kao i svim onim studentima koji su uspjeno detektirali tiskarske greke u radnim verzijama
ovog rada, jer sam svjestan da je rat s tiskarskim grekama bespovratno
izgubljen, ali poneka je bitka dobivena, zahvaljujuci njima. Nadalje, posebno bih se zahvalio profesorici Mariji Buelic i Sanji Blazevic koje su svojom
beskrajnom upornocu i altruizmom doprinijele da ova knjiga uopce ugleda
svjetlost dana. Za tehnicku podrku zahvalio bih se aniju Buricu. Na kraju
volio bih reci jedno veliko hvala blizim clanovima moje obitelji na njihovim
sugestijama i lekturi, te za uvijek prisutnu podrku kada su s dubokim razumijevanjem cesto morali podnositi moja prevrtljiva raspolozenja tijekom
njezinog nastajanja.

iv

Poglavlje 1

Uvod u regresijsku analizu


1.1

Pojam ekonometrije

Ekonometrija doslovno znaci ekonomsko mjerenje. Ekonometriju mozemo


denirati kao znanstvenu disciplinu koja se bavi empirickim dokazivanjem
ekonomskih zakona deniranih u ekonomskoj teoriji. Usko je vezana uz
discipline: ekonomska teorija, matematicka ekonomija i ekonomska
statistika.
Ekonomska teorija postavlja svoje zakone uglavnom na kvalitativnoj razini, tj. odreuje smjer kretanja zavisnosti odreenih ekonomskih pojava,
bez odreivanja velicine i znacajnosti tih veza.
Matematicka ekonomija izrazava ekonomsku teoriju u odreenoj matematickoj formi (jednadzbe), bez osvrtanja na empiricku provjeru tih teorija.
Ekonomska statistika bavi se prikupljanjem, obradom i prezentiranjem
ekonomskih pokazatelja u obliku tablica i slika. Ekonomska statistika ne bavi
se provjerom ekonomskih teorija na temelju tako prikupljenih podataka.
Znaci, ekonometrijom se provjeravaju, koristeci se metodama matematicke ekonomije i podacima dobivenim iz statistike, jesu li valjane ekonomske
teorije za odreeni uzorak (populaciju).
Ekonometriju mozemo podijeliti u dvije glavne skupine: teorijska ekonometrija i primijenjena ekonometrija. Teorijska ekonometrija bavi se
razvijanjem ekonometrijskih metoda, dok se primijenjena ekonometrija bavi
primjenjivanjem ekonometrijskih metoda koje je razvila teorijska ekonometrija na konkretnim ekonomskim problemima.
Teorijska i primijenjena ekonometrija mogu koristiti ili Bayesov ili klasicni pristup statistickom zakljucivanju. Glavna je razlika izmeu ova dva
pristupa u njihovom poimanju vjerojatnosti. Po Bayesovom pristupu vjerojatnost se odnosi na stupanj razumno prihvatljivog uvjerenja; vjerojatnost je
vezana za stupnjeve pouzdanosti koje istrazivac unaprijed ima o nekom empirickom fenomenu (prije samog promatranja podataka). Drugim rijecima
po Bayesu imamo subjektivni pristup konceptu vjerojatnosti. Po klasicnom

pristupu vjerojatnost se odnosi na frekvenciju pojavljivanja odreenog dogaaja u ponovljenim izvlacenjima, ili imamo objektivni pristup konceptu
vjerojatnosti.

1.2

Koraci u ekonometrijskoj analizi

Ekonometrijska analiza slijedi odreen put, a to je:


1. Odreivanje teorije ili hipoteze
2. Specikacija matematickog modela
3. Specikacija ekonometrijskog modela
4. Prikupljanje podataka
5. Procjena ekonometrijskog modela
6. Testiranje hipoteza
7. Predvianje i prognoziranje

1.2.1

Odreivanje teorije ili hipoteze

Svoje teorije i hipoteze ekonometrija uglavnom preuzima, kao to smo rekli,


iz ekonomske teorije. Tako je npr., J. M. Keynes rekao da ako se raspoloziv
dohodak stanovnitva poveca, tada ce se, uz ostale nepromijenjene uvjete,
povecati potronja stanovnitva, ali za manje od povecanja raspolozivog dohotka. Ne govori nam nita u prilog tome koliko ce se potronja povecati za
jedinicno povecanje raspolozivog dohotka, vec nam govori samo o smjeru zavisnog kretanja tih varijabli i da je granicna sklonost potronji stanovnitva
izmeu 0 i 1.

1.2.2

Specikacija matematickog modela

Iako je Keynes pretpostavio pozitivnu vezu izmeu potronje i raspolozivog dohotka, nije specicirao precizni oblik funkcionalne veze izmeu tih
varijabli. Matematicka ekonomija sugerira sljedecu funkcionalnu formu:
y=

1x

0<

gdje:
y = potronja
x = raspoloziv dohodak
0 = autonomna potronja
1 = granicna sklonost potronji

<1

(1.1)

Potronja

y = 0 + 1 x

1
1

Raspoloiv dohodak

Slika 1.1: Deterministicki model

Jednadzba (1.1) govori nam da je potronja linearno ovisna o dohotku jer


imamo linearnu funkciju (polinom prvog stupnja). To je matematicki model
izmeu potronje i dohotka koji se u ekonomiji zove funkcija potronje.
Opcenito modelom zovemo skup matematickih jednadzbi. Jednadzbe ne
moraju biti linearne vec mogu poprimiti razlicite funkcionalne forme (logaritamske, eksponencijalne, itd.). U prikazanom slucaju model cini samo jedna
linearna jednadzba. y i x zovemo varijablama modela. Varijablu x, koja
ne ovisi o drugim varijablama u modelu, zovemo nezavisnom ili egzogenom varijablom, dok varijablu y, koja u naem slucaju ovisi o varijabli x
zovemo zavisnom ili endogenom varijablom. 0 i 1 zovu se parametri
ili koecijenti modela. O vrijednostima parametara ovisi izgled funkcije.
0 odreuje odsjecak na ordinati, koji se u ekonomiji interpretira kao autonomna potronja, dok 1 odreuje nagib ili smjer funkcije, to se u ekonomiji
interpretira kao granicna sklonost potronji.

1.2.3

Specikacija ekonometrijskog modela

Jednadzba 1.1 prikazuje egzaktnu ili deterministicku vezu izmeu varijable x i varijable y. Meutim, veze izmeu ekonomskih varijabli uglavnom
nisu egzaktne stoga se pojavljuje potreba za ukljucivanjem stohastickog elementa " u matematicki model. Ukljucivanjem stohastickog elementa "
matematicki se model 1.1 pretvara u ekonometrijski (stohasticki) mo3

del:
y=

1x

+"

0<

< 1:

(1.2)

Stohasticki element " zovemo i slucajno odstupanje, slucajna greka


ili rezidual.
y = 0 + 1 x

Potronja

Raspoloiv dohodak

Slika 1.2: Ekonometrijski model

Na Slici 1.2 prikazan je ekonometrijski model funkcije potronje. Iz Slike


1.2 vidimo da svaku tocku mozemo odrediti deterministickim dijelom y =
0 + 1 x kojemu dodajemo slucajno odstupanje ". Slucajno odstupanje
moze biti pozitivno (iznad pravca) ili negativno (ispod pravca). Slucajno
odstupanje preuzima na sebe vrijednosti svih varijabli koje su izostavljene
iz modela, a koje utjecu na ponaanje y i greke koje se pojavljuju uslijed
krive funkcionalne forme. Mozemo reci da se slucajna greka " pojavljuje
zbog:
1. Neodreenosti teorije: ekonomska teorija tezi pojednostavljivanju stvarnog svijeta i stoga u teorijske modele ne ulaze sve varijable koje bi
mogle utjecati na y, vec samo one koje se smatraju vaznijima, kako bi
se ekonomski modeli zadrzali jednostavnima.
2. Nedostupnosti podataka: npr. mozemo smatrati da na potronju pojedinaca utjece, osim njihovog raspolozivog dohotka, i njihovo bogatstvo. Dok je raspoloziv dohodak dostupna informacija, bogatstvo je
cesto nedostupan podatak.
4

3. Manje vaznih varijabli : pretpostavimo da, osim raspolozivog dohotka, na potronju utjecu i sljedece varijable: broj djece, spol, vjera,
obrazovanje i zemljopisni polozaj. Moguce je pretpostaviti da je njihov utjecaj na potronju slab, nesustavan i stoga slucajan. Stoga se iz
prakticnih razloga te varijable izostavljaju, a njihov zajednicki utjecaj
na zavisnu varijablu y ulazi u slucajnu greku ".
4. Slucajnosti koje su svojstvene ljudskom ponaanju: kada bismo i uspjeli ukljuciti u model sve relevantne varijable, uvijek postoji u ponaanju pojedinca odreena doza slucajnosti koja se ne moze racionalno
objasniti, ma koliko mi to pokuavali.
5. Loih zamjenskih varijabli : cesto varijable koje predlaze ekonomska
teorija nisu neposredno mjerljive. U poznatoj funkciji potronje Miltona Friedmana permanentna potronja ovisi o permanentnom dohotku.
Meutim, niti je permanentni dohodak, niti je permanentna potronja
neposredno mjerljiva velicina, vec se procjenjuju na temelju njihovih
tekucih vrijednosti. U tom slucaju moze doci do greke u njihovoj procjeni. Ovu ce mjernu greku takoer na sebe preuzeti slucajna greka
".
6. Krive funkcionalne forme: iako smo ispravno u model ukljucili relevantne varijable moguce je da smo pogrijeili u odabiru funkcionalne
forme. Npr. pretpostavimo da je umjesto y = 0 + 1 x + " ispravan
model y = 0 + 1 x + 2 x2 + ". U modelu sa samo dvije varijable lako
je na temelju izgleda dijagrama disperzije odrediti funkcionalnu formu.
Meutim, u modelima s vie nezavisnih varijabli to postaje vrlo teko
jer nije moguce prikazati viestruko dimenzionalni dijagram disperzije.
Greka, koja se pojavljuje uslijed odabira krive funkcionalne forme, uci
ce u slucajnu greku ".

1.2.4

Prikupljanje podataka

Parametre 0 i 1 modela 1.2 procjenjuju se na temelju opazanja varijabli


x i y koji se dobiju iz statistike. Opazanja o varijablama mogu se prikupljati za vremenska razdoblja, pa govorimo o vremenskim nizovima (eng.
time series). Osim toga mogu se prikupljati za pojedince, grupe pojedinaca,
predmete ili za geografska podrucja, pa govorimo o podacima vremenskog
presjeka (eng. cross section). Obje se vrste podataka mogu kombinirati da bi se dobili zdruzeni podaci vremenskih nizova i vremenskih
presjeka (eng. pooled cross sections).
Vremenski nizovi
Vremenski se nizovi sastoje od opazanja jedne ili vie varijabli kroz vrijeme.
Takvi se podaci mogu prikupljati dnevno (npr. cijene dionica), tjedno
5

(npr. ponuda novca), mjesecno (npr. indeks cijena, stopa nezaposlenosti),


kvartalno (npr. BDP), godinje (npr. drzavni proracun), desetogodinje (npr. popis stanovnitva).
Tablica 1.1: Potronja i BDP u Hrvatskoj od 1997. do 2005. godine
Potronja (C)
BDP (Y)
Godina
u milijardama kuna
u milijardama kuna
1997.
79.023
123.811
1998.
82.741
137.604
1999.
83.336
141.579
2000.
109.500
152.519
2001.
99.611
165.639
2002.
100.139
181.231
2003.
115.081
198.422
2004.
122.100
212.826
2005.
130.576
229.031
Izvor: International Financial Statistics (IFS), Meunarodni monetarni fond, veljaa 2007.

U Tablici 1.1 prikazani su podaci o hrvatskoj potronji i BDP-u za razdoblje od 1997. do 2005. godine na temelju kojih mozemo izracunati hrvatsku funkciju potronje. Vidimo da se radi o dva vremenska niza izrazena
na godinjoj frekvenciji. Svi podaci koji ulaze u odreenu ekonometrijsku
analizu moraju biti izrazeni u istoj vremenskoj frekvenciji (svi moraju biti
godinji, kao u gornjem slucaju, kvartalni, itd.) Podatke iz viih frekvencija mozemo pretvoriti u nize frekvencije (npr. kvartalne u godinje)
pomocu prosjeka za varijable koje prikazuju stanja (npr. cijene, kamatnjaci), ili pomocu zbrajanja za varijable koje prikazuju tokove (npr. BDP,
potronja, investicije). S nizih frekvencija na vie frekvencije moguce
je transformirati varijable pomocu statistickih metoda interpolacije (za stanja) i distribucije vrijednosti (za tokove). Vremenske nizove karakteriziraju
trend i sezonska odstupanja (za frekvencije vie od godinjih) a njima
se bavi jedan posebni dio ekonometrije koji se zove Analiza vremenskih
nizova ili Ekonometrija vremenskih nizova. Na slici 1.3 prikazan je
hrvatski BDP izrazen u kvartalima (tromjesecno) gdje se jasno vidi da u
promatranom razdoblju BDP ima znacajan trend rasta i velika sezonska odstupanja; BDP je najveci u 3. kvartalu a najmanji u 1. kvartalu1 . Drugim
rijecima, vremenski nizovi cesto nisu stacionarni procesi2 , a stacionarnost
je jedna od pretpostavki na kojima leze ekonometrijski modeli.
1
Jasno se vidi da je 1995. godine "podbacila" sezona uslijed redarstvenih akcija Bljeska
i Oluje.
2
Kaze se da je vremenski niz stacionaran ako se njegova sredina i varijanca asimptotski
ne mijenjaju tijekom vremena.

BDP
bazni indeks 2000.= 100

150

125

100

75
1993

1995

1997

1999

2001

2003

2005

Slika 1.3: Hrvatski kvartalni BDP od 1993:1-2006:3

Vremenski presjeci
Podaci vremenskog presjeka su podaci jedne ili vie varijabli prikupljeni u
zadanoj vremenskoj tocki. Kada bismo na taj nacin htjeli prikupiti podatke
na temelju kojih bismo mogli procijeniti funkciju potronje u Hrvatskoj,
morali bismo prikupiti npr. opazanja o dohotku i potronji po gradovima ili
zupanijama.
U Tablici 1.2 prikazan je vremenski presjek (za 2004. g.) potronje i
BDP-a za tranzicijske zemlje. Vidimo da se skup opazanja u ovom slucaju
ne sastoji od razlicitih godina, vec od podataka za razlicite zemlje za 2004.
godinu. Ako ne bismo imali na raspolaganju podatke za sve zemlje za 2004.
g., mogli bismo koristiti za neke zemlje i podatke iz 2003. ili 2005. godine, ako smatramo da nije dolo do strukturnih promjena u tim godinama.
Drugim rijecima, u analizi vremenskih presjeka mozemo zanemariti manje
razlike u vremenu prikupljanja podataka. Kao to vremenski nizovi imaju
svoje specicne probleme (stacionarnost), tako i vremenski presjeci imaju
svoje specicne probleme, meu kojima je najznacajniji heterogenost podataka.
Dijagramom disperzije na slici 1.4 prikazan je odnos izmeu BDP-a i potronje u tranzicijskim zemljama. Imamo male zemlje s malim BDP-om kao
to su Makedonija, Bugarska, Hrvatska, Slovenija i Slovacka, zemlje sa sred7

Tablica 1.2: Potronja i BDP 2004. godine u tranzicijskim zemljama


Potronja (C)
BDP (Y)
Zemlja
u milijardama US $
u milijardama US $
Bugarska
16.518
24.225
Hrvatska
20.249
35.295
eka
54.818
108.212
Maarska
68.572
102.157
Makedonija
4.182
5.368
Poljska
161.921
252.254
Rumunjska
51.277
75.574
Slovaka
23.833
42.011
Slovenija
17.874
32.601
Izvor: International Financial Statistics (IFS), Meunarodni monetarni fond, veljaa 2007.

ka i Maarska, i na kraju imamo Poljsku


njim BDP-om kao Rumunjska, Ce
koja znatno odskace po svojoj velicini. U tom slucaju, imamo heterogene
podatke i zato moramo voditi racuna o tzv. efektu razmjera ili efektu
opsega.
Zdruzeni podaci i panel (uzduzni) podaci
Ako kombiniramo vremenske nizove s vremenskim presjecima dobijemo zdruzene podatke.
Posebna vrsta zdruzenih podataka, u kojima se kroz razlicite vremenske
tocke pojavljuju iste vremenski presjecne jedinice (iste obitelji, iste zemlje,
itd.), zovu se panel ili uzduzni (longitudinalni) podaci. Tablica 1.3 prikazuje uzduzne podatke o potronji i BDP-u za tranzicijske zemlje. U tom
slucaju imamo za svaku vremenski presjecnu jedinicu (zemlju) niz vremenskih tocaka (od 1997. do 2005. godine). Ako gledamo tablicu kroz njezine
retke, vidimo vremenski presjek, ali ako je gledamo kroz stupce, vidimo vremenski niz. Znaci, uzduzni podaci su kombinacija vremenskih presjeka i
vremenskih nizova za iste vremenski presjecne jedinice.
Pretpostavimo, meutim, da se u dvije razlicite godine (2000. i 2005.)
istrazivala funkcija potronje hrvatskih obitelji s pitanjima o njihovim dohocima i potronji. Kada bismo ukljucili samo opazanja iz 2000. godine, ili
samo opazanja iz 2005. godine, radilo bi se o vremenskom presjeku. Meutim, kako bi se povecao broj opazanja mozemo zdruziti podatke iz 2000. i
2005. godine i tako dobiti zdruzene podatke iz obje godine. Buduci da su
se obitelji za istrazivanje birale slucajno, vrlo je mala vjerojatnost da je ista
obitelj sudjelovala u istrazivanju 2000. i 2005. godine. Stoga za razlicite vremenske tocke imamo razlicite vremenski presjecne jedinice (obitelji). U tom
slucaju ne govorimo o uzduznim (panel) podacima nego samo o zdruzenim
(pooled) podacima.

Slika 1.4: Odnos BDP-a i potronje u tranzicijskim zemljama 2004. godine.

1.2.5

Procjena ekonometrijskog modela

Kada imamo podatke, mozemo procijeniti parametre funkcije potronje 1.2


na temelju vrijednosti prikazanih u Tablici 1.1. Na Slici 1.5 prikazana je
hrvatska funkcija potronje za razdoblje od 1997. do 2005. godine.
Pravac koji prolazi kroz tocke dijagrama disperzije nacrtali smo na nacin
da minimiziramo sumu kvadrata odstupanja. O toj metodi bit ce vie rijeci
u sljedecem poglavlju. Dobiveni koecijenti prikazanog pravca su:
yb = 21:42 + 0:47x:

(1.3)

Kapica nad y oznacava da se radi o procijenjenoj vrijednosti (prikazanoj pravcem) stvarne zavisne varijable y (prikazana tockama). Iz procijenjene funkcije potronje prikazane u jednadzbi 1.3 vidimo da je koecijent
nagiba 0.47, to znaci da bi u promatranom razdoblju povecanje BDP-a u
Hrvatskoj za 1 kunu povecalo u prosjeku potronju stanovnitva za 47 lipa.
Iz Slike 1.5 vidimo da smo provukli regresijski pravac kroz dijagram
disperzije. Kada se, meutim, prica o linearnoj regresiji, ne misli se na
linearnost u varijablama, vec na linearnost u parametrima. Mogli smo
kroz tocke dijagrama disperzije povuci i neki drugi oblik funkcije, kao npr.
9

Tablica 1.3: Potronja i BDP u tranzicijskim zemljama u razdoblju od 1997.


do 2005. g. (u milijardama US dolara)
Godina
1997.
1998.
1999.
2000.
2001.
2002.
2003.
2004.
C
7.57
8.60
9.22
8.73
9.47
10.69
13.73
16.52
Bugarska
Y
10.38
12.74
12.93
12.62
13.63
15.55
19.97
24.22
C
12.83
13.01
11.72
13.22
11.94
13.60
17.18
20.25
Hrvatska
Y
20.10
21.64
19.91
18.42
19.86
23.03
29.62
35.29
C
30.72
32.58
31.84
29.77
32.08
38.56
47.23
54.82
eka
Y
57.13
61.85
60.19
56.71
61.84
75.27
91.35 108.21
C
28.28
29.37
30.67
30.25
34.22
44.00
57.59
68.57
Maarska
Y
45.72
47.05
48.04
47.96
53.32
66.71
84.42 102.16
C
2.71
2.59
2.56
2.67
2.41
2.92
3.53
4.18
Makedonija
Y
3.72
3.58
3.67
3.59
3.44
3.79
4.63
5.37
C
98.56 107.86 106.00 109.65 123.65 132.28 141.95 161.92
Poljska
Y 157.12 172.67 167.84 171.18 190.51 198.00 216.48 252.25
C
26.06
31.81
26.49
25.95
28.10
31.56
39.29
51.28
Rumunjska
Y
35.13
42.00
35.67
37.04
40.13
45.76
59.51
75.57
C
11.67
12.38
11.72
11.57
12.25
14.20
18.70
23.83
Slovaka
Y
21.56
22.43
20.60
20.45
21.11
24.52
32.98
42.01
C
11.45
12.12
12.50
11.08
11.20
12.38
15.66
17.87
Slovenija
Y
19.72
21.04
21.56
19.31
19.77
22.29
28.07
32.60
Izvor: International Financial Statistics (IFS), Meunarodni monetarni fond, veljaa 2007.

2005.
18.71
26.72
21.95
38.49
61.50
123.97
75.10
110.37

190.32
302.67
73.16
97.25
27.21
47.43
18.87
34.35

y = 0 + 1 x2 , ili ln y = 0 + 1 ln x, tj. nelinearan model u varijablama,


meutim, i dalje govorimo o linearnoj regresiji jer su prikazani
modeli lip
+
nearni u parametrima. Modeli tipa y = 0 + 21 x, y =
0
1 x; iako
su linearni u varijablama, nisu linearni u parametrima i stoga govorimo o
nelinearnim (u parametrima) regresijskim modelima.

1.2.6

Testiranje hipoteza

Kao to smo ranije rekli Keynes je ocekivao da je granicna sklonost potronji


izmeu 0 i 1. U slucaju Hrvatske procijenili smo u jednadzbi 1.3 da je
granicna sklonost potronji u Hrvatskoj u promatranom razdoblju bila 0.47.
Kako bismo zakljucili da je dobiveni rezultat za Hrvatsku u suglasju sa
Keynesijanskom ekonomskom teorijom, i da se ne radi o slucajnosti, moramo
dodatno testirati je li ova vrijednost statisticki znacajno razlicita od 0 i
mogucnost da nije veca od 1.

1.2.7

Prognoziranje i predvianje

Na temelju jednadzbe 1.3 mozemo predvidjeti vrijednosti varijable y za zadane vrijednosti varijable x. Npr. mozemo predvidjeti kolika ce biti potronja
stanovnitva u Hrvatskoj ako BDP dosegne vrijednost od 250 milijardi kuna

10

140

Potronja u milijardama kuna

130

120

110

100

90

80

70
100

120

140

160

180

200

220

240

BDP u milijardama kuna

Slika 1.5: Hrvatska funkcija potronje za razdoblje od 1997. do 2005. godine

na sljedeci nacin:
yb250 = 21:42 + 0:47(250) = 138:92:

Drugim rijecima, na temelju vrijednosti naih parametara prognoziramo


da ce potronja stanovnitva biti 138:92 milijarde kuna, kada ce BDP u
Hrvatskoj iznositi 250 milijardi kuna.

1.3

Regresijska funkcija populacije i regresijska funkcija uzorka

Pretpostavimo da smo iz hipoteticke populacije studenata prikupili podatke o njihovom mjesecnom dohotku i o njihovoj mjesecnoj potronji. Studente
smo podijelili na 10 dohodovnih razreda (od 100 kn do 1000 kn) i u Tablici
1.4 prikazali njihove mjesecne potronje. Stoga imamo 10 ksnih vrijednosti varijable x kojima odgovaraju razlicite vrijednosti y. Drugim rijecima
imamo 10 dohodovnih podpopulacija.
Iz Tablice 1.4 jasno se vidi da se u svakoj dohodovnoj grupi studenti
razlicito ponaaju (imamo one sklonije tednji i one manje sklone tednji);
tako npr. pojedini studenti koji imaju dohodak 300 kn troe vie (250 kn
11

Potronja

Tablica 1.4: Mjesecna potronja i dohodak studenata (u kunama)

Ukupno

E (y | xi )

Dohodak
500
600
290
350
330
410
365
445
370
460
375
480
390
495
410
430

100
80
85
90
95
100

200
120
145
150
160
165
180
200

300
190
200
230
240
250
270

400
240
260
300
310
330
360

450

1120

1380

1800

2960

90

160

230

300

370

800
500
520
540
550
590
620
650
670

900
600
620
640
660
680
700

1000
700
710
750

2640

700
460
480
490
500
510
520
530
540
560
4590

4640

3900

2160

440

510

580

650

720

i 270 kn) nego pojedini studenti koji imaju dohodak 400 kn (240 kn i 260
kn). Mozemo, meutim, primijetiti da unatoc tim varijabilnostima postoji
odreeno pravilo da u prosjeku studenti koji imaju veci dohodak vie i troe.
To se jasno vidi iz aritmetickih sredina (ili prosjeka) svake podpopulacije
koje su prikazane u zadnjem retku Tablice 1.4 koje zovemo vrijednostima
uvjetnog ocekivanja jer su uvjetovane zadanim vrijednostima varijable x.
Uvjetno ocekivanje oznacavamo s E (yjxi ) te citamo ocekivana vrijednost
y za zadanu vrijednost x. Tako npr. ocekivana potronja studenata, koji
imaju dohodak od 200 kn, iznosi 160 kn, dok je kod studenata, koji imaju
800 kn, ocekivana potronja 580 kn.
Uvjetno ocekivanje razlikuje se od matematickog (neuvjetnog) ocekivanja E (y) koji prikazuje prosjecnu potronju svih 64 studenata populacije,
neovisno o njihovom dohodovnom razredu. U naem bi slucaju matematicko
+2160
ocekivanje bilo E (y) = 450+1120+
= 400:625.
64
Na slici 1.6 prikazan je dijagram disperzije na temelju Tablice 1.4. Spajanjem svih uvjetnih ocekivanja za sve ksne vrijednosti dohotka dobili smo
regresijsku funkciju populacije (RFP)3 koja u naem slucaju poprima
oblik pravca. Sve tocke kojima prolazi regresijski pravac populacije oznacava ocekivanu potronju odreenog dohodovnog razreda; tako npr. za razred
200 kn ocekivana potronja je 160 kn, za razred 500 kn ocekivana potronja
je 370 kn, itd. Opcenito mozemo reci da regresijska funkcija populacije predstavlja sve tocke uvjetnih ocekivanja zavisne varijable y za ksne vrijednosti
nezavisne varijable x.
Na temelju tako denirane regresijske funkcije populacije mozemo odrediti pojedinacnu potronju svakog studenta kao odstupanje od uvjetnog oce3

Na slici je oznacena sa E (yjxi ).

12

E (y | xi )

800
700
600
510

Potronja

500
400

370

300
200

160

100

0
0

100

200

300

400

500

600

700

800

900

1000

1100

Dohodak

Slika 1.6: Regresijska funkcija populacije izvedena iz Tablice 1.4

kivanja dohodovnog razreda kojemu pripada


"i = yi

E (yjxi ) :

Stvarna potronja bit ce


yi = E (yjxi ) + "i :

(1.4)

Znaci, potronja i tog studenta sastoji se od dva dijela: jedan je deterministicki ili sustavni dio E (yjxi ) kojeg mozemo predvidjeti na temelju
dohodovnog razreda kojemu student pripada te od "i to predstavlja slucajno odstupanje ili nesustavni dio. Slucajno se odstupanje pojavljuje zbog
utjecaja ostalih varijabli na potronju studenata a koje nisu ukljucene u model, kao npr. spol, stanuje li student s roditeljima ili je podstanar, drutvo
u kojemu se krece, navike, itd4 . Ako pretpostavimo da imamo linearnost
E (yjxi ) u varijabli xi kao na slici 1.6 tada se jednadzba 1.4 pretvara u
yi =

1 xi

+ "i :

(1.5)

Nazalost, u praksi nemamo na raspolaganju cjelokupnu populaciju vec


samo uzorak iz te populacije. Stoga je problem, s kojim smo suoceni, da na
4
Glavni razlozi pojavljivanja slucajne greke "i objanjeni su u naslovu Specikacija
ekonometrijskog modela na stranici 4.

13

temelju poznavanja samo vrijednosti uzorka, izvucenog iz neke populacije,


moramo procijeniti nama nepoznatu funkciju populacije prikazanu jednadzbom 1.5. Pretpostavimo da smo iz populacije prikazane u Tablici 1.4 izvukli
jedan slucajan uzorak (Uzorak 1) potronje studenata za svaku dohodovnu
grupu, prikazan u Tablici 1.5
Tablica 1.5: Slucajni uzorci iz Tablice populacije
Dohodak
100
200
300
400
500
600
700
800
900
1000

Potronja: uzorak 1
80
145
270
310
375
480
530
520
700
750

Potronja: uzorak 2
95
200
240
330
390
460
500
550
640
700

Mozemo primijetiti da za svaku dohodovnu grupu (ksna vrijednost x)


imamo samo jednu vrijednost potronje (y), za razliku od populacije kada
smo za svaku vrijednost x imali vie vrijednosti y. Vrijednosti iz Tablice
1.5 (Potronja: uzorak 1) prikazali smo na Slici 1.7 i provukli kroz tocke
regresijsku funkciju uzorka (RFU1 ) koja u naem slucaju poprima izgled
pravca kojeg cemo oznaciti
y^i = b0 + b1 xi + ei

(1.6)

gdje je:
y^i = procjenitelj E (yjxi )
b0 = procjenitelj 0
b1 = procjenitelj 1
ei = slucajno odstupanje uzorka koje interpretiramo kao procjenitelj "i :
Cilj regresijske funkcije uzorka y^i = b0 +b1 xi +ei je procijeniti nepoznatu
regresijsku funkciju populacije yi = 0 + 1 xi + "i .
Iz nae populacije, prikazane u Tablici 1.4, mozemo izvuci i drugi uzorak
(Uzorak 2 koji je prikazan u Tablici 1.5). Na slici 1.7 vidimo da, iako izvuceni iz iste populacije, regresijske funkcije uzoraka (RFU1 i RFU2 ) meusobno
se razlikuju zbog uktuacije populacije oko regresijske funkcije populacije.
Jedino u specijalnom slucaju, kada bi se sve tocke populacije prikazane na
slici 1.6 nalazile na regresijskom pravcu populacije, tada bi regresijski pravci
uzoraka prikazani na slici 1.7 bili potpuno jednaki. to je veca disperzija
tocaka oko regresijske funkcije populacije, to je vjerojatnost da su regresijske funkcije uzoraka meusobno razlicitije. Postavlja se, dakle, pitanje
14

RFU1

800

RFU2
700
600

Potronja

500
400
300
200
100
0
0

100

200

300

400

500

600

700

800

900

1000

1100

Dohodak

Slika 1.7: Regresijske funkcije uzoraka temeljene na populaciji iz Tablice 1.4

jesu li i pod kojim uvjetima regresijske funkcije uzoraka dobri procjenitelji


regresijske funkcije populacije?
Odgovor glasi da ce regresijska funkcija uzorka biti dobar procjenitelj
"nevidljive" regresijske funkcije populacije ako vrijede sljedece pretpostavke o RFP, koje zovemo i pretpostavkama klasicnog linearnog regresijskog modela:
1. Linearnost u parametrima: vec smo rekli da kada govorimo o linearnim
modelima govorimo o linearnosti u parametrima. Neki modeli mogu
izgledati nelinearno u parametrima kao na primjer Cobb-Douglasova
funkcija proizvodnje5
y = 0 K 1 L 2 e"
(1.7)
koju, meutim, mozemo jednostavno linearizirati ako je logaritmiramo
ln y =

1 ln K

2 ln L

+"

(1.8)

gdje je a = ln 0 : Vidimo da je jednadzba 1.8 nelinearna u varijablama


(zbog logaritama), ali linearna u parametrima. U tom slucaju govorimo da je model prikazan jednadzbom 1.7 sutinsko linearan model,
5
Napomena: e u jednadzbi (1.7) odnosi se na bazu prirodnog logaritma a ne na slucajno
odstupanje uzorka.

15

jer ga mozemo odreenim transformacijama pretvoriti u model linearan u parametrima. S druge strane, da je Cobb-Douglasova funkcija
bila denirana kao
y = 0 K 1 L 2 + ";
(1.9)
ne bi je bilo moguce nikakvom transformacijom linearizirati. U tom
slucaju govorimo da je model sutinsko nelinearan model i da ne
zadovoljava pretpostavku o linearnosti u parametrima.
2. Nestohasticnost varijable x: vrijednosti varijable x ksirane su u ponovljenom uzorkovanju, kao na primjeru u Tablici 1.4 kada imamo
razlicite vrijednosti potronje (y) za ksne (iste) vrijednosti dohotka
(x).
3. Sredina slucajne greke "i je jednaka nuli ili simbolicki E ("i jxi ) = 0.
Buduci da regresijska funkcija populacije predstavlja uvjetno matematicko ocekivanje E (yjxi ), tj. sredinu (prosjek) y za zadani xi , to znaci
da je zbroj pozitivnih i negativnih odstupanja "i za svaki zadani xi
jednak nuli.
Primjer 1.1 Zbrajanjem odstupanja od uvjetnog matematicko ocekivanja za dohodovnu grupu 100 kn u Tablici 1.4 dobijemo (80 90) +
(85 90) +
+ (100 90) = 10 + ( 5) +
+ 10 = 0. Isto vrijedi
i za sve ostale dohodovne grupe.
4. Homoskedasticnost: jednaka varijanca za sva opazanja ili simbolicki
V ar ("i jxi ) = E ["i

E ("i jxi )]2 =

Razumno bi bilo ocekivati, u naem hipotetickom primjeru, osim da


studenti s vecim dohotkom troe apsolutno vie u odnosu na studente
s manjim dohotkom, da varijanca odstupanja (rasipanje oko RFP, varijabilnost potronje unutar dohodovne grupe) bude veca za studente s
viim dohocima u odnosu na one koji imaju manji dohodak i stoga manji "manevarski" prostor za potronju. Ako varijanca slucajne greke
nije ista za sva opazanja, vec ovisi o nekoj od nezavisnih varijabli (u
naem slucaju raste s rastom dohotka) govorimo o heteroskedasticnosti, koju simbolicki oznacavamo s Var("i jxi ) = 2i , gdje nam subskript
i govori da varijanca slucajnog odstupanja "i nije konstantna.
5. Odsutnost autokorelacije slucajnih odstupanja: za dvije ksne vrijednosti xi i xj za (i 6= j), kovarijanca (korelacija) izmeu dva slucajna
odstupanja "i i "j za bilo koji (i 6= j) je nula, ili simbolicki
Cov ("i ; "j jxi ; xj ) = E f["i

E ("i )] jxi g f["j

E ("j )] jxj g = 0:

To znaci da je odstupanje " slucajno, tj. da nema sustavni obrazac


(kao npr. isti predznak s prethodnim opazanjem).
16

6. Odsutnost multikolinearnosti : izmeu nezavisnih varijabli (kada ih


imamo vie) ne smije postojati savrena linearna veza. Ako postoji
znacajna veza izmeu nezavisnih varijabli, vrlo je teko izolirati utjecaj pojedinih varijabli na zavisnu varijablu y.
7. Kovarijanca izmeu "i i xi je nula, ili simbolicki
Cov ("i ; xi ) = E ["i

E ("i )] [xi

E (xi )] = 0:

Kada smo denirali RFP u jednadzbi 1.5 pretpostavili smo da x i "


imaju zasebne utjecaje na y (deterministicki i nesustavni dio). Meutim, kada bi oni bili meusobno korelirani, takvi se zasebni utjecaji x
i " na y ne bi mogli pravilno identicirati.
8. Broj opazanja mora biti veci od broja parametara koji se procjenjuju:
na temelju jednog opazanja (jedna tocka u dvodimenzionalnom prostoru) ne mozemo procijeniti pravac na tom prostoru; potrebne su nam
minimalno dvije tocke da odredimo parametre pravca 0 i 1 , drugim
rijecima potrebna su nam barem dva opazanja.
9. Varijabilnost vrijednosti x : vrijednosti varijable x ne smiju biti sve
iste. Bolje je ako varijabla x ima vece uktuacije jer se u tom slucaju
varijablom x mogu bolje objasniti uktuacije zavisne varijable y.
10. Pravilno speciciran regresijski model : kada govorimo o pravilno speciciranom modelu, govorimo o pravilno speciciranoj funkcionalnoj
formi, pravilno speciciranim nezavisnim varijablama i pravilno
speciciranim pretpostavkama o vjerojatnosti y, x, i ".

17

Poglavlje 2

Parametri modela dobiveni


metodom najmanjih
kvadrata
U prethodnom poglavlju objasnili smo da ako vrijede pretpostavke o RFP-u
mogu se donositi zakljucci o regresijskoj funkciji populacije (RFP)
yi =

1 xi

+ "i

na temelju regresijske funkcije uzorka (RFU)


y^i = b0 + b1 xi + ei :
Postavlja se, meutim, pitanje kako procijeniti parametre b0 i b1 regresijske
funkcije uzorka.

2.1

Procjena parametara
Tablica 2.1: Mjesecna potronja i dohodak studenata (u kunama)
Student
Marko
Ivan
Mira
Maja
Ana

Potronja
100
250
300
210
160

Dohodak
150
300
500
400
200

Pretpostavimo da smo izabrali jedan reprezentativni uzorak studenata


koji su nam dali podatke o njihovim mjesecnim potronjama i dohocima.
Prikupljeni podaci prikazani su u Tablici 2.1. Ako vrijednosti iz Tablice

18

350

300

Potronja

250

200

150

100

50

0
0

100

200

300

400

500

600

Dohodak

Slika 2.1: Dijagram disperzije mjesecnog dohotka i potronje studenata (u


kunama)

2.1 prikazemo dijagramom disperzije, u kojemu svakom opazanju odgovara


jedna tocka u dvodimenzionalnom prostoru dobijemo Sliku 2.1.
Iz prikazanih tocaka vidimo da kada se vrijednost dohotka studenata
povecava, povecava se i njihova potronja . Meutim na temelju prikazanih tocaka ne mozemo tocno kvanticirati npr.: koliko ce studenti povecati
potronju, ako im se dohodak poveca za 100 kn, kolika je vjerojatnost potronje studenta koji ima 450 kn dohotka, kolika je autonomna (koja ne
ovisi o dohotku) potronja studenata, itd. Odgovore na ova pitanja moguce
je dobiti ako kroz tocke dijagrama disperzije provucemo odreenu matematicku funkciju. Na temelju pozicioniranja tocaka na dijagramu disperzije
prikazanom na Slici 2.1 mozemo pretpostaviti da je prikladni funkcionalni
oblik regresijske funkcije pravac kojim bismo mogli objasniti vezu izmeu
dohotka i potronje studenata. Problem koji se sada namece je kako odrediti
parametre pravca koji ce ga denirati. Razumno bi bilo da pravac
P odredimo
tako da minimiziramo zbroj svih odstupanja (greke), tj. min ei :
Iz Slike 2.2 vidimo da pravac P1 prolazi blize tockama dijagrama disperzije od pravca P2. S druge strane ako zbrojimo
odstupanja za P1 (P
35+0+60+(-30)+10) vidimo da je rezultat
ei = 5, dok
P ako zbrojimo
odstupanja za P2 (-180+(-120)+60+50+190) rezultat je
ei = 0. Drugim
rijecima po kriteriju minimizacije odstupanja bolji je pravac P2 u odnosu
19

350
P1

300

+10

2
i

=5
= 5825

250

Potronja

+60
200

-120

-180

-30

+190

+50

150
-35
P2

100

=0

ei2 = 89000

50

0
0

100

200

300

400

500

600

Dohodak

Slika 2.2: Kriterij minimalnih kvadrata odstupanja

na pravac, koji "na oko" izgleda bolji, P1. Zato? Vrijednosti odstupanja ei
poprimaju pozitivne i negativne vrijednosti tako da se u njihovom zbrajanju meusobno ponitavaju. Tako u slucaju pravca P2, u kojemu su velika
odstupanja, imamo u zbroju vece (potpuno) ponitavanje vrijednosti odstupanja u odnosu na pravac P1, koji ima vidno manja odstupanja, ali koja se u
zbroju ne ponitavaju u cijelosti. Ponitavanje vrijednosti u zbroju mozemo
izbjeci tako
vrijednosti ei : Iz Slike 2.2 vidimo da je za pravac
P da2 kvadriramo
P1 zbroj
ei = ( 35)2 + 02 +
+ 102 = 5825 znatno manji u odnosu
P 2
na pravac P2 gdje je
ei = (( 180)2 + ( 120)2 +
+ 1902 ) = 89000.
Ako nam kriterijP
za vucenja pravca kroz tocke dijagrama disperzije postane minimizacija
e2i ; tada vidimo da pravac, koji "na oko" izgleda bolji,
bolji je i na temelju naeg postavljenog kriterija minimizacije kvadrata
odstupanja koji sprjecava ponitavanje pozitivnih i negativnih vrijednosti
odstupanja. Metodu, koja se temelji na kriteriju minimizacije kvadrata odstupanja, zovemo Obicnom metodom najmanjih kvadrata (eng. OLS
- Ordinary Least Square).
Kvadriranjem odstupanja, osim to pretvaramo odstupanja u pozitivne
vrijednosti, dajemo vecu tezinu vecim (udaljenijim od regresijskog pravca) odstupanjima u odnosu na manja, buduci da su vrijednosti kvadrirane.
Problem se u tom slucaju moze pojaviti u prisutnosti izuzetno udaljenih
20

odstupanja (eng. outliers), cija prisutnost moze bitno promijeniti izgled


regresijskog pravca, buduci da je metoda najmanjih kvadrata izuzetno osjetljiva na takve udaljene tocke. Uobicajeno je rjeenje tog problema da se
opazanja vezana za udaljene tocke jednostavno izbace iz analize. Pri tome
se meutim mora pristupiti vrlo pazljivo jer ponekad te udaljene tocke u
sebi mogu sadrzavati bitne informacije o vezi izmeu analiziranih varijabli.
Na temelju kriterija minimizacije kvadrata odstupanja iz Slike 2.2 vidimo da je pravac P1 bolji od pravca P2. Ali nitko nam ne jamci da je pravac
P1 najbolji izmeu svih mogucih pravaca koje mozemo potegnuti kroz dijagram disperzije po kriteriju minimizacije kvadrata odstupanja. Moramo
li na temelju recenoga potegnuti kroz tocke dijagrama disperzije veliki broj
pravaca i na temelju njihovog zbroja kvadrata odstupanja
P 2 odluciti koji je od
njih najbolji, ili drugim rijecima koji ima minimalni
ei ? Takav bi pristup
bio sigurno vremenski jako rastroan i na kraju ne bismo imali konacan odgovor, tj. ne bismo imali nikakvu sigurnost da je na pravac, najbolji meu
onima koje smo testirali, i najbolji meu onima koje nismo testirali. Ovaj
problem rijeio je njemacki matematicar Carl Friedrich Gauss na sljedeci
nacin. Za model s jednom nezavisnom varijablom
yi = b0 + b1 xi + ei

(2.1)
P

moramo izabrati parametre b0 i b1 tako da minimiziraju


e2i : Da bismo
P 2
dobili parametri s tim svojstvima moramo parcijalno derivirati izraz
ei
po b0 i b1 i izjednaciti prve derivacije s nulom kako bismo dobili ekstreme
funkcija (minimum).
Kriterij najmanjih kvadrata mozemo denirati kao
Min

n
X

e2i = Min

i=1

n
X

(yi

b0

b1 xi )2

(2.2)

i=1

gdje yi oznacava stvarnu vrijednost y za i-to opazanje, a n oznacava broj


opazanja.
Parcijalnim deriviranjem izraza 2.2 po parametrima b0 i b1 i izjednacavanjem prve derivacije s nulom dobivamo jednadzbe
@ P
(yi
@b0
@ P
(yi
@b1

b0

b1 xi )2 =

b0

b1 xi )2 =

P
P

(yi
xi (yi

b0

b1 xi ) = 0
b0

b1 xi ) = 0:

(2.3)
(2.4)

Simultanim rjeavanjem jednadzbi 2.3 i 2.4 po parametrima b0 i b1 (cjeloviti izvod prikazan je u Dodatku A.1) dobijemo vrijednosti parametara
koje imaju svojstvo minimizacije sume kvadrata odstupanja prikazanih u
jednadzbi 2.2 koje glase
P
P
(xi x) (yi y)
x
~i y~i
b1 =
= P 2
(2.5)
P
2
x
~i
(xi x)
21

b0 = y

b1 x

(2.6)

gdje y i x prikazuju sredine uzoraka, a x


~ i y~ oznacavaju varijable x i y u
1
njihovoj devijacijskoj formi
x
~i = xi

y~ = yi

y:

Koritenjem Gaussovih jednadzbi 2.5 i 2.6 mozemo dobiti parametre


(procjenitelje) modela na temelju obicne metode najmanjih kvadrata u slucaju jedne nezavisne varijable.
Ako imamo vie nezavisnih varijabli procjenitelje, temeljene na Gaussovoj metodi najmanjih kvadrata (OLS), mozemo jednostavno dobiti koritenjem matricne algebre.
Model sa (k 1) brojem nezavisnih varijabli
yi = b0 + b1 x1i + b2 x2i +

+ b(k

1) x(k 1)i

+ ei

(2.7)

mozemo prikazati u matricnoj formi


y = Xb + e
u kojoj
2
3
y1
6 y2 7
6
7
y =6 . 7
4 .. 5
yn

6
6
X =6
4

1 x11
1 x12
..
..
.
.
1 x1n

x(k
x(k
..

.
x(k

1)1

..
.

1)2

1)n

(2.8)
3
7
7
7
5

6
6
b =6
4

b0
b1
..
.
bk

7
7
7
5

6
6
e =6
4

e1
e2
..
.
en

3
7
7
7
5

gdje
y = n

1 vektor stupac s opazanjima zavisne varijable

X = n

k matrica s opazanjima nezavisnih varijabli

b = k

1 vektor stupac nepoznatih parametara

e = n

1 vektor stupac odstupanja.

Svaki element matrice X ima dva subskripta; prvi se odnosi na varijablu


(stupac), dok se drugi odnosi na opazanje (redak). Tako npr. element x24
oznacava cetvrto opazanje varijable x2 . Interesantno je primijetiti da je prvi
redak u matrici X ispunjen jedinicama. Ovaj redak odrazava konstantni
clan koji se veze za parametar b0 .
Naje cilj, kao i u slucaju sa samo jednom nezavisnom varijablom, minimizirati sumu kvadrata odstupanja koju u matricnoj algebri mozemo pisati
min

n
P

i=1
1

e2i = min(e0 e):

Neka svojstva devijacijskih formi prikazana su u Dodatku A.1

22

(2.9)

Iz jednadzbe 2.8 imamo


e=y

(2.10)

Xb;

to sumu kvadrata odstupanja pretvara u


e0 e = (y
0

= yy

Xb)0 (y
0

Xb)

y0 Xb + b0 X0 Xb

bXy

= y0 y 2b0 X0 y + b0 X0 Xb:

(2.11)

Zadnji je korak moguc jer su b0 X0 y i y0 Xb meusobno jednaki skalari.


Minimizirati sumu kvadrata odstupanja po parametrima modela mozemo
ako deriviramo e0 e po parametrima i izjednacimo prvu derivaciju s nulom
@
y0 y
@b

2b0 X0 y + b0 X0 Xb =

iz cega slijedi da
b = X0 X

2X0 y+2X0 Xb = 0;

(2.12)

X0 y:

(2.13)

Za dobivanje jednadzbe 2.13 nismo koristili nikakve pretpostavke o nacinu na koji se podaci generiraju. Jedino to pretpostavljamo je da postoji
inverzna matrica (X0 X) 1 , tj. da matrica X0 X nije singularna matrica,
to podrazumijeva da niti jedan redak (stupac) te matrice ne smije biti egzaktna linearna kombinacija ostalih redaka, to znaci da nema
multikolinearnosti (linearne veze izmeu nezavisnih varijabli).
Tablica 2.2: Izracun vrijednosti procjenitelja (parametara) na temelju obicne
metode najmanjih kvadrata odstupanja
Student
Marko
Ivan
Mira
Maja
Ana

Sredina

yi

xi

~y
i

~
xi

~
xi ~
yi

100
250
300
210
160
1020
204

150
300
500
400
200
1550
310

-104
46
96
6
-44
0

-160
-10
190
90
-110
0

16640
-460
18240
540
4840
39800

~
xi2
25600
100
36100
8100
12100

82000

yi

126.34
199.15
296.22
247.68
150.61
1020
204

ei
-26.34
50.85
3.78
-37.68
9.39
0

Primjer 2.1 Iz jednadzbi za parametre 2.5 i 2.6 i Tablice 2.2 mozemo izracunati:
P
39800
x
~i y~i
b1 = P 2 =
= 0:48537
(2.14)
82000
x
~i
b0 = y

b1 x = 204

0:48537

23

310 = 53: 535:

(2.15)

e i2
693.87
2586.09
14.29
1420.00
88.18

4802.44
960.49

Isti smo rezultat mogli dobiti i koritenjem matricne forme iz jednadzbe


2.13 koja vrijedi za broj k nezavisnih varijabli pa stoga vrijedi i za slucaj
samo jedne nezavisne varijable, kao u naem primjeru:
b = X0 X
gdje su

Ako izracunamo2 da

6
6
X=6
6
4

1
1
1
1
1

150
300
500
400
200

XX=

1
1
1
1
1
150 300 500 400 200

u konacnici imamo
0

b= XX

Xy=

7
6
7
6
7; y = 6
7
6
5
4

i da
X0 y =

X0 y

1
1
1
1
1
150 300 500 400 200

5
1550
1550 562 500

2
6
6
6
6
4

1
1
1
1
1

100
250
300
210
160
150
300
500
400
200
3

7
7
7
7
5

7
7
7=
7
5

100
6 250 7
6
7
6 300 7 =
6
7
4 210 5
160
1

1020
356 000

5
1550
1550 562 500

1020
356 000

53: 535
:
0:485 37
(2.16)

Vidljivo je da smo u 2.16 dobili identicni rezultat kao i u jednadzbama


2.14 i 2.15, tj. da je b0 = 53:535, a b1 = 0:48537. Drugim rijecima na
regresijski pravac uzorka (zaokruzen na dvije decimale) dobiven metodom
najmanjih kvadrata je
y^i = 53:54 + 0:49xi :
(2.17)
P 2
Iz Tablice 2.2 vidimo da je
ei = 4802:44 ovog pravca manja nego za
pravce iz Slike 2.2. Ne samo to, vec znamo da ne postoji pravac, meu
testiranima i ne testiranima do sada, koji bi imao manju sumu kvadrata
odstupanja. Regresijski pravac iz 2.17 mozemo gracki prikazati kao na Slici
2.3. Vidimo da za prvo opazanje (Marko iz Tablice 2.2) imamo dohodak od
150; stvarnu potronju y1 = 100 i Markovu procijenjenu potronju naim
regresijskim pravcem od y^1 = 126:34. Stoga odstupanje regresijskog pravca
2

Manipuliranje matricama olakavaju matricno orijentirani racunalni paketi kao to su


Matlab ili Scilab

24

od stvarne vrijednosti (greka) u Markovom slucaju je (y1 y^1 ) = e1 =


26:34. Ostale stvarne i procijenjene vrijednosti nisu prikazane na Slici 2.3
nego ih mozemo naci u Tablici 2.2.

yi = 53 .54 + 0.49 xi

Potronja

yp = 274 .04

y = 204

y1 = 126 .34
y1 = 100

e1 = 26 .34

53.54

x1 = 150

x = 310

x p = 450

Dohodak

Slika 2.3: Regresijski pravac uzorka


Na temelju ovog dobivenog pravca mozemo odgovoriti na pitanja na koje
nismo mogli odgovoriti na temelju samo dijagrama disperzije kao to su:
Koliko ce studenti povecati potronju ako im se dohodak poveca za
100 kn? Prva derivacija potronje po dohotku dobivenog pravca je
d^
y
dx = 0:49, to znaci da je granicna sklonost potronji reprezentativnog
studenta 0:49, to nam govori da ce od dodatne dobivene kune potroiti
49 lipa, ili ako dobije dodatnih 100 kuna, 49 kuna ce potroiti, a 51
kunu utedjeti. Gracki 0:49 predstavlja koecijent smjera (nagib)
regresijskog pravca na Slici 2.3.
Kolika je vjerojatnost potronje studenta koji ima 450 kn dohotka? Iz
naeg pravca imamo
y^450 = 53:54 + 0:49(450) = 274: 04;
iz cega mozemo prognozirati da student koji ima 450 kn dohotka trebao
bi troiti 274:04 kn, kao to se jasno vidi iz regresijskog pravca na Slici
2.3.
25

Kolika je autonomna (koja ne ovisi o dohotku) potronja studenata?


Potronja, koja ne ovisi o dohotku, u naem primjeru je 53:54 kn. To
je i minimalna potronja naeg reprezentativnog studenta kada nema
dohotka (x = 0; radi se o minimumu jer za dohodak vrijedi uvjet o nenegativnosti). Gracki, kao to je prikazana na Slici 2.3, ta vrijednost
oznacava odsjecak na ordinati regresijskog pravca.

2.2

Svojstva regresijskog pravca

Regresijski pravac dobiven metodom najmanjih kvadrata ima sljedeca svojstva:


1. Regresijski pravac prolazi kroz sredinu uzoraka (x i y) kao to
se jasno vidi na Slici 2.3. Ovo svojstvo proizlazi iz jednadzbe 2.6 za
izracunavanje parametra b0 . Naime, ako je
b0 = y

b1 x

(2.18)

y = b0 + b 1 x

(2.19)

tada vrijedi da je
to nam govori da kada x poprima vrijednost svoje sredine x procijenjena vrijednost y^ je y: Drugim rijecima regresijski pravac prolazi kroz
tocku (x; y).
Primjer 2.2 Lako mozemo provjeriti da za x = 310
y^310 = 53:54 + 0:49(310) = 204

(2.20)

y^ poprima vrijednost3 svoje sredine y = 204, kao to se vidi iz Tablice


2.2.
2. Sredina stvarnog y jednaka je sredini procijenjenog y^. Svojstvo
y = y^ proizlazi iz4
y^i = b0 + b1 xi
= (y

b1 x) + b1 xi

= y + b1 (xi

x) :

Zbrajanjem lijeve i desne strane jednadzbe 2.21 dobijemo


P
P
y^i = ny + b1 (xi x) :

(2.21)

(2.22)

Mala se greka pojavljuje u ovome izracunu uslijed zaokruzivanja na dvije decimale.


Napomena: ovo svojstvo vrijedi samo ako regresija ima konstantni clan b0 , jer bez
konstantnog clana, kao to se jasno vidi iz izvoda, ne moze se izvesti jednadzba 2.21.
4

26

Iz
P Svojstva B.4 operatora zbrajanja (vidi Dodatak B.1) znamo da
(xi x) = 0; to 2.22 pretvara u
P
y^i = ny:
(2.23)

Ako lijevu i desnu stranu jednadzbe 2.23 podijelimo s n; dobijemo


P
y^i
ny
=
n
n
y^ = y:
(2.24)
Primjer 2.3 Iz Tablice 2.2 vidimo da je sredina stvarnog y = 204
jednaka sredini procijenjenog y^ = 204.

P
3. Suma odstupanja je nula5 ( ei = 0), to se jasno vidi iz Tablice
2.2. Ovo svojstvo proizlazi iz uvjeta minimizacije kvadrata odstupanja
po b0 prikazanog u jednadzbi 2.3
P
P
@ P
(yi b0 b1 xi )2 = 2 (yi b0 b1 xi ) = 2 ei = 0
@b0
(2.25)
P
to povlaci
ei = 0: Iz toga proizlazi da je i sredina odstupanja
P
ei
= 0:
(2.26)
e=
n
4. Odstupanja ei i procijenjeni y^i meusobno su neovisni. Kovarijancu izmeu ei i y^i mozemo izraziti
Cov (^
y i ; ei ) =

n
1 P
y^i
n i=1

y^ (ei

e)

(2.27)

Iz Svojstva 3. regresijskog pravca znamo da je e = 0; stoga da


bi
P izraz 2.27 bio nula (neovisnost izmeu ovih dviju varijabli) tada
y^i y^ ei mora biti jednak nuli, ili ako piemo u devijacijskoj forPe
mi
y^i ei = 0: Regresijski pravac za dvije varijable u devijacijskoj
formi mozemo pisati bez konstantnog clana
e
y^i = b1 x
~i :

(2.28)

Varijable u devijacijskoj formi imaju sredinu nula, stoga regresijski


pravac prolazi kroz ishodite (vidi Svojstvo 1. regresijskog pravca),
iz cega proizlazi da je odsjecak na ordinati tog pravca jednak nuli, ili
drugim rijecima b0 = 0: Na temelju jednadzbe 2.28 mozemo pisati
P
Pe
y^i ei = b1 x
~i ei
P
= b1 x
~i (~
y b1 x
~i )
P
2P 2
~i y~ b1 x
~i :
(2.29)
= b1 x

Napomena: ovo svojstvo ne vrijedi kada nemamo konstantnog clana b0 u regresiji.

27

Na temelju jednadzbe 2.5 mozemo pisati


P
P 2
x
~i y~ = b1 x
~i

(2.30)

to 2.29 pretvara u

Pe
P 2
y^i ei = b21 x
~i

b21

= 0:

x
~2i
(2.31)

Na ovaj smo nacin dokazali da ne postoji linearna veza izmeu odstupanja i procijenjene zavisne varijable.
P U naem primjeru iz Tablice 2.2
lako se moze provjeriti da vrijedi
y^i y^ ei = 0.
P
5. Odstupanja ei i xi meusobno su neovisni, drugim rijecima xi ei =
0. Ovaj zakljucak proizlazi iz uvjeta minimizacije kvadrata odstupanja
po b1 prikazanog u jednadzbi 2.4
P
P
@ P
(yi b0 b1 xi )2 = 2 xi (yi b0 b1 xi ) = 2 xi ei = 0
@b1
(2.32)
P
to povlaci
xi ei = 0. Ovo svojstvo regresijskog pravca, takoer se
moze lako provjeriti na primjeru iz Tablice 2.2.

2.3

Svojstva procjenitelja

Ako vrijede pretpostavke o regresijskoj funkciji populacije koje smo


naveli na stranici 15 tada procjenitelji dobiveni metodom najmanjih kvadrata imaju odreena pozeljna svojstva navedena u Gauss-Markovljevom
teoremu:
Gauss-Markovljev teorem: Ako vrijede pretpostavke klasicnog linearnog regresijskog modela, procjenitelji dobiveni metodom najmanjih kvadrata najbolji (najekasniji) su linearni nepristrani procjenitelji, tj. imaju minimalnu varijancu u klasi linearnih nepristranih procjenitelja.
1. Linearnost: znaci da je procjenitelj linearna funkcija slucajne varijable jer se moze napisati kao linearna kombinacija pojedinih opazanja
y.
Primjer 2.4 Iz Tablice 2.2 mozemo dobiti vektor b iz
b = X0 X

33
41
2
1025

39
164
1
8200

85
164
19
8200

28

X0 y

23
164
9
8200

101
164
11
8200

2
6
6
6
6
4

100
250
300
210
160

3
7
7
7
7
5

39
85
ili b0 mozemo dobiti iz linearne kombinacije 33
41 100 + 164 250
164 300
23
101
164 210 + 164 160 = 53: 537. Na slican nacin mozemo dobiti vrijednost
b1 iz linearne kombinacije elemenata vektora y s drugim redom matrice
(X0 X) 1 X0 .

Stoga su procjenitelji dobiveni na taj nacin, linearna kombinacija vrijednosti zavisne varijable y pa ih zovemo linearnim procjeniteljima.
2. Nepristranost: znaci da u ponovljenom uzorkovanju mozemo ocekivati da je procjenitelj u prosjeku jednak stvarnom populacijskom
procjenitelju , to mozemo pisati
E(b) = :

(2.33)

Distribucija frekvencija

Na slici 2.4 mozemo vidjeti dvije distribucije dobivene ponovljenim

Nepristrana

Pristrana

E(b)=

E(b)

Slika 2.4: Nepristranost i pristranost


procjenitelja
E(b)=
uzorkovanjem iz iste populacije.
Propozicija 2.1 Procjenitelj dobiven pomocu metode najmanjih kvadrata je nepristran, ili sredina distribucije bit ce E(b) = .

29

Dokaz.
E (b) = E
= E
=

X0 X

1
1

i
h
X0 y = E X0 X

X0 X
X0 X + X0 X
h
i
1 0
+ E X0 X
X" = :

Zadnji korak slijedi iz


h
i
h
1 0
E X0 X
X " = E X0 X
zato jer su X i " nezavisni i E ["] = 0.

i
X0 (X + ")
i
h
1 0
X " = E I + X0 X
1

i
X0 E ["] = 0

(2.34)

(2.35)

Interesantno je primijetiti da u tom dokazu nismo koristili pretpostavke da nema autokorelacije i heteroskedasticnosti. To ukazuje da procjenitelji dobiveni metodom najmanjih kvadrata i u slucaju postojanja
heteroskedasticnosti i autokorelacije reziduala su nepristrani
sve dok slucajna greka ima sredinu nula i dok je neovisna od egzogenih varijabli. Izraz (X0 X) 1 X0 " iz jednadzbe 2.34 mozemo gledati
kao regresija " na X. To ukazuje da ce procjenitelji biti nepristrani, i u slucaju da smo zanemarili unijeti u model neku nedostajucu
varijablu, sve dok je ta varijabla neovisna o ostalim X i ima sredinu
0. Znaci, pristranost procjenitelja, uslijed nedostajuce objasnidbene
varijable, imat cemo samo u slucaju ako je ona zavisna o drugim nezavisnim varijablama i ako ima sredinu razlicitu od nule. Procjenitelj
dobiven metodom najmanjih kvadrata normalno je distribuiran
buduci da je b linearna funkcija ", a " je normalno distribuiran6 .
3. Ekasnost: znaci da procjenitelj dobiven metodom najmanjih kvadrata ima minimalnu varijancu izmeu svih linearnih procjenitelja koji
su nepristrani. Na slici 2.5 prikazan je ekasan i neekasan procjenitelj. Vidimo da su oba procjenitelja nepristrana, meutim, ekasan
ima manje odstupanja (minimalno) oko sredine u odnosu na neekasnog procjenitelja. Gauss-Markovljev teorem ne odnosi se na nelinearne procjenitelje. Nelinearni procjenitelj moze biti nepristran i
imati manju varijancu u odnosu na procjenitelja dobivenog metodom
najmanjih kvadrata.
4. Konzistentnost: prethodna svojstva procjenitelja odnose se na svojstva konacnih uzoraka. Kada se velicina uzorka beskonacno poveca
tada procjenitelji imaju odreena pozeljna statisticka svojstva. Ta se
svojstva zovu svojstva velikih uzoraka ili asimptotska svojstva.
Konzistentnost je jedno takvo pozeljno svojstvo, koje ima procjenitelj dobiven metodom najmanjih kvadrata. Kazemo da je procjenitelj konzistentan kada procjenitelj b povecanjem uzorka konvergira
6

Vidi o tome vie na stranici 42.

30

i
X0 "

Distribucija frekvencija

Efikasan

Neefikasan

E(b)=

Slika 2.5: Ekasan i neekasan procjenitelj

stvarnoj vrijednosti . Drugim rijecima kada je uzorak jako velik,


vjerojatnost da je b razlicit od veoma je mala ili formalno
lim Pr fjb

n!1

j > g = 0 za sve

>0

(2.36)

to znaci, asimptotski gledano, da je vjerojatnost da procjenitelj, dobiven metodom najmanjih kvadrata, odstupa vie od proizvoljne pozitivne vrijednosti od stvarnog parametra jednaka nuli. U tom slucaju
kazemo da limes vjerojatnosti b je i piemo
plim b = :

(2.37)

Cesto
se ne moze dokazati da je neki procjenitelj nepristran; moguce je
da u odreenim nelinearnim i dinamickim modelima nepristran procjenitelj uopce ne postoji. U tim slucajevima konzistentnost je minimalni
uvjet, koji se postavlja pred procjenitelja, kako bi bio koristan. Stoga su ekonometricari cesto vie zabrinuti konzistentnocu procjenitelja
nego li njihovom (ne)pristranocu.

31

Poglavlje 3

Pokazatelji kvalitete regresije


Nakon to smo procijenili parametre modela postavlja se pitanje koliko dobro tako dobiveni regresijski pravac pristaje opazanjima? Na slici 3.1 prikay

y
y= 20 + 0.8 x

x
a)

y= 20 + 0.8 x

x
b)

Slika 3.1: Pristajanje regresijskog pravca opazanjima

zana su dva istovjetna regresijska pravca uzorka izvucena iz dvije razlicite


populacije
y^ = 20 + 0:8x:
U slucaju 3.1a) tocke (opazanja) se grupiraju vrlo blizu regresijskom pravcu,
dok se u slucaju 3.1b) grupiraju daleko od regresijskog pravca. Jasno je da
gore navedeni regresijski pravac bolje pristaje slucaju a) nego slucaju b).

32

3.1

Koecijent determinacije

Uobicajen pokazatelj pristajanja regresijskog pravca nekim opazanjima je


koecijent determinacije kojeg cemo oznaciti sa R2 . Koecijent determinacije pokazuje koliko je varijance uzorka y objanjeno naim modelom
ili matematicki koecijent determinacije mozemo denirati kao
Pn
1 Pn
yi y)2
yi y)2
Var (^
y)
i=i (^
n 1
2
i=i (^
(3.1)
R =
=
= 1 Pn
P
n
Var (y)
y)2
y)2
i=i (yi
i=i (yi
n 1

P
gdje n 1 1 ni=i (^
yi y)2 pokazuje "objanjenu" varijancu y regresijskim pravP
cem a n 1 1 ni=i (yi y)2 "ukupnu" varijancu y. Drugim rijecima, nakon
skracivanja, koecijent determinacije regresijskog modela prikazuje dio ukupne varijance y koju smo objasnili regresijskim modelom.
Na slici 3.2 prikazano1 je za odreenu vrijednost xi :
ukupno odstupanje y od njegove sredine (yi

y)

regresijskim pravcem objanjeno odstupanje y; (^


yi

y)

regresijskim pravcem neobjanjeno odstupanje y; (yi


smo do sada oznacavali kao rezidual ei .

y^) kojeg

Propozicija 3.1 Kada je u modelu, dobiven metodom najmanjih kvadrata, prisutan konstantni clan b0 za yi = y^i + ei vrijedi
Var (yi ) = Var (^
yi ) + Var (ei ) :
Dokaz. Stvarnu vrijednost yi mozemo izracunati na temelju zbroja procijenjene vrijednosti y^i i slucajnog odstupanja ei
yi = y^i + ei :

(3.2)

Jednadzbu 3.2 mozemo pisati u devijacijskoj formi


(yi

y) = y^i

y^ + (ei

e)

(3.3)

Iz Svojstva 3. regresijskog pravca, iz jednadzbe 2.26 znamo da vrijedi


e=0
1

Napomena: pogreno bi bilo iz ove slike zakljuciti da je ukupno odstupanje jednako


zbroju objanjenog odstupanja i neobjanjenog odstupanja. Na slici je stvarna vrijednost
postavljena tako da se mogu zornije prikazati te velicine, ali uocljivo je da kada bi se tocka
koja prikazuje stvarnu vrijednost y nalazila, recimo, izmeu regresijskog pravca i sredine
y da bi ukupno odstupanje bilo manje od objanjenog odstupanja.

33

y
yi = b0 + b1 xi

yi

(yi yi )

(yi y )

(yi y )

xi

Slika 3.2: Ukupno, objanjeno i neobjanjeno odstupanje y od svoje sredine.

a iz Svojstva 2. regresijskog pravca, jednadzba 2.24 znamo da vrijedi2


y^ = y
Na temelju navedenih svojstava 3.3 mozemo pisati
(yi

y) = (^
yi

y) + ei :

Ako preemo operatorom sume i kvadriramo obje strane jednadzbe dobijemo


n
X

(yi

y)2 =

i=1

n
X

(^
yi

y)2 + 2

i=1

Izraz

n
X

(^
yi

y) ei +

i=1

n
X

(^
yi

n
X

e2i :

(3.4)

i=1

y) ei

i=1

predstavlja kovarijancu izmeu procijenjenog y i reziduala, to iz Svojstva


4. regresijskog pravca, jednadzba 2.31 znamo da je 0. Stoga 3.4 mozemo
pisati
n
n
n
X
X
X
(yi y)2 =
(^
yi y)2 +
e2i
(3.5)
i=1

i=1

i=1

Napomena: Svojstva 2. i 3. regresijskog pravca dobivena metodom najmanjih kvadrata ne vrijede kada u modelu nije prisutan konstantni clan b0 :Vidi izvod tih Svojstava
na stranici 27.

34

i kada podijelimo s (n 1) dobijemo


Pn
Pn
Pn 2
y)2
yi y)2
e
i=1 (yi
i=1 (^
=
+ i=1 i
n 1
n 1
n 1
ili
Var (yi ) = Var (^
yi ) + Var (ei )
cime smo dokazali Propoziciju 3.1.
Koristeci se ovim svojstvom koecijent determinacije mozemo izvesti tako da podijelimo cijelu jednadzbu s Var(yi ) te nakon skracivanja za (n 1)
dobijemo
Pn
Pn 2
Pn 2
yi y)2
2
i=1 (^
i=1 ei
i=1 ei
1 = Pn
(3.6)
2 + Pn
2 = R + Pn
y)
y)
y)2
i=1 (yi
i=1 (yi
i=1 (yi
iz cega slijedi da je koecijent deteminacije R2 jednak
Pn 2
e
2
R = 1 Pn i=1 i 2 :
y)
i=1 (yi

(3.7)

Iz 3.7 vidimo da su vrijednosti koje R2 moze poprimiti izmeu 0 i 1.


Jedino ako su sva odstupanja od regresijskog pravca jednaka nuli ei = 0
tada je R2 = 1. U tom slucaju sva opazanja leze na regresijskom pravcu
i govorimo o deterministickom, a ne vie o stohastickom modelu. Ako je
R2 = 0 to znaci da model ne objanjava kretanje y nita bolje od sredine
uzorka y. Stoga mozemo na R2 gledati kao na pokazatelj koliko regresijski
model bolje opisuje kretanje zavisne varijable u odnosu na trivijalni model
koji sadrzava samo konstantni clan.
Buduci da R2 mjeri objanjenu varijaciju varijable y , on je osjetljiv na
deniciju te varijable. Na primjer objasniti potronju studenata u naem
primjeru razlicito je od objanjenja kretanja logaritma potronje studenata,
stoga niti koecijenti determinacije iz modela, koji imaju kao zavisnu varijablu potronju, nisu usporedivi s koecijentima deteminacije koji imaju zavisnu varijablu ln(potronja): Da bi koecijenti determinacije bili usporedivi
izmeu razlicitih modela, ti modeli moraju imati istu zavisnu varijablu.
Buduci da koecijent determinacije nema u svojem temelju odreenu
hipotezu koju testiramo, vec pokazuje nam samo odnos objanjene i ukupne
varijance y, nemamo granicne vrijednosti na temelju kojih mozemo zakljuciti
je li neka pojava dovoljno dobro objanjena naim modelom. to je veci
R2 , znaci da smo veci dio pojave objasnili, ali teko je odrediti i to je
to "veliki" koecijent determinacije. Vrijednost R2 = 0:5 moze biti niska
u slucajevima kada analiziramo vremenske nizove, dok u slucaju analize
vremenskih presjeka moze biti zadovoljavajuce visoka, buduci da je lake
objasniti agregatnu potronju zemlje kroz vrijeme (vremenski niz) u odnosu
na potronju pojedinih kucanstava u zemlji (vremenski presjek).
35

Primjer 3.1 Na temelju podataka iz Tablice 2.2 mozemo izracunati koecijent determinacije
Pn
(^
yi y)2
19317:56
2
R = Pi=i
n
2 = 24120:00 = 0:800 89:
y)
i=i (yi

Buduci da su jednadzbe 3.1 i 3.7 istovjetne za model procijenjen pomocu metode najmanjih kvadrata s konstantnim clanom, R2 mozemo dobiti i
pomocu
Pn 2
e
4802:44
R2 = 1 Pn i=1 i 2 = 1
= 0:800 89:
24120:00
y)
i=1 (yi

Ovaj nam koecijent determinacije govori da smo 80% varijacije potronje studenata uspjeli objasniti pomocu kretanja njihovog raspolozivog dohotka.
Koecijenta determinacije, kao to je deniran u 3.7 prate tri problema:
1. Ne vrijedi za regresijske modele koji su izracunati metodom najmanjih kvadrata bez konstantnog clana b0 : Jednadzbu 3.7 dobili smo iz
pretpostavki
e = 0 , y^ = y
(3.8)
koje ne vrijede kada nemamo konstantni clan u modelu3 . U tom slucaju dobiveni koecijent determinacije iz 3.7 nije isti koecijentu determinacije iz 3.1. Kada nemamo konstantni clan u modelu koristimo
tzv. necentriranim koecijentom determinacije koji glasi
Pn
Pn 2
y^i2
e
2
i=1
necentrirani R = Pn
= 1 Pni=1 i2 :
(3.9)
2
i=1 yi
i=1 yi
Ovaj se pokazatelj zove necentrirani jer varijable nisu centrirane oko
sredine ili nisu u devijacijskoj formi kao u slucaju obicnog koecijenta
determinacije iz 3.1 koji stavlja u odnos centrirane varijable oko svojih
sredina, pa se stoga cesto zove i centrirani koecijent determinacije. Za racunanje necentriranog koecijenta determinacije, buduci
da ne koristi devijacijske forme, nije potrebno zadovoljavati svojstva
iz 3.8.
Primjer 3.2 Ako za procjenu potronje studenata iz Tablice 2.1 koristimo model bez konstantnog clana b0
y^i = b1 xi + ei
3

Vidi Svojstvo 2 i 3 regresijskog pravca na stranici 27.

36

centrirani R2 izracunat pomocu jednadzbe 3.1 je


Pn
yi y)2
33149:51
2
i=i (^
R = Pn
2 = 24120:00 = 1: 374 4
y)
i=i (yi
dok izracunat pomocu 3.7 je
Pn 2
e
2
R = 1 Pn i=1 i 2 = 1
y)
i=1 (yi

6891:56
= 0:714 28:
24120:00

Necentrirani R2 je

Pn
y^i2
225308:44
=
necentrirani R = Pi=1
= 0:970 32
n
2
232200:00
i=1 yi
2

li alternativno

necentrirani R = 1

Pn 2
e
Pni=1 i2 = 1
i=1 yi

6891:56
= 0:970 32:
232200:00

Iz gonjeg primjera vidimo da su centrirani R2 ; izracunati na temelju


3.1 i 3.7, razliciti
Pn
Pn 2
yi y)2
e
i=i (^
Pn
Pn i=1 i 2
2 6= 1
y)
y)
i=i (yi
i=1 (yi

i da je R2 ; izracunat na temelju 3.1 veci od 1, to ukazuje da u tom


slucaju ne vrijedi Var(yi ) =Var(^
yi ) +Var(ei ). Jasno je da je tako iz2
racunat R pogreno izracunat jer nisu zadovoljene pretpostavke iz
3.8. S druge strane iz primjera 3.2 proizlazi da je necentrirani koecijent determinacije ekvivalentan i kada nemamo konstantnog clana u
modelu. Odnosno, i dalje vrijedi
Pn
Pn 2
y^i2
i=1 ei
Pi=1
P
=
1
n
n
2
2:
y
i=1 i
i=1 yi

2. Ne vrijedi za regresijske modele koji nisu izracunati pomocu metode


najmanjih kvadrata (OLS). Buduci da smo koecijent determinacije
izracunali na temelju Svojstava regresijskog pravca, izvedenog pomocu
metode najmanjih kvadrata, tada, ako koristimo metodu najmanjih
kvadrata, imat cemo jednakost izmeu 3.1 i 3.7, no ako je regresijski
pravac izracunat pomocu neke druge metode tada ta jednakost vie
ne vrijedi, stoga i tako izracunat R2 ne vrijedi. Postoji alternativni
nacin racunanja koecijenta determinacije R2 ; koji u slucaju metode
najmanjih kvadrata ostaje isti kao u 3.1 i 3.7, a za ostale metode
37

(ne OLS) procjenjivanja regresijskog pravca krece se uvijek izmeu


vrijednosti 0 i 1. Taj koecijent determinacije mozemo izracunati kao
R2 = corr2 (yi ; y^i ) =

Pn

i=1 (yi

P
( ni=1 (yi

y))

y) y^i
Pn

i=1

y^
y^i

y^

!2

(3.10)

tj. izracunavamo ga na temelju kvadriranog koecijenta korelacije izmeu stvarnih y i procijenjenih y^. Ovako deniran R2 govori koliko se
dobro mogu varijacije u y objasniti varijacijama u y^; ili pokazuje jacinu linearne veze izmeu ovih dviju varijabli. Buduci da se koecijent
korelacije uobicajeno oznacava s r, zato se koecijent determinacije oznacava s R2 da bi se naglasilo da je koecijent determinacije kvadrat
koecijenta korelacije.
Primjer 3.3 Na temelju podataka iz Tablice 2.2 imamo
R2 = corr2 (yi ; y^i ) = 0:89492 = 0:800 85:
Iz gornjeg primjera proizlazi da je tako izracunat koecijent determinacije istovjetan koecijentima deteminacije koje smo izracunali na
temelju 3.1 i 3.7. Interesantno je primijetiti da u slucaju samo jedne
nezavisne varijable, kao u gornjem primjeru, buduci da je procijenjeni y^ linearna kombinacija samo x, mozemo dobiti isti koecijent
determinacije ako kvadriramo koecijent korelacije izmeu x i y; to
se jasno vidi u sljedecem primjeru.
Primjer 3.4
R2 = corr2 (yi ; xi ) = 0:89492 = 0:800 85:
3. R2 nikada ne opada s povecanjem broja nezavisnih varijabli i kada dodatne varijable ne objanjavaju kretanje zavisne varijable. Uobicajeni
nacin rjeavanja tog problema je ukljucivanje u izracun koecijenta
determinacije stupnjeve slobode, to nam daje tzv. korigirani R2
kojeg oznacavamo s
Pn 2
1
i=1 ei
(n
k)
R2 = 1
:
(3.11)
P
n
1
y)2
i=1 (yi
(n 1)

P
Var(yi ) je neovisna od broja nezavisnih varijabli x, dok ni=1 e2i ovisi
oPbroju nezavisnih varijabli x, jer to je veci broj x-ova, smanjit ce se
n
2
i=1 ei . Da bi se efekt smanjenja sume kvadrata reziduala pri ukljucivanju novih varijabli "kaznio", suma kvadrata reziduala dijeli se sa
38

stupnjevima slobode (n k). U tom se slucaju koecijent determinacije ne povecava automatski s povecanjem broja regresora,
vec ovisi
P
o tome je li nova varijabla vie doprinijela smanjenju ni=1 e2i svojim
ulaskom u model ili vie tetila smanjenjem stupnjeva slobode (n k).
Korigirani R2 je uvijek manji od nekorigiranog R2 , osim u slucaju kada model ukljucuje samo konstantni clan pa su oba jednaka nuli. U
ekstremnim slucajevima korigirani R2 moze biti negativan.

3.2

Primjer 3.5 Na temelju podataka iz Tablice 2.2 korigirani koecijent


determinacije bit ce
P
1= (n k) ni=1 e2i
1= (5 2) 4802:44
2
R =1
= 0:734 53:
Pn
2 = 1 1= (5
1) 24120:00
1= (n 1) i=1 (yi y)

3.2.1

Znacajnost procjenitelja

Standardna greka procjenitelja

Na temelju jednadzbe 2.13 procijenili smo vrijednosti parametara populacije


na temelju jednog uzorka iz te populacije. Buduci da se podaci mijenjaju
u ovisnosti o uzorku kojeg vucemo iz neke populacije, mijenjaju se i parametri uzorka b kojima procjenjujemo parametre populacije . Postavlja
se stoga pitanje koliko bi meusobno odstupali parametri razlicitih uzoraka
s istim brojem opazanja koje vucemo iz iste populacije, ili koliko mozemo
biti sigurni da dobiveni parametri na temelju nekog uzorka precizno opisuju
"nevidljive" parametre populacije? Zato to ne znamo stvarne vrijednosti populacije, zakljucke o odstupanjima u populaciji donosimo na temelju
odstupanja u uzorku. Ako uzorak ima velika odstupanja oko regresijske
funkcije, kao na Slici 3.1b); zakljucujemo da je taj uzorak izvucen iz neke
populacije koja takoer ima velika odstupanja. Ako su odstupanja velika,
tada se iz populacije mogao izvuci jedan drugi uzorak koji ima bitno razlicite vrijednosti parametara regresijske funkcije uzorka u odnosu na na prvo
izvuceni uzorak. U tom slucaju dobiveni parametri iz jednadzbe 2.13 nisu
pouzdani za opisivanje parametara populacije, ili drugim rijecima: ne mozemo biti sigurni da parametri dobiveni iz uzorka precizno opisuju stvarne
"nevidljive" parametre populacije. S druge strane ako su odstupanja oko
regresijske funkcije uzorka mala, kao na Slici 3.1a), tada pretpostavljamo da
je taj uzorak izvucen iz neke populacije koja ima mala odstupanja, i da bi
parametri, koje bismo dobili iz ostalih uzoraka iste velicine, izvuceni iz iste
populacije, bili vrlo slicni parametrima regresijskog pravca iz prvog uzorka.
Preciznost (pouzdanost) procjenitelja mjerimo standardnom devijacijom, koju zovemo i standardnom grekom procjenitelja i racunamo
je na temelju varijance procjenitelja. Varijancu procjenitelja mozemo
izraziti
Var (b) = E (b E [b]) (b E [b])0 :
(3.12)
39

Na temelju svojstva nepristranosti procjenitelja dobivenih metodom najmanjih kvadrata imamo


E [b] =
(3.13)
to 3.12 pretvara u
2

Var (b) = E (b
2
1]

E [b1

6 E [(b2
6
=6
4
E [(bk

2 ) (b1

..
.
k ) (b0

)0

) (b

E [(b1
1 ) (b2
2
E [b2
1 )]
2]
..
.

2 )]

0 )]

2 )]

E [(bk

E [(b1
E [(b2
..

k ) (b2

1 ) (bk

k )]

2 ) (bk

k )]

..
.

.
E [bk

2
k]

(3.14)

to mozemo pisati
2
6
6
Var (b) = 6
4

Var (b1 )
Cov (b1 ; b2 )
Cov (b2 ; b1 )
Var (b2 )
..
..
.
.
Cov (bk ; b1 ) Cov (bk ; b2 )

..

Cov (b1 ; bk )
Cov (b2 ; bk )
..
.

Var (bk )

7
7
7:
5

(3.15)

Vidimo da je matrica Var(b) simetricna matrica s varijancama parametara na glavnoj dijagonali i kovarijancama izmeu parametara na pozicijama
izvan glavne dijagonale.
Iz jednadzbe 2.13 znamo da
b =

X0 X

X0 X

X0 X

= I + X0 X

1
1

+ X0 X

X0 (X + ")
1

+ X0 X

X0 "

X0 "

X0 "

(3.16)

iz cega imamo
) = X0 X

(b

X0 y = X0 X

X0 ":

(3.17)

Vrijednosti matrice Var(b) mozemo stoga izracunati na temelju


Var (b) = E (b
) (b
)0
h
0
1 0
= E X0 X
X "" X X0 X
=

X0 X

X0

X0 X

X0 X

X0 X

40

In X X 0 X
X0 X

i
1

(3.18)

3
7
7
7
5

Iz 3.18 poznata nam je vrijednost matrice (X0 X) 1 . Meutim skalar 2


predstavlja varijancu regresijskog modela populacije koja nam je nepoznata. Mozemo je procijeniti pomocu nepristranog procjenitelja varijance populacije izracunatog iz odstupanja uzorka4
s2 =

e0 e
n k

(3.19)

to 3.18 pretvara u

e0 e
1
X0 X
:
(3.20)
n k
Standardne devijacije (greke) procjenitelja mozemo izracunati tako da korjenujemo varijance ili
p
sd (b) =
Var (b)
r
e0 e
=
(X0 X) 1 :
(3.21)
n k
Iz jednadzbe 3.18 vidimo da to je veca varijanca modela populacije
2 (veca rasprenost oko regresijske funkcije populacije) da je veca i varijanca procjenitelja Var(b). Znaci, ako imamo vrlo rasprenu populaciju oko
regresijske funkcije populacije tada i regresijske funkcije uzoraka, koje su
izvedene iz te populacije, mogu se meusobno jako razlikovati. U slucaju
da imamo malu rasprenost populacije oko regresijske funkcije populacije
tada ce uzorci izvedeni iz te populacije davati slicne vrijednosti parametara
regresijskih funkcija uzoraka.
Buduci da ne znamo 2 , nju smo procijenili iz varijance uzorka s2 (jednadzba 3.19), pretpostavljajuci da ako uzorak ima velika odstupanja oko
regresijske funkcije uzorka da i populacija iz koje je taj uzorak izvucen ima
velika odstupanja oko regresijske funkcije populacije.
Var (b) =

Primjer 3.6 Na temelju jednadzbe 3.21 mozemo izracunati Var(b) za parametre iz primjera 2.1 na sljedeci nacin:
Var (b) =
=
=

4802:44
5 2
4802:44
3

5
1550
1550 562 500
225
164
31
8200

31
8200
1
82 000

2196: 2
6: 051 9
6: 051 9 0:01 952 2

Vidimo da je Var(b0 ) = 2196:2, Var(b1 ) = 0:019522, te kovarijanca Cov(b0 ; b1 ) =


6:0519. Standardna devijacija procjenitelja bit ce
p
p
sd (b0 ) =
Var (b0 ) = 2196:2 = 46: 864
p
p
sd (b1 ) =
Var (b1 ) = 0:019522 = 0:139 72:
4
Dokaz da se radi o nepristranom procijenitelju varijance populacije moze se naci u [3],
str. 48-49. ili [5], str. 30-31.

41

Do sada nismo imali nikakvu pretpostavku vezanu za oblik distribucije odstupanja "i , osim to smo pretpostavili da su meusobno nekorelirani,
neovisni o X, da imaju sredinu nula i konstantnu varijancu. Meutim da bi
se moglo statisticki zakljucivati i testirati hipoteze moramo eksplicitno denirati pretpostavku o distribuciji odstupanja. Uobicajena je pretpostavka
da su odstupanja "i normalno distribuirana, tj.
"

N 0;

In :

(3.22)

Drugim rijecima, vektor " normalno je distribuiran sa sredinom nula i s


kovarijancnom matricom 2 In . Iz jednadzbe 3.16 vidimo da su procjenitelji
b linearna funkcija vektora odstupanja " iz cega slijedi da su procjenitelji
dobiveni metodom najmanjih kvadrata takoer normalno distribuirani sa
sredinama i kovarijancnom matricom 2 (X0 X) 1 tj.
b

X0 X

(3.23)

iz cega slijedi da je svaki element vektora b normalno distribuiran ili


bk

k;

X0 X

1
kk

gdje (k; k) predstavlja element na glavnoj dijagonali matrice (X0 X)

3.2.2

(3.24)
1

Testiranje hipoteza nad procjeniteljima

Pri statistickom testiranju hipoteza mozemo uciniti dvije vrste greke: mozemo odbaciti hipotezu koja je istinita ili mozemo ne odbaciti hipotezu koja
je kriva. Odbacivanje istinite hipoteze u statistici se zove greka I. tipa,
dok se neodbacivanje krive hipoteze zove greka II. tipa. Vjerojatnost nastanka greke I. tipa neposredno kontrolira istrazivac proizvoljnim odabirom
razine znacajnosti koja se u statistici oznacava s : Uobicajeno je testirati na razini znacajnosti od 5%, tj. s "ugraenom" vjerojatnocu greke I.
tipa od 5%. Postavlja se pitanje zato dodatno ne smanjiti tu vjerojatnost
greke, pa testirati na razini znacajnosti od 1% ili manje? Nazalost na tim
razinama znacajnosti dodatno smanjenje vjerojatnosti greke I. tipa drasticno povecava vjerojatnost da se ucini greka II. tipa (koja se u statistici
uobicajeno oznacava sa ), tj. da se ne odbaci hipoteza koja je kriva. Vjerojatnost da se ne ucini greka II. tipa zove se snaga testa (1
); odnosno
snaga testa pokazuje sposobnost testa da odbaci krivu hipotezu.
Ekonometrijski paketi pri testiranju razlicitih hipoteza izracunavaju tzv.
p vrijednost (p iz eng. probability) ili tocnu razinu znacajnosti testa
koja prikazuje najmanju razinu znacajnosti pri kojoj mozemo odbaciti H0 :
Ako je p vrijednost manja od razine znacajnosti ; mozemo odbaciti H0 .
Ona, takoer, pokazuje osjetljivost odluke o odbacivanju nul hipoteze u
odnosu na razinu znacajnosti. Tako npr. vrijednost p = 0:07 ukazuje da
42

mozemo odbaciti nul hipotezu na razini znacajnosti od 10%, ali ne i na


razini znacajnosti od 5%. Kada mozemo odbaciti H0 , kazemo da su rezultati
statisticki znacajni, a kada ne mozemo odbaciti H0 , kazemo da rezultati
nisu statisticki znacajni.
Za testiranje hipoteza o parametrima (procjeniteljima) modela koristit
cemo dva testa: t-test za testiranje zasebnih hipoteza i F-test za testiranje
zajednickih hipoteza.
t-test
Iz jednadzbe 3.24 slijedi da varijabla
bk

z=

2 (X0 X) 1
kk

1=2

(3.25)

ima standardnu normalnu distribuciju, tj. sredinu nula i varijancu 1. Buduci da nam nije poznata varijanca populacije 2 , zamijenit cemo je procijenjenom
varijancom na temelju uzorka iz jednadzbe 3.19,
Pnepristranom
e2i : Buduci da su reziduali uzorka ei normalno distribuirani, njis2 = n 1 k
P 2
hova suma kvadrata
ei ima 2 distribuciju5 . Od tuda slucajna varijabla
bk

tk =

s2 (X0 X)kk1

1=2

(3.26)

predstavlja odnos standardizirane normalne varijable i drugog korijena varijable s 2 distribucijom. Buduci da su ove dvije varijable i meusobno
nezavisne, tada slucajna varijabla tk ima Studentovu t distribuciju s (n k)
stupnjeva slobode6 . Studentova distribucija slicna je normalnoj distribuciji. Ima neto deblje krakove u odnosu na normalnu distribuciju kada imamo
mali broj stupnjeva slobode, no povecanjem broja stupnjeva slobode postaju
slicnije i za dovoljan velik broj stupnjeva slobode postaju identicne.
Slijedom gore recenog mozemo konstruirati t-test kojim mozemo testirati
hipoteze o parametru populacije k pomocu
tk =

bk
k
sd (bk )

(3.27)

koji ima t distribuciju s (n k) stupnjeva slobode. Vidimo da su nam u 3.27


poznate sve velicine: parametar uzorka bk , standardna greka parametra
uzorka sd(bk ) i vrijednost parametra populacije koju proizvoljno testiramo
k:
5
6

Vidi Dodatak C.1, teorem C.3.


Vidi Dodatak C.1, teorem C.5.

43

Dvostrani t-test Na temelju jednadzbe 3.27 mozemo testirati hipotezu


da k poprima vrijednost k , tj. H0 : k = k nasuprot alternativnoj
hipotezi H1 : k 6= k . Velika razlika u vrijednostima parametara uzorka bk ;
kojeg smo procijenili pomocu metode najmanjih kvadrata i testne velicine k
podrazumijeva malu vjerojatnost da su te dvije velicine iste. U tom slucaju
mozemo lake odbaciti H0 . Nadalje iz brojnika jednadzbe 3.27 mozemo
uociti da se povecanjem razlike izmeu bk i k testna statistika tk povecava
u apsolutnoj vrijednosti. Stoga mozemo lako zakljuciti kako veca vrijednost
jtk j implicira lake odbacivanje H0 .
Interesantno je dalje primijetiti da povecanje velicine uzorka smanjuje
standardnu greku procjenitelja. Buduci da se standardna greka procjenitelja nalazi u nazivniku jednadzbe 3.27 to povecava t vrijednost. Veca t vrijednost podrazumijeva lake odbacivanje H0 to kod velikih uzoraka znatno
smanjuje vjerojatnost greke II. tipa. Kako bi kompenzirali taj efekt, istrazivaci uobicajeno smanjuju vjerojatnost greke I. tipa tako to smanje razinu
znacajnosti njihovih testova. To objanjava zato je kod velikih uzoraka
opravdano birati razinu znacajnosti od 1%, umjesto uobicajenih 5%, a kod
vrlo malih uzoraka razinu znacajnosti od 10%.
Buduci da alternativna hipoteza H1 : k 6= k dozvoljava vrijednosti
koje su vece ali i manje od k , tada se takav test zove dvostrani test
(testira se na oba kraka distribucije) cije se kriticne vrijednosti t =2;(n k)
deniraju kao vjerojatnost
Pr jtk j > t

=2;(n k)

= :

(3.28)

Odbacujemo H0 ako je apsolutna vrijednost jtk j veca od kriticne vrijednosti t =2;(n k) gdje oznacava razinu znacajnosti a (n k) stupnjeve
slobode.

Primjer 3.7 Pretpostavimo da zelimo testirati, s razinom znacajnosti od


5%; hipotezu da je granicna sklonost potronji studenata, iz Tablice 2.1,
0:6:Na temelju parametra kojeg smo izracunali u primjeru 2.1 i standardne
devijacije koju smo izracunali u primjeru 3.6 mozemo testirati H0 : 1 = 0:6
nasuprot alternativnoj hipotezi H1 : 1 6= 0:6 pomocu t-testa na sljedeci
nacin:
b1
0:485 0:6
1
t1 =
=
= 0:823:
sd (b1 )
0:1397
U tablici Studentove distribucije vjerojatnosti E.2, prikazanoj u Dodatku,
mozemo naci kriticnu vrijednost t0:025;3 = 3:1824: Buduci da je u naem
primjeru jt1 j < t =2;(n k) , tj. 0:823 < 3:1824 zakljucujemo da ne mozemo
odbaciti nul hipotezu H0 = 0:6 :
Umjesto tablice Studentove distribucije mogli smo koristiti tocnu razinu znacajnosti testa (p vrijednost) za dvostranu t distribuciju, s 3 stupnja
44

slobode i testnom velicinom od 0:823, koju uobicajeno izracunavaju ekonometrijski paketi. U naem primjeru ona iznosi p = 0:4707, to nam govori
da ne mozemo odbaciti nul hipotezu jer vjerojatnost da smo ucinili greku
ako odbacimo H0 = 0:6 je 47:07%; mnogo veca od razine znacajnosti od 5%
na kojoj testiramo. Buduci da imamo vrlo mali uzorak (n = 5) opravdano
bi bilo testirati na razini znacajnosti od 10%. Ali na temelju p vrijednosti
od 47:07% odmah mozemo zakljuciti da i na razini od 10% ne mozemo odbaciti nul hipotezu. Lako se moze uociti da p vrijednost pokazuje "granicnu"
razinu znacajnosti testa, ili najmanju razinu znacajnosti pri kojoj se moze
odbaciti nul hipoteza (u naem primjeru nul hipotezu mozemo odbaciti tek za
razine znacajnosti
47:07%). Statisticko zakljucivanje na temelju p vrijednosti identicno je zakljucivanju na temelju tablice Studentove distribucije
vjerojatnosti.
U prethodnom primjeru 3.7 vidjeli smo da rezultati testiranja nisu bili statisticki znacajni, ili da nismo mogli odbaciti H0 = 0:6, to ne znaci
da automatski prihvacamo vrijednost testiranog parametra 1 = 0:6 kao
istinitu. U naem smo primjeru mogli testirati cijeli skup razlicitih hipoteza koje ne mozemo odbaciti na razini znacajnosti od 5%, kao to su npr.
H0 : 1 = 0:5; H0 : 1 = 0:3; H0 : 1 = 0:75: Bilo bi neozbiljno tvrditi da su
sve te hipoteze istovremeno istinite, ili da ih sve istovremeno prihvacamo.
Stoga je jedini prikladni zakljucak da se gore navedene hipoteze ne mogu
odbaciti. Drugim rijecima hipoteze u klasicnoj statistici ne prihvacaju se,
vec se odbacuju ili ne odbacuju.
Ekonometrijski paketi uobicajeno automatski prikazuju, pokraj vrijednosti parametara i njihovih standardnih devijacija, t vrijednosti kojima se
testira hipoteza H0 : k = 0, nasuprot hipotezi H0 : k 6= 0. Buduci da je u
tom slucaju k = 0; t-test jednadzbe 3.27 pretvara se u
tk =

bk
bk 0
bk
k
=
=
;
sd (bk )
sd (bk )
sd (bk )

(3.29)

kojeg uobicajeno zovemo t-omjer. Ako je procijenjeni parametar znacajno


razlicit od 0; tada mozemo reci da varijabla xk , koja se veze za taj parametar,
ima znacajan utjecaj na zavisnu varijablu y: Drugim rijecima, ako mozemo
odbaciti H0 : k = 0, tada kazemo da je utjecaj varijable xk na y znacajan.
Primjer 3.8 Je li utjecaj raspolozivog dohotka na potronju studenata iz
Tablice 2.1 znacajan, mozemo testirati pomocu
t1 =

b1
0:485
=
= 3: 472:
sd (b1 )
0:1397

Tocna razina znacajnost testa iznosi p = 0:04; na temelju koje mozemo sa


znacajnocu od 5 i 10% odbaciti H0 : 1 = 0: S druge strane, ako odaberemo razinu testiranja od 1% znacajnosti, tada ne mozemo odbaciti tu istu
45

nul hipotezu. Mozemo stoga zakljuciti da je utjecaj raspolozivog dohotka na


potronju studenata statisticki znacajan ako testiramo sa znacajnocu od 5 i
10%, no ako testiramo sa znacajnocu od 1%, ne mozemo odbaciti hipotezu
da raspoloziv dohodak studenata ne utjece na njihovu potronju.
Jednostrani t test Ponekad moramo testirati hipoteze nad parametrima koje imaju jednostranu alternativnu hipotezu. Ako testiramo hipotezu
H0 : k
k , vidimo da ce alternativna hipoteza H1 : k > k biti jednostrana buduci da uzima u obzir samo vrijednosti koje su vece od k . Ako
razmotrimo jednadzbu 3.27 vidimo da velika pozitivna razlika brojnika vodi ka velikoj pozitivnoj tk vrijednosti (standardna greka procjenitelja koja
se nalazi u nazivniku izraza uvijek je pozitivna), a velika negativna razlika
brojnika vodi ka velikoj negativnoj vrijednosti tk . Velika pozitivna razlika vodi ka odbacivanju H0 , dok je velika negativna razlika u skladu s nul
hipotezom H0 : k
k i ne vodi ka njezinom odbacivanju. Analogno,
mogli smo konstruirati hipotezu H0 : k
k , sa H1 : k < k : Kriticnu
vrijednost za jednostrani test mozemo stoga izraziti kao
Pr tk > t
za H0 :

nasuprot H1 :

>

Pr tk <
za H0 :

nasuprot H1 :

;(n k)

<

(3.30)

te

;(n k)

(3.31)

k:

Primjer 3.9 Pretpostavimo da zelimo testirati, s razinom znacajnosti od


5%, hipotezu da je granicna sklonost studenata iz Tablice 2.1 jednaka ili
veca od 0:6, ili H0 : 1 0:6, nasuprot hipotezi H0 : 1 < 0:6. Na temelju
jednadzbe 3.27 dobit cemo
t1 =

b1
0:485 0:6
1
=
=
sd (b1 )
0:1397

0:823;

istu vrijednost koju smo dobili u primjeru 3.7 kada smo testirali dvostranim
testom hipotezu H0 : 1 = 0:6: Kriticna vrijednost za jednostrani test7 s 5%
znacajnosti i 3 stupnja slobode iznosi t0:05;3 = 2:3534, dok je za dvostrani
test iz primjera 3.7 bila t0:025;3 = 3:1824: Buduci da je u naem primjeru
t1 > t0:025;3 , tj. 0:823 > 2:3534; na temelju jednadzbe 3.31 ne mozemo
odbaciti s 5% znacajnosti hipotezu H0 : 1 0:6: Ekonometrijski paketi uobicajeno prikazuju p vrijednosti za dvostrane testove, koji su ceci u praksi.
Ako koristimo za statisticko zakljucivanje p vrijednosti umjesto tablica Studentove distribucije za jednostrani t-test, moramo dobivenu p vrijednost za
dvostrani test podijeliti s 2. Tako u naem slucaju imamo p=2 = 0:4707=2 =
7

Vidi Dodatak, Tablica E.2

46

0:235 4, to ukazuje da je vjerojatnost da smo pogrijeili 23:54%, ako odbacimo H0 . Drugim rijecima ako testiramo s 5% znacajnosti, ne mozemo
odbaciti hipotezu da je granicna sklonost potronji studenata iz naeg primjera jednaka ili veca od 0:6:
Primjer 3.10 Pretpostavimo da zelimo testirati, sa znacajnocu od 5%, hipotezu da je granicna sklonost potronji studenata iz Tablice 2.1 jednaka ili
manja od 0:1, ili H0 : 1 0:1, nasuprot hipotezi H1 : 1 > 0:1. Na temelju
jednadzbe 3.27 imamo
t1 =

b1
0:485 0:1
1
=
= 2: 756:
sd (b1 )
0:1397

(3.32)

Iz Studentove tablice imamo t0:05;3 = 2:3534. Buduci da t1 > t0:025;3 ; ili


2:756 > 2:3534 na temelju jednadzbe 3.30 mozemo odbaciti H0 : Do istog
zakljucka mozemo doci koristeci se p vrijednocu koja za ovaj test iznosi
p=2 = 0:070=2 = 0:035 :Drugim rijecima vjerojatnost da smo ucinili greku
je 3:5%, ako odbacimo nul hipotezu. Zato to je vjerojatnost da smo ucinili
greku, kada odbacujemo H0 , manja od "doputene" vjerojatnosti greke od
5%, hipotezu H0 : 1 0:1 mozemo odbaciti.
Interval pouzdanosti parametara Interval pouzdanosti parametra mozemo denirati kao raspon svih vrijednosti k za koje se H0 : k = k ne
moze odbaciti t-testom. Vjerojatnost da se t statistika nae izmeu kriticnih
t vrijednosti iznosi
Pr

tk

=2;(n k)

=2;(n k)

=1

(3.33)

Supstitucijom jednadzbe 3.27 u 3.33 dobijemo


Pr

=2;(n k)

Nakon sreivanja po
Pr bk

sd (bk ) t

bk
k
sd (bk )

=2;(n k)

=1

(3.34)

imamo

=2;(n k)

bk + sd (bk ) t

=2;(n k)

=1

ili kompaktno interval pouzdanosti populacijskog parametra


pisati kao
bk sd (bk ) t =2;(n k) :

(3.35)
k

mozemo
(3.36)

Iz jednadzbe 3.36 vidimo da interval pouzdanosti izracunavamo na temelju


poznatih velicina koje smo izvukli iz uzorka te populacije, a to su: parametar
bk i njegova standardna devijacija sd(bk ). to je veca standardna devijacija
procjenitelja, to ce biti iri interval pouzdanosti. iri interval pouzdanosti

47

znaci vecu neizvjesnost u procjenjivanju populacijskog nepoznatog parametra k . Stoga se na standardnu greku procjenitelja gleda kao na mjeru preciznosti procjenitelja koja nam govori koliko precizno procjenitelj bk opisuje
stvarnu vrijednost populacijskog k .
Populacijski parametar k je nepoznata, ali ksna vrijednost, zato izraz
3.35 ne mozemo interpretirati kao "(1
) je vjerojatnost da se populacijski
parametar k nalazi u granicama bk sd (bk ) t =2;(n k) " jer bi to impliciralo
da je interval pouzdanosti ksan, a populacijski parametar slucajna vrijednost. Buduci da je populacijski parametar k ksna vrijednost, kada bi
interval pouzdanosti takoer bio ksan, vrijednost populacijskog parametra
lezala bi, ili ne bi lezala, u ksnom intervalu pouzdanosti. U tom slucaju
imali bismo samo dvije vjerojatnosti: ako lezi, vjerojatnost je 1 (100%);
ako ne lezi u intervalu pouzdanosti je 0. Meutim interval pouzdanosti nije ksan vec slucajan jer ovisi o izvucenom uzorku iz populacije. Stoga
jedini pravilan nacin interpretacije intervala pouzdanosti parametra je da
u ponovljenom uzorkovanju, 100 (1
) % izracunatih slucajnih intervala
pouzdanosti, na temelju izvucenih uzoraka iz iste populacije, ukljucivat ce
stvarni populacijski skni parametar k: Drugim rijecima kada bi se iz neke
populacije izvuklo 100 uzoraka i na temelju njih izracunalo, koristeci izraz
3.36, 100 slucajnih 95 postotnih intervala pouzdanosti za ksni populacijski parametar k , u 95 od 100 intervala pouzdanosti nali bismo vrijednost
populacijskog ksnog parametra k :
Primjer 3.11 Na temelju jednadzbe 3.36 mozemo izracunati 95 postotne
intervale pouzdanosti za parametre modela izracunatih u primjeru 2.1. Da
bismo dobili 95 postotni interval pouzdanosti biramo razinu znacajnosti od
= 0:05 jer 100 (1
) % = 100 (1 0:05) % = 95%: Kriticna vrijednost
t =2;(n k) iznosi t0:025;3 = 3:1824 (vidi Tablica E.2 u Dodatku). Na temelju
izraza 3.36 mozemo izracunati 95 postotni interval pouzdanosti za parametar
0

b0

sd (b0 ) t

=2;(n k)

= 53: 535

46:864

= 53:535

149: 14

3:1824

to mozemo pisati
95: 605
Za parametar

202:675:

95 postotni interval pouzdanosti bit ce


b1

sd (b1 ) t

=2;(n k)

= 0:48537

0:139 72

= 0:48537

0:444 6

3:1824

to mozemo pisati
0:04077

48

:0:92997:

F -test
Na temelju t-testa mozemo testirati pojedinacne hipoteze nad jednim koecijentom. Postavlja se pitanje kako testirati zajednicke hipoteze nad koecijentima kao to su na primjer
H0 :

= 0 ili H0 :

= 1:

U tom slucaju mozemo konstruirati ograniceni model koji ce u sebi sadrz avati ogranicenja nad parametrima i testirati razliku izmeu neobjanjena
odstupanja ogranicenog modela i neogranicenog modela. Kod neogranicenog modela ne forsiramo da parametri poprime odreene vrijednosti, vec
doputamo da poprime bilo koju vrijednost koja, u slucaju da rabimo metodu najmanjih kvadrata, minimizira zbroj kvadrata odstupanja. Kod ogranicenog modela, s druge strane, forsiramo da odreeni parametri poprime
a priori zadane vrijednosti koje ne minimiziraju zbroj kvadrata odstupanja.
Jasno je stoga da zbroj kvadrata neobjanjenih odstupanja bit ce uvijek veci
kod ogranicenog modela u odnosu na neograniceni model. Nadalje, to se
forsirani parametar u neogranicenom modelu udaljava svojom vrijednocu
od parametra koji minimizira sumu kvadrata odstupanja (dobiven neogranicenim modelom) to ce biti veca razlika izmeu sume kvadrata odstupanja
ogranicenog i neogranicenog modela. Na taj nacin prirodno se namece test
koji usporeuje zbrojeve kvadrata neobjanjenih odstupanja ogranicenog i
neogranicenog modela. Ako je razlika velika, tada ce se nul hipoteza moci odbaciti, ako je razlika mala,Ptada se nul hipoteza nece moci odbaciti.
Ako sumu kvadrata odstupanja
(yi y^i )2 oznacimo s RSS, tada F test
mozemo pisati
(RSSR RSSU R ) =J
F =
(3.37)
RSSU R = (n k)
gdje RSSR oznacava sumu kvadrata odstupanja ogranicenog modela, RSSU R
sumu kvadrata odstupanja neogranicenog modela, J broj ogranicenja i (n k)
stupnjeve slobode neogranicenog modela. Buduci da je RSSR uvijek veci
od RSSU R , gornji izraz uvijek ce biti pozitivan.
Ako
da su odstupanja
ei normalno distribuirana,
P vrijedi pretpostavka
P 2
tada
(yi y^i )2 ; to skraceno piemo
ei , iz Teorema8 C.3 ima 2 distribuciju. Na temelju Teorema C.4 znamo da zbrajanje i oduzimanje varijabli
s 2 distribucijom daju varijablu s 2 distribucijom. Stoga ce i razlika
RSSR RSSU R , takoer, imati 2 distribuciju. Iz Teorema C.6 znamo da
x =n
ce odnos dviju slucajnih varijabli s 2 distribucijom x12 =n21 imati F distribuciju s (n1 ; n2 ) stupnjeva slobode, ili kao u slucaju nae jednadzbe 3.37 F -test
ima F distribuciju sa (J; n k) stupnjeva slobode. F -test je jednostrani test
ciju kriticnu vrijednost F J;(n k) mozemo denirati kao
n
o
Pr F > F J;(n k) =
(3.38)
8

Vidi Dodatak C.1

49

gdje predstavlja razinu znacajnosti testa. Drugim rijecima velika razlika


izmeu RSSR i RSSU R vodit ce k velikim vrijednostima F statistike iz
3.37, a velike vrijednosti F statistike vodit ce na temelju 3.38 odbacivanju
nul hipotez
e.
Ekonometrijski paketi cesto automatski pokraj vrijednosti parametara,
standardnih devijacija koecijenata, t vrijednosti, koecijenata determinacije itd. prikazuju i rezultate F -testa kojim se za model
y=

1 x1

2 x2

k 1 xk 1

testira zajednicka hipoteza


H0 :

k 1

= 0;

(3.39)

odnosno, testira se zajednicka hipoteza da su svi parametri, koji se vezu za


nezavisne varijable, jednaki nula, to znaci da niti jedna nezavisna varijabla
nije znacajna za objanjenje zavisne varijable y. U tom se slucaju ograniceni
model svodi na trivijalan model koji sadrzi samo konstantni clan 0
y=

0:

(3.40)

Iz Propozicije 3.1 znamo da za model s konstantnim clanom vrijedi


Var (yi ) = Var (^
yi ) + Var (ei ) :
Ako pomnozimo s (n
n
X
i=1

1) dobijemo jednadzbu 3.5


(yi

y) =

n
X

(^
yi

y) +

i=1

n
X

e2i

i=1

koju mozemo pojednostavljeno pisati


T SS = ESS + RSS;

(3.41)

gdje T SS oznacava ukupnu sumu kvadrata odstupanja, ESS objanjenu


sumu kvadrata odstupanja, a RSS neobjanjenu sumu kvadrata odstupanja
od sredine uzorka. Buduci da u ogranicenom modelu 3.40 nemamo ni jednu
nezavisnu varijablu, tada ce njegova objanjena suma kvadrata odstupanja
biti ESSR = 0, a iz 3.41 slijedi da za tako ograniceni model vrijedi
RSSR = T SS:

(3.42)

Taj rezultat pretvara F -test, kojim mozemo testirati hipotezu 3.39, u


F =

(RSSR RSSU R ) =J
(T SS RSSU R ) = (k
=
RSSU R = (n k)
RSSU R = (n k)

50

1)

ESSU R = (k 1)
RSSU R = (n k)
(3.43)

ili u odnos objanjene i neobjanjene varijance neogranicenog modela. Broj ogranicenja J je (k 1), tj. broj parametara koji se procjenjuju
u modelu manje jedan (konstantni clan koji nije ogranicen). Interesantno
je primijetiti da ograniceni model 3.40 ima koecijent
(koriP determinacije
girani kao i nekorigirani) jednak nuli jer je ESS =
(^
yi yi )2 = 0: Stoga
je testirati nul hipotezu 3.39 ekvivalentno testiranju nul hipoteze da je populacijski koecijent determinacije R2 = 0: Drugim rijecima F -test iz 3.43
mozemo interpretirati i kao test kojim se testira znacajnost koecijenta
determinacije R2 .
Kada imamo skup linearnih ogranicenja u obliku
r11

+ r12

+ r1k

= q1

r21

+ r22

+ r2k

= q2

+ rjk

= qJ

..
.
rJ1

+ rJ2

zgodno ih je prikazati u kompaktnoj matricnoj formi


R = q:

(3.44)

Matrica R ima k stupaca koji odgovaraju broju parametara, koji se procjenjuju i J redaka, koji odgovaraju broju linearnih ogranicenja nad parametrima. Broj stupaca mora biti manji od broja redaka (J < k); drugim rijecima
moramo imati manje ogranicenja od procijenjenih parametara. Testiranje
nul hipoteze jednog skupa od J linearnih ogranicenja mozemo denirati sa
H0 : R

q=0

(3.45)

q 6= 0:

(3.46)

nasuprot alternativnoj hipotezi


H1 : R

Na ovaj nacin lako mozemo denirati zajednicku nul hipotezu koja se


sastoji od mnogih linearnih ogranicenja kao npr.
H0 :
putem

= 2;

7;

0 1 0 0 0
R=4 1 0 0 0 0
0 0 0 1 1

0
0
1

=1

3
2 3
0
2
1 5, q = 4 0 5
0
1

ili hipotezu 3.39 da su svi parametri u modelu osim konstantnog clana jednaki nuli
R = [0 : Ik 1 ] ; q = 0:
51

Za zadane parametre uzorka, dobivene metodom najmanjih kvadrata, mozemo denirati vektor nepodudarnosti (eng. discrepancy vector) s
m = Rb

(3.47)

gdje vektor Rb prikazuje procijenjeno stanje, a q velicine koje zelimo testirati. Na temelju Waldovog kriterija
W = m0 Var (m) m

(3.48)

nakon supstituiranja varijance populacije 2 procijenjenom varijancom populacije s2 , mozemo dobiti F statistiku9 za testiranje linearne hipoteze 3.45

F =

n h
m0 R s2 (X0 X)
J

R0

m
:

(3.49)

F statistika izracunata ovim nacinom, s (J; n k) stupnjeva slobode, istovjetna je F statistici, koju dobijemo koristeci jednadzbu 3.37, tj. daju
potpuno isti rezultat. Prednost 3.49 nad 3.37 je relativno jednostavno deniranje skupa linearnih ogranicenja koja ulaze u nul hipotezu.
Primjer 3.12 Pretpostavimo da zelimo nad parametrima modela10
y = 410:81

(162:830)

(10:793)

2
RU
R = 0:9989
RSSU R = 6808:58
ESSU R = 6394831
(3.50)

=0

(3.51)

33:75 x1 + 3:23 x2 + 9:71 x3 31:57 x4 + 38:39 x5

(26:134)

(0:989)

(0:727)

(1:162)

testirati s 5% znacajnosti sljedece hipoteze:


a)
H0 :

drugim rijecima zelimo testirati zajednicku hipotezu da su svi parametri


vezani za nezavisne varijable jednaki nula nasuprot hipotezi H1 : 1 =
2 = 3 = 4 = 5 6= 0: U naem slucaju model iz jednadzbe 3.50
je neograniceni model, dok ce ograniceni model, u kojeg ugraujemo
nul hipotezu 3.51, biti model samo s konstantnim clanom, ili u naem
slucaju
2 = 0:0000
RR
y = 3067:82
:
(3.52)
RSSR = 6401640
Buduci da u ogranicenom modelu nemamo nezavisnih varijabli, koecijent determinacije R2 ; kao i korigirani koecijent determinacije R2
9
10

Vidi detaljan izvod u [3] str. 96-97.


Podaci za ovaj model prikazani su u Dodatku D.1.

52

su nula. Vidimo da RSSR ogranicenog modela 3.52 znatno je veci od


RSSU R neogranicenog modela 3.50. Hipotezom smo ogranicili 5 parametara, zato je broj ogranicenja J = 5, i imamo (n k) = (25 6) =
19 stupnjeva slobode. Prema tome F test kojim testiramo nul hipotezu
3.51 bit ce
F =

(RSSR RSSU R ) =J
(6401640 6808:58) =5
=
= 3569: 1:
RSSU R = (n k)
(6808:58) =19

Kriticna vrijednost F distribucije za 5% znacajnosti prikazana je u


5
Dodatku, Tablica E.3, i iznosi F0:05;19
= 2:740. Buduci da je u naem
J
slucaju F > F ;(n k) , mozemo na razini od 5% znacajnosti odbaciti
nul hipotezu 3.51. Na temelju Tablice E.4, iz Dodatka, vidimo da nul
hipotezu mozemo odbaciti i s 1% znacajnosti, tj. s vjerojatnocu da
smo pri odbacivanju hipoteze ucinili greku od samo 1%; buduci da je
5
kriticna vrijednost F0:01;19
= 4:171 manja od testne velicine 3569:1.
Kada testiramo hipotezu da su svi parametri vezani za nezavisne varijable jednaki nula, tada F vrijednost mozemo dobiti koristeci se i
jednadzbom 3.43
F =

ESSU R = (k
RSSU R = (n

1)
6394831=5
=
= 3569:1
k)
6808:58=19

u koju ulaze podaci samo neogranicenog modela. Ekonometrijski paketi


pokraj parametara modela cesto automatski prikazuju ovu F vrijednost,
kojom se testira hipoteza da su svi parametri modela vezani za nezavisne varijable jednaki nula (hipoteza 3.51). U matricnoj formi gornju
hipotezu mozemo testirati pomocu Waldovog kriterija ako deniramo
R = [0 : I5 ] ; q = 0:
Vidimo da matricom R ne ogranicavamo samo konstantni clan (prvi
stupac). Broj ogranicenja je J = 5 dok je broj parametara k = 6; to
zadovoljava uvjet J < k, pa mozemo izracunati vektor nepodudarnosti
koji ce u naem primjeru biti
2
3
2 3 2
3
2
410:81
0
33: 75
0 1 0 0 0 0 6
7
6 0 0 1 0 0 0 7 6 33:75 7 6 0 7 6
3: 23
6 7 6
76
6
3:23 7
6
7
6
6
7
6
7
9: 71
m = Rb q = 6 0 0 0 1 0 0 7 6
6 0 7=6
9:71 7
7 4 0 5 4 31: 57
4 0 0 0 0 1 0 56
4 31:57 5
38: 39
0
0 0 0 0 0 1
38:39

Vektor nepodudarnosti prikazuje razliku izmeu vrijednosti parametara uzorka i vrijednosti koje testiramo. Buduci da u naem primjeru
testiramo hipotezu da su populacijski parametri vezani za nezavisne
53

7
7
7:
7
5

varijable jednaki nula, vektor nepodudarnosti svodi se na vrijednosti


procijenjenih parametara na temelju uzorka koji su vezani za nezavisne varijable. to su vece, u apsolutnoj velicini, vrijednosti vektora
nepodudarnosti, lake ce biti odbaciti nul hipotezu. Kada znamo da je
procijenjena varijanca populacije naeg modela s2 = 358:35; i da je
simetricna matrica
2
73:9891
9:4129
0:2885
0:1717
0:2869
1:2070
6 9:4129
1:9059
0:0182
0:0049
0:0404
0:1452
6
6
0:2885
0:0182
0:0027
0:0019
0:0004
0:0030
1
X0 X
=6
6 0:1717
0:0049
0:0019
0:0015
0:0003
0:0014
6
4 0:2869
0:0404
0:0004
0:0003
0:0038
0:0100
1:2070
0:1452
0:0030
0:0014
0:0100
0:3251
imamo sve elemente za izracunavanje F vrijednosti pomocu jednadzbe
n h
i o 1
m0 R s2 (X0 X) 1 R0
m
F =
= 3569:1:
J

7
7
7
7;
7
7
5

b)
H0 :

15

(3.53)

nasuprot H1 : 1 6= 15. U prethodnom smo poglavlju vidjeli da hipoteze nad jednim parametrom testiramo t-testom. F -test je opcenit,
stoga, osim testiranja nad vie parametara, doputa nam testiranje i
nad jednim parametrom. Obje metode morale bi dovesti do istog zakljucka. Ako gornju hipotezu testiramo pomocu t-testa imamo
t1 =

b1
1
=
sd (b1 )

33:75 ( 15)
=
26:134

0:71746 :

(p=0:4818)

Ograniceni model bit ce


y =

(y + 15x1 ) =

15x1 +

2 x2

3 x3

4 x4

2 x2

3 x3

4 x4

5 x5

5 x5

koji procijenjen izgleda


(y + 15x1 ) = 318:21+ 3:05 x2 + 9:76 x3 31:17 x4 + 36:97 x5
(98:061)

(0:945)

(0:715)

(1:008)

(10:478)

R2 = 0:9989
:
RSSR = 6993:03

Prema tome F -test, kojim testiramo hipotezu 3.53, bit ce


F =

(RSSR RSSU R ) =J
(6993:03 6808:58) =1
=
= 0:514 73 :
RSSU R = (n k)
6808:58=19
(p=0:4818)

Jasno je da t i F vrijednosti nisu iste, buduci da proizlaze iz razlicitih


distribucija. Meutim, tocne razine znacajnosti testa p su identicne u
54

oba slucaja, p = 0:4818, to upucuje na identican statisticki zakljucak,


tj. da ne mozemo odbaciti nul hipotezu. Waldovim kriterijem mozemo
testirati hipotezu 3.53 na temelju matrica ogranicenja
0 1 0 0 0 0

R=

q=

15

koje daju vektor nepodudarnosti m = 18: 75. Kada ukljucimo ove


vrijednosti u jednadzbu 3.49 dobijemo vrijednost F = 0:514 73; koja je
istovjetna F vrijednosti dobivenu prethodnom metodom (RSS).
c)
H0 :

=0

(3.54)

nasuprot hipotezi H1 : 4 + 5 6= 0. Iz gornje jednadzbe slijedi da je


4 =
5 ili 5 =
4 . Neovisno o tome koristimo li za ogranicenje
modela 3.50 jednakost 4 =
5 ili 5 =
4 , moramo dobiti istu
vrijednost RSSR . Ako koristimo 4 =
;
imamo
5
y =

1 x1

2 x2

3 x3

1 x1

2 x2

3 x3

5 x4

5 (x5

5 x5

x4 )

i kada procijenimo parametre dobijemo ograniceni model


y = 392:81
(157:61)

31:70 x1 + 3:30 x2 + 9:74 x3 +31:84 (x5

(25:508)

Ako koristimo

(0:970)

(0:714)

(1:058)

x4 )

R2 = 0:9989
:
RSSR = 6942:08

imamo

y =

1 x1

2 x2

3 x3

4 x4

4 x5

1 x1

2 x2

3 x3

4 (x4

x5 )

i kada procijenimo parametre modela dobijemo ograniceni model


y = 392:81
(157:61)

31:70 x1 + 3:30 x2 + 9:74 x3 31:84 (x4

(25:508)

(0:970)

(0:714)

(1:058)

x5 )

R2 = 0:9989
RSSR = 6942:08

s identicnim RSSR . Stoga, neovisno o jednakosti koju koristimo za


ogranicenje modela, dobijemo istu F vrijednost
F =

(RSSR RSSU R ) =J
(6942:08 6808:58) =1
=
= 0:372 6 :
RSSU R = (n k)
(6808:58) =19
(p=0:5489)

Iz razine znacanost testa p = 0:5489 zakljucujemo da ne mozemo odbaciti ovu hipotezu. Interesantno je primijetiti da pri testiranju ove hipoteze, iako se u hipotezi pojavljuju dva parametra, imamo samo jedno
ogranicenje. Jedno ogranicenje bilo bi i kada bismo testirali hipotezu:
H0 : 1 + 2 2
4 + 5 = 0, unatoc tome to se pojavljuju 4 parametra, dok s druge strane, ako npr. testiramo H0 : 1 = 0; 4 = 30;
55

imamo dva ogranicenja. Znaci, pri racunanju broja ogranicenja nije


vazan broj parametara koji se pojavljuje u hipotezi vec broj jednadzbi. Ako zelimo dobiti F vrijednost pomocu Waldovog kriterija matrice
ogranicenja, kojima opisujemo hipotezu 3.54, glase
R=

0 0 0 0 1 1

q=0

koje daju vrijednost m =6:8241 i F = 0:3726; identicnu vrijednost


koju smo dobili i metodom usporedbe RSS ogranicenog i neogranicenog
modela.
d)
H0 :

4;

= 3;

=0

(3.55)

nasuprot alternativnoj hipotezi H1 : 1 6= 4 ; 2 6= 3; 4 + 5 6= 0. Kada imamo skup linearnih ogranicenja, (kao u ovom primjeru) supstitucija tih ogranicenja u neograniceni model bit ce slozen posao da bismo
dobili ograniceni model na temelju kojeg mozemo izracunati RSSR ,
dok ce to isto matricnom metodom, na temelju Waldovog kriterija, biti lake izvedivo. Matrice ogranicenja za testiranje gornje hipoteze bit
ce
2
3
2 3
0 1 0 0
1 0
0
0 0 5 , q=4 3 5
R =4 0 0 1 0
0 0 0 0
1 1
0
koje daju vektor nepodudarnosti
2
m =4

3
2:1789
0:2314 5 :
6:8241

Na temelju jednadzbe 3.49 za broj ogranicenja J = 3 dobit cemo F


vrijednost od 0:1578 kojoj odgovara razina znacajnosti testa p = 0:9233.
Drugim rijecima ovu hipotezu ne mozemo odbaciti.

56

Dodatak A

Izvodi i dokazi
A.1

Izvod parametara modela s jednom nezavisnom varijablom metodom najmanjih kvadrata

Za model
yi = b0 + b1 xi + ei

(A.1)
P

treba izabrati parametre b0 i b1 tako da minimiziraju


e2i : Da P
bi se dobili
parametri s tim svojstvima, mora se parcijalno derivirati izraz
e2i po b0
i b1 i izjednaciti prve derivacije s nulom kako bi se dobili ekstremi funkcija
(minimum)
@ P 2
@ P
ei =
(yi
@b0
@b0
@ P
@ P 2
ei =
(yi
@b1
@b1

b0

b0

b1 xi )2 =

b1 xi )2 =

(yi

xi (yi

b0

b0

b1 xi ) = 0

(A.2)

b1 xi ) = 0: (A.3)

Ako jednadzbe A.2 i A.3 podijelimo s 2 i napiemo u obliku tzv. normalnih jednadzbi, imamo
P
P
yi = b0 n + b1 xi
(A.4)
P
P
P 2
xi yi = b0 xi + b1 xi :
(A.5)
Sada
P mozemo simultano rijeiti po b0 i b1 tako da jednadzbu A.4 pomnozimo
s
xi ; a jednadzbu A.5 s n
P

P
P
P
xi yi = b0 n xi + b1 ( xi )2
P
P
P
n xi yi = b0 n xi + b1 n x2i :
57

(A.6)
(A.7)

Oduzimanjem jednadzbe A.6 od jednadzbe A.7 dobijemo


h P
i
P
P P
P
n xi yi
xi yi = b1 n x2i ( xi )2
iz cega slijedi

b1 =

P
xi yi
P 2
n xi

P P
xi yi
P 2 :
( xi )

(A.8)

(A.9)

Jednadzba A.9 moze se jednostavnije napisati, ako pretpostavimo specijalni slucaj da je sredina uzoraka jednaka nuli. U tom specijalnom slucaju
mozemo dobiti koecijent smjera regresijskog pravca (b1 ) tako da brojnik i
nazivnik izraza A.9 podijelimo s n2
P
P
P
P
b1 =

xi

xi yi
n

yi

x2i
n

xi
n

n
2

xi yi

= Pn

x2i
n

xy

(A.10)

x2

Buduci da u naem specijalnom slucaju po pretpostavci vrijedi x = y = 0


jednadzba A.10 postaje
P
P
xi y i
xi yi
n
P
(A.11)
b1 =
= P 2 :
x2i
xi
n

Pojednostavljena jednadzba A.11 vrijedi samo za specijalni slucaj kada


varijabla x i varijabla y imaju sredinu nula. Meutim, bilo koju varijablu
mozemo transformirati tako da ima sredinu nula, ako je izrazimo u njezinoj
devijacijskoj formi1
x
~i = xi x
y~ = yi y:

Ovom transformacijom paralelno pomicemo regresijski pravac na ishodite


koordinatnog sustava mijenjajuci odsjecak na ordinati, ali ostavljajuci nagib
pravca nepromijenjenim, stoga se koecijent nagiba regresijskog pravca b1
moze izraziti u devijacijskoj formi varijabli
P
P
(xi x) (yi y)
x
~i y~i
b1 =
(A.12)
= P 2 :
P
2
x
~i
(xi x)
Kada imamo b1 ; iz jednadzbe A.4 jednostavno mozemo dobiti
P
P
yi
xi
b0 =
b1
= y b1 x:
n
n

P
P
x
e
(xi
Dokaz: x
e= n i =
n
zbrajanja u Dodatku B.1.
1

x)

xi
n

x=x

58

(A.13)

x = 0; vidi Svojstvo B.4. operatora

Dodatak B

Matematika
B.1

Neka svojstva operatora zbrajanja

Operator zbrajanja

vrijednosti varijable x
n
X

xi = x1 + x2 +

+ xn

i=1

ima sljedeca svojstva:


Svojstvo 1

n
X

kxi = k

i=1

gdje je k konstanta jer


n
X

n
X

xi

(B.1)

i=1

kxi = kx1 + kx2 +

+ kxn

i=1

= k (x1 + x2 +

+ xn ) = k

n
X

xi :

i=1

Svojstvo 2

n
X

(xi + yi ) =

i=1

zato jer
n
X

n
X

xi +

i=1

(xi + yi ) = x1 + y1 + x2 + y2 +

n
X

yi

(B.2)

i=1

+ xn + yn

i=1

= (x1 + x2 +
+ xn ) + (y1 + y2 +
n
n
X
X
=
xi +
yi :
i=1

i=1

59

+ yn )

Svojstvo 3

n
X

k =k+k+

+ k = kn

(B.3)

i=1

Svojstvo 4

gdje je x =

1
n

Dokaz.

n
X

(xi

x) = 0

(B.4)

i=1

Pn

i=1 xi .

Pn

i=1 (xi

x)

Pn

i=1 xi

n
n
X
1
xi
n

nx
n
x=x

x=0

i=1

iz cega slijedi
Pn

i=1 (xi

x)

= 0 ()

60

n
X
i=1

(xi

x) = 0:

Dodatak C

Statistika
C.1

Distribucije vjerojatnosti izvedene iz normalne distribucije

Teorem C.1 Ako su z1 ; z2 ; : : : ; zn normalno i nezavisno distribuirane


P slucajne varijable takve da zi N i ; 2i , tada je linearna kombinacija ki zi ;
gdje su kiP
konstante koje nisu P
sve nula, takoer normalno distribuirana sa
sredinom
ki i i varijancom
ki2 2i :

Teorem C.2 Ako su z1 ; z2 ; : : : ; zn normalno i zavisno distribuirane slu


Pcajne
2
varijable takve da zi
N i ; i , tada je linearna kombinacija
ki zi ;
gdje su kiP
konstante koje nisu sve
nula,
takoer
normalno
distribuirana
sa
P 2 2
P
ki i + 2 ki kj cov (xi ; xj ) :
sredinom
ki i i varijancom

Teorem C.3 Ako su z1 ; z2 ; : : : ; zn normalno i nezavisno distribuirane sluvarijable takve da zi N (0; 1), tj. standardizirane normalne varijable,
cajneP
tada ni=1 zi2 ima 2 distribuciju s n stupnjeva slobode.
Teorem C.4 Ako su x1 ; x2 ; : : : ; xn nezavisno distribuirane slucajne
P varijable koje imaju 2 distribuciju
s
n
stupnjeva
slobode,
tada
zbroj
xi ima
i
P
2
takoer
distribuciju sa
ni stupnjeva slobode.

Teorem C.5 Ako je z standardizirana normalna varijabla [z1 N (0; 1)] a


x ima 2 distribuciju s n stupnjeva slobode i nezavisna je od z, tada odnos
p z ima Studentovu t distribuciju s n stupnjeva slobode.
x=n

Teorem C.6 Ako su x1 i x2 dvije nezavisne varijable s 2 distribucijom s


1
odnosnim n1 i n2 stupnjevima slobode, tada odnos xx12 =n
=n2 ima F distribuciju
s n1 i n2 stupnjeva slobode.

61

Dodatak D

Podaci
D.1
y
2835.9
2615.0
2556.2
2510.9
2582.6
2586.4
2608.4
2542.7
2598.7
2662.4
2704.3
2767.3
2894.1
2980.6
3022.8
3088.2
3207.4
3360.1
3513.9
3641.5
3840.1
3888.3
3920.2
3816.3
3951.2

x1
4.49
4.26
3.83
3.89
3.79
3.79
3.98
3.97
4.02
3.87
3.99
3.90
3.89
3.96
4.03
4.12
4.18
4.20
4.19
4.17
4.20
4.21
4.25
4.47
4.77

x2
287.80
292.12
296.12
297.14
298.66
301.11
306.48
310.93
316.30
322.14
327.57
333.33
340.24
347.41
352.85
359.90
367.92
375.92
383.57
391.03
397.53
404.34
413.47
421.96
430.39

x3
496.1
509.2
510.2
514.2
527.9
527.1
529.9
524.6
528.9
539.9
550.3
563.4
576.8
583.9
591.0
594.4
603.4
612.1
624.9
634.3
650.4
659.6
671.2
676.3
696.5

62

x4
100.00
112.93
115.61
117.82
119.16
119.16
119.06
119.59
120.79
122.94
124.90
127.73
129.21
129.93
130.56
130.60
130.60
130.22
130.46
129.69
128.74
130.12
133.57
138.70
142.58

x5
0.3202
-0.1125
-0.3275
-0.3974
-0.3392
-0.8013
-1.3413
-1.1790
-0.8171
-0.4666
-0.2619
-0.4310
-0.0325
-0.0507
0.3994
0.4184
0.6175
0.7757
0.7226
0.6831
0.7747
0.5136
0.5501
0.7459
0.8152

Dodatak E

Statisticke tablice
Tablica E.1: Kumulativna povrina ispod standardne normalne distribucije
0.00
0.01
0.02
0.03
0.04
0.05
z
0.0
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.6
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.8
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.9
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
1.0
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
1.1
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
1.2
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
1.3
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
1.4
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
1.5
0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
1.6
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
1.7
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
1.8
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
1.9
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
2.0
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
2.1
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
2.2
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
2.3
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
2.4
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
2.5
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
2.6
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
2.7
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
2.8
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
2.9
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
3.0
0.9987
0.9987
0.9987
0.9988
0.9988
0.9989
3.1
0.9990
0.9991
0.9991
0.9991
0.9992
0.9992
3.2
0.9993
0.9993
0.9994
0.9994
0.9994
0.9994
3.3
0.9995
0.9995
0.9995
0.9996
0.9996
0.9996
3.4
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
3.5
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
Izvor: Vrijednosti su izraunate koristei Excel funkciju NORMSDIST

63

0.06
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998

0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998

0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998

0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998

Tablica E.2: Jednostrane kriticne vrijednosti Studentove t distribucije

n k

0.10

0.05

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
1

3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.3830
1.3722
1.3634
1.3562
1.3502
1.3450
1.3406
1.3368
1.3334
1.3304
1.3277
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.3150
1.3137
1.3125
1.3114
1.3104
1.3031
1.2958
1.2886
1.2816

6.3137
2.9200
2.3534
2.1318
2.0150
1.9432
1.8946
1.8595
1.8331
1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
1.7011
1.6991
1.6973
1.6839
1.6706
1.6576
1.6449

0.25
12.7062
4.3027
3.1824
2.7765
2.5706
2.4469
2.3646
2.3060
2.2622
2.2281
2.2010
2.1788
2.1604
2.1448
2.1315
2.1199
2.1098
2.1009
2.0930
2.0860
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
2.0484
2.0452
2.0423
2.0211
2.0003
1.9799
1.9600

0.001

0.005

31.8210
6.9645
4.5407
3.7469
3.3649
3.1427
2.9979
2.8965
2.8214
2.7638
2.7181
2.6810
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395
2.5280
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
2.4671
2.4620
2.4573
2.4233
2.3901
2.3578
2.3264

63.6559
9.9250
5.8408
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498
3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609
2.8453
2.8314
2.8188
2.8073
2.7970
2.7874
2.7787
2.7707
2.7633
2.7564
2.7500
2.7045
2.6603
2.6174
2.5758

Izvor: Vrijednosti su izraunate koristei Excel funkciju TINV

64

65

n1
n2
1
2
3
4
5
6
7
8
9
1
161.446
199.499
215.707
224.583
230.160
233.988
236.767
238.884
240.543
2
18.513
19.000
19.164
19.247
19.296
19.329
19.353
19.371
19.385
3
10.128
9.552
9.277
9.117
9.013
8.941
8.887
8.845
8.812
4
7.709
6.944
6.591
6.388
6.256
6.163
6.094
6.041
5.999
5
6.608
5.786
5.409
5.192
5.050
4.950
4.876
4.818
4.772
6
5.987
5.143
4.757
4.534
4.387
4.284
4.207
4.147
4.099
7
5.591
4.737
4.347
4.120
3.972
3.866
3.787
3.726
3.677
8
5.318
4.459
4.066
3.838
3.688
3.581
3.500
3.438
3.388
9
5.117
4.256
3.863
3.633
3.482
3.374
3.293
3.230
3.179
10
4.965
4.103
3.708
3.478
3.326
3.217
3.135
3.072
3.020
11
4.844
3.982
3.587
3.357
3.204
3.095
3.012
2.948
2.896
12
4.747
3.885
3.490
3.259
3.106
2.996
2.913
2.849
2.796
13
4.667
3.806
3.411
3.179
3.025
2.915
2.832
2.767
2.714
14
4.600
3.739
3.344
3.112
2.958
2.848
2.764
2.699
2.646
15
4.543
3.682
3.287
3.056
2.901
2.790
2.707
2.641
2.588
16
4.494
3.634
3.239
3.007
2.852
2.741
2.657
2.591
2.538
17
4.451
3.592
3.197
2.965
2.810
2.699
2.614
2.548
2.494
18
4.414
3.555
3.160
2.928
2.773
2.661
2.577
2.510
2.456
19
4.381
3.522
3.127
2.895
2.740
2.628
2.544
2.477
2.423
20
4.351
3.493
3.098
2.866
2.711
2.599
2.514
2.447
2.393
21
4.325
3.467
3.072
2.840
2.685
2.573
2.488
2.420
2.366
22
4.301
3.443
3.049
2.817
2.661
2.549
2.464
2.397
2.342
23
4.279
3.422
3.028
2.796
2.640
2.528
2.442
2.375
2.320
24
4.260
3.403
3.009
2.776
2.621
2.508
2.423
2.355
2.300
25
4.242
3.385
2.991
2.759
2.603
2.490
2.405
2.337
2.282
26
4.225
3.369
2.975
2.743
2.587
2.474
2.388
2.321
2.265
27
4.210
3.354
2.960
2.728
2.572
2.459
2.373
2.305
2.250
28
4.196
3.340
2.947
2.714
2.558
2.445
2.359
2.291
2.236
29
4.183
3.328
2.934
2.701
2.545
2.432
2.346
2.278
2.223
30
4.171
3.316
2.922
2.690
2.534
2.421
2.334
2.266
2.211
31
4.160
3.305
2.911
2.679
2.523
2.409
2.323
2.255
2.199
32
4.149
3.295
2.901
2.668
2.512
2.399
2.313
2.244
2.189
33
4.139
3.285
2.892
2.659
2.503
2.389
2.303
2.235
2.179
34
4.130
3.276
2.883
2.650
2.494
2.380
2.294
2.225
2.170
35
4.121
3.267
2.874
2.641
2.485
2.372
2.285
2.217
2.161
36
4.113
3.259
2.866
2.634
2.477
2.364
2.277
2.209
2.153
37
4.105
3.252
2.859
2.626
2.470
2.356
2.270
2.201
2.145
38
4.098
3.245
2.852
2.619
2.463
2.349
2.262
2.194
2.138
39
4.091
3.238
2.845
2.612
2.456
2.342
2.255
2.187
2.131
40
4.085
3.232
2.839
2.606
2.449
2.336
2.249
2.180
2.124
Izvor: Vrijednosti su izraunate koristei Excel funkciju FINV. n 1=stupnjevi slobode brojnika, n 2=stupnjevi slobode nazivnika
10
241.882
19.396
8.785
5.964
4.735
4.060
3.637
3.347
3.137
2.978
2.854
2.753
2.671
2.602
2.544
2.494
2.450
2.412
2.378
2.348
2.321
2.297
2.275
2.255
2.236
2.220
2.204
2.190
2.177
2.165
2.153
2.142
2.133
2.123
2.114
2.106
2.098
2.091
2.084
2.077

12
243.905
19.412
8.745
5.912
4.678
4.000
3.575
3.284
3.073
2.913
2.788
2.687
2.604
2.534
2.475
2.425
2.381
2.342
2.308
2.278
2.250
2.226
2.204
2.183
2.165
2.148
2.132
2.118
2.104
2.092
2.080
2.070
2.060
2.050
2.041
2.033
2.025
2.017
2.010
2.003

15
245.949
19.429
8.703
5.858
4.619
3.938
3.511
3.218
3.006
2.845
2.719
2.617
2.533
2.463
2.403
2.352
2.308
2.269
2.234
2.203
2.176
2.151
2.128
2.108
2.089
2.072
2.056
2.041
2.027
2.015
2.003
1.992
1.982
1.972
1.963
1.954
1.946
1.939
1.931
1.924

Tablica E.3: Jednostrane kriticne vrijednosti F distribucije za 5 posto znacajnosti


20
248.016
19.446
8.660
5.803
4.558
3.874
3.445
3.150
2.936
2.774
2.646
2.544
2.459
2.388
2.328
2.276
2.230
2.191
2.155
2.124
2.096
2.071
2.048
2.027
2.007
1.990
1.974
1.959
1.945
1.932
1.920
1.908
1.898
1.888
1.878
1.870
1.861
1.853
1.846
1.839

25
249.260
19.456
8.634
5.769
4.521
3.835
3.404
3.108
2.893
2.730
2.601
2.498
2.412
2.341
2.280
2.227
2.181
2.141
2.106
2.074
2.045
2.020
1.996
1.975
1.955
1.938
1.921
1.906
1.891
1.878
1.866
1.854
1.844
1.833
1.824
1.815
1.806
1.798
1.791
1.783

66

n2
1
2
3
4
5
6
7
8
1
4052.185
4999.340
5403.534
5624.257
5763.955
5858.950
5928.334
5980.954
2
98.502
99.000
99.164
99.251
99.302
99.331
99.357
99.375
3
34.116
30.816
29.457
28.710
28.237
27.911
27.671
27.489
4
21.198
18.000
16.694
15.977
15.522
15.207
14.976
14.799
5
16.258
13.274
12.060
11.392
10.967
10.672
10.456
10.289
6
13.745
10.925
9.780
9.148
8.746
8.466
8.260
8.102
7
12.246
9.547
8.451
7.847
7.460
7.191
6.993
6.840
8
11.259
8.649
7.591
7.006
6.632
6.371
6.178
6.029
9
10.562
8.022
6.992
6.422
6.057
5.802
5.613
5.467
10
10.044
7.559
6.552
5.994
5.636
5.386
5.200
5.057
11
9.646
7.206
6.217
5.668
5.316
5.069
4.886
4.744
12
9.330
6.927
5.953
5.412
5.064
4.821
4.640
4.499
13
9.074
6.701
5.739
5.205
4.862
4.620
4.441
4.302
14
8.862
6.515
5.564
5.035
4.695
4.456
4.278
4.140
15
8.683
6.359
5.417
4.893
4.556
4.318
4.142
4.004
16
8.531
6.226
5.292
4.773
4.437
4.202
4.026
3.890
17
8.400
6.112
5.185
4.669
4.336
4.101
3.927
3.791
18
8.285
6.013
5.092
4.579
4.248
4.015
3.841
3.705
19
8.185
5.926
5.010
4.500
4.171
3.939
3.765
3.631
20
8.096
5.849
4.938
4.431
4.103
3.871
3.699
3.564
21
8.017
5.780
4.874
4.369
4.042
3.812
3.640
3.506
22
7.945
5.719
4.817
4.313
3.988
3.758
3.587
3.453
23
7.881
5.664
4.765
4.264
3.939
3.710
3.539
3.406
24
7.823
5.614
4.718
4.218
3.895
3.667
3.496
3.363
25
7.770
5.568
4.675
4.177
3.855
3.627
3.457
3.324
26
7.721
5.526
4.637
4.140
3.818
3.591
3.421
3.288
27
7.677
5.488
4.601
4.106
3.785
3.558
3.388
3.256
28
7.636
5.453
4.568
4.074
3.754
3.528
3.358
3.226
29
7.598
5.420
4.538
4.045
3.725
3.499
3.330
3.198
30
7.562
5.390
4.510
4.018
3.699
3.473
3.305
3.173
31
7.530
5.362
4.484
3.993
3.675
3.449
3.281
3.149
32
7.499
5.336
4.459
3.969
3.652
3.427
3.258
3.127
33
7.471
5.312
4.437
3.948
3.630
3.406
3.238
3.106
34
7.444
5.289
4.416
3.927
3.611
3.386
3.218
3.087
35
7.419
5.268
4.396
3.908
3.592
3.368
3.200
3.069
36
7.396
5.248
4.377
3.890
3.574
3.351
3.183
3.052
37
7.374
5.229
4.360
3.873
3.558
3.334
3.167
3.036
38
7.353
5.211
4.343
3.858
3.542
3.319
3.152
3.021
39
7.333
5.194
4.327
3.843
3.528
3.305
3.137
3.006
40
7.314
5.178
4.313
3.828
3.514
3.291
3.124
2.993
Izvor: Vrijednosti su izraunate koristei Excel funkciju FINV. n 1=stupnjevi slobode brojnika, n 2=stupnjevi slobode nazivnika

n1
9
6022.397
99.390
27.345
14.659
10.158
7.976
6.719
5.911
5.351
4.942
4.632
4.388
4.191
4.030
3.895
3.780
3.682
3.597
3.523
3.457
3.398
3.346
3.299
3.256
3.217
3.182
3.149
3.120
3.092
3.067
3.043
3.021
3.000
2.981
2.963
2.946
2.930
2.915
2.901
2.888

10
6055.925
99.397
27.228
14.546
10.051
7.874
6.620
5.814
5.257
4.849
4.539
4.296
4.100
3.939
3.805
3.691
3.593
3.508
3.434
3.368
3.310
3.258
3.211
3.168
3.129
3.094
3.062
3.032
3.005
2.979
2.955
2.934
2.913
2.894
2.876
2.859
2.843
2.828
2.814
2.801

12
6106.682
99.419
27.052
14.374
9.888
7.718
6.469
5.667
5.111
4.706
4.397
4.155
3.960
3.800
3.666
3.553
3.455
3.371
3.297
3.231
3.173
3.121
3.074
3.032
2.993
2.958
2.926
2.896
2.868
2.843
2.820
2.798
2.777
2.758
2.740
2.723
2.707
2.692
2.678
2.665

Tablica E.4: Jednostrane kriticne vrijednosti F distribucije za 1 posto znacajnosti


15
6156.974
99.433
26.872
14.198
9.722
7.559
6.314
5.515
4.962
4.558
4.251
4.010
3.815
3.656
3.522
3.409
3.312
3.227
3.153
3.088
3.030
2.978
2.931
2.889
2.850
2.815
2.783
2.753
2.726
2.700
2.677
2.655
2.634
2.615
2.597
2.580
2.564
2.549
2.535
2.522

20
6208.662
99.448
26.690
14.019
9.553
7.396
6.155
5.359
4.808
4.405
4.099
3.858
3.665
3.505
3.372
3.259
3.162
3.077
3.003
2.938
2.880
2.827
2.780
2.738
2.699
2.664
2.632
2.602
2.574
2.549
2.525
2.503
2.482
2.463
2.445
2.428
2.412
2.397
2.382
2.369

Tablica E.5: Jednostrane kriticne vrijednosti


n k

0.995

0.990

0.975

0.95

0.9

1
0.000
0.000
0.001
0.004
0.016
2
0.010
0.020
0.051
0.103
0.211
3
0.072
0.115
0.216
0.352
0.584
4
0.207
0.297
0.484
0.711
1.064
5
0.412
0.554
0.831
1.145
1.610
6
0.676
0.872
1.237
1.635
2.204
7
0.989
1.239
1.690
2.167
2.833
8
1.344
1.647
2.180
2.733
3.490
9
1.735
2.088
2.700
3.325
4.168
10
2.156
2.558
3.247
3.940
4.865
11
2.603
3.053
3.816
4.575
5.578
12
3.074
3.571
4.404
5.226
6.304
13
3.565
4.107
5.009
5.892
7.041
14
4.075
4.660
5.629
6.571
7.790
15
4.601
5.229
6.262
7.261
8.547
16
5.142
5.812
6.908
7.962
9.312
17
5.697
6.408
7.564
8.672
10.085
18
6.265
7.015
8.231
9.390
10.865
19
6.844
7.633
8.907
10.117
11.651
20
7.434
8.260
9.591
10.851
12.443
21
8.034
8.897
10.283
11.591
13.240
22
8.643
9.542
10.982
12.338
14.041
23
9.260
10.196
11.689
13.091
14.848
24
9.886
10.856
12.401
13.848
15.659
25
10.520
11.524
13.120
14.611
16.473
26
11.160
12.198
13.844
15.379
17.292
27
11.808
12.878
14.573
16.151
18.114
28
12.461
13.565
15.308
16.928
18.939
29
13.121
14.256
16.047
17.708
19.768
30
13.787
14.953
16.791
18.493
20.599
31
14.458
15.655
17.539
19.281
21.434
32
15.134
16.362
18.291
20.072
22.271
33
15.815
17.073
19.047
20.867
23.110
34
16.501
17.789
19.806
21.664
23.952
35
17.192
18.509
20.569
22.465
24.797
36
17.887
19.233
21.336
23.269
25.643
37
18.586
19.960
22.106
24.075
26.492
38
19.289
20.691
22.878
24.884
27.343
39
19.996
21.426
23.654
25.695
28.196
40
20.707
22.164
24.433
26.509
29.051
Izvor: Vrijednosti su izraunate koristei Excel funkciju CHIINV.

67

distribucije

0.5

0.1

0.05

0.025

0.01

0.005

0.455
1.386
2.366
3.357
4.351
5.348
6.346
7.344
8.343
9.342
10.341
11.340
12.340
13.339
14.339
15.338
16.338
17.338
18.338
19.337
20.337
21.337
22.337
23.337
24.337
25.336
26.336
27.336
28.336
29.336
30.336
31.336
32.336
33.336
34.336
35.336
36.336
37.335
38.335
39.335

2.706
4.605
6.251
7.779
9.236
10.645
12.017
13.362
14.684
15.987
17.275
18.549
19.812
21.064
22.307
23.542
24.769
25.989
27.204
28.412
29.615
30.813
32.007
33.196
34.382
35.563
36.741
37.916
39.087
40.256
41.422
42.585
43.745
44.903
46.059
47.212
48.363
49.513
50.660
51.805

3.841
5.991
7.815
9.488
11.070
12.592
14.067
15.507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773
44.985
46.194
47.400
48.602
49.802
50.998
52.192
53.384
54.572
55.758

5.024
7.378
9.348
11.143
12.832
14.449
16.013
17.535
19.023
20.483
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.852
34.170
35.479
36.781
38.076
39.364
40.646
41.923
43.195
44.461
45.722
46.979
48.232
49.480
50.725
51.966
53.203
54.437
55.668
56.895
58.120
59.342

6.635
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
37.566
38.932
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892
52.191
53.486
54.775
56.061
57.342
58.619
59.893
61.162
62.428
63.691

7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
25.188
26.757
28.300
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
41.401
42.796
44.181
45.558
46.928
48.290
49.645
50.994
52.335
53.672
55.002
56.328
57.648
58.964
60.275
61.581
62.883
64.181
65.475
66.766

Bibliograja
[1] Baltagi, B.H., (2011), Econometrics, peto izdanje, Springer Text in Business and Economics.
[2] Davidson, R., J.G. MacKinnon, (2004), Econometric Theory and Methods, Oxford University Press, New York.
[3] Greene, W.H., (2003), Econometric Analysis, peto izdanje, Prentice Hall,
New Jersey.
[4] Gujarati, D.N., (2004), Basic Econometrics, cetvrto izdanje, McGrawHill, New York.
[5] Hayashi, F., (2000), Econometrics, Princenton University Press, New
Jersey.
[6] Kennedy, P., (2003), A Guide to Econometrics, peto izdanje, MIT Press,
Cambridge, Massachusetts.
[7] Pindyck R.S., D.C. Rubenfeld, (1998), Econometric Models and Economic Forecasts, cetvrto izdanje, McGraw-Hill, New York.
[8] Verbeek, M., (2005), A Guide to Modern Econometrics, drugo izdanje,
John Wiley & sons, West Sussex, England.
[9] Wooldridge, J., (2006), Introductory Econometrics: A Modern Approach,
trece izdanje, South-Western Pub.

68

You might also like