Professional Documents
Culture Documents
Ekonometrija
Ekonometrija
Ekonometrija
-----------------------------------------------------------------------------------------------------------------
1
UVOD
ekonomsko mjerenje
znanstvena disciplina koja se bavi empirickim
1
dokazivanjem ekonomskih zakona koji su
definirani u ekonomskoj teoriji
usko je vezana za discipline kao to su ekonomska teorija, matematicka ekonomija i
ekonomska statistika
Ekonomska teorija povezanost izmedu ekonomskih pojava; ne govore o jacini (velicini)
vec o smjeru
Provjera da li u praksi postoje veze koju opisuje ekonomska teorija i da ih kvantificira
Ekonometrija potvrduje odnosno ne potvrduje ekonomsku teoriju
Matematicka ekonomija izraava ekonomsku teoriju u odredenoj matematickoj formi bez
osvrtanja na empiricku osnovu u toj promjeni
Ekonometrija polazeci od jednadbi matematicke ekonomije gradi ekonometrijske modele
pogodne za empiricko testiranje ekonomskih teorija.
Ekonomska statistika bavi se prikupljanjem, obradom i prezentiranjem ekonomskih
pokazatelja u obliku tablica i slika. Ne bavi se provjerom ekonomskih teorija na temelju tako
prikupljenih podataka, vec to cini ekonometrija, koristeci se podacima prikupljanim od strane
statistike koji ulaze u njezinu analizu.
Metodologija ekonometrije:
Ekonometrijska analiza slijedi odredeni metodoloki put:
1. Odredivanje teorije ili hipoteze preuzima iz ekonomske teorije
2. Specifikacija ekonometrijskog modela iako je Keynes pretpostavio pozitivnu vezu
izmedu C i Y
D
, nije specificirao precizni oblik funkcionalne veze izmedu tih varijabli
C=+Y
D
0<<1
Czavisna varijabla (endogena varijabla)
Y
D
nezavisna varijabla (egzogena varijabla-zadana)
Yd
C
Stohasticki ili empiricki model
1
iz iskustva
greka
Scatter dijagram
Y= + yD + Ui
Ui
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
2
Stohasticke
2
varijable imaju odredenu distribuciju vjerojatnosti.
3. Procjena parametara dati vrijednosti, temeljem neke metode, parametrima
(koeficijentima)
ili
0
=120 ili
1
=0.8
odsjecak na ordinati nagib pravca
Svojstvo pravca: minimizirati odstupanje
4. Provjera
H
0
:
1
=0.9 Ako je velika disperzija, prihvacamo hipotezu.
5. Predvidanje (strukture modela)
PRIRODA REGRESIJSKE ANALIZE
Regresija- Francis Galton 1886. godine
Regresija i uzronost
Koeficijent korelacije
3
samo linearna veza/ mjera linearne korelacije
-1 < r < 1
etva meteoroloke prilike Ne govori se koja varijabla na koju utjece.
2
Deterministicka povezanost za svaku vrijednost jedne pojave tocno znamo vrijednost druge pojave
Stohasticka povezanost na osnovu vrijednosti jedne pojave ne moemo sa sigurnocu predvidjeti vrijednost
druge pojave
3
Cemu slue korelacija i regresija? Statisticka sredstva za proucavanje povezanosti (odnosa) medu pojavama.
Korelacija proucava jakost (intenzitet, stupanj) povezanosti medu pojavama. Regresija povezanost se precizno
opisuje pomocu modela (tzv. regresijski model).
Koeficijent korelacije je mjera linearne korelacije.
Visina
djece
1.8
1.7
1.6
1.5
1.50 1.60 1.70 1.80 1.90 2.0 Visina roditelja
Regresijski pravac
Tendencija prema
mediokritetu.
Postoji ocekivana
vrijednost.
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
3
etva= f (meteoroloke prilike, gnojivo,)
Regresija pokazuje smjer uzrocnosti, za razliku od korelacije koja je simetricna (obje se
varijable tretira jednako).
Regresijska analiza proucava zavisnost varijable o nezavisnim varijablama. To je kretanje
prema prosjeku. Slui nam za procjenu srednje vrijednosti zavisne varijable.
Stohasticke varijable mogu poprimiti bilo koju vrijednost uz zadanu vjerojatnost.
Terminologija:
Y=
0
+
1
X Jednostavna regresija
Yzavisna varijabla
Xnezavisna varijabla
Y=
0
+
1
X
1
+
2
X
2
+.......+
n
X
n
Viestruka regresija
USlucajna greka, rezidual
Vrste podataka:
1) Vremenski nizovi
sezonska kretanja
trendovi
slijedeca ovisi o prethodnoj
2) Cross section
razlicite vremenske tocke
nije vezan za vrijeme (nema vremensku komponentu)
3) Panel podaci
vremenski nizovi+cross section
t Y
D
C
1 500 350
2 350 100
3 600 550
4 1500
IME Y
D
C
Paola 350 100
Ivana 500 450
IME Paola Ivana
Y
D
C Y
D
C
1 500 350
2 350 100
3 600 550
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
4
Kvaliteta:
Ekonometrijska analiza vrijedi koliko i kvaliteta podataka koje koristimo. Podaci su loi jer:
1) Postoji opservacijska greka
2) Nema dovoljno podataka
3) Postoje greke koje se pojavljuju zaokruivanjem
4) Pristranost kod selekcije
5) Problem kad su podaci jako agregirani
Regresija s dvije varijable
Y=f (X) jednostavna regresija
Y potronja
X raspoloivi dohodak
*
uzeli smo kao uzorak
Uvjetna vjerojatnost zato to Y ovisi o X Y ce poprimiti neku vrijednost Yi ako X
poprimi Xi
P(Y=Y
i
|X=X
i
)
P(Y|X)
Dohodak
80 100 120
55 65 79
55
*
70 84
65 74 90
*
70 80 94
75 85
*
98
88
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
5
*
uvjetna vjerojatnost Y uz dano X
Uvjetna sredina ili matematicko uvjetno ocekivanje
Opceniti oblik linearne funkcije E (Y|X
i
)
E=552/5+651/5+701/5+751/5=22+13+14+15=64
E (Y|X
i
)=f(X
i
)
Ocekivana vrijednost ce ovisiti o visini dohotka.
E (Y|X
i
)=
0
+
1
X
i
Linearna populacijska regresija
LINEARNA REGRESIJA linearnost u parametrima, a ne linearnost u varijablama
a) E(Y|X
i
)=
0
+
1
X
i
+
b) E(Y|X
i
)=
2
1 0 i
X + -
c) E(Y|X
i
)=
0
+
1
lnX
i
+
d) E(Y|X
i
)=
0
+
1
2
X
i
-
Linearnost odnos
PARAMETARA odnos parametara i zavisne varijable E(Y|X)=
0
+
1 1
X
(nema linearnosti)
Dohodak
80 100 120
1/6 1/5 2/5
1/6 1/5
1/5 1/6 1/5
1/5 1/6 1/5
P (Y|X
i
)
*
1/5 1/6 1/5
E (Y|X
i
) 64 77 89
Y
105
95
85
75
65
55
0 80 100 120 X
i
Regresijska funkcija
populacije
matematicko ocekivanje ili
uvjetna sredina zavisne varijable
za fiksnu vrijednost nezavisne
varijable
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
6
VARIJABLI odnos varijable i zavisne varijable E(Y|X)=
0
+
1
X
1
2
(nema
linearnosti)
Odstupanje
U
i
=Y
i
-E(Y|X
i
)
Y
i
=E(Y|X
i
)+U
i
Pojedinacna potronja ce ovisiti o prosjeku grupacije neka greka
Regresijska funkcija uzorka uzorak mora biti reprezentativan
i i i
e x Y + + =
1 0
Y
procijenjena vrijednost
1
procijenjena vrijednost
1
e
i
U
i
A
Y
0 X
S1
POP
Regresijska funkcija uzorka podcjenjuje
vrijednosti populacije prije A
Regresijska funkcija uzorka precjenjuje
vrijednosti populacije nakon A
Y
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
7
Pozitivna
autokorelacija
odstupanja
Uj
+
Ui
+
Negativna
autokorelacija
odstupanja
Uj
+
Ui
+
Uj
Ui
+
Nema korelacije
izmedu Ui i Uj
Pretpostavke koje moraju biti zadovoljene da bi prihvatili regresijsku funkciju uzorka kao
procjenitelja regresijske funkcije populacije:
1. E (U
i
|X
i
)=0
Statisticke greke regresijske funkcije populacije su 0.
Za svaki njegov X
i
, njegov prosjek mora biti 0.
2. Cov (U
i
, U
j
)=0 Odsutnost autokorelacije, odstupanja su nekorelirana.
3. Homoskedasticnost Var (U
i
|X
i
)=
2
varijanca je jednaka
Svako odstupanje ima istu varijancu, nemogucnost rasprenja odstupanja za vece
vrijednosti od malih.
X1 X2 X3
Y
Ui
+
Ui
-
Regresijska funkcija populacije
za svaku vrijednost varijable X,
odstupanje je normalno distribuirano oko
0
sredina=0
simetricno distribuirana oko njezine
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
8
Razlika
RFP-RFU
0
0 X1 X2 X3 X4 X
Y
Y4
Y2
Y1
Y3
e4 -
e3 -
e2 +
e1 +
4. Pravilno specificiran regresijski model
Regresija s dvije varijable
-Problem procjene parametara-
metoda najmanjih kvadrata (OLS)
4
Karl Friedrich Gauss
Min
= =
=
n
i
i i
n
i
i
Y Y e
1
2
1
2
)
(
i i i
e x Y + + =
1 0
)
(
1 0 i i i
x Y e + =
i i i
Y Y e
= Y
i
stvarni
i
Y
procijenjeni
4
Ordinary Least Square Dobivamo najmanja odstupanja od regresijske linije
A
B
RFP
RFU
A B
e
i
Autokorelacija pozitivna
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
9
0 1 2 3 4 5 6 X
Y
12
11
10
9
8
7
6
5
4
3
2
Izabrati
1 0
i da minimiziraju onu sumu
= )
(
1 0
2
f e
i
0
=3
1
=1
npr. X Y 5 . 0 4
+ =
= 5 . 26
2
i
e
Treba izabrati
0
i
1
takve da minimiziraju sumu Bolji je pravac jer minimizira
kvadrata tih odstupanja. sumu tih kvadrata.
0 )
(
2
1 0
0
=
i i
X Y
2
i
e
= =
x
i
=(X
i
- X )
y
i
=(Y
i
-Y )
Y
i
X
i
i
Y
e
i
2
i
e
x
i
y
i
x
i
y
i
2
i
x
i
Y
e
i
2
i
e
4 1 4 0 0 -3 -3 9 9 2.92 1.08 1.17
5 4 7 -2 4 0 -2 0 0 7 -2 4
7 5 8 -1 1 1 0 0 1 8.36 -1.36 1.85
12 6 9 3 9 2 5 10 4 9.72 2.28 5.2
Y =7 X =4
14 19 14 7 12.22
Y
i
x
i
i
Y
e
i
2
i
e
4 1 4 0 0
5 4 7 -2 4
7 5 8 -1 1
12 6 9 3 9
0 14
i i
X Y + = 1 3
=
2
1
i
i i
x
y x
x y
1 0
=
X Y
i
36 . 1 56 . 1
+ =
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
10
36 . 1
14
19
2
1
= =
=
i
i i
X
Y X
56 . 1 4 36 . 1 7
1 0
= = = X Y
Svojstva regresijske funkcije:
1. Prolazi kroz sredinu uzoraka
2. Sredina procijenjenog Y-a jednaka je sredini stvarnog Y-a
Y Y =
Y Y
X X Y
X X Y
X Y
i
=
+ =
+ =
+ =
) (
(
1
1 1
1 0
DOKAZ!
Dobijemo Y Y =
jer je ( )
= 0 X X
i
3. Sredina reziduala je 0
0 = e
n
0
Proizlazi iz uvjeta optimizacije
( )
= = =
0 0 2
2
1 1 0
0
e e X Y
i i
x y
1 0
=
X Y
1 0
+ =
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
11
Regresijska funkcija populacije
1
=0.75
Uzmemo uzorke
(
1
)=0.7
(
1
)=0.65
(
1
)=0.8
.
.
.
.
.
E (
1
)=0.75
4. Reziduali e
i
su nezavisni od procijenjenog Y-a (
i
Y
)
0
)
2 2
1
2 2
1
2 2
1 1
1 1
1
1
=
=
=
=
=
=
i i
i i i
i i i
i i i i
i i
x x
x y x
x y x
e x e y
x y
5. Reziduali e
i
su nezavisni od x
i
Proizlazi iz problema minimizacije
= =
0 2
) (
1
i i
i
x e
e
kovarijanca
Svojstva procjenitelja (parametara, koeficijenta regresije):
1. Oni su BLUE
5
a. Linearni preduvjet za regresijsku funkciju
u linearnom odnosu prema zavisnoj varijabli
b. Nepristrani njihova ocekivana vrijednost jednaka je stvarnoj vrijednosti
E (
)=
5
Best Linear Unbiased Estimator (Najbolji linearni nepristrani procjenitelji)
= =
=
=
2 2
1
2
1 1 1
1
2
1
.
.
i i i i
i
i i
i i i
x x y x II
x
y x
proizlazi odakle
x y x I
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
12
N
A
J
B
O
L
J
I
e
i
TSS
Y
0
X
i
X
c. Efikasni
OLS metoda
Alternativna metoda
E(
1
)=
1
minimalna varijanca (raspon vrijednosti) za istu sredinu
d. Konzistentni
E(
1
)=0.65
S povecanjem uzoraka, parametri konvergiraju populacijskoj sredini pa su
konzistetni.
Koeficijent determinacije (koeficijent korelacije
2
)
2
govori koliko smo pomocu X protumacili varijaciju Y-a u odnosu na ukupnu varijancu
Y-a
odnos izmedu ESS I TSS
r(x,y) koeficijent korelacije se radi izmedu dvije varijable
Y
regresijska funkcija uzorka
ESS
Y
i
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
13
e
i
ili RSS (residual sum of square)neobjanjeno odstupanje kvadrata
TSS total sum of squareukupno odstupanje kvadrata
ESSestimated sum of squareobjanjeno odstupanje
RSS ili SSR=
=
=
n
i
i i i
Y Y e
1
2 2
)
(
TSS ili SST=
2
) ( Y Y
i
to je pravac vie nagnut, TSS ce biti veci.
ESS ili SSE=
2
)
( Y Y
i
TSS=ESS+RSS
2
) ( Y Y
i
=
2
)
( Y Y
i
n
i
i i
Y Y
1
2
)
( /
2
) ( Y Y
i
1=
2
)
( Y Y
i
2
) ( Y Y
i
+
n
i
i i
Y Y
1
2
)
( /
2
) ( Y Y
i
1=
TSS
RSS
TSS
ESS
+
2
=
2
2
2
) (
1
Y Y
e
i
i
TSS
RSS
= 1
2
TSS
ESS
=
2
0<
2
<1 to je veci, to je bolji.
Y=f(x
1
, x
2
, x
3
,., x
n
) to ima vie varijabli, koeficijent determinacije ce rasti.
Svojstva
2
:
- nije nikada negativan (samo ako se radi o regresiji kroz ishodite)
- 0
2
1
- r=
2
r
Stupnjevi slobode N-k (U softveru df.)
kbroj parametara koje ocjenjujemo
N=10
Y=
0
+
1
X
1
df=8
Y=
0
+
1
X
1
+
2
X
2
df=7
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
14
Korigirani koeficijent determinacije
2
=
) 1 /( ) (
) /(
1
2
2
2
N Y Y
k N e
i
i
2
ima u sebi troak ubacivanja nove varijable (korigiran je za N-k)
Je li veci
2
ili
2
ovisi o odnosu (N-k) i (N-1)
(N-k) < (N-1)
2
je uvijek veci od
2
jer je (N-k) uvijek manje od (N-1)
2
<
2
Vrijednost
2
moe ostati ista ili se povecati, ali nikako smanjiti ulaskom nove
varijable u regresiju.
Uvodenjem nove varijable odstupanja ce se smanjiti jer ce neto vie objasniti. Ali gube se i
stupnjevi slobode. Ako je vie objanila nego tetila, varijabla ostaje u modelu.
Testiranje nad koeficijentom
Y=
0
+
1
X
1
+
2
X
2
++
n
X
n
t=
) (
var
) (
*
se
vrijednost testirana vrijednost na st
se
=
t-test
sestandardna devijacija
T testtestiranje signifikantnosti regresijskih koeficijenata
pokazuje znacajnost parametara
VAR (
1
)=
2
2
i
x
2
2
k N
e
i
=
procijenjena varijanca
= =
2
2
1 1
( )
(
i
X
se VAR
VAR(
0
)=
2
2
2
i
i
x N
X
se(
0
)=
2
2
2
i
i
x N
X
STANDARDNA GREKA PROCJENITELJA
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
15
Y
=0.5+2.5X
1
-1.5X
2
se (0.1)
Testiram mogucnost da je
1
=2
H
0
:
1
=2
t= 5
1 . 0
5 . 0
1 . 0
2 5 . 2
= =
(
) (
=
N
i
i i
Y Y
RSS M
ESS
ijanca na procijenje
ijanca objanjena
var
var
Ovaj test testira hipotezu da su svi koeficijenti osim
0
jednaki 0.
F
(1, N-k)
H
0
:
1
=
2
=.=
n
=0 (nisu znacajni za objanjenje varijable Y)
6
sredina
Izvor
odstupanja
SS D.F. MSS
6
ESS
N
i
i i
Y Y
1
2
)
(
1 SS:D.F.
RSS
=
n
i
i
e
1
2
N-k
2
ili
k N
e
i
2
TSS
n
i
i
Y Y
1
2
) (
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
16
Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
primjer F= 35 p=0,006 odbacujemo
primjer F= 1.5 p=0,15
Cesto cemo odbaciti H
0
.
Svi parametri u modelu koji se vezuju uz varijablu jesu 0. To F-test testira.
Testiranje na parametrima
F=
) /( ) 1 (
/ ) (
2
2 2
k N
m
UR
R UR
UR
2
neogranicen
R
2
ogranicen
m broj ogranicenja
Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
UR
2
=
H
0
:
2
=
3
=0 ne spadaju
Y=
0
+
1
X
1 R
2
=.. ogranicen jer nismo ukljucili x
2
i x
3
R
2
< UR
2
te brojke koje dobijemo stavljamo u jednadbu
F
(m, N-k)
2
=0
3
=0 m=2 (ogranicenja) N-kstupnjevi slobode
Stavljamo UVIJEK stupnjeve slobode veceg modela, s vie varijabli!!!
H
0
:
1
+
2
=1 m=1 Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
UR
2
= 0,99
2
=1-
1
Y=
0
+
1
X
1
+(1-
1
)X
2
+
3
X
3
Y=
0
+
1
X
1
+X
2
-
1
X
2
+
3
X
3
X
2
nema koeficijenta
Y-X
2
=
0
+
1
X
1
-
1
X
2
+
3
X
3
Y-X
2
=
0
+1(X
1
-X
2
)+
3
X
3
konacni model iz
kojeg cemo dobiti
R
2
gubimo
stupnjeve slobode
R
2
=0,98
Da je velika razlika izmedu UR
2
i R
2
, F ce biti veliki broj, p ce biti izrazito malen i
hipoteza se odbacuje.
II. primjer:
H
0
:
1
-
2
=0 m=1 Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
1
=
2
Y=
0
+
2
X
1
+
2
X
2
+
3
X
3
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
17
Y=
0
+2(X
1
+X
2
)+
3
X
3
ZADATAK:
Obiteljski dohodak X
Potronja Y
Y
i
X
i
x
i
7
y
i
8
x
i
y
i
x
i
2
i
Y
9
e
i
10
e
i
2
X
i
2
( )
2
Y Y
i
( )
2
Y Y
i
70 80 -
90
-
41
3690 8100 65,1 4,9 24,01 6400 2106,81 1681
65 100 -
70
.46 3220 4900 75,3 -
10,3
106,09 10000 1274,49 2116
90 120 -
50
-
21
1050 2500 85,5 4,5 20,25 14400 650,25 441
95 140 -
30
-
16
480 900 95,7 -0,7 0,49 19600 234,09 256
110 160 -
10
-1 10 100 105,9 4,1 16,81 25600 26,01 1
115 180 10 4 40 100 116,1 -1,1 1,21 32400 26,01 16
120 200 30 9 270 900 126,3 -6,3 36,69 40000 234,09 81
140 220 50 29 1450 2500 136,5 3,5 12,25 48400 650,25 841
155 240 70 44 3080 4900 146,7 8,3 68,89 57600 1274,49 1936
150 260 90 39 3510 8100 156,9 -6,9 47,61 67600 2106,81 1521
111 = Y 170 = X
16800 33000 337,3 322200 8583,3 8890
Y=
0
+
1
X
Izracunati koeficijente,
2
(koeficijent determinacije), se, F i napraviti testiranje.
1
=
2
i
i i
x
y x
0
= X Y
1
VAR(
1
)=
2
2
i
x
VAR(
0
)=
2
2
2
i
i
x N
X
= =
2
2
2
) (
)
(
Y Y
Y Y
TSS
ESS
i
i
F=
2
ESS
k N
e
i
2
2
51 , 0
33000
16800
1
= =
0
=111-0,51170=24,3
Y=24,3+0,51X
se (6,42) (0.036)
t (3,79) (14,17)
7
X X
i
8
Y Y
i
9
zadano
10
Y - Y
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
18
16 , 42
2
2
=
k N
e
i
VAR(
1
)=0.0013 VAR(
0
)=41,16
se(
1
)= 036 , 0 )
(
1
= VAR se(
0
)= 42 , 6 )
(
0
= VAR
t-test H
0
:
0
=0 t=
) (
var
) (
*
se
testirani ni st
se
=
H
0
:
1
=0
Primjer:
1
=0,8
t= 05 , 8
036 , 0
8 , 0 51 , 0
=
|-8,05|>2 odbacujemo
ANOVA tablica
F= 59 , 203
2
=
ESS
966 , 0
8890
3 , 8583
2
= = =
TSS
ESS
957 . 0 043 , 0 1
9 : 8890
16 , 42
1
1 / ) (
/
1
2
2
2
= = =
N Y Y
k N e
i
i
2 2
<
Y
=24,3+0,51X
(3,79) (14,17)
Varijabla X je znacajna za objanjenje potronje.
F=203,59 Odbacujemo hipotezu da je X beznacajan za model
96% varijance potronje smo uspjeli objasniti kretanjem dohotka.
SS D.F. MSS
ESS 8583,3 1 8583,3
RSS 337,3 8 42,16
TSS 8890 8 1111,25
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
19
E
E
E
0
X
Y
FUNKCIONALNE FORME
nagib je isti, ali elasticnost je
razlicita
Mjerne jedinice
GDP, M
11
u milijunima
Y, C u milijunima
C=f (Y
D
)
Cmilijuni; Y
D
milijuni C=
0
+0,8 Y
D
2
=0,89 F=200
(2,5)
Ctisuce; Y
D
milijuni C=
0
+800 Y
D
2
=0,89 F=200
(2,5)
Cmilijuni; Y
D
tisuce C=
0
+0,0008 Y
D
2
=0,89 F=200
(2,5)
Ako su varijable u razlicitim mjernim jedinicama,
2
i t ostaju isti.
Model:
1
11.
..
LIN-LIN Jednadba Nagib(
dX
dY
) Elasticnost(E
Y,X
Y
X
dX
dY
)
Y=
0
+
1
X
1
1
Y
X
2
22.
..
LOG-LOG lnY=
0
+
1
X
1
=
dX X
dY Y
X d
Y d
=
) (ln
) (ln
ln
ln
1 1
Y
X
X
Y
Y
X
dX
dY
= =
11
novcana masa
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
20
1
=
Y
X
dX
dY
dX
X
dY
Y
=
1
1
Nagib
X
Y
dX
dY
=
1
Y=AK
+L
Cobb-Douglasova funkcija proizvodnje Atehnoloki napredak
Kkapital
Lrad
lnY=lnA+lnK+lnL
0
PARAMETRI
3
33.
..
LOG-LIN Jednadba Nagib(
dX
dY
) Elasticnost(E
Y,X
Y
X
dX
dY
)
lnY=
0
+
1
X
1
=
dX
Y
dY
dX
Y d
=
ln
1
Y X
Y
X
=
1
=
Y dX
dY 1
dX
dY
Nagib Y
dX
dY
1
=
4
44.
..
LIN-LOG Y=
0
+
1
lnX
1
=
X
dX
dY
X d
dY
=
ln
1
Y
X
X
1 1
1
=
1
= X
dX
dY
Nagib
X
dX
dY 1
1
=
Stopa rasta:
Y
dY
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
21
w
w
(place)
Philipsova krivulja p
p
(cijene)
0
0
nezaposlenost
od stope napravimo prosjekeprosjecna stopa rasta
izvodi se pomocu LOG-LIN modela
bolja u odnosu na klasicnu metodu jer ne ovisi o baznom
razdoblju
lnY=
0
+
1
X
1
mjesecna stopa rasta12=godinja stopa rasta
kvartalna stopa rasta4=godinja stopa rasta
1
=
dT
Y
dY
dT
Y d
=
ln
Y
dY
stopa rasta
Mjesec T(trend) Kvartal
8 1 I
9 2 II
10 91. 3 III
11 4 IV
12 5 I
1 92. 6 II
lnY=
0
+
1
T
(0,5) znaci da naa varijabla nema trenda
je + je -
0
<0
1
>0
0
<0;
1
<0
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
22
AS
AD
P
1
P
2
Y
2
Y
1
Y=
0
+
1
X
1
RECIPROCNI Jednadba Nagib(
dX
dY
) Elasticnost(E
Y,X
Y
X
dX
dY
)
Y=
0
+
1
X
1
) (
1
X
dX
d
dX
dY
o
+ =
Y
X
X
Y
X
dX
dY
=
2
1
=
2
1
2
1
1 0
X
X
=
=-
1
Y X
1
=
XY
DUMMY VARIJABLE
koriste se kad elimo u model ukljuciti nenumericke ili kvalitativne varijable
mogu poprimiti dvije vrijednosti 0 i 1 pa se cesto zovu i binarne vrijednosti
Y=
0
+
1
GS+
2
D
Yplaca, koja ovisi o GS (godinama staa)
pozitivna korelacija Y raste s GS
moda ovisi i o strucnoj spremi
za kvalitativne modeledummy
varijable
D=0 VSS
D=1SSS
SSS D=0 Y=
0
+
1
GS
VSS D=1 Y=
0
+
1
GS+
2
Y=(
0
+
2
) +
1
GS
a b
Y=1000+50GS+300D
Y X
0,5 1
0,15 2
0,16 3
Godine
staa
Strucna
sprema
D
Ante 20 VSS 1
Miro 25 SSS 0
Anka 5 VSS 1
Marko 30 VSS 1
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
23
VSS
SSS
GS
Y
0
0
+
2
1
Ante Y=1000+5020+300=2300 kn 300 kn vie zbog VSS
Miro Y=1000+5025=2250
Da smo za SSS imali D=1, a za VSS D=0, predznak bi za Miru ispred
2
bio negativan, ili
Ante Y=1300+5020=2300 kn
Miro Y=1300+5025-300=2250 kn
2
bit ce jednak
kvaliteta regresije ne ovisi o tome kojoj smo kvaliteti dali 0 ili 1
mijenjaju se parametri
Y=
0
+
1
GS bez D SSS
Y=
0
+
1
GS+
2
s D VSS
VSS
INTERCEPT DUMMY
ostao je isti nagib, ali je
odsjecak na ordinati
razlicit
pozitivna korelacija
S obzirom na godine staa, model procjenjuje Y za SSS i VSS.
U slucaju 3 obiljeja
GS SS D1(SSS) D2(VS) D3(VSS)
Ante 20 VSS 0 0 1
Miro 25 SSS 1 0 0
Anka 5 VSS 0 0 1
Marko 30 VS 0 1 0
Jednu cemo izbaciti. Svejedno je jer ce
0
poprimiti vrijednosti, npr. SSS
Y=
0
+
1
GS+
2
VS+
3
VSS
SSS Y=
0
+
1
GS
VS Y=
0
+
1
GS+
2
VS Y=
0
+
1
GS+
2
VSS Y=
0
+
1
GS+
3
VSS Y=
0
+
1
GS+
3
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
24
GS
1
SSS
VS
VSS Y
0
+
2
0
+
3
0
SSS+ (veca placa)
VSS+ (veca placa)
VSS+M
SSS+M (manja placa)
GS 0
Y
0
+
3
0
+
2
0
+
2
+
3
pretpostavili
3
>
2
M0 1
Y=
0
+
1
GS+
2
SS+
3
SPOL
(t) pokazuje znacajnost parametra
Ante Y=
0
+
1
GS+
2
=(
0
+
2
)+
1
GS
Miro Y=
0
+
1
GS
Anka Y=
0
+
1
GS+
2
+
3
=(
0
+
2
+
3
)+
1
GS
H
0
:
3
=0 t>2, postoje razlike.
Ako je
2
300, moramo gledati t vrijednost. Ako je npr. 0,25, onda ne igra veliku ulogu jer je t
vrijednost mala.
* recimo da na 95% pouzdanosti testiramo, gledamo p vrijednost koja bi bila primjerice 0,7
to znaci da ne moemo odbaciti hipotezu jer radimo 70% pogreke ako odbacimo.
* npr. t je 4,5 ispod
3
postoji diskriminacija
Marko Y=
0
+
1
GS+
2
=(
0
+
2
)+
1
GS
Godine
staa
Strucna
sprema
VSS SPOL
Ante 20 VSS 1 0
Miro 25 SSS 0 0
Anka 5 VSS 1 1
Marko 30 VSS 1 0
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
25
M
GS 0
Y
S
0
tednja od 1950.-2000.
tednja od 1900.-1950.
1950.
SLOPE DUMMYmijenja nagib
mukarcima se GS vie uvaavaju
nego enama
enama se onemogucava karijera
Y=
0
+
1
GS+
2
D+
3
GSD
2
Dintercept
3
GSDslope
D=0 Y=
0
+
1
GS
D=1 Y=
0
+
1
GS+
2
+
3
GS
Y=(
0
+
2
)+(
1
+
3
)GS
Razlika u odsjecku na ordinati i u koeficijentu smjera
D=0mukarci
D=1ene
S=
0
+
1
Y+
2
D+
3
DY
D=1 nakon 1950. S=(
0
+
2
)+(
1
+
3
)Y
D=0 prije 1950. S=
0
+
1
Y
Prije 1950. Nakon 1950.
1
=
dY
dS
1
+
3
=
dY
dS
Spol GS D (spol) GSD
Ante M 20 0 0
Miro M 25 0 0
Anka 5 1 5
D GodS
1950. 0
0
0
1950. 0
1951. 1
1 ..
1
2000. 1
.
..
.
..
.
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
26
t
GDP
0 I II III IV I II
Jo jedan nacin izracunavanja razlikeraditi 2 regresije:
prije 1950. S=200+0,2Y
nakon 1950. S=150+0,3Y
usporediti
Nedostatak: moramo imati dovoljno opaanja
S=
0
+
1
Y+
2
D+
3
DY
prije S=
0
+
1
Y
nakon 1950. S=(
0
+
2
)+(
1
+
3
)Y
Razlika u i
3
: ako je t vrijednost velika, razlika u ponaanju je velika
dummy varijable se cesto koriste kod vremenskih nizova za desezoniranje
lice na stablima
vremenski nizovi
trend-dugorocni
fluktuacije
uvijek se koristi jedna dummy varijbla manje od broja varijabli
postoji korelacija izmedu GDP-a i lica na stablima
da bi izbjegli nelogicnosti korelacije vrimo desezoniranje
ubacujemo sezonske dummy varijable koje kupe na sebe sezonska odstupanja
S
2
S
3
S
4
I 0 0 0
II 1 0 0
III 0 1 0
IV 0 0 1
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
27
Y=
0
+
1
X+
2
S
2
+
3
S
3
+
4
S
4
rijeili smo sezonu; kod GDP-a bi se trebali rijeiti trenda rasta
ukljucimo i TREND VARIJABLU
T
1 linearni
2
3
.
. eksponencijalni trend T
2
.
N
Y=
0
+
1
X+
2
S
2
+
3
S
3
+
4
S
4
+
5
T
2
pokazuje koliko je veci ili manji rast u II. kvartalu u odnosu na I. kvartal
GDP
I II III IV I II
dummy varijabla konstruira regresijske pravce
da izgledaju ravno omogucuje im TREND varijabla
Y=20+5S
2
+7S
3
-4S
4
I 20
II 25 log-lin
III 27
IV 16
lnY=2+0,5S
2
+0,7S
3
-0,4S
4
50% veca u odnosu na I. kvartal
Y=
0
+
1
X+
2
S
2
+
3
S
3
+
4
S
4
+
5
T
pokazuje realnu vezu izmedu varijabli X i Y neovisno od sezone i trenda
Tecaj kune=
0
+
1
S
2
+
2
S
3
+.+
11
S
12
mjesecno
(t) (t)
Gledamo t vrijednosti ako su velike, pekulacija ima smisla, a ako je t oko 0, to nije sigurno
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
28
Y
0 X X*
prodaja
p
r
o
v
i
z
i
j
a
0 100
Tecaj
II. mjesec 7,4 7,4 kn za 1
VII. mjesec 7,0 7 kn za 1 kupiti u VII. mjesecu da bi prodali u II. mjesecu
ako su visoke t vrijednosti, postoji velika vjerojatnost
da ce se to dogoditi
Postoji li sezona? Izbacimo sezonske dummy (
2
UR
) i napravimo novu regresiju nakon cega
radimo F test.
PIECEWISE REGRESIJA
Pratimo regresijski pravac do
neke vrijednosti nakon cega
mijenjamo nagib
granicna
vrijednost
Y=
0
+
1
X
1
+
2
X
2
+
3
D+
4
X
2
D
1, X
2
>X*
D=
0, X
2
<X*
Y=
0
+
1
X
1
+
2
X
2
Y=(
0
+
3
)+
1
X
1
+(
2
+
4
)X
2
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
29
Primjer:
D=0 Y=
0
+
1
X
1
+
2
X
2
D=1 Y=
0
+
1
X
1
+
2
X
2
+
3
+
4
X
2
=(
0
+
3
)+
1
X
1
+(
2
+
4
)X
2
AUTOKORELACIJA
Autokorelacija odstupanja (reziduala)
veza izmedu reziduala u vremenu t i reziduala u t-1
e
t
=
1 t
e +u
t
autokorelacija I. reda
Imamo dvije serije gledamo njihovu korelaciju
Ako postoji korelacija
t
e X Y + + =
1 0
f( e
t-1
)
Y X
1
X
2
D DX
2
30 20 90 0 0
25 25 110 1 110
70 30 60 0 0
60 30 150 1 150
90 25 140 1 140
Y
Y
e
t
e
t-1
30 28 2 -
25 32 -7 2
40 36 4 -7
4
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
30
e
t-1
e
t
t
e
t
t
e
t
e
j
+
e
i
+
e
j
-
e
i
-
e
j
+
e
i
+ e
i
-
e
j
-
Naruena je pretpostavka o autokorelaciji
12
- -
- -
+ +
- -
kad je pozitivna je pozitivna
kada u jednom trenutku prede u
negativni kvadrant zadrava se u
negativnom kvadrantu
pozitivna autokorelacija mijenjanje predznakanegativna
autokorelacija
nema vidljivog uzorka u ponaanju
poz. autok.
neg. autok.
nema autokorelacije
12
Pretpostavka o autokorelaciji jest da nema autokorelacije
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
31
1 2 3 t
e
t
1000
500
250
asimptotsko kretanje prema
osi X
1 2 t
eksplozivan trend (proces)
reziduali nemaju
eksplozivnih karakteristika
pa pretpostavljamo da
<1
1 2 3 t
PRETPOSTAVKA O AUTOKORELACIJI
e
t
=
1 et
+u
t
=0.5
e
0
=1000 pocetni uvjet
e
1
= e
0
+u= 0.51000+0= 500
e
2
=0.5500+0= 250
e
3
=0.5250= 125
=2
e
0
=1000
Da je =1
= -0.5
e
0
=1000
e
1
=-0.51000= -500
e
2
=-0.5(-500)= 250
e
3
=-0.5250= -125
e
t
2000
1000
e
t
1000
e
t
1000
500
250
-500
-1000
oscilacijski tip
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
32
0 X
Y
0
-1 < < 1 stabilni procesi (ako ne elimo eksplozivne procese)
negativna pozitivna
autokorelacija autokorelacija
Zbog cega je prisutna autokorelacija? (UZROCI autokorelacije)
1. zbog zanemarene varijable
Y=
0
+
1
X
1
+
2
X
2
+e pravi proces
Y=
0
+
1
X
1
+ e* izvedeno (mi napravili)
e*=
2
X
2
+e u reziduale otili reziduali iz prvog modela s varijablom X
2
koja ima,
ako je vremenski niz, veliku vjerojatnost da je autokorelirana
povezano e i e* ako postoji kod X
2
vremenski uzorak (tada postoji i vremenski
uzorak u rezidualima)
postoji autokorelacija
2. zbog krive funkcionalne forme
Y=0+1X e-iovi
pozitivna autokorelacija
Ako napravimo pravu funkcionalnu formu, rezidualni nece imati prepoznatljiv uzorak.
Posljedice autokorelacije:
1. Cista autokorelacija nema pristranost ocjenjivaca nepristranost
ocekivani (populacije)= procijenjeni (uzorak)
E [] =
Nema velike razlike izmedu i
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
33
2. Autokorelacija povecava varijancu ocjenjivaca
stvarna varijanca ocjenjivaca
zbog pristranosti autokorelacije, Var je veca
3. OLS metoda ce podcijeniti varijancu precijenjene t vrijednosti
OLS ce izvesti stvarnu varijancu
var s aotokorelacijom se nece vidjeti
standardna devijacija ce biti manja
Y=
0
+ 10X + e e-iovi su autokorelirani pa to prebacuju na X
se (5) podcijenjena
t (2)
Otkrijemo da ima autokorelaciju
Var je znacajna za model
Y=
0
+ 10 X ocistili smo od autokorelacije
se (5) Var X je neznacajna za model
t (1)
Kad ocistimo, brojke u oba modela bi trebale biti slicne
t vrijednosti bi, nakon cicenja, trebale biti nie
Testiranje autokorelacije
DURBIN-WATSON TEST DW
1. Prikladan je kada regresija ima kontantni clan Y=
1
X
1
+
2
X
2
2. Prikladan je kada imamo autokorelaciju I. reda e=
et-1
3. Prikladan je kada model ne ukljucuje lagiranu zavisnu varijablu Y
t-1
Y
t
=
0
+
1
Y
t-1
+
2
X
2
+.
lagirana zavisna varijabla
DW=
=
=
T
i
t
T
i
t t
e
e e
1
2
2
2
1
) (
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
34
obje sume su slicne-razlikuju se u prvom clanu
rijec je o vremenskim varijablama; T je krajnje vrijeme
CISTA POZITIVNA AUTOKORELACIJA
=1 e
t
=e
t-1
e
t-1
=e
t
DW=
2
2
) (
t
t t
e
e e
0
CISTA NEGATIVNA AUTOKORELACIJA
=-1 e
t
= -e
t-1
e
t +
e
t-1
=2e
t
DW= 4 4
4 ) 2 (
2
2
2
2
2
2
=
t
t
t
t
t
t
e
e
e
e
e
e
NEMA AUTOKORELACIJE
PRETPOSTAVKA Cov=0 (ako nema autokorelacije)
DW= 2
2 2 ) 2 (
2
2
2
2
1
2
2
2
1 1
2
2
1 1
+
=
+
=
+
t
t
t
t t
t
t t t t
t
t t t t
e
e
e
e e
e
e e e e
e
e e e e
Distribucija:
e
t
e
t-1
e
t
-e
t-1
1 20 - -
2 -15 20
3 30 -15
__
=
T
i 2
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
35
0 d
L
d
U
2 4-d
U
4-d
L
4
moramo imati granicne vrijednosti
NEMA ZAKLJUCKA NEMA A. NEMA ZAKLJUCKA
POZITIVNA A. NEGATIVNA A.
LOWER UPPER
broj opservacija
n k`=1
d
L
d
U
6
7
..
..
10 0.6 1.00
k`=k-1 Y=
0
+
1
X
1
k=2 k`=1
k broj varijabli
ako dobijemo autokorelaciju, gledamo razlog
loe specificirani model ili zanemarena varijabla
ako ne znamo razlog, radimo tehnicki zahvat (GLS)
Rjeavanje autokorelacije :
GLS generalizirana metoda najmanjih kvadrata
Y=
0
+
1
X
1
.+ (e
t
-
et-1
)
u
t
e
t
=
et-1
+ u
t
u
t
=e
t
-
et-1
ORCUTT-COHRANE
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
36
0 Z
i
Y
t
=
0
+
1
X
1t
+
2
X
2t
+..+
n
X
nt
+e
t
/
Y
t
=
0
+
1
X
1t
+
2
X
2t
+..+
n
X
nt
+ e
t
pomaknemo jednadbu razdoblje unazad
Y
t-1
=
0
+
1
X
1t-1
+
2
X
2t-1
+..+
n
X
nt-1
+ e
t-1
ODUZMEMO TRECU OD PRVE JEDNADBE
(Y
t
- Y
t-1
)= (
0
-
0
)+
1
(X
1t
- X
1t-1
)+
2
(X
2t
- X
2t-1
)+.+
n
(X
nt
- X
nt-1
)+( e
t
- e
t-1
)
X
1
KO X
2
KO u
t
nezavisna
varijabla
e
t
=
et-1
+ u
t
dobijemo pa ce biti koeficijent regresije I. nacin dobivanja
2
1
DW
= ako imamo DW II. nacin dobivanja
1
ce ostati isti, kao i
2
i
3
.. koeficijenti
Razlika ce biti u
0
0
*=
0
-
0
0
*=
0
(1- )
0
=
1
*
0
moemo vratiti
0
iz pocetnog modela
Ocekujemo manje t vrijednosti i
2
pa moda vidimo da i varijbla za koju smo smatrali da
je bitna za model i nije ba bitna.
HETEROSKEDASTICNOST
HOMOSKEDASTICNOST
varijanca za razlicite Z
i
-ove
je jednaka
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
37
0 Z
i
Var(e
i
)=
2
Z
i
proporcionalni faktor
HETEROSKEDASTICNOST kada se poveca neki X, poveca se i varijanca; postoji veza
izmedu varijance modela i nezavisne varijable
varijance se povecavaju
razlicite su za svaku generaciju
Var(e
i
)=
2
i
heteroskedasticnost se cesto pojavljuje u cross-sectionu (npr. razlicite zemlje, dohodak,)
Moe se javiti ako:
1. zaboravimo neku varijablu koja je vana
UVOZ=f (GDP, PR)
PR=
w
d
P
P
P
d
domace P
w
strano
npr. uvoz=
0
+
2
PR+e
j
*
e
j
*=e
j
+
1
GDP
ako je PR , uvoz
ako GDP , uvoz
2. ako nam je funkcionalna formula kriva rijetko
Posljedice:
1. E (
X
X
X
X
X
Y
+ + + + =
npr. dobijemo YKO=0.6+2.5
2
1
X
+0.5
2
1
X
X
+7
2
3
X
X
2
0
MULTIKOLINEARNOST
veza izmedu nezavisnih varijabli
Y= f ( X
1
, X
2
, , X
n
)
X
1
= g (X
2
, X
3
,., X
n
)
14
Weighted Least Square
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
40
X
2
= z (X
1
, X
3
, X
4
,, X
n
)
moguca je pocetnicka greka radi multikolinearnosti
Y= f (i, H*) Y je funkcija nominalnog kamatnjaka i inflacije
i vec sadrava H i= r + H nominalni kamatnjak = realni kamatnjak + inflacija
slijedeca greka DOMINANTNA VARIJABLA!
pr. proizvodnja obuce= f (L, K, kolicina koe koja se troi)
kolicina koe koja se troi linearno vezana sa Q
deterministicka veza usko vezana sa proizvodnjom
Q=
0
+0.5L+0.3K+0.9X
2
1 velik jer je X usko vezana s Q
t (200)
dominantna varijabla bi zasjenila druge nezavisne varijable
dominantnu varijablu izbacimo iz modela
Posljedice multikolinearnosti:
1. procjenitelji ce biti nepristrani
2. standardne greke koeficijenata ce viti velike
3. imati cemo male t vrijednosti podcjenjuje t vrijednosti
4. osjetljive na promjenu specifikacije i na promjenu nezavisnih varijabli u modelu
Q=
0
+0.5L+0.3K imamo multikolinearnost
Q=
0
+0.5L+0.3K+X ubacimo X
ako koeficijenti ostaju isti robusni na promjene
ako se koeficijenti promijene nisu robusni
Dvije promjene ubacivanje/izbacivanje varijable
specifikacija modela
5.
2
i F ce biti nepromijenjeni
6. nece utjecati na procjenu nemultikolineiranih varijabli
Otkrivanje multikolinearnosti:
1. Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
2
=0.98 veliki
2
, male t vrijednosti
(0.6) (1.2) (0.8)
-98 % varijance nezavisne varijable smo objasnili modelom
-ni jedna varijabla nije znacajna
-postoji multikolinernost
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
41
-neke nezavisne varijable su povezane
2. Koeficijenti korelacije izmedu nezavisnih varijabli
r
1
(X
1
, X
2
)
r
2
(X
2
, X
3
) Problem se javlja jer koeficijenti korelacije pokazuju vezu samo
r
3
(X
1
, X
3
) izmedu dvije varijable
| r | > 0.8
3. Ako postoji multikolinearnost izmedu vie varijabli
VIF
15
test otkriva skrivene veze medu varijablama; radimo regresiju izmedu nezavisnih
varijabli
-ako sumnjamo na kolinearnost, radimo druge regresije
2
1
= VIF1 X
1
=
0
+
1
X
2
+
2
X
3
2
2
=VIF2 X
2
=
0
+
1
X
1
+
2
X
3
2
3
=VIF3 X
3
=
0
+
1
X
1
+
2
X
2
koeficijent determinacije
2
ce pokazati vezu
-moe li se X
1
izraziti kao linearna kombinacija izmedu X
2
i X
3
varijable
VIF=
2
1
1
2
je 0 nema nikakve veze VIF=1
2
je 1 sve smo objasnili VIF=
VIF>1
Neki softveri, umjesto VIF vrijednosti TOLERANCIJA = (1-
2
)
Ako ukljucujemo vie varijabli, shodno tome raste i
2
X
1
=
0
+
1
X
2
+
2
X
3
+.
VIF>5 Prihvacamo hipotezu o multikolinearnosti za mali broj nezavisnih varijabli
(10-tak)
VIF>10 Za vie od 10 varijabli
Kako se rijeiti multikolinearnosti? to uciniti?
1. Nita
Y=
0
+
1
X
1
+
2
X
2
2
=0.8
(2.1) (2.2)
15
Variance Inflatory Factor
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
42
-nademo multikolinearnost
-ne stvara pristranost-ne remeti koeficijente
-t vrijednosti oko 2 visoke
2. Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
2
=0.8
(2.1) (0.7) (0.8)
-multikolinearnost izmedu X
2
i X
3
Izbaciti iz modela jednu (ili vie) od multikolineiranih varijabli! (koja nije znacajna) to
utjece na pristranost koeficijenata
npr. C=
0
+0.8Y
D
+0.6S-0.01T
2
=0.9
(0.6) (0.9) (-2.5)
Samo porezi uzrokuju potronju?!
Nademo vezu izmedu Y
D
i S
Koju izbaciti? t vrijednosti su poremecene radi multikolinearnosti
znanje iz ekonomske teorije Y
D
ostaje u modelu
C=
0
+0.75Y
D
-0.01T kad izbacimo S
(7) (-2.5)
3. Transformacija nezavisnih varijabli
Y= f (i, H)
r= i
H
Y= f(r) gubimo neke informacije, ali nema multikolinearnosti
Y=
0
+
1
X
1
+
2
X
2
velika multikolineiranost izmedu X
1
i X
2
ne smijemo izbaciti pa definiramo X
3
kao linearnu kombinaciju
izmedu dvije varijable
X
3
=X
1
+X
2
Y=
0
+
1
X
3
pr. X
3
= GDP+H= 3,200,000+0,08=3,200,000.08
=3,200,000+
0,15=3,200,000.15
=3,400,000+0,15=3,400,000.15
Promjena inflacije ne mijenja nita, dok promjena GDP-a itekako mijenja
velicine nisu ravnomjerne
Moramo ih prikazati ravnomjerno
H pomnoiti s 1,000,000 npr.
Y=
0
+0.8X
3
ne moemo izdvojiti zasebne efekte
gubimo informacije
linearna kombinacija
X
1
i X
2
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
43
RESET TEST
-teko je izabrati nezavisne varijable, pogotovo ako prije nije bilo nikakvih istraivanja
-imamo dvije vrste mogucnosti:
1. da smo iskljucili varijablu koja je bitna
2. da smo ukljucili varijablu koja nije bitna
Ad 1. Iskljucenje bitne varijable
npr. Y=
0
+
1
X
1
+
2
X
2
+e
Y=
0
+
2
X
2
+e*
E [
2
]=
2
+
1
f (r
1,2
) o tome ovisi hoce li
2
biti veci ili manji
e*= e+
1
X
1
-stvara se pristranost koeficijenta
E [
2
]
2
1
f (r
1,2
)
2
>
2
+ +
- +
2
<
2
+ -
2
<
2
- -
2
>
2
-pristranosti nema kada je
1
=0 (varijabla X
1
nije znacajna) ili kada ne postoji korelacija
izmedu X
1
i X
2
( f(r
1,2
)=0 )
-kako ispraviti taj problem? Ukljuciti varijablu koja nedostaje (teko ju je otkriti)
-pristranost moe biti mala, pa onda prihvacamo model kakav jest
-pocetnici ce cesto ukljucivati sve varijable
Ad 2. Ukljucivanje nebitne varijable
Y=
0
+
1
X
1
+e
Y=
0
+
1
X
1
+
2
X
2
+e*
e*=e-
2
X
2
-ubacivanje nevanih varijabli nece stvarati pristranost
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
44
Posljedice povecati ce se varijanca ostalih varijabli, smanjiti ce se njihove vrijednosti,
smanjiti ce se
2
korigirani
Pravi odabir:
1. teorija
2. gledati t testove-jesu li varijable znacajne
3. gledati
2
korigirani-je li sveukupna kvaliteta regresije u redu
4. imamo li pristranost u koeficijentima ili mijenjaju li se bitno koeficijenti varijable
kada ukljucujemo ili iskljucujemo neke od njih
Primjer:
Potranja za brazilskom kavom D
BC
D
BC
= f (P
BC,
P
t,
Y
D
)
P
BC
cijena brazilske kave -
P
t
cijena caja +
Y
D
dohodak +
D
BC
= 8.1+7.8 P
BC
+2.4 P
t
+0.0035 Y
D
(0.5) (2.0) (3.5)
2
=0.6
-cijena brazilske kave nema nikakav utjecaj na potronju kave
-izbacujemo varijablu cijena brazilske kave
D
BC
= 9.3 +2.6 P
t
+0.0036 Y
D
2
=0.61
(2.6) (4.0)
-moguce je da je elasticnost za kavom mala ili nikakva u odnosu na cijenu kave
-ukljucujemo i cijenu kolumbijske kave
D
BC
= f (P
BC,
P
t,
Y
D,
P
CC
)
P
BC
cijena brazilske kave -
P
t
cijena caja +
Y
D
dohodak +
P
CC
cijena kolumbijske kave +
D
BC
= 10.0+8.6P
CC
-5.6 P
BC
+2.6 P
t
+0.0030 Y
D
(2.0) (-2.8) (2.0) (3.0)
2
=0.65
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
45
-cijena kolumbijske kave utjece na potranju za brazilskom kavom
-teorija je zadovoljena,
2
se povecao, predznaci su ocekivani (pristranost), t vrijednosti su
znacajne
2
je precjenjivao stvarni
2
-moramo se vie oslanjati na ekonomsku teoriju nego na statisticku znacajnost
-nacin na koji se to radi TRAENJE SPECIFIKACIJE:
1. DATA MINING
neeticna metoda, oslanja se na velik broj regresija s velikim brojem varijabli, lagova,
razlicite funkcionalne forme
2. STEP WISE REGRESIJA
temelji se na tome da npr. uzmemo 6 varijabli s kojima se ucine sve moguce
kombinacije
Y= f (X
1
)
Y= f (X
1
, X
2
)
Y= f (X
2
)
Y= f (X
2
, X
3
)
Y= f (X
1
, X
2
, X
3
, X
4
)
-gleda koja kombinacija daje najveci
2
Y= f (X
1
, X
2
, X
3
,., X
n
) maksimalan
2
3. SEKVENCIJALNO TRAENJE SPECIFIKACIJE
istraivaci tee definiranju pocetne jednadbe, ubacuju ili izbacuju varijablejednu po
jednu i gledaju to ce se dogoditi
sa to manje varijabli objasniti neki model
REMSEY TEST
njime testiramo funkcionalnu formu modela
temelji se na tome da uzima vrijednosti koje bi trebalo procijeniti kakve bi nae vrijednosti
trebale biti
4 3 2
Y Y Y
Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
46
Izvodenje testa:
1. napravimo regresiju
e X X Y + + + =
2 2 1 1 0
dobivamo procijenjenu vrijednost Y
2.
4 3 2
Y Y Y potenciramo Y
3. e Y Y Y X X Y + + + + + + =
4
5
3
4
2
3 2 2 1 1 0
u
4 3 2