Ekonometrija

Sanja Blaevic, Ekonometrija
-----------------------------------------------------------------------------------------------------------------
1
UVOD

ekonomsko mjerenje
znanstvena disciplina koja se bavi empirickim
1
dokazivanjem ekonomskih zakona koji su
definirani u ekonomskoj teoriji
usko je vezana za discipline kao to su ekonomska teorija, matematicka ekonomija i
ekonomska statistika

Ekonomska teorija povezanost izmedu ekonomskih pojava; ne govore o jacini (velicini)
vec o smjeru

Provjera da li u praksi postoje veze koju opisuje ekonomska teorija i da ih kvantificira
Ekonometrija potvrduje odnosno ne potvrduje ekonomsku teoriju

Matematicka ekonomija izraava ekonomsku teoriju u odredenoj matematickoj formi bez
osvrtanja na empiricku osnovu u toj promjeni

Ekonometrija polazeci od jednadbi matematicke ekonomije gradi ekonometrijske modele
pogodne za empiricko testiranje ekonomskih teorija.

Ekonomska statistika bavi se prikupljanjem, obradom i prezentiranjem ekonomskih
pokazatelja u obliku tablica i slika. Ne bavi se provjerom ekonomskih teorija na temelju tako
prikupljenih podataka, vec to cini ekonometrija, koristeci se podacima prikupljanim od strane
statistike koji ulaze u njezinu analizu.

Metodologija ekonometrije:

Ekonometrijska analiza slijedi odredeni metodoloki put:

1. Odredivanje teorije ili hipoteze preuzima iz ekonomske teorije
2. Specifikacija ekonometrijskog modela iako je Keynes pretpostavio pozitivnu vezu
izmedu C i Y
D
, nije specificirao precizni oblik funkcionalne veze izmedu tih varijabli

C=+Y
D
0<<1
Czavisna varijabla (endogena varijabla)
Y
D
nezavisna varijabla (egzogena varijabla-zadana)

Yd
C

Stohasticki ili empiricki model

1
iz iskustva
greka
Scatter dijagram
Y= + yD + Ui
Ui
-----------------------------------------------------------------------------------------------------------------
2
Stohasticke
2
varijable imaju odredenu distribuciju vjerojatnosti.

3. Procjena parametara dati vrijednosti, temeljem neke metode, parametrima
(koeficijentima)

ili
0
=120 ili
1
=0.8

odsjecak na ordinati nagib pravca

Svojstvo pravca: minimizirati odstupanje

4. Provjera
H
0
:
1
=0.9 Ako je velika disperzija, prihvacamo hipotezu.

5. Predvidanje (strukture modela)

PRIRODA REGRESIJSKE ANALIZE

Regresija- Francis Galton 1886. godine

Regresija i uzronost

Koeficijent korelacije
3
samo linearna veza/ mjera linearne korelacije

-1 < r < 1

etva meteoroloke prilike Ne govori se koja varijabla na koju utjece.

2
Deterministicka povezanost za svaku vrijednost jedne pojave tocno znamo vrijednost druge pojave
Stohasticka povezanost na osnovu vrijednosti jedne pojave ne moemo sa sigurnocu predvidjeti vrijednost
druge pojave
3
Cemu slue korelacija i regresija? Statisticka sredstva za proucavanje povezanosti (odnosa) medu pojavama.
Korelacija proucava jakost (intenzitet, stupanj) povezanosti medu pojavama. Regresija povezanost se precizno
opisuje pomocu modela (tzv. regresijski model).
Koeficijent korelacije je mjera linearne korelacije.
Visina
djece

1.8

1.7

1.6

1.5
1.50 1.60 1.70 1.80 1.90 2.0 Visina roditelja
Regresijski pravac
Tendencija prema
mediokritetu.
Postoji ocekivana
vrijednost.
-----------------------------------------------------------------------------------------------------------------
3

etva= f (meteoroloke prilike, gnojivo,)

Regresija pokazuje smjer uzrocnosti, za razliku od korelacije koja je simetricna (obje se
varijable tretira jednako).
Regresijska analiza proucava zavisnost varijable o nezavisnim varijablama. To je kretanje
prema prosjeku. Slui nam za procjenu srednje vrijednosti zavisne varijable.
Stohasticke varijable mogu poprimiti bilo koju vrijednost uz zadanu vjerojatnost.

Terminologija:

Y=
0
+
1
X Jednostavna regresija

Yzavisna varijabla
Xnezavisna varijabla

Y=
0
+
1
X
1
+
2
X
2
+.......+
n
X
n
Viestruka regresija

USlucajna greka, rezidual

Vrste podataka:

1) Vremenski nizovi

sezonska kretanja

trendovi
slijedeca ovisi o prethodnoj

2) Cross section

razlicite vremenske tocke
nije vezan za vrijeme (nema vremensku komponentu)

3) Panel podaci

vremenski nizovi+cross section

t Y
D
C
1 500 350
2 350 100
3 600 550
4 1500
IME Y
D
C
Paola 350 100
Ivana 500 450
IME Paola Ivana
Y
D
C Y
D
C
1 500 350
2 350 100
3 600 550
-----------------------------------------------------------------------------------------------------------------
4
Kvaliteta:

Ekonometrijska analiza vrijedi koliko i kvaliteta podataka koje koristimo. Podaci su loi jer:

1) Postoji opservacijska greka
2) Nema dovoljno podataka
3) Postoje greke koje se pojavljuju zaokruivanjem
4) Pristranost kod selekcije
5) Problem kad su podaci jako agregirani

Regresija s dvije varijable

Y=f (X) jednostavna regresija

Y potronja
X raspoloivi dohodak

*
uzeli smo kao uzorak

Uvjetna vjerojatnost zato to Y ovisi o X Y ce poprimiti neku vrijednost Yi ako X
poprimi Xi
P(Y=Y
i
|X=X
i
)
P(Y|X)

Dohodak
80 100 120
55 65 79
55
*
70 84
65 74 90
*
70 80 94
75 85
*
98
88
-----------------------------------------------------------------------------------------------------------------
5

*
uvjetna vjerojatnost Y uz dano X

Uvjetna sredina ili matematicko uvjetno ocekivanje

Opceniti oblik linearne funkcije E (Y|X
i
)

E=552/5+651/5+701/5+751/5=22+13+14+15=64

E (Y|X
i
)=f(X
i
)

Ocekivana vrijednost ce ovisiti o visini dohotka.

E (Y|X
i
)=
0
+
1
X
i
Linearna populacijska regresija

LINEARNA REGRESIJA linearnost u parametrima, a ne linearnost u varijablama

a) E(Y|X
i
)=
0
+
1
X
i
+
b) E(Y|X
i
)=
2
1 0 i
X + -
c) E(Y|X
i
)=
0
+
1
lnX
i

+
d) E(Y|X
i
)=
0
+
1
2
X
i
-

Linearnost odnos
PARAMETARA odnos parametara i zavisne varijable E(Y|X)=
0
+
1 1
X
(nema linearnosti)
Dohodak
80 100 120
1/6 1/5 2/5
1/6 1/5
1/5 1/6 1/5
1/5 1/6 1/5

P (Y|X
i
)
*

1/5 1/6 1/5
E (Y|X
i
) 64 77 89
Y

105
95
85
75
65
55

0 80 100 120 X
i

Regresijska funkcija
populacije

matematicko ocekivanje ili
uvjetna sredina zavisne varijable
za fiksnu vrijednost nezavisne
varijable
-----------------------------------------------------------------------------------------------------------------
6
VARIJABLI odnos varijable i zavisne varijable E(Y|X)=
0
+
1
X
1
2
(nema
linearnosti)

Odstupanje

U
i
=Y
i
-E(Y|X
i
)
Y
i
=E(Y|X
i
)+U
i

Pojedinacna potronja ce ovisiti o prosjeku grupacije neka greka

Regresijska funkcija uzorka uzorak mora biti reprezentativan

i i i
e x Y + + =
1 0

Y
procijenjena vrijednost Y-a

0
procijenjena vrijednost

1
procijenjena vrijednost
1

e
i
U
i

A
Y

0 X
S1
POP
Regresijska funkcija uzorka podcjenjuje
vrijednosti populacije prije A
Regresijska funkcija uzorka precjenjuje
vrijednosti populacije nakon A
Y
-----------------------------------------------------------------------------------------------------------------
7
Pozitivna
autokorelacija
odstupanja
Uj
+
Ui
+
Negativna
autokorelacija
odstupanja
Uj
+
Ui
+
Uj

Ui
+
Nema korelacije
izmedu Ui i Uj
Pretpostavke koje moraju biti zadovoljene da bi prihvatili regresijsku funkciju uzorka kao
procjenitelja regresijske funkcije populacije:

1. E (U
i
|X
i
)=0

Statisticke greke regresijske funkcije populacije su 0.

Za svaki njegov X
i
, njegov prosjek mora biti 0.

2. Cov (U
i
, U
j
)=0 Odsutnost autokorelacije, odstupanja su nekorelirana.

3. Homoskedasticnost Var (U
i
|X
i
)=
2
varijanca je jednaka

Svako odstupanje ima istu varijancu, nemogucnost rasprenja odstupanja za vece
vrijednosti od malih.

X1 X2 X3
Y
Ui
+

Ui
-
Regresijska funkcija populacije
za svaku vrijednost varijable X,
odstupanje je normalno distribuirano oko
0
sredina=0
simetricno distribuirana oko njezine
-----------------------------------------------------------------------------------------------------------------
8
Razlika
RFP-RFU
0
0 X1 X2 X3 X4 X
Y
Y4
Y2
Y1

Y3
e4 -
e3 -
e2 +
e1 +
4. Pravilno specificiran regresijski model

Regresija s dvije varijable
-Problem procjene parametara-

metoda najmanjih kvadrata (OLS)
4

Karl Friedrich Gauss

Min

= =
=
n
i
i i
n
i
i
Y Y e
1
2
1
2
)
(

i i i
e x Y + + =
1 0

)
(
1 0 i i i
x Y e + =

i i i
Y Y e
= Y
i
stvarni
i
Y
procijenjeni

4
Ordinary Least Square Dobivamo najmanja odstupanja od regresijske linije
A
B
RFP
RFU
A B
e
i
Autokorelacija pozitivna
-----------------------------------------------------------------------------------------------------------------
9
0 1 2 3 4 5 6 X
Y
12
11
10
9
8
7
6
5
4
3
2

Izabrati
1 0

i da minimiziraju onu sumu

= )
(
1 0
2
f e
i

0
=3

1
=1

npr. X Y 5 . 0 4
+ =

= 5 . 26
2
i
e
Treba izabrati
0
i
1
takve da minimiziraju sumu Bolji je pravac jer minimizira
kvadrata tih odstupanja. sumu tih kvadrata.

0 )

(
2
1 0
0
=
i i
X Y

2
i
e
= =
0 ...... .......... ..........

1

x
i
=(X
i
- X )
y
i
=(Y
i
-Y )

Y
i
X
i
i
Y

e
i
2
i
e
x
i
y
i
x
i
y
i

2
i
x
i
Y

e
i
2
i
e
4 1 4 0 0 -3 -3 9 9 2.92 1.08 1.17
5 4 7 -2 4 0 -2 0 0 7 -2 4
7 5 8 -1 1 1 0 0 1 8.36 -1.36 1.85
12 6 9 3 9 2 5 10 4 9.72 2.28 5.2
Y =7 X =4
14 19 14 7 12.22

Y
i
x
i
i
Y

e
i

2
i
e
4 1 4 0 0
5 4 7 -2 4
7 5 8 -1 1
12 6 9 3 9
0 14
i i
X Y + = 1 3

=
2
1
i
i i
x
y x

x y
1 0

=
X Y
i
36 . 1 56 . 1
+ =
-----------------------------------------------------------------------------------------------------------------
10
36 . 1
14
19
2
1
= =
=

i
i i
X
Y X
56 . 1 4 36 . 1 7

1 0
= = = X Y

Svojstva regresijske funkcije:

1. Prolazi kroz sredinu uzoraka

2. Sredina procijenjenog Y-a jednaka je sredini stvarnog Y-a

Y Y =

Y Y
X X Y
X X Y
X Y
i
=
+ =
+ =
+ =
) (
(

1
1 1
1 0
DOKAZ!

Dobijemo Y Y =
jer je ( )
= 0 X X
i

3. Sredina reziduala je 0

0 = e
n
0

Proizlazi iz uvjeta optimizacije

( )

= = =
0 0 2

2
1 1 0
0
e e X Y
i i

x y
1 0

=
X Y
1 0

+ =
-----------------------------------------------------------------------------------------------------------------
11
Regresijska funkcija populacije
1
=0.75
Uzmemo uzorke
(
1
)=0.7
(
1
)=0.65
(
1
)=0.8
.
.
.
.
.

E (
1
)=0.75
4. Reziduali e
i
su nezavisni od procijenjenog Y-a (
i
Y
)

0

)
2 2
1
2 2
1
2 2
1 1
1 1
1
1
=
=
=
=
=
=

i i
i i i
i i i
i i i i
i i
x x
x y x
x y x
e x e y
x y

5. Reziduali e
i
su nezavisni od x
i

Proizlazi iz problema minimizacije

= =
0 2
) (
1
i i
i
x e
e

kovarijanca

Svojstva procjenitelja (parametara, koeficijenta regresije):

1. Oni su BLUE
5

a. Linearni preduvjet za regresijsku funkciju
u linearnom odnosu prema zavisnoj varijabli
b. Nepristrani njihova ocekivana vrijednost jednaka je stvarnoj vrijednosti

E (
)=

5
Best Linear Unbiased Estimator (Najbolji linearni nepristrani procjenitelji)

= =
=
=
2 2
1
2
1 1 1
1
2
1

.
.
i i i i
i
i i
i i i
x x y x II
x
y x
proizlazi odakle
x y x I

-----------------------------------------------------------------------------------------------------------------
12
N
A
J
B
O
L
J
I

e
i
TSS
Y
0
X
i
X

c. Efikasni
OLS metoda

Alternativna metoda

E(
1
)=
1

minimalna varijanca (raspon vrijednosti) za istu sredinu

d. Konzistentni

E(
1
)=0.7 npr. uzeli smo prvih 20 uzoraka

Uzmemo jo 20 i dobijemo ocekivanu vrijednost za 40 opaanja

E(
1
)=0.65

S povecanjem uzoraka, parametri konvergiraju populacijskoj sredini pa su
konzistetni.

Koeficijent determinacije (koeficijent korelacije
2
)

2
govori koliko smo pomocu X protumacili varijaciju Y-a u odnosu na ukupnu varijancu
Y-a
odnos izmedu ESS I TSS

r(x,y) koeficijent korelacije se radi izmedu dvije varijable

Y

regresijska funkcija uzorka
ESS
Y
i
-----------------------------------------------------------------------------------------------------------------
13
e
i
ili RSS (residual sum of square)neobjanjeno odstupanje kvadrata
TSS total sum of squareukupno odstupanje kvadrata
ESSestimated sum of squareobjanjeno odstupanje

RSS ili SSR=

=
=
n
i
i i i
Y Y e
1
2 2
)
(
TSS ili SST=

2
) ( Y Y
i
to je pravac vie nagnut, TSS ce biti veci.
ESS ili SSE=
2
)
( Y Y
i

TSS=ESS+RSS

2
) ( Y Y
i
=
2
)
( Y Y
i

n
i
i i
Y Y
1
2
)
( /

2
) ( Y Y
i

1=
2
)
( Y Y
i

2
) ( Y Y
i
+
n
i
i i
Y Y
1
2
)
( /

2
) ( Y Y
i

1=
TSS
RSS
TSS
ESS
+

2

=
2
2
2
) (
1
Y Y
e
i
i

TSS
RSS
= 1
2

TSS
ESS
=
2

0<
2
<1 to je veci, to je bolji.

Y=f(x
1
, x
2
, x
3
,., x
n
) to ima vie varijabli, koeficijent determinacije ce rasti.

Svojstva
2
:
- nije nikada negativan (samo ako se radi o regresiji kroz ishodite)
- 0
2
1
- r=
2
r

Stupnjevi slobode N-k (U softveru df.)
kbroj parametara koje ocjenjujemo

N=10
Y=
0
+
1
X
1
df=8
Y=
0
+
1
X
1
+
2
X
2
df=7

-----------------------------------------------------------------------------------------------------------------
14
Korigirani koeficijent determinacije
2

=
) 1 /( ) (
) /(
1
2
2
2
N Y Y
k N e
i
i

2
ima u sebi troak ubacivanja nove varijable (korigiran je za N-k)

Je li veci
2
ili
2
ovisi o odnosu (N-k) i (N-1)

(N-k) < (N-1)

2
je uvijek veci od
2
jer je (N-k) uvijek manje od (N-1)

2
<
2
Vrijednost
2
moe ostati ista ili se povecati, ali nikako smanjiti ulaskom nove
varijable u regresiju.

Uvodenjem nove varijable odstupanja ce se smanjiti jer ce neto vie objasniti. Ali gube se i
stupnjevi slobode. Ako je vie objanila nego tetila, varijabla ostaje u modelu.

Testiranje nad koeficijentom

Y=
0
+
1
X
1
+
2
X
2
++
n
X
n

t=
) (
var
) (
*
se
vrijednost testirana vrijednost na st
se

=

t-test

sestandardna devijacija
T testtestiranje signifikantnosti regresijskih koeficijenata
pokazuje znacajnost parametara

VAR (
1
)=
2
2
i
x
varijanca populacijskog modela (rasprenost)

) (
2
2
k N
e
i
=

procijenjena varijanca

= =
2
2
1 1
( )
(
i
X
se VAR

VAR(
0
)=
2
2
2

i
i
x N
X

se(
0
)=
2
2
2

i
i
x N
X
STANDARDNA GREKA PROCJENITELJA
-----------------------------------------------------------------------------------------------------------------
15

Y
=0.5+2.5X
1
-1.5X
2
se (0.1)

Testiram mogucnost da je
1
=2

H
0
:
1
=2
t= 5
1 . 0
5 . 0
1 . 0
2 5 . 2
= =
Ako je veci od 2 je znacajan.

U Studentovoj t-distribuciji gledamo moemo li broj 5 prihvatiti ili odbaciti.

prazina znacajnosti testakolika je vjerojatnost da smo nacinili greku ako odbacujemo
hipotezu
znacajnost 0.05 5% p=1-z
pouzdanost 0.05 95% z=1-p

F-test

ANOVA tablica (analiza varijance)

procijenjena varijanca modela (populacije)

Testiranje na vie parametara

F=
2
1
2
(
) (
=
N
i
i i
Y Y
RSS M
ESS

ijanca na procijenje
ijanca objanjena
var
var

Ovaj test testira hipotezu da su svi koeficijenti osim
0
jednaki 0.

F
(1, N-k)
H
0
:
1
=
2
=.=
n
=0 (nisu znacajni za objanjenje varijable Y)

6
sredina
Izvor
odstupanja
SS D.F. MSS
6

ESS
N
i
i i
Y Y
1
2
)
(
1 SS:D.F.
RSS
=
n
i
i
e
1
2

N-k
2
ili
k N
e
i
2

TSS
n
i
i
Y Y
1
2
) (

-----------------------------------------------------------------------------------------------------------------
16
Y=
0
+
1
X
1
+
2
X
2
+
3
X
3

primjer F= 35 p=0,006 odbacujemo
primjer F= 1.5 p=0,15

Cesto cemo odbaciti H
0
.

Svi parametri u modelu koji se vezuju uz varijablu jesu 0. To F-test testira.

Testiranje na parametrima

F=
) /( ) 1 (
/ ) (
2
2 2
k N
m
UR
R UR

UR
2
neogranicen
R
2
ogranicen
m broj ogranicenja

Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
UR
2
=
H
0
:
2
=
3
=0 ne spadaju

Y=
0
+
1
X
1 R
2
=.. ogranicen jer nismo ukljucili x
2
i x
3

R
2
< UR
2
te brojke koje dobijemo stavljamo u jednadbu

F
(m, N-k)

2
=0

3
=0 m=2 (ogranicenja) N-kstupnjevi slobode

Stavljamo UVIJEK stupnjeve slobode veceg modela, s vie varijabli!!!

H
0
:
1
+
2
=1 m=1 Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
UR
2
= 0,99

2
=1-
1
Y=
0
+
1
X
1
+(1-
1
)X
2
+
3
X
3

Y=
0
+
1
X
1
+X
2
-
1
X
2
+
3
X
3
X
2
nema koeficijenta

Y-X
2
=
0
+
1
X
1
-
1
X
2
+
3
X
3

Y-X
2
=
0
+1(X
1
-X
2
)+
3
X
3
konacni model iz
kojeg cemo dobiti
R
2
gubimo
stupnjeve slobode
R
2
=0,98

Da je velika razlika izmedu UR
2
i R
2
, F ce biti veliki broj, p ce biti izrazito malen i
hipoteza se odbacuje.

II. primjer:

H
0
:
1
-
2
=0 m=1 Y=
0
+
1
X
1
+
2
X
2
+
3
X
3

1
=
2
Y=
0
+
2
X
1
+
2
X
2
+
3
X
3

-----------------------------------------------------------------------------------------------------------------
17
Y=
0
+2(X
1
+X
2
)+
3
X
3

ZADATAK:

Obiteljski dohodak X
Potronja Y

Y
i
X
i
x
i
7

y
i
8

x
i
y
i
x
i
2
i
Y
9

e
i
10

e
i
2
X
i
2
( )
2
Y Y
i

( )
2
Y Y
i

70 80 -
90
-
41
3690 8100 65,1 4,9 24,01 6400 2106,81 1681
65 100 -
70
.46 3220 4900 75,3 -
10,3
106,09 10000 1274,49 2116
90 120 -
50
-
21
1050 2500 85,5 4,5 20,25 14400 650,25 441
95 140 -
30
-
16
480 900 95,7 -0,7 0,49 19600 234,09 256
110 160 -
10
-1 10 100 105,9 4,1 16,81 25600 26,01 1
115 180 10 4 40 100 116,1 -1,1 1,21 32400 26,01 16
120 200 30 9 270 900 126,3 -6,3 36,69 40000 234,09 81
140 220 50 29 1450 2500 136,5 3,5 12,25 48400 650,25 841
155 240 70 44 3080 4900 146,7 8,3 68,89 57600 1274,49 1936
150 260 90 39 3510 8100 156,9 -6,9 47,61 67600 2106,81 1521
111 = Y 170 = X
16800 33000 337,3 322200 8583,3 8890

Y=
0
+
1
X
Izracunati koeficijente,
2
(koeficijent determinacije), se, F i napraviti testiranje.

1
=

2
i
i i
x
y x

0
= X Y
1
VAR(
1
)=
2
2
i
x
VAR(
0
)=
2
2
2

i
i
x N
X

= =
2
2
2
) (
)
(
Y Y
Y Y
TSS
ESS
i
i
F=
2

ESS

k N
e
i
2
2

51 , 0
33000
16800
1
= =
0
=111-0,51170=24,3

Y=24,3+0,51X
se (6,42) (0.036)
t (3,79) (14,17)

7
X X
i

8
Y Y
i

9
zadano
10
Y - Y

-----------------------------------------------------------------------------------------------------------------
18
16 , 42
2
2
=
k N
e
i
VAR(
1
)=0.0013 VAR(
0
)=41,16
se(
1
)= 036 , 0 )
(
1
= VAR se(
0
)= 42 , 6 )
(
0
= VAR

t-test H
0
:
0
=0 t=
) (
var
) (
*
se
testirani ni st
se

=

H
0
:
1
=0

Primjer:

1
=0,8

t= 05 , 8
036 , 0
8 , 0 51 , 0
=
|-8,05|>2 odbacujemo

ANOVA tablica

F= 59 , 203
2
=
ESS

966 , 0
8890
3 , 8583
2
= = =
TSS
ESS

957 . 0 043 , 0 1
9 : 8890
16 , 42
1
1 / ) (
/
1
2
2
2
= = =

N Y Y
k N e
i
i

2 2
<

Y
=24,3+0,51X
(3,79) (14,17)

Varijabla X je znacajna za objanjenje potronje.

F=203,59 Odbacujemo hipotezu da je X beznacajan za model

96% varijance potronje smo uspjeli objasniti kretanjem dohotka.

SS D.F. MSS
ESS 8583,3 1 8583,3
RSS 337,3 8 42,16
TSS 8890 8 1111,25
-----------------------------------------------------------------------------------------------------------------
19
E
E
E
0
X
Y
FUNKCIONALNE FORME

nagib je isti, ali elasticnost je
razlicita
Mjerne jedinice

GDP, M
11
u milijunima
Y, C u milijunima

C=f (Y
D
)

Cmilijuni; Y
D
milijuni C=
0
+0,8 Y
D
2
=0,89 F=200

(2,5)

Ctisuce; Y
D
milijuni C=
0
+800 Y
D
2
=0,89 F=200

(2,5)

Cmilijuni; Y
D
tisuce C=
0
+0,0008 Y
D
2
=0,89 F=200

(2,5)

Ako su varijable u razlicitim mjernim jedinicama,
2
i t ostaju isti.

Model:

1
11.
..
LIN-LIN Jednadba Nagib(
dX
dY
) Elasticnost(E
Y,X

Y
X
dX
dY
)

Y=
0
+
1
X
1
1

Y
X

2
22.
..
LOG-LOG lnY=
0
+
1
X
1
=
dX X
dY Y
X d
Y d

=
) (ln
) (ln
ln
ln

1 1

Y
X
X
Y
Y
X
dX
dY
= =

11
novcana masa
-----------------------------------------------------------------------------------------------------------------
20

1
=
Y
X
dX
dY
dX
X
dY
Y
=
1
1

Nagib
X
Y
dX
dY
=
1

Y=AK
+L

Cobb-Douglasova funkcija proizvodnje Atehnoloki napredak
Kkapital
Lrad
lnY=lnA+lnK+lnL

0
PARAMETRI

3
33.
..
LOG-LIN Jednadba Nagib(
dX
dY
) Elasticnost(E
Y,X

Y
X
dX
dY
)
lnY=
0
+
1
X
1
=
dX
Y
dY
dX
Y d
=
ln

1
Y X
Y
X
=
1

=
Y dX
dY 1

dX
dY

Nagib Y
dX
dY
1
=

4
44.
..
LIN-LOG Y=
0
+
1
lnX
1
=
X
dX
dY
X d
dY
=
ln

1
Y
X
X
1 1
1
=

1
= X
dX
dY

Nagib
X
dX
dY 1
1
=

Stopa rasta:
Y
dY

-----------------------------------------------------------------------------------------------------------------
21
w
w
(place)
Philipsova krivulja p
p
(cijene)
0
0
nezaposlenost

od stope napravimo prosjekeprosjecna stopa rasta
izvodi se pomocu LOG-LIN modela
bolja u odnosu na klasicnu metodu jer ne ovisi o baznom
razdoblju

lnY=
0
+
1
X
1
mjesecna stopa rasta12=godinja stopa rasta
kvartalna stopa rasta4=godinja stopa rasta

1
=
dT
Y
dY
dT
Y d
=
ln

Y
dY
stopa rasta

Mjesec T(trend) Kvartal
8 1 I
9 2 II
10 91. 3 III
11 4 IV
12 5 I
1 92. 6 II

lnY=
0
+
1
T
(0,5) znaci da naa varijabla nema trenda

je + je -

0
<0

1
>0

0
<0;
1
<0

-----------------------------------------------------------------------------------------------------------------
22
AS
AD
P
1
P
2
Y
2
Y
1

Y=
0
+
1
X
1

RECIPROCNI Jednadba Nagib(
dX
dY
) Elasticnost(E
Y,X

Y
X
dX
dY
)
Y=
0
+
1
X
1
) (
1
X
dX
d
dX
dY
o
+ =

Y
X
X
Y
X
dX
dY
=
2
1

=
2
1
2
1
1 0
X
X

=

=-
1
Y X
1
=
XY

DUMMY VARIJABLE

koriste se kad elimo u model ukljuciti nenumericke ili kvalitativne varijable
mogu poprimiti dvije vrijednosti 0 i 1 pa se cesto zovu i binarne vrijednosti

Y=
0
+
1
GS+
2
D

Yplaca, koja ovisi o GS (godinama staa)
pozitivna korelacija Y raste s GS
moda ovisi i o strucnoj spremi

za kvalitativne modeledummy
varijable
D=0 VSS
D=1SSS

SSS D=0 Y=
0
+
1
GS
VSS D=1 Y=
0
+
1
GS+
2

Y=(
0
+
2
) +
1
GS

a b

Y=1000+50GS+300D
Y X
0,5 1
0,15 2
0,16 3
Godine
staa
Strucna
sprema
D
Ante 20 VSS 1
Miro 25 SSS 0
Anka 5 VSS 1
Marko 30 VSS 1
-----------------------------------------------------------------------------------------------------------------
23
VSS
SSS
GS
Y
0
0
+
2

1

Ante Y=1000+5020+300=2300 kn 300 kn vie zbog VSS
Miro Y=1000+5025=2250

Da smo za SSS imali D=1, a za VSS D=0, predznak bi za Miru ispred
2
bio negativan, ili

Ante Y=1300+5020=2300 kn
Miro Y=1300+5025-300=2250 kn

2
bit ce jednak
kvaliteta regresije ne ovisi o tome kojoj smo kvaliteti dali 0 ili 1
mijenjaju se parametri

Y=
0
+
1
GS bez D SSS
Y=
0
+
1
GS+
2
s D VSS

VSS
INTERCEPT DUMMY
ostao je isti nagib, ali je
odsjecak na ordinati
razlicit

pozitivna korelacija

S obzirom na godine staa, model procjenjuje Y za SSS i VSS.

U slucaju 3 obiljeja

GS SS D1(SSS) D2(VS) D3(VSS)
Ante 20 VSS 0 0 1
Miro 25 SSS 1 0 0
Anka 5 VSS 0 0 1
Marko 30 VS 0 1 0

Jednu cemo izbaciti. Svejedno je jer ce
0
poprimiti vrijednosti, npr. SSS

Y=
0
+
1
GS+
2
VS+
3
VSS

SSS Y=
0
+
1
GS
VS Y=
0
+
1
GS+
2
VS Y=
0
+
1
GS+
2

VSS Y=
0
+
1
GS+
3
VSS Y=
0
+
1
GS+
3
-----------------------------------------------------------------------------------------------------------------
24
GS
1
SSS
VS
VSS Y
0
+
2
0
+
3
0
SSS+ (veca placa)
VSS+ (veca placa)
VSS+M
SSS+M (manja placa)
GS 0
Y
0
+
3
0
+
2

0
+
2
+
3

pretpostavili
3
>
2

M0 1

Y=
0
+
1
GS+
2
SS+
3
SPOL
(t) pokazuje znacajnost parametra

Ante Y=
0
+
1
GS+
2
=(
0
+
2
)+
1
GS
Miro Y=
0
+
1
GS
Anka Y=
0
+
1
GS+
2
+
3
=(
0
+
2
+
3
)+
1
GS

H
0
:
3
=0 t>2, postoje razlike.

Ako je
2
300, moramo gledati t vrijednost. Ako je npr. 0,25, onda ne igra veliku ulogu jer je t
vrijednost mala.

* recimo da na 95% pouzdanosti testiramo, gledamo p vrijednost koja bi bila primjerice 0,7
to znaci da ne moemo odbaciti hipotezu jer radimo 70% pogreke ako odbacimo.

* npr. t je 4,5 ispod
3
postoji diskriminacija

Marko Y=
0
+
1
GS+
2
=(
0
+
2
)+
1
GS

Godine
staa
Strucna
sprema
VSS SPOL
Ante 20 VSS 1 0
Miro 25 SSS 0 0
Anka 5 VSS 1 1
Marko 30 VSS 1 0
-----------------------------------------------------------------------------------------------------------------
25
M

GS 0
Y
S
0
tednja od 1950.-2000.
tednja od 1900.-1950.
1950.
SLOPE DUMMYmijenja nagib

mukarcima se GS vie uvaavaju
nego enama
enama se onemogucava karijera

Y=
0
+
1
GS+
2
D+
3
GSD
2
Dintercept
3
GSDslope
D=0 Y=
0
+
1
GS
D=1 Y=
0
+
1
GS+
2
+
3
GS
Y=(
0
+
2
)+(
1
+
3
)GS

Razlika u odsjecku na ordinati i u koeficijentu smjera

D=0mukarci
D=1ene

S=
0
+
1
Y+
2
D+
3
DY
D=1 nakon 1950. S=(
0
+
2
)+(
1
+
3
)Y
D=0 prije 1950. S=
0
+
1
Y

Prije 1950. Nakon 1950.

1
=
dY
dS

1
+
3
=
dY
dS

Spol GS D (spol) GSD
Ante M 20 0 0
Miro M 25 0 0
Anka 5 1 5
D GodS
1950. 0
0
0
1950. 0
1951. 1
1 ..
1
2000. 1
.
..
.

..
.
-----------------------------------------------------------------------------------------------------------------
26
t
GDP
0 I II III IV I II

Jo jedan nacin izracunavanja razlikeraditi 2 regresije:

prije 1950. S=200+0,2Y
nakon 1950. S=150+0,3Y

usporediti
Nedostatak: moramo imati dovoljno opaanja

S=
0
+
1
Y+
2
D+
3
DY
prije S=
0
+
1
Y

nakon 1950. S=(
0
+
2
)+(
1
+
3
)Y

Razlika u i
3
: ako je t vrijednost velika, razlika u ponaanju je velika

dummy varijable se cesto koriste kod vremenskih nizova za desezoniranje

lice na stablima

vremenski nizovi
trend-dugorocni
fluktuacije
uvijek se koristi jedna dummy varijbla manje od broja varijabli

postoji korelacija izmedu GDP-a i lica na stablima
da bi izbjegli nelogicnosti korelacije vrimo desezoniranje
ubacujemo sezonske dummy varijable koje kupe na sebe sezonska odstupanja

S
2
S
3
S
4
I 0 0 0
II 1 0 0
III 0 1 0
IV 0 0 1

-----------------------------------------------------------------------------------------------------------------
27
Y=
0
+
1
X+
2
S
2
+
3
S
3
+
4
S
4
rijeili smo sezonu; kod GDP-a bi se trebali rijeiti trenda rasta

ukljucimo i TREND VARIJABLU
T
1 linearni
2
3
.
. eksponencijalni trend T
2
.
N

Y=
0
+
1
X+
2
S
2
+
3
S
3
+
4
S
4
+
5
T

2
pokazuje koliko je veci ili manji rast u II. kvartalu u odnosu na I. kvartal

GDP

I II III IV I II

dummy varijabla konstruira regresijske pravce
da izgledaju ravno omogucuje im TREND varijabla

Y=20+5S
2
+7S
3
-4S
4

I 20
II 25 log-lin
III 27
IV 16

lnY=2+0,5S
2
+0,7S
3
-0,4S
4

50% veca u odnosu na I. kvartal

Y=
0
+
1
X+
2
S
2
+
3
S
3
+
4
S
4
+
5
T

pokazuje realnu vezu izmedu varijabli X i Y neovisno od sezone i trenda

Tecaj kune=
0
+
1
S
2
+
2
S
3
+.+
11
S
12
mjesecno
(t) (t)

Gledamo t vrijednosti ako su velike, pekulacija ima smisla, a ako je t oko 0, to nije sigurno

-----------------------------------------------------------------------------------------------------------------
28
Y
0 X X*
prodaja
p
r
o
v
i
z
i
j
a

0 100
Tecaj
II. mjesec 7,4 7,4 kn za 1
VII. mjesec 7,0 7 kn za 1 kupiti u VII. mjesecu da bi prodali u II. mjesecu

ako su visoke t vrijednosti, postoji velika vjerojatnost
da ce se to dogoditi
Postoji li sezona? Izbacimo sezonske dummy (
2
UR
) i napravimo novu regresiju nakon cega
radimo F test.

PIECEWISE REGRESIJA

Pratimo regresijski pravac do
neke vrijednosti nakon cega
mijenjamo nagib

granicna
vrijednost

Y=
0
+
1
X
1
+
2
X
2
+
3
D+
4
X
2
D

1, X
2
>X*
D=
0, X
2
<X*

Y=
0
+
1
X
1
+
2
X
2

Y=(
0
+
3
)+
1
X
1
+(
2
+
4
)X
2

-----------------------------------------------------------------------------------------------------------------
29

Primjer:

D=0 Y=
0
+
1
X
1
+
2
X
2
D=1 Y=
0
+
1
X
1
+
2
X
2
+
3
+
4
X
2
=(
0
+
3
)+
1
X
1
+(
2
+
4
)X
2

AUTOKORELACIJA

Autokorelacija odstupanja (reziduala)

veza izmedu reziduala u vremenu t i reziduala u t-1

e
t
=
1 t
e +u
t
autokorelacija I. reda

Imamo dvije serije gledamo njihovu korelaciju

Ako postoji korelacija
t
e X Y + + =
1 0

f( e
t-1
)

Y X
1
X
2
D DX
2
30 20 90 0 0
25 25 110 1 110
70 30 60 0 0
60 30 150 1 150
90 25 140 1 140
Y
Y

e
t
e
t-1
30 28 2 -
25 32 -7 2
40 36 4 -7
4
-----------------------------------------------------------------------------------------------------------------
30
e
t-1
e
t
t

e
t
t

e
t
e
j
+
e
i
+
e
j
-
e
i
-
e
j
+
e
i
+ e
i
-
e
j
-
Naruena je pretpostavka o autokorelaciji
12
- -
- -
+ +
- -

kad je pozitivna je pozitivna
kada u jednom trenutku prede u
negativni kvadrant zadrava se u
negativnom kvadrantu

pozitivna autokorelacija mijenjanje predznakanegativna
autokorelacija

nema vidljivog uzorka u ponaanju

poz. autok.

neg. autok.
nema autokorelacije

12
Pretpostavka o autokorelaciji jest da nema autokorelacije
-----------------------------------------------------------------------------------------------------------------
31
1 2 3 t
e
t
1000

500
250

asimptotsko kretanje prema
osi X
1 2 t
eksplozivan trend (proces)
reziduali nemaju
eksplozivnih karakteristika
pa pretpostavljamo da
<1
1 2 3 t

PRETPOSTAVKA O AUTOKORELACIJI

e
t
=
1 et
+u
t

=0.5
e
0
=1000 pocetni uvjet
e
1
= e
0
+u= 0.51000+0= 500
e
2
=0.5500+0= 250
e
3
=0.5250= 125

=2
e
0
=1000

Da je =1

= -0.5
e
0
=1000
e
1
=-0.51000= -500
e
2
=-0.5(-500)= 250
e
3
=-0.5250= -125

e
t

2000

1000

e
t

1000

e
t
1000

500
250

-500

-1000

oscilacijski tip
-----------------------------------------------------------------------------------------------------------------
32
0 X
Y
0

-1 < < 1 stabilni procesi (ako ne elimo eksplozivne procese)

negativna pozitivna
autokorelacija autokorelacija

Zbog cega je prisutna autokorelacija? (UZROCI autokorelacije)

1. zbog zanemarene varijable

Y=
0
+
1
X
1
+
2
X
2
+e pravi proces
Y=
0
+
1
X
1
+ e* izvedeno (mi napravili)

e*=
2
X
2
+e u reziduale otili reziduali iz prvog modela s varijablom X
2
koja ima,
ako je vremenski niz, veliku vjerojatnost da je autokorelirana

povezano e i e* ako postoji kod X
2
vremenski uzorak (tada postoji i vremenski
uzorak u rezidualima)
postoji autokorelacija

2. zbog krive funkcionalne forme

Y=0+1X e-iovi

pozitivna autokorelacija

Ako napravimo pravu funkcionalnu formu, rezidualni nece imati prepoznatljiv uzorak.

Posljedice autokorelacije:

1. Cista autokorelacija nema pristranost ocjenjivaca nepristranost

ocekivani (populacije)= procijenjeni (uzorak)

E [] =

Nema velike razlike izmedu i

-----------------------------------------------------------------------------------------------------------------
33
2. Autokorelacija povecava varijancu ocjenjivaca

stvarna varijanca ocjenjivaca

zbog pristranosti autokorelacije, Var je veca

3. OLS metoda ce podcijeniti varijancu precijenjene t vrijednosti

OLS ce izvesti stvarnu varijancu
var s aotokorelacijom se nece vidjeti
standardna devijacija ce biti manja

Y=
0
+ 10X + e e-iovi su autokorelirani pa to prebacuju na X
se (5) podcijenjena
t (2)

Otkrijemo da ima autokorelaciju
Var je znacajna za model

Y=
0
+ 10 X ocistili smo od autokorelacije
se (5) Var X je neznacajna za model
t (1)

Kad ocistimo, brojke u oba modela bi trebale biti slicne
t vrijednosti bi, nakon cicenja, trebale biti nie

Testiranje autokorelacije

DURBIN-WATSON TEST DW

1. Prikladan je kada regresija ima kontantni clan Y=
1
X
1
+
2
X
2

2. Prikladan je kada imamo autokorelaciju I. reda e=
et-1

3. Prikladan je kada model ne ukljucuje lagiranu zavisnu varijablu Y
t-1

Y
t
=
0
+
1
Y
t-1
+
2
X
2
+.

lagirana zavisna varijabla

DW=
=
=
T
i
t
T
i
t t
e
e e
1
2
2
2
1
) (

-----------------------------------------------------------------------------------------------------------------
34

obje sume su slicne-razlikuju se u prvom clanu

rijec je o vremenskim varijablama; T je krajnje vrijeme

CISTA POZITIVNA AUTOKORELACIJA

=1 e
t
=e
t-1

e
t-1
=e
t

DW=

2
2
) (
t
t t
e
e e
0

CISTA NEGATIVNA AUTOKORELACIJA

=-1 e
t
= -e
t-1

e
t +
e
t-1
=2e
t

DW= 4 4
4 ) 2 (
2
2
2
2
2
2
=
t
t
t
t
t
t
e
e
e
e
e
e

NEMA AUTOKORELACIJE
PRETPOSTAVKA Cov=0 (ako nema autokorelacije)

DW= 2
2 2 ) 2 (
2
2
2
2
1
2
2
2
1 1
2
2
1 1

+
=
+
=
+

t
t
t
t t
t
t t t t
t
t t t t
e
e
e
e e
e
e e e e
e
e e e e

Distribucija:
e
t
e
t-1
e
t
-e
t-1
1 20 - -
2 -15 20
3 30 -15
__
=
T
i 2

-----------------------------------------------------------------------------------------------------------------
35
0 d
L
d
U
2 4-d
U
4-d
L
4

moramo imati granicne vrijednosti

NEMA ZAKLJUCKA NEMA A. NEMA ZAKLJUCKA

POZITIVNA A. NEGATIVNA A.

LOWER UPPER

broj opservacija
n k`=1
d
L
d
U

6
7
..
..
10 0.6 1.00

k`=k-1 Y=
0
+
1
X
1
k=2 k`=1
k broj varijabli

ako dobijemo autokorelaciju, gledamo razlog
loe specificirani model ili zanemarena varijabla
ako ne znamo razlog, radimo tehnicki zahvat (GLS)

Rjeavanje autokorelacije :

GLS generalizirana metoda najmanjih kvadrata

Y=
0
+
1
X
1
.+ (e
t
-
et-1
)

u
t

e
t
=
et-1
+ u
t
u
t
=e
t
-
et-1
ORCUTT-COHRANE

-----------------------------------------------------------------------------------------------------------------
36
0 Z
i
Y
t
=
0
+
1
X
1t
+
2
X
2t
+..+
n
X
nt
+e
t
/
Y
t
=
0
+
1
X
1t
+
2
X
2t
+..+
n
X
nt
+ e
t
pomaknemo jednadbu razdoblje unazad
Y
t-1
=
0
+
1
X
1t-1
+
2
X
2t-1
+..+
n
X
nt-1
+ e
t-1

ODUZMEMO TRECU OD PRVE JEDNADBE

(Y
t
- Y
t-1
)= (
0
-
0
)+
1
(X
1t
- X
1t-1
)+
2
(X
2t
- X
2t-1
)+.+
n
(X
nt
- X
nt-1
)+( e
t
- e
t-1
)

X
1
KO X
2
KO u
t
nezavisna
varijabla

e
t
=
et-1
+ u
t
dobijemo pa ce biti koeficijent regresije I. nacin dobivanja
2
1
DW
= ako imamo DW II. nacin dobivanja

1
ce ostati isti, kao i
2
i
3
.. koeficijenti
Razlika ce biti u
0

0
*=
0
-
0

0
*=
0
(1- )

0
=
1
*
0
moemo vratiti
0
iz pocetnog modela

Ocekujemo manje t vrijednosti i
2
pa moda vidimo da i varijbla za koju smo smatrali da
je bitna za model i nije ba bitna.

HETEROSKEDASTICNOST

HOMOSKEDASTICNOST
varijanca za razlicite Z
i
-ove
je jednaka

-----------------------------------------------------------------------------------------------------------------
37
0 Z
i
Var(e
i
)=
2

Z
i
proporcionalni faktor

HETEROSKEDASTICNOST kada se poveca neki X, poveca se i varijanca; postoji veza
izmedu varijance modela i nezavisne varijable

varijance se povecavaju
razlicite su za svaku generaciju

Var(e
i
)=
2
i

heteroskedasticnost se cesto pojavljuje u cross-sectionu (npr. razlicite zemlje, dohodak,)

Moe se javiti ako:

1. zaboravimo neku varijablu koja je vana

UVOZ=f (GDP, PR)

PR=
w
d
P
P
P
d
domace P
w
strano

npr. uvoz=
0
+
2
PR+e
j
*

e
j
*=e
j
+
1
GDP

ako je PR , uvoz
ako GDP , uvoz

2. ako nam je funkcionalna formula kriva rijetko

Posljedice:

1. E (
)= nema prostranosti koeficijenata

2. heteroskedasticnost povecava varijancu e
i
-ova
3. potcjenjuje t i F statistiku

-----------------------------------------------------------------------------------------------------------------
38

Testiranje:

1. PARK test moe se otkriti izgled varijance s obzirom na proporcionalan faktor
postupak:

a) regresija
Y=
0
+
1
X
1
+
2
X
2
+.+
n
X
n
+e

Z
j
neku od nezavisnih varijabli (X
1
, X
2
,) mi moramo otkriti (unaprijed odrediti) koja
je

b) ln (e
i
2
) logaritmiramo kvadrate reziduala

varijanca
ln(e
i
2
)=
0
+
1
ln Z
i
navedeni postupak radimo za svaki X (nezavisnu varijablu) nakon cega usporedujemo t
vrijednosti (testiramo znacajnost pomocu t testa) onaj koji ima najvecu t vrijednost je
proporcionalni faktor

2. Goldfeld-Quandt test
postupak:

I. poredati varijable (opaanja) po velicini proporcionalnog faktora

npr. shvatili smo da je
Y proporcionalan faktor

II. cijeli niz se dijeli na tri trecine (izbacimo 1/3 sredinjih podataka)
radimo regresiju za prvu trecinu i trecu trecinu i racunamo njihove RSS-
ove
13
(RSS
1
i RSS
3
)

13
regresijske sume kvadrata
C Y X
1
Ante 1400 1500 35
Mira 9800 10000 36
Marko 4500 5000 40
Ive 999 1000 55
C Y X
1
Ive 999 1000 55
Ante 1400 1500 35
Marko 4500 5000 40
Mira 9800 10000 36
-----------------------------------------------------------------------------------------------------------------
39
III. GQ=
1
3
RSS
RSS
racunamo GQ koeficijent

Ako je GQ=1 nema heteroskedasticnosti
Ako je GQ>1 velika heteroskedasticnost

IV. F( K, N``-K-1) N`` broj N-ova u jednoj trecini

Ako je GQ > F onda nemamo homoskedasticnosti (postoji
heteroskedasticnost)

H
0
: postoji homoskedasticnost (nul hipoteza kod ovog testa)

Kako se rijeiti heteroskedasticnosti?

1. vidjeti jesmo li ispustili neku varijablu redefiniranje varijabli
2. napraviti WLS
14
vagana sredina najmanjih kvadrata
najcece za necistu heteroskedasticnost

o Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
+e
Z
e

npr. Z=X
2
sve dijelimo sa Z-om (u ovom slucaju primjer Z-a je X
2
)

o
2 2
3
3
2
2
2
2
1
1
2
0
2
1
X
e
X
X
X
X
X
X
X
Y
+ + + + =

npr. dobijemo YKO=0.6+2.5
2
1
X
+0.5
2
1
X
X
+7
2
3
X
X

2

0

MULTIKOLINEARNOST

veza izmedu nezavisnih varijabli

Y= f ( X
1
, X
2
, , X
n
)
X
1
= g (X
2
, X
3
,., X
n
)

14
Weighted Least Square
-----------------------------------------------------------------------------------------------------------------
40
X
2
= z (X
1
, X
3
, X
4
,, X
n
)

moguca je pocetnicka greka radi multikolinearnosti

Y= f (i, H*) Y je funkcija nominalnog kamatnjaka i inflacije

i vec sadrava H i= r + H nominalni kamatnjak = realni kamatnjak + inflacija

slijedeca greka DOMINANTNA VARIJABLA!

pr. proizvodnja obuce= f (L, K, kolicina koe koja se troi)

kolicina koe koja se troi linearno vezana sa Q
deterministicka veza usko vezana sa proizvodnjom

Q=
0
+0.5L+0.3K+0.9X
2
1 velik jer je X usko vezana s Q
t (200)

dominantna varijabla bi zasjenila druge nezavisne varijable
dominantnu varijablu izbacimo iz modela

Posljedice multikolinearnosti:

1. procjenitelji ce biti nepristrani
2. standardne greke koeficijenata ce viti velike
3. imati cemo male t vrijednosti podcjenjuje t vrijednosti
4. osjetljive na promjenu specifikacije i na promjenu nezavisnih varijabli u modelu

Q=
0
+0.5L+0.3K imamo multikolinearnost
Q=
0
+0.5L+0.3K+X ubacimo X
ako koeficijenti ostaju isti robusni na promjene
ako se koeficijenti promijene nisu robusni

Dvije promjene ubacivanje/izbacivanje varijable
specifikacija modela

5.
2
i F ce biti nepromijenjeni
6. nece utjecati na procjenu nemultikolineiranih varijabli

Otkrivanje multikolinearnosti:

1. Y=
0
+
1
X
1
+
2
X
2
+
3
X
3
2
=0.98 veliki
2
, male t vrijednosti
(0.6) (1.2) (0.8)

-98 % varijance nezavisne varijable smo objasnili modelom
-ni jedna varijabla nije znacajna
-postoji multikolinernost
-----------------------------------------------------------------------------------------------------------------
41
-neke nezavisne varijable su povezane

2. Koeficijenti korelacije izmedu nezavisnih varijabli

r
1
(X
1
, X
2
)
r
2
(X
2
, X
3
) Problem se javlja jer koeficijenti korelacije pokazuju vezu samo
r
3
(X
1
, X
3
) izmedu dvije varijable

| r | > 0.8

3. Ako postoji multikolinearnost izmedu vie varijabli

VIF
15
test otkriva skrivene veze medu varijablama; radimo regresiju izmedu nezavisnih
varijabli
-ako sumnjamo na kolinearnost, radimo druge regresije

2
1
= VIF1 X
1
=
0
+
1
X
2
+
2
X
3

2
2
=VIF2 X
2
=
0
+
1
X
1
+
2
X
3

2
3
=VIF3 X
3
=
0
+
1
X
1
+
2
X
2

koeficijent determinacije
2

ce pokazati vezu
-moe li se X
1
izraziti kao linearna kombinacija izmedu X
2
i X
3
varijable

VIF=
2
1
1

2
je 0 nema nikakve veze VIF=1

2
je 1 sve smo objasnili VIF=
VIF>1

Neki softveri, umjesto VIF vrijednosti TOLERANCIJA = (1-
2
)

Ako ukljucujemo vie varijabli, shodno tome raste i
2

X
1
=
0
+
1
X
2
+
2
X
3
+.

VIF>5 Prihvacamo hipotezu o multikolinearnosti za mali broj nezavisnih varijabli
(10-tak)

VIF>10 Za vie od 10 varijabli

Kako se rijeiti multikolinearnosti? to uciniti?

1. Nita
Y=
0
+
1
X
1
+
2
X
2

2
=0.8
(2.1) (2.2)

15
Variance Inflatory Factor
-----------------------------------------------------------------------------------------------------------------
42
-nademo multikolinearnost
-ne stvara pristranost-ne remeti koeficijente
-t vrijednosti oko 2 visoke

2. Y=
0
+
1
X
1
+
2
X
2
+
3
X
3

2
=0.8
(2.1) (0.7) (0.8)

-multikolinearnost izmedu X
2
i X
3

Izbaciti iz modela jednu (ili vie) od multikolineiranih varijabli! (koja nije znacajna) to
utjece na pristranost koeficijenata

npr. C=
0
+0.8Y
D
+0.6S-0.01T
2
=0.9
(0.6) (0.9) (-2.5)

Samo porezi uzrokuju potronju?!
Nademo vezu izmedu Y
D
i S
Koju izbaciti? t vrijednosti su poremecene radi multikolinearnosti
znanje iz ekonomske teorije Y
D
ostaje u modelu

C=
0
+0.75Y
D
-0.01T kad izbacimo S
(7) (-2.5)

3. Transformacija nezavisnih varijabli

Y= f (i, H)

r= i

H

Y= f(r) gubimo neke informacije, ali nema multikolinearnosti

Y=
0
+
1
X
1
+
2
X
2
velika multikolineiranost izmedu X
1
i X
2

ne smijemo izbaciti pa definiramo X
3
kao linearnu kombinaciju
izmedu dvije varijable

X
3
=X
1
+X
2
Y=
0
+
1
X
3

pr. X
3
= GDP+H= 3,200,000+0,08=3,200,000.08
=3,200,000+

0,15=3,200,000.15
=3,400,000+0,15=3,400,000.15

Promjena inflacije ne mijenja nita, dok promjena GDP-a itekako mijenja
velicine nisu ravnomjerne
Moramo ih prikazati ravnomjerno
H pomnoiti s 1,000,000 npr.

Y=
0
+0.8X
3
ne moemo izdvojiti zasebne efekte
gubimo informacije
linearna kombinacija
X
1
i X
2
-----------------------------------------------------------------------------------------------------------------
43

RESET TEST

-teko je izabrati nezavisne varijable, pogotovo ako prije nije bilo nikakvih istraivanja
-imamo dvije vrste mogucnosti:

1. da smo iskljucili varijablu koja je bitna
2. da smo ukljucili varijablu koja nije bitna

Ad 1. Iskljucenje bitne varijable

npr. Y=
0
+
1
X
1
+
2
X
2
+e
Y=
0
+
2
X
2
+e*

E [
2
]=
2
+
1
f (r
1,2
) o tome ovisi hoce li
2
biti veci ili manji

e*= e+
1
X
1

-stvara se pristranost koeficijenta

E [
2
]
2

1
f (r
1,2
)
2
>
2
+ +
- +
2
<
2

+ -
2
<
2

- -
2
>
2

-pristranosti nema kada je
1
=0 (varijabla X
1
nije znacajna) ili kada ne postoji korelacija
izmedu X
1
i X
2
( f(r
1,2
)=0 )
-kako ispraviti taj problem? Ukljuciti varijablu koja nedostaje (teko ju je otkriti)
-pristranost moe biti mala, pa onda prihvacamo model kakav jest
-pocetnici ce cesto ukljucivati sve varijable

Ad 2. Ukljucivanje nebitne varijable

Y=
0
+
1
X
1
+e
Y=
0
+
1
X
1
+
2
X
2
+e*
e*=e-
2
X
2

-ubacivanje nevanih varijabli nece stvarati pristranost
-----------------------------------------------------------------------------------------------------------------
44

Posljedice povecati ce se varijanca ostalih varijabli, smanjiti ce se njihove vrijednosti,
smanjiti ce se
2
korigirani

Pravi odabir:

1. teorija
2. gledati t testove-jesu li varijable znacajne
3. gledati
2
korigirani-je li sveukupna kvaliteta regresije u redu
4. imamo li pristranost u koeficijentima ili mijenjaju li se bitno koeficijenti varijable
kada ukljucujemo ili iskljucujemo neke od njih

Primjer:

Potranja za brazilskom kavom D
BC

D
BC
= f (P
BC,
P
t,
Y
D
)

P
BC
cijena brazilske kave -
P
t
cijena caja +
Y
D
dohodak +

D
BC
= 8.1+7.8 P
BC
+2.4 P
t
+0.0035 Y
D
(0.5) (2.0) (3.5)

2
=0.6

-cijena brazilske kave nema nikakav utjecaj na potronju kave
-izbacujemo varijablu cijena brazilske kave

D
BC
= 9.3 +2.6 P
t
+0.0036 Y
D
2
=0.61
(2.6) (4.0)

-moguce je da je elasticnost za kavom mala ili nikakva u odnosu na cijenu kave
-ukljucujemo i cijenu kolumbijske kave

D
BC
= f (P
BC,
P
t,
Y
D,
P
CC
)

P
BC
cijena brazilske kave -
P
t
cijena caja +
Y
D
dohodak +
P
CC
cijena kolumbijske kave +

D
BC
= 10.0+8.6P
CC
-5.6 P
BC
+2.6 P
t
+0.0030 Y
D
(2.0) (-2.8) (2.0) (3.0)

2
=0.65
-----------------------------------------------------------------------------------------------------------------
45

-cijena kolumbijske kave utjece na potranju za brazilskom kavom
-teorija je zadovoljena,
2
se povecao, predznaci su ocekivani (pristranost), t vrijednosti su
znacajne

2
je precjenjivao stvarni
2

-moramo se vie oslanjati na ekonomsku teoriju nego na statisticku znacajnost
-nacin na koji se to radi TRAENJE SPECIFIKACIJE:

1. DATA MINING
neeticna metoda, oslanja se na velik broj regresija s velikim brojem varijabli, lagova,
razlicite funkcionalne forme

2. STEP WISE REGRESIJA
temelji se na tome da npr. uzmemo 6 varijabli s kojima se ucine sve moguce
kombinacije

Y= f (X
1
)
Y= f (X
1
, X
2
)
Y= f (X
2
)
Y= f (X
2
, X
3
)
Y= f (X
1
, X
2
, X
3
, X
4
)

-gleda koja kombinacija daje najveci
2

Y= f (X
1
, X
2
, X
3
,., X
n
) maksimalan
2

3. SEKVENCIJALNO TRAENJE SPECIFIKACIJE
istraivaci tee definiranju pocetne jednadbe, ubacuju ili izbacuju varijablejednu po
jednu i gledaju to ce se dogoditi
sa to manje varijabli objasniti neki model

REMSEY TEST

njime testiramo funkcionalnu formu modela
temelji se na tome da uzima vrijednosti koje bi trebalo procijeniti kakve bi nae vrijednosti
trebale biti
4 3 2
Y Y Y

-----------------------------------------------------------------------------------------------------------------
46
Izvodenje testa:

1. napravimo regresiju

e X X Y + + + =
2 2 1 1 0

dobivamo procijenjenu vrijednost Y

2.
4 3 2
Y Y Y potenciramo Y

3. e Y Y Y X X Y + + + + + + =
4
5
3
4
2
3 2 2 1 1 0

u
4 3 2
Y Y Y ule su sve greke

H
0
=
3
=
4
=
5
=0 da bi model bio znacajan

testiramo pomocu F testa

Cilj je dokazati da su
3
,
4
,
5
jednake 0

Ekonometrija

Uploaded by

Copyright:

Available Formats

You might also like

Ekonometrija

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Ekonometrija

Uploaded by

Copyright:

Available Formats

Sanja Blaevic, Ekonometrija

procijenjena vrijednost Y-a

0 ...... .......... ..........

)=0.7 npr. uzeli smo prvih 20 uzoraka

varijanca populacijskog modela (rasprenost)

Ako je veci od 2 je znacajan.

)= nema prostranosti koeficijenata

Y Y Y ule su sve greke

You might also like