You are on page 1of 67

Panel modeli

Panel modeli – prednosti


 Omogućuju da kontroliramo za
 varijable koje nisu mjerljive (kulturološki faktori,
razlike u razvijenosti kompanija, privredni ciklusi...
 varijable koje su vremenski promjenjive (po t), ali
se ne mijenjaju između grupa/zemalja (po i), npr.
nacionalne politike, federalni zakoni, međunarodni
sporazumi...
 Kod panel analize moguće je dodavati varijable u
različitim koracima analize (studenti, škole, države)
→ pogodno za hijerarhijsko modeliranje
(multilevel....promjenjivost parametara na više
razina)
Panel modeli - nedostaci

 Problem prikupljanja podataka (sampling design)

 nepotpuni podaci
 nepotpun obuhvat jedinica (undercoverage) ili
 neodgovorima (nonresponse) kod mikro panela

 Zavisnost između grupa (zemalja) kod makro panela


(veliko T), tj. korelacija ozmeđu zemalja
Panel model
 Panel podaci sadrže informacije o N prostornih
jedinica tijekom T vremenskih perioda

yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T


 ai – unobserved heterogeneity,vremenski
invarijantni, fiksni efekti (omitted variable bias????)
 Xi,t – skup opservabilnih, vremenski promjenjivih
nezavisnih varijabli
 Wi – skup opservabilnih, vremenski invarijantnih
nezavisnih varijabli
 gt – vremenski fiksni efekti (business cycle,.., utječu
na sve prostorne jedinice uniformno)
Panel model
 Cilj panel analize je odrediti konzistentan i efikasan
procjenitelj parcijalnog efekta

 
  E yi ,t X i ,t / X i ,t

 Da li je to moguće?
 Ovisi o pretpostavkama
Panel model
Pretpostavke:
 Striktna egzogenost (strict exogeneity) nezavisnih
varijabli

 
E ei ,t X i ,1 , X i , 2 ,  Eui X   0
 greške relacije u trenutku t, nekorelirane su s
nezavisnim varijablama u svakom trenutku (prošlim,
sadašnjim i budućim)
Panel model
Pretpostavke:
 Nezavisnost

 
E a i X i ,1 , X i , 2 ,  a

 Ili alternativno (općenitije)

 
E a i X i ,1 , X i , 2 ,  hX i ,1 , X i , 2 ,
 Potrebne dodatne pretpostavke na funkciju h
Panel model

yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 ai – unobserved heterogeneity, individual effect,


individual heterogeneity
 ui,t – idiosyncratic errors, mijenja se obzirom na i i t

Ideja:
 ai – nije opservabilna, može uzrokovati pristranost
procjenitelja (omitted variable bias)
 Kako kontrolirati efekte od ai
 Tri pristupa: FE, RE i FD
Panel model
 Pristranost (bias of ommited variables)

y  X 1 1  X 2  2  u " stvaran" model


y  X 1 1  e procijenjen model

 ˆ1 pristran jer X2 nije uključena


 Pristranost: bias = 2·g (2 parametar uz X2kada bi
bila uključena)
 g OLS procjena regresiranja X2 (zavisna) na X1
(nezavisna)
Panel model
 Primjer:

 bias = 2·g (X2=Educ, 2 =0,03)


 g OLS procjena regresiranja X2 na X1
Primjer 1: Nastavak školovanja
 Cornwell and Rupert Data ("Efficient Estimation with
Panel Data: An Empirical Comparison of Instrumental
Variable Estimators," Journal of Applied
Econometrics, 3, 1988, pp. 149-155.)
 Data Source: Panel Study of Income Dynamics
 Data File: “cornwell&rupert.dta”

 595 individua, 7 godina


Primjer 1: Nastavak školovanja
 Varijable (Cornwell and Rupert Data)

LWAGE = log of wage


EXP = work experience
WKS = weeks worked
OCC = occupation, 1 if blue collar,
IND = 1 if manufacturing industry
SOUTH = 1 if resides in south
SMSA = 1 if resides in a city (SMSA)
MS = 1 if married
FEM = 1 if female
UNION = 1 if wage set by union contract
ED = years of education
BLK = 1 if individual is black
Primjer 1: Nastavak školovanja
 Varijable (Cornwell and Rupert Data)

 Pretpostavimo da ai reflektira

 Združeni model (pooled OLS): ai se briše


(najrestriktivniji)
Primjer 1: Nastavak školovanja
 FE (fixed effect) procjenitelj:
 ai se “kontrolira”

 OLS procjena je 0,244 je precjenjena

 Oba 2 i g su pozitivni
FE model (Fixed Effects)

yi ,t  a i  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 ai – nepoznate konstante za svaku grupu (n entity-


specific intercepts)
 yi,t – zavisna varijabla
 Xi,t – skup nezavisnih varijabli (time varying)
 ui,t – greške relacije

 ai – su korelirane s uključenim nezavisnim


varijablama
 
E a i X i ,1 , X i , 2 ,  hX i ,1 , X i , 2 ,
FE model (Fixed Effects)

yi ,t  a i  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T (eq.1)


 Promjene u y su rezultat utjecaja koje nisu samo
fiksne karakteristike (spol, nacionalnost,...
 FE nije dobar model ako su:
 varijacije unutar grupa (within-cluster variation)
male ili
 ako se varijable sporo mijenjaju tijekom vremena

Interpretacija parametara:
“.....za danu zemlju (grupu, units), ako se X poveća za
jednu jedinicu, y se (u prosjeku) mijenja za β
jedinica”
FE model (Fixed Effects)
 Analogno, FE model se može definirati koristeći
dummy varijable:
yi ,t   0  X i ,t   Wi 
 g 2 E 2  g 3 E3    g N E N  u i , t (eq.2)
 Ei – entity i (konstanta, N-1 dummy varijabli)
 gi – parametar uz i-tu dummy varijablu
 (eq.1) i (eq.2) ekvivalentne
 ai iz (eq.1) i dummy varijable Ei iz (eq.2) imaju isti
izvor – nemjerljivu varijablu Zi, koja varira po i
(unutar grupa, zemalja) ali ne po t (ne tijekom
vremena)
FE model (Fixed Effects)
 (eq.2) se može proširiti uključivanjem i “vremenskih”
dummy varijabli
 time and entity fixed effects regression model
yi ,t   0  X i ,t   Wi  g 2 E2  g 3 E3    g N E N 
  2T2   3T3     T TT  ui ,t (eq.3)

 (N-1) Ei dummy varijabli, (T-1) Ti dummy varijabli


 uključi Ti (kontroliraj za vremenski fiksne efekte) ako
postoji sumnja za neočekivane varijacije ili posebne
događaje koji mogu utjecati na zavisnu varijablu
FE model (Fixed Effects)

 LSDV model (least square dummy variable)


 Dodavanjem dummy varijable za svaku zemlju,
procjenjujemo stvarni efekt nezavisnih varijabli na
zavisnu varijablu (kontroliramo unobserved
heterogenost)
 Svaka dummy varijabla Ei “apsorbira” efekt koji je
specifičan za svaku zemlju i
FE procjenitelj (Fixed Effects)
 FE =LSDV=WI procjenitelji → identični

 LSDV (least squares dummy variables)


: uključi N-1 dummy varijable za prostorne
(cross-section) jedinice

 WI (within transformation) koristi vremenske


prosjeke...po t (time means) za svaki i.
FE procjenitelj (Fixed Effects)
1) Za svaku grupu (units) izračunaj prosjek po t
T
1 T
1
yi ,.   yi ,t X i ,.   X i ,t
t 1 T t 1 T

2) Izračunaj time-demeaned data:

3) Procijeni regresijski model (time-demeaned data):

y  X  u
*
it
*
it
*
it
*
Greške relacije u su proces bijelog šuma
i ,t

→ FE procjenitelj je nepristran.
FE procjenitelj (Fixed Effects)
Združeni (pooled OLS) .vs. FE model

H0: svi koeficijenti uz dummy varijable su jednaki 0


→ Skupni F-test

use cornwell&rupert, clear


xtset person period

global ind1 exp exp2 wks occ ind south smsa ms union
global ind2 ed blk fem

* Pooled OLS
regress $ind1 $ind2, robust

** FIXED Effects, LSDV


xtreg $ind1 $ind2, fe

session 2.do
Pooled OLS .vs. FE model
Pooled OLS .vs. FE model

Nedostatak FE modela
 Vremenski invarijantne varijable ne mogu biti
nezavisne varijable
 Vremenski nepromjenjive karakteristike svake
individue su “perfekno” korelirane s dummy
varijablama individue (person or entity dummies)
 FE modeli koriste se za analizu uzroka promjena
unutar individue (within a person or entity)
FE model .vs. LSDV model
FE model - xtreg
FE model

 FE model “kontrolira” za sve vremenski invarijantne


razlike između grupa (zemalja, individua), pa FE
procjene nisu pristrane zbog izostavljanja vremenski
invarijantnih varijabli (religija, spol....
 Ne mogu se koristiti za analizu vremenski
invarijantnih uzroka zavisne varijable
 Postoji perfektna kolinearnost između vremenski
invarijantnih karakteristika i dummy varijabli (grupe)
FE model
 FE modeli koriste se za analizu uzroka promjena
unutar grupa
 Vremenski invarijantne karakteristike ne uzrokuju
takve promjene budući su konstante unutar grupe
(za svaku individu)

Kohler, Ulrich, Frauke Kreuter, Data Analysis Using


Stata, 2nd ed., p.245
RE model (Random Effects)

 Za razliku od FE modela, pretpostavlja se da su


varijacije između grupa (units) slučajne i
nekorelirane s nezavisim varijablama modela

 “.....ključna razlika između FE i RE modela je u tome


uključuju li nemjerljivi pojedinačni efekti elemente
koji su korelirani s regresorima ili ne, a ne jesu li
ti efekti slučajni ili ne.” [Green, 2008, p.183]
 Ako imamo razloga za pretpostaviti da razlike između
grupa imaju određeni utjecaj na zavisnu varijablu
potrebno je koristiti RE model
RE model (Random Effects)

Prednost RE modela:

 Moguće je analizirati vremenski invarijantne varijable

 U FE modelima one su uključene u konstantan član


RE model (Random Effects)

Član ai postaje “dio” greške relacije

yi ,t  c  X i ,t   Wi  i ,t i ,t  a i  ei ,t (eq.4)
a i  a  ui
 ui – between-entity error (između grupa)
 ei,t – within-entity error (unutar grupa)
 Dodatne pretopstavke

α ~α, σ ,
i
2
u
ei,t ~0, σ 
2
e
RE model (Random Effects)

Pretpostavke: striktna egzogenost(strict exogeneity)


yi ,t  X i ,t   a  ui   ei ,t

   
E ei ,t X i ,1 , X i , 2 ,  E ui X i ,1 , X i , 2 ,  0
 
E ei ,t X i ,1 , X i , 2 ,   e
2 2

 
E ui2 X i ,1 , X i , 2 ,   u2
 
E ei ,t u j X i ,1 , X i , 2 ,  0 za sve i,t,j
 
E ei ,t e j , s X i ,1 , X i , 2 ,  0 za t  s ili i  j
 
E ui u j X i ,1 , X i , 2 ,  0 za i  j
RE model (Random Effects)

yi ,t  c  X i ,t   Wi  i ,t i ,t  a i  ei ,t (eq.4)
 Procjenjuje se GLS metodom
 Može se pokazati da se GLS RE procjenitelj može
dobiti (quasi-demeaning) transformacijom

 l=1 → FE  u2  , a i velika varijanca


 l=0 → OLS  u2  0, nema a i
RE model (Random Effects)

 RE model pretpostavlja da regresori nisu korelirani s


ai (unobserved heterogeneity); tj. da je
Cov(Xi,t,ai)=0 (teško zadovoljiti)

 RE model omogućuje generalizaciju na populaciju


(uzorak → populacija)
RE model (Random Effects)
RE .vs. OLS i RE .vs. FE

 RE ili OLS procjenitelj → LM test

H0 : σ  0
2
u (nema a i  l  0)
 Potreban uvijet Cov(Xi,t,ai)=0 (teško zadovoljiti)

 RE ili FE procjenitelj →Hausman test

H0: Efikasniji RE procjenitelj je nepristran


Cov(Xi,t,ai)=0 je ispunjeno

 Ako se H0 ne može odbaciti → RE procjenitelj


RE .vs. OLS

Prob<0,05 → H0 se odbacuje (20 =0), RE a ne OLS


RE .vs. FE

Prob<0,05 → H0 se odbacuje (Cov(Xi,t,ai)=0 ), FE a ne RE


RE model

Interpretacija parametara?
RE model

r = Omjer varijance grešaka ui (individual-specific error)


i varijance grešaka ei (composite, entire error)
 Pokazatelj kakvoće RE modela
RE ili FE: Hausman test

 RE ili FE procjenitelj →Hausman test (Green, 2008)


H0: Odgovarajući je RE model
H1: Odgovarajući je FE model

Jesu li ui korelirane s regresorima?


H0: Cov(Xi,t,ui)=0 (RE konzistentan)
H1: Cov(Xi,t, ui)≠0 (FE konzistentan, RE nekonzistentan)

 Procijeni FE model → spremi procjene


 Procijeni RE model → spremi procjene
 Provedi test
RE ili FE: Hausman test
xtreg y x1, fe
estimates store fixed
xtreg y x1, re
estimates store random
hausman fixed random
Hausman test

 Opći test specifikacije modela


Ideja testa
 Ako je Ho (Cov(Xi,t,ui)=0) istinita
→ OLS iz LSDV i GLS su konzisentni, no OLS nije
efikasan (RE model “bolji”)
 Ako je Cov(Xi,t,ui)≠0 i Ho se odbacuje
→ OLS je konzistentan, no GLS nije (FE model
“bolji”)

 Negativna test veličina? (→ Ho se ne odbacuje, RE)


 Mundlak-ov test (alternativa Hausman-ovom)
FD procjenitelj (First Difference)

yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T


Kao bi kontrolirali (uklonili) ai – prve diferencije

 ai →se poništava,
 Wi →se poništava,
 FD procjenitelj →uvjet Cov(DXi,t, Dui)=0
 Za T=2 → FE=FD
FD procjenitelj
Panel podaci – deskriptivna statistika

 Deklariranje panel podataka i varijabli


xtset
 Panel analiza: xt naredbe
xtdes (describe)
xtsum (summarize)
xttab (tablica, one-way tabulations )
xttrans (transition probabilities)
xtline (grafički prikazi)
 Panel regresija
xtreg
Panel podaci – deskriptivna statistika
Panel podaci – deskriptivna statistika
Panel podaci – deskriptivna statistika
Panel podaci – deskriptivna statistika
Panel podaci – dijagnostika
Cross-sectional dependence
 samo za makro panele (veliki T – Baltagi, 20-30
godina)
 problem nije prisutan u mikro panelima (nekoliko
godina i veliko N)
 Testira se zavisnost između grupa (cross-sectional
dependence/contemporaneous correlation)
 Breusch-Pagan LM test o nezavisnosti
 H0 – reziduali između grupa nisu korelirani
 STATA naredba: xttest2 (nakon xtreg, fe)

 Instaliranje naredbe → ssc install xttest2


Breusch-Pagan LM test
(Cross-sectional dependence)
Pasaran CD test
Cross-sectional dependence
 Pasaran CD test (cross-sectional dependence)
 test o korelaciji reziduala između grupa
 H0 – reziduali između grupa nisu korelirani
 STATA naredba: xtcsd

 Instaliranje naredbe → ssc install xtcsd


Pasaran CD test
Cross-sectional dependence
Test heteroskedastičnosti

 Za FE modele → xttest3
 Instaliranje naredbe → ssc install xttest3
 H0 – homoskedascity (konstantna varijanca)

 Za oba modela (FE i RE) koristi opciju robust za


heteroskedasticiy-robust standardne pogreške (zovu
se još i Huber/White ili sandwich procjenitelji)
Test o postojanju
heteroskedastičnosti

Prob<0,05 → H0 se odbacuje , heteroskedastičnost!!!


Procjenitelji panel modela

yi ,t  a i ,t  X i ,t   ui ,t i  1,...,N; t  1,...,T

Združeni (pooled) model:

yi ,t  a  X i ,t   ui ,t i  1,...,N; t  1,...,T (eq.1)

 Regresori su nekorelirani s greškama relacije,


Cov(Xi,t,ui)=0
 Ako N→∞ ili T→∞ → pooled OLS – konzistentan
 Ako je stvarni model FE model – pooled OLS procjene
nisu konzistentne (standardne pogreške procjene
parametra jako podcijenjene))
Procjenitelji panel modela

FE model:

yi ,t  a i  g t  X i ,t   ui ,t i  1,...,N; t  1,...,T (eq.2)


Analogno:
N T
yi ,t   a j E j ,it   g sTs ,it  X i ,t  i  1,...,N; t  1,...,T
j 1 s2

 pooled OLS – nekonzistentan


 Procjenitelji FE, LSDV, FD
BE procjenitelj (Between Estimator)

 Za procjenu  - pooled OLS koristi varijacije po i


(grupama) i po t (vremenu)
 BE procjnitelj u kratkim panelima – koristi samo
varijaciju između grupa
 Računaju se prosjeci po vremenu

yi  a i  X i   ui i  1,...,N (eq.3)

T
1 1 1
yi   yi ,t
T T
X i   X i ,t ui   ui ,t
t 1 T t 1 T t 1 T
BE procjenitelj (Between Estimator)
 OLS regresija na prosjecima

yi  a i  X i   ui i  1,...,N (eq.3)
Analogno (between model):

yi  a  X i   a i - a  ui  i  1,...,N
 BE je konzistentan procjenitelj ako su Xi i
 
a i - a  ui nekorelirani, tj.
 U RE modelima i u modelima s konstatnim
paremetrima
FE procjenitelj (Fixed Effects)
 FE =LSDV=WI procjenitelji → identični
 WI (within transformation) koristi vremenske
prosjeke...po t (time means) za svaki i.

y  X  u
*
it
*
it
*
it

 OLS regresija na demean-data – konzistentan


procjenitelj – zove se i FE procjenitelj
 Pooled i BE procjenitelj su nekonzistentni
FE procjenitelj (Fixed Effects)

 LSDV procjenitelj– uključuje dummy varijable


 ako N nije jako velik, jednostavniji
 zove se i FE procjenitelj
FD procjenitelj (First Differences)

 OLS regresija na prvim diferencijama


 Mjeri vezu između promjena (prve diferencije)
 Kako za pojedinu grupu, jedinična promjena u
pojedinom regresoru utječe na prosječnu promjenu u
zavisnoj varijabli
RE procjenitelj (Random Effects)

 Pooled OLS je konzistentan, ali pooled GLS je


efikasniji
 Feasible GLS procjenitelj RE modela dobiva se kao
OLS regresija quasi-demeaned data
 RE procjenitelj je efikasan za RE model
 RE procjenitelj je nekonzistentan ako je FE paravi
model

You might also like