P5-Panal Models PDF

Panel modeli
Panel modeli – prednosti

 Omogućuju da kontroliramo za
 varijable koje nisu mjerljive (kulturološki faktori,
razlike u razvijenosti kompanija, privredni ciklusi...
 varijable koje su vremenski promjenjive (po t), ali
se ne mijenjaju između grupa/zemalja (po i), npr.
nacionalne politike, federalni zakoni, međunarodni
sporazumi...
 Kod panel analize moguće je dodavati varijable u
različitim koracima analize (studenti, škole, države)
→ pogodno za hijerarhijsko modeliranje
(multilevel....promjenjivost parametara na više
razina)
Panel modeli - nedostaci
 Problem prikupljanja podataka (sampling design)
 nepotpuni podaci
 nepotpun obuhvat jedinica (undercoverage) ili
 neodgovorima (nonresponse) kod mikro panela
 Zavisnost između grupa (zemalja) kod makro panela

(veliko T), tj. korelacija ozmeđu zemalja
Panel model
 Panel podaci sadrže informacije o N prostornih
jedinica tijekom T vremenskih perioda
yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 ai – unobserved heterogeneity,vremenski
invarijantni, fiksni efekti (omitted variable bias????)
 Xi,t – skup opservabilnih, vremenski promjenjivih
nezavisnih varijabli
 Wi – skup opservabilnih, vremenski invarijantnih
nezavisnih varijabli
 gt – vremenski fiksni efekti (business cycle,.., utječu
na sve prostorne jedinice uniformno)
Panel model
 Cilj panel analize je odrediti konzistentan i efikasan
procjenitelj parcijalnog efekta
 
  E yi ,t X i ,t / X i ,t
 Da li je to moguće?
 Ovisi o pretpostavkama
Panel model
Pretpostavke:
 Striktna egzogenost (strict exogeneity) nezavisnih
varijabli
 
E ei ,t X i ,1 , X i , 2 ,  Eui X   0
 greške relacije u trenutku t, nekorelirane su s
nezavisnim varijablama u svakom trenutku (prošlim,
sadašnjim i budućim)
Panel model
Pretpostavke:
 Nezavisnost
 
E a i X i ,1 , X i , 2 ,  a
 Ili alternativno (općenitije)
 
E a i X i ,1 , X i , 2 ,  hX i ,1 , X i , 2 ,
 Potrebne dodatne pretpostavke na funkciju h
Panel model
 ai – unobserved heterogeneity, individual effect,

individual heterogeneity
 ui,t – idiosyncratic errors, mijenja se obzirom na i i t
Ideja:
 ai – nije opservabilna, može uzrokovati pristranost
procjenitelja (omitted variable bias)
 Kako kontrolirati efekte od ai
 Tri pristupa: FE, RE i FD
Panel model
 Pristranost (bias of ommited variables)
y  X 1 1  X 2  2  u " stvaran" model

y  X 1 1  e procijenjen model
 ˆ1 pristran jer X2 nije uključena

 Pristranost: bias = 2·g (2 parametar uz X2kada bi
bila uključena)
 g OLS procjena regresiranja X2 (zavisna) na X1
(nezavisna)
Panel model
 Primjer:
 bias = 2·g (X2=Educ, 2 =0,03)

 g OLS procjena regresiranja X2 na X1
Primjer 1: Nastavak školovanja
 Cornwell and Rupert Data ("Efficient Estimation with
Panel Data: An Empirical Comparison of Instrumental
Variable Estimators," Journal of Applied
Econometrics, 3, 1988, pp. 149-155.)
 Data Source: Panel Study of Income Dynamics
 Data File: “cornwell&rupert.dta”
 595 individua, 7 godina

 Varijable (Cornwell and Rupert Data)
LWAGE = log of wage

EXP = work experience
WKS = weeks worked
OCC = occupation, 1 if blue collar,
IND = 1 if manufacturing industry
SOUTH = 1 if resides in south
SMSA = 1 if resides in a city (SMSA)
MS = 1 if married
FEM = 1 if female
UNION = 1 if wage set by union contract
ED = years of education
BLK = 1 if individual is black
 Varijable (Cornwell and Rupert Data)
 Pretpostavimo da ai reflektira
 Združeni model (pooled OLS): ai se briše

(najrestriktivniji)
 FE (fixed effect) procjenitelj:
 ai se “kontrolira”
 OLS procjena je 0,244 je precjenjena
 Oba 2 i g su pozitivni
FE model (Fixed Effects)
yi ,t  a i  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T
 ai – nepoznate konstante za svaku grupu (n entity-

specific intercepts)
 yi,t – zavisna varijabla
 Xi,t – skup nezavisnih varijabli (time varying)
 ui,t – greške relacije
 ai – su korelirane s uključenim nezavisnim

varijablama
 
E a i X i ,1 , X i , 2 ,  hX i ,1 , X i , 2 ,
yi ,t  a i  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T (eq.1)

 Promjene u y su rezultat utjecaja koje nisu samo
fiksne karakteristike (spol, nacionalnost,...
 FE nije dobar model ako su:
 varijacije unutar grupa (within-cluster variation)
male ili
 ako se varijable sporo mijenjaju tijekom vremena
Interpretacija parametara:
“.....za danu zemlju (grupu, units), ako se X poveća za
jednu jedinicu, y se (u prosjeku) mijenja za β
jedinica”
 Analogno, FE model se može definirati koristeći
dummy varijable:
yi ,t   0  X i ,t   Wi 
 g 2 E 2  g 3 E3    g N E N  u i , t (eq.2)
 Ei – entity i (konstanta, N-1 dummy varijabli)
 gi – parametar uz i-tu dummy varijablu
 (eq.1) i (eq.2) ekvivalentne
 ai iz (eq.1) i dummy varijable Ei iz (eq.2) imaju isti
izvor – nemjerljivu varijablu Zi, koja varira po i
(unutar grupa, zemalja) ali ne po t (ne tijekom
vremena)
 (eq.2) se može proširiti uključivanjem i “vremenskih”
dummy varijabli
 time and entity fixed effects regression model
yi ,t   0  X i ,t   Wi  g 2 E2  g 3 E3    g N E N 
  2T2   3T3     T TT  ui ,t (eq.3)
 (N-1) Ei dummy varijabli, (T-1) Ti dummy varijabli

 uključi Ti (kontroliraj za vremenski fiksne efekte) ako
postoji sumnja za neočekivane varijacije ili posebne
događaje koji mogu utjecati na zavisnu varijablu
 LSDV model (least square dummy variable)

 Dodavanjem dummy varijable za svaku zemlju,
procjenjujemo stvarni efekt nezavisnih varijabli na
zavisnu varijablu (kontroliramo unobserved
heterogenost)
 Svaka dummy varijabla Ei “apsorbira” efekt koji je
specifičan za svaku zemlju i
FE procjenitelj (Fixed Effects)
 FE =LSDV=WI procjenitelji → identični
 LSDV (least squares dummy variables)

: uključi N-1 dummy varijable za prostorne
(cross-section) jedinice
 WI (within transformation) koristi vremenske

prosjeke...po t (time means) za svaki i.
1) Za svaku grupu (units) izračunaj prosjek po t
T
1 T
1
yi ,.   yi ,t X i ,.   X i ,t
t 1 T t 1 T
2) Izračunaj time-demeaned data:
3) Procijeni regresijski model (time-demeaned data):
y  X  u
*
it
*
it
*
it
*
Greške relacije u su proces bijelog šuma
i ,t
→ FE procjenitelj je nepristran.
Združeni (pooled OLS) .vs. FE model
H0: svi koeficijenti uz dummy varijable su jednaki 0

→ Skupni F-test
use cornwell&rupert, clear

xtset person period
global ind1 exp exp2 wks occ ind south smsa ms union
global ind2 ed blk fem
* Pooled OLS
regress $ind1 $ind2, robust
** FIXED Effects, LSDV

xtreg $ind1 $ind2, fe
session 2.do
Pooled OLS .vs. FE model
Pooled OLS .vs. FE model
Nedostatak FE modela
 Vremenski invarijantne varijable ne mogu biti
nezavisne varijable
 Vremenski nepromjenjive karakteristike svake
individue su “perfekno” korelirane s dummy
varijablama individue (person or entity dummies)
 FE modeli koriste se za analizu uzroka promjena
unutar individue (within a person or entity)
FE model .vs. LSDV model
FE model - xtreg
FE model
 FE model “kontrolira” za sve vremenski invarijantne

razlike između grupa (zemalja, individua), pa FE
procjene nisu pristrane zbog izostavljanja vremenski
invarijantnih varijabli (religija, spol....
 Ne mogu se koristiti za analizu vremenski
invarijantnih uzroka zavisne varijable
 Postoji perfektna kolinearnost između vremenski
invarijantnih karakteristika i dummy varijabli (grupe)
FE model
 FE modeli koriste se za analizu uzroka promjena
unutar grupa
 Vremenski invarijantne karakteristike ne uzrokuju
takve promjene budući su konstante unutar grupe
(za svaku individu)
Kohler, Ulrich, Frauke Kreuter, Data Analysis Using

Stata, 2nd ed., p.245
RE model (Random Effects)
 Za razliku od FE modela, pretpostavlja se da su

varijacije između grupa (units) slučajne i
nekorelirane s nezavisim varijablama modela
 “.....ključna razlika između FE i RE modela je u tome

uključuju li nemjerljivi pojedinačni efekti elemente
koji su korelirani s regresorima ili ne, a ne jesu li
ti efekti slučajni ili ne.” [Green, 2008, p.183]
 Ako imamo razloga za pretpostaviti da razlike između
grupa imaju određeni utjecaj na zavisnu varijablu
potrebno je koristiti RE model
Prednost RE modela:
 Moguće je analizirati vremenski invarijantne varijable
 U FE modelima one su uključene u konstantan član

Član ai postaje “dio” greške relacije
yi ,t  c  X i ,t   Wi  i ,t i ,t  a i  ei ,t (eq.4)
a i  a  ui
 ui – between-entity error (između grupa)
 ei,t – within-entity error (unutar grupa)
 Dodatne pretopstavke
α ~α, σ ,
i
2
u
ei,t ~0, σ 
2
e
Pretpostavke: striktna egzogenost(strict exogeneity)

yi ,t  X i ,t   a  ui   ei ,t
   
E ei ,t X i ,1 , X i , 2 ,  E ui X i ,1 , X i , 2 ,  0
 
E ei ,t X i ,1 , X i , 2 ,   e
2 2
 
E ui2 X i ,1 , X i , 2 ,   u2
 
E ei ,t u j X i ,1 , X i , 2 ,  0 za sve i,t,j
 
E ei ,t e j , s X i ,1 , X i , 2 ,  0 za t  s ili i  j
 
E ui u j X i ,1 , X i , 2 ,  0 za i  j
yi ,t  c  X i ,t   Wi  i ,t i ,t  a i  ei ,t (eq.4)
 Procjenjuje se GLS metodom
 Može se pokazati da se GLS RE procjenitelj može
dobiti (quasi-demeaning) transformacijom
 l=1 → FE  u2  , a i velika varijanca

 l=0 → OLS  u2  0, nema a i
 RE model pretpostavlja da regresori nisu korelirani s

ai (unobserved heterogeneity); tj. da je
Cov(Xi,t,ai)=0 (teško zadovoljiti)
 RE model omogućuje generalizaciju na populaciju

(uzorak → populacija)
RE .vs. OLS i RE .vs. FE
 RE ili OLS procjenitelj → LM test
H0 : σ  0
2
u (nema a i  l  0)
 Potreban uvijet Cov(Xi,t,ai)=0 (teško zadovoljiti)
 RE ili FE procjenitelj →Hausman test
H0: Efikasniji RE procjenitelj je nepristran

Cov(Xi,t,ai)=0 je ispunjeno
 Ako se H0 ne može odbaciti → RE procjenitelj

RE .vs. OLS
Prob<0,05 → H0 se odbacuje (20 =0), RE a ne OLS

RE .vs. FE
Prob<0,05 → H0 se odbacuje (Cov(Xi,t,ai)=0 ), FE a ne RE

RE model
Interpretacija parametara?
RE model
r = Omjer varijance grešaka ui (individual-specific error)

i varijance grešaka ei (composite, entire error)
 Pokazatelj kakvoće RE modela
RE ili FE: Hausman test
 RE ili FE procjenitelj →Hausman test (Green, 2008)

H0: Odgovarajući je RE model
H1: Odgovarajući je FE model
Jesu li ui korelirane s regresorima?

H0: Cov(Xi,t,ui)=0 (RE konzistentan)
H1: Cov(Xi,t, ui)≠0 (FE konzistentan, RE nekonzistentan)
 Procijeni FE model → spremi procjene

 Procijeni RE model → spremi procjene
 Provedi test
RE ili FE: Hausman test
xtreg y x1, fe
estimates store fixed
xtreg y x1, re
estimates store random
hausman fixed random
Hausman test
 Opći test specifikacije modela

Ideja testa
 Ako je Ho (Cov(Xi,t,ui)=0) istinita
→ OLS iz LSDV i GLS su konzisentni, no OLS nije
efikasan (RE model “bolji”)
 Ako je Cov(Xi,t,ui)≠0 i Ho se odbacuje
→ OLS je konzistentan, no GLS nije (FE model
“bolji”)
 Negativna test veličina? (→ Ho se ne odbacuje, RE)

 Mundlak-ov test (alternativa Hausman-ovom)
FD procjenitelj (First Difference)

Kao bi kontrolirali (uklonili) ai – prve diferencije
 ai →se poništava,
 Wi →se poništava,
 FD procjenitelj →uvjet Cov(DXi,t, Dui)=0
 Za T=2 → FE=FD
FD procjenitelj
Panel podaci – deskriptivna statistika
 Deklariranje panel podataka i varijabli

xtset
 Panel analiza: xt naredbe
xtdes (describe)
xtsum (summarize)
xttab (tablica, one-way tabulations )
xttrans (transition probabilities)
xtline (grafički prikazi)
 Panel regresija
xtreg
Panel podaci – dijagnostika
Cross-sectional dependence
 samo za makro panele (veliki T – Baltagi, 20-30
godina)
 problem nije prisutan u mikro panelima (nekoliko
godina i veliko N)
 Testira se zavisnost između grupa (cross-sectional
dependence/contemporaneous correlation)
 Breusch-Pagan LM test o nezavisnosti
 H0 – reziduali između grupa nisu korelirani
 STATA naredba: xttest2 (nakon xtreg, fe)
 Instaliranje naredbe → ssc install xttest2

Breusch-Pagan LM test
(Cross-sectional dependence)
Pasaran CD test
 Pasaran CD test (cross-sectional dependence)
 test o korelaciji reziduala između grupa
 H0 – reziduali između grupa nisu korelirani
 STATA naredba: xtcsd
 Instaliranje naredbe → ssc install xtcsd

Pasaran CD test
Test heteroskedastičnosti
 Za FE modele → xttest3
 Instaliranje naredbe → ssc install xttest3
 H0 – homoskedascity (konstantna varijanca)
 Za oba modela (FE i RE) koristi opciju robust za

heteroskedasticiy-robust standardne pogreške (zovu
se još i Huber/White ili sandwich procjenitelji)
Test o postojanju
heteroskedastičnosti
Prob<0,05 → H0 se odbacuje , heteroskedastičnost!!!

Procjenitelji panel modela
yi ,t  a i ,t  X i ,t   ui ,t i  1,...,N; t  1,...,T
Združeni (pooled) model:
yi ,t  a  X i ,t   ui ,t i  1,...,N; t  1,...,T (eq.1)
 Regresori su nekorelirani s greškama relacije,

Cov(Xi,t,ui)=0
 Ako N→∞ ili T→∞ → pooled OLS – konzistentan
 Ako je stvarni model FE model – pooled OLS procjene
nisu konzistentne (standardne pogreške procjene
parametra jako podcijenjene))
Procjenitelji panel modela
FE model:
yi ,t  a i  g t  X i ,t   ui ,t i  1,...,N; t  1,...,T (eq.2)

Analogno:
N T
yi ,t   a j E j ,it   g sTs ,it  X i ,t  i  1,...,N; t  1,...,T
j 1 s2
 pooled OLS – nekonzistentan

 Procjenitelji FE, LSDV, FD
BE procjenitelj (Between Estimator)
 Za procjenu  - pooled OLS koristi varijacije po i

(grupama) i po t (vremenu)
 BE procjnitelj u kratkim panelima – koristi samo
varijaciju između grupa
 Računaju se prosjeci po vremenu
yi  a i  X i   ui i  1,...,N (eq.3)
T
1 1 1
yi   yi ,t
T T
X i   X i ,t ui   ui ,t
t 1 T t 1 T t 1 T
BE procjenitelj (Between Estimator)
 OLS regresija na prosjecima
yi  a i  X i   ui i  1,...,N (eq.3)
Analogno (between model):
yi  a  X i   a i - a  ui  i  1,...,N
 BE je konzistentan procjenitelj ako su Xi i
 
a i - a  ui nekorelirani, tj.
 U RE modelima i u modelima s konstatnim
paremetrima
 FE =LSDV=WI procjenitelji → identični
 WI (within transformation) koristi vremenske
prosjeke...po t (time means) za svaki i.
y  X  u
*
it
*
it
*
it
 OLS regresija na demean-data – konzistentan

procjenitelj – zove se i FE procjenitelj
 Pooled i BE procjenitelj su nekonzistentni
 LSDV procjenitelj– uključuje dummy varijable

 ako N nije jako velik, jednostavniji
 zove se i FE procjenitelj
FD procjenitelj (First Differences)
 OLS regresija na prvim diferencijama

 Mjeri vezu između promjena (prve diferencije)
 Kako za pojedinu grupu, jedinična promjena u
pojedinom regresoru utječe na prosječnu promjenu u
zavisnoj varijabli
RE procjenitelj (Random Effects)
 Pooled OLS je konzistentan, ali pooled GLS je

efikasniji
 Feasible GLS procjenitelj RE modela dobiva se kao
OLS regresija quasi-demeaned data
 RE procjenitelj je efikasan za RE model
 RE procjenitelj je nekonzistentan ako je FE paravi
model

P5-Panal Models PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

P5-Panal Models PDF

Uploaded by

Copyright:

Available Formats

Panel modeli

Panel modeli – prednosti

 Problem prikupljanja podataka (sampling design)

 Zavisnost između grupa (zemalja) kod makro panela

yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 Ili alternativno (općenitije)

yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 ai – unobserved heterogeneity, individual effect,

y  X 1 1  X 2  2  u " stvaran" model

 ˆ1 pristran jer X2 nije uključena

 bias = 2·g (X2=Educ, 2 =0,03)

 595 individua, 7 godina

LWAGE = log of wage

 Združeni model (pooled OLS): ai se briše

 OLS procjena je 0,244 je precjenjena

yi ,t  a i  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 ai – nepoznate konstante za svaku grupu (n entity-

 ai – su korelirane s uključenim nezavisnim

yi ,t  a i  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T (eq.1)

 (N-1) Ei dummy varijabli, (T-1) Ti dummy varijabli

 LSDV model (least square dummy variable)

 LSDV (least squares dummy variables)

 WI (within transformation) koristi vremenske

2) Izračunaj time-demeaned data:

3) Procijeni regresijski model (time-demeaned data):

H0: svi koeficijenti uz dummy varijable su jednaki 0

use cornwell&rupert, clear

** FIXED Effects, LSDV

 FE model “kontrolira” za sve vremenski invarijantne

Kohler, Ulrich, Frauke Kreuter, Data Analysis Using

 Za razliku od FE modela, pretpostavlja se da su

 “.....ključna razlika između FE i RE modela je u tome

 Moguće je analizirati vremenski invarijantne varijable

 U FE modelima one su uključene u konstantan član

Član ai postaje “dio” greške relacije

Pretpostavke: striktna egzogenost(strict exogeneity)

 l=1 → FE  u2  , a i velika varijanca

 RE model pretpostavlja da regresori nisu korelirani s

 RE model omogućuje generalizaciju na populaciju

 RE ili OLS procjenitelj → LM test

 RE ili FE procjenitelj →Hausman test

H0: Efikasniji RE procjenitelj je nepristran

 Ako se H0 ne može odbaciti → RE procjenitelj

Prob<0,05 → H0 se odbacuje (20 =0), RE a ne OLS

Prob<0,05 → H0 se odbacuje (Cov(Xi,t,ai)=0 ), FE a ne RE

r = Omjer varijance grešaka ui (individual-specific error)

 RE ili FE procjenitelj →Hausman test (Green, 2008)

Jesu li ui korelirane s regresorima?

 Procijeni FE model → spremi procjene

 Opći test specifikacije modela

 Negativna test veličina? (→ Ho se ne odbacuje, RE)

yi ,t  a i  g t  X i ,t   Wi  ui ,t i  1,...,N; t  1,...,T

 Deklariranje panel podataka i varijabli

 Instaliranje naredbe → ssc install xttest2

 Instaliranje naredbe → ssc install xtcsd

 Za oba modela (FE i RE) koristi opciju robust za

Prob<0,05 → H0 se odbacuje , heteroskedastičnost!!!

Združeni (pooled) model:

yi ,t  a  X i ,t   ui ,t i  1,...,N; t  1,...,T (eq.1)

 Regresori su nekorelirani s greškama relacije,

yi ,t  a i  g t  X i ,t   ui ,t i  1,...,N; t  1,...,T (eq.2)

 pooled OLS – nekonzistentan

 Za procjenu  - pooled OLS koristi varijacije po i