Professional Documents
Culture Documents
Indhold
10 Basic linear unobserved effects................................................................................................................. 5
10.1 Random effects ................................................................................................................................. 5
10.1.1 Test for unobserved effects .......................................................................................................... 6
10.2 Fixed effects ..................................................................................................................................... 6
10.2.1 Inferens ......................................................................................................................................... 7
10.3 FD metoder ....................................................................................................................................... 8
10.3.1 Inferens ......................................................................................................................................... 8
10.4 Sammenligning ................................................................................................................................. 9
10.4.1 FE vs. FD ...................................................................................................................................... 9
10.4.2 FE og RE – quasi time-demeaning ............................................................................................... 9
10.4.3 Hausman: sammenligning af RE og FE ....................................................................................... 9
11 More topics in linear unobserved effects ................................................................................................ 10
11.1 Oversigt .......................................................................................................................................... 10
11.2 Sekventiel eksogenitet .................................................................................................................... 11
11.2.1 Instrumentering .......................................................................................................................... 11
11.2.2 Contemporaneous korrelation mellem en x og u ........................................................................ 12
11.3 Individual slopes ............................................................................................................................. 13
11.4 GMM tilgang .................................................................................................................................. 13
11.5 Chamberlain’s tilgang..................................................................................................................... 13
11.6 Specielle ......................................................................................................................................... 14
11.6.1 Hausman-Taylor ......................................................................................................................... 14
12 M-estimation ........................................................................................................................................... 15
12.1 Setup ............................................................................................................................................... 15
12.2 2-trins estimation ............................................................................................................................ 16
12.3 Konsistens og asymptotisk normalitet ............................................................................................ 16
12.4 Varians-estimation .......................................................................................................................... 16
12.4.1 Uden nuisance ............................................................................................................................ 16
12.4.2 Var-est med nuisance.................................................................................................................. 17
1
12.5 Testning (§12.6).............................................................................................................................. 18
12.5.1 Wald ........................................................................................................................................... 18
12.5.2 LM .............................................................................................................................................. 18
12.5.3 Tests baseret på ændringer i objctive function (QLR)................................................................ 19
12.6 Optimerinsgalgoritmer .................................................................................................................... 19
13 Maximum Likelihood estimation ............................................................................................................ 19
13.1 Avar estimation............................................................................................................................... 19
13.2 Testning .......................................................................................................................................... 20
13.3 Panel ............................................................................................................................................... 20
13.3.1 Unobs.eff. and strict exo ............................................................................................................. 21
13.3.2 Lagget afh. var (y-var) ................................................................................................................ 21
13.4 Uncond. MLE (UMLE) vs. cond. MLE (CMLE) ........................................................................... 22
14 GMM ...................................................................................................................................................... 22
14.1 Efficiente instrumenter (§14.5.3, pp. 439-442)............................................................................... 22
14.2 Classical Minimum Distance (CMD) ............................................................................................. 22
15 Discrete Response Models ...................................................................................................................... 23
15.1 Linear Probability Model (LPM) – problematisk ........................................................................... 23
15.2 Latent variabel model – probit og logit .......................................................................................... 23
15.2.1 MLE (pp. 460-461)..................................................................................................................... 24
15.3 Tests i binary response index modeller........................................................................................... 24
15.3.1 Hetsked ....................................................................................................................................... 24
15.4 Reporting results ............................................................................................................................. 25
15.5 Random Utility Model .................................................................................................................... 25
15.6 Specification issues......................................................................................................................... 25
15.6.1 Neglected heterogeneity (c udeladt) ........................................................................................... 25
15.6.2 Endogen, kontinuert variabel...................................................................................................... 26
15.6.3 Når den endogene variabel er binær ........................................................................................... 27
15.6.4 Hetsked & ikke-normalitet ......................................................................................................... 28
15.6.5 Manski’s maximum score estimator – estimation under svagere antagelser .............................. 28
15.7 Panel data / cluster samples ............................................................................................................ 29
15.7.1 Pooled estimation ....................................................................................................................... 29
15.7.2 Unobserved effects probit........................................................................................................... 29
2
15.7.3 Logit: unobs eff og streng exo (FE logit, skodnavn) .................................................................. 31
15.7.4 Dynamic unobs.eff (state dependence)....................................................................................... 31
15.7.5 Andet .......................................................................................................................................... 32
15.8 Multinomial response ..................................................................................................................... 32
15.8.1 Multinomial logit ........................................................................................................................ 32
15.8.2 Probabilistic choice models: ....................................................................................................... 33
15.9 Ordered response – ordered logit/probit ......................................................................................... 34
16 Censored regressions and corner solution models .................................................................................. 35
16.1 Tobit ............................................................................................................................................... 35
16.1.1 Estimation ................................................................................................................................... 35
16.1.2 Quantities of interest................................................................................................................... 35
16.2 Neglected heterogeneity (§16.6.1) .................................................................................................. 36
16.3 Endogenous .................................................................................................................................... 37
16.4 Hetsked & ikke-normalitet ............................................................................................................. 37
16.5 Estimation under svagere antagelser............................................................................................... 37
16.5.1 Powel estimatoren ...................................................................................................................... 37
16.5.2 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff............................................... 38
16.6 Tobit for panel ................................................................................................................................ 38
16.6.1 Sml. med alm. tobit .................................................................................................................... 38
16.6.2 Tobit med unobserved effects..................................................................................................... 39
16.6.3 Dynamic unobserved effects tobit .............................................................................................. 40
17 Sample selection attrition and stratified sampling .................................................................................. 40
17.1 Sample selection ............................................................................................................................. 40
17.2 Simpel model .................................................................................................................................. 41
17.2.1 ML i sample selection – PMLE .................................................................................................. 42
17.2.2 Sammenligning: ML vs. Heckit.................................................................................................. 42
17.2.3 Ad 2SLS på selekteret data......................................................................................................... 42
17.2.4 Ad 3: Truncation (selektion på y) ............................................................................................... 42
17.2.5 Probit selektion – exogene variable (Heckit).............................................................................. 43
17.2.6 Probit selektion – endogene variable .......................................................................................... 44
17.2.7 Tobit med eksogene forklarende vars ......................................................................................... 45
17.2.8 Tobit med endogene forklarende vars ........................................................................................ 46
3
17.3 Paneldata: Sample selection ........................................................................................................... 46
17.3.1 Fixed effects på ubalancerede paneler ........................................................................................ 46
17.3.2 Test / korrektion for sample selection bias ................................................................................. 47
17.3.3 Attrition – man vælger at udgå af sample................................................................................... 48
17.3.4 Inverse probability weighting (IPW) .......................................................................................... 48
17.4 Non-parametric bounds .................................................................................................................. 49
18 Treatment effects .................................................................................................................................... 49
18.1 Noten .............................................................................................................................................. 50
18.1.1 Nonparam id – ignorability of treatment .................................................................................... 50
18.1.2 Regressions and switching models ............................................................................................. 50
18.1.3 Regression discontinuity ............................................................................................................ 51
18.1.4 Before-after ................................................................................................................................ 51
18.1.5 Selection and treatment effects ................................................................................................... 52
18.1.6 Estimation af ATE ved IV under antagelse af homogen treatment effect .................................. 52
18.1.7 Heterogene treatment effects (v0 ≠ v1) ...................................................................................... 53
18.1.8 LATE (local average treatment effects) ..................................................................................... 53
18.1.9 Essential heterogeneity and IV (sorting on the gain).................................................................. 54
18.1.10 Sammenhæng med den simple sample selection model ......................................................... 54
18.2 Ikke-parametrisk tilgang ................................................................................................................. 55
18.3 Mere parametrisk tilgang ................................................................................................................ 55
18.3.1 Switching regression .................................................................................................................. 56
18.3.2 Svagere antagelser – to ukendte g-funktioner ............................................................................ 56
18.3.3 Regression disc. designs ............................................................................................................. 57
18.4 Propensity score .............................................................................................................................. 57
18.4.1 ATE skrevet som funktion af p, som estimeres med probit........................................................ 57
18.4.2 Regressér y på w og p-hat .......................................................................................................... 58
18.5 Matching ......................................................................................................................................... 58
18.6 IV-metoder...................................................................................................................................... 59
4
10 Basic linear unobserved effects
CROSS-SECTION ∷ Løsninger på uobserveret heterogenitet,
- Proxy
- IV (2SLS)
- Indikator-IV
PANEL
Antager er tidskonstant
BEMÆRK ∷ ⇒ tidskonstante ’er kan ikke identificeres separat fra .
Antager balanceret panel – ubalancerede håndteres senere.
EKSOGENITET
5
hvor
⇔
ANTAG (FE.X)
1)
a. OBS! ⇒ streng eksogenitet, dvs.
b. Evt. tænk .
c. OBS! ⇒ ⇒ , specielt ⇒ .
2)
3) (kun nødv. for efficiens af FE)
OBS! FE1 + FE2 ⇒ unbiasedness
ESTIMATION
6
PRAKSIS
- Premultiply med eye(T) – T^-1 * ones(T,T).
NAVNE
- Within ⇔ within each cross-section ⇒ HER
- Between ⇔ between each cross section
LSDSV
- Viser sig ∷ FE = Least Squares Dummy Variable Estimator ∷ på dummies for personer,
- → svarer til at estimere for alle ⇒ incidental parameters problem.
- MEN ∷ stor ⇒ giver idé om fordelingen af heterogeniteten i populationen.
10.2.1 Inferens
INFERENS
- PAS PÅ! .
- fås ved først at beregne og så udnytte . Da er
- (unbiased).
PROBLEM ∷ FE-transformationen introducerer serielkorrelation i pr. konstruktion
- fordi . Men betydningen svinder som ∷
MEN ∷ det bliver et mindre problem (??)
10.3 FD metoder
ANTAG
1)
a. Som FE.1
b. OBS! ⇒ streng eksogenitet, dvs.
c. Evt. tænk .
2)
3) , hvor (kun nødv. for efficiens af FD)
a. MODSÆTNING til FE.3‼ FD.3 ⇒ random walk
b. (FE.3 ⇒ )
BEMÆRK
- Vi mister én periode!
- Alle ’er skal variere over .
- Egentlig skal bare være ukorr. med før vi får konsistens!
VIGTIGT
- Under FD.1-3 er alm. inferens valid under POLS på Δ’et data!
10.3.1 Inferens
OBS! Ikke nødvendigt at tænke så meget som i FE – alm. inferens @ POLS på Δ’et data er valid.
- (huskeregel: I FD har vi af 2 stok var ⇒ selv stok var ⇒ alle antagelser laves på den. I FE har vi stok
var minus noget, som bliver deterministisk når )
8
SERIEL KORR i
- Kør reg
- → alm. -test af .
- OBS! ukorrelerede ⇒ autokorr med .
10.4 Sammenligning
10.4.1 FE vs. FD
⇒ FE = FD
valget afh. af antagelser om
OBS! Endogenitet (målefejl, tidsvar.udeladte, simultanitet) ⇒ både FE & FD inkons med hver sin plim!
TEST ∷ STRENG EXO
IDE ∷ hvis FD (el. FE) modellen er korrekt og , bør være insign (den er taget højde for).
- ∷ POLS
- ∷ FE
- for ∷ for store er RE ≅ FE
- for ∷ dominerer ⇒ brug FE
RE ∷ Hjælp til en estimator i nød
- Inkludér dummies for grupper der er meget ens, dvs. som har ens ’er.
ULEMPER
9
1) Streng eksogenitet antages både under og
2) RE3 antages at holde under . Dvs. vi tester
a. (ellers får test.str. en skør asymptotisk fordeling)
IDE ∷ Det viser sig, at under RE.1-RE.3, er
Test-str. er:
BEMÆRKNINGER
- kan klares @ aux regression af quasi time-demeaned (q.t.d.’ed) på q.t.d.’ed samt en alm. (FE-
style) time-demeaned (de tidsvarierende elementer i ).
- ⇒ kør så -test af koeff. på eller Wald
- … kan evt. gøres robust for RE3 i denne setting ∷ brug robust Wald.
11.1 Oversigt
10
11.2 Sekventiel eksogenitet
- Når og er kontrolleret for, hjælper det ikke yderligere at kontrollere for fortiden af
- OBS! MILDERE antagelse end !
BEMÆRKNING
- Hvis , vil seq.exo. ⇒ dyn.compl.
- Seq.exo. ⇒ , .
FE OG FD ER INKONSISTENTE!
- FE ∷ Bias introduceres fordi fremtid er i tidsgns.
- fordi , så ⇒
- MEN ∷ hvis yderligere det antages at er weakly dep., er inkons af odten
- FD ∷ Bias fordi to på hinanden følgende perioder sættes sammen
- når vi kun har seq.exo.
- ⇒ OBS! Bias uaf. af (da på hinanden følgende perioder)
11.2.1 Instrumentering
11
Nogle x’er str.exo., nogle seq.exo.
Eksempelvis , hvor seq.exo. og str.exo.
- Model: ↷ skriv op en ligning for
- → klart at .
- FD + IV ∷ FD ⇒ fjerner , men inducerer muligvis endogenitet hvis (dvs. når ej str., men kun
seq. exo)
- kan være sit eget instrument – brug ( ) som instr for ( ).
3 mulige ophav:
1) Udeladte tidsvariante forklarende variable
2) Målefejl
3) Simultanitet
a. (kan alternativt løses ved at medtage en ligning for den simultane var’s bestemmelse)
FREMGANG
1) Transformér data (FE eller FD)
2) Brug IV af en art – hvilke instr’er afh. af anvendelsen.
FD bedre end FE
- FD er robust for mere generelle overtrædelser af str.exo end FE
- Vi kan teste for ser.korr. på Δ’et data
- Arellano & Bond (1991) foreslår GMM-baseret test for ser.korr. i .
Simultanitet
MULIGHED 1 ∷ LAGGEDE ’ER SOM INSTR’ER
OBS! og er korrelerede for alle , så kan kun estimeres med fordi
BEMÆRK ∷
- simultaniteten kommer nu ikke fra det, at vi lagger, men er med ”dobbelt” (hver gang og er
sammen)
ALTERNATIVT ∷
- lagget kunne bruges, men det kræver, at der ikke er seriel korrelation i
- (siden (i niveau) ikke indgår i ligning kan den måske bruges som IV → men formentligt SVAGT!)
MULIGHED 2 ∷ EKSTERNE INSTRUMENTER
FIND nogle eksterne instrumenter og kør POOLED 2SLS på
12
Udeladt tidsvariant variabel
FD (el. FE) ↷ efterfulgt af IV
Ikke altid oplagt smart bare at bruge laggede variable
⇒ find eksternt exo instrument
Målefejl
(I classical errors in variables under str.exo. ∷ FE forværrer målefejl)
Vi må finde et instrument udover de variable, vi har.
Hvis der er seriel korrelation i målefejlene, kan vi måske bruge som instr for .
- Pr. konstruktion er , og ,
- MEN ∷ generelt!
INDSÆT
- FE.1 ⇒ og .
SYSTEM
13
System-OLS er konsistent under FE.1.
MULIGE ANTAGELSER
- ∷ system skalar-varians
- ∷ system homoskedasticitet
- Denne failer hvis
1) ∷ ej homosked.
2) ej lineær i ∷ forkert fkt. form for
3) ej konstant ∷ ej homosked (??)
HVIS
- Begge opfyldt ⇒ SOLS efficient (??)
- Failer ⇒ FGLS kan bruges
- GMM er mest efficient med som instrument for hver tidsperiode og med den
optimale vægtmatrix.
- Test af over-ID ⇔ test af str.exo.
11.6 Specielle
11.6.1 Hausman-Taylor
ANTAG
1) ∷ str. exo
2)
BEMÆRK
- 1) giver, at FE kunne bruges ⇒ vi får så , men så ville -leddet gå ud.
IDE ∷ vi vil udnytte 2) samt at 1) medfører til at estimere . Omskriv
⇒
⇔
ANALOGIPRINCIPPET
14
… han viser det for en mere generel model
GIV (generalized IN) TANKEGANG
Bruge som instrumenter
- instrumenterer
- instrumenterer sig selv (de tidskonstante, som er ukorr. med )
- instrumenterer (de tidskonstante, som er korrelerede med )
TILGANGE ∷ i rækkefølge med stigende robusthed.
- 3SLS med på RE struktur
- 3SLS med urestrikteret
- GMM med efficient vægtmatrix
12 M-estimation
12.1 Setup
SPECIFIKATION
Karakteristik af fx , hvor .
hvor .
IDENTIFIKATION
15
12.2 2-trins estimation
løser
Trin 1: Estimér ,
Trin 2: Estimér .
ØNSKE ∷ konsistent uanset, hvordan vi vælger .
hvor
Dermed er
12.4 Varians-estimation
afh. af humør:
2 TILGANGE
1) Håndværkertilgangen ∷ udregn samt , indsæt og tag sample avg.
a. Altid mulig – men tung og måske ej pos.def.
2) Strukturel estimation ∷ givet (eller ),
a. Udnyt fx ∷ så
i. Udregn
ii. Udregn
iii. Udregn .
b. → smart hvis betingning på giver en simpel form (fx i probit bliver led = 0)
16
Analogiprincippet
Brug Analogiprincippet til at estimere
med
DVS ∷
1) Udregn lukket-form udtryk for og som funktion af og
a. Dvs. differentier to gange mht. .
2) Evaluér sample avg. af disse udtryk.
OVERVEJELSER
- NEGATIVT ∷ tung at regne, ej sikkert pos.def – men den er det hvis unikt løser sample problem.
- POSITIVT ∷ altid tilgængelig
⇒
Så analogiprincippet motiverer
Alternativt:
- hvor med .
17
- hvor ,
- hvor (og er en bøvlet, grim funktion, som formentlig skal tænkes på
som et slags generaliseret residual.
BEMÆRKNINGER
- OBS! er lineært separable I den ”almindelige” effekt og ”nuisance” effekten ,
- MEN det er ikke! (den bliver interageret på kryds og tværs pga. ”^2”)
- MEN ∷ bemærk, at selvfølgelig indgår i .
12.5.1 Wald
Testes ved
hvor
- , kan vælges robust (når eller evt. højde for nuisance)
- Jacobi-matricen for ( )
(skal være invertibel)
ULEMPE
- Ikke skalainvariant ⇒ problem (primært/kun?) ved ikke-lineære hypoteser: man kan omformulere
indtil man får den ønskede konklusion.
FORDELE
- Estimerer kun den ”store” model
- Kan gøres vilkårligt robust
12.5.2 LM
18
Hvis GIME (generalized information matrix equality, og )
FORDELE
- Estimerer kun den “lille” model.
- Med forventet hesse er den ofte invariant for reparameteriseringer.
ULEMPER
- …
ULEMPER
- Forudsætter, at GIME holder og kan ikke gøres robust for dette.
12.6 Optimerinsgalgoritmer
MANGLER DETTE AFSNIIT‼
(og hvor .)
19
Under regularitetsantagelser (bl.a. antagelse om korrekt specificeret model) holder teorem 13.2 (p. 395)
(fordi i ML sammenhænge)
- Dvs. i stedet for som i teorem 12.3.
Alle flg. 3 matricer konvergerer til den sande Avar (p. 396) ∷ baggrund: i ML
13.2 Testning
OBS ∷ asymptotisk ækvivalente! Kun finite-sample overvejelser
Wald
LR
(Like-ratio – ala -test, mere kompleksitet skal dælme give mere forklaringskraft!)
Lad . Lad være estimatet når de restriktioner er pålagt og uden. Under er
LM
(hvor langt er hældning fra nul, dvs. hvor slemt overtrædes FOC?)
Lad være vektor af afledte af evalueret ved de restrikterede estimater.
Da vil
13.3 Panel
Lad være den sande pdf. for givet .
BEMÆRK! Vi antager IKKE, at .
20
- (dvs. antager ikke )
Men vi antager, at er en korrekt specificeret pdf for for hver periode, , ”isoleret set”.
Smart teoretisk figumdik
Definér det partielle likelihood bidrag som
Og log-like er
2) PMLE-agtig tilgang
Antager intet om fordelingen af (givet )
I stedet siger vi, at vi for hver enkelt kan få tætheden af
Nu vælger vi
21
Og vi kan igen integrere ud, dvs. vi skal lave
- INITIAL CONDITION PROBLEM ∷ skal håndteres
- LØSNING ∷ betinger på (/antager)
Her er betingningen på
KOMMENTARER
- Vi smider den første obs. væk.
- Alt. ku man ha fundet distr. for … meget svært!
- ASYM VAR ∷ justér for at tage højde for at begge params. estimeres.
14 GMM
22
METHOD
- Estimate
- Choose .
KOMMENTARER
- SKALA IRRELEVANT ∷ (eller ) kunne være skaleret arbitrært
- Hvis fx , er
- ⇒ Derfor: normalisér med , for et valg af .
- Retningen af effekten fra på og er den samme ( monotont voksende)
Indekse
Fortolkning af ’erne
23
15.2.1 MLE (pp. 460-461)
Like bidrag
Log-like function
Det kan vises, at
og
Så .
KOMMENTARER
- Denne er invertibel så længe der ikke er perf.mult.kor.
- Muligt med Huber-White robuste s.e.’er ⇒ MEN ∷ hvis er misspec. så er også (ligger i
naturen af ML).
- (disse er , udregnet ved og .)
WALD ∷ problematisk når den store model er for stor ( har høj dim).
LR ∷ Kræver begge estimeret.
LM ∷ Smart hvis den store er bøvlet. Kan gøres som auxillary regression.
- Lad , , ,
- Da er fra reg af på og
HVIS ER IKKE-LINEÆR
- Wald foretrækkes,
- MEN ∷ ej invariant for reparameteriseringer
15.3.1 Hetsked
så vi omskriver
LM test
- Bøvlet augmented regression ala alm. LM.
24
15.4 Reporting results
- Percent correctly predicted (#gange , hvor .))
- Pseudo , hvis log-like fra unrestricted, log-likelihood i model med kun intercept.
og så kan vi køre helt alm. probit på den med reglen: Vælg bil hvis .
Latent form ∷ , , .
- ( w/o loss of generality)
c og x uafh.
STÆRK antagelse
Antag , da er .
Attenuation bias:
PROBLEM
Ønsker ∷ Partial effect:
25
og
c og x ikke uafh.
Så er probit generelt inkonsistent
Antag
Mistænker . Skriv
- ⇒ ingen endogenitet
Antag og
og
KORT FORTALT
- Både varians af og må normaliseres for at få identifikation
- Kan ikke løse for → den må integreres ud
- er grim!
LANGT FORTALT
27
Så skal vi tage forventningen og til det bruge tætheden af (inden i -integralet)
→ til det skal vi bruge, at er en trunkeret normalfordelt variabel, idet ⇔ :
Hetsked
Antag i latent-variabel-formuleringen:
Non-normalitet
Så er inkonsistent
- Men hvis fx det er fordi logit er den sande model, kan godt være ret tæt på.
Antag ,
(og bemærk, at )
- (fordi ⇒ (medianer kan ikke være kommatal)
Fordele:
- Robust: og må godt være afh. og er ikke restrikteret.
- Estimerer konsistent op til skala – god til fx
Ulemper:
- Konvergerer med rate (selvom Horowitz (1992) har en smoothed version med næsten .
- Vi kan ikke differentiere , så ingen partielle afledte.
- Nogle gange har modsat indflydelse på og .
28
15.7 Panel data / cluster samples
Med LPM modeller kan man evt. bruge FE, FD eller RE.
→ men stadig ikke attraktiv for binær-respons data.
Model:
-
DYNAMIC COMPLETENESS
⇒ alm. inferens
- OBS! Betyder ikke tidsuafhængighed – må fx godt indeholde laggede variable.
- Betyder blot, at , .
- ⇒ sample kan ses som en stort cross-section af str.
TEST for dyn.compl.
- Lag.dep.var ∷ Estimér den potentielt syge,
- Estimér ,
(OBS! man må droppe tidsperioder – ellers som ej findes.)
ANTAGELSE
- Dvs. er strengt eksogen betinget på (specielt indeholder nok lags osv, altsådyn.compl.)
- BERTEL’s noter ∷ ingen lagged dep.vars siden ville være perf. korr. med dem (?!?!?!)
MULIGE METODER
- Fixed effects ∷ fjern ved transformation
- SVÆRT pga. ikke-linearitet
- Proxy for (når interesse er i APE)
- Pooled analyse (når interesse er i APE)
- Estimér ∷ Fixed effects probit (dumt navn!)
- Åndssvagt! Ser som parameter ⇒ #params → ∞ for .
29
- Diskussion: man betragter som ikke-tilfældig… modsat hvad vi vil gøre!
- Traditional random effects probit
- ANTAGELSER
1) Streng exo ∷
2) Uafh., (betinget på )
⇒
3)
⇒ &&
- METODE ∷ integrér ud af !
Max log-like mht. og ‼
- HURRA ∷ både (part.eff. ved ) og (APE) kan godt estimeres!
Men hvorfor kan de pludselig det her når de ikke kunne i alm. unobs.eff.??
INDSKUD ∷ integration
Numerisk @ quadrature
Simulation @ int ≅ tage forventning
1) Træk std.normaler ↷
2) Beregn
3) Beregn for hver
4) Tag gns. og logs,
5)
SVAGERE ANTAGELSER
- Generalized estimating equations
- Response prob. specificeres kun betinget på , ikke .
- Kræver specifikation af ( ), men robust for fejlspec af denne.
- CMLE @ Fuld korrelation
- , hvor , hvor tillades fuld frihed i off-diagonal (og 1’er i
diagonalen)
- Slem curse of dim!
Men, Keane (1993, in press) har simulationsmetoder
- Chamberlain’s random effects probit
- MÅL ∷ tillade sammenhæng
- METODE ∷ specificere betinged for med konstant varians.
- Antag , .
Error form ∷ .
Restriktiv, men tillader dog noget samspil (modsat trad.REprobit)
- Indsæt i ligning:
30
- INTUITION ∷ Tilføjer tids-gns som kontrolvariabel ∷ partial eff. af når tidsgennemsnittet
holdes fast! ⇒ måde at kontrollere for uobserverede personspecifikke effekter
- Udvidelse ∷ Tillade tidsafh. i
muligt at droppe antagelsen ⇒ så skal inferens dog gøres robust for
arbitrær seriel korrelation.
Så kan vi dog kun finde APE’s ved at integrere ud (hvilket i praksis kommer ud på at
”integrere” ud (dvs. average den ud, da den observeres)
BEMÆRKNINGER
Hidtidige udledninger ∷ afhænger kritisk af, at er strictly exogenous conditional on .
→ dvs. fx ingen lags af dep.var. !
- TEST for streng exo ∷ add bare nogle lags og se om de bliver sign.
NEDERN ∷ ik muligt at specificere tæthed for så vi (nemt) kan integrere mht. den.
OPTUR ∷ muligt med FE/FD-agtig approach! → viser sig at falder ud når vi betinger på
- svedig feature ved logit-formen gør det muligt at få en funktionel form, der ik afhænger
Log-like i tilfældet:
Grundlæggende model
BEMÆRK
- ∷ dvs. antager str.exo
- Tidl. outcome må godt påvirke response prob)
INTERESSE ∷ State-dependence efter der er kontrolleret for ∷ .
JOINT PROB
31
INITIAL CONDITIONS PROBLEM ∷ hvad når vi når til ? modelleres ikke!
4 muligheder
1) Se som ikke-stokastisk
a. Streng antagelse ∷ medfører bl.a.
2) Specificere tæthed for , dernæst for
a. Svært at vælge tæthed. Førende eksempel .
3) Approksimere tæthed for , dernæst for (Heckman, 1981)
a. Fx lade følge probit med resp.prob.
4) Betinge på , dernæst specificere
a. kan fx vælges som Chamberlain, ,
b. I PRAKSIS
i. Alm. Chamberlain probit, hvor og tilføjes i alle tidsperioder
c. APE’s mv. ∷ tag MLE params og multiplicér med ( -subscript viser
dette). Std.fejl. fås vha. bootstrapping el.lign.
15.7.5 Andet
Semiparametriske metoder
- Fx Manski for brugt på differenser
Cluster samples
- Pooled probit/logit ∷ brug dog de robuste varians-estimatorer.
32
RESULTATER
Partielle effekter har en meget besværlig form, men odds bliver pæne:
LIKELIHOOD
Primarily, we’ll look at conditional logit, but conditional probit is a nice extension (although it has some
computational issues)
Conditional logit
Derived from underlying utility-maximization model
RESULTATER
BEGRÆNSNINGER
Independence of Irrelevant Alternatives
LØSNINGER
33
1) Multinomial probit (= conditional probit)
a. I tillades , hvor kovarianser er urestrikterede.
b. MEN ∷ besværlig beregning (inkl. -dim integral)
c. Dog: simulationsmetoder
2) Hierakiske modeller ∷ fx nested logit model
a. Idé ∷ indfør 2 lag ∷ først vælger man mellem grupper, derefter vælger man inden for de enktelte
grupper (betinget på at vælge gruppe , er der conditional logit blandt alternativer i den gruppe.
Del op
Response probs:
34
16 Censored regressions and corner solution models
2 typer
1) Censored data
a. Observerer
2) Corner solutions
a.
16.1 Tobit
ANTAG ∷
- ⇒ .
16.1.1 Estimation
Cond.log.like
INFERENS
- Alm. MLE
- Wolle giver første/anden afledte
Afh. af model:
- Censoring ∷ den latente variable; , eller
- Corner solution ∷ den faktiske variable,
UDLEDNING
-
- fordi , , så
-
- Derfor
35
PARTIAL EFFECTS
BEMÆRK‼
- De part.eff.’s er bare skaleringer af ’erne
- (specielt, skaleret med -variable ⇒ vi forventer )
Fra NOTERNE:
RESULTATER
- CENSORING ∷ husk, er interessen ⇒ rapportér
- CORNER ∷ vis .
ANTAG ∷
PROBLEM ∷ skal håndteres eksplicit
LØSNING ∷ integrér ud, dvs.
ANTAG ∷ har pdf.
- Så er og
- EKS
- Diskret:
36
- Kont: , ⇒ pga. .
⇒ &
16.3 Endogenous
Som for discrete choice
⇒ må antage mere struktur ∷ den endogene, , antages
- Tobit ∷ 2-step (Smith-Blundell) ∷ estimér reduceret form for endogene ved OLS ↷ inkludér
residualer (dvs. tobit af på )
- Som for probit
- Std.fejl skal korrigeres
- MEN ∷ estimeres ikke (relevant for CORNER når man estimerer APEs)
- Fuld MLE ∷ specificér simultane fordeling af de endogene vha.
- Indsætter direkte og estimerer den samtidig @ ML
TEST ∷ i begge settings testes (eller efter parameterisering) via alm. -test.
- DOG ∷ ML en del tungere beregningsmæssigt ↷ estimér Smith-Blundell først og test endo i den.
ANTAG ∷
- Dvs. ingen pdf / uafh. antagelser
ESTIMATION
LAD (least absolute deviations)
M-ESTIMATION
37
- er kontinuert ⇒ konsistens følger af 12.2
- MEN ∷ ikke differentiabel ⇒ kan ikke bruge 12.3
- Powel viser dog -asymptotisk normalitet.
RESULTATER
Censored:
- , HVIS ’s fordeling er symmetrisk omkring 0
Corner solution:
- Ingen af de ønskede kræver antagelser om fordeling
- MEN ∷ specifikationstest for Tobit modellen
PROBLEMER
Criterion function er diskontinuert ved :
- Desuden ∷ .
16.5.2 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff.
ANTAG ∷
Tobit på cross-section med obs.
38
Inferens @ robuste estimatorer; , med potentielt
- Fordi og , så afhænger af corr.
mellem og .
- , hvor vælges som enten , (bedst hvis
tilgængelig) eller
- er den simpleste for .
POSITIVT
- Kræver ikke streng exo af
- Antager , men ikke
- Laggede i er ok
- Seriel korr. i er ok
- Ingen antagelser om , kun
Laggede dep.vars. er bøvlede at inkludere ( observeres kun delvist)
YDERLIGERE ANTAGELSE
- Dynamic completeness ∷ .
- OBS! dyn.compl antagelse om uafh.!
- MEN ⇒ netop den antagelse, der giver, at alm. inferens duer
- TEST ∷ medtag flg. 2 vars i alm. Tobit ∷ og ↷ test samtidig
ANTAG ∷
- ⇒ streng exo, ,
MULIGHEDER
1) Estimér ⇒ incidental parameters
2) Antag ⇒ Random Effects tobit; Chamberlain-tilgang
3) Eliminér ved transformation @ Honoré (1992)
ANTAG
- ⇒ ⇒ , dvs. streng eksogenitet‼‼ (udelukker noget fra )
- Og (eller følger det af ovenstående?)
- ,
- og
- dvs.
⇒
- Bemærk, , så er for
39
IDENTIFICEREDE params ∷
PRAKSIS
- Alm. tobit, hvor medtages i hver periode (evt. kan bruges for at blive mere generel,
men det er tungere beregning)
- ⇒ identifikation hvis der er tidsvariation i .
RESULTATER ∷ CENSORED
- Tilføjelsen af har løst alle problemer ( er nemlig identificeret)
RESULTATER ∷ CORNER
- Vi kan tage differenser / se på ∂ ved ( ) evalueret ved fx .
- APE’s kan estimeres jf. wolle
VIDERE
- Muligt at relaxe
- Muligt at udvide Powel til dette setting.
ANTAG ∷
- Dvs. streng exo af
BEMÆRK
- Corner ∷ afhænger af, om eller 1.
- Censored ∷ giver bedre mening at inkludere ⇒ bøvlet som bar fuck!
Del datasættet op
- ∷ kun observeres
- ∷ bade og observeres.
MÅL
VISE ∷ .
- Så snart denne betingelse holder er pooled OLS ok
- … hvis ikke må vi benytte andre krumspring (antage mere struktur)
- OBS! Konklusionen gælder også for NLS!
- CMLE ∷ hvis vil MLE på det selekterede sample være konsistent.
ANVENDELSER (eksempler)
MULIGHEDER for selektion
1. er en (deterministisk) function af alene ∷
a. ⇒ ingen problemer, da uanset
b. (vi betiner en gang for meget)
2. er uafh. af og
a. ⇒ ingen problemer! Så ”indeholder ingen yderligere info om nogen aspekter af fordelingen af
, specielt ikke den betingede forventning”. Dvs.
b. ⇒
3. (truncation)
a. Antag fordeling af og brug truncated Tobit
b. ⇒ så kan vi udlede og bruge CMLE.
4. (disrete response selection)
a. Tillader afh. mellem og ∷ påvirker selection, men kun påvirker .
b. Det viser sig, at ∷
c. HECKMAN 2-step ∷
i. 1) estimér probit af på ↷ (på fuldt sample),
ii. 2) OLS af på og (på det selekterede sample)
41
5. and (Tobit selection – e.g. hours worked)
a. Implicerer mere struktur
b. 2-step
i. 1) Estimér censoreret Tobit af på ↷ residualer
ii. 2) OLS af på og for de selekterede (dvs. med )
Strukturel model ∷
Selektionsmodel ∷
UDNYT (hvor )
TEOREM 17.1
model , instrumenter
Random sampling ∷ nok at antage og estimere med 2SLS på med instr .
Selection @ ∷
- ANTAG ∷ ,
- ⇒ 2SLS af på med isntr , hvor kun det selekterede sample bruges vil give konsistente estimater.
Selektionsligning
ANTAG
1) observeres altid. observeres når .
2) med .
- Mildere end , som er et specialtilfælde.
3)
- ok da ikke observeres.
4)
- Ville følge hvis .
ESTIMATIONSLIGNING
Pga. selektion kan vi kun håbe på at estimere og , men se, at
- Testes @ std. -værdi da ⇒ alm. OLS asymptotik holder selvom en var. for meget tages med
BEMÆRKNINGER
- Bøvlet at finde varians når
43
- Stadig konsistent når (samme regressorer for og
- → MEN ∷ noisy ∷ id’es kun pga. ikke-linearitet i .
UDVIDELSE
- Hvis antages kan PMLE bruges (lang, grim …)
- → udnytter igen Bayes til at opskrive betinget på ud fra ssh. for givet over ssh. for generelt:
ANTAG
1) observeres altid, observeres kun når .
2)
3) (skala arbitrær da )
4)
5) og i ligning 2 er hvor .
BEMÆRKNINGER
- OBS! Vi skal have vars i som bestemmer selektion og den endo (relevans), men ikke (exo)
- Ala alm. endo problem, men vi må antage struktur på den endo, .
- Arbitrær korrelation tillades mellem .
UDLEDNING
TRICK:
BEMÆRKNINGER
- kan være diskret.
- Eks. ∷ . Idé til instr: hvis man blev indstillet tilfældigt (men stadig
forsk. ssh. for at deltage på bgg. af )
- exo men manglende somme tider (non-response) ⇒ modellen duer stadig, skal instrumenteres.
44
- Mindst 2 vars i skal bruges – tænk: én til og én til at identificere selektion ( ).
- (hvis ingen ekstra til selektion, vil id af køre på ikke-lin. af alene.
- Hvis vi antager , kan vi bruge PMLE.
PROCEDURE
1) Estimér ved probit af på (for hele sample)
2) Indsæt i (jf. §probit)
MOTIVATION ∷ separat variation i ⇔ vi kan sige ”hvor langt” man er fra selektion ⇒ mere efficient
EKSEMPEL ∷ timeløn, #timer arbejdet p.a.
ANTAG
1) observeres altid, observeres kun når .
2)
3) (skala ej arbitrær da observeres!)
4)
BEMÆRKNINGER
- Som for probit
- Tænk selektion: .
UDLEDNING
BEMÆRKNINER
- Efficiency gain ∷ intuitivt klart, vi kan se, hvor langt folk er fra de-selektion.
- OK med MODSAT probit! → @ nu har vi separat variation i .
- PMLE mulig @ ANTAG ∷
-
45
- hvor er og er den sædvanlige
.
ANTAG
1) observeres altid, observeres kun når .
2)
3) (skala arbitrær da )
4)
5) og i ligning 2 er hvor .
UDLEDNING (som for probit med endo)
- her er pr. konstruktion ⇒ 2SLS på selekteret sample er ok, hvis kan medtages ⇒ estimér
@ Tobit.
PROCEDURE
1) Estimér ved Tobit af på . Udregn for selekterede .
2) Estimér ved 2SLS af på og vha. instr (for sig selv), (for ), (for sig selv) på
selekterede sample
BEMÆRKNINGER
- kan være kont. eller diskret.
RESULTAT
- hvis kan vi ”uden videre” bruge formlerne med OLS på transformeret data, hvis vi
bare også ganger på hver gang (fx )
MODEL
ANTAG
1) (⇐ )
2) er invertibel (alm. rank-condition)
46
3) (⇒ alm. FE inferens holder)
BEMÆRK
- RE analyse kræver
ESTIMATION
- Definér
BEMÆRKNINGER
- FE kan kun bruge .
- Almindelig robust FE-varians kan bruges
- Tilladt at danne et balanceret subsample og estimere på det, fx vælge med .
- VIGTIGT! Vi kunne lige så godt have brugt FD metoder.
PROCEDURE
1) Probit på (eller ) – fuldt sample. Udregn (eller .
2) FE af på og – selekteret sample. @ alm. OLS.
og skriv (reduceret form) ligningen for selektion betinget på selektion i forrige periode
- fx kan indeholde og (ikke da den står på LHS for forrige periode ⇒ corr med
).
ANTAG
- ⇒
- (hvor ⇒ så vi ikke behøver betinge på det yderligere)
PROCEDURE
1) Probit på ↷ ↷
2) Pooled OLS af på , . Tests er ikke længere oplagt simple (robusthed
kræves).
PROBLEMER
- Antagelsen udelukker at kan påvirke attrition (efter betingning på ) – tænk: ingen samtidig
påvirkning fra til når der er kontrolleret for .
- antages at være strengt eksogen.
LØSNING ∷ IV
- Instrument , hvor (dvs. redundant i selektionsligningen) og er eksogen i modelligningen
- Step 2 i procedure: Lav 2SLS i stedet og instrumentér med (som fx kan være ).
INTUITION
- Regularitet giver, at kan erstattes med når vi udregner asymptotik (antages ).
UDVIDELSE
- hvis attrition probit’en ændrer sig over tid??
- ⇒ bølvet at håndtere…
18 Treatment effects
OVERORDNET ∷ ønsker at estimere og .
TILGANGE
1) Ignorability of treatment (ATE.1 og ATE.1’) ∷ regression, matching, weighting estimatorer (og evt.
mixed, som vi ikke ser på)
2) Regression discontinuity design
3) Panel data: difference in differences (og before-after)
4) IV
49
18.1 Noten
- Internal validity ∷ hvilken effekt havde jobtræninsprogrammet ⇒ ønsker vi
- External validity ∷ hvilken effekt vil et hypotetisk program have ⇒ kan vi ikke få
Average treatment effect
- On the ∷ treated ∷ untreated ∷ overall
RUBIN’S CAUSAL MODEL
- outcome w/ treatment, outcome without (cont. or discount.)
- if treated, else .
- iid.
MULIGE ANTAGELSER
- ⇒ og
- Så er .
- OBS! Uafh. ⇒ vi kan fjerne betingning ∷ generelt er , men vi kan bare
kun udregne fordi missing data gør, at vi kun har når .
- ⇒ .
ATE1: betinget på er
ATE1’: a) og b) .
(selection on observables)
- ⇒ når er partialled out, vil de tilbageværende faktorer, der påvirker være uafh. af de tilbageværende,
som påvirker .
ATE’ ⇒ .
COMMON SUPPORT
- dvs. vi skal se single-mødre i begge grupper (treatment og non-treatment)
PROCEDURE
- Reg på ∷ koeff. til er .
-
- (s.e.’s på denne via bootstraps eller Δ-metoden.
BEMÆRK
- Vi får blot en lokal gns. treatment effekt lige ved cutoff niveauet
- Hvis treatment effekten er heterogen er den ikke lig med hverken eller !
18.1.4 Before-after
Diff estimator
IDE ∷ sammenligne individ med sig selv!
OBS! Kræver paneldata og kan kun estimere (avg.treat.of.treated)
ANTAG
-
ESTIMATION ∷
- FØRST ∷ diff-estimator
- dvs. vi estimerer på det treatede sample og tjekker forskellen på og givet at man på et tidspunkt
bliver treated.
51
MEN ∷ hvad med generel tids-trend? ⇒ motiverer diff-in-diff
Diff-in-diff
ANTAG
-
(dvs. at den gns. udvikling over tid er den samme i de to grupper ⇔ samme tids-trend)
SÅ ER
PROCEDURE
- Regressér på , hvor er koefficienten til .
BEMÆRKNINGER
- Bygger på antagelsen om, at randomisering holder i FD
- Antagelsen tillader selektion på unobservables, men kun hvis de er tidsinvariante
- Dvs. fx ikke Ashenfelter’s dip ∷ discouraged worker lige før treatment.
ANTAG
- ATE.2 ∷
a)
b)
c)
52
FORKLARINGER
- a) ⇒ , idet vi kan skrive
- b) ≅ exclusion restriction, i.e. spiller ingen rolle i ligningen for . Desuden b) ⇒ .
Dermed kan vi skrive ligningen for som
Procedure 1: Alm. IV
Instrumentér med og med sig selv.
ANTAG
PROCEDURE
1) Estimér i med MLE og få (fx probit / logit)
2) Estimér ved 2SLS med instr
⇒
ANTAG
-
- (monotonicitet)
53
(…)
ESTIMATION
- , hvor er sample avg. af over .
- IV reg på med som IV for ⇒ koeff. til .
FORTOLKNING
- gns. treatment effekt på dem, som ville participate hvis blev ændret fra 0 til 1.
BEMÆRK
- defineres ud fra variationen i
- Modsat og , som defineres ud fra forhold i populationen
- Vi kan ikke observere populationen med (dvs. hvor og missing) (lige så vel som
vi ikke observerer ’erne for de treatede)
- Modsat er forventning over den treatede del af populationen, som vi kan finde eksplicit.
- GENERELT ∷ .
- HVIS forudsiger perfekt hvem, der bliver treated, og hvis dem, der bliver treated også er dem,
der har størst gain, vil .
- HVIS , vil .
- Her (må)
- Definer
⇒
ANTAG ATE.4
54
a) for
b) for
c)
d) , hvor
e) og , hvor så
SÅ KAN VI SKRIVE
- fx
- … og endelig
PROCEDURE
1) Probit af på , dvs. . Få
2) Regresser @ POLS ∷ på
SÅ ER
- dvs. er lig den generelle plus den forventede individuelle gevinst ved at blive treated (
er lig den individspecifikke gevinst ved treatment)
- Bemærk ∷ kræver flere antagelser (typisk) end .
SMART ∷ Definér
55
Så er
PROBLEM ∷ std.fejl skal fås fra de evt. non-param ’er ⇒ men muligt @ bootstrap / Δ-metoden.
- med og
- TÆNK ∷ er et fejlled, som vi har antaget betinget middelværdi nul for.
EKSEMPEL
- Vælg (eller for lidt mere generelitet)
ANTAG
- ATE.1’
⇒ så er
- hvor , og .
KONKLUSION ∷ ATE.1’ alene giver os to ting:
56
1) er en funktion af og og (en funktion af ), dvs.
2) er additiv i
PROBLEM – Saturated model
- Hvis ’erne vælges for komplekse får vi problemer (ikke datatæthed alle vegne)
- hvor
ESTIMATION
- OLS af på
RESULTATER
ANTAG
- ATE.1’
- (mao. antag og )
SÅ ER
57
PROCEDURE
1) Estimér ∷ fx vha. logit/probit med en Sieve funktionaf inden i
2) Tag sample equivallent af og
- (hvor .)
BEMÆRKNINGER
- Logit/probit sikrer, at , men måske maskerer det bare det mulige sample problem, at der findes
så …
- Det hele kommer til at hvile på, hvordan man estimerer .
18.5 Matching
ANTAG
-
-
Så kan vi estimere
BEMÆRKNINGER
58
- Matching estimatorer “balancerer” samplet så det ligner, at kovariaterne kommer fra mere “iid-agtige”
processer.
- Tillader heterogene responses – ikke-parametrisk tilgang ⇒ ingen restriktioner på respons.
- Bedre -estimator ∷ ikke bare bruge de nærmeste, men alle naboer vægtet efter deres “afstand” i .
18.6 IV-metoder
Skriv ligningen som
TILLADER
- tillades at være endogen
- (⇒ OBS! i alm. 2SLS er der ingen yderligere betænkninger ved at instrumentere en dummy!)
BEMÆRK
- Hvis , er generelt
- (dvs. hvis og har samme stokastiske led, så vil interaktionsleddet med gå ud, og
afhænger altså ikke af (svarende til, at essentielt set))
HVIS ∷ instrument ukorr. med sammensatte fejlled ⇒ potentielt muligt at instrumentere
ANTAG ATE.2 ∷ ortogonal eligibility
- og en mildere version af og mere
SÅ ⇒ direkte estimation kører og vi kan skrive
- og
- TÆNK ∷ eligibility uafh. af observables, fx Angrist’s lotteri for værnepligt: lotterinummer (højt
⇒ nok ind og springe, men nogen slap && tilfældigt)
ANTAG ATE.2’ ∷ IDÉ: er det optimale instrument for
- og (fx probit) og mere
PROCEDURE
1) Estimér ved MLE (fx probit).
2) Estimér , dvs. på og med instrumenter og .
BEMÆRK ∷ bygger vigtigt på antagelsen om, at er korrekt specificeret!
MERE STRUKTUR
- Skriv , hvor altså for
ANTAG ATE.3 ∷
- ATE.2 … og…
- for
- (evt. nok med .)
Da bliver og
60