You are on page 1of 60

Samlede eksamensnoter

Indhold
10 Basic linear unobserved effects................................................................................................................. 5
10.1 Random effects ................................................................................................................................. 5
10.1.1 Test for unobserved effects .......................................................................................................... 6
10.2 Fixed effects ..................................................................................................................................... 6
10.2.1 Inferens ......................................................................................................................................... 7
10.3 FD metoder ....................................................................................................................................... 8
10.3.1 Inferens ......................................................................................................................................... 8
10.4 Sammenligning ................................................................................................................................. 9
10.4.1 FE vs. FD ...................................................................................................................................... 9
10.4.2 FE og RE – quasi time-demeaning ............................................................................................... 9
10.4.3 Hausman: sammenligning af RE og FE ....................................................................................... 9
11 More topics in linear unobserved effects ................................................................................................ 10
11.1 Oversigt .......................................................................................................................................... 10
11.2 Sekventiel eksogenitet .................................................................................................................... 11
11.2.1 Instrumentering .......................................................................................................................... 11
11.2.2 Contemporaneous korrelation mellem en x og u ........................................................................ 12
11.3 Individual slopes ............................................................................................................................. 13
11.4 GMM tilgang .................................................................................................................................. 13
11.5 Chamberlain’s tilgang..................................................................................................................... 13
11.6 Specielle ......................................................................................................................................... 14
11.6.1 Hausman-Taylor ......................................................................................................................... 14
12 M-estimation ........................................................................................................................................... 15
12.1 Setup ............................................................................................................................................... 15
12.2 2-trins estimation ............................................................................................................................ 16
12.3 Konsistens og asymptotisk normalitet ............................................................................................ 16
12.4 Varians-estimation .......................................................................................................................... 16
12.4.1 Uden nuisance ............................................................................................................................ 16
12.4.2 Var-est med nuisance.................................................................................................................. 17
1
12.5 Testning (§12.6).............................................................................................................................. 18
12.5.1 Wald ........................................................................................................................................... 18
12.5.2 LM .............................................................................................................................................. 18
12.5.3 Tests baseret på ændringer i objctive function (QLR)................................................................ 19
12.6 Optimerinsgalgoritmer .................................................................................................................... 19
13 Maximum Likelihood estimation ............................................................................................................ 19
13.1 Avar estimation............................................................................................................................... 19
13.2 Testning .......................................................................................................................................... 20
13.3 Panel ............................................................................................................................................... 20
13.3.1 Unobs.eff. and strict exo ............................................................................................................. 21
13.3.2 Lagget afh. var (y-var) ................................................................................................................ 21
13.4 Uncond. MLE (UMLE) vs. cond. MLE (CMLE) ........................................................................... 22
14 GMM ...................................................................................................................................................... 22
14.1 Efficiente instrumenter (§14.5.3, pp. 439-442)............................................................................... 22
14.2 Classical Minimum Distance (CMD) ............................................................................................. 22
15 Discrete Response Models ...................................................................................................................... 23
15.1 Linear Probability Model (LPM) – problematisk ........................................................................... 23
15.2 Latent variabel model – probit og logit .......................................................................................... 23
15.2.1 MLE (pp. 460-461)..................................................................................................................... 24
15.3 Tests i binary response index modeller........................................................................................... 24
15.3.1 Hetsked ....................................................................................................................................... 24
15.4 Reporting results ............................................................................................................................. 25
15.5 Random Utility Model .................................................................................................................... 25
15.6 Specification issues......................................................................................................................... 25
15.6.1 Neglected heterogeneity (c udeladt) ........................................................................................... 25
15.6.2 Endogen, kontinuert variabel...................................................................................................... 26
15.6.3 Når den endogene variabel er binær ........................................................................................... 27
15.6.4 Hetsked & ikke-normalitet ......................................................................................................... 28
15.6.5 Manski’s maximum score estimator – estimation under svagere antagelser .............................. 28
15.7 Panel data / cluster samples ............................................................................................................ 29
15.7.1 Pooled estimation ....................................................................................................................... 29
15.7.2 Unobserved effects probit........................................................................................................... 29
2
15.7.3 Logit: unobs eff og streng exo (FE logit, skodnavn) .................................................................. 31
15.7.4 Dynamic unobs.eff (state dependence)....................................................................................... 31
15.7.5 Andet .......................................................................................................................................... 32
15.8 Multinomial response ..................................................................................................................... 32
15.8.1 Multinomial logit ........................................................................................................................ 32
15.8.2 Probabilistic choice models: ....................................................................................................... 33
15.9 Ordered response – ordered logit/probit ......................................................................................... 34
16 Censored regressions and corner solution models .................................................................................. 35
16.1 Tobit ............................................................................................................................................... 35
16.1.1 Estimation ................................................................................................................................... 35
16.1.2 Quantities of interest................................................................................................................... 35
16.2 Neglected heterogeneity (§16.6.1) .................................................................................................. 36
16.3 Endogenous .................................................................................................................................... 37
16.4 Hetsked & ikke-normalitet ............................................................................................................. 37
16.5 Estimation under svagere antagelser............................................................................................... 37
16.5.1 Powel estimatoren ...................................................................................................................... 37
16.5.2 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff............................................... 38
16.6 Tobit for panel ................................................................................................................................ 38
16.6.1 Sml. med alm. tobit .................................................................................................................... 38
16.6.2 Tobit med unobserved effects..................................................................................................... 39
16.6.3 Dynamic unobserved effects tobit .............................................................................................. 40
17 Sample selection attrition and stratified sampling .................................................................................. 40
17.1 Sample selection ............................................................................................................................. 40
17.2 Simpel model .................................................................................................................................. 41
17.2.1 ML i sample selection – PMLE .................................................................................................. 42
17.2.2 Sammenligning: ML vs. Heckit.................................................................................................. 42
17.2.3 Ad 2SLS på selekteret data......................................................................................................... 42
17.2.4 Ad 3: Truncation (selektion på y) ............................................................................................... 42
17.2.5 Probit selektion – exogene variable (Heckit).............................................................................. 43
17.2.6 Probit selektion – endogene variable .......................................................................................... 44
17.2.7 Tobit med eksogene forklarende vars ......................................................................................... 45
17.2.8 Tobit med endogene forklarende vars ........................................................................................ 46
3
17.3 Paneldata: Sample selection ........................................................................................................... 46
17.3.1 Fixed effects på ubalancerede paneler ........................................................................................ 46
17.3.2 Test / korrektion for sample selection bias ................................................................................. 47
17.3.3 Attrition – man vælger at udgå af sample................................................................................... 48
17.3.4 Inverse probability weighting (IPW) .......................................................................................... 48
17.4 Non-parametric bounds .................................................................................................................. 49
18 Treatment effects .................................................................................................................................... 49
18.1 Noten .............................................................................................................................................. 50
18.1.1 Nonparam id – ignorability of treatment .................................................................................... 50
18.1.2 Regressions and switching models ............................................................................................. 50
18.1.3 Regression discontinuity ............................................................................................................ 51
18.1.4 Before-after ................................................................................................................................ 51
18.1.5 Selection and treatment effects ................................................................................................... 52
18.1.6 Estimation af ATE ved IV under antagelse af homogen treatment effect .................................. 52
18.1.7 Heterogene treatment effects (v0 ≠ v1) ...................................................................................... 53
18.1.8 LATE (local average treatment effects) ..................................................................................... 53
18.1.9 Essential heterogeneity and IV (sorting on the gain).................................................................. 54
18.1.10 Sammenhæng med den simple sample selection model ......................................................... 54
18.2 Ikke-parametrisk tilgang ................................................................................................................. 55
18.3 Mere parametrisk tilgang ................................................................................................................ 55
18.3.1 Switching regression .................................................................................................................. 56
18.3.2 Svagere antagelser – to ukendte g-funktioner ............................................................................ 56
18.3.3 Regression disc. designs ............................................................................................................. 57
18.4 Propensity score .............................................................................................................................. 57
18.4.1 ATE skrevet som funktion af p, som estimeres med probit........................................................ 57
18.4.2 Regressér y på w og p-hat .......................................................................................................... 58
18.5 Matching ......................................................................................................................................... 58
18.6 IV-metoder...................................................................................................................................... 59

4
10 Basic linear unobserved effects
CROSS-SECTION ∷ Løsninger på uobserveret heterogenitet,
- Proxy
- IV (2SLS)
- Indikator-IV
PANEL
Antager er tidskonstant
BEMÆRK ∷ ⇒ tidskonstante ’er kan ikke identificeres separat fra .
Antager balanceret panel – ubalancerede håndteres senere.
EKSOGENITET

Hvis vi kun betinger på ’er ∷ ,


⇒ dvs. ækvivalent med streng exo ⇔
BEMÆRK
- -lags ⇒ streng exo kan aldrig holde ∷ ⇒ .
- → desuden giver -lags ser.korr. i composite error term pr. konstruktion .
FREMGANG – 2 spørgsmål
1) Er korreleret med for noget ?
2) Holder streng eksogenitet (betinget på )?
NAVNGIVNING
Random Effects ∷
Fixed Effects ∷

10.1 Random effects


IDE ∷ udnytte ser.korr. i til at lave GLS
ANTAG
1) Ortogonalitet
a.
b.
i. Tilstrækkeligt for konsistens ∷
ii. er without loss of generality når der er intercept.
2) Rank ∷ , hvor .
For efficiens ANTAG YDERLIGERE
3) Efficiens af RE
a.
b.
Da er
ESTIMATION
Alm. FGLS varians

5
hvor

Første trin baseres på pooled OLS.


… brug dog robust varians, hvis muligt
F-TEST
Brug fra modellen til at udregne både og (selvfølgelig).

10.1.1 Test for unobserved effects

IDE ∷ svarer til at teste


- (hvilket svarer til at teste ser.korr. i , dvs. AR(1)-test, men bedre at teste direkte på )
PROBLEM ∷ hvad er ?
LØSNING ∷ streng eksogenitet giver

FORDEL ∷ opdager mange typer ser.korr. i


ULEMPE ∷ streng exo ⇒ må ikke indeholde laggede ’er!

10.2 Fixed effects


ANTAG (FE.X)
1)
a. OBS! ⇒ streng eksogenitet, dvs.
b. Evt. tænk .
c. OBS! ⇒ ⇒ , specielt ⇒ .
2)
3) (kun nødv. for efficiens af FE)
OBS! FE1 + FE2 ⇒ unbiasedness
ESTIMATION

6
PRAKSIS
- Premultiply med eye(T) – T^-1 * ones(T,T).
NAVNE
- Within ⇔ within each cross-section ⇒ HER
- Between ⇔ between each cross section
LSDSV
- Viser sig ∷ FE = Least Squares Dummy Variable Estimator ∷ på dummies for personer,
- → svarer til at estimere for alle ⇒ incidental parameters problem.
- MEN ∷ stor ⇒ giver idé om fordelingen af heterogeniteten i populationen.

10.2.1 Inferens

INFERENS

- PAS PÅ! .
- fås ved først at beregne og så udnytte . Da er

- (unbiased).
PROBLEM ∷ FE-transformationen introducerer serielkorrelation i pr. konstruktion
- fordi . Men betydningen svinder som ∷
MEN ∷ det bliver et mindre problem (??)

Robust varians og seriel korr i idiosynkratiske fejl


Seriel korr i ?
Problem ∷ vi har ikke
⇒ vi kan udnytte, at ∷ reg på for alle og test
Problem ∷ serielkorrelation under
Løsning ∷ brug flg. robuste variansestimator

som er robust for heteroskedasticitet og seriel korrelation i


⇒ kan bruges til at lave Wald-tests.

Fixed Effects GLS


ANTAG

- dvs. FJERN FE.3.


⇒ muligt at lave en GLS analyse
7
PROBLEM ∷ det viser sig, at , som har rang på kun !! Dvs. ikk invertibel!
LØSNING ∷ Drop en tidsperiode og lav GLS
1) Estimér og drop så en tidsperiode (fx den ’te) fra datasættet.
2) Estimér .
3) Estimér
ALTERNATIV
- Man kan specificere en eller anden struktur på og udlede en stuktur på
- Fx BFN (1982) antager stabil, homoskedastisk, AR(1) ⇒ afh. kun af .
- MEN ∷ efficient hvis korrekt, inefficient ellers.

Generelt: policy implementation


Faktisk er ortogonalitetsbetingelsen jo ⇒
⇒ dvs. i nogle situationer, hvor deltagelse i et program er betinget af karakteristika før programmet
, kan FE godt være konsistent selvom POLS / RE ikke er det, hvis ortogonaliteten overholdes
- (dvs. hvis det var givet at man ville deltage, bare ikke hvornår??)

10.3 FD metoder

ANTAG
1)
a. Som FE.1
b. OBS! ⇒ streng eksogenitet, dvs.
c. Evt. tænk .
2)
3) , hvor (kun nødv. for efficiens af FD)
a. MODSÆTNING til FE.3‼ FD.3 ⇒ random walk
b. (FE.3 ⇒ )
BEMÆRK
- Vi mister én periode!
- Alle ’er skal variere over .
- Egentlig skal bare være ukorr. med før vi får konsistens!
VIGTIGT
- Under FD.1-3 er alm. inferens valid under POLS på Δ’et data!

10.3.1 Inferens

OBS! Ikke nødvendigt at tænke så meget som i FE – alm. inferens @ POLS på Δ’et data er valid.
- (huskeregel: I FD har vi af 2 stok var ⇒ selv stok var ⇒ alle antagelser laves på den. I FE har vi stok
var minus noget, som bliver deterministisk når )

8
SERIEL KORR i
- Kør reg
- → alm. -test af .
- OBS! ukorrelerede ⇒ autokorr med .

10.4 Sammenligning

10.4.1 FE vs. FD

⇒ FE = FD
valget afh. af antagelser om
OBS! Endogenitet (målefejl, tidsvar.udeladte, simultanitet) ⇒ både FE & FD inkons med hver sin plim!
TEST ∷ STRENG EXO
IDE ∷ hvis FD (el. FE) modellen er korrekt og , bør være insign (den er taget højde for).

- (evt. same men I FE framework)


GLS ∷ OBS! FE-GLS og FD-GLS er asymptotisk ækvivalente

10.4.2 FE og RE – quasi time-demeaning

Det viser sig, at RE estimation svarer til at estimerer

- ∷ POLS
- ∷ FE
- for ∷ for store er RE ≅ FE
- for ∷ dominerer ⇒ brug FE
RE ∷ Hjælp til en estimator i nød
- Inkludér dummies for grupper der er meget ens, dvs. som har ens ’er.

10.4.3 Hausman: sammenligning af RE og FE

ULEMPER

9
1) Streng eksogenitet antages både under og
2) RE3 antages at holde under . Dvs. vi tester
a. (ellers får test.str. en skør asymptotisk fordeling)
IDE ∷ Det viser sig, at under RE.1-RE.3, er

Test-str. er:

- Sædvanlige estimetorer for bruges,


- MEN ∷ brug fra et framework, ikke fra hver sit – ellers risikeres, at den bliver ikke-pos.def.
1 VARIABEL

BEMÆRKNINGER
- kan klares @ aux regression af quasi time-demeaned (q.t.d.’ed) på q.t.d.’ed samt en alm. (FE-
style) time-demeaned (de tidsvarierende elementer i ).
- ⇒ kør så -test af koeff. på eller Wald
- … kan evt. gøres robust for RE3 i denne setting ∷ brug robust Wald.

11 More topics in linear unobserved effects

11.1 Oversigt

Antagelser Foretrukket model


RE ∷ udnytter både info within og between grupper

FE el. FD. ∷ udnytter kun within-group info.


Valg mellem FE/FD afh. af antagelser af tidsserieafh. i
(kun efficienshensyn)
predetermined ∷ brug IV/GMM
FD ligningen og brug laggede niveauer som instr.
Bruger within-group info
ÅRSAGER (alm.)
1) Udeladt tidsvarierende variabel
2) Simultanitet mellem og
3) Målefejl i
SKAL BRUGE ∷ instrument ukorr med og
→ nogle gange kan panel-aspektet bruges
- (transformer ⇒ fjerner ∷ brug så IV)

10
11.2 Sekventiel eksogenitet

ÆKVIVALENT (når modellen tages i betragtning):

- Når og er kontrolleret for, hjælper det ikke yderligere at kontrollere for fortiden af
- OBS! MILDERE antagelse end !
BEMÆRKNING
- Hvis , vil seq.exo. ⇒ dyn.compl.
- Seq.exo. ⇒ , .
FE OG FD ER INKONSISTENTE!
- FE ∷ Bias introduceres fordi fremtid er i tidsgns.
- fordi , så ⇒
- MEN ∷ hvis yderligere det antages at er weakly dep., er inkons af odten
- FD ∷ Bias fordi to på hinanden følgende perioder sættes sammen
- når vi kun har seq.exo.
- ⇒ OBS! Bias uaf. af (da på hinanden følgende perioder)

11.2.1 Instrumentering

FE ∷ kræver strengt eksogene instrumenter


FD ∷ kræver seq.exo. instrumenter.
MULIGE INSTR I FD


⇒ (alle) laggede niveauer (og funktioner heraf, fx Δ’er) (op til ) kan instrumentere
⇒ bl.a. instr for (husk, eneste problem er og .)
BEMÆRKNINGER
- lille ⇒ stor varians…
- Selvom instr. gyldige, er det ikke sikkert, at de er relevante.
AR(1) model ∷ indgår allerede som regressor
- Anderson & Hsiao (1982) ∷ foreslog eller som IV
- Arellano & Bond (1991) ∷ Bruge alle tilgængelige som IV @ GMM (ej muligt i 2SLS da #instr varierer
med )
- ≅ ⇒ er svage instrumenter.
- Blundell & Bond ⇒ antog trukket fra steady-state distr. ⇒ hjælper på efficiens, men realisme??
EFF.GMM @ alle instr’er

11
Nogle x’er str.exo., nogle seq.exo.
Eksempelvis , hvor seq.exo. og str.exo.
- Model: ↷ skriv op en ligning for
- → klart at .
- FD + IV ∷ FD ⇒ fjerner , men inducerer muligvis endogenitet hvis (dvs. når ej str., men kun
seq. exo)
- kan være sit eget instrument – brug ( ) som instr for ( ).

11.2.2 Contemporaneous korrelation mellem en x og u

3 mulige ophav:
1) Udeladte tidsvariante forklarende variable
2) Målefejl
3) Simultanitet
a. (kan alternativt løses ved at medtage en ligning for den simultane var’s bestemmelse)
FREMGANG
1) Transformér data (FE eller FD)
2) Brug IV af en art – hvilke instr’er afh. af anvendelsen.
FD bedre end FE
- FD er robust for mere generelle overtrædelser af str.exo end FE
- Vi kan teste for ser.korr. på Δ’et data
- Arellano & Bond (1991) foreslår GMM-baseret test for ser.korr. i .

Simultanitet
MULIGHED 1 ∷ LAGGEDE ’ER SOM INSTR’ER
OBS! og er korrelerede for alle , så kan kun estimeres med fordi

BEMÆRK ∷
- simultaniteten kommer nu ikke fra det, at vi lagger, men er med ”dobbelt” (hver gang og er
sammen)
ALTERNATIVT ∷
- lagget kunne bruges, men det kræver, at der ikke er seriel korrelation i
- (siden (i niveau) ikke indgår i ligning kan den måske bruges som IV → men formentligt SVAGT!)
MULIGHED 2 ∷ EKSTERNE INSTRUMENTER
FIND nogle eksterne instrumenter og kør POOLED 2SLS på

12
Udeladt tidsvariant variabel
FD (el. FE) ↷ efterfulgt af IV
Ikke altid oplagt smart bare at bruge laggede variable
⇒ find eksternt exo instrument

Målefejl
(I classical errors in variables under str.exo. ∷ FE forværrer målefejl)
Vi må finde et instrument udover de variable, vi har.
Hvis der er seriel korrelation i målefejlene, kan vi måske bruge som instr for .

11.3 Individual slopes

METODE ∷ FD for at slippe af med

HUSK ∷ FE var som at estimere model med individuelle intercepts


- hvis er ser.ukorr., homosked (betinet på ),
- ⇒ så er FE på Δ’et data konsistent & asym.normalfordelt (men ej asym efficient)

11.4 GMM tilgang


MOTIVATION ∷ hvad hvis (RE) eller ikke var konstant?
3SLS kan være bedre end alm. RE (mere fri )
Men bedste er fuld GMM / min- estimation med fuld frihed i vægtmatrix

11.5 Chamberlain’s tilgang


ANTAG
- Streng eksogenitet ∷ , (dvs. FE.1)
- indeholder kun tidsvarierende variable
MEN ∷ Tillad arbitrær korrelation mellem og .
IDE ∷ Erstatte med projektionen på ∷ Vi kan altid skrive

- Pr. konstruktion er , og ,
- MEN ∷ generelt!
INDSÆT

- FE.1 ⇒ og .
SYSTEM

13
System-OLS er konsistent under FE.1.
MULIGE ANTAGELSER
- ∷ system skalar-varians
- ∷ system homoskedasticitet
- Denne failer hvis
 1) ∷ ej homosked.
 2) ej lineær i ∷ forkert fkt. form for
 3) ej konstant ∷ ej homosked (??)
HVIS
- Begge opfyldt ⇒ SOLS efficient (??)
- Failer ⇒ FGLS kan bruges
- GMM er mest efficient med som instrument for hver tidsperiode og med den
optimale vægtmatrix.
- Test af over-ID ⇔ test af str.exo.

11.6 Specielle

11.6.1 Hausman-Taylor

FORMÅL ∷ identificere effekt af tidskonstante variable i tilstedeværelsen af


MODEL

ANTAG
1) ∷ str. exo
2)
BEMÆRK
- 1) giver, at FE kunne bruges ⇒ vi får så , men så ville -leddet gå ud.
IDE ∷ vi vil udnytte 2) samt at 1) medfører til at estimere . Omskriv



ANALOGIPRINCIPPET

14
… han viser det for en mere generel model
GIV (generalized IN) TANKEGANG
Bruge som instrumenter
- instrumenterer
- instrumenterer sig selv (de tidskonstante, som er ukorr. med )
- instrumenterer (de tidskonstante, som er korrelerede med )
TILGANGE ∷ i rækkefølge med stigende robusthed.
- 3SLS med på RE struktur
- 3SLS med urestrikteret
- GMM med efficient vægtmatrix

12 M-estimation

12.1 Setup

SPECIFIKATION

Karakteristik af fx , hvor .

hvor .
IDENTIFIKATION

- minimerer RHS hvis modellen er identificérbar.


- minimerer LHS pr. valg
- Hvis konvergensen er uniform, vil .

15
12.2 2-trins estimation
løser

Trin 1: Estimér ,
Trin 2: Estimér .
ØNSKE ∷ konsistent uanset, hvordan vi vælger .

12.3 Konsistens og asymptotisk normalitet


TEOREM 12.3:
Lad alt muligt gælde, da vil

hvor

Dermed er

12.4 Varians-estimation

12.4.1 Uden nuisance

estimeres altid på samme måde!

afh. af humør:
2 TILGANGE
1) Håndværkertilgangen ∷ udregn samt , indsæt og tag sample avg.
a. Altid mulig – men tung og måske ej pos.def.
2) Strukturel estimation ∷ givet (eller ),
a. Udnyt fx ∷ så
i. Udregn
ii. Udregn
iii. Udregn .
b. → smart hvis betingning på giver en simpel form (fx i probit bliver led = 0)

16
Analogiprincippet
Brug Analogiprincippet til at estimere

med

DVS ∷
1) Udregn lukket-form udtryk for og som funktion af og
a. Dvs. differentier to gange mht. .
2) Evaluér sample avg. af disse udtryk.
OVERVEJELSER
- NEGATIVT ∷ tung at regne, ej sikkert pos.def – men den er det hvis unikt løser sample problem.
- POSITIVT ∷ altid tilgængelig

Strukturel tilgang – evaluér forventninger


Givet en fordeling for , kan vi blot udregne direkte:
- som og som .
OVERVEJELSER
- NEGATIVT ∷ kræver streng antagelse om
- POSITIVT ∷ efficient!

Mellemting – antager kun fordeling for y givet x


Hvis vi ikke vil antage fordeling for hele , men måske kun for .
Definér


Så analogiprincippet motiverer

12.4.2 Var-est med nuisance

Vi kan altid bruge den generelle

Alternativt:

- hvor med .

17
- hvor ,
- hvor (og er en bøvlet, grim funktion, som formentlig skal tænkes på
som et slags generaliseret residual.

2-STEP M-ESTIMATOR VARIANSEN ER DA

BEMÆRKNINGER
- OBS! er lineært separable I den ”almindelige” effekt og ”nuisance” effekten ,
- MEN det er ikke! (den bliver interageret på kryds og tværs pga. ”^2”)
- MEN ∷ bemærk, at selvfølgelig indgår i .

12.5 Testning (§12.6)

12.5.1 Wald

Testes ved

hvor
- , kan vælges robust (når eller evt. højde for nuisance)
- Jacobi-matricen for ( )
(skal være invertibel)
ULEMPE
- Ikke skalainvariant ⇒ problem (primært/kun?) ved ikke-lineære hypoteser: man kan omformulere
indtil man får den ønskede konklusion.
FORDELE
- Estimerer kun den ”store” model
- Kan gøres vilkårligt robust

12.5.2 LM

IDE ∷ hvor langt er FOC fra at være opfyldt


OBS! Restrikterede model (” ”-modellen) skal være nested i en større model
SETUP
Imposer kontiniuert-differenntiable restriktioner på under
- Matematisk, restriktioner , så , hvor og
o Fx ∷ , hvor og sættes til konstanter fx
- Vi lader da og .

18
Hvis GIME (generalized information matrix equality, og )

1) (hvis opdeles i endo og exo ) ∷ Foretrukket hvor mulig (bedre small-sample)


2) Hesseform ∷ i) kan være neg hvis ’erne ej pos.def.; ii) tung at udregne; iii) ej invariant for
reparameteriseringer.
3) Outer product of the scores ∷ Simpel at udregne, men size distortions (typisk afvises for ofte)

FORDELE
- Estimerer kun den “lille” model.
- Med forventet hesse er den ofte invariant for reparameteriseringer.
ULEMPER
- …

12.5.3 Tests baseret på ændringer i objctive function (QLR)

ANTAG at GIME holder ∷ og

ULEMPER
- Forudsætter, at GIME holder og kan ikke gøres robust for dette.

12.6 Optimerinsgalgoritmer
MANGLER DETTE AFSNIIT‼

13 Maximum Likelihood estimation

13.1 Avar estimation


Definitioner:

(og hvor .)

19
Under regularitetsantagelser (bl.a. antagelse om korrekt specificeret model) holder teorem 13.2 (p. 395)

(fordi i ML sammenhænge)
- Dvs. i stedet for som i teorem 12.3.
Alle flg. 3 matricer konvergerer til den sande Avar (p. 396) ∷ baggrund: i ML

hvor , dvs. der betinges på (!).


1) Kræver beregning af de 2. afledte – ikke garanteret pos.def.
2) BHHH, måske dårlige egenskaber selv i relativt store sample sizes.
3) Lukket form! Kan evt. simuleres. Fordele:
a. Afhænger (typisk) kun af 1.-afledte af en eller funktion
b. Garanteret pos.def. når den findes (jf. CIME)
c. Bedre finite-sample props end BHHH
KOMMENTARER
- Bemærk, at i visse tilfælde er simpel selvom er bøvlet (fx probit, p. 396), idet der betinges på ,
så nogle led bliver nul i forventning.

13.2 Testning
OBS ∷ asymptotisk ækvivalente! Kun finite-sample overvejelser
Wald

LR
(Like-ratio – ala -test, mere kompleksitet skal dælme give mere forklaringskraft!)
Lad . Lad være estimatet når de restriktioner er pålagt og uden. Under er

LM
(hvor langt er hældning fra nul, dvs. hvor slemt overtrædes FOC?)
Lad være vektor af afledte af evalueret ved de restrikterede estimater.
Da vil

hvor avar-estimatoren kan vælges blandt de 3 nævnte


- … vælg ud fra small-sample eller beregninsgmæssige betænkeligheder.

13.3 Panel
Lad være den sande pdf. for givet .
BEMÆRK! Vi antager IKKE, at .

20
- (dvs. antager ikke )
Men vi antager, at er en korrekt specificeret pdf for for hver periode, , ”isoleret set”.
Smart teoretisk figumdik
Definér det partielle likelihood bidrag som

SMART ∷ Da er korrekt for alle , vil (unikt) maksimere for ethvert .


⇒ specielt vil den maksimere summen.

13.3.1 Unobs.eff. and strict exo

(han tillader, at kan være en vektor ( ))


2 possibilities
- I begge tilfælde antager vi, at fordelingen af er givet ved (korrekt spec)
1) Integrate out
∷ antag og er uafh. betinget på .
Da er den simultane tæthed for givet ved

Og log-like er

2) PMLE-agtig tilgang
Antager intet om fordelingen af (givet )
I stedet siger vi, at vi for hver enkelt kan få tætheden af

Nu vælger vi

hvilket er et slags PMLE problem

13.3.2 Lagget afh. var (y-var)

Ingen problemer når blot vi har specificeret dynamikken korrekt.


DYNAMIC COMPLETENESS er når distr. af betinget på hele fortiden er lig med distr af
når vi kun betinger på .
Hvis denne korrekt specificerede tæthed er , da er

21
Og vi kan igen integrere ud, dvs. vi skal lave
- INITIAL CONDITION PROBLEM ∷ skal håndteres
- LØSNING ∷ betinger på (/antager)

Her er betingningen på
KOMMENTARER
- Vi smider den første obs. væk.
- Alt. ku man ha fundet distr. for … meget svært!
- ASYM VAR ∷ justér for at tage højde for at begge params. estimeres.

13.4 Uncond. MLE (UMLE) vs. cond. MLE (CMLE)


Generelt er det muligt, at der i fordelingen af er information om , dvs. at .
I CMLE betiner man på og smider dermed al denne info væk
→ vi kalder det UMLE, når man ikke betinger på
HVORNÅR ER DE LIGE GODE?
Når , hvor ” ikke er en funktion af ”.

14 GMM

14.1 Efficiente instrumenter (§14.5.3, pp. 439-442)


Lad og . Da er det optimale valg

og med dette valg er det ikke nødvendigt at bruge en vægtmatrix i GMM.


Desuden opnår vi samme efficiens som CMLE.
PROBLEM
vil næsten aldrig være kendt ⇒ skal estimeres.
(desuden skal også estimeres)
- estimeres typisk ved at antage en art homosked.
- Til skal der typisk bruges ikke-param. metoder.

14.2 Classical Minimum Distance (CMD)


IDEA
SETUP
- Structural problem; estimate
- Reduced form;
-
- Function maps

22
METHOD
- Estimate
- Choose .

15 Discrete Response Models

15.1 Linear Probability Model (LPM) – problematisk


PROBLEMER
- Siden variansen for en Ber(p) variabel er , er der automatisk heteroskedasticitet, da
afh. af .
- … kan evt. løses vha. WLS
- Predikterede værdier uden for .
- … men evt. godt initialt estimat af .
KOMMENTARER
- Hvis dummies udgør en klassedeling, giver de bare gns. inden

15.2 Latent variabel model – probit og logit

KOMMENTARER
- SKALA IRRELEVANT ∷ (eller ) kunne være skaleret arbitrært
- Hvis fx , er
- ⇒ Derfor: normalisér med , for et valg af .
- Retningen af effekten fra på og er den samme ( monotont voksende)
Indekse

Fortolkning af ’erne

23
15.2.1 MLE (pp. 460-461)

Like bidrag

Log-like function
Det kan vises, at

og

Så .
KOMMENTARER
- Denne er invertibel så længe der ikke er perf.mult.kor.
- Muligt med Huber-White robuste s.e.’er ⇒ MEN ∷ hvis er misspec. så er også (ligger i
naturen af ML).
- (disse er , udregnet ved og .)

15.3 Tests i binary response index modeller


Muligt med Wald, LR og LM.

WALD ∷ problematisk når den store model er for stor ( har høj dim).
LR ∷ Kræver begge estimeret.
LM ∷ Smart hvis den store er bøvlet. Kan gøres som auxillary regression.
- Lad , , ,
- Da er fra reg af på og

HVIS ER IKKE-LINEÆR

- Wald foretrækkes,
- MEN ∷ ej invariant for reparameteriseringer

15.3.1 Hetsked

Her er modellen meget besværlig (LM foretrækkes)

så vi omskriver

LM test
- Bøvlet augmented regression ala alm. LM.
24
15.4 Reporting results
- Percent correctly predicted (#gange , hvor .))
- Pseudo , hvis log-like fra unrestricted, log-likelihood i model med kun intercept.

- Evaluere i gns. personen – dvs. hvor .


- Bemærk, så er ≅ , ≅ , ≅
- Smag og behag, hvordan dummies håndteres.
- Response probabilities ∷ in ved ≅ .
- std.fejl fås vha. Delta-metoden (2. ordens lokal Taylor) (se p. 467 for detaljer)

15.5 Random Utility Model

og så kan vi køre helt alm. probit på den med reglen: Vælg bil hvis .

15.6 Specification issues

15.6.1 Neglected heterogeneity (c udeladt)

Antag sande model er

Latent form ∷ , , .
- ( w/o loss of generality)

c og x uafh.
STÆRK antagelse
Antag , da er .
Attenuation bias:
PROBLEM
Ønsker ∷ Partial effect:

Men probit giver os


Probit kan ikke estimere partial effects evalueret ved konsistent
BONUS
Probit kan godt estimere de forventede (mht. ) partial effects (kaldet APE, avg. part.eff)

25
og

c og x ikke uafh.
Så er probit generelt inkonsistent

15.6.2 Endogen, kontinuert variabel

Antag

Mistænker . Skriv

- ⇒ ingen endogenitet

2-trins test for endogenitet (Rivers & Vuong, 1988)

Antag og

- Under bivariat , kan vi skrive . Da vil


- ⇒
Nu kan man vise, at

… (lang tung snak) …


METODE
MÅL ∷ APE’s ∷ dvs. afledte eller differenser af flg. udtryk

IDE ∷ får ved at reg på … så probit af på


1) Reg på ↷ .
2) Estimér
3) Probit på ↷ , ,
4) Udregn

som vil pga. samme argumenter som ved neglected heterogenitet


(mao. kan vi tænke på som vi gjorde med (? eller hvad?))
TEST
Hvis , er og spiller altså ikke ind i første ligning
⇒ dvs. ingen strenge antagelser på ’s fordeling kræves.
26
kan testes vha. ”den sædvanlige” (?) -test på , asym
→ dog skal std.fejl korrigeres for 2-step

Alternativ til Rivers & Vuong


(smartere, da R&V er en limited information procedure)

- normalisering ⇒ identifikation af discrete response


- ⇒ endo.
FREMGANG
Udnyt
Ad ∷ Antager ⇒
Ad ∷
-
- ⇒
- udregninger ⇔ ⇔
Ad

således at likelihood bidragene er

og

testes @ asymptotisk -test.

15.6.3 Når den endogene variabel er binær

KORT FORTALT
- Både varians af og må normaliseres for at få identifikation
- Kan ikke løse for → den må integreres ud
- er grim!
LANGT FORTALT

- kan fx være deltagelse i fx jobtræningsprogram.


(proceduren er sindssygt svær at læse sig til!)
Idéen er (vist), at genbruge tankegangen bag hvordan vi fandt . Denne gang bliver

27
Så skal vi tage forventningen og til det bruge tætheden af (inden i -integralet)
→ til det skal vi bruge, at er en trunkeret normalfordelt variabel, idet ⇔ :

Vi når frem til (bemærk, at spiller rollen af integrationsdummy)

Eksempel: College attendal and catholicism (Evans & Schwab, 1995)


- går man i college eller ej
- er man katolik eller ej
- Derved tillades at afhænge af uobserverbare faktorer.

15.6.4 Hetsked & ikke-normalitet

Hetsked
Antag i latent-variabel-formuleringen:

Non-normalitet
Så er inkonsistent
- Men hvis fx det er fordi logit er den sande model, kan godt være ret tæt på.

15.6.5 Manski’s maximum score estimator – estimation under svagere antagelser

Antag ,
(og bemærk, at )
- (fordi ⇒ (medianer kan ikke være kommatal)

Fordele:
- Robust: og må godt være afh. og er ikke restrikteret.
- Estimerer konsistent op til skala – god til fx
Ulemper:
- Konvergerer med rate (selvom Horowitz (1992) har en smoothed version med næsten .
- Vi kan ikke differentiere , så ingen partielle afledte.
- Nogle gange har modsat indflydelse på og .
28
15.7 Panel data / cluster samples
Med LPM modeller kan man evt. bruge FE, FD eller RE.
→ men stadig ikke attraktiv for binær-respons data.

15.7.1 Pooled estimation

Model:

PMLE-estimation (partial MLE) ≅ pooled

- er konsistent uden videre antagelser.


- Brug robust var-est, , hvor .
- , hvor er Jacobian af (§12.6.1)

-
DYNAMIC COMPLETENESS

⇒ alm. inferens
- OBS! Betyder ikke tidsuafhængighed – må fx godt indeholde laggede variable.
- Betyder blot, at , .
- ⇒ sample kan ses som en stort cross-section af str.
TEST for dyn.compl.
- Lag.dep.var ∷ Estimér den potentielt syge,
- Estimér ,
(OBS! man må droppe tidsperioder – ellers som ej findes.)

15.7.2 Unobserved effects probit

ANTAGELSE

- Dvs. er strengt eksogen betinget på (specielt indeholder nok lags osv, altsådyn.compl.)
- BERTEL’s noter ∷ ingen lagged dep.vars siden ville være perf. korr. med dem (?!?!?!)
MULIGE METODER
- Fixed effects ∷ fjern ved transformation
- SVÆRT pga. ikke-linearitet
- Proxy for (når interesse er i APE)
- Pooled analyse (når interesse er i APE)
- Estimér ∷ Fixed effects probit (dumt navn!)
- Åndssvagt! Ser som parameter ⇒ #params → ∞ for .
29
- Diskussion: man betragter som ikke-tilfældig… modsat hvad vi vil gøre!
- Traditional random effects probit
- ANTAGELSER
 1) Streng exo ∷
 2) Uafh., (betinget på )
 ⇒
 3)
 ⇒ &&
- METODE ∷ integrér ud af !



 Max log-like mht. og ‼
- HURRA ∷ både (part.eff. ved ) og (APE) kan godt estimeres!
 Men hvorfor kan de pludselig det her når de ikke kunne i alm. unobs.eff.??
INDSKUD ∷ integration
Numerisk @ quadrature
Simulation @ int ≅ tage forventning
1) Træk std.normaler ↷
2) Beregn
3) Beregn for hver
4) Tag gns. og logs,
5)

SVAGERE ANTAGELSER
- Generalized estimating equations
- Response prob. specificeres kun betinget på , ikke .
- Kræver specifikation af ( ), men robust for fejlspec af denne.
- CMLE @ Fuld korrelation
- , hvor , hvor tillades fuld frihed i off-diagonal (og 1’er i
diagonalen)
- Slem curse of dim!
 Men, Keane (1993, in press) har simulationsmetoder
- Chamberlain’s random effects probit
- MÅL ∷ tillade sammenhæng
- METODE ∷ specificere betinged for med konstant varians.
- Antag , .
 Error form ∷ .
 Restriktiv, men tillader dog noget samspil (modsat trad.REprobit)
- Indsæt i ligning:
30
- INTUITION ∷ Tilføjer tids-gns som kontrolvariabel ∷ partial eff. af når tidsgennemsnittet
holdes fast! ⇒ måde at kontrollere for uobserverede personspecifikke effekter
- Udvidelse ∷ Tillade tidsafh. i
 muligt at droppe antagelsen ⇒ så skal inferens dog gøres robust for
arbitrær seriel korrelation.
 Så kan vi dog kun finde APE’s ved at integrere ud (hvilket i praksis kommer ud på at
”integrere” ud (dvs. average den ud, da den observeres)

BEMÆRKNINGER
Hidtidige udledninger ∷ afhænger kritisk af, at er strictly exogenous conditional on .
→ dvs. fx ingen lags af dep.var. !
- TEST for streng exo ∷ add bare nogle lags og se om de bliver sign.

15.7.3 Logit: unobs eff og streng exo (FE logit, skodnavn)

NEDERN ∷ ik muligt at specificere tæthed for så vi (nemt) kan integrere mht. den.
OPTUR ∷ muligt med FE/FD-agtig approach! → viser sig at falder ud når vi betinger på
- svedig feature ved logit-formen gør det muligt at få en funktionel form, der ik afhænger
Log-like i tilfældet:

- hvor hvis og hvis .


- OBS! Kun observationer, hvor bidrager, dvs. obs. hvor eller i begge år duer
ikke.
NAVN ∷ fixed effects logit ⇒ SKODNAVN, intet at gøre med FE probit, som ser som paramter.
FORDEL
- ∷ effekten på log-odd ratio, idet; .
ULEMPER
- Kan ikke estimere partial effects medmindre vi indsætter en værdi for
- Men hvilken værdi skal vi vælge? Ingen restriktioner, ikke engang !
- APE’s kan heller ik findes når vi ik har nogen antagelser om distr for
- Forudsætter

15.7.4 Dynamic unobs.eff (state dependence)

Grundlæggende model

BEMÆRK
- ∷ dvs. antager str.exo
- Tidl. outcome må godt påvirke response prob)
INTERESSE ∷ State-dependence efter der er kontrolleret for ∷ .
JOINT PROB
31
INITIAL CONDITIONS PROBLEM ∷ hvad når vi når til ? modelleres ikke!
4 muligheder
1) Se som ikke-stokastisk
a. Streng antagelse ∷ medfører bl.a.
2) Specificere tæthed for , dernæst for
a. Svært at vælge tæthed. Førende eksempel .
3) Approksimere tæthed for , dernæst for (Heckman, 1981)
a. Fx lade følge probit med resp.prob.
4) Betinge på , dernæst specificere
a. kan fx vælges som Chamberlain, ,

b. I PRAKSIS
i. Alm. Chamberlain probit, hvor og tilføjes i alle tidsperioder
c. APE’s mv. ∷ tag MLE params og multiplicér med ( -subscript viser
dette). Std.fejl. fås vha. bootstrapping el.lign.

15.7.5 Andet

Semiparametriske metoder
- Fx Manski for brugt på differenser
Cluster samples
- Pooled probit/logit ∷ brug dog de robuste varians-estimatorer.

15.8 Multinomial response

15.8.1 Multinomial logit

Kategorier , dvs. styk.

Hvor og (samme ’er i hver kategori – bare med forskellig param)

32
RESULTATER
Partielle effekter har en meget besværlig form, men odds bliver pæne:

LIKELIHOOD

15.8.2 Probabilistic choice models:

Primarily, we’ll look at conditional logit, but conditional probit is a nice extension (although it has some
computational issues)

Conditional logit
Derived from underlying utility-maximization model

ANTAG ∷ TypeI Extreme Value


REMARKS
- Elements of differ between alternatives
- can’t contain elements that don’t vary across alternatives!
- Dvs. ikke udd, erfaring, men ok med pris på o.lign. karakteristika for
- ⇒ håndterer en helt anden type data – valg af alternativ skal afhænge af karakteristika ved
netop .

RESULTATER

BEGRÆNSNINGER
Independence of Irrelevant Alternatives

- Dvs. relative odds mellem og afhænger kun af karakteristika for og


- → så hvis kun er . Hvis skal være
konstant, dvs. , hvilket er urealistisk.

LØSNINGER
33
1) Multinomial probit (= conditional probit)
a. I tillades , hvor kovarianser er urestrikterede.
b. MEN ∷ besværlig beregning (inkl. -dim integral)
c. Dog: simulationsmetoder
2) Hierakiske modeller ∷ fx nested logit model
a. Idé ∷ indfør 2 lag ∷ først vælger man mellem grupper, derefter vælger man inden for de enktelte
grupper (betinget på at vælge gruppe , er der conditional logit blandt alternativer i den gruppe.

15.9 Ordered response – ordered logit/probit


Valg har ordinal, men ikke kardinal nytte (2 er bedre end 1, men ikke nødv. halvt så meget som 4)

Del op

Response probs:

INTET INTERCEPT i ∷ ’erne spiller rolle af intercept (for er interceptet)


Loglike

(og vælg som sædvanligt med .


RESULTATER

Ellers ∷ Evaluér ved referenceperson / rapporter % korrekt predikteret


BEMÆRKNINGER
- Hverken eller har separat betydning.
- Vælg i stedet for ⇒ ordered logit
- Valg kan tillægges tal, fx ”hvor mange % sætter du i aktier, 25%, 50% eller 75%?”
- ⇒ ingen betydning for estimation, men giver mening til .
- UOBS.EFF ∷ (dvs. ) ∷ @ Chamberlain tilgang (antag+approx pdf for og integrér ud)
INTERVAL-KODET DATA
Samme idé, men teknisk bøvl
OBS! Nu giver faktisk mening, og har fortolkning som om det var OLS!

34
16 Censored regressions and corner solution models
2 typer
1) Censored data
a. Observerer
2) Corner solutions
a.

16.1 Tobit

ANTAG ∷
- ⇒ .

16.1.1 Estimation

TÆTHED ∷ ens for

Cond.log.like

INFERENS
- Alm. MLE
- Wolle giver første/anden afledte

16.1.2 Quantities of interest

Afh. af model:
- Censoring ∷ den latente variable; , eller
- Corner solution ∷ den faktiske variable,
UDLEDNING
-
- fordi , , så
-

- Derfor

35
PARTIAL EFFECTS

BEMÆRK‼
- De part.eff.’s er bare skaleringer af ’erne
- (specielt, skaleret med -variable ⇒ vi forventer )
Fra NOTERNE:

RESULTATER
- CENSORING ∷ husk, er interessen ⇒ rapportér
- CORNER ∷ vis .

16.2 Neglected heterogeneity (§16.6.1)


KONKLUSION
CENSORING ∷ intet problem, tobit konsistent for (?? p530??)
CORNER ∷ måske, vil vi have eller ?
- LØSNING ⇒ integrér ud.

ANTAG ∷
PROBLEM ∷ skal håndteres eksplicit
LØSNING ∷ integrér ud, dvs.
ANTAG ∷ har pdf.

- Så er og
- EKS

- Diskret:

36
- Kont: , ⇒ pga. .
 ⇒ &

16.3 Endogenous
Som for discrete choice
⇒ må antage mere struktur ∷ den endogene, , antages

⇒ antag så ⇒ vi kan erstatte , hvor

- Tobit ∷ 2-step (Smith-Blundell) ∷ estimér reduceret form for endogene ved OLS ↷ inkludér
residualer (dvs. tobit af på )
- Som for probit
- Std.fejl skal korrigeres
- MEN ∷ estimeres ikke (relevant for CORNER når man estimerer APEs)
- Fuld MLE ∷ specificér simultane fordeling af de endogene vha.
- Indsætter direkte og estimerer den samtidig @ ML
TEST ∷ i begge settings testes (eller efter parameterisering) via alm. -test.
- DOG ∷ ML en del tungere beregningsmæssigt ↷ estimér Smith-Blundell først og test endo i den.

16.4 Hetsked & ikke-normalitet


ALVORLIGE KONSEKVENSER
Inkonsistens (da ML afh. af fuld fordeling)
OBS! Modsat alm. OLS, hvor kun kræves for konsistens
TEST
Hetsked @ LM (score) tilgang → så estimerer vi den almindelige Tobit som nested i en mere generel model
- I generel model: specificér hetsked
Non-normalitet ∷ svær – noget med probit

16.5 Estimation under svagere antagelser

16.5.1 Powel estimatoren

POINTE ∷ slippe for at antage .

ANTAG ∷
- Dvs. ingen pdf / uafh. antagelser
ESTIMATION
LAD (least absolute deviations)

M-ESTIMATION

37
- er kontinuert ⇒ konsistens følger af 12.2
- MEN ∷ ikke differentiabel ⇒ kan ikke bruge 12.3
- Powel viser dog -asymptotisk normalitet.
RESULTATER
Censored:
- , HVIS ’s fordeling er symmetrisk omkring 0
Corner solution:
- Ingen af de ønskede  kræver antagelser om fordeling
- MEN ∷ specifikationstest for Tobit modellen
PROBLEMER
Criterion function er diskontinuert ved :

- Desuden ∷ .

- (generelt for LAD)


Alternativt – ILPA (iterative linear programming algorithm)
- Estimér median-reg på fuldt sample ⇒ fjern ⇒ estimér med-reg ⇒ fjern ⇒…
- Hvis konvergens er der gevinst.

16.5.2 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff.

IDE ∷ I Tobit er ” ” og ” ” den samme


⇒ måske forskellig virkning på den intensive vs. den ekstensive margin.
⇒ Hurdle / two-tier models ∷ hurdle’n eller tier #1 er, om man skal vælge eller . Tier #2 er hvor
stor skal vælges.
MODEL
- , og .

16.6 Tobit for panel

16.6.1 Sml. med alm. tobit

ANTAG ∷
Tobit på cross-section med obs.
38
Inferens @ robuste estimatorer; , med potentielt
- Fordi og , så afhænger af corr.
mellem og .
- , hvor vælges som enten , (bedst hvis
tilgængelig) eller
- er den simpleste for .
POSITIVT
- Kræver ikke streng exo af
- Antager , men ikke
- Laggede i er ok
- Seriel korr. i er ok
- Ingen antagelser om , kun
Laggede dep.vars. er bøvlede at inkludere ( observeres kun delvist)
YDERLIGERE ANTAGELSE
- Dynamic completeness ∷ .
- OBS! dyn.compl antagelse om uafh.!
- MEN ⇒ netop den antagelse, der giver, at alm. inferens duer
- TEST ∷ medtag flg. 2 vars i alm. Tobit ∷ og ↷ test samtidig

16.6.2 Tobit med unobserved effects

ANTAG ∷
- ⇒ streng exo, ,
MULIGHEDER
1) Estimér ⇒ incidental parameters
2) Antag ⇒ Random Effects tobit; Chamberlain-tilgang
3) Eliminér ved transformation @ Honoré (1992)

Random effects tobit – antag pdf for c

ANTAG
- ⇒ ⇒ , dvs. streng eksogenitet‼‼ (udelukker noget fra )
- Og (eller følger det af ovenstående?)
- ,
- og
- dvs.

- Bemærk, , så er for

39
IDENTIFICEREDE params ∷
PRAKSIS
- Alm. tobit, hvor medtages i hver periode (evt. kan bruges for at blive mere generel,
men det er tungere beregning)
- ⇒ identifikation hvis der er tidsvariation i .
RESULTATER ∷ CENSORED
- Tilføjelsen af har løst alle problemer ( er nemlig identificeret)
RESULTATER ∷ CORNER
- Vi kan tage differenser / se på ∂ ved ( ) evalueret ved fx .
- APE’s kan estimeres jf. wolle
VIDERE
- Muligt at relaxe
- Muligt at udvide Powel til dette setting.

16.6.3 Dynamic unobserved effects tobit

DUER KUN (/bedst) FOR CORNER!

ANTAG ∷
- Dvs. streng exo af
BEMÆRK
- Corner ∷ afhænger af, om eller 1.
- Censored ∷ giver bedre mening at inkludere ⇒ bøvlet som bar fuck!

Problem: initial conditions


IDE ∷ antag fordeling for betinget på og (wow, hele !)
PRAKSIS
- Kør bare random effects tobit med regressorne: og inkluderet i hver periode.
MODEL

17 Sample selection attrition and stratified sampling

17.1 Sample selection


ÅRSAGER til ikke-tilfældig sampling:
40
- Selektion på forklarende variabel ∷ fx kun 30-50-årige
- Truncation ∷ selektion på forklaret variabel ∷ fx ser kun om folk har job for folk, der har et job
- Adfærd ∷
a. Non-response
b. Attrition (dropper ud over tid – ikke problem i register-data)
c. Ser kun løn for dem, der vælger at tage arbejde
i. Anden variabel forklarer mangel – Heckman selection kan løse dette.

17.2 Simpel model

Del datasættet op
- ∷ kun observeres
- ∷ bade og observeres.
MÅL
VISE ∷ .
- Så snart denne betingelse holder er pooled OLS ok
- … hvis ikke må vi benytte andre krumspring (antage mere struktur)
- OBS! Konklusionen gælder også for NLS!
- CMLE ∷ hvis vil MLE på det selekterede sample være konsistent.

ANVENDELSER (eksempler)
MULIGHEDER for selektion
1. er en (deterministisk) function af alene ∷
a. ⇒ ingen problemer, da uanset
b. (vi betiner en gang for meget)
2. er uafh. af og
a. ⇒ ingen problemer! Så ”indeholder ingen yderligere info om nogen aspekter af fordelingen af
, specielt ikke den betingede forventning”. Dvs.
b. ⇒
3. (truncation)
a. Antag fordeling af og brug truncated Tobit
b. ⇒ så kan vi udlede og bruge CMLE.
4. (disrete response selection)
a. Tillader afh. mellem og ∷ påvirker selection, men kun påvirker .
b. Det viser sig, at ∷
c. HECKMAN 2-step ∷
i. 1) estimér probit af på ↷ (på fuldt sample),
ii. 2) OLS af på og (på det selekterede sample)

41
5. and (Tobit selection – e.g. hours worked)
a. Implicerer mere struktur
b. 2-step
i. 1) Estimér censoreret Tobit af på ↷ residualer
ii. 2) OLS af på og for de selekterede (dvs. med )

17.2.1 ML i sample selection – PMLE

Strukturel model ∷
Selektionsmodel ∷
UDNYT (hvor )

17.2.2 Sammenligning: ML vs. Heckit

FORDELE ∷ PMLE > Heckit


- Robust var-estimator ( ) er valid – ingen generated-regressor problem
a. (dvs. konsistente varians-estimater – altså spg. ved inferens i Heckit))
ULEMPER ∷ PMLE < Heckit
- Stærke antagelser ∷ (men de kan testes vha. moment-tests)
- Numerisk tung

17.2.3 Ad 2SLS på selekteret data

TEOREM 17.1
model , instrumenter
Random sampling ∷ nok at antage og estimere med 2SLS på med instr .
Selection @ ∷
- ANTAG ∷ ,
- ⇒ 2SLS af på med isntr , hvor kun det selekterede sample bruges vil give konsistente estimater.

17.2.4 Ad 3: Truncation (selektion på y)

Selektionsligning

ANTAG ∷ fordeling for er kendt, dvs. en pdf og cdf er givet.


IDE ∷ ⇒ så kan vi finde ssh. for

da ingen andre led afh. af .


42
TRUNCATED TOBIT
Fås ved at vælge .
SAMMENLIGNING
- FORSKEL ∷ i censored observeres også når censoreres, i truncated censoreres både og .
- LIGHED ∷ Hetsked / non-normalitet ⇒ inkonsistens

17.2.5 Probit selektion – exogene variable (Heckit)

bestemmes af en probit model.


CENTRALT ∷ ”the coding rule” er ikke kendt – i modsætning til top coding (hvor når ).
IDE ∷ antager parametrisk form for .

ANTAG
1) observeres altid. observeres når .
2) med .
- Mildere end , som er et specialtilfælde.
3)
- ok da ikke observeres.
4)
- Ville følge hvis .
ESTIMATIONSLIGNING
Pga. selektion kan vi kun håbe på at estimere og , men se, at

Dvs. vi mangler som regressor


MEN ∷ observeres ikke
LØSNING ∷ udtrykke ∷ udnyt at

- da det er en truncated normal ↷ inversel Mill’s ratio



OBS! Inkons af OLS skyldes omitted variable ∷
PROCEDURE (Heckit)
a) Få ∷ Estimér probit af på .
b) Estimér OLS af på med det selekterede sample.
- ⇒ konsistens og -asymptotisk normalitet
TEST

- Testes @ std. -værdi da ⇒ alm. OLS asymptotik holder selvom en var. for meget tages med
BEMÆRKNINGER
- Bøvlet at finde varians når
43
- Stadig konsistent når (samme regressorer for og
- → MEN ∷ noisy ∷ id’es kun pga. ikke-linearitet i .
UDVIDELSE
- Hvis antages kan PMLE bruges (lang, grim …)
- → udnytter igen Bayes til at opskrive betinget på ud fra ssh. for givet over ssh. for generelt:

17.2.6 Probit selektion – endogene variable

ANTAG
1) observeres altid, observeres kun når .
2)
3) (skala arbitrær da )
4)
5) og i ligning 2 er hvor .

BEMÆRKNINGER
- OBS! Vi skal have vars i som bestemmer selektion og den endo (relevans), men ikke (exo)
- Ala alm. endo problem, men vi må antage struktur på den endo, .
- Arbitrær korrelation tillades mellem .
UDLEDNING
TRICK:

Her er pr. konstruktion


⇒ teorem 17.1 ∷ konsistent at bruges 2SLS af på .
PROBLEM ∷ mangler
PROCEDURE
1) Estimér konsistent ved probit af på (fuldt sample). Udregn .
2) Estimér 2SLS af på med instr (for sig selv) (for ) og (for sig selv) på selekteret
sample).
TEST

BEMÆRKNINGER
- kan være diskret.
- Eks. ∷ . Idé til instr: hvis man blev indstillet tilfældigt (men stadig
forsk. ssh. for at deltage på bgg. af )
- exo men manglende somme tider (non-response) ⇒ modellen duer stadig, skal instrumenteres.
44
- Mindst 2 vars i skal bruges – tænk: én til og én til at identificere selektion ( ).
- (hvis ingen ekstra til selektion, vil id af køre på ikke-lin. af alene.
- Hvis vi antager , kan vi bruge PMLE.

Hvis y1 i stedet var binær

ANTAG ∷ (en masse) +

PROCEDURE
1) Estimér ved probit af på (for hele sample)
2) Indsæt i (jf. §probit)

17.2.7 Tobit med eksogene forklarende vars

MOTIVATION ∷ separat variation i ⇔ vi kan sige ”hvor langt” man er fra selektion ⇒ mere efficient
EKSEMPEL ∷ timeløn, #timer arbejdet p.a.

ANTAG
1) observeres altid, observeres kun når .
2)
3) (skala ej arbitrær da observeres!)
4)
BEMÆRKNINGER
- Som for probit
- Tænk selektion: .
UDLEDNING

IDÉ ∷ hvis observeres ⇒ kør OLS på selekteret sample


MEN ∷ kan estimeres konsistent for de med , som netop er de selekterede ⇒
for selekteret.
PROCEDURE
1) Estimér ved tobit af på for hele samplet. Udregn .
2) Estimér ved OLS af på .

BEMÆRKNINER
- Efficiency gain ∷ intuitivt klart, vi kan se, hvor langt folk er fra de-selektion.
- OK med MODSAT probit! → @ nu har vi separat variation i .
- PMLE mulig @ ANTAG ∷
-
45
- hvor er og er den sædvanlige
.

17.2.8 Tobit med endogene forklarende vars

ANTAG
1) observeres altid, observeres kun når .
2)
3) (skala arbitrær da )
4)
5) og i ligning 2 er hvor .
UDLEDNING (som for probit med endo)

- her er pr. konstruktion ⇒ 2SLS på selekteret sample er ok, hvis kan medtages ⇒ estimér
@ Tobit.
PROCEDURE
1) Estimér ved Tobit af på . Udregn for selekterede .
2) Estimér ved 2SLS af på og vha. instr (for sig selv), (for ), (for sig selv) på
selekterede sample

BEMÆRKNINGER
- kan være kont. eller diskret.

17.3 Paneldata: Sample selection


Overordnet set: Attrition / selection i paneldata kan ske for 3 grunde
1. Tilfældigt (”rotation”) ⇒ nemt at håndtere
2. Folk vælger at droppe ud (attrition)
3. Incidental truncation (fx arbejdsløshed

17.3.1 Fixed effects på ubalancerede paneler

RESULTAT
- hvis kan vi ”uden videre” bruge formlerne med OLS på transformeret data, hvis vi
bare også ganger på hver gang (fx )
MODEL

ANTAG
1) (⇐ )
2) er invertibel (alm. rank-condition)
46
3) (⇒ alm. FE inferens holder)
BEMÆRK
- RE analyse kræver
ESTIMATION
- Definér

BEMÆRKNINGER
- FE kan kun bruge .
- Almindelig robust FE-varians kan bruges
- Tilladt at danne et balanceret subsample og estimere på det, fx vælge med .
- VIGTIGT! Vi kunne lige så godt have brugt FD metoder.

17.3.2 Test / korrektion for sample selection bias

Procedure (Nijman & Verbeek, 1992)


1) Estimér FE af på og på det ubalancerede sample.
2) , testes @ alm. -teststørrelse

Incidental truncation under H0: ingen selektionsbias


BEMÆRK ∷ en enkelt var observeres ikke i nogle perioder
IDÉ
- Chamberlain-inspireret ∷ tillader .
- Antager lineær struktur
- (alternativt bare lade tidsgennemsnittet for afgøre ∷ , hvilket sparer på
parametrene)
MODEL

PROCEDURE
1) Probit på (eller ) – fuldt sample. Udregn (eller .
2) FE af på og – selekteret sample. @ alm. OLS.

Incidental truncation under HA: selektionsbias


ANTAG ∷
1)
47
2)
PROCEDURE
1) Probit på for hvert og gem for alle .
2) Pooled OLS på det selekterde sample af på .
BRUG robuste var-estimatorer

Incidental truncation Tobit selektionsligning


Hvis selektion i stedet sker på baggrund af hvor kan vi mere
Samme procedure som oven for virker, men med erstattet med osv.
I Tobit frameworket kan vi også tillade, at indeholder .
- INTUITION ∷ følger af, at så vil for alle (og vi betinger jo hele tiden på ).

17.3.3 Attrition – man vælger at udgå af sample

ANTAG ∷ ingen ”re-entry” ∷ attrition er en absorbing state.


MODEL

IDE ∷ sekventiel natur, ⇒ ↷ brug FD

og skriv (reduceret form) ligningen for selektion betinget på selektion i forrige periode

- fx kan indeholde og (ikke da den står på LHS for forrige periode ⇒ corr med
).
ANTAG
- ⇒
- (hvor ⇒ så vi ikke behøver betinge på det yderligere)
PROCEDURE
1) Probit på ↷ ↷
2) Pooled OLS af på , . Tests er ikke længere oplagt simple (robusthed
kræves).
PROBLEMER
- Antagelsen udelukker at kan påvirke attrition (efter betingning på ) – tænk: ingen samtidig
påvirkning fra til når der er kontrolleret for .
- antages at være strengt eksogen.
LØSNING ∷ IV
- Instrument , hvor (dvs. redundant i selektionsligningen) og er eksogen i modelligningen
- Step 2 i procedure: Lav 2SLS i stedet og instrumentér med (som fx kan være ).

17.3.4 Inverse probability weighting (IPW)

MÅL ∷ Generelisere metoder til ikke-lineær estimation (M-estimation)


ANTAG
48

- Kaldes selection on observables eller ignorability of selection.
PROCEDURE
1) Probit på ↷ gem de fittede sandsynligheder; .
2) M-estimation på selekteret sample (dvs. gang med ), hvor målfunktionen vægtes med , dvs.

INTUITION
- Regularitet giver, at kan erstattes med når vi udregner asymptotik (antages ).

UDVIDELSE
- hvis attrition probit’en ændrer sig over tid??
- ⇒ bølvet at håndtere…

17.4 Non-parametric bounds


LOWER BOUND
-
UPPER BOUND
-
REMARKS
- Bounds are tight when ≅ .
- Intuition ∷ the more observations that are censored, the bigger the problem!
- (knew this already;)

18 Treatment effects
OVERORDNET ∷ ønsker at estimere og .
TILGANGE
1) Ignorability of treatment (ATE.1 og ATE.1’) ∷ regression, matching, weighting estimatorer (og evt.
mixed, som vi ikke ser på)
2) Regression discontinuity design
3) Panel data: difference in differences (og before-after)
4) IV

49
18.1 Noten
- Internal validity ∷ hvilken effekt havde jobtræninsprogrammet ⇒ ønsker vi
- External validity ∷ hvilken effekt vil et hypotetisk program have ⇒ kan vi ikke få
Average treatment effect
- On the ∷ treated ∷ untreated ∷ overall
RUBIN’S CAUSAL MODEL
- outcome w/ treatment, outcome without (cont. or discount.)
- if treated, else .
- iid.

MISSING DATA ∷ only or is observed:

MULIGE ANTAGELSER
- ⇒ og
- Så er .
- OBS! Uafh. ⇒ vi kan fjerne betingning ∷ generelt er , men vi kan bare
kun udregne fordi missing data gør, at vi kun har når .
- ⇒ .

18.1.1 Nonparam id – ignorability of treatment

ATE1: betinget på er
ATE1’: a) og b) .
(selection on observables)
- ⇒ når er partialled out, vil de tilbageværende faktorer, der påvirker være uafh. af de tilbageværende,
som påvirker .
ATE’ ⇒ .
COMMON SUPPORT
- dvs. vi skal se single-mødre i begge grupper (treatment og non-treatment)

18.1.2 Regressions and switching models

- Tænk ∷ person-specifik gevinst ved programmet, så betyder, at


dem i programmet har særlige gevinster.
SWITCHING
ANTAG ∷
KAN VISE ∷ , hvor . Desuden (evt ik-lineær)
50
ANTAG ∷ OG samt

- ANTAG VIDERE ⇔ ”⇔”

PROCEDURE
- Reg på ∷ koeff. til er .
-
- (s.e.’s på denne via bootstraps eller Δ-metoden.

18.1.3 Regression discontinuity

Average treatment effect at ∷ .


Vi definerer
ANTAG
- ATE.1 (ignorability of treatment) ∷ betinget på er uafhængig af .
- og er kontinuerte i (dvs. gevinsten er kont. i – er ikke!)
Under kontinuitet er avg. treatment effect at .
ESTIMATION
- INTUITION ∷ gns. for dem, som lige akkurat blev treated MINUS gns. for dem som lige
akkurat ikke blev treated

BEMÆRK
- Vi får blot en lokal gns. treatment effekt lige ved cutoff niveauet
- Hvis treatment effekten er heterogen er den ikke lig med hverken eller !

18.1.4 Before-after

Diff estimator
IDE ∷ sammenligne individ med sig selv!
OBS! Kræver paneldata og kan kun estimere (avg.treat.of.treated)
ANTAG
-
ESTIMATION ∷
- FØRST ∷ diff-estimator

- dvs. vi estimerer på det treatede sample og tjekker forskellen på og givet at man på et tidspunkt
bliver treated.
51
MEN ∷ hvad med generel tids-trend? ⇒ motiverer diff-in-diff

Diff-in-diff
ANTAG
-
(dvs. at den gns. udvikling over tid er den samme i de to grupper ⇔ samme tids-trend)
SÅ ER

ESTIMATION ∷ overraskende nemt i regressions-framework


ANTAG ∷ .
- Indfør controls

- FUCK! Hvis folk selekterer ind i programmet er … AHA! BRUG FD!

PROCEDURE
- Regressér på , hvor er koefficienten til .
BEMÆRKNINGER
- Bygger på antagelsen om, at randomisering holder i FD
- Antagelsen tillader selektion på unobservables, men kun hvis de er tidsinvariante
- Dvs. fx ikke Ashenfelter’s dip ∷ discouraged worker lige før treatment.

18.1.5 Selection and treatment effects

OPSPALTNING af det ”observerede” gain

- Selection bias = ability bias i labour econ


- Sorting bias = selection on the gain, “forhåbentlig” treates dem med størst potential gevinst.
- Når der er både selection og sorting bias: essential heterogeneity
TIDLIGERE ∷ Diff-in-diff eneste estimator, der tillod

18.1.6 Estimation af ATE ved IV under antagelse af homogen treatment effect

ANTAG
- ATE.2 ∷
a)
b)
c)

52
FORKLARINGER
- a) ⇒ , idet vi kan skrive
- b) ≅ exclusion restriction, i.e. spiller ingen rolle i ligningen for . Desuden b) ⇒ .
Dermed kan vi skrive ligningen for som

MEN ∷ og kan godt være korrelerede‼ ⇒ endogenitetsproblem

Procedure 1: Alm. IV
Instrumentér med og med sig selv.

Procedure 2: IV med propensity score


Hvis vi er villige til at gøre yderligere antagelser, kan vi få en mere efficient procedure
Erstat c) med ∷ og og yderligere d)
1) estimér (tænk ), fx med probit (som funktion af og )
2) instrumenter med i stedet for

18.1.7 Heterogene treatment effects (v0 ≠ v1)

ANTAG

PROCEDURE
1) Estimér i med MLE og få (fx probit / logit)
2) Estimér ved 2SLS med instr

18.1.8 LATE (local average treatment effects)

CHANGE MINDSET ∷ nu to typer treatment!


- Vi trækker for alle individer ⇒ smider én af ’erne væk ⇒ smider én af ’erne væk.
- PRAKSIS ∷ TÆNK vi observerer kun , men ønsker at tænke det sådan, at der kunne have
været et andet udfald, hvis havde været på en anden måde.
- ∷ hvis , observerer vi , hvis observerer vi .


ANTAG
-
- (monotonicitet)
53
(…)

ESTIMATION
- , hvor er sample avg. af over .
- IV reg på med som IV for ⇒ koeff. til .
FORTOLKNING
- gns. treatment effekt på dem, som ville participate hvis blev ændret fra 0 til 1.
BEMÆRK
- defineres ud fra variationen i
- Modsat og , som defineres ud fra forhold i populationen
- Vi kan ikke observere populationen med (dvs. hvor og missing) (lige så vel som
vi ikke observerer ’erne for de treatede)
- Modsat er forventning over den treatede del af populationen, som vi kan finde eksplicit.
- GENERELT ∷ .
- HVIS forudsiger perfekt hvem, der bliver treated, og hvis dem, der bliver treated også er dem,
der har størst gain, vil .
- HVIS , vil .

18.1.9 Essential heterogeneity and IV (sorting on the gain)

Essential heterogeneity ⇔ der er bade sorting og selection.


→ her: en model hvor der er sorting på gains!
MODEL

- Her (må)
- Definer

- (bemærk ligheden til .)


DET GIVER INGEN MENING‼
INGEN OVERHOVEDET‼

18.1.10 Sammenhæng med den simple sample selection model

ANTAG ATE.4

54
a) for
b) for
c)
d) , hvor
e) og , hvor så
SÅ KAN VI SKRIVE
- fx
- … og endelig

PROCEDURE
1) Probit af på , dvs. . Få

2) Regresser @ POLS ∷ på

Sammenligning med IV tilgangen


IV ∷ 1) estimér 2) kør 2SLS med inkluderet som regressor.
- ANTAGER at ∷ restriktivt
DENNE ∷ 1) estimér 2) reg pooled OLS med de genererede regressorer
- Tillader comparative advantage structure samt hierarkisk struktur – sandsynligt.

18.2 Ikke-parametrisk tilgang


- ⇒ – begge estimeres som avg. effekt i sub-sample bestående af de treatede
Mindre struktur ∷ antage mean independence ∷ dvs. nok at tage hensyn til (⇐ fx )
- Faktisk, ⇒ (men )
MODELTANKEGANG

SÅ ER

- dvs. er lig den generelle plus den forventede individuelle gevinst ved at blive treated (
er lig den individspecifikke gevinst ved treatment)
- Bemærk ∷ kræver flere antagelser (typisk) end .

18.3 Mere parametrisk tilgang


ANTAG
- ATE.1 ∷ og er uafhængige når vi har betinget på
- ATE.1’ ∷ (a) (b)
RESULTAT

SMART ∷ Definér
55
Så er

og samt er sådan set det, vi har i vores datasæt!


→ dermed er identificeret for .
→ vi kan estimere den ikke-parametrisk!
ESTIMATER

PROBLEM ∷ std.fejl skal fås fra de evt. non-param ’er ⇒ men muligt @ bootstrap / Δ-metoden.

18.3.1 Switching regression

Vi kan som nævnt altid tænke

så indsat i definitionen giver det

som vi tænker på som en reg model


ANTAG ∷
- ATE.1’ ∷ for .
-
⇒ så er (fik vi allerede tidligere) og endvidere er

- med og
- TÆNK ∷ er et fejlled, som vi har antaget betinget middelværdi nul for.
EKSEMPEL
- Vælg (eller for lidt mere generelitet)

18.3.2 Svagere antagelser – to ukendte g-funktioner

ANTAG
- ATE.1’
⇒ så er

- hvor , og .
KONKLUSION ∷ ATE.1’ alene giver os to ting:

56
1) er en funktion af og og (en funktion af ), dvs.
2) er additiv i
PROBLEM – Saturated model
- Hvis ’erne vælges for komplekse får vi problemer (ikke datatæthed alle vegne)

For at komme videre: antag form for g0 og g1


ANTAG
- ATE.1’
- for .
⇒ så er

- hvor
ESTIMATION
- OLS af på
RESULTATER

- (husk nemlig at uden antagelser er )

18.3.3 Regression disc. designs

Hvis og hvis har en diskontinuitet, kan det udnyttes


- ofte vil fx , eksempelvis briller gives til børn med dårligere syn end ± 2
⇒ sammenligne personer med næsten samme ’er, men hvor én treates og én ikke gør.

18.4 Propensity score


Ved at fokusere på (i regression eller mere ”ikke-parametrisk”), kan man opnå konsistente estimater af
og
→ MEN ∷ der gemmer sig nogle ret tunge antagelser under.

18.4.1 ATE skrevet som funktion af p, som estimeres med probit

ANTAG
- ATE.1’
- (mao. antag og )
SÅ ER

IDE ∷ kan fås fra probit

57
PROCEDURE
1) Estimér ∷ fx vha. logit/probit med en Sieve funktionaf inden i
2) Tag sample equivallent af og

- (hvor .)
BEMÆRKNINGER
- Logit/probit sikrer, at , men måske maskerer det bare det mulige sample problem, at der findes
så …
- Det hele kommer til at hvile på, hvordan man estimerer .

18.4.2 Regressér y på w og p-hat

Simpel idé: tilføj som regressor, dvs. sæt ” ”


- regressér på
MOTIVATION
- Som før… hvis vi tillader , kan vi opskrive det som en regression
ANTAG
- ATE.1’
- er ukorreleret med
SÅ GIVER regressionen -asymptotisk normalt estimat af (koeff. til ).
PROCEDURE
- Estimér ∷ fx med probit.
- Tilføj som regressor, dvs. regressér på
BEMÆRKNINGER
- Man kan også køre regression en på , men så skal man i stedet antage, at
er lineær i for .

18.5 Matching
ANTAG
-
-
Så kan vi estimere

BEMÆRKNINGER

58
- Matching estimatorer “balancerer” samplet så det ligner, at kovariaterne kommer fra mere “iid-agtige”
processer.
- Tillader heterogene responses – ikke-parametrisk tilgang ⇒ ingen restriktioner på respons.
- Bedre -estimator ∷ ikke bare bruge de nærmeste, men alle naboer vægtet efter deres “afstand” i .

18.6 IV-metoder
Skriv ligningen som

TILLADER
- tillades at være endogen
- (⇒ OBS! i alm. 2SLS er der ingen yderligere betænkninger ved at instrumentere en dummy!)
BEMÆRK
- Hvis , er generelt
- (dvs. hvis og har samme stokastiske led, så vil interaktionsleddet med gå ud, og
afhænger altså ikke af (svarende til, at essentielt set))
HVIS ∷ instrument ukorr. med sammensatte fejlled ⇒ potentielt muligt at instrumentere
ANTAG ATE.2 ∷ ortogonal eligibility
- og en mildere version af og mere
SÅ ⇒ direkte estimation kører og vi kan skrive

- og
- TÆNK ∷ eligibility uafh. af observables, fx Angrist’s lotteri for værnepligt: lotterinummer (højt
⇒ nok ind og springe, men nogen slap && tilfældigt)
ANTAG ATE.2’ ∷ IDÉ: er det optimale instrument for
- og (fx probit) og mere
PROCEDURE
1) Estimér ved MLE (fx probit).
2) Estimér , dvs. på og med instrumenter og .
BEMÆRK ∷ bygger vigtigt på antagelsen om, at er korrekt specificeret!
MERE STRUKTUR
- Skriv , hvor altså for
ANTAG ATE.3 ∷
- ATE.2 … og…
- for
- (evt. nok med .)
Da bliver og

PROBLEM ∷ og korrelerer måske… og måske gør en af regressorne


LØSNING ∷ IV
PROCEDURE
59
1) Estimér ud fra (probit)
2) OLS af ovenstående ligning, på med instr .
BEMÆRK ∷
- er crucial!
ANTAG ATE.4 ∷
- … en masse plus
PROCEDURE
1) Estimér og .
2) OLS på med instr (dvs. for , alt andet for sig
selv).
ANTAG ATE.4’
- Som ovenstående, men OG
PROCEDURE
1) Estimér og .
2) OLS uden IV på .

60

You might also like