Samlede eksamensnoter

Indhold
10 Basic linear unobserved effects................................................................................................................. 5 Random effects ................................................................................................................................. 5 Test for unobserved effects .......................................................................................................... 6 Fixed effects ..................................................................................................................................... 6 Inferens ......................................................................................................................................... 7 FD metoder ....................................................................................................................................... 8 Inferens ......................................................................................................................................... 8 Sammenligning ................................................................................................................................. 9 FE vs. FD ...................................................................................................................................... 9 FE og RE – quasi time-demeaning ............................................................................................... 9 Hausman: sammenligning af RE og FE ....................................................................................... 9 10.1 10.1.1 10.2 10.2.1 10.3 10.3.1 10.4 10.4.1 10.4.2 10.4.3 11

More topics in linear unobserved effects ................................................................................................ 10 Oversigt .......................................................................................................................................... 10 Sekventiel eksogenitet .................................................................................................................... 11 Instrumentering .......................................................................................................................... 11 Contemporaneous korrelation mellem en x og u ........................................................................ 12 Individual slopes ............................................................................................................................. 13 GMM tilgang .................................................................................................................................. 13 Chamberlain’s tilgang..................................................................................................................... 13 Specielle ......................................................................................................................................... 14 Hausman-Taylor ......................................................................................................................... 14

11.1 11.2 11.2.1 11.2.2 11.3 11.4 11.5 11.6 11.6.1 12

M-estimation ........................................................................................................................................... 15 Setup ............................................................................................................................................... 15 2-trins estimation ............................................................................................................................ 16 Konsistens og asymptotisk normalitet ............................................................................................ 16 Varians-estimation .......................................................................................................................... 16 Uden nuisance ............................................................................................................................ 16 Var-est med nuisance.................................................................................................................. 17 1

12.1 12.2 12.3 12.4 12.4.1 12.4.2

12.5 12.5.1 12.5.2 12.5.3 12.6 13

Testning (§12.6).............................................................................................................................. 18 Wald ........................................................................................................................................... 18 LM .............................................................................................................................................. 18 Tests baseret på ændringer i objctive function (QLR)................................................................ 19 Optimerinsgalgoritmer .................................................................................................................... 19

Maximum Likelihood estimation ............................................................................................................ 19 Avar estimation............................................................................................................................... 19 Testning .......................................................................................................................................... 20 Panel ............................................................................................................................................... 20 Unobs.eff. and strict exo ............................................................................................................. 21 Lagget afh. var (y-var) ................................................................................................................ 21 Uncond. MLE (UMLE) vs. cond. MLE (CMLE) ........................................................................... 22

13.1 13.2 13.3 13.3.1 13.3.2 13.4 14

GMM ...................................................................................................................................................... 22 Efficiente instrumenter (§14.5.3, pp. 439-442)............................................................................... 22 Classical Minimum Distance (CMD) ............................................................................................. 22

14.1 14.2 15

Discrete Response Models ...................................................................................................................... 23 Linear Probability Model (LPM) – problematisk ........................................................................... 23 Latent variabel model – probit og logit .......................................................................................... 23 MLE (pp. 460-461)..................................................................................................................... 24 Tests i binary response index modeller........................................................................................... 24 Hetsked ....................................................................................................................................... 24 Reporting results ............................................................................................................................. 25 Random Utility Model .................................................................................................................... 25 Specification issues......................................................................................................................... 25 Neglected heterogeneity (c udeladt) ........................................................................................... 25 Endogen, kontinuert variabel...................................................................................................... 26 Når den endogene variabel er binær ........................................................................................... 27 Hetsked & ikke-normalitet ......................................................................................................... 28 Manski’s maximum score estimator – estimation under svagere antagelser .............................. 28 Panel data / cluster samples ............................................................................................................ 29 Pooled estimation ....................................................................................................................... 29 Unobserved effects probit........................................................................................................... 29 2

15.1 15.2 15.2.1 15.3 15.3.1 15.4 15.5 15.6 15.6.1 15.6.2 15.6.3 15.6.4 15.6.5 15.7 15.7.1 15.7.2

15.7.3 15.7.4 15.7.5 15.8 15.8.1 15.8.2 15.9 16

Logit: unobs eff og streng exo (FE logit, skodnavn) .................................................................. 31 Dynamic unobs.eff (state dependence)....................................................................................... 31 Andet .......................................................................................................................................... 32 Multinomial response ..................................................................................................................... 32 Multinomial logit ........................................................................................................................ 32 Probabilistic choice models: ....................................................................................................... 33 Ordered response – ordered logit/probit ......................................................................................... 34

Censored regressions and corner solution models .................................................................................. 35 Tobit ............................................................................................................................................... 35 Estimation ................................................................................................................................... 35 Quantities of interest................................................................................................................... 35 Neglected heterogeneity (§16.6.1) .................................................................................................. 36 Endogenous .................................................................................................................................... 37 Hetsked & ikke-normalitet ............................................................................................................. 37 Estimation under svagere antagelser............................................................................................... 37 Powel estimatoren ...................................................................................................................... 37 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff............................................... 38 Tobit for panel ................................................................................................................................ 38 Sml. med alm. tobit .................................................................................................................... 38 Tobit med unobserved effects..................................................................................................... 39 Dynamic unobserved effects tobit .............................................................................................. 40

16.1 16.1.1 16.1.2 16.2 16.3 16.4 16.5 16.5.1 16.5.2 16.6 16.6.1 16.6.2 16.6.3 17

Sample selection attrition and stratified sampling .................................................................................. 40 Sample selection ............................................................................................................................. 40 Simpel model .................................................................................................................................. 41 ML i sample selection – PMLE .................................................................................................. 42 Sammenligning: ML vs. Heckit.................................................................................................. 42 Ad 2SLS på selekteret data......................................................................................................... 42 Ad 3: Truncation (selektion på y) ............................................................................................... 42 Probit selektion – exogene variable (Heckit).............................................................................. 43 Probit selektion – endogene variable .......................................................................................... 44 Tobit med eksogene forklarende vars ......................................................................................... 45 Tobit med endogene forklarende vars ........................................................................................ 46 3

17.1 17.2 17.2.1 17.2.2 17.2.3 17.2.4 17.2.5 17.2.6 17.2.7 17.2.8

.... 48 Inverse probability weighting (IPW) ...............1.........................................................................6 18.... 48 Non-parametric bounds ..........................................9 18.................................1.........................4 18 Paneldata: Sample selection .1...................................................4................................................1 18................................................................................................................................................................................... 50 Regressions and switching models .3............ 55 Switching regression ...............2 18..........1........................................................................................................................................................................................... 54 18..........3.....................4 18...1............................................................................................................................................................................... som estimeres med probit.................... 59 4 .................4 18. 51 Selection and treatment effects ......1......... 58 Matching ............... 52 Estimation af ATE ved IV under antagelse af homogen treatment effect ....... 57 Propensity score .... 50 Nonparam id – ignorability of treatment .2 17........................... 53 Essential heterogeneity and IV (sorting on the gain)................................2 18............................................. 56 Regression disc................................................... 57 Regressér y på w og p-hat .................................................................................................................. 46 Fixed effects på ubalancerede paneler ..............................................................................................................................1 18..1............8 18......3 17..................................................1.............................. 58 IV-metoder.........................1............. 55 Mere parametrisk tilgang ..................................3 17.........................................................................................................................1 18..................................................6 Ikke-parametrisk tilgang ............................. 47 Attrition – man vælger at udgå af sample....................................2 18......................................................................................................10 18......... 51 Before-after .............2 18............................................................ 46 Test / korrektion for sample selection bias ...4...................................3..7 18........................4 17..........................17............ designs .........3 18.....................1 17............... 49 Treatment effects ................................................................. 52 Heterogene treatment effects (v0 ≠ v1) ...........................3..........................3......................................5 18................................................................................................................ 56 Svagere antagelser – to ukendte g-funktioner ..........................................................................3 18...........................3..................... 53 LATE (local average treatment effects) .................. 49 Noten ..1................................................................................................3.......................................................... 57 ATE skrevet som funktion af p.........................1 18.............................3 18... 50 Regression discontinuity ............ 54 Sammenhæng med den simple sample selection model ......................5 18...............................

er without loss of generality når der er intercept. konstruktion FREMGANG – 2 spørgsmål 1) Er korreleret med for noget ? 2) Holder streng eksogenitet (betinget på )? NAVNGIVNING Random Effects ∷ Fixed Effects ∷ . . .10 Basic linear unobserved effects CROSS-SECTION ∷ Løsninger på uobserveret heterogenitet. b. ækvivalent med streng exo ⇔ BEMÆRK -lags ⇒ streng exo kan aldrig holde ∷ ⇒ . b.1 Random effects IDE ∷ udnytte ser. 2) Rank ∷ . i ANTAG 1) Ortogonalitet a. i composite error term pr.korr. Tilstrækkeligt for konsistens ∷ ii. . i.Indikator-IV PANEL Antager er tidskonstant BEMÆRK ∷ ⇒ tidskonstante ’er kan ikke identificeres separat fra .IV (2SLS) . Da er ESTIMATION Alm.→ desuden giver -lags ser. .Proxy . Antager balanceret panel – ubalancerede håndteres senere. hvor For efficiens ANTAG YDERLIGERE 3) Efficiens af RE a. 10. EKSOGENITET Hvis vi kun betinger på ’er ∷ ⇒ dvs. FGLS varians 5 til at lave GLS .korr.

.X) 1) a. hvis muligt F-TEST Brug 10.2 Fixed effects ⇔ ANTAG (FE.korr. 2) 3) OBS! FE1 + FE2 ⇒ unbiasedness ESTIMATION (kun nødv. dvs. AR(1)-test. tænk 6 . ⇒ . Evt.1 fra modellen til at udregne både og (selvfølgelig). … brug dog robust varians. dvs.1.korr. i ? . c. OBS! ⇒ b.hvor Første trin baseres på pooled OLS. men bedre at teste direkte på ) PROBLEM ∷ hvad er LØSNING ∷ streng eksogenitet giver FORDEL ∷ opdager mange typer ser. specielt ⇒ . Test for unobserved effects IDE ∷ svarer til at teste (hvilket svarer til at teste ser. for efficiens af FE) OBS! ⇒ streng eksogenitet. i ULEMPE ∷ streng exo ⇒ må ikke indeholde laggede ’er! 10.

PRAKSIS Premultiply med eye(T) – T^-1 * ones(T. FJERN FE. 10.dvs. robuste variansestimator og test som er robust for heteroskedasticitet og seriel korrelation i ⇒ kan bruges til at lave Wald-tests.T). LSDSV for alle ⇒ incidental parameters problem.1 Inferens INFERENS ⇒ PAS PÅ! fås ved først at beregne .2.3. ⇒ muligt at lave en GLS analyse 7 . at Problem ∷ serielkorrelation under Løsning ∷ brug flg. Fixed Effects GLS ANTAG . pr. og så udnytte . Men betydningen svinder som ∷ PROBLEM ∷ FE-transformationen introducerer serielkorrelation i MEN ∷ det bliver et mindre problem (??) Robust varians og seriel korr i idiosynkratiske fejl Seriel korr i ? ∷ reg på for alle Problem ∷ vi har ikke ⇒ vi kan udnytte. NAVNE Within ⇔ within each cross-section ⇒ HER Between ⇔ between each cross section Viser sig ∷ FE = Least Squares Dummy Variable Estimator ∷ → svarer til at estimere MEN ∷ stor ⇒ på dummies for personer. Da er fordi (unbiased). konstruktion . giver idé om fordelingen af heterogeniteten i populationen.

hvis ortogonaliteten overholdes (dvs. AR(1) ⇒ Generelt: policy implementation Faktisk er ortogonalitetsbetingelsen jo ⇒ dvs. kan FE godt være konsistent selvom POLS / RE ikke er det. . b. inefficient ellers. i nogle situationer. c.3‼ FD.1-3 er alm.1 Inferens OBS! Ikke nødvendigt at tænke så meget som i FE – alm. tænk . kun af . inferens valid under POLS på Δ’et data! 10.3 ⇒ ) (kun nødv. bare være ukorr. ikk invertibel! og drop så en tidsperiode (fx den ’te) fra datasættet. Fx BFN (1982) antager stabil.3. at LØSNING ∷ Drop en tidsperiode og lav GLS 1) Estimér 2) Estimér 3) Estimér ALTERNATIV Man kan specificere en eller anden struktur på MEN ∷ efficient hvis korrekt. 2) 3) a.Vi mister én periode! Alle ’er skal variere over . som bliver deterministisk når 8 . (FE. hvor deltagelse ⇒ i et program er betinget af karakteristika før programmet . med før vi får konsistens! Egentlig skal .Under FD. dvs. bare ikke hvornår??) 10. VIGTIGT .1 Evt.3 ⇒ BEMÆRK . hvor MODSÆTNING til FE. OBS! ⇒ streng eksogenitet. (huskeregel: I FD har vi af 2 stok var ⇒ selv stok var ⇒ alle antagelser laves på den. hvis det var givet at man ville deltage.PROBLEM ∷ det viser sig. som har rang på kun !! Dvs. . og udlede en stuktur på afh. I FE har vi stok ) var minus noget.3 FD metoder ANTAG 1) a. b. for efficiens af FD) random walk Som FE. inferens @ POLS på Δ’et data er valid. homoskedastisk.

simultanitet) ⇒ både FE & FD inkons med hver sin plim! TEST ∷ STRENG EXO IDE ∷ hvis FD (el. af antagelser om OBS! Endogenitet (målefejl.udeladte. 10. bør være insign (den er taget højde for). autokorr med .2 FE og RE – quasi time-demeaning Det viser sig. som har ens ’er. tidsvar.4. GLS ∷ OBS! FE-GLS og FD-GLS er asymptotisk ækvivalente 10. Hausman: sammenligning af RE og FE ULEMPER 9 .4.4.3 ∷ POLS ∷ FE for for ∷ for store ∷ er RE ≅ FE dominerer ⇒ brug FE RE ∷ Hjælp til en estimator i nød Inkludér dummies for grupper der er meget ens. -test af OBS! ukorrelerede ⇒ .1 FE vs. same men I FE framework) . at RE estimation svarer til at estimerer 10. FE) modellen er korrekt og (evt.SERIEL KORR i Kør reg → alm. FD ⇒ FE = FD valget afh.4 Sammenligning 10. dvs.

ikke fra hver sit – ellers risikeres. vi tester a.d. at den bliver ikke-pos.1 Oversigt Antagelser Foretrukket model RE ∷ udnytter både info within og between grupper FE el.’ed) style) time-demeaned (de tidsvarierende elementer i eller Wald ). Bruger within-group info ÅRSAGER (alm. fra et framework. er: - Sædvanlige estimetorer for MEN ∷ brug bruges.1) Streng eksogenitet antages både under og 2) RE3 antages at holde under .t.’ed samt en alm.def. FD.1-RE.t.d. ∷ udnytter kun within-group info.str. i (kun efficienshensyn) predetermined ∷ brug IV/GMM FD ligningen og brug laggede niveauer som instr. Dvs. Valg mellem FE/FD afh. (ellers får test. (FE- … kan evt. 11 More topics in linear unobserved effects 11. 1 VARIABEL BEMÆRKNINGER kan klares @ aux regression af quasi time-demeaned (q. af antagelser af tidsserieafh.3. ⇒ kør så -test af koeff. på på q. en skør asymptotisk fordeling) IDE ∷ Det viser sig. at under RE. gøres robust for RE3 i denne setting ∷ brug robust Wald. er Test-str.) 1) Udeladt tidsvarierende variabel 2) Simultanitet mellem og 3) Målefejl i SKAL BRUGE ∷ instrument ukorr med → nogle gange kan panel-aspektet bruges 10 (transformer ⇒ fjerner og ∷ brug så IV) .

exo.Hvis . men realisme?? . instr for (husk.. er inkons af odten MEN ∷ hvis yderligere det antages at FD ∷ Bias fordi to på hinanden følgende perioder sættes sammen når vi kun har seq.1 ⇒ OBS! Bias uaf. ⇒ dyn. indgår allerede som regressor eller som IV Anderson & Hsiao (1982) ∷ foreslog med ) ≅ ⇒ er svage instrumenter. vil seq. fx Δ’er) (op til ⇒ bl. af fordi . .a. trukket fra steady-state distr.exo.Blundell & Bond ⇒ antog EFF.) AR(1) model ∷ Arellano & Bond (1991) ∷ Bruge alle tilgængelige som IV @ GMM (ej muligt i 2SLS da #instr varierer 11 . så ⇒ er weakly dep.exo.compl.2. 11. FE OG FD ER INKONSISTENTE! FE ∷ Bias introduceres fordi fremtid er i tidsgns. er det ikke sikkert. at de er relevante.GMM @ alle instr’er ) kan instrumentere . ⇒ . (da på hinanden følgende perioder) Instrumentering FE ∷ kræver strengt eksogene instrumenter FD ∷ kræver seq.2 Sekventiel eksogenitet ÆKVIVALENT (når modellen tages i betragtning): Når og er kontrolleret for. ⇒ hjælper på efficiens. gyldige. instrumenter. MULIGE INSTR I FD ⇒ ⇒ ⇒ (alle) laggede niveauer (og funktioner heraf.exo.11. eneste problem er og BEMÆRKNINGER lille ⇒ stor varians… Selvom instr. hjælper det ikke yderligere at kontrollere for fortiden af ! OBS! MILDERE antagelse end BEMÆRKNING . Seq.

exo) 11. af anvendelsen. men det kræver. og str.2 . .korr. FD bedre end FE ..exo end FE .exo. men er med ”dobbelt” (hver gang sammen) lagget (siden kunne bruges. ↷ skriv op en ligning for . kan være sit eget instrument – brug ) som instr for Contemporaneous korrelation mellem en x og u 3 mulige ophav: 1) Udeladte tidsvariante forklarende variable 2) Målefejl 3) Simultanitet a. på Δ’et data Arellano & Bond (1991) foreslår GMM-baseret test for ser. nogle seq.exo. at vi lagger.Vi kan teste for ser.FD er robust for mere generelle overtrædelser af str. Simultanitet MULIGHED 1 ∷ LAGGEDE OBS! og ’ER SOM INSTR’ER kan kun estimeres med fordi er korrelerede for alle .korr.exo.exo.2. hvor seq. men kun ). i . Eksempelvis Model: → klart at FD + IV ∷ FD ⇒ fjerner seq..Nogle x’er str. så BEMÆRK ∷ simultaniteten kommer nu ikke fra det. (kan alternativt løses ved at medtage en ligning for den simultane var’s bestemmelse) FREMGANG 1) Transformér data (FE eller FD) 2) Brug IV af en art – hvilke instr’er afh. men inducerer muligvis endogenitet hvis ( (dvs. når ( ej str. at der ikke er seriel korrelation i (i niveau) ikke indgår i ligning kan den måske bruges som IV → men formentligt SVAGT!) og er ALTERNATIVT ∷ - MULIGHED 2 ∷ EKSTERNE INSTRUMENTER FIND nogle eksterne instrumenter og kør POOLED 2SLS på 12 .

MEN ∷ INDSÆT . .FE.1) MEN ∷ Tillad arbitrær korrelation mellem IDE ∷ Erstatte - Pr.normalfordelt (men ej asym efficient) 11. med projektionen på .4 GMM tilgang MOTIVATION ∷ hvad hvis 3SLS kan være bedre end alm. konstruktion er .3 Individual slopes METODE ∷ FD for at slippe af med HUSK ∷ FE var som at estimere model med individuelle intercepts hvis er ser.Udeladt tidsvariant variabel FD (el. FE. RE (mere fri ) Men bedste er fuld GMM / minestimation med fuld frihed i vægtmatrix (RE) eller ikke var konstant? 11.1 ⇒ SYSTEM og . 11. homosked (betinet på ). FE) ↷ efterfulgt af IV Ikke altid oplagt smart bare at bruge laggede variable ⇒ find eksternt exo instrument Målefejl (I classical errors in variables under str.exo.5 Chamberlain’s tilgang ANTAG Streng eksogenitet ∷ indeholder kun tidsvarierende variable og . 13 . (dvs. og generelt! ∷ Vi kan altid skrive . ⇒ så er FE på Δ’et data konsistent & asym. vi har. ∷ FE forværrer målefejl) Vi må finde et instrument udover de variable.. kan vi måske bruge som instr for .ukorr. Hvis der er seriel korrelation i målefejlene.

som instrument for hver tidsperiode og med den 1) 2) 3) ej lineær i ej konstant ∷ ∷ system skalar-varians ∷ system homoskedasticitet Denne failer hvis ∷ ej homosked. at FE kunne bruges ⇒ vi får så . MULIGE ANTAGELSER    HVIS Begge opfyldt ⇒ SOLS efficient (??) Failer ⇒ FGLS kan bruges GMM er mest efficient med optimale vægtmatrix. form for ej homosked (??) 11.System-OLS er konsistent under FE. exo 14 . ∷ forkert fkt.6.Test af over-ID ⇔ test af str.1. men så ville -leddet gå ud.exo. Omskriv ∷ str. IDE ∷ vi vil udnytte 2) samt at 1) medfører ⇒ ⇒ ⇔ ANALOGIPRINCIPPET til at estimere .6 Specielle 11. .1 Hausman-Taylor FORMÅL ∷ identificere effekt af tidskonstante variable i tilstedeværelsen af MODEL ANTAG 1) 2) BEMÆRK 1) giver.

1 Setup SPECIFIKATION Karakteristik af fx . - minimerer RHS hvis modellen er identificérbar. vil . på RE struktur 3SLS med urestrikteret GMM med efficient vægtmatrix 12 M-estimation 12. hvor IDENTIFIKATION . valg Hvis konvergensen er uniform.… han viser det for en mere generel model GIV (generalized IN) TANKEGANG Bruge som instrumenter instrumenterer instrumenterer sig selv (de tidskonstante. hvor . minimerer LHS pr. som er ukorr. som er korrelerede med ) TILGANGE ∷ i rækkefølge med stigende robusthed. 15 . med ) instrumenterer 3SLS med (de tidskonstante.

ØNSKE ∷ konsistent uanset. 12. hvordan vi vælger .1 Uden nuisance estimeres altid på samme måde! afh. Altid mulig – men tung og måske ej pos.4. Udregn b. 16 .3: Lad alt muligt gælde.2 2-trins estimation løser Trin 1: Estimér . ∷ så . 2) Strukturel estimation ∷ givet Udnyt fx i. giver en simpel form (fx i probit bliver led = 0) samt (eller ). Udregn ii. da vil hvor Dermed er 12. Trin 2: Estimér .12. → smart hvis betingning på .4 Varians-estimation 12. indsæt og tag sample avg. af humør: 2 TILGANGE 1) Håndværkertilgangen ∷ udregn a. a.def.3 Konsistens og asymptotisk normalitet TEOREM 12. Udregn iii.

Analogiprincippet Brug Analogiprincippet til at estimere med

DVS ∷ 1) Udregn lukket-form udtryk for og som funktion af og a. Dvs. differentier to gange mht. . 2) Evaluér sample avg. af disse udtryk. OVERVEJELSER NEGATIVT ∷ tung at regne, ej sikkert pos.def – men den er det hvis POSITIVT ∷ altid tilgængelig unikt løser sample problem.

Strukturel tilgang – evaluér forventninger Givet en fordeling for OVERVEJELSER NEGATIVT ∷ kræver streng antagelse om POSITIVT ∷ efficient! , kan vi blot udregne direkte: som og som .

Mellemting – antager kun fordeling for y givet x Hvis vi ikke vil antage fordeling for hele Definér

, men måske kun for

.

⇒ Så analogiprincippet motiverer

12.4.2

Var-est med nuisance

Vi kan altid bruge den generelle

Alternativt:

-

hvor

med

. 17

-

hvor hvor (og som et slags generaliseret residual.

, er en bøvlet, grim funktion, som formentlig skal tænkes på

2-STEP M-ESTIMATOR VARIANSEN ER DA BEMÆRKNINGER OBS! er lineært separable I den ”almindelige” effekt og ”nuisance” effekten ikke! (den bliver interageret på kryds og tværs pga. ”^2”) selvfølgelig indgår i . , MEN det er

MEN ∷ bemærk, at

12.5 Testning (§12.6)
12.5.1 Wald

Testes ved

hvor ULEMPE Ikke skalainvariant ⇒ problem (primært/kun?) ved ikke-lineære hypoteser: man kan omformulere indtil man får den ønskede konklusion. FORDELE - Estimerer kun den ”store” model - Kan gøres vilkårligt robust 12.5.2 LM , kan vælges robust (når Jacobi-matricen for (skal være invertibel) ( ) eller evt. højde for nuisance)

IDE ∷ hvor langt er FOC fra at være opfyldt OBS! Restrikterede model (” ”-modellen) skal være nested i en større model SETUP Imposer o kontiniuert-differenntiable restriktioner på , så , hvor og og . Fx ∷ under , hvor sættes til konstanter fx og Matematisk, restriktioner Vi lader da

18

Hvis GIME (generalized information matrix equality,

og

)

1)

(hvis reparameteriseringer.

opdeles i endo

og exo ) ∷ Foretrukket hvor mulig (bedre small-sample) ’erne ej pos.def.; ii) tung at udregne; iii) ej invariant for for ofte)

2) Hesseform ∷ i) kan være neg hvis

3) Outer product of the scores ∷ Simpel at udregne, men size distortions (typisk afvises FORDELE - Estimerer kun den “lille” model. - Med forventet hesse er den ofte invariant for reparameteriseringer. ULEMPER - … 12.5.3 Tests baseret på ændringer i objctive function (QLR) og

ANTAG at GIME holder ∷

ULEMPER - Forudsætter, at GIME holder og kan ikke gøres robust for dette.

12.6 Optimerinsgalgoritmer
MANGLER DETTE AFSNIIT‼

13 Maximum Likelihood estimation
13.1 Avar estimation
Definitioner:

(og hvor

.) 19

Under er hvor avar-estimatoren kan vælges blandt de 3 nævnte . der betinges på (!). 3 matricer konvergerer til den sande Avar (p. 2) BHHH.3. .… vælg ud fra small-sample eller beregninsgmæssige betænkeligheder. hvor slemt overtrædes FOC?) Lad Da vil være vektor af afledte af evalueret ved de restrikterede estimater. Fordele: a. afledte – ikke garanteret pos. Bedre finite-sample props end BHHH KOMMENTARER . .Under regularitetsantagelser (bl.-afledte af en eller funktion b. 3) Lukket form! Kan evt. CIME) c. simuleres. 13. dvs.def.def. at 20 givet .Bemærk. 1) Kræver beregning af de 2. når den findes (jf. 395) (fordi Dvs.2 (p. dvs. . måske dårlige egenskaber selv i relativt store sample sizes. Garanteret pos. idet der betinges på så nogle led bliver nul i forventning. Lad være estimatet når de restriktioner er pålagt og uden. i ML sammenhænge) i stedet for som i teorem 12. p.3 Panel Lad være den sande pdf.2 Testning OBS ∷ asymptotisk ækvivalente! Kun finite-sample overvejelser Wald LR (Like-ratio – ala -test. antagelse om korrekt specificeret model) holder teorem 13. 396). 396) ∷ baggrund: hvor . Afhænger (typisk) kun af 1.a. . mere kompleksitet skal dælme give mere forklaringskraft!) Lad LM (hvor langt er hældning fra nul. 13. at i visse tilfælde er simpel selvom er bøvlet (fx probit. i ML Alle flg. for BEMÆRK! Vi antager IKKE.

2 Lagget afh. var (y-var) Ingen problemer når blot vi har specificeret dynamikken korrekt. 13.eff. at fordelingen af ∷ antag og er uafh. at vi for hver enkelt kan få tætheden af Nu vælger vi hvilket er et slags PMLE problem 13. DYNAMIC COMPLETENESS er når distr.1 Unobs. givet ved (korrekt spec) (han tillader. antager ikke ) er en korrekt specificeret pdf for for hver periode. ”isoleret set”. af når vi kun betinger på .3. ⇒ specielt vil den maksimere summen. betinget på 1) Integrate out Da er den simultane tæthed for Og log-like er 2) PMLE-agtig tilgang Antager intet om fordelingen af (givet ) I stedet siger vi.- (dvs.3. . Men vi antager. and strict exo kan være en vektor ( )) er givet ved . at Smart teoretisk figumdik Definér det partielle likelihood bidrag som SMART ∷ Da er korrekt for alle . . da er Hvis denne korrekt specificerede tæthed er betinget på hele fortiden er lig med distr af 21 . vil (unikt) maksimere for ethvert . at 2 possibilities - I begge tilfælde antager vi.

Vi smider den første obs. MLE (CMLE) Generelt er det muligt. Desuden opnår vi samme efficiens som CMLE.2 Classical Minimum Distance (CMD) IDEA SETUP Function maps 22 Structural problem. pp. at der i fordelingen af I CMLE betiner man på er information om . estimeres.3. metoder. at . hvor ” ikke er en funktion af ”. ku man ha fundet distr. vi skal lave skal håndteres INITIAL CONDITION PROBLEM ∷ LØSNING ∷ betinger på (/antager) Her er betingningen på KOMMENTARER . og smider dermed al denne info væk → vi kalder det UMLE. . 13. 14. estimeres typisk ved at antage en art homosked. for … meget svært! ASYM VAR ∷ justér for at tage højde for at begge params. 14 GMM 14.4 Uncond. cond. dvs. 439-442) Lad og .1 Efficiente instrumenter (§14. Da er det optimale valg og med dette valg er det ikke nødvendigt at bruge en vægtmatrix i GMM. (desuden skal Til også estimeres) skal der typisk bruges ikke-param. når man ikke betinger på HVORNÅR ER DE LIGE GODE? Når . estimate Reduced form. dvs.5.Og vi kan igen integrere - ud. PROBLEM vil næsten aldrig være kendt ⇒ skal estimeres. MLE (UMLE) vs. væk. Alt.

godt initialt estimat af .Hvis dummies udgør en klassedeling. af .2 Latent variabel model – probit og logit KOMMENTARER SKALA IRRELEVANT ∷ Indekse Hvis fx (eller ) kunne være skaleret arbitrært .1 Linear Probability Model (LPM) – problematisk PROBLEMER Siden variansen for en Ber(p) variabel er afh. er . monotont voksende) på er den samme ( ⇒ Derfor: normalisér med Retningen af effekten fra Fortolkning af ’erne 23 . løses vha. Predikterede værdier uden for . giver de bare gns. 15 Discrete Response Models 15.… men evt. WLS .METHOD Estimate Choose . da . … kan evt. inden 15. for et valg af og . KOMMENTARER . er der automatisk heteroskedasticitet.

15.Bøvlet augmented regression ala alm. udregnet ved og er misspec. fra reg af . MEN ∷ ej invariant for reparameteriseringer Hetsked modellen meget besværlig (LM foretrækkes) ⇒ Her er så vi omskriver LM test .1 MLE (pp. LM ∷ Smart hvis den store er bøvlet.e.) (ligger i 15. så er også .mult. ER IKKE-LINEÆR Wald foretrækkes. på og . WALD ∷ problematisk når den store model er for stor ( har høj dim). (disse er .3 Tests i binary response index modeller Muligt med Wald.3.’er ⇒ MEN ∷ hvis naturen af ML). at og Så . Muligt med Huber-White robuste s. 460-461) Like bidrag Log-like function Det kan vises. LR ∷ Kræver begge estimeret.1 Lad Da er . 24 . LM.Denne er invertibel så længe der ikke er perf. HVIS 15.2. LR og LM. KOMMENTARER . Kan gøres som auxillary regression.kor.

5 Random Utility Model og så kan vi køre helt alm. c og x uafh.6 Specification issues 15.fejl fås vha. hvordan dummies håndteres. . avg.15. personen – dvs. ) partial effects (kaldet APE. .)) log-likelihood i model med kun intercept. log-like fra unrestricted. probit på den med reglen: Vælg bil hvis . w/o loss of generality) . så er ≅ in ved . 15. Probit kan godt estimere de forventede (mht. da er . hvis . part.6. - Evaluere i gns. hvor Bemærk.4 Reporting results Percent correctly predicted (#gange Pseudo . std.eff) 25 . ordens lokal Taylor) (se p. hvor . STÆRK antagelse Antag Attenuation bias: PROBLEM Ønsker ∷ Partial effect: Men probit giver os Probit kan ikke estimere partial effects evalueret ved BONUS konsistent .1 Neglected heterogeneity (c udeladt) Antag sande model er Latent form ∷ ( . Delta-metoden (2. ≅ . ≅ . 467 for detaljer) - Response probabilities ∷ - 15. ≅ Smag og behag.

på … så probit af på som vil (mao. kan vi tænke på TEST Hvis . kontinuert variabel Antag Mistænker .⇒ Nu kan man vise. ved at reg på ↷ .6. Så er probit generelt inkonsistent 15. er og pga. . afledte eller differenser af flg. ingen strenge antagelser på . 26 ⇒ dvs. udtryk IDE ∷ får 1) Reg 3) Probit 4) Udregn 2) Estimér på ↷ .og c og x ikke uafh. kan vi skrive . Skriv - ⇒ ingen endogenitet 2-trins test for endogenitet (Rivers & Vuong. Da vil .2 Endogen. 1988) Antag Under bivariat og . at … (lang tung snak) … METODE MÅL ∷ APE’s ∷ dvs. samme argumenter som ved neglected heterogenitet som vi gjorde med (? eller hvad?)) spiller altså ikke ind i første ligning ’s fordeling kræves.

kan testes vha. da R&V er en limited information procedure) FREMGANG Udnyt Ad Ad Ad ⇒ ⇒ normalisering ⇒ identifikation af discrete response endo. ”den sædvanlige” (?) -test på → dog skal std. ∷ Antager ∷ ⇒ udregninger ⇔ ⇔ således at likelihood bidragene er og testes @ asymptotisk -test. (proceduren er sindssygt svær at læse sig til!) Idéen er (vist).fejl korrigeres for 2-step . Denne gang bliver .3 Når den endogene variabel er binær KORT FORTALT Både varians af Kan ikke løse for og må normaliseres for at få identifikation → den må integreres ud er grim! LANGT FORTALT kan fx være deltagelse i fx jobtræningsprogram. 15. at genbruge tankegangen bag hvordan vi fandt 27 . asym Alternativ til Rivers & Vuong (smartere.6.

kan Manski’s maximum score estimator – estimation under svagere antagelser . ) ⇒ (medianer kan ikke være kommatal) Antag (og bemærk. Hetsked & ikke-normalitet Hetsked Antag i latent-variabel-formuleringen: Non-normalitet Så er 15. Men hvis fx det er fordi logit er den sande model. så ingen partielle afledte. og 28 .5 inkonsistent godt være ret tæt på. at (fordi Fordele: Robust: og Estimerer må godt være afh. at spiller rollen af integrationsdummy) Eksempel: College attendal and catholicism (Evans & Schwab.6.4 er man katolik eller ej Derved tillades at afhænge af uobserverbare faktorer. at og til det bruge tætheden af er en trunkeret normalfordelt variabel. Ulemper: Konvergerer med rate Vi kan ikke differentiere Nogle gange har modsat indflydelse på . konsistent op til skala – god til fx (selvom Horowitz (1992) har en smoothed version med næsten .6.Så skal vi tage forventningen → til det skal vi bruge. idet ⇔ (inden i : -integralet) Vi når frem til (bemærk. og er ikke restrikteret. . 1995) går man i college eller ej 15.

inferens OBS! Betyder ikke tidsuafhængighed – Betyder blot.) (OBS! man må droppe tidsperioder – ellers 15.SVÆRT pga.⇒ sample kan ses som en stort cross-section af str. FD eller RE. DYNAMIC COMPLETENESS ⇒ alm.compl.vars Fixed effects ∷ fjern ved transformation .15. Estimér . .7.) BERTEL’s noter ∷ ingen lagged dep. hvor er .1) Brug robust var-est. 15. .6. korr. med dem (?!?!?!) MULIGE METODER som parameter ⇒ #params → ∞ for 29 . TEST for dyn. er strengt eksogen betinget på (specielt indeholder siden nok lags osv. .var ∷ Estimér den potentielt syge. Lag.2 Unobserved effects probit ANTAGELSE Dvs.dep. som ej findes. altsådyn. .compl.1 Pooled estimation Model: PMLE-estimation (partial MLE) ≅ pooled - er konsistent uden videre antagelser. → men stadig ikke attraktiv for binær-respons data. at . ikke-linearitet Proxy for (når interesse er i APE) Pooled analyse (når interesse er i APE) Estimér ∷ Fixed effects probit (dumt navn!) Åndssvagt! Ser ville være perf.7. må fx godt indeholde laggede variable. Jacobian af (§12. bruge FE. hvor .7 Panel data / cluster samples Med LPM modeller kan man evt.

men robust for fejlspec af denne.Kræver specifikation af CMLE @ Fuld korrelation . specificeres kun betinget på .Diskussion: man betragter Traditional random effects probit . -  Error form ∷ . ved Men hvorfor kan de pludselig det her når de ikke kunne i alm.Response prob. unobs. for med konstant varians. 5) SVAGERE ANTAGELSER . . men tillader dog noget samspil (modsat trad. ⇒ ⇒ som ikke-tilfældig… modsat hvad vi vil gøre! (betinget på ) && ud af ! METODE ∷ integrér og ‼ ) og (APE) kan godt estimeres! HURRA ∷ både INDSKUD ∷ integration Numerisk @ quadrature (part.eff.eff.- . og logs. ikke .Generalized estimating equations .. hvor tillades fuld frihed i off-diagonal (og 1’er i diagonalen) Slem curse of dim!  Men.normaler ↷ . Keane (1993.  3)       Max log-like mht. ).?? Simulation @ int ≅ tage forventning 1) Træk 2) Beregn 3) Beregn 4) Tag gns.  Restriktiv.MÅL ∷ tillade sammenhæng METODE ∷ specificere betinged Antag .REprobit) Indsæt i ligning: 30 . in press) har simulationsmetoder Chamberlain’s random effects probit .ANTAGELSER    1) Streng exo ∷ 2) Uafh. . hvor ( for hver std.

- INTUITION ∷ Tilføjer tids-gns som kontrolvariabel ∷ partial eff.7. hvor NAVN ∷ fixed effects logit ⇒ SKODNAVN. som paramter. ikke engang . er strictly exogenous conditional on . intet at gøre med FE probit. Så kan vi dog kun finde APE’s ved at integrere ”integrere” når tidsgennemsnittet holdes fast! ⇒ måde at kontrollere for uobserverede personspecifikke effekter ⇒ så skal inferens dog gøres robust for ud (hvilket i praksis kommer ud på at ud (dvs. antager str. INTERESSE ∷ State-dependence efter der er kontrolleret for JOINT PROB 31 . dvs. der ik afhænger . eller i begge år duer OBS! Kun observationer. af Udvidelse ∷ Tillade tidsafh. bidrager.4 Kan ikke estimere partial effects medmindre vi indsætter en værdi for Men hvilken værdi skal vi vælge? Ingen restriktioner. i   muligt at droppe antagelsen arbitrær seriel korrelation.3 TEST for streng exo ∷ add bare nogle lags og se om de bliver sign. skodnavn) så vi (nemt) kan integrere mht. Logit: unobs eff og streng exo (FE logit. som ser FORDEL ∷ effekten på log-odd ratio. obs.exo Tidl. hvor ikke. at → dvs. ! 15.7. fx ingen lags af dep. average den ud. ! APE’s kan heller ik findes når vi ik har nogen antagelser om distr for Forudsætter Dynamic unobs. den. NEDERN ∷ ik muligt at specificere tæthed for - OPTUR ∷ muligt med FE/FD-agtig approach! → viser sig at Log-like i hvor tilfældet: hvis og hvis falder ud når vi betinger på svedig feature ved logit-formen gør det muligt at få en funktionel form.var.eff (state dependence) Grundlæggende model BEMÆRK ∷ dvs. outcome må godt påvirke response prob) ∷ . da den observeres) BEMÆRKNINGER Hidtidige udledninger ∷ afhænger kritisk af. ULEMPER 15. idet.

kan fx vælges som Chamberlain. . Std.8 Multinomial response 15. hvor c. a. bootstrapping el. 15.a. dvs. I PRAKSIS i. dernæst for ? modelleres ikke! 2) Specificere tæthed for 3) Approksimere tæthed for Fx lade 4) Betinge på . fås vha. Kategorier Hvor og (samme ’er i hver kategori – bare med forskellig param) 32 . .fejl.lign. Førende eksempel .prob. 1981) følge probit med resp.8. styk. a. Chamberlain probit.Fx Manski for Cluster samples brugt på differenser Pooled probit/logit ∷ brug dog de robuste varians-estimatorer. a. og tilføjes i alle tidsperioder ( -subscript viser APE’s mv. dernæst for Svært at vælge tæthed. . (Heckman.5 Andet Semiparametriske metoder .1 Multinomial logit . dernæst specificere b. 15.INITIAL CONDITIONS PROBLEM ∷ hvad når vi når til 4 muligheder 1) Se a. ∷ tag MLE params og multiplicér med dette). som ikke-stokastisk Streng antagelse ∷ medfører bl. Alm.7.

8. men odds bliver pæne: LIKELIHOOD 15. hvilket er urealistisk. dvs. karakteristika for ⇒ håndterer en helt anden type data – valg af alternativ netop . ikke udd. erfaring.Elements of TypeI Extreme Value differ between alternatives can’t contain elements that don’t vary across alternatives! Dvs. relative odds mellem og → så hvis kun konstant. Hvis skal være . men ok med pris på o.RESULTATER Partielle effekter har en meget besværlig form.lign. skal afhænge af karakteristika ved RESULTATER BEGRÆNSNINGER Independence of Irrelevant Alternatives - Dvs. we’ll look at conditional logit.2 Probabilistic choice models: Primarily. LØSNINGER 33 . afhænger kun af karakteristika for og er . but conditional probit is a nice extension (although it has some computational issues) Conditional logit Derived from underlying utility-maximization model ANTAG ∷ REMARKS .

-dim integral) b. og integrér ud) . 50% eller 75%?” ⇒ ingen betydning for estimation. men ikke nødv. hvor kovarianser er urestrikterede. derefter vælger man inden for de enktelte grupper (betinget på at vælge gruppe . c. 25%.1) Multinomial probit (= conditional probit) a.9 Ordered response – ordered logit/probit Valg har ordinal. ) ∷ @ Chamberlain tilgang (antag+approx pdf for INTERVAL-KODET DATA Samme idé. men ikke kardinal nytte (2 er bedre end 1. er der conditional logit blandt alternativer i den gruppe. men giver mening til . fx ”hvor mange % sætter du i aktier. og har fortolkning som om det var OLS! 34 .UOBS. I tillades . Vælg i stedet for ⇒ ordered logit Valg kan tillægges tal. 15. MEN ∷ besværlig beregning (inkl. Ellers ∷ Evaluér ved referenceperson / rapporter % korrekt predikteret BEMÆRKNINGER Hverken eller har separat betydning. Idé ∷ indfør 2 lag ∷ først vælger man mellem grupper. Dog: simulationsmetoder 2) Hierakiske modeller ∷ fx nested logit model a. halvt så meget som 4) Del op Response probs: INTET INTERCEPT i Loglike ∷ ’erne spiller rolle af intercept (for er interceptet) (og vælg som sædvanligt RESULTATER med . men teknisk bøvl OBS! Nu giver faktisk mening.EFF ∷ (dvs.

16.16 Censored regressions and corner solution models 2 typer 1) Censored data a. af model: Censoring ∷ den latente variable.1.2 Quantities of interest Afh. . eller .Corner solution ∷ den faktiske variable.1 ⇒ .Alm.Wolle giver første/anden afledte 16.1 Tobit ANTAG ∷ 16.like INFERENS . UDLEDNING Derfor fordi . MLE . så - 35 . Estimation TÆTHED ∷ ens for Cond. Observerer 2) Corner solutions a. .1.log.

’s er bare skaleringer af . CORNER ∷ vis er interessen ⇒ rapportér . 16.De part.eff. - Så er EKS Diskret: og 36 . skaleret med Fra NOTERNE: ’erne -variable ⇒ vi forventer ) RESULTATER CENSORING ∷ husk. eller (?? p530??) ? ANTAG ∷ PROBLEM ∷ skal håndteres eksplicit LØSNING ∷ integrér ud. ANTAG ∷ har pdf.1) KONKLUSION CENSORING ∷ intet problem.(specielt.2 Neglected heterogeneity (§16. dvs.PARTIAL EFFECTS BEMÆRK‼ .6. vil vi have LØSNING ⇒ integrér ud. tobit konsistent for CORNER ∷ måske.

⇒ antag så . OLS. .Dvs. af fuld fordeling) OBS! Modsat alm.3 Endogenous Som for discrete choice ⇒ må antage mere struktur ∷ den endogene. - Fuld MLE ∷ specificér simultane fordeling af de endogene vha.I generel model: specificér hetsked Non-normalitet ∷ svær – noget med probit 16. 16. antagelser ESTIMATION LAD (least absolute deviations) M-ESTIMATION 37 . tobit af på ) Som for probit Std. hvor kun kræves for konsistens TEST Hetsked @ LM (score) tilgang → så estimerer vi den almindelige Tobit som nested i en mere generel model . hvor ⇒ vi kan erstatte Tobit ∷ 2-step (Smith-Blundell) ∷ estimér reduceret form for endogene ved OLS ↷ inkludér residualer (dvs. - TEST ∷ i begge settings testes - DOG ∷ ML en del tungere beregningsmæssigt ↷ estimér Smith-Blundell først og test endo i den.fejl skal korrigeres MEN ∷ Indsætter direkte (eller estimeres ikke (relevant for CORNER når man estimerer APEs) og estimerer den samtidig @ ML efter parameterisering) via alm.5. POINTE ∷ slippe for at antage ANTAG ∷ . ingen pdf / uafh.- Kont:  ⇒ & . -test. 16.1 Powel estimatoren .5 Estimation under svagere antagelser 16. ⇒ pga.4 Hetsked & ikke-normalitet ALVORLIGE KONSEKVENSER Inkonsistens (da ML afh. antages .

1 Sml. . den ekstensive margin. ” og ” ” den samme eller .eff. ⇒ estimér med-reg ⇒ fjern ⇒… Alternativer til Tobit for Corner – ekstensiv vs. ⇒ Hurdle / two-tier models ∷ hurdle’n eller tier #1 er. 16.5.6. med alm. om man skal vælge stor skal vælges. intensiv part.6 Tobit for panel 16.(generelt for LAD) Alternativt – ILPA (iterative linear programming algorithm) 16.3 -asymptotisk normalitet. og .MEN ∷ specifikationstest for Tobit modellen PROBLEMER Criterion function er diskontinuert ved : - Desuden ∷ . Tier #2 er hvor IDE ∷ I Tobit er ” ⇒ måske forskellig virkning på den intensive vs.2 Estimér median-reg på fuldt sample ⇒ fjern Hvis konvergens er der gevinst.MEN ∷ RESULTATER Censored: Powel viser dog er kontinuert ⇒ konsistens følger af 12. . MODEL .Ingen af de ønskede  kræver antagelser om fordeling . 38 . tobit ANTAG ∷ Tobit på cross-section med obs. HVIS ’s fordeling er symmetrisk omkring 0 Corner solution: .2 ikke differentiabel ⇒ kan ikke bruge 12.

MULIGHEDER 1) Estimér 2) Antag 3) Eliminér .⇒ streng exo. .Inferens @ robuste estimatorer.2 OBS! dyn. hvor er den simpleste for . . Fordi mellem tilgængelig) eller POSITIVT Kræver ikke streng exo af Antager Laggede i er ok og . afhænger af corr.! og ↷ test samtidig .compl antagelse om uafh. dvs. ⇒ incidental parameters ⇒ Random Effects tobit. . inferens duer TEST ∷ medtag flg. så vælges som enten . streng eksogenitet‼‼ (udelukker noget fra ) Og (eller følger det af ovenstående?) 39 .6. Chamberlain-tilgang ved transformation @ Honoré (1992) Random effects tobit – antag pdf for c ANTAG ⇒ Bemærk. er bøvlede at inkludere ( observeres kun delvist) YDERLIGERE ANTAGELSE Dynamic completeness ∷ 16. og . 2 vars i alm. MEN ⇒ netop den antagelse. (bedst hvis . der giver. i Ingen antagelser om Laggede dep. så er for dvs. Tobit ∷ Tobit med unobserved effects ANTAG ∷ . men ikke er ok . kun Seriel korr. med potentielt . og ⇒ ⇒ .vars. at alm.

wolle VIDERE 16.APE’s kan estimeres jf. men det er tungere beregning) ⇒ identifikation hvis der er tidsvariation i . kan bruges for at blive mere generel. Kør bare random effects tobit med regressorne: 17 Sample selection attrition and stratified sampling 17.6. Tilføjelsen af har løst alle problemer ( er nemlig identificeret) ( ) evalueret ved fx . hvor medtages i hver periode (evt. ⇒ bøvlet som bar fuck! Censored ∷ giver bedre mening at inkludere Problem: initial conditions IDE ∷ antag fordeling for PRAKSIS MODEL betinget på og (wow.3 Muligt at relaxe Muligt at udvide Powel til dette setting. Dynamic unobserved effects tobit DUER KUN (/bedst) FOR CORNER! ANTAG ∷ .1 Sample selection ÅRSAGER til ikke-tilfældig sampling: 40 . streng exo af BEMÆRK Corner ∷ afhænger af.Dvs. tobit.IDENTIFICEREDE params ∷ PRAKSIS Alm. hele og !) inkluderet i hver periode. om eller 1. RESULTATER ∷ CENSORED RESULTATER ∷ CORNER Vi kan tage differenser / se på ∂ ved .

Anden variabel forklarer mangel – Heckman selection kan løse dette. 2) OLS af på på og 41 ↷ (på fuldt sample). ⇒ (truncation) Antag fordeling af og brug truncated Tobit og bruge CMLE. HECKMAN 2-step ∷ i. og ∷ påvirker selection. mellem b.2 Simpel model Del datasættet op ∷ kun MÅL ∷ bade observeres og observeres. b. .… hvis ikke må vi benytte andre krumspring (antage mere struktur) . b. Non-response b. ⇒ ingen problemer! Så ”indeholder . specielt ikke den betingede forventning”. er en (deterministisk) function af a. 1) estimér probit af ii. Dvs. a. Ser kun løn for dem. a. der har et job Adfærd ∷ a. Attrition (dropper ud over tid – ikke problem i register-data) c. ⇒ så kan vi udlede (disrete response selection) Tillader afh. men kun påvirker . 17. ANVENDELSER (eksempler) MULIGHEDER for selektion 1. (på det selekterede sample) alene ∷ uanset b. da og ingen yderligere info om nogen aspekter af fordelingen af . (vi betiner en gang for meget) er uafh. ⇒ ingen problemer. Det viser sig. VISE ∷ .- Selektion på forklarende variabel ∷ fx kun 30-50-årige Truncation ∷ selektion på forklaret variabel ∷ fx ser kun om folk har job for folk. der vælger at tage arbejde i. 4. af a. 2.Så snart denne betingelse holder er pooled OLS ok . 3. at ∷ c.OBS! Konklusionen gælder også for NLS! CMLE ∷ hvis vil MLE på det selekterede sample være konsistent.

for ⇒ da ingen andre led afh. hvor kun det selekterede sample bruges vil give konsistente estimater.1 model Selection @ 17.2. Heckit Robust var-estimator ( ) er valid – ingen generated-regressor problem a. 2-step ii.2.5. dvs.4 ANTAG ∷ ⇒ 2SLS af på . en pdf og cdf er givet. and a. (dvs.g. IDE ∷ ⇒ så kan vi finde ssh. 2) OLS af på og (Tobit selection – e. med isntr . ved inferens i Heckit)) Stærke antagelser ∷ (men de kan testes vha. moment-tests) Numerisk tung Ad 2SLS på selekteret data FORDELE ∷ PMLE > Heckit - ULEMPER ∷ PMLE < Heckit 17.1 ML i sample selection – PMLE Strukturel model ∷ Selektionsmodel ∷ UDNYT (hvor ) 17. hours worked) i.2 Sammenligning: ML vs. 1) Estimér censoreret Tobit af på ↷ residualer ) for de selekterede (dvs. instrumenter og estimere med 2SLS . ∷ Random sampling ∷ nok at antage Ad 3: Truncation (selektion på y) Selektionsligning ANTAG ∷ fordeling for er kendt. på med instr . af . Implicerer mere struktur b.2. konsistente varians-estimater – altså spg.2. 42 .3 TEOREM 17. med 17.

vi mangler som regressor ∷ udnyt at MEN ∷ observeres ikke LØSNING ∷ udtrykke - da det er en truncated normal ↷ inversel Mill’s ratio ⇒ OBS! Inkons af OLS skyldes omitted variable ∷ PROCEDURE (Heckit) a) Få ∷ Estimér probit af på på . -værdi da ⇒ alm. som er et specialtilfælde.⇒ konsistens og TEST -asymptotisk normalitet . og . når ). . at ok da ikke observeres.TRUNCATED TOBIT Fås ved at vælge SAMMENLIGNING 17. med det selekterede sample.5 . observeres altid. FORSKEL ∷ i censored observeres LIGHED ∷ Hetsked / non-normalitet ⇒ inkonsistens Probit selektion – exogene variable (Heckit) bestemmes af en probit model. i truncated censoreres både og . men se. OLS asymptotik holder selvom en var. for meget tages med BEMÆRKNINGER . . ANTAG 1) 2) 3) 4) .Testes @ std.2. CENTRALT ∷ ”the coding rule” er ikke kendt – i modsætning til top coding (hvor IDE ∷ antager parametrisk form for . b) Estimér OLS af .Bøvlet at finde varians når 43 .Ville følge hvis ESTIMATIONSLIGNING . selektion kan vi kun håbe på at estimere Dvs. Pga. med Mildere end observeres når . også når censoreres.

(exo) Ala alm. (fuldt sample). Udregn (for sig selv) (for ) og . ssh. forsk. for generelt: UDVIDELSE . endo problem. grim betinget på → udnytter igen Bayes til at opskrive ud fra ssh. for at deltage på bgg. BEMÆRKNINGER OBS! Vi skal have vars i som bestemmer selektion og den endo (relevans). observeres altid. Idé til instr: hvis man blev indstillet tilfældigt (men stadig skal instrumenteres. for 17. ikke-linearitet i og . ∷ konsistent ved probit af på på på pr. men vi må antage struktur på den endo. …) givet over ssh. af ) exo men manglende somme tider (non-response) ⇒ modellen duer stadig.2. .- Stadig konsistent når → MEN ∷ noisy ∷ (samme regressorer for id’es kun pga. . (for sig selv) på selekteret 2) Estimér 2SLS af med instr . observeres kun når . men ikke .1 ∷ konsistent at bruges 2SLS af PROBLEM ∷ mangler PROCEDURE 1) Estimér sample).Hvis - antages kan PMLE bruges (lang.Arbitrær korrelation tillades mellem UDLEDNING TRICK: Her er ⇒ teorem 17.6 Probit selektion – endogene variable ANTAG 1) 2) 3) 4) 5) (skala arbitrær da og i ligning 2 er ) hvor . Eks. 44 . konstruktion . TEST BEMÆRKNINGER kan være diskret.

§probit) MOTIVATION ∷ separat variation i EKSEMPEL ∷ timeløn.Tænk selektion: UDLEDNING IDÉ ∷ hvis MEN ∷ for selekteret. observeres kun når . af alene. hvor langt folk er fra de-selektion. køre på ikke-lin. kan vi bruge PMLE. vil id af .- Mindst 2 vars i Hvis vi antager skal bruges – tænk: én til og én til at identificere selektion ( ). Udregn .Som for probit . Hvis y1 i stedet var binær ANTAG ∷ (en masse) + PROCEDURE 1) Estimér 2) Indsæt i 17.a. ANTAG 1) 2) 3) 4) BEMÆRKNINGER . OK med 45 MODSAT probit! → @ nu har vi separat variation i . .2. PROCEDURE 1) Estimér 2) Estimér ved tobit af ved OLS af på på for hele samplet. . (skala ej arbitrær da observeres!) observeres altid. som netop er de selekterede ⇒ BEMÆRKNINER Efficiency gain ∷ intuitivt klart. PMLE mulig @ ANTAG ∷ . (hvis ingen ekstra til selektion. vi kan se. #timer arbejdet p. observeres ⇒ kør OLS på selekteret sample kan estimeres konsistent for de med .7 Tobit med eksogene forklarende vars ⇔ vi kan sige ”hvor langt” man er fra selektion ⇒ mere efficient ved probit af på (for hele sample) (jf.

(for sig selv) på 2) Estimér ved 2SLS af selekterede sample BEMÆRKNINGER kan være kont.- hvor er . 4) 5) og i ligning 2 er UDLEDNING (som for probit med endo) her er observeres altid.8 Tobit med endogene forklarende vars ANTAG 1) 2) 3) (skala arbitrær da ) hvor . Incidental truncation (fx arbejdsløshed 17. hvis vi på hver gang (fx ) RESULTAT .3 Paneldata: Sample selection Overordnet set: Attrition / selection i paneldata kan ske for 3 grunde 1. konstruktion ⇒ 2SLS på selekteret sample er ok. (for sig selv).1 Fixed effects på ubalancerede paneler kan vi ”uden videre” bruge formlerne med OLS på transformeret data. PROCEDURE 1) Estimér ved Tobit af på . observeres kun når . pr. og er den sædvanlige 17. rank-condition) . (for ). Udregn på og vha. hvis kan medtages ⇒ estimér @ Tobit. Folk vælger at droppe ud (attrition) 3. instr for selekterede . Tilfældigt (”rotation”) ⇒ nemt at håndtere 2. eller diskret.3.hvis bare også ganger MODEL ANTAG 1) 2) (⇐ er invertibel ) 46 (alm. 17.2.

Test / korrektion for sample selection bias Procedure (Nijman & Verbeek. .3) BEMÆRK . hvilket sparer på . 1992) 1) Estimér FE af 2) på og på det ubalancerede sample. Almindelig robust FE-varians kan bruges Tilladt at danne et balanceret subsample og estimere på det. PROCEDURE 1) Probit 2) FE af på på (eller og ) – fuldt sample.RE analyse kræver ESTIMATION Definér (⇒ alm.3. Incidental truncation under HA: selektionsbias ANTAG ∷ 1) 47 . OLS. Udregn – selekteret sample.2 FE kan kun bruge . (eller @ alm. FE inferens holder) BEMÆRKNINGER 17. testes @ alm. . -teststørrelse Incidental truncation under H0: ingen selektionsbias BEMÆRK ∷ en enkelt var observeres ikke i nogle perioder IDÉ Chamberlain-inspireret ∷ tillader Antager lineær struktur MODEL (alternativt bare lade tidsgennemsnittet for parametrene) afgøre ∷ . fx vælge VIGTIGT! Vi kunne lige så godt have brugt FD metoder. med .

3. . Step 2 i procedure: Lav 2SLS i stedet og instrumentér Inverse probability weighting (IPW) (som fx kan være Antagelsen udelukker at til kan påvirke attrition (efter betingning på . ANTAG ⇒ (hvor på ⇒ ↷ på ↷ . MODEL IDE ∷ sekventiel natur.4 påvirkning fra LØSNING ∷ IV Instrument . ) – tænk: ingen samtidig når der er kontrolleret for antages at være strengt eksogen. hvor (dvs. ). at så vil Attrition – man vælger at udgå af sample erstattet med .2) PROCEDURE 1) Probit på for hvert og gem for alle på .3 INTUITION ∷ følger af.3. PROBLEMER 17. kan vi mere for alle (og vi betinger jo hele tiden på ANTAG ∷ ingen ”re-entry” ∷ attrition er en absorbing state. 2) Pooled OLS på det selekterde sample af BRUG robuste var-estimatorer Incidental truncation Tobit selektionsligning Hvis selektion i stedet sker på baggrund af Samme procedure som oven for virker. at 17. Tests er ikke længere oplagt simple (robusthed så vi ikke behøver betinge på det yderligere) indeholde og (ikke da den står på LHS for forrige periode ⇒ corr med PROCEDURE 1) Probit 2) Pooled OLS af kræves). MÅL ∷ Generelisere metoder til ikke-lineær estimation (M-estimation) ANTAG 48 . indeholder hvor osv. men med I Tobit frameworket kan vi også tillade. ⇒ ↷ brug FD og skriv (reduceret form) ligningen for selektion betinget på selektion i forrige periode fx kan ). redundant i selektionsligningen) og med er eksogen i modelligningen ). .

gang med INTUITION Regularitet giver. Intuition ∷ the more observations that are censored. UDVIDELSE .Kaldes selection on observables eller ignorability of selection.⇔ . . mixed.4 Non-parametric bounds LOWER BOUND UPPER BOUND REMARKS Bounds are tight when ≅ .hvis attrition probit’en ændrer sig over tid?? ⇒ bølvet at håndtere… 17. som vi ikke ser på) 2) Regression discontinuity design 3) Panel data: difference in differences (og before-after) 4) IV og . weighting estimatorer (og evt.) 18 Treatment effects OVERORDNET ∷ ønsker at estimere TILGANGE 1) Ignorability of treatment (ATE. ).1’) ∷ regression. hvor målfunktionen vægtes med . 49 . dvs. matching. 2) M-estimation på selekteret sample (dvs. the bigger the problem! . PROCEDURE 1) Probit på ↷ gem de fittede sandsynligheder.1 og ATE.(knew this already. at kan erstattes med når vi udregner asymptotik (antages ).

2 Regressions and switching models Tænk ∷ person-specifik gevinst ved programmet. .1. COMMON SUPPORT . SWITCHING ANTAG ∷ KAN VISE ∷ . if treated. være uafh. der påvirker ATE’ ⇒ .dvs. else iid. er partialled out. ⇒ vi kan fjerne betingning ∷ generelt er kun udregne ⇒ 18. men vi kan bare når .On the ∷ treated ∷ untreated ∷ overall RUBIN’S CAUSAL MODEL outcome w/ treatment. vil de tilbageværende faktorer. outcome without (cont.) MISSING DATA ∷ only MULIGE ANTAGELSER ⇒ Så er or is observed: og . . Desuden betyder. af de tilbageværende. at vi kun har . at (evt ik-lineær) .External validity ∷ hvilken effekt vil et hypotetisk program have Average treatment effect .18.1 Noten Internal validity ∷ hvilken effekt havde jobtræninsprogrammet ⇒ ønsker vi ⇒ kan vi ikke få . ATE1: betinget på ATE1’: a) (selection on observables) ⇒ når som påvirker . OBS! Uafh. hvor 50 .1 Nonparam id – ignorability of treatment er og b) . or discount.1. så dem i programmet har særlige gevinster. vi skal se single-mødre i begge grupper (treatment og non-treatment) 18. fordi missing data gør.

e. er ikke!) (dvs.1. treatment effect at er . til er . Average treatment effect at Vi definerer ANTAG - ∷ . akkurat ikke blev treated for dem.of.treated) - dvs.1 (ignorability of treatment) ∷ betinget på og er kontinuerte i avg. 51 og givet at man på et tidspunkt . i Under kontinuitet er ESTIMATION - INTUITION ∷ gns. Regression discontinuity Reg på ∷ koeff. ATE.treat.ANTAG ∷ ANTAG VIDERE OG ⇔ samt ”⇔” PROCEDURE 18. gevinsten er kont.4 Hvis treatment effekten er heterogen er den ikke lig med hverken Before-after eller ! Diff estimator IDE ∷ sammenligne individ med sig selv! OBS! Kræver paneldata og kan kun estimere ANTAG ESTIMATION ∷ FØRST ∷ diff-estimator (avg. treatment effekt lige ved cutoff niveauet 18. som lige akkurat blev treated MINUS gns.’s på denne via bootstraps eller Δ-metoden. uafhængig af – . for dem som lige BEMÆRK .1. vi estimerer på det treatede sample og tjekker forskellen på bliver treated.Vi får blot en lokal gns.3 (s.

Selection and treatment effects OPSPALTNING af det ”observerede” gain - Selection bias = ability bias i labour econ Sorting bias = selection on the gain. udvikling over tid er den samme i de to grupper ⇔ samme tids-trend) SÅ ER ESTIMATION ∷ overraskende nemt i regressions-framework ANTAG ∷ .Bygger på antagelsen om.Indfør controls . der tillod 18.2 ∷ a) b) c) 52 . Når der er både selection og sorting bias: essential heterogeneity TIDLIGERE ∷ Diff-in-diff eneste estimator. “forhåbentlig” treates dem med størst potential gevinst.6 Estimation af ATE ved IV under antagelse af homogen treatment effect ANTAG ATE. BEMÆRKNINGER . at den gns. FUCK! Hvis folk selekterer ind i programmet er … AHA! BRUG FD! PROCEDURE . fx ikke Ashenfelter’s dip ∷ discouraged worker lige før treatment.Antagelsen tillader selektion på unobservables.MEN ∷ hvad med generel tids-trend? ⇒ motiverer diff-in-diff Diff-in-diff ANTAG (dvs. men kun hvis de er tidsinvariante 18. hvor er koefficienten til .5 Dvs.1. at randomisering holder i FD .1.Regressér på .

.e.8 LATE (local average treatment effects) CHANGE MINDSET ∷ nu to typer treatment! Vi trækker for alle individer ⇒ smider én af ’erne væk ⇒ smider én af ’erne væk. men ønsker at tænke det sådan. i. b) ≅ exclusion restriction. Dermed kan vi skrive ligningen for MEN ∷ og kan godt være korrelerede‼ ⇒ endogenitetsproblem Procedure 1: Alm.1.1. idet vi kan skrive spiller ingen rolle i ligningen for . Desuden b) ⇒ som .7 med og og ) i stedet for og yderligere d) (tænk ). at der kunne have observerer vi . fx med probit (som funktion af Heterogene treatment effects (v0 ≠ v1) ANTAG PROCEDURE 1) Estimér 2) Estimér i med MLE og få (fx probit / logit) ved 2SLS med instr 18. observerer vi ⇒ ANTAG (monotonicitet) 53 . PRAKSIS ∷ TÆNK vi observerer kun ∷ hvis . IV Instrumentér med og med sig selv. Procedure 2: IV med propensity score Hvis vi er villige til at gøre yderligere antagelser. været et andet udfald. hvis havde været på en anden måde. kan vi få en mere efficient procedure Erstat c) med ∷ 1) estimér 2) instrumenter 18.FORKLARINGER a) ⇒ . hvis .

der bliver treated også er dem. af koeff. forudsiger perfekt hvem.(…) ESTIMATION IV reg på med som IV for ⇒ FORTOLKNING BEMÆRK gns. hvor er sample avg.) DET GIVER INGEN MENING‼ INGEN OVERHOVEDET‼ 18. som vi kan finde eksplicit. vil .10 Sammenhæng med den simple sample selection model ANTAG ATE. blev ændret fra 0 til 1. .4 54 . vil .1.1. og hvis dem. Essential heterogeneity and IV (sorting on the gain) Essential heterogeneity ⇔ der er bade sorting og selection. der bliver treated. → her: en model hvor der er sorting på gains! MODEL - Her (må) Definer ⇒ - (bemærk ligheden til . hvor og missing) (lige så vel som Vi kan ikke observere populationen med vi ikke observerer 18. ’erne for de treatede) er forventning over den treatede del af populationen.9 Modsat HVIS HVIS GENERELT ∷ der har størst gain. som ville participate hvis defineres ud fra variationen i Modsat og . over . treatment effekt på dem. . som defineres ud fra forhold i populationen (dvs. . til .

på . Få 2) Regresser @ POLS ∷ Sammenligning med IV tilgangen IV ∷ 1) estimér 2) kør 2SLS med inkluderet som regressor. hvor så PROCEDURE 1) Probit af på .Tillader comparative advantage structure samt hierarkisk struktur – sandsynligt. dvs. hvor .ATE. 18. nok at tage hensyn til . er lig den generelle plus den forventede individuelle gevinst ved at blive treated ( er lig den individspecifikke gevinst ved treatment) Bemærk ∷ kræver flere antagelser (typisk) end .a) b) c) d) e) SÅ KAN VI SKRIVE fx … og endelig og for for . effekt i sub-sample bestående af de treatede (⇐ fx ) ) (men Mindre struktur ∷ antage mean independence ∷ dvs.1 ∷ og er uafhængige når vi har betinget på (b) . MODELTANKEGANG SÅ ER dvs.1’ ∷ (a) RESULTAT SMART ∷ Definér 55 . ANTAGER at ∷ restriktivt DENNE ∷ 1) estimér 2) reg pooled OLS med de genererede regressorer .Faktisk.ATE.3 Mere parametrisk tilgang ANTAG . 18.2 Ikke-parametrisk tilgang ⇒ ⇒ – begge estimeres som avg.

fejl skal fås fra de evt.ATE.1’ ∷ for . Vi kan som nævnt altid tænke så indsat i definitionen som vi tænker på som en reg model ANTAG ∷ ATE. non-param 18.Vælg 18. ⇒ så er med giver det (fik vi allerede tidligere) og endvidere er og er et fejlled. som vi har antaget betinget middelværdi nul for.3.TÆNK ∷ EKSEMPEL .1’ ⇒ så er hvor . → vi kan estimere den ikke-parametrisk! ESTIMATER PROBLEM ∷ std.3.1’ alene giver os to ting: 56 . vi har i vores datasæt! identificeret for .2 Svagere antagelser – to ukendte g-funktioner ANTAG . og . (eller for lidt mere generelitet) .Så er og → dermed er samt er sådan set det.1 Switching regression ’er ⇒ men muligt @ bootstrap / Δ-metoden. KONKLUSION ∷ ATE.

18.3 (husk nemlig at uden antagelser er Regression disc. antag og ) IDE ∷ kan fås fra probit 57 .4 Propensity score Ved at fokusere på og → MEN ∷ der gemmer sig nogle ret tunge antagelser under.1’ SÅ ER (mao. 18. designs og hvis har en diskontinuitet. 18. 2) er additiv i PROBLEM – Saturated model Hvis ’erne vælges for komplekse får vi problemer (ikke datatæthed alle vegne) For at komme videre: antag form for g0 og g1 ANTAG .OLS af på RESULTATER for .1 ATE skrevet som funktion af p.ATE.hvor ESTIMATION .1’ ⇒ så er .1) er en funktion af og og (en funktion af ).4.3. kan man opnå konsistente estimater af ANTAG .ATE. eksempelvis briller gives til børn med dårligere syn end ± 2 ⇒ sammenligne personer med næsten samme ’er. kan det udnyttes ) Hvis ofte vil fx . dvs. som estimeres med probit (i regression eller mere ”ikke-parametrisk”). men hvor én treates og én ikke gør.

dvs.2 (hvor Logit/probit sikrer.ATE.Tilføj som regressor. Regressér y på w og p-hat som regressor. regressér BEMÆRKNINGER Man kan også køre regression en er lineær i for 18. . hvordan man estimerer .) .1’ er ukorreleret med SÅ GIVER regressionen PROCEDURE Estimér . men så skal man i stedet antage. dvs.Som før… hvis vi tillader ANTAG .PROCEDURE 1) Estimér ∷ fx vha. logit/probit med en Sieve funktionaf og inden i 2) Tag sample equivallent af 18.regressér på MOTIVATION . men måske maskerer det bare det mulige sample problem.4. at så … . sæt ” ” Simpel idé: tilføj . kan vi opskrive det som en regression -asymptotisk normalt estimat af (koeff. på på . til ). ∷ fx med probit. at .5 Matching ANTAG Så kan vi estimere BEMÆRKNINGER 58 . at der findes BEMÆRKNINGER Det hele kommer til at hvile på.

(⇒ OBS! i alm. . men alle naboer vægtet efter deres “afstand” i .- Matching estimatorer “balancerer” samplet så det ligner. nok med og .2’ ∷ IDÉ: og PROCEDURE 1) Estimér 2) Estimér generelt har samme stokastiske led. Bedre -estimator ∷ ikke bare bruge de nærmeste. at MERE STRUKTUR Skriv . hvis og afhænger altså ikke af HVIS ∷ instrument ANTAG ATE.) korrelerer måske… og måske gør en af regressorne 59 .2 … og… Da bliver PROBLEM ∷ LØSNING ∷ IV PROCEDURE og for (evt. af observables. med sammensatte fejlled ⇒ potentielt muligt at instrumentere BEMÆRK ∷ bygger vigtigt på antagelsen om. at essentielt set)) gå ud.2 ∷ ortogonal eligibility og en mildere version af og mere SÅ ⇒ direkte estimation kører og vi kan skrive TÆNK ∷ og eligibility uafh. dvs. 2SLS er der ingen yderligere betænkninger ved at instrumentere en dummy!) BEMÆRK Hvis . og ukorr. fx Angrist’s lotteri for værnepligt: er det optimale instrument for (fx probit) og mere ved MLE (fx probit). hvor altså ANTAG ATE. 18.3 ∷ . er korrekt specificeret! for lotterinummer (højt ⇒ nok ind og springe.6 IV-metoder Skriv ligningen som TILLADER tillades at være endogen . men nogen slap && tilfældigt) ANTAG ATE. Tillader heterogene responses – ikke-parametrisk tilgang ⇒ ingen restriktioner på respons. at kovariaterne kommer fra mere “iid-agtige” processer. på og med instrumenter og . er (dvs.ATE. så vil interaktionsleddet med (svarende til.

for . men PROCEDURE 1) Estimér 2) OLS uden IV på og . alt andet for sig 60 .Som ovenstående.1) Estimér BEMÆRK ∷ - ud fra (probit) på med instr . er crucial! ANTAG ATE.4 ∷ . (dvs. 2) OLS af ovenstående ligning.… en masse plus PROCEDURE 1) Estimér 2) OLS på selv). ANTAG ATE. OG og med instr . .4’ .