Samlede eksamensnoter

Indhold
10 Basic linear unobserved effects................................................................................................................. 5 Random effects ................................................................................................................................. 5 Test for unobserved effects .......................................................................................................... 6 Fixed effects ..................................................................................................................................... 6 Inferens ......................................................................................................................................... 7 FD metoder ....................................................................................................................................... 8 Inferens ......................................................................................................................................... 8 Sammenligning ................................................................................................................................. 9 FE vs. FD ...................................................................................................................................... 9 FE og RE – quasi time-demeaning ............................................................................................... 9 Hausman: sammenligning af RE og FE ....................................................................................... 9 10.1 10.1.1 10.2 10.2.1 10.3 10.3.1 10.4 10.4.1 10.4.2 10.4.3 11

More topics in linear unobserved effects ................................................................................................ 10 Oversigt .......................................................................................................................................... 10 Sekventiel eksogenitet .................................................................................................................... 11 Instrumentering .......................................................................................................................... 11 Contemporaneous korrelation mellem en x og u ........................................................................ 12 Individual slopes ............................................................................................................................. 13 GMM tilgang .................................................................................................................................. 13 Chamberlain’s tilgang..................................................................................................................... 13 Specielle ......................................................................................................................................... 14 Hausman-Taylor ......................................................................................................................... 14

11.1 11.2 11.2.1 11.2.2 11.3 11.4 11.5 11.6 11.6.1 12

M-estimation ........................................................................................................................................... 15 Setup ............................................................................................................................................... 15 2-trins estimation ............................................................................................................................ 16 Konsistens og asymptotisk normalitet ............................................................................................ 16 Varians-estimation .......................................................................................................................... 16 Uden nuisance ............................................................................................................................ 16 Var-est med nuisance.................................................................................................................. 17 1

12.1 12.2 12.3 12.4 12.4.1 12.4.2

12.5 12.5.1 12.5.2 12.5.3 12.6 13

Testning (§12.6).............................................................................................................................. 18 Wald ........................................................................................................................................... 18 LM .............................................................................................................................................. 18 Tests baseret på ændringer i objctive function (QLR)................................................................ 19 Optimerinsgalgoritmer .................................................................................................................... 19

Maximum Likelihood estimation ............................................................................................................ 19 Avar estimation............................................................................................................................... 19 Testning .......................................................................................................................................... 20 Panel ............................................................................................................................................... 20 Unobs.eff. and strict exo ............................................................................................................. 21 Lagget afh. var (y-var) ................................................................................................................ 21 Uncond. MLE (UMLE) vs. cond. MLE (CMLE) ........................................................................... 22

13.1 13.2 13.3 13.3.1 13.3.2 13.4 14

GMM ...................................................................................................................................................... 22 Efficiente instrumenter (§14.5.3, pp. 439-442)............................................................................... 22 Classical Minimum Distance (CMD) ............................................................................................. 22

14.1 14.2 15

Discrete Response Models ...................................................................................................................... 23 Linear Probability Model (LPM) – problematisk ........................................................................... 23 Latent variabel model – probit og logit .......................................................................................... 23 MLE (pp. 460-461)..................................................................................................................... 24 Tests i binary response index modeller........................................................................................... 24 Hetsked ....................................................................................................................................... 24 Reporting results ............................................................................................................................. 25 Random Utility Model .................................................................................................................... 25 Specification issues......................................................................................................................... 25 Neglected heterogeneity (c udeladt) ........................................................................................... 25 Endogen, kontinuert variabel...................................................................................................... 26 Når den endogene variabel er binær ........................................................................................... 27 Hetsked & ikke-normalitet ......................................................................................................... 28 Manski’s maximum score estimator – estimation under svagere antagelser .............................. 28 Panel data / cluster samples ............................................................................................................ 29 Pooled estimation ....................................................................................................................... 29 Unobserved effects probit........................................................................................................... 29 2

15.1 15.2 15.2.1 15.3 15.3.1 15.4 15.5 15.6 15.6.1 15.6.2 15.6.3 15.6.4 15.6.5 15.7 15.7.1 15.7.2

15.7.3 15.7.4 15.7.5 15.8 15.8.1 15.8.2 15.9 16

Logit: unobs eff og streng exo (FE logit, skodnavn) .................................................................. 31 Dynamic unobs.eff (state dependence)....................................................................................... 31 Andet .......................................................................................................................................... 32 Multinomial response ..................................................................................................................... 32 Multinomial logit ........................................................................................................................ 32 Probabilistic choice models: ....................................................................................................... 33 Ordered response – ordered logit/probit ......................................................................................... 34

Censored regressions and corner solution models .................................................................................. 35 Tobit ............................................................................................................................................... 35 Estimation ................................................................................................................................... 35 Quantities of interest................................................................................................................... 35 Neglected heterogeneity (§16.6.1) .................................................................................................. 36 Endogenous .................................................................................................................................... 37 Hetsked & ikke-normalitet ............................................................................................................. 37 Estimation under svagere antagelser............................................................................................... 37 Powel estimatoren ...................................................................................................................... 37 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff............................................... 38 Tobit for panel ................................................................................................................................ 38 Sml. med alm. tobit .................................................................................................................... 38 Tobit med unobserved effects..................................................................................................... 39 Dynamic unobserved effects tobit .............................................................................................. 40

16.1 16.1.1 16.1.2 16.2 16.3 16.4 16.5 16.5.1 16.5.2 16.6 16.6.1 16.6.2 16.6.3 17

Sample selection attrition and stratified sampling .................................................................................. 40 Sample selection ............................................................................................................................. 40 Simpel model .................................................................................................................................. 41 ML i sample selection – PMLE .................................................................................................. 42 Sammenligning: ML vs. Heckit.................................................................................................. 42 Ad 2SLS på selekteret data......................................................................................................... 42 Ad 3: Truncation (selektion på y) ............................................................................................... 42 Probit selektion – exogene variable (Heckit).............................................................................. 43 Probit selektion – endogene variable .......................................................................................... 44 Tobit med eksogene forklarende vars ......................................................................................... 45 Tobit med endogene forklarende vars ........................................................................................ 46 3

17.1 17.2 17.2.1 17.2.2 17.2.3 17.2.4 17.2.5 17.2.6 17.2.7 17.2.8

.....................................................5 18..........3 18...................2 18...............1.............5 18................................................................ 53 Essential heterogeneity and IV (sorting on the gain)...........2 17............................................................................................ 54 18.............................................1........................ 55 Switching regression ....................2 18..........................................1 18.......................................................................................1............................................... 51 Before-after .......... designs .......................7 18.............................................................................17................ 53 LATE (local average treatment effects) .....................3............................................. 50 Regressions and switching models ....... 57 ATE skrevet som funktion af p..... 47 Attrition – man vælger at udgå af sample...............2 18..........................................................3 18. 58 IV-metoder......................... 56 Regression disc..... 50 Nonparam id – ignorability of treatment ........................9 18................................................................................................................................1.... 48 Non-parametric bounds ..............3.......................................................3...............................................1............1 18........................................................................... 57 Propensity score .....1 18................................................................1.............................6 18...............................................................8 18..............1....................... 49 Noten .....3..............1......................................................................3.....................................................................3................................ 49 Treatment effects .................................................................. 54 Sammenhæng med den simple sample selection model .................... 52 Heterogene treatment effects (v0 ≠ v1) ... 58 Matching .........10 18.............. 50 Regression discontinuity ........................................1....................................................................... 57 Regressér y på w og p-hat .... 51 Selection and treatment effects .............................................4 18...................3............................................................................... 55 Mere parametrisk tilgang .........................................................4..............................................2 18................................................... 52 Estimation af ATE ved IV under antagelse af homogen treatment effect ........................................4 18... som estimeres med probit....................... 46 Fixed effects på ubalancerede paneler ... 48 Inverse probability weighting (IPW) .................................4.............1 18.......................................... 46 Test / korrektion for sample selection bias .....................................6 Ikke-parametrisk tilgang ..........3 17....1 17................................. 56 Svagere antagelser – to ukendte g-funktioner ....................................................3 17...........................4 17..................................................................................................4 18 Paneldata: Sample selection ...................................................................3 18............................................................................................... 59 4 ..........................................................................................................1..

i composite error term pr. . 10.1 Random effects IDE ∷ udnytte ser.IV (2SLS) . Tilstrækkeligt for konsistens ∷ ii. konstruktion FREMGANG – 2 spørgsmål 1) Er korreleret med for noget ? 2) Holder streng eksogenitet (betinget på )? NAVNGIVNING Random Effects ∷ Fixed Effects ∷ . . 2) Rank ∷ . EKSOGENITET Hvis vi kun betinger på ’er ∷ ⇒ dvs. . er without loss of generality når der er intercept. i.korr. hvor For efficiens ANTAG YDERLIGERE 3) Efficiens af RE a.10 Basic linear unobserved effects CROSS-SECTION ∷ Løsninger på uobserveret heterogenitet. i ANTAG 1) Ortogonalitet a. Antager balanceret panel – ubalancerede håndteres senere.korr. b. ækvivalent med streng exo ⇔ BEMÆRK -lags ⇒ streng exo kan aldrig holde ∷ ⇒ . b.Proxy . Da er ESTIMATION Alm. .→ desuden giver -lags ser.Indikator-IV PANEL Antager er tidskonstant BEMÆRK ∷ ⇒ tidskonstante ’er kan ikke identificeres separat fra . FGLS varians 5 til at lave GLS .

i ? .korr. hvis muligt F-TEST Brug 10. Evt.hvor Første trin baseres på pooled OLS. dvs. 2) 3) OBS! FE1 + FE2 ⇒ unbiasedness ESTIMATION (kun nødv.X) 1) a. Test for unobserved effects IDE ∷ svarer til at teste (hvilket svarer til at teste ser. … brug dog robust varians. OBS! ⇒ b. c.korr.2 Fixed effects ⇔ ANTAG (FE. AR(1)-test. i ULEMPE ∷ streng exo ⇒ må ikke indeholde laggede ’er! 10.1 fra modellen til at udregne både og (selvfølgelig). . tænk 6 . dvs.1. ⇒ . for efficiens af FE) OBS! ⇒ streng eksogenitet. specielt ⇒ . men bedre at teste direkte på ) PROBLEM ∷ hvad er LØSNING ∷ streng eksogenitet giver FORDEL ∷ opdager mange typer ser.

Men betydningen svinder som ∷ PROBLEM ∷ FE-transformationen introducerer serielkorrelation i MEN ∷ det bliver et mindre problem (??) Robust varians og seriel korr i idiosynkratiske fejl Seriel korr i ? ∷ reg på for alle Problem ∷ vi har ikke ⇒ vi kan udnytte.PRAKSIS Premultiply med eye(T) – T^-1 * ones(T. FJERN FE. Fixed Effects GLS ANTAG . 10.T). pr.3. Da er fordi (unbiased).1 Inferens INFERENS ⇒ PAS PÅ! fås ved først at beregne . konstruktion . robuste variansestimator og test som er robust for heteroskedasticitet og seriel korrelation i ⇒ kan bruges til at lave Wald-tests. at Problem ∷ serielkorrelation under Løsning ∷ brug flg. ⇒ muligt at lave en GLS analyse 7 . LSDSV for alle ⇒ incidental parameters problem. og så udnytte .2.dvs. NAVNE Within ⇔ within each cross-section ⇒ HER Between ⇔ between each cross section Viser sig ∷ FE = Least Squares Dummy Variable Estimator ∷ → svarer til at estimere MEN ∷ stor ⇒ på dummies for personer. giver idé om fordelingen af heterogeniteten i populationen.

som har rang på kun !! Dvs. homoskedastisk. b. hvis det var givet at man ville deltage. inferens valid under POLS på Δ’et data! 10. c.Vi mister én periode! Alle ’er skal variere over .1 Evt. (huskeregel: I FD har vi af 2 stok var ⇒ selv stok var ⇒ alle antagelser laves på den. b. at LØSNING ∷ Drop en tidsperiode og lav GLS 1) Estimér 2) Estimér 3) Estimér ALTERNATIV Man kan specificere en eller anden struktur på MEN ∷ efficient hvis korrekt. Fx BFN (1982) antager stabil. og udlede en stuktur på afh. hvor deltagelse ⇒ i et program er betinget af karakteristika før programmet .1 Inferens OBS! Ikke nødvendigt at tænke så meget som i FE – alm. OBS! ⇒ streng eksogenitet. 2) 3) a.3‼ FD. kan FE godt være konsistent selvom POLS / RE ikke er det. inefficient ellers. dvs. . bare være ukorr. (FE. bare ikke hvornår??) 10. kun af . for efficiens af FD) random walk Som FE. AR(1) ⇒ Generelt: policy implementation Faktisk er ortogonalitetsbetingelsen jo ⇒ dvs. ikk invertibel! og drop så en tidsperiode (fx den ’te) fra datasættet. inferens @ POLS på Δ’et data er valid. .Under FD.1-3 er alm. tænk . som bliver deterministisk når 8 . VIGTIGT . hvis ortogonaliteten overholdes (dvs.3 ⇒ ) (kun nødv. med før vi får konsistens! Egentlig skal .3 ⇒ BEMÆRK .PROBLEM ∷ det viser sig.3. I FE har vi stok ) var minus noget.3 FD metoder ANTAG 1) a. hvor MODSÆTNING til FE. i nogle situationer.

FD ⇒ FE = FD valget afh.4. GLS ∷ OBS! FE-GLS og FD-GLS er asymptotisk ækvivalente 10. autokorr med . at RE estimation svarer til at estimerer 10.SERIEL KORR i Kør reg → alm.4.2 FE og RE – quasi time-demeaning Det viser sig.4 Sammenligning 10.1 FE vs. som har ens ’er. Hausman: sammenligning af RE og FE ULEMPER 9 . af antagelser om OBS! Endogenitet (målefejl. same men I FE framework) .udeladte. 10. dvs.4.3 ∷ POLS ∷ FE for for ∷ for store ∷ er RE ≅ FE dominerer ⇒ brug FE RE ∷ Hjælp til en estimator i nød Inkludér dummies for grupper der er meget ens. bør være insign (den er taget højde for). tidsvar. FE) modellen er korrekt og (evt. -test af OBS! ukorrelerede ⇒ . simultanitet) ⇒ både FE & FD inkons med hver sin plim! TEST ∷ STRENG EXO IDE ∷ hvis FD (el.

at den bliver ikke-pos.t. ikke fra hver sit – ellers risikeres.t.’ed) style) time-demeaned (de tidsvarierende elementer i eller Wald ). på på q.def. Bruger within-group info ÅRSAGER (alm. fra et framework.1) Streng eksogenitet antages både under og 2) RE3 antages at holde under . 11 More topics in linear unobserved effects 11. en skør asymptotisk fordeling) IDE ∷ Det viser sig.) 1) Udeladt tidsvarierende variabel 2) Simultanitet mellem og 3) Målefejl i SKAL BRUGE ∷ instrument ukorr med → nogle gange kan panel-aspektet bruges 10 (transformer ⇒ fjerner og ∷ brug så IV) . ⇒ kør så -test af koeff. at under RE.d. (FE- … kan evt. i (kun efficienshensyn) predetermined ∷ brug IV/GMM FD ligningen og brug laggede niveauer som instr. er Test-str. ∷ udnytter kun within-group info. gøres robust for RE3 i denne setting ∷ brug robust Wald. Valg mellem FE/FD afh.str. af antagelser af tidsserieafh. 1 VARIABEL BEMÆRKNINGER kan klares @ aux regression af quasi time-demeaned (q. er: - Sædvanlige estimetorer for MEN ∷ brug bruges.d. FD. vi tester a. Dvs.1-RE.3. (ellers får test.’ed samt en alm.1 Oversigt Antagelser Foretrukket model RE ∷ udnytter både info within og between grupper FE el.

compl.exo. . ⇒ hjælper på efficiens.Hvis .. MULIGE INSTR I FD ⇒ ⇒ ⇒ (alle) laggede niveauer (og funktioner heraf. (da på hinanden følgende perioder) Instrumentering FE ∷ kræver strengt eksogene instrumenter FD ∷ kræver seq. 11. indgår allerede som regressor eller som IV Anderson & Hsiao (1982) ∷ foreslog med ) ≅ ⇒ er svage instrumenter.Blundell & Bond ⇒ antog EFF. instr for (husk.GMM @ alle instr’er ) kan instrumentere . ⇒ .2 Sekventiel eksogenitet ÆKVIVALENT (når modellen tages i betragtning): Når og er kontrolleret for.11.2. fx Δ’er) (op til ⇒ bl.1 ⇒ OBS! Bias uaf.exo. af fordi . hjælper det ikke yderligere at kontrollere for fortiden af ! OBS! MILDERE antagelse end BEMÆRKNING . FE OG FD ER INKONSISTENTE! FE ∷ Bias introduceres fordi fremtid er i tidsgns. er det ikke sikkert.a.exo.) AR(1) model ∷ Arellano & Bond (1991) ∷ Bruge alle tilgængelige som IV @ GMM (ej muligt i 2SLS da #instr varierer 11 . trukket fra steady-state distr. ⇒ dyn. eneste problem er og BEMÆRKNINGER lille ⇒ stor varians… Selvom instr. at de er relevante. gyldige. vil seq. er inkons af odten MEN ∷ hvis yderligere det antages at FD ∷ Bias fordi to på hinanden følgende perioder sættes sammen når vi kun har seq. Seq.exo. så ⇒ er weakly dep. men realisme?? . instrumenter.

2 .. hvor seq.exo. når ( ej str.Nogle x’er str. . nogle seq.exo. så BEMÆRK ∷ simultaniteten kommer nu ikke fra det. men er med ”dobbelt” (hver gang sammen) lagget (siden kunne bruges. kan være sit eget instrument – brug ) som instr for Contemporaneous korrelation mellem en x og u 3 mulige ophav: 1) Udeladte tidsvariante forklarende variable 2) Målefejl 3) Simultanitet a. FD bedre end FE .korr. men kun ). at vi lagger. og str.korr.2. i .exo. (kan alternativt løses ved at medtage en ligning for den simultane var’s bestemmelse) FREMGANG 1) Transformér data (FE eller FD) 2) Brug IV af en art – hvilke instr’er afh. exo) 11. på Δ’et data Arellano & Bond (1991) foreslår GMM-baseret test for ser. af anvendelsen. ↷ skriv op en ligning for . men inducerer muligvis endogenitet hvis ( (dvs. Eksempelvis Model: → klart at FD + IV ∷ FD ⇒ fjerner seq.FD er robust for mere generelle overtrædelser af str. men det kræver.Vi kan teste for ser.exo end FE . at der ikke er seriel korrelation i (i niveau) ikke indgår i ligning kan den måske bruges som IV → men formentligt SVAGT!) og er ALTERNATIVT ∷ - MULIGHED 2 ∷ EKSTERNE INSTRUMENTER FIND nogle eksterne instrumenter og kør POOLED 2SLS på 12 ..exo. Simultanitet MULIGHED 1 ∷ LAGGEDE OBS! og ’ER SOM INSTR’ER kan kun estimeres med fordi er korrelerede for alle .

5 Chamberlain’s tilgang ANTAG Streng eksogenitet ∷ indeholder kun tidsvarierende variable og . FE) ↷ efterfulgt af IV Ikke altid oplagt smart bare at bruge laggede variable ⇒ find eksternt exo instrument Målefejl (I classical errors in variables under str.3 Individual slopes METODE ∷ FD for at slippe af med HUSK ∷ FE var som at estimere model med individuelle intercepts hvis er ser. (dvs..4 GMM tilgang MOTIVATION ∷ hvad hvis 3SLS kan være bedre end alm. vi har.1) MEN ∷ Tillad arbitrær korrelation mellem IDE ∷ Erstatte - Pr. 13 . ⇒ så er FE på Δ’et data konsistent & asym.Udeladt tidsvariant variabel FD (el.1 ⇒ SYSTEM og . konstruktion er .exo. RE (mere fri ) Men bedste er fuld GMM / minestimation med fuld frihed i vægtmatrix (RE) eller ikke var konstant? 11. 11. Hvis der er seriel korrelation i målefejlene. ∷ FE forværrer målefejl) Vi må finde et instrument udover de variable. homosked (betinet på ). og generelt! ∷ Vi kan altid skrive . med projektionen på .MEN ∷ INDSÆT .normalfordelt (men ej asym efficient) 11.FE.ukorr. FE. . kan vi måske bruge som instr for .

1. men så ville -leddet gå ud. som instrument for hver tidsperiode og med den 1) 2) 3) ej lineær i ej konstant ∷ ∷ system skalar-varians ∷ system homoskedasticitet Denne failer hvis ∷ ej homosked.1 Hausman-Taylor FORMÅL ∷ identificere effekt af tidskonstante variable i tilstedeværelsen af MODEL ANTAG 1) 2) BEMÆRK 1) giver.exo. ∷ forkert fkt.Test af over-ID ⇔ test af str. Omskriv ∷ str. IDE ∷ vi vil udnytte 2) samt at 1) medfører ⇒ ⇒ ⇔ ANALOGIPRINCIPPET til at estimere . form for ej homosked (??) 11.6.6 Specielle 11. MULIGE ANTAGELSER    HVIS Begge opfyldt ⇒ SOLS efficient (??) Failer ⇒ FGLS kan bruges GMM er mest efficient med optimale vægtmatrix.System-OLS er konsistent under FE. . exo 14 . at FE kunne bruges ⇒ vi får så .

på RE struktur 3SLS med urestrikteret GMM med efficient vægtmatrix 12 M-estimation 12. hvor . som er korrelerede med ) TILGANGE ∷ i rækkefølge med stigende robusthed. valg Hvis konvergensen er uniform. med ) instrumenterer 3SLS med (de tidskonstante. 15 .… han viser det for en mere generel model GIV (generalized IN) TANKEGANG Bruge som instrumenter instrumenterer instrumenterer sig selv (de tidskonstante.1 Setup SPECIFIKATION Karakteristik af fx . hvor IDENTIFIKATION . minimerer LHS pr. som er ukorr. vil . - minimerer RHS hvis modellen er identificérbar.

2) Strukturel estimation ∷ givet Udnyt fx i.1 Uden nuisance estimeres altid på samme måde! afh. 16 . → smart hvis betingning på . Udregn b. da vil hvor Dermed er 12. Udregn ii.2 2-trins estimation løser Trin 1: Estimér .3: Lad alt muligt gælde. ∷ så .4 Varians-estimation 12.12. 12.4. indsæt og tag sample avg.3 Konsistens og asymptotisk normalitet TEOREM 12. hvordan vi vælger . Altid mulig – men tung og måske ej pos. ØNSKE ∷ konsistent uanset.def. a. Trin 2: Estimér . giver en simpel form (fx i probit bliver led = 0) samt (eller ). af humør: 2 TILGANGE 1) Håndværkertilgangen ∷ udregn a. Udregn iii.

Analogiprincippet Brug Analogiprincippet til at estimere med

DVS ∷ 1) Udregn lukket-form udtryk for og som funktion af og a. Dvs. differentier to gange mht. . 2) Evaluér sample avg. af disse udtryk. OVERVEJELSER NEGATIVT ∷ tung at regne, ej sikkert pos.def – men den er det hvis POSITIVT ∷ altid tilgængelig unikt løser sample problem.

Strukturel tilgang – evaluér forventninger Givet en fordeling for OVERVEJELSER NEGATIVT ∷ kræver streng antagelse om POSITIVT ∷ efficient! , kan vi blot udregne direkte: som og som .

Mellemting – antager kun fordeling for y givet x Hvis vi ikke vil antage fordeling for hele Definér

, men måske kun for

.

⇒ Så analogiprincippet motiverer

12.4.2

Var-est med nuisance

Vi kan altid bruge den generelle

Alternativt:

-

hvor

med

. 17

-

hvor hvor (og som et slags generaliseret residual.

, er en bøvlet, grim funktion, som formentlig skal tænkes på

2-STEP M-ESTIMATOR VARIANSEN ER DA BEMÆRKNINGER OBS! er lineært separable I den ”almindelige” effekt og ”nuisance” effekten ikke! (den bliver interageret på kryds og tværs pga. ”^2”) selvfølgelig indgår i . , MEN det er

MEN ∷ bemærk, at

12.5 Testning (§12.6)
12.5.1 Wald

Testes ved

hvor ULEMPE Ikke skalainvariant ⇒ problem (primært/kun?) ved ikke-lineære hypoteser: man kan omformulere indtil man får den ønskede konklusion. FORDELE - Estimerer kun den ”store” model - Kan gøres vilkårligt robust 12.5.2 LM , kan vælges robust (når Jacobi-matricen for (skal være invertibel) ( ) eller evt. højde for nuisance)

IDE ∷ hvor langt er FOC fra at være opfyldt OBS! Restrikterede model (” ”-modellen) skal være nested i en større model SETUP Imposer o kontiniuert-differenntiable restriktioner på , så , hvor og og . Fx ∷ under , hvor sættes til konstanter fx og Matematisk, restriktioner Vi lader da

18

Hvis GIME (generalized information matrix equality,

og

)

1)

(hvis reparameteriseringer.

opdeles i endo

og exo ) ∷ Foretrukket hvor mulig (bedre small-sample) ’erne ej pos.def.; ii) tung at udregne; iii) ej invariant for for ofte)

2) Hesseform ∷ i) kan være neg hvis

3) Outer product of the scores ∷ Simpel at udregne, men size distortions (typisk afvises FORDELE - Estimerer kun den “lille” model. - Med forventet hesse er den ofte invariant for reparameteriseringer. ULEMPER - … 12.5.3 Tests baseret på ændringer i objctive function (QLR) og

ANTAG at GIME holder ∷

ULEMPER - Forudsætter, at GIME holder og kan ikke gøres robust for dette.

12.6 Optimerinsgalgoritmer
MANGLER DETTE AFSNIIT‼

13 Maximum Likelihood estimation
13.1 Avar estimation
Definitioner:

(og hvor

.) 19

CIME) c. Lad være estimatet når de restriktioner er pålagt og uden. antagelse om korrekt specificeret model) holder teorem 13. 13.Bemærk. i ML Alle flg. hvor slemt overtrædes FOC?) Lad Da vil være vektor af afledte af evalueret ved de restrikterede estimater. måske dårlige egenskaber selv i relativt store sample sizes. for BEMÆRK! Vi antager IKKE. dvs. 3) Lukket form! Kan evt. mere kompleksitet skal dælme give mere forklaringskraft!) Lad LM (hvor langt er hældning fra nul. at i visse tilfælde er simpel selvom er bøvlet (fx probit. . der betinges på (!). 2) BHHH.def. 13.3 Panel Lad være den sande pdf. Fordele: a.Under regularitetsantagelser (bl.a.def. 396). . dvs. simuleres. . idet der betinges på så nogle led bliver nul i forventning.2 Testning OBS ∷ asymptotisk ækvivalente! Kun finite-sample overvejelser Wald LR (Like-ratio – ala -test. når den findes (jf.3. 1) Kræver beregning af de 2. i ML sammenhænge) i stedet for som i teorem 12. at 20 givet .2 (p. Under er hvor avar-estimatoren kan vælges blandt de 3 nævnte . .-afledte af en eller funktion b. p. afledte – ikke garanteret pos. Bedre finite-sample props end BHHH KOMMENTARER .… vælg ud fra small-sample eller beregninsgmæssige betænkeligheder. 3 matricer konvergerer til den sande Avar (p. 396) ∷ baggrund: hvor . Afhænger (typisk) kun af 1. 395) (fordi Dvs. Garanteret pos.

at 2 possibilities - I begge tilfælde antager vi.3.eff. betinget på 1) Integrate out Da er den simultane tæthed for Og log-like er 2) PMLE-agtig tilgang Antager intet om fordelingen af (givet ) I stedet siger vi.2 Lagget afh. Men vi antager. af når vi kun betinger på . .- (dvs. ”isoleret set”. var (y-var) Ingen problemer når blot vi har specificeret dynamikken korrekt. antager ikke ) er en korrekt specificeret pdf for for hver periode. vil (unikt) maksimere for ethvert . . da er Hvis denne korrekt specificerede tæthed er betinget på hele fortiden er lig med distr af 21 .3. at fordelingen af ∷ antag og er uafh. DYNAMIC COMPLETENESS er når distr. at Smart teoretisk figumdik Definér det partielle likelihood bidrag som SMART ∷ Da er korrekt for alle .1 Unobs. at vi for hver enkelt kan få tætheden af Nu vælger vi hvilket er et slags PMLE problem 13. 13. and strict exo kan være en vektor ( )) er givet ved . givet ved (korrekt spec) (han tillader. ⇒ specielt vil den maksimere summen.

1 Efficiente instrumenter (§14. 14 GMM 14. metoder. at . for … meget svært! ASYM VAR ∷ justér for at tage højde for at begge params. MLE (UMLE) vs. 13. ku man ha fundet distr. (desuden skal Til også estimeres) skal der typisk bruges ikke-param. estimeres typisk ved at antage en art homosked. 439-442) Lad og . væk. estimate Reduced form. og smider dermed al denne info væk → vi kalder det UMLE. .Og vi kan igen integrere - ud. pp.3.5. hvor ” ikke er en funktion af ”. Desuden opnår vi samme efficiens som CMLE. Alt. vi skal lave skal håndteres INITIAL CONDITION PROBLEM ∷ LØSNING ∷ betinger på (/antager) Her er betingningen på KOMMENTARER .Vi smider den første obs. at der i fordelingen af I CMLE betiner man på er information om . når man ikke betinger på HVORNÅR ER DE LIGE GODE? Når . estimeres.4 Uncond. PROBLEM vil næsten aldrig være kendt ⇒ skal estimeres. 14. cond. Da er det optimale valg og med dette valg er det ikke nødvendigt at bruge en vægtmatrix i GMM. MLE (CMLE) Generelt er det muligt. dvs. dvs.2 Classical Minimum Distance (CMD) IDEA SETUP Function maps 22 Structural problem.

godt initialt estimat af . Predikterede værdier uden for . løses vha. WLS .2 Latent variabel model – probit og logit KOMMENTARER SKALA IRRELEVANT ∷ Indekse Hvis fx (eller ) kunne være skaleret arbitrært . … kan evt. monotont voksende) på er den samme ( ⇒ Derfor: normalisér med Retningen af effekten fra Fortolkning af ’erne 23 . KOMMENTARER . 15 Discrete Response Models 15. for et valg af og . er .… men evt.Hvis dummies udgør en klassedeling. da . er der automatisk heteroskedasticitet. inden 15.1 Linear Probability Model (LPM) – problematisk PROBLEMER Siden variansen for en Ber(p) variabel er afh. af . giver de bare gns.METHOD Estimate Choose .

LR ∷ Kræver begge estimeret.1 MLE (pp.3 Tests i binary response index modeller Muligt med Wald.kor. 460-461) Like bidrag Log-like function Det kan vises. på og .15. KOMMENTARER . HVIS 15. at og Så . MEN ∷ ej invariant for reparameteriseringer Hetsked modellen meget besværlig (LM foretrækkes) ⇒ Her er så vi omskriver LM test . så er også . LM ∷ Smart hvis den store er bøvlet. LR og LM. LM.’er ⇒ MEN ∷ hvis naturen af ML). fra reg af .2.Bøvlet augmented regression ala alm. 24 .) (ligger i 15. Muligt med Huber-White robuste s.1 Lad Da er . Kan gøres som auxillary regression. udregnet ved og er misspec.mult. (disse er . WALD ∷ problematisk når den store model er for stor ( har høj dim). ER IKKE-LINEÆR Wald foretrækkes.Denne er invertibel så længe der ikke er perf.3.e.

≅ Smag og behag. ≅ . hvordan dummies håndteres. log-like fra unrestricted. probit på den med reglen: Vælg bil hvis . avg. w/o loss of generality) . 15. ordens lokal Taylor) (se p. part. std. ) partial effects (kaldet APE. - Evaluere i gns. . hvor Bemærk.6 Specification issues 15.5 Random Utility Model og så kan vi køre helt alm. personen – dvs. STÆRK antagelse Antag Attenuation bias: PROBLEM Ønsker ∷ Partial effect: Men probit giver os Probit kan ikke estimere partial effects evalueret ved BONUS konsistent . 467 for detaljer) - Response probabilities ∷ - 15.)) log-likelihood i model med kun intercept.6.eff) 25 . da er . .15. Delta-metoden (2.1 Neglected heterogeneity (c udeladt) Antag sande model er Latent form ∷ ( . så er ≅ in ved . c og x uafh. hvor .fejl fås vha. ≅ . Probit kan godt estimere de forventede (mht. hvis .4 Reporting results Percent correctly predicted (#gange Pseudo .

udtryk IDE ∷ får 1) Reg 3) Probit 4) Udregn 2) Estimér på ↷ . 26 ⇒ dvs. Skriv - ⇒ ingen endogenitet 2-trins test for endogenitet (Rivers & Vuong. afledte eller differenser af flg. kontinuert variabel Antag Mistænker . samme argumenter som ved neglected heterogenitet som vi gjorde med (? eller hvad?)) spiller altså ikke ind i første ligning ’s fordeling kræves.2 Endogen. kan vi skrive . 1988) Antag Under bivariat og . Så er probit generelt inkonsistent 15.⇒ Nu kan man vise. . kan vi tænke på TEST Hvis . på … så probit af på som vil (mao.6. ved at reg på ↷ . at … (lang tung snak) … METODE MÅL ∷ APE’s ∷ dvs. er og pga. ingen strenge antagelser på .og c og x ikke uafh. Da vil .

∷ Antager ∷ ⇒ udregninger ⇔ ⇔ således at likelihood bidragene er og testes @ asymptotisk -test. Denne gang bliver . at genbruge tankegangen bag hvordan vi fandt 27 .3 Når den endogene variabel er binær KORT FORTALT Både varians af Kan ikke løse for og må normaliseres for at få identifikation → den må integreres ud er grim! LANGT FORTALT kan fx være deltagelse i fx jobtræningsprogram.fejl korrigeres for 2-step . asym Alternativ til Rivers & Vuong (smartere. da R&V er en limited information procedure) FREMGANG Udnyt Ad Ad Ad ⇒ ⇒ normalisering ⇒ identifikation af discrete response endo.kan testes vha. ”den sædvanlige” (?) -test på → dog skal std. (proceduren er sindssygt svær at læse sig til!) Idéen er (vist).6. 15.

6.6. at spiller rollen af integrationsdummy) Eksempel: College attendal and catholicism (Evans & Schwab. Men hvis fx det er fordi logit er den sande model. og 28 . og er ikke restrikteret. idet ⇔ (inden i : -integralet) Vi når frem til (bemærk. Ulemper: Konvergerer med rate Vi kan ikke differentiere Nogle gange har modsat indflydelse på .5 inkonsistent godt være ret tæt på. kan Manski’s maximum score estimator – estimation under svagere antagelser . at og til det bruge tætheden af er en trunkeret normalfordelt variabel. at (fordi Fordele: Robust: og Estimerer må godt være afh. konsistent op til skala – god til fx (selvom Horowitz (1992) har en smoothed version med næsten . så ingen partielle afledte. 1995) går man i college eller ej 15.4 er man katolik eller ej Derved tillades at afhænge af uobserverbare faktorer. .Så skal vi tage forventningen → til det skal vi bruge. Hetsked & ikke-normalitet Hetsked Antag i latent-variabel-formuleringen: Non-normalitet Så er 15. ) ⇒ (medianer kan ikke være kommatal) Antag (og bemærk.

⇒ sample kan ses som en stort cross-section af str.7. Estimér . korr. → men stadig ikke attraktiv for binær-respons data.7 Panel data / cluster samples Med LPM modeller kan man evt. .7. hvor . er strengt eksogen betinget på (specielt indeholder siden nok lags osv. .15. FD eller RE. ikke-linearitet Proxy for (når interesse er i APE) Pooled analyse (når interesse er i APE) Estimér ∷ Fixed effects probit (dumt navn!) Åndssvagt! Ser ville være perf.) BERTEL’s noter ∷ ingen lagged dep. Lag. må fx godt indeholde laggede variable. bruge FE.2 Unobserved effects probit ANTAGELSE Dvs. . . altsådyn. at .) (OBS! man må droppe tidsperioder – ellers 15.vars Fixed effects ∷ fjern ved transformation .var ∷ Estimér den potentielt syge. hvor er .compl.SVÆRT pga. som ej findes. Jacobian af (§12. inferens OBS! Betyder ikke tidsuafhængighed – Betyder blot.1) Brug robust var-est. DYNAMIC COMPLETENESS ⇒ alm.compl. TEST for dyn.dep.6. 15.1 Pooled estimation Model: PMLE-estimation (partial MLE) ≅ pooled - er konsistent uden videre antagelser. med dem (?!?!?!) MULIGE METODER som parameter ⇒ #params → ∞ for 29 .

- .eff.MÅL ∷ tillade sammenhæng METODE ∷ specificere betinged Antag . for med konstant varians. in press) har simulationsmetoder Chamberlain’s random effects probit .. ). 5) SVAGERE ANTAGELSER . hvor ( for hver std. -  Error form ∷ .  Restriktiv.?? Simulation @ int ≅ tage forventning 1) Træk 2) Beregn 3) Beregn 4) Tag gns.  3)       Max log-like mht. ved Men hvorfor kan de pludselig det her når de ikke kunne i alm.Response prob.eff. men robust for fejlspec af denne. ikke . unobs. hvor tillades fuld frihed i off-diagonal (og 1’er i diagonalen) Slem curse of dim!  Men. Keane (1993. .Kræver specifikation af CMLE @ Fuld korrelation .Generalized estimating equations . specificeres kun betinget på .normaler ↷ .ANTAGELSER    1) Streng exo ∷ 2) Uafh. . men tillader dog noget samspil (modsat trad.Diskussion: man betragter Traditional random effects probit .REprobit) Indsæt i ligning: 30 . ⇒ ⇒ som ikke-tilfældig… modsat hvad vi vil gøre! (betinget på ) && ud af ! METODE ∷ integrér og ‼ ) og (APE) kan godt estimeres! HURRA ∷ både INDSKUD ∷ integration Numerisk @ quadrature (part. og logs.

som ser FORDEL ∷ effekten på log-odd ratio. ikke engang . eller i begge år duer OBS! Kun observationer. ULEMPER 15. Logit: unobs eff og streng exo (FE logit. average den ud. er strictly exogenous conditional on . hvor ikke. skodnavn) så vi (nemt) kan integrere mht. som paramter. idet. fx ingen lags af dep. outcome må godt påvirke response prob) ∷ . antager str. NEDERN ∷ ik muligt at specificere tæthed for - OPTUR ∷ muligt med FE/FD-agtig approach! → viser sig at Log-like i hvor tilfældet: hvis og hvis falder ud når vi betinger på svedig feature ved logit-formen gør det muligt at få en funktionel form. intet at gøre med FE probit.eff (state dependence) Grundlæggende model BEMÆRK ∷ dvs.var. ! 15. i   muligt at droppe antagelsen arbitrær seriel korrelation.exo Tidl. at → dvs.- INTUITION ∷ Tilføjer tids-gns som kontrolvariabel ∷ partial eff. INTERESSE ∷ State-dependence efter der er kontrolleret for JOINT PROB 31 . da den observeres) BEMÆRKNINGER Hidtidige udledninger ∷ afhænger kritisk af. ! APE’s kan heller ik findes når vi ik har nogen antagelser om distr for Forudsætter Dynamic unobs.7. hvor NAVN ∷ fixed effects logit ⇒ SKODNAVN. bidrager. af Udvidelse ∷ Tillade tidsafh. den. dvs.4 Kan ikke estimere partial effects medmindre vi indsætter en værdi for Men hvilken værdi skal vi vælge? Ingen restriktioner. der ik afhænger . Så kan vi dog kun finde APE’s ved at integrere ”integrere” når tidsgennemsnittet holdes fast! ⇒ måde at kontrollere for uobserverede personspecifikke effekter ⇒ så skal inferens dog gøres robust for ud (hvilket i praksis kommer ud på at ud (dvs.7.3 TEST for streng exo ∷ add bare nogle lags og se om de bliver sign. obs.

dernæst specificere b.7. Kategorier Hvor og (samme ’er i hver kategori – bare med forskellig param) 32 . Chamberlain probit. a. a.lign. hvor c. fås vha.Fx Manski for Cluster samples brugt på differenser Pooled probit/logit ∷ brug dog de robuste varians-estimatorer. Alm. styk.8 Multinomial response 15. 15.prob. Std. a.a. dernæst for Svært at vælge tæthed. . bootstrapping el. som ikke-stokastisk Streng antagelse ∷ medfører bl.8. 15. og tilføjes i alle tidsperioder ( -subscript viser APE’s mv.1 Multinomial logit . Førende eksempel . dvs. ∷ tag MLE params og multiplicér med dette). 1981) følge probit med resp.INITIAL CONDITIONS PROBLEM ∷ hvad når vi når til 4 muligheder 1) Se a. kan fx vælges som Chamberlain.5 Andet Semiparametriske metoder . I PRAKSIS i. . dernæst for ? modelleres ikke! 2) Specificere tæthed for 3) Approksimere tæthed for Fx lade 4) Betinge på . (Heckman.fejl. .

lign. afhænger kun af karakteristika for og er .8. skal afhænge af karakteristika ved RESULTATER BEGRÆNSNINGER Independence of Irrelevant Alternatives - Dvs. men ok med pris på o. Hvis skal være .2 Probabilistic choice models: Primarily. relative odds mellem og → så hvis kun konstant. but conditional probit is a nice extension (although it has some computational issues) Conditional logit Derived from underlying utility-maximization model ANTAG ∷ REMARKS .Elements of TypeI Extreme Value differ between alternatives can’t contain elements that don’t vary across alternatives! Dvs. dvs. ikke udd.RESULTATER Partielle effekter har en meget besværlig form. hvilket er urealistisk. LØSNINGER 33 . erfaring. men odds bliver pæne: LIKELIHOOD 15. we’ll look at conditional logit. karakteristika for ⇒ håndterer en helt anden type data – valg af alternativ netop .

MEN ∷ besværlig beregning (inkl.9 Ordered response – ordered logit/probit Valg har ordinal. Vælg i stedet for ⇒ ordered logit Valg kan tillægges tal. Idé ∷ indfør 2 lag ∷ først vælger man mellem grupper. 50% eller 75%?” ⇒ ingen betydning for estimation. Dog: simulationsmetoder 2) Hierakiske modeller ∷ fx nested logit model a. men ikke nødv. derefter vælger man inden for de enktelte grupper (betinget på at vælge gruppe . Ellers ∷ Evaluér ved referenceperson / rapporter % korrekt predikteret BEMÆRKNINGER Hverken eller har separat betydning. fx ”hvor mange % sætter du i aktier. I tillades . c. 25%. men teknisk bøvl OBS! Nu giver faktisk mening. 15.1) Multinomial probit (= conditional probit) a.EFF ∷ (dvs. hvor kovarianser er urestrikterede. ) ∷ @ Chamberlain tilgang (antag+approx pdf for INTERVAL-KODET DATA Samme idé. og har fortolkning som om det var OLS! 34 . men ikke kardinal nytte (2 er bedre end 1. men giver mening til . halvt så meget som 4) Del op Response probs: INTET INTERCEPT i Loglike ∷ ’erne spiller rolle af intercept (for er interceptet) (og vælg som sædvanligt RESULTATER med . og integrér ud) . -dim integral) b. er der conditional logit blandt alternativer i den gruppe.UOBS.

UDLEDNING Derfor fordi . MLE .1 Tobit ANTAG ∷ 16. Observerer 2) Corner solutions a. Estimation TÆTHED ∷ ens for Cond.Corner solution ∷ den faktiske variable.log.like INFERENS .1. 16.16 Censored regressions and corner solution models 2 typer 1) Censored data a.Alm.1 ⇒ . . af model: Censoring ∷ den latente variable.Wolle giver første/anden afledte 16.2 Quantities of interest Afh. så - 35 . .1. eller .

16.eff. - Så er EKS Diskret: og 36 .’s er bare skaleringer af .6. vil vi have LØSNING ⇒ integrér ud. dvs. eller (?? p530??) ? ANTAG ∷ PROBLEM ∷ skal håndteres eksplicit LØSNING ∷ integrér ud.2 Neglected heterogeneity (§16. tobit konsistent for CORNER ∷ måske.(specielt.De part.PARTIAL EFFECTS BEMÆRK‼ . skaleret med Fra NOTERNE: ’erne -variable ⇒ vi forventer ) RESULTATER CENSORING ∷ husk. CORNER ∷ vis er interessen ⇒ rapportér . ANTAG ∷ har pdf.1) KONKLUSION CENSORING ∷ intet problem.

16. - Fuld MLE ∷ specificér simultane fordeling af de endogene vha. - TEST ∷ i begge settings testes - DOG ∷ ML en del tungere beregningsmæssigt ↷ estimér Smith-Blundell først og test endo i den.- Kont:  ⇒ & . ingen pdf / uafh.I generel model: specificér hetsked Non-normalitet ∷ svær – noget med probit 16. . -test. antages . OLS.5 Estimation under svagere antagelser 16. 16. hvor ⇒ vi kan erstatte Tobit ∷ 2-step (Smith-Blundell) ∷ estimér reduceret form for endogene ved OLS ↷ inkludér residualer (dvs.3 Endogenous Som for discrete choice ⇒ må antage mere struktur ∷ den endogene.1 Powel estimatoren .5. POINTE ∷ slippe for at antage ANTAG ∷ .Dvs.fejl skal korrigeres MEN ∷ Indsætter direkte (eller estimeres ikke (relevant for CORNER når man estimerer APEs) og estimerer den samtidig @ ML efter parameterisering) via alm. af fuld fordeling) OBS! Modsat alm. ⇒ antag så . tobit af på ) Som for probit Std. antagelser ESTIMATION LAD (least absolute deviations) M-ESTIMATION 37 . hvor kun kræves for konsistens TEST Hetsked @ LM (score) tilgang → så estimerer vi den almindelige Tobit som nested i en mere generel model .4 Hetsked & ikke-normalitet ALVORLIGE KONSEKVENSER Inkonsistens (da ML afh. ⇒ pga.

tobit ANTAG ∷ Tobit på cross-section med obs. ” og ” ” den samme eller .eff.5.2 ikke differentiabel ⇒ kan ikke bruge 12.6. HVIS ’s fordeling er symmetrisk omkring 0 Corner solution: . 16.MEN ∷ specifikationstest for Tobit modellen PROBLEMER Criterion function er diskontinuert ved : - Desuden ∷ . 38 . .(generelt for LAD) Alternativt – ILPA (iterative linear programming algorithm) 16. den ekstensive margin. .6 Tobit for panel 16. Tier #2 er hvor IDE ∷ I Tobit er ” ⇒ måske forskellig virkning på den intensive vs.MEN ∷ RESULTATER Censored: Powel viser dog er kontinuert ⇒ konsistens følger af 12. ⇒ estimér med-reg ⇒ fjern ⇒… Alternativer til Tobit for Corner – ekstensiv vs.3 -asymptotisk normalitet.Ingen af de ønskede  kræver antagelser om fordeling . intensiv part. med alm. MODEL .2 Estimér median-reg på fuldt sample ⇒ fjern Hvis konvergens er der gevinst. ⇒ Hurdle / two-tier models ∷ hurdle’n eller tier #1 er. om man skal vælge stor skal vælges.1 Sml. og .

vars. MEN ⇒ netop den antagelse.⇒ streng exo. Tobit ∷ Tobit med unobserved effects ANTAG ∷ .6.compl antagelse om uafh. så vælges som enten . i Ingen antagelser om Laggede dep. streng eksogenitet‼‼ (udelukker noget fra ) Og (eller følger det af ovenstående?) 39 . . dvs. kun Seriel korr.Inferens @ robuste estimatorer. Fordi mellem tilgængelig) eller POSITIVT Kræver ikke streng exo af Antager Laggede i er ok og . med potentielt . ⇒ incidental parameters ⇒ Random Effects tobit. afhænger af corr.2 OBS! dyn. hvor er den simpleste for .! og ↷ test samtidig . og ⇒ ⇒ . MULIGHEDER 1) Estimér 2) Antag 3) Eliminér . . (bedst hvis . 2 vars i alm. men ikke er ok . Chamberlain-tilgang ved transformation @ Honoré (1992) Random effects tobit – antag pdf for c ANTAG ⇒ Bemærk. inferens duer TEST ∷ medtag flg. er bøvlede at inkludere ( observeres kun delvist) YDERLIGERE ANTAGELSE Dynamic completeness ∷ 16. at alm. og . . så er for dvs. der giver.

Dynamic unobserved effects tobit DUER KUN (/bedst) FOR CORNER! ANTAG ∷ . RESULTATER ∷ CENSORED RESULTATER ∷ CORNER Vi kan tage differenser / se på ∂ ved . Tilføjelsen af har løst alle problemer ( er nemlig identificeret) ( ) evalueret ved fx . hvor medtages i hver periode (evt.APE’s kan estimeres jf. tobit.6. kan bruges for at blive mere generel.1 Sample selection ÅRSAGER til ikke-tilfældig sampling: 40 . om eller 1. ⇒ bøvlet som bar fuck! Censored ∷ giver bedre mening at inkludere Problem: initial conditions IDE ∷ antag fordeling for PRAKSIS MODEL betinget på og (wow. men det er tungere beregning) ⇒ identifikation hvis der er tidsvariation i .3 Muligt at relaxe Muligt at udvide Powel til dette setting. wolle VIDERE 16. hele og !) inkluderet i hver periode.IDENTIFICEREDE params ∷ PRAKSIS Alm. streng exo af BEMÆRK Corner ∷ afhænger af. Kør bare random effects tobit med regressorne: 17 Sample selection attrition and stratified sampling 17.Dvs.

⇒ så kan vi udlede (disrete response selection) Tillader afh. (på det selekterede sample) alene ∷ uanset b. b. specielt ikke den betingede forventning”. VISE ∷ . ⇒ ingen problemer! Så ”indeholder . og ∷ påvirker selection.- Selektion på forklarende variabel ∷ fx kun 30-50-årige Truncation ∷ selektion på forklaret variabel ∷ fx ser kun om folk har job for folk. ⇒ ingen problemer.Så snart denne betingelse holder er pooled OLS ok . ⇒ (truncation) Antag fordeling af og brug truncated Tobit og bruge CMLE. 1) estimér probit af ii. 17. Attrition (dropper ud over tid – ikke problem i register-data) c. 3. 2.… hvis ikke må vi benytte andre krumspring (antage mere struktur) . af a. (vi betiner en gang for meget) er uafh. at ∷ c. a. Anden variabel forklarer mangel – Heckman selection kan løse dette. da og ingen yderligere info om nogen aspekter af fordelingen af . men kun påvirker . 4. er en (deterministisk) function af a.2 Simpel model Del datasættet op ∷ kun MÅL ∷ bade observeres og observeres. der vælger at tage arbejde i. a. ANVENDELSER (eksempler) MULIGHEDER for selektion 1. . b. HECKMAN 2-step ∷ i. Ser kun løn for dem. Det viser sig. mellem b. 2) OLS af på på og 41 ↷ (på fuldt sample). Non-response b. Dvs.OBS! Konklusionen gælder også for NLS! CMLE ∷ hvis vil MLE på det selekterede sample være konsistent. der har et job Adfærd ∷ a.

konsistente varians-estimater – altså spg.g. ∷ Random sampling ∷ nok at antage Ad 3: Truncation (selektion på y) Selektionsligning ANTAG ∷ fordeling for er kendt. 42 .2. Heckit Robust var-estimator ( ) er valid – ingen generated-regressor problem a. med isntr . moment-tests) Numerisk tung Ad 2SLS på selekteret data FORDELE ∷ PMLE > Heckit - ULEMPER ∷ PMLE < Heckit 17. hours worked) i. en pdf og cdf er givet. 2) OLS af på og (Tobit selection – e. IDE ∷ ⇒ så kan vi finde ssh. dvs. hvor kun det selekterede sample bruges vil give konsistente estimater. 1) Estimér censoreret Tobit af på ↷ residualer ) for de selekterede (dvs. and a.4 ANTAG ∷ ⇒ 2SLS af på . 2-step ii.2.2. instrumenter og estimere med 2SLS . for ⇒ da ingen andre led afh.2 Sammenligning: ML vs.1 model Selection @ 17. ved inferens i Heckit)) Stærke antagelser ∷ (men de kan testes vha.3 TEOREM 17. på med instr . af . Implicerer mere struktur b.1 ML i sample selection – PMLE Strukturel model ∷ Selektionsmodel ∷ UDNYT (hvor ) 17. (dvs.5.2. med 17.

også når censoreres. i truncated censoreres både og . Pga. med Mildere end observeres når . FORSKEL ∷ i censored observeres LIGHED ∷ Hetsked / non-normalitet ⇒ inkonsistens Probit selektion – exogene variable (Heckit) bestemmes af en probit model. OLS asymptotik holder selvom en var. med det selekterede sample. . observeres altid. og . vi mangler som regressor ∷ udnyt at MEN ∷ observeres ikke LØSNING ∷ udtrykke - da det er en truncated normal ↷ inversel Mill’s ratio ⇒ OBS! Inkons af OLS skyldes omitted variable ∷ PROCEDURE (Heckit) a) Få ∷ Estimér probit af på på . .2.5 . at ok da ikke observeres. som er et specialtilfælde.Bøvlet at finde varians når 43 . CENTRALT ∷ ”the coding rule” er ikke kendt – i modsætning til top coding (hvor IDE ∷ antager parametrisk form for . -værdi da ⇒ alm. men se.Ville følge hvis ESTIMATIONSLIGNING . b) Estimér OLS af . selektion kan vi kun håbe på at estimere Dvs.⇒ konsistens og TEST -asymptotisk normalitet . for meget tages med BEMÆRKNINGER .Testes @ std. når ). ANTAG 1) 2) 3) 4) .TRUNCATED TOBIT Fås ved at vælge SAMMENLIGNING 17.

for generelt: UDVIDELSE .6 Probit selektion – endogene variable ANTAG 1) 2) 3) 4) 5) (skala arbitrær da og i ligning 2 er ) hvor . BEMÆRKNINGER OBS! Vi skal have vars i som bestemmer selektion og den endo (relevans). . TEST BEMÆRKNINGER kan være diskret.Hvis - antages kan PMLE bruges (lang. …) givet over ssh. . (exo) Ala alm. endo problem. forsk. Idé til instr: hvis man blev indstillet tilfældigt (men stadig skal instrumenteres. (fuldt sample).Arbitrær korrelation tillades mellem UDLEDNING TRICK: Her er ⇒ teorem 17. Udregn (for sig selv) (for ) og . grim betinget på → udnytter igen Bayes til at opskrive ud fra ssh. observeres altid. observeres kun når . Eks. ssh. konstruktion . ∷ konsistent ved probit af på på på pr. for at deltage på bgg.1 ∷ konsistent at bruges 2SLS af PROBLEM ∷ mangler PROCEDURE 1) Estimér sample). af ) exo men manglende somme tider (non-response) ⇒ modellen duer stadig. 44 .2. men ikke . for 17. (for sig selv) på selekteret 2) Estimér 2SLS af med instr .- Stadig konsistent når → MEN ∷ noisy ∷ (samme regressorer for id’es kun pga. ikke-linearitet i og . men vi må antage struktur på den endo.

ANTAG 1) 2) 3) 4) BEMÆRKNINGER .7 Tobit med eksogene forklarende vars ⇔ vi kan sige ”hvor langt” man er fra selektion ⇒ mere efficient ved probit af på (for hele sample) (jf. køre på ikke-lin. Udregn . (hvis ingen ekstra til selektion. som netop er de selekterede ⇒ BEMÆRKNINER Efficiency gain ∷ intuitivt klart. observeres ⇒ kør OLS på selekteret sample kan estimeres konsistent for de med . .- Mindst 2 vars i Hvis vi antager skal bruges – tænk: én til og én til at identificere selektion ( ). vil id af .a.Som for probit . (skala ej arbitrær da observeres!) observeres altid. observeres kun når . §probit) MOTIVATION ∷ separat variation i EKSEMPEL ∷ timeløn.2. kan vi bruge PMLE. vi kan se. #timer arbejdet p. OK med 45 MODSAT probit! → @ nu har vi separat variation i . PROCEDURE 1) Estimér 2) Estimér ved tobit af ved OLS af på på for hele samplet. Hvis y1 i stedet var binær ANTAG ∷ (en masse) + PROCEDURE 1) Estimér 2) Indsæt i 17. hvor langt folk er fra de-selektion. . PMLE mulig @ ANTAG ∷ . af alene.Tænk selektion: UDLEDNING IDÉ ∷ hvis MEN ∷ for selekteret.

3. Tilfældigt (”rotation”) ⇒ nemt at håndtere 2. hvis vi på hver gang (fx ) RESULTAT . (for sig selv) på 2) Estimér ved 2SLS af selekterede sample BEMÆRKNINGER kan være kont.hvis bare også ganger MODEL ANTAG 1) 2) (⇐ er invertibel ) 46 (alm. rank-condition) . Folk vælger at droppe ud (attrition) 3. instr for selekterede .3 Paneldata: Sample selection Overordnet set: Attrition / selection i paneldata kan ske for 3 grunde 1. hvis kan medtages ⇒ estimér @ Tobit. og er den sædvanlige 17. (for ).- hvor er .2. Incidental truncation (fx arbejdsløshed 17. pr. eller diskret. Udregn på og vha. PROCEDURE 1) Estimér ved Tobit af på .8 Tobit med endogene forklarende vars ANTAG 1) 2) 3) (skala arbitrær da ) hvor . 17. observeres kun når . 4) 5) og i ligning 2 er UDLEDNING (som for probit med endo) her er observeres altid.1 Fixed effects på ubalancerede paneler kan vi ”uden videre” bruge formlerne med OLS på transformeret data. (for sig selv). konstruktion ⇒ 2SLS på selekteret sample er ok.

Udregn – selekteret sample. . hvilket sparer på .2 FE kan kun bruge . Almindelig robust FE-varians kan bruges Tilladt at danne et balanceret subsample og estimere på det. (eller @ alm.3) BEMÆRK . fx vælge VIGTIGT! Vi kunne lige så godt have brugt FD metoder. FE inferens holder) BEMÆRKNINGER 17. testes @ alm. 1992) 1) Estimér FE af 2) på og på det ubalancerede sample.RE analyse kræver ESTIMATION Definér (⇒ alm. OLS. . med . Test / korrektion for sample selection bias Procedure (Nijman & Verbeek.3. -teststørrelse Incidental truncation under H0: ingen selektionsbias BEMÆRK ∷ en enkelt var observeres ikke i nogle perioder IDÉ Chamberlain-inspireret ∷ tillader Antager lineær struktur MODEL (alternativt bare lade tidsgennemsnittet for parametrene) afgøre ∷ . Incidental truncation under HA: selektionsbias ANTAG ∷ 1) 47 . PROCEDURE 1) Probit 2) FE af på på (eller og ) – fuldt sample.

MÅL ∷ Generelisere metoder til ikke-lineær estimation (M-estimation) ANTAG 48 . men med I Tobit frameworket kan vi også tillade.4 påvirkning fra LØSNING ∷ IV Instrument . ) – tænk: ingen samtidig når der er kontrolleret for antages at være strengt eksogen. .3. Step 2 i procedure: Lav 2SLS i stedet og instrumentér Inverse probability weighting (IPW) (som fx kan være Antagelsen udelukker at til kan påvirke attrition (efter betingning på . . hvor (dvs. Tests er ikke længere oplagt simple (robusthed så vi ikke behøver betinge på det yderligere) indeholde og (ikke da den står på LHS for forrige periode ⇒ corr med PROCEDURE 1) Probit 2) Pooled OLS af kræves). indeholder hvor osv. ANTAG ⇒ (hvor på ⇒ ↷ på ↷ . ⇒ ↷ brug FD og skriv (reduceret form) ligningen for selektion betinget på selektion i forrige periode fx kan ). PROBLEMER 17. kan vi mere for alle (og vi betinger jo hele tiden på ANTAG ∷ ingen ”re-entry” ∷ attrition er en absorbing state. ). redundant i selektionsligningen) og med er eksogen i modelligningen ). at 17.3 INTUITION ∷ følger af. 2) Pooled OLS på det selekterde sample af BRUG robuste var-estimatorer Incidental truncation Tobit selektionsligning Hvis selektion i stedet sker på baggrund af Samme procedure som oven for virker. at så vil Attrition – man vælger at udgå af sample erstattet med .3.2) PROCEDURE 1) Probit på for hvert og gem for alle på . MODEL IDE ∷ sekventiel natur.

4 Non-parametric bounds LOWER BOUND UPPER BOUND REMARKS Bounds are tight when ≅ . som vi ikke ser på) 2) Regression discontinuity design 3) Panel data: difference in differences (og before-after) 4) IV og . . Intuition ∷ the more observations that are censored. mixed.⇔ .hvis attrition probit’en ændrer sig over tid?? ⇒ bølvet at håndtere… 17. UDVIDELSE . 49 .) 18 Treatment effects OVERORDNET ∷ ønsker at estimere TILGANGE 1) Ignorability of treatment (ATE. the bigger the problem! . at kan erstattes med når vi udregner asymptotik (antages ). hvor målfunktionen vægtes med .1 og ATE.(knew this already. gang med INTUITION Regularitet giver. dvs. matching.1’) ∷ regression. PROCEDURE 1) Probit på ↷ gem de fittede sandsynligheder.Kaldes selection on observables eller ignorability of selection. weighting estimatorer (og evt. 2) M-estimation på selekteret sample (dvs. ).

1. af de tilbageværende. if treated. else iid.1 Noten Internal validity ∷ hvilken effekt havde jobtræninsprogrammet ⇒ ønsker vi ⇒ kan vi ikke få . or discount. ATE1: betinget på ATE1’: a) (selection on observables) ⇒ når som påvirker .External validity ∷ hvilken effekt vil et hypotetisk program have Average treatment effect . så dem i programmet har særlige gevinster. der påvirker ATE’ ⇒ .) MISSING DATA ∷ only MULIGE ANTAGELSER ⇒ Så er or is observed: og . COMMON SUPPORT . fordi missing data gør. outcome without (cont. at vi kun har .dvs. . OBS! Uafh. SWITCHING ANTAG ∷ KAN VISE ∷ .18.2 Regressions and switching models Tænk ∷ person-specifik gevinst ved programmet. Desuden betyder. at (evt ik-lineær) . vi skal se single-mødre i begge grupper (treatment og non-treatment) 18. vil de tilbageværende faktorer.On the ∷ treated ∷ untreated ∷ overall RUBIN’S CAUSAL MODEL outcome w/ treatment.1 Nonparam id – ignorability of treatment er og b) . ⇒ vi kan fjerne betingning ∷ generelt er kun udregne ⇒ 18.1. være uafh. men vi kan bare når . er partialled out. hvor 50 . .

1. ATE.treat. treatment effekt lige ved cutoff niveauet 18. til er . i Under kontinuitet er ESTIMATION - INTUITION ∷ gns. uafhængig af – . for dem som lige BEMÆRK .treated) - dvs. treatment effect at er .e. Average treatment effect at Vi definerer ANTAG - ∷ . Regression discontinuity Reg på ∷ koeff.ANTAG ∷ ANTAG VIDERE OG ⇔ samt ”⇔” PROCEDURE 18. som lige akkurat blev treated MINUS gns. gevinsten er kont. vi estimerer på det treatede sample og tjekker forskellen på bliver treated.Vi får blot en lokal gns.’s på denne via bootstraps eller Δ-metoden. er ikke!) (dvs. 51 og givet at man på et tidspunkt .of. akkurat ikke blev treated for dem.3 (s.1 (ignorability of treatment) ∷ betinget på og er kontinuerte i avg.4 Hvis treatment effekten er heterogen er den ikke lig med hverken Before-after eller ! Diff estimator IDE ∷ sammenligne individ med sig selv! OBS! Kræver paneldata og kan kun estimere ANTAG ESTIMATION ∷ FØRST ∷ diff-estimator (avg.1.

6 Estimation af ATE ved IV under antagelse af homogen treatment effect ANTAG ATE. at den gns.5 Dvs.MEN ∷ hvad med generel tids-trend? ⇒ motiverer diff-in-diff Diff-in-diff ANTAG (dvs. der tillod 18.Bygger på antagelsen om.1. men kun hvis de er tidsinvariante 18. hvor er koefficienten til . “forhåbentlig” treates dem med størst potential gevinst.1.2 ∷ a) b) c) 52 . udvikling over tid er den samme i de to grupper ⇔ samme tids-trend) SÅ ER ESTIMATION ∷ overraskende nemt i regressions-framework ANTAG ∷ .Antagelsen tillader selektion på unobservables. BEMÆRKNINGER .Regressér på .Indfør controls . fx ikke Ashenfelter’s dip ∷ discouraged worker lige før treatment. at randomisering holder i FD . Når der er både selection og sorting bias: essential heterogeneity TIDLIGERE ∷ Diff-in-diff eneste estimator. Selection and treatment effects OPSPALTNING af det ”observerede” gain - Selection bias = ability bias i labour econ Sorting bias = selection on the gain. FUCK! Hvis folk selekterer ind i programmet er … AHA! BRUG FD! PROCEDURE .

hvis havde været på en anden måde. kan vi få en mere efficient procedure Erstat c) med ∷ 1) estimér 2) instrumenter 18.1. . men ønsker at tænke det sådan. hvis . idet vi kan skrive spiller ingen rolle i ligningen for .8 LATE (local average treatment effects) CHANGE MINDSET ∷ nu to typer treatment! Vi trækker for alle individer ⇒ smider én af ’erne væk ⇒ smider én af ’erne væk. Desuden b) ⇒ som . i. observerer vi ⇒ ANTAG (monotonicitet) 53 . PRAKSIS ∷ TÆNK vi observerer kun ∷ hvis .FORKLARINGER a) ⇒ . b) ≅ exclusion restriction.1.7 med og og ) i stedet for og yderligere d) (tænk ). IV Instrumentér med og med sig selv. været et andet udfald. Procedure 2: IV med propensity score Hvis vi er villige til at gøre yderligere antagelser. fx med probit (som funktion af Heterogene treatment effects (v0 ≠ v1) ANTAG PROCEDURE 1) Estimér 2) Estimér i med MLE og få (fx probit / logit) ved 2SLS med instr 18. Dermed kan vi skrive ligningen for MEN ∷ og kan godt være korrelerede‼ ⇒ endogenitetsproblem Procedure 1: Alm. at der kunne have observerer vi .e.

vil .4 54 . . → her: en model hvor der er sorting på gains! MODEL - Her (må) Definer ⇒ - (bemærk ligheden til . som vi kan finde eksplicit.1.1. som defineres ud fra forhold i populationen (dvs. blev ændret fra 0 til 1. hvor er sample avg. vil . der bliver treated.9 Modsat HVIS HVIS GENERELT ∷ der har størst gain. ’erne for de treatede) er forventning over den treatede del af populationen. Essential heterogeneity and IV (sorting on the gain) Essential heterogeneity ⇔ der er bade sorting og selection. og hvis dem. som ville participate hvis defineres ud fra variationen i Modsat og . . af koeff.(…) ESTIMATION IV reg på med som IV for ⇒ FORTOLKNING BEMÆRK gns. .) DET GIVER INGEN MENING‼ INGEN OVERHOVEDET‼ 18. hvor og missing) (lige så vel som Vi kan ikke observere populationen med vi ikke observerer 18. over . treatment effekt på dem.10 Sammenhæng med den simple sample selection model ANTAG ATE. forudsiger perfekt hvem. til . der bliver treated også er dem.

ANTAGER at ∷ restriktivt DENNE ∷ 1) estimér 2) reg pooled OLS med de genererede regressorer .ATE. på .a) b) c) d) e) SÅ KAN VI SKRIVE fx … og endelig og for for .Faktisk.Tillader comparative advantage structure samt hierarkisk struktur – sandsynligt. 18. hvor .1 ∷ og er uafhængige når vi har betinget på (b) . effekt i sub-sample bestående af de treatede (⇐ fx ) ) (men Mindre struktur ∷ antage mean independence ∷ dvs. 18.ATE.3 Mere parametrisk tilgang ANTAG .2 Ikke-parametrisk tilgang ⇒ ⇒ – begge estimeres som avg. nok at tage hensyn til .1’ ∷ (a) RESULTAT SMART ∷ Definér 55 . dvs. Få 2) Regresser @ POLS ∷ Sammenligning med IV tilgangen IV ∷ 1) estimér 2) kør 2SLS med inkluderet som regressor. hvor så PROCEDURE 1) Probit af på . er lig den generelle plus den forventede individuelle gevinst ved at blive treated ( er lig den individspecifikke gevinst ved treatment) Bemærk ∷ kræver flere antagelser (typisk) end . MODELTANKEGANG SÅ ER dvs.

1’ ∷ for . vi har i vores datasæt! identificeret for . og .3.2 Svagere antagelser – to ukendte g-funktioner ANTAG . Vi kan som nævnt altid tænke så indsat i definitionen som vi tænker på som en reg model ANTAG ∷ ATE. (eller for lidt mere generelitet) . non-param 18.1’ alene giver os to ting: 56 . ⇒ så er med giver det (fik vi allerede tidligere) og endvidere er og er et fejlled. KONKLUSION ∷ ATE.Vælg 18.TÆNK ∷ EKSEMPEL .3.ATE.Så er og → dermed er samt er sådan set det.1’ ⇒ så er hvor . → vi kan estimere den ikke-parametrisk! ESTIMATER PROBLEM ∷ std.fejl skal fås fra de evt. som vi har antaget betinget middelværdi nul for.1 Switching regression ’er ⇒ men muligt @ bootstrap / Δ-metoden.

dvs. kan det udnyttes ) Hvis ofte vil fx .OLS af på RESULTATER for .1’ ⇒ så er . kan man opnå konsistente estimater af ANTAG .ATE. eksempelvis briller gives til børn med dårligere syn end ± 2 ⇒ sammenligne personer med næsten samme ’er.ATE.3. 18. designs og hvis har en diskontinuitet.3 (husk nemlig at uden antagelser er Regression disc. 18.1’ SÅ ER (mao.4 Propensity score Ved at fokusere på og → MEN ∷ der gemmer sig nogle ret tunge antagelser under.1) er en funktion af og og (en funktion af ). antag og ) IDE ∷ kan fås fra probit 57 .1 ATE skrevet som funktion af p. som estimeres med probit (i regression eller mere ”ikke-parametrisk”). 18.4.hvor ESTIMATION . men hvor én treates og én ikke gør. 2) er additiv i PROBLEM – Saturated model Hvis ’erne vælges for komplekse får vi problemer (ikke datatæthed alle vegne) For at komme videre: antag form for g0 og g1 ANTAG .

PROCEDURE 1) Estimér ∷ fx vha. regressér BEMÆRKNINGER Man kan også køre regression en er lineær i for 18. logit/probit med en Sieve funktionaf og inden i 2) Tag sample equivallent af 18.1’ er ukorreleret med SÅ GIVER regressionen PROCEDURE Estimér .Tilføj som regressor.Som før… hvis vi tillader ANTAG . ∷ fx med probit. men måske maskerer det bare det mulige sample problem. hvordan man estimerer .ATE. dvs. .) . at der findes BEMÆRKNINGER Det hele kommer til at hvile på.5 Matching ANTAG Så kan vi estimere BEMÆRKNINGER 58 . til ). Regressér y på w og p-hat som regressor.2 (hvor Logit/probit sikrer.regressér på MOTIVATION . kan vi opskrive det som en regression -asymptotisk normalt estimat af (koeff. at . på på . sæt ” ” Simpel idé: tilføj .4. dvs. at så … . men så skal man i stedet antage.

hvor altså ANTAG ATE. hvis og afhænger altså ikke af HVIS ∷ instrument ANTAG ATE. Tillader heterogene responses – ikke-parametrisk tilgang ⇒ ingen restriktioner på respons. men nogen slap && tilfældigt) ANTAG ATE. . er korrekt specificeret! for lotterinummer (højt ⇒ nok ind og springe. dvs.3 ∷ .ATE. og ukorr. 2SLS er der ingen yderligere betænkninger ved at instrumentere en dummy!) BEMÆRK Hvis .(⇒ OBS! i alm.2 … og… Da bliver PROBLEM ∷ LØSNING ∷ IV PROCEDURE og for (evt. at kovariaterne kommer fra mere “iid-agtige” processer.6 IV-metoder Skriv ligningen som TILLADER tillades at være endogen . 18. at essentielt set)) gå ud. men alle naboer vægtet efter deres “afstand” i .- Matching estimatorer “balancerer” samplet så det ligner. fx Angrist’s lotteri for værnepligt: er det optimale instrument for (fx probit) og mere ved MLE (fx probit). med sammensatte fejlled ⇒ potentielt muligt at instrumentere BEMÆRK ∷ bygger vigtigt på antagelsen om. så vil interaktionsleddet med (svarende til.2 ∷ ortogonal eligibility og en mildere version af og mere SÅ ⇒ direkte estimation kører og vi kan skrive TÆNK ∷ og eligibility uafh. på og med instrumenter og .2’ ∷ IDÉ: og PROCEDURE 1) Estimér 2) Estimér generelt har samme stokastiske led. nok med og .) korrelerer måske… og måske gør en af regressorne 59 . at MERE STRUKTUR Skriv . er (dvs. af observables. Bedre -estimator ∷ ikke bare bruge de nærmeste.

(dvs.4 ∷ . alt andet for sig 60 . 2) OLS af ovenstående ligning. for . OG og med instr .1) Estimér BEMÆRK ∷ - ud fra (probit) på med instr .… en masse plus PROCEDURE 1) Estimér 2) OLS på selv).Som ovenstående. men PROCEDURE 1) Estimér 2) OLS uden IV på og . er crucial! ANTAG ATE. . ANTAG ATE.4’ .

Sign up to vote on this title
UsefulNot useful