Samlede eksamensnoter

Indhold
10 Basic linear unobserved effects................................................................................................................. 5 Random effects ................................................................................................................................. 5 Test for unobserved effects .......................................................................................................... 6 Fixed effects ..................................................................................................................................... 6 Inferens ......................................................................................................................................... 7 FD metoder ....................................................................................................................................... 8 Inferens ......................................................................................................................................... 8 Sammenligning ................................................................................................................................. 9 FE vs. FD ...................................................................................................................................... 9 FE og RE – quasi time-demeaning ............................................................................................... 9 Hausman: sammenligning af RE og FE ....................................................................................... 9 10.1 10.1.1 10.2 10.2.1 10.3 10.3.1 10.4 10.4.1 10.4.2 10.4.3 11

More topics in linear unobserved effects ................................................................................................ 10 Oversigt .......................................................................................................................................... 10 Sekventiel eksogenitet .................................................................................................................... 11 Instrumentering .......................................................................................................................... 11 Contemporaneous korrelation mellem en x og u ........................................................................ 12 Individual slopes ............................................................................................................................. 13 GMM tilgang .................................................................................................................................. 13 Chamberlain’s tilgang..................................................................................................................... 13 Specielle ......................................................................................................................................... 14 Hausman-Taylor ......................................................................................................................... 14

11.1 11.2 11.2.1 11.2.2 11.3 11.4 11.5 11.6 11.6.1 12

M-estimation ........................................................................................................................................... 15 Setup ............................................................................................................................................... 15 2-trins estimation ............................................................................................................................ 16 Konsistens og asymptotisk normalitet ............................................................................................ 16 Varians-estimation .......................................................................................................................... 16 Uden nuisance ............................................................................................................................ 16 Var-est med nuisance.................................................................................................................. 17 1

12.1 12.2 12.3 12.4 12.4.1 12.4.2

12.5 12.5.1 12.5.2 12.5.3 12.6 13

Testning (§12.6).............................................................................................................................. 18 Wald ........................................................................................................................................... 18 LM .............................................................................................................................................. 18 Tests baseret på ændringer i objctive function (QLR)................................................................ 19 Optimerinsgalgoritmer .................................................................................................................... 19

Maximum Likelihood estimation ............................................................................................................ 19 Avar estimation............................................................................................................................... 19 Testning .......................................................................................................................................... 20 Panel ............................................................................................................................................... 20 Unobs.eff. and strict exo ............................................................................................................. 21 Lagget afh. var (y-var) ................................................................................................................ 21 Uncond. MLE (UMLE) vs. cond. MLE (CMLE) ........................................................................... 22

13.1 13.2 13.3 13.3.1 13.3.2 13.4 14

GMM ...................................................................................................................................................... 22 Efficiente instrumenter (§14.5.3, pp. 439-442)............................................................................... 22 Classical Minimum Distance (CMD) ............................................................................................. 22

14.1 14.2 15

Discrete Response Models ...................................................................................................................... 23 Linear Probability Model (LPM) – problematisk ........................................................................... 23 Latent variabel model – probit og logit .......................................................................................... 23 MLE (pp. 460-461)..................................................................................................................... 24 Tests i binary response index modeller........................................................................................... 24 Hetsked ....................................................................................................................................... 24 Reporting results ............................................................................................................................. 25 Random Utility Model .................................................................................................................... 25 Specification issues......................................................................................................................... 25 Neglected heterogeneity (c udeladt) ........................................................................................... 25 Endogen, kontinuert variabel...................................................................................................... 26 Når den endogene variabel er binær ........................................................................................... 27 Hetsked & ikke-normalitet ......................................................................................................... 28 Manski’s maximum score estimator – estimation under svagere antagelser .............................. 28 Panel data / cluster samples ............................................................................................................ 29 Pooled estimation ....................................................................................................................... 29 Unobserved effects probit........................................................................................................... 29 2

15.1 15.2 15.2.1 15.3 15.3.1 15.4 15.5 15.6 15.6.1 15.6.2 15.6.3 15.6.4 15.6.5 15.7 15.7.1 15.7.2

15.7.3 15.7.4 15.7.5 15.8 15.8.1 15.8.2 15.9 16

Logit: unobs eff og streng exo (FE logit, skodnavn) .................................................................. 31 Dynamic unobs.eff (state dependence)....................................................................................... 31 Andet .......................................................................................................................................... 32 Multinomial response ..................................................................................................................... 32 Multinomial logit ........................................................................................................................ 32 Probabilistic choice models: ....................................................................................................... 33 Ordered response – ordered logit/probit ......................................................................................... 34

Censored regressions and corner solution models .................................................................................. 35 Tobit ............................................................................................................................................... 35 Estimation ................................................................................................................................... 35 Quantities of interest................................................................................................................... 35 Neglected heterogeneity (§16.6.1) .................................................................................................. 36 Endogenous .................................................................................................................................... 37 Hetsked & ikke-normalitet ............................................................................................................. 37 Estimation under svagere antagelser............................................................................................... 37 Powel estimatoren ...................................................................................................................... 37 Alternativer til Tobit for Corner – ekstensiv vs. intensiv part.eff............................................... 38 Tobit for panel ................................................................................................................................ 38 Sml. med alm. tobit .................................................................................................................... 38 Tobit med unobserved effects..................................................................................................... 39 Dynamic unobserved effects tobit .............................................................................................. 40

16.1 16.1.1 16.1.2 16.2 16.3 16.4 16.5 16.5.1 16.5.2 16.6 16.6.1 16.6.2 16.6.3 17

Sample selection attrition and stratified sampling .................................................................................. 40 Sample selection ............................................................................................................................. 40 Simpel model .................................................................................................................................. 41 ML i sample selection – PMLE .................................................................................................. 42 Sammenligning: ML vs. Heckit.................................................................................................. 42 Ad 2SLS på selekteret data......................................................................................................... 42 Ad 3: Truncation (selektion på y) ............................................................................................... 42 Probit selektion – exogene variable (Heckit).............................................................................. 43 Probit selektion – endogene variable .......................................................................................... 44 Tobit med eksogene forklarende vars ......................................................................................... 45 Tobit med endogene forklarende vars ........................................................................................ 46 3

17.1 17.2 17.2.1 17.2.2 17.2.3 17.2.4 17.2.5 17.2.6 17.2.7 17.2.8

....................... 53 LATE (local average treatment effects) ................................................................................................ 57 ATE skrevet som funktion af p............4....................2 18....... 51 Selection and treatment effects ...................................................................................................1............................................................................................................3.........................................................................17.....................................................1 18......................................................................3....................................3 17.........................1........................................................................................3 18................ 52 Estimation af ATE ved IV under antagelse af homogen treatment effect ......2 18..........................................................................................................................................8 18.......... 59 4 ..................................... 57 Propensity score ........................................................................................................................................................1................. 46 Test / korrektion for sample selection bias .................... 54 Sammenhæng med den simple sample selection model ...................................3 18..............................1...................3...................................9 18....... 56 Regression disc......................................1..6 18.....................................1............................................... 54 18.......................1....................................................... som estimeres med probit........... 48 Inverse probability weighting (IPW) ..4 18 Paneldata: Sample selection ................................................... 58 IV-metoder........................... 49 Noten ............................4 18................... 50 Regression discontinuity ....................4 18...............6 Ikke-parametrisk tilgang .............2 18....... 56 Svagere antagelser – to ukendte g-funktioner ....1................1 18...........................................................................................................................................................................1.......10 18..........................................7 18.............. 46 Fixed effects på ubalancerede paneler .......................................................... 55 Mere parametrisk tilgang ..... 53 Essential heterogeneity and IV (sorting on the gain).........4 17................... 52 Heterogene treatment effects (v0 ≠ v1) ........................................................5 18..............3...................................3.............................. 50 Nonparam id – ignorability of treatment ................................................................................3...................... 49 Treatment effects ...........3............................................2 17..................5 18...............1 17................................................................... designs ................................................................................................................................................2 18.. 55 Switching regression .........................................................3 17.......................................... 50 Regressions and switching models .....3 18. 51 Before-after ..1....................1 18.........1 18........................ 57 Regressér y på w og p-hat ............... 58 Matching .................4........................................ 48 Non-parametric bounds ..................................................... 47 Attrition – man vælger at udgå af sample..............

1 Random effects IDE ∷ udnytte ser.korr. konstruktion FREMGANG – 2 spørgsmål 1) Er korreleret med for noget ? 2) Holder streng eksogenitet (betinget på )? NAVNGIVNING Random Effects ∷ Fixed Effects ∷ .korr. er without loss of generality når der er intercept.10 Basic linear unobserved effects CROSS-SECTION ∷ Løsninger på uobserveret heterogenitet. b. 2) Rank ∷ . . i composite error term pr.Indikator-IV PANEL Antager er tidskonstant BEMÆRK ∷ ⇒ tidskonstante ’er kan ikke identificeres separat fra . hvor For efficiens ANTAG YDERLIGERE 3) Efficiens af RE a. EKSOGENITET Hvis vi kun betinger på ’er ∷ ⇒ dvs. ækvivalent med streng exo ⇔ BEMÆRK -lags ⇒ streng exo kan aldrig holde ∷ ⇒ .Proxy .IV (2SLS) . Tilstrækkeligt for konsistens ∷ ii. i. Antager balanceret panel – ubalancerede håndteres senere. i ANTAG 1) Ortogonalitet a. 10. b. FGLS varians 5 til at lave GLS . .→ desuden giver -lags ser. Da er ESTIMATION Alm. . .

dvs.korr.2 Fixed effects ⇔ ANTAG (FE.1. i ULEMPE ∷ streng exo ⇒ må ikke indeholde laggede ’er! 10.korr. dvs.1 fra modellen til at udregne både og (selvfølgelig). hvis muligt F-TEST Brug 10. Test for unobserved effects IDE ∷ svarer til at teste (hvilket svarer til at teste ser.X) 1) a. OBS! ⇒ b. Evt. specielt ⇒ .hvor Første trin baseres på pooled OLS. . ⇒ . men bedre at teste direkte på ) PROBLEM ∷ hvad er LØSNING ∷ streng eksogenitet giver FORDEL ∷ opdager mange typer ser. c. AR(1)-test. … brug dog robust varians. 2) 3) OBS! FE1 + FE2 ⇒ unbiasedness ESTIMATION (kun nødv. i ? . tænk 6 . for efficiens af FE) OBS! ⇒ streng eksogenitet.

LSDSV for alle ⇒ incidental parameters problem. Da er fordi (unbiased).dvs.PRAKSIS Premultiply med eye(T) – T^-1 * ones(T. at Problem ∷ serielkorrelation under Løsning ∷ brug flg. NAVNE Within ⇔ within each cross-section ⇒ HER Between ⇔ between each cross section Viser sig ∷ FE = Least Squares Dummy Variable Estimator ∷ → svarer til at estimere MEN ∷ stor ⇒ på dummies for personer. giver idé om fordelingen af heterogeniteten i populationen. konstruktion . ⇒ muligt at lave en GLS analyse 7 . robuste variansestimator og test som er robust for heteroskedasticitet og seriel korrelation i ⇒ kan bruges til at lave Wald-tests.2.1 Inferens INFERENS ⇒ PAS PÅ! fås ved først at beregne . 10. pr.3. Men betydningen svinder som ∷ PROBLEM ∷ FE-transformationen introducerer serielkorrelation i MEN ∷ det bliver et mindre problem (??) Robust varians og seriel korr i idiosynkratiske fejl Seriel korr i ? ∷ reg på for alle Problem ∷ vi har ikke ⇒ vi kan udnytte. Fixed Effects GLS ANTAG .T). FJERN FE. og så udnytte .

hvis det var givet at man ville deltage.1 Evt. for efficiens af FD) random walk Som FE.1-3 er alm. at LØSNING ∷ Drop en tidsperiode og lav GLS 1) Estimér 2) Estimér 3) Estimér ALTERNATIV Man kan specificere en eller anden struktur på MEN ∷ efficient hvis korrekt. inefficient ellers. inferens valid under POLS på Δ’et data! 10. I FE har vi stok ) var minus noget. i nogle situationer. c. (huskeregel: I FD har vi af 2 stok var ⇒ selv stok var ⇒ alle antagelser laves på den.3 ⇒ BEMÆRK .3‼ FD. . inferens @ POLS på Δ’et data er valid. (FE. og udlede en stuktur på afh.3 ⇒ ) (kun nødv. VIGTIGT .3. AR(1) ⇒ Generelt: policy implementation Faktisk er ortogonalitetsbetingelsen jo ⇒ dvs. kan FE godt være konsistent selvom POLS / RE ikke er det. hvor deltagelse ⇒ i et program er betinget af karakteristika før programmet . 2) 3) a. dvs. . bare være ukorr. b. OBS! ⇒ streng eksogenitet. som har rang på kun !! Dvs. tænk . hvor MODSÆTNING til FE.3 FD metoder ANTAG 1) a.Vi mister én periode! Alle ’er skal variere over .PROBLEM ∷ det viser sig. kun af . homoskedastisk.Under FD. med før vi får konsistens! Egentlig skal . hvis ortogonaliteten overholdes (dvs. bare ikke hvornår??) 10.1 Inferens OBS! Ikke nødvendigt at tænke så meget som i FE – alm. b. som bliver deterministisk når 8 . Fx BFN (1982) antager stabil. ikk invertibel! og drop så en tidsperiode (fx den ’te) fra datasættet.

4.1 FE vs.4 Sammenligning 10. GLS ∷ OBS! FE-GLS og FD-GLS er asymptotisk ækvivalente 10. som har ens ’er.udeladte. -test af OBS! ukorrelerede ⇒ . FD ⇒ FE = FD valget afh. dvs. Hausman: sammenligning af RE og FE ULEMPER 9 . bør være insign (den er taget højde for). autokorr med . FE) modellen er korrekt og (evt.4.SERIEL KORR i Kør reg → alm.3 ∷ POLS ∷ FE for for ∷ for store ∷ er RE ≅ FE dominerer ⇒ brug FE RE ∷ Hjælp til en estimator i nød Inkludér dummies for grupper der er meget ens. af antagelser om OBS! Endogenitet (målefejl. tidsvar. 10. simultanitet) ⇒ både FE & FD inkons med hver sin plim! TEST ∷ STRENG EXO IDE ∷ hvis FD (el. at RE estimation svarer til at estimerer 10.2 FE og RE – quasi time-demeaning Det viser sig. same men I FE framework) .4.

1-RE.def.) 1) Udeladt tidsvarierende variabel 2) Simultanitet mellem og 3) Målefejl i SKAL BRUGE ∷ instrument ukorr med → nogle gange kan panel-aspektet bruges 10 (transformer ⇒ fjerner og ∷ brug så IV) .t.3. af antagelser af tidsserieafh. 11 More topics in linear unobserved effects 11. i (kun efficienshensyn) predetermined ∷ brug IV/GMM FD ligningen og brug laggede niveauer som instr.t. en skør asymptotisk fordeling) IDE ∷ Det viser sig.str. (FE- … kan evt. fra et framework. ⇒ kør så -test af koeff. (ellers får test. er Test-str. gøres robust for RE3 i denne setting ∷ brug robust Wald.d.1) Streng eksogenitet antages både under og 2) RE3 antages at holde under .’ed samt en alm. er: - Sædvanlige estimetorer for MEN ∷ brug bruges. Bruger within-group info ÅRSAGER (alm.d.1 Oversigt Antagelser Foretrukket model RE ∷ udnytter både info within og between grupper FE el. Dvs. at under RE. ∷ udnytter kun within-group info. 1 VARIABEL BEMÆRKNINGER kan klares @ aux regression af quasi time-demeaned (q. ikke fra hver sit – ellers risikeres. vi tester a. at den bliver ikke-pos. FD. Valg mellem FE/FD afh.’ed) style) time-demeaned (de tidsvarierende elementer i eller Wald ). på på q.

⇒ dyn.2. MULIGE INSTR I FD ⇒ ⇒ ⇒ (alle) laggede niveauer (og funktioner heraf. er inkons af odten MEN ∷ hvis yderligere det antages at FD ∷ Bias fordi to på hinanden følgende perioder sættes sammen når vi kun har seq.compl. vil seq.GMM @ alle instr’er ) kan instrumentere . instr for (husk. ⇒ hjælper på efficiens. FE OG FD ER INKONSISTENTE! FE ∷ Bias introduceres fordi fremtid er i tidsgns. at de er relevante.1 ⇒ OBS! Bias uaf. fx Δ’er) (op til ⇒ bl. instrumenter.11. men realisme?? .exo.exo.a. ⇒ . gyldige. (da på hinanden følgende perioder) Instrumentering FE ∷ kræver strengt eksogene instrumenter FD ∷ kræver seq.. så ⇒ er weakly dep. af fordi .exo.) AR(1) model ∷ Arellano & Bond (1991) ∷ Bruge alle tilgængelige som IV @ GMM (ej muligt i 2SLS da #instr varierer 11 .2 Sekventiel eksogenitet ÆKVIVALENT (når modellen tages i betragtning): Når og er kontrolleret for.Hvis . indgår allerede som regressor eller som IV Anderson & Hsiao (1982) ∷ foreslog med ) ≅ ⇒ er svage instrumenter. trukket fra steady-state distr.exo. eneste problem er og BEMÆRKNINGER lille ⇒ stor varians… Selvom instr.Blundell & Bond ⇒ antog EFF. 11. . Seq. hjælper det ikke yderligere at kontrollere for fortiden af ! OBS! MILDERE antagelse end BEMÆRKNING . er det ikke sikkert.

Nogle x’er str. (kan alternativt løses ved at medtage en ligning for den simultane var’s bestemmelse) FREMGANG 1) Transformér data (FE eller FD) 2) Brug IV af en art – hvilke instr’er afh. men kun ).exo.korr. at vi lagger. hvor seq. exo) 11. men er med ”dobbelt” (hver gang sammen) lagget (siden kunne bruges. ↷ skriv op en ligning for .2 .. nogle seq. men inducerer muligvis endogenitet hvis ( (dvs. Simultanitet MULIGHED 1 ∷ LAGGEDE OBS! og ’ER SOM INSTR’ER kan kun estimeres med fordi er korrelerede for alle .exo.Vi kan teste for ser. i .2. kan være sit eget instrument – brug ) som instr for Contemporaneous korrelation mellem en x og u 3 mulige ophav: 1) Udeladte tidsvariante forklarende variable 2) Målefejl 3) Simultanitet a.exo. men det kræver. FD bedre end FE . at der ikke er seriel korrelation i (i niveau) ikke indgår i ligning kan den måske bruges som IV → men formentligt SVAGT!) og er ALTERNATIVT ∷ - MULIGHED 2 ∷ EKSTERNE INSTRUMENTER FIND nogle eksterne instrumenter og kør POOLED 2SLS på 12 . af anvendelsen. så BEMÆRK ∷ simultaniteten kommer nu ikke fra det. .exo end FE . på Δ’et data Arellano & Bond (1991) foreslår GMM-baseret test for ser. og str. når ( ej str.FD er robust for mere generelle overtrædelser af str. Eksempelvis Model: → klart at FD + IV ∷ FD ⇒ fjerner seq.exo..korr.

11. ∷ FE forværrer målefejl) Vi må finde et instrument udover de variable. (dvs.exo. . og generelt! ∷ Vi kan altid skrive . vi har.5 Chamberlain’s tilgang ANTAG Streng eksogenitet ∷ indeholder kun tidsvarierende variable og .ukorr.3 Individual slopes METODE ∷ FD for at slippe af med HUSK ∷ FE var som at estimere model med individuelle intercepts hvis er ser.1 ⇒ SYSTEM og .1) MEN ∷ Tillad arbitrær korrelation mellem IDE ∷ Erstatte - Pr. kan vi måske bruge som instr for .normalfordelt (men ej asym efficient) 11.. med projektionen på . 13 . homosked (betinet på ). FE) ↷ efterfulgt af IV Ikke altid oplagt smart bare at bruge laggede variable ⇒ find eksternt exo instrument Målefejl (I classical errors in variables under str. ⇒ så er FE på Δ’et data konsistent & asym.Udeladt tidsvariant variabel FD (el.MEN ∷ INDSÆT .FE. FE. RE (mere fri ) Men bedste er fuld GMM / minestimation med fuld frihed i vægtmatrix (RE) eller ikke var konstant? 11. Hvis der er seriel korrelation i målefejlene. konstruktion er .4 GMM tilgang MOTIVATION ∷ hvad hvis 3SLS kan være bedre end alm.

exo 14 . form for ej homosked (??) 11.6.exo. som instrument for hver tidsperiode og med den 1) 2) 3) ej lineær i ej konstant ∷ ∷ system skalar-varians ∷ system homoskedasticitet Denne failer hvis ∷ ej homosked.1.6 Specielle 11.1 Hausman-Taylor FORMÅL ∷ identificere effekt af tidskonstante variable i tilstedeværelsen af MODEL ANTAG 1) 2) BEMÆRK 1) giver. IDE ∷ vi vil udnytte 2) samt at 1) medfører ⇒ ⇒ ⇔ ANALOGIPRINCIPPET til at estimere . at FE kunne bruges ⇒ vi får så . MULIGE ANTAGELSER    HVIS Begge opfyldt ⇒ SOLS efficient (??) Failer ⇒ FGLS kan bruges GMM er mest efficient med optimale vægtmatrix. men så ville -leddet gå ud. .Test af over-ID ⇔ test af str.System-OLS er konsistent under FE. ∷ forkert fkt. Omskriv ∷ str.

hvor IDENTIFIKATION .1 Setup SPECIFIKATION Karakteristik af fx .… han viser det for en mere generel model GIV (generalized IN) TANKEGANG Bruge som instrumenter instrumenterer instrumenterer sig selv (de tidskonstante. vil . - minimerer RHS hvis modellen er identificérbar. med ) instrumenterer 3SLS med (de tidskonstante. 15 . hvor . minimerer LHS pr. på RE struktur 3SLS med urestrikteret GMM med efficient vægtmatrix 12 M-estimation 12. valg Hvis konvergensen er uniform. som er korrelerede med ) TILGANGE ∷ i rækkefølge med stigende robusthed. som er ukorr.

12. indsæt og tag sample avg. ØNSKE ∷ konsistent uanset. → smart hvis betingning på . Udregn iii. Udregn b. giver en simpel form (fx i probit bliver led = 0) samt (eller ).1 Uden nuisance estimeres altid på samme måde! afh. af humør: 2 TILGANGE 1) Håndværkertilgangen ∷ udregn a. 16 . 12.3: Lad alt muligt gælde. a. Altid mulig – men tung og måske ej pos.3 Konsistens og asymptotisk normalitet TEOREM 12.4. Trin 2: Estimér . 2) Strukturel estimation ∷ givet Udnyt fx i.def.4 Varians-estimation 12. Udregn ii. da vil hvor Dermed er 12.2 2-trins estimation løser Trin 1: Estimér . hvordan vi vælger . ∷ så .

Analogiprincippet Brug Analogiprincippet til at estimere med

DVS ∷ 1) Udregn lukket-form udtryk for og som funktion af og a. Dvs. differentier to gange mht. . 2) Evaluér sample avg. af disse udtryk. OVERVEJELSER NEGATIVT ∷ tung at regne, ej sikkert pos.def – men den er det hvis POSITIVT ∷ altid tilgængelig unikt løser sample problem.

Strukturel tilgang – evaluér forventninger Givet en fordeling for OVERVEJELSER NEGATIVT ∷ kræver streng antagelse om POSITIVT ∷ efficient! , kan vi blot udregne direkte: som og som .

Mellemting – antager kun fordeling for y givet x Hvis vi ikke vil antage fordeling for hele Definér

, men måske kun for

.

⇒ Så analogiprincippet motiverer

12.4.2

Var-est med nuisance

Vi kan altid bruge den generelle

Alternativt:

-

hvor

med

. 17

-

hvor hvor (og som et slags generaliseret residual.

, er en bøvlet, grim funktion, som formentlig skal tænkes på

2-STEP M-ESTIMATOR VARIANSEN ER DA BEMÆRKNINGER OBS! er lineært separable I den ”almindelige” effekt og ”nuisance” effekten ikke! (den bliver interageret på kryds og tværs pga. ”^2”) selvfølgelig indgår i . , MEN det er

MEN ∷ bemærk, at

12.5 Testning (§12.6)
12.5.1 Wald

Testes ved

hvor ULEMPE Ikke skalainvariant ⇒ problem (primært/kun?) ved ikke-lineære hypoteser: man kan omformulere indtil man får den ønskede konklusion. FORDELE - Estimerer kun den ”store” model - Kan gøres vilkårligt robust 12.5.2 LM , kan vælges robust (når Jacobi-matricen for (skal være invertibel) ( ) eller evt. højde for nuisance)

IDE ∷ hvor langt er FOC fra at være opfyldt OBS! Restrikterede model (” ”-modellen) skal være nested i en større model SETUP Imposer o kontiniuert-differenntiable restriktioner på , så , hvor og og . Fx ∷ under , hvor sættes til konstanter fx og Matematisk, restriktioner Vi lader da

18

Hvis GIME (generalized information matrix equality,

og

)

1)

(hvis reparameteriseringer.

opdeles i endo

og exo ) ∷ Foretrukket hvor mulig (bedre small-sample) ’erne ej pos.def.; ii) tung at udregne; iii) ej invariant for for ofte)

2) Hesseform ∷ i) kan være neg hvis

3) Outer product of the scores ∷ Simpel at udregne, men size distortions (typisk afvises FORDELE - Estimerer kun den “lille” model. - Med forventet hesse er den ofte invariant for reparameteriseringer. ULEMPER - … 12.5.3 Tests baseret på ændringer i objctive function (QLR) og

ANTAG at GIME holder ∷

ULEMPER - Forudsætter, at GIME holder og kan ikke gøres robust for dette.

12.6 Optimerinsgalgoritmer
MANGLER DETTE AFSNIIT‼

13 Maximum Likelihood estimation
13.1 Avar estimation
Definitioner:

(og hvor

.) 19

Under er hvor avar-estimatoren kan vælges blandt de 3 nævnte .Under regularitetsantagelser (bl.… vælg ud fra small-sample eller beregninsgmæssige betænkeligheder. antagelse om korrekt specificeret model) holder teorem 13.3. . 3) Lukket form! Kan evt. at 20 givet . Fordele: a. at i visse tilfælde er simpel selvom er bøvlet (fx probit.a. 13.2 Testning OBS ∷ asymptotisk ækvivalente! Kun finite-sample overvejelser Wald LR (Like-ratio – ala -test. CIME) c.def. simuleres. p. afledte – ikke garanteret pos. . 396) ∷ baggrund: hvor . hvor slemt overtrædes FOC?) Lad Da vil være vektor af afledte af evalueret ved de restrikterede estimater. 3 matricer konvergerer til den sande Avar (p. 1) Kræver beregning af de 2. 13. Lad være estimatet når de restriktioner er pålagt og uden. idet der betinges på så nogle led bliver nul i forventning. når den findes (jf. der betinges på (!).def.-afledte af en eller funktion b. . . Garanteret pos.3 Panel Lad være den sande pdf. Bedre finite-sample props end BHHH KOMMENTARER . 395) (fordi Dvs. i ML Alle flg. 396). dvs. mere kompleksitet skal dælme give mere forklaringskraft!) Lad LM (hvor langt er hældning fra nul. for BEMÆRK! Vi antager IKKE.Bemærk. i ML sammenhænge) i stedet for som i teorem 12. 2) BHHH. Afhænger (typisk) kun af 1. dvs.2 (p. måske dårlige egenskaber selv i relativt store sample sizes.

antager ikke ) er en korrekt specificeret pdf for for hver periode.3. . ⇒ specielt vil den maksimere summen.3. at vi for hver enkelt kan få tætheden af Nu vælger vi hvilket er et slags PMLE problem 13. af når vi kun betinger på .- (dvs. . ”isoleret set”. at 2 possibilities - I begge tilfælde antager vi. var (y-var) Ingen problemer når blot vi har specificeret dynamikken korrekt. givet ved (korrekt spec) (han tillader. DYNAMIC COMPLETENESS er når distr.2 Lagget afh. betinget på 1) Integrate out Da er den simultane tæthed for Og log-like er 2) PMLE-agtig tilgang Antager intet om fordelingen af (givet ) I stedet siger vi. and strict exo kan være en vektor ( )) er givet ved .eff.1 Unobs. vil (unikt) maksimere for ethvert . at Smart teoretisk figumdik Definér det partielle likelihood bidrag som SMART ∷ Da er korrekt for alle . Men vi antager. at fordelingen af ∷ antag og er uafh. 13. da er Hvis denne korrekt specificerede tæthed er betinget på hele fortiden er lig med distr af 21 .

for … meget svært! ASYM VAR ∷ justér for at tage højde for at begge params. ku man ha fundet distr.Og vi kan igen integrere - ud. pp. . 14 GMM 14. estimeres typisk ved at antage en art homosked. hvor ” ikke er en funktion af ”. dvs. Desuden opnår vi samme efficiens som CMLE. estimate Reduced form.2 Classical Minimum Distance (CMD) IDEA SETUP Function maps 22 Structural problem. MLE (CMLE) Generelt er det muligt. væk. 439-442) Lad og .4 Uncond. estimeres. og smider dermed al denne info væk → vi kalder det UMLE. dvs. vi skal lave skal håndteres INITIAL CONDITION PROBLEM ∷ LØSNING ∷ betinger på (/antager) Her er betingningen på KOMMENTARER . at der i fordelingen af I CMLE betiner man på er information om . 13.5. metoder. 14. MLE (UMLE) vs. cond.3.Vi smider den første obs. når man ikke betinger på HVORNÅR ER DE LIGE GODE? Når . Da er det optimale valg og med dette valg er det ikke nødvendigt at bruge en vægtmatrix i GMM. PROBLEM vil næsten aldrig være kendt ⇒ skal estimeres.1 Efficiente instrumenter (§14. at . Alt. (desuden skal Til også estimeres) skal der typisk bruges ikke-param.

15 Discrete Response Models 15.Hvis dummies udgør en klassedeling.1 Linear Probability Model (LPM) – problematisk PROBLEMER Siden variansen for en Ber(p) variabel er afh.… men evt. … kan evt. er . KOMMENTARER . for et valg af og . er der automatisk heteroskedasticitet. godt initialt estimat af .2 Latent variabel model – probit og logit KOMMENTARER SKALA IRRELEVANT ∷ Indekse Hvis fx (eller ) kunne være skaleret arbitrært . løses vha. af . Predikterede værdier uden for . monotont voksende) på er den samme ( ⇒ Derfor: normalisér med Retningen af effekten fra Fortolkning af ’erne 23 . inden 15.METHOD Estimate Choose . da . WLS . giver de bare gns.

HVIS 15.2. på og .mult. så er også . Kan gøres som auxillary regression. fra reg af . LM ∷ Smart hvis den store er bøvlet. Muligt med Huber-White robuste s. 24 .15.kor.3 Tests i binary response index modeller Muligt med Wald. LM.1 Lad Da er .) (ligger i 15.Bøvlet augmented regression ala alm.e. WALD ∷ problematisk når den store model er for stor ( har høj dim). KOMMENTARER . LR og LM. 460-461) Like bidrag Log-like function Det kan vises. at og Så . LR ∷ Kræver begge estimeret.1 MLE (pp. udregnet ved og er misspec.’er ⇒ MEN ∷ hvis naturen af ML). ER IKKE-LINEÆR Wald foretrækkes.Denne er invertibel så længe der ikke er perf. (disse er .3. MEN ∷ ej invariant for reparameteriseringer Hetsked modellen meget besværlig (LM foretrækkes) ⇒ Her er så vi omskriver LM test .

probit på den med reglen: Vælg bil hvis . STÆRK antagelse Antag Attenuation bias: PROBLEM Ønsker ∷ Partial effect: Men probit giver os Probit kan ikke estimere partial effects evalueret ved BONUS konsistent .4 Reporting results Percent correctly predicted (#gange Pseudo . 15. ) partial effects (kaldet APE. std. ≅ . ≅ . .eff) 25 . så er ≅ in ved . hvordan dummies håndteres. hvor . ordens lokal Taylor) (se p. w/o loss of generality) . Probit kan godt estimere de forventede (mht.6.5 Random Utility Model og så kan vi køre helt alm. ≅ Smag og behag. Delta-metoden (2. personen – dvs.6 Specification issues 15.1 Neglected heterogeneity (c udeladt) Antag sande model er Latent form ∷ ( . da er . - Evaluere i gns. . hvor Bemærk. hvis .15. log-like fra unrestricted. part. 467 for detaljer) - Response probabilities ∷ - 15.fejl fås vha. c og x uafh.)) log-likelihood i model med kun intercept. avg.

på … så probit af på som vil (mao. samme argumenter som ved neglected heterogenitet som vi gjorde med (? eller hvad?)) spiller altså ikke ind i første ligning ’s fordeling kræves. kan vi skrive . at … (lang tung snak) … METODE MÅL ∷ APE’s ∷ dvs. Så er probit generelt inkonsistent 15.6. Da vil . . kontinuert variabel Antag Mistænker .2 Endogen. ingen strenge antagelser på .og c og x ikke uafh. kan vi tænke på TEST Hvis . 26 ⇒ dvs. Skriv - ⇒ ingen endogenitet 2-trins test for endogenitet (Rivers & Vuong. afledte eller differenser af flg. udtryk IDE ∷ får 1) Reg 3) Probit 4) Udregn 2) Estimér på ↷ . er og pga. ved at reg på ↷ .⇒ Nu kan man vise. 1988) Antag Under bivariat og .

at genbruge tankegangen bag hvordan vi fandt 27 .3 Når den endogene variabel er binær KORT FORTALT Både varians af Kan ikke løse for og må normaliseres for at få identifikation → den må integreres ud er grim! LANGT FORTALT kan fx være deltagelse i fx jobtræningsprogram. asym Alternativ til Rivers & Vuong (smartere. (proceduren er sindssygt svær at læse sig til!) Idéen er (vist). da R&V er en limited information procedure) FREMGANG Udnyt Ad Ad Ad ⇒ ⇒ normalisering ⇒ identifikation af discrete response endo.kan testes vha. 15.fejl korrigeres for 2-step . Denne gang bliver . ”den sædvanlige” (?) -test på → dog skal std. ∷ Antager ∷ ⇒ udregninger ⇔ ⇔ således at likelihood bidragene er og testes @ asymptotisk -test.6.

Men hvis fx det er fordi logit er den sande model.4 er man katolik eller ej Derved tillades at afhænge af uobserverbare faktorer. så ingen partielle afledte.6. 1995) går man i college eller ej 15. Ulemper: Konvergerer med rate Vi kan ikke differentiere Nogle gange har modsat indflydelse på .5 inkonsistent godt være ret tæt på.Så skal vi tage forventningen → til det skal vi bruge.6. Hetsked & ikke-normalitet Hetsked Antag i latent-variabel-formuleringen: Non-normalitet Så er 15. at (fordi Fordele: Robust: og Estimerer må godt være afh. idet ⇔ (inden i : -integralet) Vi når frem til (bemærk. konsistent op til skala – god til fx (selvom Horowitz (1992) har en smoothed version med næsten . at og til det bruge tætheden af er en trunkeret normalfordelt variabel. kan Manski’s maximum score estimator – estimation under svagere antagelser . . og 28 . og er ikke restrikteret. at spiller rollen af integrationsdummy) Eksempel: College attendal and catholicism (Evans & Schwab. ) ⇒ (medianer kan ikke være kommatal) Antag (og bemærk.

15.dep. → men stadig ikke attraktiv for binær-respons data. DYNAMIC COMPLETENESS ⇒ alm. korr.⇒ sample kan ses som en stort cross-section af str. hvor . Jacobian af (§12. Estimér . altsådyn. . bruge FE.2 Unobserved effects probit ANTAGELSE Dvs. .7. TEST for dyn. .var ∷ Estimér den potentielt syge. må fx godt indeholde laggede variable.SVÆRT pga. inferens OBS! Betyder ikke tidsuafhængighed – Betyder blot.1) Brug robust var-est.compl.) (OBS! man må droppe tidsperioder – ellers 15. Lag.1 Pooled estimation Model: PMLE-estimation (partial MLE) ≅ pooled - er konsistent uden videre antagelser.7. FD eller RE. at . . med dem (?!?!?!) MULIGE METODER som parameter ⇒ #params → ∞ for 29 .compl. som ej findes.7 Panel data / cluster samples Med LPM modeller kan man evt.vars Fixed effects ∷ fjern ved transformation .6.) BERTEL’s noter ∷ ingen lagged dep. ikke-linearitet Proxy for (når interesse er i APE) Pooled analyse (når interesse er i APE) Estimér ∷ Fixed effects probit (dumt navn!) Åndssvagt! Ser ville være perf.15. er strengt eksogen betinget på (specielt indeholder siden nok lags osv. hvor er .

eff. 5) SVAGERE ANTAGELSER . .normaler ↷ . hvor ( for hver std.?? Simulation @ int ≅ tage forventning 1) Træk 2) Beregn 3) Beregn 4) Tag gns. hvor tillades fuld frihed i off-diagonal (og 1’er i diagonalen) Slem curse of dim!  Men. for med konstant varians.Kræver specifikation af CMLE @ Fuld korrelation . ved Men hvorfor kan de pludselig det her når de ikke kunne i alm.  Restriktiv.ANTAGELSER    1) Streng exo ∷ 2) Uafh.Generalized estimating equations . ikke .REprobit) Indsæt i ligning: 30 . men tillader dog noget samspil (modsat trad.- . men robust for fejlspec af denne. -  Error form ∷ .eff. ).. og logs.MÅL ∷ tillade sammenhæng METODE ∷ specificere betinged Antag .Diskussion: man betragter Traditional random effects probit .Response prob. in press) har simulationsmetoder Chamberlain’s random effects probit . specificeres kun betinget på . Keane (1993.  3)       Max log-like mht. unobs. . ⇒ ⇒ som ikke-tilfældig… modsat hvad vi vil gøre! (betinget på ) && ud af ! METODE ∷ integrér og ‼ ) og (APE) kan godt estimeres! HURRA ∷ både INDSKUD ∷ integration Numerisk @ quadrature (part.

ikke engang . antager str. average den ud. eller i begge år duer OBS! Kun observationer. i   muligt at droppe antagelsen arbitrær seriel korrelation.var.4 Kan ikke estimere partial effects medmindre vi indsætter en værdi for Men hvilken værdi skal vi vælge? Ingen restriktioner. obs. INTERESSE ∷ State-dependence efter der er kontrolleret for JOINT PROB 31 . hvor ikke. som paramter. intet at gøre med FE probit. da den observeres) BEMÆRKNINGER Hidtidige udledninger ∷ afhænger kritisk af.exo Tidl. at → dvs. af Udvidelse ∷ Tillade tidsafh. fx ingen lags af dep. ! 15. hvor NAVN ∷ fixed effects logit ⇒ SKODNAVN.7. ULEMPER 15. dvs. idet. ! APE’s kan heller ik findes når vi ik har nogen antagelser om distr for Forudsætter Dynamic unobs. er strictly exogenous conditional on .- INTUITION ∷ Tilføjer tids-gns som kontrolvariabel ∷ partial eff. Så kan vi dog kun finde APE’s ved at integrere ”integrere” når tidsgennemsnittet holdes fast! ⇒ måde at kontrollere for uobserverede personspecifikke effekter ⇒ så skal inferens dog gøres robust for ud (hvilket i praksis kommer ud på at ud (dvs.3 TEST for streng exo ∷ add bare nogle lags og se om de bliver sign. der ik afhænger .7. den.eff (state dependence) Grundlæggende model BEMÆRK ∷ dvs. som ser FORDEL ∷ effekten på log-odd ratio. skodnavn) så vi (nemt) kan integrere mht. bidrager. NEDERN ∷ ik muligt at specificere tæthed for - OPTUR ∷ muligt med FE/FD-agtig approach! → viser sig at Log-like i hvor tilfældet: hvis og hvis falder ud når vi betinger på svedig feature ved logit-formen gør det muligt at få en funktionel form. outcome må godt påvirke response prob) ∷ . Logit: unobs eff og streng exo (FE logit.

kan fx vælges som Chamberlain.1 Multinomial logit . dernæst specificere b.prob. Chamberlain probit.a. . Alm. Kategorier Hvor og (samme ’er i hver kategori – bare med forskellig param) 32 .8 Multinomial response 15. . og tilføjes i alle tidsperioder ( -subscript viser APE’s mv. som ikke-stokastisk Streng antagelse ∷ medfører bl. a.lign.fejl. (Heckman. 1981) følge probit med resp. dvs. . dernæst for Svært at vælge tæthed.7. fås vha. a.Fx Manski for Cluster samples brugt på differenser Pooled probit/logit ∷ brug dog de robuste varians-estimatorer. dernæst for ? modelleres ikke! 2) Specificere tæthed for 3) Approksimere tæthed for Fx lade 4) Betinge på . 15. I PRAKSIS i. Std. Førende eksempel .5 Andet Semiparametriske metoder .INITIAL CONDITIONS PROBLEM ∷ hvad når vi når til 4 muligheder 1) Se a. 15. bootstrapping el.8. styk. ∷ tag MLE params og multiplicér med dette). a. hvor c.

skal afhænge af karakteristika ved RESULTATER BEGRÆNSNINGER Independence of Irrelevant Alternatives - Dvs. men ok med pris på o. men odds bliver pæne: LIKELIHOOD 15. ikke udd. hvilket er urealistisk. afhænger kun af karakteristika for og er . Hvis skal være . dvs. relative odds mellem og → så hvis kun konstant. karakteristika for ⇒ håndterer en helt anden type data – valg af alternativ netop .lign.2 Probabilistic choice models: Primarily. erfaring.RESULTATER Partielle effekter har en meget besværlig form. LØSNINGER 33 . we’ll look at conditional logit.Elements of TypeI Extreme Value differ between alternatives can’t contain elements that don’t vary across alternatives! Dvs. but conditional probit is a nice extension (although it has some computational issues) Conditional logit Derived from underlying utility-maximization model ANTAG ∷ REMARKS .8.

c. men giver mening til . Vælg i stedet for ⇒ ordered logit Valg kan tillægges tal. 15. men teknisk bøvl OBS! Nu giver faktisk mening. fx ”hvor mange % sætter du i aktier. 50% eller 75%?” ⇒ ingen betydning for estimation. er der conditional logit blandt alternativer i den gruppe. men ikke kardinal nytte (2 er bedre end 1. MEN ∷ besværlig beregning (inkl. og har fortolkning som om det var OLS! 34 . men ikke nødv. halvt så meget som 4) Del op Response probs: INTET INTERCEPT i Loglike ∷ ’erne spiller rolle af intercept (for er interceptet) (og vælg som sædvanligt RESULTATER med . ) ∷ @ Chamberlain tilgang (antag+approx pdf for INTERVAL-KODET DATA Samme idé. derefter vælger man inden for de enktelte grupper (betinget på at vælge gruppe . hvor kovarianser er urestrikterede.EFF ∷ (dvs.UOBS. og integrér ud) . I tillades . Idé ∷ indfør 2 lag ∷ først vælger man mellem grupper. 25%. -dim integral) b.9 Ordered response – ordered logit/probit Valg har ordinal.1) Multinomial probit (= conditional probit) a. Dog: simulationsmetoder 2) Hierakiske modeller ∷ fx nested logit model a. Ellers ∷ Evaluér ved referenceperson / rapporter % korrekt predikteret BEMÆRKNINGER Hverken eller har separat betydning.

Estimation TÆTHED ∷ ens for Cond.1 Tobit ANTAG ∷ 16. eller . Observerer 2) Corner solutions a.16 Censored regressions and corner solution models 2 typer 1) Censored data a. . UDLEDNING Derfor fordi .1.like INFERENS .log. .Wolle giver første/anden afledte 16.Alm. så - 35 . MLE .2 Quantities of interest Afh. 16. af model: Censoring ∷ den latente variable.1.1 ⇒ .Corner solution ∷ den faktiske variable.

tobit konsistent for CORNER ∷ måske.’s er bare skaleringer af .PARTIAL EFFECTS BEMÆRK‼ . - Så er EKS Diskret: og 36 .2 Neglected heterogeneity (§16. ANTAG ∷ har pdf.De part. vil vi have LØSNING ⇒ integrér ud. CORNER ∷ vis er interessen ⇒ rapportér . dvs. eller (?? p530??) ? ANTAG ∷ PROBLEM ∷ skal håndteres eksplicit LØSNING ∷ integrér ud.6.eff. skaleret med Fra NOTERNE: ’erne -variable ⇒ vi forventer ) RESULTATER CENSORING ∷ husk. 16.1) KONKLUSION CENSORING ∷ intet problem.(specielt.

16.I generel model: specificér hetsked Non-normalitet ∷ svær – noget med probit 16. 16. tobit af på ) Som for probit Std.3 Endogenous Som for discrete choice ⇒ må antage mere struktur ∷ den endogene. OLS. -test. hvor kun kræves for konsistens TEST Hetsked @ LM (score) tilgang → så estimerer vi den almindelige Tobit som nested i en mere generel model .5. af fuld fordeling) OBS! Modsat alm. .- Kont:  ⇒ & . antages .Dvs. POINTE ∷ slippe for at antage ANTAG ∷ . - Fuld MLE ∷ specificér simultane fordeling af de endogene vha. ⇒ antag så .fejl skal korrigeres MEN ∷ Indsætter direkte (eller estimeres ikke (relevant for CORNER når man estimerer APEs) og estimerer den samtidig @ ML efter parameterisering) via alm.4 Hetsked & ikke-normalitet ALVORLIGE KONSEKVENSER Inkonsistens (da ML afh. ingen pdf / uafh.5 Estimation under svagere antagelser 16. hvor ⇒ vi kan erstatte Tobit ∷ 2-step (Smith-Blundell) ∷ estimér reduceret form for endogene ved OLS ↷ inkludér residualer (dvs. antagelser ESTIMATION LAD (least absolute deviations) M-ESTIMATION 37 .1 Powel estimatoren . ⇒ pga. - TEST ∷ i begge settings testes - DOG ∷ ML en del tungere beregningsmæssigt ↷ estimér Smith-Blundell først og test endo i den.

MEN ∷ specifikationstest for Tobit modellen PROBLEMER Criterion function er diskontinuert ved : - Desuden ∷ . MODEL .5. 38 .eff.MEN ∷ RESULTATER Censored: Powel viser dog er kontinuert ⇒ konsistens følger af 12.2 Estimér median-reg på fuldt sample ⇒ fjern Hvis konvergens er der gevinst. .Ingen af de ønskede  kræver antagelser om fordeling . Tier #2 er hvor IDE ∷ I Tobit er ” ⇒ måske forskellig virkning på den intensive vs. med alm.1 Sml.3 -asymptotisk normalitet. om man skal vælge stor skal vælges.(generelt for LAD) Alternativt – ILPA (iterative linear programming algorithm) 16. og . ⇒ Hurdle / two-tier models ∷ hurdle’n eller tier #1 er. den ekstensive margin.6 Tobit for panel 16. ⇒ estimér med-reg ⇒ fjern ⇒… Alternativer til Tobit for Corner – ekstensiv vs. 16.2 ikke differentiabel ⇒ kan ikke bruge 12.6. tobit ANTAG ∷ Tobit på cross-section med obs. intensiv part. . HVIS ’s fordeling er symmetrisk omkring 0 Corner solution: . ” og ” ” den samme eller .

med potentielt . 2 vars i alm. men ikke er ok . ⇒ incidental parameters ⇒ Random Effects tobit. . dvs. . afhænger af corr.⇒ streng exo. så vælges som enten . er bøvlede at inkludere ( observeres kun delvist) YDERLIGERE ANTAGELSE Dynamic completeness ∷ 16. så er for dvs. at alm. (bedst hvis . Fordi mellem tilgængelig) eller POSITIVT Kræver ikke streng exo af Antager Laggede i er ok og . MEN ⇒ netop den antagelse.! og ↷ test samtidig . der giver. Chamberlain-tilgang ved transformation @ Honoré (1992) Random effects tobit – antag pdf for c ANTAG ⇒ Bemærk. hvor er den simpleste for . MULIGHEDER 1) Estimér 2) Antag 3) Eliminér . Tobit ∷ Tobit med unobserved effects ANTAG ∷ . .compl antagelse om uafh.6.2 OBS! dyn. kun Seriel korr. og ⇒ ⇒ .vars.Inferens @ robuste estimatorer. og . inferens duer TEST ∷ medtag flg. i Ingen antagelser om Laggede dep. streng eksogenitet‼‼ (udelukker noget fra ) Og (eller følger det af ovenstående?) 39 .

IDENTIFICEREDE params ∷ PRAKSIS Alm. hele og !) inkluderet i hver periode.3 Muligt at relaxe Muligt at udvide Powel til dette setting. kan bruges for at blive mere generel. Kør bare random effects tobit med regressorne: 17 Sample selection attrition and stratified sampling 17. ⇒ bøvlet som bar fuck! Censored ∷ giver bedre mening at inkludere Problem: initial conditions IDE ∷ antag fordeling for PRAKSIS MODEL betinget på og (wow. om eller 1.6. tobit. Dynamic unobserved effects tobit DUER KUN (/bedst) FOR CORNER! ANTAG ∷ .Dvs.APE’s kan estimeres jf. Tilføjelsen af har løst alle problemer ( er nemlig identificeret) ( ) evalueret ved fx .1 Sample selection ÅRSAGER til ikke-tilfældig sampling: 40 . hvor medtages i hver periode (evt. streng exo af BEMÆRK Corner ∷ afhænger af. RESULTATER ∷ CENSORED RESULTATER ∷ CORNER Vi kan tage differenser / se på ∂ ved . wolle VIDERE 16. men det er tungere beregning) ⇒ identifikation hvis der er tidsvariation i .

⇒ ingen problemer! Så ”indeholder . da og ingen yderligere info om nogen aspekter af fordelingen af . Non-response b. VISE ∷ . (på det selekterede sample) alene ∷ uanset b. der vælger at tage arbejde i. der har et job Adfærd ∷ a.OBS! Konklusionen gælder også for NLS! CMLE ∷ hvis vil MLE på det selekterede sample være konsistent. . Dvs. 17. HECKMAN 2-step ∷ i. a. 2) OLS af på på og 41 ↷ (på fuldt sample). Det viser sig.… hvis ikke må vi benytte andre krumspring (antage mere struktur) . b. ANVENDELSER (eksempler) MULIGHEDER for selektion 1. af a. (vi betiner en gang for meget) er uafh. specielt ikke den betingede forventning”. ⇒ ingen problemer. Anden variabel forklarer mangel – Heckman selection kan løse dette. 1) estimér probit af ii. 4. mellem b. ⇒ så kan vi udlede (disrete response selection) Tillader afh. 2.2 Simpel model Del datasættet op ∷ kun MÅL ∷ bade observeres og observeres. Ser kun løn for dem.Så snart denne betingelse holder er pooled OLS ok . Attrition (dropper ud over tid – ikke problem i register-data) c. men kun påvirker . a.- Selektion på forklarende variabel ∷ fx kun 30-50-årige Truncation ∷ selektion på forklaret variabel ∷ fx ser kun om folk har job for folk. er en (deterministisk) function af a. b. at ∷ c. 3. ⇒ (truncation) Antag fordeling af og brug truncated Tobit og bruge CMLE. og ∷ påvirker selection.

hvor kun det selekterede sample bruges vil give konsistente estimater.3 TEOREM 17.2 Sammenligning: ML vs. instrumenter og estimere med 2SLS . Implicerer mere struktur b.5. hours worked) i. for ⇒ da ingen andre led afh.2.g.2. af . med 17.1 ML i sample selection – PMLE Strukturel model ∷ Selektionsmodel ∷ UDNYT (hvor ) 17. en pdf og cdf er givet. 1) Estimér censoreret Tobit af på ↷ residualer ) for de selekterede (dvs. and a. 42 . på med instr .2. IDE ∷ ⇒ så kan vi finde ssh. (dvs. 2) OLS af på og (Tobit selection – e. Heckit Robust var-estimator ( ) er valid – ingen generated-regressor problem a. moment-tests) Numerisk tung Ad 2SLS på selekteret data FORDELE ∷ PMLE > Heckit - ULEMPER ∷ PMLE < Heckit 17. dvs.4 ANTAG ∷ ⇒ 2SLS af på . ∷ Random sampling ∷ nok at antage Ad 3: Truncation (selektion på y) Selektionsligning ANTAG ∷ fordeling for er kendt.1 model Selection @ 17.2. ved inferens i Heckit)) Stærke antagelser ∷ (men de kan testes vha. med isntr . 2-step ii. konsistente varians-estimater – altså spg.

5 .TRUNCATED TOBIT Fås ved at vælge SAMMENLIGNING 17. b) Estimér OLS af .Bøvlet at finde varians når 43 . og . for meget tages med BEMÆRKNINGER . men se.2.Ville følge hvis ESTIMATIONSLIGNING . med det selekterede sample. med Mildere end observeres når . ANTAG 1) 2) 3) 4) . -værdi da ⇒ alm. Pga. CENTRALT ∷ ”the coding rule” er ikke kendt – i modsætning til top coding (hvor IDE ∷ antager parametrisk form for . .Testes @ std. selektion kan vi kun håbe på at estimere Dvs. som er et specialtilfælde. FORSKEL ∷ i censored observeres LIGHED ∷ Hetsked / non-normalitet ⇒ inkonsistens Probit selektion – exogene variable (Heckit) bestemmes af en probit model. når ). i truncated censoreres både og . også når censoreres.⇒ konsistens og TEST -asymptotisk normalitet . OLS asymptotik holder selvom en var. at ok da ikke observeres. . vi mangler som regressor ∷ udnyt at MEN ∷ observeres ikke LØSNING ∷ udtrykke - da det er en truncated normal ↷ inversel Mill’s ratio ⇒ OBS! Inkons af OLS skyldes omitted variable ∷ PROCEDURE (Heckit) a) Få ∷ Estimér probit af på på . observeres altid.

observeres altid. . ∷ konsistent ved probit af på på på pr. konstruktion . af ) exo men manglende somme tider (non-response) ⇒ modellen duer stadig. forsk. Eks. (exo) Ala alm. BEMÆRKNINGER OBS! Vi skal have vars i som bestemmer selektion og den endo (relevans).2. Idé til instr: hvis man blev indstillet tilfældigt (men stadig skal instrumenteres. . Udregn (for sig selv) (for ) og . for 17. grim betinget på → udnytter igen Bayes til at opskrive ud fra ssh.Hvis - antages kan PMLE bruges (lang. …) givet over ssh. observeres kun når .6 Probit selektion – endogene variable ANTAG 1) 2) 3) 4) 5) (skala arbitrær da og i ligning 2 er ) hvor . TEST BEMÆRKNINGER kan være diskret.- Stadig konsistent når → MEN ∷ noisy ∷ (samme regressorer for id’es kun pga. (for sig selv) på selekteret 2) Estimér 2SLS af med instr .1 ∷ konsistent at bruges 2SLS af PROBLEM ∷ mangler PROCEDURE 1) Estimér sample). men ikke . 44 . ikke-linearitet i og . for at deltage på bgg. for generelt: UDVIDELSE . endo problem. ssh. (fuldt sample).Arbitrær korrelation tillades mellem UDLEDNING TRICK: Her er ⇒ teorem 17. men vi må antage struktur på den endo.

observeres ⇒ kør OLS på selekteret sample kan estimeres konsistent for de med .- Mindst 2 vars i Hvis vi antager skal bruges – tænk: én til og én til at identificere selektion ( ).Som for probit . PMLE mulig @ ANTAG ∷ . som netop er de selekterede ⇒ BEMÆRKNINER Efficiency gain ∷ intuitivt klart. §probit) MOTIVATION ∷ separat variation i EKSEMPEL ∷ timeløn. vil id af . af alene.7 Tobit med eksogene forklarende vars ⇔ vi kan sige ”hvor langt” man er fra selektion ⇒ mere efficient ved probit af på (for hele sample) (jf.Tænk selektion: UDLEDNING IDÉ ∷ hvis MEN ∷ for selekteret. kan vi bruge PMLE. (skala ej arbitrær da observeres!) observeres altid.a. Udregn . køre på ikke-lin. #timer arbejdet p. . observeres kun når . PROCEDURE 1) Estimér 2) Estimér ved tobit af ved OLS af på på for hele samplet.2. Hvis y1 i stedet var binær ANTAG ∷ (en masse) + PROCEDURE 1) Estimér 2) Indsæt i 17. hvor langt folk er fra de-selektion. ANTAG 1) 2) 3) 4) BEMÆRKNINGER . OK med 45 MODSAT probit! → @ nu har vi separat variation i . vi kan se. (hvis ingen ekstra til selektion. .

PROCEDURE 1) Estimér ved Tobit af på . konstruktion ⇒ 2SLS på selekteret sample er ok.hvis bare også ganger MODEL ANTAG 1) 2) (⇐ er invertibel ) 46 (alm.1 Fixed effects på ubalancerede paneler kan vi ”uden videre” bruge formlerne med OLS på transformeret data.3 Paneldata: Sample selection Overordnet set: Attrition / selection i paneldata kan ske for 3 grunde 1. pr.- hvor er .8 Tobit med endogene forklarende vars ANTAG 1) 2) 3) (skala arbitrær da ) hvor .2. Udregn på og vha. og er den sædvanlige 17. observeres kun når . (for sig selv). 4) 5) og i ligning 2 er UDLEDNING (som for probit med endo) her er observeres altid.3. Folk vælger at droppe ud (attrition) 3. 17. (for sig selv) på 2) Estimér ved 2SLS af selekterede sample BEMÆRKNINGER kan være kont. instr for selekterede . (for ). rank-condition) . Tilfældigt (”rotation”) ⇒ nemt at håndtere 2. Incidental truncation (fx arbejdsløshed 17. hvis kan medtages ⇒ estimér @ Tobit. hvis vi på hver gang (fx ) RESULTAT . eller diskret.

testes @ alm. hvilket sparer på . Almindelig robust FE-varians kan bruges Tilladt at danne et balanceret subsample og estimere på det. PROCEDURE 1) Probit 2) FE af på på (eller og ) – fuldt sample.3) BEMÆRK . med . FE inferens holder) BEMÆRKNINGER 17. (eller @ alm. fx vælge VIGTIGT! Vi kunne lige så godt have brugt FD metoder.3. Udregn – selekteret sample. -teststørrelse Incidental truncation under H0: ingen selektionsbias BEMÆRK ∷ en enkelt var observeres ikke i nogle perioder IDÉ Chamberlain-inspireret ∷ tillader Antager lineær struktur MODEL (alternativt bare lade tidsgennemsnittet for parametrene) afgøre ∷ . . Incidental truncation under HA: selektionsbias ANTAG ∷ 1) 47 .RE analyse kræver ESTIMATION Definér (⇒ alm. OLS. 1992) 1) Estimér FE af 2) på og på det ubalancerede sample. .2 FE kan kun bruge . Test / korrektion for sample selection bias Procedure (Nijman & Verbeek.

3.2) PROCEDURE 1) Probit på for hvert og gem for alle på . ) – tænk: ingen samtidig når der er kontrolleret for antages at være strengt eksogen. MODEL IDE ∷ sekventiel natur.4 påvirkning fra LØSNING ∷ IV Instrument . ANTAG ⇒ (hvor på ⇒ ↷ på ↷ . redundant i selektionsligningen) og med er eksogen i modelligningen ). indeholder hvor osv. ). PROBLEMER 17. hvor (dvs. at så vil Attrition – man vælger at udgå af sample erstattet med . . men med I Tobit frameworket kan vi også tillade. .3 INTUITION ∷ følger af. at 17. Step 2 i procedure: Lav 2SLS i stedet og instrumentér Inverse probability weighting (IPW) (som fx kan være Antagelsen udelukker at til kan påvirke attrition (efter betingning på . 2) Pooled OLS på det selekterde sample af BRUG robuste var-estimatorer Incidental truncation Tobit selektionsligning Hvis selektion i stedet sker på baggrund af Samme procedure som oven for virker. kan vi mere for alle (og vi betinger jo hele tiden på ANTAG ∷ ingen ”re-entry” ∷ attrition er en absorbing state. MÅL ∷ Generelisere metoder til ikke-lineær estimation (M-estimation) ANTAG 48 . ⇒ ↷ brug FD og skriv (reduceret form) ligningen for selektion betinget på selektion i forrige periode fx kan ).3. Tests er ikke længere oplagt simple (robusthed så vi ikke behøver betinge på det yderligere) indeholde og (ikke da den står på LHS for forrige periode ⇒ corr med PROCEDURE 1) Probit 2) Pooled OLS af kræves).

⇔ . weighting estimatorer (og evt. . the bigger the problem! . dvs. PROCEDURE 1) Probit på ↷ gem de fittede sandsynligheder.1 og ATE.4 Non-parametric bounds LOWER BOUND UPPER BOUND REMARKS Bounds are tight when ≅ . som vi ikke ser på) 2) Regression discontinuity design 3) Panel data: difference in differences (og before-after) 4) IV og . gang med INTUITION Regularitet giver.hvis attrition probit’en ændrer sig over tid?? ⇒ bølvet at håndtere… 17. 49 .(knew this already.) 18 Treatment effects OVERORDNET ∷ ønsker at estimere TILGANGE 1) Ignorability of treatment (ATE. at kan erstattes med når vi udregner asymptotik (antages ). ). UDVIDELSE .1’) ∷ regression. mixed. matching.Kaldes selection on observables eller ignorability of selection. hvor målfunktionen vægtes med . Intuition ∷ the more observations that are censored. 2) M-estimation på selekteret sample (dvs.

så dem i programmet har særlige gevinster.1 Noten Internal validity ∷ hvilken effekt havde jobtræninsprogrammet ⇒ ønsker vi ⇒ kan vi ikke få . at (evt ik-lineær) . COMMON SUPPORT . men vi kan bare når . Desuden betyder. fordi missing data gør. ⇒ vi kan fjerne betingning ∷ generelt er kun udregne ⇒ 18. der påvirker ATE’ ⇒ .) MISSING DATA ∷ only MULIGE ANTAGELSER ⇒ Så er or is observed: og . er partialled out. . af de tilbageværende. at vi kun har .External validity ∷ hvilken effekt vil et hypotetisk program have Average treatment effect . or discount.dvs. hvor 50 . vil de tilbageværende faktorer. else iid.On the ∷ treated ∷ untreated ∷ overall RUBIN’S CAUSAL MODEL outcome w/ treatment. ATE1: betinget på ATE1’: a) (selection on observables) ⇒ når som påvirker . vi skal se single-mødre i begge grupper (treatment og non-treatment) 18. være uafh. SWITCHING ANTAG ∷ KAN VISE ∷ .1. outcome without (cont.1 Nonparam id – ignorability of treatment er og b) . . OBS! Uafh.1.18. if treated.2 Regressions and switching models Tænk ∷ person-specifik gevinst ved programmet.

ATE. 51 og givet at man på et tidspunkt .ANTAG ∷ ANTAG VIDERE OG ⇔ samt ”⇔” PROCEDURE 18.3 (s.of.1. Average treatment effect at Vi definerer ANTAG - ∷ .Vi får blot en lokal gns. som lige akkurat blev treated MINUS gns.1.’s på denne via bootstraps eller Δ-metoden. vi estimerer på det treatede sample og tjekker forskellen på bliver treated. gevinsten er kont. er ikke!) (dvs. uafhængig af – . i Under kontinuitet er ESTIMATION - INTUITION ∷ gns. for dem som lige BEMÆRK . treatment effect at er . til er .treat. Regression discontinuity Reg på ∷ koeff. akkurat ikke blev treated for dem.4 Hvis treatment effekten er heterogen er den ikke lig med hverken Before-after eller ! Diff estimator IDE ∷ sammenligne individ med sig selv! OBS! Kræver paneldata og kan kun estimere ANTAG ESTIMATION ∷ FØRST ∷ diff-estimator (avg. treatment effekt lige ved cutoff niveauet 18.1 (ignorability of treatment) ∷ betinget på og er kontinuerte i avg.treated) - dvs.e.

Når der er både selection og sorting bias: essential heterogeneity TIDLIGERE ∷ Diff-in-diff eneste estimator.5 Dvs. der tillod 18. at den gns. men kun hvis de er tidsinvariante 18. hvor er koefficienten til . FUCK! Hvis folk selekterer ind i programmet er … AHA! BRUG FD! PROCEDURE .6 Estimation af ATE ved IV under antagelse af homogen treatment effect ANTAG ATE. at randomisering holder i FD . Selection and treatment effects OPSPALTNING af det ”observerede” gain - Selection bias = ability bias i labour econ Sorting bias = selection on the gain. fx ikke Ashenfelter’s dip ∷ discouraged worker lige før treatment. udvikling over tid er den samme i de to grupper ⇔ samme tids-trend) SÅ ER ESTIMATION ∷ overraskende nemt i regressions-framework ANTAG ∷ . “forhåbentlig” treates dem med størst potential gevinst.2 ∷ a) b) c) 52 .MEN ∷ hvad med generel tids-trend? ⇒ motiverer diff-in-diff Diff-in-diff ANTAG (dvs.Antagelsen tillader selektion på unobservables.Indfør controls .1.Bygger på antagelsen om. BEMÆRKNINGER .1.Regressér på .

kan vi få en mere efficient procedure Erstat c) med ∷ 1) estimér 2) instrumenter 18. Desuden b) ⇒ som . . i.7 med og og ) i stedet for og yderligere d) (tænk ).e. Procedure 2: IV med propensity score Hvis vi er villige til at gøre yderligere antagelser. fx med probit (som funktion af Heterogene treatment effects (v0 ≠ v1) ANTAG PROCEDURE 1) Estimér 2) Estimér i med MLE og få (fx probit / logit) ved 2SLS med instr 18. været et andet udfald. b) ≅ exclusion restriction. observerer vi ⇒ ANTAG (monotonicitet) 53 . IV Instrumentér med og med sig selv. idet vi kan skrive spiller ingen rolle i ligningen for .1. hvis havde været på en anden måde. Dermed kan vi skrive ligningen for MEN ∷ og kan godt være korrelerede‼ ⇒ endogenitetsproblem Procedure 1: Alm. PRAKSIS ∷ TÆNK vi observerer kun ∷ hvis . at der kunne have observerer vi . men ønsker at tænke det sådan.FORKLARINGER a) ⇒ .8 LATE (local average treatment effects) CHANGE MINDSET ∷ nu to typer treatment! Vi trækker for alle individer ⇒ smider én af ’erne væk ⇒ smider én af ’erne væk. hvis .1.

af koeff.10 Sammenhæng med den simple sample selection model ANTAG ATE.9 Modsat HVIS HVIS GENERELT ∷ der har størst gain. og hvis dem. Essential heterogeneity and IV (sorting on the gain) Essential heterogeneity ⇔ der er bade sorting og selection. vil . . til . hvor og missing) (lige så vel som Vi kan ikke observere populationen med vi ikke observerer 18. vil . hvor er sample avg. som vi kan finde eksplicit. . blev ændret fra 0 til 1. som ville participate hvis defineres ud fra variationen i Modsat og .) DET GIVER INGEN MENING‼ INGEN OVERHOVEDET‼ 18. forudsiger perfekt hvem. der bliver treated også er dem. → her: en model hvor der er sorting på gains! MODEL - Her (må) Definer ⇒ - (bemærk ligheden til . ’erne for de treatede) er forventning over den treatede del af populationen. over . treatment effekt på dem. som defineres ud fra forhold i populationen (dvs.4 54 .(…) ESTIMATION IV reg på med som IV for ⇒ FORTOLKNING BEMÆRK gns.1. der bliver treated. .1.

1 ∷ og er uafhængige når vi har betinget på (b) . nok at tage hensyn til .3 Mere parametrisk tilgang ANTAG .ATE. på . er lig den generelle plus den forventede individuelle gevinst ved at blive treated ( er lig den individspecifikke gevinst ved treatment) Bemærk ∷ kræver flere antagelser (typisk) end . 18.2 Ikke-parametrisk tilgang ⇒ ⇒ – begge estimeres som avg. hvor så PROCEDURE 1) Probit af på . effekt i sub-sample bestående af de treatede (⇐ fx ) ) (men Mindre struktur ∷ antage mean independence ∷ dvs. MODELTANKEGANG SÅ ER dvs. 18.ATE. dvs. hvor .Faktisk. ANTAGER at ∷ restriktivt DENNE ∷ 1) estimér 2) reg pooled OLS med de genererede regressorer .a) b) c) d) e) SÅ KAN VI SKRIVE fx … og endelig og for for .1’ ∷ (a) RESULTAT SMART ∷ Definér 55 . Få 2) Regresser @ POLS ∷ Sammenligning med IV tilgangen IV ∷ 1) estimér 2) kør 2SLS med inkluderet som regressor.Tillader comparative advantage structure samt hierarkisk struktur – sandsynligt.

Vælg 18.1’ alene giver os to ting: 56 . som vi har antaget betinget middelværdi nul for.1 Switching regression ’er ⇒ men muligt @ bootstrap / Δ-metoden. Vi kan som nævnt altid tænke så indsat i definitionen som vi tænker på som en reg model ANTAG ∷ ATE. → vi kan estimere den ikke-parametrisk! ESTIMATER PROBLEM ∷ std. (eller for lidt mere generelitet) . vi har i vores datasæt! identificeret for .3. og . non-param 18. ⇒ så er med giver det (fik vi allerede tidligere) og endvidere er og er et fejlled.TÆNK ∷ EKSEMPEL . KONKLUSION ∷ ATE.ATE.2 Svagere antagelser – to ukendte g-funktioner ANTAG .3.Så er og → dermed er samt er sådan set det.1’ ⇒ så er hvor .1’ ∷ for .fejl skal fås fra de evt.

2) er additiv i PROBLEM – Saturated model Hvis ’erne vælges for komplekse får vi problemer (ikke datatæthed alle vegne) For at komme videre: antag form for g0 og g1 ANTAG .1’ ⇒ så er . kan det udnyttes ) Hvis ofte vil fx .4. men hvor én treates og én ikke gør. dvs.1’ SÅ ER (mao.ATE.3 (husk nemlig at uden antagelser er Regression disc.3. eksempelvis briller gives til børn med dårligere syn end ± 2 ⇒ sammenligne personer med næsten samme ’er. designs og hvis har en diskontinuitet.OLS af på RESULTATER for .1) er en funktion af og og (en funktion af ).4 Propensity score Ved at fokusere på og → MEN ∷ der gemmer sig nogle ret tunge antagelser under. 18. 18. 18.hvor ESTIMATION . kan man opnå konsistente estimater af ANTAG .ATE.1 ATE skrevet som funktion af p. som estimeres med probit (i regression eller mere ”ikke-parametrisk”). antag og ) IDE ∷ kan fås fra probit 57 .

5 Matching ANTAG Så kan vi estimere BEMÆRKNINGER 58 . til ). på på .4.regressér på MOTIVATION . dvs. at . kan vi opskrive det som en regression -asymptotisk normalt estimat af (koeff.Tilføj som regressor. logit/probit med en Sieve funktionaf og inden i 2) Tag sample equivallent af 18. regressér BEMÆRKNINGER Man kan også køre regression en er lineær i for 18. men så skal man i stedet antage. . Regressér y på w og p-hat som regressor. hvordan man estimerer . at så … . sæt ” ” Simpel idé: tilføj .2 (hvor Logit/probit sikrer. at der findes BEMÆRKNINGER Det hele kommer til at hvile på.ATE.) .PROCEDURE 1) Estimér ∷ fx vha. ∷ fx med probit.Som før… hvis vi tillader ANTAG . dvs. men måske maskerer det bare det mulige sample problem.1’ er ukorreleret med SÅ GIVER regressionen PROCEDURE Estimér .

så vil interaktionsleddet med (svarende til. er korrekt specificeret! for lotterinummer (højt ⇒ nok ind og springe. at kovariaterne kommer fra mere “iid-agtige” processer. og ukorr.2 ∷ ortogonal eligibility og en mildere version af og mere SÅ ⇒ direkte estimation kører og vi kan skrive TÆNK ∷ og eligibility uafh. dvs. men alle naboer vægtet efter deres “afstand” i . hvis og afhænger altså ikke af HVIS ∷ instrument ANTAG ATE.- Matching estimatorer “balancerer” samplet så det ligner. er (dvs.(⇒ OBS! i alm. nok med og .ATE. at essentielt set)) gå ud. . hvor altså ANTAG ATE. at MERE STRUKTUR Skriv . af observables.2’ ∷ IDÉ: og PROCEDURE 1) Estimér 2) Estimér generelt har samme stokastiske led. 18. fx Angrist’s lotteri for værnepligt: er det optimale instrument for (fx probit) og mere ved MLE (fx probit).2 … og… Da bliver PROBLEM ∷ LØSNING ∷ IV PROCEDURE og for (evt.) korrelerer måske… og måske gør en af regressorne 59 . med sammensatte fejlled ⇒ potentielt muligt at instrumentere BEMÆRK ∷ bygger vigtigt på antagelsen om. Tillader heterogene responses – ikke-parametrisk tilgang ⇒ ingen restriktioner på respons. men nogen slap && tilfældigt) ANTAG ATE.6 IV-metoder Skriv ligningen som TILLADER tillades at være endogen . 2SLS er der ingen yderligere betænkninger ved at instrumentere en dummy!) BEMÆRK Hvis . Bedre -estimator ∷ ikke bare bruge de nærmeste.3 ∷ . på og med instrumenter og .

men PROCEDURE 1) Estimér 2) OLS uden IV på og .4’ . ANTAG ATE. (dvs.1) Estimér BEMÆRK ∷ - ud fra (probit) på med instr . alt andet for sig 60 .4 ∷ . .Som ovenstående.… en masse plus PROCEDURE 1) Estimér 2) OLS på selv). OG og med instr . 2) OLS af ovenstående ligning. for . er crucial! ANTAG ATE.

Sign up to vote on this title
UsefulNot useful