You are on page 1of 6

1

0.1

Diskussion af konometrisk metode

I artiklen `Estimating the economic model of crime with Panel data' af Christopher Cornwell og William N. Trumbull, forsges det at lave en model der forklarer kriminalitet ved brug af kometriske metoder. Mere specikt er de kommet i besiddelse af et panel datast hvor man har informationer vedrrende 90 counties i North Carolina fra rene 19811987. Variablene som de har til rdighed kan groft sagt deles op i to kategorier, hvor den ene del af variablene er direkte relateret til kriminalitet, mens den anden del er variable der karakteriserer samfundsmssige forhold i hver county. Den store forskel fra dette studie og tidligere studier omkring 'the economics of crime', skal ndes ved brugen af paneldata, frem for cross-section data p stats eller nationalt niveau. Datasttet som de har brugt er som sagt p county niveau, hvilket betyder at de ikke i lige s hj grad betragter en aggregeret konomi som ved data p nationalt niveau. Optimalt ville det vre hvis det var muligt at flge hvert enkelt individ i staten, da det ville gre det mulig at undersge mere specikt hvad der kendetegner krimininelle og hvilke faktorer der frer til kriminalitet. Aggregeringen mindskes dog ved at betragte counties frem for stater. Cornwell og Trumbull gr ud fra flgende linere basis model til at forklare kriminalitetsraten:

T T Rit = Xit + Pit + ai +


hvor

it

(0.1)

Rit

er kriminalitet per capita,

Xit

er en matrix der indeholder variable der beskriver samfundsforhold i hvert

county, mens

Pit

er en matrix med variable der angiver de prventive forhold relateret til kriminalitet.

Udfra () har de lavet to transformationer af modellen. Den frste er en skaldt 'between' transformation af modellen, hvor de for hver cross-section enhed tager gennemsnittet af alle variable og bruger s disse nye variable i modellen. Transformationen medfrer sledes at regressionen bliver en cross-section regressionsanalyse. Paneldata muliggre det at kontrollere for ikke observerbare karakteristika for hvert county, som kan have korrelation mellem de forklarende variable vi observerer. Fra teorien ved vi at korrelation mellem fejlleddene og de forklarende variable vil give 'biased' estimater for parametrene i modellen ved brug af OLS og korrelation med

ai

vil give inkonsistente

esimater. Den anden transformation af () de betragter, svarer til en xed eect model, der netop er designet til at hndtere dette problem, hvor man i stedet for at bruge de originale variable, bruger 'demeaned' variable sledes

ai

elimineres fra modellen. Det vil alts sige at de har to forskellige modeller, hvor den ene neglicerer uobserverede karakteristika, mens den anden tager hjde for den mulige eksistens af sdanne eekter. I begge af modellerne glder det at de anvender variablerne s de optrder i logaritme form, sledes at modellens parametre skal fortolkes som elasticiteter, hvilket giver en naturlig fortolkning i forhold til problemstillingen. Deres estimater p between modellen er i overensstemmelse med tidligere studier, som har brugt samme estimationsstrategi, det vil sige OLS p cross-section data. Efter estimering af xed eect modellen, ses det at modellens parametre er signikant forskellige. Alts er der indikation p korrelation mellem regressorerne og

ai .

Cornwell og Trumbulls studier viser at lnninger har en indydelse p kriminaliteten. Den intuitive begrundelse er, at i den konomiske model for kriminalitet, ser man p det lovlige alternativ til kriminalitet - der ofte er arbejde i en sektor med lave krav til de ansattes evner. Et kritikpunkt er imidlertid, som det fremgr i tabel?, at den eneste branche med negativ koecient og signikant t-statistik er fabriksarbejdesektoren, der iflge Cornwell og

Trumbulls egne beregninger har et relativt hjt lnningsniveau, noget man ville forvente af en branche med hje krav til de ansatte, og derfor ikke et oplagt alternativ til kriminalitet. Problemet kan vre, at regressanten er den samlede kriminalitet, som naturligvis kan vre mange ting. Vi m forvente at berigelseskriminalitet sandsynligvis afhnger af jobmuligheder, hvorimod voldelig kriminalitet ikke er det, men snarere er arv end milj. En mulighed for ydeligere studier indenfor dette omrde, vil vre kun at betragte berigelseskriminalitet. I artiklen nvner de at

Pa (lprbarr) og P OLICE (lpolpc) meget vel kan vre endogene variable. Et problem med

at bruge politi per capita i modellen, er at det er diskutabelt, om det har en kausal indydelse p kriminaliteten, p den mde det er opstillet i modellen. Man kunne let forestille sig at en county hvor kriminaliteten er hj, vil medfre at politistyrken ges, hvilket skaber et simultanitetsbias (se Wooldridge, kap 16). Et argument for at

lprbarr

kan vre korreleret med fejlledet i modellerne, er tidsvarierende forhold som razziaer og overfyldte fngsler, som hendholdsvis har en positiv og negativ virkning p sandsynligheden for at blive arresteret. Det frnvnte er den direkte rsag til at de forsger sig med en alternativ estimationsstrategi, hvor de bruger 2SLS, som tager hjde for endogenitet med instrumenterne 'oense mix' og skatteindkomst per capita Som instrumenter argumenter de for at de kan bruger variablerne 'oense mix' og skatteindkomst per capita. Vi bemrker ogs at lngden p fngselsstraf ikke har en signikant prventiv virkning p kriminalitet. rsagen skal formentlig ndes i North Carolinas skaldte  determinate sentencing system, hvilket betyder, at der ikke er forhndskrav til hvor lang en dom, den dmte idmmes. Det betyder at

S(lavgsen)

er kompliceret for en potentiel

forbryder at observere, hvorfor vedkommende mske vil vre tilbjelig til at undervurdere eller helt ignorere den. Samlet set ses det at xed eect modellerne giver anledning til at tro at eekten af de skaldte prventive variable p kriminalitet, ikke er s stor som man hidtil har antaget, da de estimerede elasticiteter alle er under

0, 4

i absolutvrdi og dermed ikke i nrheden af 1(se Hirsch, 1988). De konkluderer at bde arbejdsmarkedsmssige forhold og kriminalforebyggende tiltag har eekt p kriminalitetsraten, mens lovndringer ikke har den store eekt. Slutteligt fastsls det at man i fremtidige studier af kriminalitet altid br tage hensyn til de uobserverede eekter, da man ellers fr estimater der er 'biased' opad.

0.2

Empirisk analyse af 'The Economics of Crime'

Til at analysere problemstillingen vil vi tage udgangspunkt i flgende basis paneldata model som er liner i dens parametre,

T T lcrmrteit = 0 + Dit + 1 ldensityit + 2 lpolpcit + 3 lwmf git + 4 lpctymleit + Pit + ai +


hvor

it

(0.2)

Dit

er en matrix indeholdende rsdummies,

er en matrix indeholdende de prventive variabler,

ai

indeholder uobserverede tidskonstante county karakteriska og

it er fejlledet som antages at have middelvrdi 0 og

konstant varians. Udgangspunktet for analysen er alts den samme som for Cornwell, Trumbull, bortset fra vi ikke er i besiddelse af samme mngde af forklarende variable. Det store sprgsml er om der er en uobserveret eekt tidskonstant eekt, og i bekrftende fald hvorledes vi vlger at betragte den. Antager vi at den er ukorreleret med de vrige forklarende variable i modellen ved vi fra teorien at at bde pooled OLS, random eect estimation, xed eect

estimation og rst dierence estimation vil give konsistente estimater, men at random eect estimation vil give mest eciente estimater (se Cameron og Trivedi, 'Microeconometrics'). Mens hvis den uobserverede eekt er korreleret med de vrige regressorer, vil OLS og random eect estimation giver inkonsistente estimater og vi vil derfor vre ndsaget til at bruge xed eect- eller rst dierence estimation. Vi vil i det flgende betragte begge scenarier, for at se om der rent faktisk er en uobserveret county specik eekt, der har en pvirkning p kriminalitet, som Cornwell og Trumbull ppeger i artiklen. Vi formoder at vi nr frem til samme konklusion, da der er faktorer som er svre af mle p som kan have sammenhng med de vrige forklarende variable, som eksempelvis kriminalitet historisk set, geogrask placering og uddannelses niveau i hver county, som kan have en sammenhng med antallet af politibetjente, andellen af unge mennesker og befolkningstthed, som netop indgr som forklarende variable. Vi forventer ikke at random eect antagelsen er rimelig, idet

ai

sandsynligvis er korreleret med regressorerne og ikke

tilfldigt udvalgt fra et strre udfaldsrum. Random eect estimation ville vre mere oplagt hvis strukturen af vores data havde vret anderledes, for eksempel hvis vi havde data fra tilfldigt udvalgte counties fra hele USA. Dette sprgsml vil vi i det flgende forsge at analysere nrmere ved at se p begge tilflde, og ved hjlp af konometriske metoder konkludere om der uobserverede eekter eller ej. Frst vil vi antage at vi

ai

er en random eect, dvs at

E(ai | xit , pit ) = E(ai ), ai

hvilket svarer til at

ai

er

ukorreleret med de vrige regressorer. Nr det er tilfldet kan vi i () putte

i fejlledet og estimere modellen ved

OLS. Dette svarer til hvad mange tidligere forskere har gjort i deres studier af kriminalitet. Regressionsoutputtet for OLS regression kan ses i frste kolonne af tabel 1. Som nvnt vil OLS give konsistente estimater under antagelsen af random eect, men samtidig glder der ogs at estimaterne ikke er eciente, da modellens fejlled lider under seriekorrelation p grund af

ai . Mere eciente estimater kan derfor opnes ved brug af random eect estimation der ai
eksisterer. Sammenlignes estimaterne for de to modeller

netop tager sig af den specielle struktur i varians-kovarians matricen for fejleddet.Ved sammenligning af eciencen af de to estimationsmetoder vil derfor give et indtryk om

under random eect antagelsen, ser vi koecienterne har samme fortegn, med undtagelse af koecienterne for rsdummierne for 1982 og 1987 og for

lprbpris.

Iflge OLS regressionen vil man opleve get kriminalitet nr

sandsynligheden for blive fngslet stiger, hvilket ikke giver mening intuitivt. Det ses ogs at nsten alle rsdummies er insignikante, hvilket kan indikerer at omfanget af kriminalitet er konstant over tidsperioden vi betragter. Vi bemrker at standardfejlene for OLS parametrene er hjere end ved random eect, hvilket alts skyldes at OLS ikke er ecient under antagelse ved tilstedevrelse af en ubobserveret random eect. Derfor vlger vi ikke drage nogen form for konklusioner baseret p OLS estimation, men i stedet vil vi betragte modellen med random eect estimation nrmere. Random eect estimation svarer til at udfre OLS p

lcrmrtei,t lcrmrtei. = (xit xi. ) + (vit v i. )


hvor

(0.3)

xit

er en vektor med de forklarende variable,

xi. , lcrmrtei.

angiver gennemsnittet for hver county,

vi,t =

ai +

i,t og

= 1

2 u 2 2 T a +u

1 2

. Heraf ses det at

= 0

svarer til pooled OLS, mens

= 1

svarer til at xed

eect estimation, som vi betragter senere i analysen. Sammen med regressions outputet fra random eect modellen,

angives ogs estimater for

2 u

og

2 a ,

sledes at vi kan estimerer

og dermed f en indikation p om

ai

er en xed-

eller en random eect. Bruges disse estimater fs

= 0.83, hvilket er endnu en indikation p at OLS ikke er brugbar, ai


som en xed eect, da

og samtidig ogs indikerer at vi har brug for at betragte kommer fra

82%

af variation af fejlledet

ai . ai
som vrende en xed eect, dvs at

P baggrund af de forrige resultater vil nu betragte

cov(ai , xit ) = 0. ai

Det

implicerer at vi bliver ndt til at foretage en transformation af vores basis model, sledes at

bliver elimineret.

Dette kan enten gres ved en within transformation, som er den metode der bruges i artiklen, eller det kan gres ved rst dierence af modellen. Fixed eect estimation af modellen svarer til at udfre OLS p modellen efter within transformationen. Da vi ikke har nogle variable der er tidskonstante for hver enkelt county, kan vi inkludere de samme variable som vi har anvendt hidtil. Estimations outputtet for denne model ses i tredje kollonne ar tabel 1. Sammenlignes estimaterne for denne model med modellen med

ai

som random eect, ses det at de koecienterne

p de prventive variable er stort set identiske, men tilgengld ser vi at xed eect modellen tillgger andelen af unge mnd i countien meget strre betydning i forbindelse med kriminalitet end random eect-metoderne. Faktisk er den beregnede elasticitet mellem kriminalitetsraten og andelen af unge mnd den strste, hvilket bde er i overensstemmelse med hvad Cornwell og Trumbull nder og den generelle konsensus. Bemrkelsesvrdigt er det dog at variablen er forbundet med s meget usikkerhed at vi ikke kan afvise at elasticiteten er 0. Som alternativ til xed-eect estimation, kan vi forsge med rst dierence model, som ogs eliminerer den uobserverede eekt og er at foretrkke frem for xed eect estimation, hvis

it ikke er seriekorrelleret. Vi kan estimere rst dierence

modellen og derefter teste om vi br dannne vores konklusioner ud fra denne model eller modellen med xed eect estimation. I fjerde kollonne af tabel 1, optrder estimaterne fra rst dierence modellen. Igen bemrker vi den hje - men insignikante koecient p variablen

lpctymle.

Formelt kan vi teste om rst dierence estmation er at

foretrkke fremfor xed eect, ved at regressere frste dierencer af residualerne fra rst dierence modellen p et lag af de frste dierenceret residualer, og derefter teste om koecienten p lagget kan antages at vre lig nul, da det vil vre et tegn p at

autoregressive koecient er lig

it ikke er seriekorrelleret. First dierence vil da vre at foretrkke. Hvis derimod den 1 2 , vil det vre et tegn p at de originale fejlled er ukorreleret og xed eect vil

vre foretrukket. Ved at kre regressionen fs flgende resultat

it

= 0.561650
(0.045106)

i,t1

(0.4)

Hypotesen om at koecienten er lig nul afvises klart. Derimod kan vi ikke afvise at den autoregressive koecient er lig

1 , da vrdien af t-testen er -1.36, som er under den kritiske vrdi for t-fordelingen p 5% signikansniveau. 2

Alts er den klare tegn p at vi opnr de bedste parameter estimater ved at bruge en model baseret p xed eect estimation, hvilket er den samme konklusion som artiklens forfattere nr frem til. Dette bakkes op af Hausmann test for random eects, hvor nulhypotesen er at

ai

er en random eect. Under denne antagelse ved random eect

estimation vre mere ecient end xed eect estimation. Testen sammenligner estimaterne og signikant forskel i estimaterne vil fre til afvisning af nulhypotesen. Udfres testen p vores data fs en testvrdi p skal vurderes i en

35.12

som

(8)

fordeling og det betyder at vi klart forkaster hypotesen om random eects, da den kritiske

vrdi er

15, 51 p 5% signikans niveau. Vi har ekskluderet rsdummies fra modellen fr denne test, derfor vurderes 2 (8)
fordelingen.

teststrrelsen i

0.3

IV estimation af modellen

Som det nvnes i artiklen kan vi mske have estimereret en model med endogene variable som forklarende variable i de foregende analyser. Specikt drejer det sig om at man som nvnt tidligere kan argumentere for at politistyrken og sandsynligheden for at blive arresteret, lider under simultanitetsbias og kan vre korreleret med modellens fejlled, hvilket resulterer i inkonsistente estimater for modellens parametre. Cornwell og Trumbull er opmrksom p dette problem og forsger sig med 'Two Stage Least Squares' (2SLS) estimation af bde between modellen og within modellen med instrumental variable

lmix

og

ltaxpc,

som henholdsvis er et ml for andelen af kriminalitet med

ansigtskontakt og skatteindkomst i hver county. Som det fremgr af artiklen bliver validiteten af instrumenterne afvist, og en Hausmann test giver anledning til at deres konklusion at

lpolpc

og

lprbarr

er eksogene.

Vi skal nu se nrmere p denne problemstilling ved at betragte rene 1986 og 1987 seperat og reestimere modellen med instrumentalvariable. Artiklens forfattere argumenterer for at og

lmix

er et muligt instrument for

lprbarr,

ltaxpc for lpolpc. Som frste inspektion af variablenes validitet som instrument udfrer vi en simpel korrelations-

beregning, da instrumenterne og de mulige endogene variable skal vre korreleret for at kunne bruges i modellen. Som det ses i tabel? er der signikant positiv korrelation mellem variablene, hvilket er et positivt tegn for videre brug af instrumenterne. At instrumenterne for de mulige endogene variable, ikke er tt p at vre perfekt korrelleret er ogs stor betydning, da hj korrellation vil medfrer at instrumenterne vil lide under samme problem som de mulige endogene variable. Da instrumenterne umiddelbart ikke kan afvises, har vi estimeret modellen med 2SLS for 1986 og 1987 seperat. Regressionsoutput kan ses i tabel?, og det springer straks i jnene at de estimerede elasticiteter med hensyn til

lprbarr

og

lpctymle

er vidt forskellige for hver af de to r. Isr estimaterne fra 1987 er

meget anderledes i forhold til hvad vi tidligere har opnet, hvor vi nder at elasticiteten med hensyn til

lprbarr

er

1, 38

og at en strre andel af unge mnd vil mindske kriminalitetsraten. Vi fr dermed at sandsynligheden for at

blive arresteret er det der mindsker kriminalitetsraten mest. Hvis alle regressorer er eksogene vil OLS og 2SLS begge give konsistente estimater, dog vil OLS vre mere ecient. Ved at estimere samme model med begge metoder, vil en signikant forskel mellem estimaterne vre tegn p at vi har endogene regressorer. Dette er tankegangen bag Hausman testen for eksogene regressorer. Denne test vil vi udfre i for hvert r. Optimalt set skal man fr udfrelse af denne test, udfre en test for validiteten af instrumenterne. Men da krver at antallet af instrumenter er skarpt strre end antallet af regressorer kan vi ikke udfre denne test, men vi antager at de er valide baseret p kovariansanalysen fra tidligere. Dette er dog en mulig fejlkilde at vi ikke er i stand til at teste dette, da det er en forudstning for at Hausman testen er brugbar (Se 'Econometric methods with applications in business and economics' side 412). Vi anvender

LM

testversionen til

at teste om alle variable er eksogene. En afvisning af hypotesen vil betyde at vi har mindst n endogen variable i modellen, og dermed har brug for instrumental variable for at opn konsistente variable. Testen udfres specikt ved at vi regressere

lcrmrte

p de to mulige endogene variable og de vrige eksogene

variable ved OLS, og residualerne

i opfanges. Herefter kres to 'auxiliary' regressioner hvor de to mulige endogene

variable regresseres p alle de eksogene variable (inklusiv instrumenterne), og for hver af disse regressioner opfanges

i p de samme variable som i frste skridt og de to residualserie ij . LM2 2 testvrdien fs nu ved at udregne nR , som skal vurderes i en (2) fordeling. I tabel? har vi opsummeret de
residulalerne Slutteligt regresseres vsentligste resultater fra denne test. Som det ses er der ikke overensstemmelse mellem testens konklusion alt efter hvilket r vi betragter, da vi ikke kan afvise nulhypotesen om eksogene regressorer i 1986, mens vi afviser hypotesen i 1987 p

ij .

5%

signikansniveau. Da vi har fet indikation af endogenitet blandt regressorerne og samtidig

har konomiske grunde til at tro at det skulle vre tilflde, virker det mest fornuftigt at antage dette, da det vil give anledning til strre fejl at bruge OLS p en model med endogene variable, end at bruge 2SLS p en model med eksogene variable, som stadig vil vre en konsistent estimationsmetode.

0.4

Opsummering

Samlet set viser vores analyse at vi i modelleringen af kriminalitet br tage hensyn til at der er ubobserverede tidskonstante eekter der pvirker kriminalitetsraten, og at denne eekt br betragtes som en xed eect - alts at den har en sammenhng mellem observerbare variable, der benlyst pvirker kriminalitetsraten. Brugen af paneldata fremfor cross-sectiondata er derfor vsentlig, da det giver mulighed for at kontrollere for dette. I modstning til Cornwell og Trumbull, mener vi at endogenitet i de forklarende variable er et problem. Det vil derfor vre anbefalelsesvrdigt at IV estimator p den 'within' transformerede model som eksempelvis 2SLS, for at opn mest konsistente elasticiteter.

You might also like