You are on page 1of 16

Sumrio

Captulo 1 A Natureza da Econometria e dos Dados Econmicos 1


1.1 O que Econometria? 1
1.2 Passos na Anlise Econmica Emprica 2
1.3 A Estrutura dos Dados Econmicos 5
1.4 A Causalidade e a Noo de Ceteris Paribus na Anlise Economtrica 12

PARTE 1
ANLISE DE REGRESSO COM DADOS DE CORTE TRANSVERSAL 19

Captulo 2 O Modelo de Regresso Simples 20


2.1 Definio do Modelo de Regresso Simples 20
2.2 Derivao das Estimativas de Mnimos Quadrados Ordinrios 25
2.3 Mecnica do Mtodo MQO 34
2.4 Unidades de Medida e Forma Funcional 39
2.5 Valores Esperados e Varincias dos Estimadores de MQO 45
2.6 Regresso atravs da Origem 58

Captulo 3 Anlise de Regresso Mltipla: Estimao 64


3.1 Funcionabilidade da Regresso Mltipla 64
3.2 Mecnica e Interpretao dos Mnimos Quadrados Ordinrios 69
3.3 O Valor Esperado dos Estimadores de MQO 80
3.4 A Varincia dos Estimadores de MQO 91
3.5 Eficincia de MQO: O Teorema de Gauss-Markov 99

Captulo 4 Anlise de Regresso Mltipla: Inferncia 110


4.1 Distribuies Amostrais dos Estimadores de MQO 110
4.2 Testes de Hipteses sobre um nico Parmetro Populacional: O Teste t 113
4.3 Intervalos de Confiana 131
4.4 Testes de Hipteses sobre uma Combinao Linear dos Parmetros 134
4.5 Testes de Restries Lineares Mltiplas: O Teste F 137
4.6 Descrio dos Resultados da Regresso 149

xv
xvi Introduo Econometria Editora Thomson

Captulo 5 Anlise de Regresso Mltipla: MQO Assimpttico 158


5.1 Consistncia 158
5.2 Normalidade Assimpttica e Inferncia de Amostras Grandes 163
5.3 Eficincia Assimpttica de MQO 169

Captulo 6 Anlise de Regresso Mltipla: Problemas Adicionais 174


6.1 Efeitos da Dimenso dos Dados nas Estatsticas MQO 174
6.2 Um pouco mais sobre a Forma Funcional 179
6.3 Um pouco mais sobre o Grau de Ajuste e a Seleo de Regressores 189
6.4 Previso e Anlise de Resduos 195
Intervalos de Confiana de Previses 195
Anlise de Resduos 199
Previso de y quando a Varivel Dependente log(y) 201
Resumo 203
Problemas 204

Captulo 7 Anlise de Regresso Mltipla com Informaes Qualitativas:


Variveis Binrias (ou Dummy) 207
7.1 A Descrio das Informaes Qualitativas 207
7.2 Uma nica Varivel Dummy Independente 209
7.3 O Uso de Variveis Dummy para Categorias Mltiplas 216
7.4 Interaes Envolvendo Variveis Dummy 221
7.5 Uma Varivel Dependente Binria: O Modelo de Probabilidade Linear 230
7.6 Um Pouco mais sobre Anlise e Avaliao de Polticas e

Captulo 8 Heteroscedasticidade 243


8.1 Conseqncias da Heteroscedasticidade para o Mtodo MQO 243
8.2 Inferncia Robusta em Relao Heteroscedasticidade
aps e Estimao MQO 244
8.3 O Teste da Existncia de Heteroscedasticidade 251
8.4 Estimao de Mnimos Quadrados Ponderados 256
8.5 O Modelo de Probabilidade Linear Revisitado 266

Captulo 9 Problemas Adicionais de Especificao e de Dados 272


9.1 M Especificao da Forma Funcional 272
9.2 Utilizando Variveis Proxy para Variveis Explicativas No-Observadas 278
9.3 Propriedades do Mtodo MQO quando h Erros de Medida 285
9.4 Ausncia de Dados, Amostras No-Aleatrias e Observaes Extremas 292

PARTE 2
ANLISE DE REGRESSO COM DADOS DE SRIES TEMPORAIS 305

Captulo 10 O Bsico da Anlise de Regresso com Dados de Sries Temporais 306


10.1 A Natureza dos Dados das Sries Temporais 306
Wooldridge Sumrio xvii

10.2 Exemplos de Modelos de Regresso de Sries Temporais 307


10.3 Propriedades de Amostra Finita do MQO sob as Hipteses Clssicas 311
10.4 Forma Funcional, Variveis Dummy e Nmeros-ndices 320
10.5 Tendncia e Sazonalidade 327

Captulo 11 Questes Adicionais quanto ao Uso do MQO com Dados de


Sries Temporais 340
11.1 Sries Temporais Estacionrias e Fracamente Dependentes 340
11.2 Propriedades Assimptticas do MQO 345
11.3 O Uso de Sries Temporais Altamente Persistentes na Anlise de Regresso 352
11.4 Modelos Dinamicamente Completos e a Ausncia de Correlao Serial 360
11.5 A Hiptese de Homoscedasticidade para Modelos de Sries Temporais 363

Captulo 12 Correlao Serial e Heteroscedasticidade em Regresses de


Sries Temporais 368
12.1 As Propriedades do MQO com Erros Serialmente Correlacionados 368
12.2 O Teste da Correlao Serial 372
12.3 A Correo da Correlao Serial com Regressores Estritamente Exgenos 380
12.4 Diferenciao e Correlao Serial 387
12.5 Inferncia Robusta em Relao Correlao Serial aps o MQO 388
12.6 Heteroscedasticidade em Regresses de Sries Temporais 392

PARTE 3
TPICOS AVANADOS 401

Captulo 13 O Agrupamento de Cortes Transversais ao Longo do Tempo.


Mtodos Simples de Dados de Painel 402
13.1 O Agrupamento Independente de Cortes Transversais ao Longo do Tempo 403
13.2 Anlise de Decises Governamentais com Agrupamentos
13.3 Anlise de Dados de Painel de dois Perodos 414
13.4 Anlise de Decises Governamentais com Dados de Painel
de dois Perodos 421
13.5 A Diferenciao com mais de dois Perodos de Tempo 424

Captulo 14 Mtodos Avanados de Dados de Painel 433


14.1 Estimao de Efeitos Fixos 433
14.2 Modelos de Efeitos Aleatrios 441
14.3 A Aplicao de Mtodos de Dados de Painel a outras Estruturas de Dados 445

Captulo 15 Estimao de Variveis Instrumentais e Mnimos


Quadrados de dois Estgios 453
15.1 Motivao: Variveis Omitidas em um Modelo de Regresso Simples 454
15.2 Estimao de VI do Modelo de Regresso Mltipla 464
15.3 Mnimos Quadrados de dois Estgios 468
15.4 Solues de VI de Problemas de Erros nas Variveis 473
15.5 O Teste de Endogeneidade e o Teste de Restries
xviii Introduo Econometria Editora Thomson

Sobreidentificadoras 475
15.6 O MQ2E com Heteroscedasticidade 478
15.7 A Aplicao do MQ2E a Equaes de Sries Temporais 479
15.8 A Aplicao do MQ2E em Cortes Transversais Agrupados
e em Dados de Painel 481

Captulo 16 Modelos de Equaes Simultneas 491


16.1 A Natureza dos Modelos de Equaes Simultneas 491
16.2 Vis de Simultaneidade no MQO 496
16.3 A Identificao e a Estimao de uma Equao Estrutural 498
16.4 Sistemas com mais de duas Equaes 505
16.5 Modelos de Equaes Simultneas com Sries Temporais 506
16.6 Modelos de Equaes Simultneas com Dados de Painel 510

Captulo 17 Modelos com Variveis Dependentes Limitadas e


Correes da Seleo Amostral 517
17.1 Modelos Logit e Probit de Resposta Binria 518
17.2 O Modelo Tobit para Resposta de Soluo de Canto 529
17.3 O Modelo de Regresso de Poisson 537
17.4 Modelos de Regresso Censurada e Truncada 542
17.5 Correes da Seleo Amostral 549

Captulo 18 Tpicos Avanados sobre Sries Temporais 559


18.1 Modelos de Defasagem Distribuda Infinita 560
18.2 O Teste de Razes Unitrias 567
18.3 Regresso Espria 572
18.4 Co-Integrao e Modelos de Correo de Erro 574
18.5 Previso 581

Captulo 19 A Montagem de um Projeto na Prtica 602


19.1 A Formulao de uma Pergunta 602
19.2 A Reviso da Literatura 604
19.3 A Compilao dos Dados 605
19.4 A Anlise Economtrica 609
19.5 A Redao de um Ensaio Emprico 613

Apndice G Tabelas Estatsticas 629

Referncias Bibliogrficas 637

Glossrio 645

ndice Remissivo 667


1
A Natureza da Econometria e dos
Dados Econmicos

Captulo 1 examina o escopo da econometria e prope questes gerais que resultam da aplica-

O o dos mtodos economtricos. A Seo 1.3 examina os tipos de dados usados em negcios,
economia e outras cincias sociais. A Seo 1.4 faz uma discusso intuitiva das dificuldades
associadas com a inferncia da causalidade nas cincias sociais.

1.1 O QUE ECONOMETRIA?


Imagine que voc seja contratado pelo governo de seu Estado para avaliar a eficcia de um programa
de treinamento financiado com recursos pblicos. Suponha que esse programa ensine aos trabalhado-
res vrias maneiras de como usar computadores no processo produtivo. O programa, com durao de
20 semanas, oferece cursos fora do horrio do expediente. Qualquer trabalhador horista da produo
pode participar, e a matrcula em todo o programa, ou em parte dele, voluntria. Voc deve determi-
nar qual o efeito, se houver, do programa de treinamento sobre o salrio-hora de cada trabalhador.
Suponha, agora, que voc trabalhe para um banco de investimentos. Voc deve estudar os retor-
nos de diferentes estratgias de investimento que envolvem ttulos do Tesouro dos Estados Unidos para
decidir se elas esto de acordo com as teorias econmicas a elas associadas.
A tarefa de responder a tais questes pode parecer desanimadora primeira vista. Nesse ponto,
voc deve ter somente uma vaga idia de qual tipo de dados coletar. At o fim deste curso de princ-
pios de econometria, voc provavelmente saber como usar os mtodos economtricos para avaliar,
formalmente, um programa de treinamento ou testar uma simples teoria econmica.
A econometria baseada no desenvolvimento de mtodos estatsticos para estimar relaes eco-
nmicas, testar teorias, avaliar e implementar polticas de governo e de negcios. A aplicao mais
comum da econometria a previso de importantes variveis macroeconmicas, tais como taxas de
juros, taxas de inflao e produto interno bruto (PIB). Ainda que as previses de indicadores econ-
micos sejam bastante visveis e, muitas vezes, extensamente publicadas, os mtodos economtricos
podem ser usados em reas econmicas que no tm nada a ver com previses macroeconmicas.
Por exemplo, estudaremos os efeitos de gastos em campanhas polticas sobre os resultados de elei-
es. No campo da educao, consideraremos o efeito de gastos pblicos com escolas sobre o
desempenho de estudantes. Alm disso, aprenderemos como usar mtodos economtricos para pre-
ver sries de tempo econmicas.
A econometria evoluiu como uma disciplina separada da estatstica matemtica, porque enfoca
problemas inerentes coleta e anlise de dados econmicos no-experimentais. Dados no-expe-
rimentais no so acumulados por meio de experimentos controlados de indivduos, firmas ou seg-

1
2 Introduo Econometria Editora Thomson

mentos da economia. (Dados no-experimentais so, s vezes, chamados de dados observacionais


para enfatizar o fato de que o pesquisador um coletor passivo de dados.) Dados experimentais so
freqentemente coletados em ambientes de laboratrio nas cincias naturais, mas so muito mais dif-
ceis de serem obtidos nas cincias sociais. Embora seja possvel realizar alguns experimentos sociais,
geralmente impossvel conduzir os tipos de experimentos controlados necessrios para avaliar ques-
tes econmicas, seja porque eles so proibitivamente dispendiosos ou moralmente repugnantes. Na
Seo 1.4, apresentaremos alguns exemplos especficos das diferenas entre dados experimentais e
no-experimentais.
Naturalmente, os econometristas, sempre que possvel, valem-se dos estatsticos matemticos. O
mtodo de anlise da regresso mltipla o esteio de ambos os campos, mas seu foco e sua interpre-
tao podem diferir de forma marcante. Alm disso, os economistas criaram novas tcnicas para lidar
com as complexidades dos dados econmicos e para testar as previses das teorias econmicas.

1.2 PASSOS NA ANLISE ECONMICA EMPRICA


Os mtodos economtricos so relevantes em, virtualmente, todos os ramos da economia aplicada. Eles
entram em cena quando temos uma teoria econmica para testar ou quando temos em mente uma rela-
o que apresenta alguma importncia para decises de negcios ou anlises de polticas pblicas.
Uma anlise emprica usa dados para testar uma teoria ou estimar uma relao.
Como se estrutura uma anlise econmica emprica? Pode parecer bvio, mas importante
enfatizar que o primeiro passo em qualquer anlise emprica a formulao cuidadosa da questo
de interesse. Essa questo pode ser a de testar certo aspecto de uma teoria ou os efeitos de uma pol-
tica governamental. Em princpio, mtodos economtricos podem ser usados para responder a uma
gama de questes.
Em alguns casos, especialmente aqueles que envolvem o teste de teorias econmicas, constri-se
um modelo econmico formal. Um modelo econmico consiste em equaes matemticas que descre-
vem vrias relaes. Os economistas so conhecidos por suas construes de modelos os quais descrevem
um amplo leque de comportamentos. Por exemplo, em microeconomia intermediria, as decises de
consumo individual, sujeitas a uma restrio oramentria, so descritas por modelos matemticos. A
premissa bsica que fundamenta esses modelos a maximizao da utilidade. A hiptese de que os
indivduos fazem escolhas para maximizar seu bem-estar, sujeitas s restries de recursos, oferece-
nos um arcabouo muito poderoso para criar modelos econmicos tratveis e fazer previses bem defi-
nidas. No contexto das decises de consumo, a maximizao da utilidade leva a um conjunto de equa-
es de demanda. Em uma equao de demanda, a quantidade demandada de cada produto depende do
seu prprio preo, do preo dos bens substitutos e complementares, da renda do consumidor e das
caractersticas individuais que influem no gosto. Essas equaes podem formar a base de uma anlise
economtrica da demanda do consumidor.
Os economistas tm usado ferramentas econmicas bsicas, tais como o arcabouo da maximi-
zao da utilidade, para explicar comportamentos que, primeira vista, podem parecer de natureza
no econmica. Um exemplo clssico o modelo econmico de Becker (1968) sobre o comporta-
mento criminoso.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 3

EXEMPLO 1.1
(Modelo Econmico do Crime)
Em um artigo inspirador, o prmio Nobel Gary Becker postulou um arcabouo da maximizao da utilidade
para descrever a participao de um indivduo no crime. Certos crimes tm recompensas econmicas evi-
dentes, mas muitos comportamentos criminosos tm custos. O custo de oportunidade do crime impede o
criminoso de participar de outras atividades, como um emprego legal. Alm disso, h custos associados com
a possibilidade de ser capturado, e, se condenado, h os custos associados com o cumprimento de pena.
Da perspectiva de Becker, a deciso de empreender a atividade ilegal uma deciso de alocao de recur-
sos com os benefcios e custos das atividades concorrentes sendo considerados.
Sob hipteses gerais podemos derivar uma equao que descreve a quantidade de tempo gasto na ati-
vidade criminosa como uma funo de vrios fatores. Podemos representar tal funo como

y = f (x1, x2, x3, x4, x5, x6, x7), (1.1)

em que

y = horas gastas em atividades criminosas,


x1 = salrio por hora ocupada em atividade criminosa,
x2 = salrio-hora em emprego legal,
x3 = renda de outras atividades que no o crime ou um emprego legal,
x4 = probabilidade de ser capturado,
x5 = probabilidade de ser condenado se capturado,
x6 = sentena esperada se condenado, e
x7 = idade.

Outros fatores geralmente afetam a deciso de uma pessoa de participar de atividades criminosas, mas a
lista acima representa o que poderia resultar de uma anlise econmica formal. Como comum na teoria
econmica, no fomos especficos sobre a funo f () em (1.1). Essa funo depende de uma funo utili-
dade subjacente, raramente conhecida. Entretanto, podemos usar a teoria econmica ou a introspeco
para prever o efeito que cada varivel teria sobre as atividades criminosas. Essa a base para uma anlise
economtrica das atividades criminosas individuais.

A modelagem econmica formal , s vezes, o ponto de partida da anlise emprica, porm mais
comum usar a teoria econmica de modo menos formal, ou mesmo contar inteiramente com a intui-
o. Voc pode concordar quanto aos determinantes do comportamento criminoso que aparecem na
equao (1.1) serem razoavelmente baseados no senso comum; poderamos chegar a tal equao dire-
tamente, sem partir da maximizao da utilidade. Essa viso tem algum mrito, embora haja casos em
que derivaes formais geram idias que a intuio pode ignorar.
Vejamos o exemplo de uma equao que foi derivada por meio de um raciocnio um tanto
informal.
4 Introduo Econometria Editora Thomson

EXEMPLO 1.2
(Treinamento e Produtividade do Trabalhador)
Considere o problema proposto no incio da Seo 1.1. Um economista especializado em trabalho gostaria
de examinar os efeitos do treinamento sobre a produtividade do trabalhador. Nesse caso, h pouca necessi-
dade de teoria econmica formal. Um entendimento econmico bsico suficiente para perceber que fato-
res tais como educao, experincia e treinamento influenciam a produtividade do trabalhador. Os econo-
mistas tambm esto bem cientes de que os trabalhadores so pagos de acordo com sua produtividade. Esse
raciocnio simples leva a um modelo tal que

salrioh = f(educ, exper, treina), (1.2)

em que salrioh o salrio-hora, educ representa os anos de educao formal, exper refere-se aos anos de
experincia no mercado de trabalho e treina corresponde a semanas ocupadas em treinamento. Novamente,
outros fatores geralmente influenciam a taxa de salrio, mas (1.2) captura a essncia do problema.

Aps especificarmos um modelo econmico, precisamos voltar ao que chamamos de modelo eco-
nomtrico. Visto que trabalharemos com modelos economtricos ao longo deste texto, importante
saber como eles se relacionam com os modelos econmicos. Considere a equao (1.1) como exem-
plo. A forma da funo f() deve ser especificada antes de podermos empreender uma anlise econo-
mtrica. Uma segunda questo concernente a (1.1) como lidar com variveis que no podem ser
razoavelmente observadas. Por exemplo, considere o salrio que uma pessoa pode receber na ativi-
dade criminosa. Em princpio, tal quantidade bem-definida, mas poderia ser difcil, se no imposs-
vel, observar o salrio para um determinado indivduo. Mesmo variveis como a probabilidade de
ser preso no podem ser obtidas de modo realista para um determinado indivduo, mas pelo menos
podemos observar estatsticas de deteno relevantes e derivar uma varivel que se aproxime da pro-
babilidade de priso. Muitos outros fatores que no podemos listar, nem mesmo observar, afetam o
comportamento criminoso, mas devemos de algum modo consider-los.
As ambigidades inerentes ao modelo econmico do crime so resolvidas ao se especificar um
modelo economtrico particular, tal como:

crime = 0 + 1salriom + 2 outrenda + 3 freqpris + 4 freqcond


(1.3)
+ 5 sentmed + 6 idade + u,

em que crime alguma medida de freqncia da atividade criminosa, salriom o salrio que poderia
ser ganho em um emprego legal, outrenda a renda de outras fontes (ativos, herana etc.), freqpris
a freqncia de prises por infraes anteriores (para aproximar a probabilidade de deteno), freqcond
a freqncia de condenaes e sentmed a durao mdia da sentena aps as condenaes. A esco-
lha dessas variveis determinada pela teoria econmica e por consideraes sobre os dados. O termo
u contm fatores no observados, tais como o salrio da atividade criminosa, o carter moral, a for-
mao da famlia e erros na mensurao de coisas como a atividade criminosa e a probabilidade de
de teno. Podemos adicionar variveis de formao da famlia ao modelo, tais como o nmero de
irmos, a educao dos pais, e assim por diante, mas nunca poderemos eliminar u inteiramente. De fato,
lidar com esse termo de erro ou termo de disturbncia , talvez, o componente mais importante de qual-
quer anlise economtrica.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 5

As constantes 0, 1, ..., 6 so os parmetros do modelo economtrico e descrevem as direes


e as influncias da relao entre crime e os fatores usados para determinar crime no modelo.
Um modelo economtrico completo para o Exemplo 1.2 poderia ser

salrio = 0 + 1edu + 2 exper + 3 treina + u, (1.4)

em que o termo u contm fatores tais como aptido inata, qualidade da educao, formao da famlia
e uma mirade de outros fatores que podem influenciar o salrio de uma pessoa. Se estivermos especial-
mente interessados nos efeitos do treinamento de trabalho, ento 3 o parmetro de interesse.
Na maioria dos casos, a anlise economtrica comea pela especificao de um modelo econom-
trico, sem considerao de detalhes da criao do modelo. Geralmente seguimos essa abordagem, pois,
em grande parte, a derivao cuidadosa de algo como o modelo econmico do crime toma muito tempo
e pode nos levar para algumas reas especializadas e freqentemente difceis da teoria econmica. O
raciocnio econmico desempenhar um papel importante em nossos exemplos, e incorporaremos toda
teoria econmica subjacente na especificao do modelo economtrico. No modelo econmico do
exemplo do crime, comearamos com um modelo economtrico tal como (1.3) e usaramos o racioc-
nio econmico e o senso comum como guias para escolher as variveis. Embora essa abordagem perca
algumas das profuses da anlise econmica, ela comum e efetivamente aplicada por pesquisadores
cautelosos.
Visto que um modelo economtrico tal como (1.3) ou (1.4) tenha sido especificado, vrias hip-
teses de interesse podem ser formuladas em termos dos parmetros desconhecidos. Por exemplo, na
equao (1.3), poderamos levantar a hiptese de que salriom, o salrio que poderia ser ganho no
emprego legal, no tem efeito sobre o comportamento criminoso. No contexto desse modelo
economtrico especfico, a hiptese equivalente a 1 = 0.
Uma anlise emprica, por definio, requer dados. Aps os dados sobre as variveis relevantes
terem sido coletados, os mtodos economtricos so usados para estimar os parmetros do modelo eco-
nomtrico e para, formalmente, testar as hipteses de interesse. Em alguns casos, o modelo economtri-
co usado para fazer previses com a finalidade de testar de uma teoria a estudo do impacto de uma
poltica.
Como a coleta de dados muito importante em trabalhos empricos, a Seo 1.3 descrever os
tipos de dados com os quais, provavelmente, nos defrontaremos.

1.3 A ESTRUTURA DOS DADOS ECONMICOS


Os dados econmicos apresentam-se em uma variedade de tipos. Embora alguns mtodos econom-
tricos possam ser aplicados com pouca ou nenhuma modificao para muitos tipos diferentes de
informaes, as caractersticas especiais de alguns dados devem ser consideradas ou deveriam ser
exploradas. Descreveremos a seguir as estruturas de dados mais importantes encontradas nos traba-
lhos aplicados.

Dados de Corte Transversal


Um conjunto de dados de corte transversal consiste em uma amostra de indivduos, consumidores,
empresas, cidades, estados, pases ou uma variedade de outras unidades, tomada em um determinado ponto
no tempo. s vezes, os dados de todas as unidades no correspondem precisamente ao mesmo perodo.
Por exemplo, muitas famlias podem ser pesquisadas durante diferentes semanas de um ano. Em uma an-
6 Introduo Econometria Editora Thomson

lise pura de dados de corte transversal, ignoraramos, na coleta de dados, quaisquer diferenas de tempo
no importantes. Se o conjunto de famlias fosse pesquisado durante diferentes semanas do mesmo ano,
ainda veramos isso como um conjunto de dados de corte transversal.
Uma importante caracterstica dos dados de corte transversal que no podemos, freqentemente,
assumir que eles foram obtidos por amostragem aleatria da populao subjacente. Por exemplo, se
obtemos informaes sobre salrios, educao, experincia e outras caractersticas ao extrair aleatoria-
mente 500 pessoas de uma populao de trabalhadores, teremos uma amostra aleatria da populao
de todas as pessoas que trabalham. A amostragem aleatria, matria aprendida nos cursos introdutrios
de estatstica, simplifica a anlise de dados de corte transversal. Uma reviso sobre amostragem alea-
tria aparece no Apndice C disponvel em www.thomsonlearning.com.br, na pgina deste livro.
Algumas vezes, a amostragem aleatria no apropriada como uma hiptese para analisar dados
de corte transversal. Por exemplo, suponha que estejamos interessados em estudar fatores que influen-
ciam na acumulao de riqueza das famlias. Podemos estudar uma amostra aleatria de famlias, mas
algumas talvez se recusem a relatar suas riquezas. Se, por exemplo, for menos provvel que famlias
mais ricas revelem sua riqueza, a amostra resultante sobre a riqueza no uma amostra aleatria extrada
da populao de todas as famlias. Este um exemplo de um problema de seleo amostral, um tpico
avanado que discutiremos no Captulo 17.
Outra violao da amostragem aleatria ocorre quando construmos uma amostra a partir de uni-
dades grandes relacionadas populao, em especial a unidades geogrficas. O problema provvel em
tais casos que a populao no suficientemente grande para se supor, de maneira razovel, que as
observaes so extraes independentes. Por exemplo, se queremos explicar novas atividades de
negcios entre estados, como funo de taxas de salrios, preos de energia, alquotas de impostos, ser-
vios prestados, qualidade da fora de trabalho e outras caractersticas estaduais, improvvel que as
atividades de negcios em um Estado prximo a outro sejam independentes. Isso revela que os mto-
dos economtricos que discutimos funcionam, de fato, em tais situaes, mas algumas vezes necessi-
tam ser refinados. Na maioria dos casos, ignoraremos as complexidades que surgem ao analisar tais
situaes e trataremos esses problemas dentro do arcabouo da amostragem aleatria, mesmo quando
no for tecnicamente correto faz-lo.
Os dados de corte transversal so amplamente usados em economia e em outras cincias sociais.
Em economia, a anlise de dados de corte transversal est intimamente alinhada com campos da
microeconomia aplicada, tais como economia do trabalho, finanas pblicas estaduais e locais, orga-
nizao industrial, economia urbana, demografia e economia da sade. Dados sobre indivduos, fam-
lias, empresas e cidades em um determinado ponto do tempo so importantes para testar hipteses
microeconmicas e avaliar polticas governamentais.
Para a anlise economtrica, os dados de corte transversal usados podem ser representados e
armazenados em computadores. A Tabela 1.1 contm, de forma abreviada, um conjunto de dados de
corte transversal para o ano de 1976, de 526 trabalhadores. (Esse um subconjunto dos dados do arqui-
vo WAGE1.RAW*.) As variveis incluem salrioh (salrio por hora), educ (anos de educao formal),
exper (anos de experincia no mercado de trabalho), feminino (indicador de gnero) e casado (estado
civil). Estas duas ltimas variveis so binrias (zero-um) por natureza, e servem para indicar caracte-
rsticas qualitativas dos indivduos. (A pessoa do sexo feminino ou no; a pessoa casada ou no.)
Falaremos mais sobre variveis binrias no Captulo 7 e seguintes.

* NRT: Todos os arquivos mencionados no texto tm a designao *.RAW, mas no banco de dados os arqui-
vos so planilhas em Excel (.XLS), e os arquivos de trabalho de programas economtricos (como
*.WF1, do Eviews). Portanto, a designao *.RAW genrica e d um significado de *.matria-
prima para aplicaes e exerccios.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 7

Tabela 1.1
Conjunto de Dados de Corte Transversal sobre Salrios e outras Caractersticas Individuais

nobsi salrioh educ exper feminino casado

1 3,10 11 2 1 0

2 3,24 12 22 1 1

3 3,00 11 2 0 0

4 6,00 8 44 0 1

5 5,30 12 7 0 1

. . . . . .

. . . . . .

. . . . . .

525 11,56 16 5 0 1

526 3,50 14 5 1 0

A varivel nobsi na Tabela 1.1 o nmero da observao atribudo a cada indivduo na amostra.
Diferentemente das outras variveis, ela no uma caracterstica do indivduo. Todos os programas
economtricos e estatsticos atribuem a cada unidade um nmero de observao. A intuio deveria
dizer-lhe que, para dados como os da Tabela 1.1, no importa qual pessoa classificada como obser-
vao um, qual pessoa designada pela observao dois, e assim por diante. O fato de que a ordena-
o dos dados no importa para a anlise economtrica uma caracterstica fundamental dos conjun-
tos de dados de corte transversal obtidos a partir da amostragem aleatria.
s vezes, variveis diferentes correspondem a diferentes perodos nos conjuntos de dados de corte
transversal. Por exemplo, a fim de determinar os efeitos de polticas governamentais sobre o cresci-
mento econmico de longo prazo, os economistas tm estudado a relao entre crescimento do PIB per
capita real ao longo de certo perodo (digamos, 1960 a 1985) e variveis determinadas, em parte, pela
poltica governamental em 1960 (consumo do governo como percentagem do PIB e taxas de ensino
mdio de adultos). Tais conjuntos de dados poderiam ser representados como na Tabela 1.2, a qual
constitui parte do conjunto de dados usados no estudo de De Long e Summers (1991) sobre as taxas
de crescimento entre pases.
A varivel cpibpcr representa o crescimento mdio do PIB per capita real ao longo do perodo
1960 a 1985. O fato de que consgov60 (consumo do governo como percentagem do PIB) e second60
(percentagem da populao adulta com ensino mdio) correspondem ao ano de 1960, enquanto
cpibpcr o crescimento mdio ao longo do perodo 1960 a 1985, no leva a quaisquer problemas
especiais ao tratar essas informaes como um conjunto de dados de corte transversal. As observa-
es esto ordenadas alfabeticamente por pas, mas essa ordenao no afeta em nada qualquer an-
lise subseqente.
8 Introduo Econometria Editora Thomson

Tabela 1.2
Conjunto de Dados sobre Taxas de Crescimento Econmico e Caractersticas de Pases

nobsp pas cpibpcr consgov60 second60

1 Argentina 0,89 9 32

2 ustria 3,32 16 50

3 Blgica 2,56 13 69

4 Bolvia 1,24 18 12

. . . . .

. . . . .

. . . . .

61 Zimbbue 2,30 17 6

Dados de Sries de Tempo


Um conjunto de dados de sries de tempo consiste em observaes sobre uma varivel ou muitas vari-
veis ao longo do tempo. Exemplos de dados de sries temporais incluem preos de aes, oferta de moeda,
ndice de preos ao consumidor, produto interno bruto, taxas anuais de homicdios e nmeros de vendas
de automveis. Como eventos passados podem influenciar eventos futuros, e como, nas cincias sociais,
as defasagens do comportamento so prevalecentes, o tempo uma dimenso importante em um conjun-
to de dados de sries de tempo. Diferentemente do arranjo dos dados de corte transversal, a ordenao cro-
nolgica das observaes em uma srie de tempo transmite informaes potencialmente importantes.
Uma caracterstica essencial dos dados de sries de tempo que torna mais difcil a anlise do que
os dados de corte transversal o fato de que raramente possvel assumir (se que possvel) que as
observaes econmicas so independentes ao longo do tempo. A maioria das sries de tempo eco-
nmicas, bem como de outras sries de tempo, est relacionada muitas vezes fortemente relacionada
com seus histricos recentes. Por exemplo, saber algo sobre o produto interno bruto do ltimo tri-
mestre nos diz muito sobre a provvel variao do PIB durante este trimestre, visto que o PIB tende
a permanecer razoavelmente estvel de um trimestre para o prximo. Embora muitos procedimentos
economtricos possam ser usados tanto com dados de corte transversal como com dados de sries de
tempo, outros pontos podem ser considerados para especificar, apropriadamente, os modelos econo-
mtricos que usam dados de sries de tempo. Alm disso, as modificaes e embelezamentos das tc-
nicas economtricas comuns foram desenvolvidas com a finalidade de considerar e explorar a nature-
za dependente das sries de tempo e para tratar de outras questes, tal como o fato de que algumas
variveis econmicas tendem a exibir claras tendncias ao longo do tempo.
Outra caracterstica dos dados de sries de tempo que pode requerer ateno especial a freqn-
cia dos dados, na qual eles so coletados. Em economia, as freqncias mais comuns so: diria, semanal,
mensal, trimestral e anual. Os preos de aes so registrados em intervalos dirios (excluindo sbados e
domingos). A oferta de moeda na economia dos Estados Unidos informada semanalmente. Muitas sries
macroeconmicas so tabuladas mensalmente, incluindo as taxas de inflao e desemprego. Outras
sries macroeconmicas so registradas menos freqentemente, como a cada trs meses (todo trimestre).
O produto interno bruto um exemplo importante de uma srie trimestral. Outras sries de tempo, como
as taxas de mortalidade infantil dos estados norte-americanos, esto disponveis somente em bases anuais.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 9

Muitas sries de tempo econmicas, sejam semanais, mensais ou trimestrais, exibem um forte
padro sazonal, o qual pode ser um importante fator na anlise de sries de tempo. Por exemplo, dados
mensais sobre o incio da construo de moradias se diferenciam entre os meses simplesmente devido a
mudanas das condies climticas. Aprenderemos como trabalhar com sries de tempo no Captulo 10.
A Tabela 1.3 contm um conjunto de dados de sries de tempo, obtido de um artigo de Castillo-
Freeman e Freeman (1992), sobre os efeitos do salrio mnimo em Porto Rico. O ano mais antigo no
conjunto de dados a primeira observao, e o ano mais recente disponvel a ltima observao.
Quando os mtodos economtricos so utilizados para analisar dados de sries de tempo, os dados
devem ser armazenados em ordem cronolgica.

Tabela 1.3
Salrio Mnimo, Desemprego e Dados Relacionados para Porto Rico

nobsa ano minmed cobmed desemp pnb

1 1950 0,20 20,1 15,4 878,7

2 1951 0,21 20,7 16,0 925,0

3 1952 0,23 22,6 14,8 1.015,9

. . . . . .

. . . . . .

. . . . . .

37 1986 3,35 58,1 18,9 4.281,6

38 1987 3,35 58,2 16,8 4.496,7

A varivel minmed se refere ao salrio mnimo mdio no ano, cobmed a taxa de cobertura mdia
(o percentual de trabalhadores cobertos pela lei de salrio mnimo), desemp a taxa de desemprego e
pnb o produto nacional bruto. Usaremos esses dados mais adiante em uma anlise de sries de tempo
do efeito do salrio mnimo sobre o emprego.

Cortes Transversais Agrupados


Alguns conjuntos de dados tm tanto caractersticas de corte transversal quanto de sries de tempo. Por
exemplo, suponha que dois estudos sobre famlias sejam realizados nos Estados Unidos com dados de
corte transversal, um em 1985 e outro em 1990. Em 1985, uma amostra aleatria de famlias pesquisa-
da para variveis tais como renda, poupana, tamanho da famlia, e assim por diante. Em 1990, uma nova
amostra aleatria de famlias extrada usando as mesmas questes da pesquisa. A fim de aumentar nosso
tamanho de amostra, podemos formar um corte transversal agrupado ao combinar os dois anos.
Agrupar cortes transversais de diferentes anos , freqentemente, um modo eficaz de analisar os
efeitos de uma nova poltica de governo. A idia coletar dados de anos anteriores e posteriores a uma
importante mudana de poltica governamental. Como exemplo, considere o seguinte conjunto de
dados sobre os preos da moradia coletados em 1993 e 1995 nos Estados Unidos, quando houve uma
reduo nos impostos sobre a propriedade em 1994. Suponha que tenhamos dados sobre 250 residn-
cias para 1993 e sobre 270 para 1995. Um modo de armazenar tais dados apresentado na Tabela 1.4.
10 Introduo Econometria Editora Thomson

Tabela 1.4
Cortes-Transversais Agrupados: Dois Anos de Preos de Moradias

nobsm ano preoc imppro arquad qtdorm banhos

1 1993 85.500 42 1.600 3 2,0

2 1993 67.300 36 1.440 3 2,5

3 1993 134.000 38 2.000 4 2,5

. . . . . . .

. . . . . . .

. . . . . . .

250 1993 243.600 41 2.600 4 3,0

251 1995 65.000 16 1.250 2 1,0

252 1995 182.400 20 2.200 4 2,0

253 1995 97.500 15 1.540 3 2,0

. . . . . . .

. . . . . . .

. . . . . . .

520 1995 57.200 16 1.100 2 1,5

As observaes 1 a 250 correspondem s residncias vendidas em 1993, e as observaes 251 a


520 correspondem s 270 residncias vendidas em 1995. Embora a ordem na qual armazenamos os
dados no se revele crucial, no se esquea de que o ano de cada observao , geralmente, muito
importante. Essa a razo de introduzirmos ano como uma varivel separada.
A anlise de um corte transversal agrupado muito parecida com a de um corte transversal padro,
exceto pelo fato de que precisamos, freqentemente, considerar diferenas peridicas das variveis ao
longo do tempo. De fato, alm de aumentar o tamanho da amostra, a caracterstica de uma anlise de corte
transversal agrupada , freqentemente, ver como uma relao fundamental mudou ao longo do tempo.

Dados de Painel ou Longitudinais


Um conjunto de dados de painel (ou dados longitudinais) consiste em uma srie de tempo para cada
membro do corte transversal do conjunto de dados. Como exemplo, suponha que tenhamos o histri-
co de salrio, educao e emprego para um conjunto de indivduos ao longo de um perodo de dez anos,
ou que possamos coletar informaes, tais como dados de investimento e financeiros, sobre o mesmo
conjunto de empresas ao longo de um perodo de cinco anos. Dados de painel tambm podem ser cole-
tados para unidades geogrficas. Por exemplo, podemos coletar dados para o mesmo conjunto de muni-
cpios dos Estados Unidos sobre fluxos de imigrao, impostos, taxas de salrios, gastos governamen-
tais etc., para os anos de 1980, 1985 e 1990.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 11

A caracterstica essencial dos dados de painel que os distingue dos dados de corte transversal
agrupado o fato de que as mesmas unidades do corte transversal (indivduos, empresas ou municpios
nos exemplos anteriores) so acompanhadas ao longo de um determinado perodo. Os dados na Tabela
1.4 no so considerados um conjunto de dados de painel porque as residncias vendidas so provavel-
mente diferentes em 1993 e 1995; se houver quaisquer repeties, o nmero provavelmente bem
pequeno para ser significante. Em contraste, a Tabela 1.5 contm um conjunto de dados de painel de
dois anos sobre o crime e as estatsticas relacionadas para 150 cidades nos Estados Unidos.
H vrias caractersticas interessantes na Tabela 1.5. Primeiro, a cada cidade foi dado um nme-
ro de 1 a 150. Qual cidade decidimos chamar de cidade 1, cidade 2, e assim por diante, irrelevante.
Assim como em um corte transversal puro, a ordenao no corte transversal de um conjunto de dados
de painel no importante. Poderamos usar o nome da cidade em lugar de um nmero, mas freqen-
temente til ter ambos.

Tabela 1.5
Conjunto de Dados de Painel sobre Estatsticas de Crime nas Cidades para Dois Anos

nobsc cidade ano homicds populao desemp polcia

1 1 1986 5 350.000 8,7 440

2 1 1990 8 359.200 7,2 471

3 2 1986 2 64.300 5,4 75

4 2 1990 1 65.100 5,5 75

. . . . . . .

. . . . . . .

. . . . . . .

297 149 1986 10 260.700 9,6 286

298 149 1990 6 245.000 9,8 334

299 150 1986 25 543.000 4,3 520

300 150 1990 32 546.200 5,2 493

Um segundo ponto que os dois anos dos dados para a cidade 1 preenchem as duas primeiras
linhas ou observaes. As observaes 3 e 4 correspondem cidade 2, e assim por diante. Como cada
uma das 150 cidades tem duas linhas de dados, qualquer pacote economtrico ver isso como 300
observaes. Esse conjunto de dados pode ser tratado como um corte transversal agrupado, em que as
mesmas cidades aparecem em cada ano. Porm, como veremos nos Captulos 13 e 14, podemos tam-
bm usar a estrutura de painel para responder a questes que no podem ser respondidas simplesmen-
te vendo isso como um corte transversal agrupado.
Ao organizar as observaes na Tabela 1.5, colocamos os dois anos dos dados de cada cidade um
ao lado do outro, com o primeiro ano antecedendo o segundo em todos os casos. Apenas por questes
prticas, esse o modo preferido de se ordenar conjuntos de dados de painel. Essa organizao con-
trasta com o modo pelo qual os cortes transversais agrupados so armazenados na Tabela 1.4. Em resu-
12 Introduo Econometria Editora Thomson

mo, a razo para ordenar os dados de painel como na Tabela 1.5 que precisaremos fazer transforma-
es dos dados para cada cidade nos dois anos.
Como os dados de painel requerem a repetio das mesmas unidades ao longo do tempo, os con-
juntos de dados de painel, especialmente aqueles sobre indivduos, famlias e empresas, so mais dif-
ceis de se obter que os cortes transversais agrupados. No surpreendentemente, observar as mesmas
unidades ao longo do tempo traz vrias vantagens sobre os dados de corte transversal ou mesmo sobre
os de dados de cortes transversais agrupados. O benefcio que salientaremos neste livro que ter ml-
tiplas observaes sobre as mesmas unidades nos permite controlar certas caractersticas no obser-
vveis dos indivduos, firmas etc. Como veremos, o uso de mais de uma observao pode facilitar a
inferncia causal em situaes em que inferir causalidade seria muito difcil se somente um nico
corte transversal estivesse disponvel. Uma segunda vantagem dos dados de painel que eles, fre-
qentemente, nos permitem estudar a importncia das defasagens do comportamento ou o resultado
de tomar decises. Essa informao pode ser importante, visto que se pode esperar o impacto em mui-
tas polticas pblicas somente aps algum tempo.
A maior parte dos livros para cursos de nvel superior no contm uma discusso de mtodos eco-
nomtricos para dados de painel. Entretanto, os economistas agora reconhecem que algumas questes
so difceis, se no impossveis, de serem respondidas satisfatoriamente sem dados de painel. Como
voc ver, podemos fazer considerveis progressos com anlises simples de dados de painel, um mto-
do que no muito mais difcil do que trabalhar com um conjunto de dados de corte transversal padro.

Um Comentrio sobre Estruturas de Dados


A Parte 1 deste livro cobre a anlise de dados de corte transversal, j que ela prope menos conceitos
e dificuldades tcnicas. Ao mesmo tempo, ela ilustra muitos dos temas essenciais da anlise econom-
trica. Usaremos os mtodos e as idias da anlise de corte transversal no restante do texto.
Embora a anlise economtrica de sries de tempo use muitas das mesmas ferramentas que a
anlise de corte transversal, ela mais complicada devido existncia de tendncia que traduz a
natureza altamente persistente de muitas sries de tempo econmicas. Acredita-se que agora so
considerados falhos muitos exemplos que tm sido tradicionalmente usados para ilustrar a manei-
ra pela qual os mtodos economtricos podem ser aplicados a dados de sries de tempo. Faz pouco
sentido usar tais exemplos inicialmente, visto que esse hbito somente refora uma prtica econo-
mtrica insatisfatria. Portanto, postergaremos o tratamento da econometria de sries de tempo at
a Parte 2, quando questes importantes concernentes a tendncia, persistncia, dinmica e sazona-
lidade sero introduzidas.
Na Parte 3, trataremos explicitamente de cortes transversais agrupados e dados de painel. A an-
lise de cortes transversais independentemente agrupados e a anlise simples de dados de painel so
ambas independentemente, extenses claras e diretas da anlise pura de corte transversal. Entretanto,
vamos esperar at o Captulo 13 para tratar desses tpicos.

1.4 A CAUSALIDADE E A NOO DE CETERIS PARIBUS NA


ANLISE ECONOMTRICA
Em muitos testes de teoria econmica, e certamente para avaliar polticas pblicas, o objetivo do eco-
nomista inferir que uma varivel (tal como a educao) tem um efeito causal sobre outra varivel
(tal como a produtividade do trabalhador). Encontrar simplesmente uma associao entre duas ou
mais variveis pode ser sugestivo, mas, a no ser que se possa estabelecer uma causalidade, raramen-
te ela convincente.