You are on page 1of 84

Modelos Dinmicos com Dados em Painel: reviso de literatura

Outubro, 2000

Lus David Marques


lbmarq@fep.up.pt

CEMPRE*, FACULDADE DE ECONOMIA DO PORTO


RUA DR. ROBERTO FRIAS, 4200 PORTO, PORTUGAL

ABSTRACT

Since Hsiao [1986]s work, many surveys have appeared, providing the researcher with
the necessary tools for fully enjoying the advantages of panel data in terms of both
microeconometric and macroeconometric studies. This survey has this very aim and, in a
sense, offers no novel contribution, beyond the fact of bringing together some new
developments in estimation and specification testing in a selective manner. The estimation
of dynamic models either with fixed effects or random effects in the intercept using LSDV,
GLS,MLE, IV and GMM is presented, as well as binary choice models. A short review on
specification tests and unit roots testing is also presented.

RESUMO

Desde o trabalho fundamental de Hsiao [1986], vrias revises de literatura tm aparecido


para dotar o investigador das ferramentas necessrias a um completo aproveitamento das
vantagens dos dados em painel, quer na microeconometria, quer na macroeconometria. A
presente reviso de literatura tem este mesmo objectivo e, nesse sentido, no traz qualquer
contributo novo, para alm do facto de juntar alguns dos ltimos desenvolvimentos na
estimao e nos testes de especificao, de uma forma selectiva, transcrevendo-os para
portugus. A estimao de modelos dinmicos com efeitos fixos ou aleatrios, no termo
independente, por intermdio dos estimadores LSDV, GLS, MLE, IV e GMM
apresentada, tal como a questo da estimao de modelos de escolha binria. Apresenta-se,
tambm, um resumo de alguns testes de especificao e de testes de razes unitrias.

Keywords: panel data, dynamic models estimation, LSDV, GLS, MLE, IV, GMM, unit
root tests
Palavras-Chave: dados em painel, estimao de modelos dinmicos, LSDV, GLS, MLE,
IV, GMM e testes de raiz unitria.

*
Centro de Estudos Macroeconmicos e Previso
NDICE

1. INTRODUO........................................................................................................................................... 1

2. MODELOS ESTTICOS: ALGUMAS CONSIDERAES ................................................................... 4

2.1 MODELOS DE EFEITOS FIXOS ........................................................................................................................ 9


2.2 MODELOS DE EFEITOS ALEATRIOS ........................................................................................................... 13
2.3 EFEITOS FIXOS OU ALEATRIOS?................................................................................................................ 19

3. MODELOS DINMICOS AUTORREGRESSIVOS............................................................................... 20

3.1 INTRODUO ............................................................................................................................................. 20


3.2 ESTIMAO DE MODELOS COM EFEITOS FIXOS ........................................................................................... 22
3.3 ESTIMAO DE MODELOS COM EFEITOS ALEATRIOS ................................................................................. 25
3.4 ESTRUTURAS ALTERNATIVAS PARA A HETEROGENEIDADE .......................................................................... 32

4. ESTIMAO DE MODELOS COM DESFASAMENTOS DISTRIBUDOS........................................ 35

5. ESTIMAO GMM DE MODELOS DINMICOS COM DADOS EM PAINEL................................ 41

5.1 ESTIMAO GMM COM REGRESSORES EXGENOS .................................................................................... 41


5.2 ESTIMAO GMM E MODELOS DINMICOS................................................................................................ 46
5.3 CONCLUSES ............................................................................................................................................. 51

6. RAZES UNITRIAS E DADOS EM PAINEL....................................................................................... 53

7. DADOS DISCRETOS.............................................................................................................................. 61

7.1 MODELOS ESTTICOS DE ESCOLHA BINRIA: UMA INTRODUO................................................................. 61


7.2 MODELOS DINMICOS DE ESCOLHA BINRIA.............................................................................................. 64

8. MISCELNEA DE TEMAS..................................................................................................................... 68

8.1 ALGUNS ARTIGOS FUNDAMENTAIS ............................................................................................................. 68


8.2 TEMAS RECENTES SOBRE ESTIMAO COM DADOS EM PAINEL .................................................................... 69
8.3 ALGUNS TESTES DE ESPECIFICAO ........................................................................................................... 72

9. CONCLUSO........................................................................................................................................... 78

10. REFERNCIAS ...................................................................................................................................... 80


1. INTRODUO

O objectivo do presente texto consiste em reunir, de forma integrada, um conjunto


de referncias e de resultados teis a quem est a desenvolver trabalho emprico na rea
dos modelos dinmicos com dados em painel. Apesar de existirem diversos exemplos deste
tipo de reviso de literatura, principalmente sob a forma de working papers em lngua
inglesa, no se encontrou exemplo algum em portugus. Assim, tal como foi feito por Urga
[1992], pretende-se fornecer pistas de investigao, referncias teis e alguns resultados
prontos a usar para quem no pode despender muito tempo, nem esforo, neste tipo de
recolha. Para quem tem a estimao com dados em painel como objecto central da
respectiva pesquisa, esta survey no substitui de forma alguma a leitura dos originais
citados.
Uma das vantagens da estimao com dados em painel a relevao da
heterogeneidade individual. Assim, os dados em painel sugerem a existncia de
caractersticas diferenciadoras dos indivduos, entendidos como unidade estatstica de
base. Essas caractersticas podem ou no ser constantes ao longo do tempo, de tal forma
que estudos temporais ou seccionais que no tenham em conta tal heterogeneidade
produziro, quase sempre, resultados fortemente enviesados.
Por outro lado, os dados em painel providenciam uma maior quantidade de
informao, maior variabilidade dos dados, menor colinearidade entre as variveis, maior
nmero de graus de liberdade e maior eficincia na estimao. A incluso da dimenso
seccional, num estudo temporal agregado, confere uma maior variabilidade aos dados, na
medida em que a utilizao de dados agregados resulta em sries mais suaves do que as
sries individuais que lhes servem de base. Esse aumento na variabilidade dos dados
contribui para a reduo da eventual colinearidade existente entre variveis,
particularmente em modelos com desfasamentos distribudos.
Adicionalmente, os estudos com amostras longitudinais facilitam uma anlise mais
eficiente das dinmicas de ajustamento: os estudos seccionais, ao no contemplarem a
possibilidade de a realidade de suporte ser dinmica, transmitem uma falsa ideia de
estabilidade. Assim, a utilizao de dados em painel permite conjugar a diversidade de
comportamentos individuais, com a existncia de dinmicas de ajustamento, ainda que

1
potencialmente distintas. Ou seja, permite tipificar as respostas de diferentes indivduos a
determinados acontecimentos, em diferentes momentos.
Por outro lado, a maior quantidade de informao disponvel aumenta a eficincia
da estimao. Ou seja, os dados em painel permitem identificar e medir efeitos que no
sero pura e simplesmente detectveis em estudos exclusivamente seccionais ou temporais,
bem como construir e testar modelos comportamentais complexos, nomeadamente
recorrendo a modelos com desfasamentos distribudos com poucas restries.
No entanto, a anlise economtrica com dados em painel no est isenta de
problemas, nomeadamente porque:
aumenta o risco de se ter amostras incompletas ou com graves problemas de recolha
de dados, bem como a importncia dos erros de medida;
se virmos uma populao como um conjunto de decises que se reflectem em
diferentes histrias individuais (segundo uma definio de Haavelmo), estas tero que
ser representadas como variveis aleatrias idiossincrticas (i.e., especficas a cada
indivduo) e que certamente estaro correlacionadas no apenas com a varivel
dependente, mas tambm com o conjunto das variveis explicativas, o que causa
diversos problemas ao nvel da identificao e estimao dos modelos;
ocorre o chamado enviesamento de heterogeneidade, i.e., o enviesamento resultante
de uma m especificao pela no considerao de uma eventual diferenciao dos
coeficientes ao longo das unidades seccionais e/ou ao longo do tempo;
surgem problemas relacionados com o enviesamento de seleco (selectivity bias), ou
seja, erros resultantes da recolha dos dados que levam a que estes no constituam uma
amostra aleatria. Inclui questes como a auto-selectividade (amostras truncadas) e
ausncia de resposta ou atrito (excluso de indivduos em sucessivas rondas devido a
morte ou alterao de residncia, por exemplo). Uma forma particular de
enviesamento de seleco, comum nos estudos macroeconomtricos, relaciona-se com
a seleco das unidades individuais a utilizar no estudo. Uma seleco de acordo com
um critrio sistemtico, como usualmente efectuado em macroeconomia, do tipo,
pases da OCDE ou pases que aderiram a um dado regime de poltica econmica,
no garantir a constituio de uma amostra aleatria e, dessa forma, levar a que a
estimao seja genericamente inconsistente.
Na prxima seco, apresenta-se o tema da estimao de modelos uniequacionais
com dados em painel, atravs de uma abordagem genrica dos modelos estticos de efeitos

2
fixos e de efeitos aleatrios, limitados ao termo independente, o que usualmente
conhecido como modelo de componentes de erro. Omitiram-se propositadamente os
modelos de coeficientes variveis (fixos ou aleatrios) mais gerais, para limitar o espectro
de anlise.
No terceiro captulo, abordam-se especificamente os modelos dinmicos, quer de
efeitos fixos, quer de efeitos aleatrios e os problemas que se colocam na sua estimao,
por terem variveis dependentes desfasadas como variveis explicativas. ainda feita uma
breve referncia a uma abordagem heterogeneidade individual alternativa aos modelos de
componentes de erro e que recorre a especificaes diversas para as matrizes de varincias
e covarincias dos termos de perturbao.
Na quarta seco, resumem-se as questes relacionadas com a estimao e
identificao de modelos com desfasamentos distribudos, seguindo-se de perto a
exposio que consta da seco 8.1 de Hsiao [1986].
No quinto captulo, introduz-se a estimao de modelos dinmicos com dados em
painel atravs de tcnicas GMM, recorrendo-se extensivamente a Mtys [1999] e Baltagi
[1995].
No sexto captulo, apresentam-se as principais referncias sobre testes de deteco
da existncia de razes unitrias, com amostras em painel, questo particularmente
relevante para os modelos dinmicos.
O captulo sete apresenta o tema da estimao de modelos dinmicos com dados
discretos, nomeadamente a estimao de modelos de escolha binria.
O captulo oitavo resume os objectivos e concluses de um conjunto restrito de
artigos merecedores de destaque, por serem textos fundadores ou por, sendo recentes,
poderem dar indicaes quanto a eventuais evolues da discusso em torno da estimao
de modelos economtricos dinmicos com dados em painel. So tambm apresentados
diversos testes de especificao adaptados a modelos com dados em painel.
O ltimo captulo apresenta as principais concluses da recolha.

3
2. MODELOS ESTTICOS: ALGUMAS CONSIDERAES

Considere-se a seguinte especificao genrica para um modelo de dados em


painel:

yit = 1it x1it + 2 it x2 it +K+ kit x kit + uit yit = xit it + uit ; i = 1, K, N e t = 1,K, T (2.1)

em que it corresponde ao vector (k1) de parmetros desconhecidos relativos ao indivduo


i no momento t e xit a matriz (k1) de variveis explicativas, cuja primeira coluna, no caso
do modelo ter termo independente, ser integralmente constituda por 1s.
O modelo to s descritivo, na medida em que diz apenas que o indivduo i tem
uma dada funo de reaco especfica a cada momento no tempo. Alm do mais, o
modelo no estimvel pois tem mais coeficientes que observaes, pelo que ser
necessrio conferir-lhe uma estrutura. Nesse sentido, pode-se recorrer aos tradicionais trs
tipos de pressupostos - quanto s variveis explicativas, os termos de perturbao e a
relao estatstica destes com aquelas - e ao pressuposto especfico aos estudos com dados
em painel, quanto variabilidade dos coeficientes.
Desde logo, num modelo esttico, assumimos que as variveis explicativas so
independentes dos termos de perturbao. J no que toca questo da heterogeneidade,
podemos assumir que esta reside nos coeficientes de regresso (que podem variar no tempo
ou de indivduo para indivduo) ou na estrutura dos termos de perturbao. A escolha de
uma especificao de validade universal impossvel, restando-nos escolher aquela que,
face aos dados em concreto e ao tipo de problema em causa, melhor se adeque.
Podemos, ento, conceber sete especificaes simples, com grau crescente de
heterogeneidade (entre indivduos pois, omitiu-se a heterogeneidade temporal para no
complicar a exposio), recorrendo aos seguintes pressupostos suplementares:

I. Modelo de Regresso Simples

Esta especificao mais simples (e tambm mais irrealista) assume que o


comportamento uniforme para todos os indivduos e ao longo do tempo e que todas as
observaes so homogneas (i.e., da mesma populao), pelo que poder ser especificado
da seguinte forma:

4
a(I): it = , i,t, em que (k1);
b(I): uit ~ i.i.d.(0,2).

O modelo poder ser estimado pela aplicao de OLS amostra longitudinal visto
cumprirem-se as hipteses clssicas do modelo de regresso linear, no que conhecido
como pooled OLS. No entanto, ao no dar conta de uma heterogeneidade eventualmente
existente, o modelo padecer de um grave erro de especificao e os enviesamentos sero
grandes. Alm disso, por ignorar a existncia de heterogeneidade nos dados, a aplicao de
OLS em pool no verdadeiramente um mtodo de estimao em painel.

II. Modelo de Regresso Individual

Uma forma simples de se dar conta da heterogeneidade existente assumir que os


coeficientes so constantes no tempo, mas especficos a cada indivduo, ou seja:

a(II): it = i, t, em que i (k1);


b(II): uit ~ i.i.d.(0,i2).

A estimao do modelo reduz-se aplicao de OLS indivduo a indivduo, com as


vantagens de ser fcil de calcular, tratar as diferenas individuais explicitamente e permitir
que se testem diferenas comportamentais. No entanto, tem como principais defeitos o
facto de produzir um nmero muito elevado de coeficientes (no parcimonioso, um dos
mais importantes atributos de uma boa especificao), ter pouca fiabilidade quando N
mas T fixo e no contemplar a existncia de interdependncia entre as decises
individuais (o que o afasta do prprio esprito dos estudos com amostras longitudinais).

III. Modelo Seemingly Unrelated Regression (SUR)

A hiptese de inexistncia de interdependncia individual bastante irrealista uma


vez que natural que alguns factores no observveis (includos nos termos de
perturbao) possam afectar todos ou alguns dos indivduos ao mesmo tempo, originando

5
correlao contempornea entre as perturbaes de dois indivduos, que pode ser traduzida
atravs de uma dada estrutura no nula de covarincias das perturbaes, nomeadamente:

a(III): it = i, t, em que i (k1);


b(III): E(uit) = 0, i,t
E(uit ujs) = ij t = s
E(uit ujs) = 0 t s

o que no mais que o modelo SUR de Zellner. Quando T, o modelo revela-se muito
abrangente ao dar conta da heterogeneidade individual, ao mesmo tempo que explicita uma
interdependncia relativamente livre. No entanto, na maior parte dos estudos em painel, em
que N grande e T relativamente pequeno, o modelo consome demasiados graus de
liberdade, tornando a sua estimao pouco eficiente, se no mesmo impossvel (o nmero
de parmetros a estimar ascender a Nk+N(N+1)/2).

IV. Modelo de Efeitos Fixos (Anlise de Covarincia)

Uma forma de conjugar a parcimnia com a heterogeneidade e a interdependncia


admitir que os coeficientes so idnticos para todos os indivduos, com excepo do
termo independente 1i, que especfico a cada indivduo, mantendo-se a hiptese da
homogeneidade das observaes. Formalmente:

a(IV): kit = k , i,t , excepto para k=1, caso em que 1it = 1i


b(IV): uit ~ i.i.d.(0,2).

Uma forma mais simples de enunciar a especificao fazer 1it = 1 + i, pelo que
o modelo base passa a ser:
yit = i + xit + uit (2.2)

6
Este modelo chamado de Anlise de Covarincia, um caso especfico da famlia
de Modelos de Efeitos Fixos1, ou modelo de variveis dummy individuais. O modelo
relativamente fcil de estimar, trata as diferenas individuais de forma sistemtica e
permite que as mesmas sejam testadas.

V. Modelo de Efeitos Aleatrios (Componentes de Varincia)

Os efeitos individuais da especificao anterior resultam de uma srie de factores


individuais, constantes no tempo (embora esta restrio possa ser relaxada, como veremos)
e no observveis. Desta forma, talvez seja mais razovel trat-los como se de termos de
perturbao se tratassem, i.e., especificar os efeitos individuais, no de forma
determinstica, mas aleatria. A escolha de uma ou outra especificao pode e deve ser
procurada nos pressupostos comportamentais de base. Assim, se se cr que os efeitos
individuais resultam de um grande nmero de factores no aleatrios, a especificao com
efeitos fixos mais lgica. Para amostras de grande dimenso, o nmero de parmetros a
estimar, com efeitos fixos, pode ser relativamente elevado, pelo que uma especificao que
relega as diferenas individuais para uma componente no sistemtica, logo, no estimvel,
parece ser mais apropriada.
Este modelo de componentes de erro introduz a heterogeneidade individual no
termo de perturbao que poder ser dividido em duas partes: uma comum, com mdia
nula e varincia 2u e uma individual, tambm com mdia zero, mas com varincia 2 e
que se assumem independentes. Formalmente:

a(V): it = , i,t, em que (k1);


b(V): vit = i + uit

Se se preferir, o modelo pode ser visto como um modelo em que o termo


independente aleatrio, com 1i = 1 + i e E(i) = 0.

1
A notao Efeitos Fixos frequentemente usada exclusivamente para este tipo de modelo, ainda que deva
ser aplicada a todos os modelos em que os parmetros (termo independente e coeficientes associados a
variveis explicativas) so variveis de indivduo para indivduo, mas de forma no aleatria.

7
VI. Modelo de Coeficientes Aleatrios

Podemos ainda generalizar a especificao anterior estendendo a aleatoriedade a


todos os coeficientes atravs da incluso de uma heteroscedasticidade individual das
perturbaes. De forma mais clara:

a(VI): kit = k + ki, t,k com k fixo e ki aleatrio.


b(VI): uit ~ i.i.d.(0,i2).

A estimao do modelo acaba por conduzir a apenas k parmetros de interesse,


ainda que a estimao da matriz de covarincias dos componentes aleatrios consuma
bastantes graus de liberdade. Ao contrrio do modelo de componentes de erro, que
necessita da estimao do modelo de covarincia (possvel quando T2), este modelo de
efeitos aleatrios mais geral necessita da estimao do modelo individual (II), o que s ser
possvel se Tk.

VII. Modelo Time Series Cross Section (TSCS) de Kmenta

Uma forma radicalmente diferente de representar a heterogeneidade latente nos


dados em painel proposta por Kmenta [1986] e defendida em Greene [1997], Captulo 16
e consiste na considerao de estruturas alternativas para a matriz de varincias e
covarincias dos termos de perturbao. Partindo de um modelo standard, temos:
y it = xit + u it

em que uit ser um termo de perturbao com mdia nula e matriz de varincias V. Ser
precisamente a concepo de diferentes configuraes para V que dar origem a diferentes
justificaes para a heterogeneidade dos dados. No caso de V=2INT, temos a verso
pooled OLS do modelo em painel que ser, de todas, a menos interessante. A verso mais
complexa ser a de admitir que
uit = i ui,t-1 + it
E(uit)=0
ii
( )
E u it2 =
1 i2

8
para a qual haver um estimador GLS eficiente, desde que os regressores sejam ortogonais
face aos termos de perturbao. Atendendo a que o nmero de parmetros a estimar cresce
com N, trata-se de uma especificao particularmente adequada para painis relativamente
longos e estreitos (N pequeno e T grande). Para os painis tpicos, com uma dimenso
seccional relativamente grande face temporal, as especificaes com componentes de
erro sero mais parcimoniosas, para alm de serem mais robustas face a erros de
especificao.

Das vrias especificaes de modelos de dados em painel, duas sobressaem: efeitos


fixos e efeitos aleatrios. A primeira mais apropriada para os casos em que se retiram
amostras exaustivas de uma populao ou quando se pretende prever o comportamento
individual. A segunda mais coincidente com a viso de Haavelmo da econometria e das
populaes que so objecto do seu estudo - no um conjunto de indivduos, mas um
conjunto de decises.
Quanto terminologia, comum entender-se que os modelos com efeitos fixos e os
com efeitos aleatrios se podem englobar numa mesma classe de modelos de componentes
de erro, em que o primeiro ser o caso geral (por no se assumir qualquer distribuio para
os efeitos) e o segundo um caso particular, em que se admite uma dada distribuio para a
heterogeneidade. De seguida proceder-se- a uma anlise mais detalhada destes dois tipos
de modelos, ainda que apenas a um nvel introdutrio.

2.1 Modelos de Efeitos Fixos

Quando falamos em modelos de efeitos fixos, temos em mente modelos cujos


coeficientes podem variar de indivduo para indivduo ou no tempo, ainda que
permaneam como constantes fixas, logo, no aleatrias. Se a heterogeneidade seccional
e/ou temporal se evidencia apenas no termo independente, dizemos estar perante um
modelo de covarincia.
Uma especificao simples para um modelo linear de efeitos fixos com uma fonte
de erro (i.e., que considera apenas uma heterogeneidade seccional) ser a seguinte:
(2.3)
y it = i + xit + u it
y i = i T i + x i + i , i=1,...,N e t=1,...,T (2.4)
Y = D N + X + (2.5)

9
em que o vector de (k-1) coeficientes associados s variveis explicativas (exclui-se,
pois, o termo independente), x it a linha de (k-1) colunas relativas aos valores assumidos
pelas variveis explicativas, para o i-simo indivduo, no momento t e uit o termo de
perturbao genrico, que se assume respeitar E(uit) = 0 (i,t), E(uit .ujs) = 2, se i=j e t=s e
E(uit .ujs) = 0, caso contrrio. A segunda representao corresponde a uma agregao do
modelo para os T perodos da amostra, em que yi o vector (T1) de yit, iT um vector
unitrio2 coluna (T1) e xi a matriz T(k-1), cujas linhas correspondem a T observaes de
cada uma das variveis explicativas (excluindo termo independente). Finalmente, a ltima
linha corresponde notao matricial mais condensada, em que Y corresponde ao vector
coluna (NT1) formado a partir da agregao vertical de yi, a matriz DN (NTN) e resulta
de DN = IN iT, o vector (N1) dos termos independentes e u o vector-coluna (NT1)
dos termos de perturbao.
Admite-se, ainda, que X no aleatria, independente de u e que [DN X] tem
caracterstica (N + k 1) < NT (o que sempre possvel desde que T 2)3.
A estimao de e por OLS BLUE, se se verificarem todos os pressupostos
enunciados. Os estimadores so:
= (X WN X) 1 X WN Y (2.6)
1
= (DN D N ) 1 D N (Y X ) = D N (Y X )
T (2.7)
Y W N Y X WN (Y X )
2 =
NT N K + 1 (2.8)
Var () = ( X W N X) 1
2

em que WN = INT - DN (DN DN)-1 DN = INT - 1/T DN D N = INT - 1/T(IN JT) uma matriz
simtrica idempotente de ordem NT e caracterstica (NT-N) e JT uma matriz unitria de
ordem T. A matriz Wn um operador de desvio em relao mdia, pelo que, WNu tem
elemento genrico (uit - i), por exemplo.
Note-se que esta forma de estimao do modelo no mais que a estimao por
OLS do modelo (2.5) transformado mediante a pr-multiplicao por Wn, ou seja, da sua

2
Ou seja, cujos elementos so todos iguais a 1.
3
Isto implica tambm que todas as colunas de X sejam linearmente independentes de DN.

10
estimao na forma de desvios em relao mdia (pelo Teorema de Frisch-Waugh4 e
atendendo a que WnDN = 0):

Wn Y = Wn X + Wn u (2.10)

a que tambm se chama estimao por LSDV (Least Square Dummy Variable)5, sendo que
o estimador de mais no que:

T K
i = y it k x ki = y x (2.11)
t =1 k =2

O mtodo LSDV, na prtica, elimina todos os efeitos que no variam com o tempo
(como o sexo, religio, ...) e obriga a uma grande perda de graus de liberdade. Apesar de
tudo, os estimadores LSDV (ou intra-grupo) so BLUE, como dissemos, desde que as
perturbaes sigam as hipteses clssicas e, com N e T, consistentes. No entanto,
se N e T fixo, apenas o estimador LSDV de permanece consistente pois o nmero de
parmetros i aumenta indefinidamente.
Sob a hiptese de normalidade das perturbaes, a usual inferncia estatstica em
amostras finitas permanece vlida. Assim, um teste t passar a ter NT - N - K + 1 graus de
liberdade e um teste existncia de efeitos individuais pode ser efectuado atravs de um
simples teste de Chow com o RSS a ser retirado de uma regresso OLS sobre o modelo
homogneo (I) descrito atrs e o USS a vir da estimao do modelo (1) por LSDV. A
estatstica (retirada de Baltagi[1995],12) a seguinte:

( RSS USS ) ( N 1)
F0 = ~ F ( N 1, NT N K )
USS ( NT N K )

A estimao do modelo de efeitos fixos com heterogeneidade temporal em tudo


anloga apresentada para os efeitos seccionais, sendo a matriz de transformao para o
LSDV, agora, Wt = INT 1/N (JN IT). As propriedades dos estimadores LSDV mantm-
se, com a variante de o estimador de ser consistente desde que N.
Finalmente, a estimao de um modelo com efeitos fixos individuais e temporais
simultaneamente no constitui uma generalizao excessivamente difcil: uma abordagem

4
Greene[1997],246.
5
De facto, pode-se distinguir esta estimao por LSDV de uma estimao OLS sobre o modelo no
transformado, com incluso de N dummies e que aqui se omitiu porque esta , na maior parte dos casos,
impraticvel atendendo grande dimenso da matriz a ser invertida (NT[N+K]).

11
sinttica, mas bastante clara pode ser encontrada em Mtys e Sevestre [1992],34-43 ou
em Baltagi[1995], cap.3). O estimador LSDV ou within na presena de efeitos fixos
seccionais e temporais opera tambm na base da diferenciao dos dados relativamente a
mdias. Considere-se um modelo tipo
y it = i + t + x it + u it
y i = iT i + + xi + i
Y = D N + D T + X +
em que se torna necessrio admitir duas restries de normalizao dos efeitos especficos,
a saber:
N T

i = 0 e
i =1

t =1
t =0

por forma a que se evitem situaes de multicolinearidade (vulgo armadilha das


dummies). A transformao within ser
( yit yi yt + y ) = (xit xi xt + x) + (u it u i u t + u )
e a estimao prosseguir por OLS sobre o modelo transformado, pelo que, o estimador
LSDV de dado por

= ( XWX) 1 XWY

Y WY X W (Y X )
2 =
NT N T K + 1
Var ( ) = 2 ( X WX) 1

em que W = INT 1/T DN DN 1/N DTD T + 1/NT DN D N DTD T = INT 1/T(IN JT)
1/N(IT JN) + 1/NT JN JT. Obviamente, a transformao within, ao eliminar os efeitos
seccionais e temporais, no permite a estimao de variveis que no variem no tempo ou
de indivduo para indivduo.
A considerao de perturbaes no esfricas leva a que os estimadores LSDV no
sejam j BLUE os estimadores eficientes sero os GLS ou os MLE. O mtodo GLS
merece, no entanto, algumas consideraes.
Podemos considerar trs casos especiais de perturbaes no esfricas:
1. Perturbaes serialmente independentes: s h correlao contempornea entre as
perturbaes, i.e., no h autocorrelao temporal mas os erros esto
correlacionados seccionalmente (ou seja, h interdependncia entre os indivduos,
tal como se admite no modelo SUR, j referido). Neste caso, com Aij a representar a
matriz de covarincias entre os termos de perturbao do indivduo i e do indivduo

12
j, temos: Aij = ij IT e Var(u) = 2
= Aij IT , com Aii = i a serem matrizes
diagonais eventualmente iguais (no escalares, no caso de heteroscedasticidade);
2. Independncia Individual: cobre todos os casos de heteroscedasticidade e
autocorrelao ao nvel individual, sendo de particular interesse o caso de
homoscedasticidade em bloco dado por Aij = 0 se ij e Aii = A Var(u) = IN A;
3. Equi-correlao em bloco: Aii = A e Aij = B, com A positiva definida, B semi-
definida positiva e (A B) positiva definida, de tal forma que Var(u) = IN (A B)
+ JN B.
Pode ser demonstrado que a aplicao de um GLS habitual (i.e., recorrendo a -1 )
sobre o modelo transformado por W s ser equivalente (para ) aplicao de um mtodo
GLS sobre o modelo original nos casos 1 e 3. Para uma prova e clarificao do argumento,
veja-se Mtys e Sevestre [1992], 44-5.

2.2 Modelos de Efeitos Aleatrios

Esta especificao pressupe que o comportamento especfico dos indivduos e


perodos de tempo desconhecido, no podendo ser observado, nem medido: parte da
nossa ignorncia geral. Assim, em amostras longitudinais de grande dimenso, podemos
sempre representar estes efeitos individuais ou temporais especficos sob a forma de uma
varivel aleatria normal.
Das vantagens dos modelos de efeitos aleatrios e para o caso especfico dos
modelos de componentes de erro, destacam-se:
a sua capacidade para trabalhar com bases de dados de qualquer dimenso;
o facto de a inferncia estatstica aplicvel ser uma mera derivao dos testes de
hipteses usuais;
a possibilidade de a maior parte dos problemas e dificuldades poderem ser
resolvidos dentro do quadro economtrico tradicional;
o facto de ser o modelo de dados em painel estudado com maior profundidade;
a facilidade com que so interpretados os resultados de estimao;
o facto de ser pouco exigente em termos de software economtrico.

13
Ao contrrio do que foi visto para o modelo de efeitos fixos, a heterogeneidade no
induzida atravs do termo independente, logo, atravs de E(yit), mas sim atravs da
varincia da varivel endgena. Uma especificao geral poder ser:

Y = i NT + X + u = i NT + X + i T + v
(2.12)
y it = + x it + u it e u it = i + v it

em que i (elemento genrico do vector coluna (N1), ) ser a varivel aleatria dos
efeitos individuais e vit o termo de perturbao geral.
Assume-se, ainda, que:

(a) i ortogonal em relao a vit;

(b) E(i) = E(vit) = 0;


(c) E(vit vjs) = v2 se i=j e t=s
E(vit vjs) = 0, caso contrrio;

(d) E(ij) = 2 se i=j


E(ij) = 0, caso contrrio;

(e) vit ~ N(0, v2) e it ~ N(0, 2);

(f) X independente de e v.

A matriz de varincias e covarincias ser = Dn E(


)D n + E(vv) = 2(IN
JT) + v2INT = (T2 + v2)P + v2Wn 6, em que P = 1/T Bn =1/T (IN JT) e Wn retm o
significado atribudo em 2.1. A estrutura assumida para as perturbaes equivale a que
seja uma matriz de covarincias equi-correlacionadas em bloco que exibe correlao
temporal entre as perturbaes do mesmo indivduo, pois cov(uit ujs) = 2 + v2 se i = j e
t=s, cov(uit ujs) = 2 se i=j e ts e cov(uit ujs) = 0, nos restantes casos.
A estimao por OLS do modelo com efeitos aleatrios, ainda que permanea
cntrica, consistente (com as restries j referidas7) e assimptoticamente normal, no j
eficiente, atendendo configurao de . O mesmo pode ser afirmado em relao ao
LSDV: permanece cntrico, consistente, mas j no ser eficiente. O candidato bvio o

6
Esta a decomposio espectral de , sendo (T2 + v2) e v2 as primeiras e segundas (nicas) razes
| = (T2 + v2) N(v2) N(T-1).
caractersticas de multiplicidade N e N(T-1), logo, |
7
Mas j no ser consistente se tivernos efeitos seccionais e temporais (Mtys e Sevestre[1992], 51)

14
estimador GLS, para o que precisamos de -1 e -1/2 dadas pela decomposio de
Wansbeek e Kapteyn:

1 1
1 = P + 2 Wn
(T + v )
2

2
v
(2.13) 8
1 1
1 2 = P+ Wn
(T 2 + v2 ) v

O estimador GLS de * =[ ], que mais no que a aplicao de OLS ao modelo


(2.5) pr-multiplicado por v -1/2, :

GLS = (X 1 X) 1 X 1 Y
V2 V2 (2.14)
GLS = (X Wn X + X PX ) 1 ( X Wn Y + X PY )
V2 + T 2 V2 + T 2

sendo a ltima frmula9 uma mdia ponderada de dois estimadores: o estimador LSDV ou
Intra-Grupo (Within) e o estimador Inter-Grupo (Between) que mais no que a aplicao
de OLS ao modelo (2.12) expresso em termos de mdias temporais para cada indivduo (ou
pr-multiplicado por P). Este ltimo argumento mais visvel se pretendermos estimar
apenas , para o que recorremos frmula proposta por Baltagi [1995]:
1

= XW X + V V2
2
1 1
X(P J ) X XW Y + X(P J )Y
V2 + T 2 V2 + T 2
GLS n NT n NT
NT NT (2.15)
1
2 1
GLS = XWn X + 2 V 2 X(P J NT )X XWn X W +
V + T NT
1 (2.16)
2 1 V2 1
+ XWn X + 2 V 2 X(P J NT )X X(P J ) X B
V + T V2 + T 2 NT
NT NT
GLS = W + W = W + (1 W )
1 W 2 B 1 W 1 B

Note-se que se 2 = 0, o estimador GLS equivalente ao OLS aplicado ao modelo


em nvel, o que compreensvel pois estaramos a dar idnticos pesos s variaes intra-
grupo e inter-grupos; no caso de v2 = 0, o GLS equivale ao LSDV, ou seja, estaramos a
considerar apenas o estimador Intra-Grupo porque seria impossvel distinguir os efeitos
aleatrios dos fixos. Ou seja, podemos ver o OLS e o LSDV como dois casos extremos: o

8
Considera-se que toda a matriz que verifica =(
)(
).
9
De acordo com Mtys e Sevestre[1992], 52.

15
OLS d um peso excessivo variao entre as unidades, em vez de relegar parte destas
para variaes aleatrias atribuveis ao termo de perturbao i varivel seccionalmente; o
LSDV assume que vit = 0, logo, a nica variao entre os indivduos deve-se a um efeito
constante no tempo, pelo que, a questo de saber se este fixo ou aleatrio torna-se
irrelevante. Finalmente, repare-se que se T, o GLS equivalente ao LSDV. Ou seja, o
GLS pode ser visto como uma combinao ptima do estimadores Within e Between.
O estimador GLS ser cntrico e, pelo Teorema de Aitken, eficiente10, com matriz
de covarincias
1
2 1
Var ( GLS ) = v2 XWn X + 2 v 2 X(P J NT )X (2.18)
v + T NT

Sob algumas condies de regularidade (ver Mtys e Sevestre[1992], 49), o


estimador GLS consistente desde que N.
Nos casos em que desconhecemos , temos que recorrer a um mtodo FGLS,
sendo sugeridas vrias formas de estimar as componentes de varincia. Os estimadores
BQU (Best Quadratic Unbiased) so, de acordo com Baltagi [1995]:

uPu
v2 =
N
(2.19)
uWn u
2 =
N (T 1)

podendo-se substituir u pelos resduos de estimao LSDV (Amemiya [1985] sugere estes
uma vez que retm a mesma distribuio assimpttica dos estimadores BQU), ainda que
nada garanta que as estimativas sejam todas no-negativas. Para no estender a exposio,
no se mencionam outros estimadores, embora se possa encontrar um resumo em Baltagi
[1995]. Desde que os estimadores das componentes de varincia sejam consistentes, os
estimadores FGLS retm as mesmas propriedades que o GLS (ainda que apenas
assimptoticamente).

10
Note-se que se com T, o GLS equivalente ao LSDV, em amostras com sries temporais longas (o que
, infelizmente, raro acontecer nos dados em painel), a perda de eficincia motivada pela utilizao do
estimador LSDV no dever ser significativa, o que permite contornar as dificuldades calculatrias do GLS,
nomeadamente nos casos em que desconhecida.

16
Um outro mtodo de estimao utilizado o MLE, que pode ser obtido atravs da
maximizao da funo de verosimilhana condensada em relao a e v2 dada por

ln LC = k
NT
(
)[ ]( N
)
ln Y X MLE Wn + 2 (P J NT ) Y X MLE + ln 2 ;
2 2
(2.20)
v2 1
= 2
2
e J NT = J NT
v + T
2
NT

A maximizao de lnLC d os estimadores de mxima verosimilhana,


concretamente:

2
=
(Y X
MLE)
W (Y X
n ) MLE

(T 1)(Y X ) (P J )(Y X )
(2.21)
MLE NT MLE

[ 1
] [
MLE = X( Wn + 2 P )X X Wn + 2 P Y ]
sendo que a soluo ter que ser procurada iterativamente. Os estimadores dos restantes
parmetros so baseados nas sucessivas estimativas de e 2, nomeadamente
1
MLE = yit i t Xit MLE = y X MLE
NT i t
(2.22)
2
v ,MLE =
1
NT
(
)[ ](
Y X MLE Wn + 2 (P J NT ) Y X MLE )
e cuja derivao pode ser encontrada em Baltagi [1995],18-9. Num estudo realizado por
Breusch, verificou-se que, quando muito, havia dois mximos na funo de
verosimilhana, pelo que s temos que nos precaver contra um mximo local, que
possivelmente ser uma soluo de canto (para 2=1, i.e., quando comeamos com o
estimador OLS, caso na segunda iterao se obtenha uma estimativa para 2 superior). Um
mtodo sugerido11 (e que se deve a Breusch) que se comece com, por um lado o
estimador Between e, pelo outro, com o estimador Within e se verifique se as duas
sequncias (que so montonas) convergem para o mesmo mximo, caso em que este ser
global. Os estimadores MLE assim obtidos so geralmente consistentes, ainda que para 2
tal s seja verdade no plano semi-assimpttico (i.e., com T fixo e N).
Quanto inferncia estatstica, em particular quanto aos testes existncia de
efeitos individuais e/ou temporais, sugerida a utilizao dos habituais testes
assimptticos, mencionando-se o teste LM por ser menos exigente em termos de clculos.

17
A estimao de modelos com efeitos temporais ou com efeitos seccionais e
temporais no muito distinta da que foi apresentada apenas para os efeitos individuais,
ainda que, no segundo caso, se torne notacional e computacionalmente mais pesada,
motivo pelo qual foi aqui omitida. Ressalve-se apenas o caso da estimao por MLE nos
modelos com efeitos duplos, em que a maximizao da funo de verosimilhana de tal
forma no-linear e complicada que ainda se lhe no conhecem expresses analticas. De
qualquer forma, Baltagi[1995] sugere um mtodo iterativo semelhante ao apresentado
acima. Podem ser encontrados excelentes resumos do tema, tanto em Mtys et al. [1992],
como em Baltagi[1995].
Finalmente, nas formulaes mais simples, assume-se uma dada estrutura para a
matriz de varincias e covarincias dos termos de perturbao (i.e., admite-se a existncia
de variveis omissas que no variam temporal ou seccionalmente), o que nos permite
explorar a estrutura do processo de erro, quando T fixo (e no muito grande) e N. ,
no entanto, possvel estimar consistentemente os parmetros sem impor restries sobre
(permitindo autocorrelao ou heteroscedasticidade) atravs de um mtodo proposto por
Chamberlain [1984] e que consiste em tratar-se cada perodo t como uma equao e
estimar o modelo como um sistema de T equaes com dados seccionais, dado por

y = i T i + (I T )x i + u i
i (2.23)
( T 1)

e que ser transformado ao assumir-se que i e xi possam estar correlacionados, fazendo-se


E*(i|xi)= + axi E*(yi| xi) = i + xi, com =IT
+ia=f(
),
=[
,
] e vi= yi-
E*(yi| xi) e E*(y|x) representa a projeco de y no espao definido por x12, para

y = i T + (I T x i ) + v i
i (2.24)
( T 1)

e um vector coluna (KT2-1) que contm todas as linhas de (onde no se impe


qualquer restrio) e que ser estimada por recurso a OLS, de forma consistente (e
assimptoticamente normal) quando T fixo. Quando a matriz sujeita a restries, que se
especificam por =f(
), a estimao dos parmetros e realizada atravs de um
estimador de distncia mnima, i.e., escolhe-se a estimativa de que minimize

11
Baltagi [1995],19.
12
Ou seja, o previsor de erro quadrtico mdio mnimo ou de mnimos quadrados de y definido como funo
de x.

18
[ f( )] [ f( )] , em que um estimador consistente da matriz de varincias de

13. Este estimador de distncia mnima consistente (no caso semi-assimpttico N) e


assimptoticamente normal, no impondo qualquer restrio sobre os termos de perturbao
do modelo, mas apenas que as caractersticas individuais (para cada um dos T perodos) se
encontrem idntica e independentemente distribudas em i. Mais, o estimador de distncia
mnima ser eficiente relativamente a todos os outros estimadores que no impem
restries na matriz de varincias dos termos de perturbao, mas j no o ser, por
exemplo, quando sabemos estar perante um modelo de efeitos aleatrios (caso em que o
estimador eficiente ser o GLS), ainda que permanea consistente.

2.3 Efeitos Fixos ou Aleatrios?

Parece haver desde logo uma vantagem computacional em pressupor-se efeitos


fixos e no aleatrios, ainda que tal no possa ou no deva ser aduzido como justificao.
Esta deve antes ser procurada na resposta a duas questes (Hsiao in Mtys e Sevestre
[1992], pg. 88): (1) os objectivos do estudo em questo e (2) o contexto dos dados, a
forma como foram recolhidos e a envolvente onde foram gerados.
Assim, se o que se pretende efectuar inferncia relativamente a uma populao, a
partir de uma amostra aleatria da mesma, os efeitos aleatrios sero a escolha apropriada.
Se se pretende estudar o comportamento de uma unidade individual em concreto, ento os
efeitos fixos so a escolha bvia na medida em que indiferente considerar-se a amostra
como aleatria ou no. Em particular, no caso de se estar a estudar um grupo de N pases,
toda a inferncia ter que ser condicional em ordem ao grupo especfico sob observao.
Ou seja, na generalidade dos estudos macroeconomtricos, por ser impossvel ver
uma amostra de N pases como uma seleco aleatria de uma populao com dimenso
tendencialmente infinita, tanto mais que representar com grande probabilidade a quase
totalidade da populao em estudo, torna-se evidente que a escolha acertada a
especificao com efeitos fixos, como defendido em Judson e Owen [1996].

13
As frmulas podem ser encontradas em Hsiao [1986],59-60.

19
3. MODELOS DINMICOS AUTORREGRESSIVOS

3.1 Introduo

A natureza mais comum das relaes econmicas dinmica e uma das vantagens
dos dados em painel, como j foi visto, facultar uma melhor compreenso das dinmicas
de ajustamento. Estas relaes dinmicas podem ser representadas por uma varivel
dependente desfasada como regressor, i.e., por um modelo da forma
y it = yi ,t 1 + xit + u it ; i = 1,K, N ; t = 1,K, T
(3.1)
u it = i + vit
em que, 14 um escalar, xit o vector-coluna (K1) de variveis exgenas e uit o termo de
perturbao com apenas uma fonte de erro (individual), verificando-se que i e vit so i.i.d.
e no mutuamente correlacionadas, com mdia nula e varincias 2 e v2,
respectivamente.
Antes de mais, uma vez que as propriedades dos estimadores com amostras finitas
so, em grande medida desconhecidas, a escolha de um mtodo de estimao, em
detrimento de outro, dever ser feita com base nas suas propriedades assimptticas.
A escolha entre a especificao de efeitos fixos e aleatrios acaba por ter
implicaes radicalmente diferentes das verificadas nos modelos estticos, nomeadamente
quanto consistncia, centricidade e eficincia dos estimadores. Assim, quando todas as
variveis explicativas so exgenas, o LSDV BLUE, na especificao de efeitos fixos e
cntrico e consistente, na de efeitos aleatrios, ainda que no eficiente, quando T fixo.
Adicionalmente, se algumas ou todas as variveis independentes se encontram
correlacionadas com os termos de perturbao, o LSDV permanece cntrico no caso de
efeitos fixos (ainda que erradique esses efeitos no observveis da estimao), mas um
GLS que no seja corrigido por essa correlao ser enviesado, o que contribuiu para que
se privilegiasse a primeira especificao, nestes modelos.
No entanto, quando uma dessas variveis explicativas endgena desfasada, o
estimador LSDV (que, recorde-se, MLE, sob o pressuposto de normalidade dos termos
de perturbao) no ser consistente, no caso de efeitos fixos, com T fixo e a eventual

14
No necessrio impor a restrio de estacionaridade | |<1 desde que T seja finito, pois podemos analisar
sempre as propriedades dos estimadores no plano semi-assimpttico N.

20
consistncia dos estimadores MLE e GLS (e, mesmo, a interpretao do modelo), na
especificao de efeitos aleatrios, depender crucialmente dos pressupostos assumidos
quanto primeira observao e da forma como T e N tendem para o infinito.
Um dos problemas com a estimao de modelos dinmicos com dados em painel,
comum aos estudos convencionais15, a correlao existente entre um dos regressores, yi,t-
1, e o termo de perturbao, uit, via i. Esta situao torna os estimadores OLS enviesados e
no consistentes, mesmo que vit no exiba autocorrelao, podendo o enviesamento
assimpttico ser significativo. A mesma situao se verifica para os estimadores LSDV, no
caso do modelo de efeitos fixos, e GLS, para o modelo de efeitos aleatrios, uma vez que
as transformaes operadas para eliminar i no eliminam a correlao entre yi,t-1 e o termo
de perturbao resultante. Assim, torna-se de crucial importncia a escolha de variveis
instrumentais que assegurem a consistncia e eficincia da estimao.
Uma questo fundamental para analisar as propriedades assimptticas dos
estimadores a clarificao do processo gerador da primeira observao, o que pode ser
evidenciado atravs da representao do modelo (3.1) da seguinte forma
t 1
1 t t 1
yit = y i , 0 + xit j +
j j
i + j vi ,t j
j=0 1 j =0
(3.2)
t 1
1 t
yit = j y i , 0 + j xit j + i + it
j=0 1

Ou seja, cada observao da varivel endgena pode ser expressa como a soma de
quatro componentes: a primeira depende do valor inicial ou ponto de partida; a segunda
dos valores actuais e passados das variveis exgenas; a terceira do valor dos efeitos
individuais i e a quarta no mais que um processo autorregressivo, com valores iniciais
fixos
it = i ,t 1 + vit
(3.2)
i 0 = 0
o que torna, desde logo, claro que as observaes iniciais vo influenciar decisivamente as
propriedades semi-assimptticas dos estimadores (com T fixo), levantando-se a questo da
sua eventual exogeneidade.
No entanto, como esta questo s assume relevncia para a estimao com efeitos
aleatrios, s ser abordada no ponto 3.3.

15
Aplicamos aqui a palavra convencional como sinnimo de estudos que recorram a amostras temporais ou

21
3.2 Estimao de Modelos com Efeitos Fixos

Como j foi visto, a escolha de uma especificao de efeitos fixos mais


apropriada quando a amostra relativamente agregada (i.e., ao nvel de sectores, regies,
pases,) e o objectivo do estudo no a previso do comportamento individual , bem
como quando os efeitos individuais (no observveis) no so independentes de alguma
das variveis explicativas.
Ao modelo (3.1) teremos apenas que acrescentar:
E(vit|yi,t-1,xit) = 0;
Var(vit|yi,t-1,xit) = v2, it;
Cov(vit,vjs| yi,t-1,xit) = 0, ij e ts
ou seja, os termos de perturbao so independentes das variveis explicativas, no
autocorrelacionados e homoscedsticos. Uma agregao seccional e temporal resulta no
seguinte modelo condensado, anlogo a (2.14):
Y = Y1 + D N + X + v (3.3)

em que Dn permanece IN iT e onde se acrescenta o vector-coluna (NT1) Y-1 das


observaes desfasadas em um perodo de yit (logo, inclui yi0).
O estimador LSDV de = [ ], dado por
1
Y1 Wn Y1 Y1Wn X Y1 Wn Y
= (3.4)16
X Wn Y1 XWn X X Wn Y

ainda equivalente ao MLE admitindo a normalidade de vit, com yi0 dados e WnY 0
(caso em que no existiria) e ser consistente se N e T, mas no quando T fixo. A
prova do argumento relativamente simples, pois, invocando o Teorema de Slutsky,
temos:

seccionais.
16
A frmula, retirada de Mtys e Sevestre[1992],99, resulta da estimao por OLS do modelo (3.3) pr-
multiplicado por Wn. O estimador OLS de , de menor interesse,
= Y Y1 X i = yi yi, 1 x i .

22
1
1 1 1
plim Y1Wn Y1 plim Y1 Wn X plim Y1 Wn v
N NT N NT N NT
plim = +
plim
N 1 1 1
XWn Y1 plim XWn X plim X Wn v
N NT N NT N NT

1
e como, pela ortogonalidade das perturbaes face a X, temos plim XWn v = 0 , mas
N NT
como
1 1
plim
N NT
YWn v = plim t ( yi ,t 1 yi ,1 )( vi ,t 1 vi ,1 ) =
N NT i

1 1 T 1 T + T 2
= E ( yi ,t 1 yi ,1 )( vi ,t 1 vi ,1 ) = 2 v (3.5)
T t T ( 1 )2

temos que (3.5) 0, quando T fixo e quando T ser zero apenas se ||<1, como j
havamos notado. Assim, a semi-inconsistncia do LSDV fica a dever-se correlao (de
ordem O(1/T)) entre (yi,t-1 - yi.-1) e (vi,t - vi.), quando N, mesmo que yi,t-1 e vi,t sejam
independentes, criada pela eliminao dos efeitos individuais (no observveis) i do
modelo transformado.
Ainda que, quando se dispe de um painel com uma dimenso temporal grande, se
espere um enviesamento assimpttico pequeno17, como no esse o caso mais frequente
nas amostras longitudinais, torna-se essencial que se encontre um estimador consistente
para , quando T finito. Esse mtodo o das variveis instrumentais (IV).
Um mtodo IV sugerido por Balestra e Nerlove [1966] para o modelo de efeitos
aleatrios (que veremos na seco seguinte) e que pode ser usado no modelo de efeitos
fixos, sujeito a algumas alteraes, consiste em considerar uma matriz Z de m K+1
variveis instrumentais (p.ex., xit, xi,t-1, ) e estimar o modelo (3.3) por OLS pr-
multiplicado pelo projector de Y em Z*, PZ*=Z*(Z*Z*)-1Z*18, com Z*=(DN, Z). Atendendo
a que PZ*X=X (assumindo que X est contido em Z), PZ*DN=DN e que Wn e DN so
ortogonais, tal equivale aplicao de OLS ao modelo

17
Num modelo sem variveis exgenas, o enviesamento assimpttico , de acordo com Hsiao[1986], 74:
1
1+ 1 1 T 2 1
plim ( ) =
1 1 T (1 ) .
1
N T 1 T 1 (1 )(T 1)

23
Wn PZ Y = Wn PZ Y1 + Wn X + Wn PZ v (3.6)

que, pelo Teorema de Frisch-Waugh, nos permite obter as estimativas de e . O resultado


pode tornar-se mais eloquente se repararmos que WnPZ*=Wn(WnZ(ZWnZ)-1ZWn=PWZ e
que o mesmo resultado pode ser obtido que em (3.6) se transformarmos o modelo (3.3) por
pr-multiplicao pela matriz idempotente PWZ, que mais no que estimar o modelo
usando as variveis instrumentos na forma centrada (i.e., como desvios em relao s suas
mdias), pelo que, para que estas sejam vlidas, tm que ser estritamente exgenas.
Atendendo a que PWZPWZ = PWZ, os estimadores IV so, ento:
1
Y1Pw N z Y1 Y1 Pw N z X Y1 Pw N z Y
= XP Y XPw N z X X Pw N z Y
(3.7.)
IV w N z 1

Um outro estimador IV que se deve a Anderson e Hsiao [1981] poder ser obtido se
reescrevermos o modelo (3.3) nas primeiras diferenas (o que elimina )
Y = Y1 + X + v (3.8)
e usar como instrumento para Y-1, alternativamente, yi,t-2=(yi,t-2 yt-3) ou yt-2, sendo
ambos os estimadores da resultantes consistentes, ainda que o IV baseado em yt-2 seja mais
eficiente e menos exigente (basta que T2), segundo os mesmos autores.
De qualquer forma, os estimadores no sero completamente eficientes pois os
termos de perturbao transformados so MA(1). Mas, se se tentar ultrapassar este
problema atravs da pr-multiplicao do modelo nas primeiras diferenas por -1/2
, em
que a matriz de varincias e covarincias dos termos de perturbao v, obtm-se um
modelo com termos de perturbao que sero combinaes lineares de vit, logo,
correlacionados com quaisquer instrumentos no estritamente exgenos (i.e., yt-p e yt-p).
Pode-se, no entanto, usar os valores desfasados de X ou -1/2X como instrumentos.
Urga [1992] prope que se use, em vez das primeiras diferenas, as diferenas
ortogonais de Arellano e que consistem na transformao do modelo para desvios em
relao mdia dos valores futuros (em cada momento), como forma de remover os efeitos
individuais sem comprometer a ortogonalidade dos termos de perturbao transformados.
Um estimador mais eficiente foi ainda proposto por Arellano e Bond [1991], sob a
forma de um estimador IV generalizado (GIV) e que consiste na estimao por GLS de um
(
modelo na forma (3.8) transformado pela pr-multiplicao por uma matriz Z . Esta, uma

18
A sua multiplicao por Y dar a projeco deste no espao definido por Z*, i.e., Z*b e b=*(Z*Z*)-1Z*Y.

24
matriz que rene todos os instrumentos para cada valor desfasado de yit ortogonais em
( ( ( (
relao a vit, ou seja, Z =[ Z 1 ,, Z N ], que cumpre E( Z ivi)=019,i, com vi=(vi3-
vi2,, viT- vi,T-1). O estimador GIV de = [,
]

GIV = (X PZ( X ) (X PZ( Y )


1
(3.9)
( ( ( (
em que PZ( = Z ( Z -1 Z ) Z e X*=[Y-1,X]. Este estimador ser o mais eficiente desde

que vit no sejam autocorrelacionados.


Caso se no tenha qualquer informao quanto natureza de yi0 e distribuio de
vit, podemos recorrer a um estimador obtido pelo Mtodo dos Momentos Generalizado
( (
(GMM) e que idntico a (3.9), com a diferena de PZ( ser agora PZ( = Z Z e, sendo i o

termo de perturbao do modelo nas primeiras diferenas, ou seja, o elemento genrico de


v, temos ainda ( (
N
1
= (
N

i =1
Z i i i Z i ) 1 .

Em concluso, ainda que nem sempre se possa comparar um estimador com outro,
parece ser de recomendar o estimador IV de Balestra e Nerlove, desde que as variveis X
sejam estritamente exgenas e os termos de perturbao vit no exibam autocorrelao. J
se X no for estritamente exgeno, ainda que os termos de perturbao permaneam no
autocorrelacionados, os estimadores de Arellano e Bond [1991] afiguram-se como os
melhores candidatos. Se X no for estritamente exgeno e houver autocorrelao, Mtys e
Sevestre [1992] aconselham que se use como instrumento os valores desfasados de X no
modelo (3.8).
O estimador sugerido em Arellano e Bond [1991], tal como a questo da filtragem
com a matriz de varincias, voltar a ser discutido no captulo 5 relativo estimao de
modelos com dados em painel pelo mtodo GMM.

3.3 Estimao de Modelos com Efeitos Aleatrios

Tal como no caso dos modelos estticos, a considerao de efeitos individuais


aleatrios em vez de fixos tem implicaes distintas ao nvel da estimao e propriedades
dos estimadores. No entanto, no enquadramento especfico dos modelos dinmicos, a

19
Por exemplo, para t=3, teramos como instrumentos vlidos yi0, yi1, yi2 e xi , podendo a lista ser expandida
com valores desfasados de xi . A este propsito veja-se Mtys e Sevestre[1992],100-5 e Baltagi[1995]128-

25
questo dos efeitos aleatrios (autocorrelacionados), ao implicar correlao entre os termos
de perturbao e a varivel autorregressiva tem consequncias mais srias do que nos casos
precedentes.
Considere-se, ento, o seguinte modelo de componentes de erro (unicamente
individuais)
Y = Y1 + X + u
(3.10)
u=+v
em que E(u)=0, Var(u) = = v2Wn+(v2+T2)P = v2(Wn+1/ 2P) e X contm K
variveis exgenas.
fcil ver que o estimador OLS (sem dar conta dos efeitos individuais), ao
contrrio do que sucedia nos modelos estticos, no cntrico nem consistente, devido
correlao entre yi,t-1 e i, podendo o enviesamento ser bastante significativo.
Uma abordagem bastante poderosa, proposta por Maddala, consiste em recorrer
classe geral de estimadores e que mais no so que a estimao do modelo (3.10) pr-

multiplicado por (Wn + P), o que resulta na seguinte formulao genrica20

Y1 (Wn + P )Y1 Y1 (Wn + P )X Y1 (Wn + P )Y


1

=
X(Wn + P )X X (Wn + P )Y
(3.11)
X(Wn + P )Y1

Assim, para [0;[ temos vrios estimadores de , nomeadamente: o LSDV se


=0; o OLS, quando =1; o GLS, para = 2 e o estimador Between se . Note-se que,
quando = 0, todos estes estimadores so consistentes, mas quase todos eles deixam de o
ser, quando 0.
Para ilustrar este argumento, recorra-se, novamente, ao modelo autorregressivo
(3.2), mas agora sem variveis exgenas e com a inovao de os efeitos serem aleatrios.

y it = y i ,t 1 + i + v it
1 t t 1 (3.12)
y it = t y i , 0 + i + j v i ,t j
1 j =0

Uma estimao por OLS do modelo (3.12) leva ao seguinte estimador:

32.
20
Atendendo a que (Wn + P)(Wn + P)=(Wn + P).

26
N T N T

yit yi,t 1 ( i + vit ) y i ,t 1


OLS = i =1 t =1
N T
= + i =1 t =1
N T

y
i =1 t =1
2
i ,t 1 yi =1 t =1
2
i ,t 1

verificando-se, de acordo com resultado apresentado em Hsiao [1986], 77


N T

( i + vit ) y i ,t 1
plim (OLS ) = plim i =1 t =1
N T
>0
y
N N 2
i ,t 1
i =1 t =1

sendo que a incluso de variveis exgenas reduz, mas no elimina o enviesamento, pois o
estimador OLS de continua a sobrestimar o seu verdadeiro valor e o de encontra-se
enviesado para zero. Uma forma de determinar um estimador consistente para foi
desenvolvida por Sevestre e Trognon, em Mtys et al. [1992] e resulta num valor para
dado por
K (1 2 )
=
1 T E ( yi 0 i )
+ K (1 2 + T 2
1 + v
2 2

(T 1 T + ) T
K=
T (1 ) 2
2
= 2
2

+ v2

Ou seja, se substituirmos por * em (3.11), temos estimadores de e que sero


consistentes. Regra geral, * 2, o que prova a semi-inconsistncia do GLS22, excepto no
caso de E(yi0i) = 0, pois ento, *= 2 e os estimadores sero consistentes. Infelizmente, o
mtodo no exequvel pois * funo de parmetros desconhecidos. Sugere-se um
mtodo bi-etpico em que se estimaria, numa primeira fase, * de forma consistente e
utilizar-se-ia essa estimativa em (3.11), mas verificou-se que as distribuies assimpttica
e finita deste estimador bi-etpico dependem crucialmente da do estimador de *, o que
leva a que a estimao seja, geralmente, pouco robusta. Finalmente, este princpio no
aplicvel a modelos autorregressivos de ordem superior a um.

21
Ver Mtys e Sevestre [1992].

27
Quando o vector de perturbaes normal, a soluo natural para o problema de
estimao o recurso ao MLE que, desde que nada seja assumido quanto primeira
observao, ser regra geral equivalente ao OLS e, como este, no consistente.
A consistncia do MLE (e tambm do GLS, como vimos) vai depender de forma
determinante dos pressupostos admitidos quanto a yi0, pelo que podemos considerar quatro
casos23 para o modelo

y it = yi ,t 1 + xit + z i + i + vit (3.13)

em que z um atributo que no varia no tempo (como o sexo) e x varia seccional e


temporal. Temos, de acordo com Hsiao [1986]:
I. yi0 fixo: um indivduo comea num dado ponto arbitrrio e fixo e gradualmente
aproxima-se do nvel de equilbrio dado por (i+zi)/(1-)+j jxi,t-j. Ainda que
parea razovel, o pressuposto da no aleatoriedade de yi0 choca com a correlao
entre i e yit: se i est incorporado em yit, porque no h de estar em yi0? Se o
processo j tem alguma histria, nada justifica que yi0 tenha sido gerado de forma
diferente da de yit;
II. yi0 aleatrio e yi0 = y0 + i, em que os i representam os efeitos das dotaes
individuais iniciais, podendo-se verificar que yio seja
a) uma varivel aleatria pura, em que os impactos das dotaes iniciais
se vo esbatendo ao longo do tempo, logo, cov(i, i)= 0;
b) correlacionado com i, com cov(yi0,i)= 2y0, de tal forma que as
diferenas entre os indivduos ficam a dever-se unicamente s
diferentes dotaes iniciais, sendo o seu efeito de longo prazo i/(1-
);
III. yi0 = i0 + i, com i0 fixo e yit = it + i e it=it-1 + uit. Ou seja, it e i no
esto correlacionados e it uma varivel latente no observvel que representa um
dado processo dinmico. Os indivduos seguem um mesmo processo estocstico
{it} (condicionado pelas variveis exgenas z e x) no observvel e so sujeitos a
choques individuais independentes (uma medida das dotaes iniciais ou dos erros
de medida no i-simo processo) i. Aqui, yi0 = i0 + i (i.e., tambm afectado por

22
Quando T e N, o GLS consistente pois converge para o LSDV (Hsiao[1986],88).
23
Para uma abordagem mais completa, veja-se Hsiao[1986],78-81.

28
i, pelo que no foroso que yi0 seja o incio do processo) ser um ponto de

partida arbitrrio e yit tender para i+zi/(1-)+j jxi,t-j.


IV. yi0 = i0 + i, com i0 aleatrio e cov(yi0,i) 0, com as seguintes variaes:
a) i0 tem as mesmas mdia e varincia que os estados finais;
b) i0 tem a mesma mdia, mas varincia arbitrria (no estacionrio);
c) i0 tem a mesma varincia, mas mdia diferente (i.e., de outra
populao);
d) i0 tem mdia e varincia arbitrrias.
Para os casos III e IV.d os estimadores MLE no se encontram definidos e, quando
T e N fixo, os estimadores de e 2 no so consistentes devido insuficiente
variabilidade seccional. Os restantes estimadores MLE so, regra geral, consistentes, em
qualquer dos casos semi-assimptticos24 e a utilizao de um mtodo MLE justifica-se
quando se pretende testar hipteses quanto ao estado inicial yi0.
A estimao por MLE, maximizando a funo de verosimilhana, relativamente
complicada e pode ser efectuada atravs de um qualquer algoritmo iterativo, como o de
Newton-Raphson ou, alternativamente, atravs de um sistema de equaes

Y + X + Z = U
y10 y11 K y1T x11 x12 K x1T 1 z1
y y 21 K y 2T x x22 K x 2T 1 z (3.14)
Y = 20 ; X = 21 ;Z = 2

M M O M M M O M M M

yN 0 yN1 L y NT xN1 xN 2 L x NT 1 z N

em que U a matriz NT de termos de perturbao, com matriz de varincias . A matriz


], tal como , poder ser objecto de determinadas restries, dependentes do
A=[
caso que se escolher quanto a yi0. A utilizao de um mtodo de mnimos quadrados tri-
etpico (3SLS) dever ser equivalente utilizao de um mtodo MLE sujeito s referidas
restries, mas ser menos eficiente que a maximizao da funo de verosimilhana
irrestrita de (3.14).
Uma especificao proposta em Mtys et al [1992] para a primeira observao
consiste em acrescentar a (3.13) o seguinte:

24
Para um ponto de situao, consulte-se Hsiao[1986],84.

29
yi0 = .zi + ui0 (3.15.1)
i = .ui0 + i (3.15.2)
As perturbaes (ui0,i,vi1,,viT) so i.i.d. normais, com mdia nula e varincias u2
2 v2 e a funo logartmica de verosimilhana

N N 1 1
ln LNT ( , , , , , u2 , 2 , v2 ) = C ln ln u2 i 1 i 2 u 2
(3.16)
2 u
i0
2 2 2 i

com = v2Wn+(v2 + T2)P e i um vector coluna (T1) de elemento genrico (yit - yi,t-1
- xit - zi - ui0). A maximizao de (3.16) com respeito aos parmetros desconhecidos
dar os estimadores MLE25, com a particularidade de os estimadores de e u2 serem os
estimadores OLS de (3.15.1) e de ui0 ser substitudo pelos resduos desta ltima regresso
em i. Os estimadores assim obtidos sero consistentes e, no caso de as perturbaes serem
normais, assimptoticamente eficientes, exibindo ainda um bom comportamento em
amostras finitas.
Atendendo a que uma m escolha da especificao das condies iniciais poder
levar a estimadores MLE que no sejam consistentes, por no serem os mais adequados
(no sendo assimptoticamente equivalentes aos verdadeiros MLE, por estarem em causa
funes de verosimilhana diferentes) e porque a regra geral dos estudos que se disponha
de sries temporais relativamente curtas, torna-se imperioso que se encontre um estimador
que no dependa de yi0.
Os diversos mtodos IV, j analisados na seco anterior, valem pelo facto de
serem geralmente consistentes (desde que N), independentemente de yi0 (ainda que
pouco se possa afirmar quanto s suas eficincias relativas) e pela sua grande
aplicabilidade, no havendo grandes diferenas relativamente ao modelo com efeitos fixos.
Por isso, acabam por ser os mais utilizados. Para excelentes resumos de vrios estimadores
podem consultar-se Baltagi [1995], 126-145, Mtys e Sevestre [1992] e Mtys [1999].
Quando se no impe qualquer restrio quanto estrutura de correlaes entre os
termos de perturbao, um mtodo eficiente e consistente (com T fixo) consiste em separar
o modelo (3.13) nas primeiras diferenas em T-1 equaes

25
Ver Mtys e Sevestre[1992], 111 para as equaes normais da condio de primeira ordem.

30
( y i 2 y i1 ) = ( y i1 yi 0 ) + ( xi 2 xi1 ) + (ui 2 ui1 )
( y y ) = ( y y ) + ( x x ) + (u u )
i3
; i = 1,K, N
i2 i2 i1 i3 i2 i3 i2

M
( y iT yi ,T 1 ) = ( y i ,T 1 yi ,T 2 ) + ( xiT xi ,T 1 ) + (uiT u i ,T 1 )

e estimar o sistema por 3SLS. Como os efeitos individuais desaparecem do modelo,


indiferente estarmos perante efeitos fixos ou aleatrios. No entanto, o mtodo exige que
existam variveis exgenas no correlacionadas com o termo de perturbao vit.
Tambm o mtodo de Chamberlain [1984], com recurso a um estimador de
distncia mnima, que vimos que era eficiente nos modelos sem restries quanto
estrutura da matriz de varincias e covarincias dos termos de perturbao, pode ser
aplicado no contexto dos modelos dinmicos. O mtodo consiste em restringir , para o
modelo (3.2) com apenas uma varivel exgena, da seguinte forma:
t 1
1 t E( i yi 0 )
E ( yit | yi 0 , xi1 ,K, xiT ) = yi 0 + xi ,t j +
t j
( yi 0 E ( yi 0 ))
j =0 1 Var( yi 0 )
1 t E( i yi 0 )
0 ,T = t +
1 Var( yi 0 )
j ,t = t j ; j = 1,K,T (3.17)
j ,t = 0 ; j = t + 1,K,T
1 t E ( i yi 0 )
T +1,t = E ( yi 0 )
1 Var( yi 0 )
em que E*(yit|yi0,xi) a projeco de yit. Tal como na seco 2.3, procede-se estimao
de (coluna com todas as linhas de ) na sua forma irrestrita atravs de uma regresso
OLS de yit sobre yi0,xi. O segundo passo do mtodo consiste em estimar atravs de um
estimador de distncia mnima os parmetros sujeitos s restries expostas em (3.17)26 e
que se representam na forma matricial por =
(
)
. Assim, substituir-se- pela
estimativa OLS irrestrita, pelo que se tem

OLS = ( OLS ) + ALS = (( OLS )( OLS ) ) ( OLS ) OLS


1

em que o estimador de assim obtido corresponde a um estimador de mnimos quadrados


assimptticos (ALS) e consistente, ainda que no eficiente. Um estimador
assimptoticamente eficiente teria que considerar a matriz de covarincias de , (S,
),

26
As restries podero e devero ser simplificadas, de acordo com Mtys e Sevestre [1992],113, por forma

31
funo da matriz de covarincias de
OLS , S, e de . Assim, teremos um estimador FGLS

mais eficiente se usarmos as estimativas OLS de S e ALS de para estimar , com a


seguinte formulao:

( 1
)
FGLS = ( OLS ) 1( OLS ) ( OLS ) 1 OLS .
As vantagens deste mtodo de Chamberlain [1984] prendem-se com o facto de
necessitar de poucas restries, nomeadamente quanto dinmica das perturbaes, de
poder ser aplicado a modelos com variveis autorregressivas de ordem p>1 e de facilitar a
realizao de numerosos testes de especificao. No entanto, ao deixar a matriz de
covarincias de v irrestrita, o mtodo leva a uma perda de eficincia, quando esta tiver uma
estrutura conhecida. Por outro lado, trata-se de um mtodo computacionalmente muito
exigente, pelo que, pouco usado, ainda que esta questo seja cada vez menos relevante.

3.4 Estruturas Alternativas para a Heterogeneidade

Uma especificao alternativa aos modelos com componentes de erro a proposta


por Kmenta27 (Mtys e Sevestre [1992], 198-201 e Greene [1997], cap. 15) em que a
heterogeneidade individual deriva, no do termo independente ou de coeficientes
aleatrios, mas sim de uma particular estrutura de covarincias para um conjunto de
amostras temporais, naquilo que usualmente se considera ser um modelo da classe time-
series of cross section data (TSCS). Este tipo de especificao , segundo Greene [1997],
particularmente indicada para estudos com painis relativamente longos e estreitos, como
habitual surgir na macroeconometria. Admita-se, a ttulo de exemplo e para facilitar a
exposio, um estudo sobre a dinmica da inflao para um conjunto de N pases, durante
T perodos e que pode ser representado da seguinte forma:
p
i ,t = 0 + j i ,t j + it
j =1

11 11 12 12 L 1n 1n
(3.18).
22 22 L 2 n 2 n
V = E ( ) = 21 21
M M O M

n1 n1 n 2 n 2 L nn nn

a que se tornem lineares.


27
Kmenta, Jan [1986], Elements of Econometrics, New York, MacMillan, citado em Baltagi in Mtys e

32
A estrutura de covarincias pode ser condicionada de forma a representar diversos
casos de interesse, sendo o mais simples obtido para termos de perturbao
homoscedsticos e no correlacionados:
2 I 0 L 0

0 2I L 0
V = E(it2)=2 , i,t e E(itjs)=0, ij ou ts
M M O M

0 0 L 2 I

e que equivale estimao de (3.18) admitindo a inexistncia de efeitos especficos (em


que os estimadores OLS sero BLUE). Este caso , no entanto, de longe o menos
interessante de analisar na medida em que exclui toda heterogeneidade dos dados e a nica
vantagem de se trabalhar com um painel ser a de reunir mais observaes, aumentando os
graus de liberdade ao dispor da inferncia estatstica (na prtica faz-se o pooling dos dados
e ignora-se a dimenso temporal ou seccional da heterogeneidade).
Um caso bem mais interessante ser o de incluir heteroscedasticidade seccional ou
em grupo no modelo, i.e., admitir homoscedasticidade dos termos de perturbao para um
dado indivduo ao longo do tempo mas que a cada indivduo corresponde uma varincia
diferente. Ou seja, admite-se que:
12 I 0 L 0

0 22 I L 0
V =
M M O M

0 0 L n2 I

o que se pode ficar a dever a uma grande variao nos nveis mdios de inflao entre os
diversos pases, em que alguns deles registaram episdios de hiperinflao mesmo. Esta
hiptese pode ser introduzida no modelo como fonte adicional de heterogeneidade, para
alm dos efeitos fixos. Nesta situao, torna-se necessria a estimao da matriz de
varincias e covarincias, pelo estimador de White com correco por grupo, para uma
estimao robusta, ainda que no eficiente, por OLS. Uma alternativa mais eficiente ser a
estimao do modelo atravs de um estimador GLS se V for conhecida ou FGLS, caso V
seja desconhecida.
Finalmente, uma outra hiptese de heterogeneidade ser a resultante de uma
estrutura de correlaes entre as sries individuais (mas no dentro de cada uma das
sries), a que se chama de correlao seccional (Greene [1997], pg. 658) e que, neste

Sevestre [1992].

33
caso, pode representar a existncia de relaes econmicas estreitas entre dois ou mais
pases da amostra que originam alguma simetria na resposta a certos choques aleatrios
sobre as respectivas dinmicas inflacionrias. Neste caso, a matriz de covarincias ser
11I 12 I L 1n I
I I L I
V = E ( ) = 21 2n
22

M M O M

n1I n 2 I L nn I
em que se admite a ausncia de autocorrelao entre os termos de perturbao28. O
pressuposto de ausncia de autocorrelao torna-se essencial para garantir a consistncia
dos estimadores de mnimos quadrados (ordinrios ou generalizados) pelo que a sua no
verificao levaria a uma estimao por IV ou GMM por os regressores deixarem de ser
ortogonais, face aos termos de perturbao. Em Davidson e Mackinnon [1993] e Greene
[1997] sugere-se o mtodo mais eficiente de Hatanaka que avana como instrumento para
a varivel dependente desfasada, os valores desfasados das restantes variveis exgenas
para a obteno de estimadores consistentes para e e a implementao de um
procedimento FGLS. Para os modelos puramente autorregressivos, tal torna-se
impraticvel na medida em que no existiro variveis verdadeiramente exgenas, o que,
segundo Hamilton [1994], faz com que um mtodo FGLS iterado no corresponda j a
MLE29.
Tal como no caso dos modelos com componentes de erro, os modelos de Kmenta
tm a vantagem de trabalharem com amostras relativamente grandes e com bastante
heterogeneidade e ao permitirem uma correlao serial, encontram uma fundamentao
macroeconmica pertinente. No entanto, Baltagi em Mtys e Sevestre [1992] alerta para o
facto de este tipo de especificao ser menos robusto face a eventuais erros de
especificao que a usual abordagem dos componentes de erro.

28
Por uma questo de constncia na terminologia, estabelece-se que um termo de perturbao se diz
autocorrelacionado quando E(uit.ui,t-s) 0, s0 e serialmente correlacionada quando E(uit.ujt) 0, ij.
29
Uma alternativa apontada por Hamilton [1994] seria a estimao por MLE o que exigiria um
conhecimento, que se poder no ter, sobre as distribuies dos termos de perturbao e sobre a especificao
do processo estocstico gerador da autocorrelao. Mesmo se se conhecer a estrutura ARMA dos termos de
perturbao, caso esta no seja suficientemente simples, a aplicao de um mtodo MLE ou FGLS tornar-se-
impraticvel do ponto de vista computacional.

34
4. Estimao de Modelos com Desfasamentos Distribudos30

Devido existncia de rigidez de ordem tcnica, institucional ou psicolgica,


frequente o comportamento no se adaptar imediatamente a alteraes nas variveis
explicativas, sendo tal adaptao, na maior parte dos casos, progressiva. Assim, essa
adaptao pode ser racionalizada atravs de diversos mecanismos tericos de ajustamento,
havendo a alternativa de estimarmos y atravs de variveis dependentes desfasadas,
juntamente com variveis exgenas, ou atravs de um modelo de desfasamentos
distribudos, em que o valor actual de y ser uma funo de uma cadeia de valores
contemporneos e passados de um vector de variveis independentes. Ainda que estes dois
modelos possam ser reciprocamente transformados um no outro, sempre necessrio
determinar com algum rigor, no apenas o momento a partir do qual se comeam a sentir
os efeitos na varivel dependente de uma inovao no vector de variveis independentes,
mas tambm determinar a partir de que momento se encontram completamente
repercutidos em y os referidos efeitos.
A determinao da dimenso da estrutura de desfasamento, ainda que um tema
merecedor de ateno, no propriamente uma idiossincrasia do estudo de dados em
painel, aplicando-se os usuais critrios utilizados nas sries temporais ou nos estudos
cross-section: critrios de Schwarz ou Akaike, testes LR, ...
J a questo da estimao de um modelo com uma dada dimenso de desfasamento
sem impor restries de identificao, como os desfasamentos geomtricos de Koyck ou os
polinomiais de Almon, que dificilmente poder ser evitada nos estudos temporais com
desfasamentos importantes, devido ao excessivo nmero de parmetros a estimar (e que
inviabiliza um qualquer estimador consistente, mesmo com T , pois o nmero de
parmetros a estimar tende tambm para infinito) justifica uma referncia detalhada nos
estudos com dados em painel.
Assim, uma vez que as amostras temporais so frequentemente de reduzida
dimenso e dizem respeito a variveis provavelmente bastante correlacionadas umas com
as outras, geralmente impossvel obter estimativas, com qualidade, para os parmetros
dos diversos desfasamentos sem impor as referidas restries. Mas, se dispusermos de N

30
Esta seco foi quase exclusivamente baseada em Hsiao[1986], Seco 8.1, sujeita a algumas
simplificaes e adaptaes.

35
sries temporais, em princpio ser mais fcil estimar pelo menos alguns dos parmetros,
uma vez que passamos a dispor de N vezes mais informao. Por outro lado, ao juntarmos
a dimenso seccional, permitindo diferenas nas caractersticas individuais, estamos muito
provavelmente a reduzir a importncia do mais que provvel problema de
multicolinearidade entre xt, xt-1 ... xt-p ..., sempre presente neste tipo de especificao.
Assim, Hsiao [1986] sugere que para a estimao do seguinte modelo

yt = + xt + ut , t = 1,..., T (4.1)
=0

se recorra ao modelo transformado


t 1
yit = + l xi , t + bit + uit , t = 1,..., T ; i = 1,..., N (4.2)
=0


onde bit = t + xi , ser a contribuio dos valores pr-amostrais no observados de x.
=0

Para a estimao do modelo so necessrios alguns pressupostos, nomeadamente:

0. o modelo dado por



yit = i* + xi , t + uit , t = 1,..., T ; i = 1,..., N ,
=0

com uit independente de xis e i.i.d., com valor esperado nulo e varincia ;

1. E(i) = ;

2. i = i , it = i xi ,t e i = ( i1 , . . . , iT ) E * ( i |x i ) = 0;
~ ~
=0

3. E (i |xi) = + axi.
* *

em que E* representa o previsor de erro quadrtico mnimo da primeira varivel na


segunda (ou projector) e xi o vector de todas as observaes de xit. Admite-se ainda que
existem p + 1 observaes para antes da primeira observao disponvel para y e que
E(xixi) = xx positiva definida, com xi =[xi,-p,...,xi,T] a ser um vector aleatrio de dimenso
1 x (p + 1 + T). O segundo pressuposto pode ser aproximado pela hiptese de as diferenas
entre os coeficientes individuais I serem independentes de xi, ainda que os efeitos
individuais i* possam ser correlacionadas com este. De acordo com Hsiao [1986], os

36
pressupostos 1-3 garantem a identificao de E({}) quando N e T. Se T fixo, o
modelo dever ser reescrito da seguinte forma:
t+ p
yit = + xi ,t + bit + u$it , t = 1,..., T ; i = 1,..., N
i
*
(4.3)
=0

com o termo de perturbao agregado it = it + uit satisfazendo E(i|xi) = 0 e o termo dos



coeficientes individuais residuais (i.e., truncados) a ser dado por bit = t + xi , .
= p+1

Na generalidade dos casos, bit estar correlacionado com as variveis explicativas, pelo
que no ser possvel obter estimadores consistentes, a menos que se introduzam restries
adicionais sobre os coeficientes de desfasamento ou sobre o processo estocstico gerador
dos valores de x, vlido no apenas para os valores amostrais, mas tambm para os pr-
amostrais.
Podemos, ento, distinguir duas estratgias de identificao que podem ser resumidas da
seguinte forma:

i. usando a estrutura do processo gerador da varivel exgena

Como pretendemos estimar pelo menos alguns dos parmetros , com = 1, ... e
de forma irrestrita (i.e., sem necessitarmos de racionalizarmos {} atravs de um qualquer
mtodo de Koyck ou de Almon), vamos considerar que um coeficiente de desfasamento
se encontra identificado se for possvel calcul-lo atravs da matriz de coeficientes (de
dimenso T x (T + p + 1)) obtida atravs do previsor de erro quadrtico mdio mnimo ou
projeco de yi em xi: E*( yi| xi) = I + xi, em que yi o vector das T observaes de y
para o i-simo indivduo. Esta matriz contm informao sobre a combinao dos
coeficientes de desfasamento relevantes B e sobre as projeces de i* e bit em xi, que ter
que ser separada para se proceder identificao dos referidos coeficientes.
Uma forma simples de o fazer ser reescrever a projeco de yi em xi e i* da
seguinte forma:

E ( y i |x i , i ) = [ B + W] x i + [ i + c] i (4.4)

em que ser a matriz T x (T + p + 1) que conter T + p coeficientes e W e c sero


definidos atravs de

E (b i |x i , i ) = Wx i + c i (4.5)

37
Ora, ser ento definida por = B + [W + (I + c)a]31, com a obtida atravs de
E ( i |x i ) = + a xi . Hsiao[1986] demonstra que para se identificar B bastam apenas
algumas restries sobre W, sugerindo, para i* independente de xi, que se admita um
processo autorregressivo de ordem q para x, na medida em que possvel obterem-se
estimadores consistentes para os (T + p - q + 1) primeiros parmetros de desfasamento,
com expresso genrica
t + p q q

E ( yit |x i ) = +
=0
xt + t , j p1 xi , j p1
j =1
(4.6)

com t, j-p-1 = t+p+1-j + wt, j-p-1, t = 1, ..., T e j = 1, ..., q e q = p + 2 (por simplificao). Os


coeficientes de cada uma das equaes so estimativas dos primeiros (t + p - q + 1)
coeficientes de desfasamento do modelo, desde que t seja suficientemente grande, i.e.,
desde que (t + p - q + 1) > 0.
Ou seja, desde que se assuma 1., 2. e 3., juntamente com um dado comportamento
para os valores pr-amostrais de x, neste caso, que tenham sido gerados por um processo
AR(q)32 e que se disponha de um nmero suficiente de observaes (i.e., que T + p seja
grande face a q), ser sempre possvel estimar os primeiros coeficientes de desfasamento.
evidente que, dada a pequena dimenso temporal dos estudos em painel, no ser
possvel obter muita informao (irrestrita) sobre os coeficientes mais afastados, mas ser
sempre possvel obter estimativas para os primeiros e, a partir da, desenhar uma dada
estrutura de desfasamento que restrinja o nmero de parmetros a estimar.

ii. usando restries sobre a estrutura dos coeficientes de desfasamento

Sempre que se disponha de alguma informao terica sobre que valores os


parmetros podem ou no assumir, ou sobre as suas ordens de grandeza, etc..., pode-se
reduzir o nmero de parmetros a estimar, numa generalizao e extenso das tcnicas
utilizadas nos modelos de desfasamentos distribudos convencionais, recorrendo-se s
potencialidades dos estudos em painel. Assim, em vez de assumir um dado processo
gerador para x (como o AR(q) usado na seco anterior) vamos assumir que os parmetros
se comportam de uma dada forma conhecida a priori.

31
Para mais pormenores, consultar Hsiao[1986], 185.
32
Hsiao[1986] fornece uma frmula mais geral (p.186), que contempla o caso de i* e xi serem
correlacionados, mas que por ser notacionalmente bastante complexa, foi aqui omitida.

38
Uma forma sugerida por Hsiao [1986] considerar-se que h k parmetros
iniciais irrestritos e que os restantes seguem um comportamento de natureza
autorregressiva, nomeadamente:

k
J

j j > k
j =1

em que se assegura que decline geometricamente aps os primeiros k desfasamentos33.


A soluo geral da equao s diferenas

1 1 K J J = 0

J
dada por = Aj j , em que Aj so constantes dadas pelas condies iniciais da
j =1

equao e {j} as suas razes caractersticas, e permite-nos escrever o termo residual bit da
seguinte forma:
J J
bit = ( A
= p +1 j =1
j
t +
j ) xi , = jt bij .
j =1

Ou seja, podemos representar o termo residual bit como uma combinao linear das
condies iniciais no observveis (bi1, ..., biJ), pelo que, se juntarmos este pressuposto aos
trs j estabelecidos, o modelo de desfasamentos distribudos reduz-se a um sistema de T
regresses com J+1 coeficientes no observados (i*; bi1, ..., biJ) e em que os ltimos
decaem geometricamente. No caso particular de J=1, temos o modelo de Koyck, em que bit
= bi,t-1 que, aps algumas transformaes (que aqui se omitem para no tornar a
exposio demasiado pesada, mas que podem ser consultados em Hsiao[1986], 190-1),
pode ser identificado a partir de = B* + *w* + ia', em que B* a matriz (T(T+k)) que
contm os k +1 parmetros (de 0 a k) irrestritos e os restantes T 1 parmetros obtidos
a partir de k, = 1, ..., T-1. A matriz * [1,,...,T-1] e w* o vector de coeficientes
obtido da projeco de bi em xi e exige-se que T 3 por forma a que identifique os
parmetros e 34.

33
Nomeadamente, impondo que as razes, reais e distintas, da equao caracterstica 1 J
j Lj = 0
j =1
caiam fora do crculo unitrio. Ver Hsiao[1986], 189.
34
De facto, o que se verifica que o jacobiano de (relativamente aos parmetros desconhecidos) respeita a
condio de caracterstica, desde que T 3. possvel verificar-se, ainda, que para J>1 a condio de

39
A estimao de um modelo de desfasamentos distribudos com base em amostras de
dados em painel de curta durao pode ser feita atravs da decomposio do modelo base
(4.2) no seguinte sistema de T equaes reduzidas:

y = i + [ T xi ] + v i , i = 1,K, N
i (4.7)
(T1)

em que = [
1, ... , T] e j a j-sima linha da matriz (o que torna uma matriz de
dimenso (T21)) e vi no est correlacionado com xi. Sob as usuais condies de
regularidade, o estimador LS de consistente e assimptoticamente normal, sendo
aplicveis os usuais testes assimptticos.

caracterstica se verifica para T J+2, de acordo com Hsiao [1986].

40
5. ESTIMAO GMM DE MODELOS DINMICOS COM DADOS EM PAINEL

Como se viu, um problema que ocorre frequentemente na estimao de modelos


dinmicos com dados em painel o da perda da consistncia dos estimadores
convencionais, pelo menos quando N. O estimador within, por exemplo, torna-se
inconsistente, com T fixo, porque a transformao within origina uma correlao de ordem
1/T entre a varivel dependente desfasada e o termo de perturbao, como se viu no
captulo 3. Tambm notada nesse captulo foi a soluo popular proposta por Anderson e
Hsiao [1981] de transformar o modelo para as primeiras diferenas (removendo os efeitos
individuais) e usar a varivel dependente desfasada em dois perodos como instrumento
para o termo autorregressivo. Arellano e Bond [1991] propem um conjunto mais alargado
de instrumentos, que incluiriam recursivamente todos os valores passados de yit
(disponveis para cada momento). No entanto, como nota Mtys [1999], a viabilidade dos
valores passados da varivel dependente como instrumentos exigir um conjunto de
restries sobre as covarincias entre o termo de perturbao aleatrio, o efeito individual e
a observao inicial da varivel dependente.
O objectivo do GMM ser, ento, o de encontrar um estimador consistente com um
mnimo de restries sobre os momentos. A organizao deste captulo ser ento a
seguinte: numa primeira parte discute-se a aplicao do GMM aos dados em painel de
forma genrica e, numa segunda parte, especificamente o GMM com modelos dinmicos.

5.1 Estimao GMM com Regressores Exgenos

Considere-se o modelo genrico com efeitos seccionais, apenas:


yit = x it + uit , uit = i + it
(5.1)
y i = Xi + ui , ui = iT i + i
O objectivo do mtodo GMM ser, ento, a estimao dos parmetros de um
modelo especificando um mnimo de condies de momentos, no necessitando, pois, da
especificao completa das distribuies das variveis aleatrias usadas. A lgica do GMM
a idntica do mais prosaico mtodo dos momentos (MM): fazer equivaler os momentos
populacionais s suas contrapartes amostrais, resolvendo as equaes que da resultarem,
desde que identificadas. O MM exige, para ser exequvel, que as equaes resultantes das

41
condies de momentos sejam exactamente identificadas, i.e., que o nmero de parmetros
as estimar (dimenso do vector ) seja igual ao nmero de restries impostas sobre os
momentos.
Nos casos em que os parmetros do modelo esto sobre-identificados pelas
condies de momentos pode, ento, recorrer-se ao mtodo GMM para se obter
estimadores genericamente consistentes. Assim, as q condies de momentos
gi=E(f(Xi ))=0 representam q equaes com k>p incgnitas, de tal forma que as equaes
com os momentos amostrais
( )
f N N = 0

no tero uma soluo. O melhor que se poder fazer encontrar uma estimativa para N
que aproximar f(.) o mais possvel de zero, ou seja, um estimador (GMM) que respeite

( )
( )
N = arg min Q N ( ) = f N N VN f N N = 0

em que VN uma matriz de ponderao estocstica definida positiva e QN estritamente


positiva no caso sobre-identificado. Sob certas condies de regularidade relativamente
gerais, os estimadores assim obtidos sero consistentes35 e assimptoticamente normais36.
Para que os estimadores GMM sejam assimptoticamente eficientes, haver que escolher
apropriadamente a matriz de ponderao VN, no que poder ser empregue um processo bi-
etpico, partindo-se de um estimador consistente de . Infelizmente, como o estimador
obtido depender do ponto de partida (ainda que assimptoticamente equivalente), h que
encontrar uma forma de garantir estimadores com bons comportamentos em amostras
finitas, para o que se poder usar, por exemplo, processos iterativos. Para se encontrar um
estimador GMM mais eficiente assimptoticamente, ter-se- que considerar, de igual forma,
o conjunto das condies de momentos, no sendo verdadeiro que a um maior conjunto de
condies de ortogonalidade (ou seja, um maior conjunto de informao) corresponda um
estimador GMM mais eficiente, como nota Mtys [1999]. Assim, apenas na medida em
que uma condio adicional contribua com nova informao, para alm da j contida nas

35
Para que os estimadores GMM sejam fracamente consistentes (i.e., que convirjam em probabilidade para
) necessrio que gi exista, seja finita e uma aplicao bijectiva; que os q momentos amostrais convirjam
uniformemente em probabilidade para os seus contrapartes populacionais e que VN convirja em probabilidade
para uma matriz no aleatria definida positiva. Ver Mtys [1999], por exemplo.
36
Para o que ser necessrio impor, para alm da consistncia: que f(XN, ) seja continuamente diferencivel
em ordem a , num espao compacto B; que o Jacobiano (em ordem a , logo, uma matriz q p) das
condies de momentos convirja em probabilidade (para uma qualquer sequncia N* que convirja em
probabilidade para o verdadeiro vector ) para uma sequncia de matrizes de igual dimenso e que no

42
condies anteriores que a sua incluso aumentar a eficincia do estimador GMM. Esta
condio particularmente importante para modelos dinmicos com dados em painel
(Mtys [1999]).
Sobre este tema, devem-se consultar, entre outros, Amemiya [1985], Davidson e
MacKinnon [1993], Greene [1997] e Mtys [1999].
Relativamente ao modelos (5.1), uma estimao por GMM comear por impor
uma condio de ortogonalidade entre um conjunto de (Tp) instrumentos Zi e os termos
de perturbao ui, dada por E(Ziui) = 0 e uma condio de identificao, dada por
car[E(Ziui)] = k. Existindo esses instrumentos, pode-se obter um estimador GMM de
)Z(VN)-1Z(Y-X
pela minimizao da funo objectivo N(Y-X ) e em que VN pode ser
qualquer estimador consistente de V= E(Ziui uiZi). O estimador GMM ser:

(
GMM = XZ(VN ) Z X
1
) 1
XZ(VN ) ZY
1
(5.2)

e em que, como sugere Mtys [1999], se pode obter VN a partir de um estimador inicial
consistente de , como um estimador 2SLS. Assim, sendo ei os resduos dessa estimao:
1 N
VN = Zi ei ei Z i
N i =1
Se se impuser que E(ui ui|Zi) = , com =2(IN JT) + v2INT = IN , como se
vem fazendo desde a seco 2.2, o estimador GMM ser equivalente ao estimador 3SLS
Z. Alis, segundo Mtys [1999], para que essa
dado por (5.2), mas com VN = Z
equivalncia entre 3SLS e GMM se verifique, basta que seja vlido o pressuposto de
inexistncia de heteroscedasticidade condicional (NCH No Conditional
Zi), o
Heteroskedasticity) relativamente aos instrumentos, i.e., que E(Ziui uiZi) = E(Zi
que menos restritivo que E(ui ui|Zi) = . Esta condio NCH permite igualmente a
utilizao do estimador GIV (referido na seco 3.2 a propsito do estimador de Arellano e
Bond [1991]) como um estimador GMM que e de forma anloga a (3.9), pode ser definido
como

( (
GIV = X 1Z Z 1Z )
1
Z 1X )
1
(
X 1Z Z 1Z )
1
Z 1Y

o que mais no que aplicar o mtodo das variveis instrumentais ao modelo (5.1) pr-
multiplicado por -, tendo como instrumentos -Zi (ou seja, depois de filtrar modelo e
instrumentos por -). Um mtodo regra geral equivalente, segundo Mtys [1999] o das

dependam de .

43
variveis instrumentais filtradas (FIV) em que o processo de filtragem por - se aplica
apenas a (5.1) e que consiste em:

(
FIV = X 1 2 Z(ZZ ) Z 1 2 X
1
)
1
X 1 2 Z (ZZ ) Z 1 2 Y
1

e que, mais uma vez, GMM, desde que vigore a condio NCH. Mas Mtys [1999]
mostra que, regra geral, a filtragem (que o equivalente aplicao de GLS no contexto
do OLS) no melhora a eficincia assimpttica do GMM e, assim, deve ser considerada
como irrelevante, no contexto da estimao, quer com efeitos fixos, quer com efeitos
aleatrios, desde que se explorem todas as condies de momentos. O mesmo acaba por
ser vlido para outro tipo de instrumentos com filtragem, como o estimador FF (Forward
Filtering) de Keane e Runkle [1992] e que aqui se omite para no alongar em demasia a
exposio.
De qualquer forma, pode ser demonstrado que, regra geral, os estimadores 3SLS,
FIV e FF no so superiores a um qualquer estimador GMM que faa uso de todas as
condies de momentos, que tem contra si apenas a questo de uma eventual
inexequibilidade. Um estimador GMM, que use todas as condies de momentos (lineares)
e uma matriz de ponderao irrestrita, com p instrumentos fracamente exgenos e uma
amostra de dimenso T, conta com p(1+2++T)=p(T+1)T/2 instrumentos (Mtys
[1999]).
Questo interessante, referida em Mtys [1999], a da determinao de uma
fronteira de eficincia para os estimadores GMM, i.e., se existir ou no um nmero
mximo de condies de momentos a partir do qual no ser possvel aumentar a eficincia
do estimador. A questo , por exemplo, analisada por Koenker e Machado [1997] que,
para modelos GMM lineares com heteroscedasticidade genrica, demonstram que basta
que o nmero de condies de momentos ou instrumentos cresa a um ritmo inferior a N1/3,
relacionando dessa forma a dimenso da amostra com o nmero de instrumentos.
De entre os estimadores GMM utilizados para regressores estritamente exgenos,
merecem destaque em termos de eficincia os apresentados em Hausman e Taylor [1981]
Breusch, Myzon e Schmidt [1989] e em Amemiya e Macurdy [1986] e que passaro a ser
notados por H-T, BMS e A-M, respectivamente. Considere-se, para esse efeito, o seguinte
modelo:
y it = x it + Z i + u it , u it = i + it (5.3)
em que Zi uma matriz de g variveis explicativas constantes no tempo.

44
Hausman e Taylor [1981] sugerem um estimador 2SLS eficiente para a estimao
dos vectores de parmetros e associados s matrizes de variveis explicativas Xit e Zi,
em que as duas matrizes podem incluir variveis ortogonais (X1it e Z1i) e outras
correlacionadas com os efeitos especficos i (X2it e Z2i). Em (5-3), as matrizes Xit, Zi, X1it,
X2it, Z1i e Z2i tm dimenso (k1), (g1), (k11), (k21), (g11) e (g21), respectivamente.
Neste contexto, de eventual correlao entre uma ou vrias variveis explicativas e
os efeitos especficos, sabe-se que os estimadores OLS, assim como os GLS, no so
consistentes e que os estimadores within sero consistentes, mesmo que ineficientes e no
permitiro a estimao dos parmetros contidos em .
Uma soluo proposta por H-T ser a estimao por OLS do modelo (5-3) pr-
multiplicado por -1/2, ou seja, aplicando um operador das primeiras diferenas
generalizadas (1-(1-)L), com dado por (2.9)37 e transformando as variveis X e Z
atravs da respectiva projeco ortogonal num espao A de variveis instrumentais X1it, Z1i
e respectivos vectores de mdias. Na prtica, tal significa, num primeiro passo, regredir Z2i
em X1it e Z1i (com N observaes) e X2i. (ou seja, as mdias amostrais para cada indivduo)
. Num segundo
em X1i. e Z1i. (mais uma vez, as mdias amostrais), obtendo-se Z 2i e X 2 i.

2 it = X 2 it X 2 i. + X
passo, substitui-se em (5.3), X2it e Z2i por, respectivamente, Z 2i e X 2i . e

estima-se por OLS a equao da resultante, previamente transformada por (1-(1-)L), em


que L usual operador de desfasamento. H-T chegam ainda a um resultado importante
quanto identificao dos parmetros e : h uma condio necessria de ordem,
segundo a qual os dois vectores sero identificados se o nmero de variveis exgenas X1
for igual ou superior ao nmero de variveis pr-determinadas Z2 38 (k1 g2).
Usando pressupostos mais restritivos quanto exogeneidade face aos efeitos
seccionais das variveis X1it e Z1i do que H-T (que apenas admite ausncia de correlao
entre as mdias destas variveis e os efeitos i), Amemiya e MaCurdy [1986] chegam a um
estimador IV mais eficiente. Assim, assumem que estas variveis no so correlacionadas
com i para todo o t, o que aumenta o leque de variveis instrumentais a incluir: no usam

37
Ou seja, = ( )
v2 v2 + T 2 .
38
Haver uma condio de necessria e suficiente de caracterstica, que consta de Hausman e Taylor [1981],
1385.

45
apenas as mdias de X1 e X2, mas tambm todos os valores desfasados do primeiro vector
de variveis, recursivamente.
Assumindo um pressuposto de exogeneidade ainda mais restritivo, Breusch, Myzon
e Schmidt [1989] deduzem um estimador IV com maior eficincia assimpttica. Para tal,
impem que os efeitos seccionais, para alm de respeitarem as condies impostas por H-T
e A-M, no exibiro correlao com os desvios em relao s mdias seccionais das
variveis X2, i.e., ainda que i e X2 possam estar correlacionadas, a sua covarincia
constante (ou seja, impem uma condio de estacionaridade). Assim, BMZ acrescentam
os desvios em relao s respectivas mdias de X2 ao lote de instrumentos propostos por
A-M, tambm de forma recursiva (ou seja, em T, teremos mais T-1 instrumentos, i.e., os
desvios at T-1). De acordo com Mtys [1999], qualquer um destes estimadores, H-T, A-
M e BMZ, faz parte da classe dos estimadores FIV (variveis instrumentais filtrados) e
ser equivalente ao estimador within, no caso exactamente identificado pela definio de
H-T (k1 = g2), ou mais eficiente no caso sobre-identificado (k1 > g2).
Mtys [1999] refere alguns estimadores que podero ser mais eficientes que os
estimadores H-T, A-M e BMZ, ao reconhecerem mais condies de momentos que as
utilizadas por estes autores, citando para o efeito os estimadores de Ahn e Schmidt (AS) e
Arellano e Bover (AB)39 e que na prtica significaro a estimao do modelo (5.3) usando
como instrumentos, para alm dos propostos H-T, A-M ou BMZ, as primeiras diferenas
disponveis at ao momento das variveis explicativas no correlacionadas com os efeitos
individuais, garantindo mais (T-1)(Tk1+g1)-k1 instrumentos. Apesar disso, Mtys [1999]
sustenta que, do ponto de vista prtico, os estimadores anteriores constituem boas
alternativas ao GMM.

5.2 Estimao GMM e Modelos Dinmicos

Os primeiros estimadores que podem ser referenciados como estimadores GMM


para modelos dinmicos com dados em painel so os j referidos AB e AS e que so
sumariamente expostos em Mtys [1999] e, com maior detalhe, em Baltagi [1995].
Considere-se uma especificao mais simples que a do modelo (3-13):

39
Ver Ahn e Schmidt [1995], Efficient Estimation of Dynamic Panel Data, Journal of Econometrics, 68, 5-
27 e Arellano e Bover [1995], Another Look at Instrumental Variables Estimation of Error-Components
Models, Journal of Econometrics, 68, 29-51, citados em Mtys [1999] e tambm em Baltagi [1995], sob a

46
yit = yi,t-1 + uit, com uit = i + vit (5.4)
em que os termos de perturbao e v tm ambos mdias nulas e em que se considera que
1. E(yi0)=0;
2. E(yi0 vit)=0, t;
3. E(i vit)=0, t;
4. os termos de perturbao vit no esto autocorrelacionados, para todo o i.
Destas condies, relativamente comuns na literatura dos modelos dinmicos em
painel, como nota Mtys [1999], pode-se retirar as T(T-1)/2 condies de momentos
E(yisuit)=0, para t=2,...,T e s=0,1,...,T-2 (5.5)
em que uit = vit vi,t-1 e que foram usadas em diversos textos relativos estimao por IV,
como Anderson e Hsiao [1981], Holtz-Eakin, Newey e Rosen [1988] e Arellano e Bond
[1991]. Ahn e Schmidt [1997], retomando o trabalho desenvolvido no seu artigo de 1995,
verificam que as hipteses 2-4 impem mais T-2 condies de momentos que as usadas
pelos outros autores e que a hiptese 1., relativa a yi0, desnecessariamente restritiva. As
condies de momentos adicionais so:
E(uiTuit) = 0, t=2,,T-1 (5.6)
As condies (5.5) e (5.6) vm directamente dos pressupostos de os vit no serem
correlacionados entre si, nem com os efeitos especficos, nem to pouco com yi0, no
necessitando da hiptese de homoscedasticidade. Para alm disso, os autores demonstram
que estas seriam a totalidade das condies de momentos relevantes mesmo para os casos
em que essas correlaes no so nulas, desde que sejam constantes (no que um
pressuposto de estacionaridade). As condies podem e devem ainda ser vistas sob a forma
de restries lineares sobre os elementos da matriz de covarincias de uit, t=0,1,,T:

u i1 11 12 L 1T 10
u 22 L 2T 20
i 2 21
= M = M M O M M

u iT T 1 T 2 L T 0 T 0
u i 0 10 20 L T 0 00

de tal forma que todos os elementos das ltimas linha e coluna (i0) so iguais entre si (T-1
restries) e que todos os restantes elementos fora da diagonal principal so tambm todos

forma de working papers.

47
iguais entre si (T(T-1)/2-1 condies)40. No entanto, como as condies emergentes de
(5.6) so no lineares em u, a utilizao deste mtodo GMM ter que levar a uma
ponderao entre os ganhos de eficincia permitidos e o acrscimo exigido na
complexidade computacional pela sua implementao.
No caso dos termos v serem homoscedsticos, como consta de Ahn e Schmidt
[1997], h que considerar um novo grupo de (T-1) novas condies de momentos dadas
genericamente por:
E (u i u it ) = 0, t = 2,..., T (5.7)

Para alm disso, como notam Ahn e Schmidt [1997], as condies (5.6) podem ser
substitudas por um idntico nmero de condies lineares dadas por
E(yi,t-2ui,t-1 yi,t-1uit ) = 0, t = 3,,T (5.8)
Como refere Mtys [1999], os ganhos de eficincia permitidos pelo pressuposto de
homoscedasticidade acabam por ser reduzidos, pelo que a condio pode ser dispensada,
tendo como contrapartida uma especificao mais robusta.
Vrias outros pressupostos podem ser acrescentados ou combinados, como
efectuado em Ahn e Schmidt [1997], dando origem a diferentes conjuntos de condies de
momentos. Uma condio que vale a pena analisar a de estacionaridade, como proposta
em Breusch, Mizon e Schmidt [1989], j aqui discutida e cujas consequncias em termos
de uma estrutura GMM so analisadas em Ahn e Schmidt [1997]. Na linha do que foi feito
por Arellano e Bover, Ahn e Schmidt41 impem que cov(i,yit ) seja constante, o que leva a
uma nova restrio:
0 = (1 ) ou de forma equivalente, 0t = ts (1 ) , para t,s=1,T; t s

e que resulta num conjunto T(T-1)/2 + (2T-2) de condies de momentos lineares em


dadas por (5.5) e, ainda,
E(uiTyit) = 0, t =1,,T-1
E(uityit ui,t-1yt-1) = 0, t=2,T
Ahn e Schmidt [1997] analisam ainda o caso do pressuposto de estacionaridade em
covarincia da srie yi0,,yiT e que leva a que as condies de momentos necessrias
estimao GMM sejam as contidas em (5.5) e ainda um nica condio no linear
adicional:

40
Isto , iguais a, respectivamente, 0 e 2.
41
Artigos citados em Baltagi [1995] e Mtys [1999].

48
E[yit2 + yi1ui2/(1-2) ui,2ui1/(1-2)] = 0
A partir do modelo (5.4), pode-se definir um estimador GMM eficiente da seguinte
forma:
- usam-se as condies de momentos (5.5), escrevendo-as na forma matricial
como E(Aiui()) = 0, com

y i0 0 0 L 0
y
i0 ( y i 0 , y i1 ) 0 L 0
0 ( yi 0 , y i1 ) ( y i 0 , yi1 , y i 2 ) L 0
Ai =
M M M O M
0 0 0 L ( y i 0 , y i1 ,..., y iT 2 )

0 0 0 L ( yi 0 , yi1 ,..., y iT 2 )
- as condies (5.8) podem ser escritas tambm da mesma forma, i.e., como
E(Biui()) = 0, em que

y i1 0 0 L 0
( y + y )
i1 i2 yi2 0 L 0
yi2 ( y i 2 + y i3 ) yi 3 L 0
Bi =
M M M O M
0 0 0 L ( yi ,T 2 + yi ,T 1 )

0 0 0 L y i ,T 1
- as l condies de momentos (5.6), (5.7) (quadrticas em ) e (5.8) podem ser
divididas em l1 condies lineares42 e l2 condies no lineares em ;
- as l1 condies lineares podem ser representadas recorrendo a Si, uma matriz
Tl1 com todas as colunas de Ai e Bi, que rene todos os instrumentos lineares
disponveis, da seguinte forma
E(fi()) = 0, com fi() = Siui() = f1i + f2i, em que f1i =Siyi e f2i= - Siyi,-1
- as restantes l2 condies no lineares podero ser representadas como uma
funo quadrtica, tal que E(gi())=0, com
gi() = g1i + g2i, + (Il2 )g3i
- um estimador eficiente pode ser obtido atravs de um mtodo GMM baseado
em todas as condies de momentos definidas por

42
O nmero de condies lineares, l1, ter que ser pelo menos igual ao nmero de parmetros a estimar (neste
caso, 1) para que estes sejam identificados.

49
f ( )
E[mi ( )] = E i = 0
g i ( )
- defina-se mN = N-1imi()43 e MN = mN / = [fN /, gN /] = [FN, GN] =
[f2N , g2i + 2(Il2 )g3i] e, ainda, M=plim MN = [plimFN , plimGN] e,
finalmente, como matriz de ponderao ptima
ff fg
= = lim cov N mi
gf gg N i

e que estimada de forma consistente por () ()


= N 1 m m ,
i i i
nomeadamente a partir das condies lineares fi;
- o estimador GMM, dGMM, resultar da minimizao de NmN() 1 mN() e ter
como matriz de covarincias assimpttica N1/2(dGMM ) = [M -1M]-1;
- a validade das condies de momentos E[mi()] = 0 pode ser testada atravs de
um teste convencional de sobre-identificao, recorrendo estatstica JN =
NmN(dGMM)mN(dGMM), com distribuio 2(l 1)44, sob a hiptese nula de todas
as condies serem simultaneamente vlidas;
- no caso de todas as condies de momentos serem lineares, o estimador GMM
eficiente (quando comparado com IV, por exemplo) tem uma soluo algbrica
fechada dada por df = -[f2N 2ff f2N]-1 f2N 2ff f1N .

- para o caso de o modelo a estimar conter tambm variveis exgenas, Xi (como


um termo independente), haveria que considerar um conjunto de condies de
)] = 0, em que = [ ] rene o conjunto dos parmetros
momentos E[Xiui(
a estimar. A matriz Si incluiria tambm as colunas de Xi e a estimao
prosseguiria de igual forma, com a ser usado em vez de e Wi = [yi,-1 Xi] (que
inclui todas as variveis explicativas do modelo, endgenas desfasadas ou
exgenas) em vez de yi,-1.
De um modo geral, Ahn e Schmidt [1997] mostram que h ganhos significativos a
alcanar pela introduo de condies de momentos no lineares (que conduzem
inevitavelmente a mtodos de estimao iterativos) e desenvolvem um conjunto de testes

43
Com fN, gN, f1N, f2N, g1N, g2N e g3N definidos de igual forma.
44
2(l-k) no caso de haver k regressores, exgenos ou pr-determinados.

50
para aferir a validade das referidas condies pela comparao entre os estimadores GMM
completos e estimadores GMM linearizados, de mais simples implementao.
Note-se, ainda, que o primeiro dos pressupostos, relativo a E(yi0), faz com que as
condies de momentos de primeira ordem (E(uit=0), com uit=i+vit) cessem de ser
informativas, na medida em que deixam de identificar univocamente , pelo que sempre
seria possvel obter estimadores GMM mais eficientes se se no restringisse yi0.
Nesse sentido, temos Crpon, Kramarz e Trognon [1997] que, admitindo condies
iniciais irrestritas para y, mostram como a eliminao de parmetros redundantes (nuisance
parameters)45 pode no ter qualquer efeito em termos de perda de eficincia. Para tal, basta
que se substituam os parmetros redundantes pelas respectivas contrapartes empricas, nas
condies de ortogonalidade.
Admita-se que o vector de parmetros a estimar, num modelo autorregressivo com
regressores exgenos, dado por , pode ser dividido num vector de parmetros relevantes,
e num vector de parmetros redundantes, . Crpon et al. [1997] mostram que os clculos
exigidos pela estimao GMM, baseada na totalidade das condies de ortogonalidade,
podem ser grandemente simplificados. Ao contrrio do GMM completo (em que os
parmetros redundantes, , tm que ser expressos em funo dos parmetros relevantes, ),
no GMM abreviado, as condies de momentos s necessitam de ser expressas com
relao aos parmetros , na medida em que os parmetros so substitudos por
estimativas obtidas por um estimador etpico consistente. O procedimento acaba por ser
anlogo ao usado na estimao por MLE, quando se opta pela concentrao da funo de
verosimilhana, ainda que a equivalncia assimpttica entre o procedimento GMM
completo e este abreviado s seja verdadeira caso se verifiquem certas condies e que
constam de Crepon et al. [1997] (proposio 2).

5.3 Concluses

Uma primeira concluso que se pode retirar da questo da estimao IV ou GMM


(que, como se viu, no exactamente coincidente, nomeadamente quando as condies de
momentos no so todas lineares) a de que ela tem, de facto, interesse quando se est a

45
O conjunto de parmetros a estimar pode ser dividido em duas categorias: uma de parmetros com
interesse econmico, como o coeficiente associado ao termo AR(1) do modelo (5.4); outra de parmetros

51
estimar modelos dinmicos com amostras em painel com uma dimenso temporal pequena.
Isto porque, com um grande nmero de observaes ao longo do tempo para um nmero
comparativamente pequeno de indivduos (ou unidades seccionais), os estimadores within
so consistentes, mesmo que no completamente eficientes. Depois, como mostrado em
Arellano e Bond [1991], entre outros, a quantidade de condies de momentos disponveis
aumenta quadraticamente em T, o que torna o peso computacional do GMM, para um T
elevado, demasiado oneroso.
Para a estimao de modelos lineares, o estimador GMM frequentemente assume a
forma de um estimador IV, o que particularmente verdadeiro se for vlido o pressuposto
de inexistncia de heteroscedasticidade condicional (NCH). A diferena entre o GMM e a
forma convencional de aplicao das variveis instrumentais tem que ver com a completa
identificao das condies de momentos impostas pelos pressupostos do modelo
subjacente que o GMM implica, em que algumas dessas condies de momentos podero
ser redundantes, logo, no contribuindo para a eficincia do estimador.
No caso concreto dos modelos dinmicos, a condio NCH necessariamente
insustentvel, caso se opte pela considerao da totalidade das condies de momentos
suscitadas pelos pressupostos de exogeneidade. Assim, na estimao de modelos
dinmicos com dados em painel, o estimador GMM eficiente no corresponder a um
estimador IV, tanto mais que muitas das condies em que se baseia so no lineares,
dando lugar a procedimentos de estimao iterativos.
A literatura GMM relativa estimao de modelos com dados em painel est a
atravessar um perodo de rpida expanso, pelo que esta reviso estar necessariamente
incompleta. Para alm disso, todos os tpicos relacionados com a estimao de modelos
no-lineares (dinmicos) com GMM foi propositadamente deixada de fora, sob pena de se
alongar indefinidamente a discusso. Uma boa reviso sobre o tema pode ser encontrada
em Mtys [1999], (captulo 9).

sem significado econmico relevante e cuja estimao dispensamos.

52
6. RAZES UNITRIAS E DADOS EM PAINEL

Desde o trabalho fundamental de Balestra e Nerlove [1966] que os modelos


dinmicos com dados em painel tm revelado uma crescente importncia na anlise
economtrica, na medida em que permitem uma abordagem mais abrangente de fenmenos
de ajustamento que no podem ser vistos de forma isolada. No entanto, devido pequena
dimenso temporal da maioria dos estudos com dados em painel (essencialmente na rea
da microeconometria), a maior parte dos modelos contem dinmicas homogneas e pouca
ateno foi dada, at ao momento, a modelos com dinmicas de ajustamento heterogneas
do ponto de vista individual e temporal. Com o avano da macroeconometria para a rea
das aplicaes com painis, a dimenso temporal destes tende a aumentar e novos
problemas se colocam, nomeadamente os relacionados com temas at ento tpicos das
sries temporais, como as razes unitrias e a cointegrao. A disponibilidade de painis46
com dimenses temporais alargadas pe em causa o pressuposto tradicional da
homogeneidade dinmica e suscitam tambm novas abordagens estimao (por exemplo,
devido inconsistncia dos estimadores por agregao (pooled estimators) em modelos
dinmicos heterogneos).
A literatura relativa s questes da estacionariedade das sries econmicas muito
extensa para estudos com amostras temporais mas ainda relativamente incipiente no que
toca sua relevncia em amostras em painel. Adicionalmente, muita da nfase tem sido
dada possibilidade de os dados em painel poderem ser usados como uma alternativa,
mais poderosa, aos habituais testes de razes unitrias47. Estes, regra geral, padecem de
reduzida potncia ou so apenas vlidos em circunstncias excessivamente restritivas para
serem de utilidade prtica. Uma forma de aumentar a potncia desses testes ser o aumento
da dimenso da amostra temporal, o que causa problemas como o aumento da
possibilidade de ocorrerem quebras de estruturas que sugiram, erradamente, razes
unitrias. A incluso de uma dimenso seccional amostra, em paralelo com a temporal,
uma forma de aumentar a sua dimenso sem o risco de quebras de estrutura, desde que se
modelize de forma conveniente a heterogeneidade individual.

46
Em boa verdade, os painis usados em estudos macroeconomtricos so aquilo a que a literatura chama de
pseudo painis (Im, Pesaran e Shin [1997]) ou cohorts (bandos) na medida em que resultam da
agregao de N sries temporais individuais e no da recolha simultnea de T observaes para N indivduos.
47
Heimonen [1999] um exemplo, com uma aplicao hiptese das paridades de poder de compra.

53
Diversos artigos exploram a utilizao de painis para testar a integrao de
variveis econmicas, como alternativa simples extenso de amostras temporais
(Maddala e Kim [1998]), de que se destacam os artigos de Levin e Lin [1992] e [1993] e o
de Im, Pesaran e Shin [1997].
Levin e Lin [1993] usam como hiptese nula a existncia de resduos integrados
para cada indivduo, contra a hiptese alternativa de todos os indivduos terem resduos
estacionrios. Assim, a hiptese nula impe uma restrio transversal entre as diversas
equaes individuais48 (cross-equation), sobre os coeficientes de autocorrelao parcial de
primeira ordem. Levin e Lin [1993] desenvolvem um teste de raiz unitria que pode
incorporar efeitos individuais e temporais especficos no termo independente e nos
restantes coeficientes e com uma estrutura de varincias e covarincias dos termos de
perturbao sem restries seccionais: a nica restrio ser a existncia ou no de uma
raiz unitria. A revelao deste trabalho acaba por ser a normalidade assimpttica das
estatsticas dos testes de raiz unitria e a sua super-consistncia na dimenso temporal, i.e.,
que a convergncia das estatsticas mais rpida para T do que para N. Mais, no
mesmo artigo, os autores recomendam os testes de estacionariedade especficos a dados em
painel para amostras de mdia dimenso, i.e., com 10<N<250 e 25<T<250, enquanto que
para amostras de grande dimenso temporal se recomendam os testes Augmented Dickey-
Fuller (ADF) tradicionais separadamente para cada srie individual. Para painis com
grande dimenso seccional, quando comparada com a temporal, os autores recomendam os
testes tradicionais da literatura de painis, como o de Holtz-Eakin, Newey e Rosen [1988],
que se ver adiante. Assim, de acordo com Levin e Lin [1993], desde que se utilizem
estimadores apropriados para a mdia e varincia, os valores crticos da distribuio
normal reduzida podero servir como boas aproximaes para os testes de raiz unitria
convencionais, com melhores resultados que os obtidos para cada srie temporal
isoladamente.
Maddala e Kim [1998] criticam, no entanto, os testes de Levin e Lin [1992] por
admitirem que o coeficiente associado ao termo autorregressivo no apresenta
heterogeneidade individual, ou seja, por terem como hiptese nula a no estacionariedade
simultnea de todos os processos geradores de dados individuais e, por isso, consideram
prefervel o procedimento proposto por Im, Pesaran e Shin [1997]. O teste proposto em

48
Intui-se que Levin e Lin [1993] adoptam a verso de Chamberlain [1984] da estimao com dados em

54
Levin e Lin [1993], no entanto, j admite que ocorra heterogeneidade no coeficiente
associado varivel dependente desfasada, sendo o caso com maior interesse o que recorre
ao seguinte modelo:
y it = 0 i + 1i t + i y i ,t 1 + u it

u it = it u it + it
j =0

em que se admite que o termo de perturbao u segue um processo ARMA invertvel e que
os processo geradores de dados individuais so mutuamente independentes ou apenas
dependentes atravs de um efeito temporal especfico agregado (t). O modelo admite,
ento, heterogeneidade individual ao nvel do termo independente e do trend temporal. O
teste consiste nos seguintes passos:
(i) remover os efeitos temporais agregados atravs da transformao do modelo para a
forma de diferenas em relao mdia seccional (y*it=yit y.t);
pi
(ii) estimar N regresses separadamente do tipo y it = 10i + 11i t + 1il y i ,t 1 + u1it e
l =1

pi
y it = 20i + 21i t + 2il y i ,t 1 + u 2it , obter os respectivos resduos, eit e vit e, de
l =1

seguida, estimar eit = i v i ,t 1 + it ;

(iii) estimar o rcio dos desvios padro de curto prazo relativamente aos de longo prazo
para cada indivduo e calcular o rcio mdio para o painel dados por
yi 1 N
1 T k
L 1 T
s i =
ei
e S =
N
s
i =1
i , em que y2i =
T 1 t =2
y it2 + 2
l =1 k + 1 T 1 t =2+l
yit yi ,t l 49

(eit i vi ,t 1 )2 ;
T
1
e e2i =
T pi 1 t = pi + 2

(iv) calcular a estatstica do teste:


~
RSE ( ) NT S RSE( ) m T~ 2
~ N (0 ,1)
a

t =

(6.1)
mT
~

onde,

painel mediante um sistema de n equaes individuais.


49
A dimenso ptima do truncation lag k dada em anexo por Levin e Lin [1993].

55
N T

~e ~v it i ,t 1

~ (eit vi ,t 1 ) , RSE( ) =
N T
1 N T ~
v~
i =1 t = 2 + pi ~
= , e2i =
2 2
N T i ,t 1 ,
v 2 NT i =1 t = pi + 2 i =1 t = pi + 2
i ,t 1
i =1 t = 2 + pi

e v 1 N

p
~
ei ,t = it , v~i ,t = it , T = T
~ 1
ei ei
i
N i =1

e em que os valores para os parmetros com * em sobrescrito, obtidos por simulaes de


Monte Carlo, podem ser encontrados em anexo ao artigo referido. A convergncia em
distribuio da estatstica (6.1) entendida para T apenas devido ao j referido
resultado de super-consistncia.
A principal deficincia que se pode encontrar neste teste de Levin e Lin [1993]
acaba por ser, no como dizem Maddala e Kim [1998], o de no considerarem
heterogeneidade individual ao nvel dos coeficientes associados aos termos
50
autorregressivos, que se viu ter em conta nesta verso revista , mas sim o de restringirem
de forma excessiva a estrutura de correlaes ao nvel seccional, renegando a prpria
natureza dos dados em painel. Nesse sentido, o teste de Levin e Lin no pode ser
considerado como um verdadeiro teste de razes unitrias com dados em painel.
O teste de Im, Pesaran e Shin [1997], IPS, tem como hiptese nula a no
estacionariedade das sries temporais individuais e recorre a um procedimento assente na
mdia das estatsticas LM (multiplicador de Lagrange) para cada grupo presente no painel.
O teste menos restritivo que o de Levin e Lin [1993] em termos de heterogeneidade das
dinmicas e das estrutura de varincias inter-grupos e em termos de velocidade de
convergncia das dimenses temporal e seccional (exige apenas que N/Tk0 e no
N/T0, como em Levin e Lin [1993]). Adicionalmente, o teste IPS permanece consistente
mesmo que a hiptese alternativa admita que uma parcela das sries individuais exibe
razes unitrias. Segundo os seus autores, o teste IPS relativamente robusto perante
diferentes configuraes em termos de trends e de estruturas de varincias e covarincias
dos termos de perturbao.
O teste IPS, na sua verso base, parte de um modelo tpico de um teste Dickey-
Fuller (DF):
y it = i + i y i ,t 1 + i ,t

50
Maddala e Kim [1998] provavelmente referiam-se primeira verso do teste em Levin e Lin [1992].

56
e tem como hipteses nula e alternativa, respectivamente:
H0:i=0 , i
H1:i<0 , i=1,N1
i=0 , i=N1+1, ,N
ou seja, em que se admite como alternativa que nem todas os processos geradores de dados
individuais sejam estacionrios.
A estatstica do teste construda com base nas estatsticas LM para os testes
individuais de i=0 e que so:
Ty i Pi y i
LM iT =
y i M T y i

M T = I T i T (i T i T ) i T
1
em que se tem como matrizes idempotentes e

P = MT yi ,1(yi ,1MT yi ,1 ) yi ,1MT .


1

N
1
A mdia das estatsticas, dada por LM =
N
LM
i =1
iT servir de base estatstica

normalizada

LM =
(
N LM NT E (T ) ) ~ N (0,1)
a
(6.2)51
Var (T )

em que (T) e Var(T) so parmetros fornecidos em Im, Pesaran e Shin [1997] e obtidos
mediante simulaes de Monte Carlo.
Para painis com dinmicas heterogneas e erros autocorrelacionados, de longe o
caso mais interessante, o teste IPS apenas ligeiramente mais elaborado, partindo um
modelo AR(pi+1), o que leva a que as N equaes ADF52 possam ser escritas da seguinte
forma:
pi
y it = i + i y i ,t 1 + ij y i ,t j + it ; i = 1,K , N ; t = 1,K , T
j =1

ou na forma matricial equivalente:


y i = i y i + Qi i + i ;
[
= i

]
i1 i 2 K ipi e Qi = i T [ y i ,1 y i ,2 K y i , pi ]

51
A convergncia em distribuio suficiente para N, com T3.
52
O teste ADF dever ser usado quando os termos de perturbao da regresso DF exibem autocorrelao.

57
Sob a hiptese da independncia dos termos de perturbao idiossincrticos, it, que
tero que ser estacionrios na varincia (ainda que possam ser seccionalmente
heteroscedsticos) e conhecidos os pontos de partida yi0 (estocsticos ou determinsticos),
tem-se que a estatstica definida em (6.2) converge fracamente53 para uma distribuio
normal reduzida (Teorema 4-1 em Im, Pesaran e Shin [1997]). Para calcular (6.2) deve
agora usar-se:
Ty i Pi y i
LM iT =
y i M Qi y i

em que se tem como matrizes idempotentes de ordem (TT) e caracterstica (T-pi-1)


1
(
M Qi = I T Q i (Q i Q i ) Qi e Pi = M Qi y i ,1 y i ,1M Qi y i , 1 )
1
y i ,1M Qi .

Os mesmos procedimentos (DF e ADF) podem ser aplicados a um modelo com


efeitos temporais especficos, denunciando um certo grau de dependncia entre os grupos,
desde que sejam aplicados s respectivas equaes expressas em desvios face s mdias
seccionais54 (o que cria uma correlao cruzada entre os erros). Os testes passam, no
entanto, a ser estritamente vlidos apenas assimptoticamente (independentemente do
pressuposto da normalidade). A estatstica LM mantm-se, mas LM dado por:


2
T ~
yi MT ~ y i ,1

LM iT =
~
y M ~ y ~
y M ~ y
i T i i ,1 T i ,1
onde as variveis esto expressas na forma de desvios face s T mdias seccionais e MT
mantm a mesma composio.
Segundo Im, Pesaran e Shin [1997], o teste revela-se relativamente robusto face a
potenciais ms especificaes das componentes temporais, comparando com os testes
correntes em estudos de sries temporais e a estruturas alternativas para as correlaes
entre os termos de perturbao, no sendo apenas vlidos para modelos de efeitos
temporais com heterogeneidade seccional (tipo it).
Um outro teste que sugerido por Maddala e Kim [1998] o teste de Fisher55 e que
consiste numa combinao da evidncia fornecida por diversos testes independentes. O

53
Convergncia fraca sinnimo de convergncia em probabilidade (Amemiya [1985]).
N
1
54
Ter-se-ia que trabalhar com ~
yit = yit
N
y
j =1
jt , etc.
55
O teste deve-se a Fisher, R.A. [1932]. Statiscal Methods for Research Workers, 2nd Edition, Wiley: New

58
teste consiste na realizao de N testes de raiz unitria para cada um dos indivduos no
painel e obter o respectivo p-value, sendo a estatstica P= -2ln(pi) com distribuio
exacta 2(2N) usada para efeitos de teste da hiptese nula de razes unitrias. Este teste,
tambm conhecido por teste P de Pearson e que detalhado em Maddala [1977] (pg. 47-
8)56 tem a vantagem de ser relativamente simples na sua implementao, ainda que exija a
determinao dos p-values por simulaes de Monte Carlo.
Finalmente, para painis curtos de usar o teste de Holtz-Eakin, Newey e Rosen
[1988], H-ENR, que consiste na estimao de um modelo autorregressivo (com ou sem
variveis exgenas) atravs de um mtodo GMM. Holzt-Eakin et al. [1988] sugerem que
se estime, por 2SLS, um modelo autorregressivo como (5-4) nas primeiras diferenas,
usando como instrumentos para yi,t-1, o vector Zt = [1,yi,t-2,yi,t-3,,yi,1]. Se os efeitos
especficos variarem no tempo, i.e., se forem do tipo ti, haver que proceder a uma
quasi-diferenciao do modelo, usando em vez das primeiras diferenas: yi,t (t/t-1)yi,t-1.
Holtz-Eakin et al. [1988] defendem que se use uma verso 3SLS, onde se efectua uma
correco GLS. O teste H-ENR pode ser usado para testar a estacionaridade dos
parmetros, a existncia de razes unitrias ou explosivas na equao autorregressiva, a
dimenso do truncation lag ou o sentido da causalidade Granger, num contexto VAR.
Qualquer um destes testes pode ser visto como um teste a restries lineares sobre os
parmetros do modelo, reunidos num vector (k1). A hiptese nula do teste
H0: = H + G
em que H e G so matrizes de restries lineares e o vector de parmetros (g1) com
restries (de dimenso necessariamente inferior de ). O teste necessita que se estime o
modelo sem restries e com as restries dadas por H0, retendo-se as somas dos
quadrados dos resduos para ambos os caso, ou seja, Q e Qr. Sob H0 e com N:
L = Qr Q ~ 2(J) e J = (k-g) (z-k)
em que z o nmero de instrumentos usados para estimar (Holtz-Eakin et al. [1988],
1381).
Um problema comum a qualquer teste de estacionariedade o da seleco da
dimenso do desfasamento, i.e., da escolha do truncation lag, questo j amplamente

York, citado em Maddala e Kim [1998]. Este mesmo teste poder ser usado em contextos totalmente
diferentes, como se prope, na seco 8.3, para testar uma estrutura particular de heteroscedasticidade.
56
C.f. Maddala [1977], 48,n.

59
explorada no mbito das sries temporais e que, para j, suscita as seguintes linhas de
orientao:
- o nmero de termos desfasados no teste ADF, por exemplo, deve ser o
suficiente para garantir a ausncia de autocorrelao nos resduos da regresso
de suporte do referido teste;
- a existncia de termos MA negativos e de dimenso assinalvel tende a exigir
um aumento do nmero de termos autorregressivos;
- ao invs de se adoptar uma regra determinstica comum para a seleco do
nmero de desfasamentos, deve-se fazer recair a escolha em critrios assentes
nos prprios dados (Maddala e Kim [1998]).
De qualquer forma, segundo Heimonen [1999], a escolha da dimenso do
desfasamento a utilizar em teste de razes unitrias com dados em painel ser de menor
importncia, na medida em que a inferncia parece largamente independente do nmero de
termos autorregressivos. Este autor e Maddala e Kim [1998], por exemplo, sugerem o
seguinte critrio, dito de Schwert, para dados trimestrais e mensais, respectivamente57:
T 1 4
l 4 = int 4
100

T 1 12
l12 = int 12
100

No entanto, Im, Pesaran e Shin [1997] previnem contra os efeitos prejudiciais de
uma subestimao da dimenso do desfasamento a usar no seu teste IPS, pelo que
aconselham a utilizao de um nmero considervel de termos autorregressivos, para o que
conviria uma regra do tipo general-to-specific de Hendry.
Como resumo, pode-se prescrever a seguinte linha de aco:
- para painis curtos, deve-se usar o teste de Holtz-Eakin, Newey e Rosen [1988];
- para painis de dimenso intermdia, pode-se escolher entre o teste de Levin e
Lin [1993] e o teste de Im, Pesaran e Shin [1997], dando preferncia ao
primeiro, quando a dimenso temporal domina e ao segundo, no caso inverso;
- para painis longos (T>250), no de excluir a utilizao dos testes ADF, DF
ou Phillips-Perron, num enquadramento tpico de time series.

57
O critrio deve-se a Schwert, G.W. [1989], Tests for unit roots: a Monte Carlo investigation, Journal of
Business and Economic Statistics, 7, 147-59.

60
7. DADOS DISCRETOS

7.1 Modelos Estticos de Escolha Binria: uma introduo

Como se viu, os modelos desenvolvidos para analisar dados seccionais cometem


invariavelmente o pecado original de ignorar as diferenas individuais, tratando os efeitos
individuais de forma agregada, apenas, relegando os efeitos provenientes de variveis
omitidas para acontecimentos puramente aleatrios. Os dados em painel, pelo seu contedo
relativo s dinmicas individuais intertemporais, permitem separar um modelo de
comportamentos individuais de um modelo do comportamento mdio de um grupo de
indivduos. Assim, podemos considerar as usuais fontes de heterogeneidade seccional e
temporal, ou ambas com distintas naturezas, fixa e aleatria. A maior parte dos
resultados apresentados neste captulo vm de Hsiao [1986], seco 7.4.
Considere-se, ento, o seguinte modelo genrico:
y it = x it + uit
1 y it > 0 (7.1)
y it =
0 y it 0

Para no complicar a exposio, opta-se por abordar apenas os modelos com efeitos
individuais, quer fixos, quer aleatrios, que ser capturada pelo termo de perturbao uit =
i + vit. No caso dos efeitos fixos, temos Var(uit|i) = Var(vit) = v2 e, no caso de efeitos
aleatrios, temos E(i) = E(vit) = 0 e i e vit independentes. Admite-se, ainda, que uit ter
uma distribuio F, que pode ser a logstica () ou a normal reduzida ().
Assim, a existncia destes componentes no observveis permite que indivduos
homogneos, i.e., com as mesmas caractersticas observveis (expressas pela sua funo de
reaco), sejam heterogneos nas suas respostas.

i. Modelo de Efeitos Fixos

Tal como para os modelos convencionais, admite-se que os efeitos individuais i


so no aleatrios, pelo que temos Var(uit|i) = Var(vit) = v2 = 1 (por normalizao). A
estimao de = [i ; ] a partir de Prob(yit = 1) = F(
xit + i) efectuada por MLE, que
ser consistente quando T. No entanto, no este o caso mais comum nos estudos com

61
dados em painel, em que T usualmente pequeno e, no caso de T fixo, o estimador MLE
de i no consistente, mesmo que N: o recorrente problema do parmetro acidental
(por oposio aos parmetros estruturais que no variam de indivduo), cuja estimao
no ter significado se for apenas avaliada pelas suas propriedades assimptticas.
Resta, pois, estimar : o problema que se coloca neste enquadramento que a
estimao deste no independente da estimao de i, ou seja, a inconsistncia de i,MLE

transmitida para
MLE , mesmo que N, mas T fixo.58
Cumpre ento encontrar condies para a existncia de um estimador consistente de
. Um princpio geral ser o de Neyman-Scott, segundo o qual preciso encontrar funes
(y1,,yN |
) independentes de e que convirjam em probabilidade para zero (com

obtido resolvendo (y1,,yN


N), quando avaliado no seu valor real. Assim,

) = 0, sendo consistente, sob determinadas condies de regularidade. Uma forma


|
expedita de encontrar tal funo para os modelos probit e logit determinar

f(y i | , i )
f(y i | , i ) = , com g( i | , i ) > 0 (7.2)
g( i | , i )

que no depende de i e, a partir da, construir a funo de densidade conjunta

N
(y 1 , K , y N | , 1 , K , N ) = f(y i | , i ) (7.3)
i =1

cuja maximizao resultar num estimador consistente de . A demonstrao da existncia


de um estimador consistente de pode ser encontrada em Hsiao [1986],162-3 para uma
especificao logit. No entanto, o mesmo autor alerta para o facto de no parecer existir
um estimador consistente para o modelo probit. Assim, atendendo ao facto de ser possvel
encontrar diversos estimadores consistentes de no caso logit, atravs de algumas simples
transformaes (que passam pela maximizao de uma funo de verosimilhana
condicionada por uma qualquer estatstica suficiente mnima de yit, como yit) e de, nos
modelos univariados, os resultados do logit no diferirem muito dos do probit59, tudo
aponta para que se favorea a especificao logit em detrimento da probit.

58
Veja-se uma prova em Hsiao[1986],160.
59
Podendo ser convertidos pela relao de Amemiya:
1.6
L P

62
J no que toca aos modelos de regresso mltipla, os resultados podem variar
muito, consoante sejam obtidos por logit ou probit, da que no seja despicienda a questo
da escolha da especificao. Ainda que a evidncia no seja muito slida, os estudos de
Monte Carlo realizados para o modelo probit apontam para um enviesamento
relativamente pequeno (sempre inferior a 10%) e que ser tanto menor, quanto menor a
escala de variao dos efeitos fixos (Hsiao [1986]).

ii. Modelo de Efeitos Aleatrios

Assume-se um modelo em que os efeitos individuais i so aleatrios, mas


independentes de xi, tendo uma distribuio H, condicionada por um conjunto finito de
parmetros . A funo logartmica de verosimilhana ser:

[ ]
N 1 yit
ln L = ln F( x it + ) yit 1 F( x it + ) d H( | ) (7.4)
i =1

em que F(.) a distribuio marginal de y em . Como lnL uma funo de um conjunto


, ] finito de parmetros, sob algumas condies de regularidade, a sua maximizao
[
resultar em estimadores consistentes de e , quando N.
Um modelo mais geral considerar uma eventual correlao entre i e xi (pelo que
o procedimento anterior, ao omitir i, no ser consistente), fazendo i = xi + i, com
=(
1,, T) e xi=( xi1,, xiT), sendo E(i|xi) linear e i independente de xi e com
funo de distribuio H*. A funo de verosimilhana

[ ]
N 1 y it
ln L = ln F( x it + x i + ) yit 1 F( x it + x i + ) d H ( ) (7.5)
i =1

e, caso se pressuponha que F a normal reduzida e H* uma distribuio normal de mdia


zero e varincia 2, resultar numa especificao probit multivariada: yit = 1 xit +
xi + i + uit > 0 e (ui + ii) ~ N(0, IT + 2ii). Os estimadores resultantes sero
consistentes.

63
7.2 Modelos Dinmicos de Escolha Binria

Admite-se, agora, que a probabilidade de um indivduo alterar ou manter um dado


estado no independente da sua experincia passada. Um modelo de anlise das relaes
intertemporais entre variveis discretas pode ser especificado da seguinte forma:
t 1 t 1 s
y it = x it + p y i ,t p + y i ,t p + u it
p =1 s =1 p =1
(7.6)
yit = 1 y > 0
it

yit = 0 yit 0

em que uit independente de xit e independentemente distribudo sobre i, com matriz de


varincias e covarincias intertemporal E(uiui) = e p o coeficiente de resposta de y*it
experincia ocorrida p perodos atrs. A potencial heterogeneidade dos indivduos
permitida atravs de uit = i + vit.
Os modelos de escolha binria dinmicos suscitam, de imediato, duas questes:
como tratar as observaes iniciais yi0;
como distinguir uma real dependncia intertemporal das decises de
uma dependncia meramente espria.
A primeira questo importa para a derivao de estimadores consistentes e a
segunda vai retirar a sua importncia do facto de um dado acontecimento observado poder
ter ocorrido devido a uma dada experincia passada que alterou um comportamento
individual ou devido a uma sucesso de perturbaes no observveis e correlacionadas ao
longo do tempo (i.e., a um puro acaso) ou, ainda, devido a uma combinao das duas.

i. Condies iniciais (ou histria pr-amostral):

Para simplificar a exposio, considere-se um modelo AR(1) com termo


independente, i.e., que xit = 0, p = 1 e = 0, sobre o qual se assume, alternativamente:
(1) yi0 exgeno; (2) o processo est em equilbrio.
(1) implica que a funo de probabilidade conjunta de yi = {yi1,,yiT}, condicionada
por i, seja
T T

F( yit | yi,t 1 ,i ) =(0 + yi,t 1 + i )(2 yit 1)


t =1 t =1
(7.7)

em que a funo de distribuio de probabilidade normal.

64
(2) implica que a probabilidade marginal limite de yit = 1 e a funo de
probabilidade conjunta de yi, condicionadas por i, sejam, respectivamente
( 0 + i )
Pi = e
1 ( 0 + + i ) + ( 0 + i )
(7.8)
| yi ,t 1 , i ) = { ( 0 + y i ,t 1 + i )(2 yit 1)}Pi (1 Pi )
T T

F( y
t =1
it
t =1
yi 0 1 yi 0

Caso i seja aleatrio com distribuio G(), as funes de verosimilhana sob as


hipteses (1) e (2) so, respectivamente, segundo Hsiao [1986]:

L = { ( 0 + yi ,t 1 + )(2 yit 1)}d G( ) e


N T

i =1 t =1
(7.9)
L = { ( 0 + yi ,t 1 + )(2 yit 1)}Pi (1 Pi )
N T
1 yi 0
yi 0
d G( )
i =1 t =1

Quando i aleatrio, os estimadores MLE de 0, e 2 so consistentes, desde


que N. Na especificao com efeitos fixos, os estimadores MLE s sero consistentes
no caso semi-assimpttico T, sendo o enviesamento grande, quando T fixo, de acordo
com a evidncia emprica existente60.
No entanto, o pressuposto de que yi0 seja exgeno no vlido se as perturbaes
forem autocorrelacionadas e/ou o processo em curso se tiver iniciado antes do incio da
amostra. Tambm o pressuposto do estado de equilbrio inaceitvel quando o processo
estocstico influenciado por variveis exgenas temporais.
Com yi0 endgeno, as funes de verosimilhana para os modelos de efeitos fixos e
aleatrios so, respectivamente:

L = { ( 0 + yi ,t 1 + i )(2 y it 1)}f( yi 0 | i ) e
N T

i =1 t =1
(7.10)
L = { ( 0 + y i ,t 1 + )(2 y it 1)}f( y i 0 | )d G( )
N T

i =1 t =1

em que f(yi0|i) a probabilidade marginal de yi0 condicionada por i. O problema que a


maximizao de qualquer uma das referidas funes de verosimilhana relativamente
complexa, pelo que foi proposta uma aproximao (que Hsiao[1986] atribui a Heckman),
com resultados bastantes aceitveis e que consiste em:

60
Hsiao [1986], pg. 170

65
1. aproximar a probabilidade de yi0 atravs de um modelo probit y*i0 = Q(xit) + it,
com yi0 = 1 se y*i0 >0, yi0 = 0 se y*i0 0 e it ~N(0,1);

2. permitir que it seja livremente correlacionado com uit, t =1,,T;

estimar o modelo (7.6) sem restries entre os parmetros do modelo, na forma


yi0

ii. Dependncia intertemporal:

A segunda questo, da dependncia intertemporal com sentido causal vs. uma

que as experincias passadas afectam de forma determinante as experincias futuras


porque exercem um efeito comportamental: um indivduo que tenha experimentado uma

desempregado no futuro do que um indivduo idntico em tudo o resto, mas que no tenha
estado desempregado. A segunda diz-nos que tal relao apenas aparente porque a
proxy para uma heterogeneidade que radica em

situao de dependncia temporal, uma vez que um indivduo experimentou um dado


acontecimento, as suas preferncias alteram-se de tal forma que se comportar de forma

mesmo acontecimento no passado. No caso de dependncia espria, a experincia no tem


qualquer efeito na probabilidade de um indivduo experimentar um acontecimento no
futuro, mas, na medida em que os indivduos revelam uma heterogeneidade que no pode
ser representa atravs de variveis observveis, a incluso da varivel dependente
desfasada como varivel explicativa (i.e., a experincia passada) ser uma proxy para essas
variveis seccionais no observveis.
A importncia prtica desta questo maior do que pode parecer primeira vista e
pode ser exemplificada da seguinte forma: perante um problema de poltica de emprego, se
considerarmos vlida a dependncia intertemporal, estamos a sancionar uma poltica activa
de diminuio do desemprego no curto prazo pois, as polticas conjunturais de estmulo da
procura agregada provocaro uma reduo da taxa de desemprego de longo prazo; j se
considerarmos que a dependncia espria, as polticas de curto prazo no tero qualquer
efeito sobre a taxa de desemprego estrutural. Assim, torna-se crucial testar a hiptese de

66
dependncia intertemporal real vs. espria, o que ser apesar de tudo complicado, quando
existe heterogeneidade (efeitos individuais). De facto, se o modelo contiver efeitos
individuais aleatrios, mesmo que no haja dependncia intertemporal, teremos P(yit | xit,
yi,t-1) P(yit | xit). S no caso de no existir heterogeneidade que a inexistncia de
dependncia ser equivalente a P(yit | it, i,t-1) = P( it | it).

[1995],187, consiste em adoptar o modelo P( it = 1|


xit, yi,t-1) = F(xit + yi,t-1) e testar H0: = 0 usando os habituais testes LM. Se no
rejeitarmos H0, ignora-se a questo da heterogeneidade e prossegue-se com a estimao
pelos mtodos convencionalmente utilizados com amostras seccionais. Se rejeitarmos Ho,
temos que apurar se estamos perante dependncia intertemporal real ou heterogeneidade:
uma forma de o fazer prosseguir com o teste, mas condicionado pelos efeitos individuais.
Ou seja, desde que os termos de perturbao vit no estejam autocorrelacionados (no
modelo condicionado por i), pode-se testar = 0, no modelo P(yit = 1 | xit, yi,t-1,i) =
F(xit + yi,t-1+i). Quando subsiste autocorrelao no modelo condicionado pelos efeitos
individuais, sugere-se um mtodo avanado por Chamberlain [1984] e que consiste em
testar, para o modelo condicionado pelos efeitos individuais i:

H0: P(yit = 1 | xit, yi,t-1,i) = F(xit +pxt-pp + yi,t-1+i) ausncia de dependncia


intertemporal;
H1: P(yit = 1 | xit, yi,t-1,i) F(xit +pxt-pp + yi,t-1+i) existncia de dependncia
intertemporal.

Ainda que seja uma forma eficiente de distinguir a existncia de dependncia


intertemporal da heterogeneidade e autocorrelao, o teste no permite avanar quanto s
diferentes formas dos referidos fenmenos, o que exigiria especificaes mais
pormenorizadas.

67
8. Miscelnea de Temas

O objectivo da presente seco apresentar uma pequena reviso, no apenas de


alguns dos artigos mais importantes, mesmo fundadores, da anlise economtrica de dados
em painel, mas tambm de alguns artigos mais recentes e que podero fornecer pistas
quanto evoluo futura do tema. O captulo termina com um apanhado breve de alguns
testes de especificao existentes para modelos que usem dados em painel.

8.1 ALGUNS ARTIGOS FUNDAMENTAIS

Em Balestra e Nerlove [1966], artigo j citado acima, desenvolvido um modelo


dinmico para a procura de gs natural, discutida a sua especificao e avanados alguns
mtodos de estimao. Trata-se de um artigo fundamental e, de certa forma, pioneiro na
sua abordagem dos mtodos de estimao IV em modelos com efeitos aleatrios. Os
autores comeam por justificar a utilizao de um modelo dinmico para a especificao
de uma equao de procura de gs natural pois, esta depende do stock de equipamento
consumidor de gs. Assim sendo, propem uma funo de procura de gs em que o
consumo total de gs a varivel dependente e usam como variveis explicativas: o preo
relativo do gs, a varivel dependente desfasada, a populao e o rendimento per capita.
Confrontados com resultados de estimao OLS no conformes com a teoria
econmica, nomeadamente quanto ao parmetro associado ao termo autorregressivo
(aproximadamente 1), os autores levantam a questo de tal ser resultado de uma m
especificao pela omisso de uma eventual heterogeneidade seccional, cujo efeito seria
captado pela varivel dependente desfasada. Adoptando uma especificao com efeitos
aleatrios, Balestra e Nerlove [1966] notaram que os estimadores GLS ou FGLS
convencionais no eram aplicveis na presena da varivel autorregressiva.
Assim, os autores sugerem um mtodo IV que use como variveis instrumentais as
variveis exgenas desfasadas, uma vez que estas cumprem o princpio de Theil para as
variveis instrumentais, segundo o qual devem ser escolhidas as combinaes lineares de
variveis exgenas mais fortemente correlacionadas com a varivel pr-determinada que
vo substituir.

68
Nerlove [1971], constatando por um lado a importncia de tirar partido das
vantagens dos dados em painel no estudo das dinmicas comportamentais e, por outro, o
problema colocado estimao pela pouca profundidade seccional da maior parte das
amostras temporais, estuda o enviesamento dos mtodos OLS, LSDV, GLS, FGLS, IV e
MLE (que evidencia uma tendncia para fornecer solues de canto, levando a um
estimador inconsistente da matriz de covarincias dos termos de perturbao). Apesar de
tudo e com base em estudos de Monte Carlo, o autor d preferncia ao mtodo FGLS (com
estimado por OLS) pelo seu pequeno enviesamento e menor erro quadrtico mdio e
chama a ateno para os problemas do MLE.
Nickell [1981] deriva a expresso analtica do enviesamento assimpttico do
estimador LSDV no modelo dinmico de efeitos fixos, quando T fixo e conclui que este
pode ser muito significativo, ainda que a introduo de variveis exgenas o diminua, sem
nunca o eliminar. No entanto, o enviesamento diminui e tende para zero, quando T
aumenta, mas ser tanto maior quanto mais prximo da unidade estiver o parmetro
associado varivel dependente desfasada.
Bhargava e Sargan [1983] advogam a utilizao de mtodos de estimao de
equaes simultneas nos modelos dinmicos com efeitos aleatrios, especialmente os
mtodos de mxima verosimilhana com informao limitada (LIML), comparando as
diversas hipteses para a primeira observao (exgena ou endgena).
Anderson e Hsiao [1982] exploram a importncia das hipteses relativas s
primeiras observaes, no apenas para as propriedades assimptticas dos estimadores,
mas tambm para a prpria interpretao das estimativas. Outra questo abordada da
dependncia intertemporal vs. autocorrelao e avanam com um mtodo de estimao
MLE de modelos dinmicos com autocorrelao. Como os mtodos MLE so
relativamente difceis de implementar, os autores sugerem um mtodo GLS (ou FGLS),
que lhe assimptoticamente equivalente.

8.2 TEMAS RECENTES SOBRE ESTIMAO COM DADOS EM PAINEL

Em termos de literatura mais recente, citam-se desde logo quatro artigos (working
papers) que, admite-se, possam indiciar futuros desenvolvimentos.
Assim, Judson e Owen [1996] exploram os problemas especficos estimao de
modelos macroeconmicos com dados em painel, tipicamente com N pequeno e T grande e

69
numa especificao com efeitos fixos, concluindo que o melhor mtodo de estimao varia
muito consoante a dimenso do painel. De acordo com as simulaes realizadas, as autoras
avanam que o enviesamento do LSDV no de forma alguma irrelevante quando N
fixo: o aumento da dimenso temporal parece reduzir pouco o enviesamento.
O estudo justifica ainda a escolha de uma especificao com efeitos fixos por duas
ordens de razes: (1) porque se os efeitos individuais representam variveis omitidas,
muito provvel que estas se encontrem correlacionadas com os restantes regressores; (2)
como os painis na macroeconomia, apesar da pequena dimenso seccional, incluem muito
provavelmente a maior parte dos indivduos da populao, a hiptese de serem uma
amostra aleatria de uma populao de pases muito maior no tem cabimento. O objectivo
acaba por ser a comparao de diversos estimadores disponveis para esta especificao
LSDV, Anderson-Hsiao, Arellano-Bond e OLS concluindo-se que:
o estimador OLS apresenta-se fortemente enviesado, particularmente para o parmetro
associado varivel dependente desfasada (ainda que, ao contrrio dos restantes
estimadores, apresente um enviesamento significativo para ), mesmo quando T
aumenta;
o LSDV comporta-se exactamente da maneira prevista por Nickell [1981], ainda que
no aumente de eficincia medida que T aumenta. Assim, as autoras defendem a
utilizao de estimadores com melhor relao enviesamento-eficincia;
sugerido um mtodo LSDV corrigido pelo enviesamento (atravs de uma frmula
anloga apresentada por Nickell [1981]) e que se apresenta como o mais eficiente;
O estimador Anderson-Hsiao considerado o melhor, do ponto de vista do
enviesamento mdio, ainda que seja pouco eficiente para amostras com T pequeno.

Como a eficincia do estimador Anderson-Hsiao aumenta sensivelmente com T e


devido sua simplicidade, o estudo sugere que este seja aplicado para amostras grandes
(T>10), preferindo-se o LSDV corrigido para amostras pequenas. Os estimadores GMM,
por serem relativamente exigentes e no darem provas de grande eficincia, so preteridos.
Granger e Huang [1997] discutem a avaliao e comparao da qualidade das
diversas especificaes de modelos com amostras longitudinais atravs de tcnicas usadas
em sries temporais. A metodologia consiste em comparar as previses (tanto no sentido
temporal forecasting como no seccional prediction) com os dados reais: um mtodo
simples consiste num teste de hipteses H0: 0=0;1=1 sobre a regresso de

70
yit=0+1E*(yit)+it, em que E*(yit) a previso de yit (prediction e forecast) e deve ser it
white noise.
Finalmente, Kao e Chiang [1997] investigam as questes relacionadas com a no-
estacionaridade de sries temporais usadas em estudos com dados em painel,
nomeadamente as formas de analisar as propriedades das sries com razes unitrias, os
problemas de regresses esprias e a cointegrao em amostras longitudinais. Os autores
sublinham que existe pouco trabalho terico sobre o tema da no-estacionaridade, em geral
e sobre a questo da cointegrao, em particular. Numa anlise das propriedades de trs
estimadores num modelo com cointegrao OLS, OLS modificado (pelo enviesamento,
de forma anloga a Judson e Owen[1996]) e OLS dinmico (i.e., estimao por OLS do
modelo base aumentado com as primeiras diferenas passadas e futuras da varivel
exgena) os autores concluem pela superioridade deste ltimo em termos de
centricidade.
Kao [1999] estuda a questo das regresses esprias com dados em painel e analisa
as propriedades assimptticas do estimador within, bem como de outras estatsticas
convencionais. Assim, Kao [1999] conclui que a distribuio assimpttica do estimador
LSDV diferente da de estimadores equivalentes no contexto das time series com
regresses esprias, pelo que os testes de cointegrao convencionais tero que ser
adaptados ao contexto dos dados em painel. Outra referncia a consultar, dentro do tema da
cointegrao com dados em painel, Larsson e Lyhagen [1999].
Um tema que tambm tem suscitado numerosos artigos o da estimao de
modelos dinmicos recorrendo aos estimadores between e chamada tcnica da pooled
mean regression proposta por Pesaran e Smith61 e que de certa forma se relaciona com a
questo da cointegrao. J Baltagi e Griffin [1984] haviam discutido a questo da
estimao de multiplicadores de curto e de longo prazo, segundo a noo de que o recurso
a amostras temporais tenderia a captar os primeiros e as seccionais os segundos. Baltagi e
Griffin [1984] sugeriram que se usasse o estimador within ou o GLS (consoante se
assumissem efeitos fixos ou aleatrios) para estimar os efeitos de curto prazo e os
estimadores OLS ou between para os efeitos de longo prazo, caso os resultados produzidos

61
Pesaran, M. Hashem e Ron Smith [1993]. Alternative Approaches to Estimating Long-Run Energy
Demand Elasticities: An Application to Asian Developing Countries, University of Cambridge Department
of Applied Economics Working Paper: 9308.

71
pelos primeiros se afastem consideravelmente dos fornecidos pelos estimador between.
Para uma actualizao desta discusso, veja-se Pirotte [1999].
Baltagi e Griffin [1997] efectuam uma comparao entre estimadores que assumem
a homogeneidade dos parmetros (i.e., a poolability dos dados) e outros que consideram
que os parmetros so heterogneos, pelo que estimam cada indivduo separadamente e
depois recorrem a mdias, eventualmente ponderadas pelas respectivas matrizes de
varincias (shrinkage estimators). Os resultados tendem a confirmar a superioridade dos
estimadores convencionais, em que se contavam os LSDV, GLS e 2SLS. Alm disso,
Baltagi e Griffin [1997] notam que, para uma dimenso temporal considervel, a
implementao dos estimadores LSDV ou GLS pode ser prefervel utilizao de
estimadores IV, sobretudo quando o contedo informativo dos instrumentos pequeno.
Pesaran, Shin e Smith [1998] propem uma variante do estimador de Grupos de
Mdias (MG), para painis de dimenses considerveis, quer em N, quer em T. Em vez de
estimar N regresses e calcular as mdias dos coeficientes, sugerem um meio termo entre
esta metodologia e os estimadores com o pressuposto de homogeneidade. Assim, Pesaran
et al. [1998] restringem os parmetros de longo prazo a serem idnticos, enquanto que os
de curto prazo podem variar de indivduo para indivduo. A estimao, por MLE, requer
que se usem algoritmos iterativos, nomeadamente do tipo Newton-Raphson, podendo ser
aplicado o mesmo procedimento, independentemente da ordem de integrao dos
regressores. Estes estimadores Pooled Mean Group (PMG) so promissores, tanto mais
que podem ser justificados de ponto de vista econmico, sobretudo na macroeconometria,
ainda que a sua utilizao (tal como a do estimador LSDV) requeira uma dimenso
temporal da amostra considervel. O estimador PMG permite que as dinmicas de
ajustamento individuais sejam diferenciadas (tal como as estruturas de varincias e
covarincias), mantendo uma coeso no sistema para o longo prazo, ainda que nem sempre
as estimativas de curto prazo sejam plausveis.

8.3 ALGUNS TESTES DE ESPECIFICAO

Para aferir a robustez dos resultados de qualquer trabalho emprico, devem ser
efectuados testes existncia de autocorrelao e heteroscedasticidade dos termos de
perturbao aleatrios, para o que se sugerem alguns procedimentos. Para o efeito,
considere-se o seguinte modelo:

72
y it = i + y i ,t 1 + x it + u it , com uit ~ N(0,2it). (8.1)

em que uit tem mdia nula, varincia 2it, no necessariamente constante e covarincias no
necessariamente nulas. Para simplificar a apresentao, admite-se que os efeitos
especficos so apenas de dimenso seccional (ainda que a incluso de efeitos temporais
no constitua uma complicao intransponvel) e so tratados como fixos.

testes autocorrelao:
Para testar a ausncia de autocorrelao dos termos de perturbao recomendam-se
alguns testes:
i) teste LM de Breusch-Godfrey sobre os resduos de estimao por LSDV ou Within
(quando consistentes) com um truncation lag p a ser definido pelo critrio de
Schwert e que consiste na estimao de uma equao auxiliar com os resduos da
equao principal como varivel dependente e com as variveis explicativas do
modelo original e os resduos do mesmo modelo desfasados, seguida de um teste
significncia destes ltimos mediante estatstica nR2 ~ 2(p). O teste tem a vantagem
de ser relativamente robusto face a especificaes alternativas para o processo de
correlao, testando processos estocsticos AR(p) e MA(p), sendo o seu principal
inconveniente o facto de a sua potncia depender crucialmente da escolha do
truncation lag. Para mais pormenores do teste consulte-se, por exemplo, Davidson e
MacKinnon [1993], 357-360. Ainda assim e por o teste no ter sido concebido para
dados em painel, aconselha prudncia na sua utilizao, complementando-o com
testes alternativos.
ii) teste LM5 de Baltagi [1995] (pg. 93) que testa a hiptese nula de ausncia de
autocorrelao AR(1) ou MA(1) num modelo com efeitos fixos atravs de um teste
de multiplicador de Lagrange com estatstica
u u 1
LM 5 = NT 2 (T 1) ~ N (0 ,1) para T.
u u
em que representa um vector de resduos de estimao within, admitindo efeitos
fixos (pelo que o teste no ser apropriado para testar, por exemplo, a existncia de
autocorrelao em modelos pooled OLS). O teste tem a vantagem de se comportar
relativamente bem para outras especificaes ARMA para as perturbaes e por ser
aplicvel para modelos dinmicos ou outros modelos com regressores no
estritamente exgenos.

73
Adicionalmente, como a transformao within elimina os efeitos individuais (ou
temporais), sejam estes tidos como fixos ou aleatrios, o teste tambm pode ser
usado para testar a existncia de autocorrelao da primeira ordem em modelos com
efeitos aleatrios (Baltagi [1995], pg. 94), ainda que no seja possvel efectuar esta
extenso no caso de modelos dinmicos62 (por a transformao within no gerar
estimadores consistentes, nessa situao).
iii) Teste de Durbin-Watson com dados em painel: para um modelo com efeitos fixos
e com regressores no aleatrios, possvel usar-se o teste de Durbin-Watson para
testar-se a existncia de autocorrelao gerada por um termo AR(1). A estatstica
idntica usada para sries temporais, com a diferena de os resduos usados serem
os within e no os OLS, ou seja

( i , t 1 )
N T
2
it
DW p = i =1 t =1 (8.2)
N T

i =1 t =1
2
it

Bhargava, Franzini e Narendranathan [1982] apresentam os limites superiores e


inferiores para o valor crtico da estatstica.
iv) Teste m2 de Arellano e Bond [1991] para processos MA(2): o teste parte de um
estimador GMM para um modelo autorregressivo com efeitos aleatrios (com N
grande e T pequeno) equivalente a (3-9) e genericamente dado por
= (XZA Z X )1 (X ZA Z Y )
(8.3)
N N

em que Z uma matriz de instrumentos, X a matriz de variveis explicativas nas


primeiras diferenas ou nas diferenas ortogonais e AN = 1/Ni(zii izi) uma matriz
de ponderao obtida a partir dos resduos de estimao () resultantes de um
estimador inicial consistente. Com os resduos de estimao GMM, i, calcula-se a
estatstica do teste, para a hiptese nula de ausncia de autocorrelao da segunda
ordem:
u 2 u * a
m2 = ~ N (0 ,1)
u 1 / 2
em que * um vector dos resduos aparado para que a sua dimenso coincida com
a de -2. Para pormenores sobre o teste, consulte-se Arellano e Bond [1991], 282.

62
Para modelos estticos, com efeitos aleatrios, Baltagi aconselha uma outra estatstica, dita LM4 (pg. 91-
2) ou o uso do teste de Durbin-Watson.

74
Baltagi [1995], Captulo 5, constitui uma boa fonte para exemplos adicionais de
testes existncia da autocorrelao em circunstncias diversas, nomeadamente quando se
pretende testar simultaneamente a hiptese de autocorrelao e da existncia de efeitos
aleatrios ou quando se pretende escolher entre um processo AR(1) ou MA(1).

testes heteroscedasticidade:

O teste de White com termos cruzados ser uma proposta bvia para testar a
existncia de heteroscedasticidade genrica, segunda a qual, a cada observao
corresponde uma varincia distinta. Assim, testa-se a hiptese nula de homoscedasticidade
contra a alternativa de heteroscedasticidade genrica, incidindo o teste sobre os resduos de
estimao Within. Mais uma vez, um dos problemas do teste o de ter uma reduzida
potncia, a que se soma o facto de no ter sido concebido especificamente para dados em
painel.
Pode ainda testar-se a hiptese nula de homoscedasticidade com hiptese
alternativa de heteroscedasticidade em bloco, i.e., em que podemos ter termos de
perturbao homoscedsticos para cada i, mas com varincias diferentes de grupo para
grupo. Formalmente, a hiptese nula ser

H0: 2i,t=2i , t=1,T, i=1,,N

com hiptese alternativa de heteroscedasticidade ao nvel das observaes individuais:

H1: 2i,t=2i ; i=1,N;t=1,,T

Uma sugesto para o teste ser o de estimar o modelo com efeitos fixos e recolher
os resduos para cada um dos indivduos, correndo N regresses auxiliares do teste de
White. Em concreto, estima-se o modelo (8.1), por exemplo e adicionalmente as seguintes
N regresses auxiliares:
2
e it2 = 0 1 y i ,t 1 + 2 y i ,t 1 + x it x it xit + it , i = 1, K , N
em que a barra significa a varivel expressa na forma de diferena face respectiva mdia
seccional e e so (1k), omitindo-se os termos cruzados, para simplificar. Para cada
uma das regresses calcula-se a estatstica do teste e o respectivo p-value, dados por:

TR2 ~ 2(J-1)

75
em que J o nmero de parmetros em cada regresso. Com os N p-values dos referidos
testes individuais, procede-se a um teste de Maddala-Fisher para testes independentes
(Maddala [1977], pg. 47-8 e Maddala e Kim [1998]) que se baseia na estatstica
N
P = 2 ln ( p i ) ~ 2 (2 N )
i =1
e que, segundo Maddala [1977] se trata de uma distribuio exacta para um teste de
hipteses independentes. Maddala e Kim [1998] sugerem este teste para testar a hiptese
nula de estacionariedade das sries com dados em painel como alternativa aos testes de
Levin e Lin [1993] e Im, Pesaran e Shin [1996]63. A sua aplicao a este contexto de
heteroscedasticidade foi implementada em Marques [2000]. Ainda assim, a potncia do
teste, segundo Maddala [1977] depender da potncia dos teste individuais subjacentes,
que para o teste geral de White no ser particularmente elevada, ainda que a consistncia
esteja assegurada, desde que N fixo e T.
Caso se rejeite a hiptese nula de homoscedasticidade, justifica-se a correco da
matriz de covarincias dos estimadores (within, por exemplo) pelo mtodo consistente de
White, com ou sem correco de grupo, dependendo da hiptese alternativa prever
homoscedasticidade intra-grupo, ou no, respectivamente.
Um outro teste proposto por Baltagi [1995] o j conhecido teste de Bartlett em
que se verifica sob a hiptese nula de homoscedasticidade
T /2
2
1 T
N ( yit y i )
u = ~ 2 (N 1)
T t =1
(8.4)
N
i =1 1
2
1 T
NT T ( yit yi )
i =1
t =1

contra a hiptese alternativa de heteroscedasticidade em bloco. Pode e deve-se usar a


estatstica de Bartlett modificada, dada por:
N
(T N )ln 2 (T 1)ln i2
M = i =1
~ (N 1)
1 + [1 / 3(N 1)][N (T 1) 1 (T N )] (8.5)
N (T 1) 2
T 2

( y it y i )
1
i2 = e 2 = i
T 1 t =1 TN

63
Cuja aplicao vem dificultada pela indisponibilidade de valores exactos para os p-values dos testes ADF
convencionais, como j se referiu no captulo 6.

76
e que, tal como a anterior, pode ser alterada para acomodar painis no balanceados (isto ,
com dimenso temporal varivel). Para mais pormenores sobre o teste consulte-se Judge et
al. [1985], pg. 447-8 ou Gujarati [1996].

A escolha de uma dada especificao para um modelo, tema no abordado ao longo


deste trabalho, mas que constitui matria para futuras actualizaes, ir depender da
resposta prvia (ao trabalho de estimao) a uma sria de pressupostos de ndole terica e
no emprica. Assim, h que ter em conta: a existncia ou no heterogeneidade; o estarmos
perante modelos de efeitos fixos ou aleatrios; as perturbaes no-especficas (vit) serem
ou no esfricas e as variveis exgenas (X) serem ou no estritamente exgenas.
A escolha pode ser assistida, nalguns casos, pelo recurso ao teste de especificao
de Hausman (ou outro nele baseado), por exemplo: para testarmos a hiptese de
autocorrelao dos termos de perturbao genricos, podemos testar H0 comparando os
resultados de uma estimao MLE (consistente sob H0, mas no sob H1) com os obtidos
com um estimador IV, p.ex., o Balestra-Nerlove (consistente sob ambas as hipteses).
Sobre isto, veja-se, entre outros, Baltagi [1995] ou Mtys e Sevestre [1992].
Em Metcalf [1997] podem encontrar-se mais alguns testes de especificao para a
estimao de modelos com dados em painel usando variveis instrumentais.

77
9. CONCLUSO

Um dos primeiros passos na escolha do mtodo de estimao com dados em painel


a definio da forma como introduzida a heterogeneidade no modelos. Regra geral esta
apresentada atravs de termos independentes variveis de indivduo para indivduo ou ao
longo do tempo (ou em ambas as dimenses), sob a forma de componentes de erro e que
poder ser dividida em dois grandes tipos: efeitos fixos e efeitos aleatrios.
O primeiro tipo admite que os efeitos especficos i e t se encontram
correlacionados com as variveis explicativas e que, dessa forma, podem ser entendidos
como N e T constantes separadas. Assim, a estimao e inferncia estatstica tero que ser
feitas condicionadas por i e t.64 Admitindo-se que esses efeitos individuais e temporais
representam variveis omissas, torna-se altamente provvel que tais efeitos se encontrem
correlacionados com os regressores (Judson e Owen [1996]).
J os efeitos aleatrios admitem que os efeitos especficos so apropriadamente
descritos por variveis aleatrias no correlacionadas com os regressores (o que ser uma
dificuldade, particularmente para modelos autorregressivos) e com distribuies
possivelmente do tipo i ~ N(0,2) e t ~ N(0,2). Ou seja, os modelos com efeitos
aleatrios podem ser vistos como um caso particular dos modelos com efeitos fixos, na
medida em que assumem determinadas distribuies para os efeitos, permitindo a
inferncia incondicional.
Se se admitirem efeitos fixos, no caso genrico de regressores no estocsticos, os
estimadores LSDV sero BLUE, desde que uit ~ N(0,2) e assimptoticamente eficientes se
os mesmo termos de perturbao forem i.i.d. e de qualquer forma cntricos e consistentes
para estruturas de covarincias mais complexas. No caso concreto dos modelos dinmicos,
em que entre os regressores se encontram termos desfasados da varivel endgena, os
estimadores Within permanecero consistentes para T desde que, obviamente, os
termos de perturbao uit no se apresentem autocorrelacionados na dimenso temporal.
J com efeitos aleatrios, existem estimadores GLS eficientes face aos estimadores
within no caso de regressores no estocsticos, mas no sero sequer consistentes com

64
Ou seja, os efeitos fixos so na verdade resultado de variveis aleatrias mas que, dado estarmos a
condicionar a estimao por i e t, podem ser tratadas como constantes (Judge et al. [1985], pg. 527).

78
variveis endgenas desfasadas, pelo que a nica sada ser a estimao dos modelos
atravs de variveis instrumentais.
Para evitar o problema da perda de consistncia, em ambas as situaes, tem-se
como alternativa genericamente consistente, aps a diferenciao do modelo, a utilizao
de estimadores de variveis instrumentais, IV. A eficincia destes estimadores
questionvel, dependendo do contedo informativo dos instrumentos, que poder no ser
muito, em particular se o nmero de regressores exgenos for diminuto ou nulo.
Uma alternativa plausvel, quer ao LSDV, quer ao IV, a estimao por GMM,
conforme foi discutido no captulo 5. No entanto, haver aqui que efectuar um balano
crtico relativamente ao trade-off existente entre aos ganhos de eficincia que estes
estimadores permitem (preservando a consistncia) e o acrscimo de complexidade e de
carga computacional que exigem.
Como regra geral, para modelos dinmicos com efeitos fixos, com painis longos,
pode optar-se pelo estimador within, enquanto que para painis curtos se deve preferir a
estimao GMM.
Os modelos podem ser generalizados por forma a que heterogeneidade se revele
no apenas no termo independente, mas tambm nos prprios parmetros associados s
variveis explicativas. No entanto, por economia de espao, optou-se por no abordar essa
possibilidade nesta reviso de literatura. Para alm deste tpico, muitos outros foram
preteridos ou abordados apenas superficialmente, como as questes da estimao por
recurso a especificaes alternativas para as estruturas de varincias, os estimadores PMG
ou MG, a existncia de relaes de cointegrao em modelos em painel e, acima de tudo, a
estimao GMM, que poderia e deveria ter merecido um maior desenvolvimento.
Para quem necessitar de um maior aprofundamento das matrias aqui expostas,
referncias fundamentais sero Hsiao [1986], Baltagi [1995] e Mtys e Sevestre [1992]
(existe uma edio mais recente, de 1995, com melhorias substanciais). Para temas como o
GMM ou as razes unitrias, sugerem-se Mtys [1999] e Maddala e Kim [1998],
respectivamente. Finalmente, para quem desejar uma referncia rpida estimao de
modelos dinmicos com dados em painel, prope-se Urga [1992], ainda que
complementado com referncias mais recentes.

79
10. REFERNCIAS

[1] Amemyia, Takeshi [1985]. Advanced Econometrics, Oxford: Basil Blackwell.


[2] Amemyia, Takeshi e Thomas E. MaCurdy [1986]. Instrumental-Variable Estimation
of An Error-Components Model, Econometrica, Vol. 54, No. 4, 869-880.
[3] Anderson, T.W. e Hsiao, Cheng [1981]. Formulation and Estimation of Dynamic
Models Using Panel Data, Journal of Econometrics, 18:47-82.
[4] Ahn, Seung C. e Peter Schmidt [1997]. Efficient estimation of dynamic panel data
models: Alternative assumptions and simplified estimation, Journal of Econometrics,
76, 309-321.
[5] Arellano, Manuel e Stephen Bond [1991]. Some Tests of Specification for Panel
Data: Monte Carlo Evidence and an Application to Employment Equations, Review of
Economic Studies, 58: 277-297.
[6] Balestra, Pietro e Marc Nerlove [1966]. Pooling Cross Section and Time Series Data
in the Estimation of a Dynamic Model: the Demand for Natural Gas, Econometrica,
34, No.3, 585-612.
[7] Baltagi, Badi H. [1995]. Econometric Analysis of Panel Data, New York: John Wiley
& Sons.
[8] Baltagi, Badi H. e James Griffin [1984]. Short and long run effects in pooled
models, International Economic Review, 25, No. 3, 631-645.
[9] Baltagi, Badi H. e James Griffin [1997]. Pooled estimators vs. their heterogeneous
counterparts in the context of dynamic demand for gasoline, Jounal of Econometrics,
77, 303-327.
[10] Bhargava, Franzini e Narendranathan [1982]. Serial correlation and fixed effects
model, Review of Economic Studies 49: 129-140.
[11] Bhargava, A. e Sargan, J.D. [1983]. Estimating Dynamic Random Effects Models
from Panel Data covering Short Time Periods, Econometrica, 51:1635-59.
[12] Breusch, Trevor S., Grayham E. Mizon e Peter Schmidt [1989]. Efficient
Estimation Using Panel Data, Econometrica, Vol. 57, No. 3, 695-700.
[13] Chamberlain, Gary [1984]. Panel Data in Zvi Griliches e Michael Intriligator,
editores, Handbook of Econometrics, Vol. II, 1247-1318. Amesterdam: Elsevier
Science Publishers BV.
[14] Crepon, Bruno, Francis Kamarz e Alain Trognon [1997]. Parameters of interest,
nuisance parameters and orthogonality conditions: an application to autoregressive
error component models, Journal of Econometrics, 82, 135-156.

80
[15] Davidson, Russell e James G. MacKinnon [1993]. Estimation and Inference in
Econometrics, Oxford: Oxford University Press.
[16] Granger, Clive W.J. e Huang, Ling-Ling [1997]. Evaluation of Panel Data Models:
Some Suggestions From Time Series, University of California in San Diego -
Department of Economics Discussion Paper 97-10.
[17] Gujarati, Damodar [1995]. Basic Econometrics, 5th Ed., New York: McGraw-Hill
[18] Greene, William H. [1997]. Econometric Analysis, 3rd Ed. (International Edition),
Upper Saddle River: Prentice Hall.
[19] Hamilton, James D. [1994]. Time Series Analysis, Princeton, New Jersey: Princeton
University Press.
[20] Hausman, J.A. e W.E. Taylor [1981]. "Panel Data and Unobservable Individual
Effects", Econometrica, 49, no. 6: 1377-98.
[21] Heimonen, Kari [1999]. Stationarity of the European real exchange rates
evidence from panel data, Applied Economics, 1999, 31: 673-77.
[22] Holtz-Eakin, Douglas, Whitney Newey e Harvey S. Rosen [1988]. Estimating
Vector Autoregressions with Panel Data, Econometrica, vol. 56, no. 6, 1371-95.
[23] Hsiao, Cheng [1986]. Analysis of Panel Data. Cambridge: Cambridge University
Press.
[24] Im, Kyung So, M. Hashem Pesaran e Yongcheol Shin [1997]. Testing for Unit
Roots in Heterogeneous Panels, Department of Applied Economics Discussion Paper,
University of Cambridge s/n.
[25] Jonhston, Jack e John DiNardo [1997]. Econometric Methods, 4 Edio. New
York: McGraw-Hill Companies, Inc..
[26] Judge, George, W.E. Griffiths, R. C. Hill, H. Lktepohl e Tsoung-Chao Lee [1985].
The Theory and Practice of Econometrics, 2 Edio, New York: John Wiley and Sons.
[27] Judson, Ruth e Owen, Ann [1996]. Estimating Dynamic Panel Data Models: A
Pratical Guide for Macroeconomists, Federal Reserve System Working Paper.
[28] Kao, Chihwa [1999]. Spurious regression and residual-based tests for
cointegration in panel data, Journal of Econometrics, 90, 1-44.
[29] Kao, Chihwa e Chiang, Min-Hsien [1997]. On the Estimation and Inference of a
Cointegrated Regression in Panel Data, Syracuse University Working Paper.
[30] Keane, Michael P. e David E, Runkle [1992]. On the Estimation of Panel Data
Models With Serial Correlation When Instruments Are Not Strictly Exogenous,
Journal of Business and Economic Statistics, Vol. 10, No. 1, 18-22.
[31] Kmenta, Jan [1986]. Elements of Econometrics. New York: Macmillan.

81
[32] Koenker, Roger e Jos A.F. Machado [1997]. GMM inference when the number of
moment conditions is large, Working Paper da University of Illinois em Champaign.
[33] Larsson, Rolf e Johan Lyhagen [1999]. Likelihood-Based Inference in
Multivariate Panel Cointegration Models, Stockholm School of Economics Working
Paper Series in Economics and Finance, no. 331.
[34] Levin, Andrew e Chen.Fu Lin [1992]. Unit Root Tests in Panel Data: asymptotic
and finite sample properties, University of California in San Diego Discussion Paper
92-23.
[35] Levin, Andrew e Chen-Fu Lin [1993]. Unit Root Tests in Panel Data: new
results, University of California in San Diego Discussion Paper 93-56.
[36] Maddala, G.S. [1977]. Econometrics. New York: McGraw-Hill.
[37] Maddala, G.S. e In-Moo Kim [1998]. Unit Roots, Cointegration, and Structural
Change. Cambridge: Cambridge University Press.
[38] Marques, Lus David [2000]. Inflation Targeting: Conceitos e Evidncia de um
Novo Regime de Objectivos Intermdios em Poltica Monetria, Tese de Mestrado em
Economia, Faculdade de Economia do Porto.
[39] Mtys, Lzl e Sevestre, Patrick, eds. [1992]. The Econometrics of Panel Data:
Handbook of Theory and Applications, Dordrecht: Kluwer Academic Publishers.
[40] Mtys, Lzl [1999]. Generalized Method of Moments. Cambridge: Cambridge
University Press.
[41] Metcalf, Gilbert E. [1997]. Specification testing in panel data with instrumental
variables, Journal of Econometrics, 71, 291-307.
[42] Nerlove, Marc [1971]. Further Evidence on the Estimation of Dynamic Relations
from a Time Series of Cross Sections, Econometrica, 39:359-382.
[43] Nickell, S. [1981]. Biases in Dynamic Models with Fixed Effects, Econometrica,
49:1399-416.
[44] Pesaran, M. Hashem, Yongcheol Shin e Ron P. Smith [1998]. Pooled Mean Group
Estimation of Dynamic Heterogeneous Panels, Department of Applied Economics,
University of Cambridge Working Paper s/n., Novembro 1998.
[45] Pirotte, Alain [1999]. Convergence of the static estimation toward the long run
effects of dynamic panel data models, Economic Letters, 63, 151-158
[46] Urga, Giovanni [1992]. The Econometrics of Panel Data: a selective introduction,
texto no publicado da London Business School.

82