You are on page 1of 47

Une Synthse des Tests de Racine Unitaire sur Donnes

de Panel
Christophe Hurlin et Valrie Mignony
Janvier 2005

Rsum
Cet article propose une synthse de la littrature concernant les tests de racine unitaire en panel. Deux principales volutions peuvent tre mises en vidence dans cette voie
de recherche depuis les travaux fondateurs de Levin et Lin (1992). Dune part, on a pu
assister depuis la n des annes 90 une volution tendant prendre en compte une
htrognit des proprits dynamiques des sries tudies, avec notamment les travaux
dIm, Pesaran et Shin (1997) et de Maddala et Wu (1999). Dautre part, un second type de
dveloppements rcents dans cette littrature tend introduire une dichotomie entre deux
gnrations de tests : la premire gnration repose sur une hypothse dindpendance entre
les individus, ce qui apparat peu plausible notamment dans le cas de certaines applications
macro-conomiques. La seconde gnration, actuellement en plein dveloppement, intgre
diverses formes possibles de dpendances inter-individuelles (Bai et Ng (2001), Phillips et
Sul (2003a), Moon et Perron (2004), Choi (2002), Pesaran (2003) et Chang (2002)). Ces
deux gnrations de tests sont prsentes dans cette revue de la littrature.

Mots-Cl : Donnes de panel non stationnaires, racine unitaire, htrognit, dpendances inter-individuelles.
J.E.L Classication : C23, C33

LEO, Universit dOrlans. Facult de Droit, dEconomie et de Gestion. Rue de Blois - BP6739. 45067
Orlans Cedex 2. Email : christophe.hurlin@univ-orleans.fr.
y THEMA, Universit Paris X - Nanterre. 200 Avenue de la Rpublique, 92001 Nanterre Cedex. Tel :
01.40.97.58.60. Email : Valerie.Mignon@u-paris10.fr

Introduction

Ltude des sries temporelles non stationnaires est devenue aujourdhui incontournable dans
la pratique conomtrique courante. Les travaux empiriques dbutent ainsi frquemment par
une analyse de la stationnarit des sries temporelles considres avec lapplication de divers
tests de racine unitaire. Dans un contexte multivari, les tudes cherchent souvent mettre en
vidence des relations dquilibre de long terme entre les variables par lapplication de tests de
cointgration. En revanche, lanalyse des donnes de panel non stationnaires ne sest dveloppe
que trs rcemment, depuis les travaux pionniers de Levin et Lin (1992). Elle sest en particulier
dveloppe avec lutilisation croissante des bases de donnes macro-conomiques prsentant une
dimension temporelle su sante (suprieure vingt ans) pour que cette problmatique prsente
un intrt appliqu. Les champs dapplication des tests de racine unitaire en panel couvrent
aujourdhui ltude de la parit des pouvoirs dachat (PPA), les problmes de croissance et
de convergence, les dynamiques de lpargne et de linvestissement, les activits de recherchedveloppement au niveau international, etc.
Pourquoi tester la racine unitaire en panel ?
Lajout de la dimension individuelle la dimension temporelle usuelle prsente un intrt
important pour lanalyse des sries non stationnaires. Les tests de racine unitaire et de cointgration sur donnes de panel temporelles sont en eet plus puissants que leurs analogues sur
sries temporelles individuelles en petit chantillon. A titre dexemple, lorsque lon tudie des
sries de taux de change, on dispose gnralement de 20 ou 30 ans de donnes. Or, pour de
telles tailles dchantillon, les tests de racine unitaire sont en gnral trs peu puissants pour
distinguer des sries non stationnaires et des sries stationnaires mais fortement persistantes
(voir Salani 1999 pour une synthse). Ltendue de la priode dtude tant plus importante
que la frquence des donnes (Pierce et Snell, 1995), une solution consisterait lorsque cela
est possible accrotre cette priode. Mais, dune part, cela est rarement possible et, dautre
part, une telle procdure augmente le risque de faire face des ruptures structurelles. Si lon
reprend lexemple des taux de change, la n du systme de Bretton Woods a engendr une rupture structurelle telle quil est peu pertinent de travailler sur une longue priode mlant divers
rgimes de change. Plutt que dtendre la priode dtude, une alternative consiste alors
accrotre le nombre de donnes en incluant linformation relative des pays dirents. Il est en
eet naturel de penser que les proprits de long terme des sries, de mme que leurs caractristiques en termes de stationnarit, ont une forte probabilit dtre communes plusieurs pays.
Le recours aux donnes de panel permet ainsi de travailler sur des chantillons de taille rduite
(dans la dimension temporelle) en augmentant le nombre de donnes disponibles (dans la dimension individuelle), diminuant ainsi la probabilit de faire face des ruptures structurelles
et palliant le problme de la faible puissance des tests en petit chantillon. Ainsi que le notent
Baltagi et Kao (2000), lconomtrie des donnes de panel non stationnaires vise combiner le
meilleur des deux mondes : le traitement des sries non stationnaires laide des mthodes
des sries temporelles et laugmentation du nombre de donnes et de la puissance des tests avec
le recours la dimension individuelle.
Quelles sont les dirences fondamentales entre les tests de racine unitaire en
panel et en sries temporelles ?
Il existe deux principales dirences entre les deux approches. La premire concerne les
distributions asymptotiques. Dans le cas des sries temporelles, les statistiques de tests usuels
possdent des distributions asymptotiques non standard (point a) et conditionnelles au modle
utilis pour tester la racine unitaire (point b). Ainsi, par exemple, sous lhypothse nulle de
racine unitaire, la t-statistique de Dickey-Fuller admet une distribution asymptotique qui est
une fonction de mouvements Browniens. Cette distribution est en outre dirente suivant la
spcication de la composante dterministe du modle dans lequel on teste la racine unitaire :
2

modle avec une constante, une constante et une tendance, ou ni constante ni tendance. Dans le
cadre des modles de panel, les statistiques des tests de racine unitaire ( lexception des tests
de Fisher) admettent pour loi asymptotique des lois normales (point a). Les premiers mettre
en vidence ce rsultat furent Levin et Lin (1992). Nous donnerons lintuition de ce rsultat
dans le cadre des tests de premire gnration en voquant au passage les direntes notions de
convergence en panel (Phillips et Moon, 1999). En revanche, tout comme dans le cas des sries
temporelles, ces lois asymptotiques demeurent conditionnelles au modle utilis pour tester la
racine unitaire (point b) : les lois asymptotiques, et donc les seuils, ne sont pas les mmes
suivant que lon considre un modle avec ou sans constante, avec ou sans tendance. Mais,
contrairement aux sries temporelles, les lois asymptotiques restent des lois normales : seules
la variance et lesprance sont modies suivant le modle utilis. Ainsi, la premire dirence
rside dans le fait que lconomtre appliqu qui utilisait des tables de lois particulires dans le
cadre des sries temporelles pour mener bien ses tests, devra utiliser pour eectuer des tests
similaires en panel les tables de la loi normale.
Mais la dirence essentielle rside dans le problme de lhtrognit du modle qui ne se
pose pas dans le contexte des sries temporelles. Dans le cas univari, on se donne un modle
pour tester la prsence dune racine unitaire dans la dynamique dune variable pour un individu
donn. Lorsque lon passe en panel, la question qui vient immdiatement lesprit est la suivante : peut-on considrer un mme modle pour tester la prsence dune racine unitaire dans
la dynamique dune variable observe sur plusieurs individus ? Si lon rpond par la rmative
cette question, cela implique lexistence de proprits dynamiques strictement identiques pour
la variable quel que soit le pays considr : on parle alors de panel homogne. Prenons un
exemple : si lon teste la prsence dune racine unitaire dans la dynamique du chmage des 30
pays membres de lOCDE partir dun mme modle, cela revient tester lhypothse de racine
unitaire en imposant, sans doute tort, que la dynamique du chmage puisse tre dcrite pour
les 30 pays par le mme modle. Le test de racine unitaire ainsi construit en panel peut alors
conduire des rsultats fallacieux. Ds lors, de faon gnrale, la premire question centrale des
tests de racine unitaire en panel devient celle de la forme de lhtrognit du modle utilis
pour tester la racine unitaire. Cette question rejoint celle de la spcication mme du test de
racine unitaire comme nous le verrons par la suite.
Cette notion dhtrognit du modle est une notion centrale de lconomtrie des panels
(Hsiao, 1986, et Sevestre, 2002). La forme la plus simple dhtrognit est celle qui consiste
postuler lexistence de constantes spciques chaque individu. Il sagit bien entendu du modle
eets individuels (spcis de faon xe ou alatoire), qui traduit une htrognit uniquement du niveau moyen mais qui conserve lhypothse dhomognit des autres paramtres du
modle et en particulier de la racine autorgressive. Cest notamment ce type de modlisation
quutiliseront les premiers tests de racine unitaire de Levin et Lin (1992). Mais trs rapidement, cette conception de lhtrognit limite aux seuls eets individuels ou aux tendances
dterministes est apparue peu plausible dans le cas des applications macro-conomiques.
Ainsi, un premier mouvement sest dessin dans le contexte des tests de premire gnration
allant vers une prise en compte dune plus grande htrognit de la dynamique de la srie
tudie. Ce mouvement sinscrit dans le contexte plus large de la littrature du milieu des
annes 90 consacre aux panels dynamiques dits htrognes (Pesaran et Smith, 1995). Les
premiers tests de racine unitaire sur panels htrognes ont alors t proposs par Im, Pesaran
et Shin (1997) et Maddala et Wu (1999). Ces tests autorisent sous lhypothse alternative non
seulement une htrognit de la racine autorgressive, mais aussi une htrognit quant
la prsence mme dune racine unitaire dans le panel. Par exemple, si lon raisonne sur un panel
international, sous lhypothse alternative la variable tudie peut tre non stationnaire dans un
premier groupe de pays et stationnaire pour un autre groupe non vide de pays de lchantillon.

Lhypothse dindpendance inter-individuelle : vers une nouvelle gnration de


tests
Cette premire volution vers des spcications htrognes se double depuis trois ans dune
seconde volution allant dans le sens de la prise en compte des corrlations de la variable entre
individus. En eet, au del du problme de lhtrognit des paramtres du modle, une
autre problmatique spcique aux donnes de panel est aujourdhui devenue centrale dans
la littrature sur les tests de racine unitaire : il sagit de la prise en compte des ventuelles
dpendances inter-individuelles. La question est tout simplement de savoir si lon autorise la
prsence dventuelles corrlations entre les rsidus des dirents individus du panel. Selon la
rponse cette question, on peut opposer deux gnrations de tests comme lindique le tableau
rcapitulatif 1.
Tab. 1 Tests de Racine Unitaire en Panel
ere

Tests 1

Gnration

Indpendance entre individus

1- Spcication homogne de la racine autorgressive sous H1


Levin et Lin (1992, 1993)
Levin, Lin et Chu (2002)
Harris et Tzavalis (1999)
2- Spcication htrogne de la racine autorgressive
Im, Pesaran et Shin (1997, 2002 et 2003)
Maddala et Wu (1999)
Choi (1999, 2001)
Hadri (2000)
3- Test squentiel
Hnin, Jolivaldt et Nguyen (2001)
Tests 2eme Gnration

Dpendances entre individus

1- Tests fonds sur des modles factoriels


Bai et Ng (2001)
Moon et Perron (2004)
Phillips et Sul (2003a)
Pesaran (2003)
Choi (2002)
2- Autres approches
OConnell (1998)
Chang (2002, 2004)
La premire gnration de tests repose sur lhypothse dindpendance inter-individuelle
des rsidus. Cest prcisment cette hypothse dindpendance qui, comme nous allons le voir,
permet dtablir trs simplement les distributions statistiques de test et dobtenir gnralement
des distributions asymptotiques ou semi-asymptotiques normales. Dans cette perspective, les
ventuelles corrlations entre individus constituent des paramtres de nuisance. Cette hypothse
dindpendance inter-individuelle est particulirement gnante dans la plupart des applications
macro-conomiques des tests de racine unitaire, que ce soit dans le domaine des tests de convergence (Phillips et Sul, 2003) ou dans le domaine des tests de la PPA (OConnell, 1998). Or
lapplication tort des tests de premire gnration dans un contexte avec dpendances inter4

individuelles conduit des distorsions de taille et des puissances de tests trs faibles (Banerjee,
Marcellino et Osbat, 2000, Strauss et Yigit, 2003).
La seconde gnration de tests, plus rcents, tend lever cette hypothse dindpendance.
Ces tests renversent totalement la perspective jusqualors adopte car, plutt que de considrer
les corrlations entre individus comme des paramtres de nuisance, ils proposent dexploiter ces
co-mouvements pour dnir de nouvelles statistiques de test. Tout le problme consiste alors
proposer le test permettant la prise en compte la plus gnrale des direntes formes possibles de
dpendances entre individus. Comme le souligne Quah (1994), la modlisation des dpendances
inter-individuelles est dlicate dans la mesure o il nexiste pas a priori dordre naturel dans
les observations individuelles. Cest pourquoi de nombreux tests sont aujourdhui proposs. La
plupart sinscrivent dans la ligne des travaux fondateurs de Bai et Ng (2001, 2004) et retiennent
le cadre dun modle facteurs communs. Mais si Bai et Ng (2004) proposent deux tests spars
de racine unitaire sur les composantes commune et individuelle de la srie, les autres tests ne
considrent uniquement que la composante idiosyncratique. Les approches dirent alors suivant
la mthode retenue pour extraire de la srie brute la composante idiosyncratique inobservable.
Ainsi, nous illustrerons successivement ces approches en tudiant les tests de Moon et Perron
(2004), Choi (2002) et Pesaran (2003). Nous voquerons enn des tests alternatifs (Chang 2002,
2004) dans lesquels aucune forme particulire de dpendance inter-individuelle nest postule,
et qui ne ncessitent donc pas par consquent lidentication de facteurs communs.
Dans le cadre de cette revue de la littrature, nous prsenterons tout dabord quatre tests de
racine unitaire en panel de premire gnration an de bien comprendre les enjeux de lhypothse
dindpendance inter-individuelle. Puis nous prsenterons cinq approches des tests de deuxime
gnration. Ces dirents tests selon illustrs au travers dune application sur les sries de PNB
rels des pays de lOCDE.

Les tests de Levin et Lin

Andrew Levin et Chien-Fu Lin dans une srie de contributions (Levin et Lin 1992, Levin
et Lin 1993 et Levin, Lin et Chu 2002) ont propos le premier test de racine unitaire en panel.
Leur dmarche est directement inspire de celle des tests de racine unitaire en sries temporelles
de Dickey et Fuller (1979). Par consquent, les auteurs considrent trois modles pour tester la
racine unitaire1 suivant la forme que revt la composante dterministe :
Modle 1 :
Modle 2 :
Modle 3 :

yi;t = yi;t
yi;t =

yi;t =

+ yi;t

+ "i;t
1

(1)

+ "i;t

t + yi;t

+ "i;t

(2)
(3)

o i = 1; ::; N et t = 1; ::; T et o les termes derreur "i;t sont distribus indpendamment


entre les individus i et suivent un processus ARMA stationnaire et inversible admettant une
reprsentation AR (1) du type :
"i;t =

1
X

i;k

"i;t

i;t

(4)

k=1
1 Nous ne prsentons ici que les trois modles retenus dans la version nale de larticle (Levin, Lin et Chu,
2002). Ces trois modles excluent notamment la prsence deets temporels communs qui guraient dans les
versions de 1992 et 1993 du papier.

Les processus i;t pour i = 1; ::; N sont i:i:d: 0; 2 ;i . On peut faire deux remarques ce
niveau2 . La premire est que les trois modles de Levin et Lin supposent lindpendance des
termes derreur dans la dimension individuelle. Cette hypothse, bien que particulirement forte,
est adopte dans tous les tests de racine unitaire en panel de premire gnration : cest en eet
cette hypothse qui, comme nous le verrons par la suite, permet dutiliser un thorme central
limite pour obtenir de faon relativement simple les distributions asymptotiques (normales) des
statistiques de tests.
La seconde remarque porte sur la question de lhtrognit du processus gnrateur des
donnes retenu par les auteurs. Comme nous lavons mentionn en introduction, il sagit dun
problme fondamental en conomtrie de panel. Dans le cas prsent, les trois modles de Levin
et Lin imposent lhypothse dhomognit de la racine autorgressive ( i = j = ; 8i; j) et
par consquent lhomognit de la conclusion quant la prsence dune racine unitaire dans la
dynamique de la variable y : soit lon accepte lhypothse dune racine unitaire pour lensemble
des individus du panel, soit lon rejette lhypothse dune racine unitaire pour lensemble des
individus. Cest prcisment la principale limite de ce test. En eet, mme si dans les modles 2
et 3, Levin et Lin autorisent la prsence dune htrognit du processus gnrateur via lintroduction deets individuels xes ( i 6= j pour i 6= j) et dventuelles tendances dterministes
individuelles ( i 6= j pour i 6= j); il nen demeure pas moins que le degr de persistance des
chocs3 de "i;t sur la variable yi;t est suppos tre le mme pour tous les individus du panel. Dans
le cas de panels macro-conomiques, on conoit videmment que cette hypothse dhomognit
pose problme.
A partir de ces trois modles, Levin et Lin proposent de tester les hypothses suivantes :
Modle 1

Modle 2 :

Modle 3 :

H0 :
H1 :

H0 :
H1 :

= 0 et
< 0 et

H0 :
H1 :

= 0 et
< 0 et

i
i

i
i

=0
<0
= 0; 8i = 1; ::; N
2 R; 8i = 1; ::; N
= 0; 8i = 1; ::; N
2 R; 8i = 1; ::; N

Il est important de noter que les hypothses nulles des tests de Levin et Lin dans les modles
2 et 3 sont des hypothses jointes. Dans le modle 2, lhypothse nulle teste est lhypothse
de racine unitaire pour tous les individus du panel ( i = = 0) conjointement lhypothse
dabsence deets individuels, plus prcisment la nullit de toutes les constantes individuelles
( i = 0). Dans le modle 3, lhypothse nulle consiste en lhypothse de racine unitaire et
dabsence de composante tendancielle dterministe pour tous les individus du panel ( i = 0):
On retrouve ainsi exactement la structure des deux tests joints proposs dans le cas des sries
temporelles par Dickey et Fuller (1981).
A prsent, nous allons donner lintuition des principaux rsultats asymptotiques de Levin
et Lin dans le cadre trs simple du modle 1 en labsence dautocorrlation des rsidus. Nous
comprendrons ainsi pourquoi, dans la pratique, les tests de racine unitaire en panel de Levin
et Lin doivent tre raliss partir des seuils de la loi normale, contrairement au cas des
sries temporelles. Nous considrerons ensuite le cas gnral avec autocorrlation des rsidus,
et prsenterons la dmarche gnrale en trois tapes des tests de Levin et Lin.
2 En

ce qui concerne la discussion sur lventuel choix du modle adopter pour tester la racine unitaire,
les arguments dvelopps dans le cadre des sries temporelles (voir Salani, 1999) peuvent tre repris dans le
contexte des donnes de panel.
3 En revanche, lcriture htrogne (
i;k 6= j;k ) de la forme ARMA des processus "i;t permet denvisager,
dans le cas stationnaire, des degrs de persistance dirents pour les chocs sur i;t .

2.1

Des lois asymptotiques normales : illustration dans un cas simple

Considrons le modle 1 de Levin et Lin sans eet individuel, en labsence dautocorrlation


des rsidus ( i;k = 0).
yi;t = yi;t 1 + i;t
avec = 1 + 2 R et o, pour simplier, on suppose que les rsidus i;t pour i = 1; ::; N sont
i:i:d: 0; 2 et indpendamment distribus dans la dimension individuelle. On cherche tester
lhypothse nulle H0 : = 1 contre H1 : < 1: Dans ce cas simple, la statistique de test de
Levin et Lin, identique celle du test de Dickey-Fuller, correspond la t-statistique associe
au test = 1; note t =1 :
t

=1

1
b

= b

N T
1 XX 2
y
s2 i=1 t=1 i;t

! 21

(5)

o b dsigne lestimateur des MCO du paramtre


obtenu partir des N T observations
empiles. Sous lhypothse nulle H0 ; le biais de cet estimateur peut scrire sous la forme
suivante :
! 1 N T
!
N X
T
X
XX
2
b 1=
yi;t 1
yi;t 1 i;t
(6)
i=1 t=1

i=1 t=1

Lestimateur de la variance des rsidus s est dni de faon usuelle par :


!
N T
N
T
N
1 X 1X 2
1 X 2
1 XX 2
2
bi;t =
bi;t =
s
s =
N T i=1 t=1
N i=1 T t=1
N i=1 i

En conomtrie de panel, il existe plusieurs concepts de distribution asymptotique. On


distingue tout dabord ce que lon qualie parfois de distribution semi-asymptotique ; cest le
cas o lune des dimensions (N ou T ) est xe et lautre tend vers linni (voir Hsiao, 1986). En
ce qui concerne la distribution asymptotique au sens propre (o les deux dimensions tendent
vers linni), on doit distinguer dirents modes de convergence qui ont t clairement dnis
par Phillips et Moon (1999). La premire approche, dite convergence squentielle, consiste
supposer que les dimensions convergent dans un certain ordre. On raisonne N xe (ou T ) et
lon fait tendre T (ou N ) vers linni, puis lon fait tendre N (ou T ) vers linni. Cest souvent
lapproche la plus simple pour driver les lois asymptotiques, mais il convient dtre prudent
avec ce type de rsultats car ils peuvent parfois tre dirents lorsque lon renverse lordre
de convergence ou lorsque les deux dimensions tendent simultanment vers linni4 . Dans la
seconde approche, dite convergence le long dune diagonale, on fait tendre N et T vers linni
simultanment sous lhypothse que T = T (N ) est une fonction monotone de N: Par exemple,
on peut supposer que le ratio T =N converge vers une constante c non nulle. Bien videmment,
linconvnient de cette approche rside, dune part, dans le caractre spcique de la fonction
T (N ) qui peut conditionner les rsultats et, dautre part, dans le fait que les dimensions (N; T )
dun panel peuvent ne pas correspondre, et de loin, la relation T = T (N ) : La troisime
approche, la plus gnrale mais aussi la plus di cile utiliser, consiste supposer que N et T
tendent vers linni sans supposer une quelconque relation entre T et N:
Dans le cas de la littrature sur les tests de racine unitaire en panel, et plus particulirement dans le cas des tests de premire gnration, les modes de convergence adopts sont
4 Il convient de noter que ce mode de convergence joue un rle fondamental dans la dtermination des lois
asymptotiques des tests de racine unitaire. En eet, le fait que les statistiques des tests de racine unitaire en
panel sont asymptotiquement distribues selon des lois normales, impose une convergence, N x, de T vers
linni. Ceci peut paratre quelque peu contradictoire avec lapproche des tests de racine unitaire en panel dans
la mesure o lattrait pour ceux-ci rside notamment dans la faiblesse de la dimension temporelle de lchantillon
disponible.

essentiellement squentiels et le long dune diagonale. Nous ne considrerons ici que le cas le
plus simple de la distribution asymptotique squentielle, lorsque T tend vers linni, puis N
tend vers linni son tour.
d

Raisonnons tout dabord N x. On note ! la convergence en loi fonctionnelle et !


la convergence en loi. Sous
unitaire, pour chaque individu du panel
PTlhypothse nulle
PTde racine
2
; nots respectivement Ai et Bi , convergent
les moments empiriques t=1 yi;t 1 i;t et t=1 yi;t
en distribution respectivement vers des fonctions de mouvements Browniens do lon dduit
les distributions usuelles des tests de Dickey-Fuller (voir par exemple Hamilton 1994, chapitre
17). Ainsi, sous lhypothse nulle = 1 :
Ai =

Bi =

T
1 X 2
y
T 2 t=1 i;t

T
1X
y
T t=1 i;t

d
1

T !1

[Wi (r)] dr

d
1 i;t

T !1

Wi (1)

8i = 1; ::; N

8i = 1; ::; N

o les variables Wi (r) ; pour i = 1; ::; N; dsignent des mouvements Browniens standards indpendants. On admet paralllement que les estimateurs individuels s2i ; convergent en probabilit
vers la variance de la population des rsidus :
s2i =

T
1X 2
b
T t=1 i;t

8i = 1; ::; N

T !1

Le fait de raisonner en panel nous amne prsent considrer des statistiques de tests
(quations 5 et 6) qui sexpriment en fonction des moyennes des moments empiriques individuels
Ai et Bi . En contrlant les vitesses de convergence, la statistique de test de Levin et Lin peut
ainsi se rcrire sous la forme suivante :
v
N
h p
i 1 u
u1 X
t
t =1 = T N b 1
Ai
(7)
s
N i=1
avec

T N b

1 =

N
1 X
Ai
N i=1

N
1 X
p
Bi
N i=1

(8)

Cest ce niveau quintervient lhypothse fondamentale dindpendance des rsidus entre


individus. En eet, sous cette hypothse dindpendance, il convient de dterminer la loi asymptotique de moyennes (sur N ) de moments empiriques individuels indpendants, savoir les
PN
PN
quantits N 1 i=1 Ai et N 1=2 i=1 Bi : Or, ds lors que la dimension T tend vers linni,
les moments Ai pour i = 1; ::; N (ou Bi ) sont (i) indpendamment distribus, (ii) desprance
et de variance nie, et dans notre cas trs simple (iii) identiquement distribus5 . Ne reste plus
alors qu faire tendre la dimension N vers linni, et appliquer le thorme central limite de
Lindberg-Levy (voir Amemiya, 1985). Pour un N x, lorsque la dimension T tend vers linni
on montre que :
(
)
N
N
2
2 h
i
h
i
1 X
1 X
d
2
2
p
[Bi E (Bi )] ! p
Wi (1)
1
E Wi (1)
1
T !1
2
N i=1
N i=1 2
5 Cette dernire condition nest pas essentielle lapplication du thorme central limite et nest dailleurs
plus valide ds lors que lon lve lhypothse dhomoscdasticit inter-individuelle 2 ;i = 2 :

Sous nos hypothses, quand T ! 1


h les moments
i Bi convergent vers une distribution dont
2
lesprance E (Bi ) est nulle puisque E Wi (1)
1 = 0. Ce rsultat provient tout simplement
2

du fait que Wi (1) est distribu selon un 2 (1) : Lorsque N tend vers linni, lapplication du
thorme central limite de Lindberg-Levy, nous permet de montrer que le terme de droite (qui
est une moyenne sur N de termes i:i:d:) converge son tour vers une loi normale. hLa variance de
i
2
1 :
cette loi normale correspond tout simplement la variance de la quantit 2 =2 Wi (1)
h
i
2
Sachant que V ar Wi (1) = 2; on obtient par consquent :
(
)
!
N
2 h
4
i
1 X
l
2
p
Wi (1)
1
! N 0;
N !1
2
N i=1 2
PN
Ainsi, on montre que la quantit N 1=2 i=1 [Bi E (Bi )] converge squentiellement lorsque
T puis N tendent vers linni vers une loi normale.
!
!
N
N
T
4
1 X 1X
1 X
l
p
Bi = p
yi;t 1 i;t
!
(9)
N 0;
2
(T;N !1)seq
N i=1
N i=1 T t=1
o (T; N ! 1)seq dsigne la convergence squentielle lorsque T puis N tendent vers linni.
Cest ainsi par ce type de raisonnement (dans le cas dune convergence squentielle) que lon
tablit lexistence de distributions asymptotiques normales, contrairement aux distributions
asymptotiques non standard que lon obtenait traditionnellement en sries temporelles lorsque
T ! 1:
Paralllement, on peut tablir la convergence en probabilit de la quantit N
la mme faon. Pour un N x, on a :
N
1 X
Ai
N i=1

N
1 X
N i=1

T !1

PN

i=1

Ai de

Wi (r) dr

Lorsque N tend vers linni, la loi faible des grands nombres nous donne :
N
1 X
N i=1

Wi (r) dr

N !1

Wi (r) dr

Sachant que cette esprance est gale 1=2, on en dduit alors la convergence en probabilit
PN
squentielle du moment N1 i=1 Ai .
!
N
N
T
2
1 X
1 X 1 X 2
p
Ai =
y
!
(10)
N i=1
N i=1 T 2 t=1 i;t 1 (T;N !1)seq 2
Ainsi, partir des rsultats (9) et (10), on tablit immdiatement la distribution asymptotique squentielle de lestimateur b de la racine autorgressive (quation 8).
p

T N b

1 =

N
1 X
Ai
N i=1

N
1 X
p
Bi
N i=1

(T;N !1)seq

0;

On retrouve ainsi le rsultat de Levin et Lin (1992) dans le cas du modle sans eet individuel.
p
T N b

(T;N !1)seq

N (0; 2)

(11)

p
Notons la vitesse de convergence T N de lestimateur b que lon retrouvera dans le cadre de
lapplication que ce soit des tests de premire ou de deuxime gnration.
Il ne reste plus alors qu dterminer la distribution asymptotique squentielle de la statistique de test de Levin et Lin donne par lquation (7). Sachant que lestimateur s2 converge
squentiellement en probabilit vers la variance des rsidus 2 ; on a :

=1

h p
= T N b

v
u
N
u1 X
t
Ai
N i=1

1
s

(T;N !1)seq

N (0; 2)

On vrie alors que sous H0 la statistique de test de racine unitaire t


converge squentiellement vers une loi normale centre rduite :
Modle 1 :

=1

(T;N !1)seq

=1

de Levin et Lin

N (0; 1)

(12)

Ainsi, contrairement au cas des sries temporelles o les statistiques de Dickey-Fuller suivent
des distributions non standard, la statistique de Levin et Lin en panel est asymptotiquement
normalement distribue. Le mme rsultat peut tre tabli dans le cas dune convergence le
long dune diagonale. En ce sens, on peut dire que le panel contribue rhabiliter lusage
des tables de la loi normale dans le cadre des tests de racine unitaire. On retrouve de la
mme faon des distributions normales dans les modles avec eets individuels et/ou tendance
dterministe. Seules les esprances et les variances de ces lois normales changent. Ainsi, Levin
et Lin obtiennent les rsultats suivants en labsence dautocorrlation des rsidus :
p
p
l
Modle 2 :
1:25t =1 + 1:875N
!
N (0; 1)
(T;N !1)seq

Modle 3 :

448
277

=1

3:75 N

N (0; 1)

(T;N !1)seq

Pour nir, citons les travaux de Harris et Tzavalis (1999) qui proposent une extension des
tests de Levin et Lin (1992), toujours sous lhypothse dabsence dautocorrlation des rsidus,
pour des panels de taille T nie. Toutefois, ces premiers tests ne prennent pas en compte
lventuelle autocorrlation des rsidus. Cest pourquoi prsent, nous allons nous intresser
la mise en oeuvre des tests de Levin et Lin dans un cas gnral.

2.2

Mise en oeuvre du test de Levin et Lin dans le cas gnral

Dans le cas gnral, en prsence dune ventuelle autocorrlation des rsidus ( i;k 6= 0), le
test de Levin et Lin est construit partir de modles de type Dickey-Fuller Augments (ADF)
permettant de blanchir les rsidus et de se ramener des distributions connues pour les tstatistiques individuelles.
Modle 1 :

yi;t = yi;t

pi
X

yi;t

i;s

yi;t

(13)

i;t

s=1

Modle 2 :

yi;t =

i + yi;t

1+

pi
X

i;s

(14)

i;t

s=1

Modle 3 :

yi;t =

i+

i t + yi;t

1+

pi
X
s=1

10

i;s

yi;t

i;t

(15)

o i;t est i:i:d: 0; 2 ;i : Etant donn que lordre des retards pi permettant de purger lautocorrlation des rsidus est a priori inconnu, Levin et Lin proposent une procdure de test
en trois tapes applicable dans chacun des modles 1, 2 et 3. La manire dont Levin et Lin
ont construit leur test implique que ces trois tapes ne ncessitent nalement aucune technique
destimation propre aux donnes de panel : on peut donc utiliser les commandes de base de
lconomtrie des sries temporelles de tout logiciel pour le mettre en oeuvre.
Etape 1 Construction dun estimateur de la racine autorgressive
Lobjectif de cette premire tape consiste construire un estimateur b de la racine autorgressive commune: Pour cela, il convient tout dabord de dterminer, pour chaque individu,
lordre des retards optimal pi : Puisque ce niveau, on raisonne sur la base de rgressions individuelles indpendantes les unes des autres, les mthodes de slection du retard pi sont les mmes
quen sries temporelles. La mthode la plus simple, dite du pmax , consiste se donner un ordre
maximum de retard admissible pmax conditionnellement la dimension T des observations et
tester la signicativit du dernier retard partir de la statistique de Student qui admet dans
ce cas une distribution standard (voir Salani, 1999). Il est galement possible de recourir une
technique de vraisemblance pnalise consistant estimer plusieurs processus pour direntes
valeurs de p et retenir le modle minimisant les critres dinformation tels que ceux dAkaike
ou de Schwarz.
Une fois que lon dispose pour tous les individus du panel de lordre optimal des retards pi ;
i = 1; ::; N; on peut alors estimer le paramtre . Levin et Lin nestiment pas directement cette
racine autorgressive partir des modles ADF. La raison de ce choix technique tient simplement
au fait que la spcication dun paramtre de retard pi dirent selon les individus rend malaise
lapplication sous les logiciels usuels (Eviews, TSP, Limdep, Rats,...) des estimateurs de panels
(estimateur MCO, communment appel estimateur Within dans ce cas). Ainsi, plutt que
destimer directement les modles (13), (14) ou (15), Levin et Lin estiment de faon quivalente
deux rgressions auxiliaires individu par individu. Par exemple, si lon considre le modle 2, il
convient destimer pour chaque individu i = 1; ::; N; les deux quations suivantes par MCO :
Equation auxiliaire n 1 :

Equation auxiliaire n 2 :

yi;t = b
ai +
yi;t

=b
ci +

pi
X
s=1

pi
X
s=1

bbi;s yi;t
dbi;s yi;t

+ ebi;t

8t = pi + 2; ::; T

(16)

+ vbi;t

8t = pi + 2; ::; T

(17)

Dans le cas du modle 1, les quations auxiliaires sont identiques la dirence prs quil
ny a pas de constante dans la rgression. Dans le cas du modle 3, il convient au contraire de
rajouter une tendance aux rgressions (16) et (17). On dispose alors de N sries de ralisations
Ti
Ti
des rsidus individuels fb
ei;t gt=1
et fb
vi;t gt=1
o Ti = T pi 1 dsigne le nombre dobservations
disponibles pour lindividu i: On
peut
alors
construire un estimateur convergent
PN du paramtre
PN
en projetant directement les i=1 Ti ralisations des rsidus ebi;t sur les i=1 Ti ralisations
des rsidus vbi;t : Toutefois, an de contrler lhtroscdasticit inter-individuelle, on construit
au pralable des sries de rsidus normaliss :
eei;t =

ebi;t
b ;i

vei;t =

vbi;t
b ;i

8i = 1; ::; N; 8 t = pi + 2; ::; T

(18)

o lestimateur de la variance individuelle des rsidus b2 ;i correspond lestimateur standard


de la variance des rsidus du modle ADF (quation 13, 14 ou 15 suivant les cas). Pour un
individu i donn, cet estimateur peut tre simplement obtenu sans procder lestimation du

11

modle ADF, de la faon suivante :


b2 ;i =

1
pi

T
X

(b
ei;t

1 t=p

i +2

bi vbi;t )

8t = pi + 2; ::; T

(19)

o bi dsigne lestimateur des MCO du paramtre i dans la rgression ebi;t = bi vbi;t 1 + i;t pour
PN
Ti
Ti
et fe
vi;t gt=1
lindividu i: Ainsi, partir des i=1 Ti ralisations des rsidus normaliss fe
ei;t gt=1
pour i = 1; ::; N; on construit alors un estimateur convergent b de la racine autorgressive
commune en appliquant les MCO aux observations empiles dans le modle :
eei;t = b vei;t + "i;t

8i = 1; ::; N; 8 t = pi + 2; ::; T

(20)

Etape 2 Estimation des ratios de variances individuelles


Lobjectif de la deuxime tape consiste estimer la moyenne des N ratios si de la variance
de long terme 2i du modle sur la variance de court terme des rsidus individuels 2 ;i , pour
i = 1; ::; N :
N
N
1 X
1 X bi
SbN =
sbi =
N i=1
N i=1 b ;i

(21)

Cest prcisment cette moyenne des ratios de variances individuelles qui va nous servir dans
la dernire tape ajuster la moyenne de la distribution de la statistique de Student du test de
racine unitaire.
Etape 3 Construction de la statistique de test de Levin et Lin
A partir de lestimateur des MCO b obtenu ltape 1, on construit la statistique associe
au test H0 : = 0: De faon traditionnelle, on devrait utiliser pour cela la statistique de Student
dnie par :
b
t =0 =
(22)
bb
o bb2 dsigne un estimateur de la variance de b dni de faon standard par la quantit :
bb2

be2"

"

N
T
X
X

i=1 t=pi +2

2
vei;t

Lestimateur be2" de la variance des perturbations "i;t supposes tre homoscdastiques, est
dni de faon usuelle par la quantit :
be2"

N
X
i=1

Ti

"

N
T
X
X

i=1 t=pi +2

(e
ei;t

b vei;t )

Levin et Lin proposent dapproximer le nombre total dobservations


N Te = N (T p 1).

(23)
PN

i=1

Ti par la quantit

Dans le cas du modle 1 (sans constante), Levin et Lin dmontrent que la statistique de
test t =0 a une distribution asymptotique normale centre rduite sous lhypothse nulle de
racine unitaire H0 : = 0: Toutefois, ds lors que la composante dterministe du modle est
non nulle (cas des modles 2 ou 3), cette statistique de test diverge vers 1 sous H0 : Il est
donc ncessaire pour ces deux modles de construire une statistique corrige centre et rduite
12

permettant de se ramener dans tous les cas sous H0 une distribution normale centre rduite.
Ainsi, de faon gnrale, la statistique de test de racine unitaire de Levin et Lin scrit comme
une statistique de Student modie :
!
bN
1
S
Statistiques LL : t =0 =
t =0 N Te
bb
8m = 1; 2; 3
(24)
m;Te
be2"
m;Te
p 1 avec p =
o pour chaque modle (m = 1; 2 ou 3) suivant la dimension Te = T
PN
(1=N ) i=1 pi ; les auteurs proposent une valeur de la composante dajustement de la moyenne
et de la composante dajustement de la variance m;Te : Ces valeurs sont reportes dans le
m;Te
tableau 2.
Tab. 2 Facteurs dAjustement de la t-Statistique Corrige
Te
25
30
35
40
45
50
60
70
80
90
100
250
1

q
9
10
11
11
11
12
13
13
14
14
15
20

1;Te

0:004
0:003
0:002
0:002
0:001
0:001
0:001
0:000
0:000
0:000
0:000
0:000
0:000

1;Te

1:049
1:035
1:027
1:021
1:017
1:014
1:011
1:008
1:007
1:006
1:005
1:001
1:000

2;Te

0:554
0:546
0:541
0:537
0:533
0:531
0:527
0:524
0:521
0:520
0:518
0:509
0:500

2;Te

0:919
0:889
0:867
0:850
0:837
0:826
0:810
0:798
0:789
0:782
0:776
0:742
0:707

3;Te

0:703
0:674
0:653
0:637
0:624
0:614
0:598
0:587
0:578
0:571
0:566
0:533
0:500

3;Te

1:003
0:949
0:906
0:871
0:842
0:818
0:780
0:751
0:728
0:710
0:695
0:603
0:500

S o u rc e : Ta b le 2 , p a g e 1 4 , L e v in e t L in (2 0 0 2 )

Dans la premire colonne gure lapproximation


PN moyenne de la dimension temporelle des
observations Te = (T p 1) o p = (1=N ) i=1 pi : Pour une taille Te donne, gure dans
la deuxime colonne la valeur du paramtre de troncature qi retenu par Levin et Lin dans la
procdure destimation par noyau de la variance de long terme des rsidus (tape 2). Rappelons
que les auteurs nadoptent pas la dmarche dAndrews (1991) applique individu par individu,
et imposent le mme paramtre de troncature pour tous les individus du panel qi = q; 8i =
1; ::; N . On peut retrouver les valeurs des auteurs en retenant lentier le plus proche de la valeur
q = 3:21 Te1=3 : Dans les colonnes suivantes gurent les facteurs dajustement de lesprance et
de la variance de la statistique de Student pour les modles 1, 2 et 36 .
Tout dabord, dans le cas du modle 1 (sans constante ni tendance), comme nous lavons prcis, la statistique de Student standard t =0 (quation 22) converge asymptotiquement vers une
loi normale centre rduite : ds lors, il ny a pas besoin dapporter une quelconque correction
cette statistique de test pour obtenir une distribution asymptotique normale :
Modle 1 :
6 Il

p
!
1;Te e
T !1

0 et

p
!
1;Te e
T !1

convient de souligner que les rsultats gurant dans ce tableau sont obtenus sous lhypothse de nullit
des pi , ce qui ne nous permet donc pas dapprhender linuence des retards sur les rsultats. De mme, le fait
de retenir une valeur unique pour le paramtre de troncature q ne permet pas dapprcier limpact du choix
de ce paramtre sur les rsultats. Nous reviendrons sur ces problmes par la suite en voquant notamment la
sensibilit du test de Levin et Lin au nombre de retards retenus.

13

Par consquent, dans ce modle, la statistique corrige t =0 converge asymptotiquement vers la


statistique de Student non corrige t =0 ; cette dernire statistique convergeant elle mme vers
une loi normale centre rduite. Toutefois, pour des tailles dchantillons Te nies, Levin et Lin
proposent de corriger la statistique de Student, bien que les termes de correction soient trs
faibles pour lesprance et proches de lunit pour la variance, comme on peut le voir dans les
troisime et quatrime colonnes du tableau 1.
En revanche, dans les modles 2 (avec eets individuels) et 3 (avec tendance) la statistique
de Student t =0 diverge ngativement. Les termes de correction de lesprance 2;Te et 3;Te sont
donc asymptotiquement non nuls et les termes de correction de la variance 2;Te et 3;Te sont
asymptotiquement dirents de lunit contrairement au cas prcdent.
Sous lhypothse que lordre maximal des retards admissibles pmax (tape 1) crot une
vitesse T p avec 0 < p
1=4 et sous lhypothse que le paramtre de troncature qi (tape 2)
crot une vitesse7 T q avec 0 < q < 1, Levin et Lin tablissent la distribution asymptotique
de la statistique corrige t =0 : Ils montrent que, sous lhypothse nulle de racine unitaire, cette
statistique converge squentiellement et le long dune diagonale vers une loi normale centre
rduite quel que soit le modle retenu :
p
l
(25)
t =0
! N (0; 1) avec N =T ! 0
T;N !1

Ainsi, si la ralisation de la statistique corrige de Levin et Lin t =0 est infrieure au seuil de


la loi normale centre rduite (pour un test non symtrique 5% de risque de premire espce
ce seuil est gal 1:64), on rejette lhypothse nulle de racine unitaire pour lensemble des
individus du panel.
Quel gain de puissance peut-on esprer dun test de racine unitaire en panel comparativement aux tests eectus sur sries temporelles ? Comme le montrent Levin et Lin, pour des
chantillons de petite taille T on peut atteindre des puissances sensiblement plus importantes
que celles obtenues dans le cas de tests mens sur sries temporelles individuelles. Tout dabord,
la taille du test en panel est correcte, mme si elle est lgrement sous-estime dans des panels
de taille N modre. En labsence deets xes individuels (modle 1), on sait que pour de
petites tailles dchantillon (T
50), la puissance des tests de Dickey-Fuller est relativement
faible (27% pour un risque de premire espce de 5% pour T = 25): Or, pour une mme taille
T; lapplication du test de Levin et Lin conduit des niveaux de puissance beaucoup plus importants et ce mme si le panel a une faible dimension individuelle N: Ainsi, avec seulement 10
individus pour T = 25, la puissance du test de Levin et Lin est de lordre de 99% dans lexprience simule par les auteurs. Ces quelques expriences8 montrent quel point, pour une taille
empirique peu prs similaire, les gains de puissance peuvent tre importants dans le passage
des tests de racine unitaire en panel lorsque la dimension temporelle est modre (T < 250).
Toutefois, lorsque la dimension T est su samment grande, les tests usuels de racine unitaire
sont su samment puissants et peuvent tre appliqus sparment chaque individu du panel.
Il ny a alors aucun intrt (en termes de puissance et de taille) passer au panel pour tudier
la non stationnarit. Des rsultats similaires peuvent tre obtenus partir des autres tests de
racine unitaire en panel que nous prsenterons par la suite. Ainsi, un des arguments principaux
qui motivent le passage au panel rside dans les gains de puissance sur de petits chantillons.
Enn, en prsence de termes dterministes (eets xes et/ou tendance temporelle), la puissance
du test usuel de Dickey-Fuller est trs faible, mme pour des sries temporelles relativement
longues (T < 100) alors quelle peut tre trs leve pour le test de Levin et Lin dans des panels
de taille modre (N = 10 et T = 50 ou N = 25 et T = 25).
7 Ce

qui est le cas avec la fentre dAndrews (1991).


Levin, Lin et Chu (2002) ou Maddala et Wu (1999) pour une discussion plus approfondie sur les gains
en puissance des tests de racine unitaire en panel et la comparaison de la puissance des dirents tests de panel.
8 Voir

14

Les tests dIm, Pesaran et Shin

Comme nous lavons voqu, une des principales limites du test de Levin et Lin rside dans le
caractre homogne de la racine autorgressive sous lhypothse alternative. Il est peu probable
en eet quen cas de rejet de lhypothse de racine unitaire on puisse accepter lhypothse
dune racine autorgressive i commune tous les individus si lon applique des tests usuels de
spcication9 . Les tests proposs par Im, Pesaran et Shin dans une srie de contributions (1997,
2002 et 2003) permettent de rpondre cette critique. En eet, ces auteurs furent les premiers
dvelopper un test autorisant sous lhypothse alternative non seulement une htrognit
de la racine autorgressive i 6= j , mais aussi une htrognit quant la prsence dune
racine unitaire dans le panel.
Im, Pesaran et Shin (IPS par la suite) considrent un modle avec eets individuels et sans
tendance dterministe (quivalent du modle 2 chez Levin et Lin). En labsence dautocorrlation des rsidus, ce modle scrit :
Modle IPS :

yi;t =

i yi;t 1

+ "i;t

(26)

2
o leet individuel i est dni par i =
i i avec i 2 R et o "i;t s N:i:d: 0; ";i : Le
test dIPS, tout comme le test de Levin et Lin est un test joint de lhypothse nulle de racine
unitaire ( i = 0) et de labsence deets individuels puisque sous lhypothse nulle i = 0:

Test IPS :

H0 :
H1 :

= 0; 8i = 1; ::; N
i < 0; 8i = 1; 2; ::; N1
i = 0; 8i = N1 + 1; N1 + 2; ::; N

Sous lhypothse alternative peuvent coexister deux types dindividus : des individus indics
i = 1; ::; N1 pour lesquels la variable yi;t est stationnaire et des individus indics i = N1 +
1; ::; N pour lesquels la dynamique de la variable yi;t admet une racine unitaire: La taille N1 de
lensemble des individus stationnaires est a priori inconnue mais vrie 0 < N1 N , puisque
si N1 = 0 on retrouve alors lhypothse nulle. On admet en outre que le ratio N1 =N vrie
limN !1 N1 =N = avec 0 <
1:
Ainsi, le premier avantage de lapproche dIPS par rapport Levin et Lin tient la prise
en compte de lhtrognit de la racine autorgressive sous lalternative. Mais ce nest pas
le seul avantage. Comme nous allons le voir, les auteurs proposent une statistique de test trs
simple fonde sur la moyenne des statistiques de Dickey-Fuller ou de Dickey-Fuller Augmentes
individuelles.
Sous lhypothse dabsence dautocorrlation des rsidus, IPS drivent la loi asymptotique
de leur statistique moyenne (lorsque T et N convergent vers linni) mais aussi la loi semiasymptotique lorsque T est xe et N converge vers linni. Dans ce cas, il est en eet
possible de driver la loi exacte de la statistique de test de racine unitaire pour une taille
T quelconque, contrairement la statistique de Levin et Lin. IPS proposent mme dans
ce cas des approximations des seuils de rejet distance nie pour T et N xes.
En revanche, sous lhypothse dautocorrlation des rsidus, on ne peut plus caractriser
la loi exacte de la statistique moyenne pour une taille T donne : IPS drivent dans ce
cas les lois asymptotiques pour T et N tendant vers linni (soit de faon squentielle,
soit le long dune diagonale) et proposent deux statistiques moyennes standardises. On
retrouve encore une fois une distribution normale.
9 Voir Hurlin (2001) pour les tests dhomognit dans le cas dun modle linaire et Phillips et Sul (2003a)
pour un test dhomognit de la racine autorgressive.

15

3.1

Une moyenne de statistiques individuelles

Considrons le cas le plus simple o les rsidus "i;t du modle (26) sont N:i:d: 0; 2";i et o la
taille dchantillon disponible pour lestimation de chaque quation individuelle est identique10
pour tous les pays : Ti = Tj = T: Tout comme Levin et Lin, IPS supposent que les rsidus sont
indpendants dans la dimension individuelle. Dans ce cas, ils proposent une statistique de test
note t_barN T dnie par la moyenne des N statistiques individuelles de Dickey-Fuller :
t_barN T =

N
1 X
tiT
N i=1

o tiT correspond la statistique de Student associe11 lhypothse nulle


modle (26).

(27)

= 0 dans le

Quelle est la loi de cette statistique moyenne t_barN T sous H0 ? Commenons par voquer
le cas de la distribution asymptotique lorsque les deux dimensions N et T tendent vers linni.
Pour ce faire, nous considrerons le cas le plus simple de la convergence squentielle lorsque T
puis N tendent vers linni. On sait que sous lhypothse nulle de non stationnarit i = 0; la
statistique du test joint de Dickey-Fuller de lindividu i converge lorsque T tend vers linni
vers une distribution non standard (Dickey et Fuller, 1979) dnie par :
h
i
R1
2
1
W
(r)
1
Wi (1) 0 Wi (r) dr
i
2
d
8i = 1; ::; N
(28)
tiT !
hR
i2 21
T !1
R1
1
2
Wi (r) dr
Wi (r) dr
0
0
o les variables Wi (r) ; pour i = 1; ::; N; dsignent des mouvements Browniens standard indpendants. On sait en outre que cette distribution asymptotique admet des moments dordre
deux nis (Nabeya, 1999), avec E (tiT ) = 1:533 et V ar (tiT ) = 0:706 quand T ! 1: De
plus, sous lhypothse dindpendance inter-individuelle des rsidus, on peut montrer que les
statistiques individuelles tiT sont indpendantes. Ainsi, en rsum, lorsque la dimension T tend
vers linni, les statistiques individuelles tiT sont (i) identiquement et (ii) indpendamment
distribues selon une distribution admettant (iii) des moments dordre deux nis. Or, la statistique de test dIPS nest rien dautre que la moyenne sur N de ces statistiques individuelles.
Il su t donc, dans un second temps de faire tendre N vers linni et dappliquer le thorme
central limite de Lindberg-Levy an de montrer que la moyenne de ces N statistiques individuelles converge vers une loi normale. En dnitive, lorsque T puis N tendent vers linni,
t_barN T converge vers une loi normale. On dnit alors une variable moyenne standardise
Ztbar convergeant une loi normale centre rduite.
p
N (t_barN T + 1:533)
l
p
Ztbar =
!
N (0; 1)
(29)
(T;N !1)seq
0:706

En outre, par ce mme raisonnement, IPS peuvent tablir la loi exacte (sous lhypothse
dabsence dautocorrlation des rsidus) de leur statistique pour une taille T xe lorsque N
tend vers linni. Ce rsultat est particulirement intressant pour les applications dans le cas
des panels macro-conomiques o la taille est gnralement faible, de lordre de 30 points.
1 0 Dans le cas contraire, on conserve les mmes lois asymptotiques et semi-asymptotiques, mais la dmonstration de ce rsultat requiert lapplication du thorme limite de Lyapunov et non plus celui de Lindberg-Levy.
En eet, dans ce cas, les statistiques individuelles ne sont plus identiquement distribues Ti ni.
1 1 IPS considrent deux dnitions notes e
tiT et tiT de la statistique de Student suivant la dnition de
lestimateur de la variance des rsidus. Nous considrerons ici la statistique tiT programme sous les logiciels
usuels.

16

Contrairement au cas o T tend vers linni, on ne connat pas la distribution exacte de la


statistique individuelle tiT pour une taille T donne. Pour autant, il est possible de montrer
que la distribution de la moyenne t_barN T converge vers une loi normale lorsque N tend vers
linni en utilisant toujours le thorme central limite de Lindberg-Levy. Pour ce faire, il convient
de montrer les points (i), (ii) et (iii) sans connatre la distribution exacte des tiT pour un T
xe. Lastuce dIPS consiste alors exprimer les statistiques de Dickey-Fuller sous la forme dun
produit de ratios de formes quadratiques dnies dans un vecteur normal, puis appliquer le
thorme de Magnus (1986). Ce thorme permet, sous des conditions trs gnrales, de driver
les moments exacts dun ratio de formes quadratiques dnies dans un vecteur normal, ainsi que
les conditions dexistence de ces moments. Ainsi, en utilisant une ingalit de Cauchy-Schwarz,
on peut driver trs simplement une condition12 qui garantit que les moments dordre deux
des statistiques individuelles sont nis : cette condition se ramne tout simplement lingalit
T
6. Ds lors sous cette condition, lapplication du thorme central limite13 nous permet
dtablir la loi exacte de la statistique moyenne standardise, note Ztbar :
p
N [t_barN T E (tiT )] l
p
! N (0; 1) si T 6
(30)
Ztbar =
N !1
V ar (tiT )
o E (tiT ) et V ar (tiT ) dsignent respectivement lesprance et la variance de la statistique
de Dickey-Fuller. Lorsque T tend vers linni, ces moments tendent vers les moments de la
distribution asymptotique de Dickey-Fuller et lon retrouve la statistique standardise (29).
Toutefois, pour des tailles dchantillon T plus petites, lutilisation des moments de la distribution asymptotique de Dickey-Fuller peut conduire une perte de puissance des tests. Cest
pourquoi IPS proposent des valeurs simules pour ces deux moments pour direntes tailles
T (voir tableau 3). Prenons par exemple le cas dun panel de taille T = 10 avec N = 5: On
construit la statistique moyenne standardise Ztbar partir de la statistique moyenne t_barN T
en utilisant E (tiT ) = 1:504 et V ar (tiT ) = 1:069. Pour un risque de premire espce de %;
on compare alors la ralisation de Ztbar au seuil z de la loi normale centre rduite obtenue
sous lhypothse N ! 1. Pour un risque de 5%, si la ralisation de Ztbar est infrieure au seuil
1:64 on rejette lhypothse nulle de racine unitaire pour lensemble des individus du panel.

Enn, partir de la loi exacte de la statistique standardise Ztbar obtenue sous lhypothse
N ! 1; IPS proposent des approximations des seuils pour la statistique moyenne t_barN T dans
le cas dchantillons de petite dimension N . Ces valeurs critiques approximes notes cT ( ),
pour un niveau de risque de premire espce de %; peuvent tre obtenues par la formule
suivante :
p
N 1 V ar (tT ) + E (tT )
(31)
cT ( ) = z
o z dsigne la valeur critique associe une distribution normale centre rduite pour un
niveau de risque de %: Reprenons lexemple dun panel de taille T = 10 avec N = 5: On
peut tester la racine unitaire partir de la statistique Ztbar : Toutefois, lutilisation de la loi
semi-asymptotique obtenue sous lhypothse N ! 1 pour un panel de cette dimension peut
conduire une faible puissance ou des distorsions de taille. Une autre solution consiste
comparer directement la ralisation de la statistique moyenne t_barN T au seuil approxim

1 2 Il convient de prciser que cette condition thorique ne peut tre drive qu partir des statistiques individuelles non corriges e
tiT : Mais la mme condition est obtenue par simulation dans le cas des statistiques
corriges tiT .
1 3 Dans le cas dun panel non cylindr o les tailles T dirent selon les individus, on obtient le mme rsultat
i
asymptotique ds lors que Ti 10; 8i = 1; ::; N avec :
i
p h
P
N t_barN T N 1 N
i=1 E (tiT )
l
q
Ztbar =
! N (0; 1)
P
N !1
V
ar
(t
)
N 1 N
iT
i=1

puisque les moments individuels E (tiT ) et V ar (tiT ) varient selon la taille Ti (tableau 3).

17

Tab. 3 Moments des Statistiques Individuelles tiT


T
6
10
15
20
25
30
40
50
100
500
1

E (tiT )
1:520
1:504
1:514
1:522
1:520
1:526
1:523
1:527
1:532
1:531
1:533

V ar (tiT )
1:745
1:069
0:923
0:851
0:809
0:789
0:770
0:760
0:735
0:715
0:706

S o u rc e : Ta b le 1 , p a g e 6 0 , IP S (2 0 0 3 )

cT ( ) pour une taille N = 5: Dans notre exemple, pour un risque de premire espce de 5%,
en utilisant les moments
simuls du tableau 3, on montre que le seuil approxim est gal
p
cT ( ) = 1:64
5 1 1:069 1:504 = 2: 2623: Si la ralisation de la statistique moyenne
t_barN T est infrieure ce seuil, on rejette lhypothse nulle. IPS montrent que les seuils
approxims sont trs proches des seuils de la vraie loi N ni de la statistique moyenne
t_barN T obtenus par simulation.
En rsum, en labsence dautocorrlation des rsidus, ds lors que T
6 pour un panel
cylindr, la statistique standardise Ztbar suit sous lhypothse nulle de racine unitaire une loi
normale lorsque N tend vers linni. Cest encore une fois lune des principales dirences avec
les tests sur sries temporelles, o les distributions asymptotiques des statistiques sont non
standard.

3.2

Mise en oeuvre du test dans le cas gnral

A prsent plaons nous dans le cas gnral o il existe une ventuelle autocorrlation des
rsidus. On considre un modle de type Dickey-Fuller Augment (ADF) pour chaque individu
i = 1; ::; N du panel :
Modle IPS :

yi;t =

i+

i yi;t

1+

pi
X

i;j

yi;t

+ "i;t

(32)

j=1

2
o leet individuel i est dni par i =
i i avec i 2 R et o "i;t est N:i:d: 0; i : Comme
pour tous les tests de premire gnration, les rsidus sont indpendamment distribus dans la
dimension individuelle. On remarque quIPS autorisent la prsence dune autocorrlation des
rsidus dordre dirent pour chaque individu du panel. Ceci implique que le nombre de termes
ADF dire a priori suivant les individus pi 6= pj comme dans le test de Levin et Lin. Les
hypothses nulle et alternative du test sont les mmes que dans le cas prcdent. Pour mener
bien ce test, IPS proposent nouveau dutiliser la moyenne des statistiques individuelles ADF :

t_barN T =

N
1 X
tiT (pi ;
N i=1

i)

(33)

o tiT (pi ; i ) correspond la statistique individuelle de Student associe lhypothse nulle


H0;i : i = 0 dans le modle (32) pour un nombre de retards pi et un vecteur de paramtres ADF
18

= i;1 ; ::; i;pi : Il sagit de la statistique ADF standard obtenue partir dun modle avec
constante et qui est programme dans la plupart des logiciels usuels pour un retard pi donn.
Pour chaque individu, le choix du retard optimal pi permettant de purger lautocorrlation des
rsidus peut tre choisi de la mme faon que dans le cas des tests de Levin et Lin.
i

A partir des N statistiques ADF individuelles tiT (pi ; i ), on construit la statistique standardise Ztbar (p; ) centre sur lesprance de la distribution asymptotique de la statistique
individuelle ADF et rduite par la variance de cette mme distribution :
p
N [t_barN T E ( )]
p
(34)
Ztbar (p; ) =
V ar ( )

o les moments E ( ) et V ar ( ) correspondent lesprance et la variance de la distribution


asymptotique (quand T ! 1) dune statistique ADF sous lhypothse nulle de racine unitaire
( i = 0) dans un modle avec constante. Comme nous lavons prcis, ces moments sont respectivement gaux E (tiT ) = 1:533 et V ar (tiT ) = 0:706. Ainsi, on peut trs facilement montrer
que la statistique Ztbar (p; ) converge squentiellement vers une loi normale centre rduite
lorsque T puis N tendent vers linni.

Il est vident toutefois que cette approche fonde sur la distribution asymptotique peut
poser problme dans des panels de petite taille T . Cest pourquoi IPS proposent une seconde
statistique standardise, note Wtbar (p; ) ; qui asymptotiquement possde la mme distribution
que Ztbar (p; ) ; mais qui en outre possde lavantage dtre beaucoup plus puissante distance
nie. Cest gnralement la statistique de test dIPS que lon retient14 , puisque cest la plus
gnrale (elle tient compte de lautocorrlation des rsidus) et la plus puissante. Cette statistique
standardise est dnie de la mme faon que Ztbar (p; ) la dirence prs que lon centre et
lon rduit partir des moments de la statistique ADF obtenue sous lhypothse nulle de racine
unitaire (comme pour Ztbar (p; )) et sous lhypothse que les paramtres i des termes ADF
sont nuls pour tous les individus. Ces moments sont respectivement nots E [ tiT (pi ; 0)j i = 0] et
V ar [ tiT (pi ; 0)j i = 0]. Il convient de noter que ces moments tiennent compte de linformation
contenue dans le nombre de retards pi : Asymptotiquement, cette statistique dIPS standardise
converge vers la mme distribution que la statistique Ztbar (p; ) :
i
p h
PN
N t_barN T N 1 i=1 E [ tiT (pi ; 0)j i = 0]
l
q
Wtbar (p; ) =
! N (0; 1)
(35)
P
T;N
!1
N
N 1 i=1 V ar [ tiT (pi ; 0)j i = 0]
Les moments E [ tiT (pi ; 0)j i = 0] et V ar [ tiT (pi ; 0)j i = 0] ont t tabuls pour dirents
ordres de retards pi et direntes tailles T par les auteurs. Certaines valeurs pour le modle
sans tendance sont reportes dans le tableau 4. Tout comme pour les rsultats de la section
prcdente, ces rsultats peuvent tre tendus au cas de panels non cylindrs prsentant des
tailles Ti direntes selon les individus.

Les simulations menes par IPS montrent quen labsence de corrlation, la statistique Ztbar
(quation 30) conduit de trs bons rsultats en termes de taille et de puissance et ce mme
en petit chantillon (T = 10). Lorsque le nombre de retards est correctement choisi ou surestim, la taille du test Ztbar est trs satisfaisante, mme pour T = 10. De plus, la puissance
est largement suprieure celle dun test de Dickey-Fuller men sur sries temporelles. Un tel
rsultat illustre lapport de la dimension individuelle comparativement la prise en compte
1 4 Cest le cas dans la prsentation de Banerjee (1999), mais pas dans celle de Baltagi et Kao (2000) qui
privilgient la statistique Ztbar (p; ) : Toutefois, IPS (2003) nvaluent la puissance de leur test qu partir de
la statistique Wtbar (p; ) :

19

Tab. 4 Moments des Statistiques Individuelles tiT (pi ; 0)


T
10
15
20
25
30
40
50
60
70
100

pi = 0
Mean
Var
1:504 1:069
1:514 0:923
1:522 0:851
1:520 0:809
1:526 0:789
1:523 0:770
1:527 0:760
1:519 0:749
1:524 0:736
1:532 0:735

pi = 1
Mean
Var
1:488 1:255
1:503 1:011
1:516 0:915
1:514 0:861
1:519 0:831
1:520 0:803
1:524 0:781
1:519 0:770
1:522 0:753
1:530 0:745

pi = 2
Mean
Var
1:319 1:421
1:387 1:078
1:428 0:969
1:443 0:905
1:460 0:865
1:476 0:830
1:493 0:798
1:490 0:789
1:498 0:766
1:514 0:754

pi = 3
Mean
Var
1:306 1:759
1:366 1:181
1:413 1:037
1:433 0:952
1:453 0:907
1:471 0:858
1:489 0:819
1:486 0:802
1:495 0:782
1:512 0:761

pi = 4
Mean
Var
1:171 2:080
1:260 1:279
1:329 1:097
1:363 1:005
1:394 0:946
1:428 0:886
1:454 0:842
1:458 0:819
1:470 0:801
1:495 0:771

S o u rc e : Im , P e sa ra n e t S h in (2 0 0 3 ), Ta b le 3 , p a g e 6 6

de la seule dimension temporelle. Des rsultats allant dans le mme sens sont obtenus par les
auteurs dans le cas dune autocorrlation des rsidus sur la base de la statistique Wtbar (p; ),
mais il convient alors que T et N soient su samment importants.
Par ailleurs, ces simulations montrent que le choix du nombre de retards pi dans les rgressions ADF individuelles est crucial. On connat traditionnellement ce problme en sries
temporelles (Ng et Perron, 1995 ou Lopez, 1997). Si lon surestime le nombre de retards, la
puissance du test ADF est dtriore, mais le problme est plus fondamental si le nombre de
retards est sous valu : dans ce cas la paramtrisation du modle ne permet pas de blanchir
totalement les rsidus, en consquence de quoi les distributions asymptotiques de Dickey-Fuller
ne sont plus valides. Il est donc vident quen panel, la puissance de la statistique Ztbar (p; )
dIPS fonde sur une moyenne de statistiques ADF et standardise partir des moments E ( )
et V ar ( ) de la distribution asymptotique de Dickey-Fuller est extrmement sensible au choix
des retards pi : Si lorsque T tend vers linni, une ou plusieurs statistiques ADF individuelles ne
convergent plus vers parce que lon a sous estim pi ; la statistique standardise Ztbar (p; ) na
plus de sens. Il en va de mme pour Wtbar (p; ). A titre dexemple, les auteurs montrent que
lorsque lon retient de manire errone un nombre de retards gal zro, la taille du test tend
vers zro. Notons que ce problme se pose avec autant dacuit dans le cas du test de Levin et
Lin.

Le test de Maddala et Wu

Le troisime test de cette premire gnration est un test non paramtrique de Fisher (1932)
initialement appliqu ltude de la PPA par Choi15 (2001) et prsent de faon gnrale par
Maddala et Wu (1999). Le principe est simple et repose sur une combinaison des niveaux de
signicativit (cest--dire des p-values) de N tests individuels de racine unitaire indpendants.
Soit pi = FTi (Gi ) la p-value associe une statistique de test Gi de lhypothse nulle de racine
unitaire pour un individu i donn o FTi (:) dsigne la fonction de rpartition associe la
statistique individuelle Gi pour un chantillon de taille Ti : La statistique de test Gi peut tre
choisie comme la t-statistique dun test ADF; o la statistique de nimporte quel autre test
de lhypothse nulle de racine unitaire (Phillips et Perron, 1988, Elliott, Rothenberg et Stock,
1996, etc.). Il existe alors de trs nombreuses faons de combiner les p-values an de construire
1 5 La version document de travail date de 1999 : Choi I. (1999), Unit Root Tests for Panel Data, Manuscript,
Kookmin University, Core.

20

un test de racine unitaire en panel (en utilisant le minimum, la somme, etc.). Maddala et Wu
(1999) retiennent la statistique de test dnie par la quantit :
PM W =

N
X

ln (pi )

(36)

i=1

Si les statistiques individuelles de test sont continues, les p-values sont distribues selon des
lois uniformes sur [0; 1] et ln (pi ) est distribue selon un 2 (1) ; 8i = 1; ::; N: Maddala et Wu
(1999) considrent le cas o les statistiques individuelles sont indpendantes. Tout comme IPS
ou Levin et Lin, ce test est donc un test de premire gnration reposant sur lexclusion dune
quelconque relation entre les statistiques individuelles et plus gnralement sur labsence de
corrlation inter-individuelle. Sous cette hypothse, la statistique PM W suit, sous lhypothse
nulle de racine unitaire, un 2 (2N ) quelle que soit la taille N de lchantillon. Pour un risque
de premire espce donn, si la ralisation de PM W est suprieure au seuil dun 2 (2N ) on
rejette lhypothse nulle de racine unitaire pour les individus du panel.
Pour des valeurs leves de N , Choi (2001) suggre dutiliser la statistique standardise
suivante :
ZM W =

N N

PM W

E [ 2 ln (pi )]

V ar [ 2 ln (pi )]

N
1 X
[ 2 ln (pi )
= p
2 N i=1

2]

(37)

En eet, sous lhypothse de continuit de la statistique Gi ; on sait que E [ 2 ln (pi )] = 2 et


V ar [ 2 ln (pi )] = 4: La statistique de Choi correspond ainsi tout simplement une statistique
moyenne de type N 1 PM W centre et rduite. Si lon suppose que les p-values sont i:i:d:,
lutilisation du thorme de Lindberg-Levy nous permet de conclure que la statistique rduite
ZM W suit sous H0 une loi N (0; 1) lorsque N tend vers linni.
Tout comme le test propos par IPS, le test de Maddala et Wu (1999) ne retient pas lhypothse alternative restrictive du test de Levin et Lin selon laquelle le coe cient autorgressif i
est le mme pour tous les individus. Ce test est donc directement comparable au test IPS et lui
est trs similaire. Les deux tests reposent sur une combinaison de statistiques individuelles : des
statistiques ADF chez IPS et des seuils de signicativit chez Maddala et Wu. Les deux tests
peuvent tre appliqus sur des panels non cylindrs16 et on peut ventuellement tablir soit la
loi exacte (chez Maddala et Wu), soit une approximation des seuils (chez IPS) de la statistique
de test pour une taille N xe.
Quels sont donc les avantages respectifs des deux tests ? Les deux tests peuvent tout dabord
tre compars en termes de taille empirique et de puissance (contrairement au test de Levin
et Lin qui nadmet pas la mme hypothse alternative). Maddala et Wu considrent une srie
dexpriences dans lesquelles leur statistique de Fisher est construite partir des p-values des
t-statistiques des tests ADF individuels. Il ressort que ce test de Fisher domine lgrement le
test dIPS, puisque pour des tailles empiriques similaires la puissance du test est lgrement
augmente. Lorsque T est su samment grand (T = 50 ou 100); les puissances sont comparables, mais les distorsions de taille sont moins importantes avec le test de Maddala et Wu.
Un autre avantage traditionnel dune approche non paramtrique comme celle de Maddala et
Wu rside dans la robustesse notamment une erreur de spcication sur la distribution des
rsidus (supposs normalement distribus chez IPS). En revanche, le principal inconvnient
empirique de lapproche de Maddala et Wu provient de la ncessit de simuler par Bootstrap
1 6 Contrairement ce qui est avanc dans la synthse de Baltagi et Kao (2000) fonde sur la version de 1997
du papier dIPS.

21

les distributions des statistiques individuelles an de construire les p-values individuelles17 . A


linverse, on a vu que les statistiques standardises des tests dIPS peuvent tre construites
partir des moments fournis par les auteurs, ce qui en facilite dautant la mise en oeuvre.

Le test de stationnarit de Hadri (2000)

Se dmarquant des trois tests de racine unitaire de premire gnration prsents prcdemment qui reposaient sur lhypothse nulle de non stationnarit, le test de Hadri (2000) est bas
sur lhypothse nulle de stationnarit. Ce test consiste en une extension du test de stationnarit
propos par Kwiatkowski et al. (1992) dans le cadre de lconomtrie des sries temporelles. Il
sagit dun test du multiplicateur de Lagrange visant tester lhypothse nulle de stationnarit
des sries yi;t (pour i = 1; :::; N ) contre lhypothse alternative de racine unitaire. Hadri (2000)
considre les deux modles suivants :
yi;t = ri;t + "i;t

(38)

et
yi;t = ri;t +

it

+ "i;t

(39)

o ri;t est une marche alatoire : ri;t = ri;t 1 + ui;t , ui;t est i:i:d: 0; 2u , ui;t et "i;t tant
indpendants. Lhypothse nulle peut alors scrire 2u = 0. Par ailleurs, dans la mesure o les
"i;t sont supposs i.i.d., alors, sous lhypothse nulle, yi;t est stationnaire en niveau pour le
modle (38) et stationnaire autour dune tendance dterministe pour le modle (39). Le modle
(38) peut encore scrire :
yi;t = ri;0 + ei;t

(40)

et le modle (39) :
yi;t = ri;0 +
avec ei;t =
htrognes.

Pt

j=1

it

+ ei;t

(41)

ui;j + "i;t , ri;0 tant des valeurs initiales jouant le rle de constantes

"i;t est stationnaire (ri;t est une


Il convient de remarquer que si 2u = 0, alors ei;t
constante). Si 2u 6= 0, ei;t est non stationnaire (ri;t est une marche alatoire). Plus spciquement, Hadri (2000) teste lhypothse nulle = 0 contre lhypothse alternative > 0 o
= 2u = 2" : En notant e^i;t les rsidus estims de (40) ou (41), la statistique LM est donne
par :
!
N X
T
X
1 1
2
LM = 2
Si;t
(42)
^ " N T 2 i=1 t=1
Pt
o Si;t dsigne la somme partielle des rsidus : Si;t =
^i;j et ^ 2" est un estimateur
j=1 e
2
convergent de " . Sous lhypothse nulle de stationnarit en niveau (modle (38)), la statistique de test :
hR
io
p n
1
N LM E 0 V (r)2 dr
r h
Z =
(43)
i
R1
V 0 V (r)2 dr

suit une loi normale centre rduite, o V (r) est un pont brownien standard, pour T ! 1 suivi
R1
de N ! 1. Les cumulants de la fonction caractristique de 0 V 2 donnent respectivement

1 7 Nous faisons gurer inconvnient empiriqueentre guillemets dans la mesure o il va de soi que cet argument
purement empirique ne doit pas constituer un frein la mise en oeuvre du test de Maddala et Wu et ne constitue
en aucun cas un critre de choix entre les tests.

22

R1
la moyenne et la variance de 0 V (r)2 intervenant dans (43) : 1=6 (cumulant dordre 1) pour
lesprance et 1=45 (cumulant dordre 2) pour la variance (voir Hadri, 2000 pour les dtails).
Sous lhypothse nulle de stationnarit autour dune tendance dterministe (modle (39)),
la statistique de test :
hR
i
p
1
N LM E 0 V2 (r)2 dr
r h
(44)
Z =
i
R1
V 0 V2 (r)2 dr

R1
suit une loi normale centre rduite, o V2 (r) = W (r)+(2r 3r2 )W (1)+6r(r 1) 0 W (s)ds
R1
(voir Kwiatkowski et al. (1992)). La moyenne et la variance de 0 V22 sont donnes par les deux
premiers cumulants soit, respectivement, 1/15 et 11/6300.
Pour nir, notons que Hadri (2000) a propos une extension de son test consistant relcher
lhypothse selon laquelle les erreurs "it sont iid an de tenir compte de la prsence de corrlation
srielle.
An dtudier les performances de son test, Hadri (2000) a men des simulations de Monte
Carlo. Celles-ci font globalement ressortir que la prcision du test est dautant plus importante
que T et N sont su samment importants. Plus spciquement, la taille du test Z est proche
de la taille thorique de 5% pour T > 10 et la taille du test Z est correcte pour T > 25.
Concernant la puissance, il ressort que celle-ci augmente avec la valeur de pour tout T et N .

Comparaison et bilan des tests de premire gnration

Les simulations de Im et al. ont pour objet de comparer les performances des tests de Levin
et Lin (LL) et dIPS (Ztbar ). Les principaux rsultats peuvent snoncer comme suit :
En labsence de corrlation srielle, et comparativement au test Ztbar , le test LL a tendance
rejeter trop frquemment lhypothse nulle lorsque N augmente. Par ailleurs, pour de
faibles valeurs de T , le test Ztbar donne de meilleurs rsultats que le test LL en termes de
puissance.
En prsence de corrlation srielle, le test LL tend nouveau rejeter trop frquemment
lhypothse nulle, ceci tant dautant plus marqu que N est lev. Il ressort galement que
le test Ztbar est plus puissant que le test LL. De manire gnrale, lorsque le nombre de
retards dans les rgressions ADF est correctement choisi ou sur-estim, les performances
du test Ztbar sont meilleures que celles du test LL.
Les simulations eectues par Breitung (2000) ont galement pour objet de comparer les
performances des tests Ztbar et LL. Celles-ci font ressortir que la puissance de ces deux tests est
trs sensible la spcication des termes dterministes et tend diminuer fortement lorsque
des tendances spciques individuelles sont inclues.
Selon Maddala et Wu (1999) et Levin et al. (2002), les comparaisons directes entre les
tests LL et Ztbar ne sont pas valides car, mme si les deux tests reposent sur une hypothse
nulle identique, lhypothse alternative est dirente. On rappelle en eet que, sous lhypothse
alternative, le coe cient autorgressif est le mme pour tous les individus pour le test LL, alors
que ce mme coe cient peut direr entre les individus pour le test Ztbar . Par ailleurs, Maddala
et Wu (1999) ont men des simulations an de comparer leur test (MW), le test LL et le test
Ztbar . Selon ces auteurs, le test Ztbar et le test MW sont directement comparables ds lors
que le test de racine unitaire utilis est le test ADF. Leurs simulations mettent en vidence les
rsultats suivants :
Pour des tailles dchantillon gales entre les individus, lorsque le coe cient autorgressif
i nest pas trop variable et proche de 1, le test Ztbar est plus puissant que le test MW.
Lorsque, sous lhypothse alternative, i nest pas trop proche de 1 (par exemple i = 0; 8),

23

le test MW est plus puissant que le test Ztbar . Dans tous les cas, les tests Ztbar et MW
sont plus puissants que le test LL.
Pour des tailles dchantillon ingales, le test MW est plus performant que les tests Ztbar
et LL.
En prsence de corrlation dans les termes derreur entre les individus, le test MW est plus
performant en termes de taille que le test Ztbar , pour T grand et un nombre dindividus
modr. Lorsque T et N sont grands, la taille du test MW est comparable celle du test
Ztbar .
Maddala et Wu (1999) concluent alors de manire gnrale que leur test est plus performant
que les tests Ztbar et LL. Les simulations menes par Choi (1999), visant galement comparer
les performances des tests Ztbar et de MW, montrent que la taille des deux tests est proche de
la taille thorique de 5% lorsque N est faible et que la taille du test Ztbar est plus stable que
celle du test MW. En termes de puissance (corrige par la taille), il ressort que le test MW
donne de meilleurs rsultats que le test Ztbar . Enn, la puissance des deux tests diminue de
faon trs importante lorsquest introduite une tendance dterministe.
Concernant le test de Hadri (2000), on peut simplement noter quun de ses avantages rside
dans des considrations purement empiriques : les moments de sa distribution asymptotique
sont drivs de manire exacte et nont donc pas tre drivs de simulations.
Au del de leurs spcicits, ces tests de premire gnration butent sur deux problmes
identiques : le problme du caractre htrogne de la racine unitaire et le problme de lindpendance inter-individuelle. Le premier problme concerne uniquement les tests dIPS et Maddala
et Wu et tient au fait que lhypothse alternative autorise la prsence dun sous ensemble dindividus (de taille N1 chez IPS) dont la variable dintrt suit un processus stationnaire. Or,
lajout ou le retrait dun pays dans le panel peut dans ce cas modier radicalement la conclusion des tests en faveur ou en dfaveur de lhypothse nulle de racine unitaire. Cest par exemple
le cas dans ltude de Choi (2001) sur la validit de la PPA dont les rsultats dirent suivant
linclusion ou non du Japon. Ceci indique clairement que lhypothse nulle de ces tests, savoir
la prsence dune racine unitaire pour lensemble des individus du panel, nest sans doute pas
lhypothse qui prsente le plus grand intrt pour les conomistes dans de nombreuses problmatiques. Dans une dmarche proche du data mining, on aimerait tre en mesure didentier
deux ensembles dindividus : un ensemble avec racine unitaire (absence de convergence des PIB
par exemple) et un ensemble pour lesquels la variable est stationnaire (convergence des PIB).
Cest le cas sous lhypothse alternative dIPS mais lon ne connat pas la taille N1 du groupe
dindividus stationnaires, ni les individus appartenant cet ensemble. Lidentication de ces
deux groupes suppose ladoption dune dmarche squentielle. Il sagirait alors deectuer un
test de racine unitaire avec par exemple le Japon, puis de refaire le test sur le mme chantillon
sans le Japon. Toutefois, il convient alors de contrler le risque de premire espce. Cette approche squentielle est notamment adopte par Hnin, Jolivaldt et NGuyen (2001) qui utilisent
une statistique minimum dnie un ordre n par :
tm (n) =

min tiT

fi>N ng

o tiT correspond la statistique ADF pour le pays i et o les indices i sont classs selon les
ralisations croissantes de b
tiT : A un ordre n; on teste la prsence dune racine unitaire pour les
n derniers individus du panel. En supposant que les statistiques ADF sont identiquement et
indpendamment distribues dans la dimension individuelle, on peut alors contrler le risque
de premire espce un ordre n de la faon suivante18 :
n

Pr tm (n) < tDF = 1

(1

Pr (tm (n) < tn )

1 8 Cette ingalit est fonde sur lingalit de Bonferroni qui joue un rle important dans les tests de seconde
gnration en ce qui concerne la dtection de sous ensembles dindividus stationnaires ou non dans le panel.

24

o tDF correspond au seuil % de la loi de Dickey-Fuller et tn correspond la t-statistique


ADF du pays exclu ltape n 1: Les auteurs proposent de la mme faon une statistique de
Fisher itre, ainsi quune statistique IPS itre.
La seconde principale limite de ces tests de racine unitaire rside dans lhypothse dindpendance entre individus : indpendance des rsidus chez Levin et Lin ou chez IPS, indpendance
des p-values chez Maddala et Wu. Nous avons vu que cest prcisment cette hypothse qui
permet de driver trs simplement les lois asymptotiques normales des statistiques de tests.
Ds lors que cette hypothse est viole, ces lois asymptotiques ne son plus valides. Or, cette hypothse dindpendance pose problme notamment pour des applications macro-conomiques.
Prenons par exemple le cas des nombreux tests de convergence en panel construits partir
des tests de racine unitaire de premire gnration (Evans et Karras, 1996, Gaulier, Hurlin et
Jean-Pierre, 1999). Ces tests reposent ainsi sur lhypothse dindpendance inter-individuelle
des carts de PIB par tte la moyenne internationale, ventuellement contrls par des eets
temporels censs capter les eets de conjoncture internationale. Or rien ne garantit a priori que
lintroduction des eets temporels ou le fait de centrer les donnes sur la moyenne internationale
permette de purger les ventuelles dpendances inter-individuelles des revenus par tte.
Les auteurs de ces tests de premire gnration taient pleinement conscients de cette limite.
Ds la premire version de leur document de travail, IPS (1997) envisagent ainsi la prsence
dune corrlation inter-individuelle de la variable endogne, mais ils limitent leur analyse lintroduction deets temporels dans la perspective dun modle erreurs composes (voir Sevestre,
2002). Le rsidu "i;t du modle (32) se dcompose alors en une composante commune strictement identique pour tous les individus t et une composante idiosyncratique vi;t . Dune part,
cette formulation des dpendances inter-individuelles est trs restrictive puisque tous les pays
sont inuencs de faon symtrique par le facteur commun. Dautre part, Strauss et Yigit (2003)
montrent quune telle approche ne fait que repousser le problme en abaissant lventuelle corrlation inter-individuelle si la composante idiosyncratique prsente elle-mme des corrlations
entre individus. De mme, Maddala et Wu (1999) dans un exercice de simulation envisagent
la prsence de co-mouvements inter-individuels en considrant une forme trs particulire de
corrlations retenue par OConnell (1998) dans ltude de la PPA. Au del de la forme spcique des corrlations, cette approche pose un certain nombre de problmes techniques puisquil
convient de tenir compte de ces corrlations dans la simulation par Bootstrap des p-values.
Mais, que ce soit chez IPS ou chez Maddala et Wu, les corrlations inter-individuelles restent
nalement considres comme des paramtres de nuisance. Les tests de deuxime gnration
vont totalement renverser cette perspective.

Lhypothse de dpendances inter-individuelles : vers


une deuxime gnration de tests

La littrature actuelle se dveloppe autour de lide quil convient de prendre en compte


de faon explicite les dpendances entre les individus du panel. Ainsi, ces tests de deuxime
gnration renversent totalement la perspective jusqualors adopte, car plutt que de considrer
les corrlations entre individus comme des paramtres de nuisance, ils proposent dexploiter ces
co-mouvements pour dnir de nouvelles statistiques de test. Contrairement aux approches
dveloppes dans le cadre des tests de premire gnration, les tests de deuxime gnration
ne considrent pas ncessairement que les corrlations inter-individuelles de la variable yi;t sont
uniquement dues une corrlation inter-individuelle des rsidus. Ils envisagent notamment le cas
o les corrlations de yi;t proviennent de la prsence dune ou plusieurs composantes communes.
Tout le problme consiste alors proposer le test permettant la prise en compte la plus gnrale
des direntes formes possibles de dpendance entre individus. Il convient en eet dviter de
25

construire un test pour une forme trop particulire de corrlation des rsidus, de composante
commune ou de cointgration entre individus, qui naurait pas de bonnes proprits en termes
de taille ou de puissance pour des formes alternatives.
De nombreux tests sont aujourdhui dvelopps dans cette perspective. La plupart sinscrivent dans la ligne du test de Bai et Ng (2001, 2004) fond sur un modle facteurs communs. Mais, dans ce cadre, direntes approches sont proposes. Si Bai et Ng (2001) considrent
deux tests spars de racine unitaire sur les composantes commune et individuelle de la srie,
les autres tudes sont gnralement fondes sur un test unique de racine unitaire de la srie
tudie ; le point commun tant de tester la racine unitaire uniquement sur la composante idiosyncratique de la srie. Les tests dirent alors suivant la mthode retenue pour extraire de la
srie brute la composante idiosyncratique inobservable. Ainsi, nous tudierons successivement
les tests de Moon et Perron (2004), Choi (2002) et Pesaran (2003). Nous prsenterons enn
le test de Chang (2002) qui lui nest pas fond sur un modle factoriel et qui permet ainsi de
considrer une forme gnrale de dpendance inter-individuelle.

7.1

Le test de Bai et Ng (2004)

Bai et Ng (2001, 2004) ont propos le premier test de lhypothse nulle de racine unitaire
prenant en compte la prsence possible dune corrlation inter-individuelle des sries testes.
Le problme consiste alors spcier une forme particulire de ces dpendances. Bai et Ng
adoptent une dmarche trs simple et considrent un modle factoriel :
yi;t = Di;t +

0
i Ft

+ ei;t

(45)

o Di;t est une fonction polynomiale du temps dordre t; Ft est un vecteur de dimension (r; 1) de
facteurs communs et i un vecteur de paramtres. Ainsi, la srie individuelle yi;t se dcompose
en une composante dterministe htrogne Di;t , une composante commune 0i Ft et un terme
derreur ei;t idiosyncratique. Cest donc la prsence des facteurs communs Ft ; par rapport
auxquels chaque individu a une lasticit i propre, qui est lorigine des dpendances interindividuelles.
Dans ce cas, la variable yi;t est dite non stationnaire ds lors quau moins un des facteurs
communs du vecteur Ft est non stationnaire et/ou le terme idiosyncratique ei;t est non stationnaire. Rien ne garantit de faon gnrale que ces deux termes aient les mmes proprits
dynamiques : lun peut tre stationnaire, lautre pas, certaines composantes de Ft peuvent
tre I (0) dautres I (1) ; Ft et ei;t peuvent tre intgres dordre dirents, etc. Or, on sait
quune srie dnie par la somme de deux composantes aux proprits dynamiques direntes
a elle-mme des proprits dynamiques trs direntes des entits qui la constituent. Ainsi, il
peut tre trs di cile de diagnostiquer la non stationnarit de yi;t si cette srie admet une
composante stationnaire importante. Cest pourquoi, plutt que de tester la non stationnarit
directement partir de la srie yi;t ; lide de Bai et Ng (2001) consiste tester sparment la
prsence dune racine unitaire dans les composantes commune et individuelle. Cette procdure
est dnomme PANIC (Panel Analysis of Nonstationarity in the Idiosyncratic and Common
components) par les auteurs. Quel est lavantage de cette procdure au regard du problme
des dpendances inter-individuelles ? Cest principalement que la composante idiosyncratique
ei;t peut tre considre comme faiblement corrle entre individus alors que paralllement la
srie totale yi;t peut prsenter de fortes corrlations entre individus. On lve ainsi une des principales critiques adresses aux tests de la premire gnration, notamment dans le cadre des
applications macro-conomiques.
Supposons que la composante dterministe Di;t soit au plus dordre 1. Le modle scrit
alors sous la forme suivante :
yi;t =

it

0
i Ft

26

+ ei;t ;

t = 1; :::; T

(46)

Fm;t =

m Fm;t 1

ei;t =

i ei;t 1

+ vm;t ;

+ "i;t ;

m = 1; :::; r

(47)

i = 1; :::; N

(48)

eme

Le m
facteur commun Fm;t est stationnaire si m < 1. La composante idiosyncratique
ei;t est stationnaire pour le ieme individu si i < 1. Lobjectif est dapprhender la stationnarit
de Fm;t et ei;t sachant que ces composantes ne sont pas observes et doivent tre estimes.
Toute la validit de PANIC repose ainsi sur le fait quil soit possible dobtenir des estimateurs
de Fm;t et ei;t prservant leur degr dintgration, et ce que ei;t soit I (0) ou I (1) : Pour cela
les auteurs adoptent une analyse en composantes principales partir des donnes direncies.
On suppose ici que le nombre de facteurs communs r est connu19 .
Considrons le cas du modle sans tendance (
0
i

yi;t =
o zi;t =

ei;t et o ft =
0

0
1
(1;r)

B
B
= B ::
@ 0
(N;r)

N
(1;r)

= 0) en dirences premires :

ft + zi;t

(49)

Ft vrie E (ft ) = 0. On pose les dnitions suivantes :


0

1
C
C
C
A

(T

f20

B (1;r)
B f0
B 3
f
=B
B (1;r)
1;r)
B ::
@ 0
fT
(1;r)

1
C
C
C
C
C
C
A

(T

y1;2
B y1;3
X =B
@ :::
1;N )
y1;T

::

1
yN;2
yN;3 C
C
A
yN;T

La procdure de test peut alors tre dcompose en deux tapes. Dans une premire tape,
on estime ft = Ft et i dans le modle (49) par une analyse en composantes principales.
p
Lestimateur fb de la matrice f correspond alors au produit du scalaire T 1 par une matrice
dont les colonnes sont dnies par les r vecteurs propres associs aux r plus grandes valeurs
propres de la matrice XX 0 : Lestimateur b est dni par b = X 0 fb= (T 1) : On note alors
0
zbi;t = yi;t ^ i f^t .
Dans une deuxime tape, connaissant le vecteur des variations de la composante commune
f^t = Fbt ainsi que zbi;t , on dtermine les variables cumules dnies par :
F^m;t =

t
X
s=2

Fbm;s =

t
X

f^m;s

e^i;t =

s=2

t
X
s=2

zbi;s

(50)

avec t = 1; :::; T , m = 1; :::; r et i = 1; :::; N . On teste alors lhypothse nulle de racine


unitaire dans la composante idiosyncratique ei;t et dans les facteurs communs Ft laide des
variables estimes e^i;t et F^m;t .
An de tester la non stationnarit de la composante idiosyncratique, Bai et Ng ont propos
dempiler les t-statistiques des tests ADF calcules sur la base des composantes estimes e^i;t
dans le cadre dun modle ne contenant pas de terme dterministe :
e^i;t =

^i; t 1
i;0 e

i;1

e^i; t

+ :: +

i;p

e^i;t

ADFebc

i;t

(51)
eme

Soit
(i) la t-statistique du test ADF de la composante idiosyncratique du i
individu. La distribution asymptotique de la statistique ADFebc (i) est identique celle de la
statistique usuelle de Dickey-Fuller du modle sans constante. Un test de racine unitaire peut
alors tre eectu sur chacune des composantes idiosyncratiques du panel. La principale dirence par rapport aux tests de racine unitaire en sries temporelles rside dans le fait que les
facteurs communs ont t limins des donnes.
1 9 Pour

une estimation de r; voir Bai et Ng (2002) ou Moon et Perron (2004).

27

Naturellement, ces tests mens sur sries temporelles sont peu puissants pour des chantillons
T de petite taille. Cest pourquoi Bai et Ng proposent dutiliser soit une statistique moyenne
la IPS, soit une statistique la Maddala et Wu construite comme suit :
"
#
N
X
1
c
c
Z =p
2
log p (i) 2N
(52)
4N
i=1
o pc (i) dsigne la p-value associe la statistique de Dickey-Fuller ADFec (i): Bai et Ng sont
ce moment l obligs de supposer lindpendance entre individus des composantes individuelles
inobservables ei;t (thorme 3, page 8) pour driver la loi de cette statistique. Cela peut paratre
paradoxal puisque le test de Bai et Ng est justement cens prendre en compte ces dpendances
inter-individuelles. Mais il faut bien comprendre ici que Bai et Ng ne supposent lindpendance
que des composantes individuelles ei;t de la variable yi;t dnie par exclusion des composantes
communes. On est bien loin dans ce cas de lhypothse dindpendance inter-individuelle retenue
par IPS ou Maddala et Wu qui portait sur la srie totale yi;t . Cest donc une hypothse qui, sur
le plan conomique, est parfaitement justiable ds lors quil ny a pas derreur de spcication
notamment sur le nombre r de composantes communes20 .
Sous lhypothse dindpendance des ei;t ; les statistiques de test bases sur les composantes
estimes ebi;t sont elles aussi indpendantes. Ds lors, les p-values pc (i) sont distribues de faon
indpendante selon des lois uniformes sur [0; 1] : En conclusion, sous lhypothse que lensemble
des composantes individuelles ei;t pour i = 1; ::; N sont I (1) ; la statistique de test Z c suit une
loi N (0; 1) quelle que soit la taille N du panel. On peut ici adopter la standardisation de Choi
(2001) pour des panels de taille N importante (cf. section prcdente).
An de tester la non stationnarit des facteurs communs, Bai et Ng (2004) distinguent deux
cas21 . Lorsquil y a un seul facteur commun parmi les N variables (r = 1), ils utilisent un test
ADF standard dans le cas dun modle avec constante :
F^1;t = c +

i;0 F1;t 1

i;1

F^1;t

+ :: +

i;p

F^1;t

+ vi;t

(53)

ADFFcb ,

La t-statistique correspondante, note


a la mme distribution asymptotique que la
statistique usuelle de Dickey-Fuller dans le cas dun modle avec constante. Sil existe plus
dun facteur commun (r > 1), Bai et Ng testent le nombre r1 de tendances stochastiques
communes dans ces facteurs communs. Bien videmment, si r1 = 0, alors il existe N vecteurs de
cointgration pour N facteurs communs, et tous les facteurs sont I(0). Tester individuellement
la prsence dune racine unitaire dans chacun des facteurs tend gnralement surestimer le
nombre de tendances communes. Bai et Ng proposent alors deux statistiques bases sur les r
facteurs estims F^m;t pour m = 1; :::; r. Ces statistiques sont similaires celles proposes par
Stock et Watson (1988). Lobjet est de tester si la partie relle de la plus petite valeur propre
de la matrice des coe cients autorgressifs est gale lunit. Les deux statistiques ncessitent
des tests successifs de squences dhypothses, linstar des tests du nombre de vecteurs de
cointgration de Johansen (1988). Lhypothse nulle est dnie par H0 : r1 = m. Si lhypothse
nulle est rejete, on pose m = m 1 et on rapplique le test. Dans le cas inverse, le nombre estim
de tendances communes, not rb1 , est gal m. On teste lgalit entre le nombre de tendances
communes et le nombre de facteurs communs, i.e. r1 = r. La premire statistique de test,
2 0 En pratique, le nombre de composantes communes est rarement connu et doit tre estim. Comme lont
montr Bai et Ng (2002), pour des panels dau moins 20 individus, le nombre de composantes communes
peut tre estim avec une prcision parfaite. En revanche, cela nest plus le cas lorsque le nombre dindividus
est moindre. Dans ce dernier cas, la mthode destimation de Bai et Ng (2002) tend fortement surestimer le
nombre de facteurs communs (voir Moon et Perron, 2004). Cette surestimation du nombre de facteurs communs,
lorsque le nombre dindividus est faible, engendre en consquence dimportantes distorsions de taille.
2 1 Dans leur premier document de travail (Bai et Ng, 2001), la procdure tait identique quel que soit le nombre
de facteurs communs et reposait uniquement sur des tests ADF.

28

note M Qf , suppose que les composantes non stationnaires suivent un processus autorgressif
vectoriel dordre ni. La deuxime statistique, note M Qc , autorise la prsence de dynamiques
plus gnrales pour le processus de racine unitaire.
Une dmarche similaire peut tre adopte dans le cas dun modle incluant des tendances
dterministes propres chaque individu ( i 6= 0 dans le modle 46). La seule dirence rside
alors dans ltape 1, o la variable yi;t doit tre remplace par yi;t
yi ; avec yi =
1 PT
yi;t : De la mme faon, dans le modle (49), laccroissement de la composante
(T 1)
t=2
commune doit tre centr, ce qui revient remplacer ft = Ft par Ft
Ft ; de mme pour
ei;t : Dans ce cas, la statistique de test associe la
la composante idiosyncratique ei;t
composante commune de ltape 2, note ADFF (m); suit sous H0 la distribution de DickeyFuller pour un modle avec constante et tendance. La statistique de test associe la composante
individuelle de lindividu i; note ADFe (i); admet une distribution asymptotique relie celle
dun pont brownien identique celle du test de Schmidt et Lee (1991).
Ainsi que le notent Banerjee et Zanghieri (2003), la mise en oeuvre des tests de Bai et Ng
(2001) telle quelle est dcrite ici montre bien le rle que peut avoir la prsence de co-mouvements
entre les individus. En eet, pour les panels pour lesquels il existe une forte dpendance entre
les individus, les tests de Bai et Ng en prenant en compte les facteurs communs aux diverses
sries acceptent lhypothse nulle de racine unitaire dans les facteurs, ce qui les amnent
conclure la non stationnarit des sries. Pour nir, notons que les simulations menes par Bai
et Ng (2001) montrent que leur test donne des rsultats satisfaisants en termes de taille et de
puissance, mme pour des panels de taille modre (N = 20).

7.2

Les tests de Phillips et Sul (2003a) et Moon et Perron (2004)

Les tests de Phillips et Sul (2003a) et Moon et Perron (2004), contrairement Bai et Ng
(2001), testent directement la prsence dune racine unitaire dans la srie observable yi;t et
non pas de faon spare dans les composantes individuelle et commune. Au del de cette
dirence fondamentale, il existe certaines similitudes entre les deux approches qui reposent sur
lutilisation dun modle factoriel. Nous ne prsenterons en dtail que le test de Moon et Perron
(2004) qui admet la spcication la plus gnrale des composantes communes.
Moon et Perron (2004) considrent un modle autorgressif standard avec eets individuels
xes dans lequel les rsidus satisfont un modle factoriel. La structure du modle est donc
dirente de celle de Bai et Ng (2001). Si lon conserve les mmes notations que prcdemment,
leur modle scrit :
0
yi;t = i + yi;t
(54)
0
yi;t
=
i;t

0
i yi;t 1

0
i Ft

i;t

+ ei;t

(55)
(56)

On suppose dans un premier temps quePla dimension r du vecteur Ft est a priori connue
1
et que les chocs idiosyncratiques ei;t = =0 di;j vi;t j ; avec vi;t i:i:d: (0; 1) sont non corrls
dans la dimension individuelle. Ds lors, la corrlation inter-individuelle des variables yi;t est
dtermine par le vecteur i puisque E i;t j;t = 0i E (Ft Ft0 ) i : On teste lhypothse nulle de
racine unitaire pour tous les individus du panel H0 : i = 1; 8i = 1; ::; N contre H1 : i < 1
pour au moins un individu i:
Lintuition de la dmarche de Moon et Perron (2004) est alors la suivante : il sagit de
transformer le modle de sorte liminer les composantes communes de la srie yi;t , puis de
tester la racine unitaire sur les sries en carts aux facteurs communs. Ainsi, on supprime les
dpendances inter-individuelles et lon peut se ramener des distributions asymptotiques normales. On retrouve alors des distributions normales comme chez IPS ou Levin et Lin, mais la
29

dirence fondamentale est que les statistiques de tests sont construites ici partir de donnes transformes, prises en carts aux composantes communes et donc indpendantes dans la
dimension individuelle.
On suppose que lon dispose initialement de T + 1 observations de la variable dintrt
yi;t . Soit la matrice Z des observations individuelles de yi;t et Z 1 la matrice des observations
retardes. On note enn la matrice (N; r) des coe cients i (cf. section prcdente) et F la
matrice des composantes communes :
0
1
0
1
0 0 1
y1;2
:: yN;2
y1;1 :: yN;1
F1
A Z 1 = @ :::
A
Z = @ :::
F = @ ::: A
(T;N )
(T;r)
(T;N )
y1;T +1
yN;T +1
y1;T
yN;T
FT0

Comme lavons prcdemment mentionn, lide de Moon et Perron (2004) consiste tester
la racine unitaire sur les carts aux composantes communes. Supposons que les paramtres de
soient connus, les composantes dcart scrivent tout simplement comme la projection de Z
sur lorthogonal du sous espace vectoriel engendr par les colonnes de : En eet, considrons
pour simplier le modle (55) sous lhypothse nulle de racine unitaire ( i = 1) et en labsence
deets individuels ( i = 0) crit sous forme vectorielle :
Z=Z

+F

+e
1

0
o e dsigne la matrice (T; N ) des composantes idiosyncratiques. Soit Q = IN
( 0 )
la matrice de projection sur lorthogonal du sous espace vectoriel engendr par les colonnes de
: En pr-multipliant droite par Q ; on exprime alors le modle partir des donnes en carts
aux composantes communes ZQ :

ZQ = Z

1Q

+ eQ

(57)

La projection ZQ correspond aux donnes exprimes en carts aux facteurs communs, tandis
que les rsidus eQ ne prsentent par construction aucune corrlation inter-individuelle. Cest
alors partir de ces donnes transformes que lon va eectuer le test de racine unitaire. Moon
et Perron construisent une statistique de test partir de lestimateur pooled 22 ( i = j ) de la
racine autorgressive. Plus prcisment, ils considrent un estimateur pooled corrig en raison
de lventuelle autocorrlation (intra-individuelle) des rsidus eQ :
b+

pool

PN
avec e = N 1 i=1 ie o le terme
composantes idiosyncratiques :

trace (Z 1 Q Z 0 ) N T
trace Z 1 Q Z 0 1
i
e

i
e

(58)

dsigne la somme des autocovariances positives des


1 X
1
X

di;j di;j+l

l=1 j=0

+
A partir de cet estimateur bpool , Moon et Perron proposent deux statistiques de test de lhypothse nulle de racine unitaire, notes respectivement ta et tb . Ces deux statistiques convergent
lorsque T et N tendent vers linni et que le rapport N=T tend vers 0.

p
+
T N bpool 1
p
ta =
2 4e =we4

T;N !1

N (0; 1)

(59)

2 2 Ils justient ce choix par le fait que cet estimateur simplie ltude des lois asymptotiques et leur permet
en outre dtudier leur test sous une alternative locale de quasi-racine unitaire.

30

tb = T N

b+
pool

1
trace Z
NT2

0
1 QZ 1

we2

l
!
4 T;N !1
e

N (0; 1)

(60)

Les quantits we2 et 4e correspondent respectivement aux moyennes sur N des variances
2
et des variances individuelles de long terme au carr 4e;i de la
individuelles de long terme we;i
2
P1
2
=
: Si la ralisation de la statistique ta
composante idiosyncratique ei;t avec we;i
j=0 di;j
(ou tb ) est infrieure au seuil de la loi normale, on rejette lhypothse nulle de racine unitaire
pour tous les individus du panel.
p
Notons au passage que lon retrouve la vitesse de convergence en T N de lestimateur pooled
(corrig ou non) de la racine autorgressive que lon avait obtenu dans le cas du modle de
Levin et Lin (quation 11). Ceci est parfaitement normal, puisque une fois que les dpendances
inter-individuelles ont t purges dans le modle de Phillips et Moon, on obtient sur donnes
transformes un modle avec racine autorgressive commune (estimateur pooled ) identique
celui de Levin et Lin sous lhypothse dindpendance inter-individuelle.
Naturellement, puisque la composante idiosyncratique ei;t est inobservable, les quantits we2 ,
4
e et e sont inconnues. Les dnitions (59) et (60) ne sont pas directement applicables. Ainsi,
an dappliquer ces tests, il nous faut deux ingrdients supplmentaires (lis) :
1. Un estimateur des composantes commune et idiosyncratique : plus prcisment un estib de la matrice de projection sur lorthogonal du sous espace vectoriel engendr
mateur Q
par les colonnes de , matrice des paramtres i associs aux composantes communes.
2. Des estimateurs de la variance de long terme (w
be2 et b4e ) et de la somme des autocovariances
positives (be ); construits partir des estimations des composantes individuelles ebi;t :
Estimation de la matrice de projection

Tout comme Bai et Ng, Moon et Perron proposent destimer par une analyse en composantes principales (cf. section prcdente) des rsidus. On commence par estimer les rsidus i;t
partir du modle (55). Pour cela, on utilise un estimateur pooled bpool sur les donnes brutes
centres sur leurs moyennes individuelles pour tenir compte des eets individuels :
e
b=Z

b=e

1 e0 e
N

pool Z 1

(61)

0
e = Qx Z et Qx = IT
o Z
T 1 lT lT0 o lT = (1; ::; 1) ; lestimateur pooled tant dni par
b
e0 e
e0 e
pool =trace Z 1 Z =trace Z 1 Z 1 : A partir des rsidus b ; on applique une analyse en
composantes principales. Un estimateur e de la matrice
p (N; r) des coe cients des composantes
communes correspond alors au produit du scalaire N par une matrice dont les colonnes sont
dnies par les r vecteurs propres associs aux r plus grandes valeurs propres de la matrice b0 b:
Moon et Perron utilisent un estimateur b re-paramtr :
1
2

(62)

b qui nous
A partir de cet estimateur b ; on dnit un estimateur de la matrice de projection Q
permettra dobtenir par la suite une estimation des composantes idiosyncratiques :
b = IN
Q

b b0 b

b0

(63)

eQ
b : On
Une estimation des donnes en carts aux composantes communes est ainsi dnie par Z
+
b
peut donc en dduire un estimateur pooled corrig pool de la racine autorgressive uniquement
eQ
b .
sur ces composantes dcarts selon la formule (58) en remplaant ZQ par Z
31

Estimation des variances de long terme


b : Soit ebi;t la
Un estimateur de la composante idiosyncratique est alors dni par eb = bQ
composante individuelle des rsidus de lindividu i la date t: Pour chaque individu i = 1; ::; N;
T
on dnit lautocovariance empirique des rsidus fb
ei;t gt=1 :
T
Xj
b i (j) = 1
ebi;t ebi;t+j
T t=1

A partir de b i (j) on construit un estimateur noyau de la variance de long terme et de la


somme des autocovariances positives comme suit :
2
=
w
be;i

e;i

T
X1

j= T +1

T
X1
j=1

w (qi ; j) b i (j)

(64)

w (qi ; j) b i (j)

(65)

o w (qi ; j) dsigne une fonction noyau et qi un paramtre de troncature. Ne reste plus alors
qu dnir les estimateurs des moyennes des variances de long terme individuelles :
w
be2 =

N
1 X 2
w
b
N i=1 e;i

N
X
b = 1
b
e
N i=1 e;i

b4e =

N
1 X 2
w
b
N i=1 e;i

(66)

Les fonctions noyau et le paramtre de troncature q doivent satisfaire un ensemble de trois


hypothses pour que les statistiques e
ta et e
tb dnies par les quations (59) et (60) en substituant
we2 , e et 4e par leurs estimateurs, convergent vers des lois normales. Moon et Perron utilisent
notamment une fonction de type noyau QS (voir Salani, 1999) :
w (qi ; j) =

25
12

x2

sin (6 x=5)
6 x=5

cos

6 x
5

pour x =

j
qi

o le paramtre de troncature optimal qi est dni par la relation :


qi = 1:3221

"

4 b2i;1 Ti

bi;1

#1=5

o b2i;1 dsigne lestimateur de lautocorrlation dordre 1 de la composante individuelle ebi;t de


lindividu i:

Phillips et Sul (2003a) considrent un modle plus restrictif que celui de Moon et Perron
(2004) puisquil ne contient quun seul facteur indpendamment distribu dans le temps. Le
vecteur de facteurs communs Ft est rduit une variable t N:i:d: (0; 1) : Au del de cette
distinction, la principale dirence rside dans le fait que Phillips et Sul adoptent une mthode
de moments pour liminer les facteurs communs au lieu dune analyse en composantes principales. Lide est de tester la racine unitaire sur des donnes orthogonalises : celles-ci tant
par construction indpendantes dans la dimension individuelle, il est possible alors dappliquer
les tests de racine unitaire de premire gnration. Ainsi, partir des estimateurs des racines
autorgressives individuelles obtenues sur donnes orthogonalises, Phillips et Sul construisent
direntes statistiques de tests de racine unitaire : soit des statistiques moyennes similaires
32

celles dIPS, soit des statistiques dnies comme des combinaisons de p-values associes des
tests individuels de racine unitaire.
Moon et Perron (2004) ont eectu des simulations de Monte Carlo an dtudier les proprits de leurs tests en termes de taille et de puissance. Leurs rsultats peuvent tre rsums
comme suit. En premier lieu, en labsence de tendance dterministe, le test tb donne de meilleurs
rsultats en termes de taille que le test ta . Par ailleurs, plus les composantes communes sont
importantes par rapport la composante idiosyncratique, plus il est di cile de contrler la taille
des tests pour de faibles valeurs de N . Les deux tests donnent de trs bons rsultats en termes
de puissance, y compris face lhypothse alternative dune valeur moyenne gale 0,99 pour
le paramtre autorgressif (ce dernier variant en outre selon les individus). En second lieu, lorsquune tendance dterministe est prsente, les rsultats en termes de taille restent valables, mais
la puissance des tests diminue de faon drastique. Au nal, Moon et Perron (2004) concluent
que leur test ncessite un minimum de 20 individus an de disposer dune estimation prcise
du nombre de facteurs et de donner des rsultats ables (voir note de bas de page numro 20).
Dans ces conditions, les tests ont de bonnes proprits en termes de taille et de puissance.

7.3

Le test de Choi (2002)

Tout comme Moon et Perron (2004), Choi (2002) teste la racine unitaire partir dune
transformation de la srie observe yi;t permettant dliminer les corrlations inter-individuelles
et les ventuelles composantes de tendance dterministes. Mais si dans le principe lapproche de
Choi (2002) est identique celle de Moon et Perron, elle en dire sur deux aspects essentiels.
Tout dabord, Choi considre un modle erreurs composes :
yi;t =
vi;t =

pi
X

di;j vi;t

+ vi;t
j

+ "i;t

(67)
(68)

j=1

o "i;t est i:i:d: 0; 2";i et indpendamment distribu entre individus. Leet temporel t est
reprsent par un processus stationnaire. Dans ce modle, contrairement aux approches de
Bai et Ng (2001) et Moon et Perron (2004), il nexiste quun seul facteur commun (r = 1
dans nos notations) reprsent par leet temporel t . Mais, plus fondamentalement, le modle
de Choi impose que les variables individuelles yi;t rpondent de faon homogne lunique
facteur commun. Cest l une dirence fondamentale avec Phillips et Sul (2003a) qui eux
aussi considrent un seul facteur commun, mais qui envisagent une spcication htrogne de
la sensibilit ce facteur, du type i t : Choi justie son choix par le fait que le passage en
logarithme du modle (67) permet dintroduire une telle sensibilit. Mais surtout Choi avance
largument quil est possible dans son modle de tester lhypothse de stationnarit du processus
t ; ce qui nest pas le cas avec une sensibilit htrogne. Cest un point important puisque, dans
une optique macro-conomique, ces eets temporels sont souvent censs capter les inexions de
la conjoncture internationale et rien ne garantit que ces eets soient stationnaires.
Dans le modle (67), on teste lhypothse nulle dune racine unitaire P
dans la composante
pi
idiosyncratique vi;t pour tous les individus du panel, ce qui scrit H0 : j=1
di;j = 1; 8i =
Ppi
1; ::; N contre lhypothse alternative selon laquelle il existe des individus i tels que j=1
di;j <
1:
La seconde dirence avec lapproche de Moon et Perron (2004), lie pour partie la spcication du modle, rside dans la manire dorthogonaliser les sries individuelles yi;t qui
seront utilises par la suite pour tester la racine unitaire uniquement sur la composante individuelle. Pour supprimer les dpendances inter-individuelles, Choi isole vi;t en liminant la

33

constante (eet individuel) i ; mais aussi et surtout le terme derreur commun t (eet temporel). Pour liminer ces composantes dterministes, Choi procde en deux tapes : limination de
la constante par lapproche dElliott, Rothenberg et Stock (1996), ERS par la suite, puis limination de leet temporel par centrage sur la moyenne individuelle. En eet, si la composante
vi;t est stationnaire, lapplication des MCO permet dobtenir un estimateur e cace du terme
constant. Toutefois, si vi;t est I (1) ou prsente une quasi racine unitaire, lapproche dERS
consistant estimer le terme constant sur donnes quasi-direncies par les MCG, permet in
ne dobtenir de meilleures proprits distance nie pour les tests de racine unitaire. Pour
cette raison, Choi (2002) utilise lapproche dERS, ce qui constitue, notre connaissance, la
premire extension de cette approche en panel. Reprenons prsent dans le dtail ces deux
tapes de lorthogonalisation des sries individuelles.
Etape 1 : Si lon suppose que la plus grande racine du processus vi;t est 1 + c=T (processus
de quasi racine unitaire), pour chaque individu i = 1; ::; N; on construit deux sries yei;t
et e
ci;t quasi direncies telles que pour t 2 :
yei;t = yi;t

1+

c
T

yi;t

e
ci;t = 1

1+

c
T

(69)

Choi considre pour tous les individus du panel la valeur de la constante c = 7 fournie
par ERS dans le cas dun modle sans drive: On rgresse ensuite par les MCG yei;t sur
la variable dterministe e
ci;t : Soit b i lestimateur des MCG obtenu pour chaque individu
i sur donnes quasi-direncies. Pour T su samment grand, on doit alors observer :
yi;t

bi '

+ vi;t

vi;1

et ceci que le processus vi;t soit I (1) ou quasi intgr. Ne reste plus alors qu liminer la
composante commune t source de corrlation entre individus : cest prcisment lobjet
de la deuxime tape.
Etape 2 : Choi propose de centrer la variable yi;t b i sur sa moyenne individuelle et de
dnir ainsi une nouvelle variable zi;t comme suit :
zi;t = (yi;t

bi)

N
1 X
(yi;t
N i=1

bi)

(70)

En eet, compte tenu des rsultats prcdents, pour chaque individu i = 1; ::; N; on peut
montrer que :
zi;t ' (vi;t v t ) (vi;1 v 1 )
PN
o v t = (1=N ) i=1 vi;t . Ainsi, les composantes dterministes i et t sont limines de la
dnition de zi;t : Les processus zi;t peuvent tre considrs comme indpendants dans la
dimension individuelle puisque les moyennes v 1 et v t convergent en probabilit vers 0 ds
lors que N tend vers linni. Ne reste plus alors qu eectuer un test de racine unitaire
sur les sries transformes zi;t :
Dans le cas dun modle avec drives individuelles, la dmarche est identique deux dirences prs : pour obtenir les estimateurs b i et bi (coe cient associ la tendance individuelle)
on rgresse par MCG la srie yei;t sur e
ci;t et dei;t = 1 c=T: On choisit alors la valeur c = 13:5
fournie par ERS dans le cas dun modle avec drive. On construit zi;t de la manire suivante :
zi;t = (yi;t

bi

N
1 X
(yi;t
N i=1

bi t)

34

bi

bi t)

A partir des sries fzi;t gt=2 ; on eectue des tests individuels de racine unitaire sans constante
ni tendance quel que soit le modle considr puisque toutes les composantes dterministes ont
t retires :
pX
i 1
zi;t = i zi;t 1 +
(71)
i;j zi;t j + ui;t
j=1

Choi (2002) montre que dans un modle sans constante, la t-statistique tERS
de Dickeyi
Fuller suit sous H0;i : i = 0 la distribution asymptotique de Dickey-Fuller lorsque T et N
tendent vers linni. En prsence dune drive, cette statistique admet une distribution tabule
par ERS (voir Salani, 1999). Encore une fois, ces tests mens sur sries temporelles bien que
plus puissants que les tests ADF standard, restent tout de mme peu puissants au regard
des tests en panel. Cest pourquoi, Choi propose des statistiques de test en panel fondes sur
les statistiques tERS
individuelles qui sont, et cest ce qui est fondamental, par construction
i
indpendantes les unes des autres. Naturellement Choi (2002) sinspire de ses travaux antrieurs
(Choi, 2001) et propose nalement trois statistiques de test fondes sur des combinaisons de
niveaux de signicativit de tests individuels (cf. section prcdente) :
Pm =

Z=

L =p

N
1 X
p
[ln (pi ) + 1]
N i=1
N
1 X
p
N i=1

1
2 N=3

N
X
i=1

ln

(pi )

(73)

pi
1

(72)

pi

(74)

o pi dsigne le niveau de signicativit associ la statistique tERS


et (:) la fonction de
i
rpartition de la loi normale centre et rduite. Sous lhypothse nulle de racine unitaire pour
tous les individus du panel, Choi (2002) montre que ces trois statistiques convergent lorsque
T et N tendent conjointement vers linni vers une loi normale centre rduite. Les rgles de
dcision sont les suivantes. Pour la statistique de Fisher transforme Pm ; si la ralisation est
suprieure au seuil de la loi normale (1.64 5% de risque de premire espce), on rejette H0 :
Pour les deux statistiques Z et L ; si la ralisation est infrieure au seuil de la loi normale
( 1:64 5% de risque de premire espce), on rejette H0 :
Tout comme pour les travaux de Choi (2001) ou Maddala et Wu (1999), la principale di cult de cette approche rside dans la ncessit de simuler par Bootstrap les p-values pi utilises
dans la construction des statistiques Pm ; Z et L et ce dautant plus que lon utilise les distributions dERS. Choi reprend la mthodologie de simulation de MacKinnon (1994). Il convient
de noter que les p-values ainsi obtenues peuvent tre relativement sensibles la loi utilise pour
gnrer le processus ut : Pour des tailles T importantes, le fait de supposer tort la normalit
des rsidus ut ne pose pas de problme. En revanche, lorsque T est faible les p-values obtenues
sous lhypothse de normalit pourraient tre sensiblement direntes des vraies valeurs si la
distribution est dirente de la loi normale. Plus spciquement, les simulations menes par
Choi (2002) visant comparer les trois tests proposs Pm ; Z et L et tudier limpact de la
non normalit des erreurs montrent que :
Les trois tests donnent de bons rsultats en termes de taille, dautant plus que T augmente.
La puissance des trois tests augmente lorsque N augmente, ce qui justie lutilisation
de donnes de panel. Lorsquune tendance dterministe est incluse dans le modle, la
puissance des trois tests tend diminuer.

35

Globalement, les tests Pm et Z conduisent de meilleurs rsultats, en termes de taille et


de puissance, que le test L , ce qui conduit Choi (2002) recommander les deux premiers
tests pour les applications empiriques.
Enn, lorsque les rsidus ut ne suivent pas une loi normale, mais une loi uniforme, il
apparat que les conclusions prcdentes restent valides. En consquence, le fait que les
rsidus ne suivent pas une loi normale na pas dimpact sur les rsultats en termes de
taille et de puissance des tests.

7.4

Le test de Pesaran (2003)

Pesaran (2003) propose un test unique (contrairement Bai et Ng, 2001) permettant de tenir
compte des ventuelles dpendances entre individus. Mais, la dirence des deux approches
prcdentes (Moon et Perron, 2003 ou Choi, 2002), Pesaran ne teste pas la racine unitaire sur
des variables transformes prises en cart aux composantes dterministes. Il choisit au contraire
de conserver les sries brutes yi;t en augmentant le modle DF ou ADF par lintroduction des
moyennes individuelles de yi;t 1 et des dirences premires yi;t : on obtient alors un modle
augment de type CADF (Cross Sectionally Augmented Dickey-Fuller ). De ce point de vue,
revenant une approche en termes de statistiques la Dickey-Fuller, le test de Pesaran (2003) se
dmarque des tests prcdemment prsents dans la mesure o les distributions asymptotiques
sont non standards.
Si lon veut faire une analogie avec le problme de lestimation de la relation de cointgration
en sries temporelles en prsence de biais dendognit de second ordre, on pourrait opposer,
dune part, les approches la Moon et Perron comparables aux Fully Modied 23 (MCO sur
variables transformes) et, dautre part, lapproche de Pesaran (2003) sensiblement proche de
la logique des Moindres Carrs Dynamiques, DOLS, de Stock et Watson (1993) ; le principe
des DOLS consistant en eet conserver les donnes brutes mais augmenter le modle en
introduisant des termes direncis retards et avancs. Les t-statistiques individuelles obtenues
dans le modle CADF ont alors une distribution asymptotique indpendante de tout paramtre
de nuisance. Toutefois, ces t-statistiques individuelles ne sont indpendantes dans la dimension
individuelle que conditionnellement un mouvement Brownien Wf : On peut ds lors construire
partir de ces statistiques individuelles soit une statistique moyenne de type IPS (appele
CIPS, pour Cross-Sectionaly Augmented IPS ), soit une statistique de type Maddala et Wu
(1999). Mais lapplication du thorme central limite la statistique moyenne ne permet pas
daboutir un rsultat de normalit asymptotique comme dans IPS (2003) du fait que la
proprit dindpendance des statistiques CADF individuelles nest ici que conditionnelle. Il est
alors ncessaire dutiliser des seuils simuls de la loi asymptotique ou de la loi distance T nie
pour la statistique moyenne. Cest donc une approche qui est relativement simple mettre en
oeuvre. En outre, comme le signale Pesaran (2003), cette approche pourra tre tendue trs
facilement des tests individuels autres que les tests ADF (de type ERS ou de type Max-ADF
de Leybourne, 1995).
Etant donn la popularit dIPS (1997), Pesaran considre exactement le mme modle et
la mme structure de test la dirence prs quil introduit un facteur commun t avec une
sensibilit htrogne la Phillips et Sul (2003a) :
yi;t =

ui;t =

i yi;t 1
i t

+ ui;t

+ "i;t

o leet individuel i est dni par i =


i i avec i 2 R. Le facteur commun t i:i:d: (0; 1)
est inobservable. Les hypothses du test de Pesaran sont identiques celles dIPS. Pesaran
montre quen labsence dautocorrlation des "i;t , lintroduction dans le modle de la moyenne
2 3 Voir

par exemple Hurlin et NDiaye (1998).

36

PN
y t = (1=N ) i=1 yi;t et de sa valeur retarde y t 1 est su sante pour ltrer asymptotiquement
les eets de la composante commune inobservable t ds lors que N tend vers linni. Ainsi,
Pesaran considre un modle DF augment dans la dimension inter-individuelle ou modle
CADF :
Modle CADF : yi;t = i + i yi;t 1 + ci y t 1 + di y t + vi;t
(75)
Pour chaque individu i = 1; ::; N on estime ce modle et lon construit de faon standard
la t-statistique associe lhypothse nulle de racine unitaire pour lindividu i; note ti (N; T ) :
Pesaran montre que la distribution exacte de ti (N; T ) sous lhypothse nulle de racine unitaire
dpend de paramtres de nuisance, mais que linuence de ces paramtres disparat ds lors
que N tend vers linni et cela que T soit xe ou tende vers linni. Lorsque T est xe, on doit
toutefois sassurer quaucun eet ne puisse transiter via le niveau de la moyenne individuelle
la date initiale y 0 : ceci peut tre obtenu en appliquant le test non pas directement yi;t , mais
la dirence yi;t y 0 : Lorsque T et N tendent vers linni de faon squentielle ou jointe, la
statistique CADF individuelle ti (N; T ) converge vers la mme distribution asymptotique. Cette
distribution est une gnralisation de celle de Dickey-Fuller pour le modle avec constante, dans
le sens o en labsence deet temporel on retrouve cette dernire.
A partir des statistiques CADF individuelles ti (N; T ) ; Pesaran propose notamment une
statistique moyenne de type IPS appele CIPS, pour Cross-Sectionaly Augmented IPS.
CIP S (N; T ) =

N
1 X
ti (N; T )
N i=1

(76)

Il sagit dune gnralisation de la statistique t_barN T (quation 27) dIPS (2003). Pesaran
montre que lon peut rcrire CIP S (N; T ) sous la forme suivante :
CIP S (N; T ) =

N
N
1 X
1 X
ti (N; T ) =
CADFi;f + Op (1)
N i=1
N i=1

o CADFi;f dsigne la distribution asymptotique lorsque N tend vers linni des statistiques
ti (N; T ) : Lindice f indique que ces distributions sont asymptotiquement dpendantes, ce qui
exclutPlapplication dun thorme central limite dans ce cas. La distribution de CADF =
N
N 1 i=1 CADFi;f lorsque N tend vers linni est non standard et les seuils de cette variable
sont tabuls par Pesaran pour direntes tailles T et N ainsi que pour direntes valeurs du
risque de premire espce. Dans le cas dun modle avec constante, pour un risque de premire
espce de 5%, les seuils sont reports dans le tableau 5. On approxime alors la distribution
de la statistique moyenne CIP S (N; T ) par celle de CADF . Ainsi, on rejette lhypothse nulle
de racine unitaire si la ralisation de CIP S (N; T ) est infrieure au seuil de la distribution de
CADF :
Pesaran propose en outre une statistique de type CIPS tronque, note CIP S (N; T ) ;
construite comme la moyenne de statistiques individuelles tronques, telle que :
N
1 X
CIP S (N; T ) =
t (N; T )
N i=1 i

o la statistique individuelle ti (N; T ) tronque


8
< K1
ti (N; T )
ti (N; T ) =
:
K2

(77)

est dnie par :


si ti (N; T )
K1
si K1 < ti (N; T ) < K2
si ti (N; T ) K2

Les paramtres de troncature K1 et K2 dpendent du modle retenu. Il sagit de constantes


positives su samment importantes pour que Pr [ K1 < ti (N; T ) < K2 ] soit su samment importante (suprieure 0,9999). Pour un modle sans constante, ni tendance K1 = 6:12 et
37

Tab. 5 Seuils Critiques 5% de la Distribution de CADF et CADF


T =N
10
15
20
30
50
70
100

10
2:52

15
2:40

20
2:33

30
2:25

50
2:19

70
2:14

100
2:10

( 2:47)

( 2:35)

( 2:29)

( 2:22)

( 2:16)

( 2:13)

( 2:11)

2:37
2:34
2:33
2:33
2:33
2:32

2:28
2:26
2:25
2:25
2:25
2:25

2:22
2:21
2:20
2:20
2:20
2:20

2:17
2:15
2:15
2:16
2:15
2:16

2:11
2:11
2:11
2:11
2:12
2:12

2:07
2:07
2:07
2:08
2:08
2:08

2:04
2:04
2:05
2:06
2:07
2:07

S o u rc e : P e sa ra n (2 0 0 3 ), Ta b le 3 b . E ntre p a re nth se s g u re nt le s se u ils d e la sta tistiq u e tro n q u e .

K2 = 4:16; pour un modle avec constante : K1 = 6:19 et K2 = 2:61; enn dans un modle avec
drive K1 = 6:42 et K2 = 1:7024 : La distribution de CIP S (N; T ) est approxime par celle
PN
de CADF = N 1 i=1 CADFi;f o CADFi;f dsigne la distribution asymptotique tronque
de la statistique ti (N; T ) ; compte tenu des mmes seuils K1 et K2 : Les seuils critiques de
CADF et de CADF sont pratiquement confondus ds lors que T > 15: En dessous de cette
taille, les seuils de CADF 5% sont reports entre parenthses dans le tableau 5. Pour des
chantillons de petite taille (T < 10), la taille de la statistique non tronque est gnralement
trop importante, cest pourquoi on doit lui prfrer la statistique tronque.
Enn, en prsence dautocorrlation des rsidus, la mme dmarche doit tre applique dans
un modle doublementaugment : augment dans la dimension inter-individuelle et augment
par les termes habituels des spcications ADF standard. Le modle CADF devient alors :
Modle CADF :

yi;t =

i yi;t

+ ci y t

1+

p
X
j=0

di;j y t

p
X

i;j

yi;t

+ ei;t

(78)

j=0

Les distributions des statistiques moyennes CIP S (N; T ) et CIP S (N; T ) sont alors identiques
celles du cas prcdent.
An dapprhender les proprits en termes de taille et de puissance des statistiques proposes, Pesaran (2003) a eectu des simulations de Monte Carlo. Les principaux rsultats obtenus
peuvent tre synthtiss comme suit :
En labsence de corrlation srielle des erreurs, les statistiques CIP S et CIP S ne prsentent pas de distorsion de taille et conduisent des rsultats similaires en termes de
puissance. Ainsi, lorsque les erreurs ne sont pas autocorrles, il nexiste pas de dirence
majeure entre les deux statistiques.
En prsence de corrlation srielle des erreurs, il ressort dimportantes distorsions de taille
lorsque les rgressions CADF ne tiennent pas compte de la dpendance entre les sries.
En revanche, lutilisation du modle doublement augment conduit une taille de lordre
de 5% et les tests bass sur ce modle ont donc de bonnes proprits en termes de taille.
Pour des valeurs de T relativement faibles (infrieures 20), la statistique CIP S prsente
toutefois des distorsions de taille plus importantes que la statistique tronque qui ne
soure pas dun tel problme, mme pour T = 10. La puissance de la statistique CIP S
crot rapidement ds lors que T 20 et est plus importante en cas de corrlation srielle
ngative quen cas de corrlation srielle positive.
2 4 Ces

valeurs sont obtenues par Pesaran


en retenant une approximation normale pour ti (N;q
T ), conduisant :
q
1 ("=2)
1 (1
K1 = E CADFif
V ar CADFif et K2 = E CADFif +
"=2) V ar CADFif ,
" dsignant une constante positive proche de zro.

38

Enn, en prsence de corrlation srielle des erreurs et de tendances linaires, la taille du


test CIP S reste tout fait correcte (y compris pour T = 10), contrairement celle de
la statistique non tronque.
Ces rsultats mettent donc globalement en avant la supriorit de la statistique CIP S par
rapport la statistique CIP S, ds lors que les termes derreurs prsentent de lautocorrlation.

7.5

Le test de Chang (2002)

Comme nous lavons mentionn prcdemment, il existe une approche alternative dans les
tests de seconde gnration qui nest pas fonde sur un modle factoriel. Les tests les plus
reprsentatifs sont ici ceux de Chang (2002, 2004). Nous nous contenterons de prsenter le
test de 2002, fond sur un estimateur des variables instrumentales non linaires qui permet
de rsoudre le problme des paramtres de nuisance li aux corrlations inter-individuelles.
Considrons le modle suivant :
yi;t =

i yi;t 1

pi
X

i;j

yi;t

+ "i;t

(79)

j=1

o les innovations "i;t sont i:i:d: 0; 2"i et peuvent tre corrles dans la dimension individuelle.
Pour liminer ces dpendances, Chang propose dutiliser pour chaque individu i; une variable
instrumentale gnre par une fonction non linaire F (yi;t 1 ) des valeurs passes yi;t 1 : Cette
fonction, appele fonction gnratrice
R 1 dinstrument (Instrument Generating Function), est une
fonction rgulire, intgrable telle 1 xF (x) dx 6= 0. Cette hypothse peut sinterprter comme
le fait que linstrument non linaire F (:) doit tre corrl avec le rgresseur yi;t 1 :
0

On note xit le vecteur des dirences premires centres passes ( yi;t 1 ; ::; yi;t pi ) et
0
0
Xi = (xi;pi +1 ; ::; xiT ) la matrice (T; pi ) correspondante. Soit yl;i = (yi;pi ; ::; yi;T 1 ) le vecteur
0
des valeurs passes et "i = ("i;pi +1 ; ::; "i;T ) le vecteur des rsidus. Sous lhypothse nulle de
racine unitaire, lestimateur des variables instrumentales non linaires du paramtre est alors
dni par :
bi

i
1
0
0
F (yl;i ) yl;i F (yl;i ) Xi (Xi0 Xi ) Xi0 yl;i
h
i
1
0
0
F (yl;i ) "i F (yl;i ) Xi (Xi0 Xi ) Xi0 "i

(80)

La variance de cet estimateur est gale :


bb2i

h
i 2
1
0
0
b2"i F (yl;i ) yl;i F (yl;i ) Xi (Xi0 Xi ) Xi0 yl;i
h
i
1
0
0
F (yl;i ) F (yl;i ) F (yl;i ) Xi (Xi0 Xi ) Xi0 F (yl;i )

(81)

PT
o b2"i = (1=T ) t=1 b
"2it . Chang montre que la t-statistique utilise pour tester la racine unitaire,
note Zi ; et construite partir de bi ; converge asymptotiquement vers une loi normale centre
rduite :
b
l
! N (0; 1) pour i = 1; ::N
Zi = i
bbi T !1

Ce rsultat asymptotique inhabituel est entirement d la non linarit des variables instrumentales. Chang fournit dirents exemples de fonctions pouvant gnrer de tels instruments.
Citons trois exemples : IGF1 (x) = x exp ( ci jxj) avec ci = 3 T 1=2 s 1 ( yit ) o s2 ( yit )
dsigne la variance empirique de yit ; IGF2 (x) = I(jxj < K) et IGF3 (x) = I(jxj < K) x
o K dsigne un paramtre de troncature. De plus, Chang montre que les t-statistiques Zi

39

sont asymptotiquement indpendantes dans la dimension individuelle, ce qui bien videmment


autorise lutilisation de statistiques moyennes :
N
1 X
SN = p
Zi
N i=1

(82)

Cette statistique est elle aussi asymptotiquement normalement distribue. Lapproche de


Chang (2002) est a priori extrmement sduisante puisquelle ne fait aucune hypothse sur la
nature des dpendances inter-individuelles, contrairement aux modles factoriels utiliss dans
les autres tests. Il est toutefois important de signaler quIm et Pesaran (2003), en utilisant un
modle facteurs communs, mettent en vidence de trs fortes distorsions de taille pour ce test,
y compris lorsque la dimension N est relativement faible par rapport la dimension T:

Application

Considrons prsent une application de ces dirents tests portant sur le PNB rel par
tte de 25 pays de lOCDE. Le panel est cylindr25 sur la priode 1965-2000 puisque certains
tests tudis ne peuvent pas tre implments lorsque les dimensions temporelles varient avec
les individus.
On constate tout dabord que les trois tests de premire gnration conduisent un diagnostic mitig quant la prsence dune racine unitaire dans le PNB rel par tte (tableau 6).
Le test de Levin, Lin et Chu (2002) conduit au rejet de la non stationnarit quelle que soit
lhypothse formule sur la composante dterministe (modle avec eets individuels ou modle
avec eets individuels et tendances dterministes). Dans cet exemple, la statistique de Levin et
Lin est fonde sur une estimation de la variance de long terme des rsidus utilisant une fonction
noyau de type Bartlett et un paramtre de troncature commun pour tous les pays, dtermin
par la valeur q = 3:21T 1=3 (Levin, Lin et Chu, 2002)26 . Mais ce rsultat est robuste la modication de la fonction noyau ainsi quau choix de paramtres individuels par la mthode de
Newey et West (1994). Les retards individuels pi ont t dtermins par la mthode du gnral
au spcique dHall (1994) et les rsultats savrent robustes au choix dune autre mthode de
slection des retards. Le test de Levin et Lin conduit donc un rsultat assez contre-intuitif
selon lequel le PIB par tte serait stationnaire pour les pays de lOCDE de notre panel.
Les rsultats sont lgrement dirents lorsque lon prend en compte la dimension htrogne
de la racine autorgressive avec le test dIm, Pesaran et Shin (2003). A partir des mmes retards
individuels que dans le test de Levin et Lin, la statistique de test Wtbar conduit accepter
lhypothse nulle de racine unitaire dans un modle avec eets individuels. Toutefois, ce rsultat
nest pas robuste linclusion de tendances dterministes. En outre, les tests de Maddala et
Wu (1999) et Choi (2001) bass eux aussi dans cet exemple sur les statistiques de tests ADF
individuelles conduisent au rejet de la non stationnarit, y compris dans un modle sans
tendance. Rappelons toutefois que, pour ces tests, le rejet de lhypothse nulle nimplique pas
2 5 Les donnes sont tires des World Development Indicators, World Bank (Code : NY.GDP.PCAP.KD) et
correspondent au PNB par tte exprim en dollars constants 1995, base 100 en 1995. Six pays de lOCDE ont t
exclus de lchantillon : la Turquie, lAllemagne, la Rpublique Tchque, la Pologne et la Rpublique Slovaque.
Les programmes de ces tests ont t raliss sous Matlab.
2 6 Lestimateur b 2 de la variance de long terme
2 dans le modle sans constante est dni par : b 2 =
i
i
i
Pqi
1 PT
1 PT
2
y
+
2
w(q
;
j)
y
y
i
=
1;
::;
N
o
w
(q
;
j)
dsigne
une
fonction
i
i;t
i;t
j
i
t=2
t=2+j
i;t
j=1
T 1
T 1
noyau et qi un paramtre de troncature. Levin et Lin utilisent une fonction noyau de type Bartlett et, dans
leurs simulations de Monte Carlo, ils considrent une taille de fentre identique pour tous les individus qi = q;
telle que q soit dni comme lentier le plus proche de la quantit q = 3:21 Te1=3 avec Te = (T p 1) o
P
p = (1=N ) N
i=1 pi dsigne la moyenne des retards sur les N individus. Dans le cas du modle avec constante,
y i : Dans le cas
lestimateur est dni en remplaant les variations yi;t par les variations centres yi;t
du modle 3, il convient de remplacer yi;t par les variations prises en cart une tendance dterministe
yi;t ai bi t o les paramtres ai et bi sont estims par MCO sur donnes individuelles.

40

la stationnarit des PNB par tte des 25 pays de lchantillon, mais signie quil existe au moins
un pays pour lequel il ny a pas de racine unitaire dans la dynamique du PNB. On obtient ainsi
globalement des rsultats trs mitigs, y compris avec le test dIm, Pesaran et Shin (2003).

Tab. 6 Rsultats des Tests de Premire Gnration


Statistique
Levin, Lin et Chu (2002)

Modle sans tendance

6:739
(0:00)

Im, Pesaran et Shin (2003)

Modle avec tendance


4:753
(0:00)

Ztbar

0:594

Wtbar

0:545
(0:70)

(0:00)

Maddala et Wu (1999)

PM W

68:01

85:29

Choi (2001)

ZM W

1:80

3:529

(0:72)

(0:05)

(0:04)

6:020
(0:00)

2:519
(0:00)
(0:00)

N o te s : L e s p -va lu e s a s s o c i e s a u x d i re n te s s ta tis tiq u e s g u re n t e n tre p a re n th s e s

Une des raisons qui pourrait expliquer ces rsultats tient la prsence dventuelles dpendances entre les PNB rels par tte des pays de la zone OCDE. La procdure de test27 du
nombre de facteurs communs propose par Bai et Ng (2002) nous conduit ainsi retenir lexistence dun facteur commun dans le PNB (r = 1). A partir des estimations ebit des composantes
idiosyncratiques obtenues par lapproche de Bai et Ng (2004), les tests sur ces composantes
conduisent au rejet de lhypothse nulle de racine unitaire. Ainsi, la ralisation de la statistique
la Choi (2001), note Z c ; construite partir des composantes idiosyncratiques estimes, est
gale 3:461. Toutefois, ce test ne conduit pas au rejet global de la non stationnarit des PNB
rels par tte puisque la composante de facteur commun prsente elle au contraire une proprit
de racine unitaire. En eet, la ralisation de la statistique de test ADF construite partir du
facteur commun Fb (ADFFcb = 1:212) conduit accepter lhypothse nulle de racine unitaire.
Ainsi, dans la perspective de Bai et Ng (2004), le PNB rel par tte admet une racine unitaire,
mais celle-ci provient uniquement de la composante de facteur commun qui peut sassimiler
dans notre exemple un facteur de croissance mondiale. Les composantes dcart ce facteur
commun sont quant elle stationnaires.
Ces rsultats sont globalement conrms par les autres tests de racine unitaire de seconde
gnration (tableau 7). Le test de Moon et Perron, dni uniquement sur la composante dcart
au facteur commun, conduit rejeter lhypothse nulle de racine unitaire. Mais, contrairement
au cas du test de Bai et Ng, on rejette alors la racine unitaire pour le PNB rel par tte
dans cet chantillon. Ce rsultat nest toutefois pas robuste la prise en compte de tendances
#
dterministes dans le modle. Dans ce cas, les statistiques modies t#
a et tb (Moon et Perron,
2004) conduisent accepter lhypothse nulle. Pour tous les autres tests, lhypothse nulle
de racine unitaire nest pas rejete et ce de faon robuste au choix des statistiques et de la
composante dterministe du modle. Les trois statistiques de Choi (2002), la statistique CIPS
de Pesaran (2003) calcule pour trois ordres de retard dirents (CIPSp avec p = 1; 2 et 328 )
ainsi que les statistiques de Chang calcules pour trois fonctions non linaires instrumentales,
permettent de conclure la prsence dune racine unitaire dans la dynamique du PNB rel
par tte des pays de lOCDE. Il est ainsi trs intressant de constater quel point la prise en
2 7 Dans

cette tude, nous retenons le critre dinformation IC2 :


des statistiques tronques CIP S donne des rsultats similaires.

2 8 Lutilisation

41

compte des ventuelles dpendances inter-individuelles peut modier la nature du diagnostic


quant la non stationnarit des sries macro-conomiques.
Tab. 7 Rsultats des Tests de Deuxime Gnration
Moon et Perron (2004)

Modle sans tendance

Modle avec tendance

rb

1
Choi (2002)

Pesaran (2003)

Pm
3:508

(0:00)

Z
4:323

L
4:137

Pm
1:558

tb

12:26

(0:99)

(1:00)

CIP S1

CIP S2

1:848
Chang (2002)

(0:00)

rb

ta

1:823

5:910

(1:00)

CIP S3

t#
a
0:310
(0:37)

Z
0:678

t#
b
0:293
(0:38)

L
0:523

(0:06)

(0:24)

(0:30)

CIP S1

CIP S2

CIP S3

1:911

2:465

2:375

2:196

(0:37)

(0:41)

(0:29)

(0:26)

(0:40)

(0:69)

IGF1
12:88

IGF2
16:86

IGF3
14:52

IGF1
6:411

IGF2
1:389

IGF3
6:911

(1:00)

(1:00)

(1:00)

(1:00)

(0:91)

(1:00)

N o te s : L e s p -va lu e s a s s o c i e s a u x d i re n te s s ta tis tiq u e s g u re n t e n tre p a re n th s e s

Conclusion et extensions : vers une troisime gnration


de tests

Dans ce travail, nous nous sommes attachs dresser une revue de la littrature des principaux tests de racine unitaire en panel. Nous avons mis en vidence une double volution de ces
tests depuis les travaux fondateurs de Levin et Lin (1992) : une volution vers des modlisations
htrognes avec les travaux dIm, Pesaran et Shin (1997) et de Maddala et Wu (1999) et, plus
rcemment, une volution vers une prise en compte des dpendances inter-individuelles. Cette
dernire introduit une dichotomie entre deux gnrations de tests. La seconde gnration est
aujourdhui en pleine construction tant donn la diversit des formes possibles de corrlations
inter-individuelles.
A ct des deux gnrations de tests prsents ici, il convient de mentionner quune troisime
catgorie de tests se dveloppe depuis le dbut de la dcennie actuelle : les tests de racine unitaire
en panel incluant la possibilit de ruptures structurelles. Depuis les travaux pionniers de Perron
(1989), il est en eet bien connu que le fait de ne pas tenir compte des ruptures structurelles
lorsquelles existent peut engendrer un biais en faveur du non rejet de lhypothse de
racine unitaire conduisant une perte de puissance signicative de ces tests. Un tel problme,
initialement mis en vidence dans le cas des tests sur sries temporelles, se pose galement
dans le cas des tests en panel. En eet, les tests de racine unitaire en panel, reposant sur une
combinaison linaire des statistiques de tests sur sries individuelles, sourent ainsi du mme
problme de biais et de perte de puissance si un changement structurel est prsent.
Lun des travaux fondateurs dans le domaine est le test dvelopp par Im, Lee et Tieslau
(2002), reprenant les dveloppements de Im et Lee (2001). Ce test, constituant une extension
du test de Schmidt et Phillips (1992) et Amsler et Lee (1995) bas sur le principe du multiplicateur de Lagrange, est relativement exible dans la mesure o les ruptures structurelles nont
pas ncessairement lieu la mme date pour tous les individus et le nombre de ruptures peut
tre dirent pour chaque individu du panel. Ce test repose toutefois sur lhypothse restrictive
dabsence de corrlation inter-individuelle des termes derreur, ce qui a conduit au dveloppe42

ment dautres types de tests, en particulier par Carrion et al. (2001, 2002). Le test propos par
Carrion et al. (2001) constitue une gnralisation du test de Harris et Tzavalis (1999) et vise
tenir compte dun changement structurel intervenant dans chacune des sries individuelles la
mme date. Prolongeant ces travaux, Carrion et al. (2002) dveloppent un test de lhypothse
nulle de stationnarit tenant compte de lexistence possible de ruptures multiples et constituant
une extension du test de Hadri (2000). Ce dernier test est assez gnral au sens o il considre (i ) des ruptures structurelles multiples, (ii ) des ruptures structurelles qui peuvent tre
situes des dates direntes pour chacune des sries et (iii ) un nombre dirent de ruptures
structurelles pour chaque individu du panel.

43

Rfrences
[1] Amemiya, T. (1985), Advanced Econometrics, Harvard University Press.
[2] Amsler, C. et Lee, J. (1995), An LM Test for a Unit Root in the Presence of a
Structural Change, Econometric Theory, 11, 359-368.
[3] Andrews, D.W.K. (1991), Heteroskedasticity and Autocorrelation Consistent Covariance Matrix Estimation, Econometrica, 59, 817-858.
[4] Bai, J. et Ng, S. (2001), A PANIC Attack on Unit Roots and Cointegration, Boston
College, Department of Economics, Unpublished Manuscript.
[5] Bai, J. et Ng, S. (2002), Determining the Number of Factors in Approximate Factor
Models, Econometrica, 70(1), 191-221.
[6] Bai, J. et Ng, S. (2004), A PANIC Attack on Unit Roots and Cointegration, Econometrica, 72(4), 1127-1178.
[7] Baltagi, B.H. et Kao, C. (2000), Nonstationary Panels, Cointegration in Panels and
Dynamic Panels : a Survey, Advances in Econometrics, vol 15, Elsevier Science, 7-51.
[8] Banerjee, A. (1999), Panel Data Unit Root and Cointegration : an Overview, Oxford
Bulletin of Economics and Statistics, Special Issue, 607-629.
[9] Banerjee, A., Marcellino, M. et Osbat, C. (2000), Some Cautions on the Use
of Panel Methods for Integrated Series of Macro-economic Data, Working Paper 170,
IGIER.
[10] Banerjee, A., Marcellino, M. et Osbat, C. (2003), Testing for PPP : Should we
use Panel Methods ?, Mimeo.
[11] Banerjee, A. et Zanghieri, P. (2003), A New Look at the Feldstein-Horioka Puzzle
Using an Integrated Panel, Working Paper CEPII, 2003-22.
[12] Carrion-I-Silvestre, J.L., Del Barrio-Castro, T. et Lopez-Bazo, E. (2001),Level Shifts in a Panel Data Based Unit Root Test. An Application to the Rate of Unemployment, Technical Report, Dpartement dconomtrie, Universit de Barcelone.
[13] Carrion-I-Silvestre, J.L., Del Barrio-Castro, T. et Lopez-Bazo, E.
(2002),Breaking the Panels. An Application to the GDP per Capita, Document de travail,
Dpartement dconomtrie, , Universit de Barcelone.
[14] Chang, Y. (2002), Nonlinear IV Unit Root Tests in Panels with CrossSectional Dependency, Journal of Econometrics, 110, 261-292.
[15] Chang, Y. (2004), Bootstrap Unit Root Tests in Panels with Cross-Sectional Dependency, Journal of Econometrics, 120, 263-293.
[16] Choi, I. (2001), Unit Root Tests for Panel Data, Journal of International Money and
Finance, 20, 249-272.
[17] Choi, I. (2002), Combination Unit Root Tests for Cross-Sectionally Correlated Panels,
Mimeo, Hong Kong University of Science and Technology.
[18] Dickey, D.A. et Fuller, W.A. (1979), Distribution of the Estimators for Autoregressive Time Series with a Unit Root, Journal of the American Statistical Association, 74,
417-31.
[19] Dickey, D.A. et Fuller, W.A. (1981), Likelihood Ratio Statistics for AutoRegressive
Time Series with a Unit Root, Econometrica, 49, 1057-1072.
[20] Elliott, G., Rothenberg, T. et Stock, J. (1996), E cient Tests for an AutoRegressive Unit Root, Econometrica, 64, 813-836
[21] Evans, P. et Karras, G. (1996), Convergence Revisited, Journal of Monetary Economics, 37, 249-265.
44

[22] Fisher, R.A. (1932), Statistical Methods for Research Workers, Oliver and Boyd, Edinburgh.
[23] Gaulier, G., Hurlin, C. et Jean-Pierre, P. (1999), Testing Convergence : A Panel
Data Approach, Annales dEconomie et de Statistique, 55-56, 411-428.
[24] Hadri, K. (2000), Testing for Unit Roots in Heterogeneous Panel Data, Econometrics
Journal, 3, 148-161.
[25] Hall, A. (1994), Testing for a Unit Root in Time Series with Pretest Data-Based Model
Selection, Journal of Business and Economic Statistics, 12, 461-70.
[26] Hamilton, J.D. (1994), Times Series Analysis, Princeton.
[27] Harris, R.D.F. et Tzavalis, E. (1999), Inference for Unit Roots in Dynamic Panels
where the Time Dimension is Fixed, Journal of Econometrics, 91, 201-226.
[28] Harvey, A. et Bates, D. (2003), Multivariate Unit Root Tests and Testing for Convergence, Faculty of Economics and Politics, University of Cambridge, Unpublished Manuscript.
[29] Henin, P-Y., Jolivaldt, P. et Nguyen, A. (2001), Testing for Unit Root on Heterogenous Panels : A Sequential Approach, Couverture Orange CEPREMAP, 2001-08
[30] Hurlin, C. (2001), Economtrie des Donnes de Panel. Modles Linaires Simples, Ecole
Doctorale Edocif, Universit Paris IX Dauphine.
[31] Hurlin, C. et NDiaye (1998), La Mthode dEstimation des Fully Modied ou
Moindres Carrs Modis : Avantages et Limites., Cahiers Eco & Maths 98.26, Universit
de Paris I.
[32] Hsiao, C. (1986), Analysis of Panel Data, Econometric society Monographs N0 11.
Cambridge University Press.
[33] Im, K.S. et Lee, J. (2001), Panel LM Unit Root Tests with Level Shifts, Manuscript,
University of Central Florida.
[34] Im, K.S., Lee, J. et Tieslau, M. (2002), Panel LM Unit Root Tests with Level Shifts,
Manuscript, University of Central Florida.
[35] Im, K.S. et Pesaran, M.H. (2003), On the Panel Unit Root Tests Using Nonlinear
Instrumental Variables, Manuscript, University of Southern California.
[36] Im, K.S., Pesaran, M.H. et Shin, Y. (1997), Testing for Unit Roots in Heterogenous
Panels, DAE, Working Paper 9526, University of Cambridge.
[37] Im, K.S., Pesaran, M.H. et Shin, Y. (2002), Testing for Unit Roots in Heterogenous
Panels, revised version of the DAE, Working Paper 9526, University of Cambridge.
[38] Im, K.S., Pesaran, M.H. et Shin, Y. (2003), Testing for Unit Roots in Heterogeneous
Panels, Journal of Econometrics, 115, 1, 53-74.
[39] Johansen, S. (1988), Statistical Analysis of Cointegration Vectors, Journal of Economic
Dynamics and Control, 12, 231-254.
[40] Kwiatkowski, D., Phillips, P.C.B., Schmidt, P. et Shin, Y. (1992), Testing the
Null Hypothesis of Stationarity against the Alternative of a Unit Root, Journal of Econometrics, 54, 91-115.
[41] Levin, A. et Lin, C.F. (1992), Unit Root Test in Panel Data : Asymptotic and Finite
Sample Properties, University of California at San Diego, Discussion Paper 92-93.
[42] Levin, A. et Lin, C.F. (1993), Unit Root Test in Panel Data : New Results, University
of California at San Diego, Discussion Paper 93-56.
[43] Levin, A., Lin, C.F., et Chu., C.S.J. (2002), Unit Root Test in Panel Data : Asymptotic and Finite Sample Properties, Journal of Econometrics, 108, 1-24.
45

[44] Leybourne, S.J. (1995), Testing for Unit Roots Using Forward and Reverse DickeyFuller Regressions, Oxford Bulletin of Economics and Statistics, 57, 559-571.
[45] Lopez, J.H. (1997), The Power of the ADF Test, Economics Letters, 57, 5-10.
[46] MacKinnon, J.G. (1994), Approximate Asymptotic Distribution Functions for UnitRoot and Cointegration, Journal of Business and Economic Statistics, 12, 167-176.
[47] Maddala, G.S. et Wu, S. (1999), A Comparative Study of Unit Root Tests with Panel
Data and a New Simple Test, Oxford Bulletin of Economics and Statistics, special issue,
631-652.
[48] Magnus, J.R. (1986), The Exact Moments of a Ratio of Quadratic Forms in Normal
Variables, Annales dEconomie et de Statistique, 4, 96-109.
[49] Moon, H. R. et Perron, B. (2004), Testing for a Unit Root in Panels with Dynamic
Factors, Journal of Econometrics, 122, 81-126.
[50] Moon, H. R., Perron, B. et Phillips, P.C.B (2003), Incidental Trends and the
Power of Panel Unit Root Tests, Mimeo, Universit de Montral.
[51] Nabeya, S., (1999), Asymptotic Moments of some Unit Root Test Statistics in the Null
Case, Econometric Theory, 15, 139-149.
[52] Newey, W. et West, K. (1994), Automatic Lag Selection and Covariance Matrix
Estimation, Review of Economic Studies, 61, 631-653.
[53] Ng, S. et Perron, P. (1995), Unit Root Tests in ARMA Models with Data Dependent
Methods for the Selection of the Truncation Lag, Journal of the American Statistical
Association, 90, 268 281.
[54] O Connell, P. (1998), The Overvaluation of Purchasing Power Parity, Journal of International Economics, 44, 1-19.
[55] Perron, P. (1989), The Great Crash, the Oil Price Shock, and the Unit Root Hypothesis, Econometrica, 57, 1361-1401.
[56] Pesaran, H.M. (2003), A Simple Panel Unit Root Test in the Presence of Cross Section
Dependence, Mimeo, University of Southern California.
[57] Pesaran, H.M. et Smith, R (1995), Estimating Long-Run Relationships from Dynamic
Heterogenous Panels, Journal of Econometrics, 68, 79-113.
[58] Phillips, P.C.B. et Moon, H. (1999), Linear Regression Limit Theory for Nonstationary Panel Data, Econometrica, 67, 1057-1111.
[59] Phillips, P.C.B. et Perron, P. (1988), Testing for a Unit Root in Time Series Regression, Biometrika, 75, 335-346.
[60] Phillips, P.C.B. et Sul, D. (2003a), Dynamic Panel Estimation and Homogeneity
Testing Under Cross Section Dependence, Econometrics Journal, 6(1), 217-259.
[61] Phillips, P.C.B. et Sul, D. (2003b), The Elusive Empirical Shadow of Growth Convergence, Cowles Foundation Discussion Paper 1398, Yale University.
[62] Pierce, R.G. et Snell, A.J. (1995), Temporal Aggregation and the Power of Tests for
a Unit Root, Journal of Econometrics, 65, 333-345.
[63] Ploberger, W. et Phillips, P.C.B. (2002), Optimal Testing for Unit Roots in Panel
Data, Mimeo.
[64] Quah, D. (1994), Exploiting Cross-Section Variations for Unit Root Inference in Dynamic
Data, Economics Letters, 44, 9-19.
[65] Salanie, B. (1999), Guide Pratique des Sries Non Stationnaires, Economie et Prvision, 137, 119-141.
[66] Schmidt, P. et Lee, J. (1991), A Modication of Schmidt-Phillips Unit Root Test,
Economics Letters, 36, 285-289.
46

[67] Schmidt, P. et Phillips, P.C.B. (1992), LM Tests for a Unit Root in the Presence of
Deterministic Trends, Oxford Bulletin of Economics and Statistics, 54, 257-587.
[68] Sevestre, P. (2002), Economtrie des Donnes de Panel, Dunod.
[69] Stock, J.H and Watson, M.W. (1988), Testing for Common Trends, Journal of the
American Statistical Association, 83, 1097-1107.
[70] Stock, J.H et Watson, M.W. (1993), A Simple Estimator of Cointegrating Vectors
in Higher Order Integrated Systems, Econometrica, 61, 783-820.
[71] Strauss, J. et Yigit, T. (2003), Shortfalls of Panel Unit Root Testing, Economics
Letters, 81, 309-313.
[72] Taylor, M.P. et Sarno, L. (1998), The Behavior of Real Exchange Rates During the
Post-Bretton Woods Period, Journal of International Economics, 46, 281-312.

47

You might also like