Professional Documents
Culture Documents
DE LA AUTOCORRELACIÓN: Introducción al
concepto de no estacionariedad y regresión espuria
Ramón Mahía
Marzo 2006
1/11
rechazarse la hipótesis de nulidad del parámetro real con un (1-0,37)=0,63% de
nivel de confianza.
A la vista de esta falta de sintonía evidente, cabe sospechar que estamos ante un error de
especificación. Efectivamente, y aunque se verá con detalle más adelante, un simple
vistazo al valor del DW indica una fuerte autocorrelación positiva que, seguramente,
viene causada por una indebida especificación en niveles.
50000
40000
30000
20000
4000
10000
2000
0
-2000
-4000
82 84 86 88 90 92 94 96 98 00 02
1
Se deja al alumno, como ejercicio voluntario, la realización del contraste de Wallis, dada la naturaleza
trimestral de los datos utilizados.
2/11
El valor del DW es extremadamente bajo (0,29) lo que, dados los límites inferior y
superior de la distribución DW (1,575 y de 1,721 respectivamente al 5% para K=4 y
n=85), confirman la presencia de una fuerte autocorrelación positiva2. El valor del
coeficiente “ρ” asociado a este valor del Durbin Watson, que correspondería a un
hipotético proceso autorregresivo de orden uno subyacente en el residuo, resulta ser de
0,85, esto es, muy indicativo de autocorrelación positiva:
ei = ρ ⋅ ei + ε i Ec. (1)
DW
DW ≅ 2 ⋅ (1 − ρˆ ) → ρˆ ≅ 1 − → ρˆ ≅ 0,85
2
Dependent Variable: R
Method: Least Squares
Date: 03/13/06 Time: 11:49
Sample(adjusted): 1981:2 2002:2
Included observations: 85 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
R(-1) 0.857483 0.057251 14.97773 0.0000
R-squared 0.727543 Mean dependent var -14.75610
Adjusted R-squared 0.727543 S.D. dependent var 1577.299
S.E. of regression 823.3101 Akaike info criterion 16.27624
Sum squared resid 56938521 Schwarz criterion 16.30497
Log likelihood -690.7401 Durbin-Watson stat 2.120850
3/11
un artículo con el inquietante, pero muy descriptivo título: Why do we sometimes get
nonsense correlations between time series?. Efectivamente, el problema de las
regresiones espurias es que tienden a admitirse como buenas, relaciones
económicas que, en realidad, sólo se deben a aspectos casuales.
¿Debemos, por tanto, rechazar siempre el uso de variables en niveles ante el riesgo
de una regresión espuria?: Concepto de Variable No Estacionaria o “Integrada”.
4/11
de una tendencia4) resulta generalmente un problema fácil de afrontar y resolver en la
modelización con variables en niveles5, la presencia de raíces unitarias en las variables
(no estacionariedad en varianza) impide su utilización en niveles. Si se realiza una
estimación en niveles de una ecuación de regresión entre dos variables No Estacionarias
(también se denominan “integradas”) corremos un alto riesgo de encontrarnos ante una
regresión espuria; La forma más clara de ilustrar el problema es utilizar los resultados
del ejemplo expuesto por Newbold y Davies (1978) y Granger y Newbold (1986) y
reutilizado después en numerosos textos como Charemza y Deadman (1992).
Supongamos dos variables yt y xt independientemente generadas por paseos aleatorios:
y t = y t −1 + ε 1t
x t = x t −1 + ε 2 t
donde ε1t y ε2t son variables aleatorias normales estándar independientes entre sí con
media cero y varianza unitaria. Dado que yt y xt están generadas de forma independiente
deberíamos esperar que no existiera ninguna relación significativa entre ambas. Sin
embargo, sobre un conjunto de 1000 muestras de yt y xt con 50 observaciones, alrededor
de un 65% de las regresiones de yt sobre xt presentan contrastes “t” significativos a un
nivel de significatividad del 5%6.
Tal y como expone Enders (1995) basta con reparar en las propiedades de la
perturbación aleatoria de la regresión de yt sobre xt para apreciar lo absurdo de estos
resultados. Efectivamente, en la regresión:
y t = a 0 + a1 x t + et
et = y t − a1 xt
t t
et = ∑ ε 1i − a1 ∑ ε 2i
i =0 i =0
4
Suele denominarse a estas variables “trend stationary” TS a diferencia de aquellas que son NO
estacionarias en varianza que suelen denominarse con el acrónimo DS “difference stationary”.
5
Las regresiones espurias, no obstante, no sólo se producen por la aparición de tendencias estocásticas
en las series: las tendencias deterministas también pueden ser un problema. Si hacemos depender una
serie yt lineal (1,2,3,4..... 50) de otra xt con tendencia cuadrática (1,4,.......502) el resultado en términos
de R2 es de 0,94 cuando en realidad queda claro que el patrón de evolución de la serie cuadrática
acabará por divergir de forma definitiva cuando el número de datos tienda a infinito. Para ajustar
adecuadamente una regresión al caso de variables con tendencias deterministas basta con incorporar
una variable de tiempo “t” que recoja la tendencia común de ambas series o bien “filtrar de tendencia”
los datos antes de su utilización en la regresión.
6
Estos datos se refieren a la prueba efectuada por Charemza y Deadman (1992). En el experimento
original de Granger y Newbold (1974) el porcentaje de regresiones con parámetro significativo al 5%
fue del 75%.
5/11
Por tanto, es obvio que estamos ante una secuencia et no estacionaria en varianza. Si
esto es así, et presenta una tendencia estocástica, lo que quiere decir que el error
cometido en “t” no se diluye en t+1, t+2... t+s ;es imposible que una regresión en la que
los errores se acumulan de forma permanente pueda tener algún interés.
Nótese que en esta situación se violan un buen número de hipótesis básicas asumidas en
los procesos de inferencia habituales en el contexto del Modelo Básico de Regresión
Lineal:
n
plim ∑ xi2 n = cte
i =1
6/11
una de ellas, o sea, una relación de equilibrio a largo plazo. A esa ligazón, representada
por el denominado “vector de cointegración”, no le afectan más que de forma temporal
los shocks que inciden en cada una de las series de forma permanente y, por tanto, cabe
pensar en la idea de un equilibrio estacionario en el que las desviaciones sean
exclusivamente temporales.
8
Algunos autores distinguen esta situación de aquella en la que la autocorrelación no viene provocada
por una deficiente especificación. Gujarati, por ejemplo, define esta situación como Autocorrelación
Pura.
9
Existen varios contrastes muy utilizados para detectar la No Estacionariedad en varianza de las series.
Los más sencillos y populares son los contrates DF y ADF (Dickey-Fuller y Augmented Dickey-Fuller),
el contraste PP (Phillips – Perron), ambos incluidos desde hace tiempo en el software E-Views.
10
Econometría. (4ª Edición). Mc-Graw-Hill.
7/11
Regresión con variables en diferencias
11
La utilización de tasas interanuales también sería posible en este caso al tratarse de variables
trimestrales. Sin embargo, salvo que se compruebe la existencia de raíces unitarias (no estacionariedad)
estacionales, esta tasa no resolvería el problema de la no estacionariedad en la componente regular (no
estacional).
8/11
evitando en parte los efectos indeseables de una inadecuada estimación MCO en un
contexto en que esta estrategia no es válida.
Quizá la forma más burda de hacer esta corrección sea simplemente camuflar el mal
dato del DW añadiendo la endógena retardada en la regresión; como puede imaginarse,
esta táctica, ni siquiera trata de adaptar la ineficiente herramienta de estimación MCO al
problema de la autocorrelación sino, directamente, distorsionar el modelo de forma que
el DW no refleje la verdadera dimensión de la autocorrelación.
Efectivamente, aunque el valor del nuevo DW parece ahora aceptable, debe recordarse
que, en realidad, en presencia de autocorrelación, se propone utilizar el estadístico “h”
de Durbin en lugar del estadístico DW original.
n
h = ρˆ
1 − nσˆ 2 (b1 )
n 85
h = ρˆ = 0.283 = 2.798
1 − nσˆ (b1 )
2
1 − 85 ⋅ (0.039181) 2
El valor de este estadístico se contraste suponiendo una distribución normal (0,1), así,
con un nivel de significación del 5%, el valor a superar es 1,645. Si el estadístico
calculado supera este valor, debe rechazarse la hipótesis de autocorrelación nula; en
nuestro caso, el valor 2.798 supera ampliamente el valor crítico por lo que,
evidentemente, la “h” de Durban refleja la existencia de autocorrelación por mucho que
el valor del DW haya mejorado artificialmente.
9/11
Una transformación algo más elegante, aunque inadecuada cuando el problema de fondo
es una incorrecta especificación en niveles, es, tal y como se expuso en las sesiones
teóricas, optar por utilizar la transformada de las variables originales, es decir, la
denominada MCG Factibles (MCGF) o Mínimos Cuadrados Generalizados Estimados
(MCGE):
y t* = y t − ρˆ ⋅ y t −1
x *jt = x jt − ρˆ ⋅ x jt −1
Y1* = Y1 1 − ρˆ 2
X *j1 = X j1 1 − ρˆ 2
En realidad, dado que el cálculo directo del “rho” implica cierta probabilidad de error,
suele ser conveniente utilizar el procedimiento de cálculo iterativo de ρ conocido como
Cochrane – Orcutt descrito en clase. Esto implicaría un proceso sucesivo de re-cálculo
de “rho” a partir de los nuevos resultados del DW obtenidos en esta regresión, y una
nueva transformación de las variables “previamente transformadas” …… ES decir, en
nuestro ejemplo, el nuevo valor del DW es ahora 1.97 lo que implica un valor del “ρ” de
0.015; podría utilizarse ese nuevo valor para transformar de nuevo las variables y
reestimar nuevamente la ecuación.12
10/11
La última de las estrategias para mejorar la estimación de un modelo de autocorrelación
consiste, evidentemente, en la utilización de Mínimos Cuadrado Generalizados
considerando para ello la matriz Σ de varianzas y covarianzas que corresponde al patrón
de autocorrelación detectado. En caso de verificarse la existencia de un proceso AR(1)
en los residuos, la forma de la matriz de autocorrelación es bien conocida pero si no
pudiésemos verificar que el proceso de autocorrelación sigue ese modelo AR(1)
deberíamos considerar estimaciones alternativas de sigma. Como ya se dijo en el
contexto de la heterocedasticidad, el riesgo de la transformación o de la utilización de
MCG radica, evidentemente, en la verosimilitud del modelo de autocorrelación
supuesto; si el modelo de autocorrelación resulta desconocido o complejo, los
eventuales beneficios de eficiencia derivados de la utilización de un procedimiento de
MCG o MCO sobre variables corregidas podrían ser menores de los previstos en cuanto
que estarán condicionados a la decisión sobre el patrón de autocorrelación considerado.
11/11