You are on page 1of 6

CAPTULO 5

Errores de especicaci
on
Estrictamente hablando, un error de especicaci
on es el incumplimiento de cualquiera
de los supuestos b
asicos del modelo lineal general. En un sentido m
as laxo, esta expresion hace referencia al supuesto implcito de que la matriz de dise
no X est
a correctamente especicada; dicho de otro modo, que las variables explicativas incluidas en la
matriz X son las verdaderamente relevantes en la explicaci
on de y. En una aplicaci
on
practica, al dise
nar la matriz X podemos cometer dos tipos de errores especicaci
on:
omisi
on de variables relevantes (infraespecicaci
on) e inclusi
on de variables irrelevantes
(sobreespecicaci
on). En este captulo, se estudian las consecuencias que se derivan de
estos dos errores de especicaci
on sobre las propiedades estadsticas del estimador de
mnimos cuadrados ordinarios.

5.1.

Omisi
on de variables relevantes

Supongamos que el modelo correcto para explicar la variable dependiente y es, en


forma particionada,
y
(n1)

Xr r
(n r)(r 1)

Xs s

(n s)(s 1)

u
(n1)

pero por error especicamos el modelo incorrecto


y = Xr r +
an la lista de factores
en donde hemos omitido las variables Xs . Estas variables engrosar
omitidos que recoge el nuevo termino de error, = Xs s + u, cuya esperanza claramente
es distinta de un vector de ceros, E() = Xs s .
r de r en el modelo incor n 51. El estimador de mnimos cuadrados b
Proposicio
r ) = (X Xr )1 X Xs s .
recto es, en general, un estimador sesgado, siendo el sesgo B(b
r
r
n. El estimador de mnimos cuadrados en el modelo incorrecto es
Demostracio
r = (X Xr )1 Xr y
b
r
Para estudiar las propiedades estadsticas de este estimador, reemplazamos y por su
expresi
on en el modelo correcto. As,
r = (X Xr )1 Xr [Xr r + Xs s + u] = r + (X Xr )1 X Xs s + (X Xr )1 X u
b
r
r
r
r
r
Tomando esperanza matem
atica
r ) = r + (X Xr )1 X Xs s
E(b
r
r
77

78

5.1. Omision de variables relevantes

vemos que el estimador de r en el modelo incorrecto es sesgado, siendo el sesgo (bias,


en ingles)
r ) = (X Xr )1 X Xs s
B(b
r
r

n 43. El sesgo causado por la omisi


Definicio
on de variables relevantes se denomina
sesgo de especicaci
on, y recoge la inuencia de Xs sobre y que estamos atribuyendo a
Xr .
n 52. El estimador de r en el modelo incorrecto ser
a insesgado cuando
Proposicio
las variables omitidas y las variables incluidas sean ortogonales.
n. Las columnas de la matriz (Xr Xr )1 Xr Xs de orden rs contienen
Demostracio
las pendientes estimadas en la regresi
on de cada variable explicativa omitida sobre las
variables explicativas incluidas. Estas pendientes ser
an iguales a cero u
nicamente en el

caso especial en que las matrices Xs y Xr sean ortogonales, Xr Xs = 0.


a insesgado
Observaci
on 31. El estimador de r en el modelo incorrecto tambien ser
un error de especicaci
on.
cuando s = 0s , es decir, cuando no se comete ning
n 53. El estimador de r en el modelo incorrecto es m
Proposicio
as ecienteque
el estimador de mnimos cuadrados de r en el modelo correcto.
n. Vamos a demostrar que la diferencia entre las matrices de varianDemostracio
zas y covarianzas de estos dos estimadores de r es una matriz semidenida negativa.
En el modelo incorrecto




r E(b
r )][b
r E(b
r )] = E (Xr Xr )1 Xr uu Xr (Xr Xr )1
r ) =E [b
V (b


=(Xr Xr )1 Xr E uu Xr (Xr Xr )1 = u2 (Xr Xr )1
  
2I
u
n

mientras que en el modelo correcto


V (r ) = u2 (Xr Ms Xr )1
En lugar de comparar estas dos matices, comparamos las inversas
)1 = 2 X Xr 2 X Ms Xr = 2 X [In Ms ]Xr = 2 X [Xs (X Xs )1 X ]Xr
r )1 V (
V (b
r
u
r
u
r
u
r
u
r
s
s
Deniendo C = Xs (Xs Xs )1 Xs Xr , obtenemos la matriz semidenida positiva
)1 = 2 C C
r )1 V (
V (b
r
u
que ser
a una matriz nula cuando Xs Xr = 0.

n 54. El estimador de u2 en el modelo incorrecto


Proposicio

y Mr y
=
nr
nr
es sesgado, siendo el sesgo no negativo.

n. La suma de cuadrados de los residuos en el modelo incorrecto,


Demostracio
puede escribirse como

y Mr y,

y Mr y = [Xr r + Xs s + u] Mr [Xr r + Xs s + u]
Prof. Dr. Jos
e Luis Gallego G
omez
Departamento de Economa. Universidad de Cantabria

Apuntes de Econometra. LADE y LE. Curso 2008-2009.


Material publicado bajo licencia Creative Commons

79

5. Errores de especicacion

en donde se ha reemplazando y por su expresi


on en el modelo correcto. Como Mr Xr = 0,
tenemos
y Mr y = [Xs s + u] Mr [Xs s + u] = s Xs Mr Xs s + u Mr us + 2 s Xs Mr u
en donde hemos usado el resultado u Mr Xs s = s Xs Mr u.
Tomando ahora esperanza matem
atica
E(y Mr y) = s Xs Mr Xs s + E(u Mr u) + 2E( s Xs Mr u) = s Xs Mr Xs s + (n r)u2
De aqu,
E(y Mr y)
1
= u2 +
X Mr Xs s
nr
nr s s
El sesgo s Xs Mr Xs s /(n r) 0 es una forma cuadr
atica semidenica porque la

matriz Xs Mr Xs es del tipo C C con C = Mr Xs .


E(
2 ) =

Observaci
on 32. Cuando las variables en Xr y Xs son ortogonales, Xr Xs = 0, el
sesgo de
2 es s Xs Xs s /(n r) siendo Xs Xs una matriz semidenida positiva, si hay
multicolinealidad exacta entre las variables explicativas omitidas, o denida positiva, si
no la hay.
La soluci
on al problema de la omisi
on de variable relevante parece simple: incluirlas
en el modelo. Sin embargo, cuando especicamos un modelo econometrico seguimos las
indicaciones de la teora econ
omica y de nuestro sentido com
un, y no somos conscientes
de que nos estamos olvidando de ciertas variables. Para empeorar las cosas, la omisi
on
de variables relevantes puede confundirse con otras violaciones de los supuestos b
asicos,
que requieren tratamientos muy diferentes. Si, por ejemplo, las variables omitidas est
an
correlacionadas con las incluidas, entonces Xr y E() = Xs s tambien est
an correlacionados y no podemos mantener el supuesto de regresores jo. Por otra parte, con datos
de series temporales, la perturbaci
on E() presentar
a autocorrelaci
on. Estudiaremos estos errores de especicaci
on en captulos posteriores.
5.2.

Inclusi
on de variables irrelevantes

Suponemos, ahora, que el modelo correcto es


y = Xr r + u
pero incluimos err
oneamente un conjunto de variables explicativas irrelevantes
y = Xr r + Xs s +
Vamos a estudiar las propiedades estadsticas de los estimadores de r y s en el modelo
incorrecto o sobreespecicado.
n 55. Los estimadores de los par
Proposicio
ametros asociados a variables relevantes
son insesgados, mientras que los estimadores de los par
ametros asociados a variables
irrelevantes tienen un valor esperado nulo.
n. Los estimadores de mnimos cuadrados de r y s son
Demostracio
r = (X Ms Xr )1 X Ms y
b
r
r
Prof. Dr. Jos
e Luis Gallego G
omez
Departamento de Economa. Universidad de Cantabria

s = (X Mr Xs )1 X Mr y
b
s
s
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons

80

5.2. Inclusion de variables irrelevantes

y pueden escribirse, reemplazando y por su expresi


on en el modelo correcto, como
r =(Xr Ms Xr )1 Xr Ms [Xr r + u] = r + (Xr Ms Xr )1 Xr Ms u
b
s =(X Mr Xs )1 X Mr [Xr r + u] = (X Mr Xs )1 X Mr u
b
s
s
s
s
Tomando esperanza matem
atica
r ) = r + (Xr Ms Xr )1 Xr Ms E(u) = r
E(b
s ) =(Xs Mr Xs )1 Xs Mr E(u) = 0
E(b

n 56. El estimador de r en el modelo sobreespecicado es menos eProposicio


ciente que el estimador de r en el modelo correcto.
n. Ya hemos demostrado que al a
Demostracio
nadir nuevas variables a un modelo
de regresi
on la eciencia de los estimadores puede disminuir, pero nunca aumentar.
n 57. El estimador de mnimos cuadrados de la varianza del error u2
Proposicio
en el modelo sobreespecicado es insesgado.
n. En el modelo incorrecto
Demostracio


y My
=
nk
nk

La suma de cuadrados de los residuos y My puede escribirse como


y My = [Xr r + u] M[Xr r + u]
en donde se ha reemplazando y por su expresi
on en el modelo correcto. Como MX =
M[Xr |Xs ] = 0, tenemos
y My = u Mu
Tomando esperanza matem
atica
E(u Mu) = (n k)u2
De aqu,
E(
2 ) =

E(y My)
= u2
nk

Comparando las dos tipos de errores de especicaci


on vemos que la consecuencia nal
es la misma: los estadsticos t y F est
an distorsionados. En el modelo sobreespecicado la
distorsi
on proviene de la sobreestimaci
on de las varianzas. Si el estimador es consistente,
esta varianza tiende a cero cuando el tama
no muestral tiende a innito. Parece, por
tanto, razonable pensar que la distorsi
on en varianza ser
a mayor en muestras peque
nas
y menor en muestras muy grandes. En el caso del modelo infraespecicado la distorsi
on
ademas proviene del sesgo del estimador, que depende de la relaci
on entre variables
incluidas y omitidas. Esta relaci
on no tiene porque disminuir con el tama
no muestral.
A modo de conclusi
on, si el tama
no muestral es sucientemente grande, parece menos
grave cometer errores de especicaci
on por exceso que por defecto.
Prof. Dr. Jos
e Luis Gallego G
omez
Departamento de Economa. Universidad de Cantabria

Apuntes de Econometra. LADE y LE. Curso 2008-2009.


Material publicado bajo licencia Creative Commons

81

5. Errores de especicacion

5.3.

Forma funcional incorrecta

Imaginemos que la relaci


on estadstica entre dos variables Yt y Xt viene dada por la
regresion polinomial
Yt = 0 + 1 Xt + 2 Xt2 + + k Xtk + ut
pero por error especicamos la regresi
on lineal simple
Yt = 0 + 1 Xt + t
En este modelo, la omisi
on de las k 1 variables relevantes puede interpretarse como un
error en la especicaci
on de la forma funci
on: estamos especicando una relaci
on lineal
entre Yt y Xt , cuando la relaci
on entre ambas es no lineal
Ramsey propuso un contraste muy simple para detectar este error de especicaci
on,
el test RESET (del ingles, REgression Epecication Error Test). Los pasos son los siguientes:
1. Estimar la regresi
on simple de Yt sobre Xt , calcular el coeciente de determinaci
on, digamos R02 , y generar los valores ajustados Yt .
2. Estimar la regresi
on de Yt sobre 1, Xt , Yt2 , ..., Ytr y calcular el coeciente de
determinaci
on, R12 .
3. Calcular el estadstico F
F =

(R12 R02 )/(k 1)


(1 R12 )/(n k 1)

4. El modelo est
a err
oneamente especicado si F > c, en donde c es el valor crtco
tal que P rob(Fk1,nk1 > c) = .

Resumen
1. Las consecuencias de la omisi
on de variables relevantes son:
a) los estimadores de los par
ametros asociados a las variables incluidas son
sesgados,
b) la matriz de varianzas y covarianzas de estos estimadores es menorque
la que se obtendra en el modelo correcto,
c) la varianza de las perturbaciones est
a sobreestimada,
d) los contrastes de hip
otesis basados en los estadsticos t y F no son v
alidos.
La inclusi
on de variables irrelevantes tiene las siguientes consecuencias:
a) los estimadores de los par
ametros asociados a las variables relevantes son
insesgados, mientras que los de las variables irrelevantes tienen un valor
esperado nulo,
b) la matriz de varianzas y covarianzas de los estimadores par
ametros relevantes en el modelo sobreespecicado es mayorque la correspondiente
en el modelo verdadero,
c) la varianza del error es insesgada,
d) los contrastes de hip
otesis basados en los estadsticos t y F est
an sesgados
hacia la no signicaci
on.
Prof. Dr. Jos
e Luis Gallego G
omez
Departamento de Economa. Universidad de Cantabria

Apuntes de Econometra. LADE y LE. Curso 2008-2009.


Material publicado bajo licencia Creative Commons

82

5.3. Ejercicios

Palabras clave
Matriz de dise
no
Error de especicaci
on
Omisi
on de variable relevante
Inclusi
on de variable irrelevante
Infraespecicaci
on

Sobreespecicaci
on
Sesgo de especicaci
on
Forma funcional incorrecta
Test RESET

Ejercicios
1. Discuta la siguiente proposici
on: cuando el tama
no muestral es muy grande, es
menos grave la inclusi
on de variables irrelevantes que la omisi
on de variables
relevantes.
2. Obtenga el sesgo del estimador de la varianza residual en un modelo de regresi
on
con omisi
on de variables relevantes.
3. Sea la ecuaci
on de demanda
qi = + pi + ri + ui ,

i = 1, . . . , N

asticas
donde las variables explicativas precio pi y renta ri se consideran no estoc
y el termino de error ui cumple las propiedades siguientes
E(ui ) = 0,

E(u2i ) = 2 ,

E(ui uj ) = 0 i = j.

a) Demuestre que si esta ecuaci


on se estima sin la variable relevante renta,
entonces la esperanza matem
atica del estimador MCO del par
ametro es
N
= + i=1 pi ri
E()
N
2i
i=1 p

donde pi = pi p y ri = ri r.
b) Demuestre que si esta ecuaci
on se estima con la variable relevante renta,
entonces
2
=
V ()
N
2i (1 2pr )
i=1 p
on simple entre las variables precio
donde pr es el coeciente de correlaci
y renta.

Prof. Dr. Jos


e Luis Gallego G
omez
Departamento de Economa. Universidad de Cantabria

Apuntes de Econometra. LADE y LE. Curso 2008-2009.


Material publicado bajo licencia Creative Commons