Professional Documents
Culture Documents
Apuntes de Econometria Gil PDF
Apuntes de Econometria Gil PDF
APUNTES
DE CLASE
Profesores:
Agosto 2004
Pontificia Universidad Católica de Chile
Estos apuntes están en permanente revisión por lo cual sugerencias o correcciones serán bienvenidas.
E-mails: vgila@afpprovida.cl y alema@security.cl
1
INDICE
1. INTRODUCCIÓN............................................................................................................................................ 1
1.1 ORÍGEN Y CONCEPTO ....................................................................................................................................1
Definiciones................................................................................................................................................................ 1
Diferencias entre un econometrista y un estadístico:......................................................................................... 2
1.2 MODELO ECONOMÉTRICO. .........................................................................................................................2
1.3 OBJETIVOS DE LA ECONOMETRÍA ...........................................................................................................3
1.4 METODO DE LA ECONOMETRÍA. ..............................................................................................................3
1.5 DATOS, VARIABLES Y MODELOS. ............................................................................................................5
DATOS. ....................................................................................................................................................................... 5
RELACIONES............................................................................................................................................................ 7
VARIABLES................................................................................................................................................................ 7
FORMAS FUNCIONALES (Introducción) ........................................................................................................... 8
A NEXO 1: RECORDANDO DE INFERENCIA .....................................................................................................................9
Variable Aleatoria..................................................................................................................................................... 9
Notación:..................................................................................................................................................................... 9
Distribución de Probabilidades.............................................................................................................................. 9
A NEXO 2: UN REPASO DE MATRICES .................................................................................................................11
3.1.1 Operaciones matriciales:.............................................................................................................................11
3.1.2 Valores y vectores propios...........................................................................................................................16
3.2 A LGUNOS EJERCICIOS DE M ATRICES..................................................................................................................19
3.2.1 Operaciones con matrices............................................................................................................................19
3.2.2 Determinantes...............................................................................................................................................19
3.2.3 Matriz Inversa ...............................................................................................................................................20
3.2.4 Valores y Vectores propios..........................................................................................................................20
2. REGRESIÓN SIMPLE..............................................................................................................................22
2.1 EL M ÉTODO DE MÍNIMOS CUADRADOS ORDINARIOS (MICO). .......................................................................22
2.1.1 Definición de análisis de regresión............................................................................................................22
2.1.2 Especificación de la Regresión Simple......................................................................................................23
2.1.3 Ejemplo:..........................................................................................................................................................23
2.1.4 Fuentes de Error µ ........................................................................................................................................25
2.1.5 Función de regresión poblacional y muestral.........................................................................................25
2.1.6. MICO para una regresión simple..............................................................................................................29
ˆ ˆ
2.1.7 Ejemplo de cálculo de β1 y β 2 ..................................................................................................................31
2.1.8 Expresión de las formulas en desvíos........................................................................................................32
2.1.9 Corolarios de los estimadores MICO. .......................................................................................................33
2.1.10. Coeficiente de determinacion (R2)..........................................................................................................38
2.1.11 Algunas Regresiones Particulares...........................................................................................................40
2.1.12. ¿Cómo seleccionar entre estimadores? .................................................................................................42
S
2.2 UPUESTOS CLÁSICOS DEL M ODELO DE REGRESIÓN. .....................................................................................45
1. La variable explicativa X está dada (es no estocástica o no aleatoria)..............................................46
2. E(µi /Xi)=0 ∀ i ...............................................................................................................................................46
3. No autocorrelación ⇒ Cov( µi , u j)=0 i≠j...............................................................................................46
4. Homocedasticidad ⇒ V(µi /Xi )=σ2...........................................................................................................48
5. El modelo está bien especificado...............................................................................................................49
6. Normalidad ⇒ µi ∼N( 0 , σ2 ) ..................................................................................................................49
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
3
5. MULTICOLINEALIDAD ....................................................................................................................................147
5.1 INTUICIÓN ..........................................................................................................................................................147
5.2 TIPOS DE MULTICOLINEALIDAD.............................................................................................................148
Multicolinealidad perfecta...................................................................................................................................148
Multicolinealidad imperfecta..............................................................................................................................150
¿Por qué importa el determinante?....................................................................................................................151
5.3 EFECTO DE LA MULTICOLINEALIDAD A NIVEL EMPÍRICO ........................................................152
En el modelo con dos variables explicativas...................................................................................................152
En el Modelo General...........................................................................................................................................152
Efectos prácticos de la multicolinealidad:........................................................................................................153
5.4 FORMAS DE DETECTAR LA MULTICOLINEALIDAD.........................................................................153
Por sus efectos sobre los test...............................................................................................................................153
5.5 FORMAS DE SOLUCIONAR LA MULTICOLINEALIDAD ...................................................................154
No hacer nada........................................................................................................................................................154
Incorporar información adicional......................................................................................................................154
6. HETEROCEDASTICIDAD ...................................................................................................................................157
6.1 ¿CÓMO SE AFECTAN LAS PROPIEDADES DEL ESTIMADOR MICO CUANDO EXISTE
HETEROCEDASTICIDAD? ....................................................................................................................................158
¿Qué ocurre si se estima por MICO sin tener en cuenta la heterocedasticidad?......................................160
6.2. M ÉTODO DE M ÍNIMOS CUADRADOS GENERALIZADOS................................................................................160
Derivación de MCG en el caso simple ..............................................................................................................162
Derivación de MCG en el caso múltiple...........................................................................................................162
6.3. ¿CÓMO DETECTAR LA HETEROCEDASTICIDAD? ..........................................................................163
• Naturaleza del problema:..........................................................................................................................164
• Método gráfico:...........................................................................................................................................164
• Prueba de Park............................................................................................................................................164
• Prueba de Glesjer .......................................................................................................................................164
• Goldfeld - Quant .........................................................................................................................................165
• Test de White. ..............................................................................................................................................166
6.4 ¿CÓMO SOLUCIONAR HETEROCEDATICIDAD? ..............................................................................166
Ejemplo en caso general......................................................................................................................................167
7. AUTOCORRELACIÓN.........................................................................................................................................169
7.1 INTRODUCCIÓN ................................................................................................................................................169
7.2 CAUSAS MÁS FRECUENTES DE AUTOCORRELACIÓN ....................................................................170
Ciclos o tendencias en las variables,.................................................................................................................170
Autocorrelación espacial,....................................................................................................................................170
Influencia prolongada de shocks:.......................................................................................................................170
Inercia:....................................................................................................................................................................170
Mala especificación..............................................................................................................................................170
Quiebre o cambio estructural..............................................................................................................................171
7.3 ALGUNAS DEFINICIONES .............................................................................................................................172
Autocovarianza ......................................................................................................................................................172
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
4
Coeficiente de Autocorrelación...........................................................................................................................172
EJEMPLO...............................................................................................................................................................172
7.4 PROPIEDADES DE LA ESTIMACIÓN MICO BAJO AUTOCORRELACIÓN ...................................175
7.5 ¿CÓMO DETECTAR AUTOCORRELACIÓN ?...........................................................................................................176
Método gráfico:.....................................................................................................................................................176
Estadístico de Durbin-Watson (1951)................................................................................................................176
Test de Breusch - Godfrey (1978).......................................................................................................................179
Ejemplo de utilización de los test en Eviews....................................................................................................179
7.6 FORMAS DE CORREGIR POR AUTOCORRELACION ......................................................................181
7.6.1 Conozco la forma de la autocorrelación y conozco ρ.....................................................................181
7.6.2 . No conocemos ρ...............................................................................................................................184
8. ESPECIFICACION DE MODELOS ...................................................................................................................186
8.1 ATRIBUTOS DE UN BUEN MODELO .........................................................................................................186
8.2 TIPO DE ERRORES DE ESPECIFICACIÓN................................................................................................186
8.3 CONSECUENCIAS DE LOS ERRORES DE ESPECIFICACIÓN. .........................................................186
8.3.1 Variables Omitidas......................................................................................................................................186
8.3.2 Inclusión de una Variable Irrelevante (Variables Intrusas)................................................................189
Conclusión para Especificar Modelos...............................................................................................................190
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
1
1. INTRODUCCIÓN
1.1 ORÍGEN Y CONCEPTO
Algunos economistas ⇒ Europa S. XIX
Otros ⇒ S. XX (como movimiento organizado)
1930 ⇒ fundación de la Sociedad Econométrica (Revista, 1933)
Definiciones.
• “Es lo que hacen los econometristas”
• Etimológicamente: “Economía Medida”
Sin embargo, este es un concepto vago, porque medir el PIB, el empleo, la oferta de
dinero, etc., no es econometría. El concepto es más amplio que este.
• Maddala:
“Es la aplicación de métodos estadísticos y matemáticos al análisis de los datos
económicos con el propósito de otorgar contenido empírico a las teorías económicas,
verificándolas o refutándolas”
• Kennedy:
“ Los desacuerdos permitirían escribir un paper”
La confusión proviene de que los econometristas son al mismo tiempo:
i) Economistas: interpretan (o crean teoría) para probar empíricamente.
ii) Matemáticos: formulan matemáticamente su teoría
iii) Estadísticos aplicados: buscando datos para sus variables y gastando horas
frente al computador tratando de estimar relaciones económicas y prediciendo.
iv) Estadísticos teóricos: aplicando su habilidad para desarrollar técnicas
estadísticas apropiadas a los problemas empíricos.
• La econometría no significa lo mismo que estadística económica, tampoco es lo que
conocemos como teoría económica, ni es la aplicación de las matemáticas a la
economía. Econometría es la unificación de estas tres áreas.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
3
El término eµ será una variable aleatoria con determinadas propiedades que veremos
en el curso, por lo que deberemos especificar la distribución de probabilidad de µ y
las consecuencias de estas sobre la estimación.
3.Información 2. Modelo
apriori Econométrico 4. Datos
5. Estimación
del Modelo
6. Testeo de
Hipótesis
sugeridas por
el Modelo
Económico
7.Predicción y
Políticas
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
4
3. Revisión de
resultados 2. Y=AK αLβ eµ 4. Conseguir
los datos de
obtenidos en PIB (Y) y
otros estudios 5. Estimación de α
Empleo (L)
similares, yβ del Banco
nacionales e Central.
internacionales 6. Verifico hipótesis Construir una
respecto a los serie de
parámetros. Ej: Test capital (K).
α+β=1
ii) Críticas:
- Hay feedback entre 1 y 6 (no es cierto que sólo se “testean teorías”)
- Hay feedback entre 2 y 5 con 3 (también hay aportes en datos)
- Hay feedback entre 6 y 2 (como resultado de los test econométricos es posible
replantear modelos econométricos)
Por tanto hay retroalimentación (Cuadro 2)
Teoría Económica
Estimación
Pruebas de Especificación y
examen de Diagnóstico
no
si
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
5
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
6
17.6
17.2
16.8
16.4
16.0
15.6
60 65 70 75 80 85 90 95 00
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
7
RELACIONES.
i) Uniecuacionales:
Es aquella en que la variable dependiente “está determinada” por variables
explicativas.
C= f(Y,r,G), donde C (Consumo) es la variable dependiente e Y(Ingreso) , r (tasa de
interés) y G (Gustos) las variables independientes.
ii) Multiecuacionales
Es cuando para explicar un fenómeno se requieren varias ecuaciones.
Ej: Consumo Durables =f(Ingreso Permanente, tasa de interés)
Consumo No Durables: f(Ingreso Transitorio)
El tratamiento de las ecuaciones puede ser en forma separada o conjunta.
iii) Ecuaciones simultáneas.
Es cuando dos o más variables vienen determinadas “simultáneamente” por un
cierto número de variables explicativas.
En los casos anteriores, el ingreso (Y) es “dado” para una familia individual, pero
en la economía como un todo no se puede considerar que el ingreso esté “dado”
Para un consumidor individual el precio de un bien viene “dado”. Para toda la
economía, los precios y las cantidades vienen determinadas simultáneamente por las
condiciones de oferta y demanda.
Qd = f (p,x)
Qs= f (p,z)
Qd =Qs
Donde Qd es la cantidad demandada, Qs es la cantidad ofrecida, X es la variable de
escala en la demanda (Ingreso) y Z es la variable de escala en la oferta (tecnología).
VARIABLES.
En general:
Variable dependiente: Y
Variables independientes: X1 , X2 ......Xk
Sin embargo, reciben también otros nombres:
Y X1 , X2 ......Xk
a) Predicha Predictores
b) Regresandos Regresores
c) Explicada Explicativas
d) Dependiente Independientes
e) Causada Causante
f) Endógena Exógena
g) Objetivo Control
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
8
i) Lineal ⇒ C= α + βY
ii) Log-Lineal ⇒ ln C= α + β ln Y
También se le llama Doble Logarítmica. Elasticidad Constante.
iii) Semi-logarítmica ⇒ ln C= α + β Y ⇒Elasticidad Variable
iv) Lineal-Recíproco ⇒ C=α + β (1/Y)
v) Log-Recíproco ⇒ ln C= α +β (1/Y)
vi) Lineal Log ⇒ C=α +β lnY
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
9
Distribución de Probabilidades.
Discre ta: Lista de los posibles valores que una variable aleatoria discreta puede tomar
conjuntamente con sus probabilidades asociadas.
Ej. X es el número que sale en la cara superior al tirar un dado.
x P(X=x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
10
1 2
1 − (x −µ )
f (x ) = 2σ 2
e
σ 2π
utilizada es la normal, que tiene la siguiente función densidad:
f(x)
µ
X
Donde µ es la media y σ es el desvío estándar.
Tarea:
• Revisar INFERENCIA
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
11
Propiedades:
⇒ (A′)′=A
⇒ (A+B)′=A′+B′
⇒ (AB)′=B′A′
⇒ (αA)′=αA′, si α es un escalar y A una matriz.
⇒ Si A=A′, entonces se dice que A es simétrica.
• Suma y Resta
Sea Am×n y Bm×n , entonces Cm×n =A+B es tal que cij=aij+bij
Sea Am×n y Bm×n , entonces Dm×n =A-B es tal que dij=aij-bij
Propiedades:
⇒ A+B+C=A+(B+C)=(A+B)+C
⇒ A+B=B+A
1
Este anexo repasa solamente algunas propiedades de matrices. Mas detalles en:
• Econometría. Alfonso Novales. Segunda Edición. Capítulo 1
• Métodos de Econometría. J. Johnston. Capítulo 4
• Introducción a la Econometría. G.S. Maddala. Segunda edición. Apendice al Capítulo 2.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
12
• Traza
La traza de una matriz cuadrada es igual a la suma de los elementos de la diagonal
principal.
Propiedades:
⇒ Tr(A+B)=Tr(A)+Tr(B)
⇒ Tr(ABC)=Tr(CAB)=Tr(BCA)
• Matriz identidad.
Se denota como In a la matriz cuadrada de orden n, que tiene elementos 1 en la
diagonal y cero en el resto.
1 0
I2 =
0 1
Propiedades:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
13
• Diferenciación Matricial
∂[f ( b) ]
∂b
1
∂ [f ( b) ]
∂[f (b )] ∂b 2
=
.
Si bn×1 , entonces
∂b
.
∂[f ( b) ]
∂b
n
Ejemplos:
∂[a ' b]
⇒ =a
∂b
∂[b' Ab ]
⇒ = 2 Ab
∂b
∂[2Ab ]
⇒ = 2A
∂b
• Determinante de una matriz
El determinante es una función que asocia un número real a una matriz cuadrada.
Procedimiento de Laplace:
1. Elija cualquier fila o columna de una matriz y para cada uno de los elementos
calcule el cofactor. El cofactor de un elemento aij será cij=(-1)i+jMij.
2. Mij (matriz menor) es el determinante de la matriz que surge de eliminar la fila i y la
columna j de la matriz original.
3. Multiplique cada elemento aij de esa fila (o columna) por su cofactor cij
n
4. Determinante de A=|A|= ∑a
j=1
ij c ij ∀ i
Ejemplos:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
14
a a 12
1. A = 11 A = a 11c 11 + a 21c 12
a 21 a 22
c11 =(-1)1+1 M11 =(-1)2 (a22 )=a22
c21 =(-1)2+1 M21 =(-1)3 (a12 )= -a12
2 −1 3
2. A= 3 0 − 5 A = 2c 11 + 3c 21 + 2c 31
2 1 1
0 −5
1+1 2
c11 =(-1) M11 =(-1) 1 1 =5
−1 3
c21 =(-1)2+1 M21 =(-1)3 1 1 =(-1)(-1-3)=4
−1 3
3+1 4
c31 =(-1) M31 =(-1) 0 − 5 =5
A = 2(5) + 3( 4) + 2(5) = 32
Propiedades:
⇒ A = A'
• Matriz inversa
Dada la matriz cuadrada An , A −n1 es su matriz inversa si A n A −n1 = I n
Procedimiento de calculo:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
15
Ejemplo:
1 0 0
A = 0 0 1 A = 1c 11 + 0c 21 + 0c 31 = 1
0 1 0
0 1
c11 =(-1)1+1 M11 =(-1)2 1 0 =-1
A = ( −1)
0 1 0 1 0 0
(1) ( −1) (1)
1 0 0 0 0 1
0 0 1 0 1 0
( −1) (1) ( −1) '
1 0 0 0 0 1 (1)( −1) ( −1)( 0) (1)( 0)
0 0 1 0 1 0 ( −1)( 0) (1)( 0) ( −1)(1) '
(1) ( −1) (1)
(A c )' 0 1 0 1 0 0 (1)( 0) (−1)(1) (1)( 0)
= = =
A −1 −1
−1 0 0 −1 0 0
0 0 − 1' 0 0 −1
0 −1 0 0 − 1 0 1 0 0
= = = 0 0 1
−1 −1 0 1 0
Propiedades:
⇒ ¿Siempre existe A −1 ? No, la matriz A debe ser cuadrada y no singular
⇒ ( A −1 ) − 1 = A
⇒ La inversa (si existe) es única.
⇒ ( AB) −1 = B −1 A −1
⇒ ( A' ) −1 = (A −1 )'
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
16
Ax=λx es una ecuación que tiene implícita dos incógnitas, un vector y un escalar. Las
soluciones vendrán en parejas, a cada λ le corresponde un vector x
Procedimiento de cálculo:
Ax=λx
Ax-λx=0
(A-λI)x=0
Si A-λI es no singular, entonces la única solución a la ecuación anterior es la trivial (x=0).
Entonces, para que la solución sea no nula, el determinante de A-λI debe ser igual a cero.
A esta se le conoce como ecuación característica y tiene n soluciones a las que se denomina
valores propios. Para cada valor propio existe un vector propio que se obtiene sustituyendo
el valor de λ en la ecuación (A-λI)x=0.
Ejemplo:
0 1
A=
0.5 0.5
i) Encontramos los valores propios de la matriz A:
Debemos resolver: det( A-λI)=0
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
17
−λ 1
= (-λ)(0.5-λ)-0.5= -0.5λ+λ2 -0.5 =0
0. 5 0. 5 − λ
0.5 2 − 4( −0.5) 1
0.5± =(0.5±1.5)/2=
2 −0.5
Los valores propios son 1 y –0.5
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
18
c= -2d ⇒ c = −2 / 5
− 2
c 5
x 2 = =
d 1
5
Propiedades:
⇒ Los valores propios de una matriz simétrica son reales.
⇒ Los vectores propios correspondientes a distintos valores propios de una matriz
simétrica son ortogonales entre si. Es decir que su producto es cero. x1' x2 = 0
⇒ Sea B una matriz que tenga por columnas los vectores propios de A y D una matriz que
tiene los valores propios en la diagonal y cero en el resto.
| | | λ1 0 0
| | | 0 λ2 0
B= x 1 x2 . . x n y D= 0
0 . 0
| | | 0 0 . 0
| 0 λ n
| | 0
La propiedad anterior asegura que B’B= BB’=In , esto implica que B’ es la inversa de B
(B es ortogonal).
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
19
⇒ Sea una matriz A de orden m, definida positiva, y P una matriz de m×n, de orden m, el
producto P’AP es una matriz definida positiva.
⇒ Los elementos de la diagonal principal de una matriz definida positiva son estrictamente
positivos, mientras que los elementos de la diagonal principal de una matriz
semidefinida positiva son no negativos.
2
3.2 ALGUNOS EJERCICIOS DE MATRICES
3.2.2 Determinantes
1 0 4 1 1 2
A = B = C =
3 1 0 2 2 1
Comprobar:
A. B = A . B
A. B. C = A . B . C
2
Recomendables para quienes el tema de matrices resulte nuevo o olvidado.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
20
2 1 1 x
1 2 1 y
B=
1 1 2 z
1 1 1 t
2 −2 3 3 1 1
A = 1 0 −3 B = 1 2 2
3 4 0 1 2 4
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
21
b) Dada la matriz:
1 4
A=
1 1
2 1
A =
1 2
1 1
1
d) Dado que X=
1
2
1 [ ]
, calcular A= I 4 − ( X(X' X) −1 X' ) . Demostrar que A es idempotente
1 3
y determinar su rango. Calcular los valores propios de A y obtener la matriz que
diagonaliza a A.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
22
2. REGRESIÓN SIMP LE
2.1 EL MÉTODO DE MÍNIMOS CUADRADOS ORDINARIOS
(MICO).
Significado del término de regresión (Francis Galton, 1886): la estatura promedio de los
niños que nacían de padres con una determinada estatura tendía a moverse o “regresar”
hacia la altura promedio de la población total. Ello aún cuando existía una tendencia a que
los padres altos tuvieran hijos altos y padres bajos tuvieran hijos bajos. Galton dijo que
existía una “regresión a la mediocridad”.
Y = f (X 1 , X 2 ,....., X k )
Donde en general X1 no representa una variable, sino que es una columna de “unos” que
permitirá calcular la constante del modelo.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
23
Y= f (X)
Esta puede ser de dos tipos:
i) determinística o matemática.
De este tipo de relación se preocupa la economía matemática.
Ej: Y=1+X
Y queda determinada exactamente dado el valor de la variable X.
2.1.3 Ejemplo:
Relación deterministica
Y=K 0.3 L0.7
0 .3
Y K 0. 3L0.7 1 K
Divido entre L, = = K 0.3 L−0.3 = K 0.3 0.3 =
L L L L
Aplico logaritmo: LN(Y/L) =0.3 LN(K/L)
Dados los valores de K/L (relación capital/trabajo), existe un único valor de producto por trabajador
(Y/L).
7
LN(K/L) LN(Y/L) Y/L
6
12 3.6 36.6
5
14 4.2 66.7
LN (Y/L)
4
20 6 403.4
3
5 1.5 4.5
2
10 3 20.1
1
0
0 5 10 15 20 25
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
LN (K/L)
24
Relación estocástica
Y=K 0.3 L0.7 eµ
Y K0.3L0.7e µ
0 .3
1 K
Divido entre L, = = K0.3L− 0.3eµ = K0.3 0.3 e µ = e µ
L L L L
7
LN(K/L) LN(Y/L) si µ=1 LN(Y/L) si µ=-1
6 X Y Y
5 12 4.6 2.6
LN (Y/L)
4 14 5.2 3.2
3
20 7 5
2
5 2.5 0.5
1
10 4 2
0
0 5 10 15 20 25
LN (K/L)
Supongamos ahora que µ es una variable aleatoria continua que tiene
una distribución normal estandarizada (con esperanza cero y varianza 1). Entonces por cada valor
de K/L tendremos infinitos valores para Y/L, dependiendo del valor de µ. El gráfico que
obtendríamos sería algo similar a esto:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
25
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
26
Del gráfico podemos concluir que E(Y/Xi) es una función de Xi, y esa será una función
lineal de Xi. Recordar: la linealidad puede ser en las variables y en los parámetros.
Lo que nos interesa es que la relación sea lineal en los parámetros.
No Linealizables
β X
E (Y / X ) = β1 + β 2 e 2 i
i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
27
Yi = β 1 + β 2 X i + µ i
Ŷi = βˆ 1 + βˆ 2 X i será la recta estimada
Yi = Ŷi + ei
Yi = βˆ 1 + βˆ 2Xi + ei
donde
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
28
Yi
Y1 E( Y / X i ) = β1 + β 2 X i
β2
µ1
µ2
Y2
β1
Xi
X1 X2
Modelo estimado
ˆ = βˆ + βˆ X
Y
Y1 i 1 2 i
β̂ 2
µ1 E(Y/Xi)=β1+β2 Xi
e1
β2
E(Y/X1 )
Yˆ1
β1
β̂ 1
X1
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
29
Diferencias entre µi y ei
e i = Yi − Y ˆ
µi= Yi - E(Y/Xi)
i
e i = Yi − βˆ 1 − βˆ 2 X i
µ
-es no observable
-es una variable aleatoria a la que se le supone cierta distribución de probabilidad
e
-es observable (se dispone de valores)
- satisface ciertas propiedades que veremos más adelante.
¿Cómo calcular β 1 y β 2 ?
Método de momentos?
Máxima Verosimilitud?
Método de Mínimos Cuadrados Ordinarios (MICO)?
Idea: “Pasar la recta de regresión a través de los puntos del gráfico de forma que esté lo
más próxima posible a la urbe de puntos”. Trataremos que las distancias verticales
(errores) sean lo más pequeñas posible.
e = Y −Y ˆ
i i i
ˆ
e = Y −β −β X
i i 1 2 i
Se trata de elegir βˆ 1 y βˆ 2 tal que la diferencia sea mínima.
Minimizaremos ∑ e 2i (para dar peso equivalente a residuos más grandes). O sea,
minimizaremos la suma de los cuadrados de las “distancias verticales” desde los puntos de
la recta.
Q = ∑ ( Yi − Yˆ i )2 = ∑ (Yi − βˆ 1 − βˆ 2 Xi )2 = f (βˆ 1, βˆ 2 )
Debemos minimizar Q, es decir que debemos encontrar las condiciones de mínimo
CNPO CNSO
∂Q ∂2Q
• =0 >0
∂βˆ (∂βˆ ) 2
1 1
condicione s de mínimo
∂Q 2
∂ Q
• =0 >0
∂βˆ (∂βˆ ) 2
2 2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
30
∂Q
(1) = 2 ∑ (Yi − βˆ 1 − βˆ 2 X i ) ( −1) = 0
∂βˆ 1
∑ (Y − βˆ i 1 − βˆ 2X i ) = 0
∑ Y − βˆ ∑1 − βˆ ∑ X
i 1 2 i =0
n
Y − βˆ 1 − βˆ 2 X = 0
n
βˆ 1 = Y − βˆ 2 X (*)
∂Q
( 2) = − 2 ∑ ( Yi − βˆ 1 − βˆ 2 X i )( X i ) = 0
ˆ
∂β 2
∑ Y i Xi − βˆ 1 ∑ Xi − βˆ 2 ∑ X2i = 0
∑Y i X i − ( Y − βˆ 2 X) ∑ X i − βˆ 2 ∑ X 2i = 0
∑Y i X i = ( Y − βˆ 2 X ) ∑ X i + βˆ 2 ∑ X 2i
∑Y i X i = ( Y − βˆ 2 X) nX + βˆ 2 ∑ X i2
∑Y i X i = n X Y − βˆ 2 n X 2 + βˆ 2 ∑ X 2i
∑Y i X i = n X Y + βˆ 2 ( ∑ X i2 − nX 2 )
∑ Yi Xi − n X Y
βˆ 2 = (**)
∑ X 2i − n X2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
31
Recordando de Inferencia:
∑ (Xi − X)(Yi − Y ) ∑ ( Xi Yi − Xi Y − XYi + X Y )
S xy = cov(X,Y) = =
n n
∑ X iYi ∑ Xi ∑ Yi n
= − Y − X + X Y =
n n n n
=
∑X Y i i
− Y X − XY + X Y =
∑X Y i i −nY X
n n
∑ (X
2
− X)
=
2 i
parecido a la formula de la varianza muestral, S .
n −1
x
βˆ 2 = ∑
Yi Xi − n X Y nS XY SXY cov arianza muestral entre X e Y
= = 2 =
∑X 2
i−nX 2
n S2x Sx var ianza muestral de X
donde:
βˆ 1 - ordenada en el origen
βˆ 2 - coeficiente angular o pendiente
ˆ ˆ
2.1.7 Ejemplo de cálculo de β1 y β 2
Supongamos que conocemos los datos de producción y horas trabajadas de 10 trabajadores
de una fábrica en un momento de tiempo (corte transversal). Definimos Y = producto , X =
horas de trabajo
X Y X2 Y2 XY
1 10 11 100 121 110
2 7 10 49 100 .
3 10 12 100 . .
4 5 6 25 .
5 8 10 64
6 8 7 64
7 6 9 36
8 7 10 49
9 9 11 81
10 10 10 100
∑ 80 96 668 952 789
X =8
Y = 9 ,6
Yi = βˆ 1 + βˆ 2 Xi + e i
βˆ 1 = Y − βˆ 2 X = 9,6 − βˆ 2 • 8 = 9,6 − 0,75(8) = 3,6
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
32
Por ejemplo:
Yˆ =3,6+0,75(10)=7,5+3,6=11,1
1 Ŷ2 = 3,6 + 0,75(7)= 8,85
ˆ = 11,0 − 11,1 = − 0,1
e1 = Yi − Y e2 = Yi − Ŷ1 = 10,0 − 8,85 = 1.15
1
15
e1=-0.1
10 e2=1.15
5
Pendiente: 0.75
Intercepto: 3.6
0
0 2 4 6 8 10 12
∑e =0 i
∑e X =0
i i
βˆ 2 =
∑ X i Yi − n X Y = S XY = ∑ (X i − X)(Yi − Y ) (**)
∑ X 2i − n X 2 S 2X ∑ ( X i − X) 2
Definamos las variables en desvíos respecto a su media
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
33
x i = Xi − X
y i = Yi − Y
βˆ 2 =
∑x y i i
(***), donde las variables en minúsculas representan desvíos respecto a la
∑x 2
i
media de la variable.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
34
Como ∑ei = 0
∑Y i = n βˆ 1 + βˆ 2 ∑X + ∑ e
i i , recordando que ∑ei = 0 y dividiendo entre n
(2) Y = βˆ 1 + βˆ 2 X
Yi − Y = βˆ 2 ( Xi − X ) + e i
Expresado en desvíos ⇒ y i = βˆ 2 x i + e i
Los residuos no están correlacionados con el valor estimado de Yi, ni con los valores
explicativos.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
35
1
n
[∑ Yˆe ] = 1n ∑ ( βˆ
i 1 + βˆ 2 X i ) e i =
1
n
[ ]
∑ ( Y − βˆ 2 X) + βˆ 2 X i e i
1
n
[∑ Ye − βˆ X∑ e +βˆ ∑ X e ] = 0
i 2 i 2 i i
ˆ +e
Yi = Yi i
ˆ
Y =Y
ˆ −Y
Restando las dos expresiones anteriores, obtenemos Y i − Y = Y ˆ +e , lo que en
i i
desvíos respecto a la media, se puede expresar:
Con lo que:
yi = βˆ 2x i + ei = ŷi + ei
Se eleva al cuadrado:
y i2 = (βˆ 2 x i + e i ) 2 = ( ŷ i + e i ) 2
y i2 = βˆ 22 x i2 + 2βˆ 2 x i e i + e i2 = ŷ 2i + 2 ŷ i e i + e 2i
Se aplica ∑:
∑ y = ∑ (βˆ
2
i
2
2
)
x 2i + 2 βˆ 2 x i e i + e 2i = ∑ ŷ i2 + 2 ∑ ŷ i e i + ∑ e i2
∑y 2
i = βˆ 22 ∑x 2
i + 2 βˆ 2 ∑ x i e i + ∑ e i2 = ∑ ŷ 2i + 2 ∑ ŷ i e i + ∑ e 2i
∑y 2
i = βˆ 22 ∑x 2
i + ∑ e 2i = ∑ ŷ 2i + ∑ e 2i , (****) dado que los dos términos de
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
36
Definimos:
∑y 2
i = Suma de cuadrados totales = SCT = SST
∑ ŷ 2
i = βˆ 22 ∑x 2
i = Suma de cuadrados explicados = SCE = SSE
∑e 2
i = SCR = Suma de cuadrados residuales = SSR
SCE = βˆ 22 ∑x 2
i
Como βˆ 2 =
∑x y i i
∑x 2
i
∑ xi yi
2
[∑ x y ] 2
[∑ x y ] 2
SCE = βˆ 22 ∑ x i2 = ∑
[∑ x ] ∑
= = = βˆ 2 ∑ x i y i
i i i i
2 2
x x
∑ x i ∑ x i2
2 i i
2 2
i
Ejemplo.
Supongamos que el consumo de los hogares se explica por su nivel de ingreso. En el
diagrama de dispersión (Gráfico1) cada punto (Xi,Yi) indica la combinación de ingreso y
consumo del hogar. Podríamos partir explicando el consumo de una cierta familia por el
consumo medio observado de la muestra. Para cada familia cometeríamos un error dado por
Y − Y.
i
Si realizamos una regresión y estimamos los parámetros βˆ 1 y βˆ 2 por MICO, el error que
cometemos al asignar a la familia Xi cuyo verdadero consumo es Yi, la media de los
consumos, se divide ahora en dos partes (Gráfico 2). Una de ellas nos indica la parte del
error que ha sido explicada por el modelo ( Yˆi − Y ). La otra mide el error que aún subsiste
(ei)
Esto se puede generalizar obteniendo medidas resumen para todas las observaciones (o sea
para toda la muestra). Estas medidas son las sumas de cuadrados que vimos antes: la suma
de cuadrados totales (SCT) puede descomponerse en una parte explicada por la regresión
(SCE) y otra parte que aún no logramos explicar o residual (SCR).
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
37
* (Xi,Yi )
*
Yi − Y Es el desvío total (DT)
respecto a la media.
Y
* *
* *
Al DT = ( Yi − Y) le sumamos y restamos Y ˆ ,
i
ˆ ˆ ˆ ˆ
DT = Yi − Yi + Yi − Y = ( Yi − Yi ) + ( Yi − Y ) = DE + DR
Y
(Xi,Y i)
Yi *
ˆ
* βˆ 1 + βˆ 2 X i
DR= Yi −Y DT=Yi −Y
Yˆi
Y ˆ −Y
* DE= i
* *
* *
X Xi X
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
38
Consideraciones:
1. Es una medida de bondad absoluta del modelo ya que mide qué proporción de la
varianza total (la varianza de Y) es explicada por el modelo de regresión (por X).
Cuanto mayor sea la relación entre X e Y, mayor será este indicador.
2. Es una medida de bondad relativa entre modelos. Por ejemplo, permite comparar si
la capacidad explicativa es mayor incluyendo X como variable independiente
respecto a incluir Z.
3. 0 ≤ R2 ≤ 1
(Si el modelo no explica nada SCR = SCT ⇒ R2 = 0)
(Si el modelo explica todo SCE = SCT ⇒ R2 = 1)
R2=1
Y
Y R2=0
* * *
Y
* * * *
X X X
Todas las observaciones coinciden con la línea No existe relación alguna que
de regresión⇒ ajuste perfecto (imposible) sea expresable linealmente
∑ x y ∑ x
2
i i
(∑ x y )
2
∑ ∑
∑ x
i 2
βˆ 22
2
ŷ i2 x 2i S 2xy
=
SCE i i i
R 2
= = = = = = rx2, y
SCT ∑y 2
i ∑y 2
i ∑y 2
i ∑y ∑x 2
i
2
i S 2x • S 2y
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
39
Recordar que r XY =
Cov( X , Y )
=
∑x y i i
=
S x ,y
, era una medida de la
V ( X ) V (Y ) ∑x ∑y 2
i
2
i
S xSy
asociación lineal que existe entre X e Y.
Debemos recordar que el concepto de covarianza nos da una primera aproximación del
grado de asociación que tienen X e Y.
S xy =
∑ (X − X)( Y − Y) = ∑ xy
n n
X X
Cov( X , Y ) βˆ 2S xy
Por eso trabajamos con r XY = = . El signo de rXY dependerá del signo
V ( X )V ( Y ) S 2y
de la covarianza.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
40
Propiedades de r:
a. Está entre –1 y 1
b. Simetría rxy =ryx
c. Es independiente del origen y de la escala.
d. Si X e Y son estadísticamente independientes, entonces r=0. Pero r=0, no implica
independencia.
e. Como es una medida de asociación lineal, no tiene sentido utilizarlo para describir
relaciones no lineales.
f. No dice nada de las relaciones causa-efecto. Para eso se utiliza el test de Granger.
∂Q
∂βˆ
=2 ∑ (Y − βˆ )( −1) = 0
i 1
1
∑ Y = ∑ βˆi 1
βˆ =
1
∑Y = Y i
βˆ 1 = Y
∑ (Y − βˆ X ) X
i 2 i i =0 ⇒ ∑Y X
i i − βˆ 2 ∑X 2
i =0
βˆ =
∑YX i i
∑X
2 2
i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
41
Características:
∑e ≠0i
∑e X =0
i i
ln Y = β1 + β 2 ln X + u i
∂ ln Y
η YX = = elasticida d de Y respecto a X = βˆ 2
∂ ln X
↓
cambio porcentual de Y, respecto al
cambio porcentual en X
• Modelo Semilogarítmico
ln Y = β1 + β2 X + ui
∂ ln Y
= β 2 ⇒ cambio relativo en Y por un cambio absoluto en X .
∂X
↓
semielasti cidad : tasa de cambio en Y por el cambio en una unidad en X.
Supongamos que tenemos el siguiente modelo para representar la evolución de una cierta
economía:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
42
dPIB
= 0.03PIB
dt
Esta es una ecuación diferencial que se puede reescribir como:
1
dPIB = 0.03dt . Si integramos a ambos lados de la ecuación, tenemos:
PIB
1
∫ PIB dPIB = ∫ 0.03dt y resolviendo ambas integrales:
ln PIB + c1 = 0.03t + c 2
PIB(t)=e0.03t ec
Hasta ahora hemos derivado los estimadores MICO para βˆ 1 y βˆ 2 . También hemos derivado
sus propiedades. En este punto nos preguntamos qué criterios podemos aplicar para saber
que tan buenos son estos estimadores.
Pese a que MICO es el método más popular para estimar los parámetros de un modelo,
minimizar la suma de los errores al cuadrado, no dice nada sobre la relación del estimador y
el verdadero valor del parámetro. Puede pasar que la minimización sea válida para una
muestra en particular.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
43
MICO siempre minimiza ∑ e 2i , pero esto no garantiza que se cumplan otras propiedades.
Mayor R2
¿Tiene sentido decir que los estimadores tendrán buenas propiedades si hacen que el R2 sea
el mayor posible?
No, MICO minimiza ∑ e 2i para una muestra en particular y esto es equivalente a
maximizar R2.
El R2 no es válido como criterio para "buena" estimación, sino como indicador ajuste de la
regresión a la muestra seleccionada. Ver Sección 2.1.10
ˆ
Insesgamiento ⇒ E(β) = β
Esto no quiere decir que β = βˆ , sino que se calcula el estimador correspondiente para
muestras repetidas, "en promedio" estaremos sobre el parámetro poblacional.
Minimizar ∑ e 2i puede aplicarse sin requerir casi ninguna información sobre la
forma en que los datos han sido generados. Este no es el caso del criterio de insesgamiento.
Para verificar si el estimador MICO es insesgado, deberemos realizar ciertos supuestos
sobre la forma en que se extrajo la muestra con la que trabajamos.
Eficiencia
¿Cómo elegimos entre estimadores que son todos insesgados?
Será mejor el que tenga la varianza más pequeña, es decir el que sea más eficiente.
Veremos qué supuestos deben plantearse para que se cumpla con esta propiedad.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
44
Ahora, si tengo un estimador con mínima varianza, ¿estaré seguro que es el mejor
estimador? No, depende del sesgo.
Error Cuadrático Medio
f (β* )
β* ) ≠ β
E(
Consistencia
En muchos problemas econometricos es imposible encontrar estimadores con las
propiedades anteriores. Sin embargo, muchas veces se puede justificar la utilización de un
estimador en base a sus propiedades asintóticas.
La distribución muestral de un estimador muchas veces cambia en la medida que cambia el
tamaño muestral. Es posible que el sesgo de un estimador se haga cada vez mas pequeño
en la medida que aumenta n. Por esta razón al analizar las propiedades deseables de un
estimador se deben tener en cuenta las propiedades asintóticas o de “muestras grandes” del
mismo:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
45
f(x)
f (βˆ ) 100
f (βˆ )40
(βˆ )20
β
En el grafico vemos un ejemplo en que a medida que aumenta n (de 20 a100) la
distribución se concentra respecto a β mientras la varianza del estimador va
disminuyendo.
En conclusión: cuando no se encuentra un estimador con buenas propiedades para muestras
pequeñas es deseable elegir un estimador con buenas propiedades para muestras grandes.
Recordemos que para derivar las fórmulas de los estimadores MICO, no fue necesario
realizar supuestos sobre la forma en que se extrajo la muestra o sobre la distribución de
probabilidad de µ.
Sin embargo para verificar las propiedades estadísticas que tienen estos estimadores si
requeriremos ciertos supuestos. Los supuestos usuales que se requieren y que por tanto
reciben el nombre de SUPUESTOS CLÁSICOS , son los siguientes:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
46
µi ⇒ es una perturbación aleatoria que puede tomar valores positivos o negativos, pero
no existe razón para esperar que sea sistemáticamente positiva o negativa. Por el
contrario, suponemos que los errores “a la larga” se compensan.
Con lo que este supuesto también implica que todo lo que no está incluido
explícitamente en el modelo (“todo lo que ignoramos” sobre los determinantes de la
variable Y), se supone que no afecta en forma sistemática el valor promedio de Y,
porque se compensan los errores negativos y los positivos.
Se supone que los errores cometidos en dos momentos distintos en el tiempo no están
correlacionados. Esto significa que en repetidas muestras no existe ninguna tendencia a
que los errores asociados con una observación estén relacionada a los errores de otra.
Si en un momento de tiempo o en un individuo de la muestra se genera un error
positivo, esto no nos da ninguna información sobre si el próximo error será positivo o
negativo.
Este supuesto implica que los errores no tienen un patrón de comportamiento
sistemático.
[ ]
COV( µ i , µ j ) = E{[µ i − E (µ i ) ] µ j − E(µ j ) }y dado el supuesto 1
= E(µ i , µ j ) = 0
Ejemplo:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
47
Cuando se trabaja con series de tiempo en economía es muy común que se presenten
fenómenos que tienen inercia y si esta no es recogida por el modelo, se genera
autocorrelación en el error. Por ejemplo, los efectos de la crisis de 1982 generalmente
son difíciles de recoger en su totalidad por un modelo, por lo que se genera un error que
estará correlacionado con el error cometido en el período siguiente.
µi µi
* *
* * *
* *
* *
-µj * * * µj -µj µj
*
* * * *
*
Correlación
Positiva Correlación
Negativa
-µi
-µi
µi
No existe
Correlación
*
* * *
-µj * * ** µj
* *
-µi
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
48
f ( µ)
Homocedasticidad.
X3
f ( µ)
Heterocedasticidad
X1 E(Y/Xi)=β 1 +β 2Xi
X2
X3
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
49
Los errores son normales, idéntica e independientemente distribuidos. Es decir que cada
error es una extracción aleatoria independiente de una distribución normal con media
cero y varianza σ2 .
f ( µ)
µ1 ∼N(0, σ2)
Y µ2∼ N(0, σ 2)
X1 E(Y/Xi)=β 1 +β2 Xi
X2
X3
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
50
En base a algunos de los supuestos clásicos anteriores, veremos ahora que propiedades
estadísticas tienen los estimadores MICO. ¿Son insesgados? ¿Son eficientes? ¿Tienen el
menor ECM?
2.3.1 Linealidad
∑ x y = ∑ x ( Y − Y) = ∑ x Y − ∑ x Y = ∑ x Y − Y ∑ x
βˆ 2 =
i i i i i i i i i i
∑x ∑x
2
i ∑x 2
i ∑x 2
i
2
i
∑x
2 2
i
xi
Si definimos k i = como un tipo especial de ponderador que cumple las siguientes
∑ x i2
propiedades:
a) no estocástico
b) ∑k i =0
1
∑k
2
c) =
i
∑ x 2i
Tarea: Verificar estas cuatro
d) ∑k x =∑k X
i i i i =1
propiedades
Esta expresión muestra que β̂2 es un estimador que puede expresarse como
combinación lineal de la variable Yi (donde ki son las ponderaciones de esa
combinación lineal).
2.3.2 Insesgamiento
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
51
βˆ 2 = ∑ k i (β 1 + β 2 X i + µ i )
βˆ 2 = ∑ k i β1 + ∑ k iβ 2 X i + ∑ k i µ i
βˆ 2 = β1 ∑ k i + β 2 ∑ k i X i + ∑ k i µ i
0 1
por a) por d)
βˆ 2 = β 2 + ∑ k i µ i (***)
Esta expresión es muy útil porque expresa al estimador como la suma del verdadero
parámetro β 2 más una suma ponderada de errores aleatorios que puede resultar
positiva o negativa, pero cuyo valor esperado es 0.
βˆ es insesgado si E(βˆ ) = β
2 2 2
E (βˆ 2 ) = E(β2 + ∑ k iµ i )
E (βˆ 2 ) = β 2
El estimador es insesgado, esto es, aunque para una muestra en particular β̂ 2 se puede alejar
de β en algo positivo o negativo ( βˆ − β =
2 2 2 ∑
k µ ), si repetimos muchas veces el
i i
experimento, estaremos en promedio sobre el verdadero valor del parámetro. Recordar: que
el estimador sea insesgado no nos garantiza que sea el "mejor" estimador.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
52
2.3.3 Eficiencia
2.3.3.1 Cálculo de varianzas y covarianzas.
Para verificar cuan concentrado o disperso (respecto al verdadero valor) se
encuentra el estimador MICO necesitamos calcular las VARIANZAS :
Recordar var( X ) = E(X i − E (X ) ) 2
• ( 2
)
VAR (βˆ 2 ) = E βˆ 2 − E(βˆ 2 ) , pero E(βˆ 2 ) = β 2 luego, VAR (βˆ 2 ) = E[(βˆ 2 − β 2 )] 2
De (***) sabemos que
βˆ 2 = β 2 + ∑ k i µ i
βˆ 2 − β 2 = ∑ k i µ i , con lo que:
[
Var (βˆ 2 ) = E( ∑ k i µ i ) 2 = E (k 1µ 1 + k 2 µ 2 + . . . + k n µ n ) =
2
]
Var (βˆ 2 ) = E[(k 1µ 1 + k 2 µ 2 + . . . + k n µ n )(k 1µ 1 + k 2 µ 2 + . . . + k n µ n )] =
[
Var (βˆ 2 ) = E k 12 µ 12 + k 1k 2µ 1 µ 2 + k 1 k 3µ 1 µ 3 + . . . + k 22 µ 22 + k 2µ 2 k 1µ 1 + … ]
nos quedan
n
→ n terminos k µ → ∑ k i2 µ i2
2
i
2
i
1
n (n −1)
n ( n − 1)
→ términos ( 2k i µ i k jµ j ) → ∑ 2k i k jµ i µ j
2 1
n n ( n −1)
Var (β 2 ) = E ∑ k i µ i + 2 ∑ k i k j µ i µ j
2
ˆ 2 2
1 1
k i no aleatorio
Recordando E(µ 2i ) = σ 2
E(µ µ ) = 0
i j
n ( n −1) n ( n −1 )
n 2 n 2
Var (βˆ 2 ) = ∑ k 2i E ( µ i2 ) + 2 ∑kk i j E( µ i µ j ) = ∑ k 2i E (µ 2i ) + 2 ∑ k k E(µ µ i j i j )
1 1 1 1
σ2 ∀ i 0
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
53
1
= σ
2
Var (βˆ 2 ) = σ 2 ∑ i
k 2
= σ 2
∑ x 2i ∑ x i2
1
por c), ∑k 2
=
∑ x i2
i
• COV( βˆ 1 , βˆ 2 )
( )( ) [
COV (βˆ 1 , βˆ 2 ) = E βˆ 1 − E(βˆ 1 ) βˆ 2 − E(βˆ 2 ) = E (βˆ 1 − β1 ) (βˆ 2 − β 2 ) ]
↓ ↓
E(βˆ 1 ) = β 1 E (βˆ 2 ) = β 2
βˆ 1 − β1 = β1 + β 2 X + µ − βˆ 2 X − β1 , y por tanto,
βˆ − βˆ = X ( β − βˆ ) + µ =
1 1 2 2
βˆ − β = − X ( βˆ − β ) + µ
1 1 2 2
Entonces,
E[− X ( βˆ 2 − β 2 ) ( βˆ 2 − β 2 ) ] + E [µ ( βˆ 2 − β 2 ) ] =
∑ µi
− X E ( βˆ 2 − β 2 ) 2 + E ( )( ∑ k i µ i ) =
N
σ2 1
−X• + E ( µ1 + µ 2 + . . . + µ n )( k1 µ 1 + k 2 µ 2 + . . . + k n µ n ) =
∑ xi N
2
σ2
−X• + σ 2 ∑ ki
∑ xi
2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
54
σ2
COV(βˆ 1 , βˆ 2 ) = − X •
∑ x 2i
Características de la varianza
• Dado σ2, cuanto mayor sea la variabilidad de la variable X, más centrado estará el
estimador del verdadero valor.
• Dada la varianza de Xi, a mayor σ2 (mayor variabilidad de los datos a explicar o
mayor variabilidad del error aleatorio), mayor será la varianza del estimador.
Y
X
variabilidad
de Y no
explicada
variabilidad
por X
de X
La amplitud
de esta área
es σ2 variabilidad común, en el sentido
que se puede explicar una por otra.
Cuanto mayor esta área, mayor la
información empleada por el
procedimiento de estimación para
calcular la pendienteβ2 , entonces,
menor su varianza.
Características de la covarianza
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
55
las verdaderas varianzas. Estimaremos σ2 y eso nos permitirá estimar las varianzas de
βˆ y βˆ .
1 2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
56
2.3.3.2 Estimador de σ2
(1) Yi = β 1 + β 2 X i + µ i
(divido entre n y sumo para todo i)
∑Y i
= β1 + β 2
∑X i
+
∑µ i
n n n
(2) Y = β1 + β 2 X + µ
(3) y i = β 2 x i + (µ i − µ )
Recordando que:
(4) e = y − ŷ = y − βˆ x
i i i i 2 i
Sustituyendo (3) en (4)
(5) e = β x + µ − µ − βˆ x i
i 2 i i 2
(6) e = (βˆ − β )( −x ) + µ − µ
i 2 2 i i
[
e 2i = (βˆ − β )( − x ) + µ − µ
2 2 i i
2
]
(7) e 2i = ( −x i ) 2 (βˆ 2 − β 2 ) 2 + (µ i − µ ) 2 − 2x i (βˆ 2 − β 2 ) (µ i − µ )
(9)
i i 2 2 i i 2 2
[
E (Σ e 2 ) = E ∑ x 2 (βˆ − β ) 2 + E Σ (µ − µ ) 2 − 2E ∑ x (βˆ − β ) (µ − µ )
i
]
(10)
i 14i 442244243 1442 i
443 14444
2 4 2244
[
E (Σ e 2 ) = ∑ x 2 E (βˆ − β ) 2 + E Σ( µ − µ ) 2 − 2E (βˆ − β ) ∑ x (µ − µ )
i 4i443
]
A B C
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
57
(11) E (Σe 2 ) = A + B + C
i
Desarrollando A
i 2
(
A = ∑ x 2 E βˆ – β
2
2
i
)
= ∑x2 •
σ2
2
=σ2
∑ xi
σ2
Recordar que V(βˆ 2 ) =
∑ x 12
Desarrollando B
14
(
2 24 2
3
)
i i
i i i i
(
C = − 2 E β − β ∑ x (µ − µ ) = − 2E ∑ k µ ∑ x µ − µ ∑ x =
ˆ
{i
)
∑k µ
0
[ ] [ ]
i i
= − 2 E ∑ k µ ∑ x µ = − 2 E (k µ + k µ … k µ )( x µ + x µ … x µ )
i i i i 1 1 2 2 n n 1 1 2 2 n n
= − 2 k x E(µ 2 ) + k x E (µ 2 ) + … + k x E (µ 2 ) + … k x E(µ µ )
1 1 1213 2 2 123 2 n n 12n3 n n − 1 14 n2n4−4
4 1
3
σ2 σ2 σ2 0
= − 2 ∑ k x σ 2 = − 2σ 2 ∑ k x = − 2σ 2
i i 12i 3i
1
Entonces ahora (11)
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
58
(12) E (∑ e i2 ) = A + B + C = σ 2 + ( n − 1)σ 2 − 2σ 2 = σ 2 (1 + n − 1 − 2) = σ 2 ( n − 2)
(13) E (∑ e i ) = σ ( n − 2)
2 2
2 ∑ e i2
Definamos que el estimador de σ es σˆ = 2
, el resultado (13) nos asegura que
n−2
estamos definiendo un estimador insesgado de σ2 .
Esto porque σ2 será insesgado si:
∑ e2
i = 1
E σˆ = σ y E(σˆ ) = E E ∑ e 2 =
2 2 2 1
• σ 2 (n − 2) = σ 2
n −2 n − 2 1 4
42
i
3 n −2
σ 2 ( n − 2)
2 ∑ e i2
El estimador insesgado de σ2 será σˆ =
n−2
ˆ ˆ
V (β 2 ) = σ βˆ =
ˆ 2 σˆ 2
=
∑ e 2i / n − 2
=
∑ e 2i
2
∑ x 2i ∑ x 2i ( n − 2)∑ x 2i
σˆ
o alternativamente σˆ βˆ = Tarea: para el
2
∑x 2
i
ejemplo 2.1.7,
calcular las
y análogas para βˆ 1 ,
varianzas y
Var (βˆ 1 ) = σ 2
∑X 2
i
X2
=σ 2
+
1
covarianzas
n∑ x estimadas.
∑ x i n
2 2
i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
59
V̂(βˆ 1 ) = σˆ β2ˆ1 = ~
σ2
∑X 2
i
X2
= σˆ 2 +
1
n∑ x 2
i ∑ x i n
2
2. E(µi) = 0 ∀i
2
3. y 4. E u , u = σ si i = j homocedasticidad y no autocorrelación
i j 0 si i ≠ j
TESIS: Los estimadores MICO son de mínima varianza entre los estimadores lineales e
insesgados ⇒ MICO son los mejores estimadores lineales insesgados (MELI).
Demostración
ˆ σ2
Además V(β 2 ) =
∑ x 2i
• Supongamos que existe otro estimador β* lineal de β 2 .
2
Entonces para que será lineal β* deberá ser igual a β*2 = ∑ w i Yi donde wi es alguna
2
ponderación.
• Calculemos E (β* ) y veamos que condición debemos exigirle a wi para que β* sea
2 2
insesgado.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
60
∑w X = ∑w x
i i i i =1
• Veamos las condiciones que tiene que cumplir wi para que la varianza sea mínima
2 2
2 x
i +
x
i 2
x
i x
i
= σ ∑ w − = σ ∑ w − +
i 2 2 i 2 2
∑x ∑x ∑x ∑x
i i i i
2 2
x x
x i x i
= σ 2 ∑ w − i + + 2 i
w − i
i ∑ x 2 ∑ x2 ∑ x2 ∑ x 2
i i i i
2 2
x w x x2
2 x
i 2 i 2 i i i
= σ ∑ w − +σ ∑ + 2σ ∑ −
i 2 ∑x2 2
∑xi ∑x (∑ x 2 ) 2
i i i
2
x 1 1 ∑x 2
2 2 ∑ i ∑ wi x i −
= σ2 ∑ w − i + σ2 x 2 + 2σ2 i
i 2
∑ x i ( ∑ i
x ) ∑ x 2i ∑x 2
i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
61
σ2
quiero minimizar esto, pero el segundo sumando es un número , es una constante,
2
∑xi
x
Entonces, minimizar Var(β*2 ) es equivalente a minimizar ∑ ( w − i )2
i
∑ x i2
xi
La condición que minimiza la varianza es que w i = , que es una condición igual a la
∑x 2
i
Este teorema asegura que si existe otro estimador ( β*2 ) con similares propiedades al que
tiene MICO (linealidad e insesgamiento), para que la varianza de β*2 sea mínima, este
estimador debe ser el estimador MICO.
Como consecuencia, MICO es el mejor estimador entre los estimadores lineales e
insesgados.
Hasta este punto hemos demostrado que los estimadores MICO tienen propiedades
importantes:
• linealidad
• insesgamiento
• mínima varianza dentro de la familia de estimadores lineales e insesgados (eficientes
entre los estimadores lineales e insesgados)
De los seis supuestos clásicos solo hemos utilizado los cinco primeros, es decir, para
determinar estas propiedades no hemos requerido ningún supuesto sobre la distribución de
los errores.
Tarea: verificar qué supuestos son necesarios para determinar cada una de las
propiedades
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
62
µ i ≈ N( 0, σ 2 ) ∀i
X −µ
lím ite de z = ~ N ( 0, 1)
σ/ n
n →∞
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
63
0
χ 2α
Exactamente el 95% de una distribución chi-cuadrado caen entre χ 20. 975 y χ 20.025 .
Entonces,
∑Z i ~ χ 2∑ ki
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
64
α/2
-tα/2 tα/2
0
TM8 Si X es la media de una muestra aleatoria de tamaño n que se toma de una población
normal con media µ y varianza finita y desconocida σ2 , pero varianza estimada S2 ,
X −µ
entonces el estadístico t = ~ t n −1 , se distribuye t con n-1 grados de libertad.
S/ n
Z1 ~ χ k 1
2
Z1 / k1
Z2 ~ χ F=
2
k2 ~ Fk 1 , k2
Z2 / k 2
Z1 es independie nte de Z 2
P ( F > Fα ) = α la probabilidad de
que cualquier valor de la F sea mayor a
Fα es igual al área que se acumula arriba
α y a la derecha de F α
0 Fα
TM 10
t 2k = F 1, k
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
65
2. Yi = β1 + β 2 X i + µ i
3. Recordemos que βˆ 2 = β 2 + ∑ k i µ i
V (βˆ 2 ) = σ 2βˆ 2 =
∑x 2
i
βˆ 2 ~ N (β2 , σ2βˆ )
2
4. Estandarizando,
βˆ 2 − β 2
Z2 = ~ N(0, 1)
σβˆ 2
βˆ 1 − β1
Z1 = ~ N( 0, 1)
σ βˆ 1
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
66
βˆ 2 ≈ N (β 2 , σ 2βˆ )
2
0 β2
βˆ 2 − β 2
Z2= ~ N(0,1)
σ βˆ
2
2
(n − 2) σˆ 2
(1) ~ χ2
2 n−2
σ
6. Sabemos que
βˆ 2 − β 2 σ 2µ σµ
~ N(0, 1) con σβˆ = =
σ βˆ
2
2
∑x 2
i ∑x 2
i
Entonces, =
ˆ
βˆ 2 − β 2 (β 2 − β 2 ) ∑x 2
i
~ N(0, 1) (2)
σµ σµ
∑x 2
i
(βˆ 2 − β 2 ) ∑x 2
i
σµ
t= ~ t n −2 (3)
(n − 2) σˆ 2µ
n−2
σ 2µ
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
67
t=
(βˆ 2 − β 2 ) ∑x 2
i σµ
=
(βˆ 2 − β 2 ) ∑x 2
i σµ
=
(βˆ 2 − β 2 ) ∑x 2
i σµ
σˆ µ2 (n − 2) 1 σˆ 2µ σˆ µ σ µ
⋅
σ 2µ ( n − 2) σ 2µ
=
(βˆ 2 − β 2 ) ∑x 2
i
=
(βˆ 2 − β 2 ) (βˆ − β 2 )
= 2
σˆ µ σˆ µ σˆ βˆ
2
σ βˆ
ˆ 2
∑ x i 2
Es decir que:
(βˆ 2 − β 2 ) (βˆ 1 − β1 )
≈ t n− 2 y por similar procedimiento, ≈ t n −2
σˆ ˆ
β2
σˆ ˆ β1
Esto nos permitirá obtener intervalos de confianza y realizar test de hipótesis sobre β 1 y β 2.
α nivel de significancia
El intervalo será aleatorio (depende de la muestra), pero después que se utilizó una muestra,
el intervalo queda fijo y por tanto la probabilidad de que el verdadero valor esté en el
intervalo es cero o uno (“está o no está”)
βˆ 2 − β2
Dado que ~ t n −2 , entonces exactamente el 1-α de esta distribución t con n-2
σˆ βˆ
2
βˆ 2 − β 2
P (− t α / 2 ≤ ≤ t α / 2 ) = 1− α
σˆ βˆ 2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
68
P (− t α / 2 • σˆ βˆ 2 ≤ βˆ 2 − β 2 ≤ t α / 2 • σˆ βˆ 2 ) = 1 − α
P (−βˆ 2 − t α / 2 • σˆ βˆ 2 ≤ − β 2 ≤ − βˆ 2 + t α / 2 • σˆ βˆ 2 ) = 1 − α
P (βˆ 2 − t α / 2 • σˆ βˆ 2 ≤ β 2 ≤ βˆ 2 + t α / 2 • σˆ βˆ 2 ) = 1 − α
IC β 2 = βˆ 2 ± t α / 2 σˆ βˆ
2
Y en forma similar:
IC β1 = βˆ 1 ± t α / 2 σˆ βˆ
1
• Si b ∈ IC ⇒ No rech H0
• Si b ∉ IC ⇒ Rech Ho.
β 2 = βˆ 2 − t α / 2 σˆ βˆ β 2 = βˆ 2 + t α / 2 σˆ βˆ
2 2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
69
βˆ 2 − β 2 βˆ − b
Sabemos que ~ t n − 2 , entonces bajo la hipótesis nula 2 ~ t n −2
σˆ βˆ σˆ βˆ
2 2
βˆ 2 − b
P (− t α / 2 ≤ ≤ t α / 2 ) =1 − α
σˆ βˆ 2
P (− t α / 2 • σˆ βˆ 2 ≤ βˆ 2 − b ≤ t α / 2 • σˆ βˆ 2 ) = 1 − α
P (− b − t α / 2 • σˆ βˆ 2 ≤ − βˆ 2 ≤ − b + t α / 2 • σˆ βˆ 2 ) = 1 − α
βˆ 2 − b
Bajo Ho, ~ t n-2
σˆ ˆ
β2
α/2
-t c tc
0
bσ+βˆ 2
ˆ > ˆ
Rech Ho⇒β 2 tα /2
Rech Ho⇒ β 2 < b -σ βˆ 2 tα/2
ˆ ˆ
Entonces rechazamos H0 si
• t >tc
Rech H0 si | t | > tc
• t < tc
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
70
βˆ 2 − b βˆ 2 − b
Como t = , entonces Rech H0 si > tc
σˆ βˆ σˆ βˆ
2 2
1. Diferencia entre test a una o dos colas, viene dada por la hipótesis alternativa.
Una cola
H0 : β 2 = b 2
H1 : β2 > b 2
α
Rech H 0 si t > tc
tc
Dos colas
H 0 : β2 = b2
α /2 H1 : β 2 ≠ b 2
α/2 Rech H0 si |t| > tc
- tc tc
Si β̂2 cae en alguna de las colas de la distribución (Rech H0), puede ser por dos
razones
Rech H0 Error I Ok
No Rech H0 Ok Error II
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
71
β 2 bajo H0
β 2 bajo H1
error II.
β = P(Error Tipo II) = P(No Rech H0/H0 es falso)
H 0 : β2 = 0 βˆ 2
, luego, bajo la hipótesis nula t = ~ t n −2
H1 : β2 ≠ 0 σˆ ˆ β2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
72
H0 : β2 = 0
H1 : β2 ≠ 0
Para el ejemplo 2.1.7, teníamos que Yˆ = 3.6 + 0.75 X i y los desvíos estándar de los
coeficientes eran:
σˆ βˆ = 2.09
1
σˆ βˆ 2 = 0.256
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
73
Rech Ho si |t |>2.306
βˆ 2 − 0 0,75
t= = = 2,93 > 2,3 ⇒ rech . H 0
σˆ ˆ 0,256
β2
0.025
-2.306 2.306
0
2.93
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
74
βˆ i
t-Statistic: presenta el valor del estadístico t (t = ) para la hipótesis nula β i=0. Para
σˆ βˆi
el ejemplo, vemos que el estadístico t del intercepto es menor que dos, por lo que
podríamos decir que la constante no es significativa.
Prob: el p-value, o sea, el nivel de significancia (α) máximo ex post que requerimos
para no rechazar la hipótesis nula. En este ejemplo, si trabajamos con α=1.8%, no
rechazamos la hipótesis de que β 2 =0.
iii) La tercera parte de la salida presenta indicadores de ajuste y otros estadísticos
veremos más adelante en este curso. Los que conocemos hasta ahora son:
n−2
suma al cuadrado de los residuos: ∑ e 2
Sum squared resid: i
Ejemplo:
Considere el siguiente modelo:
Yi = β 1 + β 2 Xi + µi
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
75
Sabemos que Yi = β 1 + β 2 X i + µ i
H0)β 2 = 1
H1)β 2 > 1
Se pide calcular la Probabilidad de rechazar H0 correctamente. Esto es, la probabilidad de
que rechacemos que β 2 =1, dado que en realidad es 4.
Debemos calcular Prob (rech H0 / β 2 =4)
βˆ 2 − 1
Bajo H0 , ~ N(0,1), porque se conoce la verdadera varianza de µi
σˆ
β2
Bajo H0,
β2~ N(1, σ ) Bajo H1,
β̂2 El área achurada es la que se nos pide
β2~ N(4,σ )
β̂2 calcular, es la P(rech H0, dado H 1) y es
igual a 1-P(no Rech H 0, dado H1)=1-β
1 4
No rech Ho β̂ c Rech Ho
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
76
σ 2µ = 40
n = 10 2 1 1 1 40 40
σ βˆ 2 = σ µ • = σ 2µ = σ µ2 = = =4
2
∑ i
X = 20 ∑ 1
x 2
∑ (X i − X) 2
∑X 2
1 − nX 2
50 − 10( 2) 2
10
∑ X i = 50
2
⇒ σ βˆ = 4 = 2
2
βˆ 2 − 1
Rech. H0 si > 1,645
2
ˆ
Rech Ho si β 2 > 1,645 * 2 + 1 = 4.29
ˆ
Rech Ho si β 2 > 4.29
Luego,
βˆ − 4 4,29 − 4
Pr ob(Re chH 0 / β2 = 4) = Pr ob (βˆ 2 > 4, 29 / β 2 = 4) = P 2 >
2 2
= P(Z > 0,145) = 0,4443
Pr ob(Re chH / β2 = 4) = 0, 4443
0
3
En el caso de la regresión simple, tanto la hipótesis a probar como el estadístico que utilizaremos son
coincidentes con un test de significancia. Esto debido a que solo existe una variable explicativa. Este
resultado no será igual en un modelo general.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
77
Sabemos que:
βˆ 2 − β 2
~ N ( 0, 1) (1)
σβˆ
2
Si elevamos (1) al cuadrado, tenemos que (2) se distribuye chi-cuadrado con un grado de
libertad.
(βˆ 2 −β2 )2
~ χ1
2
(2)
σ 2
βˆ 2
Transformando (2):
βˆ 2 − β 2 (βˆ 2 − β 2 ) ∑ x 2i 2
= ~ χ1 (3)
σµ 2 1 σ 2
µ
∑ x 2i
Por otro lado sabemos que:
σˆ 2 (n − 2)
~ χ 2n− 2 ⇒
∑e 2
i
~ χ 2n− 2 (4)
σ 2
σ 2
Se puede demostrar que (3) y (4) son independientes y pueden formar una nueva expresión
que se distribuye F.
(βˆ 2 − β2 ) ∑x
2
2
i
σ 2µ
F= 1 ~ F1, n− 2 (5)
∑e 2
1
σ 2u
n −2
Simplificando (5)
F=
(βˆ 2 −β2 ) ∑x
2
2
i
~ F1, n − 2 (6)
∑e 2
1
n−2
Bajo H0 :
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
78
F=
∑x
βˆ 22 2
i
~ F1, n −2 (7)
∑e 2
1
n−2
Analizando esta expresión, vemos que el numerador coincide con la suma de cuadrados
explicados (SCE), y el denominador es la SCR dividida por sus grados de libertad.
SCE
F= ~ F1, n − 2 (8)
SCR / n − 2
0 Fα
Este test indica que el modelo es significativo en su conjunto, si el "efecto explicado por el
modelo" es suficientemente grande respecto al "ruido", a lo residual.
SCE
Si F = > Fα (1, n − 2) ⇒ Re ch. H 0
SCR / n − 2
Rechazo que β 2 = 0, si obtengo un valor del "aporte de X" respecto al residuo que
sea considerable. ¿Cuán considerable? El límite nos lo da el valor de tabla.
Grados de Libertad
Asociado a cada suma de cuadrados hay grados de libertad; (valores que pueden elegirse
arbitrariamente).
Suma de cuadrados Totales (SCT): tiene n-1 grados de libertad. Esto surge como
consecuencia de la pérdida de un grado de libertad, necesario para calcular Y .
Suma de cuadrados residuales (SCR): tiene n-2 grados de libertad. Se pierden dos grados
de libertad que son necesarios para asegurar que se cumplan las ecuaciones normales. Estas
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
79
condiciones son: ∑e i =0
n-2
∑e i X i = 0
Antes veíamos que al realizar una regresión, esto nos permitía dividir la variación total en
dos partes, la parte explicada por la regresión y la parte residual. Es decir que existen
distintas fuentes en que se descompone la variación total. Esto se puede resumir en esta
tabla a la que generalmente se conoce como TABLA ANOVA.
FUENTES DE VARIACION:
Residuo SCR = ∑ e 2
i
n-2 SCR/n-2
Existe una forma alternativa de expresar (8) que también permite realizar el test:
Verifiquemos ahora que este test, para el caso del modelo de regresión simple, es
equivalente a un test de significancia de β 2 .
Sabemos que
βˆ 2
βˆ ∑x
2 2 i
Re ch H si = >t
0 2 σˆ α / 2, n − 2
σˆ / ∑ x µ
µ i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
80
βˆ 2 ∑ x 2 βˆ 2 ∑ x 2
Re ch H si 2 i = 2 i >F
0 2 2 1, n − 2
σˆ ∑ e /n −2
µ i
Esta expresión es la misma de (7).
Debemos recordar que el cualquier valor de la tabla t para k grados de libertad, elevado al
cuadrado es igual al valor de la tabla F en 1, k grados de libertad. En
particular t 2n − 2 = F1, n− 2 .
Este resultado no se verifica en regresiones con mayor número de variables explicativas.
∑ (X − X)
3
i
coeficiente de simetría: S= n
σ3
∑ (X − X)
4
i
coeficiente de curtosis: C= n
σ4
Para una ditribución normal el coeficiente de asimetria es cero y el coeficiente de curtosis
es 3.
Bajo la hipótesis nula de que los residuos estan normalmente distribuidos, Jarque y Bera
S 2 (C − 3) 2
demostraron que asintóticamente el estadistico JB = n +
24
sigue una
6
distribución chi-cuadrado con dos grados de libertad. Si el valor JB es grande comparado
con el valor de una distribución chi-cuadrado con dos grados de libertad, rechazo la
hipótesis nula, rechazo normalidad.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
81
3.1 DEFINICIONES
(1) es equivalente a:
Y 1 = β 1 + β 2 X 12 + β 3 X 13 + . . . + β k X 1k + µ 1
Y 2 = β 1 + β 2 X 22 + β 3 X 23 + . . . + β k X 2 k + µ 2
•
(2)
•
•
•
Y = β + β X
n 1 2 n 2 + β 3 X n 3 + . . . + β k X nk + µ n
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
82
Y1 1 X12 X 13 . X1k β µ
Y 1 X 22 . X 2 k β µ
1 1
X 23
2 2 2
(3) . = . . . . . . + .
. .
. . .
. . .
Yn 1 X n 2 X n3 . X nk β k µ n
Y1 1 X 12 X13 . X 1k β 1
Y 1 X X 23 . X 2k β
2 22
2
Yn×1 = . X n× k = . . . . . β k×1 = .
. .
. . . . .
β
Yn 1 X n2 Xn3 . X nk k
µ1
µ
2
µ n×1 = .
.
µ
n
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
83
(8) Y i = βˆ 1 + βˆ 2 X i2 + βˆ 3 X i3 + . . . + βˆ k X ik + e i
e 1
e
2
Con lo que definiendo e n×1 = . , lo podemos transformar en forma matricial como
.
e n
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
84
e1
e
2
(10) e n×1 = . = Y − Y
ˆ = Y − Xβˆ
.
en
Entonces:
Y = Xβ + µ
Yˆ = Xβˆ
ˆ ˆ
e = Xβ + u − Xβ = X(β − β) + µ
e = Y − Xβˆ
⇓
Yˆ + e = Xβˆ + Y − Xβˆ = Y
∑e ∑ (Y
2
min Q = min i
= min i − βˆ 1 − βˆ 2 X i2 − βˆ 3 Xi 3 − …… βˆ k X ik ) 2
(11) •
•
•
∂Q
( k ) = 2 ∑ (Yi − βˆ 1 − βˆ 2 X i2 − βˆ k X i3 − … − βˆ k X ik )( −X ik ) = 0
ˆ
∂β
k
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
85
Trabajando:
(1) ∑ Yi = Nβˆ 1 + βˆ 2 ∑ X i2 … + βˆ k ∑ X ik
( 2) Y X = βˆ
∑ i i2 1 ∑ X i 2 + β 2 ∑ X i 2 + … + β k ∑ X ik X i 2
2
ˆ ˆ
(12) •
•
•
( k ) ∑ Y X = βˆ ∑ X + βˆ ∑ X X + … + βˆ ∑ X 2
i ik 1 ik 2 i2 ik k ik
1
X
1 . . 1 Y1 n ∑X i2 . . ∑X ik
βˆ 1
ˆ
X 22 . . X n2 Y2 ∑ X i 2 ∑X 2
. . ∑X X ik β 2
12 i2 i2
(13) . . . . . . = . . . . . .
. . . . . . . . . . . .
X 1k
X 2k . . X nk Yn ∑ X ik ∑ X i 2 X ik . . ∑ X ik βˆ k
2
1 X 12 X13 . X 1k 1 1 . . 1
1 X X 23 . X 2k X X 22 . . X n 2
22 12
X n×k = . . . . . X 'k× n = . . . . .
. . . . . . . . . .
1 X n2 X n3 . X nk X1k X2k . . X nk
n
∑X i2 . . ∑X ik
∑ X i2 ∑X ∑X X
2
i2 . . i2 ik
X' X = . . . . .
. . . . .
∑ ik ∑X ∑ ik
X X ik . . X 2
i2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
86
Esta es la fórmula matricial que estabamos buscando y que resume los k estimadores
MICO.
Esto implica que para poder calcular β̂ , las variables explicativas que son las que forman
X’X, tendrán que cumplir con determinadas condiciones que aseguren que la matriz sea
invertible.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
87
Queremos minimizar ∑e 2
i y esto es equivalente a minimizar e’e, porque
e1
e
( e1 … e n ) 2 = e' e = ∑ e 2i
.
e
n
Como :
e = Y - X β̂
min ∑e 2
i = min e' e = min
ˆβ
( Y − Xβˆ )' ( Y − Xβˆ )
Son escalares y uno es el transpuesto del otro ⇒ puedo sustituirlo por − 2 βˆ ' X' Y
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
88
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
89
βˆ = ( X' X) −1 X' Y
Condiciones de segundo orden
∂ 2Q
= 2X' X
(∂βˆ )(∂βˆ )'
Las condiciones de mínimo implican que esta matriz debe ser definida positiva. Para
comprobar esto definamos d cualquier vector no nulo de k elementos y c un vector de n
elementos tal que c=Xd. Como X es de rango completo por columna esto implica que c sea
no nulo (de lo contrario habría dependencia lineal entre las columnas de X).
Por lo tanto,
c’c= d’X’Xd >0 y entonces X’X es definida positiva.
βˆ = ( X' X) −1 X' Y
Yi = β 1 + β 2 X i 2 + µ i
¿Cómo son las matrices para este caso en particular?
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
90
1 X 12
1 Y1
X 12 1……………1 :
X = :
: X' = Y=
:
: : X12 X 22 … X n 2
1 Yn
X n2
1 X12
1 X
1
X' X =
1 . . 1
. .
22
. =
n ∑X i2
∑ X i2 ∑X 2
X12 X 22 . . X n 2
. . i2
1 X n 2
−1 1 ∑ X 2i2 − ∑ Xi2
( X' X) =
n∑ X 2i2 − ( ∑ X i 2 ) 2 − ∑ X i2 n
∑ X 2i2 − ∑ Xi2
n ∑ X i 2 − ( ∑ X i2 ) n ∑ X 2i2 − (∑ X i 2 ) 2
2 2
( X' X) −1 =
− ∑ X i2 n
n X 2 − ( X )2 2
∑ i 2 ∑ i2 n ∑ X i2 − (∑ X i 2 )
2
Y1
:
1
X' Y =
1 . . 1 = ∑ Yi
. . X n 2
.
X12 X 22 : ∑ X i2 Yi
Yn
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
91
∑ X i22 − ∑ X i2
n ∑ X i2 − (∑ X i 2 ) n ∑ X i22 − ( ∑ X i2 ) 2 ∑ Yi
2 2
βˆ = ( X' X) −1 X' Y =
− ∑ Xi2 n ∑ i 2 i
X Y
n X2 − ( X )2 2
∑ i2 ∑ i 2 n ∑ X i 2 − ( ∑ X i2 )
2
Multiplicando:
∑ X 2i 2 ∑ Yi − ∑ X i 2 ∑ X i2 Yi
n ∑ X 2i2 − ( ∑ X i2 ) 2
βˆ = (X' X) −1 X' Y =
− ∑ X i 2 ∑ Yi + n∑ X i 2 Yi
n ∑ X 2i2 − ( ∑ X i2 ) 2
∑ X 2i2 nY − n X∑ X i 2 Yi ∑ X 2i2 Y − X∑ X i2 Yi
n ∑ X 2i 2 − ( nX) 2 ∑ X 2i2 − nX 2
βˆ = ( X' X) X' Y =
−
=
1
− nXnY + n ∑ X i2 Yi − nX Y + ∑ X i 2 Yi
n ∑ X 2i 2 − ( nX) 2 ∑ X 2i2 − nX 2
∑ X 2i 2 Y − X∑ X i 2 Yi
∑ X i22 − n X 2
ˆβ =
∑ X i2 Yi − nXY
∑ X i22 − n X 2
En la segunda fila obtenemos una formula que es idéntica a la que teníamos en el modelo
simple.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
92
∑ X 2i2 Y − X( ∑ X i2 Yi − n XY + nXY)
ˆβ =
∑ X 2i2 − nX 2
ˆβ
2
∑ X 2i 2 Y −nX 2 Y X( ∑ X i 2 Yi − nXY)
∑ X Y −nX Y − X (∑ X i 2 Yi − nXY )
2 2 −
i2
∑ X 2i2 − nX 2 ∑ X 2i 2 − nX 2
ˆβ = ∑ X 2i2 − nX 2 =
β2
ˆ
βˆ 2
Simplificando:
∑ X i22 −nX 2
− X ∑ X i2 Yi − n XY
Y
∑ X i22 − n X 2
∑ X 2i2 − nX 2
ˆβ = Y − Xβˆ 2
=
βˆ 2
βˆ 2
Con lo que:
Y − βˆ 2 X Y − βˆ 2 X
βˆ = =
∑ X i 2 Yi − nXY ∑ x i 2 y i
∑ X i2 − nX ∑ x i2
2 2 2
Yi = β 1 + β 2 X i2 + β 3 X i3 + µ i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
93
1 X 12 X13
1 X X 23
22 n
∑X i2 ∑X i3
= . . X' X = ∑ X i2 ∑X ∑X X
2
X n×3 . i2 i2 i3
∑ X i3
. . . ∑X X i2 i3 ∑X 2
i3
1 X n2 X n 3
∑ Yi
X ' Y = ∑ X i2 Yi
∑ X i3 Yi
X Y
Consideremos ahora que se incluye una nueva variable explicativa Z, de forma que el
modelo es Ŷi = βˆ + βˆ x X i + βˆ z Z i + e i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
94
*
X * * * Y
* * * *
•
• •
∇
•
∇ ∇∇
• • •
∇∇ ∇
• • • •
∇ ∇ ∇ ∇
• •
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
95
(1) ˆ = Y − Xβˆ
e=Y−Y
(2) Y = Xβˆ + e
De las ecuaciones normales sabemos que:
( X' X) βˆ = X' Y
( X' X) βˆ = X' ( Xβˆ + e)
( X' X) βˆ = X' X βˆ + X' e
¿Qué significa?
1 1 . . 1 e1 ∑ e i 0
X12 X 22 . . X n 2 e 2 ∑ e i X i2 0
X' e = . . . . . e 3 = ∑ e i X i3 = 0
. . . . . . . .
X 1k
X 2k . . X n k e n ∑ e i X ik 0
El hiperplano de regresión pasa por el punto determinado por las medias muestrales de
todas las variables involucradas en el modelo. ( X 2 , X 3 ,...., X k , Y) , siempre que éste posea
intercepto.
Esto debido a que la primera ecuación de (12) implica que
Y = βˆ + βˆ X + βˆ X + .... + βˆ X
1 2 2 3 3 k k
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
96
SCT=SCE+SCR
∑y 2
i = βˆ 22 ∑ x + ∑ e = ∑ ŷ + ∑ e
2
i
2
i
2
i
2
i
Ahora:
• SCT
SCT = Σy i2 = Σ(Yi − Y) 2 = ∑ Yi2 − n Y 2
Y1
Y2
Dado que Y' Y = (Y1 Y2 . . Yn ) . = ∑ Yi
2
.
Yn
• SCE
SCE = ∑ ŷ i2 = ∑ ( Y
ˆ −Y
i
ˆ )2
=∑ Y
ˆ 2 − nY 2 = Y
i
ˆ 'Y
ˆ − NY 2 = βˆ ' X' Xβˆ − N Y 2
Demostración:
Y = ( Xβˆ + e )
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
97
SCT= SCE+SCR ⇒ es decir que en el modelo múltiple también es posible dividir la suma
de cuadrados totales en dos partes, una explicada por el modelo y otra residual.
Dado:
βˆ = ( X' X) −1 X' Y
(*) Es equivalente a:
( )
Y' Y = ( X' X) −1 X' Y ' X' Y + e' e = Y' X (X' X) −1 X' Y + e' e
El modelo en desvíos.
Yi = βˆ 1 + βˆ 2 X i2 + βˆ 3 X i3 + ........ + βˆ k X ik + e i (1)
Σ Yi ΣX i2 ΣX i3 Σ X ik Σe i
= βˆ 1 + βˆ 2 + βˆ 3 + ........ + βˆ k +
n n n n n
Y = βˆ 1 + βˆ 2 X 2 + βˆ 3 X 3 + ........ + βˆ k X k
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
98
βˆ 1 = Y − βˆ 2 X 2 − βˆ 3 X 3 − ........ − βˆ k X k (2)
Yi = (Y − βˆ 2 X 2 − ........ − βˆ k X k ) + βˆ 2 X i 2 + ........ + βˆ k X ik + e i
Yi = Y − βˆ 2 X 2 − ........ − βˆ k X k + βˆ 2 X i2 + ...... + βˆ k X ik + e i
Yi − Y = βˆ 2 ( X i2 − X 2 ) + βˆ 3 ( X i3 − X 3 ) ........ βˆ k ( X ik − X k ) + e i
Y1 − Y y 1 X 12 − X 2 . X1k − X k x 12 . x 1k
Y − Y y 2
. .
2 X − X . . X 2 k − X k x 22 . . x 2 k
y= . = . x n×( k −1) = 22 2
=
. . . . . . . . . .
Yn − Y y n X n2 − X 2 . . X nk − X k x n 2 . . x nk
βˆ 2
ˆ
β
ˆβ*( k−1)×1 = 3
.
ˆ
β k
Con lo que y = x βˆ * + e
ŷ = x βˆ *
e = y − ŷ = y − x βˆ *
e' e = ( y − xβˆ * )' ( y − xβˆ * ) = y ' y − y ' xβˆ * − βˆ * ' x ' y + βˆ * ' x ' xβˆ * = y' y - 2βˆ * ' x ' y + βˆ * ' x ' xβˆ
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
99
∂e' e
= − 2x ' y + 2x ' xβˆ * = 0
∂βˆ
βˆ * = ( x ' x ) −1 x' y
Es decir que la fórmula de calculo de los estimadores no cambia al utilizar las variables en
desvíos respecto a la media. A esto debe agregarse:
βˆ 1 = Y − βˆ 2 X 2 + βˆ 3 X 3 + ........ + βˆ k X k
y' y = ( xβˆ * + e )' ( xβˆ * + e) = (βˆ * x '+e ' )( xβˆ * + e) = βˆ * ' x ' xβˆ * + βˆ * ' x ' e + e' xβˆ * + e' e = βˆ * ' x ' xβˆ * + e' e
SCT = y' y
*
SCE = ŷ' ŷ = βˆ ' x ' x βˆ y ' y = βˆ * ' x ' x βˆ * + e' e = SCE + SCR
*
SCR = e' e
Notar que cuando las variables están expresadas en desvíos, no es necesario restar el
término n Y 2 para el cálculo de la suma de cuadrados totales y de la suma de
cuadrados explicados.
Coeficiente de determinación: R2
SCE βˆ ' X ' X βˆ − n Y βˆ ' X ' Y − n Y βˆ ' x ' xβˆ βˆ ' x ' y
2 2 * *
R2 = = = = =
SCT Y' Y − n Y 2 Y' Y − n Y 2 y' y y' y
El R2 corregido.
2
El R múltiple tiene un problema
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
100
(1) Yi = β 1 + β 2 X i 2 + µ i
(2) Yi = β 1 + β 2 X i 2 + β 3 X i3 + µ i
Sin embargo, sólo por agregar una nueva variable (“algo explica”), la SCR2 disminuye,
provocando un aumento R2 cuando aumenta k. Por esta razón, para comparar el R2 de dos
regresiones, estas deben tener igual numero de variables.
2
Para evitar este problema se define un R corregido por grados de libertad
e' e e' e
R 2c = 1 − n −k = 1− n −k
Y' Y − nY 2 y' y
n −1 n −1
e' e n −1 n −1
R 2c = 1 − • = 1 − (1 − R 2
)
n − k Y' Y − n Y 2 n−k
n −1
= R 2 − R 2 + 1 −
(1 − R )
2
n −k
n −1 n −1
= R 2 + (1 − R 2 ) − 2
(1 − R ) = R + (1 − R ) 1 −
2 2
n−k n −k
n − k − n +1 2 k −1
= R 2 + (1 − R 2 ) = R − (1 − R )
2
n−k n −k
2 k −1
R C = R − (1 − R )
2 2
n −k
1−k 2 1− n
Otra formula: R 2c = +R
n −k n−k
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
101
Y
Yi = β 1 + β 2 X i + µ i
*
Y *
X X
∑e 2
i = 0 , con lo que R 2 = 1 −
Σy
= 1 . Esto significaría un ajuste perfecto, sin embargo,
i
2
1
Algunas propiedades:
i) R C2 < R 2 , son iguales cuando la correlación es perfecta.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
102
2
3. Homocedasticidad y no autocorrelación E(µµ’) = σ I
0 i≠j
COV(µi, µj)= E (µ i µ j ) = 2
σ i = j
5. ui ~ N(0, σ2 ) ∀i 2
u ~ N(0, σ I)
Explicación
1. Todo nuestro análisis está condicionado a conocer X que se supone se mantiene fija
en distintas muestras. Esto implica que la única fuente de variación de Y viene dada
por µi. Este supuesto se puede relajar suponiendo X estocásticos, pero
independientes de µ.
2. E (µ ) = 0
µ 1 E( µ 1 ) 0
µ 2 E (µ 2 ) 0
E (µ) = E = = = 0 nx1
. . .
µ E( µ ) 0
n n
Esto permite calcular:
E(Y/X) = E(Xβ + µ) = Xβ + E(µ) = Xβ
Es decir que se cometen errores pero en promedio estaremos sobre el plano de
regresión.
2
3. E(µµ‘) = σ I
En general
Varianza de X = E [( X − E( X))( X − E (X))' ] = E [(X − µ)( X − µ )'] =
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
103
X1 − µ
X 2 − µ
= E . (X1 − µ X 2 − µ . . X n − µ )
.
X − µ
n
( X − µ) 2 ( X − µ )( X − µ) ( X − µ)( X − µ )
1 1 2
. .
1 n
. ( X − µ) 2 . . .
2
=E . . . . .
. .
(X − µ ) 2
n
E( X − µ ) 2 E (X − µ)( X − µ) E( X − µ)( X − µ )
1 1 2
. .
1 n
. E( X − µ ) 2 . . .
2
= . . . . .
. .
E( X − µ) 2
n
VAR (X 1 ) Cov (X 1 , X 2 ) … Cov ( X1 , X n )
Cov ( X 1 , X 2 ) .
= . =matriz varianza y
.
VAR ( X n )
covarianza
µ 1 µ 12 µ 1µ 2 . . µ 1µ n
µ 2 µ 22
E(µµ‘) = E . (µ 1 µ2 . . µ n ) = E .
. .
µ 2
µn
n
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
104
E( µ 12 ) E (µ 1µ 2 ) . . E(µ 1µ n ) σ 2 0 . . 0 1 0 . . 0
0 1
E(µ 22 ) σ2
= . = . = σ2 1
. . . 0
E (µ n )
2
σ 2 0 1
E(µµ‘)=σ2 Inxn
4. El rango de X es k.
Este es un requisito que permite invertir X’X y que es necesario para obtener
estimadores MICO β̂ en forma única.
Propiedades:
⇒ El número máximo de filas LI es igual al número máximo de columnas LI
⇒ Rango (Am×n )≤ min (m,n)
⇒ Rango A=Rango A’
⇒ Si rango Am×n =m=n, entonces A es no singular y su inversa existe y es única.
⇒ Rango (X’X) = Rango (XX’) = Rango de X
2
5. µ ~ N (0, σ I) es normal multivariante.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
105
3.5.1 Linealidad
βˆ = ( X' X) −1 X' Y
3.5.2 Insesgamiento
βˆ = ( X' X) −1 X' Y
βˆ = ( X' X) −1 X' ( Xβ + µ )
βˆ = β + (X' X) −1 X' µ
[
E (βˆ ) = E(β) + E ( X' X) −1 X' µ ]
E (βˆ ) = β + (X' X) −1 X' E (µ)
E (βˆ ) = β Es insesgado
3.5.3 Eficiencia
3.5.3.1 Matriz de Varianzas y Covarianzas.
( ) (
= E (X ' X ) −1 X ' µ) (( X ' X ) −1 X' µ )' = E ( X ' X ) −1 X ' µµ' X (X ' X ) − 1 )
= ( X ' X ) −1 X' E(µµ ' ) X ( X ' X ) −1 = ( X ' X ) −1 X ' σ 2 I X ( X ' X ) −1 = σ 2 ( X ' X ) −1 X ' X ( X ' X ) −1 =
⇓
I
−1
Var - Cov(βˆ ) = V(βˆ ) = σ ( X' X) 2
1 X1
. .
1 . . 1
X = . .
1
V(βˆ ) = σ 2 (X' X) −1 X' =
X1 X2 . . X n
. .
1 Xn
1 X 1
1 . .
X' X =
1 . . 1
. . =
n ∑X i
X1 . . X n ∑ X i ∑X 2
.
X2
.
i
1 X n
∑ X 2i − ∑X i
1
( X' X) −1 = =
n ∑ X 2i − ( ∑ X i ) 2
− ∑ Xi n
∑ X 2i − ∑ Xi ∑ X 2i − ∑ Xi
σ 2 σ2
V(βˆ ) = =
n ∑ X 2i − ( ∑ X i ) 2 n ∑ X 2i − ( nX) 2
− ∑ Xi n − ∑ Xi n
∑ X 2i − ∑ Xi ∑ X 2i − ∑ Xi
σ 2 σ2
V(βˆ ) = =
n (∑ X 2
i − nX 2 )
− ∑ Xi n
n ∑ x 2i
−∑ X i n
107
σ2 σ 2 ∑ X i σ 2 ∑ X 2i σ 2 X
n ∑ x i2 ∑ i
X2 − −
n ∑ x 2i n ∑ x i2 n ∑ x 2i
V(βˆ ) = =
− σ 2 ΣX i
2
σ 2
σ2 X σ2
n −
n∑ x i n ∑ x i2 n ∑ x 2i ∑ i
x 2
Al igual que en el caso simple tanto las varianzas como las covarianzas dependen de σ2 ,
parámetro poblacional desconocido que es necesario estimar.
3.5.3.2 Un estimador de σ2
Debemos estimar σ2 , la varianza del término de error. Como los valores de µ no se pueden
observar, el estimador se basará en los residuos e.
Sabemos que:
e = Y − X( X' X) −1 X' Y , con lo que se puede sacar Y de post-factor común, de forma que:
( )
e = I − X( X' X) −1 X' Y , y definiendo M = I − X( X' X) −1 X' , luego:
e = MY
♦ Es cuadrada (n×n)
♦ Es no estocástica
♦ Es simétrica (M’=M)
( )
M ' = I − X( X' X) −1 X' ' = I '− X( X' X) −1 X' = M
♦ Es idempotente (M.M=M)
( )(
MM = I − X(X' X) −1 X' I − X( X' X) −1 X' = )
= I − X( X' X) −1 X'− X(X' X) −1 X'+X( X' X) −1 X' X( X' X) −1 X'
♦ MX=0
108
e = MY = M (X β + µ) = MX β + M µ = Mµ
a 11 a 12 . . a 1n µ 1
a 21 a 22 . . a 2n µ 2
E (e' e) = E(µ' Mµ) = E (µ 1 µ2 . . µ n ) . . =
. .
a n1 a n2 a nn µ n
µ1
µ 2
= E (∑ µ i a i1 ∑ µ i a i2 . . ∑ µ i a in ) . = E(µ 1 ∑ µ i a i1 + µ 2 ∑ µ i a i2 + ... + µ n ∑ µ i a in )
.
µ n
= E[µ 1 (µ 1a 11 + µ 2 a 21 + ... + µ n a n1 ) + µ 2 ( µ 1a 12 + µ 2 a 22 + ... + µ n a n 2 ) + ... + µ n (µ 1a 1n + µ 2 a 2n + ... + µ n a nn ) ]
• Tr(A±B)=Tr(A) ±Tr(B)
• Tr(ABC)=Tr(CBA)=Tr(BAC)
[ ( )] [ ]
= σ 2 Tr ( I n − X( X' X) −1 X' ) = σ 2 Tr (I n ) − Tr X( X' X) −1 X' = σ 2 n − X' X( X' X) −1 =
= σ 2 [n − Tr ( I k ) ] = σ 2 [n − k ]
Con lo que :
E (e' e ) = E(µ ' Mµ) = σ 2 [n − k ]
e' e
Luego si definimos: σˆ =
2
, tendremos un estimador de la varianza del término de
n−k
perturbación que cumple la propiedad de ser insesgado. Esto porque:
e'e 1 1
E (σˆ ) = E = E(e ' e ) = σ (n − k ) = σ
2 2 2
n −k n − k n −k
c. Calculemos la varianza de β*
• β * -β = (X' X) −1 X' µ + Cµ
Luego,
[
V(β*) = E[ (β * − β) (β * − β)'] = E (( X' X) −1 X'µ + Cµ ) (( X' X) −1 X'µ + Cµ )' ]
[
V(β*) = E (( X' X) −1 X' µ + Cµ) (µ' X( X' X) −1 + µ ' C' ) ]
[
V(β*) = E ( X' X) −1 X' µµ' X( X' X) −1 + ( X' X) −1 X' µµ ' C'+Cµµ ' X(X' X) − 1 + Cµµ ' C' ]
V(β*) = ( X' X) −1 X' E( µµ' ) X(X' X) −1 + ( X' X) −1 X' E( µµ' )C'+CE(µµ ' ) X( X' X) −1 + CE(µµ' ) C'
Recordando que E(µµ‘)=σ2 I
V(β*) = σ 2 ( X' X) −1 X' X( X' X) −1 + σ 2 ( X' X) −1 X' C'+σ 2 CX( X' X) −1 + σ 2 CC'
Dado que CX=0 y simplificando, obtenemos:
V(β*) = σ 2 ( X' X) −1 + σ 2 (X' X) −1 X' C'+σ 2 CX( X' X) − 1 + σ 2 CC'
∑ c12i ∑c c . . ∑c c ki
1i 2i 1i
∑ c1i c 2i ∑c 2
2i . . ∑c 2 i ki
c
CC' = . . . .
. . . .
∑ c1i c ki ∑c 2i c ki . . ∑ c 2ki
3.5.4 Consistencia
Sabemos que :
3.6.1 Distribución de β̂
βˆ = β + ( X' X) −1 X' µ , con lo que β̂ por ser combinación lineal de variables aleatorias es
también una variable aleatoria que se distribuye normal multivariante.
Esperanza: E (βˆ ) = β
a 11 a 12 . . a 1k
a 12 a 22
2
Varianza: V(βˆ ) = σ 2 ( X' X) −1 =σ .
.
a a kk
1k . . .
1
µ' µ ~ χ 2n
σ 2
µ' ( σ 2 I ) −1 µ ~ χ 2n
113
Este resultado, nos sirve para recordar como se forman las distribuciones derivadas de una
normal multivariante. Sin embargo, tampoco es útil por si mismo ya que no conocemos µ.
e' e
3.6.3 Distribución de
σ2
Hemos visto los siguientes resultados:
• e = Mµ , como u ~ N (0, σ 2 I ) , por lo que e también se distribuye normal.
• e' e = µ' Mµ
• M = I − X( X' X) −1 X' , siendo simétrica e idempotente.
• Tr(M)=Rg(M)=n-k . Como M es idempotente de aquí se deriva que M tiene n-k
valores propios.
• Sea B una matriz que tenga por columnas los vectores propios de M y D una matriz
que tiene los valores propios en la diagonal y cero en el resto.
| | | λ1 0 0
| | | 0 λ2 0
B= x 1 x2 . . x n y D= 0
0 . 0
| | | 0 0 . 0
| 0 λ n
| | 0
Sabemos que:
⇒ B’B=BB’=In
⇒ B ' MB = D
⇒ Dado que los valores propios de una matriz idempotente son cero o uno,
sabemos que D tiene n-k valores propios 1 y k valores propios igual a cero.
1 0 . . . . 0
0 1 . .
. . . .
I n −k 0 k
D= . 1 =
. 0 k 0 k
0
. .
0 . . . . . 0
Definamos:
y= B’µ
Luego, premultiplicando por B tenemos que, By=B B’µ=Iµ
µ = By
114
Dado que y= B’µ, y será una variable que se distribuye normal multivariada.
yi
Es decir que y ~ N (0, σ2 I) , con lo que cada ~ N(0,1) se distribuye normal tipificada e
σ
independiente.
Sabemos que:
e' e = µ' Mµ = y ' B
1'23y =
MB
D
1 0 . . . . 0 y 1
0 1 . . y 2
. . . . .
= ( y1 y2 . y n −k y n −k +1 . y n ) . 1 y n − k
. 0 y
n − k +1
. . .
0 . . . . . 0 y n
n− k
= y 12 + y 22 + ....y 2n − k + 0 + .... + 0 = ∑ y i2
1
n −k
e' e = ∑ y 2i
1
n− k 2
y y
Como i ~ N(0,1) , luego
σ
∑1 σi ~ χ 2n -k
n −k
y 2n − k ∑
y 2i
y12 y 22
⇒ 2 + 2 + ..... 2 = 1 2 ~ χ 2n- k
σ σ σ σ
115
e' e
⇒ ~ χ n2- k
σ2
Pruebas Individuales
Tenemos:
βˆ i − β i
i) ~ N ( 0, 1) pero σ es desconocida
σ a ii
e' e e ' e /( n − k )
ii) = (n − k ) ~ χ 2
σ σ 2
2 n -k
Definimos:
βˆ i − βi βˆ i − βi
σ a ii a ii βˆ − βi
t= = = i ∼ t n-k
e' e σˆ σˆ a ii
σ2
n−k
H0 : β 2 = β 3 =............= β k = 0
H1 : Algún β i distinto de 0
i) SCE/σ2 ∼ χ k2-1
116
e' e SCR
ii) = 2 ~ χ n2- k
σ 2
σ
iii) Puede demostrarse que i) y ii) son independientes.
0 Fα
Este test indica que el modelo es significativo en su conjunto, si el "efecto explicado por el
modelo" es suficientemente grande respecto al "ruido", a lo residual. Si el F calculado es
mayor que el F de tabla, rechazo que β 2 = β 3 =............= β k = 0, o sea el "aporte de las X"
respecto al residuo es considerable. ¿Cuán considerable? El límite nos lo da el valor de
tabla.
TABLA ANOVA
Variación Suma de Cuadrados Grados de Libertad Suma Promedio de
Cuadrados
Regresión SCE k-1 SCE/(k-1)
Residuo SCR n-k SCR/(n-k)
Total SCT n-1 SCT/ (n-1)
117
Grados de Libertad
Asociado a cada suma de cuadrados hay grados de libertad; (valores que pueden elegirse
arbitrariamente).
Suma de cuadrados Totales (SCT): tiene n-1 grados de libertad. Esto surge como
consecuencia de la pérdida de un grado de libertad, necesario para calcular Y .
Suma de cuadrados residuales (SCR): tiene n-k grados de libertad. Se pierden k grados de
libertad que son necesarios para asegurar que se cumplan las ecuaciones normales. Estas
condiciones son:
1 1 . . 1 e1 ∑ e i 0
X12 X 22 . . X n 2 e 2 ∑ e i X i2 0
X' e = . . . . . e 3 = ∑ e i X i3 = 0
. . . . . . . .
X 1k
X 2k . . X n k e n ∑ e i X ik 0
Suma de cuadrados explicados (SCE): tiene k-1 grados de libertad ya que se encuentra en
función de todos los parámetros estimados, excepto el intercepto.
Ejemplo 1:
Si queremos testear
H0 : β2 = 0
H1 : β 2 ≠0
H0 : Cβ = r
H1 : Cβ ≠ r
118
donde C = [0 1 0]
β1
Cβ = [0 1 0] β 2 = β 2
β 3
r=0
Ejemplo 2:
Si queremos testear
H0 : β 2 +β 3 = 1
H1 : β 2 +β 3 ≠ 1
H0 : Cβ = r
H1 : Cβ ≠ r
donde C = [0 1 1]
β1
Cβ = [0 1 1] β 2 = β 2 + β 3
β 3
Ejemplo 3:
Si queremos testear
119
H0 : β2 = β3
H1 : β2 ≠ β3
H0 : Cβ = r
H1 : Cβ ≠ r
donde C = [0 1 -1]
β1
Cβ = [0 1 − 1] β 2 = β 2 - β 3
β 3
r=0
Ejemplo 4:
H0 : β2 = β3 = 0
H1 : Algún β i distinto de 0
β1
0 1 0 β 2
Cβ = β
2 = β
0 0 1 β 3
3
0
r=
0
Ejemplo 5:
lnYi = β 1 + β 2 lnLi + β 3 lnKi + β 4 lnZi + β 5 lnWi + µi
120
H0 : β4 = β5 = 0
H1 : Algún β i distinto de 0
β1
β
0 0 0 1 0 β4
2
Cβ = β3 =
0 0 0 0 1 β β5
4
β 5
0
r=
0
Sabemos que:
βˆ ~ N ( β , σ 2 ( X ' X ) −1 )
E (Cβˆ ) = CE(βˆ ) = Cβ
V( Cβˆ ) = E[Cβˆ − Cβ)( Cβˆ − Cβ)'] = E[(Cβˆ − Cβ)(βˆ ' C' − β' C' ) ] =
E[C(βˆ − β)(βˆ ' − β' )C'] = E[C(βˆ − β)(βˆ − β)' C'] =
CE[(βˆ − β)(βˆ − β)'] C' = σ2 C( X' X) −1 C'
i. [
( Cβˆ − r )' σ 2 C( X' X) −1 C' ]−1
( Cβˆ − r ) ~ χ 2R [Estamos sumando R normales(0,1)
elevadas al cuadrado]
σˆ 2 ( n − k ) e ' e
ii. = 2 ~ χ 2n − k
σ 2
σ
Entonces:
[
(Cβˆ − r )' σ 2 C( X' X) −1 C' ]−1
( Cβˆ − r ) / R
~ FR , n −k
e' e
σ (n − k )
2
1
(Cβˆ − r )' ( σˆ 2 C(X ' X ) −1 C' ) −1 (Cβˆ − r ) ~ FR , n − k
R
α
Rech H 0si F calculado > F
de tabla
Volvamos al Ejemplo 1
H0: β 2 = 0
H1: β 2 ≠ 0
C = [0 1 0]
r=0
R=1
122
1
(Cβˆ − r )' (σˆ 2 C( X ' X ) −1 C' ) −1 ( Cβˆ − r ) ~ FR , n − k
R
a 11 a 12 a 13 0
−1
2
βˆ 2 σˆ (0 1 0) a 21 a 22 a 23 1 βˆ 2 ~ F1, n − 3
a a
31 32 a 33 0
−1
0
βˆ 2 σˆ (a 21 a 22 a 23 ) 0 βˆ 2 ~ F1, n − 3
2 1
[
βˆ 2 σˆ 2 a 22 ]
−1
βˆ 2 ~ F1, n − 3
βˆ 22
~ F1,n−3
σˆ 2 a 22
[
~e ' ~e − e' e = (Cβˆ − Cβ)' C( X' X) −1 C1 ]
−1
(Cβˆ − Cβ)
~e ' ~e e' e
~ χ 2n −( k −R ) y ~ χ 2n −k
σ 2
σ 2
~e ' ~e − e' e
Por lo que ~ χ 2n −( k − R ) − ( n − k) = χ2R
σ 2
~e ' ~e − e ' e
• ~ χ 2R
σ 2
~e ' ~e − e' e
/R
e' e
• 2 ~ χ n− k
2 σ2
~ FR , n− k
σ
e' e
/n −k
σ2
• independie ntes
Con lo que:
123
e − e' e) / R
(~e ' ~
~ FR , n − k
e'e / n − k
Etapas:
1. Se estima regresión restringida (imponiendo que se cumpla la hipótesis nula) y se
obtiene la SCR restringida → e˜' ˜e
2. Se estima regresión libre (sin imponer que se cumpla la hipótesis nula) y se obtiene
la SCR libres→ e' e'
( ~e ' ~e − e' e) / R
3. Se calcula el estadístico F =
e' e /( n − k )
Si F > FTABLA rech H0 (Rech que la restricción sea valida si la suma se reduce mucho al
calcular dicho estadístico)
rech H 0
•
Mediante el coeficiente de determinación, R2
=
[(1 − R~ ] [
) − (1 − R 2 ) / R 1 − R
2
=
~ 2 −1 + R 2 / R ]
(1 − R 2 ) /( n − k) (1 − R 2 ) /( n − k )
(R 2 − R ~2)/R
= ~ FR , n− k
(1 − R 2 ) /( n − k )
Tenemos la hipótesis a priori que la función de producción difiere según períodos; por
ejemplo:
1960-74 → β1I , β I2 , β I3
1975-97 → β 1 , β 2 , β 3
II II II
YI = XI β I + µI
YII= XIIβ II + µII
H 0 : β I = β II
H 0 : β I ≠ β II
Modelo restringido: los parámetros del primer período coinciden con los del segundo.
YI X
I
Y = X β + µ ⇒ = II β + µ
YII X
Es decir se supone que hay un solo modelo a lo largo del período y se obtiene SCR
restringida, ~e ' ~e
Modelo libre (no restringido):
Se corren dos regresiones: una para el primer período y otra para el segundo.
YI X I 0 β I µ I
Y = 0 +
X II β II µ II
II
Luego:
~e ' ~e − e ' e
R ~ Fk, n − 2k
e' e
n − 2k
Grados de Libertad
Numerador: R = número de restricciones (k, se impone que los k parámetros sean iguales
entre períodos).
También puede deducirse como: gl de ~e ' ~e - gl de e'e
gl de ~e ' ~e = n - k
gl de e'e = gl de (e'e)I + gl de (e'e) II = n1 – k + n2 – k = n1 + n2 – 2k = n-2k
gl numerador = n - k – (n-2k ) = k
El Test de Chow es un caso particular del test de cambio estructural. Chow discutió dos
situaciones peculiares: nII = k y nII< k.
3 1 3 5
1 1 4 −8
1 26.7 4.5
Y = 8 X = 1 5 6 , luego ( X' X) −1 = 4.5 1 − 1.5
3 1 2 4 − 8 − 1.5 2.5
5 1 4 6
Ejemplos:
1. Significación conjunta de X2 y X3
Ho: β 2 =β 3 =0
SCE 26.5
F= k − 1 = 3 −1 = 17.67
SCR 1.5
n−k 5−3
Ho: β 3 =0
Una forma de probarlo es con un test de hipótesis simple. Observando la salida de E-Views
se concluye que este parámetro es no significativo.
127
Otra forma de probar esto es estimando la regresión restringida (es decir aquella donde se
supone válida la hipótesis nula).
LS // Dependent Variable is Y
Included observations: 5
Variable Coefficient Std. Error t-Statistic Prob.
C -0.800000 0.938083 -0.852803 0.4564
X1 1.600000 0.282843 5.656854 0.0109
R-squared 0.914286 Mean dependent var 4.000000
Adjusted R-squared 0.885714 S.D. dependent var 2.645751
S.E. of regression 0.894427 Akaike info criterion 0.066031
Sum squared resid 2.400000 Schwarz criterion -0.090194
Log likelihood - 5.259770 F-statistic 32.00000
Durbin-Watson stat 1.366667 Prob(F-statistic) 0.010938
−1
βˆ 1 20.02 3.37 − 6 0 βˆ 1
1
F= (0 1 1) βˆ 2 − 0 ' ( 0 1 1) 3.37 0.75 − 1.125 1 (0 1 1) βˆ 2 − 0
1 βˆ − − 1 βˆ
3 6 1 . 125 1 . 875 3
128
−1
0
(2.5 − 1.5 )' (3.37 − 6 0.75 − 1.125 − 1.125 + 1.875) 1
(2.5 −1.5 )
1
12
F= 1[0.75 −1.125 − 1.125 + 1.875]−11 = = 2.66
0.375
Dado que el valor del test F es muy pequeño, rechazo la hipótesis nula.
1
Sabemos que (Cβˆ − Cβ)' ( σˆ 2 C( X ' X ) −1 C' ) −1 (Cβˆ − Cβ) ~ FR , n− k , luego podemos utilizar
R
este resultado para construir regiones de confianza de los test. Distintas especificaciones de
R, darán diferentes regiones de confianza para grupos de parámetros.
Supongamos que nos interesa conocer la región en que se cumple que β 2 y β 3 son
conjuntamente significativos.
Ho: β 2 =β 3 =0
Luego,
0 1 0
C = y R=2
0 0 1
( Cβˆ − Cβ)' ( C(X ' X) −1 C' ) −1 ( Cβˆ − Cβ)
1 R
F= (Cβˆ − Cβ)' (σˆ 2 C( X' X ) −1 C' ) −1 ( Cβˆ − Cβ) =
R e' e
n −k
−1
βˆ1 β1 26.7 4.5 − 8 0 0 βˆ β
0 1 0 0 1 0 0 1 0 1 1
βˆ 2 − β2 ' 4.5
1 − 1.51 0 βˆ 2 − β2
0 0 1
βˆ 3 β3 0 0 1 − 8 − 1.5 2.5 0 1 0 0 1 βˆ β
3 3
F= 2
0.75
−1
0 0
− 1.5 βˆ 2 − β 2
F=
1 ˆ
(β 2 − β 2 βˆ 3 − β 3 )
4.5 1
1 0
1.5 − 8 −1. 5 2.5 0 1 β
ˆ
3 − β 3
129
−1
1 − 1.5 βˆ 2 − β2 1 10 6 βˆ 2 − β2
F=
1 ˆ
(β2 − β2 βˆ 3 − β3 ) βˆ − β = 1.5 (2.5 − β2 − 1.5 − β3 ) 6 4 βˆ − β
1.5 −1.5 2.5 3 3 3 3
β3
β̂ 2
El origen (0,0) se encuentra dentro de la elipse, lo que significa que, con un 95% de
confianza, no se puede rechazar la hipótesis de que ambos parámetros son cero en forma
conjunta.
130
Es importante observar :
• que los límites que se obtienen en forma conjunta para β̂ 2 y β̂ 3 son distintos a los que se
obtienen en intervalos de confianza individuales. Es perfectamente posible que
utilizando test individuales se concluya que los parámetros son individualmente no
significativos, pero testeando conjuntamente la hipótesis de que ambos parámetros son
cero esta sea rechazada por obtener un elipse tal que el punto (0,0) este fuera de la
misma. En ese caso uno puede decir que al menos uno de los parámetros tiene
suficiente influencia sobre la variable explicativa, pero no puede asignar esa influencia
a uno de los parámetros en particular.
131
3.6 PREDICCION
Yˆ i = βˆ 1 + βˆ 2 X i2 + βˆ 3 X i3 + . . . + βˆ k X ik i = 1 ....... n
Ŷn×1 = X n× k βˆ k×1
Ŷ i = βˆ 1 + βˆ 2 X 02 + βˆ 3 X 03 + . . . + βˆ k X 0 k
• E (Y0 / X0 ) = E (β + β2X02 + … + βk X0 k + u 0 )
= β1 + β2X02 + … + βk X0 k + E( u0 ) = β1 + β2X02 + … + βk X0 k
= β1 + β 2X 02 + … + β k X0 k
132
El punto clave es realizar una proyección correcta de las variables explicativas y verificar si
es correcto usar βˆ i históricos hacia adelante.
Que E( Ŷ0 ) = E(Y0) (no hay sesgo), no implica que no exista error de predicción,
e 0 = β1 + β2 X 02 + … + β k X 0 k + u 0 − βˆ 1 − βˆ 2 X 02 ……βˆ k X 0k
e 0 = X '0 (β − βˆ ) + u 0
1 xk kx 1 1x1
• ¿Cuál es la varianza de e 0 ?
V(e0 ) = V ( X '0 (β − βˆ ) + u 0 )
[ ] [
= V X '0 (β − βˆ ) + V ( u 0 ) + 2 Cov X '0 (β − βˆ ) u 0 ]
La covarianza está en función de dos variables aleatorias (β̂ y µ0 ). β̂ es función de los (i=1
hasta n) y µ0 es un error aleatorio posterior a n. Por lo tanto, COV (µi,µ0 )=0 por el supuesto
[
de no autocorrelación de los errores y Cov X '0 (β − βˆ ), u 0 =0 ]
[ ]
= V X '0 (β − βˆ ) + σ 2
= X '0 V (βˆ ) X 0 + σ 2
= X '0 • σ 2 ( X ' X ) −1 X 0 + σ 2
133
[ ]
= σ 2 X '0 ( X ' X ) −1 X 0 + 1
• ¿Cómo se distribuye e 0 ?
e 0 = X'0 (β − βˆ ) + u 0
u ~ N (0, σ2 I)
βˆ ~ N (β, σ 2 ( X' X) −1 )
[
e 0 ~ N 0, σ2 ( X '0 ( X ' X ) −1 X 0 + 1) ]
e 0 ~ N [0, V (e 0 )]
e0 − E( e0 )
~ N( 0, 1)
DS( e0 )
e' e e0
σˆ =
2
~ tn − k
n −k −1
σˆ X0 ( X' X) X0 + 1
'
σˆ 2
( n − k ) ~ χn − k
2
σ 2
e0
Con lo que ~ t n −k
DSˆ(e 0 )
INT( e 0 ) = ± t α / 2 • DS(ˆe 0 )
134
1 ( X 0 − X)
2
Y0 = Ŷ0 ± t α / 2 σˆ 1 + +
N ∑ x i2
En algunos casos interesa predecir E ( Ŷ / X)
E (Y0 ) = X '0βˆ
[ ]
V ( e 0 ) = V X '0 (β − βˆ ) = X '0 σ 2 (X ' X ) − 1 X 0 = σ 2 X '0 (X ' X ) − 1 X 0
135
βˆ 2 − β2
~ t n −2
DS (ˆβˆ )
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
136
Ni
E(Ni)
β1 + β 2 con β2 > 0
β2
β1
Observación
E(Ni /mujer) = E(Ni / Si =1) = β 1 + β 2 + β 3 PPAi (nota esperada para una mujer)
nota
β 1 + β 2 + β 3 PPA i Supuestos:
β2 > 0
β 1 + β 3 PPA i β 3 igual para ambos sexos
β2
PPAi
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
137
La nota en econometría podría ser función del sexo y de la nacionalidad (por ejemplo
extranjero versus chileno).
0 si el alumno es chileno
Ei =
1 si el alumno es extranjero
E(Ni /hombre, chileno) = E(Ni / Si =0, Ei =0) = β 1 (nota esperada para un hombre
chileno)
E(Ni /hombre, extranjero) = E(N i / Si =0, Ei =1) = β 1 + β 3 (nota esperada para un hombre
extranjero)
E(Ni /mujer, chilena) = E(Ni / Si =1, Ei =0) = β 1 + β 2 (nota esperada para una mujer
chilena)
E(Ni /mujer,extranjera) = E(N i / Si =1, Ei =1) = β 1 + β 2 + β 3 (nota esperada para una mujer
extranjera)
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
138
(β 1 + β 2 ) + (β 3 + β 4 )PPA i
nota
Supuestos:
β2 > 0
β 1 + β 3 PPA i β4 > 0
β2
β1
PPA
1 si el alumno es uruguayo
Ui =
0 en el resto
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
139
Nota
Uruguayo
.Resto
Costa Rica
Uru CR Resto
N i = β1 + β 2 R i + β3 UR i + β 4 CR i + u i
R i UR i CR i
1 1 0 0
1 1 0 0
• 0 1 0
X=
• 0 1 0
• 0 0 1
1 0 0 1
Posibles soluciones
i) Eliminar el intercepto
N i = α 2 R i + α 3 U i + α 4 CR i + u i
N i = δ1 + δ 2 U i + δ 3 CR i + u i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
140
En la alternativa i):
E ( N i / U i = 1, R i = 0, CR i = 0, alumno uruguayo) = α 3
En la alternativa ii):
E ( N i / Ui = 1, R i = 0, CR i = 0, alumno uruguayo) = δ1 + δ 2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
141
700000
650000
600000
550000
500000
450000
400000
350000
300000
250000
200000
86-I
87-I
88-I
89-I
90-I
91-I
92-I
93-I
94-I
95-I
96-I
97-I
98-I
M1A serie original Ciclo Tendencia
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
142
1 ln Y 1 i1 1 0 0 0
1 ln Y 2 i2 0 1 0 0
1 ln Y 3 i3 0 0 1 0
1 ln Y 4 i4 0 0 0 1
1 ln Y 5 i5 1 0 0 0
X =
1 ln Y 6 i6 0 1 0 0
1 ln Y 7 i7 0 0 1 0
1 ln Y 8 i8 0 0 0 1
. . . . . . .
. . . . . . .
. . . . . . .
1 ln Y n in 0 0 0 1
D1 + D2 + D3 + D4 = 1 (las cuatro variables dummy son una combinación lineal que dan
lugar a la columna 1)
Posibles soluciones
i) Eliminar el intercepto
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
143
En este caso si existe estacionalidad en el cuarto trimestre, el efecto será captado por el
intercepto.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
144
H 0 : β I = β II
H 1 : β I ≠ β II
Supongamos que intuimos que hubo cambio estructural en 1974 producto del proceso de
apertura comercial iniciado por el país.
1960-74 → β1I , β I2
1975-97 → β1 , β 2
II II
Podríamos definir:
0 si economía es cerrada ( 60 − 74)
Di =
1 si economía es abierta ( 75 − 97 )
β 2 es el intercepto diferencial
β 4 es la pendiente diferencial
H0 : β 2 = β 4 = 0
H1 : Algún β ι ≠ 0
H0 : β 2 = 0
H1 : β 2 ≠ 0
H0 : β 4 = 0
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
145
H1 : β 4 ≠ 0
Aquí utilizamos 11 dummies para captar estacionalidad por tratarse de datos mensuales.
ECUACIÓN ESTIMADA PARA LA DEMANDA POR DINERO
13.5
0.20 13.0
0.15
12.5
0.10
0.05
12.0
0.00
-0.05
87 88 89 90 91 92 93 94 95 96 97 98
Se percibe que en marzo de 1992 tenemos un residuo anormal: casi 0.15 en circunstancias
que el desvío estándar de la regresión es de 0.023. Existe justificación para controlar ese
residuo anormal a través de la inclusión de una dummy.
1 si i = marzo de 1992
D923 =
0 en el resto.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
146
13.5
13.0
0.06
0.04 12.5
0.02
12.0
0.00
-0.02
-0.04
87 88 89 90 91 92 93 94 95 96 97 98
A primera vista, parecería que el numero de outliers hubiera aumentado. Sin embargo, debe
considerarse que la banda se estrechó producto de la disminución del desvío estándar de la
regresión (desde 0.023 a 0.017).
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
147
5. MULTICOLINEALIDAD
5.1 INTUICIÓN
El estimador MICO de un parámetro específico del vector β, no involucra solamente las
observaciones de la variable correspondientes a ese β, sino también el resto de las variables
independientes.
Esto es porque, para obtener estimaciones precisas de la influencia de una variable sobre
otra, se debe tomar en cuenta la influencia simultánea de las otras variables explicativas.
Hacer esto asegura que el elemento β j refleja la influencia de la variable independiente j,
cuando el efecto de las otras variables se mantiene constante.
• Si el modelo a estimar es Yi = β 1 + β 2 Xi + ui
Y X
Y = variación de Y
X = variación de X
= variación común de Y y X.
• Si el modelo incorpora una variable adicional, generalmente habrá una zona en que
estas dos variables tienen variabilidad común, lo que denominaremos multicolinealidad o
colinealidad ( + ).
Yi = β 1 + β 2 Xi + β 3 Zi + ui
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
148
Esto implica que el área común ahora es desechada, esto es porque no es posible saber
a-priori a qué variable (X o Z) atribuirlo.
• Si las variables X y Z son muy colineales, el área es muy grande y las áreas ( )
y( ) son pequeñas, lo que implica que para estimar β 2 y β 3 se utiliza muy poca
información. Esto provoca que las varianzas estimadas de estos coeficientes son muy
elevadas.
• Si hay colinealidad perfecta entre X y Z, el área común abarca todo el círculo (no
hay área ( ) y ( )esto implica que no es posible hacer estimaciones.
Multicolinealidad perfecta
Es el fenómeno presente cuando tenemos
λ 1X 1 + λ 2X 2 + …… + λ k X k = 0
con algún λ i ≠ 0 ⇒ relación perfecta entre variables Xi.
Ej. :Supongamos el siguiente modelo expresado en desvíos:
y = x 2β 2 + β 3 x 3 + µ − µ donde se tiene que x3 = λ x2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
149
x 12 x 13
x x 23 ∑ x i2
x x 22 • • x n 2
22
2
∑x x i3
i2
x' x = 12 • =
x 13 x 23 x n 3 2
• ∑ x i2 x i3 ∑ x i3
x n 2 x n3
Como x3 = λ x2
∑ x 2i2 ∑x λx i 2
i2 1 λ
x' x = = ∑ x i2
2
x λx
∑ i2 i 2 ∑ (x i 2 λ) 2 λ λ2
( x ' x ) βˆ = ∑ xi 2 =
2
βˆ 3 λ x 2 (βˆ + λβˆ )
λ λ2 ∑ i2 2 3
Por lo que:
∑x 2
i2 (βˆ 2 + λβˆ 3 ) = ∑ x i 2 y
las dos ecuaciones son una y nos permiten estimar :
λ ∑ x 2i2 (βˆ 2 + λβˆ 3 ) = λ∑ x i 2 y
βˆ 2 + λβˆ 3 =
∑ x i2 y
es estimable la combinación, pero no βˆ 2 y βˆ 3 .
∑x 2
i2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
150
x 3 = λx 2
y = β 2 x 2 + β 3 λx 2 + (µ − µ )
y = (β 2 + λβ 3 ) x 2 + (µ − µ )
∑ x i2 y
Si definimos β = β 2 + λβ 3 , el único parámetro que podremos estimar será βˆ =
∑ x 2i2
Multicolinealidad imperfecta
Hay fuerte asociación entre variables explicativas
en la regresión simple: el coeficiente de correlación simple r x1 x2 es alto
Ejemplo:
∑ x 2i 2 ∑x x i3 ∑ x 2i2
i2 ∑x (λˆ x i2 + v i )
i2
x' x = =
x x
∑ i 2 i3 ∑ x i 3 ∑ x i2 (λˆ x i 2 + v i )
2
∑ (x i2 λˆ + v i )
2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
151
x' x =
∑ x 2i2 λˆ ∑ x 2i + ∑ x i 2 v i
λ ∑ x i + ∑ x i 2 v i λˆ 2 ∑ x 2i2 + ∑ v 2i
2
ˆ
y dado que ∑x i2 vi = 0
∑ x i22 λˆ ∑ x i22
x' x =
λˆ ∑ x i2 λˆ ∑ x + ∑ v
2 2 2 2
i2 i
[ ∑x
det x' x = λˆ 2 2
i2 + ∑ v 2i − λˆ 2 ∑ x ]∑ x 2
i2
2
i2 = ∑ x 2i 2 ∑ v 2i
∑ x i22 0
⇒ Supongamos que x2x3 son ortogonales ⇒ x' x =
0 2
∑ x i3
luego, det x' x = ∑ x 2i2 ∑x 2
i3
⇒ Sabemos que ∑v 2
i < ∑x 2
i3 ( porque v i2 es la SCR de la regresión x 3 = λˆ x 2 + v i ) y
siempre SCT> SCR
⇒ Entonces, concluimos que ∑x ∑v <∑x ∑x
2
i2
2
1
2
i2
2
i3 y por tanto el determinante
cuando existe colinealidad es menor que el determinante bajo Ortogonalidad.
A mayor colinealidad ⇒ más pequeños el determinante ( cuanto más grande sea R2, más
pequeño será ∑ v 2i respecto a ∑ x 2i3
¿Por qué importa el determinante?
Porque,
∑ x 2i3 − ∑ x i2 x i 3
−1 1
(x ' x ) =
det( x ' x )
− ∑ x i 2 x i3 ∑ x i2
y este resultado se utiliza no solo para calcular βˆ , sino también para var-cov ( βˆ ).
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
152
Var βˆ 2 =
∑x σ2 2
3
=
σ
2
∑ x ∑ x − (∑ x
2 2
x i3 ) 2 ( ∑ x i2 x i3 ) 2
∑x −
3 2 i2 2
∑x
2 2
i3
σ2 σ2
Var βˆ 2 = =
(n cov ( x 2 x 3 ) )2 n 2 cov( x 2 x 3 ) 2 var x 2
n var x 2 − n var x 2 −
n var x 3 n var x 3 var x 2
cov( x 2, x 3)
y recordando r x 2, x3 =
σ x2σx3
σ2 σ2
Var βˆ 2 = =
(
n var x 2 − n var x 2 rx22 , x3 ) ∑x ( 2
i2 1 − rx22 , x3 ) es decir que la varianza que
En el Modelo General
σ2
V(βˆ j ) = Tarea: demostrarlo
n var ( X j )(1 − R 2j )
Importante:
Esta colinealidad puede compensarse por alta varianza Xi o por elevado n.
Si Xi es de baja varianza, el efecto sobre la varianza será igual al que produce la
colinealidad.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
153
Un modelo con alta correlación ( R2 alto), pero σ2 bajo, puede tener estimaciones
confiables para V( βˆ j ) .
3. Test t se reducen
βˆ j
↑ var (βˆ j ) ⇒ ↑ V(βˆ j ) ⇒ ↓ ⇒ test t bajos .
V(β j )
Que los resultados de los test sean mas bajos no necesariamente quiere decir que
hay que excluir una variable explicativa. Este resultado puede ser efecto de la
multicolinealidad.
Cuidado:
1. A mayor multicolinealidad no implica mayor R2.
2. Alta multicolinealidad no siempre implica test t más bajos, puede
compensarse por otros efectos.
3. No es una condición necesaria, ni suficiente para que exista
multicolinealidad.
⇒ Test sobre R 2j
Se calcula :
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
154
R 2j / k − 2
Fj : ≈ Fk− 2, n− ( k −1)
(1 − R 2j ) / n − ( k − 1)
H 0 : δ 2 , δ 3 , …… , δ k −1 = 0
H i : a lg una diferente a cero
Conclusión:
No hay un test único que me permita detectarlo, además en caso de hacerlo, solo son
medidas de lo mal que están las cosas respecto a la situación ideal.
5.5 FORMAS DE SOLUCIONAR LA MULTICOLINEALIDAD
No hacer nada
Es asumir que la realidad es así, que la muestra utilizada, tiene estos problemas.
Asumir que multicolinealidad es un problema muestral.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
155
σ2
V(β j ) =
n var( x j )(1 − R 2j )
∆Yi = β2 ∆X 2i + β3 ∆X 3i + v i
Ahora explicamos las variables en cambios y no en niveles ⇒correlación disminuye
en cambios.
Para que esto sea aplicable vi debe cumplir supuestos clásicos.
⇒ Yi = β1 + (1 − β 3 ) X 2i + β 3 X 3i + µ i
Y i = β 1 + X 2i − β 3 X 2i + β 3 X 3i + µ i
Yi − X 2i = β 1 + β 3 (X 3i − X 2i ) + µ i
Z i = β1 + β 3 Wi + µ i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
156
ln Yt − 1,02 ln I t = β 1 + β 2 ln Pt + µ t
Si la restricción es válida, soluciono el problema de multicolinealidad.
Pero ajusta: Yi = b 1 + b 2 X 2i + u i
b̂ 2 =
∑x y i i
∑x 2
i
y i = β 2 x 2i + β 3 x 3i + µ i − µ
b̂ 2 =
∑x i2 (β2 x 2i + β3x 3i + u i − u )
=
∑x 2
2i
=
∑ x β + β ∑ x x + ∑ x (u
2
2i 2 3 i2 i3 i2 i − u)
∑x 2
2i
=β +β
∑ x x + ∑ x ( u − u)
i2 i3 i2 i
∑x ∑x
2 3 2 2
i2 i2
β3 ∑ x i2 xi3
E( ˆb2 ) = β 2 +
∑ x2i2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
157
6. HETEROCEDASTICIDAD
Uno de los supuestos clásicos que hemos mantenido hasta ahora es:
E (µ 2i ) = σ 2
o en términos matriciales
E (µµ ' ) = σ 2 I
Es decir que la varianza del término de error es constante ∀ i . Esto se refleja en una
varianza constante para la regresión ⇒ V (Yi ) = σ 2 .
Este supuesto es irreal en algunos casos:
§ En estudios de corte transversal es más fácil imaginar ejemplos donde la varianza del
término de error aumenta (o disminuye) con una variable explicativa. Ello debido a la
convivencia de unidades heterogéneas. Esta heterogeneidad generalmente está asociada
al comportamiento de una o mas variables explicativas.
Ci
•
•
recta de regresión estimada
•
•
•
• •
•
•
•
•
Yi
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
158
errores al tirar
penales •
•
•
•
•
•
•
•
•
•
•
tiempo de aprendizaje
•
•
•
•
•
•
•
•
•
Xi
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
159
Pero con E (µ 2i ) = σ 2i
∑x y = k y = k Y = k
βˆ 2 = ∑ ∑ ∑ (β1 + β 2 X i + µ i ) =
i i
∑x 2 i i i i i
i
βˆ 2 = β ∑k +β ∑k X + ∑k µ
1 i 2 i i i i
• V(βˆ 2 ) = E (βˆ 2 − β 2 ) 2 = E( ∑ k i µ i ) 2 = E( k 12 µ 12 + … + k 2n µ 2n + k 1 k 2 µ 1µ 2 …)
= E( k 12 µ 12 ) + E( k 22 µ 22 ) + …… + E (k 2n µ 2n ) + 0 + ....0 =
= k 12 E( µ 12 ) + k 22 E(µ 22 ) + …… + k 2n E(µ 2n ) = ∑ k i2 σ 2i
123 123 123
σ 21 σ 22 σ 2n
x i 2 ∑ x i2σ2i
2
=∑ 2
σi =
∑ x i ( ∑ x 2i ) 2
σ2
Antes teníamos que V(β 2 ) =
ˆ , por lo que las varianzas de los estimadores
∑ x i2
cambian relajar el supuesto de homocedasticidad.
βˆ = β + ( X' X) − 1 X' µ
• E(βˆ ) = β
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
160
(
V (βˆ ) = E[(βˆ − β)(βˆ − β)'] = E ( X ' X ) −1 X ' µµ ' X (X ' X) −1 = )
= ( X ' X ) −1 X ' E( µµ' ) X ( X ' X ) −1 = ( X ' X ) −1 X ' σ 2 Ω X (X ' X ) −1
= σ 2 ( X ' X ) −1 X ' ΩX (X ' X ) −1
Por lo que:
• El estimador sigue siendo
insesgado.
• Las varianzas deben ser corregidas para incorporar heterocedasticidad.
∑ e 2i
El sesgo surge de que el estimador de σ , σˆ = 2 2 , deja de ser insesgado bajo
n −2
heterocedasticidad.
Esto implica que usar los procedimientos habituales de MICO puede provocar serios
errores. Por eso se utiliza un método alternativo: Método de Mínimos Cuadrados
Generalizados
Se recomienda ver ejercicio 6.18 de la Guía.
6.2. MÉTODO DE MÍNIMOS CUADRADOS GENERALIZADOS
Idea: Utilizar una técnica que presta menos atención a los residuos asociados con
observaciones con alta varianza. Esto se hace asignando menos "peso" a esas
observaciones, dado que éstas dan una indicación menos precisa del lugar donde
pasa la verdadera recta de regresión.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
161
Yi
•
•
•
•
•
•
•
•
•
•
Xi
Partamos del modelo simple:
(1) Yi = β 1 + β 2 X i + µ i
Otra forma de expresarlo es
(2) Yi = β 1 X 0i + β 2 X i + µ i , donde X0i =1 para todo i.
Yi X X µ
(3) = β1 0i + β 2 i + i
σi σi σi σi
( 4) Y i* = β *1 X *01 + β *2 X *i + µ *i
Calculemos ahora la varianza del término de error de la regresión en que los datos
fueron transformados:
2
µ 1 σ2
Var (µ ) = E(µ ) = E i
* * 2
= 2 E(µ 2i ) = i2 = 1
σi σi σi
i i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
162
Yi = βˆ 1* X *01 + βˆ * 2 X*02 + e *i
1
Sea w i =
σ 2i
2
e ei
2
min ∑e *2
= min ∑ i = min
∑σ = min ∑ (w e 2
)
σi
i 2 i i
i
= min ∑w i (Y i − βˆ 1* − βˆ *2 X i ) 2
∂∑ w i e i2
= 2 ∑ w i ( Yi − βˆ *1 − βˆ *2 X i )( −1) = 0
∂βˆ 1
*
∂∑ w i e i2
= 2 ∑ w i ( Yi − βˆ *1 − βˆ *2 X i )( −1) = 0
∂β 2
ˆ *
βˆ *i = Y * − β*2 X *
( ∑ w i )( ∑ w i Yi X i ) − ( ∑ w i X i )( ∑ w i Yi )
βˆ *2 =
( ∑ w i )( ∑ w i X12 ) − (∑ w i X i ) 2
TY = TX β + Tµ = TX β + v
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
163
Ω −1 = T' T (*)
Es decir que T, debe ser una matriz que satisfaga (*)
βˆ MCG = ((TX )' TX ) −1 ( TX )' TY = ( X' T' TX ) −1 X' T ' TY = ( X' Ω −1X) − 1 X' Ω −1 Y
= ( X' Ω −1X) −1 X' Ω −1 ( Xβ + µ) = ( X' Ω −1X) −1 X' Ω −1 Xβ + ( X' Ω −1X) −1 X' Ω −1µ =
= β + ( X' Ω −1 X) −1 X' Ω −1 µ
E (βˆ MCG ) = β
[(
V(βˆ MGB ) = E([(βˆ − β)(βˆ − β)'] = E X' Ω −1X )−1
X' Ω −1µµ ' Ω −1 X X' Ω −1 X ( ) −1
]=
[(
= X' Ω −1 X )+1
(
X' Ω −1E (µµ' ) Ω −1X X' Ω −1 X )−1
] = [(X' Ω −1
X) −1
(
X' Ω −1σ 2 ΩΩ −1X X' Ω −1 X )−1
]=
[(
= σ 2 X' Ω −1X )−1
(
X' Ω −1 ΩΩ −1X X' Ω −1 X ) −1
] = σ (X' Ω
2 −1
X)
−1
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
164
σ i2 = σ 2 X i β e v i
Ln σ i2 = ln σ 2 + β ln X i + v i
ln e i2 = α + β ln X i + v i (i )
• Prueba de Glesjer
Es similar al método anterior pero se realiza testeando con diferentes formas
funcionales:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
165
ei = β 1 + β 2 X i + vi
ei = β 1 + β 2 X i + vi
1
ei = β 1 + β 2 + vi
Xi
1
ei = β 1 + β 2 + vi
Xi
e i = β1 + β 2 X i + v i
Problema:
§ El residuo tiene como propiedades: E(vi) ≠ 0, correlacionado y heterocedástico.
Pero para nuestras grandes pueden ocuparse las 4 primeras formas.
Ventaja: trata de estimar la verdadera forma de la heterocedasticidad.
• Goldfeld - Quant
Yi = β 1 + β 2 X i + µ i
σ i2 = σ 2 X 2i
Pasos:
1. Ordenar las observaciones de acuerdo a Xi
2. Omitir observaciones centrales (c). Nos quedan 2 grupos de
n −c
observaciones cada uno.
2
3. Aplicar MICO a las dos submuestras y obtener SCRI y SCRII
4. Calcular
SCR ii / g de l
λ=
SCR i / g de l
si µ i ~ N y hom ocedástico λ ~ F n −c −2 k
, n − c− 2 k
2 2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
166
• Test de White.
Es válida para n grande.
Pasos:
(1) Aplicamos MICO a la regresión original ⇒ calculo ei.
e 2i = α 1 + α 2 X 2 + α 3 X 3 + α 4 X 2 X 3 + α 5 X 22 + α 6 X 23 + µ i
1) Supongo E (µ 2i ) = σ 2 X 2i
La forma es dividir datos por Xi
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
167
Yi = β 1 + β 2 X i + µ i
Yi β1 µ
= +β2 + i
Xi Xi Xi
Yi 1
= β1 + β 2 + vi
Xi Xi
µ
E ( v i ) = E i = 0
Xi
2
µ 1 2 Xi
2
E ( v ) = E i
2
i
= 2 E(µ i ) = σ
2
2
= σ2
Xi X i X i
2) Supongo E (µ 2i ) = σ 2 X i
Mejor transformación
Yi β1 β2 µi
= + Xi +
Xi Xi Xi Xi
Yi 1 µi 1
= β1 + β2 Xi + = β1 +β2 Xi + v i
Xi Xi Xi Xi
µ
E ( v i ) = E i =0
X
i
2
µ 1
= E µ i
2
X
E ( v i ) = E i = E( µ i2 ) = σ 2 i = σ 2
X ( X )2 Xi Xi
i i
Ejemplo en caso general
Supongamos un modelo de corte transversal
Yt = α + βX t + µ t para t = 1....n
ut homocedástico
Pero solo tenemos acceso a datos agrupados en m grupos con ni observaciones en cada
grupo i.
Yi = α + βX i + µ i
σ2
var( µ i ) =
ni
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
168
1 / n 0 . 0
.
2 0 1/ n2 .
σ Ω=σ
2
. . . .
0 . . 1/ n m
n 1
Ω −1 = n2
n m
T' T = Ω −1
n1
n2
•
T =
•
•
n m
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
169
7. AUTOCORRELACIÓN
7.1 INTRODUCCIÓN
La heterocedasticidad es solo una de las formas en que se puede levantar el supuesto
de E(µµ’) = σ2I. La segunda manera es suponer que los errores presenten estén
correlacionados entre sí ⇒ E(µiµj) ≠ 0 para i ≠ j
Esto provocaría que la matriz de varianzas y covarianzas de los errores presentará términos
distintos de 0 fuera de la diagonal principal:
γ 0 γ1 γ2 …
γ γ0
1
γ •
E (µµ' ) = 2 donde γs = E(µiµi-s )
•
•
γ 0
En lo anterior, se está suponiendo que la covarianza entre dos errores depende sólo de la
distancia temporal entre las observaciones.
A su vez, como todos los términos de la diagonal principal se tiene el mismo valor, se está
suponiendo homocedasticidad ⇒ γ0 = E(µiµi-0)= E (µ 2i ) = γ 0 = σ 2µ
En términos gráficos:
ui ui
ei
x
x
x
x
x
x x
x x x
x x
x x
x x x
x x
x
x x t
x
t
x x
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
170
Autocorrelación espacial,
En datos de cross-section un shock aleatorio que afecta la actividad de una región puede
causar actividad económica en regiones adyacentes (ej.: mal tiempo).
También ocurre efecto vecindad o efecto demostración.
Inercia:
Debido a la inercia o a fenómenos psicológicos, las acciones pasadas muchas veces tienen
efecto en el presente. Si al modelo le falta incorporar dinámica presente en la realidad, a
través de rezagos, los residuos tendrán patrones autocorrelacionados.
Mala especificación
pero estimamos Yi = β 1 + β 2 X 2 + v i
Entonces, v i = µ i + β 3 X 3
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
171
f. funcional
estimada
errores positivos
verdadera forma
o negativos
forma verdadera
forma estimada
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
172
Si s = 0 ⇒ E( µ i , µ i− s ) = E(µ 2i ) = γ 0 = σ 2µ
γ 0 γ1 γ2 .
γ γ0
1
E (µµ' ) = . . =
. .
γ 0
Coeficiente de Autocorrelación
Definimos
Cov(µ i , µ i− s ) E( µ i . µ i −s ) E( µ i .µ i− s ) γ s
rs = = = =
E( µ i ) 2 • E (µ i −s ) 2 γ 0 • γ0 γ0 γ0
γs
⇒ rs = ⇒ γ s = γ 0 r s ⇒ γ s = σ µ2 rs
γ0
Si s=0, γ 0 = σ µ2
γ 0 γ1 γ2 σµ σ 2µ r1 σ 2µ r 2 1
2
. . r1 r2 .
γ σ 2 r r
1 γ0 µ 1 σ 2µ 1 1
E (µµ' ) = . . = . . = σ 2µ . .
. . . . . 1
γ 0 2
σµ 1
E (µµ' ) = σ 2µ Ω
EJEMPLO
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
173
µ i = ρ µ i −1 + ε i donde ε i ~ N ( 0, σ 2ε I)
Calculo de γ0
γ 0 = E(µ 2i ) = σ 2µ
µ i = ρ µ i−1 + ε i = ρ(ρ µ i− 2 + ε i −1 ) + ε i = ρ 2 µ i− 2 + ρ ε i −1 + ε i =
= ρ 2 ( ρ µ i− 3 + ε i −2 ) + ρ ε i−1 + ε i = ρ 3 µ i −3 + ρ 2 ε i− 2 + ρ ε i−1 + ε i = .....
= ε i + ρ ε i −1 + ρ 2 ε i− 2 + ρ 3 µ i− 3 .......
• E (µ i ) = E( ε i + ρ ε i−1 + ρ 2 ε i −2 + ρ 3 µ i −3 .......) = 0
E (µ i ) = 0 (i)
[
• E (µ 2i ) = E (ε i + ρε i −1 + ρ 2 ε i − 2 + … + )(ε i + ρε i −1 + ρ 2 ε i − 2 …) ]
[
= E (ε 2i + ρ 2 ε 2i−1 + ρ 4 ε 2i− 2 + … + ρ ε i ε i−1 + ρ 3 ε i −1 ε i− 2 … ]
= σ 2ε + ρ 2 σ 2ε + ρ 4 σ 2ε + … + 0 + 0 = σ 2ε (1 + ρ 2 + ρ 4 + … )
1
El segundo término es la suma de una progresión geométrica . S.P.G. = , por lo que
1 − ρ2
σ ε2
entonces, E (µ 2i ) = (ii)
1− ρ2
σ 2ε
γ 0 = σ 2µ = (iii)
1− ρ 2
Calculo de γ1
γ1 = E( µ i , µ i−1 )
pero como:
µ i = ε i + ρ ε i −1 + ρ 2 ε i −2 + ρ 3 µ i− 3 .....
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
174
ρ σ ε2
γ1 = (iv)
1 − ρ2
Por inducción:
σ 2ε
γ0 = = σµ2
1− ρ 2
σ 2ε ρ
γ1 = = ρ σ 2µ
1−ρ 2
M
σ ε2 ρ s
γs = = ρ s σ µ2
1− ρ 2
Entonces,
σ 2ε σ 2ε σ 2ε
ρ ρ2 .
1 − ρ2 1− ρ2 1− ρ2
2
γ 0 γ1 γ2 .
γ γ0 σε σ 2ε
1 ρ 1 − ρ 2 1− ρ 2
E (µµ' ) = . . = =
. .
. . . .
γ 0
σε
2
1 − ρ 2
1 ρ ρ 2 .
ρ 1
σε
2 σ ε2
= . . = Ω = σ 2µ Ω
1− ρ2 1− ρ2
. .
1
γs σ 2µ
Recordar: r s = =ρ
s
=ρ
s
σ 2µ σ 2µ
• MA (1) ⇒ µ t = ε t + θ ε t −1
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
175
no son adecuados.
§ El R2 está sobreestimado.
[ ]
V(βˆ ) = E[(βˆ − β)(βˆ − β)'] = E (X' X) −1 X' µµ ' X ( X' X) −1 = σ 2 ( X' X) −1 X' Ω X ( X' X) −1
Si utilizamos esta varianza el estimador obtenido tampoco será un estimador eficiente .
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
176
1 ρ ρ 2 .
ρ 1
σε
2 σ ε2
E (µµ' ) = . . = Ω = σ 2µ Ω
1− ρ2 1− ρ 2
. .
1
1 −ρ 0 L 0
− ρ (1 + ρ) −ρ L
Ω −1 = 0 −ρ (1 + ρ) − ρ
M M O M
1
Método gráfico:
el simple análisis de los residuos obtenidos puede confirmar la presencia de errores mal
comportados.
Estadístico de Durbin-Watson (1951)
Este estadístico es calculado con los residuos de la regresión MICO y es usado para
testear autocorrelación de primer orden.
El test es válido bajo las siguientes condiciones:
1) En la regresión hay constante ⇒ ∑e i =0
2) La matriz X es no estocástica
3) Solo sirve para testear procesos AR(1).
4) No es válido cuando la variable dependiente está rezagada.
Derivación:
d=
∑ (e − e i i −1 )2
=
∑e 2
i + ∑ e 2i −1 − 2 ∑ e i e i−1
∑e 2
i ∑e 2
i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
177
como ∑e ≅∑e
2
i
2
i −1
2 ∑ e 2i − 2 ∑ e i e i−1 ∑ e 2i ∑ e i e i−1
= 2 1 − ∑ i i−1
ee
d≅ = 2 −
∑e 2
i ∑ i
e 2
∑ e i ∑ e 2i
2
↓
(*)
ρˆ =
∑ (e − e)(e
i i −1 − e)
=
∑e e
i i −1
∑ (e − e )
i
2
∑e 2
i
∑ e i e i−1
⇒ d = 2 1 − = 2(1 − ρˆ )
∑ e i
2
Entonces,
∑ e i e i−1
d = 21 − = 2(1 − ρˆ )
e i2
El estadístico d no tiene una distribución conocida. Por eso Durbin y Watson tabularon la
distribución del test. Para cada valor de k y n (al 5% y al 1%) se obtienen dos valores
críticos: du y dL que permiten establecer zonas en que se rechaza la hipótesis nula, zonas
en que se acepta y zonas de indecisión
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
178
dL dU 2 4-d U 4-d L
No hay Autocorrelación
Autocorrelación positiva Autocorrelación negativa
§ Test H de Durbin
H0) ρ = 0
n
h = ρˆ
1 − n [var (βˆ 2 )]
n - tamaño muestral
ρˆ - estimación de ρ
var βˆ 2 - varianza del coeficiente asociado a Yt-1.
Características de la prueba:
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
179
1. No importa cuantas veces está rezagada Yt, solo necesito la varianza del coeficiente
asociado a Yt-1.
2. La prueba no es válida si n var βˆ 2 > 1.
iii) El estimador (n-p)R2 bajo la hipótesis nula se distribuye χ2,p , con lo que si
En E-Views podemos realizar fácilmente alguno de estos test. Para los datos del ejercicio
2.1.7 tenemos la siguiente salida:
LS // Dependent Variable is Y
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 3.600000 2.090177 1.722342 0.1233
X 0.750000 0.255738 2.932692 0.0189
R-squared 0.518092 Mean dependent var 9.600000
Adjusted R-squared 0.457854 S.D. dependent var 1.837873
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
180
Corresponde al valor calculado del estadístico de DW. Este valor hay que
contrastarlo con los valores de dU y dL de la tabla
No hay Autocorrelación
Autocorrelación positiva Autocorrelación negativa
2.34
Test Equation:
LS // Dependent Variable is RESID
Date: 11/24/98 Time: 13:02
Variable Coefficient Std. Error t-Statistic Prob.
C -0.572430 2.461777 -0.232527 0.8239
X 0.076530 0.304399 0.251415 0.8099
RESID(-1) -0.301095 0.448296 -0.671642 0.5268
RESID(-2) -0.148734 0.428825 -0.346841 0.7406
R-squared 0.075679 Mean dependent var -4.22E-16
Adjusted R-squared -0.386481 S.D. dependent var 1.275844
S.E. of regression 1.502293 Akaike info criterion 1.103159
Sum squared resid 13.54130 Schwarz criterion 1.224193
Log likelihood -15.70518 F-statistic 0.163751
Durbin-Watson stat 2.006501 Prob(F-statistic) 0.916964
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
181
p=2, n=10
7.6.1.1 AR(1)
Sabemos que µ i = ρ µ i −1 + ε t y supongamos que conocemos ρ.
1 ρ ρ 2 .
ρ 1
σε
2 σ ε2
E (µµ' ) = . . = Ω = σ 2µ Ω
1− ρ2 1− ρ 2
. .
1
1 −ρ 0 L 0
− ρ (1 + ρ) − ρ L
Ω −1 = 0 −ρ (1 + ρ) − ρ
M M O M
1
Sabemos que la regresión debe ser con los datos transformados, de forma que el residuo sea
bien comportado
Y = Xβ + µ µ t = ρ µ t −1 + ε t
TY = T X β + Tµ = T X β + v
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
182
1 − ρ2 0 L L0
−ρ 1 0 L 0
T= 0 − ρ 1 0 0
M M O O 0
0 0 L − ρ 1
por tanto
1 − ρ 2 Y1 1 − ρ 2 µ1 1− ρ2
Y − ρY µ − ρµ ε2
2 1
2 1
Y − ρY µ − ρµ ε3
TY = 3 2 Tµ = 3 2 =
• • •
• • •
• • •
• • •
Yn − ρYn −1 µ n − ρµ n−1 εn
1− ρ 2 1 − ρ 2 X 12 ………… 1 − ρ 2 X 1k
1 − ρ X 22 − ρX12 ………… X 2k − ρX 1k
•
TX =
•
•
•
1 − ρ X n2 − ρX n−1, 2 ……… X nk − ρX n−1, k
Observación:
Si partimos de:
(1) Yi = β 1 + β 2 X i2 + …… + β k X ik + µ i
donde µi = ρ µi-1 + ε i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
183
(4)
Yi − ρYi−1 = β1 (1 − ρ) + β 2 ( X i2 − ρX i−1, 2 ) + …… + β k ( X ik − ρX i−1, k ) + µ i − ρµ i −1
↓
εi
Este último método es más utilizado, pero menos eficiente para corregir autocorrelación.
7.6.1.2 AR(2)
µ i = ρ1 µ i−1 + ρ 2 µ i− 2 + ε i
Rezago (5)
(6) Y i−1 = β1 + β 2 X i −1, 2 + …… + β k X i −1, k + µ i −1
Rezago (6)
(7) Y i− 2 = β1 + β 2 X i−1, 2 + …… + β k X i− 2, k + µ i − 2
(10)
Yi − ρ1 Yi−1 − ρ 2 Yi − 2 = β 1 (1 − ρ 1 − ρ 2 ) + β 2 ( X i 2 − ρ1 X i−1, 2 − ρ 2 X i − 2, 2 ) +
+ L + β k ( X ik − ρ1 X i−1, k − ρ 2 X i− 2, k ) + µ i − ρ1 µ i −1 − ρ 2 µ i− 2
donde el último término es ε i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
184
7.6.2 . No conocemos ρ.
Como no conocemos ρ, podríamos partir de alguno de los dos casos extremos. Esto es
suponer que ρ = 1 o ρ = - 1.
∆Yi = β 2 ∆X i2 + …… + β k ∆X ik + ε i
Es decir que hay que estimar con los datos expresados en primeras diferencias
El problema de este método, es que si ρ≠1 o ρ≠-1 el remedio puede ser peor que la
enfermedad.
7.6.2.2 Método basado en estadístico d de Durbin y Watson
d ≅ 2 (1− ρˆ )
⇓
ρˆ ≅ 1 − d \ 2 → esto solo es válido si n es grande
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
185
e i = ρˆ e i −1 + v t
iii. con ρ̂ estimado, corregir los datos y correr la ecuación (4)
v. e *i = ρˆ e *i−1 + w t
Yt = β1 (1 − ρ) + β 2 X 2t − ρβ 2 X t−1 + ρYt −1 + …… + ε t
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
186
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
187
y i = β 2 x 2 i + (v i − v i )
βˆ 2 =
∑x y = ∑x
2i i 2i (β 2 x 2i + β 3 x 3i + µ i − µ )
=
β 2 ∑ x 22i + β 3 ∑ x 2i x 3i + ∑ x 2i ( µ i − µ )
∑x 2
2i ∑x 2
2i ∑x 2
2i
β ∑x x + ∑ (µ i − µ ) x 2i
=β +
3 2i 3i
∑x
2 2
2i
β 3 ∑ x 3i x 2i
E (βˆ 2 ) = β 2 +
∑x 2
2i
E (βˆ 2 ) = β2 + β 3 ∑x x 2 3
∑x 2
2
∑x x 2 3
> 0, porque existe cierto gra do de asociación entre var iables .
∑x 2
2
( No Causalidad )
Luego, al estimar sin el precio del sustituto, el coeficiente estimado queda
sesgado y el sesgo es positivo.
8.3.1.2. Consecuencias
§ Si X3 esta correlacionada con X2 ⇒ ambos estimadores son sesgados
inconsistentes (es decir que el sesgo no desaparece para muestras grandes)
§ Si X2 y X3 no están correlacionados ⇒ el estimador de la pendiente es
insesgado, pero el del intercepto sesgado.
§ σˆ 2µ está mal estimado si omito variables
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
188
e' e
> σµ → Sesgo
2
E
N − ( k − r )
Esto porque e’e es mayor , mientras el efecto sobre el denominador es
marginal.
§ Como consecuencia del punto anterior la varianza de los estimadores es sesgada
V (βˆ ) = σˆ µ2 ( X ' X ) −1
↓
mal estimada
§ Prueba d de Durbin-Watson.
Si existe correlación positiva en los errores ⇒ significa que estos no son aleatorios y
que pueden estar asociados a alguna variable no incluida en el modelo.
Se calcula d = ∑
(e − e i i −1 )2
-
∑e 2
i
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
189
R2.
- Se vuelve a correr la regresión, introduciendo como variables
explicativas formas funcionales de
[ ]
Ŷi por ejemplo Ŷi2 , Ŷi3 , etc. ⇒ se obtiene R *2 .
- H0 ) Modelo Bien Especificado.
H1 ) Modelo Mal Especificado.
- Si F> Ftabla, rechazo H0 , por tanto rechazo que que modelo esté bien
especificado.
Consecuencias
i ) Estimadores insesgados y consistentes
ii) σˆ 2µ se computa correctamente
e'e
E ≅ σ 2µ esto porque la caída en e’e no es muy grande, porque la
n ( k + s)
variable
donde s es el NKO de Variables Intrusas.
Hay que distinguir "computar" de la estimación que se encuentra.
e' e
Se "computa" correctamente porque el estimador que se usa sigue siendo
N −K
un estimador insesgado.
Puede haber, sin embargo, un error de estimación (pequeño) por agregar una
variable que no debía ir.
iii) Intervalos y pruebas de hipótesis son válidos.
iv) Pero la varianza estimada para los parámetros son más grandes que las del modelo
original.
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004
190
σ2
v( βˆ 2 ) = (Modelo original)
∑ x22i
σ2
v( αˆ 2 ) = (Modelo estimado)
∑ x 22i (1 − 2
2,3 )
V(αˆ 2 ) 1
=
V(βˆ 2 )
2
1 − 2,3
v(αˆ 2 )
Como 0 ≤ r 22,3 ≤ 1 ⇒ > 1
v(βˆ )
2
Econometría E-250: Apuntes de Clase Profesores Verónica Gil y Aldo Lema Agosto 2004