Tema 3: Modelo de Regresi´on M´ultiple: Estimaci´on

Jos´e Villegas G´
omez
Universidad Alberto Hurtado

Abril 16, 2016

Econometr´ıa

Abril 16, 2016

1 / 54

outline

Outline

1

Introducci´on: El Modelo Lineal General

2

El Modelo Lineal General: Estimaci´
on

3

El Modelo Lineal General: Propiedas Estad´ısticas

Econometr´ıa

Abril 16, 2016

2 / 54

Introducci´
on: El Modelo Lineal General

Outline

1

Introducci´on: El Modelo Lineal General

2

El Modelo Lineal General: Estimaci´
on

3

El Modelo Lineal General: Propiedas Estad´ısticas

Econometr´ıa

Abril 16, 2016

3 / 54

Introducci´
on: El Modelo Lineal General

Motivaci´
on
Siempre que buscamos medir el efecto de una variable sobre otra
podemos utilizar el modelo de regresi´
on simple:
y = β0 + β1 x + u

Sabemos que cualquier conclusi´
on sobre causalidad est´a determinada
por lo plausible del supuesto:
E(u) = E(u|x) = 0

Es muy poco probable que podamos defender este supuesto en
cualquier investigaci´on aplicada. Lo cual, seg´
un lo visto anteriormente
significar´a que nuestras estimaciones ser´an siempre sesgadas.
Econometr´ıa

Abril 16, 2016

4 / 54

Introducci´
on: El Modelo Lineal General

¿Por qu´
e Incluir m´
as Regresores en el Modelo de Regresi´
on Lineal?
Incluir regresores adicionales nos permite controlar por otros factores
que afecta a y , de forma que realmente aislemos el efecto casual de
nuestro regresor inter´es.
La inclusi´on de regresores adicionales permitir´a incrementar la
variaci´on explicada de nuestro modelo.
Incluir regresiones adicionales permitir´a modelar de forma m´as
apropiada el efecto de x sobre y (por ejemplo: efecto no lineal de la
educaci´on sobre los salarios)

Econometr´ıa

Abril 16, 2016

5 / 54

Por tanto Cov (educ. u) = 0 y Cov (habil. habil) > 0. Nuestro par´ametro de inter´es no reflejar´a el efecto aislado de un a˜ no adicional de educaci´ on sobre los salarios. 2016 6 / 54 . v ) 6= 0. La unica forma de resolver esto es incluyendo la variable (controlando por) habil en el modelo de regresi´ on. Es bastante plausible pensar que Cov (educ. Asumamos que Cov (educ.Introducci´ on: El Modelo Lineal General Ejemplo: Retornos de la educaci´ on El modelo econom´etrico que se plante´ o inicialmente: salario = β0 + β1 educ + v Sea: v = β2 habil + u. Econometr´ıa Abril 16. u) = 0.

Donde v = β2 Ing 2 + u. Por tanto Cov (Ing . De la misma forma.Introducci´ on: El Modelo Lineal General Ejemplo: La funci´ on de Consumo Queremos estimar el efecto de un dolar adicional de ingreso laboral sobre el consumo de las familias. Si no incluimos el termino cuadr´atico en nuestro modelo entonces: Consum = β0 + β1 Ing + v . Sea nuestro modelo econom´etrico Consum = β0 + β1 Ing + β2 Ing 2 + u . Econometr´ıa Abril 16. v ) 6= 0. Si asumimos que : Cov (ing . u) = 0. Cualquier cambio en Ing deber´a generar un incremento en Ing 2 . 2016 7 / 54 . no incluir el t´ermino cuadr´atico en el modelo (especificaci´on funcional incorrecta) sesgar´a nuestro par´ametro de inter´es.

se asume que una vez que se ha controlando por x1 y x2 nuestros regresores no estar´an correlados con u. Es decir. 2016 8 / 54 . Ser´a necesario asumir en este caso E(u|x1 . De forma que este tema ser´a como un repaso de lo ya visto anteriormente. x2 ) = 0 . Econometr´ıa Abril 16. B´asicamente la derivaci´ on de los estimadores MCO en el modelo de regresi´on lineal general (modelo de regresi´ on m´ ultiple) ser´a bastante similar al caso del modelo simple.Introducci´ on: El Modelo Lineal General ¿Por qu´ e Incluir m´ as Regresores en el Modelo de Regresi´ on Lineal? Note que si el modelo en la poblaci´ on es y = β0 + β1 x1 + β2 x2 + u y queremos medir el efecto causal de x1 sobre y .

El Modelo Lineal General: Estimaci´ on Outline 1 Introducci´on: El Modelo Lineal General 2 El Modelo Lineal General: Estimaci´ on 3 El Modelo Lineal General: Propiedas Estad´ısticas Econometr´ıa Abril 16. 2016 9 / 54 .

. . 2. .. 2016 10 / 54 . x2 . . + βK xK + u Donde: β0 es el intercepto..El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Supuestos Sea el modelo poblacional: y = β0 + β1 x1 + β2 x2 + ... .. K y u es el t´ermino de error o disturbancia... Econometr´ıa Abril 16.. βj ∀j = 1. En este caso nuestros supuestos claves son: (1) E(u) = 0 (siempre que incluyamos intercepto en el modelo).. K es el par´ametro que acompa˜ na a cada regresor xj ∀j = 1. K .. (2) E(u|x1 . El supuesto (2) nos dice que una vez que controlamos por x1 . Lo cual sabemos que implica que Cov (xk . xK ) = 0 . . xK el t´ermino de error no est´a correlado con ning´ un regresor en el modelo.. x2 ..... 2. 2. u) = E(xk u) = 0 ∀k = 1..

. − βˆK xiK )2 i=1 Las Condiciones de Primer Orden (CPO) del problema de minimizaci´on nos permitir´a formar un sistema de K + 1 ecuaciones para hallar nuestros K + 1 estimadores. entonces estos deber´an: ( N ) X min (yi − βˆ0 − βˆ1 xi1 − βˆ2 xi2 − . 2016 11 / 54 ... βˆK ) nuestros estimadores MCO. . . nuestros estimadores MCO ser´an aquellos que minimicen la suma de residuos estimados cuadr´aticos... Y nuestra Funci´on de Regresi´ on Muestral (FRM) ser´a: yˆ = βˆ0 + βˆ1 x1 + βˆ2 x2 + .. xk ) = β0 + β1 x1 + β2 x2 + .. βˆ1 . Econometr´ıa Abril 16. Es decir Sean (βˆ0 .. x2 .El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Estimaci´ on MCO Bajo los anteriores supuestos la Funci´ on de Regresi´on Poblacional (FRP) ser´a: E(y |x1 .... + βK xK .. + βˆK xK Como vimos en el anterior cap´ıtulo. βˆ2 .

. Vimos en el anterior tema que es posible utilizar el m´etodo de momentos para formar un sistema de ecuaciones que nos permitir´a determinar nuestros estimadores MCO. . xi1 .. 2016 12 / 54 . xi2 .El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Estimaci´ on MCO De la misma forma que asumimos en el anterior tema. xiK }N no N obtenida i=1 de tama˜ aleatoriamente.. Usaremos la contraparte muestral de nuestros K + 1 supuestos establecidos incialmente para hallar el sistema de ecuaciones necesario para identificar los estimadores MCO. Econometr´ıa Abril 16. tenemos una muestra {yi .

....El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Estimaci´ on MCO N 1 X (yi − βˆ0 − βˆ1 xi1 − βˆ2 xi2 − . N 1 X xiK (yi − βˆ0 − βˆ1 xi1 − βˆ2 xi2 − .. − βˆK xiK ) = 0 (2) N i=1 N 1 X xi2 (yi − βˆ0 − βˆ1 xi1 − βˆ2 xi2 − . − βˆK xiK ) = 0 (3) N i=1 .. 2016 13 / 54 ... − βˆK xiK ) = 0 (K + 1) N i=1 Econometr´ıa Abril 16.. − βˆK xiK ) = 0 (1) N i=1 N 1 X xi1 (yi − βˆ0 − βˆ1 xi1 − βˆ2 xi2 − . .

Lo que se hace en la estimaci´ on de los par´ametros MCO en el modelo m´ ultiple es netear el efecto del resto de variables sobre xj . 3.El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Estimaciones MCO Usando la ecuaci´on (1) podemos encontrar el estimador para el intercepto: βˆ0 = y¯ − βˆ1 x¯1 − βˆ2 x¯2 − . Econometr´ıa Abril 16. 2016 14 / 54 . 2.... dejando esa parte que se relaciona con y y que no estar´a correlada con el resto de regresores en el modelo.. Los estimadores para el resto de par´ametros que acompa˜ nan a nuestros regresores tiene una forma bastante intutitiva: PN rˆij yi βˆj = PNi=1 ∀j = 1. − βˆK x¯K .K rij )2 i=1 (ˆ Donde: rˆij es el residuo estimado de la regresi´ on de xj sobre el resto de regresores.

. N (2) Con la informaci´ on {yi . rˆi1 }i=1 corremos la regresi´on: yˆ = α ˆ 0 + βˆ1 rˆ1 .. Econometr´ıa Abril 16. Donde xˆi1 se obtiene de la regresi´ on: xˆ1 = γˆ1 + γˆ2 x2 + .. es u ´til entender la mec´anica detr´as del anterior estimador. Esto lo hacemos obteniendo el residuo rˆi1 = xi1 − xˆi1 para cada observaci´ on i...xK sobre nuestra variable de inter´es.. Esto puede entenderse en dos etapas: (1) Sea nuestra variable de inter´es x1 . x3 .El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Estimaci´ on MCO A pesar de que STATA no obtinen de esta forma los estimadores. 2016 15 / 54 . + γˆk xk . La primera etapa lo que hace es netear el efecto del resto de regresores x2 .

∆y Por tanto: ∆y = β1 ∆x1 . 2016 16 / 54 .. El anterior an´alisis se puede tambi´en para el caso de que querramos evaluar el efecto marginal ceteris paribus de dos regresores.. ser´a la magnitud del 1 efecto de un cambio en una unidad del regresor de inter´es x1 sobre la variable dependiente y ...∆xK = 0.. Econometr´ıa Abril 16. Expresando el modelo en diferencias: ∆y = β1 ∆x1 + β2 ∆x2 + . + βK ∆xK + ∆u. Es decir β1 = ∆x .El Modelo Lineal General: Estimaci´ on Interpretaci´ on de los Efecto Marginales Con el modelo lineal general: y = β0 + β1 x1 + β2 x2 + . + βK xK + u. Si se cumple el supuesto de independencia en media para el t´ermino de error entonces ∆u = 0.. Si nuestra variable de inter´es es x1 entonces manteniedo constante por el resto de variables en nuestra modelo econom´etrico : ∆x2 = ∆x3 = .

x3 .. 2016 17 / 54 . No confunda esto con el caso de un muestreo donde solo se recopila informaci´on de x1 e y en observaciones con los mismos valores para el resto de regresores x2 . el modelo de regresi´on imita una situaci´on de ceteris paribus.” (Wooldridge p´agina 77). ”El poder del modelo de regresi´ on m´ ultiple es que nos permite hacer con datos no experimentales lo que puede relizarse en las ciencias naturales: mantener el resto de factores constantes.. xK ..El Modelo Lineal General: Estimaci´ on Nota Sobre la Interpretaci´ on de los Efectos Marginales Una de las ventajas del modelo de regresi´ on m´ ultiple es que al controlar por otros regresores. Econometr´ıa Abril 16.

. 2. xK = xiK .K i=1 xij u La covarianza muestral entre yˆi y uˆi es cero. . 3. x¯1 .. x3 = xi3 . .. Las propiedades algebraicas en el modelo de regresi´on m´ ultiple son las mismas que en el caso simple: 1.¯ xK ) El promedio de los valores ajustados es igual al promedio muestral: y¯ ˆ = y¯ Econometr´ıa Abril 16. por otro lado si uˆi < 0 la FRM sobre predice el valor de y .. 2016 18 / 54 . yˆ = βˆ0 + βˆ1 x1 + βˆ2 x2 + .. uˆi ser´a el residuo estimado. La FRM siempre pasa por el punto (¯ y .. x¯2 .. x2 = xi2 .. 4. 5. 3. En caso de que uˆi > 0 la FRM sub predice el valor de y . + βˆK xK ser´a el valor predecido de y cuando x1 = xi1 .. PN uˆi = 0 Pi=1 N ˆi = 0 ∀j = 1.El Modelo Lineal General: Estimaci´ on El Modelo Lineal General: Algunas Definiciones y Propiedades Algebraicas Para cada observaci´on i: yi = yˆi + uˆi . 2.

3. En ese caso nuestro modelo econom´etrico deber´ıa ser: salario = β0 + β1 educ + β2 IQ + β3 exper + β4 exper 2 +β5 educmom + β6 educpap + u . Existen tres variables que pensamos que pueden generar que nuestra variable de inter´es est´e correlada con el t´ermino de disturbancia: 1. 2. salarios mensuales en d´olares y otras carater´ısticas observables para 935 personas tomadas aleatoriamente para USA en 2011. Econometr´ıa Abril 16. 2016 19 / 54 .El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Tenemos data sobre a˜ nos de educaci´ on. Experiencia laboral (se sugiere incluir un t´ermino cuadr´atico). En el anterior tema estimamos los retornos de la educaci´on asumiendo que el modelo poblacional era: salario = β0 + β1 educ + v (1) . Habilidad innata (la cual puede ser medida con test IQ). Educaci´ on de los padres.

El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Veamos si en la data que tenemos las variables enumeradas est´an relacionadas de alguna forma con nuestro regresor de inter´es: Econometr´ıa Abril 16. 2016 20 / 54 .

Veamos como indicador final sus correlaciones: Econometr´ıa Abril 16. 2016 21 / 54 .El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Al parecer existe cierta relaci´ on entre los regresores que enumerados y la variable a˜ nos de educaci´ on.

En el modelo simple un a˜ no adicional de educaci´on incrementa los salarios en 5. en en modelo m´ ultiple este efecto marginal reduce a 5 %.El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Entonces estimemos el modelo con las especificaci´on que incluye regresores adicionales. 2016 22 / 54 . Econometr´ıa Abril 16.9 %. Comparemos las estimaciones obtenidas con el modelo m´ ultiple con las estimaciones del modelo simple: La inclusi´on de regresores adicionales disminuye el retorno de un a˜ no adicional de educaci´on.

Los residuos obtenidos y como estos se relacionan con la variable dependiente lwage se muestra a continuaci´ on: Econometr´ıa Abril 16. lo cual significa estimar los residuos de la regresi´on de educ sobre exper . 2016 23 / 54 . IQ.El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Veamos ahora como obtener las estimaciones con el m´etodo de dos etapas visto anteriormente. educmom y educpap. exper 2 . En la primera etapa netabamos el efecto del resto de variables sobre nuestra variable de inter´es.

El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on En la segunda etapa utilizamos los residuos estimados para obtener estimaciones de la regresi´ on de lwage sobre los residuos. Econometr´ıa Abril 16. Los resultados se muestran a continuaci´ on: Note que la estimaci´on del efecto parcial de nuestra variable de inter´es educ con el m´etodo de dos etapas es el mismo que el que se obtuvo con el modelo m´ ultiple. 2016 24 / 54 .

Si δ˜1 = 0 .El Modelo Lineal General: Estimaci´ on Comparaci´ on Etimadores MCO Modelo Simple Modelo M´ ultiple ¿Como se comparan los estimadores del modelo simple con los estimadores del modelo m´ ultiple? Sea la FRM para el modelo simple: y˜ = β˜0 + β˜1 x1 .x2 ) Cov ˆ (x2 ) Var es el par´ametro de la regresi´on de x1 sobre x2 . lo cual implica que Cov Econometr´ıa Abril 16. 2016 25 / 54 . La estimaci´ on del efecto parcial del regresor x2 es cero. es decir βˆ2 = 0. x2 ) = 0. ii. Por tanto el estimador β˜1 en el modelo simple ser´a igual al estimador βˆ1 en el modelo m´ ultiple si y solo si: i. en tanto que para el modelo m´ ultiple: yˆ = βˆ0 + βˆ1 x1 + βˆ2 x2 . Es posible demostrar que: β˜1 = βˆ1 + βˆ2 δ˜1 Donde δ˜1 = ˆ (x1 . ˆ (x1 .

En tanto que la FRM en el modelo simple es: salario = β˜0 + β˜1 educ Como vimos anteriormente es posible demostrar que: β˜1 = βˆ1 + βˆ2 δ˜1 Donde δ˜1 es el par´ametro de estimaci´ on de la regresi´on de IQ sobre educ Econometr´ıa Abril 16.El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Comparemos las estimaciones del modelo m´ ultiple con las del modelo simple con la data que se present´ o anteriormente. 2016 26 / 54 . Supongamos que la FRM en el caso m´ ultiple es la siguiente: salario = βˆ0 + βˆ1 educ + βˆ2 IQ.

0391199 + (0. 2016 27 / 54 .0598392 = 0.533829) Econometr´ıa Abril 16.0058631) ∗ (3.El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Encontremos las anteriores estimaciones: Se puede ver que la anterior relaci´ on se cumple: 0.

Econometr´ıa Abril 16. En el modelo de regresi´on m´ ultiple esta descomposici´on es igualmente v´alida. 2016 28 / 54 .El Modelo Lineal General: Estimaci´ on Descomposici´ on de Varianza y Bondad de Ajuste Vimos en el anterior tema que la variaci´ on de la variable dependiente puede descomponerse de la siguiente forma: N X i=1 2 (yi − y¯) = N X i=1 N X (ˆ yi − y¯) + (uˆi )2 2 i=1 Es decir: SCT = SCE + SCR . Recordemos que este indicador nos muestra la proporci´ on de la varianza de la variable dependiente explicado por nuestro modelo de regresi´on. SCE Por tanto tambi´en es posible calcular el R 2 = SCT .

Una medida de ajuste m´as robusta a la inclusi´ on de regresores adicionales es el R 2 ajustado (R¯ 2 ): SCE N − 1 R¯ 2 = SCT N − K − 1 Lo que hace R¯ 2 es penalizar la inclusi´ on de variables adicionales. para un K elevado. incluso usualmente incrementa. la variable adicional inclu´ıda deber´a explicar mayor varaici´ on para que R¯ 2 pueda incrementar. Econometr´ıa Abril 16. Esto debido a que SCR nunca incrementan cuando se incluye un regresor adicional. Lo anterior significa que el R 2 es un indicador poco fiable para guiar nuestra elecci´on de variables adicionales que se incluir´an en la regresi´on.El Modelo Lineal General: Estimaci´ on Descomposici´ on de Varianza y Bondad de Ajuste El problema con el R 2 es que cuando el modelo incluye regresores adicionales este indicador nunca disminuir´a. 2016 29 / 54 . Por tanto.

Econometr´ıa Abril 16.El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Veamos que es lo que sucede con el R 2 cuando el n´ umero de variables se incrementa. de la misma forma el R¯ 2 incrementa lo cual indica que la penalizaci´ on por la inclusi´on de regresores adicionales no revierte la mayor variaci´on explicada por el modelo con esta variable adicional. 2016 30 / 54 . Incluyamos una variable no muy relevante orden de nacimiento de las personas que est´an en la muestra. Las estimaciones ser´an: Note que se ha incrementado el R 2 .

2016 31 / 54 .El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on ¿Que es lo que sucede si incluimos una variable que no tiene nada que ver con los salarios? Creamos una variable que toma valores aleatorios entre 0 y 100. Gr´aficamente se lo muestra a continaci´ on: Econometr´ıa Abril 16.

2016 32 / 54 .El Modelo Lineal General: Estimaci´ on Ejemplo Pr´ actico: Retornos de la Educaci´ on Si inclu´ımos esta variable aleatoria en la regresi´ on veremos que el R 2 : Econometr´ıa Abril 16.

2016 33 / 54 .El Modelo Lineal General: Propiedas Estad´ısticas Outline 1 Introducci´on: El Modelo Lineal General 2 El Modelo Lineal General: Estimaci´ on 3 El Modelo Lineal General: Propiedas Estad´ısticas Econometr´ıa Abril 16.

No es correcto hablar sobre si una estimaci´ on particular es sesgada o insesgada.El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento Recuerden que los estimadores MCO. Econometr´ıa Abril 16. es una propiedad que proviene del muestre aleatorio repetido. como se vi´ o. bajo ciertos supuestos. Un estimador (recuerde la diferencias entre estimador y estimaci´on) ser´a insesgado (o no) cuando se lo considera aplicado a todas las muestras aleatorias posibles. La propiedad de insesgamiento. poseen propiedades estad´ısticas atractivas. 2016 34 / 54 .

y u es el t´ermino de error... ... β1 . xiK }N i=1 Econometr´ıa Abril 16. x2 . xi2 . xi1 . + βK xK + u Donde: (β0 ... β2 βK ) son los par´ametros desconocidos de inter´es. Recuerde que este supuesto no restringe incluir en el modelo las posibles relaciones no lineales entre y y (x1 . 2016 35 / 54 . .El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento: Supuestos del Modelo Lineal General Se enuncian a continuaci´ on los supuestos que nos permitir´an asegurar la propiedad de insesgamiento: (1) Linealidad en Par´ametros: El modelo poblacional (ideal) que representa a nuestro fen´ omeno de estudio es lineal en par´ametros: y = β0 + β1 x1 + β2 x2 + ... xK ) (2) Muestreo Aleatorio: Se tiene una muestra aleatoria {yi .

. 2016 36 / 54 .. 3... ...El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento: Supuestos del Modelo Lineal General (3) No Colinealidad Perfecta: Ning´ un regresor (x1 . x2 . . Este supuesto nos dice unicialmente que todos los regresores en el modelo presentan cierta variaci´ on.. xK ) puede expresarse como combinaci´ on lineal de otros regresores. xK ) en la muestra aleatoria es constante.. La otra parte del supuesto nos dice que no existe colinealidad entre los regresores del modelo.K Var . . x2 . Ning´ un regresor (x1 . 2. es decir: ˆ (xj ) > 0 ∀ j = 1. Econometr´ıa Abril 16.

Es decir x2 est´a construido en base a valores en base a valores de x1 mediante una funci´ on (f´ ormula) lineal. es decir: x2 = a + bx1 .El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento: Supuestos del Modelo Lineal General Sea el modelo que se piensa estimar: y = β0 + β1 x1 + β2 x2 + u El regresor x2 estar´a correlado perfectamente con el regresor x2 si se se pueden expresar un como una combinaci´ on lineal del otro. b > 0 Donde: a ≥ 0 y b > 0 . ∀ a ≥ 0 . 2016 37 / 54 . Econometr´ıa Abril 16.

en cuyo caso ambas variables ser´an colineales de manera perfecta. estar´a correlado perfectamente con ingmiles .: Sea el modelo econom´etrico sobre la relaci´on entre consumo e ingreso el siguiente: cons = β0 + β1 ingmiles + β2 ing + u Note que el regresor ing = 1000 ∗ ingmiles por tanto. Econometr´ıa Abril 16.El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento: Supuestos del Modelo Lineal General Ejemplo 1. Es necesario recalcar que el modelo: cons = β0 + β1 ing + β2 ing 2 + u no rompe el supuesto de colinealidad perfecta ya que ing 2 est´a relacionado con ing pero de forma no lineal. 2016 38 / 54 . Lo cual no es lo mismo si nuestros regresores son: Log (ing ) y Log (ing 2 ) .

por tanto Totalgastos es perfectamente colineal con gastosA y gastosB . pero no perfectamente correlados. Econometr´ıa Abril 16. sea el modelo econom´etrico: votosA = β0 + β1 gastosA + β2 gastosB + β3 Totalgastos + u En este caso particular Totalgastos = gastosA + gastosB . 2016 39 / 54 . En la muestra podemos encontrar que dos regresores est´en altamente correlados.El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento: Supuestos del Modelo Lineal General Ejemplo 2. La u ´nica forma de resolver la perfecta colinealidad es quitar el regresor problem´atico del modelo econom´etrico. lo cual no rompe con el supuesto de colienalidad perfecta.: Queremos estimar el efecto de una dolar adicional en gastos de campa˜ na sobre el n´ umero de votos obtenidos.

.... xK ) se genera que el t´ermino de disturbancia u (todo lo inobsrvable) no est´a correlado con (x1 ... (ii) Forma funcional incorrecta.. x2 ..El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento: Supuestos del Modelo Lineal General (4) Independencia en Media: Controlando por (x1 . Es decir: E(u|x1 . (iii) Errores de medici´on en los regresores del modelo. xK ) = E(u) = 0 El supuesto de independencia en media para el t´ermino de error es muy importante. Las causas por las que se rompe el supuesto (4) son: (i) Omisi´on de variable relevante (por falta de informaci´ on o por desconocimiento). . 2016 40 / 54 . ya que restringe en como nuestras variables del modelo se relacionan con aquello que no podemos cuantificar (y afecta a nuestra variable dependiente).. x2 . Econometr´ıa Abril 16. x2 . . xK ) . .

Entonces: ¿Por qu´e es importante este resultado? Al menos sabemos que nuestro estimador est´a apuntando al blanco correcto y no a otro que no nos interesa (ejem: disparando a un blanco con los ojos vendados). No conocemos y nunca conoceremos los par´ametros reales del modelo.El Modelo Lineal General: Propiedas Estad´ısticas Insesgamiento Si los supuestos (1). 2. (2). Econometr´ıa Abril 16.K Es decir que bajo muestreo aleatorio (obtener todas las muestras aleatorias posibles de nuestra poblaci´ on de inter´es) en promedio las estimaciones que obtenemos dar´an exactamente en el blanco.. es decir: E(βˆj ) = βj ∀ j = 1. . y no es posible realizar muestreo aleatorio en la pr´actica. 2016 41 / 54 . (3) y (4) se cumplen entonces nuestros estimadores MCO ser´an insesgados..

E(βˆ1 ) = β1 . 2016 42 / 54 . (2). x2 ) = β0 + β1 x1 + β2 x2 Pero por desconocimiento de lo anterior estimamos el siguiente modelo: yˆ = βˆ0 + βˆ1 x1 + βˆ2 x2 + βˆ3 x3 Si se cumplen los supuestos (1). Sea el modelo poblacional: y = β0 + β1 x1 + β2 x2 + β3 x3 + u Pero asumamos que x3 no afecta a y . x3 ) = E(y |x1 . (3) y (4) entonces no deber´ıa afectarse la propiedad de insesgamiento de nuestros estimadores MCO. en ese caso: β3 = 0. E(βˆ2 ) = β2 y E(βˆ3 ) = 0 Econometr´ıa Abril 16. Es decir: E(βˆ0 ) = β0 . Es decir: E(y |x1 .El Modelo Lineal General: Propiedas Estad´ısticas Inclusi´ on de una Varible Irrelevante ¿Que es lo que pasa si incluimos una variable irrelevante en el modelo? Sobre especifici´ on del Modelo. x2 .

por tanto las estimaciones ser´an sesgadas. 2016 43 / 54 . Donde el signo ∼ se usa para denotar que las estimaciones provienen del modelo mal especificado. Econometr´ıa Abril 16.El Modelo Lineal General: Propiedas Estad´ısticas Omisi´ on de una Varible Irrelevante ¿Que es lo que pasa si no incluimos una variable relevante en el modelo? Subespecifici´ on del Modelo: Sabemos que la omisi´ on de una variable relevante generar´a un problema con el supuesto de independencia en media. Es posible tener una idea del signo del sesgo. Consideremos el siguiente modelo poblacional: y = β0 + β1 x1 + β2 x2 + u Por error se estima el la siguiente FRM: y˜ = β˜0 + β˜1 x1 .

(3) y (4) .x2 ) Cov ˆ (x1 ) Var es la estimaci´ on de la regresi´on de x2 sobre x1 . Ya se vi´o anteriormente que la relaci´ on entre β˜1 y βˆ1 es la siguiente: β˜1 = βˆ1 + βˆ2 δ˜1 Donde δ˜1 = ˆ (x1 . 2016 44 / 54 .El Modelo Lineal General: Propiedas Estad´ısticas Omisi´ on de una Varible Irrelevante Sea el modelo estimado correctamente: yˆ = βˆ0 + βˆ1 x1 + βˆ1 x2 . (2). entonces aplicando esperanzas a la anterior expresi´on (asumiendo que δ˜1 es constante): E(β˜1 ) = β1 + β2 δ˜1 El sesgo ser´a igual a: sesgo = E(β˜1 ) − β1 = β2 δ˜1 Econometr´ıa Abril 16. Supongamos adicionalmente que los supuestos (1).

cualquier omisi´ on de una variable relevante generar´a sesgo en los estimadores MCO.El Modelo Lineal General: Propiedas Estad´ısticas Omisi´ on de una Varible Irrelevante Observemos la siguiente tabla para ver el signo del sesgo en nuestro ejemplo anterior: β2 > 0 β2 < 0 Corr (x1 . Econometr´ıa Abril 16. x2 ) > 0 Sesgo positivo Sesgo Negativo Corr (x1 . x2 ) < 0 Sesgo Negativo Sesgo Positivo En un caso m´as general el signo del sesgo es m´as dif´ıcil de predecir ya que depende de como se relacionan cada par de regresores en el modelo econom´etrico. De cualquier forma. 2016 45 / 54 .

.. x2 .. 2016 46 / 54 . . x2 . Econometr´ıa Abril 16.. xK ) no nos dar´an informaci´on sobre la varianza del error. . es decir este u ´ltimo no se 2 modificar´a (σ ).El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad El supuesto de homocedasticidad lo vimos anteriomente para el caso del modelo simple. En el caso del Modelo Lineal General el supuesto de homocedasticidad es: (5) Homocedasticidad: Var (u|x1 . los valores que toma (x1 . B´asicamente nos dice que el error tiene varianza constante y que esta no depende de los valores que puedan tomar los regresores del modelo... x3 ) = Var (u) = E(u 2 ) = σ 2 En este caso.

Permite determinar la precisi´ on de los estimadores y influye en los resultados que obtendremos sobre intervalos de confianza y pruebas de hip´otesis. (2).. (3).El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad Los supuestos (1). 2016 47 / 54 . . 2.K es igual a: σ2 Var (βˆj ) = PN x )2 (1−Rj2 ) i=1 (xji −¯ La varianza es un indicador bastante importante en la pr´actica.. (4) y (5)se cumplen entonces se puede demostrar que la varianza del estimados MCO βˆj ∀ j = 1. Econometr´ıa Abril 16.

(iii) El tercer factor que influye en la varianza es Rj2 . Para aumentar la variaci´ on de nuestro regresor necesitamos aumentar el tama˜ no de muestra. (ii) Una mayor varianci´ on muestral del regresor sobre el cual estimamos el par´ametro βj generar´a mejor precisi´ on de nuestro estimador. 2016 48 / 54 . lo cual se traduce en mayor varianza de los estimadores (menor precisi´ on). Veamoslo detenidamente Econometr´ıa Abril 16.El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad Veamos los componentes que afectan el tama˜ no de la varianza: (i) Una mayor varianzan del error genera mayor ruido (variaci´on no explicada en el modelo).

R12 nunca ser´a igual a 1 por nuestro supuesto (3). Si el modelo econom´etrico es: y = β0 + β1 x1 + β2 x2 + u Entonces la varianza de βˆ1 es: 2 Var (βˆ1 ) = Pi=1 σ N (x1i −¯ x )2 (1−R12 ) Donde el R12 se obtiene de la regresi´ on: ˆ xˆ1 = δ0 + δˆ1 x2 El R12 nos mostrar´a como se correlacionan x1 y x2 . Econometr´ıa Abril 16. Mientras m´as alta sea la relaci´on (lineal) de ambas variables R12 ser´a m´as cercano a 1 lo cual empeorar´a la precisi´ on de nuestro estimador βˆ1 (multicolinealidad).El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad Rj2 es el que se obteniene de la regresi´ on de xj sobre el resto de los regresores. 2016 49 / 54 .

Sustituyendo esta variable en la varianza tendremos: ˆ (βˆk ) = Var Pi=1 N Econometr´ıa σ ˆ2 (xij −¯ x )2 (1−Rj2 ) Abril 16.El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad Dado que no se conoce E(u 2 ) = σ 2 ustilizaremos el promedio de los residuos estimados en el modelo: σ ˆ2 = PN ˆi )2 i=1 (u N−K −1 Donde N − K − 1 se denominan grandos de libertad. 2016 50 / 54 .

El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad ¿Que es lo que pasa con la varianza si inclu´ımos una varaible adicional en nuestro modelo? Supongamos que tenemos dos posibles especificaciones: y = β0 + β1 x1 + e y = β0 + β1 x1 + β2 x2 + u La varianza de nuestro estimador β˜1 y βˆ1 ser´a respectivamente: Var (β˜1 ) = Var (βˆ1 ) = Pi=1 N Econometr´ıa 2 Pi=1 σ x )2 N (x1i −¯ σ2 (x1i −¯ x )2 (1−R12 ) Abril 16. 2016 51 / 54 .

Incluso cuando la inclusi´ on de una variable aumenta la varianza de nuestra estimaci´on. Si la variable x2 es relevante β2 6= 0 pero incorrelada con x1 (R12 = 0 ) entonces Var (β˜1 ) = Var (βˆ1 ). ya que si esta es relevante podr´ıa generar sesgo que no disminuye con el tama˜ no de muestra pero la varianza si lo har´a. Si la variable x2 es relevante β2 6= 0 y correlada con x1 (R12 > 0 ) entonces Var (β˜1 ) < Var (βˆ1 ). deber´ıamos incluirla en el modelo. Econometr´ıa Abril 16. 2016 52 / 54 .El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad Entonces si la variable x2 no es relevante β2 = 0 y por tanto Var (β˜1 ) < Var (βˆ1 ).

2016 53 / 54 .El Modelo Lineal General: Propiedas Estad´ısticas Varianza: El Supuesto de Homocedasticidad Veamos si esto se cumple para el ejemplo de retornos a la educaci´on: Econometr´ıa Abril 16.

Econometr´ıa Abril 16. insesgados porque en promedio son iguales a su valor real. 2016 54 / 54 . βˆ2 . (4) y (5) los estimadores (βˆ0 . βˆ1 . Mejores porque son los m´as eficientes (menor varianza). (1).. lineales ya que son lineales en y .El Modelo Lineal General: Propiedas Estad´ısticas El Teorema de Gauss-Markov Bajo los Supuestos (1). (3).. βˆK ) MCO son los Mejores Estimadores Lineales Insesgados (MELI). (2). ..