You are on page 1of 33

APUNTES

ECONOMETR A

Unin de Estudiantes de Ciencias Econmicas | AECUC3M

Unin de Estudiantes de Ciencias Econmicas

Tema 1 Modelizaci n y Datos Econom tricos


Concepto de Modelo Econom trico La Econometr a se basa en el desarrollo de m todos estad sticos destinados a estimar las relaciones econ micas. La Econometr a se centra en los problemas inherentes a la recopilaci n y al an lisis de datos econ micos no experimentales. La Econometr a es una rama de la Estad stica basada en el planteamiento de modelos que relacionen variables econ micas. Uno de los objetivos principales de la Econometr a es realizar an lisis causal, que permite determinar los efectos de ciertas pol ticas; y caracterizar y cuantificar la relaci n de comportamiento entre variables econ micas. Las variables: 1. Variables observacionales: Son aquellas que se pueden medir. a) Variable Dependiente: Es aquella que tratamos de explicar. b) Variable Independiente: Es aquella que explica o causa a la variable dependiente. Dicho de otra forma, la variable dependiente estarcausada por las variables independientes. y Variable dependiente Variable explicada Variable respuesta Variable predicha Regresando x Variable independiente Variable explicativa Variable de control Variable predictor Regresor

Concepto de Econometr a

Componentes del modelo econom trico

2. Variables no observacionales: Son aquellas que no se pueden medir por estar contenidas en el t rmino de error. Los Par metros: Si est n contenidos en la ecuaci n del modelo, se llamar n par metros estructurales. Los Datos: 1. Datos de Secci n Cruzada o Corte Transversal: a) Definici n: Son conjuntos de observaciones de una o m s variables medidas en distintas unidades econ micas. b) Ejemplo: Salario de un grupo de trabajadores de una empresa; Ventas de un conjunto de empresas en 2009, etc. 2. Datos de Serie Temporal: a) Definici n: Son conjuntos de observaciones de una o m s variables medidas a lo largo del tiempo en per odos regulares. b) Ejemplos: El IPC mensual, el crecimiento del PIB trimestral,etc. 3. Datos de Panel:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


a) Definici n: Son conjunto de observaciones de una co m s variables medidas en distintas unidades econ micas, en dos per odos distintos de tiempo, entre los que se produce un cambio estructural. b) Ejemplo: Medimos el precio de un conjunto de viviendas antes y despu s de construir un verdadero pr ximo. Propiedades de las Esperanzas, Covarianzas ,Varianzas, Sumatorios y L mites Probabil sticos Propiedades de las Esperanzas Propiedades de las Varianzas Propiedades de las Covarianzas La suma del producto de una constante por una variable, es igual a k veces la sumatoria de la variable.

Propiedades de los Sumatorios

El sumatorio hasta N de una constante, es igual a N veces la constante.

El sumatorio de una suma es igual a la suma de las sumatorias de cada t rmino.

El sumatorio de un producto no es igual al producto de las sumatorias de cada t rmino.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


El sumatorio de los cuadrados de los valores de una variable no es igual a la sumatoria de la variable elevado al cuadrado.

Aplicaci n de las propiedades de los Sumatorios: 1. C lculo de la Varianza de X:

2. C lculo de la Covarianza entre X e Y:

Propiedades de L mites Probabil sticos

El l mite probabil stico de un constante es igual al constante.

El l mite probabil stico del producto de un constante por una variable es igual al constante por el l mite probabil tico de la variable.

El l mite probabil stico de una suma o resta de dos variables es igual a la suma o resta de l mites probabil sticos de las dos variables.

El l mite probabil stico de un producto entre dos variables es igual al producto de los l mites probabil sticos de las dos variables.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

El l mite probabil stico de un cociente entre dos variables es igual al cociente de los l mites probabil sticos de las dos variables.

Introducci n

Efecto Causal

Concepto de Esperanza Condicionada y Causalidad CETERIS PARIBUS El objetivo de los modelos econom tricos es predecir Y en funci n de X. Dando por hecho que entr ambas variables existe una relaci n de causalidad, es decir, que Y est causada por X puede demostrarse que la mejor predicci n de Y en funci n de X es la Esperanza de Y condicionada a X, E(Y/X), o Esperanza Condicional. Tambi n se le conoce como Funci n de Regresi n Poblacional. El objetivo de los economistas es inferir si una variable tiene un efecto causal sobre otras variables. Para obtener este efecto causal, debemos aislar el efecto de las otras variables influyentes en el salario. Esto es lo que se conoce como causalidad CETERIS PARIBUS, es decir, mantenemos constantes el resto de variables influyentes en Y.

Propiedades de las Esperanzas Condicionadas

Suponemos que Z=g(X) Suponemos que Z=a+bX+cY Ley de Esperanzas Iteradas: Descomposici n de la Varianza Marginal:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 2

Modelo de Regresi n Lineal Simple


Concepto y Tipos de Predicci n El objetivo del Modelo de Regresi n Lineal Simple es predecir la variable dependiente Y, utilizando la informaci n de la variable independiente X. El concepto de predicci n consiste en elaborar una predicci n c(X), al ser una funci n de x. Evidentemente cometeremos un error de predicci n (u), que serla diferencia entre el valor real de Y y nuestra predicci n c(X): Como el error de predicci n (u) puede ser positivo, negativo o nulo, para asegurarnos de que siempre obtengamos magnitudes positivas, definimos el Error Cuadr tico Medio de la Predicci n ECM (u): Nuestro objetivo es encontrar la predicci n c(X) que haga que el ECM (u) sea m nimo. Mejor Predicci n Constante: a) Supuesto: No conocemos la informaci n de la variable X y la funci n c(X)=c b) Minimizando esta funci n, obtenemos la mejor predicci n constante de la variable Y. c) Predictor: La media poblacional es el mejor predictor constante de la variable Y. Mejor Predicci n Lineal: a) Supuesto: Conocemos la variable X para predecir la variable Y, y la funci n c(X) es de tipo lineal, de tal manera que . b) Minimizando este error cuadr tico medio, obtenemos la mejor predicci n lineal, y la llamamos Proyecci n Lineal de Y/X o Predictor Lineal ptimo de Y/X.

Concepto

Tipos de Predicci n

La Mejor Predicci n: a) Supuesto: Conocemos la variable X antes de hacer la predicci n de la variable Y. En este caso, la funci n c(X) puede ser lineal o no lineal, pero en general es desconocida. b) Minimizando esta funci n, obtenemos la mejor predicci n de la variable Y, que serla Esperanza de Y condicionada a X, E(Y/X), o Funci n de Esperanza Condicional. c) Si E(Y/X) es Lineal, entonces coincidircon la proyecci n lineal:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


d) Si E(Y/X) no es lineal, entonces no coincidircon la proyecci n lineal.

Supuestos del Modelo de Regresi n Lineal Simple Linealidad en los Par metros del Modelo Esto quiere decir, que el modelo serlineal si los par metros ( son lineales. Por lo tanto, un modelo puede no ser lineal en variables, pero s lo es en per metros, se considerarque cumple este supuesto. Suponemos que , donde es el t rmino de error o peturbaci n, y es una variable aleatoria que recoge el efecto de las variables explicativas no incluidas en el modelo. Implicaciones del Supuesto: 1. Se cumple que . 2. La , Incorrelaci n entre X y , tambi n se puede decir que X es ex geno. 3. La funci n de Esperanza condicional serlineal, es decir, Supone que la Varianza Condicionada del Error es Constante e igual a . Implicaciones del Supuesto: 1. 2. Estimaci n del Modelo: M nimos Cuadrados Ordinarios Las expresiones que se cumplen en t rminos muestrales tambi n se cumplir n en t rminos poblacionales (y viceversa). POBLACIONAL MUESTRAL

Homocedastici dad

Principio de Analog a

Condiciones de Primer Orden para las Estimaciones MCO

Las condiciones de primer orden para las estimaciones MCO es una expresi n que viene del c lculo de optimizaci n. La expresi n M nimos Cuadrados Ordinarios viene del hecho de que estos valores estimados minimizan la suma de los cuadrados de los residuos. Minimizar la Suma de los Cuadrados de los Residuos: Dado que , por lo que Nuestro objetivo es minimizar la suma de los residuos al cuadrado, es decir:

Una condici n necesaria para que

sean soluciones del problema de minimizaci n es

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


que las dedivadas parciales de la funci n sea igual a 0.

Propiedades Algebraicas de los Estimadores MCO

Por lo tanto observamos que para que sea un estimador ptimo, la condici n es que , y para que sea un estimador ptimo, la condici n es que . Y estas dos condiciones son las dos implicaciones de uno de los supuestos del MRLS: y . La suma, y por lo tanto, la media muestral de los residuos MCO es nula:

Esta propiedad deriva directamente de la condici n de primer orden de los MCO. La Covarianza muestral entre los regresores y los residuos MCO es nula:

El punto

siempre estsobre la recta de regresi n MCO, es decir

Estimaci n de la varianza del error

Aplicando las propiedades anteriores, observamos que , y dado que , por lo tanto, . Distinci n entre los errores y los residuos: Los errores nunca son observables, y aparecen en la ecuaci n que contiene los par metros poblacionales: Los residuos se calculan a partir de los datos, y aparecen en la ecuaci n estimada:

Estimaci n de la varianza del error: Luego, un estimador de ser a:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Sin embargo, este estimador tiene un sesgo, porque no considera las restricciones que los residuos MCO deben satisfacer. Estas restricciones vienen dadas por las dos condiciones de primer orden del estimador MCO: y . Un estimador insesgado de ser a:

Teorema de Gauss-Markov Linealidad

Propiedades de los Estimadores MCO De entre todos los estimadores, los estimadores MCO son lineales, insesgados y tienen varianza m nima, es decir, que son ptimos. Significa que y son en realidad, funciones lineales de Y.

Insesgadez

Decimos que un estimador es insesgado o centrado cuando su esperanza es igual al par metro que estimamos.

Varianza m nima

Puede demostrarse que y estimadores m s eficientes.

de MCO tienen m nima varianza, y por tanto, ser n los

Consistencia

Los estimadores y son estimadores consistentes si a medida que se incrementa el tama o muestral, su valor se aproxima al verdadero par metro poblacional. En t rminos econom tricos, la consistencia equivale a convergencia en probabilidad.

Introducci n

Interpretaci n de los coeficientes Al plantear cualquier modelo de regresi n, nuestro objetivo es interpretar el efecto de x sobre y. Para que los par metros de un modelo puedan interpretarse, el modelo tiene que ser lineal en par metros. Como vimos, la condici n para que el modelo sea lineal era el cumplimiento del . Esto viene a significar que, si ,entonces los par metros no tendr n interpretaci n. Concepto de Variaci n Absoluta, Variaci n Relativa y Variaci n Porcentual: Ejemplo: Supongamos que el salario de un individuo (x) al mes son 2000, y su salario se incrementa hasta 2500. Vamos a calcular la variacin absoluta, relativa y porcentual del salario: Variaci n Absoluta:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Variaci n Relativa:

Variaci n Porcentual:

Concepto de Elasticidad y Semielasticida d Modelo Lineal

Elasticidad: Cuando las 2 variables est n expresados en funci n de Ln. Semielasticidad: Cuando s lo 1 de las variables se ve afectado por Ln.

Interpretaci n de

Ante un incremento de 1 unidad en X, le corresponde en promedio una variaci n de en Y. Elasticidad de Y con respecto a X:

unidades

En este modelo, la elasticidad no es constante, puesto que depende de los valores de X e Y. Modelo Logar tmico-Li neal Interpretaci n de :

Ante un incremento de 1 unidad en X, le corresponde en promedio una variaci n de puntos porcentuales en Y. Elasticidad de Y con respecto a X:

En este modelo, la elasticidad no es constante, puesto que depende del valor de X. Modelo Lineal-Logar t mico Interpretaci n de :

Ante un incremento de 1 punto porcentual en X, le corresponde en promedio una variaci n de unidades en Y. Elasticidad de Y con respecto a X:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

En este modelo, la elasticidad no es constante, puesto que depende del valor de Y. Modelo Doble Logar tmico Interpretaci n de :

Ante un incremento de 1 punto porcentual en X, le corresponde en promedio una variaci n de puntos porcentuales en Y. Elasticidad de Y con respecto a X:

Unidades de Medida

En este modelo, la elasticidad es constante. Los estimadores MCO cambian en una forma totalmente previsible cuando se modifican las unidades de medida de las variables dependientes e independientes. Si la variable dependiente (Y) se multiplica por la constante c, entonces los valores estimados MCO del t rmino constante y de la pendiente tambi n se multiplican por c. Si la variable independiente (X) se divide o se multiplica por una constante no nula, c , entonces el coeficiente de la pendiente MCO se multiplica o se divide por c, respectivamente. El cambio s lo en las unidades de medida de la variable independiente no afecta al t rmino constante. Bondad de Ajuste Suma de Cuadrados Total (SCT): SCT=SCM+SCE

Suma de Cuadrados

Suma de Cuadrados del Modelo (SCM):

Suma de Cuadrados de los residuos (SCE):

R-cuadrado

Es una forma de medir la capacidad de la variable independiente o explicativa X de explicar la variable dependiente. R-cuadrado es la proporci n de la variaci n explicada en comparaci n con la variaci n total.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Se interpreta como la fracci n de la variaci n muestral en Y que viene explicada por X. 100* es el porcentaje de la variaci n muestral de Y que viene explicada por X.

tambi n es igual al cuadrado del coeficiente de correlaci n muestral entre

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 3

Modelo de Regresi n M ltiple


Modelo con k variables explicativas Linealidad en los par metros: Esto quiere decir, que el modelo serlineal si los par metros ( son lineales. Por lo tanto, un modelo puede no ser lineal en variables, pero s lo es en per metros, se considerar que cumple este supuesto. : Se trata de un supuesto fundamental del modelo y tiene las siguientes implicaciones: 4. Se cumple que . 5. La , Incorrelaci n entre y . 6. La funci n de Esperanza condicional serlineal, es decir: Homocedasticidad: Supone que la Varianza Condicionada del Error es Constante e igual a

Supuestos del Modelo de Regresi n M ltiple

Implicaciones del Supuesto: 3. 4. No Colinealidad Perfecta: Supone que no existe ninguna combinaci n lineal exacta entre variables explicativas, porque si existiese, el modelo presentar a multicolinealidad o Colinealidad y no podrestimarse. Es importante tener en cuenta que el supuesto s permite que las variables independientes est n correlacionadas, lo que no pueden es estar perfectamente correlacionadas. Ejemplos de combinaciones exactas de variables:

Modelo con dos variables explicativas

Un caso especialmente importante en este modelo es el caso de Incorrelaci n entre decir, . Por lo tanto:

, es

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Condici n de Primer Orden

Estimaci n del Modelo de Regresi n M ltiple: MCO Dado que , por lo que Nuestro objetivo es minimizar la suma de los residuos al cuadrado, es decir:

Una condici n necesaria para que y sean soluciones del problema de minimizaci n es que las dedivadas parciales de la funci n sea igual a 0.

Propiedades Algebraicas de los Estimadores MCO Interpretar la ecuaci n de la regresi n MCO para 2 variables

La media muestral de los residuos es cero. La Covarianza muestral entre cada variable independiente y los residuos MCO es cero, de lo que se desprende que la covarianza muestral entre los valores ajustados MCO y los residuos MCO es cero. El punto siempre estsobre la recta de regresi n MCO. Interpretaci n de los Coeficientes en un Modelo de Regresi n M ltiple El par metro del t rmino constante es el valor predicho de y cuando = =0. Siempre se necesita el par metro del t rmino constante para obtener una predicci n de y a partir de la recta de regresi n MCO. Los valores estimados y tienen interpretaciones de efecto parcial o ceteris paribus.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


independientes Cuando Cuando se mantiene fijo, de forma que se mantiene fijo, de forma que , entonces: , entonces:

Interpretar la ecuaci n de la regresi n MCO para m s de 2 variables independientes

Escrito en t rminos de cambios: El coeficiente de mide el cambio en por cada incremento en una unidad de manteniendo fijas las restantes variables independientes. ,

Formas Cuadr ticas

La utilidad del an lisis de regresi n m ltiple reside en que nos proporciona una interpretaci n ceteris paribus aun cuando los datos no hayan sido recogidos de una forma ceteris paribus. La utilidad del an lisis de regresi n m ltiple reside en que nos permite hacer en un medio no experimental lo que los cient ficos hacen en el medio controlado de un laboratorio: mantener fijos el resto de los factores. Cuando planteamos el modelo de regresi n, el primer supuesto que realizamos es la linealidad en los par metros. Sin embargo, las variables no tienen porquser lineales. Puede ocurrir que al plantear un modelo de regresi n para recoger el efecto de alguna variable explicativa, no baste con incluirla en forma lineal, sino que tengamos que incluir un t rmino cuadr tico. Cuando la variable contiene un t rmino cuadr tico, la interpretaci n se realiza a partir de la primera derivada del modelo:

Sustituyendo las derivadas por los incrementos:

T rminos de Interacci n

Interpretaci n del efecto de la variable independiente Ante un incremento de 1 unidad en , le corresponde una variaci n en promedio de unidades en Y, manteniendo el restos de variables independientes fijos. Por tanto, este efecto no es constante, y dependerdel valor que tome . Puede ocurrir que al plantear un modelo de regresi n, el efecto de una variable explicativa dependa de otras variables explicativas del modelo. Cuando esto ocurre, es necesario introducir t rminos de interacci n. Para obtener en este caso el efecto parcial ceteris paribus de derivada: , habrque plantear la siguiente

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Sustituyendo las derivadas por los incrementos:

Teorema de Gauss-Markov Linealidad Insesgadez

Interpretaci n del efecto de la variable independiente Ante un incremento de 1 unidad en , le corresponde una variaci n en promedio de unidades en Y, manteniendo el restos de variables independientes fijos. Por tanto, este efecto no es constante, y dependerdel valor que tome . Propiedades de los Estimadores de MCO: Teorema de Gauss-Markow De entre todos los estimadores, los estimadores MCO son lineales, insesgados y tienen varianza m nima, es decir, que son ptimos. Significa que Si se cumple el supuesto insesgados: se pueden expresar mediante una combinaci n lineal de Y. , entonces los estimadores MCO ser n

Varianza M nima

Se puede demostrar que los estimadores MCO tienen la menor varianza de entre todos los estimadores lineales e insesgados.

Donde regresi n de Consistencia

es la varianza muestral total de sobre el resto de las variables independientes.

,y

es el R-cuadrado de la

Los estimadores son estimadores consistentes si a medida que se incrementa el tama o muestral, su valor se aproxima al verdadero par metro poblacional. En t rminos econom tricos, la consistencia equivale a convergencia en probabilidad.

Inferencia en los Modelos de Regresi n Contraste de Hip tesis de un nico par metro poblacional Hip tesis nula: Interpretaci n: Contrastar que no tiene ning n efecto sobre el valor esperado de Y. Estad stico de Contraste:

1. Como

siempre es positivo,

tiene el mismo signo que

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


2. La estimaci n puntual nunca serexactamente igual a 0, sea o no cierta la hip tesis nula. La cuesti n es saber a qudistancia est de 0. 3. Estamos contrastando hip tesis sobre los par metros poblacionales. No estamos contrastando hip tesis sobre las estimaciones obtenidas de una muestra particular. 4. En Econometr a, todas las muestras son Asint ticas (n>30), y estos estad sticos convergen a una distribuci n normal: Contraste frente a alternativas unilaterales: 1. Bajo la hip tesis alternativa 2. Regla de Rechazo: , el valor esperado de es positivo.

, siendo c el valor cr tico.

3. Para grados de libertad mayores que 120, se pueden usar los valores cr ticos de la normal tipificada. 1. Bajo la hip tesis alternativa 2. Regla de Rechazo: , el valor esperado de , siendo c el valor cr tico. es negativo.

Contraste frente a alternativas bilaterales: 1. Bajo esta alternativa, positivo o negativo. 2. Regla de Rechazo: tiene un efecto ceteris paribus en Y, sin especificar si el efecto es

, siendo c el valor cr tico.

Interpretaci n del Resultado de Contraste: 1. Si se rechaza , decimos que es estad sticamente significativo. 2. Si no se rechaza , decimos que es estad sticamente no significativo. Contraste de otras hip tesis sobre :

C lculo de p-valores: El p-valor es el nivel de significatividad m s peque o al que se rechazar a la hip tesis nula. Intervalo de Confianza:

Contraste de Hip tesis acerca de una

Hip tesis nula:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


nica combinaci n lineal de los par metros Hip tesis Alternativa:

Estad stico de Contraste:

C lculo de

Otra forma de c lculo:

Sustituir Contraste de Restricciones Lineales M ltiples

en la regresi n original y estimamos:

Noci n b sica: 1. El contraste de Restricciones Lineales M ltiples se utiliza para contrastar si un conjunto de variables independientes no ejerce un efecto parcial sobre la variable dependiente. 2. Modelo No Restringido: Aquel modelo inicial que contiene todas las variables explicativas. 3. Modelo Restringido: Aquel modelo resultado de haber sustituido las hip tesis nulas en el modelo inicial. Contraste de Restricciones de Exclusi n: Modelo no restringido:

Hip tesis nulas y alternativas:

Modelo restingido:

Estad stico de Contraste:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Como no puede ser menor que , el estad stico F es siempre positivo. En Econometr a, todas las muestras son Asint ticas (n>30), y estos estad sticos convergen a una distribuci n chi-cuadrado :

Notaci n: q= n mero de restricciones de exclusi n de . k= n mero de variables explicativas del modelo no restringido. Interpretaci n del Resultado de Contraste: 1. Si se rechaza , decimos que son estad sticamente significativa de forma conjunta al nivel de significatividad adecuado. 2. Si no se rechaza , entonces las variables son conjuntamente no significativas. Relaci n entre los estad sticos t y F: Se puede demostrar que el estad stico F para contrastar la exclusi n de una nica variable es igual al cuadrado del estad stico t correspondiente. O bien,

La forma R-cuadrado del estad stico F: 1. Una raz n para utilizar la forma de R-cuadrado se halla en que el R-cuadrado estsiempre entre 0 y 1, mientras que las SCE pueden ser muy grandes dependiendo de las unidades de medida de Y. 2. Forma R-cuadrado del estad stico F:

En Econometr a, todas las muestras son Asint ticas (n>30), y estos estad sticos convergen a una distribuci n chi-cuadrado :

3. Como , esto demuestra de nuevo que el estad stico F siempre serpositivo. 4. Es importante no elevar al cuadrado el R-cuadrado antes de introducirlo en la f rmula, puesto que la elevaci n al cuadrado ya se ha realizado. El Estad stico F para la significatividad conjunta de una regresi n:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Modelo no restringido:

Hip tesis nulas y alternativas:

Modelo restingido:

Estad stico de Contraste:

En este caso, R-cuadrado de

es igual a 0.

Contraste de Restricciones Lineales Generales: Modelo no restringido:

Hip tesis nulas y alternativas:

Modelo restingido:

Estad stico de Contraste:

En este caso, el modelo restringido es un modelo con un t rmino constante, pero con una variable dependiente diferente de la del modelo no restingido. Por lo tanto, no podemos utilizar la forma R-cuadrado del estad stico F. Como Regla General, deber a usarse la forma SCE del estad stico F si la regresi n restringida presenta una variable dependiente distinta a la de la regresi n no restringida.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 4

Variables Binarias
Variables Binarias En la investigaci n econom trica suelen aparecer fen menos de discriminaci n por raz n de sexo, raza, nivel de estudios, lugar de residencia, etc, que no pueden analizarse utilizando nicamente variables cuantitativas. Para analizar estos fen menos discriminatorios, necesitaremos introducir informaci n cualitativa en los modelos. Las variables cualitativas se introducen en los modelos mediante variables binarias, ficticias o dummies. Se trata de variables que toman nicamente dos valores: 1. Valor 1: Cuando el individuo o el elemento analizado cumpla una determinada caracter stica. 2. Valor 0: Cuando el elemento o individuo analizado no cumple la citada caracter stica. Siempre se cumplirque podamos definir tantas variables ficticias como niveles o categor as que tenga la variable cualitativa. Siempre se cumplirque la suma de las variables binarias de una variable cualitativa es igual a 1. Si el modelo tiene t rmino constante ( ), tendremos que eliminar una variable binaria por cada variable cualitativa, porque de lo contrario aparecer a un problema de multicolinealidad perfecta, y el modelo no podr a estimarse. Si el modelo no tiene t rmino constante, podemos introducir todas las variables binarias. El objetivo de las variables binarias es comparar regresiones de distintos colectivos y para ello, se pueden introduir las variables binarias de dos formas: 1. En forma aditiva: Cuando queramos analizar las posibles diferencias en los t rminos constantes de las regresiones de los distintos colectivos. 2. En forma de interacci n: Cuando queramos analizar posibles diferencias en las pendientes de las regresiones de los distintos colectivos. Modelos B sicos que utilizan Variables Binarias Para explicar la variable dependiente Y (Salario), utilizamos nicamente la variable cualitativa (Sexo) con variables binarias nicamente en forma aditiva. En primer lugar, tendremos que definir las variables binarias correspondientes a las 2 categor as del sexo:

Introducci n

Concepto

M todo de Introducci n de las Variables Binarias en el Modelo

Modelo 1

A continuaci n podremos plantear dos modelos alternativas: 1. Modelo con T rmino Constante: En este caso, deber amos eliminar una variable binaria para evitar la multicolinealidad, por ejemplo, : En estos modelos, es especialmente importante la interpretaci n de coeficientes, as como los contrastes de discriminaci n, que sirven para verificar si existen diferencias entre los

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


distintos colectivos. Tomando las esperanzas condicionadas de la ecuaci n anterior, vamos a obtener las ecuaciones salariables de mujeres y hombres: Salario Medio de Mujer: Salario Medio de Hombre: Restando las esperanzas condicionadas, obtenemos: Interpretaci n de Coeficientes: : Salario Medio de los Hombres. : La diferencia salarial media entre mujeres y hombres. Contraste: Para contrastar si existe discriminaci n salarial entre mujeres y hombres:

2. Modelo sin T rmino Constante: Al no incluir el t rmino constante, podremos introducir las dos variables binarias, y la educaci n del modelo ser a: Tomando esperanzas condicionadas en la ecuaci n anterior, obtenemos: Salario Medio Mujer: Salario Medio Hombre: Interpretaci n de los Coeficientes: y ser an respectivamente los salarios medios de mujeres y hombres. Contraste: Para contrastar si existen diferencias salariales entre mujeres y hombres, habr a que plantear:

Modelo 2

Conclusi n: 1. Comparando el modelo con t rmino constante y el modelo sin t rmino constante, deducimos que en los modelos con t rmino constante, el coeficiente de la variable binaria mide los EFECTOS DIFERENCIALES, mientras que en los modelos sin t rmino constante, los coeficientes de las variables binarias miden EFECTOS ABSOLUTOS. Para explicar la variable dependiente Y (Salario), utilizamos la variable cuantitativa a os de estudio ( ) y la variable cualitativa sexo, con variables binarias nicamente en forma aditiva. En primer lugar, definimos las dos variables binarias correspondientes al sexo:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Vamos a centrarnos en el modelo con t rmino constante y para plantearlo, eliminamos una de las variables binarias, por ejemplo, . La ecuaci n del modelo ser a la siguiente:

Tomando esperanzas condicionadas en la ecuaci n anterior, obtenemos las ecuaciones salariales de mujeres y hombres: 1. Salario Medio de Mujeres:

2. Salario Medio de Hombres: 3. Restando las esperanzas condicionadas: Interpretaci n de los Coeficientes: 1. : Salario medio de los hombres sin estudios ( ). 2. : Pendiente de los dos colectivos, y decimos que a un incremento de un a o en los estudios, le corresponde, en promedio, una variaci n de unidades monetarias en los salarios de mujeres y hombres. 3. : Diferencia salarial media entre mujeres y hombres a igualdad de a os de estudios, o manteniendo en ceteris paribus. Contraste: Para verificar si existen diferencias salariales entre mujeres y hombres:

Modelo 3

Para explicar la variable dependiente Y (Salario), utilizamos la variable cuantitativa a os de estudio ( ) y la variable cualitativa sexo, con variables binarias nicamente en forma aditiva. En primer lugar, definimos las dos variables binarias correspondientes al sexo:

Vamos a centrarnos en el modelo con t rmino constante y para plantearlo, eliminamos una de las variables binarias, por ejemplo, . La ecuaci n del modelo ser a la siguiente: Al incluir la variable binaria en forma aditiva y de interacci n con , este modelo permite analizar diferencias en el t rmino constante y la pendiente de las regresiones de mujeres y hombres. Tomando esperanzas condicionadas en la ecuaci n anterior, obtenemos las ecuaciones salariales de mujeres y hombres. 1. Salario Medio de Mujeres:

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


2. Salario Medio de Hombres:

3. Restando las esperanzas condicionadas: Interpretaci n de los Coeficientes: 1. : Salario medio de los hombres sin estudios ( ). 2. : A un incremento de un a o en los estudios, le corresponde, en promedio, una variaci n de unidades monetarias en el salario de los hombres. 3. : La diferencia salarial media entre mujeres y hombres a igualdad de a os de estudio. 4. : La diferencia salarial media entre mujeres y hombres cuando ambos incrementan un a o en sus estudios. Adem s, en los modelos con t rminos de interacci n que incluyen variables binarias, pueden pedir el EFECTO PARCIAL de la variable explicativa que acompa a a la variable binaria. Por ejemplo, para hallar el efecto parcial del rendimiento de la educaci n ( ):

L gicamente, este efecto no es constante. Podr amos contrastar si el efecto parcial de la educaci n depende del sexo, planteando lo siguiente:

Tambi n se puede plantear otros contrastes como los siguientes: 1. Para contrastar si existen diferencias en el t rmino constante de las regresiones de mujeres y hombres, planteamos:

2. Para contrastar si existen diferencias en la pendiente de las regresiones de mujeres y hombres:

3. Para contrastar si existen diferencias salariales entre mujeres y hombres:

Observaciones

Adem s de estos 3 modelos b sicos, se pueden plantear modelos m s complejos que incluyan 2 o m s variables cualitativas e incluso podr n aparecer t rminos de interacci n entre 2 variables binarias. En cualquier caso, siempre tendremos en cuenta que si el modelo tiene t rmino constante, tendremos que eliminar una variable binaria por cada variable cualitativa para evitar la multicolinealidad. Una vez planteado el modelo, calcularemos las diferencias entre colectivos tomando esperanzas condicionadas en el modelo poblacional.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Modelo de Diferencias en Diferencias Hasta ahora, todos los modelos planteados se estimaban apartir de datos de secci n cruzada, que eran conjuntos de observaciones de una o m s variables medidas en distintas unidades econ micas en un instante de tiempo. Por ejemplo, la renta de un conjunto de individuos en 2009. Se denominan datos de secci n cruzada fusionadas o datos de panel, a conjuntos de observaciones de una o m s variables medidas en distintas unidades econ micas en dos per odos distintos de tiempo entre los que ha habido alg n cambio estructural pol tico, econ mico o social. Por ejemplo, el precio de un conjunto de viviendas en 2005 y en 2010 entre los que ha habido un cambio estructural, una crisis econ mica. Para analizar los efectos de este cambio estructural, se plantea el modelo de diferencias en diferencias. Nuestro objetivo es evaluar la repercusi n de una elevaci n del tope m ximo en el subsidio de desempleo sobre la duraci n. Definici n de las Variables: : Duraci n del desempleo en semanas (medida en logaritmos).

Modelo de Diferencias en Diferencias

Aplicaci n

Escribimos el modelo en t rminos poblacionales: La ecuaci n anterior es un modelo de diferencias en diferencias, y tiene como objetivo, analizar c mo y a qui n afectarel cambio de pol ticia econ mica, que en este caso, es la elevaci n del tope m ximo del subsidio por baja laboral. A priori, esta medida s lo deber a afectar a los individuos de rentas altas, que perciben el mayor subsidio y no deber a afectar a los de rentas bajas. Comenzamos interpretando los coeficientes de la ecuaci n anterior: 1. : La duraci n de la baja laboral en logatirmos para los individuos de renta no alta antes del cambio. 2. : La diferencia en la duraci n de la baja entre antes y despu s del cambio para los individuos de rentas no altas. 3. : La diferencia en la duraci n de la baja laboral entre los individuos de renta alta y no alta antes del cambio. 4. : Mide el efecto causal del cambio de pol tica, es decir, la diferencia en la duraci n de la baja laboral de los individuos de rentas altas despu s del cambio.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 5

Errores de Especificaci n
Omisi n de Variables Relevantes (Subespecificaci n del Modelo) Consisite en eliminar del modelo alguna variable explicativa significativa. La exclusi n de una variable relevante o de subespecificaci n del modelo. Consideremos el siguiente modelo correctamente especificado, que cumple todos los supuestos: Sin embargo, por falta de informaci n, decidimos omitir la variable , que es relevante (significativa) porque . Por eso, planteamos el siguiente modelo mal especificado: Vamos a demostrar que la omisi n de la variable relevante . Teniendo en cuenta que el error: Tomando esperanzas condicionadas: El incumplimiento del supuesto provoca que los estimadores de MCO del modelo segundo sean SESGADOS e INCONSISTENTES. Para obtener el sesgo, necesitamos una expresi n que relacione los par metros de los dos modelos anteriores. Para ello, partimos de la expresi n de y en ella, sustituimos la variable Y por el verdadero modelo: hace que en el modelo segundo la

Concepto Omisi n de Variables Relevantes

Sesgo por Omisi n de Variable

por regla general: es un estimador sesgado de . tiene una interpretaci n simple: Es simplemente el coeficiente de la pendiente de la regresi n de sobre .

no es igual a

Por lo tanto, podemos expresar de la siguiente manera: El sesgo en es omisi n de variable. Resumen del sesgo en . Esto es lo que normalmente se denomina sesgo por cuando se omite : Sesgo Negativo

Sesgo Positivo

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


(Sobreestimaci n) Sesgo Negativo (Infraestimaci n) (Infraestimaci n) Sesgo Positivo (Sobreestimaci n) tiene un

Si , decimos que tiene un sesgo al alza. Si , decimos que sesgo a la baja. De forma general, se puede calcular el sesgo mediante la siguiente f mula:

Conclusi n

Concepto Inclusi n de Variables Irrelevantes

La omisi n de una variable relevante provoca SESGO e INCONSISTENCIA en el estimador de MCO excepto en el caso de incorrelaci n entre las variables omitidas y las variables incluidas. V( ) siempre es m s peque a que V( ). Inclusi n de Variables Irrelevantes (Sobreespecificaci n del Modelo) Significa que una o m s de las variables independientes que se han incluido en el modelo no tiene ning n efecto parcial sobre Y en la poblaci n, es decir, que su coeficiente poblacional es nulo. Supongamos que establecemos un modelo del tipo: Sin embargo, no tiene ning n efecto sobre Y cuando y han sido tenidos en cuenta, lo que significa que . En t rminos de Esperanzas Condicionadas, . En cuanto a la insesgadez de y , no tiene ning n efecto. El a adir una variable irrelevante a una ecuaci n normalmente produce un aumento de las varianzas del resto de los estimadores MCO debido a la multicolinealidad. El incluir una o m s variables irrelevantes en un modelo de regresi n m ltiple, o el sobreespecificar el modelo, no afecta a la insesgadez de los estimadores MCO. Al producir un incremento en las varianzas de dichos estimadores, lo que se conoce como P rdida de Eficiencia, como consecuencia de ello, la inferencia seguirsiendo v lida, pero escasamente fiable. Pese a ello, la inclusi n de variables irrelevantes tiene efectos menos graves que la omisi n de variables relevantes. Errores de Medida en las Variables Cuando planteemos un modelo, puede ocurrir que la variable dependiente o alguna variable independiente est n medidas con error. Especialmente grave es el error de medida en las variables explicativas, ya que provoca el SESGO y la INCONSISTENCIA de los estimadores de MCO. Supongamos el siguiente modelo: Este modelo no puede estimar, porque la variable dependiente observamos la variable Y, que cumple la siguiente ecuaci n: no es observable, y en su lugar,

Efectos

Conclusi n

Concepto

Error de Medida en la Variable Dependiente

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Nuestro objetivo es poder estimar el modelo, y para ello, despejamos y lo sustituimos en la ecuaci n primera:

en la ecuaci n anterior

Llamamos a

, luego:

A continuaci n, vamos a comprobar los efectos del error de medici n en Y y para ello, realizamos dos supuestos adicionales: 1. 2. Supuesto cl sico del Error de Medida en la Variable Dependiente: Suponemos que las variables explicativas y est n incorrelacionadas con el error de medida v. Es decir: y . Efectos de Error de Medida en la Variable Dependiente: 1. Se puede demostrar que si estimamos por MCO, obtendremos estimadores INSESGADOS y CONSISTENTES. 2. Aparentemente, el error de medida en la variable dependiente no tendr a consecuencias graves, pero no es as , porque el error del modelo ha aumentado, ha pasado de a . Adem s, la varianza de dicho error ha aumentado: Este incremento en la varianza del error provoca un incremento en las varianzas de los estimadores, lo que supone una P rdida de Eficiencia, y como consecuencia, la inferencia sigue siendo v lida pero poco fiable. 3. Estos efectos son id nticos a los de la inclusi n de variables irrelevantes. Caso especial en el error de medida en la variable dependiente: 1. Supongamos que , entonces se incumple el supuesto cl sico de error de medida en la variable dependiente. 2. L gicamente, v va a formar parte de u, por lo que . 3. Por lo tanto, la consecuencia serque Supongamos en el siguiente modelo: Como no es observable, el modelo no se puede estimar, y en su lugar, observamos X que cumple la siguiente ecuaci n: Adem s, antes de analizar los efectos de este error de medida, efectuamos los siguientes supuestos: 1. 2. Supuesto Cl sico del error de medida en la variable independiente: Suponemos que la variable medida con error estincorrelacionada con el error de medida v:

Error de Medida en la Variable Independiente

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Para poder estimar la ecuaci n, en primer lugar despejamos sustituimos en la ecuaci n primera: en la ecuaci n segunda, y lo

Llamamos a

, luego el modelo con todas las variables observables ser a:

Si estimamor la ecuaci n anterior por MCO, se produce un incremento en la varianza del error que provoca que aumenten tambi n las varianzas de los estimadores. Sin embargo, el efecto realmente importante, es el SESGO e INCONSISTENCIA de los estimadores de MCO. Para demostrar este sesgo, partimos de la expresi n de :

A continuaci n, vamos a demostrar que el error de medida en X provoca que estimador inconsistente de , es decir, .

sea un

Sesgo Asint tico o Sesgo de Inconsistencia:

Conclusiones sobre el sesgo: 1. A la vista de la expresi n obtenida, deducimos que si es positivo, el sesgo ser negativo. 2. La magnitud del sesgo depende directamente de la varianza del error de medida, ,e inversamente de la varianza de la variable medida con errores . 3. Existen dos casos especiales en los que el sesgo es nulo y es consistente: a) Si tiene un error de medida nulo ( ), entonces y el sesgo ser a 0. b) Supongamos que todas las observaciones de estuviesen medidas con el

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


mismo error, es decir tambi n ser a nulo. , en ese caso, , y el sesgo

Conclusi n: 1. El error de medida en las variables explicativas provoca sesgo e inconsistencia en todos los estimadores de MCO, excepto en los casos especiales. 2. La causa del sesgo es que la variable medida con error estcorrelacionada con el error del modelo inicial ( ), es decir, C( , . 3. En t rminos precisos, se dice que es una variable end gena. 4. El sesgo y la inconsistencia de los estimadores de MCO hace que la inferencia est invalidada.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas

Tema 6

Modelos con Variables Explicativas End genas


Estimaci n de Variables Instrumentales Antes de plantear este m todo de estimaci n debemos definir una variable instrumental e instrumento Z, que es una variable que cumple las dos siguientes condiciones: 1. La variable instrumental Z debe estar incorrelada con el t rmino de error del modelo , es decir, . Esta condici n no puede contrastarse, y s lo puede razonarse de manera ter rica. 2. La variable instrumental Z debe estar correlacionada con la variable end gena X. Es decir, . Esta segunda condici n de instrumento puede comprobarse planteando una regresi n de la variable end gena X frente a la variable instrumental Z. Planteamos el contraste de identificaci n:

Estimaci n de Variables Instrumentales

Si , por lo que X y Z estar n correlacionadas y se cumplirla segnda condici n de instrumento. Una vez comprobadas las dos condiciones de instrumento, si se cumplen, entonces ser a un instrumento v lido o adecuado. Para ello, introducimos en la C(Z,Y) el valor de la variable Y de la ecuaci n:

Aplicando el principio de analog a, obtenemos la expresi n del estimador de variables instrumentales:

Se puede demostrar que Insesgadez: Consistencia:

es un estimador INSESGADO y CONSISTENTE de

Sin embargo, a pesar de ser un estimador insesgado y consistente, ocurre que:

Donde es el coeficiente de determinaci n de la regresi n de X sobre Z. Conclusi n: 1. El estimador de MCO es siempre m s eficiente (tiene menor varianza) que el estimador de variable instrumental. 2. Cuanto mayor sea la relaci n entre X y Z, menor varianza tendrel estimador de

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


variables instrumentales. 3. Bajo endogeneidad, utilizaremos el estimador de variables instrumentales. Estimaci n por M nimos Cuadrados Biet picos o en dos etapas (MC2E) Hasta ahora, hemos analizado el problema de la endogeneidad nicamente en el Modelo de Regresi n Simple. La soluci n de la estimaci n de Variables Instrumentales, que produc a estimadores de Variables Instrumentales, que produc a estimadores insesgados y consistentes. Sin embargo, el m todo de Variables Instrumentales, es complejo de aplicar en el modelo de regresi n m ltiple, y en su lugar utilizamos la estimaci n de m nimos cuadrados biet picos. Supongamos el siguiente modelo: es una variable end gena, es decir, es una variable ex gena, es decir, Si estimamos esta ecuaci n por MCO, obtendr amos estimadores sesgados e inconsistentes, debido a la endogeneidad de . Para obtener estimadores insesgados y consistentes de , y , utilizamos la estimaci n de M nimos cuadrados biet picos o en dos etapas. Disponemos de una sola variable end gena externa . Buscamos el mejor instrumento posible para la variable end gena , y dicho instrumento es una combinaci n lineal de todas las variables ex genas internas y externas al modelo. 1 Etapa: Estimamos por MCO la ecuaci n: El objetivo de esta etapa es determinar si existe relaci n o no entre la variale end gena externa o posible instrumento. Entonces planteamos el contraste de identificaci n: Donde

Estimaci n por M nimos Cuadrados Biet picos o en dos etapas

Caso 1

En este contraste, debemos rechazar identificaci n( ). Entonces 2 Etapa: En la ecuaci n valores ajustados .

y decimos que se cumplirla condici n de serun instrumento v lido. , sustituimos la variable end gena , por los

Si estimamos la ecuaci n anterior por MCO, obtenemos los estimadores de m nimos cuadrados biet picos, .

Se trata de estimadores consistentes y asint ticamente normales, es decir, en muestras asint ticas, tienen distribuci n normal. Sin embargo, al igual que ocurr a en Variables Instrumentales, los estimadores de M nimos cuadrados biet picos, son menos eficientes (tienen mayor varianza que los de M nimos Cuadrados Ordinarios).

Apuntes Realizados y Distribuidos por ZHOUJIE MA

Unin de Estudiantes de Ciencias Econmicas


Caso 2 Disponemos de m s de 1 instrumento, es decir, de m s de 1 variable ex gena externa. Suponemos que ten a 2 variables ex genas externas: y . Buscamos el mejor instrumento posible para que es una combinaci n lineal de todas las variables ex genas internas ( ) y externas ( y ). 1 Etapa: Estimamos por MCO la ecuaci n: A continuaci n planteamos el contraste de identificaci n que sirve para determinar si los instrumentos y est n o no correlacionados con la variable end gena .

Si , se cumplirla condici n de identificaci n, y los instrumentos y est n correlacionados con . Por lo tanto, son instrumentos v lidos. 2 Etapa: En En la ecuaci n , sustituimos la variable end gena , por los valores ajustados . Si estimamos la ecuaci n anterior por MCO, obtenemos los estimadores de M nimos Cuadrados Biet picos o en 2 etapas, que ser n consistentes y asint ticamente normales, siempre que los instrumentos y sean v lidos. En general, si los instrumentos no son v lidos por incumplir alguna de las condiciones de instrumento, los estimadores de M nimos Cuadrados Biet picos o en 2 etapas ser n INCONSISTENTES y peores que los de MCO, puesto que los estimadores de MCO tambi n son inconsistentes, sin embargo, tienen m nima varianza. Contraste de Sobreidentificaci n de SARGAN Planteamos una regresi n de los residuos de M nimos Cuadrados Biet picos o en 2 etapas, llamados frente a todas las variables ex genas internas y externas. Las hip tesis del contraste de Sargan son:

Conclusi n

Contraste de Sobreidentifica ci n de SARGAN

El estad stico de Contraste es: Si todos los instrumentos est n incorrelacionados con el error, entonces ser an instrumentos v lidos. Si alg n instrumento estcorrelacionado con el error, entonces no ser a v lido. Sin embargo, el contraste de Sargan no dice quinstrumento es no v lido.

Apuntes Realizados y Distribuidos por ZHOUJIE MA

You might also like