Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof.

Edson Apaza Mamani
eapaza@unap.edu.pe eapaza@unap.edu.pe

Notas de clase preparadas para el curso de Econometría II.
Prohibida su reproducción parcial o total del documento sin
autorización expresa del autor.

Econometría Aplicada con
Stata
Modelos de Elección Discreta

Edson Apaza Mamani
UNIVERSIDAD NACIONAL DEL ALTIPLANO

INGENIERÍA ECONÓMICA

Abril de 2017 pág. 0 pág. 1

Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof. Edson Apaza Mamani
eapaza@unap.edu.pe eapaza@unap.edu.pe

7.1. Introducción ............................................................................................................. 42
7.2. Modelos TRUNCADOS .............................................................................................. 42

Contenido 7.3. Modelos CENSURADOS ............................................................................................ 46
REGRESIÓN CON VARIABLES DEPENDIENTES E INDEPENDIENTES DISCRETAS ................................. 5 MODELOS DE HECKMAN DE AUTOSELECCION .............................................................................. 50
1. Modelo de regresión con variables discretas en las variables independientes. ................. 5 8. Modelos Selección ........................................................................................................... 50
1.1. Aplicación del Modelo Lineal General 1 ..................................................................... 8 vi) Aplicación................................................................................................................. 56
Referencias .......................................................................................................................... 10 Referencias: ......................................................................................................................... 57
REGRESIÓN CON VARIABLES DEPENDIENTES E INDEPENDIENTES DISCRETAS (2) .......................... 11 MODELOS DE ELECCIÓN MULTIPLE .............................................................................................. 59
2. Modelo Lineal General 2 .................................................................................................. 11 9. Modelos de elección múltiple .......................................................................................... 59
3. Estrategia de Identificación ............................................................................................. 12 v) Aplicaciones ................................................................................................................. 61
i) Causalidad y Correlación .............................................................................................. 12 9.2. Logit Condicional ...................................................................................................... 63
iii) Aplicación: Ecuación de Mincer 3 (Impacto)............................................................. 14 Referencias .......................................................................................................................... 67
REGRESIÓN CON VARIABLES DEPENDIENTES DISCRETAS .............................................................. 15 MODELOS DE ELECCIÓN MULTIPLE .............................................................................................. 68
4. Modelos de regresión con variables discretas en la variable dependiente ...................... 15 9.3. Logit Multinomial ......................................................................................................... 68
4.1. Modelos de Elección Discreta................................................................................... 16 References ........................................................................................................................... 71
4.2. Modelo de Probabilidad Lineal (MPL) ...................................................................... 16
4.3. Modelo Probabilístico .............................................................................................. 17
4.4. Modelo Logístico ...................................................................................................... 18
4.5. Modelo de doble complementariedad logarítmica .................................................. 20
4.6. Medidas de bondad de ajuste (fitstat) ..................................................................... 21
Referencias .......................................................................................................................... 26
AUTOSELECCION .......................................................................................................................... 31
5. Modelo de Autoselección ................................................................................................ 31
i) Modelo de Heckman .................................................................................................... 31
Referencias .......................................................................................................................... 35
CAMBIO DE REGRESIÓN: SWITCHING REGRESSION ...................................................................... 36
6. Modelo de Switching Regression ..................................................................................... 36
SWITCHING REGRESSION: APLICACIÓN .................................................................................... 38
Referencias .......................................................................................................................... 41
MODELOS TRUNCADOS Y CENSURADOS ...................................................................................... 42
7. Modelos censurados y truncados .................................................................................... 42

pág. 2 pág. 3

Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof. Edson Apaza Mamani
eapaza@unap.edu.pe eapaza@unap.edu.pe

ECONOMETRÍA APLICADA

Prof. Edson Apaza Mamani

REGRESIÓN CON VARIABLES DEPENDIENTES E
INDEPENDIENTES DISCRETAS

1. Modelo de regresión con variables discretas en las variables independientes.

La especificación habitual de los modelos lineales, incluyen una variable dependiente y
varias variables explicativas. Así por ejemplo:

= + + + +
Esta representación teórica puede ser utilizado en un contexto empírico, donde es posible
establecer la siguiente relación; ln( ) representa el logaritmo del ingreso, esta
medido en años de educación alcanzado, mide los años de experiencia laboral y es
una variable dicotómica que toma el valor de uno si es casado e igual a cero si tiene otro
estado civil. La especificación para esta relación sería de la forma:

( )= + + + +
Especificación propuesto por Mincer para identificar los retornos a la educación. La
estimación de los parámetros se obtienen utilizando el método de Mínimos Cuadrados
Ordinarios (MCO). Dadas las características de la especificación, es posible representarlo de
forma matricial como:

= +

i) Estimación por MCO

El método de estimación para un modelo lineal es el estimador de MCO, siempre y
cuando se cumplan los supuestos del modelo lineal general (MLG). Dado que el método
estima los parámetros minimizando la suma de los errores al cuadrado, se obtiene el
siguiente estimador:

=( ′ ) ′

La estimación consistente debe reflejar resultados estadísticamente significativos,
relevancia y dependencia. Asimismo, debe observase la bondad de ajuste del modelo
estimado, el cual se observa por el , que indica el grado de ajuste o grado de

pág. 4 pág. 5

en otras especificaciones el i. ) = . } son i. para el caso lineal. la variable d) MCO4: Identificabilidad dependiente variará en unidades. Si se cumple que ( | . estimador tiene una interpretación diferente.d. Si se cumple que ( | . Cambios marginales i. i. .pe eapaza@unap. … . ) distribuida). ) = 0. y b) Asintóticamente Distribuido Normalmente ( )=0 b) MCO2: Independencia. (promedio independiente) ii) Interpretación de los estimadores El promedio del término de error es independiente de las variables La interpretación de los estimadores se realizan obteniendo: explicativas. Este resultado Semi-logaritmico Ln( ) = + + Semielasticidad permite a la varianza del error depender de las variables explicativas. iii. Significa que Lineal = + + Niveles la varianza del termino de error es una constante. A continuación se presenta las Propiedades Asintóticas de los Estimadores de Mínimos Cuadrados Ordinarios. ii. entonces se presenta el problema de la Heterocedasticidad condicional. … . | . ) = 0. Logaritmico ln( ) = + ln( )+ Elasticidad La consistencia de los estimadores requieren que se cumplan las propiedades asintóticas.….… .Econometría Aplicada Prof. ) < ∞. esto garantizará que las estimaciones sean estadísticamente significativas.i.edu. a) Consistencia Los supuestos de los estimadores de MCO: = a) MCO1: Linealidad en los parámetros del modelo. (independiente e idénticamente √ − → (0. 7 .edu. iv. Edson Apaza Mamani Econometría Aplicada Prof. (no correlación) = Implica que el término de error y las variables explicativas no están correlacionadas. ii. ) Interpretación de los e) MCO5: Estructura del error. Modelo ( | . son linealmente independientes y 0 < ( ) < ∞ ∀ . (independiente) Implica que el termino de error es independiente de las variables explicativas. Edson Apaza Mamani eapaza@unap. El término de error no contiene información relacionada con las variables explicativas. = varianza asintótica. Es decir que la matriz de información de las variables explicativas es de rango Tabla 1. Es decir. esto garantiza que la muestra sea aleatoria y de una muestra comparable. pág. ) . ~ Asume que el término de error es independiente de las variables explicativas y que éstas están normalmente distribuidas. Interpretación de los Cambios marginales completo. { . ( | . c) Aproximadamente Distribuido Normalmente c) MCO3: Exogeneidad de las variables expectativas. que ante cambios en una unidad de las variables explicativas .pe variabilidad explicada por las variables explicativas incluidos en el modelo econométrico. ~ (0. ∀ : ⊥ . esto garantiza que los regresores no sean colineales perfectos entre sí: ninguna variable es una combinación lineal de las otras explicativas. = + + . )= = ( . ∀ : ( . entonces la relación entre las variables explicativas y el término de error es Homocedástica. 6 pág.

9 . estimar los valores del esto de observaciones. Stata agrega automáticamente una constante.pe eapaza@unap. vce(robust) Se puede utilizar el comando postestimación test para estimar las pruebas de dependencia. para ello utilizaremos el comando stepwise con la opción prob(n.c. del investigador. Por ejemplo: test educ la prueba consiste en evaluar : = 0 contra : ≠ 0. Edson Apaza Mamani eapaza@unap.2): regress wage educ exper expersq regress wage educ exper expersq Regresiona la ecuación de MINCER. Edson Apaza Mamani Econometría Aplicada Prof. 8 pág. es determinar la mejor especificación del Estimación en Stata: modelo empírico. el salario por hora en función de escolaridad y experiencia. use mincer_peru. estima las elasticidades en la forma de d(lny)/d(lnx) salario. prueba F.dta summarize stepwise. estima las elasticidades en la forma de d(lny)/d(x) ln( )= + + + + Un problema frecuente. estima las elasticidades en la forma de d(y)/d(lnx) eydx. Stata reporta un estimador de MCO de covarianza robusta y consistente utilizando la opción robust.pe 1. Por ejemplo regress wage educ exper expersq if _n < 100 i) Taller Stata 1 predict wage_hat_in if e(sample) predict wage_hat_out if !e(sample) La estimación de un modelo lineal por MCO utilizando Stata es: browse wage wage_hat_in wage_hat_out regress vardep [varsindep] [if] [in] [weight]. dyex. test educ exper la prueba consiste en evaluar : =0y = 0 contra : ≠0o ≠0 test educ = exper la prueba consiste en evaluar : = contra : ≠ pág.). [option] donde vardep es la variable dependiente y varsindep es una lista de variables utiliza las primeras 100 observaciones para estimar el modelo de regresión lineal y explicativas.1. pr(0.edu. estima los efectos marginales por defecto La ecuación de Mincer intenta explicar que tan importante es la escolaridad sobre el eyex. La estimación de cambios marginales se obtiene utilizando el comando mfx y sus respectivas opciones.Econometría Aplicada Prof. A continuación vamos a determinar la especificación adecuada. Aplicación del Modelo Lineal General 1 El comando post-estimación predict genera dentro de la muestra fuera de la muestra las predicciones. regress wage educ exper expersq.edu. de la forma: ii) Aplicación en Stata: Ecuación de Mincer 1 dydx. para una o más restricciones.

4th ed.pe Referencias ECONOMETRÍA APLICADA Libros introductorios Prof. Joshua D. A. 11 . ln( )= + + + + + Libros adicionales Donde es igual a uno si la el individuo es hombre y cero si es mujer. Secciones 4. Pearson Addison-Wesley. Edson Apaza Mamani eapaza@unap. Colin and Pravin K. 1 Representación de una variable ficticia Note que el efecto marginal para los dos grupos (implícitamente definido por la variable dummy) es igual pero diferente en el término constante. and Mark W. de tal forma que tengamos la siguiente Wooldridge.edu. Introductory Econometrics: A Modern Approach. 10 pág.4. and Jorn-Steffen Pischke (2009). Jefrey M. Si a esta última relación de variables se incluyen variables binarias (dummy).9.1 . Edson Apaza Mamani Econometría Aplicada Prof. Jefrey M.edu. Capítulo 3. Capítulos 4.. Capítulos 4 . Gráficamente podemos suponer que: Figura Nro. James H. el uso de una Angrist. Trivedi (2005).8. i) Prueba de hipótesis de relevancia (t) y de dependencia (F) pág. (continua) y variables explicativas (continuas)..23. Econometric Analysis of Cross Section and Panel Data. Princeton University Press. variables tiene varias aplicaciones. Microeconometrics:Methods and La especificación inicial permite ver una relación lineal entre la variable dependiente Applications.pe eapaza@unap. Edson Apaza Mamani Stock. (2009). Modelo Lineal General 2 Cameron. REGRESIÓN CON VARIABLES DEPENDIENTES E Wooldridge.1-4. Watson (2007). MIT representación: Press.4. INDEPENDIENTES DISCRETAS (2) South-Western Cengage Learning. Capítulos 2 . Introduction to Econometrics. Cambridge University Press. Mostly Harmless Econometrics: An variable dicotómica permite identificar la presencia o ausencia de un atributo. Libros Avanzados 2. 2nd ed.Econometría Aplicada Prof. (2002). este tipo de Empiricist's Companion.

contando con una muestra de observaciones de estas variables y haciendo algunos supuestos simplificadores sobre la estructura de este proceso generador de datos.pe eapaza@unap. más concentrado en los datos y menos necesitado de modelos teóricos o econométricos muy sofisticados. las políticas de empleo y formación o las subvenciones públicas. la interacción con la variable dummy : sobre el mercado de trabajo han aparecido numerosas contribuciones muy importantes para el desarrollo de esta técnica de evaluación. Esto se debe a que ofrece una estrategia de identificación de los efectos causales de una política pública a partir. 12 pág. La presencia de variables asociadas sin mayor sentido. Esto se debe a que tradicionalmente la estadística inferencial ha estudiado la manera como los datos “aparecen” en el mundo real. 2. Existen modelo teórico detrás de la relación. Pues para tener una idea de este efecto. La aceptación de la frase que “la correlación no implica causalidad” ha significado el límite que la estadística se ha puesto a si misma en su contribución a este análisis. Cambio en pendiente por una variable ficticia El interés por hacer un estudio acerca de la relación causal entre las variables. sobre ln( )= + + + + ∗ + + todo. como en el caso de las ln( )= + + + + + conocidas regresiones espurias o la presencia de los llamados “confounders”. el “Enfoque Causal” o de “efectos de un tratamiento” se ha De la forma functional convertido en un complemento sustancial al anterior. 13 . más que del soporte Efectos marginales para educ y exp: estricto de un determinado modelo económico.pe Es importante evaluar la significancia individual y en todo el cojunto de variables probabilidades y las esperanzas condicionales— son llamados “parámetros asociativos” explicativas. deberíamos tener alguna idea sobre la existencia de una relación causal entre estas variables.edu. la estadística inferencial obtiene estimadores de los parámetros que configuran a tal proceso. Luego. tanto pruebas de multicolinealidad y heterocedasticidad. Tal interés conlleva al estudio de la distribución de probabilidad conjunta de estas variables. Este estudio empieza con la pregunta inicial de cualquier estudio de impacto: ¿cuál es el efecto causal de una variable X sobre otra variable Y? Responderla puede ser un asunto no tan trivial ni desde el punto de vista analítico ni desde los datos. donde el interés científico se ha centrado en campos tan diversos como las finanzas La interpretación de estos efectos y de los parámetros individuales es muy específico al públicas. Estos parámetros no son determinantes para establecer relaciones causales entre las ii) Aplicación: Ecuación de Mincer para Perú (género) variables. numerosos ejemplos en la literatura reciente sobre este tipo de evaluaciones. los subsidios a la contratación. de datos adecuados para contestar a cada pregunta concreta. los efectos de cambios fiscales sobre la oferta de ∂ ln( ) trabajo o la inversión.edu.Econometría Aplicada Prof. la evaluación de políticas públicas constituye hoy un campo de indudable crecimiento. presenta una limitación importante para el análisis de inferencia causal con base en parámetros asociativos 3. la cual entrega las probabilidades de ocurrencia de ellas. etc. Algunos de estos parámetros —como las pág. = +2 + ∂ Así. Estrategia de Identificación ii) Interacciones En los últimos veinte años. los cuales han sido utilizados como pieza clave en el análisis econométrico. Edson Apaza Mamani eapaza@unap. Este enfoque. En particular. ha ∂ ln( ) = + generado contribuciones notables en la evaluación de políticas tan relevantes como la ∂ formación. Un caso especial. ln( )= + + + + + ∗ + i) Causalidad y Correlación Figura Nro. Edson Apaza Mamani Econometría Aplicada Prof.

Los dos posibles valores están denotados usualmente por 0 y 1. test hijos El valor esperado de una variable dicotómica ∈ {0.kidslt6. Otro ejemplo sería los estudiantes que solicitan el servicio de generate hijos=( kidslt6!=0 & kidsge6!=0) comedor o de residencia de la universidad. 15 .1] y no representan una probabilidad.kidslt6*educ. Además el término de error es heterocedastico como: Tabla 2. ( | )=0 xi: regress inlf educ exper expersq i.pe iii) Aplicación: Ecuación de Mincer 3 (Impacto) ECONOMETRÍA APLICADA ¿Vale la pena el esfuerzo? Prof.pe eapaza@unap. Muchas variables dependientes de interés en economía y otras ciencias sociales pueden Se puede utilizar el comando postestimación test para estimar las pruebas de tomar sólo dos valores. vce(robust) Es llamado el modelo de probabilidad lineal en este contexto. de 1: test educ exper hijos ( )=0∙ ( = 0) + 1 ∙ ( = 1) = ( = 1) la prueba consiste en evaluar : = 0. o ≠ 0.1} es la probabilidad que toma el valor la prueba consiste en evaluar : = 0 contra : ≠ 0. en  Relación causal y correlación realidad es endógena debido a causas del estudio. Este modelo no es un modelo estadístico adecuado como el valor esperado de ( | ) = puede sobrepasar los límites de [0. Edson Apaza Mamani Estimación por MCO.edu. =0y = 0 contra : ≠0o ≠0 El modelo de regresión lineal.edu. prueba F.dta REGRESIÓN CON VARIABLES DEPENDIENTES DISCRETAS regress wage educ exper expersq Actividades: 4. Un ejemplo de esto puede ser el caso en Regresión lineal general que se necesite estimar el efecto de las uniones sindicales (pertenecer a un sindicato) sobre el salario de los trabajadores. para una o más restricciones. Modelos de regresión con variables discretas en la variable dependiente  La estrategia de identificación Esta situación se presenta cuando una variable dummy (ficticia) exógena en un modelo. Esto origina un problema de autoselectividad o autoselección en la muestra. Edson Apaza Mamani Econometría Aplicada Prof. Edson Apaza Mamani eapaza@unap.Econometría Aplicada Prof. Estimación del Modelo de Probabilidad Lineal Error Probabilidad de Ocurrencia del Evento ( ) 1− 1− ( )= (1 − ) ( ) = ( | )[1 − ( | )] pág. 14 pág. dependencia. = + . vce(robust) pueden utilizar la variable dependiente discreta. vce(robust) xi: regress inlf educ exper expersq i. use mincer_peru. Por ejemplo: Tales variables son llamadas variables dummy o variables dicotómicas. así como estos existen varios casos donde se regress wage educ exper expersq hijos.

Modelo de Probabilidad Lineal (MPL) ( = 1| ) = ( ) = ( ) Es la representación más básica. binaria. la función de transformación para definirá la especificación del Los modelos de elección discreta. y empírcamente son válidos los resultados. obtenemos que: como: ( = 1| ) = [ > ] ( | ) = ( = 1| ) = [ + > + | ] Este resultado explica la unidad de medida de los estimadores. (∞) = 1. En general. varianza constante e igual a uno pero no logística. Donde es un vector columna de parámetros de dimensión ( + 1).2. Edson Apaza Mamani Econometría Aplicada Prof. La decisión observada revela cual de las alternativas proporciona más utilidad o mayor beneficio (el cual es no observable). ( + 1) variables explicativas incluyendo el término constante. ( = 1| ) = [ ] Para la última representación. … . robustez y demás pruebas para información de corte transversal. o puede tener una distribución logística Considere una muestra de N ( = 1.2.pe 4. 16 pág. ) observaciones i. Como se vió antes. se requiere evaluar la consistencia de los resultados. Sin embargo el uso de los modelos lineales con la variable dependiente binomial trae consigo riesgos de la presencia del problema de heterocedasticidad. La interpretación de los parámetros estimados es directa como efectos marginales sobre la variable dependiente . por su simplicidad. Así se puede tener una distribución normal con media cero y probabilidades ( = 1) de la variable dependiente . los resultados son una primera aproximación a los resultados acumulativa (cdf) de la distribución normal estándar. A pesar de El modelo probit asume que la transformación de la función es la función de densidad su poca aplicación.3. y sus desventajas.d. (independiente e con media cero y varianza constante logística. es decir que el consumidor escoja la alternativa a. por ejemplo. La respuesta de probabilidad es: obtenidos con los modelos no lineales como son el logit. Edson Apaza Mamani eapaza@unap.i. = i) Estimadores: MCO Es un índice lineal simple. Modelos de Elección Discreta ii) Bondad de ajuste Sea la utilidad de obtener el comedor universitario y la utilidad de estar pensionado. >0 cuadrados ordinarios. probit o cloglog. La probabilidad que la variable dependiente toma el valor de 1 es modelado como: 4.edu. iii) Interpretación La formulación habitual es: = + y = + . Los habituales. Por tanto. a pesar de tener problemas asociados con las varianzas. como los cambios ( = 1| ) = [ + > 0] marginales. En el primer caso se puede aplicar el modelo idénticamente distribuida) de la variable dependiente dummy y un vector de dimensión Probit también llamada Normit y en el segundo el modelo Logit. La transformación de la función muestra un índice dentro del =( ′ ) ′ rango [0. Modelo Probabilístico error.edu.1. el cual permite estimar las primeras aproximaciones a los resultados. se puede representar Si denotamos a = 1. 17 .pe eapaza@unap.Econometría Aplicada Prof.1] y en general satisface: En este tipo de modelos es habitual el uso del estimador por el método de mínimos ( ) (−∞) = 0. se puede asumir diferentes distribuciones para el término de 4. 1 ( = 1| ) = Φ( )= () = √2 pág. describe la respuesta de modelo no lineal a estimar. la variable que se observa vale 1 si > y 0 si ≤ .

) es la función de densidad de probabilidad (pdf) y Φ(. la transformación de la función es la función logística. Función de transformación en el modelo Logit y Probit i) Estimadores: MV = [Prob( = 1| )] [Prob( = 1| )] = [Φ( )] [1 − Φ( )] = ln[Φ( )] + (1 − ) [1 − Φ( )] ϕ( ) −ϕ( ) = + (1 − ) =0 Φ( ) [1 − Φ( )] ii) Interpretación de los parámetros Nota: el modelo Logit y Probit son casi idéntico y el modelo de elección es usualmente arbitrario. La respuesta de probabilidades son: f( ) −f( ) = + (1 − ) =0 1 F( ) [1 − F( )] ( = 1| ) = = 1+ 1+ La siguiente figura muestra la función de transformación de para los dos modelos.4.Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof. Edson Apaza Mamani eapaza@unap. En algunas situaciones. 3. 18 pág. Modelo Logístico = ln[F( )] + (1 − ) [1 − F( )] En el modelo Logit.pe Donde (. Figura Nro. i) Estimadores: MV En general.pe eapaza@unap.6 son aproximadamente interpretar directamente como efectos marginales sobre la variable iguales al modelo Logit estimado.edu. Multiplicando los parámetros del modelo Probit por 1. los parámetros de los modelos son escalados de manera A diferencia del modelo lineal. 19 . Sin embargo. la función índice = tiene una clara interpretación en el modelo teórico y el efecto marginal. del cambio de sobre . ) la función de distribución acumulativa (cdf) de la distribución normal estándar. ( | ) ( = 1| ) ∂Φ( ) = [F( )] [1 − F( )] = = = ( ) ∂ 4. los parámetros estimados no se pueden diferente. estamos interesados en estimar el efecto marginal del cambio de sobre .edu. ii) Interpretación de los parámetros pág. dependiente.

Ante cambios en la probabilidad de elegir una de dos  LNR  alternativas de manera desproporcional 30 y 70 o 70 y 30 los modelos habituales ya no son 2/ N consistentes. 2ln LNR  ln LR   n 2 ln LR 2  ln LR  ln LNR  N ii) Interpretación Arturo Estrella : 1     ln LR  ( | ) Cada investigador puede especificar el uso del estadístico de bondad de ajuste. son las técnicas más comunes para la estimación de modelos con una variable dependiente dicotómica.edu. cualquier individuo tiene un efecto 4. impone el supuesto de que los individuos tienen Medida de Effron :1  n1n2 una probabilidad de 0.6. Para los modelos de variables dependientes discretas y limitadas. Edson Apaza Mamani eapaza@unap. yˆ  n yi  yˆi  2 Los modelos Logit y Probit.Econometría Aplicada Prof. ante ello propongo una distribución alternativa para los errores en la  L  distribución normal o logística. 20 pág.5 de elegir cualquiera de las dos alternativas. Modelo de doble complementariedad logarítmica Coeficiente de correlación :  2  y . sin embargo ambas son muy sensibles a los cambios en las variables independientes. los estadísticos habituales de bondad de ajuste ahora son diferentes. pág. Este efecto marginal depende de las características de todas las para la observación . Algunos de ellos son modificaciones de la medida de bondad de ajuste de McFadden.pe eapaza@unap.5. : 1   R  simétricas con respecto a cero. Además.edu.pe Como antes. Este supuesto es impuesta por 2/ N  L  la técnica de estimación porque las dos funciones de densidad logística y normal son Ratio de LR. los parámetros estimados no se interpretan directamente como efectos marginales. a continuación listo ( | ) ( = 1| ) algunos de estos: = = (1 + ) 4. Medidas de bondad de ajuste (fitstat) marginal diferente. Edson Apaza Mamani Econometría Aplicada Prof. El estimador resultante. se demuestra que es apropiado Cragg-Uhler (1) : 1   R  donde los individuos con alguna probabilidad inicial de elegir cualquiera de las dos  LNR  alternativas son más sensibles a los cambios en las variables independientes. 21 . 2 2 LNRN  LRN Cragg-Uhler (2) : 1 ( = 1| ) = 1 −  1  L2 N   N   L2 N   R  i) Estimadores: MV ln LNR McFadden : 1 ln LR = [Prob( = 1| )] [Prob( = 1| )] 2ln LNR  ln LR  Aderish-Nelson : 2ln LNR  ln LR   n 2ln LNR  ln LR  2 ln LNR  n  =0 Veal-Zimmerman : .

.180 Probit ( ′ ) hectáreas. POSTURA: Variable dependiente que representa los precios revelados bajo una pregunta de formato abierto. 22 pág. ¿cuál sería el mecanismo más adecuado de implementación de esta política?.pe ECONOMETRÍA APLICADA Tabla 3. Las variables incluidas dentro de este estudio fueron: . SEXO: Variable independiente discreta que toma el valor de 1 si el entrevistado es del genero masculino y 0 si es del genero femenino. EDAD: Variable independiente continúa que representa la edad del jefe o responsable de la familia. Edson Apaza Mamani Econometría Aplicada Prof. Y: Variable independiente que representa el ingreso familiar mensual en soles. para el valor de existencia. Dadas los antecedentes anteriores surgen una serie de preguntas de mucho interés en torno al manejo de este recurso natural. PH: Variable independiente que representa el precio hipotético propuesto en soles para financiar el plan de saneamiento ambiental. . además de las islas de Taquile y Amantan en el lado peruano y las islas del Sol y de la Luna en el lado boliviano. Edson Apaza Mamani eapaza@unap.Econometría Aplicada Prof. La ciudad de Puno es uno de los departamentos con un flujo de turismo Φ( ′ ) = ( ) considerable.edu. . . Edson Apaza Mamani Modelo Probabilidad = ( = 1| ) Efecto Marginal: Valoración Económica Logit Λ( ′ ){1 − Λ( ′ )} Λ( ′ ) = 1+ La bahía de Puno se encuentra dentro de la reserva nacional del Titicaca con 36. ¿cuál sería el valor de no uso que estarían dispuesto a asignar estas personas a la reserva natural de Titicaca?. En la actualidad los hogares no están de acuerdo con la disposición de las aguas servidas y sus inconveniencias asociadas con las inundaciones en épocas de lluvia y riesgos de contraer enfermedades asociadas con el agua contaminada. ¿Es posible la implementación de una política de descontaminación de la bahía y la regulación de las fuentes generadoras de la contaminación?. Resumen de modelos de elección discreta Prof. En la actualidad la bahía de Puno enfrenta problemas de contaminación del agua derivados de la disposición de aguas servidas provenientes de diversas actividades económicas desarrolladas por las poblaciones aledañas a esta. por sus diversos atractivos turísticos. ubicada a 6 kilómetros de la bahía de Puno. La variable nivel de educación del entrevistado fue presentada en tres variables discretas a como sigue: pág. ¿cuál sería la disponibilidad a pagar de los habitantes de Puno por una mejora en la calidad ambiental de la bahía?.pe eapaza@unap. PROB: Variable dependiente discreta que toma el valor de 1 si la persona responde afirmativamente a la pregunta de disponibilidad a pagar y 0 si no.edu. que constituye uno de los atractivos Probabilidad Lineal ( ′ )= ′ más singulares del turismo mundial. siendo uno de estos el lago Titicaca en Cloglog ( ′ ) =1− ( ′ ) cuyas aguas se encuentra la isla flotante de los Uros. . 23 .

pr(0. . robust gen ECL=-(_b[_cons]+_b[y]*y + _b[sexo]*sexo + _b[ed1]*ed1 . stepwise. . Edson Apaza Mamani Econometría Aplicada Prof. robust variables. Edson Apaza Mamani eapaza@unap. robust . 25 . ENF: Variable independiente que representa la presencia de enfermedades gen ECCL=-(_b[_cons]+_b[y]*y + _b[sexo]*sexo + _b[ed1]*ed1 relacionadas con la contaminación del agua de la bahía. cloglog prob ph y sexo ed1 ed2 np enf. . iii) Especificación econométrica . logit prob ph y sexo ed1 ed2 np enf. oc2 oc3 oc4 oc5 enti mcon nhab valor enf uso.2): probit prob ph y edad sexo ed1 ed2 ed3 np oc1 oc2 oc3 oc4 oc5 enti mcon nhab valor enf uso.pe . OC4: Toma el valor de 1 si el entrevistado es jubilado rentista y 0 los demás. robust .2): cloglog prob ph y edad sexo ed1 ed2 ed3 np demás. compruebe sus resultados del punto ii) iv) Estime la disponibilidad media a pagar (Excedente del consumidor) de los habitantes de la ciudad de Puno por el plan de Saneamiento Ambiente de la Bahía. 1 si es una entidad pública y 0 si es una entidad privada. gen ECP=-(_b[_cons]+_b[y]*y + _b[sexo]*sexo + _b[ed1]*ed1 . NP: Variable independiente que representa el número de personas por familia. ii) Especifique diferentes formas funcionales del modelo de elección discreta y summarize ECLO ECPR ECCL concluya una especificación final. 1 si es noble. 2 = poco. pr(0.edu. ED3: Toma el valor de 1 si el entrevistado tiene educación primaria completa y 0 los stepwise. pr(0. ED1: Toma el valor de 1 si el entrevistado tiene educación superior completa y 0 los Especificación de los Cambios marginales: demás. iv) Estimación del beneficios social del proyecto de descontaminación .txt" describe summarize tabulate prob ii) Comparación de modelos de elección discreta Especificación de los modelos de elección discreta: Probit. ED2: Toma el valor de 1 si el entrevistado tiene educación secundaria completa y 0 los Bondad de ajuste: demás. La variable independiente ocupación del entrevistado fue representada a partir de cinco stepwise.2): logit prob ph y edad sexo ed1 ed2 ed3 np oc1 . NHAB: Variable independiente que representa el número de habitaciones de la vivienda probit prob ph y sexo ed1 ed2 np enf.pe eapaza@unap. r del entrevistado. r . 1 = ninguno. oc2 oc3 oc4 oc5 enti mcon nhab valor enf uso. Solución: valoración económica i) Importando datos y Estadisticas descriptivas: insheet using "TITICACA. oc1 oc2 oc3 oc4 oc5 enti mcon nhab valor enf.edu. OC3: Toma el valor de 1 si el entrevistado es obrero o vendedor ambulante y 0 los stepwise. ENTI: Variable independiente discreta que la preferencia por el tipo de identidad que ejecute el plan de saneamiento. 0 si es adobe. OC5: Toma el valor de 1 si el entrevistado esta sin trabajo o es ama de casa y 0 los demás. pr(0. Logit. MCON: Variable independiente que representa el tipo de material con que esta + _b[ed2]*ed2 + _b[np]*np + _b[enf]*enf)/(_b[ph]) construida la casa del entrevistado. + _b[ed2]*ed2 + _b[np]*np + _b[enf]*enf)/(_b[ph]) i) Realice las estadísticas básicas de la muestra e interprete. Interpretación de los coeficientes estimados: . iii) Utilizando el comando stepwise de Stata. 1 si hay presencia y 0 si no hay. OC1: Toma el valor de 1 si el entrevistado es empleado del sector público y 0 los demás. Cloglog pág. r . Interprete.2): reg prob ph y edad sexo ed1 ed2 ed3 np oc1 demás.Econometría Aplicada Prof. 3 = mucho. OC2: Toma el valor de 1 si el entrevistado es comerciante y 0 los demás. VALOR: Variable independiente que representa la ponderación que asigna a la bahía si + _b[ed2]*ed2 + _b[np]*np + _b[enf]*enf)/(_b[ph]) se descontaminara. 24 pág. realice pruebas de robutez. .

and Jorn-Steffen Pischke (2009). Capítulo 3.….4. considere una v. ) Libros Avanzados Cameron. se obtiene: ( | ) (−1) 3(1 − ) + (3 − 1) = − + =0 1− (1 − ) 2 = + + =0 1− (1 − ) Por lo tanto: 2 − (1 − ) + =− − = (1 − ) 1− (1 − ) 2 − − + − = = (1 − ) (1 − ) (1 − ) 1 (1 − ) =− 2 (1 − ) pág.23. ( | )= ( .1-4. 0 ≤ ≤ 1. Introductory Econometrics: A Modern Approach. Jefrey M. La función de verosimilitud será: South-Western Cengage Learning.d.edu.0 ≤ ≤ 1. James H.8.pe eapaza@unap. ) ( . 2nd ed. 26 pág..a. Pearson 2 ( . Edson Apaza Mamani Econometría Aplicada Prof. Capítulos 2 . Edson Apaza Mamani eapaza@unap. MIT Press. Trivedi (2005). Cambridge University Press. (2009). Princeton University Press.. Sea la muestra aleatoria de tamaño n: ( . ( | )= … = 1− 1− 1− 1− Wooldridge. Secciones 4. and Mark W. e igualando a cero. que tiene la siguiente f. Colin and Pravin K. )= . 4th ed. A. >0 Libros adicionales Tomando logaritmos en la última expresión: Angrist. >0 Addison-Wesley. Econometric Analysis of Cross Section and Panel Data. 0≤ ≤ 1. 1− Wooldridge. Introduction to Econometrics. 1− 1− 3 −1 = [ 2 − (1 − )] + 1− 3 −1 = 2+ − (1 − ) + 1− Derivando respecto de . )= ( . )… ( .pe Referencias Anexo: Estimador de Máxima Verosimilitud 1.p. Mostly Harmless Econometrics: An 2 3 −1 ( | )= + Empiricist's Companion. Capítulos 4. Microeconometrics:Methods and 2 2 2 2 Applications.1 . Joshua D. (2002).4.: Stock. Jefrey M.9. Capítulos 4 . 27 . … .Econometría Aplicada Prof.edu. Watson (2007). ).0 ≤ ≤ 1. Halle el estimador del parámetro por el método de MV a partir de una muestra de Libros introductorios tamaño n.

2 1(−2) 2 − =− =− + ( − ) =0 2 2 =− 1 2∑ − = ( − ) = − 2∑ 3. )→ . . . ( .…. | . | . .…. ): ℝ x(0. ∞) . )… ( | . ∈ℝ .….edu. Encontrar los estimadores de máxima √2 verosimilitud de: = . ) = (2 ) ( . ) ( . | . | .. ) 2 2 (2 ) Condiciones de primer orden Distribución conjunta. ) = (2 ) ( ) ( ) ( ) 1 1 1 1 ( . Sea { } i. .d. =− (2 ) − ( ) − ( − ) 2 2 2 2 2 = − (1 − ) 1 max =− (2 ) − ( ) − ( − ) ℝ.Econometría Aplicada Prof.….edu. . ) ( )( ) Multiplicación por independencia de xi ( .…. ahora en términos de función de verosimilitud pág.pe eapaza@unap. .…. Sea el modelo = + y Sea ~ . . 29 . Edson Apaza Mamani eapaza@unap. ( ) I ( ) ( .…. )= 2. ) ( | .….…. )= ∑ ( ) max − (2 ) − − ( − )′( − ) . . )= ( | . ). Edson Apaza Mamani Econometría Aplicada Prof.…. . .i. ) = (2 ) ( ) ( )( ) ( . )=− (2 ) − − ( − )′( − ) . . 1 2 + − =0 =− 2( − )(−1) = 0 2 1 2 − + =0 = − = 0. ( . . ( .…. Encuentre el estimador de MV de El estimador de MV es: = = (04 puntos) − 2∑ 1 ( ) ( ) ( . 28 pág.pe 1 (1 − ) 1 =− . ( . donde ~ ( . )= … 2 2 √2 √2 √2 1 1 ( . ℝ 2 2 2 2 =− + Condiciones de primer orden . . ⟹ = .

la cual señala que el logaritmo del ingreso es función de la = − ′ − escolaridad.edu.pe eapaza@unap.pe ( . Para una explicación detallada. 1 Este tipo de problema se conoce en la literatura como sesgo por autoselección. común en MV )= ln( + + + + (1) Donde ln( ) representa el logaritmo del ingreso del individuo . 1 Con el método de dos etapas de Heckman se busca eliminar los posibles sesgos que surgen debido a que en las encuestas únicamente se puede observar el ingreso de aquellos individuos cuyo salario de reserva es inferior al salario de mercado. ) −2 =0=− − ( − )′( − ) Ahora analizaremos qué factores determinan el salario de las mujeres casadas. las estimaciones con este método pueden ser sesgadas. De acuerdo con Heckman (1979) esta situación puede introducir sesgos en los estimadores de los parámetros de la ecuación de ingresos similares a los generados por la omisión de variables relevantes en el modelo. véase Heckman (1979) y Lewis (1974). ) 1 ECONOMETRÍA APLICADA =0=− ( − + ′ ′ + ′ ′ ) 2 −2 +2 ′ ′ =0 Prof. no observado. 30 pág. es la experiencia laboral. y es el cuadrado de la experiencia laboral. Edson Apaza Mamani Econometría Aplicada Prof. i) Modelo de Heckman Para ilustrar este método se plantean dos ecuaciones: ∗ = + ó ó (2) = + ó é (3) En este caso son la ecuación de participación de las ocupadas asalariadas y la función de Mincer (1). es el nivel de ingreso potencial de un determinado individuo. 31 . Si esto sucede. la experiencia laboral y el cuadrado de ésta.edu. Modelo de Autoselección ( . Edson Apaza Mamani eapaza@unap. es un vector de variables explicativas observadas y es un término de error en la ecuación de decisión. Aquellos con un salario de reserva superior al de mercado no aparecen en la estimación. respectivamente. Donde ∗ es la propensión a trabajar. La especificación anterior tiene el problema de que no toma en cuenta si las mujeres han decidido autoseleccionarse a no participar en el mercado de trabajo. Formalmente se tiene: Estimadores sesgados. . . Para ello 2 utilizaremos una especificación que en la literatura mundial se conoce como minceriana. pág. Edson Apaza Mamani − ′ + ′ =0 AUTOSELECCION =( ′ ) ′ 5.Econometría Aplicada Prof. son los años de educación. en 1 honor a Mincer (1974).

twostep indica que es una estimación en dos etapas. hijo1218. El problema de autoselección surge si la parte no observada de la decisión de probit inlf kidslt6 kidsge6 faminc age agesq trabajar ( ) se correlaciona con la parte no observada del resultado ( ). es otro Para hacer esta estimación escribimos: término de error en la ecuación de interés. ∗ reg lwage educ exp expsq Así. lsens Empíricamente. se obtienen el ratio inversa de Modelo Lineal con : Mills para cada grupo de hogares. en la primera etapa de este método se estima un modelo probit en la Estimando el IMR ( ): ecuación de decisión con el cual se calcula el inverso de la razón de Mills ( ). hijo611. y edad. que tampoco se observa. restringido o no restringido del crédito. de la siguiente manera: reg lwage educ exper expersq imr. Estimación por MCO norte. gen imr = normalden(y_hat)/normprob(y_hat) Para corregir el sesgo de selección. En nuestro caso son: hijo5. xb Máxima Verosimilitud en la segunda etapa. select(varlist_s). En nuestro caso es lwage. A continuación se presenta la estimación por este método. 33 . Edson Apaza Mamani eapaza@unap. ingreso familiar. de la primera etapa. select(varlist_s) [twostep] ecuación de decisión. Esto es: ( | )= ( | ∗ > 0) (4) Procedimiento manual: Para las mujeres que no trabajan se tiene que ∗ ≤ 0 y en consecuencia es igual a Modelo Probit: cero. eda2. el cual se incluye como regresor en la ecuación de interés. Donde depvar es la variable independiente.pe eapaza@unap. Edson Apaza Mamani Econometría Aplicada Prof.pe es un vector de variables que influyen en el nivel de ingreso potencial. La decisión individual de incorporarse al mercado laboral puede estar afectada por diferentes factores. eda. ingfam.Econometría Aplicada Prof. 32 pág. hijos entre 6 y 18 añ0s. es observado si > 0. En este caso utilizaremos las variables siguientes: hijos menores a 6 indepvars representa las variables independientes. Si el valor estimado de es distinto a cero se puede concluir que existe autoselección. En nuestro caso años.edu. varlist_s representa el grupo de variables que se incluyen en la ii) Aplicación: inlf ecuación de decisión. robust ( ) = Φ( ) Procedimiento directo: ( ) = Modelo HECKIT 1 − Φ( ) Para aplicar el modelo Heckit en STATA se deberá emplear el comando heckman. Primero generamos la variable del logaritmo de los salarios: Así se deberá escribir el comando siguiente: gen lwage=log( salario) pág.edu. que se estima por el Método de predict y_hat. Así la ecuación final que se estima es: ∗ La sintaxis es la siguiente: | >0= + + (5) Donde es el coeficiente asociado al inverso de la razón de Mills evaluado en la heckman depvar [indepvars]. y sur Aunque sabemos que si estimamos por MCO podemos tener un sesgo por variable omitid.

Econometría Aplicada Prof. National Bureau of Economic Research. 765–799. Mroz.pe eapaza@unap. Woolwridge. Mincer. pp. (1987). El valor de lambda indica si existe o no autoselección. Schooling Experience and Earnings. J. 35 . Edson Apaza Mamani eapaza@unap. The Sensitivity of an Empirical Model of Married Women’s Hours of Work to Economic and Statistical Assumptions Econometrica 55. Econometric Analysis of Cross-Section and Panel Data. Nº age agesq) first twostep 1. Columbia University Press.edu.pe heckman lwage educ exper expersq. Jeffrey M. J. A. T. (1979). select(kidslt6 kidsge6 faminc Heckman. Edson Apaza Mamani Econometría Aplicada Prof.edu. Sample selection bias as a specification error. 47. vol. Econometrica. (2002). 34 pág. 153-161. MIT Press pág. select(kidslt6 kidsge6 faminc Referencias age agesq) twostep heckman lwage educ exper expersq. (1974).

porque y no se observan simultáneamente. se debe calcular las esperanzas condicional y no condicional. f es la función de densidad de distribución normal.pe eapaza@unap. ∗ .) es la función de densidad normal. Edson Apaza Mamani Econometría Aplicada Prof.Econometría Aplicada Prof. c) es el coeficiente de correlación entre y . )= + 2 (7) ( ) vectores de variables débilmente exógenas. y son los _ =( | = 1. )= − 1 (6) 1− ( ) Régimen 2: = + =0 (2) ( ) Donde. c) es la covarianza de y . d) f(. )= + 1 (5) ( ) Régimen 1: = + =1 (1) ( ) _ =( | = 0. y . Edson Apaza Mamani donde F es una función acumulativa de distribución normal. el cual describe el comportamiento de un agente con dos =( | )= (3) ecuaciones de regresión y una función de criterio. b) es el coeficiente de correlación entre y . f) El modelo está identificado por construcción a través de no linealidades. g) Dado el supuesto con respecto a la distribución de los términos de error. Modelo de Switching Regression La esperanza no condicional: Considere el siguiente modelo. 223-225) pág.edu. y tienen una distribución normal (trivariada) con el vector de media ( ) igual cero y una matriz de convarianzas: _ =( | = 0. el logaritmo de la función de verosimilitud para el sistema de ecuaciones (1-2) es: 2 La discusión en esta sección es tomado de Maddala (1983.edu. y γ son los vectores de parámetros. Edson Apaza Mamani eapaza@unap. )= − 2 (8) 1− ( ) Donde: Ω= a) y son los errores estándar de y . b) y son las varianzas de los términos de error en las ecuaciones continuas. CAMBIO DE REGRESIÓN: SWITCHING REGRESSION Luego de estimar los parámetros del modelo. d) es la covarianza de . e) La covarianza entre y no está definido. a) es la varianza del termino de error en la ecuación de selección. Asumiendo = 1 (γ es estimable solo como un factor de escala). es un ponderador opcional para la observación . 36 pág. 37 . 6. que determina que régimen enfrenta =( | )= (4) el agente 2: La esperanza condicional: =1 + >0 ( ) =0 + ≤0 _ =( | = 1.pe ECONOMETRÍA APLICADA > Prof. Se asume que .] es la distribución normal acumulativa. y F[. son las variables dependientes en las ecuaciones continuas. y y .

select(privado=edad edad2 prima secun univer puno . la ecuación de elección del sector de empleo (11) incluye dos variables para mejorar la identificación. . de (9-10). . regress privado edad edad2 prima secun univer puno aqp otros . es el salario del individuo en el sector . Aplicación. y la regresión de salario en el sector público es reportada en el panel lsalario_0. . . Además. aqp otros soltero nempleados) . el logaritmo del salario individual mensual. El estado civil del individuo y el número de miembros = + =0 (10) empelados en el hogar que se cree que afecta la elección de un individuo del sector de La función de criterio de decisión de trabajar en el sector público o privado esta dado por: empleo. 39 . = + =1 (9) . La estimación simultánea de (9-12) por ML corrige el sesgo de selección en el salario sectorial estimado. educacion. Edson Apaza Mamani Econometría Aplicada Prof. robust . Regresión de salarios. + ≤0 (12) Regresión de intercambio. Omitiendo este efecto de selectividad es probable tener una imagen falsa de la relativa select/privado. Algunas características no observadas que afecta la probabilidad de elegir un sector en particular de empleo además podrían influenciar al salario que recibe el individuo una vez que él este empleado. Que el sector de empleo es endógeno para el salario. es la variable latente que determina el sector en el cual el individuo está empleado . Edson Apaza Mamani eapaza@unap. es un vector de características individuales que se piensa que afecta el salario individual.edu. soltero. . Incluye las características individuales como: edad. La estimación por ML: ∗ )+ = ( − + (11) ∗ Regresión de decisión de participación en el sector privado: . empleado en un sector particular tiene la siguiente forma: heckman lsalario edad edad2 prima secun univer puno aqp otros ∗ nempleados. Los resultados de la regresión de salarios en el sector privado son reportados en el panel lsalario_1. lsalario. sectores público y privado. posición de ganancia tanto en el sector público y privado. A continuación realizaremos la estimación empírica pada determinar los factores que determinan la decisión de trabajar en el sector público o privado. es un vector de características que afectan la decisión respecto al sector de empleo. select(privado=edad edad2 prima secun univer puno =1 >0 . Prof. Los resultados de la ecuación de selección del sector son reportados en el panel . La variable endógena. . y son vectores de parámetros. 38 pág. + >0 aqp otros soltero nempleados ) first twostep ∗ =0 ≤0 .pe ECONOMETRÍA APLICADA . pero no afecta el salario. Una especificación habitual se puede representar de la siguiente . y son los términos de error. determinamos el problema de estimación de salario individual en los Polacheck.Econometría Aplicada Prof. y dummies forma: regionales. edad2. regress lsalario edad edad2 prima secun univer puno aqp otros nempleados privado. robust Las realizaciones observadas dicótomas de la variable latente ∗ de si el individuo está Regresión de autoselección. . .edu. utilizando la Las variables exógenas en la regresión de salario (9-10) se basan en Mincer (Mincer y ecuación de Mincer.pe eapaza@unap. Edson Apaza Mamani El indicador de elección del sector privado=1 si el individuo está empleado en el sector SWITCHING REGRESSION: APLICACIÓN privado y 0 si está en el sector público. El supuesto que se hace con frecuencia en este tipo de modelos: movestay lsalario edad edad2 prima secun univer puno aqp otros nempleados. 1974). pág.

Family Human procedimiento de máxima verosimilitud. 18. Edson Apaza Mamani Econometría Aplicada Prof. Vol. No. 1979. Edson Apaza Mamani eapaza@unap. Models for Sample Selection Bias. 1992. 162.. 327-350 pág. Annual Review of Sociology. pp. /lns1. (1992). . el modelo sugiere que un Heckman. and Fertility (Mar. 41 .pe eapaza@unap. S76-S108 varianzas de los errores del modelo de regresión. pp. Maddala. The Journal of Political Economy. Mare. se reporta en la última línea de la salida. 1974. que cualquier individuo de la muestra habría ganado. sigma_1 y sigma_2 son las raíces cuadradas de las Capital.Econometría Aplicada Prof.edu. Winship Christopher and Robert D. Cambridge University Press. Econometrica 47(1): 153– individuo quien elige trabajar en el sector público ganan un salario menor en ese sector. La prueba de razón de verosimilitud para la independencia conjunta de las tres ecuaciones Econometric Society Monographs No. J. 2. 82. y aquellos que trabajan en el sector privado no están mejor o peor que un individuo cualquiera. 1974). (1983) Limited-Dependent and Qualitative Variables in Econometric. Sample selection bias as a specification error. y /r2 son parámetros auxiliares utilizando en el of Women..edu. Part 2: Marriage.Apr. Vol. 3. G. 40 pág. /lns2. Ya que rho_2 es positivo y estadísticamente diferente de cero. /r1. New York. Mincer Jacob and Solomon Polachek. Family Investments in Human Capital: Earnings La variable sigma.pe El coeficiente de correlación rho_1 y rho_2 ambos son positivos pero solo es significativo Referencias para la correlación entre la ecuación de elección y la ecuación de salario del sector público. /r1 y /r2 son la transformación de la correlación entre los errores de las dos ecuaciones.

= y = 1. es decir: y varianza puede ser escrita utilizando la función de densidad de probabilidad (.1. ) De la normal estándar (0. Edson Apaza Mamani eapaza@unap. ( )= pág. Modelos TRUNCADOS donde ≡ ( )/Φ( ) y = ( − )/ . La distribución de ∗ dado es por lo tanto normal: √2 2 ∗ − | ~ ( .pe ∗ ECONOMETRÍA APLICADA La observación es sólo observado si está por encima de cierto limite/umbral conocido. 0. particular de una submuestra. 43 . es decir3: 7. donde (. 7. sin ( | )= − embargo todas la demás datos si están disponibles tanto para los que reportan salarios cero 1−Φ o no disponible. ) La distribución normal acumulativa. o un cierto rango de edades. Un ejemplo. )= La existencia de información omitida o no cuantificada en las encuestas. Por ello.1) ∗ = + ~ (0. ) 1 ( − ) ( )= − √2 2 El término de error es independiente y normalmente distribuido con media cero y 1 1 ( ) ( )= − varianza constante. Para este caso el modelo a utilizar es un modelo truncado. rango de ingresos etc. Únicamente hogares con ingreso debajo de una cierta línea de pobreza son parte de la muestra.edu. − Φ Esta información permitirá definir el modelo econométrico a estimar como un modelo censurado. . el método ∗ ∗ [( − )/ ] de estimación más apropiado es el estimador de máxima verosimilitud. i) Especificación del modelo (Regresión Truncada) 3 Note cómo la función de densidad de probabilidad de una variable normalmente distribuida con media Considere la variable aleatoria latente ∗ que depende linealmente de . El valor esperado de la variable latente es ∗ = . se presentan casos en las cuales existe disponible. La siguiente figura muestra el modelo de regresión truncada en un ejemplo con = 30. Edson Apaza Mamani ∗ ∗ > = ∗ .2. un estudio de los determinantes del ingreso de los pobres. nos permitirá definir un modelo censurado o truncado. 1 ( | )= por ejemplo. En estos modelos. los puestos del modelo lineal general ya no se cumplen. )= + + Φ[( − )/ ] 7. para una submuestra. La muestra de este subconjunto se basa variable dependiente) con un punto de truncamiento = 0. puede dar logar a ∗ > | la inconsistencia en la estimación de los modelos econométricos. Así por ejemplo. ≤ MODELOS TRUNCADOS Y CENSURADOS La función de densidad de la variable truncada observada es por tanto la función de densidad de probabilidad de la variable latente condicional sobre sus valores observados. Edson Apaza Mamani Econometría Aplicada Prof. es decir: Prof. es posible que el investigador esté interesado en un rango de información. − En otros casos.Econometría Aplicada Prof. ( | )= ( | > . de información de −1 − salario muchos de los cuales están considerados como cero o no esá disponible. Introducción Note que el valor esperado de la variable observada no es lineal en (intente derivar la La estimación de modelos econométricos con información faltante o con un interés ecuación de abajo).edu. ). un cierto nivel de estudios.pe eapaza@unap. ) es la función de densidad de probabilidad y Φ(. = 2 (un termino constante y una Los efectos del trucamiento ocurre cuando los datos observados en la muestra sólo se −2 agrupan a una submuestra de una gran población. Modelos censurados y truncados ∗ ∗ ( ∗| ) ( | )= ( | > .5 en el valor de la variable dependiente. 42 pág.

Por ejemplo: La regresión truncada además es usualmente por el método de máxima verosimilitud truncreg wage age educ.. =( | > ) ∗ podemos utilizar los comandos post-estimación predict y mfx para obtener que está correlacionado con y ( )= ( | > )= > 0. = + truncreg depvar [indepvars] [if] [in] [weight] [.5) mfx compute. e(. estimar el efecto marginal es más complicado.5)) at(age=40.Econometría Aplicada Prof. 44 pág.5 dólares iii) Interpretación de los parámetros la hora. simplemente se interpretan como los efectos marginales. iv) Aplicaciones Stata estima el modelo de regresión truncada por el comando Figura 1: Modelo de regresión truncada truncreg depvar [indepvars] [. predict(e(.2) predict lwage_hat. los coeficientes ( | ) para personas con 45 años de edad y con escolaridad de 12 años de educación.1. La función de mfx compute. etc. ll(1.edu. Edson Apaza Mamani Econometría Aplicada Prof. e(.pe eapaza@unap. ) en esta submuestra La interpretación de los parámetros depende mucho de la pregunta de investigación. predict(e(.1. 45 . predicciones y efectos marginales. La función de máxima verosimilitud es: predict wage_hat. calcula el valor proyectado de ( | ) = ( ∗ | ∗ > . como el término de error es: donde la opción umbral arriba ll y abajo lu puede ser referido a observaciones ∗ específicas y sus valores están definidor por varname.edu. ll(varname) lu(varname)] Obteniendo estimadores sesgados de .2) y permite estimar tanto y por una procedimiento numérico iterativo.2)) at(age=40. estima un modelo de regresión truncada debajo del nivel de ingreso (wage) 1..pe Sin embargo. con un punto de truncamiento por arriba o por encima.5) (ML).educ=12) verosimilitud aplica las propiedades de consistencia. Podemos estimar un modelo general La regresión lineal simple por MCO para la variable observada sobre . ll(#)] ii) Estimadores: MV donde ll(#) define el punto de truncamiento . eficiencia asintótica y normalidad. ll(1...educ=12) − − = − 1−Φ truncreg lwage age educ.1. ( ∗| ) = pág. ) = = + = (1 − − ) Estos efectos marginales dependen de las características individuales y sólo pueden ser reportados para tipos específicos o como efectos promedio en la muestra poblacional (ver ejemplo de aplicación para cambios marginales). Si y calcula los efectos marginales de edad y educación sobre el valor esperado del ingreso el investigador está interesado en el promedio de toda la población. Edson Apaza Mamani eapaza@unap.1. si el investigador sólo está interesado en el efecto del valor esperado de l subpoblación. de hecho se debe estimar: ∗ ∗ ( | ) ( | > .

>0 = ∗ 0 ≤0 = + La variable observada es una variable aleatoria mezclada con una probabilidad de masa Obteniendo estimadores sesgados de . no puede exceder la capacidad del estadio. 47 . no resuelve el problema como sería en el caso de / ) ( | )= + Φ( / ) un modelo de regresión truncada hacia arriba. Modelos CENSURADOS La siguiente figura representa el modelo de regresión truncada en un ejemplo con = 30. Algunos ejemplos. como ( = 0| ) = ( ∗ < 0| ) = Φ(− / ) sobre 0 y un valor continuo sobre 0 con densidad ( | ) = ϕ[( − )/ ]. El valor esperado de la variable latente es ∗ = .3. 46 pág. donde > 0. La distribución de ∗ dado es por lo tanto normal: ∗ | ~ ( . los modelos de datos de conteo pueden ser más apropiados.5 variable dependiente la información sólo es observable para una bus muestra. ( | )= Φ( / ) + ϕ( / ) Asumiendo independencia entre las observaciones. ). es decir: ∗ ) = + ~ (0. Edson Apaza Mamani Econometría Aplicada Prof. es decir. ( recolectadas. El número de aventuras extramatrimoniales son no negativos. Gasto en bienes durables son tanto valores positivos como ceros (este es el ejemplo utilizado en Tobin (1958) en su paper original. Sin embargo. (Observe que aunque el famoso paper de Fair (1978) utiliza un modelo Tobit.edu. Edson Apaza Mamani eapaza@unap. Como veremos más adelante.pe 7. El valor observado de está censurada por abajo por 0. ( | )= Φ( / ) + ϕ( / ) El valor esperado de la variable observada es: no es una función lineal de . existe información (para las variables independientes) de la muestra completa. para el caso de truncamiento la debajo = y = 1. la función de máxima verosimilitud (log likelihood) es: pág. ∗ ∗ ∗ ∗ ( | )=0∙ ( ≤ 0| ) + ( | > 0. Φ( / ) La regresión truncada usualmente se estima por el método de máxima verosimilitud. Tickets vendidos para un encuentro deportivo. 0. )∙ ( > 0| ) Note que existe una muestra restringida de todas las observaciones observadas.pe eapaza@unap. El término de error es independiente y normalmente distribuido con media cero y Figura 2: El modelo Tobit estándar (tipo 1). es decir: ii) Estimadores: MV ∗ ∗ La regresión por MCO para la variable observada sobre . varianza constante. = 2 (una constante y una variable independiente) un punto de truncamiento El censuramiento ocurre cuando los valores de la variable dependientes están restringidos −2 a un rango de valores.Econometría Aplicada Prof.edu. i) Especificación ∗ Considere la variable latente aleatoria que depende linealmente de .

pe eapaza@unap. El estimador es inconsistente ante y la presencia de heterocedasticidad. Por ejemplo: valores observados (censurado). ystar(2000. Vea Chay y Powell (2001) para una poblacional (ver ejemplo de aplicación para cambios marginales). se deja al lector la demostración del mismo. ≡ = Sin embargo.educ=12) Hay una descomposición interesante de este efecto marginal (McDonald y Moffit. 1980): (1) el efecto sobre la expectativa de todos los valores completamente observados estima ( | ) = ( ∗ | ∗ > 0. Edson Apaza Mamani eapaza@unap.Econometría Aplicada Prof. ll[(#)] ul[(#)] [options] luego es posible utilizar los comandos post-estimación predict y mfx para obtener Sin embargo.. introducción.edu. se puede estimar modelos más generales con censuramiento para arriba (ll) y para abajo (lu). 49 .pe − ∗ ( > 0) Φ( / ) −1 = + 1−Φ = = {| } { | } esta función puede estimar tanto y por una procedimiento numérico iterativo. Si tobit depvar [indepvars]. ∗ ( | ) = tobit depvar [indepvars] [if] [in] [weight] . Aunque la función de máxima verosimilitud del modelo Tobit no es globalmente cóncava este tiene un máximo único. predict(ystar(2000.) = Φ( / ) mfx compute.edu. Greene (2004. ll[(0)] el investigador está interesado en el promedio de toda la población. ) ∙ ( ∗ > 0| ) y calcula los efectos marginales y (2) el efecto sobre la probabilidad de ser completamente observado: de la edad y educación sobre el nivel de ingresos ( | ) para personas de 45 años de ∗ ∗ ∗ edad con escolaridad de 12 años alcanzados. ll(2000) ( | ) predict faminc_hat.3. 48 pág. Existen Estos efectos marginales dependen de las características individuales y sólo pueden varias estrategias de estimación semi-paramétrico.. ) ( ) ( ) con ( ∗| ∗ > 0. = La estimación por ML de los modelos de regresión censurada descansa fuertemente de los supuestos fuertes de que el término de error está normalmente distribuido. ( | ) ( | > 0. seccion 22. ) ∗ ( > 0) ∗ ∗ = ( > 0) + ( | > 0. La función donde de verosimilitud hacia arriba es una función combinada de componentes discreta y continua y una función de máxima verosimilitud estándar. ) = (1 − − ) pág. estima el modelo Tobit estándar (tipo 1) mediante el comando: La interpretación de los parámetros depende mucho de la pregunta de investigación. Asimismo.)) at(age=40.3. los coeficientes se interpretan como los efectos marginales. el efecto marginal es (derívelo!): tobit faminc age educ. estrategias que han sido propuestas ser reportados para tipos específicos o como efectos promedio en la muestra que relaja la distribución del término de error.) muestra cómo se realiza la prueba de heterocedasticidad. este puede ser mostrado que el estimador tiene propiedades usuales de 1−Φ Φ máxima verosimilitud. Edson Apaza Mamani Econometría Aplicada Prof. iv) Aplicaciones iii) Interpretación de los Parámetros El programa Stata. si el investigador está interesado en el efecto del valor esperado de los predicciones y efectos marginales.

51 . ∗ ) determina el valor de . El problema de selección muestral ocurre cuando la muestra observada no es una muestra La siguiente figura muestra un ejemplo de un modelo de selección con = 30. . pág.5 −2 .edu. Por tanto.pe eapaza@unap. es posible que al momento de estimar los determinantes de la migración o los factores que determinan el acceso al microcrédito. = 1. Edson Apaza Mamani ∗ =1 = . Estas se observan únicamente en un indicador cuando la variable latente ∗ es positiva. 50 pág. El ejemplo clásico: el ingreso sólo se observa para personas empleadas pero no para aquellos que deciden estar en casa (históricamente se mantienen para el caso de las mujeres). solamente se observan aquella que decidieron hacer el cambio de residencia por diferentes factores. = aleatoria pero sistemáticamente se eligen de una población. i) Especificación del modelo (Modelo de Selección de Heckman. MODELOS DE HECKMAN DE AUTOSELECCION En otras palabras. El valor de la variable ∗ = sólo se observa si el indicador es 1. Modelos Selección especial de esta especificación con = . 0 Los términos de error y son independientemente (entre observaciones) y conjuntamente normalmente distribuidos con covarianza .5 probabilidad de ser observada incrementa con . Hogares que realmente tienen acceso al crédito. 1 0. = 0. = . Otros ejemplos. El truncamiento y −1. )~ . la primera ecuación (la ecuación de decisión. Edson Apaza Mamani eapaza@unap. es decir: ∗ = + ∗ = + con 0 1 ( . tengan el problema de selección muestral. Tobit tipo 2) Considere un modelo con dos variables latentes ∗ y ∗ que dependen linealmente de variables observables y respectivamente. ∗ ) explica qi una observación está en la muestra o no. No se pueden ver los otros casos.Econometría Aplicada Prof. losque deciden quedarse en sus lugares de origen y los que no recibieron el crédito.8 y correlación entre y explica porqué la censuramiento como casos especiales de selección muestral o truncamiento incidental. = . en estudios de migración. = y = 1. Las dos variables latentes no son observadas por el investigador. Note que la varianza de es fijado a la unidad ya que en la estimación no está identificada. Edson Apaza Mamani Econometría Aplicada Prof. Note que el modelo estándar tobit es un caso 8.edu.pe ∗ ECONOMETRÍA APLICADA 1 >0 = 0 Prof. La segunda ecuación (ecuación de regresión de interés.

es decir. La siguiente figura muestra esta situación. = + Obteniendo estimadores sesgados de .edu. Note que no existe sesgo si los componentes no observables están no correlacionados ( = 0) incluso cuando la muestra observada es altamente selectiva (sólo inlf. para un y . Edson Apaza Mamani eapaza@unap. sólo con créditos. El término de error además está correlacionada con si ≠ 0 y está correlacionada con . ) = ( ∗| = 1. (Demostración en Stata). ya que el f actor: pág. ii) Estimación La regresión por MCO para la variable observada sobre . 52 pág.Econometría Aplicada Prof. puntos de ∗ por encima del valor esperado (por ejemplo. )= + = + ( ) Φ( ) Figura 4: el modelo de selección con correlación de características observables pero donde ( ) ≡ ( )/Φ( ) es el indicador conocido como el ratio inversa de Mills.pe eapaza@unap. Note que ( | . solo migrantes. etc. 53 .8. es No es necesario decir que no existe sesgo si las características observables y no decir que = 0. Como = 0. .edu. Edson Apaza Mamani Econometría Aplicada Prof. en términos econométricos: ( ) ( | . Figura 3: modelo de selección con correlación observable y características no observables. Esto es aun cierto cuando y están correlacionados. ) = si los dos términos de errores no están correlacionados. ∗ El valor esperado de la variable es la esperanza condicional de condicionado a que sea observado ( = 1).pe ( ) Φ( ) se omite y se convierte parte del término de error. características no observables no correlacionados. es el caso de una representación de muestra aleatoria pura. indica que se tiene una correlación positiva del error explica por qué. como por observables entre la decisión y la ecuación de regresión no esta correlacioandas. incluso cuando y están correlacionadas y así algunos valores de son más probables a ser observadas que otras.). la cual se observa en la siguiente figura. El resultado sesgado es llamado sesgo de selección o sesgo de selección muestral. el punto 6) es más probable para ser observado. Este ejemplo en el caso usual cuando alguna variable independiente aparece en y en .

En la práctica es difícil para encontrar numéricamente el máximo valor. (2) La contribución de probabilidad de las el conjunto de observaciones en el modelo probit estándar: observaciones con = 1. En el caso de = 0.edu. con el regresor adicional (el ratio inversa de Mills). =0 =1 ( ) ( ) ≡ = = [ = 0] + ∗ + = 1| ∗ 1 − Φ( ) Φ( ) =0 =1 =1 Segunda etapa. etc. pero no la varianza de el cual fue fijado a la unidad. la estimación con el procedimiento de dos etapas que analizaremos en la siguiente sección es a menudo utilizado como valor inicial. . eficiencia. normalidad asintótica. Vea Vella 81998) para una introducción. para todas las = [ = 0] + ∗ = 1| ∗ observaciones. las funciones de probabilidad se El estimador de dos etapas de Heckman es consistente per no eficiente. iv) Estimación con el Procedimiento de Dos Etapas de Heckman Figura 5: el modelo de selección tanto con características observables y características Heckman propuso un estimador de dos etapas que sólo considera la estimación de un no observables no correlacionadas. es decir. Además. la probabilidad de no ser La primera etapa es la estimación consistente de por el método de ML utilizando todo observado en la ecuación de regresión. El modelo de regresión de MCO obtiene . el ratio inversa de Mills . )= + = + ( ) Las ecuaciones de decisión y regresión pueden ser estimados simultáneamente por el Φ( ) método de máxima verosimilitud bajo el supuesto distribucional de los errores. El procedimiento de dos etapas se define sobre la media condicional: iii) Estimación con el Método de Máxima Verosimilitud ( ) ( | . y así la correlación = ⁄ .pe eapaza@unap.edu. ya que el valor inicial es muy importante. La estimación por ML del modelo de selección de Heckman descansa fuertemente en el supuesto de que el términos de errores están conjuntamente normalmente distribuidos. muestras aleatorias. La función de máxima verosimilitud consiste en dos partes: (1) la contribución de de todas las ’s observadas probabilidad de las observaciones con = 0. Hay un supuesto muy fuerte y a menudo no realista.). . es la estimación de la ecuación de regresión con el ratio inversa de Mills como − + − una variable adicional: = [Φ(− )] + + Φ / (1 − ) =0 =1 =1 = + + Para la submuestra de todas las observaciones. es decir la probabilidad de ser observada multiplicada con la densidad condicional del valor observado: ∗ = + ∗ = [ = 0] + [ = 1] ∗| =1 = 1 si > 0. Edson Apaza Mamani eapaza@unap. 0 en otro caso =0 =1 Podemos utilizar para esta estimación consistente.pe La estimación por ML del modelo de selección tienen las propiedades estándar de ML (consistencia. Edson Apaza Mamani Econometría Aplicada Prof. Muchas estrategias de estimación semi paramétricas han sido propuestos donde relajan los supuestos distributivos sobre el término de error. 54 pág. Note que esta función de máxima verosimilitud identifica . La estimación por ML es sólo necesario cuando la prueba de = 0 es rechazado en la estimación de dos etapas. modelo probit estándar y un modelo de regresión lineal. el cual esta medido con error y el término de pág. 55 . la matriz de reduce a la suma de un modelo probit y un modelo regresión lineal que puede ser covarianzas del estimador de la segunda etapa proporcionado por MCO estándar es incorrecto estimado por separado. es decir. Además. .Econometría Aplicada Prof.

como puede verse en la siguiente figura. Takeshi (1994).pe eapaza@unap. 29-42. con el comando heckman: Chay. Kenneth Y. Press. Para los regresores que aparecen en el lado izquierdo tanto en Amemiya. Advanced Econometrics. Econometric Analysis. Prentice Hall. “incorrectos” de MCO (como ellos son correctos bajo la hipótesis nula). Además el error estándar necesita ser corregido. el efecto marginal depende no sólo de sino también de a través de la University Press. Cambridge: Harvard ∗ y ∗ .1-22. r Estimación del modelo de Heckman en dos etapas heckman lwage educ exper expersq. Edson Apaza Mamani Econometría Aplicada Prof.7. select(kidslt6 kidsge6 faminc age agesq) twostep heckman lwage educ exper expersq. depvar_s = y varlist_s= . Vea Greene 2003. Oxford University Press. select(kidslt6 kidsge6 faminc age agesq) first twostep heckman lwage educ exper expersq. Introduction to Statistics and Econometrics. los investigadores están interesados en el efecto sobre la población observada. Edson Apaza Mamani eapaza@unap. La pruena de la hipótesis nula = calcula los parámetros de interés por el método de ML por dos etapas. En la mayoría de los casos. v) Interpretación de los parámetros Davidson and MacKinnon (1993). agregando la 0 es una prueba optima de = 0 y puede ser realizado utilizando los errores estándar opción twostep. 15(4). Stata detalles Greene (2003. Journal of Economic Perspectives.edu. nosotros estamos interesados en el efecto de las variables independientes en toda la población. Para más donde depvar = . Sin embargo. regress lwage educ exper expersq imr. Este es además fuertemente aconsejable para incluir variables en que no están incluidos en aunque esto es con frecuencia Estimación de la segunda etapa: difícil encontrar tales variables. Greene. Cambridge: Harvard University Press. William H. (2003). indepvars= . Stata calcula por el método de ML. En algunos casos. probabilidad de estar en la muestra. Amemiya. vi) Aplicación chapter 10.edu.6-15. ). 57 . chapter 11. es caso lineal para una gran rango de valores de .pe error es hetorocedastico.6.3.4.4. cuando = . sin embargo. section 22.4. select(depvar_s = varlist_s) [twostep] pág. es decir. 56 pág. xb (1998).) sobre cómo hacerlo. Powell (2001). select(kidslt6 kidsge6 faminc age agesq) first twostep mills(mymills) Referencias: Figura 6: El ratio inversa de Mills y las observaciones de la Figura 3. section 13. Además nos gustaría obtener los estimadores Davidson and MacKinnon (2004). Los parámetros y están teóricamente identificados por la nolinealidad del gen imr = normalden(y_hat)/normprob(y_hat) ratio inversa de Mills (. Takeshi (1985). Estimation and Inference in Econometrics. and James L. Semiparametric Censored Regression Models. vea Vella predict y_hat. 22.2.6-11.8. sections 15. heckman depvar [indepvars]. Econometric Theory and Methods. Oxford University insesgados y consistentes de que es interpretado directamente como efecto marginal.).Econometría Aplicada Prof. sección 22. Estimación de la primera etapa: Existe a menudo un problema práctico de identificación (casi multicolinealidad) cuando probit inlf kidslt6 kidsge6 faminc age agesq las variables de ambas ecuaciones son las mismas.

Edson Apaza Mamani Econometría Aplicada Prof. empresa. es decir. mientras que toma el valor de 0 si el individuo escoge otra de las opciones. F. Edson Apaza Mamani MODELOS DE ELECCIÓN MULTIPLE 9. 4 = "Algo de acuerdo ". … . Journal of Human ECONOMETRÍA APLICADA Resources.edu. 5 =" totalmente de acuerdo". Algunas veces tales valores/categorías de tales variables discretas pueden ser naturalmente ordenados.pe Vella.1. tomador de decisiones. 127-169 Prof. por ejemplo: {1. Probit Ordenado La variable dependiente a menudo toma números valores contables. hogar. 9. Algunos ejemplos:  Escala en las encuestas de opinión: 1 = "Totalmente en desacuerdo". a este tipo de problemas de decisión. A modo de ejemplo. 2 = "tiempo parcial". El modelo probit ordenado es un modelo de variable latente que ofrece un proceso generador de datos para este tipo de variables dependientes.2. … . 33.pe eapaza@unap. 3 = "Indeciso". Modelos de elección múltiple En muchas ocasiones.  Estado de Empleo: 1 = "sin empleo". logit ordenado y modelo logit multinomial.) i) Especificación del Modelo Econométrico Considere la variable latente aleatoria ∗ para los individuos = 1.2.Econometría Aplicada Prof. 2 = "Algo en desacuerdo". 3 = "tiempo completo". el agente económico debe elegir entre más de dos alternativas posibles. valores grandes se asumen a su correspondiente mayor “resultado”. (1998) Estimating Models with Sample Selection Bias: A Survey.edu. ) pág. y denotaremos por una variable que toma el valor de 1 si el individuo escoge la opción . 58 pág. …) elige de un conjunto de alternativas. (Aunque a menudo se utiliza como ejemplo cabe preguntarse el orden "natural" en este caso y aplicar los modelos sin ordenar. En esta sección analizaremos los modelos más conocidos de elección múltiple: probit ordenado. sin mucha dificultad. Edson Apaza Mamani eapaza@unap. 59 . supongamos que cada individuo de una muestra puede escoger una entre tres alternativas posibles. ∗ = + ~ (0. Los modelos presentados anteriormente pueden adaptarse. } Esto aplica en contextos donde un agente (individuo.

options] estima los parámetros y el umbral en el modelo probit ordenado. y individualmente.pe que depende linealmente de .2. Cuando es positivo.Econometría Aplicada Prof. es decir = + +⋯+ . … . además normal: ∗ | ~ ( . Además. ya que es arbitrariamente escalado por el = 3 < ∗≤ supuesto = 1. la elección observada es: respuesta/elección cambia a una categoría mayor cuando la variable independiente incrementa. . Lo cual puede abarcar. El modelo probit ordenado puede ser estimado utilizando el método de ML. que se define a través de sus puede ser interpretado directamente: un signo positivo nos dice si la probabilidad de límites inferior y superiores . Φ[( − )/ ] =1 ( = | ) ⎧ =− ( ) ⎪Φ[( − )/ ] − Φ[( − )/ ] =2 = Φ[( − )/ ] − Φ[( − )/ ] =3 ⎨ ⋮ ( = 2| ) ⎪ =[ ( )− ( − )] ⎩1 − Φ − / = donde Φ(. sin embargo. es decir. Entonces y . entonces la probabilidad de elegir la primera tanto por la definición de =0o = 0. … . uno usualmente asume = 1. El valor esperado de la variable latente es ∗ = .2. ⎪ ⎩ < ∗ A menudo es interesante predecir las probabilidades de elección ( = | ) para La probabilidad que un individuo elija la alternativa es fácilmente derivada con la ciertos tipos de y para inspeccionar el efecto marginal de una variable independiente ayuda de la siguiente figura: en las probabilidades de elección (suponiendo = 1 y = 1). La hipótesis nula = 0 implica que la variable . pág.pe eapaza@unap. El modelo es usualmente identificado especificados . Stata no asume la donde = 1 si el elije la alternativa y = 0 en caso contrario. ). 61 .edu. el efecto en las categorías medias es ambiguo y iii) Estimación depende de . = 0. Edson Apaza Mamani eapaza@unap. depvar es una variable categórica que es más favorable verosimilitud es numéricamente maximizado sujeto a < <⋯< . … . La distribución de ∗ dado es asintóticamente eficiente y distribuidos normalmente. que la magnitud ⎧2 < ∗≤ ⎪ absoluta de los parámetros no tiene sentido.edu. Tenga en cuenta. ) Es la distribución acumulativa normal estándar. por ejemplo. no tiene influencia 1 ∗ ≤ sobre la probabilidad de elección. El término de error es independiente y estimadores de la función de máxima verosimilitud y ̂ son consistentes. La función de constante. Edson Apaza Mamani Econometría Aplicada Prof. 60 pág. Los pero no necesariamente codificado como 1. no comparar directamente las ⎨ ⋮ estimaciones de los parámetros de la misma variable en diferentes subgrupos. normalmente distribuido con media 0 y varianza . La función v) Aplicaciones de ML es: El comando de Stata = oprobit depvar [indepvars] [if] [in] [weight] [. iv) Interpretación de los Parámetros La elección observada es únicamente si el índice del individuo indica la elección dentro [el índice del individuo es omitida en esta sección] el signo del parámetros estimados de una categoría (que elige previamente) = 1. ( = 3| ) =[ ( − )− ( − )] ii) Identificación … La probabilidad de elección permite sólo para identificar los ratios / y / pero no . es decir. ( = | ) = − Suponfa que la función índice contiene una constante. no están identificadas como sólo diferencias − Tenga en cuenta que los efectos marginales sólo pueden ser reportados para tipos aparecen en las probabilidades de elección . categoría ( = 1) disminuye con y la probabilidad de que los última categoría ( = ) aumenta. Sin embargo.

) elige a partir de un conjunto directamente puede predecir las probabilidades de elección para todas las alternativas. 9. Esto se aplica a menudo a un contexto en el que un agente nuestra notación ( = | ). … . predict p1 p2 p3. que es específica a una alternativa y una variable "gastos de viaje" que depende del medio de Los efectos marginales sobre la probabilidad de elegir la alternativa con valor 1 se transporte y el ingreso personal a través de los costos de oportunidad. "tren". Usted (individuo. a través de los individuos. es: ∗ = + Hay términos errores para cualquier individuo . "coche". a menudo interpretada como utilidad indirecta.2. que es el calcula como mismo para todas las alternativas. empresa. "Vans".pe El comando post estimación. 62 pág. La utilidad indirecta ∗ de un individuo elegir la alternativa = 1. p posiblemente. . para un individuo con características medias ̅ .2. familia. las variables dependientes discretas outcome(outcome) nooffset] predict p1.edu. "Station Wagons". Logit Condicional predict [type] {stub* | newvar | newvarlist} [if] [in] [. Puede haber una variable "tiempo de viaje". "avión".2. predict(outcome(1))  Los compradores de coches escogen entre ciertos tipos de vehículos: " Sedán 4 puertas". . "Todo terreno". mfx compute. Edson Apaza Mamani eapaza@unap. i) Especificación del Modelo Econométrico La elección de una de las alternativas desordenadas es impulsada por una variable latente. La elección observada de un individuo es por lo tanto ∗ ∗ 1 ≤ ⎧ ∗ ∗ ⎪2 ≤ ∗ ∗ = 3 ≤ ⎨ ⋮ ⎪ ∗ ∗ ⎩ ≤ pág. "Camiones Tractor" .  Los compradores de papel higiénico tienen que elegir entre diferentes marcas.Econometría Aplicada Prof. tipos . p outcome(1) {1. Algunos ejemplos: asigna las probabilidades estimada ( = 1| ). p2 y p3. Para = 3 alternativas. toma de decisiones. siempre que ofrezca el mayor valor de utilidad indirecta.. . la alternativa con valor = 1. por ejemplo. 2| ) en las respectivas nuevas variables p1. o en ambos . desordenado de alternativas. statistic En la mayoría de los casos. … . Un individuo elije la alternativa .. sólo en la alternativa. " Auto Deportivo". " coupé 2 puertas".  Las empresas deben elegir entre diferentes tecnologías. en no tienen un orden natural. Edson Apaza Mamani Econometría Aplicada Prof. el commando El modelo logit condicional requiere que las variables que varían entre alternativas y. } predice la probabilidad de elegir. para todos los individuos de la muestra. se puede dividir en variables que dependen de un sólo individuo. 63 . "Convertibles". ( = 2| )y ( =  Los viajeros eligen entre un conjunto de modos de transporte: "bus".. La opción at se utiliza para evaluar los "Mini vans".edu.pe eapaza@unap. Las variables exógenas = .

pe Tenga en cuenta que esto implica que la elección sólo depende de la diferencia de probabilidad de elección . es decir. Edson Apaza Mamani eapaza@unap. 64 pág. Los factores que influyen en el nivel de = 1− utilidad dependen de todas las alternativas. Edson Apaza Mamani Econometría Aplicada Prof. (IIA). . Tenga en cuenta que para la identificación del efecto fijo.edu. y el correspondiente no está identificado. no identificado por el mismo de elección para los tipos de hogares específicos descritos por argumento.Econometría Aplicada Prof. El modelo logit condicional supone que los términos de error siguen una distribución iii) Estimación independiente e idénticamente un valor extremo. La función de distribución acumulativa es: El modelo condicional puede ser estimado utilizando máxima verosimilitud (ML).pe eapaza@unap. por supuesto.…. el signo de un preferencia por una determinada alternativa es independiente de su preferencia parámetro se puede interpretar como la dirección de la influencia de la variable . La función de verosimilitud es = Esta especificación aparentemente arbitrario del término de error tiene dos = características importantes: (1) La diferencia de dos términos de error sigue una distribución logística (como en el modelo logit). la interpretación natural de la variable latente ∗ . Además. = ( = | )= ∑ A menudo es beneficioso incluir el término constante de la alternativa específica . Estos efectos fijos de la alternativa capturan todas las características observadas y no Sin embargo sólo se puede inspeccionar los cambios de las características individuales observadas que describen la alternativa que son idénticos entre los individuos. cualquier vector añade ∗ = + y ∗= − se cancela dentro de la pág. En estas situaciones. = ( = | )= ∑ iv) Interpretación de los Parámetros La independencia del término de error a través de alternativas es un supuesto fuerte. asintóticamente eficiente y normalmente distribuida.edu. El elige la alternativa es una expresión simple (que no es trivial derivar): estimador de máxima verosimilitud es consistente. En este en el resultado predicho como toda la información sobre las alternativas está encerrado en el estimado βj alternativa parámetros específicos. para todo . utilidad y no sobre el nivel.… . las personas sólo se preocupan por las diferencias de ( = | ) servicios públicos a través de alternativas. el coeficiente de la variable de alternativa específica no es identificado: adición o supresión de alternativas de elección. una alternativa actúa como referencia y su constante se fija en cero. la preferencia no observada. no es posible simular la caso. 65 . Un término constante que no varían con A menudo es más interesante utilizar el modelo estimado para predecir probabilidades los individuos ni las alternativas es. A veces es interesante examinar el efecto marginal de una variable independiente ii) Identificación en las probabilidades de elección: En el modelo logit condicional. (2) La probabilidad de que un individuo donde = 1 si el individuo elije la alternativa y = 0 de lo contrario. [El índice de individuo se omite en esta sección] En algunas aplicaciones existe una Esto implica que la estocástica de un individuo. Las variables independientes individuales específicas por lo tanto se ( = ≠ | ) cancela en la probabilidad elección = Tenga en cuenta que los efectos marginales dependen de que pasa por y para ello = = = ∑ ∑ ∑ sólo puede ser reportado para tipos especificados. La característica individual comienza a jugar un papel cuando interactúan con las características de las alternativas (forman los efectos fijos). Tenga en cuenta que la magnitud absoluta de los suposición se discuten en la literatura como independencia de alternativas irrelevantes parámetros no tiene sentido o intepretación dirrecta. Las fuertes y desagradables consecuencias de esta = . por lo tanto no se puede explicar la decisión del individuo. estocástico para otras alternativas.

2.. La variable dependiente (vardep = ) es una variable categórica para el individuo que elige la alternativa .edu.pe v) Aplicaciones numéricamente muy exigente. Los datos se almacenan como los datos habituales de corte transversal: una línea por Referencias cada individuo. Takeshi (1985).7.1-21. Discrete Choice Methods with Simulation. Sections 21. Advanced Econometrics. todavía no muchos entienden completamente los problemas prácticos que surgen de la identificación. La flexibilidad del probit multinomial y el modelo logit mixto. sin embargo..4. Edson Apaza Mamani Econometría Aplicada Prof.3. Econometric Analysis. El comando post-estimación Davidson and MacKinnon (2004). 66 pág. Por ejemplo.4. Section 13. Kenneth E. Harvard University Press. tiene un precio: la estimación es pág. Los efectos marginales sobre la probabilidad de elegir por ejemplo.3. mlogit depvar [indepvars] [if] [in] [weight] [. Econometric Theory and Methods. para todos los individuos en la muestra. Takeshi (1994). el comando es: predict p1 p2 p3.edu.3. chapter 11. Stata estima el modelo logit multinomial utilizando el Train. Chapter 9. basecategory (#) Greene. Oxford University predict p1. options] Amemiya. para 3 alternativas. (2003).Econometría Aplicada Prof.5. 67 . vi) Vea otros temas relacionados . William H. predice la probabilidad de elegir la alternativa con valor = 1. Prentice Hall. De manera general Amemiya. Harvard el comando mlogit es de la forma: University Press. predict(outcome(1)) para un individuo con características medias ̅ .8. donde # indica la alternativa para el cual el parámetro = 0 para su identificación (valor de la variable dependiente como base o punto de referencia). en la mayoría de las aplicaciones de un supuesto muy poco realista. Las variables independientes (varindeps = ) no varían entre las alternativas. la alternativa con valor 1 se calcula mediante mfx compute. 21. Edson Apaza Mamani eapaza@unap. en nuestra notación ( = 1| ). Por otra parte.1-9. La opción at se utiliza para evaluar otros tipos más. .7. p básicamente asigna las probabilidades estimadas ( = 1| ). p2 y p3.pe eapaza@unap. mlogit vardep varindeps. La propiedad de independencia de alternativas irrelevantes (IIA) de los modelos logit condicional y el modelo logit multinomial es. (2003). Los estimadores de los parámetros y en especial las predicciones contrafactuales de ambos modelos son incompatibles si el IIA no se sostiene. Los modelos más flexibles que se han propuestos son el logit anidado (nested logit). Introduction to Statistics and Econometrics. logit mixto (kernel) o probit multinomial tanto. Chapter 1 and 2. ( = 2| ) y ( = 2| ) en las respectivas nuevas variables p1. Usted puede proyectar directamente las probabilidades de elección para todas las alternativas. Cambridge siguiente comando: University Press. Los modelos logit multinomiales sólo utiliza las características individuales específicas. p outcome(1) Press.

Edson Apaza Mamani eapaza@unap.  Los compradores de papel higiénico eligen entre diferentes marcas. " Auto Deportivo". Algunos ejemplos:  Los viajeros eligen entre un conjunto de modos de transporte: "bus".2. i) Especificación del Modelo Econométrico iii) Estimación El modelo logit multinomial difiere del modelo logit condicional sólo en la especificación El modelo condicional puede ser estimado utilizando máxima verosimilitud (ML). Sólo se utiliza información elección sobre el comprador. 69 . vector se añade a todos los vectores de ∗ = + cancela en las probabilidades de "Mini vans". Como en el caso = = = ∑ ( ) ∑ ∑ anterior. Los ’s se identifican generalmente mediante el establecimiento de la = 0 para una alternativa de referencia.edu. = − "coche". "Station Wagons". … .Econometría Aplicada Prof. "Todo terreno". "Vans". función de verosimilitud es ∗ = + = Las variables exógenas describen únicamente los individuos y son idénticos entre las alternativas.3. no tienen una nunca definición: cualquier puertas". Logit Multinomial de valor extremo El modelo logit multinomial se utiliza para el mismo tipo de situaciones de elección como = el logit condicional: y la probabilidad de que un individuo elige la alternativa es: {1. ii) Identificación  Los compradores de coches escoger entre ciertos tipos de vehículos:  Los compradores de coches escogen entre ciertos tipos de vehículos: " Sedán 4 El vector de parámetros . Edson Apaza Mamani ⎪2 ≥ ∗ ∗ = 3 ≥ ⎨ ⋮ ⎪ ∗ ∗ MODELOS DE ELECCIÓN MULTIPLE ⎩ ≥ los términos de error continúan como independiente e idénticamente una distribución 9. } = ( = | )= donde el valor de no tienen un orden natural. " coupé 2 puertas". = 1. 68 pág. "Camiones Tractor" . La de la parte determinística de la utilidad indirecta. "tren".edu.pe Las partes restantes son como en el modelo logit condicional: la elección observada de un individuo es ECONOMETRÍA APLICADA ∗ ∗ 1 ≥ ⎧ ∗ ∗ Prof. Sin embargo el parámetro difiere entre las alternativas. el logit multinomial utiliza sólo las variables que describen las características Una característica interesante del modelo logit multinomial es que el ratio de de los individuos y no de las alternativas.pe eapaza@unap. ∗ .2. pág. No hay información sobre los modos de viaje. … . "Convertibles".  Las empresas deben elegir entre diferentes tecnologías. Sólo se utiliza Información de la empresa. "avión". Esto limita la utilidad del modelo para las probabilidad /odds ratio) ( / ) depende log-linealmente de . predicciones hipotéticas. ∑ Sin embargo. Hay variables que describen al viajero. como sus ingresos. Edson Apaza Mamani Econometría Aplicada Prof. sólo se utiliza información sobre el comprador.

El modelo logit multinomial también se puede utilizar para predecir probabilidades de elección para determinados tipos de hogares References = ( = | )= ∑ Train. Edson Apaza Mamani Econometría Aplicada Prof. para 3 alternativas.edu. La variable dependiente (depvar = ) es una variable categórica los parámetros estimados. p2 y p3. predict(outcome(1)) significa por lo tanto que la probabilidad relativa de elegir aumenta la probabilidad para un individuo con características medias ̅ . el comando es: / predict p1 p2 p3. La opción at se utiliza para evaluar relativa de elegir . Ni el signo (véase la sección de identificación Los modelos logit multinomiales sólo utiliza las características individuales específicas. Cambridge University Press. 70 pág.edu. Edson Apaza Mamani eapaza@unap. . 71 . Por obtener viendo el logaritmo del ratio de probabilidades: ejemplo. Las Los datos se almacenan tanto como es usual en formato de corte transversal: una línea pruebas de hipótesis deben. basecategory(#) ( = | ) = − ̅ donde # indica la alternativa para el cual el parámetro = 0 para su identificación (valor de la variable dependiente como base o punto de referencia). p = − básicamente asigna las probabilidades estimadas ( = 1| ). ser muy cuidadosamente formuladas en términos de por cada individuo. depende no sólo de los parámetros sino también en la media de todas las demás alternativas ̅ = 1/ ∑ El comando post-estimación predict p1. Discrete Choice Methods with Simulation. encerrada en los parámetros específicos estimado de la alternativa . con la persona que elige la alternativa . Las variables independientes (indepvar= ) no varían entre las alternativas. iv) Interpretación de los Parámetros v) Aplicaciones [El índice individual se omite en esta sección] Los parámetros del modelo logit multinomial son difíciles de interpretar. pág. Usted puede Una posible interpretación más directa de las estimaciones de los parámetros se puede proyectar directamente las probabilidades de elección para todas las alternativas. El Sin embargo sólo se puede inspeccionar los cambios de las características individuales estimador de máxima verosimilitud es consistente. no es posible simular la adición o supresión de alternativas de elección.pe donde = 1 si el individuo elije la alternativa y = 0 de lo contrario. otros tipos más. como toda la información sobre las alternativas está normalmente distribuida. Stata estima el modelo logit El efecto marginal de una variable independiente en la probabilidad de elección para multinomial con el comando la alternativa mlogit depvar indepvars. ( = 2| ) que se reduce a: y ( = 2| ) en las respectivas nuevas variables p1. para todos los individuos en la muestra.Econometría Aplicada Prof. Chapter 1 and 2. la alternativa con = valor 1 se calcula mediante para las comparaciones con la categoría de referencia . en nuestra notación ( = 1| ).pe eapaza@unap. Kenneth E. pues. anteriormente) ni la magnitud del parámetro tiene un significado intuitivo directa. (2003). Un parámetro positivo mfx compute. p outcome(1) Una posible interpretación más directa de las estimaciones de los parámetros se puede se ha subido al ver el registro de la razón de posibilidades: predice la probabilidad de elegir la alternativa con valor = 1. / Los efectos marginales sobre la probabilidad de elegir por ejemplo. asintóticamente eficiente y en el resultado proyectado. Además.

Amemiya. Sections 21. 21.Econometría Aplicada Prof. Edson Apaza Mamani eapaza@unap.1-9. Introduction to Statistics and Econometrics. Oxford University Press.7. Takeshi (1985).4. Chapter 9.7. Takeshi (1994). chapter 11.2. Prentice Hall.4. Econometric Theory and Methods.pe Greene. William H.3. Davidson and MacKinnon (2004). pág.5. (2003).edu.3. Harvard University Press.8.3. Section 13. Econometric Analysis. Amemiya.1-21. Advanced Econometrics. 72 . Harvard University Press.