You are on page 1of 75

Universidad de la Habana

Facultad de Economa
Departamento de Macro-Microeconoma

MODELOS Y MTODOS

MICROECONOMTRICOS

TESIS DE MAESTRA

Autor: Lic. Maikel Hernndez Castellanos

Tutora: Dra. Doris Nennger Navarro

Ciudad de la Habana, Diciembre de 2005


Agradecimientos:

A mi tutora, a mis padres, a todos los que me ayudaron a realizar este trabajo.

2
ndice

Introduccin general y objetivos .......................... 5


1. Captulo Introductorio ....................................... 7
1.1. Que es la Microeconometra? ......................................................................... 7
1.2. Antecedentes .......................................................................................................... 8
1.3. Clasificacin de los modelos microeconomtricos ..................................... 9
2. Modelos de eleccin binaria ........................... 11
2.1. Interpretacin econmica de los modelos de eleccin binaria .............. 11
2.2.1. Problemas en la estimacin del MPL...................................................... 13
2.2.2. Limitaciones del MPL .................................................................................. 16
2.3. Los modelos Logit, Probit y Valor Extremo ................................................. 17
2.3.1. Especificacin de los modelos................................................................. 19
2.3.2. El problema de la estimacin.................................................................... 20
2.4. Medidas de la bondad del ajuste en los modelos dicotmicos .............. 21
2.5. Interpretacin de los modelos de eleccin binaria .................................... 22
2.5.1. Interpretacin del modelo de probabilidad lineal (MPL).................... 22
2.5.2. Interpretacin del modelo Logit ............................................................... 23
2.5.3 Interpretacin del modelo Probit............................................................... 23
2.5.4 Interpretacin del modelo Valor Extremo ............................................... 24
2.6. Comparacin entre Logit, Probit y Valor Extremo...................................... 25
2.7. Tests para problemas de especificacin en los modelos de eleccin
binaria ............................................................................................................................. 25
2.8. Un ejemplo sobre concesin de crditos bancarios ................................. 26
2.8.1. Anlisis a travs del Modelo de probabilidad lineal ........................... 27
2.8.2. Estimaciones Logit, Probit y Valor Extremo ......................................... 31
2.8.3 Comparacin entre modelos ...................................................................... 34
2.8.4. Problemas de especificacin en el modelo elegido ........................... 36
3. Modelos de respuesta mltiple....................... 41
3.1. Clasificacin de los modelos de respuesta mltiple ................................. 41
3.2. Interpretacin econmica del proceso de eleccin mltiple................... 42
3.3 Modelo de Respuesta Mltiple Ordenado, enfoque de la variable latente
.......................................................................................................................................... 42
3.3.1. Estimacin Mximo -Verosmil del Modelo de Respuesta Mltiple
Ordenado ................................................................................................................... 44
3.3.2. Interpretacin del modelo ordenado....................................................... 44
3.4. El modelo de respuesta mltiple ordenado, un ejemplo didctico........ 45
3.4.1 Estimaciones mediante los modelos Probit ordenado y Logit
ordenado.................................................................................................................... 47
3.4.2. Comparacin entre modelos ..................................................................... 48
3.4.3. Interpretacin de los resultados en el modelo elegido...................... 49
4. Modelos censurados y truncados .................. 51
4.1. Definiciones de truncamiento y censura....................................................... 51

3
4.2. Truncamiento........................................................................................................ 52
4.2.2. El modelo de regresin truncado, especificacin y estimacin .... 54
4.3. Datos censurados................................................................................................ 55
4.3.1. Modelo de regresin censurada: Anlisis Tobit .................................. 56
4.3.2 El modelo de regresin censurada, el problema de la estimacin.. 57
4.4. Validacin y contrastes de hiptesis ............................................................. 58
4.5. Modelos censurados y truncados, un ejemplo didctico......................... 58
4.5.1. Anlisis del modelo truncado ................................................................... 59
4.5.2. Anlisis del modelo censurado ................................................................ 62
Conclusiones ....................................................... 65
Recomendaciones ............................................... 67
Bibliografa utilizada ............................................ 68
Anexos .................................................................. 70

4
Introduccin general y objetivos
La Economa, como ciencia ligada al estudio de la forma en que los agentes
utilizan los recursos escasos, est sujeta a continuos procesos de decisin entre
las diferentes alternativas que se presentan, tanto a nivel macro como
microeconmico. Es por eso que una de las tareas ms importantes para los
economistas es la bsqueda de herramientas que permitan dar un carcter
objetivo al proceso de toma de decisiones.

Esta circunstancia oblig a que a partir de la segunda mitad del siglo XX se


comenzaran a desarrollar un conjunto de medios y tcnicas que han pasado a
formar parte de una nueva rama de la Econometra conocida actualmente como
Microeconometra. Estos medios y tcnicas, poseen algunas caractersticas
distintivas que precisan un estudio particular de los mismos.

Sin embargo, el trmino Microeconometra, as como sus caractersticas y


contenido no resulta ser del conocimiento de la inmensa mayora de los
profesionales de la Economa en nuestro pas, incluso de buena parte de aquellos
que enfocan su esfuerzo en temas de Econometra, aunque quizs en algn
momento hayan trabajado con modelos microeconomtricos. Tampoco existe
ninguna asignatura con ese nombre dentro de los programas de estudios de las
Facultades de Economa en Cuba.

El objetivo fundamental de este trabajo es la realizacin de un anlisis profundo y


riguroso sobre los principales y ms utilizados modelos y mtodos
microeconomtricos, con el fin de elaborar un material metodolgico de
referencia en donde se establezcan conclusiones sobre sus elementos ms
distintivos e importantes y la necesidad del estudio de dichos elementos.

Es de sealar que este estudio se limita slo a los modelos microeconomtricos


de corte transversal, es decir aquellos que no consideran la componente temporal,
postergando para futuras investigaciones la metodologa de Datos Panel.

La estructura de este material est diseada en la siguiente forma:

Primeramente se refleja un captulo introductorio, en el cual se establece lo que


es la Microeconometra y sus antecedentes. Tambin se realiza la clasificacin de
los modelos microeconmetricos, elemento este ltimo que resulta indispensable
para comprender la posterior estructura as como los contenidos tratados en los
captulos siguientes.

El segundo captulo est dedicado al tema de los modelos de eleccin binaria.


Adems de los elementos tericos correspondientes al tema, se realiza, con un fin
didctico, un ejemplo sobre concesin de crditos bancarios que permite
desarrollar toda la metodologa expuesta en el captulo para un caso particular.

5
El tercer captulo se dedica a los modelos multinomiales o de eleccin mltiple. En
l se presenta por primera vez el enfoque de variable latente, idea importante
dentro del anlisis microeconomtrico. Adems de los aspectos metodolgicos, se
efecta un ejemplo con fines didcticos.

El cuarto captulo se enfoca en los modelos con variable dependiente limitada,


especficamente los modelos truncados y censurados. En l se expone el anlisis
Tobit para modelos censurados y se analiza un ejemplo ilustrativo.

El paquete estadstico empleado para realizar las estimaciones de los modelos


utilizados como ejemplo en cada uno de los captulos es el programa Eviews en su
versin 3.1 , adems todas las pruebas estadsticas realizadas se han efectuado
con un nivel de significacin = 0.05 .

Finalmente se establecen las conclusiones y recomendaciones derivadas de los


cuatro captulos mencionados.

6
1. Captulo Introductorio

1.1. Que es la Microeconometra?

La Microeconometra es una nueva rama de la Econometra que se dedica a


estudiar y modelar los procesos de decisin y de eleccin entre diferentes
alternativas por parte de los agentes individuales. Ofrece un conjunto de teoras y
mtodos analticos para estudiar y explicar los comportamientos individuales de
las unidades decisorias y la posibilidad de contrastar estadsticamente las
hiptesis efectuadas.

La Microeconometra se orienta hacia el anlisis con datos individualizados o


microeconmicos. La ventaja de los modelos microeconomtricos frente a los
tradicionalmente utilizados en Econometra consiste en que superan los
problemas de agregacin existentes en los planteamientos economtricos
tradicionales, lo que permite explicar con mayor eficacia las preferencias
individuales en trminos probabilsticos. En la Microeconometra se fusionan los
conceptos de la Econometra clsica con la teora microeconmica para la
explicacin de las decisiones econmicas de los individuos y las familias.

La Microeconometra es un campo de aplicacin, no slo para la economa, sino


tambin para otras ciencias sociales tales como la sicologa o la sociologa.
Adems, algunos modelos microeconomtricos han sido utilizados en ciencias
naturales como la medicina y la biologa.

La captacin de los procesos de decisin individual requiere el estudio de los


mismos desde un punto de vista desagregado. Estos estudios requieren
informacin con datos individualizados para cada uno de los agentes econmicos,
lo cual implica un gran esfuerzo en el tratamiento de la informacin. Los avances
informticos, que han permitido contar con datos individualizados a gran escala y
el avance experimentado en las ltimas dcadas con respecto a los estudios
realizados con encuestas, han catalizado el empleo de los mtodos
microeconomtricos y han desarrollado un marco terico de referencia donde
fundamentar los procesos de decisin individual. As, la Microeconometra
proporciona una metodologa que permite examinar y modelar los datos extrados
de encuestas individuales captando efectos que no pueden ser captados con los
datos agregados.

La mayor parte de los modelos microeconomtricos reflejan procesos de decisin


discreta, esto es, que los individuos se enfrentan slo a unas pocas opciones.
Tcnicas tradicionales de estimacin, como por ejemplo los Mnimos cuadrados
ordinarios (MCO), resultan impropias dado el carcter de discontinuidad del
regresando y la no linealidad en sentido general de las ecuaciones modeladas.
Estos modelos en general recurren a procesos de estimacin no lineales y la

7
tcnica de estimacin de referencia es el mtodo de Mxima Verosimilitud. La
Microeconometra se ocupa tambin de los diagnsticos que permiten validar los
resultados del modelo y de los supuestos establecidos en su fundamentacin
terica. La parte de la Econometra que estudia los problemas tericos inherentes
a este tipo de modelos se denomina Mtodos Microeconomtricos.

1.2. Antecedentes

En los ltimos aos ha cobrado especial importancia a nivel internacional el


estudio con modelos microeconomtricos. Algunos aspectos que han potenciado
recientemente su uso han sido:

- La generalizacin y uso de medios informticos junto con el desarrollo de


softwares especficos que han facilitado el uso de tcnicas y mtodos
sofisticados de anlisis.

- El aumento de la disponibilidad de informacin estadstica individualizada


obtenida principalmente a travs de encuestas.

- El inters de las empresas e instituciones en basar sus decisiones en


estudios cuantitativos bien fundamentados.

En el ao 2000 se le otorga el premio Nobel de Economa a los economistas


James J. Heckman y Daniel L. McFadden, poniendo de manifiesto la relevancia
de las tcnicas de anlisis microeconomtrico. Dichos economistas, laureados por
su desarrollo de las teoras y mtodos para el anlisis de las alternativas discretas,
desarrollan sus trabajos en el marco de la teora de la utilidad y dentro del binomio
teora econmica-observacin emprica. Sus investigaciones tratan el anlisis y la
explotacin de informacin microeconmica relacionada con los individuos familias
y empresas con el fin de caracterizar su conducta ms probable.

Los modelos microeconomtricos han sido ampliamente utilizados en muchsimos


estudios, fundamentalmente en pases desarrollados.

El propio Daniel McFadden realiz un estudio con el fin de establecer la


probabilidad del uso o no del transporte pblico por parte de los individuos, dicha
investigacin fue completada con una aplicacin posterior en la ciudad de San
Francisco que permita estimar los efectos de futuras inversiones sobre las
decisiones individuales de movilidad.

Los modelos y mtodos microeconomtricos han sido utilizados en problemas


sobre clasificacin de bonos, riesgos de impago, concesin de prstamos,
modelos de demanda, en estudios sobre migraciones, turismo, seguros, finanzas,
transporte, en la evaluacin de riesgos de accidentes, problemas de seleccin en

8
economa laboral, economa de la fecundidad, pensiones y otras muchas
situaciones.

Es importante sealar que actualmente la Microeconometra es una de las ramas


de investigacin ms activa dentro de la Econometra, por lo que su empleo debe
ser difundido en las diferentes reas de las disciplinas econmicas en Cuba.
Adems de ser una de las ramas ms dinmicas e innovadoras de las que
componen las ciencias econmicas, es una de las ms integradoras, al hacer uso
de los mtodos economtricos sin perder nunca la referencia de la teora
econmica para la especificacin de los modelos empricos. Los avances de la
Microeconometra en las ltimas dos dcadas han contribuido notablemente a
facilitar la contrastacin emprica rigurosa de los modelos tericos desarrollados
en Economa, lo que constituye un objetivo para toda disciplina que aspire a ser
considerada como ciencia.

Un aspecto muy caracterstico de la Microeconometra es que sus contribuciones


metodolgicas han venido siempre motivadas por la resolucin de problemas de
naturaleza aplicada, problemas que con frecuencia tienen una gran relevancia
desde el punto de vista social y que trascienden lo puramente econmico.

Como asignatura se explica en muchas universidades europeas. En Espaa


existen programas en Alicante, Islas Balear, Universidad Complutense de Madrid,
etc. Nuestros actuales programas slo incluyen algunos elementos de
Microeconometra, especificamente el MPL y el modelo Logit dentro de la
asignatura Econometra II que se imparte a los estudiantes de Economa Global.

1.3. Clasificacin de los modelos microeconomtricos

Los modelos microeconomtricos se clasifican segn las caractersticas de la


variable endgena ya que sta determina finalmente las alternativas a las que se
enfrenta el agente en el proceso de decisin. Se clasifican en Modelos de eleccin
discreta, Modelos censurados y truncados y Modelos de datos panel.

Dentro de los modelos de eleccin discreta se encuentran los modelos de eleccin


binaria y los modelos de eleccin mltiples. Los modelos de eleccin binaria
fueron utilizados a partir de los aos cincuenta asociados a la teora de la decisin
racional del consumidor. Su introduccin a la Microeconometra fue a partir del
trabajo de McFadden (1973). Anteriormente dichos modelos haban tenido
aplicaciones en la medicina y la biologa donde se utilizaban para estimar la
efectividad de un tratamiento mdico especfico en un determinado paciente.

En 1970 Theil generaliz los modelos al caso en que los agentes se enfrentasen a
ms de dos alternativas en su decisin surgiendo as los modelos de eleccin
mltiples. Estos modelos requieren un tratamiento especfico, su objetivo no es
tanto la determinacin del comportamiento medio de la poblacin sino la obtencin

9
del valor de la probabilidad de que el individuo adopte una eleccin determinada
segn el valor de las variables explicativas.

Un aspecto relevante a considerar en los modelos microeconomtricos es la


importancia que tienen las tcnicas de recogida de la informacin para la
obtencin de resultados confiables, debido a que se parte de probabilidades
muestrales para determinar la probabilidad poblacional de los factores que
condicionan la decisin.

Los modelos censurados son modelos hbridos que anan de cierta forma las
caractersticas de los modelos dicotmicos junto con los modelos lineales, la
variable dependiente en este caso es de tipo mixto, presenta valores de variable
discreta y continua a la vez. Dentro de una gran variedad los ms utilizados son
los llamados modelos Tobit donde se presentan procesos de eleccin secuencial.

Los modelos de panel de datos tienen una doble vertiente de corte transversal y
de informacin temporal. Permiten analizar las variaciones en el tiempo de las
decisiones de los individuos segn van cambiando sus condiciones iniciales,
considerando el carcter dinmico de los modelos. Posibilitan captar la trayectoria
dinmica de los individuos, con lo que es posible obtener resultados superiores a
los modelos que slo consideran la vertiente transversal.

10
Captulo 2

2. Modelos de eleccin binaria


Existen numerosas situaciones en que los agentes econmicos deben elegir entre
dos posibles alternativas, afiliarse o no a un determinado sindicato, consumir o no
un determinado bien, conceder o no un crdito, el estudio por parte de un banco
de que un cliente devuelva en tiempo su prstamo o no y muchas otras. La
caracterstica comn de los modelos que se utilizan en casos como estos, es que
la variable dependiente es del tipo que produce una respuesta de s o no, es decir,
es dicotmica por naturaleza. La modelacin de estas situaciones se efecta a
travs de los llamados modelos de respuesta dicotmica. Este captulo est
dirigido al estudio de los mismos y en especfico sern abordados el Modelo de
Probabilidad Lineal (MPL) y los modelos Logit, Probit y Valor Extremo (VE).

2.1. Interpretacin econmica de los modelos de eleccin binaria

La interpretacin econmica de los modelos de eleccin binaria se fundamenta en


el hecho de que la racionalidad de los agentes econmicos hace comportarse a
los mismos de modo tal que maximicen la utilidad esperada que les proporciona
cada una de las opciones sobre las que le toca decidir. As pues, a la luz de tal
interpretacin, las probabilidades de que el individuo i elija la alternativa 1 la
alternativa 0 estarn en funcin de las utilidades esperadas por cada decisin
para dicho individuo, las cuales se denotan como U i1 y U i 0 respectivamente. Las
mismas, son funciones de las variables explicativas de dicha decisin, que son en
definitiva caractersticas propias de cada alternativa de eleccin o caractersticas
personales, econmicas o culturales del individuo enfrentado al proceso de
decisin.

Ms especficamente, se define como

U i 0 : la utilidad que proporciona al agente i la eleccin 0 .


U i1 : la utilidad que proporciona al agente i la eleccin 1 .
X i 0 : el vector de las variables explicativas que caracterizan la eleccin de
la alternativa 0 por parte del agente i .
X i1 : el vector de las variables explicativas que caracterizan la eleccin de la
alternativa 1 por parte del agente i .

Al suponer linealidad en las funciones de utilidad, se tiene que

11
Ui0 = U i0 + i0 = 0 + X i0 '
+ i0

( 2.1 )
U i1 = U i1 + i1 = 1 + X i1 '
+ i1

Aqu 0 , 1 y el vector constituyen los parmetros de las regresiones y i 0 y


i1 son perturbaciones aleatorias que recogen las desviaciones del agente i con

respecto a las utilidades medias asociadas a cada decisin U i 0 y U i1 . Se


considera que estas perturbaciones son independientemente distribuidas con
esperanza constante e igual a cero y varianza constante en ambos casos.

Ahora y dentro del marco de la teora de la utilidad, el agente i elegir la opcin 1


si la utilidad de esa eleccin supera a la de la opcin 0 y viceversa, es decir:

1 si U i1 > U i 0
Yi = ( 2.2 ).
0 si U i0 > U i1

Lo cual implica que

P(Yi = 1) = P(U i1 > U i0 ) = P( i0 i1 < U i1 U i 0 ) =


( 2.3 ).
=P i0 i1 < ( 1 0) +
'
( X i1 X i0 ) = F ( X i ' )

Es decir, la posibilidad de que el individuo i elija la opcin 1 puede ser resumida a


travs de la ecuacin

P(Yi = 1) = F ( X i ' ) ( 2.4 ),

la cual establece que la probabilidad de que el individuo enfrentado al proceso de


eleccin binaria tome una decisin especfica se calcula a travs del valor
numrico que alcanza una determinada funcin de distribucin F evaluada en un
factor Z i = X i ' denominado ndice, el cual es a su vez funcin del vector de
variables explicativas de la decisin del individuo i .

La ecuacin ( 2.4 ) constituye el ncleo de la modelacin de los procesos de


eleccin binaria. Ahora, dependiendo de la funcin F que se seleccione, el
modelo especificado ser diferente. El Modelo de Probabilidad Lineal (MPL) y los
modelos Logit, Probit y Valor Extremo, estn determinados a travs de
ecuaciones que constituyen casos particulares de la ecuacin ( 2.4 ) cuando se
utilizan formas funcionales F especficas.

12
2.2. El modelo de probabilidad lineal (MPL)

Es posible considerar el siguiente modelo para la variable dicotmica Y

+ i = [1 X 2i X 3i .... X ki ][ ] + i
'
Yi = X i '
1 2 3 ..... ki ( 2.5 )

donde i es el trmino de perturbacin aleatorio. Los modelos en la forma


anterior, que expresan la variable dicotmica Yi como una funcin lineal de las
variables explicativas X i se denominan modelos de probabilidad lineal.

Suponiendo como es habitual que E( i ) = 0 , se obtiene que

E(Yi /X i ) = X i '
( 2.6 ).

Si se denota ahora como Pi a P(Yi = 1) , entonces 1 Pi = P(Yi = 0) , y como


consecuencia

E(Yi /X i ) = 1( Pi ) + 0(1 Pi ) = Pi ( 2.7 ).

Comparando ( 2.6 ) con ( 2.7 ), no es difcil obtener la siguiente relacin

E(Yi / X i ) = X i '
= Pi = P(Yi = 1) ( 2.8 ).

La ecuacin ( 2.8 ) se puede ver como el caso particular de la ecuacin ( 2.4 )


cuando F es la funcin identidad F ( x) = x (aunque esta ltima no satisface las
condiciones necesarias para ser considerada una funcin de distribucin).

La probabilidad de eleccin de la alternativa 1 por parte del agente i quedara


planteada en los trminos siguientes

P(Yi = 1) = X i '
( 2.9 ).

2.2.1. Problemas en la estimacin del MPL

El aplicar el mtodo de los MCO al modelo de probabilidad lineal descrito en ( 2.5 )

+ i = [1X 2i X 3i .... X ki ][ ] + i
'
Yi = X i '
1 2 3 ..... k ,

13
puede acarrear diferentes consecuencias negativas debido a algunos problemas
especiales que ste posee y que se enumeran a continuacin.

1) No normalidad de las perturbaciones

Al igual que Yi , i toma dos valores, es decir

i = Yi Xi '
( 2.10 )

y como consecuencia

i = 1 X i '
si Yi = 1 , lo cual ocurre con probabilidad Pi ,

i = X i '
si Yi = 0 , lo cual ocurre con probabilidad ( 1 Pi ).

Por lo tanto i sigue una distribucin Binomial y no una distribucin Normal. La


violacin del supuesto de normalidad no trae consecuencias sobre los estimadores
puntuales de los parmetros, que continan siendo lineales, insesgados y ptimos,
aunque si trae problemas para fines de inferencia, ya que los estadsticos usuales
para efectuar contrastes de hiptesis no pueden ser utilizados.

Si el tamao de la muestra aumenta indefinidamente, los estimadores de MCO


generalmente tienden a estar normalmente distribuidos1. Por tanto, para muestras
grandes la metodologa usual para la inferencia estadstica del MPL sigue el
procedimiento habitual bajo el supuesto de normalidad.

2) Heteroscedasticidad de las perturbaciones

Como se observ anteriormente, las perturbaciones i estn distribuidas de la


siguiente forma:

i Probabilidad
Xi '
1 Pi
1 Xi '
Pi

Ahora:

1
El resultado es una consecuencia del teorema central del lmite, su prueba aparece en [12] E.
Malinvaud, Statistical Methods of Econometrics, Rand Mc Nally & Company, Chicago 1966.

14
V( i ) = E( i E( i )) 2 = E( i ) , dado que se supone que E ( i ) = 0 ,
2

y se obtiene que

V( i ) = E( i ) = ( X i ' )2 (1 Pi ) + (1 X i ' ) 2 Pi
2

( 2.11 ).
V( i ) = X i (1 X i ) = Pi (1 Pi )
' '

Por tanto, la varianza del trmino de error depende de X i con lo que se presenta
un problema de heteroscedasticidad. La heteroscedasticidad provoca que los
estimadores de MCO aunque son insesgados, no sean eficientes. Este problema
no es insoluble, una posible solucin la constituye la tcnica de Mnimos
Cuadrados Ponderados. Es posible transformar la ecuacin ( 2.5 ) dividiendo
ambos lados del modelo por

E(Yi / X i ) [1 E(Yi / X i )] = Pi (1 Pi ) = wi

Al hacer esto se obtiene la siguiente ecuacin

Yi X 2i X ki
= 1
+ 2 + ... + k + i ( 2.12 ).
wi wi wi wi wi

Las perturbaciones de la ecuacin transformada ( 2.12 ) son ahora


homoscedsticas con varianza constante e igual a 1 . Como E (Yi / X i ) no se
conoce, tampoco se conoce wi pero es posible utilizar el siguiente
procedimiento en dos etapas:

Etapa 1: Se efecta la regresin MCO de ( 2.5 ) sin tener en cuenta el problema de


la heteroscedasticidad obtenindose as el valor estimado de E (Yi / X i ) y el valor
estimado de wi .

Etapa2: Se utiliza el wi estimado para transformar la informacin y efectuar la


regresin sobre la ecuacin ( 2.12 ), obtenindose as los estimadores insesgados
y eficientes de los parmetros.

Observacin: Es posible que para algunos valores de i , las estimaciones de Yi


se encuentren fuera del intervalo [ 0,1] , el wi estimado en estos casos no ser
positivo, por lo que al no ser posible definir wi , stas sern observaciones que
se pierden para la etapa 2. Algo similar ocurre si para algunas observaciones, el

15
Pi estimado es cero o uno ya que en cualquiera de los casos wi = 0 y no podr
usarse para dividir las ecuaciones en la etapa 2. El eliminar las observaciones
donde se manifiesta esta situacin, ocasiona una prdida de grados de libertad,
por lo que los estimadores obtenidos podran no ser robustos. Este problema es
especialmente grave si el tamao de la muestra no es grande.

3) No cumplimiento de 0 E(Yi / X i ) 1

Luego de realizar la regresin, se va a dar la situacin en general de que para


determinados valores de i la E(Yi /Xi )=Xi ' puede estar fuera del intervalo [0,1] ,
lo cual es contradictorio con el hecho de que ella representa una probabilidad.
Esto constituye una parte fundamental de la limitacin del modelo de probabilidad
lineal. A este problema se le pueden dar soluciones alternativas:

1) Se eliminan estas observaciones (con la consecuente prdida de grados de


libertad).
2) Se sustituyen los valores menores o iguales que cero del Yi estimado por
0,001 y los valores mayores o iguales que uno por 0,999.

4) Valor cuestionable del R 2 como medida de bondad del ajuste

Por razones puramente geomtricas es de esperar que para un modelo de


probabilidad lineal el R 2 calculado convencionalmente sea muy inferior a 1 . En la
mayora de las aplicaciones se encuentra en un rango entre 0.2 y 0.6. Autores
como John Aldrich y Forrest Nelson sostienen que el coeficiente de determinacin
como estadstico resumen debe evitarse en los modelos con variable dependiente
cualitativa. En momentos posteriores de este trabajo se har referencia a otros
estadsticos ms adecuados a este tipo de modelos.

2.2.2. Limitaciones del MPL

Como se ha observado el MPL posee numerosos problemas a los que de alguna


manera se le pueden dar soluciones, dependiendo entre otras cosas del tamao y
la calidad de la muestra con la que contamos. No obstante existe un problema de
fondo mucho ms sutil que hace que el modelo de probabilidad lineal no sea el
ms adecuado a la hora de analizar los modelos de respuesta dicotmica.

La razn es, que al suponer que Pi aumenta linealmente con el vector X i ,


implcitamente se supone que el efecto marginal o incremental de las X
permanece constante todo el tiempo. Esto desde el punto de vista intuitivo y
econmico no resulta lgico. Se puede poner el sencillo ejemplo de que se est
analizando la probabilidad de que una familia sea propietaria de su vivienda en
funcin del nivel de renta anual de la misma. Si se utiliza el MPL para intentar

16
explicar esta relacin, el resultado obtenido considerar que un aumento unitario
de la renta tendr el mismo efecto marginal sobre la probabilidad de que la familia
sea propietaria, cualquiera sea el nivel de renta inicial de la misma. Este resultado
carece de sentido. Lo lgico es pensar que si el nivel de renta es muy bajo, un
aumento unitario de la renta no provocar un aumento significativo en la
probabilidad de que la familia sea propietaria. As mismo, un aumento unitario de
la renta cuando el nivel de renta es muy alto no debe provocar aumentos
significativos en la probabilidad de que la familia sea propietaria.

Mucho ms realista sera considerar que el grafo de la probabilidad de ser


propietario como funcin del nivel de renta debe ser en forma de S al igual que
una funcin de distribucin acumulativa (FDA). El anlisis anterior constituye el
basamento lgico y econmico de los dems modelos de respuesta dicotmica
que se analizarn, el Logit, el Probit y el modelo de Valor Extremo (VE).

No obstante sus limitaciones, el modelo de probabilidad lineal se utiliz


ampliamente en numerosas aplicaciones. Su ventaja consista en la sencillez del
modelo y de su estimacin. Dado que hoy da se dispone de programas
informticos para estimar todo tipo de modelos, el modelo de probabilidad lineal
(MPL) se usa cada vez menos, y se estima nicamente para poder comparar sus
resultados con los que se obtienen utilizando modelos ms apropiados.

2.3. Los modelos Logit, Probit y Valor Extremo

De acpites anteriores se conoce que en los procesos de eleccin binaria la


probabilidad de eleccin de una determinada alternativa, en sentido general,
puede ser plasmada a travs de la ecuacin:

P(Yi = 1) = P(U i1 > U i 2 ) = F( X i ' ) = F(Zi ) ( 2.4 ).

Se analiz en detalles el Modelo de Probabilidad Lineal (cuando F es la funcin


identidad F ( x) = x ) y sus limitaciones. Se estableci que desde el punto de vista
intuitivo y econmico es ms adecuado suponer que la funcin F sigue la forma
de una funcin de distribucin acumulativa (FDA) del ndice Z i , lo cual garantiza
que F ( Z i ) [0,1] y que el efecto sobre la probabilidad de un incremento marginal
en el ndice sea elevado sobre los valores medios de Z i y bajo sobre los valores
extremos.

Dependiendo de la funcin de distribucin acumulativa a la que se asocie el


proceso de decisin, el modelo especificado ser diferente. De acuerdo con este
criterio, los modelos que se han utilizado en la prctica dentro de un conjunto
posible de ellos, han sido los siguientes:

17
1) El modelo Logit:

'
e Zi e Xi
P(Yi = 1) = ( Z i ) = = ( X i
'
) = ' .
1 + e Zi 1 + e Xi

Donde la FDA utilizada es la funcin de distribucin logstica que se denota


mediante la letra .

2) El modelo Probit:

' '
Zi Zi s2 Xi Xi s2
1 1
P(Yi = 1) = (Zi ) = ( s )ds = e 2
ds = ( s )ds = e 2
ds .
2 2

Donde la FDA utilizada es la funcin de distribucin Normal estandarizada que se


denota con la letra (y mediante se denota a la funcin de densidad de la
Normal estandarizada).

3) El modelo Valor Extremo de tipo I o Valor Extremo:

-Zi Xi '
P(Yi = 1) = (Zi ) = e-e = ( X i ' ) = e e
.

Donde la funcin utilizada es una funcin de distribucin de tipo Gompit,


denotada mediante la letra .

Las razones que justifican el uso de dichas funciones en la construccin de estos


modelos son las siguientes:

1. Son funciones crecientes de la variable ndice Z i que van de ( ,+ )


en [0,1] .
2. Son funciones continuas que toman valores comprendidos entre cero
y uno.
3. Cuando Z i tiende a , Pi tiende a cero.
4. Cuando Z i tiende a + , Pi tiende a uno.
5. La relacin entre Pi y el ndice no es lineal, la pendiente vara en funcin
del valor de Z i .

18
2.3.1. Especificacin de los modelos

1) Modelo Logit

El modelo Logit relaciona la variable dicotmica Yi con las variables X 2i , ..., X ki


a travs de la ecuacin:

1
Yi = 1 + 2 X 2 i +.....+
+ i ( 2.13 ),
1+ e ( k X ki )

al igual que en el modelo de probabilidad lineal se supone que E ( i ) = 0 y dado


que la variable de respuesta es dicotmica se puede demostrar que

1
P(Yi = 1) = E(Yi / X i ) = 1 + 2 X 2 i +.....+
( 2.14 ).
1+ e ( k X ki )

2) Modelo Probit

El modelo Probit relaciona a la variable dicotmica Yi con las variables


explicativas X 2i ,...., X ki a travs de la siguiente ecuacin:

Zi s2
1
Yi = e 2
ds + i ( 2.15 ).
2

Ahora y como en los casos anteriores:

Zi s2
1
P(Yi = 1) = E(Yi /X i ) = e 2
ds ( 2.16 ).
2

3) Modelo Valor Extremo

El modelo Valor Extremo relaciona a la variable dicotmica Yi con las


variables explicativas X 2i ,...., X ki a travs de la siguiente ecuacin:

( 1+ 2 X 2 i +...+ k X ki )
Yi = e e
+ i ( 2.17 ).

Al igual que en los casos anteriores y dado el carcter dicotmico de la variable de


respuesta Yi y la suposicin de que E ( i ) = 0 se obtiene que:

19
( 1 + 2 X 2 i + ... + k X ki )
P(Yi = 1) = E(Yi / X i ) = e e
( 2.18 ).

2.3.2. El problema de la estimacin

Los modelos Logit, Probit y Valor Extremo son no lineales en los parmetros. El
mtodo de estimacin ms utilizado para los mismos es el mtodo de mxima
verosimilitud. Si se tiene una muestra de tamao I (i = 1...I ) y bajo la hiptesis de
que las observaciones Yi son independientes, entonces se obtiene la siguiente
relacin

I
P(Y1 , Y2 ,...., YI ) = P(Y1 )P(Y2 )....P(Yi )....P(YI ) = P(Yi ) ,
i =1

dado que Yi slo puede tomar como valores 1 0 con probabilidades Pi y 1 Pi


respectivamente, entonces

I I
I Yi (1 Yi )
L= P(Yi ) = Pi i=1 (1 Pi ) i=1 ( 2.19 ).
i =1

Luego, el logaritmo de la funcin de verosimilitud sera

I I
ln( L) = Yi ln Pi + (1 Yi ) ln(1 Pi ) ( 2.20 ).
i =1 i =1

Si en ( 2.20 ) se sustituye a Pi por su expresin en ( 2.14 ), ( 2.16 ), o ( 2.18 ), se


obtiene el logaritmo de la funcin de verosimilitud de los modelos Logit, Probit y
Valor Extremo respectivamente. Mediante algoritmos de optimizacin no lineales
es posible maximizar dicha funcin, estimando as los parmetros de estos
modelos. Actualmente muchos paquetes estadsticos, incluyendo Eviews,
presentan estas estimaciones dentro de sus facilidades.

Puede probarse que los estimadores obtenidos por el proceso de mxima


verosimilitud son consistentes y asintticamente eficientes. As mismo, son
asintticamente normales, por lo que el contraste de significatividad individual de
los parmetros se suele realizar a travs de una distribucin Normal si el tamao
de la muestra es grande.

20
2.4. Medidas de la bondad del ajuste en los modelos dicotmicos

Ya se coment que en los modelos donde la variable toma slo valores 1 y 0 el


R 2 no constituye una medida adecuada de la bondad del ajuste. Se utilizan
algunas medidas alternativas:

1) R 2 propuesto por Mc Fadden o ndice de cocientes de verosimilitudes


(ICV) que se define como

ln LSR
ICV = R 2 McFadden = 1 ( 2.21 ).
ln LCR

Donde ln LCR es el logaritmo de la funcin de verosimilitud del modelo con


restricciones que se obtiene de suponer que 2 = 0, 3 = 0, ...., K = 0.

Este estadstico toma valores entre cero y uno. Si todos los estimadores de las
pendientes son cero (modelo imperfecto), entonces el ICV toma el valor
cero porque las funciones de verosimilitud LCR y LSR seran iguales. En los
modelos habituales el ICV nunca llega a valer uno (lo cul sera indicio de un
ajuste perfecto ya que ello ocurre slo si LSR = 1 ), aunque es posible que
llegue a acercarse a esta cifra.

Fuera de estos valores no est tan clara la interpretacin del R 2 propuesto por Mc
Fadden. Algunos autores sealan que lo que mide ste, es el porcentaje de
incertidumbre en los datos explicado por el modelo.

2) Otro estadstico utilizado es el estadstico LR:

#L
LR = 2 ln !! CR = 2(ln LCR - ln LSR ) ( 2.22 )
" LSR

donde LCR es el valor de la funcin de verosimilitud que se obtiene al efectuar la


estimacin bajo la hiptesis nula H 0 : 2 = 3 = ..... = k = 0 y bajo dicha hiptesis
el estadstico LR se distribuye como una $ 2 con k 1 grados de libertad.

3) Proporcin de predicciones correctas calculadas a partir del


Pseudo R 2 de prediccin:

Despus de obtener la estimacin de Pi para cada i , si el Pi estimado es menor


que 0.5 , el pronstico que ofrece el modelo sobre la decisin del agente i es
que Yi = 0 , en cambio si el Pi estimado es mayor que 0.5 , el pronstico ser que

21
Yi = 1 . Luego, es posible contrastar dichos pronsticos con los verdaderos valores
de Yi con el objetivo de determinar que tan bien el modelo explica la realidad a
partir del clculo del coeficiente

nmero de aciertos
Pseudo R 2 de prediccin = ( 2.23 ).
total de predicciones

2.5. Interpretacin de los modelos de eleccin binaria

En primer lugar, la variable endgena estimada mediante cualquiera de los


^ ^ # ^
modelos estudiados Yi = Pi = F ! X i ' , es la cuantificacin de la probabilidad de
"
que el agente i elija la alternativa 1 .

La interpretacin de los parmetros para los distintos modelos analizados puede


efectuarse a travs de las correspondientes derivadas parciales. La derivada
parcial respecto a la variable X ki se interpreta como la variacin que se produce en
la probabilidad de que el individuo i elija la alternativa 1 ante un aumento unitario
en el valor de X ki , mantenindose el resto de los valores de las variables
explicativas fijas a partir de los niveles iniciales del vector X i . En el caso de ser la
variable X k una variable dicotmica, el resultado se interpreta como la diferencia
entre los valores de probabilidad de elegir la alternativa 1 cuando el individuo i
posee la caracterstica que mide X k con respecto a cuando no la posee, con el
resto de las variables explicativas mantenindose constantes a partir de sus
niveles iniciales en el vector X i .

2.5.1. Interpretacin del modelo de probabilidad lineal (MPL)

En el modelo de probabilidad lineal

= [1X 2i X 3i .... X ki ][ ]
'
P (Yi = 1) = F ( X i ' ) = X i '
1 2 3 ..... ki , por tanto

%F ( X i ' ) % ( X i ' )
= = k ( 2.24 ).
%X ki %X ki

Es decir, en el MPL los coeficientes k se interpretan como la variacin en la


probabilidad de que el individuo elija la alternativa 1 ante un incremento marginal
de la variable X ki .

22
2.5.2. Interpretacin del modelo Logit

Una vez estimado el modelo, la probabilidad es cuantificada a travs de


^ ^
'
Zi ^ Xi
^ ^ e e
P(Yi = 1) = Yi = ( Z i ) = ^ = (Xi '
)= ^ , por lo tanto la derivada parcial
1 + e Zi
'
1+ e Xi

respecto a X ki ser:

'
% (Xi ') e Xi
= k = &(Xi ' ) k ( 2.25 ),
%X ki
'
(1 + e X i ) 2

donde & ( X i ' ) es la funcin de densidad logstica evaluada en el ndice.

Ahora no ocurre como en el MPL, en el que k se interpretaba como la variacin


de la probabilidad ante el incremento marginal de X ki , ahora esta variacin es el
producto de la funcin de densidad & ( X i ' ) por k . En este caso la variacin de
la probabilidad no es constante, depende de los valores iniciales contenidos en el
vector X i . El signo de k s indica la direccin del cambio.

Con vistas a obtener una interpretacin de los coeficientes se acostumbra a hallar


la razn de las derivadas parciales del modelo respecto a dos variables diferentes,
dgase X ki y X ( k +1)i obtenindose:

% (Xi ')
%X ki &( Xi ' )
= k
= k
( 2.26 )
% ( Xi ' ) &( Xi ' ) k +1 k +1
%X ( k +1)i

Es decir, el cociente entre los coeficientes mide la importancia relativa de un


cambio unitario en los regresores X ki y X ( k +1)i sobre el cambio en la probabilidad
relativa del regresando.

2.5.3 Interpretacin del modelo Probit

Una vez estimado el modelo, la probabilidad estara cuantificada por:


^
'
Xi
^ ^
P(Yi = 1) = Yi = (Zi ) = ( s )ds .

23
La interpretacin de los parmetros se efecta a travs de las derivadas parciales,
si el modelo es derivable respecto a X ki entonces:

% (Xi ')
= (Xi ') k ( 2.27 ),
%X ki

donde ( X i ' ) es la funcin de densidad de la distribucin Normal estandarizada.

Aqu y al igual que en el caso del modelo Logit, el coeficiente k indica el sentido
del cambio en la probabilidad de elegir la opcin 1 ante un incremento marginal en
la variable X ki . No obstante, la magnitud del cambio depende, adems del valor
de k , del valor de la funcin de densidad evaluada en el ndice, o sea ( X i ' ) .

Tambin y al igual que en el modelo Logit se acostumbra a obtener la razn entre


las derivadas con el fin de medir la importancia relativa de un cambio unitario en
los regresores X ki y X ( k +1)i sobre el cambio en la probabilidad relativa del
regresando, en este caso, y como se demuestra en la siguiente ecuacin, este
tambin se mide por el cociente entre los coeficientes k y k +1 .

% (Xi ')
%X ki (Xi ')
= k
= k
( 2.28 ).
% (Xi ') (Xi ') k +1 k +1
%X ( k +1) i

2.5.4 Interpretacin del modelo Valor Extremo

Una vez estimado el modelo, la probabilidad estara cuantificada por:

-Zi Xi '
P(Yi = 1) = (Zi ) = e-e = ( X i ' ) = e e
.

La interpretacin de los parmetros se efecta a travs de las derivadas parciales,


si el modelo es derivable respecto a X ki entonces:

( 1+ 2 X 2 i +...+ X )
% ( X i ' ) % (e e k ki
)
= = '( X i ' ) k ( 2.29 )
%X ki %X ki

donde ' ( X i ' ) es la funcin de densidad de la funcin Valor Extremo.

24
Aqu y al igual que en los casos anteriores, el signo del coeficiente k indica el
sentido del cambio en la probabilidad de elegir la opcin 1 ante un incremento
marginal en la variable X ki y la magnitud del cambio depende, adems del valor
de k , del valor de la funcin de densidad evaluada en el ndice, o sea ' ( X i ' ) .

Tambin y al igual que en los modelos anteriores se acostumbra a obtener la


razn entre las derivadas con el fin de medir la importancia relativa de un cambio
unitario en los regresores X ki y X ( k +1)i sobre el cambio en la probabilidad relativa
del regresando, en este caso y como se demuestra en la siguiente ecuacin este
tambin se mide por el cociente entre los coeficientes k y k +1 .

% (Xi ')
%X ki '( X i ' )
= k
= k
( 2.30 ).
% ( X i ' ) '( X i ' ) k +1 k +1
%X ( k +1)i

2.6. Comparacin entre Logit, Probit y Valor Extremo

En general, los modelos Logit, Probit y Valor Extremo tienden a arrojar resultados
similares, las estimaciones de los parmetros no son directamente comparables,
hecho que se deduce implcitamente de los acpites anteriores. La metodologa
que se propone, para elegir entre los tres modelos, es realizar las tres
estimaciones en cada caso particular y luego comparar los resultados obtenidos
en base a la funcin de verosimilitud o los estadsticos de Akaike, Schwarz o
Hannan Quinn con vistas a determinar cul estimacin es ms apropiada para el
caso analizado.

2.7. Tests para problemas de especificacin en los modelos de


eleccin binaria

Los principales problemas de especificacin en los modelos de eleccin binaria


suelen ser la omisin de variables significativas y la heteroscedasticidad. Existen
tests que permiten detectarlos:

1) Omisin de variables:

Es posible efectuar un test de razn de verosimilitud para docimar hiptesis entre


el modelo restringido y el modelo sin restricciones.

2) Heteroscedasticidad:

El test que usalmente se utiliza para contrastar la presencia de


heteroscedasticidad es el propuesto por Davidson y Mc Kinnon en 1993. Plantea

25
la hiptesis nula de homoscedasticidad frente a heteroscedasticidad a travs del
siguiente patrn:
'
V( i ) = e 2( Si ( 2.31 )

donde:

u i es la variable aleatoria del modelo especificado.


( es un parmetro desconocido.
S i es el regresor o combinacin lineal de los regresores que se
sospecha, generan la heteroscedasticidad.

Para resolver el problema de la estimacin de la ecuacin ( 2.31 ), Davidson y Mc


Kinnon proponen la estimacin por mnimos cuadrados ordinarios de la siguiente
ecuacin auxiliar:

^ ^ ^ ^
' ' '
Yi Pi f (Xi ) ' f (Xi )( X i ) '
= Xi *
+ Si **
( 2.32 ).
^ ^ ^ ^
^ ^
Pi (1 Pi ) Pi (1 P i )
Pi (1 Pi )

Donde f (.) es la funcin de densidad de la funcin de distribucin utilizada


(uniforme, logit, probit o valor extremo). Observar que el miembro izquierdo est
formado por los residuos estandarizados. Davidson y Mc Kinnon sostienen que
bajo la hiptesis nula de homoscedasticidad, la suma explicada de cuadrados de
la regresin anterior se distribuye asintticamente como una $ 2 con un nmero de
grados de libertad igual al nmero de regresores utilizados en S i .

2.8. Un ejemplo sobre concesin de crditos bancarios

Un problema de decisin que se presenta con frecuencia para las agencias


bancarias es la concesin de crditos. La decisin de los bancos de conceder
crditos est en dependencia de diversos factores, entre los que se encuentran
aquellos que reflejan la capacidad de pago de los individuos. Con el fin de estudiar
este proceso mediante la aplicacin de la teora descrita en el captulo, se accede
a datos2 que proporcionan informacin referente a 1000 hogares que solicitaron
crditos en un mismo perodo de tiempo en diferentes bancos espaoles.

2
Los datos aparecen contenidos en el fichero Pract_3 anexo al libro Microeconometra y decisin
[ 4] de los autores Bernard Cabrer Borrs, Amparo Sancho Prez y Guadalupe Serrano Domingo.

26
La concesin o no del crdito por parte de los bancos es recogida a travs de la
variable dicotmica PRESTAM que toma el valor 1 si al hogar le fue concedido el
prstamo y 0 si no.

Las variables que se supone explican la decisin de los bancos son las siguientes:

RENTA: expresada en unidades monetarias, recoge los ingresos anuales de la


familia.

PARADO: variable dicotmica que recoge la situacin laboral del sustentador


principal de la familia, toma el valor 1 cuando el individuo est desempleado y 0
en caso contrario.

VIVPROP: variable dicotmica que toma el valor 1 si la familia es propietaria de la


vivienda y 0 si no lo es.

El objetivo es realizar un estudio sobre como los bancos toman la decisin de


conceder crditos, estimando para ello cul es la probabilidad de que las familias
reciban un prstamo bancario en funcin de las variables anteriores.

A priori es de suponer que la probabilidad de recibir prstamo aumente si aumenta


la renta y si la familia es propietaria de su vivienda y disminuya si el sustentador
principal esta en situacin de paro.

En principio se pueden efectuar las estimaciones correspondientes a cada uno de


los cuatro modelos analizados en este captulo, el MPL (ponderado), el Logit, el
Probit y el modelo de Valor Extremo.

2.8.1. Anlisis a travs del Modelo de probabilidad lineal

En el epgrafe (2.2.1) se hizo referencia a la forma de eliminar la


heteroscedasticidad del MPL a travs del procedimiento en dos etapas descrito
all. En este caso, primero se debe hacer la regresin por MCO de PRESTAM
sobre las variables explicativas sin tener en cuenta el problema de la
heteroscedasticidad, con el fin de estimar en cada caso Pi , y con ste, el factor
wi = Pi (1 Pi ) . Luego en una segunda etapa se divide cada miembro de las
ecuaciones PRESTAM i = 1 + 2 RENTAi + 3 PARADOi + 4VIVPROPi + i por el
trmino wi correspondiente que se ha estimado de la primera etapa,
efectundose posteriormente la estimacin del modelo expresado a travs de la
ecuacin

PRESTAM i RENTAi PARADOi VIVPROPi ( 2.33 ),


= 1
+ 2 + 3 + 4 + i
wi wi wi wi wi wi

27
el cual, como se sabe, es homoscedstico. Adems, es importante observar que la
regresin por MCO del modelo dado por ( 2.33 ) es una regresin a travs del
origen.

En este proceso hay una prdida de 234 observaciones de una etapa a otra,
correspondientes a hogares que en la primera regresin su probabilidad estimada
de recibir prstamos se encontraba fuera del rango de 0 a 1 . La salida en el
programa Eviews 3.1 a la estimacin por mnimos cuadrados del modelo ( 2.33 ) es
la siguiente:

Tabla 1
Dependent Variable: PRESTAM/WS
Method: Least Squares
Date: 11/20/05 Time: 14:10
Sample: 1 1000
Included observations: 766
Excluded observations: 234
Variable Coefficient Std. Error t-Statistic Prob.
1/WS -0.036714 0.022902 -1.603079 0.1093
RENTA/WS 0.014851 0.001895 7.837509 0.0000
PARADO/WS -0.059668 0.016204 -3.682241 0.0002
VIVPROP/WS 0.024771 0.012842 1.928879 0.0541
R-squared 0.046296 Mean dependent var 0.301720
Adjusted R-squared 0.042541 S.D. dependent var 0.960961
S.E. of regression 0.940298 Akaike info criterion 2.719969
Sum squared resid 673.7307 Schwarz criterion 2.744205
Log likelihood -1037.748 Durbin-Watson stat 2.103730
Fuente: Elaboracin propia.
(La serie WS es la serie de los trminos wi ).

En principio se puede constatar que las expectativas a priori con respecto a los
signos de los coeficientes fueron satisfechas. En la estimacin obtenida
^ ^ ^ ^

1 = -0.036714 , 2 = 0.014851 , 3 =-0.059668 y 4 = 0.024771 . Por lo que la expresin


de la ecuacin de ajuste es:

^
PRESTAM i = -0.036714 + 0.014851*RENTAi + -0.059668* PARADOi + 0.024771*VIVPROPi

Si se desea hacer inferencia sobre la significatividad de las variables explicativas,


o sobre la bondad del modelo, se debe actuar con cautela. La no normalidad de
las perturbaciones es un hecho verificable a partir del estadstico de Bera-Jarque,
que bajo la hiptesis nula de normalidad distribuye $ 2 con dos grados de libertad.
En este caso B J = 17916, 38 (ver Anexo 2), comparando el valor obtenido con el
valor crtico para = 0.05 de la distribucin $ 2 (2) que es 5.99 se obtiene que no
se satisface que B J < $ 2 0.05 ( 2) . Dado que no se cumple la desigualdad se
rechaza la hiptesis nula de normalidad y se acepta la hiptesis alterna de no

28
normalidad de las perturbaciones. El resultado es consistente con los
planteamientos tericos expuestos.

Dado que para muestras grandes es posible efectuar las pruebas de inferencia
habituales, (resultado mencionado previamente en el epgrafe ( 2.2.1 )), como se
trabaj con una muestra de 766 observaciones, en este caso es posible contrastar
la significatividad de los coeficientes individuales a partir del estadstico t .

Bajo la hiptesis nula i = 0 , el estadstico


se distribuye segn una
i

# ^
se ! i
"
t-Student con n k grados de libertad. En este caso 766 4 = 762 , grados de
libertad. El valor crtico t / 2 (762) para = 0.05 es aproximadamente 1,96 , por tanto
# ^
!
se debe verificar si se cumple que ! t /2 < i
<t /2 , o lo que es lo mismo
se !#
^
!
! i
" "
# ^
!
! 1, 96 < i
< 1,96 .
! # ^

! se ! i
" "

Para 2 :

2
= 7.837509 ) (-1,96 ; 1,96) , por lo que se rechaza la hiptesis nula 2 =0.
# ^
se ! 2
"
Para 3 :

3
= -3.682241 ) (-1,96 ; 1,96) , por lo que se rechaza la hiptesis nula 3 = 0.
# ^
se ! 3
"

Para 4 :

= 1.928879 (-1,96 ; 1,96) , por lo que se acepta la hiptesis nula 4 = 0 .


4

# ^
se ! 4
"
En resumen, mediante el anlisis anterior se percibe que las variables RENTA y
PARADO explican el regresando y la variable VIVPROP no explica el regresando.

29
(A estas conclusiones se poda arribar a partir de la comparacin de los p valores
de la Tabla1 con el nivel de prefijado).

La bondad del ajuste de la estimacin obtenida se puede analizar a travs de las


diferentes medidas establecidas para modelos dicotmicos que fueron
presentadas en el epgrafe ( 2.4 ).

1) A partir del R 2 propuesto por Mc Fadden:

ln LSR
ICV = R 2 McFadden = 1 .
ln LCR

Donde en este caso ln LCR es el logaritmo de la funcin de verosimilitud del


modelo con restricciones que se obtiene de suponer 2 = 0, 3 = 0, 4 = 0 . El valor
ln LSR = -1037.748 , se observa en la Tabla 1 y el valor ln LCR = -1080.396 es el valor
de la funcin de verosimilitud estimada que se observa en la tabla de resultados
PRESTAM i 1 1
de Eviews si se realiza la regresin de slo sobre = (ver
wi wi ws
Anexo 3). Finalmente, en el caso analizado

ln LSR -1037.748
ICV = R 2 McFadden = 1 =1 = 0.04 .
ln LCR -1080.396

El resultado es muy bajo, prximo a cero, lo que indica que el modelo es


imperfecto.

2) A partir del estadstico LR:

#L
LR = 2 ln !! CR = 2(ln LCR - ln LSR ) .
" LSR
Como ya se haba visto, ln LSR = -1037.748 y ln LCR = -1080.396 por tanto

LR = 2(ln LCR - ln LSR ) = 2 ( -1080.396 - ( -1037.748) ) = 85.296 .

Bajo la hiptesis nula H 0 : 2 = 3 = 4 = 0 , el estadstico LR se distribuye como


una $ con 3 grados de libertad. El valor crtico para = 0.05 de la distribucin
2

$ 2 (3) es 7.81473 , evidentemente LR > $ 0.05


2
(3) con lo que se rechaza la hiptesis
nula. Ello indica que el modelo estimado es muy significativo.

30
3) Proporcin de predicciones correctas calculadas a partir del
Pseudo R 2 de prediccin:

En el caso en estudio se obtiene que para el modelo ponderado

678
Pseudo R 2 de prediccin = = 0.885 ,
766

lo cual indica que el pronstico que ofrece el modelo de probabilidad lineal


ponderado fue correcto en un 88,5% de los casos. Es decir, el modelo tuvo un alto
poder predictivo. Es de sealar que el resultado de 678 predicciones correctas se
obtiene luego de un leve trabajo de programacin (ver Anexo 4), ya que el paquete
estadstico Eviews 3.1 no posee ninguna opcin inmediata que permita obtener
ese resultado.

Adems, otros estadsticos que sirven para comparar este modelo con los
restantes a analizar, son: la funcin de verosimilitud estimada (Log Likelihood), el
estadstico de Akaike (AIC) y el estadstico propuesto por Schwarz (Ver anexo 1).
Los resultados de dichos estadsticos para este caso aparecen en la siguiente
tabla:

Tabla 2

Log likelihood Akaike info Schwarz criterion


criterion
-1037.748 2.719969 2.744205

Fuente: Elaboracin propia.

2.8.2. Estimaciones Logit, Probit y Valor Extremo

En este epgrafe, se obtienen las estimaciones correspondientes a los modelos


Logit, Probit y Valor Extremo para el caso en estudio y en el siguiente se
procede a comparar los resultados obtenidos, con vistas a elegir cul de las
estimaciones es la ms apropiada.

Estimacin Probit:

El modelo Probit en el ejemplo en estudio tiene la siguiente especificacin:

Zi s2
1
PRESTAM i = e 2
ds + i = ( 1 + 2 RENTAi + 3 PARADOi + VIVPROPi ) + i
4
2
( 2.34 ).

31
Los resultados obtenidos de la estimacin por mxima verosimilitud del modelo
anterior mediante el programa Eviews 3.1 son los siguientes:

Tabla 3
Dependent Variable: PRESTAM
Method: ML - Binary Probit
Date: 11/21/05 Time: 14:38
Sample: 1 1000
Included observations: 1000
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -2.236327 0.227841 -9.815287 0.0000
RENTA 0.077441 0.009810 7.894422 0.0000
PARADO -0.454440 0.134781 -3.371684 0.0007
VIVPROP 0.263338 0.207497 1.269117 0.2044
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.253917 Akaike info criterion 0.470024
Sum squared resid 64.21618 Schwarz criterion 0.489655
Log likelihood -231.0119 Hannan-Quinn criter. 0.477485
Restr. log likelihood -293.1843 Avg. log likelihood -0.231012
LR statistic (3 df) 124.3447 McFadden R-squared 0.212059
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.

En principio se puede observar que los signos de los parmetros estimados


satisfacen las expectativas a priori. En la estimacin obtenida
^ ^ ^ ^

1 = -2.236327 , 2 = 0.077441 , 3 =-0.454440 y 4 = 0.263338 . (Observar que la

variable VIVPROP no tiene un coeficiente estadsticamente diferente de cero).

La expresin de la ecuacin de ajuste es:

^
PRESTAM i = ( -2.236327 + 0.077441* RENTAi + -0.454440*PARADOi + 0.263338*VIVPROPi )
Estimacin Logit:

El modelo Logit en este caso sigue la siguiente especificacin:

1
PRESTAM i = 1+ 2 RENTAi + 3 PARADOi + 4VIVPROPi )
+ i ( 2.35 ).
1+ e (

Los resultados de la estimacin por mxima verosimilitud del modelo dado por
( 2.35 ) mediante el programa Eviews 3.1 son los siguientes:

32
Tabla 4
Dependent Variable: PRESTAM
Method: ML - Binary Logit
Date: 11/21/05 Time: 15:33
Sample: 1 1000
Included observations: 1000
Convergence achieved after 7 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -4.214824 0.516033 -8.167736 0.0000
RENTA 0.142950 0.018250 7.832665 0.0000
PARADO -0.969263 0.270492 -3.583334 0.0003
VIVPROP 0.719559 0.488548 1.472853 0.1408
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.253246 Akaike info criterion 0.468089
Sum squared resid 63.87690 Schwarz criterion 0.487720
Log likelihood -230.0446 Hannan-Quinn criter. 0.475550
Restr. log likelihood -293.1843 Avg. log likelihood -0.230045
LR statistic (3 df) 126.2794 McFadden R-squared 0.215358
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.

En principio se observa que los signos de los parmetros estimados satisfacen las
^ ^
expectativas a priori. En la estimacin obtenida 1 = -4.214824 , 2 = 0.142950 ,
^ ^

3 =-0.969263 y 4 = 0.719559 .

La expresin de la ecuacin de ajuste es:

^ 1
PRESTAM i = (-4.214824 + 0.142950*RENTAi + -0.969263*PARADOi + 0.719559*VIVPROPi )
1+ e

Estimacin mediante el modelo de Valor Extremo

El modelo Valor Extremo sigue la siguiente especificacin:


( 1+ 2 RENTAi + 3PARADOi + 4VIVPROP )
PRESTAM i = e e
+ i ( 2.36 ).

Los resultados de la estimacin por mxima verosimilitud del modelo anterior


mediante el programa Eviews 3.1 son los siguientes:

33
Tabla 5
Dependent Variable: PRESTAM
Method: ML - Binary Extreme Value
Date: 11/21/05 Time: 15:46
Sample: 1 1000
Included observations: 1000
Convergence achieved after 5 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -1.524288 0.158327 -9.627459 0.0000
RENTA 0.063026 0.008406 7.497409 0.0000
PARADO -0.309932 0.101934 -3.040517 0.0024
VIVPROP 0.136117 0.134893 1.009076 0.3129
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.254942 Akaike info criterion 0.473116
Sum squared resid 64.73560 Schwarz criterion 0.492747
Log likelihood -232.5579 Hannan-Quinn criter. 0.480577
Restr. Log likelihood -293.1843 Avg. log likelihood -0.232558
LR statistic (3 df) 121.2528 McFadden R-squared 0.206786
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.

Los signos de los parmetros estimados satisfacen las expectativas a priori. En la


^ ^ ^ ^
estimacin obtenida 1 = -1.524288 , 2 = 0.063026 , 3 =-0.309932 y 4 = 0.136117 .
(Observar que la variable VIVPROP no tiene un coeficiente estadsticamente
diferente de cero). La expresin de la ecuacin de ajuste es:

^ (-1.524288+0.063026*RENTAi +-0.309932*PARADOi +0.136117*VIVPROP )


PRESTAM i = e e
.

2.8.3 Comparacin entre modelos

Para elegir cul especificacin es ms apropiada para el caso analizado se


pueden comparar los resultados de las estimaciones correspondientes en base a
la funcin de verosimilitud y los estadsticos de Akaike, Schwarz y Hannan Quinn.
La siguiente tabla permite apreciar ms claramente la situacin.

Tabla 6
Modelo Log likelihood Akaike info Schwarz Hannan-
criterion criterion Quinn criter.
Probit -231.0119 0.470024 0.489655 0.477485
Logit -230.0446 0.468089 0.487720 0.475550
Valor -232.5579 0.473116 0.492747 0.480577
Extremo
Fuente: Elaboracin propia.

34
Evidentemente, los resultados de las tres estimaciones son muy similares, pero
en el caso del modelo Logit la funcin de verosimilitud estimada es ligeramente
superior y los estadsticos de Akaike, Schwarz y Hannan Quinn son ligeramente
menores, as que el modelo Logit es el ms apropiado para el caso en estudio.

Otro elemento que confirma la afirmacin anterior es la comparacin de las


diferentes medidas de la bondad del ajuste entre los tres modelos.

Tabla 7
Modelo R 2 Mc Fadden LR statistic (3 df) Pseudo R 2 de
prediccin.

Probit 0.212059 124.3447 908


= 0.908
1000
Logit 0.215358 126.2794 915
= 0.915
1000
Valor Extremo 0.206786 121.2528 909
= 0.909
1000
Fuente: Elaboracin propia.

Se puede observar el alto poder predictivo de los tres modelos, en especial del
modelo Logit, que en el 91.5% de los casos proporciona un pronstico acertado
(ver el Pseudo R 2 de prediccin). Adems, los estadsticos LR obtenidos en cada
una de las tres estimaciones satisfacen la desigualdad LR > $ 0.05
2
(3) = 7.81473 lo
cual lleva a rechazar la hiptesis nula H 0 : 2 = 3 = 4 = 0 , indicando que los
modelos estimados son significativos.

Cuando se analizan las medidas de bondad del ajuste de las tres estimaciones
realizadas a travs de los modelos Probit, Logit y Valor extremo con las del MPL,
salta a las claras la desventaja de este ltimo.

Modelo R 2 Mc Fadden LR statistic (3 df) Pseudo R 2 de


prediccin.

Probit 0.212059 124.3447 908


= 0.908
1000
Logit 0.215358 126.2794 915
= 0.915
1000
Valor Extremo 0.206786 121.2528 909
= 0.909
1000
MPL ponderado 0.04 85.296 678
= 0.885
766

35
Se haba comentado tambin que las estimaciones de los parmetros i
obtenidas en los modelos MPL, Logit, Probit y Valor extremo no son directamente
comparables, ya que poseen diferente interpretacin. En el caso del MPL el
coeficiente K mide el incremento en la probabilidad ante un incremento marginal
de la variable X k . Sin embargo en los modelos Logit, Probit y Valor Extremo, el
incremento en la probabilidad depende tambin de la funcin de densidad
correspondiente, evaluada en el valor inicial del ndice. Ms especficamente, en
%P( X i ' )
cada caso = f ( X i ' ) k , donde f es la funcin de densidad logstica,
%X ki
Normal estandarizada o de valor extremo respectivamente. Con vistas a efectuar
comparaciones entre los parmetros obtenidos, cuando las muestras son grandes,
suele analizarse el efecto que un incremento marginal de la variable explicativa
correspondiente al parmetro, provoca sobre la probabilidad de eleccin del
individuo medio (el individuo medio se considera aquel cuyos valores de cada una
de sus variables explicativas son la media de dicha variable explicativa en la
muestra analizada).

2.8.4. Problemas de especificacin en el modelo elegido

1) Significatividad de las variables.

Se puede contrastar la significatividad de los coeficientes individuales estimados


en el modelo Logit, a partir de la distribucin Normal. Como se sabe del epgrafe
( 2.3 ), los estimadores obtenidos por el proceso de mxima verosimilitud son
consistentes y asintticamente eficientes. As mismo, son asintticamente
normales por lo que el contraste de significatividad individual de los parmetros se
puede realizar a travs de una distribucin Normal si el tamao de la muestra es
grande, como es el caso analizado.
^

Bajo la hiptesis nula i = 0 el estadstico


se distribuye segn una
i

# ^
se ! i
"
Distribucin Normal (0,1). El valor crtico N / 2 para = 0.05 es aproximadamente
1,96 , por tanto en cada caso se debe verificar si se cumple que
# ^
# ^
! !
! N /2 < i
<N /2 , o lo que es lo mismo ! 1,96 < i
< 1,96 .
se #!
!
^
! # ^

! i ! se ! i
" " " "

Para 2 :

36
^

2
= 7.832665 ) (-1,96 ; 1, 96) , por lo que se rechaza la hiptesis nula 2 =0.
# ^
se ! 2
"
Para 3 :

3
= -3.583334 ) (-1,96 ; 1, 96) , por lo que se rechaza la hiptesis nula 3 = 0.
# ^
se ! 3
"

Para 4 :
^

4
= 1.472853 (-1,96 ; 1,96) , por lo que se acepta la hiptesis nula 4 = 0 .
# ^
se ! 4
"
En resumen mediante el anlisis anterior y al igual que ocurri en el MPL
ponderado, se percibe que en el modelo Logit las variables RENTA y PARADO
explican el regresando y la variable VIVPROP no explica el regresando (al mismo
resultado se arriba en el resto de los modelos).

Dado que de los anlisis anteriores se deduce la no significatividad de la variable


VIVPROP, en aras de la parsimonia, se puede efectuar la regresin logstica sin
considerar esta variable en el modelo. La regresin logstica de PRESTAM slo
sobre las variables RENTA y PARADO arroja los siguientes resultados:

Tabla 8 .
Dependent Variable: PRESTAM
Method: ML - Binary Logit
Date: 11/23/05 Time: 16:58
Sample: 1 1000
Included observations: 1000
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C -3.661018 0.320030 -11.43961 0.0000
RENTA 0.150178 0.017821 8.426907 0.0000
PARADO -0.995537 0.269990 -3.687314 0.0002
Mean dependent var 0.086000 S.D. dependent var 0.280504
S.E. of regression 0.253893 Akaike info criterion 0.468632
Sum squared resid 64.26825 Schwarz criterion 0.483355
Log likelihood -231.3159 Hannan-Quinn criter. 0.474228
Restr. log likelihood -293.1843 Avg. log likelihood -0.231316
LR statistic (2 df) 123.7367 McFadden R-squared 0.211022
Probability(LR stat) 0.000000
Obs with Dep=0 914 Total obs 1000
Obs with Dep=1 86
Fuente: Elaboracin propia.

37
^ ^ ^
En la estimacin obtenida 1 = -3.661018 , 2 = 0.150178 y 3 =-0.995537 .

La expresin de la ecuacin de ajuste es:

^ 1
PRESTAM i = (-3.661018 + 0.150178*RENTAi + -0.995537*PARADOi )
.
1+ e

2) Heteroscedasticidad.

Si se efecta la estimacin a travs de un modelo Logit, Probit o Valor extremo,


tanto el test de White como otros similares no son viables debido a que sus
supuestos no son satisfechos por la modelacin elegida. En su lugar se utiliza el
test propuesto por Davidson y Mc Kinnon. Pero para ello se debe tener la
sospecha de cul o cuales son, entre las variables explicativas las generan
heteroscedasticidad. Al realizar la regresin logstica de PRESTAM sobre las
variables RENTA y PARADO se puede obtener el siguiente diagrama de la
variable RENTA vs. el valor absoluto de los residuos de la regresin:

Grfico 1
1.0

0.8
ABS(RESID)

0.6

0.4

0.2

0.0
0 10 20 30 40

RENTA

Fuente: Elaboracin propia.

Este parece sugerir que a medida que la renta aumenta, la varianza de los
residuos tambin. Se puede intentar realizar el test de Davidson y Mc Kinnon bajo
la sospecha de que la variable renta causa la heteroscedasticidad.

Para realizar este test, es necesario efectuar la regresin por mnimos cuadrados
ordinarios de la siguiente ecuacin auxiliar:

38
^ ^ ^ ^
' ' '
Yi Pi f (Xi ) f (Xi ) f (Xi )
= *
1 + *
2 ( RENTA)i + *
3 ( PARADO)i +
^ ^ ^ ^ ^ ^
^ ^
Pi (1 Pi ) Pi (1 Pi ) Pi (1 Pi )
Pi (1 Pi )
^ ^
' '
f (Xi )( X i )
+ **
( RENTA)i
^ ^
Pi (1 Pi )
( 2.37 ).
^
Donde el trmino X i ' se refiere al ndice estimado de la regresin logstica, es
decir, el producto vectorial del vector de variables explicativas del individuo por el
^
vector de coeficientes estimados mediante la regresin, f ( X i ' ) se refiere a la
funcin de densidad logstica evaluada en dicho ndice y Yi se est empleando en
lugar de PRESTAM i . La suma explicada de cuadrados de la regresin anterior
bajo la hiptesis nula de homoscedasticidad, se distribuye asintticamente como
una $ 2 con un grado de libertad (en este caso uno, ya que es el nmero de
variables que se supone generan la heteroscedasticidad). Los resultados de la
regresin por mnimos cuadrados del modelo dado por ( 2.37 ) son los siguientes:

Tabla 9
Dependent Variable: ESTANDARES
Method: Least Squares
Date: 12/09/05 Time: 19:09
Sample: 1 1000
Included observations: 1000
Variable Coefficient Std. Error t-Statistic Prob.
FAC -0.158228 0.466842 -0.338934 0.7347
FAC*RENTA 0.004155 0.020103 0.206691 0.8363
FAC*PARADO -0.078180 0.320043 -0.244280 0.8071
FAC*INDEXLOGI*RE -0.007014 0.014880 -0.471376 0.6375
NTA
R-squared 0.000222 Mean dependent var 0.001136
Adjusted R-squared -0.002790 S.D. dependent var 1.012385
S.E. of regression 1.013796 Akaike info criterion 2.869272
Sum squared resid 1023.671 Schwarz criterion 2.888903
Log likelihood -1430.636 Durbin-Watson stat 2.032836
Fuente: Elaboracin propia.

39
^
Yi Pi
Donde el trmino ESTANDARES se refiere a , el trmino FAC se
^ ^
Pi (1 Pi )
^
'
f (Xi )
refiere a y el trmino FAC*INDEXLOGI*RENTA se refiere a
^ ^
Pi (1 Pi )
^ ^
' '
f (Xi )( X i )
( RENTA)i .
^ ^
Pi (1 P i )

Luego de realizar la estimacin es posible calcular la suma explicada de


cuadrados ( SEC ) de la regresin anterior. El resultado es SEC=0.234897333182 .
El valor crtico para = 0.05 de la distribucin $ 2 (1) es 3.84146 , evidentemente
SEC < $ 0.05
2
(1) con lo que se acepta la hiptesis nula de que el modelo es
homoscedstico con respecto a la variable RENTA.

El proceso de realizacin de test de heteroscedasticidad de Davidson y Mc Kinnon


implica algn trabajo de programacin ya que el paquete Eviews 3.1 no lo realiza
de forma automtica. En el Anexo 5 se detalla el trabajo realizado para la
obtencin de los resultados expuestos.

El test de heteroscedasticidad de Davidson y Mc Kinnon slo permite determinar la


presencia de heteroscedasticidad, pero no establece su causa y con ello, no
permite establecer un remedio para la misma.

40
Captulo 3

3. Modelos de respuesta mltiple

3.1. Clasificacin de los modelos de respuesta mltiple

En los modelos de respuesta mltiple se generaliza el proceso de eleccin de


forma tal que el agente econmico se enfrenta a varias alternativas posibles. Estas
alternativas pueden presentarse de forma ordenada, secuencial o no ordenada,
dando lugar a diferentes tipos de modelaciones. Surgen as los modelos de
respuesta ordenada, modelos ordenados jerarquizados, modelos de
respuesta secuencial y modelos de respuesta no ordenada respectivamente.

En la vida real se dan diferentes situaciones en las que el agente econmico se


enfrenta a procesos de decisin mltiple y que sirven para ilustrar los modelos
mencionados:

Modelo de respuesta ordenada: Surge cuando las decisiones de los individuos


pueden ordenarse. Ejemplo de ello pueden ser el elegir el nmero de televisores a
tener en el hogar 0,1,2,... , o calificar de malo, regular, bueno o excelente el
desempeo de cierta institucin.

Modelo ordenado jerarquizado: Este tipo de modelo nace cuando las decisiones
del individuo se pueden jerarquizar. En l, se plantea la necesidad de estar en
posesin o de cumplir una determinada condicin para aspirar a otra superior. Un
ejemplo puede ser el de los modelos que explican el nivel de instruccin de los
trabajadores, educacin primaria, secundaria o superior en funcin de un conjunto
de caractersticas socioeconmicas del individuo y su familia.

Modelo condicional o secuencial: Es el caso en el que el agente econmico se


plantea dos o ms decisiones de forma secuencial. Es decir no ocurre 2 si no
ocurre primero 1 . Ejemplo de ello puede ser cuando el individuo se plantea
efectuar un viaje ya sea por va terrestre o por va martima, una vez que elige la
opcin 1 , est en condicin de optar por las diferentes alternativas, coche propio,
tren, autobs, etc.

Modelo multinomial no ordenado: Es el modelo en el cul el proceso de


eleccin no implica ninguna ordenacin. Un ejemplo puede ser cuando el individuo
debe elegir entre diferentes marcas posibles de un mismo bien.

41
3.2. Interpretacin econmica del proceso de eleccin mltiple
En sentido general el enfoque terico de estos modelos se fundamenta en la
teora de la utilidad del agente econmico. Si se supone que el individuo decide
entre M posibles alternativas la variable dependiente suele construirse
asignndole el valor 0 si el individuo elige la primera alternativa, 1 si elige la
segunda, y as sucesivamente hasta el nmero de categoras o alternativas menos
uno. Los trminos en los que se plantea la situacin son los siguientes:

Se establece que U i 0 , U i1 , ....., U i ( M 1) , representan las utilidades de las M


alternativas para el individuo i simo , las variables X i*0 , X i*1 , ..., X im
*
,..., X *i ( M 1) son
el conjunto de las caractersticas propias de la eleccin, tal como las percibe el
individuo i y el vector X i** es el conjunto de caractersticas personales del
individuo. Se supone adems, linealidad de las funciones de utilidad con respecto
a los vectores de caractersticas, de tal forma que la especificacin del modelo
queda:

+ X i*0, ' + X i**( 0 +


'
Ui0 = U i0 + i0 = 0 i0

U i1 = U i1 + i1 = 1 + X , + X ( + i1
*
i1
' ** '
i 1

... ( 3.1 )
, ' + X i**( m + im
'
U im = U im + im = m + X im *

...
U i ( M 1) = U i ( M 1) + i ( M 1) = ( M 1) + X i*( M 1), ' + X i** (( ( M 1) )' + i ( M 1)

El individuo se decide por una determinada opcin si la utilidad que le proporciona


dicha alternativa es mayor que la utilidad que le proporciona el resto de las
alternativas. O sea:

0 si U i 0 > U im /m . 0
-1 si U > U
- i1 im /m . 1
Yi = ( 3.2 )
- ...
-( M 1) si U i ( M 1) > U im /m . ( M 1)

3.3 Modelo de Respuesta Mltiple Ordenado, enfoque de la


variable latente

Por la relativa sencillez de su modelacin y por sus numerosas aplicaciones, este


captulo se va a limitar a los modelos de respuesta ordenada. En este tipo de
modelos suele utilizarse un enfoque alternativo para plantear el problema de la

42
eleccin, que es el enfoque de la variable latente. En l, se supone la existencia
de una variable no observable o latente Yi * no limitada en su rango de variacin,
que depende del vector de caractersticas propias de las decisiones X i* y de las
caractersticas X i** del individuo i . Sobre esta variable latente se aplica una regla
de observabilidad que genera las alternativas que se observan en la realidad. De
esta forma, los valores de la variable real Yi se fundamentan de acuerdo al
siguiente esquema:

0 si Yi*
c1
-
-1 si c1 < Yi c2
*

Yi = ( 3.3 )
- ...
-( M 1) si Y * > c
i (M 1)

donde c1 , c 2 ,..., c ( M 1) son los valores umbrales o barreras (a estimar).

La ecuacin de partida es:

Yi* = X i '
+ i ( 3.4 ).

Donde

Yi* : es la variable latente no observada.


Zi = X i '
: es el ndice del modelo.
i : es una perturbacin aleatoria sobre la cual se supone una distribucin
F (.) que puede ser Logstica, Normal o de Valor Extremo.

No resulta difcil determinar que ahora las probabilidades de eleccin del individuo
vendrn dadas por:

P (Yi = 0 / X i , , c) = F (c1 Xi ')


P (Yi = 1/ X i , , c) = F (c2 X i ' ) F (c1 Xi ')
P (Yi = 2 / X i , , c) = F (c3 X i ' ) F (c2 X i ' ) ( 3.5 ).
...
P (Yi = ( M 1) / X i , , c ) = 1 F (c( M 1) X i ' )

Los valores umbrales o barreras c m son nuevos parmetros que se incluyen en el


modelo y se estimarn conjuntamente con las , mediante el mtodo de mxima
verosimilitud teniendo en cuenta la restriccin c1 < c 2 < c 3 < ... < c ( M 1) para que
todas las probabilidades sean positivas.

43
3.3.1. Estimacin Mximo -Verosmil del Modelo de Respuesta
Mltiple Ordenado

La funcin de probabilidad conjunta del modelo de respuesta mltiple ordenado,


parte del supuesto de que se dispone de una muestra de tamao I (i = 1,2,...I ) y
bajo la hiptesis de independencia entre los distintos individuos

I
P (Y1Y2 ...Yi ...YI ) = P (Yi ) = P (Yi = 0) P (Yi = 1) ... P (Yi = M 1) ,
i =1 i {i / Yi = 0} i {i / Yi =1} i {i / Yi = ( M 1)}

de lo cual se obtiene que la funcin de verosimilitud L es

I
L= P (Yi ) = P (Yi = 0) P (Yi = 1) ... P (Yi = M 1) ( 3.6 ).
i =1 i {i / Yi = 0} i {i / Yi =1} i {i / Yi = ( M 1)}

Mientras que el logaritmo de la funcin de verosimilitud es:

ln L = ln( P(Yi = 0)) + ln( P(Yi = 1)) + ... + ln( P(Yi = M 1))
i {i / Yi =0} i {i / Yi =1} i {i / Yi = ( M 1)}

( 3.7 ).

Sustituyendo ahora las diferentes probabilidades P(Yi = ...) por sus respectivas
expresiones segn ( 3.5 ) y determinando para la funcin F (.) su especificacin
(distribucin logstica, normal o de valor extremo), es posible, aplicando algoritmos
de optimizacin, estimar los parmetros del modelo, en cualquiera de los casos.
Los estimadores obtenidos por el proceso de mxima verosimilitud son
consistentes y asintticamente eficientes. Igualmente son asintticamente
normales, con lo que cuando el tamao de la muestra es grande, el contraste de
significatividad de los parmetros puede efectuarse a travs de una distribucin
Normal. En este caso, todos los tests propuestos para estudiar la bondad del
ajuste en los modelos de respuesta dicotmica, pueden ser utilizados para los
modelos ordenados.

3.3.2. Interpretacin del modelo ordenado

La interpretacin de los parmetros puede efectuarse a travs de las


correspondientes derivadas parciales, as, en el caso del modelo ordenado
descrito a travs del sistema ( 3.5 ), el efecto marginal del regresor para cada
categora es:

44
%P(Yi = 0)
= f (c1 Xi ') k
%X ki
%P(Yi = 1)
= f (c2 X i ' ) + f (c1 Xi ') k
%X ki
%P(Yi = 2)
= f (c3 X i ' ) + f (c2 Xi ') k ( 3.8 )
%X ki
...
%P(Yi = ( M 1))
= f (c( M 1) Xi ') k
%X ki

donde f (.) es la funcin de densidad de la funcin de distribucin F (.) que se


elija. Se puede observar, que la magnitud de la variacin en la probabilidad de
cada una de las categoras depende del nivel inicial de esta y por tanto de los
valores iniciales de todos los coeficientes y regresores contenidos en el ndice. El
%P(Yi = 0)
signo de k es contrario al signo de e idntico al signo de
%X k
%P(Yi = ( M 1))
. Pero no se puede determinar lo que sucede con el sentido de la
%X k
variacin en las probabilidades de las categoras intermedias, depende de las dos
densidades. La conclusin final es que se debe andar con cuidado a la hora de
interpretar los coeficientes de este modelo, es el ms ambiguo de los
considerados hasta ahora. Sin un buen nmero de clculos adicionales, no est
nada claro como interpretar los coeficientes de un modelo de respuesta mltiple
ordenado.

3.4. El modelo de respuesta mltiple ordenado, un ejemplo


didctico

Con el fin de desarrollar la metodologa expuesta en el captulo en un caso


particular, se accede a datos3 que reflejan una encuesta realizada a 940 familias
espaolas en la que se peda informacin sobre las siguientes variables:

TV: Nmero de televisores en el hogar. Puede tomar los valores uno, dos o
tres para aquellas familias que posean hasta tres o ms televisores.

IF: Ingresos familiares anuales, expresados en millones de pesetas.

3
Los datos aparecen contenidos en el fichero ejer6-2 anexo al libro Microeconometra y decisin
[ 4] de los autores Bernard Cabrer Borrs, Amparo Sancho Prez y Guadalupe Serrano Domingo.

45
NI: Nivel de instruccin del cabeza de familia, codificado en cuatro
niveles, 1 - Educacin bsica, 2 - Bachiller Superior, 3 - Universitaria
media, 4 - Universitaria Superior.

El objetivo es establecer las probabilidades de tener uno, dos, o ms televisores


en funcin del nivel de instruccin del cabeza de familia y del nivel de ingreso
anual de la familia.

Este es un caso clsico de un modelo de respuesta mltiple ordenado porque la


decisin del individuo sobre el nmero de televisores a tener puede ordenarse. El
problema de la eleccin en este caso, ser planteado mediante el enfoque de la
variable latente. La ecuacin de partida es

TVi* = IFi 1 + NI i 2 + i ( 3.9 ).

Donde

TVi* : es la variable latente no observada.

IFi 1 + NI i 2 : es el ndice del modelo (notar que no hay trmino


constante).

i : es la perturbacin aleatoria, sobre la cual se supone una distribucin


F (.) que puede ser Logstica, Normal o de Valor Extremo.

De esta forma, la decisin de la familia sobre el nmero de televisores a tener, se


fundamenta de acuerdo a la siguiente regla de observabilidad

1 si TVi * c1
-
TV = 2 si c1 < TVi* c2 ( 3.10 ).
-
3 si TVi * > c2

Ahora c1 y c2 son dos nuevos parmetros a estimar que constituyen los valores
umbrales o barreras.

Las probabilidades de eleccin vendrn planteadas en los siguientes trminos:

P(TVi = 1) = F ( c1 ( IFi 1 + NI i 2 ))

P(TVi = 2) = F ( c2 ( IFi 1 + NI i 2 ) ) F ( c1 ( IFi 1 + NI i 2 )) ( 3.11 )

46
P(TVi = 3) = 1 F ( c2 ( IFi 1 + NI i 2 )) ,

donde F (.) es la funcin de distribucin que se suponga para el trmino de


perturbacin aleatorio en ( 3.9 ).

3.4.1 Estimaciones mediante los modelos Probit ordenado y Logit


ordenado.

La estimacin de los parmetros 1 , 2 , c1 y c2 es obtenida por el mtodo de


mxima verosimilitud mediante la maximizacin de la funcin

ln L = ( ln F ( c1 ( IFi 1 + NI i 2 )) )
i {i / TVi =1}

+ ln F ( c2 ( IFi 1 + NI i 2 ) ) F ( c1 ( IFi 1 + NI i 2 ))
i {i / TVi = 2}
+ ln 1 F ( c2 ( IFi 1 + NI i 2 )) ( 3.12 )
i {i / TVi =3}

mediante algn algoritmo de optimizacin no lineal. El paquete estadstico Eviews


permite obtener dicha estimacin.

Si se supone que F (.) es la funcin de distribucin Normal estandarizada los


resultados obtenidos a travs de Eviews 3.1 son:

Tabla 10
Dependent Variable: TV
Method: ML - Ordered Probit
Date: 11/29/05 Time: 17:49
Sample: 1 940
Included observations: 940
Number of ordered indicator values: 3
Convergence achieved after 9 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
IF 0.852461 0.066782 12.76488 0.0000
NI 0.517980 0.094179 5.499925 0.0000
Limit Points
LIMIT_2:C(3) 4.248920 0.281436 15.09729 0.0000
LIMIT_3:C(4) 12.75944 0.869698 14.67112 0.0000
Akaike info criterion 0.241968 Schwarz criterion 0.262589
Log likelihood -109.7252 Hannan-Quinn criter. 0.249829
Restr. log likelihood -898.4508 Avg. log likelihood -0.116729
LR statistic (2 df) 1577.451 LR index (Pseudo-R2) 0.877873
Probability(LR stat) 0.000000
Fuente: Elaboracin propia.

47
^ ^ ^ ^
En la estimacin obtenida 1 = 0.852461 , 2 = 517980 , c1 = 4.248920 y c2 = 12.75944 .

Si se supone que F (.) es la funcin de distribucin logstica los resultados


obtenidos a travs de Eviews 3.1 son:

Tabla 11
Dependent Variable: TV
Method: ML - Ordered Logit
Date: 11/29/05 Time: 17:59
Sample: 1 940
Included observations: 940
Number of ordered indicator values: 3
Convergence achieved after 9 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
IF 1.686776 0.152682 11.04765 0.0000
NI 0.820545 0.174598 4.699630 0.0000
Limit Points
LIMIT_2:C(3) 8.010554 0.625440 12.80788 0.0000
LIMIT_3:C(4) 24.75738 2.011020 12.31085 0.0000
Akaike info criterion 0.237367 Schwarz criterion 0.257988
Log likelihood -107.5627 Hannan-Quinn criter. 0.245228
Restr. log likelihood -898.4508 Avg. log likelihood -0.114428
LR statistic (2 df) 1581.776 LR index (Pseudo-R2) 0.880280
Probability(LR stat) 0.000000
Fuente: Elaboracin propia.

^ ^ ^
En la estimacin obtenida 1 = 1.686776 , 2 = 0.820545 , c1 = 8.010554 y
^
c2 = 24.75738 .

3.4.2. Comparacin entre modelos

La comparacin entre ambas estimaciones puede efectuarse en base a la


funcin de verosimilitud y los estadsticos de Akaike, Schwarz y Hannan Quinn.

Tabla 12

Modelo Log likelihood Akaike info Schwarz Hannan-


criterion criterion Quinn criter.
Probit -109.7252 0.241968 0.262589 0.249829
ordenado
Logit -107.5627 0.237367 0.257988 0.245228
ordenado
Fuente: Elaboracin propia.

48
Los resultados de las estimaciones son muy similares, pero en el caso del
modelo Logit, la funcin de verosimilitud estimada es ligeramente superior y los
estadsticos de Akaike, Schwarz y Hannan Quinn son ligeramente menores, as
que el modelo Logit resulta ms adecuado en este caso.

Otro elemento que confirma la afirmacin anterior es la comparacin entre las


diferentes medidas de la bondad del ajuste en ambos modelos.

Tabla 13

Modelo R 2 Mc Fadden LR statistic (2 df) Pseudo R de


2

prediccin.

Probit 0.87787 1577.451 0.877873


ordenado
Logit 0.88028 1581.776 0.880280
ordenado
Fuente: Elaboracin propia.

3.4.3. Interpretacin de los resultados en el modelo elegido


Los resultados obtenidos de las estimaciones de los parmetros en el modelo
^ ^ ^ ^
Logit ordenado fueron 1 = 1.686776 , 2 = 0.820545 , c1 = 8.010554 y c2 = 24.75738 .
Ello implica que la variable latente no observada TV * estimada de un hogar en
funcin de sus caractersticas de ingresos familiares y de nivel de instruccin del
cabeza de familia vendr dada por:

TV * = 1.686776349*IF + 0.8205452656*NI

y las probabilidades de poseer uno, dos o tres o ms televisores sern:

1
P(TV = 1) = (8.010553931 (1.686776349*IF + 0.8205452656*NI) )
1+ e

1 1
P(TV = 2) = ( 24.75737842 (1.686776349*IF + 0.8205452656*NI) ) (8.010553931 (1.686776349*IF + 0.8205452656*NI) )
1+ e 1+ e

1
P(TV = 3) = 1 ( 24.75737842 (1.686776349*IF + 0.8205452656*NI) )
( 3.13 )
1+ e

respectivamente. (Aqu los parmetros estimados aparecen con ms cifras


significativas que en la tabla de salida de Eviews, se hallan en Procs/Make
Model).

49
Si se desea conocer el valor de la variable latente y las probabilidades anteriores
para un hogar donde el nivel de instruccin del cabeza de familia sea el bsico y
de los ingresos familiares sean de 7 millones de pesetas anuales se debe
sustituir en las expresiones anteriores a NI por 1 y a IF por 7 . Obtenindose
que TV * = 1.686776* 7 + 0.820545 *1 =12.628 .

Observar que en este caso c1 < TV * < c2 , ya que 8.010554<12.628<24.75738 , esto


quiere decir que el pronstico que establece el modelo para este hogar, segn la
regla de observabilidad explcita en ( 3.11 ), ser de 2 televisores. Las
probabilidades para cada una de las categoras son calculadas a partir de ( 3.13 )
obtenindose

1
P (TV = 1) = (8.010553931 (1.686776349*7 + 0.8205452656*1) )
= 0.00978156781772
1+ e

1 1
P (TV = 2) = ( 24.75738 (1.686776 *7 + 0.820545*1) ) ( 8.010554 (1.686776 *7 + 0.820545*1) )
= 0.990213033762
1+ e 1+ e

1
P (TV = 3) = 1 ( 24.75737842 (1.686776349*7 + 0.8205452656*1) )
= 5.39842 *10 6 .
1+ e

Si se quiere medir el efecto marginal en la probabilidad de tener 3 televisores


para una familia con una renta anual de 7 millones de pesetas si el nivel de
instruccin del cabeza de familia cambiara de bsica a Bachiller superior, se debe
calcular la diferencia entre P (TV = 3 / IF = 7, NI = 2) y P (TV = 3 / IF = 7, NI = 1) .
Dicha diferencia es obtenida a partir de

1 # 1
1 ( 24.75737842 (1.686776349*7 + 0.8205452656*2) ) !1 ( 24.75737842 (1.686776349*7 + 0.8205452656*1) )
1+ e " 1+ e

y su resultado es de 6.8652936340*10 6 . Con lo que se observa que si el nivel de


instruccin del cabeza de familia cambia de bsica a Bachiller superior en una
familia con una renta de 7 millones de pesetas, la probabilidad para dicha familia
de tener tres televisores, tendr un pequeo aumento de 6.8652936340*10 6 . Se
^
debe notar que el signo positivo del coeficiente 2 implicaba de hecho el sentido
del cambio en la probabilidad anterior, ya que TV = 3 es en este caso la categora
superior. Sin embargo cualquier anlisis sobre el sentido del efecto de dicho
incremento marginal para la probabilidad de tener dos televisores requerira su
^
clculo explcito, ya que el signo del coeficiente 2 no basta para determinar el
sentido del cambio debido a que TV = 2 es la categora intermedia.

50
Captulo 4
4. Modelos censurados y truncados

4.1. Definiciones de truncamiento y censura

En este captulo se analizan problemas de truncamiento y censura. El efecto del


truncamiento aparece cuando los datos de la muestra se extraen de un
subconjunto de una poblacin mayor. Un ejemplo de modelo truncado surge
cuando se desea estimar la ecuacin de salarios de los trabajadores de una
empresa en funcin de sus caractersticas sociolaborales. En este caso la variable
dependiente salario tiene que ser mayor o igual que el salario interprofesional
mnimo vigente.

Otro ejemplo es el caso en el que se estudien los niveles de ingresos basados en


datos que estn solamente por encima o por debajo de cierto umbral de pobreza.
O cuando se quiere cuantificar la cantidad de dinero gastado en tabaco con base
en encuestas realizadas a los clientes de las tiendas de tabaco, en este caso slo
se recoge la informacin de los que compran tabaco en estos centros.

En sentido general se dice que el modelo es truncado si los valores de las


variables (tanto dependientes como explicativas), no se conocen si la variable
dependiente est fuera de un determinado rango (que puede estar definido por un
lmite superior, inferior o ambos). El truncamiento es esencialmente una
caracterstica de la distribucin de la que se extraen los datos de la muestra.

Algunos autores definen como modelos censurados a aquellos en los que los
valores inferiores a cierta cantidad son sustituidos por una cantidad fija (por
ejemplo cero), otros los definen como modelos en los que no se conocen algunos
valores del regresando. En general, los modelos censurados son aquellos en los
que los valores de la variable endgena superiores o inferiores a un determinado
valor no se conocen, es decir, estn sometidos a una barrera o lmite (por los que
son sustituidos). En el ejemplo previo, sobre el estudio de los niveles de ingreso, si
los datos por debajo del nivel del umbral de pobreza aparecen en la muestra como
si fueran iguales al nivel umbral de pobreza, entonces hay presencia de censura.
A diferencia del truncamiento, la censura es un defecto de los datos de la muestra,
si los datos no estuvieran censurados constituiran una muestra representativa de
la poblacin de inters.

51
4.2. Truncamiento

En este apartado se analiza como hacer inferencia sobre las caractersticas de la


poblacin a partir de una muestra extrada de una parte limitada de esa poblacin.
Los teoremas siguientes, contenidos en el libro Anlisis Economtrico de William
H. Green [ 7] , constituyen el marco terico que sirve de referencia a la
metodologa utilizada en los modelos con variable dependiente truncada.

Teorema 1: Densidad de una variable aleatoria truncada. Si la funcin de


densidad de una variable aleatoria continua x es f (x ) y a es una constante,
f ( x)
entonces f ( x / x > a) = .
P( x > a)
f ( x)
En el caso de truncamiento por arriba, el resultado sera f ( x / x < a ) = .
P( x < a)

La demostracin es una consecuencia inmediata de la definicin de probabilidad


condicional. El resultado expresa que truncar equivale a introducir un factor de
escala en la funcin de densidad de manera que integre uno cuando en el recinto
de integracin se incluyen slo los valores mayores que a .

La mayora de los trabajos utilizan la distribucin Normal truncada, si x sigue


una distribucin Normal con media y varianza 2 2 , con base en el Teorema 1 es
posible afirmar que

1 #x
!
2 " 2
f ( x / x > a) = ( 4.1 ).
#a
1 !
" 2

Teorema 2: Momentos de la distribucin normal truncada. Si x es una


variable normalmente distribuida con media y varianza 2 2 y a es una
constante entonces:

E( x / truncamiento) = + 2& ( ),
( 4.2 )
Var( x / truncamiento) = 2 2 [1 , ( )],

a
siendo = ,
2

( )
&( ) = si el truncamiento es x > a ,
1 ( )

52
( )
&( ) = si el truncamiento es x < a ,
( )
y

, ( ) = & ( )[& ( ) ].
Un resultado importante es que 0 < , ( ) < 1 para cualquier valor de .

Se pueden extraer las siguientes consecuencias inmediatas del Teorema 2:

1) Si se truncan los valores que estn por debajo de un determinado valor, la


media de la variable truncada es mayor que la media de la variable original.
Si se truncan los valores que estn por encima de un determinado valor, la
media de la variable truncada es menor que la media de la variable original.
2) La varianza de la variable truncada es menor que la varianza de la variable
original.

4.2.1. El modelo de regresin truncado

El modelo de regresin clsico, cuando no hay truncamiento se especifica en la


forma siguiente

Yi = X i '
+ i ( 4.3 )

con i ~ N(0, 2 2 ) .

Como resulta conocido, en dicho modelo (Yi / X i ) ~ N ( X i ' , 2 2 ) . Si lo que interesa


es la distribucin de Yi , sabiendo que Yi est por encima del punto de
truncamiento a , aplicando el Teorema 2 se deduce que

# a Xi '
!
E (Yi / Yi > a ) = X i ' + 2 " 2 ( 4.4 ).
# a Xi '
1 !
" 2
Por lo tanto, la esperanza condicional no es una funcin lineal ni en X ni en .
Los efectos marginales en la subpoblacin pueden obtenerse teniendo en
cuenta que

'
a Xi
E (Yi / Yi > a ) = X i '
+ 2& ( i ) , donde = . Entonces
2
i

53
%E (Yi / Yi > a) # d&( i ) % i
= +2 !
%X i " d i %X i
#
= + 2 (& 2 ( i ) &( i )) ! ( 4.5 ) .
" 2
i

= (1 & 2 ( i ) + i & ( i ) ) = (1 , ( i ))

De que 0 < , ( ) < 1 y de ( 4.5 ) se deduce que en todos los elementos de X i el


efecto marginal es menor que el coeficiente correspondiente. El tipo de inferencia
que quiera hacerse determina cul efecto marginal interesa. Si se desean hacer
predicciones sobre la subpoblacin, interesar el efecto marginal que se deduce
en (4.5). Si se quieren sacar conclusiones acerca del efecto marginal sobre toda la
muestra, entonces lo que interesa es el coeficiente .

4.2.2. El modelo de regresin truncado, especificacin y


estimacin

En la subpoblacin de donde se extrae la muestra se especifica el siguiente


modelo:

(Yi / Yi > a ) = X i '


+ 2& ( i ) + i = E (Yi / Yi > a ) + i ( 4.6 ),

siendo i = Yi E (Yi / Yi > a ) . Por la construccin del modelo i tiene media cero,
pero su varianza, V( i ) = 2 2 (1 , ( i )) , depende de X i , presentndose entonces
heteroscedasticidad.

Si se estima ( 4.6 ) con una regresin de MCO de Y sobre X se habr omitido a la


variable & ( i ) , produciendo un sesgo provocado por el error de especificacin.

Lo usual es realizar la estimacin de ( 4.6 ) mediante el mtodo de mxima


verosimilitud. Del Teorema 1 se conoce que bajo la hiptesis de truncamiento
1 #x
!
2 " 2
f ( x / x > a) = y bajo el supuesto de independencia entre los
#a
1 !
" 2
individuos y con una muestra de tamao N el logaritmo de la funcin de
verosimilitud quedara:

N N 1 N N
# a Xi '
ln L = ln 2 ln 2 2 (Yi Xi ' 2
) ln 31 ! 4 ( 4.7 ).
2 2 22 2 i =1 i =1 " 2

54
El proceso de maximizacin de esta funcin, an siendo muy complicado, dada la
poca linealidad de la misma, es realizable y est incluido en muchos paquetes
estadsticos, incluyendo Eviews.

4.3. Datos censurados

Cuando la variable dependiente est censurada, todos los valores contenidos en


un cierto intervalo se han transformado en un nico valor. Adems, en muchos
estudios se analizan variables dependientes que toman el valor cero en un
porcentaje significativo de las observaciones. En estos casos tambin es
conveniente analizar la variable como una variable censurada, ya que con los
mtodos de regresin clsicos no es posible explicar la diferencia cualitativa entre
las observaciones lmites (cero) y las no lmites (continuas).

Los resultados tericos que se utilizan para el estudio de las variables censuradas
son similares a los ya utilizados para variables truncadas. Como en el caso
anterior, se utilizar la distribucin Normal ya que la inmensa mayora de las
aplicaciones prcticas realizadas, suponen normalidad para las distribuciones.

Cuando hay censura, la distribucin que siguen los datos de la muestra es una
mezcla entre una distribucin continua y una discreta. Para entender mejor lo
anterior se puede analizar el siguiente modelo de variable censurada:

*
-0 si y 0
y= * ( 4.8 )
- y si y > 0
*

con y * ~ N ( , 2 2 ) .

# #
Entonces la distribucin que sigue y es: P ( y = 0) = P ( y * 0) = ! =1 !
" 2 "2

y si y * > 0 , entonces y tiene la misma densidad de y * .

Observar que ahora la probabilidad total sigue siendo 1 pero en vez de introducir
un factor de escala en la segunda parte, como ocurre en el modelo truncado lo
que se hace es asignar toda la probabilidad contenida en la regin censurada al
punto de corte.

El siguiente teorema contenido conjuntamente con su demostracin en el libro


Anlisis Economtrico de William H. Green [ 7] , permite deducir el modelo de
regresin censurada que se analiza posteriormente.

55
Teorema 3: Momentos de la variable Normal censurada. Sea y * ~ N ( , 2 2 ) ; se
define y = a si y * a , y = y * en caso contrario, entonces:

E( y ) = ( )a + (1 ( ))( + 2& ( )) ( 4.9 )

Var[ y ] = 2 2 (1 ( ))[(1 , ) + ( & ( )) ( )] ( 4.10 )

a ( )
siendo = , &( ) = y , = & ( )[& ( ) ].
2 1 ( )

Cuando se censura la parte superior de la distribucin en vez de la parte inferior,


lo nico que debe hacerse es invertir los papeles de ( ) y de 1 ( ) y redefinir
( )
& ( ) como & ( ) = del mismo modo que en el Teorema 2 se haca para el
( )
caso de la distribucin truncada superiormente.

4.3.1. Modelo de regresin censurada: Anlisis Tobit

La formulacin general suele darse en trminos de una variable latente que


depende linealmente de las variables explicativas.

yi* = X i '
+ i ( 4.11.a ).

-0 si y i* 0,
yi = * ( 4.11.b ).
- y i si y > 0.
*
i

Si se supone que i ~ N (0, 2 2 ) entonces y * ~ N ( X i ' , 2 2 ) y aplicando el Teorema


3 se deduce que la esperanza de una observacin extrada aleatoriamente, que
puede estar censurada o no, ser:

# Xi '

3 ! 4
# Xi " 2
'
E( yi / X i ) = 3X '
+2 4 ( 4.12 )
! 3 i 4
" 2 # Xi '

3 ! 4
3 " 2 4

56
Si el objetivo es el estudio de la variable no censurada, se debe utilizar la media
de la variable latente, es decir X i ' , pero si el objetivo es el estudio de la variable
censurada, se debe utilizar ( 4.12 ).

Los efectos marginales tambin difieren si se usa una u otra funcin de esperanza
condicional, si se usa la media del ndice se obtiene:

% E( y i* / X i )
= ( 4.13 ),
%X i

y teniendo en cuenta la censura, el efecto marginal slo es

% E( yi / X i ) # Xi '
= ! ( 4.14 ).
%X i " 2
% E( yi / X i )
Pero la siguiente descomposicin de propuesta por Mc Donald y Moffit
%X i
(1980), es la que determina el verdadero efecto marginal sobre E ( y i / X i ) cuando
hay censura:

% E( y i / X i )
= [ ( i )( i + & ( i )) + ( i )(1 & ( i )( i + & ( i )))] ( 4.15 ),
%X i
'
Xi ( i)
donde = y &( i ) = .
i
2 ( i)

Si se considera la expresin anterior trmino a trmino se obtiene

% E( y i / X i ) % E( y i / X i , y i > 0) %P( y i > 0)


= P( y i > 0) + E( y i / y i > 0) ( 4.16 ).
%X i %X i %X i
Con lo que se observa que un cambio en X i produce un efecto sobre la media
condicional de y i* en la parte positiva de la distribucin y a su vez afecta a la
probabilidad de que la observacin caiga en esa parte de la distribucin.

4.3.2 El modelo de regresin censurada, el problema de la


estimacin

La estimacin de estos modelos se encuentra contenida en numerosos programas


informticos. La funcin de probabilidad conjunta, si se dispone de una muestra de
tamao N y bajo la hiptesis de independencia entre los individuos, se expresa a
travs de la siguiente relacin:

57
j N
P ( y1 , y 2 ,..., y j ,... y N ) = P ( y i = 0) P ( y i / y i > 0)
j =1 i = j +1

donde se ha supuesto que para las j primeras observaciones la variable


dependiente es cero.

Ms concretamente:

j
# # Xi ' N
# yi X i '
L= !1 ! ! ( 4.17 )
i =1 " " 2 i = j +1 " 2

y su logaritmo es

j
# Xi ' N
1 ( yi X i ' ) 2
ln L = ln 31 ! 4 + 3 ln 2 + ln 2 2
+ 4 ( 4.18 ).
i =1 " 2 i = j +1 2 22

Mediante la maximizacin de esta funcin, se obtienen los estimadores mximo


verosmiles de los parmetros del modelo con variable dependiente censurada
especificado en ( 4.11 ).

4.4. Validacin y contrastes de hiptesis

La literatura refleja que en el campo de los Modelos de Variable Limitada,


se pueden construir los contrastes habituales sobre un coeficiente o un conjunto
de coeficientes.

El contraste individual de un coeficiente se puede efectuar, para muestras


grandes, a partir de una aproximacin asinttica a una t Student, y la
significatividad conjunta del modelo puede efectuarse mediante las pruebas
estadsticas basadas en la funcin de verosimilitud y en el logaritmo de la funcin
de verosimilitud, tal y como se haca en los modelos analizados en captulos
anteriores. As mismo, son utilizados como medida de la bondad del ajuste del
modelo los estadsticos usuales basados en la funcin de verosimilitud estimada,
el estadstico de Akaike, el de Schwarz y el de Hannan Quinn.

4.5. Modelos censurados y truncados, un ejemplo didctico

Con vistas a desarrollar la teora expuesta en el captulo en un caso particular, se


ha accedido a datos4 que reflejan 800 observaciones sobre el gasto anual en la
4
Los datos aparecen contenidos en el fichero pract7-a anexo al libro Microeconometra y decisin
[ 4] de los autores Bernard Cabrer Borrs, Amparo Sancho Prez y Guadalupe Serrano Domingo.

58
compra de viviendas para diferentes familias. El objetivo es estimar la relacin
existente entre el gasto en viviendas y el nivel de ingresos del sustentador
principal de la familia, as como los aos de experiencia del mismo y el hecho de
que ste ocupe o no cargos directivos. Las variables involucradas son:

VIVIENDA: Variable que cuantifica el gasto anual en la compra de la primera


vivienda realizado por una familia.

INGRES: Nivel de ingresos del sustentador principal de la familia.

ANYOS: Aos de experiencia laboral del sustentador principal de la familia.

TRABAJO: Variable dicotmica que toma el valor 1 si el sustentador principal


ocupa un puesto directivo y 0 en otro caso.

El ejemplo servir para ejemplificar tanto la censura como el truncamiento.

Dentro de las 800 observaciones aparecen un total de 55 observaciones para las


cuales la variable dependiente toma el valor cero, en este caso es conveniente
analizar la variable como una variable censurada, ya que con los mtodos de
regresin clsicos no es posible explicar la diferencia cualitativa entre las
observaciones lmites (cero) y las no lmites (continuas).

Si las 55 observaciones en las cuales la variable dependiente toma valor cero


fueran excluidas de la muestra, se estara en presencia de un caso de
truncamiento, ya que los valores de las variables (tanto dependientes como
explicativas), no se conocen si la variable dependiente es menor que 1.871802 ,
que es su menor valor en la submuestra.

4.5.1. Anlisis del modelo truncado

Si no hubiese truncamiento, el modelo a utilizar sera el modelo de regresin


clsico,

VIVIENDA i = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4 + i ( 4.19 )

con i ~ N(0, 2 2 ) .

Pero como en este caso se va a trabajar con una muestra truncada de las 745
observaciones para las cuales la variable dependiente es diferente de cero, se
debe utilizar el modelo de regresin truncado especificado en ( 4.6 ) y que para el
caso particular en estudio toma la forma:

59
# 1.87 Z i
!
" 2
(VIVIENDA i / VIVIENDA i > 1.87) = Z i + 2 + i ( 4.20 ),
# 1.87 Zi
1 !
" 2

donde Z i = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4 .

El punto de corte elegido fue 1.87 , que es un valor muy prximo a 1.871802 , el
menor valor de la variable dependiente que aparece en la submuestra. Como es
conocido, el trmino de perturbacin i tiene media cero, pero su varianza
# # 1.87 Z i
V(i ) = 2 2 !1 , ! depende del vector de variables explicativas del
" " 2
individuo, presentndose entonces heteroscedasticidad.

La estimacin de los parmetros del modelo puede efectuarse a travs del mtodo
de mxima verosimilitud a partir de la maximizacin de una funcin ln L tal como
en ( 4.7 ). El resultado de dicho proceso mediante el paquete Eviews 3.1 para el
caso en estudio es el siguiente:

Tabla 14
Dependent Variable: VIVIENDA
Method: ML - Censored Normal (TOBIT)
Date: 12/03/05 Time: 18:17
Sample: 1 745
Included observations: 745
Truncated sample
Left censoring (value) series: 1.87
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
C 1.165494 0.098851 11.79045 0.0000
INGRES 0.015998 0.005999 2.667038 0.0077
ANYOS 0.098026 0.006707 14.61627 0.0000
TRABAJO -0.098723 0.034601 -2.853202 0.0043
Error Distribution
SCALE:C(5) 0.387484 0.014581 26.57469 0.0000
R-squared 0.309021 Mean dependent var 2.496442
Adjusted R-squared 0.305286 S.D. dependent var 0.390144
S.E. of regression 0.325183 Akaike info criterion 0.457083
Sum squared resid 78.25065 Schwarz criterion 0.488046
Log likelihood -165.2635 Hannan-Quinn criter. 0.469018
Avg. log likelihood -0.221830
Left censored obs 0 Right censored obs 0
Uncensored obs 745 Total obs 745
Fuente: Elaboracin propia.

60
^ ^
Los resultados de la estimacin de los parmetros son 1 = 1.165494 , 2 = 0.015998
^ ^ ^
, 3 = 0.098026 , 4 = -0.098723 , 2 = 0.387484 .

Si se desean hacer predicciones sobre toda la poblacin del efecto sobre el gasto
de un aumento marginal del nivel de ingreso del sustentador principal, ste puede
^
ser medido por 2 = 0.015998 , sin embargo dicho efecto para un individuo de la
subpoblacin analizada, vendr medido por:

%E (VIVIENDAi / VIVIENDAi > 1.87) ^


= 2 (1 & 2 ( i ) + i & ( i ))
%INGRESi ( 4.21 )
^
= 2 (1 , ( i ))

1.87 Z i 1.87 Z i
con i = ^
=
2 0.387484
y
^ ^ ^ ^
Zi = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4

= 1.165494 + INGRESi 0.015998 + ANYOSi 0.098026 + TRABAJOi *(-0.098723)

Como puede apreciarse, el incremento esperado en el gasto depende de los


valores de la variable explicativa de la familia analizada. Si quiere determinarse
cul es el efecto para un individuo con un nivel de ingresos de INGRES=3 , con
una experiencia laboral de 10 aos y que no ocupa cargos directivos, sustituyendo
los valores de las variables explicativas en ( 4.21 ) se obtiene:

Z i = 1.165493526 + 0.01599837236*3 + 0.09802591495*10 - 0.09872276922*0


= 2.19374779258

1.87 Z i 1.87 2.19374779258


i = ^
= = 0.835513411289
2 0.3874836576

y
, ( i ) = & 2 ( 0.835513411289) ( 0.835513411289) * & ( 0.835513411289)
= 0.418782102397

con lo que para esta familia el aumento esperado en el gasto ser:

2 (1 , ( i )) = 0.015998*(1-0.418782102397)=0.00929854034815 ,

61
observar que el efecto marginal es menor que el efecto que tendra el aumento del
nivel de ingresos si la familia se tomara de la poblacin y no de una parte de ella.

4.5.2. Anlisis del modelo censurado

Para analizar la muestra con las 800 observaciones, incluyendo las 55 en las
cuales el gasto en vivienda toma el valor cero, lo correcto es analizar al modelo
como un modelo censurado, en este caso el enfoque sera a partir de la variable
latente tal como en ( 4.11 )

VIVIENDAi* = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4 + i ( 4.22.a )

con i ~ N (0, 2 2 )

y el gasto en vivienda estara en funcin de la variable latente

*
-0 si VIVIENDA i 0,
VIVIENDAi = ( 4.22.b )
-VIVIENDAi si VIVIENDA i > 0.
* *

La esperanza de una observacin extrada aleatoriamente, que puede estar


censurada o no, ser:

# Zi
!
# Zi 3 "2 4
4
E(VIVIENDAi ) = ! 3 Zi + 2 ( 4.23 ),
"2 3 # Zi 4
3 !
"2 4
donde Zi = 1 +INGRESi 2 + ANYOSi 3 + TRABAJOi 4 .

La estimacin de los parmetros del modelo puede efectuarse a travs del mtodo
de mxima verosimilitud a partir de la maximizacin de una funcin ln L tal como
en ( 4.18 ). El resultado de dicho proceso mediante el paquete Eviews 3.1 para el
caso en estudio es el siguiente

62
Tabla 15
Dependent Variable: VIVIENDA
Method: ML - Censored Normal (TOBIT)
Date: 12/03/05 Time: 23:13
Sample: 1 800
Included observations: 800
Left censoring (value) at zero
Convergence achieved after 4 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
C 0.773018 0.119903 6.447056 0.0000
INGRES 0.041137 0.009420 4.367083 0.0000
ANYOS 0.099962 0.008930 11.19432 0.0000
TRABAJO 0.240470 0.051454 4.673511 0.0000
Error Distribution
SCALE:C(5) 0.706041 0.018811 37.53400 0.0000
R-squared 0.193831 Mean dependent var 2.324812
Adjusted R-squared 0.189775 S.D. dependent var 0.735692
S.E. of regression 0.662215 Akaike info criterion 2.231187
Sum squared resid 348.6299 Schwarz criterion 2.260466
Log likelihood -887.4747 Hannan-Quinn criter. 2.242434
Avg. log likelihood -1.109343
Left censored obs 55 Right censored obs 0
Uncensored obs 745 Total obs 800
Fuente: Elaboracin propia.

^
Los resultados de la estimacin de los parmetros son 1 = 0.773018 ,
^ ^ ^ ^

2 = 0.041137 , 3 = 0.099962 , 4 = 0.240470 , 2 = 0.706041 .

La estimacin del gasto esperado para una familia, que puede estar censurada o
no, ser:

# Zi
3 ! 4
# Zi " 0.706041 4
E(VIVIENDAi ) = ! 3 Z i + 0.706041 ( 4.24 )
" 0.706041 3 # Zi 4
3 ! 4
" 0.706041

con

Z i = 0.773018+INGRESi 0.041137 + ANYOSi 0.099962+ TRABAJOi 0.240470 .

Y la probabilidad de que el individuo no gaste en vivienda ser calculada a partir


# Zi
de 1 ! . El efecto de incrementos marginales en alguna de las
" 0.706041
variables explicativas sobre el valor esperado del gasto en vivienda E(VIVIENDAi )

63
% E( yi / X i )
vendr dado por la descomposicin de propuesta por Mc Donald y
%X i
Moffit tal como en ( 4.15 ) y como puede notarse all, este efecto no es el mismo
para todos los individuos, puesto que depende de los valores iniciales de las
variables explicativas del individuo en cuestin.

Este ejemplo refleja una aplicacin de los modelos censurados a un proceso de


eleccin secuencial, la primera decisin para las familias es decidirse a gastar o
no gastar en vivienda, en un segundo paso, si decidieron gastar, entonces deben
determinar que cantidad.

En la literatura economtrica, los modelos censurados se han aplicado


fundamentalmente a modelos de demanda, tales como la demanda de tabaco,
en los que el proceso secuencial ha consistido en primer lugar, en explicar la
decisin de fumar o no fumar y posteriormente la cantidad de tabaco que se
consume. Se han establecido tambin modelos de demanda de turismo en los que
se explican, en primer lugar, la eleccin de viajar o no, y si se decide realizar el
viaje, se determina posteriormente la cantidad a gastar en ese servicio.

Otro ejemplo de este tipo de modelos es el problema de decisin al que se


enfrenta un banco a la hora de conceder prstamos. En primer lugar, se establece
el modelo de decisin, asignando una probabilidad al hecho de conceder o no un
prstamo a un cliente, donde los factores que influyen pueden ser: la edad del
individuo, el hecho de estar trabajando o en paro, situacin familiar, tipo de
trabajo, etc. En segundo lugar, se establece la cantidad de prstamo a conceder,
lo cual depende de: salario, renta familiar, patrimonio, etc.

64
Conclusiones

La aplicacin del conjunto de medios y tcnicas analizados debe ser vista como
una poderosa herramienta para objetivar el proceso de decisin. Pudindose
arribar a las siguientes conclusiones:

1) Durante esta investigacin, se pudo comprobar que el uso de estos medios y


tcnicas en el pas es bastante limitado, en parte por condiciones materiales
objetivas y adems por su poco conocimiento y difusin. Aunque el objetivo de
este material es fundamentalmente metodolgico, se intent incluir aplicaciones
de algunos de estos modelos relacionadas con la problemtica cubana. No
obstante, las encuestas a las que se tuvo acceso no posean un diseo que
permitiese un estudio del tipo que se deseaba.

2) En el proceso de elaboracin de este trabajo se pudo apreciar que los modelos


y mtodos microeconomtricos cuentan con caractersticas distintivas, que
ameritan su estudio como parte de una rama independiente dentro de la
Econometra, stas son:

a) El carcter discontinuo del regresando y la no linealidad de las ecuaciones


de regresin.

b) La utilizacin del mtodo de mxima verosimilitud como mtodo de estimacin


por excelencia.

c) El empleo de medidas de bondad del ajuste tales como el Pseudo R 2 de


prediccin y el R 2 propuesto por McFadden, diferentes a las habitualmente
utilizadas en Econometra clsica.

d) Sus correspondientes interpretaciones econmicas, basadas en la teora de la


utilidad del agente econmico.

e) La interpretacin particular de los coeficientes de cada uno de los modelos y de


los modelos en s mismos.

f) La evaluacin particular de los efectos sobre la variable dependiente de


incrementos marginales de las variables explicativas.

g) Pruebas especficas de validacin y contrastes de hiptesis.

h) Necesidad de tratar con datos individualizados.

3) En los modelos estudiados pudieron apreciase como problemas de


especificacin mas frecuentes, la no normalidad de las perturbaciones, la
heteroscedasticidad y la omisin de variables.

65
4) Los conocimientos tericos sobre los modelos microeconomtricos son
indispensables para el trabajo con los mismos. Si bien hoy da existen softwares
especficos que permiten realizar la estimacin de tales modelos sin muchas
dificultades, las interpretaciones de los resultados que se obtengan, as como la
comprensin del sentido econmico de lo que se ha modelado, no pueden
ofrecerlas los programas informticos. Es por ello que en los ejemplos
desarrollados en este trabajo se hizo especial nfasis en la interpretacin de los
resultados obtenidos y en el sentido de lo modelado.

5) Los modelos y mtodos microeconomtricos deben ser vistos como parte


importante de los muchos instrumentos que intentan explicar el comportamiento y
la conducta del ser humano como agente decisor dentro del mbito econmico.
Por las mltiples aplicaciones que han encontrado en otras latitudes, su estudio
debe ser promovido dentro del entorno acadmico cubano, tal y como se plantea
en las recomendaciones que se sugieren.

66
Recomendaciones

- Extender el anlisis metodolgico realizado en este material a los modelos de


datos panel, a fin de cubrir todas las partes de la Microeconometra.

- Establecer las coordinaciones necesarias para poder realizar una bsqueda de


posibles aplicaciones, dentro del actual contexto de la economa cubana, de los
modelos estudiados.

-Incluir elementos de Microeconometra dentro de los programas de estudios de


las Facultades de Economa, al menos como asignaturas opcionales.

-Promocionar las posibilidades que brindan los modelos microeconomtricos entre


los profesionales de las reas econmicas.

67
Bibliografa utilizada

[1] Alegre G, Guareda N, Riera A, Modelos de eleccin discreta y modelos con


datos panel. Universidad de las Isla Baleares- Coleccin de materiales
didcticos, 58. Palma de Mallorca, 1999.

[ 2] Amemiya T. Una revisin de los modelos Tobit. Cuadernos Econmicos N 0


39, 1982.

[3] Amemiya T. Modelos de respuesta cualitativa, un examen. Cuadernos


Econmicos N 0 39, 1982.

[ 4] Cabrer Borrs Bernard, Sancho Prez Amparo, Serrano Domingo Guadalupe.


Microeconometra y Decisin. Ediciones Pirmide. Madrid, 2001.

[ 5]
Colectivo de autores. Anlisis de regresin y series cronolgicas . Editorial
ENPES, La Habana, 1983.

[ 6] Gracia Diez Mercedes. Modelos con variable dependiente cualitativa y de


variacin limitada. Cuadernos Econmicos N 0 39, 1982.

[ 7] Greene William H.. Anlisis Economtrico. Prentice Hall Iberia, Tercera


Edicin. Madrid, 1999.

[8]Gujarati Damodar N.. Econometra Bsica. Mc Graw Hill, Tercera Edicin.


Bogot, 1997.

[9] Hernndez Luis M, del Castillo Alfredo, Bofill Arturo, Pons Juan,
Probabilidades. Editorial Pueblo y Educacin, Ciudad de la Habana, 1980.

[10] Hsiao Cheng. Analysis of Panel Data. Cambridge University Press. Segunda
Edicin. California 2003.

[11] Linares Fleites G, Martinez Crespo C, Hernndez Prez N .Probabilidades y


Estadstica. Editorial Pueblo y Educacin, Ciudad de la Habana, 1987.

[12] Malinvaud , E. Statistical Methods of Econometrics, Rand Mc Nally &


Company, Chicago 1966.

68
[13] Novales A. Econometra, Mc Graw Hill, Madrid, 1988.

[14] Pulido San Romn Antonio, Prez Garca Julin. Modelos economtricos.
Ediciones Pirmide. Madrid, 2001.

[15] Wooldridge, J. Econometric Analysis of cross Section and Panel Data. The
MIT Press Cambridge, Massachusetts (2002).

Algunos sitios consultados en Internet:

http:/www.ucm.es/info/ecocuan/microectr/

http:/www.microeconometri.com/

http:/www.uam.es/departamentos/economicas/ecocuan/

http:/www.revistasice.com/

http:/www.uc3m.es/uc3m/inst/fl/boletin/espanol/pdfdebate/

69
Anexos

Anexo 1
Pruebas estadsticas basadas en la funcin de verosimilitud y en el
logaritmo de la funcin de verosimilitud

A partir de la funcin de verosimilitud estimada de los residuos o bien de su


logaritmo
I I 1 2
ln L( , 2 2 ) = ln(2 ) ln(2 2 ) (Yi F ( X i ' )) ,
2 2 22 2

se pueden construir distintos contrastes de hiptesis, el criterio para la eleccin


tiene en cuenta que se prefiere aquel modelo que presente mayor valor de la
funcin de verosimilitud estimada de sus residuos.

Un contraste de hiptesis que involucra la funcin de verosimilitud es el contraste


de razn de verosimilitud que sirve para docimar hiptesis entre modelos que
tienen la misma variable dependiente. El primer modelo sera el que se estima
bajo la hiptesis nula (modelo con restricciones), cuya funcin de verosimilitud se
denota por LCR , el segundo modelo sera el que se estima bajo la hiptesis
alternativa (modelo sin restricciones) cuya funcin de verosimilitud se denota por
LSR . A partir de estas funciones se construye el estadstico
#L
LR = 2 ln !! CR = 2(ln LCR - ln LSR ) que bajo la hiptesis nula distribuye $ 2 con
" LSR
un nmero de grados de libertad igual al nmero de restricciones.

Existen otros estadsticos adems, basados en la funcin de verosimilitud


estimada (Log Likelihood) que sirven para comparar modelos diferentes, estos
tienen en cuenta el nmero de coeficientes K y el nmero de observaciones I .

Ellos son el estadstico de Akaike (AIC) cuya expresin es:

2K 2 ln ( L( , 2 2 ))
AIC = .
I I

El criterio de comparacin basado en este estadstico sostiene que ser mejor


aquel modelo que presente un menor valor de AIC.

Otro estadstico es el propuesto por Schwarz que se define como:

k * lnI 2 ln (L( , 2 2 ) )
SC = .
I I

70
Segn este criterio ser preferible aquel modelo que presente un valor de SC
menor.

Otro estadstico es el propuesto es el de Hannan-Quinn que se define como:

2 * k * ln( ln I ) 2 ln( L( , 2 2 ))
H-Q = .
I I
Segn este criterio ser preferible aquel modelo cuyo valor H - Q sea menor.

Anexo 2
Histograma y estadsticas de los residuos de la regresin dada por la ecuacin
( 2.33 ):

400
Series: RESID
Sample 1 1000
Observations 766
300
Mean -0.014998
Median -0.243029
Maximum 7.981035
200
Minimum -0.874680
Std. Dev. 0.938333
Skewness 4.144782
100 Kurtosis 25.19531

Jarque-Bera 17916.38
Probability 0.000000
0
0.00 1.25 2.50 3.75 5.00 6.25 7.50

71
Anexo 3

PRESTAM i 1 1
Tabla de resultados de la regresin de sobre = en el
wi wi ws
ejemplo del epgrafe 2.8

Dependent Variable: PRESTAM/WS


Method: Least Squares
Date: 12/09/05 Time: 14:45
Sample: 1 1000
Included observations: 766
Excluded observations: 234
Variable Coefficient Std. Error t-Statistic Prob.
1/WS 0.029735 0.006141 4.841946 0.0000
R-squared -0.066040 Mean dependent var 0.301720
Adjusted R-squared -0.066040 S.D. dependent var 0.960961
S.E. of regression 0.992185 Akaike info criterion 2.823489
Sum squared resid 753.0891 Schwarz criterion 2.829548
Log likelihood -1080.396 Durbin-Watson stat 1.961748

Anexo 4

Pasos necesarios en Eviews 3.1. para la aplicacin del MPL ponderado del
ejemplo del epgrafe 2.8.

1) ls prestam c renta parado vivprop

Este paso realiza la estimacin del modelo de probabilidad lineal sin ponderar.

2) forecast prestamf
^
Este paso permite obtener la serie prestamf de los valores estimados de Pi .

3) genr prestamfa=log((0<prestamf) and (prestamf<1))+1*prestamf

^
Este paso permite obtener la serie de los Pi que estn entre cero y uno,
eliminando las observaciones que no satisfacen esta condicin.

4) genr ws=(prestamfa*(1-prestamfa))^0.5

Este paso genera la serie de los trminos wi correspondientes a las 766


observaciones que no fueron eliminadas en el paso anterior.

72
5) ls (prestam/ws) (1/ws) (renta/ws) (parado/ws) (vivprop/ws)

Mediante este paso se realiza la regresin por MCO del modelo ponderado dado
por la ecuacin ( 2.33 ).

6) ls (prestam/ws) (1/ws)

PRESTAM i 1 1
Mediante este paso se realiza la regresin de slo sobre = ,
wi wi ws
necesaria para obtener el valor de su verosimilitud estimada y poder obtener el
estadstico LR y el ndice de cociente de verosimilitudes o R 2 de Mc Fadden.

7) genr probestimada=c(1)+c(2)*renta+c(3)*parado+c(4)*vivprop

Esta instruccin despus del paso 5) genera la serie probestimada de las


^
Pi estimadas a partir del MPL ponderado.

8) genr probestimadaacep=log((0<probestimada)and(probestimada<1))
+1*probestimada

Esta instruccin despus del paso 7) genera la serie probestimadaacep de las


^
Pi estimadas a partir del MPL ponderado que estn entre cero y uno, eliminando
las restantes.

9)
genr aciertos=((0<=probestimadaacep)and(probestimadaacep<0.5))*
(1-prestam)
+ ((0.5<=probestimadaacep) and (probestimadaacep<=1))*prestam

Esta instruccin genera una serie denominada aciertos. Para cada i dicha serie
toma el valor 1 si el pronstico para PRESTAM segn la probabilidad estimada
concuerda con el valor real de PRESTAM, en caso contrario toma el valor cero.

9) scalar numeroaciertos

Define un escalar que ser utilizado en el paso 10.

10) numeroaciertos=@sum(aciertos)

Esta instruccin permite finalmente obtener en el valor del escalar el nmero de


aciertos totales al que se lleg mediante el MPL ponderado y es el nmero de 678
678
que se observa en el numerador del Pseudo R 2 de prediccin = = 0.885 .
766

73
Anexo 5

Pasos necesarios en Eviews 3.1. para la aplicacin del test de


heteroscedasticidad de Davidson y Mc Kinnon en el ejemplo del epgrafe 2.8.

1) logit prestam c renta parado

Este paso permite realizar la estimacin logstica de PRESTAM sobre RENTA y


PARADO.

2) Luego de realizar la instruccin anterior, se activan los comandos


PROCS/MAKE RESIDUAL SERIES esto da como resultado una ventana en la que
se puede seleccionar la opcin STANDARIZED, generando la serie de los
residuos estandarizados, que se nombr en este caso ESTANDARES y
constituye el conjunto de las variables dependientes en la ecuacin ( 2.37 ).

3) forecast prestamflog

^
Genera la serie prestamlog de los valores de Pi estimados mediante la regresin
logstica.

4) genr indexlogi=c(1)+c(2)*renta+c(3)*parado

^
'
Genera la serie X i del ndice estimado mediante la regresin logstica.

5) genr denslog=(exp(indexlogi))/((1+exp(indexlogi))^2)

^
'
Genera la serie de los trminos f ( X i ) de la funcin de densidad logstica
evaluada en el ndice.

6) genr FAC= denslog/((prestamflog*(1-prestamflog))^0.5)

^
'
f (Xi )
Genera la serie FAC de los trminos .
^ ^
Pi (1 Pi )

7) LS ESTANDARES FAC (FAC*RENTA) (FAC*PARADO) (FAC*INDEXLOGI*RENTA)

74
Despus de todos los pasos anteriores, a travs de la orden anterior es posible
estimar mediante MCO la ecuacin ( 2.37 ) obtenindose los resultados presentes
en la Tabla 9.

8) forecast estandaresf

^
Mediante esta instruccin se genera la serie de los ESTANDARES , la cual se
necesita para hallar la suma explicada de cuadrados de de la regresin ( 2.37 ).

9) scalar estandaresmedia

10) estandaresmedia=(@sum(estandares))/1000

Mediante estas dos ltimas instrucciones, es posible hallar la media de la variable


ESTANDARES con mayor exactitud que como aparece en la Tabla 9. En la tabla
aparece 0.001136 y el resultado de estandaresmedia es 0.011363445845 .

11) genr explicada= estandaresf-estandaresmedia

^
Genera la serie de los trminos ESTANDARES ESTANDARES .

12) scalar SEC=@sumsq(explicada)

Esta instruccin finalmente permite obtener la suma explicada de cuadrados de la


regresin ( 2.37 ), el resultado es SEC=0.234897333182 .

75