Modelos probabilísticos Probit y Logit para variables dependientes discretas

Econometra de Corte Transversal
Las herramientas metodolgicas que se presentan a continuacin son aplicables a

informacin obtenida en un momento en el tiempo para un grupo determinado de
individuos, sean stos personas, empresas, bancos, etc.. Por lo mismo, el
componente temporal pierde (momentneamente) importancia, centrndose ahora el
inters en las similitudes o disparidades de ese grupo en determinado instante de
tiempo; es as que nuestras observaciones pasarn a tener el subndice i (y ya no t),
donde i hace referencia al individuo i de la muestra.
Pese a esta caracterstica de la informacin, el uso de MCO no se invalida siempre que
la dependiente sea una variable continua sin ninguna limitacin, siendo slo necesario
ser cuidadoso con la posible heterocedasticidad del modelo estimado, la misma que
debe ser convenientemente corregida. No obstante, cuando la dependiente no satisface
estas condiciones, el estimador MCO deja de ser el ms apropiado surgiendo otros
estimadores de mejores propiedades finitas y asintticas. Son stos estimadores el
centro del anlisis de las siguientes pginas.
Debido a que el problema se centra en la dependiente, dividiremos el anlisis sobre la
base de las caractersticas que sta muestre, distinguiendo entre una dependiente
discreta de aquella que siendo continua tiene rangos limitados de trabajo.
1. Variable dependiente discreta
1.1. Las binomiales
Son aquellas que toman slo dos valores, tradicionalmente 0 y 1, es decir:
Yi = 1, si se cumple cierta condicin
0, de cualquier otra forma
por ejemplo,
Yi = 1, si una persona trabaja 1
0, si una persona no trabaja
1.1.1. 1.1.1. Modelo de Probabilidad Lineal (MPL) Modelo de Probabilidad Lineal (MPL)
Supongamos que decidimos modelar la variable dependiente de (1) usando un modelo
lineal de la forma:
Y X u
i i i
+ '
, 2
donde ( ) E u
i
0
. Podemos decir que:
( ) ( ) ( ) E Y X Yi Yi
i i
/ + 1 0 Prob =1 Prob = 0
3
adems de (2) se puede deducir que:
( )
i i i
X X Y E ' / 4
1
por lo que se puede concluir que:
( )
i i i
Y X Y ob ' 1 Pr 5
es decir, la probabilidad de que la persona trabaje es Xi, la que por lgica tiene que
estar entre 0 y 1. No obstante, en el modelo no hay nada que restringa a
i
Y a estarlo.
Adems, se tiene problemas con el error, pues ste toma slo dos valor, a saber:
Si ui Pr
Yi = 1 1- Xi Xi P(Yi =1)
Yi = 0 - Xi 1- Xi P(Yi = 0)
Total 1
Es decir, el error es binomial y no normal, siendo su varianza igual a:
( ) ( ) ( ) ( ) ( )
i i i i i i i
X X X X X X u Var ' 1 ' ' 1 ' ' ' 1 ) (
2 2
+
1
6
de forma tal que, como depende de las observaciones, termina siendo heterocedstica.
De esta forma podemos concluir que existen tres grandes limitaciones para el uso del
estimador MCO en estos modelos:
El error es heteroscedstico
El error no es normal
Nada restringe a Yi = Xi = Pr (Yi = 1) a estar entre 0 y 1
Los dos primeros problemas pueden ser resueltos con relativa facilidad, utilizando MCG
y ampliando la muestra, respectivamente. No obstante, no existe forma de resolver el
ltimo problema, razn por la cual nos vemos en la necesidad de trabajar con un
mtodo que garantice que la probabilidad resultante se mueva entre esos lmites; para
ello se recurrir a la funcin de distribucin acumulada del error, la cual ser utilizada
para hallar el estimador MV de los parmetros de inters.
1.1.2. 1.1.2. Los modelos probabilsticos: Probit y Logit Los modelos probabilsticos: Probit y Logit
Supongamos que se tiene el siguiente modelo:
Y X u
i i i
* ' +
7
en el que Yi * es una variable no observable e igual, por ejemplo, al nmero de horas
deseadas de trabajo. La variable que se observa es Yi, la misma que toma el valor de
1 si Yi * > 0, y de 0 si Yi * < 0.
Note que ahora
i
X ' es igual a
( )
i i
X Y E / * y no a
( )
i i
X Y E / , por lo que no hay
necesidad de que est restringido a 0 y 1, ms an si tenemos en cuenta que la
Pr(Yi=1) ya no es igual a BXi. Es as que:
( ) ( ) ( ) Pr Pr * Pr Y Y u X
i i i i
> 1 0 > - '
1
Ntese que ello implica que:
( ) ( ) ( ) [ ] 1 Pr 1 1 Pr ' 1 ' ) (
i i i i i
Y Y X X u Var
2
= ( ) 1 F X
i
'
8

donde F() es la funcin de densidad acumulada del error.
La funcin de verosimilitud pertinente, para los n individuos de una muestra, estara
dada por:
L =
F X F X
i
Yi
i
Yi
( ' ) [ ( ' )]

0 1
1
9
Si F(u) es normal estndar estaramos hablando del modelo Probit, mientras que si
fuera logstica
2
nos referiramos al modelo Logit. Cabe mencionar que como ambas
funciones son simtricas podemos concluir que ( ) ( )
i i
X F Y ' ) X ' F(- - 1 1 Pr
i
.
Comparemos un poco ms estas dos funciones. La principal diferencia entre ellas es la
amplitud de sus colas, ya que la logstica tiene colas ms anchas. Por lo mismo los
resultados que se obtienen con cada una de ellas no son comparables. Dado que en el
modelo probit el uso de una normal estndar arroja s estandarizados (siendo =1), la
comparacin con los s logit requiere estandarizar estos ltimos tambin, para lo cual
hay que dividir los estimados entre la desviacin estndar, que es igual a
3
. Es
decir

3 L
vs. P
Dado que no hay forma de saber a priori cmo se comportan los errores de los
modelos que queremos estimar, y que la diferencia entre estas funciones es
relativamente sutil, la eleccin entre probit y logit depender del mejor ajuste que se
logre utilizando una u otra indistintamente.
Finalmente, vale la pena comparar las implicancias de utilizar los modelos
probabilsticos frente a la posibilidad de utilizar MPL. Como vimos en 1.1.1, el MPL
implica que Pr(Yi = 1) = Xi , mientras que los modelos probabilsticos suponen que
Pr(Yi = 1) = F( Xi ). De esta forma, en el primer caso el efecto marginal o impacto de
un cambio en una unidad de las Xs sera constante, a saber:

Pr( ) Y
X
i

1

10
mientras que para los modelos probabilsticos este efecto sera:

Pr( )
( ' ).
Yi
X
f Xi
1

11
es decir, dependera del nivel de las Xs para cada individuo. Esto ltimo coincide con lo
que se observa en la vida real. Por ejemplo, el cambio en la probabilidad de que un
nio asista al colegio frente a un aumento en el ingreso, ser distinto en el caso de
2
Recurdese que la funcin logstica tiene la siguiente especificacin:
F(u) =
exp( )
exp( )
u
u 1+
3
familias de altos y bajos ingresos, esperando para las primeras un incremento casi nulo
de la probabilidad y para las segundas una bastante mayor.
3
Veamos ahora la matemtica del modelo Logit. Su funcin de verosimilitud se define
como:
L =
1
1 1
1
1
+
_
,
_
,
exp( ' )
exp( ' )
exp( ' )
X
X
X
i
i
n
Yi
i
i
Yi
12
L =
( )
exp ( )
exp ( ' )

X Y
X
i i
i
n
i
i
n

+
1
1
1
13
Y tomando logaritmo:
[ ]
ln ln exp L X Y
i i
+

1 ( ' X )
i
derivando respecto a los parmetros y maximizando:
( ) 0
i
0
) X ' ( exp + 1
) ' ( exp ln
S X
X
Y X
L
ik
i
i i
14
Como vemos, 14 es una ecuacin no lineal en , por lo que para resolverla es
necesario recurrir a algn mtodo iterativo. Uno de los ms usado es el de Newton-
Raphson. As, se define:
( ) [ ] ( ) 0
1
0 0 1 I + = S
donde [I(0)] es la matriz de informacin. De esta forma, se utiliza un valor cualquier

para 0, que podra ser el de MCO, y se contina iterando hasta hallar el que haga
S(0) = 0.
1.1.3. 1.1.3. Bondad de Ajuste Bondad de Ajuste
Para establecer la bondad de ajuste del modelo se requerira comparar la prediccin de
la variable dependiente con la realmente observada. No obstante, en un modelo
discreto ello pierde sentido ya que se observa la eleccin real (0 1, en el caso
binomial) mientras que el modelo arroja probabilidades. Es as que el R
2
, que se
basara en estos errores distorsionados, pierde sentido.
Una alternativa lo constituye el Test de la Razn de Verosimilitud, cuya Ho es que
todos los s del modelo (excepto la constante), o un subconjunto de ellos, es igual a 0.
El estadstico asociado se define como:
3
Cuando hablamos de bajos ingresos no queremos referirnos a las familias de mayor pobreza
entre las que es posible que la mencionada probabilidad tambin sea nula. Esto ltimo no hace
sino reafirmar la lgica del uso de la funcin de densidad cuyos extremos son menos
empinados que el resto de la funcin.
4
( )
( )

max
max
L
O L
15
donde L*(0) es la funcin de verosimilitud del modelo restringido (que slo considera
constante, o las explicativas que no estn sometidas a la prueba de significancia) y
L*() es la del modelo completo.
Segn Wilks (1962):
2ln ( ) X q
2
16
donde q es el nmero de restricciones.
A partir de la funcin de verosimilitud es posible construir un seudo R
2
. As hay que
tener en cuenta que como L() es generalmente una productoria de probabilidades
puede tomar valores entre 0 y 1. Por ello, ln L() < 0. Si definimos L*() como el valor
mximo del logaritmo de la funcin de verosimilitud, es decir:
L*()= mx ln L()
Entonces debe ser cierto que:
L*() L*(0)
Es decir, L*() debe estar muy cerca de 0 para que el modelo estimado sea bueno, y
cuanto mejor sea la distancia respecto a L*(0) debera ser mayor. Es as que si
definimos el seudo R
2
como:
( )
( )
2
1
0

L
L
*
*

17
Si el modelo es bueno L*() se aproximara a 0, por lo que
2
tendera a 1. Si el modelo
es malo L*() estara muy cerca de L*(0) por lo que
2
tendera a 0. Como regla
prctica, es de esperar que un buen modelo tenga un
2
entre 0.2 y 0.4.
1.1.4. 1.1.4. Procedimiento para estimar un modelo Procedimiento para estimar un modelo
Para estimar correctamente un modelo discreto se sugiere seguir los pasos que se
explican a continuacin:
1. Analizar la matriz de correlaciones entre la dependiente y el conjunto de
posibles explicativas. A partir de ella se busca rescatar dos cosas:
Establecer el grado de relacin de las explicativas y la dependiente as
como su signo esperado.
Establecer la posible correlacin entre explicativas potenciales. Como
regla prctica, si dos variables tienen una correlacin mayor a 75% se
debe elegir entre ellas a aquella que ajuste mejor; no incluir a ambas en
el modelo.
5
2. Analizar tablas cruzadas entre la dependiente y las explicativas que mostraron
en 1. ser las ms relacionadas con la primera. A travs de este anlisis se
pretende confirmar la direccin y magnitud de la relacin.
3. Estimar la ecuacin con todas las explicativas que aparecieron como relevantes
en 1 y 2. Una vez corrido el modelo dejar aquellas explicativas que tengan el
signo esperado y cuya probabilidad asociada a t no sea mayor a 10% 15%.
Ntese que en el caso de los modelos discretos el t reduce su validez, por lo
que se relaja la necesidad de ser muy estrictos respecto de las conclusiones
que arroja este test.
Uno de los resultados claves del modelo estimado es la prediccin de la
probabilidad asociada a la variable dependiente, la misma que puede ser
determinada para la media muestral o para individuos con caractersticas
especficas dentro de la muestra.
4. Determinar los efectos impactos de las variables explicativas del modelo. En el
caso de una variable explicativa discreta k ste sera igual a:
( )
( )
ki i
k
i
k
X f
X
Y
EI
. '

1 Pr
18
El mismo que puede ser evaluado en la media muestral o para un conjunto
especfico de valores de las explicativas.
En el caso de una variable explicativa discreta tendra que calcularse la
diferencia de la probabilidad cuando dicha variable toma un valor u otro. Por
ejemplo, si estamos analizando la decisin de trabajar y la variable explicativa
de inters es el sexo de la persona, definido como 1 si es hombre y 0 si es
mujer, el efecto impacto de la misma sobre la probabilidad de trabajar sera:
( ) ( )
EI F X X X F X X X
X 2 1 1 2 3 3 4 4 1 1 2 3 3 4 4
1 0 + + + + + + + + ( ) .... ( ) .... -
En este caso tambin podra calcularse el efecto para la media muestral o para
caractersticas determinadas del individuo.
Note que cualquiera sea el tipo de variable explicativa, el efecto impacto arroja
el cambio de la probabilidad, en puntos porcentuales, frente a la variacin en
una unidad de la explicativa, razn por la cual su utilidad es mayor cuando
analizamos explicativas discretas.
5. Determinar la elasticidad de la probabilidad respecto de cambios en las
variables explicativas. La misma puede definirse como para la variable
explicativa k:
( ) X F
X
EI
K
X K
K
'
19
La elasticidad indica el cambio porcentual en la probabilidad ante una variacin
de 1% en la variable explicativa de inters, razn por la cual resulta ms
conveniente estimarla para explicativas continuas. No obstante, dado que
6
carece de unidades, la elasticidad puede servir tambin para rankear todas las
variables explicativas de acuerdo con su importancia relativa en el modelo.
1.2. Modelos Multinomiales
Los modelos multinomiales son aqullos cuyo objetivo es explicar variables
dependientes discretas pero de mltiples opciones, de forma tal que se modela el
proceso a travs del cual una persona escoge entre diferentes alternativas de eleccin,
de acuerdo con aqulla que le d la ms alta utilidad.
De esta forma, si definimos:
ij ij ij
x U + '
*
20
donde Uij* es la utilidad que recibe el individuo i al escoger la alternativa j, dicha utilidad
est en funcin de un conjunto de variables explicativas xij, a travs de los parmetros
, que pueden o no depender de las alternativas de eleccin.
El modelo general se basa en la resolucin de la funcin de verosimilitud construida a
partir de la funcin de distribucin conjunta de cada uno de los individuos de la
muestra. Es decir:
n
i
Yim
im
Yi
i
Yi
i
P P P L
1
2
2
1
1
...... .
21
donde Yij toma el valor de 1 si el individuo i escoge la categora j y Pij es la probabilidad
del mismo de elegir dicha categora. La especificacin de las probabilidades estar en
funcin del tipo de modelo multinomial que se est trabajando, el que depende a su vez
de la forma de la variable que se quiere explicar.
1.2.1. 1.2.1. Variables dependientes no ordenadas Variables dependientes no ordenadas
Son aqullas que se caracterizan por especificar un conjunto de posibles alternativas
que no presentan una relacin de orden entre ellas, como por ejemplo, profesiones,
hobbies, modos de transporte, marcas de cigarrillos, etc. Tomando el primer ejemplo,
supngase que se desean explicar los determinantes del tipo de ocupacin del jefe de
hogar de las familias peruanas, de forma tal que la variable se define como:
Yi = Ocupacin del jefe de hogar
= 1 Mdico
2 Abogado
3 Carpintero

.

m Otros
7
De esta forma, se tienen en total m categoras no ordenadas. El hecho de que stas no
puedan ser relacionadas de acuerdo a algn ordenamiento especfico genera la
necesidad de establecer un orden a priori a travs de la seleccin de una categora
base o referencial. A partir de ella se podr especificar la probabilidad de escoger cada
categora, utilizando un conjunto de modelos binomiales entre ellas y la categora base,
es decir:
( )
( )
( ) '

'
'
2
2
2
1
1
1
X F
P P
P
X F
P P
P
X F
P P
P
j
m j
j
m
m
22
donde F() es la funcin de densidad de los errores de la ecuacin explicativa de la
utilidad. A partir de (22) se define una especificacin para Pj y Pm de forma que:
4
( ) ( )
( )
( )
( )
P P F X P F X
P
P
F X
F X
G X
j j j m j
j
m
j
j
j
+

' '
'
'
'
1
23
donde G() es la funcin de densidad de la diferencia de los errores de las ecuaciones
explicativas de la utilidad que da la alternativa j y la m. Ahora se puede derivar la
probabilidad de escoger la categora m aplicando sumatoria al cociente Pj/Pm:
( )
( )
1
1
1
1
1
1
1
1 '
' 1
1 1
1
1
]
1

m
j
j m
m
j
j
m
j m m
m
m
j
X G P
X G
P P
P
P
P
24
y a partir de Pm hallar la probabilidad de escoger una alternativa j cualquiera:
( )
( )
( )
1
1
' 1
'
'
m
j
j
j
j
m j j
X G
X G
P
P X G P
25
Las expresiones de Pj y Pm resultan ser el centro del inters del modelo. G() puede ser
normal o logstica, aunque dada la necesidad de evaluar mltiples integrales en el caso
de usar una normal se prefiere la distribucin logstica, resultando lo que se conoce
como el Modelo Logit Multinomial. En el mismo los resultan ser parmetros relativos
respecto de la categora base por lo que no pueden ser analizados en forma individual.
Este modelo tiene especificaciones determinadas que dependen de la utilidad final que
se le d. As, cuando se supone que la probabilidad de escoger una categora j
4
Ver Amemiya (1983)
8
depende exclusivamente de caractersticas del individuo i se puede reescribir el Pj de
(25), de forma que:
( )
( )
1
1
' 1
'
m
j
i j
i j
ij
X G
X G
P
26
donde, como se observa, las variables explicativas dependen del individuo i.
No obstante, es posible tener una especificacin alternativa en donde las explicativas
dependen del individuo y de la alternativa, mientras que los son invariables a ambos
factores. Este es el conocido modelo condicional de McFadden (1973) en donde la
probabilidad de que el individuo i escoja la alternativa j est dada por:
( )
( )
1
1
' 1
'
m
j
ij
ij
ij
X G
X G
P
27
en esta especificacin los representan los "precios implcitos" de las diferentes
caractersticas de las alternativas a escoger (o pesos especficos) mientras que Xij es la
valoracin que el individuo i tiene respecto de cada caracterstica de la alternativa j.
Como se observa, la especificacin de cada modelo responde a un objetivo especfico.
As, el primer modelo definido por (26) se utiliza para predecir la probabilidad que un
individuo fuera de la muestra escoja una de las m alternativas analizadas, dadas sus
caractersticas especficas. Por su lado, el modelo que define (27) permite predecir la
probabilidad de escoger una alternativa no considerada entre las m estimadas, pero
para la que se tienen las valoraciones de cada individuo i Xij; ello gracias a que se
cuenta con los precios implcitos o ponderaciones de las caractersticas de las m
alternativas con las que se realiz la estimacin.
5
Finalmente, sera posible considerar un modelo combinado que incorpore tanto la
valoracin de las caractersticas de las alternativas como aqullas de los individuos que
conforman la muestra. Ello implicara una nueva especificacin de la probabilidad de
que el individuo i escoja la alternativa j de la forma:
( )
( )
+ +
+
1
1
'
'
' 1
'
m
j
i j ij
i j ij
ij
Y X G
Y X G
P

28
5
Es posible notar, adems, que en el primer modelo el nmero de parmetros a estimar es
igual al nmero de variables explicativas del individuo por m-1, si es que se considera la
normalizacin de uno de los parmetros a estimar (o=0). En el segundo modelo se estiman
tantos parmetros como caractersticas se hayan considerado para cada alternativa.
9
donde Xij representa las valoraciones del individuo i respecto de las caractersticas de
la alternativa j, mientras que Yi indica las caractersticas particulares del individuo i.
1.2.2. 1.2.2. Variables dependientes ordenadas Variables dependientes ordenadas
Las variables multinomiales ordenadas son aqullas que indican diversas alternativas
que guardan entre s un ordenamiento especfico. Ese sera el caso de un ranking de
prioridades de inversin, de rangos de ingresos, de categoras de instituciones
prestadoras de salud, entre otras variables. Si tomamos este ltimo ejemplo podramos
definir la variable Yi como:
Yi = Institucin de salud donde se obtiene el servicio
= 4 Clnicas particulares
= 3 Hospitales pblicos
= 2 Centros y postas
= 1 Otros proveedores
Este ordenamiento supone que son las instituciones a las que se les coloca un mayor
valor de la variable Y las de mejor servicio.
El modelo se basa en la definicin de un ndice de performance I*, el que se encuentra
relacionado con un conjunto de variables explicativas vinculadas con el individuo y las
alternativas j, tal como:
i i i
X I + ' * 29
Asimismo se establecen puntos de corte ('s) entre los cuales se mueve el I*. As, si
I*<1, el individuo escoge la categora 1; si I* est entre 1 y 2 escoge la categora 2, si
est entre 2 y 3 escoge la 3, y si es mayor que 3 elige la categora 4. De esta forma
se requerirn tener tanto puntos de corte como categoras haya, menos uno.
A partir de estas definiciones se pueden especificar las probabilidades asociadas a
estar en una determinada categora, es decir:
( ) ( ) ( )
( )
( )
( ) ( ) ( )
( ) ( )
( ) ( ) ( )
( ) ( )
( ) ( ) ( )
( )
i
i i i i
i i
i i i
i i
i i i
i
i i
i i i i
X F
X I Y
X F X F
I I Y
X F X F
I I Y
X F
X
X I Y
' 1
' Pr * Pr 4 Pr
' '
* Pr * Pr 3 Pr
' '
* Pr * Pr 2 Pr
'
' Pr
' Pr * Pr 1 Pr
3
3 3
2 3
2 3
1 2
1 2
1
1
1 1

> >

< <

< <

<
< + <
30
10
A fin de que todas las probabilidades sean positivas debe ser cierto que 1<2<3. Estos
puntos de corte son estimados por el modelo junto con los y hacen posible obtener
las probabilidades estimadas de estar en cada categora. Como en el caso binomial, los
no tienen un significado individual sino dentro del argumento de la funcin de
densidad; no obstante, su signo indicar la direccin de la relacin con la probabilidad
de estar en la categora ms alta, y la inversa de la misma en el caso de la categora
ms baja; las categoras intermedias tendrn efectos impacto que no se pueden definir
a priori.
1.2.3. 1.2.3. Variables dependientes secuenciales Variables dependientes secuenciales
Estas variables son un tipo especial de ordenada en la que una categora no puede ser
elegida sin haber pasado por un proceso previo de eleccin de otra(s) de ella(s). Esta
secuencialidad debe ser incorporada en la especificacin de la probabilidad de elegir
una categora determinada. Veamos un par de ejemplos que pueden ser ilustrativos.
Supongamos que la variable bajo estudio es la educacin del jefe de hogar de las
familias peruanas, la que se especifica de la siguiente forma:
Yi = Educacin del JH
= 1 si no termin la educacin primaria
= 2 si no termin la educacin secundaria pero s la primaria
= 3 si no termin la educacin superior pero s la secundaria
= 4 si termin la educacin superior
As, por ejemplo, si la persona se encuentra en el nivel 3 definitivamente no puede
situarse en las dos categoras anteriores, an cuando previamente ha debido pasar por
ellas para alcanzar la 3, por lo que la definicin de la probabilidad asociada con dicha
categora debe incorporar esta consideracin.
La estimacin de los determinantes del nivel de educacin del jefe de hogar se puede
llevar a cabo a travs de modelos binomiales secuenciales. Partiendo la muestra en
dos, los que terminaron primaria y los que no, se estima un primer modelo binomial
obteniendo el vector 1 de parmetros. Luego, tomando slo aqullos que terminaron la
primaria, se puede dividir esta submuestra en aqullos que s terminaron secundaria y
los que no; ello hara posible estimar un segundo modelo binomial de donde se
obtendra el vector 2. El proceso seguira y es brevemente resumido en el siguiente
cuadro.
3

No termin
primaria Y=1
S termin primaria
Y=0
Termin
superior
Y=0
No termin
superior
Y=1
Si termin secundaria
Y=0
No termin secundaria
Y=1
_ 2
1
11
A partir de estas estimaciones se pueden obtener las probabilidades de estar en una
categora determinada (ver Amemiya 1983). As por ejemplo la probabilidad de estar en
la categora 3 es igual a la probabilidad conjunta de no haber terminado la educacin
superior pero s la secundaria
6
. La definicin de las probabilidades de todas las
categoras analizadas se muestra a continuacin:
( ) ( )
( ) ( ) ( )
[ ]
( ) ( ) ( )
[ ]
( )
[ ]
( ) ( )
[ ]
( )
[ ]
( )
[ ]
Pr '
Pr ' '
Pr ' ' '
Pr ' ' '
Y F X
Y F X F X
Y F X F X F X
Y F X F X F X
i i
i i i
i i i i
i i i i

1
2 1
3 1 1
4 1 1 1
1
2 1
3 1 2
1 2 3

31
Una especificacin alternativa se observa en el siguiente modelo para la demanda de
automviles trabajado por Cragg y Uhler (1970). En el mismo se quieren analizar los
determinantes de la adquisicin de un automvil, planteando las decisiones de compra
de la siguiente manera:
Cambiar el actual
S
Comprar uno por primera vez
Adquirir un automvil
Vender el actual
No
Mantenerse en la situacin actual
Si definimos las siguientes probabilidades:
P1= probabilidad de cambiar el auto actual
P2= probabilidad de comprar uno por primera vez
P3= probabilidad de vender el auto actual
P4= probabilidad de no hacer ninguna transaccin
Entonces podemos definir estas probabilidades como:
( ) ( ) ( )
( ) ( ) ( ) [ ]
( ) ( ) ( ) [ ]
( ) ( ) [ ] ( ) [ ]
i i i
i i i
i i i
i i i
X F X F Y
X F X F Y
X F X F Y
X F X F Y
' 1 ' 1 4 Pr
' 1 ' 3 Pr
' 1 ' 2 Pr
' ' 1 Pr
3 1
1 3
2 1
2 1

32
As, el vector 1 se obtendr del modelo binomial que divide la muestra entre quienes
adquieren un auto nuevo y los que no lo hacen; el 2 del modelo que, dentro de la
muestra de quienes compran un auto nuevo, diferencia entre quienes reemplazan el
que tienen y los que compran uno por primera vez; finalmente, el 3 se obtiene del
modelo que, entre quienes no adquieren un carro, diferencia entre los que venden
carros y los que no realizan ninguna transaccin.
6
Es decir, Pr(Yi=3,Yi 2)=Pr(Yi=3/Yi 2) x Pr(Yi 2)
12
Ntese que la propuesta de estimacin simultnea planteada en los dos modelos antes
presentados slo es vlida en la medida que los factores aleatorios que afectan las
diferentes etapas de decisin sean independientes entre s (independencia de los
errores de las ecuaciones que se estiman sucesivamente).
13

Modelos probabilísticos Probit y Logit para variables dependientes discretas

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Modelos probabilísticos Probit y Logit para variables dependientes discretas

Uploaded by

Copyright:

Available Formats

Econometra de Corte Transversal

Las herramientas metodolgicas que se presentan a continuacin son aplicables a

donde [I(0)] es la matriz de informacin. De esta forma, se utiliza un valor cualquier

You might also like