IN5602 – Marketing II

Logit

Marcel Goic (mgoic@dii.uchile.cl)
Semestre Otoño 2011
1
Modelos de Elección Discreta
Introducción
2
Las Alternativas de Elección
• En lo que sigue nos enfocaremos en describir situaciones
en que las alternativas de decisión son discretas.
– Elección de Marca / Tienda
– Elección de Tamaño / Color / Sabor
– Elección de comprar / no comprar un producto nuevo
– Elecciones de entrar/ no entrar a un mercado

• Características de las Alternativas:
– Mutuamente excluyentes
– Exhaustivas
– Numero finito de alternativas
3
Maximizacion de Utilidades
• Buscamos describir P
ni
, la probabilidad que un agente n
(n=1,…,N) elija la alternativa i (i=1,…,I)

• Asumiremos que el individuo (la firma) decide entre las
alternativas maximizando la utilidad u
ni
(beneficio π
ni
)

• La utilidad u
ni
es conocida para el tomador de decisión, pero no
para el analista y por tanto la descompondremos en una
componente determinística (v
ni
) y otra estocástica (ε
ni
)
4
( )
( )
( )
[ , ]
Pr ,
Pr ,
nj ni ni nj
n
ni ni nj
ni ni nj nj
v v j i n n
P u u j i
v v j i
f d
c c
c
c c
c c
÷ < ÷ ¬ =
= > ¬ =
= + > + ¬ =
=
}
1
Especificación del Modelo
• Para conducir un análisis empírico, necesitamos
especificar las componentes de la utilidad
– Componente determinística:
• Cuales son las variables observables que podrían afectar
la utilidad que derivan los tomadores de decisiones al
elegir una alternativa.
– Componente aleatoria:
• Cual es la distribución de los errores que no observamos

• Las utilidades son relativas por lo que típicamente
necesitaremos normalizar alguna(s) de sus
componentes
5
Logit
Errores IID de valor Extremo
6
Logit: Definición
• El modelo logit resulta de
asumir que cada ε
ni
se
distribuye valor extremo:



• Esta distribución también
es conocida como
Gumbel o de valor
extremo tipo I
7
3 2 1 1 2 3
0.05
0.10
0.15
0.20
0.25
0.30
0.35
3 2 1 1 2 3
0.2
0.4
0.6
0.8
normal
valor extremo
normal
valor extremo
( )
ni
ni
e
ni
f e e
c
c
c
÷
÷ ÷
=
( )
ni
e
ni
F e
c
c
÷
÷
=
Logit: Probabilidad de Elección
8
( )
( )
Pr ,
Pr ,
ni ni ni nj nj
nj ni ni nj
P v v j i
v v j i
c c
c c
= + > + ¬ =
= < + ÷ ¬ =
( )
v v
ni ni nj
ni
ni
ni
e e
ni ni
j i
P e e e d
c
c
c
c
c
÷ + ÷
÷
÷ ÷ ÷
=
| |
=
|
\ .
[
}
( )
( )
( )
( )
0
0
exp
exp
ni nj
ni nj
ni nj
v v
j
v v
ni
v v
j
j
t e
P t e dt
e
·
÷ ÷
÷ ÷
÷ ÷
÷·
÷
| |
= ÷ ÷ =
|
÷ \ .
¿
¿
}
¿
ni
nj
v
ni
v
j
e
P
e
=
¿
P
ni

ni
f(ε
ni
)


t = exp(-ε
ni
)
dt =-exp(-ε
ni
)dε
ni

Derivadas y Elasticidades
• Supongamos que describimos v
ni
como función de
variables observables z
ni
(por ejemplo lineal: v
ni
= β
z
’z
ni
)
9
( )
... 1
ni
nj
v
ni ni
ni ni v
ni ni ni
j
P v e
P P
z z z
e
(
c c c
(
= = = ÷
c c c (
¸ ¸
¿
...
ni
nj
v
ni ni
ni nj v
nj nj ni
j
P v e
P P
z z z
e
(
c c c
(
= = = ÷
c c c (
¸ ¸
¿
( )
,
... 1
ni
ni ni ni
i z ni ni
ni ni ni
P z v
E z P
z P z
c c
= = = ÷
c c
,
...
nj
nj
ni ni
i z nj nj
nj ni nj
z
P v
E z P
z P z
c c
= = = ÷
c c
( )
1
ni ni z ni ni
P z P P | c c = ÷
ni ni z ni nj
P z P P | c c = ÷
( )
,
1
ni
i z z ni ni
E z P | = ÷
,
nj
i z z nj nj
E z P | = ÷
Elasticidades Derivadas
Caso lineal:
Caso lineal:
Caso lineal:
Caso lineal:
Logit: Propiedades
1. Logit puede representar variación sistemática de
preferencias, pero no variaciones aleatorias.
• Componente aleatoria de la utilidad se han asumido
independientemente distribuidas

2. Logit puede capturar dinámicas en elecciones repetidas
(datos de panel) con factores observables, pero no con
factores no observables.
• Componente aleatoria de la utilidad se han asumido
independientemente distribuidas

3. Logit implica patrones de substitución proporcionales
entre las alternativas (IIA)
10
Patrones de Substitución
• Propiedad de Independencia de Alternativas
Irrelevantes



• Substitución Proporcional



• Dados estos patrones de substitución, el modelo logit
puede calibrarse en un subconjunto de alternativas.
11
ni nj
v v
ni
nj
P
e
P
÷
=
,
nj
i z z nj nj
E z P | = ÷
El ratio depende solo de alternativas i y j
Ejemplo de buses azules y rojos
Si ante el cambio de un atributo en una
alternativa, una probabilidad de elección
decrece un 10%, todas decrecerán un 10%
Estimación
• Supongamos observamos I alternativas cada una
caracterizadas por un vector observables de atributos x
ni
y
las elecciones y
ni
que toma el valor 1 si el individuo n elige
alternativa i.

• Los parámetros del modelo pueden estimarse usando
método de la máxima verosimilitud.
12
( ) ( )
( )
( )
'
'
ln
ln
' ln '
ni
nj
ni ni
n i
x
ni x
n i
j
ni ni ni nj
j
n i n i
LL y P
e
y
e
y x y x
|
|
|
| |
=
| |
|
=
|
\ .
= ÷
¿¿
¿¿
¿
¿¿ ¿¿ ¿
( )
( )
ni ni ni
n i
LL
y P x
|
|
c
= ÷
c
¿¿
Bondad de Ajuste
• Existen varias métricas de bondad de ajuste y comparación
de modelos.

• Para un modelo de k parámetros estimado sobre n
observaciones
– Índices de Ratios de Verosimilitud


– El criterio de información de Akaike (AIC)


– El criterio de información Bayesiano (BIC)

13
ˆ
( )
1
(0)
LL
LL
|
µ = ÷
ˆ
2 ( ) 2 AIC LL k | = ÷ +
( )
ˆ
2 ( ) ln BIC LL k n | = ÷ +
Test de Hipotesis
• Como en cualquier modelo de regresión, podemos usar
los estadísticos-t (y errores estándar) para testear si
coeficientes individuales son significativos.

• Para hipótesis mas complejas podemos usar el test de
ratios de verosimilitud.
– Si la hipótesis nula puede expresarse como k
restricciones sobre los parámetros, entonces
estimamos un modelo A irrestricto y otro B restringido.
– Calculamos el estadístico LR = 2(LLA − LLB), que se
distribuye χ2 con k grados de libertad.
14
Conceptos Introducidos
• Descripción general de modelos de elección discreta

• Modelo Logit:

– Definición de modelo logit

– Propiedades del modelo logit

– Estimación de un modelo logit

– Análisis de resultados de un modelo logit.
15
IN5602 – Marketing II
Logit

Marcel Goic (mgoic@dii.uchile.cl)
Semestre Otoño 2011
16

Introducción Modelos de Elección Discreta 2 .

Las Alternativas de Elección • En lo que sigue nos enfocaremos en describir situaciones en que las alternativas de decisión son discretas. – – – – Elección de Marca / Tienda Elección de Tamaño / Color / Sabor Elección de comprar / no comprar un producto nuevo Elecciones de entrar/ no entrar a un mercado • Características de las Alternativas: – Mutuamente excluyentes – Exhaustivas – Numero finito de alternativas 3 .

la probabilidad que un agente n (n=1. pero no para el analista y por tanto la descompondremos en una componente determinística (vni) y otra estocástica (εni) Pni  Pr  uni  unj .I) • Asumiremos que el individuo (la firma) decide entre las alternativas maximizando la utilidad uni (beneficio πni) • La utilidad uni es conocida para el tomador de decisión. j  i    1[ nj  ni vni vnj . j  i   Pr  vni   ni  vnj   nj .….Maximizacion de Utilidades • Buscamos describir Pni.j i ] f   n  d  n n 4 .….N) elija la alternativa i (i=1.

necesitamos especificar las componentes de la utilidad – Componente determinística: • Cuales son las variables observables que podrían afectar la utilidad que derivan los tomadores de decisiones al elegir una alternativa. – Componente aleatoria: • Cual es la distribución de los errores que no observamos • Las utilidades son relativas por lo que típicamente necesitaremos normalizar alguna(s) de sus componentes 5 .Especificación del Modelo • Para conducir un análisis empírico.

Errores IID de valor Extremo Logit 6 .

05 valor extremo normal e  e  ni 3 2 1 1 2 3 • Esta distribución también es conocida como Gumbel o de valor extremo tipo I 3 0.6 0.4 normal 0.8 valor extremo 0.Logit: Definición • El modelo logit resulta de asumir que cada εni se distribuye valor extremo: F  ni   ee f  ni   e  ni   ni 0.35 0.25 0.10 0.2 2 1 1 2 3 7 .15 0.20 0.30 0.

Logit: Probabilidad de Elección Pni  Pr  vni   ni  vnj   nj . j  i   v v      ni  e ni ni nj Pni     e e  ni e  e d  ni   ni  j  i  t = exp(-εni) dt =-exp(-εni)dεni 0 Pni|εni f(εni)   v  v   Pni    exp  t  e ni nj  dt  j    exp t  j e  j e    vni  vnj    vni vnj    → 0 evni Pni  v e nj j 8 . j  i   Pr  nj   ni  vni  vnj .

  ni znj Pnj znj Pni znj Caso lineal: Pni zni    z Pni Pnj Ei ..  ni Pni 1  Pni  zni   Ei ...   ni Pni Pnj zni   Caso lineal: Ei ..  ni zni 1  Pni  zni Pni zni P zni  z P 1  P  ni ni ni  v   ..... zni   z zni 1  Pni  Pni   evni   znj znj   j evnj  Caso lineal: Ei .Derivadas y Elasticidades • Supongamos que describimos vni como función de variables observables zni (por ejemplo lineal: vni = βz’zni) Derivadas Elasticidades Pni   evni   zni zni   j evnj  Caso lineal:  v   . znj Pni znj v   . zni  Pni zni v  . znj  z znj P nj 9 .

pero no variaciones aleatorias. • Componente aleatoria de la utilidad se han asumido independientemente distribuidas 3.Logit: Propiedades 1. Logit puede representar variación sistemática de preferencias. Logit puede capturar dinámicas en elecciones repetidas (datos de panel) con factores observables. pero no con factores no observables. • Componente aleatoria de la utilidad se han asumido independientemente distribuidas 2. Logit implica patrones de substitución proporcionales entre las alternativas (IIA) 10 .

znj  z znj P nj Si ante el cambio de un atributo en una alternativa. todas decrecerán un 10% • Dados estos patrones de substitución. el modelo logit puede calibrarse en un subconjunto de alternativas. 11 . una probabilidad de elección decrece un 10%.Patrones de Substitución • Propiedad de Independencia de Alternativas Irrelevantes Pni v v  e ni nj Pnj El ratio depende solo de alternativas i y j Ejemplo de buses azules y rojos • Substitución Proporcional Ei .

LL      yni ln  Pni  n i  e  ' xni   yni ln    j e  ' xnj n i  n i n     i LL        yni  Pni  xni n i   yni   ' xni   yni ln   ' x  j nj 12 . • Los parámetros del modelo pueden estimarse usando método de la máxima verosimilitud.Estimación • Supongamos observamos I alternativas cada una caracterizadas por un vector observables de atributos xni y las elecciones yni que toma el valor 1 si el individuo n elige alternativa i.

• Para un modelo de k parámetros estimado sobre n observaciones – Índices de Ratios de Verosimilitud ˆ LL( )   1 LL(0) – El criterio de información de Akaike (AIC) ˆ AIC  2 LL(  )  2k – El criterio de información Bayesiano (BIC) ˆ BIC  2LL( )  k ln  n  13 .Bondad de Ajuste • Existen varias métricas de bondad de ajuste y comparación de modelos.

– Calculamos el estadístico LR = 2(LLA − LLB).Test de Hipotesis • Como en cualquier modelo de regresión. – Si la hipótesis nula puede expresarse como k restricciones sobre los parámetros. 14 . entonces estimamos un modelo A irrestricto y otro B restringido. podemos usar los estadísticos-t (y errores estándar) para testear si coeficientes individuales son significativos. • Para hipótesis mas complejas podemos usar el test de ratios de verosimilitud. que se distribuye χ2 con k grados de libertad.

Conceptos Introducidos • Descripción general de modelos de elección discreta • Modelo Logit: – Definición de modelo logit – Propiedades del modelo logit – Estimación de un modelo logit – Análisis de resultados de un modelo logit. 15 .

cl) Semestre Otoño 2011 16 .uchile.IN5602 – Marketing II Logit Marcel Goic (mgoic@dii.

f¾° f N!3 N  N3 N3 .

f¾° f  3  N!3 3 N.  3 !3 .   3 3 !3 N3 !3 N3  3  .

f¾° f  .

8:2/4 3/0503/039020390/897-:/.3./80./0.:9/.0.8  [Y` \US\S`^[ZW_VW_aT_``aU Z\^[\[^U[ZSW_ WZ`^WS_S`W^ZS`bS_   .3. $7" #  W [Y` \aWVW^W\^W_WZ`S^bS^SU Z__`W `USVW \^WXW^WZUS_\W^[Z[bS^SU[ZW_SWS`[^S_ 425430390.8  W [Y` \aWVWUS\`a^S^VZ US_WZWWUU[ZW_^W\W`VS_ VS`[_VW\SZWU[ZXSU`[^W_[T_W^bSTW_\W^[Z[U[Z XSU`[^W_Z[[T_W^bSTW_ 425430390./80.8:2/4 3/0503/039020390/897-:/.0.947.:9/.947./0.

 3 !3 f°  nf¯  °f  °°f f °ff °f½ f  f    nn° n n °  f¾ n n h°° W SV[_W_`[_\S`^[ZW_VW_aT_``aU ZW[VW[[Y` \aWVWUST^S^_WWZaZ_aTU[ZaZ`[VWS`W^ZS`bS_  .$"#%#$$%  W ^[\WVSVVW ZVW\WZVWZUSVW`W^ZS`bS_ ^^WWbSZ`W_ !3 . .  0 3 3 !3 f ½ ° ¾ f °ff¾© © ¯½  ¾ ¾f ¾©¾ W aT_``aU Z ^[\[^U[ZS  3  .

 0 3  3 3 3   N . . #$  W a\[ZYS[_[T_W^bS[_ S`W^ZS`bS_USVSaZS US^SU`W^ SVS_\[^aZbWU`[^[T_W^bSTW_VWS`^Ta`[_ Z  S_WWUU[ZW_ Z ]aW`[SWbS[^ _WZVbVa[Z WYW S`W^ZS`bS W [_\S^ W`^[_VW[VW[\aWVWZW_`S^_Wa_SZV[  `[V[VWS SbW^[_`aV  . 3  . 3 . N. 3  3  3 !3 3 3 .  3  3 3 !3 3 3 3    3  0 .

.  .0      .34      .79074/031472.948/0'074829:/ 8    .79074/031472.  .O3/0.  3 3  .%#$ W  _`WZbS^S_ `^US_VWT[ZVSVVWSa_`W U[\S^SU Z VW[VW[_ W S^SaZ[VW[VW \S^ W`^[_W_`SV[_[T^WZ [T_W^bSU[ZW_ 3/..08/0#.O3.08.

944974708973/4 .437.430884-70485.4#   6:080 /897-:0 .780./J89.:../48/0-079./  ..08 0892.424 70897.#$  $## W [[WZUaS]aW^[VW[VW^WY^W_ Z\[VW[_a_S^ [_W_`SV _`U[_` W^^[^W_W_` ZVS^\S^S`W_`WS^_ U[WXUWZ`W_ZVbVaSW__[Z_YZXUS`b[_ W S^S\ `W__S_U[\WS_\[VW[_a_S^W`W_`VW ^S`[_VWbW^[_`aV $.5O90883:.5:0/005708.248:324/04770897.7E209748 03943.2480089.

 $# $"%# W W_U^\U ZYWZW^SVW[VW[_VWWWUU ZV_U^W`S W [VW[ [Y` 013./48/0:324/0449  .O3/0:324/0449 3E88/0708:9.O3/024/0449 !7450/./08/024/0449 892..

# Ê S^W`ZY  $ S^UW [U Y[U VaUWU WW_`^W.

`[ [  .

Sign up to vote on this title
UsefulNot useful