Professional Documents
Culture Documents
Estimación Consistente de Modelos de Recuento Con Inflación Cero
Estimación Consistente de Modelos de Recuento Con Inflación Cero
RESUMEN
Las aplicaciones de los modelos de datos de recuento con inflación cero han proliferado en la
economía de la salud. Sin embargo, los estimadores de máxima verosimilitud de Poisson con
inflación cero o binomial negativa con inflación cero no son robustos a la especificación
errónea. Este artículo propone estimadores de cuasi-verosimilitud de Poisson como
alternativa. Estos estimadores son consistentes en presencia de exceso de ceros sin tener que
especificar la distribución completa. Las ventajas del enfoque de cuasi-verosimilitud de Poisson
se ilustran en una serie de simulaciones de Monte Carlo y en una aplicación a la demanda de
servicios sanitarios. Copyright © 2012 John Wiley & Sons, Ltd.
1. INTRODUCCIÓN
En la siguiente sección se revisan los modelos para datos de recuento con inflación
cero. La estimación ML y la cuasi-verosimilitud de los modelos cero-inflados se
discuten en la sección 3. En la sección 4 se presentan los resultados de la
simulación de Monte Carlo que comparan el estimador PQL con los estimadores
ML. La sección 5 ilustra el estimador PQL con inflación cero logit en una aplicación
que modela la frecuencia de las visitas al médico. La sección 6 concluye el artículo.
2. MODELOS ECONOMÉTRICOS
2.1. Modelos de datos de recuento con inflación cero
Los modelos de datos de recuento con inflación cero tienen una función de
probabilidad
{
f ( y )= π +(1−π )g(0) for y=0
(1−π) g( y ) for y=1,2,3 , …
donde y es una variable aleatoria con valor de conteo, π ∈[0,1] es un parámetro de inflación
cero (la probabilidad de un cero estratégico), y g(⋅) es la función de probabilidad del modelo
de recuento principal. El exceso de ceros, o inflación cero, se produce por definición siempre
que π >0. La media del modelo de datos de recuento con inflación cero es
∞
E( y)=∑ ❑(1−π ) g(k )=(1−π ) E g ( y)
k=1
donde E g ( y ) denota la media de la distribución madre. Una vez que se especifica la función
de probabilidad del modelo de recuento de los padres, se obtiene un modelo de datos de
recuento totalmente paramétrico con inflación cero. Por ejemplo, el modelo ZIP se obtiene
para
exp (−λ) λ y
g( y ; λ)= , λ >0
y!
con la media E g ( y )=λ y E( y)=(1−π ). La principal alternativa al modelo ZIP es el modelo
binomial negativo inflado a cero, que tiene la misma media que el ZIP pero sobredispersión en
la parte de recuento del modelo. Tanto λ y π pueden parametrizarse en términos de variables
explicativas exógenas. Los supuestos estándar son que
exp ( z δ )
'
π (z)=
1+exp ( z δ )
'
donde z puede ser idéntico a x , solaparse con x o ser completamente distinto de x . La función
de expectativa condicional (CEF) del correspondiente modelo de datos de recuento con
inflación cero viene dada por
exp ( x' β )
E( y ∣ x , z )=(1−π ( z )) λ( x )=
1+ exp ( z ' δ )
Es importante destacar que éste es el CEF de cualquier modelo de datos de recuento con
inflación cero, no sólo del modelo ZIP, siempre que se cumplan las ecuaciones (4) y (5).
Además, la ecuación (6) es bastante general, en el sentido de que puede captar varias
desviaciones de los modelos de datos de recuento estándar distintas de la inflación cero. Por
ejemplo, Winkelmann y Zimmermann (1993) dedujeron una expresión como la ecuación (6) a
partir de un modelo de infradeclaración (en su modelo de "adelgazamiento binomial," y se
distribuye por Poisson con una media doblemente indexada). Kim y Lee (2011) obtuvieron la
ecuación (6) a partir de un modelo de obstáculos a cero, donde 1−π (z ) es la probabilidad de
tener un recuento positivo, y la condición de CEF al pasar el obstáculo se modela como una
función exponencial: E( y ∣ x , y> 0)=exp ( x ' β ).
2.2. Parámetros de interés
En las aplicaciones económicas de la salud, como las citadas en la sección 1, los objetos clave
de interés son las predicciones del CEF, así como sus derivadas. La derivada con respecto a una
variable w que es un elemento de los vectores x y z viene dada por
3 ESTIMACIÓN
3.1. Estimación
de máxima verosimilitud
La función log-verosimilitud del modelo ZIP para una muestra de n tuplas de
observación independientes ( y i , xi , zi ) es
n
[
ln l ZIP =¿ ∑ ❑1 ( y i=0 ) ln exp ( z i δ ) + exp (−exp ( xi β ) )
i=1
]
+ 1 ( y i >0 ) [−exp ( x i β ) + y i x i β ]−ln ( 1+exp ( z i δ ) )
Dado que el modelo tiene una estructura de mezcla finita, la maximización de la función de
log-verosimilitud puede utilizar el algoritmo EM, aunque también es posible la maximización
directa mediante Newton-Raphson. Hall y Cheng (2010) discuten algoritmos de estimación
alternativos. Si el modelo está correctamente especificado, la teoría ML asegura que estos
estimadores son consistentes y asintóticamente eficientes, siempre que existan (Cameron y
Trivedi, 1998; Winkelmann, 2008).
3.2. Estimación basada en el momento
Los parámetros β y δ también pueden estimarse directamente a partir de la restricción de
momento condicional (6). Este enfoque es, en principio, preferible, porque hace menos
suposiciones sobre el proceso de generación de datos que la estimación ML. Estos supuestos
adicionales, si se violan, invalidarán la inferencia ML pero no la inferencia basada en
momentos. Los estimadores basados en el momento son, por tanto, más robustos.
La identificación basada en la ecuación (6) plantea dos cuestiones. En primer lugar, si z sólo
tiene una constante, obtenemos un modelo con inflación cero constante. En este caso, el CEF
del modelo con inflación cero viene dado por
En segundo lugar, supongamos que x=z es decir, que todas las variables entran en la parte de
inflación cero así como en el proceso matriz. En este caso, dos vectores de parámetros
conducen al mismo CEF (véase Papadopoulos y Santos Silva, 2008):
exp ( x β1 ) exp ( x β2 )
' '
E( y ∣ x , z )= =
1+exp ( x δ 1 ) 1+exp ( x δ 2 )
' '
para β 2=β 1+ δ 1 y δ 2=−δ 1. Así, el problema de estimación tiene dos soluciones. En la
práctica, este problema de identificación puede superarse si se conoce el signo de al menos un
elemento de δ es conocido. En tercer lugar, en el caso de que x y z difieren, la identificación se
consigue si hay al menos una variable en z que no esté incluida en x .
Para implementar los estimadores basados en el momento en este caso recién identificado,
son posibles varios enfoques. Sugerimos integrar el CEF en un modelo de Poisson estándar,
una aplicación de la estimación de cuasi-verosimilitud, que conduce a estimaciones
consistentes y, como mostraremos en las simulaciones de Monte Carlo, tiene también buenas
propiedades de muestra finita. Alternativamente, se pueden resolver los análogos muestrales
de las restricciones de momento incondicionales implícitas en la ecuación (6), como la
ortogonalidad entre los errores del CEF y las funciones de los regresores:
[
E y i−
exp ( x 'i β )
1+exp ( z'i δ ) ] [
h1 ( x i , z i ) =0 and E y i −
exp ( x 'i β )
1+exp ( z 'i δ ) ] h2 ( x i , zi ) =0 ,
Como mostraremos en la siguiente sección, las condiciones de primer orden del estimador de
cuasi-verosimilitud implican la condición de ortogonalidad ponderada entre los regresores y
los errores del CEF, h1 ( x , z )=w1 ( x , z ) x y h2 ( x , z)=w2 (x , z ) z . En este caso recién
identificado, las ponderaciones óptimas dependen de los momentos de orden superior del
modelo, que se dejan sin especificar. Sin embargo, el estudio de Monte Carlo aquí (y los
resultados de Monte Carlo relacionados en otros lugares; véase Santos Silva y Tenreyro 2006,
2011) sugieren que los estimadores PQL tienen un buen rendimiento en general.
3.3. Quasi-ML
La estimación Quasi-ML se basa en distribuciones dentro de la familia exponencial lineal (LEF),
cuya función de probabilidad puede escribirse como (Gourieroux et al., 1984a)
f
LEF
( y ∣ μ x )=exp {a ( μ x ) +b( y)+c ( μ x ) y } ,
∂ log f ( y ∣ x )
=( y−μ x ) h( x)
∂β
n
ql( β , δ )=∑ ❑ y i ln λ́ ( x i , z i , β , δ )− λ́ ( x i , zi , β , δ )
i=1
∂ ql(β , δ ) n
∂β
= ∑ ❑ y i−
i =1 (
exp ( xi β )
1+exp ( z i δ )
x i=0
)
y
(
exp ( x'i β )
)
exp ( z 'i δ )
n
∂ ql(β , δ )
=−∑ ❑ y i− z i=0
∂δ i=1 ( 1+ exp ( i )
z '
δ 1+ exp ( z
'
i δ )
4
4. PRUEBAS DE MONTE CARLO
Diseño de simulación
Para comparar el rendimiento del estimador PQL con sus principales competidores, los
estimadores ZIP y ZINB ML, creamos tres configuraciones. Todos ellos se obtienen a
partir del siguiente diseño experimental básico. La variable dependiente de recuento y
se especifica como
exp ( δ 0+ δz )
λ ( x , v )=exp ( β 0+ βx+ v ) , π (z )=
1+exp ( δ 0 +δz )
con x=q 1 y z=( q1 , q2 ). Los regresores escalares q 1 y q 2 siguen χ 2 con un grado de libertad; q 1
se reescala para tener una varianza de 0.1. Así, el proceso de generación de datos contiene
dos regresores, uno de los cuales se excluye de la parte de recuento. La atención se centra en
'
la estimación de β y δ=( δ 1 , δ 2 ) que se fijan en 1. El parámetro β 0 se fija en −0.5 que garantiza
una media baja del proceso de recuento de los padres con una fracción sustancial de ceros
incidentales (∼ 45 %). El grado de inflación de ceros se controla mediante δ 0. Todos los
experimentos de simulación se realizan para dos niveles de inflación de ceros 10 % y 50 %.
Estos valores se eligen para reflejar el rango de porcentajes de observaciones con y=0 que
suelen encontrarse en las aplicaciones en las que se utilizan modelos con inflación cero. Con
10 % inflación cero, la fracción total de ceros en los datos es aproximadamente 50 %con 50 %
inflación cero, es aproximadamente 75 %. Es poco probable que los modelos ZI sean útiles si la
proporción de ceros en los datos es mayor. 2 Para obtener 10 % inflación cero, δ 0 se fija igual a
−4.2un valor de δ 0=−1.1 da como resultado 50 % inflación cero.
¿
Se pueden obtener diferentes funciones de varianza para y pueden obtenerse especificando
σ como función de x . Dejando que
2
Utilizamos tres configuraciones. En primer lugar, establecemos c=0 y k =0y se deduce que
σ 2=0 (no hay heterogeneidad no observada), y el proceso de generación de datos es
efectivamente ZIP con λ=exp (−0.5+ x ) y una inflación nula de 10 % o 50 %. Esta primera
configuración nos permite comparar la pérdida de eficiencia de PQL en relación con el
estimador ZIP ML correctamente especificado y, por tanto, asintóticamente eficiente.
Se obtiene una segunda configuración para c=exp (1)−1 y k =1. Se deduce que σ 2=1y hay
sobredispersión cuadrática. Aunque tanto el ZIP como el ZINB están mal especificados (porque
el verdadero proceso padre es Poisson log-normal), esperamos que el ZINB se comporte de
forma bastante satisfactoria ya que la mala especificación se limita a los momentos de orden
superior, no a la media y la varianza. El modelo ZIP, por el contrario, asume la igualdad de la
media y la varianza y, por tanto, es poco probable que produzca buenos resultados. El
estimador PQL es robusto a este tipo de especificación errónea y debería funcionar bien. En
nuestra tercera configuración, establecemos c=2 y k =−1lo que implica una función de
varianza con una constante aditiva
Var ( y ¿ ∣ x )=E ( y ¿ ∣ x ) +2
La correspondiente relación entre la varianza y la media es ahora hiperbólica. En este caso, los
tres estimadores -ZIP, ZINB y PQL−¿ sólo especifican correctamente el primer momento.
Esto no debería importar para PQL, pero conduce a un sesgo para ZIP, así como ZINB.
En todos los casos, se consideraron dos tamaños de muestra (5000 y 50.000 observaciones,
respectivamente). El número de réplicas fue de 10.000 para los procesos de generación de
datos con 5.000 observaciones, y de 1.000 réplicas para los de 50.000 observaciones. El
estudio de Monte Carlo se programó en STATA/MP 11.1; el código está disponible a petición
de los autores.
4.2. Resultados
Los resultados de las tres configuraciones de simulación se muestran en la Tabla I, que se
divide en tres paneles, cada uno de los cuales presenta los resultados de una de las tres
configuraciones. Siguiendo el enfoque de la literatura, nos concentramos en los principales
parámetros de interés, la semielasticidad del proceso matriz β y el cambio en las
probabilidades logarítmicas de los ceros estratégicos, δ 1 y δ 2cuyos valores reales son 1. Las
principales entradas de la tabla I son la media de las estimaciones QL y ML β́ , δ́ y δ 2 sobre las
réplicas. Los números entre paréntesis indican las desviaciones estándar.
( )
2
exp ( x i β )
n '
∑❑ y i−
i=1 (1+exp ( z'i δ )
que lleva a h1 ( x , z )=[1−π (z)] λ (x) x y h2 ( x , z)=π (z )[1−π ( z)] λ ( x) z como
instrumentos; es decir, pondera las condiciones de momento de PQL con el CEF,
[1−π ( z)] λ (x). Sin embargo, este estimador no funciona bien para los procesos de
generación de datos utilizados. El Apéndice B contiene resultados de simulación adicionales
para este estimador en muestras con 50.000 y 500.000 observaciones. Sus resultados se
comparan muy mal con los de PQL. 3 Una explicación de esto es que la ponderación CEF
implicada por NLS pondera a la baja las observaciones con alta probabilidad de exceso de ceros
(CEF bajo), reduciendo así drásticamente la información a partir de la cual estimar δ . En
consecuencia, los mayores sesgos del estimador NLS son para δ y en configuraciones con
pocos excesos de ceros.
4.3. Otros resultados sin restricciones de exclusión
En las simulaciones de la Tabla I, q 2el regresor excluido de x , proporciona una variación
independiente al proceso de inflación cero, una configuración ideal. En las aplicaciones, las
restricciones de exclusión pueden a menudo no ser justificables. Para abordar esta cuestión,
repetimos las simulaciones estableciendo δ 2=0 , es decir, eliminando los procesos
generadores de datos del regresor adicional. El resultado es una especificación con un regresor
que entra en ambas partes del modelo. Como ya se ha comentado, el estimador PQL tiene
ahora dos soluciones. Para elegir entre ellas, utilizamos la información fuera de la muestra que
en el proceso de generación de datos δ 1=1>0 y seleccionamos siempre la solución en la que
4
el coeficiente estimado δ́ 1> 0
Los resultados no son tan diferentes de los de la sección anterior. Con 5.000 observaciones, la
estimación ZIP ML del modelo ZIP es adecuada (panel izquierdo, "Sin sobredispersión").
Asimismo, la estimación ZINB ML del proceso de sobredispersión cuadrática (panel central) es
comparable a la del cuadro I. Sin embargo, en n=5000 , PQL estimación tiene problemas con
el sesgo de la muestra finita y las grandes desviaciones estándar. Sin embargo, como
ilustraremos con la aplicación en la siguiente sección, la estimación PQL con tales tamaños de
muestra puede no ser problemática si se dispone de regresores adicionales: la variación de
más regresores puede ayudar a estimar los parámetros con mayor precisión.
Al pasar a los resultados correspondientes a 50.000 observaciones, la mejora en el
rendimiento de PQL es notable. En entornos con 10 % inflación cero, el sesgo de PQL nunca
supera 2 %. En cambio, ZINB presenta sesgos de hasta 4 % en el proceso de sobredispersión
cuadrática, y de hasta 17.6 % en la configuración de sobredispersión aditiva (panel de la
derecha), ZIP se comporta aún peor. Con una alta inflación de cero, sigue habiendo cierto
sesgo en las estimaciones de PQL, pero su magnitud es visiblemente menor que la de la
estimación ZIP y ZINB ML mal especificada.
En resumen, los resultados de los experimentos de Monte Carlo de esta sección demuestran la
solidez del estimador PQL en muestras finitas con inflación cero y los sesgos que pueden surgir
al utilizar sus dos competidores más comunes de ML.
Nota. Las entradas son las estimaciones medias sobre las réplicas. Desviaciones estándar entre
paréntesis. Valores reales: b = d1 = 1.
Ilustramos la estimación PQL de un modelo de recuento con inflación logit cero en una
conocida aplicación de economía de la salud. En concreto, el objetivo es estimar cómo afecta
el seguro médico a la frecuencia de las visitas al médico. El conjunto de datos es idéntico al
utilizado por Cameron y Trivedi (1986). La muestra de 5.190 individuos se extrae de la
encuesta de salud australiana de 1977-1978. La variable dependiente es el número de
consultas con un médico o especialista en el periodo de 2 semanas anterior a la entrevista. La
media es de 0,302 y la varianza de 0,637. En Cameron y Trivedi (1986) y en las referencias
citadas en el mismo (Tabla II) se ofrecen más detalles y una motivación de la selección de las
variables explicativas.
Los regresores incluyen datos demográficos (sexo, edad y edad al cuadrado), ingresos, diversas
medidas del estado de salud (número de días de actividad reducida, puntuación en el
cuestionario de salud general, enfermedad reciente, afección crónica 1 y afección crónica 2) y
tres tipos de cobertura de seguro médico (Levyplus, Freepoor y Freerepat; el primero
representa un nivel de cobertura más alto y los dos últimos un nivel básico suministrado
gratuitamente).
El cuadro III contiene los resultados de la regresión para el estimador PQL (en las dos primeras
columnas), así como para los modelos ZIP totalmente paramétricos (en las columnas 3 y 4) y
ZINB (en las columnas 5 y 6). En cada caso, los mismos regresores entran en el modelo logit
para la inflación cero y el CEF log-lineal del modelo principal. Como se ha comentado
anteriormente, esto significa que el estimador PQL tiene dos soluciones. Para identificar la
correcta, debemos basarnos en información fuera de la muestra: suponemos que los
individuos que han experimentado enfermedades recientemente tienen más probabilidades
de formar parte de la población que demanda visitas al médico, lo que implica que el signo del
parámetro sobre "enfermedad" es negativo -es decir, que reduce la probabilidad de un cero
adicional- y presentamos este conjunto de estimaciones como d. 5
No hay diferencias significativas en la magnitud de los errores estándar entre los modelos: los
errores estándar del ZIP son más pequeños que los del ZINB y el PQL, siendo estos dos últimos
aproximadamente similares. Por lo tanto, la precisión de la estimación del PQL debería ser
buena aunque no haya restricciones de exclusión.
Una prueba de ratio de verosimilitud entre el ZIP y el ZINB favorece claramente a este último.6
Aunque esto es una indicación de la presencia de heterogeneidad no observada y de
sobredispersión, no significa, sin embargo, que el ZINB sea el modelo "correcto". Si la
sobredispersión está mal especificada, el estimador ZINB es inconsistente,
independientemente de que se ajuste a los datos mejor que el ZIP.
Es tranquilizador, por tanto, que las estimaciones de los parámetros sean bastante insensibles
a la elección de la especificación en muchos casos, pero hay excepciones. Por ejemplo, el
modelo ZINB no detecta ningún efecto estadísticamente significativo de tener una condición
de salud crónica en ninguna de las partes del modelo. En el modelo PQL, el segundo indicador
tiene un gran efecto negativo y estadísticamente significativo sobre la probabilidad de un cero
adicional y, por tanto, aumenta el número esperado de visitas. Las inferencias de PQL y ZINB
también difieren en cuanto a la situación de seguro. "Freepoor" y "Levyplus" son
estadísticamente significativos en el ZINB, pero no en el modelo PQL, lo que sugiere cierta
cautela a la hora de interpretar estos efectos.
6. OBSERVACIONES FINALES
La principal ventaja de utilizar el PQL sobre el ZIP y el ZINB es su robustez frente a las
especificaciones erróneas. Dada la omnipresente incertidumbre sobre los procesos de
generación de datos en la práctica, el uso de estimadores para modelos ZI parece poco
aconsejable si existen preocupaciones sobre el sesgo derivado de una mala especificación de
orden superior. Las especificaciones erróneas relativamente leves de la DGP presentadas en
los experimentos de Monte Carlo con frecuencia dieron lugar a sesgos notables, lo que sugiere
que PQL puede ser la mejor opción para estimar los modelos ZI en comparación con los
estimadores ZI ML en ausencia de información fuerte a priori sobre la DGP. Esta conclusión
será tanto más convincente cuanto mayor sea el conjunto de datos de que se dispone.
APÉNDICE A
CÓDIGO DE STATA PARA LA
ESTIMACIÓN PQL DE MODELOS DE CONTEO INFLADO A CERO El siguiente código de Stata
primero carga el programa para la estimación PQL de modelos de conteo inflado a cero, pqlzi,
y luego ejemplifica su uso con un conjunto de datos del sitio web de Stata, fish.dta. El único
propósito del ejemplo es ilustrar el uso de pqlzi; el modelo particular estimado en estos datos
no tiene sentido. El programa pqlzi utiliza la función media πλ en lugar de (1−π ) λ. A menudo
encontramos que esto tiene mejores propiedades de convergencia. Significa que todas las
estimaciones de la parte binaria (eq 2-salida) tienen el signo "equivocado". Por ejemplo, "-
1,81" debería leerse como "1,81". Si se prefiere, esto se puede cambiar borrando los dos bits
"+"theta2" en el programa.
clear all
** Cargar programa pqlzi
capturar programa soltar
programa pqlzi
definir pqlzi
args lnf theta1 theta2
sustituir tranquilamente 'Inf' ¿ 1/1
−exp ¿ 'theta1' + 'theta2') ¿ ¿ 'theta2')) ///
+ $ ML _y 1∗ln ¿ 'theta1' + 'theta2') ¿ ¿ 'theta2')) ///
Infactorial($ML_y1)
end
** Utilizar el conjunto de datos de ejemplo de Stata
webuse f ish
** Obtener valores iniciales para pqlzi
poisson count persons livebait /* obtener valores iniciales para la parte de recuento /
mat po ¿ e (b)
logit count child camper / obtener valores iniciales para la parte binaria /mat
10=e( b)
** Estimar el modelo pqlzi
modelo ml Si pqlzi (eq1: count = persons livebait) (eq2: child camper), vce(robust)
m init po 1o, copy skip/ cargar valores iniciales /ml maximizar / estimar el modelo
pqlzi /** Comparar con otros modelos ZIzinb count persons livebait, inflate(child
camper) / comparar con zinb /zip count persons livebait, inflate(child camper) /
comparar con zip */
APÉNDICE B
RESULTADOS ADICIONALES DE MONTE CARLO: ESTIMADOR NLS
Nota. 1000 réplicas para n=50,000 ;100 para n=500,000. Valores reales: β=δ 1=δ 2=1
.
AGRADECIMIENTOS
REFERENCIAS
Cameron AC, Trivedi PK. 1986. Modelos econométricos basados en datos de conteo:
Comparaciones y aplicaciones de algunos estimadores y pruebas. Journal of Applied
Econometrics 1: 29-53.
Cameron AC, Trivedi PK. 1998. Regression Analysis of Count Data. Cambridge University Press:
Cambridge, MA. Campolieti M. 2002. The recurrence of occupational injuries: Estimates from a
zero-inflated count model. Applied Economics Letters 9: 595-600.
Chang F-R, Trivedi PK. 2003. Economics of Self-Medication: Theory and Evidence. Health
Economics 12: 721-739.
Hall DB, Shen J. 2010. Estimación robusta para la regresión de Poisson inflada por cero.
Scandinavian Journal of Statistics 37: 237-252.
Kim Y-S, Lee M-J. 2011. Effect of informal family care on formal health care: Zero-inflated
endogenous count for censored response, University of York, HEDG Working Paper 10/11.
Mullahy J. 1986. Specification and Testing of Some Modified Count Data Models. Journal of
Econometrics 33: 341-365.
Papadopoulos G, Santos Silva JMC. 2008. Identification Issues in Models for Underreported
Counts, University of Essex, Discussion Paper No. 657.
Pizer SD, Prentice JC. 2011. El tiempo es dinero: Outpatient Waiting Times and Health
Insurance Choices of Elderly Veterans in the United States. Journal of Health Economics 30:
626-636.
Santos Silva JMC, Tenreyro S. 2006. El registro de la gravedad. The Review of Economics and
Statistics 88: 641-658. Santos Silva JMC, Tenreyro S. 2011.
Sari N. 2009. Physical Inactivity and its Impact on Healthcare Utilization. Health Economics 18:
885-901.
Sheu M-L, Hu T-W, Keeler TE, Ong M, Sung H-Y. 2004. El efecto de un cambio importante en el
precio de los cigarrillos sobre el comportamiento de los fumadores en California: un modelo
binomial negativo con inflación cero. Health Economics 13: 721-791.
Street A, Jones A, Furuta A. 1999. Cost sharing and pharmaceutical utilisation and expenditure
in Russia. Journal of Health Economics 18: 459-472.
Winkelmann R. 2008. Econometric Analysis of Count Data, quinta edición. Springer: Berlín.
Winkelmann R, Zimmermann KF. 1993. Poisson-Logistic Regression, Department of Economics,
University of Munich, Working Paper No. 93-18.
Yen ST, Tang C-H. Su S-JB. 2001. Demand for Traditional Medicine in Taiwan: A Mixed
Gaussian-Poisson Model Approach. Health Economics 10: 221-232.