You are on page 1of 76

• Modèles ordonnés

• Modèles séquentiels
Chapitre 2 : • Modèles non ordonnés :
Les modèles à • logit multinomial,
variables • logit conditionnel,
qualitatives • hypothèse fondamentale de l’indépendance des états
non pertinents et test de celle-ci,
polytomiques
• autres modèles alternatifs :logit emboîté,
probit polytomique
2.1 Introduction
Quelle que soit la catégorie des modèles considérés, un
modèle polytomique (multinomial) peut se définir comme
suit :
- la variable à expliquer yi peut prendre mi + 1 modalités :
0,1,...,mi
- les modalités j sont mutuellement exclusives pour
chaque individu i : m +1 i

 P(yi = j) = 1∀i
j=0

- la probabilité associée à chaque réponse est :


P(yi = j) = Fi j (X,) i = 1,..., n; j = 0,..., mi

- on définit les variables binaires yi j


2.1 Introduction
- on définit les variables binaires yi j

- on peut écrire la vraisemblance du modèle comme le


produit des probabilités associées aux différentes
modalités, ceci pour tous les individus :
N mi
L =  Fi j (X,)yi j
i=1 j=0
2.2 Les modèles ordonnés
Exemples :
- résultats à des tests de goûts
- état de niveau de qualification
- étude de salaires en classes
- étude de la situation d’emploi: pas
d’emploi, temps partiel, temps plein
3.2.1 Présentation générale
- Variable latente
Une variable latente est une variable qui ne peut pas être
mesurée directement, mais qui est supposée être à la base des
variables observées. C’ est variable que l'on peut inférer depuis
un modèle à partir d'une variable observée
Comme les logits et probits binaires, le modèle est basé sur une
variable latente, qui est fonction des variables explicatives
2.2 Les modèles ordonnés
3.2.1 Présentation générale
- Variable latente
y∗
i = Xi + ui

Elle permet de définir la réalisation de la variable observée


Par convention : µ0 = − µm+1 = +


2.2 Les modèles ordonnés
3.2.1 Présentation générale
- Variable latente
Les bornes µ j seront estimées
Supposons ui indépendants, de moyenne nulle symétrique
autour de 0 et soit F la fonction de répartition de ui/
P(Yi = 0) = P(µ0 ≤ y∗i < µ1) = P(yi∗ < µ1) − P(y∗i≤ µ0)
= P(Xi + ui < µ1) − P(Xi + ui ≤ µ0)
2.2 Les modèles ordonnés
3.2.1 Présentation générale
- Variable latente
2.2 Les modèles ordonnés
3.2.1 Présentation générale
- Variable latente

De manière générale

- Fonction de vraisemblance
2.2 Les modèles ordonnés
3.2.1 Présentation générale
- La log-vraisemblance

On pose 2 = 1
- Maximum de vraisemblance
2.2 Les modèles ordonnés
3.2.2 Logit et Probit ordonné
- Probit ordonné

- Logit ordonné
2.2 Les modèles ordonnés
3.2.3 Interprétation
Les constantes dans ces modèles ne sont
pas identifiables

Les coefficients n’ont pas de signification en tant que tel.


Il faut revenir au calcul des probabilités

P(yi = j) F(µ j+1 − Xi) F(µ j − Xi)


= − = −[ f ((µj+1 − Xi) − f (µ j − Xi)]
Xi Xi Xi
2.2 Les modèles ordonnés
3.2.4 Exemple
2.2 Les modèles ordonnés
3.2.4 Exemple
2.3 Les modèles séquentiels
Les modèles séquentiels sont utilisés pour rendre compte
de choix effectués ou d’événements selon une séquence
bien précise, le plus souvent dans le temps et dont les
réalisations conditionnent naturellement l’ensemble des
modalités futures.
Exemple : métro, bus rouge, bus bleu
2.3 Les modèles séquentiels
Exemple : métro, bus rouge, bus bleu
Si on suppose que les termes d’erreurs sont orthogonaux
P(y2i = 1; y1i = 0) = P(y2i = 1|y1i = 0).P(y1i = 0)

= F(X2i2)[1 − F(X1i1)]

P(y2i = 0; y1i = 0) = P(y2i = 0|y1i = 0).P(y1i = 0)


= [1 − F(X2i2)][1 − F(X1i1)]

P(y1i = 1) = F(X1i1)
2.3 Les modèles séquentiels
Exemple : métro, bus rouge, bus bleu

La vraisemblance peut s’évaluer de façon séquentielle

n
L= [F(X1i1)]y
1i
[1 − F(X1i1)](1−y1i) [F(X2i2)]y2i [1 − F(X2i2)](1−y2i)
i=1

Autre exemple : réussite scolaire


2.4 Les modèles non-ordonnés
3.4.1 Le logit multinomial
- Généralisation du logit binaire
Dans le cas du logit binaire :
exp(Xi) 1
P(yi = 1) = P(yi = 0) =
1 + exp(Xi) 1 + exp(Xi)

Un seul vecteur de paramètres était suffisant pour expliquer les


deux probabilités élémentaires, qui ne variaient qu’en fonction des
caractéristiques X.

Le passage au cas multinomial pose le problème suivant : comment


expliquer des différences entre plus de deux probabilités si  est
constant ?
2.4 Les modèles non-ordonnés
3.4.1 Le logit multinomial
- Généralisation du logit binaire
2 solutions possibles :
i) considérer un vecteur de paramètres différents selon
chaque alternative (logit multinomial)
ii) autoriser les variables explicatives X à varier
en fonction des modalités (logit conditionnel)

Dans le cas du logit binaire, si on introduit deux vecteurs 0 et 1 ,


on peut réécrire :
exp[Xi( j − 0)]
P(yi = j) = 1 avec  = 1 − 0
k=0 exp[X ( −  )]
i k 0

Le rapport des probabilités est égal au rapport de deux fonctions


dont les paramètres sont indicés par la modalité
2.4 Les modèles non-ordonnés
3.4.1 Le logit multinomial
- Généralisation du logit binaire
Dans le cas multinomial : soit (m+1) modalités et (p0,..., pm) les
probabilités associées. La catégorie 0 est prise en référence et l’on
pose p1 p2 pm
H(Xi1) = ,H(Xi2) = ,...., H(Xim) =
p1 + p0 p2 + p0 pm + p0

avec H(.) une fonction continue et croissante et p j + p0 = H −1(Xi j )


pj
2.4 Les modèles non-ordonnés
3.4.1 Le logit multinomial
- Généralisation du logit binaire
si on pose G(Xi j ) = exp(Xi j ) et 0 = 0
exp(Xi j ) exp(Xi j )
pj = m =
k=0 exp(Xik) 1 + m
k=1 exp(Xik)

Le rapport entre deux probabilités p j = exp(Xi j )


pk exp(Xik)

Il est indépendant des alternatives autres que j et k.


2.4 Les modèles non-ordonnés
3.4.1 Le logit multinomial
- Spécification et estimation
Comme 0 = 0 , on cherche (1,..., m) la solution de max. de la log-
vraisemblance.

La log-vraisemblance :
n m n m n
L = [pi j ] ⇒ ln L =
yi j
  yi j ln[pi j] = [yi0 ln pi0 + yi1 ln pi1 + ... + yim ln pim]
i=1 j=0 i=1 j=0 i=1

exp(Xi j ) 1
avec pi j = 1 + m exp(X  ) pi0 =
k=1 i k 1 + m
k=1 exp(Xik)

 ln L n
=  [yi j − pi j ]Xi = 0
 j i=1
2.4 Les modèles non-ordonnés
3.4.1 Le logit multinomial
- Spécification et estimation
Les coefficients ne sont pas directement interprétables : la
significativité et le signe sont les seuls éléments auxquels on
s’intéresse.

Effet marginal :
pi j m
= pi j [ j −  pikk]
Xi k=1
2.4 Les modèles non-ordonnés

- Exemple
2.4 Les modèles non-ordonnés
3.4.2 Le logit conditionnel de McFadden
Le logit conditionnel considère un vecteur de paramètres
constants et autorise les variables explicatives à dépendre
des modalités
exp(Xi j )
P(yi = j) = m
k=0 exp(Xik )
Xi j : les attributs caractéristiques de chaque alternative
(lesquels peuvent dépendre de l’individu comme la
distance au travail pour le choix du moyen de transport)
Ce modèle est couramment utilisé en économie industrielle
appliquée/marketing.
Exemple : choix de la marque de céréales de petit déjeuner en
fonction des caractéristiques nutritionnelles des produits
2.4 Les modèles non-ordonnés
3.4.2 Le logit conditionnel de McFadden
P(yi = j)
Comme dans le logit multinomial, est indépendant des
autres modalités P(yi = l)
P(yi = j) exp(Xi j )
= = exp[( Xi j − Xil )], ∀j = 1,..., m
P(yi = l) exp(Xil)
Pour le calcul des effets marginaux, on s’intéresse à la variation
estimée de la probabilité qu’un individu i choisisse la modalité j,
lorsque la kème variable explicative associée à une modalité
quelconque (l) varie. En indiçant les paramètres par rapport aux
composantes du vecteur Xi j , on a :
2.4 Les modèles non-ordonnés
3.4.2 Le logit conditionnel de McFadden

Remarque : le choix entre le logit multinomial et le logit


conditionnel dépend essentiellement du type de données dont on
dispose. Si les données sont majoritairement individuelles (propres
aux individus), on utilisera le logit multinomial. Dans le cas plus
rare où les variables dépendent des modalités, on préférera le logit
conditionnel.

Dans le logit conditionnel, comme les paramètres sont


indépendants des modalités, il n’est pas possible a priori
d’incorporer dans le modèle des variables propres aux individus,
car les paramètres associés ne seraient pas associés.
2.4 Les modèles non-ordonnés
3.4.2 Le logit conditionnel de McFadden
=>Mélange d’un logit multinomial et d’un logit conditionnel. On
pose alors : exp(Xi j  + Zi j )
P(yi = j) =
k=0 exp(Xik  + Zik )
m
et en divisant par exp(Xi0).exp(Zi0) :
exp[(Xi j − Xi0) + Zi( j − 0)]
P(yi = j) = m
k=0 exp[(Xik − Xi0) + Zi(k − 0)]

Les paramètres de ce modèle s’interprètent de la façon suivante :


ceux associés aux variables spécifiques aux individus constituent la
différence entre les paramètres originaux et ceux de la modalité de
référence 0, alors que les paramètres  sont associés aux
différences entre les variables dépendant des modalités et la valeur
des variables dans le cas de référence.
2.4 Les modèles non-ordonnés
3.4.3 Modèles à choix discrets via une approche d’utilité
Considérons un ens. de consommateurs rationnels, faisant face à
un certain nombre de biens. Chaque bien procure un niveau
d’utilité différent et le consommateur cherche à maximiser son
utilité, ce qui revient ici à décider quel bien il va consommer.
Comme le niveau d’utilité exacte est trop complexe à connaître,
on suppose que l’utilité est une fonction aléatoire des attributs.
Ui j = v(Xi j ) + i j , j = 0,..., m

(par souci de simplification des écritures, on élimine l’indice i)


2.4 Les modèles non-ordonnés
3.4.3 Modèles à choix discrets via une approche d’utilité
P(y j = 1) = P(U j > U0,U j > U1, ...,U j > Um )
= P(v(Xj) +  j > v(X0) + 0, v(Xj) +  j > v(X1) + 1, ..., v(Xj) +  j > v(Xm) + m)
= P(0 < v(X j ) − v(X0) +  j, 1 < v(X j ) − v(X1) +  j, ..., m < v(X j ) − v(Xm) +  j)

Si les termes d’erreurs sont iid avec une fonction de répartition F

Cette probabilité peut être difficile à calculer, sauf si on adopte une


loi de Gumbell
2.4 Les modèles non-ordonnés
3.4.3 Modèles à choix discrets via une approche d’utilité
Si  j suit une loi de Gumbell (0,1), aussi appelée loi des valeurs
extrêmes de type I, alors la probabilité précédente s’écrit :
exp(v(Xj))
P(y j = 1) =
k=0 exp(v(Xk))
m
On retrouve l’expression du logit multinomial ou du logit
conditionnel en faisant l’hypothèse de linéarité de la fonction v(.)
par rapport aux variables X.

Loi de Gumbell :
F() = exp(−exp(−µ( − )))
 → G(, µ)
f () = µ.exp(−µ( − )).exp(−exp(−µ( − ))
2.4 Les modèles non-ordonnés
3.4.4 L’hypothèse IIA
L’expression très simple des probabilités dans le cas du logit
multinomial vient du fait que les erreurs sont non-corrélés entre
les différents biens et ont une même variance.

Sous ces hypothèses, le logit vérifie la propriété IIA (Independance


of Irrelevant Alternatives) qui s’énonce comme suit :
Le rapport des probabilités associées au choix entre deux
modalités est indépendant des autres modalités

=> ajouter ou éliminer une tierce modalité, ou bien modifier les


caractéristiques d’une modalité déjà incluse, ne change pas le
rapport entre ces probabilités.
2.4 Les modèles non-ordonnés
3.4.4 L’hypothèse IIA
Cette hypothèse est discutable quand le logit est utilisé pour
modéliser des choix très similaires
Exemple (qui ne vérifie pas IIA) :

On suppose que les individus sont indifférents entre bus et voiture


et que s’ils choisissent de prendre le bus, ils sont indifférents entre
prendre le bus bleu et le bus rouge.

P1/123 = P2/123 + P3/123 P1/123 = 1/2

P2/123 = P3/123
=>
P2/123 = P3/123 = 1/4
P1/123 + P2/123 + P3/123 = 1
2.4 Les modèles non-ordonnés
3.4.4 L’hypothèse IIA
Si on considère seulement 2 modalités : { 1,3} ; { 1,2}
P1/12 = P2/12 = 1/2 P1/13 = P3/13 = 1/2
Ainsi :
P1/123 1/2 P1/12 1/2
= =2 = =1
P2/123 1/4 P2/12 1/2

=> Ici, l’indépendance des alternatives non


pertinentes n’est pas vérifiée. La modalité 3 a une
influence sur le choix

Cet exemple illustre la non-pertinence de la propriété IIA.

Il faudra s’assurer que l’hypothèse IIA est vérifiée avant


d’utiliser un modèle Logit.
2.4 Les modèles non-ordonnés
3.4.4 L’hypothèse IIA
Un test de la propriété IIA
-idée : si la propriété IIA est valide, inclure ou exclure des modalités
tierces ne devrait pas modifier de façon significative les paramètres
estimés. En revanche, si les paramètres sont sensiblement différents,
le rapport des probabilités dépendra des autres modalités et la
propriété sera rejetée.
- le test formel proposé est basé sur la statistique de test de
Hausman. Pour ce faire, il faut :
sous H0 : ˆ1 convergent et efficace
ˆ2
convergent mais moins précis
sous H1 : ˆ1non convergent
ˆ2
= (̂2 − ̂1)J [V (̂2) − V (̂1)]−1(̂2 − ̂1) → 2(K)
H convergent
2.4 Les modèles non-ordonnés
5. Modèles multinomiaux alternatifs
1. le logit multinomial emboîté (Nested logit)
Ce type de modèle est utilisé quand certaines modalités sont
similaires à d’autres par rapport à des facteurs inobservés.
Les modalités sont regroupées en sous-groupes tels que
l’hypothèse IIA soit valide au sein de chaque groupe.
Exemple : Supposons qu’un salarié a plusieurs choix possibles pour
se rendre à son travail : 1. voiture seul, 2. co-voiturage , 3. bus, 4.
train.
Si une modalité est éliminée, les probabilités des autres modalités
devraient augmenter (ex : si un salarié est blessé et ne peut plus
conduire alors les probabilités de co-voiturage, bus et train
augmentent). La question pertinente pour regrouper les modalités
est dans quelle proportion chaque probabilité devrait augmenter
quand une modalité est éliminée.
2.4 Les modèles non-ordonnés
5. Modèles multinomiaux alternatifs
1. le logit multinomial emboîté (Nested logit)

Ce tableau suggère une partition de l’ensemble des modalités en


deux sous-groupes :
- groupe 1 : voiture, co-voiturage.
- groupe 2 : bus, train.

IIA est vérifiée au sein des groupes mais pas entre groupes
2.4 Les modèles non-ordonnés
5. Modèles multinomiaux alternatifs
1. le logit multinomial emboîté (Nested logit)
Ces modèles peuvent être représentés par un arbre de
décision où chaque branche constitue un sous-ensemble de
modalités au sein duquel l’hypothèse IIA est respectée.
2.4 Les modèles non-ordonnés
5. Modèles multinomiaux alternatifs
1. le logit multinomial emboîté (Nested logit)

McFadden (1978, 1981) montre comment ce modèle peut être


dérivé d’un modèle de choix rationnel :
U i = Vi + εi
εi ∼ GE V
Avec cette distribution, la probabilité associée à la modalité i :
2.4 Les modèles non-ordonnés
5. Modèles multinomiaux alternatifs
1. le logit multinomial emboîté (Nested logit)

Si λ = 1 , il n’y a pas de corrélation : on retrouve l’expression


d’un logit multinomial standard.
Méthodes d’estimation :

-FIML : max. de vrais. standard avec les probabilités


précédentes.

-approche séquentielle (probabilité marginale et


conditionnelle)
2.4 Les modèles non-ordonnés
3.4.5 Modèles multinomiaux alternatifs
3.4.5.2 le probit multinomial
On suppose que les termes d’erreurs dans le modèle à utilité
aléatoire suivent une distribution normale multivariée.

Prenons le cas de 3 alternatives (1,2,3) avec des utilités indirectes


associées :
Ui j = µi j + i j ; j = 1,2,3

On suppose que les termes aléatoires (i1,i2,i3) suivent une loi


normale trivariée.
2.4 Les modèles non-ordonnés
3.4.5 Modèles multinomiaux alternatifs
3.4.5.2 le probit multinomial
P(yi1 = 1) = P(Ui1 > Ui2;Ui1 > Ui3)
= P(i2 − i1 < µi1 − µi2; i3 − i1 < µi1 − µi3)

On pose :
21 = i2 − i1; 31 = i3 − i1; µ12 = µi1 − µi2; µ13 = µi1 − µi3)

et la probabilité que l’alternative 1 soit choisie est donnée par :


P(yi1 = 1) = P(21 < µ12; 31 < µ13)
2.5 Conclusion
Il existe 3 catégories de modèles multinomiaux : ordonnés,
séquentiels et non-ordonnés. Parmi les modèles non-ordonnés, les
logits multinomiaux sont les plus utilisés et sont une extension
directe du logit binaire au cas polytomique.

Si ces logits multinomiaux sont simples à utiliser, ils posent des


problèmes de cohérence en raison de l’hypothèse peu réaliste
d’indépendance des états non pertinents (IIA).

Pour pallier cet inconvénient, d’autres modèles ont été


développés : logit emboîté et probit multinomial. Leur inconvénient
est que les techniques d’estimation sont plus complexes.

Les modèles multinomiaux possèdent une motivation intéressante


en termes d’utilité aléatoire, ce qui les rend très utiles dans les
problèmes de choix discrets.
Chapitre 3 : • Troncature versus censure
Les modèles • Le modèleTobit simple
à variable • Extensions du modèle Tobit simple (Tobit à censure multiple,
dépendante modèles de friction)

limitée • Modèles Tobit généralisés


3.1 Introduction
Ce chapitre introduit des modèles de régression dans
lesquels la variable à expliquer est continue,
mais n’est observable que sur un certain
intervalle.
Dans la mesure où on explique la valeur d’une variable
continue, une partie de la modélisation fera référence à la
régression linéaire. Et comme la variable dépendante n’est
observable que sur un certain intervalle, la probabilité de
se situer dans ce dernier devra être prise en compte, avec
des notions similaires à celles utilisés précédemment dans
les modèles qualitatifs.
Selon que les variables explicatives sont disponibles ou
non, on parle de modèles tronqués ou censurés.
3.2 Modèles censurés et tronqués
4.2.1 Troncature versus censure
On parle de troncature lorsque l’on travaille avec un sous-
échantillon de la population d’intérêt.
On a un modèle tronqué quand on n’a aucune information
sur la variable explicative et sur la variable à expliquer.

On parle de censure lorsqu’une partie de l’échantillon


représentatif de la population n’apporte qu’une information
limitée.
Dans un modèle censuré, on a une information imprécise
sur la variable à expliquer, c’est-à-dire que l’on connaît la
position de la variable à expliquer par rapport à un seuil
mais on a toutes les informations sur les variables
explicatives.
3.2 Modèles censurés et tronqués
4.2.1 Troncature versus censure
On considère un ensemble de couples {y∗i,Xi∗} tel que
E(y∗|X
i i

) = X ∗
i  . Un échantillon de taille N est constitué à
partir de ces couples, mais la variable y∗i n’est pas toujours
disponible. On observe à la place
!
y∗ si y∗
i > ci
yi = i
ci sinon
observé pour tout i, que y∗i soit
Si Xi est égal à ci ou non, on
un échantillon censuré : seule la variable dépendante n’est
observée que sur un certain intervalle.
Supposons à présent que les observations telles que y∗i ≤ ci
sont éliminées de l’échantillon. Si l’on n’observe ni y∗i ni Xi ,
dans ce cas, on parle d’échantillon tronqué.
3.2 Modèles censurés et tronqués
4.2.2 Troncature
Si l’échantillon est tronqué, on ne dispose plus que des

observations pour lesquelles y i > ci . Dans ce cas, la
probabilité d’observer y∗i est égale à la densité associée à
yi = y∗i,conditionnellement au fait que y∗i > ci :

P(yi = y∗ ∗ ∗ ∗
i |yi > ci) = f (yi |yi > ci)

On a besoin de connaître la densité f (y∗i|y∗i > ci) .

- Les lois normales tronquées


3.2 Modèles censurés et tronqués
4.2.2 Troncature
- Les lois normales tronquées
3.2 Modèles censurés et tronqués
4.2.2 Troncature
- Les lois normales tronquées
On cherche les moments de u|u > a
3.2 Modèles censurés et tronqués
4.2.2 Troncature
- Les lois normales tronquées
3.2 Modèles censurés et tronqués
4.2.2 Troncature
- Les lois normales tronquées
3.2 Modèles censurés et tronqués
4.2.2 Troncature
- Les lois normales tronquées sur des transformations linéaires
3.2 Modèles censurés et tronqués
4.2.2 Troncature
- La vraisemblance
3.3 Le modèle Tobit simple
4.3.1 Présentation du modèle
Modèle à estimer

Pour les N0 observations pour lesquelles yi = 0


P(yi = 0) = P(y∗
i ≤ 0) = P(Xi + ui ≤ 0)

Pour les N1 observations pour lesquelles yi > 0


"
4.3 Le modèle Tobit simple
2. Estimation du modèle
- Utilisation des MCO donne des estimateurs biaisés
a) MCO sur la totalité de l’échantillon
4.3 Le modèle Tobit simple
4.3.2 Estimation du modèle
- Utilisation des MCO donne des estimateurs biaisés
b) MCO sur l’échantillon restreint aux valeurs positives
On fait l’estimation sur une partie de la population, on fait donc un
tirage non aléatoire sur la variable à estimer. D’où l’apparition d’un
biais de sélection.
3.3 Le modèle Tobit simple
4.3.2 Estimation du modèle
- Le maximum de vraisemblance

Cette log-vraisemblance n’est pas globalement concave. Ainsi, il est


incorrect d’utiliser l’algorithme de Newton-Raphson.
3.3 Le modèle Tobit simple
4.3.2 Estimation du modèle
- Le maximum de vraisemblance
Deux possibilités pour effectuer l’estimation s’offre à nous :
- retenir l’algorithme BHHH
-paramétrage alternatif : Olsen (1978) a montré qu’en
paramétrant de façon différente  = /, h = 1/ , la fonction de
vraisemblance est globalement concave par rapport à (, h)
Une conséquence intéressante est alors qu’un algorithme itératif
de maximisation de la log-vrais. permettra toujours de converger
vers le maximum global. La log-vrais. d’Olsen s’écrit

On estime ĥ et ̂ avec l’algorithme de Newton-Raphson, qui


convergera en quelques itérations.
3.3 Le modèle Tobit simple
4.3.2 Estimation du modèle
- Le maximum de vraisemblance

Pour obtenir un estimateur de (, ) , il suffira de prendre


̂ 1
̂ = ̂ =
hˆ hˆ
et on a Var(̂,̂) = J.Var(̂, ĥ).J J avec J la Jacobienne

- Méthode en deux étapes : correction d’Heckman


C’est une méthode alternative pour estimer un tobit. On a vu que
(Xi)
E(yi|yi > 0) = Xi + . 
(Xi)

L’idée d’Heckman est d’introduire comm e variable explicative
l’inverse du ratio de Mills afin que les MCO sur les seules données
positives ne soient pas biaisés.
3.3 Le modèle Tobit simple
4.3.2 Estimation du modèle
- Méthode en deux étapes : correction d’Heckman
1ère étape : estimation
! du modèle qualitatif : probit

Estimation de  = / par un probit :


i i

2ème étape : régression MCO sur données positives avec


introduction de l’inverse du ratio de Mills comme variable
explicative yi = Xi + ̂i = vi
⇒ ̂, ̂
3.3 Le modèle Tobit simple
4.3.3 Effets marginaux avec le modèle Tobit
Il y a plusieurs prédictions possibles pour le Tobit selon que l’on
s’intéresse à la distribution censurée ou à celle de la variable
latente.

Une fois le modèle estimé, quelle moyenne on choisit pour les


prévisions ?
- si on pense que la censure va demeurer, (ii) est préférable à (i)
- si c’est le potentiel qui nous intéresse, (i) est mieux.
3.3 Le modèle Tobit simple
4.3.3 Effets marginaux avec le modèle Tobit
E(y∗i)
= k
xik

E(yi)
= ik
xik
3.3 Le modèle Tobit simple
Exemple : Equations des heures travaillées pour les femmes mariées
3.3 Le modèle Tobit simple
Exemple : Equations des heures travaillées pour les femmes mariées
3.4 Le modèle Tobit à deux seuils
Dans certaines applications, la variable dépendante est censurée à la
fois par le haut et par le bas.

Exemple : Sur un marché de cotation, il peut exister des limites


inférieure et supérieure aux cours, au-delà desquelles la valeur du
cours est soit égale au seuil plancher, soit plafonnée.

Le modèle général avec double censure s’écrit :


3.4 Le modèle Tobit à deux seuils
Les contributions à la vraisemblance et vraisemblance
3.4 Le modèle Tobit à deux seuils
3.5 Modèles Tobit généralisés
4.5.1 Présentation du modèle (Tobit type 2)
Exemple 1 : Décision d’achat d’un bien durable
Dans le Tobit simple, on suppose que la décision d’achat et le
montant de la dépense sont déterminées simultanément

Dans le Tobit de type 2, la décision d’achat et le montant de la


dépense peuvent avoir des déterminants différents
3.5 Modèles Tobit généralisés
4.5.1 Présentation du modèle (Tobit type 2)
Exemple 2 : Recherche d’emploi

Salaire offert : Wio = X2i2 + u2i


Salaire souhaité : Wir = Zi + vi
3.5 Modèles Tobit généralisés
4.5.2 La vraisemblance (Tobit type 2)

Pour éliminer l’intégrale, on utilise les propriétés reliées à la loi


normale conjointe.
3.5 Modèles Tobit généralisés
4.5.2 La vraisemblance (Tobit type 2)
3.5 Modèles Tobit généralisés
4.5.2 La vraisemblance (Tobit type 2)
3.5 Modèles Tobit généralisés
4.5.3 Estimation du modèle
- Le maximum de vraisemblance

Pour un  donné et en faisant le changement de variable


1 = 1/1, 2 = 2/2, h1 = 1/1 , la vraisemblance est globalement
concave en (1, 2,h1). Une procédure de balayage de  ∈ [−1, 1] est
donc recommandable.

On détermine le  qui maximise la log-vraisemblance

- La méthode en deux étapes d’Heckman


Si on restreint notre échantillon aux données telles que y∗
2i|y∗
1i ≥0 ,
l’estimation par MCO sera biaisée.
3.5 Modèles Tobit généralisés
4.5.3 Estimation du modèle
- La méthode en deux étapes d’Heckman

1ère étape : estimation du modèle qualitatif : probit


!

Estimation de 1 = 1/1 par un probit :


i

1
2ème étape : régression MCO sur les données positives y2i avec
l’introduction de l’inverse du ratio de Mills comme variable
explicative 12
y2i = X2i2 + ̂ + v
1i i
1
3.5 Modèles Tobit généralisés
4.5.3 Estimation du modèle
- La méthode en deux étapes d’Heckman

=> problème d’hétéroscédasticité

=> mieux vaut faire des MCG que des MCO sur la régression de
deuxième étape (ou correction de White)

You might also like