Professional Documents
Culture Documents
Référence : Martine Osbonne and Ariel Rubinsten MIT Press : A course in Game theory
Définition : soit Ω = {𝜔1 ; 𝜔2 ; … ; 𝜔𝑛 } l’ensemble des états de la nature. Deux cas possibles :
1. On dit que l’on est en univers certain si Ω est un ensemble fini (la liste de tous les états de
la nature est finie) et si Ω est probabilisable c’est à dire qu’il est possible d’affecter une
probabilité à chaque état de la nature et ∑𝒌𝒊=𝟏 𝒑𝒌 = 𝟏.
2. On dit que l’on est en univers incertain si soit Ω n’est pas fini ou bien Ω n’est pas
probabilisable ou bien les deux.
Application : un modèle en absence d’incertitude et choix rationnels
2
Autrement dit, à chaque conséquence possible d’une action est associé un gain qu’on appelle
« payoff ». La fonction de gain (gain function) s’écrit :
𝑨⟶𝑪
𝒈∶ {
𝒂 ⟶ 𝒈(𝒂) = 𝒄
Comme on a une relation de préférence, on peut classer les préférences entre elles et, par exemple,
les mettre dans ℝ :
𝑪⟶ℝ
𝒖∶ {
𝒄 ⟶ 𝒖(𝒄) = 𝒖
On dit alors que 𝑐1 ≿𝑖 𝑐2 ⟷ 𝑢𝑖 (𝑐1 ) ≥ 𝑢𝑖 (𝑐2 ). Si 𝑢𝑖 (𝑔(𝑎1 )) ≥ 𝑢𝑖 (𝑔(𝑎2 )) alors 𝑎1 est solution du
problème 𝑀𝑎𝑥𝑎∈𝐴 𝑢(𝑎)
On dit alors que 𝑒𝑢1 ≿𝑖 𝑒𝑢2 ⟷ 𝐸𝑢(𝑔(𝜔 , 𝑎1 )) ≥ 𝐸𝑢(𝑔(𝜔 , 𝑎2 )). Dans ce cas, 𝑒𝑢1 est solution du
problème 𝑀𝑎𝑥𝑎∈𝐴 𝐸𝑢(𝑔(𝜔, 𝑎))
3
CHAPITRE 2 : EQUILIBRE DE NASH
Exemple : 𝐴1 = {𝑎, 𝑏}, 𝐴2 = {𝑐, 𝑑}, 𝐶 = {(𝑎, 𝑐), (𝑎, 𝑑), (𝑏, 𝑐), (𝑏, 𝑑)}
Définition : Un jeu dont l’ensemble des actions est fini s’appelle un jeu stratégique fini.
Remarque : La définition 2 est très large et un très grand nombre d’exemple correspondent à ce type de
jeu. Les joueurs peuvent être des individus ou des groupes d’individus (un syndicat joue contre un
patronat), un gouvernement, tout organisme vivant (fleurs, plantes, arbres, animal).
Remarque : Il n’y a pas de restrictions sur l’ensemble 𝐴𝑖 .
Remarque : Chaque joueurs apprécient une issue de jeu suivant ses propres préférences.
Remarque : Quelques fois l’ensemble des conséquences possibles d’un jeu est confondu avec
l’ensemble des actions des joueurs. Dans ce cas les préférences sont sur 𝐴 et non sur 𝐶.
𝐴→𝐶
𝑔={
𝑎 → 𝑔(𝑎) = 𝑐; 𝑐 ∈ ℝ
Une relation de préférence est définie sur 𝐶 pour chaque joueur 𝑖 ∈ 𝑁: 𝒂 ≽𝒊 𝒃 ↔ 𝒈(𝒂) ≥ 𝒈(𝒃).
D’autres situations sont risquées :
- 𝐶 ensemble des conséquences
- 𝐴 ensemble des actions
- Ω ensembles des états de la nature
4
𝐴×Ω →𝐶
𝑔={
(𝑎, 𝑤) → 𝑔(𝑎, 𝑤) = 𝑐
L’ensemble des actions induit une loterie sur 𝐶. Les préférences de 𝑖 sont alors spécifiées sur l’ensemble
des loteries : (𝒂, 𝒘) ≽𝒊 (𝒃, 𝒘) ↔ 𝒈(𝒂, 𝒘) ≥ 𝒈(𝒃, 𝒘).
Notation : Les primitives d’un jeu stratégique sont les suivantes 𝐺 =< 𝑁, 𝐴, ≽𝑖 >.
On peut représenter un jeu sous forme matricielle ou « forme normale ».
𝑁 = {1,2} est l’ensemble des joueurs.
𝐴1 = {𝑇𝑜𝑝, 𝐵𝑜𝑡𝑡𝑜𝑚} 𝐴2 = {𝐿𝑒𝑓𝑡, 𝑅𝑖𝑔ℎ𝑡}
A. Commentaires et interprétations
Un jeu stratégiques est un modèle caractérisant une situation où :
- Une décision est prise une fois pour toutes.
- Chaque joueur connaît les détails du jeu.
- Chaque joueur est rationnel (il ne fait pas en permanence le contraire de ce qu’il souhaite).
- Les actions sont choisies simultanément et indépendamment des autres joueurs.
On peut jouer plusieurs fois consécutives à un même jeu. Si les actions jouées dans le passé influencent
celles qui sont choisies dans le présent, on parle de jeu répété.
B. Equilibre de Nash
Définition : Un équilibre de Nash d’un jeu est un état stationnaire du jeu pour lequel aucun joueur n’a
intérêt à dévier sachant que chaque joueurs formule les bonnes anticipations sur le comportement des
autres et que chaque joueur est rationnel est comprend le jeu de la même manière que les autres.
La procédure avec laquelle l’équilibre est atteint n’est pas étudiée.
Définition : On appelle équilibre de Nash de 𝑮 =< 𝑵, 𝑨, ≽𝒊 > un profil d’actions 𝑎∗ ∈ 𝐴 ayant la
propriété suivante : ∀𝑖 ∈ 𝑁, (𝑎−𝑖 ∗ , 𝑎𝑖 ∗ ) ≽𝑖 (𝑎−𝑖 ∗ , 𝑎𝑖 ) avec 𝑎𝑖 ∈ 𝐴𝑖 . 𝒂∗ = (𝒂−𝒊 ∗ , 𝒂𝒊 ∗ ) est appelé un
équilibre de Nash.
Etant donné la meilleure réponse des autres joueurs, chaque joueur calcule sa meilleure réponse. Ainsi,
personne n’à intérêt à dévier.
On peut reformuler dans certains cas, le concept d’équilibre de Nash comme suit ∀𝑎−𝑖 ∈ 𝐴−𝑖 on définit
𝑩𝒊 (𝒂−𝒊 ) la best set of action pour 𝑖 ∈ 𝑁 étant données les actions des autres.
𝑩𝒊 (𝒂−𝒊 ) = {𝒂𝒊 ∈ 𝑨𝒊 ; (𝒂−𝒊 , 𝒂𝒊 ) ≥ (𝒂−𝒊 , 𝒂′ 𝒊 )𝒂𝒊 ∈ 𝑨𝒊 }
𝐵𝑖 est l’ensemble des meilleures réponses du joueur 𝑖 aux actions des autres joueurs.
Définition : Un équilibre de Nash est une suite d’actions 𝑎∗ /𝑎∗ ∈ 𝐵𝑖 (𝑎−𝑖 ∗ )∀𝑖 ∈ 𝑁.
5
III. Exemple
• 𝑁 = {1,2} est l’ensemble des 2 joueurs. Par exemple 1 est celui qui préfère Bach et 2 celui qui
préfère Straviusky.
• ∀𝑖 ∈ 𝑁, 𝐴1 = {𝐵1 , 𝑆1 } 𝐴2 = {𝐵2 , 𝑆2 } est un ensemble d’action fini où 𝐵𝑖 représente Bach et 𝑆𝑖
représente Straviusky ∀𝑖 ∈ 𝑁.
• Chaque joueur préfère l’un des 2 concerts et préfère être ensemble que séparés par conséquent
les préférences sont parfaitement définies sur 𝐶 = 𝑋𝑗∈𝑁 𝐴𝐽 .
𝐵2 𝑆2
𝐵1 A;B C;C
𝑆1 C;C B;A
Le joueur 1 se dit :
- si 2 joue 𝐵2 alors 1 choisit 𝐵1 car 𝐴 > 𝐶 : (𝐵1 , 𝐵2 )
- Si 2 joue 𝑆2 alors 1 choisit 𝑆1 car 𝐵 > 𝐶 : (𝑆1 , 𝑆2 )
Le joueur 2 raisonne comme suit :
- si 1 joue 𝐵1 alors 2 choisit 𝐵2 car 𝐵 > 𝐶 : (𝐵1 , 𝐵2 )
- si 1 joue 𝑆1 alors 2 choisit 𝑆2 car 𝐴 > 𝐶 : (𝑆1 , 𝑆2 )
Interprétez économiquement.
Il y a 2 équilibres de Nash symétriques. On ne peut pas les choisir ou encore on ne sait pas lequel sera
joué. Chaque équilibre de Nash est un état stationnaire du jeu.
B. Un jeu de coordination
On reprend la même situation mais les payoffs changent. Si les 2 joueurs vont ensemble à Bach chacun à
A. Si les 2 joueurs vont ensemble à Straviusky chacun à B. Sinon C chacun. 𝐴 > 𝐵 > 𝐶.
Montrez qu’il s’agit d’un jeu stratégique fini.
La situation proposée dans l’exercice correspond à un jeu stratégique 𝐺 =< 𝑁, 𝐴, ≽𝑖 > où
𝐵2 𝑆2
𝐵1 A;A C;C
𝑆1 C;C B;B
Interprétez économiquement.
Il y a 2 équilibres de Nash mais 𝐷𝑖 ≽𝑖 𝑆𝑖 donc on peut penser que (𝐵1 , 𝐵2 ) est un équilibre dominant
l’équilibre (𝑆1 , 𝑆2 ) : c’est pourquoi on parle de coordination.
C. Head and Take
Deux joueurs jouent à pile ou face. Si les 2 jets de la pièce donne le même côté, le J1 remporte A et le J2
paye A à 1. Si le jet de la pièce donne 2 côtés différents, le J2 remporte A et le J1 paye A à 2.
Montrez qu’il s’agit d’un jeu stratégique fini.
La situation proposée dans l’exercice correspond à un jeu stratégique 𝐺 =< 𝑁, 𝐴, ≽𝑖 > où
𝑃2 𝐹2
𝑃1 A ; -A -A ; A
𝐹1 -A ; A A ; -A
7
Quel est l’ensemble des équilibres de Nash ?
Le joueur 1 se dit :
- si 2 joue 𝑃2 alors 1 choisit 𝑃1 car 𝐴 > −𝐴 : (𝑃2 , 𝑃1 )
- Si 2 joue 𝐹2 alors 1 choisit 𝐹1 car 𝐴 > −𝐴: (𝐹2 , 𝐹1 )
Le joueur 2 raisonne comme suit :
F2
- si 1 joue 𝑃1 alors 2 choisit 𝑃2 car 𝐴 > −𝐴 : (𝑃1 , 𝑃2 )
- si 1 joue 𝐹1 alors 2 choisit 𝐹2 car 𝐴 > −𝐴 : (𝐹1 , 𝐹2 )
P2
Ainsi, 𝑁𝑝 = {(𝑃1 , 𝑃2 ), (𝐹1 , 𝐹2 )} Il n’y a pas d’équilibre de NASH
Interprétez économiquement.
Il n’y a pas d’équilibre de Nash en stratégies pures. Aucun état stationnaire du jeu n’est préféré par les 2
joueurs en même temps à un autre état stationnaire. Nous sommes dans un jeu à somme nulle.
D. Le dilemme du prisonnier
2 suspects d’un crime sont placés dans 2 cellules différentes sans aucun moyen de communication entre
eux. La police fait l’offre suivante : si 𝑖 dénonce 𝑗, 𝑖 reçoit 𝐴 et 𝑗 reçoit D. Si les 2 se dénoncent chacun
reçoit C. Si aucun ne dénonce l’autre chacun reçoit B. 𝐴 > 𝐵 > 𝐶 > 𝐷.
Montrez qu’il s’agit d’un jeu stratégique fini.
La situation proposée dans l’exercice correspond à un jeu stratégique 𝐺 =< 𝑁, 𝐴, ≽𝑖 > où
𝐷2 𝐶2
𝐷1 C;C A;D
𝐶1 D;A B;B
Interprétez économiquement.
8
Il y a un équilibre de Nash mais il correspond au pire socialement. En effet, (𝐶1 , 𝐶2 ) donne un meilleur
payoff à chaque joueur car 𝐵 > 𝐶 mais ce n’est pas un équilibre et donc cette stratégie n’est jamais
jouée. Cet équilibre (𝐷1 , 𝐷2 ) est Pareto détériorant. Il ne faut pas confondre équilibre et efficacité.
E. Faucon/Colombe
2 animaux se battent dans un pré pour une proie. Chaque animal peut-être soit Faucon (agressif) soit
Colombe (non agressif). Si les 2 sont Colombe ils ont B chacun. Si les 2 sont Faucon, ils ont D chacun.
Sinon celui qui est Faucon reçoit A et l’autre C.
Montrez qu’il s’agit d’un jeu stratégique fini.
La situation proposée dans l’exercice correspond à un jeu stratégique 𝐺 =< 𝑁, 𝐴, ≽𝑖 > où
𝐹2 𝐶2
𝐹1 D;D A;C
𝐶1 C;A B;B
Interprétez économiquement.
Il y a 2 équilibres de Nash en stratégies pures avec à chaque fois un faucon et un colombe. Il y a donc
agression et non-agression à l’équilibre. L’équilibre est dans les diagonales opposées et on ne sait pas
comment les animaux vont à l’équilibre.
IV. Conclusion
Il peut ne pas y avoir d’équilibres, ou bien un unique équilibre ou bien plusieurs.
Un équilibre est un état stationnaire pour lequel personne n’a intérêt à dévier.
Un équilibre n’est pas synonyme de Pareto-efficacité (dilemme du prisonnier c’est le pire qui sort).
9
Objet : Etudier les conditions pour lesquelles l’ensemble des équilibres de Nash est non vide.
Intérêt : Savoir à l’avance si le jeu vérifie les conditions d’existence, alors on peut calculer l’équilibre. On
peut étudier les propriétés de l’équilibre.
Pour montrer qu’un équilibre existe, il faut définir les conditions pour lesquelles on a
𝒂∗ /𝒂∗ ∈ 𝑩𝒊 (−𝒂∗ ) ∀𝒊 ∈ 𝑵
∈ fait référence au Théorème du point fixe généralisé au cas des correspondances (différent des
fonctions).
Rappel : 𝒙∗ est appelé point fixe si 𝑓 définie continue sur 𝐼, 𝒙 ∈ 𝑰; 𝒇(𝒙∗ ) = 𝒙∗ .
Définition : Une correspondance est définie par le fait qu’une abscisse peut avoir plusieurs ordonnées.
𝑨→𝑨
𝑩: {𝒂 → 𝑩(𝒂) = 𝒙
𝒋∈𝑵 𝑩𝒋 ()
Définition : On appelle jeu à somme nulle tout jeu concurrentiel dont la somme des payoffs est
constante.
Définition : Un jeu 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > 𝐴𝑖 fini est un jeu à somme nulle s’il est concurrentiel et si la
somme des payoffs est constante.
Exemple : Un duopole se partage un marché donc la somme des parts de marché est égale à 100%.
B1 B2
A1 80 ; 20 50 ; 50
A2 30 ; 70 40 ; 60
Chaque joueur adopte une stratégie prudente : Le joueur 1 se dit
- Si je joue A1 alors J2 me punit en jouant B2 car 50 < 80.
- Si je joue A2 alors J2 me punit en jouant B1 car 30 < 40.
10
𝑀𝑖𝑛𝐵∈𝐴2 𝑢1 (𝐴1; 𝐵) = 𝐵2 → 𝑢1 (𝐴1; 𝐵2) = 50
𝑀𝑖𝑛𝐵∈𝐴2 𝑢1 (𝐴2; 𝐵) = 𝐵1 → 𝑢1 (𝐴2; 𝐵1) = 30
𝑀𝑎𝑥𝐴∈𝐴1 𝑀𝑖𝑛𝐵∈𝐴2 𝑢1 (𝐴1; 𝐵) = 𝐴1
Le joueur 2 se dit :
- Si je joue B1 alors J1 me punit en jouant A1 car 20 < 70.
- Si je joue B2 alors J1 me punit en jouant A1 car 50 < 60.
𝑀𝑖𝑛𝐴∈𝐴1 𝑢2 (𝐴; 𝐵1) = 𝐴1 → 𝑢2 (𝐴1; 𝐵1) = 20
𝑀𝑖𝑛𝐴∈𝐴1 𝑢2 (𝐴; 𝐵2) = 𝐴1 → 𝑢2 (𝐴1; 𝐵2) = 50
𝑀𝑎𝑥𝐵∈𝐴2 𝑀𝑖𝑛𝐴∈𝐴1 𝑢2 (𝐴1; 𝐵) = 𝐵2
Définition : Soit 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > un jeu à somme nulle. L’action 𝒙∗ ∈ 𝑨𝟏 est un maximiniseur pour
le joueur 1 si :
𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙∗ ; 𝒚) ≥ 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) ∀𝒙 ∈ 𝑨𝟏
Le joueur 𝑖 choisit l’action qui lui procure le plus grand des gains minima.
Vocabulaire : Un maximiniseur pour le joueur 𝑖 ∈ 𝑁 est appelé une stratégie prudente.
Remarque : Une stratégie prudente garantie à chaque joueur le plus grand gain possible.
𝑀𝑎𝑥𝑥∈𝐴1 𝑀𝑖𝑛𝑦∈𝐴2 𝑢1 (𝑥; 𝑦) stratégie prudente pour le joueur 1.
• 𝑦 ∈ 𝐴2 est solution du problème 𝑀𝑎𝑥𝑦∈𝐴2 𝑀𝑖𝑛𝑥∈𝐴1 𝑢2 (𝑥; 𝑦) ↔ il est aussi solution du problème
𝑀𝑖𝑛𝑦∈𝐴2 𝑀𝑎𝑥𝑥∈𝐴1 𝑢1 (𝑥; 𝑦)
11
Preuve : 𝒖𝟏 = −𝒖𝟐 donc 𝑀𝑎𝑥 𝑢1 ↔ 𝑀𝑖𝑛 𝑢2
Proposition : Soit 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > un jeu à somme nulle.
a) Si (𝒙∗ , 𝒚∗ ) est un équilibre 𝑵𝒑 de 𝐺 alors 𝑥 ∗ est solution du problème de
𝑀𝑎𝑥𝑥∈𝐴1 𝑀𝑖𝑛𝑦∈𝐴2 𝑢1 (𝑥; 𝑦) et 𝑦 ∗ est solution du problème de 𝑀𝑖𝑛𝑥∈𝐴1 𝑀𝑎𝑥𝑦∈𝐴2 𝑢2 (𝑥; 𝑦). NB :
C’est une implication pas une équivalence.
c) Si 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) = 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚) alors 𝑥 ∗ est un maximiniseur pour 1
et 𝑦 ∗ est un maximiniseur pour 2 et (𝒙∗ , 𝒚∗ ) est un équilibre de Nash en stratégie pure.
Preuve : Regarder sur le livre A course in game theory – Martin Osborne & Ariel (proposition 2.2)
Vocabulaire : Si 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) = 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚) alors le gain correspondant
(équilibre du jeu) s’appelle la valeur du jeu.
NB : En général dans un jeu concurrentiel, les stratégies d’équilibre ont ces propriétés. Si le jeu n’est pas
concurrentiel alors elles n’ont pas ces propriétés. Exception : Le dilemme du prisonnier qui n’est pas un
jeu concurrentiel a ces propriétés.
A. Définitions
On utilise les jeux bayésiens pour modéliser des situations où certains joueurs sont incertains sur les
caractéristiques des autres joueurs. Pour cela, on conserve les primitives 𝑁, 𝐴𝑖 et on ajoute 𝛀 (fini) un
ensemble d’état de la nature, des probabilités a priori sur Ω (ce sont des données). A chaque 𝑤 ∈ Ω on
associe une probabilité 𝒑(𝒘) a priori. On ajoute une fonction de signal 𝝉𝒊 (𝒘).
𝑇𝑖 l’ensemble des types possibles, 𝑡𝑖 ∈ 𝑇𝑖 est un type possible.
12
𝛀 → 𝑻𝒊
• ∀𝑖 ∈ 𝑁; 𝝉𝒊 : {
𝒘 → 𝝉𝒊 (𝒘) = 𝒕𝒊
• ∀𝑖 ∈ 𝑁 une croyance à priori 𝑤 𝒑(𝒘) = 𝒑[𝝉𝒊 −𝟏 (𝒕𝒊 ) ] > 𝟎 ∀𝑡𝑖 ∈ 𝑇𝑖
• ≽𝒊 une relation de préférences définie sur 𝐴 × Ω, 𝐴 = 𝑋𝑗∈𝑁 𝐴𝑗
13
Le jeu a donc un gagnant car le joueur 1 remporte l’objet.
CHAPITRE 3 :
I. Introduction
Dans les 2 chapitres précédents, les jeux étaient en univers déterministe pour les jeux stratégiques,
concurrentiels ou à somme nulle. Dans ce chapitre, on étudie 2 types de jeux où l’univers est risqué :
Objectif : Modéliser l’équilibre de jeux où les choix des joueurs dépendent de probabilités exogènes.
Pour cela il faut rajouter une primitive du jeu stratégique. Dans ce cas, les joueurs calculent les espérances
d’utilité.
Soit 𝛿 ∈ ∆𝑋 une probabilité sur l’espace 𝑋 avec ∆𝑋 l’ensemble des distributions sur 𝑋.
Définition : On appelle équilibre de Nash en stratégie mixte la probabilité de non déviation de jouer 𝑎𝑖 . C’est
donc un profil de probabilité.
14
∏ 𝛼𝑗 (𝑎𝑖 )
𝑗∈𝑁
Définition : Extension mixte d’un jeu stratégique fini. Soit 𝐺 =< 𝑁, 𝐴𝑖 , ≽𝑖 > un jeu stratégique fini. L’extension
de 𝐺 est un jeu 𝑮 =< 𝑵, ∆𝑨𝒊 , 𝑼𝒊 > où ∆𝐴𝑖 est l’ensemble des distributions de probabilité sur 𝐴𝑖 et 𝑈𝑖 est
l’espérance d’utilité du jeu
𝑿𝒋∈𝑵 ∆𝑨𝒋 → ℝ
𝑼𝒊 : { = [∑ ∏ 𝜶𝒋 (𝒂𝒊 )] 𝒖(𝒂𝒊 )
𝜶 → 𝑼𝒊 (𝜶)
𝒂∈𝑨 𝒋∈𝑵
Si 𝐴𝑖 est fini
Définition : Un équilibre de Nash en stratégie mixte d’un jeu stratégique est un équilibre de Nash du jeu étendu
aux stratégies mixtes.
𝑏1 𝜷 𝑏2 𝟏 − 𝜷
𝑎1 𝜶 A;B C;C
𝑎2 𝟏 − 𝜶 C;C B;A
15
𝜕𝐸𝑈1
= 0 ↔ 𝛽𝐴 + (1 − 𝛽)𝐶 − 𝛽𝐶 − (1 − 𝛽)𝐵 = 0
𝜕𝛼
𝜕𝐸𝑈2
= 0 ↔ 𝛼𝐵 − 𝛼𝐶 + (1 − 𝛼)𝐶 − (1 − 𝛼)𝐴 = 0
{ 𝜕𝛽
𝛽[𝐴 − 𝐶 − 𝐶 + 𝐵] + 𝐶 − 𝐵 = 0
{
𝛼[𝐵 − 𝐶 − 𝐶 + 𝐴] + 𝐶 − 𝐴 = 0
𝑩−𝑪 𝟏
𝜷∗ = =
𝑨𝑪 + 𝑩 − 𝑪 𝑨 − 𝑪 + 𝟏
𝑩−𝑪
𝟏
𝜶∗ =
𝑩−𝑪
𝑨−𝑪+𝟏
Interprétations :
𝐷2 𝜷 𝐶2 𝟏 − 𝜷
𝐷1 𝜶 C;C A;D
𝐶1 𝟏 − 𝜶 D;A B;B
Supposons que 1 envoie un message « Je coopère ». 2 en profite, s’il croit au message il ne coopère pas car 𝐴 > 𝐵
et s’il ne croit pas au message, il ne coopère pas non plus car 𝐶 > 𝐷. Donc 2 ne coopère jamais donc 1 non plus
car le jeu est symétrique.
𝜕𝐸𝑈1
= 0 ↔ 𝛽𝐶 + (1 − 𝛽)𝐴 − 𝛽𝐷 − (1 − 𝛽)𝐵 = 0
𝜕𝛼
𝜕𝐸𝑈2
= 0 ↔ 𝛼𝐶 − 𝛼𝐷 + (1 − 𝛼)𝐴 − (1 − 𝛼)𝐵 = 0
{ 𝜕𝛽
𝛽[𝐶 − 𝐴 − 𝐷 + 𝐵] + 𝐴 − 𝐵 = 0
{
𝛼[𝐶 − 𝐷 − 𝐴 + 𝐵] + 𝐴 − 𝐵 = 0
16
𝑩−𝑨 𝟏
𝛽[𝐶 − 𝐴 − 𝐷 + 𝐵] = 𝐵 − 𝐴 ↔ 𝜶 = 𝜷 = = >𝟏
𝑩−𝑨+𝑪−𝑫 𝟏+𝑪−𝑫
𝑩−𝑨
Attention : L’équilibre en stratégie mixte est des probabilités pas des actions !
Remarque : Aucun joueur n’a choisit d’introduire de l’aléatoire dans son comportement.
Exemple : Equilibre du prisonnier avec la Main Tremblante de John Harsaniy et Rainard Seten
𝛿 = (1 − 𝜀)𝑝𝑛 + 𝜀𝑞
𝛿 = 1 − 𝜀 + 𝜀𝑞
Choisissons 𝑞 = 0
𝐷2 𝟏 − 𝜺 𝐶2 𝜺
𝐷1 C;C A;D
𝐶1 D;A B;B
1 suppose que 2 joue 𝐷2 avec 1 − 𝜀 et 𝐶2 avec 𝜀 chance. Il compare EPayoff : 𝐸𝑃[𝐷1 ] avec 𝐸𝑃[𝐶1 ].
𝐸𝑃[𝐷1 ] ≤ 𝐸𝑃[𝐶1 ]
(1 − 𝜀)(𝐶 − 𝐷) + 𝜀(𝐴 − 𝐵) > 0
17
Il n’y a pas d’𝜀 ∈ [0,1] tel que 𝐸𝑃[𝐶1 ] ≥ 𝐸𝑃[𝐷1 ]. L’équilibre de Nash est stable.
Définition : Un équilibre de Nash en stratégies mixtes d’un jeu stratégique 𝐺 =< 𝑁, ∆𝐴, 𝑈𝑖 > est un profil 𝜶∗ de
stratégies mixtes ayant la propriété que ∀𝑖 ∈ 𝑁 chaque action sur le support de probabilité 𝛼𝑖 ∗ est une meilleure
réponse à 𝛼−𝑖 ∗ .
N équilibre de Nash en stratégies mixtes est un n-uplet (s’il y a 𝑛 joueurs) de probabilités de non déviation.
Chaque probabilité peut s’interpréter comme une croyance. Un équilibre de Nash en stratégies mixtes représente
un état stationnaire du jeu.
On a étudié le cas où l’action d’un joueur dépend d’un signal privé qu’il reçoit de la nature. Ce signal est privé et
indépendant. (Jeu bayésien)
𝐵2 𝑆2
𝐵1 2;1 0;0
𝑆1 0;0 1;2
1
On suppose qu’une variable aléatoire a une probabilité 2 d’apparaître.
Existe-il un équilibre ? L’espérance de payoffs (EP) dans ce jeu est-elle supérieure à l’espérance de payoffs de
l’équilibre de Nash en stratégies mixtes ?
2 1
𝛼∗ = 𝑒𝑡 𝛽 ∗ =
3 3
2 1 1 2 4
𝐸𝑈1 = × (2) + 0 + 0 + × × 1 =
3 3 3 3 9
2 1 1 2 2
𝐸𝑈2 = × (1) + × × 2 =
3 3 3 3 9
18
Si 𝑥 sort alors 𝑖 choisit 𝐵𝑖 alors que 𝑦 sort, i choisit 𝑆𝑖 : 𝑖 = 1,2
4 2 2
𝐸𝑈𝑖 = + =
9 9 3
2 1 3
𝐸𝑈𝑖 = + =
2 2 2
𝐵2 𝑆2
𝐵1 x;z x ; x, y
𝑆1 y, z ; z y, z ; x, y
C. Formalisme
1 1 1
L’ensemble des états de la nature 𝛀 = {𝒙, 𝒚, 𝒛}. La probabilité associée est 𝑃 = {3 ; 3 ; 3}.
L’ensemble d’information du joueur i représente une partition de l’ensemble des états de la nature
Une stratégie est un choix d’action conditionnel à la réalisation d’une variable aléatoire.
Un équilibre est optimal pour un joueur s’il n’a pas intérêt à choisir une autre action étant donné les choix des
autres joueurs.
Définition : On appelle équilibre corrélé d’un jeu stratégique 𝐺 =< 𝑁, 𝐴𝑖 , 𝑈𝑖 > consiste en :
▪ Un espace de probabilité finie (𝛀; 𝝅) avec Ω l’ensemble des états de la nature et 𝜋 la probabilité
associée à chaque élément de Ω.
▪ ∀𝑖 ∈ 𝑁, une partition 𝑷𝒊 de Ω appelée ensemble d’information du joueur 𝑖
𝛀 → 𝑨𝒊
▪ ∀𝑖 ∈ 𝑁, une stratégie 𝝈𝒊 : {
𝝎 → 𝝈𝒊 (𝝎) = 𝒂𝒊
𝜔 ∈ 𝑃𝑖
Si { alors 𝜎𝑖 (𝜔) = 𝜎𝑖 (𝜔′) = 𝑎𝑖
𝜔′ ∈ 𝑃𝑖
19
Telle que ∀𝑖 ∈ 𝑁 un signal 𝝉𝒊 (𝝎) :
𝛀 → 𝑨𝒊
𝝉𝒊 : {
𝝎 → 𝝉𝒊 (𝝎) = 𝒂𝒊
𝜏𝑖 (𝜔) = 𝜏𝑖 (𝜔′) si 𝜔 ∈ 𝑃𝑖 et 𝜔′ ∈ 𝑃𝑖
Remarque : Etant donné Ω l’espace des probabilités et 𝜋 la partition d’information sont endogènes.
Remarque : La condition d’optimalité de la définition signifie que ∀𝜔 qui apparaît avec une probabilité positive
(> 0) 𝜎𝑖 (𝜔) est une action optimale pour 𝑖 étant données les stratégies des autres et l’information de 𝑖 sur 𝜔.
Proposition : N’importe quel équilibre de Nash en stratégie mixte d’un jeu stratégique fini 𝐺 =< 𝑁, 𝐴𝑖 , 𝑈𝑖 >
possède un équilibre corrélé < (Ω, 𝜋), 𝑃𝑖 , 𝐺𝑖 > dans lequel ∀𝑖 ∈ 𝑁 la distribution sur 𝐴𝑖 induite par 𝜎𝑖 est 𝛼𝑖 .
Joueur 2
𝑩𝟐 𝑺𝟐
𝑩𝟏 (2 ; 1) (0 ; 0)
Joueur 1
𝑺𝟏 (0 ; 0) (1 ; 2)
2 1
𝑁𝑚 = { ; }
3 3
2
𝐸𝑈𝑚 =
3
𝑁𝑝 = {(𝑎1 ; 𝑏1 ) ; (𝑎2 ; 𝑏2 )}
Exemple :
20
Joueur 2
𝑳 R
T (6 ; 6) (2 ; 7) 𝛼
Joueur 1
B (7 ; 2) (0 ; 0) 1−𝛼
𝛽 1−𝛽
Ω = {𝑥 , 𝑦 , 𝑧}
1
Π(𝑥) = Π(𝑦) = Π(𝑧) =
3
Le joueur 𝑖 = 1 a pour partition : {{𝑥}{𝑦 ; 𝑧}}
4 14 3 × 4 12 + 42 − 12 42 14
𝐸𝑈𝑖 = + − = = =
3 3 9 9 9 3
Les équilibres de Nash de ce jeu en stratégies pures 𝑁𝑝 = {(𝐵 ; 𝐿) ; (𝑇 ; 𝑅)} apparaissent chacun avec une
probabilité de 2/9.
𝜎1 (𝑥) = 𝐵
𝜎1 (𝑦) = 𝜎1 (𝑧) = 𝑇
𝜎2 (𝑥) = 𝜎2 (𝑦) = 𝐿
𝜎2 (𝑧) = 𝑅
1 1 1 15 14
𝐸𝑈𝐶 = (6) + (2) + (7) = >
3 3 3 3 3
Les deux joueurs sont donc d’accord pour tirer au sort plutôt que de jouer en stratégies mixtes.
21
Proposition : soit un jeu stratégique 𝐺 = 〈𝑁 ; 𝐴𝑖 ; 𝑢𝑖 〉. Toute combinaison convexe de profil de payoffs
d’équilibre de 𝐺 est un profil de payoffs d’équilibre corrélé de 𝐺.
Proposition : soit un jeu stratégique fini 𝐺 = 〈𝑁 ; 𝐴𝑖 ; 𝑢𝑖 〉. Toute distribution de probabilité sur les résultats qui
peuvent être obtenu dans un équilibre corrélé de 𝐺 peut être obtenu dans un équilibre corrélé pour lequel :
1. L’ensemble des états de la Nature est égal à l’ensemble des actions 𝐴𝑖
2. ∀𝑖 ∈ ℕ, la partition d’informations de 𝑖 consiste en tous les ensembles de la forme suivante : {𝑎 ∈
𝐴𝑖 ; 𝑎𝑖 = 𝑏𝑖 } pour 𝑏𝑖 ∈ 𝐴𝑖
Ω′ = 𝐴
Π ′ (𝑎) = Π ′ [{ω ∈ Ω ; σ(ω) = a}] , ∀𝑎 ∈ 𝐴
𝑃𝑖′ = 𝑒𝑛𝑠𝑒𝑚𝑏𝑙𝑒 𝑑𝑢 𝑡𝑦𝑝𝑒 {𝑎 ∈ 𝐴 ; 𝑎𝑖 = 𝑏𝑖 }, ∀𝑏 ∈ 𝐴𝑖
𝜎𝑖′ (…)
Interprétation : si les deux joueurs s’accordent sur les probabilités exogènes de chaque état de la nature, alors il
est possible qu’un tirage au sort soit Pareto dominant par rapport à un équilibre en stratégies mixtes.
Interprétation : si les deux joueurs ne s’accordent pas sur les probabilités alors il est possible qu’un tirage au sort
ne soit pas Pareto dominant. Dans ce cas, d’autres équilibres sont possibles. Par exemple 𝑖 impose son point de
vue à 𝑗.
Les jeux évolutionnaires sont une variante de jeux stratégiques dans laquelle les joueurs sont des organismes
vivants.
Un jeu évolutionnaire est une variante de l’équilibre de Nash. Les joueurs sont des plantes, des animaux, des
hommes.
Lorsqu’un organisme rencontre un autre organisme il prend (≠ choisir) une décision c’est-à-dire il hérite d’un
mode de fonctionnement, de comportement. Chaque organisme est affecté par une mutation.
Si le joueur 𝑖 prend l’action 𝑎 cependant que toute la population a pris l’action 𝑏 avec la probabilité 𝛽 alors la
capacité de survivre de 𝑖 est mesurée par son espérance d’utilité 𝐸𝑈(𝑎 ; 𝑏) sous 𝛽.
22
Ainsi un jeu évolutionnaire se note 𝑮𝑬 = ⟨{𝟏 ; 𝟐} ; (𝑩 ; 𝑩) ; 𝒖𝒊 ⟩
𝑢1 (𝑎 ; 𝑏) = 𝑢(𝑎 ; 𝑏)
𝑢2 (𝑎 ; 𝑏) = 𝑢(𝑏 ; 𝑎)
Un équilibre évolutionnaire est une action dans 𝐵 telle que toute la population prend l’action d’équilibre et aucun
mutant ne peut survivre.
Si un mutant est accidentellement généré à l’équilibre évolutionnaire stable alors il ne peut pas dominer la
population. Un 𝑏 ≠ 𝑏 ∗ ne peut être pris que par une plus faible fraction d’organismes.
A l’équilibre, aucun mutant ne peut avoir une espérance d’utilité supérieure à celle du reste de la population. Le
mutant meurt sans envahir la population.
Le payoff moyen d’un mutant s’écrit (𝟏 − 𝜺)𝒖(𝒃 ; 𝒃∗ ) + 𝜺𝒖(𝒃 ; 𝒃) où (1 − 𝜀) est la probabilité qu’un mutant
rencontre un non mutant.
Une stratégie évolutionnairement stable (ESS) de 𝐺𝐸 est une action 𝑏 ∗ ∈ 𝐵 tel que (𝑏 ∗ ; 𝑏 ∗ ) est un équilibre de
Nash de 𝐺𝐸 . On a 𝑢(𝑏 ; 𝑏) < 𝑢(𝑏 ∗ ; 𝑏) pour tout 𝑏 ≠ 𝑏 ∗ avec 𝑏 ∈ 𝐵 et 𝑏 ∗ ∈ 𝐵 où B représente l’ensemble des
stratégies mixtes d’un quelconque ensemble d’actions.
Un jeu sous forme extensive en information parfaite (JEIP) est la description complète de la structure séquentielle
des décisions des joueurs placés en situation stratégique.
23
Dans un jeu sous forme extensive en information parfaite, les joueurs peuvent formuler différents plans d’actions
dans le temps suivant les étapes du jeu.
Pour cela, il faut modifier les primitives du jeu pour que les joueurs puissent reconsidérer leurs choix d’actions au
fur et à mesure que le jeu se déroule.
Dans ce cadre, le concept d’équilibre de Nash est insatisfaisant si on ignore la structure séquentielle des
décisions. C’est pourquoi il faut définir un concept alternatif dit d’équilibre parfait en sous jeux (EPSJ).
La différence essentielle entre le jeu statique 𝐺 et le jeu séquentiel 𝐺𝑆 est la structure séquentielle des décisions
𝐻; 𝑝(ℎ) qui est de nature à modifier le concept d’équilibre de Nash.
L’objet de l’exemple suivant est de montrer les difficultés qu’engendre le concept d’équilibre de Nash dans un jeu
séquentiel.
II. Exemple
Règles du jeu : Le joueur 1 propose un partage. Le J2 accepte et le partage a lieu, s’il refuse chaque joueur à 0.
Un nœud correspond à une histoire, il y en a 10. Chaque branche est une action, il y en a 9.
1 2 3 4 5 6 7 8
YYY YYN YNY YNN NYY NYN NNY NNN
A 2,0 (2,0) (2,0) (2,0) (2,0) (0,0) (0,0) (0,0) (0,0)
B 1,1 (1,1) (1,1) (0,0) (0,0) (1,1) (1,1) (0,0) (0,0)
C 0,2 (0,2) (0,0) (0,2) (0,0) (0,2) (0,0) (0,2) (0,0)
𝑁𝑝 = {(𝐴, 1); (𝐴, 2); (𝐴, 3); (𝐴, 4); (𝐴, 7); (𝐴, 8); (𝐵, 5); (𝐵, 6); (𝐶, 7)}
25
Il y a 9 équilibres de Nash, on ne peut pas les choisir.
III. Stratégies
Dans un jeu séquentiel (sous forme extensive avec information parfaite), la notion de stratégie correspond à un
plan d’action spécifiant l’action prise par chaque joueur après chaque histoire pour laquelle c’est son tour de
jouer 𝑃(ℎ) = 𝑖 ℎ ∈ 𝐻 ∖ 𝑍.
Définition : Une stratégie d’un joueur 𝑖 ∈ 𝑁 dans un jeu sous forme extensive avec information parfaite 𝚪 = <
𝑵, 𝑯, 𝑷, ≽𝒊 > est une fonction qui affecte une action après chaque histoire
∀ℎ ∈ 𝐻 ∖ 𝑍 / 𝑃(ℎ) = 𝑖
𝐻\𝑍 → 𝑁
𝑃: {
ℎ → 𝑃(ℎ) = 𝑖
Remarque : Une stratégie spécifie les actions à choisir par un joueur à chaque étape du jeu pour laquelle il doit
prendre une décision même pour les stratégies qui ne sont pas atteintes.
Pour chaque profil de stratégies 𝑆 = {𝛿𝑖 } 𝑖 ∈ 𝑁 : 𝑁 → ℝ, 𝑡 → 𝑂𝑡 de Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > jeux sous forme extensive
en information parfaite, on définit une fonction de résultat notée 𝑂 (outcome) (𝑎1 , … , 𝑎𝑘 ) ∈ 𝑍 𝑡𝑞 0 ≤ 𝑘 < 𝑍
26
Définition : Un équilibre de Nash en stratégies pures d’un jeu sous forme extensive en information parfaite Γ =
< 𝑁, 𝐻, 𝑃, ≽𝑖 > est un profil de stratégies vérifiant ∀𝑖 ∈ 𝑁, 𝑂(𝑆−𝑖 ∗ , 𝑆𝑖 ∗ ) ≥ 𝑂(𝑆−𝑖 ∗ , 𝑆𝑖 ) avec 𝑆𝑖 ∈ 𝐻; 𝑃(ℎ).
Il est possible de passer d’un jeu Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > à un jeu stratégique statique G = < 𝑁, 𝑆𝑖 , 𝑢𝑖 >
On restreint maintenant la notion de stratégie pour éliminer les histoires incohérentes entre elles.
Définition : On appelle stratégie réduite du joueur 𝑖 ∈ 𝑁 la fonction 𝑓𝑖 dont le domaine de définition est
l’ensemble {ℎ ∈ 𝐻; 𝑃(ℎ) = 𝑖} = 𝐷𝑓𝑖 ayant les propriétés suite :
Remarque : Un équilibre de Nash d’un jeu sous forme extensive avec information parfaite peut être restreint aux
stratégies réduites.
Définition : Soit un jeu sous forme extensive avec information parfaite Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > et G = < 𝑁, 𝑆𝑖 , ≽𝑖 ′ >
le jeu associé, ∀𝑖 ∈ 𝑁, les stratégies 𝑠𝑖 ∈ 𝑆𝑖 et 𝑠′𝑖 ∈ 𝑆𝑖 sont dites équivalentes. Si ∀𝑠−𝑖 ∈ 𝑆−𝑖 on a
(𝑆𝑖′ , 𝑆−𝑖 )~𝑖 (𝑆𝑖 , 𝑆−𝑖 ).
La forme réduite 𝚪 est un jeux stratégique 𝐆′ = < 𝑵, 𝑺𝒊 , ≽𝒊 ′′ > pour lequel ∀𝑖 ∈ 𝑁 chaque ensemble 𝑆 contient
un membre de chaque ensemble de stratégie équivalente dans 𝑆′𝑖 et ≽𝑖 ′′ est un pré-ordre de préférences défini
sur 𝑋𝑗∈𝑁 𝑆′𝑗 induite.
Exemple :
27
(𝐵, 𝐿) s’explique grâce au concept de menace. Le J2 indique au J1 que s’il joue A, il joue L et dans ce cas J1 préfère
jouer B s’il croit à la menace du J2.
Remarque : Ici, la menace du J2 n’est pas crédible car si le J1 joue A et le J2 est rationnel alors il préfère R car 1 >
0.
Y N
A : (2,0) 2,0 0,0
B : (1,1) 1,1 0,0
C : (0,2) 0,2 0,0
Si Y alors AY
S A alors AY, AN
Si B alors BY
Si C alors CY
Les paires d’actions communes sont AY et AN mais le J2 a des intérêts à dévier donc le seul équilibre de Nash en
stratégies pures réduites est BY.
Exemple :
28
Dans le sous-jeu 1, le J1 choisit 𝑚𝑎𝑥{𝑣1 , 𝑣2 } = 𝑣1 .
Entre 1 et 2, le J1 𝑚𝑎𝑥{𝑣4 ; 𝑣8 }.
𝑁 = {(𝑣8 ; 𝑤8 )}
Définition : Le sous-jeux d’un jeu sous extensive avec information parfaite Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > qui suit l’histoire ℎ
est le jeu extensif 𝚪(𝐡) =< 𝑵, 𝑯|𝒉, 𝑷|𝒉, ≽𝒊 |𝒉 > où
Remarque : L’action prescrite pour chaque joueur doit être optimale étant donnée l’action des autres joueurs ;
après chaque histoire. On note 𝑠𝑖 |ℎ la stratégie qui induit le sous-jeu Γ(h). On note le résultat 𝒐𝒊 |𝒉.
Définition : Un équilibre parfait en sous jeux d’un jeu sous forme extensive en information parfaite Γ = <
𝑁, 𝐻, 𝑃, ≽𝑖 > est un profil de stratégie tel que ∀𝑖 ∈ 𝑁, ∀ℎ ∈ 𝐻 et 𝑃(ℎ) = 𝑖 on a ∀𝑠𝑖 ∈ Γ(h)
Remarque : Un équilibre parfait en sous jeux est un profil de stratégie Γ(h) tel que ∀ℎ ∈ 𝐻 𝑠𝑖 ∗ |ℎ est un équilibre
de Nash de Γ(h).
29
Soit Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > un jeu sou forme extensive en information parfaite avec horizon fini. Un profil de
stratégies 𝑠 ∗ est un équilibre parfait en sous jeu de Γ si et seulement si ∀𝑖 ∈ 𝑁, ∀ℎ ∈ 𝐻 y compris ℎ = ∅ et
𝑃(ℎ) = 𝑖 on a ∀𝑠𝑖 ∈ Γ(h) avec 𝑠𝑖 ≠ 𝑠𝑖 ∗ |ℎ.
Chaque jeu sous forme extensive en information parfaite fini possède un équilibre parfait en sous jeu.
A. L’incertitude exogène
On étend la définition d’un jeu sous forme extensive avec information parfaite en autorisant le hasard à intervenir
dans le jeu.
▪ 𝑓𝑐 (. |ℎ) est une mesure de probabilité sur 𝐴(ℎ). Toutes les mesures de probabilités sont supposées
indépendantes.
▪ ∀𝑖 ∈ 𝑁, ≽𝒊 est défini sur une loterie sur 𝑍
B. Coups simultanés
Après l’histoire ℎ, les joueurs peuvent jouer en même temps. On modifie la définition d’un jeu sous forme
extensive en information parfaite comme suit : Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > est un jeu sous forme extensive en
information parfaite avec coups simultanés si :
Une histoire dans un tel jeu est une suite de vecteurs dont les composantes sont les actions 𝑎𝑘 prises par les
joueurs dont les coups ont été jouées après l’histoire ℎ.
30
𝐻 ∖ 𝑍 → 𝐴𝑖 (ℎ)∀𝑖 ∈ 𝑃(ℎ)
Une stratégie 𝑠𝑖 : {
ℎ → 𝑠𝑖 (ℎ)
I. Introduction
Problème : Choisir une meilleure issue possible dans un jeu où il s’agit de partager « un gâteau ».
A. Marchandage et jeux
En théorie des jeux non coopératifs, on étudie des situations conflictuelles telles que chaque joueur s’engage
dans une suite d’actions (une fois pour toute c’est à dire jeux stratégiques ou jeux sous forme extensive en
information parfaite). Toutefois, il existe des situations conflictuelles plus compliquées dans lesquelles les joueurs
marchandent. S’il y a plus qu’une suite d’actions plus avantageuses que désavantageuses ∀𝑖 ∈ 𝑁 alors une
certaine forme de négociation est nécessaire pour résoudre ce conflit.
La théorie des jeux est utile pour modéliser ce type de situation. Nash est le premier à avoir étudié ce type de jeu.
Il montre qu’elle est l’influence de la patience et de l’aversion au risque.
Soit 𝑋 l’ensemble des résultats possible. 𝑥 ∈ 𝑋 est un partage possible d’un « gâteau ». « 𝑫 = default point »
correspond à l’échec de la négociation, personne n’a quelque chose !
𝑋 = [0,1] est l’ensemble des divisions possibles du gâteau. Une telle situation se modélise par un jeu sous forme
extensive avec information parfaite dans lequel la procédure de négociation est spécifiée.
On introduit le temps dont la valeur (pour chaque joueurs) est non négative : attendre coûte. Il y a donc un taux
d’actualisation qui affecte la fonction d’utilité d’un partage 𝑥 ∈ 𝑋.
𝑡 = 0, 1e coup : J1 fait une proposition 𝑥 ∈ 𝑋 à J2. Soit J2 accepte et obtient 𝑥, soit il refuse.
NB : 𝑥 = 𝑥′ est possible.
31
Si ∅ = 𝑡 = 0, aux périodes paires J1 fait une proposition et impaires J2 fait une proposition.
Si ∅ = 𝑡 = 1, c’est l’inverse.
Si la négociation n’aboutit pas alors on considère que chaque joueur à « 𝐷 le default point »
𝚪 = < 𝑵, 𝑻, 𝑯, 𝑷, ≽𝒊 >
▪ 𝑁 = {1,2}
▪ 𝑋 = {𝑒𝑛𝑠𝑒𝑚𝑏𝑙𝑒 𝑐𝑜𝑚𝑝𝑎𝑐𝑡 𝑑𝑒𝑠 𝑎𝑐𝑐𝑜𝑟𝑑𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠}
▪ 𝑇 est l’ensemble des nombres ≥ 0
▪ 𝐻 l’ensemble des histoires
1 𝑠𝑖 ℎ 𝑖𝑚𝑝𝑎𝑖𝑟
▪ 𝑃(ℎ) = {
2 𝑠𝑖 ℎ 𝑝𝑎𝑖𝑟
▪ ≽𝑖 → 𝑍
La relation de préférence ≽𝑖 est définie sur l’ensemble des partages possibles y compris le défaut (𝑋𝑋𝑇) ∪ {𝐷}
(𝑥, 𝑡) ≽𝑖 𝐷 ∀𝑖 ∈ 𝑁 𝑒𝑡 ∀𝑥 ∈ 𝑋, 𝑡 ∈ 𝑇
32
Hypothèse 2 : Le temps a de la valeur.
(𝑥, 𝑡) ≽𝑖 (𝑥, 𝑡 + 1) ∀𝑖 ∈ 𝑁 𝑒𝑡 ∀𝑥 ∈ 𝑋, 𝑡 ∈ 𝑇
(𝑥, 0) ≽𝑖 𝐷
Si 𝑥𝑛 ∈ 𝑋 et 𝑦𝑛 ∈ 𝑁, ∀𝑛 ∈ 𝑁
𝑥𝑛 → 𝑥 ∈ 𝑋
𝑦𝑛 → 𝑦 ∈ 𝑋
(𝑥𝑛 , 𝑡) ≽𝑖 (𝑦𝑛 , 𝑠)∀𝑛 → (𝑥, 𝑡) ≽𝑖 (𝑦, 𝑠)
𝑋→ℝ
𝑢𝑖 : {
𝑥 → 𝑢𝑖 (𝑥)
𝑋×𝑇 →ℝ
𝛿 𝑡 𝑢𝑖 : { ∀𝛿 ∈ [0,1]
(𝑥, 𝑡) → 𝛿 𝑡 𝑢𝑖 (𝑥)
Ainsi
33
Remarque : Attention 𝜀 𝑡 𝑢𝑖 (𝑥) représente les mêmes préférences que 𝛿 𝑡 𝑢𝑖 (𝑥) donc si 𝜀 > 𝛿, on ne peut pas
conclure que l’un des joueurs est plus impatient que l’autre.
Remarque : si < 𝑁, 𝐻, 𝑃, ≽𝑖 > est un jeu extensif en information parfaite, alors on définit le jeu associé avec offres
alternatives < 𝑋; ≽𝑖 >. On remarque que 𝐻 n’est pas nécessaire car il n’est pas tenu compte des offres passées.
𝑥𝑖 ≥ 0
𝑋 = {(𝑥1 , 𝑥2 { 1 + 𝑥2 = 1 , 𝑖 = 1,2}
): 𝑥
𝑥𝑖 ≤ 1
avec 𝑋 est l’ensemble des accords possibles ↔ ensembles des partages possibles du gâteau.
Les préférences sont définies car chaque joueur préfère plus que moins.
{𝑋 × 𝑇} ∪ {𝐷}
(𝑥, 𝑡) ≽ (𝑦, 𝑡) ↔ 𝑥𝑖 ≽𝑖 𝑦𝑖
{
↔ (𝑥1 ; 1 − 𝑥1 ) ≽ (𝑦1 ; 1 − 𝑦1 ) ↔ (𝑥1 ; 𝑥2 ) ≽ (𝑦1 ; 𝑦2 )
𝑤𝑖 (0) = 0
L’ensemble des équilibres de Nash est très grand. ∀𝑥 ∗ ∈ 𝑋; ∃ un équilibre de Nash acceptable.
J1 a une stratégie d’équilibre 𝑥 ∗ joué à ℎ = ∅. J2 accepte c’est la fin. Si J2 refuse et propose 𝑥1 ∗ et J1 accepte,
c’est la fin. Si la négociation n’aboutit jamais chacun à 0. Rien n’empêche d’exclure les menaces non crédibles.
A. Caractérisation
Pour qu’un jeu < 𝑋, ≽𝑖 > possède un unique équilibre de Nash, il faut faire 4 hypothèses :
34
Hypothèse 1 : Aucun accord n’est pire qu’un désaccord et on n’a jamais 𝑥, 𝑦 / (𝑥, 0)~(𝑦, 0) ∶ (13; 87)~(23; 77).
Hypothèse 3 : La frontière de Pareto de 𝑥 est strictement monotone. Si 𝑥 est un accord efficient alors ∄𝑦/
(𝑦, 0) ≽𝑖 (𝑥, 0).
Sous H1, H2, H3 et H4 attendre est coûteux et de plus en plus coûteux avec le temps. La perte est croissante dans
le temps.
Si la frontière de Pareto est 𝑋, l’ensemble des accords {𝒙 ∈ ℝ𝟐 ; 𝒙𝟐 = 𝒈(𝒙𝟏 )} avec 𝒈 concave décroissante et si
les préférences sont définies par 𝛿 𝑡 𝑥𝑖 , 𝛿 ∈ [0,1] alors on a la proposition suivante :
Proposition : Soit (𝑋, ≽𝑖 ) un jeu de marchandage avec offres alternatives. Si ce jeu vérifie H1, H2, H3, H4 alors il
(𝑥 ∗ , 1)~(𝑦 ∗ , 0)
possède un équilibre parfait en sous-jeu. Soit (𝑥 ∗ , 𝑦 ∗ ) l’unique paire d’accords efficients tels que { ∗ .
(𝑦 , 1)~(𝑥 ∗ , 0)
Dans chaque équilibre parfait en sous jeu,
▪ J1 propose toujours 𝑥 ∗ , accepte 𝑦 ∗ et n’importe 𝑥 ∈ 𝑋 / (𝑥, 0) ≽ (𝑦, 0). Il rejette 𝑥/ (𝑦 ∗ , 0) ≽𝑖 (𝑥, 0).
▪ J2 propose toujours 𝑦 ∗ , accepte 𝑥 ∗ et n’importe 𝑥/ (𝑥, 0) ≽2 (𝑥 ∗ , 0) 𝑒𝑡 (𝑥 ∗ , 0) ≽2 (𝑥, 0).
B. Propriétés de l’équilibre
Proposition : Soient 2 jeux de marchandage avec offre alternatives < 𝑋, ≽𝑖 >; < 𝑋, ≽𝑖 ′ >. Chaque jeu satisfait H1
– H4 :
• si ≽′𝑖=1 traduit une impatience au moins aussi grande que ≽𝑖=1 et ≽′2 =≽2.
• si 𝑥 ∗ représente un équilibre parfait en sous jeu de (𝑋, ≽𝑖 ) et 𝑥′ est l’accord atteint dans < 𝑋, ≽ ′ > alors
(𝑥 ∗ , 0) ≽1 (𝑥 ′ , 0).
III. Variations et extensions
A. Importance de la procédure
35
Supposons qu’en ℎ = ∅, le J1 fasse toutes les offres possibles : dans ce cas n’importe quelle offre de 2 est un
équilibre de Nash, il est unique ! En effet, il correspond à 𝑏1 ! Mais tous les jours ne sont pas traités
symétriquement.
𝑥𝑖 ≥0
Soient un < 𝑋, ≽𝑖 > 𝑖 = 1,2,3 et 𝑋 = {(𝑥1 , 𝑥2 , 𝑥3 ) ∈ 𝑋 3 / 𝑥𝑖 ≤1 }
𝑥1 +𝑥2 +𝑥3 =1
𝛿 𝑡 𝑢𝑖 (𝑥𝑖 )𝑎𝑣𝑒𝑐 0<𝛿<1
Procédure de marchandage : ℎ = ∅
J1 fait une proposition. J2 considère la proposition : si non fin, J2 fait une proposition, si oui J3 considère la
proposition : si non , J3 fait une proposition, si oui fin.
Graphique
1
Si 𝛿 ∈ ]2 ; 1[ alors ∃ un équilibre parfait en sous jeu.
36