Cours Entier TDJ

Chapitre 1 : Introduction générale
Référence : Martine Osbonne and Ariel Rubinsten MIT Press : A course in Game theory
I. La théorie des jeux

Définition : On appelle théorie des jeux un ensemble d’outils analytiques permettant de
comprendre les conséquences observées de décideurs placés en situations de conflit (théorie des
jeux non coopératifs) ou placés en situations stratégiques.
Définition : Un outil analytique est si l’on procède à des démonstrations et si on isole le
phénomène de son ensemble.
Hypothèses :
1. L’objectif de chaque décideur est exogène et parfaitement défini.
2. Le principe de rationalité motive les choix d’un décideur. Cela signifie que le décideur
raisonne stratégiquement s’il prend en compte en même temps :
➢ Toute l’information disponible
➢ Ses attentes
➢ Les attentes des autres décideurs (c’est la spécificité de la théorie des jeux par
rapport à la microéconomie)
Définition : On appelle stratégie (optimale) une suite de décisions (optimales) qui prend
explicitement en compte les décisions (optimales) des autres décideurs.
Par conséquence, la théorie des jeux étudie les interactions qui existent entre des décideurs qui
raisonnent stratégiquement en accord avec le principe de rationalité.
Définition alternative : la théorie des jeux est l’étude mathématique des interactions
stratégiques entre décideurs.
II. La notion de jeux et de solutions

Définition : Un jeu est la description des interactions stratégiques étant donné certaines
contraintes et l’intérêt des joueurs.
Remarque : Un jeu ne spécifie pas qu’elles sont les actions qu’il faut choisir.
Remarque : Un jeu est une liste de joueurs, d’actions, de conséquences (gains).
Définition : Une (des) solution(s) correspond(ent) à la description systématique des actions qui
seront choisies.
En théorie des jeux, on étudie des classes de solutions et leurs propriétés (existence, unicité,
stabilité, stationnarité, continuité).
Exemple : équilibre de Bertrand, équilibre de Cournot, équilibre de Stackelberg
III. Les jeux coopératifs et les jeux non coopératifs

Définition : On appelle joueur un individu qui prend ou choisit des actions. Un individu est un
décideur ou un groupe de décideurs.
On distingue deux classes de modèles :
▪ Les jeux non coopératifs pour lesquels l’ensemble des actions possibles des joueurs
constitue les primitives du jeu
1
▪ Les jeux coopératifs pour lesquels l’ensemble des actions jointes des joueurs constitue
les primitives du jeu
A. Les jeux en information parfaite/imparfaite

Définition : information parfaite : tout ce qu’un décideur sait est parfaitement défini.
Définition : information parfaite et complète : le décideur sait tout ce qui est utile pour
prendre une décision.
Définition : information parfaite et incomplète : le décideur ne pas sait tout.
Définition : information imparfaite : les connaissances du décideur ne sont pas sûres.
Définition : Un jeu est dit en information parfaite si chaque joueur est parfaitement informé
des actions que peuvent prendre ou choisir tous les joueurs.
Définition : un jeu est dit en information imparfaite si chaque joueur est imparfaitement
informé des actions que peuvent prendre ou choisir tous les joueurs.
B. Les jeux stratégiques/extensifs/normaux
Définition : Les jeux sous forme normale sont des jeux statiques dans lesquels les joueurs jouent
simultanément. Chaque joueur prend ou choisit un plan d’action une fois pour toute.
Définition : les jeux sous forme extensive sont des jeux pour lesquels les prises de décisions se
font dans le temps et pour lesquels l’ordre des joueurs compte. Chaque joueur prend ou choisit
un plan d’action et joue quand c’est son tour.
Remarque : un jeu extensif n’est pas forcément un jeu dynamique où les actions des joueurs
dépendent de ce qu’il s’est passé avant.
IV. Le comportement rationnel

Conditions de rationalité :
▪ Chaque joueur connait ses attentes et connait celle des autres.
▪ Chaque joueur formule des choix.
▪ Il connait ses préférences.
▪ Il se donne une procédure pour atteindre ses objectifs.
Un joueur rationnel ne fait pas en permanence le contraire de ce qu’il souhaite.
Définition : soit Ω = {𝜔1 ; 𝜔2 ; … ; 𝜔𝑛 } l’ensemble des états de la nature. Deux cas possibles :
1. On dit que l’on est en univers certain si Ω est un ensemble fini (la liste de tous les états de
la nature est finie) et si Ω est probabilisable c’est à dire qu’il est possible d’affecter une
probabilité à chaque état de la nature et ∑𝒌𝒊=𝟏 𝒑𝒌 = 𝟏.
2. On dit que l’on est en univers incertain si soit Ω n’est pas fini ou bien Ω n’est pas
probabilisable ou bien les deux.
Application : un modèle en absence d’incertitude et choix rationnels
Soit 𝑁 = {1 ; 2 ; … ; 𝑛} un ensemble de joueurs et ∀𝑖 ∈ 𝑁 on a 𝐴𝑖 = {𝑎1𝑖 ; 𝑎2𝑖 ; … ; 𝑎𝑛𝑖 } l’ensemble des

actions possibles pour 𝑖. 𝐶 = ×𝑗∈𝑛 𝐴 est l’ensemble des conséquences possibles avec ×𝑗∈𝑛 le produit
cartésien de toutes les actions et tous les joueurs. Soit une relation de préférence ≿𝑖 définie sur 𝐶.
2
Autrement dit, à chaque conséquence possible d’une action est associé un gain qu’on appelle
« payoff ». La fonction de gain (gain function) s’écrit :
𝑨⟶𝑪
𝒈∶ {
𝒂 ⟶ 𝒈(𝒂) = 𝒄
Comme on a une relation de préférence, on peut classer les préférences entre elles et, par exemple,
les mettre dans ℝ :
𝑪⟶ℝ
𝒖∶ {
𝒄 ⟶ 𝒖(𝒄) = 𝒖
On dit alors que 𝑐1 ≿𝑖 𝑐2 ⟷ 𝑢𝑖 (𝑐1 ) ≥ 𝑢𝑖 (𝑐2 ). Si 𝑢𝑖 (𝑔(𝑎1 )) ≥ 𝑢𝑖 (𝑔(𝑎2 )) alors 𝑎1 est solution du
problème 𝑀𝑎𝑥𝑎∈𝐴 𝑢(𝑎)
Application : un modèle de choix rationnels en présence d’incertitude

Soit 𝑁 = {1 ; 2 ; … ; 𝑛} un ensemble de joueurs et soit Ω = {𝜔1 ; 𝜔2 ; … ; 𝜔𝑘 ; … } l’ensemble des états
de la nature. Comme on ne connait pas tous les états de la nature, on ne connait pas toutes les
probabilités associées 𝑃 = {𝑝1 ; 𝑝2 ; … ; 𝑝𝑘 ; … }. On a 𝐴𝑖 = {𝑎1𝑖 ; 𝑎2𝑖 ; … ; 𝑎𝑝𝑖 } l’ensemble des actions
possibles pour chaque joueur ∀𝑖 ∈ 𝑁. L’ensemble des conséquences possibles est le produit
cartésien des états de la nature avec l’ensemble des actions : 𝐶 = Ω ×𝑗∈𝑛 𝐴.
On peut définir une fonction d’espérance de gain :

𝛀×𝑨⟶𝑪
𝑬𝒈 ∶ {
(𝝎, 𝒂) ⟶ 𝒈(𝝎 , 𝒂) = 𝒄
On établit la relation de préférence dans ℝ :
𝑪⟶ℝ
𝑬𝒖 ∶ { 𝒈(𝝎 , 𝒂) ⟶ 𝑬𝒖(𝒈(𝝎 , 𝒂)) = 𝑬𝒖
On dit alors que 𝑒𝑢1 ≿𝑖 𝑒𝑢2 ⟷ 𝐸𝑢(𝑔(𝜔 , 𝑎1 )) ≥ 𝐸𝑢(𝑔(𝜔 , 𝑎2 )). Dans ce cas, 𝑒𝑢1 est solution du
problème 𝑀𝑎𝑥𝑎∈𝐴 𝐸𝑢(𝑔(𝜔, 𝑎))
3
CHAPITRE 2 : EQUILIBRE DE NASH
PARTIE 1 : JEUX STRATEGIQUES

L’objectif de cette partie est l’étude des jeux sous forme normale. Les joueurs sont compatibles avec la
théorie de Von Neumann et Morgenstern. On dit qu’ils « sont VNM » c’est-à-dire qu’ils raisonnent en
espérance d’utilité. Ils ont chacun un pré ordre de préférences sur les conséquences du jeu.
Chapitre 2 : Equilibre de Nash

I. Introduction
L’équilibre de Nash est le concept le plus utilité en sciences économiques aujourd’hui avec l’équilibre
de marché.
L’objet du chapitre est de présenter le concept d’équilibre de Nash dans les jeux stratégiques
(information parfaite) et dans les jeux bayésiens (information imparfaite).
II. Notion de jeu stratégique

Définition : On appelle jeu stratégique un modèle de prise de décision dans lequel tous les joueurs
jouent simultanément et prennent leurs décisions une fois pour toute.
Exemple : les enchères sous pli scellé
Définition : Un jeu stratégique consiste en :
• 𝑵 = {𝟏, … , 𝒏} est un ensemble discret de joueurs ou 𝑵 = [𝒏, 𝒏 ̅ ] est un ensemble continu de
joueurs.
• ∀𝒊 ∈ 𝑵, 𝑨𝒊 = {𝒂𝒊 𝟏 , … , 𝒂𝒊 𝒑 } est un ensemble discret ou 𝑨𝒊 = [𝒂𝒊 , 𝒂
̅𝒊 ] continu d’actions.
• ≽ préférences sont définies sur 𝐶 l’ensemble des conséquences possibles 𝑪 = 𝑿𝒋∈𝑵 𝑨𝒋
Exemple : 𝐴1 = {𝑎, 𝑏}, 𝐴2 = {𝑐, 𝑑}, 𝐶 = {(𝑎, 𝑐), (𝑎, 𝑑), (𝑏, 𝑐), (𝑏, 𝑑)}
Définition : Un jeu dont l’ensemble des actions est fini s’appelle un jeu stratégique fini.
Remarque : La définition 2 est très large et un très grand nombre d’exemple correspondent à ce type de
jeu. Les joueurs peuvent être des individus ou des groupes d’individus (un syndicat joue contre un
patronat), un gouvernement, tout organisme vivant (fleurs, plantes, arbres, animal).
Remarque : Il n’y a pas de restrictions sur l’ensemble 𝐴𝑖 .
Remarque : Chaque joueurs apprécient une issue de jeu suivant ses propres préférences.
Remarque : Quelques fois l’ensemble des conséquences possibles d’un jeu est confondu avec
l’ensemble des actions des joueurs. Dans ce cas les préférences sont sur 𝐴 et non sur 𝐶.
𝐴→𝐶
𝑔={
𝑎 → 𝑔(𝑎) = 𝑐; 𝑐 ∈ ℝ
Une relation de préférence est définie sur 𝐶 pour chaque joueur 𝑖 ∈ 𝑁: 𝒂 ≽𝒊 𝒃 ↔ 𝒈(𝒂) ≥ 𝒈(𝒃).
D’autres situations sont risquées :
- 𝐶 ensemble des conséquences
- 𝐴 ensemble des actions
- Ω ensembles des états de la nature
4
𝐴×Ω →𝐶
𝑔={
(𝑎, 𝑤) → 𝑔(𝑎, 𝑤) = 𝑐
L’ensemble des actions induit une loterie sur 𝐶. Les préférences de 𝑖 sont alors spécifiées sur l’ensemble
des loteries : (𝒂, 𝒘) ≽𝒊 (𝒃, 𝒘) ↔ 𝒈(𝒂, 𝒘) ≥ 𝒈(𝒃, 𝒘).
On parle d’espérance d’utilité ∑𝑲

𝒌=𝟏 𝒈(𝒂, 𝒘𝒌 ).
Notation : Les primitives d’un jeu stratégique sont les suivantes 𝐺 =< 𝑁, 𝐴, ≽𝑖 >.
On peut représenter un jeu sous forme matricielle ou « forme normale ».
𝑁 = {1,2} est l’ensemble des joueurs.
𝐴1 = {𝑇𝑜𝑝, 𝐵𝑜𝑡𝑡𝑜𝑚} 𝐴2 = {𝐿𝑒𝑓𝑡, 𝑅𝑖𝑔ℎ𝑡}
L R Un jeu est défini par :

T W1 ; W2 X1 ; X2 • L’association de payoffs à des actions
B Y1 ; Y2 Z1 ; Z2 • L’ordonnancement des payoffs
A. Commentaires et interprétations
Un jeu stratégiques est un modèle caractérisant une situation où :
- Une décision est prise une fois pour toutes.
- Chaque joueur connaît les détails du jeu.
- Chaque joueur est rationnel (il ne fait pas en permanence le contraire de ce qu’il souhaite).
- Les actions sont choisies simultanément et indépendamment des autres joueurs.
On peut jouer plusieurs fois consécutives à un même jeu. Si les actions jouées dans le passé influencent
celles qui sont choisies dans le présent, on parle de jeu répété.
B. Equilibre de Nash
Définition : Un équilibre de Nash d’un jeu est un état stationnaire du jeu pour lequel aucun joueur n’a
intérêt à dévier sachant que chaque joueurs formule les bonnes anticipations sur le comportement des
autres et que chaque joueur est rationnel est comprend le jeu de la même manière que les autres.
La procédure avec laquelle l’équilibre est atteint n’est pas étudiée.
Définition : On appelle équilibre de Nash de 𝑮 =< 𝑵, 𝑨, ≽𝒊 > un profil d’actions 𝑎∗ ∈ 𝐴 ayant la
propriété suivante : ∀𝑖 ∈ 𝑁, (𝑎−𝑖 ∗ , 𝑎𝑖 ∗ ) ≽𝑖 (𝑎−𝑖 ∗ , 𝑎𝑖 ) avec 𝑎𝑖 ∈ 𝐴𝑖 . 𝒂∗ = (𝒂−𝒊 ∗ , 𝒂𝒊 ∗ ) est appelé un
équilibre de Nash.
Etant donné la meilleure réponse des autres joueurs, chaque joueur calcule sa meilleure réponse. Ainsi,
personne n’à intérêt à dévier.
On peut reformuler dans certains cas, le concept d’équilibre de Nash comme suit ∀𝑎−𝑖 ∈ 𝐴−𝑖 on définit
𝑩𝒊 (𝒂−𝒊 ) la best set of action pour 𝑖 ∈ 𝑁 étant données les actions des autres.
𝑩𝒊 (𝒂−𝒊 ) = {𝒂𝒊 ∈ 𝑨𝒊 ; (𝒂−𝒊 , 𝒂𝒊 ) ≥ (𝒂−𝒊 , 𝒂′ 𝒊 )𝒂𝒊 ∈ 𝑨𝒊 }
𝐵𝑖 est l’ensemble des meilleures réponses du joueur 𝑖 aux actions des autres joueurs.
Définition : Un équilibre de Nash est une suite d’actions 𝑎∗ /𝑎∗ ∈ 𝐵𝑖 (𝑎−𝑖 ∗ )∀𝑖 ∈ 𝑁.
5
III. Exemple
A. La bataille des sexes Luce D. Raiffa 1957

Un couple souhaite sortir le soir. Ils ont 2 possibilités chacun : un concert de Bach ou un concert de
Straviusky. Si le joueur 1 se rend au concert de son choix (𝐵1 ) alors il a le payoff A si le joueur 2
l’accompagne ; C sinon si les 2 joueurs se rendent à un concert différent chacun, celui qui accompagne
l’autre à B. 𝐴 > 𝐵 > 𝐶.
Montrez qu’il s’agit d’un jeu stratégique fini.
La situation proposée dans l’exercice correspond à un jeu stratégique 𝐺 =< 𝑁, 𝐴, ≽𝑖 > où
• 𝑁 = {1,2} est l’ensemble des 2 joueurs. Par exemple 1 est celui qui préfère Bach et 2 celui qui
préfère Straviusky.
• ∀𝑖 ∈ 𝑁, 𝐴1 = {𝐵1 , 𝑆1 } 𝐴2 = {𝐵2 , 𝑆2 } est un ensemble d’action fini où 𝐵𝑖 représente Bach et 𝑆𝑖
représente Straviusky ∀𝑖 ∈ 𝑁.
• Chaque joueur préfère l’un des 2 concerts et préfère être ensemble que séparés par conséquent
les préférences sont parfaitement définies sur 𝐶 = 𝑋𝑗∈𝑁 𝐴𝐽 .
Ecrire le jeu sous forme matricielle.
𝐵2 𝑆2
𝐵1 A;B C;C
𝑆1 C;C B;A
Quel est l’ensemble 𝑵𝒑 des équilibres de Nash en stratégies pures ?
Le joueur 1 se dit :
- si 2 joue 𝐵2 alors 1 choisit 𝐵1 car 𝐴 > 𝐶 : (𝐵1 , 𝐵2 )
- Si 2 joue 𝑆2 alors 1 choisit 𝑆1 car 𝐵 > 𝐶 : (𝑆1 , 𝑆2 )
Le joueur 2 raisonne comme suit :
- si 1 joue 𝐵1 alors 2 choisit 𝐵2 car 𝐵 > 𝐶 : (𝐵1 , 𝐵2 )
- si 1 joue 𝑆1 alors 2 choisit 𝑆2 car 𝐴 > 𝐶 : (𝑆1 , 𝑆2 )
Ainsi, 𝑁𝑝 = {(𝐵1, 𝐵2 ), (𝑆1 , 𝑆2 )}
Interprétez économiquement.
Il y a 2 équilibres de Nash symétriques. On ne peut pas les choisir ou encore on ne sait pas lequel sera
joué. Chaque équilibre de Nash est un état stationnaire du jeu.
B. Un jeu de coordination
On reprend la même situation mais les payoffs changent. Si les 2 joueurs vont ensemble à Bach chacun à
A. Si les 2 joueurs vont ensemble à Straviusky chacun à B. Sinon C chacun. 𝐴 > 𝐵 > 𝐶.
• 𝑁 = {1,2} est l’ensemble de joueur où 1 est la « dame » et 2 le « monsieur ».

6
• ∀𝑖 ∈ 𝑁, 𝐴1 = {𝐵1 , 𝑆1 } 𝐴2 = {𝐵2 , 𝑆2 } est un ensemble d’action fini où 𝐵𝑖 représente Bach et 𝑆𝑖
représente Straviusky ∀𝑖 ∈ 𝑁.
• ≽𝑖 est une relation de préférence pour chaque joueur sur 𝐶 définit par le fait que chaque joueur
préfère l’un des concerts à l’autre. Comme l’ensemble des actions est fini, le jeu stratégique est
fini.
Quelle est la matrice des gains ?
𝐵2 𝑆2
𝐵1 A;A C;C
𝑆1 C;C B;B
Quel est l’ensemble des équilibres de Nash ?

- Si 2 joue 𝑆2 alors 1 choisit 𝑆1 car 𝐵 > 𝐶 : (𝑆1 , 𝑆2 )
- si 1 joue 𝑆1 alors 2 choisit 𝑆2 car 𝐵 > 𝐶 : (𝑆1 , 𝑆2 )
Ainsi, 𝑁𝑝 = {(𝐵1, 𝐵2 ), (𝑆1 , 𝑆2 )}
Il y a 2 équilibres de Nash mais 𝐷𝑖 ≽𝑖 𝑆𝑖 donc on peut penser que (𝐵1 , 𝐵2 ) est un équilibre dominant
l’équilibre (𝑆1 , 𝑆2 ) : c’est pourquoi on parle de coordination.
C. Head and Take
Deux joueurs jouent à pile ou face. Si les 2 jets de la pièce donne le même côté, le J1 remporte A et le J2
paye A à 1. Si le jet de la pièce donne 2 côtés différents, le J2 remporte A et le J1 paye A à 2.
• 𝑁 = {1,2} est l’ensemble de joueur.

• ∀𝑖 ∈ 𝑁, 𝐴𝑖 = {𝑃𝑖 , 𝐹𝑖 } est un ensemble d’action fini pour chaque joueur 𝑖 où 𝑃𝑖 représente Pile et
𝐹𝑖 représente Face.
• ≽𝑖 est une relation de préférences pour chaque joueur définit sur 𝐶 = 𝑋𝑗∈𝑁 𝐴𝐽 . Chaque joueur
préfère gagner A que payer A. Comme l’ensemble des actions 𝐴𝑖 est fini, le jeu stratégique est
fini.
𝑃2 𝐹2
𝑃1 A ; -A -A ; A
𝐹1 -A ; A A ; -A
7
- si 2 joue 𝑃2 alors 1 choisit 𝑃1 car 𝐴 > −𝐴 : (𝑃2 , 𝑃1 )
- Si 2 joue 𝐹2 alors 1 choisit 𝐹1 car 𝐴 > −𝐴: (𝐹2 , 𝐹1 )
F2
- si 1 joue 𝑃1 alors 2 choisit 𝑃2 car 𝐴 > −𝐴 : (𝑃1 , 𝑃2 )
- si 1 joue 𝐹1 alors 2 choisit 𝐹2 car 𝐴 > −𝐴 : (𝐹1 , 𝐹2 )
P2
Ainsi, 𝑁𝑝 = {(𝑃1 , 𝑃2 ), (𝐹1 , 𝐹2 )} Il n’y a pas d’équilibre de NASH
Il n’y a pas d’équilibre de Nash en stratégies pures. Aucun état stationnaire du jeu n’est préféré par les 2
joueurs en même temps à un autre état stationnaire. Nous sommes dans un jeu à somme nulle.
D. Le dilemme du prisonnier
2 suspects d’un crime sont placés dans 2 cellules différentes sans aucun moyen de communication entre
eux. La police fait l’offre suivante : si 𝑖 dénonce 𝑗, 𝑖 reçoit 𝐴 et 𝑗 reçoit D. Si les 2 se dénoncent chacun
reçoit C. Si aucun ne dénonce l’autre chacun reçoit B. 𝐴 > 𝐵 > 𝐶 > 𝐷.
• 𝑁 = {1,2} est l’ensemble de joueur.

• ∀𝑖 ∈ 𝑁, 𝐴𝑖 = {𝐷𝑖 , 𝐶𝑖 } est un ensemble d’actions fini pour chaque joueur 𝑖 où 𝐷𝑖 représente
l’action de Dénoncer et 𝐶𝑖 représente l’action de Coopérer.
• ≽𝑖 est une relation de préférences pour chaque joueur définit sur 𝐶 = 𝑋𝑗∈𝑁 𝐴𝐽 . Chaque joueur
préfère A à tout autre gain. Comme l’ensemble des actions 𝐴𝑖 est fini, le jeu stratégique est fini.
𝐷2 𝐶2
𝐷1 C;C A;D
𝐶1 D;A B;B

- si 2 joue 𝐷2 alors 1 choisit 𝐷1 car 𝐶 > 𝐷 : (𝐷2 , 𝐷1 )
- Si 2 joue 𝐶2 alors 1 choisit 𝐷1 car 𝐴 > 𝐵 : (𝐶2 , 𝐷1 )
- si 1 joue 𝐷1 alors 2 choisit 𝐷2 car 𝐶 > 𝐷 : (𝐷1 , 𝐷2 )
- si 1 joue 𝐶1 alors 2 choisit 𝐶2 car 𝐴 > 𝐵 : (𝐶1 , 𝐷2 )
Ainsi, 𝑁𝑝 = {(𝐷1 , 𝐷2 )}
8
Il y a un équilibre de Nash mais il correspond au pire socialement. En effet, (𝐶1 , 𝐶2 ) donne un meilleur
payoff à chaque joueur car 𝐵 > 𝐶 mais ce n’est pas un équilibre et donc cette stratégie n’est jamais
jouée. Cet équilibre (𝐷1 , 𝐷2 ) est Pareto détériorant. Il ne faut pas confondre équilibre et efficacité.
E. Faucon/Colombe
2 animaux se battent dans un pré pour une proie. Chaque animal peut-être soit Faucon (agressif) soit
Colombe (non agressif). Si les 2 sont Colombe ils ont B chacun. Si les 2 sont Faucon, ils ont D chacun.
Sinon celui qui est Faucon reçoit A et l’autre C.
• 𝑁 = {1,2} est l’ensemble de joueur où 𝑖 = 1,2 est l’un des 2 animaux.

• ∀𝑖 ∈ 𝑁, 𝐴𝑖 = {𝐹𝑖 , 𝐶𝑖 } est un ensemble d’actions fini pour chaque joueur 𝑖 où 𝐹𝑖 représente « agir
en Faucon » et 𝐶𝑖 représente « agir en Colombe ».
• ≽𝑖 est une relation de préférences parfaitement définies sur 𝐶 = 𝑋𝑗∈𝑁 𝐴𝐽 . Chaque joueur préfère
A à tout autre gain. Comme l’ensemble des actions 𝐴𝑖 est fini, le jeu stratégique est fini.
𝐹2 𝐶2
𝐹1 D;D A;C
𝐶1 C;A B;B

- si 2 joue 𝐹2 alors 1 choisit 𝐶1 car 𝐶 > 𝐷 : (𝐹2 , 𝐶1 )
- Si 2 joue 𝐶2 alors 1 choisit 𝐹1 car 𝐴 > 𝐵 : (𝐶2 , 𝐹1 )
- si 1 joue 𝐹1 alors 2 choisit 𝐶2 car 𝐶 > 𝐷 : (𝐹1 , 𝐶2 )
- si 1 joue 𝐶1 alors 2 choisit 𝐹2 car 𝐴 > 𝐵 : (𝐶1 , 𝐹2 )
Ainsi, 𝑁𝑝 = {(𝐹1 , 𝐶2 ), (𝐶1 , 𝐹2 )}
Il y a 2 équilibres de Nash en stratégies pures avec à chaque fois un faucon et un colombe. Il y a donc
agression et non-agression à l’équilibre. L’équilibre est dans les diagonales opposées et on ne sait pas
comment les animaux vont à l’équilibre.
IV. Conclusion
Il peut ne pas y avoir d’équilibres, ou bien un unique équilibre ou bien plusieurs.
Un équilibre est un état stationnaire pour lequel personne n’a intérêt à dévier.
Un équilibre n’est pas synonyme de Pareto-efficacité (dilemme du prisonnier c’est le pire qui sort).
V. Existence d’un équilibre de Nash
9
Objet : Etudier les conditions pour lesquelles l’ensemble des équilibres de Nash est non vide.
Intérêt : Savoir à l’avance si le jeu vérifie les conditions d’existence, alors on peut calculer l’équilibre. On
peut étudier les propriétés de l’équilibre.
Pour montrer qu’un équilibre existe, il faut définir les conditions pour lesquelles on a
𝒂∗ /𝒂∗ ∈ 𝑩𝒊 (−𝒂∗ ) ∀𝒊 ∈ 𝑵
∈ fait référence au Théorème du point fixe généralisé au cas des correspondances (différent des
fonctions).
Rappel : 𝒙∗ est appelé point fixe si 𝑓 définie continue sur 𝐼, 𝒙 ∈ 𝑰; 𝒇(𝒙∗ ) = 𝒙∗ .
Définition : Une correspondance est définie par le fait qu’une abscisse peut avoir plusieurs ordonnées.
𝑨→𝑨
𝑩: {𝒂 → 𝑩(𝒂) = 𝒙
𝒋∈𝑵 𝑩𝒋 ()
Sous forme vectorielle 𝑎∗ ∈ 𝐵(𝑎∗ ).

Théorème du point fixe de Kakutani : Soit 𝑋 un ensemble compact (fermé, borné) et convexe (tout
segment reliant deux points de l’ensemble est dans l’ensemble)
𝑿→𝑿
𝒇: {
𝒙 → 𝒇(𝒙)
où f est un ensemble non vide convexe, dont le graphe est fermé. C’est-à-dire
∀{𝑥𝑛 } et ∀{𝑦𝑛 } /𝑦𝑛 ∈ 𝑓(𝑥𝑛 )∀𝑛 𝑜𝑛 𝑎 𝑥𝑛 → 𝑥 , 𝑦𝑛 → 𝑦 et 𝑦 ∈ 𝑓(𝑥), alors ∃ 𝑥 ∗ ∈ 𝑋 /𝑥 ∗ ∈ 𝑓(𝑥 ∗ ).
Proposition : Soit 𝐺 =< 𝑁, 𝐴, ≽𝑖 > un jeu stratégique fini. G possède un équilibre de Nash si 𝑖 ∈ 𝑁 :
• 𝐴𝑖 est non vide, compact et convexe.

• Les préférences sont quasi-concaves sur C et continues
VI. Les jeux strictement concurrentiels

Définition : 𝐺 =< {1,2}, 𝐴, ≽𝑖 > est un jeu stratégique fini à 2 joueurs. G est un jeu strictement
concurrentiel si les intérêts des joueurs sont diamétralement opposés. Soit 𝑎 = [𝑎1 , 𝑎2 ] et 𝑏 = [𝑏1 , 𝑏2 ]
2 profils d’actions avec 𝒂 ≥𝒊 𝒃 et 𝒃 ≥𝒋 𝒂.
Définition : On appelle jeu à somme nulle tout jeu concurrentiel dont la somme des payoffs est
constante.
Définition : Un jeu 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > 𝐴𝑖 fini est un jeu à somme nulle s’il est concurrentiel et si la
somme des payoffs est constante.
Exemple : Un duopole se partage un marché donc la somme des parts de marché est égale à 100%.
B1 B2
A1 80 ; 20 50 ; 50
A2 30 ; 70 40 ; 60
Chaque joueur adopte une stratégie prudente : Le joueur 1 se dit
- Si je joue A1 alors J2 me punit en jouant B2 car 50 < 80.
- Si je joue A2 alors J2 me punit en jouant B1 car 30 < 40.
10
𝑀𝑖𝑛𝐵∈𝐴2 𝑢1 (𝐴1; 𝐵) = 𝐵2 → 𝑢1 (𝐴1; 𝐵2) = 50
𝑀𝑖𝑛𝐵∈𝐴2 𝑢1 (𝐴2; 𝐵) = 𝐵1 → 𝑢1 (𝐴2; 𝐵1) = 30
𝑀𝑎𝑥𝐴∈𝐴1 𝑀𝑖𝑛𝐵∈𝐴2 𝑢1 (𝐴1; 𝐵) = 𝐴1
- Si je joue B1 alors J1 me punit en jouant A1 car 20 < 70.
- Si je joue B2 alors J1 me punit en jouant A1 car 50 < 60.
𝑀𝑖𝑛𝐴∈𝐴1 𝑢2 (𝐴; 𝐵1) = 𝐴1 → 𝑢2 (𝐴1; 𝐵1) = 20
𝑀𝑖𝑛𝐴∈𝐴1 𝑢2 (𝐴; 𝐵2) = 𝐴1 → 𝑢2 (𝐴1; 𝐵2) = 50
𝑀𝑎𝑥𝐵∈𝐴2 𝑀𝑖𝑛𝐴∈𝐴1 𝑢2 (𝐴1; 𝐵) = 𝐵2
On cherche les équilibres de Nash : Le joueur 1 raisonne comme suit :

- Si J2 joue B1 alors 1 joue A1 car 80 > 30. (A1 ; B1)
- Si J2 joue B2 alors 1 joue A1 car 50 > 40. (A1 ; B2)
- Si J1 joue A1 alors J2 joue B2 car 50 > 20. (A1 ; B2)
- Si J1 joue A2 alors J2 joue B1 car 70 > 60. (A2 ; B1)
𝑵𝒑 = {(𝑨𝟏; 𝑩𝟐)} = 𝑺𝒑
Définition : Soit 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > un jeu à somme nulle. L’action 𝒙∗ ∈ 𝑨𝟏 est un maximiniseur pour
le joueur 1 si :
𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙∗ ; 𝒚) ≥ 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) ∀𝒙 ∈ 𝑨𝟏
L’action 𝒚∗ ∈ 𝑨𝟐 est un maximinimiseur pour le joueur 2 si

𝑴𝒊𝒏𝒙∈𝑨𝟏 𝒖𝟐 (𝒙 ; 𝒚∗ ) ≥ 𝑴𝒊𝒏𝒙∈𝑨𝟏 𝒖𝟐 (𝒙; 𝒚) ∀𝒚 ∈ 𝑨𝟐
Le joueur 𝑖 choisit l’action qui lui procure le plus grand des gains minima.
Vocabulaire : Un maximiniseur pour le joueur 𝑖 ∈ 𝑁 est appelé une stratégie prudente.
Remarque : Une stratégie prudente garantie à chaque joueur le plus grand gain possible.
𝑀𝑎𝑥𝑥∈𝐴1 𝑀𝑖𝑛𝑦∈𝐴2 𝑢1 (𝑥; 𝑦) stratégie prudente pour le joueur 1.
𝑀𝑎𝑥𝑦∈𝐴2 𝑀𝑖𝑛𝑥∈𝐴1 𝑢2 (𝑥; 𝑦) stratégie prudente pour le joueur 2.
Dans ce cas 𝑢1 = −𝑢2

Lemme : Soit 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > un jeu à somme nulle.
• 𝑴𝒂𝒙𝒚∈𝑨𝟐 𝑴𝒊𝒏𝒙∈𝑨𝟏 𝒖𝟐 (𝒙; 𝒚) = 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚)
Tout maximiniseur pour 𝑖 est un minimaxiseur pour 𝑗 ≠ 𝑖.
• 𝑦 ∈ 𝐴2 est solution du problème 𝑀𝑎𝑥𝑦∈𝐴2 𝑀𝑖𝑛𝑥∈𝐴1 𝑢2 (𝑥; 𝑦) ↔ il est aussi solution du problème
𝑀𝑖𝑛𝑦∈𝐴2 𝑀𝑎𝑥𝑥∈𝐴1 𝑢1 (𝑥; 𝑦)
11
Preuve : 𝒖𝟏 = −𝒖𝟐 donc 𝑀𝑎𝑥 𝑢1 ↔ 𝑀𝑖𝑛 𝑢2
Proposition : Soit 𝐺 =< {1,2}; 𝐴𝑖 ; ≽𝑖 > un jeu à somme nulle.
a) Si (𝒙∗ , 𝒚∗ ) est un équilibre 𝑵𝒑 de 𝐺 alors 𝑥 ∗ est solution du problème de
𝑀𝑎𝑥𝑥∈𝐴1 𝑀𝑖𝑛𝑦∈𝐴2 𝑢1 (𝑥; 𝑦) et 𝑦 ∗ est solution du problème de 𝑀𝑖𝑛𝑥∈𝐴1 𝑀𝑎𝑥𝑦∈𝐴2 𝑢2 (𝑥; 𝑦). NB :
C’est une implication pas une équivalence.
b) Si (𝒙∗ , 𝒚∗ ) est un équilibre 𝑵𝒑 de 𝐺 alors 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) =

𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚) = 𝒖𝟏 (𝒙∗ , 𝒚∗ ). Ainsi tous les équilibres de Nash provoquent le même
payoffs.
c) Si 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) = 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚) alors 𝑥 ∗ est un maximiniseur pour 1
et 𝑦 ∗ est un maximiniseur pour 2 et (𝒙∗ , 𝒚∗ ) est un équilibre de Nash en stratégie pure.
Preuve : Regarder sur le livre A course in game theory – Martin Osborne & Ariel (proposition 2.2)
Vocabulaire : Si 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) = 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚) alors le gain correspondant
(équilibre du jeu) s’appelle la valeur du jeu.
NB : En général dans un jeu concurrentiel, les stratégies d’équilibre ont ces propriétés. Si le jeu n’est pas
concurrentiel alors elles n’ont pas ces propriétés. Exception : Le dilemme du prisonnier qui n’est pas un
jeu concurrentiel a ces propriétés.
VII. Jeux bayésiens : Jeux stratégiques en information imparfaite
A. Définitions
On utilise les jeux bayésiens pour modéliser des situations où certains joueurs sont incertains sur les
caractéristiques des autres joueurs. Pour cela, on conserve les primitives 𝑁, 𝐴𝑖 et on ajoute 𝛀 (fini) un
ensemble d’état de la nature, des probabilités a priori sur Ω (ce sont des données). A chaque 𝑤 ∈ Ω on
associe une probabilité 𝒑(𝒘) a priori. On ajoute une fonction de signal 𝝉𝒊 (𝒘).
𝑇𝑖 l’ensemble des types possibles, 𝑡𝑖 ∈ 𝑇𝑖 est un type possible.
Si 𝝉𝒊 bijective, alors 𝜏𝑖 (𝑤) = 𝑡𝑖 , 𝑤 = 𝜏𝑖 −1 (𝑡𝑖 ) : 𝒑(𝒘) = 𝒑[𝝉𝒊 −𝟏 (𝒕𝒊 ) ] > 𝟎 ∀𝑡𝑖 ∈ 𝑇𝑖

Ainsi chaque joueur affecte une probabilité a priori sur le type des autres joueurs ∀𝑖 ∈ 𝑁. S’il reçoit le
signal 𝜏𝑖 (𝑤) = 𝑡𝑖 alors il en déduit que 𝑖 est du type 𝑤. 𝑤 ∈ 𝜏𝑖 −1 (𝑡𝑖 )
On peut construire une croyance à posteriori que l’état de la nature w se réalise :
𝑝𝑖 (𝑤) −1
{[𝜏𝑖 −1 (𝑡𝑖 ) ] 𝑠𝑖 𝑤 ∈ 𝜏𝑖 (𝑡𝑖 )
0 𝑠𝑖𝑛𝑜𝑛
Définition : Un jeu bayésien consiste en
• 𝑵 = {𝟏, … , 𝒏} un ensemble de 𝑛 joueurs.

• 𝛀 = {𝒘𝟏 , … , 𝒘𝒌 } un ensemble d’états de la nature.
• ∀𝑖 ∈ 𝑁; 𝑨𝒊 = {𝒂𝟏 𝒊 , … , 𝒂𝒑 𝒊 } est un ensemble d’actions possibles pour 𝑖.
• ∀𝑖 ∈ 𝑁; 𝑻𝒊 = {𝒕𝟏 𝒊 , … , 𝒕𝒎 𝒊 } l’ensemble des types possibles pour 𝑖.
12
𝛀 → 𝑻𝒊
• ∀𝑖 ∈ 𝑁; 𝝉𝒊 : {
𝒘 → 𝝉𝒊 (𝒘) = 𝒕𝒊
• ∀𝑖 ∈ 𝑁 une croyance à priori 𝑤 𝒑(𝒘) = 𝒑[𝝉𝒊 −𝟏 (𝒕𝒊 ) ] > 𝟎 ∀𝑡𝑖 ∈ 𝑇𝑖
• ≽𝒊 une relation de préférences définie sur 𝐴 × Ω, 𝐴 = 𝑋𝑗∈𝑁 𝐴𝑗
𝑮𝑩 =< 𝑵, 𝛀, 𝑨𝒊 , 𝑻𝒊 , 𝝉𝒊 , 𝒑, ≽𝒊 > = < 𝑵 × 𝑻𝒊 , 𝛀 × 𝐀, 𝝉𝒊 , 𝒑, ≽𝒊 >

Remarque : Les joueurs peuvent avoir des croyances différentes.
Remarque : Des joueurs différents peuvent avoir les mêmes croyances.
Remarque : Les croyances peuvent être liées. (Exemple : lettre de recommandation)
Remarque : Les probabilités subjectives peuvent coïncidées avec les probabilités objectives.
Définition : Un équilibre de Nash d’un jeu bayésien 𝑁𝐺𝐵 𝐺𝐵 =< 𝑁 × 𝑇𝑖 , Ω × A, 𝜏𝑖 , 𝑝, ≽𝑖 > est un
équilibre de Nash du jeu stratégique où l’ensemble des joueurs est l’ensemble des paires (𝑖, 𝑡𝑖 )∀𝑖 ∈
𝑁, ∀𝑡𝑖 ∈ 𝑇𝑖 , l’ensemble des actions est 𝐴𝑖 ∀𝑖 ∈ 𝑁, ≽𝑖,𝑡𝑖 :
𝒂∗ ≽𝒊,𝒕𝒊 𝒃∗ 𝒔𝒔𝒊 𝑳𝒊 (𝒂∗ , 𝒕𝒊 ) ≽𝒊 𝑳(𝒃∗ , 𝒕𝒊 )

𝑝𝑖 (𝑤)
où 𝐿𝑖 est une loterie sur 𝐴𝑋Ω qui affecte la probabilité à (𝑎∗ (𝜏𝑗 (𝑤)𝑗∈𝑁 ); 𝑤) si 𝑤 ∈ 𝝉𝒊 −𝟏 (𝒕𝒊 ) ; 0
𝑝𝑖 [𝝉𝒊 −𝟏 (𝒕𝒊 )]
sinon.
Un équilibre de Nash d’un jeu bayésien est un profil d’action tel que chaque joueur choisit sa MR étant
donné : le signal qu’il reçoit sur Ω, sa croyance sur l’état de la nature 𝑝(𝑤), sur l’action des autres
joueurs sachant les signaux qu’ils reçoivent.
Exemple : Les enchères au 1e prix. Un objet est à vendre et à affecter à un joueur 𝑖 ∈ 𝑁 = {1, … , 𝑛} en
échange d’un paiement. Soit 𝑣𝑖 l’évaluation de l’objet par le joueur 𝑖. On suppose 𝑣1 > 𝑣2 > ⋯ > 𝑣𝑛 >
0. Chaque joueur fait une offre sous pli cacheté simultanément. L’offre la plus élevée remporte l’objet.
Chaque joueur est incertain sur l’évaluation des autres 𝑣𝑗≠𝑖 . Soit 𝑉 l’ensemble des évaluations
possibles. On suppose qu’aucune coalition de joueur n’est possible.
Montrez qu’il s’agit d’un jeu bayésien.
Ce jeu correspond à un jeu bayésien car :
• 𝑁 = {1, … , 𝑛} l’ensemble de 𝑛 joueurs.

• Ω = 𝑉 𝑛 un ensemble d’états de la nature (le produit cartésiens des évaluations).
• ∀𝑖 ∈ 𝑁; 𝐴𝑖 = {𝑎𝑖 } est un ensemble des actions avec 𝑎𝑖 = 𝑣𝑖 − 𝑚𝑎𝑥{𝑎𝑗∈𝑁 } possible. Si 𝑎𝑖 > 0
alors remporte l’objet, si 𝑎𝑖 < 0 ne remporte pas l’objet.
• ∀𝑖 ∈ 𝑁; 𝑇𝑖 = 𝑉𝑖 l’ensemble des types possibles pour 𝑖.
• ∀𝑖 ∈ 𝑁; 𝜏𝑖 = 𝜏(𝑣1 … 𝑣𝑛 )
• ∀𝑖 ∈ 𝑁 une croyance à priori 𝑝𝑖 (𝑣1 … 𝑣𝑛 ) = ∏𝑛𝑗=1 𝜋(𝑣𝑗 ) avec 𝜋 est une distribution de
probabilité sur 𝑉.
• ≽𝑖 est définie comme une variable aléatoire ∈ 𝑉, 𝑎𝑖 ≥ 𝑎𝑗 0 sinon, 𝑣𝑖 − 𝑚𝑎𝑥 𝑎𝑗 𝑗 ∈ 𝑁 ∖ {𝑖}

L’ensemble des équilibres de Nash correspond à l’ensemble des utilités marginales.
𝑁𝑝 = {𝑣1 … 𝑣𝑛 }
13
Le jeu a donc un gagnant car le joueur 1 remporte l’objet.
CHAPITRE 3 :
Chapitre 3 : Equilibre mixte et équilibre corrélé
I. Introduction
Dans les 2 chapitres précédents, les jeux étaient en univers déterministe pour les jeux stratégiques,
concurrentiels ou à somme nulle. Dans ce chapitre, on étudie 2 types de jeux où l’univers est risqué :
• L’équilibre de Nash en stratégies mixtes noté 𝑁𝑚 .

• L’équilibre corrélé
II. Equilibre de Nash en stratégie mixte
Objectif : Modéliser l’équilibre de jeux où les choix des joueurs dépendent de probabilités exogènes.
Pour cela il faut rajouter une primitive du jeu stratégique. Dans ce cas, les joueurs calculent les espérances
d’utilité.
Rappel de maths : Support de probabilité
Soit 𝑋 un ensemble fini.
Soit 𝛿 ∈ ∆𝑋 une probabilité sur l’espace 𝑋 avec ∆𝑋 l’ensemble des distributions sur 𝑋.
Notation : On note 𝛿(𝑥) la probabilité que 𝑥 ∈ 𝑋.
Soit 𝐴𝑖 un ensemble d’actions fini, ∆𝐴𝑖 l’ensemble de distribution de probabilité sur 𝐴𝑖 .
Définition : On appelle stratégie pure 𝑎𝑖 ∈ 𝐴𝑖 .
Définition : On appelle stratégie mixte 𝛿(𝑎𝑖 ) = 𝛼𝑖 ∈ ∆𝐴𝑖 .
Définition : On appelle équilibre de Nash en stratégie mixte la probabilité de non déviation de jouer 𝑎𝑖 . C’est
donc un profil de probabilité.
14
∏ 𝛼𝑗 (𝑎𝑖 )
𝑗∈𝑁
L’espérance d’utilité est :
𝑬𝑼𝒊 (𝒂𝒊 ) = ∑ [∏ 𝜶𝒋 (𝒂𝒊 )] 𝒖(𝒂𝒊 )

𝒂∈𝑨 𝒋∈𝑵
Définition : Extension mixte d’un jeu stratégique fini. Soit 𝐺 =< 𝑁, 𝐴𝑖 , ≽𝑖 > un jeu stratégique fini. L’extension
de 𝐺 est un jeu 𝑮 =< 𝑵, ∆𝑨𝒊 , 𝑼𝒊 > où ∆𝐴𝑖 est l’ensemble des distributions de probabilité sur 𝐴𝑖 et 𝑈𝑖 est
l’espérance d’utilité du jeu
𝑿𝒋∈𝑵 ∆𝑨𝒋 → ℝ
𝑼𝒊 : { = [∑ ∏ 𝜶𝒋 (𝒂𝒊 )] 𝒖(𝒂𝒊 )
𝜶 → 𝑼𝒊 (𝜶)
𝒂∈𝑨 𝒋∈𝑵
Remarque : 𝑈𝑖 (𝛼) est linéaire en 𝛼, ∀𝑢𝑖 .
Soit (𝛼, 𝛽) un profil de stratégie mixte ∀𝜆 ∈ [0,1]
𝑼𝒊 (𝝀𝜶 + (𝟏 − 𝝀)𝜷 = 𝝀𝑼𝒊 (𝜶) + (𝟏 − 𝝀)𝑼(𝜷)
Espérance d’utilité d’une loterie = loteries des espérances d’utilité
Si 𝐴𝑖 est fini
𝑈𝑖 (𝛼) = ∑ 𝛼𝑖 (𝑎𝑖 )𝑢𝑖 (𝛼−𝑖 𝑒(𝑎𝑖 ))

𝑎𝑖 ∈𝐴𝑖
ou 𝑒(𝑎𝑖 ) est la stratégie mixte dégénérée de 𝑎𝑖 (probabilité = 1) ou stratégie pure.
Définition : Un équilibre de Nash en stratégie mixte d’un jeu stratégique est un équilibre de Nash du jeu étendu
aux stratégies mixtes.
Exemple : Bataille des sexes 𝐴 > 𝐵 > 𝐶
𝑏1 𝜷 𝑏2 𝟏 − 𝜷
𝑎1 𝜶 A;B C;C
𝑎2 𝟏 − 𝜶 C;C B;A
𝐸𝑈1 = 𝛼𝛽𝐴 + 𝛼(1 − 𝛽)𝐶 + (1 − 𝛼)𝛽𝐶 + (1 − 𝛼)(1 − 𝛽)𝐵

𝐸𝑈2 = 𝛼𝛽𝐵 + 𝛼(1 − 𝛽)𝐶 + (1 − 𝛼)𝛽𝐶 + (1 − 𝛼)(1 − 𝛽)𝐴
15
𝜕𝐸𝑈1
= 0 ↔ 𝛽𝐴 + (1 − 𝛽)𝐶 − 𝛽𝐶 − (1 − 𝛽)𝐵 = 0
𝜕𝛼
𝜕𝐸𝑈2
= 0 ↔ 𝛼𝐵 − 𝛼𝐶 + (1 − 𝛼)𝐶 − (1 − 𝛼)𝐴 = 0
{ 𝜕𝛽
𝛽[𝐴 − 𝐶 − 𝐶 + 𝐵] + 𝐶 − 𝐵 = 0
{
𝛼[𝐵 − 𝐶 − 𝐶 + 𝐴] + 𝐶 − 𝐴 = 0
𝑩−𝑪 𝟏
𝜷∗ = =
𝑨𝑪 + 𝑩 − 𝑪 𝑨 − 𝑪 + 𝟏
𝑩−𝑪
𝟏
𝜶∗ =
𝑩−𝑪
𝑨−𝑪+𝟏
Interprétations :
1. (𝛼 ∗ , 𝛽 ∗ ) représente des probabilités de non déviation.

2. La probabilité mixte représente l’espérance de gain à l’équilibre.
3. Les stratégies mixtes sont l’expression théorique d’une fréquence d’apparition empirique d’un
événement.
Exemple : Le dilemme du prisonnier 𝐴 > 𝐵 > 𝐶 > 𝐷
𝐷2 𝜷 𝐶2 𝟏 − 𝜷
𝐷1 𝜶 C;C A;D
𝐶1 𝟏 − 𝜶 D;A B;B
Que se passerait-il si les joueurs pouvaient communiquer entre eux ?
Supposons que 1 envoie un message « Je coopère ». 2 en profite, s’il croit au message il ne coopère pas car 𝐴 > 𝐵
et s’il ne croit pas au message, il ne coopère pas non plus car 𝐶 > 𝐷. Donc 2 ne coopère jamais donc 1 non plus
car le jeu est symétrique.
𝐸𝑈1 = 𝛼𝛽𝐶 + 𝛼(1 − 𝛽)𝐴 + (1 − 𝛼)𝛽𝐷 + (1 − 𝛼)(1 − 𝛽)𝐵

𝐸𝑈2 = 𝛼𝛽𝐶 + 𝛼(1 − 𝛽)𝐷 + (1 − 𝛼)𝛽𝐴 + (1 − 𝛼)(1 − 𝛽)𝐵
𝜕𝐸𝑈1
= 0 ↔ 𝛽𝐶 + (1 − 𝛽)𝐴 − 𝛽𝐷 − (1 − 𝛽)𝐵 = 0
𝜕𝛼
𝜕𝐸𝑈2
= 0 ↔ 𝛼𝐶 − 𝛼𝐷 + (1 − 𝛼)𝐴 − (1 − 𝛼)𝐵 = 0
{ 𝜕𝛽
𝛽[𝐶 − 𝐴 − 𝐷 + 𝐵] + 𝐴 − 𝐵 = 0
{
𝛼[𝐶 − 𝐷 − 𝐴 + 𝐵] + 𝐴 − 𝐵 = 0
16
𝑩−𝑨 𝟏
𝛽[𝐶 − 𝐴 − 𝐷 + 𝐵] = 𝐵 − 𝐴 ↔ 𝜶 = 𝜷 = = >𝟏
𝑩−𝑨+𝑪−𝑫 𝟏+𝑪−𝑫
𝑩−𝑨
𝑁𝑚 = {(1,1)} Aucun joueur ne coopère en stratégies mixtes.
Attention : L’équilibre en stratégie mixte est des probabilités pas des actions !
(1) et (2) se réécrivent 𝛽(𝐶 − 𝐷) + (1 − 𝛽)(𝐴 − 𝐵) ≠ 0

Supposons 𝛽 = 0 alors 𝐴 − 𝐵 > 0. Supposons 𝛽 = 1 alors 𝐶 − 𝐷 > 0.
Remarque : On a introduit de l’aléatoire dans le comportement des joueurs.
Remarque : Aucun joueur n’a choisit d’introduire de l’aléatoire dans son comportement.
Remarque : Les joueurs anticipent les déviations possibles de l’autre joueur.
Exemple : Equilibre du prisonnier avec la Main Tremblante de John Harsaniy et Rainard Seten
Appliquons une déviation exogène à l’équilibre de Nash 𝑁𝑚 . 𝑝𝑛 la solution de 𝑁𝑚 .
𝛿 = (1 − 𝜀)𝑝𝑛 + 𝜀𝑞
𝛿 = 1 − 𝜀 + 𝜀𝑞
Choisissons 𝑞 = 0
𝐷2 𝟏 − 𝜺 𝐶2 𝜺
𝐷1 C;C A;D
𝐶1 D;A B;B
1 suppose que 2 joue 𝐷2 avec 1 − 𝜀 et 𝐶2 avec 𝜀 chance. Il compare EPayoff : 𝐸𝑃[𝐷1 ] avec 𝐸𝑃[𝐶1 ].
A-t-on ∃ 𝜀 ∗ ∈ [0,1]/ 𝐸𝑃[𝐶1 ] ≥ 𝐸𝑃[𝐷1 ] ?
A-t-on (1 − 𝜀)𝐶 + 𝜀𝐴 ≤ (1 − 𝜀)𝐷 + 𝜀𝐵 ?
𝐸𝑃[𝐷1 ] ≤ 𝐸𝑃[𝐶1 ]
(1 − 𝜀)(𝐶 − 𝐷) + 𝜀(𝐴 − 𝐵) > 0
17
Il n’y a pas d’𝜀 ∈ [0,1] tel que 𝐸𝑃[𝐶1 ] ≥ 𝐸𝑃[𝐷1 ]. L’équilibre de Nash est stable.
Vocabulaire : Soit 𝐺 =< 𝑁, 𝐴, ≽𝑖 >.
• ≽𝑖 sont définie sur 𝐶 = 𝑋𝑗∈𝑁 𝐴𝑗

• ≽𝑖 sont parfaitement définie : les payoffs sont tous différents.
Définition : Un équilibre de Nash en stratégies mixtes d’un jeu stratégique 𝐺 =< 𝑁, ∆𝐴, 𝑈𝑖 > est un profil 𝜶∗ de
stratégies mixtes ayant la propriété que ∀𝑖 ∈ 𝑁 chaque action sur le support de probabilité 𝛼𝑖 ∗ est une meilleure
réponse à 𝛼−𝑖 ∗ .
N équilibre de Nash en stratégies mixtes est un n-uplet (s’il y a 𝑛 joueurs) de probabilités de non déviation.
Chaque probabilité peut s’interpréter comme une croyance. Un équilibre de Nash en stratégies mixtes représente
un état stationnaire du jeu.
III. Equilibre corrélé
On a étudié le cas où l’action d’un joueur dépend d’un signal privé qu’il reçoit de la nature. Ce signal est privé et
indépendant. (Jeu bayésien)
On étudie maintenant le cas où le signal n’est pas privé ni indépendant.
A. Un exemple : La bataille des sexes
𝐵2 𝑆2
𝐵1 2;1 0;0
𝑆1 0;0 1;2
1
On suppose qu’une variable aléatoire a une probabilité 2 d’apparaître.
Existe-il un équilibre ? L’espérance de payoffs (EP) dans ce jeu est-elle supérieure à l’espérance de payoffs de
l’équilibre de Nash en stratégies mixtes ?
2 1
𝛼∗ = 𝑒𝑡 𝛽 ∗ =
3 3
2 1 1 2 4
𝐸𝑈1 = × (2) + 0 + 0 + × × 1 =
3 3 3 3 9
2 1 1 2 2
𝐸𝑈2 = × (1) + × × 2 =
3 3 3 3 9
18
Si 𝑥 sort alors 𝑖 choisit 𝐵𝑖 alors que 𝑦 sort, i choisit 𝑆𝑖 : 𝑖 = 1,2
4 2 2
𝐸𝑈𝑖 = + =
9 9 3
2 1 3
𝐸𝑈𝑖 = + =
2 2 2
Il est donc préférable de tirer au sort que de jouer l’équilibre de Nash.
B. Exemple : Le cas d’une variable aléatoire {𝑥, 𝑦, 𝑧}
Le joueur 1 se dit si {𝑥} alors 𝐵1 , si {𝑦, 𝑧} alors 𝑆1 .
Le joueur 2 se dit {𝑧} alors 𝐵2 , si {𝑥, 𝑦} alors 𝑆2 .
𝐵2 𝑆2
𝐵1 x;z x ; x, y
𝑆1 y, z ; z y, z ; x, y
C. Formalisme
1 1 1
L’ensemble des états de la nature 𝛀 = {𝒙, 𝒚, 𝒛}. La probabilité associée est 𝑃 = {3 ; 3 ; 3}.
L’ensemble d’information du joueur i représente une partition de l’ensemble des états de la nature
𝐼1 = {{𝑥}; {𝑦, 𝑧}}
𝐼2 = {{𝑧}; {𝑥, 𝑦}}
Une stratégie est un choix d’action conditionnel à la réalisation d’une variable aléatoire.
Un équilibre est optimal pour un joueur s’il n’a pas intérêt à choisir une autre action étant donné les choix des
autres joueurs.
Définition : On appelle équilibre corrélé d’un jeu stratégique 𝐺 =< 𝑁, 𝐴𝑖 , 𝑈𝑖 > consiste en :
▪ Un espace de probabilité finie (𝛀; 𝝅) avec Ω l’ensemble des états de la nature et 𝜋 la probabilité
associée à chaque élément de Ω.
▪ ∀𝑖 ∈ 𝑁, une partition 𝑷𝒊 de Ω appelée ensemble d’information du joueur 𝑖
𝛀 → 𝑨𝒊
▪ ∀𝑖 ∈ 𝑁, une stratégie 𝝈𝒊 : {
𝝎 → 𝝈𝒊 (𝝎) = 𝒂𝒊
𝜔 ∈ 𝑃𝑖
Si { alors 𝜎𝑖 (𝜔) = 𝜎𝑖 (𝜔′) = 𝑎𝑖
𝜔′ ∈ 𝑃𝑖
19
Telle que ∀𝑖 ∈ 𝑁 un signal 𝝉𝒊 (𝝎) :
𝛀 → 𝑨𝒊
𝝉𝒊 : {
𝝎 → 𝝉𝒊 (𝝎) = 𝒂𝒊
𝜏𝑖 (𝜔) = 𝜏𝑖 (𝜔′) si 𝜔 ∈ 𝑃𝑖 et 𝜔′ ∈ 𝑃𝑖
Pour chaque stratégie on a :
∑ ∏(𝝎)𝒖𝒊 [𝝈−𝒊 (𝝎); 𝝈𝒊 (𝝎)] ≥ ∑ ∏(𝝎)𝒖𝒊 [𝝈−𝒊 (𝝎); 𝝉𝒊 (𝝎)]

𝝎∈𝛀 𝝎∈𝛀
Remarque : Etant donné Ω l’espace des probabilités et 𝜋 la partition d’information sont endogènes.
Remarque : La condition d’optimalité de la définition signifie que ∀𝜔 qui apparaît avec une probabilité positive
(> 0) 𝜎𝑖 (𝜔) est une action optimale pour 𝑖 étant données les stratégies des autres et l’information de 𝑖 sur 𝜔.
Remarque : Les joueurs sont VNM.
Proposition : N’importe quel équilibre de Nash en stratégie mixte d’un jeu stratégique fini 𝐺 =< 𝑁, 𝐴𝑖 , 𝑈𝑖 >
possède un équilibre corrélé < (Ω, 𝜋), 𝑃𝑖 , 𝐺𝑖 > dans lequel ∀𝑖 ∈ 𝑁 la distribution sur 𝐴𝑖 induite par 𝜎𝑖 est 𝛼𝑖 .
Exemple : bataille des sexes
Joueur 2
𝑩𝟐 𝑺𝟐
𝑩𝟏 (2 ; 1) (0 ; 0)
Joueur 1
𝑺𝟏 (0 ; 0) (1 ; 2)
2 1
𝑁𝑚 = { ; }
3 3
2
𝐸𝑈𝑚 =
3
𝑁𝑝 = {(𝑎1 ; 𝑏1 ) ; (𝑎2 ; 𝑏2 )}
Il existe un tirage a sort si celui-ci apporte une espérance d’utilité supérieure.
Exemple :
20
Joueur 2
𝑳 R
T (6 ; 6) (2 ; 7) 𝛼
Joueur 1
B (7 ; 2) (0 ; 0) 1−𝛼
𝛽 1−𝛽
Ω = {𝑥 , 𝑦 , 𝑧}
1
Π(𝑥) = Π(𝑦) = Π(𝑧) =
3
Le joueur 𝑖 = 1 a pour partition : {{𝑥}{𝑦 ; 𝑧}}
Le joueur 𝑖 = 2 a pour partition : {{𝑥 ; 𝑦}{𝑧}}
Calcul des stratégies mixtes :
𝐸𝑈1 = 6𝛼𝛽 + 2𝛼(1 − 𝛽) + 7(1 − 𝛼)𝛽 + 0 = 2𝛼 + 7𝛽 − 3𝛼𝛽

𝐸𝑈2 = 6𝛼𝛽 + 7𝛼(1 − 𝛽) + 2(1 − 𝛼)𝛽 + 0 = 7𝛼 + 2𝛽 − 3𝛼𝛽
𝜕𝐸𝑈1 2
= 2 − 3𝛽 = 0 𝛽∗ =
𝜕𝛼 3
𝜕𝐸𝑈2 ⟷{
2
= 2 − 3𝛼 = 0 𝛼∗ =
{ 𝜕𝛽 3
4 14 3 × 4 12 + 42 − 12 42 14
𝐸𝑈𝑖 = + − = = =
3 3 9 9 9 3
Les équilibres de Nash de ce jeu en stratégies pures 𝑁𝑝 = {(𝐵 ; 𝐿) ; (𝑇 ; 𝑅)} apparaissent chacun avec une
probabilité de 2/9.
Calcule d l’espérance d’utilité dans un jeu corrélé :
𝜎1 (𝑥) = 𝐵
𝜎1 (𝑦) = 𝜎1 (𝑧) = 𝑇
𝜎2 (𝑥) = 𝜎2 (𝑦) = 𝐿
𝜎2 (𝑧) = 𝑅
1 1 1 15 14
𝐸𝑈𝐶 = (6) + (2) + (7) = >
3 3 3 3 3
Les deux joueurs sont donc d’accord pour tirer au sort plutôt que de jouer en stratégies mixtes.
21
Proposition : soit un jeu stratégique 𝐺 = 〈𝑁 ; 𝐴𝑖 ; 𝑢𝑖 〉. Toute combinaison convexe de profil de payoffs
d’équilibre de 𝐺 est un profil de payoffs d’équilibre corrélé de 𝐺.
Proposition : soit un jeu stratégique fini 𝐺 = 〈𝑁 ; 𝐴𝑖 ; 𝑢𝑖 〉. Toute distribution de probabilité sur les résultats qui
peuvent être obtenu dans un équilibre corrélé de 𝐺 peut être obtenu dans un équilibre corrélé pour lequel :
1. L’ensemble des états de la Nature est égal à l’ensemble des actions 𝐴𝑖
2. ∀𝑖 ∈ ℕ, la partition d’informations de 𝑖 consiste en tous les ensembles de la forme suivante : {𝑎 ∈
𝐴𝑖 ; 𝑎𝑖 = 𝑏𝑖 } pour 𝑏𝑖 ∈ 𝐴𝑖
Preuve : soit 𝐺𝐶 = ⟨(Ω ; Π) ; 𝑃𝑖 ; 𝜎𝑖 ⟩ un jeu corrélé de 𝐺 = 〈𝑁 ; 𝐴𝑖 ; 𝑢𝑖 〉 alors on peut considérer 𝐺𝐶′ =

⟨(Ω′ ; Π′) ; 𝑃𝑖′ ; 𝜎𝑖 ′ ⟩ un autre jeu corrélé de 𝐺 dans lequel on a
Ω′ = 𝐴
Π ′ (𝑎) = Π ′ [{ω ∈ Ω ; σ(ω) = a}] , ∀𝑎 ∈ 𝐴
𝑃𝑖′ = 𝑒𝑛𝑠𝑒𝑚𝑏𝑙𝑒 𝑑𝑢 𝑡𝑦𝑝𝑒 {𝑎 ∈ 𝐴 ; 𝑎𝑖 = 𝑏𝑖 }, ∀𝑏 ∈ 𝐴𝑖
𝜎𝑖′ (…)
Interprétation : si les deux joueurs s’accordent sur les probabilités exogènes de chaque état de la nature, alors il
est possible qu’un tirage au sort soit Pareto dominant par rapport à un équilibre en stratégies mixtes.
Interprétation : si les deux joueurs ne s’accordent pas sur les probabilités alors il est possible qu’un tirage au sort
ne soit pas Pareto dominant. Dans ce cas, d’autres équilibres sont possibles. Par exemple 𝑖 impose son point de
vue à 𝑗.
IV. Jeux évolutionnaires
Les jeux évolutionnaires sont une variante de jeux stratégiques dans laquelle les joueurs sont des organismes
vivants.
Un jeu évolutionnaire est une variante de l’équilibre de Nash. Les joueurs sont des plantes, des animaux, des
hommes.
Lorsqu’un organisme rencontre un autre organisme il prend (≠ choisir) une décision c’est-à-dire il hérite d’un
mode de fonctionnement, de comportement. Chaque organisme est affecté par une mutation.
L’utilité représente la capacité de survivre d’un organisme.
Si le joueur 𝑖 prend l’action 𝑎 cependant que toute la population a pris l’action 𝑏 avec la probabilité 𝛽 alors la
capacité de survivre de 𝑖 est mesurée par son espérance d’utilité 𝐸𝑈(𝑎 ; 𝑏) sous 𝛽.
22
Ainsi un jeu évolutionnaire se note 𝑮𝑬 = ⟨{𝟏 ; 𝟐} ; (𝑩 ; 𝑩) ; 𝒖𝒊 ⟩
𝑢1 (𝑎 ; 𝑏) = 𝑢(𝑎 ; 𝑏)
𝑢2 (𝑎 ; 𝑏) = 𝑢(𝑏 ; 𝑎)
Un équilibre évolutionnaire est une action dans 𝐵 telle que toute la population prend l’action d’équilibre et aucun
mutant ne peut survivre.
Si un mutant est accidentellement généré à l’équilibre évolutionnaire stable alors il ne peut pas dominer la
population. Un 𝑏 ≠ 𝑏 ∗ ne peut être pris que par une plus faible fraction d’organismes.
A l’équilibre, aucun mutant ne peut avoir une espérance d’utilité supérieure à celle du reste de la population. Le
mutant meurt sans envahir la population.
Le payoff moyen d’un mutant s’écrit (𝟏 − 𝜺)𝒖(𝒃 ; 𝒃∗ ) + 𝜺𝒖(𝒃 ; 𝒃) où (1 − 𝜀) est la probabilité qu’un mutant
rencontre un non mutant.
Le payoff moyen d’un non mutant s’écrit (𝟏 − 𝜺)𝒖(𝒃∗ ; 𝒃∗ ) + 𝜺𝒖(𝒃∗ ; 𝒃)
A l’équilibre (𝟏 − 𝜺)𝒖(𝒃 ; 𝒃∗ ) + 𝜺𝒖(𝒃 ; 𝒃) < (𝟏 − 𝜺)𝒖(𝒃∗ ; 𝒃∗ ) + 𝜺𝒖(𝒃∗ ; 𝒃)
On suppose que 𝑏 ≠ 𝑏 ∗, il faut que

𝒖(𝒃 ; 𝒃∗ ) < 𝒖(𝒃∗ ; 𝒃∗ )
𝑜𝑢 𝑏𝑖𝑒𝑛
{ 𝒖(𝒃 ; 𝒃∗ ) = 𝒖(𝒃∗ ; 𝒃)
{
𝒖(𝒃 ; 𝒃) < 𝒖(𝒃∗ ; 𝒃)
Définition : équilibre évolutionnairement stable : soit 𝐺𝐸 = ⟨{1 ; 2} ; (𝐵 ; 𝐵) ; 𝑢𝑖 ⟩ un jeu stratégique symétrique

tel que 𝑢1 (𝑎 ; 𝑏) = 𝑢2 (𝑏 ; 𝑎) = 𝑢(𝑎 ; 𝑏) pour certaines fonctions 𝑢.
Une stratégie évolutionnairement stable (ESS) de 𝐺𝐸 est une action 𝑏 ∗ ∈ 𝐵 tel que (𝑏 ∗ ; 𝑏 ∗ ) est un équilibre de
Nash de 𝐺𝐸 . On a 𝑢(𝑏 ; 𝑏) < 𝑢(𝑏 ∗ ; 𝑏) pour tout 𝑏 ≠ 𝑏 ∗ avec 𝑏 ∈ 𝐵 et 𝑏 ∗ ∈ 𝐵 où B représente l’ensemble des
stratégies mixtes d’un quelconque ensemble d’actions.
Chapitre 4 : Jeux sous extensive en informations parfaites
Un jeu sous forme extensive en information parfaite (JEIP) est la description complète de la structure séquentielle
des décisions des joueurs placés en situation stratégique.
23
Dans un jeu sous forme extensive en information parfaite, les joueurs peuvent formuler différents plans d’actions
dans le temps suivant les étapes du jeu.
Pour cela, il faut modifier les primitives du jeu pour que les joueurs puissent reconsidérer leurs choix d’actions au
fur et à mesure que le jeu se déroule.
Dans ce cadre, le concept d’équilibre de Nash est insatisfaisant si on ignore la structure séquentielle des
décisions. C’est pourquoi il faut définir un concept alternatif dit d’équilibre parfait en sous jeux (EPSJ).
I. Définition d’un jeu extensif en information parfaite
Cette définition est due à Selten dans son article de 1975.
Définition : un jeu extensif en information parfaite consiste en :
1. 𝑁 = {1 ; 2 ; … ; 𝑛} ou bien 𝑁 = [𝑛 ; 𝑛] est un ensemble de joueurs.

2. Un ensemble de séquences 𝑯 vérifiant les propriétés suivantes :
➢ ∅ ∈ 𝐻 : la séquence vide fait partie de l’ensemble des histoires. ∅ s’appelle histoire initiale
➢ Si (𝑎𝑘 )𝑘=1,..,𝐾 ∈ 𝐻 (y compris 𝐾 ⟶ ∞) et 𝐿 < 𝐾 alors (𝑎𝑘 )𝑘=1,..,𝐿 ∈ 𝐻. Le jeu contient toutes les
histoires précédentes
➢ Si (𝑎𝑘 )𝑘=1,..,∞ satisfait (𝑎𝑘 )𝑘=1,..,𝐿 ∈ 𝐻 alors (𝑎𝑘 )𝑘=1,..,∞ ∈ 𝐻. Chaque élément de H constitue une
histoire. Chaque composante d’une histoire est une action prise par un (ou plusieurs) joueurs. Z
est l’ensemble des histoires terminales y compris l’infini.
3. 𝑃(ℎ) = 𝑖 ∈ 𝑁
𝐻\𝑍 → 𝑁
𝑃: {
ℎ → 𝑃(ℎ) = 𝑖
C’est la fonction des joueurs qui indique qui joue à chaque histoire ℎ ∈ 𝐻.
4. La relation de préférence est définie sur Z.
La différence essentielle entre le jeu statique 𝐺 et le jeu séquentiel 𝐺𝑆 est la structure séquentielle des décisions
𝐻; 𝑝(ℎ) qui est de nature à modifier le concept d’équilibre de Nash.
L’objet de l’exemple suivant est de montrer les difficultés qu’engendre le concept d’équilibre de Nash dans un jeu
séquentiel.
II. Exemple
2 personnes doivent se partager 2 biens indivisibles et identiques.
Règles du jeu : Le joueur 1 propose un partage. Le J2 accepte et le partage a lieu, s’il refuse chaque joueur à 0.
Montrer qu’il s’agit d’un jeu sous extensive en information parfaite.

24
• 𝑁 = {1 ; 2 } est un ensemble discret de joueurs.
• 𝐻 = {∅, (2,0); (1,1); (0,2); (2,0)𝑌; (2,0)𝑁; (1,1)𝑌; (1,1)𝑁; (0,2)𝑌; (0,2)𝑁} ensemble de 10 histoires.
• 𝑃(∅) = 1 et 𝑃(1) = 2
• ≽𝑖 est définie sur 𝑍 l’ensemble des histoires terminales. Chaque joueur préfère 2 biens à n’importe quel
autre partage.
Tracer l’arbre de décision.
Un nœud correspond à une histoire, il y en a 10. Chaque branche est une action, il y en a 9.
Trouver les équilibres de Nash.
1 2 3 4 5 6 7 8
YYY YYN YNY YNN NYY NYN NNY NNN
A 2,0 (2,0) (2,0) (2,0) (2,0) (0,0) (0,0) (0,0) (0,0)
B 1,1 (1,1) (1,1) (0,0) (0,0) (1,1) (1,1) (0,0) (0,0)
C 0,2 (0,2) (0,0) (0,2) (0,0) (0,2) (0,0) (0,2) (0,0)
Le J1 raisonne comme suit :
• Si J2 joue 1 alors J1 joue A (1, A)

• Si J2 joue 5 alors J1 joue B (5, B)
• Si J2 joue 6 alors J1 joue B (6, B)
• Si J2 joue 7 alors J1 joue A, B ou C (7, A) (7, B) (7, C)
• Si J2 joue 8 alors J1 joue A, B ou C (8, A) (8, B) (8, C)
Le J2 raisonne comme suit :
• Si J1 joue A alors J2 joue 1, 2, 3, 4, 5, 6, 7 ou 8

• Si J1 joue B alors J2 joue 1, 2, 5, 6
• Si J1 joue C alors J2 joue 1, 3, 5, 7
𝑁𝑝 = {(𝐴, 1); (𝐴, 2); (𝐴, 3); (𝐴, 4); (𝐴, 7); (𝐴, 8); (𝐵, 5); (𝐵, 6); (𝐶, 7)}
25
Il y a 9 équilibres de Nash, on ne peut pas les choisir.
III. Stratégies
Dans un jeu séquentiel (sous forme extensive avec information parfaite), la notion de stratégie correspond à un
plan d’action spécifiant l’action prise par chaque joueur après chaque histoire pour laquelle c’est son tour de
jouer 𝑃(ℎ) = 𝑖 ℎ ∈ 𝐻 ∖ 𝑍.
Définition : Une stratégie d’un joueur 𝑖 ∈ 𝑁 dans un jeu sous forme extensive avec information parfaite 𝚪 = <
𝑵, 𝑯, 𝑷, ≽𝒊 > est une fonction qui affecte une action après chaque histoire
∀ℎ ∈ 𝐻 ∖ 𝑍 / 𝑃(ℎ) = 𝑖
𝐻\𝑍 → 𝑁
𝑃: {
ℎ → 𝑃(ℎ) = 𝑖
Remarque : La notion de stratégie ne dépend pas de la forme du jeu.
Dans ce jeu, il y a 7 histoires, 6 actions et 4 histoires terminales.
Remarque : Une stratégie spécifie les actions à choisir par un joueur à chaque étape du jeu pour laquelle il doit
prendre une décision même pour les stratégies qui ne sont pas atteintes.
Dans notre exemple (𝐵, 𝐸) et (𝐵, 𝐹) s’interprètent comme des menaces.
Pour chaque profil de stratégies 𝑆 = {𝛿𝑖 } 𝑖 ∈ 𝑁 : 𝑁 → ℝ, 𝑡 → 𝑂𝑡 de Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > jeux sous forme extensive
en information parfaite, on définit une fonction de résultat notée 𝑂 (outcome) (𝑎1 , … , 𝑎𝑘 ) ∈ 𝑍 𝑡𝑞 0 ≤ 𝑘 < 𝑍
𝑆𝑝(𝑎1 ,…,𝑎𝑘 ) (𝑎1 , … , 𝑎𝑘 ) = 𝑎𝑘+1
𝑆𝑚(𝛼1 ,…,𝛼𝑘) (𝑎1 , … , 𝑎𝑘 ) = 𝛼 𝑘+1
IV. Equilibre de Nash
26
Définition : Un équilibre de Nash en stratégies pures d’un jeu sous forme extensive en information parfaite Γ =
< 𝑁, 𝐻, 𝑃, ≽𝑖 > est un profil de stratégies vérifiant ∀𝑖 ∈ 𝑁, 𝑂(𝑆−𝑖 ∗ , 𝑆𝑖 ∗ ) ≥ 𝑂(𝑆−𝑖 ∗ , 𝑆𝑖 ) avec 𝑆𝑖 ∈ 𝐻; 𝑃(ℎ).
Il est possible de passer d’un jeu Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > à un jeu stratégique statique G = < 𝑁, 𝑆𝑖 , 𝑢𝑖 >
• ∀𝑖 ∈ 𝑁, 𝑆𝑖 est l’ensemble de stratégies de 𝑖 dans Γ

• ∀𝑖 ∈ 𝑁, ≽𝑖 est définie comme suit 𝑠 ≽𝑖 𝑠 ′ ↔ 𝑂(𝑠) ≽𝑖 𝑂(𝑠 ′ ) ∀𝑠 ∈ 𝑋𝑗∈𝑁 𝑆𝑗 et ∀𝑠′ ∈ 𝑋𝑗∈𝑁 𝑆𝑗
On restreint maintenant la notion de stratégie pour éliminer les histoires incohérentes entre elles.
Définition : On appelle stratégie réduite du joueur 𝑖 ∈ 𝑁 la fonction 𝑓𝑖 dont le domaine de définition est
l’ensemble {ℎ ∈ 𝐻; 𝑃(ℎ) = 𝑖} = 𝐷𝑓𝑖 ayant les propriétés suite :
• Elle associe à chaque histoire ℎ ∈ 𝐷𝑓𝑖 une action ∈ ℎ.

• Une histoire ℎ avec 𝑝(ℎ) = 𝑖 est dans 𝐷𝑓𝑖 si et seulement toutes les actions de 𝑖 ∈ ℎ sont celles imposées
par 𝑓𝑖 si ℎ(𝑎𝑘 ) et ℎ′(𝑎𝑘 )𝑎1 …𝑎𝐿 alors 𝑓𝑖 (ℎ′ ) = 𝑎𝐿+1 est une suite de ℎ avec 𝑝(ℎ′ ) = 𝑖.
• Chaque stratégie réduite de 𝑖 correspond à l’ensemble de stratégies 𝑖 étant le vecteur des stratégies des
autres joueurs dans cet ensemble conduisant au même résultat.
Remarque : Un équilibre de Nash d’un jeu sous forme extensive avec information parfaite peut être restreint aux
stratégies réduites.
Définition : Soit un jeu sous forme extensive avec information parfaite Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > et G = < 𝑁, 𝑆𝑖 , ≽𝑖 ′ >
le jeu associé, ∀𝑖 ∈ 𝑁, les stratégies 𝑠𝑖 ∈ 𝑆𝑖 et 𝑠′𝑖 ∈ 𝑆𝑖 sont dites équivalentes. Si ∀𝑠−𝑖 ∈ 𝑆−𝑖 on a
(𝑆𝑖′ , 𝑆−𝑖 )~𝑖 (𝑆𝑖 , 𝑆−𝑖 ).
La forme réduite 𝚪 est un jeux stratégique 𝐆′ = < 𝑵, 𝑺𝒊 , ≽𝒊 ′′ > pour lequel ∀𝑖 ∈ 𝑁 chaque ensemble 𝑆 contient
un membre de chaque ensemble de stratégie équivalente dans 𝑆′𝑖 et ≽𝑖 ′′ est un pré-ordre de préférences défini
sur 𝑋𝑗∈𝑁 𝑆′𝑗 induite.
Exemple :
L’ensemble des équilibres de Nash est 𝑁𝑝 = {(𝐴, 𝑅), (𝐵, 𝐿)}
27
(𝐵, 𝐿) s’explique grâce au concept de menace. Le J2 indique au J1 que s’il joue A, il joue L et dans ce cas J1 préfère
jouer B s’il croit à la menace du J2.
Remarque : Ici, la menace du J2 n’est pas crédible car si le J1 joue A et le J2 est rationnel alors il préfère R car 1 >
0.
Dans l’exemple du partage de 2 biens
Y N
A : (2,0) 2,0 0,0
B : (1,1) 1,1 0,0
C : (0,2) 0,2 0,0
Si Y alors AY
Si N alors AN, BN, CN
S A alors AY, AN
Si B alors BY
Si C alors CY
Les paires d’actions communes sont AY et AN mais le J2 a des intérêts à dévier donc le seul équilibre de Nash en
stratégies pures réduites est BY.
𝑁𝑝𝑟 = {((1,1); 𝑌)}
Exemple :
28
Dans le sous-jeu 1, le J1 choisit 𝑚𝑎𝑥{𝑣1 , 𝑣2 } = 𝑣1 .
Entre 1 et 2, les payoffs du J2 sont {𝑤1 ; 𝑤4 } et dans ce cas, le J2 choisit 𝑚𝑎𝑥{𝑤1 ; 𝑤4 } = 𝑤4 .
Entre 3 et 4, les payoffs du J2 sont {𝑤5 ; 𝑤8 } et dans ce cas, le J2 choisit 𝑚𝑎𝑥{𝑤5 ; 𝑤8 } = 𝑤8 .
Entre 1 et 2, le J1 𝑚𝑎𝑥{𝑣4 ; 𝑣8 }.
𝑁 = {(𝑣8 ; 𝑤8 )}
V. Equilibre parfait en sous-jeux
Définition : Le sous-jeux d’un jeu sous extensive avec information parfaite Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > qui suit l’histoire ℎ
est le jeu extensif 𝚪(𝐡) =< 𝑵, 𝑯|𝒉, 𝑷|𝒉, ≽𝒊 |𝒉 > où
▪ 𝐻|ℎ représente l’ensemble des conséquences ℎ′ pour lesquelles (ℎ, ℎ′ ) ∈ 𝐻

▪ 𝑃|ℎ (ℎ′ ) = 𝑃(ℎ, ℎ′ ) ∀ℎ′ ∈ 𝐻|ℎ
▪ ≽𝑖 |ℎ est défini par ℎ′ ≽𝑖 ℎ′′ ↔ (ℎ, ℎ′ ) ≽𝑖 (ℎ, ℎ′′ )
Remarque : L’action prescrite pour chaque joueur doit être optimale étant donnée l’action des autres joueurs ;
après chaque histoire. On note 𝑠𝑖 |ℎ la stratégie qui induit le sous-jeu Γ(h). On note le résultat 𝒐𝒊 |𝒉.
Définition : Un équilibre parfait en sous jeux d’un jeu sous forme extensive en information parfaite Γ = <
𝑁, 𝐻, 𝑃, ≽𝑖 > est un profil de stratégie tel que ∀𝑖 ∈ 𝑁, ∀ℎ ∈ 𝐻 et 𝑃(ℎ) = 𝑖 on a ∀𝑠𝑖 ∈ Γ(h)
𝒐𝒉 (𝒔−𝒊 ∗ |𝒉; 𝒔𝒊 ∗ |𝒉) ≽𝒊 𝒐𝒉 (𝒔−𝒊 ∗ |𝒉; 𝒔𝒊 |𝒉)
Remarque : Un équilibre parfait en sous jeux est un profil de stratégie Γ(h) tel que ∀ℎ ∈ 𝐻 𝑠𝑖 ∗ |ℎ est un équilibre
de Nash de Γ(h).
Remarque : Cette procédure élimine les équilibres non crédibles.
Exemple : Equilibre de Stackelberg
𝑚𝑎𝑥𝑎1 ∈𝐴1 𝜋1 (𝑎1 ; 𝑎2 ∗ )𝑎𝑣𝑒𝑐 𝑎2 ∗ = 𝑎𝑟𝑔𝑚𝑎𝑥𝑎1 ∈𝐴1 𝜋2 (𝑎∗ ; 𝑎2 )
Lemme : La propriété de déviation unique
29
Soit Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > un jeu sou forme extensive en information parfaite avec horizon fini. Un profil de
stratégies 𝑠 ∗ est un équilibre parfait en sous jeu de Γ si et seulement si ∀𝑖 ∈ 𝑁, ∀ℎ ∈ 𝐻 y compris ℎ = ∅ et
𝑃(ℎ) = 𝑖 on a ∀𝑠𝑖 ∈ Γ(h) avec 𝑠𝑖 ≠ 𝑠𝑖 ∗ |ℎ.
𝒐𝒉 (𝒔−𝒊 ∗ |𝒉; 𝒔𝒊 ∗ |𝒉) ≽𝒊 𝒐𝒉 (𝒔−𝒊 ∗ |𝒉; 𝒔𝒊 |𝒉)
Proposition : Théorème de Kuhn
Chaque jeu sous forme extensive en information parfaite fini possède un équilibre parfait en sous jeu.
Démonstration : La démonstration repose sur le principe de « rétroduction » Backward induction. On commence

par la fin et on remonte vers le début. L’unicité n’est pas garantie. C’est un algorithme qui permet de déterminer
un équilibre parfait en sous jeu. C’est une procédure naturelle pour analyser le jeu.
VI. Extensions naturelles
A. L’incertitude exogène
On étend la définition d’un jeu sous forme extensive avec information parfaite en autorisant le hasard à intervenir
dans le jeu.
▪ 𝑁 un ensemble fini de joueurs

▪ 𝐻 un ensemble d’histoires du jeu
𝐻 → 𝑁 ∪ {𝑐}
▪ 𝑃 une fonction de joueurs 𝑃: {
ℎ → 𝑃(ℎ)
Si 𝑃(ℎ) = 𝑐 alors le hasard intervient dans le jeu.
▪ 𝑓𝑐 (. |ℎ) est une mesure de probabilité sur 𝐴(ℎ). Toutes les mesures de probabilités sont supposées
indépendantes.
▪ ∀𝑖 ∈ 𝑁, ≽𝒊 est défini sur une loterie sur 𝑍
B. Coups simultanés
Après l’histoire ℎ, les joueurs peuvent jouer en même temps. On modifie la définition d’un jeu sous forme
extensive en information parfaite comme suit : Γ = < 𝑁, 𝐻, 𝑃, ≽𝑖 > est un jeu sous forme extensive en
information parfaite avec coups simultanés si :
▪ 𝑁 un ensemble fini de joueurs

▪ 𝐻 un ensemble d’histoires du jeu
𝐻→𝑁
▪ ≽𝒊 →∶ {
ℎ → 𝑃(ℎ)
et pour chaque ℎ ∈ 𝐻 ∖ 𝑍 on a une collection d’ensembles {𝐴𝑖 (ℎ)}𝑖 ∈ 𝑃(ℎ)
𝐴(ℎ) = {𝑎: (ℎ, 𝑎) ∈ 𝐻 = 𝑋𝑗∈𝑃(ℎ) 𝐴𝑗 (ℎ)}
Une histoire dans un tel jeu est une suite de vecteurs dont les composantes sont les actions 𝑎𝑘 prises par les
joueurs dont les coups ont été jouées après l’histoire ℎ.
30
𝐻 ∖ 𝑍 → 𝐴𝑖 (ℎ)∀𝑖 ∈ 𝑃(ℎ)
Une stratégie 𝑠𝑖 : {
ℎ → 𝑠𝑖 (ℎ)
La seule différence avec la définition habituelle est 𝑖 ∈ 𝑃(ℎ).
Chapitre 5 : Les jeux de marchandages
I. Introduction
Problème : Choisir une meilleure issue possible dans un jeu où il s’agit de partager « un gâteau ».
A. Marchandage et jeux
En théorie des jeux non coopératifs, on étudie des situations conflictuelles telles que chaque joueur s’engage
dans une suite d’actions (une fois pour toute c’est à dire jeux stratégiques ou jeux sous forme extensive en
information parfaite). Toutefois, il existe des situations conflictuelles plus compliquées dans lesquelles les joueurs
marchandent. S’il y a plus qu’une suite d’actions plus avantageuses que désavantageuses ∀𝑖 ∈ 𝑁 alors une
certaine forme de négociation est nécessaire pour résoudre ce conflit.
La théorie des jeux est utile pour modéliser ce type de situation. Nash est le premier à avoir étudié ce type de jeu.
Il montre qu’elle est l’influence de la patience et de l’aversion au risque.
B. Un jeu de marchandage avec offre alternative
Soit 𝑋 l’ensemble des résultats possible. 𝑥 ∈ 𝑋 est un partage possible d’un « gâteau ». « 𝑫 = default point »
correspond à l’échec de la négociation, personne n’a quelque chose !
𝑋 = [0,1] est l’ensemble des divisions possibles du gâteau. Une telle situation se modélise par un jeu sous forme
extensive avec information parfaite dans lequel la procédure de négociation est spécifiée.
On introduit le temps dont la valeur (pour chaque joueurs) est non négative : attendre coûte. Il y a donc un taux
d’actualisation qui affecte la fonction d’utilité d’un partage 𝑥 ∈ 𝑋.
𝑡 = 0, 1e coup : J1 fait une proposition 𝑥 ∈ 𝑋 à J2. Soit J2 accepte et obtient 𝑥, soit il refuse.
𝑡 = 1, 2e coup : J2 fait une proposition à J1 𝑥′ ∈ 𝑋. Soit J1 accepte et obtient 1 − 𝑥, soit il refuse.
NB : 𝑥 = 𝑥′ est possible.
31
Si ∅ = 𝑡 = 0, aux périodes paires J1 fait une proposition et impaires J2 fait une proposition.
Si ∅ = 𝑡 = 1, c’est l’inverse.
NB : Ce jeu est à horizon infini.
Si la négociation n’aboutit pas alors on considère que chaque joueur à « 𝐷 le default point »
𝚪 = < 𝑵, 𝑻, 𝑯, 𝑷, ≽𝒊 >
▪ 𝑁 = {1,2}
▪ 𝑋 = {𝑒𝑛𝑠𝑒𝑚𝑏𝑙𝑒 𝑐𝑜𝑚𝑝𝑎𝑐𝑡 𝑑𝑒𝑠 𝑎𝑐𝑐𝑜𝑟𝑑𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠}
▪ 𝑇 est l’ensemble des nombres ≥ 0
▪ 𝐻 l’ensemble des histoires
1 𝑠𝑖 ℎ 𝑖𝑚𝑝𝑎𝑖𝑟
▪ 𝑃(ℎ) = {
2 𝑠𝑖 ℎ 𝑝𝑎𝑖𝑟
▪ ≽𝑖 → 𝑍
Les joueurs sont sensibles à 3 points :
1. Le fait qu’un accord soit conclu.

2. Le temps mis pour y parvenir.
3. Le contenu de l’accord.
Une solution est un couple (𝑥𝑖 , 𝑡) avec 𝑥𝑖 ∈ 𝑋 et 𝑡 ∈ 𝑇.
L’ensemble des 𝐻 est de différents types possibles :
▪ Scénario 1 : ∅ (𝑥 0 , 𝑅); (𝑥 1 , 𝑅) … (𝑥 𝑡 , 𝐴 𝑥 𝑡+1 𝑜𝑢 𝑅)

▪ Scénario 2 : (𝑥 0 , 𝑅); (𝑥 1 , 𝑅) … (𝑥 𝑡 , 𝑅) 𝑥 𝑡+1 𝐴
▪ Scénario 3 : (𝑥 0 , 𝑅); (𝑥 1 , 𝑅) … (𝑥 𝑡 , 𝑅) 𝑥 ∞ 𝐴
▪ Scénario 4 : (𝑥 0 , 𝐴)
La relation de préférence ≽𝑖 est définie sur l’ensemble des partages possibles y compris le défaut (𝑋𝑋𝑇) ∪ {𝐷}
Hypothèse 1 : Aucun accord n’est pire qu’un désaccord.
(𝑥, 𝑡) ≽𝑖 𝐷 ∀𝑖 ∈ 𝑁 𝑒𝑡 ∀𝑥 ∈ 𝑋, 𝑡 ∈ 𝑇
32
Hypothèse 2 : Le temps a de la valeur.
(𝑥, 𝑡) ≽𝑖 (𝑥, 𝑡 + 1) ∀𝑖 ∈ 𝑁 𝑒𝑡 ∀𝑥 ∈ 𝑋, 𝑡 ∈ 𝑇
(𝑥, 0) ≽𝑖 𝐷
Hypothèse 3 : Les préférences sont stationnaires.
(𝑥, 𝑡) ≽𝑖 (𝑥, 𝑡 + 1) ↔ (𝑥, 0) ≽𝑖 (𝑦, 1)

(𝑥, 𝑡) ≽𝑖 (𝑦, 𝑡) ↔ (𝑥, 0) ≽𝑖 (𝑦, 0)
Hypothèse 4 : Les préférences sont continues.
Si 𝑥𝑛 ∈ 𝑋 et 𝑦𝑛 ∈ 𝑁, ∀𝑛 ∈ 𝑁
𝑥𝑛 → 𝑥 ∈ 𝑋
𝑦𝑛 → 𝑦 ∈ 𝑋
(𝑥𝑛 , 𝑡) ≽𝑖 (𝑦𝑛 , 𝑠)∀𝑛 → (𝑥, 𝑡) ≽𝑖 (𝑦, 𝑠)
Si H1, H2, H3 et H4 alors ∃𝛿 ∈ [0,1] et ∃ 𝑢𝑖 continue
𝑋→ℝ
𝑢𝑖 : {
𝑥 → 𝑢𝑖 (𝑥)
𝑋×𝑇 →ℝ
𝛿 𝑡 𝑢𝑖 : { ∀𝛿 ∈ [0,1]
(𝑥, 𝑡) → 𝛿 𝑡 𝑢𝑖 (𝑥)
Ainsi
(𝑥, 𝑡) ≽𝑖 (𝑦, 𝑠) ↔ 𝛿 𝑡 𝑢𝑖 (𝑥) ≥ 𝛿 𝑡 𝑢𝑖 (𝑦)
33
Remarque : Attention 𝜀 𝑡 𝑢𝑖 (𝑥) représente les mêmes préférences que 𝛿 𝑡 𝑢𝑖 (𝑥) donc si 𝜀 > 𝛿, on ne peut pas
conclure que l’un des joueurs est plus impatient que l’autre.
Remarque : si < 𝑁, 𝐻, 𝑃, ≽𝑖 > est un jeu extensif en information parfaite, alors on définit le jeu associé avec offres
alternatives < 𝑋; ≽𝑖 >. On remarque que 𝐻 n’est pas nécessaire car il n’est pas tenu compte des offres passées.
Exemple : Couper le gâteau
𝑥𝑖 ≥ 0
𝑋 = {(𝑥1 , 𝑥2 { 1 + 𝑥2 = 1 , 𝑖 = 1,2}
): 𝑥
𝑥𝑖 ≤ 1
avec 𝑋 est l’ensemble des accords possibles ↔ ensembles des partages possibles du gâteau.
Les préférences sont définies car chaque joueur préfère plus que moins.
{𝑋 × 𝑇} ∪ {𝐷}
(𝑥, 𝑡) ≽ (𝑦, 𝑡) ↔ 𝑥𝑖 ≽𝑖 𝑦𝑖
{
↔ (𝑥1 ; 1 − 𝑥1 ) ≽ (𝑦1 ; 1 − 𝑦1 ) ↔ (𝑥1 ; 𝑥2 ) ≽ (𝑦1 ; 𝑦2 )
𝐷~1 ((0,1), 0) et 𝐷~2 ((0,1), 0)
Les préférences peuvent être représentées par :

𝑋×𝑇 →ℝ
𝑊𝑖 : { ∀𝛿 ∈ [0,1]
(𝑥, 𝑡) → 𝛿 𝑡 𝑤𝑖 (𝑥)
𝑤𝑖 (0) = 0
L’ensemble des équilibres de Nash est très grand. ∀𝑥 ∗ ∈ 𝑋; ∃ un équilibre de Nash acceptable.
J1 a une stratégie d’équilibre 𝑥 ∗ joué à ℎ = ∅. J2 accepte c’est la fin. Si J2 refuse et propose 𝑥1 ∗ et J1 accepte,
c’est la fin. Si la négociation n’aboutit jamais chacun à 0. Rien n’empêche d’exclure les menaces non crédibles.
II. Equilibre parfait en sous jeux
A. Caractérisation
Pour qu’un jeu < 𝑋, ≽𝑖 > possède un unique équilibre de Nash, il faut faire 4 hypothèses :
34
Hypothèse 1 : Aucun accord n’est pire qu’un désaccord et on n’a jamais 𝑥, 𝑦 / (𝑥, 0)~(𝑦, 0) ∶ (13; 87)~(23; 77).
Hypothèse 2 : (𝑏 𝑖 ; 1)~𝑗 (𝑏 𝑖 ; 0)~𝑗 𝐷, 𝑖 = 1,2 𝑒𝑡 𝑗 ≠ 𝑖
𝑏 𝑖 est la meilleure réponse de 𝑖.
Hypothèse 3 : La frontière de Pareto de 𝑥 est strictement monotone. Si 𝑥 est un accord efficient alors ∄𝑦/
(𝑦, 0) ≽𝑖 (𝑥, 0).
Hypothèse 4 : ∃! (𝑥 ∗ ; 𝑦 ∗ )/(𝑥 ∗ , 1)~(𝑦 ∗ , 0)𝑒𝑡 (𝑦 ∗ , 1)~(𝑥 ∗ , 0)
Sous H1, H2, H3 et H4 attendre est coûteux et de plus en plus coûteux avec le temps. La perte est croissante dans
le temps.
Si la frontière de Pareto est 𝑋, l’ensemble des accords {𝒙 ∈ ℝ𝟐 ; 𝒙𝟐 = 𝒈(𝒙𝟏 )} avec 𝒈 concave décroissante et si
les préférences sont définies par 𝛿 𝑡 𝑥𝑖 , 𝛿 ∈ [0,1] alors on a la proposition suivante :
Proposition : Soit (𝑋, ≽𝑖 ) un jeu de marchandage avec offres alternatives. Si ce jeu vérifie H1, H2, H3, H4 alors il
(𝑥 ∗ , 1)~(𝑦 ∗ , 0)
possède un équilibre parfait en sous-jeu. Soit (𝑥 ∗ , 𝑦 ∗ ) l’unique paire d’accords efficients tels que { ∗ .
(𝑦 , 1)~(𝑥 ∗ , 0)
Dans chaque équilibre parfait en sous jeu,
▪ J1 propose toujours 𝑥 ∗ , accepte 𝑦 ∗ et n’importe 𝑥 ∈ 𝑋 / (𝑥, 0) ≽ (𝑦, 0). Il rejette 𝑥/ (𝑦 ∗ , 0) ≽𝑖 (𝑥, 0).
▪ J2 propose toujours 𝑦 ∗ , accepte 𝑥 ∗ et n’importe 𝑥/ (𝑥, 0) ≽2 (𝑥 ∗ , 0) 𝑒𝑡 (𝑥 ∗ , 0) ≽2 (𝑥, 0).
B. Propriétés de l’équilibre
1. Efficience : Sous H1, H2, H3 et H4, l’équilibre est atteint à ∅ ;

2. Stationnarité des stratégies : J1 propose 𝑥 ∗ , J2 propose 𝑦 ∗ .
3. Le J1 a un avantage.
Proposition : Soient 2 jeux de marchandage avec offre alternatives < 𝑋, ≽𝑖 >; < 𝑋, ≽𝑖 ′ >. Chaque jeu satisfait H1
– H4 :
• si ≽′𝑖=1 traduit une impatience au moins aussi grande que ≽𝑖=1 et ≽′2 =≽2.
• si 𝑥 ∗ représente un équilibre parfait en sous jeu de (𝑋, ≽𝑖 ) et 𝑥′ est l’accord atteint dans < 𝑋, ≽ ′ > alors
(𝑥 ∗ , 0) ≽1 (𝑥 ′ , 0).
III. Variations et extensions
A. Importance de la procédure
35
Supposons qu’en ℎ = ∅, le J1 fasse toutes les offres possibles : dans ce cas n’importe quelle offre de 2 est un
équilibre de Nash, il est unique ! En effet, il correspond à 𝑏1 ! Mais tous les jours ne sont pas traités
symétriquement.
B. Plus que 2 joueurs
𝑥𝑖 ≥0
Soient un < 𝑋, ≽𝑖 > 𝑖 = 1,2,3 et 𝑋 = {(𝑥1 , 𝑥2 , 𝑥3 ) ∈ 𝑋 3 / 𝑥𝑖 ≤1 }
𝑥1 +𝑥2 +𝑥3 =1
𝛿 𝑡 𝑢𝑖 (𝑥𝑖 )𝑎𝑣𝑒𝑐 0<𝛿<1
Procédure de marchandage : ℎ = ∅
J1 fait une proposition. J2 considère la proposition : si non fin, J2 fait une proposition, si oui J3 considère la
proposition : si non , J3 fait une proposition, si oui fin.
Graphique
1
Si 𝛿 ∈ ]2 ; 1[ alors ∃ un équilibre parfait en sous jeu.
36

Cours Entier TDJ

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Cours Entier TDJ

Uploaded by

Copyright:

Available Formats

Chapitre 1 : Introduction générale

I. La théorie des jeux

II. La notion de jeux et de solutions

III. Les jeux coopératifs et les jeux non coopératifs

A. Les jeux en information parfaite/imparfaite

IV. Le comportement rationnel

Soit 𝑁 = {1 ; 2 ; … ; 𝑛} un ensemble de joueurs et ∀𝑖 ∈ 𝑁 on a 𝐴𝑖 = {𝑎1𝑖 ; 𝑎2𝑖 ; … ; 𝑎𝑛𝑖 } l’ensemble des

Application : un modèle de choix rationnels en présence d’incertitude

On peut définir une fonction d’espérance de gain :

PARTIE 1 : JEUX STRATEGIQUES

Chapitre 2 : Equilibre de Nash

II. Notion de jeu stratégique

On parle d’espérance d’utilité ∑𝑲

L R Un jeu est défini par :

A. La bataille des sexes Luce D. Raiffa 1957

Ecrire le jeu sous forme matricielle.

Quel est l’ensemble 𝑵𝒑 des équilibres de Nash en stratégies pures ?

Ainsi, 𝑁𝑝 = {(𝐵1, 𝐵2 ), (𝑆1 , 𝑆2 )}

• 𝑁 = {1,2} est l’ensemble de joueur où 1 est la « dame » et 2 le « monsieur ».

Quel est l’ensemble des équilibres de Nash ?

Ainsi, 𝑁𝑝 = {(𝐵1, 𝐵2 ), (𝑆1 , 𝑆2 )}

• 𝑁 = {1,2} est l’ensemble de joueur.

• 𝑁 = {1,2} est l’ensemble de joueur.

Quel est l’ensemble des équilibres de Nash ?

• 𝑁 = {1,2} est l’ensemble de joueur où 𝑖 = 1,2 est l’un des 2 animaux.

Quel est l’ensemble des équilibres de Nash ?

V. Existence d’un équilibre de Nash

Sous forme vectorielle 𝑎∗ ∈ 𝐵(𝑎∗ ).

• 𝐴𝑖 est non vide, compact et convexe.

VI. Les jeux strictement concurrentiels

On cherche les équilibres de Nash : Le joueur 1 raisonne comme suit :

L’action 𝒚∗ ∈ 𝑨𝟐 est un maximinimiseur pour le joueur 2 si

𝑀𝑎𝑥𝑦∈𝐴2 𝑀𝑖𝑛𝑥∈𝐴1 𝑢2 (𝑥; 𝑦) stratégie prudente pour le joueur 2.

Dans ce cas 𝑢1 = −𝑢2

• 𝑴𝒂𝒙𝒚∈𝑨𝟐 𝑴𝒊𝒏𝒙∈𝑨𝟏 𝒖𝟐 (𝒙; 𝒚) = 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝒖𝟏 (𝒙; 𝒚)

Tout maximiniseur pour 𝑖 est un minimaxiseur pour 𝑗 ≠ 𝑖.

b) Si (𝒙∗ , 𝒚∗ ) est un équilibre 𝑵𝒑 de 𝐺 alors 𝑴𝒂𝒙𝒙∈𝑨𝟏 𝑴𝒊𝒏𝒚∈𝑨𝟐 𝒖𝟏 (𝒙; 𝒚) =

VII. Jeux bayésiens : Jeux stratégiques en information imparfaite

Si 𝝉𝒊 bijective, alors 𝜏𝑖 (𝑤) = 𝑡𝑖 , 𝑤 = 𝜏𝑖 −1 (𝑡𝑖 ) : 𝒑(𝒘) = 𝒑[𝝉𝒊 −𝟏 (𝒕𝒊 ) ] > 𝟎 ∀𝑡𝑖 ∈ 𝑇𝑖

• 𝑵 = {𝟏, … , 𝒏} un ensemble de 𝑛 joueurs.

𝑮𝑩 =< 𝑵, 𝛀, 𝑨𝒊 , 𝑻𝒊 , 𝝉𝒊 , 𝒑, ≽𝒊 > = < 𝑵 × 𝑻𝒊 , 𝛀 × 𝐀, 𝝉𝒊 , 𝒑, ≽𝒊 >

𝒂∗ ≽𝒊,𝒕𝒊 𝒃∗ 𝒔𝒔𝒊 𝑳𝒊 (𝒂∗ , 𝒕𝒊 ) ≽𝒊 𝑳(𝒃∗ , 𝒕𝒊 )

• 𝑁 = {1, … , 𝑛} l’ensemble de 𝑛 joueurs.

Quel est l’ensemble des équilibres de Nash ?

Chapitre 3 : Equilibre mixte et équilibre corrélé

• L’équilibre de Nash en stratégies mixtes noté 𝑁𝑚 .

II. Equilibre de Nash en stratégie mixte

Rappel de maths : Support de probabilité

Soit 𝑋 un ensemble fini.

Notation : On note 𝛿(𝑥) la probabilité que 𝑥 ∈ 𝑋.

Soit 𝐴𝑖 un ensemble d’actions fini, ∆𝐴𝑖 l’ensemble de distribution de probabilité sur 𝐴𝑖 .

Définition : On appelle stratégie pure 𝑎𝑖 ∈ 𝐴𝑖 .

Définition : On appelle stratégie mixte 𝛿(𝑎𝑖 ) = 𝛼𝑖 ∈ ∆𝐴𝑖 .

L’espérance d’utilité est :

𝑬𝑼𝒊 (𝒂𝒊 ) = ∑ [∏ 𝜶𝒋 (𝒂𝒊 )] 𝒖(𝒂𝒊 )

Remarque : 𝑈𝑖 (𝛼) est linéaire en 𝛼, ∀𝑢𝑖 .

Soit (𝛼, 𝛽) un profil de stratégie mixte ∀𝜆 ∈ [0,1]

𝑼𝒊 (𝝀𝜶 + (𝟏 − 𝝀)𝜷 = 𝝀𝑼𝒊 (𝜶) + (𝟏 − 𝝀)𝑼(𝜷)

Espérance d’utilité d’une loterie = loteries des espérances d’utilité

𝑈𝑖 (𝛼) = ∑ 𝛼𝑖 (𝑎𝑖 )𝑢𝑖 (𝛼−𝑖 𝑒(𝑎𝑖 ))

ou 𝑒(𝑎𝑖 ) est la stratégie mixte dégénérée de 𝑎𝑖 (probabilité = 1) ou stratégie pure.

Exemple : Bataille des sexes 𝐴 > 𝐵 > 𝐶

𝐸𝑈1 = 𝛼𝛽𝐴 + 𝛼(1 − 𝛽)𝐶 + (1 − 𝛼)𝛽𝐶 + (1 − 𝛼)(1 − 𝛽)𝐵