You are on page 1of 20

SUBJUEGOS PERFECTOS

Credibilidad
La idea de credibilidad es muy similar al concepto de inducción hacia atrás. Se trata de que el jugador
no pueda tener una mejor ganancia tomando otra acción, es decir su elección anticipada debe ser una
mejor respuesta.
Para el caso del juego de la entrada, las estrategias deben ser tal que constituyan un equilibrio de Nash
en el juego después de la entrada. Lo que se denomina un comportamiento creíble en el juego después
de la entrada.
Razonable
Se puede argumentar que un equilibrio es razonable, porque muchas veces no es razonable tomar
ciertas acciones.
Es muy similar al concepto de inducción hacia atrás, en cuyo caso solo unas ramas del árbol se juegan,
pero para saber que ramas se juegan se tiene que doblar el árbol y revisar la credibilidad en todo el
juego.
Hay una diferencia entre un juego de información imperfecta y juego de información perfecta.
En el juego de información perfecta en cada nodo solo uno de los jugadores tiene que tomar una
decisión. La credibilidad se juzga simplemente si es en el mejor interés de ese jugador tomar dicha
estrategia.
En el juego de información imperfecta los jugadores toman decisiones simultáneas. Por lo tanto es la
credibilidad de las decisiones del grupo lo que se tiene que juzgar. Una manera de verificar esto es
revisar si el grupo está jugando un equilibrio de Nash en un componente del juego.
Definición. Un subjuego es una parte de la forma extensiva; una colección de ramas y nodos que
satisfacen tres propiedades.
1. Comienza en un solo nodo de decisión.
2. Contiene cada sucesor de este nodo
3. Contiene todas las partes de un set de información, es decir contiene todos los nodos de un set de
información.
Equilibrio subjuego perfecto
Definición.s1y s2constituyen un subjuego perfecto si para cada subjuego g, s1(g)y s2(g)constituye un
equilibrio de Nash en cada subjuego.
Vamos a determinar el equilibrio subjuego perfecto de juegos con información imperfecta por el
procedimiento por inducción hacia atrás.
Comenzamos con un subjuego final, es decir un subjuego que termine solo con nodos terminales.
Determinamos el equilibrio de Nash. Hacemos lo mismo para todos los subjuego finales.
Regresamos al subjuego que precede el subjuego final y ponemos atención solamente a aquellos
equilibrios en el penúltimo subjuego que constituyen un equilibrio de Nash en el último juego.
Y así sucesivamente hasta que se llegue al subjuego inicial
Solución subjuego perfecto y solución por inducción hacia atrás
El subjuego perfecto es una generalización del juego por inducción hacia atrás.
Proposición. Si es un juego de información perfecta, la solución subjuego perfecto es exactamente la
misma que la solución por inducción hacia atrás
Representación de un juego
Planteamos la representación del juego conocido como dilema del prisionero.
La policía detiene por un pequeño delito a dos delincuentes sospechosos de un delito grave. A cada uno
de los delincuentes por separado se les ofrece el siguiente trato:
- Si delatas a tu compañero y él no confiesa te reduzco la pena a un año y a él le caen diez años.
- Si os delatáis mutuamente la pena es de tres años para cada uno.
- Si ninguno delata a su compañero sólo se les puede condenar a ambos a dos años por el delito
menor.

Representación en forma normal
Jugador B
delata no delata
Jugador A delata -3, -3 -1, -10
no delata -10, -1 -2, -2


Representación en forma extensiva


1.2. Equilibrio
Una situación en la que los individuos no tienen incentivos para cambiar su decisión

Equilibrio en estrategias dominantes
La estrategia de A es una estrategia dominante si la elección de A es óptima para cualquier elección de
B. La estrategia de B es una estrategia dominante si la elección de B es óptima para cualquier elección
de A.
A
B B
-3, -3 -1, -10 -10, -1 -2, -2
delata
no delata
d
nd d
nd




Jugador B
izquierda derecha
Jugador A arriba 1, 2 1 0, 1
abajo 12, 1 1 11, 0

͞abajo͟ es una estrategia dominante para el jugador A
͞izquierda͟ es una estrategia dominante para el jugador B
En este caso, es fácil predecir las jugadas y los pagos finales

No siempre existen estrategias dominantes. Por ejemplo:

Jugador B
izquierda derecha
Jugador A arriba 12, 1 1 0, 0
abajo 0, 0 11, 2 1

Estrategias dominantes iterativas
Jugador B
i c d
Jugador A a 4, 3 2, 7 1 10, 4
b 15, 5 1 15, 1 -4, -2

Jugador A: no tiene una estrategia dominante.
Jugador B: c domina a d. Nunca jugará d.
Teniendo en cuenta este hecho resulta que:
b es una estrategia dominante para el jugador A.
Dado que A juega b, entonces B juega i.

Equilibrio de Nash
Dos estrategias (a*,b*) constituyen un equilibrio de Nash si a* es la mejor estrategia posible del jugador
A cuando B juega b* y b* es la mejor estrategia para B cuando A juega a*.

Ejercicio
Aplicar este concepto a los ejemplos anteriores. Existe equilibrio de Nash en las casillas en que haya dos
marcas.

El concepto de equilibrio de Nash presenta los siguientes problemas:
1. Puede haber más de un equilibrio de Nash.
2. En ocasiones no hay un equilibrio de Nash.

Ejemplo de juego sin equilibrio de Nash en estrategias puras
Jugador B
izquierda derecha
Jugador A arriba 0, 0 1 10, -1
abajo 11, 0 -1, 3 1

No hay ninguna casilla con dos marcas. Por lo tanto no existe equilibrio de Nash en estrategias puras.

Equilibrio de Nash en estrategias mixtas
Un agente elige la frecuencia óptima con la que seguirá una estrategia dada la frecuencia con la que elija
el otro. Se puede demostrar que, bajo ciertas condiciones, siempre existe un equilibrio de Nash en
estrategias mixtas.

Jugador B
izquierda (q) derecha (1-q)
Jugador A arriba (p) 0, 0 0, -1
abajo (1-p) 1, 0 -1, 3

Los beneficios esperados de cada estrategia y el beneficio esperado para el jugador A se pueden escribir
como:

´ ) ´ )
´ ) ´ )
. J ´ )´ )
0 0 1 0
1 1 1 2 1
0 2 1 1
A
A
A
arriba q q
abajo q q q
E p q p
4 ! !
4 ! !
4 !

El jugador A elige p de modo que maximize . J
A
E H . Es decir:

. J ´ )´ ) max 2 1 1
0 1
p A
E q p
st p
H =
· ·

Las probabilidades óptimas en función de q son las siguientes:

1
0
2
1
0 1
2
1
1
2
q p
q p
q p
" =
= · ·
· =

Los beneficios esperados de cada estrategia y el beneficio esperado para el jugador B se expresan como:

´ ) ´ )
´ ) ´ )
. J ´ )´ ) ´ )´ )
0 0 1 0
1 3 1 3 4
0 3 4 1 3 4 1
B
B
B
izquierda p p
derecha p p p
E q p q p q
H = + =
H = + =
H = + =

El jugador B elige q de modo que maximize . J
B
E 4 . Es decir:

. J ´ )´ ) max 3 4 1
0 1
q B
E p q
st q
4 !
e e

Las probabilidades óptimas en función de p son las siguientes:

3
0
4
3
0 1
4
3
1
4
p q
p q
p q
· =
= · ·
" =

Las dos probabilidades mutuamente consistentes son:

3 1
,
4 2
p q ! !

Ejemplo de equilibrio de Nash en estrategias mixtas
Un guardia y un ladrón juegan este juego todas las noches en el edificio de la Facultad. Si el ladrón va a
un lugar distinto del guardia consigue un botín y el guardia es despedido. Si coinciden en el mismo lugar,
el ladrón va a la cárcel. Representamos el juego en forma normal como:

Guardia
aulario (q) oficinas (1-q)
Ladrón aulario (p) -10, 0 1 110, -10
oficinas (1-p) 110, -10 -10, 0 1

No hay equilibrio de Nash en estrategias puras ya que no coinciden dos marcas en la misma casilla.
Los beneficios esperados de cada estrategia y el beneficio esperado para el ladrón se expresan como:

´ ) ´ )
´ ) ´ )
. J ´ ) ´ )´ )
. J ´ )´ )
10 10 1 10 20
10 10 1 20 10
10 20 20 10 1
20 10 1 2
L
L
L
L
aulario q q q
oficinas q q q
E q p q p
E q p
4 ! !
4 ! !
4 !
4 !

Las probabilidades óptimas en función de q son las siguientes:

1
1
2
1
0 1
2
1
0
2
q p
q p
q p
· =
= · ·
" =

Los beneficios esperados de cada estrategia y el beneficio esperado para el guardia se expresan como:

´ ) ´ )
´ ) ´ )
. J ´ ) ´ )
. J ´ )
0 10 1 10 10
10 0 1 10
10 10 10 1
10 20 10
G
G
G
G
aulario p p p
oficinas p p p
E p q p q
E p p q
4 ! !
4 ! !
4 !
4 !

Las probabilidades óptimas en función de p son las siguientes:

1
1
2
1
0 1
2
1
0
2
p q
p q
p q
" !
! e e
!

Las dos probabilidades mutuamente consistentes son:

1 1
,
2 2
p q ! !

Ejemplo de equilibrios múltiples de Nash

La guerra de los sexos

Marido
boxeo ballet
Esposa boxeo 110, 5 1 4, 4
ballet 0, 0 15, 10 1

Situaciones no eficientes desde el punto de vista de Pareto

Prisionero B
confesar no confesar
Prisionero A confesar 1-3, -3 1 10, -6
no confesar -6, 0 1 -1, -1

1. Confesar es una estrategia dominante
2. Podían mejorar si cooperasen. No lo hacen porque el juego no se repite.
3. Los individuos irán a la cárcel
4. El juez (la policía) diseña este mecanismo
5. La sociedad (la policía o el juez) tiene que "gastar" para encarcelarlos. Al diseñador del mecanismo
le gustaría que estuviesen seis años en la cárcel pero tiene que bajar la condena a tres años para
proporcionales un incentivo a confesar. Como veremos en otras ocasiones en esta clase, es costoso
que un individuo revele información.
1.3. Juegos repetidos
Juego dinámico
Un jugador elige una acción tras observar la acción de su oponente

Amenaza no creíble
Ejemplo
Un individuo te amenaza con hacer explotar una bomba que tiene en la mano si no le entregas 1 millón
de euros. Para completar la matriz de pagos suponemos que los daños del ataque suponen un coste de
5 millones.
El análisis de este juego requiere usar exclusivamente la información que se ha dado.


Representación del juego en forma extensiva


Este juego dinámico contiene tres subjuegos. El juego al que se enfrenta el jugador B si le da el dinero. El
juego al que se enfrenta el jugador B cuando no le da el dinero y, finalmente, el juego completo.
La solución recursiva de este juego consiste en solucionar primero los subjuegos del jugador que juega
en segundo lugar y después el juego total en función de los resultados en los subjuegos.

Caso 1.
A
B B
-6, -4 -1, 1 -5, -5 0, 0
1 pagar
0 no pagar
explotar
no explotar
explotar
no explotar
El jugador A le da el dinero y el jugador B no explotará la bomba

Caso 2.
El jugador A no le da el dinero y el jugador B no explotará la bomba.
El jugador A debe decidir qué hacer considerando que en ambos casos el jugador B no explotará la
bomba. Como consecuencia, elige no darle el dinero.
Este resultado es un equilibrio de Nash. No explotar la bomba es una estrategia dominante para el
jugador B. Como consecuencia, esa es su acción óptima en cualquier caso. La actuación óptima del
jugador A es no darle el dinero.

Este juego contiene una sorpresa cuando se analiza su forma normal. El jugador A tiene dos estrategias,
dar el dinero o no darlo. El jugador B tiene cuatro estrategias:
Explotar si le da el dinero y explotar si no se lo da ( ee).
No explotar si le da el dinero y no explotar si se lo da (nn).
Explotar si le da el dinero y no explotar si no se lo da ( en).
No explotar si le da el dinero y explotar si no se lo da ( ne).

Jugador B
ee nn en ne
Jugador A 1 -6,-4 -1,1 1 -6,-4 1-1,1 1
0 1-5,-5 10,0 1 10,0 1 -5,-5

La sorpresa es que el equilibrio que logramos antes usando una solución recursiva (0, nn) no es el único
equilibrio de Nash. Aparecen otros dos equilibrios: (1, ne) (0, en)
El primero de ellos (1, ne) es muy interesante. Se trata de un equilibrio de Nash ya que si B decide jugar
ne, el óptimo para A es darle el dinero. Por otra parte, si A le da el dinero es óptimo para B jugar de este
modo para que la decisión de A sea óptima (si no plantea explotar la bomba cuando no le da el dinero A
no debería dárselo). No obstante este equilibrio está basado en una amenaza no creíble. Una amenaza
que sirve para que la estrategia óptima del jugador A sea pagar la cantidad exigida pero que no se
llevaría a cabo en caso de llegar a esa tesitura.
Por otra parte, el equilibrio de Nash ( 0, en) contiene una acción que nunca se realizaría (explotar si te
pagan). Ante la estrategia en del jugador B, la estrategia óptima de A es no pagar (0). Por tanto, si A no
juega 1, la estrategia de B de explotar la bomba cuando reciba el dinero es irrelevante ya que el juego
nunca llega a ese punto.

Algunas aclaraciones sobre amenazas no creíbles.
1. Se trata de una actuación que aparece en una estrategia y que no se llevaría a cabo si el
jugador llegase al punto de tener que hacerla.
2. Sirve para mantener el equilibrio porque afecta a la decisión óptima del oponente.
3. Para evitar equilibrios con amenazas no creíbles se refina el concepto de equilibrio de Nash
buscando que el comportamiento de los agentes sea óptimo incluso en situaciones que no se
producen en equilibrio.
4. El equilibrio de Nash perfecto en los subjuegos ocurre cuando el equilibrio en los subjuegos es
un equilibrio de Nash. Esto implica la existencia de optimalidad incluso en aquellas ramas del
juego a las que no se accede.
5. Estos equilibrios de Nash perfectos en los subjuegos se identifican mediante la búsqueda de la
solución recursiva. Es decir, buscando en primer lugar los equilibrios de Nash en los subjuegos.

En el caso analizado anteriormente (1,ne) y (0,en) son equilibrios de Nash pero no son perfectos en los
subjuegos. Se exige que la solución del juego sea un equilibrio perfecto en los subjuegos. En este caso
nos quedamos exclusivamente con (0,nn).

Ejemplo: amenaza no creíbles en la entrada en un mercado
La demanda de un mercado viene dada por la ecuación:
41 P Q =
Función de costes:
´ ) C q q !

Equilibrio de Cournot
El productor 1 produce la cantidad que maximiza su beneficio dada la cantidad que produce el 2. El 2
hace lo mismo. La solución conjunta a estas dos decisiones constituye el denominado equilibrio de
Cournot. El beneficio del productor 1 se escribe como:
´ )
1 1 2 1 1
41 q q q q 4 !
La condición de primer orden de este problema de optimización es:

1
1 2 1
1
1 2
41 1 0
1
20
2
q q q
q
q q
x4
! !
x
!

Por simetría, la repetición del proceso para el segundo productor daría como resultado:

2 1
1
20
2
q q =
La solución resulta de resolver el sistema de ecuaciones anterior:

´ )
1 2
1 2
13, 3
26, 6
14, 3
14, 3 1 13, 3 177
q q
Q
P
= =
=
=
H = H = - =

Stackelberg. Modelo líder-seguidor
La primera empresa (líder) tiene en cuenta la reacción de la segunda a su decisión. La segunda toma la
decisión del primero como dada. Por tanto, la cantidad producida por la segunda sigue la misma lógica
que en el modelo de Cournot. Es decir:

2 1
1
20
2
q q !
La empresa lider tiene en cuenta la reacción de la seguidora. Es decir, el beneficio se escribe como:

2
1 1 1 1 1 1 1
1 1
41 20 20
2 2
q q q q q q
¨ ¸
4 ! !
© ¹
ª º

La maximización del beneficio implica que:

1
1
1
1
20 0
20
q
q
q
xH
= =
x
=

Por tanto, se tiene:

´ )
´ )
1
2
1
2
20
1
20 20 10
2
30
11
11 1 20 200
11 1 10 100
q
q
Q
P
=
= - =
=
=
H = - =
H = - =


A continuación representamos esta situación como un juego en forma extensiva. Para la empresa líder
consideramos dos estrategias: producir la cantidad de Cournot (13) o producir la cantidad del modelo
líder seguidora (20). Para la empresa seguidora consideramos dos posibles acciones producir la cantidad
del modelo de Cournot (13) o la cantidad del modelo líder seguidora (10). Por tanto, necesitamos
calcular el beneficio de dos situaciones que no se habían considerado. En primer lugar:

´ )
´ )
1 2
1
2
20, 13.3
33, 3
7, 6
7, 6 1 20 132
7, 6 1 13, 3 87
q q
Q
P
= =
=
=
H = - =
H = - =

En segundo lugar:

´ )
´ )
1 2
1
2
13, 3, 10
23, 3
17, 6
17, 6 1 13, 3 222
17, 6 1 10 167
q q
Q
P
= =
=
=
H = - =
H = - =

La representación en forma extensiva es:


La solución recursiva es la siguiente:
La empresa 2 elegiría b si la empresa 1 eligiese a.
La empresa 2 elegiría a si la empresa 1 eligiese b.
Como consecuencia, la empresa 1, elige a.
El equilibrio de Nash perfecto en los subjuegos es (a,ba). Es decir, la empresa 1 entra con la cantidad
óptima de la empresa lider Stackelberg y la empresa 2 produce la cantidad óptima de la seguidora.
El conjunto completo de equilibrios de Nash se observa mejor en una representación normal del juego.
Empresa 2
1
2 2
200, 1001
132, 87 222, 167 177, 1771 0
10 (b)
13 (a)
10 (b)
13 (a)
20 (a)
13 (b)
bb aa ab ba
Empresa 1
a 200, 100 132, 87 132, 87 200, 100
b 222, 167 177, 177 222, 167 177, 177

Los equilibrios de Nash son:
(a, ba) que la solución recursiva había identificado como el equilibrio perfecto en los subjuegos.
(b, aa) que es un equilibrio de Nash basado en una amenaza no creible. De hecho, la empresa 2 no
producirá a (13) cuando la empresa 1 entre como empresa líder jugando a (20). Sin embargo, esta
circunstancia nunca llega ya que si la empresa 2 juega siempre a , la estrategia óptima de la empresa 1
es b. En estas circunstancias, la estrategia óptima de 2 es aa. De otro modo, la estrategia óptima de la
empresa 1 cambiaría. Por tanto, nos encontramos ante dos estrategias óptimas mutuamente
compatibles. Es decir, un equilibrio de Nash.

Ejemplo: reacciones de una empresa que produce en un mercado ante la entrada de una segunda
empresa
La demanda y los costes son idénticos al ejemplo anterior.
La empresa que entra en el mercado puede:
0. Entrar con la cantidad de equilibrio de Cournot (a) buscando la misma reacción por parte de la
empresa que está en el mercado (q
2
=13).
1. No entrar (b) que, en términos de producción, equivale a q
2
=0.

Caso 1.
La empresa 2 entra con q
2
=13, la empresa 1 reacciona a la Cournot q
1
=13. En este caso, se tiene que
1 2
177 H = H = .

Caso 2.
La empresa 2 entra con q
2
=13, la empresa 1 produce la cantidad que baja el precio a cero.

´ )
´ )
1 1
1
2
41 13, 3 0 27, 6
0 1 27, 6 27, 6
0 1 13, 3 13, 3
P q q = = =
H = - =
H = - =

Caso 3.
La empresa 2 no entra y la 1 se comporta como un monopolista.

´ )
´ )
2
1 1 1 1 1 1
1
1 1
1
1
2
41 40
40 2 0 20
41 20 21
20 1 20 400
0
q q q q q
q q
q
P
4 ! !
x4
! ! !
x
! !
4 ! v !
4 !

Caso 4.

´ )
2 1
1
2
0 13, 3
41 13, 3 27, 6
27, 6 1 13, 3 355
0
q q
P
= =
= =
H = - =
H =

Caso 5.

´ )
2 1
1
2
0 27, 6
41 27, 6 13, 3
13, 3 1 27, 6 340
0
q q
P
= =
= =
H = - =
H =

Caso 6.

´ )
´ )
2 1
1
2
13, 3 20
41 20 13, 3 7, 6
7, 6 1 20 132
7, 6 1 13, 3 88
q q
P
! !
! !
4 ! v !
4 ! v !

La representación en forma normal del juego es la siguiente:

2
1 1
355, 0 400, 0 340, 0 177, 177 132, 88 -27, 13
0 (b) 13 (a)
13 (b)
20 (m)
27 (a)
13 (b)
20 (m)
27 (a)

Obtención de equilibrio de Nash perfecto en los subjuegos mediante la solución recursiva.
La empresa 1 produce la cantidad m si la empresa 2 decide no entrar. La empresa 1 produce la cantidad
b si la empresa 2 decide entrar.
El equilibrio de Nash perfecto en los subjuegos es (mb,a). Corresponde al caso en que la entrada de la
empresa 2 conduce a una situación de duopolio de Cournot.

El conjunto completo de equilibrios de Nash se observa mejor en una representación normal del juego.
Empresa 2
b a
Empresa 1
bb 355, 0 177, 177
bm 355, 0 132, 88
ba 355, 0 -27, -13
mb 400, 0 177, 177
mm 400, 0 132, 88
ma 400, 0 -27, -13
ab 340, 0 177, 177
am 340, 0 132, 88
aa 340, 0 -27, -13

En la forma normal aparece el equilibrio de Nash perfecto en los subjuegos obtenido anteriormente
mediante la solución recursiva (mb, a).
Existen otros dos equilibrios de Nash que conducen al mismo resultado: (bb, a) y (ab, a). Son equilibrios
de Nash que en que se juega una estrategia no óptima en la rama izquierda del juego porque no se llega
a ella ya que la empresa 2 no cambia su decisión por estos cambios en la rama izquierda.
El equilibrio de Nash (ma, b) es muy interesante. Representa el caso en que la empresa 2 no entra en el
mercado ante la perspectiva de que la empresa 1 produzca la cantidad que hace el precio cero si la 2
entra. Es un equilibrio de Nash ya que la 2 no entra, y dado que la 2 no entra, la 1 no tiene incentivos
para cambiar esta estrategia. Sin embargo, si la 2 entrase no se comportaría de esa manera porque no
es óptimo comportarse de esa manera en el árbol derecho del juego. Es decir, este equilibrio contiene
una amenaza no creíble.

Ejemplo
2,0
D
I1
I1
D

El equilibrio obtenido por solución recursiva es (II;I).
Los equilibrios de Nash en los subjuegos son:
Jugador 2
i d
Jugador 1
i 11, 1 1 13,0
d 11,1 0, 21

(i, i) es el equilibrio de Nash en el subjuego.

Los equilibrios de Nash en el juego completo son:
Jugador 2
i d
Jugador 1
ii 12, 0 1 2, 0 1
id 12, 0 1 2, 0 1
di 1, 1 1 13,0
dd 1,1 0, 2 1

Existen dos equilibrios de Nash: (ii, i) y (id, i).
El primero es un equilibrio de Nash en el subjuego. El segundo no lo es.
Jugar derecha al final es una amenaza no creíble.
1
1
2
1,1
3,0 0,2
I1 D

Ejemplo. Tirole, La teoría de la organización industrial. Pag. 424.




Representación en forma normal.

Jugador 2
ii dd id di
Jugador 1 i 12, 0 1 2, -1 2, 0 1 12, -1
d 1, 0 13, 1 1 13, 1 1 1, 0

Los equilibrios de Nash son:
(i, ii ), (d, dd) y (d, id).
La solución recursiva y, por tanto, el equilibrio de Nash perfecto en los subjuegos es (d, id).
Los otros dos equilibrios de Nash corresponden con amenazas no creíbles. Es decir, con estrategias que
contienen acciones que no se llevarían a cabo si el juego llegase al punto de tener que ejercitarlas.

1.4. Aplicaciones

Colusión como juego repetido

Productor 2
colusión engaño
1
2 2
2,0 2,-1 1,0 3,1
i d i d
i d
Productor 1 colusión 1012, 1012 759, 1139 1
engaño 11139, 759 1900, 900 1

Estrategia del "gatillo"
Coludir hasta que alguien no coopere. Si alguien no coopera pasar a Cournot.
Pago de la colusión:

1012
1 H

Pago del engaño:

900
1139
1
H
H

Se coopera si:

,
1012 900
1139
1 1
1012 1139 1139 900
239 127
0 53
H
H H
H H
H
H
" +

" +
"
"

La solución depende del grado de impaciencia de los individuos (ɷ) y del pago de engañar.

Ejemplo de amenaza no creíble





La solución recursiva indica que (d, di) es un equilibrio de Nash perfecto en los subjuegos.

Representación en forma normal.
Jugador 2
ii dd id di
Jugador 1 i 13, 1 11, 2 1 13, 1 1, 2 1
d 2, 1 1 0, 0 0, 0 12, 1 1

Aparecen dos equilibrios de Nash: (i, dd) y (d, di).
El equilibrio (i, dd). La amenaza de 2 de jugar derecha si 1 juega derecha hace que 1 juegue izquierda.
Dado que 1 juega izquierda la jugada de 2 es óptima.

Negociación en tres etapas
Se analiza el reparto de 1 unidad monetaria con una tasa de descuento ɷ.
1) A hace una oferta. Si B acepta la oferta concluye el juego. Si B no acepta se pasa a la segunda etapa.
2) B hace una oferta. Si A acepta la oferta concluye el juego. Si A no acepta se pasa a la tercera etapa.
3) El gobierno hace el reparto. A A le corresponde x y a B 1-x.

1
2 2
3, 1 1, 2 2, 1 0, 0
i d 1 i 1 d
I D1
Solución recursiva
B al hacer una oferta en la segunda etapa sabe cuáles son los pagos descontados de la tercera etapa:
´ ) , x 1 x H H
B debe hacerle una oferta a A que pueda aceptar ( x H ). Por tanto, el reparto propuesto y aceptado por
A es:
, x 1 x H H
A conoce este resultado en la primera etapa. Por tanto, debe hacer una propuesta en la primera etapa
que B no rechace ´ ) 1 x H H :
´ ) ´ ) , 1 1 x 1 x H H H H
La solución recursiva evita las amenazas no creíbles.

Es muy interesante el caso en que x=1 o x=0. Es decir, cuando el gobierno va a dar todo a uno de los
agentes. Aún en ese caso, la oferta en la primera etapa que el agente acepta no es nula. Los agentes
evitan la espera a la tercera etapa haciendo una oferta positiva en la primera.


y y y

Si delatas a tu compañero y él no confiesa te reduzco la pena a un año y a él le caen diez años. Si os delatáis mutuamente la pena es de tres años para cada uno. Si ninguno delata a su compañero sólo se les puede condenar a ambos a dos años por el delito menor.

Representación en forma normal Jugador B delata Jugador A delata no delata -3, -3 -10, -1 no delata -1, -10 -2, -2

Representación en forma extensiva

A delata

no delata

B d nd d

B nd

-3, -3

-1, -10

-10, -1

-2, -2

1.2.

Equilibrio

Una situación en la que los individuos no tienen incentivos para cambiar su decisión

Equilibrio en estrategias dominantes La estrategia de A es una estrategia dominante si la elección de A es óptima para cualquier elección de B. La estrategia de B es una estrategia dominante si la elección de B es óptima para cualquier elección de A.

Jugador B izquierda Jugador A arriba abajo 1. Por ejemplo: Jugador B izquierda Jugador A arriba abajo derecha 0. es fácil predecir las jugadas y los pagos finales No siempre existen estrategias dominantes. 4 -4. 3 c 2. 5  5. 1  0. 0 1. 2  Estrategias dominantes iterativas Jugador B i Jugador A a b 4. 1 2. Nunca jugará d. 2  derecha 0. 0 2. Teniendo en cuenta este hecho resulta que: . 0 abajo es una estrategia dominante para el jugador A izquierda es una estrategia dominante para el jugador B En este caso. 7  d 0. -2 5. 1 Jugador A: no tiene una estrategia dominante. Jugador B: c domina a d. 1  1.

Por lo tanto no existe equilibrio de Nash en estrategias puras. siempre existe un equilibrio de Nash en estrategias mixtas. Equilibrio de Nash en estrategias mixtas Un agente elige la frecuencia óptima con la que seguirá una estrategia dada la frecuencia con la que elija el otro. -1 -1. Se puede demostrar que. entonces B juega i. El concepto de equilibrio de Nash presenta los siguientes problemas: 1. bajo ciertas condiciones. Puede haber más de un equilibrio de Nash. Ejemplo de juego sin equilibrio de Nash en estrategias puras Jugador B izquierda Jugador A arriba abajo 0. 2. En ocasiones no hay un equilibrio de Nash. Existe equilibrio de Nash en las casillas en que haya dos marcas.b*) constituyen un equilibrio de Nash si a* es la mejor estrategia posible del jugador A cuando B juega b* y b* es la mejor estrategia para B cuando A juega a*. Dado que A juega b. 3  1. Equilibrio de Nash Dos estrategias (a*.b es una estrategia dominante para el jugador A. Ejercicio Aplicar este concepto a los ejemplos anteriores. 0 No hay ninguna casilla con dos marcas. Jugador B izquierda (q) derecha (1-q) . 0  derecha 0.

0 0. 3 Los beneficios esperados de cada estrategia y el beneficio esperado para el jugador A se pueden escribir como: 4 A .Jugador A arriba (p) abajo (1-p) 0. -1 -1. 0 1.

arriba ! 0q  0 .

1  q ! 0 4 A .

abajo ! 1q  1.

1  q ! 2 q  1 E ?4 A A ! 0 p  .

2q  1 .

Es decir: max p E ?4 A A ! .1  p El jugador A elige p de modo que maximize E ?4 A A.

2q  1 .

1  p st 0e p e1 Las probabilidades óptimas en función de q son las siguientes: 1   p!0 2 1 q !   0e p e1 2 1 q   p !1 2 q" Los beneficios esperados de cada estrategia y el beneficio esperado para el jugador B se expresan como: 4 B .

izquierda ! 0 p  0 .

1  p ! 0 4 B .

derecha ! 1 p  3 .

1  p ! 3  4 p E ?4 B A ! 0 q  .

3  4 p .

1  q ! .

3  4 p .

Es decir: max q E ?4 B A ! .1  q El jugador B elige q de modo que maximize E ?4 B A.

3  4 p .

1  q st 0e q e1 Las probabilidades óptimas en función de p son las siguientes: 3  q!0 4 3 p !   0e q e1 4 3 p "   q !1 4 p Las dos probabilidades mutuamente consistentes son: .

Representamos el juego en forma normal como: Guardia aulario (q) Ladrón aulario (p) oficinas (1-p) -10. Si coinciden en el mismo lugar. q! 4 2 Ejemplo de equilibrio de Nash en estrategias mixtas Un guardia y un ladrón juegan este juego todas las noches en el edificio de la Facultad. 0  oficinas (1-q) 10. -10 No hay equilibrio de Nash en estrategias puras ya que no coinciden dos marcas en la misma casilla. -10 -10. el ladrón va a la cárcel. Si el ladrón va a un lugar distinto del guardia consigue un botín y el guardia es despedido. 0  10. Los beneficios esperados de cada estrategia y el beneficio esperado para el ladrón se expresan como: 4 L .p! 3 1 .

aulario ! 10q  10 .

1  q ! 10  20q 4 L .

oficinas ! 10q  10 .

1  q ! 20q  10 E ?4 L A ! .

10  20q p  .

20q  10 .

1  p E ?4 L A ! .

20q  10 .

1  2 p Las probabilidades óptimas en función de q son las siguientes: 1   p !1 2 1 q !   0e p e1 2 1 q"   p!0 2 q Los beneficios esperados de cada estrategia y el beneficio esperado para el guardia se expresan como: 4 G .

aulario ! 0 p  10 .

1  p ! 10 p  10 4 G .

oficinas ! 10 p  0 .

1  p ! 10 p E ?4 G A ! .

10 p  10 q  10 p .

1  q E ?4 G A ! 10 p  .

20 p  10 q Las probabilidades óptimas en función de p son las siguientes: .

1   q !1 2 1 p !   0e q e1 2 1  q!0 p 2 p" Las dos probabilidades mutuamente consistentes son: p! 1 1 . -1 1. 5. Confesar es una estrategia dominante Podían mejorar si cooperasen. 4. Los individuos irán a la cárcel El juez (la policía) diseña este mecanismo La sociedad (la policía o el juez) tiene que "gastar" para encarcelarlos. q! 2 2 Ejemplo de equilibrios múltiples de Nash La guerra de los sexos Marido boxeo Esposa boxeo ballet ballet 4. No lo hacen porque el juego no se repite. 0  0. -6 -1. Al diseñador del mecanismo le gustaría que estuviesen seis años en la cárcel pero tiene que bajar la condena a tres años para . 10  Situaciones no eficientes desde el punto de vista de Pareto Prisionero B confesar Prisionero A confesar no confesar no confesar -3. -3  -6. 0 5. 3. 2. 4 10. 5  0.

Caso 1. 1 -5. es costoso que un individuo revele información. -5 0. El análisis de este juego requiere usar exclusivamente la información que se ha dado. 0 Este juego dinámico contiene tres subjuegos. El juego al que se enfrenta el jugador B cuando no le da el dinero y.proporcionales un incentivo a confesar. . La solución recursiva de este juego consiste en solucionar primero los subjuegos del jugador que juega en segundo lugar y después el juego total en función de los resultados en los subjuegos. -4 -1. El juego al que se enfrenta el jugador B si le da el dinero.3. 1. Representación del juego en forma extensiva A 0 no pagar 1 pagar B explotar explotar no explotar B no explotar -6. el juego completo. finalmente. Para completar la matriz de pagos suponemos que los daños del ataque suponen un coste de 5 millones. Juegos repetidos Juego dinámico Un jugador elige una acción tras observar la acción de su oponente Amenaza no creíble Ejemplo Un individuo te amenaza con hacer explotar una bomba que tiene en la mano si no le entregas 1 millón de euros. Como veremos en otras ocasiones en esta clase.

el óptimo para A es darle el dinero.El jugador A le da el dinero y el jugador B no explotará la bomba Caso 2. en) contiene una acción que nunca se realizaría (explotar si te pagan). esa es su acción óptima en cualquier caso. Se trata de un equilibrio de Nash ya que si B decide jugar ne.0  La sorpresa es que el equilibrio que logramos antes usando una solución recursiva (0. Jugador B ee Jugador A 1 0 -6.1  -5. elige no darle el dinero. No explotar si le da el dinero y explotar si no se lo da ( ne).-5 -5. dar el dinero o no darlo. El jugador A tiene dos estrategias. La actuación óptima del jugador A es no darle el dinero. Ante la estrategia en del jugador B. ne) (0. No explotar si le da el dinero y no explotar si se lo da (nn). Como consecuencia. El jugador B tiene cuatro estrategias: Explotar si le da el dinero y explotar si no se lo da ( ee). El jugador A debe decidir qué hacer considerando que en ambos casos el jugador B no explotará la bomba. Este resultado es un equilibrio de Nash. El jugador A no le da el dinero y el jugador B no explotará la bomba. ne) es muy interesante. Por tanto. Como consecuencia. Una amenaza que sirve para que la estrategia óptima del jugador A sea pagar la cantidad exigida pero que no se llevaría a cabo en caso de llegar a esa tesitura.-4 nn -1.0  0. . Aparecen otros dos equilibrios: (1. Por otra parte. la estrategia de B de explotar la bomba cuando reciba el dinero es irrelevante ya que el juego nunca llega a ese punto. No obstante este equilibrio está basado en una amenaza no creíble. nn) no es el único equilibrio de Nash. si A le da el dinero es óptimo para B jugar de este modo para que la decisión de A sea óptima (si no plantea explotar la bomba cuando no le da el dinero A no debería dárselo). el equilibrio de Nash (0. en) El primero de ellos (1.-4 ne -1. si A no juega 1.1  en -6. Por otra parte. No explotar la bomba es una estrategia dominante para el jugador B. Este juego contiene una sorpresa cuando se analiza su forma normal. Explotar si le da el dinero y no explotar si no se lo da ( en). la estrategia óptima de A es no pagar (0).-5 0.

5.Algunas aclaraciones sobre amenazas no creíbles. Se trata de una actuación que aparece en una estrategia y que no se llevaría a cabo si el jugador llegase al punto de tener que hacerla.nn). 1. 2. Estos equilibrios de Nash perfectos en los subjuegos se identifican mediante la búsqueda de la solución recursiva. Sirve para mantener el equilibrio porque afecta a la decisión óptima del oponente. El equilibrio de Nash perfecto en los subjuegos ocurre cuando el equilibrio en los subjuegos es un equilibrio de Nash. buscando en primer lugar los equilibrios de Nash en los subjuegos. Para evitar equilibrios con amenazas no creíbles se refina el concepto de equilibrio de Nash buscando que el comportamiento de los agentes sea óptimo incluso en situaciones que no se producen en equilibrio. Esto implica la existencia de optimalidad incluso en aquellas ramas del juego a las que no se accede. En el caso analizado anteriormente (1. Se exige que la solución del juego sea un equilibrio perfecto en los subjuegos. En este caso nos quedamos exclusivamente con (0.ne) y (0.en) son equilibrios de Nash pero no son perfectos en los subjuegos. 3. Ejemplo: amenaza no creíbles en la entrada en un mercado La demanda de un mercado viene dada por la ecuación: P ! 41  Q Función de costes: C . Es decir. 4.

q ! q Equilibrio de Cournot El productor 1 produce la cantidad que maximiza su beneficio dada la cantidad que produce el 2. El 2 hace lo mismo. El beneficio del productor 1 se escribe como: 4 1 ! . La solución conjunta a estas dos decisiones constituye el denominado equilibrio de Cournot.

41  q1  q2 q1  q1 La condición de primer orden de este problema de optimización es: x41 ! 41  q1  q2  q1  1 ! 0 xq1 1 q1 ! 20  q2 2 .

3 4 1 ! 4 2 ! .3 Q ! 26. 6 P ! 14.Por simetría. la repetición del proceso para el segundo productor daría como resultado: 1 q2 ! 20  q1 2 La solución resulta de resolver el sistema de ecuaciones anterior: q1 ! q2 ! 13.

La segunda toma la decisión del primero como dada. Modelo líder-seguidor La primera empresa (líder) tiene en cuenta la reacción de la segunda a su decisión. Es decir.14.3 ! 177 Stackelberg. la cantidad producida por la segunda sigue la misma lógica que en el modelo de Cournot. Es decir: 1 q2 ! 20  q1 2 La empresa lider tiene en cuenta la reacción de la seguidora.3  1 v 13. Por tanto. se tiene: q1 ! 20 1 q2 ! 20  v 20 ! 10 2 Q ! 30 P ! 11 4 1 ! . el beneficio se escribe como: 1 ¸ 1 ¨ 4 1 ! © 41  q1  20  q1 ¹ q1  q1 ! 20q1  q12 2 º 2 ª La maximización del beneficio implica que: x41 ! 20  q1 ! 0 xq1 q1 ! 20 Por tanto.

11  1 v 20 ! 200 4 2 ! .

En primer lugar: .11  1 v 10 ! 100 A continuación representamos esta situación como un juego en forma extensiva. Por tanto. Para la empresa líder consideramos dos estrategias: producir la cantidad de Cournot (13) o producir la cantidad del modelo líder seguidora (20). necesitamos calcular el beneficio de dos situaciones que no se habían considerado. Para la empresa seguidora consideramos dos posibles acciones producir la cantidad del modelo de Cournot (13) o la cantidad del modelo líder seguidora (10).

q1 ! 20.3 Q ! 33. 6 4 1 ! . q2 ! 13.3 P ! 7.

6  1 v 20 ! 132 4 2 ! .7.

7.3 ! 87 En segundo lugar: q1 ! 13. q2 ! 10 Q ! 23.3. 6 4 1 ! .3 P ! 17. 6  1 v 13.

6  1 v13.17.3 ! 222 4 2 ! .

100 132. 167 177. 87 222. Es decir.ba). Como consecuencia. El equilibrio de Nash perfecto en los subjuegos es (a. la empresa 1. la empresa 1 entra con la cantidad óptima de la empresa lider Stackelberg y la empresa 2 produce la cantidad óptima de la seguidora. La empresa 2 elegiría a si la empresa 1 eligiese b. Empresa 2 . elige a.17. 177 0 La solución recursiva es la siguiente: La empresa 2 elegiría b si la empresa 1 eligiese a. El conjunto completo de equilibrios de Nash se observa mejor en una representación normal del juego. 6  1 v10 ! 167 La representación en forma extensiva es: 1 20 (a) 13 (b) 2 10 (b) 10 (b) 13 (a) 2 13 (a) 200.

en términos de producción. 167 177. En estas circunstancias. De otro modo. nos encontramos ante dos estrategias óptimas mutuamente compatibles. Entrar con la cantidad de equilibrio de Cournot (a) buscando la misma reacción por parte de la empresa que está en el mercado (q2=13). un equilibrio de Nash. (b. 87 ab 132. esta circunstancia nunca llega ya que si la empresa 2 juega siempre a . la empresa 2 no producirá a (13) cuando la empresa 1 entre como empresa líder jugando a (20). La empresa 2 entra con q2=13. 87 ba 200. ba) que la solución recursiva había identificado como el equilibrio perfecto en los subjuegos. En este caso. Es decir. la estrategia óptima de la empresa 1 cambiaría. Caso 1. P ! 41  q1  13. La empresa 2 entra con q2=13. 100  177. 167 Los equilibrios de Nash son: (a. Caso 2. Por tanto.3 ! 0   q1 ! 27. la empresa 1 reacciona a la Cournot q1 =13. 177  222. se tiene que 4 1 ! 4 2 ! 177 . 100  aa 132. Ejemplo: reacciones de una empresa que produce en un mercado ante la entrada de una segunda empresa La demanda y los costes son idénticos al ejemplo anterior. la empresa 1 produce la cantidad que baja el precio a cero. aa) que es un equilibrio de Nash basado en una amenaza no creible. Sin embargo. La empresa que entra en el mercado puede: 0. la estrategia óptima de 2 es aa. 1. 177  222. la estrategia óptima de la empresa 1 es b.bb a Empresa 1 b 200. equivale a q2=0. De hecho. No entrar (b) que. 6 4 1 ! .

6 4 2 ! . 6 !  27.0  1 v 27.

0  1 v 13.3 Caso 3. La empresa 2 no entra y la 1 se comporta como un monopolista. .3 ! 13.

4 1 ! .

41  q1 q1  q1 ! 40q1  q12 x41 ! 40  2q1 ! 0   q1 ! 20 xq1 P ! 41  20 ! 21 4 1 ! .

6 4 1 ! .3 P ! 41  13.20  1 v 20 ! 400 42 ! 0 Caso 4. q2 ! 0 q1 ! 13.3 ! 27.

3 4 1 ! . 6 ! 13.27. 6  1 v 13. 6 P ! 41  27.3 ! 355 42 ! 0 Caso 5. q2 ! 0 q1 ! 27.

3 ! 7. 6 4 1 ! .3 q1 ! 20 P ! 41  20  13.13. q2 ! 13. 6 ! 340 42 ! 0 Caso 6.3  1 v 27.

7. 6  1 v 20 ! 132 4 2 ! .

0 400. 177 132. 13 . 0 177. 0 340.3 ! 88 La representación en forma normal del juego es la siguiente: 2 0 (b) 13 (a) 1 13 (b) 20 (m) 1 13 (b) 20 (m) 27 (a) 27 (a) 355.7. 88 -27. 6  1 v 13.

El equilibrio de Nash (ma. si la 2 entrase no se comportaría de esa manera porque no es óptimo comportarse de esa manera en el árbol derecho del juego. -13  177. Sin embargo. 88 -27. a). 0 400. Representa el caso en que la empresa 2 no entra en el mercado ante la perspectiva de que la empresa 1 produzca la cantidad que hace el precio cero si la 2 entra. a) y (ab. 0 340. 177 132. Ejemplo D I 2. Existen otros dos equilibrios de Nash que conducen al mismo resultado: (bb. este equilibrio contiene una amenaza no creíble. Corresponde al caso en que la entrada de la empresa 2 conduce a una situación de duopolio de Cournot. y dado que la 2 no entra. b) es muy interesante. 88 -27. Son equilibrios de Nash que en que se juega una estrategia no óptima en la rama izquierda del juego porque no se llega a ella ya que la empresa 2 no cambia su decisión por estos cambios en la rama izquierda.Obtención de equilibrio de Nash perfecto en los subjuegos mediante la solución recursiva. la 1 no tiene incentivos para cambiar esta estrategia. 0 340. 0 340. Empresa 2 b bb bm ba mb Empresa 1 mm ma ab am aa 355. 0 355. Es un equilibrio de Nash ya que la 2 no entra. -13 400. La empresa 1 produce la cantidad b si la empresa 2 decide entrar. a). 177 132. La empresa 1 produce la cantidad m si la empresa 2 decide no entrar. El equilibrio de Nash perfecto en los subjuegos es (mb. 0 a  177.a). 88 -27. Es decir. El conjunto completo de equilibrios de Nash se observa mejor en una representación normal del juego. 0 355. 177 132. -13 En la forma normal aparece el equilibrio de Nash perfecto en los subjuegos obtenido anteriormente mediante la solución recursiva (mb. 0  177. 0 400.0 I D .

1 1 3.0 0. 1  1. . i) y (id. 0  2. Los equilibrios de Nash en los subjuegos son: 0. i) es el equilibrio de Nash en el subjuego.I). 2 (i. 0  2.2 Jugador 2 i i Jugador 1 d d 1. 2  Existen dos equilibrios de Nash: (ii. El segundo no lo es.1 I 2 D 1. 1  1.1 3.0 0. i).1 d 2. Jugar derecha al final es una amenaza no creíble. 0  3. El primero es un equilibrio de Nash en el subjuego.0 El equilibrio obtenido por solución recursiva es (II. 0  2. Los equilibrios de Nash en el juego completo son: Jugador 2 i ii id Jugador 1 di dd 1.

1. La teoría de la organización industrial. Los otros dos equilibrios de Nash corresponden con amenazas no creíbles. con estrategias que contienen acciones que no se llevarían a cabo si el juego llegase al punto de tener que ejercitarlas. 0 2. id).Ejemplo. Aplicaciones Colusión como juego repetido Productor 2 colusión engaño . por tanto. -1 id 2.0 2.-1 1. -1 1. Tirole. 424. 1 i 2 d 2 i d i d 2. Pag. 0 3. ii). 0  1. dd) y (d. id).0 3. La solución recursiva y.1 Representación en forma normal. 1  3. Jugador 2 ii Jugador 1 i d dd 2. Es decir. el equilibrio de Nash perfecto en los subjuegos es (d. 0  di 2.4. (d. 1  Los equilibrios de Nash son: (i.

759 900. 1139  1139. 1012 759. Pago de la colusión: 1012 1H Pago del engaño: 1139  H Se coopera si: 900 1H 1012 900 " 1139  H 1H 1H 1012 " 1139  1139H  900H 239H " 127 H " 0. 53 La solución depende del grado de impaciencia de los individuos ( ) y del pago de engañar. Si alguien no coopera pasar a Cournot. 900  Estrategia del "gatillo" Coludir hasta que alguien no coopere.Productor 1 colusión engaño 1012. .

Negociación en tres etapas Se analiza el reparto de 1 unidad monetaria con una tasa de descuento . Representación en forma normal. La amenaza de 2 de jugar derecha si 1 juega derecha hace que 1 juegue izquierda. dd) y (d. 0 2. 2 2. 0 La solución recursiva indica que (d. dd). 1  1. A A le corresponde x y a B 1-x. 2  3. Jugador 2 ii Jugador 1 i d dd id di 1. Si B no acepta se pasa a la segunda etapa. 1 1.Ejemplo de amenaza no creíble 1 I 2 D 2 i d i d 3. El gobierno hace el reparto. 1 2. . 2  0. El equilibrio (i. 1) 2) 3) A hace una oferta. di) es un equilibrio de Nash perfecto en los subjuegos. B hace una oferta. Si A no acepta se pasa a la tercera etapa. di). 0 3. 1 0. Si B acepta la oferta concluye el juego. Dado que 1 juega izquierda la jugada de 2 es óptima. 1 0. Si A acepta la oferta concluye el juego. 1  Aparecen dos equilibrios de Nash: (i.

H .Solución recursiva B al hacer una oferta en la segunda etapa sabe cuáles son los pagos descontados de la tercera etapa: H x.

Por tanto. Por tanto. el reparto propuesto y aceptado por A es: H x. debe hacer una propuesta en la primera etapa que B no rechace H . 1  H x A conoce este resultado en la primera etapa.1  x B debe hacerle una oferta a A que pueda aceptar ( H x ).

1  H x : 1  H .

1  H x . H .

. Es decir. Los agentes evitan la espera a la tercera etapa haciendo una oferta positiva en la primera.1  H x La solución recursiva evita las amenazas no creíbles. cuando el gobierno va a dar todo a uno de los agentes. la oferta en la primera etapa que el agente acepta no es nula. Aún en ese caso. Es muy interesante el caso en que x=1 o x=0.