Juegos Dinámicos

*
Alvaro J. Riascos Villegas
Universidad de los Andes
Septiembre de 2013

Índice
1. Conceptos básicos 2

2. Aprendizaje y estrategias mixtas 5

3. Información perfecta 9

4. Información imperfecta 14
4.1. Amenazas no creı́bles . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2. Creencias no creı́bles . . . . . . . . . . . . . . . . . . . . . . . . . 22

5. Equilibrio perfecto y propio 25

6. Aplicaciones 26
6.1. Oligopolio: Stackelberg . . . . . . . . . . . . . . . . . . . . . . . . 26
6.2. Diseño de mecanismos . . . . . . . . . . . . . . . . . . . . . . . . 26
6.2.1. Un problema de externalidades . . . . . . . . . . . . . . . 26
6.2.2. La solución de Pigou . . . . . . . . . . . . . . . . . . . . . 27
6.2.3. El mecanismo de compensación . . . . . . . . . . . . . . . 28
6.2.4. El problema del Rey Salomón . . . . . . . . . . . . . . . . 30

* Notas de clase basadas en Mas-Colell et.al [1995], Myerson , R. [1990] y Vega - Redondo,F

[2003].

1

1. Conceptos básicos
Muchas situaciones en las que se se presenta la interacción de varios agen-
tes tiene una forma interactiva. Esta dinámica puede ser explı́citamente
modelada y de esta forma enriquecer el análisis estático que hemos estudia-
do hasta el momento. La caracterı́stica fundamental de estas situaciones
estratégicas e interactivas es que a lo largo de la interacción entre los
agentes se revela información total o parcialmente sobre las aciones de los
demás que pueden ser usadas para revisar las estrategias individuales.

Definición 1 Un juego en forma extensiva es una estructura

Γ = (N, K, R, Z, {Ki }i=1,...,N , {Hi }i=1,...,N , {A(k)}k∈K\Z , {ui }i=1,...,N )

donde:

1. N es un conjunto de jugadores, N = {1, ...N } .1
2. K es un conjunto finito que representa los nodos de un árbol.
3. R es una relación sobre K que define un árbol.

4. Z son los nodos terminales del árbol.
5. {Ki }i=1,...,N es una partición de K\Z que denota los nodos donde cada
jugador juega.
6. Para i = 1, ..., N ; Hi es una partición de Ki . Cada h ∈ Hi denota un con-
junto de información. Las particiones Hi son la estructura de información
de lo agentes en el juego.
7. Para i = 1, ..., N, y k ∈ Ki , A(k) denota las acciones posibles del jugador
i en el nodo k. Denotamos un elemento de a ∈ A(k) por ak . Dados k y
k 0 ∈ h ∈ Hi debe complirse que A(k) = A(k 0 ). De esta forma el jugador
no es capaz de distinguir, con base en las acciones factibles en un nodo,
en cuál de los nodos del conjunto de información se encuentra. Luego, el
conjunto de acciones factibles en un nodo lo podemos identificar como un
conjunto de acciones factibles del conjunto de información que contiene
al nodo. Abusando un poco del lenguaje definimos A(h) = A(k), k ∈ h y
denotamos una acción a ∈ A(h) por ah .

8. Para i = 1, ..., N, y z ∈ Z, ui (z) denota la utilidad del agente i en caso
de que el resultado final del juego sea el nodo terminal z. Esto no excluye
que existan pagos intermedios. Interpretamos estas funciones de utilidad
como funciones de utilidad de von Neumann y Morgentern.
1 En ocasiones adicionamos un jugador no estratégico que denotamos por cero y representa

la naturaleza.

2

Nota técnica 1 La extensión de la definción anterior al caso en el que los
pagos dependen de la realización de algún evento aleatorio es inmediata (i.e.,
jugadas de la naturaleza).

Definición 2 Sea Ai = ∪ A(h). Una estrategia pura si para el jugador i =
h∈Hi
1, ..., N en un juego en forma extensiva Γ es una función si : Hi −→ Ai tal que
para todo h ∈ Hi , si (h) ∈ A(h).

Dada una estrategia conjunta (si )i=1,...N ésta induce un camino único a
lo largo del árbol comenzando en la raı́z y terminando en algún nodo
z = ζ(s) ∈ Z. En ocasiones utilizaremos la notación (s1 , ..., sN ) para
denotar la estrategia conjunta (si )i=1,...N .
Todo juego en forma extensiva se puede representar de dos formas como
juegos estáticos: forma normal y forma multiagentes o de Selten.

Definición 3 (Forma normal) Para i = 1, ..., N, sea Si = {si : Hi −→ Ai p
N
si (h) ∈ A(h)}, s ∈ S = Π Si y definimos ζ(s) ∈ Z como el nodo final co-
i=0
rrespondiente al único camino que sobre el árbol define la estrategia conjun-
ta s. Para i = 1, ..., N definimos πi (s1 , ..., sN ) = ui (ζ(s1 , ..., sN )). El juego
G = ({1, ..., N } , {Si }i=1,...,N , {πi }i=1,...,N ) se llama la representación normal
del juego en forma extensiva.

Es fácil ver que un juego en forma normal puede ser la representación
normal de juegos distintos en forma extensiva.
La representación multiagente de Selten informalmente supone la existen-
cia de varios agentes de un jugador, uno en cada conjunto de información,
que actuan de forma independiente y toman decisiones en nombre del
jugador que representan.

Definición 4 (Forma multiagente o de Selten) Sea N ∗ = ∪ {i} × Hi el
i∈N
conjunto de jugadores. Un jugador es una pareja (i, hi ) donde i ∈ N y hi ∈ Hi .
Por simplicidad y mientras no haya riesgo de confusión, denotaremos el agente
(i, hi ) por hi . Para cada jugador hi , sea Sh∗i = A(hi ) su conjunto de estrategias.
Una estrategia conjunta es s ∈ S ∗ donde S ∗ = Π ∗ Sh∗i y escribimos s =
hi ∈N
(shi )hi ∈N ∗ . Cada estrategia conjunta tiene asociado un nodo terminal z ∈ Z
que denotamos por z = ζ ∗ (shi )hi ∈Hi ,i∈N .
Para cada jugador hi definimos

πh∗i ((shi )hi ∈N ∗ ) = ui (ζ ∗ ((shi )hi ∈N ∗ )).

El juego G∗ = (N ∗ , Sh∗i h ∈N ∗ , (πh∗i )hi ∈N ∗ ) se llama la representación de Sel-

i
ten o multiagente del juego en forma extensiva.

3

nin- guna estrategia es dominada débilmente. obsérvese que en la forma normal.0 b 8.5. Ejercicio 1 ¿Se puede modificar este juego para dar un argumento en términos de estrategias dominadas? 4 . la eliminación secuencial de estrategias débilmente dominadas predice que el jugador uno ju- gará y y el dos jugará bw. para ver que estas representaciones no son simplemente formas dis- tintas de decir lo mismo. en la representación multiagente. La forma normal de este juego es: 1 y z aw 5.1.3 0.1 4.4.4.7.1 3.0 y la multiagente es (el agente 1 y 2 representan al jugador 1 y el agente 3 representa el juagador 2) : Agente 1 w x Agente 1 w x a 5.0 1.3 3.0 bw 8.3 b 0.8.1 bx 7.3.0 y z Agente 3 Agente 3 Obsérvese que los pagos del agente 1 y 2 siempre se repiten ya que represen- tan al mismo jugador 1.1 ax 4.3 7.0.Ejemplo 1 Considere el siguiente juego en forma extensiva (Figura 1). Ahora.0 4.0 4.0 a 1. Sin embargo.

Sean A1 . A2 y A3 los eventos en los cuales el gato está detrás de la puerta 1. Nuetro objetivo es calcular P (Ai |Bj ) . Pero la teorı́a de la proba- bilidad dice otra cosa. usando la regla de Bayes. considere el juego de cara y sello en una representación en forma extensiva. Entonces dada la información del problema es natural suponer: 1 P (Ai ) = . Ejemplo 2 (Paradoja del gato) Una persona está frente a tres puertas ce- rradas. 2 o 3 respectivamente. P A1 |B2 ) = 23 Una motivación para introducir estrategias mixtas en juegos en forma extensiva es observando que en algunos de estos juegos no necesariamente existe un equilibrio en estrategias puras. El sentido común dice que no hace diferencia. abre una de las puertas en la que no esté el gato y que no haya sido la elegida por la primera persona. exis- ten dos formas naturales de definir estrategias mixtas. Sean B1 y B2 los eventos en los cuales el se- gundo jugador abre la puerta 1 o 2 reespectivamente. 5 . Dadas las dos representaciones anteriores. Se sabe que detrás de alguna de las puertas hay un gato y el objetivo de la persona es adivinar en qué puerta está el gato. La persona se le pide escoger una puerta. Aprendizaje y estrategias mixtas En esta sección veremos la relevancia de definir un modelo de aprendizaje en ambientes inciertos. Por ejemplo. 2 Entonces si la segunda persona abre la puerta 2 es fácil calcular. El paradigma de modelo de aprendizaje en teorı́a de la decisión es el regla de Bayes. Después una segunda persona que sabe donde está el gato y cuál fue la puerta elegida por la primera persona. Para formalizar este problema. El siguiente ejemplo llama la atención sobre las sutilezas de este concepto. P (B1 |A1 ) = P (A2 |B2 ) = 0 3 P (B1 |A2 ) = P (B2 |A1 ) = 1 y 1 P (B1 |A3 ) = P (B2 |A3 ) = . La probabilidad de encontrar el gato en la puerta que permanece cerrada y que no es la elegida por la primera persona es mayor que la elegida incialmente. Ahora se le pregunta a la primera persona si desearı́a cambiar de puerta. La primera persona puede observar que la puerta que fue abierta no tiene el gato y conoce la forma de actuar de la segunda persona. supongamos que la primera elección fue la tercera puerta. forma normal o de Selten.2.

Por ejemplo.Definición 5 (Estrategias mixtas y de comportamiento) Una estrategia mixta en un juego en forma extensiva es una estrategia mixta del juego en su re- presentación normal. el segundo agente del jugador 1 jamás jugarı́a y por lo tanto no escogerı́a y en su estrategia de comportamiento. σh∗i . 5[b]. Ejemplo 3 (Estrategias mixtas como estrategias de comportamiento) Considere el siguiente juego de la figura 1A y la estrategia mixta para el jugador 1. hi ∈ N ∗ donde σh∗i es un elemento de ∆(Sh∗i ) = ∆(A(hi )).5[bz]. s−i ) implica pasar por hi . Ahora defina γi para el jugador i. La función γi representa las estrategias de comportamiento en el sen- tido de la última definición. (B. considere el juego de la figura 2. 0. 5[b].5[a] + 0. D) son incompatibles con el segundo conjunto de información del jugador 1. la probabiliad de escoger y es 1. Un argumento muy similar muestra que toda estrategia de comportamiento γi define una estrategia de comportamiento en el sentido de Selten. Para resaltar la diferencia entre los dos conceptos de estrategias mixtas estudiemos el siguiente ejemplo. Las estrategias puras para el jugador 1. Ahora. condicional a que le toca jugar al segundo agente del jugador 1. una estrategia de comportamiento para el jugador i es una función γi : Hi → ∆(Ai ) tal que para todo h ∈ Hi el soporte de γi (h) está con- tenido en A(h). [y]) . Una estrategia de comportamiento en un juego en forma extensiva es una estrategia mixta del juego en su representación multiagente. Para ver que las dos definiciones de estrategias de comportamiento son equivalentes considere una estrategia de comportamiento en el sentido de Selten. Alternativamente. Por ejemplo. esto no parece hacer mayor sentido. Una posibilidad para representar esta estrategia como una estrategia de comportamiento es simplemente asociandole a cada agente (que lo representa en sus conjuntos de información) la probabilidad marginal de las estrategias puras involucradas.5[a] + 0. como γi : Hi → ∆(Ai ) donde γi (hi ) = σh∗i .5[ay] + 0. Decimos que una estrategia pura si ∈ Si para el jugador i en la representación normal del juego es compatible con el conjunto de información hi ∈ Hi si existe un conjunto de estrategias s−i para los demás jugadores tal que le estrategia conjunta s = (si . un candidato natural para la estra- tegia de comportamiento del jugador 1 es: (0. C) y (B. Luego otra posible representación de la estrategia mixta como una estrategia de comportamiento es: (0. 6 .5[y] + 0. Sin embargo. Este ejemplo motiva la siguiente definición informal. Sea hi ∈ Hi y Sbi (hi ) las estrategias puras del jugador i que son compatibles con el conjunto de información hi . pues en la estrategia mixta original para escoger z es necesario escoger bz y en ese caso.5[z]) donde la primera coordenada corresponde a la estrategia mixta en el primer conjunto de información del jugador 1 y la segunda al segundo conjunto de información. 0.

7 .

k ∈ Ki . k 0 6= k 00 . D) respectivamente. entonces la regla de Bayes no tiene ninguna implicación sobre la probabilidad en ese nodo y puede definirse de forma arbitraria. 12 donde el suponemos que cada coorde- nada del vector representa la probabilidad de elegir las estrategias P puras (A. γi (h)(a) es la probabilidad según σi de la acción a condi- cional a pasar por el conjunto de información h. (A. Formalmente esto se puede ex- presar como: 1. en la figura anterior (figura 2). Sin embargo. Esto es. donde P (x) denota el conjunto de los predecesores inmediatos de x. En general. Véase figura 1. Por ejemplo. Cuando esta probabili- dad de pasar con el conjunto de información h es cero. El hecho de que dos estrategias mixtas puedan inducir la misma estrategia de comportamiento puede tener consecuencias estrategicas importantes en cierto tipo de juegos (figura 1. k = P (k 0 ). σ1 = 0. Los juegos en los que las estrategias mixtas y de comportamiento son estratégicamente equivalentes son juegos con memoria perfecta. juegos en los que ningún jugador olvida sus acciones o información adquirida en el pasado. definimos la siguiente estrategia de comportamiento para el jugador i: P σi (si ) {si ∈Sbi (hi ):si (hi )=a} P γi (h)(a) = P si σi (si ) > 0 σi (si ) s ∈S b (h ) i i i si ∈S bi (hi ) P P γi (h)(a) = σi (si ) si σi (si ) = 0 {si ∈Sbi (hi ):si (hi )=a} si ∈S bi (hi ) Intuitivamente.Redondo). entonces todo par de nodos sucesores de k 0 . (B. Definición 6 (Memoria Perfecta) Un juego en forma extesiva es de memoria perfecta si ningún jugador olvida las acciones tomadas o la in- formación que en el algún momento tuvo. el punto importante es que si la probabilidad de pasar por el conjunto de información h es cero. entonces definimos γi (h)(a) como la probabilidad no condicional según σi de pasar por el conjunto de imformación h. considere la estrategia mixta para el jugador 1. k = P (k 00 ). El teorema que establece la equivalencia estratégica entre estrategias mix- tas y de comportamiento en juegos de memoria perfecta se debe a Kuhn (1953). (B.12 de Vega . k 00 en 8 . D). No olvidar acciones: i no olvida a ∈ A(k). 0.11 y 1. En este caso σ1 (s1 ) = 0 s1 ∈S b1 (h1 ) y por definición γ1 (h)(D) = 12 . más de una estrategia mixta puede inducir la misma estrategia de comportamiento. C). 12 . C).10 página 20 de Vega Redondo.Dada una estrategia mixta σi del juego en formal normal.

si b k ∈ Ki es un predescesor de k entonces k 0 ∈ Ki predescesor de k 0 tal que b existe un b kybk 0 están en el mismo conjunto de información. Ejemplo 4 (Entrada de una firma) Considere el juego de la Figura 2A. No olvidar información pasada: i no olvida información pasada si para todo k ∈ Ki k. los jugadores siempre saben en que nodo del árbol se encuentran). cada conjunto de información de cada jugador es un singleton (i. Luego una primera aproximación al problema de describir sitemáticamente el resultado de un juego dinámico es analizar su forma normal. Sin embargo. esto no explota la naturaleza dinámica del problema. En los juegos de información perfecta.. Un ejemplo es el ajedrez que discutiremos con cierto detalle más adelante. El siguiente ejemplo (entrada de una firma) pone de manifiesto la debilidad del análisis en forma normal y llama la atención sobre la necesidad de desarrollar conceptos de equilibrio que exploten explı́citamente el proceso de revelación de información o dinámica del problema. los que i deba tomar una decisión están en conjunto de información distintos. 2. Información perfecta Los juegos de información perfecta son juegos en forma extensiva en donde los conjuntos de información son lo más finos posibles. k 0 ∈ h. una estrategia si para un jugador i puede representarse simplemente como si : Ki → Ai donde si (k) ∈ A(k).e. 3. Es decir. Este juego tiene como representación normal: 9 . De ahora en adelante vamos a considerar únicamente juegos de memoria perfecta. Todo juego en forma extensiva puede representarse como un juego en forma normal.

Convierta el nodo k en un nodo terminal donde los pagos son los que determina la estrategia sbi (k). 2 Este es el teorema que Mas Colell et. este no es históricamente el teorema Zermelo (1913). 3... Una forma más cercana al teorema incialmente probado por Zermelo es el teorema que afirma que el ajedrez es un juego determinado (véase más abajo la definición de juego determinado). El converso de este teorema no es cierto. 10 .2 E -1.. Sin embargo. Repita los pasos anteriores hasta llegar la raı́z del árbol. Para cada nodo k tal que todo nodo sucesor de k sea terminal. 2. . si k ∈ Ki entonces sbi (k) maximiza el pago del agente i entre las posibilidades que tiene en ese nodo. y P. Teorema 2 (Zermelo) Todo juego de información perfecta tiene un equilibrio de Nash en estrategias puras. Para una discusión detallada de la contribución de Zermelo a la teorı́a de juegos véase Schwalbe. El teorema es una consecuencia inmediata del teorema de Kuhn. el equilibrio de Nash es único. En este juego.Cournot.2 Prueba.-1 1. Walker (1999). Definición 7 (Inducción hacia atrás) Decimos que la estrategia conjunta sb = (b s1 . El ejemplo clásico es el problema de entrada de una firma. La definición anterior se extiende de forma natural al caso de estrategias mixtas.1 Un concepto interesante en juegos de información perfecta es el de estra- tegia de inducción hacia atrás. Zermelo and the Early History of Game Theory.2 0. U. Las estrataegias de inducción hacia atrás en un juego de información per- fecta son casos especiales del concepto de equilibrio perfecto en subjuegos que introduciremos en la siguiente sección. el equilibrio de Nash . sbN ) es una estrategia de inducción hacia atrás en un juego de informa- ción perfecta si puede obtenerse de la siguiente forma: 1. Más aún si ningun jugador es indiferente entre dos nodos terminales (a lo largo del proceso de inducción hacia atrás). 1 F C N 0.al llaman teorema de Zermelo. Teorema 1 (Kuhn) Si s es una estrategia de inducción hacia atrás en un juego de información perfecta entonces s es un equilibrio de Nash .Cournot que no es creı́ble no es una estrategia de inducción hacia atrás. El teorema original de Zermelo se considera el primer teorema importante en teorı́a de juegos.

El concepto de inducción hacia atrás tiene como consecuencia resultados inesperados y altamente ineficientes. Escribir el juego en forma normal y calcular sus equilibrios de Nash y el equilibrio perfecto (en forma normal del juego). 11 . El teorema de Zermelo junto con el teorema de von Neumann de juegos de suma cero tiene implicaciones fuertes sobre los juegos de información perfecta de suma cero. Considere el juego del cienpies de Rosenthal (1981) (Figura cienpies). Ca- lular la estrategia de inducción hacia atrás. Ejercicio 3 Considere el siguiente juego en forma extensiva (Figura 3). Teorema 3 Todo juego bilateral de información perfecta y suma cero tiene un equilibrio de Nash en estrategias puras (por inducción hacia atrás) que a su vez son estrategias maxmin para cada jugador (por el teorema de von Neumann).Ejercicio 2 Las estrategias de inducción hacia atrás no son necesariamente únicas. Obsérvese que el equilibrio perfecto no es una estrategia de inducción hacia atrás (esto contrasta con el concepto de equilibrio perfecto para juegos en forma extensiva que introduciremos más adelante).

Ejercicio 4 Este es un ejercicio para los que conocen un poco lógica matemáti- ca y es una prueba alternativa del anterior teorema. El problema con esta estrategia es que el número de jugadas admisibles en el ajedrez ha sido estimado en alrededor de 1020 − 1043 jugadas. es- to prueba que en el ajedrez alguno de los jugadores tiene una estrategia que es siempre ganadora o garantiza al menos un empate. Luego. es determinado. supongamos que en un tablero jugado se sabe que las blancas pueden ganar con certeza independientemente de lo que el otro haga (esto puede ser un nodo final del juego. 12 . al otro el perdedor. Un caso particular de juegos de suma cero son los juegos donde las utili- dades posibles de cada jugador están en el conjunto {−1.e. como esta frase o su negación debe ser verdad. A continuación discutimos algunas consecuencias de la afirmación anterior para algunos juegos conocidos. Llamaremos a estos juegos. esto implica que esas estrate- gias puras aseguran como mı́nimo el valor del juego para cada jugador independientemente de lo que el otro haga. Además no existen incentivos unilaterales a desviarse. empata. con el menor número de fichas posibles y un jaque mate como última jugada). total de suma cero. Esta observación llama la atención sobre la importacia de distinguir el concepto de racionalidad entre uno puramente conceptual y uno de tipo computacional. El teorema anterior implica que todo juego de información perfecta.. Escriba una sentencia en el lenguage de primer order que reprente que las blancas tiene una estrategia gana- dora independientemente de la estrategia de las negras. En efecto.Ejemplo 5 (El juego de ajedrez) Por el anterior teorema existe una estra- tegia para alguno de los jugadores tal que no importa que haga el otro jugador a lo largo del juego ésta garantiza que el jugador siempre gana o. La limitación sin embargo no es teórica sino de tipo computacional. Definición 8 Para juegos totales de suma cero decimos que el juego es determi- nado si alguno de los dos jugadores tiene una estrategia ganadora independien- temente de lo que el otro haga (i. juegos totales de suma cero. o ganar. una estrategia estrictamente dominante). basta con hacer inducción hacia atrás y obtendrı́amos de esa forma un estrate- gia para las blancas que fuerzan una victoria. Estos son núnero comparables al número de moleculas en el universo y cualquier busqueda de estrategias óptima en un espacio de esta dimensión es en la actualidad computacionalmente imposible. Muestre que la negación de esta sentencia afirma que las negras tienen una estrategia que garantiza por lo menos un empate. El problema fundamental es que no se conoce si las blancas o las negras pueden forzar un empate. Lo importante de este teorema es que al asegurar que el equilibrio de Nash es tabién una solución maxmin del juego. 1}. Según el teorema de Zermelo. como m/’inimo. Este último con- cepto sirve como fundamento de la idea de racionalidad limitada y es el centro de estudio de una área nueva y muy fructifera de la teorı́a de juegos conocida como teorı́a de algoritmica de juegos. El jugador con pago 1 lo lla- maremos el ganador.

2)). xL ) en L variables xii=1. x5 ) = (x3 + 2)(x5 + 2)... Considere el siguiente juego. Ejemplo 7 (Juegos determinados no decidibles) .... 3. Pag 63-70. 1982. Jones (1981. Ahora considere tres casos: 1. 13 . pedazos como se muestra en la figura (figura no incluida). Ejercicio 5 Taken from http://polymathprojects. pueden haber hasta dos estrategias ganadoras). entonces el jugador 1 tiene que tener una estrategia ganadora. The rules of the game depend on two positive integers k and n which are known to both players.. Es fácil de ver que el jugador II tiene una estrategia ganador si y sólo si existen infinitos números primos de la forma n2 + 1.3 Para ilustrar esto en un juego sencillo considere un polinomio P (x1 .. xL ).. y ∞ × ∞ (en ambos casos el juego es determinado. El objetivo del último jugador es hacer el polinomio P (x1 . 1982) muestra como se puede reinterpretar este juego como un juego artimético. el juego es determinado pero no se sabe en favor de quién). x5 ) = x21 + x22 + 2x1 x2 − x3 x5 − 2x3 − 2x5 − 3.L donde cada xi es un número entero no negativo. El objetivo del otro jugador es hacer este polino- mio diferente de cero. Vol 11. Rabin (1957) ha dado un ejemplo basado en conjuntos simples.P. . todo juego aritmético es determinado). un problema no resuelto de la teorı́a de números (por lo menos hasta el año 1982. Este polinomio se puede reescribir como: P (x1 . Some undecidable determined games. 4 Decimos que L es la longuitud del juego...e. 3 Basado en Jones. El perdedor es el jugador que está obligado e retirar el último cuadrado. 2. . xL ) = 0. En cada jugada es obligatorio retirar por lo menos un cuadrado. .) Más interesante aún es el hecho de que existen juegos artiméticos en el que la estrategia ganadora no es efectivamente computable (no es decidible). n × m (el primer jugador tiene una estrategia ganadora: Suponga que el jugador 2 tiene una estrategia ganadora. International Journal of Game Theory.. J. No. Después el jugador II escoge un entero no negativo x2 y ası́ sucesivamente hasta que a alguno de los dos jugado- res le corresponde escoger el entero xL . .4 Existen dos jugadores que juegan alternadamente..Ejemplo 6 (Juego de Gale) .. Ahora considere el juego aritmético definido por el polinómio P (x1 .... 2. Es muy fácil demostrar que en todo juego aritmético el jugador I o el jugador II tiene una estrategia ganadora independientemente de lo que el otro haga (i.e. Dado una figura con n × m cuadrados el juego consiste en retirar de forma iterativa. El siguiente es un juego aritmético asociado al polinomio P (x1 . n × n (la estrategia ganadora es (2.... El jugaor I comienza y escoge un entero no negativo x1 . una contradicción). Existen juegos en los que se sabe que uno de los jugadores tiene una estrategia ganadora independien- temente de la estrategia del oponente (i..org/). primero un jugador después el otro y ası́ sucesivamente. The liar guessing game is a game played between two players A and B. . n × ∞.

no hay conjuntos de información divididos por el subjuego). he loses. otherwise. then B wins.99k such that B cannot guarantee a win. R). Ésta puede definir un camino que en el juego original nunca hubiera sido alcanzado al utilizar la estrategia original. Definición 10 (Equilibrio perfecto en subjuegos) Una estrategia conjun- ta s es un equilibrio perfecto en subjuegos si induce un equilibrio de Nash - Cournot de todo subjuego. la estrategia inducida en un subjuego es la restricción de la estrategia al subjuego. After B has asked as many questions as he wants. Véanse los ejemplos de equilibrios perfectos en subjuegos. he must specify a set X of at most n positive integers. La generalización requiere la introducción del concepto de subjuego. A chooses two integers x and N with 1 ≤ x ≤ N . Prove that: If n ≥ 2k . the only restriction is that.5 La anterior definición se extiende de forma natural al caso de estrategias de comportamiento. Player B may ask as many such questions as he wishes. and truthfully tells N to player B. 4. 14 . Definición 9 (Subjuegos) Un subjuego de un juego en forma extensiva es un juego tal que (1) Comienza con un nodo que define un conjunto de información que es un singleton. r) y dos en subjuegos: ((O. Amenazas no creı́bles El concepto de estrategia de inducción hacia atrás no se generaliza de forma inmediata al caso de juegos de información imperfecta. l) y ((I. Player A keeps x secret. at least one answer must be truthful. At the start of the game. For all sufficiently large k. and asking A whether x belongs to S. player A must immediately answer it with yes or no. (2) Contiene todos los nodos sucesores y solo éstos. then B can guarantee a win. among any k + 1 consecutive answers. L)). but is allowed to lie as many times as she wishes. 5 Dada una estrategia de un juego. r) Ejemplo 9 En el siguiente juego (figura 5) vemos como el concepto de equilibrio perfecto en subjuegos selecciona un único equilibrio de Nash de dos equilibrios de Nash que existen. there exists an integer n ≥ 1. Each question consists of B specifying an arbitrary set S of positive integers (possibly one specified in a previous question). En este juego existen dos equilibrios de Nash en el único subjuego (propio): (L. (3) Si un nodo está en el subjuego entonces todo nodo en su conjunto de informa- ción también está (es decir. Ejemplo 8 Figura (a). Información imperfecta 4. l) y (R. After each question.1. If x belongs to X. Player B now tries to obtain information about x by asking player A questions as follows.

15 .

Ahora. a) es el único equilibrio perfecto en subjuegos. Ejemplo 10 (Ineficiencia del equilibrio perfecto en subjuegos) En el si- guiente juego. ((A. el conjunto de estrategias de inducción hacias atrás coincide con los equilibrio perfectos en subjuegos. Véase el juego de la figura 5 para el caso de juegos de información imperfecta. El análogo del teorema de Nash para juegos de información imperfecta es el siguiente teorema de Selten. es interesante que el concepto de equilibrio perfecto en subjuegos puede seleccionar un equilibrio que es dominado por otro equilibrio de Nash. El siguiente ejemplo ilustra esta situación. C) . Ejercicio 6 (Necesidad de memoria perfecta) El siguiente juego ilustra la necesidad de la hipótesis de memoria perfecta en el teorema de Selten. Si bien el concepto de equilibrio perfecto en subjuegos llama la atención sobre la necesidad de enfocarse en estrategias conjuntas que sean óptimas 16 . El ejemplo clásico es el juego de entrada de una firma. la estrategia ((B. Sin embargo. b) es un equilibrio de Nash que domina el equilibrio perfecto en subjuegos. Demostrar que el juego de la figura no tiene un equilibrio en estrategias de comportamiento. Teorema 5 (Selten) Todo juego finito en forma extensiva de memoria per- fecta tiene un equilibrio perfecto en subjuegos (posiblemente en estrategias de comportamiento). figura D. Teorema 4 En un juego información perfecta. El concepto de equilibrio perfecto en subjuegos en un refinamiento estricto del concepto de equilibrio de Nash . D) .Cournot y generaliza el concepto de inducción hacia atrás.

a) son equilibrios perfectos en subjuegos. 1 1 2 4 0 0 1 1 0 0 4 ⫺1 1 1 0 0 1 1 ⫺1 Figure 7. (a) Calculate a Nash equilibrium for the game. in- dependientemente de si el jugador 2 cree estar en el nodo x o en el nodo y la estrategia mixta para 2. 0. La necesidad de introducir un sistema de expectativas como parte integral de la evaluación que de un juego la ilustra la siguiente modificación del juego de la figura C.38 Complete the proof of Theorem 7.6 on the existence of subgame perfect equilibrium. En particular.40 Answer the following questions for the game shown in Fig. dinámicamente (a lo largo de todos los subjuegos).26(a). figura C. 39.39 Find all subgame perfect equilibria of the game in Fig. (0.39. b) es un equilibrio de Nash pero que este sea o no sea creı́ble depende de con qué probabilidad 17 . 7.5. Desafortunadamente no logra eliminar todas las amenzas no creibles porque el concepto de equili- brio no distingue entre nodos que pueden ser alcanzados con probabilidad positiva y aquellos con probabilidad cero de ser alcanzados. no tiene subjuegos propios.7. 7. Ejercicio 7 En el juego de la figura G mostrar que el único equilibrio en el que el jugador 2 juega m con probabilidad cero es cuando el jugador 1 juega L con probabilidad cero. Una vez el jugador 1 decide no entrar. (b) Show that this game has no Nash equilibrium in behavioural strategies. 7.5) domina la estrategia m para el jugador 2. no es creı́ble que el segundo jugador jugará b en caso de tener que jugar. La figura C1 muestra que ((A. Los equili- brios de Nash (A. Los dos ejem- plos siguientes ilustran el problema. Sin embargo el primero no es creı́ble. b) y (B. 0. Ejemplo 11 El siguiente juego. 7. Ejemplo 12 El siguiente juego (figura G) tiene un equilibrio perfecto en sub- juegos ((L. m)) que no es creı́ble.

18 .

en caso de que le toque jugar. Definamos el conjunto de todas las expectativas del agente i como ∆i = ∪ ∆(h) donde ∆(h) denota el conjunto de distribuciones de probabilidad h∈Hi sobre el conjunto de información h. {bi }i=1.... estará haciendolo en uno u otro nodo. Sea k un nodo cualquiera.. Definimos la utilidad del jugador i en el conjunto de información h ∈ Hi cuando el perfil de estrategias de comportamiento es {bi }i=1. Definición 11 (Sistema de expectativas) Un sistema de expectativas de un juego es un conjunto funciones {pi }i=1. Obsérvese que esta utilidad la podemos interpretar como una función: ui (b p ·) : Ki → R..N y las expectativas del jugador son pi (h) ∈ ∆i (h) como: vi (b p h) = Epi (h) [ui (b p ·)] ........ cree el jugador que..N . La interpretación es: pi (h) es la expectativa que tiene el jugador i de estar en cada uno de los nodos de su conjunto de información h.. 19 ....   Definición 12 (Estimación) Una estimación del juego es {pi }i=1..N .. k ∈ Ki .N son estrategias de comportamiento..e...N ..N .N .N donde (pi )i=1... pi : Hi → ∆i tal que pi (h) ∈ ∆(h).N es un sistema de expectativas y (bi )i=1. secuencialmente racionales).   Fijemos una estimación del juego: {pi }i=1. {bi }i=1. Dada una estimación existe una forma natural de definir si las estrategias de comportamiento son óptimas dadas las expectativas de los jugadores (i.... definimos ui (b p k) como la utilidad del jugador i cuando suponemos que éste se encuentra en este nodo y las estrategias de comportamiento utilizadas por los jugadores son {bi }i=1.

bi ) p h). Ejemplo 14 (Racionalidad secuencial en el juego de cara y sello) Considere el siguiente juego (Cara y sello): Figura G Este juego tiene un único equilibrio de Nash en estrategias de comportamiento: la estrategia mixta de jugar cara con probabilidad 12 . py = 1. ((1. conjunto de información I como aparece en la figura): Analizamos separa- damente los 3 subjuegos con raı́z x. pz = 16 . figura F. una estimación secuencialmente racional no es nece- sariamente un equilibrio perfecto en subjuegos.N . dadas las expectativas del jugador 1 en I obtenemos: v1 (b) = 4. b−i p h) ≥ vi ((b0i . 0). ningún jugador tiene incen- tivos unilaterales a desviarse. Supongamor que las expectativas del jugador 1 son px = 21 .... (1.Ejemplo 13 Calculemos v1 (b p I) para el siguiente juego. 0)) es secuencialmente racional pero no es un equilibrio de Nash. el equilibrio prefecto en subjuegos que no es creible no es racionalmente secuencial... Sin embargo la estimación: px = 0. 20 . Intuitivamente. py = 13 . {bi }i=1. (jugador 1. dada esa estimación del juego.. conjunto de información h ∈ Hi y estrategia de comportamiento b0i del jugador i tenemos: vi (bi . Es fácil ver que u1 (b p x) = 4.   Definición 13 (Racionalidad secuencial) Una estimación de un juego {pi }i=1. Ni siquiera un equilibrio de Nash. En la figura figura G. u1 (b p y) = 3 y u1 (b p z) = 6.N es secuencialmente racional si para todo jugador i. Luego. y y z (dejando de lado el hecho de que están en el mismo conjunto de información I). Desafortunadamente.

. Definición 15 (Equilibrio perfecto débil Bayesiano) Una estimación de un juego es un equilbrio perfecto Bayesiano si es secuencialmente racional y si la estimación es consistente con la regla de Bayes. 21 . Sin embargo. (B. Definición  14 (Consistenciacon regla de Bayes) Una estimación de un juego {pi }i=1. Vamos a introducir algunas restricciones de compatibilidad entre las ex- pectativas y estrategias de comportamiento de los jugadores..N es consistente con la regla de Bayes si la ex- pectativa que tiene cada jugador de estar en un nodo especı́fico es igual a la probabilidad condicional a alcanzar el conjunto de información al que pertenece el nodo.. este no es un equilibrio perfecto en subjuegos porque en el único subjuego propio. inducida por las estrategias de comportamiento de todos los jugadores en cada nodo del conjunto de información.. D) es un equilibrio perfecto débil Bayesiano que lo sustenta la creencia del jugador 3 de estar en el nodo superior de su con- junto de información con probabilidad 0. Un equilibrio perfecto débil Bayesiano no tiene que ser necesariamente un equilibrio perfecto en subjuegos como lo demuestra el siguiente ejemplo. X. La consistencia con la regla de Bayes deja indeterminadas las expectativas en los conjuntos de información que no tiene una probabilidad positiva de ser alcanzados...5. Obsérvese que esto no impone nin- guna restricción sobre las expectativas que puede tener un jugador de estar en un nodo particular cuando la probabiliad de llegar al conjunto de información que contiene ese nodo es cero. Ejemplo 15 (Equilibrio perfecto débil Bayesiano que no es perfecto en subjuegos) En el juego de la figur 4. La estimación del juego de cara y sello del ejemplo anterior no es consis- tente con la regla de Bayes por lo tanto no es un equilibrio perfecto débil Bayesiano. {bi }i=1.N . la estrategia inducida no es un equilibrio de Nash (el jugador 3 tiene incentivos unilaterales a desviar- se).

those involving mismas expectativas. B.restringir Thus.e.. 6 by Kreps and Wilson (1982a). X | µ̂.6. Para todo n y para todo i. selectively discard) Nash equilibria that include threats (contingent 6 behaviorPara out más detalles véase Kohlberg of equilibrium) y Reny that would [1997]. sort of belief-based rationality at every information set. we have     π D.N . Creencias no creı́bles 3 = 2 > π 3 C. 2.expectativas D) is indeeddeben reflejar que los juga- a WPBE..N es consistente si existe una sucesión de estrategias de comportamiento conjuntas {bni }n tal que: Supplementary Material 1. which is discussed at some length in Section 4. toda estrategia Refinements excluding pura tiene probabilidad “untenable estrictamente positiva de ser beliefs”: examples elegida). 2. WPBE may be too weak La siguiente and more stringent figura muestra refinements un considered. where D Dos and restricciones C are the two possibleque adicionales choices ayudanin aĥ. 1.” and thus unsuitable to support the equilibrium in question. 2) C 3 X D (0. it fails to guarantee the equilibrium features ensured by SPE at proper subgames. Those threats were conceived as “incredible. 3) Figure 4. the strategy de el universo profile creen- consideredcias son lasthe satisfies siguientes.5: An extensive-form game with a weak perfect Bayesian equilibrium that is not subgame perfect. {b } i i=1. 2.e.  (Evauluaciones Consistentes) una evaluación sequential equilibrium. Its attempt toLa introduce siguienteexplicit figura beliefs muestraintounthe analysis juego en el of multistage que games la restriccion deappears indepen- to backfire. X | µ̂. 16 thus(Independencia) confirming that (B. Furthermore.earlier Another independencia y si- concept that metrı́a son equivalentes a que la evaluación de un juego sea consistente en addresses the issue in a quite different fashion. refine (i. 22 .. 2) B (1.2).120 Refinements of Nash equilibrium: theory (2. But for games of even moderate complexity (recall the game represented in Figure 4. 1.5 (i. Equilibrium. was proposed el sentido de la siguiente definición... Perfect Bayesian β. given these beliefs. namely. Even though WPBE achieves some dencia sobre la expectativas implica que α = β. 0. The above example illustrates a substantial drawback of the WPBE concept. 0) A Y 3 1 D (2.g. ĥ = 0.2. need to be juego en el One que possibility la restriccion de respect in this indepen- dencia y simetrı́a sobre la expectativas implica que α = is afforded by a notion proposed by Fudenberg and Tirole (1991).Las X. our attention focuses onDecimos just oneque of them. de Bayes. Definition 4. laobjective sucesiónhas {bnibeen to propose }n converge a brobustness criteria that might i. dores escogen sus estrategias de forma independiente. bni es de soporte completo o completamente mixta 4.5).  de un juego {p } i i=1. just two stages). Definición It is easy to see 17 (Simetrı́a) that thiscon Jugadores problem idéntica cannot arise indeben información very simple tener las games (e. Para cada our i. optimality required at the information set ĥ (part (a) of Definition 4.. In previous sections. never be carried out by rational players. B. It is straightforward to check that it is satisfied as well at all other Definición information sets. sequential equilibrium... Since both of these approaches end up arriving at similar solutions of Definición 18 the problem. 0) 2 C (0. which strengthens WPBE by imposing some natural constraints on how beliefs Lascanhipótesis be formed de consistencia con la regla off the equilibrium path.2.. ĥ 4.

el equilibrio 7. α is the probability that player 2 places on player 1 having Now. when given El análogo exactlyal the teorema same de Nash o al teorema information asdeplayer Selten para equilibrios 2). (0) l (0) l (0) [␤ ] 3 [1 ⫺ ␤ ] A restriction implied 1 (1) ence.e. They are as3. e how these two principles lead to α figura En la figura = β. mación con probabilidad cero de ser visitados) un jugador tiene incentivos unilaterales a desviarse. lies that player 3 also places probability α on player 1 having chosen L at n the game (i. Para cada i las espectativas que induce la sucesión {bni }n de acuerdo a la regla de Bayes convergen a las espectativas pi . dence of the players’ strategies.30. the principle de un equilibrio perfecto en of common subjuegos que sea se- cuencialmente racional pero no sea un equilibrio secuencial.G.en When prefecto player subjuegos que no 2’s es creible no es un equilibrio secuencial (no es secuencialmente racional). although this is notEjercicio represented in ejemplo 8 Dar un the diagram.. But secuenciales es el teorema de Krep y Wilson. en ningún momento del juego (aún en conjuntos de infor- identical beliefs. h identical information haveIntuitivamente.consider Fig. set is reached. reflect that players choose their 19 Definición strategies independently. finding out the strategy choice of player 2 Teorema 6 (Kreps y Wilson) Todo juego en forma extensiva con memoria ayer 3 with no information whatever regarding the strategy chosen by player perfecta tiene un equilibrio secuencial (posiblemente en estrategias de compor- tamiento) y todo equilibrio secuencial es un equilibrio perfecto en subjuegos. (Equilibrio Secuencial) Una evaluación de un juego es un equilibrio secuencial si es consistente y secuencialmente racional. (0) (0) 2 (1) (1) (0) (0) (0) (0) [␣ ] 3 [1 ⫺ ␣ ] [␤ ] 3 [1 ⫺ ␤ ] eed this equality follows from two additional principles that we intentionally ly informally.follows. 23 .

(1) (0) (0) L R [␣ ] 2 [1⫺ ␣ ] r (1) r (1) (0) l (0) l (0) [␤ ] 3 [1 ⫺ ␤ ] A restriction implied 1 (1) ce. CHAPTER 7 A restriction implied by 1 OUT fs and independence. (0) (0) 2 (1) (1) (0) (0) (0) (0) 24 [␣ ] 3 [1 ⫺ ␣ ] [␤ ] 3 [1 ⫺ ␤ ] .

25 .4. i. signaling). the secuencial. 0) a x 22 b (0. 0. strategy profile Considere (A. 5. we showed that this equilibrium notion does not even guarantee subgame perfection. 2. 0) 3 A (0.6.with consistent U ) es unand (4.4. U ) satisfies both (a) and (0. Mas Colell tiene un buen ejemplo de un equilibrio que es secuencial pero no perfecto. To tackle the problem. Las estrategias (A. U ) son un equilibrio perfecto equilibrium is weak perfect Bayesian for any belief pattern µ̂ that satisfies débil Bayesiano siempre y cuando el jugador 3 crea que está en x31 con probabilidad superior a 2 µ̂(x31 ) ≥ 2(1 3 . Vega - Redondo. Analizar figuras 4. 0.4) that involves a belief x 31 . Equilibrio perfecto y propio En la figura C el concepto de equilibrio propio elimina el equilibrio no creible. Esto completa la totalidad del analisis relevante en Vega Redondo.5)este equilibrio requerirı́a una sucesión de expectativas convergiendo a cero en el nodo or µ̂(x31 ) ≥ 2/3. b. arguably “untenable”) belief imputations off the equilibrium path. 1) U x 31 (1.8 y 4. it may allow for nonequilibrium behavior in some proper subgames. any assessment (recall Section 4. Ver ejemplo 23 de las notas.9 de Vega Redondo (ejemplos de jugadores con teorias alternativas. En este caso. profile (A. ese equilibrio lo elimina. 0) b U B x 32 V 1 2 (2. 2) C (0.7. consider the game represented in Ejemplo Figure 4. But more generally. There.10. 1. the objective should be to rule out all awkward (thus. Soportar (4. Este equilibrio no−esµ̂(xcreible 31 )) y no es un equilibrio secuencial. one of the primary objectives in this respect must be to guarantee that the induced equilibria satisfy the basic requirement of subgame perfection.e.16 Equilibrio perfecto débil Bayesiano que es perfecto en subjuegos pero no equilibrio In this game.. 0) V a x 21 (0. 0) Figure 4.5) equilibrio secuencial the strategy y esb.creı́ble. b.10 deThis equilibrium. Clearly. Uel) defines juego de la figura a Nash 4. Ahora pattern (B. 0. 0.10: An extensive-form game with a WPBE that is not a sequential equilibrium. To illustrate some of the considerations involved in this task. 0. the main issue concerns finding natural conditions that suitably narrow down the unrestricted off-equilibrium beliefs permitted by the WPBE concept. Las consecuencias de equivocarse al jugar un equilibrio de Nash motiva el concepto de equilibrio propio.6 Sequential equilibrium The important shortcomings exhibited by the WPBE concept were illustrated in Section 4. Of course.4. b.4.

Un problema de externalidades • Basado en Varian [1994]: A Solution to the Problem of Externalities when Agents are Well-Informed. Consideremos el caso de dos firmas: Ci (qi ) = cqi y P (Q) = max{M −dQ. En particular. Existen otros equilibrios del juego de Stackelberg que sean equlibrios de Nash. d > y Q = q1 + q2 . La misma relación se mantiene para los beneficios. Son estos crébles? 6. En esta caso la solución es: M −c q1 = (1) 2d M − c − dq1 M −c q2 = = (2) 2d 4d Si comparamos este equilibrio con el equilibrio simétrico en el caso de competencia a la Cournot. mostrar que en términos de excedente del consumidor competencia a la Stackelberg es mejor que competencia a la Cournot y peor que competencia a la Bertrand. La forma de resolver este juego de información perfecta es hacer inducción hacias atrás.2.2.1. M. Oligopolio: Stackelberg Este es un juego en dos etapas en las que una firma es lı́der y toma su decisión de producción. 6. Primero encontramos la función de mejor respuesta de la firma seguidora ante cualquier estrategia de la firma lı́der. El espacio de estrategias de la firma lı́der es S1 = R+ . calculamos la mejor estrategia de la firma lı́der cuando esta anticipa que la firma seguidora utilizará su mejor respuesta.6. Diseño de mecanismos Vamos a estudiar dos aplicaciones a la teoria de diseño de mecanismos: el mecanismo de compensación de Varian y el problema de Rey Salomón. Aplicaciones 6. En la segunda etapa las demás firmas deciden sus niveles de producción. la firma lı́der produce más que en el caso de competencia a la Cournot y la firma seguidora menos. • Implementa asignaciones eficientes como equilibrios perfectos en sub- juegos en: 26 . El espacio de es- trategias para la firma seguidora es el conjunto de todas las funciones de los reales no negativos en los reales no negativos (la estrategia de la firma seguidora es condicional a la cantidad producidad por la firma lı́der). Cournot y Bentrand.1. Ejercicio 9 Compare los resultados de este modelo de competencia de Stackel- berg con los resultados de competencia monopolı́stica. 0} . Segundo.

Ambientes económicos con externalidades. Es decir. Arrow: crear un mercado para la externalidad (mercado de dere- chos para generar la externalidad). éstas si se conocen entre ellas.O son: r − c0 (x∗1 ) − e0 (x∗1 ) = 0 luego si el regulador le impone un impuesto p∗ = e0 (x∗1 ) y la firma resuelve: rx1 − c(x1 ) − p∗ x1 entonces esta tributación (lineal) implementa el mecanismo de Pigou. 2. Este es un ejempló ti- pico de un problema de información completa pues. El problema es que el mercado puede ser muy ”delgado”. 3.2. 27 .2. • π1 (x1 ) = rx1 − c(x1 ). • Tres soluciones clásicas a este problema: 1. • El problema de la firma 1 es: rx1 − c(x1 ) − e(x1 ) y las C.P. • El mecanismo supone que los agentes conocen las tecnologı́as y prefe- rencias de los demás agentes pero el regulador no. Mostrar que la solucion descentrali- zada no satisface estas ecuaciones y. la firma 1 impone una externalidad en la firma 2. 6. Coase: negociación privada en ausencia de costos de transacción y derechos de propiedad bien definidos. 2. 1. si bien el regulador desconoce los fundamentales de las firmas. • Considere dos fimas i = 1. Ejercicio 10 Caracterice la solución eficiente de este problema como un problema de optimización de un planificador central y escriba las condidi- ciones de primer orden del problema. 3. es ineficiente. Juegos como el dilema de los prisioneros. • El problema es que el regulador no conoce e(x1 ). Problemas de competencia imperfecta. • π2 (x1 ) = −e(x1 ). Pigou: Supone que el regulador conoce las tecnologı́as. x1 la cantidad que ofrece la firma 1 y c(x1 ) el costo. por lo tanto. La solución de Pigou • Cobrar un impuesto a la firma 1 igual a e(x). donde r es el precio de venta del producto. 2. Este meca- nismo motiva una modificación que relaja el anterior supuesto y es la intuición básica del mecanismo de compensación.

Dado p2 la firma 1 escoge p1 = p2 . p∗ ).P. • Dos etapas: 1. • Para ver esto resolvamos el juego por inducción hacia atrás (obsérvese que en la primera etapa se escogen precios de forma simultánea y en la segunda la firma 1 escoge cantidades y la 2 es pasiva).2. en la primera etapa si la firma 2 maximiza su beneficio entonces escoge p2 para maximizar: p1 x(p2 ) − e(x(p2 )) que tiene C. 2. p2 )). ◦ La firma 2: p1 x − e(x) • Intuitivamente la firma 1 es llamada a pagar un impuesto proporcional al costo marginal según lo reporta la firma 2 y un costo por reportar algo diferente a lo que reporta 1.6. p) donde x maximice el beneficio de la firma 1 es un equilibrio de Nash. • Ahora. Pagos netos: Las firmas deben resolver el siguiente problema: ◦ La firma 1: rx − c(x) − p2 x − α1 (p1 − p2 )2 donde α1 es cualquier parámetro mayor que cero. • Este juego en dos etapas tiene múltiple equilibrios de Nash: cualquier strategia ((x. Supongamos que p1 . Esa es su mejor respuesta. Sin embargo.O: (p1 − e0 (x(p2 ))) x0 (p2 ) ⇒ p1 − e0 (x(p2 )) 28 . p). Etapa de revelación del impuesto y subsidio: Las firmas son lla- madas a anunciar cual es el impuesto Pigoviano que soluciona el problema de ineficiencia ((p1 . es un juego estático en el que cada firma escoge precios de forma simultánea. p∗ ) que implementa las asignaciones de Pigou. • La firma 2 recibe una compensación proporcional a lo que la firma 1 reporta como el costo marginal. tiene un único equilibrio perfecto en subjuegos: ((x∗ . El mecanismo de compensación • El mecanismo de compensación consiste de un juego de información imperfecta en dos etapas.3. p2 es dado y la firma 1 maximiza su beneficio: esto significa escoger x∗ (p2 ) tal que: r − c0 (x∗ (p2 )) − p2 = 0 • En la primera etapa del juego.

29 . Ejemplo 17 (Dilema de los prisioneros) Considere el juego: C D C 5. • También se puede implementar el mecanismo con impuestos no linea- les.6 D 7. x2 ) + p221 x1 − p212 x2 − (p121 − p221 )2 y 2 maximiza: u2 (x1 . x2 ) Ejemplo 18 Mecanismo de compensación  I: El primera etapa los ju- gadores anuncian: p112 . (p221 . x2 ) − p12 x2 + p21 x1 y 2 maximiza: u2 (x1 . Combinando las ecuaciones anteriores obtenemos: r − c0 (x∗ ) − e0 (x∗ ) = 0 • Se puede demostrar que este es también el único equilibrio en estrate- gias mixtas. El agente 1 maximiza: u1 (x1 . (p221 . Cero de lo contrario y lo mismo para el segundo jugador. ¿Cómo se puede inducir la asignación eficiente en la que ambos cooperan? Sea x1 = 1 si el jugador 1 coopera.1 3. • Este es un mecanismo balanceado en equilibrio pero no por fuera de equilibrio.3 La pregunta es. x2 ) + p112 x2 − p121 x1 − (p212 − p112 )2 Demostrar que cooperar  es un equilibrio perfecto en subjuegos y que cualquier p112 . x2 ) − p21 x1 + p12 x2 Demostrar que cooperar es un equilibrio perfecto en subjuegos y calcular los precios que implementan el equilibrio. La utilidad de cada jugador la denotamos por ui (x1 . p212 ) . p212 ) tal que: 4 ≥ p121 = p221 ≥ 2 3 ≥ p112 = p212 ≥ 1 son precios que implementan el equilibrio. p121 . • Con más de dos agentes es posible hacer el mecanismo balanceado por fuera de equilibrio. p121 . En la segunda etapa ellos escogen si cooperan o no. Ejemplo 19 Mecanismo de compensación  II: En la primera etapa los jugadores anuncian: p12 .5 2. p21 ) etapa los jugadores anuncian si van a cooperar o no. En la segunda etapa ellos escogen si cooperan o no. El agente 1 maximiza: u1 (x1 .

A pesar de que el Rey no sabe cuál es el juego en forma extensi- va que se está jugando. El valor para la verda- dera madre del bebé es 100 y 50 para la mujer que no es la verdadera madre. Cada una de las mujeres reclama al bebé como suyo. se aparecen en frente al Rey Salomón con un bebé. Si responde afir- mativamente la mujer B le debe pagar al Rey 75 y se queda con el bebé y la mujer A debe pagarle 10 al Rey.4. 2. 2. El Rey le pregunta a la mujer B si es la verdadera madre. Tiene este juego otro equilibrio que no sean perfecto en subjuegos? 30 . El Rey les propone jugar el siguiente juego. Describa los dos juegos en forma extensiva que resultan de suponer que la mujer A es la verdadera madre y que la mujer B es la verdadera madre. Si dice que no lo es le entrega el bebé a la mujer B. El problema del Rey Salomón Ejercicio 11 Juegos en forma extensiva (implementación). El Rey no sabe quién es la verdadera madre pero sı́ sabe las valoraciones mencionadas. El Rey va a preguntarle a la mujer A si ella es la verdadera madre. A y B. logra él con este mecanismo entregarle el bebé a la verdadera madre? 4.6. Calcular el equilibrio perfecto en subjuegos de cada juego. Responda las siguientes preguntas. 1.2. 3. Dos mu- jeres. Si dice que no lo es se le entrega el bebé a la mujer A. 1. Si A responde afirmativamente se continua con el siguiente paso.