You are on page 1of 3

ESCUELA POLITÉCNICA NACIONAL

FACULTAD DE CIENCIAS
TEORÍA DE JUEGOS
Nombre: Marjorie Salas Fecha: 24/07/2018

JUEGOS REPETIDOS Y REPUTACIÓN


RESUMEN
A menudo las personas interactúan en relaciones continuas, al decidir cómo comportarse en una relación
continua, uno debe considerar cómo el comportamiento de uno influirá en las acciones de los demás en el futuro.
Las personas a veces tienen un incentivo para renunciar a pequeñas ganancias inmediatas debido a la amenaza
de futuras represalias por parte de otros. El término "reputación" se usa a menudo para describir cómo las
acciones pasadas de una persona afectan las creencias y el comportamiento futuros. La preocupación por la
reputación puede motivar a las partes a cooperar entre sí, la teoría de juegos proporciona un marco para
comprender cómo dicho mecanismo de reputación puede apoyar a la cooperación.
La interacción entre ganancias inmediatas e incentivos a largo plazo se examina a través de un juego repetido.
Un juego repetido se juega durante períodos de tiempo discretos (período 1, período 2, etc.). T denota el número
total de períodos en el juego repetido, T puede ser un número finito o puede ser infinito, lo que significa que los
jugadores interactúan perpetuamente con el tiempo.
En cada período, los jugadores juegan un juego de escenario estático, mediante el cual seleccionan acciones de
forma simultánea e independiente. Estas acciones conducen a una recompensa del juego.
El juego de la etapa se puede denotar por {A, u}, donde 𝐴 = 𝐴1 𝑥𝐴2 𝑥 … . 𝐴𝑛 es el conjunto de perfiles de acción
y 𝑈𝑖 (𝑎) es el resultado del juego de escenario del jugador i cuando el perfil a se juega. El mismo juego de la
etapa se juega en cada período. Además, se supone que en cada período t, los jugadores han observado la
secuencia de perfiles de acción, desde el primer período hasta el período t - 1. La recompensa de todo el juego
se define como la suma de las ganancias del juego de etapa en los períodos 1 a T. A veces se supone que los
jugadores descuentan el futuro, en cuyo caso se incluye un factor de descuento en la especificación de pago.
UN JUEGO REPETIDO DE DOS PERÍODOS
Los jugadores 1 y 2 interactúan en dos períodos. (T=2). En cada
período, juegan el juego de la etapa que se muestra en la figura (1).
Suponemos que el pago de todo el juego es la suma de los pagos del
juego de la etapa en los dos períodos. Por ejemplo, si (A, X) se juega
en el primer período y (B, Y) se juega en el segundo período, entonces
el pago del jugador 1 es 4 + 2 = 6 y el pago del jugador 2 es 3 + 1 = 4.
Figura (1)

La figura 2 (a) representa gráficamente el conjunto de posibles pagos repetidos del juego. Cada punto en el
gráfico corresponde a la suma de dos vectores de pago de escenario. Por ejemplo, el vector de pago (3, 5) puede
alcanzarse si (A, Z) se juega en el primer período y (B, Y) se juega en el segundo período; los mismos resultados
de pago si (B, Y) se juega en el primer período, seguido de (A, Z).
Figura (2)

Este juego repetido de dos períodos tiene una gran representación de forma extensa, la forma extensa comienza
con la selección simultánea de acciones en el primer período: el jugador 1 elige entre A y B, y el jugador 2
selecciona X, Y o Z. Luego, después de haber observado las acciones del primer período de los demás, los
jugadores seleccionan nuevamente desde {A, B} y {X, Y, Z}. Como cada jugador sabe lo que sucedió en el
primer período, su elección en el segundo período se condiciona a esta información.
Debido a que hay seis resultados posibles de la interacción del primer período, cada jugador tiene seis conjuntos
de información en el segundo período. En otras palabras, cada jugador tiene que tomar seis decisiones en el
período 2.
Este juego tiene un gran conjunto de estrategias, por lo que el análisis de la racionalidad es un poco desalentador
sin embargo se puede aclarar mediante la búsqueda de equilibrios de Nash de estrategia pura y subjuegos
perfectos. Para simplificar la búsqueda se debe especificar que en el segundo período, los jugadores seleccionan
un perfil de acción que sea un equilibrio de Nash del juego de la etapa.

Figura (3)

Siguiendo el juego de (A, Z) en el primer período, el subjuego se describe mediante la matriz en la figura 3, se
construyó esta matriz agregando el vector de pago (1, 4) a cada una de las celdas en el juego de escenario. Por
lo tanto, la Figura 3 describe los posibles pagos de continuación después del juego de (A, Z) en el primer período.
El subjuego tiene dos equilibrios de Nash, (B, Y) y (A, Z). Por lo tanto, un equilibrio perfecto en subjuegos
debe especificar que (B, Y) o (A, Z) se jueguen en el segundo período si (A, Z) se juega en el primer período.
Debido a que la matriz de subjuegos se forma agregando el mismo vector de pago a cada celda de la matriz de
juego de etapa, las preferencias de los jugadores sobre los perfiles de acción en el subjuego son exactamente las
mismas que sus preferencias en una jugada aislada del juego de etapa. Es decir una vez que termina el primer
período, los pagos del primer período se reducen. Lo que obtengan los jugadores en el segundo período, es
adicional a lo que ya recibieron en el primero. Así, un equilibrio perfecto en subjuegos debe especificar que los
jugadores seleccionan un equilibrio de Nash en el juego de escenario en el período 2, pase lo que pase en el
período 1.
Cualquier combinación de los perfiles de Nash puede ser respaldada como un resultado de equilibrio perfecto
en el subjuego. Por ejemplo, "elegir (A, Z) en el primer período y luego, independientemente del resultado del
primer período, elegir (B, Y) en el segundo período" es un equilibrio perfecto en el subjuego; produce el vector
de pago (3, 5). Los resultados de los equilibrios que especifican los perfiles de Nash en ambos períodos están
encuadrados en la Figura 2 (b).
Solo se pueden jugar los perfiles de Nash en el segundo período. Sin embargo, a veces existen equilibrios
reputacionales por los cuales los jugadores seleccionan perfiles de Nash que no son de etapa en el primer
período. Estas elecciones son compatibles al hacer que las acciones del segundo período continúen dependiendo
del resultado en el primer período.
Los juegos infinitamente repetidos se definen por T = infinito; es decir, el juego de la etapa se juega en cada
período durante un número infinito de períodos, los juegos infinitamente repetidos son útiles para modelar
algunas situaciones del mundo real. Además, a pesar de la complejidad de estos juegos, el análisis de sus
equilibrios perfectos en subjuegos puede ser bastante simple.
Considere un juego infinitamente repetido con descuento, por el cual los pagos en el juego de escenario se
descuentan con el tiempo. Usemos δ (un número entre 0 y 1) para indicar el factor de descuento para ambos
jugadores. Al comparar un pago recibido hoy con un pago recibido mañana, se descuenta el pago de mañana
multiplicándolo por el factor de descuento. Los pagos que se obtuvieron de dos períodos a partir de ahora se
descuentan por δ 2, beneficios obtenidos de tres períodos a partir de ahora tienen un descuento del δ3, y así
sucesivamente.
Para juegos repetidos, se tiene que calcular la suma de una secuencia de pagos descontados. Por ejemplo, un
jugador puede obtener 1 unidad en cada período por un número infinito de períodos. En este caso, la suma de
su flujo de pago descontado es:

Podemos simplificar esta expresión al notar que

Finalmente, obtenemos:

En un juego repetido, hay un conjunto de información diferente para cada período t y cada historia de juego
diferente desde el comienzo del juego hasta el período t - 1. Por lo tanto, una estrategia prescribe una acción
para que un jugador tome condicional todo lo que tomó colocar en el pasado.
A menudo es suficiente considerar solo algunos tipos de estrategias simples en juegos repetidos. Los más
simples son los que prescriben los perfiles de Nash en cada período.
Para capturar la idea de reputación, se examina otro tipo de estrategia simple llamada estrategia desencadenante.
Las estrategias de activación se refieren específicamente a dos perfiles de acción para el juego de escenario: un
perfil se denomina "perfil de cooperación" y el otro se llama "perfil de castigo". Se supone que el perfil de
castigo es un perfil de Nash en etapa. En un equilibrio de estrategia desencadenante, se supone que los jugadores
juegan el perfil cooperativo en cada período. Sin embargo, si uno o ambos se desvían del perfil cooperativo,
entonces juegan el perfil de castigo para siempre. En otras palabras, desviarse del perfil cooperativo destruye la
reputación de un jugador y desencadena el perfil de castigo para el resto del juego.
Para ver cómo funciona esto, se considera el dilema de los presos infinitamente repetido. El juego de la etapa
se da en la figura 4. Solo hay un equilibrio de Nash de etapa, (D, D), entonces lo usamos como el perfil de
castigo. (C, C) es el perfil cooperativo. El objetivo es entender si los jugadores tienen el incentivo para jugar
(C, C) cada período bajo la amenaza de que volverán a (D, D) para siempre si uno o ambos hacen trampa. Para
ser precisos, la estrategia desencadenante especifica que los jugadores seleccionen (C, C) cada período, siempre
que este perfil siempre se haya jugado en el pasado; de lo contrario, deben jugar (D, D). Esto a veces se llama
la estrategia de gatillo sombrío.

Figura (4)

You might also like