TEORÍA DE JUEGOS - EJEMPLOS

Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
1







1 1. . J UEGOS DE DOS PERSONAS CON SUMA CERO

1 1. .1 1. . En el horario de 8 a 9 p.m., dos cadenas televisivas compiten por la audiencia de 100
millones de espectadores. Las cadenas deben anunciar en forma simultánea el
espectáculo en ese horario. Las elecciones posibles de cada cadena y el número de
televidentes de la cadena 1, en millones, aparecen en la tabla a continuación, para
cada elección. ¿Tiene este juego un punto de silla? ¿Cuál es el valor del juego para la
cadena?

CADENA 1 CADENA 2
MÍNIMO DE
RENGLÓN

Película del oeste
Telenovela
Comedia
Película del Oeste
35
45
38
Telenovela
15
58
14
Comedia
60
50
70

15
45
14
MÁXIMO DE
COLUMNA
45 58 70

Observando los mínimos de renglón, se encuentra que si la cadena 1 opta por la telenovela,
puede asegurar al menos ( ) es televident de millones máx 45 14 , 45 , 15 = . Al observar los
máximos de columna, se encuentra que si la cadena 2 escoge la película del oeste, puede
mantener la audiencia de la cadena 1 en cuando mucho
( ) es televident de millones máx 45 70 , 58 , 45 = . Se observa entonces que el máximo de los
mínimos de renglón es igual al mínimo de los máximos de columna, es decir 45; por lo tanto
sí hay punto de silla y el valor del juego para la cadena es 45 millones de personas.
TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
2
1 1. .2 2. . Se lanza al aire una moneda buena, y se muestra al jugador 1. Este jugador debe
decidir si pasar o apostar. Si el jugador 1 pasa, debe pagar 1 dólar al jugado 2. Si
apuesta el jugador 1, el jugador 2, quien no conoce el resultado de lanzar la moneda,
puede seguir o retirarse de la apuesta. Si el jugador 2 sigue, paga un dólar al jugador
1. Si se retira y al lanzar la moneda sale cara, el jugador 2 paga 2 dólares al jugador 1;
si sale cruz, el jugador 1 debe pagar 2 dólares al jugador 2. Formule lo anterior como
un juego de dos personas con suma cero. Determine en forma gráfica el valor del
juego y la estrategia óptima de cada jugador.

Con el fin de formar la matriz de recompensa de este juego, primero deben hacerse los
cálculos correspondientes, para saber cuál es la ganancia del jugador uno en cada caso.
Para esto, se sigue la siguiente representación para las estrategias del jugador 1:

PP = Pasar en cara y pasar en cruz
PB = Pasar en cara y apostar en cruz
BP = Apostar en cara y pasar en cruz
BB = Apostar en cara y apostar en cruz


Mientras que, el jugador 2, sólo tiene dos opciones, retirarse (R) o seguir (S).A continuación
se muestran los cálculos para la matriz de recompensa:

( )( ) ( )( )
( )( ) ( )( )
( )( ) ( )( )
( )( ) ( )( )
( )( ) ( )( )
( )( ) ( )( )
( )( ) ( )( )
( )( ) ( )( ) dólar 0,5 0,5 S Vs. BB
dólares 0,5 0,5 R Vs. BB
dólares 0,5 0,5 S Vs. BP
dólares 0,5 0,5 R Vs. BP
dólares 0,5 0,5 S Vs. PB
dólares 0,5 0,5 R Vs. PB
dólar 0,5 0,5 S Vs. PP
dólar 0,5 0,5 R Vs. PP
1 1 1
0 2 2
0 1 1
5 , 0 1 2
0 1 1
50 , 1 2 1
1 1 1
1 1 1
= +
= − +
= − +
= − +
= + −
− = − + −
− = − + −
− = − + −



Ahora sí se puede hacer la respectiva matriz de recompensa para el jugador 1
TEORÍA DE JUEGOS - EJEMPLOS


JUGADOR 1
JUGADOR 2
MÍNIMO DE
RENGLÓN

PP
PB
BP
BB
RETIRARSE
-1
-G
1
0
SEGUIR
-1
0
0
1

-1
-G
0
0
MÁXIMO DE
COLUMNA
1 1


En la matriz anterior se puede notar que no hay punto de silla, sin embargo, sí hay
estrategias dominadas, las cuales son las estrategias PP y PB, las cuales son dominadas
tanto por la estrategia BP como por BB. Al omitir estas estrategias dominadas, se obtiene
una nueva matriz de recompensa, así:

JUGADOR 1 JUGADOR 2
MÍNIMO DE
RENGLÓN

BP
BB
RETIRARSE
1
0
SEGUIR
0
1

0
0
MÁXIMO DE
COLUMNA
1 1

Ahora si se pasa a la solución gráfica del ejercicio, teniendo en cuenta las variables:

( )
( ) seguir escoja 2 jugador el que de ad Probabilid
retirarse escoja 2 jugador el que de ad Probabilid
BB escoja 1 jugador el que de ad Probabilid
BP escoja 1 jugador el que de ad Probabilid
= −
=
= −
=
1
1
1
1
1
1
γ
γ
χ
χ


Para determinar la estrategia óptima del jugador 1, se observa que para cualquier valor de X
i
,
la recompensa esperada contra retirarse y seguir es:

( )( ) ( ) ( )
( )( ) ( ) ( ) seguir Contra
retirarse Contra
1 1 1
1
1 1
1 1 1 0
2
1 0 5 , 0
χ χ χ
χ
χ χ
− = − +
= − +


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
3
TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
4
Mientras que para el jugador 2, su recompensa esperada, si el jugador 1 escoge BP y si
escoge BB es:

( )( ) ( ) ( )
( )( ) ( ) ( ) BB
BP
1 1 1
1
1 1
1 1 1 0
2
1 0 5 , 0
λ γ γ
γ
γ χ
− = − +
= − +



Las gráficas para cada jugador son:



En resumen, el valor del juego es ⅓ para el jugador 1, la estrategia mezclada óptima para el
jugado 1 es (⅔, ⅓), y la estrategia óptima mezclada para el jugador 2 también es (⅔, ⅓)


1 1. .3 3. . Determinar el valor y las estrategias óptimas para el juego de dos personas con suma
cero de la tabla que se muestra a continuación.

JUGADOR 1 JUGADOR 2
MÍNIMO DE
RENGLÓN

Estrategia 1
Estrategia 2
Estrategia 1
30
60
Estrategia 2
40
10
Estrategia 3
36
36

30
10
MÁXIMO DE
COLUMNA
60 40 36

TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
5
El juego no tiene punto de silla, ni estrategias dominadas, por lo tanto se procede a resolver
mediante programación lineal. Dado que no hay valores negativos en la matriz del juego, se
sabe que el valor del juego es no negativo. Las PL del jugador 1 y el jugador 2 son:

0 , ,
1
36 36
10 40
60 30 . .
2 1
2 1
2 1
2 1
2 1

= +
+ ≤
+ ≤
+ ≤
=
v

v
v
v A S
v Z
máximo
χ χ
χ χ
χ χ
χ χ
χ χ

0 , , ,
1
36 10 60
36 40 30 . .
3 2 1
3 2 1
3 2 1
3 2 1

= + +
+ + ≥
+ + ≥
=
w

w
w A S
w Z
mínimo
γ γ γ
γ γ γ
γ γ γ
γ γ γ

Jugador 1 Jugador 2

Después de sustituir (
1 2
1 ) χ χ − por y sustituyendo
2 1 3
1 γ γ γ − − = , en los modelos
anteriores se obtienen los siguientes modelos de PL:

0 , ,
36
10 40
60 30 . .
2 1
1
1


≤ −
≤ +
=
v
v
v
v A S
v Z
máximo
χ χ
χ
χ

0 , , ,
36 26 24
36 4 6 . .
3 2 1
2 1
2 1

≥ + −
≥ − +
=
w
w
w A S
w Z
mínimo
γ γ γ
γ γ
γ γ

Jugador 1 Jugador 2

De estos dos modelos, se obtiene que el valor del juego es v = 35, la estrategia del jugador
1 es 6 / 5
1
= χ y ( ) 6 / 1 1
1
= − χ , y la estrategia para el jugador 2 es 2 / 1
1
= γ , 2 / 1
2
= γ y
0
3
= γ .

1.4. En el juego de dos dedos, dos jugadores sacan en forma simultánea 1 o 2 dedos.
Cada jugador debe anunciar el número de dedos que cree que su contrincante ha
sacado. Si ninguno de los dos jugadores adivina, o ambos adivinan, el juego se
empata. Si no es así, el jugador que adivina en forma correcta gana al otro jugador la
cantidad, en dólares, de dedos que han sacado los dos. Si hacemos que (i, j),
represente la estrategia de sacar i dedos y adivinar que el oponente ha sacado j
dedos, la matriz de recompensas correspondiente es la que aparece a continuación:
TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
6


JUGADOR 1 JUGADOR 2
MÍNIMO DE
RENGLÓN

(1, 1)
(1, 2)
(2, 1)
(2, 2)
(1, 1)
0
-2
3
0
(1, 2)
2
0
0
-3
(2, 1)
-3
0
0
4
(2, 2)
0
3
-4
0

-3
-2
-4
-3
MÁXIMO DE
COLUMNA
3 2 4 3


Este juego no tiene punto de silla ni estrategias dominadas, al igual que el anterior, se
resuelve por programación lineal. Para asegurar que el valor del juego sea positivo, se le
suma 4 a cada elemento de la matriz de recompensa, dando como resultado la siguiente
matriz de recompensa.

JUGADOR 1 JUGADOR 2

(1, 1)
(1, 2)
(2, 1)
(2, 2)
(1, 1)
4
2
7
4
(1, 2)
6
4
4
1
(2, 1)
1
4
4
8
(2, 2)
4
7
0
4


Los modelos de programación de lineal para cada uno de los jugadores son:

( )
( )
( )
( )
0 ' , , ,
1 4 7 4
1 8 4 4 1
1 1 4 4 6
1 4 7 2 4 . .
3 2 1
3 2 1 2 1
3 2 1 3 2 1
3 2 1 3 2 1
3 2 1 3 2 1

− − − + + ≤
− − − + + + ≤
− − − + + + ≤
− − − + + + ≤
=
v
v'
v'
v'
v' A S
v Z
máximo
χ χ χ
χ χ χ χ χ
χ χ χ χ χ χ
χ χ χ χ χ χ
χ χ χ χ χ χ

PL para el jugador 1
TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
7
( )
( )
( )
0 ' , , ,
1 1 4 8 1 4
7 7 7
1 1 7 4 4 2
1 1 4 1 6 4 . .
'
3 2 1
3 2 1 3 2 1
3 2 1
3 2 1 3 2 1
3 2 1 3 2 1

− − − + + + ≥
+ + ≥
− − − + + + ≥
− − − + + + ≥
=
w
w'
w'
w'
w' A S
w Z
mínimo
γ γ γ
γ γ γ γ γ γ
γ γ γ
γ γ γ γ γ γ
γ γ γ γ γ γ

PL para el jugador 1

Los resultados obtenidos (mediante el método símplex) para estos modelos son: el valor del
juego (v’) es 4; las estrategias para el jugador 1 son 0
1
= χ , 5 / 3
2
= χ , 5 / 2
3
= χ y 0
4
= χ ; y
las estrategias para el jugador 2 son 0
1
= γ , 5 / 3
2
= γ , 5 / 2
3
= γ y 0
4
= γ . Como al
comienzo a cada elemento de la matriz de recompensa se le sumo 4, entonces el valor
esperado del juego en realidad es 0 4 ' = − = v v .


2 2. . J UEGOS DE DOS PERSONAS CON SUMA NO CONSTANTE

2 2. .1 1. . Hay dos restaurantes en competencia, Hot Dog King y Hot Dog Chef, que tratan de
determinar sus presupuestos de propaganda para el año próximo. Las ventas
combinadas de los dos son 240 millones de dólares y pueden gastar 6 o 10 millones
de dólares en propaganda. Si uno de ellos gasta más que el otro, tendrá ventas de
190 millones de dólares. Si ambas empresas gastan la misma cantidad en
propaganda, tendrán ventas iguales. Cada dólar de ventas produce 10¢ de ganancia.
Suponga que a cada restaurante le interesa maximizar [(contribución de ventas a la
ganancia) –(costos de propaganda)]. Determine un punto de equilibrio para este
juego.

JUGADOR 1 JUGADOR 2

Gastar 10
6
dólares
Gastar 6
6
dólares
Gastar 10
6
dólares
(2, 2)
(-1, 9)
Gastar 6
6
dólares
(9, -1)
(6, 6)


TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
8

En la matriz anterior se identifica gastar 10 millones de dólares como acción no cooperativa
(ejemplo similar al dilema del prisionero), y gastar 6 millones de dólares como acción
cooperativa, entonces (2, 2), que corresponde a mucha propaganda por parte de ambos
restaurantes, es un punto de equilibrio. Aunque ambos restaurantes se encuentran mejor en
(6, 6) que en (2, 2), el primero es inestable porque cualquier restaurante puede ganar si
cambia su estrategia. Así, para proteger su parte en el mercado, cada restaurante debe
invertir mucho en la propaganda.


2.2. Estados Unidos y la ex-Unión Soviética estaban enzarzados en la carrera
armamentista en la que cada nación tenía dos estrategias posibles: crear un nuevo
proyectil o mantener el status quo. Se supone que la matriz de recompensas es como
se muestra a continuación. Esta matriz de recompensa se basa en la hipótesis de que
si sólo una nación crea un nuevo proyectil, conquistará a la otra. En este caso, la
nación conquistadora gana una recompensa de 20 unidades y la nación conquistada
pierde 100 unidades. También se supone que el costo de crear un proyectil nuevo es
de 10 unidades. Identifique un punto de equilibrio para este juego.

JUGADOR 1 JUGADOR 2

Nuevo misil
Status quo
Nuevo misil
(-10, -10)
(-100, 10)
Status quo
(10, -100)
(0,0 )

Si se identifica “nuevo misil” como acción sin cooperación y “status quo” como acción con
cooperación, vemos que (-10, -10) es un punto de equilibrio. Aunque (0, 0) deja a ambas
naciones mejor que (-10, -10), se ve que en este caso puede ganar de una traición; por lo
tanto, (0, 0) no es estable.


2 2. .3 3. . Angry Max conduce un automóvil contra el de James Bond en una carretera solidaria.
Cada jugador tiene dos estrategias: virar bruscamente o no. Determine los puntos de
equilibrio para este juego

TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
9

JUGADOR 1 JUGADOR 2

Virar bruscamente
No virar
Desviarse
(0, 0)
(5, -5)
No desviarse
(-5, 5)
(-100, -100 )


Tanto para (5, -5) como (-5, 5), ninguno de los jugadores puede ganar por un cambio
unilateral de estrategia. Por lo tanto, (5, -5) y (-5, 5)son puntos de equilibrio.


3 3. . TEORÍA DE J UEGOS CON n PERSONAS


3 3. .1 1. . El juego del fármaco nuevo. Juan Gómez inventó un fármaco nuevo, pero no lo
puede fabricar solo. Puede vender su fórmula a la empresa 2 o a la empresa 3. La
empresa afortunada compartirá un millón de dólares de ganancias con Juan.
Determine la función características para este juego.

Sean Juan Gómez el jugador número 1; la empresa 2, el jugador número 2; y la empresa 3,
el jugador número 3; se tiene que la función característica para este juego es:

{ } ( ) { } ( ) { } ( ) { } ( ) { } ( )
{ } ( ) { } ( ) { } ( ) dólares 3 3

000 . 000 . 1 , 2 , 1 , 1 2 , 1
0 3 , 2 3 2 1
= = =
= = = = =
ν ν ν
ν ν ν ν ν



3 3. .2 2. . El juego de la basura. Cuatro propietarios tienen sendas de basura y deben tirarlas
en el terreno de otro. Si se tiran b sacos de basura en el terreno de la coalición recibe
una recompensa de –b. Determine la función característica para este juego.

TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
10
Lo mejor que pueden hacer los miembros de cualquier coalición es tirar toda su basura en
los terrenos de quienes no están en S. Así, la función característica para el juego de la
basura está representada por ( ) S en jugadores de número el es S :

{ } ( ) ( ) ( )
{ } ( ) ( ) 4 4
4 4
= → − =
< → − − =
S Si 4 3, 2, 1,
S Si S S
ν
ν


La segunda ecuación se deduce porque si todos los jugadores están en S, deben tirar su
basura en los miembros de S.


3 3. .3 3. . Se tiene un juego de tres personas con la siguiente función característica:

{ } ( ) { } ( ) { } ( ) { } ( )
{ } ( ) { } ( ) { } ( ) { } ( ) 3 2, 1, 3 2, 3 1, 2 1, 1 ; 2 , 0 ; , 2 , 0 ; 1 , 0
0 3 2 1
= = = =
= = = =
ν ν ν ν
ν ν ν ν


Sean ( ) 0,05 0,90; 0,05; x = y ( ) 0,10 0,80; 0,10; y = . Demuestre que
( )
x y
1,3
>

Nótese primero que tanto x como y son imputaciones. A continuación obsérvese que con la
imputación y, los jugadores 1 y 3 reciben más de lo que reciben con x. También, y da a los
jugadores en {1, 3} un total de 0,10 + 0,10 = 0,20. Como 0,20 no es mayor que
{ } ( ) 20 , 0 = 3 1, ν , es razonable suponer que los jugadores 1 y 3 se pueden agrupar y recibir
una recompensa total de 0,20. Así los jugadores 1 y 3 nunca permitirán que se puedan dar
las recompensas que da x.


3 3. .4 4. . El juego de la basura (continuación): Determine el núcleo del juego.

Se observa que (
4 3 2 1
χ , χ , χ , χ x = ) será una imputación si y sólo si
3 2 1
χ , χ , χ y
4
χ
satisfacen las siguientes desigualdades:

TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
11
4
3
3
3
3
− = + + +
− ≥
− ≥
− ≥
− ≥
4 3 2 1
4
3
2
1
χ χ χ χ
χ
χ
χ
χ

( )
( )
( )
( )
( ) 5
4
3
2
1

Sabiendo que una imputación es el núcleo de un juego si y sólo si ( ) S χ
S i
i
ν ≥


, se ve que
para que (
4 3 2 1
χ , χ , χ , χ x = ) esté en el núcleo, es necesario que
3 2 1
χ , χ , χ y
4
χ
satisfagan las siguientes desigualdades:

1
1
1
1
− ≥ + +
− ≥ + +
− ≥ + +
− ≥ + +
4 3 2
4 3 1
4 2 1
3 2 1
χ χ χ
χ χ χ
χ χ χ
χ χ χ

( )
( )
( )
( )
( ) 10
9
8
7
6


Ahora se procede a demostrar que este juego tiene un núcleo vacío; considerando la
imputación (
4 3 2 1
χ , χ , χ , χ x = ), para que esté en el núcleo debe satisfacer la imputación
generada sumando las desigualdades anteriores: 4 − ≥ + + +
4 3 2 1
χ χ χ χ , pero
anteriormente se tiene la ecuación (29), que dice 4 − = + + +
4 3 2 1
χ χ χ χ , por lo cual
ninguna imputación puede satisfacer la suma de las desigualdades (6) a (10) y el núcleo del
juego está vacío.


3 3. .5 5. . El juego del fármaco nuevo (continuación): Determine el núcleo del juego.

Para este juego, (
3 2 1
χ , χ , χ x = ) será una imputación si y sólo si:

000 . 000 . 1
0
0
0
= + +



3 2 1
3
2
1
χ χ χ
χ
χ
χ

( )
( )
( )
( ) 14
13
12
11

TEORÍA DE JUEGOS - EJEMPLOS


Tomado de: INVESTIGACIÓN DE OPERACIONES: Aplicaciones y Algoritmos. Wayne L. Winston
Elaborado por: FRANCISCO HERNÁNDEZ SIERRA y AMIRA FELIZZOLA GARCÍA
12
De ( ) S χ
S i
i
ν ≥


se tiene que ( )
3 2 1
χ , χ , χ x = estará en el núcleo si y sólo si
3 2 1
χ , χ , χ
satisfacen las desigualdades anteriores y las siguientes:

000 . 000 . 1
0
000 . 000 . 1
000 . 000 . 1
= + +
≥ +
≥ +
≥ +
3 2 1
3 2
3 1
2 1
χ χ χ
χ χ
χ χ
χ χ

( )
( )
( )
( ) 18
17
16
15


Para determinar el núcleo, se observa que si ( )
3 2 1
χ , χ , χ x = está en el núcleo, entonces
3 2 1
χ , χ , χ deben satisfacer la desigualdad generada al sumar las desigualdades (15) a (14).
Al hacer esta suma, se obtiene ( ) 000 . 000 . 2 2 ≥ + +
3 2 1
χ χ χ , o sea que se cumple la
ecuación 18. Así todas las ecuaciones (15) a (18) deben ser obligatorias. Cuando se
resuelve en forma simultánea las desigualdades (15) a (18) como ecuaciones, se obtiene
dólares χ
1
000 . 000 . 1 = , dólares χ
2
0 = , dólares χ
3
0 = ; valores que cumplen las
desigualdades (11) a (14), por lo tanto, el núcleo de este juego es la imputación
( 0dólares 0, 1.000.000, ). Así el núcleo subraya la importancia del jugador 1.