Professional Documents
Culture Documents
Teoría de Decisiones y Juegos
Teoría de Decisiones y Juegos
1) Teoría de decisiones
La teoría de decisiones permite seleccionar una opción dentro de un conjunto de alternativas, aplicando modelos matemáticos que
consideren varios factores o criterios. Las herramientas utilizadas por la teoría de decisiones cuantifica el valor de cada alternativa en
función de los criterios establecidos para encontrar la que más beneficie al que debe tomar la decisión.
Para tomar las decisiones se necesitan datos o elementos que permitan valorar cada alternativa. El nivel de confianza o exactitud de
dichos datos determina el método que se va a aplicar para tomar la decisión. En este material se van a presentar tres métodos para
tomar decisiones:
*Toma de decisiones bajo certidumbre, Proceso de Jerarquía Analítica (PJA): se implementa cuando los datos se conocen
con certeza. Este método aplica un árbol de decisiones que surge de los factores utilizados para evaluar cada una de las alternativas.
Al ponderar el resultado de cada factor para cada alternativa se encuentra el valor que representa la alternativa y a partir de él tomar la decisión.
*Toma de decisiones en condiciones de riesgo: se implementa cuando los beneficios asociados a cara alternativa no se conocen
con certidumbre. Los beneficios están asociados a distribuciones de probabilidad. Se aplica un árbol de decisiones donde se calcula el valor
monetario esperado para cada alternativa. En este método las probabilidades pueden ser determinadas a priori (cuando la probabilidad de ocurrencia
se establece a partir de datos pasados) o a posteriori (cuando la probabilidad de ocurrencia se calcula por experimentos).
*Toma de decisiones bajo incertidumbre: se implementa cuando los beneficios asociados a cara alternativa no se conocen con certeza
pero tampoco se conoce su distribución de probabilidad. Esto condujo a la creación de algunos métodos que ayudaran a tomar la decisión:
Laplace, Minimax, Savage y Hurwicz,
En las próximas hojas se explican cada uno de los métodos señalados para la toma de decisiones.
2) Teoría de juegos
Esta teoría estudia situaciones de decisión en la que dos oponentes inteligentes con objetivos conflictivos (en caso de juegos suma cero)
compiten intensamente para superar al otro. Ejemplos típicos incluyen el lanzamiento de campañas publicitarias de productos que compiten y
la forma en la que dos empresas distribuyen sus productos en el mercado.
En un conflicto, cada uno de los dos jugadores (oponentes) tiene una cantidad de alternativas o estrategias. Asociada con cada par de estrategias
está la retribución que un jugador recibe del otro. Tal situación se conoce como juego de suma cero entre dos personas porque la ganancia
de un jugador es igual a la pérdida del otro. Esto significa que podemos representar el juego en función de la retribución que recibe un jugador.
Designando los dos jugadores A y B con m y n estrategias, respectivamente, el juego se presenta usualmente en función de la matriz de
retribuciones que recibe el jugador A.
Existen diversos métodos para resolver las situaciones de juego, dependiendo del tipo de estrategia que se puede utilizar:
*Juegos de suma cero con estrategia pura: son juegos en los que la solución se da en la combinación de una estrategia por cada
jugador. Para resolverlos se aplican los criterios minimax y maximin de teoría de decisiones.
*Juegos de suma cero con estrategia combinadas: ocurren cuando la solución para cada jugador no coinciden en la combinación de una
estrategia. En estos casos se puede aplicar el método gráfico si el juego es 2xm o programación lineal, para cualquier tipo de combinación de estrategias.
En las próximas hojas se explican cada uno de los métodos señalados para resolver los juegos.
xactitud de
tos se conocen
de él tomar la decisión.
nativa no se conocen
se calcula el valor
a probabilidad de ocurrencia
en en la combinación de una
de combinación de estrategias.
TOMA DE DECISIONES BAJO CERTIDUMBRE
PROCESO DE JERARQUÍA ANALÍTICA (PJA)
El PJA está diseñado para situaciones en que las ideas, sentimientos y emociones que afectan el proceso de toma de decisiones
se cuantifican y así obtener una escala numérica para priorizar las alternativas. La persona que está tomando la decisión debe valorar
cada alternativa respecto a varios factores, comparando las alternativas entre sí. Con los valores asignados por la persona que toma la
decisión se calculan los pesos relativos que ayudan a seleccionar la mejor opción.
EJEMPLO 1
Datos:
Alternativas de decisión: se debe seleccionar a cuál universidad debe entrar Juan, entre: UCV, UC, UDO.
Factores de decisión: ubicación de la universidad y su reputación.
El problema indica:
*La reputación académica es 5 veces más importante que la ubicación.
*En cuanto a la ubicación, Juan considera que la UC posee una ubicación el doble de beneficiosa si se compara con la UCV pero la
mitad de beneficiosa si se compara con la UDO. Mientras que la UDO tiene una ubicación de 5:1 si se compara con la UCV.
*En cuanto a la reputación académica, la UCV tiene el doble de reputación que la UC y el triple que la UDO. Mientras que la relación
de reputación de la UC respecto a la UDO es de 3:2.
PROCEDIMIENTO
Paso 1: Se debe construir un árbol de decisión, donde las alternativas se muestran en el extremo inferior y cada nivel de decisión representa
un nivel de jerarquía en el árbol. En el ejemplo solo existe un nivel de decisión que incluye dos factores: reputación y ubicación.
Seleccionar
universidad
Paso 2: Construir las matrices de comparación que relacionan cada nivel del árbol. La matriz de comparación refleja la importancia
que tiene un factor o elemento respecto a otro
*La reputación académica es 5 veces más importante que la ubicación.
U R Notas: *La diagonal de la matriz siempre es uno, porque se comparan los fac
A= U 1 1/5 *El 5 indica que R es cinco veces más importante que U. Por lógica, U
R 5 1 1/5 de importante si se compara con R.
*En cuanto a la ubicación, Juan considera que la UC posee una ubicación el doble de beneficiosa si se compara con la UCV pero la
mitad de beneficiosa si se compara con la UDO. Mientras que la UDO tiene una ubicación de 5:1 si se compara con la UCV.
UCV UC UDO
B= UCV 1 1/2 1/5 Nota: Los valores amarillos se obtienen del enunciado mientra
UC 2 1 1/2 se obtiene por su inverso.
UDO 5 2 1
*En cuanto a la reputación académica, la UCV tiene el doble de reputación que la UC y el triple que la UDO. Mientras que la relación
de reputación de la UC respecto a la UDO es de 3:2.
UCV UC UDO
C= UCV 1 2 3
UC 1/2 1 3/2
UDO 1/3 2/3 1
Paso 3: Calcular los pesos relativos que permiten calificar las alternativas. Para ello se necesita normalizar las matrices de comparación que
se construyeron. Para normalizar la matriz divida cada elemento de la matriz por el total de su columna:
U R Peso
NormA= U 0.167 0.167 0.167 Nota: El peso es el promedio de cada fila.
R 0.833 0.833 0.833
Las filas de cada matriz normalizada deben dar los mismos valores, indicando que las matrices son consistentes. Se evidencia que la matriz B, correspond
a la comparación de las ubicaciones de las alternativas no da una matriz normalizada consistentes, por lo cual se debe evaluar su consistencia.
Paso 4: Se debe evaluar el nivel de inconsistencia de las matrices que no sean consistentes. Para ello se calcula la razón de consistencia así:
Para que la matriz posea un nivel de inconsistencia aceptable, RC debe ser menor a 0,1. De ser mayor la matriz tiene un nivel de inconsistencia muy
elevado por lo cual la persona que toma las decisiones debe replantearse las comparaciones que permitieron formar dicha matriz.
Para calcular el n máximo se multiplica la matriz de comparación por su matriz columna de pesos:
n max 3.007
n max 3.007
n 3 *Representa el número de filas
IC 0.0037
RI 0.6600
RC 0.0056 *Valor por debajo de 1 por lo cual la inconsistencia de la matriz es aceptable.
Seleccionar
universidad
Para calcular el valor de cada alternativa se multiplican los pesos de los niveles que conducen a dicha alternativa, así:
Respuesta:
Juan debe seleccionar la UCV como su casa de estudio porque fue la alternativa que mayor valor genera bajo el método del PJA.
nconsistencia muy
UDO
0.182
TOMA DE DECISIONES EN CONDICIONES DE RIESGO
DESCRIPCIÓN
En condiciones de riesgo, los beneficios asociados con cada alternativa de decisión están representados por distribuciones de probabilidad con valores a
decisión puede basarse en el criterio de valor esperado, maximización de la utilidad esperada o la minimización del costo esperado.
Los datos del problema asumen que la retribución (o costo) asociado con cada alternativa de decisión es probabilística.
En terminología de teoría de decisiones cada alternativa tiene estados de la naturaleza, que son diferentes escenarios que puede ocurrir y cada
uno tiene asociado una probabilidad de ocurrencia y una retribución esperada. En función de ello se puede armar una tabla de retribución así:
El problema de decisión también se puede presentar como un árbol de decisión, donde cada alternativa sale de un nodo en forma de cuadro,
dicho nodo indica que una de las opciones se debe seleccionar. Mientras que los estados de la naturaleza salen de un nodo probabilístico
que tiene forma de círculo, en dicho nodo es que se aplica el cálculo del valor esperado.
EJEMPLO 2
Datos
Mercado optimista Mercado pesimista
Empresa A Empresa B Empresa A Empresa B
Ingresos ($/mes) 10000 6500 Ingresos ($/mes) 3000 5500
Costos ($/mes) 5000 5000 Costos ($/mes) 5000 5000
Ganancia ($/mes) 5000 1500 Ganancia ($/mes) -2000 500
Al ser un problema que implica tomar una sola decisión, se puede resolver armado la tabla de retribución:
Mercado Mercado
optimista pesimista
Empresa A 5000 -2000
Empresa B 1500 500
Probabilidad 0.6 0.4
Respuesta:
La empresa que se debe seleccionar es la que tiene un mayor valor esperado de ganancia, por lo cual se debe invertir en la empresa A
que tiene una ganancia esperada de 2200 $/mes.
b) Suponga que de seleccionar la opción B, podría participar en la decisión si se mantiene en su ubicación actual o moverla a otro estado. Si se
mueve a otro estado el ingreso esperado en un mercado optimista sería de 12.000 $ y en un mercado pesimista sería de 8000 $; sin embargo, los .
costos operativos aumentarían a 7000 $ al mes.
Datos
Empresa B reubicada
Mercado Mercado
optimista pesimista
Ingresos ($/mes) 12000 8000
Costos ($/mes) 7000 7000
Ganancia ($/mes) 5000 1000
En este caso hay dos niveles de decisión por lo cual se recomienda elaborar el árbol de decisión:
Nivel secundario: se debe decidir si la empresa B se queda en la ubicación actual o se mueve a una nueva ubicación.
Nivel primario o principal: se debe decidir en cuál empresa invertir.
Primero se debe calcular el valor esperado de la ganancia para cada nodo probabilístico con la misma ecuación descrita previamente:
Respuesta:
Se debe invertir en la empresa B y al tener poder de decisión en la junta directiva se debe decidir reubicar la empresa porque eso generaría
un valor monetario de 3400 $.
orma de cuadro,
obabilístico
a otro estado. Si se
00 $; sin embargo, los .
observa que hay dos nodos de decisión (recuadros),
te a los dos niveles descritos.
eso generaría
TOMA DE DECISIONES EN CONDICIONES DE RIESGO
DESCRIPCIÓN
En el modelo anterior las probabilidades utilizadas en el criterio del valor esperado se suelen estimar a partir de datos históricos.
En algunos casos la precisión de estas estimaciones puede mejorarse por medio de experimentación adicional. Las probabilidades
resultantes se conocen como probabilidades a posteriori (o de Bayes), en contraste con las probabilidades a priori determinadas
a partir de datos duros sin procesar.
Los experimentos que permiten adquirir nueva información lo que permiten es generar nuevos estados de la naturaleza que pueden
afectar la decisión. Dichos experimentos establecen probabilidades de ocurrencia de los estados de la naturaleza originales en función
de los estados de la naturaleza estudiados en el experimento. Por tal motivo se necesita utilizar la Ley de probabilidad condicional:
EJEMPLO 3
Datos
La afirmación del amigo proporciona probabilidades condicionales de las recomendaciones “a favor” y “en contra” dado que los estados de la
naturaleza son mercados optimista y pesimista. Defina:
v1: voto a favor
v2: voto en contra
m1: mercado optimista
m2: mercado pesimista
Entonces la afirmación del amigo: En un mercado optimista, hay 90% de probabilidades de que la recomendación sea “a favor”.
Se reduce a 50% en un mercado pesimista. Se traduce en:
P(v1/m1)=0.9 P(v2/m1)=0.1
P(v1/m2)=0.5 P(v2/m2)=0.5
v1 v2
m1 0.9 0.1
m2 0.5 0.5
Paso 2: Calcule las probabilidades conjuntas así:
Las probabilidades a priori P(m1) y P(m2), son las probabilidades de ocurrencia de cada estado de la naturaleza antes del experimento:
P(m1)=0,6 y P(m2)=0,4
Mercado Mercado
optimista pesimista
P(mi) 0.6 0.4
Aplicando la formula anterior en la tabla de probabilidades condicionales, se encuentra la tabla de probabilidades conjuntas:
v1 v2
m1 0.54 0.06
m2 0.2 0.2 Note como la suma de los valores en la tabla da 1.
P(vi) 0.74 0.26
Donde P(vi) son las probabilidades de que se de un escenario a favor y uno en contra, respectivamente.
v1 v2
m1 0.730 0.231
m2 0.270 0.769
Escenario a favor:
VE de Ganancia en A 3108.11 $/mes
VE de Ganancia en B 1229.73 $/mes
Respuesta 1:
En un escenario a favor de la inversión se debe seleccionar la empresa A, la cual arroja el valor esperado de ganancia mayor: 3108,1 $/mes.
Escenario en contra:
VE de Ganancia en A -384.62 $/mes
VE de Ganancia en B 730.77 $/mes
Respuesta 2:
En un escenario en contra de la inversión se debe seleccionar la empresa B, la cual arroja el valor esperado de ganancia mayor: 730,77 $/mes.
Con los valores de ganancia esperada para cada escenario y su probabilidad de ocurrencia, se puede calcular la retribución esperada de la inversión:
Respuesta 3:
Si se recomienda invertir el dinero porque se espera una ganancia de 2490 $/mes como retribución.
za que pueden
nales en función
condicional:
La toma de decisiones bajo incertidumbre, así como bajo riesgo, implica acciones alternativas cuyas retribuciones dependen de
los estados de la naturaleza (aleatorios).
Específicamente, la matriz de retribución de un problema de decisión con m acciones alternativas y n estados de la
naturaleza puede representarse como
En la toma de decisiones bajo incertidumbre, la distribución de probabilidad asociada con los estados de la naturaleza, o se desconoce o no puede
ser determinada. Esta falta de información condujo al desarrollo de criterios de decisión especiales:
1) Criterio de Laplace
El criterio de Laplace se basa en el principio de razón insuficiente. Ya que no se conocen las distribuciones de probabilidad, no hay razón alguna
para creer que las probabilidades asociadas con los estados de la naturaleza sean diferentes. Por tanto, las alternativas se evalúan utilizando la
suposición simplificadora de que todos los estados son igualmente probables de que ocurran.
En tal sentido, se calcula el promedio por cada fila de la matriz de retribución y se selecciona la opción óptima:
*Si se desea maximizar, se selecciona la fila con el mayor valor promedio.
*Si se desea minimizar, se selecciona la fila con el menor valor promedio.
3) Criterio de Savage
El criterio de lamento de Savage “modera” el grado de conservadurismo del criterio minimax (maximin) al reemplazar la matriz de retribución
(ganancia o pérdida) con una matriz de pérdida (o lamento), mediante la siguiente transformación: si es una matriz de maximización, el valor de cada
columna se resta con el mayor valor de esa columna. Si es una matriz de minimización, a cada valor de una columna se resta el menor valor de esa
columna. Luego se aplican los criterios:
*Si se desea maximizar, primero se busca el menor valor de cada fila. Luego se selecciona la fila con el mayor valor.
*Si se desea minimizar, primero se busca el mayor valor de cada fila. Luego se selecciona la fila con el menor valor.
4) Criterio de Hurwicz
El último criterio está diseñado para representar diferentes actitudes de decisión que van desde la más optimista hasta la más pesimista.
En cada fila se realiza el siguiente calculo:
*Si es de maximización, αmax+(1-α)min. Se selecciona la fila con el mayor valor.
*Si es de minimización, αmin+(1-α)max. Se selecciona la fila con el menor valor.
El parámetro α es el índice de optimismo. En un problema de maximización, si α=0, entonces el criterio se reduce al criterio minimax conservador,
que busca la mejor de las peores condiciones. Si α=1, entonces el criterio es optimista porque busca la mejor de las mejores condiciones.
EJEMPLO 4
Datos
Al ser una matriz de costo se desea determinar la capacidad de campamento que logre minimizar el costo de la desviación.
A continuación se aplica cada uno de los criterios de toma de decisiones bajo incertidumbre:
1) Criterio de Laplace
3) Criterio de Savage
Matriz de Lamento: al ser un problema de minimización, a cada valor de una columna se resta el menor valor de esa columna.
4) Criterio de Hurwicz
Bajo el criterio de Hurwicz, con α=0,5, la capacidad óptima es de 200 o 250 estudiantes.
Conclusión:
La capacidad del campamento debe ser de 250 estudiantes porque fue la que obtuvo mayor coincidencia entre los 4 criterios.
ay razón alguna
an utilizando la
de retribución
ación, el valor de cada
menor valor de esa
imax conservador,
JUEGOS DE SUMA CERO CON ESTRATEGIA PURA
Debido a que los juegos de suma cero o constante implican un conflicto de intereses, la base para la selección de estrategias óptimas garantiza
que ninguno de los jugadores intenta buscar una estrategia diferente porque el resultado será una retribución peor. Estas soluciones pueden ser
en la forma de una sola estrategia (estrategia pura) o varias estrategias combinadas al azar.
Los juegos se representan en matrices de retribución, como se muestra a continuación. La matriz muestra la retribución del jugador cuyas
estrategias se muestran en las filas. Al ser un juego de suma cero, la retribución para el otro jugador tienen los mismos valores pero con signo contrario.
Supongamos que se tienen dos jugadores (Ay B), el jugador A tienen tres estrategias de acción (A1, A2, A3) y el jugador B tiene solo dos estrategias
de acción (B1, B2). La siguiente matriz muestra la retribución que obtiene cada estrategia de A cuando se combina con una estrategia de B.
B1 B2 *Suponiendo que los valores de retribución están en $, la matriz indica que si el jugador A
A1 5 -2 aplica la estrategia A1 y el B aplica la estrategia B1, el resultado será una ganancia de 5$
A2 3 2 para A. Mientras que si A aplica la estrategia A1 y B aplica la B2 el resultado será un perdid
A3 -1 4 de 2 $ para A.
Con los datos de la matriz anterior se puede armar la matriz de retribución para B:
A1 A2 A3 *Note como los signos cambian, es decir, lo que es ganancia para un jugador
B1 -5 -3 1 es una perdida para el oponente. Este es un principio básico de juegos suma
B2 2 -2 -4
No es necesario obtener la matriz de retribución de B porque el método que se explicará con el ejemplo permite calcular la mejor estrategia para cada
jugador utilizando la matriz de retribuciones de solo uno de ellos.
EJEMPLO 5
Datos
Se presentan los % de mercado capturado o perdido por la compañía A, al aplicar sus estrategias publicitarias en competencia con las estrategias
de la compañía B.
B1 B2 B3 B4
A1 8 -2 9 -3
A2 6 5 6 8
A3 -2 4 -9 5
El método de solución de juegos suma cera se fundamenta en encontrar lo mejor de lo peor; es decir, cuál es la estrategia que brinda el mejor resultado
pero partiendo de los peores resultados de cada estrategia. Para ello se aplica el criterio maximin para el jugador A:
B1 B2 B3 B4 Min de fila
A1 8 -2 9 -3 -3
A2 6 5 6 8 5 Maximin
A3 -2 4 -9 5 -9
Note como lo peor que puede pasar si A aplica la A1 es perder 3% del mercado, si aplica la A2 lo peor que sucede es que gane solo 5% del mercado
y si aplica la A3 puede perder el 9% de mercado. El maximin es 5, siendo la respuesta para el jugador A. Es decir, debe aplicar la estrategia A2.
Para encontrar la estrategia adecuada para el jugador B, igualmente se busca lo mejor de lo peor. Como matriz esta dada para las retribuciones de A,
lo peor que le puede suceder a B es que A logre resultados máximos con sus estrategias, por lo cual se debe aplicar el criterio minimax para el jugador B:
B1 B2 B3 B4 Min de fila
A1 8 -2 9 -3 -3
A2 6 5 6 8 5
A3 -2 4 -9 5 -9
Max de
8 5 9 8
columna
Minimax
La solución indica que B debe aplicar la estrategia B2, perdiendo solo un 5% de mercado, esta es su mejor solución.
Para entender mejor la dinámica del juego: recuerde que un jugador no está en conocimiento de la estrategia que va aplicar su contrincante
como en el juego clásico de piedra, papel o tijera. Note como si B cambia de estrategia buscando un mejor resultado, pero A mantiene su estrategia
de A2 (porque es la mejor para A pero B no lo conoce), entonces B quedará en una peor posición porque en lugar de perder 5% de mercado podría
perder 6% u 8%.
Respuesta:
La empresa A debe realizar el anuncio de su medicamento para la gripe mediante la televisión (A2) y la compañía B también lo debe hacer mediante
la televisión (B2), para encontrar la mejor retribución: para A es ganar el 5% de mercado, el cual lo perderá B.
Note que la mejor estrategia para cada jugador coinciden en el mismo valor de juego: 5%. Cuando esto sucede se dice que el juego se resuelve
con una estrategia pura y al valor de juego se le llama punto silla.
aplicar su contrincante
pero A mantiene su estrategia
perder 5% de mercado podría
mbién lo debe hacer mediante
Los juegos de suma cero con estrategia mixta ocurren cuando la mejor estrategia posible para cada jugador no ocurre en un cruce de dos estrategias.
En este caso se debe aplicar una combinación de estrategias que genere un valor de juego intermedio entre los dos valores encontrados para cada
jugador. La combinación de estrategias se da en función de una probabilidad de ocurrencia de cada alternativa,
Dependiendo del tamaño de la matriz, se aplica el método de solución que facilite los cálculos: si el juego es 2xm (un jugador tiene dos estrategias
y el otro tiene m estrategias) entonces se puede encontrar una solución gráfica al problema.
EJEMPLO 6
Datos
B1 B2 B3
A1 4 3 1
A2 0 1 2
Para resolver el problema primer se debe intentar encontrar una solución con estrategia pura, como se explicó anteriormente:
B1 B2 B3 Min de fila
A1 4 3 1 1 Maximin
A2 0 1 2 0
Max de
4 3 2
columna
Mini max
Como se puede observar, las mejores estrategias de juego para cada contrincante no coinciden: para A el mejor escenario ocurre con A1-B3, dando
un valor de juego de 1 y para B el mejor escenario ocurre con A2-B3, dando un valor de juego de 2. Por lo cual la estrategia que se debe aplicar no
es pura, debe ser una combinación de las estrategias planteadas (estrategia mixta), que de un valor de juego entre 1 y 2, los valores obtenidos
para cada jugador.
PROCEDIMIENTO
*Paso 1: asignar a cada fila y cada columna una variable que indique la probabilidad de ocurrencia de cada estrategia.
B1 B2 B3 Proporción
A1 4 3 1 x1 Considere que: x1+x2=1
A2 0 1 2 x2 y1+y2+y3=1
Proporción y1 y2 y3
*Paso 2: Para el jugador que solo posee 2 estrategias, calcule el valor de retribución esperado si el contrincante aplica cada una de sus alternativas:
B1 B2 B3 Proporción
A1 4 3 1 x1
A2 0 1 2 x2
VER-B1 4X1+0X2=4X1
VER-B2 3X1+X2
VER-B3 X1+2X2
VER-B1 4X1
VER-B2 3X1+(1-x1)=2x1+1
VER-B3 X1+2X2=x1+2(1-x1)=-x1+2
*Paso 3: graficar las ecuaciones de retribución encontradas, recordando que x1 debe estar entre 0 y 1, al ser una probabilidad
VER1=4x1
VER2=2x1+1
VER3=-x1+2
Para encontrar los puntos de corte con los ejes se sugiere utilizar:
x1=0
x1=1
Como se están graficando las retribuciones esperadas para el jugador A, el método aplicado es el maximin, es decir, hay que buscar el valor
máximo dentro de la región de mínimos (lo que está por debajo de todas las rectas).
El área marcada en rojo señala los valores mínimos posibles y el punto amarillo
refleja el máximo dentro de los mínimos.
Dicho punto ocurre donde se cortan las dos rectas:
VER1=4x1
VER3=-x1+2
B1 B2 B3 Proporción
A1 4 3 1 x1=2/5
A2 0 1 2 x2=3/5
Proporción y1 y2 y3 V=8/5
Aplicando a B el calculo realizado en el paso 2, se encuentra la retribución del jugador B si el A aplica alguna de sus dos estrategias:
En la gráfica de la solución encontrada se observa que la línea verde (correspondiente a B2) no participa en la solución, por lo cual y2=0.
Como se conoce que el valor esperado del juego es V=8/5:
8/5=4y1+y3
8/5=2y3
B1 B2 B3 Proporción
A1 4 3 1 x1=2/5
A2 0 1 2 x2=3/5
Proporción y1=1/5 y2=0 y3=4/5 v=8/5
Respuesta:
El jugador A debe combinar sus estrategias: 2/5 (40%) la A1 y 3/5 (60%) la A2 para obtener una retribución de 8/5.
El jugador B debe combinar sus estrategias: 1/5 (20%) la B1 y 4/5 (80%) la B3 para obtener una retribución de -8/5.
El valor del juego favorece al jugador A.
Note como el valor del juego 8/5=1,6; se encuentra entre 1 y 2, los dos valores encontrados para cada jugador inicialmente.
EJEMPLO 7
Datos
B1 B2
A1 5 8
A2 6 5
A3 5 7
El problema presentado es de mx2. Al igual que en el ejemplo anterior primero se debe comprobar si existe una solución de estrategia pura:
B1 B2 Min de fila
A1 5 8 5
A2 6 5 5
A3 5 7 5 Maximin
Max de
6 8
columna
minimax
La solución encontrada no es una estrategia pura. Para el jugador A el valor óptimo es 5 y para el jugador B es 8, por lo cual el valor del juego
producto de una estrategia mixta estará entre 8 y 5.
Para resolver este problema se debe aplicar el procedimiento señalado en el ejemplo anterior:
*Paso 1: asignar a cada fila y cada columna una variable que indique la probabilidad de ocurrencia de cada estrategia.
B1 B2 Proporción
A1 5 8 x1 Considere que: x1+x2+x3=1
A2 6 5 x2 y1+y2=1
A3 5 7 x3
Proporción y1 y2
*Paso 2: Para el jugador que solo posee 2 estrategias, calcule el valor de retribución esperado si el contrincante aplica cada una de sus alternativas:
VER-A1 5y1+8y2
VER-A2 6y1+5y2
VER-A3 5y1+7y2
VER-B1 5y1+8(1-y1)=-3y1+8
VER-B2 6y1+5(1-y1)=y1+5
VER-B3 5y1+7(1-y1)=-2y1+7
*Paso 3: graficar las ecuaciones de retribución encontradas, recordando que y1 debe estar entre 0 y 1, al ser una probabilidad
VER1=-3y1+8
VER2=y1+5
VER3=-2y1+7
Para encontrar los puntos de corte con los ejes se sugiere utilizar:
y1=0
y1=1
Como se están graficando las retribuciones esperadas para el jugador B, y la tabla está en función de las retribuciones de A, el método aplicado
es el minimax, es decir, hay que buscar el valor mínimo dentro de la región de máximos (lo que está por encima de todas las rectas).
El área marcada en rojo señala los valores máximos posibles y el punto amarillo
refleja el mínimo dentro de los máximos.
Dicho punto ocurre donde se cortan las dos rectas:
VER1=-3y1+8
VER2=y1+5
B1 B2 Proporción
A1 5 8 x1
A2 6 5 x2
A3 5 7 x3
Proporción y1=3/4 y2=1/4 v=23/4
Aplicando a A el calculo realizado en el paso 2, se encuentra la retribución del jugador A si B aplica alguna de sus dos estrategias:
En la gráfica de la solución encontrada se observa que la línea morada (correspondiente a A3) no participa en la solución, por lo cual x3=0.
Como se conoce que el valor esperado del juego es v=23/4:
23/4=5x1+6x2
23/4=8x1+5x2
B1 B2 Proporción
A1 5 8 x1=1/4
A2 6 5 x2=3/4
A3 5 7 x3=0
Proporción y1=3/4 y2=1/4 v=23/4
Respuesta:
El jugador A debe combinar sus estrategias: 1/4 (25%) la A1 y 3/4 (75%) la A2 para obtener una retribución de 23/4.
El jugador B debe combinar sus estrategias: 3/4 (75%) la B1 y 1/4 (20%) la B2 para obtener una retribución de -23/4.
El valor del juego favorece al jugador A.
Note como el valor del juego 23/4=5,75; se encuentra entre 5 y 8, los dos valores encontrados para cada jugador inicialmente.
o cual y2=0.
estrategia pura:
el valor del juego
r lo cual x3=0.
JUEGOS DE SUMA CERO CON ESTRATEGIA MIXTA
SOLUCIÓN CON PROGRAMACIÓN LINEAL
La teoría de juegos está estrechamente relacionada con la PL en el sentido de que cualquier juego de suma cero entre dos personas puede
expresarse como un programa lineal, y viceversa. De hecho, G. Dantzig (1963) expresa que cuando J. von Neumann, padre de la teoría de juegos, la
introdujo por primera vez al método simplex en 1947, de inmediato reconoció esta relación y además precisó y recalcó el concepto de dualidad en
la programación lineal.
A continuación se explica por medio de un ejemplo cómo resolver un juego por programación lineal.
EJEMPLO 8
Datos
B1 B2 B3
A1 3 -1 -3
A2 -2 4 -1
A3 -5 -6 2
B1 B2 B3 Min de fila
A1 3 -1 -3 -3
A2 -2 4 -1 -2 Maximin
A3 -5 -6 2 -6
Max de
3 4 2
columna
Minimax
El juego no tiene una solución de estrategia pura pero se conoce que el valor del juego debe estar entre -2 y 2.
Variables:
x1: proporción en la que se aplica la alternativa A1
x2: proporción en la que se aplica la alternativa A2
x3: proporción en la que se aplica la alternativa A3
Objetivo:
Maximizar el valor del juego
Max v
Restricciones:
v-3x1+2x2+5x3≤0
v+x1-4x2+6x3≤0
v+3x1+x2-2x3≤0
x1+x2+x3=1
x1,x2,x3≥0
Max v= -0.908
B1 B2 B3
x1 0.394 A1 3 -1 -3
x2 0.312 A2 -2 4 -1
x3 0.294 A3 -5 -6 2
Restricción: 1.000 Valor esperado -0.90825688 -0.90825688 -0.90825688
Restricción: 0.000 0.000 0.000
Solución:
v=-0,908
x1=0,394
x2=0,312
x3=0,294
*Paso 3: Solicitar a SOLVER el análisis de sensibilidad para encontrar los valores duales; y1, y2, y3; que corresponden a las proporciones
en las que B debe aplicar sus estrategias.
v=-0,908
y1=0,321
y2=0,083
y3=0,596
Respuesta:
El jugador A debe combinar sus estrategias: 39,4% la A1, 31,2% A2 y 29,4% la A3 para obtener una retribución de -0,91.
El jugador B debe combinar sus estrategias: 32,1% la B1, 8,3% la B2 y 59,6% la B3 para obtener una retribución de 0,91.
El valor del juego favorece al jugador B.
Note como el valor del juego -0,91; se encuentra entre -2 y 2, los dos valores encontrados para cada jugador inicialmente.
Celdas cambiantes
Valor Gradiente Coeficiente Aumento Aumento
Celda Nombre Igual reducido objetivo permisible permisible
$B$67 x1 Max v= 0.394 0.000 0 2.6923076923 1.5
$B$68 x2 Max v= 0.312 0.000 0 0.6923076923 3.5
$B$69 x3 Max v= 0.294 0.000 0 6.5 1.2857142857
$C$64 Max v= x1,x2,x3≥0 -0.908 0.000 1 1E+030 1
Restricciones
Valor Sombra Restricción Aumento Aumento
Celda Nombre Igual precio lado derecho permisible permisible
$B$70 Restricción: Max v= 1 -0.9082568807 1 1E+030 1E+030
$E$71 Restricción: B1 0 0.3211009174 0 1E+030 1E+030
$F$71 Restricción: B2 0 0.0825688073 0 1E+030 1E+030
$G$71 Restricción: B3 0 0.5963302752 0 1E+030 1E+030
Estos son los valores duales yi