Teoría de Decisiones y Juegos

TEORÍA DE DECISIONES Y JUEGOS
1) Teoría de decisiones
La teoría de decisiones permite seleccionar una opción dentro de un conjunto de alternativas, aplicando modelos matemáticos que
consideren varios factores o criterios. Las herramientas utilizadas por la teoría de decisiones cuantifica el valor de cada alternativa en
función de los criterios establecidos para encontrar la que más beneficie al que debe tomar la decisión.
Para tomar las decisiones se necesitan datos o elementos que permitan valorar cada alternativa. El nivel de confianza o exactitud de
dichos datos determina el método que se va a aplicar para tomar la decisión. En este material se van a presentar tres métodos para
tomar decisiones:
*Toma de decisiones bajo certidumbre, Proceso de Jerarquía Analítica (PJA): se implementa cuando los datos se conocen
con certeza. Este método aplica un árbol de decisiones que surge de los factores utilizados para evaluar cada una de las alternativas.
Al ponderar el resultado de cada factor para cada alternativa se encuentra el valor que representa la alternativa y a partir de él tomar la decisión.
*Toma de decisiones en condiciones de riesgo: se implementa cuando los beneficios asociados a cara alternativa no se conocen
con certidumbre. Los beneficios están asociados a distribuciones de probabilidad. Se aplica un árbol de decisiones donde se calcula el valor
monetario esperado para cada alternativa. En este método las probabilidades pueden ser determinadas a priori (cuando la probabilidad de ocurrencia
se establece a partir de datos pasados) o a posteriori (cuando la probabilidad de ocurrencia se calcula por experimentos).
*Toma de decisiones bajo incertidumbre: se implementa cuando los beneficios asociados a cara alternativa no se conocen con certeza
pero tampoco se conoce su distribución de probabilidad. Esto condujo a la creación de algunos métodos que ayudaran a tomar la decisión:
Laplace, Minimax, Savage y Hurwicz,
En las próximas hojas se explican cada uno de los métodos señalados para la toma de decisiones.
2) Teoría de juegos
Esta teoría estudia situaciones de decisión en la que dos oponentes inteligentes con objetivos conflictivos (en caso de juegos suma cero)
compiten intensamente para superar al otro. Ejemplos típicos incluyen el lanzamiento de campañas publicitarias de productos que compiten y
la forma en la que dos empresas distribuyen sus productos en el mercado.
En un conflicto, cada uno de los dos jugadores (oponentes) tiene una cantidad de alternativas o estrategias. Asociada con cada par de estrategias
está la retribución que un jugador recibe del otro. Tal situación se conoce como juego de suma cero entre dos personas porque la ganancia
de un jugador es igual a la pérdida del otro. Esto significa que podemos representar el juego en función de la retribución que recibe un jugador.
Designando los dos jugadores A y B con m y n estrategias, respectivamente, el juego se presenta usualmente en función de la matriz de
retribuciones que recibe el jugador A.
Existen diversos métodos para resolver las situaciones de juego, dependiendo del tipo de estrategia que se puede utilizar:
*Juegos de suma cero con estrategia pura: son juegos en los que la solución se da en la combinación de una estrategia por cada
jugador. Para resolverlos se aplican los criterios minimax y maximin de teoría de decisiones.
*Juegos de suma cero con estrategia combinadas: ocurren cuando la solución para cada jugador no coinciden en la combinación de una
estrategia. En estos casos se puede aplicar el método gráfico si el juego es 2xm o programación lineal, para cualquier tipo de combinación de estrategias.
En las próximas hojas se explican cada uno de los métodos señalados para resolver los juegos.
Elaborado por: Ing. Angel González

ternativa en
xactitud de
tos se conocen
de él tomar la decisión.
nativa no se conocen
se calcula el valor
a probabilidad de ocurrencia
no se conocen con certeza

tomar la decisión:
gos suma cero)

uctos que compiten y
n cada par de estrategias

porque la ganancia
que recibe un jugador.
de la matriz de
a estrategia por cada
en en la combinación de una
de combinación de estrategias.
TOMA DE DECISIONES BAJO CERTIDUMBRE
PROCESO DE JERARQUÍA ANALÍTICA (PJA)
El PJA está diseñado para situaciones en que las ideas, sentimientos y emociones que afectan el proceso de toma de decisiones
se cuantifican y así obtener una escala numérica para priorizar las alternativas. La persona que está tomando la decisión debe valorar
cada alternativa respecto a varios factores, comparando las alternativas entre sí. Con los valores asignados por la persona que toma la
decisión se calculan los pesos relativos que ayudan a seleccionar la mejor opción.
EJEMPLO 1
Datos:
Alternativas de decisión: se debe seleccionar a cuál universidad debe entrar Juan, entre: UCV, UC, UDO.
Factores de decisión: ubicación de la universidad y su reputación.
El problema indica:
*La reputación académica es 5 veces más importante que la ubicación.
*En cuanto a la ubicación, Juan considera que la UC posee una ubicación el doble de beneficiosa si se compara con la UCV pero la
mitad de beneficiosa si se compara con la UDO. Mientras que la UDO tiene una ubicación de 5:1 si se compara con la UCV.
*En cuanto a la reputación académica, la UCV tiene el doble de reputación que la UC y el triple que la UDO. Mientras que la relación
de reputación de la UC respecto a la UDO es de 3:2.
PROCEDIMIENTO
Paso 1: Se debe construir un árbol de decisión, donde las alternativas se muestran en el extremo inferior y cada nivel de decisión representa
un nivel de jerarquía en el árbol. En el ejemplo solo existe un nivel de decisión que incluye dos factores: reputación y ubicación.
Seleccionar
universidad
Ubicación (U) Reputación ( R)

UCV UC UDO UCV UC
Paso 2: Construir las matrices de comparación que relacionan cada nivel del árbol. La matriz de comparación refleja la importancia
que tiene un factor o elemento respecto a otro
*La reputación académica es 5 veces más importante que la ubicación.
U R Notas: *La diagonal de la matriz siempre es uno, porque se comparan los fac
A= U 1 1/5 *El 5 indica que R es cinco veces más importante que U. Por lógica, U
R 5 1 1/5 de importante si se compara con R.
*En cuanto a la ubicación, Juan considera que la UC posee una ubicación el doble de beneficiosa si se compara con la UCV pero la
mitad de beneficiosa si se compara con la UDO. Mientras que la UDO tiene una ubicación de 5:1 si se compara con la UCV.
UCV UC UDO
B= UCV 1 1/2 1/5 Nota: Los valores amarillos se obtienen del enunciado mientra
UC 2 1 1/2 se obtiene por su inverso.
UDO 5 2 1
*En cuanto a la reputación académica, la UCV tiene el doble de reputación que la UC y el triple que la UDO. Mientras que la relación
de reputación de la UC respecto a la UDO es de 3:2.
UCV UC UDO
C= UCV 1 2 3
UC 1/2 1 3/2
UDO 1/3 2/3 1
Paso 3: Calcular los pesos relativos que permiten calificar las alternativas. Para ello se necesita normalizar las matrices de comparación que
se construyeron. Para normalizar la matriz divida cada elemento de la matriz por el total de su columna:
U R Peso
NormA= U 0.167 0.167 0.167 Nota: El peso es el promedio de cada fila.
R 0.833 0.833 0.833
UCV UC UDO Peso

NormB= UCV 0.125 0.143 0.118 0.129
UC 0.250 0.286 0.294 0.277
UDO 0.625 0.571 0.588 0.595
UCV UC UDO Peso

NormC= UCV 0.545 0.545 0.545 0.545
UC 0.273 0.273 0.273 0.273
UDO 0.182 0.182 0.182 0.182
Las filas de cada matriz normalizada deben dar los mismos valores, indicando que las matrices son consistentes. Se evidencia que la matriz B, correspond
a la comparación de las ubicaciones de las alternativas no da una matriz normalizada consistentes, por lo cual se debe evaluar su consistencia.
Paso 4: Se debe evaluar el nivel de inconsistencia de las matrices que no sean consistentes. Para ello se calcula la razón de consistencia así:
Donde: Índice de consistencia (IC): El cálculo de n máx se mu
Consistencia aleatoria (RI):
Para que la matriz posea un nivel de inconsistencia aceptable, RC debe ser menor a 0,1. De ser mayor la matriz tiene un nivel de inconsistencia muy
elevado por lo cual la persona que toma las decisiones debe replantearse las comparaciones que permitieron formar dicha matriz.
Para calcular el n máximo se multiplica la matriz de comparación por su matriz columna de pesos:
1 1/2 1/5 0.129 0.386

2 1 1/2 x 0.277 = 0.831
5 2 1 0.595 1.791
n max 3.007
n max 3.007
n 3 *Representa el número de filas
IC 0.0037
RI 0.6600
RC 0.0056 *Valor por debajo de 1 por lo cual la inconsistencia de la matriz es aceptable.
Paso 5: Asignar los pesos en el árbol para tomar la decisión.
Seleccionar
universidad
Ubicación (U) Reputación ( R)

0.167 0.833
UCV UC UDO UCV UC

0.129 0.277 0.595 0.545 0.273
Para calcular el valor de cada alternativa se multiplican los pesos de los niveles que conducen a dicha alternativa, así:
Valor de UCV 0.475962

Valor de UC 0.273375
Valor de UDO 0.250663
Respuesta:
Juan debe seleccionar la UCV como su casa de estudio porque fue la alternativa que mayor valor genera bajo el método del PJA.

on la UCV pero la
ntras que la relación

UDO
que se comparan los factores entre sí.

nte que U. Por lógica, U es solo
n del enunciado mientras que el resto

la matriz B, correspondiente
consistencia.
cálculo de n máx se muestra con el ejemplo.
nconsistencia muy
UDO
0.182
TOMA DE DECISIONES EN CONDICIONES DE RIESGO
ÁRBOL DE DECISIONES BASADO EN EL CRITERIO DE VALOR ESPERADO
DESCRIPCIÓN
En condiciones de riesgo, los beneficios asociados con cada alternativa de decisión están representados por distribuciones de probabilidad con valores a
decisión puede basarse en el criterio de valor esperado, maximización de la utilidad esperada o la minimización del costo esperado.
Los datos del problema asumen que la retribución (o costo) asociado con cada alternativa de decisión es probabilística.
En terminología de teoría de decisiones cada alternativa tiene estados de la naturaleza, que son diferentes escenarios que puede ocurrir y cada
uno tiene asociado una probabilidad de ocurrencia y una retribución esperada. En función de ello se puede armar una tabla de retribución así:
Estado de la Estado de la Estado de la

naturaleza 1 naturaleza 2 naturaleza 3
Alternativa A Retribución A1 Retribución A2 Retribución A3 El valor esperado para la opción i es:

Alternativa B Retribución B1 Retribución B2 Retribución B3 VEi=Ri1(P1)+Ri2(P2)+Ri3(P3)
Alternativa C Retribución C1 Retribución C2 Retribución C3
Probabilidad P1 P2 P3
El problema de decisión también se puede presentar como un árbol de decisión, donde cada alternativa sale de un nodo en forma de cuadro,
dicho nodo indica que una de las opciones se debe seleccionar. Mientras que los estados de la naturaleza salen de un nodo probabilístico
que tiene forma de círculo, en dicho nodo es que se aplica el cálculo del valor esperado.
EJEMPLO 2
Datos
Mercado optimista Mercado pesimista
Empresa A Empresa B Empresa A Empresa B
Ingresos ($/mes) 10000 6500 Ingresos ($/mes) 3000 5500
Costos ($/mes) 5000 5000 Costos ($/mes) 5000 5000
Ganancia ($/mes) 5000 1500 Ganancia ($/mes) -2000 500
a) Determine en cuál de las dos empresas invertiría dinero.

Este es un problema que tiene dos alternativas de decisión y cada una tiene dos estados de la naturaleza.
Alternativas de decisión: Empresa A y empresa B.
Estados de la naturaleza: mercado optimista (P=0,6) y mercado pesimista (P=0,4).
Al ser un problema que implica tomar una sola decisión, se puede resolver armado la tabla de retribución:
Mercado Mercado
optimista pesimista
Empresa A 5000 -2000
Empresa B 1500 500
Probabilidad 0.6 0.4
Se calcula el Valor Esperado de la Ganancia para cada alternativa:
VE de Ganancia en A 2200 $/mes

VE de Ganancia en B 1100 $/mes
Respuesta:
La empresa que se debe seleccionar es la que tiene un mayor valor esperado de ganancia, por lo cual se debe invertir en la empresa A
que tiene una ganancia esperada de 2200 $/mes.
b) Suponga que de seleccionar la opción B, podría participar en la decisión si se mantiene en su ubicación actual o moverla a otro estado. Si se
mueve a otro estado el ingreso esperado en un mercado optimista sería de 12.000 $ y en un mercado pesimista sería de 8000 $; sin embargo, los .
costos operativos aumentarían a 7000 $ al mes.
Datos
Empresa B reubicada
Mercado Mercado
optimista pesimista
Ingresos ($/mes) 12000 8000
Costos ($/mes) 7000 7000
Ganancia ($/mes) 5000 1000
En este caso hay dos niveles de decisión por lo cual se recomienda elaborar el árbol de decisión:
Nivel secundario: se debe decidir si la empresa B se queda en la ubicación actual o se mueve a una nueva ubicación.
Nivel primario o principal: se debe decidir en cuál empresa invertir.
En el árbol se observa que hay dos nodos d

correspondiente a los dos niveles descrito
Los demás nodos son probabilísticos (círcu

por los dos estados de la naturaleza que p
Primero se debe calcular el valor esperado de la ganancia para cada nodo probabilístico con la misma ecuación descrita previamente:
Como se observa en la figura, a cada nodo

Luego se debe tomar la decisión del nivel s
La empresa reubicada presenta un VME m
las instalaciones actuales a la nueva ubicac
De esta manera, el VME de la planta reubi

a la empresa B.
Finalmente, se toma la decisión principal:

A y B, se debe invertir en la empresa B por
Respuesta:
Se debe invertir en la empresa B y al tener poder de decisión en la junta directiva se debe decidir reubicar la empresa porque eso generaría
un valor monetario de 3400 $.

probabilidad con valores a priori, y la
ede ocurrir y cada

e retribución así:
orma de cuadro,
obabilístico
a otro estado. Si se
00 $; sin embargo, los .
observa que hay dos nodos de decisión (recuadros),
te a los dos niveles descritos.
os son probabilísticos (círculos) que son influenciados

ados de la naturaleza que presenta cada alternativa.
va en la figura, a cada nodo probabilístico se le determina su VME.

tomar la decisión del nivel secundario:
ubicada presenta un VME mayor por lo cual se deben trasladar
es actuales a la nueva ubicación.
a, el VME de la planta reubicada es el valor que representa
toma la decisión principal: si se comparan los VME de las empresas

nvertir en la empresa B porque al reubicarla generaría un VME mayor.
eso generaría
TOMA DE DECISIONES EN CONDICIONES DE RIESGO
ÁRBOL DE DECISIONES BASADO EN EL CRITERIO DE VALOR ESPERADO CON LEY DE BAYES
DESCRIPCIÓN
En el modelo anterior las probabilidades utilizadas en el criterio del valor esperado se suelen estimar a partir de datos históricos.
En algunos casos la precisión de estas estimaciones puede mejorarse por medio de experimentación adicional. Las probabilidades
resultantes se conocen como probabilidades a posteriori (o de Bayes), en contraste con las probabilidades a priori determinadas
a partir de datos duros sin procesar.
Los experimentos que permiten adquirir nueva información lo que permiten es generar nuevos estados de la naturaleza que pueden
afectar la decisión. Dichos experimentos establecen probabilidades de ocurrencia de los estados de la naturaleza originales en función
de los estados de la naturaleza estudiados en el experimento. Por tal motivo se necesita utilizar la Ley de probabilidad condicional:
EJEMPLO 3
Datos
La afirmación del amigo proporciona probabilidades condicionales de las recomendaciones “a favor” y “en contra” dado que los estados de la
naturaleza son mercados optimista y pesimista. Defina:
v1: voto a favor
v2: voto en contra
m1: mercado optimista
m2: mercado pesimista
Entonces la afirmación del amigo: En un mercado optimista, hay 90% de probabilidades de que la recomendación sea “a favor”.
Se reduce a 50% en un mercado pesimista. Se traduce en:
P(v1/m1)=0.9 P(v2/m1)=0.1
P(v1/m2)=0.5 P(v2/m2)=0.5
Con esta representación el problema de decisión se resume como:

1. Si la recomendación del amigo es “a favor”, ¿invertiría en la acción A o en la acción B?
2. Si la recomendación del amigo es “en contra”, ¿invertiría en la acción A o en la acción B?
3. ¿Recomienda realizar la inversión?
En función de lo descrito se forma el árbol de decisión:
El nodo inicial INVERTIR muestra los

investigación: A favor y en contra.
Los nodos 2 de decisión representan

presentadas anteriormente.
Finalmente, cada alternativa de emp

optimistas y pesimistas.
A diferencia del ejemplo anterior, en

calcular las probabilidades de que se
optimista, dado un escenario a favor
Dichas probabilidades se conocen co
o probabilidades de Bayes.
Para calcular las probabilidades de Bayes se debe seguir el siguiente procedimiento:
Paso 1: Resuma las probabilidades condicionales P(vi/mi) en la siguiente forma tabular:
v1 v2
m1 0.9 0.1
m2 0.5 0.5
Paso 2: Calcule las probabilidades conjuntas así:
Las probabilidades a priori P(m1) y P(m2), son las probabilidades de ocurrencia de cada estado de la naturaleza antes del experimento:
P(m1)=0,6 y P(m2)=0,4
Mercado Mercado
optimista pesimista
P(mi) 0.6 0.4
Aplicando la formula anterior en la tabla de probabilidades condicionales, se encuentra la tabla de probabilidades conjuntas:
v1 v2
m1 0.54 0.06
m2 0.2 0.2 Note como la suma de los valores en la tabla da 1.
P(vi) 0.74 0.26
Donde P(vi) son las probabilidades de que se de un escenario a favor y uno en contra, respectivamente.
Paso 3: Determine las probabilidades a posteriori deseadas:
La tabla de probabilidades de Bayes es:
v1 v2
m1 0.730 0.231
m2 0.270 0.769
Con las probabilidades obtenidas se puede completar el árbol de decisión:

Con la matriz de probabilidades a posteriori (Bayes) y los siguientes datos del problema, se calculan los valores esperados de ganancia:
Mercado optimista Mercado pesimista

Empresa A Empresa B Empresa A Empresa B
Ingresos ($/mes) 10000 6500 Ingresos ($/mes) 3000 5500
Costos ($/mes) 5000 5000 Costos ($/mes) 5000 5000
Ganancia ($/mes) 5000 1500 Ganancia ($/mes) -2000 500
Escenario a favor:
VE de Ganancia en A 3108.11 $/mes
VE de Ganancia en B 1229.73 $/mes
Respuesta 1:
En un escenario a favor de la inversión se debe seleccionar la empresa A, la cual arroja el valor esperado de ganancia mayor: 3108,1 $/mes.
Escenario en contra:
VE de Ganancia en A -384.62 $/mes
VE de Ganancia en B 730.77 $/mes
Respuesta 2:
En un escenario en contra de la inversión se debe seleccionar la empresa B, la cual arroja el valor esperado de ganancia mayor: 730,77 $/mes.
Con los valores de ganancia esperada para cada escenario y su probabilidad de ocurrencia, se puede calcular la retribución esperada de la inversión:
VE de Ganancia a favor 3108.11 $/mes

VE de Ganancia en contra 730.77 $/mes
P(v1) 0.74
P(v2) 0.26
VE de inversión 2490.00 $/mes
Respuesta 3:
Si se recomienda invertir el dinero porque se espera una ganancia de 2490 $/mes como retribución.

babilidades
za que pueden
nales en función
condicional:
do que los estados de la

nodo inicial INVERTIR muestra los dos estados producto de la
nvestigación: A favor y en contra.
os nodos 2 de decisión representan las dos primeras preguntas

resentadas anteriormente.
nalmente, cada alternativa de empresa tiene sus mercados

ptimistas y pesimistas.
diferencia del ejemplo anterior, en este problema se necesita

alcular las probabilidades de que se de, por ejemplo: un mercado
ptimista, dado un escenario a favor de la inversión: P(m1/v1).
ichas probabilidades se conocen como probabilidades a posteriori
probabilidades de Bayes.
del experimento:
dos de ganancia:
mayor: 3108,1 $/mes.
a mayor: 730,77 $/mes.
ción esperada de la inversión:

TOMA DE DECISIONES BAJO INCERTIDUMBRE
La toma de decisiones bajo incertidumbre, así como bajo riesgo, implica acciones alternativas cuyas retribuciones dependen de
los estados de la naturaleza (aleatorios).
Específicamente, la matriz de retribución de un problema de decisión con m acciones alternativas y n estados de la
naturaleza puede representarse como
Estado de la Estado de la Estado de la

naturaleza 1 naturaleza 2 naturaleza 3
Alternativa A Retribución A1 Retribución A2 Retribución A3
Alternativa B Retribución B1 Retribución B2 Retribución B3
Alternativa C Retribución C1 Retribución C2 Retribución C3
En la toma de decisiones bajo incertidumbre, la distribución de probabilidad asociada con los estados de la naturaleza, o se desconoce o no puede
ser determinada. Esta falta de información condujo al desarrollo de criterios de decisión especiales:
1) Criterio de Laplace
El criterio de Laplace se basa en el principio de razón insuficiente. Ya que no se conocen las distribuciones de probabilidad, no hay razón alguna
para creer que las probabilidades asociadas con los estados de la naturaleza sean diferentes. Por tanto, las alternativas se evalúan utilizando la
suposición simplificadora de que todos los estados son igualmente probables de que ocurran.
En tal sentido, se calcula el promedio por cada fila de la matriz de retribución y se selecciona la opción óptima:
*Si se desea maximizar, se selecciona la fila con el mayor valor promedio.
*Si se desea minimizar, se selecciona la fila con el menor valor promedio.
2) Criterio maximin o minimax

El criterio maximin (minimax) está basado en la actitud conservadora de hacer la mejor de las peores condiciones posibles. Entonces:
*Si se desea maximizar, primero se busca el menor valor de cada fila. Luego se selecciona la fila con el mayor valor.
*Si se desea minimizar, primero se busca el mayor valor de cada fila. Luego se selecciona la fila con el menor valor.
3) Criterio de Savage
El criterio de lamento de Savage “modera” el grado de conservadurismo del criterio minimax (maximin) al reemplazar la matriz de retribución
(ganancia o pérdida) con una matriz de pérdida (o lamento), mediante la siguiente transformación: si es una matriz de maximización, el valor de cada
columna se resta con el mayor valor de esa columna. Si es una matriz de minimización, a cada valor de una columna se resta el menor valor de esa
columna. Luego se aplican los criterios:
*Si se desea maximizar, primero se busca el menor valor de cada fila. Luego se selecciona la fila con el mayor valor.
*Si se desea minimizar, primero se busca el mayor valor de cada fila. Luego se selecciona la fila con el menor valor.
4) Criterio de Hurwicz
El último criterio está diseñado para representar diferentes actitudes de decisión que van desde la más optimista hasta la más pesimista.
En cada fila se realiza el siguiente calculo:
*Si es de maximización, αmax+(1-α)min. Se selecciona la fila con el mayor valor.
*Si es de minimización, αmin+(1-α)max. Se selecciona la fila con el menor valor.
El parámetro α es el índice de optimismo. En un problema de maximización, si α=0, entonces el criterio se reduce al criterio minimax conservador,
que busca la mejor de las peores condiciones. Si α=1, entonces el criterio es optimista porque busca la mejor de las mejores condiciones.
EJEMPLO 4
Datos
Muy por Muy por

Por debajo Por encima
debajo encima
Capacidad=200 10 5 18 25
Capacidad=250 8 7 12 23
Capacidad=300 21 18 12 21
Capacidad=350 30 22 19 15
*La tabla muestra los costos de las desviaciones en miles de $.
Al ser una matriz de costo se desea determinar la capacidad de campamento que logre minimizar el costo de la desviación.
A continuación se aplica cada uno de los criterios de toma de decisiones bajo incertidumbre:
1) Criterio de Laplace
Muy por Muy por

Por debajo Por encima PROMEDIO
debajo encima
Capacidad=200 10 5 18 25 14.5
Capacidad=250 8 7 12 23 12.5
Capacidad=300 21 18 12 21 18
Capacidad=350 30 22 19 15 21.5
Bajo el criterio de Laplace la capacidad óptima es de 250 estudiantes.
2) Criterio maximin o minimax
Muy por Muy por

Por debajo Por encima Max de fila
debajo encima
Capacidad=200 10 5 18 25 25
Capacidad=250 8 7 12 23 23
Capacidad=300 21 18 12 21 21
Capacidad=350 30 22 19 15 30
Bajo el criterio minimax la capacidad óptima es de 300 estudiantes.
3) Criterio de Savage
Muy por Muy por

debajo encima
Capacidad=200 10 5 18 25
Capacidad=250 8 7 12 23
Capacidad=300 21 18 12 21
Capacidad=350 30 22 19 15
Matriz de Lamento: al ser un problema de minimización, a cada valor de una columna se resta el menor valor de esa columna.
Muy por Muy por

Por debajo Por encima Max de fila
debajo encima
Capacidad=200 2 0 6 10 10
Capacidad=250 0 2 0 8 8
Capacidad=300 13 13 0 6 13
Capacidad=350 22 17 7 0 22
Bajo el criterio de Savage la capacidad óptima es de 250 estudiantes.
4) Criterio de Hurwicz
α 0.5 *Se coloca a criterio del analista
Muy por Muy por Calculo de

debajo encima Hurwicz
Capacidad=200 10 5 18 25 15
Capacidad=250 8 7 12 23 15
Capacidad=300 21 18 12 21 16.5
Capacidad=350 30 22 19 15 22.5
Bajo el criterio de Hurwicz, con α=0,5, la capacidad óptima es de 200 o 250 estudiantes.
Conclusión:
La capacidad del campamento debe ser de 250 estudiantes porque fue la que obtuvo mayor coincidencia entre los 4 criterios.

conoce o no puede
ay razón alguna
an utilizando la
de retribución
ación, el valor de cada
menor valor de esa
imax conservador,
JUEGOS DE SUMA CERO CON ESTRATEGIA PURA
Debido a que los juegos de suma cero o constante implican un conflicto de intereses, la base para la selección de estrategias óptimas garantiza
que ninguno de los jugadores intenta buscar una estrategia diferente porque el resultado será una retribución peor. Estas soluciones pueden ser
en la forma de una sola estrategia (estrategia pura) o varias estrategias combinadas al azar.
Los juegos se representan en matrices de retribución, como se muestra a continuación. La matriz muestra la retribución del jugador cuyas
estrategias se muestran en las filas. Al ser un juego de suma cero, la retribución para el otro jugador tienen los mismos valores pero con signo contrario.
Supongamos que se tienen dos jugadores (Ay B), el jugador A tienen tres estrategias de acción (A1, A2, A3) y el jugador B tiene solo dos estrategias
de acción (B1, B2). La siguiente matriz muestra la retribución que obtiene cada estrategia de A cuando se combina con una estrategia de B.
B1 B2 *Suponiendo que los valores de retribución están en $, la matriz indica que si el jugador A
A1 5 -2 aplica la estrategia A1 y el B aplica la estrategia B1, el resultado será una ganancia de 5$
A2 3 2 para A. Mientras que si A aplica la estrategia A1 y B aplica la B2 el resultado será un perdid
A3 -1 4 de 2 $ para A.
Con los datos de la matriz anterior se puede armar la matriz de retribución para B:
A1 A2 A3 *Note como los signos cambian, es decir, lo que es ganancia para un jugador
B1 -5 -3 1 es una perdida para el oponente. Este es un principio básico de juegos suma
B2 2 -2 -4
No es necesario obtener la matriz de retribución de B porque el método que se explicará con el ejemplo permite calcular la mejor estrategia para cada
jugador utilizando la matriz de retribuciones de solo uno de ellos.
EJEMPLO 5
Datos
Se presentan los % de mercado capturado o perdido por la compañía A, al aplicar sus estrategias publicitarias en competencia con las estrategias
de la compañía B.
B1 B2 B3 B4
A1 8 -2 9 -3
A2 6 5 6 8
A3 -2 4 -9 5
El método de solución de juegos suma cera se fundamenta en encontrar lo mejor de lo peor; es decir, cuál es la estrategia que brinda el mejor resultado
pero partiendo de los peores resultados de cada estrategia. Para ello se aplica el criterio maximin para el jugador A:
B1 B2 B3 B4 Min de fila
A1 8 -2 9 -3 -3
A2 6 5 6 8 5 Maximin
A3 -2 4 -9 5 -9
Note como lo peor que puede pasar si A aplica la A1 es perder 3% del mercado, si aplica la A2 lo peor que sucede es que gane solo 5% del mercado
y si aplica la A3 puede perder el 9% de mercado. El maximin es 5, siendo la respuesta para el jugador A. Es decir, debe aplicar la estrategia A2.
Para encontrar la estrategia adecuada para el jugador B, igualmente se busca lo mejor de lo peor. Como matriz esta dada para las retribuciones de A,
lo peor que le puede suceder a B es que A logre resultados máximos con sus estrategias, por lo cual se debe aplicar el criterio minimax para el jugador B:
B1 B2 B3 B4 Min de fila
A1 8 -2 9 -3 -3
A2 6 5 6 8 5
A3 -2 4 -9 5 -9
Max de
8 5 9 8
columna
Minimax
La solución indica que B debe aplicar la estrategia B2, perdiendo solo un 5% de mercado, esta es su mejor solución.
Para entender mejor la dinámica del juego: recuerde que un jugador no está en conocimiento de la estrategia que va aplicar su contrincante
como en el juego clásico de piedra, papel o tijera. Note como si B cambia de estrategia buscando un mejor resultado, pero A mantiene su estrategia
de A2 (porque es la mejor para A pero B no lo conoce), entonces B quedará en una peor posición porque en lugar de perder 5% de mercado podría
perder 6% u 8%.
Respuesta:
La empresa A debe realizar el anuncio de su medicamento para la gripe mediante la televisión (A2) y la compañía B también lo debe hacer mediante
la televisión (B2), para encontrar la mejor retribución: para A es ganar el 5% de mercado, el cual lo perderá B.
Note que la mejor estrategia para cada jugador coinciden en el mismo valor de juego: 5%. Cuando esto sucede se dice que el juego se resuelve
con una estrategia pura y al valor de juego se le llama punto silla.

ategias óptimas garantiza
stas soluciones pueden ser
ón del jugador cuyas

s valores pero con signo contrario.
r B tiene solo dos estrategias
n una estrategia de B.
la matriz indica que si el jugador A

esultado será una ganancia de 5$
ica la B2 el resultado será un perdida
lo que es ganancia para un jugador

un principio básico de juegos suma cero.
ular la mejor estrategia para cada
petencia con las estrategias

tegia que brinda el mejor resultado
ue gane solo 5% del mercado

aplicar la estrategia A2.
ada para las retribuciones de A,

criterio minimax para el jugador B:
aplicar su contrincante
pero A mantiene su estrategia
perder 5% de mercado podría
mbién lo debe hacer mediante
e que el juego se resuelve

JUEGOS DE SUMA CERO CON ESTRATEGIA MIXTA (JUEGO 2xm)
Los juegos de suma cero con estrategia mixta ocurren cuando la mejor estrategia posible para cada jugador no ocurre en un cruce de dos estrategias.
En este caso se debe aplicar una combinación de estrategias que genere un valor de juego intermedio entre los dos valores encontrados para cada
jugador. La combinación de estrategias se da en función de una probabilidad de ocurrencia de cada alternativa,
Dependiendo del tamaño de la matriz, se aplica el método de solución que facilite los cálculos: si el juego es 2xm (un jugador tiene dos estrategias
y el otro tiene m estrategias) entonces se puede encontrar una solución gráfica al problema.
EJEMPLO 6
Datos
B1 B2 B3
A1 4 3 1
A2 0 1 2
Para resolver el problema primer se debe intentar encontrar una solución con estrategia pura, como se explicó anteriormente:
B1 B2 B3 Min de fila
A1 4 3 1 1 Maximin
A2 0 1 2 0
Max de
4 3 2
columna
Mini max
Como se puede observar, las mejores estrategias de juego para cada contrincante no coinciden: para A el mejor escenario ocurre con A1-B3, dando
un valor de juego de 1 y para B el mejor escenario ocurre con A2-B3, dando un valor de juego de 2. Por lo cual la estrategia que se debe aplicar no
es pura, debe ser una combinación de las estrategias planteadas (estrategia mixta), que de un valor de juego entre 1 y 2, los valores obtenidos
para cada jugador.
PROCEDIMIENTO
*Paso 1: asignar a cada fila y cada columna una variable que indique la probabilidad de ocurrencia de cada estrategia.
B1 B2 B3 Proporción
A1 4 3 1 x1 Considere que: x1+x2=1
A2 0 1 2 x2 y1+y2+y3=1
Proporción y1 y2 y3
*Paso 2: Para el jugador que solo posee 2 estrategias, calcule el valor de retribución esperado si el contrincante aplica cada una de sus alternativas:
A1 4 3 1 x1
A2 0 1 2 x2
Valores esperados de retribución (VER):
VER-B1 4X1+0X2=4X1
VER-B2 3X1+X2
VER-B3 X1+2X2
Considerando que: x2=1-x1
VER-B1 4X1
VER-B2 3X1+(1-x1)=2x1+1
VER-B3 X1+2X2=x1+2(1-x1)=-x1+2
*Paso 3: graficar las ecuaciones de retribución encontradas, recordando que x1 debe estar entre 0 y 1, al ser una probabilidad
Las rectas graficadas son las siguientes:
VER1=4x1
VER2=2x1+1
VER3=-x1+2
Para encontrar los puntos de corte con los ejes se sugiere utilizar:
x1=0
x1=1
*Paso 4: encontrar la región de solución y el punto óptimo.
Como se están graficando las retribuciones esperadas para el jugador A, el método aplicado es el maximin, es decir, hay que buscar el valor
máximo dentro de la región de mínimos (lo que está por debajo de todas las rectas).
El área marcada en rojo señala los valores mínimos posibles y el punto amarillo
refleja el máximo dentro de los mínimos.
Dicho punto ocurre donde se cortan las dos rectas:
VER1=4x1
VER3=-x1+2
Mediante un cálculo algebraico se puede determinar que:

x1=2/5
Como: x2=1-x1, entonces:
x2=3/5
Sustituyendo el valor de x1 en cualquiera de las ecuaciones que definen el punto

óptimo (punto silla), se puede encontrar el valor del juego:
Valor del juego (v)=8/5
Para culminar el problema se necesita conocer el valor de las yi:
A1 4 3 1 x1=2/5
A2 0 1 2 x2=3/5
Proporción y1 y2 y3 V=8/5
Aplicando a B el calculo realizado en el paso 2, se encuentra la retribución del jugador B si el A aplica alguna de sus dos estrategias:
VER-A1 4y1+3y2+y3 Recuerde que cada yi se encuentra entre 0 y 1.

VER-A2 y2+2y3
En la gráfica de la solución encontrada se observa que la línea verde (correspondiente a B2) no participa en la solución, por lo cual y2=0.
Como se conoce que el valor esperado del juego es V=8/5:
8/5=4y1+y3
8/5=2y3
De la segunda ecuación se encuentra y3=4/5.

Como y1+y2+y3=1, entonces y1=1/5, encontrando así toda la solución al problema.
A1 4 3 1 x1=2/5
A2 0 1 2 x2=3/5
Proporción y1=1/5 y2=0 y3=4/5 v=8/5
Respuesta:
El jugador A debe combinar sus estrategias: 2/5 (40%) la A1 y 3/5 (60%) la A2 para obtener una retribución de 8/5.
El jugador B debe combinar sus estrategias: 1/5 (20%) la B1 y 4/5 (80%) la B3 para obtener una retribución de -8/5.
El valor del juego favorece al jugador A.
Note como el valor del juego 8/5=1,6; se encuentra entre 1 y 2, los dos valores encontrados para cada jugador inicialmente.
EJEMPLO 7
Datos
B1 B2
A1 5 8
A2 6 5
A3 5 7
El problema presentado es de mx2. Al igual que en el ejemplo anterior primero se debe comprobar si existe una solución de estrategia pura:
B1 B2 Min de fila
A1 5 8 5
A2 6 5 5
A3 5 7 5 Maximin
Max de
6 8
columna
minimax
La solución encontrada no es una estrategia pura. Para el jugador A el valor óptimo es 5 y para el jugador B es 8, por lo cual el valor del juego
producto de una estrategia mixta estará entre 8 y 5.
Para resolver este problema se debe aplicar el procedimiento señalado en el ejemplo anterior:
*Paso 1: asignar a cada fila y cada columna una variable que indique la probabilidad de ocurrencia de cada estrategia.
B1 B2 Proporción
A1 5 8 x1 Considere que: x1+x2+x3=1
A2 6 5 x2 y1+y2=1
A3 5 7 x3
Proporción y1 y2
*Paso 2: Para el jugador que solo posee 2 estrategias, calcule el valor de retribución esperado si el contrincante aplica cada una de sus alternativas:
VER-A1 5y1+8y2
VER-A2 6y1+5y2
VER-A3 5y1+7y2
Considerando que: y2=1-y1
VER-B1 5y1+8(1-y1)=-3y1+8
VER-B2 6y1+5(1-y1)=y1+5
VER-B3 5y1+7(1-y1)=-2y1+7
*Paso 3: graficar las ecuaciones de retribución encontradas, recordando que y1 debe estar entre 0 y 1, al ser una probabilidad
Las rectas graficadas son las siguientes:
VER1=-3y1+8
VER2=y1+5
VER3=-2y1+7
Para encontrar los puntos de corte con los ejes se sugiere utilizar:
y1=0
y1=1
*Paso 4: encontrar la región de solución y el punto óptimo.
Como se están graficando las retribuciones esperadas para el jugador B, y la tabla está en función de las retribuciones de A, el método aplicado
es el minimax, es decir, hay que buscar el valor mínimo dentro de la región de máximos (lo que está por encima de todas las rectas).
El área marcada en rojo señala los valores máximos posibles y el punto amarillo
refleja el mínimo dentro de los máximos.
Dicho punto ocurre donde se cortan las dos rectas:
VER1=-3y1+8
VER2=y1+5
Mediante un cálculo algebraico se puede determinar que:

y1=3/4
Como: y2=1-x1, entonces:
y2=1/4
Sustituyendo el valor de y1 en cualquiera de las ecuaciones que definen el punto
óptimo (punto silla), se puede encontrar el valor del juego:
Valor del juego (v)=23/4
Para culminar el problema se necesita conocer el valor de las xi:
B1 B2 Proporción
A1 5 8 x1
A2 6 5 x2
A3 5 7 x3
Proporción y1=3/4 y2=1/4 v=23/4
Aplicando a A el calculo realizado en el paso 2, se encuentra la retribución del jugador A si B aplica alguna de sus dos estrategias:
VER-B1 5x1+6x2+5x3 Recuerde que cada xi se encuentra entre 0 y 1.

VER-B2 8x1+5x2+7x3
En la gráfica de la solución encontrada se observa que la línea morada (correspondiente a A3) no participa en la solución, por lo cual x3=0.
Como se conoce que el valor esperado del juego es v=23/4:
23/4=5x1+6x2
23/4=8x1+5x2
Resolviendo el sistema de ecuaciones se obtiene:

x1=1/4
x2=3/4
Solución del problema:
B1 B2 Proporción
A1 5 8 x1=1/4
A2 6 5 x2=3/4
A3 5 7 x3=0
Proporción y1=3/4 y2=1/4 v=23/4
Respuesta:
El jugador A debe combinar sus estrategias: 1/4 (25%) la A1 y 3/4 (75%) la A2 para obtener una retribución de 23/4.
El jugador B debe combinar sus estrategias: 3/4 (75%) la B1 y 1/4 (20%) la B2 para obtener una retribución de -23/4.
El valor del juego favorece al jugador A.
Note como el valor del juego 23/4=5,75; se encuentra entre 5 y 8, los dos valores encontrados para cada jugador inicialmente.

cruce de dos estrategias.
encontrados para cada
r tiene dos estrategias
curre con A1-B3, dando

que se debe aplicar no
valores obtenidos
una de sus alternativas:
buscar el valor
sibles y el punto amarillo

ones que definen el punto
o cual y2=0.
estrategia pura:
el valor del juego
una de sus alternativas:

el método aplicado
sibles y el punto amarillo

ones que definen el punto
r lo cual x3=0.
JUEGOS DE SUMA CERO CON ESTRATEGIA MIXTA
SOLUCIÓN CON PROGRAMACIÓN LINEAL
La teoría de juegos está estrechamente relacionada con la PL en el sentido de que cualquier juego de suma cero entre dos personas puede
expresarse como un programa lineal, y viceversa. De hecho, G. Dantzig (1963) expresa que cuando J. von Neumann, padre de la teoría de juegos, la
introdujo por primera vez al método simplex en 1947, de inmediato reconoció esta relación y además precisó y recalcó el concepto de dualidad en
la programación lineal.
A continuación se explica por medio de un ejemplo cómo resolver un juego por programación lineal.
EJEMPLO 8
Datos
B1 B2 B3
A1 3 -1 -3
A2 -2 4 -1
A3 -5 -6 2
Primero debe evaluar si el juego tiene una solución de estrategia pura:
B1 B2 B3 Min de fila
A1 3 -1 -3 -3
A2 -2 4 -1 -2 Maximin
A3 -5 -6 2 -6
Max de
3 4 2
columna
Minimax
El juego no tiene una solución de estrategia pura pero se conoce que el valor del juego debe estar entre -2 y 2.
PROCEDIMIENTO DE SOLUCIÓN CON PL

*Paso 1: Plantear el modelo de programación lineal.
Se va a plantear el modelo de solución para el jugador A:

*Existe una variable por cada estrategia posible para el jugador A.
*Existe una restricción por cada estrategia posible para el jugador B.
*Sea v el valor del juego. Representa la función objetivo, que para el jugador A se desea maximizar.
*Las restricciones del jugador A son del tipo ≤, porque se busca el máximo dentro de los mínimos.
Forma de la restricción; v-(c1x1+c2x2+c3x3)≤0
*La suma de las variables debe ser igual a 1.
Modelo matemático del ejemplo, para el jugador A:
Variables:
x1: proporción en la que se aplica la alternativa A1
Objetivo:
Maximizar el valor del juego
Max v
Restricciones:
v-3x1+2x2+5x3≤0
v+x1-4x2+6x3≤0
v+3x1+x2-2x3≤0
x1+x2+x3=1
x1,x2,x3≥0
*Paso 2: Resolver el modelo de PL por el método SIMPLEX de SOLVER.
Max v= -0.908
B1 B2 B3
x1 0.394 A1 3 -1 -3
x2 0.312 A2 -2 4 -1
x3 0.294 A3 -5 -6 2
Restricción: 1.000 Valor esperado -0.90825688 -0.90825688 -0.90825688
Restricción: 0.000 0.000 0.000
Solución:
v=-0,908
x1=0,394
x2=0,312
x3=0,294
*Paso 3: Solicitar a SOLVER el análisis de sensibilidad para encontrar los valores duales; y1, y2, y3; que corresponden a las proporciones
en las que B debe aplicar sus estrategias.
v=-0,908
y1=0,321
y2=0,083
y3=0,596
Respuesta:
El jugador A debe combinar sus estrategias: 39,4% la A1, 31,2% A2 y 29,4% la A3 para obtener una retribución de -0,91.
El jugador B debe combinar sus estrategias: 32,1% la B1, 8,3% la B2 y 59,6% la B3 para obtener una retribución de 0,91.
El valor del juego favorece al jugador B.
Note como el valor del juego -0,91; se encuentra entre -2 y 2, los dos valores encontrados para cada jugador inicialmente.

onas puede
teoría de juegos, la
pto de dualidad en
Microsoft Excel 12.0 Informe de sensibilidad
Hoja de cálculo: [TEORÍA DE DECISIONES Y JUEGOS.xlsx]PL APLICADA A JUEGOS
Informe creado: 16/05/2020 05:30:42 a.m.
Celdas cambiantes
Valor Gradiente Coeficiente Aumento Aumento
Celda Nombre Igual reducido objetivo permisible permisible
$B$67 x1 Max v= 0.394 0.000 0 2.6923076923 1.5
$B$68 x2 Max v= 0.312 0.000 0 0.6923076923 3.5
$B$69 x3 Max v= 0.294 0.000 0 6.5 1.2857142857
$C$64 Max v= x1,x2,x3≥0 -0.908 0.000 1 1E+030 1
Restricciones
Valor Sombra Restricción Aumento Aumento
Celda Nombre Igual precio lado derecho permisible permisible
$B$70 Restricción: Max v= 1 -0.9082568807 1 1E+030 1E+030
$E$71 Restricción: B1 0 0.3211009174 0 1E+030 1E+030
$F$71 Restricción: B2 0 0.0825688073 0 1E+030 1E+030
$G$71 Restricción: B3 0 0.5963302752 0 1E+030 1E+030
Estos son los valores duales yi

Teoría de Decisiones y Juegos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Teoría de Decisiones y Juegos

Uploaded by

Copyright:

Available Formats

TEORÍA DE DECISIONES Y JUEGOS

Elaborado por: Ing. Angel González

no se conocen con certeza

gos suma cero)

n cada par de estrategias

Ubicación (U) Reputación ( R)

UCV UC UDO Peso

UCV UC UDO Peso

Donde: Índice de consistencia (IC): El cálculo de n máx se mu

Consistencia aleatoria (RI):

1 1/2 1/5 0.129 0.386

Paso 5: Asignar los pesos en el árbol para tomar la decisión.

Ubicación (U) Reputación ( R)

UCV UC UDO UCV UC

Valor de UCV 0.475962

Elaborado por: Ing. Angel González

ntras que la relación

que se comparan los factores entre sí.

n del enunciado mientras que el resto

cálculo de n máx se muestra con el ejemplo.

ÁRBOL DE DECISIONES BASADO EN EL CRITERIO DE VALOR ESPERADO

Estado de la Estado de la Estado de la

Alternativa A Retribución A1 Retribución A2 Retribución A3 El valor esperado para la opción i es:

a) Determine en cuál de las dos empresas invertiría dinero.

Se calcula el Valor Esperado de la Ganancia para cada alternativa:

VE de Ganancia en A 2200 $/mes

En el árbol se observa que hay dos nodos d

Los demás nodos son probabilísticos (círcu

Como se observa en la figura, a cada nodo

De esta manera, el VME de la planta reubi

Finalmente, se toma la decisión principal:

Elaborado por: Ing. Angel González

ede ocurrir y cada

os son probabilísticos (círculos) que son influenciados

va en la figura, a cada nodo probabilístico se le determina su VME.

a, el VME de la planta reubicada es el valor que representa

toma la decisión principal: si se comparan los VME de las empresas

ÁRBOL DE DECISIONES BASADO EN EL CRITERIO DE VALOR ESPERADO CON LEY DE BAYES

Con esta representación el problema de decisión se resume como:

El nodo inicial INVERTIR muestra los

Los nodos 2 de decisión representan

Finalmente, cada alternativa de emp

A diferencia del ejemplo anterior, en

Para calcular las probabilidades de Bayes se debe seguir el siguiente procedimiento:

Paso 1: Resuma las probabilidades condicionales P(vi/mi) en la siguiente forma tabular:

Paso 3: Determine las probabilidades a posteriori deseadas:

La tabla de probabilidades de Bayes es:

Con las probabilidades obtenidas se puede completar el árbol de decisión:

Mercado optimista Mercado pesimista

VE de Ganancia a favor 3108.11 $/mes

Elaborado por: Ing. Angel González

do que los estados de la

os nodos 2 de decisión representan las dos primeras preguntas

nalmente, cada alternativa de empresa tiene sus mercados

diferencia del ejemplo anterior, en este problema se necesita

a mayor: 730,77 $/mes.

ción esperada de la inversión:

Estado de la Estado de la Estado de la

2) Criterio maximin o minimax

Muy por Muy por

Muy por Muy por

Bajo el criterio de Laplace la capacidad óptima es de 250 estudiantes.

2) Criterio maximin o minimax