Teoría de Juegos y Estrategias

-EQUILIBRIO DE NASH-

Equilibrio de Nash

1. ¿Quién es John Forbes Nash?

John Forbes Nash Jr., nació el 13 de junio de 1928, en Bluefield, Virginia Occidental. Recibió el Premio Nobel de Economía de 1994[1] por sus aportes a la Teoría de Juegos y los procesos de negociación, junto con Reinhard Selten y John Harsanyi. Nash ganó una beca en el concurso George Westinghouse y entró en junio de 1945 para estudiar Ingeniería Química por el Instituto de Tecnología "Carnegie Institute" (hoy en día Carnegie Mellon). Sin embargo empezó a destacar en Matemáticas y su profesor le convenció para que se especializara en ellas. En 1948 aceptó una beca de la Universidad de Princeton, para realizar sus estudios de doctorado en Matemáticas. La carta de recomendación escrita por su profesor R.J. Duffin tenía sólo una línea: "Este hombre es un genio". En Princeton trabajaban en ese momento genios como Einstein o Von Neumann, lo que hizo aumentar su ansia por destacar, por superarse a sí mismo y a los demás y por obtener reconocimiento. Inventó un juego matemáticamente perfecto, en el cual se basa el actual Hex. En 1949, propuso el sistema de equilibrio de mercados vigente en la actualidad, rebatiendo las teorías de Adam Smith. A los veintiún años, en 1950, se doctoró con una tesis de menos de treinta páginas sobre "Juegos NoCooperativos", lo que desde entonces se llamó "el equilibrio de Nash", que tuvo un inmediato reconocimiento entre todos los especialistas. Nash comenzó a trabajar para la RAND, una institución de las fuerzas aéreas dedicada a la investigación estratégica. Sus teorías han influido en las negociaciones comerciales globales, en los avances en Biología evolutiva, o en las relaciones laborales nacionales.

2. El Equilibrio de Nash.
En teoría de juegos, se define el equilibrio de Nash (formulado por John Forbes Nash) como un modo de obtener una estrategia óptima para juegos que involucren a dos o más jugadores. Si hay un conjunto de estrategias tal que ningún jugador se beneficia cambiando su estrategia mientras los otros no cambien la suya, entonces ese conjunto de estrategias y las ganancias correspondientes constituyen un equilibrio de Nash. El concepto de equilibrio de Nash apareció por primera vez en su disertación Non-cooperative games (1950). John Forbes Nash demostró que las distintas soluciones que habían sido propuestas anteriormente para juegos tienen la propiedad de producir un equilibrio de Nash. Un juego puede no tener equilibrio de Nash, o tener más de uno. Nash fue capaz de demostrar que si permitimos estrategias mixtas (en las que los jugadores pueden escoger estrategias al azar con una probabilidad predefinida), entonces todos los juegos de n jugadores en los que cada jugador puede escoger entre un número finito de estrategias tienen al menos un equilibrio de Nash con estrategias mixtas. Si un juego tiene un único equilibrio de Nash y los jugadores son completamente racionales, los jugadores escogerán las estrategias que forman el equilibrio. Consideramos el siguiente juego de dos jugadores: "Los jugadores escogen simultáneamente un número entero entre cero (0) y diez (10). Los dos jugadores ganan el valor menor en dólares, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar $2 al otro."

1

en el que ambos confiesan y ambos reciben largas condenas. Si uno calla y el cómplice confiesa. Sea cual sea la elección del otro jugador. También hay un equilibrio de Nash con estrategias mixtas.100 En este caso hay dos equilibrios de Nash con estrategias puras. todo lo que podrán hacer será encerrarlos durante seis meses por un cargo menor. El primer número en cada celda indica la ganancia del primer jugador (cuyas opciones se muestran a la izquierda) y el segundo la ganancia del segundo jugador (cuyas opciones se muestran encima). La enunciación clásica del dilema del prisionero es: La policía arresta a dos sospechosos. y el primero será liberado. Cualquier otra estrategia puede mejorarse si uno de los jugadores escoge un número menor. Si ambos permanecen callados. 10 años Vamos a suponer que ambos prisioneros son completamente egoístas y su única meta es reducir su propia estancia en la cárcel. cuando cada jugador escoge aleatoriamente con una probabilidad del 50% cuál de las dos estrategias aplica. tú sales libre Él sale libre. sin embargo. Incluso si pudiesen hablar entre sí. el cómplice será condenado a la pena total. Lo que puede resumirse como: Tú lo niegas Él lo niega Él confiesa Ambos son condenados a 6 meses Tú confiesas Él es condenado a 10 años.0 100. mientras el cómplice tendrá que cumplir una condena de 10 años. ambos serán condenados a seis años. hay 11 equilibrios de Nash distintos. Por desgracia para los prisioneros. lo que significaría que sería liberado inmediatamente. y de otro modo no ganen nada. esto conduce a un resultado regular. diez años. ya que al menos no recibirá la condena completa de 10 años. Aquí se encuentra el 2 . Si. Desafortunadamente. Como prisioneros tienen dos opciones: cooperar con su cómplice y permanecer callado. Si se modifica el juego de modo que los dos jugadores ganen el número escogido si ambos son iguales. o traicionar a su cómplice y confesar. y tras haberlos separado. uno no conoce qué ha elegido hacer el otro. pueden reducir siempre su sentencia confesando. no podrían estar seguros de confiar mutuamente. No hay pruebas suficientes para condenarlos. ambos decidiesen cooperar y permanecer en silencio. la opción óptima para el primero sería confesar. cuando ambos conducen por la derecha o ambos conducen por la izquierda.0 Conducir por la derecha: 0. Si ambos confiesan. el primero recibirá esa pena y será el cómplice quien salga libre. al igual que el cómplice. 3. El dilema del prisionero. Si espera que su cómplice decida confesar. Si uno espera que el cómplice escoja cooperar con él y permanecer en silencio. tú eres condenado a Ambos son condenados a 6 años. Juego de coordinación: Este juego es un juego de coordinación al conducir. Confesar es una estrategia dominante para ambos jugadores. Conducir por la izquierda: Conducir por la izquierda: Conducir por la derecha: 100. El resultado de cada elección depende de la elección del cómplice. Si uno confiesa y su cómplice no. ambos serían liberados en sólo 6 meses.100 0. los visita a cada uno y les ofrece el mismo trato. Las opciones son: o conducir por la derecha o conducir por la izquierda: 100 significa que no se produce un choque y 0 significa que sí. la mejor opción es confesar también.Teoría de Juegos y Estrategias Equilibrio de Nash Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0). y sólo tendrá que esperar 6.

4º (lo menos preferido) Él elige Discoteca y ELLA elige Fútbol. 4º (lo menos preferido) Él elige Discoteca y ELLA elige Fútbol. Supongamos que el orden de preferencias de ELLA es el siguiente: 1º (lo más preferido) ÉL y ELLA eligen Discoteca. Si se razona desde la perspectiva del interés óptimo del grupo (de los dos prisioneros). el resultado en el cual ambos detenidos no confiesan domina al resultado en el cual los dos eligen confesar. Supongamos que el orden de preferencias de ÉL es el siguiente: 1º (lo más preferido) ÉL y ELLA eligen Fútbol. A pesar de ello. Esa solución. 3º ÉL elige Fútbol y ELLA elige Discoteca. Sin transferencia de utilidad significa que no hay comunicación previa por lo que no es posible ponerse de acuerdo. es posible que el resultado no sea óptimo. Cada uno de ellos puede elegir entre dos posibles estrategias a las que llamaremos "Fútbol" y "Discoteca". los pagos a ÉL. La guerra de los sexos El juego de "La guerra de los sexos" es un ejemplo muy sencillo de utilización de modelos de la teoría de juegos para analizar un problema frecuente en la vida cotidiana. no es un punto de equilibrio de Nash ya que los jugadores están tentados 3 . si siguen sus propios intereses egoístas. El problema que se plantea es simplemente un problema de coordinación. Hay dos jugadores: "ÉL" y "ELLA". La forma iterada de este juego (mencionada más abajo) ofrece una oportunidad para este tipo de castigo. tal como lo hemos descrito.Teoría de Juegos y Estrategias Equilibrio de Nash punto clave del dilema. negociar ni acordar pagos secundarios ("Si vienes al fútbol te pago la entrada"). 3º ÉL elige Fútbol y ELLA elige Discoteca. En ese juego. Cualquier otra decisión sería peor para ambos si se consideran conjuntamente. es un juego sin repetición y sin transferencia de utilidad. Al no haber comunicación previa. Si has tenido una oportunidad para castigar al otro jugador por confesar. 4. cada uno de los dos prisioneros recibirá una sentencia dura. Este juego. el juego iterado ofrece una opción de castigo que está ausente en el modo clásico del juego. entonces un resultado cooperativo puede mantenerse. La matriz de pagos es como sigue: ELLA Fútbol Discoteca Fútbol 1\2 3 \ 3* ÉL Discoteca 4\4 2\1 Los pagos representan el orden de preferencias. En otras palabras. se le puede castigar traicionándolo a la próxima. Sin repetición significa que sólo se juega una vez por lo que no es posible tomar decisiones en función de la elección que haya hecho el otro jugador en juegos anteriores. Se trata de coincidir en la elección. si el cómplice traiciona y confiesa una vez. 2º ÉL y ELLA eligen Fútbol. A la izquierda de la barra. Así. ya que esto reduciría el tiempo total de condena del grupo a un total de un año. el resultado correcto sería que ambos cooperasen. Si cada uno de los jugadores elige su estrategia maximín el pago que recibirán (3\3) es subóptimo. A la derecha de la barra los pagos a ELLA. existe una situación tal que la utilidad de uno de los detenidos podría mejorar (incluso la de ambos) sin que esto implique un empeoramiento para el resto. marcada en la matriz con un asterisco. El resultado de las interacciones individuales produce un resultado que no es óptimo en el sentido de Pareto. 2º ÉL y ELLA eligen Discoteca.

El dilema del prisionero es por ello de interés para ciencias sociales como economía. además de ciencias biológicas como etología y biología evolutiva. una solución estable. Supongamos que las posiciones 2ª y 3ª en el orden de preferencias de ÉL se invierten. parecen actuar • Otro interesante ejemplo tiene que ver con un concepto conocido de las carreras en ciclismo. pero el resultado es completamente irracional. Sabiendo esto ELLA elegirá siempre la estrategia Fútbol también. A menudo. el escenario del dilema del prisionero se usa a menudo para ilustrar el problema de dos estados involucrados en una carrera armamentística. Podemos introducir una interesante modificación en el juego convirtiéndolo en asimétrico a la vez que nos aproximamos más al mundo real. se aplica precisamente el escenario del dilema del prisionero: está en el interés de ambos sospechosos el confesar y testificar contra el otro prisionero/sospechoso. un punto de silla. es decir. por ejemplo. Si ninguno de los ciclistas hace un esfuerzo para permanecer delante. el peor caso se da cuando sólo uno de ellos es culpable: no es probable que el inocente confiese. razonarán que su armamento. muchos ejemplos de interacciones humanas y de interacciones naturales en las que se obtiene la misma matriz de pagos. sentirá el deseo de cambiar de estrategia para obtener un pago mayor. La matriz de pagos queda como sigue: ELLA Fútbol 1 \ 2* 4\4 ÉL Fútbol Discoteca Discoteca 2\3 3\1 ELLA conoce la matriz de pagos. manteniendo a ambos lejos del pelotón. Está muy claro que ÉL elegirá siembre la estrategia Fútbol. es un óptimo. incluso si ambos son inocentes del supuesto crimen. • Por último. La ironía está en que ambos estados racionalmente. se prohíben los acuerdos judiciales. El resultado. por ejemplo el Tour de Francia. Ejemplos en la vida real Estos ejemplos en concreto en los que intervienen prisioneros. ambos se inclinarán hacia la expansión militar. marcado con un asterisco. o llegar a un acuerdo para reducir Ninguno de los dos estados puede estar seguro de que el otro acatará el acuerdo. esto llevará probablemente a una victoria del segundo ciclista (desertor) que ha tenido una carrera fácil en la estela del primer corredor. • En ciencia política. ËL prefiere ir solo al Fútbol más que ir con ELLA a la Discoteca. donde no se pueden refugiar del viento. de hecho. las preferencias de ÉL. en muchos países. Se puede decir que. intercambio de bolsas y cosas parecidas pueden parecer rebuscados. de este modo. ciencia política y sociología. un punto de equilibrio de Nash. Considérense dos ciclistas a mitad de carrera. la conclusión teórica del dilema del prisionero es una razón por la cual. Ambos tienen dos opciones: o incrementar el gasto militar. Aplicaciones.Teoría de Juegos y Estrategias Equilibrio de Nash de cambiar su elección: cuando ELLA llegue a la discoteca y observe que ÉL se ha ido al fútbol. El modelo que hemos visto es un juego simétrico ya que jugadores o estrategias son intercambiables sin que los resultados varíen. Obsérvese que esta solución conduce a una situación estable de dominación social del jugador que podríamos calificar como el más egoísta. Al final. el pelotón les alcanzará rápidamente (deserción mutua). Un ejemplo visto a menudo es que un sólo ciclista haga todo el trabajo (coopere). pero existen. el problema de coordinación desaparece. La estrategia maximín de ambos jugadores coincide. 4 . Los dos ciclistas trabajan a menudo conjuntamente (cooperación mutua) compartiendo la pesada carga de la posición delantera. mientras que el culpable tenderá a confesar y testificar contra el inocente. 5. sea cual sea la elección de ELLA. ya que prefiere estar con ÉL aunque sea en el Fútbol que estar sola aunque sea en la Discoteca. con el pelotón a gran distancia.

Sign up to vote on this title
UsefulNot useful