El curso de Juegos Gerenciales proporcionará la teoría de juegos para fortalecer la capacidad de analizar estratégicamente en entornos complejos e interactivos, de tal forma que consideremos las situaciones como retos de los que pueden surgir soluciones factibles cuando intervienen varias partes en las negociaciones.
Teoría de Decisión
Es una área interdisciplinaria de estudio, relacionada con casi todos los participantes en ramas de la ciencia, la Administración, Economía, la psicología (basados en perspectivas cognitivo-conductuales). Concierne a la forma y al estudio del comportamiento y fenómenos psíquicos de aquellos que toman las decisiones (reales o ficticios), así como las condiciones por las que deben ser tomadas las decisiones.
La mayor parte de la teoría de la decisión es normativa o prescriptiva, es decir concierne a la identificación de la mejor decisión que pueda ser tomada, asumiendo que una persona que tenga que tomar decisiones (decision maker) sea capaz de estar en un entorno de completa información, capaz de calcular con precisión y completamente racional. La aplicación práctica de esta aproximación prescriptiva (de como la gente debería hacer y tomar decisiones) se denomina análisis de la decisión y proporciona una búsqueda de herramientas, metodologías y software para ayudar a las personas a tomar mejores decisiones. Las herramientas de software orientadas a este tipo de ayudas se desarrollan bajo la denominación global de Sistemas para la ayuda a la decisión (decision support systems, abreviado en inglés como DSS).
Como parece obvio que las personas no se encuentran en estos entornos óptimos y con la intención de hacer la teoría más realista, se ha creado un área de estudio relacionado que se encarga de la parte de la disciplina más positiva o descriptiva, intentando describir qué es lo que la gente realmente hace durante el proceso de toma de decisiones. Se pensó en esta teoría debido a que la teoría normativa, trabaja sólo bajo condiciones óptimas de decisión y a menudo crea hipótesis, para ser probadas, algo alejadas de la realidad cotidiana. Los dos campos están íntimamente relacionados; no obstante, es posible relajar algunas presunciones de la información perfecta que llega al sujeto que toma decisiones, se puede rebajar su racionalidad y así sucesivamente, hasta llegar a una serie de prescripciones o predicciones sobre el comportamiento de la persona que toma decisiones, permitiendo comprobar qué ocurre en la práctica de la vida cotidiana.
La mayor parte de la teoría de la decisión es normativa o prescriptiva, es decir concierne a la identificación de la mejor decisión que pueda ser tomada, asumiendo que una persona que tenga que tomar decisiones (decision maker) sea capaz de estar en un entorno de completa información, capaz de calcular con precisión y completamente racional. La aplicación práctica de esta aproximación prescriptiva (de como la gente debería hacer y tomar decisiones) se denomina análisis de la decisión y proporciona una búsqueda de herramientas, metodologías y software para ayudar a las personas a tomar mejores decisiones. Las herramientas de software orientadas a este tipo de ayudas se desarrollan bajo la denominación global de Sistemas para la ayuda a la decisión (decision support systems, abreviado en inglés como DSS).
Como parece obvio que las personas no se encuentran en estos entornos óptimos y con la intención de hacer la teoría más realista, se ha creado un área de estudio relacionado que se encarga de la parte de la disciplina más positiva o descriptiva, intentando describir qué es lo que la gente realmente hace durante el proceso de toma de decisiones. Se pensó en esta teoría debido a que la teoría normativa, trabaja sólo bajo condiciones óptimas de decisión y a menudo crea hipótesis, para ser probadas, algo alejadas de la realidad cotidiana. Los dos campos están íntimamente relacionados; no obstante, es posible relajar algunas presunciones de la información perfecta que llega al sujeto que toma decisiones, se puede rebajar su racionalidad y así sucesivamente, hasta llegar a una serie de prescripciones o predicciones sobre el comportamiento de la persona que toma decisiones, permitiendo comprobar qué ocurre en la práctica de la vida cotidiana.
Teoría de Juegos
Es un área de la matemática aplicada que utiliza modelos para estudiar interacciones en estructuras formalizadas de incentivos (los llamados «juegos») y llevar a cabo procesos de decisión. Sus investigadores estudian las estrategias óptimas así como el comportamiento previsto y observado de individuos en juegos. Tipos de interacción aparentemente distintos pueden, en realidad, presentar estructura de incentivo similar y, por lo tanto, se puede representar mil veces conjuntamente un mismo juego. Desarrollada en sus comienzos como una herramienta para entender el comportamiento de la economía, la teoría de juegos se usa actualmente en muchos campos, como en la biología, sociología, psicología y filosofía. Experimentó un crecimiento sustancial y se formalizó por primera vez a partir de los trabajos de John von Neumann y Oskar Morgenstern, antes y durante la Guerra Fría, debido sobre todo a su aplicación a la estrategia militar, en particular a causa del concepto de destrucción mutua garantizada. Desde los setenta, la teoría de juegos se ha aplicado a la conducta animal, incluyendo el desarrollo de las especies por la selección natural. A raíz de juegos como el dilema del prisionero, en los que el egoísmo generalizado perjudica a los jugadores, la teoría de juegos ha atraído también la atención de los investigadores en informática, usándose en inteligencia artificial y cibernética.
Aunque tiene algunos puntos en común con la teoría de la decisión, la teoría de juegos estudia decisiones realizadas en entornos donde interaccionan. En otras palabras, estudia la elección de la conducta óptima cuando los costes y los beneficios de cada opción no están fijados de antemano, sino que dependen de las elecciones de otros individuos. Un ejemplo muy conocido de la aplicación de la teoría de juegos a la vida real es el dilema del prisionero, popularizado por el matemático Albert W. Tucker, el cual tiene muchas implicaciones para comprender la naturaleza de la cooperación humana. La teoría psicológica de juegos, que se arraiga en la escuela psicoanalítica del análisis transaccional, es enteramente distinta.
Aunque tiene algunos puntos en común con la teoría de la decisión, la teoría de juegos estudia decisiones realizadas en entornos donde interaccionan. En otras palabras, estudia la elección de la conducta óptima cuando los costes y los beneficios de cada opción no están fijados de antemano, sino que dependen de las elecciones de otros individuos. Un ejemplo muy conocido de la aplicación de la teoría de juegos a la vida real es el dilema del prisionero, popularizado por el matemático Albert W. Tucker, el cual tiene muchas implicaciones para comprender la naturaleza de la cooperación humana. La teoría psicológica de juegos, que se arraiga en la escuela psicoanalítica del análisis transaccional, es enteramente distinta.
Estrategias Dominantes
Se denomina en teoría de juegos a una estrategia dominante o también dominancia cuando la estrategia de uno de los jugadores es provechosa para él, independiente de la estrategia del jugador oponente. Las estrategias dominantes dan como resultado final el equilibrio de las estrategias dominantes en el juego. En un juego en el que cada uno de los jugadores tenga una estrategia dominante el resultado final es predecible. Lo contrario de la situación de estrategia dominante se denomina intransitividad y se caracteriza porque una estrategia puede ser mejor o peor que la del jugador oponente dependiendo de las opciones e información que posea.
Equilibrio de Nash
El equilibrio de Nash o equilibrio de Cournot o equilibrio de Cournot y Nash o equilibrio del miedo es, en la teoría de los juegos, un “concepto de solución” para juegos con dos o más jugadores, el cual asume que:
Cada jugador conoce y ha adoptado su mejor estrategia, y todos conocen las estrategias de los otros.
Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los movimientos de los demás jugadores.
En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros. Consecuentemente, ningún jugador tiene ningún incentivo para modificar individualmente su estrategia.
Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes, sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamente posible que el resultado fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.
En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia.
Quizás el mejor ejemplo de un equilibrio de Nash es la variación del conocido “dilema del prisionero” modificado a fin de resaltar los efectos descritos. En esta versión hay varios jugadores (más de tres). El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan, pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación (equilibrio) en la cual cada uno minimiza su posible pérdida.
Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los jugadores repartiendo un “botín”, etc.). En todas esas situaciones resulta que la estrategia de no cooperar es la que minimiza el riesgo de pérdidas y otorga una ganancia media pero segura para cada jugador individual, pero la cooperación maximizaría la ganancia tanto a nivel individual como de grupo.
Cada jugador conoce y ha adoptado su mejor estrategia, y todos conocen las estrategias de los otros.
Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los movimientos de los demás jugadores.
En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros. Consecuentemente, ningún jugador tiene ningún incentivo para modificar individualmente su estrategia.
Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes, sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamente posible que el resultado fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.
En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia.
Quizás el mejor ejemplo de un equilibrio de Nash es la variación del conocido “dilema del prisionero” modificado a fin de resaltar los efectos descritos. En esta versión hay varios jugadores (más de tres). El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan, pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación (equilibrio) en la cual cada uno minimiza su posible pérdida.
Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los jugadores repartiendo un “botín”, etc.). En todas esas situaciones resulta que la estrategia de no cooperar es la que minimiza el riesgo de pérdidas y otorga una ganancia media pero segura para cada jugador individual, pero la cooperación maximizaría la ganancia tanto a nivel individual como de grupo.
El concepto de equilibrio de Nash comienza su desarrollo con Antoine Augustin Cournot y su trabajo sobre oligopolios (1838). En éste se plantea el modelo de varias empresas que compiten por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia en función de la producción de las otras. Se establece un equilibrio de Cournot cuando la producción de cada empresa maximiza sus beneficios, dada la producción de las otras empresas, lo que es una situación de estrategia pura en el equilibrio de Nash.
Los equilibrios de Nash en estrategias puras son limitados en muchos aspectos y fue con el desarrollo de la teoría moderna de juegos que surgen los equilibrios en estrategias mixtas (aquellas en las que los jugadores pueden elegir aleatoriamente entre varias estrategias). El concepto de equilibrio para este tipo de estrategias fue introducido por John von Neumann y Oskar Morgenstern en su libro Theory of Games and Economic Behavior (1944), aunque sólo trataron los equilibrios para el caso especial de juegos de suma cero.
Fue John Forbes Nash quien en su tesis de doctorado (1951) define los equilibrios que hoy llevan su nombre, tratando de manera general las estrategias mixtas y demostrando que cualquier juego con un número finito de estrategias tiene al menos un equilibrio de Nash en estrategias mixtas. Nash ganaría posteriormente un premio Nobel por la amplia gama de aplicaciones que tuvo este concepto en diversas ramas de las ciencias.
Posteriormente se encontraron algunos casos en los que los equilibrios de Nash no llevaban a predicciones totalmente adecuadas para los comportamientos de los jugadores, o comportamientos estables que no se podían encontrar como equilibrios de Nash, lo que dio paso a la búsqueda y desarrollo de nuevos equilibrios (muchas veces como refinamientos de los equilibrios de Nash) y conceptos de solución de un juego..
Los equilibrios de Nash en estrategias puras son limitados en muchos aspectos y fue con el desarrollo de la teoría moderna de juegos que surgen los equilibrios en estrategias mixtas (aquellas en las que los jugadores pueden elegir aleatoriamente entre varias estrategias). El concepto de equilibrio para este tipo de estrategias fue introducido por John von Neumann y Oskar Morgenstern en su libro Theory of Games and Economic Behavior (1944), aunque sólo trataron los equilibrios para el caso especial de juegos de suma cero.
Fue John Forbes Nash quien en su tesis de doctorado (1951) define los equilibrios que hoy llevan su nombre, tratando de manera general las estrategias mixtas y demostrando que cualquier juego con un número finito de estrategias tiene al menos un equilibrio de Nash en estrategias mixtas. Nash ganaría posteriormente un premio Nobel por la amplia gama de aplicaciones que tuvo este concepto en diversas ramas de las ciencias.
Posteriormente se encontraron algunos casos en los que los equilibrios de Nash no llevaban a predicciones totalmente adecuadas para los comportamientos de los jugadores, o comportamientos estables que no se podían encontrar como equilibrios de Nash, lo que dio paso a la búsqueda y desarrollo de nuevos equilibrios (muchas veces como refinamientos de los equilibrios de Nash) y conceptos de solución de un juego..
Tipos de Juegos
JUEGOS BIPERSONALES DE SUMA CERO
En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante.
MATRIZ DE PAGO
La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j.
ESTRATEGIA MIXTA, VALOR ESPERADO
Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si en cada turno escoge al azar una acción para que cada acción se esté usando una fracción determinada del tiempo.
Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):
R = [a b c . . . ]
Con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1.
Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.
VALOR ESPERADO
El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por
e = RPC
El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificada por R y C después de un gran número de turnos.
CRITERIO MINIMAX, PRINCIPIOS FUNDAMENTALES DE LA TEORÍA DE JUEGOS
CRITERIO MINIMAX
Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante.
Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta tema muestra un método gráficamente para solucionar juegos 2×2. Para juegos generales, se puede usar el método simplex. Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo).
PRINCIPIOS FUNDAMENTALES DE LA TEORÍA DE JUEGOS
Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:
PUNTO DE SILLA, JUEGO ESTRICTAMENTE DETERMINADO
Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja las máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.
Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinados:
ESTRATEGIA ALEATORIA
Es aquella en donde el jugador renglón elige un renglón al azar, de acuerdo con cierta distribución de probabilidad.
Si el jugador renglón utiliza esta distribución de forma predecible, como cuando selecciona repetidamente el renglón 1 dos veces y luego el renglón 2 una vez, el jugador columna podría descubrir la estrategia de responder con el fin de reducir al mínimo su eficacia. Por lo tanto, el jugador renglón debe emplear algún dispositivo aleatorio, como la rueda giratoria que se mostro anteriormente (ruleta de pueblo), con el cual elegiría 1 dos terceras partes del tiempo.
Los juegos de punta de silla están estrictamente determinados; es decir, los jugadores adoptan estrategias puras, y el curso del juego se determina por adelantado (suponiendo que los jugadores son agresivos y capaces). Los juegos sin punto de silla no están estrictamente determinados; si un jugador emplea una estrategia aleatoria, el curso del juego estará sujeto al azar, y todo puede suceder. No hay valor fijo para el juego; solo hay un valor muy probable o esperado.
JUEGOS NO ESTRICTAMENTE DETERMINADOS
Esta clase de juegos tiene más de una alternativa de juego por la que los jugadores podrían ganar, por lo que no están obligados a siempre jugar con la misma estrategia, no presentan un punto silla por que el número menor de todos los máximos de las columnas no es igual al número mayor de los menores de los renglones, dando como resultado un juego no estrictamente determinado.
EJEMPLO:
Formulación de juegos de dos personas con suma cero
Para ilustrar las características básicas de un modelo de teoría de juegos, considérese el juego llamado pares y nones. Éste consiste nada más en que los dos jugadores muestran al mismo tiempo uno o dos dedos. Si el número de dedos coincide, el jugador que apuesta a pares (por ejemplo, el jugador 1) gana la apuesta (digamos $l) al jugador que va por nones (jugador II). Si el número no coincide, el jugador 1 paga $l al jugador II.
En general, un juego de dos personas se caracteriza por:
1. Las estrategias del jugador I.
2. Las estrategias del jugador II.
3. La matriz de pagos.
Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente y la matriz de pagos. Una jugada real en el juego consiste en que los dos jugadores elijan al mismo tiempo una estrategia sin saber cuál es la elección de su oponente.
Una estrategia puede constituir una acción sencilla, como mostrar un número par o non de dedos en el juego de pares y nones. Por otro lado, en juegos más complicados que llevan en sí una serie de movimientos, una estrategia es una regla predeterminada que especifica por completo cómo se intenta responder a cada circunstancia posible en cada etapa del juego. Por ejemplo, una estrategia de un jugador de ajedrez indica cómo hacer el siguiente movimiento para todas las posiciones posibles en el tablero, de manera que el número total de estrategias posibles sería astronómico. Las aplicaciones de la teoría de juegos involucran situaciones competitivas mucho menos complicadas que el ajedrez pero las estrategias que se manejan pueden llegar a ser bastante complejas.
Por lo general, la matriz de pagos muestra la ganancia (positiva o negativa) que resultaría con cada combinación de estrategias para el jugador 1. Se da de esta manera, ya que la matriz del jugador II es el negativo de ésta, debido a la naturaleza de la suma cero del juego.
Los elementos de la matriz pueden tener cualquier tipo de unidades, como dólares, siempre que representen con exactitud la utilidad del jugador 1 en el resultado correspondiente. Debe hacerse hincapié en que la utilidad no necesariamente es proporcional a la cantidad de dinero (o cualquier otro bien) cuando se manejan cantidades grandes. Por ejemplo, para una persona pobre $2 millones (después de impuestos) tal vez vale mucho más que el doble de $1 millón. En otras palabras, si a una persona se le da a elegir entre: 1) recibir, con el 50% de posibilidades, $2 millones en lugar de nada y 2) recibir $1 millón con seguridad, ese individuo tal vez prefiriera este último. Por otro lado, el resultado que corresponde a un elemento 2 en una matriz de pagos debe "valer el doble" para el jugador 1 que el resultado correspondiente a un elemento 1. Así, dada la elección, debe serle indiferente un 50% de posibilidades de recibir el primer resultado (en lugar de nada) y recibir en definitiva el último resultado.
Un objetivo primordial de la teoría de juegos es establecer criterios racionales para seleccionar una estrategia, los cuales implican dos suposiciones importantes:
1. Ambos jugadores son racionales.
2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin compasión para el oponente).
La teoría de juegos se contrapone al análisis de decisión, en donde se hace la suposición de que el tomador de decisiones está jugando un juego contra un oponente pasivo, la naturaleza, que elige sus estrategias de alguna manera aleatoria.
Se desarrollará el criterio estándar de teoría de juegos para elegir las estrategias mediante ejemplos ilustrativos. En particular, a continuación se presenta un ejemplo prototipo que ilustra la formulación de un juego y su solución en algunas situaciones sencillas. Después se desarrollará una variación más complicada de este juego para obtener un criterio más general.
En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante.
MATRIZ DE PAGO
La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j.
ESTRATEGIA MIXTA, VALOR ESPERADO
Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si en cada turno escoge al azar una acción para que cada acción se esté usando una fracción determinada del tiempo.
Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):
R = [a b c . . . ]
Con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1.
Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.
VALOR ESPERADO
El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por
e = RPC
El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificada por R y C después de un gran número de turnos.
CRITERIO MINIMAX, PRINCIPIOS FUNDAMENTALES DE LA TEORÍA DE JUEGOS
CRITERIO MINIMAX
Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante.
Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta tema muestra un método gráficamente para solucionar juegos 2×2. Para juegos generales, se puede usar el método simplex. Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo).
PRINCIPIOS FUNDAMENTALES DE LA TEORÍA DE JUEGOS
Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:
- Cada jugador hace la acción mejor posible.
- Cada jugador sabe que su contrincante está también haciendo la acción mejor posible.
PUNTO DE SILLA, JUEGO ESTRICTAMENTE DETERMINADO
Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja las máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.
Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinados:
- Todos los puntos de silla en un juego tienen los mismos valores de pago.
- Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.
ESTRATEGIA ALEATORIA
Es aquella en donde el jugador renglón elige un renglón al azar, de acuerdo con cierta distribución de probabilidad.
Si el jugador renglón utiliza esta distribución de forma predecible, como cuando selecciona repetidamente el renglón 1 dos veces y luego el renglón 2 una vez, el jugador columna podría descubrir la estrategia de responder con el fin de reducir al mínimo su eficacia. Por lo tanto, el jugador renglón debe emplear algún dispositivo aleatorio, como la rueda giratoria que se mostro anteriormente (ruleta de pueblo), con el cual elegiría 1 dos terceras partes del tiempo.
Los juegos de punta de silla están estrictamente determinados; es decir, los jugadores adoptan estrategias puras, y el curso del juego se determina por adelantado (suponiendo que los jugadores son agresivos y capaces). Los juegos sin punto de silla no están estrictamente determinados; si un jugador emplea una estrategia aleatoria, el curso del juego estará sujeto al azar, y todo puede suceder. No hay valor fijo para el juego; solo hay un valor muy probable o esperado.
JUEGOS NO ESTRICTAMENTE DETERMINADOS
Esta clase de juegos tiene más de una alternativa de juego por la que los jugadores podrían ganar, por lo que no están obligados a siempre jugar con la misma estrategia, no presentan un punto silla por que el número menor de todos los máximos de las columnas no es igual al número mayor de los menores de los renglones, dando como resultado un juego no estrictamente determinado.
EJEMPLO:
Formulación de juegos de dos personas con suma cero
Para ilustrar las características básicas de un modelo de teoría de juegos, considérese el juego llamado pares y nones. Éste consiste nada más en que los dos jugadores muestran al mismo tiempo uno o dos dedos. Si el número de dedos coincide, el jugador que apuesta a pares (por ejemplo, el jugador 1) gana la apuesta (digamos $l) al jugador que va por nones (jugador II). Si el número no coincide, el jugador 1 paga $l al jugador II.
En general, un juego de dos personas se caracteriza por:
1. Las estrategias del jugador I.
2. Las estrategias del jugador II.
3. La matriz de pagos.
Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente y la matriz de pagos. Una jugada real en el juego consiste en que los dos jugadores elijan al mismo tiempo una estrategia sin saber cuál es la elección de su oponente.
Una estrategia puede constituir una acción sencilla, como mostrar un número par o non de dedos en el juego de pares y nones. Por otro lado, en juegos más complicados que llevan en sí una serie de movimientos, una estrategia es una regla predeterminada que especifica por completo cómo se intenta responder a cada circunstancia posible en cada etapa del juego. Por ejemplo, una estrategia de un jugador de ajedrez indica cómo hacer el siguiente movimiento para todas las posiciones posibles en el tablero, de manera que el número total de estrategias posibles sería astronómico. Las aplicaciones de la teoría de juegos involucran situaciones competitivas mucho menos complicadas que el ajedrez pero las estrategias que se manejan pueden llegar a ser bastante complejas.
Por lo general, la matriz de pagos muestra la ganancia (positiva o negativa) que resultaría con cada combinación de estrategias para el jugador 1. Se da de esta manera, ya que la matriz del jugador II es el negativo de ésta, debido a la naturaleza de la suma cero del juego.
Los elementos de la matriz pueden tener cualquier tipo de unidades, como dólares, siempre que representen con exactitud la utilidad del jugador 1 en el resultado correspondiente. Debe hacerse hincapié en que la utilidad no necesariamente es proporcional a la cantidad de dinero (o cualquier otro bien) cuando se manejan cantidades grandes. Por ejemplo, para una persona pobre $2 millones (después de impuestos) tal vez vale mucho más que el doble de $1 millón. En otras palabras, si a una persona se le da a elegir entre: 1) recibir, con el 50% de posibilidades, $2 millones en lugar de nada y 2) recibir $1 millón con seguridad, ese individuo tal vez prefiriera este último. Por otro lado, el resultado que corresponde a un elemento 2 en una matriz de pagos debe "valer el doble" para el jugador 1 que el resultado correspondiente a un elemento 1. Así, dada la elección, debe serle indiferente un 50% de posibilidades de recibir el primer resultado (en lugar de nada) y recibir en definitiva el último resultado.
Un objetivo primordial de la teoría de juegos es establecer criterios racionales para seleccionar una estrategia, los cuales implican dos suposiciones importantes:
1. Ambos jugadores son racionales.
2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin compasión para el oponente).
La teoría de juegos se contrapone al análisis de decisión, en donde se hace la suposición de que el tomador de decisiones está jugando un juego contra un oponente pasivo, la naturaleza, que elige sus estrategias de alguna manera aleatoria.
Se desarrollará el criterio estándar de teoría de juegos para elegir las estrategias mediante ejemplos ilustrativos. En particular, a continuación se presenta un ejemplo prototipo que ilustra la formulación de un juego y su solución en algunas situaciones sencillas. Después se desarrollará una variación más complicada de este juego para obtener un criterio más general.