miércoles, 24 de noviembre de 2010

El dilema del prisionero y la gestión de proyectos

Para cerrar este blog quisiera compartirles una presentación muy interesante que encontré sobre este tema. Aquí se mencionan con ejemplos practicos los temas que ya se han comentado en este sitio, si no quieren revisar todo el documento, les recomiendo a partir del slide 45.


De este tema podemos obtener información interesante tal como "la gestión de conflictos" y "la negociación efectiva".

Realmente espero que la información de este tema les sea de utilidad. Muchas gracias!

lunes, 15 de noviembre de 2010

Matriz de Pagos

Dentro del Dilema del Prisionero es muy común escuchar el término "matriz de pagos". Veamos en que consiste:

Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.


Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.

En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general.



La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está señalado en la matriz mediante un asterisco.

El dilema del prisionero fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias reactivas.

domingo, 7 de noviembre de 2010

Video "El dilema del Prisionero: Cooperación"

Este video nos da una explicación interesante sobre el tema. Espero que puedan consultarlo:
http://www.dailymotion.com/video/x8e3sh_el-dilema-de-prisionero-cooperacion_school

Toma y Daca (tit for tat)

En la primera entrada del blog menciono el "dilema del prisionero iterado", para esta teoría existe una estrategía llamada "toma y daca". Veamos en que consiste.

El Toma y daca (Tit for tat en su expresión original en inglés) es una estrategia óptima en teoría de juegos para el dilema del prisionero iterado.
La expresión inglesa tit for tat significa "represalia equivalente" (toma y daca, tanto "tit" como "tat" son golpes suaves, por lo que vendría a decir "golpea suavemente al que te ha golpeado suavemente").
En ella, un agente que use esta estrategia responderá consecuentemente a la acción previa del oponente. Si el oponente ha cooperado previamente, el agente cooperará. Si el oponente deserta, el agente se vengará de él.
Esta estrategia depende de cuatro condiciones:
  1. El agente siempre colabora, a menos que sea provocado con una deserción
  2. El agente se vengará ante cualquier deserción
  3. El agente perdona fácilmente una vez que se ha vengado
  4. El agente debe tener una probabilidad mayor de 2/3 de jugar de nuevo contra el mismo oponente
Robert Axelrod organizó un concurso para encontrar una estrategia válida para el dilema del prisionero iterado. Se jugaría un torneo con 200 rondas por partida, y el programa con mayor puntuación sería el ganador.
Entre los 14 participantes, Anatol Rapoport presentó un programa que consistía en 4 líneas en BASIC, y al que llamó Toma y daca. Sólo tenía dos reglas:
  1. Comenzar colaborando
  2. Hacer lo que tu oponente hizo la ronda anterior
Era la más sencilla de todas las estrategias presentadas, y fue la que obtuvo la puntuación más alta.

Fuente: wikipedia

¿Qué el "El Dilema del Prisionero"?

Dos hombres acusados de infringir conjuntamente la ley han sido confinados por la policía en habitaciones separadas, o sea, que cada prisionero está aislado y no puede hablar con el otro. Se dice a cada uno por separado que:
1.- Si uno de ellos se confiesa culpable, pero el otro no, el primero recibirá una recompensa y el segundo será castigado.
2.- Si ambos confiesan se castigará a los dos.
3.- Si ninguno confiesa, ambos quedarán libres.
Hay dos opciones: confesar o no confesar. Las llamaremos técnicamente cooperación o deserción. El problema se reduce a decidir qué opción debemos tomar.

Generar un problema de tipo “dilema del prisionero” no es difícil. Basta una situación en la que uno puede mejorar sus intereses pero que, si todo el mundo hiciera lo mismo, sería un desastre.

Este ejemplo sólo tiene dos jugadores, pero puede haber más. Por ejemplo: colarse en el transporte público. Si, aprovechando que nadie nos ve, nos podemos colar (en el mundo real, quien se cuela lo hace con total impunidad, pero eso es otro problema), ¿lo hacemos o no? Si lo hacemos, nos ahorramos el precio del trayecto, pero si lo hiciera todo el mundo, el trasporte público quebraría y nadie podría utilizarlo. Un viajero que se cuele no influye en absoluto, pero si todo el mundo lo hiciera…

Otro ejemplo: hemos abollado un coche y la reparación costará mucho dinero. ¿Dejamos una nota conforme hemos sido nosotros? Si lo hacemos, acarrearemos con las consecuencias; si no, la reparación la pagará la compañía de seguros. Hay que pensar, sin embargo, que esto repercute en el incremento de tarifas de dichas compañías, que, a su vez, han de correr gastos adicionales. Pudiera ser, por ejemplo, que si lo pagamos nosotros nos costaría 1.000 euros y a la compañía 1.500.

sábado, 23 de octubre de 2010

Equilibrio de Nash

El concepto de equilibrio de Nash comienza su desarrollo con Antoine Augustin Cournot, y su trabajo sobre oligopolios (1838). En éste se plantea el modelo de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia. Cournot encuentra comportamientos de equilibrio para el juego, que coinciden con los equilibrios de Nash en estrategias puras.

Los equilibrios de Nash en estrategias puras son limitados en muchos aspectos y fue con el desarrollo de la teoría moderna de juegos que surgen los equilibrios en estrategias mixtas (aquellas donde los jugadores pueden elegir aleatoriamente entre varias estrategias). El concepto de equilibrio para este tipo de estrategias fue introducido por John von Neumann y Oskar Morgenstern en su libro The Theory of Games and Economic Behavior (1944), aunque sólo trataron los equilibrios para el caso especial de juegos de suma cero.

Fue John Forbes Nash quien en su tesis de doctorado (1951) define los equilibrios que hoy llevan su nombre, tratando de manera general las estrategias mixtas y demostrando que cualquier juego con un número finito de estrategias tiene al menos un equilibrio de Nash en estrategias mixtas. Nash ganaría posteriormente un premio Nobel por la amplia gama de aplicaciones que tuvo este concepto en diversas ramas de las ciencias.

Posteriormente se encontraron algunos casos en los que los equilibrios de Nash no llevaba a predicciones totalmente adecuadas para los comportamientos de los jugadores, o que existían comportamientos estables que no se podían encontrar como equilibrios de Nash, lo que dio paso a la búsqueda y desarrollo de nuevos equilibrios (muchas veces como refinamientos de los equilibrios de Nash) y conceptos de solución de un juego.

Fuente: Wikipedia

DILEMA DEL PRISIONERO

El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si en ello va el interes de ambas. Fue desarrollado originariamente por Merrill Flood y Melvin Dresher en 1950. Albert W. Tucker formalizó el juego con la frase sobre las recompensas penitenciarias y le dió el nombre del "dilema del prisionero".

Es un ejemplo de problema de suma no nula. Las técnicas de análisis de la teoría de juegos estándar, por ejemplo determinar el equilibrio de Nash, pueden llevar a cada jugador a escoger traicionar al otro, pero ambos jugadores obtendrían un resultado mejor si colaborasen.

En el dilema del prisionero iterado, la cooperación puede obtenerse como un resultado de equilibrio. Aquí se juega repetidamente, por lo que, cuando se repite el juego, se ofrece a cada jugador la oportunidad de castigar al otro jugador por la no cooperación en juegos anteriores. Así, el incentivo para defraudar puede ser superado por la amenaza del castigo, lo que conduce a un resultado cooperativo.


Fuente: wikipedia