N08.- PD-two-person-iterated

INFORMACIÓN

WHAT IS IT?
Este modelo es una versión repetida del dilema del prisionero. Si no está familiarizado con los conceptos básicos del dilema del prisionero, consulte el modelo PD Basic que se encuentra en la suite “Prisoner’s Dilemma”

HOW IT WORKS
El modelo PD Basic presenta un problema interesante: para minimizar el tiempo total en la cárcel, cooperaría con su pareja y permanecería en silencio y no confesaría. Sin embargo, la elección racional es declarar en contra de su pareja confesando. Si su pareja no confiesa, saldrá libre. Si tu pareja confiesa, irás a la cárcel por tres años, mucho mejor que los cinco que te habrías ganado si te hubieras negado a confesar. Desafortunadamente, tu pareja está en la misma posición. Actuando racionalmente, ambos estarán peor. El dilema se vuelve más interesante cuando sabes que volverás a interactuar con la persona.
Consideremos el caso en el que usted y un amigo son elegidos para un estudio de investigación para jugar al juego del dilema del prisionero; sólo que en lugar de que las recompensas sean años de cárcel, son dinero.
Los investigadores los separan a usted y a su amigo en habitaciones separadas, lo que permite que la comunicación se produzca solo a través de una computadora. Te dan una hoja con las reglas para el dilema del prisionero iterado, que dice lo siguiente: Este juego constará de un número indeterminado de rondas. Al final del juego, recibirá $ 1 por cada punto que haya ganado. En cada ronda, usted y su socio tendrán la oportunidad de ganar puntos eligiendo cooperar (C) o delatar (D). La comunicación se realizará únicamente a través de la computadora. El único mensaje que podrá transmitir es cooperar o delatar. Ninguna persona verá el mensaje de la otra hasta que ambos hayan elegido su acción.
Su recompensa para cada ronda estará determinada por las acciones de la siguiente manera: (Nota: esta forma de determinar su pago es lo opuesto al modelo PD Basic. En PD Basic, se le “otorgó” algo malo: tiempo en la cárcel. En este modelo, se le otorga algo bueno: dinero). Su socio tiene una matriz de pagos idéntica.

HOW TO USE IT
Botones
:
SETUP: comience a jugar el dilema del prisionero repetido. Si opta por poner a “off” el interruptor SELECT-COMPUTER-STRATEGY? antes de presionar este botón, la estrategia de la computadora se elegirá al azar en este momento.
PLAY ONCE: juega una sola ronda del dilema del prisionero con la estrategia que has seleccionado.
PLAY REPEATIDLY: juega repetidamente rondas del dilema del prisionero entre tú y la computadora. Puedes cambiar tu estrategia en cualquier momento. Si está a “on” el interruptor.
SELECT-COMPUTER-STRATEGY? , también puede cambiar la estrategia de la computadora en cualquier momento.
Interruptores:
SELECT-COMPUTER-STRATEGY?: Si está activado, puede seleccionar la estrategia de la computadora usando el selector correspondiente. Si está desactivado, la estrategia de la computadora se elegirá al azar de la lista de estrategias que se encuentra a continuación, excluyendo la “custom-strategy”.
DISPLAY-HISTORY?: Activa o desactiva la mensajería en el centro de comando.
HUMAN-STRATEGY: seleccione su estrategia de la lista a continuación.
Estrategias:
random” – cooperar o delatar al azar
cooperate” – cooperar siempre
defect” – delatar siempre
tit-for-tat” (ojo por ojo) – Si el oponente coopera en esta ronda, coopere en la siguiente. Si el oponente delata en esta ronda, delatar la siguiente ronda. Coopere inicialmente.
Tit-for-Two-Tats”: si el oponente coopera en esta ronda, coopere en la siguiente ronda. Si el oponente delata dos rondas seguidas, delatar la siguiente. Coopere inicialmente.
unforgiving” (implacable): coopere siempre a menos que el oponente se desvíe una vez. Ante la deserción del oponente, tome represalias delatando siempre.
custom-Strategy”: esta estrategia debe ser escrita por usted. Actualmente, el valor predeterminado es “tit-for-tat”.
Monitores:
HUMAN-SCORE: el total de puntos que ha ganado
COMPUTER-SCORE: el total de puntos que ha ganado la computadora
Gráfica:
AVERAGE SCORE : la puntuación promedio de usted y la computadora en cada ronda frente al número de iteraciones. Este es un buen indicador de lo bien que lo está haciendo en relación con el promedio máximo posible de $5 por ronda.

EXTENDEING THE MODEL
Incluso las estrategias más complejas de este modelo son relativamente simples. Seguro que puedes hacerlo mejor. Redefinir el procedimiento de CUSTOM-STRATEGY intentando desarrollar una estrategia que pueda obtener una puntuación más alta que las presentadas en el modelo o un jugador humano. Pruébelo contra las otras estrategias y contra usted mismo. Cuales son sus puntos fuertes? ¿Cuáles son sus debilidades? Intenta seguir mejorándolo.
Examine el modelo PD N-PERSON ITERATED

NETLOGO FEATURES
Tenga en cuenta el uso de la variable de turtle “label” para mostrar el puntaje promedio de cada tortuga en la vista del mundo Tenga en cuenta que el procedimiento set-action toma una entrada que debe proporcionarse cuando se llama al procedimiento.

RELATED MODELS
PD Básico, PD N-Persona Iterado, PD Básico Evolutivo

INTERFAZ