Perché è un vero Dilemma?
Questa non è una tavola inventata arbitrariamente. Per essere un autentico Dilemma del Prigioniero devono valere due condizioni matematiche precise:
T > R > P > S
Temptation (5) > Reward (3) > Punishment (1) > Sucker (0)
Ingannare è sempre localmente conveniente…
2R > T + S
2 × 3 = 6 > 5 + 0 = 5
…ma la fiducia reciproca batte qualsiasi media di sfruttamento.
La prima condizione crea il dilemma: in ogni singola tappa conviene sempre ingannare, qualunque cosa faccia il collega. La seconda condizione crea il valore della cooperazione iterata: se vi fidate reciprocamente per tutta la rotta, guadagnate più che ingannarvi a vicenda.
Questo è il cuore del problema: la logica di breve termine spinge verso l'inganno, ma la logica di lungo termine — e il fatto che vi rincontrerete molte volte — premia l'onestà.
Come leggere la cronaca del viaggio
Ogni tappa viene registrata con un'etichetta colorata:
OO
Entrambi onesti → 3🪙 ciascuno
OI
Tu onesto, lui imbroglione → 0🪙 a te
IO
Tu imbroglione, lui onesto → 5🪙 a te
II
Entrambi imbroglioni → 1🪙 ciascuno
I mercanti che incontrerai
All'inizio di ogni partita viene sorteggiato uno tra 30 possibili mercanti, ciascuno con un carattere diverso.
L'identità rimane nascosta fino all'ultima tappa. Solo alla fine del viaggio scoprirai con chi hai davvero trattato.
I mercanti provengono dal celebre Torneo di Axelrod (1984), il primo esperimento scientifico sul comportamento cooperativo nei giochi ripetuti.
I reciprocatori — rispondono con la stessa moneta
Tit for Tat
Inizia da onesto, poi copia esattamente l'ultima tua mossa. Il vincitore del I torneo di Axelrod.
Tit for Two Tats
Risponde solo se imbrogliato due volte di fila. Molto paziente.
Generous TFT
Come TFT ma perdona l'inganno con probabilità 1/3.
Forgiving TFT
TFT con 5% di probabilità di ignorare un inganno ricevuto.
Contrite TFT
Si "pente" subito se riconosce di aver reagito per sbaglio.
Adaptive TFT
Segue TFT ma si chiude se la lealtà media del collega scende sotto il 50%.
Dynamic Two TFT
Adatta la finestra di osservazione all'ostilità dell'ambiente.
Spiteful TFT
Al secondo inganno ricevuto, smette di fidarsi per sempre.
I punitori — proporzionali o implacabili
Gradual
Al k-esimo inganno risponde con k rifiuti, poi offre 2 gesti di pace.
Grudger
Onesto finché non viene ingannato una sola volta, poi chiude per sempre.
Soft Grudger
Risponde con 4 rifiuti e 2 riconciliazioni ad ogni inganno.
Fool Me Once
Perdona il primo inganno, al secondo chiude definitivamente.
First by Shubik
La punizione cresce: 1 rifiuto al primo inganno, 2 al secondo, ecc.
First by Davis
Onesto le prime 10 tappe senza condizioni, poi diventa Grudger.
Level Punisher
Risponde in proporzione al tasso di lealtà del collega.
Gli analisti — calcolano e modellano
Omega TFT
Tiene due registri: lealtà e instabilità del collega.
Revised Downing
Stima probabilisticamente il comportamento del collega e massimizza il guadagno atteso.
ZD-GTFT-2
Strategia Zero-Deterministica: manipola il valore atteso dell'avversario.
ZD-GEN-2
Variante ZD con surplus cooperativo derivato algebricamente.
Doubler
Si fida solo se gli scambi onesti ricevuti sono almeno il doppio degli inganni.
Memory Decay
I round recenti pesano esponenzialmente di più nella valutazione.
ShortMem
Considera solo gli ultimi 5 incontri per decidere.
I caratteri particolari
Pavlov
Ripete la mossa se l'esito fu buono, la cambia se fu cattivo.
Firm But Fair
Reagisce solo ai torti evidenti (payoff 0), ignora quelli marginali.
CAPRI
Onesto solo se nell'incontro precedente entrambi lo erano stati.
Once Bitten
Perdona solo dopo 3 scambi onesti consecutivi.
Resurrection
Se la lealtà del collega crolla sotto il 20%, offre improvvisamente la merce come reset.
Soft Joss
Quasi onesto, ma con il 10% di probabilità imbroglia anche dopo uno scambio leale.
Forgiver
Si chiude solo se gli inganni storici superano il 20% del totale.
Inverse Punisher
Punisce di più chi aveva cooperato di più — un paradosso deliberato.
GrudgerAlternator
Dopo un inganno alterna rifiuto e offerta in modo imprevedibile.
Gli imbroglioni — sfruttatori e predatori
Prober
Sonda con C-D-D iniziali: se il collega non reagisce, imbroglia per sempre. Altrimenti diventa TFT.
Hard Prober
Versione ancora più aggressiva: inizia con D. Se il collega non risponde duramente, lo sfrutta fino alla fine.
Naive Prober
TFT con 10% di probabilità di imbrogliare spontaneamente anche dopo una tappa leale. Opportunista cronico.
Remorseful Prober
Come il Naive Prober, ma se il collega reagisce offre un gesto di scuse. Opportunista, non del tutto spietato.
Sneaky Tit for Tat
Sonda, poi sfrutta a intermittenza alternando C e D. Sa anche fingersi onesto quando conviene.
ZD-Extort-2
Strategia estortiva algebrica: forza il tuo guadagno ad essere il doppio di quello del collega in ogni scenario.
Hard Tit for Tat
Risponde a ogni inganno con due D consecutive. Il doppio della fermezza rispetto al TFT classico.
Backstabber
Costruisce fiducia cooperando onestamente per 18 tappe, poi imbroglia sistematicamente fino alla fine del viaggio.