Perdonare conviene? La matematica dice di sì (a volte)
- Francesco Scolz
- 16 lug
- Tempo di lettura: 4 min

In teoria dei giochi, esiste una strategia "migliore" delle altre?
Nel post precedente abbiamo visto come Tit for Tat (italianizzato in "occhio per occhio") riesca spesso a favorire la cooperazione nei giochi ripetuti. Inizia con fiducia, risponde con fermezza, e torna a cooperare se l'altro fa lo stesso.
Ma è davvero sempre efficace?
Nella realtà, anche le strategie più razionali possono essere ingannate, fraintese o sfruttate. E proprio per questo, nel tempo sono nate varianti più sofisticate. In questa seconda parte esploreremo perché essere buoni, a volte, non basta. Ma nemmeno esserlo a intermittenza. Serve una strategia più robusta, e più intelligente.
Consiglio vivamente la lettura del post precedente per una migliore esperienza
La strategia "Occhio per occhio" e le sue debolezze
Prima di tutto, un piccolo ripasso sulla strategia Tit for Tat: questa strategia replica ciò che ha fatto l'avversario nel turno precedente. Inizia cooperando, ma basta una sola defezione altrui per scatenare la vendetta immediata. Inoltre, se dovesse affrontare una sua copia ed uno dei due tradisse anche una sola volta, scatenerebbero una reazione a catena infinita poco efficente per giochi a somma non zero.
Può sembrare una strategia semplice, equa e vendicativa il giusto. Tuttavia in situazioni con più "rumore", più attori o strategie più sofisticate rischia di diventare obsoleta.
Possiamo pensarla nella realtà con due aziende competitor
La prima (blu) usa la strategia "Tit for Tat"
L'altra (rossa) si adatta di conseguenza
Entrambe hanno come obiettivo quello di massimizzare le vendite individuali, e NON prevalere sull'altro.
Le aziende non sanno le strategie adottate dall'altro, quindi possiamo definire l'ambiente ad informazione incompleta
Utilizzando lo schema della scorsa volta, possiamo simulare uno scenario plausibile:

Con questa strategia però, esistono almeno due casi in cui Tit for Tat perde di efficacia:
Se la seconda dovesse defezionare, la prima risponderà di conseguenza. Se la defezione iniziale fosse solo una tantum, le cose non cambiano di molto. Ma se la seconda dovesse replicare la risposta, allora inizia una spirale infinita di defezioni Ad ogni turno quindi, quando uno coopera, l'altro tradisce, risultando in un guadagno medio pari alla media tra la ricompensa per aver tradito (quadrante in basso a sinistra) e la ricompensa per esser stato tradito (quadrante in alto a destra) =3.5 punti ogni turno
Se dopo la prima defezione però, la seconda azienda decide di defezionare continuamente, pensando di sfruttare il perdono dell'altro, allora c'è la possibilità di arrivare ad una situazione sub-ottimale dove entrambi continuano a tradirsi a vicenda, risultando in una ricompensa fissa di 1 (quadrante in basso a destra) per ognuno =1 punto per turno
Altre strategie più sofisticate
Ma quindi, come possiamo formulare una strategia più adatta ad ambienti rumorosi che restituisca un ritorno elevato?
Per formulare la "strategia migliore", possiamo guardare alcune strategie più sofisticate, formulate negli anni, tra cui:
Tit for two tats: simile a Tit for Tat, ma risponde solo dopo esser stato tradito due volte di fila PRO: meno soggetto a rumore / più perdonativo CONTRO: a volte risulta troppo perdonativo, e può esser sfruttato da strategie alternative
Generous Tit for Tat: simile al cugino "Tit for Tat", questo replica la mossa precedente dell'avversario. Tuttavia, una volta ogni tanto, al posto di rispondere alla defezione deciderà di restare sulla cooperazione. La percentuale delle volte in cui perdona è variabile e può essere sia un valore costante, sia un valore dinamico che cambia con il tempo in base all'andamento del gioco PRO: più perdonativo CONTRO: se la percentuale di perdono è mal calibrata, può diventare troppo perdonativo, e quindi più sfruttabile, o troppo poco perdonativo, similmente alla versione più semplice
Win-Stay Lose-Shift: non direttamente un'evoluzione di Tit for Tat, ma comunque solida. Questa strategia mantiene la scelta quando vince (quadranti a sinistra), oppure cambia quando perde (quadranti a destra) PRO: costante ed autoadattivo CONTRO: anche una strategia semplice come "always defect" (defeziona sempre), porterebbe questa strategia ad un rendimento bassissimo (0.5 punti per turno)
La "strategia migliore" esiste?
Ma quindi, esiste una strategia che vada bene per tutto?
La risposta è no. Non esiste una strategia unica che sia la migliore in qualsiasi contesto
Sarebbe come pensare di prepararsi un solo schema di gioco nella pallacanestro e usarlo sempre pensando che sia il migliore in assoluto. Diverse squadre risponderanno diversamente agli stili di gioco, e con alcuni avversari sarà più difficile attuarlo che con altre.
Tit for Two tats può andare bene in un contesto rumoroso, ma una strategia come "defect then cooperate" (defeziona poi coopera) già lo manda in difficoltà
Generous Tit for Tat è più flessibile, ma impostare valori sbagliati lo può rendere troppo generoso (simile a Tit for Two Tats), o troppo rigido (come Tit for Tat)
Win-stay Lose-shift può essere usato per un rendimento costante, ma strategie più cattive potrebbero distruggere i piani
Inoltre, in teoria dei giochi esistono situazioni di tutti i tipi: quelli con interazioni ripetute, quelli con informazioni nascoste, quelli con più di due giocatori...
È quindi impossibile avere una sola strategia per ogni situazione: bisogna averne molteplici e scegliere in base all'ambiente, agli obiettivi ed al tipo di gioco
La prossima volta andremo a vedere giochi a più di 2 attori, aprendo le porte ad ancora più tattiche e strategie
Vedremo soggetti coalizzarsi? Fare la guerra? Oppure riusciranno a stabilire un equilibrio sano?
Alla prossima
Commenti