Accueilretour

Le dilemme du prisonnier

Sémantique

Logique

Infini

Mesure

Probas

Nombres

Physique

Pour changer, Filochard et Ribouldingue [1] se sont encore fait pincer. Filochard (F.) sait que s'il se tait alors que Ribouldingue (R.) avoue, il prendra 5 ans et R. sera libéré. Mais l'inverse est aussi vrai. Maintenant, si tout le monde avoue, le tarif sera de 4 ans, tandis que si chacun se tait ça fera 2 ans par tête. Bien sûr, chacun ignore la décision de l'autre. En résumé :


  F. avoue F. se tait
 R. avoue  4 ans
chacun
R. libre
 F : 5 ans 
R. se tait F. libre
 R : 5 ans 
2 ans
chacun
    (1)

F. réfléchit ainsi : "Si R. avoue, alors j'ai intérêt à avouer, puisque j'aurai 4 ans au lieu de 5. Mais si R. se tait, alors j'ai encore plus intérêt à avouer, car alors je serai libre." R. de son côté fait le même raisonnement. Chacun individuellement conclut donc qu'il a intérêt à avouer. Pourtant globalement la situation "F. et R. avouent" est plus défavorable pour les deux que "F. et R. se taisent". Il y a déjà paradoxe à ce niveau ; c'est le dilemme du prisonnier.

La situation se complique encore lorsqu'elle est itérée. Si F. se rappelle que R. l'avait trahi (en avouant), il pourrait être plus que tenté de trahir R. à son tour, au grand dam des deux si R. persiste. Alors le problème ne se pose plus en termes d'un choix ponctuel, mais d'une stratégie à adopter sur le long terme [2]. La question devient donc : quelle est "la meilleure stratégie possible (sur un grand nombre de choix)" ? C'est le dilemme du prisonnier itéré.

Une grande variété de stratégies ont été envisagées et soumises à étude. Cela va de méchante (toujours trahir, toujours avouer) à gentille (toujours coopérer, toujours se taire) en passant par donnant-donnant (reproduire le choix de précédent de l'autre) et beaucoup d'autres, aux noms poétiques.

On organise des "tournois" entre ces différentes stratégies, en leur attribuant des points en fonction de leurs résultats et des coefficients du tableau (1) (qui peuvent être modifiés, mais pas arbitrairement si l'on veut que le paradoxe subsiste).

Les résultats sont complexes. Par exemple méchante "ne perd jamais" lors d'une confrontation directe, mais accomplit alors un piètre score global. La stratégie donnant-donnant mérite une mention particulière. Elle ne gagne jamais dans une confrontation individuelle, mais se détache irrésistiblement lors des comparaisons d'ensemble.


Cette présentation du dilemme du prisonnier est adaptée d'après le livre de J.-P. Delahaye, Logique, informatique et paradoxes, Belin 1995, pp. 88 sq. On le consultera avec profit pour plus de détails sur ce sujet (notamment dans sa version itérée).


Notes

[1] deux des Pieds Nickelés... le troisième, Croquignol, a dû passer entre les mailles du filet.

[2] voire très long, en ce qui concerne nos deux héros malheureux -- mais on peut imaginer des situations se prêtant à une itération plus rapide.