« Dilemme du prisonnier » : différence entre les versions

Version du 21 mai 2019 à 16:52

Introduction

Le dilemme du prisonnier à été inventé en 1950 par Albert William Tucker et fait partie de la théorie des jeux qui est un domaine des mathématiques étudiant les interactions entre différents individus qui sont conscients ou non de ces interactions. Ils devront donc faire des choix dont ils sont conscients ou non lors de ces interactions.

Le dilemme du prisonnier

Les individus sont soumis dans le dilemme du prisonnier à une interaction où ils ont deux choix : soit ils coopèrent avec l’autre individu, soit ils le trahissent. Les individus sont récompensés selon la matrice des paiements suivante :

L’intérêt de la configuration actuelle de la matrice des Paiements actuelle est que les individus ont un intérêt certain à trahir l’autre mais que la coopération est la meilleur option pour les deux individus. On représente l’intérêt à trahir par rapport à la coopération par la variable B qui dans notre exemple est égale à 1,85.

Afin de simplifier notre modèle nous ne considérerons que deux comportements possibles qui sont :

-Le Croyant qui coopérera systématiquement

-Le Traître qui trahira systématiquement

Spatialisation du dilemme du prisonnier

L’idée de spatialiser le dilemme du prisonnier a été présenté dans par Nowak et May afin de modéliser la diffusion de certains comportements dans des populations en interaction. « The prisoners’ Dilemma is an interesting metaphor for the fundamental biological problem of how cooperative behaviour may evolve and be maintained »(Nowak,M.A. et May, R.M. 1992.Evolutionary games and spatial chaos) Ce model apporte un éclairage mathématique sur des questions liées à l’évolution comme l’apparition de comportements altruistes par exemple ou le maintien de la coopération dans des groupes sociaux. Ce model simple peux compléter celui du jeux de la vie (croissance en fonction des ressources) et celui de l’évolution (croisement et sélection) pour expliquer les équilibres écologiques.

Les prisonniers sont au voisinage de Moore (8 voisins) de telle sorte à ce que dans l’espace les voisins d’un prisonnier lambda soient disposés de la manière suivante :

1 2 3

4 P 5

6 7 8

L’espace dans lequel ils évoluent est un espace toroïdale (bordures ouvertes) en forme de carré de dimension n*n. On peut aussi le représenter comme une matrice carré avec les bordures qui communiquent entre elles.

À chaque tour les prisonniers vont jouer au dilemme du prisonnier avec chacun de leurs voisins. Ils obtiendront un score conformément à leurs choix et à la matrice des Paiements. Puis chacun leur tour mettre à jour leur stratégie en fonction du score des voisins.

Dans les prochaines images on affiche les prisonniers en fonction de leur stratégie actuelle et de leur dernière stratégie. Le code couleur est le suivant :

-en rouge les Traîtres qui l’ont été pendant 2 tours consécutifs

-en jaune les Croyants qui sont devenus Traîtres

-en vert les Traîtres devenus Croyants

-en bleu les Croyants qui l’ont été pendant 2 tours consécutifs

Une expérience intéressante

On propose dans cette partie de commencer à étudier un cas en particulier. Dans cette première expérience nous fixons B à 1,85 et plaçons un traître au milieu de croyants dans une grille de 301 par 301. Nous pensons que cette configuration donnera des résultats intéressants car B n'est pas assez grand pour permettre une domination complète des Traîtres ou pas assez petit pour permettre une domination complète des Croyants.

Après quelques tours de la simulation nous observons l'image suivante:

Nous pouvons voir grâce à la bordure verte que le carré de traîtres au centre de l'image est en train de rétrécir alors que dans les coins des îlots de traîtres apparaissent comme nous le montre la grand quantité de jaune.

Nous passons sous silence quelques tours pour arriver à la situation suivante:

Nous pouvons voir à présent que les comportements dans la simulation varient beaucoup comme témoignent l'abondance de prisonniers affichés en jaune et en vert.

Lors du déroulé de cette simulation nous avons pus récolter C qui est le rapport entre le nombre de croyants dans la matrice sur le nombre de prisonniers au total. Cette variable nous permettra de visualiser l'évolution du nombre de croyants dans la simulation rapidement. Nous allons maintenant montrer son évolution au court du temps dans la simulation.

Nous pouvons ainsi observer sur le graphique que C semble tendre vers environ 0.3 montrant de ce fait que la simulation est dominé par les traîtres mais que les croyants résistent tout de même. Les variations de C ne sont pas de ce que l'on observe sur le graphique et la simulation cycliques ce qui veut dire que même si le nombre de croyants semble à peut près stable il n'en reste pas moins fluctuant.

Automatisation des expériences

Nous avons pus observer une simulation particulière mais nous devons maintenant pouvoir faire des observations autres que visuelles car nous n’avons pas le temps de le faire pour toutes les expériences permisses par notre modèle. On n’as alors décidé donc de créer un objet dans le programme pour extraire les données des expériences et nous les résumées. Nous ne montrerons toutefois que les expériences que l’on juge intéressantes.

Nous voulons tout d'abord mesurer l'influence de B sur l'évolution d'une répartition aléatoire. Pour cela nous fixerons les paramètres suivants pour chaque simulation. Dans chaque simulation on aura systématiquement 10% de traîtres répartis aléatoirement parmi 90% de croyants. La dimension des matrices sera de 200*200. Nous ferons variez B entre 1.75 et 2.

Pour un B appartenant à [1.75;1.8[ On observe la simulation suivante au bout de 400 tours:

On observe des réseaux de traîtres interconnectés entre eux mais pouvant être indépendants avec une taille minimale d'un carré de 4 traîtres. On observe aussi des zones ou les prisonniers alternent entre traître et croyant, on les repères en cherchant les zones en jaune ou en vert.

Le graphique de l'évolution de C est le suivant:

Ce graphique nous permet d'affirmer que la simulation est à peut près stable car on observe toujours des petits chutes du nombre de croyants. C semble tendre par ailleurs vers 0.7.

Pour un B appartenant à [1.8;2[ On observe la simulation suivante au bout de 400 tours:

On observe une situation chaotique avec une majorité de Traîtres et des îlots de Croyants apparaissant et disparaissant au fur et à mesure de la simulation. On remarque aussi beaucoup de jaune et de verts sur les images cela nous montre que les comportements des prisonniers changent beaucoup.

Le graphique de l'évolution de C est le suivant:

Ce graphique nous montre que la simulation n'est pas stable mais que C se stabilise vers 0.3.

Il est aussi à noter que sur les images B est à 1.9 et que plus B tend vers 1.8, C se stabilise vers 0.4.

Pour un B supérieur à 2 On observe la simulation suivante au bout de 400 tours:

On observe que les traîtres occupent quasiment tout l'espace et que les croyants sont regroupés en îlots qui s'étendent et se rétrécissent périodiquement.

Le graphique de l'évolution de C est le suivant:

Ce graphique nous montre que la simulation est très stable et que C tend vers 0.02.

Améliorations à apporter

Nous n’avons pas exploré toutes les possibilités de notre modèle nous discuterons ici des améliorations à apporter à notre modèle.

La première des améliorations que nous pourrions apporter pourrait être l’introduction de comportements avec un historique des actions passées de leurs voisins. Cela nous permettrait d’avoir des stratégies plus complexes à étudier.

La deuxième amélioration que nous pourrions apporter serait une amélioration au niveau du code. On proposerait de faire en sorte d’avoir un objet Stratégie qui se passerait de prisonnier en prisonnier et grâce à la programmation objet on pourrait créer des Stratégies variées avec peu de changements dans la structure du programme.

Code Soure

Comme le notre code source est d'une longueur d'environ 1800 lignes on ne le mettra pas dans cette page web. Nous proposons néanmoins de le retrouver à l'adresse suivante

Sources

Lien vers le site du cormas

Lien vers l'article original

@@ Ligne 5 : / Ligne 5 : @@
 == Le dilemme du prisonnier ==
-Les individus sont soumis dans le dilemme du prisonnier à une interaction où ils ont deux choix : soit ils coopèrent avec l’autre individu, soit ils le trahissent. Les individus sont récompensés selon la matrice des Paiements suivante :
+Les individus sont soumis dans le dilemme du prisonnier à une interaction où ils ont deux choix : soit ils coopèrent avec l’autre individu, soit ils le trahissent. Les individus sont récompensés selon la matrice des paiements suivante :
 [[Fichier:Tableau matrice paiements.PNG]]

« Dilemme du prisonnier » : différence entre les versions

Version du 21 mai 2019 à 16:52

Sommaire

Introduction

Le dilemme du prisonnier

Spatialisation du dilemme du prisonnier

Une expérience intéressante

Automatisation des expériences

Améliorations à apporter

Code Soure

Sources

Menu de navigation

« Dilemme du prisonnier » : différence entre les versions

Version du 21 mai 2019 à 16:52

Introduction

Le dilemme du prisonnier

Spatialisation du dilemme du prisonnier

Une expérience intéressante

Automatisation des expériences

Améliorations à apporter

Code Soure

Sources

Menu de navigation

Rechercher

« Dilemme du prisonnier » : différence entre les versions