« Modélisation de la ruine du joueur » : différence entre les versions

De Wiki du LAMA (UMR 5127)
Aller à la navigation Aller à la recherche
(Debut estimation temps moyen)
(Fin Estimation Durée)
Ligne 131 : Ligne 131 :
<math>
<math>
\begin{cases}
\begin{cases}
e_k = 1 + p \cdot e_{k+1} + q \cdot p_{k-1}, & \text{pour } 1 \leq k \leq a + b \\
e_k = 1 + p \cdot e_{k+1} + q \cdot e_{k-1}, & \text{pour } 1 \leq k \leq a + b \\
e_0 = 0, \\
e_0 = 0, \\
e_{a+b} = 0.
e_{a+b} = 0.
\end{cases}
\end{cases}
</math>
</math>

On note, pour <math> k \geq 1 , d_k = e_k - e_{k-1} </math>

On a donc la relation de récurence : <math> 0 = 1 + p \cdot d_{k+1} - q \cdot d_k </math>


====Pour p = 1/2 ====
====Pour p = 1/2 ====


On a <math> \frac{1}{2} \cdot d_{k+1} = \frac{1}{2} \cdot d_{k} - 1 </math>

donc, <math> d_{k+1} = d_k - 2 </math>

d'où <math> d_k = d_1 - 2 \left(k-1 \right) </math>

Alors pour <math> n \geq 1 , e_n = \sum_{k=1}^{n} d_k = n \cdot d_1 - 2 \cdot \sum_{k=0}^{n-1}k = n \cdot d_1 - 2 \cdot \frac{n(n-1)}{2} = n(d_1 - (n - 1)) </math>

Or <math> e_{a+b} = 0 = (a+b)(d_1 + (a + b - 1)), \text{d'où } d_1 = a + b - 1 </math>

Donc <math> E[T] = e_a = a(a + b - 1 - (a - 1)) = ab </math>
====Pour les autres probabilités====
====Pour les autres probabilités====

On pose le réel l qui verifie <math> 0 = pl - ql </math> qui est donc <math> l = \frac{1}{q-p} </math>

La relation devient donc <math> 0 = p(d_{k+1} - l) - q(d_k - l) </math>

Par conséquent, <math> d_{k+1} - l = \frac{q}{p}(d_k - l) , \text{et donc } d_k - l = \left( \frac{q}{p} \right) ^{k-1} (d_1 - l) </math>
Donc pour <math> n \geq 1 </math>, on a :

<math> e_n = \sum_{k=1}^{n}d_k + e_0 = \sum_{k=1}^{n} \left( l + \left( \frac{q}{p} \right) ^{k-1} \cdot (d_1 - l) \right) = nl + (d_1 - l) \cdot \sum_{k=0}^{n-1}\left( \frac{q}{p} \right) ^{k} = nl + (d_1 - l) \cdot \frac{1 - \left( \frac{q}{p} \right) ^{n}}{1 - \frac{q}{p}}</math>

Or <math> e_{a+b} = 0 = (a+b)l + (d_1 - l) \cdot \frac{1 - \left( \frac{q}{p} \right) ^{a+b}}{1 - \frac{q}{p}} \text{par conséquent :} \frac{d_1 - l}{1 - \frac{q}{p}} = -\frac{(a+b)l}{1 - \left( \frac{q}{p} \right) ^{a+b} }</math>

Donc <math> E[T] = e_a = al - \left( 1 - \left( \frac{q}{p} \right)^{a} \right) \cdot \frac{(a+b)l}{1 - \left( \frac{q}{p} \right) ^{a+b}} = \frac{1}{q-p} \cdot \left( a - (a+b) \cdot \frac{1 - \left( \frac{q}{p} \right) ^{a} }{1 - \left( \frac{q}{p} \right) ^{a+b} } \right) = \frac{(a+b)p-a}{p-q} </math>


==Simulation d'une partie==
==Simulation d'une partie==

Version du 14 mai 2024 à 19:59

Modélisation de la ruine du joueur

Nous nous intéressons à l'étude des gains d'un joueur lors d'une soirée au casino, dans lequel le joueur joue à la roulette russe.

Le joueur commence avec une somme initiale comprise entre 0 et la somme souhaitée, le joueur s'arrête uniquement si :

  - il obtient la somme souhaitée 
  - le joueur est ruiné (la somme est égale à 0)

Pour cela le joueur va jouer à la roulette en misant à chaque fois 1 jeton qu'il peut doubler ou perdre.

Estimations numériques

Notre objectif est de trouver de :

- calculer la probabilité de victoire, soit d'atteindre la somme souhaitée, en partant de la somme de départ.
- calculer la durée de la partie, soit le joueur arrête de jouer, donc il atteint l'une des conditions d'arrêt.

On définit de manière générale p la probabilité de victoire d'une partie et q = (1-p)

Estimation de la probabilité de gagner

On veut trouver une formule qui permet de trouver la probabilité de victoire lors d'une soirée au casino selon les paramètres de départs, soit la somme de départ et la somme voulue et la probabilité de victoire.

On commence avec la loi de probabilité totale :

Ce qui donne le système suivant :

On cherche l'équation quadratique :

On a l'équation :

On remplace par  :

On divise par  :

On résoult l'équation

Pour p = 1/2

Ca qui donne la solution unique :

On en déduit les valeurs  :

On a donc formule suivante :

Pour les autres probabilités

Ce qui donne les solutions :

On a alors :


On en déduit les valeurs  :

On obtient :

D'où :

On a donc formule suivante :

Estimation du temps moyen de jeu

Ce qui donne l'équation :

On note, pour

On a donc la relation de récurence :

Pour p = 1/2

On a

donc,

d'où

Alors pour

Or

Donc

Pour les autres probabilités

On pose le réel l qui verifie qui est donc

La relation devient donc

Par conséquent,

Donc pour , on a :

Or

Donc

Simulation d'une partie

Afin de modéliser la ruine du joueur on peut utiliser ce programme python :

...