« MATH206 : Probabilités et Statistiques » : différence entre les versions

De Wiki du LAMA (UMR 5127)
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Ligne 6 : Ligne 6 :
==Vocabulaire de probabilité==
==Vocabulaire de probabilité==


* ''' Population ''' : Groupe d'objets étudiés. Elle peut-être :
* Population
**"réelle" : les Français, les étudiants de ce cours...
* Sous-population, échantillon
** "virtuelle" : l'ensemble des lancés de dés possibles...
* Partition
* '''Sous-population, échantillon '''
* Cardinal (Propriété)
* '''Expérience ''' : Choisir un élément dans une population.
* Fréquence (Propriété)
* '''Evénement''' : L'événement se produit lorsque l'élément appartient à la sous-population.
* Variable aléatoire et Série statistique
* '''Partition ''' : Découpage d'un ensemble en plusieurs sous-ensembles disjoints.
* '''Cardinal ''' : Nombre d'éléments d'un ensemble.
* '''Fréquence ''' d'un sous ensemble A &sub; &Omega; : <math> F(A)=\frac{\displaystyle {card(A)}}{\displaystyle{card}(\Omega)} </math>
* '''Variable aléatoire ''' et ''' Série statistique ''' : Application d'une population &Omega; dans un ensemble X quelconque.


==Estimateur ponctuel==
==Estimateur ponctuel==


* Moyenne et espérance (rappel et "sens")
* '''Moyenne ''' et '''espérance''' (rappel et "sens")
Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population <math>\Omega</math>:
Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population <math>\Omega</math>:
<math>\displaystyle M(X) = E(X) = \frac{\sum_{i \in \Omega} X_i}{Card(\Omega)}</math>
<math>\displaystyle M(X) = E(X) = \frac{\sum_{i \in \Omega} X_i}{Card(\Omega)}</math>
La moyenn est le nombre x qui remplace le mieux <math>X_i</math> pour l'ensemble de la population quand on regarde l'erreur quadratique
La moyenne est le nombre x qui remplace le mieux <math>X_i</math> pour l'ensemble de la population quand on regarde l' '''erreur quadratique'''
donnée par la formule suivante (preuve facile en dérivant f):
donnée par la formule suivante (preuve facile en dérivant f):
<math>\displaystyle f(x) = \sum_{i \in \Omega} (X_i - x)^2</math>
<math>\displaystyle f(x) = \sum_{i \in \Omega} (X_i - x)^2</math>


On définit deux types d'erreurs :
Cette erreur est d'ailleurs liée à la variance V(X) car:
# ''' l'erreur absolue ''' : <math> \mid X_i -xi \mid </math>
# ''' l'erreur quadratique ''' : <math> (X_i -x)^2 </math>

L'erreur quadratique est aussi liée à la variance V(X) car:


<math>\displaystyle V(X) = \frac{\sum_{i \in \Omega} (X_i - E(X))^2}{Card(\Omega)} = \frac{f(E(x))}{Card(\Omega)}</math>
<math>\displaystyle V(X) = \frac{\sum_{i \in \Omega} (X_i - E(X))^2}{Card(\Omega)} = \frac{f(E(x))}{Card(\Omega)}</math>


Rappel on a aussi <math>V(X) = E(X^2) - E(X)^2</math>
''Rappel'' : On a aussi <math>V(X) = E(X^2) - E(X)^2</math>


* Propriété de la moyenne (linéarité) E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)
* Propriété de la moyenne (linéarité) : E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)


* Définition d'estimateur et de biais
* Définition d'estimateur et de biais :


Un estimateur est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.
Un '''estimateur''' est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.


Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population
Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population
(cela n'a guère se sens que sur les populations infinies ...)
(cela n'a guère se sens que sur les populations infinies ...)


Un estimateur pour P(X) est sans biais, si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de <math>\Omega</math> (notée <math>\Omega^{(n)}</math>).
Un estimateur pour P(X) est '''sans biais''', si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de <math>\Omega</math> (notée <math>\Omega^{(n)}</math>).

**<u> Estimateur de la moyenne :</u> la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Soit A={1;...;n} l'échantillon, <math>e(X)=\frac{\sum_{i \in A} X_i}{n} </math>

<u>Démonstration :</u>
<math> E ( \frac{\sum_{i \in A} X_i}{n} ) = \frac{1}{n} E(\sum_{i \in A} X_i)= \frac{1}{n} \sum_{i \in A} E(X_i)=\frac{1}{n} X n E(X) =E(X) </math>


* Estimateur de la moyenne : la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Si on note


* Estimateur de la variance (avec et sans remise) :
** <u> Estimateur de la variance (avec et sans remise) :</u>


Si on note <math>\sigma^2</math> la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais
Si on note <math>\sigma^2</math> la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais
Ligne 49 : Ligne 61 :


<math>\displaystyle \frac{N-1}{N} \frac{n}{n-1}\sigma^2</math> dans le cas de tirage sans remise (qui vaut bien <math>\sigma^2</math> lorque n = N).
<math>\displaystyle \frac{N-1}{N} \frac{n}{n-1}\sigma^2</math> dans le cas de tirage sans remise (qui vaut bien <math>\sigma^2</math> lorque n = N).
<u>Démonstration :</u>
'' Rappel préalable : '' <math> V(X)=E( (X-E(X))^2)= E (X^2 -2XE(X)+E(X)^2)=E(X^2)-2E(X)E(X)+E(x)^2=E(X^2)-E(X)^2 </math>
'' Calcul préalable : '' Soit X une variable aléatoire sur &Omega, soient X<sub>1</sub> et X<sub>2</sub> deux variables aléatoires.
** avec remise : <math> E(X_1X_2)= \frac{1}{N^2} \left( \sum_{i,j \in \Omega} X_iX_j \right)=E(X)^2 </math>
** sans remise : <math> E(X_1X_2)=\frac{\sum_{i,j \in \Omega ; i \neq j }X_iX_j}{N(N-1)} = \frac{\sum_{i,j \in \Omega}X_iX_j - \sum_{i \in \Omega}X_i^2}{N(N-1)}=\frac{ \left( \sum_{i \in \Omega} X_i \right) ^2 - \sum_{i \in \Omega }X_i^2}{N(N-1)}= E(X)^2 \frac{N}{N-1} - \frac{E(X^2)}{N-1}</math>
Soit &Omega; une population de taille N, soit X une variable aléatoire sur &Omega;, on s'intéresse aux échantillons de taille n. On a V(x) variance de la population et <math>\sigma^2</math> la variance d'un échantillon A de taille n.
<math> \sigma^2 (A)=\frac{\sum_{i \in A} \left( X_i- \frac{\sum_{i \in A}X_i}{n} \right) ^2}{n}= \frac{n-1}{n} \sum_{i \in A} (X_i^2) - \frac{\sum_{i \neq j \in A} X_iX_j}{n^2}</math> D'où
<math> E(\sigma^2(A))=\frac{n-1}{n^2} \sum_{i \in A} E(X_i^2) - \frac{1}{n^2} \sum_{i \neq j \in A} E(X_iX_j)= \frac{n-1}{n} E(X^2) - \frac{n-1}{n} E(X_1X_2)</math>
** avec remise : <math> E(\sigma^2(A))= \frac{n-1}{n} (E(X^2) - E(X)^2)= \frac{n-1}{n} V(X) </math>
** sans remise : <math> E(\sigma^2(A))= \frac{n-1}{n} (E(X^2) - E(X)^2 \frac{N}{N-1} + \frac{E(X^2)}{N-1})= \frac{n-1}{n} \frac{N}{N-1}V(X) </math>


On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon <math>A \subset \Omega</math> la valeur appelée variance empirique de Y :
On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon <math>A \subset \Omega</math> la valeur appelée variance empirique de Y :

Version du 28 janvier 2008 à 22:29

Feuilles de TD : 1 2


Vocabulaire de probabilité

  • Population  : Groupe d'objets étudiés. Elle peut-être :
    • "réelle" : les Français, les étudiants de ce cours...
    • "virtuelle" : l'ensemble des lancés de dés possibles...
  • Sous-population, échantillon
  • Expérience  : Choisir un élément dans une population.
  • Evénement : L'événement se produit lorsque l'élément appartient à la sous-population.
  • Partition  : Découpage d'un ensemble en plusieurs sous-ensembles disjoints.
  • Cardinal  : Nombre d'éléments d'un ensemble.
  • Fréquence d'un sous ensemble A ⊂ Ω :
  • Variable aléatoire et Série statistique  : Application d'une population Ω dans un ensemble X quelconque.

Estimateur ponctuel

  • Moyenne et espérance (rappel et "sens")

Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population : La moyenne est le nombre x qui remplace le mieux pour l'ensemble de la population quand on regarde l' erreur quadratique donnée par la formule suivante (preuve facile en dérivant f):

On définit deux types d'erreurs :

  1. l'erreur absolue  :
  2. l'erreur quadratique  :

L'erreur quadratique est aussi liée à la variance V(X) car:

Rappel : On a aussi

  • Propriété de la moyenne (linéarité) : E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)
  • Définition d'estimateur et de biais :

Un estimateur est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.

Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population (cela n'a guère se sens que sur les populations infinies ...)

Un estimateur pour P(X) est sans biais, si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de (notée ).

    • Estimateur de la moyenne : la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Soit A={1;...;n} l'échantillon,
         Démonstration :
         


    • Estimateur de la variance (avec et sans remise) :

Si on note la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais de la variance avec les formules suivantes:

dans le cas de tirage avec remise de l'échantillon

dans le cas de tirage sans remise (qui vaut bien lorque n = N).

         Démonstration :
          Rappel préalable :  
          Calcul préalable :  Soit X une variable aléatoire sur &Omega, soient X1 et X2 deux variables aléatoires.
         ** avec remise : 
         ** sans remise : 
         Soit Ω une population de taille N, soit X une variable aléatoire sur Ω, on s'intéresse aux échantillons de taille n. On a V(x) variance de la population et  la variance d'un échantillon A de taille n.
          D'où
         
         ** avec remise : 
         ** sans remise : 

On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon la valeur appelée variance empirique de Y :

Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de et sont deux variables aléatoires obtenues à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise.

Un peu de dénombrement

  • Cardinal du produit cartésien : le produit des cardinaux.
  • Tirage sans ordre et sans remise de p parmi n, c-à-d nombre de parties à p éléments d'un ensemble à n éléments :
  • Tirage avec ordre et sans remise de p parmi n, c-à-d nombre de p-uplets d'un ensemble à n éléments (nombre d'injections de {1;...;p} dans un ensemble à n éléments) :
  • Tirage avec ordre et avec remise de p parmi n, c-à-d nombre de tirage avec remise et avec ordre de p-élemnts parmis n (nombre d'applications de {1;...;p} dans un ensemble à n éléments) :
  • Tirage sans ordre et avec remise de p parmi n :

Rappel des formules usuelles pour les coefficients binomiaux.

  • avec factoriel :
  • triangle de Pascal : et
  • Formule du binôme de Newton et applications comme .

Probabilité et lois usuelles

  • Probabilité (ou loi de probabilité) sur un ensemble : un nombre associé P(E) aux sous-ensembles d'un ensemble (pas toujours tous les sous-ensembles) tel que :
    • si
  • Évènements = Sous-ensemble. évènement certains, impossible, incompatible. Implication entre évènement et inégalité sur les probas.
  • Cas des ensembles finies et probabilité uniforme.
  • Loi image.
  • Lois discrètes usuelles
    • Loi indicatrice ou loi de Bernouiili
    • Loi de Pascal
    • Loi binomiale
    • Loi hypergéométrique
    • Loi de Poisson
  • Lois continus

Théorème de la limite centrale

Intervalle de confiance