MATH206 : Probabilités et Statistiques

De Wiki du LAMA (UMR 5127)
Aller à la navigation Aller à la recherche

Vocabulaire de probabilité

  • Population
  • Sous-population, échantillon
  • Partition
  • Cardinal (Propriété)
  • Fréquence (Propriété)
  • Variable aléatoire et Série statistique

Estimateur ponctuel

  • Moyenne et espérance (rappel et "sens")

Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population : La moyenn est le nombre x qui remplace le mieux pour l'ensemble de la population quand on regarde l'erreur quadratique donnée par la formule suivante (preuve facile en dérivant f):

Cette erreur est d'ailleurs liée à la variance V(X) car:

Rappel on a aussi

  • Propriété de la moyenne (linéarité) E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)
  • Définition d'estimateur et de biais

Un estimateur est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.

Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population (cela n'a guère se sens que sur les populations infinies ...)

Un estimateur pour P(X) est sans biais, si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de (notée ).

  • Estimateur de la moyenne : la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Si on note
  • Estimateur de la variance (avec et sans remise) :

Si on note la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais de la variance avec les formules suivantes:

dans le cas de tirage avec remise de l'échantillon

dans le cas de tirage sans remise (qui vaut bien lorque n = N).

On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon la valeur appelée variance empirique de Y :

Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de et sont deux variables aléatoires obtenues à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise.

Un peu de dénombrement

  • Tirage sans ordre et sans remise de p parmi n, c-à-d nombre de parties à p éléments d'un ensemble à n éléments :
  • Tirage avec ordre et sans remise de p parmi n, c-à-d nombre de p-uplets d'un ensemble à n éléments (nombre d'injection de {1;...;p} dans un ensemble à n éléments) :
  • Tirage avec ordre et avec remise de p parmi n, c-à-d nombre de tirage avec remise et avec ordre de p-élemnts parmis n (nombre d'applications de {1;...;p} dans un ensemble à n éléments) : n^p

Probabilité et loi usuelle

Intervalle de confiance