« MATH206 : Probabilités et Statistiques » : différence entre les versions

De Wiki du LAMA (UMR 5127)
Aller à la navigation Aller à la recherche
Ligne 48 : Ligne 48 :
<math>\displaystyle \sigma'^2 = \frac{1}{Card(A)-1}\sum_{i \in A} (y_i - \overline y)^2</math>
<math>\displaystyle \sigma'^2 = \frac{1}{Card(A)-1}\sum_{i \in A} (y_i - \overline y)^2</math>


Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de <math>X_1X_2</math> où <math>X_1</math> et <math>X_2</math> sont deux variables aléatoires obtenue à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise.
Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de <math>X_1X_2</math> où <math>X_1</math> et <math>X_2</math> sont deux variables aléatoires obtenues à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise.


==Un peu de dénombrement==
==Un peu de dénombrement==

Version du 21 janvier 2008 à 11:16

Vocabulaire de probabilité

  • Population
  • Sous-population, échantillon
  • Partition
  • Cardinal (Propriété)
  • Fréquence (Propriété)
  • Variable aléatoire et Série statistique

Estimateur ponctuel

  • Moyenne et espérance (rappel et "sens")

Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population : La moyenn est le nombre x qui remplace le mieux pour l'ensemble de la population quand on regarde l'erreur quadratique donnée par la formule suivante (preuve facile en dérivant f):

Cette erreur est d'ailleurs liée à la variance V(X) car:

Rappel on a aussi

  • Propriété de la moyenne (linéarité) E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)
  • Définition d'estimateur et de biais

Un estimateur est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.

Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population (cela n'a guère se sens que sur les populations infinies ...)

Un estimateur pour P(X) est sans biais, si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de (notée ).

  • Estimateur de la moyenne : la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Si on note
  • Estimateur de la variance (avec et sans remise) :

Si on note la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais de la variance avec les formules suivantes:

dans le cas de tirage avec remise de l'échantillon

dans le cas de tirage sans remise (qui vaut bien lorque n = N).

On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon la valeur appelée variance empirique de Y :

Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de et sont deux variables aléatoires obtenues à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise.

Un peu de dénombrement

Probabilité et loi usuelle

Intervalle de confiance