« MATH206 : Probabilités et Statistiques » : différence entre les versions
| Ligne 48 : | Ligne 48 : | ||
<math>\displaystyle \sigma'^2 = \frac{1}{Card(A)-1}\sum_{i \in A} (y_i - \overline y)^2</math> |
<math>\displaystyle \sigma'^2 = \frac{1}{Card(A)-1}\sum_{i \in A} (y_i - \overline y)^2</math> |
||
Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de X_1X_2 où X_1 et X_2 sont deux variables aléatoires obtenue à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise. |
Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de <math>X_1X_2</math> où <math>X_1</math> et <math>X_2</math> sont deux variables aléatoires obtenue à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise. |
||
==Un peu de dénombrement== |
==Un peu de dénombrement== |
||
Version du 21 janvier 2008 à 11:15
Vocabulaire de probabilité
- Population
- Sous-population, échantillon
- Partition
- Cardinal (Propriété)
- Fréquence (Propriété)
- Variable aléatoire et Série statistique
Estimateur ponctuel
- Moyenne et espérance (rappel et "sens")
Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population : La moyenn est le nombre x qui remplace le mieux pour l'ensemble de la population quand on regarde l'erreur quadratique donnée par la formule suivante (preuve facile en dérivant f):
Cette erreur est d'ailleurs liée à la variance V(X) car:
Rappel on a aussi Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle V(X) = E(X^2) - E(X)^2}
- Propriété de la moyenne (linéarité) E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)
- Définition d'estimateur et de biais
Un estimateur est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.
Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population (cela n'a guère se sens que sur les populations infinies ...)
Un estimateur pour P(X) est sans biais, si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \Omega} (notée Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \Omega^{(n)}} ).
- Estimateur de la moyenne : la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Si on note
- Estimateur de la variance (avec et sans remise) :
Si on note Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \sigma^2} la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais de la variance avec les formules suivantes:
Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle \frac{n}{n-1}\sigma^2} dans le cas de tirage avec remise de l'échantillon
Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle \frac{N-1}{N} \frac{n}{n-1}\sigma^2} dans le cas de tirage sans remise (qui vaut bien Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \sigma^2} lorque n = N).
On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle A \subset \Omega} la valeur appelée variance empirique de Y : Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle \sigma'^2 = \frac{1}{Card(A)-1}\sum_{i \in A} (y_i - \overline y)^2}
Remarque: pour faire le calcul pour l'estimateur de variance, le point principal est de calculer l'espérance de Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle X_1X_2} où Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle X_1} et Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle X_2} sont deux variables aléatoires obtenue à partir d'une variable aléatoire X en choisissant deux individus au hasard. On a besoin de faire ce calcul à la fois pour un choix de deux individus avec remise et sans remise.