« MATH206 : Probabilités et Statistiques » : différence entre les versions
| Ligne 44 : | Ligne 44 : | ||
<math>\displaystyle \frac{N-1}{N} \frac{n}{n-1}\sigma^2</math> dans le cas de tirage sans remise (qui vaut bien <math>\sigma^2</math> lorque n = N). |
<math>\displaystyle \frac{N-1}{N} \frac{n}{n-1}\sigma^2</math> dans le cas de tirage sans remise (qui vaut bien <math>\sigma^2</math> lorque n = N). |
||
On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon <math>A \subset \Omega</math> la valeur appelée variance empirique de Y : |
|||
<math>\displaystyle \sigma'^2 = \frac{1}{n-1}\sum_{i \in A} (y_i - \overline y)^2</math> |
|||
==Un peu de dénombrement== |
==Un peu de dénombrement== |
||
Version du 18 janvier 2008 à 08:54
Vocabulaire de probabilité
- Population
- Sous-population, échantillon
- Partition
- Cardinal (Propriété)
- Fréquence (Propriété)
- Variable aléatoire et Série statistique
Estimateur ponctuel
- Moyenne et espérance (rappel et "sens")
Formule de la moyenne (resp. espérance) d'une série statistique (resp. variable aléatore) X sur un population Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \Omega} : Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle M(X) = E(X) = \frac{\sum_{i \in \Omega} X_i}{Card(\Omega)}} La moyenn est le nombre x qui remplace le mieux Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle X_i} pour l'ensemble de la population quand on regarde l'erreur quadratique donnée par la formule suivante (preuve facile en dérivant f): Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle f(x) = \sum_{i \in \Omega} (X_i - x)^2}
Cette erreur est d'ailleurs liée à la variance V(X) car:
Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle V(X) = \frac{\sum_{i \in \Omega} (X_i - E(X))^2}{Card(\Omega)} = \frac{f(E(x))}{Card(\Omega)}}
Rappel on a aussi Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle V(X) = E(X^2) - E(X)^2}
- Propriété de la moyenne (linéarité) E(X + Y) = E(X) + E(Y) et E(aX) = aE(X)
- Définition d'estimateur et de biais
Un estimateur est une "formule" permettant de calculer un nombre à partir de la variable aléatoire restreinte à un échantillon.
Un estimateur estime un paramètre P(X) si il converge vers P(X) lorsque la taille de l'échantillon tend vers la taille de la population (cela n'a guère se sens que sur les populations infinies ...)
Un estimateur pour P(X) est sans biais, si son espérance est égale à P(X) lorsqu'on le considère comme une variable aléatoire sur la population des échantillons de taille n fabriquée à partir de Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \Omega} (notée Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \Omega^{(n)}} ).
- Estimateur de la moyenne : la moyenne sur l'échantillon est un estimateur sans biais de la moyenne sur la population entière. Si on note
- Estimateur de la variance (avec et sans remise) :
Si on note Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \sigma^2} la variance d'un échantillon de taille n dans une population de taille N, on obtient un estimateur sans biais de la variance avec les formules suivantes:
Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle \frac{n}{n-1}\sigma^2} dans le cas de tirage avec remise de l'échantillon
Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle \frac{N-1}{N} \frac{n}{n-1}\sigma^2} dans le cas de tirage sans remise (qui vaut bien lorque n = N).
On prend donc en général, pour estimateur sans biais de V(X) sur un échantillon Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle A \subset \Omega} la valeur appelée variance empirique de Y : Échec de l’analyse (SVG (MathML peut être activé via une extension du navigateur) : réponse non valide(« Math extension cannot connect to Restbase. ») du serveur « https://wikimedia.org/api/rest_v1/ » :): {\displaystyle \displaystyle \sigma'^2 = \frac{1}{n-1}\sum_{i \in A} (y_i - \overline y)^2}