Comment taille de l'échantillon affecte erreur standard

La taille (n) D'un échantillon statistique affecte l'erreur-type pour cet échantillon. Car n est dans le dénominateur de la formule standard d'erreur, l'erreur-type diminue à mesure que n augmente. Il est logique que d'avoir plus de données donne moins de variation (en plus de précision) dans vos résultats.

Distributions de fois pour 1 travailleur, 10 travailleurs, et 50 travailleurs.
Distributions de fois pour 1 travailleur, 10 travailleurs, et 50 travailleurs.

Supposer X est le temps qu'il faut pour un employé de bureau à taper et envoyer une lettre de recommandation, et dire X a une distribution normale avec une moyenne de 10,5 minutes et l'écart type de 3 minutes. La courbe inférieure de la figure précédente montre la répartition des X, les temps individuels pour tous les employés de bureau dans la population. Selon la règle empirique, presque toutes les valeurs sont dans les 3 écarts-types de la moyenne (10,5) - entre 1,5 et 19,5.

Maintenant, prenez un échantillon aléatoire de 10 employés de bureau, de mesurer leur temps, et de trouver la moyenne,

image1.jpg


chaque fois. Répétez ce processus encore et encore, et représenter graphiquement tous les résultats possibles pour tous les échantillons possibles. La courbe du milieu de la figure montre l'image de la distribution d'échantillonnage de

image2.jpg

Notez qu'il est toujours centré à 10,5 (que vous attendiez), mais sa variabilité est à plus petite l'erreur-type dans ce cas est

image3.jpg

(un peu moins de 3 minutes, l'écart type des temps individuels).

En regardant la figure, les délais moyens pour les échantillons de 10 employés de bureau sont plus proches de la moyenne (10,5) que les temps individuels sont. Voilà parce que les temps moyens ne varient pas autant d'un échantillon à que temps individuels varient de personne à personne.

Maintenant, prenez tous les échantillons aléatoires possibles de 50 employés de bureau et de trouver leur désigne: la distribution d'échantillonnage est indiquée dans la courbe la plus haute dans la figure. L'erreur type de

image4.jpg

Vous pouvez voir le temps moyen pour 50 employés de bureau sont encore plus proche de 10,5 que ceux pour 10 employés de bureau. Par la règle empirique, presque toutes les valeurs se situent entre 10,5 - 3 (0,42) = 9,24 et 10,5 + 3 (0,42) = 11,76. Des échantillons plus importants ont tendance à être une réflexion plus précises de la population, donc leurs moyens de l'échantillon sont plus susceptibles d'être plus proche de la moyenne de la population - donc moins de variations.

Pourquoi avoir plus de précision autour de la moyenne importante? Parce que parfois vous ne savez pas la moyenne de population mais qui veulent déterminer ce qu'il est, ou au moins obtenir aussi près de lui que possible. Comment peux-tu faire ça? En prenant un échantillon aléatoire de la population et de trouver sa moyenne. Vous savez que votre moyenne de l'échantillon sera proche de la population réelle signifie si votre échantillon est grande, comme le montre la figure (en supposant que vos données sont collectées correctement).


» » » » Comment taille de l'échantillon affecte erreur standard