Comment utiliser le t-test pour manipuler des petits échantillons et écarts types inconnus

Lorsque vous utilisez une statistique de test pour une moyenne de la population, il ya deux cas où vous devez utiliser la t-au lieu de la répartition Z-distribution. Le premier cas est celui où la taille de l'échantillon est faible (en dessous de 30 ou plus), et le second cas est lorsque l'écart type de population,

image0.jpg

On ne sait pas, et il faut l'estimer en utilisant l'écart type d'échantillon, s. Dans les deux cas, vous avez des informations moins fiables sur lesquelles fonder vos conclusions, de sorte que vous aurez à payer une pénalité pour cela en utilisant le t-la distribution, qui a une plus grande variabilité dans les queues qu'un Z-distribution a.

Un test d'hypothèse pour une moyenne de population qui implique le t-la distribution est appelée t-test. La formule pour la statistique de test dans ce cas est:

image1.jpg

tn-1 est une valeur de la t-distribution avec n-1 degrés de liberté.

Notez qu'il est juste comme la statistique de test pour le grand échantillon et / ou le boîtier de distribution normale, à l'exception

image2.jpg

On ne sait pas, si vous remplacez l'écart type d'échantillon, s, à la place, et utiliser un t-valeur plutôt qu'une z-valeur.




Parce que le t-distribution a queues plus gros que le Z-distribution, vous obtenez un plus grand p-La valeur de la t-la distribution d'un que la normale standard (Z-) Distribution serait vous ont donné pour la même statistique de test. Un plus grand p-valeur signifie moins de chance de rejeter une hypothèse nulle, H0. Avoir moins de données et / ou ne sachant pas l'écart type de la population devrait créer un fardeau de preuve plus élevée.

Supposons une société de livraison prétend qu'ils livrent leurs colis dans 2 jours en moyenne, et si vous soupçonnez qu'elle est plus que cela. Les hypothèses sont

image3.jpg

Pour tester cette affirmation, vous prenez un échantillon aléatoire de 10 paquets et d'enregistrer leurs délais de livraison. Vous trouvez la moyenne de l'échantillon est

image4.jpg

et l'écart type d'échantillon est de 0,35 jours. (Parce que l'écart type de population,

image5.jpg

est inconnue, vous estimez avec s, l'écart type d'échantillon.) Ceci est un emploi pour la t-test.

Parce que la taille de l'échantillon est petit (n = 10 est beaucoup moins que 30) et l'écart type de population ne sait pas, votre statistique de test a une t-distribution. Les degrés de liberté est de 10 - 1 = 9. La formule de la statistique de test (dénommée t-valeur) est:

image6.jpg

Pour calculer le p-valeur, vous regardez dans la ligne dans la t-table pour df = 9.

image7.jpg

Votre statistique de test (2,71) se situe entre deux valeurs dans la ligne de df = 9 dans le t-Tableau: 2,26 et 2,82 (arrondi à deux décimales). Pour calculer le p-valeur pour votre statistique de test, trouver les colonnes qui correspondent à ces deux nombres. Le nombre 2.26 apparaît dans la colonne 0,025 et 2,82 le nombre apparaît dans le 0,010-colonnes vous savez maintenant le p-valeur pour votre statistique de test se situe entre 0,025 et 0,010 (soit 0,010 lt; p-valeur lt; 0,025).

En utilisant le t-table que vous ne connaissez pas le nombre exact pour le p-valeur, mais parce 0,010 et 0,025 sont à la fois moins de votre niveau de signification de 0,05, vous rejetez H0- vous avez suffisamment de preuves dans votre échantillon à-dire les paquets ne sont pas remis en 2 jours, et en fait, le temps moyen de livraison est de plus de 2 jours.

La tentation est de dire, “ Eh bien, je savais que la réclamation de 2 jours en moyenne était trop faible parce que l'échantillon moyen de 2,3 minutes était nettement plus grande. Pourquoi dois-je encore besoin d'un test d'hypothèse ”?; Tout ce nombre vous dit quelque chose au sujet de ces 10 paquets échantillonnés. Vous devez également tenir compte de la variation en utilisant l'erreur-type et la t-la distribution de pouvoir dire quelque chose à propos de l'ensemble de la population de colis expédiés.

La t-tableau ne comprend pas tous les possibles t-à valeur retrouver que les deux valeurs proche de la vôtre, de chaque côté, regarder les colonnes ils sont, et de signaler votre p-valeur par rapport à la leur. (Si votre statistique de test est supérieure à tous les t-valeurs de la ligne correspondante de la t-table, il suffit d'utiliser la dernière de un votre p-La valeur sera inférieure à sa probabilité).


» » » » Comment utiliser le t-test pour manipuler des petits échantillons et écarts types inconnus