Comment comparer deux moyennes de population indépendants

Vous pouvez comparer les données numériques pour les deux populations ou des groupes (tels que les niveaux de cholestérol chez les hommes par rapport aux femmes, ou des niveaux de revenu pour l'école secondaire par rapport diplômés des collèges) statistiques pour tester une réclamation à propos de la différence de leurs moyennes. (Par exemple, est la différence dans la population signifie égal à zéro, indiquant leurs moyens sont égaux?) Deux échantillons aléatoires (totalement séparée) indépendants doivent être choisis, un de chaque population, afin de recueillir les données nécessaires pour ce test .

L'hypothèse nulle est que les deux moyennes de population sont les same--à-dire que leur différence est égale à 0. La notation pour l'hypothèse nulle est

image0.jpg

Vous pouvez également écrire l'hypothèse nulle que

image1.jpg

mettant l'accent sur l'idée que leur différence est égale à zéro si les moyens sont les mêmes.

La formule pour la statistique de test comparant deux moyens (sous certaines conditions) est:

image2.jpg

Pour le calculer, faire ce qui suit:

  1. Calculer les moyennes de l'échantillon

    image3.jpg

    sont donnés.) Soit n1 et n2 représenter les deux tailles d'échantillon (ils ne doivent pas être égale).

  2. Trouvez la différence entre les deux moyennes de l'échantillon:

    image4.jpg

    Gardez à l'esprit que, parce que

    image5.jpg


    est égal à 0 si H0 est vrai, il n'a pas besoin d'être inclus dans le numérateur de la statistique de test. Cependant, si la différence qu'ils testent est une valeur autre que 0, vous soustrayez cette valeur de x1-X2 dans le numérateur de la statistique de test.

  3. Calculer l'erreur standard à l'aide de l'équation suivante:

    image6.jpg
  4. Divisez votre résultat de l'étape 2 par le résultat de l'étape 3.

    Pour interpréter la statistique de test, ajoutez les deux étapes suivantes à la liste:

  5. Recherchez votre statistique de test sur la normale standard (Z-) La distribution (voir ci-dessous la Z-table) et calculer le p-valeur.

    image7.jpgimage8.jpg
  6. Comparez le p-la valeur à votre niveau de signification, (comme 0,05). Si elle est inférieure ou égale à votre niveau de signification, rejeter H0. Sinon, ne pas rejeter H0.

Les conditions d'utilisation de ce test sont que les deux écarts types de population sont connus et soit les deux populations ont une distribution normale ou deux tailles d'échantillon sont assez grand pour le théorème central limite à appliquer.

Par exemple, supposons que vous voulez comparer la capacité d'absorption de deux marques de serviettes en papier (appeler les marques Statistiques absorbants et Sponge-o-matic). Vous pouvez faire cette comparaison en regardant le nombre moyen d'onces chaque marque peut absorber avant d'être saturé. H0 dit la différence entre les capacités d'absorption moyenne est 0 (inexistant), et Hun dit la différence est de 0. En d'autres termes, une seule marque est plus absorbant que l'autre. En utilisant la notation statistique, vous avez

image9.jpg

Ici, vous avez sans indiquer lequel serviette en papier peut être plus absorbant, de sorte que le non-égal-à alternative est le seul à utiliser.

Supposons que vous sélectionnez un échantillon aléatoire de 50 serviettes en papier de chaque marque et de mesurer la capacité d'absorption de chaque serviette en papier. Supposons que la capacité d'absorption moyenne de Stats-absorbant (X1) Pour votre échantillon est de 3 onces, et supposons que l'écart type de la population est de 0,9 onces. Pour Sponge-o-matic (X2), La capacité d'absorption moyenne est de 3,5 onces selon vos sample- supposer l'écart type de population est de 1,2 onces. Effectuer ce test d'hypothèse en suivant les 6 étapes ci-dessus:

  1. Compte tenu des informations ci-dessus, vous savez

    image10.jpg
  2. La différence entre l'échantillon des moyens pour (Statistiques absorbant - Sponge-o-matic) est

    image11.jpg

    (Une différence négative signifie simplement que le deuxième moyen de l'échantillon était plus grande que la première.)

  3. L'erreur-type est

    image12.jpg
  4. Divisez la différence, -0.5, par l'erreur-type, 0,2121, ce qui vous donne -2.36. Ceci est votre statistique de test.

  5. Pour trouver le p-valeur, regardez -2.36 sur la normale standard (Z-) La distribution - voir ci-dessus Z-table. La chance d'être au-delà, dans ce cas à la gauche de, -2,36 est égale à 0,0091. Parce que Hun est un organisme sans égale à l'alternative, vous doublez ce pourcentage pour obtenir 2 # 8727- 0,0091 = 0,0182, votre p-valeur.

  6. Ce p-valeur est un peu moins de 0,05. Cela signifie que vous avez des preuves assez forte pour rejeter H0.

Votre conclusion est qu'une différence statistiquement significative existe entre les niveaux de ces deux marques de serviettes en papier, en fonction de vos échantillons d'absorption. Et Sponge-o-matic vient en tête, car il a une moyenne plus élevée. (Statistiques-absorbants moins Sponge-o-matic négative signifie être Sponge-o-matic avait la valeur la plus élevée.)

La tentation est de dire, “ Eh bien, je savais que l'affirmation selon laquelle les niveaux d'absorption étaient égaux était erroné parce que l'on marque avait une moyenne d'échantillon de 3,5 onces et l'autre était de 3,0 onces. Pourquoi dois-je encore besoin d'un test d'hypothèse ”?; Tous ces chiffres vous disent quelque chose sur ces 100 serviettes en papier échantillonnés. Vous devez également tenir compte de la variation en utilisant l'erreur-type et la distribution normale pour être en mesure de dire quelque chose à propos de l'ensemble de la population de serviettes en papier.


» » » » Comment comparer deux moyennes de population indépendants