Création d'un intervalle de confiance pour la différence des deux moyens avec des écarts-types connus
Si vous connaissez les écarts-types de deux échantillons de population, alors vous pouvez trouver un intervalle de confiance (IC) de la différence entre leurs moyens, ou moyennes. L'objectif de nombreuses enquêtes et études statistiques est de comparer deux populations, comme les hommes par rapport aux femmes, les faibles contre les familles à revenu élevé, et les républicains contre les démocrates. Lorsque la caractéristique rapport est numérique (par exemple, la hauteur, le poids, ou le revenu), l'objet d'intérêt est le montant de la différence dans les moyens (moyennes) pour les deux populations.
Par exemple, vous pouvez comparer la différence de l'âge moyen des républicains contre les démocrates, ou la différence entre les revenus moyens des hommes par rapport aux femmes. Vous estimez que la différence entre les deux moyens de la population,
en prélevant un échantillon à partir de chaque population (par exemple, échantillon 1 et échantillon 2) et en utilisant la différence des deux moyennes d'échantillon
plus ou moins une marge d'erreur. Le résultat est un intervalle de confiance pour la différence des deux moyennes de population,
Si les deux écarts types de population sont connus, alors la formule pour un CI pour la différence entre deux moyennes de population (moyennes) est
sont la moyenne et la taille du premier échantillon, et l'écart type de la première population,
est donné (connu);
et n2 sont la moyenne et la taille du deuxième échantillon, et l'écart type de la seconde population,
est donné (connu). Ici z * est la valeur appropriée de la distribution normale standard pour votre niveau de confiance désiré. (Reportez-vous au tableau ci-dessous pour les valeurs de z * pour certains niveaux de confiance).
z*-valeurs pour différents niveaux de confiance | |
Un niveau de confiance | z * -value |
---|---|
80% | 1,28 |
90% | 1.645 (par convention) |
95% | 1,96 |
98% | 2.33 |
99% | 2.58 |
Pour calculer un IC pour la différence entre deux moyennes de population avec des écarts-types connus, procédez comme suit:
Déterminer le niveau de confiance et de trouver le lieu z *-valeur.
Faire référence à le tableau ci-dessus.
Identifier
Identifier
Trouvez la différence,
entre les moyens de l'échantillon.
Carré
et le diviser par n1- carré
et le diviser par n2.
Ajouter les résultats ensemble et prendre la racine carrée.
Multipliez votre réponse de l'étape 4 par z *.
Cette réponse est la marge d'erreur.
Prendre
plus ou moins la marge d'erreur pour obtenir le CI.
L'extrémité inférieure de l'IC est
moins la marge d'erreur, tandis que l'extrémité supérieure de l'IC est
plus la marge d'erreur.
Supposons que vous vouliez estimer avec confiance à 95% de la différence entre la longueur moyenne (moyenne) des épis de deux variétés de maïs sucré (leur permettant de grandir le même nombre de jours dans les mêmes conditions). Appelez les deux variétés de maïs-e-stats et Stats-o-douce. Supposons par la recherche avant que les écarts-types de la population pour le maïs-e-stats et Stats-o-douce sont de 0,35 pouces et 0,45 pouces, respectivement.
Parce que vous voulez un intervalle de confiance de 95%, votre z * est 1,96.
Supposons que votre échantillon aléatoire de 100 épis des moyennes de variétés de maïs-e-stats 8,5 pouces, et votre échantillon aléatoire de 110 épis de moyennes Stats-o-douces 7,5 pouces. Donc, l'information que vous avez est:
La différence entre les moyennes des échantillons,
de l'étape 2, est 8.5 à 7.5 = 1 pouce. Cela signifie que la moyenne pour le maïs-e-stats moins la moyenne pour les Stats-o-douce est positif, ce qui rend le maïs-e-stats la plus grande des deux variétés, en termes de cet échantillon. Est-ce que la différence assez de généraliser à l'ensemble de la population, si? Voilà ce que cet intervalle de confiance va vous aider à décider.
Carré
(0,35) pour obtenir 0.1225- diviser par 100 pour obtenir 0,0012. Carré
(0,45) divisez par 110 pour obtenir 0,0018. La somme est 0,0012 + 0,0018 = 0.0030- la racine carrée est 0.0554 pouces (si aucun arrondi est fait).
Multipliez 1,96 fois 0.0554 pour obtenir 0,1085 pouces, la marge d'erreur.
Votre intervalle de confiance de 95% pour la différence entre les longueurs moyennes pour ces deux variétés de maïs sucré est de 1 pouce, plus ou moins 0,1085 pouces. (L'extrémité inférieure de l'intervalle est de 1 à 0,1085 = 0,8915 pouces-l'extrémité supérieure est 1 + 0,1085 = 1,1085 pouces.) Notez toutes les valeurs dans cet intervalle sont positifs. Cela signifie que le maïs-e-stats est estimé à plus de base de vos données Statistiques-o-doux,.
Pour interpréter ces résultats dans le contexte du problème, vous pouvez dire avec 95% de confiance que la variété de maïs-e-stats est plus longue, en moyenne, que les Stats-O-douce variété, par quelque part entre 0.8915 et 1.1085 pouces, basé sur votre échantillon.
La tentation est de dire, Eh bien, je savais maïs-e-stats maïs était plus parce que sa moyenne de l'échantillon est de 8,5 pouces et Stat-o-douce était seulement de 7,5 pouces en moyenne. Pourquoi dois-je encore besoin d'un intervalle de confiance ?; Tous ces deux chiffres vous disent quelque chose sur ces 210 épis échantillonnés. Vous devez également tenir compte de la variation en utilisant la marge d'erreur pour être en mesure de dire quelque chose à propos de l'ensemble des populations de maïs.
Notez que vous pourriez obtenir une valeur négative pour
Par exemple, si vous aviez activé les deux variétés de maïs, vous auriez obtenu -1 pour cette différence. Vous voulez dire que Statistiques-o-douce en moyenne un pouce plus court que le maïs-e-stats dans l'échantillon (la même conclusion indication contraire).
Si vous voulez éviter les valeurs négatives pour la différence moyenne de l'échantillon, toujours faire le groupe avec le plus grand échantillon signifie votre premier groupe - toutes vos différences seront positifs.
Cependant, même si le groupe avec le plus grand échantillon moyen sert le premier groupe, parfois, vous obtiendrez toujours des valeurs négatives dans l'intervalle de confiance. Supposons dans l'exemple ci-dessus que la moyenne de l'échantillon de maïs-e-stats est de 7,6 pouces. Ainsi, la différence dans l'échantillon est de 0,1 signifie, et l'extrémité supérieure de l'intervalle de confiance est de 0,1 + 0,1085 = 0,2085 tandis que l'extrémité inférieure est de 0,1 - 0,1085 -0,0085 =. Cela signifie que la vraie différence est raisonnablement n'importe où à partir de maïs-e-stats être autant que 0,2085 pouces de plus Stat-o-douce étant 0,0085 pouces de plus. Il est trop proche de dire avec certitude quelle variété est de plus en moyenne.