Comment comparer deux proportions de la population

À des fins statistiques, vous pouvez comparer deux populations ou groupes lorsque la variable est catégorique (par exemple, fumeur / non-fumeur, démocrate / républicain, le soutien / opposer une opinion, etc.) et vous êtes intéressé par la proportion d'individus avec un caractéristique donnée - par exemple, la proportion de fumeurs.

Pour faire cette comparaison, deux échantillons aléatoires indépendants (séparées) doivent être choisis, un de chaque population. L'hypothèse nulle H0 est que les deux proportions de population sont le same--à-dire que leur différence est égale à 0. La notation pour l'hypothèse nulle est H0: p1 = p2, où p1 est la proportion de la première population, et p2 est la proportion de la seconde population.

Déclarant en H0 que les deux proportions sont égales est identique à dire leur différence est égale à zéro. Si vous commencez avec l'équation p1 = p2 et soustrayez p2 de chaque côté, vous obtenez p1 - p2 = 0. Donc vous pouvez écrire l'hypothèse nulle de toute façon.

La formule pour la statistique de test comparant deux proportions (sous certaines conditions) est

image0.jpg

image1.jpg

est la proportion dans le premier échantillon avec la caractéristique d'intérêt,

image2.jpg

est la proportion dans le deuxième échantillon avec la caractéristique d'intérêt,

image3.jpg

est la proportion de l'échantillon combiné (tous les individus dans les premier et second échantillons ensemble) avec la caractéristique d'intérêt, et z est une valeur sur la Z-distribution. Pour calculer la statistique de test, procédez comme suit:

  1. Calculez les proportions de l'échantillon

    image4.jpg

    pour chaque échantillon. Pour ce faire, let n1 et n2 représenter les deux tailles d'échantillon (ils ne doivent pas être égale). Pour rho_1, diviser le nombre d'individus dans le premier échantillon qui ont la caractéristique d'intérêt par n1. Pour rho_2, diviser le nombre d'individus dans le second échantillon qui ont la caractéristique d'intérêt par n2.




  2. Trouvez la différence entre les deux proportions de l'échantillon,

    image5.jpg
  3. Calculer la proportion de l'échantillon global

    image6.jpg

    le nombre total d'individus des deux échantillons qui ont la caractéristique d'intérêt (par exemple, le nombre total de fumeurs, hommes ou femmes, combiné à partir de deux échantillons), divisé par le nombre total d'individus des deux échantillons (n1 + n2).

  4. Calculer l'erreur-type:

    image7.jpg
  5. Divisez votre résultat de l'étape 2 par le résultat de l'étape 4.

    Cette réponse est votre statistique de test.

Pour interpréter la statistique de test, regardez votre statistique de test sur la normale standard (Z-) La distribution (voir ci-dessous la Z-table) et calculer le p-à valeur alors prendre des décisions, comme d'habitude.

image8.jpgimage9.jpg

Par exemple, les responsables de l'Adderall, un médicament pour le trouble déficitaire de l'attention avec hyperactivité (TDAH), a indiqué que 26 des 374 sujets (7%) qui ont pris le vomissements médicament connu comme un effet secondaire, comparativement à 8 des 210 sujets (4 %) qui étaient sur une placebo (faux médicaments). Notez que les patients ne savaient pas quel traitement ils ont été donnés. Dans l'échantillon, des vomissements un plus grand pourcentage de la population sur le médicament connu, mais ce pourcentage est suffisant de dire que l'ensemble de la population sur le médicament serait une expérience de plus de vomissements? Vous pouvez tester pour voir.

Dans cet exemple, vous avez H0: p1 - p2 = 0 par rapport à Hun: p1 - p2 > 0, où p1 représente la proportion de tous les patients qui vomissent lors de l'utilisation Adderall, et p2 représente la proportion de tous les patients qui vomir en utilisant le placebo.

Pourquoi Hun contenir un “> ” signer et pas un “ lt; ” signer? Hun représente le scénario dans lequel ceux qui prennent Adderall expérience plus vomissements que ceux sur le placebo - qui est quelque chose de la FDA (et tout candidat à la drogue) voudraient connaître. Mais l'ordre des groupes est également important. Vous voulez mettre en place afin que le groupe Adderall est le premier, de sorte que lorsque vous prenez la proportion de Adderall moins la proportion de placebo, vous obtenez un nombre positif si Hun est vrai. Si vous changez les groupes, le signe aurait été négative.

Maintenant calculer la statistique de test:

  1. Tout d'abord, déterminer que

    image10.jpg

    Notez les tailles d'échantillon sont n1 = 374 et n2 = 210, respectivement.

  2. Prenez la différence entre ces proportions de l'échantillon pour obtenir

    image11.jpg
  3. Calculer la proportion globale de l'échantillon pour obtenir

    image12.jpg
  4. L'erreur-type est

    image13.jpg
  5. Enfin, la statistique de test est

    image14.jpg

    Ouf!

La p-valeur est la probabilité d'être atteint ou dépassé (dans ce cas, à la droite de) 1,60, qui est de 1 à 0,9452 = 0,0548. Ce p-la valeur est légèrement supérieure à 0,05, donc, techniquement, vous ne devez pas assez de preuves pour rejeter H0. Cela signifie que, selon vos données, vomissements est pas connu beaucoup plus par ceux qui prennent ce médicament par rapport à un placebo.

Vous pourriez vous demander, “ Hey, la différence entre les proportions de l'échantillon est de 0,032 ce qui montre que le médicament induit des vomissements plus que le placebo. Pourquoi le test d'hypothèse ne rejette H0 depuis 0,032 est évidemment supérieure à 0 ° 148?; Dans ce cas, 0,032 est pas significativement supérieure à 0. Vous devez également tenir compte de la variation en utilisant l'erreur-type et la distribution normale pour être en mesure de dire quelque chose à propos de l'ensemble de la population de patients.


» » » » Comment comparer deux proportions de la population