Comment tester une différence moyenne en utilisant le test t apparié

Vous pouvez tester pour une différence moyenne en utilisant la apparié t-tester si la variable est numérique (par exemple, le revenu, le niveau de cholestérol, ou de miles par gallon) et les individus dans l'échantillon statistique sont soit jumelé d'une certaine façon en fonction de variables pertinentes telles que l'âge ou peut-être du poids, ou les mêmes personnes sont utilisé deux fois (par exemple, en utilisant un pré-test et post-test).

Des couples de tests sont généralement utilisés pour des études dans lesquelles quelqu'un teste pour voir si un nouveau traitement, une technique ou méthode fonctionne mieux que une méthode existante, sans avoir à se soucier d'autres facteurs sur les sujets qui peuvent influer sur les résultats.

Avec la différence moyenne, vous correspondre les sujets de sorte qu'ils sont considérés comme provenant d'une seule population, et l'ensemble des écarts mesurés pour chaque sujet (par exemple, pré-test par rapport post-test) sont considéré comme un échantillon. Le test d'hypothèse revient ensuite vers le bas pour un test pour une moyenne de la population.

Par exemple, supposons un chercheur veut voir si les élèves d'apprendre à lire à l'aide d'un jeu d'ordinateur donne de meilleurs résultats que l'enseignement avec une méthode phonétique essayé-et-vrai. Elle sélectionne au hasard 20 élèves et les met en 10 paires en fonction de leur niveau de préparation à la lecture, l'âge, le QI, et ainsi de suite. Elle sélectionne au hasard un élève de chaque paire d'apprendre à lire par la méthode de jeu de l'ordinateur (CM abrégé), et l'autre dans la paire apprend à lire en utilisant la méthode phonétique (PM abrégé). A la fin de l'étude, chaque étudiant suit le même test de lecture. Les données sont présentées dans le tableau suivant.

Scores lecture pour Computer Game Methodversus Phonétique Méthode
Paire étudiantsMéthode informatiquePhonétique MéthodeDifférence (CM - PM)
18580+5
280800
39588+7
48790-3
57872+6
68279+3
75750+7
86973-4
97378-5
109995+4

Les données d'origine sont en paires, mais vous êtes vraiment intéressé seulement dans la différence dans les scores de lecture (phonétique score en lecture informatique de moins lire score) pour chaque paire, ne pas les scores de lecture elles-mêmes. Donc le différences appariées (les différences dans les paires de scores) sont votre nouvel ensemble de données. Vous pouvez voir leurs valeurs dans la dernière colonne du tableau.

En examinant les différences dans les paires d'observations, vous avez vraiment avoir qu'un seul ensemble de données, et vous avez seulement un test d'hypothèse pour une moyenne de population. Dans cet exemple spécifique, l'hypothèse nulle est que la moyenne (des différences appariées) est égal à 0, et l'hypothèse alternative est que la moyenne (des différences appariées) est supérieure à 0.

Si les deux méthodes de lecture sont les mêmes, la moyenne des différences appariées devrait être proche de 0. Si la méthode de l'ordinateur est meilleure, la moyenne des différences appariées devrait être nettement plus que 0- qui est, le score de la lecture informatique serait plus grande que les phonétique marquer.

La notation pour l'hypothèse nulle est

image0.jpg

(La dans l'indice vous rappelle juste que vous travaillez avec les différences appariées.)

La formule pour la statistique de test pour les différences appariées est

image1.jpg

l'échantillon, et tn-1 est une valeur sur la t-distribution avec n - 1 degrés de liberté.

Vous utilisez un t-Répartition ici parce que dans la plupart des expériences appariée la taille de l'échantillon est faible et / ou l'écart type de la population

image2.jpg


est inconnue, il est donc estimé par s.

Pour calculer la statistique de test pour les différences appariées, procédez comme suit:

  1. Pour chaque paire de données, prendre la première valeur de la paire moins la deuxième valeur de la paire de trouver la différence jumelé.

    Pensez aux différences que votre nouvel ensemble de données.

  2. Calculer la moyenne,

    image3.jpg

    et l'écart-type, s, de toutes les différences.

  3. Laisser n représenter le nombre de différences paires que vous avez, calculons l'erreur type:

    image4.jpg
  4. Diviser

    image5.jpg

    par l'erreur-type de l'étape 3.

Car

image6.jpg

est égal à 0 si H0 est vrai, il n'a pas vraiment besoin d'être inclus dans la formule de la statistique de test. En conséquence, vous voyez parfois la statistique de test écrit comme ceci:

image7.jpg

Pour l'exemple des notes de lecture, vous pouvez utiliser les étapes précédentes pour voir si la méthode de l'ordinateur est mieux en termes de l'enseignement aux élèves à lire.

Pour trouver la statistique, suivez ces étapes:

  1. Calculer les différences pour chaque paire (ils sont affichés dans la colonne 4 du tableau ci-dessus). Remarquez que le signe sur chacune des différences est important- il indique la méthode de meilleurs résultats pour cette paire particulière.

  2. Calculer la moyenne et l'écart-type de la différence de l'étape 1. Dans cet exemple, la moyenne des différences est

    image8.jpg

    et l'écart type est s = 4,64. Noter que n = 10 ici.

  3. L'erreur-type est

    image9.jpg

    (Rappelez-vous que ici, n est le nombre de paires, ce qui est 10.)

  4. Prendre la moyenne des différences (étape 2) divisé par l'erreur-type de 1,47 (étape 3) pour obtenir 1,36, la statistique de test.

Est le résultat de l'étape 4 suffit pas de dire que la différence dans les scores en lecture trouvés dans cette expérience applique à l'ensemble de la population en général? Parce que l'écart type de population,

image10.jpg

est inconnue et vous avez estimé que la norme de l'échantillon-type (s), Vous devez utiliser le t-la répartition plutôt que Z-Répartition de trouver votre p-valeur. Utilisation du dessous t-table, vous regardez jusqu'à 1,36 sur la t-répartition de 10 - 1 = 9 degrés de liberté pour calculer la p-valeur.

image11.jpg

La p-dans ce cas, la valeur est supérieure à 0,10 (et donc supérieur à 0,05), parce que 1,36 est plus petit que (ou à la gauche de) la valeur de 1,38 sur la table, et par conséquent son p-valeur est supérieure à 0,10 (le p-valeur pour le titre de la colonne correspondant à 1,38).

Parce que le p-valeur est supérieure à 0,05, vous ne parvenez pas à rejeter H0- vous ne disposez pas de suffisamment de preuves que la différence moyenne dans les scores entre la méthode de l'ordinateur et la méthode phonétique est nettement supérieure à 0. Toutefois, cela ne signifie pas nécessairement une réelle différence est pas présent dans la population de tous les élèves. Mais le chercheur ne peut pas dire que le jeu d'ordinateur est une meilleure méthode de lecture sur la base de cet échantillon de 10 étudiants.

Vous pourriez vous demander, “ Hé, l'échantillon moyenne des différences est de 2,0 ce qui montre que la méthode de l'ordinateur était mieux que la méthode phonétique. Pourquoi le test d'hypothèse ne rejette H0 depuis 2.0 est évidemment supérieure à 0 ° 148?; Parce que dans ce cas, 2.0 est pas significativement supérieure à 0. Vous devez également tenir compte de la variation en utilisant l'erreur-type et la t la distribution de pouvoir dire quelque chose à propos de l'ensemble de la population d'étudiants.


» » » » Comment tester une différence moyenne en utilisant le test t apparié