Comment comparer deux échantillons de données avec r

R vous donne deux tests standard pour comparer deux groupes avec des données numériques: le t-test avec le t.test ()

Sommaire

fonction, et le test de Wilcoxon avec le wilcox.test () fonction. Si vous voulez utiliser le t.test () fonction, vous devez d'abord vérifier, entre autres choses, si les deux échantillons sont distribués normalement. Pour le test de Wilcoxon, ce ne sont pas nécessaires.

Comment utiliser la fonction de Wilcoxon R pour les données anormalement distribués

Dans certains cas, vos données écarte sensiblement de la normalité et vous ne pouvez pas utiliser le t.test () fonction. Pour ces cas, vous avez la wilcox.test () fonction, d'utiliser exactement de la même manière, comme indiqué dans l'exemple suivant:

> Wilcox.test (temp ~ activ, data = beaver2)

Cela vous donne le résultat suivant:




 Test de Wilcoxon rang-somme avec une continuité correctiondata: temp par activW = 15, p-valeur lt; 2.2e-16alternative hypothèse: véritable changement de l'emplacement est pas égal à 0

Encore une fois, vous obtenez la valeur de la statistique de test (W dans ce test) et une valeur p. En vertu de cette information, vous lisez l'hypothèse alternative, et qui diffère un peu de l'hypothèse alternative d'un t-test. Le test de Wilcoxon examine si le centre de vos données (l'emplacement) diffère entre les deux échantillons.

Avec ce code, vous effectuez le test de Wilcoxon ou test de Mann-Whitney. Les deux tests sont parfaitement équivalentes si R ne contient pas de fonction séparée pour le test de U de Mann-Whitney.

Comment utiliser T-Test et Wilcoxon test de R à la direction de test

Avec le test T-Test et Wilcoxon base, vous testez si les échantillons diffèrent sans préciser de quelle manière. Statisticiens appellent cela un test bilatéral. Imaginez que vous ne voulez pas savoir si la température du corps diffère entre les périodes actives et inactives, mais si la température du corps est plus faible pendant les périodes inactives.

Pour ce faire, vous devez spécifier l'argument subsidiaire soit dans le t.test () ou wilcox.test () fonction. Cet argument peut prendre trois valeurs:

  • Par défaut, il a la valeur 'two.sided', ce qui signifie que vous voulez que le test bilatéral standard.

  • Si vous voulez tester si la moyenne (ou l'emplacement) du premier groupe est inférieur, vous lui donnez la valeur 'Moins'.

  • Si vous voulez tester si cette moyenne est plus grand, vous spécifiez la valeur 'grande'.

Si vous utilisez l'interface de la formule pour ces tests, les groupes sont classés dans le même ordre que les niveaux du facteur que vous utilisez. Vous devez en tenir compte pour savoir quel groupe est considéré comme le premier groupe. Si vous donnez les données pour les deux groupes comme des vecteurs séparés, le premier vecteur est le premier groupe.


» » » » Comment comparer deux échantillons de données avec r