Comment évaluer les différences dans vos données avec R

Pour vérifier le modèle de données que vous avez créé avec ANOVA (analyse de variance), vous pouvez utiliser les R résumé()

Sommaire

la fonction de l'objet de modèle comme ceci:

> Résumé de valeur (AOVModel) Df Somme Sq Sq Mean F Pr (> F) spray5 2 669 533,8 34,7 lt; 2e-16 *** résidus 66 1015 15,4 --- Signif. codes: 0 "***" 0.001 "** '0,01' * '0,05'. ' 0,1 '' 1

R vous imprime le tableau d'analyse de variance qui, en substance, vous indique si les différents termes peuvent expliquer une partie importante de la variance dans vos données. Ce tableau vous indique seulement quelque chose à propos du terme, mais rien sur les différences entre les différents sprays. Pour cela, vous avez besoin de creuser un peu plus profond.

Comment vérifier les tables du modèle de données

Avec le (model.tables) fonction, vous pouvez jeter un oeil à des résultats pour les niveaux individuels des facteurs. La fonction vous permet de créer deux Tableaux- différente soit vous regardez le résultat moyen estimé pour chaque groupe, ou vous regardez la différence avec la moyenne générale.

Pour savoir combien effet chaque pulvérisation avait, vous utilisez le code suivant:

> Model.tables (AOVModel, tapez = «effets») Tables de effectsspraysprayA BCDE F5.000 5,833 -7,417 -4,583 -6,000 7.167



Ici vous voyez que, par exemple, pulvérisation E a entraîné, en moyenne, six bogues moins que la moyenne sur tous les domaines. D'autre part, dans les champs où pulvérisation A a été utilisé, les agriculteurs ont constaté, en moyenne, cinq bogues plus par rapport à la moyenne globale.

Pour obtenir les moyens modélisés par groupe et la moyenne générale, il suffit d'utiliser la valeur d'argument type = "moyens" au lieu de type = "effets".

Comment regarder les différences individuelles dans les données

Un agriculteur ne serait probablement pas envisager l'achat d'un jet, mais que dire de pulvérisation D? Bien que sprays E et C semblent être mieux, ils peuvent également être beaucoup plus cher. Pour tester si les différences par paire entre les pulvérisations sont importants, vous utilisez Honnête différence significative (HSD) test de Tukey. La TukeyHSD () fonction vous permet de le faire très facilement, comme ceci:

> Comparaisons lt; - TukeyHSD (Model)

La Comparaisons objet contient maintenant une liste où chaque élément est nommé d'après l'un des facteurs dans le modèle. Dans l'exemple, vous avez un seul élément, appelé vaporiser. Cet élément contient, pour chaque combinaison de sprays, de ce qui suit:

  • La différence entre les moyennes.

  • Le niveau de l'intervalle de confiance de 95 pour cent autour de cette différence moyenne inférieure et supérieure.

  • La p-valeur qui indique si cette différence est significativement différent de zéro. Cette p-value est ajusté en utilisant la méthode de Tukey (d'où le nom de la colonne p adj).

Vous pouvez extraire toutes ces informations en utilisant les méthodes classiques d'extraction. Par exemple, vous obtenez les informations sur la différence entre D et C comme ceci:

> Comparaisons $ Spray ['D-C',] difflwrupr p adj2.8333333 -1,8660752 7,5327418 0,4920707

Cette différence n'a pas l'air impressionnant, si vous demandez Tukey.

Comment tracer les différences

La TukeyHSD objet a une autre fonctionnalité intéressante: Il peut être tracée. Ne vous embêtez pas à la recherche d'une page d'aide de la fonction de tracé - tout ce que vous trouvez est une phrase: “ Il ya une méthode de parcelle n ° 148. Mais il fonctionne vraiment! Essayez-le comme ceci:

> Plot (comparaisons, las = 1)

Vous voyez la sortie de cette ligne simple. Chaque ligne représente la différence moyenne entre les deux groupes avec un intervalle de confiance selon. Chaque fois que l'intervalle de confiance ne contient pas zéro (la ligne verticale), la différence entre les deux groupes est significative.

Vous pouvez utiliser certains des paramètres graphiques pour rendre le tracé plus lisible. Plus précisément, la las paramètre est utile ici. En fixant à 1, vous vous assurez que toutes les étiquettes des axes sont imprimées horizontalement de sorte que vous pouvez réellement les lire.

image0.jpg

» » » » Comment évaluer les différences dans vos données avec R