Comment analyser les écarts de données dans les modèles avec r

Une analyse de variance (Anova) est une technique très courante utilisée avec R de comparer les moyens entre les différents groupes de données. Pour illustrer cela, jetez un oeil à l'ensemble de données Spray insecticide

Sommaire

:

> Str (InsectSprays) 'data.frame': 72 obs. de 2 variables: $ count: num 7 20 14 10 14 12 10 23 17 20 ... $ pulvérisation: Facteur W / 6 niveaux «A», «B», «C», «D», ..: 1 1 1 1 1 1 1 1 1 1 ...

Cette base de données contient les résultats d'une expérience agricole. Six insecticides ont été testés sur 12 champs chacun, et les chercheurs ont compté le nombre de bugs embêtants qui restaient sur chaque champ. Maintenant, les agriculteurs ont besoin de savoir si les insecticides font toute la différence, et si oui, lequel ils ont le meilleur usage. Vous répondez à cette question en utilisant le AOV () fonctionner pour effectuer une analyse de la variance.

Comment construire le modèle

Pour cet exemple simple, la construction du modèle est un morceau de gâteau. Vous voulez essentiellement pour modéliser les moyens pour la variable compter en fonction de la variable vaporiser. Vous traduisez cela à R comme ceci:

> AOVModel lt; - aov (comptage ~ pulvérisation, data = InsectSprays)



Vous passez deux arguments à la AOV () fonction dans cette ligne de code:

  • La formule compter ~ pulvérisation, qui se lit comme “ compter en fonction de pulvérisation ”

  • L'argument données, où vous spécifiez la trame de données dans laquelle les variables de la formule peuvent être trouvés

Chaque fonction de modélisation retourne un objet de modèle avec un grand nombre d'informations sur le modèle ajusté. Toujours mettre cet objet de modèle dans une variable. De cette façon vous ne devez pas remonter le modèle quand vous avez besoin pour effectuer des calculs supplémentaires.

Comment regarder l'objet modèle

Comme avec chaque objet, vous pouvez regarder un objet de modèle en tapant simplement son nom dans la console. Si vous faites cela pour l'objet Modèle que vous avez créé, vous voyez la sortie suivante:

> AOVModelCall: AOV (formule = ~ compter pulvérisation, data = InsectSprays) Conditions: pulvériser ResidualsSum des carrés 2668.833 1015.167Deg. de Freedom566Residual erreur standard: effets 3.921902Estimated peuvent être déséquilibré

Cela ne vous dit pas que beaucoup, en dehors de la commande (ou la appel) Vous avez utilisé pour construire le modèle et quelques informations de base sur le résultat approprié.

Dans la sortie, vous avez également lu que les effets estimés peuvent être déséquilibré. Cela ne veut pas un avertissement - il est un message qui est construit dans par l'auteur de la AOV () fonction. Celui-ci peut apparaître dans deux situations:

  • Vous ne devez pas le même nombre de cas dans chaque groupe.

  • Vous ne avez pas défini contrastes orthogonaux.

Dans ce cas, il est la deuxième raison.


» » » » Comment analyser les écarts de données dans les modèles avec r