Comment utiliser l'interface de formule dans r

Une autre idée très important en R est l'interface de la formule. L'interface de formule vous permet de spécifier de façon concise les colonnes à utiliser lors de l'ajustement d'un modèle, ainsi que le comportement du modèle.

Il est important de garder à l'esprit que la notation de la formule se réfère à des formules statistiques, par opposition à des formules mathématiques. Ainsi, par exemple, l'opérateur de formule + des moyens pour inclure une colonne, de ne pas ajouter mathématiquement deux colonnes ensemble. Vous avez besoin des opérateurs lorsque vous démarrez la construction de modèles.

Soyez conscient du fait que l'interprétation des signes peut varier en fonction de la fonction de modélisation que vous utilisez.

OpérateurExempleSignification
~y ~ XModèle y en fonction de x
+y ~ un + bInclure les colonnes un ainsi que b
-y ~ un - bComprendre un mais excluent b
:y ~ un : bEstimer l'interaction de un etb
*y ~ un * bInclure les colonnes ainsi que leur interaction (soit, y ~ un + b + a: b)
|y ~ un | bEstimation y en fonction d'un conditionnel à b



Beaucoup de fonctions R vous permettent d'utiliser l'interface de la formule, souvent en plus à d'autres façons de travailler avec cette fonction. Par exemple, la agrégat () fonction vous permet également d'utiliser des formules:

> Global (mpg ~ engrenage + h, data = voitures, signifie) gearam mpg1 3 automatique 16,106672 21,050003 automatique 4 4 ​​Manuel 26,275004 5 Manuel 21,38000

Notez que le premier argument est une formule et le second argument est la trame de données source. Dans ce cas, vous dites global de modéliser mpg en fonction de engrenage aussi bien que suis et à calculer la moyenne. Ceci est le même exemple que dans le paragraphe précédent, mais en utilisant l'interface de la formule de votre fonction devient très facile à lire.

Quand vous regardez le fichier d'aide pour une fonction, il sera toujours clair si vous pouvez utiliser une formule avec cette fonction. Par exemple, jetez un oeil à l'aide pour ?agrégat. Dans la section de l'utilisation de cette page, vous trouverez le texte suivant:

## Méthode S3 pour la catégorie «data.frame'aggregate (x, par, FUN, ..., simplifier = TRUE) ## méthode S3 pour la catégorie« formula'aggregate (formule, les données, FUN, ..., sous-ensemble, na.action = na.omit)

Cette page présente une méthode pour la classe trame de données, ainsi qu'un procédé pour la classe formule. Cela indique que vous pouvez utiliser soit la formulation.

Vous pouvez trouver plus d'informations (technique) à propos de formule sur sa page d'aide propre, ?formule.


» » » » Comment utiliser l'interface de formule dans r