Comment modéliser linéaires relations de données avec r

Une analyse de variance pour vos données peut également être écrit comme une modèle linéaire

Sommaire

dans R, où vous utilisez un facteur comme une variable prédictive pour modéliser une variable de réponse.

Bien sûr, les variables prédictives peuvent également être variables continues. Par exemple, le poids d'une voiture a évidemment une influence sur le kilométrage. Mais il serait bien d'avoir une idée sur l'ampleur de cette influence. Essentiellement, vous voulez trouver l'équation qui représente la ligne de tendance. Vous trouverez les données dont vous avez besoin pour vérifier cela dans l'ensemble de données mtcars.

image0.jpg

Comment construire un modèle linéaire

La lm () fonction vous permet de spécifier quoi que ce soit à partir du modèle linéaire le plus simple à des modèles d'interaction complexes.

Pour modéliser le kilométrage en fonction du poids d'une voiture, vous utilisez le lm () fonction, comme ceci:

> Modèle lt; - LM (mpg ~ WT, data = mtcars)

Vous fournissez deux arguments:




  • Une formule qui décrit le modèle: Ici, vous modélisez la variable mpg en fonction de la variable poids.

  • Une trame de données qui contient les variables de la formule: Ici, vous utilisez la trame de données mtcars.

Vous pouvez spécifier plusieurs modèles complexes avec l'interface de formule lorsque vous connaissez votre chemin.

L'objet résultant est une liste avec une structure très complexe, mais dans la plupart des cas, vous ne devez pas vous inquiéter à ce sujet. Le modèle objet contient beaucoup d'informations qui est nécessaire pour les calculs de diagnostic et de nouvelles prédictions.

Comment extraire les informations du modèle

Au lieu de plonger dans l'objet du modèle lui-même et de trouver l'information quelque part dans l'objet de la liste, vous pouvez utiliser certaines fonctions qui vous aident à obtenir les informations nécessaires à partir du modèle. Par exemple, vous pouvez extraire un vecteur nommé avec les coefficients du modèle en utilisant le coef () fonction, comme ceci:

> Coef.Model lt; - coef (modèle)> coef.Model (Intercept) wt37.285126 -5,344472

Ces coefficients représentent l'interception et la pente de la ligne de tendance. Vous pouvez l'utiliser pour tracer la ligne de tendance sur un diagramme de dispersion des données. Vous faites cela en deux étapes:

  1. Vous tracez le nuage de points avec les données.

    Vous utilisez le plot () fonction pour cela.

  2. Vous utilisez le abline () fonction pour tracer la ligne de tendance sur la base des coefficients.

Le code suivant vous donne la parcelle:

> Plot (mpg ~ poids, données)> = mtcars abline (a = coef.Model [1], b = coef.Model [2])

La abline () argument un représente le point d'intersection, et b représente la pente de la ligne de tendance que vous voulez tracer. Vous tracez une ligne verticale en définissant l'argument v à l'intersection avec la X-axe à la place. Les lignes horizontales sont tracées en mettant l'argument v à l'intersection avec la y-axe.

Voici un aperçu des fonctions pour extraire des informations à partir de l'objet du modèle lui-même. Ces fonctions fonctionnent avec des objets de modèles différents, y compris ceux construits par AOV () et lm ().

De nombreux auteurs de paquets fournissent également les mêmes fonctions pour les modèles construits par les fonctions dans leur ensemble. Ainsi, vous pouvez toujours essayer d'utiliser ces fonctions d'extraction en combinaison avec d'autres fonctions du modèle ainsi.

FonctionCe qu'il fait
coef ()Retourne un vecteur avec les coefficients du modèle
CONFINT ()Renvoie une matrice avec la limite supérieure et inférieure de l'intervalle de theconfidence pour chaque coefficient du modèle
équipée ()Retourne un vecteur avec les valeurs ajustées pour everyobservation
(résidus)Retourne un vecteur avec les résiduels pour chaque observation
vcov ()Renvoie la matrice de variance-covariance pour le coefficient

» » » » Comment modéliser linéaires relations de données avec r