Comment modéliser linéaires relations de données avec r

Une analyse de variance pour vos données peut également être écrit comme une modèle linéaire

Sommaire

Comment construire un modèle linéaire
Comment extraire les informations du modèle

dans R, où vous utilisez un facteur comme une variable prédictive pour modéliser une variable de réponse.

Bien sûr, les variables prédictives peuvent également être variables continues. Par exemple, le poids d'une voiture a évidemment une influence sur le kilométrage. Mais il serait bien d'avoir une idée sur l'ampleur de cette influence. Essentiellement, vous voulez trouver l'équation qui représente la ligne de tendance. Vous trouverez les données dont vous avez besoin pour vérifier cela dans l'ensemble de données mtcars.

Comment construire un modèle linéaire

La lm () fonction vous permet de spécifier quoi que ce soit à partir du modèle linéaire le plus simple à des modèles d'interaction complexes.

Pour modéliser le kilométrage en fonction du poids d'une voiture, vous utilisez le lm () fonction, comme ceci:

> Modèle lt; - LM (mpg ~ WT, data = mtcars)

Vous fournissez deux arguments:

Une formule qui décrit le modèle: Ici, vous modélisez la variable mpg en fonction de la variable poids.
Une trame de données qui contient les variables de la formule: Ici, vous utilisez la trame de données mtcars.

Vous pouvez spécifier plusieurs modèles complexes avec l'interface de formule lorsque vous connaissez votre chemin.

L'objet résultant est une liste avec une structure très complexe, mais dans la plupart des cas, vous ne devez pas vous inquiéter à ce sujet. Le modèle objet contient beaucoup d'informations qui est nécessaire pour les calculs de diagnostic et de nouvelles prédictions.

Comment extraire les informations du modèle

Au lieu de plonger dans l'objet du modèle lui-même et de trouver l'information quelque part dans l'objet de la liste, vous pouvez utiliser certaines fonctions qui vous aident à obtenir les informations nécessaires à partir du modèle. Par exemple, vous pouvez extraire un vecteur nommé avec les coefficients du modèle en utilisant le coef () fonction, comme ceci:

> Coef.Model lt; - coef (modèle)> coef.Model (Intercept) wt37.285126 -5,344472

Ces coefficients représentent l'interception et la pente de la ligne de tendance. Vous pouvez l'utiliser pour tracer la ligne de tendance sur un diagramme de dispersion des données. Vous faites cela en deux étapes:

Vous tracez le nuage de points avec les données.
Vous utilisez le plot () fonction pour cela.
Vous utilisez le abline () fonction pour tracer la ligne de tendance sur la base des coefficients.

Le code suivant vous donne la parcelle:

> Plot (mpg ~ poids, données)> = mtcars abline (a = coef.Model [1], b = coef.Model [2])

La abline () argument un représente le point d'intersection, et b représente la pente de la ligne de tendance que vous voulez tracer. Vous tracez une ligne verticale en définissant l'argument v à l'intersection avec la X-axe à la place. Les lignes horizontales sont tracées en mettant l'argument v à l'intersection avec la y-axe.

Voici un aperçu des fonctions pour extraire des informations à partir de l'objet du modèle lui-même. Ces fonctions fonctionnent avec des objets de modèles différents, y compris ceux construits par AOV () et lm ().

De nombreux auteurs de paquets fournissent également les mêmes fonctions pour les modèles construits par les fonctions dans leur ensemble. Ainsi, vous pouvez toujours essayer d'utiliser ces fonctions d'extraction en combinaison avec d'autres fonctions du modèle ainsi.

Fonction	Ce qu'il fait
coef ()	Retourne un vecteur avec les coefficients du modèle
CONFINT ()	Renvoie une matrice avec la limite supérieure et inférieure de l'intervalle de theconfidence pour chaque coefficient du modèle
équipée ()	Retourne un vecteur avec les valeurs ajustées pour everyobservation
(résidus)	Retourne un vecteur avec les résiduels pour chaque observation
vcov ()	Renvoie la matrice de variance-covariance pour le coefficient

A propos Auteur

Comment faire pour créer une trame de données à partir d'une matrice dans r

Vous pouvez créer une trame de données à partir d'une matrice dans R. Jetez un oeil à le nombre de paniers marqués par Granny et son amie Géraldine. Si vous créez une matrice baskets.team avec le nombre de paniers pour les deux dames, vous…

Comment faire pour créer un terrain de treillis dans r

Explorer treillis graphiques dans R, d'abord jeter un oeil à l'ensemble de données intégré mtcars. Cette base de données contient 32 observations de voitures et des informations sur le moteur, comme le nombre de cylindres, automatiques contre…

Comment créer des types de terrain différents à r

La fonction de la parcelle en R a une type l'argument qui contrôle le type de tracé ce qui est dessiné. Par exemple, pour créer un terrain avec des lignes entre les points de données, utiliser type = "l"- pour tracer seulement les points,…

Comment évaluer les données linéaires avec r

Naturellement, R fournit un ensemble de différents tests et mesures pour évaluer la façon dont votre modèle correspond à vos données, ainsi que regarder les hypothèses du modèle. Encore une fois, la liste présentée ici est loin d'être…

Comment évaluer les différences dans vos données avec R

Pour vérifier le modèle de données que vous avez créé avec ANOVA (analyse de variance), vous pouvez utiliser les R résumé() la fonction de l'objet de modèle comme ceci:> Résumé de valeur (AOVModel) Df Somme Sq Sq Mean F Pr (> F) spray5 2…

Comment extraire les variables, les observations et les valeurs d'une trame de données dans r

Dans de nombreux cas, vous pouvez extraire des valeurs d'une trame de données dans la R en prétendant qu'il est une matrice. Mais bien que les trames de données peuvent ressembler à des matrices, ils ne sont certainement pas. Contrairement…

Comment identifier et de corriger les dimensions baissé en r

Chaque fonction dans R attend vos données soient dans un format spécifique. Cela ne signifie pas simplement de savoir si il est un entier, caractère, ou un facteur, mais aussi si vous fournissez un vecteur, une matrice, une trame de données, ou…

Comment prédire de nouvelles valeurs de données avec des r

En dehors de décrire les relations, les modèles peuvent également être utilisés pour prédire des valeurs pour de nouvelles données. Pour cela, de nombreux systèmes de modèles en R utilisent la même fonction, idéalement appelé prévoir…

Comment régler les contrastes pour vos données avec R

Avant de pouvoir utiliser les R AOV () fonction avec vos données, vous feriez mieux de régler le contrastes vous allez utiliser. Les contrastes sont très souvent oubliés quand faire ANOVA (analyse des variables), mais ils aident généralement…

Comment simplifier résultats (ou non) avec la fonction sapply dans r

La sapply () fonction ne renvoie pas toujours un vecteur. En fait, le niveau de sortie sapply est une liste, mais cette liste se simplifié soit une matrice ou un vecteur si possible.Si le résultat de la fonction appliquée à chaque élément de…

Comment utiliser la famille appliquer des fonctions de r

Utilisation pour boucles a des effets très importants secondaires. Les objets que vous créez dans le pour boucle rester dans l'espace de travail par la suite. Les objets que vous changez dans le pour boucle sont modifiés dans l'espace de travail.…

Comment utiliser l'interface de formule dans r

Une autre idée très important en R est l'interface de la formule. L'interface de formule vous permet de spécifier de façon concise les colonnes à utiliser lors de l'ajustement d'un modèle, ainsi que le comportement du modèle.Il est important…

Comment travailler avec les facteurs et les vecteurs numériques dans les modèles R et calculs

Si vous travaillez avec des facteurs de R qui ont des valeurs numériques comme les niveaux, vous devez être très prudent lors de l'utilisation de ces facteurs dans les modèles et d'autres calculs. Par exemple, vous convertissez le nombre de…

Calculer un modèle de régression sur la TI-83 Plus

La modélisation de régression est le processus de trouver une fonction qui correspond approximativement à la relation entre les deux variables en deux listes de données. Pour calculer un modèle de régression pour vos données à deux variables…

godiches.com » Ordinateurs et logiciels » Programmation » R » Comment modéliser linéaires relations de données avec r