Comment introduire les données dans r régression pour l'analyse prédictive

L'ensemble de données que vous allez utiliser dans cet exemple est le jeu de données Auto-MPG, qui peut être trouvé dans le référentiel de l'UCI. Cette base de données a 398 observations et 8 attributs, plus l'étiquette.

La étiquette escomptée outcome- il est utilisé pour former et évaluer l'exactitude du modèle prédictif. Le résultat que nous essayons de prédire est le mpg attendu (attribut 1) d'un véhicule automobile lorsqu'il est administré les valeurs des huit attributs.

Voici les attributs dans l'ordre des colonnes dans lesquelles ils sont fournis:

  • mpg

  • cylindres

  • déplacement




  • cheval-vapeur

  • poids

  • accélération

  • l'année modèle

  • origine

  • nom de voiture

Pour obtenir l'ensemble de données à partir du référentiel de l'UCI et le charger dans la mémoire, tapez la commande suivante dans la console:

> Autos lt; - read.csv ("http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data",
tête = FALSE, SEP = "", as.is = TRUE)

Vous verrez que le jeu de données a été chargé en mémoire que la variable de trame de données autos, en regardant votre volet d'espace de travail (le volet en haut à droite). Clique le autos variable pour voir les valeurs de données dans le volet de la source (le volet en haut à gauche).

image0.jpg

Bache, K. Lichman, M. (2013). Référentiel Machine Learning UCI [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information et informatique.

Utilisation des fonctions de tête et de queue peut être utile parfois, si vous voulez juste voir les cinq premières et dernières lignes de données. Ceci est également un moyen rapide pour vérifier que vous avez réellement chargé le fichier correct et il a été lu correctement. La fonction peut vous donner des statistiques de base sur chaque colonne des données.

Vous pouvez copier et coller les trois lignes de code suivantes dans le volet source et ont montré la sortie de la console:

tête (autos, 5) queue (autos, 5) Résumé (autos)

» » » » Comment introduire les données dans r régression pour l'analyse prédictive