Comment charger les données dans un classement de r analyse prédictive modèle

L'ensemble de données que nous analysons de faire une prédiction sur le jeu de données sur les semences, qui peut être trouvé à l'apprentissage automatique référentiel UCI. Cette base de données dispose de 210 observations et 7 attributs ainsi que l'étiquette. Le label est le résultat attendu et est utilisé pour former et évaluer l'exactitude du modèle prédictif.

Le résultat que vous essayez de prévoir le type de graines, il est (attribut 8), compte tenu des valeurs des sept attributs. Les trois valeurs possibles pour le type de semence sont étiquetés 1, 2 et 3, et représentent la Kama, Rosa, et les variétés canadiennes de blé.

Les attributs dans l'ordre de la colonne ils sont fournis:

  1. région

  2. périmètre




  3. compacité

  4. longueur de noyau

  5. largeur de noyau

  6. coefficient d'asymétrie

  7. longueur du noyau rainure

  8. classe de blé

Pour obtenir l'ensemble de données à partir du référentiel de l'UCI et le charger dans la mémoire, tapez la commande suivante dans la console:

> Graines lt; - 
read.csv ("http://archive.ics.uci.edu/ml/machine~~number=plural -learning-bases de données / 00236 / seeds_dataset.txt", tête = FALSE, SEP = "", as.is = true)

Vous voyez que le jeu de données a été chargé en mémoire que la variable de trame de données Source, en regardant votre volet d'espace de travail (en haut à droite). Clique le graines variable pour voir les valeurs de données dans le volet de la source (en haut à gauche). Ceci est la façon dont les données se regarde dans le volet source.

image0.jpg

Vous pouvez trouver plus d'informations sur les données que vous venez de charger en utilisant le résumé() fonction.

> Sommaires (graines) V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu:. 12,27 1er Qu:. 13.45 1er Qu:. 0.8569Median: 14.36 Médiane: 14.32 Médiane: 0.8734Mean: 14.85 Moyenne: 14.56 Moyenne: 0.87103rd Qu:. 17.30 3ème Qu:. 15,71 3ème Qu:. 0.8878 Max. : 21.18 Max. : 17.25 Max. : 0.9183 ...

» » » » Comment charger les données dans un classement de r analyse prédictive modèle