Comment créer un classement de r analyse prédictive modèle

Vous voulez créer un modèle d'analyse prédictive que vous puissiez évaluer en utilisant les résultats connus. Pour ce faire, diviser la graines ensemble de données en deux ensembles: l'un pour l'apprentissage du modèle et un pour tester le modèle. A 70/30 entre la formation et les essais des ensembles de données suffira. Les deux prochaines lignes de code calculer et stocker les tailles de chaque ensemble de données:

> TrainSize lt; - ronde (nrow (graines) * 0,7)> testSize lt; - nrow (graines) - trainSize

À la sortie des valeurs, tapez le nom de la variable que vous avez utilisé pour stocker la valeur et appuyez sur Entrée. Voici le résultat:

> TrainSize [1] 147> testSize [1] 63

Ce code détermine les tailles pour la formation et les essais des ensembles de données. Vous ne l'avez pas fait encore créé les séries. En outre, vous ne voulez pas seulement les 147 premières observations à la formation fixés et les 63 dernières observations à l'ensemble de test. Cela créerait un mauvais modèle parce que le graines ensemble de données est ordonné dans la colonne de l'étiquette.

Ainsi vous avez à faire à la fois l'ensemble de la formation et de l'ensemble essai représentant de l'ensemble des données. Une façon de le faire est de créer la formation de définir une sélection aléatoire de l'ensemble des données.

En outre, vous voulez faire ce test reproductible de sorte que vous pouvez apprendre de la même exemple. Vous pouvez le faire en mettant l'ensemble de données pour le générateur aléatoire de sorte que vous avez le même "aléatoire" ensemble de la formation, comme ceci:

> Set.seed (123)> training_indices lt; - échantillons (seq_len (nrow (graines)),
 size = trainSize)> rame lt; - semences [training_indices,]> testSet lt; - semences [-training_indices,]

L'ensemble de la formation que vous recevez de ce code contient 147 observations le long avec un résultat (seedType) De chaque observation. Lorsque vous créez le modèle, vous direz à l'algorithme qui variable est le résultat. L'algorithme de classification utilise ces résultats pour former le modèle en regardant les relations entre les variables prédictives (l'une des sept attributs) et l'étiquette (seedType).

L'ensemble de test contient le reste des données, qui est, toutes les données ne figurent pas dans le jeu de la formation. Notez que l'installation d'essai comprend également l'étiquette (seedType). Lorsque vous utilisez le prédire fonction (du modèle) avec l'ensemble de test, il ignore l'étiquette et utilise uniquement les variables prédictives, aussi longtemps que les noms de colonnes sont les mêmes car ils sont dans l'ensemble de la formation.

La fête package est l'un des plusieurs paquets dans R qui créent des arbres de décision. (Autres forfaits arbres de décision commune comprennent rpart, arbre, et randomForest.) La prochaine étape est d'utiliser le paquet pour créer un modèle d'arbre de décision, à l'aide seedType que la variable cible et toutes les autres variables comme des variables prédictives. La première étape de ce processus est d'installer le paquet et le charger dans notre session de R.

Tapez les lignes suivantes de code à installer et à charger le fête forfait:

> Install.packages («partie»)> bibliothèque (parti)

Vous êtes maintenant prêt à former le modèle. Tapez dans la ligne de code suivante:

> Modèle lt; - ctree (. seedType ~, data = rame)

Pour faire des prédictions avec de nouvelles données, vous utilisez simplement la fonction vec une liste des valeurs d'attribut sept. Le code suivant fait que:

> NewPrediction lt; - prédire (modèle, la liste (zone = 11,
 périmètre = 13, compacité = 0,855, longueur = 5,
 width = 2.8, l'asymétrie = 6,5, length2 = 5),
 intervalle = "prédire", level = 0,95)

Ceci est le code de sortie et la nouvelle valeur de prédiction.

> NewPrediction [1] 3Levels: 1 2 3

La prédiction était type de semence 3, ce qui est pas surprenant parce valeurs ont été délibérément choisis qui étaient proches à l'observation n ° 165.

A propos Auteur

Comment expliquer les résultats d'une classification des r analyse prédictive modèle

Une autre tâche de l'analyse prédictive est de classer les nouvelles données en prédisant quelle classe un élément de cible de données appartient, étant donné un ensemble de variables indépendantes. Vous pouvez, par exemple, de classer un…

Comment expliquer les résultats analytiques prédictifs de régression r

Une fois que vous créez un modèle de régression de R pour l'analyse prédictive, vous voulez être en mesure d'expliquer les résultats de l'analyse. Pour voir quelques informations utiles sur le modèle, le type dans le code suivant:> Résumé…

Comment introduire les données dans r régression pour l'analyse prédictive

L'ensemble de données que vous allez utiliser dans cet exemple est le jeu de données Auto-MPG, qui peut être trouvé dans le référentiel de l'UCI. Cette base de données a 398 observations et 8 attributs, plus l'étiquette.La étiquette…

Comment charger des données dans un modèle d'apprentissage svm supervisé

Pour l'analyse prédictive, vous devez charger les données de vos algorithmes à utiliser. Chargement du jeu de données dans Iris scikit est aussi simple que la délivrance d'un couple de lignes de code, car scikit a déjà créé une fonction…

Comment charger les données dans un classement de r analyse prédictive modèle

L'ensemble de données que nous analysons de faire une prédiction sur le jeu de données sur les semences, qui peut être trouvé à l'apprentissage automatique référentiel UCI. Cette base de données dispose de 210 observations et 7 attributs…

Comment de nouvelles prédictions analytiques avec r régression

Pour faire des prédictions analytiques avec de nouvelles données, vous utilisez simplement la fonction avec une liste des valeurs d'attribut sept. Le code suivant fait ce travail:> NewPrediction lt; - prédire (modèle,
liste (cylindres =…

Comment décrire les données d'essais et de test pour l'analyse prédictive

Lorsque vos données est prêt et vous êtes sur le point de commencer à construire votre modèle prédictif pour l'analyse, il est utile de décrire votre méthodologie de test et de rédiger un plan de test. Le test doit être guidée par les…

Comment préparer les données dans un classement de r analyse prédictive modèle

Pour exécuter une analyse prédictive, vous devez obtenir les données sous une forme que l'algorithme peut utiliser de construire un modèle. Pour ce faire, vous avez à prendre un certain temps à comprendre les données et de connaître sa…

Comment faire pour exécuter les données d'essai et d'évaluer un modèle d'apprentissage supervisé svm

L'apprentissage supervisé est une tâche d'apprentissage qui apprend à la machine à partir de données d'analyse de prédiction qui ont été marqués. Une façon de penser à propos de l'apprentissage supervisé est que l'étiquetage des…

Comment faire pour exécuter les données de formation dans un modèle d'apprentissage supervisé svm

Avant que vous pouvez nourrir le classificateur Support Vector Machine (SVM) avec les données qui ont été chargés pour l'analyse prédictive, vous devez diviser l'ensemble de données complet en un ensemble de formation et un ensemble de…

Comment tester le modèle d'analyse prédictive

Pour être en mesure de tester le modèle d'analyse prédictive vous avez construit, vous devez diviser votre ensemble de données en deux ensembles: formation et de test des ensembles de données. Ces ensembles de données doivent être choisis au…

Comment utiliser l'analyse supervisées pour former des modèles prédictifs

Dans Analytics supervisées, l'entrée et la sortie préférée font partie des données de formation. Le modèle d'analyse prédictive est présenté avec les résultats corrects dans le cadre de son processus d'apprentissage. Un tel apprentissage…

Comment utiliser régressions linéaires dans l'analyse prédictive

Régression linéaire est une méthode statistique qui analyse et trouve les relations entre les deux variables. Dans l'analyse prédictive, il peut être utilisé pour prédire une valeur numérique d'une grandeur future.Prenons un exemple de…

L'exploration de données pour les données volumineuses

L'exploration de données consiste à explorer et d'analyser de grandes quantités de données pour trouver des modèles pour les grandes données. Les techniques sont sortis des domaines de la statistique et de l'intelligence artificielle (IA),…

godiches.com » Ordinateurs et logiciels » Big Data » La science des données » Comment créer un classement de r analyse prédictive modèle