Notions de base de modèles de classification pour les prédictions analytiques

Une fois que vous avez tous les outils et les données nécessaires pour commencer à créer un modèle prédictif, le plaisir commence. En général, la création d'un modèle d'apprentissage pour les tâches de classification va entraîner les étapes suivantes:

Charger les données.
Choisissez un classificateur.
Former le modèle.
Visualisez le modèle.
Tester le modèle.
Évaluer le modèle.

Tant la régression logistique et Support Vector Machine (SVM) des modèles de classification effectuent plutôt bien en utilisant l'ensemble de données Iris.

Longueur des sépales	Sépale Largeur	Pétale Longueur	Pétale Largeur	Classe cible / Étiquette
5.1	3.5	1.4	0,2	Setosa (0)
7.0	3.2	4.7	1.4	Versicolor (1)
6.3	3.3	6.0	2.5	Virginica (2)

Le modèle de régression logistique avec le paramètre C = 1 était parfait dans ses prévisions, tandis que le modèle SVM et le modèle de régression logistique avec C = 150 manqué une seule prédiction. En effet, la haute précision des deux modèles est le résultat d'avoir un petit ensemble de données qui a des points de données qui sont à peu près linéairement séparables.

Fait intéressant, le modèle de régression logistique avec C = 150 avait une parcelle de surface de décision plus beau que celui avec C = 1, mais il n'a pas de meilleurs résultats. Cela ne veut pas une grosse affaire, étant donné que l'ensemble de test est si petit. Si une autre scission aléatoire entre jeu de la formation et de jeu de test avait été choisi, les résultats auraient pu facilement pu être différente.

Cela révèle une autre source de complexité qui surgit dans l'évaluation de modèle: l'effet de l'échantillonnage, et comment le choix de la formation et des ensembles de test peuvent affecter la sortie du modèle. Techniques de validation croisée peuvent aider à minimiser l'impact de l'échantillonnage aléatoire sur la performance du modèle.

Pour un ensemble de données plus vaste avec des données non-linéairement séparables, vous pouvez vous attendre les résultats de dévier encore plus. En outre, le choix du modèle approprié devient de plus en plus difficile en raison de la complexité et de la taille des données. Soyez prêt à passer beaucoup de temps à régler vos paramètres pour obtenir un ajustement idéal.

Lors de la création des modèles prédictifs, essayez quelques algorithmes et exhaustive affiner leurs paramètres jusqu'à ce que vous trouver ce qui fonctionne le mieux pour vos données. Puis comparer leurs sorties contre l'autre.

A propos Auteur

Comment créer un modèle d'analyse prédictive avec r régression

Vous voulez créer un modèle d'analyse prédictive que vous puissiez évaluer en utilisant les résultats connus. Pour ce faire, nous allons partager notre ensemble de données en deux ensembles: l'un pour l'apprentissage du modèle et un pour…

Comment créer un modèle d'apprentissage supervisé par régression logistique

Après vous construisez votre premier modèle prédictif de classification pour l'analyse des données, la création de plus de modèles comme il est une tâche très simples en scikit. La seule vraie différence d'un modèle à l'autre est que vous…

Comment Ensemble méthodes visant à accroître la précision analytique prévision

Comme dans le monde réel, donc avec la multiplicité des modèles d'analyse prédictive: Là où il ya l'unité, il ya la force. Plusieurs modèles peuvent être combinés de différentes manières pour faire des prédictions. Vous pouvez ensuite…

Comment de nouvelles prédictions analytiques avec r régression

Pour faire des prédictions analytiques avec de nouvelles données, vous utilisez simplement la fonction avec une liste des valeurs d'attribut sept. Le code suivant fait ce travail:> NewPrediction lt; - prédire (modèle,
liste (cylindres =…

Comment décrire les données d'essais et de test pour l'analyse prédictive

Lorsque vos données est prêt et vous êtes sur le point de commencer à construire votre modèle prédictif pour l'analyse, il est utile de décrire votre méthodologie de test et de rédiger un plan de test. Le test doit être guidée par les…

Comment faire pour exécuter les données d'essai et d'évaluer un modèle d'apprentissage supervisé svm

L'apprentissage supervisé est une tâche d'apprentissage qui apprend à la machine à partir de données d'analyse de prédiction qui ont été marqués. Une façon de penser à propos de l'apprentissage supervisé est que l'étiquetage des…

Comment faire pour exécuter les données de formation dans un modèle d'apprentissage supervisé svm

Avant que vous pouvez nourrir le classificateur Support Vector Machine (SVM) avec les données qui ont été chargés pour l'analyse prédictive, vous devez diviser l'ensemble de données complet en un ensemble de formation et un ensemble de…

Comment marquer vos prédictions analytiques précision

Lors de l'analyse de la qualité d'un modèle prédictif, vous aurez envie de mesurer son exactitude. L'une prévision plus précise le modèle fait, plus il est utile à l'entreprise, ce qui est une indication de sa qualité. Ceci est tout bon -…

Comment tester le modèle d'analyse prédictive

Pour être en mesure de tester le modèle d'analyse prédictive vous avez construit, vous devez diviser votre ensemble de données en deux ensembles: formation et de test des ensembles de données. Ces ensembles de données doivent être choisis au…

Comment utiliser l'analyse supervisées pour former des modèles prédictifs

Dans Analytics supervisées, l'entrée et la sortie préférée font partie des données de formation. Le modèle d'analyse prédictive est présenté avec les résultats corrects dans le cadre de son processus d'apprentissage. Un tel apprentissage…

Comment utiliser régressions linéaires dans l'analyse prédictive

Régression linéaire est une méthode statistique qui analyse et trouve les relations entre les deux variables. Dans l'analyse prédictive, il peut être utilisé pour prédire une valeur numérique d'une grandeur future.Prenons un exemple de…

L'exploration de données pour les données volumineuses

L'exploration de données consiste à explorer et d'analyser de grandes quantités de données pour trouver des modèles pour les grandes données. Les techniques sont sortis des domaines de la statistique et de l'intelligence artificielle (IA),…

Calculer un modèle de régression sur la TI-83 Plus

La modélisation de régression est le processus de trouver une fonction qui correspond approximativement à la relation entre les deux variables en deux listes de données. Pour calculer un modèle de régression pour vos données à deux variables…

La modélisation de régression sur la TI-84 Plus

La modélisation de régression est le processus de trouver une fonction qui correspond approximativement à la relation entre les deux variables en deux listes de données. Le tableau montre les types de modèles de régression de la calculatrice…

godiches.com » Ordinateurs et logiciels » Big Data » La science des données » Notions de base de modèles de classification pour les prédictions analytiques