Comment Ensemble méthodes visant à accroître la précision analytique prévision

Comme dans le monde réel, donc avec la multiplicité des modèles d'analyse prédictive: Là où il ya l'unité, il ya la force. Plusieurs modèles peuvent être combinés de différentes manières pour faire des prédictions. Vous pouvez ensuite appliquer le modèle combiné - appelé modèle d'ensemble - à la phase d'apprentissage, à l'étape de classification, ou aux deux étapes.

Voici une façon d'utiliser un modèle d'ensemble:

  1. Diviser les données de formation en plusieurs ensembles.

  2. Avoir chacun des modèles individuels qui composent les pièces ensemble de processus de modèle de données et en tirer des leçons.

  3. Demandez à chaque modèle de produire son résultat d'apprentissage à partir de ces données.




Jusqu'ici, tout va bien. Mais pour obtenir le modèle d'ensemble de prévoir une étiquette de classe ou catégorie avenir pour de nouvelles données et de prendre une décision, vous devez exécuter les nouvelles données à travers toutes les modèles- formés chaque modèle prédit une étiquette de classe. Puis, sur la base de la classification collective ou prédiction, vous pouvez générer une prévision globale.

Vous pouvez générer cette prévision globale par simple mise en œuvre d'un mécanisme de vote qui décide du résultat final. Une technique de vote pourrait utiliser l'étiquette que la majorité des modèles prédisent que l'étiquette que le modèle d'ensemble produit comme résultat.

Supposons que vous voulez construire un modèle qui permettra de prédire si un e-mail entrant est un spam. Supposons que les données de la formation consiste en un ensemble d'e-mails dans lesquels certains sont du spam et autres ne sont pas. Ensuite, vous pouvez distribuer ce jeu de données à un certain nombre de modèles à des fins de formation.

Ensuite, les modèles formés traitent un e-mail entrant. Si la majorité des modèles classer comme spam, alors le modèle d'ensemble donne l'e-mail l'étiquette finale de spam.

Une autre façon de mettre en œuvre un modèle d'ensemble est de peser l'exactitude de chaque modèle que vous construisez dans le modèle d'ensemble contre l'exactitude de tous les autres modèles de la ensemble:

  1. Vous affectez un poids spécifique (précision) pour chaque modèle.

  2. Ce poids varie d'un ensemble de données à l'autre et d'un problème d'entreprise à l'autre.

  3. Après les modèles sont formés, vous pouvez utiliser les données de test où vous savez que la classification de chaque point de données dans les données de test.

  4. Évaluer la prédiction faite par chaque modèle pour chaque cas de test.

  5. Augmenter le poids pour les modèles qui prédisaient correctement et diminuer le poids pour les modèles qui ont classé les données de manière incorrecte.


» » » » Comment Ensemble méthodes visant à accroître la précision analytique prévision