Comment décrire les données d'essais et de test pour l'analyse prédictive

Lorsque vos données est prêt et vous êtes sur le point de commencer à construire votre modèle prédictif pour l'analyse, il est utile de décrire votre méthodologie de test et de rédiger un plan de test. Le test doit être guidée par les objectifs de l'entreprise que vous avez recueilli, documenté, et recueilli toutes les données nécessaires pour vous aider à atteindre.

Dès le départ, vous devez concevoir une méthode pour tester si un objectif d'affaires a été atteint avec succès. Depuis l'analyse prédictive mesurent la probabilité d'une issue avenir - et la seule façon d'être prêt à courir un tel test est par la formation de votre modèle sur des données passées, vous avez encore à voir ce qu'il peut faire quand il est contre les futures données.




Bien sûr, vous ne pouvez pas courir le risque d'un modèle prévenus sur les futures données réelles, de sorte que vous aurez besoin d'utiliser les données existantes afin de simuler de façon réaliste les futures données. Pour ce faire, vous devez diviser les données que vous travaillez sur dans la formation et de test des ensembles de données.

Assurez-vous que vous sélectionnez ces deux ensembles de données au hasard, et que les deux ensembles de données contiennent et couvrent tous les paramètres de données que vous mesurez.

Lorsque vous divisez vos données en ensembles de données de test et de formation, vous évitant de manière efficace les problèmes de sur-apprentissage qui pourraient découler de surentraînement le modèle sur l'ensemble des données et de ramasser tous les motifs de bruit ou des caractéristiques spécifiques qui appartiennent seulement à l'échantillon de données, et ne sont pas applicable à d'autres ensembles de données.

La séparation des données en apprentissage et de test des ensembles de données, environ 70 pour cent et 30 pour cent respectivement, assure une mesure précise de la performance du modèle d'analyse prédictive vous construisez. Vous voulez évaluer votre modèle contre les données de test, car elle est un moyen simple de mesurer si les prédictions du modèle sont exacts.


» » » » Comment décrire les données d'essais et de test pour l'analyse prédictive