Comment résoudre les problèmes dans l'analyse prédictive

La modélisation prédictive est gagne en popularité comme un outil pour gérer de nombreux aspects de l'entreprise. Veiller à ce que l'analyse des données se fait à droite renforcera la confiance dans les modèles utilisés - qui, à son tour, peut générer le buy-in nécessaire pour l'analyse prédictive pour devenir une partie de boîte à outils standard de votre organisation.

Sommaire

Peut-être cette popularité croissante provient de la façon dont un projet d'analyse prédictive peut soutenir la prise de décision en créant des modèles qui décrivent les ensembles de données, découvrent possibles les nouvelles tendances (comme indiqué par les données), et de prédire les résultats avec une plus grande fiabilité.

Pour atteindre cet objectif, un projet d'analyse prédictive doit livrer un modèle qui correspond le mieux aux données en sélectionnant les variables de décision correctement et efficacement. Doivent être répondues en route vers cet objectif quelques questions essentielles:

  • Quelles sont les hypothèses minimales et variables de décision qui permettent le modèle pour répondre au mieux les données?

  • Comment le modèle en cours de construction par rapport aux autres modèles applicables?

  • Quels sont les critères d'évaluation et de mieux marquer ce modèle?

Une fois de plus, vous pouvez appeler la voix de l'expérience à la rescousse: les experts de connaissances domaine peuvent discuter de ces questions, d'interpréter des résultats qui montrent des tendances cachées dans les données, et vous aider à vérifier et valider la sortie du modèle.

Comment décrire les limites du modèle d'analyse prédictive

Tout modèle analytique prédictive a certaines limites fondées sur les algorithmes qu'elle emploie et l'ensemble de données, il fonctionne sur. Vous devez être conscient de ces limites et les faire travailler à votre Advantage- ceux liés aux algorithmes comprennent




  • Si les données ont modèles non linéaires (ne forme pas une ligne)

  • Comment fortement corrélé les variables sont (relations statistiques entre les caractéristiques)

  • Si les variables sont indépendantes (pas de relations entre les entités)

  • Que la portée des données de l'échantillon rend le modèle sujettes à overfitting

Pour surmonter les limites de votre modèle, l'utilisation rationnelle validation croisée techniques pour tester vos modèles. Commencez en divisant vos données en apprentissage et de test des ensembles de données, et exécuter le modèle contre chacun de ces ensembles de données séparément à évaluer et à marquer les prédictions du modèle.

Comment tester et d'évaluer votre modèle d'analyse prédictive

Aucun modèle ne peut produire de 100 pour cent exact forecasts- tout modèle a le potentiel pour produire des résultats inexacts. Soyez à l'affût de toute variation significative entre les prévisions de votre modèle produit et les données observées - surtout si les sorties du modèle contredisent le sens commun. Si cela semble trop bon, mauvais, ou l'extrême pour être vrai, alors il est probablement pas vrai (à la réalité, de toute façon).

Dans le processus d'évaluation, d'examiner soigneusement les sorties des modèles que vous testez et de les comparer aux variables d'entrée. La capacité de prévision de votre modèle doit répondre à tous les objectifs de l'entreprise énoncés qui ont poussé sa création en premier lieu.

Si des erreurs ou des préjugés surgissent dans la sortie de votre modèle, essayez de les remonter jusqu'à

  • La validité, la fiabilité, et la saisonnalité relative des données

  • Hypothèses utilisées dans le modèle

  • Variables qui ont été inclus ou exclus dans l'analyse

Travailler avec les utilisateurs professionnels d'évaluer chaque étape de votre modèle de processus de faire en sorte que les sorties de modèles peuvent être facilement interprétés et utilisés dans une situation d'affaires dans le monde réel. Équilibrer l'exactitude et la fiabilité du modèle avec quelle facilité les sorties du modèle peuvent être interprétés et mis en pratique.

Comment éviter les modèles non-évolutives d'analyse prédictive

Lorsque vous construisez un modèle, toujours garder à l'esprit l'évolutivité. Toujours vérifier la performance, la précision et la fiabilité du modèle à différentes échelles. Votre modèle doit être en mesure de modifier son échelle - et intensifier aussi grand que nécessaire - sans tomber en morceaux ou en sortie de mauvaises prédictions.

Évolutivité était tout un défi dans le passé. Les modèles prédictifs ont pris beaucoup de temps à construire et à exécuter. Les ensembles de données sur les modèles couraient étaient petits, et les données ont été coûteuses à collecter, stocker et recherche. Mais ce fut tout dans le “ les données pré-big ” ère.

Aujourd'hui, Big Data est pas cher, abondant et croissant. En fait, un autre problème potentiel se dessine: Le volume de données redoutable actuellement disponibles peut affecter négativement le modèle et dégrader ses performances, obsolescence du modèle dans une période relativement courte de temps. Correctement mis en œuvre, l'évolutivité peut aider “ l'épreuve du futur ” votre modèle.

L'avenir est pas la seule menace. Même dans l'ère présente ligne, streaming des données peut submerger un modèle - surtout si les flux d'augmentation de données à une inondation.

Seul volume de données peut causer les variables de décision et les facteurs prédictifs de croître à des chiffres géants qui nécessitent une mise à jour continue du modèle. Alors oui, votre modèle a intérêt à être évolutive - rapidement évolutive.


» » » » Comment résoudre les problèmes dans l'analyse prédictive