Comment décider de garder les valeurs aberrantes dans l'analyse prédictive

Décider d'inclure les valeurs aberrantes dans l'analyse - ou de les exclure - aura des implications pour votre modèle d'analyse prédictive. Garder les valeurs aberrantes dans le cadre des données dans votre analyse peut mener à un modèle qui est non applicable - soit pour les valeurs aberrantes ou pour le reste des données.

Si vous décidez de garder une valeur aberrante, vous aurez besoin de choisir les techniques et les méthodes statistiques qui excellent dans la manipulation des valeurs aberrantes sans influencer l'analyse. Une telle technique est d'utiliser des fonctions mathématiques tels que les algorithmes naturelles et la racine carrée de réduire l'écart entre les valeurs aberrantes et le reste des données.

Ces fonctions, cependant, ne fonctionnent que pour les données numérique qui est supérieur à zéro - et d'autres problèmes peuvent survenir. Par exemple, la transformation des données peut nécessiter des interprétations de la relation entre les variables dans les données nouvellement transformées qui diffèrent de l'interprétation qui régit les variables dans les données d'origine.




La simple présence de valeurs aberrantes dans vos données peut fournir des indications sur votre entreprise qui peut être très utile dans la génération d'un modèle robuste. Les valeurs aberrantes peuvent attirer l'attention sur un cas d'entreprise valide qui illustre un bit événement important inhabituel.

Vous cherchez des valeurs aberrantes, les identifier et d'évaluer leur impact devrait faire partie de l'analyse des données et de prétraitement. Experts du domaine d'affaires peuvent donner un aperçu et vous aider à décider quoi faire avec les cas inhabituels dans votre analyse. Bien que parfois le sens commun est tout ce que vous devez faire face à des valeurs aberrantes, il est souvent utile de demander à quelqu'un qui connaît les ficelles du métier.

Si vous êtes dans une entreprise qui bénéficie d'événements rares - par exemple, un observatoire astronomique avec une subvention pour l'étude des astéroïdes en orbite de la Terre-franchissement - vous êtes plus intéressé par les valeurs aberrantes que dans la masse des données.

Les valeurs aberrantes peuvent être une grande source d'information. Déviant de la norme pourrait être un signal d'une activité suspecte, nouvelles de dernière heure, ou un événement opportuniste ou catastrophique. Vous devrez peut-être développer des modèles qui vous aident à identifier les valeurs aberrantes et les ânes les risques qu'ils signifient.

Il est prudent de procéder à deux analyses: une qui comprend les valeurs aberrantes, et un autre qui les omet. Ensuite, examiner les différences, essayer de comprendre les implications de chaque méthode, et d'évaluer la façon dont l'adoption d'une méthode plutôt qu'une autre pourrait influencer vos objectifs d'affaires.


» » » » Comment décider de garder les valeurs aberrantes dans l'analyse prédictive