Comment utiliser les données de lissage dans l'analyse prédictive

Lissage de données

Sommaire

l'analyse prédictive est, essentiellement, en essayant de trouver le “ le signal ” dans le “ le bruit ” en éliminant les points de données qui sont considérées “ ” ;. bruyant L'idée est d'aiguiser les tendances dans les données et de mettre en évidence les tendances des données pointe.

image0.jpg

L'implication derrière lissage de données est que les données se compose de deux parties: une partie (comprenant le points de données de base) Signifie que les tendances générales ou des tendances réelles, et une autre partie qui se compose principalement d'écarts (bruit) - Quelques points fluctuations qui résultent de certaine volatilité dans les données. Lissage de données vise à éliminer cette deuxième partie.

Comment baisser le bruit

Lissage de données fonctionne sur plusieurs hypothèses:

  • Que les fluctuations dans les données est plus probable d'être le bruit.

  • Que la partie bruyante des données est de courte durée.

  • Que la fluctuation des données, indépendamment de la façon dont il peut être variée, ne sera pas affecter les tendances sous-jacentes représentées par les points de données de base.

Le bruit dans les données tend à être aléatoire ses fluctuations ne devrait pas affecter les tendances globales tirées de l'examen du reste des données. Donc, réduire ou éliminer les points de données bruyants peuvent clarifier véritables tendances et des modèles dans les données - en effet, les données de l'amélioration “ rapport signal sur bruit ”.

Pourvu que vous avez identifié le bruit correctement et ensuite réduit ce, lissage de données peut vous aider à prédire les prochaines données observées indiquent simplement en suivant les grandes tendances que vous avez détectée dans les données.

Lissage de données se préoccupe de la majorité des points de données, leurs positions dans un graphique, et quels sont les motifs résultant prédisent au sujet de la tendance générale de (par exemple) un prix d'achat d'actions, si sa direction générale est haut, le bas ou latéralement.

Cette technique ne sera pas prédire avec précision le prix exact de la transaction suivante pour un stock donné - mais prédire une tendance générale peut apporter un éclairage plus puissant que de savoir le prix réel ou de ses fluctuations.

Une prévision basée sur une tendance générale déduite de données lissées suppose que la direction que les données ont suivi jusqu'ici continuera dans l'avenir d'une manière conforme à la tendance. Dans le marché boursier, par exemple, les performances passées ne indication précise du rendement futur, mais il peut certainement être un guide général pour l'évolution future du cours de l'action.

Méthodes, avantages et les inconvénients de lissage de données

Lissage de données ne sont pas être confondue avec ajustement d'un modèle, qui fait partie de l'analyse de données constitué de deux étapes:

  1. Trouver un modèle adapté qui représente les données.

  2. Assurez-vous que le modèle intègre les données de manière efficace.

Lissage de données se concentre sur l'établissement d'une orientation fondamentale pour les points de données de base (1) en ignorant les points de données bruyant et (2) l'élaboration d'une courbe lisse à travers les points de données qui saute ceux de frétillant et souligne motifs primaires - les tendances - dans les données, peu importe comment ralentir leur émergence. En conséquence, dans une série de temps numérique, lissage de données sert comme une forme de filtrage.




Lissage de données peut utiliser l'une des méthodes suivantes:

  • Marche aléatoire est basé sur l'idée que le prochain résultat, ou futur point de données, est un écart aléatoire à partir de la dernière adresse connue, ou présent, point de données.

  • Moyenne mobile est une moyenne mobile des périodes, équidistants consécutifs. Un exemple serait le calcul d'une moyenne mobile de 200 jours d'un prix de l'action.

  • Lissage exponentiel affecte de façon exponentielle plus de poids, ou de l'importance, aux points de données récentes que de points de données plus anciennes.

  • Simple: Cette méthode doit être utilisée lorsque les données de séries chronologiques n'a pas de tendance et pas de saisonnalité.

  • Linéaire: Cette méthode doit être utilisée lorsque les données de séries chronologiques a une ligne de tendance.

  • Saisonnier: Cette méthode doit être utilisée lorsque les données de séries chronologiques n'a pas de tendance, mais la saisonnalité.

Qu'est-ce que ces méthodes de lissage ont tous en commun est qu'ils réalisent une sorte de processus de calcul de la moyenne sur plusieurs points de données. Cette moyenne de points de données adjacents est le moyen essentiel de concentrer sur les tendances ou des motifs sous-jacents.

Les avantages de lissage de données sont

  • Il est facile à mettre en œuvre.

  • Il permet d'identifier les tendances.

  • Il permet d'exposer les modèles dans les données.

  • Il élimine les points de données que vous avez décidé de ne sont pas d'intérêt.

  • Il permet de prédire la direction générale des prochains points de données observées.

  • Il génère de belles graphiques lisses.

Mais tout a un inconvénient. Les inconvénients de lissage de données sont

  • Il peut éliminer les points de données valides qui résultent de phénomènes extrêmes.

  • Elle peut conduire à des prévisions inexactes si les données de test est uniquement saisonnière et pas entièrement représentatif de la réalité qui a généré les points de données.

  • Il peut se déplacer ou de fausser les données, en particulier les pics, résultant en une image déformée de ce qui se passe.

  • Il peut être vulnérable à des perturbations importantes de valeurs aberrantes dans les données.

  • Il peut en résulter un écart important par rapport aux données originales.

Si lissage de données ne fait que donner les données d'un simple lifting, il peut tirer une fondamentalement mauvais dans les manières suivantes:

  • Elle peut introduire des erreurs à travers les distorsions qui traitent les données lissées comme si elle était identique à celle des données originales.

  • Il peut fausser l'interprétation en ignorant - et la clandestinité - risques incorporés dans les données.

  • Elle peut conduire à une perte de détail au sein de votre données - qui est une façon qu'une courbe lissée peut varier fortement de celle des données originales.

Comment sérieux lissage de données peut affecter vos données dépend de la nature des données à portée de main, et qui a été mis en œuvre technique de lissage sur ces données. Par exemple, si les données d'origine a plusieurs pics en elle, puis lissage de données conduira à grand déplacement de ces pics dans les graphiques lissées - probablement une distorsion.

Voici quelques points en garde à garder à l'esprit que vous vous approchez de lissage de données:

  • Il est une bonne idée de comparer les graphiques lissées aux graphes vierges que tracer les données originales.

  • Les points de données enlevés pendant lissage de données peuvent ne pas être Bruit ils pourraient être, points de données réelles qui sont valides résultat d'événements rares, mais réel.

  • Lissage de données peut être utile dans la modération, mais son utilisation excessive peut conduire à une fausse déclaration de vos données.

En appliquant votre jugement professionnel et votre expertise de connaissance de l'entreprise, vous pouvez utiliser les données de lissage efficacement. Enlever le bruit de votre données - sans nuire à la précision et l'utilité des données d'origine - est au moins autant un art qu'une science.


» » » » Comment utiliser les données de lissage dans l'analyse prédictive