Les techniques de prévision dans l'analyse statistique des données volumineuses

Beaucoup de techniques différentes ont été conçus pour prévoir la valeur future d'une variable. Deux d'entre elles sont des modèles de régression série de temps et des modèles de simulation.

Sommaire

  • Modèles de régression série temps
  • Les modèles de simulation

Modèles de régression série Temps

UN modèle série de régression de temps est utilisé pour estimer la tendance suivie d'une variable dans le temps, en utilisant des techniques de régression. UN ligne de tendance montre la direction dans laquelle se déplace une variable au cours du temps.

A titre d'exemple, La figure montre une série de temps que représente la production annuelle d'une mine d'or (mesurée en milliers d'onces par an) depuis la mine a ouvert il ya dix ans.

Une série chronologique montrant la sortie d'or par an pendant les dix dernières années.
Une série chronologique montrant la sortie d'or par an pendant les dix dernières années.

L'équation de la ligne de tendance est estimé à

Y = 0,9212X + 1,3333



X est l'année.
Y est la production annuelle de l'or (mesurée en milliers d'onces).

Cette ligne de tendance est estimée en utilisant une analyse de régression. La ligne de tendance indique que, en moyenne, la sortie de la mine augmente de 0.9212 mille (921,2 oz) chaque année.

Vous pouvez utiliser cette ligne de tendance à prévoir la sortie de l'année prochaine (la 11e année de fonctionnement) en remplaçant 11 pour X, comme suit:

Y = 0,9212X + 1,3333
Y = 0,9212 (11) + 1,3333 = 11,4665

Basé sur l'équation de la ligne de tendance, serait la mine devrait produire 11,466.5 onces d'or l'année prochaine.

Les modèles de simulation

Tu peux utiliser simulation modèles pour prévoir une série de temps. Les modèles de simulation sont extrêmement flexibles, mais peuvent être extrêmement longs à mettre en œuvre. Leur exactitude dépend aussi sur des hypothèses faites au sujet des propriétés statistiques de la données de séries chronologiques.

Deux approches standard à la prévision de séries financières à l'aide de modèles de simulation sont simulation historique et la simulation de Monte Carlo.

Simulation historique

Historique la simulation est une technique utilisée pour générer une distribution de probabilité pour une variable à mesure qu'il évolue au fil du temps, en fonction de ses valeurs passées. Si les propriétés de la variable simulée restent stables dans le temps, cette technique peut être très précis. Un inconvénient de cette approche est que, pour obtenir une prévision précise, vous devez avoir beaucoup de données. Elle dépend aussi de l'hypothèse que le comportement passé d'une variable se poursuivra dans l'avenir.

A titre d'exemple, cette figure montre un histogramme qui représente les rendements à un stock au cours des 100 derniers jours.

Un histogramme des rendements boursiers.
Un histogramme des rendements boursiers.

Cet histogramme montre la distribution de probabilité des rendements sur la base d'actions sur les 100 derniers jours de négociation. Le graphique montre que le retour le plus fréquent au cours des 100 derniers jours était une perte de 2 pour cent, le deuxième le plus fréquent était une perte de 3 pour cent, et ainsi de suite. Vous pouvez utiliser les informations contenues dans ce graphique pour créer une distribution de probabilité pour le retour le plus probable de ce stock au cours de la journée de négociation à venir.

Simulation de Monte Carlo

monte Carlo la simulation est une technique dans laquelle des nombres aléatoires sont substituées dans un modèle statistique afin de prévoir les valeurs futures d'une variable. Cette méthodologie est utilisée dans de nombreuses disciplines différentes, y compris les finances, l'économie et les sciences dures, telles que la physique. Simulation de Monte Carlo peut fonctionner très bien, mais peut aussi être extrêmement fastidieux à mettre en œuvre. En outre, sa précision dépend du modèle statistique utilisé pour décrire le comportement de la série chronologique.


» » » » Les techniques de prévision dans l'analyse statistique des données volumineuses