Comment utiliser régressions linéaires dans l'analyse prédictive

Régression linéaire est une méthode statistique qui analyse et trouve les relations entre les deux variables. Dans l'analyse prédictive, il peut être utilisé pour prédire une valeur numérique d'une grandeur future.

Prenons un exemple de données qui contient deux variables: les données antérieures comprenant les temps d'arrivée d'un train et son temps de retard correspondant. Supposons que vous voulez prévoir ce que le retard serait le prochain train. Si vous appliquez la régression linéaire pour ces deux variables - l'arrivée et temps de retard - vous pouvez générer une équation linéaire comme

Retard = a + (b * Heure d'arrivée) + d

Cette équation exprime la relation entre le temps de retard et le temps d'arrivée. Les constantes un et b sont les paramètres du modèle. La variable est le terme d'erreur (également connu sous le reste) - Une valeur numérique qui représente l'écart entre les deux variables retard et heure d'arrivée. Si l'erreur est pas égal à zéro, qui pourraient indiquer qu'il existe des critères affectant la variable retard.

Si vous êtes assis à la gare, vous pouvez simplement brancher l'heure d'arrivée dans l'équation précédente et vous pouvez calculer le délai prévu, en utilisant les paramètres donnés par le modèle de régression linéaire a, b, et .

La régression linéaire est (comme vous pouvez l'imaginer) le plus approprié pour les données linéaires. Mais il est très sensible vers les valeurs aberrantes dans les points de données. Les valeurs aberrantes dans vos données peuvent avoir un impact significatif sur le modèle. Il est recommandé que vous supprimez ces valeurs aberrantes de l'ensemble de la formation si vous avez l'intention d'utiliser la régression linéaire pour votre modèle prédictif.


» » » » Comment utiliser régressions linéaires dans l'analyse prédictive