Prédire les valeurs des clients avec la ligne de régression

Bien qu'une corrélation parle à la force d'une relation entre les deux variables, et la r2 contribue à expliquer que la force de la relation, ce que vous devez faire pour prédire une variable d'un autre est d'utiliser une extension de l'analyse de régression de corrélation appelé. Analyse de régression qui est connu comme un “ bourreau de travail n ° 148; l'analyse prédictive. Le calcul est pas trop compliqué, et la plupart des logiciels soutenir l'analyse de régression.

L'analyse de régression étend l'idée du nuage de points utilisé en corrélation et ajoute une ligne qui mieux “ adapte ” les données.

L'une des exigences de l'utilisation de corrélations et l'analyse de régression est que les données sont linéaires. Linear signifie une ligne peut raisonnablement décrire la relation entre les variables et ensuite être utilisé pour prédire les valeurs qui ne figurent pas dans vos données (points de données de la clientèle future). Si le nuage de vos données forme une courbe, ou toute forme une ligne ne correspond pas bien, vous pouvez obtenir des résultats trompeurs.

Bien qu'il existe de nombreuses façons de dessiner des lignes à travers les données, l'analyse des moindres carrés est une façon mathématique qui permet de réduire la distance entre la ligne et chaque point dans le nuage de points. Cette analyse peut être fait à la main ou à l'aide de logiciels tels que Minitab, SPSS, SAS, R, ou Excel.

La figure montre une ligne de régression des moindres carrés.

image0.jpg

Le logiciel vous donne l'équation de la droite de régression dessus du graphique:

Temps = 86.57 + 4.486 Taps

L'équation de régression prend la forme générale de la

image1.jpg


Voici une explication de chaque partie de l'équation:

image2.jpg

(prononcé y chapeau): Ceci est la valeur prédite de la variable dépendante: temps prédit.

  • b0: Appelé le y-interception, ceci est où la ligne traverserait (ou l'origine) avec le y-axe.

  • b1: Ceci est la pente de la ligne prévue (comment il est raide).

  • X: Cela représente une valeur particulière de la variable indépendante: robinets.

  • e: représente l'erreur inévitable la prédiction contiendra.

Donc, dans cet exemple, l'équation de régression indique que le montant prévu de temps qu'il faut à un client de faire un achat est égal à 86,57 (le y-interception) plus 4,486 (la pente), multiplié par le nombre d'entailles (X).

Il est la formule de régression qui vous permet de prédire les valeurs des clients qui ne figurent pas dans vos données. Il vous permet d'effectuer “ what-if ” analyses sur les valeurs futures des clients. C'est le “ prédictive ” partie de l'analyse client prédictifs.

Par exemple, en utilisant l'équation de régression de l'exemple précédent, vous pouvez prédire combien de temps un client prend de faire un achat avec 38 robinets. Vous remplissez seulement 38 dans l'équation de régression.

Temps = 86,57 + 4,486 (38)
Temps = 86,57 + 170,47 = 257,04

Un client a besoin de 257 secondes, ou un peu plus de quatre minutes, pour faire un achat qui nécessite 38 robinets.

La variable dépendante est notée “ Y ” et est affiché sur l'axe des y (vertical). La variable indépendante est appelé X et est affiché sur le (x) axe horizontal.

Au lieu de prédire le temps de travail d'un client des robinets, cette même approche peut être utilisée pour prédire d'autres analyse de la clientèle, y compris:

  • Revenus de la clientèle des recettes publicitaires

  • Probabilité de recommander à partir de données de la convivialité

  • Nombre de conversions sur le site Web de pages vues


» » » » Prédire les valeurs des clients avec la ligne de régression