L'analyse de régression dans l'analyse statistique des données volumineuses

Régression analyse est utilisé pour estimer la force et la direction de la relation entre les variables qui sont linéairement liées entre elles. Deux variables X et Y sont dites linéairement liées si la relation entre eux peut être écrit sous la forme

Y = mX + b

m est le pente, ou le changement de Y en raison d'un changement donné dans X
b est le interception, ou la valeur de Y quand X = 0



Comme un exemple d'analyse de régression, supposons qu'une société veut déterminer si ses dépenses de publicité sont en fait augmenter les profits, et si oui, de combien. La société recueille des données sur la publicité et les profits pour les 20 dernières années et utilise ces données pour estimer l'équation suivante:

Y = 50 + 0,25X

Y représente les bénéfices annuels de la société (en millions de dollars).
X représente les dépenses publicitaires annuelles de la société (en millions de dollars).

Dans cette équation, la pente est égale à 0,25, et l'interception est égal à 50. Parce que la pente de la droite de régression est de 0,25, ce qui indique que, en moyenne, pour chaque augmentation de 1 million $ en dépenses de publicité, les bénéfices augmentent de 0,25 millions $, ou de 250 000 $ . Parce que l'interception est de 50, ce qui indique que sans publicité, les bénéfices seraient encore 50 millions $.

Cette équation, par conséquent, peut être utilisé pour prévoir les bénéfices futurs basés sur les dépenses de publicité prévues. Par exemple, si la société prévoit de dépenser 10 millions $ en publicité l'année prochaine, ses bénéfices attendus seront comme suit:

Y = 50 + 0,25X
Y = 50 + 0,25 (10) = 50 + 2,5 + 52,5

Ainsi, avec un budget de publicité de 10 millions $ l'an prochain, les bénéfices devraient être 52,5 millions $.


» » » » L'analyse de régression dans l'analyse statistique des données volumineuses