Comment interpréter une ligne de régression

Dans les statistiques, une fois que vous avez calculé la pente et y-

Sommaire

intercepter pour former la ligne de régression de meilleur ajustement dans un nuage de points, vous pouvez alors interpréter leurs valeurs.

Interprétation de la pente d'une droite de régression

La pente est interprété comme en algèbre montée sur la distance. Si, par exemple, la pente est de 2, vous pouvez écrire ce que 2/1 et dites que vous vous déplacez le long de la ligne, comme la La valeur de la X variable augmente de 1, la valeur de la Y variable augmente de 2. Dans un contexte de régression, la pente est le cœur et l'âme de l'équation, car il vous indique combien vous pouvez vous attendre Y à changer X augmente.

En général, les unités de pente sont les unités de la Y variable par des unités de la X variable. Il est un rapport de changement de Y par changement X. Supposons que dans l'étude de l'effet du niveau de dosage en milligrammes (mg) sur la pression artérielle systolique (mmHg), un chercheur constate que la pente de la droite de régression est -2.5. Vous pouvez écrire ce que -2,5 / 1 et dire que devrait la pression artérielle systolique diminuer de 2,5 mmHg en moyenne par augmentation de 1 mg en dose de médicament.




Veillez à toujours utiliser des unités appropriées lors de l'interprétation pente. Si vous ne considérez pas les unités, vous ne verrez pas vraiment le lien entre les deux variables à portée de main. Par exemple, si Y est une note d'examen et X = Temps d'étude, et vous trouverez la pente de l'équation est de 5, ce que cela signifie? Pas grand-chose sans unités à tirer de. Y compris les unités, vous voyez que vous obtenez une augmentation de 5 points (changement Y) Pour chaque augmentation de 1 heure à l'étude (changement X). Veillez également à surveiller les variables qui ont plus d'une unité commune, comme la température étant en degrés Fahrenheit ou Celsius- savoir quel appareil est utilisé.

Si vous utilisez un 1 dans le dénominateur de la pente est pas super-sens pour vous, vous pouvez multiplier le haut et le bas par un nombre quelconque (tant qu'il est le même numéro) et de l'interpréter de cette façon à la place. Dans l'exemple de la pression artérielle systolique, au lieu d'écrire pente que -2,5 / 1 et de l'interpréter comme une goutte de 2,5 mmHg par une augmentation de mg du médicament, vous pouvez multiplier le haut et le bas par 10 pour obtenir -25/10 et dire une augmentation de la dose de 10 mg résultats par une diminution de la pression artérielle systolique de 25 mmHg.

Interprétation de la y-interception d'une ligne de régression

La y-l'origine est l'endroit où la ligne de régression y = mx + b traverse la y-axe (où X = 0), et est désigné par b. Parfois l y-interception peut être interprété d'une manière significative, et parfois non. Cette incertitude est différente de la pente, ce qui est toujours interprétable. En effet, entre les deux concepts de pente et y-interception, la pente est la star du spectacle, avec le y-interception servant moins célèbre mais toujours perceptible acolyte.

Par moments, les y-interception n'a pas de sens. Par exemple, supposons que vous utilisez pour prédire la pluie boisseaux par acre de maïs. Vous savez, si l'ensemble de données contient un point où la pluie est 0, les boisseaux à l'acre doivent être 0 ainsi. Par conséquent, si la droite de régression croise le y-axe ailleurs outre 0 (et il n'y a aucune garantie que cela se croiser à 0 - cela dépend des données), le y-interception fera pas de sens. De même, dans ce contexte, une valeur négative de y (la production de maïs) ne peut être interprété.

Une autre situation où vous ne pouvez pas interpréter la y-interception est lorsque les données ne sont pas présents près du point où X = 0. Par exemple, supposons que vous voulez utiliser les résultats des élèves à mi-parcours sur 1 pour prédire leurs scores sur 2. La mi-parcours y-l'origine représente une prédiction pour 2 à mi-parcours lorsque le score à mi-parcours 1 est 0. Vous ne vous attendez pas les scores sur une mi-parcours pour être à ou près de 0 à moins que quelqu'un n'a pas l'examen, dans ce cas, son score ne serait pas inclus en premier lieu.

Plusieurs fois, cependant, le y-à l'origine est de vous intéresser, il a un sens, si vous avez des données recueillies dans la zone où X = 0. Par exemple, si vous prédire les ventes de café à des matchs de football à Green Bay, au Wisconsin, en utilisant la température, certains jeux deviennent assez froid pour avoir des températures égales ou même inférieures à 0 degrés Fahrenheit, afin de prédire les ventes de café à ces températures est logique . (Comme vous pouvez le deviner, ils vendent de plus en plus de café que la température descend.)

Lorsque vous utilisez une ligne de régression, vous ne pouvez appliquer les interprétations de la pente et y-interception sur la gamme de X des valeurs. Il est dangereux de faire des prédictions ou déclarations delà de la portée de ce que vous avez observé dans l'ensemble de données. Le faire est connu sous le nom extrapolation. Par exemple, supposons que vous collectez des données sur les hauteurs d'enfants âgés de 2 à 8, et vous calculez une pente de 3,7 pouces par an. Ainsi, en moyenne, ces personnes développent chaque année 3,7 pouces. Mais devrions-nous utiliser la même valeur de la pente de prédire leur hauteur tard dans la vie que les adolescents ou même des adultes? Définitivement pas.


» » » » Comment interpréter une ligne de régression