Comment calculer le coefficient de détermination ajusté

Vous pouvez utiliser le coefficient de détermination ajusté afin de déterminer comment une équation de régression multiple "adapte" données de l'échantillon. Le coefficient de détermination ajusté est étroitement lié au coefficient de détermination (également connu sous le R2) Que vous utilisez pour tester les résultats d'une équation de régression simple.

Le coefficient de détermination ajusté (également connu comme rajusté R2 ou

image0.jpg

prononcé "barre de R au carré") est une mesure statistique qui montre la proportion de variation expliqué par la ligne de régression estimée.

Variation se réfère à la somme des carrés des différences entre les valeurs de Y et la valeur moyenne de Y, exprimé mathématiquement comme

image1.jpg

Ajusté R2 prend toujours sur une valeur comprise entre 0 et 1. Plus ajusté R2 est à 1, mieux l'équation de régression estimée correspond ou explique la relation entre X et Y.




La principale différence entre R2 et ajusté R2 est-ce R2 augmente automatiquement lorsque vous ajoutez de nouvelles variables indépendantes à une équation de régression (même si elles ne contribuent pas de nouveau pouvoir explicatif de l'équation). Par conséquent, vous souhaitez utiliser ajusté R2 avec une analyse de régression multiple. Ajusté R2 augmente uniquement lorsque vous ajoutez de nouvelles variables indépendantes qui faire augmenter le pouvoir explicatif de l'équation de régression, ce qui en fait une mesure beaucoup plus utile de la façon dont une équation de régression multiple correspond aux données échantillon que R2.

L'équation suivante montre la relation entre ajusté R2 et R2:

image2.jpg
  • n = La taille de l'échantillon

  • k = Le nombre de variables indépendantes dans l'équation de régression

Par exemple, supposons que le département des ressources humaines d'une grande entreprise veut déterminer si les salaires de ses employés sont liés à des années des employés d'expérience de travail et leur niveau d'études supérieures. Pour tester cette idée, le département RH choisit un échantillon de huit employés de façon aléatoire et enregistre leurs salaires annuels (mesurés en milliers de dollars par an), des années d'expérience, et des années d'études supérieures.

Ce chiffre met en évidence une section de statistiques de régression à partir d'une feuille de calcul Excel sur la base de cette étude.

Tableur montrant le coefficient de détermination ajusté.
Tableur montrant le coefficient de détermination ajusté.

R2 se trouve dans la Figure- il est étiqueté "R Square" et équivaut à 0,944346527. L'échantillon contient huit observations, et il ya deux variables indépendantes (années d'expérience et des années d'études supérieures). La figure montre le coefficient de détermination ajusté (R carré ajusté) Comme environ 0,922. Ceci est calculé comme suit:

image4.jpg

(Ce qui correspond à la valeur dans la figure, sauf pour une légère différence d'arrondi.)

La plage de valeurs possibles pour le coefficient de détermination ajusté est de 0 à 1 en termes mathématiques,

image5.jpg

Sur la base de la valeur ajustée de R2, la proportion de variation expliqué par la ligne de régression estimée est d'environ 0,922 ou 92,2 pour cent. Ainsi, l'équation de régression estimée correspond ou explique la relation entre X et Y.


» » » » Comment calculer le coefficient de détermination ajusté