Testez l'équation de régression estimée en utilisant le coefficient de détermination, r2
Après vous estimez la droite de régression de la population, vous pouvez vérifier si l'équation de régression est logique en utilisant le coefficient de détermination, également connu comme R2 (R au carré). Ceci est utilisé comme une mesure de la façon dont l'équation de régression décrit en fait la relation entre la variable dépendante (Y) Et la variable indépendante (X).
Ce peut être le cas qu'il n'y a pas de relation réelle entre le variables- régression simple dépendantes et indépendantes génère des résultats, même si cela est le cas. Il est donc important de soumettre les résultats de la régression à certains tests clés qui vous permettent de déterminer si les résultats sont fiables.
Le coefficient de détermination, R2, est une mesure statistique qui montre la proportion de variation expliqué par la ligne de régression estimée. La variation se réfère à la somme des carrés des différences entre les valeurs de Y et la valeur moyenne de Y, exprimé mathématiquement comme
R2 prend toujours sur une valeur comprise entre 0 et 1. Plus R2 est à 1, mieux l'équation de régression estimée correspond ou explique la relation entre X et Y.
L'expression
est également connue sous le nom somme totale des carrés (TSS).
Cette somme peut être divisé en deux catégories suivantes:
Somme expliqué de carrés (ESS): Aussi connu sous le variation expliquée, l'ESS est la partie de la variation totale qui mesure à quel point l'équation de régression explique la relation entre X et Y.
Vous calculez l'ESS avec la formule
Somme résiduelle des carrés (RSS): Cette expression est également connu comme variation inexpliquée et est la partie de la variation totale qui mesure écarts (erreurs) entre les valeurs réelles de Y et ceux estimés par l'équation de régression.
Vous calculez le RSS avec la formule
Plus la valeur de RSS par rapport à l'ESS, meilleure est la ligne de régression correspond ou explique la relation entre la variable dépendante et indépendante.
Somme totale des carrés (TSS):
La somme des flux RSS et ESS est égal TSS.
R2 est le rapport de la somme des carrés expliqué (ESS) à somme totale des carrés (TSS):
Vous pouvez également utiliser cette formule:
Sur la base de la définition de R2, sa valeur ne peut jamais être négatif. Aussi, R2 ne peut pas être supérieur à 1, de sorte que
Grâce à une analyse de régression simple, R2 est égale au carré de la corrélation entre X et Y.
Le coefficient de détermination est utilisée comme une mesure de la façon dont une ligne de régression explique la relation entre une variable dépendante (Y) Et une variable indépendante (X). Plus le coefficient de détermination est à 1, le plus près de la ligne de régression adapte les données d'échantillon.
Le coefficient de détermination est calculée à partir des sommes de carrés. Ces calculs sont résumés dans le tableau suivant.
Pour calculer ESS, vous soustrayez la valeur moyenne de Y de chacune des valeurs estimées de Y- chaque terme est carré et additionnées:
Pour calculer RSS, vous soustrayez la valeur estimée de Y de chacune des valeurs réelles de Y- chaque terme est carré et additionnées:
Pour calculer TSS, vous soustrayez la valeur moyenne de Y de chacune des valeurs réelles de Y- chaque terme est carré et additionnées:
Alternativement, vous pouvez simplement ajouter ESS et RSS pour obtenir TSS:
TSS = ESS + RSS = 0,54 + 0,14 = 0,68
Le coefficient de détermination (R2) Est le rapport de l'ESS à TSS:
Cela montre que 79,41 pour cent de la variation de Y est expliquée par la variation de X. Parce que le coefficient de détermination ne peut pas dépasser 100 pour cent, une valeur de 79,41 indique que la ligne de régression correspond étroitement les données d'échantillons réels.