Comment calculer une corrélation

Peut-on mesure statistique à la fois la force et la direction d'une relation linéaire entre deux variables? Bien sûr! Les statisticiens utilisent la Coefficient de corrélation pour mesurer la force et la direction de la relation linéaire entre deux variables numériques X et Y. Le coefficient de corrélation pour un échantillon de données est désignée par r.

Bien que la définition de la rue de corrélation applique à tout deux éléments qui sont liés (tels que le sexe et l'appartenance politique), les statisticiens utilisent ce terme que dans le contexte de deux variables numériques. Le terme officiel pour corrélation est le Coefficient de corrélation. De nombreuses mesures de corrélation différents ont été créé- celui utilisé dans ce cas est appelé Pearson coefficient de corrélation.

La formule pour la corrélation (r) est

image0.jpg

n est le nombre de paires de données;

image1.jpg

sont les moyens échantillon de toutes les X-les valeurs et tous les y-valeurs, respectivement- et sX et sy sont les écarts-types de l'ensemble des échantillons X- et y-valeurs, respectivement.

Vous pouvez utiliser les étapes suivantes pour calculer la corrélation, r, à partir d'un ensemble de données:

  1. Trouver la moyenne de tous les X-valeurs

    image2.jpg



  2. Trouver l'écart type de toutes les X-valeurs (appeler sX) Et l'écart type de toutes les y-valeurs (appeler sy).

    Par exemple, pour trouver sX, vous pouvez utiliser l'équation suivante:

    image3.jpg
  3. Pour chacun des n des paires (X, y) Dans l'ensemble de données, prendre

    image4.jpg
  4. Ajouter le n les résultats de l'étape 3.

  5. Diviser la somme par sX # 8727- sy.

  6. Divisez le résultat par n - 1, où n est le nombre de (X, y) Paires. (Il est le même que la multiplication par 1 plus n - 1.)

    Cela vous donne la corrélation, r.

Par exemple, supposons que vous avez l'ensemble de données (3, 2), (3, 3), et (6, 4). Vous calculez le coefficient de corrélation r par les étapes suivantes. (Notez que pour ces données, le X-les valeurs sont 3, 3, 6, et la y-les valeurs sont 2, 3, 4.)

  1. Calcul de la moyenne des valeurs x et y, on obtient

    image5.jpg
  2. Les écarts-types sont sX = 1,73 et sy = 1,00.

  3. La n = 3 différences trouvées dans l'étape 2 sont multipliés ensemble: (3-4) (2-3) = (- 1) (- 1) = + 1- (3 - 4) (3-3) = (- 1) ( 0) = 0- (6-4) (4-3) = (2) (1) = 2.

  4. L'ajout de la n = 3 Étape 3 résultats, vous obtenez 1 + 0 + 2 = 3.

  5. Divisant par sX # 8727- sy vous donne 3 / (1,73 # 8727- 1,00) = 3 / 1,73 = 1,73. (Il est juste une coïncidence que le résultat de l'étape 5 est également 1.73.)

  6. Maintenant diviser le résultat par 5 Étape 3 - 1 (qui est 2), et vous obtenez la corrélation r = 0,87.


» » » » Comment calculer une corrélation