Les diagrammes de dispersion: technique graphique pour les données statistiques

Contrairement à un diagramme à tiges et à feuilles, un nuage de points est destiné à montrer la relation entre deux variables. Il peut être difficile de voir si il ya une relation entre deux variables juste en regardant les données brutes, mais avec un nuage de points, tous les motifs qui existent dans les données deviendra beaucoup plus facile à voir.

Un diagramme de dispersion est constitué d'une série de points- chaque point représente une valeur unique pour deux variables différentes. Par exemple, vous pourriez construire un nuage de points pour montrer la relation entre les revenus annuels d'une société et de ses bénéfices annuels. Si vous essayez de prévoir les bénéfices basés sur les recettes, l'axe X serait utilisé pour montrer les revenus annuels, et l'axe Y serait utilisé pour montrer les bénéfices annuels. Ainsi, les revenus sont considérés comme la variable indépendante, et les profits sont considérés comme la variable dépendante dans cette relation.

Sur un nuage de points, l'axe X (qui est, l'axe horizontal) est utilisée pour montrer la indépendant variable et l'axe Y (l'axe vertical) est utilisé pour montrer la dépendant variable.

Dans cet exemple, chaque point sur le diagramme de dispersion montre les revenus et les ventes pour une année donnée. Le tableau montre la relation entre les revenus annuels et bénéfices annuels d'une société pendant les années 2004-2014.

Revenus et bénéfices annuels 2004-2014
AnRevenus (en millions de dollars)Profits (en millions de dollars)
200422542
2,00523743
2,00624548
2,00722240
2,00826560
2,00927056
2,01025453
2,01128060
201229062
2,01330565
2,01431271

La figure suivante montre le diagramme de dispersion résultant.

Diagramme de dispersion des revenus et des profits annuels 2004-2014.
Diagramme de dispersion des revenus et des profits annuels 2004-2014.

Chaque point du nuage de points représente les revenus et les bénéfices connexes de la société pour une seule année. Par exemple, le point dans le supérieur droit; coin de la parcelle représente les données de 2014, lorsque les revenus de la Société ont été de 312 millions $ et les profits étaient de 71 M $.

Vous pouvez utiliser un diagramme de dispersion pour déterminer si




  • Les deux variables ont tendance à se déplacer dans la même direction.

  • Les deux variables ont tendance à se déplacer dans des directions opposées.

  • Les deux variables ne sont pas liées les unes aux autres.

Si deux variables ont tendance à se déplacer dans la même direction, ils sont dits être positivement correlated- si elles ont tendance à se déplacer dans des directions opposées, ils sont censés être négativement corrélés. Si deux variables ne montrent aucune tendance particulière, ils sont censés être décorrélées.

Cette figure montre un nuage de points pour les deux variables (X et Y) qui sont corrélées positivement.

Nuage de points des deux variables corrélées positivement.
Nuage de points des deux variables corrélées positivement.

Le diagramme de dispersion montre que X augmente, il ya une forte tendance à Y pour augmenter (mais pas nécessairement du même montant). Cela montre que X et Y sont corrélées positivement.

La figure suivante montre le même nuage de points avec un tendance ligne- l'équation de cette droite est estimée avec analyse de régression.

Nuage de points des deux variables corrélées positivement avec une ligne de tendance.
Nuage de points des deux variables corrélées positivement avec une ligne de tendance.

La ligne de tendance montre combien les changements Y en moyenne, compte tenu d'un changement spécifique dans X. Une ligne de tendance à pente positive indique que deux variables sont positivement correlated- similaire, une ligne de tendance pente négative indique que deux variables sont corrélées négativement. Si une ligne de tendance est plat (ce qui est, a une pente nulle), ce qui indique que les deux variables ne sont pas liés les uns aux autres. La ligne de tendance à pente positive montre que X et Y sont positivement corrélés.

La figure suivante montre un nuage de points et la ligne de tendance pour les deux variables qui sont négativement corrélés.

Nuage de points des deux variables corrélées négativement avec une ligne de tendance.
Nuage de points des deux variables corrélées négativement avec une ligne de tendance.

Le diagramme de dispersion montre que X augmente, Y tend à decrease- la ligne de tendance a une négatif pente. Par conséquent, X et Y représentent négativement corrélés.

La figure suivante montre un nuage de points et la ligne de tendance pour les deux variables qui sont décorrélées.

Nuage de points des deux variables non corrélées avec une ligne de tendance.
Nuage de points des deux variables non corrélées avec une ligne de tendance.

Le diagramme de dispersion montre que X augmente, Y augmente parfois et parfois diminue. Il n'y a pas motif particulier pour les données. Les points semblent être dispersé de façon aléatoire dans le diagramme. En conséquence, la ligne de tendance est à peu près plat, ce qui montre que X et Y représentent décorrélées.

Pour un exemple du monde réel, cette figure montre un diagramme de dispersion de la relation entre le prix de l'action Apple et de la norme et 500 actions de l'indice de marché Poor partir du 1er Janvier 2013 au 31 Décembre 2013.

Nuage de points des prix quotidiens de l'action Apple et le S & P 500.
Nuage de points des prix quotidiens de l'action Apple et le SP 500.

500 (SP 500) l'indice Standard and Poor est une moyenne des prix des 500 plus grandes actions américaines. La valeur de cet indice reflète l'état général de l'économie américaine. Le graphique montre qu'il ya une corrélation positive entre le prix de l'action Apple et le SP 500.


» » » » Les diagrammes de dispersion: technique graphique pour les données statistiques