Comment graphiques peuvent fausser les statistiques

Un graphique statistique peut vous donner une fausse image des statistiques sur lesquelles il est fondé. Par exemple, il peut être trompeur à travers son choix de l'échelle sur l'axe de fréquence fréquence / relatifs (qui est, de l'axe où les quantités de chaque groupe sont signalés), et / ou sa valeur de départ.

En utilisant une échelle "tendu" (par exemple, ayant chacune demi-pouce d'un bar représentent 10 unités contre 50 unités), vous pouvez étirer la vérité, font différences look plus dramatique, ou exagèrent valeurs. Vérité-étirements peuvent également se produire si l'axe de fréquence commence à un nombre qui est très proche de l'endroit où les différences dans les hauteurs des barres vous démarrage sont en substance coupant le bas des barres (la partie moins passionnant) et juste montrant leurs sommets, soulignant (de manière trompeuse) où l'action est. Non chaque axe de fréquence doit commencer à zéro, mais attention aux situations qui élèvent les différences.




Voici un bon exemple de graphique avec une échelle étendu:

Le Kansas Lottery montre régulièrement ses résultats récents du Pick 3 Loterie. Une des statistiques déclarées est le nombre de fois chaque numéro (0 à 9) est tiré au sort parmi les trois numéros gagnants. Le tableau montre un graphique du nombre de fois que chaque numéro a été tiré au cours de 1613 au total Pick 3 jeux (4839 numéros simples tirées). Il signale également le pourcentage de fois que chaque numéro a été tiré. Selon la façon dont vous choisissez de regarder ces résultats, vous pouvez faire les statistiques semblent dire des histoires très différentes.

Numéros tirés dans le Pick 3 Loterie
Nombre DrawnNo. de fois tiré hors de 4839Pourcentage de Times Drawn (n ° de Times Drawn diviser-4839)
048510,0%
14689,7%
251310,6%
349110,1%
448410,0%
54809,9%
648710,1%
748210,0%
84759,8%
94749,8%

La façon dont les loteries affichent généralement des résultats comme ceux du tableau est montré dans le graphique du haut dans l'image suivante.

Les graphiques à barres montrant un certain nombre) de fois chaque numéro était drawn- et b) le pourcentage de fois chaque numéro
Les graphiques à barres montrant un certain nombre) de fois chaque numéro était drawn- et b) le pourcentage de fois chaque numéro a été tiré.

Notez que dans ce tableau, il semble que le nombre 1 ne soit pas attirée presque aussi souvent (seulement 468 fois) que le numéro 2 ne (513 fois). La différence dans la hauteur de ces deux barres semble être très grande, exagérer la différence dans le nombre de fois où ces deux numéros ont été tirés. Toutefois, pour mettre cela en perspective, la différence réelle ici est 513-468 = 45 sur un total de 4839 numéros tirés. En termes de pourcentage, la différence entre le nombre de fois que le numéro 1 et le numéro 2 sont tirées est de 45 # 247- 4839 = 0,009, ou seulement neuf dixièmes de un pour cent (0,009 x 100% = 0,9%).

Pourquoi le graphique du haut de l'image a été faite de cette façon? Il pourrait conduire les gens à penser qu'ils ont un bord intérieur si elles choisissent le numéro 2 parce qu'il est «en ébullition» - ou ils pourrait être amené à choisir le numéro 1 parce qu'il est "due à venir." Ces deux théories sont fausses, par le balisage, car les numéros sont choisis au hasard, ce qui est arrivé dans le passé n'a pas d'importance. Le graphique du bas dans la figure a été fait correctement.


» » » » Comment graphiques peuvent fausser les statistiques