Résumer les données groupées avec des bars, des boîtes, et les moustaches

Parfois, vous voulez montrer comment une variable varie d'un groupe de sujets à l'autre. Par exemple, les niveaux de certaines enzymes sanguins varient entre les différentes races. Deux types de graphiques sont couramment utilisés à cette fin: des diagrammes à barres et des parcelles boîte à moustaches.

Sommaire

Diagramme à barres

Une façon simple de voir et comparer les moyens de plusieurs groupes de données est un graphique à barres, comme celui représenté, où la hauteur des barres pour chaque course est égal à la moyenne (ou médiane, ou la moyenne géométrique) valeur du niveau de l'enzyme pour que course.

image0.jpg

Et l'histogramme devient encore plus informatif si vous indiquez la propagation de valeurs pour chaque course par des lignes en plaçant représentant un écart-type au-dessus et au-dessous des sommets des barres. Ces lignes sont toujours appelés les barres d'erreur (un choix malheureux de mots qui peuvent prêter à confusion lorsque les barres d'erreur sont ajoutés à un graphique à barres).

Mais même avec les barres d'erreur, un graphique à barres ne donne toujours pas une très bonne image de la distribution des niveaux d'enzymes au sein de chaque groupe. Sont les valeurs faussées? Y at-il des valeurs aberrantes? La moyenne et SD peuvent ne pas être très instructif si les valeurs sont distribuées log-normale ou d'une autre manière inhabituelle.

Idéalement, vous voulez montrer un histogramme pour chaque groupe de sujets, mais cela peut prendre beaucoup trop de l'espace. Que devrais tu faire? Continuez votre lecture pour savoir.

Graphiques Boîte à moustaches




Heureusement, un autre type de graphique appelé Le tracé en rectangle et moustaches (ou BW, ou juste Boîte terrain) Montre - dans très peu d'espace - beaucoup d'informations à propos de la distribution des nombres dans un ou plusieurs groupes de sujets. Une parcelle BW simple des mêmes données d'enzymes illustrés par un graphique à barres antérieure est illustré ci-dessous, sur la gauche.

image1.jpg

Le chiffre BW pour chaque groupe a généralement les éléments suivants:

  • Une boîte couvrant la gamme interquartile (IQR), étendant du premier quartile (25e centile) au troisième quartile (75e centile) des données, et englobant donc le milieu 50 pour cent des données

  • Une ligne horizontale épaisse, tracée à la médiane (50e centile), qui met souvent à ou près du milieu de la boîte

  • Les lignes pointillées (les moustaches) étendant vers le plus éloigné point est pas plus de 1,5 fois l'IQR loin de la zone de données

  • Points individuels situées en dehors des moustaches, considérés comme des valeurs aberrantes

Parcelles BW fournissent un résumé utile de la distribution. Une médiane qui est pas situé près du milieu de la boîte indique une distribution asymétrique.

Certains logiciels tire les différentes parties d'une parcelle BW selon des règles différentes (la ligne horizontale peut être à la moyenne au lieu de la Med-la boîte peut représenter la moyenne # 1 177- norme Déviation- les moustaches peut prolonger vers le plus éloigné outliers- et ainsi de suite). Toujours vérifier la documentation du logiciel et de fournir la description des parties chaque fois que vous présentez une parcelle BW.

Certains logiciels fournit diverses améliorations apportées à la parcelle BW base. Le chiffre à la droite de la boîte à moustaches simple illustre deux de ces embellissements que vous pouvez envisager d'utiliser:

  • Largeur variable: Les largeurs des boîtes peuvent être mises à l'échelle pour indiquer la taille relative de chaque groupe. Vous pouvez voir qu'il ya beaucoup moins de Asiatiques et les «autres» que les Blancs ou les Noirs.

  • Encoches: La boîte peut avoir des encoches qui indiquent l'incertitude dans l'estimation de la médiane. Si deux groupes ont des encoches ne se chevauchent pas, ils ont probablement significativement différents médianes. Blancs et les «autres» ont des niveaux similaires d'enzymes médiane, alors que les Asiatiques ont des niveaux significativement plus élevés et les Noirs ont des niveaux nettement inférieurs.


» » » » Résumer les données groupées avec des bars, des boîtes, et les moustaches