Comment résumer et représenter graphiquement des données catégoriques

Une variable catégorique est résumée d'une manière assez simple. Vous venez de Tally le nombre de sujets dans chaque catégorie et d'exprimer ce numéro comme un compte - et peut-être aussi comme un pourcentage du nombre total de sujets dans toutes les catégories confondues. Ainsi, par exemple, un échantillon de 422 sujets peut être résumée par la race.

Sujets à l'étude classés par Race
RaceCompterPour cent du total
blanc12830,3%
Noir14133,4%
Asiatique7016,6%
Autre8319,7%
Global422100%

La distribution conjointe des sujets entre deux variables (comme la race par sexe), est résumée par un tableau croisé ("cross-onglet.

Croisement des sujets par Variables TwoCategorical
blancNoirAsiatiqueAutreGlobal
Mâle60603442196
Femelle68813641226
Global1281417083422

Un tableau croisé peut devenir très encombré si vous essayez d'inclure des pourcentages. Et il ya trois types différents de pourcentage pour chaque chef d'accusation dans un tableau croisé. Par exemple, les 60 hommes blancs comprennent 46,9 pour cent de tous les sujets blancs, 30,6 pour cent de tous les hommes, et de 14,2 pour cent de tous les sujets.

Données catégorielles est généralement affiché graphiquement comme les graphiques à barres de la fréquence et de camemberts:




  • Histogrammes de fréquence: Affichage de la propagation de sujets à travers les différentes catégories d'une variable est la plus facile à faire par un graphique à barres. Pour créer un graphique à barres manuellement à partir d'un décompte des sujets dans chaque catégorie, vous dessinez un graphique contenant une barre verticale pour chaque catégorie, ce qui rend la hauteur proportionnelle au nombre de sujets dans cette catégorie.

    Mais presque tous les programmes statistiques vont préparer les graphiques à barres pour vous- vous suffit de sélectionner les options que vous voulez, comme celle qui variable catégorique que vous souhaitez afficher et si vous voulez l'axe vertical de montrer compte ou pour cent du total.

  • Camemberts: Les graphiques circulaires indiquent le nombre relatif de sujets dans chaque catégorie par l'angle d'un coin circulaire (un morceau de la tarte). Pour créer un graphique circulaire manuellement, vous multipliez le pour cent des sujets dans chaque catégorie par 360 (le nombre de degrés d'arc dans un cercle complet), puis divisez par 100. Cela vous donnera l'angle de chaque coin de la tarte.

    Vous dessinez un cercle avec un compas, puis le diviser en morceaux en utilisant un rapporteur (rappelez-vous les outils de dessin de l'école secondaire?). Beaucoup mieux d'avoir l'ordinateur faire un camembert pour vous - il est pas plus difficile que d'avoir un programme faire un graphique à barres.

    Mais la comparaison de l'importance relative des différentes sections d'un diagramme circulaire est plus difficile que de comparer bar hauteurs. Pouvez-vous dire à un coup d'œil, du camembert ci-dessous, si il ya plus de Blancs ou les Noirs? Ou plus Asiatiques que les «autres»? Vous pouvez faire ces distinctions immédiatement de l'histogramme.

    Les diagrammes circulaires sont souvent utilisés pour présenter les données au public (peut-être parce que la "part du gâteau" métaphore est tellement intuitif), mais ils sont mal vus dans les publications techniques.

    image0.jpg

    Beaucoup de programmes (y compris Excel) vous permettent de générer soi-disant tableaux "3D". Cependant, ces cartes sont souvent dessinés avec une perspective oblique qui les rend presque impossible à interpréter quantitativement, il faut donc éviter les graphiques en 3D lors de la présentation de vos données.


» » » » Comment résumer et représenter graphiquement des données catégoriques