Comment briser les statistiques catégoriques en utilisant des tables à deux voies

Vous pouvez rompre données catégoriques bas à l'aide des tableaux dans les deux sens (aussi connu comme les tableaux de contingence, tableaux croisés ou des tableaux croisés) pour résumer les informations statistiques sur les différents groupes. Données catégorielles (aussi connu comme données qualitatives) Capturer qualités ou des caractéristiques d'un individu, tels que l'œil de la couleur, de sexe, de parti politique ou l'opinion d'une personne sur une question (typiquement en utilisant des catégories telles que accord, en désaccord, ou sans opinion, ou une variante de ces éléments).

Les données catégoriques ont tendance à tomber dans des groupes ou des catégories assez naturellement. “ Parti politique, n ° 148; par exemple, a généralement quatre groupes aux États-Unis: démocrate, républicain, indépendant, et autres. Les données catégoriques viennent souvent à partir des données de l'enquête, mais ils peuvent aussi être collectées dans des expériences. Par exemple, dans un test expérimental d'un nouveau traitement médical, les chercheurs peuvent utiliser trois catégories pour évaluer les résultats de l'expérience: le patient at-il aller mieux, pire, ou rester la même tout en subissant le traitement?




Les données catégoriques sont souvent résumées en signalant le pourcentage de personnes qui tombent dans chaque catégorie. Par exemple, les sondeurs peuvent déclarer les statistiques sur l'affiliation politique en donnant le pourcentage de républicains, démocrates, indépendants, et d'autres. Pour calculer le pourcentage d'individus dans une certaine catégorie, trouver le nombre de personnes dans cette catégorie, diviser par le nombre total de personnes dans l'étude, puis multiplier par 100%. Par exemple, si un sondage de 2.000 adolescents inclus 1.200 femmes et 800 hommes, les pourcentages résultant seraient (1200 # 247- 2000) # 8727- 100% = 60% de femmes et (800 # 247- 2000) # 8727- 100% = 40% d'hommes.

Vous pouvez répartir les données catégoriques plus loin en créant quelque chose appelé les deux sens tables. Tables bidirectionnelles sont des tables avec des lignes et des colonnes. Ils résument l'information à partir de deux variables catégoriques à la fois, comme le sexe et parti politique, de sorte que vous pouvez voir (ou facilement calculer) le pourcentage d'individus dans chaque combinaison de catégories et de les utiliser pour faire des comparaisons entre les groupes.

Le gouvernement américain calcule et résume les charges de données catégorielles en utilisant les tableaux croisés. Âge et le sexe des données typiques, rapportés par le Bureau du recensement des États-Unis pour une enquête menée en 2009, sont présentés dans ce tableau. (Normalement, l'âge serait considéré comme une variable numérique, mais la façon dont le gouvernement américain signale qu'elle, l'âge est décomposé en catégories, ce qui en fait une variable.)

US Population, ventilées par âge et par sexe (2009)
Tranche d'âgeLes mâles%Femmes%Global%
Moins de 5 ans108870087.19104126486,69212996566,94
5-9105359006,96100737346.48206096346.71
10-14102225226,7597510426.27199735646.51
15-19110512897,30104865486.74215378377.02
20-24110935527.32104460076,72215395597.02
25-29111155607,34105621596,79216777197.06
30-34101079746,6797806296.29198886036.48
35-39103530166.84101853356,55205383516,69
40-44105041396,94104874666.74209916056.84
45-49112955247,46115355687.42228310927,44
50-54106778477,05110835447.13217613917,09
55-5992046666.0897703606,28189750266.18
60-6475769335,0082349905.29158119235.15
65-6955111643.6462731564.03117843203,84
70-7440822262.7049255213.1790077472.93
75-7931492362.0841762922.6873255282.39
80-8422982601.5235240742.2758223341.90
85-8912668990,8423954981,5436623971.19
90-944248820,2810773810,6915022630,49
95-99821350,053198420,214019770,13
100+87580,01552660,04640240,02
Global151449490100.00155557060100.00307006550100.00

Vous pouvez examiner différentes facettes de la population américaine en regardant et en travaillant avec des numéros différents de la table. Par exemple, en regardant le sexe, vous remarquez que les femmes sont légèrement plus nombreuses les hommes - la population en 2009 était de 50,67% femelle (diviser nombre total de femmes par la taille de la population totale et multiplier par 100%) et 49,33% de sexe masculin (diviser nombre total de mâles par taille de la population totale et de multiplier par 100%). Vous pouvez également regarder à l'âge: Le pourcentage de la population totale qui est de moins de 5 ans était de 6,94% (Diviser le nombre total moins de 5 ans par la taille totale de la population et de multiplier par 100%). Le plus grand groupe appartient aux 45-49 ans, qui représentent 7,44% de la population.

Ensuite, vous pouvez explorer une possible relation entre le sexe et l'âge en comparant différentes parties de la table. Vous pouvez comparer, par exemple, le pourcentage de femmes-hommes dans la tranche d'âge 80 ans et plus. Parce que ces données sont rapportées par incréments de 5 ans, vous avez à faire un peu de mathématiques afin d'obtenir votre réponse, cependant. Le pourcentage de la population qui est féminin et âgées de 80 ans et au-dessus (en regardant la colonne 7 du tableau) est de 2,27% + 1,54% + 0,69% + 0,21% + 0,04% = 4,75%. Le pourcentage des hommes âgés de 80 ans et plus (en regardant la colonne 5 du tableau) est de 1,52% + 0,84% + 0,28% + 0,05% + 0,01% = 2,70%. Cela montre que le groupe d'âge de 80 ans et plus pour les femelles est environ 76% plus grandes que les mâles (parce que [4,75 à 2,70] # 247- 2,70 = 0,76).


» » » » Comment briser les statistiques catégoriques en utilisant des tables à deux voies