Comment tracer quantiles pour les sous-groupes en r

Souvent, vous souhaitez séparer l'analyse de données pour différents sous-groupes de R afin de les comparer. Vous avez besoin de faire cela si vous voulez savoir comment la taille moyenne de la lèvre compare entre les hommes et les gouramis baisers féminins (grand poisson en passant!) Ou, dans le cas de notre exemple, vous voulez savoir si le nombre de cylindres dans un voiture influe sur le kilométrage.

Bien sûr, vous pouvez utiliser tapply () pour calculer l'un des descriptifs pour les sous-groupes définis par un facteur variable. Mais dans la R vous trouvez des autres outils pour résumer descriptifs pour les différents sous-groupes.

Une façon de comparer rapidement les groupes est de construire un diagramme à boîte et moustaches à partir des données. Vous pourriez construire cette parcelle par le calcul de la gamme, les quartiles, et la médiane pour chaque groupe, mais heureusement, vous pouvez juste dire R pour faire tout cela pour vous. Par exemple, si vous voulez savoir comment le kilométrage compare entre les voitures avec un nombre différent de cylindres, vous utilisez simplement le boxplot () fonction:

image0.jpg


> Boîte à moustaches (mpg ~ cyl, data = voitures)

Vous fournissez une formule simple que le premier argument de boxplot (). Cette formule se lit comme “ boîtes de parcelle pour la variable mpg pour les groupes définis par la variable cyl.”

Cette parcelle utilise quantiles pour vous donner une idée de la façon dont les données sont réparties au sein de chaque sous-groupe. La ligne au milieu de chaque boîte représente la médiane, et les bords de la boîte représentent le premier et le troisième quartiles. Les moustaches ont trait soit le minimum et le maximum de données ou 1,5 fois la distance entre les premier et troisième quartiles, selon ce qui est plus petit.

Pour être tout à fait correct, les bords de la boîte représentent les charnières inférieures et supérieures du résumé de cinq nombre calculé selon la fivenum () fonction. Ils sont égaux aux quartiles seulement si vous avez un nombre impair d'observations dans vos données. Sinon, les résultats de fivenum () et quantile () peut varier un peu en raison de différences dans les détails du calcul.

Vous pouvez laisser les moustaches étendent toujours le minimum et le maximum en réglant le gamme argument de la boxplot () fonction 0.


» » » » Comment tracer quantiles pour les sous-groupes en r