Comment obtenir geoms dans ggplot dans r

UN ggplot2

Sommaire

geom raconte l'intrigue comment vous voulez afficher vos données dans R. Par exemple, vous utilisez geom_bar () pour faire un graphique à barres. Dans ggplot2, vous pouvez utiliser une variété de geoms prédéfinies visant à rendre les types standard de complot.

Un geom définit la présentation d'un ggplot2 couche. Par exemple, vous pouvez utiliser geoms pour créer des diagrammes à barres, diagrammes de dispersion, et les schémas de ligne (ainsi que une variété d'autres parcelles), comme vous pouvez le voir ci-dessous.

Chaque geom a une stat de défaut, et chacun a une stat geom par défaut. En pratique, vous devez spécifier un seul de ces.

GeomDescriptionPar défaut Stat
geom_bar ()Diagramme à bandesstat_bin ()
geom_point ()Scatterplotstat_identity ()
geom_line ()Schéma de ligne, reliant observations dans l'ordre parX-valeurstat_identity ()
geom_boxplotDiagramme à boîte et moustachesstat_boxplot ()
geom_pathSchéma de ligne, les observations de raccordement dans l'ordre originalstat_identity ()
geom_smoothAjouter une moyenne lissée conditionnéstat_smooth ()
geom_histogramUn alias pour geom_bar () et stat_bin ()stat_bin ()

Création d'un graphique à barres

Pour faire un graphique à barres, vous utilisez le geom_bar () fonction. Toutefois, notez que la stat par défaut est stat_bin (), qui est utilisé pour couper vos données dans des bacs. Ainsi, le comportement par défaut de geom_bar () est de créer un histogramme.

Par exemple, pour créer un histogramme de la profondeur des tremblements de terre de la tremblements ensemble de données, essayez:

> Ggplot (tremblements de terre, AES (x = profondeur)) + geom_bar ()> ggplot (tremblements de terre, AES (x = profondeur)) + geom_bar (binwidth = 50)

Notez que votre cartographie ne définit que les X-axe variable (dans ce cas, tremblements de profondeur $). Un argument utile geom_bar () est binwidth, qui contrôle la taille des bacs de vos données est découpé en. Cela crée ce complot.

Faire un histogramme avec & lt; span class =geom_bar (). "width =" 535 "/>
Faire un histogramme avec geom_bar ().



Alors si geom_bar () rend un histogramme par défaut, comment faites-vous un graphique à barres? La réponse est que vous devez d'abord agréger vos données, puis spécifiez l'argument stat =identité dans votre appel à geom_bar ().

Dans l'exemple suivant, vous utilisez agrégat () pour calculer le nombre de tremblements de terre en profondeur les différentes strates:

> Quakes.agg lt; - agrégat (~ mag ronde (profondeur, -1), les données = tremblements, + FUN = longueur)> noms (quakes.agg) lt; - c (“ ” ;, profondeur “ mag ”)

Maintenant, vous pouvez tracer l'objet quakes.agg avec geom_bar (stat =identité):

> Ggplot (quakes.agg, AES (x = profondeur, y = mag)) ++ geom_bar (stat = “ identité ”)

En résumé, vous pouvez utiliser geom_bar () pour créer un histogramme et laisser ggplot2 résumer vos données, ou vous pouvez résumer vos données, puis utiliser stat =identité pour tracer un graphique à barres.

Faire un nuage

Pour créer un nuage de points, vous utilisez le geom_point () fonction. Un diagramme de dispersion crée des points (ou parfois des bulles ou autres symboles) sur votre carte. Chaque point correspond à une observation dans vos données.

Vous avez probablement vu ou créé ce type de graphiques un million de fois, alors vous savez déjà que les diagrammes de dispersion utilisent le système de coordonnées cartésiennes, où une variable est mappé à la coordonnée X-axe et une seconde variable est mis en correspondance avec le y-axe.

Exactement de la même manière, en ggplot2 vous créez un mappage entre X-axe et y-variables d'axe. Donc, pour créer un graphique de la tremblements données, vous mapper tremblements $ longue au X-axe et tremblements $ lat au y-axe:

> Ggplot (tremblements de terre, AES (x = de long, y = lat)) + geom_point ()

Cela crée ce diagramme de dispersion.

Faire un nuage de points avec & lt; span class =geom_point (). "width =" 535 "/>
Faire un nuage de points avec geom_point ().

Création de diagrammes de ligne

Pour créer un graphique en ligne, vous utilisez le geom_line () fonction. Vous utilisez cette fonction d'une manière très similaire à geom_point ()- la différence est que geom_line () trace une ligne entre les points consécutifs dans vos données.

Ce type de graphique est utile pour les données de séries chronologiques dans des trames de données, comme les données de population dans l'ensemble de données intégré Longley. Pour créer un graphique de la ligne des chiffres du chômage, vous utilisez ce qui suit:

> Ggplot (Longley, AES (x = Année, y = Chômeurs)) + geom_line ()

Cela crée cette ligne.

Dessin d'un graphe de ligne avec & lt; span class =geom_line (). "width =" 535 "/>
Dessin d'un graphe de ligne avec geom_line ().

Vous pouvez utiliser geom_line () ou geom_path () pour créer un dessin au trait dans ggplot2. La différence est que geom_line () les premières commandes selon observations X-la valeur, tandis que geom_path () attire les observations dans l'ordre trouvé dans les données.


» » » » Comment obtenir geoms dans ggplot dans r