Comment définir le mode d'affichage de données dans r

UN ggplot2

Sommaire

geom en R raconte l'intrigue comment vous voulez afficher vos données. Par exemple, vous utilisez geom_bar () pour faire un graphique à barres. Dans ggplot2, vous pouvez utiliser une variété de geoms prédéfinies visant à rendre les types standard de complot.

Un geom définit la présentation d'un ggplot2 couche. Par exemple, il ya geoms pour créer des diagrammes à barres, diagrammes de dispersion, et les schémas de ligne (ainsi que une variété d'autres parcelles).

Chaque geom a une stat de défaut, et chacun a une stat geom par défaut. En pratique, vous devez spécifier un seul de ces.

GeomDescriptionPar défaut Stat
geom_bar ()Diagramme à bandesstat_bin ()
geom_point ()Scatterplotstat_identity ()
geom_line ()Diagramme de ligne, qui relie les observations dans triés parX-valeurstat_identity ()
geom_boxplotDiagramme à boîte et moustachesstat_boxplot ()
geom_pathSchéma de ligne, les observations de raccordement dans l'ordre originalstat_identity ()
geom_smoothAjouter une moyenne lissée conditionnéstat_smooth ()
geom_histogramUn alias pour geom_bar () et stat_bin ()stat_bin ()

Comment créer un graphique à barres en utilisant ggplot2 en R

Pour faire un graphique à barres que vous utilisez le geom_bar () fonction. Toutefois, notez que la stat par défaut est stat_bin (), qui est utilisé pour couper vos données dans des bacs. Ainsi, le comportement par défaut de geom_bar () est de créer un histogramme.

Par exemple, pour créer un histogramme de la profondeur des tremblements de terre de la tremblements ensemble de données, vous effectuez les opérations suivantes:

> Ggplot (tremblements de terre, AES (x = profondeur)) + geom_bar ()> ggplot (tremblements de terre, AES (x = profondeur)) + geom_bar (binwidth = 50)



Notez que votre cartographie ne définit que les X-axe variable (dans ce cas, tremblements de profondeur $). Un argument utile geom_bar () est binwidth, qui contrôle la taille des bacs de vos données est découpé en.

Alors si geom_bar () rend un histogramme par défaut, comment faites-vous un graphique à barres? La réponse est que vous devez d'abord agréger vos données, puis spécifiez l'argument stat = "identité" dans votre appel à geom_bar ().

Dans l'exemple suivant, vous utilisez agrégat () pour calculer le nombre de tremblements de terre en profondeur les différentes strates:

> Quakes.agg lt; - agrégat (~ mag ronde (profondeur, -1), les données = tremblements, + FUN = longueur)> noms (quakes.agg) lt; - c («profondeur», «mag»)

Maintenant, vous pouvez tracer l'objet quakes.agg avec geom_bar (stat = «identité»):

> Ggplot (quakes.agg, AES (x = profondeur, y = mag)) ++ geom_bar (stat = «identité»)

En résumé, vous pouvez utiliser geom_bar () pour créer un histogramme et laisser ggplot2 résumer vos données, ou vous pouvez pré-résumer vos données, puis utiliser stat = "identité" pour tracer un graphique à barres.

image0.jpg

Comment faire un diagramme de dispersion dans ggplot2

Pour créer un nuage de points, vous utilisez le geom_point () fonction. Un diagramme de dispersion crée des points (ou parfois des bulles ou autres symboles) sur votre carte. Chaque point correspond à une observation dans vos données.

Vous avez probablement vu ou créé ce type de graphiques un million de fois, alors vous savez déjà que les diagrammes de dispersion utilisent le système de coordonnées cartésiennes, où une variable est mappé à la coordonnée X-axe et une seconde variable est mis en correspondance avec le y-axe.

Exactement de la même manière, en ggplot2 vous créez un mappage entre X-axe et y-variables d'axe. Donc, pour créer un graphique de la tremblements données, vous mapper tremblements $ longue au X-axe et tremblements $ lat au y-axe:

image1.jpg
> Ggplot (tremblements de terre, AES (x = de long, y = lat)) + geom_point ()

Comment créer des graphiques linéaires de ggplot2

Pour créer un graphique en ligne, vous utilisez le geom_line () fonction. Vous utilisez cette fonction d'une manière très similaire à geom_point (), à la différence que geom_line () trace une ligne entre les points consécutifs dans vos données.

Ce type de graphique est utile pour les données de séries chronologiques dans des trames de données, comme les données de population dans l'ensemble de données intégré Longley. Pour créer un graphique de la ligne des chiffres du chômage, vous utilisez ce qui suit:

image2.jpg
> Ggplot (Longley, AES (x = Année, y = Chômeurs)) + geom_line ()

» » » » Comment définir le mode d'affichage de données dans r