Comment ajouter des variables à une trame de données dans r

Une trame de données peut être étendue avec de nouvelles variables dans R. Vous pouvez, par exemple, obtenir des données d'un autre joueur de l'équipe de Granny. Ou vous pouvez calculer une nouvelle variable à partir des autres variables dans l'ensemble de données, comme la somme totale des paniers faits à chaque match.

Sommaire

Ajout d'une seule variable

Il existe trois principales façons d'ajouter une variable. Comme dans le cas de l'ajout d'observations, vous pouvez utiliser soit le cbind () fonction ou les indices.

Vous pouvez également utiliser le signe dollar à ajouter une variable supplémentaire. Imaginez que Mamie vous a demandé d'ajouter le nombre de paniers de son amie Gabrielle à la trame de données. Tout d'abord, vous devez créer un vecteur avec ces données comme ceci:

> Baskets.of.Gabrielle lt; - c (11, 5, 6, 7, 3, 12, 4, 5, 9)



Pour créer une variable supplémentaire nommé Gabrielle avec ces données, vous faites simplement ce qui suit:

> Baskets.df $ Gabrielle lt; - baskets.of.Gabrielle

Si vous voulez vérifier si cela a fonctionné, mais vous ne voulez pas afficher la trame de données complète, vous pouvez utiliser la tête () fonction. Cette fonction prend deux arguments: l'objet que vous souhaitez afficher et le nombre de lignes que vous souhaitez voir. Pour voir les quatre premières lignes de la nouvelle trame de données, baskets.df, utilisez le code suivant:

> Tête (baskets.df, 4) Granny Geraldine Gabrielle1st 12 5112e 4 4 ​​5 2 53 6 4 7 64ème

Ajout de plusieurs variables en utilisant cbind

Vous pouvez prétendre votre bloc de données est une matrice et utilisez le cbind () fonction pour ce faire. Contrairement lorsque vous utilisez rbind () sur des trames de données, vous ne même pas besoin de se soucier des noms de ligne ou de colonne. Créons une nouvelle trame de données avec les objectifs pour Gertrude et Guenièvre. Pour combiner les deux dans une trame de données, essayez:

> New.df lt; - data.frame (+ Gertrude = c (3, 5, 2, 1, NA, 3, 1, 1, 4) = c + Guinevere (6, 9, 7, 3, 3, 6, 2, 10, 6) +)

Bien que les noms de lignes de trames de données new.df et baskets.df différer, R va ignorer cela et il suffit d'utiliser les noms de lignes de la première trame de données dans le cbind () fonction, comme vous pouvez le voir sur la sortie du code ci-dessous:

> Tête (cbind (baskets.df, new.df), 4) Granny Geraldine Gabrielle Gertrude Guinevere1st 12 5113 62e 4 4 ​​55 93 5 2 62 6 4 71 74e 3

Lorsque vous utilisez une trame de données ou d'une matrice avec les noms de colonnes, R va les utiliser comme les noms des variables. Si vous utilisez cbind () ajouter un vecteur d'une trame de données, R va utiliser le nom de vecteur comme un nom variable, sauf si vous spécifiez un vous-même, comme vous l'avez fait avec rbind ().

Si vous liez une matrice sans les noms des colonnes pour la trame de données, R utilise automatiquement les numéros de colonne comme noms. Cela va provoquer un peu de mal cependant, parce que les nombres sont simples noms d'objets non valides et, par conséquent, plus difficile à utiliser comme noms de variables. Dans ce cas, vous feriez mieux d'utiliser les indices.

Chaque fois que vous souhaitez utiliser une trame de données et ne veulent pas d'avoir en permanence à taper son nom suivi par $, vous pouvez utiliser les fonctions avec () et dans les (). Avec le dans les () fonction, vous pouvez également facilement ajouter des variables à une trame de données.


» » » » Comment ajouter des variables à une trame de données dans r