Comment travailler avec les noms de variables dans r

Variables dans une trame de données dans la R toujours besoin d'avoir un nom. Pour accéder aux noms de variables, vous pouvez encore traiter une trame de données comme une matrice et utiliser la fonction colnames () comme ça:

> Colnames (employ.data) [1] «employé» «salaire» «startdate"

Mais, en fait, cela prend le chemin le plus long. Dans le cas d'une trame de données, la colnames () fonction permet le travail acharné être fait à l'interne par une autre fonction, la (noms) fonction. Donc, pour obtenir les noms de variables, vous pouvez simplement utiliser cette fonction directement comme ceci:

> Noms (employ.data) [1] «employé» «salaire» «startdate"

Semblable à la façon dont vous le faites avec des matrices, vous pouvez utiliser cette même fonction à affecter de nouveaux noms aux variables ainsi. Par exemple, pour renommer la variable date de début à premier jour, vous pouvez utiliser le code suivant:




> Noms (employ.data) [3] lt; - '' FirstDay> noms (employ.data) [1] «employé» «salaire» «FirstDay"

Une différence importante entre une matrice et une trame de données est que les trames de données ont toujours nommé observations. Alors que le rownames () retour de la fonction NUL si vous ne spécifiez pas les noms de lignes d'une matrice, il sera toujours donner un résultat dans le cas d'une trame de données.

Vérifiez le résultat du code suivant:

> Rownames (employ.data) [1] "1" "2" "3"

Par défaut, les noms de ligne - ou les noms d'observation - d'une trame de données sont tout simplement les numéros de ligne en format de caractère. Vous ne pouvez pas vous débarrasser d'eux, même si vous essayez de les supprimer en affectant la NUL valeur que vous pouvez faire avec des matrices.

Vous ne devriez pas essayer de se débarrasser d'eux non plus, parce que votre trame de données ne sera pas affichée plus correctement si vous le faites.

Vous pouvez, cependant, changer les noms de ligne exactement comme vous le faites avec des matrices, tout simplement en attribuant les valeurs via le rownames () fonction, comme ceci:

> Rownames (employ.data) lt; - c ('Chef', 'BigChef', 'BiggerChef')> employ.dataemployee salaire firstdayChef John Doe 21000 2010-11-01BigChef Peter Gynn 23400 2008-03-25BiggerChef Jolie Espoir 26800 2007-03-14

Ne soyez pas dupe, cependant: les noms de lignes peuvent ressembler à une autre variable, mais vous ne pouvez pas y accéder de la façon dont vous accédez les autres variables.


» » » » Comment travailler avec les noms de variables dans r