Comment créer des vecteurs de caractères pour les données de texte dans r

Texte dans R est représenté par des vecteurs de caractères. UN vecteur de caractères

Sommaire

est - vous l'avez deviné! - Un vecteur composé de caractères.

Dans le monde de la programmation informatique, le texte est souvent considéré comme un chaîne. Ici, le mot texte se réfère à un seul élément d'un vecteur, mais vous devez être conscient que les fichiers d'aide de R se réfèrent parfois à cordes et parfois texte. Ils signifient la même chose.

image0.jpg

Jetez un oeil à la façon dont R utilise des vecteurs de caractères pour représenter du texte. Vous affectez un texte à un vecteur de caractères et le faire pour extraire des sous-ensembles de ces données. Vous obtenez également familier avec le concept très puissant de vecteurs nommés, des vecteurs dans lesquels chaque élément a un nom. Cela est utile car vous pouvez alors consulter les éléments par leur nom ainsi que la position.

Attribuer une valeur à un vecteur de caractères




Vous affectez une valeur à un vecteur de caractères en utilisant l'opérateur d'affectation (lt; -), De la même manière que vous faites pour toutes les autres variables. Vous tester si une variable est de classe personnage, par exemple, en utilisant le is.character () fonction comme suit:

> X lt; - "Bonjour tout le monde"> is.character (x) TRUE

Notez que X est un vecteur de caractères de longueur 1. Pour en savoir combien de caractères sont dans le texte, l'utilisation nchar:

> Longueur (x) [1] 1> nchar (x) [1] 12

Cette fonction vous dit que X a une longueur et que l'élément unique en X a 12 caractères.

Créer un vecteur de caractères avec plus d'un élément

Pour créer un vecteur de caractère avec plus d'un élément, utilisez la fonction Combiné, c ():

X lt; - c ("Bonjour", "le monde!")> longueur (x) [1] 2> nchar (x) [1] 5 6

Notez que cette fois, R vous dit que votre vecteur a une longueur de 2 et que le premier élément a cinq caractères et le deuxième élément a six caractères.


» » » » Comment créer des vecteurs de caractères pour les données de texte dans r