Comment rechercher du texte par le modèle de r

Comme tout langage de programmation, R, il est facile de dresser des listes de données triées et ordonnées. Pour trouver des sous-chaînes, vous pouvez utiliser la grep () fonction, qui prend deux arguments essentiels:

  • motif: Le motif que vous voulez trouver.

  • X: Le vecteur de caractère que vous voulez rechercher.

Supposons que vous voulez trouver tous les Etats qui contiennent le motif Nouveau. Faire comme ceci:




> Grep (“ ” ;, New state.name) [1] 29 30 31 32

Le résultat de grep () est un vecteur numérique avec les positions de chacun des composants qui contiennent le motif d'adaptation. En d'autres termes, le composant 29 state.name contient le mot Nouveau.

> State.name [29] New Hampshire

Ouf, cela a fonctionné! Mais en tapant dans la position de chaque texte correspondant va être beaucoup de travail. Heureusement, vous pouvez utiliser les résultats de grep () directement au sous-ensemble le vecteur d'origine. Vous pouvez le faire en ajoutant l'argument value = TRUE. Essaye ça:

> Grep (“ ” ;, New state.name, valeur = TRUE) [1] “ New Hampshire ” “ New Jersey ” [3] “ Nouveau-Mexique ” “ New York ”

La grep () fonction est sensible à la casse - il ne correspond texte dans le même cas (majuscule ou minuscule) que votre modèle de recherche. Si vous recherchez pour le modèle “nouveau” en minuscules, les résultats de recherche sont vides:

> Grep (“ ” ;, nouvelle state.name, valeur = TRUE) caractère (0)

» » » » Comment rechercher du texte par le modèle de r