Comment rechercher plusieurs mots r

Lorsque vous travaillez avec le texte dans R, vous devrez peut-être de trouver des mots ou des motifs à l'intérieur du texte. Imaginez que vous avez une liste des États des États-Unis, et vous voulez savoir quels noms de l'Etat se composent de deux mots.

Pour trouver des sous-chaînes, vous pouvez utiliser la grep () fonction, qui prend deux arguments essentiels:

  • motif: Le motif que vous voulez trouver.

  • X: Le vecteur de caractère que vous voulez rechercher.




Alors, comment trouvez-vous les noms de tous les Etats avec plus d'un mot? Ceci est facile quand vous réalisez que vous pouvez encadrer la question en trouvant tous les États qui contiennent un espace:

> State.name [grep ("", state.name)] [1] "New Hampshire" "New Jersey" [3] "New Mexico" "New York" [5] "Caroline du Nord" "le Dakota du Nord" [7 ] "Rhode Island" "Caroline du Sud" [9] "Dakota du Sud" "West Virginia"

Les résultats incluent tous les pays qui ont des noms de deux mots, comme le New Jersey, New York, Caroline du Nord, le Dakota du Sud, et la Virginie occidentale.

Vous pouvez le voir sur cette liste qu'il n'y a pas des noms d'état qui contiennent Est. Vous pouvez confirmer cela en faisant une autre trouvaille:

> State.name [grep ("Est", state.name)] caractère (0)

Lorsque le résultat d'une opération de caractère est un vecteur vide (qui est, il n'y a rien en elle), R représente comme caractère (0). De même, un vide ou de longueur nulle, vecteur numérique est représenté avec nombre entier (0) ou numérique (0).

R établit une distinction entre NUL et un vecteur vide. NUL signifie habituellement quelque chose est indéfini. Ceci est subtilement différent de quelque chose qui est vide. Par exemple, un vecteur de caractère qui se trouve à avoir aucun élément est encore un vecteur de caractères, représentée par caractère (0).


» » » » Comment rechercher plusieurs mots r