Comment compter les valeurs de données uniques dans r

Pour comprendre ce que les données peuvent être pris en compte lorsque l'on travaille en R, nous allons jeter un oeil à l'ensemble de données mtcars. Cette base de données intégré décrit la consommation de carburant et dix points de 32 voitures des années 1970 de conception différentes. Il contient, au total, 11 variables, mais elles sont toutes numérique.

Bien que vous puissiez travailler avec la trame de données tel quel, certaines variables pourraient être converties à un facteur, car ils ont une quantité limitée de valeurs.

Si vous ne savez pas combien de valeurs différentes une variable a, vous pouvez obtenir cette information en deux étapes simples:




  1. Obtenez les valeurs uniques de la variable à l'aide Unique ().

  2. Obtenez la longueur du vecteur obtenu à l'aide length ().

En utilisant le sapply () fonction, vous pouvez le faire pour la trame de données entière à la fois. Vous appliquez une fonction anonyme combinant les deux étapes mentionnées sur la trame de données ensemble, comme ceci:

> Sapply (mtcars, la fonction (x) longueur (unique (x))) mpg cyl disp ch drat poids QSEC vs engrenage h carb25 27 22 22 3 29 30 2 2 3 6

Donc, il semble que les variables cyl, contre, suis, engrenage, et carb peuvent bénéficier d'une conversion au facteur.

Vous avez 32 observations différentes dans ce jeu de données, de sorte qu'aucun des variables a des valeurs uniques seulement.

Quand traiter une variable comme un facteur dépend un peu de la situation, mais, en règle générale, d'éviter plus de dix niveaux différents dans un facteur et d'essayer d'avoir au moins cinq valeurs par niveau.


» » » » Comment compter les valeurs de données uniques dans r