Comment regarder la structure d'un facteur de r

R a une structure de données spéciale pour les données catégorielles, appelés facteurs. Facteurs sont étroitement liés à des personnages parce que tout vecteur de caractère peut être représenté par un facteur. Pour regarder un peu sous le capot de la structure d'un facteur, utilisez le str () fonction:

> Str (state.region) Facteur w / 4 niveaux "Nord-Est", "Sud", ..: 2 4 4 2 4 4 1 2 2 2 ...

R signale la structure de state.region en tant que facteur avec quatre niveaux. Vous pouvez voir que les deux premiers niveaux sont "Nord est" et «Sud», mais ces niveaux sont représentés par des nombres entiers 1, 2, 3 et 4.

Les facteurs sont un moyen pratique pour décrire les données catégoriques. Un facteur interne est stocké comme une valeur numérique associée à chaque niveau. Cela signifie que vous pouvez définir et étudier les niveaux d'un facteur séparément des valeurs du facteur.

Pour regarder les niveaux d'un facteur, vous utilisez le (niveaux) fonction. Par exemple, pour extraire les taux de facteur de state.region, utiliser les éléments suivants:




> Niveaux (state.region) [1] "Nord" «Sud» [3] «North Central" "de l'Ouest"

Parce que les valeurs du facteur sont liés aux niveaux, lorsque vous modifiez les niveaux, vous changez aussi indirectement les valeurs elles-mêmes. Pour que ce soit clair, changer les niveaux de state.region les valeurs "NE", "S", "NC", et "W":

> Niveaux (state.region) lt; - c ("NE", "S", "NC", "W") head> (state.region) [1] SWWSW WLevels: NE S NC W

Parfois, il est utile de connaître le nombre de niveaux d'un facteur. La fonction de confort NLEVELS () extrait le nombre de niveaux de facteur:

> NLEVELS (state.region) [1] 4

Parce que les niveaux d'un facteur sont stockées en interne par R comme un vecteur, vous pouvez également extraire le nombre de niveaux à l'aide longueur:

> Longueur (niveaux (state.region)) [1] 4

Pour la même raison, vous pouvez indexer les niveaux d'un facteur en utilisant les règles vecteur subsistantes standard. Par exemple, pour extraire les deuxième et troisième niveaux de facteurs, en utilisant ce qui suit:

> Niveaux (state.region) [2: 3] [1] "S" "NC"

» » » » Comment regarder la structure d'un facteur de r