Comment au sous-ensemble des trames de données dans r

Maintenant que vous avez examiné les règles pour la création de sous-ensembles, vous pouvez l'essayer avec quelques trames de données dans R. Vous avez juste à rappeler que une trame de données est un objet bidimensionnel et contient des lignes ainsi que des colonnes. Cela signifie que vous devez spécifier le sous-ensemble de lignes et de colonnes indépendamment. Pour ce faire, vous combinez les opérateurs.

Pour illustrer sous-ensembles de trames de données, avoir un regard sur l'ensemble de données intégré iris, une trame de données de cinq colonnes et 150 lignes avec des données sur les fleurs de l'iris.

> Str (iris) 'data.frame': 150 obs. 5 variables: $ Sepal.Length: num 4.9 4.7 4.6 5.1 5.4 4.6 5 5 4.4 4.9 ... $ Sepal.Width: num 3 3.2 3.1 3.5 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1,5 1,4 1,7 1,3 1,4 1,5 1,4 1,5 ... $ Petal.Width: num 0,2 0,2 ​​0,2 ​​0,2 ​​0,2 ​​0,4 0,3 0,2 0,2 ​​0,1 $ ... Espèce: Facteur w / 3 niveaux "setosa", "versicolor", ..: 1 1 1 1 1 1 1 1 1 1 ...

Lorsque vous sous-ensemble des objets avec plus d'une dimension, vous spécifiez l'argument de sous-ensemble pour chaque dimension - vous séparez les arguments de sous-ensembles par des virgules.

Par exemple, pour obtenir les cinq premières rangées de iris et toutes les colonnes, essayez ce qui suit:

> Iris [1: 5],



Pour obtenir toutes les lignes, mais seulement deux des colonnes, essayez ce qui suit:

> Iris [, c ("Sepal.Length", "Sepal.Width")]

Vous devez prendre des précautions particulières lors de sous-ensembles dans une seule colonne d'une trame de données. Essayez ce qui suit:

iris [, 'Sepal.Length']

Vous verrez que le résultat est un vecteur, pas une trame de données que vous pouvez vous attendre.

Lorsque votre opération de sous-ensemble renvoie une seule colonne, le comportement par défaut est de retourner une version simplifiée. La façon dont cela fonctionne, est que la R inspecte les longueurs des éléments retournés. Si tous ces éléments ont la même longueur, alors R simplifie le résultat à un vecteur, une matrice ou d'un tableau.

Dans l'exemple, R simplifie le résultat dans un vecteur. Pour remplacer ce comportement, vous devez spécifier l'argument goutte = FALSE dans votre opération de sous-ensemble:

> Iris [, 'Sepal.Length', abandonnent = FALSE]

Alternativement, vous pouvez sous-ensembles de la trame de données comme une liste. Le code suivant vous renvoie une trame de données avec une seule colonne ainsi:

> Iris ['Sepal.Length']

Enfin, pour obtenir un sous-ensemble de certaines colonnes et certaines lignes:

> Iris [1: 5, c ("Sepal.Length", "Sepal.Width")] Sepal.Length Sepal.Width1 3,52 4,9 3,03 5,1 3,24 4,6 3,15 4,7 5,0 3,6

» » » » Comment au sous-ensemble des trames de données dans r