Comment préparer les données dans r

Avec R à votre portée, vous pouvez rapidement façonner vos données exactement comme vous le voulez. Voilà bien parce que dans de nombreux cas de la vie réelle, vous obtenez des tas de données dans un gros fichier, et de préférence dans un format que vous ne pouvez pas utiliser du tout. Ce doit être la règle d'or de la collecte de données: Assurez-vous que votre statisticien transpire son pantalon juste en regardant les données.

Sélection seules les variables dont vous avez besoin et de les transformer au bon format devient assez facile avec des trucs à R.

Préparons la trame de données mtcars un peu en utilisant quelques astuces simples. Tout d'abord, créer une trame de données voitures comme ça:

> Autos lt; - mtcars [c (1,2,9,10)]> autos $ engrenage lt; - commandé (voitures $ engrenage)> voitures $ h lt; - facteurs (voitures $ h, étiquettes = c ('auto', 'manuel'))



Avec ce code, vous effectuez les opérations suivantes:

  • Sélectionnez quatre variables de la trame de données mtcars et les enregistrer dans une trame de données appelé voitures. Notez que vous utilisez le système d'index pour les listes pour sélectionner les variables.

  • Faire la variable engrenage dans ces données encadrer un facteur ordonné.

  • Donnez la variable suis la valeur 'auto' si sa valeur d'origine est 1, et «manuel» si sa valeur d'origine est 0.

  • Transformer la nouvelle variable suis à un facteur.

Dans la conversion de voitures $ h, vous remarquez que le premier argument de la sinon() déclaration est pas une expression logique. La variable d'origine a 0 et 1 en tant que valeurs, et R lit un 0 comme FAUX et tout le reste VRAI. Vous pouvez utiliser cette propriété dans votre propre code, comme indiqué plus tôt.

Après l'exécution de ce code, vous devriez avoir un ensemble de données voitures dans votre espace de travail avec la structure suivante:

> Str (voitures) 'data.frame': 32 obs. de 4 variables: mpg $ num: 21 21 22,8 21,4 18,7 $ ... cyl num: 6 6 4 6 8 ... $ h: facteur w / 2 niveaux "auto", "Manuel": 1 1 1 2 2. .. engins de $: Ord.factor w / 3 niveaux de LT "3", "4" lt; "5": 2 2 2 1 1 ...

» » » » Comment préparer les données dans r