Comment corriger les erreurs de lecture de données dans r
Probablement erreurs les plus courantes en R sont faites lors de la lecture des données à partir de fichiers texte à l'aide read.table () ou read.csv (). Beaucoup d'erreurs entraînent des erreurs R de lancement, mais parfois vous remarquez que quelque chose allait mal quand vous regardez la structure de vos données. Dans le dernier cas, vous trouverez souvent que certaines ou toutes les variables sont convertis en facteurs quand ils devraient vraiment pas être.
Lorsque R donne des erreurs ou de la structure de vos données est pas ce que vous pensez qu'elle devrait être, vérifiez les points suivants:
Vous avez oublié de spécifier l'argument tête = TRUE? Si oui, R va voir les noms de colonnes comme les valeurs et, en conséquence, de convertir chaque variable d'un facteur comme il le fait toujours avec les données de caractère dans un fichier texte.
Avez-vous eu des espaces dans vos noms de colonnes ou des données? La read.table () fonction peut interpréter espaces dans, par exemple, les noms de colonnes ou dans les données de chaîne comme un séparateur. Vous obtenez alors des erreurs de vous dire «ligne x n'a pas d'éléments y '.
Avez-vous eu un séparateur décimal différent? Dans certains pays, les décimales sont séparées par une virgule. Vous devez dire spécifiquement R qui est le cas en utilisant l'argument dec = "," dans le read.table () fonction.
Avez-vous oublié de spécifier stringsAsFactors = FALSE? Par défaut, R modifie les données de caractères à des facteurs, de sorte que vous ayez toujours ajouter cet argument si vous voulez que vos données restent variables caractères.
Avez-vous une autre façon de spécifier les valeurs manquantes? R lit 'N / A' dans un fichier texte comme une valeur manquante, mais le fichier peut utiliser un code différent (par exemple, «disparus»). R verra que sous forme de texte et encore convertir cette variable à un facteur. Vous résoudre ce problème en spécifiant l'argument na.strings dans le read.table () fonction.
Si vous vérifiez toujours la structure de vos données immédiatement après avoir lu, vous pouvez attraper des erreurs beaucoup plus tôt et d'éviter des heures de frustration. Votre meilleur pari est d'utiliser str () des informations sur les types et tête () pour voir si les valeurs sont ce que vous attendiez.
A propos Auteur
Comment manipuler des fichiers dans r Parfois, vous pouvez écrire un script dans R qui va traverser un dossier donné et effectuer des actions sur toutes les données dans les fichiers ou un sous-ensemble des fichiers dans ce dossier.Pour obtenir une liste des fichiers dans un dossier…
Comment faire fondre les données à format long en r Lorsque vous utilisez R, considérer les mots large et long comme des métaphores visuelles pour la forme de vos données. En d'autres termes, les données large a tendance à avoir plus de colonnes et de rangées de moins par rapport aux données…
Comment résumer un ensemble de données dans r Si vous avez besoin d'un aperçu rapide de votre ensemble de données, vous pouvez, bien sûr, toujours utiliser la commande R str () et de regarder la structure. Mais cela vous dit quelque chose seulement sur les classes de vos variables et le…
Comment utiliser read.csv () pour importer des données dans r Une des façons les plus faciles et les plus fiables d'obtenir des données dans R est d'utiliser des fichiers de texte, en particulier CSV (valeurs séparées par des virgules) des fichiers. Le format de fichier CSV utilise la virgule pour séparer…
Comment utiliser read.table () pour importer les données des tableaux sont en r Les fonctions read.csv (), read.csv2 (), et read.delim () sont des cas particuliers de la polyvalente read.table () fonction dans R qui peut traiter une grande variété de formats de fichiers de données. La read.table () fonction a un certain…
Comment utiliser le presse-papiers pour copier et coller les données dans r Une autre façon d'importer des données de manière interactive en R est d'utiliser le Presse-papiers pour copier et coller des données. Pour importer des données à partir du presse-papiers, utilisez la readClipboard () fonction. Par exemple,…
Comment travailler avec des fichiers de données non-CSV dans r Malgré le fait que CSV (comma-separated values) des fichiers sont très largement utilisés pour importer et exporter des données dans R, ils ne sont pas toujours le format le plus approprié. Certains formats de données permettent la…
Importation de données dans r R possède de nombreuses fonctions qui vous permettent d'importer des données provenant d'autres applications. Le tableau suivant présente certaines des fonctions d'importation de texte utile, ce qu'ils font, et des exemples de la façon de les…
R pour les nuls Même avec de bons livres d'introduction sur R, vous aurez besoin d'utiliser les fichiers d'aide R. Les fichiers d'aide de R fournissent des informations détaillées sur l'utilisation des différentes fonctions et leurs particularités. R a une…
Comment ajouter des données SQL, une rangée à la fois La plupart saisie de données-forme de support SQL SGBD. Cette fonctionnalité vous permet de créer une forme d'écran qui a un champ pour chaque colonne dans une table de base de données. Étiquettes de champ du formulaire vous permettent de…
Comment transformer les données XML dans des tables SQL Jusqu'à récemment, en pensant à la relation entre SQL et XML, l'accent a été mis sur la conversion des données de la table SQL en XML pour les rendre accessibles sur Internet. SQL: 2008 a abordé le problème complémentaire de convertir des…
Comment lire les données simples à partir d'un fichier texte dans SPSS Voici une procédure que vous pouvez suivre pour lire les données à partir d'un simple fichier texte dans SPSS. Le fichier est nommé awards.txt. Il contient deux cas (lignes de données) en tant que deux lignes de texte, les éléments de…
La collecte et la validation des données d'études cliniques Si le formulaire de rapport de cas (CRF) a été soigneusement conçu et logiquement, d'entrer les données de chaque sujet au bon endroit sur la CRF devrait être simple. Ensuite, vous avez besoin pour obtenir ces données dans un ordinateur pour…
Comment créer un dictionnaire de données pour décrire vos données de biostatistique Chaque base de données de recherche, grandes ou petites, simples ou complexes, doit être accompagnée par un dictionnaire de données qui décrit les variables contenues dans la base de données. Il sera inestimable si la personne qui a créé la…