Comment supprimer des lignes avec des données manquantes dans r

Une autre application utile de jeux partiels de trames de données est de trouver et de supprimer des lignes avec des données manquantes. La fonction R pour vérifier cela est (complete.cases). Vous pouvez essayer ce sur l'ensemble de données intégré qualité de l'air, une trame de données avec une bonne quantité de données manquantes:

> Str (airquality)> complete.cases (airquality)

Le résultat de (complete.cases) est un vecteur avec la valeur logique VRAI pour les lignes qui sont complets, et FAUX pour les lignes qui ont une certaine N / A des valeurs. Pour supprimer les lignes avec des données manquantes qualité de l'air, essayez ce qui suit:

> X lt; - constantes de l'air [complete.cases (airquality),]> str (x)

Votre résultat devrait être une trame de données avec 111 lignes, plutôt que les 153 lignes de l'original qualité de l'air trame de données.

Comme toujours avec R, il ya plus d'une façon d'atteindre votre objectif. Dans ce cas, vous pouvez faire usage de na.omit () d'omettre toutes les lignes qui contiennent des valeurs NA:

> X lt; - na.omit (airquality)

Lorsque vous êtes certain que vos données est propre, vous pouvez commencer à analyser en ajoutant des champs calculés.

Si vous utilisez une de ces méthodes au sous-ensemble de vos données ou de nettoyer les valeurs manquantes, pensez à stocker le résultat dans un nouvel objet. R ne change rien dans la trame de données d'origine, sauf si vous écrasez explicitement. Cela est une bonne chose, parce que vous ne pouvez pas accidentellement gâcher vos données.


» » » » Comment supprimer des lignes avec des données manquantes dans r