Comment déterminer une structure de données en r

La première décision que vous devez faire avant d'analyser vos données est de savoir comment représenter ces données à l'intérieur de R. Si vos données n'a qu'une dimension, alors vous savez déjà que les vecteurs représentent ce type de données très bien. Toutefois, si vos données a plus d'une dimension, vous avez le choix d'utiliser des matrices, des listes ou des trames de données. Donc, la question est: Quand utilisez-vous qui?

Matrices et les tableaux de dimensions supérieures sont utiles lorsque toutes vos données sont d'une seule classe - en d'autres termes, toutes vos données sont numériques ou toutes vos données sont des caractères. Si vous êtes un mathématicien ou statisticien, vous êtes familier avec les matrices et susceptibles d'utiliser ce type d'objet très fréquemment.




Mais dans de nombreuses situations pratiques, vous aurez les données qui ont de nombreuses classes différentes - en d'autres termes, vous aurez un mélange de données numériques et de caractère. Dans ce cas, vous devez utiliser soit des listes ou des trames de données.

Si vous imaginez vos données en une seule feuille de calcul, une trame de données est probablement un bon choix. Rappelez-vous que une trame de données est simplement une liste de vecteurs nommées de la même longueur, qui est conceptuellement très similaire à une feuille de calcul avec des colonnes et un en-tête de colonne pour chaque.

Si vous êtes familier avec les bases de données, vous pouvez penser à un cadre comme semblable à une seule table dans une base de données. Trames de données sont extrêmement utiles et, dans de nombreux cas, sera votre premier choix d'objets pour stocker vos données.

Si vos données se compose d'une collection d'objets, mais vous ne peut pas représenter que comme un tableau ou d'une trame de données, puis une liste est votre choix idéal. Parce que les listes peuvent contenir toutes sortes d'autres objets, y compris d'autres listes ou des trames de données, ils sont extrêmement flexible. Par conséquent, R a une grande variété d'outils pour traiter les listes.

Vous pouvez trouver qu'une trame de données est un choix très approprié pour la plupart des tâches d'analyse et de traitement de données. Il est un moyen très pratique de représenter vos données, et il est semblable à travailler avec des tables de base de données. Quand vous lisez les données d'une valeur séparées par des virgules (CSV) avec la fonction read.csv () ou read.table (), R met les résultats dans une trame de données.

ObjetDescriptionCommentaires
vecteurL'objet de données de base dans R, consistant seul type de une ou plusieurs valeurs (par exemple, caractère, nombre ou entier).Pensez à cela comme une seule colonne ou une ligne dans une feuille de calcul ou acolumn dans une table de base de données.
matrice ou un tableauUn objet multidimensionnelle d'un seul type (connu sous le nomatomique). Une matrice est un tableau à deux dimensions.Lorsque vous avez à stocker des numéros dans de nombreuses dimensions, usearrays.
listeLes listes peuvent contenir des objets de tout type.Les listes sont très utiles pour stocker des collections de thatbelong de données ensemble. Parce que les listes peuvent contenir des listes, ce type ofObject est très utile.
trame de donnéesTrames de données sont un type spécial de liste nommée où tous theelements ont la même longueur.Les trames de données sont similaires à une seule feuille de calcul ou à une tablein une base de données.

» » » » Comment déterminer une structure de données en r