Notions de base de types de données et des structures dans les programmes de R pour l'analyse prédictive

Dans la programmation de R pour l'analyse prédictive, les données types

Sommaire

sont parfois confondus avec les données structures. Chaque variable dans la mémoire de programme ayant un type de données. Bien sûr, vous pouvez sortir avec plusieurs variables ayant dans votre programme et être gérable encore. Mais cela ne fonctionnera probablement pas si bien si vous avez des centaines (ou des milliers) de variables- vous devez donner chaque variable un nom afin que vous puissiez y accéder.

Il est plus efficace pour stocker toutes ces variables dans un ensemble logique.

Les types de données

Comme d'autres langues à part entière programmation, R propose de nombreux types de données et structures de données. Il n'y a pas besoin de spécifier le type que vous affectez à un Variable- l'interprète fera pour vous. Cependant, vous pouvez spécifier ou convertir le type si le besoin arises- ce qu'on appelle coulage. Trois types de données sont les suivantes:

  • Numérique: Ce sont vos nombres décimaux typiques. Ceux-ci sont appelés flotteurs (court pour nombres à virgule flottante) Ou double dans d'autres langues.

  • Personnages: Ce sont vos chaînes formées avec des combinaisons de lettres, des caractères et des chiffres. Ils ne sont pas censés avoir un sens numérique. Ceux-ci sont appelés cordes dans d'autres langues.

  • Logique: VRAI ou FAUX. Toujours capitaliser ces valeurs dans R. Ces valeurs sont appelées Booléens dans d'autres langues.

La comparaison d'une chaîne de nombres à un nombre numérique se traduit par l'interprète la conversion de la chaîne de nombres dans un numérique et puis en faisant une comparaison numérique.




Des exemples de types de données sont les suivantes:

> I lt; - 10 numérique #> j lt; - 10,0 # numérique> k lt; - "10" caractère #> m lt; - i == j # logique> n lt; - i == k # logique

Après l'exécution de ces lignes de code, vous pouvez trouver sur leurs valeurs et leurs types en utilisant le str () fonction. Cette opération ressemble à ceci:

> Str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) Logi TRUE> str (n) Logi VRAI

L'expression dans le n affectation est un exemple de conversion de l'interprète temporairement le type de données k dans un numérique pour faire l'évaluation entre numérique je et le caractère k.

Les structures de données

R aura besoin d'un endroit pour stocker des groupes de types de données afin de travailler avec elle de manière efficace. Ceux-ci sont appelés structures de données.

Un exemple concret de ce concept est un garage de stationnement: Il est une structure qui stocke voitures efficacement. Il est conçu pour stationner autant d'automobiles que possible, et permet de voitures d'entrer et de sortir efficacement la structure. Aussi, pas d'autres objets en plus de voitures doivent être garées dans un stationnement.

Les structures de données comprennent:

  • Vecteurs: Vecteurs stocker un ensemble de valeurs d'un type de données unique. Pensez-y comme un pilulier hebdomadaire. Chaque compartiment dans la casemate ne peut stocker un certain type d'objet. Après avoir mis quelques pilules dans l'un des compartiments, tous les autres compartiments doivent également être remplis avec soit zéro pilules ou plus de pilules.

    Vous ne pouvez pas mettre des pièces dans le même box-vous devez utiliser un autre “ Pill Box ” (vecteur) pour cela. De même, une fois que vous enregistrez un numéro dans un vecteur, toutes les valeurs futures devraient également être des nombres. Sinon l'interprète convertit tous vos numéros de caractères.

  • Matrices: UN matrice ressemble à une feuille de calcul Excel: Essentiellement, il est un tableau constitué de rangées et de colonnes. Les données remplit les cellules vides par ligne ou une colonne, l'ordre dans lequel vous spécifiez lorsque vous créez la matrice.

    Toutes les colonnes doivent avoir le même type de données.

  • Les trames de données: Une trame de données est semblable à une matrice, sauf les colonnes d'une trame de données peuvent contenir différents types de données. Les ensembles de données utilisés dans la modélisation prédictive sont chargés dans des trames de données et il stockés pour une utilisation dans le modèle.

  • Facteurs: UN facteur est comme un vecteur avec un nombre limité de valeurs distinctes. Le nombre de valeurs distinctes est désigné par son niveau. Vous pouvez utiliser des facteurs de traiter une colonne qui a un nombre limité et connu de valeurs que les valeurs catégoriques. Par défaut, les données de caractères est chargée dans des trames de données en tant que facteurs.

Vous accédez à des vecteurs, des matrices, et des trames de données en utilisant notation de tableau. Par exemple, vous taperez v [5] pour accéder au cinquième élément du vecteur v. Pour une matrice à deux dimensions et la trame de données, vous mettez dans le numéro de ligne et le numéro de colonne, séparés par une virgule, à l'intérieur des crochets. Par exemple, vous tapez m [2,3] pour accéder à la deuxième rangée, troisième valeur de colonne pour la matrice m.

Les structures de données sont un sujet de pointe en informatique. Pour l'instant, nous nous en tenons à la pratique. Rappelez-vous juste que les structures de données ont été construits pour stocker certains types de données et ils ont des fonctions pour l'insertion de données, la suppression et la récupération.


» » » » Notions de base de types de données et des structures dans les programmes de R pour l'analyse prédictive