Comment distinguer les différents types de données dans r

Dans le domaine des statistiques, être capable de faire la distinction entre les variables de différents types est très important. Le type de données détermine très souvent le type d'analyse qui peut être effectuée. En conséquence, R offre la possibilité de classer les données de manière explicite comme suit:

  • Données nominale: Ce type de données, que vous représentez dans R en utilisant des facteurs, la distinction entre les différentes catégories, mais il n'y a aucun ordre implicite entre les catégories. Exemples de données nominales sont des couleurs (rouge, vert, bleu), le sexe (masculin, féminin), et la nationalité (britannique, français, japonais).

  • Données ordinale: Données ordinale se distingue par le fait qu'il ya une sorte d'ordre naturel entre les éléments, mais aucune indication de la différence de taille relative. Tout type de données qui est possible de classer dans l'ordre mais pas donner des valeurs exactes à est ordinale. Par example, faible lt; moyen lt; haut décrit les données qui est commandé avec trois niveaux.

    Dans une étude de marché, il est très courant d'utiliser une échelle de cinq points pour mesurer les perceptions: fortement en désaccord lt; être en désaccord lt; neutre lt; accepter lt; tout à fait d'accord. Ceci est également un exemple de données ordinales.




    Un autre exemple est l'utilisation des noms de couleurs pour indiquer l'ordre, comme rouge lt; ambre lt; vert pour indiquer l'état de projet.

    Dans R, vous utilisez facteurs commandés pour décrire les données ordinales.

  • Les données numériques: Vous avez données numériques lorsque vous pouvez décrire vos données avec des nombres (par exemple, longueur, poids, ou de compter). Les données numériques a deux sous-catégories.

  • Intervalle données échelonné: Vous avez intervalle échelle des données lorsque l'intervalle entre les unités de mesure adjacents est la même, mais le point zéro est arbitraire. Un exemple quotidien de données à l'échelle d'intervalle est notre système de calendrier. Chaque année a la même longueur, mais le point zéro est arbitraire. En d'autres termes, le temps n'a pas commencé en l'an zéro utiliser -simplement une année pratique pour commencer à compter. Cela signifie que vous pouvez ajouter et soustraire des dates (et tous les autres types de données mises à l'échelle d'intervalle), mais vous ne pouvez pas diviser de façon significative dates. D'autres exemples comprennent la longitude, ainsi que toute autre chose où il peut y avoir désaccord sur l'endroit où le point de départ est.

    D'autres exemples de données d'intervalle échelle peuvent être trouvés dans la recherche en sciences sociales telles que les études de marché.

    En R vous pouvez utiliser entier ou numérique objets pour représenter des données à l'échelle d'intervalle.

  • Ratio échelle des données: Ce sont des données où toutes sortes d'opérations mathématiques sont interdits, en particulier la capacité à multiplier et diviser (en d'autres termes, prendre des ratios). La plupart des données en sciences physiques sont rapport échelle - par exemple, la longueur, la masse et la vitesse. Dans R, vous utilisez numérique objets pour représenter des données de rapport à l'échelle.


» » » » Comment distinguer les différents types de données dans r