Comment utiliser des facteurs ou des données numériques dans r

Avant d'essayer de décrire vos données dans R, vous devez vous assurer que vos données sont dans le bon format. Ça signifie

  • Assurant que tous vos données est contenue dans une trame de données (ou dans un vecteur si elle est une seule variable)

  • Veiller à ce que toutes les variables sont du type correct

  • Vérification que les valeurs sont toutes traitées correctement




Certaines données ne peuvent avoir qu'un nombre limité de valeurs différentes. Par exemple, les gens peuvent être soit mâle ou femelle, et vous pouvez décrire la plupart des types de cheveux avec seulement un peu de couleurs.

Parfois, plusieurs valeurs sont théoriquement possibles, mais pas réaliste. Par exemple, les voitures peuvent avoir plus de 16 cylindres dans leurs moteurs, mais vous ne trouverez pas beaucoup d'entre eux. D'une façon ou d'une autre, toutes ces données peuvent être considérées comme catégorique. Selon cette définition, les données catégorique comprend également des données ordinales.

D'autre part, vous avez des données qui peuvent avoir un nombre illimité de valeurs possibles. Cela ne signifie pas nécessairement que les valeurs peuvent être une valeur quelconque. Par exemple, le kilométrage d'une voiture est exprimée en miles par gallon, souvent arrondie à l'ensemble mile. Pourtant, la valeur réelle sera légèrement différente pour chaque voiture.

La seule chose qui définit le nombre de valeurs possibles vous permettez est la précision avec laquelle vous exprimez les données. Les données qui peut être exprimé avec un niveau de précision choisi est continu. Les deux données d'intervalle-échelle et données de rapport-échelle sont généralement données continues.

La distinction entre les données catégorique et continu est pas toujours clair si. L'âge est, en substance, une variable continue, mais il est souvent exprimée en nombre d'années depuis la naissance.

Vous avez encore beaucoup de valeurs possibles si vous faites cela, mais ce qui arrive si vous regardez à l'âge des enfants de votre école secondaire locale? Soudain, vous avez seulement cinq, peut-être six, des valeurs différentes dans vos données. À ce moment, vous pouvez obtenir plus de votre analyse si vous traitez ces données aussi catégorique.

Lors de la description de vos données, vous devez faire la distinction entre les données qui profite d'être convertie à un facteur et de données qui doit rester numérique. Si vous pouvez voir vos données aussi catégorique, le convertissant en un facteur aide à analyser.


» » » » Comment utiliser des facteurs ou des données numériques dans r