Comment décrire le centre de données continues en r

Vous avez le jeu de données et que vous avez formaté pour l'adapter à vos besoins en matière de R, alors maintenant vous êtes prêt pour le vrai travail. Analyser vos données commence toujours par le décrivant. De cette façon, vous pouvez détecter les erreurs dans les données, et vous pouvez décider quels modèles sont appropriés pour obtenir l'information dont vous avez besoin à partir des données que vous avez.

Quels statistiques descriptives vous utilisez dépend de la nature de vos données, bien sûr.

Parfois, vous êtes plus intéressés par la situation générale de vos données que vous êtes dans les valeurs individuelles. Vous pouvez être intéressé pas le kilométrage de chaque voiture, mais dans le kilométrage moyen de toutes les voitures de ce jeu de données. Pour cela, vous calculez la moyenne en utilisant la signifier() fonction, comme ceci:

> Moyenne (voitures $ mpg) [1] 20.09062

Vous pouvez également calculer le nombre moyen de cylindres ces voitures ont, mais cela n'a pas vraiment de sens. La moyenne serait 6.1875 cylindres, et pas de voitures conduire avec un cylindre incomplète. Dans ce cas, la médiane - la valeur la plus central dans vos données - plus de sens. Vous obtenez la médiane de l'utilisation de la fonction médian (), comme ça:

> Médians (voitures $ cyl) [1] 6

Il existe de nombreuses autres raisons pour le calcul de la médiane au lieu de la moyenne, ou encore les deux ensemble. Les deux statistiques décrivent une propriété différente de vos données, et même la combinaison peuvent vous dire quelque chose.


» » » » Comment décrire le centre de données continues en r