Trouver les valeurs aberrantes dans vos données le foot

En analysant les données pour vos infographie, vous devez être conscient que certains points de données - connu sous le nom aberrantes - jeter si loin en dehors de la norme, comme pour appeler l'attention sur eux. Dans les cas les plus graves, ils peuvent même fausser les données et de créer une image trompeuse du sujet. Vous devez reconnaître quand vous avez une valeur aberrante et ensuite décider quoi faire à ce sujet.

Cette table contient un exemple simple pour illustrer ce concept. Les deux ensembles de données représentent les notes d'un élève, pendant huit semaines, sur deux exams- hebdomadaire les chiffres sont la pour cent correct à l'examen. L'ensemble de données sur la gauche (le premier examen) ne contient pas une aberration, mais l'ensemble de données sur le droit (le deuxième examen) fait. L'une valeur aberrante est indiqué en caractères gras.

Notes d'examen hebdomadaires
SemaineGrades (pas aberrant)Grades (une valeur)
190%90%
288%88%
390%90%
485%50%
586%86%
687%87%
785%85%
884%84%
Moyenne87%83%

La moyenne dans la colonne du milieu peint une image assez précise de la réussite de l'élève dans des tests réguliers. La seule valeur aberrante (gras) (50%) dans l'ensemble de données sur le droit jette une clé dans les œuvres, cependant, laisser tomber la moyenne de l'étudiant par quatre points de pourcentage et de biaiser les données.




Qu'est-ce que un journaliste de données faire dans un tel cas? Voici quelques options:

  • Jetez la valeur aberrante. Si vous utilisez uniquement la moyenne dans votre graphique et êtes concerné qu'il est trompeur, éliminer la valeur aberrante comme une aberration et ensuite calculer la moyenne, sans que la semaine, comme le montre la figure.

    Dans cet exemple, jeter la valeur aberrante signifierait score au test moyenne de cet élève grimpe à 87%, ce qui (comme la première colonne indique) est une meilleure représentation de la réussite sur la durée.

    image0.jpg

    Si vous y allez avec cette option, assurez-vous d'ajouter une note expliquant tout: dans ce cas, la suppression d'un point de données. Toujours être aussi transparent que possible.

  • Afficher les données tel quel. Que vous utilisiez juste la moyenne dans votre graphique ou tracer toutes les données dans un graphique, vous pouvez toujours présenter les données exactement comme il est venu à vous, comme le montre la figure suivante.

    Dans ce cas, vous devriez ajouter une note appelant à la valeur aberrante afin que votre lecteur est pleinement conscient de cela.

    image1.jpg
  • Construire un “ la ligne de meilleur ajustement ”. Cette option concerne uniquement si vous allez créer un graphique montrant toutes les données. Une ligne de meilleur ajustement - également appelé régression linéaire - est un moyen visuel de vos données: littéralement la ligne qui représente vos points de données dispersées meilleur.


» » » » Trouver les valeurs aberrantes dans vos données le foot