Tendance centrale: au-delà des bases

La moyenne et médiane sont les deux mesures les plus fréquemment rapportés fiables et du centre, et ils sont utilisés dans une grande variété de situations. Toutefois, si vous êtes sérieusement étudier les statistiques, vous devez être familier avec deux autres mesures de tendance centrale.

Sommaire

Mode

La mode est une autre mesure de centre qui calcule quelle valeur (ou plage de valeurs) survient le plus fréquemment. La moyenne et la médiane peuvent être très efficaces à décrire les distributions symétriques et unimodales. Le mode est utile pour expliquer des situations que la moyenne et la valeur médiane peuvent pas les données, en particulier asymétriques ou multimodaux.




Pour calculer le mode, il vous suffit de créer une table de fréquence de toutes les valeurs possibles et comptez le nombre de fois où chaque affiche. Par exemple, si l'ensemble de données contient 10, 20, 20, 20, 30, 30, 40, 50, 50- alors le mode est de 20.

Si vous avez un ensemble de données qui ne possède pas les valeurs qui se répètent exactement, vous pouvez les diviser en des gammes similaires à la façon dont vous vous préparez pour établir un histogramme. Par exemple, dans le tableau ci-dessous, deux joueurs sur les Lakers font la ligue NBA minimum, donc le mode pourraient être considérées comme 959 111 $. Alternativement, vous pouvez diviser les données en groupes de 1 million $, auquel cas le mode serait la gamme 5-6 M $ parce que quatre joueurs tombent dans ce groupe.

Salaires pour L.A. Lakers NBA Players (2009-2010)
JoueurSalaire ($)
Kobe Bryant23034375
Pau Gasol16452000
Andrew Bynum12526998
Lamar Odom7500000
Ron Artest5854000
Adam Morrison5257229
Derek Fisher5048000
Sasha Vujacic5000000
Luke Walton4840000
Shannon Brown2000000
Jordan Farmar1947240
Didier Ilunga-Mbenga959111
Josh Powell959111
Global91378064

Le mode peut être visualisé par le pic dans un histogramme. Avec les ensembles de données qui ont plusieurs pics, il est pas rare de déclarer plusieurs modes parce que la moyenne et la médiane peuvent ne pas refléter exactement où la plupart des valeurs se situent.

Moyenne tronquée

Vous avez vu que la moyenne est sensible aux valeurs aberrantes et sera “ tiré ” vers les valeurs les plus extrêmes. La moyenne tronquée (ou moyenne tronquée) Tente d'éliminer l'influence des valeurs aberrantes par rogner un petit nombre de valeurs extrêmes de sorte que la moyenne se concentre davantage sur les valeurs les plus centraux.

Pour calculer une moyenne tronquée, vous choisissez un petit pourcentage de vos données définir (par exemple, 10 pour cent), diviser ce nombre de moitié, retirer le pourcentage correspondant de valeurs des deux extrémités hautes et basses, et ensuite calculer la moyenne de la participation restante des valeurs.

Par exemple, supposons un ensemble de données contient les informations suivantes n = 20 valeurs: 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 9, 500. La valeur aberrante de 500 unités l'échantillon (traditionnel) signifie être de 29,6, ce qui est plus grand que tous, mais l'une des valeurs de données et pas vraiment indiquant où toute l'action est.

Au lieu de cela, vous pouvez découper la plus extrême de 10 pour cent, ce qui signifie enlever deux valeurs (10% x 20 = 20), et juste de calculer une moyenne basée sur la moyenne de 90 pour cent des valeurs. Depuis que vous avez à diviser que deux entre les deux extrémités, vous allez supprimer l'un de l'extrémité basse (3) et l'autre de l'extrémité supérieure (500). Les 90 pour cent la moyenne tronquée basée sur les 18 valeurs de données restantes est 4.9 et reflète mieux la tendance centrale des données.


» » » » Tendance centrale: au-delà des bases