5 façons pour étendre la gamme de vos graphiques

Parce que les mineurs de données penchent fortement sur les graphiques de base, certaines applications de data-mining offrent peu ou rien de plus. D'autres offrent un large éventail d'options de graphique, de la commune à l'exotisme. Il est pas nécessaire d'utiliser tout cela, mais vous pouvez bénéficier en choisissant et en utilisant quelques-uns qui répondent à vos propres besoins. Les mineurs de données utilisent souvent ces graphiques:

Sommaire

5 façons pour étendre la gamme de vos graphiques
5 façons pour étendre la gamme de vos graphiques Agrandir
1

Boxplot (également appelé Boîte et moustaches)

Histogrammes décrivent les distributions de variables continues, mais ont une valeur limitée pour montrer les détails. Une boîte à moustaches est une alternative. Le cœur de l'image est un box-ce qui représente la moitié des données, prises dans le milieu de la fourchette.

Le centre de la boîte est la valeur médiane de la variable, et les extrémités inférieures et supérieures de la boîte représentent les niveaux de 25th- et 75e percentiles, respectivement. Moustaches étendent ci-dessous et au-dessus de la boîte, ce qui représente la gamme de la majeure partie des données. Points au-delà les moustaches sont prises pour être aberrantes, des valeurs hautement atypiques (certaines parcelles indiquent aussi extrêmes, Quelles sont les valeurs aberrantes parmi les valeurs aberrantes).

5 façons pour étendre la gamme de vos graphiques
5 façons pour étendre la gamme de vos graphiques Agrandir
2

Boxplot conditionnelle




Boxplots pour plusieurs groupes (telles que les régions géographiques) peuvent être placés côte à côte sur un même graphique pour faciliter la comparaison.

5 façons pour étendre la gamme de vos graphiques
5 façons pour étendre la gamme de vos graphiques Agrandir
3

Coordonnées parallèles

Les graphiques montrent les valeurs pour plusieurs variables tous ensemble sur une seule parcelle, avec les valeurs pour chaque cas reliés par des segments de ligne. Combinaisons communes se démarquent du reste. Par exemple, la figure montre plusieurs variables liées à l'automobile et la consommation de carburant.

Beaucoup de cas partagent certaines valeurs, exactement ou approximativement, formant des motifs sombres de nombreuses lignes suivantes chemins similaires à travers le graphe. Par exemple, les cas pour les voitures avec un quatre cylindres, à faible déplacement, kilométrage élevé, et les années de modèles récents forment un motif très sombre et visible.

5 façons pour étendre la gamme de vos graphiques
5 façons pour étendre la gamme de vos graphiques Agrandir
4

Gains graphiques (aussi appelé gains cumulatifs)

Un tableau des gains que vous montre à quel point un modèle prédictif améliore les résultats sur un échantillonnage aléatoire. Certaines personnes sont plus susceptibles de prendre des mesures (acheter un produit, voter pour un candidat, enfreindre la loi...) Que d'autres. Si vous ne savez rien sur un groupe de personnes, le meilleur que vous pouvez dire est que le contact avec la moitié des gens vont tourner la moitié de ceux qui vont prendre des mesures.

Mais un modèle prédictif peut vous dire que les gens sont les meilleurs prospects, de sorte que vous pouvez utiliser le modèle pour prendre la moitié (ou 10 pour cent ou 60 pour cent, et ainsi de suite...) Et d'obtenir plus d'action. Combien en plus?

Dans le graphique, vous pouvez voir une ligne diagonale où le X et y Les valeurs sont toujours les same- cela représente ce que vous obtiendriez en sélectionnant perspectives au hasard. L'autre ligne représente le modèle. La différence de y des valeurs entre le modèle et la sélection aléatoire montre combien le modèle améliore votre résultat. Lire la ligne du modèle tracé sur la carte, et le comparer à la ligne pour l'échantillonnage aléatoire.

5 façons pour étendre la gamme de vos graphiques
5 façons pour étendre la gamme de vos graphiques Agrandir
5

Graphiques Lift

Graphiques Lift sont très semblables aux graphiques de gains. La principale différence est que les données sont normalisées, de sorte que l'échantillonnage aléatoire est toujours représenté comme une valeur de 1 et les résultats du modèle sont représentés en proportion de l'échantillonnage aléatoire.

Vous pouvez voir plusieurs différents types de graphiques appelées diagrammes de levage. Certains sont cumulatifs, et d'autres ne sont pas. Certains peuvent même être graphiques de gains


» » » » 5 façons pour étendre la gamme de vos graphiques