Comment utiliser de grandes variations dans les données axée sur le marketing

Vous allez courir à travers les situations où vos données de conduite de distribution de marketing semble durer éternellement. Les données sur le revenu est comme ça. La grande majorité des ménages ont des revenus dans une fourchette relativement étroite. Le pourcentage de ménages qui gagnent moins de un million de dollars représente presque tout le monde. Peu importe à quelle hauteur vous allez, de 10 millions $, 100 millions $, même 500 millions $, vous aurez toujours pas pris en compte chaque famille.

Cette situation est communément appelé long-tailed distribution. Ces distributions font moyennes extrêmement trompeur. La raison en est cette façon de données hors de là-bas dans la distribution contribue beaucoup plus à la moyenne que les données à la base.

Un calcul simple permettra d'illustrer ce point. Supposons que vous avez 100 personnes qui font 50K $ et 1 personne qui fait 10 millions $. Cela donne un total de 15 millions $. Ce sort à un revenu moyen de 148 500 $ un peu plus. Ceci est trois fois ce que quelqu'un fait vraiment. Et cette déformation est causée par un point de données.

Une distribution à longue queue est un exemple où ignorant données est une bonne idée. Lorsqu'on effectue une analyse sur ces types de distributions, il est bon de jeter les points de données extrêmes, appelé aberrantes. Si vous ne voulez pas de les jeter complètement, puis au moins plafonner eux à un niveau raisonnable afin qu'ils ne brouillent les œuvres.




Vous verrez que les distributions très larges surgissent fréquemment dans regardant les données comportementales. En regardant certaines données annuelles de réussite pour une entreprise de divertissement, certaines personnes ont franchi la passe qu'une seule fois. La grande majorité a utilisé moins de dix fois, mais il y avait des passages qui ont été bien utilisés plus de 200 fois.

Dans de telles situations, il est impossible de tracer l'ensemble de la distribution d'une manière significative. Si vous groupez les données dans de larges gammes, vous ne voyez pas la variation significative dans le bas.

image0.jpg

La meilleure alternative est de plafonner la distribution à une valeur assez tôt et de créer une créer une barre pour “ tout le reste ” ;.

image1.jpg

Maintenant, vous pouvez voir qu'il ya effectivement une distribution bi-modale à l'extrémité inférieure. Beaucoup de clients utilisent leur carte une seule fois, et il ya un autre pic centré autour de cinq utilisations.

La bulle sur la droite est pas vraiment une bulle. En continuant à représenter graphiquement la totalité de la distribution, il irait sur plusieurs pages et aucune page aurait plus d'une poignée de clients qui y sont représentées. Mais cela ne-vraiment-un-bulle ne vous donner une idée du nombre de clients utilisent leurs passes beaucoup.

Cette distribution suggère que, si vous étiez cette société de divertissement, vous auriez deux possibilités de commercialisation différentes. D'abord, vous voudriez obtenir les clients à usage unique de revenir. Vous aurez besoin de comprendre pourquoi ces gens ne reviennent pas et essayer de surmonter ces obstacles. Deuxièmement, vous voulez maximiser vos revenus à partir du deuxième groupe.

Vous pouvez le faire en communiquant des événements spéciaux ou les tenir informés de ce qui est nouveau. Les clients à forte utilisation ne probablement pas besoin de beaucoup d'attention supplémentaire de marketing de base de données.

Dans cet exemple, vous avez identifié trois groupes distincts de clients. Et vous avez fait cela en regardant une seule variable. Maintenant, vous pouvez creuser plus profondément dans les données sur chaque groupe séparément et développer des campagnes de marketing pour répondre à chacun.

Comprendre la façon dont les données varie auprès de vos clients ou au fil du temps vous aide à identifier les possibilités de commercialisation. Il vous permet de regrouper vos clients ainsi que de façon significative.


» » » » Comment utiliser de grandes variations dans les données axée sur le marketing