L'exploration de données

La caractéristique distinctive de l'exploitation minière de données, par rapport à l'interrogation, de reporting, OLAP ou même, est que vous pouvez obtenir des informations sans avoir à poser des questions précises.

Sommaire

L'exploration de données sert deux rôles principaux dans votre mission de business intelligence:

  • La “ Dites-moi ce qui pourrait arriver ” rôle: Le premier rôle de l'exploration de données est prédictive, dans laquelle vous dites essentiellement, “ Dites-moi ce qui pourrait arriver ”. Utilisation de la connaissance cachée enfermé dans votre entrepôt de données, des probabilités et de la probabilité des tendances et des événements futurs sont déniché et présenté à vous.

  • La “ Dis-moi quelque chose d'intéressant ” rôle: En plus des événements et des incidents éventuels, l'exploration de données tente également de sortir des informations intéressantes que vous devriez savoir probablement, comme une relation particulièrement inhabituel entre les ventes de deux produits différents et comment cette relation varie selon le placement dans vos magasins de détail.

    Bien que beaucoup de ces détails intéressants sont susceptibles d'exister, quelles questions poseriez-vous si vous utilisiez une interrogation ou un outil OLAP, et comment interprétez-vous les résultats? L'exploration de données vous aidera dans cette tâche ardue de déterminer quelles questions poser en faisant beaucoup de gros du travail pour vous.

L'exploration de données à des missions d'affaires spécifiques

L'exploration de données est particulièrement adapté pour ces types spécifiques de missions d'affaires:

  • Détecter la fraude

  • Détermination de l'efficacité du marketing du programme

  • Sélection qui, à partir d'une large base de clientèle ou de la population générale, vous devez cibler dans le cadre d'un programme de marketing

  • Gestion du cycle de vie du client, y compris la mission de fidélisation de la clientèle




  • Exécution modélisation de processus de pointe et des scénarios de simulation

Pensez à ce qui se cache derrière chacune des missions commerciales dans la liste précédente:

  • Une grande quantité de données

  • Un nombre encore plus grand de combinaisons de différents morceaux de données

  • Intensive analyse des résultats de jeu, impliquant généralement des algorithmes complexes et des techniques statistiques avancées

Maintenant, pensez à ce que vous auriez à faire si vous utilisiez une déclaration ou d'un outil OLAP pour accomplir ces missions. Vous souhaitez trouver qu'il est pratiquement impossible d'effectuer soigneusement toute les missions précédentes de si vous aviez à poser une question et obtenir un résultat, poser une autre question et obtenir un autre résultat, puis répéter ces étapes.

L'exploration de données et en intelligence artificielle

Si vous avez été dans le domaine de la technologie de l'information (TI) pour au moins une décennie, certains des termes les précédentes peut paraître vaguement familier. Déverrouillage connaissance cachée? Fonctionnalité prédictive? Attendez une minute - qui est l'intelligence artificielle!

Dès les premiers jours de l'informatique commerciale, il ya eu un intérêt considérable dans le développement “ machines pensantes ” qui peut traiter de grandes quantités de données et de prendre des décisions fondées sur cette analyse.

L'intérêt pour l'intelligence artificielle (AI) a atteint son apogée au milieu des années 1980. A cette époque, les fournisseurs de base de données ont travaillé sur la production de systèmes de gestion de base de connaissances (KBMSs) - d'autres fournisseurs sont sortis avec coquilles de systèmes experts, ou des cadres de développement d'applications à base de AI qui utilisaient des techniques telles que l'avant-chaînage et en arrière-chaînage à informer les usagers sur les réseaux de neurones et des décisions relatives ont été positionnés comme le développement prochain grand AI.

L'intérêt pour AI diminué au début des années 1990, lorsque les attentes dépassées capacités disponibles et d'autres délires, comme client / serveur et la migration (bien sûr) l'entreposage de données, ont été au centre.

Maintenant, AI est de retour!

La technique la plus élevée AI-profil utilisé dans l'extraction de données est les réseaux de neurones. Les réseaux neuronaux ont été initialement envisagé comme un modèle de traitement qui serait imiter la façon dont le cerveau humain résout les problèmes, en utilisant les neurones et le traitement hautement parallèle à faire motif résolution.

Appliquant des algorithmes de réseau neuronal pour les domaines de la Business Intelligence que les poignées d'extraction de données (encore une fois, prédictive et “ me dire quelque chose d'intéressant ” missions) semble être un match naturel.

Bien que l'extraction de données / neuronal jeu en réseau est certainement la peine de vérifier dans, vous devriez le faire avec soin. Vous pouvez trouver beaucoup de technologies intéressantes et passionnantes que, dans les mains de ceux qui ne comprennent pas les algorithmes, échouera probablement.

Cependant, avec la connaissance et l'éducation appropriée, vous pouvez prendre un engagement à grande échelle à apporter ce type de traitement dans votre cadre de business intelligence comme le jumelage technique d'analyse pour l'analyse d'affaires OLAP-concentré.

L'exploration de données et les statistiques

La zone la plus mature de l'exploration de données est l'application de techniques statistiques avancées contre les gros volumes de données dans votre entrepôt de données. Différents outils utilisent différents types de techniques statistiques, adaptées aux zones particulières qu'ils essaient de répondre.

Sans un contexte statistique, vous trouverez peut-être une grande partie de l'exploitation minière déroutant de données. Vous devez faire beaucoup de travail pour former les algorithmes et de construire les règles pour assurer des résultats corrects avec de plus grands ensembles de données. Cependant, en supposant que vous êtes à l'aise avec ce concept, ou avoir un collègue qui peut aider, voici quelques-uns des algorithmes plus largement à effet de levier:

  • Algorithmes de classification: Prévoir une ou plusieurs variables discrètes, en fonction des autres caractéristiques de l'ensemble de données. En utilisant des algorithmes de classification, l'outil d'extraction de données peut regarder de grandes quantités de données, puis vous informer que, par exemple, “ Les clients qui sont conservés à travers au moins deux générations de l'achat de produits ont tendance à avoir ces caractéristiques: Ils ont un revenu d'au moins 75 000 $, et ils possèdent leurs propres maisons ”.

  • Algorithmes de régression: Prévoir une ou plusieurs variables continues, comme résultat, basés sur d'autres attributs dans l'ensemble de données. Algorithmes de régression sont entraînés par l'information historique présentée à l'outil d'extraction de données “ au fil du temps, ” mieux connu comme des séries chronologiques information.

  • Les algorithmes de segmentation: Diviser les données en groupes, ou grappes, des articles qui ont des propriétés similaires.

  • Algorithmes Association: Trouver des corrélations entre les différents attributs dans un ensemble de données. L'application la plus courante de ce type d'algorithme crée des règles d'association, que vous pouvez utiliser dans une analyse de panier du marché. Notez que, par exemple, si un client achète un logiciel en particulier, il ou elle a une chance d'acheter 65 pour cent de au moins deux produits spécifiques add-on packs dans les deux semaines.

  • Des algorithmes d'analyse de séquence: Résumer séquences fréquentes ou épisodes de données, comme un flux web-chemin.

Beaucoup d'autres méthodes existent. Dépoussiérez que les anciennes statistiques livre et de commencer à lire.


» » » » L'exploration de données