L'exploration de données

La caractéristique distinctive de l'exploitation minière de données, par rapport à l'interrogation, de reporting, OLAP ou même, est que vous pouvez obtenir des informations sans avoir à poser des questions précises.

Sommaire

L'exploration de données à des missions d'affaires spécifiques
L'exploration de données et en intelligence artificielle
L'exploration de données et les statistiques

L'exploration de données sert deux rôles principaux dans votre mission de business intelligence:

La “ Dites-moi ce qui pourrait arriver ” rôle: Le premier rôle de l'exploration de données est prédictive, dans laquelle vous dites essentiellement, “ Dites-moi ce qui pourrait arriver ”. Utilisation de la connaissance cachée enfermé dans votre entrepôt de données, des probabilités et de la probabilité des tendances et des événements futurs sont déniché et présenté à vous.
La “ Dis-moi quelque chose d'intéressant ” rôle: En plus des événements et des incidents éventuels, l'exploration de données tente également de sortir des informations intéressantes que vous devriez savoir probablement, comme une relation particulièrement inhabituel entre les ventes de deux produits différents et comment cette relation varie selon le placement dans vos magasins de détail.
Bien que beaucoup de ces détails intéressants sont susceptibles d'exister, quelles questions poseriez-vous si vous utilisiez une interrogation ou un outil OLAP, et comment interprétez-vous les résultats? L'exploration de données vous aidera dans cette tâche ardue de déterminer quelles questions poser en faisant beaucoup de gros du travail pour vous.

L'exploration de données à des missions d'affaires spécifiques

L'exploration de données est particulièrement adapté pour ces types spécifiques de missions d'affaires:

Détecter la fraude
Détermination de l'efficacité du marketing du programme
Sélection qui, à partir d'une large base de clientèle ou de la population générale, vous devez cibler dans le cadre d'un programme de marketing
Gestion du cycle de vie du client, y compris la mission de fidélisation de la clientèle
Exécution modélisation de processus de pointe et des scénarios de simulation

Pensez à ce qui se cache derrière chacune des missions commerciales dans la liste précédente:

Une grande quantité de données
Un nombre encore plus grand de combinaisons de différents morceaux de données
Intensive analyse des résultats de jeu, impliquant généralement des algorithmes complexes et des techniques statistiques avancées

Maintenant, pensez à ce que vous auriez à faire si vous utilisiez une déclaration ou d'un outil OLAP pour accomplir ces missions. Vous souhaitez trouver qu'il est pratiquement impossible d'effectuer soigneusement toute les missions précédentes de si vous aviez à poser une question et obtenir un résultat, poser une autre question et obtenir un autre résultat, puis répéter ces étapes.

L'exploration de données et en intelligence artificielle

Si vous avez été dans le domaine de la technologie de l'information (TI) pour au moins une décennie, certains des termes les précédentes peut paraître vaguement familier. Déverrouillage connaissance cachée? Fonctionnalité prédictive? Attendez une minute - qui est l'intelligence artificielle!

Dès les premiers jours de l'informatique commerciale, il ya eu un intérêt considérable dans le développement “ machines pensantes ” qui peut traiter de grandes quantités de données et de prendre des décisions fondées sur cette analyse.

L'intérêt pour l'intelligence artificielle (AI) a atteint son apogée au milieu des années 1980. A cette époque, les fournisseurs de base de données ont travaillé sur la production de systèmes de gestion de base de connaissances (KBMSs) - d'autres fournisseurs sont sortis avec coquilles de systèmes experts, ou des cadres de développement d'applications à base de AI qui utilisaient des techniques telles que l'avant-chaînage et en arrière-chaînage à informer les usagers sur les réseaux de neurones et des décisions relatives ont été positionnés comme le développement prochain grand AI.

L'intérêt pour AI diminué au début des années 1990, lorsque les attentes dépassées capacités disponibles et d'autres délires, comme client / serveur et la migration (bien sûr) l'entreposage de données, ont été au centre.

Maintenant, AI est de retour!

La technique la plus élevée AI-profil utilisé dans l'extraction de données est les réseaux de neurones. Les réseaux neuronaux ont été initialement envisagé comme un modèle de traitement qui serait imiter la façon dont le cerveau humain résout les problèmes, en utilisant les neurones et le traitement hautement parallèle à faire motif résolution.

Appliquant des algorithmes de réseau neuronal pour les domaines de la Business Intelligence que les poignées d'extraction de données (encore une fois, prédictive et “ me dire quelque chose d'intéressant ” missions) semble être un match naturel.

Bien que l'extraction de données / neuronal jeu en réseau est certainement la peine de vérifier dans, vous devriez le faire avec soin. Vous pouvez trouver beaucoup de technologies intéressantes et passionnantes que, dans les mains de ceux qui ne comprennent pas les algorithmes, échouera probablement.

Cependant, avec la connaissance et l'éducation appropriée, vous pouvez prendre un engagement à grande échelle à apporter ce type de traitement dans votre cadre de business intelligence comme le jumelage technique d'analyse pour l'analyse d'affaires OLAP-concentré.

L'exploration de données et les statistiques

La zone la plus mature de l'exploration de données est l'application de techniques statistiques avancées contre les gros volumes de données dans votre entrepôt de données. Différents outils utilisent différents types de techniques statistiques, adaptées aux zones particulières qu'ils essaient de répondre.

Sans un contexte statistique, vous trouverez peut-être une grande partie de l'exploitation minière déroutant de données. Vous devez faire beaucoup de travail pour former les algorithmes et de construire les règles pour assurer des résultats corrects avec de plus grands ensembles de données. Cependant, en supposant que vous êtes à l'aise avec ce concept, ou avoir un collègue qui peut aider, voici quelques-uns des algorithmes plus largement à effet de levier:

Algorithmes de classification: Prévoir une ou plusieurs variables discrètes, en fonction des autres caractéristiques de l'ensemble de données. En utilisant des algorithmes de classification, l'outil d'extraction de données peut regarder de grandes quantités de données, puis vous informer que, par exemple, “ Les clients qui sont conservés à travers au moins deux générations de l'achat de produits ont tendance à avoir ces caractéristiques: Ils ont un revenu d'au moins 75 000 $, et ils possèdent leurs propres maisons ”.
Algorithmes de régression: Prévoir une ou plusieurs variables continues, comme résultat, basés sur d'autres attributs dans l'ensemble de données. Algorithmes de régression sont entraînés par l'information historique présentée à l'outil d'extraction de données “ au fil du temps, ” mieux connu comme des séries chronologiques information.
Les algorithmes de segmentation: Diviser les données en groupes, ou grappes, des articles qui ont des propriétés similaires.
Algorithmes Association: Trouver des corrélations entre les différents attributs dans un ensemble de données. L'application la plus courante de ce type d'algorithme crée des règles d'association, que vous pouvez utiliser dans une analyse de panier du marché. Notez que, par exemple, si un client achète un logiciel en particulier, il ou elle a une chance d'acheter 65 pour cent de au moins deux produits spécifiques add-on packs dans les deux semaines.
Des algorithmes d'analyse de séquence: Résumer séquences fréquentes ou épisodes de données, comme un flux web-chemin.

Beaucoup d'autres méthodes existent. Dépoussiérez que les anciennes statistiques livre et de commencer à lire.

A propos Auteur

Comment choisir un algorithme pour un modèle d'analyse prédictive

Divers data-mining, et de la machine-apprentissage des algorithmes statistiques, sont disponibles pour une utilisation dans votre modèle d'analyse prédictive. Vous êtes dans une meilleure position pour sélectionner un algorithme après que vous…

Comment identifier les données pour l'analyse prédictive

Pour votre projet d'analyse prédictive, vous aurez besoin d'identifier les sources de données appropriées, les données du pool de ces sources, et le mettre dans un format structuré bien organisé. Ces tâches peuvent être très difficiles et…

Comment préparer les données pour un modèle d'analyse prédictive

Lorsque vous avez défini les objectifs du modèle pour l'analyse prédictive, la prochaine étape est d'identifier et de préparer les données que vous allez utiliser pour construire votre modèle. La séquence générale des mesures ressemble à…

Comment tester le modèle d'analyse prédictive

Pour être en mesure de tester le modèle d'analyse prédictive vous avez construit, vous devez diviser votre ensemble de données en deux ensembles: formation et de test des ensembles de données. Ces ensembles de données doivent être choisis au…

Comment utiliser mahout Apache pour l'analyse prédictive

Un outil open-source qui est uniquement utile dans l'analyse prédictive est Apache Mahout. Cette bibliothèque d'apprentissage comprend des versions à grande échelle de la classification, la classification, filtrage collaboratif, et d'autres…

L'architecture et les données de Business intelligence entreposage

Les premiers jours de traitement de business intelligence (toute variété, sauf l'extraction de données) avaient une à deux vitesses, la saveur client / serveur forte, de première génération. (Certains environnements d'intelligence d'affaires…

Découvrez données produits d'entreposage et entreprises

Toute catégorie de produits d'entreposage de données (tels que les outils OLAP, outils d'exploration de données, rapports de base et les outils d'interrogation, de moteurs de bases de données, des produits d'extraction, des outils de qualité…

L'exploration de données pour les données volumineuses

L'exploration de données consiste à explorer et d'analyser de grandes quantités de données pour trouver des modèles pour les grandes données. Les techniques sont sortis des domaines de la statistique et de l'intelligence artificielle (IA),…

L'exploration de données pour l'entreposage de données

À certains moments, l'exploration de données pour l'entreposage de données ne sont pas mélangés avec les autres formes de business intelligence. Ce manque d'intégration se produit pour deux raisons:Les utilisateurs professionnels ne disposent…

Les sources de données et des outils de business intelligence pour entrepôt de données luxe

Vous ne serez pas eu la chance de trouver des environnements mono-source quand vous construisez un luxe d'entrepôt de données. Maintenant, vous avez un nouvel ensemble de problèmes que vous devez traiter, y compris celles figurant dans cette…

Les sources de données et des outils de business intelligence pour entrepôt de données suprême

En raison de la vaste gamme de domaines dans un entrepôt de données suprême, il a de nombreuses sources de données. Les bonnes nouvelles: Parce que beaucoup de sources externes à votre propre environnement d'entreposage, vous n'êtes pas…

Text Analytics for big données non structurées

De nombreuses méthodes existent pour l'analyse de données non structurées pour votre grande initiative de données. Historiquement, ces techniques sont sortis de domaines techniques tels que traitement du langage naturel (NLP), la découverte de…

Sources de données opérationnelles communes dans la business intelligence

Entreprises stocker numériquement une quantité énorme de données opérationnelles, et pour la business intelligence à la fonction, il a besoin de larges routes ouvertes entre les sources de données. Les anciens systèmes Mainframe forment…

Les 9 lois de l'exploration de données: un guide de référence

Mineur de données pionnières Thomas Khabaza développé ses «Neuf lois de Data Mining" pour guider les nouveaux explorateurs de données comme ils se mettent au travail. Ce guide de référence vous montre ce que chacune de ces lois signifie…

godiches.com » Ordinateurs et logiciels » Big Data » Ingénierie » L'exploration de données