Bases de données et data mining

Les données recueillies par les grandes organisations dans le cadre de ses activités de tous les jours est habituellement stocké dans des bases de données. Mais les administrateurs de base de données peuvent ne pas être disposé à permettre à des mineurs de données un accès direct à ces sources de données, et un accès direct peuvent ne pas être la meilleure option à partir de votre point de vue non plus. Accès direct aux opérationnels (utilisé pour les activités de routine) des bases de données peut être une mauvaise idée parce que

  • Les mineurs de données utilisent un grand nombre de données. Vous pourriez involontairement immobiliser les ressources et d'interférer avec les opérations commerciales ordinaires.

  • Juridiques et autres obligations des entreprises d'importance. Vous pourriez involontairement violer une loi de protection des données ou une autre exigence de gestion des données si votre accès aux données ne sont pas correctement contrôlée.

  • Bases de données opérationnelles ne sont pas organisés pour le data mining. Vous pourriez passer beaucoup de temps à lutter pour obtenir les données dont vous avez besoin, et toujours pas être sûr de bien faire les choses.

Lorsque vous avez besoin d'une base de données opérationnelle (et vous avez l'approbation approprié d'utiliser les données), vous devriez discuter de vos besoins avec l'administrateur responsable de ces données. Vous aurez besoin d'expliquer exactement ce que les données dont vous avez besoin, le format que vous avez besoin pour l'extraction de données, et si vous devez les données une seule fois ou sur une base continue.




La meilleure approche pour les demandes ponctuelles est souvent à l'administrateur pour extraire les données pour vous et de le livrer dans un fichier texte ou un autre format acceptable.

L'accès aux données en cours est une autre affaire. L'administrateur peut ne pas vouloir fournir des extraits de données à plusieurs reprises, et en vous donnant un accès direct aux systèmes d'entreprise est risquée. Une solution commune est de créer un base de données analytique. Ceci est une base de données relationnelle ordinaire qui est séparé de systèmes commerciaux classiques. Les données sont régulièrement (et automatiquement) transféré de systèmes de gestion de la base de données analytique, et les mineurs de données peut accéder à tout moment.

Si vous utilisez une base de données analytique, assurez-vous qu'il est bien organisé pour soutenir l'exploration de données. Aidez votre administrateur de base de données en esquissant un schéma comme celui montré à démontrer comment les données doivent être organisées.

image0.jpg

Si l'administrateur de base de données insiste pour que les données ne peuvent être stockées de cette façon, se demander si il est possible de créer un vue (une requête stockée peut être interrogé comme si elle était une table de données classiques) avec l'organisation que vous avez besoin.

De nombreux produits d'exploration de données sont capables de lire les données à partir de bases de données. Les étapes nécessaires varient en fonction de la

  • Conception de l'application de data-mining

  • Structure de la base de données source

  • Middleware, habituellement appelé conducteur (Pilote ODBC, JDBC), Un logiciel spécial qui assure la médiation entre le logiciel de base de données et des applications

Documentation de votre application de data-mining devrait vous dire si elle peut lire les données à partir d'une base de données, et si oui, quel outil ou fonction à utiliser, et comment. L'administrateur qui met en place la base de données de l'analyse peut fournir des détails sur l'accès à la base de données.

Si vous êtes déjà à l'aise de travailler avec des bases de données et d'autres applications, vous trouverez rien de surprenant à faire les mêmes choses avec une application de data-mining. Si les bases de données sont nouveaux pour vous, obtenir une personne bien informée de votre organisation pour vous guider à travers le processus avec votre propre application de base de données et de data-mining.


» » » » Bases de données et data mining