Les phases du processus de data mining
La Cross-Industry Standard Process for Data Mining (CRISP-DM) Est le cadre dominant du processus de data mining. Il est un quelqu'un normalisation ouverte peut l'utiliser. La liste suivante décrit les différentes phases du processus.
La compréhension de l'activité: Obtenez une compréhension claire du problème que vous êtes hors de résoudre, comment elle influence votre organisation, et vos objectifs pour y faire face. Les tâches de cette phase comprennent:
Identification de vos objectifs d'affaires
Évaluer votre situation
Définir vos objectifs d'exploration de données
Produire votre plan de projet
Compréhension des données: Passez en revue les données que vous avez, documenter, d'identifier la gestion des données et les problèmes de qualité de données. Tâches pour cette phase comprennent:
Rassembler des données
Décrivant
Exploration
Vérification de la qualité
La préparation des données: Obtenez vos données prête à l'emploi pour la modélisation. Tâches pour cette phase comprennent:
Sélection des données
Nettoyage des données
Construire
Intégrer
Formatage
Modélisation: Utilisez des techniques mathématiques pour identifier les tendances au sein de vos données. Tâches pour cette phase comprennent:
Sélection techniques
Tests de Design
Modèles de construction
Evaluation des modèles
Évaluation: Passez en revue les modèles que vous avez découverts et évaluer leur potentiel pour une utilisation professionnelle. Tâches pour cette phase comprennent:
L'évaluation des résultats
Revoir le processus
Déterminer les prochaines étapes
Déploiement: Mettez vos découvertes à travailler dans les affaires courantes. Tâches pour cette phase comprennent:
Le déploiement de la planification (vos méthodes d'intégration des découvertes d'exploration de données en usage)
La présentation des résultats finaux
Revoir les résultats finaux
A propos Auteur
L'exploration de données pour l'entreposage de données À certains moments, l'exploration de données pour l'entreposage de données ne sont pas mélangés avec les autres formes de business intelligence. Ce manque d'intégration se produit pour deux raisons:Les utilisateurs professionnels ne disposent…
Couche 3 de la grosse pile de données: l'organisation des services et des outils de données L'organisation des services de données et des outils, couche 3 de la grosse pile de données, la capture, valider et assembler différents éléments de données dans de grandes collections contextuellement pertinents. Parce que Big Data est…
Meilleures pratiques pour grande intégration de données Beaucoup d'entreprises explorent de gros problèmes de données et à venir avec des solutions innovantes. Il est maintenant temps de prêter attention à un certain les meilleures pratiques, ou principes de base, qui vous servira ainsi que vous…
Comment hiérarchiser grande qualité des données Obtenir le bon point de vue sur la qualité des données peut être très difficile dans le monde du big data. Avec la majorité des grandes sources de données, vous devez supposer que vous travaillez avec des données qui ne sont pas propres. En…
Comment raccourcir le temps du projet avec le projet de microsoft office 2007 Vous estimez que la longueur d'un projet du mieux que vous pouvez, mais si votre projet Microsoft Office Project 2007 prend plus de temps que prévu, essayez les méthodes suivantes pour serrer le calendrier:Modifier les dépendances afin que les…
Techniques de gagner du temps gestion de projet La gestion de projet est tout au sujet de gagner du temps. Mais même avec des outils de gestion tels que Microsoft Project 2010, votre projet pourrait fonctionner plus longtemps que prévu. Dans ce cas, essayez les méthodes suivantes pour serrer…
Phases de développement du système de SQL Dans l'élaboration de tout système, vous commencez au début et à aller jusqu'au bout, et il est pas différent avec SQL. La liste suivante vous montre ce qu'il faut considérer à chaque phase du cycle de vie de développement de SQL:Phase de…
La facturation médicale et de codage: se préparer pour le déménagement de la CIM-9 à la CIM-10 En tant que professionnel de la facturation médicale, vous aurez besoin de savoir à propos du déménagement de la CIM-9 à la CIM-10. La neuvième édition de la classification de la CIM est la CIM-9, qui aux États-Unis a utilisé depuis 1979.…
Fermer INVESTISSEMENTS ou de phase, des outils et des techniques, que vous devez savoir pour l'examen de certification PMP The Close processus de projet ou de phase est le dernier processus dont vous avez besoin pour préparer l'examen de certification PMP et marque le point culminant d'une phase dans le cycle de vie du projet ou de l'achèvement de l'ensemble du…
10 erreurs d'exploration de données communes (que vous ne pourrez pas faire) L'exploration de données se fait par essais et erreurs, et donc, pour les mineurs de données, faire des erreurs est naturel. Les erreurs peuvent être utiles, en d'autres termes, au moins dans certaines conditions. Pas toutes les erreurs sont…
L'exploration de données pour les nuls Mineur de données pionnières Thomas Khabaza développé ses «Neuf lois de Data Mining" pour guider les nouveaux explorateurs de données comme ils se mettent au travail. Ce guide de référence vous montre ce que chacune de ces lois signifie…
La planification stratégique, la phase 5: aligner vos ressources Maintenant que vous avez établi une direction claire et la feuille de route pour y arriver, votre équipe de planification stratégique est prêt à aligner la stratégie de ressources. Plus précisément, à la phase 5, vous alignez les ressources…
La planification stratégique, la phase 6: exécuter votre plan L'exécution de votre plan stratégique est aussi importante que - ou même plus important que - votre stratégie. La majorité des organisations qui ont des plans stratégiques parviennent pas à les (la raison la plus commune étant que les…
Les 9 lois de l'exploration de données: un guide de référence Mineur de données pionnières Thomas Khabaza développé ses «Neuf lois de Data Mining" pour guider les nouveaux explorateurs de données comme ils se mettent au travail. Ce guide de référence vous montre ce que chacune de ces lois signifie…