La phase 1 du modèle de processus croquants dm: la compréhension de l'entreprise

La Cross-Industry Standard Process for Data Mining

Sommaire

(CRISP-DM) Est le cadre de processus dominant pour l'extraction de données. Dans la première phase d'un projet d'exploration de données, avant de vous approcher des données ou des outils, vous définissez ce que vous êtes à accomplir et de définir les raisons de vouloir atteindre cet objectif.

La phase de compréhension de l'entreprise comprend quatre tâches (activités principales, dont chacun peut impliquer plusieurs parties plus petites).

Tâche: Déterminer vos objectifs d'affaires

La première chose que vous devez faire dans tout projet est de trouver exactement ce que vous essayez d'accomplir! Cela est moins évident qu'il n'y paraît. Beaucoup de mineurs de données ont investi beaucoup de temps sur l'analyse de données, seulement pour trouver que leur gestion était pas particulièrement intéressé à la question qu'ils enquêtaient. Vous devez commencer par une compréhension claire de

  • Un problème que votre direction souhaite aborder les

  • Les objectifs de l'entreprise

  • Contraintes (limitations sur ce que vous pouvez faire, les types de solutions qui peuvent être utilisées, lorsque le travail doit être terminé, et ainsi de suite)

  • Incidence (comment le problème et les solutions possibles cadrent avec l'entreprise)

Livrables pour cette tâche comprennent trois éléments (généralement de brefs rapports axés sur les principaux points seulement):




  • Contexte: Expliquer la situation de l'entreprise qui pilote le projet. Cet article, comme beaucoup qui suivent, ne représente que quelques paragraphes.

  • Objectifs de l'entreprise: Définir ce que votre organisation a l'intention d'accomplir avec le projet. Cela est généralement un objectif plus large que vous, en tant que mineur de données, pouvez accomplir indépendamment. Par exemple, l'objectif de l'entreprise pourrait être d'augmenter les ventes d'un campagne publicitaire de vacances de 10 pour cent sur un an.

  • Critères de réussite de l'entreprise: Définir comment les résultats seront mesurés. Essayez d'obtenir les critères de succès quantitatifs clairement définis. Si vous devez utiliser des critères subjectifs (indice: des termes comme mieux comprendre ou obtenir une poignée sur impliquerait des critères subjectifs), au moins obtenir un accord sur exactement qui va juger si oui ou non ces critères ont été remplies.

Tâche: Évaluer votre situation

Ceci est où vous obtenez plus en détail sur les questions liées à vos objectifs d'affaires. Maintenant, vous allez aller plus loin dans des faits, la construction d'une explication beaucoup plus charnu des questions évoquées dans la tâche des objectifs d'affaires.

Livrables pour cette tâche comprennent cinq rapports en profondeur:

  • Inventaire des ressources: Une liste de toutes les ressources disponibles pour le projet. Ceux-ci peuvent inclure les personnes (mineurs non seulement des données, mais aussi ceux ayant une connaissance approfondie du problème de l'entreprise, les gestionnaires de données, support technique, et autres), les données, le matériel et le logiciel.

  • Exigences, les hypothèses et les contraintes: Les exigences seront inclure un calendrier pour l'achèvement, les obligations juridiques et de sécurité, et les exigences pour le travail fini acceptable. Ceci est le point de vérifier que vous aurez accès à des données appropriées!

  • Risques et incertitudes: Identifier les causes qui pourraient retarder l'achèvement du projet, et de préparer un plan d'urgence pour chacun d'eux. Par exemple, si une panne d'Internet dans votre bureau pourrait poser un problème, peut-être votre urgence pourrait être de travailler à un autre poste jusqu'à la panne est terminée.

  • Terminologie: Créer une liste de conditions commerciales et les conditions d'exploration de données qui sont pertinentes pour votre projet et de les écrire dans un glossaire avec des définitions (et peut-être des exemples), de sorte que toutes les personnes impliquées dans le projet peut avoir une compréhension commune de ces termes.

  • Coûts et avantages: Préparer une analyse coûts-avantages pour le projet. Essayez d'indiquer tous les coûts et avantages en dollar (euro, livre sterling, yen, etc.) termes. Si les bénéfices ne dépassent pas de façon significative les coûts, arrêter et reconsidérer cette analyse et votre projet.

Les décideurs se sentent souvent ressources attribuant plus confortables à des projets qui réduisent les coûts que ceux qui visent à augmenter les recettes, il faut donc toujours chercher des économies potentielles et les possibilités d'épargne de l'État en premier dans votre rapport coûts et des avantages.

Tâche: Définition de vos objectifs d'exploration de données

Atteindre l'objectif de l'entreprise nécessite souvent l'action de beaucoup de gens, et pas seulement le mineur de données. Alors maintenant, vous devez définir votre petite partie dans le tableau d'ensemble. Si l'objectif de l'entreprise est de réduire l'attrition de la clientèle, par exemple, vos objectifs d'exploration de données pourraient être d'identifier les taux d'attrition pour plusieurs segments de clientèle, et de développer des modèles pour prédire quels clients sont les plus à risque.

Livrables pour cette tâche comprennent deux rapports:

  • Objectifs d'exploration de données: Définir les livrables d'exploration de données, tels que des modèles, des rapports, des présentations et des ensembles de données traitées.

  • Data-mining critères de réussite: Définir les critères techniques d'exploration de données nécessaires pour soutenir les critères de réussite de l'entreprise. Essayez de les définir en termes quantitatifs (tels que la précision du modèle prédictif ou l'amélioration par rapport à une méthode existante). Si les critères doivent être qualitative, d'identifier la personne qui fait l'évaluation.

Tâche: Produire votre plan de projet

Maintenant, vous spécifiez chaque étape que vous, le mineur de données, l'intention de prendre jusqu'à ce que le projet est terminé et les résultats sont présentés et examinés.

Livrables pour cette tâche comprennent deux rapports:

  • Plan de projet: Décrivez votre plan étape par étape l'action pour le projet. Développez le contour avec un calendrier pour l'achèvement de chaque étape, les ressources requises, les intrants (tels que les données ou une rencontre avec un expert en la matière), et extrants (tels que les données nettoyées, un modèle ou un rapport) pour chaque étape, et dépendances (mesures qui ne peuvent pas commencer tant que cette étape est terminée). Déclarent explicitement que certaines étapes doivent être répétées (par exemple, la modélisation et l'évaluation font généralement appel à plusieurs répétitions de va-et-vient).

  • L'évaluation initiale des outils et techniques: Identifier les capacités requises pour répondre à vos objectifs d'exploration de données et d'évaluer les outils et les ressources que vous avez. Si quelque chose est manquant, vous devez répondre à cette préoccupation très tôt dans le processus.


» » » » La phase 1 du modèle de processus croquants dm: la compréhension de l'entreprise