Services de Middleware: la cartographie des données et de la transformation

Cette figure montre un environnement dans lequel les données sont extraites de trois sources de données différentes pour inclusion dans un entrepôt de données, et chacune des trois sources est sur une plateforme différente. À un certain moment dans le processus de middleware, ces extraits QA'd doivent être réunis pour un processus de cartographie et de transformation combiné.

image0.jpg

Le service de cartographie et de transformation gère les problèmes d'entreposage de données classiques. Supposons que une source de données stocke les clients à l'aide d'un client ID cinq de caractères, et une autre source utilise un identificateur de client numérique à six chiffres.

Pour permettre des comparaisons et d'autres traitements de l'entrepôt de données, vous avez besoin d'une méthode commune de l'identification du client: Un des systèmes d'identification doivent être convertis à l'autre, ou peut-être un troisième système d'identification, neutre, en fonction des caractéristiques de l'environnement.




En plus de traiter les incompatibilités inter-système, transformations supplémentaires peuvent comprendre

  • Résumé des données: Un résumé peut être effectuée plus tôt dans le processus, avant que le mouvement inter-systèmes, en fonction des particularités de votre environnement spécifique d'entreposage de données.

  • Inclusion sélective des données: Vous pourriez inclure les enregistrements d'une seule source de données, par exemple, si vous obtenez un dossier comparable d'un autre extrait. Vous ne savez pas, jusqu'à ce que vous converger toutes les contributions de la source de données, comment les règles d'inclusion sélectifs sont appliqués.

  • La convergence des données: Certains éléments provenant d'une source de données sont combinées avec des éléments d'une autre source pour créer un enregistrement unifié pour chaque client, produit, contrat, ou quel que soit le type de données que vous avez affaire.

Le point principal à retenir sur le service de cartographie et de transformation est que vous devriez avoir, à sa conclusion, un ensemble unifié de données qui est prêt à charger dans l'entrepôt de données - dès que vous avez terminé quelques pas de plus.

Dans les environnements d'entreposage de données complexes, vous pourriez envisager de multiples processus de transformation. Comme le montre cette figure, par exemple, des extraits de données convergent à plusieurs niveaux de la transformation avant de se déplacer plus loin sur le pipeline de middleware, vous permettant d'appliquer plus de puissance pour le processus de transformation en utilisant de multiples serveurs au début de l'écoulement.

image1.jpg

» » » » Services de Middleware: la cartographie des données et de la transformation