Middleware pour l'entreposage de données

Middleware est un logiciel d'ordinateur qui se connecte les composants logiciels. Dans un environnement d'entreposage de données, les services de middleware sont l'ensemble des programmes et des routines qui font ce qui suit:

  • Extraire des données de la source (ou les sources).

  • Assurez-vous que les données correctes'S.

  • Déplacer les données autour de l'environnement de plateforme en plateforme, si nécessaire.

  • Gérer toutes les transformations de données nécessaires.

  • Charger les données dans la base de données de l'entrepôt de données (ou bases de données).

Dans un sens plus formel, les éléments de la liste précédente sont traitées par ces services de middleware:




  • La sélection des données et de l'extraction

  • L'assurance de la qualité des données, partie I (au niveau de la composante)

  • Mouvement de données, partie I (également au niveau de la composante)

  • La cartographie des données et de la transformation

  • L'assurance de la qualité des données, la partie II (après transformation a eu lieu)

  • Mouvement de données, partie II (dans l'environnement de la plate-forme de l'entrepôt de données)

  • Le chargement de données (dans l'entrepôt de données)

Cette figure illustre comment ces services middleware coulent ensemble dans un environnement d'entreposage de données de taille moyenne.

image0.jpg

Mais votre environnement d'entreposage de données pourrait différer de celui représenté sur cette figure, notamment dans le domaine des services de données mouvement. Un service de données mouvement est nécessaire chaque fois que les limites du système de croisements de données. Votre image conceptuelle diffère, selon les détails de votre environnement particulier de bout-en-bout.

Vous absolument besoin pour planifier, concevoir, et de penser autrement à propos de entrepôt de données middleware en termes de services individuels dans la liste précédente, plutôt que dans des termes génériques, tels que “ des outils d'extraction ”. De nombreux fournisseurs différents offrent certains, plusieurs ou tous ces services dans le cadre d'un seul produit ou une gamme de produits.

Mais un outil qui a des services de cartographie et de transformation forts, par exemple, pourrait être faible dans les services de chargement de données, ou un outil qui fournit un riche ensemble de services d'extraction pourrait être moins efficace dans l'espace de la cartographie et de la transformation, en plus de la qualité des données assurance.

Avant de sélectionner un outil pour votre projet d'entreposage de données (si tel est le chemin que vous empruntez, plutôt que de codage personnalisé), assurez-vous que vous avez une bonne idée sur les défis particuliers dans votre environnement. Si vous avez des besoins relativement simples d'extraction de données, par exemple, mais difficiles problèmes de qualité des données, concentrer sur la recherche du meilleur outil d'assurance qualité disponible, même si elle a assez moyen capacités d'extraction.

(Ce conseil est valable même si l'outil n'a pas de capacités d'extraction, dans ce cas, vous avez de le combiner avec un autre outil.)


» » » » Middleware pour l'entreposage de données