Des services d'intégration de l'information de l'entreprise

Vers 1995, les fournisseurs ont commencé à positionner leur logiciel comme outils d'entreposage de données virtuelles. La prémisse fondamentale était que, parfois, il n'a tout simplement pas de sens pour copier et manipuler un tas de données, au cas où quelqu'un a besoin. Pourquoi ne pas accéder aux données directement à partir de la source sur une base ponctuelle?

Hélas, l'accès aux données sur un réseau à la source a révélé être le moins difficile des problèmes en essayant de fournir une sorte de place dans les entrepôts de données. Les mêmes défis à relever dans un environnement d'entreposage de données (telles que les relations avec la qualité des données, de décider quels types de transformations doivent se produire, et en choisissant comment gérer ces transformations lorsque différentes sources sont incompatibles) sont toujours présents.

Juste parce que vous pouvez obtenir des données à la source (dans presque toute structure de base de données ou fichier) ne signifie pas que les données fournit l'intelligence d'affaires nécessaire quand il est dans vos mains.

Pour résoudre ces problèmes de qualité de données, de nombreux architectes de données ont commencé à exécuter la construction de data mart bottom-up pour développer un entrepôt de données à base de composants. Plutôt que d'avoir une seule base de données dans laquelle vous nourrissez toutes les données (création de votre entrepôt de données), une série de composants de chaque gère un ensemble particulier de fonctions (telles que répondre à des questions commerciales spécifiques) ou certains sujets. Ensemble, ces dépôts de données (ou composants) comprennent un environnement d'entreposage de données.

Cette architecture de données d'accès dynamique à base de composants est à la base virtuelle entreposage de données et, plus précisément, ce qui Enterprise Information Integration (IIE) serveurs offrent sur le marché.




Cette figure montre un environnement dans lequel les composants individuels sont créés dans l'environnement de l'entrepôt de données d'une manière ascendante. Au lieu de combiner les composants dans une grande base de données (et copier toutes les données à nouveau), EII crée un environnement d'entreposage de données dans laquelle les utilisateurs peuvent accéder au contenu de chaque composante d'un outil de business intelligence comme ils ont tous été stockés ensemble, même si elles ne sont pas .

image0.jpg

Pensez à la façon dont vous utilisez un navigateur Web sur votre bureau. Soit vous cliquez sur un lien ou tapez une URL spécifique, et de l'environnement, travaillant dans les coulisses, vous emmène à la bonne place pour le contenu que vous avez demandé. Maintenant, imaginez l'Internet en cours d'exécution beaucoup plus rapide.

Quand vous allez à différents sites, vous n'êtes pas accès à des annonces pour la dernière quatre roues motrices vous avez été convoité, les résultats sportifs, bandes dessinées Dilbert, ou tout autre chose que vous faites sur Internet. Vous ramener des morceaux de données qui sont ensuite combinées et renvoyées dans votre navigateur. Voilà l'entreposage de données virtuel - il est juste comme l'Internet!

Il est pas une bonne idée de construire un environnement virtuel d'entreposage de données pour accéder aux données de source directement, dans son format natif. Votre défi est de ne pas trouver comment joindre les bases de données multi-plateformes (combinant des données IMS avec des données DB2, par exemple) et la manipulation de ces types de transformation au niveau du système, il est veiller à ce que la qualité des données est élevée, et ne nécessite pas à l'utilisateur de nettoyer manuellement les données.

Chaque demande doit donc être activé et entrepôt contient un éditeur de données qui est responsable de tous les services de middleware (telles que l'extraction et l'assurance de la qualité), comme spécifié dans les règles de gestion de l'environnement.

L'éditeur de données pourrait éventuellement fonctionner presque en mode temps réel, comme il faudrait le faire dans un magasin de données opérationnelles, ou il pourrait fonctionner dans un mode périodique (orienté lots) si des mises à jour instantanées ne sont pas tenus. Dans cette situation, l'éditeur de données est un produit mini-middleware embarqués dans l'application (ou un service accessible par l'application).

Quand vous pensez de l'entreposage de données virtuel, remplacez la question “? Puis-je obtenir les données ” avec la question “? Puis-je obtenir des données utilisables ” L'éditeur de données joue un rôle important, et ne doit pas être négligée.

Vous pouvez aussi ne pas l'architecture de données de négligence. Juste parce que vous le développement de composants de manière bottom-up et ils sont en cours d'accès en place, plutôt que d'être copié dans une plus grande base de données de l'entrepôt de données, ne signifie pas que vous pouvez négliger cette fonction.

Dire que ID magasins à un composant de la clientèle que des numéros à cinq chiffres après la transformation se produit et ne contient que les clients ayant effectué des achats au cours des six derniers mois. Et un autre composant, qui contient tous les clients qui ont déjà acheté des produits de votre entreprise, utilise sept caractères alphanumériques identifiants. Dans cette situation, vous pourriez avoir le même type de problèmes de décalage de données que vous feriez si vous étiez accéder à des données directement à partir des sources.

Bien que l'IIE permet des différences entre le contenu de composants, vous devez comprendre et gérer les différences de sorte que vous ne gênent pas la mission de business intelligence.


» » » » Des services d'intégration de l'information de l'entreprise