Services de middleware: sélection de données et extractions

Le but principal de la sélection de données et un service de -extraction est de sélectionner à partir de (retrouver dans) une source de données les données que vous souhaitez déplacer dans l'entrepôt de données, puis extrait (retirer) que les données sous une forme qui peut être préparé pour les services d'assurance de la qualité.

Vous pouvez utiliser l'un des deux types de sélection et d'extraction services pour votre environnement d'entreposage de données différentes:

  • Get 'em all et trier' em out plus tard: Trouver et extraire tous les éléments de données à une source que vous voulez charger dans votre entrepôt de données, indépendamment de savoir si un élément spécifique a été extrait auparavant.




  • Orientée vers le changement: Trouver et extraire uniquement les éléments de données qui ont été récemment ajoutés soit à la source de données ou mises à jour depuis la dernière extraction.

Le premier type de service exige moins une logique complexe pour effectuer l'extraction. Mais vous avez à traiter avec des volumes plus importants (parfois, beaucoup plus grands volumes de données) que le second type, le service axé sur le changement.

La méthode de sélection et d'extraction orientée vers le changement est assez simple lorsque votre source est une base de données relationnelle qui a un timbre de fois que vous pouvez utiliser pour détecter le moment où une ligne de données a été ajouté ou mis à jour.

Vous pouvez comparer une ligne de données contre la date et l'heure du dernier processus d'extraction afin de déterminer si les données doivent être sélectionné et extrait. Mais quand les données sont stockées dans un fichier qui ne dispose pas d'un marqueur temporel (un fichier VSAM, par exemple), ce processus peut être beaucoup plus difficile.

Vous pourriez aussi faire face à un défi lorsque les données source a été supprimé à partir d'un fichier ou une base de données. Si les règles d'affaires pour votre entreposage de données environnement appel à la suppression des données correspondantes de l'entrepôt, vous devez disposer d'un moyen de détecter les suppressions qui ont été faites depuis le dernier processus d'extraction pour assurer que les suppressions appropriées soient faites dans votre entrepôt.

Le résultat de la sélection et de l'extraction est, ainsi, un extrait des données qui est prêt à subir un traitement supplémentaire: vérifier la qualité des données.


» » » » Services de middleware: sélection de données et extractions