La modernisation de l'entrepôt de données avec Hadoop

Les entrepôts de données sont maintenant en situation de stress, en essayant de faire face à une demande accrue de leurs ressources limitées. Hadoop peut apporter un soulagement significatif dans cette situation d'entrepôt de données.

L'augmentation rapide de la quantité de données générées dans le monde a également des entrepôts de données concernées parce que les volumes de données qu'ils gèrent sont en augmentation - en partie parce que plus structuré données, le type de données qui est fortement typé et fendu en lignes et colonnes - est générée, mais aussi parce que vous avez souvent à faire face aux exigences réglementaires visant à maintenir queryable accès aux données historiques.

En outre, la puissance de traitement dans les entrepôts de données est souvent utilisé pour effectuer des transformations de données relationnelles comme il soit entre l'entrepôt lui-même ou est chargé dans un données enfant mart (un sous-ensemble séparé de l'entrepôt de données) pour une application d'analyse spécifique.

En outre, la nécessité est en augmentation pour les analystes d'émettre de nouvelles requêtes sur les données structurées stockées dans les entrepôts, et ces requêtes ad hoc peut souvent utiliser les ressources de traitement significatif de données. Parfois, un rapport d'une heure peut suffire, et parfois une analyse exploratoire est nécessaire de trouver des questions qui ne sont pas encore été posées que peut donner une valeur commerciale significative.




La ligne de fond est que les entrepôts de données sont souvent utilisés à des fins au-delà de leur design original.

La figure montre, utilisant une architecture de haut niveau, comment Hadoop peut vivre à côté des entrepôts de données et de réaliser certains des objectifs qu'ils ne sont pas conçus pour.

image0.jpg

Hadoop est un entrepôt helper, pas un remplacement de l'entrepôt. Hadoop peut moderniser un écosystème d'entreposage de données dans quatre façons-là, ils sont en résumé:

  • Fournir une zone d'atterrissage pour toutes les données.

  • Persister les données pour fournir une archive interrogeable des données froides.

  • À grande échelle le traitement par lots des efficacités de levier Hadoop pour prétraiter et transformer des données de l'entrepôt.

  • Activer un environnement propice à la découverte de données ad hoc.


» » » » La modernisation de l'entrepôt de données avec Hadoop