Appareils d'entrepôt de données

Comme avec un jean à pattes d'éléphant, des bases de données assistées par matériel sont sur la piste du retour. Microsoft, Oracle et Netezza sont à la mode à des séminaires de base de données dans le monde entier. Du milieu à la fin des années 1980, les vendeurs Britton Lee et Teradata (qui a finalement fusionné) étaient à la mode.

Ils ont fourni des machines dédiées qui ont optimisé le traitement de base de données - les premières machines utilisés par les consommateurs de données lourdes, y compris un grand nombre de sociétés de consommation emballés marchandises.

L'objectif de ces boîtes a été de consacrer tous les aspects d'un ordinateur pour obtenir des données aux utilisateurs plus rapidement. Cette machine dédiée inclus une base de données des opérations, de la mémoire, CPU, et disque requête-centrée. Finalement, ces produits sortis de la mode, et les systèmes de gestion de base de données ont été migrés vers une architecture plus ouverte, exécutez-sur-toute-boîte.




Maintenant, ils sont de retour!

UN appliance d'entrepôt de données est un ensemble intégré de serveurs, stockage, système d'exploitation, SGBD, et des logiciels spécifiquement pré-installé et pré-optimisés pour l'entreposage de données. Appareils d'entrepôt de données fournissent des solutions pour le milieu à grand volume marché des entrepôts de données, offrant des performances à faible coût sur les volumes de données dans le téraoctet de gamme pétaoctet (ça fait beaucoup de données!).

La plupart des fournisseurs d'appareils d'entreposage de données utilisent le traitement massivement parallèle (MPP) les architectures de fournir les performances des requêtes de haut et plateforme évolutivité. Architectures MPP sont constitués de processeurs ou de serveurs indépendants exécutant en parallèle.

La plupart des architectures MPP mettre en œuvre une architecture sans partage, dans lequel chaque serveur est auto-suffisante et contrôle sa propre mémoire et le disque. Architectures shared nothing ont fait leurs preuves pour une grande évolutivité et peu de conflits.

La plupart des appareils d'entreposage de données distribuent des données sur les unités de stockage sur disque dédiés connectés à chaque serveur dans l'appareil. Cette distribution permet aux appareils de résoudre une requête relationnelle en scannant les données sur chaque serveur en parallèle. L'approche diviser pour régner offre un rendement élevé et varie linéairement lorsque vous ajoutez de nouveaux serveurs dans l'architecture.

Et, du point de vue des prix, la plupart des fournisseurs dans ce domaine tentent une stratégie de plug-and-play. Par exemple, Netezza vend habituellement un nouvel utilisateur leur produit comme plug-compatible avec Teradata pour moins que le coût d'entretien Teradata. Ce niveau de prix rend les produits très attractive, en leur donnant un taux d'adoption de plus en plus.


» » » » Appareils d'entrepôt de données