Horizontal par rapport à la gestion du stockage de données verticale

La plupart des gestionnaires de bases de données relationnelles ont été construits sur une gestionnaire de stockage horizontale, qui place toutes les données dans une base de données en ligne (ou enregistrement) quand une transaction se produit. Une table de base de données est représenté comme une chaîne de pages de base de données qui contiennent une ou plusieurs lignes de données.

Un gestionnaire de stockage horizontal fournit le traitement des transactions en ligne (OLTP) un soutien rapide parce que la plupart des transactions se produisent dans un format d'enregistrement - par exemple, l'insertion d'une entrée de grand livre général ou écrire un chèque. Toutefois, lorsqu'un utilisateur demande un dossier, la page de base de données qui contient les données est souvent déplacé dans la mémoire, ce qui pour les applications de business intelligence est très inefficace.

Plusieurs produits de base de spécialité ont émergé au fil des ans visant à aider et à optimiser des applications de requête-centrée, comme l'intelligence d'affaires. Ces produits vous permettent de développer plus facilement des entrepôts de données interactives. L'objectif de ces bases de données en colonne est d'augmenter la vitesse des requêtes de support de décision effectuées sur de grandes quantités de données.

Lorsque les administrateurs de base de données sont demandé si elles seraient jamais placer un index sur une colonne qui contient le code d'une personne de la zone, la moyenne pondérée du point d'un étudiant, ou le total des transactions d'un client, ils répondent avec un retentissant “ n ° 148!; Ils donnent généralement cette réponse catégorique pour des motifs fondés sur la technologie, tels que:

  • Nous indice basé uniquement sur les chemins classiques, bien connus (tels que le nom) en raison de la surcharge des indices.

  • La cardinal, ou l'apparition de données unique, obligerait la base de données pour effectuer une analyse de table de toute façon.




Pourtant, quand vous demandez aux utilisateurs les informations dont ils ont besoin pour remplir leurs responsabilités professionnelles, ils répondent avec ces types de besoins:

  • Voir le nombre de personnes par code de zone sur mon territoire afin que je puisse gérer plus efficacement mes promotions.

  • Identifier les étudiants les mieux classés dans la classe de finissants donc je peux arranger les interviews appropriées.

  • Comprendre que les clients font des affaires avec ma compagnie et dépenser entre 100 000 $ et 500 000 $ par année.

Chacun de ces trois exigences caractérise une demande d'utilisateur différent, mais ils remplissent tous des fonctions similaires: Ils sont axés sur le soutien des requêtes de décision. Un besoin d'accéder aux données entraîne des exigences d'information de l'utilisateur, mais les modèles d'accès des utilisateurs ne sont pas compatibles avec la plupart des stratégies d'indexation SGBDR. En bref, la technologie de SGBDR est dans la manière de la réussite des applications.

Une table de base de données est représenté comme une chaîne de pages de base de données qui contiennent une ou plusieurs rangées de données, comme représenté sur cette figure. Un gestionnaire de stockage horizontal fournit le traitement des transactions en ligne (OLTP) un soutien rapide parce que la plupart des transactions se produisent dans un format d'enregistrement.

image0.jpg

Ces bases de données relationnelles aider l'activité des requêtes en utilisant des index. Les index sont construits au-dessus des rangées pour simplifier et accélérer la récupération de données sur des chemins communs, comme le montre la figure.

Des solutions d'entreposage de données, telles que la Business Intelligence, de ne pas utiliser beaucoup de ces techniques d'indexation parce qu'ils ont été conçus pour aider les applications OLTP dans le besoin fréquent de trouver et de mettre à jour des lignes individuelles dans les tables de base de données.

Pour appuyer correctement les requêtes typiques d'utilisateurs trouvés en intelligence d'affaires, d'autres techniques de stockage et d'indexation sont nécessaires. Fournisseurs tels que Sybase et Vertica ont construit les gestionnaires de stockage verticales. Au lieu de stocker les données par ligne, ces produits stockent les données en colonnes - d'où le nom gestionnaire de stockage vertical ou le stockage de colonne par colonne.

Cette méthode de stockage résout efficacement le problème des requêtes des utilisateurs contre les grands ensembles de données parce qu'un utilisateur cherche souvent à seulement quelques colonnes, par rapport au grand nombre de colonnes gérées dans une rangée par un gestionnaire de stockage horizontal. Avec les données stockées en une série de changements de page, chaque page comportant les données de colonne, le temps de traitement de requête est réduite d'un facteur de 500 ou plus à 1.

En outre, ces produits supportent d'autres optimisations qui aident à la vitesse de traitement des requêtes, y compris la compression de données, les opérations de requêtes parallèles, et de multiples techniques d'indexation par colonne. Le défi de la mise en œuvre de ces technologies implique la normalisation. Par conséquent, de nombreux services de gestion de données refusent de mettre en œuvre ces technologies parce que ces technologies requièrent travail de soutien supplémentaire.


» » » » Horizontal par rapport à la gestion du stockage de données verticale