Les données en colonnes dans nosql

Magasins de colonne dans NoSQL sont similaires à la première comparution au SGBD relationnelles traditionnelles. Les concepts de lignes et de colonnes sont toujours là. Vous définissez également les familles des colonnes avant le chargement des données dans la base de données, ce qui signifie que la structure de données doit être connu à l'avance.

Cependant, les magasins de colonne organiser les données différemment de bases de données relationnelles font. Au lieu de stocker les données dans une rangée pour un accès rapide, les données sont organisées pour les opérations de colonnes rapides. Cette colonne # 8208 vue centrée rend colonne magasins idéal pour courir les fonctions d'agrégation ou pour rechercher des enregistrements répondant à plusieurs colonnes.

Les fonctions d'agrégation sont des combinaisons de données ou des fonctions d'analyse. Ils peuvent être aussi simple que de compter le nombre de résultats, en les additionnant, ou calculer leur moyenne arithmétique. Ils pourraient être plus complexe, même si - par exemple, de retourner une valeur complexe décrivant une gamme globale de temps.

Magasins de colonne sont aussi parfois appelées grandes tables ou Big clones de table, reflétant leur ancêtre commun, Bigtable de Google.




Peut-être la principale différence entre les magasins de colonne et un SGBDR traditionnelle est que, dans un magasin de colonne, chaque enregistrement (pensez rangée dans un SGBDR) ne nécessite pas une seule valeur par colonne. Au lieu de cela, il est possible de modéliser les familles de colonne. Un enregistrement unique peut être constitué d'un champ d'ID, une famille de colonne pour “ la clientèle ” informations, et une autre famille de colonne pour “ afin article ” information.

Chacune de ces familles de colonne est constitué de plusieurs champs. Une de ces familles de colonne peut avoir de multiples “ rangées ” dans son droit. Afin d'informations de l'article, par exemple, comporte plusieurs lignes - une pour chaque ligne d'article. Ces lignes contiennent des données telles que l'article ID, la quantité et le prix unitaire.

Un avantage clé d'un magasin de colonne sur un SGBDR est que les magasins de colonne ne nécessitent pas de champs d'être toujours présente et ne nécessitent pas une valeur nulle rembourrage vierge comme un SGBDR fait. Cette fonctionnalité empêche le problème de la rareté des données, la préservation de l'espace disque. Un exemple d'un ensemble de données variables et clairsemée est montré ici.

image0.jpg

Le grand chose sur les magasins de colonne est que vous pouvez récupérer toutes les informations relatives à l'aide d'un seul ID d'enregistrement, plutôt que d'utiliser le complexe Structured Query Language (SQL) joindre comme dans un SGBDR. Cela ne nécessite un peu d'avance la modélisation et l'analyse des données, cependant.

Dans l'exemple illustré, vous pouvez récupérer toutes les informations de commande en sélectionnant une seule rangée de magasins de la colonne, ce qui signifie que le développeur n'a pas besoin d'être conscient de la complexe exact rejoindre la syntaxe d'une requête dans un magasin de la colonne, à la différence qu'ils doivent être utilisant SQL jointures complexes dans un SGBDR.

Donc, pour les structures de données relationnelles complexes et variables, un magasin de colonne peut être plus efficace dans le stockage et moins d'erreurs dans le développement que ses ancêtres de SGBDR.

On notera que, dans le article Famille de colonne, l'identifiant de chaque élément est représenté à l'intérieur de la clé, et la valeur est la quantité commandée. Cette configuration permet un accès rapide pour toutes les commandes contenant ces éléments ID.

Si vous connaissez les champs de données impliqués avant et besoin de récupérer rapidement les données liées ensemble comme un seul enregistrement, puis envisager un magasin de colonne.


» » » » Les données en colonnes dans nosql