Magasins de données NoSQL contre hadoop

Les magasins de données NoSQL initialement souscrit à la notion “ Just Say No to SQL ” (pour paraphraser à partir d'une campagne de publicité anti-drogue dans les années 1980), et ils étaient une réaction aux limites perçues de bases de données relationnelles (SQL) sur la base. Il a pas que ces gens détestait SQL, mais ils étaient fatigués de forcer des chevilles carrées dans des trous ronds en résolvant les problèmes que bases de données relationnelles ne sont pas conçus pour.

Une base de données relationnelle est un outil puissant, mais pour certaines sortes de données (comme les paires clé-valeur, ou graphiques) et certains modèles d'utilisation (comme extrêmement grand stockage de l'échelle) une base de données relationnelle est tout simplement pas pratique. Et quand il vient au stockage à haut volume, base de données relationnelle peut être coûteux, tant en termes de coûts de licence de base de données et les coûts de matériel. (Bases de données relationnelles sont conçus pour fonctionner avec le matériel de classe entreprise.)

Donc, avec le mouvement NoSQL, les programmeurs créatifs développé des dizaines de solutions pour différents types de stockage et de traitement de données des problèmes épineux. Ces bases de données NoSQL fournissent généralement une extensibilité massive par voie de regroupement, et sont souvent conçus pour permettre un débit élevé et une faible latence.

Le nom NoSQL est quelque peu trompeur parce que beaucoup de bases de données qui correspondent à la catégorie faire avoir le soutien de SQL (plutôt que “ NoSQL ” soutien). Pensez à son nom à la place que “ Not Only SQL ”.

Les offrandes NoSQL disponibles aujourd'hui peuvent être décomposés en quatre catégories distinctes, en fonction de leur conception et le but:

Clé-valeur magasins: Cette offre fournit un moyen de stocker tout type de données sans avoir à utiliser un schéma. Ceci est en contraste aux bases de données relationnelles, où vous avez besoin pour définir le schéma (la structure de table) avant que des données est inséré. Depuis magasins clé-valeur ne nécessitent pas un schéma, vous avez une grande flexibilité pour stocker des données dans de nombreux formats.
Dans un magasin clé-valeur, une rangée consiste simplement d'une clé (un identifiant) et une valeur, qui peut être quelque chose d'une valeur entière à une grande chaîne de données binaires. De nombreuses implémentations de magasins clé-valeur sont basées sur le papier Dynamo d'Amazon.
Les magasins de la famille de la colonne: Ici vous avez des bases de données dans lequel les colonnes sont regroupées en familles de colonnes et stockés ensemble sur disque.
Strictement parlant, beaucoup de ces bases de données ne sont pas axées sur la colonne, car ils sont basés sur le papier BigTable de Google, qui stocke les données comme une carte multidimensionnelle triés.
Magasins de documents: Cette offre repose sur des collections de documents de même codés et formatés pour améliorer l'efficacité. Magasins de documents permettent documents individuels dans une collection d'inclure seulement un sous-ensemble de champs, de sorte que les données qui est nécessaire est stocké. Pour les ensembles de données éparses, où de nombreux champs ne sont pas souvent peuplées, ce qui peut se traduire par d'importantes économies d'espace.
En revanche, les colonnes vides dans les tables de base de données relationnelles ne prennent de la place. Magasins de document permet également la flexibilité de schéma, parce que seuls les champs qui sont nécessaires sont stockés, et de nouveaux champs peuvent être ajoutés. Là encore, contrairement aux bases de données relationnelles, les structures de table sont définis à l'avance avant que les données sont stockées, et en changeant les colonnes est une tâche fastidieuse que les impacts de l'ensemble du jeu de données.
Bases de données graphe: Ici vous avez des bases de données qui stockent structures de graphes - qui montrent des représentations des collections d'entités (sommets ou noeuds) et leurs relations (bords) avec l'autre. Ces structures permettent bases de données de graphes d'être extrêmement bien adapté pour stocker des structures complexes, comme les relations de liaison entre toutes les pages Web connus. (Par exemple, les pages Web individuelles sont des nœuds, et les bords qui les relient sont des liens d'une page à l'autre.)
Google, bien sûr, est partout dans la technologie graphique, et a inventé un moteur de traitement graphique appelé Prégel pour alimenter son algorithme de PageRank. (Et oui, il ya un livre blanc sur Prégel.) Dans la communauté Hadoop, il ya un projet Apache appelé Giraph (basé sur le papier Prégel), qui est un moteur de traitement graphique conçu pour traiter des graphiques stockés dans HDFS.

Les options de stockage et de traitement des données disponibles dans Hadoop sont dans de nombreux cas implémentations des catégories NoSQL énumérés ici. Cela vous aidera à mieux évaluer les solutions qui sont disponibles pour vous et voyez comment Hadoop peut compléter les entrepôts de données traditionnels.

A propos Auteur

Les caractéristiques communes de nosql

Livres et blogs NoSQL offrent des opinions différentes sur ce qu'est une base de données NoSQL est. Quatre caractéristiques fondamentales de NoSQL, indiqués dans la liste suivante, demander au plupart des bases NoSQL. La liste compare NoSQL au…

Bases de données de documents et nosql

Bases de données de documents sont parfois appelés des bases de données agrégées, car ils ont tendance à tenir des documents qui combinent l'information dans une seule unité logique - une agrégat. Vous pourriez avoir un document qui comprend…

Traitement de Graph dans Hadoop

L'une des technologies les plus excitantes émergents NoSQL implique le stockage et le traitement des données graphiques. Vous pourriez penser que cette déclaration est de vieilles nouvelles parce que les scientifiques informatiques ont mis au…

Bases de données NoSQL hybrides

Compte tenu de la gamme de types de données gérés par des bases de données NoSQL, vous êtes pardonné si vous pensez que vous avez besoin de trois bases de données différentes pour gérer toutes vos données. Cependant, bien que chaque base…

Magasins en mémoire clé-valeur dans les bases de données NoSQL

Les entreprises doivent veiller à ce que leurs données est durable en le mettant sur le disque en toute sécurité. Toutefois, les bases de données en mémoire mises en œuvre avec NoSQL sont également utiles dans certains cas, tels que ce qui…

Magasins clé-valeur dans nosql

# 8208-valeur magasins clés NoSQL ont un dossier avec un champ d'ID - la clé dans les principaux # 8208-valeur magasins - et un ensemble de données. Ces données peuvent être l'un des suivants:Un morceau de données arbitraire qui les…

Gestion des différents types de données avec nosql

Bases de données NoSQL ne sont pas limités à une rangées # 8208 et # 8208-colonnes approche. Ils sont conçus pour traiter une grande variété de données, y compris les données dont la structure change au fil du temps et dont les relations ne…

NoSQL et moteurs de recherche

Il peut sembler étrange de parler de moteurs de recherche et NoSQL ensemble, mais un grand nombre de moteurs de recherche d'aujourd'hui utiliser une architecture très similaire aux bases de données NoSQL. Leurs indices et le traitement des…

Termes et définitions NoSQL

Obtenir votre tête autour de NoSQL peut être un peu difficile. Si vous avez étudié les bases de données à l'école, vous avez été endoctrinés de manière relationnelle de la pensée. Dire base de données la plupart des gens, et ils pensent…

Réduire le temps de valeur dans nosql

Temps de valeur est la quantité de temps nécessaire de démarrer un projet informatique pour être en mesure de réaliser des bénéfices commerciaux. Cela peut être des avantages tangibles dans la réduction des coûts ou de la capacité à…

Les bases de données en colonnes dans un environnement grand de données

Les bases de données en colonnes peuvent être très utiles dans votre grand projet de données. Bases de données relationnelles sont orientée rangée, que les données de chaque ligne d'une table sont stockées ensemble. Dans une forme de…

Bases de données multidimensionnelles

Cela ne veut pas la première fois dans l'histoire récente de nouveaux types de produits de base de données ont émergé et de surmonter les inefficiences du SGBDR. Retour dans les années 1980, une classe d'applications a été identifié dans…

Bases de données non relationnelles dans un environnement grand de données

Bases de données non relationnelles ne reposent pas sur la table / modèle clé endémique de SGBDR (systèmes de gestion de base de données relationnelle). En bref, les données de spécialité dans le grand monde de données exige de la…

La structure de base de données et mysql

MySQL est un système de gestion de bases de données relationnelles (SGBDR). Votre serveur MySQL peut gérer plusieurs bases de données en même temps. En fait, beaucoup de gens pourraient avoir différentes bases de données gérées par un seul…

godiches.com » Ordinateurs et logiciels » Big Data » Gestion des données » Magasins de données NoSQL contre hadoop