Bigtable / large magasin de fonctionnalités de bases de données NoSQL dans la colonne
Bigtables clones sont un type de base de données NoSQL qui a émergé à partir de papier Bigtable séminale de Google. Bigtables sont une manière hautement distribué pour gérer les données tabulaires. Ces tableaux de données ne sont pas liés les uns aux autres comme ils le seraient dans un système de gestion de base de données relationnelles classiques (SGBDR). Voici les caractéristiques les plus importantes de choix de bases de données populaires.
Feature Zone | Accumulo | Cassandra | HBase | Hypertable |
---|
Acide ou une base | ACIDE | BASE | BASE | ACIDE |
HA répliques | Oui, Sync | Oui, Async | Oui, Sync | TBD |
DR répliques | Comme HDFS | Oui, Asyn | Comme HDFS | TBD |
Les types de données | Pas de support de type de données. | Oui, le schéma doit être défini à l'avance. | Pas de support de type de données. | Pas de support de type de données. |
L'indexation des données | Aucune indexation secondaire. | Pas vrai secondaire N ° 148; fonctionnalité - onlyallows colonnes à être utilisée dans des requêtes - ne pas accélérer la récupération Updata. Prise en charge de filtres de Bloom. | Aucune indexation. Prise en charge de filtres de Bloom. | Index secondaire complet. |
Interrogation et de recherche | Utilise Map / Reduce pour accéder aux données. | CQL langue semblable à de requête SQL. | Utilise Map / Reduce pour accéder aux données. Peut être utilisé avec Hive queryengine. | Valeur correspondance exacte et la chaîne commence par queries.Column existe soutien à long terme de la requête. Pas de plage. |
Publicité | 2. Apache occasion au gouvernement pour les besoins Bigtable sécurisés. | Version commerciale de DataStax. | Apache 2. Disponible à partir d'un certain nombre de fournisseurs Hadoop. | GPL v3 autorisé. |
Autre | Rôle de contrôle d'accès basé sur les rôles (RBAC) et cellulaire (par valeur) levelsecurity utile pour les cas d'utilisation de gouvernement. Authentification personnalisée et l'autorisation plug-ins disponibles. Partialencryption au repos de données dans Accumulo 1.6. (Intermédiaire recoveryfiles pas chiffré.) | 0.5-1.0TB des données recommandé par nœud. SSD storagerecommended. 32 Go de RAM et 4/8 noyaux recommandé. Système AWS recommandée pour 1 To de données est 2.2xlarge (60 Go de RAM + SSDstorage), ou plus petit c3.2large pour 100 Go de données. Aide pour le cryptage des données au repos (mais pas de journaux de journal). | Considéré comme le plus lent, des bases de données NoSQL basés sur Hadoop. Endpoints fournir une fonctionnalité similaire à StoredProcedures. | Fonction d'allocation de mémoire Adaptive accorde automatiquement RAMusage pour les applications d'écriture-lecture-lourds et lourds. |
A propos Auteur
Bases de données NoSQL hybrides Compte tenu de la gamme de types de données gérés par des bases de données NoSQL, vous êtes pardonné si vous pensez que vous avez besoin de trois bases de données différentes pour gérer toutes vos données. Cependant, bien que chaque base…
Identité et gestion des accès (idam) dans nosql Autorisation d'un utilisateur pour l'accès à l'information ou de la fonctionnalité de base de données est une chose, mais avant que vous pouvez faire cela, vous devez être sûr que le système connaît que l'utilisateur est bien…
Magasins en mémoire clé-valeur dans les bases de données NoSQL Les entreprises doivent veiller à ce que leurs données est durable en le mettant sur le disque en toute sécurité. Toutefois, les bases de données en mémoire mises en œuvre avec NoSQL sont également utiles dans certains cas, tels que ce qui…
Bases de données de traitement massivement parallèle Pour permettre une meilleure compréhension des alternatives SQL-sur-Hadoop Hive, il pourrait être utile d'examiner une amorce sur le traitement massivement parallèle (MPP) des bases de données en premier.Apache Hive est posée sur le dessus du…
NoSQL pour les nuls Bigtables clones sont un type de base de données NoSQL qui a émergé à partir de papier Bigtable séminale de Google. Bigtables sont une manière hautement distribué pour gérer les données tabulaires. Ces tableaux de données ne sont pas liés…
NoSQL et moteurs de recherche Il peut sembler étrange de parler de moteurs de recherche et NoSQL ensemble, mais un grand nombre de moteurs de recherche d'aujourd'hui utiliser une architecture très similaire aux bases de données NoSQL. Leurs indices et le traitement des…
Magasins de données NoSQL contre hadoop Les magasins de données NoSQL initialement souscrit à la notion Just Say No to SQL (pour paraphraser à partir d'une campagne de publicité anti-drogue dans les années 1980), et ils étaient une réaction aux limites perçues de…
Termes et définitions NoSQL Obtenir votre tête autour de NoSQL peut être un peu difficile. Si vous avez étudié les bases de données à l'école, vous avez été endoctrinés de manière relationnelle de la pensée. Dire base de données la plupart des gens, et ils pensent…
Stocker les données de grandes avec HBase HBase est, une base de données qui utilise HDFS que son magasin de persistance pour les grands projets de données non relationnelles distribuée (de colonne). Elle est calquée sur Google BigTable et est capable d'accueillir de très grandes…
Stockage des données dans bigtables Un Bigtable a tableaux comme un SGBDR fait, mais contrairement à un SGBDR, un tables Bigtable sont généralement pas avoir des relations avec d'autres tables. Au lieu de cela, des données complexes est regroupé dans un seul tableau.Une table…
Stockage de données structurées et de traitement dans Hadoop Lorsque l'on considère les capacités de Hadoop pour travailler avec des données structurées (ou de travailler avec des données de tout type, d'ailleurs), rappelez-vous les caractéristiques de base de Hadoop: Hadoop est, d'abord et avant tout,…
L'écosystème Hadoop Apache Hadoop est plus que MapReduce et HDFS (Distributed File System Hadoop): Il est également une famille de projets connexes (un écosystème, vraiment) pour le calcul distribué et le traitement de données à grande échelle. La plupart (mais pas…
Les bases de données en colonnes dans un environnement grand de données Les bases de données en colonnes peuvent être très utiles dans votre grand projet de données. Bases de données relationnelles sont orientée rangée, que les données de chaque ligne d'une table sont stockées ensemble. Dans une forme de…
Bases de données non relationnelles dans un environnement grand de données Bases de données non relationnelles ne reposent pas sur la table / modèle clé endémique de SGBDR (systèmes de gestion de base de données relationnelle). En bref, les données de spécialité dans le grand monde de données exige de la…