NoSQL pour les nuls

Bigtables clones sont un type de base de données NoSQL qui a émergé à partir de papier Bigtable séminale de Google. Bigtables sont une manière hautement distribué pour gérer les données tabulaires. Ces tableaux de données ne sont pas liés les uns aux autres comme ils le seraient dans un système de gestion de base de données relationnelles classiques (SGBDR). Voici les caractéristiques les plus importantes de choix de bases de données populaires.

Sommaire

Feature ZoneAccumuloCassandraHBaseHypertable
Acide ou une baseACIDEBASEBASEACIDE
HA répliquesOui, SyncOui, AsyncOui, SyncTBD
DR répliquesComme HDFSOui, AsynComme HDFSTBD
Les types de donnéesPas de support de type de données.Oui, le schéma doit être défini à l'avance.Pas de support de type de données.Pas de support de type de données.
L'indexation des donnéesAucune indexation secondaire.Pas vrai “ secondaire N ° 148; fonctionnalité - onlyallows colonnes à être utilisée dans des requêtes - ne pas accélérer la récupération Updata.
Prise en charge de filtres de Bloom.
Aucune indexation.
Prise en charge de filtres de Bloom.
Index secondaire complet.
Interrogation et de rechercheUtilise Map / Reduce pour accéder aux données.CQL langue semblable à de requête SQL.Utilise Map / Reduce pour accéder aux données. Peut être utilisé avec Hive queryengine.Valeur correspondance exacte et la chaîne “ commence par ” queries.Column existe soutien à long terme de la requête. Pas de plage.
Publicité2. Apache occasion au gouvernement pour les besoins Bigtable sécurisés.Version commerciale de DataStax.Apache 2. Disponible à partir d'un certain nombre de fournisseurs Hadoop.GPL v3 autorisé.
AutreRôle de contrôle d'accès basé sur les rôles (RBAC) et cellulaire (par valeur) levelsecurity utile pour les cas d'utilisation de gouvernement.
Authentification personnalisée et l'autorisation plug-ins disponibles. Partialencryption au repos de données dans Accumulo 1.6. (Intermédiaire recoveryfiles pas chiffré.)
0.5-1.0TB des données recommandé par nœud. SSD storagerecommended. 32 Go de RAM et 4/8 noyaux recommandé.
Système AWS recommandée pour 1 To de données est 2.2xlarge (60 Go de RAM + SSDstorage), ou plus petit c3.2large pour 100 Go de données.
Aide pour le cryptage des données au repos (mais pas de journaux de journal).
Considéré comme le plus lent, des bases de données NoSQL basés sur Hadoop.
“ Endpoints ” fournir une fonctionnalité similaire à StoredProcedures.
Fonction d'allocation de mémoire Adaptive accorde automatiquement RAMusage pour les applications d'écriture-lecture-lourds et lourds.

Key-Value magasin Base de données NoSQL Caractéristiques




Magasins de valeurs-clés sont les bases de données sans fioritures qui délèguent généralement toute valeur-assistance au code de l'application elle-même. Ce sont les principales caractéristiques de bases de données communes de magasins clé-valeur.

image0.jpg

Base de données NoSQL document Caractéristiques

Bases de données NoSQL document sont flexibles et le schéma agnostique, ce qui signifie que vous pouvez charger tout type de document, sans la base de données soit nécessaire de connaître la structure du document à l'avant. Bases de données NoSQL document en charge ces fonctionnalités importantes.

Feature ZoneCouchbaseMicrosoft DocumentDBMarkLogic serveurMongoDB
Acide ou une baseBASEBASE, la sélection de la cohérence du pilote clientACIDE, entièrement sérialisableBASE, la sélection de la cohérence du pilote client
HA répliquesNonGéré par la plate-forme Azure.Oui, SyncOui, Async (par défaut)
DR répliquesOui, maître-maître, AsyncGéré par la plate-forme Azure.Oui, AsyncOui, Async
Les types de donnéesLe document JSON modèleJSON modèle de document. Mêmes types pris en charge comme JSON -string, numéros (IEEE754), et booléens. Extended date-heure, guid, types Int64 pris en charge.XML, JSON, texte et documents binaires pris en charge. Tous les types de données pris en charge XMLSCHEMA W3C.JSON modèle de document. Mêmes types que JSON. Soutien pour les données 2Dgeospatial.
L'indexation des donnéesIndex secondaires pris en charge. Vues prises en charge. Aucune universalindex. Indices mis à jour de manière asynchrone.Indice universel pour tous les documents de JSON. Indexincludes universelles de détection d'indice de plage automatique. Indices eventuallyconsistent, par défaut.Index universel pour tous les documents texte, XML, JSON et. Viewsnot charge. Offre une gamme indices. Indices mis à jour dans la transaction theACID. Index 2D géospatiales.Aucun indice universel. Index secondaires configurable sur namedproperties.
Interrogation et de rechercheAPI Memcached entièrement pris en charge. Requêtes plus de documents et viewssupported.Utilise SQL sur HTTP pour les requêtes. Pas de recherche en texte libre grammarsupport. Requêtes de projection et plage prise en charge.Texte libre (semblable à la boîte de recherche Google) recherche grammaire andstructured requêtes à la fois en charge. Gamme interroge supported.Aggregates peuvent être calculées lors d'une recherche. Geospatial queriessupported.Format de requête personnalisée JSON avec le support des requêtes de gamme. Texte Nofree aide pour la recherche de la grammaire. Texte et géospatiale (GeoJSON) requêtes prises en charge.
PublicitéCommercial-seul modèle. Pourvu seulement sur Azureplatform de Microsoft.Commercial-seul modèle.AGPL autorisé. Les licences commerciales disponibles.
AutreAzure plate-forme de Microsoft cache beaucoup de complexitiesof montée en puissance d'une grande base de données sur plusieurs zones géographiques.Fournit meetups à un modèle de sécurité worldwide.Document au niveau des bureaux MarkLogic mis en œuvre.Un soutien fort à meetups locales dans de nombreux officesworldwide MongoDB. 10 officielle et 32 ​​pilotes clients de la communauté.

Magasin Triple et graphique Base de données NoSQL Caractéristiques

Vous pouvez utiliser un magasin triple ou base de données NoSQL graphique si vous avez un web de données interconnectées, ou vous pouvez simplement marquer vos données et de déduire les relations selon les dossiers qui partagent les mêmes balises. Ces produits de base de données en charge ces fonctionnalités importantes.

Feature ZoneAllegroGraphMarkLogic serveurNeo4jOrientDB
Acide ou une baseACIDE, entièrement sérialisableACIDE, entièrement sérialisableACIDE, read committedACIDE, entièrement sérialisable ou lire engagée
HA répliquesNonOui, SyncNonOui, Sync
DR répliquesOui, AsyncOui, AsyncOui, Sync (si disponible)TBD
Les types de donnéesPrise en charge des nombres entiers, des entiers non signés, virgule flottante, les décimales, et le temps et les dates.JSON, binaire, XML, le stockage de texte libre en charge. Tous les types de schéma W3C RDF andXML pris en charge.Types de données Java pris en charge.JSON, binaire, et le stockage RDF soutenu.
L'indexation des donnéesTriple indices optimisés pour les requêtes de style graphique. 7 SPOGIindexes.Triple indice optimisé pour stylequeries profondeur connue de magasins triple. 4 indices de SPOGI.Triple indices optimisés pour les requêtes de style graphique (shortestpath, sous-graphe, et ainsi de suite). 7 indices de SPOGI.A posséder triple index. Optimisé pour stylequeries de magasins triples.
Interrogation et de rechercheSPARQL 1.0 et 1.1 pris en charge. SPARQL inférences Notation (SPIN) API pris en charge.SPARQL 1.0 conformité, SPARQL 1.1 conformité partielle (benearly sera conforme à la version 8 à venir). Inférence soutien inversion 8.Langage de requête Cypher fourni, ressemblant SQL. Aucune standardssupport. Chemin le plus court, Dijkstra, et A * graphe algorithmssupported.Pas de SPARQL W3C ou GraphStore support du protocole pour stocker des données RDF orquerying. A propre langage de requête.
PublicitéCommercial-seul modèle. Disponible à partir de Franz, Inc. Gratuit versionavailable limitée à 5 millions de triplets. Developer version availablelimited à 50 millions de triplets.Commercial-seul modèle. Niveau d'entrée “ EssentialEnterprise ” édition pour les petits groupes, et “ GlobalEnterprise ” pour les grands groupes.Fourni sous AGPL. Licence commerciale disponible. Discountedstart-up licence disponible.Des conditions commerciales favorables disponibles pour les startups. Commercialsupport disponible pour Apache 2 édition sous licence, bien que featurelimited. Toutes les fonctionnalités sont disponibles uniquement dans commercialversion.
AutreLa sécurité au niveau Triple-prise en charge. Les sauvegardes en ligne withpoint-à-temps de récupération pris en charge. CLIF ++ et ++ RDFS supported.Includes une bibliothèque Social Network Analysis (SNA).Niveau record (graphique) appui à la sécurité. Fournit meetups dans les bureaux someMarkLogic monde.Neo Technologies recommande SSD pour une bonne performance.Niveau record (graphique) appui à la sécurité.