Bases de données graphiques dans un grand environnement de données

La structure fondamentale des bases de données graphiques dans Big Data est appelé “ le noeud-relation ”. Cette structure est particulièrement utile lorsque vous devez traiter avec des données fortement interconnectés. Nœuds et les relations de soutien propriétés, une paire où les données sont stockées clé-valeur.

Ces bases de données sont parcourus en suivant les liens. Ce type de stockage et la navigation est pas possible dans les SGBDR (systèmes de gestion de base de données relationnelle) en raison des structures rigides de table et l'incapacité de suivre des liens entre les données partout où ils pourraient nous conduire. Une base de données graphique pourrait être utilisé pour gérer des données géographiques pour l'exploration pétrolière ou pour modéliser et optimiser les réseaux d'un fournisseur de télécommunications.

Une des bases de données du graphique la plus utilisée est Neo4j. Il est un projet open source sous licence v3.0 licence publique GNU. Une prise en charge, la version commerciale est assurée par Neo Technology sous la GNU AGPL v3.0 et de licence commerciale.

Neo4j est une base de données des transactions ACID offrant une haute disponibilité grâce au regroupement. Il est une base de données fiable et évolutive qui est facile à modéliser raison de la structure fondamentale de propriétés noeud-relationnels et comment naturellement maps à nos propres relations humaines. Il ne nécessite pas un schéma, ni ne nécessite typage des données, il est donc intrinsèquement très flexible.

Avec cette souplesse vient quelques limitations. Nœuds ne peuvent pas se faire directement référence. Par exemple, vous (comme un nœud) ne pouvez pas être aussi Le tien père ou la mère (comme les relations), mais vous pouvez être un père ou la mère. Il pourrait y avoir des cas réels du monde où l'auto-référence est nécessaire.




Si oui, une base de données graphique est pas la meilleure solution car les règles sur l'auto-référence sont strictement appliquées. Alors que la capacité de réplication est très bonne, Neo4j ne peut répliquer graphiques entières, imposant une limite sur la taille globale du graphe (environ 34 milliards de noeuds et de 34 milliards de relations).

Les caractéristiques importantes de Neo4j comprennent ce qui suit:

  • Intégration avec d'autres bases de données: Neo4j soutient la gestion de transaction avec rollback pour permettre l'interopérabilité transparente avec les non graphique magasins de données.

  • Les services de synchronisation: Neo4j soutient comportements event-driven via un bus de l'événement, la synchronisation périodique à l'aide elle-même, ou un SGBDR comme le maître, et synchronisation par lot traditionnel.

  • Résilience: Neo4j supporte le froid (qui est, quand la base de données ne fonctionne pas) et chaudes (quand il fonctionne) les sauvegardes, ainsi que d'un mode de clustering haute disponibilité. Alertes standard sont disponibles pour l'intégration avec les systèmes de gestion des opérations existantes.

  • Langage de requêtes: Neo4j supporte un langage déclaratif appelé Cypher, conçu spécifiquement pour interroger graphiques et de leurs composants. Cypher commandes sont généralement fondées sur la syntaxe SQL et sont destinés à des requêtes ad hoc des données de graphique.

Implémentations Neo4j sont les mieux adaptés pour

  • Le réseautage social

  • Classification des domaines biologiques ou médicaux

  • La création de collectivités dynamiques de la pratique ou de l'intérêt


» » » » Bases de données graphiques dans un grand environnement de données