SGBDR dans un environnement grand de données

Big données devient un élément important dans la façon dont les organisations tirent parti des données à haut volume à la bonne vitesse pour résoudre des problèmes spécifiques de données. Relational Database Management Systems sont importants pour ce volume élevé. Big data ne vivent pas en vase clos. Pour être efficaces, les entreprises ont souvent besoin d'être en mesure de combiner les résultats de la grande analyse de données avec les données qui existe au sein de l'entreprise.

Sommaire

Big bases de données: les données SGBDR et persistants

L'un des services les plus importants offerts par les bases de données opérationnelles (aussi appelé magasins de données) Est la persistance. Persistance garantit que les données stockées dans une base de données ne seront pas modifiées sans autorisation et qu'il ne sera disponible dans la mesure où il est important de l'entreprise. A quoi bon une base de données si elle ne peut pas faire confiance pour protéger les données que vous mettez en elle?

Compte tenu de cette exigence le plus important, vous devez alors penser à ce genre de données que vous souhaitez conserver, comment pouvez-vous accéder et mettre à jour, et comment pouvez-vous l'utiliser pour prendre des décisions d'affaires. A ce niveau le plus fondamental, le choix de vos moteurs de base de données est essentiel à votre succès global avec votre grosse mise en œuvre de données.

Même si la technologie sous-jacente a été autour depuis un certain temps, bon nombre de ces systèmes sont en service aujourd'hui, parce que les entreprises qu'ils soutiennent sont très dépendantes des données. Pour les remplacer serait apparenté à changer les moteurs d'un avion sur un vol transocéanique.

Big bases de données: SGBDR et tables

Bases de données relationnelles sont construits en une ou plusieurs relations et sont représentées par des tableaux. Ces tables sont définies par leurs colonnes, et les données sont stockées dans les rangées. La clé primaire est souvent la première colonne de la table. La cohérence de la base de données et beaucoup de sa valeur sont réalisés par «normaliser» les données. Données normalisées a été converti à partir du format natif dans une partagé, format convenu.

Par exemple, dans une base de données que vous pourriez avoir "téléphone" comme XXX-XXX-XXXX tandis que dans l'autre, il pourrait être XXXXXXXXX. Pour obtenir une vue cohérente de l'information, le champ devra être normalisée à une autre forme. Cinq niveaux de normes existent pour la normalisation. Le choix de la forme normale est souvent reléguée au concepteur de la base de données. La collection de tables, des clés, des éléments, et ainsi de suite est connue comme la base de données schéma.

Au fil des ans, le langage de requête SQL (Structured) a évolué à l'étape de verrouillage avec la technologie SGBDR et est le mécanisme le plus largement utilisé pour la création, l'interrogation, la maintenance et l'exploitation des bases de données relationnelles.

Dans les entreprises petites et grandes, la plupart de leur information opérationnelle importante est probablement stocké dans SGBDR. De nombreuses entreprises ont SGBDR différente pour différents domaines de leur activité. Les données transactionnelles peuvent être stockées dans la base de données d'un fournisseur, tandis que les informations de la clientèle pourrait être stockée dans un autre.




Il est peu probable que vous allez utiliser SGBDR pour le noyau de l'application, mais vous aurez besoin de compter sur les données stockées dans les SGBDR pour créer le plus haut niveau de valeur pour l'entreprise avec de grandes données.

PostgreSQL, une base de données relationnelle open source

Lors de votre grande mise en œuvre de données, vous aurez probablement rencontré PostgreSQL, une base de données relationnelle open source largement utilisé. Plusieurs facteurs contribuent à la popularité de PostgreSQL. Comme un SGBDR avec le support de la norme SQL, il fait toutes les choses attendues d'un produit de base de données, en plus de sa longévité et une large utilisation en ont fait «bataille testé." Il est également disponible sur à peu près toutes les variétés de système d'exploitation, des PC aux ordinateurs centraux.

Fournir les bases et le faire de manière fiable sont qu'une partie de l'histoire. PostgreSQL supporte également de nombreuses fonctionnalités ne se trouvent que dans les SGBDR propriétaire coûteux, dont les suivantes:

  • Capacité à gérer directement "objets" dans le schéma relationnel

  • Les clés étrangères (référencement clés d'une table dans un autre)

  • Déclencheurs (événements utilisés pour démarrer automatiquement une procédure stockée)

  • Des requêtes complexes (sous-requêtes et jointures entre tables discrètes)

  • L'intégrité transactionnelle

  • Multiversion contrôle de concurrence

La vraie puissance de PostgreSQL est son extensibilité. Les utilisateurs et les programmeurs de base de données peuvent ajouter de nouvelles fonctionnalités sans affecter le fonctionnement fondamental ou la fiabilité de la base de données. Extensions possibles comprennent

  • Les types de données

  • Opérateurs

  • Fonctions

  • Méthodes d'indexation

  • Les langages procéduraux

Ce niveau élevé de personnalisation rend PostgreSQL souhaitable lorsque rigides, des produits propriétaires ne seront pas faire le travail. Il est extensible à l'infini.

Enfin, la licence PostgreSQL permet la modification et la distribution sous quelque forme, la source ouverte ou fermée. Les modifications peuvent être gardés privé ou partagées avec la communauté que vous le souhaitez.


» » » » SGBDR dans un environnement grand de données