Ibm grande sql et Hadoop

IBM a une longue histoire de collaboration avec SQL et de la technologie de base de données. En accord avec cette histoire, la solution d'IBM pour SQL sur Hadoop exploite des composants de ses technologies de base de données relationnelles qui sont portés pour fonctionner sur Hadoop.

Si vous êtes tous familiers avec le nommage produit d'IBM pour ses produits Big Data et de fonctionnalités, vous pouvez facilement deviner ce qu'ils ont appelé leur SQL sur la solution Hadoop: Big SQL. Le but de Big SQL est de fournir une interface SQL sur Hadoop qui donne aux utilisateurs autant que possible de ce qu'ils sont habitués à des interfaces SQL pour les bases de données relationnelles.

Cela signifie un large soutien de la syntaxe de requête, une performance rapide qui ne nécessite pas que les utilisateurs ayant au singe avec leurs requêtes, et la capacité de contrôler la sécurité des données.




La figure montre un déploiement partiel des BigInsights, la distribution de Hadoop IBM exécutant Big SQL.

image0.jpg

Ici, vous pouvez voir un sous-ensemble des nœuds maîtres et des noeuds de données derrière le pare-feu BigInsights. Un des noeuds de maître fonctionne le serveur SQL Big, qui comprend le compilateur et un optimiseur de SQL d'IBM. Sont également inclus sur ce nœud maître est un catalogue, où les métadonnées et des statistiques sur les données cataloguées dans HDFS sont stockées pour une utilisation par le compilateur / optimiseur.

Les paragraphes de requêtes sont envoyées aux noeuds de données applicables lorsque les données requises sont stockées, et il le Big SQL Runtime (qui est l'exécution de SQL IBM) exécute la charge de travail. Plutôt que de courir mappeur et procédés réducteurs et persister des fichiers avec des jeux de résultats intermédiaires, Big SQL utilise fonctionnant en continu démons qui passent des messages entre eux.

Il est important de noter que les données interrogées sont stockées et gérées par Hadoop. Big SQL supporte les formats de fichiers Hadoop standards - par exemple, rcfile et parquet.

Big SQL fournit la même vaste support de SQL que les produits de base de données relationnelle IBM - par exemple, la norme ANSI SQL-2011, et la compatibilité pour SQL Procedural Language d'IBM (SQL / PL). (Au moment de l'écriture, IBM a travaillé à fournir un soutien pour le dialecte SQL d'Oracle et de leur langage procédural PL / SQL.)

Avec le moteur standard SQL IBM parcouru un certain nombre d'autres capacités, notamment IBM row- et de la sécurité basée sur les colonnes (aussi connu comme grains fins de contrôle d'accès, ou FGAC), où seuls des utilisateurs spécifiques peuvent être autorisés à voir certains ensembles de des lignes de données ou colonnes.

Big SQL est livré avec le client IBM Data Server standard, qui comprend un package de pilote. Les applications classiques de base de données peuvent se connecter au cluster Hadoop BigInsights et en toute sécurité échanger des données chiffrées sur SSL.