Regionservers dans HBase

RegionServers sont les processus logiciels (souvent appelés démons) vous activez pour stocker et récupérer des données dans HBase (Base de données Hadoop). Dans les environnements de production, chaque RegionServer est déployé sur son propre nœud de calcul dédié. Lorsque vous commencez à utiliser HBase, vous créez une table, puis commencez stocker et récupérer vos données.

Cependant, à un certain moment - et peut-être assez rapidement dans les grandes cas d'utilisation de données - la table croît au-delà d'une limite configurable. À ce stade, le système HBase divise automatiquement la table et répartit la charge à un autre RegionServer.




Dans ce procédé, souvent dénommé auto-sharding, HBase redimensionne automatiquement lorsque vous ajoutez des données dans le système - un avantage énorme par rapport à la plupart des systèmes de gestion de base de données, qui nécessitent une intervention manuelle à l'échelle du système global au-delà d'un seul serveur. Avec HBase, aussi longtemps que vous avez une autre dans le rack de serveur de secours qui est configuré, mise à l'échelle est automatique!

Pourquoi fixer une limite sur les tables, puis les diviser? Après tout, HDFS est le mécanisme de stockage sous-jacent, de sorte que tous les disques disponibles dans le cluster HDFS sont disponibles pour le stockage de vos tables. (Sans compter le facteur de réplication, bien sûr.) Si vous avez un cluster entier à votre disposition, pourquoi vous limiter à un RegionServer pour gérer vos tableaux?

Simple. Vous pouvez avoir un certain nombre de tables de grandes ou petites, et vous aurez envie de tirer parti de tous les HBase RegionServers disponibles lors de la gestion de vos données. Vous souhaitez profiter pleinement de la puissance de calcul de la grappe. En outre avec de nombreux clients accédant à votre système HBase, vous aurez envie, d'utiliser de nombreuses RegionServers pour satisfaire la demande.

HBase répond à toutes ces préoccupations pour vous et redimensionne automatiquement en termes de capacité de stockage et de puissance de calcul.

image0.jpg