Hadoop système de fichiers distribué (HDFS) fédération

La solution à l'expansion des grappes Hadoop indéfiniment est de fédérer l'NameNode. Avant Hadoop 2 est entré en scène, les clusters Hadoop ont dû vivre avec le fait que NameNode placé des limites à la mesure dans laquelle ils pourraient évoluer. Peu de groupes ont pu évoluer au-delà de 3000 ou de 4000 nœuds.

La nécessité de NameNode de tenir des registres pour chaque bloc de données stockées dans le cluster avéré être le plus important facteur limitant une plus grande croissance de la grappe. Lorsque vous avez trop de blocs, il devient de plus en plus difficile pour le NameNode à l'échelle comme le cluster Hadoop échelles sur.

Plus précisément, vous devez définir HDFS de sorte que vous disposez de plusieurs instances de NameNode exécutant sur leurs propres nœuds, dédiés maître et puis faisant de chaque NameNode responsable que pour les blocs de fichiers dans son propre espace de nom.

image0.jpg

La figure montre des modèles de réplication de blocs de données dans HDFS. Vous pouvez voir un cluster Hadoop avec deux NameNodes servir un seul cluster. Les nœuds esclaves tous contiennent des blocs de deux espaces de noms.


» » » » Hadoop système de fichiers distribué (HDFS) fédération