Réseautage et grappes Hadoop

Comme pour tout système distribué, le réseautage peut faire ou défaire un cluster Hadoop: Ne pas “ aller pas cher ”. Une grande partie de bavardage a lieu entre les nœuds maîtres et nœuds esclaves dans un cluster Hadoop qui est essentiel dans le maintien de la grappe en marche, afin commutateurs de classe entreprise sont certainement recommandé.

Pour chaque rack dans votre cluster, vous avez besoin de deux (TdR) commutateurs top-of-rack, en termes de redondance et de performance. Utilisez 10GbE pour les commutateurs Tor.

Commutateurs Tor sont des commutateurs de réseau qui se connectent tous les ordinateurs dans un rack ensemble. Vous les voyez normalement tout en haut d'un rack, ce qui explique pourquoi les gens disent “. Top-of-rack ” Une approche de réseautage alternative est d'utiliser de fin de ligne (EOR) commutateurs, mais vous ne voient pas très souvent.

L'approche TdR est plus simple du point de vue de la mise en réseau des grappes de croissance. Par exemple, l'ajout de nœuds esclaves et racks supplémentaires est beaucoup plus facile avec des commutateurs TdR que EoR.

Lorsque vous avez plus de trois racks, vous devez au moins deux commutateurs centraux (à nouveau, surtout pour la redondance, mais aussi pour les performances). Ces commutateurs centraux gèrent des quantités massives de trafic, donc 40 GbE est une nécessité.

Si vous construisez ou l'expansion d'un cluster pour couvrir plusieurs racks, engager des experts qui sont familiers avec Hadoop, vos plans de croissance futurs, et votre charge de travail en réseau. Bad réseau peut entraver gravement la performance, mais il peut aussi faire de la croissance future douloureux et coûteux.


» » » » Réseautage et grappes Hadoop