Comment choisir une architecture de cluster hadoop

Hadoop est conçu pour être déployé sur une grande grappe d'ordinateurs en réseau, avec des nœuds maîtres (qui accueillent les services qui contrôlent le stockage et le traitement de Hadoop) et nœuds esclaves (où les données sont stockées et traitées). Vous pouvez, toutefois, exécutez Hadoop sur un seul ordinateur, ce qui est une excellente façon d'apprendre les rudiments de Hadoop en expérimentant dans un espace contrôlé.

Sommaire




Hadoop dispose de deux modes de déploiement: le mode pseudo-distribué et le mode entièrement distribué, qui tous deux sont décrits ici.

Mode pseudo-distribué (noeud unique)

Un seul nœud Hadoop déploiement est considéré comme en cours d'exécution dans Hadoop distribué pseudo- Mode, où tous les services Hadoop, y compris les services de maître et esclave, tous exécutés sur un nœud de calcul unique. Ce type de déploiement est utile pour tester rapidement des applications alors que vous êtes les développer sans avoir à vous soucier de l'aide Hadoop ressources du cluster quelqu'un d'autre pourrait avoir besoin.

Il est également un moyen pratique d'expérimenter avec Hadoop, comme la plupart d'entre nous ne disposent pas des grappes d'ordinateurs à notre disposition.

Mode entièrement distribuée (un cluster de nœuds)

Un déploiement Hadoop où les services de maître et esclave Hadoop exécutées sur un cluster d'ordinateurs est en cours d'exécution dans ce qui est connu sous le nom mode entièrement distribuée. Ceci est un mode approprié pour les clusters de production et de pôles de développement. Une autre distinction peut être faite ici: un pôle de développement a généralement un petit nombre de noeuds et est utilisé pour prototyper les charges de travail qui finira par exécuter sur un cluster de production.


» » » » Comment choisir une architecture de cluster hadoop