Gérer grandes ressources de données et des applications avec fil de Hadoop

La planification des tâches et de suivi pour les grandes données sont des parties intégrantes de Hadoop MapReduce et peuvent être utilisés pour gérer les ressources et les applications. Les premières versions de Hadoop faveur d'un système de suivi de l'emploi et de la tâche rudimentaire, mais comme le mélange de travail soutenu par Hadoop changé, le planificateur ne pouvaient pas suivre.

En particulier, l'ancien planificateur ne pouvait pas gérer les tâches non-MapReduce, et il était incapable de optimisant l'utilisation de cluster. Ainsi, une nouvelle fonctionnalité a été conçu pour remédier à ces lacunes et d'offrir plus de flexibilité, l'efficacité et la performance.

Encore un autre négociateur des ressources (FIL) est un service de base Hadoop fournissant deux services principaux:




  • La gestion globale des ressources (ResourceManager)

  • La gestion par application (ApplicationMaster)

Le ResourceManager est une NodeManager de service et de contrôle maître dans chacun des noeuds d'un cluster Hadoop. Inclus dans le ResourceManager est Scheduler, dont la seule tâche est d'allouer les ressources du système pour les applications en cours spécifiques (tâches), mais il ne veut pas contrôler ou suivre l'état de l'application.

Toutes les informations de système requis est stocké dans un conteneur de ressources. Il contient CPU détaillée, disque, réseau, et d'autre ressource importante attributs nécessaires pour exécuter des applications sur le noeud et dans le cluster.

Chaque nœud a une NodeManager asservie à la ResourceManager mondiale dans le cluster. Le NodeManager contrôle l'utilisation du CPU, disque, réseau, et de la mémoire et des rapports de retour à l'ResourceManager de l'application. Pour chaque application exécutée sur le noeud il existe un ApplicationMaster correspondant.

Si plus de ressources sont nécessaires pour appuyer l'application en cours d'exécution, l'ApplicationMaster avise le NodeManager et NodeManager négocie avec le ResourceManager (Scheduler) pour la capacité supplémentaire au nom de l'application. Le NodeManager est également responsable du suivi de l'état du travail et le progrès au sein de son nœud.


» » » » Gérer grandes ressources de données et des applications avec fil de Hadoop