Configuration de workflows oozie

Comme un moteur de workflow, oozie vous permet d'exécuter un ensemble d'applications Hadoop dans une séquence spécifiée connu comme un flux de travail. Vous pouvez configurer des workflows oozie dans l'une des trois façons, en fonction de vos circonstances particulières. Tu peux utiliser

  • Le fichier config-default.xml: Définit les paramètres qui ne changent pas pour le workflow.

  • La job.properties fichier: Définit les paramètres qui sont communs pour un déploiement particulier du flux de travail. Définitions ici remplacent celles faites dans le fichier config-default.xml.

  • La paramètres de ligne de commande: Définit les paramètres qui sont spécifiques à l'invocation de workflow. Définitions ici remplacent celles faites dans le fichier job.properties et le fichier config-default.xml.

Les détails de configuration diffèrent, en fonction de l'action qu'ils sont associés avec. Par exemple, comme vous pouvez le voir dans l'action de MapReduce (carte action) dans la liste ci-dessous, vous avez beaucoup plus de choses à y configurer:

... @@1 serverName: 8021serverName: 8020 @@2


@@3 jobConfig.xml...mapreduce.map.classdummies.oozie.FlightMilesMappermapreduce.reduce.classdummies.oozie.FlightMilesReducer mapred.mapoutput.key.classorg.apache.hadoop.io.Textmapred.mapoutput.value.classorg.apache.hadoop.io.IntWritablemapred.output.key.classorg.apache.hadoop.io.Textmapred.output.value.classorg.apache.hadoop.io.IntWritablemapred.input.dir«/ usr / Dirk / Données de vol"mapred.output.dir«/ usr / Dirk / flightmiles '...
...

Par opposition à un système de fichiers (fs) l'action comme celui montré ici:

......

» » » » Configuration de workflows oozie