Scripts Pig interfaces dans Hadoop

Le langage de programmation Pig est conçu pour gérer tout type de données jeté son chemin - structurée, semi-structurée, les données non structurées, you name it. Programmes de porcs peuvent être emballés de trois manières différentes:

  • Script: Cette méthode est rien de plus que d'un fichier contenant des commandes Pig Latin, identifié par le suffixe .pig (FlightData.pig, par exemple). Mettre fin à votre programme de porc avec l'extension .pig est une convention, mais pas obligatoire. Les commandes sont interprétés par le compilateur Pig Latin et exécutés dans l'ordre déterminé par l'optimiseur de porc.

  • Grunt: Grunt agit comme un interpréteur de commandes où vous pouvez entrer interactivement Pig Latin à la ligne de commande Grunt et de voir immédiatement la réponse. Cette méthode est utile pour le prototypage au cours du développement initial et avec des scénarios de simulation.

  • Embarqué: Déclarations Pig Latin peuvent être exécutées dans les programmes Java, Python, ou javascript.




Scripts de porc, les commandes shell Grunt Pig, et des programmes de porc intégrés peuvent fonctionner soit en mode local ou en mode MapReduce.

Le Grunt shell fournit un shell interactif de soumettre des commandes ou lancer des scripts Pig Pig. Pour commencer la coquille Grunt en mode interactif, simplement soumettre la commande de porc à votre coquille.

Pour spécifier si un script shell ou Grunt est exécutée localement ou en mode Hadoop suffit de spécifier dans le drapeau -x à la commande de porc. Ce qui suit est un exemple de la façon dont vous souhaitez spécifier l'exécution de votre script de porc en mode local

milesPerCarrier.pig locale de porc 

Voici comment vous souhaitez exécuter le script de porc en mode Hadoop, qui est la valeur par défaut si vous ne spécifiez pas le drapeau:

MapReduce la milesPerCarrier.pig de porc

Par défaut, lorsque vous spécifiez la commande de porc sans aucun paramètre, il commence la coquille Grunt en mode Hadoop. Si vous voulez commencer la coquille Grunt en mode local suffit d'ajouter le drapeau locale -x à la commande. Voici un exemple

cochon -x locale

» » » » Scripts Pig interfaces dans Hadoop