Comment démarrer avec ruche apache

Il n'y a pas de meilleure façon de voir ce qui est ce que l'installation du logiciel ruche et lui donner un essai. Comme avec d'autres technologies dans l'écosystème Hadoop, il ne faut pas longtemps pour commencer.

Si vous avez le temps et la bande passante du réseau, il est toujours préférable de télécharger toute une distribution Hadoop avec toutes les technologies intégrées et prêtes à fonctionner.

Si vous prenez la route pleine de distribution, une approche populaire pour apprendre les tenants et les aboutissants de la ruche est d'exécuter votre distribution Hadoop dans une machine virtuelle Linux (VM) sur un ordinateur portable 64 bits compatible avec suffisamment de RAM. (Huit gigaoctets de RAM ou plus tendance à bien fonctionner si Windows 7 est l'hôte de votre VM.)

Vous avez également besoin de Java 6 ou version ultérieure et - bien sûr - un système d'exploitation pris en charge: Linux, Mac OS X, ou Cygwin, de fournir un shell Linux pour les utilisateurs Windows.

Les étapes de configuration exécuter quelque chose comme ceci:

  1. Télécharger la dernière version de la ruche.

    Vous devez également les sous-systèmes Hadoop MapReduce et, alors assurez-vous de terminer l'étape 2.




  2. Télécharger Hadoop version 1.2.1.

  3. En utilisant les commandes dans la liste suivante, placer les rejets dans des répertoires distincts, puis Décompressez eux.

    (Décompressez est un de ces termes Unix embêtants qui signifie tout simplement d'étendre un logiciel archivé.)

    $ Mkdir hadoop- cp hadoop-1.2.1.tar.gz cd hadoop- hadoop $ gunzip hadoop-1.2.1.tar.gz $ tar xvf * .tar $ mkdir hive- cp ruche 0.11.0.tar.gz ruche - cd ruche $ gunzip ruche 0.11.0.tar.gz $ tar xvf * .tar
  4. En utilisant les commandes dans la liste suivante, configurer vos variables d'environnement Apache Hive, y compris HADOOP_HOME, JAVA_HOME, HIVE_HOME et PATH, dans votre script de profil de shell.

    l'exportation HADOOP_HOME = / home / user / ruche / Hadoop / Hadoop-1.2.1export JAVA_HOME = / opt / jdkexport HIVE_HOME = / home / user / ruche / ruche 0.11.0export PATH = $ HADOOP_HOME / bin: $ HIVE_HOME / bin: $ JAVA_HOME / bin: $ PATH
  5. Créer le fichier de configuration ruche que vous utilisez pour définir les paramètres de configuration spécifiques ruche.

    La distribution Apache Hive comprend un fichier de configuration de modèle qui fournit tous les paramètres par défaut de la ruche. Pour personnaliser la ruche pour votre environnement, tout ce que vous devez faire est de copier le fichier de modèle dans le fichier nommé ruche-site.xml et le modifier.

    En utilisant votre éditeur favori, modifiez le fichier ruche-site.xml de sorte qu'il ne comprend que le “ hive.metastore.warehouse.dir ” propriété pour le moment. Lorsque vous avez terminé, il va ressembler le fichier XML ci-dessous. Notez que les commentaires ont été supprimés pour raccourcir la liste:

    $ Cd $ HIVE_HOME / conf $ cp ruche default.xml.template ruche site.xmllt;? Xml version = "1.0"> lt;? Xml-stylesheet type = "text / xsl" href = "configuration.xsl" ?>

» » » » Comment démarrer avec ruche apache