Lorsque l'on considère les capacités de Hadoop pour travailler avec des données structurées (ou de travailler avec des données de tout...
Apache Hive est incontestablement interface d'interrogation de données la plus répandue dans la communauté Hadoop. À l'origine, les...
Il ya des raisons impérieuses que SQL a su résister. L'industrie des TI a eu 40 ans d'expérience avec SQL, car il a d'abord été...
Avec le mode d'insertion, les dossiers exportés par Sqoop sont ajoutés à la fin de la table cible. Sqoop fournit également un mode de...
Connecteurs Sqoop vont généralement de pair avec un pilote JDBC. Sqoop ne liez pas les pilotes JDBC, car ils sont souvent propriétaires...
Avec tout le succès entourant Sqoop 1.x sur sa graduation de l'incubateur Apache, Sqoop a lancée! Donc, comme vous vous en doutez, Sqoop...
SQuirreL SQL est un outil open source qui agit comme un client Hive. Vous pouvez télécharger ce client SQL universelle à partir du site...
Dimensionnement tout système de traitement de données est autant une science car elle est un art. Avec Hadoop, vous considérez les...
Comme la mort et les impôts, les pannes de disque (et assez de temps donné, même les échecs nœud ou rack), sont inévitables dans le...
Dans un cluster Hadoop, chaque noeud de données (également connue en tant que nœud esclave) Exécute un processus de fond nommée...
Dans un univers Hadoop, nœuds esclaves sont où les données Hadoop est stockée et où le traitement de données a lieu. Les services...
Analyse de sentiment social est facilement le plus démesuré de l'Hadoop utilise, ce qui ne devrait pas être une surprise, étant donné...
Si vous êtes à l'aise de travailler avec VM et Linux, vous pouvez installer Bigtop sur un autre VM que ce qui est recommandé. Si vous...
Une caractéristique commune des systèmes NoSQL est leur capacité à évoluer sur plusieurs serveurs de produits de base. Ces...
Après avoir créé un ensemble de flux de travail, vous pouvez utiliser une série de oozie emplois de coordonnateur pour planifier quand...
Hadoop est un écosystème riche et évolue rapidement avec un ensemble croissant de nouvelles applications. Plutôt que d'essayer de faire...
Comme Hadoop entre le courant dominant de l'informatique et commence à être utilisé d'une manière importante dans les environnements de...
La modélisation des risques est un autre cas d'utilisation importante qui est alimenté par Hadoop. Vous verrez que cela correspond...