La puissance et la flexibilité de Hadoop pour les grandes données sont immédiatement visibles pour les développeurs de logiciels...
Un principe de base de Hadoop est mise à l'échelle avec des nœuds esclaves supplémentaires pour répondre à l'augmentation de stockage...
Pour comprendre pleinement les capacités de Hadoop MapReduce, il est important de différencier entre MapReduce (l'algorithme) et une mise...
Plus grande technique de Hadoop pour traiter de grands défis de données est sa capacité à diviser et conquérir avec Zookeeper. Après...
Sqoop (SQL-à-Hadoop) est un outil grand de données qui offre la possibilité d'extraire des données à partir des données magasins non...
Les types de données de porcs constituent le modèle de données pour savoir comment Pig pense de la structure des données qu'il traite....
Le système de fichiers distribués Hadoop est un résilient approche polyvalente, cluster à la gestion des fichiers dans un environnement...
La partition de mot est utilisé pour deux concepts différents dans les terres NoSQL. UN partition de données est un mécanisme pour...
Le volume des transactions rend plus difficile de déceler la fraude en raison du volume des données, ironiquement, ce même défi peut...
Une base de données fait une chose très bien: Il stocke les données. Cependant, parce que toutes les applications ont besoin d'un...
Les personnes de raison déguster leurs données avant de lancer l'analyse statistique dans Hadoop est que ce genre d'analyse nécessite...
Noeuds périphériques constituent l'interface entre le cluster Hadoop et le réseau extérieur. Pour cette raison, ils sont parfois...
Hadoop MapReduce implique le traitement d'une séquence d'opérations sur des ensembles de données distribuées. Les données se compose...
Bases de données de documents sont parfois appelés des bases de données agrégées, car ils ont tendance à tenir des documents qui...
Bases de données NoSQL document sont flexibles et le schéma agnostique, ce qui signifie que vous pouvez charger tout type de document,...
La gestion de contenu d'entreprise (ECM) systèmes ont été autour pendant plus de dix ans. Document de NoSQL peut offrir une certaine...
La technologie Java qui utilise la ruche pour traiter les enregistrements et les mapper aux types de données de colonnes dans les tables...
Workflows oozie sont, à leur base, graphes orientés, où vous pouvez définir des actions (applications Hadoop) et les flux de données,...