Hadoop porc ou de latin pour les Big Data

La puissance et la flexibilité de Hadoop pour les grandes données sont immédiatement visibles pour les développeurs de logiciels...

Hadoop considérations de rack

Un principe de base de Hadoop est mise à l'échelle avec des nœuds esclaves supplémentaires pour répondre à l'augmentation de stockage...

Hadoop MapReduce pour Big Data

Pour comprendre pleinement les capacités de Hadoop MapReduce, il est important de différencier entre MapReduce (l'algorithme) et une mise...

Hadoop Zookeeper pour Big Data

Plus grande technique de Hadoop pour traiter de grands défis de données est sa capacité à diviser et conquérir avec Zookeeper. Après...

Hadoop Sqoop pour Big Data

Sqoop (SQL-à-Hadoop) est un outil grand de données qui offre la possibilité d'extraire des données à partir des données magasins non...

Les types et la syntaxe de données de porc de Hadoop

Les types de données de porcs constituent le modèle de données pour savoir comment Pig pense de la structure des données qu'il traite....

Système de fichiers distribué Hadoop (HDFS des) pour les grands projets de données

Le système de fichiers distribués Hadoop est un résilient approche polyvalente, cluster à la gestion des fichiers dans un environnement...

Manipulation des partitions dans nosql

La partition de mot est utilisé pour deux concepts différents dans les terres NoSQL. UN partition de données est un mécanisme pour...

La détection de la fraude avec Hadoop

Le volume des transactions rend plus difficile de déceler la fraude en raison du volume des données, ironiquement, ce même défi peut...

Extension de votre couche de données avec nosql

Une base de données fait une chose très bien: Il stocke les données. Cependant, parce que toutes les applications ont besoin d'un...

Les facteurs qui augmentent l'échelle d'analyse statistique dans Hadoop

Les personnes de raison déguster leurs données avant de lancer l'analyse statistique dans Hadoop est que ce genre d'analyse nécessite...

Nœuds de pointe dans des clusters Hadoop

Noeuds périphériques constituent l'interface entre le cluster Hadoop et le réseau extérieur. Pour cette raison, ils sont parfois...

Traitement distribué Hadoop MapReduce avec

Hadoop MapReduce implique le traitement d'une séquence d'opérations sur des ensembles de données distribuées. Les données se compose...

Bases de données de documents et nosql

Bases de données de documents sont parfois appelés des bases de données agrégées, car ils ont tendance à tenir des documents qui...

Les caractéristiques de base de données de documents

Bases de données NoSQL document sont flexibles et le schéma agnostique, ce qui signifie que vous pouvez charger tout type de document,...

Document de nosql contre ecm

La gestion de contenu d'entreprise (ECM) systèmes ont été autour pendant plus de dix ans. Document de NoSQL peut offrir une certaine...

Définir les formats d'enregistrement de la table dans la ruche

La technologie Java qui utilise la ruche pour traiter les enregistrements et les mapper aux types de données de colonnes dans les tables...

Développement de workflows oozie dans Hadoop

Workflows oozie sont, à leur base, graphes orientés, où vous pouvez définir des actions (applications Hadoop) et les flux de données,...