Dans de nombreux cas, grande analyse des données sera représenté à l'utilisateur final à travers des rapports et des visualisations....
Pas toutes les données que vous pourriez avoir besoin est sur les gens. Peut-être vous êtes plus intéressés par des entreprises ou des...
Les données recueillies par les grandes organisations dans le cadre de ses activités de tous les jours est habituellement stocké dans...
Lorsque vous enregistrez un fichier dans HDFS, le système, il se décompose en un ensemble de blocs individuels et stocke ces blocs dans...
La découverte des données devient une activité de plus en plus important pour les organisations qui comptent sur leurs données d'être...
Les États-Unis est seulement un des nombreux gouvernements qui de données de partager avec le public. Bien que vous ne trouvez pas...
Trouver les données dont vous avez besoin des gouvernements d'État et locaux peut être très difficile. Certains États sont plus...
Vous pouvez voir un nombre compris entre le qualificatif de colonne et la valeur ('FN »: 1383859182496:« John », par...
L'idée de moteurs ETL Hadoop inspiration a gagné beaucoup de traction au cours des dernières années. Après tout, Hadoop est un...
Les entrepôts de données sont maintenant en situation de stress, en essayant de faire face à une demande accrue de leurs ressources...
UN entrepôt de données est une maison pour vos données de grande valeur, ou actifs de données, qui provient d'autres applications de...
Livres et blogs NoSQL offrent des opinions différentes sur ce qu'est une base de données NoSQL est. Quatre caractéristiques...
Compactage, le processus par lequel HBase nettoie après lui-même, est disponible en deux saveurs: majeures et mineures. Principaux...
Vous verrez que l'écosystème Hadoop a de nombreux composants, qui tous existent en tant que leurs propres projets Apache. Parce que...
Les volumes de données énormes qui sont des réalités dans un Hadoop compression typique déploiement marque une nécessité. La...
Comme un moteur de workflow, oozie vous permet d'exécuter un ensemble d'applications Hadoop dans une séquence spécifiée connu comme un...
Cloudera est un important fournisseur de logiciels et de services Hadoop dans le grand marché de données. Comme Drill Apache, la...
Bases de données NoSQL sont bien adaptés à de très grands ensembles de données. Clones Bigtable comme HBase ne font pas exception....