Différentes approches de la grande analyse de données

Dans de nombreux cas, grande analyse des données sera représenté à l'utilisateur final à travers des rapports et des visualisations....

Les données disponibles au delà des données des consommateurs

Pas toutes les données que vous pourriez avoir besoin est sur les gens. Peut-être vous êtes plus intéressés par des entreprises ou des...

Bases de données et data mining

Les données recueillies par les grandes organisations dans le cadre de ses activités de tous les jours est habituellement stocké dans...

Les blocs de données dans le système de fichiers distribué Hadoop (HDFS)

Lorsque vous enregistrez un fichier dans HDFS, le système, il se décompose en un ensemble de blocs individuels et stocke ces blocs dans...

La découverte des données et des bacs à sable dans Hadoop

La découverte des données devient une activité de plus en plus important pour les organisations qui comptent sur leurs données d'être...

Sources de gouvernements du monde entier de données

Les États-Unis est seulement un des nombreux gouvernements qui de données de partager avec le public. Bien que vous ne trouvez pas...

Sources de États-Unis de données Les gouvernements des États et locaux

Trouver les données dont vous avez besoin des gouvernements d'État et locaux peut être très difficile. Certains États sont plus...

Versions de données dans le modèle de données HBase

Vous pouvez voir un nombre compris entre le qualificatif de colonne et la valeur ('FN »: 1383859182496:« John », par...

La transformation des données dans Hadoop

L'idée de moteurs ETL Hadoop inspiration a gagné beaucoup de traction au cours des dernières années. Après tout, Hadoop est un...

La modernisation de l'entrepôt de données avec Hadoop

Les entrepôts de données sont maintenant en situation de stress, en essayant de faire face à une demande accrue de leurs ressources...

L'entreposage de données pour les nuls

UN entrepôt de données est une maison pour vos données de grande valeur, ou actifs de données, qui provient d'autres applications de...

Les caractéristiques communes de nosql

Livres et blogs NoSQL offrent des opinions différentes sur ce qu'est une base de données NoSQL est. Quatre caractéristiques...

Tassements dans HBase

Compactage, le processus par lequel HBase nettoie après lui-même, est disponible en deux saveurs: majeures et mineures. Principaux...

En comparant les distributions Hadoop

Vous verrez que l'écosystème Hadoop a de nombreux composants, qui tous existent en tant que leurs propres projets Apache. Parce que...

Compression de données dans Hadoop

Les volumes de données énormes qui sont des réalités dans un Hadoop compression typique déploiement marque une nécessité. La...

Configuration de workflows oozie

Comme un moteur de workflow, oozie vous permet d'exécuter un ensemble d'applications Hadoop dans une séquence spécifiée connu comme un...

Cloudera Impala et Hadoop

Cloudera est un important fournisseur de logiciels et de services Hadoop dans le grand marché de données. Comme Drill Apache, la...

Clustering dans nosql

Bases de données NoSQL sont bien adaptés à de très grands ensembles de données. Clones Bigtable comme HBase ne font pas exception....