Services de middleware: l'assurance de la qualité des données

Vous devez établir deux services différents d'assurance de la qualité (AQ) dans le flux des services de middleware. Vous devez effectuer...

Services de middleware: sélection de données et extractions

Le but principal de la sélection de données et un service de -extraction est de sélectionner à partir de (retrouver dans) une source de...

Services de Middleware: la cartographie des données et de la transformation

Cette figure montre un environnement dans lequel les données sont extraites de trois sources de données différentes pour inclusion dans...

Les données de grandes mines avec ruche

Hive est, une couche d'entreposage des données orientée lots construit sur les éléments de base de Hadoop (HDFS et MapReduce) et est...

Gérer la virtualisation pour Big Data

Virtualisation sépare ressources et des services de l'environnement de la livraison physique sous-jacente, qui vous permet de créer de...

La gestion des données de base (mdm)

Au cours des dernières années, les systèmes de rétroaction ODS-style définies dans un but précis - les données de référence - ont...

Couche 0 de la grande pile de données: l'infrastructure physique redondante

Au niveau le plus bas de la grande pile de données est l'infrastructure physique. Votre entreprise peut-être déjà un centre de données...

Couche 4 de la grande pile de données: les entrepôts de données analytiques

L'entrepôt de données, couche 4 de la grande pile de données, et de son compagnon de l'entrepôt de données, ont longtemps été les...

Bases de données dans un environnement de données grande paire clé-valeur

De loin, la plus simple de la NoSQL (non-seulement-SQL) des bases de données dans un environnement grand de données sont celles qui...

Couche 1 de la grande pile de données: l'infrastructure de sécurité

Sécurité et confidentialité exigences, la couche 1 de la grande pile de données, sont similaires aux exigences pour les environnements...

Couche 2 de la grosse pile de données: bases de données opérationnelles

À la base de tout grand environnement de données, et la couche 2 de la grande pile de données, sont les moteurs de base de données...

Couche 3 de la grosse pile de données: l'organisation des services et des outils de données

L'organisation des services de données et des outils, couche 3 de la grosse pile de données, la capture, valider et assembler différents...

Identifier les données dont vous avez besoin pour votre entrepôt de données

Il suffit de vous poser cette question: En regardant la liste complète de l'intérieur de votre entreprise de toutes les sources de...

Identifier les données dont vous avez besoin pour votre Big Data

Faites l'inventaire du type de données que vous traitez avec votre grand projet de données. De nombreuses organisations reconnaissent que...

Mettre en place un data mart - rapidement

Peu importe comment vous décidez de diviser l'univers des matières possibles dans un sous-ensemble pour votre data mart, rappelez-vous...

Comment utiliser MapReduce pour Big Data

MapReduce est un cadre logiciel qui est idéal pour les grandes données, car il permet aux développeurs d'écrire des programmes qui...

Comment configurer la base architecturale pour les Big Data

Il est important de jeter une base solide architecture si vous voulez avoir du succès avec de grandes données. En plus de supporter les...

Comment optimiser tâches MapReduce

Mis à part l'optimisation du code de l'application réelle avec MapReduce pour les grands projets de données, vous pouvez utiliser...