Comment configurer la base architecturale pour les Big Data

Il est important de jeter une base solide architecture si vous voulez avoir du succès avec de grandes données. En plus de supporter les exigences fonctionnelles, il est important de soutenir la performance requise. Vos besoins dépendront de la nature de l'analyse que vous soutenez. Vous aurez besoin de la bonne quantité de puissance de calcul et la vitesse.

Sommaire

Votre architecture doit aussi avoir la bonne quantité de redondance afin que vous êtes protégé contre les temps de latence et les temps d'arrêt imprévus.

Commencez par vous poser les questions suivantes:

  • Combien de données de votre organisation devra gérer aujourd'hui et dans l'avenir?

  • Combien de fois votre organisation aura besoin pour gérer les données en temps réel ou quasi temps réel?

  • Quel degré de risque de votre organisation peut se permettre? Votre industrie est assujettie à la sécurité stricte, la conformité et les exigences en matière de gouvernance?

  • Quelle est l'importance vitesse à votre besoin pour gérer les données?




  • Comment certaine ou précise les données doivent être fait?

    image0.jpg

Interfaces et aliments pour Big Data

Pour comprendre comment les données big fonctionne dans le monde réel, il est important de commencer par comprendre la nécessité des interfaces et des aliments. En fait, ce qui rend les données de grandes grand est le fait qu'elle repose sur ramasser beaucoup de données à partir de lots de sources.

Par conséquent, les interfaces de programmation d'applications (API) ouverte seront noyau à toute architecture big de données. En outre, garder à l'esprit que les interfaces existent à tous les niveaux et entre toutes les couches de la pile. Sans les services d'intégration, de grandes données ne peuvent pas se produire.

Infrastructure physique grande de données redondantes

L'infrastructure physique de soutien est fondamentale pour le fonctionnement et l'évolutivité d'une architecture big de données. En fait, sans la disponibilité des infrastructures physiques robustes, grandes données ne seraient probablement pas ont émergé comme une telle tendance importante. Pour soutenir un volume imprévue ou imprévisible des données, une infrastructure physique pour les grandes données doit être différente de celle pour les données traditionnelles.

L'infrastructure physique est basé sur un modèle de calcul distribué. Cela signifie que les données peuvent être stockées physiquement dans de nombreux endroits différents et peuvent être reliés entre eux au moyen de réseaux, l'utilisation d'un système de fichiers distribué, et divers grands outils d'analyse de données et des applications.

La redondance est important parce que vous faites affaire avec autant de données à partir de tant de sources différentes. Redondance prend de nombreuses formes. Si votre entreprise a créé un cloud privé, vous voudrez avoir redondance intégrée dans l'environnement privé de sorte qu'il peut évoluer pour soutenir l'évolution des charges de travail.

Si votre entreprise veut contenir la croissance interne de TI, il peut utiliser les services de cloud externes pour augmenter ses ressources internes. Dans certains cas, cette redondance peut venir sous la forme d'un logiciel comme une offre de service (SaaS) qui permet aux entreprises de faire une analyse sophistiquée des données en tant que service. L'approche SaaS offre des coûts inférieurs, démarrage plus rapide, et de l'évolution transparente de la technologie sous-jacente.

Infrastructure de sécurité de données Big

Le plus important, grande analyse des données devient pour les entreprises, plus il sera important pour garantir que les données. Par exemple, si vous êtes une entreprise de soins de santé, vous voudrez probablement utiliser de grandes applications de données pour déterminer les changements dans la démographie ou des changements dans les besoins des patients. Ces données à propos de vos électeurs doit être protégé à la fois pour répondre aux exigences de conformité et de protéger la vie privée des patients.

Vous aurez besoin de prendre en compte qui est autorisé à voir les données et dans quelles circonstances ils sont autorisés à le faire. Vous devrez être en mesure de vérifier l'identité des utilisateurs ainsi que de protéger l'identité des patients.

Sources de données opérationnelles gros

Il est important de comprendre que vous avez à intégrer toutes les sources de données qui vous donnera une image complète de votre entreprise et de voir comment les impacts de données la façon dont vous exploitez votre entreprise. Comme le monde change, il est important de comprendre que les données opérationnelles a maintenant pour englober un éventail plus large de sources de données, y compris les sources de données non structurées telles que les médias sociaux dans toutes ses formes.

Vous trouverez de nouvelles approches émergentes à la gestion des données dans le grand monde de données, y compris le document, graphique, en colonne, et les architectures de bases de données géospatiales. Collectivement, ceux-ci sont appelés NoSQL, ou non seulement SQL, les bases de données. En essence, vous devez mapper les architectures de données pour les types de transactions.

Cela aidera à assurer la droit données est disponible lorsque vous en avez besoin. Vous devez également les architectures de données qui prennent en charge des contenus non structurés complexes. Vous devez inclure les deux bases de données relationnelles et non relationnelles bases de données dans votre approche pour exploiter les grandes données. Il est également nécessaire d'inclure des sources de données non structurées, telles que les systèmes de gestion de contenu, de sorte que vous pouvez vous rapprocher de ce point de vue d'affaires de 360 ​​degrés.

Toutes ces sources de données opérationnelles ont plusieurs caractéristiques en commun:

  • Ils représentent systèmes d'enregistrement qui gardent la trace des données critiques nécessaires en temps réel, le fonctionnement au jour le jour de l'entreprise.

  • Ils sont continuellement mis à jour en fonction des opérations qui se déroulent au sein des unités d'affaires et sur le web.

  • Pour ces sources pour fournir une représentation précise de l'entreprise, ils doivent se fondre les données structurées et non structurées.

  • Ces systèmes doivent également être en mesure de monter en charge des milliers d'utilisateurs sur une base cohérente. Celles-ci pourraient inclure des systèmes transactionnels de commerce électronique, les systèmes de gestion de la relation client, ou des applications de centre d'appels.


» » » » Comment configurer la base architecturale pour les Big Data