Comment utiliser les données en streaming pour Big Data

Parfois, à l'approche de grands volumes de données, les entreprises sont confrontées à d'énormes quantités de données et petite idée de l'endroit où aller. Entrez le streaming de données. Quand une quantité importante de données doit être rapidement traitées en temps quasi réel pour mieux comprendre, les données en mouvement sous la forme de données de transmission en continu est la meilleure réponse.

Qu'est-ce qui est des données pas au repos? Ce serait les systèmes qui gèrent les transactions actives et ont donc besoin d'avoir la persévérance. Dans ces cas, les données seront stockées dans une banque de données opérationnelle. Cependant, dans d'autres situations, ces opérations ont été exécutées, et il est temps d'analyser les données généralement dans un entrepôt de données ou data mart.

Cela signifie que l'information est en cours de traitement par lots et pas en temps réel. Lorsque les organisations planifient leur avenir, ils doivent être capables d'analyser de nombreuses données, allant de l'information à propos de ce que les clients achètent et pourquoi. Il est important de comprendre les principaux indicateurs de changement. En d'autres termes, comment changements ont un impact Quels produits et services d'une organisation offrira à l'avenir?

De nombreuses organisations de recherche utilisent ce type de grandes analyses de données pour découvrir de nouveaux médicaments. Une compagnie d'assurance peut vouloir comparer les modèles de accidents de la circulation sur une large zone géographique avec les statistiques météorologiques. Dans ces cas, aucun avantage existe pour gérer cette information à la vitesse en temps réel. De toute évidence, l'analyse doit être rapide et pratique. En outre, les organisations vont analyser les données pour voir si de nouvelles tendances émergent.

Flux de données est une plate-forme de calcul analytique qui met l'accent sur la vitesse. En effet, ces applications nécessitent un flux continu de données non structurées souvent à traiter. Par conséquent, les données sont analysées en continu et transformé dans la mémoire avant d'être stocké sur un disque. Flux de traitement des données à des œuvres de traitement “ fenêtres de temps ” des données en mémoire à travers un cluster de serveurs.

Ceci est similaire à l'approche en matière de gestion des données au repos misant sur Hadoop. La principale différence est la question de la vitesse. Dans le cluster Hadoop, les données sont collectées en mode batch et ensuite traitées. Vitesse importe moins dans Hadoop qu'il ne le fait en streaming de données. Quelques principes clés définissent l'utilisation de flux est le plus approprié:

Quand il est nécessaire de déterminer une opportunité d'achat au détail au point de l'engagement, que ce soit via les médias sociaux ou par messagerie permission-based
La collecte d'informations sur le mouvement autour d'un site sécurisé
Pour être en mesure de réagir à un événement qui a besoin d'une réponse immédiate, comme une panne de service ou d'un changement dans l'état médical d'un patient
Calcul en temps réel des coûts qui dépendent de variables telles que les ressources disponibles et d'utilisation

Flux de données est utile lorsque l'analyse doivent être faites en temps réel alors que les données est en mouvement. En fait, la valeur de l'analyse (et souvent les données) diminue avec le temps. Par exemple, si vous ne pouvez pas analyser et agir immédiatement, une opportunité de vente pourrait être perdu ou une menace pourrait passer inaperçue.

Ce qui suit sont quelques exemples qui peuvent aider à expliquer comment cela est utile.

Une centrale doit être un environnement hautement sécurisé afin que les personnes non autorisées ne pas interférer avec la fourniture d'énergie aux clients. Entreprises placent souvent capteurs autour du périmètre d'un site pour détecter les mouvements. Mais un problème peut exister. Une énorme différence existe entre un lapin qui se précipite autour de la place et une conduite automobile par rapidement et délibérément. Par conséquent, la vaste quantité de données provenant de ces capteurs doivent être analysées en temps réel de sorte qu'une alarme retentit uniquement lorsque une menace réelle existe.

Une entreprise de télécommunications dans un marché hautement concurrentiel veut faire en sorte que les pannes sont soigneusement surveillés de sorte qu'une baisse détecté des niveaux de service peut être augmentée au groupe approprié. Les systèmes de communication génèrent d'énormes volumes de données qui doivent être analysées en temps réel pour prendre les mesures appropriées. Un retard dans la détection d'une erreur peut sérieusement affecter la satisfaction du client.

Inutile de dire que les entreprises sont aux prises avec un grand nombre de données qui doivent être traitées et analysées en temps réel. Par conséquent, l'environnement physique qui prend en charge ce niveau de la réactivité est essentielle. Diffusion environnements de données nécessitent généralement une solution matérielle en cluster, et parfois une approche de traitement massivement parallèle seront nécessaires pour gérer l'analyse.

Un facteur important en continu sur l'analyse des données est le fait qu'il est une analyse de la transmission unique. En d'autres termes, l'analyste ne peut réanalyser les données après il est diffusé. Cette situation est commune dans les applications où vous recherchez l'absence de données.

Si plusieurs passes sont nécessaires, les données devront être mis en quelque sorte de l'entrepôt où l'analyse supplémentaire peut être réalisée. Par exemple, il est souvent nécessaire de mettre en place contexte. Comment ce flux de données se comparent aux données historiques? Cette corrélation peut vous en dire beaucoup sur ce qui a changé et ce que le changement pourrait signifier pour votre entreprise.

A propos Auteur

Bases de données statiques et écoutés dans analyics prédictifs

Les données dans l'analyse prédictive peuvent être identifiés comme streaming, statique, ou un mélange des deux. Données en streaming changements de les exemples incluent le flux constant de mises à jour Facebook, tweets sur Twitter, et le…

Big analyse de données fournisseurs de solutions

Un certain nombre de fournisseurs sur le marché aujourd'hui soutenir le besoin croissant de solutions de données de grandes pour votre entreprise. Voici une liste de quelques solutions que vous pourriez trouver intéressant:IBM adopte une approche…

Big data en streaming dans le secteur de l'énergie

Réduire la consommation d'énergie, la recherche de nouvelles sources d'énergie renouvelables, et en augmentant l'efficacité énergétique sont tous de grands objectifs de données importantes pour protéger l'environnement et soutenir la…

Big data en streaming avec un impact sur les politiques publiques

Presque tous les domaines d'une ville a la capacité d'utiliser les données de grandes, que ce soit sous la forme de taxes, les capteurs sur les bâtiments et les ponts, la surveillance de la structure du trafic, les données de localisation et des…

Big data: la nécessité pour les métadonnées dans les flux de données

La plupart des grands professionnels de la gestion des données sont familiers avec la nécessité de gérer les métadonnées dans des environnements de gestion de base de données structurées. Ces sources de données sont fortement typés (par…

Comment garder prédictive des données d'analyse à jour

Après l'étape de chargement de Extract Transform Load, après que vous obtenez vos données dans cette base de données séparée, data mart, ou d'un entrepôt pour l'analyse, vous aurez besoin de conserver les données de sorte que les frais…

Améliorer l'expérience du client avec de grandes analyses de données

Le gros des données qui peuvent faire une différence dans la façon dont les entreprises à satisfaire leurs clients et partenaires est pas nécessairement dans les bases de données traditionnelles plus. La valeur de données non structurées…

Analyse des données Big et l'entrepôt de données

Vous trouverez la valeur en apportant les capacités de l'entrepôt de données et de l'environnement de données grand ensemble. Vous devez créer un environnement hybride où les grandes données peuvent travailler main dans la main avec…

Identifier les données dont vous avez besoin pour votre Big Data

Faites l'inventaire du type de données que vous traitez avec votre grand projet de données. De nombreuses organisations reconnaissent que beaucoup de données générées en interne n'a pas été utilisé à son plein potentiel dans le passé.En…

Modifier les produits de business intelligence pour gérer le Big Data

Les produits traditionnels de business intelligence sont pas vraiment conçus pour traiter les données volumineuses, ils peuvent nécessiter une certaine modification. Ils ont été conçus pour fonctionner avec des données hautement structurées,…

L'avenir des entrepôts de données à l'époque grand de données

Le marché de l'entrepôt de données a en effet commencé à changer et à évoluer avec l'avènement de grands volumes de données. Dans le passé, il était tout simplement pas rentable pour les entreprises de stocker la quantité massive de…

Meilleures pratiques pour grande intégration de données

Beaucoup d'entreprises explorent de gros problèmes de données et à venir avec des solutions innovantes. Il est maintenant temps de prêter attention à un certain les meilleures pratiques, ou principes de base, qui vous servira ainsi que vous…

Définition de gros volumes de données: le volume, la vitesse, et la variété

Big données permet aux entreprises de stocker, gérer et manipuler de grandes quantités de données disparates à la bonne vitesse et au bon moment. Pour gagner les bonnes idées, Big Data est généralement décomposé par trois…

Dix grandes tendances de données chaudes

Lorsque vous entrez dans le monde de grands volumes de données, vous aurez besoin d'absorber de nombreux nouveaux types de technologies de bases de données et de gestion des données. Voici le top-dix grandes tendances de données:Hadoop est en…

godiches.com » Ordinateurs et logiciels » Big Data » La science des données » Comment utiliser les données en streaming pour Big Data