Applications en temps réel et en streaming dans Hadoop

Le flux de processus de fils ressemble beaucoup comme un cadre de l'exécution du lot. Vous pourriez vous demander, “? Qu'est-il arrivé à cette idée de flexibilité pour les différents modes d'applications ” Eh bien, le seul cadre de l'application actuellement prêt pour une utilisation en production est MapReduce. Bientôt, le Tez Apache et Apache tempête seront prêts pour une utilisation en production, et vous pouvez utiliser Hadoop pour plus que juste le traitement par lots.

Tez, par exemple, va soutenir temps réel applications - un type d'application interactive où l'utilisateur attend une réponse immédiate. Un objectif de conception de Tez est de fournir un outil interactif pour les utilisateurs d'émettre des requêtes de la ruche et recevoir un jeu de résultats en quelques secondes ou moins.

Un autre exemple d'un type d'application non-batch est Storm, qui peuvent analyser les données de transmission en continu. Ce concept est complètement différent de soit MapReduce ou Tez, deux qui fonctionnent avec des données qui est déjà persisté sur le disque - en d'autres termes, les données au repos. Tempête traite les données qui n'a pas encore été stockée sur le disque - plus spécifiquement, des données qui est continu dans le réseau d'une organisation. Ce sont des données en mouvement, en d'autres termes.

Dans les deux cas, les objectifs et le streaming interactifs-traitement des données ne seraient pas fonctionner si Maîtres d'application doivent être instancié, avec tous les conteneurs nécessaires. Que FILS permet ici est le concept d'un service continu (une session), où il est un maître de l'application dédiée qui reste en vie, en attendant de coordonner les demandes. Le Maître de l'application a également baux ouvertes sur des contenants réutilisables pour exécuter toutes les demandes dès qu'ils arrivent.


» » » » Applications en temps réel et en streaming dans Hadoop