Big data et les origines de MapReduce

MapReduce est de plus en plus utile pour les gros volumes de données. Au début des années 2000, certains ingénieurs de Google sont penchés sur l'avenir et a déterminé que pendant que leurs solutions actuelles pour des applications telles que ramper web, la fréquence de requête, et ainsi de suite étaient suffisants pour la plupart des exigences actuelles, ils étaient insuffisantes pour la complexité qu'ils prévoyaient que la Web mise à l'échelle de plus en plus d'utilisateurs.

Ces ingénieurs ont déterminé que si le travail peut être réparti sur les ordinateurs peu coûteux et ensuite connecté sur le réseau sous la forme d'un “ cluster, ” ils pourraient résoudre le problème. Répartition seul était pas une réponse suffisante. Cette répartition du travail doit être effectué en parallèle pour les trois raisons suivantes:

  • Le traitement doit être en mesure d'élargir et contracter automatiquement.




  • Le traitement doit être en mesure de procéder indépendamment de défaillances dans le réseau ou les systèmes individuels.

  • Développeurs tirant parti de cette approche doivent être en mesure de créer des services qui sont faciles à exploiter par d'autres développeurs. Par conséquent, cette approche doit être indépendant de l'endroit où les données et les calculs ont signé.

MapReduce a été conçu comme un modèle de programmation générique. Certaines des premières implémentations fournies à toutes les exigences clés de l'exécution en parallèle, la tolérance aux pannes, équilibrage de charge, et la manipulation de données. Les ingénieurs en charge du projet nommé MapReduce d'initiative, car il combine deux capacités de langages informatiques fonctionnelles existant: carte et réduire.

Les ingénieurs de Google MapReduce conçus pour résoudre un problème pratique spécifique. Par conséquent, il a été conçu comme un modèle de programmation combinée à la mise en œuvre de ce modèle - en substance, une implémentation de référence.

La mise en œuvre de référence a été utilisé pour démontrer la faisabilité et l'efficacité du concept et pour aider à assurer que ce modèle serait largement adopté par l'industrie informatique. Au fil des ans, d'autres implémentations de MapReduce ont été créés et sont disponibles à la fois open source et des produits commerciaux.


» » » » Big data et les origines de MapReduce