MapReduce在处理数据方面的优点如下:
第一, 这个模型非常方便使用,即使是对于完全没有分布式程序的程序员也是如此。它隐藏了并行计算的细节,错误容灾,本地优化以及负载均衡。MapReduce运行开发人员使用自己熟悉的语言进行开发,如Java,C#,Python,C++等等。
第二, 对于大型的计算需求使用MapReduce可以非常轻松的完成。
比如说, Google使用MapReduce来提供网页搜索服务,排序,数据挖掘,机器学习,以及其他系统。
第三, 通过MapReduce,应用程序可以在超过1000个节点的大型集群上运行,并且提供经过优化的错误容灾。
关于MapReduce推荐的阅读链接:
http://en.wikipedia.org/wiki/MapReduce
http://labs.google.com/papers/mapreduce.html