1、MapReduce 易於編程
它簡單的實現一些接口,就可以完成一個分佈式程序,這個分佈式程序可以分布到大量廉價的機器上運行。也就是說你寫一個分佈式程序,跟寫一個簡單的串行程序是一模一樣的。就是因為這個特點使得MapReduce編程變得非常流行。
2、良好的擴展性
當你的計算資源不能得到滿足的時候,你可以通過簡單的增加機器來擴展它的計算能力。
3、高容錯性
MapReduce設計的初衷就是使程序能夠部署在廉價的機器上,這就要求它具有很高的容錯性。比如其中一臺機器掛了,它可以把上面的計算任務轉移到另外一個節點上運行,不至於這個任務運行失敗,而且這個過程不需要人工參與,而完全是由Hadoop內部完成的。
4、適合PB級以上海量數據的離線處理
可以實現上千臺服務器集群併發工作,提供數據處理能力。
1、MapReduce 易於編程
它簡單的實現一些接口,就可以完成一個分佈式程序,這個分佈式程序可以分布到大量廉價的機器上運行。也就是說你寫一個分佈式程序,跟寫一個簡單的串行程序是一模一樣的。就是因為這個特點使得MapReduce編程變得非常流行。
2、良好的擴展性
當你的計算資源不能得到滿足的時候,你可以通過簡單的增加機器來擴展它的計算能力。
3、高容錯性
MapReduce設計的初衷就是使程序能夠部署在廉價的機器上,這就要求它具有很高的容錯性。比如其中一臺機器掛了,它可以把上面的計算任務轉移到另外一個節點上運行,不至於這個任務運行失敗,而且這個過程不需要人工參與,而完全是由Hadoop內部完成的。
4、適合PB級以上海量數據的離線處理
可以實現上千臺服務器集群併發工作,提供數據處理能力。