map端join和reduce端join的区别
生活随笔
收集整理的這篇文章主要介紹了
map端join和reduce端join的区别
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
MapReduce Join
MapJoin和ReduceJoin區別及優化
maptask處理后寫到本地,如果再到reduce,又涉及到網絡的拷貝。
map端join最大優勢,可以提前過濾不需要的數據。
如對于20G左右的文件,可以用2個job來處理:
一個mapreduce進行數據過濾,
另一個mapreduce進行計算。
轉載于:https://www.cnblogs.com/pingzizhuanshu/p/9129023.html
總結
以上是生活随笔為你收集整理的map端join和reduce端join的区别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Observer(订阅与发布)
- 下一篇: kbmmw 5.06.00 beta 发