spark mapreduce术语梳理
生活随笔
收集整理的這篇文章主要介紹了
spark mapreduce术语梳理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
計算層、存儲層、資源管理。
往哪存,資源夠不夠。
hive不存數據,也不算數據,只是產生mr的工具。hive最值錢的是metastore,存儲到存儲層。
mr的并行計算流程梳理:
1個app對應1個job
1個job1-2個stage:可能只是過濾,不進行統計。最多2個stage
1個stage對應n個task
多個job組成作業鏈
總結
以上是生活随笔為你收集整理的spark mapreduce术语梳理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Spark on YARN cluste
- 下一篇: 阿里公共DNS正式发布:223.5.5.