Spark基本工作流程和作业调度
生活随笔
收集整理的這篇文章主要介紹了
Spark基本工作流程和作业调度
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
基本工作流程
作業調度
作業調度關系圖
- Application(應用程序):Spark應用程序由一個或多個作業組成
- Job(作業):由一個RDD Action 生成一個或多個調度階段所組成的一次計算作業
- Stage(調度階段):一個任務集多對應的調度階段。Stage的劃分是根據寬依賴(shuffle操作)來劃分的
- TaskSet(任務集):由一組關聯的,但互相之間沒有shuffle依賴關系的任務所組成的任務集
- Task(任務):單個分區數據集上的最小處理流程單元
作業調度具體流程
總結
以上是生活随笔為你收集整理的Spark基本工作流程和作业调度的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于图神经网络的图像分类,遥感图像分析
- 下一篇: 盘点人工智能高薪职位