Hadoop之资源调度器与任务推测执行
生活随笔
收集整理的這篇文章主要介紹了
Hadoop之资源调度器与任务推测执行
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
Hadoop之資源調(diào)度器
目錄
1. 資源調(diào)度器概述
目前,Hadoop作業(yè)調(diào)度器主要有三種:FIFO、Capacity Scheduler和Fair Scheduler。Hadoop2.7.2默認(rèn)的資源調(diào)度器是Capacity Scheduler。
具體設(shè)置詳見:yarn-default.xml文件
<property><description>The class to use as the resource scheduler.</description><name>yarn.resourcemanager.scheduler.class</name> <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value> </property>2. 先進(jìn)先出調(diào)度器(FIFO)
先進(jìn)先出調(diào)度器(FIFO),如下圖所示
3. 容量調(diào)度器(Capacity Scheduler)
容量調(diào)度器(Capacity Scheduler),如下圖所示
4. 公平調(diào)度器(Fair Scheduler)
公平調(diào)度器(Fair Scheduler),如下圖所示
5. 任務(wù)的推測執(zhí)行
作業(yè)完成時間取決于最慢的任務(wù)完成時間
一個作業(yè)由若干個Map任務(wù)和Reduce任務(wù)構(gòu)成。因硬件老化、軟件Bug等,某些任務(wù)可能運行非常慢。
典型案例:系統(tǒng)中有99%的Map任務(wù)都完成了,只有少數(shù)幾個Map老是進(jìn)度很慢,完不成,怎么辦?
推測執(zhí)行機(jī)制
發(fā)現(xiàn)拖后腿的任務(wù),比如某個任務(wù)運行速度遠(yuǎn)慢于任務(wù)平均速度。為拖后腿任務(wù)啟動一個備份任務(wù),同時運行。誰先運行完,則采用誰的結(jié)果。
執(zhí)行推測任務(wù)的前提條件
總結(jié)
以上是生活随笔為你收集整理的Hadoop之资源调度器与任务推测执行的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop之Yarn工作机制详解
- 下一篇: Hadoop之Hadoop企业优化(HD