Hadoop-2.2.0学习之三YARN简介
MapReduce在hadoop-0.23版本中進行了完全的檢查修改,并發展為了現在稱之為的MapReduce2.0(MRv2)或者YARN。YARN的基本想法是將JobTracker的兩個主要功能資源管理和作業調度監控分開為獨立的后臺進程,目標是擁有一個全局ResourceManager (RM)和每個應用程序一個的ApplicationMaster (AM)。一個應用程序或者是從經典MapReduce作業角度來看的一個單獨作業,或者是這種作業的一個有向無環圖(DAG)
ResourceManager和從節點的NodeManager(NM)組成了數據計算框架,ResourceManager是協調系統中所有應用程序之間資源的最終權威。事實上,ApplicationMaster是框架特定的類庫,任務是從ResourceManager協調資源以及同NodeManager一起工作進行任務的執行和監控。下圖為YARN的架構示意圖。
ResourceManager有兩個主要的組件:調度器(Scheduler)和應用程序管理器(ApplicationsManager)。
調度器負責在各種運行的,受制于計算機容量、隊列等約束條件的應用程序之間分配資源。調度器在某種意義上是純的調度器,因為它不監控或者跟蹤應用程序的狀態,并且不提供重啟失敗任務的保證,無論任務失敗是由于應用程序還是硬件問題。調度器在應用程序對資源的需求基礎上執行調度功能,這樣做是基于resourceContainer 的抽象概念,resourceContainer 整合了內存、CPU、硬盤、網絡等。在第一個版本中,resourceContainer 只包
總結
以上是生活随笔為你收集整理的Hadoop-2.2.0学习之三YARN简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop学习之HDFS架构(二)
- 下一篇: Hadoop-2.2.0学习之二HDFS