Hadoop学习之Hadoop集群的定制配置(二)
除了上篇博客介紹的管理hadoop后臺進程的參數外,還有其它一些參數或者功能用于管理hadoop的運行方式,比如任務的啟動與控制、TaskTracker節點的監控等。
先看看hadoop的任務控制器。任務控制器是MapReduce框架中定義用戶的map和reduce任務如何啟動和控制的一些類。任務控制器可以在要求定制用戶任務的啟動過程或者控制過程的集群中使用,比如,在某些集群中,可能要求以提交作業的用戶運行任務,而不是作為任務跟蹤器用戶,后者是任務如何啟動的默認方式。在hadoop中有兩個任務控制器可以使用,它們是DefaultTaskController和LinuxTaskController,對應的類分別為org.apache.hadoop.mapred.DefaultTaskController和是org.apache.hadoop.mapred.LinuxTaskController。DefaultTaskController是Hadoop中的默認任務控制器,任務作為任務追蹤器用戶運行。LinuxTaskController作為提交作業的用戶運行任務,只被Linux支持,要求用戶賬號在任務啟動的集群節點上被創建。LinuxTaskController使用包含在Hadoop版本中的setuid可執行文件,TaskTracker使用該可執行文件啟動和殺死任務。該setuid可執行文件切換到提交作業的用戶啟動或者殺死任務。為了最大的安全性,該任務控制器建立了受限制的訪問權限和被任務使用的本地文件和目錄的用戶/組所有權,這些文件諸如作業的jar文件,中間文件,任務日志文件和分布式緩存文件。需要注意的是,除了作業的擁有者和TaskTracker,其它用戶都不能訪問任何本地文件和目錄,包括那些本地化為分布式緩存一部分的文件和目錄。
任務控制器可以在m
總結
以上是生活随笔為你收集整理的Hadoop学习之Hadoop集群的定制配置(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop学习之Hadoop集群的定制
- 下一篇: Hadoop学习之以全分布模式部署及问题