Centos 6/7安装Torque(单节点)
Centos 6/7安裝Torque(單節點)**
1、 簡介
PBS(Portable Batch System)最初由NASA的Ames研究中心開發,主要為了提供一個能滿足異構計算網絡需要的軟件包單節點,用于靈活的批處理,特別是滿足高性能計算的需要,如集群系統、超級計算機和大規模并行系統。
PBS是功能最為齊全, 歷史最悠久, 支持最廣泛的本地集群調度器之一。PBS的主要特點有:代碼開放,免費獲取;支持批處理、交互式作業和串行、多種并行作業,如MPI、PVM、HPF、MPL。
PBS的目前包括:openPBS, PBS Pro和Torque三個主要分支.
應用PBS提交任務則會形成任務隊列,依次執行,有效分配資源,避免資源競爭。否則CPU時間片會輪流分配給各個人的任務,從而影響所有人的正常作業。本文主要說明Torque的安裝與配置,通過編譯源代碼的方式安裝torque由于整個torque都被安裝在一臺計算機上,所以上述pbs_server、pbs_mom和pbs_sched都會被安裝在一起。
Torque主要由三個主要部件組成:
2、軟件獲取
| torque-6.1.1.1 | http://wpfilebase.s3.amazonaws.com/torque/torque-6.1.1.1.tar.gz |
| torque-6.1.2 | http://wpfilebase.s3.amazonaws.com/torque/torque-6.1.2.tar.gz |
| 官網下載 | http://www.adaptivecomputing.com/support/download-center/torque-download |
注:不同版本的安裝和配置類似,本文以torque-6.1.1.1為例。
3、系統信息的查詢
3.1 計算機核數查詢
lscpu: 此命令用來顯示cpu的相關信息(lscpu從sysfs和/proc/cpuinfo收集cpu體系結構信息)
主要信息:
CArchitecture: #架構PU(s)
Thread(s) per core: #每個核心線程
Core(s) per socket: #每個CPU物理核數
CPU socket(s): #cpu插槽數
Vendor ID: #cpu廠商ID
CPU family: #cpu系列
Model: #型號
Stepping: #步進
CPU MHz: #cpu主頻
Virtualization: #cpu支持的虛擬化技術
注:總的Threads數量(CPU邏輯核數) = 2(Sockets) × 4(Core(s)) × 2(Threads) = 16(CPU(s)).
或者用nproc直接查看邏輯核數。
[root@master ~]# nproc 163.2 系統IP和主機名查詢
hostname: 此命令用來顯示主機名稱。(默認主機名為:localhost)
ifconfig -a|grep “inet addr”:此命令用來顯示主機IP。
3.3 更改主機名稱
CentOS 6 :
需要更改兩處:一處是/etc/sysconfig/network,另一處是/etc/hosts,只修改任一處會導致系統啟動異常,需要保持兩處一致。更改時需要切換到root用戶。
更改HOSTNAME=后的內容為master
[root@master ~]# vi /etc/hosts 127.0.0.1 master ###添加到此處##### 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6在首行添加:“127.0.0.1 master” 或者 “主機IP master"。
注意:修改上面兩個文件是永久的,重啟系統后才生效。
CentOS 7:
可以直接用命令修改:
注意:這也是永久生效,但是不會立刻生效,需重啟。
為避免重新啟動可用“hostname”臨時修改主機名:
master主機名立刻生效,但它只是臨時地修改主機名,系統重啟后會恢復原樣的。
4 、安裝和配置Torque
4.1 安裝Torque運行環境和依賴庫
[root@master ~]# yum install libxml2-devel openssl-devel gcc gcc-c++ boost-devel libtool-y4.2 Torque下載與解壓
[root@master ~]# wget http://wpfilebase.s3.amazonaws.com/torque/torque-6.1.1.1.tar.gz [root@master ~]# tar zxvf torque-6.1.1.1.tar.gz [root@master ~]# cd torque-6.1.1.14.2 Torque編譯與安裝
[root@master torque-6.1.1.1]# ./configure --prefix=/usr/local/torque --with-scp --with-default-server=master [root@master torque-6.1.1.1]# make -j [root@master torque-6.1.1.1]# make install [root@master torque-6.1.1.1]# make packages [root@master torque-6.1.1.1]# ./libtool --finish /usr/local/torque/lib注意:prefix設置安裝路徑,with-default-server設置主機名,packages(打包)是為了方便于其他節點安裝
4.3 Torque配置
將contrib/init.d/目錄下的pbs_server、pbs_sched、pbs_mom、trqauthd添加到系統初始化簡腳本/etc/init.d/中,并設置為開機啟動。
[root@master torque-6.1.1.1]# cp contrib/init.d/{pbs_{server,sched,mom},trqauthd} /etc/init.d/ [root@master torque-6.1.1.1]# for i in pbs_server pbs_sched pbs_mom trqauthd; do chkconfig --add $i; chkconfig $ion; done設置環境變量。
[root@master torque-6.1.1.1]# vi /etc/profile.d/torque.shTORQUE=/usr/local/torque export PATH=$PATH:/usr/local/torque/bin:/usr/local/torque/sbin ###添加后保存### [root@master torque-6.1.1.1]# source /etc/profile [root@master torque-6.1.1.1]# echo '/usr/local/lib' > /etc/ld.so.conf.d/torque.conf [root@master torque-6.1.1.1]# ldconfig注意:ldconfig命令的用途主要是在默認搜尋目錄/lib和/usr/lib以及動態庫配置文件/etc/ld.so.conf內所列的目錄下,搜索出可共享的動態鏈接庫(格式如lib.so),進而創建出動態裝入程序(ld.so)所需的連接和緩存文件。如果沒有這一步可能會出現libtorque.so.2庫文件找不到錯誤。
將root設為Torque的管理賬戶
[root@master torque-6.1.1.1]# ./torque.setup root安裝mom、client
[root@master torque-6.1.1.1]# ./torque-package-mom-*.sh --install [root@master torque-6.1.1.1]# ./torque-package-clients-*.sh --install設置Torque(工作目錄為/var/spool/torque/)
a)設置服務器名:編輯/var/spool/torque/server_name文件
b)設置機群所有機器名和設置計算總核數:編輯/var/spool/torque/server_priv/nodes文件
[root@master torque-6.1.1.1]# vi /var/spool/torque/server_priv/nodesmaster np=16c)設置MOM進程配置文件:編輯 /var/spool/torque/mom_priv/config文件
[root@master torque-6.1.1.1]# vi /var/spool/torque/mom_priv/config$pbsserver master$logevent 255啟動pbs_server、pbs_sched、pbs_mom、trqauthd幾個服務
[root@master torque-6.1.1.1]# for i in pbs_server pbs_sched pbs_mom trqauthd; do service $i start; done查看運行情況
[root@master torque-6.1.1.1]# ps -e | grep pbs2800 ? 00:00:23 pbs_mom2968 ? 00:00:00 pbs_sched3277 ? 00:00:05 pbs_server創建設置作業隊列
[root@master torque-6.1.1.1]# qmgr Max open servers: 9 Qmgr: create queue test Qmgr: set queue test queue_type = execution Qmgr: set queue test started = true Qmgr: set queue test enabled = true Qmgr: set queue test resources_default.walltime = 240:00:00 Qmgr: set queue test resources_default.nodes = 1 Qmgr: set server default_queue = test Qmgr: exit [root@master torque-6.1.1.1]#qstat -q ###查看隊列信息### server: masterQueue Memory CPU Time Walltime Node Run Que Lm State ---------------- ------ -------- -------- ---- --- --- -- ----- test -- -- -- -- 6 0 -- E R batch -- -- -- -- 0 0 -- E R----- -----6 0注意:創建的隊列名稱為test
查看節點的狀態信息
切換到user用戶提交任務
[root@master torque-6.1.1.1]# su user [user@master torque-6.1.1.1]$ echo sleep 30 | qsub 1.master [user@master torque-6.1.1.1]$ qstat Job ID Name User Time Use S Queue ------------------------- ---------------- --------------- -------- - ----- 1.master STDIN user 0 R test [luys@master torque-6.1.1.1]$ qstat -amaster: Req'd Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time ----------------------- ----------- -------- ---------------- ------ ----- ------ --------- --------- - --------- 1.master user test STDIN 29590 1 1 -- 240:00:00 R 00:02:03至此安裝成功!!!
總結
以上是生活随笔為你收集整理的Centos 6/7安装Torque(单节点)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Code pratice】—— 成绩统
- 下一篇: 五年级上册数学计算机和应用题,2017五