用户同步管理及集群初始配置-集群搭建步骤7
????????前面的幾個步驟執(zhí)行完之后,集群就已經(jīng)創(chuàng)建好了初步的分區(qū),如下所示:
????????STATE為idle證明所有節(jié)點上的slurmd服務(wù)狀態(tài)是正常,但此時用戶還無法利用slurm提交作業(yè),還需要對集群進行初始化配置以及創(chuàng)建用戶,并把用戶同步到所有的計算節(jié)點。
1、集群添加account
????????account屬性是slurm用戶在提交作業(yè)時需要配置的屬性之一,用于作業(yè)記賬使用。集群在初始化時,需添加系統(tǒng)的account,用戶提交作業(yè)時的可不指定account屬性,因為系統(tǒng)中有默認(rèn)的account。
創(chuàng)建集群名字,如果在slurmdbd.conf文件中已經(jīng)指定了cluster,那么這一步不需要執(zhí)行,系統(tǒng)會自動創(chuàng)建。
sacctmgr add cluster hgy在集群中添加account屬性:
sacctmgr add account normal Description="Default account"此時normal會作為系統(tǒng)中存在的account屬性之一存在,如果創(chuàng)建用戶時指定了默認(rèn)的account為normal,那么用戶在提交作業(yè)時無需指定account屬性,將會自動以normal的account進行提交。當(dāng)然也可以為集群添加多個account。
2、用戶同步
? ? ? ?由于集群中存在多個計算節(jié)點,那么提交作業(yè)時,所有的計算節(jié)點都必須存在此用戶賬戶,并且UID需保持一致。因此在創(chuàng)建用戶時需指定用戶的UID,并且把用戶信息同步到所有的計算節(jié)點。此處推薦有條件的用戶采用ldap作為用戶認(rèn)證管理工具,適合集群上的用戶認(rèn)證機制,此次由于集群較小,沒有使用ldap。
UIDNOW=1300 useradd test -p test -d /public/home/$1 -u ${UIDNOW} -s /bin/bash scp /etc/passwd /etc/shadow /etc/group cn02:/etc/ scp /etc/passwd /etc/shadow /etc/group cn03:/etc/ scp /etc/passwd /etc/shadow /etc/group cn04:/etc/ scp /etc/passwd /etc/shadow /etc/group cn05:/etc//etc/passwd: 存儲用戶UID等相關(guān)信息的文件。
/etc/shadow: 存儲用戶密碼信息的文件
/etc/group: 存儲用戶組信息的文件。
把這三個文件同步到其他節(jié)點之后,就可以保證所有節(jié)點的用戶是一致的。
3、添加linux系統(tǒng)用戶到slurm中
? ? ? ? 雖然系統(tǒng)中存在了test用戶,但是slurm自己本身并無法識別test用戶,因此必須在slurm中添加test用戶:????????
sacctmgr -i add user test DefaultAccount=normal注意必須指定:DefaultAccount屬性,同時在管理節(jié)點的slurm.conf配置文件中需開啟如下配置:
AccountingStorageEnforce=associations用戶此時便可利用默認(rèn)的account或者指定其他的account進行提交作業(yè)。
4、提交作業(yè)
? ? ? ? 不指定-A 參數(shù),則以默認(rèn)的normal屬性提交
srun -n 10 hostname? ? ? ? 指定-A參數(shù),則以其他的記賬屬性提交
srun -A otheraccount -n 10 hostname? ? ? ? 其他常用命令請參考slurm官方網(wǎng)站。
總結(jié)
以上是生活随笔為你收集整理的用户同步管理及集群初始配置-集群搭建步骤7的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1-13 格式化输出
- 下一篇: Android 求时间差