AIX小机更换硬盘
IBM小機更換硬盤步驟
步驟:
因為一些客戶的環境有的很不規范,經常會有很多后建的lv沒有做mirror,強行更換會丟失數據,所以在工作的時候一定要做好檢查確認工作。
一般客戶都是裝好系統后對rootvg做mirror,但后期客戶可能自行添加一些lv,這些lv不會被自動mirror,需要用smitty? mklvcopy手工做mirror
?
特別注意AIX里面的操作界面,在不同的telnet客戶端的熱鍵會有區別
F3 返回上一級菜單,對應按鍵是ESC+3
F10 直接退回到#下,對應按鍵是ESC+0
?
?
?下面的操作步驟看上去很繁瑣,因為增加了很多輔助的檢查工作,確保更換安全可靠。
特別注意,在執行操作前,一定要用prtconf|pg命令確認要更換硬盤的機器的型號序列號,千萬不要登錯了機器。結合hostname和errpt命令判斷是不是這臺機器要更換硬盤
使用lsvg –p rootvg命令可以查看rootvg里的硬盤pv狀態是否正常
注意正常的pv狀態都應該是active,有些可能是remove或missing,這個狀態的pv硬盤肯定是不正常的。上面圖示的正常的,但是某些情況下即使是active硬盤也可能有問題,比如不能新建lv寫入數據,會在errpt里面報錯。
?
2、使用diag工具,先找到要更換的硬盤,比如hdisk1(hdiks0操作是一樣的)
執行diag回車,第一個提示界面回車,看到如下界面,光標移動到task這行上回車
?
?
3、新界面移動光標到hot plug task回車
?
4、光標移動到scsi and scsi raid hot plug manager回車
?
5、光標移動到identify這行回車
?
6、可以看到類似如下的界面,里面顯示了hdisk1,光標移動到hdisk1上回車
回車后會彈出一個小窗口,不要動
7、這個時候到機器上看哪塊硬盤在閃燈,這個閃燈的硬盤就是要找的硬盤。
在按一下鍵閃燈結束。
8、執行命令lsvg–l rootvg,來確認是不是所有的lv都被mirror
可以看到類似如下的界面,注意看LPs? 和PPs列的數值比應該是1:2,說明兩塊硬盤做了mirror。
[root@hxpc_server2]/ #lsvg -l rootvg
rootvg:
LV NAME???????????? TYPE????? ?LPs?? PPsPVs? LV STATE????? MOUNT POINT
hd5???????????????? boot????? ?1???? 2 ????2??? closed/syncd? N/A
hd6???????????????? paging???? 32??? 64??? 2??? open/syncd??? N/A
hd8???? ????????????jfs2log??? 1???? 2???? 2??? open/syncd??? N/A
hd4???????????????? jfs2?????? 8???? 16??? 2??? open/syncd??? /
hd2???????????????? jfs2?????? 35??? 70??? 2??? open/syncd??? /usr
hd9var????????????? jfs2?????? 8???? 16??? 2??? open/syncd??? /var
hd3???????????????? jfs2?????? 12??? 24??? 2??? open/syncd??? /tmp
hd1???????????????? jfs2?????? 16??? 32??? 2??? open/syncd??? /home
hd10opt???????????? jfs2?????? 8???? 16??? 2??? open/syncd??? /opt
fwdump????????????? jfs2?????? 2???? 4???? 2??? open/syncd??? /var/adm/ras/platform
特別要注意下面的部分
所有rootvg里邏輯卷LPs與PPs的比例都應該是1:2,如果有邏輯卷的比例是1:1,說明這個邏輯卷沒有被mirror,如果這個lv在壞盤上,那需要遷移到好盤。
注意有一個特殊的邏輯卷例外lg_dumplv,這個不會被mirror,比如下面的例子,1:1是正常的
lg_dumplvsysdump??? 8?????? 8?????? 1??? open/syncd??? N/A
?
?
lspv–l hdisk0? 檢查hdisk0上有哪些lv
lspv–l hdisk1? 檢查hdisk1上有哪些lv
上面的兩個輸入做比對,檢查沒有實現mirror的lv在哪塊硬盤上,如果在需要更換的壞盤hdisk1上,那么需要使用下面的命令將存在壞盤上的lv遷移到hdisk0好盤上
migratepv–l 邏輯卷名字? hdisk1 hdisk0????? (邏輯卷的名字是lsvg–l 看到的第一列,類似fslv00)
注意有些情況下migratepv會提示不能遷移,這個時候不要往下做了,申請二線支持。
?
如果沒有被mirror的lv存儲在好盤上,那么繼續。
確保好盤上有所有的lv后
9、執行命令unmirrorvgrootvg hdisk1?? 拆除mirror ,要換哪塊盤后面就輸入哪塊盤號
注意,在執行命令操作的時候(包括下面的命令步驟)經常會提示需要手工執行savebase,那么執行一條命令后就執行一次savebase,這個命令執行完沒有顯示。
執行了unmirrorvg后執行lsvg–l rootvg 驗證是否現在所有lv的比例已經是1:1了
執行lspv–l hdisk0? 查看hdisk0上的信息
執行lspv–l hdisk1查看hdisk1上的lv信息,因為本例是拆除hdisk1,所以這個時候hdisk1上應該已經沒有lv了
?
10、執行命令reducevg–d rootvg hdisk1??? 從rootvg踢出壞盤hdisk1
特別注意如果要踢出的硬盤上如果還有lv數據,會提示是否刪除,這個時候要確認提示要刪除的lv是否還有用。
如果是踢出hdisk0,那么執行下面的操作
注意,一般lg_dumplv會存在hdisk0上,如果是踢出hdisk0會提示刪除lg_dumplv,可以選擇y刪除,這個lv可以刪除,沒有這個lv系統可以正常啟動,運行也不會出現問題,只是沒有了dump device,為了保險在reduce hdisk0前執行下面的操作
?sysdumpdev -P -p /dev/sysdumpnull修改主dump設備指向為null
在踢出hdisk0的時候會提示是否刪除lv,輸入y刪除。
?
?
?
10、執行命令rmdev–dl hdisk1????
?從系統刪除硬盤
lspv
檢查是否已經看不到hdisk1了
?
11、拔掉硬盤,插上新硬盤
具體的硬盤位置已經用diag確認好,別拔錯。
12、執行命令
cfgmgr–v? 重新掃描硬件
?
13、lspv查看是否重新認出了hdisk1
如果新識別的硬盤沒有識別出pvid,就是第二列只看到none,沒有16位的pvid字符串,
可以執行chdev–l hdisk1 –a pv=yes? 設置出pvid,
在lspv檢查一下是否有了pvid,比如下面lspv例子的第二列的長字符串就是pvid,剛識別出的硬盤后面的vg部分會顯示none
14、extendvg rootvg hdisk1?
將新硬盤加入rootvg
這個時候lspv能看到新加的硬盤后面是rootvg? active了
15、mirrorvg? -S? rootvg hdisk1
重新做mirror,加了-S參數mirror會自動在后臺運行,會從老硬盤讀取數據寫入到新換上的硬盤上,1-2個小時應該會自動做完。這個時候不用等待,直接進行下面16的操作就可以了
可以執行topas命令,可以看到hdisk0和hdisk1的讀寫操作會很busy。
執行lsvg–l rootvg 可以看到lv的LPS和PPs的比例是1:2了。
16、還需要執行下面的命令
bosboot–ad hdisk1? 將hd5引導映像寫入兩塊磁盤。
?
bootlist–m normal? hdisk0 hdisk1?? 設置引導順序
bootlist–m normal –o可以看到剛才設置的引導順序
?
如果前面是更換的hdisk0,并且刪除了lg_dumplv
那么執行mklv -t sysdump -y lg_dumplv rootvg 8 hdisk0? (注意這個8根據更換前lsvg–l看到的lg_dumplv的大小確認,原來多大還建多大)
?執行sysdumpdev -Pp /dev/lg_dumplv修改主dump設備指向到lg_dumplv
?
18、清除黃燈
Diag命令
進入task。。。。。
找到log rapir
找到op panel? 按回車,前面會出現+號,按F7(有些終端需要按ESC+7),執行成功后服務器面板黃燈熄滅。
或者使用: /usr/lpp/diagnostics/bin/usysfault -s normal
19、操作完成。
?
總結
- 上一篇: aix 查看防火墙状态_AIX防火墙策略
- 下一篇: [下载演讲稿]数字藏品与元宇宙存储—数字