检測磁盘驱动的健康程度SMART
在server中,全部組件中一般最easy壞掉的就是磁盤。所以一般採取RAID來保證系統(tǒng)的穩(wěn)定性,通過冗余磁盤的方式防止磁盤故障。
現(xiàn)代硬件驅(qū)動器一般支持SMART(自我監(jiān)測分析和報告技術(shù)),它可以監(jiān)視整個硬盤驅(qū)動器的健康狀況。而且當(dāng)硬盤驅(qū)動器即將故障的時候會發(fā)出警告。
一般硬件廠商提供的磁盤工具,是在系統(tǒng)重新啟動后檢查磁盤驅(qū)動的健康狀況,而SMART能夠不用重新啟動系統(tǒng)就能夠檢查硬盤驅(qū)動器的健康程度。
在linux中,工具包的名字為smartmontools
在centos中能夠使用yum install smartmontools來安裝工具
首先通過smartctl -i /dev/sda 來檢查一下硬盤是否具有 SMART 特性
以下是smart工具的說明文檔,里面有具體的說明
http://smartmontools.sourceforge.net/smartmontools_scsi.html
這個是我在虛擬機(jī)中測試的不支持
這個是我在真server中測試的,支持
<img src="http://img.blog.csdn.net/20140718221304502?
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFwZW5nMDExMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
SMART support 是 Disabled 狀態(tài)的話,須要開啟 SMART 的支持:
smartctl -s on /dev/sda
然后使用smartctl -H /dev/sda來檢測磁盤的健康狀況
查看/dev/sda當(dāng)前總體監(jiān)控狀態(tài)。PASSED表示健康。否則意味著磁盤已經(jīng)故障。或非常快就會發(fā)生問題。
使用
smartctl -t short /dev/sda
做一個高速自檢
smartctl -l selftest /dev/sda
查看自檢的進(jìn)度和結(jié)果
使用smartctl -t long /dev/sda 做長時間自檢,這個非常耗時,一般放在凌晨
使用smartctl -l error /dev/sda查看出錯日志
<img src="http://img.blog.csdn.net/20140719152542515?
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFwZW5nMDExMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
在這里,我的讀、寫都沒有錯誤發(fā)生。在Non-medium error count 中出現(xiàn)錯誤6。
我一直沒有搞懂(非媒介錯誤計數(shù))這個是什么意思。在官方文檔查了一下。出現(xiàn)例如以下:
non-medium error counter (only a single number displayed). This represents the number of recoverable events other than write, read or verify errors.
我大致理解了一下,是除了read,write,verify errors的錯誤,可恢復(fù)事件的數(shù)量
查看全部信息
打印/dev/sda全部的SMART信息。
smartctl -a /dev/sda
相當(dāng)于依次運行:
smartctl –i /dev/sda
smartctl -c /dev/sda
smartctl -A /dev/sda
smartctl -l error /dev/sda
smartctl -l selftest /dev/sda
smartctl -l selective /dev/sda
開/關(guān)SMART功能
打開或關(guān)閉/dev/sda 的SMART功能。
smartctl -s on/off /dev/sda
查看當(dāng)前SMART功能是否開啟,能夠使用 –i 參數(shù)。
smartctl -i /dev/sda
離線測試
對/dev/sda進(jìn)行離線測試,它的結(jié)果主要用來更新SMART 屬性。
smartctl -t offline /dev/sda
觀察測試進(jìn)度
通過-c 參數(shù)。能夠觀察到測試的進(jìn)度:
smartctl -c /dev/sda
smartctl參數(shù)幫助
-h 幫助信息
-V 版本號信息
-i 打印基本信息(磁盤設(shè)備號、序列號、固件版本號…)
-a 打印磁盤全部的SMART信息
執(zhí)行時行為 參數(shù):
-q TYPE 指定輸出的安靜模式。
TYPE能夠有3種選擇:
eorsonly 僅僅打印錯誤日志。
slent 有不論什么打印。
nserial 不打印序列號
-d TYPE 指定磁盤的類型。
假設(shè)沒有指定,smartctl會依據(jù)磁盤的名字來
推測磁盤類型。
-T TYPE 指定當(dāng)錯誤發(fā)生時,smartctl的容忍程度,是否繼續(xù)執(zhí)行。
TYPE能夠有4種選擇:
conservative 一有錯就會退出
normal 假設(shè)必須支持的SMART命令失敗,則退出
permissive 忽略一次必須支持的SMART命令失敗
verypermissive 忽略全部必須支持的SMART命令失敗
-b TYPE 指定當(dāng)發(fā)生校驗錯誤時,smartctl的動作。
TYPE有3種選擇:
warn 發(fā)出警告,繼續(xù)運行
exit 退出smartctl
ignore 不發(fā)出告警。繼續(xù)運行
-r TYPE smartmontools開發(fā)者相關(guān)。
-n POWERMODE 指定當(dāng)磁盤處于節(jié)能模式時。smartctl是否繼續(xù)檢查。
默認(rèn)是不檢查。
POWERMODE有4種選擇:
never 檢查
sleep 除了sleep模式,檢查。
standby 除了sleep或standby模式,檢查。
idle 除了sleep或standby或idle模式,見車。
SMART功能開關(guān) 參數(shù):
-s on/off 打開或關(guān)閉磁盤的SMART功能
-o on/off 打開或關(guān)閉SMART自己主動離線檢測。該功能每4小時就會自己主動掃描磁盤是
否有缺陷。
-S on/off 打開或關(guān)閉“自己主動保存廠商指定屬性”功能。
SMART 讀和顯示數(shù)據(jù) 參數(shù)
-H 報告磁盤的是否健康。假設(shè)報告不健康,則說明磁盤已經(jīng)損壞或會在24小時
內(nèi)損壞。
-c 顯示磁盤支持的普通SMART功能,以及這些功能當(dāng)前的狀態(tài)。
-A 顯示磁盤支持的廠商指定SMART特性。這些特性的編號從1-253,而且有指
定的名字。
-l TYPE 指定顯示的log類型。
TYPE有4種選擇:
error 僅僅顯示error log。
selftest 僅僅顯示selftest log
selective 僅僅顯示selective self-test log
directory 僅僅顯示Log Directory
-v N,OPTION 顯示廠商指定SMART特性N時,使用廠商相關(guān)的顯示方式。
-F TYPE 設(shè)置smartctl的行為,當(dāng)出現(xiàn)一些已知但還沒有解決的硬件或軟件bug時,
smartctl應(yīng)該怎么做。
-P TYPE 設(shè)置smartctl是否對磁盤使用數(shù)據(jù)庫中已有的參數(shù)。
SMART 離線測試、自測試 參數(shù)
-t TEST 立馬運行測試,能夠和-C參數(shù)一起使用。
TEST能夠有下面幾個選擇:
offline 離線測試。
能夠在掛載文件系統(tǒng)的磁盤上使用
short 短時間測試。能夠在掛載文件系統(tǒng)的磁盤上使用。
long 長時間測試。能夠在掛載文件系統(tǒng)的磁盤上使用。
conveyance [ATA only]傳輸zi測試。能夠在掛載文件系統(tǒng)的磁盤上使用。
select, N-M
select, N+SIZE [ATA only]有選擇性測試。測試磁盤的部分LBA。
N表示
LBA編號,M表示結(jié)束LBA編號。SIZE表示測試的LBA
范圍。
-C 在captive模式下執(zhí)行測試。
注意:(1)-C必須配合-t一起使用。但假設(shè)是-t offline,則-C不生效。
(2)-C會使得磁盤非常忙,所以最好是在沒有掛載文件系統(tǒng)的磁盤上使用。
-X 中斷no-captive模式下執(zhí)行的測試。
總結(jié)
以上是生活随笔為你收集整理的检測磁盘驱动的健康程度SMART的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android内存泄漏问题(一)
- 下一篇: 宝宝头三年至关重要,不看悔掉肠子