数据中心巡检实操之UPS及电池
UPS和電池是數據中心核心設施---IT設備的最貼身護衛,它們的重要作用于數據中心來說是不言而喻的。關于UPS的功能、原理本文不再細說,此類的文章汗牛充棟。本文以我們多年現場實操運維經驗,來陳述UPS及電池是怎樣巡檢和管理的。
一、UPS及電池的巡檢要點
1、節點及導體的發熱
?“羅馬不是一天建成的”,絕大多數的設備故障都不是突然出現的,在故障發生前一定有異常的訊號發出,那么發熱是重要的表征特點之一,巡檢前要對哪些節點重點關注,首先心中要建立起一份清單。
2、UPS散熱
電子技術的發展日新月異,高頻UPS成為行業的主流,電路的半導體器件集成度越來越高,UPS各組件的物理尺寸越來越小但功率卻越來越大,單位空間的發熱量也就越來越大。良好的散熱是UPS穩定運行的基石,UPS散熱不好,會潛移默化般引發一系列故障。很多運維手冊上都說,大型UPS在0~35℃溫度范圍可連續運行,到了40℃能連續運行8小時,推薦運行溫度是20~25℃。由此可見UPS的正常運行對溫度是很敏感的,也是有要求的,但依據我們的經驗,我們想對這段話應該有個精確的詮釋:UPS出風風扇口的溫度為25℃左右。要達到這個指標,那么UPS進風口的溫度以為18℃為最優。若UPS房采用全淹沒制冷方式,則房間內的溫度需要18℃。
3、電池漏液
電池漏液的原因:a、使用時電池輸出電流太大,導致內部溫升、液體膨脹;b、電極的消耗使電極四周密封空隙變大或密封材料老化;c、生產工藝缺陷或運輸碰撞導致電池外殼ABS材料存在暗裂。電池漏液的危害主要有:a、電解液減少,會導致內阻增大,電池容量降低,縮短電池的壽命;b、影響電池組正常運行,造成停電事故;c、酸性溶液漏到金屬電池架上形成接地通路,造成接地短路引發火災。
二、巡檢內容
日檢(頻次為一日兩次)內容
1、查看監控中心的動力環境監控系統,是否有UPS和電池的報警、故障、參數異常等信息,包括輸出功率、電流等有無異常的波動、電池內阻/電壓有沒有大幅度偏高等。特別說明:再好的監控系統也只是通過檢測到信號參數達到目標閾值后,才及時發出告警信號,而數據中心穩定地、可靠地運行還是需要靠人對設備和系統認真多次巡檢才能防范于未然。把對監控系統的查看放在巡檢的第一步是為了對出現的警示信號進行快速的響應,一切正常后才開始每次的例行檢查;
2、沿UPS房和電池房的主干通道及四周巡視一圈,感受環境的溫度、濕度是否有異常;通過嗅覺能否體察到異常氣味;查看溫濕度計的數值;目光掃視天花有無異物掉落跡象;地面有無小動物入侵的痕跡;地面有無水漬;空調的風口有無凝結的露珠……
3、UPS輸入輸出電柜面板指示燈是否異常,儀表是否有告警、故障信息,電流功率參數是否有較大波動,用手背感受斷路器表面溫度;
4、打開電柜面板,手背感受接口處電纜絕緣層的溫度,查看電纜和斷路器端接頭,看顏色是否有無變化、涂層有無焦化、接頭有無變形松動,必要時用紅外點溫槍復核重要部位的溫度;
5、翻閱UPS控制器顯示屏歷史記錄,有無故障、報警和異常等信息,可核實UPS本地信息和監控中心環境監控信息的一致性;
6、傾聽UPS的風扇聲、元器件的電頻聲等,是否有異常噪音,用手觸摸UPS外殼感受其震動頻率有無異常;
7、打開UPS柜門,查看進風過濾網有無積塵或粘附異物,用手電筒光線照射進去UPS內部核心部件、接線端子、板卡等處,查看涂層顏色是否焦化變色、接頭是否變形、電容有無鼓包漏液等異常現象,嗅聞是否有異味等;
8、查看UPS排風口是否有異物、積塵程度,用手感受排風溫度;
9、查看電池房環境時,重點關注電池架上空是否存在異物跌落的可能,尤其關注是否有可導電物體存在跌落的可能;
10、巡視每一排電池時,用手觸摸電纜頭和連接銅排的絕緣層感受其溫度情況,注意嗅聞環境氣味,如果有酸液冒出一定會有異于環境的刺激性氣味;
11、查看電池有無破損、鼓包、劃傷、移位、撞擊變形等;
12、掃視每一節電池上方的單向排氣閥,閥口附近是否有噴出的液體,如果有則說明其它部分排氣閥存在堵塞現象,則需要清理或更換排氣閥;
13、打開電池開關電柜面板,查看開關狀態,手背感受開關體表溫度、接口處電纜絕緣層的溫度,查看電纜和斷路器端接頭,看顏色是否有無變化、涂層有無焦化、接頭有無變形松動,必要時用紅外點溫槍復核重要部位的溫度;
14、對巡檢過程中發現的異常數據進行記錄,異常的現象及時處理并記錄,形成巡檢檔案;
15、巡檢UPS配套的空調設施(以后再述);
周檢內容
1、用3成干的洗抹布清理UPS進出風口積塵,清潔過濾網;
2、測試每臺UPS關鍵部件的表面溫度并做好記錄;
3、用光電轉速表記錄每個UPS排風扇的轉速,對轉速大幅度下降的風扇要做計劃更換;
4、認真全面查看每一節UPS電容器的外觀狀態,并做好記錄;
5、清理每節電池的表面衛生,查看每節電池電極的顏色變化情況,如果有顏色異常,比如說在電極或螺母上析出一層薄膜蠟狀物或白色小顆粒,則可判斷該電池將存在冒酸的可能,應做好標識,加以重點關注;
6、測量每一節電池內阻、電壓、電極溫度,并做好記錄;
7、每周核實一次電池室風機是否定時間點定時段自動啟動;
月度/季度檢查內容
1、檢測記錄UPS輸入輸出電壓、電流、頻率、負載功率等參數,查看并記錄UPS同步及輸出頻率的穩定性,檢查并機系統的每臺UPS之間的負載均衡性;
2、檢查并記錄UPS輸入/輸出的電壓、電流、功率、頻率,輸入額定電壓要在-15%~+10,面板顯示各個設定參數正常,控制精度正常,單機帶載容量不能超過80%且并機負載均分性能良好,輸出頻率穩定;
3、測量并記錄UPS電池電壓和浮充電壓、電流及UPS正常運行時的負載率;
4、在帶載情況下測量并記錄UPS輸入/輸出斷路器、電池開關斷路器、銅排、連接端子、輸入、輸出交流電容、直流母線電容、功率器件SCR、IGBT、接觸器以及變壓器等重要設備溫度情況,并做好記錄;
年度檢查內容
1、對UPS用電能質量分析儀測試輸入諧波電流(滿載情況下3~39次諧波不大于5%),非滿載情況下測試值要與說明書規定值或前次測量數據結果對比無明顯變化;
2、確定外觀、風扇、電容、電纜以及整流、逆變器(可視)板件,外觀無變形破損,電纜接頭無焦黃變色,電容無鼓脹漏液,板件無異常等。如有異常則進行維修、更換,確保最終所有部件正常;
3、儀表校正,實測電壓、電流與顯示對比沒有過大誤差;
4、檢查主機、電池以及配電引線連接端子的接觸情況,檢查饋電母線、電纜及各個軟接頭等連接部位以及溫升情況(接頭處要沒有明顯的氧化變色、接觸良好無松動、溫度在正常范圍);
5、測量UPS輸出的零地電壓值須小于2V;
6、對同UPS及電池相關的所有開關檢查測試,開關分/合正常;
7、電池每年要進行一次核對性放電測試,放出額定容量的30~40%,三年以上的電池組每年要進行一次容量測試(注意電池充/放電時對電池溫度進行監控,電池表面溫升不得高于環境溫度20度);
?
后記:看完文章后,想一想運維機器人該如何設計呢?歡迎大家在評論區留言討論!
資料免費送(點擊鏈接下載)
史上最全,數據中心機房標準及規范匯總(下載)數據中心運維管理 | 資料匯總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
加入運維管理VIP群(點擊鏈接查看)
《數據中心運維管理》VIP技術交流群會員招募說明
掃描以下二維碼加入學習群
總結
以上是生活随笔為你收集整理的数据中心巡检实操之UPS及电池的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 惊艳!亚洲规模最大、标准最高的金融数据中
- 下一篇: 核心交换机的链路聚合、冗余、堆叠、热备份