数据中心的运维管理原则(二)
隨著大數(shù)據(jù)分析以及人工智能技術(shù)的應(yīng)用,使得數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,這也促使了數(shù)據(jù)中心的數(shù)量和規(guī)模成幾何倍數(shù)增長。相信在數(shù)據(jù)中心基礎(chǔ)設(shè)施部門運維工作者,應(yīng)該都能體會到設(shè)備對運行環(huán)境要求苛刻,試想一下,在一個擁上萬臺甚至數(shù)十萬臺服務(wù)器的數(shù)據(jù)中心,如何保證這些設(shè)備安全可靠而有序地運行,有必要制定一套完善的機房設(shè)備管理制度。?
一、設(shè)備進場登記管理
動力設(shè)備和空調(diào)設(shè)備的質(zhì)量好壞,是保證IT設(shè)備運行環(huán)境舒適性的關(guān)鍵,進而也影響了數(shù)據(jù)中心運行生命周期的長短。因此,在設(shè)備采購前期務(wù)必做好服務(wù)商資質(zhì)的審查(后續(xù)同類設(shè)備采購,盡量邀請同一批服務(wù)商競標(biāo)),保證關(guān)鍵設(shè)備的質(zhì)量要求。
設(shè)備在正式進場后,機房的配電系統(tǒng)、UPS系統(tǒng)、柴油發(fā)電機系統(tǒng)、照明系統(tǒng)以及機房空調(diào)和新風(fēng)系統(tǒng)應(yīng)該有數(shù)據(jù)中心專人負責(zé)運維(包括各類子系統(tǒng)的健康檢查、巡檢、故障設(shè)備的更換以及事后設(shè)備清單統(tǒng)計和故障原因分析)。如果屬于合作協(xié)議約定范圍內(nèi)的設(shè)備或原廠商及其代理服務(wù)商提供維保工作,則按照約定協(xié)議規(guī)定的責(zé)任方承擔(dān)運維工作,但在責(zé)任方運維過程中,數(shù)據(jù)中心人員應(yīng)該發(fā)揮陪同監(jiān)督的作用(保證協(xié)議約定以外的設(shè)備在責(zé)任方運維操作過程中不受影響,做到數(shù)據(jù)中心的設(shè)備必須專人負責(zé)使用)以及適當(dāng)?shù)募夹g(shù)支持。
隨著數(shù)據(jù)中心規(guī)模的擴大,其相應(yīng)配套的基礎(chǔ)設(shè)施數(shù)量也在激增,幾乎每天都會有設(shè)備出現(xiàn)故障,為了不影響數(shù)據(jù)中心業(yè)務(wù)的正常運行,運維中心應(yīng)該備有充足的備件,及時對故障部件進行更換,以保證應(yīng)急事件發(fā)生時有序高效地執(zhí)行。另外,庫房備件也應(yīng)該做到專人負責(zé),對備件清單及物理位置進行更新,對不足的備件及早進行采購。
二、機房環(huán)境衛(wèi)生管理
為了保證設(shè)備運行在最佳工況下,讓設(shè)備的生命周期得以延長,從而降低數(shù)據(jù)中心的運行開支,一個干凈整潔的機房環(huán)境是十分必要的。怎樣給機房設(shè)備提供一個無塵清新的運行環(huán)境呢,需要保證一下兩點:
1、在機房剛交付時,讓保潔對機房環(huán)境衛(wèi)生進行大掃除(除了地面清潔、機柜以及冷通道的清潔外,還需要清除架空地板下施工遺留的電纜碎屑、螺絲等);在機房交付后,由于機房運維人員日常巡檢或者故障排查等原因,機房環(huán)境目前做不到絕對的無塵,這就要求機房運維人員需要穿著專用工作服和專用鞋,臨時進入機房人員更換專用拖鞋或使用鞋套方可進入機房內(nèi)。同時,需要保潔對機房內(nèi)部衛(wèi)生進行定期清理(小編所在的數(shù)據(jù)中心,頻次在一個月一次);在機房保潔過程中,尤其在夏季,也需要關(guān)注門、窗的密封性,以防窗戶和門縫產(chǎn)生冷凝水,一旦發(fā)現(xiàn)問題及時解決;最后,每年年末對機房環(huán)境衛(wèi)生進行評估,找出隱患并制定整改措施。
2、機房內(nèi)包括值班室禁止帶入食品,以免引入鼠患,所以需要在機房區(qū)域以及動力區(qū)域放置捕鼠器、門口放置擋鼠板(小編所在數(shù)據(jù)中心,曾經(jīng)發(fā)生過鼠患,因老鼠咬破電纜而發(fā)生短路),一旦發(fā)現(xiàn)鼠患或者其他動物進入,應(yīng)立即采取措施,避免給數(shù)據(jù)中心造成不必要的損失。另外,機房內(nèi)嚴禁吸煙、喝水、吃食物等,一經(jīng)發(fā)現(xiàn)需立刻制止,并制定相應(yīng)的處罰措施。當(dāng)然,機房內(nèi)包括機房走道嚴禁堆放易燃易爆品,如設(shè)備進場遺留下的紙箱或者廢紙等。
三、機房設(shè)備性能優(yōu)化管理
數(shù)據(jù)中心已成為用電量增長最快的行業(yè),龐大的數(shù)據(jù)中心數(shù)量和規(guī)模,已經(jīng)讓電力行業(yè)不堪重負,數(shù)據(jù)中心理應(yīng)走在節(jié)能的前列,提升數(shù)據(jù)中心運營能效。基礎(chǔ)設(shè)施部門績效考核的一個關(guān)鍵指標(biāo)是PUE,PUE=(IT負載能耗+動力設(shè)備能耗)/ IT負載能耗,目前新建的數(shù)據(jù)中心PUE普遍在1.75左右,IT負載能耗是由業(yè)務(wù)需求量決定的,如何最大化降低PUE值,在于基礎(chǔ)設(shè)施部門如何讓空調(diào)制冷量最大限度地冷卻IT設(shè)備。
1、目前機房普遍采用的是架空地板下送風(fēng)、上回風(fēng)形式,這種粗放式冷卻方式,冷卻效率較低。為了減少這種能源浪費,目前主流采用的是冷熱通道隔離形式,避免冷熱氣流混合。在機房資源分配時,機房需求部門應(yīng)嚴格按要求擺放IT設(shè)備,避免出現(xiàn)設(shè)備出風(fēng)口和進風(fēng)口顛倒的情況,另外,機房內(nèi)電源、光纖和網(wǎng)絡(luò)布線應(yīng)遵循橫平豎直的原則,減少氣流組織損耗。
2、新進設(shè)備在機柜上不恰當(dāng)擺置,同樣會引起局部熱點和溫度倒掛現(xiàn)象。為避免出現(xiàn)此類問題,設(shè)備的擺置應(yīng)遵循先下后上的方式,設(shè)備間間隔1U的距離均勻放置,直至擺滿整個機柜。在未安裝設(shè)備的位置應(yīng)放置盲板,以及機柜中電源布線、網(wǎng)絡(luò)布線應(yīng)用毛刷封閉,減少氣流損失。
四、機房設(shè)備報廢
? ? ? ?數(shù)據(jù)中心本身是一個資源消耗型的單位,在運營過程往往采用節(jié)流的方式減少其開支,其配置的硬件資源往往都是十分昂貴的,因此,有必要制定一套完善報廢流程。設(shè)備管理部一般規(guī)定滿足如下條件時,方可申請設(shè)備報廢:
? 1)設(shè)備因損壞而無法維修;
? 2)設(shè)備維修成本超過新購?fù)愒O(shè)備報價的70%以上(含70%);
? 3)設(shè)備資產(chǎn)折舊已完成并達到使用年限。
注:以上機房硬件設(shè)備管理制度僅根據(jù)小編任職的數(shù)據(jù)中心進行總結(jié),有如不同觀點歡迎留言交流。
資料免費送(點擊鏈接下載)
史上最全,數(shù)據(jù)中心機房標(biāo)準(zhǔn)及規(guī)范匯總(下載)數(shù)據(jù)中心運維管理 | 資料匯總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
加入運維管理VIP群(點擊鏈接查看)
《數(shù)據(jù)中心運維管理》VIP技術(shù)交流群會員招募說明
加入學(xué)習(xí)群掃描以下二維碼或者添加微信:
wang2017bj
總結(jié)
以上是生活随笔為你收集整理的数据中心的运维管理原则(二)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 爆料!亦庄地区数据中心将面临史上最长群体
- 下一篇: “数据中心运维管理VIP学习群”问题汇总