数据中心
數(shù)據(jù)中心
- 前言
- 一、數(shù)據(jù)中心的概念
- 二、數(shù)據(jù)中心的基本單元——服務(wù)器
- 三、數(shù)據(jù)中心地址
- 四、數(shù)據(jù)中心的能耗
- 參考文獻(xiàn)
前言
現(xiàn)如今,各種類型的數(shù)據(jù)正在以爆炸性的方式迅速增長(zhǎng),大數(shù)據(jù)的出現(xiàn)正迫使企業(yè)不斷提升自身以數(shù)據(jù)中心為平臺(tái)的數(shù)據(jù)處理能力。同時(shí),云計(jì)算、虛擬化等技術(shù)正不斷為數(shù)據(jù)中心的發(fā)展帶來(lái)新的推動(dòng)力,并正在改變傳統(tǒng)數(shù)據(jù)中心的模式。本章將介紹數(shù)據(jù)中心的概念,數(shù)據(jù)中心的發(fā)展歷史,數(shù)據(jù)中心的組成單元一一服務(wù)器,以及數(shù)據(jù)中心的選址及能耗問題。
一、數(shù)據(jù)中心的概念
數(shù)據(jù)中心(DataCenter)通常是指在一個(gè)物理空間內(nèi)實(shí)現(xiàn)信息的集中處理、存儲(chǔ)、傳輸、交換、管理,而計(jì)算機(jī)設(shè)備、服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備等通常認(rèn)為是網(wǎng)絡(luò)核心機(jī)房的關(guān)鍵設(shè)備。
關(guān)鍵設(shè)備運(yùn)行所需要的環(huán)境因素,如供電系統(tǒng)、制冷系統(tǒng)、機(jī)柜系統(tǒng)、消防系統(tǒng)、監(jiān)控系統(tǒng)等通常被認(rèn)為是關(guān)鍵物理基礎(chǔ)設(shè)施。
電子機(jī)房主要有計(jì)算機(jī)機(jī)房、電信機(jī)房、控制機(jī)房、屏蔽機(jī)房等。這些機(jī)房既有電子機(jī)房的共性,也有各自的特點(diǎn),其所涵蓋的內(nèi)容不同,功能也各異。
(一)計(jì)算機(jī)機(jī)房 計(jì)算機(jī)機(jī)房?jī)?nèi)放置重要的數(shù)據(jù)處理設(shè)備、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)傳輸設(shè)備及機(jī)房保障設(shè)備。計(jì)算機(jī)機(jī)房的建設(shè)應(yīng)考慮以上設(shè)備的正常運(yùn)行,確保信息數(shù)據(jù)的安全性以及工作人員身心健康的需要。 大型計(jì)算機(jī)機(jī)房一般由無(wú)人區(qū)機(jī)房、有人區(qū)機(jī)房組成。無(wú)人區(qū)機(jī)房一般包括小型機(jī)機(jī)房、服務(wù)器機(jī)房、存儲(chǔ)機(jī)房、網(wǎng)絡(luò)機(jī)房、介質(zhì)存儲(chǔ)間、空調(diào)設(shè)備間、UPS設(shè)備間、配電間等;有人區(qū)機(jī)房一般包括總控中心機(jī)房、研發(fā)機(jī)房、測(cè)試機(jī)房、設(shè)備測(cè)試間、設(shè)備維修存儲(chǔ)間、緩沖間、更衣室、休息室等。 中、小型計(jì)算機(jī)機(jī)房可將小型機(jī)機(jī)房、服務(wù)器機(jī)房、存儲(chǔ)機(jī)房等合并為一個(gè)主機(jī)房。
(二)電信機(jī)房 電信機(jī)房是每個(gè)電信運(yùn)營(yíng)商的寶貴資源,合理、有效、充分地利用電信機(jī)房,對(duì)于設(shè)備的運(yùn)行維護(hù)、快速處理設(shè)備故障、降低成本、提高企業(yè)的核心競(jìng)爭(zhēng)力等具有十分重要的意義。 電信機(jī)房一般是按不同的功能和專業(yè)來(lái)區(qū)分和布局的,通常分為設(shè)備機(jī)房、配套機(jī)房和輔助機(jī)房。 設(shè)備機(jī)房是用于安裝某一類通信設(shè)備,實(shí)現(xiàn)某一種特定通信功能的建筑空間,便于完成相應(yīng)專業(yè)內(nèi)的操作、維護(hù)和生產(chǎn),一般由傳輸機(jī)房、交換機(jī)房、網(wǎng)絡(luò)機(jī)房等組成。配套機(jī)房是用于安裝保證通信設(shè)施正常、安全和穩(wěn)定運(yùn)行設(shè)備的建筑空間,一般由計(jì)費(fèi)中心、網(wǎng)管監(jiān)控室、電力電池室、變配電室和油機(jī)室等組成。 輔助機(jī)房是除通信設(shè)施機(jī)房以外,保障生產(chǎn)、辦公、生活需要的用房,一般由運(yùn)維辦公室、運(yùn)維值班室、資料室、備品備件庫(kù)、消防保安室、新風(fēng)機(jī)房、鋼瓶間和衛(wèi)生間等組成。在一般智能建筑中通信機(jī)房經(jīng)常與計(jì)算機(jī)網(wǎng)絡(luò)機(jī)房合建。
(三)控制機(jī)房 隨著智能化建筑的發(fā)展,為實(shí)現(xiàn)對(duì)建筑中智能化樓宇設(shè)備的控制,必需設(shè)立控制機(jī)房。控制機(jī)房相對(duì)于數(shù)據(jù)機(jī)房、電信機(jī)房而言,機(jī)房面積較小,功能比較單一,對(duì)環(huán)境要求稍低。但卻關(guān)系到智能化建筑的安全運(yùn)行及設(shè)備、設(shè)施的正常便用。 控制機(jī)房包括樓宇智能控制機(jī)房、保安監(jiān)控機(jī)房、消防控制室、衛(wèi)星接收機(jī)房、視頻會(huì)議控制機(jī)房等。這些控制機(jī)房的共同特點(diǎn)是機(jī)房?jī)?nèi)均有操作人員工作,在保證電子設(shè)備運(yùn)行的同時(shí)還要保證操作人員的身體需要。根據(jù)設(shè)備及操作的要求,這些控制機(jī)房也有其相應(yīng)的特點(diǎn)。(1)樓宇智能控制機(jī)房。主要用于安放樓宇智能控制的主機(jī)及控制設(shè)備,對(duì)智能建筑內(nèi)的公共照明、空調(diào)系統(tǒng)、電梯及建筑內(nèi)的風(fēng)、水、電等機(jī)電設(shè)備進(jìn)行實(shí)時(shí)監(jiān)控,以確保智能建筑的安全運(yùn)行。(2)保安監(jiān)控機(jī)房。內(nèi)設(shè)監(jiān)控主機(jī)及終端顯示設(shè)備,對(duì)建筑各出入口、車庫(kù)、走道、電梯轎箱等處進(jìn)行視頻監(jiān)控、防盜報(bào)警等。(3)消防控制室。是火災(zāi)自動(dòng)報(bào)警和聯(lián)動(dòng)系統(tǒng)的控制中心,也是火災(zāi)時(shí)滅火指揮和信息中心,具有十分重要的地位和作用。《高層民用建筑設(shè)計(jì)防火規(guī)范》和《建筑設(shè)計(jì)防火規(guī)范》等對(duì)消防監(jiān)控機(jī)房的設(shè)置范圍、位置、建筑耐火性能都作了明確規(guī)定,并對(duì)其主要功能提出原則性要求。(4)衛(wèi)星接收機(jī)房。主要用于安放衛(wèi)星接收機(jī)、調(diào)制解調(diào)器、混合器、放大器、有線光纜接入設(shè)備、各頻段接受顯示器等。衛(wèi)星接收機(jī)房一般是位于建筑頂層,有利于衛(wèi)星電視信號(hào)的傳輸。(5)視頻會(huì)議控制機(jī)房。主要用于安放視頻會(huì)議主控單元(MCU)、調(diào)音臺(tái)、音響擴(kuò)聲系統(tǒng)、信號(hào)傳輸設(shè)備、控制臺(tái)設(shè)備、信號(hào)源機(jī)柜等。但由于一般的視頻會(huì)議控制機(jī)房面積較小,在設(shè)備布置時(shí)應(yīng)根據(jù)房間的具體情況靈活布置。
(四)屏蔽機(jī)房 為了有效地防止電磁干擾式噪聲、輻射對(duì)電子設(shè)備和測(cè)量?jī)x器的影響,并嚴(yán)防電子信號(hào)泄漏從而威脅到機(jī)密信息的安全,國(guó)家機(jī)關(guān)、軍隊(duì)、公安、銀行、鐵路等單位需要建立屏蔽機(jī)房。有保密要求的數(shù)據(jù)機(jī)房應(yīng)建設(shè)屏蔽機(jī)房,確保數(shù)據(jù)在處理過程中,其信號(hào)不泄漏,從而滿足數(shù)據(jù)保密的要求。一些對(duì)抗電磁干擾要求較高的環(huán)境,如通信設(shè)備的測(cè)試試驗(yàn)室等場(chǎng)所,需要建設(shè)屏蔽機(jī)房,以防止外界電磁信號(hào)的干擾。有強(qiáng)電磁干擾設(shè)備的機(jī)房應(yīng)進(jìn)行相應(yīng)的電磁屏蔽處理,以避免干擾臨近機(jī)房設(shè)備的正常還行。
二、數(shù)據(jù)中心的基本單元——服務(wù)器
什么是服務(wù)器
服務(wù)器是指能向網(wǎng)絡(luò)用戶提供特定服務(wù)的軟件和硬件。這個(gè)服務(wù)器的定義包含了以下兩個(gè)方面的內(nèi)容:一方面,服務(wù)器的作用是為網(wǎng)絡(luò)提供特定的服務(wù),而人們通常會(huì)以服務(wù)器所能提供的服務(wù)來(lái)命名服務(wù)器,如提供文件共享服務(wù)的服務(wù)器稱為文件服務(wù)器,提供打印隊(duì)列共享服務(wù)的服務(wù)器稱為打印服務(wù)器等;另一方面,服務(wù)器是軟件和硬件的統(tǒng)一體,特定的服務(wù)程序需要運(yùn)行在特定的硬件或一般通用的微機(jī)上才能完成服務(wù)功能,由服務(wù)程序完成服務(wù)策略,并通過硬件實(shí)現(xiàn)所需的服務(wù),如文件服務(wù)依靠大容量硬盤,打印服務(wù)需要高速打印機(jī)。
由于整個(gè)網(wǎng)絡(luò)的用戶均依靠不同的服務(wù)器提供不同的網(wǎng)絡(luò)服務(wù),因此,網(wǎng)絡(luò)服務(wù)器是網(wǎng)絡(luò)資源管理和共享的核心。網(wǎng)絡(luò)服務(wù)器的性能對(duì)整個(gè)網(wǎng)絡(luò)的共享性能有著決定性的影響。
服務(wù)器分類
按照不同的分類標(biāo)準(zhǔn),服務(wù)器分為許多種。
1、按網(wǎng)絡(luò)規(guī)模劃分
按網(wǎng)絡(luò)規(guī)模劃分,服務(wù)器分為工作組級(jí)服務(wù)器、部門級(jí)服務(wù)器、企業(yè)級(jí)服務(wù)器。
工作組級(jí)服務(wù)器用于聯(lián)網(wǎng)計(jì)算機(jī)在幾十臺(tái)左右或者對(duì)處理速度和系統(tǒng)可靠性要求不高的小型網(wǎng)絡(luò),其硬件配置相對(duì)比較低,可靠性不是很高。
部門級(jí)服務(wù)器用于聯(lián)網(wǎng)計(jì)算機(jī)在百臺(tái)左右、對(duì)處理速度和系統(tǒng)可靠性中等的中型網(wǎng)絡(luò),其硬件配置相對(duì)較高,其可靠性居于中等水平。
企業(yè)級(jí)服務(wù)器用于聯(lián)網(wǎng)計(jì)算機(jī)在數(shù)百臺(tái)以上、對(duì)處理速度和數(shù)據(jù)安全要求最高的大型網(wǎng)絡(luò),硬件配置最高,系統(tǒng)可靠性要求最高。
需要注意的是,這三種服務(wù)器之間的界限并不是絕對(duì)的,而是比較模糊的,比如工作組級(jí)服務(wù)器和部門級(jí)服務(wù)器的區(qū)別就不是太明顯,有的干脆統(tǒng)稱為“工作組/部門級(jí)”服務(wù)器。
2、按架構(gòu)劃分
按照服務(wù)器的結(jié)構(gòu),可以分為CISC架構(gòu)的服務(wù)器和RISC架構(gòu)的服務(wù)器。
CISC架構(gòu)主要指的是采用英特爾架構(gòu)技術(shù)的服務(wù)器,即我們常說的“PC服務(wù)器”;RISC架構(gòu)的服務(wù)器指采用非英特爾架構(gòu)技術(shù)的服務(wù)器,如采用Power PC、Alpha、PA-RISC、Sparc等RISC CPU的服務(wù)器。
RISC架構(gòu)服務(wù)器的性能和價(jià)格比CISC架構(gòu)的服務(wù)器高得多。近幾年來(lái),隨著PC技術(shù)的迅速發(fā)展,IA架構(gòu)服務(wù)器與RISC架構(gòu)的服務(wù)器之間的技術(shù)差距已經(jīng)大大縮小,用戶基本上傾向于選擇IA架構(gòu)服務(wù)器,但是RISC架構(gòu)服務(wù)器在大型、關(guān)鍵的應(yīng)用領(lǐng)域中仍然居于非常重要的地位。
3、按用途劃分
按照使用的用途,服務(wù)器又可以分為通用型服務(wù)器和專用型(或稱“功能型”)服務(wù)器,如實(shí)達(dá)的滄海系列功能服務(wù)器。
通用型服務(wù)器是沒有為某種特殊服務(wù)專門設(shè)計(jì)的可以提供各種服務(wù)功能的服務(wù)器,當(dāng)前大多數(shù)服務(wù)器是通用型服務(wù)器。
專用型(或稱“功能型”)服務(wù)器是專門為某一種或某幾種功能專門設(shè)計(jì)的服務(wù)器,在某些方面具有與通用型服務(wù)器有所不同。如光盤鏡像服務(wù)器是用來(lái)存放光盤鏡像的,那么需要配備大容量、高速的硬盤以及光盤鏡像軟件。
4、按外觀劃分
按照服務(wù)器的外觀,可以分為臺(tái)式服務(wù)器(又稱“塔式服務(wù)器”)和機(jī)架式服務(wù)器。
臺(tái)式服務(wù)器有的采用大小與立式PC臺(tái)式機(jī)大致相當(dāng)?shù)臋C(jī)箱,有的采用大容量的機(jī)箱,像一個(gè)碩大的柜子一樣,有的臺(tái)式服務(wù)器可以利用外掛導(dǎo)軌改裝成機(jī)架式服務(wù)器。
機(jī)架式服務(wù)器的外形看起來(lái)不像計(jì)算機(jī),而是像交換機(jī),有1U(1U=1.75英寸)、2U、4U等規(guī)格。
服務(wù)器硬件
其實(shí)服務(wù)器系統(tǒng)的硬件構(gòu)成與我們平常所接觸的電腦有眾多的相似之處,主要的硬件構(gòu)成仍然包含如下幾個(gè)主要部分:中央處理器、內(nèi)存、芯片組、I/O總線、I/O設(shè)備、電源、機(jī)箱和相關(guān)軟件。這也成了我們選購(gòu)一臺(tái)服務(wù)器時(shí)所主要關(guān)注的指標(biāo)。
整個(gè)服務(wù)器系統(tǒng)就像一個(gè)人,處理器就是服務(wù)器的大腦,而各種總線就像是分布于全身肌肉中的神經(jīng),芯片組就像是骨架,而I/O設(shè)備就像是通過神經(jīng)系統(tǒng)支配的人的手、眼睛、耳朵和嘴;而電源系統(tǒng)就像是血液循環(huán)系統(tǒng),它將能量輸送到身體的所有地方。
對(duì)于一臺(tái)服務(wù)器來(lái)講,服務(wù)器的性能設(shè)計(jì)目標(biāo)是如何平衡各部分的性能,使整個(gè)系統(tǒng)的性能達(dá)到最優(yōu)。如果一臺(tái)服務(wù)器有每秒處理1000個(gè)服務(wù)請(qǐng)求的能力,但網(wǎng)卡只能接受200個(gè)請(qǐng)求,而硬盤只能負(fù)擔(dān)150個(gè),而各種總線的負(fù)載能力僅能承擔(dān)100個(gè)請(qǐng)求的話,那這臺(tái)服務(wù)器得處理能力只能是100個(gè)請(qǐng)求/秒,有超過80%的處理器計(jì)算能力浪費(fèi)了。 所以設(shè)計(jì)一個(gè)好服務(wù)器的最終目的就是通過平衡各方面的性能,使得各部分配合得當(dāng),并能夠充分發(fā)揮能力。我們可以從這幾個(gè)方面來(lái)衡量服務(wù)器是否達(dá)到了其設(shè)計(jì)目的;R:Reliability——可靠性;A:Availability——可用性;S:Scalability——可擴(kuò)展性;U:Usability——易用性;M:Manageability——可管理性,即服務(wù)器的RASUM衡量標(biāo)準(zhǔn)。
由于服務(wù)器在網(wǎng)絡(luò)中提供服務(wù),那么這個(gè)服務(wù)的質(zhì)量對(duì)承擔(dān)多種應(yīng)用的網(wǎng)絡(luò)計(jì)算環(huán)境是非常重要的,承擔(dān)這個(gè)服務(wù)的計(jì)算機(jī)硬件必須有能力保障服務(wù)質(zhì)量。這個(gè)服務(wù)首先要有一定的容量,能響應(yīng)單位時(shí)間內(nèi)合理數(shù)量的服務(wù)器請(qǐng)求,同時(shí)這個(gè)服務(wù)對(duì)單個(gè)服務(wù)請(qǐng)求的響應(yīng)時(shí)間要盡量快,還有這個(gè)服務(wù)要在要求的時(shí)間范圍內(nèi)一直存在。
如果一個(gè)WEB服務(wù)器只能在1分鐘里處理1個(gè)主頁(yè)請(qǐng)求,1個(gè)以外的其他請(qǐng)求必須排隊(duì)等待,而這一個(gè)請(qǐng)求必須要3分鐘才能處理完,同時(shí)這個(gè)WEB服務(wù)器在1個(gè)小時(shí)以前可以訪問到,但一個(gè)小時(shí)以后卻連接不上了,這種WEB服務(wù)器在現(xiàn)在的Internet計(jì)算環(huán)境里是無(wú)法想象的。
現(xiàn)在的WEB服務(wù)器必須能夠同時(shí)處理上千個(gè)訪問,同時(shí)每個(gè)訪問的響應(yīng)時(shí)間要短,而且這個(gè)WEB服務(wù)器不能停機(jī),否則這個(gè)WEB服務(wù)器就會(huì)造成訪問用戶的流失。
為達(dá)到上面的要求,作為服務(wù)器硬件必須具備如下的特點(diǎn):性能,使服務(wù)器能夠在單位時(shí)間內(nèi)處理相當(dāng)數(shù)量的服務(wù)器請(qǐng)求并保證每個(gè)服務(wù)的響應(yīng)時(shí)間;可靠性,使得服務(wù)器能夠不停機(jī);可擴(kuò)展性,使服務(wù)器能夠隨著用戶數(shù)量的增加不斷提升性能。因此我們說不能把一臺(tái)普通的PC作為服務(wù)器來(lái)使用,因?yàn)?#xff0c;PC遠(yuǎn)遠(yuǎn)達(dá)不到上面的要求。這樣我們?cè)诜?wù)器的概念上又加上一點(diǎn)就是服務(wù)器必須具有承擔(dān)服務(wù)并保障服務(wù)質(zhì)量的能力。這也是區(qū)別低價(jià)服務(wù)器和PC的差異的主要方面。
在信息系統(tǒng)中,服務(wù)器主要應(yīng)用于數(shù)據(jù)庫(kù)和Web服務(wù),而PC主要應(yīng)用于桌面計(jì)算和網(wǎng)絡(luò)終端,設(shè)計(jì)根本出發(fā)點(diǎn)的差異決定了服務(wù)器應(yīng)該具備比PC更可靠的持續(xù)運(yùn)行能力、更強(qiáng)大的存儲(chǔ)能力和網(wǎng)絡(luò)通信能力、更快捷的故障恢復(fù)功能和更廣闊的擴(kuò)展空間,同時(shí),對(duì)數(shù)據(jù)相當(dāng)敏感的應(yīng)用還要求服務(wù)器提供數(shù)據(jù)備份功能。而PC機(jī)在設(shè)計(jì)上則更加重視人機(jī)接口的易用性、圖像和3D處理能力及其他多媒體性能。
服務(wù)器內(nèi)存
服務(wù)器內(nèi)存重要性闡述
服務(wù)器運(yùn)行著企業(yè)關(guān)鍵業(yè)務(wù),一次內(nèi)存錯(cuò)誤導(dǎo)致的宕機(jī)將使數(shù)據(jù)永久丟失。本身內(nèi)存作為一種電子器件,很容易出現(xiàn)各種錯(cuò)誤。
因此,面臨著企業(yè)事實(shí)的壓力和本身的不足,各個(gè)廠商都早已積極推出自己獨(dú)特的服務(wù)器內(nèi)存技術(shù),像HP的“在線備份內(nèi)存”和熱插拔鏡像內(nèi)存;IBM的ChipKill內(nèi)存技術(shù)和熱更換和熱增加內(nèi)存技術(shù)。而隨著企業(yè)信息系統(tǒng)的擴(kuò)展所需,內(nèi)存的密度和容量也將會(huì)得到相應(yīng)的發(fā)展。
服務(wù)器內(nèi)存性能探討
服務(wù)器內(nèi)存也是內(nèi)存,它與我們平常在電腦城所見的普通內(nèi)存在外觀和結(jié)構(gòu)上沒有什么實(shí)質(zhì)性的區(qū)別,它主要是在內(nèi)存上引入了一些新的技術(shù),僅從外觀上是不得出什么結(jié)論的。這樣或許你就擔(dān)心了,如果別人拿普通PC機(jī)的內(nèi)存條當(dāng)服務(wù)器內(nèi)存條賣給你,咋辦?這一般來(lái)說可以放心,其可能性幾乎為零。因?yàn)槠胀≒C機(jī)上的內(nèi)存在服務(wù)器上一般是不可用的,這也說明服務(wù)器內(nèi)存不能隨便為了貪便宜而用普通PC機(jī)的內(nèi)存來(lái)替代就可了事。
如今常用的服務(wù)器內(nèi)存主要有SDRAM和DDR二類,還有另一種RAMBUS內(nèi)存,是一種高性能、芯片對(duì)芯片接口技術(shù)的新一代存儲(chǔ)產(chǎn)品。現(xiàn)在剛興起的DDR2,也逐漸延伸到服務(wù)器內(nèi)存。現(xiàn)代Hynix在2010年六月份已經(jīng)開始量產(chǎn)供服務(wù)器和工作站使用的DDR2內(nèi)存了。
而從技術(shù)層面來(lái)說,之所以與普通內(nèi)存有著區(qū)別,都是因?yàn)镋CC。這是ErrorChecking and Correcting的簡(jiǎn)寫。它廣泛應(yīng)用于各種領(lǐng)域的計(jì)算機(jī)指令中。ECC和奇偶校驗(yàn)(Parity)類似。然而,在那些Parity只能檢測(cè)到錯(cuò)誤的地方,ECC實(shí)際上可以糾正絕大多數(shù)錯(cuò)誤。經(jīng)過內(nèi)存的糾錯(cuò),計(jì)算機(jī)的操作指令才可以繼續(xù)執(zhí)行。這在無(wú)形中也就保證了服務(wù)器系統(tǒng)的穩(wěn)定可靠。但ECC技術(shù)只能糾正單比特的內(nèi)存錯(cuò)誤,當(dāng)有多比特錯(cuò)誤發(fā)生的時(shí)候,ECC內(nèi)存會(huì)生成一個(gè)不可隱藏(non-maskable interrupt)的中斷(NMI),系統(tǒng)將會(huì)自動(dòng)中止運(yùn)行。
服務(wù)器CPU
服務(wù)器CPU,顧名思義,就是在服務(wù)器上使用的CPU(Central Processing Unit中央處理器)。接觸過局域網(wǎng)絡(luò)的讀者一定知道,服務(wù)器是網(wǎng)絡(luò)中的重要設(shè)備,要接受成千上萬(wàn)用戶的訪問,因此對(duì)服務(wù)器具有大數(shù)據(jù)量的快速吞吐、超強(qiáng)的穩(wěn)定性、長(zhǎng)時(shí)間運(yùn)行等嚴(yán)格要求。所以才將CPU比喻成計(jì)算機(jī)的“大腦”,同時(shí)CPU也是衡量服務(wù)器性能的首要指標(biāo)。
目前,服務(wù)器的CPU仍按CPU的指令系統(tǒng)來(lái)區(qū)分,通常分為CISC型CPU和RISC型CPU兩類,后來(lái)又出現(xiàn)了一種64位的VLIM(Very Long Instruction Word超長(zhǎng)指令集架構(gòu))指令系統(tǒng)的CPU。
CISC型CPU
CISC是英文“Complex Instruction Set Computer”的縮寫,中文意思是“復(fù)雜指令集”,它是指英特爾生產(chǎn)的x86(intel CPU的一種命名規(guī)范)系列CPU及其兼容CPU(其他廠商如AMD,VIA等生產(chǎn)的CPU),它基于PC機(jī)(個(gè)人電腦)體系結(jié)構(gòu)。這種CPU一般都是32位的結(jié)構(gòu),所以我們也把它成為IA-32 CPU。(IA: Intel Architecture,Intel架構(gòu))。CISC型CPU目前主要有intel的服務(wù)器CPU和AMD的服務(wù)器CPU兩類。
RISC型CPU
RISC是英文“Reduced Instruction Set Computing ”的縮寫,中文意思是“精簡(jiǎn)指令集”。它是在CISC(Complex Instruction Set Computer)指令系統(tǒng)基礎(chǔ)上發(fā)展起來(lái)的,相對(duì)于CISC型CPU ,RISC型CPU不僅精簡(jiǎn)了指令系統(tǒng),還采用了一種叫做“超標(biāo)量和超流水線結(jié)構(gòu)”,架構(gòu)在同等頻率下,采用RISC架構(gòu)的CPU比CISC架構(gòu)的CPU性能高很多,這是由CPU的技術(shù)特征決定的。RISC型CPU與Intel和AMD的CPU在軟件和硬件上都不兼容。
[編輯]
服務(wù)器的選擇原則[2]
服務(wù)器是指客戶機(jī)/服務(wù)器(或?yàn)g覽器用服務(wù)器)網(wǎng)絡(luò)上的一些機(jī)器,管理著應(yīng)用程序、數(shù)據(jù)和網(wǎng)絡(luò)資源。客戶機(jī)請(qǐng)求服務(wù),而服務(wù)器提供服務(wù)。早期的服務(wù)器主要用來(lái)管理數(shù)據(jù)文件或網(wǎng)絡(luò)打印機(jī)。現(xiàn)在,服務(wù)器則用來(lái)完成其他各種服務(wù),如網(wǎng)絡(luò)管理、各種各樣的信息服務(wù)處理、基礎(chǔ)安全性的訪問等。
服務(wù)器可以是集中式服務(wù)器,也可以是專用服務(wù)器。集中式服務(wù)器是指將網(wǎng)絡(luò)上的多項(xiàng)任務(wù)集中到單個(gè)主機(jī)上,可用來(lái)處理網(wǎng)絡(luò)上的所有打印機(jī)、應(yīng)用程序和數(shù)據(jù)共享任務(wù)。集中式服務(wù)器必須是高性能的計(jì)算機(jī),以便及時(shí)、有效地處理網(wǎng)絡(luò)上的各種請(qǐng)求。專用服務(wù)器則是指一臺(tái)服務(wù)器主機(jī)只對(duì)應(yīng)于一種服務(wù),如應(yīng)用程序服務(wù)器、數(shù)據(jù)文件服務(wù)器、電子郵件服務(wù)器、打印服務(wù)器等,專用服務(wù)器可以支持不同客戶,因?yàn)樨?fù)載分布于多臺(tái)機(jī)器上。
總之,從邏輯上看,服務(wù)器是對(duì)應(yīng)于客戶機(jī)的一種服務(wù),一種服務(wù)程序。
作為服務(wù)器的計(jì)算機(jī)一般是高檔微型計(jì)算機(jī)或小型計(jì)算機(jī)。一般而言,選擇服務(wù)器時(shí)通常要考慮以下幾個(gè)方面的性能指標(biāo)。
1)可管理性
可管理性是指服務(wù)器的管理是否方便、快捷,應(yīng)用軟件是否豐富。在可管理性方面,基于Widows NT/2000平臺(tái)的個(gè)人計(jì)算機(jī)服務(wù)器要優(yōu)于Unix服務(wù)器。
2)可用性
可用性是指在一般時(shí)間內(nèi)服務(wù)器可供訪問者正常使用的時(shí)間的百分比。.提高可用性有兩個(gè)方面的考慮:減少硬件平均故障時(shí)間和利用專用功能機(jī)制。專用功能機(jī)制可在出現(xiàn)故障時(shí)自動(dòng)執(zhí)行系統(tǒng)或部件切換機(jī)制,以避免或減少意外停機(jī)。
3)高性能
這是指服務(wù)器綜合性能指標(biāo)要高。主要要求在運(yùn)行速度、磁盤空間、容錯(cuò)能力、擴(kuò)展能力、穩(wěn)定性、監(jiān)測(cè)功能及電源等方面具有較高的性能指標(biāo)。尤其是硬盤和電源的熱插拔性能、網(wǎng)卡的自適應(yīng)能力的性能指標(biāo)要高。
4)可擴(kuò)展性
為了使服務(wù)器隨負(fù)荷的增加而平穩(wěn)升級(jí),井保證服務(wù)器工作的穩(wěn)定性和安全性,必須考慮服務(wù)器的可擴(kuò)展性能。首先在機(jī)架上要有為硬盤和電源的增加而留有的充分空間,其次主機(jī)上的插槽不但要種類齊全,而且要有一定的余量。
5)模塊化
模塊化是指電源、網(wǎng)卡、SCSI卡、硬盤等部件為模塊化結(jié)構(gòu),且都是有熱插拔功能,可以在線維護(hù),從而使系統(tǒng)停機(jī)的可能性大大減少。特別是分布式電源技術(shù)可使每個(gè)重要部件都有自己的電源。
以上幾個(gè)方面是所有網(wǎng)站在選購(gòu)服務(wù)器時(shí)要重點(diǎn)考慮的因素。它們之間既互相影響,又各自獨(dú)立。在具體使用時(shí),這些方面的重要性因服務(wù)器工作任務(wù)的不同也有輕重之分,因此必須綜合權(quán)衡。此外,晶牌、價(jià)格、售后服務(wù)及廠商實(shí)力等因素也需要考慮在內(nèi)。
網(wǎng)絡(luò)服務(wù)器[3]
網(wǎng)絡(luò)服務(wù)器是計(jì)算機(jī)局域網(wǎng)的核心部件。網(wǎng)絡(luò)操作系統(tǒng)是在網(wǎng)絡(luò)服務(wù)器上運(yùn)行的,網(wǎng)絡(luò)服務(wù)器的效率直接影響整個(gè)網(wǎng)絡(luò)的效率。因此,一般要用高檔計(jì)算機(jī)或?qū)S梅?wù)器計(jì)算機(jī)作為網(wǎng)絡(luò)服務(wù)器。網(wǎng)絡(luò)服務(wù)器主要有以下4個(gè)作用。
·運(yùn)行網(wǎng)絡(luò)操作系統(tǒng),控制和協(xié)調(diào)網(wǎng)絡(luò)中各計(jì)算機(jī)之間的工作,最大限度地滿足用戶的要求,并做出響應(yīng)和處理。
·存儲(chǔ)和管理網(wǎng)絡(luò)中的共享資源,如數(shù)據(jù)庫(kù)、文件、應(yīng)用程序、磁盤空間、打印機(jī)、繪圖儀等。
·為各工作站的應(yīng)用程序服務(wù),如采用客戶/服務(wù)器(Client/Server)結(jié)構(gòu)使網(wǎng)絡(luò)服務(wù)器不僅擔(dān)當(dāng)網(wǎng)絡(luò)服務(wù)器,而且還擔(dān)當(dāng)應(yīng)用程序服務(wù)器。
·對(duì)網(wǎng)絡(luò)活動(dòng)進(jìn)行監(jiān)督及控制,對(duì)網(wǎng)絡(luò)進(jìn)行實(shí)際管理,分配系統(tǒng)資源,了解和調(diào)整系統(tǒng)運(yùn)行狀態(tài),關(guān)閉/啟動(dòng)某些資源等。
刀片服務(wù)器vs.機(jī)架服務(wù)器vs.塔式服務(wù)器
如今的服務(wù)器有幾種不同的種類和配置。在數(shù)據(jù)中心中,采用刀片服務(wù)器、機(jī)架服務(wù)器還是塔式服務(wù)器的決策將影響數(shù)據(jù)中心的性能、空間、預(yù)算以及可擴(kuò)展性。
如今的服務(wù)器有幾種不同的種類和配置。在數(shù)據(jù)中心中,采用刀片服務(wù)器、機(jī)架服務(wù)器還是塔式服務(wù)器的決策將影響數(shù)據(jù)中心的性能、空間、預(yù)算以及可擴(kuò)展性。
以下是機(jī)架式服務(wù)器、刀片式服務(wù)器、塔式服務(wù)器的快速入門指南:用戶可以了解它們的優(yōu)缺點(diǎn),以及每種類型如何適合其服務(wù)器需求。
在深入探討之前,先簡(jiǎn)要了解一下一些基本信息:
?機(jī)架服務(wù)器通常安裝在10英尺高的標(biāo)準(zhǔn)機(jī)架上,從而使數(shù)據(jù)中心可以有效地部署數(shù)十個(gè)機(jī)架的服務(wù)器。
?刀片服務(wù)器是安裝在服務(wù)器機(jī)柜中采用小型電路板的服務(wù)器,是在緊湊環(huán)境中實(shí)現(xiàn)高處理能力的絕佳選擇。
?塔式服務(wù)器具有高度的優(yōu)化和自定義功能,使用戶可以根據(jù)自己的需求匹配更高的配置。
什么是機(jī)架服務(wù)器?
機(jī)架服務(wù)器是安裝在機(jī)架內(nèi)部的服務(wù)器。機(jī)架服務(wù)器通常是支持廣泛的應(yīng)用程序和計(jì)算基礎(chǔ)架構(gòu)的通用服務(wù)器。服務(wù)器垂直堆疊在機(jī)架中,以節(jié)省數(shù)據(jù)中心的空間。
標(biāo)準(zhǔn)化機(jī)架以1.75英寸高、19英寸寬的單位(U)計(jì)量。機(jī)架式服務(wù)器通過垂直倍增的方法適應(yīng)這些尺寸,這意味著機(jī)架服務(wù)器的高度可能是1U、4U、10U或更高,例如和2016年推出的10英尺高的70U機(jī)架一樣。另外還制造了符合機(jī)架單元標(biāo)準(zhǔn)的附加設(shè)備,因此用戶可以充分利用機(jī)架空間。
機(jī)架式服務(wù)器專業(yè)版
?獨(dú)立式:每個(gè)機(jī)架式服務(wù)器都有作為獨(dú)立或網(wǎng)絡(luò)系統(tǒng)運(yùn)行所需的一切:其自身的電源、CPU和內(nèi)存。這使得機(jī)架式服務(wù)器能夠運(yùn)行密集的計(jì)算操作。
?效率:機(jī)架式服務(wù)器可高效利用有限的數(shù)據(jù)中心空間,并且能夠通過額外的內(nèi)存、存儲(chǔ)和處理器輕松擴(kuò)展。如果管理員共享或集群服務(wù)器數(shù)據(jù)以獲得冗余,則熱插拔機(jī)架式服務(wù)器在操作上很簡(jiǎn)單。
?經(jīng)濟(jì)高效:以較低的成本提高管理和能源效率。
機(jī)架服務(wù)器的缺點(diǎn)
?電源使用:緊湊的機(jī)架需要更多的冷卻裝置,這會(huì)增加能源成本。大量的機(jī)架服務(wù)器將總體上提高能源需求。
?維護(hù):密集的機(jī)架需要更多的故障排除和管理時(shí)間。
什么是刀片服務(wù)器?
刀片服務(wù)器是由多個(gè)模塊化電路板構(gòu)建而成。大多數(shù)刀片服務(wù)器由CPU、網(wǎng)絡(luò)控制器和內(nèi)存構(gòu)建而成,也有一些刀片服務(wù)器配備內(nèi)部存儲(chǔ)驅(qū)動(dòng)器。其他任何組件(例如開關(guān)、端口和電源連接器)都通過機(jī)箱共享。
刀片服務(wù)器機(jī)箱通常采用機(jī)架通用的尺寸,從而可以節(jié)省部署空間。管理員可以將刀片服務(wù)器集群化,或者將每臺(tái)刀片服務(wù)器作為單獨(dú)的服務(wù)器進(jìn)行管理和操作,例如將應(yīng)用程序和最終用戶分配給特定的刀片服務(wù)器。他們的模塊化架構(gòu)支持熱插拔操作。在刀片服務(wù)器外部有一個(gè)小手柄,因此插拔或更換刀片服務(wù)器很簡(jiǎn)單。
刀片服務(wù)器具有強(qiáng)大的處理能力,可以滿足復(fù)雜的計(jì)算需求。如果數(shù)據(jù)中心具有足夠的散熱和能量來(lái)支持密集的基礎(chǔ)設(shè)施,則它們可以擴(kuò)展到更高的性能級(jí)別。
刀片服務(wù)器專業(yè)版
?低能耗:單獨(dú)的機(jī)箱為多個(gè)刀片服務(wù)器供電,而不是為一個(gè)機(jī)架中的多臺(tái)服務(wù)器供電和冷卻。這樣可以減少能源消耗。
?處理能力:刀片服務(wù)器提供更高的處理能力,同時(shí)占用更小的空間。
?多用途:它們可以承載主操作系統(tǒng)和虛擬機(jī)監(jiān)控程序、數(shù)據(jù)庫(kù)、應(yīng)用程序、Web服務(wù)和其他企業(yè)級(jí)流程和應(yīng)用程序。
?可用性:刀片服務(wù)器環(huán)境簡(jiǎn)化了集中式監(jiān)視和維護(hù)、負(fù)載平衡以及集群故障轉(zhuǎn)移。熱插拔還有助于提高系統(tǒng)可用性。
刀片服務(wù)器的缺點(diǎn)
?前期成本:隨著時(shí)間的推移,由于簡(jiǎn)化管理界面、降低能耗,將會(huì)降低運(yùn)營(yíng)費(fèi)用。但是,初始投資、部署和配置成本可能很高。
?能源成本:高密度的刀片服務(wù)器需要先進(jìn)的環(huán)境控制。為了保持刀片服務(wù)器的性能,加熱、冷卻和通風(fēng)都是必要的開支。
什么是塔式服務(wù)器?
塔式服務(wù)器是采用獨(dú)立機(jī)箱的服務(wù)器。它們使用最少的組件和軟件進(jìn)行制造,因此中型企業(yè)和客戶可以針對(duì)特定任務(wù)大量定制服務(wù)器。例如,塔式服務(wù)器通常不附帶其他組件,如高級(jí)顯卡、更多內(nèi)存或外圍設(shè)備。
塔式服務(wù)器通常面向那些希望定制其服務(wù)器并維護(hù)自定義升級(jí)路徑的客戶。例如,客戶可以將塔式服務(wù)器配置為通用服務(wù)器、通信服務(wù)器、Web服務(wù)器或使用HTTP協(xié)議集成的網(wǎng)絡(luò)服務(wù)器。用戶可以訂購(gòu)他們需要的定制服務(wù),或者在塔式服務(wù)器運(yùn)送到他們的站點(diǎn)時(shí)自己定制。另一種使用情況是小型企業(yè)需要一個(gè)功能強(qiáng)大的服務(wù)器來(lái)運(yùn)行多個(gè)流程和應(yīng)用程序。
塔式服務(wù)器從外觀上看與臺(tái)式機(jī)類似,而且和臺(tái)式機(jī)一樣,不共享輸入設(shè)備。多臺(tái)塔式服務(wù)器安裝將需要單獨(dú)的鍵盤、鼠標(biāo)和顯示器;或者可以共享外圍設(shè)備的開關(guān)。它們可以像任何其他類型的服務(wù)器一樣共享網(wǎng)絡(luò)存儲(chǔ)。
塔式服務(wù)器專業(yè)版
?高效的可擴(kuò)展性:塔式服務(wù)器配置最少,因此它可以根據(jù)業(yè)務(wù)需要對(duì)其進(jìn)行定制和升級(jí),它們比滿載的服務(wù)器價(jià)格更低。
?冷卻成本低:由于組件密度低,冷卻塔式服務(wù)器的成本低于緊湊的機(jī)架式服務(wù)器或刀片服務(wù)器。
塔式服務(wù)器的缺點(diǎn)
?升級(jí)費(fèi)用。許多客戶購(gòu)買塔式服務(wù)器是為了定制,而不是為了降低投資成本。高端硬件組件和軟件將顯著提高其價(jià)格。
?占用空間大:塔式服務(wù)器不適合放在機(jī)架中,并占用更多的數(shù)據(jù)中心空間。需要打開機(jī)箱以進(jìn)行故障排除和添加或升級(jí)內(nèi)部組件。
?需要進(jìn)行外圍設(shè)備管理:在多個(gè)塔式服務(wù)器環(huán)境中,IT團(tuán)隊(duì)必須配備交換機(jī)或?qū)⑼獠吭O(shè)備重新插入每臺(tái)單服務(wù)器。
刀片式服務(wù)器vs.機(jī)架式服務(wù)器vs.塔式服務(wù)器的概覽
這三種類型的服務(wù)器都可以在數(shù)據(jù)中心工作。用戶根據(jù)自己的實(shí)際需求進(jìn)行選擇。以下是關(guān)于適合用戶的計(jì)算需求和數(shù)據(jù)中心構(gòu)建的占地面積和架構(gòu)。
三、數(shù)據(jù)中心地址
數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),用來(lái)在internet網(wǎng)絡(luò)基礎(chǔ)設(shè)施上傳遞、加速、展示、計(jì)算、存儲(chǔ)數(shù)據(jù)信息。
在今后的發(fā)展中,數(shù)據(jù)中心也將會(huì)成為企業(yè)競(jìng)爭(zhēng)的資產(chǎn),商業(yè)模式也會(huì)因此發(fā)生改變。隨著數(shù)據(jù)中心應(yīng)用的廣泛化,人工智能、網(wǎng)絡(luò)安全等也相繼出現(xiàn),更多的用戶都被帶到了網(wǎng)絡(luò)和手機(jī)的應(yīng)用中。隨著計(jì)算機(jī)和數(shù)據(jù)量的增多,人們也可以通過不斷學(xué)習(xí)積累提升自身的能力,是邁向信息化時(shí)代的重要標(biāo)志。
數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),用來(lái)在因特網(wǎng)絡(luò)基礎(chǔ)設(shè)施上傳遞、加速、展示、計(jì)算、存儲(chǔ)數(shù)據(jù)信息。數(shù)據(jù)中心大部分電子元件都是由低直流電源驅(qū)動(dòng)運(yùn)行的。
數(shù)據(jù)中心的產(chǎn)生致使人們的認(rèn)識(shí)從定量、結(jié)構(gòu)的世界進(jìn)入到不確定和非結(jié)構(gòu)的世界中,它將和交通、網(wǎng)絡(luò)通訊一樣逐漸成為現(xiàn)代社會(huì)基礎(chǔ)設(shè)施的一部分,進(jìn)而對(duì)很多產(chǎn)業(yè)都產(chǎn)生了積極影響。不過數(shù)據(jù)中心的發(fā)展不能僅憑經(jīng)驗(yàn),還要真正的結(jié)合實(shí)踐,促使數(shù)據(jù)中心發(fā)揮真正的價(jià)值作用,促使社會(huì)的快速變革。
隨著數(shù)據(jù)中心行業(yè)在全球的蓬勃發(fā)展,隨著社會(huì)經(jīng)濟(jì)的快速增長(zhǎng),數(shù)據(jù)中心的發(fā)展建設(shè)將處于高速時(shí)期,再加上各地政府部門給予新興產(chǎn)業(yè)的大力扶持,都為數(shù)據(jù)中心行業(yè)的發(fā)展帶來(lái)了很大的優(yōu)勢(shì)。隨著數(shù)據(jù)中心行業(yè)的大力發(fā)展,將來(lái)在很多城市中都會(huì)有很大的發(fā)展空間,一些大型的數(shù)據(jù)中心也會(huì)越來(lái)越多。2017年全球經(jīng)歷了前所未有的自然災(zāi)害之后,很多數(shù)據(jù)中心管理人員都在積極制定災(zāi)難恢復(fù)計(jì)劃。例如就可以通過云計(jì)算工具對(duì)電力使用的功率進(jìn)行限制,在遭遇停電時(shí)間時(shí)將允許以降低的功率繼續(xù)運(yùn)行,可以為電力企業(yè)的正常運(yùn)行提供有效的保障。還可以利用數(shù)據(jù)中心指定備份計(jì)劃,對(duì)服務(wù)器的操作進(jìn)行拓展,就不需要通過關(guān)閉和重啟服務(wù)器操作。
數(shù)據(jù)中心是與人力資源、自然資源一樣重要的戰(zhàn)略資源,在信息時(shí)代下的數(shù)據(jù)中心行業(yè)中,只有對(duì)數(shù)據(jù)進(jìn)行大規(guī)模和靈活性的運(yùn)用,才能更好的去理解數(shù)據(jù),運(yùn)用數(shù)據(jù),才能促使我國(guó)數(shù)據(jù)中心行業(yè)快速高效發(fā)展,體現(xiàn)出國(guó)家發(fā)展的大智慧。海量數(shù)據(jù)的產(chǎn)生,也促使信息數(shù)據(jù)的收集與處理發(fā)生了重要的轉(zhuǎn)變,企業(yè)也從實(shí)體服務(wù)走向了數(shù)據(jù)服務(wù)。產(chǎn)業(yè)界需求與關(guān)注點(diǎn)也發(fā)生了轉(zhuǎn)變,企業(yè)關(guān)注的重點(diǎn)轉(zhuǎn)向了數(shù)據(jù),計(jì)算機(jī)行業(yè)從追求的計(jì)算能力轉(zhuǎn)變?yōu)閿?shù)據(jù)處理能力,軟件業(yè)也將從編程為主向數(shù)據(jù)為主轉(zhuǎn)變,云計(jì)算的主導(dǎo)權(quán)也將從分析向服務(wù)轉(zhuǎn)變。
在信息時(shí)代下,數(shù)據(jù)中心的產(chǎn)生,更多的網(wǎng)絡(luò)內(nèi)容也將不再由專業(yè)網(wǎng)站或者特定人群所產(chǎn)生,而是由全體網(wǎng)民共同參與。隨著數(shù)據(jù)中心行業(yè)的興起,網(wǎng)民參與互聯(lián)網(wǎng)、貢獻(xiàn)內(nèi)容也更加便捷,呈現(xiàn)出多元化。巨量網(wǎng)絡(luò)數(shù)據(jù)都能夠存儲(chǔ)在數(shù)據(jù)中心,數(shù)據(jù)價(jià)值也會(huì)越來(lái)越高,可靠性能也在進(jìn)一步加強(qiáng)。
常見故障
數(shù)據(jù)中心網(wǎng)絡(luò)常見的通訊故障主要集中在:硬件故障、系統(tǒng)故障兩個(gè)類別:
(1)硬件故障:
數(shù)據(jù)中心是通過無(wú)數(shù)計(jì)算機(jī)硬件組成的,硬件出現(xiàn)問題,就會(huì)導(dǎo)致部分功能無(wú)法正常發(fā)揮或運(yùn)作。無(wú)論是設(shè)備、線路、端口,哪一點(diǎn)出現(xiàn)故障,都會(huì)導(dǎo)致網(wǎng)絡(luò)通訊故障的出現(xiàn)。硬件方面的故障相對(duì)比較容易查找,例如線路故障,一般的成因就是線路明顯的老化或者破損,而影響到了整體網(wǎng)絡(luò)的運(yùn)營(yíng);再比如,端口故障,計(jì)算機(jī)端口作為數(shù)據(jù)中心網(wǎng)絡(luò)的重要環(huán)節(jié),若出現(xiàn)接觸不良、損壞等傳輸問題,就會(huì)影響到整體網(wǎng)絡(luò)的運(yùn)行。硬件故障只要進(jìn)行逐一排查,就可以及時(shí)進(jìn)行更換處理,相對(duì)比較好解決。
(2)系統(tǒng)故障:
數(shù)據(jù)中心是計(jì)算機(jī)領(lǐng)域比較熱門的研究之一,因此研究技術(shù)十分成熟。計(jì)算機(jī)網(wǎng)絡(luò)構(gòu)成主要包括TREE、FAT-TREE、BCUBE、FICONN等,主要采用模塊化、層次化、扁平化的設(shè)計(jì)思路與虛擬化的分割管理技術(shù),將成千上萬(wàn)臺(tái)設(shè)備,以單元為單位進(jìn)行劃分,逐一進(jìn)行管理。通過分層、遞歸的結(jié)構(gòu)進(jìn)行聯(lián)結(jié),盡可能的避免了所謂“關(guān)鍵節(jié)點(diǎn)”的存在。這樣組合也形成了良好的冗余與容錯(cuò)性,如果其中出現(xiàn)故障的某一個(gè)或某幾個(gè)單元,沒有被檢測(cè)出來(lái),也不至于影響數(shù)據(jù)中心的整體運(yùn)行。但是如果超出一定比例,就會(huì)在影響數(shù)據(jù)中心網(wǎng)絡(luò)的高速運(yùn)行,拉慢網(wǎng)絡(luò)通訊的速度,所以仍舊需要針對(duì)性的查找故障進(jìn)行處理。
故障處理
(1)分析故障現(xiàn)象:
一般來(lái)說由于構(gòu)成組件比較復(fù)雜,故障也呈現(xiàn)出不同的表現(xiàn)方式。因此想要對(duì)于故障進(jìn)行分析,就要先了解故障的現(xiàn)象。例如,應(yīng)用方面出現(xiàn)了支付系統(tǒng)支付不了,網(wǎng)頁(yè)難以打開等問題,那么就要逐一檢查相關(guān)的故障點(diǎn),有哪幾個(gè)故障是上述表現(xiàn),如,線路故障,端口故障等,就要更換線路、端口等設(shè)備。因此,需要針對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)的幾種常見的故障進(jìn)行收集與整理,根據(jù)現(xiàn)象,進(jìn)行檢索、查找。
(2)測(cè)試并確認(rèn)故障范圍,進(jìn)行故障點(diǎn)定位。
所有的應(yīng)用業(yè)務(wù)是在這些物理硬件正常運(yùn)行的基礎(chǔ)上開展的,其中某些硬件出現(xiàn)問題就會(huì)導(dǎo)致故障。根據(jù)故障的表現(xiàn),需要針對(duì)各個(gè)部分進(jìn)行篩選檢查,例如,對(duì)于服務(wù)器進(jìn)行測(cè)試,檢查網(wǎng)絡(luò)設(shè)備等。針對(duì)問題表現(xiàn),進(jìn)行逐一排除,最終敲定故障點(diǎn)所在位置。
(3)如果以上硬件故障都已經(jīng)排除,那么就是計(jì)算機(jī)系統(tǒng)的故障,這一故障需要建立故障模型進(jìn)行診斷,根據(jù)PMC模型進(jìn)行定義。通過分層測(cè)試的方法,查找問題單元,即正常單元測(cè)試正常單元、正常單元測(cè)試故障單元、故障單元測(cè)試故障單元、故障單元測(cè)試正常單元等四種。其中后三種的檢測(cè)結(jié)果都是故障,因此就可以通過分層測(cè)量的方式,建立有限個(gè)單元,通過矩陣以及螢火蟲算法重點(diǎn)FAFD算法對(duì)于其他單元進(jìn)行診斷,最終確定故障的系統(tǒng)是哪個(gè)或者哪幾個(gè)單元的。當(dāng)然也可以通過鏡像、流量統(tǒng)計(jì)、抓包等其他手段確定故障所在的設(shè)備范圍,進(jìn)而縮小范圍,集中處理某一個(gè)或者幾個(gè)設(shè)備。
(4)收集重要的數(shù)據(jù)信息。
在進(jìn)行故障處理時(shí),通過收集設(shè)備的日志、診斷、操作記錄等信息資料,將這些數(shù)據(jù)資料進(jìn)行匯總,條件允許的情況下,建立故障數(shù)據(jù)庫(kù),對(duì)于常見問題可以做到“出現(xiàn)即處理”,對(duì)于沒有出現(xiàn)過的故障,可以繼續(xù)收集進(jìn)數(shù)據(jù)庫(kù)。總之,必要的信息收集,有利于日后更好的查找故障原因,確保數(shù)據(jù)中心網(wǎng)絡(luò)健康、平穩(wěn)運(yùn)行。
發(fā)展前景
數(shù)據(jù)中心
在信息時(shí)代下,數(shù)據(jù)中心也為更多企業(yè)帶來(lái)了便利和經(jīng)濟(jì)效益,例如騰訊公司的QQ,幾乎每一個(gè)手機(jī)用戶都有。還有百度的出現(xiàn),可以為用戶提供更便捷和智能的各種搜索服務(wù),用戶可以在百度中準(zhǔn)確地獲取病癥的原因、癥狀、治療信息等,還可以通過百度在線咨詢醫(yī)生,在線掛號(hào),大大降低了人們獲得醫(yī)療信息和服務(wù)的門檻。還有阿里巴巴的云計(jì)算、微信等出現(xiàn),更一步的促進(jìn)了數(shù)據(jù)中心的發(fā)展。在今后的發(fā)展中,數(shù)據(jù)中心也將會(huì)成為企業(yè)競(jìng)爭(zhēng)的資產(chǎn),商業(yè)模式也會(huì)因此發(fā)生改變。隨著數(shù)據(jù)中心應(yīng)用的廣泛化,人工智能、網(wǎng)絡(luò)安全等也相繼出現(xiàn),更多的用戶都被帶到了網(wǎng)絡(luò)和手機(jī)的應(yīng)用中。隨著計(jì)算機(jī)和數(shù)據(jù)量的增多,人們也可以通過不斷學(xué)習(xí)積累提升自身的能力,是邁向信息化時(shí)代的重要標(biāo)志。
冷卻技術(shù)
數(shù)據(jù)中心冷卻技術(shù)的發(fā)展有以下趨勢(shì)。
一、末端冷卻設(shè)備貼近服務(wù)器
以前數(shù)據(jù)中心機(jī)房普通采用房間級(jí)空調(diào),地板下送風(fēng)的冷卻方式。該方式建設(shè)成本低,機(jī)房利用率高,用于解決3~5kW的單機(jī)柜發(fā)熱。但隨著機(jī)架式、刀片式服務(wù)器在機(jī)房大量應(yīng)用,單機(jī)柜內(nèi)設(shè)備數(shù)量、功率密度、發(fā)熱密度都有顯著提高。傳統(tǒng)的機(jī)房級(jí)空調(diào)已經(jīng)不能解決IT設(shè)備的散熱問題,行級(jí)空調(diào)、背板空調(diào)應(yīng)運(yùn)而生。這種新型的空調(diào)末端更貼近熱源,能解決局部熱點(diǎn)、高發(fā)熱密度的問題,通過近距離的冷量傳輸,減小風(fēng)機(jī)功耗,達(dá)到節(jié)能。不論房間級(jí)空調(diào),還是行級(jí)空調(diào)、背板空調(diào),都是先冷卻空氣,再通過冷空氣與服務(wù)器的CPU進(jìn)行熱交換來(lái)降溫。由于空氣的換熱效率、熱流密度很低,空冷服務(wù)器有冷卻能耗高、噪聲大、設(shè)備密度低等問題。為解決超高功率密度IT設(shè)備散熱難題,數(shù)據(jù)中心開始采用液冷技術(shù),使用工作流體作為中間熱量傳輸?shù)拿浇?#xff0c;將熱量從發(fā)熱區(qū)傳遞到遠(yuǎn)處再進(jìn)行冷卻。液冷技術(shù)冷卻效率顯著高于風(fēng)冷散熱,可有效解決高密度服務(wù)器的散熱問題,降低冷卻系統(tǒng)能耗而且減少噪聲。
二、重視冷卻系統(tǒng)節(jié)能
隨著數(shù)據(jù)中心的競(jìng)爭(zhēng)加劇,運(yùn)營(yíng)成本的壓力增大,冷卻系統(tǒng)的節(jié)能研究迫在眉睫。隨著耐高溫服務(wù)器的出現(xiàn),越來(lái)越多的數(shù)據(jù)中心逐步嘗試開發(fā)使用free-cooling(自然冷卻)。自然冷源的利用主要有以下2種方向。
1、新風(fēng)直接冷卻
典型的案例就是Facebook在美國(guó)俄勒岡州普林維爾的數(shù)據(jù)中心。室外新風(fēng)經(jīng)過濾處理后,進(jìn)行加濕降溫,然后通過風(fēng)扇墻送入機(jī)架的進(jìn)風(fēng)口,室外新風(fēng)經(jīng)服務(wù)器加熱后排到室外。這種方式對(duì)室外空氣質(zhì)量的要求高,寧夏中衛(wèi)的一些數(shù)據(jù)中心嘗試應(yīng)用了該技術(shù)。
2、利用深層湖水、江水冷卻
典型的案例是湖南省資興市東江湖數(shù)據(jù)中心。東江湖為我國(guó)中南地區(qū)最大的人工湖,冷水資源豐富。東江湖面積160平方千米,蓄水量8.12×109立方米。其下游小東江水溫常年低于10℃,水流穩(wěn)定且水質(zhì)達(dá)到國(guó)家一級(jí)標(biāo)準(zhǔn)。全年90%的時(shí)間不需要機(jī)械制冷,采用江水直冷冷卻,預(yù)計(jì)年平均PUE為1.15。
應(yīng)用
一個(gè)數(shù)據(jù)中心的主要目的是運(yùn)行應(yīng)用來(lái)處理商業(yè)和運(yùn)作的組織的數(shù)據(jù)。這樣的系統(tǒng)屬于并由組織內(nèi)部開發(fā),或者從企業(yè)軟件供應(yīng)商那里買。像通用應(yīng)用有ERP和CRM系統(tǒng)。一個(gè)數(shù)據(jù)中心也許只關(guān)注于操作體系結(jié)構(gòu)或者也提供其他的服務(wù)。常常這些應(yīng)用由多個(gè)主機(jī)構(gòu)成,每個(gè)主機(jī)運(yùn)行一個(gè)單一的構(gòu)件。通常這種構(gòu)件是數(shù)據(jù)庫(kù),文件服務(wù)器,應(yīng)用服務(wù)器,中間件以及其他的各種各樣的東西。數(shù)據(jù)中心也常常用于非工作站點(diǎn)的備份。公司也許預(yù)定被數(shù)據(jù)中心提供的服務(wù)。這常常聯(lián)合備份磁帶使用。備份能夠?qū)⒎?wù)器本地的東西放在磁帶上,然而,磁帶存放場(chǎng)所也易受火災(zāi)和洪水的安全威脅。較大的公司也許發(fā)送他們的備份到非工作場(chǎng)所。這個(gè)通過回投而能夠被數(shù)據(jù)中心完成。加密的備份能夠通過Internet發(fā)送到另一個(gè)數(shù)據(jù)中心,安全保存起來(lái)。為了災(zāi)難恢復(fù),各種大的硬件供應(yīng)商開發(fā)了移動(dòng)設(shè)備解決方案,能夠安裝并在短時(shí)間內(nèi)可操作。供應(yīng)商像思科系統(tǒng),Sun微系統(tǒng),IBM和HP開發(fā)的系統(tǒng)能夠用于這個(gè)目的。
四、數(shù)據(jù)中心的能耗
數(shù)據(jù)中心能效指標(biāo)對(duì)新建數(shù)據(jù)中心方案設(shè)計(jì)和在用數(shù)據(jù)中心運(yùn)維管理等方面都具有十分重要的作用。目前,已經(jīng)有幾十種針對(duì)數(shù)據(jù)中心性能進(jìn)行評(píng)價(jià)的指標(biāo),PUE、ASHRAE 90.4、CADE、EEUE等指標(biāo)主要對(duì)數(shù)據(jù)中心能效進(jìn)行評(píng)估。除了數(shù)據(jù)中心整體能效指標(biāo)外,亦有大量針對(duì)數(shù)據(jù)中心設(shè)備、子系統(tǒng)等方面的能效評(píng)估指標(biāo),其中包括微模塊、空調(diào)、服務(wù)器的能效指標(biāo)。從設(shè)備級(jí)到系統(tǒng)級(jí)的能耗評(píng)價(jià)指標(biāo),在指導(dǎo)數(shù)據(jù)中心技術(shù)演進(jìn)、設(shè)備研發(fā)、綠色運(yùn)維、能耗模型優(yōu)化等方面具有重要的意義。本文將主要介紹PUE、微模塊和服務(wù)器的能效指標(biāo),從數(shù)據(jù)中心整體、子系統(tǒng)、設(shè)備3個(gè)維度梳理能效指標(biāo)。
2007年,綠色網(wǎng)格(The Green Grid)提出PUE的概念,公式(1)為PUE的定義公式。
(1)
其中,Ptotal為數(shù)據(jù)中心總耗電,包含IT設(shè)備耗電、制冷耗電、照明耗電等;PIT為數(shù)據(jù)中心中IT設(shè)備耗電。在數(shù)據(jù)中心耗電中,IT設(shè)備耗電所占的比重越高,證明越少的電能被應(yīng)用于制冷、照明等,能源利用效率越高。根據(jù)公式可知,PUE的值應(yīng)該大于1,且其值越接近于1時(shí),數(shù)據(jù)中心能源效率越高。
目前,PUE能效指標(biāo)是業(yè)界公認(rèn)的、影響范圍較大的評(píng)估指標(biāo),我國(guó)政府、企業(yè)、科研機(jī)構(gòu)都將PUE作為評(píng)估數(shù)據(jù)中心能效的重要依據(jù)。以PUE計(jì)算公式為基準(zhǔn),針對(duì)不同數(shù)據(jù)中心的特點(diǎn)和計(jì)算要求,PUE的計(jì)算方法會(huì)略有不同。以Google為例,公式(2)為其公布的PUE計(jì)算公式。
(2)
其中,ESIS代表對(duì)冷卻裝置、照明、辦公場(chǎng)所及一些聯(lián)網(wǎng)設(shè)備進(jìn)行供電的設(shè)施變電站的能源消耗,EITS代表對(duì)服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)設(shè)備和機(jī)房空調(diào)(CRAC)進(jìn)行供電的IT變電站的能源消耗,ETX代表中高壓變壓器損耗,EHV代表高壓電纜損耗,ELV代表低壓電纜損耗,EF代表現(xiàn)場(chǎng)燃料(包括天然氣和燃油)的能源消耗,ECRAC CRAC代表能源消耗,EUPS代表對(duì)服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)設(shè)備的不間斷供電(UPS)造成的能量損耗,ENet1代表類型1單位分電站供給的機(jī)房能源。根據(jù)Google官方的說明,采用以上方法得到的PUE結(jié)果更加苛刻。
(2)微模塊能效指標(biāo)
微模塊集配電、制冷、監(jiān)控、照明等于一體,可快速安裝部署,是近年來(lái)數(shù)據(jù)中心領(lǐng)域研究的重點(diǎn)之一。模塊化的數(shù)據(jù)中心由多個(gè)相對(duì)獨(dú)立的微模塊系統(tǒng)組成,微模塊的能耗情況直接影響著數(shù)據(jù)中心的整體能耗情況。2018年11月,TGG(中國(guó))發(fā)布《微模塊產(chǎn)品PUE測(cè)試規(guī)范》,在標(biāo)準(zhǔn)方面對(duì)微模塊能效指標(biāo)、測(cè)量環(huán)境、測(cè)量步驟等進(jìn)行規(guī)范。其中,微模塊PUE定義與數(shù)據(jù)中心PUE定義相似,是微模塊產(chǎn)品總輸入能耗(IMDC Total Energy)與微模塊產(chǎn)品IT設(shè)備能耗(IMDC IT Equipment Energy)的比值。為了統(tǒng)一測(cè)試條件,更加客觀地評(píng)價(jià)不同條件下微模塊的能效指標(biāo),測(cè)試規(guī)范要求測(cè)試在焓差實(shí)驗(yàn)室進(jìn)行。測(cè)試規(guī)范又考慮了IT負(fù)載對(duì)PUE的影響,在模擬室外側(cè)溫度分別為-5℃、5℃、15℃、25℃、35℃的情況下,測(cè)量微模塊IT負(fù)載為25%、50%、75%、100%情況下的PUE值。最終通過公式(3),得到微模塊在不同地區(qū)某個(gè)負(fù)載下的全年平均PUE。其中,PUEaPUEe分別代表室外溫度-5℃35℃時(shí),某個(gè)負(fù)載下的PUE值;Ta~Tb代表某個(gè)地區(qū)全年溫度分布系數(shù)。
3)服務(wù)器能效指標(biāo)
研究機(jī)構(gòu)和企業(yè)一直都在對(duì)服務(wù)器、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備等進(jìn)行能耗與節(jié)能的研究,以期可以制定評(píng)價(jià)標(biāo)準(zhǔn)、研發(fā)評(píng)測(cè)工具、推動(dòng)節(jié)能技術(shù)發(fā)展。美國(guó)環(huán)境保護(hù)署(EPA)聯(lián)合Intel、IBM、DELL等公司,于2009年發(fā)布能源之星服務(wù)器規(guī)范1.0版本,該規(guī)范成為業(yè)界較權(quán)威的服務(wù)器能效標(biāo)準(zhǔn),并且規(guī)范在持續(xù)更新之中。在服務(wù)器電源方面,規(guī)范對(duì)電源效率和功率因素進(jìn)行規(guī)范;在服務(wù)器方面,規(guī)范根據(jù)不同類型的服務(wù)器種類對(duì)空閑功耗情況提出要求,同時(shí)也對(duì)服務(wù)器的擴(kuò)展組件功耗進(jìn)行規(guī)范。
三、能耗模型建立過程
能耗模型建立過程中,應(yīng)當(dāng)遵循全系統(tǒng)、精確、快速、通用性、彈性、簡(jiǎn)單等原則。圖1為能耗模型的建立過程,并將對(duì)能耗建立過程進(jìn)行分析。
(1)能耗組成與關(guān)聯(lián)情況分析
通過對(duì)數(shù)據(jù)中心總體架構(gòu)、設(shè)備組成與分布、IT設(shè)備部署等情況進(jìn)行分析,進(jìn)而分析數(shù)據(jù)中心能耗組成、占比情況,并對(duì)影響能耗的因素進(jìn)行逐一梳理;在得到數(shù)據(jù)中心設(shè)備能耗組成與環(huán)境條件后,對(duì)設(shè)備間、設(shè)備與環(huán)境間的關(guān)聯(lián)和影響關(guān)系進(jìn)行分析,為能耗模型選擇建立基礎(chǔ)。
(2)能耗模型選擇
通過對(duì)能耗組成和關(guān)聯(lián)情況的分析,并結(jié)合數(shù)據(jù)中心能耗數(shù)據(jù)采集和設(shè)備自動(dòng)化控制等方面的因素,從數(shù)據(jù)中心總體、子系統(tǒng)、設(shè)備3個(gè)層級(jí),綜合選擇適用于數(shù)據(jù)中心能耗建模、易于數(shù)據(jù)中心能耗優(yōu)化的模型。同時(shí),能耗模型宜根據(jù)數(shù)據(jù)中心實(shí)際情況和3個(gè)層級(jí)各自的特點(diǎn),分別選擇聚類、線性回歸、深度學(xué)習(xí)等數(shù)據(jù)挖掘方法。
(3)能耗數(shù)據(jù)采集
數(shù)據(jù)是建模的關(guān)鍵,為實(shí)現(xiàn)能耗模型的建立,需使用傳感器對(duì)數(shù)據(jù)中心實(shí)時(shí)運(yùn)行數(shù)據(jù)進(jìn)行采集。
(4)能耗模型訓(xùn)練與調(diào)優(yōu)
模型和數(shù)據(jù)選擇完成后,需要完成對(duì)模型的訓(xùn)練;在訓(xùn)練過程中,應(yīng)當(dāng)調(diào)整參數(shù)不斷優(yōu)化模型,并利用新生成的數(shù)據(jù)對(duì)模型的效果進(jìn)行驗(yàn)證和改進(jìn)。
(5)能耗模型應(yīng)用
能耗建模的最終目的是通過能耗模型服務(wù)于數(shù)據(jù)中心能耗管理,提高能效。建模完成后可以對(duì)數(shù)據(jù)中心能耗情況進(jìn)行預(yù)測(cè),并為能效優(yōu)化提供基礎(chǔ)支撐。
能耗數(shù)據(jù)采集和建模方法選擇是能耗建模的關(guān)鍵,其中能耗數(shù)據(jù)采集主要完成溫度、負(fù)載、IT設(shè)備、UPS、空調(diào)等環(huán)境信息與設(shè)備狀態(tài)的實(shí)時(shí)數(shù)據(jù)采集;能耗建模是以外部數(shù)據(jù)、歷史數(shù)據(jù)、實(shí)時(shí)數(shù)據(jù)等為基礎(chǔ),結(jié)合聚類、線性回歸算法、非線性回歸算法、深度學(xué)習(xí)等數(shù)學(xué)模型,從而構(gòu)建準(zhǔn)確的能耗模型;能耗模型主要應(yīng)用于數(shù)據(jù)中心狀態(tài)預(yù)測(cè)、資源調(diào)度優(yōu)化等方面。其中,能耗數(shù)據(jù)采集、能耗建模是數(shù)據(jù)中心能耗模型建立的重要步驟。
(一)能耗數(shù)據(jù)采集
數(shù)據(jù)中心能耗模型的建立依賴于數(shù)據(jù)中心監(jiān)控?cái)?shù)據(jù)的獲取,而實(shí)時(shí)能耗分析與預(yù)測(cè)、設(shè)備動(dòng)態(tài)調(diào)控等都對(duì)數(shù)據(jù)中心實(shí)時(shí)監(jiān)測(cè)有更高的要求。因此,數(shù)據(jù)中心能耗模型建立的基礎(chǔ)之一是進(jìn)行能耗數(shù)據(jù)的采集。能耗數(shù)據(jù)采集主要包括以下方面:
(1)IT設(shè)備運(yùn)行與負(fù)載情況:包含服務(wù)器、交換機(jī)、存儲(chǔ)系統(tǒng)等設(shè)備,可以通過監(jiān)控和采集上述設(shè)備的CPU、內(nèi)存、流量等信息,實(shí)現(xiàn)設(shè)備業(yè)務(wù)運(yùn)行狀態(tài)的監(jiān)控。
(2)數(shù)據(jù)中心硬件設(shè)備能耗數(shù)據(jù):包含IT設(shè)備、供配電設(shè)備、制冷設(shè)備、照明設(shè)備等,應(yīng)當(dāng)從不同層級(jí)、不同粒度上監(jiān)控設(shè)備及模塊的電流、電壓等相關(guān)信息。
(3)非IT類設(shè)備狀態(tài)信息:包含空調(diào)、UPS等設(shè)備,主要監(jiān)測(cè)設(shè)備的負(fù)載率、運(yùn)行設(shè)置等情況。
(4)數(shù)據(jù)中心環(huán)境監(jiān)測(cè)數(shù)據(jù):包含數(shù)據(jù)中心內(nèi)部機(jī)房溫度和濕度、外部天氣環(huán)境溫度和濕度等,其中制冷系統(tǒng)的送回風(fēng)溫度等也應(yīng)是重點(diǎn)監(jiān)控信息。
能耗數(shù)據(jù)采集是能耗模型建立的基礎(chǔ),全面而詳細(xì)的數(shù)據(jù),有利于模型建立、能耗預(yù)測(cè)等后續(xù)工作的開展。因此,數(shù)據(jù)采集應(yīng)當(dāng)覆蓋數(shù)據(jù)中心的各個(gè)方面,目前國(guó)內(nèi)外數(shù)據(jù)中心建設(shè)、運(yùn)維公司都在數(shù)據(jù)中心安裝了大量的傳感器,以便于實(shí)時(shí)了解數(shù)據(jù)中心的各種狀態(tài)。根據(jù)Google在數(shù)據(jù)中心方面公開的資料,目前其數(shù)據(jù)中心的幾千個(gè)傳感器,實(shí)時(shí)采集溫度、耗電量、泵速、設(shè)備運(yùn)行設(shè)定等數(shù)據(jù)。相對(duì)而言,國(guó)內(nèi)數(shù)據(jù)中心目前整體數(shù)據(jù)監(jiān)控與采集仍然粗放,為實(shí)現(xiàn)能耗模型建立、精細(xì)化管理等目標(biāo),首先需要建立完善的狀態(tài)監(jiān)控與數(shù)據(jù)采集系統(tǒng)。
(二)能耗建模方法
學(xué)術(shù)界與產(chǎn)業(yè)界提出了諸多能耗模型的建立方法,部分方案已經(jīng)通過實(shí)踐驗(yàn)證,并取得了較好的效果。本文將主要對(duì)聚類、線性回歸、深度學(xué)習(xí)3種模型建立方式進(jìn)行討論。
(1)基于聚類的能耗模型優(yōu)化方案
聚類是一種無(wú)監(jiān)督學(xué)習(xí)的方法,可以在無(wú)任何先知前提下,根據(jù)物體本身特性對(duì)其類別進(jìn)行劃分。將聚類算法應(yīng)用于能耗模型,可以快速簡(jiǎn)單地發(fā)現(xiàn)不同能耗狀態(tài)之間的關(guān)系,從而對(duì)能耗狀態(tài)類別進(jìn)行劃分,并制定每種狀態(tài)下的類別優(yōu)化策略,實(shí)現(xiàn)能耗模型建立與能效優(yōu)化的目標(biāo)。
利用聚類進(jìn)行能耗模型的建立與能效優(yōu)化的過程中,首先應(yīng)選擇合適的聚類算法;然后調(diào)整參數(shù)實(shí)現(xiàn)對(duì)采集數(shù)據(jù)的類簇劃分;再選取各個(gè)類簇中心,以其為研究基礎(chǔ),探討能效優(yōu)化的方法。在數(shù)據(jù)中心運(yùn)維管理實(shí)踐中,已經(jīng)采用了聚類的方法。以聚類作為構(gòu)建能耗模型的方法,優(yōu)點(diǎn)是簡(jiǎn)單易行,但存在精度不高、優(yōu)化方案工作量大等方面的問題。
(2)基于線性回歸的能耗模型優(yōu)化方案
回歸分析通過建立模型,研究自變量與因變量之間的關(guān)系。在變量關(guān)系分析、預(yù)測(cè)、時(shí)間序列問題研究等方面具有重要的作用。回歸分析又可分為線性回歸、邏輯回歸等不同的方法。而多元線性回歸模型是能耗建模分析中常用的方法,其主要討論因變量與多個(gè)自變量之間的線性關(guān)系。公式(4)為多元線性回歸模型的計(jì)算公式。
(4)
線性回歸不僅可以對(duì)數(shù)據(jù)中心總體能耗模型進(jìn)行擬合,同時(shí)也應(yīng)用在服務(wù)器、制冷系統(tǒng)等設(shè)備和子系統(tǒng)的能耗模型建立上。相對(duì)聚類,線性回歸能夠更加精準(zhǔn)的建立能耗模型,但是當(dāng)能耗變量較多、數(shù)據(jù)量較大時(shí),模型建立將變得困難。
(3)基于深度學(xué)習(xí)的能耗模型優(yōu)化方案
隨著數(shù)據(jù)中心建設(shè)水平的不斷提高,一方面監(jiān)控設(shè)備的采樣能力不斷增強(qiáng),采集數(shù)據(jù)的種類和數(shù)量都不斷增多;另一方面,數(shù)據(jù)中心設(shè)備的自動(dòng)化水平不斷提高,集中化的精細(xì)式管控成為可能。多樣與全面的數(shù)據(jù),讓構(gòu)建更加優(yōu)秀的模型成為可能,集中化的設(shè)備管控為數(shù)據(jù)中心能耗的降低提供基礎(chǔ);然而,與之而來(lái)的就是更加復(fù)雜的能耗模型構(gòu)建,該模型需要根據(jù)每個(gè)數(shù)據(jù)中心的不同特點(diǎn),建立設(shè)備間的相互影響關(guān)系,以及不同環(huán)境下設(shè)備的實(shí)時(shí)調(diào)控方式。
上述問題對(duì)傳統(tǒng)能耗模型構(gòu)建方式、傳統(tǒng)設(shè)備調(diào)度策略帶來(lái)了挑戰(zhàn)。于是,各個(gè)機(jī)構(gòu)開始嘗試?yán)蒙疃葘W(xué)習(xí)建立模型,并制定數(shù)據(jù)中心資源調(diào)度優(yōu)化規(guī)則。通過深度學(xué)習(xí)訓(xùn)練CNN、RNN等神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)構(gòu)建數(shù)據(jù)中心能耗模型,形成資源調(diào)度策略的目標(biāo)。根據(jù)Google的公開資料,目前其已經(jīng)將深度學(xué)習(xí)應(yīng)用于數(shù)據(jù)中心能耗的管理。圖2為Google應(yīng)用深度學(xué)習(xí)管理能耗前后的PUE變化,應(yīng)用深度學(xué)習(xí)后,制冷能耗減少40%,PUE降低約15%。利用深度學(xué)習(xí)能夠通過處理大量的數(shù)據(jù),建立更加復(fù)雜的模型;但與此同時(shí),也對(duì)能耗數(shù)據(jù)采集、自動(dòng)化控制等方面提出了更高的要求。
參考文獻(xiàn)
鄂大偉主編.計(jì)算機(jī)網(wǎng)絡(luò)與應(yīng)用技術(shù).中國(guó)物資出版社,1998年01月第1版.
勞動(dòng)和社會(huì)保障部教材辦公室組織編寫.電子商務(wù)師、高級(jí)電子商務(wù)師.中國(guó)勞動(dòng)社會(huì)保障出版社,2003.10.
李丕賢,劉德山主編.大學(xué)計(jì)算機(jī)基礎(chǔ).人民郵電出版社,2008.9.
石述紅.信息時(shí)代的數(shù)據(jù)中心[J].數(shù)字通信世界,2018,(11):136.
顏仕禮.數(shù)據(jù)中心網(wǎng)絡(luò)常見通訊故障分析與處理[J].通訊世界,2019,26(1):141.
潘俊,王克勇,王晨平, 等.簡(jiǎn)述數(shù)據(jù)中心冷卻技術(shù)發(fā)展趨勢(shì)[J].電信快報(bào),2019,(2):43-44.
王少鵬、王樹嶺《信息通信技術(shù)與政策》2019年第2期
總結(jié)
- 上一篇: Nginx源码安装(CentOS7)
- 下一篇: protues7 使用笔记