业务连续性管理—第四篇—业务连续性总结和灾难恢复
一、引言
在我們?nèi)粘9ぷ髦谐3?huì)將業(yè)務(wù)連續(xù)性管理(BCM)和災(zāi)難恢復(fù)(DR)兩個(gè)概念混淆,兩者之間有內(nèi)在聯(lián)系,但也有所不同。業(yè)務(wù)連續(xù)性管理更加寬泛,關(guān)注企業(yè)的戰(zhàn)略,以保障業(yè)務(wù)運(yùn)營(yíng)為目標(biāo),解決全生命周期的問(wèn)題,而后者更加注重具體操作,以系統(tǒng)為目標(biāo),著重解決事中的問(wèn)題,同步處理事后的問(wèn)題。一般來(lái)講,可以將災(zāi)難恢復(fù)做為業(yè)務(wù)連續(xù)性的一個(gè)部分,但不是全部。
1)按照CISSP中的定義
災(zāi)難恢復(fù)的目標(biāo)是盡量減少災(zāi)難或中斷帶來(lái)的影響。這意味著要采取必要的步驟以確保資源、人員和業(yè)務(wù)流程能夠及時(shí)恢復(fù)運(yùn)行。這與連續(xù)性規(guī)劃不同,連續(xù)性規(guī)劃提供給我們處理長(zhǎng)期運(yùn)營(yíng)中斷和災(zāi)難的方法和程序。災(zāi)難恢復(fù)計(jì)劃的目標(biāo)是在災(zāi)難之后,處理災(zāi)難及其后果;災(zāi)難恢復(fù)計(jì)劃已信息技術(shù)為核心。災(zāi)難恢復(fù)計(jì)劃是當(dāng)一切事情仍處于緊急模式時(shí)實(shí)施的計(jì)劃,其中每個(gè)人都爭(zhēng)相所有關(guān)鍵系統(tǒng)重新聯(lián)機(jī)。業(yè)務(wù)連續(xù)性規(guī)劃采取一個(gè)更廣泛的解決問(wèn)題的方法。它可以包括在計(jì)劃實(shí)施中對(duì)原有設(shè)施進(jìn)行恢復(fù)的同時(shí)在另一個(gè)環(huán)境中恢復(fù)關(guān)鍵系統(tǒng),使正確的人在這段時(shí)間內(nèi)回到正確的位置,在不同的模式下執(zhí)行業(yè)務(wù)直到常規(guī)條件恢復(fù)為止。
2)按照NIST SP800-34的定義
業(yè)務(wù)連續(xù)性計(jì)劃(BCP):業(yè)務(wù)連續(xù)性計(jì)劃的重點(diǎn)是在中斷期間和中斷之后維持組織的任務(wù)/業(yè)務(wù)流程。任務(wù)/業(yè)務(wù)流程的示例可以是組織的工資單流程或客戶服務(wù)流程。業(yè)務(wù)連續(xù)性計(jì)劃可以針對(duì)單個(gè)業(yè)務(wù)單元內(nèi)的任務(wù)/業(yè)務(wù)流程編寫,也可以針對(duì)整個(gè)組織的流程。
災(zāi)難恢復(fù)計(jì)劃(DRP):DRP適用于拒絕長(zhǎng)期訪問(wèn)主要設(shè)施基礎(chǔ)設(shè)施的重大、通常是物理性服務(wù)中斷。DRP是一種以信息系統(tǒng)為中心的計(jì)劃,旨在在緊急情況發(fā)生后恢復(fù)備用站點(diǎn)上目標(biāo)系統(tǒng)、應(yīng)用程序或計(jì)算機(jī)設(shè)施基礎(chǔ)設(shè)施的可操作性。一旦備用設(shè)施建立,DRP可由多個(gè)信息系統(tǒng)應(yīng)急計(jì)劃提供支持,以解決受影響的單個(gè)系統(tǒng)的恢復(fù)問(wèn)題。DRP可以通過(guò)在備用位置恢復(fù)任務(wù)/業(yè)務(wù)流程或任務(wù)基本功能的支持系統(tǒng)來(lái)支持BCP或COOP計(jì)劃。DRP只處理需要重新定位的信息系統(tǒng)中斷。
3)按照GB/T 30145-2013/ISO 22301:2012和GB/T 20988-2007 定義
業(yè)務(wù)連續(xù)性管理 (business continuity management):識(shí)別對(duì)組織的潛在威脅以及這些威脅一旦發(fā)生可能對(duì)業(yè)務(wù)運(yùn)行帶來(lái)的影響的一整套管理過(guò)程。該過(guò)程為組織建立有效應(yīng)對(duì)威脅的自我恢復(fù)能力提供了框架,以保護(hù)關(guān)鍵相關(guān)方的利益、聲譽(yù)、品牌和創(chuàng)造價(jià)值的活動(dòng)。
業(yè)務(wù)連續(xù)性計(jì)劃:用于指導(dǎo)組織在業(yè)務(wù)中斷時(shí)進(jìn)行響應(yīng)、恢復(fù)、重新開(kāi)始和還原到預(yù)先確定的業(yè)務(wù)運(yùn)行水平的形式文件的程序。
災(zāi)難恢復(fù) (disaster recovery):為了將信息系統(tǒng)從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運(yùn)行狀態(tài)、并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài),而設(shè)計(jì)的活動(dòng)和流程。
總結(jié):
針對(duì)三個(gè)標(biāo)準(zhǔn)的理解,各個(gè)標(biāo)準(zhǔn)關(guān)于術(shù)語(yǔ)定義描述各有側(cè)重,但筆者更加傾向于NSIT的定義。筆者認(rèn)為:業(yè)務(wù)連續(xù)性計(jì)劃是基于企業(yè)戰(zhàn)略的、處理長(zhǎng)期的、面向中斷中和后維持業(yè)務(wù)連續(xù)性的規(guī)劃,核心是業(yè)務(wù)連續(xù);災(zāi)難恢復(fù)計(jì)劃是面向重大的、災(zāi)難性的系統(tǒng)故障,在異地恢復(fù)業(yè)務(wù)暫時(shí)性正常運(yùn)轉(zhuǎn)的計(jì)劃。災(zāi)難恢復(fù)解決的臨時(shí)性的、針對(duì)異地恢復(fù)的臨時(shí)性計(jì)劃。業(yè)務(wù)連續(xù)性管理從涉及的內(nèi)容看,包含了災(zāi)難恢復(fù)計(jì)劃,還包括高可用性。業(yè)務(wù)連續(xù)性更多側(cè)重策劃、執(zhí)行和管控,災(zāi)難恢復(fù)更注重執(zhí)行。
本文是筆者近期,短時(shí)間內(nèi)所學(xué)的總結(jié),一定會(huì)有理解不對(duì)的地方,后期根據(jù)知識(shí)的更新,會(huì)進(jìn)行更新??傊瑯I(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù),無(wú)論從安全角度,還是企業(yè)運(yùn)營(yíng)的角度是十分重要的。其投資回報(bào)是隱性的,但不能因?yàn)榭床坏?,摸不著就不投入,一旦事件發(fā)生,后悔莫及。因此規(guī)劃須是自上而下的執(zhí)行,首先要先從思想的統(tǒng)一,需要高層的支持,作為一把手工程去抓,否則就成了光說(shuō)不練假把式。
以下內(nèi)容,主要以IT的視角對(duì)業(yè)務(wù)連續(xù)和災(zāi)難恢復(fù)進(jìn)行總結(jié)。
二、業(yè)務(wù)連續(xù)性管理
業(yè)務(wù)連續(xù)性管理具體包括:
出現(xiàn)緊急情況時(shí)提供及時(shí)和適當(dāng)?shù)膽?yīng)對(duì)措施
保護(hù)生命和確保安全
減少對(duì)業(yè)務(wù)的影響
恢復(fù)關(guān)鍵業(yè)務(wù)功能
在災(zāi)難時(shí)減少混亂
確保企業(yè)的生存能力
在災(zāi)難發(fā)生后迅速“啟動(dòng)并運(yùn)行”
具體流程和里面涉及的細(xì)節(jié)進(jìn)行闡述。
1.BCP的啟動(dòng)階段工作
1)BCP項(xiàng)目啟動(dòng)前準(zhǔn)備活動(dòng)
確定BCP需求,可以包括有針對(duì)性的風(fēng)險(xiǎn)分析以識(shí)別關(guān)鍵系統(tǒng)可能的中斷
了解相關(guān)法律、法規(guī)、行業(yè)規(guī)范以及機(jī)構(gòu)的業(yè)務(wù)和技術(shù)規(guī)劃的要求,以確保BCP與其一致
任命BCP項(xiàng)目負(fù)責(zé)人,建立BCP團(tuán)隊(duì),包括業(yè)務(wù)和技術(shù)部門的代表
制定項(xiàng)目管理計(jì)劃書(shū),其中應(yīng)明確項(xiàng)目范圍、目標(biāo)、方法、責(zé)任、任務(wù)以及進(jìn)度
召開(kāi)項(xiàng)目啟動(dòng)會(huì),獲得管理層支持
確定收集數(shù)據(jù)所需的自動(dòng)化工具
設(shè)置必要的技能培訓(xùn)和意識(shí)提升活動(dòng)
2)工作任務(wù)
計(jì)劃的開(kāi)發(fā)團(tuán)隊(duì)與管理層的溝通和聯(lián)絡(luò)
有權(quán)與計(jì)劃相關(guān)所有人進(jìn)行直接接觸和溝通
充分了解業(yè)務(wù)中斷對(duì)機(jī)構(gòu)業(yè)務(wù)的影響
熟悉機(jī)構(gòu)的需求和運(yùn)作,有能力平衡機(jī)構(gòu)相關(guān)部門的不同需求
與高級(jí)管理層對(duì)話
了解機(jī)構(gòu)業(yè)務(wù)方向和高管理層的意圖
有能力影響高級(jí)管理層的決策
3)BCP項(xiàng)目的關(guān)鍵角色
恢復(fù)團(tuán)隊(duì):災(zāi)難后進(jìn)行評(píng)估、恢復(fù)、復(fù)原等相關(guān)工作的多個(gè)團(tuán)隊(duì)
業(yè)務(wù)部門代表:識(shí)別機(jī)構(gòu)的關(guān)鍵業(yè)務(wù)功能,協(xié)助恢復(fù)策略的選擇和制定
IT部門
通信部門
信息安全部門
法律代表
必須建立的團(tuán)隊(duì):
損失評(píng)估團(tuán)隊(duì):確定災(zāi)難原因;確定進(jìn)一步破壞的可能性;標(biāo)識(shí)影響的業(yè)務(wù)和領(lǐng)域;標(biāo)識(shí)關(guān)鍵資源可用程度;標(biāo)識(shí)必要的資源;評(píng)估要多久完成。若評(píng)估時(shí)間超過(guò)原來(lái)評(píng)估的MTD值,立即啟動(dòng)升級(jí)BCP。
還原/重建團(tuán)隊(duì)(restoration):讓備用站點(diǎn)投入運(yùn)營(yíng)
救援團(tuán)隊(duì)(salvage): 把備份站點(diǎn)在轉(zhuǎn)到主站點(diǎn),讓主站點(diǎn)恢復(fù)運(yùn)營(yíng)。
3)BCP目標(biāo)
確定信息收集技術(shù)
選擇受訪者
識(shí)別關(guān)鍵業(yè)務(wù)功能(critical business functions)及其支持資源
確定如果失去這些資源的支持這些功能能存活多久
識(shí)別弱點(diǎn)和威脅
計(jì)算每個(gè)業(yè)務(wù)功能的風(fēng)險(xiǎn)
準(zhǔn)備提交BIA報(bào)告:存在的問(wèn)題、應(yīng)對(duì)建議
BCP策略:BCP規(guī)劃最終應(yīng)該形成業(yè)務(wù)連續(xù)性策略條款,該條款記錄的BCP的目標(biāo)、范圍、需求、基本原則和指導(dǎo)方針、職責(zé)和責(zé)任、關(guān)鍵環(huán)節(jié)的基本要求。策略條款應(yīng)得到高級(jí)管理層的正式批準(zhǔn),并公布成為機(jī)構(gòu)的政策,指導(dǎo)業(yè)務(wù)連續(xù)性的相關(guān)工作。
2.BIA分析
主要工作內(nèi)容:
確定關(guān)鍵功能
確定關(guān)鍵資源
計(jì)算MTD資源
識(shí)別威脅
計(jì)算風(fēng)險(xiǎn)
確定方案
1)BIA過(guò)程
2)BIA分析方法
定性分析以劃分嚴(yán)重程度的方式得出災(zāi)難或中斷事件造成的影響
定量分析以貨幣的方式得出災(zāi)難或中斷事件造成的影響
BIA的信息分析過(guò)程:整理(Organize) 歸納(Correlate) 分析(Analyses)和確認(rèn)(Confirm)
BIA分析中斷的影響,確定每項(xiàng)業(yè)務(wù)功能的恢復(fù)窗口,具體會(huì)涉及幾個(gè)值:
工作復(fù)原時(shí)間, Work Recovery Time,WRT:從系統(tǒng)正常運(yùn)轉(zhuǎn),恢復(fù)業(yè)務(wù)的時(shí)間(數(shù)據(jù)恢復(fù))
恢復(fù)時(shí)間目標(biāo),Recovery Time Object,RTO:在系統(tǒng)的不可用性嚴(yán)重影響到機(jī)構(gòu)之前所允許消耗的最長(zhǎng)時(shí)
恢復(fù)點(diǎn)目標(biāo),Recovery Point Objectives,RPO:數(shù)據(jù)必須被恢復(fù)以便繼續(xù)進(jìn)行處理的點(diǎn)。所允許的最大數(shù)據(jù)損失量
RTO+WRT<=MTD
關(guān)于MTD與RPO、RTO和WRT的關(guān)系如下圖:
關(guān)于網(wǎng)絡(luò)和資源可用性指標(biāo)
平均修復(fù)時(shí)間(MTTR):修復(fù)一臺(tái)設(shè)備并使其投入生產(chǎn)狀態(tài)所需的時(shí)間
平均無(wú)故障時(shí)間(MTTF):計(jì)算機(jī)系統(tǒng)平均能夠正常運(yùn)行多長(zhǎng)時(shí)間,才發(fā)生一次故障。系統(tǒng)的可用性越高,平均無(wú)故障時(shí)間越長(zhǎng)。
平均故障時(shí)間間隔(MTBF):期望一臺(tái)設(shè)備可靠運(yùn)行估計(jì)時(shí)間.是衡量一個(gè)產(chǎn)品(尤其是電器產(chǎn)品)的可靠性指標(biāo),單位為“小時(shí)”。它反映了產(chǎn)品的時(shí)間質(zhì)量,是體現(xiàn)產(chǎn)品在規(guī)定時(shí)間內(nèi)保持功能的一種能力。
總結(jié):組件越多,整體可靠性越低
3)風(fēng)險(xiǎn)評(píng)估
應(yīng)當(dāng)識(shí)別、評(píng)估和記錄以下內(nèi)容:
組織中對(duì)時(shí)間最敏感的資源和活動(dòng)的所有脆弱點(diǎn)
組織中最緊迫的資源以及活動(dòng)的威脅和危害
衡量關(guān)鍵的服務(wù)和產(chǎn)品中斷的可能性、時(shí)間長(zhǎng)度以及造成的影響。
單點(diǎn)故障的情況
由于關(guān)鍵技能的缺失造成的業(yè)務(wù)連續(xù)風(fēng)險(xiǎn)
由于外包供應(yīng)商和供應(yīng)商造成的業(yè)務(wù)持續(xù)性風(fēng)險(xiǎn)
因BCP計(jì)劃沒(méi)有涵蓋本部門或者BCP計(jì)劃沒(méi)有很好地落實(shí)而造成的業(yè)務(wù)連續(xù)性風(fēng)險(xiǎn)
3.確定預(yù)防控制措施
主要的目標(biāo)實(shí)施控制,以降低風(fēng)險(xiǎn)
1)數(shù)據(jù)備份方案的選擇
數(shù)據(jù)備份開(kāi)始位置:歸檔位。
歸檔位:操作系統(tǒng)的文件系統(tǒng)通過(guò)設(shè)定歸檔位來(lái)跟蹤發(fā)生變化的文件。
完全備份(fullbackup):整個(gè)數(shù)據(jù)的備份
增量備份(incrementalprocess):對(duì)最近完全備份和增量備份以后發(fā)生的所有文件進(jìn)行備份;階段性疊加;占用空間少,但恢復(fù)慢,恢復(fù)時(shí)需要把所有增量加上全備份進(jìn)行恢復(fù)
差量備份(differentialprocess):對(duì)最近完全備份發(fā)生改變的部分進(jìn)行備份;與完全備份的差異部分備份;需要空間大,恢復(fù)快?;謴?fù)時(shí)只需要最新一次差量和一個(gè)完備
具體關(guān)系圖如下:
完全備份是增量備份和差異備份的前提條件,首次需要先完成一次完全備份后才能開(kāi)在增量備份、差異備份。若選擇差異備份,當(dāng)要恢復(fù)數(shù)據(jù)時(shí)需要選擇一次完全備份和以此完全備份為基礎(chǔ)的最近一次的差異備份,這種方式的缺點(diǎn)是備份時(shí)間長(zhǎng)、占用空間大,例如開(kāi)始數(shù)據(jù)10G,每天增加1G,那么完全備份的數(shù)據(jù)是10G,第一天的差異備份是1G,第二天的是1G+1G,第三天的是1G+1G+1G,這樣恢復(fù)時(shí),只需要恢復(fù)一個(gè)完全備份,選一個(gè)需要恢復(fù)時(shí)間點(diǎn)的差異備份即可;若選擇增量備份,但恢復(fù)數(shù)據(jù)時(shí)需要選擇一次完全備份和以此完全備份為基礎(chǔ)的所有增量備份,這種方式缺點(diǎn)是恢復(fù)慢,例如開(kāi)始書(shū)記10G,每天增量1G,那么完全備份的數(shù)據(jù)是10G,第一天是1G,第二天是1G,第三天是1G,這樣恢復(fù)時(shí),需要先恢復(fù)完全備份,然后恢復(fù)第一天,再恢復(fù)第2天,再恢復(fù)第3天。順序不能亂。
2)高可用性
應(yīng)用層(負(fù)載均衡+高可用)、數(shù)據(jù)層(rac)、設(shè)施層(HA)
3)電子備份解決方案
磁盤映像(diskduplexing)(RAID 1)
電子傳送(electronicvaulting):在文件發(fā)生改變時(shí)進(jìn)行備份,再定期傳送到另一個(gè)地點(diǎn);不是實(shí)時(shí) (使用備份軟件)
電子鏈接:一種實(shí)時(shí)備份到異地設(shè)施批量傳送方法(使用備份軟件/備份設(shè)備)
遠(yuǎn)程日志處理(remotejournaling):離線數(shù)據(jù)傳輸方法;只將日志或事務(wù)處理日志傳送到異地,不傳送實(shí)際文件;類似數(shù)據(jù)庫(kù)的歸檔;通過(guò)日志可重建丟失的數(shù)據(jù),實(shí)際為數(shù)據(jù)被增刪改的記錄;實(shí)時(shí)發(fā)生(歸檔日志)
4)設(shè)施選擇
完備場(chǎng)所(hot sit):擁有與主站點(diǎn)的所有軟硬件設(shè)施,唯一缺的是數(shù)據(jù)。在幾個(gè)小時(shí)就能投入運(yùn)營(yíng)
基本完備場(chǎng)所(warm site):只配置了主要軟硬件
基礎(chǔ)場(chǎng)所(cold site):只提供機(jī)房環(huán)境
軟件備份:代碼第三方托管
5)其他因素
網(wǎng)絡(luò)和計(jì)算機(jī)設(shè)備冗余
語(yǔ)音和數(shù)據(jù)通信資源冗余
人力資源
設(shè)備和人員運(yùn)送
環(huán)境問(wèn)題
數(shù)據(jù)和人員安全
辦公資源
文檔記錄
外包:一種風(fēng)險(xiǎn)轉(zhuǎn)移措施
互惠協(xié)議(reciprocal agreements):組織間用于分享宕機(jī)風(fēng)險(xiǎn)。在災(zāi)難發(fā)生時(shí),每個(gè)組織承諾承擔(dān)彼此的數(shù)據(jù)和處理任務(wù)。
4.制定恢復(fù)策略
業(yè)務(wù)流程、設(shè)施、供應(yīng)和技術(shù)、用戶和用戶環(huán)境、數(shù)據(jù)
恢復(fù)策略的選擇必須符合組織需求
成本效益分析(CBA)
建立策略的初始費(fèi)用
維護(hù)恢復(fù)策略解決方案的持續(xù)費(fèi)用
方案定期測(cè)試的費(fèi)用
通信相關(guān)的費(fèi)用
5.制定BCP
文檔化程序包括:計(jì)劃程序、恢復(fù)程序、恢復(fù)解決方案、角色和任務(wù)、應(yīng)急響應(yīng)
業(yè)務(wù)連續(xù)性計(jì)劃流程如下:
a)確定業(yè)務(wù)關(guān)鍵功能
公司的業(yè)務(wù)計(jì)劃通常就決定了公司關(guān)鍵的使命和業(yè)務(wù)功能。必須為這些功能設(shè)定優(yōu)先級(jí)別
b)確定支持關(guān)鍵功能的資源和系統(tǒng)
在確定了關(guān)鍵的功能之后,就有必要找出實(shí)現(xiàn)這些功能究竟需要那些支持。
需要有人來(lái)對(duì)這些資源進(jìn)行分析,這樣的分析應(yīng)該由那些理解資源并知道它們是如何為企業(yè)提供功能的人來(lái)完成。
c)估計(jì)潛在的災(zāi)難事件
確定所有可能的意外事故和災(zāi)難
BIA的結(jié)果作為以上的輸入。
d)選擇計(jì)劃策略
制定有關(guān)如何恢復(fù)關(guān)鍵資源和評(píng)估應(yīng)急方案
6)實(shí)施策略
一旦決定了策略,就需要將它們歸檔,這使得我們的努力從純粹的計(jì)劃階段進(jìn)入到了實(shí)際的實(shí)施和行動(dòng)階段。
6.操作、演練和測(cè)試
需要對(duì)業(yè)務(wù)連續(xù)性計(jì)劃做定期測(cè)試,因?yàn)榄h(huán)境總是在持續(xù)變化,每一次測(cè)試都能夠帶來(lái)一些改進(jìn)。一般會(huì)形成以下計(jì)劃:
測(cè)試計(jì)劃
改進(jìn)計(jì)劃
培訓(xùn)計(jì)劃
1)具體測(cè)試類型包括:
清單/檢查表測(cè)試(checkling test):計(jì)劃副本發(fā)涉及的部門讓他們審核,避免出現(xiàn)不切實(shí)際或遺漏的措施。
各部分分頭審核提意見(jiàn)
組織演練測(cè)試/結(jié)構(gòu)化排練測(cè)試(structured walk-through test):各部門人員聚在一起審核計(jì)劃。
聚集在一起審核提意見(jiàn)
模擬測(cè)試(simulation test):所有相關(guān)人聚集在一起,根據(jù)某個(gè)場(chǎng)景展開(kāi)練習(xí)如何執(zhí)行災(zāi)難恢復(fù)計(jì)劃。測(cè)試每個(gè)人的反應(yīng)。確保沒(méi)有遺漏步驟。測(cè)試過(guò)程只包含哪些實(shí)際災(zāi)難中可能存在的情況。測(cè)試一直持續(xù)到搬到了異地設(shè)施處并真正配置了替換設(shè)備為止。
所有人聚集一起測(cè)試,選定場(chǎng)景,知道設(shè)備搬到異地備份結(jié)束。
并行測(cè)試(parallel test):系統(tǒng)搬到備用廠所運(yùn)行,然后與原廠所對(duì)比。
只系統(tǒng)搬到異地,本地還運(yùn)行,對(duì)比分析
全中端測(cè)試(full-interrupution test):完全模擬真實(shí)場(chǎng)景,原站點(diǎn)關(guān)閉,備用站點(diǎn)啟用。
本地全停用,異地啟用,管理層批準(zhǔn),先要完成并行測(cè)試。
2)測(cè)試策略包含測(cè)試目標(biāo)和范圍
測(cè)試BCP/DRP 每年至少測(cè)試一次: 當(dāng)重大變更發(fā)生時(shí)需要進(jìn)行測(cè)試
測(cè)試目標(biāo)剛開(kāi)始可以簡(jiǎn)單逐漸增加復(fù)雜度、參與級(jí)別、職能以及物理位置
測(cè)試不要危及正常業(yè)務(wù)運(yùn)行
測(cè)試展示在模擬危機(jī)下各種管理和響應(yīng)能力,逐漸增加更多的資源和參與者
揭示不恰當(dāng)之處以便修正測(cè)試程序
考慮偏離測(cè)試腳本插入意外事件,比如關(guān)鍵個(gè)人或服務(wù)的損失
包括足量所有類型交易確?;謴?fù)設(shè)施適當(dāng)?shù)哪芰凸δ?/p>
測(cè)試策略包含測(cè)試計(jì)劃:基于預(yù)定的測(cè)試范圍和目標(biāo)
包含測(cè)試計(jì)劃評(píng)審程序
包含各種測(cè)試場(chǎng)景和方法的開(kāi)發(fā)
測(cè)試計(jì)劃:主測(cè)試計(jì)劃應(yīng)包括所有的測(cè)試目標(biāo)
測(cè)試目標(biāo)和方法的具體描述
所有測(cè)試參加者包括支持人員的角色
測(cè)試參與者的委派
測(cè)試決策制定者和后續(xù)計(jì)劃
測(cè)試位置
測(cè)試升級(jí)條件和測(cè)試聯(lián)系信息
7.維護(hù)BCP
整合到變更控制流程中,主要包括:
分配責(zé)任
更新計(jì)劃
更新后發(fā)布
8.應(yīng)急事件處理流程
再造階段(reconstittutionphase):當(dāng)公司開(kāi)始搬回原來(lái)的場(chǎng)所或搬進(jìn)一個(gè)新設(shè)施時(shí)。
三、災(zāi)難恢復(fù)計(jì)劃
災(zāi)難恢復(fù):指自然或人為災(zāi)害后,重新啟用信息系統(tǒng)的數(shù)據(jù)、硬件及軟件設(shè)備,恢復(fù)正常商業(yè)運(yùn)作的過(guò)程。
災(zāi)難恢復(fù)目標(biāo):降低災(zāi)難或業(yè)務(wù)中斷的影響;采取必要的步驟保證資源、人員和業(yè)務(wù)流程盡快恢復(fù)運(yùn)作。往往更加關(guān)注IT層面。
預(yù)防性措施與恢復(fù)戰(zhàn)略的區(qū)別
預(yù)防性是不僅降低公司經(jīng)歷災(zāi)難的可能性,同時(shí)減輕破壞程度,對(duì)災(zāi)難本身進(jìn)行緩解
恢復(fù)戰(zhàn)略是災(zāi)難發(fā)生后用于保護(hù)公司的方法,利用提供備用場(chǎng)所,對(duì)災(zāi)難本身沒(méi)有啥改變
業(yè)務(wù)流程恢復(fù):是一組相互關(guān)聯(lián)的步驟,它通過(guò)特定的決策活動(dòng)完成具體的任務(wù)
DR包括反應(yīng)、人員、溝通、評(píng)估、恢復(fù)和培訓(xùn)
災(zāi)難恢復(fù)計(jì)劃執(zhí)行大體上可以以下幾步組成:
響應(yīng)階段:開(kāi)始判斷災(zāi)難的原因,先分析才能對(duì)癥下藥。
溝通階段:針對(duì)事件情況進(jìn)行溝通評(píng)估
評(píng)估階段:確定需要立即替換的資源、判斷關(guān)鍵系統(tǒng)上線的時(shí)間,為下一步工作作準(zhǔn)備,并確定是否啟動(dòng)BCP計(jì)劃。
恢復(fù)階段:宣告災(zāi)難,開(kāi)始災(zāi)難恢復(fù)。
四、其他相關(guān)計(jì)劃
業(yè)務(wù)連續(xù)性計(jì)劃:著重于恢復(fù)必須重建的業(yè)務(wù)流程而非IT組件
操作連續(xù)性計(jì)劃:在災(zāi)難發(fā)生后建立高級(jí)管理層和總部,說(shuō)明角色、權(quán)威,繼任的先后順序
IT應(yīng)急計(jì)劃:用于網(wǎng)絡(luò)、系統(tǒng)和主要應(yīng)用程序恢復(fù)的過(guò)程計(jì)劃
緊急通信計(jì)劃:包括內(nèi)部和外部溝通結(jié)構(gòu)和角色
網(wǎng)絡(luò)事故響應(yīng)計(jì)劃:主要關(guān)注惡意軟件、入侵攻擊和其他安全問(wèn)題
災(zāi)難恢復(fù)計(jì)劃:重點(diǎn)說(shuō)明在發(fā)生災(zāi)難后恢復(fù)各種IT機(jī)制
場(chǎng)所應(yīng)急計(jì)劃:人員安全和撤離程序。
特別聲明:
1.以上所有描述內(nèi)容部分參考鏈接/文獻(xiàn)未逐一列出,若有侵權(quán),請(qǐng)及時(shí)告知,有則改之無(wú)則加勉。
2.以上僅是學(xué)習(xí)過(guò)程的總結(jié),相信有很多理解偏差的地方,特別希望指出,給予幫助,更新知識(shí)體系,共同進(jìn)步。
3.以上內(nèi)容大部分是采用百度翻譯,結(jié)合自己的理解,所有有些理解偏差的,請(qǐng)批評(píng)指正!
參考文獻(xiàn):
<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false">
來(lái)自為知筆記(Wiz)
總結(jié)
以上是生活随笔為你收集整理的业务连续性管理—第四篇—业务连续性总结和灾难恢复的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 15款优秀移动APP产品原型设计工具
- 下一篇: 电脑版怎么打印资料电脑如何打印资料