漫话:如何给女朋友解释什么是系统可用性? | 技术头条
戳藍字“CSDN云計算”關(guān)注我們哦!
技術(shù)頭條:干貨、簡潔、多維全面。更多云計算精華知識盡在眼前,get要點、solve難題,統(tǒng)統(tǒng)不在話下!
轉(zhuǎn)自:漫話編程
在一個陽光明媚的周二下午,我正在公司里面看著即將發(fā)布的Java 12的新特性,這時候女朋友打來電話。
晚上下班后,女朋友回到家里面和我說,發(fā)現(xiàn)淘寶無法訪問的十幾分鐘后又可以了。


系統(tǒng)的可用性,英文名字為System Usability,即系統(tǒng)服務(wù)不中斷運行時間占實際運行時間的比例。所以,可用性其實是一個百分比,如99.9%。
我們通常會聽說一個詞:高可用,其實指的就是高可用性。高可用指的就是系統(tǒng)服務(wù)不中斷運行時間占實際運行時間的占比更大。
要了解可用性,躲不開的三個體現(xiàn)系統(tǒng)可用性的重要指標(biāo):MTTR、MTTF、MTBF
MTTF 即 Mean Time To Failure,中文為:平均無故障時間。指系統(tǒng)無故障運行的平均時間,取所有從系統(tǒng)開始正常運行到發(fā)生故障之間的時間段的平均值。
MTTR 即 Mean Time To Repair,中文為:平均修復(fù)時間,指系統(tǒng)從發(fā)生故障到維修結(jié)束之間的時間段的平均值。
MTBF 即 Mean Time Between Failure,中文為:平均失效間隔,指系統(tǒng)兩次故障發(fā)生時間之間的時間段的平均值。
上圖,就是一張可以提現(xiàn)三者之間關(guān)系的圖。可以看出:
MTBF?=?MTTF?+?MTTR
按照以上概念,那么系統(tǒng)的可用性指的其實就是:?MTTF / MTBR * 100%?即?MTTF / ( MTTF + MTTR ) * 100%
在實際的情況中,很多系統(tǒng)都是由若干個子系統(tǒng)組成的,那么整個系統(tǒng)的可用性到底該如何計算呢?我們接著來了解下系統(tǒng)結(jié)構(gòu)。
對于串聯(lián)系統(tǒng):
對于并聯(lián)系統(tǒng):

對于組合系統(tǒng):

衡量系統(tǒng)的高可用性,一般通過SLA,全稱Service Level Agrement,也就是有幾個9的高可用性。我們經(jīng)常可以看到很多公司會宣稱自己的系統(tǒng)可以達到99.99%、99.999%等。
工業(yè)界通常通過統(tǒng)計故障發(fā)生到恢復(fù)的時間的方法來測量SLA。一般以年度為單位,統(tǒng)計一年內(nèi)的系統(tǒng)不可用總時長。具體對應(yīng)關(guān)系如下表:

墨菲定律說 “會出錯的事總會出錯”,可用性做到 100 是可望而不可及的。
對于 SLA 指標(biāo)來說,9 的數(shù)字越多可用性越高,宕機時間越少,系統(tǒng)就可以在給定的時刻內(nèi)高比例地正常工作。然而對系統(tǒng)的挑戰(zhàn)就越大,投入的成本也會越高。 比如 5 個 9 要求系統(tǒng)每年只宕機 5 分鐘左右,而 4 個 9 要求每年宕機時間不超過一個小時。這就使得系統(tǒng)需要在設(shè)計、基礎(chǔ)設(shè)施、數(shù)據(jù)備份等不同層面采取多種方式,甚至增加基礎(chǔ)設(shè)施投資來保證可用性。
“當(dāng)你的設(shè)備處理人命關(guān)天的事情,或業(yè)務(wù)中斷一分鐘就會損失百萬美刀,那么你可以考慮 99.99% 的可靠性。” Robertson(Linux 高可用項目開發(fā)者)
不同系統(tǒng)的可用性要求也是不同的,比如:淘寶、京東等這些電商系統(tǒng)用戶量很多,不同區(qū)不同時刻都有大量的用戶在使用系統(tǒng),這必然對系統(tǒng)的可用性要求很高。
據(jù)以往這些系統(tǒng)的故障統(tǒng)計和不準(zhǔn)確地測試數(shù)據(jù)推測,它們目前的可用性是在 3 個 9 到 4 個 9 左右。相對而言,企業(yè)類的工作軟件因為通常只在工作時間被使用,或只在某些特定的地區(qū)使用,或只給某部分人某一特定時間使用,可用性的需求就會低一些。
影響可用性的因素有很多,包括系統(tǒng)故障、基礎(chǔ)設(shè)施故障、數(shù)據(jù)故障、安全攻擊、系統(tǒng)壓力等等。
可用性的保障涉及到很多層面,其中包括但不限于了:
軟件的設(shè)計、編碼、測試、上線和軟件配置管理的水平
工程師的人員技能水平
運維的管理和技術(shù)水平
數(shù)據(jù)中心的運營管理水平
依賴于第三方服務(wù)的管理水平
對待技術(shù)的態(tài)度
一個公司的工程文化
領(lǐng)導(dǎo)者對工程的尊重
下面的表格里,列出了高可用常見的問題和應(yīng)對措施。
保障系統(tǒng)的高可用,并不是一個簡單的事情,上表中列舉的也只是其中一部分方法論,真正的保證高可用,還是需要大量實踐的!
參考資料:
https://blog.csdn.net/hexieshangwang/article/details/49126159
https://dev.to/fangdajiang/-abilities-8e1
https://www.oracle.com/technetwork/cn/community/developer-day/7-critical-busi-sys-solution-360101-zhs.pdf
https://coolshell.cn/articles/17459.html
https://blog.csdn.net/hustspy1990/article/details/78008324
福利
掃描添加小編微信,備注“姓名+公司職位”,加入【云計算學(xué)習(xí)交流群】,和志同道合的朋友們共同打卡學(xué)習(xí)!
推薦閱讀:
趣挨踢 | 用大數(shù)據(jù)扒一扒蔡徐坤的真假流量粉
姚期智提出的"百萬富翁"難題被破解? 多方安全計算MPC到底是個什么鬼?
全民 AI !教育部宣布 35 所高校新增 AI 本科專業(yè)
深度 | 人工智能究竟能否實現(xiàn)?
程序媛報告:調(diào)查了 12,000 名女性開發(fā)者發(fā)現(xiàn),女性比男性更懂 Java!
程序員怒了!你敢削減專利獎金,我敢拒絕提交代碼!
喜歡就點擊“在看”吧
總結(jié)
以上是生活随笔為你收集整理的漫话:如何给女朋友解释什么是系统可用性? | 技术头条的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Boost:GPU上的2D图像中绘制最终
- 下一篇: 利润推动的通货膨胀属于