大型私有云运维实践
戳藍字“CSDN云計算”關注我們哦!
大家下午好!我要分享的題目是國家級私有云的實踐。分享的內容有三部分:
第一部分為什么要建設云?云建設的目標是什么?
第二部分介紹一些云技術發展的趨勢,有些技術也好幾年了,但是最近也遇到一些變化;
第三,自己在私有云運維方面的實踐。
先簡單介紹一下自己,我目前在新鈦云服工作,工作有19 年了,1999 年參加工作,馬上 20 年了。在盛大游戲待了八年,2013 年到珠海金山西山居工作了三年,到 2016 年時到北京中聯潤通工作,主要做私有云,做了一些國家級的項目。
2015年5月份出版了一本書叫《深度實踐KVM》,我是第一作者,還是《運維前線》這本書的策劃人。
也參與翻譯了幾本書,已經出版的有《云原生基礎架構》、《Ceph Cool Book》,還有一本《OpenDayLight寶典》預計快要出版了。
1. 云建設目標
為什么要建設云?這里有個人的思考,也許不對,拿出來跟大家探討。我總結的云建設的火箭模型,云建設的目標是要實現云原生,它有什么特點呢?彈性、持續發布、多租戶、與基礎架構無關、無狀態、充分冗余、自動化、模塊化、微服務。因為要把業務拆微服務實現云原生,首先要實現基礎架構云原生,要實現虛擬機、物理機、容器的管理API化,方便上層調用。
當然這是目標,怎么實現云原生呢?對于創業公司來說首選基于云的無服務器計算,一步可以實現云原生,好處是學習成本低,不好的地方就是要使用公有云,要持續產生成本,每個廠商的接口不一樣,一旦基于某個廠商建設起來很容易被綁定。
第二種方式我們就使用公有云的容器服務,公有云的容器服務相對比較成熟,它會產生費用,而且也很容易產生綁定,容器現在也有通用的接口。
當然還可以自建私有云,再其之上構建云原生的環境,這個缺點是什么?要從構建云的基礎環境開始,周期非常長,要求也非常高。
已有的業務我們要做云原生怎么辦?我們要重構這個業務。當然可以搞雙模IT,舊的不管,新的方面來建設云原生。
現在云原生現狀怎么樣呢?真正實現云原生的企業并不多,就是頭部的企業像BAT這類的,國外的是像谷歌、Facebook。
大部分組織或者有些組織只是實現了使用云主機或者虛擬機,離真正的云原生差距還是很大,還有很多的組織只能叫虛擬化,云可能都談不上。原因是什么?第一個云原生要重構業務,覺得不劃算,沒這方面動力去做改變。
還有就是人才方面的制約,這方面的人要招、培訓都有過程,管理層決心也非常重要,不管實現云原生還是DevOps的決心非常重要,中間會碰到任何問題,沒有管理層的支持很難推進下去。競爭對手如果沒有搞云原生,沒有競爭壓力也就沒有沒有推行云原生的決心,所以目前這個現狀還要維持很長時間。
2. 最近幾個云技術發展趨勢
首先是裸金屬,裸金屬云也喊了很長時間了,這有一份數據,來自于中國移動研究院,騰訊云推出“黑石”物理服務器,還有Oracle、IBM、華為、阿里云、微軟都有裸金屬服務器。這是一個趨勢,裸金屬云發展還是比較快的,到2020年有90億美金的市場份額。
裸金屬云有什么特點?它的計算能力比較強,其實就是物理機。可以做到物理層面的隔離。快速交付,實際上是把物理機API化了。還有一個好處是可以和云產品打透,比如說和對象存儲、VPC都打通,整個云融合在一起。
完全像使用云主機一樣使用裸金屬還是有些困難,比如說云主機有遠程的VNC,有遠程的界面可以看到,但是目前這些公有云提供的裸金屬服務還有沒有遠程桌面的服務,技術上還是有好多需要克服的地方。
哪些場景可以用裸金屬?一是性能要求比較高的,比如說大型在線游戲、基因測序,這種對計算要求比較高的業務,還有一些傳統行業,想核心數據庫,SAP HANA這些。
裸金屬對傳統行業是比較好的,SAP要云化放在云主機上不太現實,現在有一種方式直接可以搬到物理機上,并且放在云上,這是非常有吸引力的解決方案。還有大數據的分析,它的壓力比較高,對壓力、網絡要求比較高,裸金屬也很適合。還有用裸金屬搭建私有容器云,這也是比較靈活的解決方案。
另外就是超融合,超融合喊了好多年了,目前國內很多廠商都在做超融合,看起來也是一種發展趨勢,并且發展比較快。
這是中國超融合2016年的市場數據,每年有20%的增長。超融合好處是開箱即用,缺點是比較貴,不適合大型場景,中小企業比較適合,規模比較大的公司一方面成本比較高,一方面要定制化非常麻煩。
有沒有接口,能不能跟現有的各種系統打通,能否跟流程、認證打通?還有超融合是一體化的,要擴容什么必須按比例擴容。
云方面還有一個技術 SDN,SDN實際就是把控制層面和轉發層面分離。最近幾年有一種聲音,就是智能化的網絡,我理解就是SDN+AI的解決方案,這個是思科網站的圖,學習各種場景然后智能化。Ganter總結基于意圖的網絡有四個特征:
第一個就是轉移和驗證,將網絡工程的命令轉換為執行的操作能力,當管理者想要驗證策略時,基于意圖的網絡系統會驗證策略是否可以執行。
自動實施,軟件自動執行網絡管理員定義的策略。
網絡狀態感知,收集數據以持續監控網絡操作。
保障和動態優化補救,機器學習可以確定保障策略的實施和糾正措施的自動化。
如果真的基于智能化的網絡做的比較好,以后可能就是通過語音或者圖拖拽兩下就可以成功了。現在廠商各種產品都能看到智能,這個也是后面網絡發展的方向。
再就是多云和混合云,混合云也喊了好幾年了,多云就是使用多個公有云,像國內的公有云、阿里云、騰訊云。混合云就同時使用多云和私有云,還有異構,既使用小型機,也使用X86物理機。
這里也有私有云的數據,其實私有云里OpenStack國內用的比較多,但是國內外使用的多的還是VMware,昨天有一篇文章叫OpenStack的八年之癢,是非常yip有深度的文章,推薦大家看看。
接下來是云網融合,把自己的私有云和公有云打通,這樣可以保證網絡的穩定和數據安全,所以云網融合也是比較熱的一方面。
云對IT團隊也提到了比較高的要求,IT團隊要轉換到云上面,如何把云用好,如何專注云、控制云的成本?
在云時代運維的價值是什么?用云是必須的,用云的過程中要持續優化成本,云原生是持續的追求目標。
3.私有云運維方面的經驗
在規模比較大的私有云里,還是比較講究用傳統的解決方案,像PDCA、ITIL。大型企業里ITIL是深入到IT內部的,必須要用ITIL語言進行溝通。
我簡單用一個項目的實施周期給大家介紹一下如何運行的。首先就是大型項目里合規是紅線,必須要過三級等保,我們也有合規方面的專家。然后要有大量的基于ITIL的制度、流程等方面的儲備。
再簡單介紹一下人員組織的演進,我們原來分為四塊,系統方面包括系統方面的部署和實施,系統之上的云平臺實施,網絡方面專門做網絡方面的實施,支持呢方面主要是ITIL的工作臺工作,有24小時值班,還有工單系統、工單流轉、任務追蹤的支持,現場方面主要做物理服務器上架。
后來我們組織方面做了變革,分成架構組,主要做架構方面的設計還有方案的驗證,和疑難雜癥的處理;實施組,要有搭建云的能力,包括機房現場上架不線、服務器OS運維、網絡設備之安全設備、分布式存儲、云平臺,然后內部還有考核,考核完了才具備實施組的資格,支持組做的事情和原來差不多。
架構組要有方案的能力和云平臺的搭建能力,還要完整的云運維能力,還要腳本以及編程能力。每碰到一個新項目來的時候我們生成虛擬項目組,這個項目會有唯一的運維內部的owner,從項目開始到項目結束,他是唯一的責任人,也包括跟客戶和公司技術人員對接。這個項目出了問題這個owner必須要負責,覺得容量不夠了就要申請資源,客戶有需求也會跟客戶約談,他知道這是責任是他的,他也跑不掉。
這就是我們人員組織方面的經驗。然后就進入項目立項階段,我們會指定Owner,然后制定實施方案,主要就是WBS的形式,WBS就是三個字母的縮寫,Work、Breakdown、Structure,它是按照一定的結構模式去組織的。
舉個例子,比如說包餃子有很多人包過,沒包過也看到過,可以分解為準備餃子餡、餃子皮等,就不詳細介紹了。
這一塊插播一下七大人生工具,SWOT分析PDCA循環、6W2H法、SMART原則、時間管理、WBS、八二原則,比如說WBS我開始看起來也非常有道理,但是做的時候發現有好多細節上的東西,真正實踐的時候,尤其做項目的時候怎么樣分解,是按照時間線分解還是按照任務分解呢?關于各種人生方法有好多書大家有興趣也可以研究一下。
做項目實施的時候反而簡單了,按照自己的WBS做,做了哪些?哪些沒做?為什么有偏差?
然后進入項目運維階段。首先夠是ITIL方面的流程,我們使用了大量的開源工具。
工單方面我們用的OTRS,OTRS是非常重的工具,但是功能比較多一點,大家可以看一下。有的客戶還需要大屏,當然如果要求比較高的話也會定制化開發大屏,國內有好多公司專門做大屏也能生存,最后就是專家,要有對疑難雜癥比較熟悉的專家。
總結一下吧,有個故事,有一位將軍射箭時圍了一群人,每次射箭都能射到紅點上,周圍人都叫好,旁邊有一個賣油翁說“無他但手熟爾”,將軍很生氣,賣油翁說:“以我酌油知之”,然后取一枚銅錢放到裝油的葫蘆上,拿瓢從很高的地方倒油,油細線一樣進入到葫蘆中,至始至終銅錢沒有沾到一滴油,周圍人都很嘆服。
其實做運維也是這樣的,不容有任何的紕漏和偏差,然后也要依靠經驗、平臺、流程和Checklist和核查機制,長期不斷地嘗試、修整、積累。我分享就這么多,謝謝大家。
文章轉自:?高效運維
1.微信群:
添加小編微信:color_ld,備注“進群+姓名+公司職位”即可,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習!
2.征稿:
投稿郵箱:liudan@csdn.net;微信號:color_ld。請備注投稿+姓名+公司職位。
推薦閱讀
細數華為核心技術家底:華為真會被擊垮嗎?
如何使用 Lucene 做網站高亮搜索功能?
20張圖表達程序員的心酸
一個程序員父親的呼吁:不要教你的孩子從小學編程!
Python | 7招教你識別一個網站是否是Django后臺
月薪 50K 大牛整理!6 張 Python 圖譜,看完茅塞頓開!
程序人生公眾號是CSDN旗下有影響力的開發者自媒體之一。這是一個以程序員日常工作和生活緊密相關且垂直服務于程序員群體的自媒體平臺,掃描關注吧~
↓點擊“閱讀原文”,打開APP 閱讀更順暢
總結
- 上一篇: Hadoop精华问答 | 非大数据的项目
- 下一篇: 初识vue3