带宽运营,皆为错峰
?引言?
本文是對《云平臺的成本優化-提升資源利用率》的硬核實踐。
有個傳說,古羅馬兩匹馬屁股的間距,決定了馬車軸距、鐵路寬度、隧道寬度,最終決定了陸基運載火箭的噴口直徑。
對于帶寬產品的資源運營,也有個類似的根源,那就是帶寬以峰值為計費基準。
無論讀者的角色是云廠商/IDC/CDN還是大型用戶,無論產品是BGP、單線、CDN還是邊緣計算,只要我們在帶寬類產品上消費額過了千萬,我們就需要關注帶寬運營和產品設計的根源是錯峰。
1. 帶寬三驚
驚嚇驚喜和驚訝
對于大帶寬云產品,我先總結出三個略帶驚訝的真相。
1. 驚嚇:運營商千萬別降價
如果運營商將帶寬價格普調性降低,那會是一場橫掃整個云行業的災難。
其他大營收的云產品也別笑,硬件和電費降價,你們也一樣尷尬。
2. 驚喜:帶寬生意要大小搭配
大客戶讓云廠商有做帶寬生意的體量、也能騰挪出海量流動資金,但小客戶錯開了日峰。
3. 驚訝:成本真的估不精細
多線BGP的成本都是估算的,調優的效果更是一片動態迷霧。廣域網互聯是一個無中心的協商系統,線路成本更是超出技術范疇之外,月峰值也在給冗余的傷口撒鹽。toB產品都可以只做大客戶,但帶寬類產品最好是大小搭配。
2. 計費繁瑣
難題和操作空間
帶寬不是資源,帶寬本質上是運營商做的一層規則限制。
運營商的根本計費規則就是“按月峰值計費”,即按照每月最大使用的那個水位線計費,在此基礎上涌現出多種變體:
無保底峰值計費,最簡單的用多少量給多少錢,可以演化成無保底流量計費。
有保底峰值計費,要收個最低月租費,比如保底1G帶寬就是實際用300M也是收1G的錢。
95峰值計費,5%的最高用量被掐尖抹掉,避免偶發高峰造成大賬單。
保底后突發流量價格變高,這是供應商鼓勵你多交計劃內月租,少搞突然襲擊。
保底后突發流量價格變低,這是供應商鼓勵你資源用的越多越好,最好每根線都用到滿載。
固定帶寬計費,客戶掏的錢都是保底值,但過保底0.01%就會被限流。因為打點統計的粒度太粗,肯定會漏過真實帶寬最高峰,而限流丟包時所有數據包等比例隨機丟棄,所以大家只敢用到固定帶寬的50%-85%。
共享帶寬計費,大家肯定以為這種方式早被淘汰了,但是過去租U位共享100M和現在買云主機共享5M帶寬有區別嗎?
肯定有讀者嫌棄上文太復雜了,想要求必須是“無保底流量計費”——這就是“我可以接受漲價”或者“沒流量就不賣給你”的意思。
除了計費規則之外,帶寬成本還有到特定區域比例限速、跨國跨區域合并保底、樓內線成本、跨運營商冗余方案等等一大堆問題和解決方法。
這些復雜的規則,讓掌握帶寬計費規則成為高智商專業性工作,留給了云廠商、大型互聯網廠商的采購、產品、運營、運維極大的難題,也留下了極大的操作空間。
3. 現在的帶寬
浪費為主也有復用
在成本不準、需求不準、甚至效果也不準的前提下,帶寬錯峰仍然是有實操的思路和原則。日峰(含周峰)是我們以低成本保持安全冗余的前提條件,避免出現新的月峰是省錢的目標,而上傳錯峰是帶寬廠商夢想的新金礦。
????1. 日峰值錯峰求安全
日峰錯峰的目的是保證不超過帶寬上限,保證始終有富裕帶寬平穩運行。
網絡服務是超過限速流量,就會出現大范圍丟包的嚴重事故,加上測量不準流控不精,我們只敢用到帶寬上限的70%以下。
有些運營商是1:3以上的保底突發比例,大家用起來就比較放心,但有些運營商突發比例給的很小,甚至只給固定帶寬,這時錯峰就是刀尖上跳舞的剛需了。
還好不同用戶的業務高峰并不相同,有白天的有晚上的甚至有后半夜的,不同用戶錯開業務高峰,讓業務量始終沒漫到帶寬上限;用戶錯峰行為主要體現在日峰,個別會體現在周峰。
肯定有朋友說,我只在白天和后半夜用帶寬,因此能不能打折?這句話理論上是對的,但是有兩個現實問題,一是錯不開峰值怎么停掉廉價帶寬,二是上游運營商是按照月峰計費的。
2. 月峰值的冒尖和浪費
對于用量突增導致的月峰,因為有用戶買單所以皆大歡喜;
對于短期DDOS攻擊導致的月峰,運氣好能找供應商撒嬌抹一下賬單;
如果A線路故障導致B線路突發峰值,A線路的賠償款可填不平B線路的突發賬單。
月峰在發生前很難壓住別冒尖,但在冒尖之后又缺乏好辦法規避浪費。我們很難做到因為某線路出現了月峰冒尖,接下來就刻意多用此線路。如果強行往月峰發生線纜上導流量,會面臨著三個問題:
首先,要確認這個計費月還有幾天空閑;
然后,我們要小心該線路日峰爆倉出故障;
最根本的問題是:其他被抽掉流量的線纜也是保底加月峰付費。
月峰冒尖和浪費的根本原因是:
需求側不可控只能被動響應;
可調度的對象只有幾個運營商的網口;
技術調度方法又非常笨拙緩慢。
3. 上行帶寬的商業化
運營商售出的IDC帶寬是上下行對稱,上下行中按用量最高的取值。
但實操的過程中,IDC上行帶寬基本就是贈送的,用量最大的肯定是下行帶寬。CDN帶寬上下行不對稱,但上行帶寬也一直夠用。
這幾年直播火爆,因為直播業務只能回源無法緩存,CDN上行帶寬終于用起來了;隨著家用IOT場景的日漸普及,曾經閑置的IDC上行帶寬逐漸緊俏起來。各個云平臺公開的云主機裸金屬,都很精明的寫出是買下行帶寬贈送上行帶寬。隨著5G類應用的日漸深入,這個贈送的帶寬早晚也要變成收費,屆時上下行錯峰復用會成為帶寬產品的新利潤增長點。
4. 數據和產品
帶寬運營的展望
帶寬運營的現狀是糾結和浪費,但隨著技術進步和行業變化,我們能看到帶寬運營在逐漸變得確定和清晰。
1. 精確預估大客戶成本
互聯網巨頭們的客戶量固定、業務模式也固定,他們的用戶分布、節假日變動都已經是明確的曲線,開拓新國家也有了相對固定的模式。這一些工作讓帶寬類產品可以相對精確的預估大客戶成本,讓閑置資源更少、復用資源更多。
我知道多個視頻大廠都在研發整理峰值的技術,將留給供應商“AAA”的峰值削成“凹凸凹”的峰值,在我來看這是在緣木求魚。供應商的利潤就來自于錯峰復用,一個巨頭去整理峰值是蹭其他巨頭的便宜,多個大廠都選擇“凹凸凹”的峰值,只會導致供應商漲價。
2.線路分組混用互備
運營商之間的互聯互通能力在向集中化、簡單化去演進;國內有信號,歐美已經成為事實,多個IPtransit之間的互備互通機制已經很成熟。
我們可以將線路按照運營商進行互備分組,也可以將線路按照延遲等質量系數分類,這些分類至少能解決保底和災備問題,也有望減少月峰值突發。
3. 精細化監控和敏捷決策
傳統帶寬監控的粒度太粗,也只用于觸發報警和手工決策。
帶寬監控的正道是準實時監控,有了準實時數據就能有更精細的流控機制,再加上AI技術做敏捷判斷和大數據技術做匯總統計,人類調配帶寬終會變成自動調配帶寬。
4. 從需求側做新產品
我說的新產品包括網絡產品的自我優化,也包括應用產品的見縫插針。
同樣是為解決日峰值中提到“如何停掉廉價帶寬”的問題,可以將流控和QoS做到了IP層,也可以用源IP和端口去標識出“它就是可暫停的廉價帶寬”,還要求上層應用天然是高容錯可暫停。
同樣是為了解決鏈路穩定性問題,可以是專線+冗余+BGP等IP層技術,也可以設計一套傳輸協議,還可以客戶端默認雙路推流,還可以在編解碼技術上搞容錯。
要做出上述新產品,必須說明舊產品線的現狀數據,新技術有哪些突破,資源池有哪些臨界值。
>>?5. 結束語
帶寬運營并不是一個輕松的話題,毫厘間的差錯就是真金白銀的損失,每一個需求方都在同時索要低價格和高價值。
但正如上一篇文章《云平臺的成本優化》中的結束語:
這是難做又有用途的事情,
是值得我們努力的方向。
總結
- 上一篇: 使用FFT进行快速FIR滤波
- 下一篇: 江苏自考计算机专业2020,2020年4