网易超分黑科技来了!全新移动端视频体验时代来临
如今,互聯網上的社交行為已不局限于QQ和微信。泛娛樂與社交領域相融合所形成的泛娛樂社交正在幫助企業打開全新的文娛布局。泛娛樂應用社交與互動性強成為共同特征,而具備這些特性的產品往往都集中在直播、短視頻、圖片分享社區等社交化娛樂產品。
在這些產品背后的黑科技也持續成為關注重點,網易云信在網易MCtalk 泛娛樂創新峰會上重點介紹了超越像素的AI視頻黑科技“超分”。 超分辨率(Super-Resolution)通過硬件或軟件方法提高原有圖像的分辨率,通過一幅或者多幅低分辨率的圖像來得到一幅高分辨率的圖像過程就是超分辨率重建,網易云信通過人工智能深度學習將低分辨率視頻重建成高分辨率視頻模糊圖像、視頻瞬間變高清,為移動端為用戶帶來極致視頻體驗。
?
什么是超分辨率
廣義的超分辨率 (超分辨率算法, Super Resolution) 是指一類用于提升圖像分辨率的技術。這類技術已經存在了很長一段時間,應用也非常廣泛。隨著圖像處理理論的發展,以及機器學習的普及和更高性能的處理器的出現,各類更優秀的超分辨率算法陸續出現。現在提及超分辨率算法時,往往是特指依靠機器學習來實現的圖像放大算法。文中提到超分辨率算法時也均特指這類算法。它能夠提供遠超于傳統圖像放大算法的圖像質量。
圖1. 將原始圖像縮小3倍后分別使用Bicubic (一種傳統圖像放大算法) 和超分辨率算法CNN (一種基于CNN的圖像放大算法) 進行放大[1]。
超分辨率理論描述
超分辨率算法算法本質上和傳統圖像放大算法大體類似,都是利用已有的圖像信息去預測需要的像素點。只不過傳統算法的預測模型非常簡單,可以通過人工設計的方式實現。例如雙線性插值,就是利用目標像素周圍的四個點來做預測,離目標位置越近的點權重越大,通過一個簡單的公式就能得到結果: f(x,y)=f(0,0)(1-x)(1-y)+f(1,0)x(1-y)+f(0,1)(1-x)y+f(1,1)xy
圖2. 雙線性插值,通過Q11~Q22這四個點預測點P
而現代超分辨率算法為了得到更精確的預測結果,其預測模型則復雜了很多。一般有多個卷積層和激活層,會利用到目標像素周圍很大一片區域的圖像信息,包含成千上萬個模型參數,純靠人工設計是不現實的。所以人們才會依靠機器學習的方式來決定參數。這種做法還附帶有不少好處。例如無需對圖像處理有深厚的理解就可以訓練模型,也可以根據自己的應用場景調整訓練集,從而得到更合適的預測模型。
下圖是一個簡單的例子,來自經典的超分算法超分辨率算法CNN[1]。模型基于卷積神經網絡,以原始圖像為輸入,先是用廉價的上采樣算法將分辨率提升到期望的大小, 然后經過3層分別為9x9x128,3x3x64,5x5的卷積運算,得到超分輸出。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖3. 超分辨率算法CNN網絡結構
近年來每屆超分競賽都會出現不少值得借鑒的新理論和新實現,超分辨率算法的效果上限被不斷提高。
?
什么時候用超分辨率
雖然視覺效果很好,但超分辨率算法在使用上有幾方面限制需要注意。其中最重要的是硬性指標性能。即便是極為簡單的超分辨率算法,其運算量也是傳統放大算法的上千倍,能否滿足應用的性能需求需要經過測試和優化。
另外,目前的超分辨率算法算法主要分兩個流派,一派的目標是盡可能地還原信息,另一派則允許在不影響視覺體驗的前提下對內容進行一些修改。需要根據應用場景來選擇不同的算法。
圖4. 上圖左側為超分辨率算法GAN模型[2]放大4倍生成的圖片,可以看到首飾的紋理被大幅修改。
超分辨率的優勢
??? 基于深度學習的超分技術能較好的恢復圖像細節。在視頻發送源可能因為種種客觀限制, 無法提供高分辨率的視頻,比如攝像頭采集能力不足, 網絡帶寬不足,源端處理能力不足等。在這些情形下, 如果云端或者接收端的處理能力滿足要求, 可以借助超分技術, 對于視頻質量做恢復, 呈現給用戶高質量的視頻。所以超分技術為在惡劣的客觀條件下的視頻應用提供了高質量呈現, 是傳統的應用借助人工智能技術提升使用體驗的典型落地場景。
??
網易云信在超分辨率的實踐
??? 網易云信提供了點播直播和實時音視頻等技術能力。 支持的終端包括Windows PC,? MAC,? iPhone,? iPad,? Android手機, 機頂盒, 智能手表等可穿戴設備。其中可穿戴設備, 機頂盒等終端的成本控制比較嚴格, 通常CPU處理能力相對較弱, 無法支持高清, 甚至標清的視頻規格, 但是作為這些終端的使用者, 他們依然希望看到高清或標清的視頻質量, 接收的終端可能是PC或者性能較好的手機, 平板電腦等設備,它們自己可能有能力提供優秀的計算資源。在這種場景下, 網易云信可以在接收的終端上通過超分辨率技術, 恢復視頻質量,極大地提升了移動端用戶的體驗。如果接收的終端本身運算能力不足以支撐深度學習, 但是有能力處理高清視頻的解碼, 網易云信依然可以在云端對低分辨率的視頻進行處理, 采用包括超分在內的技術,對質量恢復后,將高質量的視頻提供到接收終端。
尤其針對弱網情況,云信將在云端或者接收終端通過超分技術對質量進行補償, 為用戶呈現超高質量視頻。云信通過人工智能深度學習將低分辨率視頻重建成高分辨率視頻模糊圖像、視頻瞬間變高清,為移動端為用戶帶來極致視頻體驗。
?
[1] C. Dong, C. C. Loy, K. He, and X. Tang. Learning a deep convolutional network for image super-resolution. In European Conference on Computer Vision (ECCV), pages 184–199. Springer,
2014.
[2] Ledig C, Theis L,Huszar F, et al. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network[J]. 2016:105-114.
?
想要技術干貨、行業洞察,歡迎關注網易云信博客。
了解網易云信,來自網易核心架構的通信與視頻云服務。
網易云信(NeteaseYunXin)是集網易18年IM以及音視頻技術打造的PaaS服務產品,來自網易核心技術架構的通信與視頻云服務,穩定易用且功能全面,致力于提供全球領先的技術能力和場景化解決方案。開發者通過集成客戶端SDK和云端OPEN API,即可快速實現包含IM、音視頻通話、直播、點播、互動白板、短信等功能。
?
?
總結
以上是生活随笔為你收集整理的网易超分黑科技来了!全新移动端视频体验时代来临的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【入门】WebRTC知识点概览 | 内有
- 下一篇: 【Webkit Blog翻译】深入研究W