音视频技术开发周刊 54期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第54期內容,祝您閱讀愉快。
策劃 / LiveVideoStack
架構
如何看待Pensieve:MIT基于神經網絡的流媒體碼率自適應策略
今年的SIGCOMM上, MIT CSAIL的一支研究團隊,發表了一篇名為Pensieve的工作,即利用神經網絡優化碼率自適應算法,用于提高媒體傳輸質量。本文對其進行了簡單的介紹,并發表了一些看法。
李大龍:音視頻技術是互聯網品質生活的連接器
結識李大龍源于LiveVideoStackCon 2017,忙碌的工作讓我們在會場擦肩而過,并相約一場采訪。通過采訪,我深深的感受到他對行業的執著與熱情,他將音視頻技術定義為互聯網品質生活的連接器,而我們這些社區媒體不也是這些開發者與生態的連接器嗎?
直播終端技術比較
目前,連麥直播的終端主要包括:原生APP、瀏覽器H5、瀏覽器WebRTC、微信小程序。瀏覽器上的應用包括H5和WebRTC,前者可以拉流觀看,后者可以實現推流和拉流。
WebSocket Go
本文主要介紹了WebSocket 協議、WebSocket 的 Go 語言實現,以及 socket.io 服務端庫的 Go 語言實現的理解。
WebRTC下的媒體網絡連接STUN、TURN、UDP、TCP
WebRTC對等連接:連接不同設備上的瀏覽器
本文詳細介紹了如何在不需要服務器的情況下(只需要在開始交互的時候使用服務器),使不同設備上的兩個瀏覽器相互交流。
音頻/視頻技術
移形換影 - 短視頻色彩特效背后的故事
本文介紹了騰訊云短視頻(UGSV)眾多視頻特效中的一種——移形換影。
詳解音視頻中的DRM數字版權技術
本文首先簡單介紹了當前移動端DRM的一些基本概念,并通過實例重點介紹了安卓視頻開發的DRM處理。
Pensieve:AI帶來的更流暢的高質量觀看體驗
麻省理工學院計算機科學與人工智能實驗室(MIT CSAIL)開發的基于機器學習的流媒體系統能更好的適應不同的網絡條件,從而提供更加流暢的流媒體傳輸體驗。LiveVideoStack對原文進行了摘譯。
FFmpeg3.3.2+SDL2實現流媒體音頻播放
本文介紹了如何通過FFmpeg+SDL實現簡單的播放器效果。
編解碼
視頻編碼與封裝方式詳解
本文為大家介紹了視頻編碼的方式、封裝格式、以及標準兩大系統,并指出幾種常用的視頻編碼方式以及存儲封裝格式。
Zoe Liu:被Chrome Media團隊的專注精神感染
在WebRTCon 2018期間,Google軟件工程師Zoe Liu接受了LiveVideoStack社區編輯丁雪豐的采訪。Zoe暢談了AV1及VP9的現狀與應用前景,以及從On2到Chrome Media堅持20多年做編解碼研發的團隊。
AVS2音頻標準頒布,中國自主音視頻標準比翼雙飛
2018年6月7日,繼AVS2視頻部分2016年底頒布為國家標準后,我國第二代數字音頻編碼標準《信息技術 高效多媒體編碼 第3部分:音頻》(簡稱AVS2音頻標準)將于2019年1月1日正式實施。
Android 基于FFmpeg開發簡易播放器 - FFmpeg解封裝
AI智能
深度學習AI美顏系列---AI瘦身效果算法揭秘
商湯基于深度學習研發了整套瘦身SDK,包括了瘦腿,瘦腰,瘦胳膊,瘦頭型等等功能,并給出了酷炫的實時瘦身視頻,驚艷到了眾人!本文將以瘦腰和瘦腿為例,給大家詳細講解一下。
圖像語義分割的工作原理和CNN架構變遷
圖像分割是根據圖像內容對指定區域進行標記的計算機視覺任務,本文聚焦于語義分割任務,即在分割圖中將同一類別的不同實例視為同一對象。作者將沿著該領域的研究脈絡,說明如何用卷積神經網絡處理語義圖像分割的任務。
從ISCA論文看AI硬件加速的新技巧
總得來說,專門針對ML/DNN的硬件架構已經是ISCA連續幾年的熱點了,經過大家的努力,對相關問題的挖掘已經越來越深。目前,對ML/DNN硬件加速技術的研究主要圍繞提高Inference的處理效率展開。
圖像
壓縮效率第一!CVPR圖像壓縮挑戰賽騰訊音視頻實驗室勝出
CVPR 2018 圖像壓縮挑戰賽(CLIC)結果已經出爐,騰訊音視頻實驗室和武漢大學陳震中教授聯合團隊于該項挑戰賽上取得壓縮性能第一。
具有感興趣區域的靜止圖像壓縮編碼算法研究
為了提高感興趣區域的圖像質量,在信道資源和存儲空間有限的條件下,提出感興趣區域的零樹編碼算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它對感興趣區域圖像和背景圖像采用不同的壓縮步驟,使感興趣區域內的圖像比背景圖像具有更好的圖像質量。
代碼簡單實現模擬噪聲
本文介紹了圖像噪聲的概念、來源、幾種常見的圖像噪聲形式以及如何通過代碼簡單實現模擬噪聲。
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 54期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pensieve:AI带来的更流畅的高质
- 下一篇: 视频编码末日将至?