音视频技术开发周刊 | 192
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
HYPER: 充滿挑戰和成就的十年
自從Flash Player和Adobe Media Server多年以來一直跟隨我的人知道,在過去的15年中,我一直在忙于開發編碼器,播放器以及通用軟件體系結構,以實現,增強和優化大規模的視頻流。特別是在2021年,我要慶祝Hyper成立10周年,它也是這些成就之一,但讓我們從頭開始。
https://sonnati.wordpress.com/2021/03/30/hyper-a-decade-of-challenges-and-achievements/
Chrome 91新特性:手寫識別,WebXR平面檢測等
除非另有說明,否則以下描述的更改適用于Android,Chrome OS,Linux,macOS和Windows的最新Chrome beta通道版本。通過提供的鏈接或ChromeStatus.com上的列表,詳細了解此處列出的功能。Chrome 91將于2021年4月22日發布Beta版。
https://blog.chromium.org/2021/04/chrome-91-handwriting-recognition-webxr.html
華為云薛浩:走進視頻“新時代”
隨著社會發展,視頻產業的發展也在迅速加快。視頻“新時代”帶來了新的機遇、也有新的挑戰。本次分享我們邀請到了華為云的薛浩先生,他向我們分享了華為云在面對視頻“新時代”的想法、投入及對產業界的看法。
淘系音視頻技術的演進之路
隨著社會的發展,音視頻技術在電商運營中占據的位置越來越重要。不僅時代在進步,音視頻技術也在前進。本次LiveVideoStackCon 2021 上海站中,我們邀請到了淘系技術的陳穎老師為我們分享淘系內容電商技術的過去、現在及其未來展望。
音視頻技術在云會議場景的拓展和未來
音視頻技術不斷發展,云會議場景在人們生活中也越來越常見。那么如何將云會議場景中的音視頻技術不斷提升改善?本次分享會我們邀請到了來自騰訊會議的商世東先生,他將與我們分享云視頻技術在騰訊會議里面的一些領域使用情況和他們對未來的一些思考。
阿里云窄帶高清的演進與思考
窄帶高清實際上是一套以人眼的主觀感受最優為基準的視頻編碼技術,研究的是在帶寬受限的情況下,如何追求最佳的視覺感受。今天我們請到了來自阿里云智能視頻云的王豪老師,他將與我們分享窄帶高清是什么、現在的窄帶高清主要關注哪些內容、以及未來的布局是什么。
目標檢測,FFmpeg中第一個基于深度學習模型的視頻分析功能
2021年4月,終于把目標檢測(object detection)加到FFmpeg upstream了,有maintainer身份加持,還是交互了將近100封郵件,花了兩個多月才完成upstream,這還不包括前面的開發時間,當然,這么多的交流也對最后的代碼有很大的提升。
遮擋視頻實例分割,牛津阿里最新開源OVIS數據集!
當場景中存在嚴重的遮擋時,作者的視頻理解系統能感知對象嗎?為了回答這個問題,作者收集了一個名為OVIS的大規模數據集,用于遮擋視頻實例分割,即同時檢測、分割和跟蹤遮擋場景中的實例。OVIS由來自25個語義類別的296k高質量實例掩碼組成,對象遮擋通常發生在這些類別中。
5G+邊緣計算,對于VR移動電競游戲來說意味著什么?
這是一個5G+邊緣計算意義的問題。其實對VR游戲(特別是電競游戲)這類大流量/低延遲的應用服務來說,大多數人第一時間想到的優點會是高達1Gbps/s的數據傳輸速度,雖然事實確實如此,但并不是全部。
從WinZips到Cat GIF,Jacob Ziv的算法提供了數十年的壓縮能力
無損壓縮的先驅者獲得了2021年IEEE榮譽勛章。
https://spectrum.ieee.org/geek-life/profiles/from-winzips-to-cat-gifs-jacob-zivs-algorithms-have-powered-decades-of-compression
會議更流暢,表情更生動!視頻生成編碼 VS 國際最新 VVC 標準
阿里云視頻云的標準與實現團隊與香港城市大學聯合開發了基于 AI 生成的人臉視頻壓縮體系,相比于 VVC 標準,兩者質量相當時可以取得 40%-65% 的碼率節省,旨在用最前沿的技術,普惠視頻通話、視頻會議、在線教育等重要應用領域。
評估使用SL-HDR1壓縮HDR的比特率
本文是來自VidTrans 21的演講,演講者是來自Cobalt Digital的Ciro Noronha,演講的主要內容是評估使用SL-HDR1壓縮HDR的比特率。
評估廣播工作流程中視頻質量的一個新范例
本次演講來源于2021年3月1日視頻服務論壇(VSF)的年度會議VidTrans,演講者Margaret H Pinson來自國家電信和信息管理局(NTIA)。
Facebook基于Transformer的目標檢測 (DETR)的詳細指南
DEtection TRansformer (DETR)是Facebook研究團隊巧妙地利用了Transformer 架構開發的一個目標檢測模型。在這篇文章中,我將通過分析DETR架構的內部工作方式來幫助提供一些關于它的直覺。
Twitter在Android和iOS上推出4K圖像支持
在公司于3月進行測試之后,iOS和Android上的Twitter用戶現在都可以以4K上傳和查看圖像。為此,你所需要做的就是導航到設置菜單的“數據使用情況”部分,并更新高品質圖像選項上的選擇。
https://www.engadget.com/twitter-4k-image-uploads-mobile-171149369.html
VR/AR/MR/XR 概念辨析
虛擬現實(Virtual Reality,VR)、增強現實(Augmented Reality,AR)等業務以其三維化、自然交互、空間計算等完全不同于當前移動互聯網的特性,被認為將是下一代通用計算平臺。
LiveVideoStack主編觀察03 /大會見聞&思考
時隔兩年,4月16-17日,LiveVideoStackCon再次來到上海。也許是疫情讓大家彼此疏離了太久,因此,本次LiveVideoStackCon是有史以來上海站參會者數量最多的一次,本周我就來聊聊在這次大會上的見聞與思考。
后疫情時代音視頻行業思考LVSCon2021SH
作為一個參與了3次LVSCon大會的從業者(2020年因疫情原因,遺憾未能參與),對于本次在上海舉辦的LVSCon,感受到了與以往完全不一樣的氛圍。
2021上海LVS音視頻大會觀感和思考
其實音視頻這個領域非常的窄,很長一段時間都沒有屬于自己專一和垂直的社區。最近幾年,隨著國外的FFmpeg和WebRTC的普及,國內SRS和LVS在這個領域也變得越來越活躍。從2017年LVS組織第一次線下大型活動到現在已經五個年頭了,感謝LVS提供的平臺和機會,讓大家每年有一兩次線下面對面交流機會,也感謝這個時代對音視頻技術的持續推動。
一個 RTC 開發者在 LVS 音視頻技術大會的見聞與思考
兩天的大會,全程一場緊接著一場的聽下來,不知道其他參會者感覺如何,反正我是挺累的。當然,不能白累,收獲是必須的。下面我就分享下自己在 LVS 音視頻技術大會的一些收獲。
小提示:鏈接跳轉僅支持公眾號相關鏈接
插圖源自Pexels
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 192的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Vulkan Video实现GPU加速视
- 下一篇: 视频直播/远程会议中的AI关键技术探索应