音视频技术开发周刊 | 154
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
內容推薦
5G時代探索互動立體視頻信息承載的新可能
5G時代對于視頻行業(yè)的發(fā)展和業(yè)務形態(tài)將是一個重要的助推,但5G時代帶來的改變不只是帶寬提升和延遲降低這兩個最直接的因素。本次LiveVideoStackCon 2020線上峰會我們邀請到了阿里巴巴高級算法專家盛驍杰,他將介紹在5G時代,視頻信息承載將逐步從目前的平面視頻形態(tài)過渡到信息表達更為豐富的三維視頻,而這種過渡中包含的可能性一方面需要我們充分利用5G技術本身的云、邊、端架構帶來的技術紅利,另一方面,也需要我們對于快速發(fā)展的三維視覺,AI,AR等技術進行綜合性的創(chuàng)新運用,使得視頻體驗通過可互動的三維信息表達在5G時代不斷給用戶創(chuàng)造出更多的價值。
https://mp.weixin.qq.com/s/4cA1Cw-c5_cma-NR2Kwi2Q
架構
三個常見的 WebRTC 工作流程
如何將流分成三種單獨的工作流類型。
https://www.wowza.com/blog/3-common-webrtc-workflows
傳輸網絡
TCPDUMP 實例-獲取網絡包的50種方法
TCPDUMP 毫無疑問是最重要的網絡分析工具,因為它簡單實用,而且功能強大。這篇教程將會教你從 IP、端口、協(xié)議、應用層等多方面來獲取通信數(shù)據(jù)包,確保你可以盡可能快的找到你想要的數(shù)據(jù)。
https://juejin.im/post/5f12938af265da22a92476af
LL-HLS的演進
HTTP實時流媒體,也就是HLS,是蘋果為了解決擴展問題在2009年發(fā)布的。HLS協(xié)議目前成為非常流行的協(xié)議并且被廣泛應用。和其他基于HTTP的流媒體協(xié)議一樣,它的最大缺點是延遲。本文討論了低延遲HLS的出現(xiàn),變量如何變化,更新如何隨時間改變,和它們如何影響流媒體傳輸。
https://mp.weixin.qq.com/s/bNJoWDeqgAV-1GBPOPB1dg
ProAV新標準IPMX的介紹
本次演講來自Media-over-IP Education的summer seesions,演講者是來自ALC NetworkX的Andreas Hildebrand,演講的主題是介紹IPMX。
https://mp.weixin.qq.com/s/UEl_vEDh-8jonF-PN34RCg
編解碼
基于FPGA的高性能視頻硬件編碼器
基于高性能視頻編解碼技術的解決方案,可以實現(xiàn)高清畫質更快的壓縮速度、更少的帶寬消耗,在滿足用戶高清畫質要求的前提下有效降低運營成本。阿里巴巴達摩院XG實驗室,高級算法專家楊名遠在LiveVideoStack線上分享中詳細介紹了現(xiàn)有視頻編碼方案存在的挑戰(zhàn),并對高性能視頻硬件編碼技術進行了詳細解析。
https://mp.weixin.qq.com/s/12qWqb1sAwoJtkzKeuNJlw
AVS3關鍵技術和uavs3d解碼器的簡介
數(shù)字音視頻編解碼技術標準(AVS)是中國具有自主知識產權的信源編碼標準。AVS基于我國創(chuàng)新技術與部分國際公開技術,采用簡便的一站式專利池管理方案,提前規(guī)避了后續(xù)產業(yè)化時潛在苛刻的專利許可問題。AVS3視頻編碼標準屬于第三代AVS標準,主要面向8K、VR和流媒體等視頻應用。
https://zhuanlan.zhihu.com/p/161723343?utm_source=wechat_session&utm_medium=social&utm_oi=795383971449040896&from=timeline&s_s_i=OIwExDRYUq%2FIMa1%2FxUxP56AGWF0YhNpv5RjyKgeAJPM%3D&s_r=1
最近很火的最新一代國際視頻標準 VVC 到底是什么?阿里專家為你揭秘
在經歷了JEM上的三年標準前期技術積累,兩年多的標準化,三個重要里程碑,幾千篇技術提案,100多個會議工作日,數(shù)十個核心實驗和專題討論組一輪又一輪的激烈討論之后,VVC終于成功誕生!
https://mp.weixin.qq.com/s/EcGA3McH0ezvngQXWXTdYg
HLS和DASH多編解碼器的編碼和打包
本文來自The broadcast knowledge的演講,演講者是FuboTV公司的工程負責人Nick Krzemienski,演講內容為HLS和DASH多編解碼器的編碼和打包。
https://mp.weixin.qq.com/s/5TbJKCfa0M-AanBTNQYByQ
音視頻技術
QQ音樂聽歌識曲系列之一
本文為聽歌識曲技術分享系列之一,走進一直以來受到用戶廣泛使用和好評的QQ音樂聽歌識曲,及其背后原理。
https://mp.weixin.qq.com/s/MUtYacgaVKHjBqaGsRFJfA
視頻生產環(huán)境下的音視頻解決方案
隨著云剪輯、云導播、音視頻生產在線協(xié)作的興起, 生產環(huán)境下的音視頻處理越發(fā)為人所關注。音視頻處理在生產環(huán)境下,對控制精準性有著更高的要求。從服務端到客戶端,精準的時間控制、畫面控制都是生產環(huán)境音視頻和分發(fā)環(huán)境下音視頻處理的重要區(qū)別。服務端與客戶端的協(xié)同上,容易產生微小的差異。
https://mp.weixin.qq.com/s/eUQRA4giJHbqyxFmI3luYg
音視頻常見問題分析和解決:HLS切片丟幀引起的視頻卡頓問題排查
視頻卡頓引起的原因很多,一般分為兩大類:一類是因為音視頻時間戳打的不規(guī)范導致視頻在解碼渲染時順序不對引起的;另外一大類就是視頻傳輸過程中因為網絡問題導致的丟包進而產生的花屏和卡頓問題。一般具體問題需要具體分析,但是思路差不多。
https://mp.weixin.qq.com/s/CR_B1cH3EKTgjO8jbWei4w
AI智能
阿波羅登月51周年!程序員用DAIN技術還原阿波羅登月高清影像,效果震撼
7月20日是阿波羅登月51周年。一位YouTube名為DutchSteamMachine的程序員使用AI技術修復了阿波羅登月的原始影像,將登月鏡頭的像素從每秒12幀提升到每秒60幀,效果令人震撼。
https://mp.weixin.qq.com/s/OEc1zcUNlIERUgQY1SNJpw
可視化解釋以及在DNN/CNN/RNN中的應用
深入了解DNNs,CNNs以及RNNs中的Dropout來進行正則化,蒙特卡洛不確定性和模型壓縮的方法。
https://mp.weixin.qq.com/s/cSLXZN3BdLbnkGBLoG_uTg
一種基于機器學習的圖像編碼方法
如何有效減少壓縮偽像仍然是一個沒有完全解決的問題。
https://zhuanlan.zhihu.com/p/161968402?utm_source=wechat_session&utm_medium=social&utm_oi=795383971449040896&from=timeline&s_r=0
圖像
下一代圖像壓縮技術:JPEG XL
本次來自SPIE Digital Library,演講主題是JPEG XL,下一代圖像壓縮技術,演講者是來自Google Research的Luca Versari,介紹了JPEG XL的一些主要編碼工具的升級。
https://mp.weixin.qq.com/s/DMv8iVhXt7zHbKCBZvfCHQ
蘋果的DTOF中的SPAD原理和特性
本篇文章我們就簡單看一下SPAD的一些基本知識。
https://mp.weixin.qq.com/s/DLsmHtUz3gAXMdzNsUTyFA
資源推薦
Fiber
Fiber 是由 Uber 開源的分布式機器學習平臺,它可以幫助用戶輕松地將本地計算方法擴展到成百上千臺機器上。Fiber 可以使使用 Python 的大規(guī)模計算項目變得快速、簡單和資源高效,從而簡化 ML 模型訓練過程,并獲得更優(yōu)的結果。
https://github.com/uber/fiber
Leela Zero
由比利時程序員帕斯庫托開發(fā)的,也是目前少有的完全開放的圍棋 AI 項目。
https://github.com/leela-zero/leela-zero
活動推薦
【線上分享】海外超低延時鏈路設計的挑戰(zhàn)與優(yōu)化實踐
7月30日19:30,我們邀請到Zenlayer產品和平臺副總裁陳碩,以及Telin Singapore全球業(yè)務負責人莊文杰、技術與運營副總裁Sendang,探索不同場景下延時要求、網絡架構設計難點與挑戰(zhàn),重點解析海外超低延時鏈路設計的思路、優(yōu)化與未來演進方向,并結合東南亞地區(qū)分享如何保障高質量流媒體服務的實踐經驗。
http://livevideostack.mikecrm.com/5tNZybK
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 154的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: VVC专利池最新进展:MC-IF正在召集
- 下一篇: 互动场景下的低延迟编码技术