音视频技术开发周刊 | 194
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉(zhuǎn)僅支持公眾號相關(guān)鏈接
進入全真互聯(lián)網(wǎng)——音視頻通信的技術(shù)變革
隨著5G和下一代編解碼、傳輸?shù)燃夹g(shù)持續(xù)演進,音視頻通話技術(shù)從低延時到超低延時實時通信快速迭代,越來越多應(yīng)用與服務(wù)遷移至線上,越來越真實無損地還原線下體驗,新的互動方式和場景不斷涌現(xiàn),從高度數(shù)字化到擬真化再到全真互聯(lián)網(wǎng)時代。本次LiveVideoStackCon 2021上海站我們邀請到了騰訊云副總裁李郁韜來分享音視頻的變革趨勢、演進以及未來。
邊緣計算不“邊緣”——助攻視頻行業(yè)這幾年
隨著邊緣計算行業(yè)的不斷發(fā)展,其業(yè)務(wù)也越來越廣泛,越來越成熟。邊緣計算的發(fā)展歷程并不是一帆風(fēng)順,其運用起來也和傳統(tǒng)云計算有很大不同。那么邊緣計算行業(yè)所面對的挑戰(zhàn)以及未來的發(fā)展是什么樣的呢?有請網(wǎng)心科技的李浩為我們分享他助攻視頻行業(yè)的這幾年。
實時音視頻技術(shù)的演進與應(yīng)用
本次分享我們邀請到了來自騰訊云實時音視頻TRTC后臺的研發(fā)負(fù)責(zé)人薛笛,他向我們分享了騰訊云TRTC在架構(gòu)升級和產(chǎn)品實踐中的經(jīng)驗。仔細講解了混音引擎最初的制造源、在整個優(yōu)化過程中發(fā)現(xiàn)的問題以及解決方法,為后來做騰訊會議和云呼叫中心打下了一個良好的基礎(chǔ)。
流媒體的安全
本文來自Streaming Video Alliance,在本網(wǎng)絡(luò)研討會中,我們將探討許多可用于阻止直播盜版的技術(shù),以及視頻發(fā)行商可以用來幫助盡可能減少盜版的一些做法。
談?wù)?WebRTC 的 SDP Unified Plan
今年2月份,webrtc M89 的正式發(fā)布,在Release note 提出了一個重要更新,即廢棄webrtc Plan B SDP 語義,推薦使用標(biāo)準(zhǔn)SDP格式:Unified Plan。WebRTC1.0 已經(jīng)正式成為 W3C 標(biāo)準(zhǔn),主流瀏覽器基本都支持UnifiedPlan SDP。
WebRTC如何驅(qū)動亞秒級廣播和游戲直播流
本次演講來自Demuxed 2020,主講人是來自蘋果公司開發(fā)人員Sean dubios,他還是Pion WebRTC的創(chuàng)建者。演講主題是WebRTC如何驅(qū)動亞秒級廣播和游戲直播流。
MediaStreamTrack 的可插入流
從現(xiàn)在開始,WebRTC 會有更多的虛擬背景和有趣的面具功能加入。
https://web.dev/mediastreamtrack-insertable-media-processing/
Visionular AV1編碼器針對所有用例進行了優(yōu)化
得益于AOMedia資助的dav1d項目,Visionular確定了AV1可行的用戶方案,可以在其中利用軟件解碼解決方案,這已成為標(biāo)準(zhǔn)和Visionular解決方案發(fā)展的重要基礎(chǔ)。
http://aomedia.org/av1%20adoption/visionular-av1-encoder-optimized/
淺析 XR 關(guān)鍵技術(shù)
擴展現(xiàn)實(XR)實際是一個概括性術(shù)語,囊括了增強現(xiàn)實(AR),虛擬現(xiàn)實(VR),混合現(xiàn)實(MR)以及介于他們之間的所有內(nèi)容。
AR中面部追蹤的基礎(chǔ)淺析
在AR中實現(xiàn)追蹤并不是一件易事,一方面需要擁有更為強大的傳感器,另一方面還需要設(shè)備有足夠的算力。
DeepBlur:一種簡單有效的自然圖像模糊方法
現(xiàn)有的圖像模糊技術(shù)要么容易受到人類或深度學(xué)習(xí)模型的再識別攻擊,要么在保持圖像保真度方面不夠,要么計算量太大,難以實現(xiàn)。為了解決這些問題,我們提出了DeepBlur,這是一種簡單而有效的圖像模糊方法,它通過無條件預(yù)先訓(xùn)練的生成模型的潛在空間進行模糊處理,該模型能夠合成逼真的人臉圖像。
輸入兩張“怪異”圖像,VGG、Inception、ResNet集體翻車,經(jīng)典圖像分類模型有多脆弱?
如果我們對圖像進行一些非常規(guī)操作,比如把豬放在它“不熟悉”的天空環(huán)境中,或者把局部目標(biāo)異常放大,它們還能準(zhǔn)確分類嗎?
Telegram 下個月添加群組視頻通話功能
有無使用 WebRTC?是否支持瀏覽器?據(jù)悉,群組視頻通話將在下個月出現(xiàn)在Telegram的消息平臺上,并被吹捧為一個功能齊全的實現(xiàn),包括支持基于Web的視頻會議。
https://techcrunch.com/2021/04/28/telegram-to-add-group-video-calls-next-month/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29
VLC發(fā)布3.0.13版本
此次更新包括2處更改,41個添加項和3個刪除項。在多路分配器、編解碼器、使用權(quán)、視頻輸出、接口等方面都做了相應(yīng)的更新或修復(fù)調(diào)整。
https://code.videolan.org/videolan/vlc-3.0/-/blob/master/NEWS
Safari 14.1 的 Webkit 新功能
WebKit中的Web Speech API支持語音合成已有一段時間了。現(xiàn)在,Safari支持與Siri相同的語音引擎支持的語音識別。這意味著Web開發(fā)人員可以享受50多種語言和方言的高質(zhì)量轉(zhuǎn)錄。
https://webkit.org/blog/11648/new-webkit-features-in-safari-14-1/
插圖源自Pexels
The cover from?creativeboom.com
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 194的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 广播IP转型报告:远程制作持续崛起
- 下一篇: 打入硅谷的局外人|Decode the