音视频技术开发周刊 | 151
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨和新聞投稿:contribute@livevideostack.com。
活動推薦
一切為了高清——金山云魔鏡平臺助推5G高清應(yīng)用
5G時代是超高清的時代,然而,冰凍三尺非一日之寒,在超高清視頻直播點播等業(yè)務(wù)研發(fā)過程中,總會遇到很多令人抓狂的難題。本次LiveVideoStackCon 2020線上峰會我們邀請到了金山云高級技術(shù)總監(jiān)蔡媛,她將從金山云魔鏡平臺本身出發(fā),講解平臺如何幫助使用者提升畫質(zhì)評測效率,保障評測質(zhì)量,一站式解決用戶畫質(zhì)評測的難點。
https://mp.weixin.qq.com/s/Dq7SihY4CA6Oq0MAZvXH-g
架構(gòu)
Kurento 6.14.0 發(fā)布
修復(fù) bugs 為主。
https://www.kurento.org/blog/kurento-6140-june-2020
WebRTC系列之音頻的那些事
WebRTC由語音引擎,視頻引擎和網(wǎng)絡(luò)傳輸三大模塊組成,其中語音引擎是WebRTC中最具價值的技術(shù)之一,實現(xiàn)了音頻數(shù)據(jù)的采集、前處理、編碼、發(fā)送、接受、解碼、混音、后處理、播放等一系列處理流程。
https://juejin.im/post/5efafe405188252e7a1c5819
傳輸網(wǎng)絡(luò)
如何使用開源SFU構(gòu)建RTC云服務(wù)
本文由百度智能云RTC產(chǎn)品技術(shù)負(fù)責(zé)人 李永興LiveVideoStack線上分享的內(nèi)容整理而成,從系統(tǒng)架構(gòu)角度,分析了常見的開源SFU在分布式部署以及高可用、高并發(fā)方面的不足,并提出相應(yīng)的解決方案。
https://mp.weixin.qq.com/s/1ttedzc7VTO2hVg2s0qZIw
使用 Rust 實現(xiàn):3K,60fps,130ms
如今幾乎所有視頻通話服務(wù),最終結(jié)果似乎都是以一種或另一種方式使用了 WebRTC 庫。
https://blog.tonari.no/why-we-love-rust
關(guān)于傳輸層協(xié)議UDP、TCP
在本系列課程我會為大家講述傳輸層協(xié)議UDP、TCP和應(yīng)用層協(xié)議HTTP、HTTPS以及Android中優(yōu)秀的網(wǎng)絡(luò)框架的基本使用和源碼解析。
https://www.jianshu.com/p/271b1c57bb0b
編解碼
視頻編解碼器 2020-比賽開始!
目前已有不少可應(yīng)用于視頻流媒體服務(wù)的視頻編解碼器,而且今年還將發(fā)布更多。諸多的方案給視頻服務(wù)商帶來了選擇困難癥,因為他們需要為自己選擇合適的編解碼器,以確保為用戶傳送的音畫內(nèi)容能具備盡可能好的質(zhì)量和最低的比特率,同時還要考慮到編碼器對計算資源的要求。
https://mp.weixin.qq.com/s/ODOIv72pZxDEWDGOEZBWYA
音視頻前沿:新一代 AV1 視頻標(biāo)準(zhǔn)究竟是怎樣一種存在?
AV1是開放媒體聯(lián)盟Alliance for Open Media (AOM) 開發(fā)的第一代視頻編碼標(biāo)準(zhǔn),自推出以來獲得了產(chǎn)業(yè)界巨大關(guān)注和支持。騰訊多媒體實驗室也加入進(jìn)來和其他公司團(tuán)隊一同積極推動AV1編碼器的優(yōu)化和落地,為客戶提供高性能和高效率的云端編碼服務(wù)。
https://mp.weixin.qq.com/s/9QvF_qjdKPswH4YdizKKow
編碼器對決:VP9 vs HEVC
本文是來自Bitmovin’s Tech Talks的演講,講者是Bitmovin的編碼團(tuán)隊領(lǐng)導(dǎo)Christian Feldmann。主要內(nèi)容是對比VP9和HEVC這兩個編碼器。
https://mp.weixin.qq.com/s/p6kDAzSoxkLVp4VQTSBaMA
MPEG新標(biāo)準(zhǔn)介紹及視頻啟播優(yōu)化討論
本文是來自于Bitmovin Vienna Video Tech Meetup的演講,講者是來自于Bitmovin的編碼團(tuán)隊領(lǐng)導(dǎo)Christian Feldmann和產(chǎn)品經(jīng)理Christoph Prager。主要內(nèi)容是即將發(fā)布的三個MPEG標(biāo)準(zhǔn)以及流媒體啟動時間優(yōu)化。
https://mp.weixin.qq.com/s/T4pcNaBYshg9ILSsXXcyjw
對未來編解碼器前景的深入探討
本文來自Bitmovin APAC EDITION 2020的一篇演講,演講者是來自bitmovin視頻編碼團(tuán)隊的Christian Feldmann,他主要探討了現(xiàn)有的和即將到來的視頻編解碼器。
https://mp.weixin.qq.com/s/u-JugYdCijLbHuWq6COVqQ
音視頻技術(shù)
騰訊天籟:基于上下文的語音丟包補(bǔ)償算法
騰訊天籟,“天籟之音,溝通無界”,作為騰訊多媒體實驗室提供的端到端實時音頻解決方案,專注于持續(xù)提升人們的溝通體驗,給用戶提供高音質(zhì),低延時,強(qiáng)抗性的音頻通信服務(wù)。
https://mp.weixin.qq.com/s/POv_lN4V8OUTLY67F0BLpQ
通過新的 Twilio 會議抖動緩沖區(qū)控制技術(shù)(Jitter Buffer Controls)改善通話體驗
Twilio 現(xiàn)在支持開發(fā)人員確定其通道的抖動大小。
https://www.twilio.com/blog/improve-call-experience-new-twilio-conference-jitter-buffer-controls
Android 音視頻學(xué)習(xí):MediaCodec錄制MP4文件
在Android 4.1版本提供了MediaCodec來訪問設(shè)備的編解碼器,它采用的是硬件編解碼,所以在速度上比軟解碼更有優(yōu)勢。
https://juejin.im/post/5ef982e45188252e5f37b50d
AI智能
高文、張鈸、楊強(qiáng)隔空論道:AI精度與隱私的博弈
AI時代,如何保護(hù)大眾的隱私?以聯(lián)邦學(xué)習(xí)為代表的AI技術(shù)能否實現(xiàn)AI協(xié)作,提升模型精度的同時,實現(xiàn)數(shù)據(jù)隱私的保護(hù)?中國如何搶占人工智能安全發(fā)展的制高點?下一個十年,人工智能又將何去何從?
https://mp.weixin.qq.com/s/hAioNIGNAom70f5Zmik9eQ
清華大學(xué)計算機(jī)系教授胡事民:自研深度學(xué)習(xí)框架“計圖”2大創(chuàng)新、6大特性詳解
演講中,胡事民談到了深度學(xué)習(xí)框架“計圖”研發(fā)的初衷。他表示,回溯深度學(xué)習(xí)框架在過去十年間的演進(jìn),國外的 TensorFlow 、PyTorch 、caffe 等主流深度學(xué)習(xí)框架發(fā)展迅速,國產(chǎn)深度學(xué)習(xí)框架的發(fā)展相對慢一些。
https://mp.weixin.qq.com/s/luEC1JpITPKUY1C31kxUxg
SimulSpeech: 端到端同聲傳譯系統(tǒng)(論文)
同聲傳譯是指在不打斷講話者的情況下,同步地將源語言的語音翻譯成目標(biāo)語言的文字或語音,這種翻譯方式被廣泛應(yīng)用于大型國際會議等場景。隨著機(jī)器翻譯技術(shù)的發(fā)展,基于機(jī)器的同聲傳譯準(zhǔn)確率有了極大的提高,并逐漸投入到實際使用中。
https://www.aclweb.org/anthology/2020.acl-main.350.pdf
圖像
牛!Python 也能實現(xiàn)圖像姿態(tài)識別溺水行為了!
眾所周知隨著人工智能智能的發(fā)展,人工智能的落地項目也在變得越來越多,尤其是計算機(jī)視覺方面。
所以今天我們也是做一個計算機(jī)視覺方面的訓(xùn)練,用python來判斷用戶溺水行為,結(jié)合姿態(tài)識別和圖像識別得到結(jié)果。其中包括姿態(tài)識別和圖像分類。
https://mp.weixin.qq.com/s/x1S0Mlx1pk3t7c848LOsTA
資源推薦
啟用 WebRTC simulcast 以提高使用 Amazon Chime SDK 構(gòu)建的應(yīng)用程序的視頻性能
AWS 將 simulcast 功能添加到其 Chime SDK 中了。
https://aws.amazon.com/about-aws/whats-new/2020/06/enable-webrtc-simulcast-to-improve-video-performance-for-applications-built-with-amazon-chime-sdk/
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 151的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2020对于音视频行业意味着什么?
- 下一篇: Open WebRTC Toolkit实