音视频技术开发周刊 | 172
每周一期,縱覽音視頻技術領域的干貨和新聞投稿:contribute@livevideostack.com。
架構
手把手搭建WebRTC測試環境,實現1對1視頻通話
本文就是幫助大家一步步搭建一個DEMO的運行環境,只要嚴格按照教程,基本都能搭建出來,后續再講解接口調用和WebRTC一些源碼編譯和內部情況。
https://mp.weixin.qq.com/s/uj-_WktICjGIKx5seM6QPw
傳輸網絡
CDN管理/大規模運營:編排和運營
本文來自Content Delivery Summit Autumn 2020,主要討論CDN管理方面的問題。主持人是來自Axello的CEO,Mark de Jong。
https://mp.weixin.qq.com/s/lBh8IKijE7r39qALcLe-tQ
攜程移動直播探索
本文從直播流的選擇、交互優化、快速迭代等方面介紹攜程直播技術。
https://mp.weixin.qq.com/s/fZOpnikrrWZYDHc9nIRjWQ
數據監測
簡單的流式遙測
本文介紹了gnmi-gateway項目的一些背景知識,我們為什么創建它以及如何使用它來監視自己的網絡。
https://netflixtechblog.com/simple-streaming-telemetry-27447416e68f
編解碼
MediaCodec編碼OpenGL速度和清晰度均衡
在安卓平臺為了實現h264視頻編碼,我們通常可以使用libx264, ffmpeg等第三方視頻編碼庫,但是如果對編碼的速度有一定的要求,要實現實時甚至超實時的高速視頻編碼,我們并沒有太多選項,只能使用Android提供的MediaCodec硬編碼模塊。
https://mp.weixin.qq.com/s/HnHNCyvt1Ob8h84cUpDBNA
LCEVC編解碼器介紹&per-title編碼基本原理
本次演講來自IndVideoTech Meetup,演講者分別是來自Bitmovin的解決方案架構師Saravanan Silvarajoo,以及來自V-Nova的產品副總裁Fabio Murra。本次演講主要包括了per-title編碼的基礎知識和LCEVC(MPEG5 Part2)編解碼器的介紹。
https://mp.weixin.qq.com/s/rIZ-x6YJT8-5BhzKJyu5Hw
音視頻技術
關于主動降噪耳機,你想知道的一切
本文主要介紹反饋降噪(FB ANC) 的原理。
https://mp.weixin.qq.com/s/2tq8tMnMGbNfe_javn07Eg
構建支持音頻研究的基礎架構
聲音是一種看不見的力量,以我們看不見但可以感覺到的方式到達我們。這也是音頻難以被機器解析的原因:人類可以分辨出發呆的人聲,可跳舞的節拍和嗡嗡的蜂聲之間的區別。我們也可以教機器聽那些差異嗎??
https://engineering.atspotify.com/2020/11/04/its-all-just-wiggly-air-building-infrastructure-to-support-audio-research/
幀率:實時流媒體入門指南
本文將探討選擇實時流或流fps的幀速率時要考慮的因素。
https://www.wowza.com/blog/frame-rate-beginners-guide-live-streaming
超強屏幕錄制和注釋工具:Screenity
Screenity 是一個強大的屏幕記錄和注釋工具,你可以在錄制畫面標注事項,添加人臉視頻窗口。
https://github.com/alyssaxuu/screenity
活動推薦
LiveVideoStackCon?SFO 2020 圓桌論壇
QUIC HTTP/3, HLS/DASH, CMAF, WebRTC, RTMP/FLV......?
OTT/短視頻/線上教育/遠程協作/云游戲...?
云剪輯/線上視頻制作/AI視頻制作......?
當新的標準被應用到新領域、新的應用配備了新的標準、新的領域衍生了新的應用......音視頻技術人會帶來怎樣的技術革新,多媒體行業的后疫情時代又會催生出怎樣的新創?
灣區最原汁原味的技術,全球最前沿的應用實踐。
無需漂洋過海,我們在線上等您!
https://sfo2020.livevideostack.com/schedule
AI智能
AI視覺,騰訊云視頻云新挑戰的解決之道
AI就像一個加速器,正在滲透在多媒體應用的方方面面,改進甚至顛覆傳統的圖像視頻處理方法。本文整理自騰訊云高級研發工程師劉兆瑞在LiveVideoStackCon 2020北京站上的演講,將從超低碼率壓縮場景下AI技術在前置處理中的優化、AI技術的畫質修復探索以及智能編輯場景的落地實踐三個方面展開。
https://mp.weixin.qq.com/s/NJkLx5lQDENh7mDe-yF5wQ
微軟開源的 AI 工具,讓舊照片煥發新生
在 GitHub 熱點趨勢 Vol.046 中,HG 介紹過一個微軟開源的 AI ?工具——Bringing-Old-Photos-Back-to-Life,它可以讓破損、殘舊的圖片煥發新生,在本周更是獲得近 3k star。而本文則是項目團隊成員 Ziyu Wan 發布于 Hacker News 的項目介紹。
https://juejin.cn/post/6898862569226764302
U^2-Net跨界肖像畫,完美復刻人物細節,GitHub標星2.5K+
今年提出的 U^2-Net 顯著性檢測算法,刷爆了 reddit 和 twitter,號稱是 2020 年「地表最強」的靜態背景分割算法。
https://mp.weixin.qq.com/s/BsOtHbhC3xXUYrDt_GqWeg
日均5億字符翻譯量,百毫秒內響應,攜程機器翻譯平臺實踐
隨著國際化進程的開展,攜程正加速第三次創業,各部門及業務場景對多語種的需求日益增長,依靠譯員或精通多語種的客服難以支撐持續擴大的自然文本翻譯流量。機器翻譯技術作為近年來人工智能領域在自然語言處理任務上探索的先驅,逐漸走出學術的象牙塔,開始為普通用戶提供實時便捷的翻譯服務,并已取得了顯著的成效。在這樣的形勢下,針對旅游服務場景提供更高質量低成本的機器翻譯服務成為了一個重要課題。
https://mp.weixin.qq.com/s/XE56cWASFcq8r-p1OBvKng
圖像
Ukiyo-e faces dataset 浮世繪面孔數據集
作為我的論文《基于分辨率的GAN插值用于域間的可控圖像合成》的一部分,我使用浮世繪人臉圖像的數據集來訓練StyleGAN模型,本文包含該數據集的鏈接和該數據集的詳細信息。
https://mp.weixin.qq.com/s/uV-OOY5eMGol1cjC0H055g
資訊速覽
一顆芯片引發的投資狂潮
5 年前投芯片的人只夠坐一桌,“現在能裝下一個足球場,肯定有幾千人。”
https://mp.weixin.qq.com/s/3zy0h0fcYwxDFqD9W9KLBg
Google計劃首次通過沙特阿拉伯和以色列建立光纖網絡連接
新的光纖網絡將連接歷史上的敵人,并為互聯網流量打開新的走廊。
https://www.wsj.com/articles/google-plans-fiber-optic-network-to-connect-via-saudi-arabia-and-israel-for-first-time-11606143590?mod=djemalertNEWS
YouTube和Netflix宣布提供適用于Xbox One平臺的參考AV1解碼器
YouTube和Netflix對這種參考解碼器可能為業界帶來的AV1增長機會感到興奮。
https://aomedia.org/in%20the%20news/youtube-and-netflix-announce-availability-reference-av1-decoder-for-xbox/
云計算不僅可以助力數字化,還能促進碳減排?
不過,云計算不僅可以助力企業數字化,如今的云計算,還可以使全球企業的生產標準在環境上可持續發展,從而創造出可以減少二氧化碳排放的新商業模式。
https://www.leiphone.com/news/202011/MerYkHXUoAJ4aVxy.html
活動推薦
【線上分享】云原生時代,華為云音視頻質量監控與優化實踐
云時代,視頻直播、實時音視頻通信等在線音視頻服務面臨各種復雜的網絡環境和流量爆發式的增長,對音視頻質量監控和成本優化提出新的嚴峻挑戰。
12月3日19:30,我們邀請到華為云音視頻大數據研發負責人康永紅,本次分享將介紹基于大數據的音視頻全流程質量監控評估體系和各個環節的優化實踐,面向不同的業務和場景,通過不同的關鍵數據指標改進音視頻服務的體驗質量和產品成本。
http://livevideostack.mikecrm.com/3Kn1c3a
訪問上方鏈接或點擊【閱讀原文】了解詳情
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 172的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用VoiceFliter-Lite改进
- 下一篇: 【线上分享】云原生时代,华为云音视频质量