音视频技术开发周刊 | 197
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉僅支持公眾號相關鏈接
穩健、可靠全真即時通信網的架構與應用
支撐全真互聯網的基礎網絡包括實時音視頻通信網絡、即時通信網絡和流媒體分發網絡。隨著社會的進步,人們對低延時即時通信的需求越來越高。本次LiveVideoStackCon 2021上海站大會邀請到了負責騰訊云千億級底層通信網絡的劉然,他為我們分享了穩健、可靠的全真即時通信網的架構與應用實踐。
如何利用 AWS WebSocket API 進行無服務器 Serverless WebRTC 信令
在本文中,Edward展示了他們如何利用無服務器架構來設置其WebRTC信號。他們使用AWS的API網關WebSocket API終止WebSocket并調用AWS無服務器Lambda函數。
https://webrtchacks.com/leverage-aws-websocket-api-for-webrtc-signaling/
詳解 WebRTC 高音質低延時的背后 — AGC(自動增益控制)
本文將結合實例全面解析 WebRTC AGC 的基本框架,一起探索其基本原理、模式的差異、存在的問題以及優化方向。
MPEG-DASH視頻流——完全指南
MPEG-DASH是最流行的視頻流協議之一,被廣泛用于通過視頻點播或直播來把媒體分發到各種終端用戶設備,包括智能手機、平板電腦、智能電視、游戲機等等。這篇文章將介紹MPEG-DASH的基本原理、它的歷史、最重要的特點等等。
網易云信視頻引擎技術
視頻引擎的應用場景多為需要低延遲的實時通訊場景,比如視頻會議和娛樂直播。本次分享我們邀請到了網易云信的工程師韓慶瑞老師,為我們分享網易云信視頻引擎技術的特點和落地方案。
通過透視式顯示設備和光學設備進行視覺增強
本文來自OSA的Imaging and Applied Optics Congress 2020, 講者是來自東京工業大學的助理教授Yuta Itoh,演講主題是關于通過透視式顯示設備和光學設備進行視覺增強。
2021 最新視頻防抖論文+開源代碼匯總
今年三篇關于視頻防抖的文章,這三篇文章分布采用了不同的方法來解決視頻抖動的問題。
1、基于深度的三維視頻穩定學習方法Deep3D穩定器
2、融合運動傳感器數據和光流,實現在線視頻穩定
3、融合視頻中多個相鄰幀的信息,來呈現無需裁剪的完整穩定視頻
喜馬拉雅:基于 WeNet 和 gRPC 的語音識別微服務架構的設計和應用
近日,喜馬拉雅語音團隊在wenet中增加了基于gRPC的流式語音識別的支持。本文由喜馬拉雅語音團隊撰寫,介紹wenet中的gRPC的設計和實現,并介紹喜馬拉雅基于wenet和gRPC的語音識別微服務架構的設計和應用。
Vonage 提高了現場互動的視頻質量?
回想我們一年前的狀況真是不可思議。COVID-19挑戰了我們,改變了我們的工作,生活和彼此聯系的方式。視頻通信爆炸式增長以幫助我們適應新的生活方式—去年2月至4月之間,Vonage視頻平臺上的視頻分鐘數增加了707%,而視頻總分鐘數仍然很高,2020年7月的使用率比2020年2月的使用率達到501%。
https://www.vonage.com/about-us/vonage-stories/video-quality-webrtc-live-interactions-post-covid1/
如果讓AI根據文字畫「抽象畫」,那得成什么樣?|DeepMind新算法
根據文字生成圖片,AI早就會了。而如今,和以往的“寫實派”不同,AI要開始進軍“抽象派”藝術了!
這些行業,將率先落地AI芯片
廣義上,所有面向AI應用的芯片都可以稱為AI芯片。目前一般認為是針對AI算法做了特殊加速設計的芯片。現階段,這些人工智能算法一般以深度學習算法為主,也可以包括其他淺層機器學習算法。
性能優化:SRS為何能做到同類的三倍
性能無疑是服務器的核心能力,幾乎每個開源服務器的介紹都是”高性能XXX服務器“。視頻服務器由于業務的超復雜度,特別是WebRTC服務器,要做到高性能是非常有挑戰的難點。
Google新作 | 詳細解讀 Transformer那些有趣的特性(建議全文背誦)
本文發現了Transformer的一些重要特性,如Transformer對嚴重的遮擋,擾動和域偏移具有很高的魯棒性、與CNN相比,ViT更符合人類視覺系統,泛化性更強,等等…代碼即將開源!
實操教程|使用圖像分割來做缺陷檢測的一個例子
什么是物體檢測?給定一張圖像,我們人類可以識別圖像中的物體。例如,我們可以檢測圖像中是否有汽車,樹木,人等。如果我們可以分析圖像并檢測物體,我們可以教機器做同樣的事情嗎?答案是肯定的。隨著深度學習和計算機視覺的興起,我們可以實現目標檢測的自動化。
微軟MR設計師:如何用視覺模擬彌補AR交互缺乏的體感反饋?
近期,為了進一步優化AR虛實融合的效果,微軟MR設計師Oscar Salandin開發了一種逼真的物理模擬AR demo。據悉,該應用基于物理交互模擬和AR,乍一看只是一個可以自由交互的AR立方體,但它的獨特之處在于,可通過基于視覺的反饋來增強AR的逼真感,盡管沒有體感反饋,也能給體驗者帶來足夠虛實結合的感受。
綜述:基于點云的自動駕駛3D目標檢測和分類方法
本文基于現有的自動駕駛中利用3D點云數據進行目標檢測的文獻,從數據特征提取和目標檢測模型等方面對不同技術進行比較。
無人駕駛“解救”礦山之困
當社會還在熱議老齡化社會可能帶來的變化時,一些行業已經為這個問題焦頭爛額了許久。作為礦山智能化體系中重要組成部分的無人駕駛,得益于此前多年的技術積累,更容易快速落地,形成智慧礦山的標桿項目。
調查報告:全美成年人中有23%用過VR,Quest使用率占總體24%
自2012到2014年掀起一波VR風口,至今已經過去7年以上的時間。隨著前幾年VR一體機誕生,VR硬件和內容市場得到了肉眼可見的發展和推動。那么時至今日,已經有多少人用上了VR?VR在普通消費群體的滲透率到底有多少?又有哪些難點阻止更多人接受VR呢?為了解答上述問題,Thrive Analytics和ARtillery Intelligence合作發布全新的VR用戶行為調查報告,報告中對4.6萬美國成年人進行調查,結果發現……
廣播IP轉型報告:2021年廣播公司面臨的最大挑戰
在第一份關于IP和云應用狀況的報告中,當Haivision在2019年著手調查廣播公司時,我們很好奇是什么讓業內人士夜不能寐,并要求受訪者按重要性排序他們的答案。我們想深入挖掘,真正了解我們的廣播客戶面臨的最大挑戰和障礙是什么。去年底,當我們第二次進行這項調查時,我們問了同樣的問題,看看這些挑戰有什么變化。
活動推薦
#?火山引擎 “全擎而進” 品牌發布會
2021年6月10日,火山引擎“全擎而進”品牌發布會將在北京舉行,首次對外展示企業服務產品和行業增長案例,揭秘字節跳動 9 年增長背后的技術原力,這也是火山引擎自去年對外服務以來的首個對外大會。整場活動以線下參會、線上直播兩種方式進行。線下展區則被打造成了“增長引擎艙”,為來賓提供沉浸式商業體驗,更有代入感地體驗火山引擎產品技術帶來的增長成效。
https://www.livevideostack.cn/news/tech-for-growth-0610/
#?多媒體技術PI 第三期——網絡傳輸線上圓桌
掃描上方海報二維碼,關注 LiveVideoStack 視頻號預約 5月29日 上午10:30?的線上 /網絡傳輸/?主題圓桌直播你將看到WebRTC中的TURN的應用、WebRTC網絡安全傳輸、實時流媒體傳輸技術在直播場景應用實踐,以及如何提升直播體驗和技術應用背后的思考。
#?LiveVideoStackCon 2021?北京站大會門票7折優惠倒計時
LiveVideoStackCon 2021 北京站(9月3-4日),將以“新技術,新機會”為主題,聚焦行業最新技術探索與應用實踐,在這里不僅可以了解到業內頂尖技術人、leader的技術探索、創新思考與思維碰撞,此外還可以看到多媒體生態內部頂級玩家、大廠針對行業趨勢、存在挑戰,以及未來前景的全面解讀。
*LiveVideoStackCon 2021 北京站 ?大會門票7折優惠截止 —?5月30日
https://bj2021.livevideostack.com/
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 197的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【直播预告 | 今天10:30】多媒体技
- 下一篇: 新的Google Lyra音频编解码器对