當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

音视频技术开发周刊 | 197

發布時間：2024/4/11 编程问答 51 豆豆

生活随笔收集整理的這篇文章主要介紹了音视频技术开发周刊 | 197 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

每周一期，縱覽音視頻技術領域的干貨。

新聞投稿：contribute@livevideostack.com。

小提示：鏈接跳轉僅支持公眾號相關鏈接

穩健、可靠全真即時通信網的架構與應用
支撐全真互聯網的基礎網絡包括實時音視頻通信網絡、即時通信網絡和流媒體分發網絡。隨著社會的進步，人們對低延時即時通信的需求越來越高。本次LiveVideoStackCon 2021上海站大會邀請到了負責騰訊云千億級底層通信網絡的劉然，他為我們分享了穩健、可靠的全真即時通信網的架構與應用實踐。

如何利用 AWS WebSocket API 進行無服務器 Serverless WebRTC 信令
在本文中，Edward展示了他們如何利用無服務器架構來設置其WebRTC信號。他們使用AWS的API網關WebSocket API終止WebSocket并調用AWS無服務器Lambda函數。

https://webrtchacks.com/leverage-aws-websocket-api-for-webrtc-signaling/

詳解 WebRTC 高音質低延時的背后 — AGC（自動增益控制）
本文將結合實例全面解析 WebRTC AGC 的基本框架，一起探索其基本原理、模式的差異、存在的問題以及優化方向。

MPEG-DASH視頻流——完全指南
MPEG-DASH是最流行的視頻流協議之一，被廣泛用于通過視頻點播或直播來把媒體分發到各種終端用戶設備，包括智能手機、平板電腦、智能電視、游戲機等等。這篇文章將介紹MPEG-DASH的基本原理、它的歷史、最重要的特點等等。

網易云信視頻引擎技術
視頻引擎的應用場景多為需要低延遲的實時通訊場景，比如視頻會議和娛樂直播。本次分享我們邀請到了網易云信的工程師韓慶瑞老師，為我們分享網易云信視頻引擎技術的特點和落地方案。

通過透視式顯示設備和光學設備進行視覺增強
本文來自OSA的Imaging and Applied Optics Congress 2020，講者是來自東京工業大學的助理教授Yuta Itoh，演講主題是關于通過透視式顯示設備和光學設備進行視覺增強。

2021 最新視頻防抖論文+開源代碼匯總
今年三篇關于視頻防抖的文章，這三篇文章分布采用了不同的方法來解決視頻抖動的問題。
1、基于深度的三維視頻穩定學習方法Deep3D穩定器
2、融合運動傳感器數據和光流，實現在線視頻穩定
3、融合視頻中多個相鄰幀的信息，來呈現無需裁剪的完整穩定視頻

喜馬拉雅：基于 WeNet 和 gRPC 的語音識別微服務架構的設計和應用
近日，喜馬拉雅語音團隊在wenet中增加了基于gRPC的流式語音識別的支持。本文由喜馬拉雅語音團隊撰寫，介紹wenet中的gRPC的設計和實現，并介紹喜馬拉雅基于wenet和gRPC的語音識別微服務架構的設計和應用。

Vonage 提高了現場互動的視頻質量?
回想我們一年前的狀況真是不可思議。COVID-19挑戰了我們，改變了我們的工作，生活和彼此聯系的方式。視頻通信爆炸式增長以幫助我們適應新的生活方式—去年2月至4月之間，Vonage視頻平臺上的視頻分鐘數增加了707％，而視頻總分鐘數仍然很高，2020年7月的使用率比2020年2月的使用率達到501％。

https://www.vonage.com/about-us/vonage-stories/video-quality-webrtc-live-interactions-post-covid1/

如果讓AI根據文字畫「抽象畫」，那得成什么樣？｜DeepMind新算法

根據文字生成圖片，AI早就會了。而如今，和以往的“寫實派”不同，AI要開始進軍“抽象派”藝術了！

這些行業，將率先落地AI芯片
廣義上，所有面向AI應用的芯片都可以稱為AI芯片。目前一般認為是針對AI算法做了特殊加速設計的芯片。現階段，這些人工智能算法一般以深度學習算法為主，也可以包括其他淺層機器學習算法。

性能優化：SRS為何能做到同類的三倍
性能無疑是服務器的核心能力，幾乎每個開源服務器的介紹都是”高性能XXX服務器“。視頻服務器由于業務的超復雜度，特別是WebRTC服務器，要做到高性能是非常有挑戰的難點。

Google新作 | 詳細解讀 Transformer那些有趣的特性（建議全文背誦）
本文發現了Transformer的一些重要特性，如Transformer對嚴重的遮擋，擾動和域偏移具有很高的魯棒性、與CNN相比，ViT更符合人類視覺系統，泛化性更強，等等…代碼即將開源！

實操教程｜使用圖像分割來做缺陷檢測的一個例子
什么是物體檢測？給定一張圖像，我們人類可以識別圖像中的物體。例如，我們可以檢測圖像中是否有汽車，樹木，人等。如果我們可以分析圖像并檢測物體，我們可以教機器做同樣的事情嗎?答案是肯定的。隨著深度學習和計算機視覺的興起，我們可以實現目標檢測的自動化。

微軟MR設計師：如何用視覺模擬彌補AR交互缺乏的體感反饋？
近期，為了進一步優化AR虛實融合的效果，微軟MR設計師Oscar Salandin開發了一種逼真的物理模擬AR demo。據悉，該應用基于物理交互模擬和AR，乍一看只是一個可以自由交互的AR立方體，但它的獨特之處在于，可通過基于視覺的反饋來增強AR的逼真感，盡管沒有體感反饋，也能給體驗者帶來足夠虛實結合的感受。

綜述：基于點云的自動駕駛3D目標檢測和分類方法

本文基于現有的自動駕駛中利用3D點云數據進行目標檢測的文獻,從數據特征提取和目標檢測模型等方面對不同技術進行比較。

無人駕駛“解救”礦山之困

當社會還在熱議老齡化社會可能帶來的變化時，一些行業已經為這個問題焦頭爛額了許久。作為礦山智能化體系中重要組成部分的無人駕駛，得益于此前多年的技術積累，更容易快速落地，形成智慧礦山的標桿項目。

調查報告：全美成年人中有23%用過VR，Quest使用率占總體24%
自2012到2014年掀起一波VR風口，至今已經過去7年以上的時間。隨著前幾年VR一體機誕生，VR硬件和內容市場得到了肉眼可見的發展和推動。那么時至今日，已經有多少人用上了VR？VR在普通消費群體的滲透率到底有多少？又有哪些難點阻止更多人接受VR呢？為了解答上述問題，Thrive Analytics和ARtillery Intelligence合作發布全新的VR用戶行為調查報告，報告中對4.6萬美國成年人進行調查，結果發現……

廣播IP轉型報告：2021年廣播公司面臨的最大挑戰
在第一份關于IP和云應用狀況的報告中，當Haivision在2019年著手調查廣播公司時，我們很好奇是什么讓業內人士夜不能寐，并要求受訪者按重要性排序他們的答案。我們想深入挖掘，真正了解我們的廣播客戶面臨的最大挑戰和障礙是什么。去年底，當我們第二次進行這項調查時，我們問了同樣的問題，看看這些挑戰有什么變化。

活動推薦

#?火山引擎 “全擎而進” 品牌發布會

2021年6月10日，火山引擎“全擎而進”品牌發布會將在北京舉行，首次對外展示企業服務產品和行業增長案例，揭秘字節跳動 9 年增長背后的技術原力，這也是火山引擎自去年對外服務以來的首個對外大會。整場活動以線下參會、線上直播兩種方式進行。線下展區則被打造成了“增長引擎艙”，為來賓提供沉浸式商業體驗，更有代入感地體驗火山引擎產品技術帶來的增長成效。

https://www.livevideostack.cn/news/tech-for-growth-0610/

#?多媒體技術PI 第三期——網絡傳輸線上圓桌

掃描上方海報二維碼，關注 LiveVideoStack 視頻號預約 5月29日上午10:30?的線上 /網絡傳輸/?主題圓桌直播你將看到WebRTC中的TURN的應用、WebRTC網絡安全傳輸、實時流媒體傳輸技術在直播場景應用實踐，以及如何提升直播體驗和技術應用背后的思考。

#?LiveVideoStackCon 2021?北京站大會門票7折優惠倒計時

LiveVideoStackCon 2021 北京站（9月3-4日），將以“新技術，新機會”為主題，聚焦行業最新技術探索與應用實踐，在這里不僅可以了解到業內頂尖技術人、leader的技術探索、創新思考與思維碰撞，此外還可以看到多媒體生態內部頂級玩家、大廠針對行業趨勢、存在挑戰，以及未來前景的全面解讀。

*LiveVideoStackCon 2021 北京站 ?大會門票7折優惠截止 —?5月30日

https://bj2021.livevideostack.com/

總結

以上是生活随笔為你收集整理的音视频技术开发周刊 | 197的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【直播预告 | 今天10:30】多媒体技
下一篇：新的Google Lyra音频编解码器对