音视频技术开发周刊 | 227
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
直播新玩法背后的音視頻技術演進
近年來,直播改變了許多行業模式,其形態在不斷的演進中也逐漸豐富起來。直播在字節跳動中衍生出了KTV歌房、直播答題、互動游戲、電商拍賣及企業直播等不同場景。本次分享我們邀請到火山引擎視頻云音視頻直播客戶端研發負責人——徐鴻,向大家介紹直播場景中沉淀下的優秀架構能力和技術能力。
微博HDR視頻的落地實踐
社交平臺以日漸成為我們日常生活中不可或缺的一部分。從文字、語音再到視頻,用戶對社交平臺中的視頻類信息越發依賴,這也促進了視頻體驗優化的發展。隨著HDR的普及,微博用戶也希望獲得更好的視頻體驗。本次LiveVideoStackCon 2021 音視頻技術大會 北京站,我們邀請到了微博客戶端播放器研發負責人——劉文,他向我們分享了微博在HDR視頻方面的落地實踐。
基于AVS3的全I幀8K淺壓縮編碼實踐
本文對AVS3標準進行擴展以支持4:2:2色度采樣格式,針對AVS3的全I幀編碼研發了基于CPU+GPU的混合編碼框架,同時設計實現高效并行機制,實現了8K 50P 10bit 4:2:2的實時編碼效果。通過對AVS3全I幀淺壓縮的實踐,驗證了其不僅可以滿足實際應用需求,而且在壓縮率上比現有方案體現出明顯優勢。
Android FFmpeg + MediaCodec 實現視頻硬解碼
本文將利用 FFmpeg+ MediaCodec 做一個播放器,實現視頻的硬解碼和音視頻同步等功能。
超高清時代編碼技術應用與發展的現狀
超高清電視的視頻數據量巨大,對視頻編碼技術提出了挑戰,為了更好地適應超高清時代編碼技術需求,國內外相關機構都開展了超高清編碼技術的研發和應用。本文對國內外超高清視頻編碼標準相關情況及關鍵技術進行了介紹,并對比分析了幾種淺壓縮編碼技術的性能,為超高清編碼技術實際應用提供參考。
從 RTC 走向元宇宙
元宇宙無疑是是當下產業和技術的熱詞,成為近期全球科技領域炙手可熱的新概念。上海交通大學 Medialab 的宋利老師最近就這一熱點話題,做過多次訪談或技術報告,包括上海人民廣播電臺長三角之聲《思創空間》、上海科技報《科技會客廳》、數字電視與無線多媒體通信國際論壇(IFTC2021) 、視頻體驗聯盟(VEA)、以及百視通、華為等企業。最近受邀在 RTSConf 2021(12 月 26 日,線上)做了“從 RTC 到元宇宙”的分享。
索尼360 VME空間音頻技術解析:可打造虛擬的專業混音室
我們都知道,理想的VR體驗不只需要沉浸、清晰的視覺效果,還需要模擬逼真的體感環境,而具有空間感的3D音頻也同樣重要。在VR中常用到兩種音頻,即Object Based Audio和Ambisonic。
其中,Ambisonic可應用于3DoF全景VR視頻。指的是一種高保真的立體聲像復制技術,特點是將聲源貼在360°全景視頻上,又稱為full-sphere環繞音頻。而Object-based音頻則是一種將聲源與位置信息結合的技術,原理是在空間中特定位置,放置支持實時渲染的聲源,為體驗者提供具有空間感的聲音效果。
旅行中的增強現實:增強現實(AR)如何豐富游客度假體驗
如果你玩過 Pokemon Go,嘗試過宜家的應用程序來選購家居,用過抖音各式各樣的濾鏡,沉迷過美圖相機的各種風格妝效,那么你已經與增強現實有了短暫的接觸。增強現實的本質是改變我們所見的事物,增強我們的體驗并且增加我們探索世界時的樂趣,這項新技術正在滲透進我們生活的方方面面。
Github大盤點!2021年最驚艷的38篇AI論文
2021年是人工智能繼續突飛猛進的一年。近日,Github上有人總結出了今年最有趣、最驚艷的38篇關于AI和機器學習論文,值得收藏。
基于Adapter結構進行高參數效率的跨語言遷移學習
本文將為大家介紹「如何使用Adapter(適配器)結構、基于元學習和遷移學習思想對預訓練語音識別(ASR)模型進行跨語言的遷移」。
2021 AI技術盤點:預訓練模型5大進展
2021年已進入尾聲,回顧一年來人工智能領域的發展歷程,有眾多矚目的技術事件發展。其中,預訓練模型無疑是2021年的重點發展領域。
基于Object Query的機器視覺新思路: DETR及發展
目標檢測是計算機視覺的重要任務。DETR模型是面向這一任務的新型端到端方法。它集合了set prediction思想,以創新的object query結構,打破了之前傳統的基于人工錨點進行識別再進行重復結果合并的流程。我們將探討其中的實現原理以及后續的改進工作,這也將幫助我們思考與DETR類似的使用Transformer結構在計算機視覺領域的應用及其特點。
動漫風格遷移AnimeGANv2,發布線上運行Demo
AnimeGANv2 最近發布了一項更新,由社區貢獻者開發,通過 Gradio 實現了一個可以在線運行的 Demo,發布在 huggingface 上。
用上 RNN,這個視頻摳像工具效果絕了
本文為字節跳動團隊發布的視頻摳像工具 RVM 代碼解析及論文《Robust High-Resolution Video Matting with Temporal Guidance》概要。
圖像的表示(2):YCbCr 怎么來的?必看這篇顏色空間發展簡史丨音視頻基礎
在前面的文章《圖像的表示(1)》里,我們提出了一個問題:從我們眼睛看見的『畫面』,到我們用手機、電腦所處理的『圖像數據』,其中經歷了什么?從這個問題出發,我們探討了『圖像的定義是什么』和『圖像成像的原理是什么』這兩個問題,接下來我們繼續探討下個問題:『怎樣對圖像進行數學描述』。
閱讀推薦
音視頻出海,如何乘風破浪?
最近幾年,以TikTok為首的泛娛樂出海企業的成功讓大家看到了中國之外的巨大市場和機會。但面對緊張的國際形勢,嚴格的監管措施,很多躍躍欲試、想要開啟出海業務的公司卻望而卻步:要不要出海?向哪里出海?如何應對“水土不服”?本地化如何開展?海外員工在管理上與國內有何不同?各種不確定性和疑問隨之而來。
因此,LiveVideoStack策劃了一期出海訪談,我們邀請到三家音視頻相關領域的出海企業:四達時代、聲網Agora和傳音控股,請相關負責人跟大家聊聊出海所面臨的機遇和挑戰。
中南大學張昊:我非常期待基于AI的圖像視頻編碼技術的創新
本周是2021年的最后一周,在這個迎接新年的日子里,LiveVideoStack有幸邀請到了中南大學計算機學院張昊教授參加我們的年終訪談。過去的十余年時間里,張教授一直致力于視頻編碼技術的研究,曾發表期刊會議論文共50余篇,擁有專利60余項(授權或申請),主要研究領域包括視頻編解碼、基于深度學習的圖像視頻處理、視頻分析等。在此次與LiveVideoStack的對話中,張教授分享了他對音視頻技術發展與未來創新、元宇宙、音視頻人才培養和技術學習等話題的看法和感悟。
蘋果發布7項空間音頻相關專利
蘋果正在優先考慮在AirPods Pro,AirPods Max和未來的混合現實耳機的音頻系統上提供空間音頻。空間音頻與動態頭部跟蹤為用戶提供影院般的觀影體驗,在觀影過程中,聲音始終圍繞著他們。通過內置陀螺儀和加速計,AirPods Max和你的iPhone、iPad、Mac或Apple TV追蹤頭部的細微運動,并由此將聲音固定在設備上。日前,美國專利和商標局發布了一系列蘋果公司與空間音頻相關的7項專利申請,這些專利詳細介紹了頭部運動檢測、用戶姿態檢測等。
行業報告|未來已來:全球XR產業洞察
近日,德勤中國科技、傳媒和電信行業推出元宇宙系列報告《元宇宙系列白皮書—未來已來:全球XR產業洞察》,聚焦XR產業發展趨勢。
報告指出,多元融合是元宇宙的演變趨勢。在元宇宙發展的起步階段,預計將會形成以各行業為核心的分散化、多中心的元宇宙小生態體系,隨后相近的小生態之間開始逐步打通數據與標準,實現相似相融的整合,而成熟階段的元宇宙目前仍充斥的大量不確定的想象。
LiveVideoStack公眾號2021年終盤點
在2021年伊始,我們翻譯過Tsahi Levent-Levi關于今年WebRTC流行趨勢的文章,文中提到2021年將是“還債”的一年,此前所進行的系統設計、軟件架構或軟件開發都將迎來最終結果;同時它也將是服務及傳輸質量不斷優化的一年。在供給側長期大于需求側的當下,技術迭代的速度遠遠甩開新需求增長的趨勢。或許每當這個時期,大家都會選擇沉淀下來等待下一個風口,翹首以盼誰會成為下一只“FlyPig”,率先打破元宇宙與現實的邊界。
在此之前還是讓我們跟隨LiveVideoStack的視角,來看看2021年有哪些內容被大家廣泛關注。
活動推薦
【城市沙龍】LiveVideoStack Meet | 南京:
互聯網沙漠的音視頻發展
2021年LiveVideoStack Meet已成功在北京、蘇州、杭州、成都、西安、合肥與上海落地。這一路我們分享對于行業內卷的看法,探討技術發展方向,也了解到更多二線城市的音視頻環境。2022年第一站,將于1月8日在南京與大家見面,本次分享內容涵蓋人工智能、實時音視頻、直播全鏈路監控、云游戲實踐等多方面,快來現場與嘉賓面對面交流吧。
活動時間:2022.01.08 14:00-16:00
活動地點:南京市雨花臺區鳳信路6號 南京金證科技園3棟1樓路演廳
報名地址:
https://8392623630544.huodongxing.com/event/5628086056100
插圖源自Pexels
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 227的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LiveVideoStack公众号202
- 下一篇: SRS的2021,盐碱地里种西瓜的王婆