对话美摄科技侯康:提升技术,拓展场景 美摄智能汽车视频处理方案已就位
美攝科技成立于2014年,是一家專注智能視音頻整體解決方案的國家高新技術企業,致力于視音頻與AI技術的融合與創新,目前已服務海內外數千家企業客戶。在視音頻領域深耕多年,美攝科技憑借雄厚的技術實力,在當今視頻化浪潮下不斷拓展應用場景,將服務擴展到了智能手機、智能硬件、智能汽車、智慧廣電等眾多領域,助力平臺為用戶帶來更豐富、更便捷的視頻創作體驗。本次,LiveVideoStack有幸采訪了來自美攝科技的算法工程師侯康,他向我們介紹了過去的一年美攝科技在音視頻領域關注的重點、在美攝汽車智能剪輯方案開發過程中所做的工作、研發過程中遇到的“坑”以及最近推出的桌面端深度視頻編輯解決方案“美映PC版”等。
侯康:北京美攝網絡科技有限公司 , 算法工程師
LiveVideoStack: 侯老師,您好。請您介紹一下您在美攝科技所負責的工作和您近期所關注的技術方向。
侯康: 我目前負責美攝AI算法團隊的管理,技術方面主要是針對智能剪輯和圖像處理算法的開發。當前我主要關注一些新的AI研究方向,例如transformer在智能剪輯系統方面可能會涉及到的應用點,同時繼續拓展和優化美攝的智能剪輯能力。
LiveVideoStack:在過去的一年,美攝科技在音視頻領域中關注的重點是什么?取得了哪些成績?
侯康: 美攝在音視頻領域主要關注智能剪輯在各個領域的拓展和應用。美攝在2019年開發出了面向生活類和旅行類視頻的智能剪輯系統,并獲得了市場的熱烈反響,因此后續我們針對各種不同場景進行了大量優化工作。例如在智能汽車領域,我們針對汽車視頻拍攝場景的特點和汽車的硬件系統做了大量適配和優化工作,并且加入了面向汽車的特色算法,收到了客戶的一致好評。
去年,美攝除了在智能手機、智能硬件、社交平臺、政務媒體以及出海等領域持續發力以外,還將服務領域擴展至了智能穿戴、智能汽車等新行業。技術方面我們也取得了新的突破,在國家廣播電視總局舉辦的首屆“廣播電視和網絡視聽人工智能應用創新大賽”中,美攝基于深度學習框架的智能視頻內容生產平臺經過層層評選,最終斬獲一等獎。
LiveVideoStack:在這里道一聲恭喜!我們也很欣喜地發現美攝開始在智能汽車領域發力,是怎樣的契機想到去開發這個場景?
侯康: 隨著車輛的普及、硬件升級和用戶的認知提升,汽車用戶對車輛的訴求也從基礎的駕駛代步向全面的駕乘體驗轉變,簡單的車內娛樂已經無法滿足用戶需求,圍繞汽車的生活內容分享變得越來越重要。當前的拍攝硬件大都還是使用手機、相機等外部設備,駕駛過程中用戶使用的便利性不佳,拍攝視角也極為受限。此外,目前很少有適合車輛場景的制作工具,用戶在利用手機、PC軟件進行后期處理時,需要導入長段視頻,后期制作難度大,也無法進行實時分享。在此背景下,美攝汽車智能視頻處理方案應運而生。
LiveVideoStack:作為全新視頻生產平臺,汽車進行視頻處理與互聯網場景下通過移動端、PC端等進行視頻創作有什么區別?
侯康: 汽車本身沒有像手機和PC那樣方便的用戶操作界面,因此對于自動化的剪輯方案需求更加迫切。汽車的處理平臺和系統目前還是百花齊放的狀態,因此需要做大量的適配工作,來滿足不同廠家的需求,美攝目前擁有全平臺適配的能力。此外,汽車無法像手機和PC那樣隨時更新軟件,并且對安全性和穩定性的要求更高。美攝做了大量工作來滿足汽車廠商對于穩定性和安全性的要求,目前我們的SDK和整套智能剪輯系統已經能夠穩定地運行在主流廠商的車載操作系統上。
LiveVideoStack:在智能汽車場景下智能視頻生產平臺研發的過程中遇到的“坑”是什么?如何解決?
侯康: 在智能剪輯系統的開發過程中,主要的難點在于如何針對不同場景進行調優。目前AI技術還無法像真正的導演那樣面對不同場景、不同類型的片子都能完成剪輯,因此針對不同場景需要設計不同的框架和算法來達到最優的效果。此外在進行汽車智能剪輯系統開發時,最大的問題還是不同系統和硬件架構的適配過程。由于汽車硬件、處理平臺、系統還沒有像手機和PC那樣較為統一,因此需要做大量工作來進行適配和調優,才能達到流暢穩定的運行狀態。
LiveVideoStack:有看到美攝近期推出了桌面端深度視頻編輯解決方案“美映PC版”。其實無論是PC端還是移動端,面向內容創作的視頻編輯工具也涌現很多,那么美攝是處于怎樣的考量去推出這樣一款產品呢?
侯康: 美映PC版是一款面向企業用戶的深度視頻編輯工具,具備全面且高效的專業編輯功能,接入方式簡單,支持企業添加自研或其他第三方技術。基于跨平臺的美攝SDK,企業可以搭建互通協作的平臺及方案產品,輸出多場景專業編輯應用產品。
美攝推出這款產品跟當下的視頻領域發展趨勢是分不開的。現如今隨著長、短視頻平臺之間的競爭進一步加劇,中視頻內容已成為平臺的重點發力方向。中長視頻對創作工具及場景的要求更為嚴苛,不同平臺的風格調性也決定了創作者很難通過Pr、Final Cut Pro這樣的傳統視頻編輯工具直接生產出所需內容,打造自有視頻編輯工具是不少平臺的選擇。但PC端視音頻編輯開發難度大,所需投入和后期維護成本過高。基于這樣的背景,我們推出了美映PC版,助力平臺快速搭建自有視頻創作平臺,構建系統化的產品生態。
LiveVideoStack:美攝科技的下一步規劃是什么?重心會放在技術研發方面,還是在場景拓展方面呢?
侯康: 作為國家高新技術企業,美攝致力于成為全球最具影響力的智能視音頻技術企業。美攝的核心研發團隊在視音頻領域有著豐富的研發經驗,專注視音頻引擎、圖形圖像處理和計算機視覺領域開發二十余年。與此同時,我們也在不斷探索新的應用場景。去年我們在智能手機、智能硬件、廣電及通信運營商等的基礎上,成功將業務領域拓展到了智能汽車、智能穿戴等行業。
在我們看來,技術研發和場景拓展二者是相互促進的關系。領先的技術水平能夠支撐我們開拓更廣泛的應用場景,同時新的場景需求和應用中遇到的新情況、新問題也會促使我們不斷提高技術能力。今年,我們推出了美映PC版、一鍵成片等多種新方案,能夠適配更多應用場景,敬請期待。
LiveVideoStack:本次大會您將分享哪些精彩內容呢?您可以劇透一下嗎?
侯康: 本次大會我將會分享美攝的汽車智能剪輯系統相關的解決方案,包括圖像畫質增強、智能視頻剪輯以及虛擬場景娛樂三部分。
LiveVideoStack:好的,謝謝您接受采訪,期待您在大會上的精彩分享。
采訪、編輯:Teresa
▼掃描下圖二維碼了解音視頻技術大會更多信息▼
總結
以上是生活随笔為你收集整理的对话美摄科技侯康:提升技术,拓展场景 美摄智能汽车视频处理方案已就位的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【专题介绍】音视频+
- 下一篇: 【公开课预告】:多媒体开源PI