微软展示 Rumi 项目,通过多模方式提高 AI 理解能力
生活随笔
收集整理的這篇文章主要介紹了
微软展示 Rumi 项目,通过多模方式提高 AI 理解能力
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
8 月 5 日消息,微軟研究院近日展示了 Project Rumi 項目,結合文本,音頻和視頻數據,通過多模方法,提高人工智能系統的理解能力,從而更能理解人類的意圖。
人工智能系統近年來取得了長足的進步,尤其在自然語言處理(NLP)領域的成長更為驚人。不過現有 NLP AI 主要依賴于文本輸入輸出,忽略了人類在自然交流中的語調,面部表情,手勢和肢體語言等線索,從而在理解方面會存在偏差。
在 AI 專業術語中,這些線索統稱為副語言(paralinguistics/ paralanguage)。
微軟研究院為了解決這個問題,開發了 Project Rumi,這是一個新穎的框架,旨在通過多模態副語言提示來增強人工智能的理解。該項目包括兩個主要部分:多模式副語言編碼器和多模式副語言解碼器。在此附上視頻如下:
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的微软展示 Rumi 项目,通过多模方式提高 AI 理解能力的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Win11 预览版新特性:鼠标和键盘 R
- 下一篇: 蔚来法务部:捐赠维权所获赔偿用于社会公益