當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Talk | 东京大学博士生刘海洋：多模态驱动谈话动作生成-质量与多样性

發布時間：2024/3/26 编程问答 40 豆豆

生活随笔收集整理的這篇文章主要介紹了 Talk | 东京大学博士生刘海洋：多模态驱动谈话动作生成-质量与多样性小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本期為TechBeat人工智能社區第471期線上Talk！

北京時間2月1日(周三)20:00，東京大學情報理工系博士生——劉海洋的Talk將準時在TechBeat人工智能社區開播！

他與大家分享的主題是:?“多模態驅動談話動作生成：質量與多樣性?”，屆時將介紹多模態驅動談話動作生成領域的進展。

Talk·信息

▼

主題：多模態驅動談話動作生成：質量與多樣性

嘉賓：東京大學情報理工系博士生劉海洋

時間：北京時間?2月1日?(周三) 20:00

地點：TechBeat人工智能社區

http://www.techbeat.net/

點擊下方鏈接，即可觀看視頻

TechBeatTechBeat是薈聚全球華人AI精英的成長社區，每周上新來自頂尖大廠、明星創業公司、國際頂級高校相關專業在讀博士的最新研究工作。我們希望為AI人才打造更專業的服務和體驗，加速并陪伴其成長。https://www.techbeat.net/talk-info?id=748

Talk·介紹

▼

隨著AIGC技術的發展，生成模型在動畫建模上已經取得了出色的成果，業界和學界的研究重心逐漸從建模轉向驅動，即探索基于AI的由低成本信號驅動的動作生成算法。目前的算法由于缺乏顯式的模型設計，以及豐富的訓練數據，在生成結果的質量和多樣性上仍與真實數據存在較大差異。提升生成動作的多樣性和質量是學界的熱點及難點。

Talk大綱如下：

本報告將介紹多模態驅動談話動作生成領域的進展，首先進行背景介紹（引出多樣性和質量問題），之后介紹針對多樣性提出的：基于動作特征解耦的動作生成算法，最后介紹針對該任務構建的新數據集，基線模型和評估標準，著重于生成情感和語意相關的動作。

Talk·預習資料

▼

DisCo: disentangled implicit content and rhythm learning for diverse co-speech gesture synthesis, ACMMM 2022,?https://pantomatrix.github.io/DisCo/??
BEAT: A Large-Scale Semantic and Emotional Multi-Modal Dataset for Conversational Gestures Synthesis, ECCV 2022,?https://pantomatrix.github.io/BEAT/??

Talk·提問交流

▼

在Talk界面下的【交流區】參與互動！留下你的打call🤟和問題🙋，和更多小伙伴們共同討論，被講者直接翻牌解答！

你的每一次貢獻，我們都會給予你相應的i豆積分，還會有驚喜獎勵哦！

Talk·嘉賓介紹

▼

劉海洋

東京大學情報理工系博士生

劉海洋，現為東京大學情報理工系博士生。2020年獲早稻田大學工學碩士學位，2019年獲東南大學工學學士學位。主要研究方向包括：多模態，生成模型，音頻識別，人體姿態估計等，主要工作集中于基于單/多模態生成更真實，有表現力的肢體/面部動作，從而構建基于AI的動畫制作管線。其研究成果發表于ECCV, KDD, ACMMM等國際會議。

個人主頁：

https://h-liu1997.github.io/

-The End-

關于TechBeat人工智能社區

▼

TechBeat(www.techbeat.net)隸屬于將門創投，是一個薈聚全球華人AI精英的成長社區。

我們希望為AI人才打造更專業的服務和體驗，加速并陪伴其學習成長。

期待這里可以成為你學習AI前沿知識的高地，分享自己最新工作的沃土，在AI進階之路上的升級打怪的根據地！

更多詳細介紹>>TechBeat，一個薈聚全球華人AI精英的學習成長社區

總結

以上是生活随笔為你收集整理的Talk | 东京大学博士生刘海洋：多模态驱动谈话动作生成-质量与多样性的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：虹膜识别论文4：DeepIris: Le
下一篇：程序员不知道用什么开发工具？我来告诉你(