Talk | 东京大学博士生刘海洋:多模态驱动谈话动作生成-质量与多样性
本期為TechBeat人工智能社區第471期線上Talk!
北京時間2月1日(周三)20:00,東京大學情報理工系博士生——劉海洋的Talk將準時在TechBeat人工智能社區開播!
他與大家分享的主題是:?“多模態驅動談話動作生成:質量與多樣性?”,屆時將介紹多模態驅動談話動作生成領域的進展。
Talk·信息
▼
主題:多模態驅動談話動作生成:質量與多樣性
嘉賓:東京大學情報理工系博士生 劉海洋
時間:北京時間?2月1日?(周三) 20:00
地點:TechBeat人工智能社區
http://www.techbeat.net/
點擊下方鏈接,即可觀看視頻
TechBeatTechBeat是薈聚全球華人AI精英的成長社區,每周上新來自頂尖大廠、明星創業公司、國際頂級高校相關專業在讀博士的最新研究工作。我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其成長。https://www.techbeat.net/talk-info?id=748
Talk·介紹
▼
隨著AIGC技術的發展,生成模型在動畫建模上已經取得了出色的成果,業界和學界的研究重心逐漸從建模轉向驅動,即探索基于AI的由低成本信號驅動的動作生成算法。目前的算法由于缺乏顯式的模型設計,以及豐富的訓練數據,在生成結果的質量和多樣性上仍與真實數據存在較大差異。提升生成動作的多樣性和質量是學界的熱點及難點。
Talk大綱如下:
本報告將介紹多模態驅動談話動作生成領域的進展,首先進行背景介紹(引出多樣性和質量問題),之后介紹針對多樣性提出的:基于動作特征解耦的動作生成算法,最后介紹針對該任務構建的新數據集,基線模型和評估標準,著重于生成情感和語意相關的動作。
Talk·預習資料
▼
-
DisCo: disentangled implicit content and rhythm learning for diverse co-speech gesture synthesis, ACMMM 2022,?https://pantomatrix.github.io/DisCo/??
-
BEAT: A Large-Scale Semantic and Emotional Multi-Modal Dataset for Conversational Gestures Synthesis, ECCV 2022,?https://pantomatrix.github.io/BEAT/??
Talk·提問交流
▼
在Talk界面下的【交流區】參與互動!留下你的打call🤟和問題🙋,和更多小伙伴們共同討論,被講者直接翻牌解答!
你的每一次貢獻,我們都會給予你相應的i豆積分,還會有驚喜獎勵哦!
Talk·嘉賓介紹
▼
劉海洋
東京大學情報理工系博士生
劉海洋,現為東京大學情報理工系博士生。2020年獲早稻田大學工學碩士學位,2019年獲東南大學工學學士學位。主要研究方向包括:多模態,生成模型,音頻識別,人體姿態估計等,主要工作集中于基于單/多模態生成更真實,有表現力的肢體/面部動作,從而構建基于AI的動畫制作管線。其研究成果發表于ECCV, KDD, ACMMM等國際會議。
個人主頁:
https://h-liu1997.github.io/
-The End-
關于TechBeat人工智能社區
▼
TechBeat(www.techbeat.net)隸屬于將門創投,是一個薈聚全球華人AI精英的成長社區。
我們希望為AI人才打造更專業的服務和體驗,加速并陪伴其學習成長。
期待這里可以成為你學習AI前沿知識的高地,分享自己最新工作的沃土,在AI進階之路上的升級打怪的根據地!
更多詳細介紹>>TechBeat,一個薈聚全球華人AI精英的學習成長社區
總結
以上是生活随笔為你收集整理的Talk | 东京大学博士生刘海洋:多模态驱动谈话动作生成-质量与多样性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 虹膜识别论文4:DeepIris: Le
- 下一篇: 程序员不知道用什么开发工具?我来告诉你(