INTERSPEECH 2020 AutoSpeech论文征集挑战赛正式启动
近日,國際語音領(lǐng)域頂級會議INTERSPEECH 2020正式公布了“Special Sessions & Challenges”議程,其中由第四范式、南方科技大學(xué)、西北工業(yè)大學(xué)、ChaLearn、Google聯(lián)合主辦的AutoSpeech 2020于近期公開征集論文,投稿者可在5月8日前提交與AutoSpeech主題有關(guān)的論文。作為此次會議的競賽環(huán)節(jié),第二屆AutoSpeech挑戰(zhàn)賽也正式開賽,旨在讓參賽選手設(shè)計開發(fā)全自動的語音多標(biāo)簽分類系統(tǒng),自動挖掘聲紋、語種、情感等各類語音信息。
近年來,深度學(xué)習(xí)在說話人識別、語言識別和情感識別等語音相關(guān)任務(wù)中取得了顯著的成功。而隨著語音類應(yīng)用需求量的不斷增長,對語音分類技術(shù)及系統(tǒng)也提出了更高的需求。然而,這些語音相關(guān)任務(wù)的復(fù)雜性往往超出了非專家的能力范圍。在實際應(yīng)用中,在沒有語音處理等相關(guān)專業(yè)知識儲備的情況下,則很難使深度學(xué)習(xí)系統(tǒng)獲得良好的性能。自動深度學(xué)習(xí)(AutoDL)是一種無需人工干預(yù)、針對特定范圍任務(wù)的動態(tài)學(xué)習(xí)系統(tǒng),因具備降低深度學(xué)習(xí)系統(tǒng)門檻等特性成為行業(yè)研究的重要方向。
AutoSpeech 2020以“可自動構(gòu)建語音類深度學(xué)習(xí)系統(tǒng)”為目標(biāo),通過舉辦AutoSpeech挑戰(zhàn)賽、論文投稿及分享等形式,推動AutoDL技術(shù)在語音領(lǐng)域的落地及快速發(fā)展。此前,第四范式已先后組織了面向圖像、語音、自然語言處理等技術(shù)領(lǐng)域的AutoDL系列賽事,如AutoSpeech、AutoCV、AutoNLP等,引起學(xué)術(shù)界和產(chǎn)業(yè)界的關(guān)注。作為第二屆AutoSpeech挑戰(zhàn)賽,比賽難度將進一步升級。
??論文征集 ??
AutoSpeech 2020將遵循INTERSPEECH 2020相同的論文提交政策,被提交的論文屬于官方正式會議論文,由AutoSpeech 2020 Special Session擇優(yōu)錄取。本次,主辦方接收以AutoSpeech為主題的論文,包括(但不限于):
-??????Meta Learning
-??????Transfer Learning
-??????Network Architecture Search
-??????Few-shot Learning
-??????Reinforcement Learning
-??????Model Compression
-??????Data Augmentation
-??????Hyperparameter Optimization
-??????Learning to Learn
-??????Algorithm Configuration
-??????Model Selection
-??????Model Initialization
此外,語音相關(guān)的論文也可投稿,包括(但不限于):
-??????Automatic Speech Recognition
-??????Analysis of Paralinguistics in Speech and Language
-??????Speaker Identification
-??????Language Identification
-??????Emotion Classificaton
-??????Accent Recognition
-??????Music Genre Classification
即使作者不參與比賽,也具備投稿資格。
??關(guān)于比賽??
AutoSpeech競賽旨在為語音相關(guān)任務(wù)提出自動解決方案,這一挑戰(zhàn)僅限于來自不同語音分類領(lǐng)域的多標(biāo)簽分類問題。當(dāng)只提供原始數(shù)據(jù)(語音特征)和元信息時,所提供的解決方案有望發(fā)現(xiàn)多種副語言、語音屬性信息,如說話人、語言、情感等。
?
主辦方為本次比賽準(zhǔn)備了15個語音分類數(shù)據(jù)集。其中包括 5個離線公共數(shù)據(jù)集(用于選手開發(fā)和訓(xùn)練自己的AutoSpeech程序)、5個線上公共數(shù)據(jù)集(用于盲測,選手無法獲得數(shù)據(jù)集任何信息)、5個私有數(shù)據(jù)集(用于盲測,選手無法獲得數(shù)據(jù)集任何信息)。
賽事挑戰(zhàn)
在第一屆AutoSpeech挑戰(zhàn)賽中,許多解決方案在自動語音分類任務(wù)的性能上取得了顯著進步,但當(dāng)數(shù)據(jù)集變大以及標(biāo)簽類別更多時,比賽仍極具挑戰(zhàn)性。此外,選手面臨的其他挑戰(zhàn)還包括:
-??????如何在口語會話中自動發(fā)現(xiàn)各種副語言信息?
- ? ? ?如何從語音數(shù)據(jù)中自動提取不同任務(wù)的有效特征?
- ? ? ?如何自動處理長時和短時語音數(shù)據(jù)?
- ? ? ?如何自動設(shè)計有效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)?
- ? ? ?如何建立和自動適應(yīng)預(yù)先訓(xùn)練的模型?
?
此外,選手還應(yīng)考慮:
-??????如何自動有效地選擇合適的機器學(xué)習(xí)模型和超參數(shù)?
-??????如何使解決方案更通用,即如何使其適用于未知的任務(wù)?
-??????如何保證計算和內(nèi)存成本可以接受?
賽事規(guī)則
本次挑戰(zhàn)賽分為三個階段(反饋階段、檢查階段和最終階段)。首先,選手通過5個可下載的公共數(shù)據(jù)集,離線開發(fā)AutoSpeech解決方案。然后進入反饋階段,參賽者將自己的AutoSpeech程序代碼上傳到平臺上,并通過在另外五個驗證數(shù)據(jù)集測試,得到其性能的即時反饋。反饋階段結(jié)束后,將進入檢查階段,參賽選手只允許在私有數(shù)據(jù)集上提交一次代碼,以便進行調(diào)試。此時,參賽選手將無法閱讀詳細(xì)的日志,但是他們能夠看到提交的代碼是否報告錯誤。最終階段,參賽選手的AutoSpeech程序在五個測試數(shù)據(jù)集上進行評估。最終階段的排名將決定獲勝者。
賽程時間
以下均為北京時間(UTC+8)
2020年3月4日:發(fā)布公共數(shù)據(jù)集和基線
2020年3月11日:反饋階段開始
2020年4月20日:反饋階段結(jié)束
2020年4月20日:檢查階段開始
2020年4月22日:檢查階段結(jié)果通知
2020年4月24日:重新提交的截止日期,檢查階段結(jié)束
2020年4月24日:最終階段開始
2020年4月27日:最終階段結(jié)束,并通知結(jié)果
2020年5月8日:INTERSPEECH 2020論文提交截止日期
TBA:向INTERSPEECH 2020提交最終文件
TBA:提供終稿論文
?
賽事獎金
第一名:2000 USD
第二名:1500 USD
第三名:500 USD
AutoML系列賽事
-??????AutoML@PAKDD 2018
-??????AutoML@NeurIPS 2018
-??????AutoML@PAKDD 2019
-??????AutoML@KDDCUP 2019
-??????AutoCV@IJCNN 2019
-??????AutoCV2@ECML PKDD 2019
-??????AutoNLP@WAIC 2019
-??????AutoSpeech@ACML 2019
-??????AutoWSL@ACML 2019
-??????AutoSeries@WSDM 2020
想要參與AutoSpeech 2020挑戰(zhàn)賽以及提交論文的朋友,可以點擊【閱讀原文】查看官網(wǎng)詳細(xì)信息。
總結(jié)
以上是生活随笔為你收集整理的INTERSPEECH 2020 AutoSpeech论文征集挑战赛正式启动的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL中 JSON 数据类型应用
- 下一篇: java 自定义注解+AOP实现日志记录