當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

INTERSPEECH 2020 AutoSpeech论文征集挑战赛正式启动

發(fā)布時間：2025/3/12 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 INTERSPEECH 2020 AutoSpeech论文征集挑战赛正式启动小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

近日，國際語音領(lǐng)域頂級會議INTERSPEECH 2020正式公布了“Special Sessions & Challenges”議程，其中由第四范式、南方科技大學(xué)、西北工業(yè)大學(xué)、ChaLearn、Google聯(lián)合主辦的AutoSpeech 2020于近期公開征集論文，投稿者可在5月8日前提交與AutoSpeech主題有關(guān)的論文。作為此次會議的競賽環(huán)節(jié)，第二屆AutoSpeech挑戰(zhàn)賽也正式開賽，旨在讓參賽選手設(shè)計開發(fā)全自動的語音多標(biāo)簽分類系統(tǒng)，自動挖掘聲紋、語種、情感等各類語音信息。

近年來，深度學(xué)習(xí)在說話人識別、語言識別和情感識別等語音相關(guān)任務(wù)中取得了顯著的成功。而隨著語音類應(yīng)用需求量的不斷增長，對語音分類技術(shù)及系統(tǒng)也提出了更高的需求。然而，這些語音相關(guān)任務(wù)的復(fù)雜性往往超出了非專家的能力范圍。在實際應(yīng)用中，在沒有語音處理等相關(guān)專業(yè)知識儲備的情況下，則很難使深度學(xué)習(xí)系統(tǒng)獲得良好的性能。自動深度學(xué)習(xí)（AutoDL）是一種無需人工干預(yù)、針對特定范圍任務(wù)的動態(tài)學(xué)習(xí)系統(tǒng)，因具備降低深度學(xué)習(xí)系統(tǒng)門檻等特性成為行業(yè)研究的重要方向。

AutoSpeech 2020以“可自動構(gòu)建語音類深度學(xué)習(xí)系統(tǒng)”為目標(biāo)，通過舉辦AutoSpeech挑戰(zhàn)賽、論文投稿及分享等形式，推動AutoDL技術(shù)在語音領(lǐng)域的落地及快速發(fā)展。此前，第四范式已先后組織了面向圖像、語音、自然語言處理等技術(shù)領(lǐng)域的AutoDL系列賽事，如AutoSpeech、AutoCV、AutoNLP等，引起學(xué)術(shù)界和產(chǎn)業(yè)界的關(guān)注。作為第二屆AutoSpeech挑戰(zhàn)賽，比賽難度將進一步升級。

??論文征集 ??

AutoSpeech 2020將遵循INTERSPEECH 2020相同的論文提交政策，被提交的論文屬于官方正式會議論文，由AutoSpeech 2020 Special Session擇優(yōu)錄取。本次，主辦方接收以AutoSpeech為主題的論文，包括（但不限于）：

-??????Meta Learning

-??????Transfer Learning

-??????Network Architecture Search

-??????Few-shot Learning

-??????Reinforcement Learning

-??????Model Compression

-??????Data Augmentation

-??????Hyperparameter Optimization

-??????Learning to Learn

-??????Algorithm Configuration

-??????Model Selection

-??????Model Initialization

此外，語音相關(guān)的論文也可投稿，包括（但不限于）：

-??????Automatic Speech Recognition

-??????Analysis of Paralinguistics in Speech and Language

-??????Speaker Identification

-??????Language Identification

-??????Emotion Classificaton

-??????Accent Recognition

-??????Music Genre Classification

即使作者不參與比賽，也具備投稿資格。

??關(guān)于比賽??

AutoSpeech競賽旨在為語音相關(guān)任務(wù)提出自動解決方案，這一挑戰(zhàn)僅限于來自不同語音分類領(lǐng)域的多標(biāo)簽分類問題。當(dāng)只提供原始數(shù)據(jù)（語音特征）和元信息時，所提供的解決方案有望發(fā)現(xiàn)多種副語言、語音屬性信息，如說話人、語言、情感等。

主辦方為本次比賽準(zhǔn)備了15個語音分類數(shù)據(jù)集。其中包括 5個離線公共數(shù)據(jù)集（用于選手開發(fā)和訓(xùn)練自己的AutoSpeech程序）、5個線上公共數(shù)據(jù)集（用于盲測，選手無法獲得數(shù)據(jù)集任何信息）、5個私有數(shù)據(jù)集（用于盲測，選手無法獲得數(shù)據(jù)集任何信息）。

賽事挑戰(zhàn)

在第一屆AutoSpeech挑戰(zhàn)賽中，許多解決方案在自動語音分類任務(wù)的性能上取得了顯著進步，但當(dāng)數(shù)據(jù)集變大以及標(biāo)簽類別更多時，比賽仍極具挑戰(zhàn)性。此外，選手面臨的其他挑戰(zhàn)還包括：

-??????如何在口語會話中自動發(fā)現(xiàn)各種副語言信息？

- ? ? ?如何從語音數(shù)據(jù)中自動提取不同任務(wù)的有效特征？

- ? ? ?如何自動處理長時和短時語音數(shù)據(jù)？

- ? ? ?如何自動設(shè)計有效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)？

- ? ? ?如何建立和自動適應(yīng)預(yù)先訓(xùn)練的模型？

此外，選手還應(yīng)考慮：

-??????如何自動有效地選擇合適的機器學(xué)習(xí)模型和超參數(shù)？

-??????如何使解決方案更通用，即如何使其適用于未知的任務(wù)？

-??????如何保證計算和內(nèi)存成本可以接受？

賽事規(guī)則

本次挑戰(zhàn)賽分為三個階段（反饋階段、檢查階段和最終階段）。首先，選手通過5個可下載的公共數(shù)據(jù)集，離線開發(fā)AutoSpeech解決方案。然后進入反饋階段，參賽者將自己的AutoSpeech程序代碼上傳到平臺上，并通過在另外五個驗證數(shù)據(jù)集測試，得到其性能的即時反饋。反饋階段結(jié)束后，將進入檢查階段，參賽選手只允許在私有數(shù)據(jù)集上提交一次代碼，以便進行調(diào)試。此時，參賽選手將無法閱讀詳細(xì)的日志，但是他們能夠看到提交的代碼是否報告錯誤。最終階段，參賽選手的AutoSpeech程序在五個測試數(shù)據(jù)集上進行評估。最終階段的排名將決定獲勝者。

賽程時間

以下均為北京時間（UTC+8）

2020年3月4日：發(fā)布公共數(shù)據(jù)集和基線

2020年3月11日：反饋階段開始

2020年4月20日：反饋階段結(jié)束

2020年4月20日：檢查階段開始

2020年4月22日：檢查階段結(jié)果通知

2020年4月24日：重新提交的截止日期，檢查階段結(jié)束

2020年4月24日：最終階段開始

2020年4月27日：最終階段結(jié)束，并通知結(jié)果

2020年5月8日：INTERSPEECH 2020論文提交截止日期

TBA：向INTERSPEECH 2020提交最終文件

TBA：提供終稿論文

賽事獎金

第一名：2000 USD

第二名：1500 USD

第三名：500 USD

AutoML系列賽事

-??????AutoML@PAKDD 2018

-??????AutoML@NeurIPS 2018

-??????AutoML@PAKDD 2019

-??????AutoML@KDDCUP 2019

-??????AutoCV@IJCNN 2019

-??????AutoCV2@ECML PKDD 2019

-??????AutoNLP@WAIC 2019

-??????AutoSpeech@ACML 2019

-??????AutoWSL@ACML 2019

-??????AutoSeries@WSDM 2020

想要參與AutoSpeech 2020挑戰(zhàn)賽以及提交論文的朋友，可以點擊【閱讀原文】查看官網(wǎng)詳細(xì)信息。

總結(jié)

以上是生活随笔為你收集整理的INTERSPEECH 2020 AutoSpeech论文征集挑战赛正式启动的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： MySQL中 JSON 数据类型应用
下一篇： java 自定义注解+AOP实现日志记录