當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2021年10月语音合成和语音识别论文月报

發布時間：2024/1/8 编程问答 32 豆豆

生活随笔收集整理的這篇文章主要介紹了 2021年10月语音合成和语音识别论文月报小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文統計每月更新一次，主要跟蹤語音合成和語音識別的發展狀況(很多文章都是在會議后才發出，但不影響統計。統計過程難免存在疏漏，因此統計結果僅供參考。所有文章語音合成領域統計列表請訪問http://yqli.tech/page/tts_paper.html，語音識別領域論文統計請訪問http://yqli.tech/page/asr_paper.html。如何查找語音資料請參考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。讀者有什么建議可以直接給我發消息，我將不斷修改該統計。如有轉載，請注明出處。歡迎關注微信公眾號：低調奮進。

本月添加了語音識別論文的統計，目前對識別方向的分類還在不斷調整，讀者有什么建議可以給我發送修改意見。

一?語音合成篇

首先，看一下語音合成每月的文章數量。語音合成在10月的論文數量大幅增加，有64篇。這可能由于下半年高校開學和各種會議舉辦的結果。

接下來，看一下每個方向的具體情況。表一給出具體分類說明，本次添加了S2S這種分類，是因為我感覺這個方向的研究越來越多，而且非常實用。由表二以及折線圖和柱狀圖可知，語音合成前端的工作依然很清淡，合成領域的主要的研究方向還是聲學模型的優化、風格情感、聲碼器和聲音轉換。另外，本月的多語言模型有5篇文章。最后，歌唱方面的研究的確增加很多，要不是受限于訓練數據，該方向的文章將會更多。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?表一? 語音合成分類說明

分類	說明
前端	多音字，韻律，g2p等等。
聲學模型	語言特征轉聲學特征，attention工作，多說話人以及雙重學習
聲碼器	波形生成
個性化	少數據，臟數據應用等自適應
多語言	多語言模型
歌唱合成	歌唱和音樂合成
情感	風格和情感
多模態	talking head等等
聲音轉換	基于GAN方案和特征解耦方案
S2S	?speech-to-speech
其它	基于EEG合成，數據，MOS評測以及語音合成的應用

表二語音合成文章情況表（單位：篇）

接下來是相關的柱狀圖和折線圖

語音合成的文章列表請訪問http://yqli.tech/page/tts_paper.html

10月份的文章

二?語音識別篇

本月增加了語音識別的文章統計，其具體的分類有待調整，接下來我將對齊不斷修改，具體分類參照?表三說明。表四為每個方向的具體文章數據量和本月的文章總量，其中10月份ASR相關的文章有?69篇。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??表三? 語音識別分類說明

分類	說明
general	包括傳統、混合語音識別，以及對asr的優化
ctc	ctc優化
rnn-t	rnn-t的優化
aed	aed優化
dataset	開源數據庫
data aug	數據增廣
lm	語言模型研究
multilingual	多語音系統以及code-switch
personal	少數據量以及個性化ASR
rescoring	多種模型聯合打分
unsupervised	無監督或者自監督學習
accent?,dialect	口音和方言
other	其它方向研究，包括系統評價標準等等

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?表四? 語音識別文章數量統計?（單位：篇）

語音識別的文章列表請訪問http://yqli.tech/page/asr_paper.html

10月份語音識別具體文章

總結

以上是生活随笔為你收集整理的2021年10月语音合成和语音识别论文月报的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【排序算法】冒泡排序|选择排序|插入排序
下一篇：出售，2012年世界末日诺亚舟船票，绝密