语音识别工具箱综述和产品介绍
? ? 今天是周末,想來想去,還是寫一篇這樣的博文吧。算是對語音識別這一段時間的總結,為后來的人融入鋪好前面的路。這個只是工具箱的綜述,不是語音識別的綜述。希望您有所收獲。
??? 目前,語音識別領域公開的開源的代碼或者說工具箱有:sphinx,htk,julius,kaldi。也許也有其他的吧。下面我盡量一一介紹:
1.sphinx:這個是李開復的博士論文。后面不斷的壯大,有了后來的版本。這個比較小,實現起來也比較簡單點吧。
???? 網址:http://cmusphinx.sourceforge.net/
???? 網上有很多sphinx的資料:
???????? 1)最著名的當屬Sphinx武林秘籍這個系列。作者很詳細的說明了一切,值得你去參考和實驗。
?????????2)zouxy09博文的這個系列也很清楚的說了sphinx。
?? 如果你想實驗,基本這些資料就很全了。你可以很好的做些實驗了。最近也看到調用sphinx的接口放到安卓等一些平臺上,所以在我看來這個開源雖然有點老,但是我覺得還是很不錯的。還是有很多東西需要人去挖掘的。
2.htk :這個雖然說是隱馬爾科夫(HMM)工具箱,但是基本是為語音識別專用。與sphinx相比,htk的知名度一直很高,一直長久不衰。很多語音識別的論文的實驗都是基于這個實現的。在深度學習之前,基本很多的語音識別實驗都是他壟斷的。
???? 網址:http://htk.eng.cam.ac.uk/
???? htk的資料還是很多的,htkbook是最好的資料,雖然是英文,而且很多頁。但中國人還是有才的,有人翻譯了前三章,大家可以去讀讀。很經典的書吧,讀完你基本會對語音識別過程有個簡單的認識吧。當然,想入門就得做實驗。前面的幾個博文基本介紹了。先貼我的博文吧:
??? 1.語音識別系統之htk------孤立詞識別(yesno)
??? 2.語音識別系統之htk-----連續語音識別
??? 其他的資料我在上面的博文里都提到了。htk博大精深,我們后續還會繼續添加資料的。
3.julius:這個是日本人弄的一個語音識別系統。我自己不是很熟悉。
???? 網址:http://julius.sourceforge.jp/en_index.php?q=en/index.html
???? 這個網址有很多資料,比如下載和book等等。有人寫了一篇論文:基于Julius的機器人語音識別系統構建。其他的資料還是比較少。如果有時間我也愿意去把這個補全。
4.kaldi :這個我一直比較有興趣吧。因為有深度學習的內容。最近,深度學習在語音識別上的運行已經很好了,把語音識別提高到了一個很高的標準了。
??? 網址:http://kaldi.sourceforge.net/
??? 中文的資料可以參加我的博文:
??????? 1.語音識別工具箱之kaldi介紹?,比如一些實例,你也可以去看看我的博文了。具體的不貼鏈接了。
????????2.povey寫的四篇文章。在kaldi代碼里有個doc里面有。大家自己去查看下吧。這個工具箱的中文資料實在太少,我也就根據自己的實驗寫出了些東西。希望你們可以有所收獲吧。還有自己可以去看povey的個人主頁,里面有資料哦。http://www.danielpovey.com/index.html這個是主頁網址。
????????許多使用kaldi的原因大多由于kaldi支持深度學習的dnn模型。希望kaldi能夠壯大吧,如果你有數據庫,在kaldi上實驗是件簡單的事情。因為腳本都寫好了。
至此,工具箱就介紹完畢。
???????下面我們就介紹些目前的市場產品說說吧。
?????? 國內產品有:訊飛語點,百度助手等。
???????國外產品有:谷歌的google now ,蘋果的siri,微軟的Speech SDK 和操作系統里的語音識別。
???? 我用過的訊飛語點,原來的不是很準,但越用越準確。感覺和推薦系統差不多吧。百度助手的確不是還好,不知道現在改進沒?百度的深度學習研究院還是很好的,有余凱老師在,希望可以很好的推出自己的產品。如果明年招了我,那就好了。呵呵……希望余凱老師可以把語音產品做的更好吧……訊飛就不用說了,國內語音的領導者,關鍵在我大安徽,呵呵……其他的語音公司有云知聲,騰訊微信的語音識別,等等其他的。科研機構有中國科技大學,清華大學,中科院的自動化研究所等等都很不錯的。唯獨我們學校似乎沒什么進展。
???? 國外的科技公司在語音上面都很猛的,暑假上過微軟鄧力老師的深度學習的課。微軟的語音識別還是很不錯的。谷歌的和蘋果的就不用說了。我希望中文的比他們好就可以了。呵呵……
???? 大家可以多去用用這些產品吧。多幫這些去改進自己的識別系統。
?
?
???? 感覺寫的有點多了,以上也就是我的一些認識吧。希望對你有用,歡迎和我交流和討論。爭取早日自己可以寫一個語音識別的綜述。加油……
總結
以上是生活随笔為你收集整理的语音识别工具箱综述和产品介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 魔戒显示网络错误 或者服务器停机,指环王
- 下一篇: 初学Intersystem:使用DBea