语音识别中的鸡尾酒会问题
生活随笔
收集整理的這篇文章主要介紹了
语音识别中的鸡尾酒会问题
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
概念
“ 雞尾酒會問題”(cocktail party problem)是在計算機語音識別領域的一個問題。當前語音識別技術已經可以以較高精度識別一個人所講的話,但是當說話的人數為兩人或者多人時,語音識別率就會極大的降低,這一難題被稱為雞尾酒會問題。
解決方案 ?
斯坦福大學的Andrew NG教授的機器學習公開課(http://v.163.com/special/opencourse/machinelearning.html)(ml-class.org)在第一章unsupervised learning那段視頻里解決雞尾酒會問題(cocktail party problem)就寫了一行代碼:[W,s,v] = svd ((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
用fastICA算法可以比較好地解決http://research.ics.tkk.fi/ica/fastica/。
http://www.endolith.com/wordpress/2009/11/22/a-simple-fastica-example/ 是一個分離音樂的例子,效果比較明顯。用的就是fastICA的python實現。不過好像用來解決cocktail party problem的話效果不太好。
Blind Source Separation of recorded speech and music signals:http://cnl.salk.edu/~tewon/Blind/blind_audio.html
總結
以上是生活随笔為你收集整理的语音识别中的鸡尾酒会问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: qt geomery的单位是什么_生命吗
- 下一篇: SR综述论文总结