人工智能之语音识别技术(二)
生活随笔
收集整理的這篇文章主要介紹了
人工智能之语音识别技术(二)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 語音識別技術的重要性
各種終端設備的智能化和集成化程度越來越高,傳統的信息檢索和菜單操作方式已經越來越無法滿足需求。迫切需要一種更加便捷的信息檢索和命令方式來替代傳統的按鍵操作。
語音識別技術的基本內容包括以下內容:
- 語音識別基本單元
- 語音識別流程
- 語音識別技術應用
2 語音識別基本單元
語音識別系統組成
語音識別系統本質上是一種模式識別系統,包括特征提取、模式匹配、參考模式庫等三個基本單元。
語音識別研究領域分類
在語音識別系統中,可以根據不同的方式對語音識別的研究進行分類。
3 語音識別流程
基于HMM的語音識別過程
-
在開始語音識別之前,通常需要把首尾段的靜音切除,降低對后續步驟的干擾。這個靜音切除的操作一般稱為VAD。
-
分幀,也就是把聲音切開成多個小段,每小段稱為一幀。
-
波形變換:常用的一種方法是MFCC特征,通過12維度的向量來描述一幀的波形,12維向量是根據耳朵的生理特征提取的,這一過程稱為聲學特征提取。
-
矩陣變成文本
- 把幀識別成狀態;
- 把狀態組合成音素;
- 把音素組合成單詞。
-
語音識別過程總結
4 語音識別最新進展
最新進展
- 目前,國外的應用一直以蘋果的Siri,谷歌的Google Now為代表。
- 國內國內方面,科大訊飛、云知聲,百度語音等系統都采用了最新的語音識別技術,市面上其他的相關產品也直接或間接潛入了類似的技術。
總結
以上是生活随笔為你收集整理的人工智能之语音识别技术(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三十九、ETL工具Kettle基础使用
- 下一篇: 人工智能之语音识别技术(三)