声纹识别_
聲紋識別和語音識別的區別
1.兩者在原理上一樣,都是通過采集語音信息進行分析和處理,提取相應的特征或建立模型,然后做出判斷
2.兩者識別的目的:語音識別通過識別說話的內容轉化為文字,而聲紋識別則是要識別說話人的身份,是一種生物識別技術
3.聲紋識別是通過語音波形反應說話人的生理和行為特征的語音參數,進而連接到聲紋庫,因此,聲紋識別不注重語音信號的語義,而是從語音信號中提取個人聲紋特征,挖掘出包含在語音信號中的個性因素。
文本相關
語音識別有文本相關和文本無關兩種。
文本相關要求用戶按照給定的內容發音,每個人的聲紋模型逐個被精確地確立,而識別也同樣按照相同的內容發音。
關鍵問題
聲紋識別分為兩個關鍵的問題:特征提取和模式匹配
1。特征提取:特征提取是提取并選擇對說話人的聲紋具有可分性強,穩定性高等特性的聲學或語音特征
聲紋識別模型可以使用的特征包括:(1)聲學特征(倒頻譜) (2)詞語特征(說話人相關的詞n-gram,音素n-gram)(3)韻律特征(利用n-gram描述的基音和能量“姿勢”);(4)語種、方言和口音信息;(5)通道信息(使用何種通道);等等。
總之,較好的特征,應該能夠有效地區分不同的說話人,但又能在同一說話人語音發生變化時保持相對的穩定;不易被他人模仿或能夠較好地解決被他人模仿問題;具有較好的抗噪性能;……。當然,這些問題也可以通過模型方法去解決。
模式識別
對于模式識別,有如下幾大類方法:
(1)模板匹配方法:利用動態時間彎折(DTW)以對準訓練和測試特征序列,主要用于固定詞組的應用(通常為文本相關任務);
(2)最近鄰方法:訓練時保留所有特征矢量,識別時對每個矢量都找到訓練矢量中最近的k個,據此進行識別,通常模型存儲和相似計算的量都很大
(3)神經網絡方法:有很多種形式,如多層感知、徑向基函數(RBF)等,可以顯式訓練以區分說話人和其背景說話人,其訓練量很大,且模型的可推廣性不好;
(4)隱式馬爾可夫模型(HMM)方法:通常使用單狀態的HMM,或高斯混合模型(GMM),是比較流行的方法,效果比較好;
(5)VQ聚類方法(如LBG):效果比較好,算法復雜度也不高,和HMM方法配合起來更可以收到更好的效果;
(6)多項式分類器方法:有較高的精度,但模型存儲和計算量都比較大;
技術原理
聲紋識別的主要任務包括:語音信號處理、聲紋特征提取、聲紋建模、聲紋比對、判別決策等
聲紋身份認證分為兩個階段:
1:聲紋注冊階段,用戶輸入注冊語音樣本,系統提取特征建模
2.聲紋認證階段,用戶再次錄入語音開展身份認證,另外,系統可以根據電話用戶語音身份認證的狀況,適當地更新或者調整用戶的聲紋模型
總結
- 上一篇: require.js用法简介
- 下一篇: Hive2.1.1的安装教程(元数据放在