模板训练算法
上一篇博客介紹的內容是DTW算法中的模式匹配過程,在此過程中,模板建立的好壞將直接影響匹配結果。
https://blog.csdn.net/fewjioqpfjeiowph/article/details/83743573
下面介紹一般DTW中的模板訓練算法。
1.偶然模板訓練法
- 當待識別詞表不太大,且系統為特定人設計時,采用一種簡單的多模板訓練方法。
- 即將每個詞的每一遍語音形成一個模板。
- 在識別時,待識別矢量序列用DTW算法分別求得與每個模板的累計失真后,判別它是屬于哪一類。
- 這種方法具有很大的偶然性,且訓練時語音可能存在錯誤,所以這種方法形成的模板的頑健性不好。
2.頑健模板訓練法
這種方法將每個詞重復說多遍,直到得到一對一致性較好的特征矢量序列。
最終得到的模板是在一致性較好的特征矢量序列對在沿DTW的路徑上求平均。
訓練過程如下:
這樣得到的模板比偶然訓練法可靠,但如果每個詞的模板由這樣的一個模板表示,往往還顯得不夠充分。
當識別問題是針對非特定人時,問題更為突出。
3.非特定人識別的模板訓練算法——聚類方法
? ? ? ?令為L個訓練序列的集合,=,其中,每個元素Xi為某特定語音的一次實現,即一次發音。對每兩次發音的特征矢量序列進行匹配計算,得到的匹配距離,則可構成一個的距離矩陣。聚類的目的是將訓練集聚成N個不同的類,使在同一類???中的語音模式比較相近。類的總數N可以事先確定,也可以在聚利時根據某種準則自動確定。每一類可以用一個典型的語音序列來代表,也可以不是的一個元素。
總結