语音特征提取: MFCC的理解
生活随笔
收集整理的這篇文章主要介紹了
语音特征提取: MFCC的理解
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
文章目錄
- 1. 一般wav提取特征的方式:
- 2. 什么是MFCC:
- 3. 什么求倒譜:
- 4. 什么是頻譜的包絡(luò):
- 5.如何獲取頻譜的包絡(luò):
1. 一般wav提取特征的方式:
2. 什么是MFCC:
在mel-spectrum上取對(duì)數(shù),再做傅里葉變換得到的特征,就是MFCCs。
這個(gè)過程可以概括為對(duì)mel-spectrum求倒譜。
3. 什么求倒譜:
求倒譜 就是對(duì)頻譜取對(duì)數(shù),再做傅里葉變換,又回去了。
實(shí)際上是為了獲取頻譜的包絡(luò),包絡(luò)這個(gè)東西是非常用途很廣。
4. 什么是頻譜的包絡(luò):
就是頻譜里面主要頻率成分的連線的平滑曲線,就是一段聲音里面頻率振幅高的那些頻率的連線。
包絡(luò)就是頻率主要成分振幅的變化。
5.如何獲取頻譜的包絡(luò):
包絡(luò)就是頻率主要成分振幅的變化。可以通過幅度解調(diào)的方法。就是這個(gè)變化是低頻的。
對(duì)頻譜做傅里葉變化,過濾低頻的成分,就是包絡(luò)的信息。
總結(jié)
以上是生活随笔為你收集整理的语音特征提取: MFCC的理解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: spring和mybatis整合:使用x
- 下一篇: Win10 ancona傻瓜安装tens