语音信号处理疑惑与解答
語音信號處理疑惑與解答
- 什么是梅爾倒譜
- 聲道形狀如何描述
- 頻譜是什么
- 什么是聲譜圖
- 什么共振峰
- 倒譜的求解過程
- mel頻率是什么
- 如何求解梅爾倒譜系數
- 1. 什么是語音識別
- 2. 什么是信道
- 3. 什么是加性噪聲
- 4. 什么是乘性噪聲
- 5. 什么是信道畸變
什么是梅爾倒譜
- 基于聲音頻率的非線性梅爾刻度的對數能量譜的線性變換
聲道形狀如何描述
聲道的形狀在語音短時功率譜的包絡顯示出來,MFCC就是描述該包絡形狀的一種特征。
頻譜是什么
頻譜表示頻率與能量的關系。頻譜分為三種:線性振幅譜,對數振幅譜,自功率譜
幅度譜表示時間與能量的關系
什么是聲譜圖
連續的一幀幀的頻譜構成聲譜圖
什么共振峰
共振峰指聲音的頻譜中能量相對集中的一些區域,共振峰不但是音質的決定因素,而且反應了聲道(共振腔)的物理特征
倒譜的求解過程
信號->頻譜(DFT)->頻譜絕對值化(幅度取模)->對數譜(去ln)-> 倒譜(IDFT)
mel頻率是什么
基于人的聽覺感知系統,人耳對對頻率具有選擇性,人耳對低頻比較敏感,對高頻相對不敏感從而抑制。因此人耳的對頻率的感知是非線性的,然而在mel域,人耳對頻率的感知能力是線性的,從而有利于有利于分析信號。
mel(f)=2595log10(1+f700)mel(f)=2595log_{10}(1+\frac{f}{700})mel(f)=2595log10?(1+700f?)
如何求解梅爾倒譜系數
信號->頻譜(DFT)->頻譜絕對值化(幅度取模)->mel譜(mel濾波器組)->對數譜(去ln)-> 倒譜(IDFT)
1. 什么是語音識別
語音識別是將語音信號轉變為文字的過程。
2. 什么是信道
信道就是語音傳輸的外界環境,傳輸信息的通道。如A對B說話,A說出口的聲波到達B耳朵里的這段路程,就是信道。
3. 什么是加性噪聲
加性噪聲是相對于乘性噪聲來說,我們知道,聲音經過信道由一個地方傳輸到另外一個地方,可以把信號看成一個系統,根據《信號與系統》知,y(t)=x(t)?h(t)+v(t)y(t)=x(t)*h(t)+v(t)y(t)=x(t)?h(t)+v(t),其中t為時間,y(t)為經過信道傳輸后接受到的信號,x(t)為原始語音信號,h(t)的信道的系統函數,而信道中不是干凈的,總含有一些雜波,這些雜波為v(t),則v(t)的加性噪聲。由上可知,加性噪聲是一直存在的,不受h(t)的制約。而如果信道隨時間發生改變,則會出現乘性噪聲,即乘性噪聲一般描述系統的時變性。
如果信道h(t)發生了改變,則稱為信道畸變,如兩個大小不同的房間,則其信道是不一樣的。
4. 什么是乘性噪聲
見問題3
5. 什么是信道畸變
見問題3
- 共振峰
Fn=(2n?1)c4L,n=1,2,3,4...F_n = \frac{(2n-1)c}{4L},\quad n=1,2,3,4...Fn?=4L(2n?1)c?,n=1,2,3,4...
總結
以上是生活随笔為你收集整理的语音信号处理疑惑与解答的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Windows系统提示应用程序无法正常启
- 下一篇: python应用程序无法正常启动0xc0