数字语音信号处理学习笔记——语音信号的短时时域分析(2)
版權聲明:本文為博主原創文章,未經博主允許不得轉載。?? ?https://blog.csdn.net/u013538664/article/details/26068797
3.3 短時平均能量
??????由于語音信號的能量隨時間而變化,清音和濁音之間的能量差別相當顯著。因此,對短時能量和短時平均幅度進行分析,可以描述語音的這種特征變化情況。
??????定義n時刻某語音信號的短時平均能量為:
??????
??????式中,N為窗長,可見短時能量為一幀樣點值的加權平方和。特殊地,當窗函數為矩形窗時,有
??????
??????也可以從另外一個角度來解釋。令:
??????
??????平均能量還可以表示為:
??????
??????上式可以理解為:首先語音信號各個樣點值平方,然后通過一個沖激相應為h(n)的濾波器,輸出為由短時能量構成的時間序列:
??????
??????沖激響應的選擇或者說窗函數的選擇直接影響著短時能量的計算。通常N的選擇與語音的基音周期相聯系,一般要求窗長為幾個基音周期的數量級。由于語音基音頻率范圍為50~500Hz,因此折中選擇幀長為10~20ms。
??????短時平均能量的主要用途如下:
??????1.可以作為區分清音和濁音的特征參數。實驗結果表明濁音的能量明顯高于清音。通過設置一個能量門限值,可以大致判定濁音變為清音或者清音變為濁音的時刻,同時可以大致劃分濁音區間和清音區間
??????2.在信噪比比較高的情況下,短時能量還可以作為區分有聲和無聲的依據
??????3.可以作為輔助的特征參數用于語音識別中
3.4 短時平均幅度函數
??????短時能量的一個主要問題是對信號電平值過于敏感。由于需要計算信號樣值的平方和,在定點實現時很容易產生溢出。為了克服這個缺點,可以定義一個短時平均幅度函數來衡量語音幅度的變化:
??????
??????上式可以理解為w(n)對|x(n)|的線性濾波運算,實現框圖如下。與短時能量比較,短時平均幅度相當于用絕對值之后代替了平方和,簡化了運算。
??????
3.5 短時平均過零率
??????短時平均過零率是語音信號時域分析中的一種特征參數。它是指每幀內信號通過零值的次數。對有時間橫軸的連續語音信號,可以觀察到語音的時域波形通過橫軸的情況。在離散時間語音信號情況下,如果相鄰的采樣具有不同的代數符號就稱為發生了過零,因此可以計算過零的次數。單位時間內過零的次數就稱為過零率。一段長時間內的過零率稱為平均過零率。如果是正弦信號,其平均過零率就是信號頻率的兩倍除以采樣頻率,而采樣頻率是固定的。因此過零率在一定程度上可以反映信號的頻率信息。短時平均過零率的定義為:
??????
???????其中,sgn[ ]為符號函數,即
???????
????????短時平均過零率的運算圖:
????????
????????短時平均過零率可以用于語音信號請濁音的判斷。如果過零率高,語音信號就是清音,如果過零率低,語音信號就是濁音。但有的音,位于濁音和清音的重疊區域,這時,只根據短時平均過零率就不可能來明確地判別清、濁音。
???????
---------------------?
作者:JameJuZhang?
來源:CSDN?
原文:https://blog.csdn.net/jojozhangju/article/details/26068797?
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!
總結
以上是生活随笔為你收集整理的数字语音信号处理学习笔记——语音信号的短时时域分析(2)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php开发工具 debug,php开发性
- 下一篇: 数字语音信号处理学习笔记——语音信号的短