语音信号之特性分析图(二)
語音信號的特性主要是指它的聲學特性、語音信號的時域波形和頻譜特性以及語音信號的統(tǒng)計特性等。這些特性對應著各種語音信號有特性分析圖,如時域圖、頻譜圖和聲譜圖,之前一直分不太清,最近查了一些資料學習了各個圖及各中圖含義,本次只介紹認識這幾種圖。
???????一 時域圖
??????時域圖中,語音信號直接用它的時間波形表示出來,通過觀察世間波形可以看出語音信號一些重要特性,下圖是用coolEdit打開的“changge”的時域圖,表示這段語音波形時量化精度是16bit,從圖中可以得到各個音的起始位置,通過波形振幅和周期性可以觀察不同性質的音素的差別。
??????????????????????????????????????????????????????????????????(唱歌)???????????????????
???????如果想比較仔細的看,可以在coolEdit或者GlodWave里打開。
????????????????????????????????????????????????????????????
????????該圖是《語音信號處理》書中給出的例子,是“sou ke”的時域圖,圖中標明了時間及各個音節(jié)的起始位置。由于在時域波形中各個音節(jié)間不好明顯的分界,因此,圖中標出的某個音的起點只是粗略的,圖中,清輔音[s][k]和元音[ou][e]這兩類音的時間波形有很大區(qū)別,例如從A點開始的音節(jié)[s],以及從C點開始的[k]都是清輔音,他們的波形類似白噪音,振幅很小,沒明顯周期,而從B點開始的元音[ou]以及從D點開始的[e]都具有明顯的周期性,且振幅較大,它們的周期對應的就是聲帶振動的頻率。
???????語音信號屬于短時平穩(wěn)信號,一般認為在10~30ms內語音信號特性基本上是不變的,或是緩慢的,于是可截取一小段進行頻譜分析。
???????二 頻譜圖
???????簡單地說,任何信號(當然要滿足一定的數(shù)學條件,但是說多了又不好懂了,所以先不提),都可以通過傅立葉變換而分解成一個直流分量(也就是一個常數(shù))和若干個(一般是無窮多個)正弦信號的和。每個正弦分量都有自己的頻率和幅值,這樣,以頻率值作橫軸,以幅值作縱軸,把上述若干個正弦信號的幅值畫在其所對應的頻率上,就做出了信號的幅頻分布圖,也就是所謂頻譜圖,另外還有相頻分布,但其意義不大。
???????通過matlab的傅里葉變換可以得到一個3維圖,是頻率、振幅和相位的關系,如上圖“唱歌”對應的頻譜圖如下:
? ? ?
?????????????????????
???????上圖頻率和相位關系圖觀察不出什么特性,但頻率和振幅可以觀察到一些特點,使用《語音信號處理》里的圖可以更明顯觀察一些特性。
????????????????????????????
???????第一幅為清輔音[k]的頻譜圖,第二幅為[ou]的頻譜圖,其中凸點出現(xiàn)頻率就是共振峰的頻率(共振峰是指在聲音的頻譜中能量相對集中的一些區(qū)域,共振峰不但是音質的決定因素,而且反映了聲道(共振腔)的物理特征),如料[k]沒有明顯的周期,[ou]可以看出周期穩(wěn)定。
??????三?語譜圖
???????語音的時域分析和頻域分析就是語音分析的兩種重要方法,但這兩種單獨分析的方法有局限性,時域分析對語音信號的頻率沒有直觀了解,而頻域分析出的特征中又沒有語音信號隨時間變化的關系。語音信號是時變信號,?所以頻譜也是隨時間變化的,由于語音信號隨時間變化是緩慢的,因而在一段時間內(如10~30ms,即所謂一幀內)可以認為頻譜是不變的,這種頻譜是短時譜,短時譜只反映語音信號靜態(tài)頻譜特性,所以研究語譜圖,即把和時間相關的傅立葉分析的顯示圖成為語譜圖,是一種三維頻譜,表示語音頻譜隨時間變化的圖形,縱軸是頻率,橫軸是時間,任意給定頻率成分在給定時刻的強弱用相應點的灰度圖或色調的濃淡表示,顏色深,表示該點的語音能量越強。
???????語譜圖上因其不同的黑白程度形成了不同的紋路,稱之為“聲紋”,它因人而異,即不同講話者語譜圖聲紋是不同的,因而可以用聲紋鑒定不同的講話人。語譜圖中的花紋有橫杠、亂紋和豎直條等,橫杠是和時間軸平行的幾條深黑色帶紋,它們相應于短時譜中的幾個凸出點,即共振峰,有沒有橫杠出現(xiàn)是判斷它是否是濁音的重要標志。
???????????????????????????????????????????????????????
???????上圖為在Pratt中查看的“唱歌”的語譜圖。
???????對語譜圖的詳細解釋也可以參見博客:http://blog.csdn.net/zouxy09/article/details/9156785,寫的很好。
————————————————
版權聲明:本文為CSDN博主「冬瓜子」的原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權協(xié)議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/yongchunaq/article/details/36227961
總結
以上是生活随笔為你收集整理的语音信号之特性分析图(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 男高音,女高音,男中音,女中音,男低音,
- 下一篇: Java与C#比较,哪个语言更是适合你?