2021-07-15 声音一些基本概念
一、聲音
聲音的本質是波動。受作用得空氣發生振動,當震動頻率在20-20000Hz時,作用于人的耳鼓膜而產生的感覺稱為聲音。聲源可以是固體、也可以是流體(液體和氣體)的振動。聲音的傳媒介質有空氣。水和固體,它們分別稱為空氣聲、水聲和固體聲等。噪聲監測主要討論空氣聲。
二、聲音的發生、頻率、波長和聲速
頻率:聲源在一秒中內振動的次數,記作f。單位為Hz。
周期:聲源振動一次所經歷的時間,記作T,單位為s。T=1/f。
波長:沿聲波傳播方向,振動一個周期所傳播的距離,或在波形上相位相同的相鄰兩點間距離,記為λ,單位為m。
聲速:聲波每秒在介質中傳播的距離,記作c,單位為m/s。聲速與傳播聲音的介質和溫度有關。在空氣中,聲速(c)和溫度(t)的關系可簡寫為:c = 331.4+0.607t常溫下,聲速約為345m/s。
頻率f、波長λ和聲速c三者之間的關系是: c = λf當物體在空氣中振動,使周圍空氣發生疏、密交替變化并向外傳遞,且這種振動頻率在20-20000Hz之間,人耳可以感覺,稱為可聽聲,簡稱聲音,噪聲監測的就是這個范圍內的聲波。頻率低于20Hz的叫次聲,高于20000Hz的叫超聲,它們作用到人的聽覺器官時不引起聲音的感覺,所以不能聽到。
三、聲功率、聲強和聲壓
聲壓,聲功率和聲強描述了聲音的不同方面,均可用分貝表示,但各自的分貝值代表各自的測量值,三者之間的分貝值不能直接比較。
聲功率–從物體發出聲音的速率,與觀察聲音的位置或距離無關,是聲源本身的屬性。建筑設備到計算機打印機等產品的噪聲法規中,經常聲功率,其以W為單位。不能不能直接測得,需聲壓進行轉換測得。
聲壓–表示空間中特定位置的聲音振幅的級別,是一個標量。在自由場中,聲壓大小取決于觀測點相對于聲源的位置和距離,單位是帕斯卡(Pa)。
聲強–聲強是單位面積的聲功率。它表征聲場內某位置的聲流,聲強以W/m2為單位。
聲功率與聲強兩者有直接的關系,觀察兩者的單位(W與W/m2)可以發現以面積為變量,對聲強求積分來得到聲功率的值。
(1) 聲功率(W)
聲功率是指單位時間內,聲波通過垂直于傳播方向某指定面積的聲能量。在噪聲監測中,聲功率是指聲源總聲功率。單位為W。一個物體產生了多大的聲能量,這可以用聲功率來表示,它指聲源在單位時間內向外輻射的聲能。
聲功率w=聲強×面積
(2) 聲強(I)
是指單位時間內,聲波通過垂直于傳播方向單位面積的聲能量。聲強是矢量(有大小和方向)。聲強與聲壓的關系為:I=p2/ρc=(ρc)2u2/ρc =Pu
某點的聲強=(瞬時聲壓Pⅹ瞬時速度u)的平均值
(3)聲壓(P)
聲壓是由于聲波的存在而引起的壓力增值。聲音傳遞時,聲波傳播擾動介質,使得介質內部產生的壓強變化叫做聲壓。單位為Pa。聲波在空氣中傳播時形成壓縮和稀疏交替變化,所以壓力增值是正負交替的。但通常講的聲壓是取均方根值,叫有效聲壓,故實際上總是正值,對于球面波和平面波,
p=(ρc)u
其中p是聲壓,單位為Pa或N/m2;ρ是流體密度,對于海水ρ=103kg/m3;u是質點速度,單位為m/s;ρc是介質特征阻抗,海水介質的特征阻抗ρc=1.5*10^6kg/m2s; c為聲速,c=f×λ。f為頻率,λ為波長。水中的聲速一般取1500m/s,與水溫、鹽度、深度有關系。
補充:
1.聲壓
當聲波不存在時,空氣層處于平衡狀態,各處氣壓相等,也就是和通常所說的大氣壓是一樣的。當聲波出現時,由于聲波的作用,媒質的各部分必然產生壓縮與膨脹的周期性變化.從而使局部氣壓發生漲落變化.空氣密集處壓強增強.空氣稀薄處壓強降低,這種由聲波引起的壓強變化就叫作聲壓。一般用P表示,單位是帕(Pa).聲壓的大小反映了振動的強弱.同時也決定了聲音的大小。
人們正常講話時,離開嘴巴0.5米處的聲壓大約是0.1帕.只有大氣壓的百萬分之一左右。這時人們可以聽到聲音很響,可見人耳是相當靈敏的感覺器官。當然,聲壓很低時人耳是聽不到的.聲壓低到2×10^-5帕時差不多已是人耳所能聽到的最低限度了,低于這一聲壓人耳就無法聽到了。
在沒有任何反射的自由聲場中,球面波輻射的聲波隨著距離的增加而迅速減小.具體來說就是聲壓的大小與距離成反比。由于實際的聲場中都存在不同程度的反射.而且實際的聲源都有一定的指向性(介于球面波和平面波之間).所以實際上聲壓隨距離而衰減的速度要比上面所講的設得多,在室內尤其如此。
2.聲壓級
人耳所能聽到的聲音其聲壓范圍極其寬廣,從人耳所能聽到的最低聲壓(聽閱)到感覺耳痛的最低聲壓(痛闊)之間相差一百萬倍(106倍)。在這樣寬廣的范圍內,用聲壓的絕對大小來衡量聲音的強弱是很不方便的,要用具有一定絕對精度的儀器來度盆它也是十分困難的。而且從人耳分辨能力來著,主觀上產生的“響度感覺”并不是正比于聲壓的絕對值.而是更近于與聲壓的對數成正比。基于這兩方面的原因.我們常用聲壓的相對大小來表示聲壓的強弱,并稱之為聲壓級。
聲壓級(以分貝為單位)定義為實際聲壓P和荃準聲壓P,6的比值取常用對教再乘以20,即:聲壓級(SPL) =20 lg(P/Pm)單位:分則dB)其中P '為參考聲玉.在空氣中p -般取2x10^-5帕,這個數值就是人耳對1千赫聲音剛剛能覺察到其存在的聲壓值,也就是1千赫聲音的可聽周聲壓。一般來說低于這一聲壓值.人耳就再也覺察不出這聲音的存在。為了讓大家對聲壓級的大小有個數云概念,下面舉幾個典型的例子以供參考,見表1.1.1
3.頻率
聲音引起聽覺的作用.不僅取決于聲壓大小,而且還和它每秒鐘內振動的次教即撅率有關。頗率的單位是赫茲(Hz),簡稱赫。例如:1秒內振動100次.它的頻率就是100赫;1秒內振動11000次.它的頻率就是1,000特。不同頗率的聲音信號使人感覺到音調的差異,簡單來說頻率越高.音調也越高。
人耳可聽到的頻率范圍是20赫-20千赫。當然這只是一個大概的范圍,每個人實際上聽到的預率范圍并不相同,一般來講,育年人聽到的頻率范圍要比老年人聽到的報率范圍寬.
這是因為隨著年齡的增長.人耳對高孩聲的聽力會逐漸降低。比如50歲左右的人,最高可聽到的碩串約為13千赫;而60歲以上的人,很少能聽到8千赫以上的聲音。
頻率低于20赫的聲波稱為次聲波;頻率高于20千赫的聲波稱為超聲波。次聲和超聲對人耳來說都是聽不見的.因而,次聲和超聲即使振幅再大.其響度也是為零。
聲音可以是單族率的純音,但是絕大多數聲音都是由多個頻率成分組合而成的復音。日常生活中遇到的語言、音樂或噪聲大多是復音。其實,任何復雜的聲音.都可以看作是由幾個或許多個頻串和振幅都不相同的簡諧波的疊加.即復音可以分解為許多個純音之和。
如果組合起來的許多純音都集中在高頻部分,就稱為高頻聲;集中在低頻部分.就稱為低頻聲。當然,所謂高頻聲和低預聲都相對而言的,一般習慣上把預率低于60赫的聲音稱為超低音.把60-200赫的稱為低音.把200-1千赫的稱為中音,把1-5千赫的稱為中高音,而5千赫以上的則統稱為高音。
聲音的大小與頻率無關,它與波幅有關,也就是說聲波蘊含的能量越多聲音就越大。
四、 分貝
人們日常生活中遇到的聲音,若以聲壓值表示,由于變化范圍非常大,可以達六個數量級以上,同時由于人體聽覺對聲信號強弱刺激反應不是線形的,而是成對數比例關系。所以采用分貝來表達聲學量值。所謂分貝是指兩個相同的物理量(例A1和A0)之比取以10為底的對數并乘以10(或20)。N = 10lg(A1/A0) 分貝符號為"dB",它是無量綱的。式中A0是基準量(或參考量),A是被量度量。被量度量和基準量之比取對數,這對數值稱為被量度量的"級"。亦即用對數標度時,所得到的是比值,它代表被量度量比基準量高出多少"級"。
五、聲功率級
Lw =10lg(W/W0)
式中:Lw—聲功率級(dB);W— 聲功率(W);W0—基準聲功率,為10-12 W。
(三) 聲強級
LI = 10lg(I/I0)式中:LI —聲壓級(dB);I —聲強(W/m2);I0 —基準聲強,為10-12 W/m2。
六、 聲壓級(振幅)
人耳對聲音強弱的變化的感受并不與聲壓成正比,而與聲壓的對數成正比。
LP = 20lg(P/P0)
式中: LP—聲壓級(dB);P —聲壓(Pa);P0—基準聲壓,為2×10-5Pa,該值是對1000HZ聲音人耳剛能聽到的最低聲壓。所以聲壓每增加一倍,聲壓級增大 (20Log2) 6dB,根據這個可以算出人耳朵可接受的最大聲壓級。由于人耳可承受的最大聲壓約為20Pa,而通常在空氣中的參考聲壓是2×10-5Pa,也就是人耳的可承受的最大聲壓級約為120dB (20Log20/2×10-5),這也就是我們常常所說的痛閾,但這痛閾值并不是適用于所有的人,有的人由于工作環境或者天生耳部構造等原因可以達到130甚至140dB。
七、響度(N)
響度是人耳判別聲音由輕到響的強度等級概念,它不僅取決于聲音的強度(如聲壓級),還與它的頻率及波形有關。響度的單位為"宋",1宋的定義為聲壓級為40dB,頻率為1000Hz,且來自聽者正前方的平面波形的強度。如果另一個聲音聽起來比1宋的聲音大n倍,即該聲音的響度為n宋。
八、采樣率、位深度、采樣位數、聲道數
采樣、量化、編碼詳看https://blog.csdn.net/Robin_Pi/article/details/109235946
(1)采樣率
音頻采樣,是把聲音從模擬信號轉換為數字信號。采樣率,就是每秒對聲音進行采集的次數,同樣也是所得的數字信號的每秒樣本數。
采樣越高,聲音的還原就越真實越自然,人對頻率的識別范圍是 20HZ - 20000HZ, 如果每秒鐘能對聲音做 20000 個采樣, 回放時就足可以滿足人耳的需求.
采樣率(sampleRate), 采樣率就是每秒從連續信號中提取并組成離散信號的采樣個數,它用赫茲(Hz)來表示,說的簡單一點就是每秒在每個聲道上采樣的個數。采樣就是把模擬信號數字化的過程,不僅僅是音頻需要采樣,所有的模擬信號都需要通過采樣轉換為可以用0101來表示的數字信號,示意圖如下所示:
藍色代表模擬音頻信號,紅色的點代表采樣得到的量化數值。采樣頻率越高,紅色的間隔就越密集,記錄這一段音頻信號所用的數據量就越大,同時音頻質量也就越高。
(2) 位深度
位深度,也叫位寬,量化精度,上圖中,每一個紅色的采樣點,都需要用一個數值來表示大小,這個數值的數據類型大小可以是:4bit、8bit、16bit、32bit等等,位數越多,表示得就越精細,聲音質量自然就越好,當然,數據量也會成倍增大。常見的位寬有:8bit 或者 16bit。
(3)采樣位數
音頻在經過采樣得到樣本后,還需要對該樣本執行兩個步驟:
量化。音頻量化的量化位數常用的有:
8bit (也就是1字節) 只能記錄 256 個數, 也就是只能將振幅劃分成 256 個等級;
16bit (也就是2字節) 可以細到 65536 個數, 這已是 CD 標準了;
32bit (也就是4字節) 能把振幅細分到 4294967296 個等級, 實在是沒必要了.
量化位數又叫做采樣位數、位深度、分辨率, 它是指聲音的連續強度被數字表示后可以分為多少級。N-bit的意思聲音的強度被均分為2^N級。16-bit的話,就是65535級。這是一個很大的數了,人可能也分辨不出六萬五千五百三十五分之一的音強差別。也可以說是聲卡的分辨率,它的數值越大,分辨率也就越高,所發出聲音的能力越強。這里的采樣倍數主要針對的是信號的強度特性,采樣率針對的是信號的時間(頻率)特性這是兩個不一樣的概念。
二進制編碼。也就是把量化所得的結果,即單個聲道的樣本,以二進制的碼字進行存放。其中有兩種存放方式:
直接以整形來存放量化結果,即Two’s complement code;
以浮點類型來存放量化結果,即Floating point encoding code。
大多數格式的PCM樣本數據使用整形來存放,而在對一些對精度要求高的應用方面,則使用浮點型來表示PCM 樣本數據。
(4)聲道數
由于音頻的采集和播放是可以疊加的,因此,可以同時從多個音頻源采集聲音,并分別輸出到不同的揚聲器,故聲道數一般表示聲音錄制時的音源數量或回放時相應的揚聲器數量。單聲道(Mono)和雙聲道(Stereo)比較常見,顧名思義,前者的聲道數為1,后者為2。
一幀應該是指持續采樣時間,這個是很靈活的可以使用20ms,也可是200ms,一般來說時間越短延時就越少。
音頻在量化得到二進制的碼字后,需要進行變換,而變換(MDCT)是以塊為單位(block)進行的,一個塊由多個(120或128)樣本組成。而一幀內會包含一個或者多個塊。幀的常見大小有960、1024、2048、4096等。一幀記錄了一個聲音單元,它的長度是樣本長度和聲道數的乘積。FFmpeg中 AVFrame 結構體中的 nb_samples 代表的就是一幀中單個聲道的音頻樣本數量。
總結
以上是生活随笔為你收集整理的2021-07-15 声音一些基本概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 无需安卓手游模拟器,电脑玩绝地求生:全军
- 下一篇: Objective-C学习篇03—继承