为什么需要超过48k的采样音频?
最近在看音頻的事情,隨便拿點(diǎn)東西出來(lái)聊一下,如果說(shuō)的不對(duì),請(qǐng)用棒槌來(lái)打我,這樣我晚上睡覺就不用數(shù)綿羊了。
我播放一個(gè)20HZ~20KHZ的音頻,如下圖
我使用16K的采樣率來(lái)采集它是聲音信號(hào),獲取音頻如下圖
我使用48K的采樣率來(lái)采集它是聲音信號(hào),獲取如下圖
總結(jié)上面是現(xiàn)象
1、使用16K進(jìn)行采樣獲取的音頻,最大只能還原 8K的音頻信號(hào),后面也有聲音,但是已經(jīng)不是準(zhǔn)確的聲音了。
2、使用48K進(jìn)行采樣,可以獲取到20HZ~20KHZ的完整音頻信號(hào)。
奈奎斯特采樣定理
奈奎斯特采樣定理解釋了采樣率和所測(cè)信號(hào)頻率之間的關(guān)系。闡述了采樣率fs必須大于被測(cè)信號(hào)感興趣最高頻率分量的兩倍。該頻率通常被稱為奈奎斯特頻率fN。
為什么采樣的頻率要大于兩倍的被測(cè)試信號(hào)頻率呢?
為更好理解其原因,讓我們來(lái)看看不同速率測(cè)量的正弦波。
情況A,頻率f的正弦波以同一頻率采樣。這些采樣標(biāo)記在原始信號(hào)的左側(cè),在右側(cè)構(gòu)建時(shí),信號(hào)錯(cuò)誤地顯示為恒定直流電壓。
情況B,采樣率是信號(hào)頻率的兩倍。現(xiàn)在信號(hào)顯示為三角波。這種情況下,f等于奈奎斯特頻率,這也是特定采樣頻率下為了避免混疊而允許的最高頻率分量。
情況C,采樣率是4f/3。
我們會(huì)驚訝的發(fā)現(xiàn)一個(gè)問(wèn)題,如果采樣率越大,那么想還原信號(hào)的真實(shí)性就越容易。我們簡(jiǎn)直就是天才啊~~
混疊
當(dāng)采樣頻率設(shè)置不合理時(shí),即采樣頻率低于2倍的信號(hào)頻率時(shí),會(huì)導(dǎo)致原本的高頻信號(hào)被采樣成低頻信號(hào)。如下圖所示,灰色信號(hào)是原始的高頻信號(hào),但是由于采樣頻率不滿足采樣定理的要求,導(dǎo)致實(shí)際采樣點(diǎn)如圖中黑色實(shí)心點(diǎn)所示,將這些實(shí)際采樣黑色點(diǎn)連成曲線,可以明顯地看出這是一個(gè)低頻信號(hào)。在圖示的時(shí)間長(zhǎng)度內(nèi),原始灰色信號(hào)有10個(gè)周期,但采樣后的藍(lán)色信號(hào)只有2個(gè)周期。也就是采樣后的信號(hào)頻率成分為原始信號(hào)頻率成分的1/5,這就是所謂的混疊:高頻混疊成低頻了。
通過(guò)我強(qiáng)大的分析發(fā)現(xiàn),要消除混疊,就需要提高采樣率,這也是奈奎斯特采樣定理出現(xiàn)的原因了。
網(wǎng)上很多觀點(diǎn)說(shuō),根據(jù)采樣定理,48K的音頻采樣率即可無(wú)損的表示音頻模擬信號(hào)(人耳最多可以聽到20K的音頻),為何還需要96K, 192K等更高的采樣率呢?最先我也有這樣的疑問(wèn),畢竟采樣定理是經(jīng)過(guò)數(shù)學(xué)家證明過(guò)的,48K的采樣率確實(shí)可以無(wú)損的表示20K的音頻信號(hào),注意是無(wú)損,而不是近似!
近日重讀《數(shù)字音頻技術(shù)》這本書,豁然開朗了。大家說(shuō)的沒錯(cuò),采樣定理是數(shù)學(xué)上證明過(guò)了的。但是具體到物理的、各種電子設(shè)備來(lái)實(shí)現(xiàn)這個(gè)錄音過(guò)程時(shí),器件本身的各種局限性,決定了48K不能達(dá)到理論的音質(zhì)。
例如,根據(jù)采樣定理,如果用48K的采樣率,那么音頻信號(hào)就不能超過(guò)20K(理論是24K,但為了契合人耳的20K上限,后面統(tǒng)一說(shuō)20K)。而麥克風(fēng)或者各種拾音器收集到的模擬信號(hào)卻包含了很多超出20K的信號(hào)。麥克風(fēng)不是人耳,人耳只能聽到最高20K的聲音,但是,麥克風(fēng)的震膜卻可以采集到超出20K很多的高頻信號(hào)。這些超出20K的高頻信號(hào)必須被過(guò)濾掉,否則經(jīng)過(guò)48K的采樣率進(jìn)行采樣時(shí),會(huì)產(chǎn)生“混疊效應(yīng)”,因?yàn)楦鶕?jù)采樣定理,48K的采樣率最高只能處理20K的信號(hào)。
混疊效應(yīng),打個(gè)比方,當(dāng)你看高速旋轉(zhuǎn)的風(fēng)扇、或者車輪時(shí),你會(huì)有一種錯(cuò)覺:他們好像在倒著轉(zhuǎn),這就是混疊效應(yīng)。在音頻系統(tǒng)中,它們會(huì)造成非常嚴(yán)重的失真,因?yàn)樾盘?hào)采集錯(cuò)了!
因此,電子系統(tǒng)中,必須使用一種濾波器,把麥克風(fēng)采集到的原始信號(hào)中20K以上的高頻信號(hào)完美的過(guò)濾掉,只有這樣才能保證符合采樣定理。但是這樣完美的濾波器只存在數(shù)學(xué)公式中,現(xiàn)實(shí)中要制造這樣的濾波器太難了,基本做不到。現(xiàn)實(shí)中的濾波器,一方面對(duì)于20K以內(nèi)的信號(hào),并不是完整不變的PASS過(guò)去的,而是一條近似水平的波浪線,不同頻率點(diǎn)的信號(hào)會(huì)有不同程度的衰減;另一方面,20K以外的音頻信號(hào),并不是說(shuō)立馬就給全部過(guò)濾了,它存在一個(gè)漸變區(qū)域,可能21K, 22K, 23K ... 逐漸給你過(guò)濾到0。這樣的物理器件,其輸出信號(hào),實(shí)際上是不完全滿足采樣定理數(shù)學(xué)上的嚴(yán)格要求的,因此必然會(huì)產(chǎn)生各種各樣的噪聲。
那么,為了進(jìn)一步提升音頻系統(tǒng)的品質(zhì),只有提升采樣率了,96K, 192K,也就有他們存在的意義了。
華麗的分割線
即使提升了采樣率,還不夠,因?yàn)橐獫M足采樣定理而制造的濾波器,還是太困難了,因此工程師們想了很多辦法。超高采樣率就是這樣,它使用64倍或者128倍20K的采樣率進(jìn)行采樣,這樣即使原始模擬信號(hào)中存在高頻信號(hào),也在采樣定理的保證下,被無(wú)損的采樣,而不會(huì)發(fā)生混疊效應(yīng)。這就大大降低了對(duì)于濾波器的要求了,而且即使濾波器的截止點(diǎn)存在漸變地帶,那也是在很高的頻率了,引入的混疊效應(yīng)也發(fā)生在很高的頻率點(diǎn),所引入的噪聲遠(yuǎn)遠(yuǎn)超出人耳的聽覺范圍。可以這么理解:過(guò)采樣系統(tǒng)中仍然有噪聲,但是它降低了器件的復(fù)雜度,而且它把噪聲趕到人耳聽覺能力以外了。
超高采樣率采集到的數(shù)據(jù),包含很多高頻信號(hào),但是可以使用數(shù)字濾波器進(jìn)行濾波,數(shù)字濾波器可以使用各種算法進(jìn)行計(jì)算優(yōu)化,傅里葉變換等等,把高頻信號(hào)過(guò)濾掉以后,只保留20K以內(nèi)的音頻信號(hào)。根據(jù)采樣定理,再數(shù)字重采樣到48K的采樣率,輸出給后續(xù)系統(tǒng)進(jìn)行處理。
超高采樣時(shí),就沒有必要使用16位或者24位做AD轉(zhuǎn)換了,只是用6位、或1位即可,這個(gè)叫做delta-segma轉(zhuǎn)換。
思路至此, DSD格式的音樂就橫空出世了,DSD相對(duì)于傳統(tǒng)的PCM,就是另外一片天地了。
在數(shù)字音頻領(lǐng)域,常用的采樣率有:
8,000 Hz - 電話所用采樣率, 對(duì)于人的說(shuō)話已經(jīng)足夠
11,025 Hz
22,050 Hz - 無(wú)線電廣播所用采樣率
32,000 Hz - miniDV 數(shù)碼視頻 camcorder、DAT (LP mode)所用采樣率
44,100 Hz - 音頻CD, 也常用于MPEG-1 音頻(VCD, SVCD, MP3)所用采樣率
47,250 Hz - Nippon Columbia (Denon)開發(fā)的世界上第一個(gè)商用 PCM 錄音機(jī)所用采樣率
48,000 Hz - miniDV、數(shù)字電視、DVD、DAT、電影和專業(yè)音頻所用的數(shù)字聲音所用采樣率
50,000 Hz - 二十世紀(jì)七十年代后期出現(xiàn)的3M 和Soundstream 開發(fā)的第一款商用數(shù)字錄音機(jī)所用采樣率
50,400 Hz - 三菱 X-80 數(shù)字錄音機(jī)所用所用采樣率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音軌、BD-ROM(藍(lán)光盤)音軌、和 HD-DVD (高清晰度 DVD)音軌所用所用采樣率
2.8224 MHz - SACD、索尼 和 飛利浦 聯(lián)合開發(fā)的稱為Direct Stream Digital的1位sigma-delta modulation 過(guò)程所用采樣率。
? 回復(fù)「?籃球的大肚子」進(jìn)入技術(shù)群聊
回復(fù)「1024」獲取1000G學(xué)習(xí)資料
PS:想加入技術(shù)群的同學(xué),加了我好友后,就給我發(fā)「籃球的大肚子」這句話,有可能機(jī)器人打瞌睡,可以多發(fā)幾次,不要發(fā)與技術(shù)無(wú)光的消息或者推廣。
總結(jié)
以上是生活随笔為你收集整理的为什么需要超过48k的采样音频?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: RK3288/RK3399 CPU定频方
- 下一篇: 你应该知道为什么需要内核