生活随笔
收集整理的這篇文章主要介紹了
PCM音频基础知识及采样数据处理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
PCM音頻基礎知識及采樣數據處理
目錄
PCM簡介采樣頻率、量化精度(采樣位數)和聲道數音頻幀錄播過程音頻混音PCM音頻采樣數據處理
轉載自:音頻PCM知識整理
視音頻數據處理入門:PCM音頻采樣數據處理
1. PCM簡介
PCM(Pulse Code Modulation),脈沖編碼調制。人耳聽到的是模擬信號,PCM是把聲音從模擬信號轉化為數字信號的技術。原理是用一個固定的頻率對模擬信號進行采樣,采樣后的信號在波形上看就像一串連續的幅值不一的脈沖(脈搏似的短暫起伏的電沖擊),把這些脈沖的幅值按一定精度進行量化,這些量化后的數值被連續的輸出、傳輸、處理或記錄到存儲介質中,所有這些組成了數字音頻的產生過程(抽樣、量化、編碼三個過程)。PCM(Pulse Code Modulation,脈沖編碼調制)音頻數據是未經壓縮的音頻采樣數據裸流自然界的音頻都是模擬信號,要在計算機中模擬出來,必須轉成數字信號,這就是模數轉換。下面是聲音波形的模擬信息
首先對聲音按照一定精度的采樣(比如上圖0.5一個采樣點,常見采樣頻率為44.1kHZ,16kHZ等),采樣完成,對聲音進行一定精度的量化,得到量化后的數字信號
將量化后的數字信號從十進制轉二進制得到二進制方波
2. 采樣頻率、量化精度(采樣位數)和聲道數
采樣頻率是設備一秒鐘內對模擬信號的采樣次數,在主流的采集卡上分為:(8Khz的電話采樣率就可以達到人的對話程度) 22.05KHz:無線電廣播;44.1KHz:音頻 CD,MP3等;48KHz:miniDV、數字電視、DVD、電影和專業音頻。 人耳能夠感覺到的最高頻率為20kHz,要滿足人耳的聽覺要求,則需要每秒進行40k次采樣,即40kHz。我們常見的CD采樣率為44.1kHz。(硬件的揚聲器最高是16KHz,則手機MIC采樣率就不用太高,節省傳輸帶寬)采樣位數比如8bit(現在少見)、16bit(常用)和24bit,指的是描述數字信號所使用的位數。聲道數:聲音在錄制或播放時在不同空間位置采集或回放的相互獨立的音頻信號。單聲道:采樣數據為8位的短整數(short)。雙聲道:采樣數據為16位的整數,(int),高八位(左聲道)和低八位(右聲道)分別代表兩個聲道。[時長]s * [采樣率]Hz * [采樣位數]bit * [聲道數] / 8 = [文件大小]byte。某音頻信號是采樣率為8kHz、聲道數、位寬為16bit,時長為1s,則音頻數據的大小為:1 * 8000 * 16 *2 = 256000 bit / 8 = 32000 byte / 1024 = 31.25 KB
3. 音頻幀
音頻跟視頻很不一樣,視頻每一幀就是一張圖像,音頻數據是流式的,不同的編碼格式各自不同的編碼標準,拿PCM和MP3做一個對比。PCM因為沒有壓縮,根據采樣率位寬等數據可以得到每秒的音頻數據,并不需要幀的概念;MP3則是因為壓縮后信息比較多,則有了類似H264的幀概念,每一個幀都有一個幀頭,有興趣可以詳見如下,有很詳細的MP3的幀解析:MP3格式音頻文件結構解析
4. 錄播過程
播放音樂時,應用程序從存儲介質中讀取音頻數據(MP3、WMA、AAC…),經過解碼后,最終送到音頻驅動程序中的就是PCM數據,反過來,在錄音時,音頻驅動不停地把采樣所得的PCM數據送回給應用程序,由應用程序完成壓縮、存儲等任務。所以,音頻驅動的兩大核心任務就是: playback:如何把用戶空間的應用程序發過來的PCM數據,轉化為人耳可以辨別的模擬音頻capture:把mic拾取到得模擬信號,經過采樣、量化,轉換為PCM信號送回給用戶空間的應用程序。
5. 音頻混音
1. 混音原理
聲音是由于物體的振動對周圍的空氣產生壓力而傳播的一種壓力波,轉成電信號后經過抽樣,量化,仍然是連續平滑的波形信號,量化后的波形信號的頻率與聲音的頻率對應,振幅與聲音的音量對應,量化的語音信號的疊加等價于空氣中聲波的疊加,所以當采樣率一致時,混音可以實現為將各對應信號的采樣數據線性疊加。而問題的關鍵就是如何處理疊加后溢出問題。
5. PCM音頻采樣數據處理
視音頻數據處理入門:PCM音頻采樣數據處理
總結
以上是生活随笔為你收集整理的PCM音频基础知识及采样数据处理的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。