数字音频技术
1 數字音頻基礎知識
1.1 聲音的基本概念
語音+音樂+自然聲
聲音的基本概念
周期 振幅 頻率
可聽聲波
20Hz ~ 20kHZ
小于20Hz的是次聲波
大于20kHz的是超聲波
人聲音在 300Hz ~ 3kHz 之間
聲音的聽覺特征
聲音的元素
1.2 聲音的數字化
數字音頻質量三要素
聲音數字化的數據量
1.3 音頻的文件格式
WAV
MS和IBM共同開發的PC波形文件, 不壓縮, 文件數據量很大
MP3
MPEG Audio layer 3
是一種按照MPEG標準的音頻壓縮技術
WMA
Windows Media格式的一個子集
壓縮到mp3的一半 音質不變
MIDI
樂器數字接口, 是一組聲音或者樂器符號的集合
數據量小但是缺乏重現自然音
1.4 聲音的采集和處理
采集
直接錄取
錄音棚
唱片
數字音頻庫
處理
刪除無用部分
降噪
調節均衡, 高中低頻段
添加混響, 延遲和變速
音頻文件格式的轉換
2 數字音頻壓縮標準
2.1 概述
編解碼過程
壓縮編碼技術
基本依據
聲音信號存在大量冗余
強音能夠抑制弱音
壓縮編碼的分類
2.2 音頻壓縮技術標準
音頻壓縮技術標準
2.3 音頻壓縮工具軟件
主要有 Audio Converter; MP3 Resizer
3 聲卡與電聲設備
聲卡: 聲音的基本的硬件設備
性能指標
采樣和量化能力
采集分為11.025(語音) 22.05(音樂) 44.1(高保真)
量化 8(語音) 16(高保真)
芯片類型
CODEC占用CPU資源
DSP 不需要CPU資源可以獨立運行
總線類型
ISA;PCI;USB
輸出聲道數
2; 2.1; 4.1; 5.1聲道
外部接口
線性輸入; 線性輸出; 揚聲器輸出; MIDI接口
傳聲器
話筒, 麥克風
原理
電磁換換能原理
性能指標
靈敏度; 頻率響應; 指向性; 輸出阻抗
揚聲器
喇叭, 電信號轉化為聲音
音響
揚聲器系統
聲道數
2.0表示雙聲道
2.1是雙聲道+超重低音聲道 也就是說0.1就是指低音炮
4.1/5.1/7.1 主流首選5.1
性能指標
輸出功率: 一般顯示的是最大功率
頻率范圍
信噪比: 70~80db普通
80~90db 高檔
>95db 專業音響
4 電子音樂與MIDI
發展
留聲機, 電吉他, 電貝司等
電子合成器
MIDI音樂技術
MIDI樂器數字接口
MIDI的合成方法
調頻合成法FM
波形合成法WT
計算機音樂系統
MIDI鍵盤
音序器: 能夠將音樂的各種要素以數字的語匯進行有序的排序
音序軟件
音樂軟件的分類
5 音頻編輯軟件
5.1 Audition概述
錄制聲音的軟件有: 錄音機; 錄音大師; Wave Studio; Audition
Audition的前身是Cool Edit Pro
Cool Edit Pro 2000是其中的主流產品
基本功能
是集聲音錄制, 音頻混合和編輯與一身的音頻編輯軟件
窗口組成
標題欄; 菜單欄; 工具欄; 編輯器; 功能面板; 狀態欄
5.2 音頻文件的管理
Audition支持的格式
音頻格式: MP3; WAV; WMA
動畫格式: SWF
視屏格式: FLV
(1) 打開音頻文件
文件-->打開
(2) 追加打開
文件-->追加打開
可以選擇打開到新文件或者到之前的文件之后
(3) 導入文件
文件-->導入
導入文件與打開文件的區別就是是在源文件上的處理還是導入之后在內存上處理
(4) 創建音頻文件
文件-->新建-->音頻文件
在上面可是填入需要的內容(文件名等)
(5) 創建多軌合成項目
文件-->新建-->多軌合成項目
在要插入的音軌上右鍵-->插入-->文件
(6) 從CD中提取音頻
文件-->從CD中提取
(7) 保存音頻文件
文件-->下面有五種保存方式, 可以根據需要點擊保存
5.3 控制聲音播放
可以通過走帶面板控制
5.4 波形的縮放和滾動
在走帶面板右側的 可以點擊
含義分別是:振幅放大, 縮小, 周期放大, 縮小, 全面縮小, 放大入點, 縮小入點, 縮至放選區
5.5 錄音技術
在波形下錄制
在波形面板里 右鍵新建一個音頻文件
通過點擊走帶面板的 錄制 按鈕, 就可以錄制聲音
注意錄制的時候的電平的變化, 如果出現紅色就有可能爆音
但是音量也不能太小, 要保證在右側的一個區域是最好的
在多軌界面下錄制
新建多軌項目, 單機音軌的R按鈕,進入準備錄音狀態
在走帶面板中點擊錄制按鈕
5.6 音頻的剪輯
選取波形
ctrl+A或者雙擊 選取全部
多軌中可以通過上下鍵 選擇其中一個音軌
可以選取多個音軌, 也可以只處理一個音軌
復制波形
ctrl+C
ctrl+shift+C 復制成一個新的文件
剪切
ctrl+X
粘貼
ctrl+V
還有一個混合粘貼
刪除
delete
裁剪
選取的波形保留
ctrl+T
5.7 改變振幅
用于調節聲音大小
效果-->振幅與壓限-->振幅
通過向左移動來減小
5.8 淡入淡出
效果-->振幅與壓限-->淡化包絡
選擇預設的處理模式來設置淡入或者淡出
5.9 降低噪音
在語音停頓處有一種振幅變化不大的聲音就是噪音
處理的方法
選擇噪音樣本, 最好大于1秒
效果-->降噪/修復-->降噪
點擊選擇完整文件, 進行匹配噪音并將整個文件匹配的聲音去除
5.10 延遲和回聲效果
延遲是原始信號的復制, 以毫秒間隔再現
回聲與原始音頻間隔時間長, 可分辨出原始信號與回聲信號
分類:
模擬延遲
延遲
回聲
模擬延遲
模擬延遲效果可模擬老式的硬件延遲效果器的聲音, 使用特性失真和調整立體聲
要創建離散回聲, 延遲要35ms或者更多
創建方法:
效果-->延遲與回聲-->模擬延遲
延遲效果
用于創建簡單的回聲和一些其他效果
1-14ms 在空間定位一個單聲道聲音
15-34ms 創建簡單的合唱或者鑲邊效果
35ms以上 創建離散的回聲
操作方法
效果-->延遲與回聲-->延遲
回聲效果
添加一系列重復衰減
操作
效果-->延遲與回聲-->回聲
5.11 聲音沒學
提高聲音的質量
潤色聲音
加工聲音
相關因素:
清晰度; 噪音; 音色; 旋律
6 語音識別技術
主要應用
將語音轉化為文字
辨別說話人的身份
基本原理
本質上是模式識別的過程
人若有恒 無所不成
總結
- 上一篇: 广州 购物(广州奢侈品批发市场)
- 下一篇: 中国第一个母亲节是哪年(今年母亲节几号)