音频信息隐藏技术研究
??????根據隱藏載體不同,可將信息隱藏技術分為視頻信息隱藏、圖像信息隱藏、音頻信息隱藏和文本信息隱藏等幾大類。由于以下兩方面原因,音頻信息隱藏成為了信息隱藏研究的重點和熱點:其一,音頻是人類交流的一種重要工具,是日常生活中不可或缺的一個要素;其二,音頻中存在足夠多的信息冗余,可以給信息嵌入提供一個很好的應用環境。音頻信息隱藏的核心思想是以音頻作為隱藏載體,在其中尋找到一些對人耳聽覺相對透明的特性,然后根據待隱藏信息對這些特性的某些參數進行修改,從而實現待隱藏信息在音頻中的嵌入,最后將攜密音頻傳輸給接收方,完成整個待隱藏信息的保密傳輸過程。文獻[1-6]都很好地體現了這一技術實現思想。
1 音頻信息隱藏基本原理
??????音頻信息隱藏的主要方法就是根據待隱藏信息,對人耳聽覺不敏感的音頻參數進行修改,以達到信息嵌入的目的。因此尋找人耳聽覺不敏感的音頻參數就成了音頻信息隱藏的首要任務。
??????根據前人的研究,聽覺閾值、聽覺掩閉效應等特征很大程度上影響了人耳聽覺的敏感性。
??????(1)聽覺閾值
??????在聲學中,用I 表示聲強,它是指單位時間內通過垂直于聲波傳播方向的單位面積的聲波能量。取I 0 =10 -2Wm?? -2 作為聲強的基準,把稱為聲強級。如果聲波的頻率在20 Hz~20 kHz之間,而聲強又達到一定的強度,該聲波就能被人耳所感知,此時的聲波強度被稱為聽覺閾值。前人大量的實驗測試結果[7-8]表明,人耳對不同頻率的聲波主觀上感受到相同響度時的聲強是不同的,這就引出了聲學上的聽覺等響曲線,如圖1所示。
????? 圖中最下方的一條虛線表示人耳能感知在當前頻率的聲波所需的最低聲強,即為聽閾曲線。由圖1中聽閾曲線的形狀可得:人耳對兩端頻段上的聲波反應較為遲鈍,而對中間頻段上的聲波反應相對較為敏感。這是音頻信息隱藏的一個重要理論依據。
??????(2)聽覺掩蔽效應
??????一方面,如果時間上相鄰的兩個聲波同時存在,且其中一個聲波較強,而另一個較弱,則較弱的一個聲波會因為較強聲波的存在而被人耳聽覺所忽略;另一方面,如果頻率相近的兩個聲波同時存在,且其中一個聲波較強,而另一個較弱,則較弱的一個頻率會因為較強頻率的存在而被人耳所忽略。這兩種現象在聲學上被稱為人耳聽覺掩蔽效應[9-10],其中前一種稱為時域聽覺掩蔽效應,而后一種被稱為頻域聽覺掩蔽效應。聽覺掩蔽效應是一種常見的心理聲學現象,是心理聲學中一個很重要的特征,也是音頻信息隱藏的一個重要理論基礎。最不重要位(LSB)、頻帶分割等音頻信息隱藏技術都充分利用了人耳聽覺的這一特性。
??????(3)相位不敏感
??????人耳對不同強度、不同頻率聲音的聽覺范圍稱為聲域。在人耳的聲域范圍內,聲音聽覺心理的主觀感受主要有響度、音高、音色等特征。其中,主觀上的響度、音高和音色可以分別用振幅、頻率和相位3個物理量來進行描述。其中,人耳對振幅,頻率的變化較為敏感,而對相位變化的敏感程度則要欠缺得多。這使得相位問題成了實現音頻信息隱藏的一個重要參考方向。
2 音頻信息隱藏主要技術指標
??????音頻信息隱藏的主要技術指標有透明性、魯棒性、不可檢測性和安全性等。這些技術指標是衡量音頻信息隱藏算法優劣成敗的重要依據。
??????(1)透明性
??????透明性也叫隱蔽性,是指嵌入載體中的信息不容易引起非法第三方注意的特性。為了滿足透明性要求,在設計音頻信息隱藏算法時,一方面,對人耳聽覺不敏感的音頻特性充分加以利用,使嵌入待隱藏信息后的攜密音頻與原始音頻在聽覺效果上保持很好的一致性;另一方面,充分研究和利用其他音頻處理技術,使得攜密音頻在面對頻譜分析、語譜分析時也有不錯的表現。
??????(2)魯棒性
??????魯棒性對信息隱藏非常重要,它是指攜密音頻不會因為經過了音頻文件的改動、信號處理技術的加工或是環境噪聲的攻擊而導致隱藏信息丟失的能力。為了保證隱藏信息的魯棒性,音頻信息隱藏時,一方面會選擇不變性較好的音頻特性作為操作對象,另一方面會引入糾錯編碼,同時增加隱藏的強度,使得攜密音頻在經過某些文件操作或者信號處理后仍能很好地將隱藏信息恢復出來。
??????(3)不可檢測性
??????不可檢測性是指攜密音頻應該具有不被隱藏分析工具所檢測的特性。近年來,隱藏分析技術的研究取得了很大的進步,對簡單LSB、改進的LSB,甚至是一些其他更為復雜的信息隱藏算法,都取得了很好的檢測效果。因此,在設計音頻隱藏算法時,不可檢測性就成了其中必須考慮的一個重要的因素,其核心思想就是要求攜密載體與原始載體在統計特性上具有很好的一致性。
??????(4)安全性
??????安全性是指隱藏信息不易被非法用戶恢復,或者即使恢復出隱藏信息,也無法獲取信息的真實含意的特性。提高信息隱藏算法的安全性主要有兩種方法:首先,對隱藏技術的關鍵參數(也稱隱藏密鑰)進行嚴格保密,使非法用戶很難正確地對隱藏信息進行恢復;其次,將密碼學應用到信息隱藏技術中,在進行信息嵌入之前,先對待隱藏信息進行加密處理,使得非法用戶即使采用手段正確恢復出隱藏信息,也很難理解隱藏信息的真正含意。
3 音頻信息隱藏模型
??????音頻信息隱藏系統模型主要由隱藏模型和解隱藏模型組成。隱藏模型用來描述信息嵌入到音頻載體的過程,而解隱藏模型則用以描述從攜密載體中恢復隱藏信息的過程。
??????(1)隱藏模型
??????典型的隱藏模型如圖2所示,待隱藏信息的嵌入步驟如下:
- 獲取音頻、圖像、文本等原始待隱藏信息;
- 為了提高隱藏方法的安全性,可對待隱藏信息進行加密處理;
- 為了增強隱藏方法的魯棒性,可選擇對待隱藏信息進行糾錯交織;
- 考慮到隱藏時通常是逐位進行的,因此需要對糾錯交織后的數據進行并串轉換;
- 讀取原始載體音頻,如果是變換域隱藏算法,則需要對載體音頻進行相應的變換;
- 為了能夠對隱藏信息進行準確的盲檢測,通常需要在信息嵌入之前,先在載體音頻中加入同步信號;
- 完成信息嵌入、音頻反變換,再將音頻數據傳輸給接收方。
在一些具體應用環境中,可能因為信息隱藏的特殊性而使得模型會有所差異。
??????(2)解隱藏模型
??????典型的解隱藏模型如圖3所示,隱藏信息的提取步驟如下:
- 從發送方獲取攜密音頻,音頻可能以音頻文件或者是音頻流等形式出現;
- 如果信息隱藏是在變換域中進行的,則需要對攜密音頻進行相應的變換;
- 獲取同步信息,為準確提取隱藏信息做準備。在許多應用場合,這是極為關鍵的一步,它嚴重地影響著信息提取的正確性;
- 串并轉換,解糾錯交織,解密,最后得到恢復后的隱藏信息。
??????在某些場合,由于考慮到接收端音頻的聽覺效果,還需要對音頻進行去隱藏、濾波、音頻平滑等處理。
4 音頻信息隱藏分類
??????音頻信息隱藏的分類標準有很多,嵌入信息所采用的域是其中最為常用的一種。以嵌入信息所采用的域為依據,可將音頻信息隱藏劃分為時域音頻隱藏、頻域音頻隱藏、離散余弦變換(DCT)域音頻隱藏,小波(Wavelet)域音頻隱藏和壓縮域音頻隱藏等。
??????(1)時域隱藏
??????時域音頻信息隱藏選擇直接對音頻信號的幅度或者音頻文件結構進行處理,是較為簡單的一類隱藏方法。它主要包括LSB及改進LSB隱藏、回聲隱藏和音頻文件結構隱藏等。
??????LSB隱藏是用待隱藏信息按一定的規律對音頻數據的最不重要位進行替換的隱藏方法,其容量大,實現容易,但魯棒性相對比較差,甚至不能抵抗微弱噪聲的攻擊,抗檢測性也不強。
??????回聲隱藏在待隱藏信息在音頻信號上疊加一些微弱的回聲,然后通過對回聲的識別實現對信息進行提取。其聽覺透明性較好,是一種不錯的強魯棒性音頻信息隱藏方法。
??????音頻文件結構隱藏是對音頻文件中一些并非必須的結構段進行操作,從而實現信息嵌入的一類隱藏方法。其實現簡單,魯棒差,因此實際應用價值并不高。
??????(2)頻域隱藏
??????頻域音頻信息隱藏是對音頻進行離散傅立葉變換(DFT)變換,然后對音頻的頻域特征進行處理以實現信息嵌入的一類方法,因此又稱為DFT域音頻信息隱藏。它主要包括頻域LSB隱藏、擴頻隱藏、相位隱藏和頻帶分割隱藏等。
??????頻域LSB隱藏與時域LSB相似,具有操作簡單,隱藏容量大,但魯棒性差等特點。
??????擴頻隱藏借用了擴頻通信思想,將待隱藏信息以偽噪聲的形式擴散到整個音頻通帶上,因此透明性好,抗噪能力強,具有很高的實用價值,是頻域音頻信息隱藏算法中較為成功的一類。
??????相位隱藏算法充分利用人耳聽覺對絕對相位并不敏感這一特點,通過對相位的改變實現信息的嵌入。該類隱藏方法透明性好,但對噪聲的抵抗能力不甚理想。
??????頻帶分割隱藏將音頻載體的頻帶分割成無數個子帶,充分利用聽覺閾值和聽覺掩蔽效應等人耳聽覺特性,在人耳聽覺不太敏感的子帶上進行隱藏。這類方法隱藏容量大,聽覺透明性好,但頻域透明性較差。
??????(3)離散余弦變換域隱藏
??????DCT域隱藏是對音頻載體進行DCT變換,然后對DCT系數進行某些操作,從而完成信息嵌入的一類音頻信息隱藏方法。
??????該類隱藏方法最大的優點是對模/數轉換(A/D)、數/模轉換(D/A)影響的抵抗能力非常強,有很高的實用價值,因此應用極為廣泛。
??????DCT域LSB方法與上兩類LSB相似,具有相似的優缺點。
??????DCT域相位隱藏對DCT相位進行改動,以實現信息的嵌入。該類隱藏方法與頻域相位隱藏相似,也具有很好的透明性。
??????DCT域上還有許多根據不同值域內數量,不同頻段數據奇偶性等特征進行信息嵌入的方法,都具有很好的透明性和魯棒性。
??????(4)小波域隱藏
??????Wavelet域隱藏方法是對音頻載體進行Wavelet變換,然后對其系數進行修改,以實現信息嵌入的一類隱藏方法。該類隱藏方法與DCT隱藏一樣,在抵抗A/D、D/A攻擊方面有著非常優秀的表現。
??????Wavelet域LSB隱藏方法對Wavelet系數的最不重要位進行替換。其實現方法與其他域的LSB隱藏相似。
??????Wavelet域能量比隱藏通過比較和修改不同Wavelet級上的能量,或是對同一Wavelet級上某一能量值范圍內的系數數量、奇偶性等進行修改,從而實現信息的嵌入。
??????Wavelet域上還有許多隱藏方法,都是針對Wavelet系數進行某些操作以完成信息嵌入。這是目前研究較熱,應用較多的一類隱藏方法。
??????(5)壓縮域隱藏
??????壓縮域隱藏方法是近年來才出現的一類隱藏方法。該類方法的主要目標是將信息嵌入到壓縮算法的碼流或相關碼表中去,如MP3哈夫曼碼表,MIDI樂器碼表等。
??????這一類方法的透明性很好,但對音頻格式變換、信號處理等攻擊的抵抗能力不強。
5 結束語
??????音頻信息隱藏作為信息隱藏的一個重要分支,它主要涉及的域有時域、頻域、DCT域、Wavelet域、壓縮域等。其中,時域和頻域的嵌入方法相對容易實現,但魯棒性相對較差;而DCT域和Wavelet域方法透明性好,魯棒性也不錯,尤其是在抵抗A/D、D/A攻擊時有著非常優秀的表現,但其操作復雜,實現難度相對較高;壓縮域隱藏算法一般有較好的透明性,但魯棒性相對較差。
音頻信息隱藏技術發展到現在,音頻信息隱藏在許多場合取得了很好的應用效果,也解決了不少實際的生活難題。然而,面對重錄音攻擊,尚且沒有一種很好的方法。大量的實驗結果表明,解決這一難題的關鍵是精確同步信息的嵌入和強魯棒隱藏方法的研究。后一問題可以在DCT域或Wavelet域內尋求解決途徑,而前一問題則還沒有太好的思路,還有大量的研究工作有待進一步展開。
6 參考文獻
[1] JI Rongrong, YAO Hongxun, LIU Shaohui, et al. Genetic algorithm based optimal block mapping method for LSB substitution [C]//Proceedings of International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP’06), Dec 18-20, 2006, Pasadena, CA, USA. Piscataway, NJ, USA:IEEE, 2006: 215-218.
[2] LIN C, PAN J S, SHIEH C S. A subsampling and PSK based watermarking scheme resisted the permutation attacking [C]//Proceedings of International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP’06), Dec 18-20, 2006, Pasadena, CA, USA. Piscataway, NJ,USA: IEEE, 2006: 113-116.
[3] ZHANG L k, LIU S. Secret telephone technology based on information hiding and encryption [C]// Proceedings of International Conference on Information Acquisition (ICIA'06), Aug 20-23, 2006, Jeju, Korea. Piscataway, NJ, USA: IEEE ,2006: 155-159.
[4] LI Ming, LEI Y, LIU J. A novel audio watermarking in wavelet domain [C]//Proceedings of International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP’06), Dec 18-20, 2006, Pasadena, CA, USA. Piscataway, NJ,USA: IEEE, 2006: 27-32.
[5] CAI R, LU L, HANJALIC A. A flexible framework for key audio effects detection and auditory context inference [J]. IEEE Transactions on Audio, Speech and Language Processing, 2006, 3(14): 1026-1039.
[6] AIS O, NOUREDDINE E . A speech analysis technique based on temporal and frequency masking properties of the auditory system [C]//Proceedings of International Conference on Systems, Man and Cybernetics (SMC’02): Vol 6, Oct 6-9, 2002, Hammamet, Tunisia. Los Alamitos, CA, USA: IEEE Computer Society, 2002: 6-12.?
[7] 諸揮明, 梁路光, 付妍. 人耳聽閾曲線的測定 [J]. 大學物理實驗, 2006, 16(1): 43-46.??
[8] BAUER B B, TORICK E L. Researches in loudness measurement [J]. IEEE Transactions on Audio and Electroacoustics, 1966, 3(14): 141-151.
[9] 周克蘭, 張玉華. 基于聽覺掩蔽效應和小波變換的音頻水印 [J]. 微電子學與計算機,2005,22(3): 185-188.?
[10] 賈駿, 王朔中, 張新鵬. 一種基于人耳聽覺特性的數字音頻水印方案 [J].西安電子科技大學學報:自然科學版, 2004, 31(4): 652-655.
鏈接:http://www.zte.com.cn/cndata/magazine/zte_communications/2007/5/magazine/200709/t20070929_150698.html
總結
以上是生活随笔為你收集整理的音频信息隐藏技术研究的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 西安80坐标系转换工具
- 下一篇: 【PIC】单片机基本概述