嵌入在音頻信號(hào)中的隱藏?cái)?shù)據(jù)的恢復(fù)的制作方法

文檔序號(hào)：2831773閱讀：301來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：嵌入在音頻信號(hào)中的隱藏?cái)?shù)據(jù)的恢復(fù)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信系統(tǒng)。本發(fā)明特別但不排它地涉及下述通信系統(tǒng)，在所述通信系
統(tǒng)中，經(jīng)由聲音數(shù)據(jù)信道提供數(shù)據(jù)給諸如蜂窩電話之類的電話設(shè)備。 WO 02/45273描述了一種蜂窩電話系統(tǒng)，其中，在電視或無線電節(jié)目的音頻之內(nèi)向蜂窩電話傳送隱藏?cái)?shù)據(jù)。在當(dāng)前的上下文中，在下述意義上對(duì)數(shù)據(jù)進(jìn)行隱藏對(duì)數(shù)據(jù)進(jìn)行編碼以便試圖將數(shù)據(jù)隱藏在音頻中，使得它不引起用戶注意并在一定程度上為音頻所掩蓋。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，可接受的數(shù)據(jù)可聽度水平會(huì)取決于所涉及的應(yīng)用和用戶而變化。在這個(gè)較早的申請(qǐng)中描述了用于將數(shù)據(jù)編碼在音頻之內(nèi)的各種技術(shù)，包括擴(kuò)展頻譜編碼、回波調(diào)制、臨界頻帶編碼等。然而，發(fā)明人發(fā)現(xiàn)應(yīng)用程序軟件不得不執(zhí)行大量處理以便能夠恢復(fù)隱藏的數(shù)據(jù)。因此，一個(gè)實(shí)施例的一個(gè)目標(biāo)就是要減少軟件應(yīng)用程序的處理需求。在一個(gè)實(shí)施例中，提供了一種用于從輸入的音頻信號(hào)中恢復(fù)隱藏的數(shù)據(jù)或者用于
識(shí)別輸入的音頻信號(hào)的方法，該方法使用電信設(shè)備，所述電信設(shè)備具有音頻編碼器，所述音
頻編碼器用于壓縮輸入的音頻信號(hào)以便傳送到電信網(wǎng)絡(luò)，該方法特征在于，通過音頻編解
碼器傳遞輸入的音頻信號(hào)以生成壓縮的音頻數(shù)據(jù)，并且處理壓縮的音頻數(shù)據(jù)以恢復(fù)隱藏的
數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。發(fā)明人發(fā)現(xiàn)通過音頻編碼器傳遞輸入的音頻，可以顯著減
少隨后的恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻所需的處理量。特別地，這個(gè)處理可以被執(zhí)
行而無須重新生成音頻樣本然后再著手用于恢復(fù)隱藏的數(shù)據(jù)或者用于識(shí)別音頻信號(hào)的傳
統(tǒng)技術(shù)。在一個(gè)實(shí)施例中，音頻編碼器對(duì)輸入的音頻執(zhí)行線性預(yù)測(cè)(LP)分析以生成表示輸入的音頻的LP數(shù)據(jù)，并且其中處理步驟處理LP數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。優(yōu)選地，音頻編碼器壓縮LP數(shù)據(jù)以生成壓縮的LP數(shù)據(jù)，并且處理步驟包括從壓縮的音頻數(shù)據(jù)中重新生成LP數(shù)據(jù)的步驟。編碼器所生成的LP數(shù)據(jù)可以包括LP濾波數(shù)據(jù)如LPC濾波系數(shù)、濾波極點(diǎn)或線狀
譜頻率，并且處理步驟使用這種LP濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。處理步驟可以包括生成LP合成濾波器的脈沖響應(yīng)的步驟，或者包括對(duì)LP濾波數(shù)
據(jù)執(zhí)行逆萊文森-德賓(Levinson-Durbin)算法的步驟。當(dāng)生成脈沖響應(yīng)時(shí)，優(yōu)選地取它
的自相關(guān)，由此可以比從脈沖響應(yīng)自身更加容易地識(shí)別回波存在與否。音頻編碼器所生成的LP數(shù)據(jù)可以包括LP激發(fā)數(shù)據(jù)(諸如碼簿索引、激發(fā)脈沖位
置、脈沖符號(hào)等)，并且處理步驟可以使用這種LP激發(fā)數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音
頻信號(hào)。在大多數(shù)情況下，LP數(shù)據(jù)會(huì)包括LP濾波數(shù)據(jù)和LP激發(fā)數(shù)據(jù)兩者，并且處理步驟可以處理對(duì)應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù)據(jù)中之一的壓縮音頻數(shù)據(jù)中的全部或其子集以恢復(fù)隱藏的數(shù)據(jù)。可以使用若干技術(shù)將數(shù)據(jù)隱藏在音頻信號(hào)之內(nèi)。然而，在優(yōu)選實(shí)施例中，將數(shù)據(jù)作為音頻信號(hào)的一個(gè)或多個(gè)回波而隱藏在音頻中。然后可以通過檢測(cè)回波來恢復(fù)隱藏的數(shù)據(jù)。要被隱藏的數(shù)據(jù)的每個(gè)符號(hào)可以通過回波的組合來(同時(shí))表示，也可以表示為音
5頻信號(hào)之內(nèi)的回波的序列，并且處理步驟可以包括識(shí)別回波的組合以恢復(fù)隱藏的數(shù)據(jù)的步驟，或者包括跟蹤音頻中回波的序列以恢復(fù)隱藏的數(shù)據(jù)的步驟。在一個(gè)實(shí)施例中，音頻編碼器具有預(yù)定操作頻帶，并且回波隱藏在音頻之內(nèi)的操
作頻帶預(yù)定部分之內(nèi)，優(yōu)選地隱藏在頻帶的上部，并且其中處理步驟包括濾波步驟以過濾
掉這個(gè)預(yù)定部分之外的頻率。例如，在音頻編碼器具有300Hz至3. 4kHz的操作頻帶的情況
下，回波可以僅包括在1kHz和3. 4kHz之間的頻帶內(nèi)，更優(yōu)選地在2kHz和3. 4kHz之間的頻
帶內(nèi)，因?yàn)檫@可以減少對(duì)音頻信號(hào)的影響，所述音頻信號(hào)的能量通常位于操作帶寬的下部
之內(nèi)。在另一個(gè)實(shí)施例中，遍及操作頻帶都包括回波，但是處理步驟仍然執(zhí)行濾波以減少對(duì)
音頻的影響。這并不同樣優(yōu)選，因?yàn)榛夭ㄐ盘?hào)的一部分會(huì)在濾波時(shí)丟失。為了幫助識(shí)別回波在音頻編碼器輸出中的存在，處理步驟可以確定一個(gè)或多個(gè)自
相關(guān)值，其有助于突出回波。還可以執(zhí)行自相關(guān)值的幀間濾波以減少對(duì)緩慢變化的音頻成
分的影響。所使用的音頻編碼器可以是若干已知的編碼器如CELP編碼器、AMR編碼器、寬帶AMR編碼器等中的任何一種。在一個(gè)實(shí)施例中，處理步驟可以根據(jù)從編碼器輸出的壓縮音頻數(shù)據(jù)來確定頻譜圖，然后識(shí)別頻譜圖中的特定特征(類似于指紋)。這些特定特征識(shí)別輸入的音頻并且可以用于確定輸出給用戶的音頻的軌道信息，或者其可以用于將電信設(shè)備同步到音頻信號(hào)，例如輸出與音頻相關(guān)的字幕。另一個(gè)實(shí)施例提供了一種電信設(shè)備，其包括用于接收聲音信號(hào)并且用于將接收到的所述聲音信號(hào)轉(zhuǎn)換成相應(yīng)的音頻電信號(hào)的裝置；用于采樣所述音頻電信號(hào)以產(chǎn)生數(shù)字音頻樣本的裝置；音頻編碼裝置，用于壓縮所述數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)以便傳送到電信網(wǎng)絡(luò)；以及數(shù)據(jù)處理裝置，其耦合到所述音頻編碼裝置，用于處理壓縮的所述音頻數(shù)據(jù)，以恢復(fù)接收到的所述聲音信號(hào)之內(nèi)傳送的隱藏?cái)?shù)據(jù)，或者識(shí)別接收到的所述聲音信號(hào)。本發(fā)明的一個(gè)實(shí)施例還提供了一種數(shù)據(jù)隱藏設(shè)備，其包括音頻編碼裝置，用于接收并壓縮表示音頻信號(hào)的數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)；用于接收要被隱藏在所述音頻信號(hào)之內(nèi)的數(shù)據(jù)并且用于取決于接收到的所述數(shù)據(jù)而改變壓縮的所述音頻數(shù)據(jù)以生成修改的壓縮音頻數(shù)據(jù)的裝置；以及用于使用修改的所述壓縮音頻數(shù)據(jù)來生成音頻樣本的裝置，所述音頻樣本表示了原始的音頻信號(hào)并傳送隱藏的所述數(shù)據(jù)。另一個(gè)實(shí)施例提供了一種將數(shù)據(jù)隱藏在音頻信號(hào)中的方法，該方法包括取決于要被隱藏在音頻信號(hào)中的數(shù)據(jù)而向音頻添加一個(gè)或多個(gè)回波的步驟，并且其特征在于，在將回波與音頻信號(hào)進(jìn)行組合之前對(duì)所述回波進(jìn)行高通濾波。發(fā)明人發(fā)現(xiàn)通過僅在音頻信號(hào)的較高頻帶中添加回波，可以更加容易地檢測(cè)回波，并且減少了在遍及音頻頻帶施加回波時(shí)浪費(fèi)的能量。從參考附圖描述的示例性實(shí)施例的以下詳細(xì)描述中，本發(fā)明的這些以及其它方面將會(huì)變得明顯，其中

圖1示意性圖示了用于經(jīng)由電視信號(hào)的音頻部分將數(shù)據(jù)傳送到蜂窩電話的信號(hào)傳輸系統(tǒng)；圖2是圖示蜂窩電話主要組成部分的示意性框圖，所述蜂窩電話包括用于恢復(fù)接
6收到的音頻信號(hào)之內(nèi)隱藏的數(shù)據(jù)的軟件應(yīng)用程序；圖3a是圖示形成圖2所示蜂窩電話一部分的音頻編解碼器所執(zhí)行的處理的示意性框圖；圖3b圖示了音頻信號(hào)的LP編碼之下的源濾波器模型；圖3c圖示了其中逆LPC濾波器可以用于從輸入的音頻信號(hào)中生成激發(fā)或剩余信號(hào)的方式；圖4是圖示對(duì)來自音頻編解碼器的輸出執(zhí)行處理以恢復(fù)音頻信號(hào)中隱藏的數(shù)據(jù)的示意性框圖；圖5是可以從其中確定隱藏的數(shù)據(jù)的自相關(guān)曲線圖；圖6是圖示可以被執(zhí)行以恢復(fù)隱藏?cái)?shù)據(jù)的代替處理的示意性框圖；圖7是圖示其中可以從來自音頻編解碼器的輸出恢復(fù)隱藏的數(shù)據(jù)的進(jìn)一步代替
的方式的示意性框圖；圖8是圖示其中可以從音頻編解碼器所輸出的激發(fā)參數(shù)恢復(fù)隱藏的數(shù)據(jù)的方式的示意性框圖；圖9是從中可以識(shí)別隱藏?cái)?shù)據(jù)的由形成圖8所示電路一部分的自相關(guān)部件所輸出的自相關(guān)曲線圖；圖10是圖示對(duì)圖4所示的處理電路進(jìn)行改進(jìn)的示意性框圖，其中LPC合成濾波器的脈沖響應(yīng)被高通濾波以減少對(duì)低頻音頻成分的影響；圖11是圖示對(duì)圖4所示的處理電路進(jìn)行進(jìn)一步改進(jìn)的示意性框圖，其中LPC系數(shù)被高通濾波以去除與低頻音頻成分相關(guān)的低階系數(shù)；圖12圖示了對(duì)圖4所示的處理電路進(jìn)行的進(jìn)一步改進(jìn)，其中圖5所示的自相關(guān)曲線圖被高通濾波以去除緩慢變化的自相關(guān)；圖13是圖示其中隱藏的數(shù)據(jù)可以在由蜂窩電話接收之前被編碼在音頻之內(nèi)的一種方式的一般示意性框圖；圖14是圖示其中蜂窩電話恢復(fù)使用圖13所示的系統(tǒng)編碼的數(shù)據(jù)的方式的一般框圖；圖15是圖示其中LPC編碼器所生成的參數(shù)可以被修改并與剩余信號(hào)再組合以形成修改的音頻以便傳送到蜂窩電話的一種方式的框圖；圖16圖示了代替的方式，其中從LPC編碼器獲得的激發(fā)參數(shù)被修改，并且從中剩余信號(hào)被生成，以供將修改的音頻與從LPC編碼器獲得的LPC系數(shù)進(jìn)行合成時(shí)使用；以及
圖17是圖示其中音頻編解碼器的輸出可以被處理以恢復(fù)用于輸入音頻的頻譜圖
以供識(shí)別或表征輸入的音頻信號(hào)時(shí)使用的方式的框圖。
概述圖l圖示了本發(fā)明的第一實(shí)施例，其中數(shù)據(jù)源l所生成的數(shù)據(jù)信號(hào)F(t)由編碼器5編碼在來自音頻源3的音頻軌道之內(nèi)，以形成修改的用于電視節(jié)目的音頻軌道。在這個(gè)實(shí)施例中，數(shù)據(jù)信號(hào)F (t)傳送觸發(fā)信號(hào)，以便使運(yùn)行于用戶的移動(dòng)電話21上的軟件應(yīng)用程序的操作與電視節(jié)目同步。如圖l所示，編碼器5所輸出的修改的音頻軌道然后在信號(hào)發(fā)生器9中與來自視頻源7的相應(yīng)視頻軌道結(jié)合，以形成傳送電視節(jié)目的電視信號(hào)。在這個(gè)實(shí)施例中，數(shù)據(jù)源1、音頻源3、視頻源7和編碼器5全都位于電視演播室中，并且電視信號(hào)由分發(fā)網(wǎng)絡(luò)11分發(fā)，在這個(gè)實(shí)施例中是射頻(RF)信號(hào)13。 RF信號(hào)13由電視天線15接收，該電視天線15將電視信號(hào)提供給傳統(tǒng)的電視17。電視17具有顯示器(未示出)，用于示出視頻軌道；以及未示出的揚(yáng)聲器，用于輸出修改的音頻軌道作為聲音信號(hào)19。
如示出的那樣，在這個(gè)實(shí)施例中，蜂窩電話21使用麥克風(fēng)23檢測(cè)電視17所發(fā)出的聲音信號(hào)19，該麥克風(fēng)23將檢測(cè)到的聲音信號(hào)轉(zhuǎn)換成相應(yīng)的電信號(hào)。蜂窩電話21然后解碼該電信號(hào)以恢復(fù)數(shù)據(jù)信號(hào)F(t)。蜂窩電話21還具有傳統(tǒng)的組成部分如揚(yáng)聲器25、用于與蜂窩狀基站35通信的天線27、顯示器29、用于輸入數(shù)字和字母的小鍵盤31以及用于訪問菜單選項(xiàng)的菜單鍵33。如在W0 02/45273中說明的那樣，從音頻信號(hào)中恢復(fù)的數(shù)據(jù)可以用于若干不同目的。一種應(yīng)用是用于運(yùn)行于蜂窩電話21上的軟件應(yīng)用程序與示出在電視17上的電視節(jié)目的同步。例如，可能會(huì)在電視17上示出測(cè)驗(yàn)秀(quiz show)，并且蜂窩電話21可能布置成生成并顯示涉及與測(cè)驗(yàn)秀同步地示出的測(cè)驗(yàn)的問題。問題例如可以預(yù) 先存儲(chǔ)在蜂窩電話21上，并且當(dāng)從數(shù)據(jù)信號(hào)F(t)中恢復(fù)適當(dāng)?shù)耐酱a時(shí)輸出。在測(cè)驗(yàn) 秀的結(jié)尾，由用戶(經(jīng)由小鍵盤31)輸入到蜂窩電話21中的答案然后可以經(jīng)由蜂窩電話基站35和電信網(wǎng)絡(luò)39傳送到遠(yuǎn)程服務(wù)器41。服務(wù)器41然后可以核對(duì)從大量用戶接收到的答案，并且基于給出的正確答案的數(shù)目和輸入答案所花費(fèi)的時(shí)間來對(duì)它們進(jìn)行分等。這種計(jì)時(shí)信息也可以由蜂窩電話21確定并連同用戶的答案一起傳送到服務(wù)器41。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，服務(wù)器41還可以處理從不同用戶接收到的信息并核對(duì)它可以存儲(chǔ)在數(shù)據(jù)庫43中的各種用戶簡(jiǎn)檔信息。這種用戶簡(jiǎn)檔信息然后例如可以用于目標(biāo)廣告。
在服務(wù)器41已識(shí)別一個(gè)或多個(gè)"獲勝"用戶之后，可以將信息或獎(jiǎng)賞發(fā)送給那些用戶。例如，可以將消息連同優(yōu)惠券或其它票據(jù)一起經(jīng)由電信網(wǎng)絡(luò)39發(fā)送給他們。如圖l 中的虛線44所示，服務(wù)器41也可以向數(shù)據(jù)源1提供要被編碼在音頻之內(nèi)的數(shù)據(jù)。
如上所述，發(fā)明人認(rèn)識(shí)到通過利用由專用音頻編解碼器芯片所執(zhí)行的編碼，可以減少需要由運(yùn)行于蜂窩電話21上的軟件所執(zhí)行的處理。特別地，發(fā)明人發(fā)現(xiàn)使用音頻編解碼器中固有的編碼過程作為解碼過程的初始步驟以恢復(fù)隱藏的數(shù)據(jù)，減少了軟件用于恢復(fù) 隱藏的數(shù)據(jù)所需的處理。
蜂窩電話圖2圖示了在這個(gè)實(shí)施例中使用的蜂窩電話21的主要組成部分。如所示，蜂窩電話21包括麥克風(fēng)23，用于接收聲音信號(hào)并且用于將它們轉(zhuǎn)換成等效電信號(hào)。這些電信號(hào) 然后由濾波器51進(jìn)行濾波以去除通常在300Hz至3. 4kHz的頻帶之外的不想要的頻率(如 ETSI所公布的標(biāo)準(zhǔn)文件EN300-903中定義的那樣)。濾波的音頻然后由模擬數(shù)字轉(zhuǎn)換器53 數(shù)字化，該模擬數(shù)字轉(zhuǎn)換器53以8kHz的采樣頻率對(duì)濾波的音頻進(jìn)行采樣，通常用13至16 位數(shù)字值表示每個(gè)樣本。數(shù)字化的音頻流(D(t))然后被輸入到音頻編解碼器55，該音頻編解碼器55是自適應(yīng)多速率(AMR)編解碼器，其操作在下面進(jìn)行描述。AMR編解碼器55所輸出的壓縮音頻然后被傳遞到RF處理單元57，該RF處理單元57將壓縮的音頻調(diào)制到一個(gè) 或多個(gè)RF載波信號(hào)上，以便經(jīng)由天線27傳送到基站35。類似地，經(jīng)由天線27接收的壓縮音頻信號(hào)被饋送到RF處理單元57，該RF處理單元57解調(diào)接收的RF信號(hào)以從( 一個(gè)或多個(gè))RF載波信號(hào)中恢復(fù)壓縮的音頻數(shù)據(jù)，其被傳遞到AMR編解碼器55。 AMR編解碼器55然后解碼壓縮的音頻數(shù)據(jù)以重新生成由此表示的音頻樣本，其經(jīng)由數(shù)字模擬轉(zhuǎn)換器59和放大器61被輸出到揚(yáng)聲器25。
如圖2所示，從AMR編解碼器55 (或RF處理單元57)輸出的壓縮音頻數(shù)據(jù)還被傳遞到處理器63，該處理器63由存儲(chǔ)在存儲(chǔ)器65中的軟件控制。所述軟件包括操作系統(tǒng)軟件67(用于控制蜂窩電話21的一般操作)；瀏覽器68，用于訪問互聯(lián)網(wǎng)；以及應(yīng)用程序軟件69 ，用于提供額外的功能給蜂窩電話21 。在這個(gè)實(shí)施例中，應(yīng)用程序軟件69配置成使蜂窩電話21以上面討論的方式與電視節(jié)目交互。為了做到這一點(diǎn)，應(yīng)用程序軟件69布置成接收并處理從AMR編解碼器55輸出的壓縮音頻數(shù)據(jù)，以恢復(fù)控制應(yīng)用程序軟件69的隱藏?cái)?shù)據(jù)F(t)。如下面將會(huì)更加詳細(xì)地描述的那樣，處理壓縮的音頻數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)F(t)可以被執(zhí)行而不必重新生成數(shù)字化的音頻樣本，同時(shí)減少了軟件應(yīng)用程序69用于直接從數(shù)字音頻樣本恢復(fù)隱藏的數(shù)據(jù)所需的處理。響應(yīng)于恢復(fù)隱藏的數(shù)據(jù)，應(yīng)用程序軟件69布置成生成并在顯示器29上輸出數(shù)據(jù)(例如針對(duì)用戶的問題)，并且接收用戶經(jīng)由小鍵盤31輸入的答案。軟件應(yīng)用程序69然后將用戶的答案連同指示用戶輸入每個(gè)答案所花費(fèi)的時(shí)間(通過軟件應(yīng)用程序69使用內(nèi)部計(jì)時(shí)器(未示出)來計(jì)算)的計(jì)時(shí)數(shù)據(jù)一起傳送到遠(yuǎn)程服務(wù)器41 (通過預(yù)先存儲(chǔ)的URL或E. 164號(hào)碼等識(shí)別)。軟件應(yīng)用程序69還可以顯示從服務(wù)器41接收回來的結(jié)果信息，該信
息指示用戶相對(duì)于參與測(cè)驗(yàn)的其它用戶做得有多好。
AMR編解碼器盡管AMR編解碼器55是眾所周知的并且由3GPP標(biāo)準(zhǔn)實(shí)體(在標(biāo)準(zhǔn)文件TS 26. 090版本3. 1. 0中)定義，現(xiàn)在仍然參考圖3給出它執(zhí)行的處理的一般描述，以便讀者可以理解隨后應(yīng)用程序軟件69所執(zhí)行的處理的描述。 AMR編解碼器55 (自適應(yīng)多速率編碼器_解碼器)以若干不同的比特率將300Hz至3. 4kHz頻帶內(nèi)的8kHz采樣數(shù)據(jù)音頻轉(zhuǎn)換成位流。編解碼器55因此非常適用于傳輸率可能需要變化的情形。它的輸出比特率可以適合于匹配盛行的傳輸狀況，因?yàn)檫@個(gè)原因，所以它是3G標(biāo)準(zhǔn)并且當(dāng)前用在大多數(shù)的蜂窩電話21中。盡管比特率是可變的，但是相同的基本編碼過程由編解碼器55在所有速率下使用。量化處理，其參數(shù)的選擇會(huì)被傳輸并且傳輸?shù)乃俾时桓淖円詫?shí)現(xiàn)八個(gè)比特率或模式下的操作12. 2、10. 2、7. 95、7. 40、6. 70、5. 90、5. 15和4. 75Kbits/s。在這個(gè)實(shí)施例中使用最高比特率模式(12. 2Kbits/s)。在AMR編解碼器55中存在四個(gè)主要部件子系統(tǒng)，下面對(duì)它們進(jìn)行描述。它們是
音調(diào)預(yù)測(cè)
LPC分析
固定碼簿查找
自適應(yīng)碼簿 AMR編解碼器55按順序應(yīng)用它們，盡管對(duì)于當(dāng)前的目的而言，更容易的是最后處理音調(diào)預(yù)測(cè)并作為自適應(yīng)碼簿處理的一部分。AMR編解碼器55建立在碼簿激發(fā)線性預(yù)測(cè)(CELP)編碼系統(tǒng)周圍。輸入的音頻信號(hào)被分成160個(gè)樣本幀(f)，并且?guī)?jīng)歷線性預(yù)測(cè)分析以每幀提取少量系數(shù)用于編碼和傳輸。這些系數(shù)表征了信號(hào)在幀內(nèi)的短期頻譜。除了這些系數(shù)之外，AMR編解碼器55還計(jì)算LPC剩余(也被稱為激發(fā))，其使用音調(diào)預(yù)測(cè)器所輔助的自適應(yīng)和固定碼簿進(jìn)行編碼。下面描述這些子系統(tǒng)。
LPC分析
9
LPC分析由圖3a所示的LPC分析部件71執(zhí)行。LPC假定了語音產(chǎn)生的經(jīng)典源濾波器模型(圖3b所示)，其中，語音被認(rèn)為是緩慢時(shí)變?yōu)V波器(LPC合成濾波器72)的輸出，由用于諸如元音中的有聲語音的規(guī)則聲門脈沖和用于例如/sh/的無聲語音的白噪聲或者用于像/z/的混合發(fā)聲聲音的這兩者的混合所激發(fā)(用激發(fā)塊74表示)。盡管基于語音產(chǎn)生的模型，但是還提供了用于對(duì)所有聲音進(jìn)行編碼的有效模型。合成濾波器72假定為全極點(diǎn)，亦即它僅具有諧振。這個(gè)假定是LPC分析方法的基礎(chǔ)。在采樣數(shù)據(jù)(z平面)表示法中，它表明在傳遞函數(shù)H(z)的分母中，傳遞函數(shù)純粹是z—1的多項(xiàng)式。<formula>formula see original document page 10</formula> 這個(gè)濾波器對(duì)輸入激發(fā)en的時(shí)間序列響應(yīng)sn于是為
s，, = eK+ S & 5"—: (2) 這就是說系統(tǒng)的輸出sn是輸入en加上p個(gè)以前輸出的加權(quán)線性之和。這是LPC的理論基礎(chǔ)。限度p是LPC的"階"，其通常是固定的并且在AMR編解碼器55中p等于10。在AMR編解碼器55(以及其它基于LPC的系統(tǒng))中，使用線性預(yù)測(cè)分析為輸入音頻的每個(gè)幀估計(jì)濾波權(quán)重或系數(shù)A —旦被估計(jì)，它們?nèi)缓缶捅晦D(zhuǎn)換成適合于量化和傳輸?shù)男问健?br> 有效地估計(jì)系數(shù)ai需要進(jìn)行逼近和假定。求解系數(shù)的所有方法都旨在7使en在上述方程(2)中的貢獻(xiàn)最小化。AMR編解碼器55使用自相關(guān)方法，這意味著求解p個(gè)聯(lián)立
線性方程；以矩陣的形式
<formula>formula see original document page 10</formula> 或者以更簡(jiǎn)略的形式
Ru ai = & (4) R的元素rij是用于延遲|i-j|下的輸入音頻信號(hào)的自相關(guān)值。因?yàn)镽是對(duì)稱的并且每個(gè)對(duì)角線的所有元素都相等，所以它對(duì)用于求逆矩陣的快速遞歸方法開放。在AMR編碼器55中使用萊文森_德賓算法。
線狀譜頻率系數(shù)ai實(shí)際上不容易量化。它們隨時(shí)間相當(dāng)不可預(yù)測(cè)地變化，并且具有未確定范圍之上的正負(fù)值。AMR編解碼器55因此使用LSF確定部件73來將這些系數(shù)在量化之前轉(zhuǎn)換成線狀譜頻率，這去除了這些缺點(diǎn)并且允許LPC系數(shù)的有效編碼。系數(shù)ai是全極點(diǎn)合成濾波器72的權(quán)重，并且是第p階z—1多項(xiàng)式的系數(shù)，其可以進(jìn)行因式分解以求根。這些根是合成濾波器72中的諧振或極點(diǎn)。這些極點(diǎn)常常被量化以便在它們被合理排序時(shí)傳輸，具有平均值，并且從幀到幀更加可預(yù)測(cè)地變化，這給機(jī)會(huì)以節(jié)省位，其沒有編碼a,。線狀譜頻率(LSF)對(duì)這甚至比極點(diǎn)更好。重要的是要認(rèn)識(shí)到LSF不與全極點(diǎn)模型的極點(diǎn)相同，但是它們相關(guān)。它們的導(dǎo)數(shù)是相關(guān)的，但是定性地涉及選擇合成濾波器的特殊表示中的兩組邊界條件，一個(gè)邊界條件對(duì)應(yīng)于當(dāng)聲門完全開放時(shí)，另一個(gè)對(duì)應(yīng)于當(dāng)聲門完全關(guān)閉時(shí)。這導(dǎo)致兩組具有零帶寬的假設(shè)極點(diǎn)，亦即完全諧振器。
LSF的主要優(yōu)點(diǎn)在于
LSF僅包括下述頻率，它們的帶寬總是零(盡管有極點(diǎn)兩倍多的LSF)
LSF理論上比極點(diǎn)更好排序 LSF因此服從非常低的比特率編碼。特別地，如圖3a所示，每個(gè)LSF的平均值(事先計(jì)算并存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器75中)可以由平均值減法部件77減去。進(jìn)一步，因?yàn)樽鳛榻Y(jié)果的增量(delta) LSF不隨時(shí)間迅速變化，所以預(yù)測(cè)器79然后可以用于預(yù)測(cè)當(dāng)前的增量值，其由預(yù)測(cè)減法部件81從實(shí)際增量中減去。作為結(jié)果的數(shù)據(jù)然后由矢量量化(VQ)部件83另外編碼，該VQ部件83經(jīng)由單個(gè)索引一次性編碼兩個(gè)值，導(dǎo)致在某些情況下小于每值1位。AMR編解碼器55輸出如此獲得的VQ索引值用于當(dāng)前幀作為編碼的LPC數(shù)據(jù)，以便傳輸?shù)交?5。 LP激發(fā) 如上所述，AMR編解碼器55還編碼圖3b所示的模型的激發(fā)部分74。為了做到這一點(diǎn)，AMR編解碼器55生成激發(fā)信號(hào)的表示，以便它然后可以進(jìn)行編碼。如圖3c所示，通過生成"逆"LPC濾波器76來做到這一點(diǎn)，該"逆"LPC濾波器76可以通過對(duì)輸入的音頻信號(hào)進(jìn)行濾波來生成激發(fā)信號(hào)。從逆濾波器76獲得的激發(fā)信號(hào)有時(shí)也被稱為剩余。這個(gè)逆LPC濾波器76實(shí)際上從上面確定的相同系數(shù)&來定義，但是使用它們來定義具有下述傳遞函數(shù)的全零點(diǎn)模型 <formula>formula see original document page 11</formula>
這在時(shí)域中對(duì)應(yīng)于下述濾波器 <formula>formula see original document page 11</formula> (6)所定義的逆LPC濾波器76包括抵消(2)所定義的全極點(diǎn)合成濾波器72中的極點(diǎn)的零點(diǎn)。理論上，如果使用逆濾波器76對(duì)輸入的音頻信號(hào)進(jìn)行濾波，然后通過合成濾波器72對(duì)生成的激發(fā)信號(hào)進(jìn)行濾波，那么我們就得回了輸入的音頻信號(hào)(因此有名稱"逆"LPC濾波器)。重要的是要注意，原始音頻信號(hào)不需要是語音以進(jìn)行完全重構(gòu)。如果LPC分析在表示輸入的音頻信號(hào)方面尚未做出好的工作，那么在剩余中會(huì)有更多信息。
對(duì)激發(fā)信號(hào)進(jìn)行編碼是AMR編解碼器55中的固定碼簿部件87和自適應(yīng)碼簿部件89的工作。當(dāng)與用于對(duì)LSF進(jìn)行編碼的位的數(shù)目相比較時(shí)，在AMR編解碼器55中使用比較大量的位以對(duì)激發(fā)進(jìn)行編碼在12. 2Kbits/s模式下每幀244位中的206個(gè)(84% )，在4. 75Kbits/s模式下為95中的72個(gè)(74% )。位的這種使用允許AMR編解碼器55以某種效果對(duì)非語音信號(hào)進(jìn)行編碼。有聲語音中的激發(fā)通過一系列聲音音調(diào)(在正常語音中對(duì)于成年男性為大約100Hz至130Hz，對(duì)于女性和小孩為兩倍)下的點(diǎn)擊(脈沖)來表征。在無聲語音中為白噪聲(或多或少)。在混合語音中是混合物。思考激發(fā)作為剩余的一種方式是認(rèn)識(shí)到LPC分析在音頻的短期頻譜中取出凸起，留下具有平坦得多的頻譜的剩余。這適用于無論什么是輸入信號(hào)。在AMR編解碼器55中，激發(fā)信號(hào)被編碼為固定碼簿和自適應(yīng)碼簿輸出的組合。自適應(yīng)碼簿并不作為任何東西存在以供查找，而只是在音調(diào)預(yù)測(cè)器所預(yù)測(cè)的時(shí)期反饋的組合碼簿輸出的以前組合的副本。
固定碼簿固定碼簿部件87通過以下生成用于當(dāng)前幀的激發(fā)信號(hào)(ef):使用用于當(dāng)前幀的從LPC分析部件71輸出的LPC系數(shù)ai，以設(shè)置上面的方程(6)中所定義的逆濾波器76的權(quán)重；并且使用這個(gè)濾波器對(duì)輸入音頻的當(dāng)前幀進(jìn)行濾波。固定碼簿部件然后識(shí)別固定碼簿脈沖或模式(存儲(chǔ)在固定碼簿88中)，其最佳迎合發(fā)生在激發(fā)信號(hào)中的新事物，這將會(huì)有效地修改來自自適應(yīng)碼簿部件89的以前幀的激發(fā)的滯后(延遲)副本。
每個(gè)幀再分成4個(gè)子幀，其中的每一個(gè)具有獨(dú)立編碼的固定碼簿輸出。用于一個(gè)子幀的固定碼簿激發(fā)將激發(fā)編碼為成對(duì)單一振幅脈沖的一系列5交錯(cuò)鏈。針對(duì)MR122(AMR的12. 2kb/s模式的名稱)在下面的表格中示出每對(duì)脈沖的可能位置。如上面指示的那樣，
這種編碼使用了顯著數(shù)目的位。
軌道脈沖位置
10，50，5，10，15，20，25，30，35
21，61，6，11，16，21，26，31，36
32，72，7，12，17，22，27，32，37
43，83，8，13，19，23，28，33，38
54，94，9，14，19，24，29，34，39 每個(gè)軌道中的第一個(gè)脈沖的符號(hào)也被編碼；第二個(gè)脈沖的符號(hào)相同，除非當(dāng)相反時(shí)它在軌道中更早下降。用于子幀的增益也被編碼。
自適應(yīng)碼簿自適應(yīng)碼簿是組合激發(fā)的以前部分的時(shí)間延遲副本，并且在編碼有聲語音中是重要的。因?yàn)橛新曊Z音是有規(guī)則的，所以可以使用固定碼簿輸出僅對(duì)當(dāng)前音調(diào)周期和以前音調(diào)周期之間的差進(jìn)行編碼。當(dāng)添加到以前聲音周期的保存副本時(shí)，我們得到這個(gè)幀的激發(fā)的估計(jì)。不傳輸自適應(yīng)碼簿；編碼器和解碼器根據(jù)以前組合輸出和當(dāng)前音調(diào)延遲來計(jì)算自適應(yīng)碼簿。音調(diào)預(yù)測(cè)器音調(diào)預(yù)測(cè)器(其形成自適應(yīng)碼簿部件89的一部分)的目的是要確定用于自適應(yīng)碼簿的最佳延遲。它是兩階段過程。第一個(gè)階段是單向開環(huán)音調(diào)預(yù)測(cè)，將語音與以前的樣本相關(guān)聯(lián)，以找到有聲周期的估計(jì)(如果語音有聲的話)或者使誤差測(cè)量最小化的最佳重復(fù)率。這之后是重復(fù)的閉環(huán)預(yù)測(cè)，以在1/6的樣本之內(nèi)得到用于自適應(yīng)碼簿的最佳延遲。因?yàn)檫@個(gè)原因，語音預(yù)測(cè)是編碼器中的自適應(yīng)碼簿過程的一部分。計(jì)算受兩階段方法的限制，因?yàn)榈诙€(gè)更加詳細(xì)的搜索僅在少量樣本之上發(fā)生。AMR編解碼器55使用通過合成方法進(jìn)行的分析，以便通過使針對(duì)候選延遲的輸出和輸入語音之間的均方差最小化來選擇最佳延遲。
12
因此，為了表示用于當(dāng)前幀的激發(fā)信號(hào)，AMR編解碼器55輸出為當(dāng)前幀確定的固定碼簿索引(每個(gè)子幀一個(gè))、固定碼簿增益、自適應(yīng)碼簿延遲和自適應(yīng)碼簿增益。這個(gè)數(shù)據(jù)和LPC編碼的數(shù)據(jù)可用于在蜂窩電話21上運(yùn)行的應(yīng)用程序軟件69，并且從中隱藏的數(shù)據(jù)必須被恢復(fù)。數(shù)據(jù)隱藏和恢復(fù) 存在其中可以將數(shù)據(jù)F(t)隱藏在音頻信號(hào)之內(nèi)的各種方式，并且對(duì)于將數(shù)據(jù)隱藏在音頻中的不同技術(shù)的詳細(xì)討論，讀者可以參考Bender的論文"Techniques For DataHiding", IBM Systems Journal, Vol 35，no 384,1996。在當(dāng)前的實(shí)施例中，通過將回波添加到音頻來將數(shù)據(jù)隱藏在音頻中，其中回波的時(shí)間延遲被改變以對(duì)數(shù)據(jù)進(jìn)行編碼。例如通過使用簡(jiǎn)單的沒有回波對(duì)應(yīng)于二進(jìn)制0并且有回波對(duì)應(yīng)于二進(jìn)制1的方案來執(zhí)行這種改變。代替地，二進(jìn)制l可以通過在第一延遲添加回波來表示，并且二進(jìn)制O可以通過在不同的第二延遲添加回波來表示。回波的符號(hào)還可以隨著要被隱藏的數(shù)據(jù)而變化。在更加復(fù)雜的編碼方案中，二進(jìn)制1可以通過回波的第一組合或序列(同時(shí)有兩個(gè)或更多回波或者連續(xù)施加)來表示，并且二進(jìn)制0可以通過不同的回波第二組合或序列來表示。
在這個(gè)實(shí)施例中，回波可以添加有0. 75ms和1. 00ms的延遲，并且二進(jìn)制1通過為音頻(通常對(duì)應(yīng)于幾個(gè)AMR幀)的第一部分添加衰減的0.75ms回波繼之以在音頻的第二部分中添加衰減的1. 00ms回波來表示；并且二進(jìn)制0通過為音頻的第一部分添加衰減的l.OOms回波繼之以在音頻的第二部分中添加衰減的O. 75ms回波來表示。因此，為了恢復(fù)隱藏的數(shù)據(jù)，軟件應(yīng)用程序不得不處理來自AMR編解碼器55的編碼輸出，以識(shí)別音頻中接收的回波序列并從而識(shí)別音頻中隱藏的數(shù)據(jù)。通常，通過以下在音頻信號(hào)中識(shí)別回波執(zhí)行音頻樣本的自相關(guān)，以及識(shí)別對(duì)應(yīng)于任何回波的峰值。然而，如上所述，隱藏的數(shù)據(jù)將要從AMR編解碼器55的輸出中恢復(fù)。
數(shù)據(jù)恢復(fù)1 圖4圖示了其中回波可以被檢測(cè)并且隱藏的數(shù)據(jù)F(t)由應(yīng)用程序軟件69從AMR編解碼器55的輸出中恢復(fù)的一種方式。如所示，在這種技術(shù)中，應(yīng)用程序軟件單獨(dú)地從圖3所示的VQ部件83所輸出的LPC編碼信息中恢復(fù)隱藏的數(shù)據(jù)。如圖4所示，應(yīng)用程序軟件69所執(zhí)行的第一個(gè)處理由VQ部件91執(zhí)行，該VQ部件91反轉(zhuǎn)AMR編解碼器55所執(zhí)行的矢量量化。VQ部件91的輸出然后由預(yù)測(cè)加法部件93處理，該預(yù)測(cè)加法部件93將LSF增量預(yù)測(cè)(由預(yù)測(cè)器95確定)添加到來自VQ部件91的輸出。LSF平均值(從數(shù)據(jù)存儲(chǔ)器97獲得)然后被平均值加法部件99加回，以恢復(fù)用于當(dāng)前幀的LSF。 LSF然后被LSF轉(zhuǎn)換部件101轉(zhuǎn)換回到LPC系數(shù)。由于在其它AMR處理階段中執(zhí)行的逼近和量化，如此確定的系數(shù)Si不會(huì)確切地與圖3中的LPC分析部件71所確定的系數(shù)相同。如所示，在這個(gè)實(shí)施例中，確定的LPC系數(shù)^用于根據(jù)上述方程(2)配置LPC合成濾波器103。通過向如此配置的濾波器103施加脈沖(由脈沖發(fā)生器105生成)，于是獲得這個(gè)合成濾波器103的脈沖響應(yīng)(h(n))。發(fā)明人發(fā)現(xiàn)回波存在于這個(gè)脈沖響應(yīng)(h(n))之內(nèi)并且可以從對(duì)應(yīng)于回波延遲的滯后周圍的脈沖響應(yīng)的自相關(guān)中找到。如所示，自相關(guān)部件107對(duì)在數(shù)據(jù)存儲(chǔ)器108中識(shí)別的滯后執(zhí)行這些自相關(guān)計(jì)算。圖5圖示了對(duì)于所有正滯后獲得的自相關(guān)。曲線圖將滯后識(shí)別為在零滯后處來自主峰值108的樣本。所以使用8kHz的采樣率，每個(gè)樣本對(duì)應(yīng)于O. 125ms的滯后。如所示，在零滯后處存在初始峰值108，繼之以在大約1. 00ms的滯后處的峰值110(對(duì)應(yīng)于離原點(diǎn)8個(gè)樣本)——表明當(dāng)前幀具有1. 00ms回波。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，不需要針對(duì)所有回波都計(jì)算自相關(guān)——只需針對(duì)對(duì)應(yīng)于回波會(huì)被發(fā)現(xiàn)的那些地方的滯后周圍(亦即在0. 75ms和1. 00ms周圍)進(jìn)行計(jì)算。如圖4所示，自相關(guān)部件107所確定的自相關(guān)值被傳遞到回波識(shí)別部件109，該回波識(shí)別部件109確定在當(dāng)前幀中是否存在任何回波(例如通過用適當(dāng)?shù)拈撝祵?duì)自相關(guān)值進(jìn)行設(shè)限來識(shí)別相關(guān)滯后處的任何峰值)。識(shí)別的峰值然后被傳遞到數(shù)據(jù)恢復(fù)部件111，該數(shù)據(jù)恢復(fù)部件111跟蹤相鄰幀之上的識(shí)別的回波序列，以檢測(cè)隱藏?cái)?shù)據(jù)F(t)的二進(jìn)制1或二進(jìn)制O的存在。用這種方式，隱藏的數(shù)據(jù)被恢復(fù)，并且然后可以用于以上述方式控制應(yīng)用程序軟件69的操作。發(fā)明人發(fā)現(xiàn)以這種方式恢復(fù)隱藏?cái)?shù)據(jù)的計(jì)算需求顯著小于直接從數(shù)字化的音頻
樣本中恢復(fù)隱藏?cái)?shù)據(jù)的計(jì)算需求。數(shù)據(jù)恢復(fù)2 在上述實(shí)施例中，LPC合成濾波器的脈沖響應(yīng)的自相關(guān)被確定，并且從中確定回波的存在以恢復(fù)隱藏的數(shù)據(jù)。圖6圖示了可以根據(jù)用于恢復(fù)隱藏的數(shù)據(jù)的替代技術(shù)來執(zhí)行的處理。如通過比較圖4和6可以看到的那樣，這個(gè)實(shí)施例和第一個(gè)實(shí)施例之間的主要差別在于，重新生成的用于當(dāng)前幀的LPC系數(shù)&被直接傳遞到自相關(guān)部件107，該自相關(guān)部件107計(jì)算LPC系數(shù)序列的自相關(guān)。這個(gè)實(shí)施例因此是第一個(gè)實(shí)施例的簡(jiǎn)化。然而，在回波滯后處輸出的自相關(guān)中的峰值并不如同在第一個(gè)實(shí)施例中宣稱的那樣，所以因?yàn)檫@個(gè)原因，這個(gè)較簡(jiǎn)單的實(shí)施例在足夠的處理能力可用的情況下不是優(yōu)選的。
數(shù)據(jù)恢復(fù)3 圖7圖示了可以在第三技術(shù)中執(zhí)行的處理，該第三技術(shù)用于識(shí)別回波的存在以及隨后恢復(fù)隱藏的數(shù)據(jù)。如通過比較圖6和7可以看到的那樣，這個(gè)實(shí)施例和第二個(gè)實(shí)施例之間的主要差別在于，重新生成的用于當(dāng)前幀的LPC系數(shù)Si被施加到逆萊文森-德賓部件114，該逆萊文森_德賓部件114使用逆萊文森_德賓算法以從LPC系數(shù)中重新計(jì)算上述方程(3)的自相關(guān)矩陣Rij。所確定的值對(duì)應(yīng)于輸入的音頻信號(hào)自身的自相關(guān)值，并因此會(huì)包括與所述或每個(gè)回波的延遲相對(duì)應(yīng)的滯后處的峰值。來自逆萊文森-德賓部件114的輸出因此可以像以前一樣處理，以恢復(fù)隱藏的數(shù)據(jù)。這個(gè)實(shí)施例的主要缺點(diǎn)在于，逆萊文森-德賓算法在計(jì)算方面比較密集，所以在只有有限處理能力的情況下，這個(gè)實(shí)施例不是優(yōu)選的。
數(shù)據(jù)恢復(fù)4 在上述三個(gè)實(shí)施例中，通過處理從AMR編解碼器55輸出的編碼LPC濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)。AMR編解碼器55會(huì)對(duì)LPC濾波數(shù)據(jù)中的回波進(jìn)行編碼，只要回波延遲小于LPC濾波器的長(zhǎng)度。如上所述，LPC濾波器具有十量級(jí)(p)的樣本。使用8kHz的采樣頻率，這對(duì)應(yīng)于1. 25ms的最大延遲。如果添加具有較長(zhǎng)延遲的回波，則它不能被編碼到LPC系數(shù)中。然而它會(huì)被編碼在剩余或激發(fā)信號(hào)之內(nèi)。為了說明這一點(diǎn)，將會(huì)描述其中使用2ms和10ms回波將二進(jìn)制1和0編碼在音頻中的實(shí)施例。圖8圖示了在這個(gè)實(shí)施例中由應(yīng)用程序軟件69執(zhí)行以恢復(fù)隱藏?cái)?shù)據(jù)的處理。如所示，在這個(gè)實(shí)施例中，應(yīng)用程序軟件69接收用于每個(gè)幀的當(dāng)它由AMR編解碼器55輸出時(shí)的激發(fā)編碼數(shù)據(jù)。接收到的數(shù)據(jù)中的固定碼簿索引由固定碼簿部件121使用，以從固定碼簿123中識(shí)別用于當(dāng)前幀的激發(fā)脈沖。這些激發(fā)脈沖然后由從AMR編解碼器55接收的編碼數(shù)據(jù)中定義的相應(yīng)固定增益放大。放大的激發(fā)脈沖然后被施加到加法器127，在那里它們被添加到通過將以前幀的激發(fā)脈沖傳遞通過增益129和自適應(yīng)碼簿延遲131而獲得的以前激發(fā)脈沖的適當(dāng)放大和延遲的版本。在從AMR編解碼器55接收的編碼數(shù)據(jù)中定義所使用的自適應(yīng)碼簿增益和延遲。來自加法器127的輸出是用于當(dāng)前幀的剩余或激發(fā)信號(hào)的脈沖表示。如圖8所示，激發(fā)信號(hào)的這個(gè)脈沖表示(e》然后被傳遞到自相關(guān)部件107，該自相關(guān)部件107計(jì)算在滯后數(shù)據(jù)存儲(chǔ)器108中定義的不同滯后的自相關(guān)。圖9圖示了當(dāng)在接收到的音頻中存在2ms回波時(shí)針對(duì)所有正滯后從自相關(guān)部件107輸出的自相關(guān)。如所示，存在零滯后處的主峰值132和對(duì)應(yīng)于2ms的滯后處的另一個(gè)峰值134。因此，自相關(guān)部件107的輸出可以像以前一樣由回波識(shí)別部件109和數(shù)據(jù)恢復(fù)部件111處理以恢復(fù)隱藏的數(shù)據(jù)F(t)。
改進(jìn) 現(xiàn)在參考圖10、 11和12對(duì)上述實(shí)施例進(jìn)行若干改進(jìn)。進(jìn)行這些改進(jìn)以增加隱藏?cái)?shù)據(jù)的成功恢復(fù)，并且旨在抗擊可能掩蓋回波存在的語音或房間聲音的影響。這些改進(jìn)將被施加到上述第一實(shí)施例，但是它們同樣可以很好地適用于其它實(shí)施例。
如通過比較圖4和IO可以看到的那樣，在第一個(gè)改進(jìn)中，用于當(dāng)前幀的LPC合成濾波器103的脈沖響應(yīng)(h(n))由高通濾波器151進(jìn)行濾波，以減少脈沖響應(yīng)中的較低頻率的影響。發(fā)明人發(fā)現(xiàn)回波信息通常被編碼到脈沖響應(yīng)的較高頻帶中。這種高通濾波因此改善了用于回波的自相關(guān)峰值的銳度，使得更容易識(shí)別它們的存在。高通濾波器151優(yōu)選地過濾掉大約2kHz以下的頻率(對(duì)應(yīng)于采樣頻率四分之一的頻率)，盡管通過僅過濾掉大約lkHz以下的頻率仍然可以進(jìn)行某種增益。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，這種濾波是過濾掉脈沖響應(yīng)低頻部分的幀"內(nèi)"濾波(亦即僅在幀內(nèi)進(jìn)行濾波)，盡管還可以執(zhí)行幀"間"濾波(例如過濾掉發(fā)生在幀之間的脈沖響應(yīng)的緩慢變化特征)。圖11圖示了實(shí)現(xiàn)相同結(jié)果的替換方式。具體地，在這個(gè)實(shí)施例中，用于當(dāng)前幀的LPC系數(shù)Sj在用于配置LPC合成濾波器103之前被傳遞通過高通濾波器153。在這種情況下，高通濾波器153去除了與合成濾波器103的較低頻率極點(diǎn)相對(duì)應(yīng)的系數(shù)。這通過對(duì)LPC系數(shù)進(jìn)行因式分解以識(shí)別極點(diǎn)頻率和帶寬來實(shí)現(xiàn)。在下限以下的頻率處的極點(diǎn)被丟棄，并且剩下的極點(diǎn)用于生成只有較高頻率的合成濾波器103。其余的處理跟以前一樣，并且進(jìn)一步的描述將不再給出。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，這種濾波也是幀內(nèi)濾波，盡管還可以執(zhí)行幀間濾波。圖12圖示了可以被應(yīng)用以增加恢復(fù)隱藏?cái)?shù)據(jù)的成功率的進(jìn)一步改進(jìn)。如所示，這個(gè)實(shí)施例和圖4所示的實(shí)施例之間的主要差別在于提供了高通濾波器155，用于執(zhí)行幀間濾波以過濾掉通常由音頻自身和用戶的蜂窩電話21位于其中的房間的聲音造成的自相關(guān)輸出中的緩慢變化的相關(guān)性(亦即從幀到幀變化緩慢的相關(guān)性)。除了過濾掉這樣的幀間變化之外或者代替地，高通濾波器155可以執(zhí)行幀內(nèi)濾波，以從每個(gè)幀內(nèi)的自相關(guān)輸出去除低頻相關(guān)性。已發(fā)現(xiàn)這使回波造成的相關(guān)性峰值尖銳，從而使得它們更容易識(shí)別。
—般編碼方案在上述實(shí)施例中，通過添加具有不同延遲的回波而將數(shù)據(jù)隱藏在音頻信號(hào)之內(nèi)。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，存在下述各種方式，其中數(shù)據(jù)可以隱藏在音頻之內(nèi)并仍然被傳遞通過AMR編解碼器55。一般地說，可以分別用圖13和14所示的一般框圖來表示上述數(shù)據(jù)隱藏和恢復(fù)過程。如圖13所示，一般數(shù)據(jù)隱藏過程可以被認(rèn)為涉及與AMR編解碼器所執(zhí)行的類似的編碼操作161，以生成AMR參數(shù)(其可以是最終的AMR輸出參數(shù)或在 AMR處理中生成的中間參數(shù))。這些參數(shù)中的一個(gè)或多個(gè)然后取決于要被隱藏在音頻之內(nèi) 的數(shù)據(jù)而被改變163。修改的參數(shù)然后被解碼165以生成修改的音頻信號(hào)，其作為聲音信號(hào) 被傳輸并由蜂窩電話的麥克風(fēng)23接收。在進(jìn)行濾波和模擬數(shù)字轉(zhuǎn)換之后，音頻編碼器167 然后以上述方式處理數(shù)字化的音頻樣本以生成修改的參數(shù)。修改的參數(shù)然后由參數(shù)處理部件169處理，以檢測(cè)對(duì)參數(shù)做出的(一個(gè)或多個(gè))修改，并從而恢復(fù)隱藏的數(shù)據(jù)。
在將回波添加到音頻以對(duì)隱藏的數(shù)據(jù)進(jìn)行編碼的情況下，這可以以上述方式容易地進(jìn)行，而不必在電視演播室中(或數(shù)據(jù)要被隱藏在音頻之內(nèi)的任何地方)執(zhí)行詳細(xì)的編碼過程。代替地，通過操縱AMR編碼過程的輸出參數(shù)或中間參數(shù)可以添加回波。例如，通過向上述方程(3)中定義的自相關(guān)矩陣的一個(gè)或多個(gè)條目添加常數(shù)，或者通過直接操縱從 LPC分析確定的LPC系數(shù)中的一個(gè)或多個(gè)的值，可以將回波添加到音頻。
還可以通過調(diào)制音頻編碼參數(shù)的其它更多直接方式來隱藏?cái)?shù)據(jù)。例如，可以修改針對(duì)音頻生成的線狀譜頻率(例如通過用要被隱藏的數(shù)據(jù)來改變LSF的最低有效位)，或者可以根據(jù)要被隱藏的數(shù)據(jù)來修改從中確定LSF的極點(diǎn)的頻率或帶寬。代替地，可以修改激發(fā)參數(shù)來承載隱藏的數(shù)據(jù)。例如，AMR編解碼器55使用具有可變脈沖位置和符號(hào)的定義脈沖鏈的固定和自適應(yīng)碼簿來對(duì)激發(fā)信號(hào)進(jìn)行編碼。因此，通過改變軌道或子幀中的一個(gè)或多個(gè)之內(nèi)的脈沖位置的最低有效位，或者通過改變所選擇的軌道或子幀的符號(hào)，可以隱藏數(shù)據(jù)。代替施加回波以將數(shù)據(jù)隱藏在音頻中，可以取決于要被隱藏的數(shù)據(jù)而改變音頻信號(hào)的一個(gè)或多個(gè)頻率分量的相位。在固定和自適應(yīng)碼簿所編碼的脈沖的位置中，來自音頻的相位信息被保留到某種程度。因此，通過從碼簿重新生成激發(fā)脈沖并且檢測(cè)相關(guān)(一個(gè) 或多個(gè))頻率分量隨時(shí)間的相位變化，可以從AMR編解碼器55的輸出中檢測(cè)這種相位編碼。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，非常不可能的是演播室系統(tǒng)會(huì)使用實(shí)際的 AMR編碼器和解碼器模型，因?yàn)殡娨曆莶ナ抑械囊纛l質(zhì)量比AMR編解碼器55中使用的大得多。充分的演播室系統(tǒng)因此會(huì)將音頻帶分成AMR帶(在300Hz和3. 4kHz之間)和這個(gè)范圍之外的非AMR帶。然后會(huì)如上所述操縱AMR帶，但是不會(huì)使用AMR解碼器重構(gòu)AMR帶信號(hào)。相反地，會(huì)將來自從原始音頻信號(hào)獲得的實(shí)際LPC剩余的AMR帶音頻信號(hào)與修改的LPC 數(shù)據(jù)進(jìn)行合成以得到更高的音頻質(zhì)量。代替地，在用隱藏的數(shù)據(jù)修改激發(fā)參數(shù)的情況下，會(huì) 從修改的參數(shù)來構(gòu)造剩余，該修改的參數(shù)然后會(huì)由合成濾波器使用從LPC分析獲得的LPC 系數(shù)來進(jìn)行濾波。修改的AMR帶然后會(huì)被添加到非AMR帶，以便作為電視信號(hào)的一部分進(jìn) 行傳輸。在圖15和16中圖示了這種處理。具體地，圖15圖示了在原始音頻已被分成AMR帶和非AMR帶之后可以在電視演播室之內(nèi)執(zhí)行的處理。如所示，音頻AMR帶被輸入到LPC編碼器171，該LPC編碼器171執(zhí)行上述LPC分析以生成用于當(dāng)前幀的LPC系數(shù)ai。這些系數(shù)然后被傳遞到系數(shù)改變部件173，該系數(shù)改變部件173取決于要被隱藏在音頻信號(hào)之內(nèi)的數(shù)據(jù)而改變這些系數(shù)中的一個(gè)或多個(gè)。修改的LPC系數(shù)^然后被輸出以根據(jù)上面給出的方程(2)配置LPC合成濾波器175。如圖15所示，LPC編碼器171所生成的LPC系數(shù)ai用于根據(jù)上面的方程(6)配置逆LPC
16濾波器177。從中生成當(dāng)前LPC系數(shù)組的音頻幀然后被傳遞通過這個(gè)逆LPC濾波器以生成 LPC剩余(激發(fā))信號(hào)，其然后被施加到LPC合成濾波器175。這導(dǎo)致生成修改的音頻AMR 帶信號(hào)，其然后在與視頻軌道相結(jié)合以便進(jìn)行分發(fā)之前與非AMR帶信號(hào)相結(jié)合。
圖16圖示了其中激發(fā)參數(shù)隨著要被隱藏的數(shù)據(jù)而改變的替換場(chǎng)景。具體地，如圖 16所示，音頻AMR帶初始由LPC編碼器171處理，該LPC編碼器171在這個(gè)實(shí)施例中生成并輸出表示剩余或激發(fā)信號(hào)的固定和自適應(yīng)碼簿數(shù)據(jù)。這個(gè)碼簿數(shù)據(jù)然后被傳遞通過改變部件181，該改變部件181改變碼簿數(shù)據(jù)，以便根據(jù)要被隱藏在音頻信號(hào)之內(nèi)的數(shù)據(jù)而改變固定碼簿數(shù)據(jù)所表示的一個(gè)或多個(gè)脈沖的位置和/或符號(hào)。修改的碼簿數(shù)據(jù)然后被輸出到剩余發(fā)生器183，該剩余發(fā)生器183重新生成相應(yīng)的剩余信號(hào)，其在由AMR編解碼器55處理時(shí)會(huì)重新生成修改的固定和自適應(yīng)碼簿數(shù)據(jù)。這例如可以通過以下實(shí)現(xiàn)執(zhí)行迭代程序以適配起動(dòng)剩余，直到對(duì)它的編碼導(dǎo)致改變部件181所輸出的修改的碼簿數(shù)據(jù)。代替地，修改的碼簿數(shù)據(jù)可以用于生成直接用作剩余信號(hào)的脈沖鏈。脈沖之間的間隙可以填充以可以使用用于當(dāng)前幀的LPC系數(shù)和逆LPC濾波器生成的剩余信號(hào)的一部分或噪聲。不管所使用的技術(shù)，如此生成的剩余信號(hào)然后被傳遞到LPC合成濾波器175，該LPC合成濾波器175使用 LPC編碼器171所生成的LPC系數(shù)進(jìn)行配置。LPC合成濾波器175然后對(duì)施加的剩余信號(hào) 進(jìn)行濾波以生成修改的音頻AMR帶，其然后與非AMR帶相結(jié)合以重新生成用于與視頻軌道
相結(jié)合的音頻。
音頻識(shí)別在上述實(shí)施例中，數(shù)據(jù)隱藏在電視節(jié)目的音頻之內(nèi)，并且通過蜂窩電話中的適當(dāng) 處理來恢復(fù)這個(gè)數(shù)據(jù)。為了恢復(fù)隱藏的數(shù)據(jù)而執(zhí)行的處理利用了已經(jīng)由蜂窩電話的音頻編解碼器執(zhí)行的處理的至少一部分。如上所述，發(fā)明人發(fā)現(xiàn)這減少了恢復(fù)隱藏的數(shù)據(jù)所需的計(jì)算開銷。類似的優(yōu)點(diǎn)可以在下述其它應(yīng)用中獲得沒有實(shí)際的數(shù)據(jù)隱藏在音頻之內(nèi)，但是其中例如將要從音頻自身的聲音模式(指紋)中識(shí)別音頻?，F(xiàn)在參考音樂識(shí)別系統(tǒng)來描述其中可以實(shí)現(xiàn)這一點(diǎn)的方式。目前，存在若干音樂識(shí)別服務(wù)，諸如Shazam所提供的服務(wù)。這些音樂識(shí)別服務(wù)允許蜂窩電話21的用戶通過撥打號(hào)碼并將音樂播放到耳機(jī)來識(shí)別當(dāng)前播放的音樂軌道。服務(wù)然后將軌道的名稱返回到電話。在技術(shù)上，系統(tǒng)通過以下操作設(shè)立從蜂窩電話到遠(yuǎn)程服務(wù)器的電話呼叫，同時(shí)向電話播放音樂。遠(yuǎn)程服務(wù)器在預(yù)定時(shí)期之后斷開呼叫，相對(duì)于存儲(chǔ) 在數(shù)據(jù)庫中的模式對(duì)接收到的聲音執(zhí)行某種匹配以識(shí)別音樂，然后以它識(shí)別的音樂軌道的名稱的方式發(fā)送文本消息至電話。根據(jù)來自Shazam系統(tǒng)的發(fā)明人以及其它的公布材料，用于識(shí)別軌道的一般過程為 1.將原始音頻信號(hào)轉(zhuǎn)換成頻譜圖，這通常通過計(jì)算一系列重疊快速傅立葉變換 (FFT)來實(shí)現(xiàn)。 2.分析頻譜圖以確定特定特征——這些通常是能量峰值位置，通過它們的時(shí)間和頻率來表征。 3.使用這些特征的散列函數(shù)，并使用散列函數(shù)的結(jié)果來查找數(shù)據(jù)庫以確定可能匹配音頻信號(hào)的一組條目。 4.針對(duì)這些潛在的匹配執(zhí)行進(jìn)一步的模式匹配，以確定音頻信號(hào)是否真正匹配從數(shù)據(jù)庫中識(shí)別的那些中的任何一個(gè)。傳統(tǒng)上，根據(jù)對(duì)用于音頻信號(hào)的數(shù)字化音頻樣本的重疊塊進(jìn)行的一系列快速傅立葉變換來確定用于音頻的頻譜圖。當(dāng)在移動(dòng)電話網(wǎng)絡(luò)之上進(jìn)行操作時(shí)，輸入的音頻會(huì)由蜂窩電話中的AMR編解碼器壓縮以便經(jīng)由空中接口37傳輸?shù)揭苿?dòng)電話網(wǎng)絡(luò)35，在那里壓縮的音頻被解壓縮以重新生成數(shù)字音頻樣本。服務(wù)器然后對(duì)數(shù)字音頻樣本執(zhí)行傅立葉變換分析以生成用于音頻信號(hào)的頻譜圖。發(fā)明人已認(rèn)識(shí)到，移動(dòng)電話系統(tǒng)所執(zhí)行的這種編碼和解碼然后還有Shazam服務(wù) 器所執(zhí)行的隨后的頻率分析是浪費(fèi)的，并且可以實(shí)施類似的系統(tǒng)而不必將壓縮的音頻解碼回到音頻樣本。用這種方式，軌道識(shí)別處理可以整個(gè)地在蜂窩電話21之內(nèi)執(zhí)行。用戶因此不必放置至遠(yuǎn)程服務(wù)器的呼叫以便能夠識(shí)別正在播放的軌道?，F(xiàn)在參考圖17來描述其中可以實(shí)現(xiàn)這一點(diǎn)的方式。具體地，圖17是圖示在蜂窩電話21上運(yùn)行的軌道識(shí)別軟件應(yīng)用程序(未示出) 所執(zhí)行的處理的框圖。如所示，在這個(gè)實(shí)施例中，軟件應(yīng)用程序從AMR編解碼器55接收AMR 編碼LPC數(shù)據(jù)和AMR編碼激發(fā)數(shù)據(jù)。AMR LPC編碼數(shù)據(jù)然后像以前一樣被傳遞到VQ部件 91、預(yù)測(cè)加法部件93、平均值加法部件99和LSF轉(zhuǎn)換部件101。這種處理的結(jié)果是重新生成的LPC系數(shù)&。用于當(dāng)前幀的LPC系數(shù)然后被傳遞到計(jì)算它們的快速傅立葉變換的FFT部件201。類似地，AMR編碼激發(fā)數(shù)據(jù)由固定碼簿部件121 、固定增益125、加法器127、自適應(yīng) 碼簿延遲121和自適應(yīng)增益129進(jìn)行解碼，以重新生成表示用于輸入幀的剩余的激發(fā)脈沖。這些解碼的脈沖然后被輸入到FFT部件203以生成激發(fā)脈沖的傅立葉變換。如圖17所示，來自兩個(gè)FFT部件201和203的輸出由乘法器205乘在一起，以生成用于當(dāng)前幀的組合頻率表示。乘法器205所輸出的這種組合頻率表示應(yīng)當(dāng)近似對(duì)應(yīng)于當(dāng)前幀之內(nèi)的數(shù)字音頻樣本的FFT。這是因?yàn)锳MR編解碼器55所執(zhí)行的LPC分析之下的源濾波器模型。具體地，如上所述，LPC分析假定語音通過以下生成通過合成濾波器對(duì)適當(dāng)?shù)募ぐl(fā)信號(hào)進(jìn)行濾波。換言之，音頻通過以下生成使激發(fā)信號(hào)與合成濾波器的脈沖響應(yīng)進(jìn)行巻積，或者在頻域中，使激發(fā)信號(hào)的頻譜與LPC合成濾波器的頻譜相乘。在當(dāng)前實(shí)施例中，LPC系數(shù)的頻譜與碼簿激發(fā)脈沖的頻譜相乘。這些是分別對(duì)LPC 合成濾波器的頻譜和激發(fā)信號(hào)的頻譜的逼近。因此，從乘法器205輸出的組合頻譜會(huì)是當(dāng) 前幀之內(nèi)的數(shù)字化音頻信號(hào)的頻譜的逼近。如圖17所示，這個(gè)頻譜然后被輸入到頻譜圖生成部件207，該頻譜圖生成部件207從接收到的頻譜中生成用于輸入的音頻信號(hào)的相鄰幀的頻譜圖。如此生成的頻譜圖然后被傳遞到模式匹配部件209，在那里使用來自頻譜圖的特定特征來搜索存儲(chǔ)在模式數(shù)據(jù)庫211之內(nèi)的模式，以識(shí)別蜂窩電話的麥克風(fēng)23所拾取的音頻軌道。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，這種模式匹配可以使用與Shazam系統(tǒng)的服務(wù)器中使用的那些類似的處理技術(shù)，亦即首先使用散列函數(shù)來識(shí)別模式數(shù)據(jù)庫211的一部分以與音頻的頻譜圖相匹配。模式匹配部件209所輸出的識(shí)別的軌道信息然后被輸出用于在顯示器29上向用戶顯示。發(fā)明人發(fā)現(xiàn)與將壓縮的音頻數(shù)據(jù)轉(zhuǎn)換回到數(shù)字化音頻樣本然后對(duì)音頻樣本采取快速傅立葉變換相比，這種處理需要顯著更少的計(jì)算。事實(shí)上，發(fā)明人發(fā)現(xiàn)與對(duì)原始音頻樣本采取快速傅立葉變換相比，這種處理需要更少的處理。這是因?yàn)閷?duì)LPC系數(shù)采取快速傅
18立葉變換比較簡(jiǎn)單，因?yàn)槊繋挥?0個(gè)系數(shù)；而且對(duì)碼簿激發(fā)脈沖的快速傅立葉變換也比較直接，因?yàn)楹?jiǎn)單地通過區(qū)別脈沖位置或者使它們?cè)诓檎冶碇蓄A(yù)先計(jì)算(因?yàn)榇嬖谟邢迶?shù) 目的碼簿所定義的脈沖位置)，可以將脈沖位置系數(shù)轉(zhuǎn)換到頻域中。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，由于所進(jìn)行的逼近，以這種方式獲得的作為結(jié)果的頻譜圖無法與從音頻樣本的FFT導(dǎo)出的頻譜圖直接相比較。然而，該頻譜圖攜帶了足夠的并且與傳統(tǒng)頻譜圖類似的信息，所以可以使用相同或相似的模式匹配技術(shù)用于音頻識(shí)別。為了最佳結(jié)果，存儲(chǔ)在數(shù)據(jù)庫211中的模式信息優(yōu)選地從以類似方式獲得的頻譜圖中生成(亦即根據(jù)AMR編解碼器輸出，而不是使用從音頻樣本中直接生成的那些頻譜圖)。修改和進(jìn)一步替換上面已描述了說明下述方式的若干實(shí)施例蜂窩電話中的音頻編解碼器可以用于減少電話的其它部分所執(zhí)行的隨后處理，以便恢復(fù)隱藏的信息或者識(shí)別輸入的音頻片段。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，可以對(duì)上述實(shí)施例進(jìn)行各種修改和改進(jìn)，并且現(xiàn)在來描述這些修改中的一些修改。在上述音頻識(shí)別實(shí)施例中，所有的模式數(shù)據(jù)庫211都存儲(chǔ)在蜂窩電話21之內(nèi)。在替換實(shí)施例中，模式匹配部件209可以布置成根據(jù)為音頻生成的頻譜圖的特定特征生成散列函數(shù)，并且這個(gè)散列函數(shù)的結(jié)果然后可以被傳輸?shù)竭h(yuǎn)程服務(wù)器，該遠(yuǎn)程服務(wù)器下載將要與音頻的頻譜圖相匹配的適當(dāng)模式信息。以這種方式，必須存儲(chǔ)在蜂窩電話21上的模式數(shù) 據(jù)庫211之內(nèi)的數(shù)據(jù)量可以保持到最小，同時(shí)僅引入了在用于從遠(yuǎn)程數(shù)據(jù)庫中檢索所選擇的模式的處理中的比較小的延遲。在上述音頻識(shí)別實(shí)施例中，線狀譜頻率被轉(zhuǎn)換回到LPC系數(shù)，然后使用FFT將其轉(zhuǎn) 換到頻域中。在替換實(shí)施例中，可以直接根據(jù)線狀譜頻率或者根據(jù)從它們導(dǎo)出的極點(diǎn)來確定用于LPC數(shù)據(jù)的頻譜。這會(huì)進(jìn)一步減少執(zhí)行音頻識(shí)別所需的處理。在上述較早的實(shí)施例中，數(shù)據(jù)隱藏在音頻中并且用于將電話的操作同步到用戶所觀看的電視節(jié)目。在剛剛描述的最后實(shí)施例中，在音頻之內(nèi)沒有隱藏的數(shù)據(jù)，而是代替地，音頻的特定特征被識(shí)別并用于對(duì)音頻進(jìn)行識(shí)別。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，可以在同步實(shí)施例中使用類似的音頻識(shí)別技術(shù)。例如，在電話上運(yùn)行的軟件應(yīng)用程序可以通過識(shí)別音頻聲音軌道之內(nèi)的預(yù)定部分而將自身同步到電視節(jié)目。這種類型的同步還可以用于控制電視節(jié)目字幕的輸出。在上述較早的實(shí)施例中，通過確定合成濾波器的脈沖響應(yīng)或LPC系數(shù)的自相關(guān)值來恢復(fù)隱藏的數(shù)據(jù)。這種相關(guān)性處理不是必要的，因?yàn)榭梢酝ㄟ^直接監(jiān)視系數(shù)或脈沖響應(yīng) 來發(fā)現(xiàn)隱藏的數(shù)據(jù)。然而，自相關(guān)處理是優(yōu)選的，因?yàn)樗沟酶菀鬃R(shí)別回波。
在上述改進(jìn)中，各種高通濾波技術(shù)用于過濾掉與音頻和房間聲音相關(guān)聯(lián)的低頻成分。在優(yōu)選實(shí)施例中，在蜂窩電話中執(zhí)行這樣的高通濾波的情況下，回波信號(hào)優(yōu)選地僅被添加到(在隱藏過程期間)AMR帶的高頻部分中的音頻。例如在lkHz以上，并且優(yōu)選地僅在 2kHz以上。這例如可以通過以下實(shí)現(xiàn)對(duì)音頻信號(hào)進(jìn)行濾波以去除較低頻率AMR帶成分，然后以需要的時(shí)間延遲將濾波的輸出添加到原始音頻。這是優(yōu)選的，因?yàn)闇p少了會(huì)被蜂窩電話中執(zhí)行的高通濾波過濾掉(并因此丟失)的回波信號(hào)中的能量。在上述實(shí)施例中，已假定蜂窩電話所使用的音頻編解碼器是AMR編解碼器。然而，
19如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，上述原理和概念還適用于其它類型的音頻編解碼
器，并且尤其適用于依靠輸入音頻的線性預(yù)測(cè)分析的那些音頻編解碼器。在上述實(shí)施例中，通過蜂窩電話上運(yùn)行的軟件來執(zhí)行從音頻編解碼器輸出的壓縮
音頻數(shù)據(jù)的各種處理。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，這種處理中的一些或全部可
以由專用硬件電路執(zhí)行，盡管軟件由于其在制造之后被添加到蜂窩電話的能力以及其一旦
裝載可以被更新的能力而是優(yōu)選的。用于使蜂窩電話以上述方式操作的軟件可以作為信號(hào)
提供，或者可以提供在諸如緊致盤之類的載體或其它載體介質(zhì)上。在上述實(shí)施例中，在蜂窩電話之內(nèi)執(zhí)行處理。然而，如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，益處會(huì)適用于具有內(nèi)置音頻編解碼器的任何通信裝置。在上述早先的實(shí)施例中，數(shù)據(jù)隱藏在音頻之內(nèi)并且用于使蜂窩電話的操作與用戶
所觀看的電視秀同步。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，并且如WO 02/45273所述，存
在對(duì)于隱藏?cái)?shù)據(jù)的各種其它用途。例如，隱藏的數(shù)據(jù)可以識(shí)別用于遠(yuǎn)程位置的URL，或者可
以識(shí)別要被發(fā)送到用于說明的預(yù)先存儲(chǔ)的URL的代碼。這種隱藏的數(shù)據(jù)可以為用戶提供例
如關(guān)于電視節(jié)目的另外信息，并且/或者為用戶提供特別報(bào)價(jià)或其它目標(biāo)廣告。在上述實(shí)施例中，經(jīng)由RF通信鏈路13向用戶傳送電視節(jié)目。如本領(lǐng)域技術(shù)人員
將會(huì)意識(shí)到的那樣，可以經(jīng)由任何適當(dāng)?shù)姆职l(fā)技術(shù)如通過有線電視、因特網(wǎng)、衛(wèi)星電視等向
用戶分發(fā)電視節(jié)目。還可以從存儲(chǔ)介質(zhì)如DVD獲得并通過適當(dāng)?shù)腄VD播放器讀出。在上述實(shí)施例中，蜂窩電話拾取電視節(jié)目的音頻。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到
的那樣，在從收音機(jī)或其它揚(yáng)聲器系統(tǒng)獲得音頻的情況下也可以使用上述技術(shù)。在上述實(shí)施例中，假定在電視系統(tǒng)的電視演播室一端將數(shù)據(jù)隱藏在音頻之內(nèi)。在
替換實(shí)施例中，例如通過機(jī)頂盒可以在電視系統(tǒng)的用戶一端將數(shù)據(jù)隱藏在音頻之內(nèi)。機(jī)頂
盒可以適合于在向用戶輸出電視節(jié)目之前將適當(dāng)?shù)臄?shù)據(jù)隱藏到音頻中。在上述實(shí)施例中，軟件應(yīng)用程序處理從蜂窩電話21之內(nèi)的AMR編解碼器接收的壓
縮音頻數(shù)據(jù)。在替換實(shí)施例中，軟件應(yīng)用程序可以對(duì)經(jīng)由電話網(wǎng)絡(luò)接收的并且由RF處理單
元57提供給處理器63的壓縮音頻數(shù)據(jù)執(zhí)行類似處理。在上述實(shí)施例中，假定音頻編解碼器的輸出不包括LPC系數(shù)自身，而是包括從它們導(dǎo)出的其它參數(shù)如線狀譜頻率或LPC合成濾波器的濾波器極點(diǎn)。如本領(lǐng)域技術(shù)人員將會(huì) 意識(shí)到的那樣，如果蜂窩電話21中使用的音頻編解碼器使得由其導(dǎo)出的LPC系數(shù)可用于處理器63，那么軟件應(yīng)用程序?yàn)榱嘶謴?fù)LPC系數(shù)而執(zhí)行的初始處理就是不必要的，并且軟件應(yīng)用程序可以直接對(duì)音頻編解碼器所輸出的LPC系數(shù)進(jìn)行工作。這會(huì)進(jìn)一步減少需要的處理。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣，在上述實(shí)施例中描述的比特率、采樣率等的精確值并不是本發(fā)明的必要特征，而是可以在不脫離本發(fā)明的情況下進(jìn)行改變。
權(quán)利要求
一種用于從輸入的音頻信號(hào)中恢復(fù)隱藏的數(shù)據(jù)或者用于識(shí)別輸入的音頻信號(hào)的方法，該方法使用電信設(shè)備，所述電信設(shè)備具有音頻編碼器，所述音頻編碼器用于壓縮輸入的音頻信號(hào)以便傳送到電信網(wǎng)絡(luò)，所述方法由所述電信設(shè)備執(zhí)行并且特征在于，通過音頻編解碼器傳遞輸入的音頻信號(hào)以生成壓縮的音頻數(shù)據(jù)，并且處理壓縮的音頻數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。
2. 根據(jù)權(quán)利要求1所述的方法，其中，所述音頻編碼器對(duì)輸入的音頻執(zhí)行線性預(yù)測(cè) (LP)分析以生成表示輸入的音頻的LP數(shù)據(jù)，并且其中所述處理步驟處理所述LP數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。
3. 根據(jù)權(quán)利要求2所述的方法，其中，所述音頻編碼器壓縮所述LP數(shù)據(jù)以生成壓縮的所述LP數(shù)據(jù)，并且其中所述處理步驟包括從壓縮的音頻數(shù)據(jù)中重新生成所述LP數(shù)據(jù)的步驟。
4. 根據(jù)權(quán)利要求2或3所述的方法，其中，所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)，并且所述處理步驟使用所述LP濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
5. 根據(jù)權(quán)利要求4所述的方法，其中，所述處理步驟包括生成合成濾波器的脈沖響應(yīng) 的步驟，或者包括對(duì)所述LP濾波數(shù)據(jù)執(zhí)行逆萊文森_德賓算法的步驟。
6. 根據(jù)權(quán)利要求2、3或4所述的方法，其中，所述LP數(shù)據(jù)包括LP激發(fā)數(shù)據(jù)，并且所述處理步驟使用所述LP激發(fā)數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
7. 根據(jù)權(quán)利要求2或3所述的方法，其中，所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)和LP激發(fā)數(shù) 據(jù)，并且其中所述處理步驟處理對(duì)應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù)據(jù)中之一的壓縮音頻數(shù)據(jù)的子集以恢復(fù)隱藏的數(shù)據(jù)。
8. 根據(jù)任何在先權(quán)利要求所述的方法，其中所述音頻信號(hào)包括由所述音頻信號(hào)的一個(gè) 或多個(gè)回波定義的隱藏?cái)?shù)據(jù)，并且其中所述處理步驟處理壓縮的音頻以識(shí)別所述音頻信號(hào) 之內(nèi)的回波的存在，以便恢復(fù)隱藏的數(shù)據(jù)。
9. 根據(jù)任何在先權(quán)利要求所述的方法，其中隱藏的數(shù)據(jù)的每個(gè)數(shù)據(jù)符號(hào)用所述音頻信號(hào)之內(nèi)的回波序列或回波組合表示，并且其中所述處理步驟包括識(shí)別所述回波組合以恢復(fù) 隱藏的數(shù)據(jù)的步驟，或者包括跟蹤音頻中的回波序列以恢復(fù)隱藏的數(shù)據(jù)的步驟。
10. 根據(jù)權(quán)利要求8或9所述的方法，其中所述音頻編碼器具有預(yù)定操作頻帶，并且其中所述回波隱藏在音頻之內(nèi)的操作頻帶預(yù)定部分之內(nèi)，優(yōu)選地隱藏在頻帶的上部，并且其中所述處理步驟包括濾波步驟以過濾掉所述預(yù)定部分之外的頻率。
11. 根據(jù)任何在先權(quán)利要求所述的方法，其中，所述處理步驟為所述音頻信號(hào)的時(shí)間幀序列中的每一個(gè)確定一個(gè)或多個(gè)自相關(guān)值，并且使用確定的所述自相關(guān)值恢復(fù)隱藏的數(shù) 據(jù)。
12. 根據(jù)權(quán)利要求11所述的方法，其中，所述處理步驟執(zhí)行確定的所述自相關(guān)值的高通濾波以去除緩慢變化的相關(guān)性。
13. 根據(jù)任何在先權(quán)利要求所述的方法，其中，所述處理步驟在不從壓縮的音頻數(shù)據(jù)中重新生成數(shù)字化的音頻樣本的情況下恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻。
14. 一種電信設(shè)備(21)，包括:麥克風(fēng)(23)，用于接收聲音信號(hào)并且用于將接收到的所述聲音信號(hào)轉(zhuǎn)換成相應(yīng)的音頻電信號(hào)；模擬數(shù)字轉(zhuǎn)換器(53)，用于采樣所述音頻電信號(hào)以產(chǎn)生數(shù)字音頻樣本；音頻編碼器(55)，用于壓縮所述數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)以便傳送到電信網(wǎng)絡(luò)(39);以及數(shù)據(jù)處理器(115)，其耦合到所述音頻編碼器(55)，用于處理壓縮的所述音頻數(shù)據(jù)，以恢復(fù)接收到的所述聲音信號(hào)之內(nèi)傳送的隱藏?cái)?shù)據(jù)，或者識(shí)別接收到的所述聲音信號(hào)。
15. 根據(jù)權(quán)利要求14所述的設(shè)備，其中所述音頻編碼器可操作用于對(duì)輸入的音頻執(zhí)行線性預(yù)測(cè)(LP)分析以生成表示輸入的音頻的LP數(shù)據(jù)，并且其中所述數(shù)據(jù)處理器可操作用于處理所述LP數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。
16. 根據(jù)權(quán)利要求15所述的設(shè)備，其中所述音頻編碼器可操作用于壓縮所述LP數(shù)據(jù)以生成壓縮的所述LP數(shù)據(jù)，并且其中所述數(shù)據(jù)處理器可操作用于從壓縮的音頻數(shù)據(jù)中重新生成所述LP數(shù)據(jù)。
17. 根據(jù)權(quán)利要求15或16所述的設(shè)備，其中，所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)，并且所述數(shù)據(jù)處理器可操作用于使用所述LP濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
18. 根據(jù)權(quán)利要求17所述的設(shè)備，其中，所述數(shù)據(jù)處理器可操作用于生成合成濾波器的脈沖響應(yīng)或者對(duì)所述LP濾波數(shù)據(jù)執(zhí)行逆萊文森_德賓算法以恢復(fù)隱藏的數(shù)據(jù)。
19. 根據(jù)權(quán)利要求15、 16或17所述的設(shè)備，其中，所述LP數(shù)據(jù)包括LP激發(fā)數(shù)據(jù)，并且所述數(shù)據(jù)處理器可操作用于使用所述LP激發(fā)數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
20. 根據(jù)權(quán)利要求15或16所述的設(shè)備，其中所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)和LP激發(fā) 數(shù)據(jù)，并且其中所述數(shù)據(jù)處理器可操作用于處理對(duì)應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù) 據(jù)中之一的壓縮音頻數(shù)據(jù)的子集以恢復(fù)隱藏的數(shù)據(jù)。
21. 根據(jù)權(quán)利要求14至20中任何一項(xiàng)所述的設(shè)備，其中所述音頻信號(hào)包括由所述音頻信號(hào)的一個(gè)或多個(gè)回波定義的隱藏?cái)?shù)據(jù)，并且其中所述數(shù)據(jù)處理器可操作用于處理壓縮的音頻數(shù)據(jù)以識(shí)別所述音頻信號(hào)之內(nèi)的回波的存在，以便恢復(fù)隱藏的數(shù)據(jù)。
22. 根據(jù)權(quán)利要求14至21中任何一項(xiàng)所述的設(shè)備，其中隱藏的數(shù)據(jù)的每個(gè)數(shù)據(jù)符號(hào)用所述音頻信號(hào)之內(nèi)的回波序列或回波組合表示，并且其中所述數(shù)據(jù)處理器可操作用于識(shí)別所述回波組合以恢復(fù)隱藏的數(shù)據(jù)或者跟蹤音頻中的回波序列以恢復(fù)隱藏的數(shù)據(jù)。
23. 根據(jù)權(quán)利要求21或22所述的設(shè)備，其中所述音頻編碼器具有預(yù)定操作頻帶，并且其中所述回波隱藏在音頻之內(nèi)的操作頻帶預(yù)定部分之內(nèi)，優(yōu)選地隱藏在頻帶的上部，并且其中所述數(shù)據(jù)處理器可操作用于過濾掉所述預(yù)定部分之外的頻率。
24. 根據(jù)權(quán)利要求14至23中任何一項(xiàng)所述的設(shè)備，其中，所述數(shù)據(jù)處理器可操作用于為時(shí)間幀序列中的每一個(gè)確定一個(gè)或多個(gè)自相關(guān)值，并且可操作用于使用確定的所述自相關(guān)值恢復(fù)隱藏的數(shù)據(jù)。
25. 根據(jù)權(quán)利要求24所述的設(shè)備，其中，所述數(shù)據(jù)處理器可操作用于執(zhí)行確定的所述自相關(guān)值的高通濾波以去除緩慢變化的相關(guān)性。
26. 根據(jù)權(quán)利要求14至25中任何一項(xiàng)所述的設(shè)備，其中，所述數(shù)據(jù)處理器可操作用于在恢復(fù)隱藏的數(shù)據(jù)時(shí)執(zhí)行幀間和/或幀內(nèi)高通濾波。
27. 根據(jù)權(quán)利要求14至26中任何一項(xiàng)所述的設(shè)備，其中，所述數(shù)據(jù)處理器可操作用于在不從壓縮的音頻數(shù)據(jù)中重新生成數(shù)字化的音頻樣本的情況下恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻。
28. —種數(shù)據(jù)隱藏設(shè)備(5)，包括音頻編碼裝置(161)，用于接收并壓縮表示音頻信號(hào)的數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)；用于接收要被隱藏在所述音頻信號(hào)之內(nèi)的數(shù)據(jù)并且用于取決于接收到的所述數(shù)據(jù)而改變壓縮的所述音頻數(shù)據(jù)以生成修改的壓縮音頻數(shù)據(jù)的裝置(163);以及用于使用修改的所述壓縮音頻數(shù)據(jù)來生成音頻樣本的裝置(165)，所述音頻樣本表示了原始的音頻信號(hào)并傳送隱藏的所述數(shù)據(jù)。
29. —種將數(shù)據(jù)隱藏在音頻信號(hào)中的方法，該方法包括取決于要被隱藏在音頻信號(hào)中的數(shù)據(jù)而向音頻添加一個(gè)或多個(gè)回波的步驟，并且其特征在于，在將回波與音頻信號(hào)進(jìn)行組合之前對(duì)所述回波進(jìn)行高通濾波。
30. —種機(jī)頂盒，包括用于接收音頻信號(hào)的裝置、用于將數(shù)據(jù)隱藏在接收的所述音頻信號(hào)中的裝置以及用于為用戶輸出具有隱藏的所述數(shù)據(jù)的所述音頻信號(hào)的裝置，其中，所述機(jī)頂盒可操作用于用所述音頻信號(hào)之內(nèi)的回波序列或回波組合來表示要被隱藏的所述數(shù) 據(jù)的每個(gè)數(shù)據(jù)符號(hào)。
31. 根據(jù)權(quán)利要求30所述的機(jī)頂盒，可操作用于在將那些回波添加到所述音頻信號(hào)之前對(duì)所述回波中的一個(gè)或多個(gè)執(zhí)行高通濾波。
32. —種計(jì)算機(jī)可實(shí)施指令產(chǎn)品，包括用于使可編程處理器執(zhí)行根據(jù)權(quán)利要求1至13 中任何一項(xiàng)所述的處理步驟的計(jì)算機(jī)可實(shí)施指令。
全文摘要
本發(fā)明提供了一種用于恢復(fù)嵌入在輸入的聲音信號(hào)之內(nèi)的隱藏?cái)?shù)據(jù)的蜂窩電話。該電話將聲音數(shù)據(jù)傳遞通過電話的音頻編碼器，然后處理音頻編碼器所生成的壓縮音頻，以恢復(fù)隱藏的數(shù)據(jù)。本發(fā)明還提供了一種用于從音頻編碼器的壓縮輸出中識(shí)別音頻信號(hào)的類似電話。本發(fā)明還描述了用于將數(shù)據(jù)隱藏在音頻之內(nèi)的各種編碼技術(shù)。
文檔編號(hào)G10L19/06GK101715549SQ200880017878
公開日2010年5月26日申請(qǐng)日期2008年5月29日優(yōu)先權(quán)日2007年5月29日
發(fā)明者伊恩·邁克爾·霍斯金, 彼得·約翰·凱利, 約翰·賴伊, 邁克爾·雷蒙德·雷諾茲申請(qǐng)人:英特拉松尼克斯有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：邁克爾.雷蒙德.雷諾茲;彼得.約翰.凱利;約翰.賴伊;伊恩.邁克爾.霍斯金
技術(shù)所有人：英特拉松尼克斯有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻信號(hào)的數(shù)據(jù)是小數(shù)相關(guān)技術(shù)

音頻信號(hào)數(shù)據(jù)相關(guān)技術(shù)

音視頻如何編輯和嵌入相關(guān)技術(shù)

ppt音頻嵌入相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

嵌入在音頻信號(hào)中的隱藏?cái)?shù)據(jù)的恢復(fù)的制作方法