两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

嵌入在音頻信號(hào)中的隱藏?cái)?shù)據(jù)的恢復(fù)的制作方法

文檔序號(hào):2831773閱讀:301來源:國(guó)知局
專利名稱:嵌入在音頻信號(hào)中的隱藏?cái)?shù)據(jù)的恢復(fù)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及通信系統(tǒng)。本發(fā)明特別但不排它地涉及下述通信系統(tǒng),在所述通信系
統(tǒng)中,經(jīng)由聲音數(shù)據(jù)信道提供數(shù)據(jù)給諸如蜂窩電話之類的電話設(shè)備。 WO 02/45273描述了一種蜂窩電話系統(tǒng),其中,在電視或無線電節(jié)目的音頻之內(nèi)向蜂窩電話傳送隱藏?cái)?shù)據(jù)。在當(dāng)前的上下文中,在下述意義上對(duì)數(shù)據(jù)進(jìn)行隱藏對(duì)數(shù)據(jù)進(jìn)行編碼以便試圖將數(shù)據(jù)隱藏在音頻中,使得它不引起用戶注意并在一定程度上為音頻所掩蓋。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,可接受的數(shù)據(jù)可聽度水平會(huì)取決于所涉及的應(yīng)用和用戶而變化。在這個(gè)較早的申請(qǐng)中描述了用于將數(shù)據(jù)編碼在音頻之內(nèi)的各種技術(shù),包括擴(kuò)展頻譜編碼、回波調(diào)制、臨界頻帶編碼等。然而,發(fā)明人發(fā)現(xiàn)應(yīng)用程序軟件不得不執(zhí)行大量處理以便能夠恢復(fù)隱藏的數(shù)據(jù)。 因此, 一個(gè)實(shí)施例的一個(gè)目標(biāo)就是要減少軟件應(yīng)用程序的處理需求。 在一個(gè)實(shí)施例中,提供了一種用于從輸入的音頻信號(hào)中恢復(fù)隱藏的數(shù)據(jù)或者用于
識(shí)別輸入的音頻信號(hào)的方法,該方法使用電信設(shè)備,所述電信設(shè)備具有音頻編碼器,所述音
頻編碼器用于壓縮輸入的音頻信號(hào)以便傳送到電信網(wǎng)絡(luò),該方法特征在于,通過音頻編解
碼器傳遞輸入的音頻信號(hào)以生成壓縮的音頻數(shù)據(jù),并且處理壓縮的音頻數(shù)據(jù)以恢復(fù)隱藏的
數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。發(fā)明人發(fā)現(xiàn)通過音頻編碼器傳遞輸入的音頻,可以顯著減
少隨后的恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻所需的處理量。特別地,這個(gè)處理可以被執(zhí)
行而無須重新生成音頻樣本然后再著手用于恢復(fù)隱藏的數(shù)據(jù)或者用于識(shí)別音頻信號(hào)的傳
統(tǒng)技術(shù)。 在一個(gè)實(shí)施例中,音頻編碼器對(duì)輸入的音頻執(zhí)行線性預(yù)測(cè)(LP)分析以生成表示輸入的音頻的LP數(shù)據(jù),并且其中處理步驟處理LP數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。優(yōu)選地,音頻編碼器壓縮LP數(shù)據(jù)以生成壓縮的LP數(shù)據(jù),并且處理步驟包括從壓縮的音頻數(shù)據(jù)中重新生成LP數(shù)據(jù)的步驟。 編碼器所生成的LP數(shù)據(jù)可以包括LP濾波數(shù)據(jù)如LPC濾波系數(shù)、濾波極點(diǎn)或線狀
譜頻率,并且處理步驟使用這種LP濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。 處理步驟可以包括生成LP合成濾波器的脈沖響應(yīng)的步驟,或者包括對(duì)LP濾波數(shù)
據(jù)執(zhí)行逆萊文森-德賓(Levinson-Durbin)算法的步驟。當(dāng)生成脈沖響應(yīng)時(shí),優(yōu)選地取它
的自相關(guān),由此可以比從脈沖響應(yīng)自身更加容易地識(shí)別回波存在與否。 音頻編碼器所生成的LP數(shù)據(jù)可以包括LP激發(fā)數(shù)據(jù)(諸如碼簿索引、激發(fā)脈沖位
置、脈沖符號(hào)等),并且處理步驟可以使用這種LP激發(fā)數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音
頻信號(hào)。 在大多數(shù)情況下,LP數(shù)據(jù)會(huì)包括LP濾波數(shù)據(jù)和LP激發(fā)數(shù)據(jù)兩者,并且處理步驟可以處理對(duì)應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù)據(jù)中之一 的壓縮音頻數(shù)據(jù)中的全部或其子集以恢復(fù)隱藏的數(shù)據(jù)。 可以使用若干技術(shù)將數(shù)據(jù)隱藏在音頻信號(hào)之內(nèi)。然而,在優(yōu)選實(shí)施例中,將數(shù)據(jù)作為音頻信號(hào)的一個(gè)或多個(gè)回波而隱藏在音頻中。然后可以通過檢測(cè)回波來恢復(fù)隱藏的數(shù)據(jù)。要被隱藏的數(shù)據(jù)的每個(gè)符號(hào)可以通過回波的組合來(同時(shí))表示,也可以表示為音
5頻信號(hào)之內(nèi)的回波的序列,并且處理步驟可以包括識(shí)別回波的組合以恢復(fù)隱藏的數(shù)據(jù)的步驟,或者包括跟蹤音頻中回波的序列以恢復(fù)隱藏的數(shù)據(jù)的步驟。 在一個(gè)實(shí)施例中,音頻編碼器具有預(yù)定操作頻帶,并且回波隱藏在音頻之內(nèi)的操
作頻帶預(yù)定部分之內(nèi),優(yōu)選地隱藏在頻帶的上部,并且其中處理步驟包括濾波步驟以過濾
掉這個(gè)預(yù)定部分之外的頻率。例如,在音頻編碼器具有300Hz至3. 4kHz的操作頻帶的情況
下,回波可以僅包括在1kHz和3. 4kHz之間的頻帶內(nèi),更優(yōu)選地在2kHz和3. 4kHz之間的頻
帶內(nèi),因?yàn)檫@可以減少對(duì)音頻信號(hào)的影響,所述音頻信號(hào)的能量通常位于操作帶寬的下部
之內(nèi)。在另一個(gè)實(shí)施例中,遍及操作頻帶都包括回波,但是處理步驟仍然執(zhí)行濾波以減少對(duì)
音頻的影響。這并不同樣優(yōu)選,因?yàn)榛夭ㄐ盘?hào)的一部分會(huì)在濾波時(shí)丟失。 為了幫助識(shí)別回波在音頻編碼器輸出中的存在,處理步驟可以確定一個(gè)或多個(gè)自
相關(guān)值,其有助于突出回波。還可以執(zhí)行自相關(guān)值的幀間濾波以減少對(duì)緩慢變化的音頻成
分的影響。 所使用的音頻編碼器可以是若干已知的編碼器如CELP編碼器、AMR編碼器、寬帶AMR編碼器等中的任何一種。 在一個(gè)實(shí)施例中,處理步驟可以根據(jù)從編碼器輸出的壓縮音頻數(shù)據(jù)來確定頻譜圖,然后識(shí)別頻譜圖中的特定特征(類似于指紋)。這些特定特征識(shí)別輸入的音頻并且可以用于確定輸出給用戶的音頻的軌道信息,或者其可以用于將電信設(shè)備同步到音頻信號(hào),例如輸出與音頻相關(guān)的字幕。 另一個(gè)實(shí)施例提供了一種電信設(shè)備,其包括用于接收聲音信號(hào)并且用于將接收到的所述聲音信號(hào)轉(zhuǎn)換成相應(yīng)的音頻電信號(hào)的裝置;用于采樣所述音頻電信號(hào)以產(chǎn)生數(shù)字音頻樣本的裝置;音頻編碼裝置,用于壓縮所述數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)以便傳送到電信網(wǎng)絡(luò);以及數(shù)據(jù)處理裝置,其耦合到所述音頻編碼裝置,用于處理壓縮的所述音頻數(shù)據(jù),以恢復(fù)接收到的所述聲音信號(hào)之內(nèi)傳送的隱藏?cái)?shù)據(jù),或者識(shí)別接收到的所述聲音信號(hào)。 本發(fā)明的一個(gè)實(shí)施例還提供了一種數(shù)據(jù)隱藏設(shè)備,其包括音頻編碼裝置,用于接收并壓縮表示音頻信號(hào)的數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù);用于接收要被隱藏在所述音頻信號(hào)之內(nèi)的數(shù)據(jù)并且用于取決于接收到的所述數(shù)據(jù)而改變壓縮的所述音頻數(shù)據(jù)以生成修改的壓縮音頻數(shù)據(jù)的裝置;以及用于使用修改的所述壓縮音頻數(shù)據(jù)來生成音頻樣本的裝置,所述音頻樣本表示了原始的音頻信號(hào)并傳送隱藏的所述數(shù)據(jù)。 另一個(gè)實(shí)施例提供了一種將數(shù)據(jù)隱藏在音頻信號(hào)中的方法,該方法包括取決于要被隱藏在音頻信號(hào)中的數(shù)據(jù)而向音頻添加一個(gè)或多個(gè)回波的步驟,并且其特征在于,在將回波與音頻信號(hào)進(jìn)行組合之前對(duì)所述回波進(jìn)行高通濾波。發(fā)明人發(fā)現(xiàn)通過僅在音頻信號(hào)的較高頻帶中添加回波,可以更加容易地檢測(cè)回波,并且減少了在遍及音頻頻帶施加回波時(shí)浪費(fèi)的能量。 從參考附圖描述的示例性實(shí)施例的以下詳細(xì)描述中,本發(fā)明的這些以及其它方面將會(huì)變得明顯,其中

圖1示意性圖示了用于經(jīng)由電視信號(hào)的音頻部分將數(shù)據(jù)傳送到蜂窩電話的信號(hào)傳輸系統(tǒng); 圖2是圖示蜂窩電話主要組成部分的示意性框圖,所述蜂窩電話包括用于恢復(fù)接
6收到的音頻信號(hào)之內(nèi)隱藏的數(shù)據(jù)的軟件應(yīng)用程序; 圖3a是圖示形成圖2所示蜂窩電話一部分的音頻編解碼器所執(zhí)行的處理的示意性框圖; 圖3b圖示了音頻信號(hào)的LP編碼之下的源濾波器模型; 圖3c圖示了其中逆LPC濾波器可以用于從輸入的音頻信號(hào)中生成激發(fā)或剩余信號(hào)的方式; 圖4是圖示對(duì)來自音頻編解碼器的輸出執(zhí)行處理以恢復(fù)音頻信號(hào)中隱藏的數(shù)據(jù)的示意性框圖; 圖5是可以從其中確定隱藏的數(shù)據(jù)的自相關(guān)曲線圖; 圖6是圖示可以被執(zhí)行以恢復(fù)隱藏?cái)?shù)據(jù)的代替處理的示意性框圖; 圖7是圖示其中可以從來自音頻編解碼器的輸出恢復(fù)隱藏的數(shù)據(jù)的進(jìn)一步代替
的方式的示意性框圖; 圖8是圖示其中可以從音頻編解碼器所輸出的激發(fā)參數(shù)恢復(fù)隱藏的數(shù)據(jù)的方式的示意性框圖; 圖9是從中可以識(shí)別隱藏?cái)?shù)據(jù)的由形成圖8所示電路一部分的自相關(guān)部件所輸出的自相關(guān)曲線圖; 圖10是圖示對(duì)圖4所示的處理電路進(jìn)行改進(jìn)的示意性框圖,其中LPC合成濾波器的脈沖響應(yīng)被高通濾波以減少對(duì)低頻音頻成分的影響; 圖11是圖示對(duì)圖4所示的處理電路進(jìn)行進(jìn)一步改進(jìn)的示意性框圖,其中LPC系數(shù)被高通濾波以去除與低頻音頻成分相關(guān)的低階系數(shù); 圖12圖示了對(duì)圖4所示的處理電路進(jìn)行的進(jìn)一步改進(jìn),其中圖5所示的自相關(guān)曲線圖被高通濾波以去除緩慢變化的自相關(guān); 圖13是圖示其中隱藏的數(shù)據(jù)可以在由蜂窩電話接收之前被編碼在音頻之內(nèi)的一種方式的一般示意性框圖; 圖14是圖示其中蜂窩電話恢復(fù)使用圖13所示的系統(tǒng)編碼的數(shù)據(jù)的方式的一般框圖; 圖15是圖示其中LPC編碼器所生成的參數(shù)可以被修改并與剩余信號(hào)再組合以形成修改的音頻以便傳送到蜂窩電話的一種方式的框圖; 圖16圖示了代替的方式,其中從LPC編碼器獲得的激發(fā)參數(shù)被修改,并且從中剩余信號(hào)被生成,以供將修改的音頻與從LPC編碼器獲得的LPC系數(shù)進(jìn)行合成時(shí)使用;以及
圖17是圖示其中音頻編解碼器的輸出可以被處理以恢復(fù)用于輸入音頻的頻譜圖
以供識(shí)別或表征輸入的音頻信號(hào)時(shí)使用的方式的框圖。
概述 圖l圖示了本發(fā)明的第一實(shí)施例,其中數(shù)據(jù)源l所生成的數(shù)據(jù)信號(hào)F(t)由編碼器5編碼在來自音頻源3的音頻軌道之內(nèi),以形成修改的用于電視節(jié)目的音頻軌道。在這個(gè)實(shí)施例中,數(shù)據(jù)信號(hào)F (t)傳送觸發(fā)信號(hào),以便使運(yùn)行于用戶的移動(dòng)電話21上的軟件應(yīng)用程序的操作與電視節(jié)目同步。如圖l所示,編碼器5所輸出的修改的音頻軌道然后在信號(hào)發(fā)生器9中與來自視頻源7的相應(yīng)視頻軌道結(jié)合,以形成傳送電視節(jié)目的電視信號(hào)。在這個(gè)實(shí)施例中,數(shù)據(jù)源1、音頻源3、視頻源7和編碼器5全都位于電視演播室中,并且電視信號(hào)由分發(fā)網(wǎng)絡(luò)11分發(fā),在這個(gè)實(shí)施例中是射頻(RF)信號(hào)13。 RF信號(hào)13由電視天線15接收, 該電視天線15將電視信號(hào)提供給傳統(tǒng)的電視17。電視17具有顯示器(未示出),用于示 出視頻軌道;以及未示出的揚(yáng)聲器,用于輸出修改的音頻軌道作為聲音信號(hào)19。
如示出的那樣,在這個(gè)實(shí)施例中,蜂窩電話21使用麥克風(fēng)23檢測(cè)電視17所發(fā)出 的聲音信號(hào)19,該麥克風(fēng)23將檢測(cè)到的聲音信號(hào)轉(zhuǎn)換成相應(yīng)的電信號(hào)。蜂窩電話21然后 解碼該電信號(hào)以恢復(fù)數(shù)據(jù)信號(hào)F(t)。蜂窩電話21還具有傳統(tǒng)的組成部分如揚(yáng)聲器25、用 于與蜂窩狀基站35通信的天線27、顯示器29、用于輸入數(shù)字和字母的小鍵盤31以及用于 訪問菜單選項(xiàng)的菜單鍵33。如在W0 02/45273中說明的那樣,從音頻信號(hào)中恢復(fù)的數(shù)據(jù)可 以用于若干不同目的。 一種應(yīng)用是用于運(yùn)行于蜂窩電話21上的軟件應(yīng)用程序與示出在電 視17上的電視節(jié)目的同步。例如,可能會(huì)在電視17上示出測(cè)驗(yàn)秀(quiz show),并且蜂窩 電話21可能布置成生成并顯示涉及與測(cè)驗(yàn)秀同步地示出的測(cè)驗(yàn)的問題。問題例如可以預(yù) 先存儲(chǔ)在蜂窩電話21上,并且當(dāng)從數(shù)據(jù)信號(hào)F(t)中恢復(fù)適當(dāng)?shù)耐酱a時(shí)輸出。在測(cè)驗(yàn) 秀的結(jié)尾,由用戶(經(jīng)由小鍵盤31)輸入到蜂窩電話21中的答案然后可以經(jīng)由蜂窩電話基 站35和電信網(wǎng)絡(luò)39傳送到遠(yuǎn)程服務(wù)器41。服務(wù)器41然后可以核對(duì)從大量用戶接收到的 答案,并且基于給出的正確答案的數(shù)目和輸入答案所花費(fèi)的時(shí)間來對(duì)它們進(jìn)行分等。這種 計(jì)時(shí)信息也可以由蜂窩電話21確定并連同用戶的答案一起傳送到服務(wù)器41。如本領(lǐng)域技 術(shù)人員將會(huì)意識(shí)到的那樣,服務(wù)器41還可以處理從不同用戶接收到的信息并核對(duì)它可以 存儲(chǔ)在數(shù)據(jù)庫43中的各種用戶簡(jiǎn)檔信息。這種用戶簡(jiǎn)檔信息然后例如可以用于目標(biāo)廣告。
在服務(wù)器41已識(shí)別一個(gè)或多個(gè)"獲勝"用戶之后,可以將信息或獎(jiǎng)賞發(fā)送給那些 用戶。例如,可以將消息連同優(yōu)惠券或其它票據(jù)一起經(jīng)由電信網(wǎng)絡(luò)39發(fā)送給他們。如圖l 中的虛線44所示,服務(wù)器41也可以向數(shù)據(jù)源1提供要被編碼在音頻之內(nèi)的數(shù)據(jù)。
如上所述,發(fā)明人認(rèn)識(shí)到通過利用由專用音頻編解碼器芯片所執(zhí)行的編碼,可以 減少需要由運(yùn)行于蜂窩電話21上的軟件所執(zhí)行的處理。特別地,發(fā)明人發(fā)現(xiàn)使用音頻編解 碼器中固有的編碼過程作為解碼過程的初始步驟以恢復(fù)隱藏的數(shù)據(jù),減少了軟件用于恢復(fù) 隱藏的數(shù)據(jù)所需的處理。
蜂窩電話 圖2圖示了在這個(gè)實(shí)施例中使用的蜂窩電話21的主要組成部分。如所示,蜂窩電 話21包括麥克風(fēng)23,用于接收聲音信號(hào)并且用于將它們轉(zhuǎn)換成等效電信號(hào)。這些電信號(hào) 然后由濾波器51進(jìn)行濾波以去除通常在300Hz至3. 4kHz的頻帶之外的不想要的頻率(如 ETSI所公布的標(biāo)準(zhǔn)文件EN300-903中定義的那樣)。濾波的音頻然后由模擬數(shù)字轉(zhuǎn)換器53 數(shù)字化,該模擬數(shù)字轉(zhuǎn)換器53以8kHz的采樣頻率對(duì)濾波的音頻進(jìn)行采樣,通常用13至16 位數(shù)字值表示每個(gè)樣本。數(shù)字化的音頻流(D(t))然后被輸入到音頻編解碼器55,該音頻編 解碼器55是自適應(yīng)多速率(AMR)編解碼器,其操作在下面進(jìn)行描述。AMR編解碼器55所輸 出的壓縮音頻然后被傳遞到RF處理單元57,該RF處理單元57將壓縮的音頻調(diào)制到一個(gè) 或多個(gè)RF載波信號(hào)上,以便經(jīng)由天線27傳送到基站35。類似地,經(jīng)由天線27接收的壓縮 音頻信號(hào)被饋送到RF處理單元57,該RF處理單元57解調(diào)接收的RF信號(hào)以從( 一個(gè)或多 個(gè))RF載波信號(hào)中恢復(fù)壓縮的音頻數(shù)據(jù),其被傳遞到AMR編解碼器55。 AMR編解碼器55然 后解碼壓縮的音頻數(shù)據(jù)以重新生成由此表示的音頻樣本,其經(jīng)由數(shù)字模擬轉(zhuǎn)換器59和放 大器61被輸出到揚(yáng)聲器25。
如圖2所示,從AMR編解碼器55 (或RF處理單元57)輸出的壓縮音頻數(shù)據(jù)還被傳遞到處理器63,該處理器63由存儲(chǔ)在存儲(chǔ)器65中的軟件控制。所述軟件包括操作系統(tǒng)軟件67(用于控制蜂窩電話21的一般操作);瀏覽器68,用于訪問互聯(lián)網(wǎng);以及應(yīng)用程序軟件69 ,用于提供額外的功能給蜂窩電話21 。在這個(gè)實(shí)施例中,應(yīng)用程序軟件69配置成使蜂窩電話21以上面討論的方式與電視節(jié)目交互。為了做到這一點(diǎn),應(yīng)用程序軟件69布置成接收并處理從AMR編解碼器55輸出的壓縮音頻數(shù)據(jù),以恢復(fù)控制應(yīng)用程序軟件69的隱藏?cái)?shù)據(jù)F(t)。如下面將會(huì)更加詳細(xì)地描述的那樣,處理壓縮的音頻數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)F(t)可以被執(zhí)行而不必重新生成數(shù)字化的音頻樣本,同時(shí)減少了軟件應(yīng)用程序69用于直接從數(shù)字音頻樣本恢復(fù)隱藏的數(shù)據(jù)所需的處理。 響應(yīng)于恢復(fù)隱藏的數(shù)據(jù),應(yīng)用程序軟件69布置成生成并在顯示器29上輸出數(shù)據(jù)(例如針對(duì)用戶的問題),并且接收用戶經(jīng)由小鍵盤31輸入的答案。軟件應(yīng)用程序69然后將用戶的答案連同指示用戶輸入每個(gè)答案所花費(fèi)的時(shí)間(通過軟件應(yīng)用程序69使用內(nèi)部計(jì)時(shí)器(未示出)來計(jì)算)的計(jì)時(shí)數(shù)據(jù)一起傳送到遠(yuǎn)程服務(wù)器41 (通過預(yù)先存儲(chǔ)的URL或E. 164號(hào)碼等識(shí)別)。軟件應(yīng)用程序69還可以顯示從服務(wù)器41接收回來的結(jié)果信息,該信
息指示用戶相對(duì)于參與測(cè)驗(yàn)的其它用戶做得有多好。
AMR編解碼器 盡管AMR編解碼器55是眾所周知的并且由3GPP標(biāo)準(zhǔn)實(shí)體(在標(biāo)準(zhǔn)文件TS 26. 090版本3. 1. 0中)定義,現(xiàn)在仍然參考圖3給出它執(zhí)行的處理的一般描述,以便讀者可以理解隨后應(yīng)用程序軟件69所執(zhí)行的處理的描述。 AMR編解碼器55 (自適應(yīng)多速率編碼器_解碼器)以若干不同的比特率將300Hz至3. 4kHz頻帶內(nèi)的8kHz采樣數(shù)據(jù)音頻轉(zhuǎn)換成位流。編解碼器55因此非常適用于傳輸率可能需要變化的情形。它的輸出比特率可以適合于匹配盛行的傳輸狀況,因?yàn)檫@個(gè)原因,所以它是3G標(biāo)準(zhǔn)并且當(dāng)前用在大多數(shù)的蜂窩電話21中。 盡管比特率是可變的,但是相同的基本編碼過程由編解碼器55在所有速率下使用。量化處理,其參數(shù)的選擇會(huì)被傳輸并且傳輸?shù)乃俾时桓淖円詫?shí)現(xiàn)八個(gè)比特率或模式下的操作12. 2、10. 2、7. 95、7. 40、6. 70、5. 90、5. 15和4. 75Kbits/s。在這個(gè)實(shí)施例中使用最高比特率模式(12. 2Kbits/s)。 在AMR編解碼器55中存在四個(gè)主要部件子系統(tǒng),下面對(duì)它們進(jìn)行描述。它們是
音調(diào)預(yù)測(cè)
LPC分析
固定碼簿查找
自適應(yīng)碼簿 AMR編解碼器55按順序應(yīng)用它們,盡管對(duì)于當(dāng)前的目的而言,更容易的是最后處理音調(diào)預(yù)測(cè)并作為自適應(yīng)碼簿處理的一部分。AMR編解碼器55建立在碼簿激發(fā)線性預(yù)測(cè)(CELP)編碼系統(tǒng)周圍。輸入的音頻信號(hào)被分成160個(gè)樣本幀(f),并且?guī)?jīng)歷線性預(yù)測(cè)分析以每幀提取少量系數(shù)用于編碼和傳輸。這些系數(shù)表征了信號(hào)在幀內(nèi)的短期頻譜。除了這些系數(shù)之外,AMR編解碼器55還計(jì)算LPC剩余(也被稱為激發(fā)),其使用音調(diào)預(yù)測(cè)器所輔助的自適應(yīng)和固定碼簿進(jìn)行編碼。下面描述這些子系統(tǒng)。
LPC分析
9
LPC分析由圖3a所示的LPC分析部件71執(zhí)行。LPC假定了語音產(chǎn)生的經(jīng)典源濾波器模型(圖3b所示),其中,語音被認(rèn)為是緩慢時(shí)變?yōu)V波器(LPC合成濾波器72)的輸出,由用于諸如元音中的有聲語音的規(guī)則聲門脈沖和用于例如/sh/的無聲語音的白噪聲或者用于像/z/的混合發(fā)聲聲音的這兩者的混合所激發(fā)(用激發(fā)塊74表示)。盡管基于語音產(chǎn)生的模型,但是還提供了用于對(duì)所有聲音進(jìn)行編碼的有效模型。合成濾波器72假定為全極點(diǎn),亦即它僅具有諧振。這個(gè)假定是LPC分析方法的基礎(chǔ)。在采樣數(shù)據(jù)(z平面)表示法中,它表明在傳遞函數(shù)H(z)的分母中,傳遞函數(shù)純粹是z—1的多項(xiàng)式。<formula>formula see original document page 10</formula> 這個(gè)濾波器對(duì)輸入激發(fā)en的時(shí)間序列響應(yīng)sn于是為
s,, = eK+ S & 5"—: (2) 這就是說系統(tǒng)的輸出sn是輸入en加上p個(gè)以前輸出的加權(quán)線性之和。這是LPC的理論基礎(chǔ)。限度p是LPC的"階",其通常是固定的并且在AMR編解碼器55中p等于10。在AMR編解碼器55(以及其它基于LPC的系統(tǒng))中,使用線性預(yù)測(cè)分析為輸入音頻的每個(gè)幀估計(jì)濾波權(quán)重或系數(shù)A —旦被估計(jì),它們?nèi)缓缶捅晦D(zhuǎn)換成適合于量化和傳輸?shù)男问健?br> 有效地估計(jì)系數(shù)ai需要進(jìn)行逼近和假定。求解系數(shù)的所有方法都旨在7使en在上述方程(2)中的貢獻(xiàn)最小化。AMR編解碼器55使用自相關(guān)方法,這意味著求解p個(gè)聯(lián)立
線性方程;以矩陣的形式
<formula>formula see original document page 10</formula> 或者以更簡(jiǎn)略的形式
Ru ai = & (4) R的元素rij是用于延遲|i-j|下的輸入音頻信號(hào)的自相關(guān)值。因?yàn)镽是對(duì)稱的并且每個(gè)對(duì)角線的所有元素都相等,所以它對(duì)用于求逆矩陣的快速遞歸方法開放。在AMR編碼器55中使用萊文森_德賓算法。
線狀譜頻率 系數(shù)ai實(shí)際上不容易量化。它們隨時(shí)間相當(dāng)不可預(yù)測(cè)地變化,并且具有未確定范圍之上的正負(fù)值。AMR編解碼器55因此使用LSF確定部件73來將這些系數(shù)在量化之前轉(zhuǎn)換成線狀譜頻率,這去除了這些缺點(diǎn)并且允許LPC系數(shù)的有效編碼。系數(shù)ai是全極點(diǎn)合成濾波器72的權(quán)重,并且是第p階z—1多項(xiàng)式的系數(shù),其可以進(jìn)行因式分解以求根。這些根是合成濾波器72中的諧振或極點(diǎn)。這些極點(diǎn)常常被量化以便在它們被合理排序時(shí)傳輸,具有平均值,并且從幀到幀更加可預(yù)測(cè)地變化,這給機(jī)會(huì)以節(jié)省位,其沒有編碼a,。線狀譜頻率(LSF)對(duì)這甚至比極點(diǎn)更好。重要的是要認(rèn)識(shí)到LSF不與全極點(diǎn)模型的極點(diǎn)相同,但是它們相關(guān)。它們的導(dǎo)數(shù)是相關(guān)的,但是定性地涉及選擇合成濾波器的特殊表示中的兩組邊界條件,一個(gè)邊界條件對(duì)應(yīng)于當(dāng)聲門完全開放時(shí),另一個(gè)對(duì)應(yīng)于當(dāng)聲門完全關(guān)閉時(shí)。這導(dǎo)致兩組具有零帶寬的假設(shè)極點(diǎn),亦即完全諧振器。
LSF的主要優(yōu)點(diǎn)在于
LSF僅包括下述頻率,它們的帶寬總是零(盡管有極點(diǎn)兩倍多的LSF)
LSF理論上比極點(diǎn)更好排序 LSF因此服從非常低的比特率編碼。特別地,如圖3a所示,每個(gè)LSF的平均值(事先計(jì)算并存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器75中)可以由平均值減法部件77減去。進(jìn)一步,因?yàn)樽鳛榻Y(jié)果的增量(delta) LSF不隨時(shí)間迅速變化,所以預(yù)測(cè)器79然后可以用于預(yù)測(cè)當(dāng)前的增量值,其由預(yù)測(cè)減法部件81從實(shí)際增量中減去。作為結(jié)果的數(shù)據(jù)然后由矢量量化(VQ)部件83另外編碼,該VQ部件83經(jīng)由單個(gè)索引一次性編碼兩個(gè)值,導(dǎo)致在某些情況下小于每值1位。AMR編解碼器55輸出如此獲得的VQ索引值用于當(dāng)前幀作為編碼的LPC數(shù)據(jù),以便傳輸?shù)交?5。 LP激發(fā) 如上所述,AMR編解碼器55還編碼圖3b所示的模型的激發(fā)部分74。為了做到這一點(diǎn),AMR編解碼器55生成激發(fā)信號(hào)的表示,以便它然后可以進(jìn)行編碼。如圖3c所示,通過生成"逆"LPC濾波器76來做到這一點(diǎn),該"逆"LPC濾波器76可以通過對(duì)輸入的音頻信號(hào)進(jìn)行濾波來生成激發(fā)信號(hào)。從逆濾波器76獲得的激發(fā)信號(hào)有時(shí)也被稱為剩余。這個(gè)逆LPC濾波器76實(shí)際上從上面確定的相同系數(shù)&來定義,但是使用它們來定義具有下述傳遞函數(shù)的全零點(diǎn)模型 <formula>formula see original document page 11</formula>
這在時(shí)域中對(duì)應(yīng)于下述濾波器 <formula>formula see original document page 11</formula> (6)所定義的逆LPC濾波器76包括抵消(2)所定義的全極點(diǎn)合成濾波器72中的極點(diǎn)的零點(diǎn)。理論上,如果使用逆濾波器76對(duì)輸入的音頻信號(hào)進(jìn)行濾波,然后通過合成濾波器72對(duì)生成的激發(fā)信號(hào)進(jìn)行濾波,那么我們就得回了輸入的音頻信號(hào)(因此有名稱"逆"LPC濾波器)。重要的是要注意,原始音頻信號(hào)不需要是語音以進(jìn)行完全重構(gòu)。如果LPC分析在表示輸入的音頻信號(hào)方面尚未做出好的工作,那么在剩余中會(huì)有更多信息。
對(duì)激發(fā)信號(hào)進(jìn)行編碼是AMR編解碼器55中的固定碼簿部件87和自適應(yīng)碼簿部件89的工作。當(dāng)與用于對(duì)LSF進(jìn)行編碼的位的數(shù)目相比較時(shí),在AMR編解碼器55中使用比較大量的位以對(duì)激發(fā)進(jìn)行編碼在12. 2Kbits/s模式下每幀244位中的206個(gè)(84% ),在4. 75Kbits/s模式下為95中的72個(gè)(74% )。位的這種使用允許AMR編解碼器55以某種效果對(duì)非語音信號(hào)進(jìn)行編碼。 有聲語音中的激發(fā)通過一系列聲音音調(diào)(在正常語音中對(duì)于成年男性為大約100Hz至130Hz,對(duì)于女性和小孩為兩倍)下的點(diǎn)擊(脈沖)來表征。在無聲語音中為白噪聲(或多或少)。在混合語音中是混合物。思考激發(fā)作為剩余的一種方式是認(rèn)識(shí)到LPC分析在音頻的短期頻譜中取出凸起,留下具有平坦得多的頻譜的剩余。這適用于無論什么是輸入信號(hào)。 在AMR編解碼器55中,激發(fā)信號(hào)被編碼為固定碼簿和自適應(yīng)碼簿輸出的組合。自適應(yīng)碼簿并不作為任何東西存在以供查找,而只是在音調(diào)預(yù)測(cè)器所預(yù)測(cè)的時(shí)期反饋的組合碼簿輸出的以前組合的副本。
固定碼簿 固定碼簿部件87通過以下生成用于當(dāng)前幀的激發(fā)信號(hào)(ef):使用用于當(dāng)前幀的從LPC分析部件71輸出的LPC系數(shù)ai,以設(shè)置上面的方程(6)中所定義的逆濾波器76的權(quán)重;并且使用這個(gè)濾波器對(duì)輸入音頻的當(dāng)前幀進(jìn)行濾波。固定碼簿部件然后識(shí)別固定碼簿脈沖或模式(存儲(chǔ)在固定碼簿88中),其最佳迎合發(fā)生在激發(fā)信號(hào)中的新事物,這將會(huì)有效地修改來自自適應(yīng)碼簿部件89的以前幀的激發(fā)的滯后(延遲)副本。
每個(gè)幀再分成4個(gè)子幀,其中的每一個(gè)具有獨(dú)立編碼的固定碼簿輸出。用于一個(gè)子幀的固定碼簿激發(fā)將激發(fā)編碼為成對(duì)單一振幅脈沖的一系列5交錯(cuò)鏈。針對(duì)MR122(AMR的12. 2kb/s模式的名稱)在下面的表格中示出每對(duì)脈沖的可能位置。如上面指示的那樣,
這種編碼使用了顯著數(shù)目的位。
軌道脈沖位置
10,50,5,10,15,20,25,30,35
21,61,6,11,16,21,26,31,36
32,72,7,12,17,22,27,32,37
43,83,8,13,19,23,28,33,38
54,94,9,14,19,24,29,34,39 每個(gè)軌道中的第一個(gè)脈沖的符號(hào)也被編碼;第二個(gè)脈沖的符號(hào)相同,除非當(dāng)相反時(shí)它在軌道中更早下降。用于子幀的增益也被編碼。
自適應(yīng)碼簿 自適應(yīng)碼簿是組合激發(fā)的以前部分的時(shí)間延遲副本,并且在編碼有聲語音中是重要的。因?yàn)橛新曊Z音是有規(guī)則的,所以可以使用固定碼簿輸出僅對(duì)當(dāng)前音調(diào)周期和以前音調(diào)周期之間的差進(jìn)行編碼。當(dāng)添加到以前聲音周期的保存副本時(shí),我們得到這個(gè)幀的激發(fā)的估計(jì)。不傳輸自適應(yīng)碼簿;編碼器和解碼器根據(jù)以前組合輸出和當(dāng)前音調(diào)延遲來計(jì)算自適應(yīng)碼簿。 音調(diào)預(yù)測(cè)器 音調(diào)預(yù)測(cè)器(其形成自適應(yīng)碼簿部件89的一部分)的目的是要確定用于自適應(yīng)碼簿的最佳延遲。它是兩階段過程。第一個(gè)階段是單向開環(huán)音調(diào)預(yù)測(cè),將語音與以前的樣本相關(guān)聯(lián),以找到有聲周期的估計(jì)(如果語音有聲的話)或者使誤差測(cè)量最小化的最佳重復(fù)率。這之后是重復(fù)的閉環(huán)預(yù)測(cè),以在1/6的樣本之內(nèi)得到用于自適應(yīng)碼簿的最佳延遲。因?yàn)檫@個(gè)原因,語音預(yù)測(cè)是編碼器中的自適應(yīng)碼簿過程的一部分。計(jì)算受兩階段方法的限制,因?yàn)榈诙€(gè)更加詳細(xì)的搜索僅在少量樣本之上發(fā)生。AMR編解碼器55使用通過合成方法進(jìn)行的分析,以便通過使針對(duì)候選延遲的輸出和輸入語音之間的均方差最小化來選擇最佳延遲。
12
因此,為了表示用于當(dāng)前幀的激發(fā)信號(hào),AMR編解碼器55輸出為當(dāng)前幀確定的固定碼簿索引(每個(gè)子幀一個(gè))、固定碼簿增益、自適應(yīng)碼簿延遲和自適應(yīng)碼簿增益。這個(gè)數(shù)據(jù)和LPC編碼的數(shù)據(jù)可用于在蜂窩電話21上運(yùn)行的應(yīng)用程序軟件69,并且從中隱藏的數(shù)據(jù)必須被恢復(fù)。 數(shù)據(jù)隱藏和恢復(fù) 存在其中可以將數(shù)據(jù)F(t)隱藏在音頻信號(hào)之內(nèi)的各種方式,并且對(duì)于將數(shù)據(jù)隱藏在音頻中的不同技術(shù)的詳細(xì)討論,讀者可以參考Bender的論文"Techniques For DataHiding", IBM Systems Journal, Vol 35,no 384,1996。在當(dāng)前的實(shí)施例中,通過將回波添加到音頻來將數(shù)據(jù)隱藏在音頻中,其中回波的時(shí)間延遲被改變以對(duì)數(shù)據(jù)進(jìn)行編碼。例如通過使用簡(jiǎn)單的沒有回波對(duì)應(yīng)于二進(jìn)制0并且有回波對(duì)應(yīng)于二進(jìn)制1的方案來執(zhí)行這種改變。代替地,二進(jìn)制l可以通過在第一延遲添加回波來表示,并且二進(jìn)制O可以通過在不同的第二延遲添加回波來表示。回波的符號(hào)還可以隨著要被隱藏的數(shù)據(jù)而變化。在更加復(fù)雜的編碼方案中,二進(jìn)制1可以通過回波的第一組合或序列(同時(shí)有兩個(gè)或更多回波或者連續(xù)施加)來表示,并且二進(jìn)制0可以通過不同的回波第二組合或序列來表示。
在這個(gè)實(shí)施例中,回波可以添加有0. 75ms和1. 00ms的延遲,并且二進(jìn)制1通過為音頻(通常對(duì)應(yīng)于幾個(gè)AMR幀)的第一部分添加衰減的0.75ms回波繼之以在音頻的第二部分中添加衰減的1. 00ms回波來表示;并且二進(jìn)制0通過為音頻的第一部分添加衰減的l.OOms回波繼之以在音頻的第二部分中添加衰減的O. 75ms回波來表示。因此,為了恢復(fù)隱藏的數(shù)據(jù),軟件應(yīng)用程序不得不處理來自AMR編解碼器55的編碼輸出,以識(shí)別音頻中接收的回波序列并從而識(shí)別音頻中隱藏的數(shù)據(jù)。 通常,通過以下在音頻信號(hào)中識(shí)別回波執(zhí)行音頻樣本的自相關(guān),以及識(shí)別對(duì)應(yīng)于任何回波的峰值。然而,如上所述,隱藏的數(shù)據(jù)將要從AMR編解碼器55的輸出中恢復(fù)。
數(shù)據(jù)恢復(fù)1 圖4圖示了其中回波可以被檢測(cè)并且隱藏的數(shù)據(jù)F(t)由應(yīng)用程序軟件69從AMR編解碼器55的輸出中恢復(fù)的一種方式。如所示,在這種技術(shù)中,應(yīng)用程序軟件單獨(dú)地從圖3所示的VQ部件83所輸出的LPC編碼信息中恢復(fù)隱藏的數(shù)據(jù)。如圖4所示,應(yīng)用程序軟件69所執(zhí)行的第一個(gè)處理由VQ部件91執(zhí)行,該VQ部件91反轉(zhuǎn)AMR編解碼器55所執(zhí)行的矢量量化。VQ部件91的輸出然后由預(yù)測(cè)加法部件93處理,該預(yù)測(cè)加法部件93將LSF增量預(yù)測(cè)(由預(yù)測(cè)器95確定)添加到來自VQ部件91的輸出。LSF平均值(從數(shù)據(jù)存儲(chǔ)器97獲得)然后被平均值加法部件99加回,以恢復(fù)用于當(dāng)前幀的LSF。 LSF然后被LSF轉(zhuǎn)換部件101轉(zhuǎn)換回到LPC系數(shù)。由于在其它AMR處理階段中執(zhí)行的逼近和量化,如此確定的系數(shù)Si不會(huì)確切地與圖3中的LPC分析部件71所確定的系數(shù)相同。 如所示,在這個(gè)實(shí)施例中,確定的LPC系數(shù)^用于根據(jù)上述方程(2)配置LPC合成濾波器103。通過向如此配置的濾波器103施加脈沖(由脈沖發(fā)生器105生成),于是獲得這個(gè)合成濾波器103的脈沖響應(yīng)(h(n))。發(fā)明人發(fā)現(xiàn)回波存在于這個(gè)脈沖響應(yīng)(h(n))之內(nèi)并且可以從對(duì)應(yīng)于回波延遲的滯后周圍的脈沖響應(yīng)的自相關(guān)中找到。如所示,自相關(guān)部件107對(duì)在數(shù)據(jù)存儲(chǔ)器108中識(shí)別的滯后執(zhí)行這些自相關(guān)計(jì)算。圖5圖示了對(duì)于所有正滯后獲得的自相關(guān)。曲線圖將滯后識(shí)別為在零滯后處來自主峰值108的樣本。所以使用8kHz的采樣率,每個(gè)樣本對(duì)應(yīng)于O. 125ms的滯后。如所示,在零滯后處存在初始峰值108,繼之以在大約1. 00ms的滯后處的峰值110(對(duì)應(yīng)于離原點(diǎn)8個(gè)樣本)——表明當(dāng)前幀具有1. 00ms回波。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,不需要針對(duì)所有回波都計(jì)算自相關(guān)——只需針對(duì)對(duì)應(yīng)于回波會(huì)被發(fā)現(xiàn)的那些地方的滯后周圍(亦即在0. 75ms和1. 00ms周圍)進(jìn)行計(jì)算。 如圖4所示,自相關(guān)部件107所確定的自相關(guān)值被傳遞到回波識(shí)別部件109,該回波識(shí)別部件109確定在當(dāng)前幀中是否存在任何回波(例如通過用適當(dāng)?shù)拈撝祵?duì)自相關(guān)值進(jìn)行設(shè)限來識(shí)別相關(guān)滯后處的任何峰值)。識(shí)別的峰值然后被傳遞到數(shù)據(jù)恢復(fù)部件111,該數(shù)據(jù)恢復(fù)部件111跟蹤相鄰幀之上的識(shí)別的回波序列,以檢測(cè)隱藏?cái)?shù)據(jù)F(t)的二進(jìn)制1或二進(jìn)制O的存在。用這種方式,隱藏的數(shù)據(jù)被恢復(fù),并且然后可以用于以上述方式控制應(yīng)用程序軟件69的操作。 發(fā)明人發(fā)現(xiàn)以這種方式恢復(fù)隱藏?cái)?shù)據(jù)的計(jì)算需求顯著小于直接從數(shù)字化的音頻
樣本中恢復(fù)隱藏?cái)?shù)據(jù)的計(jì)算需求。 數(shù)據(jù)恢復(fù)2 在上述實(shí)施例中,LPC合成濾波器的脈沖響應(yīng)的自相關(guān)被確定,并且從中確定回波的存在以恢復(fù)隱藏的數(shù)據(jù)。圖6圖示了可以根據(jù)用于恢復(fù)隱藏的數(shù)據(jù)的替代技術(shù)來執(zhí)行的處理。如通過比較圖4和6可以看到的那樣,這個(gè)實(shí)施例和第一個(gè)實(shí)施例之間的主要差別在于,重新生成的用于當(dāng)前幀的LPC系數(shù)&被直接傳遞到自相關(guān)部件107,該自相關(guān)部件107計(jì)算LPC系數(shù)序列的自相關(guān)。這個(gè)實(shí)施例因此是第一個(gè)實(shí)施例的簡(jiǎn)化。然而,在回波滯后處輸出的自相關(guān)中的峰值并不如同在第一個(gè)實(shí)施例中宣稱的那樣,所以因?yàn)檫@個(gè)原因,這個(gè)較簡(jiǎn)單的實(shí)施例在足夠的處理能力可用的情況下不是優(yōu)選的。
數(shù)據(jù)恢復(fù)3 圖7圖示了可以在第三技術(shù)中執(zhí)行的處理,該第三技術(shù)用于識(shí)別回波的存在以及隨后恢復(fù)隱藏的數(shù)據(jù)。如通過比較圖6和7可以看到的那樣,這個(gè)實(shí)施例和第二個(gè)實(shí)施例之間的主要差別在于,重新生成的用于當(dāng)前幀的LPC系數(shù)Si被施加到逆萊文森-德賓部件114,該逆萊文森_德賓部件114使用逆萊文森_德賓算法以從LPC系數(shù)中重新計(jì)算上述方程(3)的自相關(guān)矩陣Rij。所確定的值對(duì)應(yīng)于輸入的音頻信號(hào)自身的自相關(guān)值,并因此會(huì)包括與所述或每個(gè)回波的延遲相對(duì)應(yīng)的滯后處的峰值。來自逆萊文森-德賓部件114的輸出因此可以像以前一樣處理,以恢復(fù)隱藏的數(shù)據(jù)。這個(gè)實(shí)施例的主要缺點(diǎn)在于,逆萊文森-德賓算法在計(jì)算方面比較密集,所以在只有有限處理能力的情況下,這個(gè)實(shí)施例不是優(yōu)選的。
數(shù)據(jù)恢復(fù)4 在上述三個(gè)實(shí)施例中,通過處理從AMR編解碼器55輸出的編碼LPC濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)。AMR編解碼器55會(huì)對(duì)LPC濾波數(shù)據(jù)中的回波進(jìn)行編碼,只要回波延遲小于LPC濾波器的長(zhǎng)度。如上所述,LPC濾波器具有十量級(jí)(p)的樣本。使用8kHz的采樣頻率,這對(duì)應(yīng)于1. 25ms的最大延遲。如果添加具有較長(zhǎng)延遲的回波,則它不能被編碼到LPC系數(shù)中。然而它會(huì)被編碼在剩余或激發(fā)信號(hào)之內(nèi)。為了說明這一點(diǎn),將會(huì)描述其中使用2ms和10ms回波將二進(jìn)制1和0編碼在音頻中的實(shí)施例。 圖8圖示了在這個(gè)實(shí)施例中由應(yīng)用程序軟件69執(zhí)行以恢復(fù)隱藏?cái)?shù)據(jù)的處理。如所示,在這個(gè)實(shí)施例中,應(yīng)用程序軟件69接收用于每個(gè)幀的當(dāng)它由AMR編解碼器55輸出時(shí)的激發(fā)編碼數(shù)據(jù)。接收到的數(shù)據(jù)中的固定碼簿索引由固定碼簿部件121使用,以從固定碼簿123中識(shí)別用于當(dāng)前幀的激發(fā)脈沖。這些激發(fā)脈沖然后由從AMR編解碼器55接收的編碼數(shù)據(jù)中定義的相應(yīng)固定增益放大。放大的激發(fā)脈沖然后被施加到加法器127,在那里它們被添加到通過將以前幀的激發(fā)脈沖傳遞通過增益129和自適應(yīng)碼簿延遲131而獲得的以前激發(fā)脈沖的適當(dāng)放大和延遲的版本。在從AMR編解碼器55接收的編碼數(shù)據(jù)中定義所使用的自適應(yīng)碼簿增益和延遲。來自加法器127的輸出是用于當(dāng)前幀的剩余或激發(fā)信號(hào)的脈沖表示。如圖8所示,激發(fā)信號(hào)的這個(gè)脈沖表示(e》然后被傳遞到自相關(guān)部件107,該自相關(guān)部件107計(jì)算在滯后數(shù)據(jù)存儲(chǔ)器108中定義的不同滯后的自相關(guān)。圖9圖示了當(dāng)在接收到的音頻中存在2ms回波時(shí)針對(duì)所有正滯后從自相關(guān)部件107輸出的自相關(guān)。如所示,存在零滯后處的主峰值132和對(duì)應(yīng)于2ms的滯后處的另一個(gè)峰值134。因此,自相關(guān)部件107的輸出可以像以前一樣由回波識(shí)別部件109和數(shù)據(jù)恢復(fù)部件111處理以恢復(fù)隱藏的數(shù)據(jù)F(t)。
改進(jìn) 現(xiàn)在參考圖10、 11和12對(duì)上述實(shí)施例進(jìn)行若干改進(jìn)。進(jìn)行這些改進(jìn)以增加隱藏?cái)?shù)據(jù)的成功恢復(fù),并且旨在抗擊可能掩蓋回波存在的語音或房間聲音的影響。這些改進(jìn)將被施加到上述第一實(shí)施例,但是它們同樣可以很好地適用于其它實(shí)施例。
如通過比較圖4和IO可以看到的那樣,在第一個(gè)改進(jìn)中,用于當(dāng)前幀的LPC合成濾波器103的脈沖響應(yīng)(h(n))由高通濾波器151進(jìn)行濾波,以減少脈沖響應(yīng)中的較低頻率的影響。發(fā)明人發(fā)現(xiàn)回波信息通常被編碼到脈沖響應(yīng)的較高頻帶中。這種高通濾波因此改善了用于回波的自相關(guān)峰值的銳度,使得更容易識(shí)別它們的存在。高通濾波器151優(yōu)選地過濾掉大約2kHz以下的頻率(對(duì)應(yīng)于采樣頻率四分之一的頻率),盡管通過僅過濾掉大約lkHz以下的頻率仍然可以進(jìn)行某種增益。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,這種濾波是過濾掉脈沖響應(yīng)低頻部分的幀"內(nèi)"濾波(亦即僅在幀內(nèi)進(jìn)行濾波),盡管還可以執(zhí)行幀"間"濾波(例如過濾掉發(fā)生在幀之間的脈沖響應(yīng)的緩慢變化特征)。 圖11圖示了實(shí)現(xiàn)相同結(jié)果的替換方式。具體地,在這個(gè)實(shí)施例中,用于當(dāng)前幀的LPC系數(shù)Sj在用于配置LPC合成濾波器103之前被傳遞通過高通濾波器153。在這種情況下,高通濾波器153去除了與合成濾波器103的較低頻率極點(diǎn)相對(duì)應(yīng)的系數(shù)。這通過對(duì)LPC系數(shù)進(jìn)行因式分解以識(shí)別極點(diǎn)頻率和帶寬來實(shí)現(xiàn)。在下限以下的頻率處的極點(diǎn)被丟棄,并且剩下的極點(diǎn)用于生成只有較高頻率的合成濾波器103。其余的處理跟以前一樣,并且進(jìn)一步的描述將不再給出。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,這種濾波也是幀內(nèi)濾波,盡管還可以執(zhí)行幀間濾波。 圖12圖示了可以被應(yīng)用以增加恢復(fù)隱藏?cái)?shù)據(jù)的成功率的進(jìn)一步改進(jìn)。如所示,這個(gè)實(shí)施例和圖4所示的實(shí)施例之間的主要差別在于提供了高通濾波器155,用于執(zhí)行幀間濾波以過濾掉通常由音頻自身和用戶的蜂窩電話21位于其中的房間的聲音造成的自相關(guān)輸出中的緩慢變化的相關(guān)性(亦即從幀到幀變化緩慢的相關(guān)性)。除了過濾掉這樣的幀間變化之外或者代替地,高通濾波器155可以執(zhí)行幀內(nèi)濾波,以從每個(gè)幀內(nèi)的自相關(guān)輸出去除低頻相關(guān)性。已發(fā)現(xiàn)這使回波造成的相關(guān)性峰值尖銳,從而使得它們更容易識(shí)別。
—般編碼方案 在上述實(shí)施例中,通過添加具有不同延遲的回波而將數(shù)據(jù)隱藏在音頻信號(hào)之內(nèi)。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,存在下述各種方式,其中數(shù)據(jù)可以隱藏在音頻之內(nèi)并仍然被傳遞通過AMR編解碼器55。 一般地說,可以分別用圖13和14所示的一般框圖來表示上述數(shù)據(jù)隱藏和恢復(fù)過程。如圖13所示,一般數(shù)據(jù)隱藏過程可以被認(rèn)為涉及與AMR編 解碼器所執(zhí)行的類似的編碼操作161,以生成AMR參數(shù)(其可以是最終的AMR輸出參數(shù)或在 AMR處理中生成的中間參數(shù))。這些參數(shù)中的一個(gè)或多個(gè)然后取決于要被隱藏在音頻之內(nèi) 的數(shù)據(jù)而被改變163。修改的參數(shù)然后被解碼165以生成修改的音頻信號(hào),其作為聲音信號(hào) 被傳輸并由蜂窩電話的麥克風(fēng)23接收。在進(jìn)行濾波和模擬數(shù)字轉(zhuǎn)換之后,音頻編碼器167 然后以上述方式處理數(shù)字化的音頻樣本以生成修改的參數(shù)。修改的參數(shù)然后由參數(shù)處理部 件169處理,以檢測(cè)對(duì)參數(shù)做出的(一個(gè)或多個(gè))修改,并從而恢復(fù)隱藏的數(shù)據(jù)。
在將回波添加到音頻以對(duì)隱藏的數(shù)據(jù)進(jìn)行編碼的情況下,這可以以上述方式容易 地進(jìn)行,而不必在電視演播室中(或數(shù)據(jù)要被隱藏在音頻之內(nèi)的任何地方)執(zhí)行詳細(xì)的編 碼過程。代替地,通過操縱AMR編碼過程的輸出參數(shù)或中間參數(shù)可以添加回波。例如,通 過向上述方程(3)中定義的自相關(guān)矩陣的一個(gè)或多個(gè)條目添加常數(shù),或者通過直接操縱從 LPC分析確定的LPC系數(shù)中的一個(gè)或多個(gè)的值,可以將回波添加到音頻。
還可以通過調(diào)制音頻編碼參數(shù)的其它更多直接方式來隱藏?cái)?shù)據(jù)。例如,可以修改 針對(duì)音頻生成的線狀譜頻率(例如通過用要被隱藏的數(shù)據(jù)來改變LSF的最低有效位),或者 可以根據(jù)要被隱藏的數(shù)據(jù)來修改從中確定LSF的極點(diǎn)的頻率或帶寬。代替地,可以修改激 發(fā)參數(shù)來承載隱藏的數(shù)據(jù)。例如,AMR編解碼器55使用具有可變脈沖位置和符號(hào)的定義脈 沖鏈的固定和自適應(yīng)碼簿來對(duì)激發(fā)信號(hào)進(jìn)行編碼。因此,通過改變軌道或子幀中的一個(gè)或 多個(gè)之內(nèi)的脈沖位置的最低有效位,或者通過改變所選擇的軌道或子幀的符號(hào),可以隱藏 數(shù)據(jù)。 代替施加回波以將數(shù)據(jù)隱藏在音頻中,可以取決于要被隱藏的數(shù)據(jù)而改變音頻信 號(hào)的一個(gè)或多個(gè)頻率分量的相位。在固定和自適應(yīng)碼簿所編碼的脈沖的位置中,來自音頻 的相位信息被保留到某種程度。因此,通過從碼簿重新生成激發(fā)脈沖并且檢測(cè)相關(guān)(一個(gè) 或多個(gè))頻率分量隨時(shí)間的相位變化,可以從AMR編解碼器55的輸出中檢測(cè)這種相位編 碼。 如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,非常不可能的是演播室系統(tǒng)會(huì)使用實(shí)際的 AMR編碼器和解碼器模型,因?yàn)殡娨曆莶ナ抑械囊纛l質(zhì)量比AMR編解碼器55中使用的大得 多。充分的演播室系統(tǒng)因此會(huì)將音頻帶分成AMR帶(在300Hz和3. 4kHz之間)和這個(gè)范 圍之外的非AMR帶。然后會(huì)如上所述操縱AMR帶,但是不會(huì)使用AMR解碼器重構(gòu)AMR帶信 號(hào)。相反地,會(huì)將來自從原始音頻信號(hào)獲得的實(shí)際LPC剩余的AMR帶音頻信號(hào)與修改的LPC 數(shù)據(jù)進(jìn)行合成以得到更高的音頻質(zhì)量。代替地,在用隱藏的數(shù)據(jù)修改激發(fā)參數(shù)的情況下,會(huì) 從修改的參數(shù)來構(gòu)造剩余,該修改的參數(shù)然后會(huì)由合成濾波器使用從LPC分析獲得的LPC 系數(shù)來進(jìn)行濾波。修改的AMR帶然后會(huì)被添加到非AMR帶,以便作為電視信號(hào)的一部分進(jìn) 行傳輸。在圖15和16中圖示了這種處理。 具體地,圖15圖示了在原始音頻已被分成AMR帶和非AMR帶之后可以在電視演播 室之內(nèi)執(zhí)行的處理。如所示,音頻AMR帶被輸入到LPC編碼器171,該LPC編碼器171執(zhí)行 上述LPC分析以生成用于當(dāng)前幀的LPC系數(shù)ai。這些系數(shù)然后被傳遞到系數(shù)改變部件173, 該系數(shù)改變部件173取決于要被隱藏在音頻信號(hào)之內(nèi)的數(shù)據(jù)而改變這些系數(shù)中的一個(gè)或 多個(gè)。修改的LPC系數(shù)^然后被輸出以根據(jù)上面給出的方程(2)配置LPC合成濾波器175。 如圖15所示,LPC編碼器171所生成的LPC系數(shù)ai用于根據(jù)上面的方程(6)配置逆LPC
16濾波器177。從中生成當(dāng)前LPC系數(shù)組的音頻幀然后被傳遞通過這個(gè)逆LPC濾波器以生成 LPC剩余(激發(fā))信號(hào),其然后被施加到LPC合成濾波器175。這導(dǎo)致生成修改的音頻AMR 帶信號(hào),其然后在與視頻軌道相結(jié)合以便進(jìn)行分發(fā)之前與非AMR帶信號(hào)相結(jié)合。
圖16圖示了其中激發(fā)參數(shù)隨著要被隱藏的數(shù)據(jù)而改變的替換場(chǎng)景。具體地,如圖 16所示,音頻AMR帶初始由LPC編碼器171處理,該LPC編碼器171在這個(gè)實(shí)施例中生成并 輸出表示剩余或激發(fā)信號(hào)的固定和自適應(yīng)碼簿數(shù)據(jù)。這個(gè)碼簿數(shù)據(jù)然后被傳遞通過改變部 件181,該改變部件181改變碼簿數(shù)據(jù),以便根據(jù)要被隱藏在音頻信號(hào)之內(nèi)的數(shù)據(jù)而改變固 定碼簿數(shù)據(jù)所表示的一個(gè)或多個(gè)脈沖的位置和/或符號(hào)。修改的碼簿數(shù)據(jù)然后被輸出到剩 余發(fā)生器183,該剩余發(fā)生器183重新生成相應(yīng)的剩余信號(hào),其在由AMR編解碼器55處理 時(shí)會(huì)重新生成修改的固定和自適應(yīng)碼簿數(shù)據(jù)。這例如可以通過以下實(shí)現(xiàn)執(zhí)行迭代程序以 適配起動(dòng)剩余,直到對(duì)它的編碼導(dǎo)致改變部件181所輸出的修改的碼簿數(shù)據(jù)。代替地,修改 的碼簿數(shù)據(jù)可以用于生成直接用作剩余信號(hào)的脈沖鏈。脈沖之間的間隙可以填充以可以使 用用于當(dāng)前幀的LPC系數(shù)和逆LPC濾波器生成的剩余信號(hào)的一部分或噪聲。不管所使用的 技術(shù),如此生成的剩余信號(hào)然后被傳遞到LPC合成濾波器175,該LPC合成濾波器175使用 LPC編碼器171所生成的LPC系數(shù)進(jìn)行配置。LPC合成濾波器175然后對(duì)施加的剩余信號(hào) 進(jìn)行濾波以生成修改的音頻AMR帶,其然后與非AMR帶相結(jié)合以重新生成用于與視頻軌道
相結(jié)合的音頻。
音頻識(shí)別 在上述實(shí)施例中,數(shù)據(jù)隱藏在電視節(jié)目的音頻之內(nèi),并且通過蜂窩電話中的適當(dāng) 處理來恢復(fù)這個(gè)數(shù)據(jù)。為了恢復(fù)隱藏的數(shù)據(jù)而執(zhí)行的處理利用了已經(jīng)由蜂窩電話的音頻編 解碼器執(zhí)行的處理的至少一部分。如上所述,發(fā)明人發(fā)現(xiàn)這減少了恢復(fù)隱藏的數(shù)據(jù)所需的 計(jì)算開銷。類似的優(yōu)點(diǎn)可以在下述其它應(yīng)用中獲得沒有實(shí)際 的數(shù)據(jù)隱藏在音頻之內(nèi),但是 其中例如將要從音頻自身的聲音模式(指紋)中識(shí)別音頻?,F(xiàn)在參考音樂識(shí)別系統(tǒng)來描述 其中可以實(shí)現(xiàn)這一點(diǎn)的方式。 目前,存在若干音樂識(shí)別服務(wù),諸如Shazam所提供的服務(wù)。這些音樂識(shí)別服務(wù)允 許蜂窩電話21的用戶通過撥打號(hào)碼并將音樂播放到耳機(jī)來識(shí)別當(dāng)前播放的音樂軌道。服 務(wù)然后將軌道的名稱返回到電話。在技術(shù)上,系統(tǒng)通過以下操作設(shè)立從蜂窩電話到遠(yuǎn)程服 務(wù)器的電話呼叫,同時(shí)向電話播放音樂。遠(yuǎn)程服務(wù)器在預(yù)定時(shí)期之后斷開呼叫,相對(duì)于存儲(chǔ) 在數(shù)據(jù)庫中的模式對(duì)接收到的聲音執(zhí)行某種匹配以識(shí)別音樂,然后以它識(shí)別的音樂軌道的 名稱的方式發(fā)送文本消息至電話。 根據(jù)來自Shazam系統(tǒng)的發(fā)明人以及其它的公布材料,用于識(shí)別軌道的一般過程 為 1.將原始音頻信號(hào)轉(zhuǎn)換成頻譜圖,這通常通過計(jì)算一系列重疊快速傅立葉變換 (FFT)來實(shí)現(xiàn)。 2.分析頻譜圖以確定特定特征——這些通常是能量峰值位置,通過它們的時(shí)間和 頻率來表征。 3.使用這些特征的散列函數(shù),并使用散列函數(shù)的結(jié)果來查找數(shù)據(jù)庫以確定可能匹 配音頻信號(hào)的一組條目。 4.針對(duì)這些潛在的匹配執(zhí)行進(jìn)一步的模式匹配,以確定音頻信號(hào)是否真正匹配從數(shù)據(jù)庫中識(shí)別的那些中的任何一個(gè)。 傳統(tǒng)上,根據(jù)對(duì)用于音頻信號(hào)的數(shù)字化音頻樣本的重疊塊進(jìn)行的一系列快速傅立 葉變換來確定用于音頻的頻譜圖。當(dāng)在移動(dòng)電話網(wǎng)絡(luò)之上進(jìn)行操作時(shí),輸入的音頻會(huì)由蜂 窩電話中的AMR編解碼器壓縮以便經(jīng)由空中接口37傳輸?shù)揭苿?dòng)電話網(wǎng)絡(luò)35,在那里壓縮的 音頻被解壓縮以重新生成數(shù)字音頻樣本。服務(wù)器然后對(duì)數(shù)字音頻樣本執(zhí)行傅立葉變換分析 以生成用于音頻信號(hào)的頻譜圖。 發(fā)明人已認(rèn)識(shí)到,移動(dòng)電話系統(tǒng)所執(zhí)行的這種編碼和解碼然后還有Shazam服務(wù) 器所執(zhí)行的隨后的頻率分析是浪費(fèi)的,并且可以實(shí)施類似的系統(tǒng)而不必將壓縮的音頻解碼 回到音頻樣本。用這種方式,軌道識(shí)別處理可以整個(gè)地在蜂窩電話21之內(nèi)執(zhí)行。用戶因此 不必放置至遠(yuǎn)程服務(wù)器的呼叫以便能夠識(shí)別正在播放的軌道?,F(xiàn)在參考圖17來描述其中 可以實(shí)現(xiàn)這一點(diǎn)的方式。 具體地,圖17是圖示在蜂窩電話21上運(yùn)行的軌道識(shí)別軟件應(yīng)用程序(未示出) 所執(zhí)行的處理的框圖。如所示,在這個(gè)實(shí)施例中,軟件應(yīng)用程序從AMR編解碼器55接收AMR 編碼LPC數(shù)據(jù)和AMR編碼激發(fā)數(shù)據(jù)。AMR LPC編碼數(shù)據(jù)然后像以前一樣被傳遞到VQ部件 91、預(yù)測(cè)加法部件93、平均值加法部件99和LSF轉(zhuǎn)換部件101。這種處理的結(jié)果是重新生 成的LPC系數(shù)&。用于當(dāng)前幀的LPC系數(shù)然后被傳遞到計(jì)算它們的快速傅立葉變換的FFT部 件201。 類似地,AMR編碼激發(fā)數(shù)據(jù)由固定碼簿部件121 、固定增益125、加法器127、自適應(yīng) 碼簿延遲121和自適應(yīng)增益129進(jìn)行解碼,以重新生成表示用于輸入幀的剩余的激發(fā)脈沖。 這些解碼的脈沖然后被輸入到FFT部件203以生成激發(fā)脈沖的傅立葉變換。如圖17所示, 來自兩個(gè)FFT部件201和203的輸出由乘法器205乘在一起,以生成用于當(dāng)前幀的組合頻 率表示。乘法器205所輸出的這種組合頻率表示應(yīng)當(dāng)近似對(duì)應(yīng)于當(dāng)前幀之內(nèi)的數(shù)字音頻樣 本的FFT。這是因?yàn)锳MR編解碼器55所執(zhí)行的LPC分析之下的源濾波器模型。具體地,如 上所述,LPC分析假定語音通過以下生成通過合成濾波器對(duì)適當(dāng)?shù)募ぐl(fā)信號(hào)進(jìn)行濾波。換 言之,音頻通過以下生成使激發(fā)信號(hào)與合成濾波器的脈沖響應(yīng)進(jìn)行巻積,或者在頻域中, 使激發(fā)信號(hào)的頻譜與LPC合成濾波器的頻譜相乘。 在當(dāng)前實(shí)施例中,LPC系數(shù)的頻譜與碼簿激發(fā)脈沖的頻譜相乘。這些是分別對(duì)LPC 合成濾波器的頻譜和激發(fā)信號(hào)的頻譜的逼近。因此,從乘法器205輸出的組合頻譜會(huì)是當(dāng) 前幀之內(nèi)的數(shù)字化音頻信號(hào)的頻譜的逼近。如圖17所示,這個(gè)頻譜然后被輸入到頻譜圖生 成部件207,該頻譜圖生成部件207從接收到的頻譜中生成用于輸入的音頻信號(hào)的相鄰幀 的頻譜圖。如此生成的頻譜圖然后被傳遞到模式匹配部件209,在那里使用來自頻譜圖的特 定特征來搜索存儲(chǔ)在模式數(shù)據(jù)庫211之內(nèi)的模式,以識(shí)別蜂窩電話的麥克風(fēng)23所拾取的音 頻軌道。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,這種模式匹配可以使用與Shazam系統(tǒng)的服 務(wù)器中使用的那些類似的處理技術(shù),亦即首先使用散列函數(shù)來識(shí)別模式數(shù)據(jù)庫211的一部 分以與音頻的頻譜圖相匹配。模式匹配部件209所輸出的識(shí)別的軌道信息然后被輸出用于 在顯示器29上向用戶顯示。 發(fā)明人發(fā)現(xiàn)與將壓縮的音頻數(shù)據(jù)轉(zhuǎn)換回到數(shù)字化音頻樣本然后對(duì)音頻樣本采取 快速傅立葉變換相比,這種處理需要顯著更少的計(jì)算。事實(shí)上,發(fā)明人發(fā)現(xiàn)與對(duì)原始音頻樣 本采取快速傅立葉變換相比,這種處理需要更少的處理。這是因?yàn)閷?duì)LPC系數(shù)采取快速傅
18立葉變換比較簡(jiǎn)單,因?yàn)槊繋挥?0個(gè)系數(shù);而且對(duì)碼簿激發(fā)脈沖的快速傅立葉變換也比 較直接,因?yàn)楹?jiǎn)單地通過區(qū)別脈沖位置或者使它們?cè)诓檎冶碇蓄A(yù)先計(jì)算(因?yàn)榇嬖谟邢迶?shù) 目的碼簿所定義的脈沖位置),可以將脈沖位置系數(shù)轉(zhuǎn)換到頻域中。 如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,由于所進(jìn)行的逼近,以這種方式獲得的作 為結(jié)果的頻譜圖無法與從音頻樣本的FFT導(dǎo)出的頻譜圖直接相比較。然而,該頻譜圖攜帶 了足夠的并且與傳統(tǒng)頻譜圖類似的信息,所以可以使用相同或相似的模式匹配技術(shù)用于音 頻識(shí)別。為了最佳結(jié)果,存儲(chǔ)在數(shù)據(jù)庫211中的模式信息優(yōu)選地從以類似方式獲得的頻譜 圖中生成(亦即根據(jù)AMR編解碼器輸出,而不是使用從音頻樣本中直接生成的那些頻譜 圖)。 修改和進(jìn)一步替換 上面已描述了說明下述方式的若干實(shí)施例蜂窩電話中的音頻編解碼器可以用于 減少電話的其它部分所執(zhí)行的隨后處理,以便恢復(fù)隱藏的信息或者識(shí)別輸入的音頻片段。 如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,可以對(duì)上述實(shí)施例進(jìn)行各種修改和改進(jìn),并且現(xiàn)在 來描述這些修改中的一些修改。 在上述音頻識(shí)別實(shí)施例中,所有的模式數(shù)據(jù)庫211都存儲(chǔ)在蜂窩電話21之內(nèi)。在 替換實(shí)施例中,模式匹配部件209可以布置成根據(jù)為音頻生成的頻譜圖的特定特征生成散 列函數(shù),并且這個(gè)散列函數(shù)的結(jié)果然后可以被傳輸?shù)竭h(yuǎn)程服務(wù)器,該遠(yuǎn)程服務(wù)器下載將要 與音頻的頻譜圖相匹配的適當(dāng)模式信息。以這種方式,必須存儲(chǔ)在蜂窩電話21上的模式數(shù) 據(jù)庫211之內(nèi)的數(shù)據(jù)量可以保持到最小,同時(shí)僅引入了在用于從遠(yuǎn)程數(shù)據(jù)庫中檢索所選擇 的模式的處理中的比較小的延遲。 在上述音頻識(shí)別實(shí)施例中,線狀譜頻率被轉(zhuǎn)換回到LPC系數(shù),然后使用FFT將其轉(zhuǎn) 換到頻域中。在替換實(shí)施例中,可以直接根據(jù)線狀譜頻率或者根據(jù)從它們導(dǎo)出的極點(diǎn)來確 定用于LPC數(shù)據(jù)的頻譜。這會(huì)進(jìn)一步減少執(zhí)行音頻識(shí)別所需的處理。 在上述較早的實(shí)施例中,數(shù)據(jù)隱藏在音頻中并且用于將電話的操作同步到用戶所 觀看的電視節(jié)目。在剛剛描述的最后實(shí)施例中,在音頻之內(nèi)沒有隱藏的數(shù)據(jù),而是代替地, 音頻的特定特征被識(shí)別并用于對(duì)音頻進(jìn)行識(shí)別。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,可 以在同步實(shí)施例中使用類似的音頻識(shí)別技術(shù)。例如,在電話上運(yùn)行的軟件應(yīng)用程序可以通 過識(shí)別音頻聲音軌道之內(nèi)的預(yù)定部分而將自身同步到電視節(jié)目。這種類型的同步還可以用 于控制電視節(jié)目字幕的輸出。 在上述較早的實(shí)施例中,通過確定合成濾波器的脈沖響應(yīng)或LPC系數(shù)的自相關(guān)值 來恢復(fù)隱藏的數(shù)據(jù)。這種相關(guān)性處理不是必要的,因?yàn)榭梢酝ㄟ^直接監(jiān)視系數(shù)或脈沖響應(yīng) 來發(fā)現(xiàn)隱藏的數(shù)據(jù)。然而,自相關(guān)處理是優(yōu)選的,因?yàn)樗沟酶菀鬃R(shí)別回波。
在上述改進(jìn)中,各種高通濾波技術(shù)用于過濾掉與音頻和房間聲音相關(guān)聯(lián)的低頻成 分。在優(yōu)選實(shí)施例中,在蜂窩電話中執(zhí)行這樣的高通濾波的情況下,回波信號(hào)優(yōu)選地僅被添 加到(在隱藏過程期間)AMR帶的高頻部分中的音頻。例如在lkHz以上,并且優(yōu)選地僅在 2kHz以上。這例如可以通過以下實(shí)現(xiàn)對(duì)音頻信號(hào)進(jìn)行濾波以去除較低頻率AMR帶成分, 然后以需要的時(shí)間延遲將濾波的輸出添加到原始音頻。這是優(yōu)選的,因?yàn)闇p少了會(huì)被蜂窩 電話中執(zhí)行的高通濾波過濾掉(并因此丟失)的回波信號(hào)中的能量。 在上述實(shí)施例中,已假定蜂窩電話所使用的音頻編解碼器是AMR編解碼器。然而,
19如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,上述原理和概念還適用于其它類型的音頻編解碼
器,并且尤其適用于依靠輸入音頻的線性預(yù)測(cè)分析的那些音頻編解碼器。 在上述實(shí)施例中,通過蜂窩電話上運(yùn)行的軟件來執(zhí)行從音頻編解碼器輸出的壓縮
音頻數(shù)據(jù)的各種處理。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,這種處理中的一些或全部可
以由專用硬件電路執(zhí)行,盡管軟件由于其在制造之后被添加到蜂窩電話的能力以及其一旦
裝載可以被更新的能力而是優(yōu)選的。用于使蜂窩電話以上述方式操作的軟件可以作為信號(hào)
提供,或者可以提供在諸如緊致盤之類的載體或其它載體介質(zhì)上。 在上述實(shí)施例中,在蜂窩電話之內(nèi)執(zhí)行處理。然而,如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到 的那樣,益處會(huì)適用于具有內(nèi)置音頻編解碼器的任何通信裝置。 在上述早先的實(shí)施例中,數(shù)據(jù)隱藏在音頻之內(nèi)并且用于使蜂窩電話的操作與用戶
所觀看的電視秀同步。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,并且如WO 02/45273所述,存
在對(duì)于隱藏?cái)?shù)據(jù)的各種其它用途。例如,隱藏的數(shù)據(jù)可以識(shí)別用于遠(yuǎn)程位置的URL,或者可
以識(shí)別要被發(fā)送到用于說明的預(yù)先存儲(chǔ)的URL的代碼。這種隱藏的數(shù)據(jù)可以為用戶提供例
如關(guān)于電視節(jié)目的另外信息,并且/或者為用戶提供特別報(bào)價(jià)或其它目標(biāo)廣告。 在上述實(shí)施例中,經(jīng)由RF通信鏈路13向用戶傳送電視節(jié)目。如本領(lǐng)域技術(shù)人員
將會(huì)意識(shí)到的那樣,可以經(jīng)由任何適當(dāng)?shù)姆职l(fā)技術(shù)如通過有線電視、因特網(wǎng)、衛(wèi)星電視等向
用戶分發(fā)電視節(jié)目。還可以從存儲(chǔ)介質(zhì)如DVD獲得并通過適當(dāng)?shù)腄VD播放器讀出。 在上述實(shí)施例中,蜂窩電話拾取電視節(jié)目的音頻。如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到
的那樣,在從收音機(jī)或其它揚(yáng)聲器系統(tǒng)獲得音頻的情況下也可以使用上述技術(shù)。 在上述實(shí)施例中,假定在電視系統(tǒng)的電視演播室一端將數(shù)據(jù)隱藏在音頻之內(nèi)。在
替換實(shí)施例中,例如通過機(jī)頂盒可以在電視系統(tǒng)的用戶一端將數(shù)據(jù)隱藏在音頻之內(nèi)。機(jī)頂
盒可以適合于在向用戶輸出電視節(jié)目之前將適當(dāng)?shù)臄?shù)據(jù)隱藏到音頻中。 在上述實(shí)施例中,軟件應(yīng)用程序處理從蜂窩電話21之內(nèi)的AMR編解碼器接收的壓
縮音頻數(shù)據(jù)。在替換實(shí)施例中,軟件應(yīng)用程序可以對(duì)經(jīng)由電話網(wǎng)絡(luò)接收的并且由RF處理單
元57提供給處理器63的壓縮音頻數(shù)據(jù)執(zhí)行類似處理。 在上述實(shí)施例中,假定音頻編解碼器的輸出不包括LPC系數(shù)自身,而是包括從它 們導(dǎo)出的其它參數(shù)如線狀譜頻率或LPC合成濾波器的濾波器極點(diǎn)。如本領(lǐng)域技術(shù)人員將會(huì) 意識(shí)到的那樣,如果蜂窩電話21中使用的音頻編解碼器使得由其導(dǎo)出的LPC系數(shù)可用于處 理器63,那么軟件應(yīng)用程序?yàn)榱嘶謴?fù)LPC系數(shù)而執(zhí)行的初始處理就是不必要的,并且軟件 應(yīng)用程序可以直接對(duì)音頻編解碼器所輸出的LPC系數(shù)進(jìn)行工作。這會(huì)進(jìn)一步減少需要的處 理。 如本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到的那樣,在上述實(shí)施例中描述的比特率、采樣率等 的精確值并不是本發(fā)明的必要特征,而是可以在不脫離本發(fā)明的情況下進(jìn)行改變。
權(quán)利要求
一種用于從輸入的音頻信號(hào)中恢復(fù)隱藏的數(shù)據(jù)或者用于識(shí)別輸入的音頻信號(hào)的方法,該方法使用電信設(shè)備,所述電信設(shè)備具有音頻編碼器,所述音頻編碼器用于壓縮輸入的音頻信號(hào)以便傳送到電信網(wǎng)絡(luò),所述方法由所述電信設(shè)備執(zhí)行并且特征在于,通過音頻編解碼器傳遞輸入的音頻信號(hào)以生成壓縮的音頻數(shù)據(jù),并且處理壓縮的音頻數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述音頻編碼器對(duì)輸入的音頻執(zhí)行線性預(yù)測(cè) (LP)分析以生成表示輸入的音頻的LP數(shù)據(jù),并且其中所述處理步驟處理所述LP數(shù)據(jù)以恢 復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。
3. 根據(jù)權(quán)利要求2所述的方法,其中,所述音頻編碼器壓縮所述LP數(shù)據(jù)以生成壓縮的 所述LP數(shù)據(jù),并且其中所述處理步驟包括從壓縮的音頻數(shù)據(jù)中重新生成所述LP數(shù)據(jù)的步 驟。
4. 根據(jù)權(quán)利要求2或3所述的方法,其中,所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù),并且所述處 理步驟使用所述LP濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
5. 根據(jù)權(quán)利要求4所述的方法,其中,所述處理步驟包括生成合成濾波器的脈沖響應(yīng) 的步驟,或者包括對(duì)所述LP濾波數(shù)據(jù)執(zhí)行逆萊文森_德賓算法的步驟。
6. 根據(jù)權(quán)利要求2、3或4所述的方法,其中,所述LP數(shù)據(jù)包括LP激發(fā)數(shù)據(jù),并且所述 處理步驟使用所述LP激發(fā)數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
7. 根據(jù)權(quán)利要求2或3所述的方法,其中,所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)和LP激發(fā)數(shù) 據(jù),并且其中所述處理步驟處理對(duì)應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù)據(jù)中之一的壓縮 音頻數(shù)據(jù)的子集以恢復(fù)隱藏的數(shù)據(jù)。
8. 根據(jù)任何在先權(quán)利要求所述的方法,其中所述音頻信號(hào)包括由所述音頻信號(hào)的一個(gè) 或多個(gè)回波定義的隱藏?cái)?shù)據(jù),并且其中所述處理步驟處理壓縮的音頻以識(shí)別所述音頻信號(hào) 之內(nèi)的回波的存在,以便恢復(fù)隱藏的數(shù)據(jù)。
9. 根據(jù)任何在先權(quán)利要求所述的方法,其中隱藏的數(shù)據(jù)的每個(gè)數(shù)據(jù)符號(hào)用所述音頻信 號(hào)之內(nèi)的回波序列或回波組合表示,并且其中所述處理步驟包括識(shí)別所述回波組合以恢復(fù) 隱藏的數(shù)據(jù)的步驟,或者包括跟蹤音頻中的回波序列以恢復(fù)隱藏的數(shù)據(jù)的步驟。
10. 根據(jù)權(quán)利要求8或9所述的方法,其中所述音頻編碼器具有預(yù)定操作頻帶,并且其 中所述回波隱藏在音頻之內(nèi)的操作頻帶預(yù)定部分之內(nèi),優(yōu)選地隱藏在頻帶的上部,并且其 中所述處理步驟包括濾波步驟以過濾掉所述預(yù)定部分之外的頻率。
11. 根據(jù)任何在先權(quán)利要求所述的方法,其中,所述處理步驟為所述音頻信號(hào)的時(shí)間 幀序列中的每一個(gè)確定一個(gè)或多個(gè)自相關(guān)值,并且使用確定的所述自相關(guān)值恢復(fù)隱藏的數(shù) 據(jù)。
12. 根據(jù)權(quán)利要求11所述的方法,其中,所述處理步驟執(zhí)行確定的所述自相關(guān)值的高 通濾波以去除緩慢變化的相關(guān)性。
13. 根據(jù)任何在先權(quán)利要求所述的方法,其中,所述處理步驟在不從壓縮的音頻數(shù)據(jù)中 重新生成數(shù)字化的音頻樣本的情況下恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻。
14. 一種電信設(shè)備(21),包括:麥克風(fēng)(23),用于接收聲音信號(hào)并且用于將接收到的所述聲音信號(hào)轉(zhuǎn)換成相應(yīng)的音頻 電信號(hào);模擬數(shù)字轉(zhuǎn)換器(53),用于采樣所述音頻電信號(hào)以產(chǎn)生數(shù)字音頻樣本; 音頻編碼器(55),用于壓縮所述數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)以便傳送到電信 網(wǎng)絡(luò)(39);以及數(shù)據(jù)處理器(115),其耦合到所述音頻編碼器(55),用于處理壓縮的所述音頻數(shù)據(jù),以 恢復(fù)接收到的所述聲音信號(hào)之內(nèi)傳送的隱藏?cái)?shù)據(jù),或者識(shí)別接收到的所述聲音信號(hào)。
15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述音頻編碼器可操作用于對(duì)輸入的音頻執(zhí)行 線性預(yù)測(cè)(LP)分析以生成表示輸入的音頻的LP數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用 于處理所述LP數(shù)據(jù)以恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別輸入的音頻信號(hào)。
16. 根據(jù)權(quán)利要求15所述的設(shè)備,其中所述音頻編碼器可操作用于壓縮所述LP數(shù)據(jù)以 生成壓縮的所述LP數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用于從壓縮的音頻數(shù)據(jù)中重新 生成所述LP數(shù)據(jù)。
17. 根據(jù)權(quán)利要求15或16所述的設(shè)備,其中,所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù),并且所述 數(shù)據(jù)處理器可操作用于使用所述LP濾波數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
18. 根據(jù)權(quán)利要求17所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于生成合成濾波器 的脈沖響應(yīng)或者對(duì)所述LP濾波數(shù)據(jù)執(zhí)行逆萊文森_德賓算法以恢復(fù)隱藏的數(shù)據(jù)。
19. 根據(jù)權(quán)利要求15、 16或17所述的設(shè)備,其中,所述LP數(shù)據(jù)包括LP激發(fā)數(shù)據(jù),并且 所述數(shù)據(jù)處理器可操作用于使用所述LP激發(fā)數(shù)據(jù)來恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別音頻信號(hào)。
20. 根據(jù)權(quán)利要求15或16所述的設(shè)備,其中所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)和LP激發(fā) 數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用于處理對(duì)應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù) 據(jù)中之一的壓縮音頻數(shù)據(jù)的子集以恢復(fù)隱藏的數(shù)據(jù)。
21. 根據(jù)權(quán)利要求14至20中任何一項(xiàng)所述的設(shè)備,其中所述音頻信號(hào)包括由所述音頻 信號(hào)的一個(gè)或多個(gè)回波定義的隱藏?cái)?shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用于處理壓縮的 音頻數(shù)據(jù)以識(shí)別所述音頻信號(hào)之內(nèi)的回波的存在,以便恢復(fù)隱藏的數(shù)據(jù)。
22. 根據(jù)權(quán)利要求14至21中任何一項(xiàng)所述的設(shè)備,其中隱藏的數(shù)據(jù)的每個(gè)數(shù)據(jù)符號(hào)用 所述音頻信號(hào)之內(nèi)的回波序列或回波組合表示,并且其中所述數(shù)據(jù)處理器可操作用于識(shí)別 所述回波組合以恢復(fù)隱藏的數(shù)據(jù)或者跟蹤音頻中的回波序列以恢復(fù)隱藏的數(shù)據(jù)。
23. 根據(jù)權(quán)利要求21或22所述的設(shè)備,其中所述音頻編碼器具有預(yù)定操作頻帶,并且 其中所述回波隱藏在音頻之內(nèi)的操作頻帶預(yù)定部分之內(nèi),優(yōu)選地隱藏在頻帶的上部,并且 其中所述數(shù)據(jù)處理器可操作用于過濾掉所述預(yù)定部分之外的頻率。
24. 根據(jù)權(quán)利要求14至23中任何一項(xiàng)所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于 為時(shí)間幀序列中的每一個(gè)確定一個(gè)或多個(gè)自相關(guān)值,并且可操作用于使用確定的所述自相 關(guān)值恢復(fù)隱藏的數(shù)據(jù)。
25. 根據(jù)權(quán)利要求24所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于執(zhí)行確定的所述 自相關(guān)值的高通濾波以去除緩慢變化的相關(guān)性。
26. 根據(jù)權(quán)利要求14至25中任何一項(xiàng)所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于 在恢復(fù)隱藏的數(shù)據(jù)時(shí)執(zhí)行幀間和/或幀內(nèi)高通濾波。
27. 根據(jù)權(quán)利要求14至26中任何一項(xiàng)所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于 在不從壓縮的音頻數(shù)據(jù)中重新生成數(shù)字化的音頻樣本的情況下恢復(fù)隱藏的數(shù)據(jù)或者識(shí)別 音頻。
28. —種數(shù)據(jù)隱藏設(shè)備(5),包括音頻編碼裝置(161),用于接收并壓縮表示音頻信號(hào)的數(shù)字音頻樣本以生成壓縮的音 頻數(shù)據(jù);用于接收要被隱藏在所述音頻信號(hào)之內(nèi)的數(shù)據(jù)并且用于取決于接收到的所述數(shù)據(jù)而 改變壓縮的所述音頻數(shù)據(jù)以生成修改的壓縮音頻數(shù)據(jù)的裝置(163);以及用于使用修改的所述壓縮音頻數(shù)據(jù)來生成音頻樣本的裝置(165),所述音頻樣本表示 了原始的音頻信號(hào)并傳送隱藏的所述數(shù)據(jù)。
29. —種將數(shù)據(jù)隱藏在音頻信號(hào)中的方法,該方法包括取決于要被隱藏在音頻信號(hào)中 的數(shù)據(jù)而向音頻添加一個(gè)或多個(gè)回波的步驟,并且其特征在于,在將回波與音頻信號(hào)進(jìn)行 組合之前對(duì)所述回波進(jìn)行高通濾波。
30. —種機(jī)頂盒,包括用于接收音頻信號(hào)的裝置、用于將數(shù)據(jù)隱藏在接收的所述音頻信 號(hào)中的裝置以及用于為用戶輸出具有隱藏的所述數(shù)據(jù)的所述音頻信號(hào)的裝置,其中,所述 機(jī)頂盒可操作用于用所述音頻信號(hào)之內(nèi)的回波序列或回波組合來表示要被隱藏的所述數(shù) 據(jù)的每個(gè)數(shù)據(jù)符號(hào)。
31. 根據(jù)權(quán)利要求30所述的機(jī)頂盒,可操作用于在將那些回波添加到所述音頻信號(hào)之 前對(duì)所述回波中的一個(gè)或多個(gè)執(zhí)行高通濾波。
32. —種計(jì)算機(jī)可實(shí)施指令產(chǎn)品,包括用于使可編程處理器執(zhí)行根據(jù)權(quán)利要求1至13 中任何一項(xiàng)所述的處理步驟的計(jì)算機(jī)可實(shí)施指令。
全文摘要
本發(fā)明提供了一種用于恢復(fù)嵌入在輸入的聲音信號(hào)之內(nèi)的隱藏?cái)?shù)據(jù)的蜂窩電話。該電話將聲音數(shù)據(jù)傳遞通過電話的音頻編碼器,然后處理音頻編碼器所生成的壓縮音頻,以恢復(fù)隱藏的數(shù)據(jù)。本發(fā)明還提供了一種用于從音頻編碼器的壓縮輸出中識(shí)別音頻信號(hào)的類似電話。本發(fā)明還描述了用于將數(shù)據(jù)隱藏在音頻之內(nèi)的各種編碼技術(shù)。
文檔編號(hào)G10L19/06GK101715549SQ200880017878
公開日2010年5月26日 申請(qǐng)日期2008年5月29日 優(yōu)先權(quán)日2007年5月29日
發(fā)明者伊恩·邁克爾·霍斯金, 彼得·約翰·凱利, 約翰·賴伊, 邁克爾·雷蒙德·雷諾茲 申請(qǐng)人:英特拉松尼克斯有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
上蔡县| 松滋市| 唐海县| 孝义市| 辉县市| 宁国市| 隆昌县| 龙陵县| 施甸县| 公安县| 泰来县| 呼伦贝尔市| 堆龙德庆县| 阿拉善盟| 玛曲县| 大名县| 武夷山市| 张家川| 封丘县| 佛冈县| 游戏| 漯河市| 罗城| 纳雍县| 九台市| 安龙县| 安乡县| 黄龙县| 万山特区| 清原| 郯城县| 双流县| 清苑县| 永寿县| 枣强县| 定安县| 江都市| 渭南市| 图木舒克市| 理塘县| 山西省|