两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于處理音頻信號(hào)的方法和裝置的制作方法

文檔序號(hào):2831765閱讀:266來源:國知局
專利名稱:用于處理音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于處理音頻信號(hào)的方法和裝置。雖然本發(fā)明適用于 范圍很廣的應(yīng)用,但它尤其適用于處理通過數(shù)字介質(zhì)、廣播信號(hào)等接 收的音頻信號(hào)。
背景技術(shù)
總的來說,在用于將包含多個(gè)對(duì)象的音頻信號(hào)下混頻成單信號(hào)或 立體聲信號(hào)的過程中,從每個(gè)對(duì)象信號(hào)提取參數(shù)。解碼器可以使用這 些參數(shù)。在此過程中,通過用戶所作的選擇,每個(gè)對(duì)象的平移和增益 是可控的。

發(fā)明內(nèi)容
技術(shù)問題
然而,為了控制每個(gè)對(duì)象信號(hào),包含在下混頻中的源需要被適當(dāng) 地定位或平移。在通過用戶控制對(duì)象的情形下,控制整個(gè)對(duì)象信號(hào)是 不方便的。而且,很難再現(xiàn)包含多個(gè)對(duì)象的音頻信號(hào)的最佳狀態(tài)還不 如通過專家來控制它。
此外,在從編碼器未接收到重建對(duì)象信號(hào)的對(duì)象信息的情形下, 很難控制在下混頻信號(hào)中包含的對(duì)象信號(hào)。
技術(shù)解決方案
相應(yīng)地,本發(fā)明涉及一種用于處理音頻信號(hào)的裝置及其方法,基 本消除了由于相關(guān)技術(shù)的局限性和不足所導(dǎo)致的一個(gè)或多個(gè)問題。
本發(fā)明的一個(gè)目的是提供用于處理音頻信號(hào)的裝置及其方法,通過該裝置和方法,可以利用預(yù)先設(shè)置的預(yù)置信息控制對(duì)象的增益和平 移。
本發(fā)明的另一目的是提供用于處理音頻信號(hào)的裝置及其方法,通 過該裝置和方法,預(yù)先設(shè)置的預(yù)置信息可以獨(dú)立于音頻信號(hào)而被傳輸 或存儲(chǔ)。
本發(fā)明的另一目的是提供用于處理音頻信號(hào)的裝置及其方法,通 過該裝置和方法,基于用戶所做的選擇,通過選擇多個(gè)先前設(shè)置的預(yù) 置信息之一,可以控制對(duì)象的增益和平移。
本發(fā)明的另一目的是提供用于處理音頻信號(hào)的裝置及其方法,通 過該裝置和方法,可以利用從外部環(huán)境輸入的用戶預(yù)置信息控制對(duì)象 的增益和平移。
本發(fā)明的又一目的是提供用于處理音頻信號(hào)的裝置及其方法,通 過該裝置和方法,如果從編碼器未接收到對(duì)象信息,則可以通過利用 下混頻信號(hào)生成盲信息來控制音頻信號(hào)。
有益效果
相應(yīng)地,本發(fā)明提供以下效果或優(yōu)勢(shì)。
首先,可以容易地控制對(duì)象的增益和平移,不需要用戶利用預(yù)先 設(shè)置的預(yù)置信息為每個(gè)對(duì)象進(jìn)行設(shè)置。
第二,基于用戶所做的選擇,利用修改的預(yù)置信息,可以控制對(duì) 象的增益和平移。
第三,利用預(yù)先設(shè)置的多個(gè)預(yù)置信息,可以容易地控制對(duì)象的增 益和平移。
第四,通過利用從外部環(huán)境輸入的用戶預(yù)置信息,利用各種預(yù)置 信息,可以控制對(duì)象的增益和平移。第五,在使用不能生成對(duì)象信息的編碼器的情形下,利用盲信息, 可以控制對(duì)象的增益和平移。


附圖被包含以提供對(duì)本發(fā)明的進(jìn)一步理解,并且被并入本說明書 中,并構(gòu)成本說明書的一部分,這些附圖示出了本發(fā)明的實(shí)施例,并 且與描述一起用于解釋本發(fā)明的原理。
在附圖中
圖1是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的框圖; 圖2A和圖2B是根據(jù)本發(fā)明實(shí)施例的被傳輸至音頻信號(hào)處理裝置 的比特流的框圖3是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的信息生成單元的
框圖4是包括在圖3中所示的信息生成單元的音頻信號(hào)處理裝置的 比特流接口的示意圖5是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)餘理裝置的信息生成單 元的框圖6是示出了包含圖5中所示的信息生成單元的音頻信號(hào)處理裝 置的比特流接口的示意圖7是包含圖5中所示的信息生成單元的音頻信號(hào)處理裝置的用 戶接口顯示器的示圖8是根據(jù)本發(fā)明又一實(shí)施例的音頻信號(hào)處理裝置的比特流接口 的示意圖9是根據(jù)本發(fā)明又一實(shí)施例的音頻信號(hào)處理裝置的信息生成單 元的示意圖IOA和圖10B是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)處理方法的 輸出信號(hào)的示意圖11是根據(jù)本發(fā)明的另一實(shí)施例,用于分析立體聲輸出信號(hào)的時(shí) 間-頻率域的曲線圖;圖12A和圖12B是根據(jù)本發(fā)明另一實(shí)施例的生成盲信息過程的框 圖和流程圖13是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)處理裝置的框圖; 圖14是根據(jù)本發(fā)明另一實(shí)施例的包含所示的盲信息生成部的信 息生成單元的具體框圖15是根據(jù)本發(fā)明另一實(shí)施例的包含圖14所示的信息生成單元
的音頻信號(hào)處理裝置的比特流接口的示意圖;以及
圖16是根據(jù)本發(fā)明又一實(shí)施例的音頻信號(hào)處理裝置的框圖。
具體實(shí)施方式
最佳模式
本發(fā)明的附加的特征和優(yōu)勢(shì)將在以下描述中闡明,并且部分將是 從本描述中顯而易見的,或可以通過本發(fā)明的實(shí)踐習(xí)得。通過在書面 描述和其權(quán)利要求以及附圖中所特別指出的結(jié)構(gòu),將實(shí)現(xiàn)并獲得本發(fā) 明的目的和其他優(yōu)勢(shì)。
為了實(shí)現(xiàn)這些和其他優(yōu)勢(shì)并且根據(jù)本發(fā)明的目的,如所實(shí)施和廣 泛描述的,根據(jù)本發(fā)明的處理音頻信號(hào)的方法包括下列步驟接收下 混頻信號(hào)、對(duì)象信息和預(yù)置信息;利用對(duì)象信息和預(yù)置信息生成下混 頻處理信息;利用下混頻處理信息處理下混頻信號(hào);以及利用對(duì)象信 息和預(yù)置信息生成多信道信息,其中,對(duì)象信息包括從構(gòu)成對(duì)象電平 信息、對(duì)象相關(guān)信息和對(duì)象增益信息的組中所選的至少一個(gè);其中, 該對(duì)象電平信息通過利用對(duì)象電平之一將對(duì)應(yīng)于對(duì)象的對(duì)象電平歸一 化而生成;其中,對(duì)象相關(guān)信息從兩個(gè)所選對(duì)象的組合生成;其中, 對(duì)象增益信息用于確定該對(duì)象對(duì)于每個(gè)下混頻信號(hào)的信道生成下混頻 信號(hào)的貢獻(xiàn)性,并且其中,從比特流提取預(yù)置信息。
應(yīng)理解的是,前述一般描述和以下具體描述僅是示例性和解釋性 的,并且其目的是提供對(duì)如權(quán)利要求所述的本發(fā)明的進(jìn)一步解釋。發(fā)明的模式
現(xiàn)在將具體參考本發(fā)明的優(yōu)選實(shí)施例,這些優(yōu)選實(shí)施例的示例在 附圖中示出。
在本公開中,信息指涵蓋值、參數(shù)、系數(shù)和要素等在內(nèi)的術(shù)語。 因此,其含義對(duì)于每種情形可以做不同解釋。這不對(duì)本發(fā)明進(jìn)行限制。
圖1是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的框圖。
參考圖1,根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置ioo包括信息
生成單元110、下混頻處理單元120和多信道解碼器130。
信息生成單元110從音頻信號(hào)比特流接收對(duì)象信息(01)和預(yù)置 信息(PI)。在該情形下,對(duì)象信息(01)是關(guān)于包含在下混頻信號(hào) (DMX)內(nèi)的對(duì)象的信息,并且可以包括對(duì)象電平信息、對(duì)象相關(guān)性 信息等。通過利用參考信息將對(duì)象電平歸一化,生成對(duì)象電平信息。 參考信息可以是對(duì)象電平之一,更確切地說,整個(gè)對(duì)象電平之中最高 的電平。對(duì)象相關(guān)性信息指示兩個(gè)對(duì)象之間的相關(guān)性,并且也指示兩 個(gè)所選對(duì)象是具有相同起源的立體聲輸出的不同信道的信號(hào)。對(duì)象增 益信息指示對(duì)象對(duì)下混頻信號(hào)的每個(gè)信道的貢獻(xiàn)性的值,更確切地說, 修改對(duì)象貢獻(xiàn)性的值。
預(yù)置信息(PI)是基于預(yù)置位置信息、預(yù)置增益信息、回放配置 信息等生成的信息。而且,預(yù)置信息(PI)是從比特流提取的。
預(yù)置位置信息是設(shè)置用于控制每個(gè)對(duì)象的位置或平移的信息。預(yù) 置增益信息設(shè)置用于控制每個(gè)對(duì)象的增益,并且包括每對(duì)象的增益因 子。而且,每對(duì)象增益因子可以根據(jù)時(shí)間而變化。而且,回放配置信 息是包含揚(yáng)聲器數(shù)目、揚(yáng)聲器位置、周圍環(huán)境信息(揚(yáng)聲器的虛擬位 置)等的信息。預(yù)置信息(PI)指對(duì)應(yīng)于預(yù)先設(shè)置的具體模式和效果的對(duì)象位置
信息、對(duì)象增益信息和回放配置信息。例如,在預(yù)置信息中的卡拉OK 模式可以包含將語音對(duì)象增益渲染為"0"的預(yù)置增益信息。而且,體 育館模式可以包含預(yù)置位置信息和預(yù)置增益信息,以提供音頻信號(hào)在 廣闊空間內(nèi)存在的效果。根據(jù)本發(fā)明的音頻信號(hào)處理裝置便于通過在 預(yù)先設(shè)置的預(yù)置信息(PI)中選擇特定模式來調(diào)整對(duì)象的增益或平移, 而不需要用戶調(diào)整每個(gè)對(duì)象的增益或平移。
信息生成單元110能夠進(jìn)一步接收在預(yù)置信息上的元信息(MTI)。 元信息(MTI)對(duì)應(yīng)于預(yù)置信息(PI),并且可以包含預(yù)置信息(PI) 名稱、制作者名稱等。在至少有兩個(gè)預(yù)置信息(PI)的情形下,可以以 索引形式包含和表示在每個(gè)預(yù)置信息(PI)上的元信息(MTI)。而且, 元信息(MTI)可以通過用戶接口等來顯示,并且可以通過接收來自用 戶的選擇命令來使用。
信息生成單元110利用對(duì)象信息(01)和預(yù)置信息(PI)生成多 信道信息(MI)。提供多信道信息(MI),以將下混頻信號(hào)(DMX) 上混頻,并且該多信道信息可以包括信道電平信息以及信道相關(guān)性信 息。而且,信息生成單元110能夠利用對(duì)象信息(01)和預(yù)置信息(PI) 生成下混頻處理信息(DPI)。
下混頻處理單元120接收下混頻信號(hào)(DMX),然后利用下混頻 處理信息(DPI)處理下混頻信號(hào)(DMX)。下混頻處理信息(DPI) 可以處理下混頻信號(hào)(DMX),以調(diào)整在下混頻信號(hào)(DMX)中包含 的每個(gè)對(duì)象信號(hào)的平移或增益。
多信道解碼器130從下混頻處理單元120接收處理的下混頻 (PDMX)。然后,多信道解碼器130通過利用從信息生成單元110 生成的多信道信息(MI)將該處理的下混頻信號(hào)(PDMX)上混頻來生成多信道信號(hào)。
圖2A和圖2B示例性地示出了根據(jù)本發(fā)明實(shí)施例的傳輸至音頻信 號(hào)處理裝置的比特流的結(jié)構(gòu)。參考圖2A,通常地,從編碼器傳輸?shù)谋?特流是單一完整的比特流,其包含下混頻信號(hào)(Mixed—Obj BS)、對(duì) 象信息(Obj—Info BS)和預(yù)置信息(Preset—Info BS)。而且,對(duì)象信 息和預(yù)置信息可以被存儲(chǔ)在下混頻信號(hào)比特流的側(cè)區(qū)域或擴(kuò)展區(qū)域。 然而,參考圖2B,根據(jù)本發(fā)明一個(gè)實(shí)施例的比特流可以作為獨(dú)立比特 序列以各種形式被存儲(chǔ)和傳輸。例如,下混頻信號(hào)(Mixed—Obj)可以 由第一比特流202傳送,并且對(duì)象信息(Obj_Info BS)和預(yù)置信息
(Preset—Info BS)可以由第二比特流204傳送。根據(jù)另一實(shí)施例,下 混頻信號(hào)(Mixed—Obj BS)和對(duì)象信息(Obj—Info BS)由第一比特流 206傳送,并且預(yù)置信息(Preset—Info BS)可以僅由獨(dú)立的第二比特流 208傳送。根據(jù)又一實(shí)施例,下混頻信號(hào)(Mixed_ObjBS)、對(duì)象信息
(Obj_InfoBS)和預(yù)置信息(Preset—Info BS)可以分別由三個(gè)獨(dú)立比 特流210、 212和214傳送。
第一比特流、第二比特流或獨(dú)立比特流可以以相同或不同比特率 傳輸。尤其是,在音頻信號(hào)重建之后,預(yù)置信息(Preset—Info BS) (PI) 可以通過與下混頻信號(hào)(Mixed—Obj BS) (DMX)或?qū)ο笮盘?hào)(Obj—Info BS) (OI)分離來存儲(chǔ)或傳輸。
根據(jù)本發(fā)明的音頻信號(hào)處理裝置從用戶接收用戶控制信息(UCI) 以及接收從編碼器傳輸?shù)念A(yù)置信息,然后,可以利用用戶控制信息 (UCI)調(diào)整對(duì)象信號(hào)的增益或平移。
圖3是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的信息生成單元 110的框圖。
參考圖3,信息生成單元110包括信息收發(fā)部310、預(yù)置信息接收部330以及信息生成部340,并且還包括接收用戶控制信息(UCI)的 用戶接口 320。信息收發(fā)部3LO接收來自從編碼器傳輸?shù)谋忍亓鞯膶?duì)象信息(01) 和預(yù)置信息(PI)。同時(shí),用戶接口 320能夠從用戶接收獨(dú)立的用戶 控制信息(UCI)。在該情形下,用戶控制信息(UCI)可以包括用戶 預(yù)置信息(UPI)。用戶接口 320接收用戶控制信息(UCI),以選擇是否使用從編碼 器輸入的預(yù)置信息(PI)。預(yù)置信息接收部330接收從編碼器傳輸?shù)念A(yù) 置信息(PI)或者從用戶接收的用戶預(yù)置信息(UPI)。如果未做出使 用來自用戶控制信息(UCI)的預(yù)置信息(PI)的選擇,則選擇用戶預(yù) 置信息(UPI),然后,將該用戶預(yù)置信息(UPI)輸入到預(yù)置信息接 收部330以供使用。信息生成部340能夠利用從預(yù)置信息接收單元330接收的預(yù)置信 息(PI)或用戶預(yù)置信息(UPI)以及從信息收發(fā)部310接收的對(duì)象信 息(OI)來生成多信道信息(MI)。圖4是包含圖3中所示的信息生成單元的音頻信號(hào)處理裝置的比 特流接口的示意圖。根據(jù)本發(fā)明的一個(gè)實(shí)施例,被輸入到解碼器410 的比特流包含下混頻信號(hào)(DMX)、對(duì)象信息(01)、預(yù)置信息(PI) 和用戶預(yù)置信息(UPI)。而且,從解碼器輸出的比特流可以包含多信 道信號(hào)(MI)和用戶預(yù)置信息(UPI)。將用戶預(yù)置信息從解碼器410 輸出,然后,能夠存儲(chǔ)在存儲(chǔ)器420中以供再利用。以下參考圖5至7,詳細(xì)解釋利用修改的預(yù)置信息(MPI)生成多 信道信息(MI)的方法,該修改的預(yù)置信息(MPI)是利用從用戶接 口輸入的用戶控制信息(UCI)修改從編碼器傳輸?shù)念A(yù)置信息(PI)的 部分而得到的。圖5是根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)處理裝置的信息生成單 元110的框圖,圖6是包含圖5中所示的信息生成單元的音頻信號(hào)處 理裝置的比特流接口的示意圖,并且圖7是包含圖5中所示的信息生 成單元的音頻信號(hào)處理裝置的用戶接口的示圖。在以下描述中,參考 圖5至7詳細(xì)解釋各個(gè)元件和步驟。參考圖5,當(dāng)輸入用戶控制信息(UCI)時(shí),如在圖3和圖4中所 示的,從編碼器傳輸?shù)念A(yù)置信息被排除,然后,利用包含在用戶控制 信息(UCI)中的用戶預(yù)置信息(UPI),可以生成下混頻處理信息(DPI) 和多信道信息(MI)。然而,通過僅修改從編碼器傳輸?shù)念A(yù)置信息(PI) 的部分,用戶控制信息(UCI)使得修改的預(yù)置信息(MPI)能夠被生 成,如圖5所示。如圖5所示,信息生成單元110包括信息收發(fā)部510、預(yù)置信息 修改部530和信息生成部540,并且還包括接收用戶控制信息(UCI) 的用戶接口 520。信息收發(fā)部510接收來自從編碼器傳輸?shù)谋忍亓鞯膶?duì)象信息(01) 和預(yù)置信息(PI)。同時(shí),用戶接口 520在屏幕上顯示預(yù)置信息(PI), 以使得用戶能夠控制每個(gè)對(duì)象的增益或平移。預(yù)置信息修改部530從信息收發(fā)器部510接收預(yù)置信息(PI), 然后,能夠利用從用戶接口 520輸入的用戶控制信息(UCI),生成修 改的預(yù)置信息(MPI)。修改的預(yù)置信息(MPI)可以不與整個(gè)對(duì)象相 關(guān)。如果修改的預(yù)置信息(MPI)與部分對(duì)象相關(guān),則不為修改的目標(biāo) 的所述對(duì)象的剩余部分的預(yù)置信息可以保持完整,而在預(yù)置信息修改 部530中不被修改。信息生成部540能夠利用修改的預(yù)置信息(MPI)和從信息收發(fā)部510接收的對(duì)象信息(01)生成多信道信息(MI)。圖6是包括圖5中所示的信息生成單元110的音頻信號(hào)處理裝置 的比特流接口的示意圖。根據(jù)本發(fā)明的一個(gè)實(shí)施例,輸入到解碼器610 的比特流包含下混頻信號(hào)(DMX)、對(duì)象信息(01)、預(yù)置信息(PI) 和用戶控制信息(UCI)。而且,從解碼器610輸出的比特流可以包含 用戶控制信息(UCI)、修改的預(yù)置信息(MPI)和多信道信號(hào)(MI)。 用戶控制信息(UCI)和修改的預(yù)置信息(MPI)從解碼器610輸出, 然后,能夠被獨(dú)立地存儲(chǔ)在存儲(chǔ)器620中以供再利用。參考圖7,可以將從編碼器傳輸?shù)念A(yù)置信息(PI)與對(duì)應(yīng)于用戶接 口 (UI)上的每個(gè)對(duì)象的索引(例如,對(duì)象名稱、符號(hào)、對(duì)應(yīng)于該符 號(hào)的表格) 一起顯示為音量調(diào)整器或開關(guān)。當(dāng)通過用戶控制信息(UCI) 修改預(yù)置信息(PI)時(shí),用戶接口 (UI)的顯示部可以顯示對(duì)應(yīng)于修 改的預(yù)置信息(MPI)的每對(duì)象的預(yù)置信息的修改。在存在多個(gè)模式表 示為所提供的預(yù)置信息(PI)的情形下,用戶接口 (UI)顯示與在顯 示部上已經(jīng)被設(shè)置的多個(gè)預(yù)置信息(PI)相關(guān)的模式信息。然后,能夠 顯示與用戶所做的選擇相對(duì)應(yīng)的模式的預(yù)置信息(Pl)。圖8是根據(jù)本發(fā)明的又一實(shí)施例的音頻信號(hào)處理裝置的比特流接 口的示意圖。包括圖5所示的信息生成單元的解碼器-l 810接收下混頻 信息(DMX)、對(duì)象信息(01)、預(yù)置信息(PI)和用戶控制信息(UCI), 并且隨后能夠輸出多信道信號(hào)(MI)、用戶控制信息(UCI)和修改的 預(yù)置信息(MPI)。用戶控制信息(UCI)和修改的預(yù)置信息(MPI) 可以被獨(dú)立地存儲(chǔ)在存儲(chǔ)器820中。而且,對(duì)應(yīng)于修改的預(yù)置信息(MPI)的下混頻信號(hào)(DMX)和對(duì)象信息(01)可以被輸入到解碼 器一2 830。在該情形下,利用存儲(chǔ)在存儲(chǔ)器820中的修改的預(yù)置信息(MPI),解碼器-2 830能夠生成與先前從解碼器-l 810生成的多信道 信號(hào)相同的多信道信號(hào)。修改的預(yù)置信息(MPI)每幀可以具有不同的值。修改的預(yù)置信 息(MPI)可以具有對(duì)于單一音樂共同的值,并且可以包括描述特征或 制作者的元信息。通過與多信道信號(hào)獨(dú)立地傳輸或存儲(chǔ),修改的預(yù)置 信息(MPI)僅能夠被正當(dāng)?shù)?legitimately)共享。
根據(jù)本發(fā)明另一實(shí)施例的音頻信號(hào)處理裝置可以包括多個(gè)預(yù)置信 息(PI)。而且,以下詳細(xì)解釋生成多信道信息的過程。
圖9是根據(jù)本發(fā)明又一實(shí)施例的音頻信號(hào)處理裝置的信息生成單 元的示意圖。
參考圖9,信息生成單元110包括信息收發(fā)部910、預(yù)置信息確定 部930和信息生成部940,并且也包括能夠接收用戶控制信息(UCI) 的用戶接口 920。
信息收發(fā)單元910接收來自從編碼器傳輸?shù)谋忍亓鞯膶?duì)象信息 (01)和預(yù)置信息(PI_n)??梢詫㈩A(yù)置信息配置為多種預(yù)置模式, 諸如卡拉OK模式、R&B加強(qiáng)模式等。
同時(shí),用戶接口 920在屏幕上顯示關(guān)于預(yù)置信息(PI)的示意信 息,以提供給用戶,并且能夠接收用戶控制信息(UCI),用于選擇來 自用戶的預(yù)置信息。
利用用戶控制信息,預(yù)置信息確定部930能夠在從信息收發(fā)單元 910輸入的預(yù)置信息(PI—n)中確定一個(gè)預(yù)置信息(PI)。例如,在圖 9中,在預(yù)置信息—1、預(yù)置信息_2、預(yù)置信息—3和預(yù)置信息_4分別對(duì) 應(yīng)于卡拉OK模式、R&B加強(qiáng)模式、轉(zhuǎn)換模式和聲學(xué)模式的情形下, 在用戶接口 920上顯示對(duì)應(yīng)于預(yù)置信息(PI)的每個(gè)的模式名稱。如果 用戶試圖獲取提供在廣闊空間中的效果的音場(chǎng)(sound stage),可以選 擇預(yù)置信息3。用戶接口 920輸出用戶控制信息(UCI),用于選擇從用戶輸入的預(yù)置信息一3。預(yù)置信息確定單元930利用用戶控制信息 (UCI)將所選的預(yù)置信息_3確定為預(yù)置信息(PI),然后,將其輸出 到信息生成部940。
利用從預(yù)置信息接收單元930接收的預(yù)置信息(PI)和從信息收 發(fā)單元910接收的對(duì)象信息(01),信息生成部940能夠生成多信道 信息(MI)。
根據(jù)本發(fā)明的音頻信號(hào)處理裝置通過利用從編碼器傳輸?shù)亩鄠€(gè)預(yù) 置信息(PI)和包括由用戶選擇的預(yù)置信息(PI)的用戶控制信息(UCI), 選擇和應(yīng)用先前設(shè)置的最佳預(yù)置信息,能夠調(diào)整對(duì)象的增益和平移, 而不需要由用戶調(diào)整對(duì)象的增益或平移。
在下列描述中,如果不從編碼器接收對(duì)象信息(01),參考圖10 等詳細(xì)解釋用于解碼包括多個(gè)對(duì)象信號(hào)的下混頻信號(hào)(DMX)的處理 音頻信號(hào)的方法和裝置。
首先,盲信息(BI)具有與對(duì)象信息(01)類似的概念。盲信息 (BI)可以包括對(duì)象信號(hào)的電平和增益信息,其中,對(duì)象信號(hào)以解碼 器使用從編碼器接收的下混頻信號(hào)(DMX)的方式被包含在下混頻信 號(hào)(DMX)中,并且還可以包括相關(guān)性信息或元信息。以下詳細(xì)解釋 生成盲信息(BI)的過程。
圖IOA和圖IOB是利用輸出信號(hào)的位置信息生成盲信息的音頻信 號(hào)處理方法的示意圖。
參考圖IOA,在使用具有立體聲信道的輸出設(shè)備的情形下,收聽 者從左和右信道接收音頻信號(hào)(DMX)。如果音頻信號(hào)包括多個(gè)對(duì)象 信號(hào),則根據(jù)貢獻(xiàn)至左或右信道的增益信息,每個(gè)對(duì)象信號(hào)在空間中 占用的區(qū)域可以不同。圖IOB示出了從每個(gè)立體信號(hào)輸出以在根據(jù)位置區(qū)域而彼此相區(qū)
別的對(duì)象信號(hào)中生成單一對(duì)象信號(hào)的結(jié)構(gòu)。在圖10B中,對(duì)象信號(hào)j
指示位于由增益因子a所確定的方向上的信號(hào),并且獨(dú)立對(duì)象信號(hào)m
和!12指示用于信號(hào)S的外圍信號(hào)??梢詫?duì)象信號(hào)輸出到具有特定方 向信息的立體聲信道。而且,方向信息可以包括電平差異信息、時(shí)間 差異信息等。此外,外圍信號(hào)可以由回放配置、聽覺感知的寬度等確
定。利用對(duì)象信號(hào)s、外圍信號(hào)m和ri2以及用于確定對(duì)象信號(hào)的方向 的增益因子a,可以將圖10B所示的立體聲輸出信號(hào)表示為公式1。
<formula>formula see original document page 17</formula>
為了獲得不僅在一個(gè)聽覺事件情景中,而且在包括多個(gè)同時(shí)激活 的源的非靜止下混頻信號(hào)(DMX)中有效的分解,需要在多個(gè)頻帶中 獨(dú)立地、并且在時(shí)間上適應(yīng)性地分析公式1。如果這樣,& 6^和Z2
60可以如下表示
<formula>formula see original document page 17</formula>
其中,"i"是頻帶索引,并且"k"是時(shí)段索引。
圖11是根據(jù)本發(fā)明的另一實(shí)施例的用于分析立體聲輸出信號(hào)的 時(shí)間-頻率域的曲線圖。每個(gè)時(shí)間-頻率域包括索引I和索引K。而且, 可以獨(dú)立地估計(jì)對(duì)象信號(hào)S、外圍信號(hào)Ni和N2以及增益因子^。在下 列描述中,頻帶索引I和時(shí)段索引K在下文中將被忽略。
用于下混頻信號(hào)(DMX)分析的頻帶的帶寬可以選擇成與特定帶相同,并且可以根據(jù)下混頻信號(hào)(DMX)的特性來確定。在每個(gè)頻帶 中,可以每毫秒t來估計(jì)S、 N,、 N2和^。 在給定X!和X2作為下混 頻信號(hào)(DMX)的情形下,S、 N,,N2和^的估計(jì)值可以通過每時(shí)間-頻率域的分析而確定。而且,可以按照公式3短時(shí)(short-time)估計(jì) Xi的功率<formula>formula see original document page 18</formula>
其中,£{.}是短時(shí)平均運(yùn)算。
對(duì)于其他的信號(hào),使用相同的慣例,艮卩,PX2、 PS和PN=PN1=PN2
是相應(yīng)的短時(shí)功率估計(jì)值。A和N2的功率假定為相同,即假定側(cè)面 獨(dú)立聲音的功率的量對(duì)于立體聲信道的左和右信道是相同的。
給定下混頻信號(hào)(DMX)的時(shí)間-頻率帶表示,計(jì)算功率(PX1, PX2) 以及歸一化互相關(guān)。在左和右之間的歸一化互相關(guān)可以表示為公式4。
<formula>formula see original document page 18</formula>增益信息(j)、對(duì)象信號(hào)功率(a)、外圍信號(hào)功率(Pw)作
為估計(jì)P)a、 Px2和歸一化互相關(guān)(#)的函數(shù)來計(jì)算。與已知和未知變 量相關(guān)的三個(gè)等式表示為公式5。對(duì)于^、 A和尸w,將公式5變形為公式6。 [公式6]
<formula>formula see original document page 19</formula>圖12A和圖12B是從編碼器傳輸?shù)南禄祛l信號(hào)(DMX)生成盲信
息(BI)的過程的框圖和流程圖。首先,將具有立體聲信道的下混頻
信號(hào)"("""""輸入到濾波器組分析部1210,然后被轉(zhuǎn)換為每時(shí)間-頻 率域信號(hào)(^(z"),^a" ) [S1200]。變換的下混頻信號(hào)
(x…"),&("")被輸入到增益信息估計(jì)部1220。增益信息估計(jì)部1220 分析轉(zhuǎn)換的下混頻信號(hào)(一(z',",A(""),估計(jì)對(duì)象信號(hào)的增益信息 (j) [S1210],并且在下混頻輸出信號(hào)中確定對(duì)象信號(hào)的位置[S1220]。 在該情形下,估計(jì)的增益信息(^)指示在下混頻信號(hào)中包含的對(duì)象信 號(hào)對(duì)下混頻輸出信號(hào)的立體聲信道的貢獻(xiàn)程度,將在輸出下混頻信號(hào) 情形下在不同位置的信號(hào)確定為獨(dú)立對(duì)象信號(hào),并且假定單一對(duì)象信 號(hào)具有一個(gè)增益信息。對(duì)象電平估計(jì)部1230:利用從增益信息估計(jì)部
1220輸出的增益信息Q)的位置信息,估計(jì)對(duì)應(yīng)于每個(gè)位置的對(duì)象信號(hào)的電平(Ps) [S1230]。而且,盲信息生成部1240利用對(duì)象信號(hào)的增 益信息和電平生成盲信息(S0LD) (BI) [S1240]。
盲信息(BI)還可以包括盲相關(guān)信息(BCI)和盲增益信息(BGI)。 盲相關(guān)信息(BCI)指示兩個(gè)對(duì)象之間的相關(guān)性,并且可以利用對(duì)象信 號(hào)的估計(jì)的增益信息和電平生成。
圖13是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置的框圖。根據(jù) 本發(fā)明一個(gè)實(shí)施例的音頻信號(hào)處理裝置1300包括信息生成單元1210、 下混頻處理單元1220和多信道解碼器1230。下混頻處理單元1220和 多信道解碼器1230具有先前圖1所示的下混頻處理單元120和多信道 解碼器130的相同結(jié)構(gòu)和作用。因此,在以下描述中將省略它們的細(xì) 節(jié)。
參考圖13,信息生成單元1210從編碼器接收下混頻信號(hào)(DMX)、 對(duì)象信息(01)和預(yù)置信息(PI),然后生成下混頻處理信息(DPI) 和多信道信息(mi)。信息生成單元1210主要包括盲信息生成單元 1211和信息生成部1212。
如果從編碼器傳輸對(duì)象信息(01),盲信息生成部1211不生成盲 信息(BI),并且如在前面圖1的描述中所提及的,信息生成部1212 利用傳輸?shù)膶?duì)象信息(01)生成下混頻處理信息和多信道信息。
如果未將對(duì)象信息(01)傳輸?shù)叫畔⑸蓡卧?210,如在前面圖 11至12B的描述中所提及的,盲信息生成部1211接收下混頻信號(hào) (dmx),將其變換為每時(shí)間-頻率域信號(hào)(aO),&("W ),將位于獨(dú) 立位置的信號(hào)識(shí)別為來自變換的下混頻信號(hào)的單一對(duì)象信號(hào),估計(jì)對(duì) 象信號(hào)的增益信息(^),然后,通過利用增益信息(j)估計(jì)對(duì)象信 號(hào)的電平來生成盲信息(bi, s0ld)。圖14是包含盲信息生成部1211的信息生成單元1210的具體框圖。
參考圖14,信息生成單元1210主要包括濾波器組1310、盲信息 估計(jì)部1320以及信息生成部1330。濾波器組1310將下混頻信號(hào)變換 成每時(shí)間-頻率域信號(hào),以能夠用于生成盲信息(BI)的分析。將通過 濾波器組1310變換成每時(shí)間-頻率域信號(hào)"'(/,",^(/,")的下混頻信 號(hào)(DMX)輸入到盲信息估計(jì)部1320。利用對(duì)象信號(hào)的位置信息、增 益信息")和對(duì)象信號(hào)的電平(Ps),生成用于解碼下混頻信號(hào)(DMX) 的盲信息(Sold)。同時(shí),信息生成部1330利用盲信息(BI) (S0LD) 和預(yù)置信息(PI)生成多信道信息。
圖15是包括圖14所示的信息生成單元的音頻信號(hào)處理裝置的比 特流接口的示意圖。根據(jù)本發(fā)明的一個(gè)實(shí)施例,輸入到解碼器1510的 比特流包含下混頻信號(hào)(DMX)、預(yù)置信息(PI)和用戶控制信息(UCI)。 在該情形下,用戶控制信息(UCI)可以是所使用的用戶預(yù)置信息(UPI), 而非使用從編碼器傳輸?shù)念A(yù)置信息(PI),或者可以部分地對(duì)應(yīng)于用于 修改預(yù)置信息(PI)的控制信息(UCI)。對(duì)象信號(hào)(OI)未被輸入其 中。而且,盲信息生成部(在附圖中未示出)被包含在解碼器1510內(nèi)。 從解碼器1510輸出的比特流可以包含多信道信號(hào)(MI)和盲信息(BI)。 將盲信息(BI)從解碼器1510輸出并且獨(dú)立存儲(chǔ)在存儲(chǔ)器1520中, 以供再利用。
圖16是根據(jù)本發(fā)明又一實(shí)施例的音頻信號(hào)處理裝置1600的框圖。
參考圖16,根據(jù)本發(fā)明的音頻信號(hào)處理裝置1600包括信息生成 單元1610、用戶接口 1620、下混頻處理單元1630和多信道解碼器1640。
信息生成單元1610包括盲信息生成部1612、信息收發(fā)部1614和 信息生成部1616。在從編碼器未接收到對(duì)象信息(01)的情形下,盲成盲信息(BI)。同時(shí), 信息收發(fā)部1614接收盲信息(BI)或?qū)ο笮畔?01),并且從用戶接 口 1620接收用戶控制信息(UCI),從編碼器接收預(yù)置信息(PI)。 信息生成部1616利用從信息收發(fā)單元1614接收的預(yù)置信息(PI)、用 戶控制信息(UCI)和盲信息(BI)(或?qū)ο笮畔?OI)),生成多信 道信息(MI)和下混頻處理信息(DPI)。
下混頻處理單元1630利用從編碼器接收的下混頻信息(DMX) 和從信息生成單元接收的下混頻處理信息(DPI),生成處理的下混頻 信號(hào)(PDMX)。而且,多信道解碼器1640利用處理的下混頻(PDMX) 和多信道信息(MI),生成多信道信號(hào)信道—1、信道—2,……信道_11。
相應(yīng)地,盡管從編碼器未接收到對(duì)象信息(01),但根據(jù)本發(fā)明 另一實(shí)施例的音頻信號(hào)處理方法和裝置生成盲信息(BI),并且利用 預(yù)置信息(PI)來便于以各種模式調(diào)整對(duì)象信號(hào)的增益和平移。
雖然已經(jīng)描述了本發(fā)明,并且已經(jīng)在此參考其優(yōu)選實(shí)施例說明了 本發(fā)明,但對(duì)于本領(lǐng)域的技術(shù)人員將顯而易見的是,在不脫離本發(fā)明 的精神和范圍的條件下,可以做出各種修改和變化。因此,本發(fā)明意 在涵蓋在隨附的權(quán)利要求和其等價(jià)內(nèi)容的范圍內(nèi)的本發(fā)明的修改和變 化。
工業(yè)應(yīng)用性
相應(yīng)地,本發(fā)明可以應(yīng)用于編碼/解碼音頻信號(hào)的過程。
權(quán)利要求
1.一種處理音頻信號(hào)的方法,包括接收下混頻信號(hào)、對(duì)象信息和預(yù)置信息;利用所述對(duì)象信息和所述預(yù)置信息生成下混頻處理信息;利用所述下混頻處理信息處理所述下混頻信號(hào);以及利用所述對(duì)象信息和所述預(yù)置信息生成多信道信息,其中,所述對(duì)象信息包括從由對(duì)象電平信息、對(duì)象相關(guān)信息和對(duì)象增益信息構(gòu)成的組所選擇的至少一個(gè),其中,通過利用對(duì)象電平之一將對(duì)應(yīng)于對(duì)象的對(duì)象電平歸一化來生成所述對(duì)象電平信息,其中,從兩個(gè)所選對(duì)象的組合生成所述對(duì)象相關(guān)信息,其中,所述對(duì)象增益信息用于確定用于每個(gè)下混頻信號(hào)的信道的所述對(duì)象對(duì)于生成所述下混頻信號(hào)的貢獻(xiàn)性,以及其中,從比特流提取所述預(yù)置信息。
2. 根據(jù)權(quán)利要求I的所述方法,其中,從與由所述下混頻信號(hào)和所述對(duì)象信息構(gòu)成的所述組選擇的至少一個(gè)相分離的所述比特流,提取所述預(yù)置信息。
3. 根據(jù)權(quán)利要求l的所述方法,其中,所述預(yù)置信息包括每對(duì)象增益因子。
4. 根據(jù)權(quán)利要求3的所述方法,其中,所述增益因子根據(jù)時(shí)間而改變。
5. 根據(jù)權(quán)利要求的所述方法,其中,所述增益因子每頻率改變。
6. 根據(jù)權(quán)利要求3的所述方法,其中,所述預(yù)置信息包括起點(diǎn)信 息、在所述起點(diǎn)的增益因子、終點(diǎn)信息以及在所述終點(diǎn)的增益因子。
7. 根據(jù)權(quán)利要求l的所述方法,進(jìn)一步包括接收用于修改或選擇所述預(yù)置信息的用戶控制信息。
8. 根據(jù)權(quán)利要求7的所述方法,其中,所述用戶控制信息選擇使用所述預(yù)置信息。
9. 根據(jù)權(quán)利要求8的所述方法,還包括如果所述預(yù)置信息未被使用,貝IJ:從用戶接收用戶預(yù)置信息;利用所述對(duì)象信息和所述用戶預(yù)置信息處理所述下混頻信號(hào);以及利用所述對(duì)象信息和所述預(yù)置信息,生成所述多信道信息。
10. 根據(jù)權(quán)利要求9的所述方法,還包括輸出所述用戶預(yù)置信息;以及存儲(chǔ)所述用戶預(yù)置信息。
11. 根據(jù)權(quán)利要求7的所述方法,還包括通過接收所述用戶控制信息,生成修改的預(yù)置信息;輸出所述修改的預(yù)置信息;以及存儲(chǔ)所述修改的預(yù)置信息。
12. 根據(jù)權(quán)利要求ll的所述方法,其中,如果所述修改的預(yù)置信息與部分對(duì)象相關(guān),則關(guān)于所述對(duì)象的剩余部分的預(yù)置信息不被修改。
13. 根據(jù)權(quán)利要求ll的所述方法,還包括顯示每對(duì)象所述預(yù)置信息被修改的實(shí)際情況。
14. 根據(jù)權(quán)利要求l的所述方法,還包括如果存在至少兩個(gè)預(yù)置信息,貝IJ:接收選擇信息,其中,生成所述多信道信息利用所選的預(yù)置信息。
15. 根據(jù)權(quán)利要求l的所述方法,還包括接收與所述預(yù)置信息對(duì)應(yīng)的元信息;以及顯示關(guān)于用戶接口的所述元信息。
16. 根據(jù)權(quán)利要求l的所述方法,其中,通過廣播信號(hào)接收所述下混頻信號(hào)。
17. 根據(jù)權(quán)利要求l的所述方法,其中,通過數(shù)字介質(zhì)接收所述下混頻信號(hào)。
18. —種計(jì)算機(jī)可讀記錄介質(zhì),包括記錄于其中的程序,提供的所述程序用于執(zhí)行權(quán)利要求l中所描述的所述步驟。
19. 一種用于處理音頻信號(hào)的裝置,包括信息收發(fā)單元,所述信息收發(fā)單元接收下混頻信號(hào)、對(duì)象信息和預(yù)置信息;下混頻處理信息生成單元,所述下混頻處理信息生成單元利用所述對(duì)象信息和所述預(yù)置信息生成下混頻處理信息;下混頻信號(hào)處理單元,所述下混頻信號(hào)處理單元利用所述下混頻處理信息處理所述下混頻信號(hào);以及多信道生成單元,所述多信道生成單元利用所述對(duì)象信息和所述預(yù)置信息生成多信道信息。
全文摘要
公開了一種處理音頻信號(hào)的方法。本發(fā)明包括接收下混頻信號(hào)、對(duì)象信息和預(yù)置信息,利用該對(duì)象信息和預(yù)置信息生成下混頻處理信息,利用下混頻處理信息處理下混頻信號(hào),并且利用對(duì)象信息和預(yù)置信息生成多信道信息,其中,從比特流提取預(yù)置信息。相應(yīng)地,可以容易地控制對(duì)象的增益和平移,而不需要用戶利用預(yù)先設(shè)置的預(yù)置信息為每個(gè)對(duì)象設(shè)置。而且,利用基于用戶所做的選擇所修改的預(yù)置信息,可以控制對(duì)象的增益和平移。
文檔編號(hào)G10L19/00GK101675471SQ200880014564
公開日2010年3月17日 申請(qǐng)日期2008年3月7日 優(yōu)先權(quán)日2007年3月9日
發(fā)明者克里斯托夫·法勒, 吳賢午, 鄭亮源 申請(qǐng)人:Lg電子株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
衡水市| 略阳县| 鄢陵县| 肃南| 诸城市| 铜川市| 天津市| 土默特左旗| 姜堰市| 太原市| 贵州省| 若尔盖县| 陆丰市| 汪清县| 太仆寺旗| 无为县| 孟津县| 吴桥县| 博罗县| 江城| 右玉县| 康定县| 水富县| 铁岭市| 永和县| 靖江市| 福建省| 饶阳县| 牙克石市| 嘉禾县| 西充县| 遂溪县| 澄城县| 兴义市| 潞城市| 南和县| 双城市| 山东省| 禹城市| 互助| 昆明市|