两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于確定在聲場(chǎng)的高階高保真立體聲表示中不相關(guān)的聲源的方向的方法和裝置的制造方法

文檔序號(hào):9278650閱讀:687來源:國(guó)知局
用于確定在聲場(chǎng)的高階高保真立體聲表示中不相關(guān)的聲源的方向的方法和裝置的制造方法
【專利說明】用于確定在聲場(chǎng)的高階高保真立體聲表示中不相關(guān)的聲源 的方向的方法和裝置
[0001] 本發(fā)明涉及用于確定在聲場(chǎng)的高階高保真立體聲表示中不相關(guān)的聲源的方向的 方法和裝置。
【背景技術(shù)】
[0002] 高階高保真立體聲(HOA)在其它技術(shù)(如波場(chǎng)合成(WFS)或基于信道的如22. 2 的方法)之中提供了表示三維立體聲的一個(gè)可能性。然而,與基于信道的方法相比,HOA表 示對(duì)不依賴于特定揚(yáng)聲器的設(shè)置提供了優(yōu)勢(shì)。然而,這種靈活性是以對(duì)特殊揚(yáng)聲器設(shè)置上 的HOA表示的重放所需的過程進(jìn)行解碼為代價(jià)的。與WFS方法相比,所需要的揚(yáng)聲器的數(shù) 量通常是很大的,也可以對(duì)只包括少數(shù)的揚(yáng)聲器的設(shè)置提出HOA。HOA另外的優(yōu)勢(shì)是也可以 采用相同的表示而無需對(duì)雙耳用的耳機(jī)做出任何修改。
[0003] HOA是基于由縮短的球諧函數(shù)(SH)展開式表示的復(fù)雜平面諧波幅度的空間密度。 每個(gè)展開系數(shù)是角頻率的函數(shù),其可以同樣由時(shí)域函數(shù)來表示。因此,不失一般性,完整的 HOA聲場(chǎng)表示實(shí)際上可以被假設(shè)被由0時(shí)域函數(shù)組成,其中0指示展開系數(shù)的數(shù)目。在下文 中,這些時(shí)域函數(shù)被稱為HOA系數(shù)序列或被稱為HOA信道。
[0004] HOA具有提供高空間分辨率的潛能,通過增長(zhǎng)的展開的最高階數(shù)N來進(jìn)行改善。這 對(duì)關(guān)于主導(dǎo)聲源的聲場(chǎng)進(jìn)行分析提供了可能性。

【發(fā)明內(nèi)容】

[0005] -個(gè)如何可以從給定的HOA表示中識(shí)別由聲場(chǎng)組成的獨(dú)立主導(dǎo)聲源、和如何追蹤 它們暫時(shí)的軌跡的申請(qǐng)。需要這種操作用于例如通過將聲場(chǎng)分寫成主導(dǎo)方向信號(hào)和其余的 周邊組件來壓縮HOA表示,如專利申請(qǐng)EP12305537. 8中所述。針對(duì)這種方向追蹤方法的另 外的申請(qǐng)會(huì)是粗糙的、初步的源分離。對(duì)后產(chǎn)生的HOA聲場(chǎng)記錄使用估計(jì)的方向軌跡以便 放大或減弱特定聲源的信號(hào)也是可能的。
[0006] 在EP 12305537. 8中提出了相繼執(zhí)行如下的三個(gè)操作:
[0007] -識(shí)別時(shí)間幀內(nèi)的當(dāng)前存在的主導(dǎo)聲源的數(shù)量并且搜索相應(yīng)的方向。主導(dǎo)聲源的 數(shù)量被從HOA信道互相關(guān)的矩陣的特征值確定。為了搜索主導(dǎo)聲源的方向,估計(jì)與固定數(shù) 量的預(yù)定測(cè)試方向的HOA系數(shù)的幀相對(duì)應(yīng)的方向功率分布。通過尋找方向功率分布中的最 大值獲得第一方向估計(jì)。隨后通過連續(xù)重復(fù)如下的兩個(gè)操作來發(fā)現(xiàn)其余識(shí)別的方向:從其 余的測(cè)試方向的集合中排除空間鄰域的測(cè)試方向,并且結(jié)果集合被認(rèn)為是搜索的方向功率 分布的最大值。
[0008] _估計(jì)的方向被分配給在最后的時(shí)間幀中被認(rèn)為是活動(dòng)的聲源。
[0009] _在分配之后,對(duì)方向估計(jì)執(zhí)行適當(dāng)?shù)钠交员惬@得暫時(shí)平滑的方向軌跡。
[0010] 然而,盡管通過這種過程,方向估計(jì)的暫時(shí)平滑在原則上通過以指數(shù)的方式計(jì)算 加權(quán)移動(dòng)平局?jǐn)?shù)來完成,但是該技術(shù)具有不能準(zhǔn)確捕獲意外的方向改變或突發(fā)的新主導(dǎo)聲 音的缺點(diǎn)。
[0011] 為了克服該問題,在專利申請(qǐng)EP 12306485.9中介紹了一種簡(jiǎn)單統(tǒng)計(jì)源移動(dòng) 的預(yù)測(cè)模型,針對(duì)由貝葉斯學(xué)習(xí)定律實(shí)行的統(tǒng)計(jì)上的動(dòng)力平滑利用該模型。然而,EP 12306485. 9和EP 12305537. 8僅從方向功率分布來針對(duì)聲源方向計(jì)算似然函數(shù)。該分布表 示來自由在單元球面上幾乎是均勻分布的取樣點(diǎn)指定的方向的多數(shù)通用平面波的功率。沒 有提供關(guān)于來自不同方向的通用平面波之間的互相關(guān)的任意信息。
[0012] 實(shí)際上,HOA表示的階數(shù)N通常是有限的,導(dǎo)致空間有限帶寬的聲場(chǎng)。具體的,這 意味著對(duì)方向功率分布的方向聲源的貢獻(xiàn)被周圍入射在鄰域內(nèi)方向的真方向所彌散。該彌 散效應(yīng)在數(shù)學(xué)上通過"分散函數(shù)"來描述,見下文高階高保真立體聲的空間分辨率部分。其 程度隨著HOA表示的階數(shù)下降而增長(zhǎng)。EP 12306485. 9和EP 12305537. 8的方向追蹤方法 某種程度上地考慮到了該效應(yīng),通過約束至先前發(fā)現(xiàn)方向鄰域外的區(qū)域的方向的搜索。然 而,鄰域的規(guī)范假設(shè)所有聲源被編碼有全階N的HOA表示。該假設(shè)違反了 N階HOA表示,該 N階HOA表示包括在小于階數(shù)N中編碼的通用平面波。這種小于階數(shù)N的通用平面波可以 是藝術(shù)創(chuàng)造的結(jié)果,為了使聲源顯得更寬。然而,它們還通過球形麥克風(fēng)隨著記錄HOA聲場(chǎng) 表示出現(xiàn)。
[0013] 假使聲場(chǎng)由小于階數(shù)N的單個(gè)通用平面波組成(這是不期望有的性能),EP 12306485. 9和EP 12305537. 8的方向追蹤方法不只識(shí)別單個(gè)聲源。
[0014] 本發(fā)明所要解決的問題是改進(jìn)HOA聲場(chǎng)中主導(dǎo)聲源的確定,使得主導(dǎo)聲源的暫時(shí) 的軌跡可以被追蹤。該問題由權(quán)利要求1、2和6中公開的方法所解決。利用權(quán)利要求6的 方法的裝置在權(quán)利要求7中公開。
[0015] 本發(fā)明改進(jìn)了 EP 12306485. 9的過程。該發(fā)明過程尋找獨(dú)立主導(dǎo)聲源并隨著時(shí)間 追蹤它們的方向。"獨(dú)立主導(dǎo)聲源"的表示意味著各自聲源的信號(hào)是不相關(guān)的。
[0016] 盡管EP 12305537. 8和EP 12306485. 9是通過僅考慮初始HOA表示的方向功率分 布來搜索主導(dǎo)聲源方向的所有潛在候選的最先進(jìn)的方法,但是下文描述的發(fā)明過程從初始 HOA表示中除去了每個(gè)方向候選的搜索,所有組件與先前發(fā)現(xiàn)的聲源的信號(hào)有關(guān)。通過這 種操作,許多代替僅一個(gè)正確聲源的錯(cuò)誤檢測(cè)的問題可以被避免,以防它對(duì)聲場(chǎng)的貢獻(xiàn)被 高度方向性地分散。如上所述,這種效應(yīng)會(huì)針對(duì)N階HOA表示發(fā)生,該N階HOA表示包括在 小于階數(shù)N中編碼的通用平面波。與EP 12306485. 9相似,針對(duì)主導(dǎo)聲源方向發(fā)現(xiàn)的候選 隨后被分配給先前發(fā)現(xiàn)的主導(dǎo)聲源,并最終根據(jù)統(tǒng)計(jì)源移動(dòng)模式使其變平滑。因此,與EP 12306485. 9相似,發(fā)明過程提供暫時(shí)平滑的發(fā)現(xiàn)估計(jì),并且能夠捕獲意外的方向改變或突 發(fā)的新主導(dǎo)聲音。
[0017] 發(fā)明過程在兩個(gè)后續(xù)處理中確定針對(duì)HOA表示的連續(xù)幀的主導(dǎo)聲源方向的估計(jì), 這兩個(gè)后續(xù)處理為:
[0018] 從HOA表示的當(dāng)前時(shí)間幀k,相繼搜索針對(duì)主導(dǎo)聲源方向的候選或估計(jì),并且確定 被認(rèn)為是由各自聲源創(chuàng)建的HOA表示的組件。在該搜索過程的每次迭代中,每個(gè)另外的方 向候選由殘差HOA表示計(jì)算,殘差HOA表示表示來自與已經(jīng)被除去的先前發(fā)現(xiàn)的聲源的信 號(hào)相關(guān)的所有組件的初始HOA表示。當(dāng)前方向候選從若干預(yù)定的測(cè)試方向中選出,使得從 監(jiān)聽者的位置上所選的方向撞擊(impinging)的殘差HOA表示的相關(guān)通用平面波的功率是 與所有其它測(cè)試方向的相比的最大值。
[0019] 接下來,針對(duì)當(dāng)前時(shí)間幀選擇的方向候選被分配給在HOA系數(shù)的先前時(shí)間幀k-1 中發(fā)現(xiàn)的主導(dǎo)聲源。其后,關(guān)于作為結(jié)果的時(shí)間軌跡平滑的最終方向估計(jì)通過實(shí)行貝葉斯 推理過程被計(jì)算,其中該貝葉斯推理過程一方面利用統(tǒng)計(jì)的先驗(yàn)聲源移動(dòng)模型,另一方面 利用初始HOA表示的主導(dǎo)聲源組件的方向功率分布。先驗(yàn)聲源移動(dòng)模型從在先前時(shí)間幀 k-1的獨(dú)立聲源的方向和先前時(shí)間幀k-1與倒數(shù)第二的時(shí)間幀k-2之間的移動(dòng)來統(tǒng)計(jì)地預(yù) 測(cè)獨(dú)立聲源的當(dāng)前移動(dòng)。通過方向估計(jì)和先前發(fā)現(xiàn)的聲源的方向?qū)χg的聯(lián)合最小角度、 和關(guān)于方向估計(jì)和在先前時(shí)間幀發(fā)現(xiàn)的主導(dǎo)聲源的方向信號(hào)對(duì)之間的相關(guān)系數(shù)的最大絕 對(duì)值來完成對(duì)在HOA系數(shù)的先前時(shí)間幀(k-1)中發(fā)現(xiàn)的主導(dǎo)聲源的方向估計(jì)的分配。
[0020] 原則上,發(fā)明方法適用于在表示聲場(chǎng)的HOA的高階高保真立體聲表示中確定不相 關(guān)的聲源的方向,所述方法包括如下步驟:
[0021] -在HOA系數(shù)的當(dāng)前時(shí)間幀中,相繼搜索主導(dǎo)聲源的初步方向估計(jì),并計(jì)算由相應(yīng) 的主導(dǎo)聲源創(chuàng)建的HOA聲場(chǎng)組件,并計(jì)算相應(yīng)的方向信號(hào);
[0022] -通過比較所述當(dāng)前時(shí)間幀的所述初步方向估計(jì)和在所述先前時(shí)間幀中活動(dòng)的聲 源的平滑方向、并且通過關(guān)聯(lián)所述當(dāng)前時(shí)間幀的所述方向信號(hào)與在所述先前時(shí)間幀中活動(dòng) 的聲源的方向信號(hào)來對(duì)在所述HOA系數(shù)的先前時(shí)間幀中活動(dòng)的相應(yīng)聲源分配所述計(jì)算的 主導(dǎo)聲源,得到分配函數(shù);
[0023]-使用所述分配函數(shù)、在所述先前時(shí)間幀中的平滑方向的集合、在所述先前時(shí)間幀 中活動(dòng)主導(dǎo)聲源的索引的集合、在倒數(shù)第二時(shí)間幀和所述先前時(shí)間幀之間的各自源移動(dòng)角 度的集合、和由相應(yīng)的主導(dǎo)聲源創(chuàng)建的所述HOA聲場(chǎng)組件來計(jì)算平滑的主導(dǎo)源方向;
[0024] _使用所述平滑的主導(dǎo)源方向、所述先前時(shí)間幀的活動(dòng)主導(dǎo)聲源的幀延遲版本的 方向、和所述先前時(shí)間幀的活動(dòng)主導(dǎo)聲源的幀延遲版本的索引來確定所述當(dāng)前時(shí)間幀的活 動(dòng)主導(dǎo)聲源的索引和方向,
[0025] 其中在所述先前時(shí)間幀中活動(dòng)的聲源的所述方向信號(hào)由所述先前時(shí)間幀的活動(dòng) 主導(dǎo)聲源的所述幀延遲版本的方向和使用模式匹配的所述先前時(shí)間幀的HOA系數(shù)來計(jì)算,
[0026] 并且其中所述倒數(shù)第二時(shí)間幀和所述先前時(shí)間幀之間的所述源移動(dòng)角度的集合 由所述先前時(shí)間幀的活動(dòng)主導(dǎo)聲源的所述幀延遲版本的方向和它另外的幀延遲版本的方 向來計(jì)算。
[0027] 原則上,發(fā)明裝置適用于在表示聲場(chǎng)的HOA的高階高保真立體聲表示中確定不相 關(guān)的聲源的方向,所述裝置包括:
[0028]-適用于在HOA系數(shù)的當(dāng)前時(shí)間幀中相繼搜索主導(dǎo)聲源的HOA系數(shù)初步方向估計(jì), 用于計(jì)算由相應(yīng)的主導(dǎo)聲源創(chuàng)建的HOA聲場(chǎng)組件,以及用于計(jì)算相應(yīng)的方向信號(hào)的裝置;
[0029]-適用于通過比較所述當(dāng)前時(shí)間幀的所述初步方向估計(jì)和在所述先前時(shí)間幀中活 動(dòng)的聲源的平滑方向、并且通過關(guān)聯(lián)所述當(dāng)前時(shí)間幀的所述方向信號(hào)與在所述先前時(shí)間幀 中活動(dòng)的聲源的方向信號(hào)來對(duì)在所述HOA系數(shù)的先前時(shí)間幀中活動(dòng)的相應(yīng)聲源分配所述 計(jì)算的主導(dǎo)聲源,得到
當(dāng)前第1頁(yè)1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
洪泽县| 嘉祥县| 贡觉县| 宁晋县| 桃源县| 贡觉县| 安新县| 文登市| 威海市| 策勒县| 南川市| 开化县| 临城县| 白水县| 达尔| 宝清县| 浦江县| 自贡市| 绍兴县| 闽侯县| 华安县| 新乡县| 广饶县| 岱山县| 左贡县| 高邮市| 吉林省| 达拉特旗| 潞城市| 英吉沙县| 宝鸡市| 浦县| 莆田市| 玉田县| 叶城县| 黑河市| 乐都县| 团风县| 芜湖县| 雷波县| 呼伦贝尔市|