專利名稱:空間聲音再現(xiàn)的制作方法
技術(shù)領域:
本發(fā)明涉及空間聲音再現(xiàn),并且特別地但是不完全涉及包括多聲道音頻信號的上混和(upmixing)的空間聲音再現(xiàn)。
背景技術(shù):
采用立體聲錄音和再現(xiàn)形式的空間聲音再現(xiàn)已經(jīng)出現(xiàn)了幾十年。在過去的幾十年中,已使用更先進的安排和信號處理來提供改善的空間聆聽體驗。特別地,使用例如5或7個空間揚聲器的環(huán)繞聲音的使用已成為流行來與例如電影或電視的觀看相結(jié)合提供增強 的體驗。此外,諸如“聲音吧(sound bar ) ”之類的緊湊型多驅(qū)動器擴音器(loudspeaker )系統(tǒng)已變成為對于傳統(tǒng)的立體聲和5. I系統(tǒng)而言受歡迎的選擇。這些設備甚至從小型設備中為收聽者提供寬闊空間聲像的體驗。這是基于信號的數(shù)字處理和設備的特殊物理安排??臻g聲音處理越來越多地利用高級的信號處理作為聲音再現(xiàn)的一部分來提供改善的空間體驗。例如,復雜的算法可以用于將音頻信號上混合到更高數(shù)量的聲道(channel)。例如,5聲道環(huán)繞信號可以在發(fā)射端上被下混合(downmix)為立體聲或單聲道信號。這個信號隨后被分發(fā),并且聲音再現(xiàn)包括將接收到的信號上混合為原始的5聲道信號。作為另一示例,信號處理可以用于對立體聲信號提供聲音展寬效應,導致收聽者體驗更寬闊的聲場(sound stage)。通常,這些方法基于減小聲道之間相關(guān)性的信號處理操作。這些技術(shù)在上面提到的緊湊型擴音器系統(tǒng)中是特別流行的。作為另一不例,空間信號的再現(xiàn)可以包括在例如立體聲信號中主導(dominating)聲源的提取。剩余的殘留信號將通常對應于更加擴散的環(huán)境立體圖像。主導信號和環(huán)境信號隨后可以不同地進行再現(xiàn),以致再現(xiàn)特性對于每一個信號被優(yōu)化。然而,雖然這樣的空間聲音再現(xiàn)技術(shù)改善聆聽體驗,但是往往具有一些相關(guān)聯(lián)的缺陷。特別地,再現(xiàn)可能無法在所有情況中提供最佳的空間體驗,并且信號處理可能在一些情況中實際上導致降級的空間體驗。因此,用于空間聲音再現(xiàn)的改善系統(tǒng)將是有利的,并且特別地,慮及增加靈活性、便利操作、便利實現(xiàn)、改善空間聆聽體驗和/或改善性能的系統(tǒng)將是有利的。
發(fā)明內(nèi)容
因此,本發(fā)明尋求單獨地或以任何組合來優(yōu)選地緩解、減輕或消除上述缺陷中的一個或多個缺陷。根據(jù)本發(fā)明的方面,提供一種用于空間聲音再現(xiàn)的設備,該設備包括用于接收多聲道音頻信號的接收機;用于確定多聲道音頻信號的空間屬性的電路;用于從多種聲音再現(xiàn)模式中選擇所選擇的再現(xiàn)模式的電路,這些多聲道聲音再現(xiàn)模式采用不同的空間渲染(rendering)技術(shù);和再現(xiàn)電路,用于驅(qū)動由一組擴音器提供的一組空間聲道,以便使用所選擇的再現(xiàn)模式來再現(xiàn)多聲道音頻信號。
本發(fā)明可以在許多實施例中提供改善的聲音再現(xiàn)。特別地,在許多情景中可以提供改善的空間體驗。通常,可以針對特定的音頻信號來改善空間再現(xiàn)。該方案在許多實施例中可以進一步允許低復雜度實現(xiàn)和便利的操作。可以針對在保持低復雜度的同時所經(jīng)歷的特定條件來優(yōu)化適當再現(xiàn)方法的選擇??臻g屬性可以指示信號的空間組織和/或空間復雜度。例如,空間屬性可以根據(jù)合適的標準或用于提取主導聲源的處理來指示一個或多個主導聲源的存在。在一些實施例中,空間屬性可以指示聲源在利用多聲道信號表示的聲像中的空間分布。 該組擴音器可以特別地是包括例如3、5或7個空間揚聲器(有可能除了非空間低頻效果揚聲器或低音炮之外)的環(huán)繞聲設置的擴音器。該組擴音器可以是多驅(qū)動器擴音器系統(tǒng),其中一般三個或更多個別驅(qū)動的擴音器(或擴音器陣列)在一個物理設備中。該組擴音器也可以包括多個這樣的設備。根據(jù)本發(fā)明的可選特征,這些聲音再現(xiàn)模式中的至少一種聲音再現(xiàn)模式包括以下之中的至少一個上混合至比多聲道音頻信號的聲道數(shù)量更高數(shù)量的空間聲道;和下混合至比多聲道音頻信號的聲道數(shù)量更低數(shù)量的空間聲道。本發(fā)明可以提供改善的空間體驗。例如,立體聲信號中的一些聲像當被再現(xiàn)為單聲道信號時可以提供改善的空間體驗。立體聲信號中的其他聲像當被再現(xiàn)為與中央信號組合的展寬的立體聲信號時即在使用三個空間聲道再現(xiàn)時可以提供改善的空間體驗。根據(jù)本發(fā)明的可選特征,該組空間聲道包括數(shù)量與多聲道音頻信號不同的聲道。本發(fā)明可以為聲音再現(xiàn)系統(tǒng)提供改善的空間體驗并且可以特別地在使得聲音再現(xiàn)適應于特定的聲像和空間特性時允許附加的自由度。根據(jù)本發(fā)明的可選特征,用于在聲音再現(xiàn)模式之間切換的最大切換頻率超過1Hz。這可以提供動態(tài)適應(adaptation)和優(yōu)化,其可以密切匹配音頻的變化特性,從而提供改善的聆聽體驗。該特征可以允許再現(xiàn)模式對于音頻信號的改善性能和改善適應,從而提供增強的聆聽體驗。該方案可以允許再現(xiàn)對于信號特性的短期適應。在一些實施例中,用于在再現(xiàn)模式之間切換的最大切換頻率可以超過O. 01Hz、
O.IHz 或甚至 IOHz。最大切換頻率可以是該設備能夠在再現(xiàn)模式之間切換的最大頻率。最大頻率可以利用該系統(tǒng)的包括空間屬性估計和切換功能的特性的設計參數(shù)來限制。根據(jù)本發(fā)明的可選特征,用于確定空間屬性的電路被安排為利用不超過10秒的時間常數(shù)來確定空間屬性。這可以提供可能密切匹配音頻的變化特性的動態(tài)適應和優(yōu)化,從而提供改善的聆聽體驗。該特征可以允許再現(xiàn)模式對于音頻信號的改善性能和改善適應,從而提供增強的聆聽體驗。該方案可以允許再現(xiàn)對于信號特性的短期適應。在一些實施例中,用于確定空間屬性的電路可以有利地被安排為利用小于500秒、100秒、I秒、500毫秒、100毫秒或甚至50毫秒的時間常數(shù)來確定空間屬性。時間常數(shù)表示空間屬性在階躍變化之后達到其最終(漸近)值的1_1/θ·63%所耗費的時間。
在一些實施例中,用于確定空間屬性的電路被安排為包括空間屬性的低通濾波,該低通濾波具有超過O. 00IHz、O. OlHz、O. 1Hz、1Hz、IOHz或50Hz的3dB截止頻率。根據(jù)本發(fā)明的可選特征,多種聲音再現(xiàn)模式包括以下之中的至少一個單聲道再現(xiàn)(monophonic reproduction)模式;保持多聲道信號的空間特性的再現(xiàn)模式;包括空間展寬處理的再現(xiàn)模式;和包括分離成至少一個主導源信號和環(huán)境信號并且應用至少一個主要源信號和環(huán)境信號的不同空間再現(xiàn)的再現(xiàn)模式。這些再現(xiàn)技術(shù)可能是特別有利的,并且適于對于不同的音頻特性提供改善的聆聽特性。在許多實施例中,多種聲音再現(xiàn)模式可以有利地包括兩種、三種或所有四種再現(xiàn)模式,因為這些模式特別適于不同的特性,并因而一起提供一組為大范圍的音頻特性提供改善再現(xiàn)的模式。這些技術(shù)可以特別地一起為寬范圍的音頻信號提供合適的再現(xiàn)特性。根據(jù)本發(fā)明的可選特征,該設備進一步包括用于為多聲道音頻信號確定內(nèi)容特性的電路;和其中用于選擇的電路被安排為響應于內(nèi)容特性來進一步選擇所選擇的再現(xiàn)算法。 這在許多實施例中可以進一步改善再現(xiàn)的適應和提供改善的空間體驗。內(nèi)容特性可以例如通過多聲道音頻信號和/或相關(guān)聯(lián)的視頻信號的內(nèi)容分析來確定。根據(jù)本發(fā)明的可選特征,用于確定內(nèi)容特性的電路被安排為響應于與多聲道音頻信號相關(guān)聯(lián)的元數(shù)據(jù)來確定內(nèi)容特性。這可以提供在許多實施例中可能是有利的特別精確和低復雜度方案。根據(jù)本發(fā)明的可選特征,用于再現(xiàn)多聲道音頻信號的電路被安排為響應于內(nèi)容特性來適配所選擇的再現(xiàn)模式的空間渲染技術(shù)的特性。這在許多實施例中可以進一步改善再現(xiàn)的適應和提供改善的空間體驗。根據(jù)本發(fā)明的可選特征,用于再現(xiàn)多聲道音頻信號的電路被安排為響應于空間屬性來適配所選擇的再現(xiàn)模式的空間渲染技術(shù)的特性。這在許多實施例中可以進一步改善再現(xiàn)的適應和提供改善的空間體驗。根據(jù)本發(fā)明的可選特征,空間處理特性是應用于多聲道音頻信號的至少兩個聲道的空間展寬的程度。這可以提供特別有利的優(yōu)化,因為空間展寬可以為一些音頻特性提供顯著增強的空間體驗,但是可能降級對于其他音頻特性的空間體驗。因此,空間展寬對于音頻特性的優(yōu)化可以提供特別有利的性能。根據(jù)本發(fā)明的可選特征,用于再現(xiàn)多聲道音頻信號的電路被安排為從第一選擇的再現(xiàn)算法逐步過渡到第二選擇的再現(xiàn)算法。這可以提供改善的性能并且可以特別地減小在不同再現(xiàn)模式之間改變的顯著性(noticeability)0該設備可以特別地被安排為在過渡間隔期間使用第一選擇的再現(xiàn)算法和第二選擇的再現(xiàn)算法二者來為該組擴音器生成驅(qū)動信號,以及利用作為驅(qū)動信號的加權(quán)組合而生成的信號來驅(qū)動該組擴音器,其中加權(quán)在過渡間隔期間動態(tài)地被改變。根據(jù)本發(fā)明的可選特征,用于確定空間屬性的電路被安排為確定空間屬性,以響應相對于用于至少兩個聲道的差信號的能量指示而言的用于多聲道音頻信號的至少兩個聲道的組合信號的能量指示。這對于適配空間再現(xiàn)而言可能是特別有利的空間屬性。特別地,這對于許多情景而言可以在精確度與復雜度之間提供有利的權(quán)衡。根據(jù)本發(fā)明的可選特征,用于確定空間屬性的電路被安排為將多聲道音頻信號分解成至少一個主導聲源信號和殘留信號,并且確定空間屬性,以響應相對于用于殘留信號的能量指示而言的用于主導聲源信號的能量指示。這對于適配空間再現(xiàn)而言可能是特別有利的空間屬性。特別地,這對于許多情景而言可以在精確度與復雜度之間提供有利的權(quán)衡。根據(jù)本發(fā)明的方面,提供一種空間聲音再現(xiàn)的方法,該方法包括接收多聲道音頻信號;確定多聲道音頻信號的空間屬性;從多種聲音再現(xiàn)模式中選擇所選擇的再現(xiàn)模式,這些多聲道聲音再現(xiàn)模式采用不同的空間渲染技術(shù);和驅(qū)動一組擴音器,以便使用所選擇的再現(xiàn)模式來再現(xiàn)多聲道音頻信號。
本發(fā)明的這些與其他方面、特征和優(yōu)點從下文描述的(一個或多個)實施例中將是顯然的,并且本發(fā)明的這些與其他方面、特征和優(yōu)點將參考下文描述的(一個或多個)實施例來闡述。
本發(fā)明的實施例將參考附圖僅通過示例來描述,其中
圖I是根據(jù)本發(fā)明的一些實施例的用于空間聲音再現(xiàn)的系統(tǒng)的示例的圖解;
圖2是根據(jù)本發(fā)明的一些實施例的用于空間聲音再現(xiàn)的系統(tǒng)的元素的示例的圖解;和 圖3是根據(jù)本發(fā)明的一些實施例的用于空間聲音再現(xiàn)的系統(tǒng)的示例的圖解。
具體實施例方式以下描述集中于可應用于使用上混合到三個聲道的立體聲信號的空間聲音再現(xiàn)的本發(fā)明的實施例。然而,將意識到本發(fā)明并不局限于這種應用,而可以應用于許多其他的音頻信號和再現(xiàn)方法。圖I示出根據(jù)本發(fā)明的一些實施例的用于再現(xiàn)聲音的系統(tǒng)的示例。該系統(tǒng)包括接收機101,其接收包括多個音頻聲道的空間音頻信號。在該示例中,輸入信號是立體聲信號,但是將意識到在其他的實施例中,可以采用其他數(shù)量的聲道。例如,輸入信號可以是五聲道環(huán)繞聲輸入信號。在一些情景中,輸入信號可以是編碼的信號,并且接收機101可以被安排為部分或全部解碼輸入信號,以便由該系統(tǒng)進一步處理。例如,對于每一個編碼段(segment),輸入信號的頻率表示可以作為編碼方案所采用的中頻表示來生成。也將意識至IJ:輸入信號的多個聲道可以利用單個編碼的音頻信號和相關(guān)聯(lián)的參數(shù)數(shù)據(jù)來表示。例如,多聲道輸入信號可以是編碼的單聲道信號和空間參數(shù)數(shù)據(jù)。作為特例,輸入信號可以是參數(shù)立體聲(Parametric Stereo)信號??梢詮娜魏蝺?nèi)部或外部源中接收輸入多聲道音頻信號。接收機101耦合到驅(qū)動電路103,其中驅(qū)動電路103從接收機101接收多聲道(在該特定不例中,立體聲信號)。驅(qū)動電路103為一組擴音器105生成驅(qū)動信號。該組擴音器提供許多空間聲道。在該示例中,這些擴音器提供左聲道、右聲道和中置聲道,但是將意識到在其他實施例中,可以提供更多(或更少)空間聲道。例如,在一些實施例中,這些擴音器可以只提供左和右聲道。在其他實施例中,全環(huán)繞系統(tǒng)配備有例如五或七個空間聲道。
在一些示例中,由該組擴音器105中的揚聲器提供的空間聲道的數(shù)量可以等于多聲道信號中的聲道的數(shù)量。然而,在該示例中,由該組擴音器105提供的空間聲道的數(shù)量高于多聲道信號中的聲道的數(shù)量。在該示例中,驅(qū)動電路103可以操作在一些再現(xiàn)模式中,這些再現(xiàn)模式包括將多聲道信號的聲道上混合至空間聲道的數(shù)量。作為選擇或此外,驅(qū)動電路103可以包括用于在至少一些再現(xiàn)模式中選擇可用聲道的子集的功能,其中該子集在不同的再現(xiàn)模式中是不同的。這些模式中的一種或多種模式可以進一步包括輸入聲道的下混合。例如,對于立體聲輸入信號,一種再現(xiàn)模式可以使用空間聲道中的兩個聲道(例如,左和右聲道)來提供輸出, 另一種再現(xiàn)模式可以僅使用一個空間聲道(例如,中置聲道),而還一種再現(xiàn)模式可以使用三個空間聲道(例如,左、右和中置聲道)。在該特定示例中,該組擴音器105在空間布局中包括三個擴音器,從而提供三個空間聲道。因而,該組擴音器105中的揚聲器對應于左、右和中間揚聲器。該組擴音器因而被安排為提供空間體驗。在一些實施例中,驅(qū)動電路103可能知道擴音器相對于聆聽位置的確切定位,但是情況通常不是這樣的,并且空間聲音再現(xiàn)以假定的擴音器的定位為基礎,正如從傳統(tǒng)的環(huán)繞聲和立體聲系統(tǒng)中所獲悉的。該組擴音器提供多個空間聲道,例如,它們可以提供左、右和中央空間聲道,這些聲道用于向收聽者提供空間體驗。然而,該組擴音器無需針對每個聲道具有單個獨立擴音器。例如,該組擴音器可以包括擴音器陣列和相關(guān)聯(lián)的驅(qū)動功能,以便使用音頻波束形成技術(shù)來提供空間聲道。因而,圖I的該組擴音器105中的擴音器可以被感知為與給定的空間位置或聲道相對應的虛擬擴音器。在一些實施例中,每一個虛擬擴音器可以對應于物理擴音器,但是這不是在所有的實施例中都是必要的。驅(qū)動電路103被安排為在驅(qū)動擴音器105時使用不同的聲音再現(xiàn)模式。不同的聲音再現(xiàn)模式使用不同的空間渲染技術(shù)。因而,不同的聲音再現(xiàn)模式可以應用不同的空間處理算法,并因而不同的聲音再現(xiàn)模式具有不同的空間音頻特性。例如,一種聲音再現(xiàn)模式可以只使用單個擴音器105來呈現(xiàn)多聲道信號(B卩,作為單聲道再現(xiàn)),另一種再現(xiàn)模式可以在沒有任何空間處理的情況下利用相應空間聲道的信號來簡單驅(qū)動每個擴音器,從而保持輸入信號的空間特性。還一種再現(xiàn)模式可以將輸入聲道擴展(spread)到所有的擴音器上并引入空間展寬。因而,驅(qū)動電路103被設計成能夠提供非常不同的空間處理和利用非常不同的屬性來驅(qū)動該組擴音器105。實際上,不同的再現(xiàn)模式不僅對于給定的空間處理使用不同的參數(shù)設置,而且還應用不同的基本原理,并且尤其使用不同的空間處理算法和方法。這樣的各種再現(xiàn)模式可以允許由該系統(tǒng)提供非常不同的效果,并且可以允許收聽者的空間體驗的高可變性。然而,發(fā)明人已認識到鑒于空間信號處理可以提供增強的體驗,它在一些情況中也可能導致減少的空間體驗。例如,對于不同的內(nèi)容和信號特性來說,音頻格式轉(zhuǎn)換算法(諸如空間展寬、上混合、轉(zhuǎn)換至單聲道信號等等)對所感知的立體圖像的影響可能是不同的。例如,一種方法可以提供適合于動作電影場景的寬闊空間圖像,但是相同的方法在新聞節(jié)目或具有單一樂器的音樂的情況中可能被感知為煩躁和模糊。即,可能適合于一種類型的內(nèi)容的上混合或立體聲展寬當被用于不同類型的內(nèi)容時可能產(chǎn)生不需要的效果。作為另一示例,當在立體聲混合物(mixture)中沒有清晰的中央聲源時,目的在于從立體聲信號中提取中置聲道的上混合算法不可能總是最佳地工作。如果中置聲道提取方法用于這樣的內(nèi)容,它可能導致立體圖像的寬度減少。允許終端用戶手動地選擇或調(diào)節(jié)再現(xiàn)模式可以允許這種敏感性被減輕,這是因為用戶能夠選擇提供最令人愉快的空間體驗的模式。然而,發(fā)明人已認識到這樣的解決方案可能通常是不實際的,因為它只允許緩慢且高度繁瑣的適應。解決方案可以是為每一種可能類型的音頻定義再現(xiàn)模式。例如,對于新聞節(jié)目,使用一種特定的再現(xiàn)模式,對于電影,使用另一種特定的再現(xiàn)模式,等等。然而,發(fā)明人已認識至IJ :由于優(yōu)選的空間再現(xiàn)可能無法直接地被鏈接到特定類型的音頻,所以這樣的方案有可能是不準確的。實際上,發(fā)明人已認識到通過實現(xiàn)合適再現(xiàn)模式的動態(tài)的實時選擇,時常能夠?qū)崿F(xiàn)實質(zhì)上改善的體驗。發(fā)明人已進一步認識到通過基于輸入信號的空間屬性來實現(xiàn)這樣 的動態(tài)選擇,能夠獲得有利的性能。因而,在圖I的系統(tǒng)中,基于輸入信號的空間屬性來動態(tài)地選擇再現(xiàn)模式。從而,獲得再現(xiàn)模式對于輸入信號中的特定變化的實時和快速適應。這樣的方案允許聲音再現(xiàn)自動地且動態(tài)地適應于信號的當前特性,從而允許增強的聆聽體驗。該方案此外允許非??焖俚倪m應,其允許再現(xiàn)模式針對當前特性和首選項來優(yōu)化,而非針對例如特定類型的音頻或該音頻表示的特定節(jié)目類型的平均或預期特性來優(yōu)化。例如,該方案允許再現(xiàn)模式在電影的音軌期間動態(tài)地且自動地改變,以致例如對話和動作聲音二者利用對于那個特定聲音而言最適合的再現(xiàn)算法來再現(xiàn)。例如,人們知道空間圖像時常在媒體項的持續(xù)時間上不斷改變。例如,電影音頻場景可以包含在寬闊的立體聲音頻場景與只有一個聲源諸如演員的語音是可聞的時刻之間的交替(alternation)。在第一種情況中,期望立體圖像是寬闊的和身臨其境的,而在第二種情況中,對于語音而言具有清晰定位的空間位置,這是自然的。圖I的系統(tǒng)提供再現(xiàn)模式的自動調(diào)節(jié)來反映這樣的首選項。特別地,圖I的系統(tǒng)包括被安排為確定多聲道音頻信號的空間屬性的分析器107??臻g屬性可以特別地是存在于輸入信號中的空間組織或復雜度的指示??臻g屬性可以指示空間擴展的程度,并且可以特別地指示輸入信號是利用一個或多個單個良好定義的聲源來表征還是更多地利用沒有強方向性提示的環(huán)境聲音來表征。分析器107耦合到選擇處理器109,其中選擇處理器被饋送空間屬性并且被安排為從能夠被驅(qū)動電路103使用的多種聲音再現(xiàn)模式中選擇再現(xiàn)模式。選擇處理器109進一步耦合到驅(qū)動電路103,并且控制這個來使用所選擇的再現(xiàn)模式。因而,在空間屬性變化時,選擇處理器109動態(tài)地且自動地在這些再現(xiàn)模式之間切換,以便對于當前特性提供最佳的再現(xiàn)處理。因而,實現(xiàn)改善的空間體驗。該系統(tǒng)特別地被安排為允許再現(xiàn)模式對于信號特性的短期適應。因而,可以允許快速切換,從而允許空間再現(xiàn)不僅在(長期)平均水平上被優(yōu)化,而且也匹配更多的瞬時信
號變化。因此,分析器107被安排為以被低通濾波或被平均的空間屬性的形式但是利用相對高的頻率來生成估計。類似地,這些再現(xiàn)模式之間的實際切換可以利用相對高的頻率來執(zhí)行。因而,不是選擇再現(xiàn)模式以及在例如整個節(jié)目中使用這個模式,圖I的系統(tǒng)動態(tài)地適配再現(xiàn)模式,以匹配信號特性中的短期變化。該系統(tǒng)的優(yōu)選的動態(tài)特性可以取決于個別實施例的特定特性和首選項。
然而,在許多實施例中,特別有利的性能可以利用允許以其范圍通常是從大約50毫秒到5分鐘的間隔更新再現(xiàn)模式的系統(tǒng)來實現(xiàn)。確切的動態(tài)性質(zhì)可以基于對于當前信號特性的適應的精確度和該系統(tǒng)的可靠性以及與不同模式之間的切換相關(guān)聯(lián)的任何偽像(artefact)的程度之間的權(quán)衡來選擇。在許多實施例中,在確定空間屬性時包括的低通濾波有利地取決于個別實施例的特定首選項而具有超過O. 001Hz、0. 01Hz、0. 1Hz、1Hz、IOHz或50Hz的3dB截止頻率。相應地,空間屬性可以有利地利用小于500秒、100秒、10秒、I秒、500毫秒、100毫秒或甚至50毫秒的時間常數(shù)來確定。時間常數(shù)可以被定義為空間屬性在階躍變化之后達到其最終(漸近)值的1_1/θ·63%所花費的時間。例如,空間屬性可以跟蹤或者取決于多聲道信號的一個或多個空間特性。在保持所有其他參數(shù)恒定的同時這個空間特性的階躍變化將導致空間屬性的改變。用于確定空間屬性的時間常數(shù)隨后可以作為這個改變達到其最終(漸近)值的l-l/e*63%所花費的時間來測量。類似地,切換可以根據(jù)類似的動態(tài)來安排。特別地,用于在再現(xiàn)模式之間切換的最 大切換頻率可以超出0.01Ηζ、0. 1Ηζ、1Ηζ乃至10Hz。最大頻率可以是由于確定空間屬性和/或?qū)嶋H切換操作而可能的最快切換。因而,最大切換頻率可以是該系統(tǒng)能夠跟隨(follow)的音頻信號的基本空間特性中的最高頻率變化。在特定的實施例中,驅(qū)動電路103被安排為在四種不同的再現(xiàn)模式之間切換。在第一種再現(xiàn)模式中,驅(qū)動電路103僅保持原始的立體聲信號并且不引入任何空間修改。因而,這種操作模式保持多聲道輸入信號的空間特性。在特定示例中,立體聲輸入信號僅被再現(xiàn)為立體聲信號,即,左輸入聲道被饋送至左擴音器,而右輸入聲道被饋送至右擴音器,并且沒有信號被饋送至中央擴音器。因而,在這種再現(xiàn)模式中,驅(qū)動電路103提供原始音頻聲道的立體聲(stereophonic)再現(xiàn)。在第二種再現(xiàn)模式中,驅(qū)動電路103將輸入信號再現(xiàn)為單聲道信號。例如,兩個立體聲聲道可以進行組合(例如,通過簡單相加),并且所得到的單聲道信號可以被饋送至中央擴音器,其中沒有信號被饋送到左或右擴音器。因而,驅(qū)動電路103的第二種再現(xiàn)模式包括下混合輸入信號并且是單聲道再現(xiàn)模式。這樣的再現(xiàn)模式在其中音頻對應于諸如例如用于新聞節(jié)目的新聞播音員的單個中央放置的聲源的情景中是特別有利的,等等。在第三種再現(xiàn)模式中,驅(qū)動電路103被安排為引入空間展寬處理。在特定示例中,第三種再現(xiàn)模式包括將立體聲展寬算法應用于輸入立體聲信號。這樣的立體聲展寬往往提供立體聲聲道的解相關(guān)(decorrelation),以便實現(xiàn)放大的空間圖像的感知。將意識到本領域技術(shù)人員將知曉各種空間展寬技術(shù),并且能夠使用任何適當?shù)乃惴ǘ鵁o損于本發(fā)明。這樣的處理在聲像由環(huán)境聲音主導而非特定定位的聲源主導時可能是特別有利的。例如,它在再現(xiàn)利用具有許多樂器的大型管弦樂隊創(chuàng)作的音樂時可以提供增強的體驗。在第四種再現(xiàn)模式中,驅(qū)動電路103將輸入信號分成一個或多個主要源信號,其中每一個主要信號尋求包括僅來自特定主導聲源的聲音。將意識到技術(shù)人員將知道用于檢測和提取主導聲源的不同算法并且可以使用任何適當?shù)乃惴ǘ鵁o損于本發(fā)明。驅(qū)動電路103進一步在提取(一個或多個)主導聲源之后生成與該信號相對應的殘留信號。在第四種再現(xiàn)模式中,輸入立體聲信號因而被分解成一個或多個主要聲源信號和環(huán)境立體聲或環(huán)繞信號。
主導聲源信號和殘留信號隨后不同地進行處理,以致不同的空間處理應用于這些信號。作為簡單示例,空間展寬可以應用于殘留信號,但是不應用于主導聲源信號。因而,主導聲源的空間良好定義的定位不被修改,而對于通常與周圍聲音環(huán)境相對應的殘留信號實現(xiàn)增強的聲像。此外,主導聲源信號可以例如存在于中央空間聲道中,并且殘留信號可以存在于左和右空間聲道中。因而,在這種再現(xiàn)模式中,由該組擴音器提供的所有的空間聲道被使用,并且該模式包括輸入信號的上混合。已提議用于從音頻聲道中估計空間源分布的方法。例如,在M. Goodwin和J-M.Jot 于 2007 年 3 月在芬蘭的 AES 30th int. Conference 發(fā)布的“Multichannel surroundformat conversion and generalized upmix”中提議一種用于從多聲道音頻數(shù)據(jù)中確定突出聲源的方向和估計環(huán)境聲級的方法。例如,在A. Hjirmji和C. Faller于2004年5 月 8-11 日在德國柏林的 AES 116th Convention 發(fā)布的 “Spatial decomposition oftime-frequency regions: subbands or sinusoids”中研究用于估計多個聲源在立體聲混合物中的分布的兩種其他方法。第四種再現(xiàn)模式可能特別適合于例如是特定聲源與環(huán)境聲音或噪聲之間的混合 物的信號。利用分析器107對輸入信號中聲源的空間分布進行的分析可以例如基于每一個聲道內(nèi)的音頻能量的頻率選擇性分析和/或代表聲道之間相似性的一些適當數(shù)值量度的變化的頻率選擇性分析。例如,分析器107可以使用與在MPEG環(huán)繞標準中使用的分析方法相類似的分析方法。因而,它們可以基于輸入信號的子帶分解以及不同聲道中的頻率子帶之間的能量和協(xié)方差值的計算。然而,將意識到可以使用許多其他的方案,例如,諸如與信號的參數(shù)表不相關(guān)的相關(guān)量度和/或表征不同聲道之間相似性的互信息。圖2示出可以在圖I的系統(tǒng)中使用的特定方案。在該示例中,分析器107包括被饋送輸入左和右信號的加法器201和減法器203。加法器將兩個信號加在一起,而減法器203從一個信號中減去另一個信號。加法器201被饋送至第一能量估計器205,其中第一能量估計器計算由加法器201生成的和信號的信號能量。減法器203被饋送至第二能量估計器207,其中第二能量估計器測量由減法器生成的差信號的信號能量。第一和第二能量估計器205、207耦合到選擇處理器109,其中選擇處理器基于和與差能量的空間屬性指示來選擇再現(xiàn)模式。因而,在該示例中,再現(xiàn)模式的選擇基于左和右聲道信號之間的和與差信號的計算以及這些信號的短時能量的比較。當和信號的能量顯著大于差信號時,估計輸入立體聲信號實質(zhì)上是單聲道的。當和與差信號的能量在相同水平上或者差信號的能量大于和信號的能量時,輸入信號被認為是常規(guī)的立體聲音頻信號。因而,在每一個能量分析周期中的檢測值可以利用下式來給定
“ 5. U. Π > *** ; / f
Ρ = ο, if £'、
\少f η--- . ■· >.%·■■.< ■
其中和Ediff分別是和信號與差信號的短時能量,而A是通常顯著大于I的標量系數(shù)(例如,A=IOO)。驅(qū)動電路103的操作并且特別地在不同再現(xiàn)模式之間的切換可以被實現(xiàn)為動態(tài)矩陣運算
權(quán)利要求
1.一種用于空間聲音再現(xiàn)的設備,所述設備包括 用于接收多聲道音頻信號的接收機(101); 用于確定多聲道音頻信號的空間屬性的電路(107); 用于從多種聲音再現(xiàn)模式中選擇所選擇的再現(xiàn)模式的電路(109),所述多聲道聲音再現(xiàn)模式采用不同的空間渲染技術(shù);以及 再現(xiàn)電路(103),用于驅(qū)動由一組擴音器(105)提供的一組空間聲道,以便使用所選擇的再現(xiàn)模式來再現(xiàn)多聲道音頻信號。
2.權(quán)利要求I的設備,其中聲音再現(xiàn)模式之中的至少一種聲音再現(xiàn)模式包括以下之中的至少一種上混合至比多聲道音頻信號的聲道的數(shù)量更高數(shù)量的空間聲道;以及下混合至比多聲道音頻信號的聲道的數(shù)量更低數(shù)量的空間聲道。
3.權(quán)利要求I的設備,其中該組空間聲道包括與多聲道音頻信號不同數(shù)量的聲道。
4.權(quán)利要求I的設備,其中用于在聲音再現(xiàn)模式之間切換的最大切換頻率超過1Hz。
5.權(quán)利要求I的設備,其中用于確定空間屬性的電路(107)被安排為利用不超過10秒的時間常數(shù)來確定空間屬性。
6.權(quán)利要求I的設備,其中多種聲音再現(xiàn)模式包括以下之中的至少一種 單聲道再現(xiàn)模式; 保持多聲道信號的空間特性的再現(xiàn)模式; 包括空間展寬處理的再現(xiàn)模式;以及 包括分離成至少一個主導源信號和環(huán)境信號并應用至少一個主要源信號和環(huán)境信號的不同空間再現(xiàn)的再現(xiàn)模式。
7.權(quán)利要求I的設備,進一步包括 用于為多聲道音頻信號確定內(nèi)容特性的電路(301);以及 其中用于選擇的電路(109)被安排為進一步選擇所選擇的再現(xiàn)算法,以響應內(nèi)容特性。
8.權(quán)利要求7的設備,其中用于確定內(nèi)容特性的電路(301)被安排為確定內(nèi)容特性,以響應與多聲道音頻信號相關(guān)聯(lián)的元數(shù)據(jù)。
9.權(quán)利要求7的設備,其中用于再現(xiàn)多聲道音頻信號的電路(103)被安排為響應于內(nèi)容特性來適配所選擇的再現(xiàn)模式的空間渲染技術(shù)的特性。
10.權(quán)利要求I的設備,其中用于再現(xiàn)多聲道音頻信號的電路(103)被安排為響應于空間屬性來適配所選擇的再現(xiàn)模式的空間渲染技術(shù)的特性。
11.權(quán)利要求10的設備,其中空間處理特性是應用于多聲道音頻信號的至少兩個聲道的 >空間展寬的程度。
12.權(quán)利要求I的設備,其中用于再現(xiàn)多聲道音頻信號的電路(103)被安排為從第一選擇的再現(xiàn)算法逐步過渡到第二選擇的再現(xiàn)算法。
13.權(quán)利要求I的設備,其中用于確定空間屬性的電路(107)被安排為確定空間屬性,以響應相對于用于至少兩個聲道的差信號的能量指示而言的用于多聲道音頻信號的至少兩個聲道的組合信號的能量指示。
14.權(quán)利要求I的設備,其中用于確定空間屬性的電路(107)被安排為將多聲道音頻信號分解成至少一個主導聲源信號和殘留信號,以及確定空間屬性,以響應相對于用于殘留信號的能量指示而言的用于主導聲源信號的能量指示。
15.—種空間聲音再現(xiàn)的方法,所述方法包括 接收多聲道音頻信號; 確定多聲道音頻信號的空間屬性; 從多種聲音再現(xiàn)模式中選擇所選擇的再現(xiàn)模式,所述多聲道聲音再現(xiàn)模式采用不同的空間渲染技術(shù);以及 驅(qū)動一組擴音器(105),以便使用所選擇的再現(xiàn)模式來再現(xiàn)多聲道音頻信號。
全文摘要
用于空間聲音再現(xiàn)的設備包括用于接收多聲道音頻信號的接收機(101)。分析器(107)確定多聲道音頻信號的空間屬性,諸如空間復雜度或組織。選擇處理器(109)隨后從多種聲音再現(xiàn)模式中選擇再現(xiàn)模式,其中這些多聲道聲音再現(xiàn)模式采用不同的空間渲染技術(shù)。再現(xiàn)電路(103)隨后驅(qū)動一組擴音器(105),以便使用所選擇的再現(xiàn)模式來再現(xiàn)多聲道音頻信號。在這些再現(xiàn)模式之間的切換可能是快速的(例如,以100毫秒到10秒的量級),從而允許再現(xiàn)模式對于信號特性的短期適應。該方案可以特別地給收聽者提供改善的空間體驗。
文檔編號H04S7/00GK102726066SQ201180008138
公開日2012年10月10日 申請日期2011年1月26日 優(yōu)先權(quán)日2010年2月2日
發(fā)明者A.S.赫梅, W.P.J.德布魯恩 申請人:皇家飛利浦電子股份有限公司