專利名稱:音頻信息變換方法、程序和設(shè)備及視/音頻格式、編碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻信息變換方法,視頻/音頻格式,編碼器,音頻信息變換程序,音頻信息變換設(shè)備,它們用于一種視頻/音頻格式,如每一對象具有視頻信息和音頻信息的MPEG(運(yùn)動圖像專家小組)4格式,或者每一場景具有視頻/音頻信息的DVD(數(shù)字多能光盤)格式。
背景技術(shù):
近年來,基于DVD或?qū)拵У囊曨l流正展現(xiàn)出美好的發(fā)展前景,從而增加了在家中處理視頻/音頻格式的機(jī)會。特別是由于DVD的普及和音頻裝置如AV放大器等的價(jià)格越來越便宜,享受多聲道音頻的人也越來越多了。在DVD中,MPEG 2被用作視頻記錄系統(tǒng),杜比(Dolby)數(shù)字系統(tǒng)(AC-3),DTS(數(shù)字影院系統(tǒng)),線性PCM(脈沖編碼調(diào)制),MPEG音頻等被用作音頻記錄系統(tǒng)。DVD光盤中能夠裝入八個音頻流。因此如果不同的聲音分別裝入每一音頻流,則各種應(yīng)用程序如多種語言的配音、高音質(zhì)播放、解說、聲道等都可以實(shí)現(xiàn)。
同時,作為下一代視頻/音頻格式之一的有MPEG 4。在MPEG 4中,具有構(gòu)成在屏幕上重放的場景的視頻/音頻信息的對象可以被感興趣地觀察,通過對每一對象的運(yùn)動圖像進(jìn)行編碼還能夠有效地獲得運(yùn)動圖像壓縮。
另外,除了運(yùn)動圖像識別處理技術(shù),校正從圖像中的運(yùn)動對象中發(fā)出的聲音的多普勒效應(yīng)的技術(shù)例如在專利文獻(xiàn)1中也已經(jīng)提出。
JP-A-5-174147(參見第0013段等)然而,現(xiàn)有技術(shù)中播放DVD的多聲道(如5.1-聲道等)音頻系統(tǒng)中,不可能改變由一個音頻流所獲得的收聽點(diǎn)。因此收聽者只在他或她自己收聽音頻的收聽點(diǎn)處才能有聽到的感覺。
另外,人們也希望響應(yīng)于收聽點(diǎn)的改變而調(diào)節(jié)由對象移動所產(chǎn)生的多普勒效應(yīng)。
本發(fā)明正是考慮到上述各種情況而提出的,本發(fā)明的目的就是提供一種音頻信息變換方法,一種視頻/音頻信息格式,編碼器,一種音頻信息變換程序及一種音頻信息變換設(shè)備,能夠僅通過一個音頻流自由地改變所獲得的收聽點(diǎn),從而產(chǎn)生能夠使得收聽者感覺收聽者就在視頻中的音頻環(huán)境,另外還能響應(yīng)于收聽點(diǎn)的變化而調(diào)節(jié)由于對象移動所產(chǎn)生的多普勒效應(yīng)。
發(fā)明內(nèi)容
為了實(shí)現(xiàn)上述目的,權(quán)利要求1中提出了一種音頻信息變換方法,該方法應(yīng)用于一種視頻/音頻信息格式,在該格式中,屏幕包括多個對象,每一對象均具有視頻信息、位置信息及音頻信息,該方法包括虛擬收聽點(diǎn)設(shè)置步驟,在不同于基本收聽點(diǎn)的位置處設(shè)置虛擬收聽點(diǎn),基本收聽點(diǎn)也即收聽者收聽聲音的位置;相對速度計(jì)算步驟,計(jì)算所述虛擬收聽點(diǎn)和對象間的相對速度;和音頻變換步驟,根據(jù)相對速度執(zhí)行音頻變換以在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中。
根據(jù)該方法,例如,對于具有構(gòu)成在屏幕上以視頻/音頻格式如MPEG 4進(jìn)行重放的場景的視頻/音頻信息的對象,多普勒效應(yīng)可以在虛擬收聽點(diǎn)處加入音頻信息,這樣,例如如果對象接近虛擬收聽點(diǎn)則音頻增加,如果對象離開虛擬收聽點(diǎn)則音頻降低。因此具有強(qiáng)感染力/逼真效果、能夠使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中的音頻環(huán)境就能夠產(chǎn)生。
另外,在權(quán)利要求2所述的音頻信息變換方法中,所述的相對速度計(jì)算步驟通過基于預(yù)定時間逝去前和后對象的位置信息計(jì)算對象的速度信息來計(jì)算虛擬收聽點(diǎn)和對象間的相對速度。
根據(jù)該方法,通過基于預(yù)定時間逝去前和后對象的位置信息計(jì)算對象的速度信息、并然后計(jì)算虛擬收聽點(diǎn)和和對象間的相對速度而將多普勒效應(yīng)在虛擬收聽點(diǎn)處加入音頻信息。因此通過使用編碼的對象位置信息可以容易地計(jì)算/處理由于對象的移動產(chǎn)生的多普勒效應(yīng)。結(jié)果,可以產(chǎn)生具有強(qiáng)感染力/逼真效果、能夠使得收聽者進(jìn)入到屏幕中的對象移離虛擬收聽點(diǎn)的狀態(tài)的音頻環(huán)境。
而且,在權(quán)利要求3所述的音頻信息變換方法中,相對速度計(jì)算步驟提取對象的速度信息,然后將對象的位置信息和速度信息與虛擬收聽點(diǎn)的位置信息進(jìn)行比較。
根據(jù)該方法,相對速度的計(jì)算是通過先提取對象的速度信息,然后將對象的位置信息和速度信息與虛擬收聽點(diǎn)的位置信息進(jìn)行比較。這樣,通過該過程就不必計(jì)算對象的速度,從而相應(yīng)地減少了計(jì)算過程,也改善了處理的速度。
而且,在權(quán)利要求4所述的音頻信息變換方法中,相對速度計(jì)算步驟通過根據(jù)預(yù)定時間逝去前后虛擬收聽點(diǎn)的位置信息計(jì)算虛擬收聽點(diǎn)的速度信息來計(jì)算虛擬收聽點(diǎn)和對象間的相對速度。
根據(jù)該方法,通過先根據(jù)虛擬收聽點(diǎn)在預(yù)定時間逝去前后的位置信息計(jì)算虛擬收聽點(diǎn)的速度信息,然后計(jì)算虛擬收聽點(diǎn)和對象間的相對速度,多普勒效應(yīng)在虛擬收聽點(diǎn)處被加入到音頻信息中。因此,由虛擬收聽點(diǎn)的移動所產(chǎn)生的多普勒效應(yīng)可以通過利用虛擬收聽點(diǎn)的位置信息很容易地進(jìn)行計(jì)算/處理。結(jié)果具有感染力/逼真效果、能夠使收聽者進(jìn)入到感覺自己(位于虛擬收聽點(diǎn))正隨音頻活動的狀態(tài)的音頻環(huán)境就能夠產(chǎn)生了。
在權(quán)利要求5所述的音頻信息變換方法中,相對速度計(jì)算步驟通過提取虛擬收聽點(diǎn)的速度信息,然后比較虛擬收聽點(diǎn)的位置信息和速度信息與對象的位置信息來計(jì)算相對速度。
根據(jù)該方法,相對速度的計(jì)算是通過先提取虛擬收聽點(diǎn)的速度信息,然后比較虛擬收聽點(diǎn)的位置信息和速度信息與對象的位置信息。這樣,通過該過程就不必計(jì)算虛擬收聽點(diǎn)的速度,相應(yīng)地減少了計(jì)算過程,也改善了處理的速度。
權(quán)利要求6所述的音頻信息變換方法應(yīng)用于一種視頻/音頻格式,在該格式中,在屏幕上重放的每一場景具有視頻信息和音頻信息,該場景具有速度信息和方向信息,背景根據(jù)該信息移動。該方法包括虛擬收聽點(diǎn)設(shè)置步驟,在不同于基本收聽點(diǎn)的位置處設(shè)置虛擬收聽點(diǎn),基本收聽點(diǎn)也即收聽者收聽聲音的位置;相對速度計(jì)算步驟,根據(jù)背景的速度信息和方向信息計(jì)算虛擬收聽點(diǎn)和背景間的相對速度;和音頻變換步驟,根據(jù)相對速度執(zhí)行音頻變換以在虛擬收聽點(diǎn)將多普勒效應(yīng)加入到音頻信息中。
根據(jù)該方法,例如對于在屏幕上以視頻/音頻格式如DVD進(jìn)行重放的場景,響應(yīng)于背景的移動速度,多普勒效應(yīng)在虛擬收聽點(diǎn)處被加入到音頻信息中。因此,具有強(qiáng)感染力/逼真效果、能夠使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中、并進(jìn)入到屏幕的背景正從虛擬收聽點(diǎn)處隨音頻移開的狀態(tài)的音頻環(huán)境就產(chǎn)生了。
如權(quán)利要求7所述的音頻信息變換方法,當(dāng)先前包括多普勒效應(yīng)的音頻信息包括在對象中時,音頻信息變換步驟執(zhí)行音頻信息變換以消除包括在對象的音頻信息中的多普勒效應(yīng),并根據(jù)相對速度執(zhí)行音頻信息變換以將多普勒效應(yīng)加入到虛擬收聽點(diǎn)的音頻信息。
根據(jù)該方法,當(dāng)先前包括多普勒效應(yīng)的音頻信息包括在對象中時,首先消除包括在音頻信息中的多普勒效應(yīng),然后將多普勒效應(yīng)在虛擬收聽點(diǎn)處加入到音頻信息中。這樣,即使是變換之前音頻信息中包括了多普勒效應(yīng),當(dāng)屏幕中的對象從虛擬收聽點(diǎn)處移離時所產(chǎn)生的多普勒效應(yīng)也可以準(zhǔn)確的表示出來。
在權(quán)利要求8所述的音頻信息變換方法中,最終圖像單元時刻的音頻信息變換通過利用公式在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中而執(zhí)行,通過該公式執(zhí)行在最終圖像之前一個圖像單元的虛擬收聽點(diǎn)處的音頻信息的音頻變換。
根據(jù)該方法,例如在當(dāng)前正在播放的標(biāo)題的最終圖像時刻不能獲得后續(xù)屏幕的位置信息時,虛擬收聽點(diǎn)聽到的對象的音頻可以利用音頻變換公式進(jìn)行計(jì)算,該公式在最終圖像前圖像的音頻變換過程中獲得。因此,可以排除因?yàn)槿鄙傩畔⒃跇?biāo)題的最終圖像中不能執(zhí)行音頻變換等的可能。
在權(quán)利要求9所述的音頻信息變換方法中,視頻/音頻格式包括每一場景屏幕的縮小比例信息。
根據(jù)該方法,當(dāng)縮小了比例的屏幕通過重放屏幕中進(jìn)行放大、縮小等而變化時,在權(quán)利要求1至8中所述的音頻信息變換仍能精確地執(zhí)行。
權(quán)利要求10所述的視頻/音頻格式包括對象的速度信息,或場景的速度信息和方向信息,或每一場景屏幕的縮小比例信息,上述信息用于權(quán)利要求1至9中任一權(quán)利要求所述的音頻信息變換方法中。
權(quán)利要求11所述的編碼器編碼對象的速度信息,或場景的速度和方向信息,或每一場景縮小了比例的屏幕信息,上述信息用于權(quán)利要求1至9中任一權(quán)利要求所述的音頻信息變換方法中。
根據(jù)該編碼器,對對象的速度信息,場景的速度和方向信息,和每一場景縮小了比例的屏幕信息進(jìn)行編碼,然后將這些信息包括在視頻/音頻格式中。因此能夠?qū)崿F(xiàn)如權(quán)利要求1至9中任一權(quán)利要求所述的音頻信息變換。
為了實(shí)現(xiàn)上述目的,在權(quán)利要求12中提出的一種音頻信息變換程序使計(jì)算機(jī)執(zhí)行如下過程在不同于收聽者收聽音頻的位置的基本收聽點(diǎn)處設(shè)置虛擬收聽點(diǎn)的過程;計(jì)算虛擬收聽點(diǎn)和對象間的相對速度的計(jì)算過程;和根據(jù)相對速度執(zhí)行音頻變換以在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中的過程。
根據(jù)該程序,例如對于具有構(gòu)成在屏幕上以視頻/音頻格式如MPEG 4進(jìn)行重放的場景的視頻/音頻信息的對象,多普勒效應(yīng)可以在虛擬收聽點(diǎn)處加入到音頻信息,這樣,例如如果對象接近虛擬收聽點(diǎn)則聲音頻率增加,或如果對象離開虛擬收聽點(diǎn)則聲音頻率降低。因此如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、能夠讓收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求13所述的音頻信息變換程序中,計(jì)算相對速度的過程包括根據(jù)預(yù)定時間逝去前后對象的位置信息計(jì)算對象的速度信息的過程。
根據(jù)該程序,由于計(jì)算相對速度的過程是根據(jù)預(yù)定時間逝去前后的對象的位置信息來計(jì)算對象的速度信息,由于對象的移動而產(chǎn)生的多普勒效應(yīng)能夠利用對象的編碼后的位置信息很容易地計(jì)算/處理。因此,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠讓收聽者進(jìn)入到屏幕上的對象正隨音頻從虛擬收聽點(diǎn)處移開的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求14所述的音頻信息變換程序中,計(jì)算相對速度的過程包括提取對象的速度信息、然后比較對象的位置信息和速度信息與虛擬收聽點(diǎn)的位置信息的過程。
根據(jù)該程序,由于計(jì)算相對速度的過程提取對象的速度信息,然后比較對象的位置信息和速度信息與虛擬收聽點(diǎn)的位置信息,因此通過該過程不必計(jì)算對象的速度,從而相應(yīng)的減少了計(jì)算過程的負(fù)擔(dān),也改善了處理速度。因此,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果,能夠讓收聽者進(jìn)入到屏幕上的對象正隨音頻從虛擬收聽點(diǎn)處移開的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求15所述的音頻信息變換程序中,計(jì)算相對速度的過程包括根據(jù)預(yù)定時間逝去前后虛擬收聽點(diǎn)的位置信息計(jì)算虛擬收聽點(diǎn)的速度信息的過程。
根據(jù)該程序,由于虛擬收聽點(diǎn)的速度信息是根據(jù)預(yù)定時間逝去前后虛擬收聽點(diǎn)的位置信息來計(jì)算的,由于虛擬收聽點(diǎn)的移動而產(chǎn)生的多普勒效應(yīng)可以利用虛擬收聽點(diǎn)的位置信息很容易地計(jì)算/處理。因此,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠讓收聽者進(jìn)入到感覺收聽者自己(處于虛擬收聽點(diǎn)位置)正隨音頻移動的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求16所述的音頻信息變換程序中,計(jì)算相對速度的過程包括通過提取虛擬收聽點(diǎn)的速度信息、然后比較虛擬收聽點(diǎn)的位置信息和速度信息與對象的位置信息而計(jì)算相對速度的過程。
根據(jù)該程序,相對速度的計(jì)算是通過先提取虛擬收聽點(diǎn)的速度信息,然后比較虛擬收聽點(diǎn)的位置信息和速度信息與對象的位置信息。因此通過該過程不必計(jì)算虛擬收聽點(diǎn)的速度,從而相應(yīng)的減少了計(jì)算過程的負(fù)擔(dān),也改善了處理速度。結(jié)果,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠讓收聽者進(jìn)入到感覺收聽者自己正隨音頻移動的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
如權(quán)利要求17所述的音頻信息變換程序使計(jì)算機(jī)執(zhí)行下列過程在不同于收聽者收聽音頻的位置的基本收聽點(diǎn)處設(shè)置虛擬收聽點(diǎn)的過程;根據(jù)場景的背景所移動的速度和方向信息來計(jì)算虛擬收聽點(diǎn)和背景間的相對速度的過程;和根據(jù)所述相對速度執(zhí)行音頻變換以在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中的過程。
根據(jù)該程序,例如對于在屏幕上以視頻/音頻格式如DVD進(jìn)行重放的場景,響應(yīng)于背景的移動速度,將多普勒效應(yīng)在虛擬收聽點(diǎn)處加入到音頻信息中。因此,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求18所述的音頻信息變換程序中,當(dāng)先前包括多普勒效應(yīng)的音頻信息包括在對象中時,執(zhí)行音頻信息變換的過程包括執(zhí)行音頻變換以消除包括在對象的音頻信息中的多普勒效應(yīng)、并根據(jù)相對速度執(zhí)行音頻變換以將多普勒效應(yīng)加入到虛擬收聽點(diǎn)處的音頻信息中的過程。
根據(jù)該程序,當(dāng)先前包括多普勒效應(yīng)的音頻信息包括在對象中時,首先消除包括在音頻信息中的多普勒效應(yīng),然后將多普勒效應(yīng)在虛擬收聽點(diǎn)處加入到的音頻信息。這樣,即使是變換之前音頻信息中包括了多普勒效應(yīng),由于屏幕中的對象從虛擬收聽點(diǎn)處移開所產(chǎn)生的多普勒效應(yīng)也可以準(zhǔn)確的表示出來。結(jié)果如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有強(qiáng)感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求19所述的音頻信息變換程序中,當(dāng)最終圖像單元時刻的音頻信息變換被執(zhí)行時,包括通過利用一個公式在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中的過程,通過該公式執(zhí)行在最終圖像之前一個圖像單元的虛擬收聽點(diǎn)處的音頻信息的音頻變換。
根據(jù)該程序,例如當(dāng)在當(dāng)前正在播放的標(biāo)題的最終圖像時刻不能獲得后續(xù)屏幕的位置信息時,虛擬收聽點(diǎn)聽到的對象的音頻可以利用在最終圖像前圖像的音頻變換過程中獲得的音頻變換公式進(jìn)行計(jì)算。因此,可以排除因?yàn)槿鄙傩畔⒍跇?biāo)題的最終圖像時刻不能執(zhí)行音頻變換的可能。結(jié)果,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有強(qiáng)感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
在權(quán)利要求20所述的音頻信息變換程序中,視頻/音頻格式包括每一場景屏幕的縮小比例信息。
根據(jù)該程序,當(dāng)屏幕的縮小比例通過在重放屏幕中進(jìn)行放大、縮小等變化時,音頻信息變換仍能精確地實(shí)現(xiàn)。因此,如果使用記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有強(qiáng)感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
為了實(shí)現(xiàn)上述目的,權(quán)利要求21提出了一種用于視頻/音頻格式的音頻信息變換設(shè)備,該格式中,屏幕包括多個對象,每一對象具有視頻信息、位置信息和音頻信息。該設(shè)備包括虛擬收聽點(diǎn)設(shè)置部分,用于在不同于收聽者收聽音頻的位置的基本收聽點(diǎn)處設(shè)置虛擬收聽點(diǎn);相對速度計(jì)算部分,用于計(jì)算虛擬收聽點(diǎn)和對象間的相對速度;和音頻變換部分,用于根據(jù)相對速度執(zhí)行音頻變換、以在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中。
根據(jù)該設(shè)備,例如對于具有構(gòu)成在屏幕上以視頻/音頻格式如MPEG 4進(jìn)行重放的場景的視頻/音頻信息的對象,可以將多普勒效應(yīng)在虛擬收聽點(diǎn)處加入音頻信息,這樣,例如如果對象接近虛擬收聽點(diǎn)則聲音頻率增加,如果對象離開虛擬收聽點(diǎn)則聲音頻率降低。因此如果使用了這種音頻變換設(shè)備,具有強(qiáng)感染力/逼真效果、使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中的音頻環(huán)境就能夠產(chǎn)生。
在權(quán)利要求22所述的音頻信息變換設(shè)備中,相對速度計(jì)算部分通過在預(yù)定時間逝去之后比較虛擬收聽點(diǎn)的位置信息和對象的位置信息來計(jì)算相對速度。
根據(jù)該設(shè)備,能夠產(chǎn)生具有強(qiáng)感染力/逼真效果、并且能夠使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中并進(jìn)入到屏幕上的對象正隨音頻從虛擬收聽點(diǎn)處移開的狀態(tài),或進(jìn)入到收聽者自己正隨音頻移動的狀態(tài)的音頻環(huán)境。
在權(quán)利要求23所述的音頻信息變換設(shè)備中,相對速度計(jì)算部分通過比較對象的位置信息和速度信息與虛擬收聽點(diǎn)的位置信息來計(jì)算相對速度。
根據(jù)該設(shè)備,能夠產(chǎn)生具有感染力/逼真效果、并能夠使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中并進(jìn)入到屏幕上的對象正隨音頻從虛擬收聽點(diǎn)處移開的狀態(tài)的音頻環(huán)境。
在權(quán)利要求24所述的音頻信息變換設(shè)備中,相對速度計(jì)算部分通過比較對象的位置信息與虛擬收聽點(diǎn)的位置信息和速度信息來計(jì)算相對速度。
根據(jù)該設(shè)備,能夠產(chǎn)生具有感染力/逼真效果、并能夠使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中并進(jìn)入到收聽者自己(處于虛擬收聽點(diǎn))正隨音頻移動的狀態(tài)的音頻環(huán)境。
權(quán)利要求25提出了一種用于視頻/音頻格式音頻信息變換設(shè)備,在該格式中,在屏幕上重放的每一場景具有視頻信息和音頻信息,場景具有速度信息和方向信息,背景根據(jù)該信息移動。該設(shè)備包括虛擬收聽點(diǎn)設(shè)置部分,用于在不同于收聽者收聽音頻的位置的基本收聽點(diǎn)處設(shè)置虛擬收聽點(diǎn);相對速度計(jì)算部分,用于根據(jù)背景的速度信息和方向信息計(jì)算虛擬收聽點(diǎn)和背景間的相對速度;和音頻變換部分,用于根據(jù)相對速度執(zhí)行音頻變換、以在虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到音頻信息中。
根據(jù)該設(shè)備,例如對于在屏幕上以視頻/音頻格式如DVD進(jìn)行重放的場景,響應(yīng)于背景的移動速度,將多普勒效應(yīng)在虛擬收聽點(diǎn)處加入到音頻信息中。因此能夠產(chǎn)生具有感染力/逼真效果、并能夠使得收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中并進(jìn)入到屏幕的背景正隨音頻從虛擬收聽點(diǎn)處移開的狀態(tài)的音頻環(huán)境。
圖1是表示根據(jù)本發(fā)明的第一實(shí)施例的音頻信息變換方法的示意圖;圖2是表示根據(jù)本發(fā)明的第一實(shí)施例的音頻信息變換方法的示意圖;圖3是表示根據(jù)本發(fā)明的第二實(shí)施例的音頻信息變換方法的示意圖及描述格式的場景的圖像示意圖;圖4是表示根據(jù)本發(fā)明的第二實(shí)施例的音頻信息變換方法的示意圖及一種視頻/音頻格式的示例性示意圖;圖5是表示根據(jù)本發(fā)明的第三實(shí)施例的音頻信息變換方法的示意圖;圖6是表示根據(jù)本發(fā)明的第四實(shí)施例的音頻信息變換方法的示意圖;圖7是表示根據(jù)本發(fā)明的第六實(shí)施例的音頻信息變換方法的示意圖;圖8是表示根據(jù)本發(fā)明的第六實(shí)施例的音頻信息變換方法的示意圖;圖9是表示根據(jù)本發(fā)明的第六實(shí)施例的音頻信息變換方法的示意圖;圖10是表示根據(jù)本發(fā)明的第六實(shí)施例的音頻信息變換方法的示意圖及一種視頻/音頻格式的示例性示意圖;圖11是表示根據(jù)本發(fā)明的第八實(shí)施例的音頻信息變換方法的示意圖;圖12是表示根據(jù)本發(fā)明的第八實(shí)施例的音頻信息變換方法的示意圖;圖13是表示根據(jù)本發(fā)明的第九實(shí)施例的音頻信息變換方法的示意圖;圖14是表示根據(jù)本發(fā)明的第十實(shí)施例的音頻信息變換方法的示意圖及一種視頻/音頻格式的示例性示意圖;和圖15是表示本發(fā)明的音頻信息變換系統(tǒng)的一個例子的方框圖。
附圖中,參考數(shù)字1,2,3均代表對象;100,801代表屏幕;101,102,701,1002代表虛擬收聽點(diǎn);1001代表基本收聽點(diǎn);1201代表時間軸;1500代表音頻信息變換設(shè)備;1510代表一種視頻/音頻格式;1520代表虛擬收聽點(diǎn)設(shè)置部分;1530代表相對速度計(jì)算部分;1540代表音頻變換部分。
具體實(shí)施例方式
以下將結(jié)合附圖對本發(fā)明的具體實(shí)施例進(jìn)行詳細(xì)的描述。
(第一實(shí)施例)圖1是描述本發(fā)明的第一實(shí)施例的示意圖。
在圖1中,在屏幕100中確定了虛擬收聽點(diǎn)101。另外,假定具有音頻信息的視頻對象1正從屏幕100的左邊向右邊移動。然后,如果虛擬收聽點(diǎn)101的坐標(biāo)值設(shè)置為(x1,y1,z1),則在圖2中對象1的當(dāng)前位置設(shè)置為P1(xa,ya,za),經(jīng)過一段時間t后的位置設(shè)置為P2(xb,Yb,zb),它們之間的矢量由方程式(1)給出。
P1P2→=(xb-xa,yb-ya,zb-za)---(1)]]>計(jì)算單位時間內(nèi)對象1的速度。此時,如果對象1的速度設(shè)為V1,該速度由方程式(2)給出。
V1=k(xb-xa,yb-ya,zb-za)…(2)其中k為常量。
然后,如圖2所示,利用從位置P1到虛擬收聽點(diǎn)101的矢量和從位置P1到位置P2的矢量間的角度θ計(jì)算cosθ。則對象1的速度V1在從位置P1到虛擬收聽點(diǎn)101的方向的分量可由方程式(3)表示。
V1′=V1cosθ …(3)這里,假定聲音的速度是v,聲源的聲音頻率是f,在虛擬收聽點(diǎn)101所聽到的聲音的音頻是f1,該音頻f1可以由方程式(4)表示。
f1=vv-V1′f---(4)]]>從方程式(4)可以看出,即使虛擬收聽點(diǎn)101設(shè)置在任意的位置,收聽者也能夠通過改變在虛擬收聽點(diǎn)101所聽到的音頻信息的音頻而聽到更逼真的聲音。
如上所述,在該實(shí)施例中,首先在不同于收聽者收聽聲音的基本收聽點(diǎn)的位置確定虛擬收聽點(diǎn)101位置,然后根據(jù)虛擬收聽點(diǎn)101的位置信息和對象1的位置信息計(jì)算虛擬收聽點(diǎn)101和對象1之間的相對速度,然后根據(jù)所計(jì)算的相對速度改變虛擬收聽點(diǎn)101處的聲音頻率。因此,能夠通過自由地移動收聽者虛擬存在的虛擬收聽點(diǎn)101的位置產(chǎn)生具有逼真效果的聲場。
(第二實(shí)施例)圖3是描述本發(fā)明的第二實(shí)施例的示意圖。
在上述第一實(shí)施例中,根據(jù)坐標(biāo)信息計(jì)算對象1的速度,并基于該信息改變在虛擬收聽點(diǎn)101所聽到的聲音的頻率。但是,如果對象1包括在先前的時間單元中的速度信息,這樣的計(jì)算就不需要了。在該實(shí)施例中,如果視頻/音頻格式具有之前通過編碼器等編碼的速度信息,這樣的速度信息需要先提取出,然后在該提取出的信息的基礎(chǔ)上計(jì)算在虛擬收聽點(diǎn)處所聽到的聲音的頻率。
在圖3所示出的視頻/音頻格式中,對象1,2...n的速度信息可以得到。同第一實(shí)施例,如果對象1的速度設(shè)為V1,從對象1到虛擬收聽點(diǎn)101方向上的速度分量V1’利用圖2所示的角度θ可以如方程式(5)表示。
V1′=V1cosθ …(5)這里,假定聲音的速度是v,從聲源發(fā)出的聲音的頻率是f,在虛擬收聽點(diǎn)101所聽到的聲音的頻率是f1,該頻率f1可由方程式(6)表示。
f1=vv-V1′f---(6)]]>在方程式(6)中,如果在虛擬收聽點(diǎn)101所聽到的音頻信息的音頻變化,即使虛擬收聽點(diǎn)101的位置設(shè)置在任意的位置,收聽者仍能聽到逼真的聲音。
同時,為了實(shí)現(xiàn)本實(shí)施例,對象1的速度信息和方向信息必須在對象信息中進(jìn)行描述。例如,如圖4所示,在一特定時刻,信息中除了包括對象1的信息外,還包括速度信息和方向信息,利用這些信息能夠產(chǎn)生具有多普勒效應(yīng)的聲音。
根據(jù)本實(shí)施例,以這種方式,在不同于收聽者收聽對象1的聲音的基本點(diǎn)的位置確定虛擬收聽點(diǎn)101,然后基于對象1的速度信息和移動方向信息及虛擬收聽點(diǎn)101的位置信息計(jì)算在虛擬收聽點(diǎn)101處所觀察的對象1靠近或離開的速度,然后根據(jù)所計(jì)算的速度改變在虛擬收聽點(diǎn)101所聽到的聲音的頻率。因此,有可能對在虛擬收聽點(diǎn)101所聽到的聲音提供比第一實(shí)施例更強(qiáng)的感染力和逼真效果。根據(jù)得到的相對速度,音頻變換部分改變虛擬收聽點(diǎn)101的音頻信息。
(第三實(shí)施例)圖5是描述本發(fā)明的第三實(shí)施例的示意圖。
在圖5中,假定虛擬收聽點(diǎn)102在屏幕上向右移動。另外,假定具有音頻信息的視頻對象2沒有移動。如果對象2的坐標(biāo)設(shè)為(x1,y1,z1),如圖5所示,虛擬收聽點(diǎn)102的當(dāng)前位置設(shè)為圖5中的P1(xa,ya,za),經(jīng)過時間t后的位置設(shè)置為P2(xb,yb,zb),它們之間的矢量可由方程式(7)表示。
P1P2→=(xb-xa,yb-ya,zb-za)---(7)]]>虛擬收聽點(diǎn)102的速度在單位時間內(nèi)進(jìn)行計(jì)算。如果虛擬收聽點(diǎn)102的速度設(shè)為V1,該速度V1可由方程式(8)表示。
V1=k(xb-xa,y-ya,zb-za)…(8)其中k為常量。
則,利用從對象2到位置P1的矢量和從位置P1到位置P2的矢量間的角度θ計(jì)算cosθ,如圖5所示。虛擬收聽點(diǎn)102的速度V1在從對象2到位置P1方向的分量V1’可由方程式(9)表示。
V1′=V1cosθ…(9)這里,假定聲音的速度是v,從聲源發(fā)出的聲音的頻率是f,在虛擬收聽點(diǎn)102聽到的聲音的頻率是f1,則該聲音頻率f1可由方程式(10)表示。
f1=v-V1′vf---(10)]]>結(jié)果,即使虛擬收聽點(diǎn)102設(shè)置在任意的位置,收聽者也能夠通過改變在虛擬收聽點(diǎn)102所聽到的聲音信息的頻率而聽到更逼真的聲音。
如上所述,根據(jù)該實(shí)施例,首先在不同于收聽者收聽對象2的聲音的基本收聽點(diǎn)的位置確定虛擬收聽點(diǎn)102,然后根據(jù)對象2的位置信息和虛擬收聽點(diǎn)102移動時該虛擬收聽點(diǎn)102的位置信息計(jì)算從對象2所觀察的虛擬收聽點(diǎn)102的速度,然后根據(jù)所計(jì)算的速度改變在虛擬收聽點(diǎn)102所聽到的聲音的頻率。因此,即使虛擬收聽點(diǎn)102移動到任意的位置,也能夠產(chǎn)生具有逼真效果的聲場。
(第四實(shí)施例)圖6是描述本發(fā)明的第四實(shí)施例的示意圖。
如圖5所示,假定虛擬收聽點(diǎn)102在屏幕中向右移動。另外,假定具有音頻信息的視頻對象2沒有移動。然后假定對象2的坐標(biāo)值如圖5所示設(shè)為(x1,y1,z1),虛擬收聽點(diǎn)102具有速度信息(還包括方向信息),速度設(shè)為V1。
然后利用如圖5所示的從對象2到位置P1的矢量和從位置P1到位置P2的矢量間的角度θ來計(jì)算cosθ。然后虛擬收聽點(diǎn)102的速度V1在從對象2到位置P1的方向上的分量可以用方程式(11)來表示。
V1′=V1cosθ …(11)這里,假定聲音的速度是v,從聲源發(fā)出的聲音的頻率是f,在虛擬收聽點(diǎn)102聽到的聲音的頻率是f1,該聲音頻率f1可由方程式(12)表示。
f1=v-V1′vf---(12)]]>結(jié)果,即使虛擬收聽點(diǎn)102設(shè)置在任意的位置,收聽者都能夠通過改變在虛擬收聽點(diǎn)102所聽到的聲音信息的頻率而聽到更逼真的聲音。
以這種方式,根據(jù)當(dāng)前的實(shí)施例,首先在不同于收聽者收聽對象2的聲音的基本收聽點(diǎn)的位置確定虛擬收聽點(diǎn)102,然后當(dāng)該虛擬收聽點(diǎn)102移動時,確定其速度和移動方向,然后計(jì)算在虛擬收聽點(diǎn)102所觀察到的對象2的靠近或離開速度,然后根據(jù)所計(jì)算的速度改變在虛擬收聽點(diǎn)101處所聽到的聲音頻率。因此,即使虛擬收聽點(diǎn)102移動到任意的位置,也能產(chǎn)生具有逼真效果的聲場。
(第五實(shí)施例)在該實(shí)施例中,當(dāng)具有視頻信息和音頻信息的對象1和虛擬收聽點(diǎn)102都移動時,在虛擬收聽點(diǎn)102所聽到的聲音的頻率就發(fā)生了變化。
假定存在如圖1所示的具有視頻信息和音頻信息的對象1。還假定如圖5所示的正在移動的虛擬收聽點(diǎn)102是確定的。然后,如果對象1的當(dāng)前位置設(shè)為圖6所示的P1(xa,ya,za),經(jīng)過時間t之后的位置設(shè)置為圖6所示的P2(xb,yb,zb),則它們之間的矢量可由方程式(13)表示。
P1P1→=(xb-xa,yb-ya,zb-za)---(13)]]>對象1的速度在單位時間內(nèi)進(jìn)行計(jì)算。如果對象1的速度設(shè)為V1,該速度V1可由方程式(14)表示。
V1=k(xb-xa,yb-ya,zb-za)…(14)其中k為常量。
然后,利用從位置P1到虛擬收聽點(diǎn)102的矢量和從位置P1到位置P2的矢量間的角度θ計(jì)算cosθ,如圖6所示。則對象1的速度V1在從位置P1到位置P2的方向上的分量可由方程式(15)表示s。
V1′=V1cosθ …(15)類似的,如果虛擬收聽點(diǎn)102的當(dāng)前位置設(shè)為圖6所示的P3(xc,yc,zc),以及經(jīng)過時間t后的位置設(shè)置為圖6所示的P4(xd,yd,zd),則它們之間的矢量可由方程式(16)表示。
P3P4→=(xd-xc,yb-yc,zd-zc)---(16)]]>虛擬收聽點(diǎn)102的速度在單位時間內(nèi)計(jì)算。如果虛擬收聽點(diǎn)102的速度設(shè)為V2,則該速度V2可由方程式(17)表示。
V2=k′(xd-xc,yb-yc,zd-zc) …(17)其中,k’為一常量。
然后,通過利用如圖6所示的從位置P1到位置P3的矢量和從位置P3到位置P4間的角度θ計(jì)算cosθ。則速度V2在從位置P1到位置P3的方向上的分量可由方程式(18)表示。
V2′=V2cosθ2 …(18)這里,假定聲音的速度是v,聲源的音頻是f,在虛擬收聽點(diǎn)102聽到的聲音的頻率是f1,該音頻f1可由方程式(19)表示。
f1=v-V2′v-V1′f---(19)]]>即使虛擬收聽點(diǎn)102設(shè)置在任意的位置,收聽者也能夠通過將在虛擬收聽點(diǎn)102處所聽到的聲音信s息的頻率改變?yōu)閒1而收聽到具有強(qiáng)逼真效果的聲音。
以這種方式,根據(jù)該實(shí)施例,當(dāng)對象2和虛擬收聽點(diǎn)102都移動時,根據(jù)對象2和虛擬收聽點(diǎn)102的位置或速度信息及移動方向來計(jì)算、從虛擬收聽點(diǎn)102所觀察的對象2的速度及從對象2所觀察的虛擬收聽點(diǎn)102的速度,然后根據(jù)所計(jì)算的速度改變在虛擬收聽點(diǎn)102處所聽到的聲音的頻率。因此,即使虛擬收聽點(diǎn)102移動到任意的位置,也能夠產(chǎn)生具有逼真效果的聲場。
(第六實(shí)施例)圖7是描述本發(fā)明的第六實(shí)施例的示意圖。
如圖7所示,虛擬收聽點(diǎn)701已經(jīng)確定。假定背景數(shù)據(jù)具有音頻信息,背景可以移動,視頻/音頻格式具有速度信息或位置信息。這里,假定屏幕801的x-y-z坐標(biāo)軸如圖8所示進(jìn)行設(shè)定,背景被看作是位于(x,y,z)=(0,0,t)點(diǎn)的對象,其中t為常量。相應(yīng)的,從虛擬收聽點(diǎn)701所聽到的聲音的頻率通過執(zhí)行第二實(shí)施例的過程來產(chǎn)生。如果背景被看作位于中心點(diǎn)Pa(0,0,t)的對象,背景的速度設(shè)為V1,則在從中心點(diǎn)Pa到虛擬收聽點(diǎn)701方向上的速度分量V1′可利用圖9所示的角度θ由方程式(20)來表示。
V1′=V1cosθ…(20)這里,假定聲音的速度是v,從聲源發(fā)出的聲音的頻率是f,在虛擬收聽點(diǎn)701聽到的聲音的頻率是f1,該聲音頻率f1可由方程式(21)表示。
f1=vv-V1′f---(21)]]>結(jié)果,即使虛擬收聽點(diǎn)701設(shè)置在任意的位置,收聽者也能夠通過改變在虛擬收聽點(diǎn)701所聽到的聲音信息的頻率而聽到更逼真的聲音。
為了實(shí)施本實(shí)施例,預(yù)先通過編碼器等進(jìn)行編碼的場景的速度信息和方向信息必須在場景信息中被描述。例如,如圖10所示,由于速度信息和方向信息包含在某一特定時刻的場景信息中,因此能夠?qū)崿F(xiàn)考慮了多普勒效應(yīng)的聲音。
以這種方式,根據(jù)當(dāng)前實(shí)施例,在播放視頻信息的屏幕上確定虛擬收聽點(diǎn)701,然后基于在虛擬收聽點(diǎn)701處觀察到的場景的移動方向和相對于背景(看作是對象)的速度的速度以及場景的速度改變在虛擬收聽點(diǎn)701處聽到的聲音頻率。因此即使虛擬收聽點(diǎn)701移動到任意的位置,也能夠產(chǎn)生具有逼真效果的聲場。
(第七實(shí)施例)在該實(shí)施例中,圖1中示出的虛擬收聽點(diǎn)102被用作另一個對象。以下該虛擬收聽點(diǎn)102被假定為對象3。對象1和對象3的位置信息或速度信息及方向信息從視頻信息和音頻信息中獲得,然后計(jì)算在從對象1到對象3的方向上的速度分量。假定對象1在從對象1到對象3的方向上的速度分量是V1’,對象3在從對象1到對象3的方向上的速度分量是V2’,聲音的速度是v,聲源的聲音的頻率是f,在虛擬收聽點(diǎn)102所聽到的聲音的頻率是f1,將這些因子應(yīng)用到代表多普勒效應(yīng)的方程中得出方程(22)。
f1=v-V2′v-V1′f---(22)]]>即使虛擬收聽點(diǎn)102設(shè)置在任意的位置,收聽者也能夠通過將在對象3處所聽到的聲音的頻率改變?yōu)閒1而聽到更逼真的聲音。
以這種方式,根據(jù)當(dāng)前實(shí)施例,在虛擬收聽點(diǎn)102處設(shè)置一個特定的對象3,然后改變在所設(shè)置的虛擬收聽點(diǎn)s102處聽到的聲音的頻率。因此,即使虛擬收聽點(diǎn)102移動到任意的位置,都能夠產(chǎn)生具有逼真效果的聲場。
(第八實(shí)施例)在有些情況下,當(dāng)在實(shí)際成像的時刻獲得了視頻信息和音頻信息時,很難獲得可以忽略其中的多普勒效應(yīng)的聲音。而且,很多時候,在通過當(dāng)前的視頻/音頻播放器如DVD播放器、MPEG 4播放器等重放的聲音中已經(jīng)考慮了多普勒效應(yīng)。在虛擬收聽點(diǎn)在這樣的聲場的所有位置處變化的情況下,即使虛擬收聽點(diǎn)在任意位置處變化,當(dāng)前實(shí)施例都可以根據(jù)這樣的位置獲得多普勒效應(yīng)。
在假定收聽者主要在如圖11所示的基本收聽點(diǎn)1001處收聽聲音的前提下生成MPEG播放器。在那時假定對象1具有音頻數(shù)據(jù),當(dāng)在基本收聽點(diǎn)1001處聽到的聲音被記錄的時候,有時該聲音中已經(jīng)提前考慮了多普勒效應(yīng)。假定對象1以速度V1移動,在基本收聽點(diǎn)1001處收聽到的聲音的頻率為f1。對象1在從對象1到基本收聽點(diǎn)1001的方向上的速度分量V1’由方程式(23)給出。
V1′=V1cosθ …(23)在基本收聽點(diǎn)1001聽到的聲音的音頻f1可由方程式(24)表示。
f1=vv-V1′f---(24)]]>那么,如果假定不考慮其中的多普勒效應(yīng)的對象1的聲音信息的音頻為f,則該頻率可由下面的方程式(25)來表示。
f=v-V1′vf1---(25)]]>以此方式,如果執(zhí)行多普勒效應(yīng)的逆運(yùn)算,則未考慮其中的多普勒效應(yīng)的音頻信息的音頻可以從考慮了其中的多普勒效應(yīng)的聲音信息中獲得。
那么,當(dāng)要生成在虛擬收聽點(diǎn)1002處收聽到的聲音時,在虛擬收聽點(diǎn)1002處收聽到的聲音信息的音頻、根據(jù)第一、第二、第三、第六和第七實(shí)施例中示出的方程式、可以從未考慮其中的多普勒效應(yīng)的聲音信息的音頻中導(dǎo)出。這里,在虛擬收聽點(diǎn)1002處收聽的聲音信息的音頻,是在假定虛擬收聽點(diǎn)1002不移動的前提下導(dǎo)出的。
在圖12中,假定在虛擬收聽點(diǎn)1002處聽到的聲音信息的頻率設(shè)為f2。如果對象1的速度V1在從對象1到虛擬收聽點(diǎn)1002的方向上的分量設(shè)為V2,此分量可由方程式(26)來表示。
V2=V1cosθ2…(26)這樣,方程式(27)被滿足了。
f2=vv-V2f---(27)]]>如果根據(jù)對象1和基本收聽點(diǎn)將下面的方程式(28)代入方程式(27),可以導(dǎo)出方程式(29)。
f1=vv-V1′f---(28)]]>[公式29]f2=vv-V2v-V1′vf1=v-V1′v-V2f1---(29)]]>即使虛擬收聽點(diǎn)1002的位置變?yōu)樽鴺?biāo)軸上的任意位置,通過在對應(yīng)于該位置加入適當(dāng)?shù)亩嗥绽招?yīng),收聽者就可以聽到具有較強(qiáng)逼真效果的聲音。
以此方式,根據(jù)當(dāng)前實(shí)施例,如果有這樣的聲音信息,當(dāng)在某一特定位置聽到聲音時所獲得的多普勒效應(yīng)已經(jīng)被加入,則可以通過執(zhí)行多普勒效應(yīng)的逆運(yùn)算產(chǎn)生沒有施加多普勒效應(yīng)的聲音信息。那么,當(dāng)由虛擬收聽點(diǎn)所產(chǎn)生的聲場產(chǎn)生時,利用未施加多普勒效應(yīng)的聲音信息將多普勒效應(yīng)加入。因此,當(dāng)從一個音頻流產(chǎn)生多個聲場時,就能夠產(chǎn)生具有更逼真效果的聲場。
而且,根據(jù)當(dāng)前實(shí)施例,忽略了多普勒效應(yīng)的聲音可以裝入各個對象的音頻流,并且從一個聲道的聲音信息所產(chǎn)生的聲場就象在多個聲道中所聽到的,另外還可以減小聲音信息的大小。
(第九實(shí)施例)在當(dāng)前實(shí)施例中,對象和虛擬收聽點(diǎn)的速度例如在不存在下一圖像的標(biāo)題的最終圖像時刻進(jìn)行計(jì)算。
當(dāng)由于下一圖像不存在或由于對象或虛擬收聽點(diǎn)在屏幕變換時的一個圖像前的時刻不具有速度信息、而不能根據(jù)下一圖像的坐標(biāo)計(jì)算速度時,假定時間軸的設(shè)定如圖13所示,并且在最終圖像單元(最終VOBU,最終柵格等)中虛擬收聽點(diǎn)所聽到的聲音的音頻信息、通過利用在一個圖像單元之前的虛擬收聽點(diǎn)處聽到的聲音的音頻信息的方程式、根據(jù)應(yīng)用于從最終圖像單元的對象所發(fā)出的聲音的音頻信息的方程式進(jìn)行計(jì)算。在圖13所示的虛擬收聽點(diǎn)102處聽到的對象1的聲音的音頻可由第五實(shí)施例中所示的方程式(19)來表示。
f1=v-V2′v-V1′f---(19)]]>那么,如果對象1在最終的圖像單元發(fā)出的聲音的音頻假定為f’,在最終圖像單元中虛擬收聽點(diǎn)102聽到的對象1的音頻f1’可由以下方程式(30)來表示。
f1′=v-V2′v-V1′f′---(30)]]>以此方式,根據(jù)當(dāng)前實(shí)施例,如果下一屏幕的位置信息不能從標(biāo)題的最終屏幕單元等獲得時,對象的速度信息或虛擬收聽點(diǎn)的速度信息從前一圖像獲得,然后計(jì)算在虛擬收聽點(diǎn)聽到的對象的聲音的音頻。因此,即使虛擬收聽點(diǎn)移動到任意的位置,也能夠產(chǎn)生具有逼真效果的聲場。
(第十實(shí)施例)為了根據(jù)屏幕上的坐標(biāo)數(shù)據(jù)在多個時間單位內(nèi)計(jì)算實(shí)際的速度,必須提供屏幕的縮小比例的信息。由于縮小比例信息各場景間不同,因此必須提供每一場景的縮小比例信息。為此,在當(dāng)前實(shí)施例中,如圖14所示,實(shí)施一種具有場景信息中的預(yù)先已通過編碼器等編碼的縮小比例信息的視頻/音頻格式。
在這種情況下,第九和第十實(shí)施例所描述的音頻信息變換方法被分別格式化為程序并被記錄在記錄介質(zhì)中,如其中記錄有用于解碼視頻/音頻格式的解碼器及解碼程序的存儲器,記錄了用于控制解碼器的程序的存儲器。這樣,能發(fā)揮各實(shí)施例優(yōu)點(diǎn)的視頻/音頻播放器(DVD播放器,LD播放器,MPEG播放器,影院系統(tǒng)等)就能夠?qū)崿F(xiàn)了。
如下參照圖15說明實(shí)施上述實(shí)施例的音頻信息變換設(shè)備的例子。
在圖15,該音頻信息變換設(shè)備包括視頻/音頻格式1510,虛擬收聽點(diǎn)設(shè)置部分1520,相對速度計(jì)算部分1530,及音頻變換部分1540。
視頻/音頻格式1510包括屏幕上的對于每一對象的視頻信息、位置信息、音頻信息、速度信息等。虛擬收聽點(diǎn)設(shè)置部分1520設(shè)置虛擬收聽點(diǎn)(例如圖1中的101)。相對速度計(jì)算部分1530通過比較對象1在某一特定時刻的位置信息和對象1從該特定時刻過去預(yù)定時間之后的位置信息來計(jì)算對象(例如,圖1的對象1)的速度,然后根據(jù)虛擬收聽點(diǎn)101的位置信息和對象1的速度信息計(jì)算虛擬收聽點(diǎn)101和對象1間的相對速度。如果對象1的速度信息包含在速度視頻/音頻格式1510中,則相對速度計(jì)算部分1530從視頻/音頻格式1510中提取速度信息,而不是計(jì)算對象1的速度。
然后,音頻變換設(shè)備1540根據(jù)所獲得的相對速度改變虛擬收聽點(diǎn)101的音頻信息。
如果虛擬收聽點(diǎn)設(shè)置部分1520設(shè)置圖1中的102點(diǎn)(移動對象3)作為虛擬收聽點(diǎn),圖1中的對象1作為聲源,相對速度計(jì)算部分1530計(jì)算虛擬收聽點(diǎn)102和對象1的速度,或者提取虛擬收聽點(diǎn)102和對象1的速度信息。然后,相對速度計(jì)算部分1530基于所得到的速度計(jì)算移動對象1和移動虛擬收聽點(diǎn)102間的相對速度。根據(jù)所計(jì)算的相對速度,音頻變換部分1540改變虛擬收聽點(diǎn)102的音頻信息。
如果只有對象1的速度信息包含在視頻/音頻格式1510中,則相對速度計(jì)算部分1530通過比較虛擬收聽點(diǎn)102在一特定時刻的位置信息和經(jīng)過預(yù)定時間后的位置信息來計(jì)算虛擬收聽點(diǎn)102的速度,并從視頻/音頻格式1510中提取對象1的速度信息。
如果只有虛擬收聽點(diǎn)的速度信息包含在視頻/音頻格式1510中,則相對速度計(jì)算部分1530通過比較對象1在一特定時刻的位置信息和經(jīng)過預(yù)定時間后的位置信息來計(jì)算對象1的速度,并從視頻/音頻格式1510中提取虛擬收聽點(diǎn)102的速度信息。
此外,如果背景是移動的,并具有音頻信息,可能需要將移動的背景考慮為作為聲源的移動對象。此時,可能需要設(shè)置另一移動對象作為虛擬收聽點(diǎn)。
本發(fā)明的優(yōu)點(diǎn)如上的詳細(xì)描述,根據(jù)權(quán)利要求1所述的音頻信息變換方法,對于具有構(gòu)成在屏幕上以視頻/音頻格式如MPEG 4重放的場景的視頻/音頻信息的對象,例如多普勒效應(yīng)可以在虛擬收聽點(diǎn)處加入到音頻信息中,從而例如如果對象靠近虛擬收聽點(diǎn),則聲音的頻率增加,或如果對象離開虛擬收聽點(diǎn),則聲音的頻率降低。因此,能夠產(chǎn)生具有強(qiáng)感染力/逼真效果、并且能夠使收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中的音頻環(huán)境。
根據(jù)權(quán)利要求2所述的音頻信息變換方法,利用對象的編碼位置信息,可以很容易地計(jì)算/處理由于對象的移動而產(chǎn)生的多普勒效應(yīng)。因此,能夠產(chǎn)生具有感染力/逼真效果、并且能夠使收聽者進(jìn)入到感覺屏幕上的對象正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)的音頻環(huán)境。
根據(jù)權(quán)利要求3所述的音頻信息變換方法,根據(jù)該過程,不必計(jì)算對象的速度,因此相應(yīng)的減少了計(jì)算過程的負(fù)擔(dān)。而且改善了處理速度。
根據(jù)權(quán)利要求4所述的音頻信息變換方法,利用虛擬收聽點(diǎn)的位置信息,可以很容易地計(jì)算/處理由虛擬收聽點(diǎn)的移動所引起的多普勒效應(yīng)。因此,能夠產(chǎn)生具有感染力/逼真效果、并且能夠使得收聽者進(jìn)入到感覺自己(位于虛擬收聽點(diǎn))正隨聲音移動的狀態(tài)的音頻環(huán)境。
根據(jù)權(quán)利要求5所述的音頻信息變換方法,根據(jù)該過程,不必計(jì)算虛擬收聽點(diǎn)的速度,因此相應(yīng)的減少了計(jì)算過程的負(fù)擔(dān)。而且改善了處理速度。
根據(jù)權(quán)利要求6所述的音頻信息變換方法,對于以視頻/音頻格式如DVD在屏幕上重放的場景,響應(yīng)于背景的移動速度,多普勒效應(yīng)在虛擬收聽點(diǎn)被加入到音頻信息中。因此,能夠產(chǎn)生具有強(qiáng)感染力/逼真效果、并且能夠使收聽者感覺確實(shí)進(jìn)入到視頻(虛擬收聽點(diǎn))中,并且進(jìn)入到感覺屏幕的背景正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)的音頻環(huán)境。
根據(jù)權(quán)利要求7所述的音頻信息變換方法,在對象中包括預(yù)先包含了多普勒效應(yīng)的音頻信息的情況下,首先包括在音頻信息中的這樣的多普勒效應(yīng)被消除,然后多普勒效應(yīng)在虛擬收聽點(diǎn)處被加入到音頻信息中。因此,即使在變換之前多普勒效應(yīng)包含在了音頻信息中,由于屏幕中的對象從虛擬收聽點(diǎn)處移動所產(chǎn)生的多普勒效應(yīng)也可以準(zhǔn)確地表示。
根據(jù)權(quán)利要求8所述的音頻信息變換方法,在后續(xù)屏幕的位置信息在正在重放的標(biāo)題的最終圖像時刻得不到的情況下,例如,在虛擬收聽點(diǎn)處聽到的對象的聲音頻率可以利用音頻變換公式來計(jì)算,該公式可在最終圖像的前一圖像的聲音頻率變換過程中獲得。因此,可以消除由于缺少信息而不能在標(biāo)題的最終圖像處等進(jìn)行音頻變換的可能。
根據(jù)權(quán)利要求9所述的音頻信息變換方法,當(dāng)屏幕的縮小比例通過在重放屏幕上進(jìn)行放大、縮小等而變化時,如權(quán)利要求1至8的音頻信息變換仍能準(zhǔn)確地執(zhí)行。
根據(jù)權(quán)利要求10所述的視頻/音頻格式,對象的速度信息,場景的速度信息和方向信息,每一場景的場景縮小比例信息通過權(quán)利要求11所述的編碼器進(jìn)行編碼,然后這些信息被包括在視頻/音頻格式中。因此,能夠?qū)崿F(xiàn)如權(quán)利要求1至9所述的音頻信息變換。
根據(jù)權(quán)利要求12所述的音頻信息變換程序,對于具有構(gòu)成在屏幕上以視頻/音頻格式如MPEG 4重放的場景的視頻/音頻信息的對象,例如多普勒效應(yīng)可以在虛擬收聽點(diǎn)處加入到音頻信息中,從而例如如果對象靠近虛擬收聽點(diǎn),則聲音的頻率增加,或如果對象離開虛擬收聽點(diǎn),則聲音的頻率降低。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求13所述的音頻信息變換程序,利用對象的編碼位置信息,可以很容易地計(jì)算/處理由于對象的移動而產(chǎn)生的多普勒效應(yīng)。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者進(jìn)入到感覺屏幕上的對象正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求14所述的音頻信息變換程序,根據(jù)該過程,不必計(jì)算對象的速度。因此相應(yīng)的減少了計(jì)算過程的負(fù)擔(dān)。而且改善了處理速度。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者進(jìn)入到感覺屏幕上的對象正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求15所述的音頻信息變換程序,利用虛擬收聽點(diǎn)的位置信息,可以很容易地計(jì)算/處理由虛擬收聽點(diǎn)的移動所引起的多普勒效應(yīng)。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者進(jìn)入到感覺自己(位于虛擬收聽點(diǎn))正隨聲音移動的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求16所述的音頻信息變換程序,根據(jù)該過程,不必計(jì)算虛擬收聽點(diǎn)的速度。因此相應(yīng)的減少了計(jì)算過程的負(fù)擔(dān)。而且,改善了處理速度。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者進(jìn)入到感覺自己(位于虛擬收聽點(diǎn))正隨聲音移動的狀態(tài)的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求17所述的音頻信息變換程序,對于以視頻/音頻格式如DVD在屏幕上重放的場景,響應(yīng)于背景的移動速度,多普勒效應(yīng)在虛擬收聽點(diǎn)被加入到音頻信息中。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求18所述的音頻信息變換程序,即使多普勒效應(yīng)在變換之前包含在了音頻信息中,由于屏幕中的對象從虛擬收聽點(diǎn)處移動所產(chǎn)生的多普勒效應(yīng)也可以準(zhǔn)確地表示。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求19所述的音頻信息變換程序,在后續(xù)屏幕的位置信息在正在重放的標(biāo)題的最終圖像時刻得不到的情況下,例如在虛擬收聽點(diǎn)處聽到的對象的聲音頻率可以利用音頻變換公式來計(jì)算,該公式可在最終圖像的前一圖像的聲音頻率變換過程中獲得。因此,可以消除由于缺少信息而不能在標(biāo)題的最終圖像處等進(jìn)行音頻變換的可能。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果的音頻環(huán)境的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求20所述的音頻信息變換程序,當(dāng)屏幕的縮小比例通過在重放屏幕上進(jìn)行放大、縮小等而變化時,音頻信息變換仍能準(zhǔn)確地實(shí)現(xiàn)。因此,如果使用了記錄該程序的記錄介質(zhì)(存儲器如ROM等),則能夠產(chǎn)生具有感染力/逼真效果的視頻/音頻播放器(DVD播放器,LD播放器,游戲,MPEG播放器,影院系統(tǒng)等)便能夠?qū)崿F(xiàn)。
根據(jù)權(quán)利要求21所述的音頻信息變換設(shè)備,對于具有構(gòu)成在屏幕上以視頻/音頻格式如MPEG 4重放的場景的視頻/音頻信息的對象,例如多普勒效應(yīng)可以在虛擬收聽點(diǎn)處加入到音頻信息中,從而例如如果對象靠近虛擬收聽點(diǎn),則聲音的頻率增加,或如果對象離開虛擬收聽點(diǎn),則聲音的頻率降低。因此,如果使用了該音頻信息變換設(shè)備,則能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中的音頻環(huán)境。
根據(jù)權(quán)利要求22所述的音頻信息變換設(shè)備,能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中、并能使收聽者進(jìn)入到感覺屏幕上的對象正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)、或進(jìn)入到感覺自己正隨聲音移動的狀態(tài)的音頻環(huán)境。
根據(jù)權(quán)利要求23所述的音頻信息變換設(shè)備,能夠產(chǎn)生具有感染力/逼真效果、能夠使收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中、并能使收聽者進(jìn)入到感覺屏幕上的對象正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)的音頻環(huán)境。
根據(jù)權(quán)利要求24所述的音頻信息變換設(shè)備,能夠產(chǎn)生具有感染力/逼真效果、并能夠使收聽者感覺確實(shí)進(jìn)入到了視頻(虛擬收聽點(diǎn))中、并能使收聽者進(jìn)入到感覺自己(位于虛擬收聽點(diǎn))正隨聲音移動的狀態(tài)的音頻環(huán)境。
根據(jù)權(quán)利要求25所述的音頻信息變換設(shè)備,對于以視頻/音頻格式如DVD在屏幕上重放的場景,響應(yīng)于背景的移動速度,多普勒效應(yīng)在虛擬收聽點(diǎn)被加入到音頻信息中。因此,能夠產(chǎn)生具有強(qiáng)感染力/逼真效果、并能夠使收聽者感覺確實(shí)進(jìn)入到視頻(虛擬收聽點(diǎn))中、并且進(jìn)入到感覺屏幕的背景正從虛擬收聽點(diǎn)隨聲音移動的狀態(tài)的音頻環(huán)境。
權(quán)利要求
1.一種應(yīng)用于一種視頻/音頻格式的音頻信息變換方法,在該格式中,屏幕包括多個對象,每一對象具有視頻信息、位置信息和音頻信息,該方法包括以下步驟虛擬收聽點(diǎn)設(shè)置步驟,在不同于基本收聽點(diǎn)的位置處設(shè)置虛擬收聽點(diǎn),所述基本收聽點(diǎn)被設(shè)置作為收聽者收聽聲音的位置;相對速度計(jì)算步驟,計(jì)算所述虛擬收聽點(diǎn)和所述對象間的相對速度;和音頻變換步驟,根據(jù)所述相對速度執(zhí)行音頻變換以在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中。
2.如權(quán)利要求1所述的音頻信息變換方法,其中所述相對速度計(jì)算步驟通過基于對象在預(yù)定時間逝去前后的位置信息計(jì)算對象的速度信息來計(jì)算虛擬收聽點(diǎn)和對象間的相對速度。
3.如權(quán)利要求1所述的音頻信息變換方法,其中所述相對速度計(jì)算步驟通過提取所述對象的速度信息、然后比較所述對象的位置信息和速度信息與所述虛擬收聽點(diǎn)的位置信息、來計(jì)算相對速度。
4.如權(quán)利要求1所述的音頻信息變換方法,其中所述相對速度計(jì)算步驟通過根據(jù)預(yù)定時間逝去前后虛擬收聽點(diǎn)的位置信息計(jì)算虛擬收聽點(diǎn)的速度信息來計(jì)算虛擬收聽點(diǎn)和對象間的相對速度。
5.如權(quán)利要求1所述的音頻信息變換方法,其中所述相對速度計(jì)算步驟通過提取虛擬收聽點(diǎn)的速度信息、然后比較虛擬收聽點(diǎn)的位置信息和速度信息與對象的位置信息、來計(jì)算相對速度。
6.一種應(yīng)用于一種視頻/音頻格式的音頻信息變換方法,在該格式中,在屏幕上重放的每一場景具有視頻信息和音頻信息,該場景具有速度信息和方向信息,背景根據(jù)該速度信息和方向信息進(jìn)行移動,該方法包括以下步驟虛擬收聽點(diǎn)設(shè)置步驟,在不同于基本收聽點(diǎn)的位置處設(shè)置虛擬收聽點(diǎn),所述基本收聽點(diǎn)被設(shè)置作為收聽者收聽聲音的位置;相對速度計(jì)算步驟,根據(jù)所述背景的速度信息和方向信息計(jì)算所述虛擬收聽點(diǎn)和背景間的相對速度;音頻變換步驟,根據(jù)所述相對速度執(zhí)行音頻變換,以在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中。
7.如權(quán)利要求1所述的音頻信息變換方法,其中,當(dāng)先前包括多普勒效應(yīng)的音頻信息包括在所述對象中時,音頻變換步驟執(zhí)行音頻變換以消除包括在對象的音頻信息中的多普勒效應(yīng),并根據(jù)相對速度執(zhí)行音頻變換以將多普勒效應(yīng)加入到虛擬收聽點(diǎn)的音頻信息中。
8.如權(quán)利要求1所述的音頻信息變換方法,其中,對于最終圖像單元,音頻變換步驟通過利用一個公式在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中而執(zhí)行,通過該公式執(zhí)行在最終圖像之前一個圖像單元的虛擬收聽點(diǎn)處的音頻信息的音頻變換。
9.如權(quán)利要求1或6所述的音頻信息變換方法,其中該視頻/音頻格式包括每一場景屏幕的縮小比例信息。
10.一種在權(quán)利要求1至9中任一權(quán)利要求中采用的視頻/音頻格式,該格式至少包括下述信息之一對象的速度信息,所述對象是包括在屏幕上的多個對象中的一個;在屏幕上重放的場景的速度信息和方向信息;和每一場景屏幕的縮小比例信息。
11.一種在權(quán)利要求1至9中任一權(quán)利要求中采用的編碼器,該編碼器用于編碼至少下述信息之一對象的速度信息,該對象是包括在屏幕上的多個對象中的一個;場景的速度和方向信息;和每一場景屏幕的縮小比例信息。
12.一種音頻信息變換程序產(chǎn)品,該程序產(chǎn)品通過計(jì)算機(jī)依次執(zhí)行以下過程在不同于基本收聽點(diǎn)的位置處設(shè)置虛擬收聽點(diǎn),該基本收聽點(diǎn)被設(shè)置作為收聽者收聽聲音的位置;計(jì)算所述虛擬收聽點(diǎn)和所述對象間的相對速度;和根據(jù)所述相對速度執(zhí)行音頻變換,以在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中。
13.如權(quán)利要求12所述的程序產(chǎn)品,其中所述計(jì)算相對速度的過程包括根據(jù)預(yù)定時間逝去前后所述對象的位置信息計(jì)算所述對象的速度信息的過程。
14.如權(quán)利要求12所述的程序產(chǎn)品,其中所述計(jì)算相對速度的過程包括以下過程提取所述對象的速度信息;和比較所述對象的位置信息和速度信息與所述虛擬收聽點(diǎn)的位置信息。
15.如權(quán)利要求12所述的程序產(chǎn)品,其中所述計(jì)算相對速度的過程包括根據(jù)預(yù)定時間逝去前后所述虛擬收聽點(diǎn)的位置信息計(jì)算所述虛擬收聽點(diǎn)的速度信息的過程。
16.如權(quán)利要求12所述的程序產(chǎn)品,其中所述計(jì)算相對速度的過程包括以下過程通過提取所述虛擬收聽點(diǎn)的速度信息計(jì)算相對速度;和比較虛擬收聽點(diǎn)的位置信息和速度信息與對象的位置信息。
17.一種音頻信息變換程序產(chǎn)品,該程序通過計(jì)算機(jī)依次執(zhí)行以下過程在不同于基本收聽點(diǎn)處設(shè)置虛擬收聽點(diǎn),該基本收聽點(diǎn)是設(shè)置作為收聽者收聽聲音的位置;根據(jù)場景的背景所移動的速度和方向計(jì)算所述虛擬收聽點(diǎn)和所述背景間的相對速度;和根據(jù)所述相對速度執(zhí)行音頻變換,以在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中。
18.如權(quán)利要求12或17中任一權(quán)利要求所述的程序產(chǎn)品,其中當(dāng)先前包括多普勒效應(yīng)的音頻信息包括在所述對象中時,所述執(zhí)行音頻變換的過程包括以下過程執(zhí)行音頻變換以消除包括在所述對象的音頻信息中的多普勒效應(yīng);和根據(jù)所述相對速度執(zhí)行音頻變換,以將多普勒效應(yīng)加入所述虛擬收聽點(diǎn)處的所述音頻信息中。
19.如權(quán)利要求12或17中任一權(quán)利要求所述的程序產(chǎn)品,其中,當(dāng)執(zhí)行最終圖像單元時刻的音頻信息變換時,所述的程序產(chǎn)品還包括以下過程通過利用一個公式在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中,通過所述公式執(zhí)行在最終圖像之前一個圖像單元的虛擬收聽點(diǎn)處的音頻信息的音頻變換。
20.如權(quán)利要求12或17中任一權(quán)利要求所述的程序產(chǎn)品,其中所述視頻/音頻格式包括每一場景屏幕的縮小比例信息。
21.一種用于一種視頻/音頻格式的音頻信息變換設(shè)備,其中在該格式中,屏幕包括多個對象,每一對象具有視頻信息、位置信息和音頻信息,該設(shè)備包括虛擬收聽點(diǎn)設(shè)置部分,用于在不同于基本收聽點(diǎn)的位置處設(shè)置虛擬收聽點(diǎn),所述基本收聽點(diǎn)是被設(shè)置作為收聽者收聽聲音的位置;相對速度計(jì)算部分,用于計(jì)算所述虛擬收聽點(diǎn)和所述對象間的相對速度;和音頻變換部分,用于根據(jù)所述相對速度執(zhí)行音頻變換,以在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中。
22.如權(quán)利要求21所述的音頻信息變換設(shè)備,其中所述相對速度計(jì)算部分通過在預(yù)定時間逝去之后比較所述虛擬收聽點(diǎn)的位置信息和所述對象的位置信息來計(jì)算相對速度。
23.如權(quán)利要求21所述的音頻信息變換設(shè)備,其中所述相對速度計(jì)算部分通過比較所述對象的位置信息和速度信息與所述虛擬收聽點(diǎn)的位置信息來計(jì)算相對速度。
24.如權(quán)利要求21所述的音頻信息變換設(shè)備,其中所述相對速度計(jì)算部分通過比較所述對象的位置信息與所述虛擬收聽點(diǎn)的位置信息和速度信息來計(jì)算相對速度。
25.一種用于一種視頻/音頻格式的音頻信息變換設(shè)備,在該格式中,在屏幕上重放的每一場景具有視頻信息和音頻信息,該場景具有速度信息和方向信息,背景根據(jù)該速度信息和方向信息移動,該設(shè)備包括虛擬收聽點(diǎn)設(shè)置部分,用于在不同于基本收聽點(diǎn)的位置設(shè)置虛擬收聽點(diǎn),所述基本收聽點(diǎn)被設(shè)置作為收聽者收聽聲音的位置;相對速度計(jì)算部分,用于根據(jù)所述背景的速度信息和方向信息計(jì)算所述虛擬收聽點(diǎn)和所述背景間的相對速度;和音頻變換部分,用于根據(jù)所述相對速度執(zhí)行音頻變換,以在所述虛擬收聽點(diǎn)處將多普勒效應(yīng)加入到所述音頻信息中。
全文摘要
本發(fā)明提供了一種音頻信息變換方法,一種程序產(chǎn)品,一種設(shè)備,一種編碼器,及其中采用的一種視頻/音頻格式。本發(fā)明通過響應(yīng)于收聽點(diǎn)的變化、調(diào)節(jié)由于對象的移動所產(chǎn)生的多普勒效應(yīng)、能夠提供一種音頻信息。在本發(fā)明中,首先在不同于收聽者收聽對象聲音的基本收聽點(diǎn)的位置設(shè)置虛擬收聽點(diǎn),然后根據(jù)虛擬收聽點(diǎn)的位置信息和對象的位置信息計(jì)算從虛擬收聽點(diǎn)觀察到的對象的速度信息。然后根據(jù)所計(jì)算的速度信息改變在虛擬收聽點(diǎn)聽到的聲音的音頻。例如,如果對象靠近虛擬收聽點(diǎn),則聲音的頻率增加,反之則降低。
文檔編號H04N9/475GK1499485SQ200310102669
公開日2004年5月26日 申請日期2003年10月28日 優(yōu)先權(quán)日2002年10月29日
發(fā)明者緒方賢史 申請人:松下電器產(chǎn)業(yè)株式會社