專利名稱:使用多個(gè)編碼器對(duì)多媒體壓縮進(jìn)行優(yōu)化的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及多媒體傳輸。
背景技術(shù):
為了節(jié)約帶寬,在發(fā)射或存儲(chǔ)通常包括視頻幀的多媒體流之前對(duì)其進(jìn)行壓縮。壓縮視頻通常意味著用相對(duì)較小的比特組表示相對(duì)較大的比特組。所接收的壓縮多媒體流被解壓縮回它們(接近于)的原始格式,以用于顯示。
很容易明白的是,可以采用多種壓縮方案。更具體地說(shuō),可以采用多種使用算法和/或基函數(shù)(這里統(tǒng)稱為“壓縮算法”)的不同壓縮方案。壓縮通常有兩個(gè)目標(biāo)第一個(gè),當(dāng)然是盡可能地壓縮多媒體流;與第一個(gè)目標(biāo)相矛盾的是,希望在壓縮和展開(kāi)過(guò)程期間不損失過(guò)多的信息。通常用于壓縮的設(shè)備稱為高質(zhì)量編碼器,該高質(zhì)量編碼器配置了固定的壓縮算法,這些壓縮算法力求優(yōu)化這兩個(gè)矛盾的目標(biāo)。
本發(fā)明認(rèn)識(shí)到,根據(jù)待壓縮的特定多媒體流的特性,第一壓縮方案對(duì)于第一流可能是最優(yōu)的,而第二壓縮方案對(duì)于第二流可能是最優(yōu)的。實(shí)際上,使用多于一個(gè)的壓縮方案來(lái)對(duì)相同流的不同部分進(jìn)行壓縮可能是最優(yōu)的。
處理這種情況的一種辦法是提供一種編碼器,該編碼器能夠動(dòng)態(tài)地改變其壓縮算法以適合于當(dāng)前正被壓縮的多媒體流。然而,如同本發(fā)明所理解的那樣,這需要通過(guò)連續(xù)測(cè)試候選算法,來(lái)改變壓縮算法、測(cè)量所得壓縮的質(zhì)量、再次改變算法等。如同這里進(jìn)一步理解的那樣,雖然對(duì)于存儲(chǔ)壓縮內(nèi)容而言,這可能可以接受,但在發(fā)射壓縮多媒體的內(nèi)容時(shí)就成為問(wèn)題,在發(fā)射期間,可能不存在足夠的時(shí)間來(lái)連續(xù)地測(cè)試候選壓縮算法?;谝呀?jīng)做出這些關(guān)鍵意見(jiàn),在下面提出了本發(fā)明。
發(fā)明內(nèi)容
一種用于處理多媒體流的方法,包括使用第一壓縮算法,從該多媒體流產(chǎn)生第一壓縮流。該方法還包括使用第二壓縮算法,與第一壓縮流并行地從該多媒體流產(chǎn)生至少第二壓縮流;然后,評(píng)估所述第一和第二壓縮流?;谠撛u(píng)估動(dòng)作,發(fā)射所述壓縮流中的最佳一個(gè)。
在一個(gè)優(yōu)選實(shí)施例中,所述第一壓縮流是使用執(zhí)行所述第一壓縮算法的第一編碼器來(lái)產(chǎn)生的。另一方面,第二壓縮流是使用執(zhí)行所述第二壓縮算法的第二編碼器來(lái)產(chǎn)生的??梢允褂煤驮u(píng)估兩個(gè)以上的編碼器。
為了有助于在發(fā)射和接收之后將該壓縮流解壓縮,將表示最佳壓縮流的壓縮算法的信息與該流一起發(fā)射。所述評(píng)估可以是基于壓縮效率和/或流質(zhì)量和/或集合傳輸信道要求和/或傳輸信道能力的。
在另一個(gè)方面,一種對(duì)原始多媒體流進(jìn)行編碼以用于發(fā)射的系統(tǒng),包括第一編碼器,用于使用至少第一編碼算法對(duì)該原始流進(jìn)行編碼,以產(chǎn)生第一編碼流;第二編碼器,用于使用至少第二編碼算法對(duì)該原始流進(jìn)行編碼,以產(chǎn)生第二編碼流。處理器選擇第一和第二編碼流中之一,來(lái)產(chǎn)生代表該原始流的選擇流。
在又一方面,一種用于選擇用于發(fā)射的壓縮流的產(chǎn)品,包括用于從多媒體流中獲取第一壓縮流的裝置。該產(chǎn)品還包括用于從該多媒體流中與第一壓縮流并行地獲取第二壓縮流的裝置。裝置被提供來(lái)動(dòng)態(tài)地選擇所述壓縮流中的一個(gè)最佳壓縮流以用于發(fā)射。
參考以下附圖,可以更好地理解本發(fā)明關(guān)于其結(jié)構(gòu)和操作的細(xì)節(jié),在所有附圖中,相同的標(biāo)號(hào)表示相同的部件,其中附圖簡(jiǎn)述
圖1是本系統(tǒng)的簡(jiǎn)化功能框圖;以及圖2是由選擇處理器執(zhí)行的邏輯的流程圖。
具體實(shí)施例方式
首先參照?qǐng)D1,示出了一種用于對(duì)來(lái)自多媒體源12的、包括視頻流的多媒體進(jìn)行壓縮和發(fā)射的系統(tǒng),總體標(biāo)記為10。源12可以是提供多媒體流的內(nèi)容提供者、或本地?cái)?shù)據(jù)存儲(chǔ)設(shè)備或接收機(jī)。源12的具體特征與本發(fā)明并無(wú)密切關(guān)系。這里的多媒體流被假定為是數(shù)字化的。
如圖所示,系統(tǒng)10包括多個(gè)壓縮編碼器A至N,所述多個(gè)壓縮編碼器A至N并行地接收待壓縮的流,并使用各自的壓縮方案相互并行地對(duì)該流進(jìn)行壓縮。編碼器A至N的輸出由選擇處理器14接收,選擇處理器14如下面進(jìn)一步討論那樣來(lái)對(duì)這些輸出的品質(zhì)(merit)進(jìn)行評(píng)估,然后將所選擇的一個(gè)流或多個(gè)流發(fā)送到用于發(fā)射所述流的發(fā)射機(jī)16。如下進(jìn)一步討論,選擇決策可以考慮諸如信噪比、可用通信層、傳輸信道特征、消費(fèi)者偏好、節(jié)目流重要性、可用帶寬以及其他的參數(shù)。接收機(jī)18接收所述流,并將該流發(fā)送到解碼器20,解碼器20將該流解壓縮,以將其呈現(xiàn)在諸如視頻監(jiān)視器、打印機(jī)、揚(yáng)聲器之類的顯示設(shè)備22上。
圖1中所示的非限制性優(yōu)選實(shí)施例示出了多媒體發(fā)射機(jī)16,該多媒體發(fā)射機(jī)16使用無(wú)線方法,更具體地說(shuō),使用碼分多址(CDMA)原理。如果需要,可以將所述流廣播到多個(gè)接收機(jī);或者使用點(diǎn)到點(diǎn)無(wú)線傳輸原理來(lái)發(fā)送該流。也可以采用多播傳輸原理。應(yīng)當(dāng)理解的是,本原理適用于其他形式的無(wú)線通信,如GSM、TDMA、寬帶CDMA、OFDM等,以及通過(guò)電纜系統(tǒng)、互聯(lián)網(wǎng)等進(jìn)行的多媒體傳輸。
現(xiàn)在參照?qǐng)D2,說(shuō)明壓縮方案選擇邏輯。從方框24開(kāi)始,來(lái)自源12的多媒體流由編碼器A、B、…、N并行地接收。在方框26中,所述編碼器使用各自的壓縮算法,相互并行地壓縮相同的流。將編碼器和/或編碼器輸出多樣化的方法的非限制性例子包括在所述編碼器中,使用不同數(shù)量和類型的層、分配到各層的不同的數(shù)據(jù)量/秒、不同的信噪比、不同的壓縮技術(shù)、不同的總帶寬等。應(yīng)該注意的是,當(dāng)前互聯(lián)網(wǎng)多媒體流應(yīng)用向用戶提供多個(gè)固定編碼選擇,包括所需的帶寬(如56Kbps、100Kbps、300Kbps)和大小(如視頻QCIF、CIF、單聲、立體聲、5.1等)。
在方框28中,將編碼器輸出的壓縮流發(fā)送到選擇處理器14進(jìn)行評(píng)估。如果需要,在一個(gè)非限制示例性實(shí)施例中,首先將所述流發(fā)送到方框27,在方框27中,根據(jù)流特征或單獨(dú)地確定集合流和可用傳輸信道的相關(guān)信息,如集合信道要求、當(dāng)前信道狀態(tài)和當(dāng)前傳輸信道能力。在方框28中,處理器14評(píng)估這些流的品質(zhì),其包括如果需要,考慮集合信道要求和傳輸信道的當(dāng)前狀態(tài)及傳輸信道的能力。應(yīng)當(dāng)明白的是,要盡可能地幾乎同時(shí)對(duì)所述流進(jìn)行評(píng)估。評(píng)估本身可以是基于各編碼器提供的壓縮效率的,即在一個(gè)非限制性例子中,可以確定相對(duì)于從源12接收的原始多媒體流的大小,哪個(gè)編碼器將其壓縮流大小減少得最多。此外,評(píng)估也可基于壓縮流的質(zhì)量??梢允褂萌魏魏线m的質(zhì)量標(biāo)準(zhǔn)。在一個(gè)非限制性例子中,可以將各壓縮流的部分解壓縮,然后,將解壓縮的部分與原始流的相應(yīng)部分進(jìn)行比較,其結(jié)果是,提供最接近匹配的編碼器被指定為“高質(zhì)量”編碼器。當(dāng)使用一個(gè)以上的評(píng)估標(biāo)準(zhǔn)時(shí),例如,當(dāng)評(píng)估壓縮效率、層數(shù)、流優(yōu)先權(quán)和流質(zhì)量時(shí),可以產(chǎn)生一個(gè)各自的加權(quán)平均測(cè)量,作為各編碼器壓縮正在處理的特定多媒體流的效率的總體指示符。在一個(gè)非限制性例子中,壓縮效率可能占總分的80%,流質(zhì)量可能占20%。在另一個(gè)非限制性例子中,將一個(gè)流的基本層壓縮到如32Kbps和將該流的第二(增強(qiáng))層壓縮到小于24Kbps的能力可能占總分的50%,流質(zhì)量可能占50%,但是,如果編碼選擇不能將基本層壓縮到小于48Kbps,將完全排除該編碼選擇。也可以使用其他啟發(fā)式方法,所述啟發(fā)式方法包括那些與接收設(shè)備能力相適應(yīng)的方法。
如方框28所示,一個(gè)品質(zhì)顯示為“最佳”的壓縮流被輸出來(lái)用于發(fā)射。決策菱形框30表明,如果需要,可以在連續(xù)循環(huán)內(nèi)執(zhí)行以上過(guò)程。具體而言,如果其中某一壓縮流是“最佳”壓縮流的改變被指出,則邏輯轉(zhuǎn)到方框32,以輸出該新的“最佳”壓縮流,然后,轉(zhuǎn)到方框34,通過(guò)環(huán)回到方框26,繼續(xù)該過(guò)程,直到全部多媒體流已經(jīng)被壓縮、評(píng)估和發(fā)射。如果決策菱形框30的檢測(cè)是否定的,如圖所述,邏輯通過(guò)方框34環(huán)回到方框26。因此,如果需要,原始多媒體流可以進(jìn)行連續(xù)地并行壓縮;如果需要,“最佳”壓縮流的選擇可以是連續(xù)且是動(dòng)態(tài)的,其中,基于對(duì)應(yīng)于各部分的品質(zhì)的各方案,可能將多個(gè)壓縮方案用于原始流的各個(gè)部分。
作為“最佳”壓縮流輸出的部分,用于產(chǎn)生“最佳”輸出的特定壓縮方案的指示與該流一起發(fā)射,例如,在該流的視頻幀的頭部中或在一個(gè)獨(dú)立的信道上。使用該指示,解碼器20可以被合適地配置來(lái)對(duì)該流進(jìn)行解壓縮。
盡管這里示出和詳細(xì)描述的具體的“SYSTEM AND METHODFOR OPTIMIZING MULTIMEDIA COMPRESSION USINGPLURALENCODERS(使用多個(gè)編碼器優(yōu)化多媒體壓縮的系統(tǒng)和方法)”能夠完全地實(shí)現(xiàn)本發(fā)明的上述目的,但應(yīng)當(dāng)理解的是,這只是本發(fā)明目前的優(yōu)選實(shí)施例,因此只是本發(fā)明廣義考慮的主題的一個(gè)代表,本發(fā)明的保護(hù)范圍完全地包括對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的其他實(shí)施例,因此,除所附的權(quán)利要求之外,本發(fā)明的保護(hù)范圍不受其他限定,其中,除非明確聲明,否則對(duì)元件的單數(shù)說(shuō)明并不表示“一個(gè)且僅一個(gè)”,而是表示“一個(gè)或多個(gè)”。與對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō)都是已知的或者以后將成為已知的上述優(yōu)選實(shí)施例的元件相等同的所有結(jié)構(gòu)和功能等價(jià)物明確地并入此處,作為參考,并且趨向于被本發(fā)明的權(quán)利要求所覆蓋。而且,對(duì)于本權(quán)利要求所覆蓋的一種設(shè)備或方法,不必解決本發(fā)明欲解決的每個(gè)問(wèn)題。此外,不管在權(quán)利要求中是否明確說(shuō)明了該要素、部件或方法步驟,本發(fā)明公開(kāi)中的任何要素、部件或方法步驟都趨向于不是專用于公眾的。除非一個(gè)產(chǎn)品權(quán)利要求使用“用于……的裝置”的措辭來(lái)明確表述,或者在一個(gè)方法權(quán)利要求情況下,該元件被表述為“步驟”而非“動(dòng)作”,否則,這里任何的單項(xiàng)權(quán)利要求都不得按照美國(guó)法典第35條第112款第六段來(lái)進(jìn)行解釋。
權(quán)利要求
1.一種用于對(duì)多媒體流進(jìn)行處理的方法,包括使用第一壓縮算法,從所述多媒體流產(chǎn)生第一壓縮流;使用第二壓縮算法,從所述多媒體流與此并行地產(chǎn)生至少第二壓縮流;評(píng)估至少所述第一和第二壓縮流;以及基于所述評(píng)估動(dòng)作,發(fā)射所述壓縮流中的選擇壓縮流。
2.如權(quán)利要求1所述的方法,其中,所述第一壓縮流是使用執(zhí)行所述第一壓縮算法的第一編碼器產(chǎn)生的,所述第二壓縮流是使用執(zhí)行所述第二壓縮算法的第二編碼器產(chǎn)生的。
3.如權(quán)利要求1所述的方法,包括使用第三壓縮算法,與產(chǎn)生所述第一和第二壓縮流并行地從所述多媒體流產(chǎn)生至少第三壓縮流。
4.如權(quán)利要求1所述的方法,還包括發(fā)射表示所述選擇壓縮流的壓縮算法的信息。
5.如權(quán)利要求4所述的方法,還包括使用表示所述選擇壓縮流的壓縮算法的信息來(lái)配置解碼器,以便于對(duì)所述選擇壓縮流進(jìn)行解壓縮。
6.如權(quán)利要求1所述的方法,其中,所述評(píng)估動(dòng)作是至少部分地通過(guò)評(píng)估壓縮質(zhì)量來(lái)執(zhí)行的。
7.如權(quán)利要求1所述的方法,其中,所述評(píng)估動(dòng)作至少部分地基于壓縮效率。
8.如權(quán)利要求1所述的方法,其中,所述評(píng)估動(dòng)作至少部分地基于集合傳輸信道的要求。
9.如權(quán)利要求1所述的方法,其中,所述評(píng)估動(dòng)作至少部分地基于傳輸信道的能力。
10.如權(quán)利要求1所述的方法,其中,所述發(fā)射動(dòng)作是無(wú)線執(zhí)行的。
11.如權(quán)利要求10所述的方法,其中,所述發(fā)射動(dòng)作是使用CDMA原理執(zhí)行的。
12.如權(quán)利要求10所述的方法,其中,所述發(fā)射動(dòng)作是使用OFDM原理執(zhí)行的。
13.如權(quán)利要求10所述的方法,其中,所述發(fā)射動(dòng)作是使用數(shù)字廣播原理執(zhí)行的。
14.一種用于對(duì)原始多媒體流進(jìn)行編碼以用于發(fā)射的系統(tǒng),包括第一編碼器,用于使用至少第一編碼算法對(duì)所述原始流進(jìn)行編碼,以產(chǎn)生第一編碼流;第二編碼器,用于使用至少第二編碼算法對(duì)所述原始流進(jìn)行編碼,以產(chǎn)生第二編碼流;和處理器,用于選擇所述第一和第二編碼流中之一,以產(chǎn)生代表所述原始流的選擇流。
15.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器至少部分地基于各編碼流的質(zhì)量來(lái)執(zhí)行所述選擇動(dòng)作。
16.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器至少部分地基于壓縮效率來(lái)執(zhí)行所述選擇動(dòng)作。
17.如權(quán)利要求14所述的系統(tǒng),還包括用于發(fā)射編碼流的無(wú)線發(fā)射機(jī)。
18.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器對(duì)所述原始流多次執(zhí)行所述選擇動(dòng)作。
19.如權(quán)利要求14所述的系統(tǒng),包括至少第三編碼器。
20.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器將產(chǎn)生所述選擇流的各個(gè)編碼器的相應(yīng)算法的相關(guān)信息連同所述選擇流一起發(fā)送。
21.如權(quán)利要求14所述的系統(tǒng),還包括一個(gè)使用所述信息來(lái)選擇解碼算法的解碼器。
22.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器至少部分地基于集合信道的要求來(lái)執(zhí)行所述選擇動(dòng)作。
23.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器至少部分地基于傳輸信道的能力來(lái)執(zhí)行所述選擇動(dòng)作。
24.如權(quán)利要求14所述的系統(tǒng),其中,所述處理器在一個(gè)獨(dú)立于所述選擇流的信道上發(fā)送產(chǎn)生所述選擇流的各個(gè)編碼器的相關(guān)信息。
25.如權(quán)利要求17所述的系統(tǒng),其中,所述無(wú)線發(fā)射機(jī)是CDMA發(fā)射機(jī)。
26.如權(quán)利要求17所述的系統(tǒng),其中,所述無(wú)線發(fā)射機(jī)是OFDM發(fā)射機(jī)。
27.如權(quán)利要求17所述的系統(tǒng),其中,所述無(wú)線發(fā)射機(jī)是數(shù)字廣播發(fā)射機(jī)。
28.一種用于選擇壓縮流以用于發(fā)射的產(chǎn)品,包括用于從多媒體流中獲取第一壓縮流的裝置;用于與所述第一壓縮流并行地從所述多媒體流獲取第二壓縮流的裝置;以及用于動(dòng)態(tài)地選擇所述壓縮流中的選擇壓縮流以用于發(fā)射的裝置。
29.如權(quán)利要求28所述的產(chǎn)品,還包括發(fā)送裝置,用于將用于產(chǎn)生所述壓縮流中的選擇壓縮流的壓縮方案的指示連同所述壓縮流中的選擇壓縮流一起發(fā)送。
30.如權(quán)利要求29所述的產(chǎn)品,還包括用于發(fā)射所述壓縮流中的選擇壓縮流的裝置。
31.如權(quán)利要求30所述的產(chǎn)品,還包括解壓縮裝置,用于當(dāng)收到所述壓縮流中的選擇壓縮流時(shí),至少部分地使用壓縮方案的所述指示對(duì)其進(jìn)行解壓縮。
32.如權(quán)利要求31所述的產(chǎn)品,還包括發(fā)送裝置,用于在獨(dú)立于所述選擇流的信道上發(fā)送產(chǎn)生所述選擇流的裝置的相關(guān)信息。
33.如權(quán)利要求32所述的產(chǎn)品,還包括用于無(wú)線地發(fā)射所述選擇流的無(wú)線發(fā)射裝置。
34.如權(quán)利要求33所述的產(chǎn)品,其中,所述無(wú)線發(fā)射裝置為CDMA發(fā)射機(jī)。
35.如權(quán)利要求33所述的產(chǎn)品,其中,所述無(wú)線發(fā)射裝置為OFDM發(fā)射機(jī)。
36.如權(quán)利要求33所述的產(chǎn)品,其中,所述無(wú)線發(fā)射裝置為數(shù)字廣播發(fā)射機(jī)。
全文摘要
用多個(gè)編碼器(A、B、...、N)對(duì)一多媒體流并行地進(jìn)行壓縮,動(dòng)態(tài)地評(píng)估所述多個(gè)編碼器的壓縮流輸出的品質(zhì)(14)。將最佳壓縮流連同所使用的特定壓縮算法的相關(guān)信息一起發(fā)射(16),以使接收機(jī)的解碼器可以將該流解壓縮以進(jìn)行呈現(xiàn)(18,20)。
文檔編號(hào)G06F13/14GK1717675SQ200380104197
公開(kāi)日2006年1月4日 申請(qǐng)日期2003年11月25日 優(yōu)先權(quán)日2002年11月26日
發(fā)明者理查德·D·萊恩 申請(qǐng)人:高通股份有限公司