專利名稱::非介入式視頻質(zhì)量測量的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及視頻質(zhì)量量度(measure),具體地說,涉及在已經(jīng)利用壓縮算法對視頻信號進行編碼的情形下的視頻質(zhì)量量度。
背景技術(shù):
:當將視頻信號從一個位置發(fā)送到另一個位置時,利用編碼算法對信號進行編碼或壓縮是已知的,從而能夠利用比沒有編碼時所需要的帶寬更窄的帶寬來發(fā)送編碼后的信號。當接收到時,編碼信號被解碼從而提取出原始信號。在許多編碼技術(shù)中進行二維余弦變換,得到一系列其幅度被量化的變換系數(shù)。從而可以有效地分配帶寬,并且允許量化粒度即步長變化。對視頻序列進行編碼和解碼的處理會引起失真或者以別的方式降低信號質(zhì)量。測量失真程度的一種方法涉及到將觀者對失真視頻序列中可感知的失真程度的意見記錄下來,并且對結(jié)果進行平均,從而獲得平均意見分值(MOS,MeanOpinionScore)。然而,這會是一個耗時的處理。結(jié)果,需要預(yù)測觀者在視頻序列中所感知到的質(zhì)量損失。雖然能夠通過參考原始序列而獲得作為編碼/解碼及傳送過程的結(jié)果的視頻質(zhì)量的惡化,但此方法通常不方便。
發(fā)明內(nèi)容根據(jù)本發(fā)明的一方面,提供一種針對表示多個幀的視頻信號生成質(zhì)量量度的方法,所述視頻信號具有原始形式;編碼形式,在該編碼形式中己經(jīng)利用壓縮算法對所述視頻信號進行了編碼,該壓縮算法利用了可變量化器(quantiser)步長,從而使編碼后的信號具有與其相關(guān)的量化器步長參數(shù);及解碼形式,在此解碼形式中已經(jīng)至少部分地將所述編碼視頻信號重新轉(zhuǎn)換為所述原始形式,該方法包括步驟a)產(chǎn)生第一質(zhì)量量度,該第一質(zhì)量量度為所述量化器步長參數(shù)的函數(shù);b)產(chǎn)生第二質(zhì)量量度,該第二質(zhì)量量度為由所述解碼形式的視頻信號表示的至少一部分幀的空間復(fù)雜度的函數(shù);及c)將所述第一量度與所述第二量度組合起來。因為可以從所述編碼視頻序列中可導(dǎo)出所述步長,并且由于復(fù)雜度量度是從所述解碼信號中獲取的,因此減小了對原始信號參考的需求。另外,由于在許多編碼方案中,步長作為參數(shù)而與視頻序列一起發(fā)送,可以方便地利用該參數(shù)來預(yù)測視頻質(zhì)量而不必重新計算該參數(shù)。重要的是已經(jīng)發(fā)現(xiàn)相對于根據(jù)步長可靠性或單獨根據(jù)作為視頻質(zhì)量指示器的復(fù)雜度所能簡單地期望到的可靠性相比,使用復(fù)雜度量度與步長相結(jié)合更加改善了質(zhì)量量度的可靠性。根據(jù)本發(fā)明的另一方面,提供一種針對表示多個幀的視頻信號生成質(zhì)量量度的設(shè)備,所述視頻信號具有原始形式;編碼形式,在該編碼形式中已經(jīng)利用壓縮算法對所述視頻信號進行了編碼,該壓縮算法利用了可變量化器步長,從而使所述編碼信號具有與其相關(guān)的量化器步長參數(shù);及解碼形式,在此解碼形式中已經(jīng)至少部分地將編碼后的視頻信號重新轉(zhuǎn)換為所述原始形式,該設(shè)備包括a)產(chǎn)生第一質(zhì)量量度的裝置,該第一質(zhì)量量度為量化器步長參數(shù)的函數(shù);b)產(chǎn)生第二質(zhì)量量度的裝置,該第二質(zhì)量量度為由所述解碼形式的視頻信號表示的至少一部分幀的空間復(fù)雜度的函數(shù);及c)將所述第一量度與所述第二量度組合起來的裝置,用于產(chǎn)生視頻信號的質(zhì)量量度?,F(xiàn)在通過僅參考附圖的示例來進一步描述本發(fā)明,其中圖1為從功能性上示出用于估計視頻序列質(zhì)量的設(shè)備的框圖2示出如何針對圖像中的像素計算水平對比度量度;圖3示出如何針對圖2的圖像中的像素計算垂直對比度量度;圖4示出訓練序列的AvPSNR與測量MOS的關(guān)系圖5示出訓練序列的AvQP與測量MOS的關(guān)系圖;圖6示出訓練序列的CS與測量MOS的關(guān)系圖7示出AvQP/CS模型的測量MOS與估計MOS的關(guān)系圖。具體實施例方式以下實施方式涉及到無參考的、基于解碼器的視頻質(zhì)量評估工具。用于該工具的算法可在視頻解碼器內(nèi)部運行,其利用針對每個解碼宏塊的量化器步長參數(shù)(通常為包含于輸入編碼視頻流中的變量)和來自每個解碼圖像的像素強度值(pixelintensityvalue)來對解碼視頻的主觀質(zhì)量進行估計。對每個幀的解碼像素執(zhí)行滑動窗口平均像素強度差值(像素對比度量度)計算,并且將作為結(jié)果的平均(TCF)用作視頻的噪聲掩蔽(mask)特性的量度。然后根據(jù)TFC參數(shù)和平均步長參數(shù)的加權(quán)函數(shù)來作出質(zhì)量估計。通過對特征解碼序列的訓練數(shù)據(jù)庫及先前獲取的針對該序列的主觀分值進行多次回歸分析而預(yù)先確定加權(quán)函數(shù)。用來估計復(fù)雜度的、對一方面是步長另一方面是滑動窗口平均像素強度差值量度的組合的使用提供了良好的主觀質(zhì)量估計。所使用的測量處理原則上通??蓱?yīng)用于這樣的視頻信號,該視頻信號利用了使用變換編碼且具有可變量化器步長的壓縮技術(shù)來進行編碼。然而,待描述的方案設(shè)計成用于根據(jù)H.264標準編碼的信號(雖然待描述的方案基于H.264視頻編解碼,它也應(yīng)用其他基于DCT的標準的編解碼,比如H.261、H.263、(基于幀的)MPEG-2等)。本測量方法屬于非介入式或"無參考式",即它不需要使用原始信號的拷貝。該方法設(shè)計為在適當?shù)慕獯a器內(nèi)使用,因為它同時需要從編碼的比特流和解碼的視頻圖片(picture)中獲取參數(shù)。在圖1所示的設(shè)備中,在輸入端1處接收到輸入信號,并且輸入信號傳到視頻解碼器,該視頻解碼器進行解碼并針對每個圖像輸出下列參數(shù)解碼圖像(D)水平解碼圖片像素大小(Px)垂直解碼圖片像素大小(PY)水平解碼圖片宏塊大小(Mx)垂直解碼圖片宏塊大小(my)量化器步長參數(shù)集合(Q)。該設(shè)備中具有兩個分析路徑,用于計算圖片平均量化器步長信號QPF(單元3)及圖片平均對比度量度CF(單元4)。然后單元5對信號QPF和CF進行時間平均,從而分別得出信號TQPF和TCF。最后,這些信號在單元6內(nèi)組合起來,從而得出對解碼視頻序列D的主觀質(zhì)量的估計PMOS。元件3-6可由單獨的硬件元件實現(xiàn),但更方便的實現(xiàn)方式是利用適當?shù)木幊烫幚砥鲌?zhí)行所有這些階段。圖像平均值Q這使用了從解碼器輸出的量化器步長信號Q。Q包含了當前解碼圖片中的每個宏塊的一個量化器步長參數(shù)值QP。對于H.264,量化器步長參數(shù)值QP定義了用于對變換系數(shù)進行編碼的線性量化器的間隔QSTEP。事實上,QP為預(yù)定義間隔表編索引,其中,QP中每增加6時QSTEP大小加倍。根據(jù)下式而在單元3中計算出圖片平均量化器參數(shù)QPF:<formula>formulaseeoriginaldocumentpage8</formula>其中Mx和MY分別是圖片中水平和垂直宏塊的數(shù)量,而Q(i,j)則是在位置(i,j)的宏塊的量化器步長參數(shù)。計算對比度量度圖2示出如何在水平方向Px像素及垂直方向Py像素大小的圏片內(nèi)的位置(x,y)處計算像素P(x,y)的對比度量度。圖2示出對水平對比度量度進行計算的分析。這里,相對于由陰影區(qū)域示出的像素P(x,y)計算對比度量度。選出大小相當?shù)南噜弲^(qū)域(其中一個區(qū)域包含陰影像素)。每個區(qū)域由來自陰影像素所在的行的一組(優(yōu)選地為連續(xù)的)像素形成。對每個區(qū)域內(nèi)的像素強度進行平均,然后根據(jù)下面的式(2)計算出平均值的絕對差,對比度量度即為該差值。如圖3所示,以類似的方式計算出垂直對比度量度。這里,選擇上組像素和下組像素。每個選出的像素位于同一列上,并且陰影像素相鄰于上組與下組之間的邊界。對上組和下組中的像素強度進行平均,然后評估每組的平均強度的差,如下面的式(3)所示,該差的絕對值即為垂直對比度量度,即垂直方向上的對比度的量度。在本例子中,陰影像素包含在下組中。然而,對比度量度相關(guān)聯(lián)的像素的位置是任意的,只要其位于由正在被比較的像素組所共享的邊界附近即可。因此,為了獲得水平對比度量度,比較長度為H的行部,而為了獲得垂直對比度量度,比較長度為V的列部(columnportion)(長度H和V可以相同但不是必需相同)。對比度量度與位置對于在一方面是行部而另一方面是列部的公共邊界為本地的像素相關(guān)。然后對如此計算出的水平對比度量度及垂直對比度量度進行比較,并且將這兩個值(即在式(4)中設(shè)定的水平-垂直量度)中最大的一個與陰影像素相關(guān)聯(lián),并存儲在存儲器中。對于圖片(在分別離圖片的垂直邊緣和水平邊緣的垂直距離V和水平距離H內(nèi))中的每個像素重復(fù)該過程,由此提供了對像素進行的滑動窗口分析,窗口大小為H或V。然后對圖片(幀)中的每個像素的水平-垂直量度進行平均,從而得出綜合像素差量度CF(見式(5))。然后在多個圖片上對該與每個像素關(guān)聯(lián)的綜合量度進行平均,從而獲得序列平均量度,即根據(jù)式(7)的時間平均量度TCF。對綜合量度(CF)進行平均的圖片的數(shù)量將依賴于視頻序列的屬性及情景變化之間的時間,并且可以長達數(shù)秒鐘。顯然,僅僅需要對圖片的一部分以這種方式進行分析,尤其是當量化步長在整個圖像上變化。通過測量圖片中不同位置處的對比度并且取平均,就能獲得對圖片復(fù)雜度的簡單量度。由于圖片中的復(fù)雜度能夠掩蔽失真,并且由此使得觀察者相信對于給定的失真,圖片具有較好的質(zhì)量,圖片中的復(fù)雜程度能夠在一定程度上用來預(yù)測觀者將與視頻信號關(guān)聯(lián)起來的主觀質(zhì)量水平。圍繞陰影像素的各區(qū)域的寬度(H)或高度(V)與觀賞者將會注意到復(fù)雜度的細節(jié)層次(detaillevel)有關(guān)。因此,如果從遠處觀察圖像,則將H和V選擇為比想象到的觀者更靠近圖片的情形更大。因為一般地說,觀者會感覺到舒適的圖片距離依賴于圖片大小,H和V的大小也會依賴于像素大小和像素維數(shù)(更大的顯示器典型地具有更大的像素而不是具有更多的像素,盡管對于給定的像素密度,顯示器尺寸也可能是一個因素)。典型地,可以預(yù)料到H和V中的每一個都在對應(yīng)圖片長寬尺寸的0.5c/。到2%之間。例如,水平值可以為4*100/720=0.56%,其中水平方向存在720個像素,并且每組平均包含4個像素,而在垂直方向的值可以為4*100/576=0.69%,其中垂直方向存在576個像素??梢詤⒖枷率蕉鴮τ嬎銓Ρ榷攘慷鹊姆治雒枋鋈缦略撚嬎憷媒獯a視頻圖片D,并確定每個圖片的圖片平均復(fù)雜度量度CF。通過首先對解碼視頻圖片執(zhí)行滑動窗口像素分析來確定CF。在示出對大小在水平方向上為Px而垂直方向上為Py的圈片內(nèi)的像素p(x,y)進行水平分析的圖2中,根據(jù)下式計算出解碼序列D的第n圖片的水平對比度量度Ch:<formula>formulaseeoriginaldocumentpage10</formula>H是水平像素分析的窗口長度。Ch(n,x,y)是解碼視頻序列D的第n圖片的像素p(x,y)的水平對比度參數(shù)。D(n,x,y)是解碼視頻序列D的第n圖片的像素p(x,y)的強度。在示出對應(yīng)垂直像素分析的圖3中,根據(jù)下式計算出垂直對比度量度Cv:<formula>formulaseeoriginaldocumentpage10</formula>(3)這里,V是垂直像素分析的窗口長度。然后可以將CA和Cv組合起來,從而得出水平-垂直量度c&,其中<formula>formulaseeoriginaldocumentpage10</formula>這里應(yīng)當注意對于某些應(yīng)用,將水平分量與垂直分量分開從而能夠在對主觀質(zhì)量(單元6)的估計中將不同的加權(quán)參數(shù)應(yīng)用于水平分量與垂直分量中的每一個。最后,根據(jù)下式根據(jù)對比度值Ch、Cv及/或Chv計算出綜合圖片平均像素差量度CF:<formula>formulaseeoriginaldocumentpage11</formula>時間平均這利用圖片平均參數(shù)QPF和CF,并根據(jù)下式確定對應(yīng)的時間平均參數(shù)TQPF禾口TCF:<formula>formulaseeoriginaldocumentpage11</formula>)<formula>formulaseeoriginaldocumentpage11</formula>應(yīng)當在需要MOS估計的時間間隔上執(zhí)行參數(shù)的平均化。這可以是產(chǎn)生單對TQPF和TCF參數(shù)的單個分析階段,或者可以是產(chǎn)生一系列參數(shù)的一系列間隔??梢酝ㄟ^CF和QPF時間序列在時間上"滑動"分析窗口(典型地具有一秒鐘長度量級的窗口間隔)而實現(xiàn)連續(xù)分析。估計MOS這利用時間平均參數(shù)TQPF和TCF,從而對解碼序列D的對應(yīng)時間間隔的主觀測量平均意見分值進行PMOS估計。TQPF有助于估計解碼序列中存在的噪聲,而TCF有助于估計噪聲可能由視頻序列的內(nèi)容所屏蔽的程度。根據(jù)下式由參數(shù)的組合來計算出PMOS:<formula>formulaseeoriginaldocumentpage11</formula>(8)Ft和F2為AvQp和CS中的適當線性函數(shù)或非線性函數(shù)。Kc為常數(shù)。PMOS為預(yù)測平均意見分值,且在1-5的范圍內(nèi),其中5即是質(zhì)量極好,而l即為質(zhì)量低劣。F卜F2和Ko可以通過許多商業(yè)統(tǒng)計軟件包中可用的適當回歸分析(比如線性、多項式或?qū)?shù))來確定。這種分析需要具有已知主觀質(zhì)量的一組訓練序列。然后以MOS為因變量而TQPF和TCF為自變量通過回歸分析可以導(dǎo)出由F,、F2和Ko定義的模型。作為結(jié)果的模型典型地用來預(yù)測與訓練中使用的序列類似地已經(jīng)經(jīng)受惡化(編解碼類型和壓縮率)的測試序列的質(zhì)量。然而,視頻內(nèi)容可能不同。對于全分辨率廣播材料的H.264壓縮,發(fā)現(xiàn)適當?shù)木€性模型為尸M)S=-0.135*775^+0.04*CS+7,442(9>然后將根據(jù)下式對作為結(jié)果的估計進行限定以下對上述實施方式的多個方面進行了另外討論。##系已經(jīng)顯示出在分析時同時利用源視頻序列和惡化視頻序列的全參考視頻質(zhì)量測量工具能夠?qū)V播視頻的視頻質(zhì)量進行高度精確的預(yù)測。未獲取預(yù)削弱"參考"序列的無參考(no-reference)設(shè)計技術(shù)是一項更為艱難的提議。無參考分析的另一種形式可以通過獲取位于網(wǎng)絡(luò)中的解碼器內(nèi)或其它位置的編碼比特流而實現(xiàn)。這種"比特流"分析的好處在于容易獲得幀緩沖器分析無法獲得的編碼參數(shù),比如量化器步長、運動向量和塊統(tǒng)計。比特流分析的范圍從不具有逆變或運動預(yù)測宏塊重構(gòu)的解碼參數(shù)的計算性輕分析(lightanalysis)到視頻序列的全解碼。PSNR是一種在視頻編碼器和全參考視頻質(zhì)量測量工具中進行主觀視頻質(zhì)量估計時使用的量度。在無參考工具中,不能直接計算出PSNR,但可以對其進行估計。這里給出一種無參考視頻質(zhì)量預(yù)測技術(shù),該技術(shù)在比全參考PSNR量度更加優(yōu)越的H.264/AVC解碼器內(nèi)運行。首先,利用PSNR量度對多個H.264編碼序列對基準質(zhì)量估計給出結(jié)果。其次,考慮到比特流技術(shù),該比特流技術(shù)使用平均量化器步長(AvQP)的量度來估計主觀質(zhì)量。已經(jīng)顯示這種比特流無參考量度不是僅僅作為PSNR的逼近值,而是可以更加優(yōu)于用于質(zhì)量估計的全參考PSNR量度。最后引入噪音掩蔽(CS)量度,其進一步增強了基于PSNR和量化器步長的質(zhì)量估計技術(shù)的性能。該量度基于解碼圖像序列的像素差分析,并在視頻解碼器內(nèi)計算出。已經(jīng)顯示基于作為結(jié)果的解碼器的無參考模型實現(xiàn)了測量主觀分值與估計主觀分值之間的0.91以上的相關(guān)度。視頻測試材料-訓練和測試數(shù)據(jù)庫用來訓練和測試技術(shù)的視頻數(shù)據(jù)庫由均為625廣播格式的18個不同的8-秒序列。訓練組由9個序列組成,并且序列中的6個來自VQEG1數(shù)據(jù)庫,而剩余的3個則來自其它地方。測試組包含9個序列。VQEG1內(nèi)容已為人知并且可以從VQEG網(wǎng)站下載。由于質(zhì)量參數(shù)是基于在每個序列持續(xù)時間上的平均,選擇具有一致的運動和細節(jié)屬性的內(nèi)容是重要的。序列的細節(jié)如表l所示。表1訓練和測試序列<table>tableseeoriginaldocumentpage13</column></row><table>視頻測試材料-編碼利用對每個訓練和測試序列設(shè)定相同的編碼器選項的H.264編碼器JM7.5c對所有的訓練和測試序列進行編碼。編碼器設(shè)定的鍵值為I、P、B、P、B、P、...幀模式;速度控制禁用;量化參數(shù)(QP)固定;適應(yīng)性幀/字節(jié)編碼啟用;循環(huán)濾波禁用。利用許多不同的可能的編碼器設(shè)定,決定保持上述設(shè)定恒定,而僅僅在每個源文件的測試之間改變量化器步長參數(shù)。針對訓練組和測試組利用12個被試者來執(zhí)行正式的單個刺激主觀測試。平均MOS結(jié)果如表2(訓練組)和表3(測試組)所示。表2訓練序列的主觀分值<table>tableseeoriginaldocumentpage13</column></row><table>表3測試序列的主觀分值<table>tableseeoriginaldocumentpage14</column></row><table>^^量仿:A麟澄信凝^:峰值信噪比(PSNR)是一種經(jīng)常使用的全參考質(zhì)量量度,并且是一種對許多視頻編碼器優(yōu)化的關(guān)鍵量度。利用正確對準的參考和惡化的序列,PSNR是一種用于計算的直接量度,并且可以根據(jù)下式計算出時間平均量度(AvPSNR):^v/\SW=(I/A0§(101ogl0(25522(J(",A力-rf(",x,力)2))其中s(n,x,y)和d(n,x,y)為來自源s和尺寸為X個(f0...X-l)水平像素和Y個(y二O...Y-l)垂直像素惡化序列d的N個幀中的第n幀內(nèi)的對應(yīng)像素強度值(0...255)。該式用來計算9個訓練序列中的每一個的8秒鐘內(nèi)的平均PSNR。平均PSNR相對于平均測量MOS的圖表如圖4所示。當考慮25dB的平均PSNR處的MOS分值時,解釋了數(shù)據(jù)的內(nèi)容依賴特性。數(shù)據(jù)中的3個MOS-點范圍顯示了使用PSNR來估計感知質(zhì)量的潛在不精確性。多項式回歸分析產(chǎn)生了MOS與AvPSNR數(shù)據(jù)之間的0.78的相關(guān)度及0.715的RMS余差(residual)。廣量仿,蘆眾器,長對于H.264,量化器參數(shù)QP定義了用于對變換系數(shù)進行編碼的線性量化器的間隔QSTEP。QP為預(yù)定間隔表編索引,在表中,QP每增加6時QSTEP的大小加倍。對于訓練組中的每次測試,對于P和I宏塊,QP固定為20、28、32、36、40或44中的一個值,而對于B宏塊QP則大2。圖5展示了平均QP相對于9個訓練序列中的每一個的平均MOS的圖表。MOS與平均QP之間的多項式回歸分析產(chǎn)生了0.924的相關(guān)度及0.424的RMS余差。同時顯然在多個QP值處的期望MOS范圍遠小于AvPSNR的MOS。根據(jù)量化器步長對PSNR進行的一次估計依賴于量化范圍內(nèi)的誤差值均勻分布的近似。然而,當大多數(shù)系數(shù)"中心裁剪(centre-dipped)"到0時,該近似并不適用于大步長的低比特率的情況。有些令人吃驚的是,結(jié)果示出與PSNR相比,AvQP可能是更好的主觀分值預(yù)測器。這里應(yīng)當注意QP與H.264內(nèi)的實際量化器步長之間的非線性映射可能一定程度上使多項式分析變得容易的可能性己經(jīng)減小,結(jié)果與針對實際步長對MOS達到的結(jié)果類似。#^^^T^r_#^r-i^^"^:^r:失真掩蔽是影響編碼視頻序列中的失真感知度的重要因素。由于人類的感知機制無法在相同的頻譜、時間或空間位置內(nèi)區(qū)別信號分量與噪音分量,因此發(fā)生了這種屏蔽。在設(shè)計視頻編碼器時這種考慮至關(guān)重要,其中比特位的有效分配是基本的。該領(lǐng)域內(nèi)的研究已經(jīng)同時在變換域和像素域內(nèi)展開。這里,僅僅考慮像素域。像z素對^^^^^^^-像z素差澄對^^^^fi^:這里,將通過像素域內(nèi)的分析而確定圖像序列的掩蔽屬性的構(gòu)思應(yīng)用于視頻質(zhì)量估計。實驗揭示通過滑動窗口像素差分析計算的對比度量度表現(xiàn)特別良好。根據(jù)上式(2)和(3)計算出像素差值對比度量度Ch和Cv,其中H是用于水平像素分析的窗口長度,而V是用于垂直像素分析的窗口長度。然后可以根據(jù)式(4)將Q和Cv組合起來得出水平-垂直量度Chv。然后根據(jù)式(5)可將Chv用來計算幀的綜合像素差量度CF,然后又計算出上式(6)中定義的序列平均量度CS。利用H=4及V=2計算出每個解碼訓練序列的序列平均量度CS(以上稱為TCF),并且相對于平均量化器步長而繪制出的結(jié)果如圖6所示。對于圖4中的PSNR對MOS結(jié)果,圖6中的結(jié)果顯示出調(diào)度顯著的相似性,對于圖5中的AvQstep對MOS結(jié)果則相似程度要差一些。"曰歷"和"巖石"序列具有最高CS值,并且在PSNR和AvQstep的很大范圍上具有最高MOS值。類似地,"獨木舟"和"油炸食物"序列具有最低CS值和最低MOS數(shù)值。因此,根據(jù)解碼像素計算出的CS量度看起來與序列的噪音掩蔽屬性有關(guān)。對于給定的PSNR,較高的CS意味著較高的掩蔽性以及更高的MOS。無參考質(zhì)量估計中的CS量度的潛在使用通過將其包含在下述多個回歸分析中而得到測試。結(jié)果首先,通過PSNR(自變量)利用在許多商業(yè)統(tǒng)計軟件包中可用的標準多項式/對數(shù)回歸分析而對訓練組的平均MOS(因變量)進行建銜14]。然后將作為結(jié)果的模型用于該測試序列。然后通過將AvQP用作自變量而重復(fù)該過程。該過程在每種情況中被重復(fù),并且以CS作為附加自變量,并且作為結(jié)果的估計MOS與測量MOS之間的相關(guān)度及RMS余差如表4所示。表4估^卜MOS與測量MOS之間的相關(guān)度及RMS余差。<table>tableseeoriginaldocumentpage16</column></row><table>結(jié)果顯示將序列平均對比度量度(CS)包含在基于PSNR或AvQP的MOS估計模型中增加了訓練數(shù)據(jù)組和測量數(shù)據(jù)組的性能。利用了AvQP及CS參數(shù)的模型性能特別良好,從而既針對訓練序列實現(xiàn)了超過0.9的相關(guān)度(0.95),也對測試序列實現(xiàn)了超過0.9的相關(guān)度(0.916)。對于AvQP/CS模型的單獨訓練和測試結(jié)果以分散繪圖(scatterplot)的形式示于圖7中。祭論己經(jīng)給出了一種用于在H.264視頻解碼器中估計主觀視頻質(zhì)量的雙參數(shù)模型。對應(yīng)于在視頻序列上平均化的H.264量化器步長指數(shù)的AvQP參數(shù)有助于對噪音的估計。利用對解碼像素進行滑動窗口差值分析而計算出的CS參數(shù)增加了對視頻內(nèi)容噪聲掩蔽屬性的指示。已經(jīng)顯示出一起使用這些參數(shù)時,可在解碼器中獲得驚人地精確的主觀質(zhì)量估計。將8秒鐘的訓練和測試序列選出,以便減小圖像屬性在時間上的顯著變化。目的是使用具有一致惡化屬性的解碼序列,從而使測量MOS分值不會不適當?shù)赝ㄟ^短暫和明顯失真而進行加權(quán)。通過這種方式,具有序列平均參數(shù)的MOS分值建模變?yōu)楦屿`敏和精確的處理。在式(5)中定義的對比度量度CF取決于在整個修剪圖像的每個像素上正在執(zhí)行的平均化。應(yīng)當認識到在空間-時間塊上對CF進行分析可能是有利的。權(quán)利要求1、一種針對表示多個幀的視頻信號生成質(zhì)量量度的方法,所述視頻信號具有原始形式;編碼形式,在所述編碼形式中已經(jīng)利用壓縮算法對所述視頻信號進行了編碼,所述壓縮算法利用了可變量化器步長,從而使所述編碼信號具有與其相關(guān)的量化器步長參數(shù);及解碼形式,在此解碼形式中已經(jīng)至少部分地將所述編碼視頻信號重新轉(zhuǎn)換為所述原始形式,所述方法包括步驟a)產(chǎn)生第一質(zhì)量量度,所述第一質(zhì)量量度為所述量化器步長參數(shù)的函數(shù);b)產(chǎn)生第二質(zhì)量量度,所述第二質(zhì)量量度為由所述解碼形式的視頻信號表示的至少一部分幀的空間復(fù)雜度的函數(shù);以及c)將所述第一量度與第二量度組合起來。2、根據(jù)權(quán)利要求1所述的方法,其中,通過在幀內(nèi)的多個位置確定局部對比度量度來測量所述空間復(fù)雜度。3、根據(jù)權(quán)利要求2所述的方法,其中,通過對幀的相鄰區(qū)域的強度執(zhí)行比較功能而獲得各個局部對比度量度。4、根據(jù)權(quán)利要求3所述的方法,其中,每個幀包括多個像素,且對于給定幀的至少一部分像素,對像素附近的相鄰區(qū)域執(zhí)行所述對比功能,從而獲得相關(guān)于該像素的比較值。5、根據(jù)以上權(quán)利要求中任何一項所述的方法,其中,所述相鄰區(qū)域是細長形的。6、根據(jù)權(quán)利要求5所述的方法,其中,每個幀包括以柵格形式排列的多個像素,所述柵格具有多個行和多個列,并且每個細長區(qū)域由沿著行部或列部而排列的多個像素形成。7、根據(jù)以上權(quán)利要求中任何一項所述的方法,其中,對沿第一方向延伸的相鄰區(qū)域?qū)M行比較。8、根據(jù)權(quán)利要求7所述的方法,其中,對沿第二方向延伸的相鄰區(qū)域?qū)M行比較。9、根據(jù)權(quán)利要求8所述的方法,其中,所述第一方向和所述第二方向互相垂直。10、根據(jù)權(quán)利要求3到9中任何一項所述的方法,其中,所述比較功能包括對相鄰區(qū)域?qū)Φ膹姸炔钸M行評估。11、根據(jù)權(quán)利要求3到10中任何一項所述的方法,其中,對于像素附近的相鄰區(qū)域,所述比較功能包括對沿第一方向延伸的第一相鄰區(qū)域?qū)Φ膹姸炔钸M行評估,并且對沿第二方向延伸的相鄰區(qū)域?qū)Φ膹姸炔钸M行評估。12、根據(jù)權(quán)利要求ll所述的方法,其中,所述比較功能還包括選擇所述第一方向和所述第二方向上的差中較大的一個。13、根據(jù)以上權(quán)利要求中任何一項所述的方法,其中,每個所述幀包括多個像素,并且對于給定幀內(nèi)的至少一部分像素,根據(jù)在第一方向上在給定像素處的強度梯度和在第二方向上在所述像素處的強度梯度的量度而確定所述空間復(fù)雜度,所述第一方向和第二方向優(yōu)選地互相垂直。14、根據(jù)權(quán)利要求13所述的方法,其中,對于給定像素,利用在所述第一方向上和所述第二方向上在該像素處的所述梯度中較大的一個而計算出所述空間復(fù)雜度。15、根據(jù)權(quán)利要求13或14所述的方法,其中,所述強度梯度的量度與幀的相鄰區(qū)域的強度差線性相關(guān)。16、根據(jù)以上權(quán)利要求中任何一項所述的方法,其中,相鄰區(qū)域的強度根據(jù)該區(qū)域內(nèi)像素的平均強度而獲得。17、根據(jù)權(quán)利要求2到16中任一項所述的方法,其中,利用在幀內(nèi)不同位置獲取的局部對比度量度的平均而計算出幀的空間復(fù)雜度。18、根據(jù)權(quán)利要求2到16中任一項所述的方法,其中,對多個幀的所述空間復(fù)雜度求平均。19、根據(jù)以上權(quán)利要求中任何一項所述的方法,其中,通過對幀內(nèi)的相鄰區(qū)域執(zhí)行比較功能而獲得所述空間復(fù)雜度,所述相鄰區(qū)域是細長的,使得每個相鄰區(qū)域具有長軸和短軸,并且每個細長區(qū)域的長軸為所述幀在所述長軸方向上的尺寸的0.5%到2%。20、根據(jù)權(quán)利要求19所述的方法,其中,每個細長區(qū)域的所述短軸對應(yīng)于單個像素的寬度。21、一種針對表示多個幀的視頻信號生成質(zhì)量量度的設(shè)備,所述視頻信號具有原始形式;編碼形式,在所述編碼形式中已經(jīng)利用壓縮算法對所述視頻信號進行了編碼,所述壓縮算法利用了可變量化器步長,從而使所述編碼信號具有與其相關(guān)的量化器步長參數(shù);及解碼形式,在此解碼形式中己經(jīng)至少部分地將所述編碼視頻信號重新轉(zhuǎn)換為所述原始形式,所述設(shè)備包括a)產(chǎn)生第一質(zhì)量量度的裝置,所述第一質(zhì)量量度為所述量化器步長參數(shù)的函數(shù);b)產(chǎn)生第二質(zhì)量量度的裝置,所述第二質(zhì)量量度為由解碼形式的視頻信號表示的至少一部分幀的空間復(fù)雜度的函數(shù);以及c)將所述第一量度與第二量度組合起來、產(chǎn)生所述視頻信號的質(zhì)量量度的裝置。全文摘要本申請涉及一種非介入式視頻質(zhì)量測量方法,具體地說,其中視頻信號具有原始形式;編碼形式,在該形式中已經(jīng)利用壓縮算法對該視頻信號進行了編碼,該壓縮算法利用了可變量化器步長,從而使所述編碼信號具有與其相關(guān)的量化器步長參數(shù);及解碼形式,在此形式中已經(jīng)至少部分地將所述編碼視頻信號重新轉(zhuǎn)換為所述原始形式,該方法包括a)產(chǎn)生第一質(zhì)量量度,該第一質(zhì)量量度為所述量化器步長參數(shù)的函數(shù);b)產(chǎn)生第二質(zhì)量量度,該第二質(zhì)量量度為由所述解碼形式的該視頻信號表示的至少一部分幀的空間復(fù)雜度的函數(shù);及c)將所述第一量度與第二量度組合起來,以獲得對解碼視頻的主觀視頻質(zhì)量的估計。文檔編號H04N7/26GK101356827SQ200680050424公開日2009年1月28日申請日期2006年11月7日優(yōu)先權(quán)日2005年12月5日發(fā)明者安德魯·戈登·戴維斯申請人:英國電訊有限公司