專利名稱:使用逆離散余弦變換調(diào)整圖像大小的方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及一種使用逆離散余弦變換(IDCT)調(diào)整圖像大小的方法,更特別但不作為限定地,涉及通過在使原始源圖像和宏塊的編碼類型相同之后執(zhí)行IDCT操作而將原始圖像放大為任意分辨率的方法。
背景技術(shù):
通用的放大圖像的方法是在空間頻域使用離散余弦變換(DCT)處理圖像。原始圖像被分為二維圖像塊,例如8×8象素大小的圖像塊,并且在每一圖像塊上執(zhí)行DCT操作以生成具有低和高空間頻率成分的DCT系數(shù)塊。
眾所周知,由于原始圖像中大部分能量通常集中在低空間頻率,所以DCT和量化相結(jié)合使得許多頻率成分為零,特別是高空間頻率的系數(shù)。
一種利用該特征的常用方法將為零的行和列添加至DCT系數(shù)塊中的高頻區(qū)域,以將DCT系數(shù)塊的尺寸增加至8×8的整數(shù)倍,例如16×16或24×24。對于尺寸得到增加的DCT系數(shù)塊的反DCT操作得到放大的圖像塊。
因為算法相對簡單并且不破壞放大的圖像的質(zhì)量,所以頻域方法有望使調(diào)整圖像大小更為普及。在例如1998年4月7日公開的專利號為5,737,019的美國專利、1999年7月25日公開的申請?zhí)枮?999-64158的韓國專利申請和2001年6月15日公開的申請?zhí)枮?001-49039的韓國專利申請中公開了用于在空間頻域內(nèi)調(diào)整圖像大小的方法。
盡管在參考的專利和出版物中公開的方法顯示了良好的結(jié)果,但是存在一個主要局限,即圖像不能放大至任意尺寸并且只能放大至其原始尺寸的整數(shù)倍。而且,沒有提到用于避免在圖像被放大至任意尺寸后在放大的圖像中可能的失真的恰當(dāng)方案。
同時,在2002年10月17日提交的申請?zhí)枮?002-63600的韓國專利申請中提出了一種新的調(diào)整圖像大小的方法。圖1描述了使用該方法的諸如圖像比例放大器這樣的調(diào)整圖像大小的設(shè)備的結(jié)構(gòu)。該設(shè)備包括離散余弦變換(DCT)單元10、零添加單元11、k系數(shù)倍增單元12、和逆離散余弦變換(IDCT)單元13。
DCT單元10將原始源圖像分割為大小為M×N象素的宏塊,并對于每一宏塊執(zhí)行DCT操作,以生成相應(yīng)的DCT系數(shù)塊。零添加單元11按照需要將為零的行和列添加到各DCT系數(shù)塊內(nèi)的高頻區(qū)域。
k系數(shù)倍增單元12計算添加了零的DCT系數(shù)塊的k系數(shù),并將添加了零的DCT系數(shù)塊的每一元素乘以該k系數(shù)。通過IDCT單元13對于乘以k系數(shù)的添加了零的DCT系數(shù)塊進(jìn)行IDCT操作,得到尺寸為P×Q象素的放大的圖像塊。
上述步驟使得圖像被放大至任意分辨率而沒有使得到的放大后的圖像失真。
根據(jù)源內(nèi)容,通過數(shù)字廣播而接收或復(fù)制的來自諸如DVD這樣的光盤的原始源圖像可以編碼為幀類型或域類型。例如,通過逐行掃描顯示的電影被編碼為幀類型,而通過隔行掃描顯示的攝影圖像被編碼為域類型。
宏塊是MPEG格式的基本圖像單元,宏塊的編碼方式使得可以得到高壓縮率,并且通過參考宏塊內(nèi)的視頻數(shù)據(jù)而編碼為幀類型或域類型。結(jié)果,宏塊的編碼類型往往不與原始源圖像的編碼類型一致,如圖2和3所示。
當(dāng)宏塊在諸如機頂盒這樣的數(shù)字廣播接收機或諸如DVD播放器這樣的光盤驅(qū)動器中得到放大時,放大的圖像變得失真,除非宏塊的編碼類型與原始源圖像的相同,下面結(jié)合附圖詳細(xì)進(jìn)行解釋。
在圖4中,幀類型的原始圖像得到放大,其中原始圖像具有與8條白色水平線交替的8條黑色水平線,并且包含具有8條黑色水平線的經(jīng)過離散余弦變換的奇域宏塊以及具有8條白色水平線的經(jīng)過離散余弦變換的偶域宏塊。對于宏塊的放大使得奇域宏塊具有16條黑色水平線并且偶域宏塊具有16條白色水平線。
如果放大的宏塊合并入幀類型畫面,則放大的圖像包含與16條白色水平線相交替的16條黑色水平線,這不是放大所希望的。結(jié)果,如果放大的畫面是通過逐行掃描機制顯示的,則得到了完全不同的圖像,其具有16條黑線而非8條黑線,這是一個問題。
在圖5中,域類型的原始圖像得到放大,其中原始圖像具有與8條白色水平線交替的8條黑色水平線,并且包含經(jīng)過離散余弦變換的幀類型宏塊,每一幀類型宏塊都具有與4條白色水平線相交替的4條黑色水平線。對于宏塊的放大使得每一宏塊都具有16條線,其中黑、灰、白和灰線以此順序重復(fù)顯示。如果這些放大的宏塊合并入域類型畫面,則放大的圖像包含具有重復(fù)的黑、灰、白和灰線的32條水平線。結(jié)果,如果放大的畫面是通過逐行掃描機制顯示的,則奇域圖像具有交替的黑色和白色線,并且偶域圖像僅具有灰線,這與原始圖像完全不同。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種用于放大圖像的方法和設(shè)備,能夠克服現(xiàn)有技術(shù)的問題和局限。
本發(fā)明的另一個目的是提供一種方法和設(shè)備,用于通過使宏塊的編碼類型與原始圖像的編碼類型相同并且使用逆離散余弦變換放大宏塊,而不導(dǎo)致失真地放大圖像。
根據(jù)本發(fā)明的實施例的使用逆離散余弦變換(IDCT)調(diào)整圖像大小的方法包括以下步驟(a)檢查原始源圖像的編碼類型和經(jīng)過離散余弦變換的宏塊的編碼類型,(b)如果檢查的兩個編碼類型不同則將宏塊的編碼類型轉(zhuǎn)換為幀類型或域類型,和(c)使用逆離散余弦變換放大經(jīng)過轉(zhuǎn)換的宏塊。
根據(jù)本發(fā)明的實施例的使用逆離散余弦變換(IDCT)調(diào)整圖像大小的設(shè)備包括檢測單元,用于檢測宏塊的編碼類型;轉(zhuǎn)換單元,用于將宏塊的編碼類型轉(zhuǎn)換為域類型或幀類型;控制單元,用于根據(jù)檢測的宏塊的編碼類型和原始源圖像的編碼類型控制轉(zhuǎn)換單元;和放大單元,用于使用逆離散余弦變換放大從轉(zhuǎn)換單元接收的宏塊。
從下面給出的具體描述可以更清楚地理解本發(fā)明的這些和其它目的。然而,應(yīng)當(dāng)理解,盡管詳細(xì)說明和特定例子說明了發(fā)明的優(yōu)選實施例,但是它們僅是作為描述性而給出的,對于本領(lǐng)域熟練技術(shù)人員可以理解,在不脫離本發(fā)明的精神和范圍的前提下可以由該詳細(xì)說明得到多種變化和改型。
附圖用于提供對于本發(fā)明的進(jìn)一步理解,
了本發(fā)明的優(yōu)選實施例,并且與說明書一起用于解釋本發(fā)明的原理。
在附圖中
圖1說明了使用IDCT的通用的調(diào)整圖像大小的設(shè)備的結(jié)構(gòu);圖2說明了通用的域類型宏塊;圖3說明了通用的幀類型宏塊;圖4說明了一個例子,其中以不正常方式放大了域類型宏塊;圖5說明了一個例子,其中以不正常方式放大了幀類型宏塊;圖6說明了數(shù)字廣播接收機的框圖,其中本發(fā)明在該數(shù)字廣播接收機中方便地實施;圖7-9說明了本發(fā)明的優(yōu)選實施例搜索的信息;圖10-11說明了幾個例子,其中域類型和幀類型宏塊根據(jù)本發(fā)明而正常地放大;和圖12說明了光盤驅(qū)動器的框圖,其中方便地實施了本發(fā)明。
具體實施例方式
為了更好地理解本發(fā)明,參考
本發(fā)明的優(yōu)選實施例。
圖6說明了數(shù)字廣播接收機的框圖,其中本發(fā)明在該數(shù)字廣播接收機中實施。數(shù)字廣播接收機包括調(diào)諧器30、去復(fù)用器31、音頻緩沖器32、視頻緩沖器33、數(shù)據(jù)緩沖器34和解碼器36,其中解碼器36包括上面參考圖1解釋的零添加單元11、k系數(shù)倍增單元12和IDCT單元13。
數(shù)字廣播接收機進(jìn)一步包含宏塊類型轉(zhuǎn)換單元35和宏塊類型檢測單元37。宏塊類型轉(zhuǎn)換單元35將由去復(fù)用器31輸出后暫時存儲在視頻緩沖器33中的源圖像的宏塊的編碼類型從幀類型轉(zhuǎn)換為域類型或從域類型轉(zhuǎn)換為幀類型。宏塊類型檢測單元37檢測宏塊的編碼類型。
而且,數(shù)字廣播接收機進(jìn)一步包括控制單元38,其使用與視頻緩沖器34中暫時存儲的視頻數(shù)據(jù)有關(guān)的信息來檢查源圖像的編碼類型,比較源圖像的編碼類型和宏塊類型檢測單元37檢測的宏塊的編碼類型,并控制宏塊類型轉(zhuǎn)換單元35的操作,以使宏塊的編碼類型與源圖像的一致。數(shù)字廣播接收機的所有部件都操作連接。
假設(shè)以傳送服務(wù)(TS)形式傳輸?shù)臄?shù)字廣播流被調(diào)諧器30接收,并由去復(fù)用器31作為分組單元流(PES)而處理并輸出。在這種情況中,控制單元38掃描progressive_frame域的畫面編碼擴(kuò)展信息,以確定接收的數(shù)字廣播的源圖像的編碼類型,如圖7所示。
例如,如果接收的TS的畫面編碼擴(kuò)展信息中的1比特progressive_frame域被設(shè)置為“1”,則確定源圖像是幀類型編碼的。如果畫面編碼擴(kuò)展信息中的1比特progressive_frame域被設(shè)置為“0”且接收的TS的順序擴(kuò)展信息的progressive_sequence域為“1”,則確定源圖像也是幀類型編碼的,如圖8所示。
即使對于幀類型的源圖像,progressive_sequence域的值也不總是被設(shè)置為“1”。于是控制單元38檢查畫面編碼擴(kuò)展信息中的picture_structure域的值。
因為在現(xiàn)實中假定隔行顯示,所以可以傳送幀類型的圖像,并且相關(guān)的信息被設(shè)置為好像圖像是域類型的。電影內(nèi)容是代表性的幀類型圖像,它需要通過2∶3的下拉處理。這種2∶3下拉的圖像有時具有如域類型而設(shè)置的相關(guān)信息。但是,通過檢查畫面編碼擴(kuò)展信息中的top_field_first和repeat_first_field域可以容易地確認(rèn)準(zhǔn)確的編碼類型。
如圖9所示,宏塊類型檢測單元37通過檢查宏塊頭中包含的dct_type域而確認(rèn)宏塊的編碼類型。例如,如果1比特的dct_type域被設(shè)置為“1”,則相應(yīng)的宏塊被作為域類型而進(jìn)行離散余弦變換。如果不是,則相應(yīng)的宏塊作為幀類型而進(jìn)行離散余弦變換。在另一例子中,宏塊類型檢測單元37可以包括在控制單元38中。
宏塊類型轉(zhuǎn)換單元35在控制單元38控制下,在轉(zhuǎn)換了宏塊的編碼類型或保持原始編碼類型不變之后,將通過視頻緩沖器33接收的宏塊輸出至解碼器36。
解碼器36使用零添加單元11、k系數(shù)倍增單元12和IDCT單元13將輸入宏塊的大小調(diào)整為任意分辨率。下面詳細(xì)說明該圖像大小調(diào)整操作。
在從去復(fù)用器31接收的數(shù)據(jù)是如圖10所示的幀類型畫面的情況下,如上面參考圖7和8解釋的,控制單元38通過檢查progressive_frame、progressive_sequence和picture_structure信息,發(fā)現(xiàn)輸入的圖像是幀類型畫面。
如圖10所示,由宏塊類型轉(zhuǎn)換單元35接收的宏塊或者是幀類型宏塊或者是域類型宏塊。如果宏塊類型檢測單元37將1比特的dct_type域證實為“1”,則控制單元38發(fā)現(xiàn)相應(yīng)的宏塊被作為幀類型而得到離散余弦變換。
如果源畫面和宏塊都是幀類型的,則宏塊類型轉(zhuǎn)換單元35不進(jìn)行轉(zhuǎn)換操作而將宏塊輸出至解碼器36,該操作由控制單元38管理。
如果宏塊類型檢測單元37將1比特的dct_type域證實為“0”,則控制單元38發(fā)現(xiàn)相應(yīng)的宏塊被作為域類型而得到離散余弦變換,這說明源圖像和相應(yīng)宏塊具有不同的編碼類型。在這種情況下,控制單元38通過令宏塊類型轉(zhuǎn)換單元35將宏塊的編碼類型轉(zhuǎn)換為幀類型,而使得宏塊的編碼類型與源圖像的一致。
結(jié)果,具有與8條白色水平線交替的8條黑色水平線的幀類型原始圖像成為由經(jīng)過離散余弦變換的宏塊構(gòu)成,每一宏塊具有與4條白色水平線交替的4條黑色水平線,如圖10所示。解碼器36將這些宏塊放大為每一個都具有16條線的宏塊,其中黑、灰、白和灰線以此順序重復(fù)顯示。
如果經(jīng)放大的宏塊合并入幀類型畫面,則經(jīng)放大的畫面包含具有重復(fù)的黑、灰、白和灰線的32條水平線。結(jié)果,如果經(jīng)放大的畫面以逐行掃描機制顯示,則得到自然放大的圖像。
另一方面,在從去復(fù)用器31接收的數(shù)據(jù)是如圖11所示的域類型畫面的情況下,如上面參考圖7和8所解釋的,控制單元38通過檢查progressive_frame、progressive_sequence和picture_structure信息而發(fā)現(xiàn)輸入的畫面是奇域還是偶域畫面。
如圖11所示,宏塊類型轉(zhuǎn)換單元35接收的宏塊或者是幀類型宏塊或者是域類型宏塊。如果宏塊類型檢測單元37將1比特的dct_type域證實為“0”,則控制單元38發(fā)現(xiàn)相應(yīng)的宏塊被作為域類型而得到離散余弦變換。
如果源畫面和宏塊都是域類型,則宏塊類型轉(zhuǎn)換單元35不進(jìn)行轉(zhuǎn)換操作而將宏塊輸出至解碼器36,該操作由控制單元38管理。
如果宏塊類型檢測單元37將1比特的dct_type域證實為“1”,則控制單元38發(fā)現(xiàn)相應(yīng)的宏塊被作為幀類型而得到離散余弦變換,這說明源圖像和相應(yīng)宏塊具有不同的編碼類型。在這種情況下,控制單元38通過令宏塊類型轉(zhuǎn)換單元35將宏塊的編碼類型轉(zhuǎn)換為域類型,而使得宏塊的編碼類型與源圖像的一致。
結(jié)果,具有與8條白色水平線交替的8條黑色水平線的幀類型原始圖像成為由經(jīng)過離散余弦變換的宏塊構(gòu)成,每一宏塊具有8條黑色水平線或者8條白色水平線,如圖11所示。解碼器36將這些宏塊放大為具有16條黑色水平線或16條白色水平線的宏塊。
如果經(jīng)放大的宏塊合并入域類型畫面,則合并的經(jīng)放大的畫面包含與16條白色水平線相交替的16條黑色水平線。結(jié)果,如果經(jīng)放大的畫面以隔行掃描機制顯示,則奇域顯示黑線,偶域顯示白線,從而呈現(xiàn)自然放大的圖像。
圖12顯示的是諸如DVD播放器這樣的光盤裝置的框圖。光盤裝置包括光拾取器51、數(shù)字信號處理單元52、分析器53、音頻緩沖器54、視頻緩沖器55、數(shù)據(jù)緩沖器56和解碼器58,解碼器58包括零添加單元11、k系數(shù)倍增單元12和IDCT單元13。
光盤裝置進(jìn)一步包括宏塊類型轉(zhuǎn)換單元57、宏塊類型檢測單元59和控制單元60。光盤裝置的所有部件都操作相連。
參考圖12,光拾取器51讀取在光盤50(或其它記錄介質(zhì))上記錄的信號,并且數(shù)字信號處理單元52處理從光拾取器51接收的信號以生成節(jié)目流(PS)。
分析其53將節(jié)目流轉(zhuǎn)換為分組包基本流(PES)并從分組包基本流中分離視頻、音頻和數(shù)據(jù)。視頻、音頻和數(shù)據(jù)被分別提供至視頻緩沖器54、音頻緩沖器55和數(shù)據(jù)緩沖器56。
控制單元60檢查progressive_frame、progressive_sequence和picture_structure信息,以如上所述確定在光盤50上保存的源圖像的編碼類型,信息是從光盤50復(fù)制的。
如上所述,宏塊類型檢測單元57通過檢查在宏塊頭中包含的dct_type域而確認(rèn)宏塊的編碼類型。
如上所述,宏塊類型轉(zhuǎn)換單元55在轉(zhuǎn)換了宏塊的編碼類型或者保持原始編碼類型不變之后,將通過視頻緩沖器53接收的宏塊輸出至解碼器58。
解碼器58使用零添加單元11、k系數(shù)倍增單元12和IDCT單元13將輸入的宏塊大小調(diào)整為任意分辨率。如上面參考圖10和11所述,宏塊類型轉(zhuǎn)換單元57令宏塊的編碼類型與原始圖像的編碼類型一致,從而生成由離散余弦變換而正常放大的圖像。
盡管參考有限的實施例公開了本發(fā)明,但是對于本領(lǐng)域熟練技術(shù)人員可以認(rèn)識到由此可以得到多種改動和變化。應(yīng)當(dāng)認(rèn)為,所附權(quán)利要求含該落在本發(fā)明的真正精神和范圍內(nèi)的所有這樣的改動和變化。
權(quán)利要求
1.一種使用逆離散余弦變換(IDCT)調(diào)整圖像大小的方法,包括以下步驟(a)檢查原始源圖像的編碼類型和經(jīng)過離散余弦變換的宏塊的編碼類型;(b)如果檢查的兩個編碼類型不同,則將所述宏塊的編碼類型轉(zhuǎn)換為幀類型或域類型;以及(c)使用逆離散余弦變換放大所述經(jīng)過轉(zhuǎn)換的宏塊。
2.如權(quán)利要求1的方法,其中在所述步驟(a)中,通過至少使用progressive_sequence信息或picture_structure信息將所述原始源圖像的編碼類型確定為域類型或幀類型。
3.如權(quán)利要求1的方法,其中在所述步驟(a)中,通過使用所述宏塊的頭中包含的DCT_type信息將所述宏塊的編碼類型確定為域類型或幀類型。
4.如權(quán)利要求1的方法,其中如果檢查的兩個編碼類型不同,則所述步驟(b)轉(zhuǎn)換所述宏塊的編碼類型,使得所述宏塊的編碼類型與所述原始源圖像的編碼類型相一致。
5.如權(quán)利要求1的方法,進(jìn)一步包含以下步驟(d)如果檢查的兩個編碼類型相同,則使用逆離散余弦變換來放大所述宏塊而不轉(zhuǎn)換所述宏塊的編碼類型。
6.如權(quán)利要求1的方法,其中所述原始源圖像是通過數(shù)字廣播接收的。
7.如權(quán)利要求1的方法,其中所述原始源圖像是從光盤復(fù)制的。
8.如權(quán)利要求1的方法,其中如果所述原始源圖像的編碼類型是幀類型,并且所述宏塊的編碼類型是域類型,則所述步驟(b)將所述宏塊的編碼類型從域類型轉(zhuǎn)換為幀類型。
9.如權(quán)利要求1的方法,其中如果所述原始源圖像的編碼類型是域類型,并且所述宏塊的編碼類型是幀類型,則所述步驟(b)將所述宏塊的編碼類型從幀類型轉(zhuǎn)換為域類型。
10.一種用于使用逆離散余弦變換(IDCT)調(diào)整圖像大小的設(shè)備,該設(shè)備包括檢測裝置,用于檢測宏塊的編碼類型;轉(zhuǎn)換裝置,用于將宏塊的編碼類型轉(zhuǎn)換為域類型或幀類型;控制裝置,用于檢測原始源圖像的編碼類型,并且根據(jù)所述宏塊的檢測的編碼類型和所述原始源圖像的檢測的編碼類型控制所述轉(zhuǎn)換裝置;和放大裝置,用于使用逆離散余弦變換來放大從所述轉(zhuǎn)換裝置接收的所述宏塊。
11.如權(quán)利要求10的設(shè)備,其中所述檢測裝置通過檢查所述宏塊的頭中包含的DCT_type信息而將所述宏塊的編碼類型確定為域類型或幀類型。
12.如權(quán)利要求10的設(shè)備,其中所述控制裝置通過至少檢查progressive_sequence信息或picture_structure信息而將所述原始源圖像的編碼類型確定為域類型或幀類型。
13.如權(quán)利要求10的設(shè)備,其中如果所述宏塊和所述原始源圖像的編碼類型不同,則所述控制裝置控制所述轉(zhuǎn)換裝置,使得所述宏塊的編碼類型被轉(zhuǎn)換為所述原始源圖像的編碼類型。
14.如權(quán)利要求10的設(shè)備,其中如果檢測的兩個編碼類型相同,則所述放大裝置使用逆離散余弦變換來放大所述宏塊而不轉(zhuǎn)換所述宏塊的編碼類型。
15.如權(quán)利要求10的設(shè)備,其中所述原始源圖像是通過數(shù)字廣播接收的。
16.如權(quán)利要求10的設(shè)備,其中所述原始源圖像是從光盤復(fù)制的。
17.如權(quán)利要求10的設(shè)備,其中如果所述原始源圖像的編碼類型是幀類型,并且所述宏塊的編碼類型是域類型,則所述轉(zhuǎn)換裝置將所述宏塊的編碼類型從域類型轉(zhuǎn)換為幀類型。
18.如權(quán)利要求10的設(shè)備,其中如果所述原始源圖像的編碼類型是域類型,并且所述宏塊的編碼類型是幀類型,則所述轉(zhuǎn)換裝置將所述宏塊的編碼類型從幀類型轉(zhuǎn)換為域類型。
19.一種用于使用逆離散余弦變換(IDCT)來調(diào)整圖像大小的設(shè)備,該設(shè)備包括(a)用于檢查原始源圖像的編碼類型以及經(jīng)過離散余弦變換的宏塊的編碼類型的裝置;(b)用于在檢查的兩個編碼類型不同時將宏塊的編碼類型轉(zhuǎn)換為域類型或幀類型的裝置;(c)用于使用逆離散余弦變換來放大所述經(jīng)轉(zhuǎn)換的宏塊的裝置。
20.如權(quán)利要求19的設(shè)備,其中如果檢查的兩個編碼類型不同,則所述(b)裝置轉(zhuǎn)換所述宏塊的編碼類型,使得所述宏塊的編碼類型與所述原始源圖像的編碼類型相一致。
全文摘要
提供了使用逆離散余弦變換(IDCT)調(diào)整圖像大小的一種方法和設(shè)備。在宏塊的編碼類型經(jīng)過轉(zhuǎn)換以使宏塊和原始源圖像具有相同編碼類型之后,使用逆離散余弦變換將原始源圖像的宏塊放大至任意尺寸。從而原始源圖像總是在諸如數(shù)字廣播接收機或HD-TV這樣的數(shù)字視頻設(shè)備中被自然地放大。
文檔編號H04N7/26GK1501688SQ20031010259
公開日2004年6月2日 申請日期2003年10月24日 優(yōu)先權(quán)日2002年10月25日
發(fā)明者姜中庸 申請人:數(shù)碼士有限公司