一種基于雙重奇異值分解的視頻圖像壓縮方法
【專利摘要】本發(fā)明公開了一種基于雙重奇異值分解的視頻圖像壓縮方法。設(shè)備包含一臺(tái)外部設(shè)備(如數(shù)碼相機(jī))及一臺(tái)測試儀器(如個(gè)人電腦)。外部設(shè)備(如數(shù)碼相機(jī))主要用于搜集我們需要壓縮的視頻圖像數(shù)據(jù),測試儀器(如個(gè)人電腦)主要用于算法的驗(yàn)證,即對外部設(shè)備(如數(shù)碼相機(jī))所采集的視頻圖像數(shù)據(jù)進(jìn)行壓縮測試,從而驗(yàn)證算法的高效性及可靠性。
【專利說明】一種基于雙重奇異值分解的視頻圖像壓縮方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)字圖像處理【技術(shù)領(lǐng)域】,具體涉及一種基于雙重奇異值分解的視頻圖像壓縮方法。
[0002]背景
[0003]視頻圖像壓縮是指以較少的比特有損或無損地表示原來的像素矩陣的技術(shù),也稱圖像編碼。視頻圖像數(shù)據(jù)之所以能被壓縮,就是因?yàn)樵家曨l圖像數(shù)據(jù)中存在著大量的冗余。而視頻圖像數(shù)據(jù)的冗余有:空間冗余,由于視頻圖像相鄰像素存在的相關(guān)性引起;時(shí)間冗余,由視頻圖像序列中不同幀之間存在相關(guān)性引起;頻譜冗余,由不同彩色平面或頻譜帶的相關(guān)性引起。
[0004]對視頻圖像進(jìn)行壓縮處理的目的就是通過去除這些數(shù)據(jù)冗余來減少表示數(shù)據(jù)所需的比特?cái)?shù)。由于圖像數(shù)據(jù)量的龐大,在存儲(chǔ)、傳輸、處理時(shí)非常困難,因此圖像數(shù)據(jù)的壓縮就顯得非常重要。
[0005]從上個(gè)世紀(jì)50年代開始,當(dāng)時(shí)的電子計(jì)算機(jī)已經(jīng)發(fā)展到一定水平,人們開始利用計(jì)算機(jī)來處理圖形和圖像信息。圖像是人類獲取和交換信息的主要來源,因此,視頻圖像壓縮作為圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方面面。隨著人類活動(dòng)范圍的不斷擴(kuò)大,視頻圖像壓縮的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。
[0006]而視頻圖像通常需要處理信息量很大,例如一幅256X256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對高分辨率彩色512X512圖像,則要求768kbit數(shù)據(jù)量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit?22.5Mbit數(shù)據(jù)量;因此對計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。而且,視頻圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個(gè)數(shù)量級;如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右。所以在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本亦高,這就對視頻圖像壓縮技術(shù)提出了更高的要求。并且,視頻圖像中各個(gè)像素是不獨(dú)立的,其相關(guān)性大;在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度;就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá)0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。
[0007]傳統(tǒng)的視頻圖像壓縮方法,都是任意給出兩個(gè)初始像素矩陣,直接進(jìn)行壓縮,而忽視了視頻圖像本身所包含的信息。因此,通常都要花費(fèi)比較長的時(shí)間才能得到我們想要的壓縮信息。
【發(fā)明內(nèi)容】
[0008]為對本發(fā)明有一全面了解,在下面提供了若干具體描述,對于熟悉本領(lǐng)域的人而言,在沒有這些描述的情況下同樣可以實(shí)現(xiàn)所提發(fā)明。另外,為了不對本發(fā)明的內(nèi)容產(chǎn)生混淆,對一些知名的算法、程序并未具體討論。
[0009]本方法最主要的貢獻(xiàn)在我們所提出的雙重奇異值分解算法,因而在此處我們需要對這個(gè)算法進(jìn)行詳細(xì)的描述。[0010]由于輸入的視頻圖像可以抽象的等同于矩陣,所以我們可以把對圖像數(shù)據(jù)的處理等同于對矩陣的處理。
[0011 ]雙重奇異值分解算法:
[0012]輸入:由人臉圖像所生成的非負(fù)矩陣n,正整數(shù)k,最大迭代數(shù)maxiter ;
[0013]輸出:非負(fù)矩陣iC",V^ Rk/ο
[0014]I)判斷輸入矩陣A是否非負(fù),如果是則繼續(xù)步驟2);否則,算法終止;
[0015]2)給定初始的 U=zeros (m,k),V=zeros (k,η);
[0016]3)對矩陣A作部分奇異值分解[W,S,H]=svds(A,k);
[0017]4)對U和V的第一列賦值:
[0018]U(:,I) =sqrt (S(I, l))*abs(W(:,I));
[0019]V (I,:) =sqrt (S (I, l))*abs(H(:,I),);
[0020]5) for i=2:k
[0021 ]ww=W (:,i) ; hh=H (:,i);
[0022]wwp=pos (ww) ;wwn=neg(ww);
[0023]hhp=pos (hh) ; hhn=neg (hh);
[0024]n_wwp=norm (wwp);
[0025]n_hhp=norm (hhp)
[0026]n_wwn=norm (wwn);
[0027]n_hhn=norm (hhn);
[0028]termp=n—wwp氺n—hhp;termn=n—wwn氺n—hhn;
[0029]if (termp>=termn)
[0030]U(:,i) =sqrt (S (i, i) ^termp) ^wwp/n_wwp;
[0031]V(i,:) =sqrt (S(i,i)*termp)*hhp’/n—hhp;
[0032]else
[0033]U(:,i) =sqrt (S (i, i) ^termn) ^wwn/n_wwn;
[0034]V (i,:) =sqrt (S(i, i) *termn) *hhn’/n—hhn;
[0035]end
[0036]end
[0037]6)將矩陣U和V中小于0的值賦值:
[0038]U (find (U〈0.0000000001)) =0;
[0039]V (find (V<0.0000000001)) =0;
[0040]7)設(shè)置:
[0041]indl=find (W==O);
[0042]ind2=find (H==O);
[0043]average=mean (A (:));
[0044]U (indl) =average;
[0045]V (ind2) =average;
[0046]8) for i=l:maxiter[0047]U=U.* (UtA)./ (UtUV+ ε ) ; V=V.* (AVt)./ (UVVt+ ε );
[0048]end
[0049]從上述算法的描述可以看出,同傳統(tǒng)的視頻圖像壓縮方法相比較;基于雙重奇異值分解算法的視頻圖像壓縮方法增加了一個(gè)初始化的過程,通過這個(gè)步驟,使初始的壓縮矩陣包含了原來圖像的信息,這樣的話,在相同迭代步驟的情況下,我們的方法可以得到比傳統(tǒng)方法更好的效果。
[0050]本發(fā)明要解決的技術(shù)問題是提供一種基于雙重奇異值分解算法的視頻圖像壓縮方法,使其能夠盡可能的保持原始圖像的信息,并快速的對視頻圖像進(jìn)行壓縮。
[0051]為了實(shí)現(xiàn)發(fā)明的目的,本發(fā)明采用的技術(shù)方案如下:
[0052]發(fā)明提供一種基于雙重奇異值分解的視頻圖像壓縮方法,包括:
[0053]采集視頻圖像數(shù)據(jù),并將視頻圖像數(shù)據(jù)信息輸入處理器;將輸入的視頻圖像數(shù)據(jù)轉(zhuǎn)換為矩陣的形式存儲(chǔ);
[0054]利用基于雙重奇異值分解算法分析和處理輸入的視頻圖像數(shù)據(jù),從而對視頻圖像數(shù)據(jù)進(jìn)行壓縮;
[0055]輸入將要測試的視頻圖像數(shù)據(jù),轉(zhuǎn)換成矩陣形式,并將其進(jìn)行壓縮處理;選擇適當(dāng)?shù)慕鈮悍椒?,對壓縮的視頻圖像進(jìn)行還原。
[0056]上述技術(shù)方案可以看出,本發(fā)明具有以下優(yōu)點(diǎn):
[0057]I)將具體的視頻圖像抽象化成矩陣處理,這樣我們就可以對數(shù)據(jù)很方便的處理;
[0058]2)將雙重奇異值分解算法應(yīng)用于視頻圖像壓縮,同傳統(tǒng)的視頻圖像壓縮算法相比較,這個(gè)算法不僅能夠盡可能的保持原始圖像的信息,并快速的對視頻圖像進(jìn)行壓縮。
[0059]3)算法簡單,穩(wěn)定性好。
[0060]上述技術(shù)方案可以看出,本發(fā)明的方法將視頻圖像抽象成矩陣,并將雙重奇異值分解算法應(yīng)用于其中,對生成的矩陣進(jìn)行分解壓縮;由于雙重奇異值分解算法是可以保留原始矩陣,即原始視頻圖像的一些信息,所以同傳統(tǒng)的方法比較,這種方法可以更加的快捷,更加的有效。所以,我們將這個(gè)算法應(yīng)用于視頻圖像壓縮當(dāng)中,可以快速的對視頻圖像進(jìn)行壓縮。
[0061]以上對本發(fā)明所提供的一種基于雙重奇異值分解的視頻圖像壓縮方法進(jìn)行了詳細(xì)介紹,本文通過對雙重奇異值分解算法進(jìn)行了詳細(xì)的描述,對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【專利附圖】
【附圖說明】
[0062]附圖是基于雙重奇異值分解的視頻圖像壓縮方法及系統(tǒng)流程圖。
【具體實(shí)施方式】
[0063]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的步驟僅僅是本發(fā)明一部分,而不是全部操作過程。基于本發(fā)明中的實(shí)施步驟,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施,都屬于本發(fā)明保護(hù)的范圍。
[0064]實(shí)施步驟:
[0065]1、外部設(shè)備采集視頻圖像數(shù)據(jù);
[0066]2、將采集的視頻圖像數(shù)據(jù)導(dǎo)入測試設(shè)備;
[0067]3、將輸入的數(shù)據(jù)全部轉(zhuǎn)換成矩陣的形式存儲(chǔ);
[0068]4、將雙重奇異值分解算法應(yīng)用于視頻圖像壓縮;
[0069]5、當(dāng)需要用到原始的視頻圖像的時(shí)候,選擇適當(dāng)?shù)慕鈮悍椒?,對壓縮的視頻圖像進(jìn)行還原。
[0070]以上對本發(fā)明所提供的一種基于雙重奇異值分解算法視頻圖像壓縮方法的步驟進(jìn)行了詳細(xì)介紹,本文通過對擴(kuò)展的雙重奇異值分解算法進(jìn)行了詳細(xì)的描述,對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施步驟的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【權(quán)利要求】
1.通過移動(dòng)設(shè)備(如數(shù)碼相機(jī))采集視頻圖像數(shù)據(jù)信息;并將采集的信息導(dǎo)入測設(shè)的設(shè)備中(如個(gè)人電腦);將獲取的視頻圖像經(jīng)過一些簡單的去噪或者過濾處理;將基于雙重奇異值分解的圖像壓縮算法應(yīng)用于視頻圖像壓縮中;在本發(fā)明中,我們還提供一個(gè)圖像還原算法,用于解壓被壓縮的視頻圖像。
2.聲明I方法中包括了一個(gè)用于采集視頻圖像的外部設(shè)備。
3.聲明I方法中所采集的數(shù)據(jù)必須導(dǎo)入到測試設(shè)備當(dāng)中,此設(shè)備可以是個(gè)人電腦;也可以是別的設(shè)備,如服務(wù)器等設(shè)備。
4.聲明I方法中所編寫的算法可以由matlab、C或者C++等編寫。
5.聲明I方法中所采集的視頻圖像在測試設(shè)備中會(huì)以矩陣的形式存儲(chǔ)。
6.在聲明I方法中,我們將基于雙重奇異值分解的視頻圖像處理方法應(yīng)用于視頻圖像壓縮當(dāng)中,其特征在于:利用擴(kuò)展的雙重奇異值分解算法分析和處理輸入的數(shù)據(jù),可以快速的對原始的視頻圖像進(jìn)行壓縮。
7.在聲明I方法中,我們將提供一種圖像還原算法,用于對壓縮的視頻圖像進(jìn)行解壓。
【文檔編號(hào)】H04N19/85GK103873879SQ201410101782
【公開日】2014年6月18日 申請日期:2014年3月18日 優(yōu)先權(quán)日:2014年3月18日
【發(fā)明者】羅笑南, 王炫盛, 楊艾琳 申請人:中山大學(xué)深圳研究院