本申請(qǐng)實(shí)施例涉及視頻編碼,尤其涉及一種圖像處理方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、視頻圖像經(jīng)過(guò)數(shù)字化之后數(shù)據(jù)量會(huì)非常大,為了減少對(duì)帶寬和存儲(chǔ)的占用,加快處理時(shí)間,在視頻傳輸之前會(huì)對(duì)視頻使用視頻編碼技術(shù)進(jìn)行壓縮編碼。其中,視頻編碼技術(shù)是通過(guò)編碼器將原始視頻信號(hào)轉(zhuǎn)換為壓縮視頻數(shù)據(jù),從而減少數(shù)據(jù)量。在視頻編碼過(guò)程中,會(huì)用到許多壓縮技術(shù),如幀內(nèi)壓縮、幀間壓縮等。其中,jpeg量化壓縮作為一種成熟且高效的壓縮技術(shù),在視頻編碼過(guò)程中有著十分廣泛的應(yīng)用。
2、在幀內(nèi)壓縮過(guò)程中,jpeg量化壓縮利用離散余弦變換(dct)將視頻中的圖像從空間域轉(zhuǎn)換到頻率域,在頻率域中,低頻部分包含了圖像的主要信息,高頻部分則包含了圖像的細(xì)節(jié)信息。通過(guò)量化,舍棄高頻部分的一些信息,從而達(dá)到壓縮的目的。然而,由于量化過(guò)程是有損的,因此這種方法在減少文件體積的同時(shí),也會(huì)導(dǎo)致一定程度的圖像質(zhì)量損失,最終導(dǎo)致視頻編碼后,相比原始視頻,會(huì)有一個(gè)明顯的畫質(zhì)損失。
3、需要說(shuō)明的是,上述內(nèi)容并不必然是現(xiàn)有技術(shù),也不用于限制本申請(qǐng)的專利保護(hù)范圍。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種圖像處理方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、計(jì)算機(jī)程序產(chǎn)品,以解決或緩解上面提出的一項(xiàng)或更多項(xiàng)技術(shù)問(wèn)題。
2、本申請(qǐng)實(shí)施例的一個(gè)方面提供了一種圖像處理方法,所述方法包括:
3、從訓(xùn)練集中取出訓(xùn)練圖像輸入至目標(biāo)模型中的預(yù)測(cè)模塊,利用所述預(yù)測(cè)模塊對(duì)所述訓(xùn)練圖像進(jìn)行預(yù)測(cè),得到預(yù)測(cè)圖像;
4、將所述預(yù)測(cè)圖像輸入至所述目標(biāo)模型中可導(dǎo)的jpeg壓縮模塊,利用所述jpeg壓縮模塊對(duì)所述預(yù)測(cè)圖像進(jìn)行壓縮,得到壓縮圖像;
5、計(jì)算所述目標(biāo)模型的損失函數(shù),所述損失函數(shù)包括所述訓(xùn)練圖像與所述預(yù)測(cè)圖像的第一損失函數(shù)、所述訓(xùn)練圖像與所述壓縮圖像的第二損失函數(shù),所述第二損失函數(shù)的權(quán)重與所述jpeg壓縮模塊采用的量化因子成反比;
6、根據(jù)所述損失函數(shù)對(duì)所述目標(biāo)模型進(jìn)行訓(xùn)練,并返回執(zhí)行所述從訓(xùn)練集中取出訓(xùn)練圖像輸入至目標(biāo)模型中的預(yù)測(cè)模塊及之后的步驟,直到所述目標(biāo)模型達(dá)到預(yù)設(shè)精度。
7、可選地,所述利用所述jpeg壓縮模塊對(duì)所述預(yù)測(cè)圖像進(jìn)行壓縮,得到壓縮圖像,包括:
8、從預(yù)設(shè)的量化因子取值范圍中隨機(jī)選擇一個(gè)量化因子;
9、以查表的方式獲取所述隨機(jī)選擇的量化因子對(duì)應(yīng)的量化表;
10、根據(jù)所述量化表對(duì)所述預(yù)測(cè)圖像進(jìn)行壓縮,得到壓縮圖像。
11、可選地,所述第一損失函數(shù)為重構(gòu)損失,所述第二損失函數(shù)為l1損失函數(shù)。
12、可選地,所述第一損失函數(shù)為重構(gòu)損失和感知損失。
13、可選地,所述預(yù)測(cè)模塊采用卷積神經(jīng)網(wǎng)絡(luò)。
14、可選地,所述方法還包括:
15、獲取目標(biāo)視頻的各個(gè)幀圖像和目標(biāo)量化因子;
16、將每一所述幀圖像分別輸入至所述訓(xùn)練好的目標(biāo)模型中,利用所述訓(xùn)練好的目標(biāo)模型根據(jù)所述目標(biāo)量化因子得到每一所述幀圖像對(duì)應(yīng)的壓縮圖像。
17、本申請(qǐng)實(shí)施例的另一個(gè)方面提供了一種圖像處理裝置,所述裝置包括:
18、預(yù)測(cè)模塊,用于從訓(xùn)練集中取出訓(xùn)練圖像輸入至目標(biāo)模型中的預(yù)測(cè)模塊,利用所述預(yù)測(cè)模塊對(duì)所述訓(xùn)練圖像進(jìn)行預(yù)測(cè),得到預(yù)測(cè)圖像;
19、壓縮模塊,用于將所述預(yù)測(cè)圖像輸入至所述目標(biāo)模型中可導(dǎo)的jpeg壓縮模塊,利用所述jpeg壓縮模塊對(duì)所述預(yù)測(cè)圖像進(jìn)行壓縮,得到壓縮圖像,所述jpeg壓縮模塊用于采用隨機(jī)大小的量化因子對(duì)所述預(yù)測(cè)圖像進(jìn)行壓縮;
20、計(jì)算模塊,用于計(jì)算所述目標(biāo)模型的損失函數(shù),所述損失函數(shù)包括所述訓(xùn)練圖像與所述預(yù)測(cè)圖像的第一損失函數(shù)、所述訓(xùn)練圖像與所述壓縮圖像的第二損失函數(shù),所述第二損失函數(shù)的權(quán)重與所述jpeg壓縮模塊采用的量化因子成反比;
21、訓(xùn)練模塊,用于根據(jù)所述損失函數(shù)對(duì)所述目標(biāo)模型進(jìn)行訓(xùn)練,并返回執(zhí)行所述從訓(xùn)練集中取出訓(xùn)練圖像輸入至目標(biāo)模型中的預(yù)測(cè)模塊及之后的步驟,直到所述目標(biāo)模型達(dá)到預(yù)設(shè)精度。
22、本申請(qǐng)實(shí)施例的另一個(gè)方面提供了一種計(jì)算機(jī)設(shè)備,包括:至少一個(gè)處理器;及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中:所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行如上所述的方法。
23、本申請(qǐng)實(shí)施例的另一個(gè)方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
24、本申請(qǐng)實(shí)施例的另一個(gè)方面提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
25、本申請(qǐng)實(shí)施例采用上述技術(shù)方案可以包括如下優(yōu)勢(shì):
26、通過(guò)從訓(xùn)練集中取出訓(xùn)練圖像輸入至目標(biāo)模型中的預(yù)測(cè)模塊,利用預(yù)測(cè)模塊得到預(yù)測(cè)圖像;將預(yù)測(cè)圖像輸入至目標(biāo)模型中可導(dǎo)的jpeg壓縮模塊,利用jpeg壓縮模塊得到壓縮圖像,計(jì)算目標(biāo)模型的損失函數(shù),損失函數(shù)包括訓(xùn)練圖像與預(yù)測(cè)圖像的第一損失函數(shù)、訓(xùn)練圖像與壓縮圖像的第二損失函數(shù),且第二損失函數(shù)的權(quán)重與jpeg壓縮模塊采用的量化因子成反比;根據(jù)損失函數(shù)對(duì)目標(biāo)模塊進(jìn)行訓(xùn)練,并返回執(zhí)行之前的步驟,直到目標(biāo)模型達(dá)到預(yù)設(shè)精度,通過(guò)在目標(biāo)模型中引入可導(dǎo)的jpeg壓縮模塊,以及采用與jpeg壓縮模塊采用的量化因子成反比的損失函數(shù)權(quán)重,可以結(jié)合預(yù)測(cè)模塊和jpeg壓縮模塊來(lái)使目標(biāo)模型獲得抵抗量化損失的能力,減少壓縮帶來(lái)的畫質(zhì)損失。
1.一種圖像處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述jpeg壓縮模塊對(duì)所述預(yù)測(cè)圖像進(jìn)行壓縮,得到壓縮圖像,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一損失函數(shù)為重構(gòu)損失,所述第二損失函數(shù)為l1損失函數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一損失函數(shù)為重構(gòu)損失和感知損失。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述預(yù)測(cè)模塊采用卷積神經(jīng)網(wǎng)絡(luò)。
6.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
7.一種圖像處理裝置,其特征在于,所述裝置包括:
8.?一種計(jì)算機(jī)設(shè)備,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法的步驟。