一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法與流程

文檔序號(hào)：11409063閱讀：1206來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法與流程

本發(fā)明涉及圖像轉(zhuǎn)化領(lǐng)域，尤其是涉及了一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法。

背景技術(shù)：

伴隨著攝影技術(shù)的出現(xiàn)、電視和電影的普及、廣告、報(bào)紙書刊、互聯(lián)網(wǎng)等眾多以圖像為主的社會(huì)媒介飛速發(fā)展，與圖像相關(guān)的技術(shù)日趨顯出其重要性。將圖像從一個(gè)域映射到另一個(gè)域(圖像到圖像轉(zhuǎn)換)具有廣泛的應(yīng)用。例如，海上環(huán)境可見度差，常常有霧霾等，通過圖像轉(zhuǎn)化提前預(yù)知環(huán)境的相關(guān)情況，將對(duì)海上交通管理、捕魚等海上作業(yè)提供便利；實(shí)現(xiàn)圖像從白天到夜晚的轉(zhuǎn)化、從晴天到雨天的轉(zhuǎn)化等，使人們提前預(yù)知環(huán)境，方便出行或?qū)嵤┢渌ぷ鳎粚D像轉(zhuǎn)化成相應(yīng)的彩色圖像，以便更好地顯示和觀察。然而，現(xiàn)有的大多數(shù)圖像到圖像轉(zhuǎn)化方法都是基于監(jiān)督學(xué)習(xí)，需要由兩個(gè)對(duì)應(yīng)的圖像對(duì)組成的訓(xùn)練數(shù)據(jù)集，但是對(duì)于許多應(yīng)用來說難以獲得所需的圖像對(duì)，因此給轉(zhuǎn)化造成不便。

本發(fā)明提出了一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法，使用無監(jiān)督圖像到圖像轉(zhuǎn)化(unit)網(wǎng)絡(luò)框架學(xué)習(xí)兩個(gè)圖像域之間的雙向轉(zhuǎn)化功能，其包括vae和vae，用它們對(duì)每個(gè)圖像域進(jìn)行建模，對(duì)抗訓(xùn)練目標(biāo)與權(quán)重共享約束相互作用，在兩個(gè)域中產(chǎn)生相應(yīng)的圖像，將轉(zhuǎn)化圖像與各個(gè)域中的輸入圖像相關(guān)聯(lián)，訓(xùn)練網(wǎng)絡(luò)聯(lián)合解決圖像重構(gòu)流和圖像轉(zhuǎn)化流的問題。本發(fā)明提出無監(jiān)督圖像到圖像轉(zhuǎn)化框架，使兩個(gè)域中沒有任何聯(lián)系的圖像完成轉(zhuǎn)化；不需要對(duì)應(yīng)圖像組成的訓(xùn)練數(shù)據(jù)集即可完成，提高了效率和實(shí)用性，該方法還可拓展到無監(jiān)督的語言轉(zhuǎn)化。

技術(shù)實(shí)現(xiàn)要素：

針對(duì)圖像轉(zhuǎn)化不便的問題，本發(fā)明的目的在于提供一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法，使用無監(jiān)督圖像到圖像轉(zhuǎn)化(unit)網(wǎng)絡(luò)框架學(xué)習(xí)兩個(gè)圖像域之間的雙向轉(zhuǎn)化功能，其包括vae和vae，用它們對(duì)每個(gè)圖像域進(jìn)行建模，對(duì)抗訓(xùn)練目標(biāo)與權(quán)重共享約束相互作用，在兩個(gè)域中產(chǎn)生相應(yīng)的圖像，將轉(zhuǎn)化圖像與各個(gè)域中的輸入圖像相關(guān)聯(lián)，訓(xùn)練網(wǎng)絡(luò)聯(lián)合解決圖像重構(gòu)流和圖像轉(zhuǎn)化流的問題。

為解決上述問題，本發(fā)明提供一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法，其主要內(nèi)容包括：

(一)變分自動(dòng)編碼器(vae)；

(二)權(quán)重共享；

(三)生成對(duì)抗網(wǎng)絡(luò)(gan)；

(四)學(xué)習(xí)。

其中，所述的無監(jiān)督圖像到圖像翻譯(unit)網(wǎng)絡(luò)，該框架包括變分自動(dòng)編碼器(vae)和生成對(duì)抗網(wǎng)絡(luò)(gan)；它由6個(gè)子網(wǎng)絡(luò)組成：包括兩個(gè)域圖像編碼器e1和e2，兩個(gè)域圖像生成器g1和g2，以及兩個(gè)域?qū)硅b別器d1和d2；令x1和x2為兩個(gè)不同的圖像域；在受監(jiān)督的圖像到圖像轉(zhuǎn)化問題中，從聯(lián)合分布繪制訓(xùn)練樣本(x1，x2)；在無監(jiān)督設(shè)置中，僅從邊際分布和給出訓(xùn)練樣本。

其中，所述的變分自動(dòng)編碼器(vae)，編碼器-發(fā)生器對(duì){e1，g1}構(gòu)成了vae1的x1域的vae；對(duì)于輸入圖像x1∈x1，vae1首先通過編碼器e1映射到潛在空間中的代碼，然后解碼，經(jīng)生成器g1重建輸入圖像；編碼器輸出平均矢量e1，μ(x1)和方差矢量其中潛碼z1的分布由給出；矩陣對(duì)角元素提取操作符將向量轉(zhuǎn)換為對(duì)角矩陣，其中對(duì)角元素是向量的分量；重建圖像為這里將q1(z1|x1)的分布作為的隨機(jī)向量的符號(hào)，并從中采樣；

類似地，{e2，g2}構(gòu)成x2域的vae：vae2；編碼器e2輸出平均矢量e2，μ(x1)和方差矢量潛碼z2的分布由給出；重建圖像表示為

進(jìn)一步地，所述的采樣，采樣操作z1～q1(z1|x1)可以通過實(shí)現(xiàn)，其中，。是hadamard乘法；同樣，z2～q2(z2|x2)采樣操作后為

其中，所述的權(quán)重共享，為了使兩個(gè)vae中的表示相關(guān)聯(lián)，強(qiáng)制執(zhí)行權(quán)重共享約束；基于兩個(gè)域中一對(duì)相應(yīng)圖像的高級(jí)表示，共享提取兩個(gè)域中的輸入圖像的高級(jí)表示e1和e2最后幾層的權(quán)重；類似地，共享解碼高級(jí)表示，重建輸入圖像g1和g2前幾層的權(quán)重。

進(jìn)一步地，所述的潛在代碼，相同的潛碼可以被解碼，在兩個(gè)域中輸出兩個(gè)不相關(guān)的圖像；通過對(duì)抗訓(xùn)練，分別將兩個(gè)域中的一對(duì)相應(yīng)圖像分別映射到e1和e2的公共潛在代碼，并將潛在的代碼映射到兩個(gè)對(duì)應(yīng)的圖像中，分別為g1和g2。

進(jìn)一步地，所述的共享潛在空間，x1和x2的共享潛在空間能完成圖像到圖像的轉(zhuǎn)化；通過應(yīng)用g2(z1～q1(z1|x1))將x1中的圖像x1轉(zhuǎn)換為x2中的圖像；將這樣的信息處理流稱為圖像轉(zhuǎn)化流；兩個(gè)圖像轉(zhuǎn)化流存在于unit框架中：x1→x2和x2→x1；兩個(gè)流與圖像重建流聯(lián)合訓(xùn)練；一旦確保一對(duì)相應(yīng)的圖像被映射到相同的潛伏碼，并且相同的潛碼解碼成一對(duì)對(duì)應(yīng)的圖像，則(x1，g2(z1～q1(z1|x1)))將形成一對(duì)相應(yīng)的圖像。

其中，所述的生成對(duì)抗網(wǎng)絡(luò)(gan)，一個(gè)unit網(wǎng)絡(luò)使用兩個(gè)對(duì)抗性的鑒別器：d1和d2；對(duì)于從第一個(gè)域數(shù)據(jù)集采樣的圖像，d1應(yīng)輸出為“正確”，而對(duì)于由g1生成的圖像，則應(yīng)輸出為“錯(cuò)誤”；由g1生成的圖像可以是相同的域重建圖像或域轉(zhuǎn)換圖像類似地，d2被訓(xùn)練為對(duì)從第二域數(shù)據(jù)集采樣的圖像輸出“正確”，對(duì)于從g2生成的圖像是d2。

其中，所述的學(xué)習(xí)，訓(xùn)練unit網(wǎng)絡(luò)可以通過聯(lián)合解決vae1，vae2，gan1和gan2的圖像重構(gòu)流和圖像轉(zhuǎn)化流的學(xué)習(xí)問題：

訓(xùn)練vae通常通過最小化負(fù)對(duì)數(shù)似然函數(shù)的變化上界來完成；

vae對(duì)象函數(shù)由上式給出。

進(jìn)一步地，所述的重建圖像，超參數(shù)λ1和λ2控制目標(biāo)函數(shù)的權(quán)重，kl代表kullback-leibler(kl)發(fā)散函數(shù)；使用由給出的高斯分布對(duì)條件分布pg1進(jìn)行建模；因此，最小化負(fù)對(duì)數(shù)似然項(xiàng)相當(dāng)于最小化圖像和重建圖像之間的歐氏距離；相同的建模應(yīng)用于pg2；先驗(yàn)分布為

(4)和(5)中的目標(biāo)函數(shù)與標(biāo)準(zhǔn)gan目標(biāo)函數(shù)不同，因?yàn)樯傻膱D像來自兩個(gè)不同的分布；對(duì)于(4)，兩個(gè)分布是q1(z1|x1)(x1中的輸入圖像的重建圖像的分布)和q2(z2|x2)(x2中的輸入圖像的轉(zhuǎn)換圖像的分布)；優(yōu)化(4)鼓勵(lì)g1輸出從類似于x1圖像的分布中抽取的圖像；類似地，優(yōu)化(5)鼓勵(lì)g2從x2輸出類似圖像的q1(z1|x1)和q2(z2|x2)采樣的圖像。

附圖說明

圖1是本發(fā)明一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法的系統(tǒng)框架圖。

圖2是本發(fā)明一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法的無監(jiān)督圖像到圖像翻譯(unit)網(wǎng)絡(luò)框架。

圖3是本發(fā)明一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法的轉(zhuǎn)化實(shí)例。

具體實(shí)施方式

需要說明的是，在不沖突的情況下，本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互結(jié)合，下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說明。

圖1是本發(fā)明一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法的系統(tǒng)框架圖。主要包括變分自動(dòng)編碼器(vae)，權(quán)重共享，生成對(duì)抗網(wǎng)絡(luò)(gan)，學(xué)習(xí)。

變分自動(dòng)編碼器(vae)，編碼器-發(fā)生器對(duì){e1，g1}構(gòu)成了vae1的x1域的vae；對(duì)于輸入圖像x1∈x1，vae1首先通過編碼器e1映射到潛在空間中的代碼，然后解碼，經(jīng)生成器g1重建輸入圖像；編碼器輸出平均矢量和方差矢量其中潛碼z1的分布由給出；矩陣對(duì)角元素提取操作符將向量轉(zhuǎn)換為對(duì)角矩陣，其中對(duì)角元素是向量的分量；重建圖像為這里將q1(z1|x1)的分布作為的隨機(jī)向量的符號(hào)，并從中采樣；

類似地，{e2，g2}構(gòu)成x2域的vae：vae2；編碼器e2輸出平均矢量e2，μ(x1)和方差矢量潛碼z2的分布由給出；重建圖像表示為

采樣操作z1～q1(z1|x1)可以通過實(shí)現(xiàn)，其中，ο是hadamard乘法；同樣，z2～q2(z2|x2)采樣操作后為

權(quán)重共享，為了使兩個(gè)vae中的表示相關(guān)聯(lián)，強(qiáng)制執(zhí)行權(quán)重共享約束；基于兩個(gè)域中一對(duì)相應(yīng)圖像的高級(jí)表示，共享提取兩個(gè)域中的輸入圖像的高級(jí)表示e1和e2最后幾層的權(quán)重；類似地，共享解碼高級(jí)表示，重建輸入圖像g1和g2前幾層的權(quán)重。

相同的潛碼可以被解碼，在兩個(gè)域中輸出兩個(gè)不相關(guān)的圖像；通過對(duì)抗訓(xùn)練，分別將兩個(gè)域中的一對(duì)相應(yīng)圖像分別映射到e1和e2的公共潛在代碼，并將潛在的代碼映射到兩個(gè)對(duì)應(yīng)的圖像中，分別為g1和g2。

x1和x2的共享潛在空間能完成圖像到圖像的轉(zhuǎn)化；通過應(yīng)用g2(z1～q1(z1|x1))將x1中的圖像x1轉(zhuǎn)換為x2中的圖像；將這樣的信息處理流稱為圖像轉(zhuǎn)化流；兩個(gè)圖像轉(zhuǎn)化流存在于unit框架中：x1→x2和x2→x1；兩個(gè)流與圖像重建流聯(lián)合訓(xùn)練；一旦確保一對(duì)相應(yīng)的圖像被映射到相同的潛伏碼，并且相同的潛碼解碼成一對(duì)對(duì)應(yīng)的圖像，則(x1，g2(z1～q1(z1|x1)))將形成一對(duì)相應(yīng)的圖像。

生成對(duì)抗網(wǎng)絡(luò)(gan)，一個(gè)unit網(wǎng)絡(luò)使用兩個(gè)對(duì)抗性的鑒別器：d1和d2；對(duì)于從第一個(gè)域數(shù)據(jù)集采樣的圖像，d1應(yīng)輸出為“正確”，而對(duì)于由g1生成的圖像，則應(yīng)輸出為“錯(cuò)誤”；由g1生成的圖像可以是相同的域重建圖像或域轉(zhuǎn)換圖像類似地，d2被訓(xùn)練為對(duì)從第二域數(shù)據(jù)集采樣的圖像輸出“正確”，對(duì)于從g2生成的圖像是d2。

學(xué)習(xí)，訓(xùn)練unit網(wǎng)絡(luò)可以通過聯(lián)合解決vae1，vae2，gan1和gan2的圖像重構(gòu)流和圖像轉(zhuǎn)化流的學(xué)習(xí)問題：

訓(xùn)練vae通常通過最小化負(fù)對(duì)數(shù)似然函數(shù)的變化上界來完成；

vae對(duì)象函數(shù)由上式給出。

重建圖像，超參數(shù)λ1和λ2控制目標(biāo)函數(shù)的權(quán)重，kl代表kullback-leibler(kl)發(fā)散函數(shù)；使用由給出的高斯分布對(duì)條件分布pg1進(jìn)行建模；因此，最小化負(fù)對(duì)數(shù)似然項(xiàng)相當(dāng)于最小化圖像和重建圖像之間的歐氏距離；相同的建模應(yīng)用于pg2；先驗(yàn)分布為

圖2是本發(fā)明一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法的無監(jiān)督圖像到圖像翻譯(unit)網(wǎng)絡(luò)框架。該框架包括變分自動(dòng)編碼器(vae)和生成對(duì)抗網(wǎng)絡(luò)(gan)；它由6個(gè)子網(wǎng)絡(luò)組成：包括兩個(gè)域圖像編碼器e1和e2，兩個(gè)域圖像生成器g1和g2，以及兩個(gè)域?qū)硅b別器d1和d2；令x1和x2為兩個(gè)不同的圖像域；在受監(jiān)督的圖像到圖像轉(zhuǎn)化問題中，從聯(lián)合分布繪制訓(xùn)練樣本(x1，x2)；在無監(jiān)督設(shè)置中，僅從邊際分布和合出訓(xùn)練樣本。

圖3是本發(fā)明一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法的轉(zhuǎn)化實(shí)例。其實(shí)現(xiàn)了無監(jiān)督日間圖像到夜間圖像的轉(zhuǎn)化，夜間圖像到日間圖像的轉(zhuǎn)化，熱像到rgb圖像的轉(zhuǎn)化，rgb圖像到熱像的轉(zhuǎn)化，晴天圖像到雨天圖像的轉(zhuǎn)化，以及雨天圖像到晴天圖像的轉(zhuǎn)化。

對(duì)于本領(lǐng)域技術(shù)人員，本發(fā)明不限制于上述實(shí)施例的細(xì)節(jié)，在不背離本發(fā)明的精神和范圍的情況下，能夠以其他具體形式實(shí)現(xiàn)本發(fā)明。此外，本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍，這些改進(jìn)和變型也應(yīng)視為本發(fā)明的保護(hù)范圍。因此，所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：夏春秋
技術(shù)所有人：深圳市唯特視科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

變分自動(dòng)編碼器相關(guān)技術(shù)

變分自編碼器相關(guān)技術(shù)

旋變編碼器相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于變分自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)的圖像轉(zhuǎn)化方法與流程