本申請(qǐng)涉及圖像處理,特別是涉及一種ocr訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在數(shù)字化時(shí)代中,大量的紙質(zhì)文檔與圖像需要被轉(zhuǎn)換為可編輯與可搜索的電子文檔,目前一般采用ocr模型對(duì)紙質(zhì)文檔與圖像進(jìn)行轉(zhuǎn)換;訓(xùn)練ocr模型時(shí)需要通過(guò)手動(dòng)掃描與手動(dòng)標(biāo)注得到的ocr訓(xùn)練圖像。
2、但是,ocr模型訓(xùn)練時(shí)需要的ocr訓(xùn)練圖像是大量的,由于ocr訓(xùn)練圖像是通過(guò)手動(dòng)掃描與手動(dòng)標(biāo)注得到的,故獲取大量的ocr訓(xùn)練圖像的過(guò)程不僅耗時(shí)而且成本高昂;此外,一些用于生成ocr訓(xùn)練圖像的高質(zhì)量紙質(zhì)文檔與圖像由于涉及到隱私或者版權(quán)問(wèn)題,變得愈加難以獲取;可見(jiàn),目前為訓(xùn)練ocr模型獲取充足的ocr訓(xùn)練圖像的難度較大。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種ocr訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品,能夠解決ocr模型中訓(xùn)練圖像缺乏的問(wèn)題。
2、第一方面,本申請(qǐng)?zhí)峁┝艘环Nocr訓(xùn)練圖像生成方法,包括:
3、基于預(yù)設(shè)的第一域圖像集與第二域圖像集,對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型;
4、基于預(yù)設(shè)的字符行尺寸,生成輸入圖像底圖;
5、基于輸入圖像底圖和字符行尺寸對(duì)應(yīng)的字符,確定模型輸入圖像;
6、將模型輸入圖像輸入目標(biāo)圖像生成模型進(jìn)行處理,輸出ocr訓(xùn)練圖像。
7、第二方面,本申請(qǐng)?zhí)峁┝艘环Nocr訓(xùn)練圖像生成裝置,包括:
8、模型訓(xùn)練模塊,用于基于預(yù)設(shè)的第一域圖像集與第二域圖像集,對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型;
9、底圖生成模塊,用于基于預(yù)設(shè)的字符行尺寸,生成輸入圖像底圖;
10、輸入圖像生成模塊,用于基于輸入圖像底圖和字符行尺寸對(duì)應(yīng)的字符,確定模型輸入圖像;
11、訓(xùn)練圖像生成模塊,用于將模型輸入圖像輸入目標(biāo)圖像生成模型進(jìn)行處理,輸出ocr訓(xùn)練圖像。
12、第三方面,本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)設(shè)備,計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,處理器執(zhí)行該計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的方法中的步驟。
13、第四方面,本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法中的步驟。
14、第五方面,本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)程序產(chǎn)品,計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法中的步驟。
15、上述ocr訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品,在生成輸入圖像底圖的基礎(chǔ)上,通過(guò)字符行尺寸對(duì)應(yīng)的字符處理該輸入圖像底圖得到模型輸入圖像,然后將該模型輸入圖像輸入至目標(biāo)圖像生成模型中進(jìn)行處理,輸出ocr訓(xùn)練圖像。通過(guò)上述實(shí)施,可在生成目標(biāo)圖像生成模型的基礎(chǔ)上,根據(jù)輸入圖像底圖以及相應(yīng)的字符自動(dòng)生成用于輸入至目標(biāo)圖像生成模型的模型輸入圖像,然后再通過(guò)目標(biāo)圖像生成模型處理模型輸入圖像以得到大量的ocr訓(xùn)練圖像,如此無(wú)需通過(guò)手動(dòng)掃描與手動(dòng)標(biāo)注得到ocr訓(xùn)練圖像,且獲取ocr訓(xùn)練圖像也不會(huì)受限于隱私或者版權(quán)問(wèn)題,如此可解決ocr模型中訓(xùn)練圖像缺乏的問(wèn)題。
1.一種ocr訓(xùn)練圖像生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于預(yù)設(shè)的第一域圖像集與第二域圖像集,對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述樣本均值組包括與所述第一域圖像集對(duì)應(yīng)的第一樣本均值,以及與所述第二域圖像集對(duì)應(yīng)的第二樣本均值;所述基于所述樣本均值組、所述第一域圖像概率與所述第二域圖像概率,確定對(duì)抗損失組,包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將所述第一域圖像集與所述第二域圖像集輸入所述初始圖像生成模型進(jìn)行處理,輸出第一圖像差異與第二圖像差異,包括:
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述樣本均值組、所述第一圖像差異與所述第二圖像差異,確定循環(huán)一致性損失,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于預(yù)設(shè)的字符行尺寸,生成輸入圖像底圖,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述基于所述輸入圖像底圖和所述字符行尺寸對(duì)應(yīng)的字符,確定模型輸入圖像,包括:
8.一種ocr訓(xùn)練圖像生成裝置,其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法的步驟。