OCR訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40635657發(fā)布日期：2025-01-10 18:41閱讀：2來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

OCR訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

本申請(qǐng)涉及圖像處理，特別是涉及一種ocr訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、在數(shù)字化時(shí)代中，大量的紙質(zhì)文檔與圖像需要被轉(zhuǎn)換為可編輯與可搜索的電子文檔，目前一般采用ocr模型對(duì)紙質(zhì)文檔與圖像進(jìn)行轉(zhuǎn)換；訓(xùn)練ocr模型時(shí)需要通過(guò)手動(dòng)掃描與手動(dòng)標(biāo)注得到的ocr訓(xùn)練圖像。

2、但是，ocr模型訓(xùn)練時(shí)需要的ocr訓(xùn)練圖像是大量的，由于ocr訓(xùn)練圖像是通過(guò)手動(dòng)掃描與手動(dòng)標(biāo)注得到的，故獲取大量的ocr訓(xùn)練圖像的過(guò)程不僅耗時(shí)而且成本高昂；此外，一些用于生成ocr訓(xùn)練圖像的高質(zhì)量紙質(zhì)文檔與圖像由于涉及到隱私或者版權(quán)問(wèn)題，變得愈加難以獲取；可見(jiàn)，目前為訓(xùn)練ocr模型獲取充足的ocr訓(xùn)練圖像的難度較大。

技術(shù)實(shí)現(xiàn)思路

1、基于此，有必要針對(duì)上述技術(shù)問(wèn)題，提供一種ocr訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品，能夠解決ocr模型中訓(xùn)練圖像缺乏的問(wèn)題。

2、第一方面，本申請(qǐng)?zhí)峁┝艘环Nocr訓(xùn)練圖像生成方法，包括：

3、基于預(yù)設(shè)的第一域圖像集與第二域圖像集，對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型；

4、基于預(yù)設(shè)的字符行尺寸，生成輸入圖像底圖；

5、基于輸入圖像底圖和字符行尺寸對(duì)應(yīng)的字符，確定模型輸入圖像；

6、將模型輸入圖像輸入目標(biāo)圖像生成模型進(jìn)行處理，輸出ocr訓(xùn)練圖像。

7、第二方面，本申請(qǐng)?zhí)峁┝艘环Nocr訓(xùn)練圖像生成裝置，包括：

8、模型訓(xùn)練模塊，用于基于預(yù)設(shè)的第一域圖像集與第二域圖像集，對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型；

9、底圖生成模塊，用于基于預(yù)設(shè)的字符行尺寸，生成輸入圖像底圖；

10、輸入圖像生成模塊，用于基于輸入圖像底圖和字符行尺寸對(duì)應(yīng)的字符，確定模型輸入圖像；

11、訓(xùn)練圖像生成模塊，用于將模型輸入圖像輸入目標(biāo)圖像生成模型進(jìn)行處理，輸出ocr訓(xùn)練圖像。

12、第三方面，本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)設(shè)備，計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器，存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，處理器執(zhí)行該計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的方法中的步驟。

13、第四方面，本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法中的步驟。

14、第五方面，本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)程序產(chǎn)品，計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的方法中的步驟。

15、上述ocr訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品，在生成輸入圖像底圖的基礎(chǔ)上，通過(guò)字符行尺寸對(duì)應(yīng)的字符處理該輸入圖像底圖得到模型輸入圖像，然后將該模型輸入圖像輸入至目標(biāo)圖像生成模型中進(jìn)行處理，輸出ocr訓(xùn)練圖像。通過(guò)上述實(shí)施，可在生成目標(biāo)圖像生成模型的基礎(chǔ)上，根據(jù)輸入圖像底圖以及相應(yīng)的字符自動(dòng)生成用于輸入至目標(biāo)圖像生成模型的模型輸入圖像，然后再通過(guò)目標(biāo)圖像生成模型處理模型輸入圖像以得到大量的ocr訓(xùn)練圖像，如此無(wú)需通過(guò)手動(dòng)掃描與手動(dòng)標(biāo)注得到ocr訓(xùn)練圖像，且獲取ocr訓(xùn)練圖像也不會(huì)受限于隱私或者版權(quán)問(wèn)題，如此可解決ocr模型中訓(xùn)練圖像缺乏的問(wèn)題。

技術(shù)特征：

1.一種ocr訓(xùn)練圖像生成方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于預(yù)設(shè)的第一域圖像集與第二域圖像集，對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型，包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述樣本均值組包括與所述第一域圖像集對(duì)應(yīng)的第一樣本均值，以及與所述第二域圖像集對(duì)應(yīng)的第二樣本均值；所述基于所述樣本均值組、所述第一域圖像概率與所述第二域圖像概率，確定對(duì)抗損失組，包括：

4.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述將所述第一域圖像集與所述第二域圖像集輸入所述初始圖像生成模型進(jìn)行處理，輸出第一圖像差異與第二圖像差異，包括：

5.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述基于所述樣本均值組、所述第一圖像差異與所述第二圖像差異，確定循環(huán)一致性損失，包括：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于預(yù)設(shè)的字符行尺寸，生成輸入圖像底圖，包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述基于所述輸入圖像底圖和所述字符行尺寸對(duì)應(yīng)的字符，確定模型輸入圖像，包括：

8.一種ocr訓(xùn)練圖像生成裝置，其特征在于，包括：

9.一種計(jì)算機(jī)設(shè)備，所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法的步驟。

技術(shù)總結(jié)
本申請(qǐng)涉及一種OCR訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。方法包括：基于預(yù)設(shè)的第一域圖像集與第二域圖像集，對(duì)初始圖像生成模型進(jìn)行訓(xùn)練得到目標(biāo)圖像生成模型；基于預(yù)設(shè)的字符行尺寸，生成輸入圖像底圖；基于輸入圖像底圖和字符行尺寸對(duì)應(yīng)的字符，確定模型輸入圖像；將模型輸入圖像輸入目標(biāo)圖像生成模型進(jìn)行處理，輸出OCR訓(xùn)練圖像。采用本申請(qǐng)，能夠解決OCR模型中訓(xùn)練圖像缺乏的問(wèn)題。

技術(shù)研發(fā)人員：張之楠,王澤宙,羅羊,周超,謝佶雋,呂江波,沈小勇
受保護(hù)的技術(shù)使用者：深圳思謀信息科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張之楠,王澤宙,羅羊,周超,謝佶雋,呂江波,沈小勇
技術(shù)所有人：深圳思謀信息科技有限公司
我是此專利的發(fā)明人

上一篇：振動(dòng)參數(shù)測(cè)試裝置的制作方法
上一篇：交直流變換電路以及充電裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

OCR訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

OCR訓(xùn)練圖像生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程