本技術(shù)屬于文字識(shí)別,尤其涉及一種印章文字識(shí)別方法、裝置及電子設(shè)備。
背景技術(shù):
1、弧形印章常用于公文、證件等重要文件的真?zhèn)舞b定和審核,對弧形印章進(jìn)行自動(dòng)識(shí)別,替代人工審核比對,可以解決文檔管理工作中人工審核時(shí)間成本高、人力成本高的問題。相較于普通文檔場景下的文字識(shí)別,弧形印章由于文字排列呈角度、背景遮擋嚴(yán)重、印章圖像質(zhì)量差異大以及標(biāo)注數(shù)據(jù)獲取困難等原因,識(shí)別更加復(fù)雜。
2、目前,印章上的弧形文字通常采用極坐標(biāo)轉(zhuǎn)換的方式進(jìn)行拉直以便識(shí)別,但這一過程可能會(huì)影響弧形文本的形態(tài),使得文字識(shí)別結(jié)果準(zhǔn)確率降低。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本技術(shù)提出一種印章文字識(shí)別方法、裝置及電子設(shè)備,可以減少文本形變對印章文字識(shí)別的影響,提高弧形印章文字識(shí)別結(jié)果的準(zhǔn)確率。
2、第一方面,本技術(shù)提供了一種印章文字識(shí)別方法,該方法包括:
3、獲取待處理的印章圖像,所述印章圖像包括多個(gè)印章文字,所述多個(gè)印章文字的輪廓為弧形;
4、識(shí)別所述印章圖像的多個(gè)文字塊,得到第一印章圖像,每個(gè)所述文字塊對應(yīng)一個(gè)所述印章文字;
5、基于所述文字塊對應(yīng)的位置信息,對所述第一印章圖像進(jìn)行切分,得到第二印章圖像,所述第二印章圖像包括多個(gè)文字塊圖像,每個(gè)所述文字塊圖像對應(yīng)一個(gè)所述文字塊;
6、將所述第二印章圖像輸入至文字識(shí)別模型,獲得所述文字識(shí)別模型輸出的所述印章圖像對應(yīng)的印章文字信息;
7、其中,所述文字識(shí)別模型是通過目標(biāo)印章圖像集訓(xùn)練得到的。
8、根據(jù)本技術(shù)的印章文字識(shí)別方法,通過識(shí)別印章圖像中印章文字對應(yīng)的文字塊,得到第一印章圖像,并基于文字塊對應(yīng)的位置信息,對第一印章圖像進(jìn)行切分,得到可以表征印章文字在印章中位置分布的第二印章圖像,將包括多個(gè)文字塊圖像的第二印章圖像輸入至文字識(shí)別模型,通過文字識(shí)別模型可以根據(jù)印章文字的位置分布輸出印章文字信息,不需要將印章圖像上的弧形文字拉直,減少文本形變對印章文字識(shí)別的影響,可以提高弧形印章文字識(shí)別結(jié)果的準(zhǔn)確率。
9、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述文字識(shí)別模型包括文字識(shí)別模塊和文字推理模塊,所述將所述第二印章圖像輸入至文字識(shí)別模型,獲得所述文字識(shí)別模型輸出的所述印章圖像對應(yīng)的印章文字信息,包括:
10、將所述第二印章圖像輸入至所述文字識(shí)別模塊,基于所述文字塊圖像對應(yīng)的文本信息和位置信息,獲得所述文字識(shí)別模塊輸出的多個(gè)所述印章文字對應(yīng)的文本概率矩陣;
11、將所述文本概率矩陣輸入至文字推理模塊,獲得所述文字推理模塊輸出的所述印章文字信息。
12、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述文字識(shí)別模塊包括平均池化層、全局特征提取層和預(yù)測層,所述將所述第二印章圖像輸入至所述文字識(shí)別模塊,基于所述文字塊圖像對應(yīng)的文本信息和位置信息,獲得所述文字識(shí)別模塊輸出的多個(gè)所述印章文字對應(yīng)的文本概率矩陣,包括:
13、將所述第二印章圖像輸入至所述平均池化層,獲得所述平均池化層輸出的維度降低的所述第二印章圖像;
14、將維度降低的所述第二印章圖像輸入至所述全局特征提取層,基于所述文字塊圖像對應(yīng)的文本信息和位置信息,獲得所述全局特征提取層輸出的所述第二印章圖像對應(yīng)的全局上下文信息;
15、將所述全局上下文信息輸入至所述預(yù)測層,獲得所述預(yù)測層輸出的所述文本概率矩陣。
16、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述全局特征提取層包括第一特征提取層和第二特征提取層,所述將維度降低的所述第二印章圖像輸入至所述全局特征提取層,基于所述文字塊圖像對應(yīng)的文本信息和位置信息,獲得所述全局特征提取層輸出的所述第二印章圖像對應(yīng)的全局上下文信息,包括:
17、將維度降低的所述第二印章圖像輸入至所述第一特征提取層,基于所述文字塊圖像對應(yīng)的文本信息和位置信息,獲得所述第一特征提取層輸出的第一特征信息;
18、將所述第一特征信息輸入至所述第二特征提取層,獲得所述第二特征提取層輸出的所述全局上下文信息。
19、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述預(yù)測層為全卷積層或全連接層。
20、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述基于所述文字塊對應(yīng)的位置信息,對所述第一印章圖像進(jìn)行切分,得到第二印章圖像,包括:
21、基于所述文字塊對應(yīng)的位置信息,對所述第一印章圖像進(jìn)行切分,得到多個(gè)所述文字塊圖像;
22、將多個(gè)所述文字塊圖像渲染至基準(zhǔn)圖像,得到所述第二印章圖像。
23、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述識(shí)別所述印章圖像的多個(gè)文字塊,包括:
24、通過可微分二值化網(wǎng)絡(luò)模型,識(shí)別所述印章圖像的多個(gè)文字塊。
25、根據(jù)本技術(shù)的一個(gè)實(shí)施例,所述將所述第二印章圖像輸入至文字識(shí)別模型,包括:
26、對所述第二印章圖像中所述文字塊圖像對應(yīng)區(qū)域外的區(qū)域進(jìn)行掩膜處理;
27、將掩膜處理后的所述第二印章圖像輸入至所述文字識(shí)別模型。
28、第二方面,本技術(shù)提供了一種印章文字識(shí)別裝置,該裝置包括:
29、獲取模塊,用于獲取待處理的印章圖像,所述印章圖像包括多個(gè)印章文字,所述多個(gè)印章文字的輪廓為弧形;
30、第一處理模塊,用于識(shí)別所述印章圖像的多個(gè)文字塊,得到第一印章圖像,每個(gè)所述文字塊對應(yīng)一個(gè)所述印章文字;
31、第二處理模塊,用于基于所述文字塊對應(yīng)的位置信息,對所述第一印章圖像進(jìn)行切分,得到第二印章圖像,所述第二印章圖像包括多個(gè)文字塊圖像,每個(gè)所述文字塊圖像對應(yīng)一個(gè)所述文字塊;
32、第三處理模塊,用于將所述第二印章圖像輸入至文字識(shí)別模型,獲得所述文字識(shí)別模型輸出的所述印章圖像對應(yīng)的印章文字信息;
33、其中,所述文字識(shí)別模型是通過目標(biāo)印章圖像集訓(xùn)練得到的。
34、根據(jù)本技術(shù)的印章文字識(shí)別裝置,通過識(shí)別印章圖像中印章文字對應(yīng)的文字塊,得到第一印章圖像,并基于文字塊對應(yīng)的位置信息,對第一印章圖像進(jìn)行切分,得到可以表征印章文字在印章中位置分布的第二印章圖像,將包括多個(gè)文字塊圖像的第二印章圖像輸入至文字識(shí)別模型,通過文字識(shí)別模型可以根據(jù)印章文字的位置分布輸出印章文字信息,不需要將印章圖像上的弧形文字拉直,減少文本形變對印章文字識(shí)別的影響,可以提高弧形印章文字識(shí)別結(jié)果的準(zhǔn)確率。
35、第三方面,本技術(shù)提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述第一方面所述的印章文字識(shí)別方法。
36、第四方面,本技術(shù)提供了一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的印章文字識(shí)別方法。
37、第五方面,本技術(shù)提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的印章文字識(shí)別方法。
38、本技術(shù)的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術(shù)的實(shí)踐了解到。