現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0079]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
[0080]類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0081 ] 本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的裝置中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)裝置中。可以把實(shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者裝置的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
[0082]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0083]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的圖像配準(zhǔn)裝置和圖像拼接裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0084]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【主權(quán)項(xiàng)】
1.一種圖像配準(zhǔn)方法,其特征在于,包括: 步驟SlOO:對(duì)第一圖像和第二圖像進(jìn)行文字識(shí)別,其中所述第一圖像和所述第二圖像包含文字; 步驟S200:基于文字識(shí)別結(jié)果生成候選匹配對(duì); 步驟S300:在所述候選匹配對(duì)中選擇自洽的候選匹配對(duì)并且根據(jù)所述自洽的候選匹配對(duì)生成所述第二圖像到所述第一圖像的幾何變換;以及 步驟S400:根據(jù)所述幾何變換,將所述第二圖像映射到所述第一圖像的坐標(biāo)系中。2.如權(quán)利要求1所述的圖像配準(zhǔn)方法,其特征在于,所述步驟SlOO進(jìn)一步包括:對(duì)所述第一圖像和所述第二圖像進(jìn)行文字樣式識(shí)別。3.如權(quán)利要求2所述的圖像配準(zhǔn)方法,其特征在于,所述文字樣式包括以下項(xiàng)中的一項(xiàng)或多項(xiàng):文字字體、文字顏色、文字長寬比、文字大小和文字特殊效果。4.如權(quán)利要求1至3任一項(xiàng)所述的圖像配準(zhǔn)方法,其特征在于,所述步驟SlOO進(jìn)一步包括:針對(duì)所識(shí)別的文字,確定文字識(shí)別的識(shí)別置信度,其中所述識(shí)別置信度作為所述文字識(shí)別結(jié)果的一部分。5.如權(quán)利要求1所述的圖像配準(zhǔn)方法,其特征在于,所述步驟S200進(jìn)一步包括: 識(shí)別所述文字識(shí)別結(jié)果中的預(yù)定字;以及 針對(duì)所述文字識(shí)別結(jié)果中的、所述預(yù)定字以外的字生成所述候選匹配對(duì)。6.如權(quán)利要求1所述的圖像配準(zhǔn)方法,其特征在于,所述步驟S300是利用隨機(jī)抽樣一致性算法。7.如權(quán)利要求1所述的圖像配準(zhǔn)方法,其特征在于,所述第一圖像和所述第二圖像是證件圖像或圖紙圖像。8.一種圖像拼接方法,其特征在于,包括: 按照如權(quán)利要求1至7任一項(xiàng)所述的圖像配準(zhǔn)方法對(duì)待拼接圖像中的、包含文字的第一圖像和第二圖像進(jìn)行配準(zhǔn)。9.一種圖像配準(zhǔn)裝置,其特征在于,包括: 識(shí)別模塊,用于對(duì)第一圖像和第二圖像進(jìn)行文字識(shí)別,其中所述第一圖像和所述第二圖像包含文字; 粗匹配模塊,用于基于文字識(shí)別結(jié)果生成候選匹配對(duì); 細(xì)匹配模塊,用于在所述候選匹配對(duì)中選擇自洽的候選匹配對(duì)并且根據(jù)所述自洽的候選匹配對(duì)生成所述第二圖像到所述第一圖像的幾何變換;以及 映射模塊,用于根據(jù)所述幾何變換將所述第二圖像映射到所述第一圖像的坐標(biāo)系中。10.如權(quán)利要求9所述的圖像配準(zhǔn)裝置,其特征在于,所述識(shí)別模塊進(jìn)一步包括: 樣式識(shí)別模塊,用于對(duì)所述第一圖像和所述第二圖像進(jìn)行文字樣式識(shí)別。11.如權(quán)利要求10所述的圖像配準(zhǔn)裝置,其特征在于,所述文字樣式包括以下項(xiàng)中的一項(xiàng)或多項(xiàng):文字字體、文字顏色、文字長寬比、文字大小和文字特殊效果。12.如權(quán)利要求9至11任一項(xiàng)所述的圖像配準(zhǔn)裝置,其特征在于,所述識(shí)別模塊進(jìn)一步包括: 置信度確定模塊,用于針對(duì)所識(shí)別的文字,確定文字識(shí)別的識(shí)別置信度,其中所述識(shí)別置信度作為所述文字識(shí)別結(jié)果的一部分。13.如權(quán)利要求9所述的圖像配準(zhǔn)裝置,其特征在于,所述粗匹配模塊進(jìn)一步包括: 預(yù)定字識(shí)別模塊,用于識(shí)別所述文字識(shí)別結(jié)果中的預(yù)定字;以及 匹配對(duì)生成模塊,用于針對(duì)所述文字識(shí)別結(jié)果中的、所述預(yù)定字以外的字生成所述候選匹配對(duì)。14.一種圖像拼接裝置,其特征在于,包括如權(quán)利要求9至13任一項(xiàng)所述的圖像配準(zhǔn)裝置。
【專利摘要】本發(fā)明公開了圖像配準(zhǔn)方法、圖像配準(zhǔn)裝置、圖像拼接方法和圖像拼接裝置。該圖像配準(zhǔn)方法包括:步驟S100:對(duì)第一圖像和第二圖像進(jìn)行文字識(shí)別,其中該第一圖像和該第二圖像包含文字;步驟S200:基于文字識(shí)別結(jié)果生成候選匹配對(duì);步驟S300:在該候選匹配對(duì)中選擇自洽的候選匹配對(duì)并且根據(jù)該自洽的候選匹配對(duì)生成該第二圖像到該第一圖像的幾何變換;以及步驟S400:根據(jù)該幾何變換,將該第二圖像映射到該第一圖像的坐標(biāo)系中。上述圖像配準(zhǔn)方法和其對(duì)應(yīng)裝置計(jì)算量小、配準(zhǔn)準(zhǔn)確。因?yàn)榕錅?zhǔn)過程的計(jì)算量小、結(jié)果準(zhǔn)確,上述圖像拼接方法和其對(duì)應(yīng)裝置也在較小計(jì)算量的前提下,能夠取得較好拼接效果。
【IPC分類】G06T3/40, G06T3/00
【公開號(hào)】CN105096239
【申請(qǐng)?zhí)枴緾N201510382287
【發(fā)明人】周舒暢, 姚聰, 朱睿
【申請(qǐng)人】北京曠視科技有限公司, 北京小孔科技有限公司
【公開日】2015年11月25日
【申請(qǐng)日】2015年7月2日