圖像配準(zhǔn)方法及其裝置以及圖像拼接方法及其裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理領(lǐng)域,具體涉及一種圖像配準(zhǔn)方法、圖像拼接方法以及與二者分別對(duì)應(yīng)的裝置。
【背景技術(shù)】
[0002]圖像配準(zhǔn)是采用一定的匹配策略,找出一個(gè)圖像中的像素點(diǎn)在另一圖像中對(duì)應(yīng)的位置,進(jìn)而確定兩個(gè)圖像之間的變換關(guān)系的圖像處理方法?,F(xiàn)有的圖像配準(zhǔn)方法主要采用點(diǎn)匹配法。具體地,首先通過尋找兩個(gè)圖像中的角點(diǎn)找到關(guān)鍵點(diǎn),在關(guān)鍵點(diǎn)鄰域提取描述子。之后,在兩個(gè)圖像中基于描述子生成候選匹配對(duì)。然后,在候選匹配對(duì)中選擇一組自洽的候選匹配對(duì),例如通過投票的方法,并生成圖像間的幾何變換。最后,可根據(jù)該幾何變換將一個(gè)圖像映射到另一圖像的坐標(biāo)系中。
[0003]圖像拼接是將多張有重疊部分的圖像,例如不同時(shí)間、不同視角或者不同傳感器獲得的圖像,拼成一幅大型圖像的技術(shù)。例如,當(dāng)用照相機(jī)的鏡頭成像時(shí),鏡頭的視角和圖像解析度是一對(duì)矛盾。具體地,增加鏡頭的視角能一次攝入更多的內(nèi)容,但是因?yàn)檎障鄼C(jī)的像素不變,因此圖像解析度必然降低。如果要保證圖像解析度,則必然視角較小,無法一次攝入太多內(nèi)容。因此當(dāng)需要對(duì)較大對(duì)象,例如大幅面文檔印刷件,進(jìn)行高清成像時(shí),通常采用如下方法:首先拍攝多張具有少量重疊的高清圖像,然后利用重疊部分對(duì)圖像進(jìn)行配準(zhǔn),最后將經(jīng)配準(zhǔn)的圖像進(jìn)行融合,以得到經(jīng)拼接重構(gòu)的平滑無縫全景圖像。圖像配準(zhǔn)和圖像融合是圖像拼接的兩個(gè)關(guān)鍵技術(shù)。圖像配準(zhǔn)是圖像融合的基礎(chǔ)。
[0004]當(dāng)上述圖像配準(zhǔn)方法用于文檔印刷件圖像時(shí),由于文字的角點(diǎn)繁多且相似度高,導(dǎo)致候選匹配對(duì)繁多,顯著增加了計(jì)算量且容易造成配準(zhǔn)錯(cuò)誤。圖像配準(zhǔn)的計(jì)算量直接影響圖像拼接的計(jì)算量,而且如果圖像配準(zhǔn)發(fā)生錯(cuò)誤,將造成圖像拼接也發(fā)生錯(cuò)誤。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種至少部分地解決上述問題的圖像配準(zhǔn)方法、圖像拼接方法以及與二者分別對(duì)應(yīng)的裝置。
[0006]根據(jù)本發(fā)明一個(gè)方面,提供了一種圖像配準(zhǔn)方法。該圖像配準(zhǔn)方法包括以下步驟:步驟SlOO:對(duì)第一圖像和第二圖像進(jìn)行文字識(shí)別,其中該第一圖像和該第二圖像包含文字;步驟S200:基于文字識(shí)別結(jié)果生成候選匹配對(duì);步驟S300:在該候選匹配對(duì)中選擇自洽的候選匹配對(duì)并且根據(jù)該自洽的候選匹配對(duì)生成該第二圖像到該第一圖像的幾何變換;以及步驟S400:根據(jù)該幾何變換,將該第二圖像映射到該第一圖像的坐標(biāo)系中。
[0007]可選地,上述步驟SlOO進(jìn)一步包括:對(duì)該第一圖像和該第二圖像進(jìn)行文字樣式識(shí)別。該文字樣式可以包括以下項(xiàng)中的一項(xiàng)或多項(xiàng):文字字體、文字顏色、文字長寬比、文字大小和文字特殊效果。
[0008]可選地,上述步驟SlOO進(jìn)一步包括:針對(duì)所識(shí)別的文字,確定文字識(shí)別的識(shí)別置信度,其中該識(shí)別置信度作為該文字識(shí)別結(jié)果的一部分。
[0009]可選地,上述步驟S200進(jìn)一步包括:識(shí)別該文字識(shí)別結(jié)果中的預(yù)定字;以及針對(duì)該文字識(shí)別結(jié)果中的、該預(yù)定字以外的字生成該候選匹配對(duì)。
[0010]根據(jù)本發(fā)明另一方面,提供了一種圖像拼接方法。該圖像拼接方法包括步驟:按照上述圖像配準(zhǔn)方法對(duì)待拼接圖像中的、包含文字的第一圖像和第二圖像進(jìn)行配準(zhǔn)。
[0011]根據(jù)本發(fā)明又一方面,提供了一種圖像配準(zhǔn)裝置。該圖像配準(zhǔn)裝置包括識(shí)別模塊、粗匹配模塊、細(xì)匹配模塊和映射模塊。識(shí)別模塊用于對(duì)第一圖像和第二圖像進(jìn)行文字識(shí)別,其中該第一圖像和該第二圖像包含文字。粗匹配模塊用于基于文字識(shí)別結(jié)果生成候選匹配對(duì)。細(xì)匹配模塊用于在該候選匹配對(duì)中選擇自洽的候選匹配對(duì)并且根據(jù)該自洽的候選匹配對(duì)生成該第二圖像到該第一圖像的幾何變換。映射模塊用于根據(jù)該幾何變換將該第二圖像映射到該第一圖像的坐標(biāo)系中。
[0012]可選地,上述識(shí)別模塊進(jìn)一步包括:樣式識(shí)別模塊,用于對(duì)該第一圖像和該第二圖像進(jìn)行文字樣式識(shí)別。該文字樣式可以包括以下項(xiàng)中的一項(xiàng)或多項(xiàng):文字字體、文字顏色、文字長寬比、文字大小和文字特殊效果。
[0013]可選地,上述識(shí)別模塊進(jìn)一步包括:置信度確定模塊,用于針對(duì)所識(shí)別的文字,確定文字識(shí)別的識(shí)別置信度,其中該識(shí)別置信度作為該文字識(shí)別結(jié)果的一部分。
[0014]可選地,上述粗匹配模塊進(jìn)一步包括預(yù)定字識(shí)別模塊和匹配對(duì)生成模塊。預(yù)定字識(shí)別模塊用于識(shí)別該文字識(shí)別結(jié)果中的預(yù)定字。匹配對(duì)生成模塊用于針對(duì)該文字識(shí)別結(jié)果中的、該預(yù)定字以外的字生成該候選匹配對(duì)。
[0015]根據(jù)本發(fā)明再一方面,提供了一種圖像拼接裝置。該圖像拼接裝置包括上述圖像配準(zhǔn)裝置。
[0016]根據(jù)本發(fā)明的圖像配準(zhǔn)方法、圖像拼接方法以及與二者分別對(duì)應(yīng)的裝置,避免了現(xiàn)有技術(shù)中包含文字的圖像配準(zhǔn)時(shí)角點(diǎn)過多且相似度高以及其帶來的候選匹配對(duì)繁多、計(jì)算量大、配準(zhǔn)容易錯(cuò)誤的問題。相應(yīng)地,取得了圖像配準(zhǔn)的計(jì)算量小,準(zhǔn)確度高的有益效果。因?yàn)閳D像配準(zhǔn)的計(jì)算量小、結(jié)果準(zhǔn)確,上述圖像拼接方法和其對(duì)應(yīng)裝置也在具有較小計(jì)算量的前提下,能夠取得較好拼接效果。
[0017]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說明】
[0018]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0019]圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的圖像配準(zhǔn)方法的流程圖;
[0020]圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的、經(jīng)文字識(shí)別的圖像的示意圖;
[0021]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的第二圖像到第一圖像的幾何變換示意圖;
[0022]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的圖像拼接方法的流程圖;
[0023]圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的圖像配準(zhǔn)裝置的示意性框圖;以及
[0024]圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的圖像拼接裝置的示意性框圖。
【具體實(shí)施方式】
[0025]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0026]文字是人類用來交流的符號(hào)系統(tǒng),是紀(jì)錄思想和事件的書寫形式。文字是由簡單圖形形成,早期更加接近圖畫,現(xiàn)在更加接近幾何線條。例如拉丁字母是簡單的直線、弧線和點(diǎn)構(gòu)成。漢字主要是由直線構(gòu)成,所以叫做“方塊漢字”。包含文字的圖像,可能包含過多圖像亮度變化劇烈的點(diǎn)或圖像邊緣曲線上曲率極大值的點(diǎn),也即角點(diǎn)。這給基于角點(diǎn)的圖像配準(zhǔn)帶來了極大負(fù)面影響,進(jìn)而也對(duì)圖像拼接造成了很大困擾。
[0027]為解決上述問題,根據(jù)本發(fā)明一個(gè)方面,提供了一種圖像配準(zhǔn)方法。圖1示出根據(jù)本發(fā)明一個(gè)實(shí)施例的圖像配準(zhǔn)方法100的流程圖,在該圖像配準(zhǔn)方法100中,將第一圖像與第二圖像進(jìn)行配準(zhǔn)。如圖1所示,圖像配準(zhǔn)方法100包括步驟S110、步驟S120、步驟S130和步驟S140。
[0028]步驟SllO:對(duì)第一圖像和第二圖像進(jìn)行文字識(shí)別,其中第一圖像和第二圖像包含文字。
[0029]