本發(fā)明涉及醫(yī)療領(lǐng)域,尤其涉及一種針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法和裝置。
背景技術(shù):
::相關(guān)技術(shù)中,可通過(guò)傳統(tǒng)的光學(xué)字符識(shí)別(opticalcharacterrecognition,ocr)算法對(duì)圖片進(jìn)行文本區(qū)域劃分。特別是對(duì)包含多種內(nèi)容的圖片進(jìn)行文本區(qū)域劃分尤為明顯。然而,傳統(tǒng)的ocr算法可能會(huì)因?yàn)閳D片的表現(xiàn)形式不同而造成了文本區(qū)域劃分不準(zhǔn)確。例如,對(duì)不同醫(yī)療機(jī)構(gòu)發(fā)出的不同形式的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分時(shí),可能將同一條檢查項(xiàng)的信息分到另外一個(gè)文本區(qū)域中的問(wèn)題發(fā)生,具體如圖1所示。技術(shù)實(shí)現(xiàn)要素:本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問(wèn)題之一。為此,本發(fā)明的一個(gè)目的在于提出一種針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,該方法能夠有效避免因圖片表現(xiàn)形式不一致,而導(dǎo)致對(duì)圖片的文本區(qū)域的劃分不準(zhǔn)確的問(wèn)題,提高了對(duì)圖片的文本區(qū)域劃分精度,提升了使用體驗(yàn)。本發(fā)明的第二個(gè)目的在于提出一種針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置。為達(dá)上述目的,本發(fā)明第一方面實(shí)施例提出了一種針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,包括:基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊;確定所述多個(gè)分塊的位置信息和類型信息,并根據(jù)所述位置信息和類型信息從所述多個(gè)分塊中獲取多個(gè)待合并分塊;識(shí)別所述多個(gè)待合并分塊的文本內(nèi)容;根據(jù)所述多個(gè)待合并分塊的文本內(nèi)容對(duì)所述多個(gè)待合并分塊進(jìn)行合并。本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,首先基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊;其次,確定多個(gè)分塊的位置信息和類型信息,并根據(jù)位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊;再次,識(shí)別多個(gè)待合并分塊的文本內(nèi)容;最后根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并,從而有效避免因圖片表現(xiàn)形式不一致,而導(dǎo)致對(duì)圖片的文本區(qū)域劃分不準(zhǔn)確的問(wèn)題,提高了對(duì)圖片的文本區(qū)域劃分精度,提升了使用體驗(yàn)。為達(dá)上述目的,本發(fā)明第二方面實(shí)施例提出了一種針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置,包括:區(qū)域劃分模塊,用于基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊;待合并分塊獲取模塊,用于確定所述多個(gè)分塊的位置信息和類型信息,并根據(jù)所述位置信息和類型信息從所述多個(gè)分塊中獲取多個(gè)待合并分塊;識(shí)別模塊,用于識(shí)別所述多個(gè)待合并分塊的文本內(nèi)容;合并模塊,用于根據(jù)所述多個(gè)待合并分塊的文本內(nèi)容對(duì)所述多個(gè)待合并分塊進(jìn)行合并。本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置,首先通過(guò)區(qū)域劃分模塊基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊;其次,待合并分塊獲取模塊確定多個(gè)分塊的位置信息和類型信息,并根據(jù)位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊;再次,識(shí)別模塊識(shí)別多個(gè)待合并分塊的文本內(nèi)容;最后,合并模塊根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并,從而有效避免因圖片表現(xiàn)形式不一致,而導(dǎo)致對(duì)圖片的文本區(qū)域的劃分不準(zhǔn)確的問(wèn)題,提高了對(duì)圖片的文本區(qū)域劃分精度,提升了使用體驗(yàn)。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。附圖說(shuō)明本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1為傳統(tǒng)的光學(xué)字符識(shí)別對(duì)文本區(qū)域劃分不準(zhǔn)確的示例圖;圖2為本發(fā)明一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法的流程圖;圖3為本發(fā)明另一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法的流程圖;圖4為本發(fā)明的再一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法的流程圖;圖5為本發(fā)明的一個(gè)實(shí)施例的多個(gè)待合并分塊合并結(jié)果示意圖;圖6為本發(fā)明一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置的結(jié)構(gòu)示意圖;圖7為本發(fā)明的一個(gè)實(shí)施例的待合并分塊模塊的結(jié)構(gòu)示意圖;圖8為本發(fā)明的一個(gè)實(shí)施例的合并模塊的結(jié)構(gòu)示意圖。具體實(shí)施方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。下面參考附圖描述本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法和裝置。需要說(shuō)明的是,對(duì)于醫(yī)學(xué)資料圖片,很多檢查項(xiàng)都以表格內(nèi)容的形式進(jìn)行呈現(xiàn)。下面以健康體檢報(bào)告為例進(jìn)行具體說(shuō)明,在健康體檢報(bào)告中,一個(gè)檢測(cè)項(xiàng)可包括:檢測(cè)項(xiàng)名稱,檢測(cè)項(xiàng)英文名,檢測(cè)值,單位,參考范圍。由于不同的醫(yī)療機(jī)構(gòu)發(fā)出的醫(yī)學(xué)資料圖片樣式不統(tǒng)一,有些醫(yī)學(xué)資料圖片可能表格中的兩列之間相隔比較大,所以傳統(tǒng)ocr算法會(huì)將一個(gè)大的區(qū)域拆分成不同的區(qū)域進(jìn)行分析,造成的后果就是將同一條檢查項(xiàng)的信息分到不同的區(qū)域中,這對(duì)于該檢查項(xiàng)的分析就不準(zhǔn)確,存在誤差。對(duì)此,本發(fā)明對(duì)在傳統(tǒng)的ocr算法對(duì)醫(yī)學(xué)資料圖片劃分區(qū)域的基礎(chǔ)上,提出了合并相關(guān)區(qū)域的改進(jìn)方法,以此解決傳統(tǒng)ocr算法對(duì)醫(yī)學(xué)資料劃分區(qū)域不準(zhǔn)確的技術(shù)問(wèn)題。圖2為本發(fā)明一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法的流程圖。如圖2所示,根據(jù)本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,包括以下步驟:s201,基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊。其中,在本實(shí)施例中,醫(yī)學(xué)資料圖片可以為健康體檢報(bào)告圖片。具體地,基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域的劃分可根據(jù)待識(shí)別的醫(yī)學(xué)資料圖片的具體表現(xiàn)形式來(lái)進(jìn)行劃分。舉例說(shuō)明如下:假設(shè)本實(shí)施例中的醫(yī)學(xué)資料圖片為健康體檢報(bào)告圖片,則確定該待識(shí)別的醫(yī)學(xué)資料圖片的表現(xiàn)形式主要是以表格形式進(jìn)行具體呈現(xiàn),從而光學(xué)字符識(shí)別ocr算法根據(jù)醫(yī)學(xué)資料圖片的表現(xiàn)形式對(duì)該醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域的劃分操作。s202,確定多個(gè)分塊的位置信息和類型信息,并根據(jù)位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊。具體地,在得到待識(shí)別的醫(yī)學(xué)資料圖片的多個(gè)分塊之后,可確定多個(gè)分塊的位置信息和類型信息。其中,確定多個(gè)分塊的位置信息可通過(guò)多個(gè)分塊與待識(shí)別的醫(yī)學(xué)資料圖片的上下左右邊界的距離來(lái)確定;類型信息可根據(jù)待識(shí)別的醫(yī)學(xué)資料圖片的表現(xiàn)形式來(lái)確定。其中,需要說(shuō)明的是,多個(gè)分塊的類型信息主要可包括:表格類型(tableblock)、文本類型(textblock)、圖片類型(pictureblock)。進(jìn)一步地,根據(jù)確定的位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊。舉例說(shuō)明如下:在多個(gè)分塊中獲取的兩個(gè)分塊,分別確定兩個(gè)分塊的位置信息和類型信息,并比較兩個(gè)分塊的位置信息和類型信息,如果比較的結(jié)果符合預(yù)設(shè)要求則確定該兩個(gè)分塊可以進(jìn)入待合并分塊的集合中。其中,預(yù)設(shè)要求可根據(jù)實(shí)際需要進(jìn)行設(shè)置,在此不作具體限制。s203,識(shí)別多個(gè)待合并分塊的文本內(nèi)容。s204,根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并。具體地,在獲取多個(gè)待合并分塊之后,可進(jìn)一步獲取多個(gè)待合并分塊的文本內(nèi)容,進(jìn)而根據(jù)獲取的文本內(nèi)容判定多個(gè)待合并分塊是否進(jìn)行合并??梢岳斫猓诘玫蕉鄠€(gè)待合并分塊的文本內(nèi)容之后,可將獲取的多個(gè)文本內(nèi)容分別進(jìn)行匹配操作,如果匹配成功則可將匹配成功的待合并分塊進(jìn)行合并操作,以得到一個(gè)完整的文本區(qū)域。本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,首先基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊;其次,確定多個(gè)分塊的位置信息和類型信息,并根據(jù)位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊;再次,識(shí)別多個(gè)待合并分塊的文本內(nèi)容;最后根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并,從而有效避免因圖片樣式不一致,而導(dǎo)致對(duì)圖片的文本區(qū)域的劃分不準(zhǔn)確的問(wèn)題,從而提高對(duì)圖片的文本區(qū)域劃分精度,提升了使用體驗(yàn)。下面通過(guò)圖3對(duì)本發(fā)明實(shí)施例進(jìn)行進(jìn)一步的描述。圖3為本發(fā)明另一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法的流程圖。如圖3所示,根據(jù)本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,包括以下步驟:s301,基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊。s302,確定多個(gè)分塊的類型信息。其中,多個(gè)分塊的類型信息至少可包括:表格類型(tableblock)、文本類型(textblock)、圖片類型(pictureblock)??梢岳斫?,該表格類型用于指示該分塊的文本內(nèi)容具有表格的形式,文本類型用于指示該分塊的文本內(nèi)容是普通的文本,圖片類型用于指示該分塊是圖片。s303,根據(jù)類型信息從多個(gè)分塊中獲取屬于第一類型的多個(gè)第一分塊。其中,第一類型為表格類型。s304,確定多個(gè)第一分塊的位置信息。s305,根據(jù)多個(gè)第一分塊的位置信息,從多個(gè)第一分塊中獲取滿足第一預(yù)設(shè)條件的多個(gè)第二分塊。其中,滿足第一預(yù)設(shè)條件可包括:距離醫(yī)學(xué)資料圖片上邊界的距離值之差小于預(yù)設(shè)閾值。需要說(shuō)明的是,在本實(shí)施例中,預(yù)設(shè)閾值可以為10像素,或者15像素,可以根據(jù)實(shí)際情況設(shè)定不同的預(yù)設(shè)閾值,在此不做具體限制。也就是說(shuō),可根據(jù)第一分塊的位置信息,從該第一分塊中獲取距離醫(yī)學(xué)資料圖片上邊界的距離值之差小于預(yù)設(shè)閾值的分塊,將這些分塊作為第二分塊??梢岳斫猓@些第二分塊在醫(yī)學(xué)資料圖片中的位置應(yīng)該相差不大,應(yīng)屬于同一個(gè)表格。還需要說(shuō)明的是,上述以距離醫(yī)學(xué)資料圖片上邊界的距離值之差小于預(yù)設(shè)閾值為判定條件,來(lái)從多個(gè)第一分塊中獲取第二分塊的方式,僅是一種示例,不能作為本發(fā)明的具體限定,即例如,還可以以距離醫(yī)學(xué)資料圖片下邊界的距離值之差小于預(yù)設(shè)閾值為判定條件,來(lái)獲取第二分塊。s306,將多個(gè)第二分塊作為多個(gè)待合并分塊。可以理解,在本實(shí)施例中,根據(jù)多個(gè)第一分塊的位置信息從多個(gè)第一分塊中獲取滿足第一預(yù)設(shè)條件的多個(gè)第二分塊,主要是將這些第一分塊的水平橫向的坐標(biāo)值進(jìn)行作差,并將差值與預(yù)設(shè)的某一個(gè)閾值進(jìn)行比較,例如10像素,如果差值小于10像素,則可將滿足該條件的第二分塊作為待合并分塊。s307,識(shí)別多個(gè)待合并分塊的文本內(nèi)容。s308,根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并。本實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,通過(guò)對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分之后,對(duì)得到的多個(gè)分塊類型進(jìn)行確定,并根據(jù)確定的類型信息從多個(gè)分塊中確定出多個(gè)第一分塊,并確定多個(gè)第一分塊的位置信息,根據(jù)確定的位置信息從多個(gè)第一分塊中獲取多個(gè)第二分塊,將多個(gè)第二分塊作為多個(gè)待合并分塊,然后識(shí)別出多個(gè)待合并分塊的文本內(nèi)容,并根據(jù)多個(gè)待合并分塊的文本內(nèi)容實(shí)現(xiàn)合并操作,從而使得對(duì)待識(shí)別的醫(yī)學(xué)資料圖片的識(shí)別精確度更高。圖4為本發(fā)明的再一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法的流程圖。如圖4所示,本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,包括以下幾個(gè)步驟:s401,基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊。s402,確定多個(gè)分塊的類型信息。s403,根據(jù)類型信息從多個(gè)分塊中獲取屬于第一類型的多個(gè)第一分塊。s404,確定多個(gè)第一分塊的位置信息。s405,根據(jù)多個(gè)第一分塊的位置信息,從多個(gè)第一分塊中獲取滿足第一預(yù)設(shè)條件的多個(gè)第二分塊。s406,將多個(gè)第二分塊作為多個(gè)待合并分塊。s407,根據(jù)多個(gè)待合并分塊的文本內(nèi)容獲取多個(gè)待合并分塊中所包含的屬性列。其中,以第一類型為表格類型為例,則多個(gè)待合并分塊的文本內(nèi)容可為二維字符串?dāng)?shù)組,該二維字符串?dāng)?shù)組中的每列數(shù)據(jù)用于指示屬于同一個(gè)屬性列的數(shù)據(jù)。作為一種示例,根據(jù)多個(gè)待合并分塊的文本內(nèi)容獲取多個(gè)待合并分塊中所包含的屬性列的具體實(shí)現(xiàn)過(guò)程可如下:提取多個(gè)待合并分塊的文本內(nèi)容中各個(gè)數(shù)據(jù)的特征信息,并根據(jù)預(yù)設(shè)的決策樹模型對(duì)特征信息進(jìn)行預(yù)測(cè)以獲取多個(gè)待合并分塊中所包含的屬性列。其中,該決策樹模型可以通過(guò)以下步驟預(yù)先建立:s4071)獲取樣本醫(yī)學(xué)資料圖片,并對(duì)樣本醫(yī)學(xué)資料圖片進(jìn)行ocr識(shí)別以生成第一ocr識(shí)別結(jié)果,第一ocr識(shí)別結(jié)果為二維字符串?dāng)?shù)組,二維字符串?dāng)?shù)組中的每列數(shù)據(jù)用于指示屬于同一個(gè)屬性列的數(shù)據(jù);s4072)提取第一ocr識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)的第一特征信息;s4073)獲取與第一ocr識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)對(duì)應(yīng)的第一標(biāo)注數(shù)據(jù),第一標(biāo)注數(shù)據(jù)用于指示各個(gè)數(shù)據(jù)所屬的屬性;s4074)根據(jù)第一特征信息和第一標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練以生成用于確定ocr識(shí)別結(jié)果中數(shù)據(jù)屬性的決策樹模型。由此,通過(guò)預(yù)設(shè)的決策樹模型對(duì)特征信息進(jìn)行預(yù)測(cè)以獲取多個(gè)待合并分塊中所包含的屬性列可以在節(jié)省大量的獲取時(shí)間,減輕了系統(tǒng)的運(yùn)行負(fù)擔(dān)。s408,確定每個(gè)待合并分塊中所包含的屬性列中的首列屬性,并從多個(gè)待合并分塊中確定首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊。其中,預(yù)設(shè)首列屬性可以是指表格列表中第一個(gè)屬性列,例如,以醫(yī)學(xué)資料圖片為健康體檢報(bào)告圖片為例,該預(yù)設(shè)首列屬性可為檢測(cè)項(xiàng)名稱。下面以健康體檢報(bào)告圖片為例進(jìn)行說(shuō)明,假設(shè)獲取的待合并分塊為第一分塊和第二分塊,其中第一待合并分塊的首列屬性為檢查項(xiàng)名稱,第二待合并分塊的首列屬性為單位,預(yù)設(shè)首列屬性為檢查項(xiàng)名稱,則可以確定出第二待合并分塊的首列屬性與預(yù)設(shè)首列屬性不一致,其中獲取的第一待合并分塊和第二待合并分塊中包含的屬性列具體可參見(jiàn)圖1所示。s409,判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列是否為具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列??梢岳斫?,判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列是否是具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列的依據(jù):例如,以健康體檢報(bào)告圖片為例,確定該圖片中包含哪些檢測(cè)項(xiàng)目(例如血液常規(guī)檢測(cè)項(xiàng)目),并確定這些檢測(cè)項(xiàng)目中所包含的所有屬性列(如檢測(cè)項(xiàng)名稱、檢查結(jié)果、單位、提示、參考范圍),以該所包含的所有屬性列為基準(zhǔn)來(lái)判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列是否為具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列。s410,若是,則對(duì)多個(gè)待合并分塊進(jìn)行合并。繼續(xù)使用上述示例說(shuō)明,如圖1所示,由于第二待合并分塊2中的首列屬性與預(yù)設(shè)首列屬性不一致,則進(jìn)一步判定第二待合并分塊2中的屬性列是否為預(yù)設(shè)首列屬性缺少的屬性列,如果確定是預(yù)設(shè)首列屬性缺少的屬性列,則可將第二待合并分塊2合并至與預(yù)設(shè)首列屬性相同的第一待合并分塊1中,具體合并的結(jié)果可參見(jiàn)圖5所示。本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別方法,根據(jù)多個(gè)待合并分塊的文本內(nèi)容獲取多個(gè)待合并分塊中的屬性列,并確定出每個(gè)待合并分塊中屬性列中的首列屬性,將確定的首列屬性與預(yù)設(shè)首列屬性進(jìn)行比對(duì),并將不一致的待合并分塊的首列屬性與預(yù)設(shè)首列屬性的缺少屬性列進(jìn)行匹配,如果匹配則將該對(duì)應(yīng)的待合并分塊與預(yù)設(shè)首列相同的待合并分塊進(jìn)行合并,從而使得不同形式醫(yī)學(xué)資料圖片的文本區(qū)域劃分都能夠準(zhǔn)確無(wú)誤的被識(shí)別,方便用戶查看。為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出了一種針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置。圖6為本發(fā)明一個(gè)實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置的結(jié)構(gòu)示意圖。如圖6所示,該針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置可包括:區(qū)域劃分模塊110、待合并分塊獲取模塊120、識(shí)別模塊130和合并模塊140。其中,區(qū)域劃分模塊110用于基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊。其中,在本實(shí)施例中,醫(yī)學(xué)資料圖片可以為健康體檢報(bào)告圖片。具體地,基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域的劃分可根據(jù)待識(shí)別的醫(yī)學(xué)資料圖片的具體表現(xiàn)形式來(lái)進(jìn)行劃分。舉例說(shuō)明如下:假設(shè)本實(shí)施例中的醫(yī)學(xué)資料圖片為健康體檢報(bào)告圖片,則確定該待識(shí)別的醫(yī)學(xué)資料圖片的表現(xiàn)形式主要是以表格形式進(jìn)行具體呈現(xiàn),從而光學(xué)字符識(shí)別ocr算法根據(jù)醫(yī)學(xué)資料圖片的表現(xiàn)形式對(duì)該醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域的劃分操作。待合并分塊獲取模塊120用于確定多個(gè)分塊的位置信息和類型信息,并根據(jù)位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊。具體地,在得到待識(shí)別的醫(yī)學(xué)資料圖片的多個(gè)分塊之后,可確定多個(gè)分塊的位置信息和類型信息。其中,確定多個(gè)分塊的位置信息可通過(guò)多個(gè)分塊與待識(shí)別的醫(yī)學(xué)資料圖片的上下左右邊界的距離來(lái)確定;類型信息可根據(jù)待識(shí)別的醫(yī)學(xué)資料圖片的表現(xiàn)形式來(lái)確定。其中,需要說(shuō)明的是,多個(gè)分塊的類型信息主要可包括:表格類型(tableblock)、文本類型(textblock)、圖片類型(pictureblock)。進(jìn)一步地,根據(jù)確定的位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊。舉例說(shuō)明如下:在多個(gè)分塊中獲取的兩個(gè)分塊,分別確定兩個(gè)分塊的位置信息和類型信息,并比較兩個(gè)分塊的位置信息和類型信息,如果比較的結(jié)果符合預(yù)設(shè)要求則確定該兩個(gè)分塊可以進(jìn)入待合并分塊的集合中。其中,預(yù)設(shè)要求可根據(jù)實(shí)際需要進(jìn)行設(shè)置,在此不作具體限制。在本發(fā)明的一個(gè)實(shí)施例中,如圖7所示,待合并分塊獲取模塊120包括:第一確定單元121、第一獲取單元122、第二確定單元123、第二獲取單元124和第三獲取單元125。其中,第一確定單元121用于確定多個(gè)分塊的類型信息。其中,多個(gè)分塊的類型信息至少可包括:表格類型(tableblock)、文本類型(textblock)、圖片類型(pictureblock)??梢岳斫?,該表格類型用于指示該分塊的文本內(nèi)容具有表格的形式,文本類型用于指示該分塊的文本內(nèi)容是普通的文本,圖片類型用于指示該分塊是圖片。第一獲取單元122用于根據(jù)類型信息從多個(gè)分塊中獲取屬于第一類型的多個(gè)第一分塊。第二確定單元123用于確定多個(gè)第一分塊的位置信息。第二獲取單元124用于根據(jù)多個(gè)第一分塊的位置信息,從多個(gè)第一分塊中獲取滿足第一預(yù)設(shè)條件的多個(gè)第二分塊。其中,滿足第一預(yù)設(shè)條件可包括:距離醫(yī)學(xué)資料圖片上邊界的距離值之差小于預(yù)設(shè)閾值。需要說(shuō)明的是,在本實(shí)施例中,預(yù)設(shè)閾值可以為10像素,或者15像素,可以根據(jù)實(shí)際情況設(shè)定不同的預(yù)設(shè)閾值,在此不做具體限制。也就是說(shuō),可根據(jù)第一分塊的位置信息,從該第一分塊中獲取距離醫(yī)學(xué)資料圖片上邊界的距離值之差小于預(yù)設(shè)閾值的分塊,將這些分塊作為第二分塊。可以理解,這些第二分塊在醫(yī)學(xué)資料圖片中的位置應(yīng)該相差不大,應(yīng)屬于同一個(gè)表格。還需要說(shuō)明的是,上述以距離醫(yī)學(xué)資料圖片上邊界的距離值之差小于預(yù)設(shè)閾值為判定條件,來(lái)從多個(gè)第一分塊中獲取第二分塊的方式,僅是一種示例,不能作為本發(fā)明的具體限定,即例如,還可以以距離醫(yī)學(xué)資料圖片下邊界的距離值之差小于預(yù)設(shè)閾值為判定條件,來(lái)獲取第二分塊。第三獲取單元125用于將多個(gè)第二分塊作為多個(gè)待合并分塊??梢岳斫猓诒緦?shí)施例中,根據(jù)多個(gè)第一分塊的位置信息從多個(gè)第一分塊中獲取滿足第一預(yù)設(shè)條件的多個(gè)第二分塊,主要是將這些第一分塊的水平橫向的坐標(biāo)值進(jìn)行作差,并將差值與預(yù)設(shè)的某一個(gè)閾值進(jìn)行比較,例如10像素,如果差值小于10像素,則可將滿足該條件的第二分塊作為待合并分塊。識(shí)別模塊130用于識(shí)別多個(gè)待合并分塊的文本內(nèi)容。合并模塊140用于根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并。在本發(fā)明的一個(gè)實(shí)施例中,如圖8所示,合并模塊140包括:獲取單元141,確定單元142、判斷單元143和合并單元144。其中,獲取單元141用于根據(jù)多個(gè)待合并分塊的文本內(nèi)容獲取多個(gè)待合并分塊中所包含的屬性列。其中,以第一類型為表格類型為例,則多個(gè)待合并分塊的文本內(nèi)容可為二維字符串?dāng)?shù)組,該二維字符串?dāng)?shù)組中的每列數(shù)據(jù)用于指示屬于同一個(gè)屬性列的數(shù)據(jù)。作為一種示例,根據(jù)多個(gè)待合并分塊的文本內(nèi)容獲取多個(gè)待合并分塊中所包含的屬性列的具體實(shí)現(xiàn)過(guò)程可如下:提取多個(gè)待合并分塊的文本內(nèi)容中各個(gè)數(shù)據(jù)的特征信息,并根據(jù)預(yù)設(shè)的決策樹模型對(duì)特征信息進(jìn)行預(yù)測(cè)以獲取多個(gè)待合并分塊中所包含的屬性列。其中,該決策樹模型可以通過(guò)以下步驟預(yù)先建立:s4071)獲取樣本醫(yī)學(xué)資料圖片,并對(duì)樣本醫(yī)學(xué)資料圖片進(jìn)行ocr識(shí)別以生成第一ocr識(shí)別結(jié)果,第一ocr識(shí)別結(jié)果為二維字符串?dāng)?shù)組,二維字符串?dāng)?shù)組中的每列數(shù)據(jù)用于指示屬于同一個(gè)屬性列的數(shù)據(jù);s4072)提取第一ocr識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)的第一特征信息;s4073)獲取與第一ocr識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)對(duì)應(yīng)的第一標(biāo)注數(shù)據(jù),第一標(biāo)注數(shù)據(jù)用于指示各個(gè)數(shù)據(jù)所屬的屬性;s4074)根據(jù)第一特征信息和第一標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練以生成用于確定ocr識(shí)別結(jié)果中數(shù)據(jù)屬性的決策樹模型。由此,通過(guò)預(yù)設(shè)的決策樹模型對(duì)特征信息進(jìn)行預(yù)測(cè)以獲取多個(gè)待合并分塊中所包含的屬性列可以在節(jié)省大量的獲取時(shí)間,減輕了系統(tǒng)的運(yùn)行負(fù)擔(dān)。確定單元142用于確定每個(gè)待合并分塊中所包含的屬性列中的首列屬性,并從多個(gè)待合并分塊中確定首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊。其中,預(yù)設(shè)首列屬性可以是指表格列表中第一個(gè)屬性列,例如,以醫(yī)學(xué)資料圖片為健康體檢報(bào)告圖片為例,該預(yù)設(shè)首列屬性可為檢測(cè)項(xiàng)名稱。下面以健康體檢報(bào)告圖片為例進(jìn)行說(shuō)明,假設(shè)獲取的待合并分塊為第一分塊和第二分塊,其中第一待合并分塊的首列屬性為檢查項(xiàng)名稱,第二待合并分塊的首列屬性為單位,預(yù)設(shè)首列屬性為檢查項(xiàng)名稱,則可以確定出第二待合并分塊的首列屬性與預(yù)設(shè)首列屬性不一致,其中獲取的第一待合并分塊和第二待合并分塊中包含的屬性列具體可參見(jiàn)圖1所示。判斷單元143用于判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列是否為具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列??梢岳斫?,判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列是否是具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列的依據(jù):例如,以健康體檢報(bào)告圖片為例,確定該圖片中包含哪些檢測(cè)項(xiàng)目(例如血液常規(guī)檢測(cè)項(xiàng)目),并確定這些檢測(cè)項(xiàng)目中所包含的所有屬性列(如檢測(cè)項(xiàng)名稱、檢查結(jié)果、單位、提示、參考范圍),以該所包含的所有屬性列為基準(zhǔn)來(lái)判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列是否為具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列。合并單元144用于在判斷單元判斷首列屬性與預(yù)設(shè)首列屬性不一致的待合并分塊中的屬性列為具有預(yù)設(shè)首列屬性的待合并分塊所缺少的屬性列時(shí),對(duì)多個(gè)待合并分塊進(jìn)行合并。繼續(xù)使用上述示例說(shuō)明,如圖1所示,由于第二待合并分塊2中的首列屬性與預(yù)設(shè)首列屬性不一致,則進(jìn)一步判定第二待合并分塊2中的屬性列是否為預(yù)設(shè)首列屬性缺少的屬性列,如果確定是預(yù)設(shè)首列屬性缺少的屬性列,則可將第二待合并分塊2合并至與預(yù)設(shè)首列屬性相同的第一待合并分塊1中,具體合并的結(jié)果可參見(jiàn)圖5所示本發(fā)明實(shí)施例的針對(duì)醫(yī)學(xué)資料圖片的文本識(shí)別裝置,首先通過(guò)區(qū)域劃分模塊基于光學(xué)字符識(shí)別ocr算法對(duì)待識(shí)別的醫(yī)學(xué)資料圖片進(jìn)行文本區(qū)域劃分,得到多個(gè)分塊;其次,待合并分塊獲取模塊確定多個(gè)分塊的位置信息和類型信息,并根據(jù)位置信息和類型信息從多個(gè)分塊中獲取多個(gè)待合并分塊;再次,識(shí)別模塊識(shí)別多個(gè)待合并并分塊的文本內(nèi)容;最后,合并模塊根據(jù)多個(gè)待合并分塊的文本內(nèi)容對(duì)多個(gè)待合并分塊進(jìn)行合并,從而有效避免因圖片表現(xiàn)形式不一致,而導(dǎo)致對(duì)圖片的文本區(qū)域的劃分不準(zhǔn)確的問(wèn)題,提高了對(duì)圖片的文本區(qū)域劃分精度,提升了使用體驗(yàn)。此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。在本說(shuō)明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬
技術(shù)領(lǐng)域:
:的技術(shù)人員所理解。在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說(shuō)明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(ram),只讀存儲(chǔ)器(rom),可擦除可編輯只讀存儲(chǔ)器(eprom或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(cdrom)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^(guò)對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來(lái)以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場(chǎng)可編程門陣列(fpga)等。本
技術(shù)領(lǐng)域:
:的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12