两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種數(shù)學(xué)公式識別方法和裝置與流程

文檔序號:11251403閱讀:356來源:國知局
一種數(shù)學(xué)公式識別方法和裝置與流程

本發(fā)明涉及數(shù)學(xué)公式識別領(lǐng)域,特別是涉及一種數(shù)學(xué)公式識別方法和一種數(shù)學(xué)公式識別裝置。



背景技術(shù):

在數(shù)學(xué)學(xué)科中,數(shù)學(xué)公式是學(xué)術(shù)文獻(xiàn)的重要組成部分,目前主要利用mathtype、latex兩種工具對數(shù)學(xué)公式進(jìn)行錄入,但隨著文檔資料數(shù)字化需求的進(jìn)一步增長,前面兩種方法面對大量的復(fù)雜的數(shù)學(xué)公式時(shí),編輯難度大,而且效率較低。

聯(lián)機(jī)手寫數(shù)學(xué)公式識別可以為用戶提供類似于紙上書寫的數(shù)學(xué)公式錄入方式,但由于數(shù)學(xué)公式復(fù)雜的結(jié)構(gòu)極大地增加了計(jì)算機(jī)識別的難度,且手寫輸入設(shè)備的非精確性、書寫筆體和速度、數(shù)學(xué)符號的二義性、結(jié)構(gòu)的多變性等都給手寫數(shù)學(xué)公式的識別和編輯進(jìn)一步增加了難度。

而且在現(xiàn)有的聯(lián)機(jī)手寫數(shù)學(xué)公式識別過程中,經(jīng)常會出現(xiàn)對字符的錯(cuò)識問題,并且會將對字符的錯(cuò)識問題疊加到對整個(gè)數(shù)學(xué)公式的分析中,從而影響最終的數(shù)學(xué)公式識別結(jié)果,導(dǎo)致識別手寫的數(shù)學(xué)公式不準(zhǔn)確。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問題,提出了本發(fā)明實(shí)施例以便提供克服上述問題或者至少部分地解決上述問題的一種數(shù)學(xué)公式識別方法和裝置。

為了解決上述問題,本發(fā)明實(shí)施例公開了一種數(shù)學(xué)公式識別的方法,所述方法包括:

接收輸入的圖像數(shù)據(jù),所述圖像數(shù)據(jù)的內(nèi)容包括手寫的數(shù)學(xué)公式信息;

確定與所述數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的一個(gè)或多個(gè)特征區(qū)域;

識別所述一個(gè)或多個(gè)特征區(qū)域,得到一個(gè)或多個(gè)公式元素;

結(jié)合所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將所述一個(gè)或多個(gè)公式元素組織成與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

優(yōu)選地,所述確定與所述數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及每個(gè)運(yùn)算關(guān)系類型對應(yīng)的一個(gè)或多個(gè)特征區(qū)域的步驟包括:

將所述圖像數(shù)據(jù)輸入預(yù)先生成的卷積神經(jīng)網(wǎng)絡(luò)模型,經(jīng)由所述卷積神經(jīng)網(wǎng)絡(luò)模型識別出所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及,根據(jù)所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型將所述圖像數(shù)據(jù)劃分后得到的一個(gè)或多個(gè)特征區(qū)域。

優(yōu)選地,所述卷積神經(jīng)網(wǎng)絡(luò)模型采用如下方式識別出所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型:

分別采用預(yù)置的多種運(yùn)算關(guān)系類型的權(quán)重系數(shù)作為卷積核,對所述圖像數(shù)據(jù)進(jìn)行卷積操作,得到所述圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率;

基于所述圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率,確定所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型。

優(yōu)選地,所述運(yùn)算關(guān)系類型具有對應(yīng)的結(jié)構(gòu)關(guān)系,所述特征區(qū)域包括單一區(qū)域和/或混合區(qū)域,所述識別所述一個(gè)或多個(gè)特征區(qū)域,得到一個(gè)或多個(gè)公式元素的步驟包括:

基于所述每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,將所述單一區(qū)域作為一個(gè)基本單元,以及,對所述混合區(qū)域進(jìn)行拆分,得到一個(gè)或多個(gè)基本單元;

采用預(yù)設(shè)的光學(xué)字符識別算法識別所述一個(gè)或多個(gè)基本單元,得到一個(gè)或多個(gè)公式元素。

優(yōu)選地,所述結(jié)合所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將所述一個(gè)或多個(gè)公式元素組織成與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式的步驟包括:

基于所述每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,確定所述每個(gè)公式元素的位置信息;

將所述每個(gè)公式元素放置在所述每個(gè)公式元素的位置信息對應(yīng)的位置,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

優(yōu)選地,所述將所述每個(gè)公式元素放置在所述每個(gè)公式元素的位置信息對應(yīng)的位置,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式的步驟包括:

針對混合區(qū)域,確定混合區(qū)域?qū)?yīng)的公式元素,結(jié)合所述混合區(qū)域?qū)?yīng)的公式元素的位置信息以及所述混合區(qū)域所包含的運(yùn)算關(guān)系類型,將所述混合區(qū)域?qū)?yīng)的公式元素組織成子公式;

針對單一區(qū)域,確定單一區(qū)域?qū)?yīng)的公式元素,將所述單一區(qū)域?qū)?yīng)的公式元素作為子公式;

對所有特征區(qū)域?qū)?yīng)的子公式進(jìn)行組合,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

優(yōu)選地,所述卷積神經(jīng)網(wǎng)絡(luò)模型采用如下方式生成:

獲取樣本圖像數(shù)據(jù),所述樣本圖像數(shù)據(jù)包括多個(gè)運(yùn)算關(guān)系類型對應(yīng)的樣本圖像數(shù)據(jù);

分別對每個(gè)運(yùn)算關(guān)系類型對應(yīng)的樣本圖像數(shù)據(jù)進(jìn)行訓(xùn)練,得到卷積神經(jīng)網(wǎng)絡(luò)模型,所述卷積神經(jīng)網(wǎng)絡(luò)模型以每個(gè)運(yùn)算關(guān)系類型對應(yīng)的權(quán)重系數(shù)作為卷積核。

優(yōu)選地,所述數(shù)學(xué)公式信息的輸入方式至少包括:手寫輸入設(shè)備、鼠標(biāo)輸入。

優(yōu)選地,所述單一區(qū)域包括數(shù)字或變量對應(yīng)的特征區(qū)域,所述混合區(qū)域包括數(shù)字或變量以及一個(gè)或多個(gè)至少以下運(yùn)算符對應(yīng)的特征區(qū)域:

分?jǐn)?shù)運(yùn)算符、開方運(yùn)算符、極限運(yùn)算符、乘積運(yùn)算符。

本發(fā)明實(shí)施例公開了一種數(shù)學(xué)公式識別的裝置,所述裝置包括:

接收模塊,用于接收輸入的圖像數(shù)據(jù),所述圖像數(shù)據(jù)的內(nèi)容包括手寫的數(shù)學(xué)公式信息;

確定模塊,用于確定與所述數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的一個(gè)或多個(gè)特征區(qū)域;

識別模塊,用于識別所述一個(gè)或多個(gè)特征區(qū)域,得到一個(gè)或多個(gè)公式元素;

組織模塊,用于結(jié)合所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將所述一個(gè)或多個(gè)公式元素組織成與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

本發(fā)明實(shí)施例包括以下優(yōu)點(diǎn):

在本發(fā)明實(shí)施例中,通過接收輸入的包括手寫的數(shù)學(xué)公式信息的圖像數(shù)據(jù),并確定與數(shù)學(xué)公式信息匹配的運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域,識別特征區(qū)域而得到公式元素,最后結(jié)合運(yùn)算關(guān)系類型,將公式元素組織成與數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式,從而實(shí)現(xiàn)對手寫數(shù)學(xué)公式的準(zhǔn)確識別,并且在識別過程中充分利用了數(shù)學(xué)公式的結(jié)構(gòu)性質(zhì),降低了字符識別的難度,優(yōu)化了整個(gè)識別過程的效果和流程,提升了對手寫數(shù)學(xué)公式識別的精確性和識別速度,為用戶提供更加精準(zhǔn)、簡便、快捷的數(shù)學(xué)公式輸入體驗(yàn)。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對本發(fā)明實(shí)施例的描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明實(shí)施例的一種數(shù)學(xué)公式識別的方法的步驟流程圖;

圖2是本發(fā)明實(shí)施例的一種數(shù)學(xué)公式識別的方法的步驟流程圖;

圖3是本發(fā)明實(shí)施例的一種手寫的數(shù)學(xué)公式示例圖;

圖4是本發(fā)明實(shí)施例的一種手寫的數(shù)學(xué)公式示例圖;

圖5是本發(fā)明實(shí)施例的一種數(shù)學(xué)公式識別的裝置的結(jié)構(gòu)框圖。

具體實(shí)施方式

為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

本發(fā)明實(shí)施例可以用于聯(lián)機(jī)識別手寫數(shù)學(xué)公式,并錄入計(jì)算機(jī),在一定程度上滿足商業(yè)人員或數(shù)學(xué)學(xué)科領(lǐng)域人員在聯(lián)機(jī)狀態(tài)下,通過鼠標(biāo)或者手寫輸入設(shè)備實(shí)現(xiàn)數(shù)學(xué)公式聯(lián)機(jī)錄入的需求。

聯(lián)機(jī)手寫數(shù)學(xué)公式識別屬于模式識別系統(tǒng)的一個(gè)方向,模式識別又稱作模式分類,通過計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀,模式可以理解為存在有某種基本結(jié)構(gòu)組織的排列或有序化,也可以稱為某一事物或其他一些感興趣項(xiàng)目的定量或結(jié)構(gòu)上的描述。

在聯(lián)機(jī)手寫數(shù)學(xué)公式識別中,分類和特征提取是系統(tǒng)最關(guān)鍵的部分。根據(jù)分類算法的不同,又可以將模式識別分為句法模式識別和統(tǒng)計(jì)模式識別。句法模式識別的基本思想是把一個(gè)模式描述為較簡單的子模式的組合,子模式又可以描述未更簡單的子模式的組合,從而做出識別分類;統(tǒng)計(jì)模式識別的分類方法主要有模塊匹配、概率分類、神經(jīng)網(wǎng)絡(luò)等。

聯(lián)機(jī)手寫數(shù)學(xué)公式識別的流程可以包括為:手寫輸入,符號分割,字符識別,結(jié)構(gòu)分析,系統(tǒng)糾錯(cuò),結(jié)果輸出,符號分割,字符識別和結(jié)構(gòu)分析是整個(gè)流程的核心部分,直接決定著最終識別結(jié)果的質(zhì)量。

其中,手寫輸入可以包括通過手寫板、鼠標(biāo)等設(shè)備輸入數(shù)學(xué)公式,在輸入過程中,將輸入比劃的軌跡坐標(biāo)進(jìn)行實(shí)時(shí)采樣并存儲在相應(yīng)的數(shù)據(jù)結(jié)構(gòu)中;符號分割可以包括將采集到的筆畫序列進(jìn)行分割,使每個(gè)字符對應(yīng)一個(gè)筆畫集合,然后提交給字符識別模塊進(jìn)行識別,根據(jù)字符識別反饋的準(zhǔn)確率來判斷分割的正確性;字符識別可以包括根據(jù)相關(guān)的字符識別算法來將分割的筆畫組合進(jìn)行識別,找出每個(gè)筆畫組最可能代表的字符;結(jié)構(gòu)分析可以包括判斷字符間的相對位置,結(jié)合表達(dá)式語法要求,分析輸入的表達(dá)式結(jié)構(gòu),將表達(dá)式結(jié)構(gòu)信息轉(zhuǎn)化為一種易于計(jì)算機(jī)處理的數(shù)據(jù)結(jié)構(gòu);系統(tǒng)糾錯(cuò)可以包括對數(shù)學(xué)公式識別過程中可能產(chǎn)生的各種錯(cuò)誤進(jìn)行分析和糾錯(cuò)處理;結(jié)果輸出可以包括數(shù)學(xué)公式識別完成后,得到的識別結(jié)果轉(zhuǎn)化成較成熟的數(shù)學(xué)公式語言輸出。

在本發(fā)明實(shí)施例中,通過將句法模式分類和結(jié)構(gòu)分析放在字符識別之前,利用卷積神經(jīng)網(wǎng)絡(luò)對聯(lián)機(jī)手寫數(shù)據(jù)進(jìn)行分類,分為:數(shù)字或變量、積分、極限、開方、分?jǐn)?shù)等,針對分類結(jié)果,利用結(jié)構(gòu)分析,將子結(jié)構(gòu)進(jìn)一步拆分為最基本的單元,即數(shù)字或變量,最后利用ocr實(shí)現(xiàn)對數(shù)字或變量的識別,從而在識別過程中充分利用了公式的結(jié)構(gòu)性質(zhì),降低了字符識別部分的難度,整體上優(yōu)化了整個(gè)識別系統(tǒng)的效果和流程。

下面對本發(fā)明實(shí)施例的具體實(shí)施方式進(jìn)行詳細(xì)說明:

參照圖1,示出了本發(fā)明實(shí)施例的一種數(shù)學(xué)公式識別的方法的步驟流程圖,具體可以包括如下步驟:

步驟101,接收輸入的圖像數(shù)據(jù),所述圖像數(shù)據(jù)的內(nèi)容包括手寫的數(shù)學(xué)公式信息;

步驟102,確定與所述數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的一個(gè)或多個(gè)特征區(qū)域;

步驟103,識別所述一個(gè)或多個(gè)特征區(qū)域,得到一個(gè)或多個(gè)公式元素;

步驟104,結(jié)合所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將所述一個(gè)或多個(gè)公式元素組織成與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在本發(fā)明實(shí)施例中,通過接收輸入的包括手寫的數(shù)學(xué)公式信息的圖像數(shù)據(jù),并確定與數(shù)學(xué)公式信息匹配的運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域,識別特征區(qū)域而得到公式元素,最后結(jié)合運(yùn)算關(guān)系類型,將公式元素組織成與數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式,從而實(shí)現(xiàn)對手寫數(shù)學(xué)公式的準(zhǔn)確識別,并且在識別過程中充分利用了數(shù)學(xué)公式的結(jié)構(gòu)性質(zhì),降低了字符識別的難度,優(yōu)化了整個(gè)識別過程的效果和流程,提升了對手寫數(shù)學(xué)公式識別的精確性和識別速度,為用戶提供更加精準(zhǔn)、簡便、快捷的數(shù)學(xué)公式輸入體驗(yàn)。

參照圖2,示出了本發(fā)明實(shí)施例的一種數(shù)學(xué)公式識別的方法的步驟流程圖,具體可以包括如下步驟:

步驟201,接收輸入的圖像數(shù)據(jù),所述圖像數(shù)據(jù)的內(nèi)容包括手寫的數(shù)學(xué)公式信息;

在本發(fā)明實(shí)施例中,當(dāng)用戶需要錄入數(shù)學(xué)公式時(shí),可以通過聯(lián)機(jī)手寫輸入的方式形成圖像數(shù)據(jù),本發(fā)明實(shí)施例可以接收輸入的圖像數(shù)據(jù)。

其中,圖像數(shù)據(jù)可以包括手寫的數(shù)學(xué)公式信息,數(shù)學(xué)公式信息可以包括將聯(lián)機(jī)手寫輸入的軌跡坐標(biāo)進(jìn)行實(shí)時(shí)采樣并存儲的數(shù)據(jù)。

作為一種示例,數(shù)學(xué)公式信息的輸入方式至少可以包括:手寫輸入設(shè)備、鼠標(biāo)輸入等,例如,手寫板等手寫輸入設(shè)備。

當(dāng)然,本領(lǐng)域技術(shù)人員還可以采用其他方式輸入數(shù)學(xué)公式信息,如采用拍照的方式,將數(shù)學(xué)公式寫在紙上并拍成照片,再將照片輸入,本發(fā)明實(shí)施例對此不作限制。

步驟202,確定與所述數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的一個(gè)或多個(gè)特征區(qū)域;

在接收輸入的圖像數(shù)據(jù)之后,本發(fā)明實(shí)施例可以采用卷積神經(jīng)網(wǎng)絡(luò)對圖像數(shù)據(jù)進(jìn)行匹配,從而確定與圖像數(shù)據(jù)中的數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,然后按照運(yùn)算關(guān)系類型對圖像數(shù)據(jù)進(jìn)行拆分,得到每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域。

作為一種示例,數(shù)學(xué)運(yùn)算類型可以為數(shù)字或變量與運(yùn)算符的組合的關(guān)系,運(yùn)算關(guān)系類型可以包括數(shù)字或變量、分?jǐn)?shù)、開方、極限、乘積等。

卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,cnn)是一種前饋神經(jīng)網(wǎng)絡(luò),它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元,對于大型圖像處理有出色表現(xiàn)。

cnn的基本結(jié)構(gòu)包括兩層,其一為特征提取層,每個(gè)神經(jīng)元的輸入與前一層的局部接受域相連,并提取該局部的特征。一旦該局部特征被提取后,它與其它特征間的位置關(guān)系也隨之確定下來;其二是特征映射層,網(wǎng)絡(luò)的每個(gè)計(jì)算層由多個(gè)特征映射組成,每個(gè)特征映射是一個(gè)平面,平面上所有神經(jīng)元的權(quán)值相等。特征映射結(jié)構(gòu)采用影響函數(shù)核小的sigmoid函數(shù)作為卷積網(wǎng)絡(luò)的激活函數(shù),使得特征映射具有位移不變性。此外,由于一個(gè)映射面上的神經(jīng)元共享權(quán)值,因而減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù)。卷積神經(jīng)網(wǎng)絡(luò)中的每一個(gè)卷積層都緊跟著一個(gè)用來求局部平均與二次提取的計(jì)算層,這種特有的兩次特征提取結(jié)構(gòu)減小了特征分辨率。

cnn主要用來識別位移、縮放及其他形式扭曲不變性的二維圖形。由于cnn的特征檢測層通過訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí),所以在使用cnn時(shí),避免了顯示的特征抽取,而隱式地從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí);再者由于同一特征映射面上的神經(jīng)元權(quán)值相同,所以網(wǎng)絡(luò)可以并行學(xué)習(xí),這也是卷積網(wǎng)絡(luò)相對于神經(jīng)元彼此相連網(wǎng)絡(luò)的一大優(yōu)勢。卷積神經(jīng)網(wǎng)絡(luò)以其局部權(quán)值共享的特殊結(jié)構(gòu)在語音識別和圖像處理方面有著獨(dú)特的優(yōu)越性,其布局更接近于實(shí)際的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享降低了網(wǎng)絡(luò)的復(fù)雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò)這一特點(diǎn)避免了特征提取和分類過程中數(shù)據(jù)重建的復(fù)雜度。

在本發(fā)明一種優(yōu)選實(shí)施例中,可以通過訓(xùn)練樣本圖像數(shù)據(jù)成卷積神經(jīng)網(wǎng)絡(luò)模型,然后采用卷積神經(jīng)網(wǎng)絡(luò)模型來實(shí)現(xiàn)步驟202。

其中,卷積神經(jīng)網(wǎng)絡(luò)模型是一種模仿生物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型,卷積神經(jīng)網(wǎng)絡(luò)模型具體可以采用如下方式生成:

獲取樣本圖像數(shù)據(jù),所述樣本圖像數(shù)據(jù)包括多個(gè)運(yùn)算關(guān)系類型對應(yīng)的樣本圖像數(shù)據(jù);分別對每個(gè)運(yùn)算關(guān)系類型對應(yīng)的樣本圖像數(shù)據(jù)進(jìn)行訓(xùn)練,得到卷積神經(jīng)網(wǎng)絡(luò)模型,所述卷積神經(jīng)網(wǎng)絡(luò)模型以每個(gè)運(yùn)算關(guān)系類型對應(yīng)的權(quán)重系數(shù)作為卷積核。

在本發(fā)明實(shí)施例中,可以將已經(jīng)確定運(yùn)算關(guān)系類型的圖像數(shù)據(jù)作為樣本圖像數(shù)據(jù),樣本圖像數(shù)據(jù)可以包括數(shù)學(xué)公式的主要公式形式,在搭建好的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練機(jī)對樣本圖像數(shù)據(jù)進(jìn)行訓(xùn)練,得到能夠?qū)D像數(shù)據(jù)中各種數(shù)學(xué)公式進(jìn)行分類的卷積神經(jīng)網(wǎng)絡(luò)分類算法,即卷積神經(jīng)網(wǎng)絡(luò)模型。

實(shí)際上,本發(fā)明實(shí)施例可以對屬于同一運(yùn)算關(guān)系類型的樣本圖像數(shù)據(jù)進(jìn)行訓(xùn)練,得到與該運(yùn)算關(guān)系類型對應(yīng)的權(quán)重系數(shù),而且權(quán)重系數(shù)是符合預(yù)置的精確度要求的。在獲得每個(gè)運(yùn)算關(guān)系類型對應(yīng)的權(quán)重系數(shù)之后,將權(quán)重系數(shù)作為卷積核,生成卷積神經(jīng)網(wǎng)絡(luò)模型。

在生成卷積神經(jīng)網(wǎng)絡(luò)模型之后,步驟202可以包括如下子步驟:

子步驟s11,將所述圖像數(shù)據(jù)輸入預(yù)先生成的卷積神經(jīng)網(wǎng)絡(luò)模型,經(jīng)由所述卷積神經(jīng)網(wǎng)絡(luò)模型識別出所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及,根據(jù)所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型將所述圖像數(shù)據(jù)劃分后得到的一個(gè)或多個(gè)特征區(qū)域。

在本發(fā)明實(shí)施例中,本發(fā)明實(shí)施例可以將接收的圖像數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)模型,卷積神經(jīng)網(wǎng)絡(luò)模型可以識別出圖像數(shù)據(jù)中包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,即識別出與圖像數(shù)據(jù)中的數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型。

具體的,卷積神經(jīng)網(wǎng)絡(luò)模型可以采用如下方式識別出圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型:

分別采用預(yù)置的多種運(yùn)算關(guān)系類型的權(quán)重系數(shù)作為卷積核,對所述圖像數(shù)據(jù)進(jìn)行卷積操作,得到所述圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率;基于所述圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率,確定所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型。

在本發(fā)明實(shí)施例中,將圖像數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)模型之后,卷積神經(jīng)網(wǎng)絡(luò)模型可以采用卷積核對圖像數(shù)據(jù)進(jìn)行卷積操作,經(jīng)過多層卷積核、池化和softmax分類器,得到圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率,從而確定圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型。

實(shí)際上,圖像數(shù)據(jù)由多個(gè)區(qū)域組成,卷積神經(jīng)網(wǎng)絡(luò)模型可以分別采用每個(gè)運(yùn)算關(guān)系類型的權(quán)重系數(shù)對圖像數(shù)據(jù)進(jìn)行卷積一次,得到圖像數(shù)據(jù)中各個(gè)區(qū)域在每個(gè)運(yùn)算關(guān)系類型的權(quán)重系數(shù)進(jìn)行卷積的概率。

針對圖像數(shù)據(jù)的每個(gè)區(qū)域,從每個(gè)運(yùn)算關(guān)系類型的權(quán)重系數(shù)對其進(jìn)行卷積的概率中確定最大的概率,將最大的概率對應(yīng)的運(yùn)算關(guān)系類型作為該區(qū)域的運(yùn)算關(guān)系類型。

在確定圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型之后,本發(fā)明實(shí)施例還可以按照運(yùn)算關(guān)系類型對圖像數(shù)據(jù)進(jìn)行劃分,在劃分后可以得到的每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域,如圖3可以分為三個(gè)特征區(qū)域,分別是:長方形框中的數(shù)字或變量對應(yīng)的特征區(qū)域,圓角長方形框中的分?jǐn)?shù)對應(yīng)的特征區(qū)域、橢圓形框中開方對應(yīng)的特征區(qū)域。

步驟203,識別所述一個(gè)或多個(gè)特征區(qū)域,得到一個(gè)或多個(gè)公式元素;

在確定每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域之后,本發(fā)明實(shí)施例可以識別每個(gè)特征區(qū)域,得到與每個(gè)特征區(qū)域?qū)?yīng)的一個(gè)或多個(gè)公式元素。

其中,運(yùn)算關(guān)系類型可以具有對應(yīng)的結(jié)構(gòu)關(guān)系,如開方具有左上半包含結(jié)構(gòu)關(guān)系、分?jǐn)?shù)具有上下結(jié)構(gòu)關(guān)系(即分式的上面為分子,分式的下面為分母)。

特征區(qū)域可以包括單一區(qū)域和/或混合區(qū)域,單一區(qū)域可以包括數(shù)字或變量對應(yīng)的特征區(qū)域,如“1”、“a”,混合區(qū)域可以包括數(shù)字或變量以及一個(gè)或多個(gè)至少以下運(yùn)算符對應(yīng)的特征區(qū)域:分?jǐn)?shù)運(yùn)算符、開方運(yùn)算符、極限運(yùn)算符、乘積運(yùn)算符,如

應(yīng)用在本發(fā)明實(shí)施例中,則步驟203還可以包括如下子步驟:

子步驟s21,基于所述每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,將所述單一區(qū)域作為一個(gè)基本單元,以及,對所述混合區(qū)域進(jìn)行拆分,得到一個(gè)或多個(gè)基本單元;

在本發(fā)明實(shí)施例中,可以采用建立好的子結(jié)構(gòu)拆分算法對特征區(qū)域進(jìn)行拆分,使其能夠?qū)⒏魈卣鲄^(qū)域分解為一個(gè)或多個(gè)基本單元,即數(shù)字或變量對應(yīng)的區(qū)域,采用子結(jié)構(gòu)拆分算法進(jìn)行拆分具體可以如下:

針對單一區(qū)域,即數(shù)字或變量對應(yīng)的特征區(qū)域,可以不進(jìn)行拆分,直接將每個(gè)單一區(qū)域都作為一個(gè)基本單元。

針對混合區(qū)域,即數(shù)字或變量以及一個(gè)或多個(gè)運(yùn)算符對應(yīng)的特征區(qū)域,由于每個(gè)運(yùn)算關(guān)系類型對應(yīng)的混合區(qū)域都有特定的運(yùn)算符以及數(shù)字或變量的結(jié)構(gòu)關(guān)系,即一種位置上的關(guān)系,如“加法”為左中右結(jié)構(gòu),本發(fā)明實(shí)施例按照結(jié)構(gòu)關(guān)系對混合區(qū)域進(jìn)行拆分,得到一個(gè)或多個(gè)數(shù)字或變量對應(yīng)的區(qū)域,在將每個(gè)數(shù)字或變量對應(yīng)的區(qū)域作為一個(gè)基本單元。

子步驟s22,采用預(yù)設(shè)的光學(xué)字符識別算法識別所述一個(gè)或多個(gè)基本單元,得到一個(gè)或多個(gè)公式元素。

在本發(fā)明實(shí)施例中,可以采用建立好的光學(xué)字符識別(opticalcharacterrecognition,ocr)算法識別一個(gè)或多個(gè)基本單元,即識別數(shù)字或變量對應(yīng)的區(qū)域,得到一個(gè)或多個(gè)公式元素。

其中,ocr指電子設(shè)備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計(jì)算機(jī)文字的過程;即,針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。

作為一種示例,ocr算法可以包括采用cnn、knn(k-nearestneighbor,k最鄰近分類算法)、svm(supportvectormachine,支持向量機(jī))算法對混合區(qū)域進(jìn)行拆分為最小的基本單元,如取連續(xù)筆跡圖像的質(zhì)心,以該質(zhì)心為中心,找一條閉合曲線,能夠包圍當(dāng)前連續(xù)筆跡圖像上任意像素點(diǎn),且與混合區(qū)域的另一部分無交集,該曲線可能有無窮多個(gè),本發(fā)明實(shí)施例可以選取其中任意一條對混合區(qū)域進(jìn)行拆分并識別。

其中,knn算法的核心思想是如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。該方法在確定分類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來決定待分樣本所屬的類別。knn方法在類別決策時(shí),只與極少量的相鄰樣本有關(guān)。由于knn方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,knn方法較其他方法更為適合。

svm是通過一個(gè)非線性映射p,把樣本空間映射到一個(gè)高維乃至無窮維的特征空間中(hilbert空間),使得在原來的樣本空間中非線性可分的問題轉(zhuǎn)化為在特征空間中的線性可分的問題.簡單地說,就是升維和線性化.升維,就是把樣本向高維空間做映射,一般情況下這會增加計(jì)算的復(fù)雜性,甚至?xí)稹熬S數(shù)災(zāi)難”,因而人們很少問津.但是作為分類、回歸等問題來說,很可能在低維樣本空間無法線性處理的樣本集,在高維特征空間中卻可以通過一個(gè)線性超平面實(shí)現(xiàn)線性劃分(或回歸).一般的升維都會帶來計(jì)算的復(fù)雜化,svm方法巧妙地解決了這個(gè)難題:應(yīng)用核函數(shù)的展開定理,就不需要知道非線性映射的顯式表達(dá)式;由于是在高維特征空間中建立線性學(xué)習(xí)機(jī),所以與線性模型相比,不但幾乎不增加計(jì)算的復(fù)雜性,而且在某種程度上避免了“維數(shù)災(zāi)難”.這一切要?dú)w功于核函數(shù)的展開和計(jì)算理論。

本發(fā)明實(shí)施例在充分利用cnn的圖像數(shù)據(jù)分類優(yōu)勢和ocr識別數(shù)字或變量的優(yōu)勢,同時(shí)又考慮到了運(yùn)算關(guān)系類型的結(jié)構(gòu)關(guān)系,極大地減少了識別數(shù)學(xué)運(yùn)算符號可能帶來的識別錯(cuò)誤,子結(jié)構(gòu)拆分算法利用運(yùn)算關(guān)系類型的結(jié)構(gòu)關(guān)系,簡單高效地拆分,識別的數(shù)字或變量,而運(yùn)算關(guān)系類型對應(yīng)的運(yùn)算符只需要將補(bǔ)充到識別的數(shù)字或變量對應(yīng)位置即可。

步驟204,結(jié)合所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將所述一個(gè)或多個(gè)公式元素組織成與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在獲得與數(shù)學(xué)公式信息對應(yīng)的一個(gè)或多個(gè)公式元素之后,本發(fā)明實(shí)施例可以結(jié)合一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將一個(gè)或多個(gè)公式元素組織成與數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在本發(fā)明的一種優(yōu)選實(shí)施例中,步驟204還可以包括如下子步驟:

子步驟s31,基于所述每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,確定所述每個(gè)公式元素的位置信息;

由于每個(gè)運(yùn)算關(guān)系類型都具有對應(yīng)的結(jié)構(gòu)關(guān)系,本發(fā)明實(shí)施例可以基于每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,確定每個(gè)公式元素的位置信息,如圖3中“a”對應(yīng)的特征區(qū)域位于“+”對應(yīng)的特征區(qū)域的的左邊。

子步驟s32,將所述每個(gè)公式元素放置在所述每個(gè)公式元素的位置信息對應(yīng)的位置,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在確定每個(gè)公式元素的位置信息之后,將每個(gè)公式元素放置在每個(gè)公式元素的位置信息對應(yīng)的位置,則可以得到與數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式,如圖3中,在識別“a”對應(yīng)的區(qū)域?yàn)樽兞俊癮”后,將變量“a”放置在加號“+”的左邊。

在本發(fā)明的一種優(yōu)選實(shí)施例中,子步驟s32還可以包括如下子步驟:

子步驟s3211,針對混合區(qū)域,確定混合區(qū)域?qū)?yīng)的公式元素,結(jié)合所述混合區(qū)域?qū)?yīng)的公式元素的位置信息以及所述混合區(qū)域所包含的運(yùn)算關(guān)系類型,將所述混合區(qū)域?qū)?yīng)的公式元素組織成子公式;

由于混合區(qū)域是數(shù)字或變量以及一個(gè)或多個(gè)運(yùn)算符對應(yīng)的區(qū)域,是相互嵌套的結(jié)構(gòu),混合區(qū)域可以包含多個(gè)運(yùn)算關(guān)系類型。

針對每個(gè)運(yùn)算關(guān)系類型,確定與其對應(yīng)的公式元素及公式元素的位置信息,按照運(yùn)算關(guān)系類型的結(jié)構(gòu)關(guān)系將公式元素組織成子公式。

子步驟s3212,針對單一區(qū)域,確定單一區(qū)域?qū)?yīng)的公式元素,將所述單一區(qū)域?qū)?yīng)的公式元素作為子公式;

由于單一區(qū)域是數(shù)字或變量對應(yīng)的特征區(qū)域,是組成數(shù)學(xué)公式最基本的結(jié)構(gòu),直接將單一區(qū)域?qū)?yīng)的公式元素作為組成數(shù)學(xué)公式的子公式。

子步驟s322,對所有特征區(qū)域?qū)?yīng)的子公式進(jìn)行組合,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在獲得所有特征區(qū)域?qū)?yīng)的子公式之后,對子公式進(jìn)行組合,得到數(shù)學(xué)公式。在識別出數(shù)學(xué)公式之后,本發(fā)明實(shí)施例可以將數(shù)學(xué)公式進(jìn)行錄入并展現(xiàn)給用戶。

需要說明的是,由于在手寫的數(shù)學(xué)公式信息識別過程中,每個(gè)步驟處理都可能產(chǎn)生錯(cuò)誤,本發(fā)明實(shí)施例可以進(jìn)行集中的系統(tǒng)糾錯(cuò),對可能產(chǎn)生的各種錯(cuò)誤進(jìn)行邏輯關(guān)系的分析和糾正處理,也可以通過改善人機(jī)交互的方式來增加用戶的糾錯(cuò),提升識別的準(zhǔn)確性。

為了是本領(lǐng)域技術(shù)人員能夠更好地理解本發(fā)明實(shí)施例,以下通過一個(gè)例子對本發(fā)明實(shí)施例加以示例性說明,但應(yīng)當(dāng)理解的是,本發(fā)明實(shí)施例并不限于此。

如圖4為用戶手寫的數(shù)學(xué)公式,采用本發(fā)明實(shí)施例的識別過程如下:

1)將圖像數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)模型;

2)采用卷積神經(jīng)網(wǎng)絡(luò)模型對整個(gè)圖像數(shù)據(jù)進(jìn)行分類,確定標(biāo)“1”的特征區(qū)域?qū)儆诩臃愋?,?biāo)“2”的特征區(qū)域?qū)儆诜质筋愋?根式、數(shù)字或變量的分類過程類似,圖中未作標(biāo)識);

3)對標(biāo)“1”的特征區(qū)域,按照加法類型對應(yīng)的“左中右”的結(jié)構(gòu)關(guān)系進(jìn)行拆分,如取“a”的質(zhì)心點(diǎn),作曲線“k1”,以“+”的質(zhì)心點(diǎn),作曲線“k2”,從而按曲線“k1”“k2”對圖像數(shù)據(jù)進(jìn)行拆分,得到基本單元“a”;

對分式類型、根式類型對應(yīng)的特征區(qū)域也進(jìn)行拆分,得到基本單元“2”、“x”;

4)對基本單元“a”、“2”、“x”采用ocr進(jìn)行識別,得到對應(yīng)的公式元素;

5)確定每個(gè)公式元素的位置信息,將公式元素重新組合成子公式,再將子公式組成數(shù)學(xué)公式,如下:

6)將數(shù)學(xué)公式返回用戶,供用戶選擇和糾錯(cuò)。

在本發(fā)明實(shí)施例中,通過接收輸入的包括手寫的數(shù)學(xué)公式信息的圖像數(shù)據(jù),并確定與數(shù)學(xué)公式信息匹配的運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域,識別特征區(qū)域而得到公式元素,最后結(jié)合運(yùn)算關(guān)系類型,將公式元素組織成與數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式,從而實(shí)現(xiàn)對手寫數(shù)學(xué)公式的準(zhǔn)確識別,并且在識別過程中充分利用了數(shù)學(xué)公式的結(jié)構(gòu)性質(zhì),降低了字符識別的難度,優(yōu)化了整個(gè)識別過程的效果和流程,提升了對手寫數(shù)學(xué)公式識別的精確性和識別速度,為用戶提供更加精準(zhǔn)、簡便、快捷的數(shù)學(xué)公式輸入體驗(yàn)。

需要說明的是,對于方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作并不一定是本發(fā)明實(shí)施例所必須的。

參照圖5,示出了本發(fā)明實(shí)施例的一種數(shù)學(xué)公式識別的裝置的結(jié)構(gòu)框圖,具體可以包括如下模塊:

接收模塊501,用于接收輸入的圖像數(shù)據(jù),所述圖像數(shù)據(jù)的內(nèi)容包括手寫的數(shù)學(xué)公式信息;

確定模塊502,用于確定與所述數(shù)學(xué)公式信息匹配的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的一個(gè)或多個(gè)特征區(qū)域;

識別模塊503,用于識別所述一個(gè)或多個(gè)特征區(qū)域,得到一個(gè)或多個(gè)公式元素;

組織模塊504,用于結(jié)合所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型,將所述一個(gè)或多個(gè)公式元素組織成與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在本發(fā)明的一種優(yōu)選實(shí)施例中,確定模塊502可以包括如下子模塊:

模型處理子模塊,用于將所述圖像數(shù)據(jù)輸入預(yù)先生成的卷積神經(jīng)網(wǎng)絡(luò)模型,經(jīng)由所述卷積神經(jīng)網(wǎng)絡(luò)模型識別出所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型,以及,根據(jù)所述一個(gè)或多個(gè)運(yùn)算關(guān)系類型將所述圖像數(shù)據(jù)劃分后得到的一個(gè)或多個(gè)特征區(qū)域。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述卷積神經(jīng)網(wǎng)絡(luò)模型可以采用如下方式識別出所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型:

分別采用預(yù)置的多種運(yùn)算關(guān)系類型的權(quán)重系數(shù)作為卷積核,對所述圖像數(shù)據(jù)進(jìn)行卷積操作,得到所述圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率;基于所述圖像數(shù)據(jù)在各個(gè)運(yùn)算關(guān)系類型中的概率,確定所述圖像數(shù)據(jù)中所包含的一個(gè)或多個(gè)運(yùn)算關(guān)系類型。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述運(yùn)算關(guān)系類型具有對應(yīng)的結(jié)構(gòu)關(guān)系,所述特征區(qū)域包括單一區(qū)域和/或混合區(qū)域,所述識別模塊503可以包括如下子模塊:

基本單元獲得子模塊,用于基于所述每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,將所述單一區(qū)域作為一個(gè)基本單元,以及,對所述混合區(qū)域進(jìn)行拆分,得到一個(gè)或多個(gè)基本單元;

基本單元識別子模塊,用于采用預(yù)設(shè)的光學(xué)字符識別算法識別所述一個(gè)或多個(gè)基本單元,得到一個(gè)或多個(gè)公式元素。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述組織模塊504可以包括如下子模塊:

位置信息確定子模塊,用于基于所述每個(gè)運(yùn)算關(guān)系類型對應(yīng)的結(jié)構(gòu)關(guān)系,確定所述每個(gè)公式元素的位置信息;

公式元素放置子模塊,用于將所述每個(gè)公式元素放置在所述每個(gè)公式元素的位置信息對應(yīng)的位置,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述公式元素放置子模塊可以包括如下單元:

子公式組織單元,用于針對混合區(qū)域,確定混合區(qū)域?qū)?yīng)的公式元素,結(jié)合所述混合區(qū)域?qū)?yīng)的公式元素的位置信息以及所述混合區(qū)域所包含的運(yùn)算關(guān)系類型,將所述混合區(qū)域?qū)?yīng)的公式元素組織成子公式;

子公式為單元,用于針對單一區(qū)域,確定單一區(qū)域?qū)?yīng)的公式元素,將所述單一區(qū)域?qū)?yīng)的公式元素作為子公式;

子公式組合單元,用于對所有特征區(qū)域?qū)?yīng)的子公式進(jìn)行組合,得到與所述數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述卷積神經(jīng)網(wǎng)絡(luò)模型采用如下方式生成:

獲取樣本圖像數(shù)據(jù),所述樣本圖像數(shù)據(jù)包括多個(gè)運(yùn)算關(guān)系類型對應(yīng)的樣本圖像數(shù)據(jù);分別對每個(gè)運(yùn)算關(guān)系類型對應(yīng)的樣本圖像數(shù)據(jù)進(jìn)行訓(xùn)練,得到卷積神經(jīng)網(wǎng)絡(luò)模型,所述卷積神經(jīng)網(wǎng)絡(luò)模型以每個(gè)運(yùn)算關(guān)系類型對應(yīng)的權(quán)重系數(shù)作為卷積核。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述數(shù)學(xué)公式信息的輸入方式至少包括:手寫輸入設(shè)備、鼠標(biāo)輸入。

在本發(fā)明的一種優(yōu)選實(shí)施例中,所述單一區(qū)域包括數(shù)字或變量對應(yīng)的特征區(qū)域,所述混合區(qū)域包括數(shù)字或變量以及一個(gè)或多個(gè)至少以下運(yùn)算符對應(yīng)的特征區(qū)域:

分?jǐn)?shù)運(yùn)算符、開方運(yùn)算符、極限運(yùn)算符、乘積運(yùn)算符。

在本發(fā)明實(shí)施例中,通過接收輸入的包括手寫的數(shù)學(xué)公式信息的圖像數(shù)據(jù),并確定與數(shù)學(xué)公式信息匹配的運(yùn)算關(guān)系類型,以及與每個(gè)運(yùn)算關(guān)系類型對應(yīng)的特征區(qū)域,識別特征區(qū)域而得到公式元素,最后結(jié)合運(yùn)算關(guān)系類型,將公式元素組織成與數(shù)學(xué)公式信息對應(yīng)的數(shù)學(xué)公式,從而實(shí)現(xiàn)對手寫數(shù)學(xué)公式的準(zhǔn)確識別,并且在識別過程中充分利用了數(shù)學(xué)公式的結(jié)構(gòu)性質(zhì),降低了字符識別的難度,優(yōu)化了整個(gè)識別過程的效果和流程,提升了對手寫數(shù)學(xué)公式識別的精確性和識別速度,為用戶提供更加精準(zhǔn)、簡便、快捷的數(shù)學(xué)公式輸入體驗(yàn)。

對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。

本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明實(shí)施例的實(shí)施例可提供為方法、裝置、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明實(shí)施例可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明實(shí)施例可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本發(fā)明實(shí)施例是參照根據(jù)本發(fā)明實(shí)施例的方法、終端設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲器中,使得存儲在該計(jì)算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

盡管已描述了本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明實(shí)施例范圍的所有變更和修改。

最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。

以上對本發(fā)明所提供的一種數(shù)學(xué)公式識別方法和裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
杨浦区| 右玉县| 英德市| 台安县| 海兴县| 隆昌县| 揭阳市| 临沭县| 鹤壁市| 长岭县| 女性| 张掖市| 额尔古纳市| 封丘县| 邢台市| 中西区| 贡觉县| 金阳县| 阳西县| 富川| 苍梧县| 盖州市| 苍南县| 北流市| 乐安县| 临武县| 昂仁县| 徐闻县| 镇平县| 望谟县| 奉贤区| 台湾省| 长春市| 托克托县| 开江县| 新竹县| 南投县| 河津市| 航空| 南平市| 蓬溪县|