两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

字符串模糊匹配方法及裝置的制造方法

文檔序號(hào):10655342閱讀:263來源:國知局
字符串模糊匹配方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種字符串模糊匹配方法,所述字符串模糊匹配方法包括以下步驟:獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度;根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值;獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。本發(fā)明還公開了一種字符串模糊匹配裝置。本發(fā)明解決了采用的精確查找的方式查找匹配的目標(biāo)字符串的精確度低的問題,提高了字符串的識(shí)別率。
【專利說明】
字符串模糊匹配方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種字符串模糊匹配方法及裝置?!颈尘凹夹g(shù)】
[0002]現(xiàn)有的數(shù)據(jù)查找過程中,通常使用精確匹配算法進(jìn)行查找操作,如文本編輯中的查找替換,數(shù)據(jù)庫中按索引進(jìn)行檢索等,其匹配要求嚴(yán)格準(zhǔn)確,實(shí)現(xiàn)算法有帶回溯的匹配算法、KMP算法等。然而,采用精確匹配算法查找數(shù)據(jù)時(shí),需要待查找的數(shù)據(jù)與目標(biāo)數(shù)據(jù)完全相同時(shí),才能將待查找數(shù)據(jù)從目標(biāo)數(shù)據(jù)中找出。在一些場合下,人們往往不能準(zhǔn)確地給出完整的待查找數(shù)據(jù)(待查找字符串),如果采用精確匹配算法,由于精確匹配算法需要待查找字符串與目標(biāo)字符串完全一樣時(shí),才能匹配成功,因此,在這種場合下使用精確匹配算法就得不到查找結(jié)果,造成查找字符串的識(shí)別率較低。
【發(fā)明內(nèi)容】

[0003]本發(fā)明的主要目的在于提供一種字符串模糊匹配方法及裝置,旨在解決現(xiàn)有技術(shù)采用精確匹配方法查找字符串的識(shí)別率較低的問題。
[0004]為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種字符串模糊匹配方法,所述字符串模糊匹配方法包括以下步驟:
[0005]獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;
[0006]根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度;
[0007]根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值;
[0008]獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。
[0009]可選地,所述獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本的步驟包括:
[0010]根據(jù)計(jì)算得出的各個(gè)目標(biāo)文本的源匹配度確定源匹配度最高的目標(biāo)文本;
[0011]判斷所述源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值;
[0012]若是,則將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本。
[0013]可選地,所述匹配的目標(biāo)文本存在多個(gè)時(shí),所述將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本的步驟之后,還包括:
[0014]根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算各個(gè)所述匹配的目標(biāo)文本的目標(biāo)匹配度,并根據(jù)計(jì)算結(jié)果確定目標(biāo)匹配度最高的目標(biāo)文本;
[0015]將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。
[0016]可選地,所述將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本的步驟包括:
[0017]根據(jù)所述第一預(yù)設(shè)閾值獲取所述源文本對(duì)應(yīng)的第二預(yù)設(shè)閾值;
[0018]判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或者等于所述第二預(yù)設(shè)閾值;[〇〇19]若是,則將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。
[0020]可選地,所述獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量的步驟包括:[0021 ]將所述源文本和所述各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息;
[0022]獲取所述各個(gè)目標(biāo)文本對(duì)應(yīng)的拼音形式的字符信息與所述源文本對(duì)應(yīng)的拼音形式的字符信息匹配的字符數(shù)量。[〇〇23]此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種字符串模糊匹配裝置,所述字符串模糊匹配裝置包括:
[0024]獲取模塊,用于獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;
[0025]第一計(jì)算模塊,用于根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度;
[0026]所述獲取模塊,還用于根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值;
[0027]第一作為模塊,用于獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。[〇〇28]可選地,所述第一作為模塊包括:
[0029]確定單元,用于根據(jù)計(jì)算得出的各個(gè)目標(biāo)文本的源匹配度確定源匹配度最高的目標(biāo)文本;
[0030]第一判斷單元,用于判斷所述源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值;
[0031]第一作為單元,用于若所述源匹配度最高的目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值,則將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本。
[0032]可選地,所述匹配的目標(biāo)文本存在多個(gè)時(shí),所述字符串模糊匹配裝置還包括:
[0033]第二計(jì)算模塊,用于根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算各個(gè)匹配的所述目標(biāo)文本的目標(biāo)匹配度,并根據(jù)計(jì)算結(jié)果確定目標(biāo)匹配度最高的目標(biāo)文本;
[0034]第二作為模塊,還用于將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。[〇〇35]可選地,所述第二作為模塊包括:[〇〇36]獲取單元,用于根據(jù)所述第一預(yù)設(shè)閾值獲取所述源文本對(duì)應(yīng)的第二預(yù)設(shè)閾值;
[0037]第二判斷單元,用于判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或者等于所述第二預(yù)設(shè)閾值;
[0038]第二作為單元,用于若確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度大于或者等于所述第二預(yù)設(shè)閾值,則將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。[〇〇39]可選地,所述獲取模塊包括:
[0040]轉(zhuǎn)換單元,用于將所述源文本和所述各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息;[0041 ]獲取單元,用于獲取所述各個(gè)目標(biāo)文本對(duì)應(yīng)的拼音形式的字符信息與所述源文本對(duì)應(yīng)的拼音形式的字符信息匹配的字符數(shù)量。
[0042]本發(fā)明通過獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;根據(jù)所述字符數(shù)量計(jì)算所述各個(gè)目標(biāo)文本的源匹配度;依次判斷所述各個(gè)目標(biāo)文本的源匹配度是否滿足第一預(yù)設(shè)條件;若是,則將滿足第一預(yù)設(shè)條件的目標(biāo)文本作為匹配的目標(biāo)文本。由于本實(shí)施例采用的是模糊匹配的方式查找匹配的目標(biāo)文本,而不是采用的精確查找的方式查找匹配的目標(biāo)文本,從而有效提尚了字符串的識(shí)別率?!靖綀D說明】
[0043]圖1為本發(fā)明字符串模糊匹配方法的第一實(shí)施例的流程示意圖;
[0044]圖2為本發(fā)明字符串模糊匹配方法的第二實(shí)施例的流程示意圖;
[0045]圖3為本發(fā)明字符串模糊匹配方法的第三實(shí)施例的流程示意圖;
[0046]圖4為本發(fā)明字符串模糊匹配方法的第四實(shí)施例的流程示意圖;
[0047]圖5為本發(fā)明字符串模糊匹配方法的第五實(shí)施例的流程示意圖;
[0048]圖6為本發(fā)明字符串模糊匹配裝置的第一實(shí)施例的功能模塊示意圖;
[0049]圖7為本發(fā)明字符串模糊匹配裝置的第二實(shí)施例的功能模塊示意圖;
[0050]圖8為本發(fā)明字符串模糊匹配裝置的第三實(shí)施例的功能模塊示意圖;
[0051]圖9為本發(fā)明字符串模糊匹配裝置的第四實(shí)施例的功能模塊示意圖;[〇〇52]圖10為本發(fā)明字符串模糊匹配裝置的第五實(shí)施例的功能模塊示意圖。
[0053]本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明?!揪唧w實(shí)施方式】[〇〇54]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0055]基于上述問題,本發(fā)明提供一種字符串模糊匹配方法。
[0056]參照?qǐng)D1,圖1為本發(fā)明字符串模糊匹配方法的第一實(shí)施例的流程示意圖。[〇〇57]在本實(shí)施例中,所述字符串模糊匹配方法包括:
[0058]步驟S10,獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;
[0059]在本實(shí)施中,所述源文本為用戶輸入的文本,所述源文本可以為語音文本、中文文本或者拼音文本。所述各個(gè)目標(biāo)文本為用于和源文本匹配的文本,所述各個(gè)目標(biāo)文本也可以為語音文本、中文文本或者拼音文本。在接收到用戶輸入的源文本后,系統(tǒng)將接收到的源文本與本地預(yù)存的各個(gè)目標(biāo)文本進(jìn)行匹配操作,查找源文本與各個(gè)目標(biāo)文本相匹配的字符,即查找所述各個(gè)目標(biāo)文本中的字符與源文本中的字符一致的字符,然后統(tǒng)計(jì)各個(gè)目標(biāo)文本與源文本匹配的字符數(shù)量。
[0060]步驟S20,根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度;
[0061]在獲取到各個(gè)目標(biāo)文本與源文本匹配的字符數(shù)量后,可以根據(jù)該字符數(shù)量與源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度,所述源匹配度為所述匹配的字符數(shù)量與源文本的字符數(shù)量的百分比,即所述源匹配度=匹配字符數(shù)量/源文本的字符數(shù)量*100%。例如,假設(shè)所述源文本字符數(shù)量為8個(gè)字符,各個(gè)目標(biāo)文本與所述源文本匹配的字符數(shù)量分別為5個(gè)字符,4個(gè)字符,6個(gè)字符,1個(gè)字符,0個(gè)字符等,則各個(gè)目標(biāo)文本的源匹配度依次為 62.5%、50.0%、75.0%、12.5%、0 等。[〇〇62]步驟S30,根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值;[〇〇63]步驟S40,獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。
[0064]在獲取到各個(gè)目標(biāo)文本的源匹配度后,為了篩選出匹配的目標(biāo)文本,可以通過依次判斷所述各個(gè)目標(biāo)文本的源匹配度是否大于或等于第一預(yù)設(shè)閾值的方式來查找匹配的目標(biāo)文本,若目標(biāo)文本的源匹配度大于或等于第一預(yù)設(shè)閾值的目標(biāo)文本只有一個(gè),則將該源匹配度大于或等于第一預(yù)設(shè)閾值目標(biāo)文本作為匹配的目標(biāo)文本,若源匹配度大于或等于第一預(yù)設(shè)閾值目標(biāo)文本存在多個(gè),則將所有的源匹配度大于或等于第一預(yù)設(shè)閾值目標(biāo)文本都作為匹配的目標(biāo)文本;若目標(biāo)文本的源匹配度小于第一預(yù)設(shè)閾值,則該目標(biāo)文本不是與源文本所匹配的目標(biāo)文本,即該目標(biāo)文本與所述源文本不匹配。在本實(shí)施例中,所述第一預(yù)設(shè)閾值與源文本的字段數(shù)量有關(guān),即不同字段數(shù)量的源文本對(duì)應(yīng)著不同的第一預(yù)設(shè)閾值, 其中,所述字段數(shù)量為源文本中的中文字符數(shù)量。故在判斷目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值之前,需要先確定源文本的字段數(shù)量,然后根據(jù)源文本的字段數(shù)量獲取源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值。具體來說,所述第一預(yù)設(shè)閾值可以根據(jù)源文本的字段數(shù)量進(jìn)行設(shè)置。例如,若源文本的字段數(shù)量為小于或等于2個(gè),則可以設(shè)置第一預(yù)設(shè)閾值為 1,該第一預(yù)設(shè)閾值為1代表該目標(biāo)文本的源匹配度為100%時(shí),該目標(biāo)文本才與源文本匹配;若源文本的字段數(shù)量大于2,即源文本中的中文字符數(shù)量多于2個(gè),則可以設(shè)置第一預(yù)設(shè)閾值為0.67,該第一預(yù)設(shè)閾值為0.67代表該目標(biāo)文本的源匹配度為67%或以上時(shí),該目標(biāo)文本與源文本才匹配。需要說明的是,上述所述的三個(gè)值可以根據(jù)實(shí)際需要自由設(shè)定和動(dòng)態(tài)調(diào)整,也可以根據(jù)實(shí)際需要設(shè)置更多個(gè)第一預(yù)設(shè)閾值,在本實(shí)施例中,不做限定。比如在語音應(yīng)用中,在源文本字段數(shù)量超過2個(gè)時(shí)設(shè)置第一預(yù)設(shè)閾值為0.67,在源文本字段數(shù)量小于或等于兩個(gè)時(shí)設(shè)置第一預(yù)設(shè)閾值為1,即如果用戶說了一個(gè)或者兩個(gè)字,就必須全部匹配至IJ,如果說了三個(gè)字及以上,必須匹配到2/3以上。
[0065]本實(shí)施例通過獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;根據(jù)所述字符數(shù)量計(jì)算所述各個(gè)目標(biāo)文本的源匹配度;依次判斷所述各個(gè)目標(biāo)文本的源匹配度是否滿足第一預(yù)設(shè)條件;若是,則將滿足第一預(yù)設(shè)條件的目標(biāo)文本作為匹配的目標(biāo)文本。由于本實(shí)施例采用的是模糊匹配的方式查找匹配的目標(biāo)文本,而不是采用的精確查找的方式查找匹配的目標(biāo)文本,從而有效提尚了字符串的識(shí)別率。
[0066]進(jìn)一步的,參照?qǐng)D2,圖2為本發(fā)明字符串模糊匹配方法的第二實(shí)施例的流程示意圖?;谏鲜鲎址:ヅ浞椒ǖ牡谝粚?shí)施例,所述步驟S40包括:
[0067]步驟S41,根據(jù)計(jì)算得出的各個(gè)目標(biāo)文本的源匹配度確定源匹配度最高的目標(biāo)文本;
[0068]在計(jì)算出各個(gè)目標(biāo)文本的源匹配度后,可以通過比較各個(gè)目標(biāo)文本的源匹配度, 然后從中選擇出源匹配度最高的目標(biāo)文本。需要說明的是,若源匹配度最高的目標(biāo)文本存在多個(gè),則需要將該多個(gè)源匹配度最高的目標(biāo)文本都選擇出來。[〇〇69]步驟S42,判斷所述源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值;
[0070]步驟S43,若是,則將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本。
[0071]在選擇出源匹配度最高的目標(biāo)文本后,由于選擇出的源匹配度最高的目標(biāo)文本的源匹配度可能很小,也就是表明選出的目標(biāo)文本與源文本的差距很大,可能不是用戶所需要的目標(biāo)文本,因此,需要丟棄此次選出的目標(biāo)文本,故在選擇出源匹配度最高的目標(biāo)文本后,可以判斷源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值,若所述源匹配度最高的目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值,則表明所述源匹配度最高的目標(biāo)文本與所述源文本匹配,并將該源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本,若源匹配度最高的目標(biāo)文本的源匹配度小于所述第一預(yù)設(shè)預(yù)設(shè),則表明所述源匹配度最高的目標(biāo)文本與所述源文本不匹配,也即目標(biāo)文本與所述源文本不匹配,用戶可以重新輸入源文本進(jìn)行匹配操作。
[0072]本實(shí)施例通過在計(jì)算出所述各個(gè)目標(biāo)文本的源匹配度之后,選擇出源匹配度最高的目標(biāo)文本組,然后對(duì)該選擇出的目標(biāo)文本進(jìn)行判斷,若該目標(biāo)文本組的源匹配度大于或等于所述第一預(yù)設(shè)閾值,則將該目標(biāo)文本作為匹配的目標(biāo)文本,本實(shí)施例中通過對(duì)選擇出源匹配度最高的目標(biāo)文本的源匹配度進(jìn)行判斷,而不需要對(duì)每個(gè)目標(biāo)文本的源匹配度進(jìn)行判斷,從而節(jié)省了匹配操作的時(shí)間。[〇〇73]進(jìn)一步的,參照?qǐng)D3,圖3為本發(fā)明字符串模糊匹配方法的第三實(shí)施例的流程示意圖?;谏鲜鲎址:ヅ浞椒ǖ牡诙?shí)施例,所述匹配的目標(biāo)文本存在多個(gè),所述步驟 S43之后,還包括:
[0074]步驟S44,根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算各個(gè)匹配的所述目標(biāo)文本的目標(biāo)匹配度,并根據(jù)計(jì)算結(jié)果確定目標(biāo)匹配度最高的目標(biāo)文本;[〇〇75]步驟S45,將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。
[0076]由于通過上述方式獲取的匹配的目標(biāo)文本可能存在多個(gè),因此,為了獲取到更準(zhǔn)確的匹配的目標(biāo)文本,可以在獲取到匹配的多個(gè)目標(biāo)文本之后,根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算各個(gè)匹配的目標(biāo)文本的目標(biāo)匹配度,并在計(jì)算出各個(gè)匹配的目標(biāo)文本的目標(biāo)匹配度后,確定目標(biāo)匹配度最高的目標(biāo)文本,所述目標(biāo)匹配度為所述匹配的字符數(shù)量與目標(biāo)文本的字符數(shù)量的百分比,即所述目標(biāo)匹配度=匹配的字符數(shù)量/目標(biāo)文本的字符數(shù)量*1〇〇 %。例如,假設(shè)各個(gè)匹配的目標(biāo)文本與源文本匹配的字符數(shù)量為5個(gè)字符,各個(gè)目標(biāo)文本的字符數(shù)量分別為5個(gè)字符,6個(gè)字符,8個(gè)字符,10個(gè)字符,12 個(gè)字符,則各個(gè)目標(biāo)文本的目標(biāo)匹配度依次為1 〇〇 %、83.3 %、62.5 %、50 %、41.7 %,則目標(biāo)匹配度最高的目標(biāo)文本為所述目標(biāo)匹配度為100%所對(duì)應(yīng)的目標(biāo)文本,在確定目標(biāo)匹配度最高的目標(biāo)文本后,將該目標(biāo)文本作為最終匹配的目標(biāo)文本,需要說明的是,若目標(biāo)匹配度最高的目標(biāo)文本存在多個(gè),則將該多個(gè)目標(biāo)匹配度最高的目標(biāo)文本都作為最終匹配的目標(biāo)文本。
[0077]本實(shí)施例通過在篩選出匹配的目標(biāo)文本后,進(jìn)一步根據(jù)該匹配的各個(gè)目標(biāo)文本的目標(biāo)匹配度作進(jìn)一步的篩選,以獲取最終匹配的目標(biāo)文本,由于獲取的最終匹配的目標(biāo)文本經(jīng)過了兩次篩選,因此,提高了獲取目標(biāo)文本的準(zhǔn)確率。
[0078]進(jìn)一步的,參照?qǐng)D4,圖4為本發(fā)明字符串模糊匹配方法的第四實(shí)施例的流程示意圖?;谏鲜鲎址:ヅ浞椒ǖ牡谌龑?shí)施例,所述步驟S45包括:
[0079]步驟S451,根據(jù)所述第一預(yù)設(shè)閾值獲取所述源文本對(duì)應(yīng)的第二預(yù)設(shè)閾值;
[0080]在本實(shí)施例中,所述第二預(yù)設(shè)閾值與所述第一預(yù)設(shè)閾值有關(guān),具體地來說,所述第二預(yù)設(shè)閾值可以根據(jù)所述第一預(yù)設(shè)閾值進(jìn)行設(shè)置。例如,若所述第一預(yù)設(shè)閾值為1,則可以設(shè)置所述第二預(yù)設(shè)閾值也為1,該第二預(yù)設(shè)閾值為1代表目標(biāo)文本的目標(biāo)匹配度為1〇〇%時(shí), 該目標(biāo)文本與源文本才匹配;若所述第一預(yù)設(shè)閾值為〇.67,則可以設(shè)置所述第二預(yù)設(shè)閾值為0.50,該第二預(yù)設(shè)閾值為0.50代表目標(biāo)文本的目標(biāo)匹配度為50 %或以上時(shí),該目標(biāo)文本與源文本才匹配。需要說明的是,上述所述的各個(gè)閾值可以根據(jù)實(shí)際需要自由設(shè)定和動(dòng)態(tài)調(diào)整,也可以根據(jù)實(shí)際需要設(shè)置更多個(gè)第二預(yù)設(shè)閾值,在本實(shí)施例中,不做限定。[0081 ]步驟S452,判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或者等于所述第二預(yù)設(shè)閾值;[〇〇82]步驟S453,若是,則將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。[〇〇83]在確定目標(biāo)匹配度最高的目標(biāo)文本后,由于確定的目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度可能很小,也就是表明選出的目標(biāo)文本與源文本的差距很大,可能不是用戶所需要的目標(biāo)文本,因此,需要丟棄此次選出的目標(biāo)文本,故在確定目標(biāo)匹配度最高的目標(biāo)文本后,可以判斷目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或等于所述第二預(yù)設(shè)閾值,若所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度大于或等于所述第二預(yù)設(shè)閾值,則表明所述目標(biāo)匹配度最高的目標(biāo)文本與所述源文本匹配,并將該目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本,若目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度小于所述第二預(yù)設(shè)預(yù)設(shè),則表明所述目標(biāo)匹配度最高的目標(biāo)文本與所述源文本不匹配,也即目標(biāo)文本與所述源文本匹配失敗。
[0084]本實(shí)施例通過在將所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本之前,判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或等于所述第二預(yù)設(shè)閾值,若是,則匹配成功,若否,則匹配失敗,本實(shí)施例通過對(duì)目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度進(jìn)行判斷,以提高獲取的目標(biāo)文本的準(zhǔn)確率。
[0085]進(jìn)一步的,參照?qǐng)D5,圖5為本發(fā)明字符串模糊匹配方法的第五實(shí)施例的流程示意圖?;谏鲜鲎址:ヅ浞椒ǖ娜我粚?shí)施例,所述步驟S10包括:
[0086]步驟SI 1,將所述源文本和所述各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息;
[0087]步驟S12,獲取所述各個(gè)目標(biāo)文本對(duì)應(yīng)的拼音形式的字符信息與所述源文本對(duì)應(yīng)的拼音形式的字符信息匹配的字符數(shù)量。
[0088]在本實(shí)施例中,所述源文本及目標(biāo)文本為語音文本或者中文文本,系統(tǒng)在接收到源文本后,為了進(jìn)行匹配操作,需要將源文本和各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息, 在將源文本和各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息后,可以將源文本的各個(gè)拼音字符信息從第一字符開始依次與目標(biāo)文本的所有拼音形式的字符信息進(jìn)行匹配,若匹配成功, 則記錄下該字符,然后對(duì)源文本的第二個(gè)字符進(jìn)行匹配操作,重復(fù)上述操作,直到對(duì)所述源文本的所有字符完成匹配操作,然后統(tǒng)計(jì)出目標(biāo)文本與該源文本中匹配的字符數(shù)量,需要說明的是,若源文本中存在多個(gè)相同的字符,則在源文本與目標(biāo)文本進(jìn)行匹配操作時(shí),若目標(biāo)文本中只存在一個(gè)字符與源文本中多個(gè)相同的字符匹配,則在統(tǒng)計(jì)匹配的字符數(shù)量時(shí), 只計(jì)算與該字符匹配的字符數(shù)量為一個(gè),而不應(yīng)該計(jì)算為多個(gè)。
[0089]本實(shí)施例通過將源文本和目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息進(jìn)行匹配操作,可以提尚目標(biāo)文本的識(shí)別率。
[0090]本發(fā)明進(jìn)一步提供一種字符串模糊匹配裝置。
[0091]參照?qǐng)D6,圖6為本發(fā)明字符串模糊匹配裝置的第一實(shí)施例的功能模塊示意圖。 [〇〇92]在本實(shí)施例中,所述字符串模糊匹配裝置包括:獲取模塊10、第一計(jì)算模塊20及第一作為模塊30。
[0093]所述獲取模塊10,用于獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;
[0094]在本實(shí)施中,所述源文本為用戶輸入的文本,所述源文本可以為語音文本、中文文本或者拼音文本。所述各個(gè)目標(biāo)文本為用于和源文本匹配的文本,所述各個(gè)目標(biāo)文本也可以為語音文本、中文文本或者拼音文本。在接收到用戶輸入的源文本后,所述獲取模塊10將接收到的源文本與本地預(yù)存的各個(gè)目標(biāo)文本進(jìn)行匹配操作,查找源文本與各個(gè)目標(biāo)文本相匹配的字符,即查找所述各個(gè)目標(biāo)文本中的字符與源文本中的字符一致的字符,然后統(tǒng)計(jì)各個(gè)目標(biāo)文本與源文本匹配的字符數(shù)量。
[0095]所述第一計(jì)算模塊20,用于根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度;
[0096]在獲取到各個(gè)目標(biāo)文本與源文本匹配的字符數(shù)量后,所述第一計(jì)算模塊20可以根據(jù)該字符數(shù)量與源文本的字符數(shù)量計(jì)算源文本與各個(gè)目標(biāo)文本的源匹配度,所述源匹配度為所述匹配的字符數(shù)量與源文本的字符數(shù)量的百分比,即所述源匹配度=匹配字符數(shù)量/ 源文本的字符數(shù)量*1〇〇%。例如,假設(shè)所述源文本字符數(shù)量為8個(gè)字符,各個(gè)目標(biāo)文本與所述源文本匹配的字符數(shù)量分別為5個(gè)字符,4個(gè)字符,6個(gè)字符,1個(gè)字符,0個(gè)字符等,則各個(gè)目標(biāo)文本的源匹配度依次為62.5%、50.0%、75.0%、12.5%、0等。
[0097]所述獲取模塊10,還用于根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值;
[0098]所述第一作為模塊30,用于獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。
[0099]在獲取到各個(gè)目標(biāo)文本的源匹配度后,為了篩選出匹配的目標(biāo)文本,可以通過依次判斷所述各個(gè)目標(biāo)文本的源匹配度是否大于或等于第一預(yù)設(shè)閾值的方式來查找匹配的目標(biāo)文本,若目標(biāo)文本的源匹配度大于或等于第一預(yù)設(shè)閾值的目標(biāo)文本只有一個(gè),則將該源匹配度大于或等于第一預(yù)設(shè)閾值目標(biāo)文本作為匹配的目標(biāo)文本,若源匹配度大于或等于第一預(yù)設(shè)閾值目標(biāo)文本存在多個(gè),則將所有的源匹配度大于或等于第一預(yù)設(shè)閾值目標(biāo)文本都作為匹配的目標(biāo)文本;若目標(biāo)文本的源匹配度小于第一預(yù)設(shè)閾值,則該目標(biāo)文本不是與源文本所匹配的目標(biāo)文本,即該目標(biāo)文本與所述源文本不匹配。在本實(shí)施例中,所述第一預(yù)設(shè)閾值與源文本的字段數(shù)量有關(guān),即不同字段數(shù)量的源文本對(duì)應(yīng)著不同的第一預(yù)設(shè)閾值, 其中,所述字段數(shù)量為源文本中的中文字符數(shù)量。故在判斷目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值之前,需要先確定源文本的字段數(shù)量,然后根據(jù)源文本的字段數(shù)量獲取源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值。具體來說,所述第一預(yù)設(shè)閾值可以根據(jù)源文本的字段數(shù)量進(jìn)行設(shè)置。例如,若源文本的字段數(shù)量為小于或等于2個(gè),則可以設(shè)置第一預(yù)設(shè)閾值為 1,該第一預(yù)設(shè)閾值為1代表該目標(biāo)文本的源匹配度為100%時(shí),該目標(biāo)文本才與源文本匹配;若源文本的字段數(shù)量大于2,即源文本中的中文字符數(shù)量多于2個(gè),則可以設(shè)置第一預(yù)設(shè)閾值為0.67,該第一預(yù)設(shè)閾值為0.67代表該目標(biāo)文本的源匹配度為66.7%或以上時(shí),該目標(biāo)文本與源文本才匹配。需要說明的是,上述所述的三個(gè)值可以根據(jù)實(shí)際需要自由設(shè)定和動(dòng)態(tài)調(diào)整,也可以根據(jù)實(shí)際需要設(shè)置更多個(gè)第一預(yù)設(shè)閾值,在本實(shí)施例中,不做限定。比如在語音應(yīng)用中,在源文本字段數(shù)量超過2個(gè)時(shí)設(shè)置第一預(yù)設(shè)閾值為0.67,在源文本字段數(shù)量小于或等于兩個(gè)時(shí)設(shè)置第一預(yù)設(shè)閾值為1,即如果用戶說了兩個(gè)字,就必須全部匹配到,如果說了三個(gè)字及以上,必須匹配到2/3以上。
[0100]本實(shí)施例通過獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;根據(jù)所述字符數(shù)量計(jì)算所述各個(gè)目標(biāo)文本的源匹配度;依次判斷所述各個(gè)目標(biāo)文本的源匹配度是否滿足第一預(yù)設(shè)條件;若是,則將滿足第一預(yù)設(shè)條件的目標(biāo)文本作為匹配的目標(biāo)文本。由于本實(shí)施例采用的是模糊匹配的方式查找匹配的目標(biāo)文本,而不是采用的精確查找的方式查找匹配的目標(biāo)文本,從而有效提尚了字符串的識(shí)別率。
[0101]進(jìn)一步的,參照?qǐng)D7,圖7為本發(fā)明字符串模糊匹配裝置的第二實(shí)施例的功能模塊示意圖?;谏鲜鲎址:ヅ溲b置的第一實(shí)施例,所述第一作為模塊30包括:確定單元 31、第一判斷單元32及第一作為單元33。
[0102]所述確定單元31,用于根據(jù)計(jì)算得出的各個(gè)目標(biāo)文本的源匹配度確定源匹配度最高的目標(biāo)文本;
[0103]在計(jì)算出各個(gè)目標(biāo)文本的源匹配度后,可以通過比較各個(gè)目標(biāo)文本的源匹配度, 然后從中選擇出源匹配度最高的目標(biāo)文本。需要說明的是,若源匹配度最高的目標(biāo)文本存在多個(gè),則需要將該多個(gè)源匹配度最高的目標(biāo)文本都選擇出來。
[0104]所述第一判斷單元32,用于判斷所述源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值;
[0105]所述第一作為單元33,用于若所述源匹配度最高的目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值,則將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本。
[0106]在選擇出源匹配度最高的目標(biāo)文本后,由于選擇出的源匹配度最高的目標(biāo)文本的源匹配度可能很小,也就是表明選出的目標(biāo)文本與源文本的差距很大,可能不是用戶所需要的目標(biāo)文本,因此,需要丟棄此次選出的目標(biāo)文本,故在選擇出源匹配度最高的目標(biāo)文本后,可以判斷源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值,若所述源匹配度最高的目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值,則表明所述源匹配度最高的目標(biāo)文本與所述源文本匹配,并將該源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本,若源匹配度最高的目標(biāo)文本的源匹配度小于所述第一預(yù)設(shè)預(yù)設(shè),則表明所述源匹配度最高的目標(biāo)文本與所述源文本不匹配,也即目標(biāo)文本與所述源文本不匹配,用戶可以重新輸入源文本進(jìn)行匹配操作。
[0107]本實(shí)施例通過在計(jì)算出所述各個(gè)目標(biāo)文本的源匹配度之后,選擇出源匹配度最高的目標(biāo)文本組,然后對(duì)該選擇出的目標(biāo)文本進(jìn)行判斷,若該目標(biāo)文本組的源匹配度大于或等于所述第一預(yù)設(shè)閾值,則將該目標(biāo)文本作為匹配的目標(biāo)文本,本實(shí)施例中通過對(duì)選擇出源匹配度最高的目標(biāo)文本的源匹配度進(jìn)行判斷,而不需要對(duì)每個(gè)目標(biāo)文本的源匹配度進(jìn)行判斷,從而節(jié)省了匹配操作的時(shí)間。
[0108]進(jìn)一步的,參照?qǐng)D8,圖8為本發(fā)明字符串模糊匹配裝置的第三實(shí)施例的功能模塊示意圖?;谏鲜鲎址:ヅ溲b置的第二實(shí)施例,所述匹配的目標(biāo)文本存在多個(gè)時(shí),所述字符串模糊匹配裝置還包括:第二計(jì)算模塊40及第二作為模塊50。
[0109]所述第二計(jì)算模塊40,用于根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算各個(gè)匹配的所述目標(biāo)文本的目標(biāo)匹配度,并根據(jù)計(jì)算結(jié)果確定目標(biāo)匹配度最尚的目標(biāo)文本;[011 〇]所述第二作為模塊50,還用于將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。
[0111]由于通過上述方式獲取的匹配的目標(biāo)文本可能存在多個(gè),因此,為了獲取到更準(zhǔn)確的匹配的目標(biāo)文本,可以在獲取到匹配的多個(gè)目標(biāo)文本之后,根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算所述源文本與各個(gè)匹配的所述目標(biāo)文本的目標(biāo)匹配度,并在計(jì)算出各個(gè)匹配的目標(biāo)文本的目標(biāo)匹配度后,根據(jù)各個(gè)匹配的目標(biāo)文本的目標(biāo)匹配度確定目標(biāo)匹配度最高的目標(biāo)文本,所述目標(biāo)匹配度為所述匹配的字符數(shù)量與目標(biāo)文本的字符數(shù)量的百分比,即所述目標(biāo)匹配度=匹配的字符數(shù)量/目標(biāo)文本的字符數(shù)量* 100%。例如,假設(shè)各個(gè)匹配的目標(biāo)文本與源文本匹配的字符數(shù)量為5個(gè)字符,各個(gè)目標(biāo)文本的字符數(shù)量分別為5個(gè)字符,6個(gè)字符,8個(gè)字符,10個(gè)字符,12個(gè)字符,則各個(gè)目標(biāo)文本的目標(biāo)匹配度依次為100%、83.3%、62.5%、50%、41.7%,則目標(biāo)匹配度最高的目標(biāo)文本為所述目標(biāo)匹配度為100%所對(duì)應(yīng)的目標(biāo)文本,在確定目標(biāo)匹配度最高的目標(biāo)文本后,將該目標(biāo)文本作為最終匹配的目標(biāo)文本,需要說明的是,若目標(biāo)匹配度最高的目標(biāo)文本存在多個(gè),則將該多個(gè)目標(biāo)匹配度最高的目標(biāo)文本都作為最終匹配的目標(biāo)文本。
[0112]本實(shí)施例通過在篩選出匹配的目標(biāo)文本后,進(jìn)一步根據(jù)該匹配的各個(gè)目標(biāo)文本的目標(biāo)匹配度作進(jìn)一步的篩選,以獲取最終匹配的目標(biāo)文本,由于獲取的最終匹配的目標(biāo)文本經(jīng)過了兩次篩選,因此,提高了獲取目標(biāo)文本的準(zhǔn)確率。
[0113]進(jìn)一步的,參照?qǐng)D9,圖9為本發(fā)明字符串模糊匹配裝置的第四實(shí)施例的流程示意圖?;谏鲜鲎址:ヅ溲b置的第三實(shí)施例,所述第二作為模塊包括50:獲取單元51、 第二判斷單元52及第二作為單元53。
[0114]所述獲取單元51,用于根據(jù)所述第一預(yù)設(shè)閾值獲取所述源文本對(duì)應(yīng)的第二預(yù)設(shè)閾值;
[0115]在本實(shí)施例中,所述第二預(yù)設(shè)閾值與所述第一預(yù)設(shè)閾值有關(guān),具體地來說,所述第二預(yù)設(shè)閾值可以根據(jù)所述第一預(yù)設(shè)閾值進(jìn)行設(shè)置。例如,若所述第一預(yù)設(shè)閾值為1,則可以設(shè)置所述第二預(yù)設(shè)閾值也為1,該第二預(yù)設(shè)閾值為1代表目標(biāo)文本的目標(biāo)匹配度為1〇〇%時(shí), 該目標(biāo)文本與源文本才匹配;若所述第一預(yù)設(shè)閾值對(duì)應(yīng)的源匹配度為〇.67,則可以設(shè)置所述第二預(yù)設(shè)閾值為〇.50,該第二預(yù)設(shè)閾值為0.50代表目標(biāo)文本的目標(biāo)匹配度為50%或以上時(shí),該目標(biāo)文本與源文本才匹配。需要說明的是,上述所述的各個(gè)閾值可以根據(jù)實(shí)際需要自由設(shè)定和動(dòng)態(tài)調(diào)整,也可以根據(jù)實(shí)際需要設(shè)置更多個(gè)第二預(yù)設(shè)閾值,在本實(shí)施例中,不做限定。[〇116]所述第二判斷單元52,用于判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或者等于所述第二預(yù)設(shè)閾值;[〇117]所述第二作為單元53,用于若確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度大于或者等于所述第二預(yù)設(shè)閾值,則將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。
[0118]在確定目標(biāo)匹配度最高的目標(biāo)文本后,由于確定的目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度可能很小,也就是表明選出的目標(biāo)文本與源文本的差距很大,可能不是用戶所需要的目標(biāo)文本,因此,需要丟棄此次選出的目標(biāo)文本,故在確定目標(biāo)匹配度最高的目標(biāo)文本后,可以判斷目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或等于所述第二預(yù)設(shè)閾值,若所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度大于或等于所述第二預(yù)設(shè)閾值,則表明所述目標(biāo)匹配度最高的目標(biāo)文本與所述源文本匹配,并將該目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本,若目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度小于所述第二預(yù)設(shè)預(yù)設(shè),則表明所述目標(biāo)匹配度最高的目標(biāo)文本與所述源文本不匹配,也即目標(biāo)文本與所述源文本匹配失敗。
[0119]本實(shí)施例通過在將所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本之前,判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或等于所述第二預(yù)設(shè)閾值,若是,則匹配成功,若否,則匹配失敗,本實(shí)施例通過對(duì)目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度進(jìn)行判斷,以提高獲取的目標(biāo)文本的準(zhǔn)確率。
[0120]進(jìn)一步的,參照?qǐng)D10,圖10為本發(fā)明字符串模糊匹配裝置的第五實(shí)施例的流程示意圖。基于上述字符串模糊匹配裝置的任一實(shí)施例,所述獲取模塊10包括:轉(zhuǎn)換單元11及獲取單元12。[0121 ]所述轉(zhuǎn)換單元11,用于將所述源文本和所述各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息;
[0122]所述獲取單元12,用于獲取所述各個(gè)目標(biāo)文本對(duì)應(yīng)的拼音形式的字符信息與所述源文本對(duì)應(yīng)的拼音形式的字符信息匹配的字符數(shù)量。
[0123]在本實(shí)施例中,所述源文本及目標(biāo)文本為語音文本或者中文文本,系統(tǒng)在接收到源文本后,為了進(jìn)行匹配操作,需要將源文本和各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息, 在將源文本和各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息后,可以將源文本的各個(gè)拼音字符信息從第一字符開始依次與目標(biāo)文本的所有拼音形式的字符信息進(jìn)行匹配,若匹配成功, 則記錄下該字符,然后對(duì)源文本的第二個(gè)字符進(jìn)行匹配操作,重復(fù)上述操作,直到對(duì)所述源文本的所有字符完成匹配操作,然后統(tǒng)計(jì)出目標(biāo)文本與該源文本中匹配的字符數(shù)量,需要說明的是,若源文本中存在多個(gè)相同的字符,則在源文本與目標(biāo)文本進(jìn)行匹配操作時(shí),若目標(biāo)文本中只存在一個(gè)字符與源文本中多個(gè)相同的字符匹配,則在統(tǒng)計(jì)匹配的字符數(shù)量時(shí), 只計(jì)算與該字符匹配的字符數(shù)量為一個(gè),而不應(yīng)該計(jì)算為多個(gè)。
[0124]本實(shí)施例通過將源文本和目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息進(jìn)行匹配操作,可以提尚目標(biāo)文本的識(shí)別率。
[0125]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如R0M/RAM、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等) 執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0126]以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種字符串模糊匹配方法,其特征在于,所述字符串模糊匹配方法包括以下步驟: 獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo)文本的源匹配度; 根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾值;獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲 取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。2.如權(quán)利要求1所述的字符串模糊匹配方法,其特征在于,所述獲取所述各個(gè)目標(biāo)文本 的源匹配度大于或等于所述第一預(yù)設(shè)閾值的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹 配的目標(biāo)文本的步驟包括:根據(jù)計(jì)算得出的各個(gè)目標(biāo)文本的源匹配度確定源匹配度最高的目標(biāo)文本;判斷所述源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所述第一預(yù)設(shè)閾值; 若是,則將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本。3.如權(quán)利要求2所述的字符串模糊匹配方法,其特征在于,所述匹配的目標(biāo)文本存在多 個(gè)時(shí),所述將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本的步驟之后,還包括:根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量計(jì)算各個(gè)所述匹配 的目標(biāo)文本的目標(biāo)匹配度,并根據(jù)計(jì)算結(jié)果確定目標(biāo)匹配度最高的目標(biāo)文本;將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。4.如權(quán)利要求3所述的字符串模糊匹配方法,其特征在于,所述將確定的所述目標(biāo)匹配 度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本的步驟包括:根據(jù)所述第一預(yù)設(shè)閾值獲取所述源文本對(duì)應(yīng)的第二預(yù)設(shè)閾值;判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或者等于所述第 二預(yù)設(shè)閾值;若是,則將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo)文本。5.如權(quán)利要求1至4任一項(xiàng)所述的字符串模糊匹配方法,其特征在于,所述獲取源文本 和各個(gè)目標(biāo)文本匹配的字符數(shù)量的步驟包括:將所述源文本和所述各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息;獲取所述各個(gè)目標(biāo)文本對(duì)應(yīng)的拼音形式的字符信息與所述源文本對(duì)應(yīng)的拼音形式的 字符信息匹配的字符數(shù)量。6.—種字符串模糊匹配裝置,其特征在于,所述字符串模糊匹配裝置包括:獲取模塊,用于獲取源文本和各個(gè)目標(biāo)文本匹配的字符數(shù)量;第一計(jì)算模塊,用于根據(jù)匹配的所述字符數(shù)量與所述源文本的字符數(shù)量計(jì)算各個(gè)目標(biāo) 文本的源匹配度;所述獲取模塊,還用于根據(jù)所述源文本的字段數(shù)量獲取所述源文本對(duì)應(yīng)的第一預(yù)設(shè)閾 值;第一作為模塊,用于獲取所述各個(gè)目標(biāo)文本的源匹配度大于或等于所述第一預(yù)設(shè)閾值 的目標(biāo)文本,并將獲取到的所述目標(biāo)文本作為匹配的目標(biāo)文本。7.如權(quán)利要求6所述的字符串模糊匹配裝置,其特征在于,所述第一作為模塊包括:確定單元,用于根據(jù)計(jì)算得出的各個(gè)目標(biāo)文本的源匹配度確定源匹配度最高的目標(biāo)文 本;第一判斷單元,用于判斷所述源匹配度最高的目標(biāo)文本的源匹配度是否大于或等于所 述第一預(yù)設(shè)閾值;第一作為單元,用于若所述源匹配度最高的目標(biāo)文本的源匹配度大于或等于所述第一 預(yù)設(shè)閾值,則將所述源匹配度最高的目標(biāo)文本作為匹配的目標(biāo)文本。8.如權(quán)利要求7所述的字符串模糊匹配裝置,其特征在于,所述匹配的目標(biāo)文本存在多 個(gè)時(shí),所述字符串模糊匹配裝置還包括:第二計(jì)算模塊,用于根據(jù)匹配的所述字符數(shù)量與各個(gè)匹配的所述目標(biāo)文本的字符數(shù)量 計(jì)算各個(gè)匹配的所述目標(biāo)文本的目標(biāo)匹配度,并根據(jù)計(jì)算結(jié)果確定目標(biāo)匹配度最高的目標(biāo) 文本;第二作為模塊,還用于將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo) 文本。9.如權(quán)利要求8所述的字符串模糊匹配裝置,其特征在于,所述第二作為模塊包括:獲取單元,用于根據(jù)所述第一預(yù)設(shè)閾值獲取所述源文本對(duì)應(yīng)的第二預(yù)設(shè)閾值;第二判斷單元,用于判斷確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度是否大于或者等于所述第二預(yù)設(shè)閾值;第二作為單元,用于若確定的所述目標(biāo)匹配度最高的目標(biāo)文本的目標(biāo)匹配度大于或者 等于所述第二預(yù)設(shè)閾值,則將確定的所述目標(biāo)匹配度最高的目標(biāo)文本作為最終匹配的目標(biāo) 文本。10.如權(quán)利要求6至9任一項(xiàng)所述的字符串模糊匹配裝置,其特征在于,所述獲取模塊包 括:轉(zhuǎn)換單元,用于將所述源文本和所述各個(gè)目標(biāo)文本轉(zhuǎn)換為拼音形式的字符信息;獲取單元,用于獲取所述各個(gè)目標(biāo)文本對(duì)應(yīng)的拼音形式的字符信息與所述源文本對(duì)應(yīng) 的拼音形式的字符信息匹配的字符數(shù)量。
【文檔編號(hào)】G06F17/30GK106021504SQ201610343584
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月20日
【發(fā)明人】曾紅
【申請(qǐng)人】深圳Tcl數(shù)字技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
福泉市| 岱山县| 察哈| 天镇县| 长治县| 长兴县| 呈贡县| 雅安市| 股票| 龙岩市| 石棉县| 台江县| 永康市| 潜江市| 喀喇沁旗| 丽水市| 井陉县| 莫力| 钟祥市| 略阳县| 克山县| 北碚区| 富源县| 栖霞市| 郎溪县| 苏尼特右旗| 射阳县| 铜陵市| 略阳县| 宜兴市| 孟村| 大庆市| 洱源县| 郓城县| 东平县| 无锡市| 巴东县| 南安市| 丹江口市| 乌兰县| 郯城县|