特殊文字搜索方法以及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明涉及一種特殊文字搜索方法,其中該方法包括以下步驟:步驟A、接收索引標(biāo)識(shí)信息,根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集;步驟B、查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集;步驟C、結(jié)合所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。本發(fā)明提供的方法可有效豐富用戶的搜索結(jié)果數(shù)據(jù),提高用戶體驗(yàn)。
【專(zhuān)利說(shuō)明】特殊文字搜索方法以及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種特殊文字搜索方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的普及,年輕網(wǎng)民為求彰顯個(gè)性,開(kāi)始大量使用同音字、音近字、特殊符號(hào)來(lái)表音的文字,這種文字與日常生活中使用的文字相比有明顯的不同并且文法也相當(dāng)奇異,所以也叫做火星文,意指地球人看不懂的文字?;鹦俏谋淮罅繎?yīng)用在年輕網(wǎng)民的昵稱(chēng)以及博客中,若用戶需要搜索該火星文昵稱(chēng)或者博客,只能通過(guò)火星文關(guān)鍵字進(jìn)行搜索才能搜索到與之匹配的昵稱(chēng)或者博客。然而,由于火星文并不是規(guī)范的文字,沒(méi)有統(tǒng)一的編排,每個(gè)文字可以有多種組成方式,火星文可以使用同音字、近音字、形近字或者拆字組合來(lái)代替正常的漢字,表達(dá)自己的思想。如:用拆字組合“走召弓雖”來(lái)表示“超強(qiáng)”,用M爾
門(mén)者卩i井?又i吾”來(lái)表示“你們都講漢語(yǔ)”;再比如用近音字“什底堤焱腥姣”來(lái)表示“什么是火星文”等等。因此,目前在使用正常文字的索引信息搜索數(shù)據(jù)時(shí),并無(wú)法提供與之相應(yīng)的火星文數(shù)據(jù),即使使用火星文索引信息也可能出現(xiàn)搜索偏差較大的情況,導(dǎo)致返回給用戶的搜索結(jié)果不完善。
【發(fā)明內(nèi)容】
[0003]有鑒于此,本發(fā)明提供了一種特殊文字搜索方法以及系統(tǒng)來(lái)解決上述問(wèn)題。
[0004]本發(fā)明提供了一種特殊文字搜索方法,其中包括:
[0005]步驟A、接收索引標(biāo)識(shí)信息,根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集;
[0006]步驟B、查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集;所述特殊文字為火星文字、菊花文以及繁體文字中一種或多種;
[0007]步驟C、結(jié)合所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
[0008]進(jìn)一步地,所述步驟A與步驟B之間還包括:
[0009]判斷所述索引標(biāo)識(shí)信息是否需要進(jìn)行特殊文字搜索;
[0010]若是,則在預(yù)設(shè)的正常文字與特殊文字映射關(guān)系表項(xiàng)中查找與所述索引標(biāo)識(shí)信息相對(duì)應(yīng)的特殊文字索引信息,并轉(zhuǎn)至步驟C ;
[0011]否則根據(jù)正常文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
[0012]進(jìn)一步地,每隔預(yù)設(shè)時(shí)間,更新所述正常文字與特殊文字映射關(guān)系表項(xiàng)。
[0013]進(jìn)一步地,所述步驟C具體包括:
[0014]對(duì)所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集進(jìn)行合并以及排重處理,生成結(jié)果數(shù)據(jù)集。
[0015]進(jìn)一步地,所述步驟A進(jìn)一步包括,
[0016]根據(jù)索引標(biāo)識(shí)信息在正常文字庫(kù)內(nèi)查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集;
[0017]所述步驟B進(jìn)一步包括,根據(jù)特殊文字索引信息在預(yù)設(shè)的特殊文字庫(kù)內(nèi)查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集,其中,每隔預(yù)設(shè)時(shí)間,更新所述正常文字庫(kù)與所述特殊文字庫(kù)。
[0018]本發(fā)明還提供一種特殊文字搜索的系統(tǒng),其中包括:
[0019]正常文字查找單元,用于接收索引標(biāo)識(shí)信息,根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集;
[0020]特殊文字查找單元,用于查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集;
[0021]結(jié)果數(shù)據(jù)生成單元,用于結(jié)合所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
[0022]進(jìn)一步地,所述系統(tǒng)還包括搜索判斷單元,
[0023]在正常文字查找單元根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集后,判斷所述索引標(biāo)識(shí)信息是否需要進(jìn)行特殊文字搜索;
[0024]若是,則在預(yù)設(shè)的正常文字與特殊文字映射關(guān)系表項(xiàng)中查找與所述索引標(biāo)識(shí)信息相對(duì)應(yīng)的特殊文字索引信息,并轉(zhuǎn)至結(jié)果數(shù)據(jù)生成單元處理;
[0025]否則根據(jù)正常文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
[0026]進(jìn)一步地,每隔預(yù)設(shè)時(shí)間,更新所述正常文字與特殊文字映射關(guān)系表項(xiàng)。
[0027]進(jìn)一步地,所述結(jié)果數(shù)據(jù)生成單元具體用于:
[0028]對(duì)所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集進(jìn)行合并以及排重處理,生成結(jié)果數(shù)據(jù)集。
[0029]進(jìn)一步地,所述正常文字查找單元進(jìn)一步用于,
[0030]根據(jù)索引標(biāo)識(shí)信息在正常文字庫(kù)內(nèi)查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集;
[0031]所述特殊文字查找單元進(jìn)一步用于,根據(jù)特殊文字索引信息在預(yù)設(shè)的特殊文字庫(kù)內(nèi)查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集,其中,每隔預(yù)設(shè)時(shí)間,更新所述正常文字庫(kù)與所述特殊文字庫(kù)。
[0032]由此可見(jiàn),本發(fā)明提供的特殊文字搜索方法以及系統(tǒng)通過(guò)在接收到索引標(biāo)識(shí)信息后,根據(jù)索引標(biāo)識(shí)信息分別查找與其關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集,最終結(jié)合正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集反饋給用戶,可有效豐富用戶的搜索結(jié)果數(shù)據(jù),提高用戶體驗(yàn)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0033]圖1是本發(fā)明實(shí)施例中特殊文字搜索系統(tǒng)的邏輯結(jié)構(gòu)示意圖;
[0034]圖2是本發(fā)明實(shí)施例中特殊文字搜索方法的工作流程圖。
【具體實(shí)施方式】
[0035]在日常生活中,火星文被大量應(yīng)用于年輕網(wǎng)民的昵稱(chēng)以及博客中,若用戶需要搜索某火星文昵稱(chēng)或者博客,只能通過(guò)火星文關(guān)鍵字進(jìn)行搜索才能搜索到與之匹配的昵稱(chēng)或者博客。然而,用戶在進(jìn)行搜索時(shí)多會(huì)使用正常文字進(jìn)行搜索,且由于火星文字的不規(guī)范性,即使使用火星文索引信息進(jìn)行搜索也不易準(zhǔn)確輸入與搜索目標(biāo)一致的索引信息,相應(yīng)地就無(wú)法提供與之對(duì)應(yīng)的火星文數(shù)據(jù)或者出現(xiàn)搜索結(jié)果偏差較大的情況,導(dǎo)致返回給用戶的搜索結(jié)果不完善。
[0036]由此,本發(fā)明提供了一種特殊文字搜索方法,通過(guò)在接收到索引標(biāo)識(shí)信息后,根據(jù)索引標(biāo)識(shí)信息查找與其關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集,接著再查找與索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集,最終結(jié)合正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。本發(fā)明中所述的特殊文字可以為火星文、菊花文或者繁體中文等網(wǎng)絡(luò)文字,以下以特殊文字為火星文為例對(duì)本發(fā)明做進(jìn)一步地闡述。
[0037]請(qǐng)參考圖1,本發(fā)明提供了一種特殊文字搜索系統(tǒng),該系統(tǒng)的基本硬件環(huán)境包括CPU、內(nèi)存、非易失性存儲(chǔ)器以及其他硬件。所述特殊文字搜索系統(tǒng)可以理解為CPU讀取非易失性存儲(chǔ)器中對(duì)應(yīng)的計(jì)算機(jī)程序在內(nèi)存中運(yùn)行所形成的,從本質(zhì)上說(shuō)其是一個(gè)邏輯系統(tǒng)。在本實(shí)施方式中,該系統(tǒng)在邏輯層面上包括:正常文字查找單元、特殊文字查找單元以及結(jié)果數(shù)據(jù)生成單元,請(qǐng)參考圖2,該系統(tǒng)在運(yùn)行過(guò)程中執(zhí)行如下處理流程:
[0038]步驟201,正常文字查找單元接收索引標(biāo)識(shí)信息,根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集;
[0039]步驟202,特殊文字查找單元查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集;
[0040]步驟203,結(jié)果數(shù)據(jù)生成單元結(jié)合所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
[0041]本發(fā)明實(shí)施例中,在接收到索引標(biāo)識(shí)信息后,首先根據(jù)接收到的索引標(biāo)識(shí)信息在正常文字庫(kù)內(nèi)查找與其關(guān)聯(lián)的正常文字緩存數(shù)據(jù),并將查找到的正常文字緩存數(shù)據(jù)進(jìn)行優(yōu)先級(jí)排序,且將重復(fù)的緩存數(shù)據(jù)排除掉后生成有序重組的正常文字緩存數(shù)據(jù)集。
[0042]接著,根據(jù)索引標(biāo)識(shí)信息在正常文字與特殊文字映射關(guān)系表項(xiàng)中查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的火星文索引信息,并使用火星文索引信息在特殊文字庫(kù)中查找與其關(guān)聯(lián)的火星文字緩存數(shù)據(jù),同時(shí)將查找到的火星文字緩存數(shù)據(jù)進(jìn)行優(yōu)先級(jí)排序,且將重復(fù)的緩存數(shù)據(jù)排除掉后生成有序重組的火星文緩存數(shù)據(jù)集。
[0043]
【權(quán)利要求】
1.一種特殊文字搜索方法,其特征在于,包括: 步驟A、接收索引標(biāo)識(shí)信息,根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集; 步驟B、查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集;所述特殊文字為火星文字、菊花文以及繁體文字中一種或多種; 步驟C、結(jié)合所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟A與步驟B之間還包括: 判斷所述索引標(biāo)識(shí)信息是否需要進(jìn)行特殊文字搜索; 若是,則在預(yù)設(shè)的正常文字與特殊文字映射關(guān)系表項(xiàng)中查找與所述索引標(biāo)識(shí)信息相對(duì)應(yīng)的特殊文字索引信息,并轉(zhuǎn)至步驟C ; 否則根據(jù)正常文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
3.如權(quán)利要求2所述的方法,其特征在于,每隔預(yù)設(shè)時(shí)間,更新所述正常文字與特殊文字映射關(guān)系表項(xiàng)。
4.如權(quán)利要求1所述的方法,其特征在于,所述步驟C具體包括: 對(duì)所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集進(jìn)行合并以及排重處理,生成結(jié)果數(shù)據(jù)集。
5.如權(quán)利要求1所述的方法,其特征在于,所述步驟A進(jìn)一步包括,` 根據(jù)索引標(biāo)識(shí)信息在正常文字庫(kù)內(nèi)查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集; 所述步驟B進(jìn)一步包括,根據(jù)特殊文字索引信息在預(yù)設(shè)的特殊文字庫(kù)內(nèi)查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集,其中,每隔預(yù)設(shè)時(shí)間,更新所述正常文字庫(kù)與所述特殊文字庫(kù)。
6.一種特殊文字搜索的系統(tǒng),其特征在于,包括: 正常文字查找單元,用于接收索引標(biāo)識(shí)信息,根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集; 特殊文字查找單元,用于查找與所述索引標(biāo)識(shí)信息對(duì)應(yīng)的特殊文字索引信息,并根據(jù)特殊文字索引信息查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集; 結(jié)果數(shù)據(jù)生成單元,用于結(jié)合所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括搜索判斷單元, 在正常文字查找單元根據(jù)索引標(biāo)識(shí)信息查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集后,判斷所述索引標(biāo)識(shí)信息是否需要進(jìn)行特殊文字搜索; 若是,則在預(yù)設(shè)的正常文字與特殊文字映射關(guān)系表項(xiàng)中查找與所述索引標(biāo)識(shí)信息相對(duì)應(yīng)的特殊文字索引信息,并轉(zhuǎn)至結(jié)果數(shù)據(jù)生成單元處理; 否則根據(jù)正常文字緩存數(shù)據(jù)集生成結(jié)果數(shù)據(jù)集。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,每隔預(yù)設(shè)時(shí)間,更新所述正常文字與特殊文字映射關(guān)系表項(xiàng)。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述結(jié)果數(shù)據(jù)生成單元具體用于:對(duì)所述正常文字緩存數(shù)據(jù)集以及特殊文字緩存數(shù)據(jù)集進(jìn)行合并以及排重處理,生成結(jié)果數(shù)據(jù)集。
10.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述正常文字查找單元進(jìn)一步用于,根據(jù)索引標(biāo)識(shí)信息在正常文字庫(kù)內(nèi)查找與所述索引標(biāo)識(shí)信息關(guān)聯(lián)的正常文字緩存數(shù)據(jù)集; 所述特殊文字查找單元進(jìn)一步用于,根據(jù)特殊文字索引信息在預(yù)設(shè)的特殊文字庫(kù)內(nèi)查找與所述特殊文字索引信息關(guān)聯(lián)的特殊文字緩存數(shù)據(jù)集,其中,每隔預(yù)設(shè)時(shí)間,更新所述正常文字庫(kù) 與所述特殊文字庫(kù)。
【文檔編號(hào)】G06F17/30GK103823874SQ201410069092
【公開(kāi)日】2014年5月28日 申請(qǐng)日期:2014年2月27日 優(yōu)先權(quán)日:2014年2月27日
【發(fā)明者】馬宇翔, 李亦峰 申請(qǐng)人:北京六間房科技有限公司