两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

面向用戶的信息搜索引擎系統(tǒng)及方法

文檔序號:6380388閱讀:254來源:國知局

專利名稱::面向用戶的信息搜索引擎系統(tǒng)及方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種面向用戶的信息搜索引擎系統(tǒng)及方法,屬于信息搜索
技術(shù)領(lǐng)域
。技術(shù)背景當(dāng)前,搜索引擎已成為信息查詢的主要工具。隨著信息的海量爆炸式增長,智能、高效的搜索方法可增大大加查詢速度,提高查全率與查準(zhǔn)率,使用戶在盡可能短的時(shí)間內(nèi)獲取盡可能多的關(guān)注信息,為用戶帶來極大的便利。根據(jù)對象控制著手點(diǎn)的不同,目前對搜索引擎設(shè)計(jì)的改進(jìn)方法主要分為兩類面向擴(kuò)展搜索詞語義的方法和面向推斷用戶興趣的方法。面向擴(kuò)展搜索詞語義的方法通過本體技術(shù)解析搜索詞的語義網(wǎng),以達(dá)到擴(kuò)展搜索詞、擴(kuò)大查詢范圍的效果。但使用這種方法存在兩方面的缺點(diǎn),一是僅僅對搜索詞進(jìn)行語義分析,未考慮搜索結(jié)果全文中可能存在著聚合語義的關(guān)鍵信息;二是往往關(guān)注于搜索詞本身的語義而忽略了用戶的意圖,難以使搜索結(jié)果符合用戶的要求。向推斷用戶興趣的方法通過記錄并用戶對歷史搜索結(jié)果的操作,分析用戶感興趣的信息,從而推斷用戶的關(guān)注領(lǐng)域。使用這種方法的缺點(diǎn)在于僅僅考慮了用戶的興趣點(diǎn),未從語義本身層面進(jìn)行擴(kuò)展,由于用戶對自己真正意圖的把握往往存在局限性和不準(zhǔn)確性,此種方法往往也使用戶難以獲得真正符合意圖的搜索結(jié)果。此外,現(xiàn)有的搜索引擎系統(tǒng)均需要用戶手動輸入關(guān)鍵詞,即便提供搜索提示,也僅僅按順序羅列了用戶以往的歷史搜索結(jié)果,未能通過相應(yīng)的解析,按使用頻率進(jìn)行推送,并運(yùn)行用戶對單個(gè)詞進(jìn)行選擇及排序,一定程度上增加了用戶交互的繁瑣性。
發(fā)明內(nèi)容本發(fā)明的技術(shù)解決問題彌補(bǔ)現(xiàn)有技術(shù)的不足,提供一種使查詢結(jié)果范圍更全、精度更高的搜索引擎系統(tǒng)及方法。該方法在推斷用戶興趣的基礎(chǔ)上實(shí)現(xiàn)了搜索詞的重構(gòu),并且在搜索詞的重構(gòu)中綜合考慮了參照權(quán)威敘詞表進(jìn)行語義的擴(kuò)展,擴(kuò)大了搜索范圍,此外,用戶通過該系統(tǒng)可實(shí)現(xiàn)搜索詞的選擇輸入、自主排序,并可通過交互操作提高后續(xù)查詢結(jié)果的精準(zhǔn)性,為用戶執(zhí)行信息搜索提供了一種靈活、便利、智能的交互接口。本發(fā)明的技術(shù)解決方案面向用戶的信息搜索引擎系統(tǒng),如圖I所示,由客戶端和服務(wù)器構(gòu)成,在服務(wù)器負(fù)責(zé)客戶端所傳遞數(shù)據(jù)的后端解析及處理工作,在服務(wù)器端部署搜索詞推送模塊、用戶關(guān)注點(diǎn)更新模塊、初次搜索模塊、用戶興趣推斷模塊、搜索詞重構(gòu)查塊及二次搜索模塊;客戶端主機(jī)通過B/S方式與服務(wù)器進(jìn)行交互,在客戶口端部署用戶發(fā)起搜索模塊、初次搜索模塊;其中上述各模塊實(shí)現(xiàn)如下搜索詞推送模塊服務(wù)器根據(jù)當(dāng)前用戶的身份信息,查詢用戶關(guān)注庫,所述的用戶關(guān)注庫由本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)兩部分組成,所述的本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)均由歷史搜索詞和搜索詞的使用頻率組成,首先解析用戶本人歷史搜索詞,按照搜索詞使用頻率由高到低進(jìn)行排序,選擇使用頻率超過一定閾值的歷史搜索詞,按序?qū)懭胗脩舯救藲v史關(guān)注詞集合,即searchVoc_past集,之后遍歷searchVoc_past集,獲取各歷史搜索詞除當(dāng)前用戶之外的其他歷史用戶,寫入同興趣用戶集合,即user_samelnt集,依次獲取user_samelnt集中各用戶的歷史搜索詞,分別查詢各歷史搜索詞的使用頻率,按照使用頻率由高到低寫入同興趣用戶歷史關(guān)注詞集合,即SearChV0C_past_other集,對searchVoc_past_other集遍歷,在避免重復(fù)的前提下,將其中的詞順序加入searchVoc_past集,根據(jù)searchVoc_past集形成搜索詞推送列表,輸出至客戶端,供用戶發(fā)起搜索模塊調(diào)用;用戶發(fā)起搜索模塊接收搜索詞推送模塊輸出的搜索詞推送列表,解析其中的搜索詞,按順序顯示在客戶端,并提供復(fù)選按鈕及排序按鈕,允許用戶對各搜索詞進(jìn)行選擇或取消,以及設(shè)置搜索詞的優(yōu)先級,根據(jù)用戶的選擇結(jié)果動態(tài)更改搜索詞集合,同時(shí)支持用戶對搜索詞集合進(jìn)行人工補(bǔ)充或修改,以形成最終提交的搜索申請,供用戶關(guān)注點(diǎn)更新模塊以及初次搜索模塊調(diào)用;用戶關(guān)注點(diǎn)更新模塊接收搜索申請,對用戶發(fā)起的搜索行為進(jìn)行記錄,所述的搜索行為由用戶輸入的搜索詞及搜索詞的順序組成,將用戶輸入的搜索詞按序?qū)懭胨阉髟~用戶選擇集合,即searchVoc_select集,遍歷searchVoc_select集,判斷其中的搜索詞是否存在于用戶關(guān)注庫中,如果已存在,則更新該詞當(dāng)前使用頻率,否則,則將該詞寫入用戶關(guān)注庫中的本人歷史關(guān)注點(diǎn)集合,同時(shí)設(shè)置當(dāng)前使用頻率為初始值;初次搜索模塊根據(jù)用戶發(fā)起的搜索行為執(zhí)行初次搜索,首先按照搜索詞的優(yōu)先級對searchVoc_select集中的全部搜索詞進(jìn)行全排列組合,將排列組合后的searchVoc_select集記作searchVoc_select重組集,其中包括獨(dú)立詞及組合詞,遍歷searchVoc_select重組集,依次查詢與其中各個(gè)詞相匹配的搜索結(jié)果,與獨(dú)立詞匹配即表示搜索結(jié)果中包含該獨(dú)立詞,與組合詞匹配即表示搜索結(jié)果包含每一個(gè)組成要素,對于每一個(gè)搜索詞的匹配結(jié)果,統(tǒng)計(jì)全文中與搜索詞的匹配頻率,按匹配頻率由高到低排序,按searchVoc_select重組集的詞序?qū)⑺衅ヅ涞乃阉鹘Y(jié)果列表組合,寫入初始搜索結(jié)果集合,即reSult_firSt集,所述的搜索結(jié)果列表由結(jié)果信息標(biāo)題、摘要、來源組成,其中,摘要為結(jié)果全文中與搜索詞匹配最多的一段文字,將形成的result_first集輸出至客戶端,供用戶查看;用戶興趣推斷模塊記錄用戶對reSult_firSt集的操作,將用戶篩選行為寫入初次搜索結(jié)果用戶篩選集,即result_userSelect集。所述的用戶篩選行為由用戶選擇結(jié)果ID、結(jié)果點(diǎn)擊次數(shù)以及結(jié)果查看時(shí)間組成。對于各條結(jié)果,對“結(jié)果點(diǎn)擊次數(shù)X結(jié)果查看時(shí)間”進(jìn)行求和計(jì)算,得到用戶對各條結(jié)果的關(guān)注程度,按照關(guān)注程度值從高到低進(jìn)行排序,分別解析出各結(jié)果的摘要信息,將摘要信息按順序?qū)懭胗脩艉Y選結(jié)果摘要集,即result_abstract集,輸出至用戶關(guān)注結(jié)果分詞模塊;用戶關(guān)注結(jié)果分詞模塊遍歷result_abstract集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,所述的字典集為哈希表,即HashMap組成的數(shù)組,數(shù)組長度為字典中可作為首字的漢字個(gè)數(shù),數(shù)組索引為該漢字的區(qū)位碼,數(shù)組各元素為該首字對應(yīng)的所有詞組成的HashMap,其中詞本身作為HashMap的key,詞頻作為HashMap的value,分詞完畢后,對照無義詞庫,將無義詞剔除,將各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstraCt_CUt_apart集,同時(shí)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abStraCt_CUt_Unit集,將abstract_cut_apart集和abstract_cut_unit集兩個(gè)集合均輸出至搜索詞重構(gòu)模塊;搜索詞重構(gòu)模塊遍歷abstract_cut_unitt集中的詞語,比對abstract_cut_apart集,解析各詞語在不同摘要中出現(xiàn)的次數(shù),所述的各詞語在不同摘要中出現(xiàn)的次數(shù)不包括該詞語在同一摘要中出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與摘要篇數(shù)相同的詞語,即各篇摘要中均出現(xiàn)的詞語匯集并寫入摘要分詞結(jié)果交集,即abstract_cut—same集,對照中文分類主題詞表,分析abstract_cut_same集,對于與其中詞語具有用代關(guān)系及相關(guān)關(guān)系的詞,寫入摘要分詞結(jié)果重組集,即abstract_cut_reorg集,將abstract_cut_same集及abstract_cut_reorg集兩個(gè)集合均輸出至二次搜索模塊;二次搜索模塊首先解析abstract_cut_same集,按照初次搜索模塊中的方法對集合中的詞進(jìn)行排列組合,遍歷abstract_cut_same集中的各搜索詞,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻,其中,對組合詞而言,與之匹配表示滿足其中每一個(gè)組成要素,之后,解析abstract_cut_reorg集,獲取與其中每個(gè)獨(dú)立詞匹配的文檔、圖片以及視頻,將所有的文檔文件按搜索順序?qū)懭攵嗡阉魑臋n結(jié)果集,即result_second_doc集,將所有的圖片文件按搜索順序?qū)懭攵嗡阉鲌D片結(jié)果集,即result_second_image集,將所有的視頻文件按搜索順序?qū)懭攵嗡阉饕曨l結(jié)果集,即result_second_vedio集,返回result_second_doc集、result_second_image集及result_second_vedio集三個(gè)集合至客戶端,按類別將搜索結(jié)果展示給用戶,提示用戶本次搜索結(jié)果可能更符合其意圖,供用戶深入查看。所述的搜索詞推送模塊實(shí)現(xiàn)過程如下(I)捕獲用戶信息,根據(jù)用戶登錄時(shí)存儲身份信息的session,獲得當(dāng)前登錄者的用戶名、用戶編號,即ID;(2)根據(jù)用戶ID查詢用戶關(guān)注庫,提取出與該ID匹配的歷史搜索詞以及搜索詞使用頻率,搜索詞記為V,使用頻率記為F,將結(jié)果按F值的降序排列;(3)設(shè)預(yù)設(shè)的詞頻閾值為E,比使用頻率F與設(shè)定閾值E的大??;c.如果F>=E,則將F對應(yīng)的V寫入用戶本人歷史關(guān)注詞集,記作searchVoc_past集;d.如果F<E,則不做處理;(4)解析searchVoc_past集,依次遍歷其中的搜索詞V,查詢用戶關(guān)注庫,獲得與V匹配的除當(dāng)前用戶之外的其他用戶ID,寫入同興趣用戶集合,即uSer_SameInt集;(5)根據(jù)user_samelnt集中各用戶ID,查詢用戶關(guān)注庫,分別獲取與各用戶ID匹配的歷史搜索詞記錄,遍歷記錄中的歷史搜索詞,分別統(tǒng)計(jì)各搜索詞用戶關(guān)注庫中的使用頻率,按頻率從高到底寫入同興趣用戶歷史關(guān)注詞集合,即searchVoc_past_other集;(6)遍歷searchVoc_past_other集,依次判斷該詞是否已存在于searchVoc_past集中;c.如果已經(jīng)存在,則對本詞不作處理,繼續(xù)解析下一個(gè)詞;d.如果不存在,則將該詞加入到searchVoc_past集中;(7)將SearChV0C_paSt集作為數(shù)組存儲在緩存中,作為搜索詞推送列表輸出至客戶端,供用戶發(fā)起搜索模塊調(diào)用。所述的搜索詞重構(gòu)模塊實(shí)現(xiàn)過程如下(I)遍歷用戶篩選結(jié)果摘要集,即result_abstract集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstract_cut_apart集,數(shù)組個(gè)數(shù)記為N;(2)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即absrtact_cut_unit集;(3)對abstract_cut_unit集進(jìn)行遍歷,對其中每個(gè)搜索詞,執(zhí)行以下操作;(3.I)初始化當(dāng)前搜索詞的出現(xiàn)頻率Fabs=O;(3.2)遍歷abstract_cut_apan集中的各個(gè)數(shù)組元素,判斷該數(shù)組元素中是否包含當(dāng)前搜索詞;c.如果包含,則Fabs=Fabs+1,繼續(xù)判斷下一條數(shù)組元素;d.如果不包含,F(xiàn)abs值不變。(3.3)將當(dāng)前搜索詞對應(yīng)的Fabs值與abstract_cut_apart集中的數(shù)組個(gè)數(shù)進(jìn)行比較;c.如果Fabs=N,將當(dāng)前搜索詞寫入摘要分詞結(jié)果交集,即abstract_cut_same;d.如果Fabs<N,不做處理,繼續(xù)判斷下一搜索詞。(4)遍歷abstract_cut_same集,對其中每個(gè)搜索詞,在中文分類主題詞表中檢索以該詞為款目敘詞的語義網(wǎng);(4.I)如果語義網(wǎng)中有標(biāo)識為“Y”的關(guān)系詞,表示該詞具有正式表達(dá)詞,將正式表達(dá)詞寫入集合abstract_cut_reorg;(4.2)如果語義網(wǎng)中有標(biāo)識為“D”的關(guān)系詞,表示該詞具有非正式表達(dá)詞,將非正式表達(dá)詞寫入集合abstract_cut_reorg;(4.3)如果語義網(wǎng)中有標(biāo)識為“C”的關(guān)系詞,表示該詞具有詞義與之相關(guān)的表達(dá)詞,將相關(guān)表達(dá)詞寫入集合abstract_cut_reorg;(5)將abstract_cut_same集及abstract_cut_reorg集均作為數(shù)組輸出至二次搜索模塊。面向用戶的信息搜索引擎系實(shí)現(xiàn)方法的實(shí)現(xiàn)步驟如下(I)服務(wù)器根據(jù)當(dāng)前用戶的身份信息,查詢用戶關(guān)注庫,所述的用戶關(guān)注庫由本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)兩部分組成,所述的本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)均由歷史搜索詞和搜索詞的使用頻率組成,首先解析用戶本人歷史搜索詞,按照搜索詞使用頻率由高到低進(jìn)行排序,選擇使用頻率超過一定閾值的歷史搜索詞,按序?qū)懭胗脩舯救藲v史關(guān)注詞集合,即searchVoc_past集,之后遍歷searchVoc_past集,獲取各歷史搜索詞除當(dāng)前用戶之外的其他歷史用戶,寫入同興趣用戶集合,即uSer_sameInt集,依次獲取user_samelnt集中各用戶的歷史搜索詞,分別查詢各歷史搜索詞的使用頻率,按照使用頻率由高到低寫入同興趣用戶歷史關(guān)注詞集合,即SearChV0C_paSt_other集,對searchVoc_past_other集遍歷,在避免重復(fù)的前提下,將其中的詞順序加入searchVoc_past集,根據(jù)searchVoc_past集形成搜索詞推送列表,輸出至客戶端,供用戶發(fā)起搜索模塊調(diào)用;10(2)接收搜索詞推送列表,解析其中的搜索詞,按順序顯示在客戶端,并提供復(fù)選按鈕及排序按鈕,允許用戶對各搜索詞進(jìn)行選擇或取消,以及設(shè)置搜索詞的優(yōu)先級,根據(jù)用戶的選擇結(jié)果動態(tài)更改搜索詞集合,同時(shí)支持用戶對搜索詞集合進(jìn)行人工補(bǔ)充或修改,以形成最終提交的搜索申請;(3)接收搜索申請,對用戶發(fā)起的搜索行為進(jìn)行記錄,所述的搜索行為由用戶輸入的搜索詞及搜索詞的順序組成,將用戶輸入的搜索詞按序?qū)懭胨阉髟~用戶選擇集合,即searchVoc_select集,遍歷searchVoc_select集,判斷其中的搜索詞是否存在于用戶關(guān)注庫中,如果已存在,則更新該詞當(dāng)前使用頻率,否則,則將該詞寫入用戶關(guān)注庫中的本人歷史關(guān)注點(diǎn)集合,同時(shí)設(shè)置當(dāng)前使用頻率為初始值,為后續(xù)的搜索詞推送提供數(shù)據(jù)基礎(chǔ);(4)根據(jù)用戶發(fā)起的搜索行為執(zhí)行初次搜索,首先按照搜索詞的優(yōu)先級對searchVoc_select集中的全部搜索詞進(jìn)行全排列組合,排列組合后的searchVoc_select集中包括獨(dú)立詞及組合詞,遍歷排列組合后的searchVoc_select集,依次查詢與其中各個(gè)詞相匹配的搜索結(jié)果,與獨(dú)立詞匹配即表示搜索結(jié)果中包含該獨(dú)立詞,與組合詞匹配即表示搜索結(jié)果包含每一個(gè)組成要素,對于每一個(gè)搜索詞的匹配結(jié)果,統(tǒng)計(jì)全文中與搜索詞的匹配頻率,按匹配頻率由高到低排序,按searchVoc^select集的詞序?qū)⑺衅ヅ涞乃阉鹘Y(jié)果列表組合,寫入初始搜索結(jié)果集合,即reSult_firSt集,所述的搜索結(jié)果列表由結(jié)果信息標(biāo)題、摘要、來源組成,其中,摘要為結(jié)果全文中與搜索詞匹配最多的一段文字,將形成的result_first集輸出至客戶端,供用戶查看;(5)記錄用戶對result_first集的操作,將用戶篩選行為寫入初次搜索結(jié)果用戶篩選集,即result_userSelect集。所述的用戶篩選行為由用戶選擇結(jié)果ID、結(jié)果點(diǎn)擊次數(shù)以及結(jié)果查看時(shí)間組成。對于各條結(jié)果,對“結(jié)果點(diǎn)擊次數(shù)X結(jié)果查看時(shí)間”進(jìn)行求和計(jì)算,得到用戶對各條結(jié)果的關(guān)注程度,按照關(guān)注程度值從高到低進(jìn)行排序,分別解析出各結(jié)果的摘要信息,將摘要信息按順序?qū)懭胗脩艉Y選結(jié)果摘要集,即reSult_abStraCt集,供分詞使用;(6)遍歷result_abstract集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,所述的字典集為哈希表,即HashMap組成的數(shù)組,數(shù)組長度為字典中可作為首字的漢字個(gè)數(shù),數(shù)組索弓I為該漢字的區(qū)位碼,數(shù)組各元素為該首字對應(yīng)的所有詞組成的HashMap,其中詞本身作為HashMap的key,詞頻作為HashMap的value,分詞完畢后,對照無義詞庫,將無義詞剔除,將各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstraCt_CUt_apart集,同時(shí)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abstract_cut_unit集;(7)遍歷abstract_cut_unitt集中的詞語,比對abstract_cut_apart集,解析各詞語在不同摘要中出現(xiàn)的次數(shù),所述的各詞語在不同摘要中出現(xiàn)的次數(shù)不包括該詞語在同一摘要中出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與摘要篇數(shù)相同的詞語,即各篇摘要中均出現(xiàn)的詞語匯集并寫入摘要分詞結(jié)果交集,即abstract_cut_same集,對照中文分類主題詞表,分析abstract_cut_same集,對于與其中詞語具有用代關(guān)系及相關(guān)關(guān)系的詞,寫入摘要分詞結(jié)果重組集,即abstract_cut_reorg集,供二次搜索使用。(8)首先解析abstract_cut_same集,按照初次搜索模塊中的方法對集合中的詞進(jìn)行排列組合,遍歷abstract_cut_same集中的各搜索詞,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻,其中,對組合詞而言,與之匹配表示滿足其中每一個(gè)組成要素,之后,解析abstract_cut_reorg集,獲取與其中每個(gè)獨(dú)立詞匹配的文檔、圖片以及視頻,將所有的文檔文件按搜索順序?qū)懭攵嗡阉魑臋n結(jié)果集,即result_seconddoc集,將所有的圖片文件按搜索順序?qū)懭攵嗡阉鲌D片結(jié)果集,即result_second_image集,將所有的視頻文件按搜索順序?qū)懭攵嗡阉饕曨l結(jié)果集,即result_second_vedio集,返回result_seconddoc集、result_secondimage集及result_second_vedio集三個(gè)集合至客戶端,按類別將搜索結(jié)果展示給用戶,為用戶提供更精準(zhǔn)的搜索結(jié)果。本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于(I)本發(fā)明綜合了關(guān)鍵詞語義擴(kuò)展以及用戶興趣推斷,在捕捉用戶交互操作的基礎(chǔ)上,通過提取并解析全文中的關(guān)鍵信息進(jìn)行語義的擴(kuò)展,實(shí)現(xiàn)搜索詞的重構(gòu),提高了搜索詞的權(quán)威性、收斂性,使搜索結(jié)果更符合用戶的真實(shí)意圖。(2)本發(fā)明可通過捕捉用戶信息實(shí)現(xiàn)對歷史搜索詞的自動推送,并支持用戶對搜索詞的選擇輸入、自主排序,簡化了現(xiàn)有搜索引擎中用戶輸入搜索詞的工作量,為用戶執(zhí)行信息搜索提供了一種靈活、便利的交互接口。(3)本發(fā)明可通過記錄用戶發(fā)起的搜索申請,不斷補(bǔ)充并完善用戶的關(guān)注點(diǎn),增強(qiáng)后續(xù)查詢結(jié)果的精準(zhǔn)性,提高了搜索引擎系統(tǒng)的智能化程度。(4)本發(fā)明在用戶提交搜索請求時(shí),首先根據(jù)初始搜索詞返回一定數(shù)量的搜索結(jié)果,快速響應(yīng)用戶請求;在用戶查看信息的同時(shí),根據(jù)用戶的操作反饋進(jìn)行搜索詞重構(gòu)及二次搜索,并將更深入的搜索結(jié)果以推薦形式反饋給用戶,在保證搜索效率的同時(shí),提高了查全率與查準(zhǔn)率。圖I為本發(fā)明系統(tǒng)的體系結(jié)構(gòu)圖2為本發(fā)明系統(tǒng)中的搜索詞推送模塊實(shí)現(xiàn)過程;圖3為本發(fā)明系統(tǒng)中的用戶發(fā)起搜索模塊實(shí)現(xiàn)過程;圖4為本發(fā)明系統(tǒng)中的用戶關(guān)注點(diǎn)更新及初次搜索模塊實(shí)現(xiàn)過程;圖5為本發(fā)明系統(tǒng)中的用戶興趣推斷模塊實(shí)現(xiàn)過程;圖6為本發(fā)明的用戶關(guān)注結(jié)果分詞、重構(gòu)及二次搜索模塊實(shí)現(xiàn)過程。具體實(shí)施方式本發(fā)明面向用戶的信息搜索引擎系統(tǒng),其系統(tǒng)由服務(wù)器和客戶端組成,數(shù)據(jù)庫服務(wù)器采用Xeon2.8雙核處理器,16G內(nèi)存,2TB硬盤,負(fù)責(zé)存儲所有的數(shù)據(jù)信息,同時(shí)配置磁帶庫和備份軟件,作為歷史數(shù)據(jù)備份和恢復(fù)使用;應(yīng)用服務(wù)器采用LinuX操作系統(tǒng),OracleQi以上的數(shù)據(jù)管理軟件,包括搜索詞推送模塊、用戶關(guān)注點(diǎn)更新及初次搜索模塊、用戶興趣推斷模塊、搜索詞重構(gòu)及二次搜索模塊,負(fù)責(zé)客戶端所傳遞數(shù)據(jù)的后端解析及處理工作;客戶端主機(jī)采用3.OCPU,4G內(nèi)存,500G硬盤,使用WindowsXP操作系統(tǒng),通過B/S方式與服務(wù)器進(jìn)行交互,主要功能為前端展示,包括用戶發(fā)起搜索模塊,以及初次搜索結(jié)果及二次搜索結(jié)果的展示工作。為了更好地理解本發(fā)明,先對一些基本概念進(jìn)行一下解釋說明。搜索詞推送列表由推薦搜索詞組成的一個(gè)數(shù)組,數(shù)組中的元素由用戶本人的歷史搜索詞和同興趣用戶的歷史搜索詞組成,每一個(gè)元素為一個(gè)搜索詞,元素的順序按搜索詞的使用頻率由高到低排列。搜索詞用戶選擇集合用戶根據(jù)自身搜索意愿,通過對系統(tǒng)推送的搜索詞進(jìn)行人為篩選形成的搜索詞列表。篩選操作包括選擇某個(gè)推送詞作為搜索詞、從當(dāng)前搜索詞列表中移除某個(gè)推送詞、調(diào)整搜索詞列表中的詞序、補(bǔ)充新的搜索詞等。搜索詞用戶選擇集合記作searchVoc_select集。searchVoc_select重組集對searchVoc_seIect集中的搜索詞進(jìn)行全排列組合后的集合,全排列組合后的詞序以遵照原集合中各詞的優(yōu)先級為原則,假設(shè)searChV0C_select集為(A,B,C),則進(jìn)行全排列組合之后的searchVoc_select重組集為(ABC,AB,AC,BC,A,B,C),重組集中包括獨(dú)立詞及組合詞,獨(dú)立指具有單獨(dú)詞義的詞,本例中包括A、B、C,組合詞指多個(gè)詞組合在一期的詞,本例中包括ABC、AB、AC、BC。逆向匹配算法一種基本的分詞算法,其基本思想是假設(shè)字典中最大詞條所含有的漢字個(gè)數(shù)為η個(gè),從待處理字符串的末尾開始,向前取η個(gè)字作為匹配字段,查找分詞字典,若字典中含有該詞,則匹配成功,分出該詞,然后從待處理字符串從末尾屬第η+1處開始再取η個(gè)字組成的字段重新在字典中匹配;如果沒有匹配成功,則將這η個(gè)字組成的字段的最后一位剔除,用剩下的η-i個(gè)字組成的字段在字典中進(jìn)行匹配,如此進(jìn)行下去,直到切分成功為止。例如,在分詞過程中,假設(shè)文本中的字串為ABC,W為字典,若CeW,BCeff,ABC€W,那么就取切分a/bc。摘要分詞結(jié)果離散集對搜索結(jié)果用戶篩選集中的各篇摘要信息分別進(jìn)行分詞,由各篇分詞結(jié)果組成的數(shù)組。數(shù)組長度為搜索結(jié)果的篇數(shù),數(shù)組元素為各篇摘要分詞集合,例如,記摘要分詞結(jié)果離散集為abstract_cut_apart,其第一個(gè)元素的形式為abstract_cut_apart[O]={液體發(fā)動機(jī),組成,包括......}。摘要分詞結(jié)果組合集各篇摘要分詞結(jié)果的并集組成的數(shù)組。數(shù)組長度為1,數(shù)組元素為包含所有分詞的并集。中文分類主題詞表顯示主題詞與詞間語義關(guān)系的規(guī)范化動態(tài)性的檢索語言詞表,是主題標(biāo)引、檢索和組織目錄、索引的主要工具,中文分類主題詞表涉及的主題專業(yè)范圍包括哲學(xué)、社會科學(xué)和自然科學(xué)、工程技術(shù)等所有領(lǐng)域的學(xué)科和主題概念。本發(fā)明中通過查詢中文分類主題詞表中搜索詞的語義關(guān)系,實(shí)現(xiàn)搜索詞語義的擴(kuò)展。語義網(wǎng)中文分類主題詞表中詞與詞之間關(guān)系的組合,主題詞之間的關(guān)系包括周、代、屬、分、族、參,其對應(yīng)的關(guān)系符合分別為“Y”、“D”、“S”、“F”、“Z”、“C”。其中,“Y”后面的詞表示款目敘詞的正式表達(dá);“D”后面的詞表示款目敘詞的非正式表達(dá);“S”后面的詞表示款目敘詞的上位詞,比款目敘詞高一個(gè)等級;“F”后面的詞表示款目敘詞的下位詞,比款目敘詞低一個(gè)等級;“Z”后面的詞表示款目敘詞的族首詞;“C”后面的詞表示款目敘詞的參照ο下面結(jié)合附圖對本發(fā)明進(jìn)行詳細(xì)說明如圖I所示,本發(fā)明面向用戶的信息搜索引擎系統(tǒng)搜索詞推送模塊、用戶發(fā)起搜索模塊、用戶關(guān)注點(diǎn)更新模塊、初次搜索模塊、用戶興趣推斷模塊、用戶關(guān)注結(jié)果分詞模塊、搜索詞重構(gòu)模塊以及二次搜索模塊構(gòu)成。整個(gè)實(shí)現(xiàn)過程如下(I)服務(wù)器根據(jù)當(dāng)前用戶的身份信息,查詢用戶關(guān)注庫,所述的用戶關(guān)注庫由本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)兩部分組成,所述的本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)均由歷史搜索詞和搜索詞的使用頻率組成,首先解析用戶本人歷史搜索詞,按照搜索詞使用頻率由高到低進(jìn)行排序,選擇使用頻率超過一定閾值的歷史搜索詞,按序?qū)懭胗脩舯救藲v史關(guān)注詞集合,即searchVoc_past集,之后遍歷searchVoc_past集,獲取各歷史搜索詞除當(dāng)前用戶之外的其他歷史用戶,寫入同興趣用戶集合,即uSer_sameInt集,依次獲取user_samelnt集中各用戶的歷史搜索詞,分別查詢各歷史搜索詞的使用頻率,按照使用頻率由高到低寫入同興趣用戶歷史關(guān)注詞集合,即SearChV0C_paSt_other集,對searchVoc_past_other集遍歷,在避免重復(fù)的前提下,將其中的詞順序加入searchVoc_past集,根據(jù)searchVoc_past集形成搜索詞推送列表,輸出至客戶端;(2)接收搜索詞推送列表,解析其中的搜索詞,按順序顯示在客戶端,并提供復(fù)選按鈕及排序按鈕,允許用戶對各搜索詞進(jìn)行選擇或取消,以及設(shè)置搜索詞的優(yōu)先級,根據(jù)用戶的選擇結(jié)果動態(tài)更改搜索詞集合,同時(shí)支持用戶對搜索詞集合進(jìn)行人工補(bǔ)充或修改,以形成最終提交的搜索申請;(3)接收搜索申請,對用戶發(fā)起的搜索行為進(jìn)行記錄,所述的搜索行為由用戶輸入的搜索詞及搜索詞的順序組成,將用戶輸入的搜索詞按序?qū)懭胨阉髟~用戶選擇集合,即searchVoc_select集,遍歷searchVoc_select集,判斷其中的搜索詞是否存在于用戶關(guān)注庫中,如果已存在,則更新該詞當(dāng)前使用頻率,否則,則將該詞寫入用戶關(guān)注庫中的本人歷史關(guān)注點(diǎn)集合,同時(shí)設(shè)置當(dāng)前使用頻率為初始值,為后續(xù)的搜索詞推送提供數(shù)據(jù)基礎(chǔ),同時(shí),根據(jù)用戶發(fā)起的搜索行為執(zhí)行初次搜索,首先按照搜索詞的優(yōu)先級對searChV0C_select集中的全部搜索詞進(jìn)行全排列組合,排列組合后的searchVoc_select集中包括獨(dú)立詞及組合詞,遍歷排列組合后的searchVoc_select集,依次查詢與其中各個(gè)詞相匹配的搜索結(jié)果,與獨(dú)立詞匹配即表示搜索結(jié)果中包含該獨(dú)立詞,與組合詞匹配即表示搜索結(jié)果包含每一個(gè)組成要素,對于每一個(gè)搜索詞的匹配結(jié)果,統(tǒng)計(jì)全文中與搜索詞的匹配頻率,按匹配頻率由高到低排序,按searchVoc^select集的詞序?qū)⑺衅ヅ涞乃阉鹘Y(jié)果列表組合,寫入初始搜索結(jié)果集合,即reSult_firSt集,所述的搜索結(jié)果列表由結(jié)果信息標(biāo)題、摘要、來源組成,其中,摘要為結(jié)果全文中與搜索詞匹配最多的一段文字,將形成的result_first集輸出至客戶端,供用戶查看;(4)記錄用戶對result_first集的操作,將用戶篩選行為寫入初次搜索結(jié)果用戶篩選集,即result_userSelect集。所述的用戶篩選行為由用戶選擇結(jié)果ID、結(jié)果點(diǎn)擊次數(shù)以及結(jié)果查看時(shí)間組成。對于各條結(jié)果,對“結(jié)果點(diǎn)擊次數(shù)X結(jié)果查看時(shí)間”進(jìn)行求和計(jì)算,得到用戶對各條結(jié)果的關(guān)注程度,按照關(guān)注程度值從高到低進(jìn)行排序,分別解析出各結(jié)果的摘要信息,將摘要信息按順序?qū)懭胗脩艉Y選結(jié)果摘要集,即reSult_abStraCt集,供分詞使用;(5)遍歷result_abstract集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,所述的字典集為哈希表,即HashMap組成的數(shù)組,數(shù)組長度為字典中可作為首字的漢字個(gè)數(shù),數(shù)組索弓I為該漢字的區(qū)位碼,數(shù)組各元素為該首字對應(yīng)的所有詞組成的HashMap,其中詞本身作為HashMap的key,詞頻作為HashMap的value,分詞完畢后,對照無義詞庫,將無義詞剔除,將各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstraCt_CUt_apart集,同時(shí)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abstract_cut_unit集,遍歷abstract_cut_ulitt集中的詞語,比對abstract_cut_apart集,解析各詞語在不同摘要中出現(xiàn)的次數(shù),所述的各詞語在不同摘要中出現(xiàn)的次數(shù)不包括該詞語在同一摘要中出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與摘要篇數(shù)相同的詞語,即各篇摘要中均出現(xiàn)的詞語匯集并寫入摘要分詞結(jié)果交集,即abstract_cut_same集,對照中文分類主題詞表,分析abstract_cut_same集,對于與其中詞語具有用代關(guān)系及相關(guān)關(guān)系的詞,寫入摘要分詞結(jié)果重組集,即abStraCt_CUt_reorg集,解析abstract_cut_same集,按照初次搜索模塊中的方法對集合中的詞進(jìn)行排列組合,遍歷abstract_cut_same集中的各搜索詞,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻,其中,對組合詞而言,與之匹配表示滿足其中每一個(gè)組成要素,之后,解析abstract_cut_reorg集,獲取與其中每個(gè)獨(dú)立詞匹配的文檔、圖片以及視頻,將所有的文檔文件按搜索順序?qū)懭攵嗡阉魑臋n結(jié)果集,即result_second_doc集,將所有的圖片文件按搜索順序?qū)懭攵嗡阉鲌D片結(jié)果集,即result_second_image集,將所有的視頻文件按搜索順序?qū)懭攵嗡阉饕曨l結(jié)果集,即result_second_vedio集,返回result_second_doc集、result_second_image集及result_second_vedio集三個(gè)集合至客戶端,按類別將搜索結(jié)果展示給用戶,為用戶提供更精準(zhǔn)的搜索結(jié)果。上述各模塊的具體實(shí)現(xiàn)過程如下I.搜索詞推送模塊該模塊的實(shí)現(xiàn)過程如圖2所示(I)捕獲用戶信息,根據(jù)用戶登錄時(shí)存儲身份信息的session,獲得當(dāng)前登錄者的用戶名、ID;(2)根據(jù)用戶ID查詢用戶關(guān)注表,記作searchVoc_past_table,提取出與該ID匹配的歷史搜索詞以及搜索詞使用頻率,搜索詞記為V,使用頻率記為F,將結(jié)果按F值的降序排列;(3)設(shè)預(yù)設(shè)的詞頻閾值為E,比使用頻率F與設(shè)定閾值E的大?。籥.如果F>=E,則將F對應(yīng)的V寫入用戶關(guān)注的歷史詞集,記作searchVoc_past集;b.如果F<E,則不做處理;(4)解析searchVoc_past集,依次遍歷其中的搜索詞V,查詢searchVoc_past_able表,獲得與V匹配的除當(dāng)前用戶之外的其他用戶ID,寫入user_samelnt集;(5)根據(jù)user_samelnt集中各用戶ID,查詢searchVoc_past_table,獲取匹配的歷史搜索詞記錄,分別統(tǒng)計(jì)各搜索詞在searchVoc_past_table中的使用頻率,按頻率從高到底寫入searchVoc_past_other集;(6)遍歷searchVoc_past_other集,依次判斷該詞是否已存在于searchVoc_past集中;a.如果已經(jīng)存在,則對本詞不作處理,繼續(xù)解析下一個(gè)詞;b.如果不存在,則將該詞寫入到searchVoc_past集中。(7)遍歷結(jié)束后,形成的searchVoc_past集即為搜索詞推送列表。2.用戶發(fā)起搜索模塊該模塊的實(shí)現(xiàn)過程如圖3所示(I)接收搜索詞推送列表,即searchVoc_past集,并讀入緩沖區(qū)中;(2)判斷searchVoc_past集的長度,記為L;(3)如果L>0,則(3.I)以L為循環(huán)邊界依次讀取搜索詞推送列表中的搜索詞,包括搜索詞ID以及搜索詞內(nèi)容,將搜索詞內(nèi)容顯示在客戶端,并在每個(gè)搜索詞前方生成復(fù)選框按鈕,復(fù)選框按鈕的ID即為當(dāng)前讀取的搜索詞的ID;(3.2)遍歷結(jié)束后,生成排序按鈕,顯示在客戶端;(4)將搜索框中的內(nèi)容存儲為字符串,記作strjearchVoc;(5)判斷str_searchVoc是否為空,如果為空,貝U初始化str_searchVoc為一個(gè)至格字符;(6)解析用戶的操作,(6.I)選中某搜索詞復(fù)選框,判斷str_searchVoc中是否包含被選中的搜索詞,如果包含,不做任何操作;如果不包含,則將該搜索詞附加在srt_searchVoc之后,同時(shí)附加空格分隔符;(6.2)取消選中某搜索詞復(fù)選框,判斷str_searchVoc中是否包含被選中的搜索詞;如果包含,則去除該搜索詞以及其后的空格分隔符;如果不包含,不做任何操作;(6.3)排序上移/下移,判斷是否有選中的搜索詞,(6.3.I)如果沒有,提示用戶進(jìn)行選擇;(6.3.2)如果選中的搜索詞大于一個(gè),提示用戶只能選擇一個(gè)搜索詞進(jìn)行操作;(6.3.3)如果選中了一個(gè)搜索詞,則a.將該搜索詞順序上移/下移一個(gè)排列位,并按照當(dāng)前的排序次序?qū)⒏魉阉髟~組成一個(gè)字符串,記作str_searchVoc_newSeq,詞與詞之間以空格分隔;b.比對分析str_searchVoc和str_searchVoc_newSeq,依次解析str_searchVoc_newSeq中的搜索詞,并判斷是否存在于str_searchVoc中,如果不存在于str_searchVoc中,在str_searchVoc_newSeq中進(jìn)行剔除;c.將處理完畢的字符串替換str_searchVoc,并將str_searchVoc中的詞重新寫入客戶端的搜索框;(6.4)用戶確認(rèn)操作后,提交搜索請求,將str_searchVoc提交到服務(wù)器。3.用戶關(guān)注點(diǎn)更新及初次搜索模塊用戶關(guān)注點(diǎn)更新及初次搜索模塊由用戶關(guān)注點(diǎn)更新模塊及初次搜索模塊兩個(gè)子模塊構(gòu)成,其執(zhí)行過程如圖4所示(I)接收搜索申請,即str_searchVoc,并存入緩沖區(qū);(2)解析str_searchVoc,按分隔符將str_searchVoc中的搜索詞分隔為數(shù)組,依次寫入searchVoc_select集;(3)遍歷searchVoc_select集,判斷其中的搜索詞是否存在于用戶關(guān)注庫中的用戶關(guān)注表,即searchVoc_past_table,a.如果已存在,則讀取該詞的當(dāng)前使用頻率,記為f,將f值轉(zhuǎn)換為整型后加I;b.如果不存在,則將該詞寫入用戶關(guān)注庫中的用戶關(guān)注表,插入值包括用戶ID、搜索詞內(nèi)容和搜索詞使用頻率,搜索詞使用頻率設(shè)定為初始值。(4)解析searchVoc_select集,由于搜索詞過多會造成搜索結(jié)果的大量冗余,因此只從前向后提取一定數(shù)量的搜索詞;(5)形成所提取的搜索詞的所有排列組合,形成重排字符串,組合詞之間以分號(“分隔,組合詞的元素(即組成組合詞的各獨(dú)立詞)之間以逗號(“,”)分隔;(6)按分號分隔符(“;,,)對重排字符串進(jìn)行分隔,寫入searchVoc^select重組集,記作searchVoc_select_reArr;(7)遍歷searchVoc_select_reArr,對其中的每一個(gè)元素進(jìn)行如下操作(7.I)按逗號分隔符(“,”)對每一個(gè)元素進(jìn)行分隔,生成arr_COnVOC數(shù)組;(7.2)判斷arr_conVoc數(shù)組的長度L,(7.2.I)如果L=1,則說明該元素為獨(dú)立詞,對該詞進(jìn)行匹配搜索,對于每一項(xiàng)搜索結(jié)果,執(zhí)行如下操作a.解析搜索結(jié)果全文,以回車為分隔符分隔出各自然段落,記作arr_result_para數(shù)組;b.遍歷arr_result_para數(shù)組,依次統(tǒng)計(jì)各元素中包含該獨(dú)立詞的個(gè)數(shù),將個(gè)數(shù)最多的一段提取出來,作為摘要;c.將標(biāo)題、摘要、來源組合為搜索結(jié)果列表,寫入初始搜索結(jié)果集,即resullfirst集;(7.2.2)如果L>1,則說明該元素為組合詞,依次提取出該元素的arr_ConVoC數(shù)組中的子元素,即獨(dú)立詞,按照(4.2.I)中的步驟執(zhí)行搜索,獲得滿足所有獨(dú)立詞的結(jié)果,將(8)遍歷結(jié)束后,形成最終的result_first集,輸出至客戶端,供用戶查看4.用戶興趣推斷模塊用戶興趣推斷模塊的實(shí)現(xiàn)過程如圖5所示(I)初始化初次搜索結(jié)果用戶篩選集,即result_userSelect集;(2)對于用戶的操作,記錄下所選擇結(jié)果的ID;(3)判斷該ID是否已存在于result_userSelect集中,(3.I)如果不存在,則a.該初始化該搜索結(jié)果ID的順序號P為I,點(diǎn)擊次數(shù)N為I,記錄下當(dāng)前操作時(shí)間Tcurrent,寫人result_userSelect集中;b.取出result_userSelect集中最大的T值,記為Tmaxljast,如果T值不存在,貝U取TmaxLast;C.通過Teiment-Tniajiast算出Tniajiast對應(yīng)的搜索結(jié)果的瀏覽時(shí)間,寫入result_userSelect集中;(3.2)如果已經(jīng)存在,則取出該ID當(dāng)前對應(yīng)的點(diǎn)擊次數(shù)N,將N值增1,并更新result_userSelect集中相應(yīng)數(shù)值;(4)遍歷result_userSelect集,按“結(jié)果初次點(diǎn)擊順序/求和(結(jié)果點(diǎn)擊次數(shù)x結(jié)果查看時(shí)間)”進(jìn)行用戶關(guān)注度計(jì)算,求得用戶對篩選的各條結(jié)果的關(guān)注度;(5)按對應(yīng)用戶關(guān)注度從高到低對result_userSelect集進(jìn)行排序,提取排在前列的一定數(shù)量的信息,分別取出各ID值對應(yīng)的摘要信息,寫入用戶篩選結(jié)果摘要集,即result_abstract集。5.用戶關(guān)注結(jié)果分詞、重構(gòu)及二次搜索模塊用戶關(guān)注結(jié)果分詞、重構(gòu)及二次搜索由用戶關(guān)注結(jié)果分詞模塊、搜索詞重構(gòu)模塊以及二次搜索模塊三個(gè)子模塊構(gòu)成,實(shí)現(xiàn)過程如圖6所示(I)遍歷result_absrtact集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstract_cut_apart集,數(shù)組個(gè)數(shù)記為N;(2)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abstract_cut_unit集;(3)對所有摘要分詞結(jié)果組成的集合進(jìn)行遍歷,對其中每個(gè)搜索詞,執(zhí)行以下操作;(3.I)初始化當(dāng)前搜索詞的出現(xiàn)頻率Fabs=O;(3.2)遍歷abstract_cut_apart集中的各個(gè)數(shù)組元素,判斷該數(shù)組元素中是否包含當(dāng)前搜索詞;e.如果包含,則Fabs=Fabs+1,繼續(xù)判斷下一條數(shù)組元素;f.如果不包含,F(xiàn)abs值不變。(3.3)將當(dāng)前搜索詞對應(yīng)的Fabs值與abstract_cut_apart集中的數(shù)組個(gè)數(shù)進(jìn)行比較;a.如果Fabs=N,將當(dāng)前搜索詞寫入摘要分詞結(jié)果交集,即abstract_cut_same;b.如果Fabs<N,不做處理,繼續(xù)判斷下一搜索詞。(4)遍歷abstract_cut_same集,對其中每個(gè)搜索詞,在中文分類主題詞表中檢索以該詞為款目敘詞的語義網(wǎng);(4.I)如果語義網(wǎng)中有標(biāo)識為“Y”的關(guān)系詞,表示該詞具有正式表達(dá)詞,將正式表達(dá)詞寫入摘要分詞結(jié)果重組集,即abstract_cut_reorg;(4.2)如果語義網(wǎng)中有標(biāo)識為“D”的關(guān)系詞,表示該詞具有非正式表達(dá)詞,將非正式表達(dá)詞寫入集合abstract_cut_reorg;(4.3)如果語義網(wǎng)中有標(biāo)識為“C”的關(guān)系詞,表示該詞具有詞義與之相關(guān)的表達(dá)詞,將相關(guān)表達(dá)詞寫入集合abstract_cut_reorg。(5)按照初次搜索模塊中的方法對abstract_cut_same集合中的詞進(jìn)行排列組合,遍歷abstract_cut_same集中的各搜索詞,按照初次搜索模塊的搜索方法,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻;(6)遍歷abstract_cut_reorg集合,讀取各獨(dú)立詞,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻;(7)將所有的文檔文件按搜索順序?qū)懭雛esult_second_doc集,將所有的圖片文件按搜索順序?qū)懭雛esult_second_image集,將所有的視頻文件按搜索順序?qū)懭雛esult_second_vedio集;(8)返回result_second_doc、result_second_image及esult_second_vedio三個(gè)集合至客戶端,按類別將搜索結(jié)果展示給用戶,提示用戶本次搜索結(jié)果可能更符合其意圖,供用戶深入查看。應(yīng)用舉例本發(fā)明的系統(tǒng)及方法已經(jīng)成功應(yīng)用于航天運(yùn)載火箭技術(shù)研究院的航天器型號的研制中,協(xié)助研發(fā)設(shè)計(jì)人員快速、便捷得到最需要的知識信息,證明了本發(fā)明系統(tǒng)及方法具有靈活性、便利性及智能化的優(yōu)點(diǎn)。本發(fā)明未詳細(xì)描述的部分屬于本領(lǐng)域公知技術(shù)。權(quán)利要求1.面向用戶的信息搜索引擎系統(tǒng),其特征在于所述信息搜索引擎系統(tǒng)由客戶端和服務(wù)器構(gòu)成,在服務(wù)器端部署搜索詞推送模塊、用戶關(guān)注點(diǎn)更新模塊、初次搜索模塊、用戶興趣推斷模塊、搜索詞重構(gòu)查塊及二次搜索模塊;客戶端主機(jī)通過B/S方式與服務(wù)器進(jìn)行交互,在客戶口端部署用戶發(fā)起搜索模塊、初次搜索模塊;其中上述各模塊實(shí)現(xiàn)如下搜索詞推送模塊服務(wù)器根據(jù)當(dāng)前用戶的身份信息,查詢用戶關(guān)注庫,所述用戶關(guān)注庫由本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)兩部分組成;所述的本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)均由歷史搜索詞和搜索詞的使用頻率組成;首先解析用戶本人歷史搜索詞,按照搜索詞使用頻率由高到低進(jìn)行排序,選擇使用頻率超過設(shè)定閾值的歷史搜索詞,按序?qū)懭胗脩舯救藲v史關(guān)注詞集合,即searchVoc_past集,之后遍歷searchVoc_past集,獲取各歷史搜索詞除當(dāng)前用戶之外的其他歷史用戶,寫入同興趣用戶集合,即uSer_sameInt集,依次獲取user_samelnt集中各用戶的歷史搜索詞,分別查詢各歷史搜索詞的使用頻率,按照使用頻率由高到低寫入同興趣用戶歷史關(guān)注詞集合,即SearChV0C_paSt_other集,對searchVoc_past_other集遍歷,在避免重復(fù)的前提下,將其中的詞順序加入searchVoc_past集,根據(jù)searchVoc_past集形成搜索詞推送列表,輸出至客戶端,供用戶發(fā)起搜索模塊調(diào)用;用戶發(fā)起搜索模塊接收搜索詞推送模塊輸出的搜索詞推送列表,解析其中的搜索詞,按順序顯示在客戶端,并提供復(fù)選按鈕及排序按鈕,允許用戶對各搜索詞進(jìn)行選擇或取消,以及設(shè)置搜索詞的優(yōu)先級,根據(jù)用戶的選擇結(jié)果動態(tài)更改搜索詞集合,同時(shí)支持用戶對搜索詞集合進(jìn)行人工補(bǔ)充或修改,以形成最終提交的搜索申請,供用戶關(guān)注點(diǎn)更新模塊以及初次搜索模塊調(diào)用;用戶關(guān)注點(diǎn)更新模塊接收搜索申請,對用戶發(fā)起的搜索行為進(jìn)行記錄,所述搜索行為由用戶輸入的搜索詞及搜索詞的順序組成,將用戶輸入的搜索詞按序?qū)懭胨阉髟~用戶選擇集合,即searchVoc_select集,遍歷searchVoc_select集,判斷其中的搜索詞是否存在于用戶關(guān)注庫中,如果已存在,則更新該詞當(dāng)前使用頻率,否則,則將該詞寫入用戶關(guān)注庫中的本人歷史關(guān)注點(diǎn)集合,同時(shí)設(shè)置當(dāng)前使用頻率為初始值;初次搜索模塊根據(jù)用戶發(fā)起的搜索行為執(zhí)行初次搜索,首先按照搜索詞的優(yōu)先級對searchVoc_select集中的全部搜索詞進(jìn)行全排列組合,將排列組合后的searchVoc_select集記作searchVoc_select重組集,其中包括獨(dú)立詞及組合詞,遍歷searchVoc_select重組集,依次查詢與其中各個(gè)詞相匹配的搜索結(jié)果,與獨(dú)立詞匹配即表示搜索結(jié)果中包含該獨(dú)立詞,與組合詞匹配即表示搜索結(jié)果包含每一個(gè)組成要素,對于每一個(gè)搜索詞的匹配結(jié)果,統(tǒng)計(jì)全文中與搜索詞的匹配頻率,按匹配頻率由高到低排序,按searchVoc_select重組集的詞序?qū)⑺衅ヅ涞乃阉鹘Y(jié)果列表組合,寫入初始搜索結(jié)果集合,即reSult_firSt集,所述的搜索結(jié)果列表由結(jié)果信息標(biāo)題、摘要、來源組成,其中,摘要為結(jié)果全文中與搜索詞匹配最多的一段文字,將形成的result_first集輸出至客戶端,供用戶查看;用戶興趣推斷模塊記錄用戶對result_first集的操作,將用戶篩選行為寫入初次搜索結(jié)果用戶篩選集,即result_userSelect集;所述的用戶篩選行為由用戶選擇結(jié)果ID、結(jié)果點(diǎn)擊次數(shù)以及結(jié)果查看時(shí)間組成;對于各條結(jié)果,對“結(jié)果點(diǎn)擊次數(shù)X結(jié)果查看時(shí)間”進(jìn)行求和計(jì)算,得到用戶對各條結(jié)果的關(guān)注程度,按照關(guān)注程度值從高到低進(jìn)行排序,分別解析出各結(jié)果的摘要信息,將摘要信息按順序?qū)懭胗脩艉Y選結(jié)果摘要集,即resuHabstract集,輸出至用戶關(guān)注結(jié)果分詞模塊;用戶關(guān)注結(jié)果分詞模塊遍歷result_abstract集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,所述的字典集為哈希表,即HashMap組成的數(shù)組,數(shù)組長度為字典中作為首字的漢字個(gè)數(shù),數(shù)組索引為該漢字的區(qū)位碼,數(shù)組各元素為該首字對應(yīng)的所有詞組成的HashMap,其中詞本身作為HashMap的key,詞頻作為HashMap的value,分詞完畢后,對照無義詞庫,將無義詞剔除,將各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstract_cut_apart集,同時(shí)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abStraCt_CUt_Unit集,將abstract_cut_apart集和abstract_cut_unit集兩個(gè)集合均輸出至搜索詞重構(gòu)模塊;搜索詞重構(gòu)模塊遍歷abstract_cut_unitt集中的詞語,比對abstract_cut_apart集,解析各詞語在不同摘要中出現(xiàn)的次數(shù),所述的各詞語在不同摘要中出現(xiàn)的次數(shù)不包括該詞語在同一摘要中出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與摘要篇數(shù)相同的詞語,即各篇摘要中均出現(xiàn)的詞語匯集并寫入摘要分詞結(jié)果交集,即abStraCt_rCUt_Same集,對照中文分類主題詞表,分析abstract_cut_same集,對于與其中詞語具有用代關(guān)系及相關(guān)關(guān)系的詞,寫入摘要分詞結(jié)果重組集,即abstract_cut_reorg集,將abstract_cut_same集及abstract_cut_reorg集兩個(gè)集合均輸出至二次搜索模塊;二次搜索模塊首先解析abstract_cut_same集,按照初次搜索模塊中的方法對集合中的詞進(jìn)行排列組合,遍歷absrtact_cut_same集中的各搜索詞,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻,其中,對組合詞而言,與之匹配表示滿足其中每一個(gè)組成要素,之后,解析abstract_cut_reorg集,獲取與其中每個(gè)獨(dú)立詞匹配的文檔、圖片以及視頻,將所有的文檔文件按搜索順序?qū)懭攵嗡阉魑臋n結(jié)果集,即result_second_doc集,將所有的圖片文件按搜索順序?qū)懭攵嗡阉鲌D片結(jié)果集,即result_second_image集,將所有的視頻文件按搜索順序?qū)懭攵嗡阉饕曨l結(jié)果集,即result_second_vedio集,返回result_second_doc集、result_second_image集及result_second_vedio集三個(gè)集合至客戶端,按類別將搜索結(jié)果展示給用戶,提示用戶本次搜索結(jié)果能夠更符合用戶意圖,供用戶深入查看。2.根據(jù)權(quán)利要求I所述的面向用戶的信息搜索引擎系統(tǒng),其特征在于所述搜索詞推送模塊實(shí)現(xiàn)過程如下(1)捕獲用戶信息,根據(jù)用戶登錄時(shí)存儲身份信息的session,獲得當(dāng)前登錄者的用戶名、用戶編號,即ID;(2)根據(jù)用戶ID查詢用戶關(guān)注庫,提取出與該ID匹配的歷史搜索詞以及搜索詞使用頻率,搜索詞記為V,使用頻率記為F,將結(jié)果按F值的降序排列;(3)設(shè)預(yù)設(shè)的詞頻閾值為E,比使用頻率F與詞頻閾值E的大??;a.如果F>=E,則將F對應(yīng)的V寫入用戶本人歷史關(guān)注詞集,記作searchVoc_past集;b.如果F<E,則不做處理;(4)解析searchVoc_past集,依次遍歷其中的搜索詞V,查詢用戶關(guān)注庫,獲得與V匹配的除當(dāng)前用戶之外的其他用戶ID,寫入同興趣用戶集合,即USet_SameInt集;(5)根據(jù)user_samelnt集中各用戶ID,查詢用戶關(guān)注庫,分別獲取與各用戶ID匹配的歷史搜索詞記錄,遍歷記錄中的歷史搜索詞,分別統(tǒng)計(jì)各搜索詞用戶關(guān)注庫中的使用頻率,按頻率從高到底寫入同興趣用戶歷史關(guān)注詞集合,即searchVbc_past_other集;(6)遍歷searchVoc_past_other集,依次判斷該詞是否已存在于searchVoc_past集中;a.如果已經(jīng)存在,則對本詞不作處理,繼續(xù)解析下一個(gè)詞;b.如果不存在,則將該詞加入到searchVoc_past集中;(7)將SearChV0C_paSt集作為數(shù)組存儲在緩存中,作為搜索詞推送列表輸出至客戶端,供用戶發(fā)起搜索模塊調(diào)用。3.根據(jù)權(quán)利要求I所述的面向用戶的信息搜索引擎系統(tǒng),其特征在于所述的搜索詞重構(gòu)模塊實(shí)現(xiàn)過程如下(1)遍歷用戶篩選結(jié)果摘要集,即reSult_abStraCt集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstract_cut_apart集,數(shù)組個(gè)數(shù)記為N;(2)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abstract_cut_unit集;(3)對abstract_cut_unit集進(jìn)行遍歷,對其中每個(gè)搜索詞,執(zhí)行以下操作;(3.I)初始化當(dāng)前搜索詞的出現(xiàn)頻率Fabs=O;(3.2)遍歷abstract_cut_apart集中的各個(gè)數(shù)組元素,判斷該數(shù)組元素中是否包含當(dāng)前搜索詞;a.如果包含,則Fabs=Fabs+1,繼續(xù)判斷下一條數(shù)組元素;b.如果不包含,F(xiàn)abs值不變。(3.3)將當(dāng)前搜索詞對應(yīng)的Fabs值與abstract_cut_apart集中的數(shù)組個(gè)數(shù)進(jìn)行比較;a.如果Fabs=N,將當(dāng)前搜索詞寫入摘要分詞結(jié)果交集,即abstract_cut_same;b.如果Fabs<N,不做處理,繼續(xù)判斷下一搜索詞;(4)遍歷abstract_cut_same集,對其中每個(gè)搜索詞,在中文分類主題詞表中檢索以該詞為款目敘詞的語義網(wǎng);(4.I)如果語義網(wǎng)中有標(biāo)識為“Y”的關(guān)系詞,表示該詞具有正式表達(dá)詞,將正式表達(dá)詞寫入集合abstract_cut_reorg;(4.2)如果語義網(wǎng)中有標(biāo)識為“D”的關(guān)系詞,表示該詞具有非正式表達(dá)詞,將非正式表達(dá)詞寫入集合abstract_cut_reorg;(4.3)如果語義網(wǎng)中有標(biāo)識為“C”的關(guān)系詞,表示該詞具有詞義與之相關(guān)的表達(dá)詞,將相關(guān)表達(dá)詞寫入集合abstract_cut_reorg;(5)將abstract_cut_same集及absrtact_cut_reorg集均作為數(shù)組輸出至二次搜索模塊。4.面向用戶的信息搜索引擎實(shí)現(xiàn)方法,其特征在于步驟如下(I)服務(wù)器根據(jù)當(dāng)前用戶的身份信息,查詢用戶關(guān)注庫,所述的用戶關(guān)注庫由本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)兩部分組成,所述的本人歷史關(guān)注點(diǎn)以及同興趣用戶歷史關(guān)注點(diǎn)均由歷史搜索詞和搜索詞的使用頻率組成,首先解析用戶本人歷史搜索詞,按照搜索詞使用頻率由高到低進(jìn)行排序,選擇使用頻率超過一定閾值的歷史搜索詞,按序?qū)懭胗脩舯救藲v史關(guān)注詞集合,即searchVoc_past集,之后遍歷searchVoc_past集,獲取各歷史搜索詞除當(dāng)前用戶之外的其他歷史用戶,寫入同興趣用戶集合,即user_samelnt集,依次獲取user_samelnt集中各用戶的歷史搜索詞,分別查詢各歷史搜索詞的使用頻率,按照使用頻率由高到低寫入同興趣用戶歷史關(guān)注詞集合,即searchVoc_past_other集,對searchVoc_past_other集遍歷,在避免重復(fù)的前提下,將其中的詞順序加入searchVoc_past集,根據(jù)searchVoc_past集形成搜索詞推送列表,輸出至客戶端,供用戶發(fā)起搜索模塊調(diào)用;(2)接收搜索詞推送列表,解析其中的搜索詞,按順序顯示在客戶端,并提供復(fù)選按鈕及排序按鈕,允許用戶對各搜索詞進(jìn)行選擇或取消,以及設(shè)置搜索詞的優(yōu)先級,根據(jù)用戶的選擇結(jié)果動態(tài)更改搜索詞集合,同時(shí)支持用戶對搜索詞集合進(jìn)行人工補(bǔ)充或修改,以形成最終提交的搜索申請;(3)接收搜索申請,對用戶發(fā)起的搜索行為進(jìn)行記錄,所述的搜索行為由用戶輸入的搜索詞及搜索詞的順序組成,將用戶輸入的搜索詞按序?qū)懭胨阉髟~用戶選擇集合,即searchVoc_select集,遍歷searchVoc_select集,判斷其中的搜索詞是否存在于用戶關(guān)注庫中,如果已存在,則更新該詞當(dāng)前使用頻率,否則,則將該詞寫入用戶關(guān)注庫中的本人歷史關(guān)注點(diǎn)集合,同時(shí)設(shè)置當(dāng)前使用頻率為初始值,為后續(xù)的搜索詞推送提供數(shù)據(jù)基礎(chǔ);(4)根據(jù)用戶發(fā)起的搜索行為執(zhí)行初次搜索,首先按照搜索詞的優(yōu)先級對SearChV0C_select集中的全部搜索詞進(jìn)行全排列組合,將排列組合后的searchVoc_select集記作searchVoc_select重組集,其中包括獨(dú)立詞及組合詞,遍歷searchVoc_select重組集,依次查詢與其中各個(gè)詞相匹配的搜索結(jié)果,與獨(dú)立詞匹配即表示搜索結(jié)果中包含該獨(dú)立詞,與組合詞匹配即表示搜索結(jié)果包含每一個(gè)組成要素,對于每一個(gè)搜索詞的匹配結(jié)果,統(tǒng)計(jì)全文中與搜索詞的匹配頻率,按匹配頻率由高到低排序,按searchVoc_select重組集的詞序?qū)⑺衅ヅ涞乃阉鹘Y(jié)果列表組合,寫入初始搜索結(jié)果集合,即result_first集,所述的搜索結(jié)果列表由結(jié)果信息標(biāo)題、摘要、來源組成,其中,摘要為結(jié)果全文中與搜索詞匹配最多的一段文字,將形成的result_first集輸出至客戶端,供用戶查看;(5)記錄用戶對reSult_firSt集的操作,將用戶篩選行為寫入初次搜索結(jié)果用戶篩選集,即resultjserSelect集;所述的用戶篩選行為由用戶選擇結(jié)果ID、結(jié)果點(diǎn)擊次數(shù)以及結(jié)果查看時(shí)間組成;對于各條結(jié)果,對“結(jié)果點(diǎn)擊次數(shù)X結(jié)果查看時(shí)間”進(jìn)行求和計(jì)算,得到用戶對各條結(jié)果的關(guān)注程度,按照關(guān)注程度值從高到低進(jìn)行排序,分別解析出各結(jié)果的摘要信息,將摘要信息按順序?qū)懭胗脩艉Y選結(jié)果摘要集,即reSult_abStraCt集,供分詞使用;(6)遍歷result_abstract集,依次解析出用戶關(guān)注結(jié)果的摘要信息,對照字典集,采用逆向匹配算法分詞,所述的字典集為哈希表,即HashMap組成的數(shù)組,數(shù)組長度為字典中可作為首字的漢字個(gè)數(shù),數(shù)組索引為該漢字的區(qū)位碼,數(shù)組各元素為該首字對應(yīng)的所有詞組成的HashMap,其中詞本身作為HashMap的key,詞頻作為HashMap的value,分詞完畢后,對照無義詞庫,將無義詞剔除,將各篇摘要的分詞結(jié)果作為獨(dú)立數(shù)組,寫入摘要分詞結(jié)果離散集,即abstract_cut_apart集,同時(shí)提取出分詞結(jié)果的并集,即不存在重復(fù)詞的最大集合,寫入摘要分詞結(jié)果組合集,即abstract_cut_unit集;(7)遍歷abstract_cut_unitt集中的詞語,比對abstract_cut_apart集,解析各詞語在不同摘要中出現(xiàn)的次數(shù),所述的各詞語在不同摘要中出現(xiàn)的次數(shù)不包括該詞語在同一摘要中出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與摘要篇數(shù)相同的詞語,即各篇摘要中均出現(xiàn)的詞語匯集并寫入摘要分詞結(jié)果交集,即abstract_cut_same集,對照中文分類主題詞表,分析abstract_cut_same集,對于與其中詞語具有用代關(guān)系及相關(guān)關(guān)系的詞,寫入摘要分詞結(jié)果重組集,即abstract_cut_reorg集,供二次搜索使用;(8)首先解析absrtact_cut_same集,按照初次搜索模塊中的方法對集合中的詞進(jìn)行排列組合,遍歷abstract_cut_same集中的各搜索詞,依次獲取全文中與之匹配的文檔、標(biāo)題中與之匹配的圖片以及視頻,其中,對組合詞而言,與之匹配表示滿足其中每一個(gè)組成要素,之后,解析abstract_cut_reorg集,獲取與其中每個(gè)獨(dú)立詞匹配的文檔、圖片以及視頻,將所有的文檔文件按搜索順序?qū)懭攵嗡阉魑臋n結(jié)果集,即result_second_doc集,將所有的圖片文件按搜索順序?qū)懭攵嗡阉鲌D片結(jié)果集,即result_second_image集,將所有的視頻文件按搜索順序?qū)懭攵嗡阉饕曨l結(jié)果集,即result_second_vedio集,返回result_second_doc集、result_second_image集及result_second_vedio集三個(gè)集合至客戶端,按類別將搜索結(jié)果展示給用戶,為用戶提供更精準(zhǔn)的搜索結(jié)果。全文摘要面向用戶的信息搜索引擎系統(tǒng)及方法,由8個(gè)模塊組成搜索詞推送模塊、用戶發(fā)起搜索模塊、用戶關(guān)注點(diǎn)更新模塊、初次搜索模塊、用戶興趣推斷模塊、用戶關(guān)注結(jié)果分詞模塊、搜索詞重構(gòu)模塊以及二次搜索模塊。該方法通過對用戶可選搜索詞解析并推送、用戶發(fā)起搜索、更新用戶關(guān)注點(diǎn)、執(zhí)行初次搜索、推斷用戶興趣、對用戶關(guān)注結(jié)果分詞、對搜索詞重構(gòu)以及執(zhí)行二次搜索8個(gè)過程實(shí)現(xiàn),使該系統(tǒng)具有查詢范圍全、查詢精度高的優(yōu)點(diǎn)。此外,用戶通過該系統(tǒng)可實(shí)現(xiàn)搜索詞的選擇輸入、自主排序,并可通過交互操作提高后續(xù)查詢結(jié)果的精準(zhǔn)性,為用戶執(zhí)行信息搜索提供了一種靈活、便利、智能的交互接口。文檔編號G06F17/30GK102930022SQ20121043373公開日2013年2月13日申請日期2012年10月31日優(yōu)先權(quán)日2012年10月31日發(fā)明者賈倩,張巍,楊秋皓,許怡婷,張冶,王志勇,章樂平,楊玉堃,畢經(jīng)元,王立偉,杜俊鵬,褚厚斌申請人:中國運(yùn)載火箭技術(shù)研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
抚远县| 安阳市| 教育| 鸡西市| 闵行区| 茌平县| 舒兰市| 三河市| 习水县| 安岳县| 黄冈市| 上蔡县| 蒲江县| 唐河县| 普兰县| 庆云县| 江门市| 稻城县| 宜黄县| 富阳市| 南靖县| 微山县| 余干县| 瑞安市| 托克托县| 盈江县| 二连浩特市| 仲巴县| 瑞昌市| 陵川县| 洪雅县| 简阳市| 甘泉县| 鄱阳县| 崇义县| 准格尔旗| 克山县| 静宁县| 宝应县| 班戈县| 麦盖提县|