專利名稱:按業(yè)務(wù)檢索的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息應(yīng)用技術(shù)領(lǐng)域,更具體地,涉及一種按業(yè)務(wù)檢索的方法及系統(tǒng)。
背景技術(shù):
信息檢索是電信信息臺需要具備的主要功能。目前,實現(xiàn)信息檢索主要有兩種方法數(shù)據(jù)庫檢索和搜索引擎檢索。由于電信信息臺主要進行模糊查詢而不是精確查詢,數(shù)據(jù)庫檢索的方式很難利用到數(shù)據(jù)庫的傳統(tǒng)索引,檢索速度會有數(shù)量級的下降,而且數(shù)據(jù)庫查詢?nèi)鄙僭~元(term)匹配和匹配度控制等,所以相比較搜索引擎檢索更適合在電信信息臺中使用。
電信信息臺的主要業(yè)務(wù)功能是向用戶準確地提供所要查詢的信息,并且盡可能地把與運營商有簽約關(guān)系的企業(yè)推薦給用戶,所以用于電信信息臺的搜索引擎系統(tǒng)與傳統(tǒng)的搜索引擎系統(tǒng)相比,對查詢的速度和排序有更高的要求 (1)查詢速度要求更高與網(wǎng)頁搜索不同,電信信息臺采用人工話務(wù)服務(wù),搜索速度提高1秒,對服務(wù)的提高就有很大影響。
(2)查詢結(jié)果排序復(fù)雜撥打電話到電信信息臺的用戶和信息服務(wù)提供商的訴求有時是不同的,用戶想了解他(她)想查詢的信息,而信息服務(wù)提供商則希望將簽約的商業(yè)信息提供給用戶,所以電信信息臺的話務(wù)員根據(jù)用戶的要求輸入檢索關(guān)鍵詞后,搜索引擎的返回結(jié)果要盡量將簽約的商業(yè)信息和與客戶要求最相關(guān)的信息排在前面。
另外,不同城市或者不同地區(qū)的排序規(guī)則經(jīng)常是不同的,所以搜索引擎還必須能適應(yīng)各種不同的業(yè)務(wù)規(guī)則排序。
目前中國的電信行業(yè)正處于轉(zhuǎn)型期,很多新業(yè)務(wù)正處于探索階段,不同地區(qū)的業(yè)務(wù)經(jīng)常有較大差異,這必然會導(dǎo)致業(yè)務(wù)規(guī)則的變動。現(xiàn)有的用于電信信息臺的搜索系統(tǒng),對按業(yè)務(wù)功能排序的實現(xiàn)是比較有限的,難以滿足不同地區(qū)不同業(yè)務(wù)規(guī)則的排序要求。
發(fā)明內(nèi)容
本發(fā)明要解決的一個技術(shù)問題是提供一種按業(yè)務(wù)檢索的方法及系統(tǒng),能夠滿足不同地區(qū)不同業(yè)務(wù)規(guī)則的排序要求。
為了實現(xiàn)上述目的,本發(fā)明提供了一種按業(yè)務(wù)檢索的方法,包括通過預(yù)先部署的檢索預(yù)處理組件對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對分詞查詢串進行分解獲得基于分詞查詢串的多個業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級對多個業(yè)務(wù)查詢串進行排序;通過預(yù)先部署的檢索組件對排序后的多個業(yè)務(wù)查詢串分別進行檢索;通過預(yù)先部署的檢索后處理組件計算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。
根據(jù)本發(fā)明方法的一個實施例,預(yù)先部署檢索預(yù)處理組件、檢索組件及檢索后處理組件的操作具體為根據(jù)不同地區(qū)的業(yè)務(wù)排序規(guī)則從組件庫中選擇檢索預(yù)處理組件、檢索組件及檢索后處理組件,配置并級連檢索預(yù)處理組件、檢索組件及檢索后處理組件。
根據(jù)本發(fā)明方法的另一實施例,該方法還包括檢索預(yù)處理組件根據(jù)期望輸出的頁號和每頁顯示的條目數(shù)設(shè)置預(yù)分頁區(qū)間;檢索組件根據(jù)預(yù)分頁區(qū)間對檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果;檢索后處理組件根據(jù)輸出結(jié)果的排序值對緩存的預(yù)分頁后的結(jié)果進行排序。
根據(jù)本發(fā)明方法的又一實施例,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
根據(jù)本發(fā)明方法的再一實施例,通過如下步驟計算輸出結(jié)果的排序值在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報、隨機輪循、按天輪循、固定排序及相關(guān)度排序;其中,f是查詢關(guān)鍵詞分詞后是否有單字的標志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型。
根據(jù)本發(fā)明方法的再一實施例,檢索組件根據(jù)預(yù)分頁區(qū)間對檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果的步驟具體為從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號,i為期望輸出的頁號,k為緩存系數(shù),p為每頁顯示的條目數(shù)。
為了實現(xiàn)上述目的,本發(fā)明還提供了一種按業(yè)務(wù)檢索的系統(tǒng),該系統(tǒng)包括預(yù)先配置并級連的檢索預(yù)處理組件、檢索組件及檢索后處理組件,其中,檢索預(yù)處理組件包括分詞模塊、業(yè)務(wù)分解模塊及業(yè)務(wù)排序模塊,分詞模塊用于對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,業(yè)務(wù)分解模塊用于根據(jù)業(yè)務(wù)類型對分詞查詢串進行分解獲得基于分詞查詢串的多個業(yè)務(wù)查詢串,業(yè)務(wù)排序模塊用于根據(jù)業(yè)務(wù)類型的優(yōu)先級對多個業(yè)務(wù)查詢串進行排序;檢索組件包括檢索模塊,檢索模塊用于對排序后的多個業(yè)務(wù)查詢串分別進行檢索;檢索后處理組件包括排序值計算模塊及結(jié)果排序模塊,排序值計算模塊用于計算輸出結(jié)果的排序值,結(jié)果排序模塊用于根據(jù)輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。
根據(jù)本發(fā)明系統(tǒng)的一個實施例,檢索預(yù)處理組件還包括預(yù)分頁區(qū)間設(shè)置模塊,預(yù)分頁區(qū)間設(shè)置模塊用于根據(jù)期望輸出的頁號和每頁顯示的條目數(shù)設(shè)置預(yù)分頁區(qū)間;檢索組件還包括預(yù)分頁模塊,預(yù)分頁模塊用于根據(jù)預(yù)分頁區(qū)間對檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果;結(jié)果排序模塊還用于根據(jù)輸出結(jié)果的排序值對緩存的預(yù)分頁后的結(jié)果進行排序。
根據(jù)本發(fā)明系統(tǒng)的另一實施例,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
根據(jù)本發(fā)明系統(tǒng)的又一實施例,排序值計算模塊包括第一判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);第二判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);第三判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報、隨機輪循、按天輪循、固定排序及相關(guān)度排序;其中,f是查詢關(guān)鍵詞分詞后是否有單字的標志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型。
根據(jù)本發(fā)明系統(tǒng)的再一實施例,預(yù)分頁模塊還用于從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號,i為期望輸出的頁號,k為緩存系數(shù),p為每頁顯示的條目數(shù)。
本發(fā)明提供的按業(yè)務(wù)檢索的方法及系統(tǒng),為話務(wù)員提供了快速的查詢服務(wù),并且搜索返回的結(jié)果能根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進行排序,將最符合用戶要求和最有商業(yè)價值的信息排在前面以便話務(wù)員選擇。另外,該系統(tǒng)還能夠在統(tǒng)一的框架下根據(jù)不同地區(qū)配置不同的業(yè)務(wù)規(guī)則,實現(xiàn)不同地區(qū)的個性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分。在附圖中 圖1是本發(fā)明采用的Filter-Chain架構(gòu)示意圖。
圖2是本發(fā)明方法的一個實施例的流程示意圖。
圖3是本發(fā)明方法的另一實施例的流程示意圖。
圖4是本發(fā)明系統(tǒng)的一個實施例的結(jié)構(gòu)示意圖。
圖5是本發(fā)明系統(tǒng)的另一實施例的結(jié)構(gòu)示意圖。
具體實施例方式 下面參照附圖對本發(fā)明進行更全面的描述,其中說明本發(fā)明的示例性實施例。本發(fā)明的示例性實施例及其說明用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的不當限定。
現(xiàn)在的搜索引擎系統(tǒng)通常是根據(jù)相關(guān)度進行排序的,但是用于電信信息臺的搜索系統(tǒng)更多是要求按照業(yè)務(wù)規(guī)則進行排序(在業(yè)務(wù)規(guī)則框架中再兼顧相關(guān)度的排序),尤其是對全省甚至全國范圍的電信信息臺搜索系統(tǒng)來說,各個地區(qū)的業(yè)務(wù)排序規(guī)則很可能是不一樣的甚至是矛盾的,這就很難利用已有搜索引擎的排序算法來實現(xiàn)。
如圖1所示,是本發(fā)明采用的Filter-Chain架構(gòu)示意圖。該架構(gòu)實現(xiàn)了檢索的預(yù)處理和后處理,并支持級連方式。Filter-Chain架構(gòu)是一個完整的組成部分,貫穿檢索的全過程,共同實現(xiàn)高性能的查詢和業(yè)務(wù)排序功能,下面分別介紹各個部分的功能和實現(xiàn)方法。
S101,PreFilter是檢索的預(yù)處理,由一組預(yù)處理任務(wù)組成,組成PreFilter的預(yù)處理任務(wù)可以根據(jù)不同地區(qū)的情況分別進行配置,如果需求出現(xiàn)變動,還可以根據(jù)接口開發(fā)新的預(yù)處理任務(wù)進行配置。預(yù)處理任務(wù)的接口可以定義為 public interface PreFilterTask { List<Message>exec(Message msg)throws BtirException; } 其中,Message記錄了客戶查詢串、分頁要求、本次檢索的頁面和頁面大小,例如,查詢第1頁,每頁顯示20條記錄,則Message中的頁面大小是客戶端的每頁顯示記錄數(shù)的整數(shù)倍,假如客戶端一頁顯示20條記錄,則客戶端向服務(wù)器請求的頁面大小可以是20、40、60......,具體的頁數(shù)和頁面大小可以由客戶端確定。
預(yù)處理任務(wù)的目的是在使用搜索引擎檢索之前,根據(jù)業(yè)務(wù)規(guī)則對待查詢的關(guān)鍵詞進行分詞、分詞后的查詢串的分解。可選地還可以進行預(yù)分頁條件的設(shè)置。
(1)分詞本發(fā)明使用現(xiàn)有的分詞算法對查詢關(guān)鍵詞進行分詞獲得分詞查詢串,具體規(guī)則是 如果查詢關(guān)鍵詞分詞后不包括單字,則將查詢關(guān)鍵詞分解為“原詞”、“分詞后各單詞的AND關(guān)系”以及“分詞后各單詞的OR關(guān)系”。例如,客戶查詢關(guān)鍵詞為“長城潤滑油”,分詞后的分詞查詢串為“長城潤滑油”、“長城AND潤滑油”以及“長城OR潤滑油”三個查詢串。
如果查詢關(guān)鍵詞分詞后包含單字,則分詞后的詞組去掉單字,查詢關(guān)鍵詞分解為“原詞”、“分詞后各單詞的AND關(guān)系”以及“分詞后各單詞的OR關(guān)系”。例如,客戶查詢關(guān)鍵詞為“佳億五金維修店”,分詞后的分詞查詢串為“佳億五金維修店”、“五金AND維修”以及“五金OR維修”三個查詢串。
(2)查詢串分解將上述分詞后的查詢串再進行分解是為了實現(xiàn)按業(yè)務(wù)檢索做準備,根據(jù)訂購關(guān)鍵字的有關(guān)業(yè)務(wù)(包括直通車、優(yōu)先報號、品牌推薦、百事通加盟等)將用戶的查詢串分解成多個,并根據(jù)業(yè)務(wù)的優(yōu)先級從高到低排序。例如,客戶的查詢串為“送水”,查詢串按業(yè)務(wù)分解后變成四個查詢串“話務(wù)轉(zhuǎn)接送水”、“優(yōu)先報號送水”、“品牌查詢送水”以及“百事通加盟送水”。
(3)預(yù)分頁條件的設(shè)置如果在獲得搜索引擎全部結(jié)果集后再進行排序,數(shù)據(jù)交換量太大(因為要獲得數(shù)據(jù)結(jié)果集的全部記錄,數(shù)據(jù)加載的時間消耗會很大),這必然導(dǎo)致查詢速度的下降,對查詢性能非常敏感的系統(tǒng)是不能接受的,預(yù)分頁的目標是查詢時只返回部分數(shù)據(jù)進行排序。例如,可以通過如下方式實現(xiàn)當要求查詢第i頁的記錄,每頁顯示的條目數(shù)為p時,預(yù)分頁設(shè)置一個緩存參數(shù)k(根據(jù)測試情況和經(jīng)驗進行配置,一般取3-5),預(yù)分頁后搜索引擎返回的查詢結(jié)果是max(0,(i-k)*p)到max(0,(i-k)*p)+(i+k)*p之間的記錄。
S102,客戶的原始查詢關(guān)鍵詞通過PreFilter分解后開始進行檢索。檢索過程由一組檢索任務(wù)組成,與預(yù)處理任務(wù)類似,檢索任務(wù)也可以根據(jù)地區(qū)進行靈活的配置,檢索任務(wù)的接口是 public interface SearchTask { void doQuery(StructuredQuery sq,InformList list)throws BtirException; } 檢索任務(wù)根據(jù)PreFilter分解后的查詢串進行檢索,并實現(xiàn)結(jié)果集的去重與合并。
(1)檢索將PreFilter分解后的查詢串轉(zhuǎn)換成lucene(lucene是基于Java的全文索引工具包)語法格式,采用lucene進行多次檢索,獲得結(jié)果集但不取出以避免大的輸入和輸出。
(2)構(gòu)造結(jié)果集根據(jù)PreFilter設(shè)置的預(yù)分頁條件,將檢索結(jié)果去重與合并后再取出部分記錄。
S103,PostFilter是檢索的后處理,由一組后處理任務(wù)組成。與前面的PreFilter和Search類似,PostFilter可以根據(jù)地區(qū)對后處理任務(wù)進行靈活地配置。后處理任務(wù)的接口是 public interface PostFilterTask { Object exec(int len,Object[]objs)throws BtirException; } PostFilter主要實現(xiàn)和業(yè)務(wù)相關(guān)的排序權(quán)重??蛇x地,基于PreFilter中設(shè)置的預(yù)分頁條件可以進行分頁處理。
(1)業(yè)務(wù)排序根據(jù)每種業(yè)務(wù)的排序策略和業(yè)務(wù)之間的權(quán)重關(guān)系,重新計算每條查詢結(jié)果的綜合值,再根據(jù)綜合值進行排序。例如,可以根據(jù)下述函數(shù)計算一條記錄的綜合值P(f,w,b)=[P1(f,w,b),P2(b),s(b)]。
其中,P1(f,w,b)是一個三輸入?yún)?shù)的函數(shù),根據(jù)業(yè)務(wù)規(guī)則配置每種業(yè)務(wù)在不同分詞情況下的權(quán)重值;f是查詢關(guān)鍵詞分詞后是否有單字的標志;w是分詞后的關(guān)系,取值有3個“原詞”、“分詞后各單詞的AND關(guān)系”以及“分詞后各單詞的OR關(guān)系”;P2(b)是排序相關(guān)的業(yè)務(wù),取值有5個話務(wù)呼轉(zhuǎn)、優(yōu)先報號、品牌推薦、百事通加盟、語音名片;s(b)是根據(jù)業(yè)務(wù)規(guī)定的業(yè)務(wù)排序規(guī)則計算的分值,至少有以下幾種計算方法 輪循或按比例播報sendNum/privalue,sendNum是記錄的播報次數(shù),privalue是信息的權(quán)重; 隨機輪循s(b)等于一個0-1之間的隨機值; 按天輪循Floor([d-Floor(d/n)*n]/p)*n+p,其中p是每個記錄的信息權(quán)重,d是合同開始天數(shù),n是購買同一產(chǎn)品的記錄總數(shù); 固定排序直接取信息的權(quán)重值privalue; 直接取搜索引擎排序的score值。
(2)分頁根據(jù)客戶原始請求的頁面信息返回相應(yīng)的查詢結(jié)果。
上述Filter-Chain的搜索引擎系統(tǒng)架構(gòu)用于構(gòu)建類似支持號碼百事通業(yè)務(wù)的電信信息臺,特別能滿足系統(tǒng)對查詢速度和對搜索結(jié)果進行復(fù)雜業(yè)務(wù)排序的要求。該系統(tǒng)實現(xiàn)了可方便擴展的排序規(guī)則配置和接口,適應(yīng)業(yè)務(wù)靈活變化的情況,能快速支持新業(yè)務(wù)的推出。在統(tǒng)一的框架下實現(xiàn)了不同地區(qū)的個性化排序策略。同時該系統(tǒng)還充分考慮了搜索引擎排序的性能,完全滿足電信信息臺實時查詢的需求。
如圖2所示,是本發(fā)明方法的一個實施例的流程示意圖。該實施例可以包括以下步驟 S201,通過預(yù)先部署的檢索預(yù)處理組件對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對分詞查詢串進行分解獲得基于分詞查詢串的多個業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級對多個業(yè)務(wù)查詢串進行排序; S202,通過預(yù)先部署的檢索組件對排序后的多個業(yè)務(wù)查詢串分別進行檢索; S203,通過預(yù)先部署的檢索后處理組件計算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。
其中,預(yù)先部署檢索預(yù)處理組件、檢索組件及檢索后處理組件的操作具體為根據(jù)不同地區(qū)的業(yè)務(wù)排序規(guī)則從組件庫中選擇檢索預(yù)處理組件、檢索組件及檢索后處理組件,配置并級連檢索預(yù)處理組件、檢索組件及檢索后處理組件。
具體地,如果輸出結(jié)果的排序值為P(f,w,b)=[P1(f,w,b),P2(b),s(b)],則可以通過如下步驟計算輸出結(jié)果的排序值在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報、隨機輪循、按天輪循、固定排序及相關(guān)度排序。
其中,f是查詢關(guān)鍵詞分詞后是否有單字的標志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型,各個城市可以靈活地配置P1(f,w,b)、P2(b)和s(b)。
對于參數(shù)w,如果分詞后無單字,例如,“體育器材”,分詞后的結(jié)果是“體育”和“器材”,則分詞順序w是“體育器材”、“體育AND器材”、“體育OR器材”;如果分詞后有單字,例如,“佳藝五金維修”,分詞后的結(jié)果是“佳”、“藝”、“五金”和“維修”,則去掉單字后的結(jié)果是“五金”和“維修”,分詞順序w是“佳藝五金維修”、“五金AND維修”、“五金OR維修”。
在排序的時候,先比較P1(f,w,b)的大小,如果P1(f,w,b)相等再比較P2(b),如果P2(b)相等再比較s(b)的大小。
下述表1是P1(f,w,b)的含義
表1 下述表2是P2(b)的含義 表2 s(b)是根據(jù)業(yè)務(wù)規(guī)定的業(yè)務(wù)排序規(guī)則計算的分值,有以下5種取值按比例播報、隨機輪循、按天輪循、固定排序、相關(guān)度排序。
例如,假設(shè)系統(tǒng)配置的業(yè)務(wù)類型包括話務(wù)呼轉(zhuǎn)、優(yōu)先報號、品牌推薦、百事通加盟、語音名片及其他,客戶待查詢的關(guān)鍵詞為“佳億五金維修店”,則系統(tǒng)按下述順序返回查詢結(jié)果 (1)訂購關(guān)鍵字包括原詞“佳億五金維修店”的話務(wù)呼轉(zhuǎn)記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (2)訂購關(guān)鍵字包括原詞“佳億五金維修店”的優(yōu)先報號記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (3)訂購關(guān)鍵字包括原詞“佳億五金維修店”的品牌推薦記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (4)業(yè)務(wù)說明中包括原詞“佳億五金維修店”的百事通加盟記錄,記錄之間隨機輪循; (5)企業(yè)名稱中包括原詞“佳億五金維修店”的語音名片記錄,記錄之間根據(jù)相關(guān)度排序; (6)企業(yè)名稱中包括原詞“佳億五金維修店”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (7)訂購關(guān)鍵字包括“五金”AND“維修”的話務(wù)呼轉(zhuǎn)記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (8)訂購關(guān)鍵字包括“五金”AND“維修”的優(yōu)先報號,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (9)訂購關(guān)鍵字包括“五金”AND“維修”的品牌推薦記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (10)業(yè)務(wù)說明中包括“五金”AND“維修”的百事通加盟記錄,記錄之間隨機輪循; (11)企業(yè)名稱中包括“五金”AND“維修”的語音名片記錄,記錄之間根據(jù)相關(guān)度排序; (12)企業(yè)名稱中包括“五金”AND“維修”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (13)訂購關(guān)鍵字包括“五金”O(jiān)R“維修”的話務(wù)呼轉(zhuǎn)記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (14)訂購關(guān)鍵字包括“五金”O(jiān)R“維修”的優(yōu)先報號記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (15)訂購關(guān)鍵字包括“五金”O(jiān)R“維修”的品牌推薦記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (16)業(yè)務(wù)說明中包括“五金”O(jiān)R“維修”的百事通加盟記錄,記錄之間隨機輪循‘ (17)企業(yè)名稱中包括“五金”O(jiān)R“維修”的語音名片記錄,記錄之間根據(jù)相關(guān)度排序; (18)企業(yè)名稱中包括“五金”O(jiān)R“維修”的其它記錄,記錄之間根據(jù)相關(guān)度排序。
該實施例能夠根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進行排序,將最符合用戶要求和最有商業(yè)價值的信息排在前面以便話務(wù)員選擇。另外,該實施例還能為不同地區(qū)配置不同的業(yè)務(wù)規(guī)則,實現(xiàn)不同地區(qū)的個性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
如圖3所示,是本發(fā)明方法的另一實施例的流程示意圖。該實施例包括以下步驟 S301,通過預(yù)先部署的檢索預(yù)處理組件對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對分詞查詢串進行分解獲得基于分詞查詢串的多個業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級對多個業(yè)務(wù)查詢串進行排序。
S302,檢索預(yù)處理組件根據(jù)期望輸出的頁號和每頁顯示的條目數(shù)設(shè)置預(yù)分頁區(qū)間。
S303,通過預(yù)先部署的檢索組件對排序后的多個業(yè)務(wù)查詢串分別進行檢索。
S304,檢索組件根據(jù)預(yù)分頁區(qū)間對檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果; 其中,檢索組件根據(jù)預(yù)分頁區(qū)間對檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果的步驟可以具體為從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號,i為期望輸出的頁號,k為緩存系數(shù),p為每頁顯示的條目數(shù)。
例如,假設(shè)客戶要檢索第1頁,每頁顯示20條記錄,檢索預(yù)處理組件設(shè)置預(yù)分頁條件的時候(假設(shè)k=3)要求搜索引擎返回0(根據(jù)max(0,(1-3)*20)=0計算得到)到80(根據(jù)(1+3)*20=80計算得到)的記錄,檢索組件檢索后從結(jié)果集中取出第0到第80條記錄,檢索后處理組件根據(jù)業(yè)務(wù)規(guī)則排序后,取出0到20條記錄返回給調(diào)用者。
再例如,假設(shè)客戶端要檢索第4頁,每頁顯示20條記錄,檢索預(yù)處理組件設(shè)置預(yù)分頁條件的時候(假設(shè)k=3)要求搜索引擎返回20(根據(jù)max(0,(4-3)*20)=20計算得到)到140(根據(jù)(4+3)*20=140計算得到)的記錄,檢索組件檢索后從結(jié)果集中取出第20到第140條記錄,檢索后處理組件根據(jù)業(yè)務(wù)規(guī)則排序后,取出80到120條記錄返回給調(diào)用者。
進一步地,檢索預(yù)處理組件將一個查詢關(guān)鍵詞根據(jù)業(yè)務(wù)規(guī)則分解成多個查詢串,例如,查詢關(guān)鍵詞“體育器材”被檢索預(yù)處理組件分解成18個查詢串(如下所示),并且檢索預(yù)處理組件設(shè)置預(yù)分頁時要求搜索引擎返回20至140條之間的記錄。檢索組件對這18個查詢條件依次進行檢索,當前面n個查詢條件檢索出的記錄總數(shù)大于等于140后,就停止檢索,取其中第20條至140條之間的記錄返回。
查詢關(guān)鍵詞“體育器材”被檢索預(yù)處理組件分解成的18個查詢串如下所示 (1)訂購關(guān)鍵字包括原詞“體育器材”的話務(wù)呼轉(zhuǎn)記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (2)訂購關(guān)鍵字包括原詞“體育器材”的優(yōu)先報號記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (3)訂購關(guān)鍵字包括原詞“體育器材”的品牌推薦記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (4)訂購關(guān)鍵字包括“體育”AND“器材”的話務(wù)呼轉(zhuǎn)記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (5)訂購關(guān)鍵字包括“體育”AND“器材”的優(yōu)先報號,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (6)訂購關(guān)鍵字包括“體育”AND“器材”的品牌推薦記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (7)業(yè)務(wù)說明中包括原詞“體育器材”的百事通加盟記錄,記錄之間隨機輪循; (8)業(yè)務(wù)說明中包括“體育”AND“器材”的百事通加盟記錄,記錄之間隨機輪循; (9)企業(yè)名稱中包括原詞“體育器材”的語音名片記錄,記錄之間根據(jù)相關(guān)度排序; (10)企業(yè)名稱中包括“體育”AND“器材”的語音名片記錄,記錄之間根據(jù)相關(guān)度排序; (11)企業(yè)名稱中包括原詞“體育器材”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (12)企業(yè)名稱中包括“體育”AND“器材”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (13)訂購關(guān)鍵字包括“體育”O(jiān)R“器材”的話務(wù)呼轉(zhuǎn)記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (14)訂購關(guān)鍵字包括“體育”O(jiān)R“器材”的優(yōu)先報號記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (15)訂購關(guān)鍵字包括“體育”O(jiān)R“器材”的品牌推薦記錄,其中訂購?fù)粋€關(guān)鍵字的記錄根據(jù)播報次數(shù)按比例輪循; (16)業(yè)務(wù)說明中包括“體育”O(jiān)R“器材”的百事通加盟記錄,記錄之間隨機輪循; (17)企業(yè)名稱中包括“體育”O(jiān)R“器材”的語音名片記錄,記錄之間根據(jù)相關(guān)度排序; (18)企業(yè)名稱中包括“體育”O(jiān)R“器材”的其它記錄,記錄之間根據(jù)相關(guān)度排序。
S305,通過預(yù)先部署的檢索后處理組件計算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對緩存的預(yù)分頁后的結(jié)果進行排序。
在上述實施例中,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
采用預(yù)分頁方法是有前提條件的,根據(jù)搜索引擎檢索出排在第n位的記錄(搜索引擎是根據(jù)相關(guān)度檢索的),根據(jù)業(yè)務(wù)規(guī)則排序的范圍應(yīng)該在[n-C,n+C]的范圍內(nèi)(C是一個常數(shù))。即,業(yè)務(wù)規(guī)則排序是和相關(guān)度排序有一定關(guān)聯(lián)性。如果不能滿足這個條件,就不宜采用預(yù)分頁方法。例如,根據(jù)“體育器材”檢索到的符合百事通加盟業(yè)務(wù)的記錄數(shù)有200條,記錄A在搜索引擎檢索出的順序中排第160位,檢索組件只取前面20-140條記錄給檢索后處理組件進行排序,A就不在排序范圍之內(nèi),但是根據(jù)業(yè)務(wù)規(guī)則,A是應(yīng)該排在前面的,這時排序的結(jié)果就不準確了。
但是,在電信信息臺的應(yīng)用中采用預(yù)分頁方法是合適的,因為從業(yè)務(wù)規(guī)則的制定上看,一個關(guān)鍵字銷售給商家的數(shù)量必然是有限的,否則商家購買關(guān)鍵字就失去了意義,所以檢索預(yù)處理組件的參數(shù)k設(shè)置足夠大,肯定能將訂購了關(guān)鍵字的記錄全部取出來,預(yù)分頁參數(shù)k是排序準確性和排序效率的一個權(quán)衡值。
如果要做到預(yù)分頁的情況下仍然滿足業(yè)務(wù)排序規(guī)則的準確性,可以用更復(fù)雜的技術(shù),但是沒有太大的實用價值。本發(fā)明提出的預(yù)分頁方法,在排序的性能和效果上已經(jīng)可以達到很好的平衡。
如圖4所示,是本發(fā)明系統(tǒng)的一個實施例的結(jié)構(gòu)示意圖。該實施例可以包括預(yù)先配置并級連的檢索預(yù)處理組件11、檢索組件12及檢索后處理組件13,其中,檢索預(yù)處理組件11包括分詞模塊111、業(yè)務(wù)分解模塊112及業(yè)務(wù)排序模塊113,分詞模塊111用于對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,業(yè)務(wù)分解模塊112用于根據(jù)業(yè)務(wù)類型對分詞查詢串進行分解獲得基于分詞查詢串的多個業(yè)務(wù)查詢串,業(yè)務(wù)排序模塊113用于根據(jù)業(yè)務(wù)類型的優(yōu)先級對多個業(yè)務(wù)查詢串進行排序;檢索組件12包括檢索模塊121,檢索模塊121用于對排序后的多個業(yè)務(wù)查詢串分別進行檢索;檢索后處理組件13包括排序值計算模塊131及結(jié)果排序模塊132,排序值計算模塊131用于計算輸出結(jié)果的排序值,結(jié)果排序模塊132用于根據(jù)輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。
該實施例能夠根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進行排序,將最符合用戶要求和最有商業(yè)價值的信息排在前面以便話務(wù)員選擇。另外,該實施例還能為不同地區(qū)配置不同的業(yè)務(wù)規(guī)則,實現(xiàn)不同地區(qū)的個性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
如圖5所示,是本發(fā)明系統(tǒng)的另一實施例的結(jié)構(gòu)示意圖。與圖4中的實施例相比,該實施例中的檢索預(yù)處理組件21還包括預(yù)分頁區(qū)間設(shè)置模塊211,預(yù)分頁區(qū)間設(shè)置模塊211用于根據(jù)期望輸出的頁號和每頁顯示的條目數(shù)設(shè)置預(yù)分頁區(qū)間;檢索組件22還包括預(yù)分頁模塊221,預(yù)分頁模塊221用于根據(jù)預(yù)分頁區(qū)間對檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果;結(jié)果排序模塊132還用于根據(jù)輸出結(jié)果的排序值對緩存的預(yù)分頁后的結(jié)果進行排序。
根據(jù)本發(fā)明系統(tǒng)的又一實施例,預(yù)分頁模塊221還用于從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號,i為期望輸出的頁號,k為緩存系數(shù),p為每頁顯示的條目數(shù)。
上述兩個實施例進行預(yù)分頁處理后可以減少取記錄的輸入和輸出,提高了排序的速度。
在本發(fā)明系統(tǒng)的再一實施例中,與圖4中的實施例相比,該實施例中的排序值計算模塊可以包括第一判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);第二判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);第三判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報、隨機輪循、按天輪循、固定排序及相關(guān)度排序;其中,f是查詢關(guān)鍵詞分詞后是否有單字的標志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型。
在上述實施例中,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
該實施例為話務(wù)員提供了快速的查詢服務(wù),并且搜索返回的結(jié)果能根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進行排序,將最符合用戶要求和最有商業(yè)價值的信息排在前面以便話務(wù)員選擇。
本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯而易見的。選擇和描述實施例是為了更好說明本發(fā)明的原理和實際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計適于特定用途的帶有各種修改的各種實施例。
權(quán)利要求
1.一種按業(yè)務(wù)檢索的方法,其特征在于,所述方法包括
通過預(yù)先部署的檢索預(yù)處理組件對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對所述分詞查詢串進行分解獲得基于所述分詞查詢串的多個業(yè)務(wù)查詢串,并根據(jù)所述業(yè)務(wù)類型的優(yōu)先級對所述多個業(yè)務(wù)查詢串進行排序;
通過預(yù)先部署的檢索組件對所述排序后的多個業(yè)務(wù)查詢串分別進行檢索;
通過預(yù)先部署的檢索后處理組件計算輸出結(jié)果的排序值,并根據(jù)所述輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,預(yù)先部署所述檢索預(yù)處理組件、所述檢索組件及所述檢索后處理組件的操作具體為
根據(jù)不同地區(qū)的業(yè)務(wù)排序規(guī)則從組件庫中選擇所述檢索預(yù)處理組件、所述檢索組件及所述檢索后處理組件,配置并級連所述檢索預(yù)處理組件、所述檢索組件及所述檢索后處理組件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括
所述檢索預(yù)處理組件根據(jù)期望輸出的頁號和每頁顯示的條目數(shù)設(shè)置預(yù)分頁區(qū)間;
所述檢索組件根據(jù)所述預(yù)分頁區(qū)間對所述檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果;
所述檢索后處理組件根據(jù)所述輸出結(jié)果的排序值對緩存的所述預(yù)分頁后的結(jié)果進行排序。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述分詞查詢串包括所述查詢關(guān)鍵詞及所述查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過如下步驟計算所述輸出結(jié)果的排序值
在不同業(yè)務(wù)類型下的所述分詞查詢串對應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)所述分詞查詢串對應(yīng)的排序值P1(f,w,b)確定所述輸出結(jié)果的排序值P(f,w,b);或
在不同業(yè)務(wù)類型下的所述分詞查詢串對應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)所述業(yè)務(wù)類型對應(yīng)的排序值P2(b)確定所述輸出結(jié)果的排序值P(f,w,b);或
在不同業(yè)務(wù)類型下的所述分詞查詢串對應(yīng)的排序值P1(f,w,b)相同并且所述業(yè)務(wù)類型對應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對應(yīng)的排序值s(b)確定所述輸出結(jié)果的排序值P(f,w,b),其中,所述業(yè)務(wù)排序規(guī)則包括按比例播報、隨機輪循、按天輪循、固定排序及相關(guān)度排序;
其中,f是所述查詢關(guān)鍵詞分詞后是否有單字的標志,w是所述查詢關(guān)鍵詞分詞后的關(guān)系,b是所述業(yè)務(wù)類型。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述檢索組件根據(jù)所述預(yù)分頁區(qū)間對所述檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果的步驟具體為
從所述檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為所述預(yù)分頁后的結(jié)果;
其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號,i為所述期望輸出的頁號,k為緩存系數(shù),p為每頁顯示的條目數(shù)。
7.一種按業(yè)務(wù)檢索的系統(tǒng),其特征在于,所述系統(tǒng)包括預(yù)先配置并級連的檢索預(yù)處理組件、檢索組件及檢索后處理組件,其中,
所述檢索預(yù)處理組件包括分詞模塊、業(yè)務(wù)分解模塊及業(yè)務(wù)排序模塊,所述分詞模塊用于對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,所述業(yè)務(wù)分解模塊用于根據(jù)業(yè)務(wù)類型對所述分詞查詢串進行分解獲得基于所述分詞查詢串的多個業(yè)務(wù)查詢串,所述業(yè)務(wù)排序模塊用于根據(jù)所述業(yè)務(wù)類型的優(yōu)先級對所述多個業(yè)務(wù)查詢串進行排序;
所述檢索組件包括檢索模塊,所述檢索模塊用于對所述排序后的多個業(yè)務(wù)查詢串分別進行檢索;
所述檢索后處理組件包括排序值計算模塊及結(jié)果排序模塊,所述排序值計算模塊用于計算輸出結(jié)果的排序值,所述結(jié)果排序模塊用于根據(jù)所述輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,
所述檢索預(yù)處理組件還包括預(yù)分頁區(qū)間設(shè)置模塊,所述預(yù)分頁區(qū)間設(shè)置模塊用于根據(jù)期望輸出的頁號和每頁顯示的條目數(shù)設(shè)置預(yù)分頁區(qū)間;
所述檢索組件還包括預(yù)分頁模塊,所述預(yù)分頁模塊用于根據(jù)所述預(yù)分頁區(qū)間對所述檢索出的結(jié)果進行預(yù)分頁,并緩存預(yù)分頁后的結(jié)果;
所述結(jié)果排序模塊還用于根據(jù)所述輸出結(jié)果的排序值對緩存的所述預(yù)分頁后的結(jié)果進行排序。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,
所述分詞查詢串包括所述查詢關(guān)鍵詞及所述查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述排序值計算模塊包括
第一判斷單元,用于在不同業(yè)務(wù)類型下的所述分詞查詢串對應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)所述分詞查詢串對應(yīng)的排序值P1(f,w,b)確定所述輸出結(jié)果的排序值P(f,w,b);
第二判斷單元,用于在不同業(yè)務(wù)類型下的所述分詞查詢串對應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)所述業(yè)務(wù)類型對應(yīng)的排序值P2(b)確定所述輸出結(jié)果的排序值P(f,w,b);
第三判斷單元,用于在不同業(yè)務(wù)類型下的所述分詞查詢串對應(yīng)的排序值P1(f,w,b)相同并且所述業(yè)務(wù)類型對應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對應(yīng)的排序值s(b)確定所述輸出結(jié)果的排序值P(f,w,b),其中,所述業(yè)務(wù)排序規(guī)則包括按比例播報、隨機輪循、按天輪循、固定排序及相關(guān)度排序;
其中,f是所述查詢關(guān)鍵詞分詞后是否有單字的標志,w是所述查詢關(guān)鍵詞分詞后的關(guān)系,b是所述業(yè)務(wù)類型。
11.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述預(yù)分頁模塊還用于從所述檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為所述預(yù)分頁后的結(jié)果;
其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號,i為所述期望輸出的頁號,k為緩存系數(shù),p為每頁顯示的條目數(shù)。
全文摘要
本發(fā)明公開了一種按業(yè)務(wù)檢索的方法及系統(tǒng)。其中,該方法包括通過預(yù)先部署的檢索預(yù)處理組件對輸入的查詢關(guān)鍵詞進行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對分詞查詢串進行分解獲得基于分詞查詢串的多個業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級對多個業(yè)務(wù)查詢串進行排序;通過預(yù)先部署的檢索組件對排序后的多個業(yè)務(wù)查詢串分別進行檢索;通過預(yù)先部署的檢索后處理組件計算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對檢索出的結(jié)果進行排序。本發(fā)明的方法及系統(tǒng),能夠在統(tǒng)一的框架下根據(jù)不同地區(qū)配置不同的排序規(guī)則,實現(xiàn)多個地區(qū)的個性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
文檔編號G06F17/30GK101699440SQ20091022359
公開日2010年4月28日 申請日期2009年11月24日 優(yōu)先權(quán)日2009年11月24日
發(fā)明者梁冰, 蔡堅錚, 張玉忠, 林全疆, 方艾, 宋平波, 李云, 金鐸, 趙華, 陳康 申請人:中國電信股份有限公司