技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0056]需要說明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于手機(jī)、個(gè)人數(shù)字助理(Personal Digital Assistant,PDA)、無(wú)線手持設(shè)備、平板電腦(Tablet Computer)、個(gè)人電腦(Personal Computer, PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、智能手表、智能手環(huán)等)等。
[0057]另外,本文中術(shù)語(yǔ)“和/或”,僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。
[0058]圖1為本發(fā)明一實(shí)施例提供的搜索方法的流程示意圖,如圖1所示。
[0059]101、獲取搜索關(guān)鍵詞。
[0060]102、獲得與所述搜索關(guān)鍵詞匹配的候選聚合問題,以作為目標(biāo)聚合問題。
[0061]103、獲得所述目標(biāo)聚合問題所對(duì)應(yīng)的觀點(diǎn)數(shù)據(jù)。
[0062]104、輸出所述目標(biāo)聚合問題所對(duì)應(yīng)的所述觀點(diǎn)數(shù)據(jù)。
[0063]需要說明的是,101?104的執(zhí)行主體的部分或全部可以為位于本地終端的應(yīng)用,或者還可以為設(shè)置在位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopment Kit,SDK)等功能單元,或者還可以為位于網(wǎng)絡(luò)側(cè)服務(wù)器中的搜索引擎,或者還可以為位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0064]可以理解的是,所述應(yīng)用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁(yè)程序(webApp),本實(shí)施例對(duì)此不進(jìn)行限定。
[0065]這樣,通過獲得與所獲取的搜索關(guān)鍵詞匹配的候選聚合問題,以作為目標(biāo)聚合問題,進(jìn)而獲得所述目標(biāo)聚合問題所對(duì)應(yīng)的觀點(diǎn)數(shù)據(jù),使得能夠輸出所述目標(biāo)聚合問題所對(duì)應(yīng)的所述觀點(diǎn)數(shù)據(jù),由于原始的資源庫(kù)中的資源不再都是相互獨(dú)立的單一內(nèi)容,而是包含了經(jīng)過聚合的觀點(diǎn)類問題和這些問題所對(duì)應(yīng)的觀點(diǎn)數(shù)據(jù),使得每個(gè)搜索結(jié)果不再是單一內(nèi)容,能夠基本滿足用戶真正的搜索意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行搜索而導(dǎo)致的增加應(yīng)用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負(fù)擔(dān)。
[0066]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,具體可以采集用戶所提供的所述搜索關(guān)鍵詞,可以通過用戶所觸發(fā)的搜索命令實(shí)現(xiàn)。具體可以采用下述兩種方式觸發(fā)搜索命令:
[0067]方式一:
[0068]用戶可以在當(dāng)前應(yīng)用所展現(xiàn)的頁(yè)面上所輸入所述搜索關(guān)鍵詞,然后,通過點(diǎn)擊該頁(yè)面上的搜索按鈕,例如,百度等普通的大搜索系統(tǒng)所提供的百度一下按鈕或百度知道等垂直搜索系統(tǒng)所提供的搜索答案按鈕等,以觸發(fā)搜索命令,該搜索命令中包含所述搜索關(guān)鍵詞。其中,用戶輸入所述搜索關(guān)鍵詞的數(shù)量可以為一個(gè),或者還可以為幾個(gè),其順序可以為任意順序,本實(shí)施例對(duì)此不進(jìn)行特別限定。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。
[0069]方式二:
[0070]采用異步加載技術(shù)例如,Ajax異步加載或Jsonp異步加載等,實(shí)時(shí)獲取用戶在當(dāng)前應(yīng)用所展現(xiàn)的頁(yè)面上所輸入的輸入內(nèi)容,為了與搜索關(guān)鍵詞進(jìn)行區(qū)分,此時(shí)的輸入內(nèi)容可以稱為是輸入關(guān)鍵詞。其中,用戶輸入所述搜索關(guān)鍵詞的數(shù)量可以為一個(gè),或者還可以為幾個(gè),其順序可以為任意順序,本實(shí)施例對(duì)此不進(jìn)行特別限定。這樣,在接收到該搜索命令之后,則可以解析出其中所包含的所述搜索關(guān)鍵詞。具體地,具體可以提供Ajax接口或Jsonp接口等接口,這些接口可以使用Java、超級(jí)文本預(yù)處理(Hypertext Preprocessor,PHP)語(yǔ)言等語(yǔ)言進(jìn)行編寫,其具體的調(diào)用可以使用Jquery,或者原生的JavaScript等語(yǔ)言進(jìn)行編寫。
[0071]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102中,具體可以利用基于語(yǔ)義的匹配方式,獲得與所述搜索關(guān)鍵詞匹配的候選聚合問題,以作為目標(biāo)聚合問題。
[0072]在一個(gè)具體的實(shí)現(xiàn)過程中,具體可以計(jì)算搜索關(guān)鍵詞與資源庫(kù)中的候選聚合問題之間的語(yǔ)義距離,然后,再根據(jù)語(yǔ)義距離,獲得二者的語(yǔ)義相似度。詳細(xì)描述具體可以參見現(xiàn)有技術(shù)中文本之間的語(yǔ)義相似度的相關(guān)內(nèi)容,此處不再贅述。若所獲得的語(yǔ)義相似度滿足預(yù)先設(shè)置的相似度條件,例如,大于或等于相似度閾值等,則可以將該候選聚合問題作為目標(biāo)聚合問題。
[0073]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,所獲得的所述觀點(diǎn)數(shù)據(jù)可以包括但不限于至少一個(gè)觀點(diǎn)和所述至少一個(gè)觀點(diǎn)中每個(gè)觀點(diǎn)的統(tǒng)計(jì)數(shù)據(jù)中的至少一項(xiàng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0074]這樣,由于原始的資源庫(kù)中的資源不再都是相互獨(dú)立的單一內(nèi)容,而是包含了經(jīng)過聚合的觀點(diǎn)類問題和這些問題所對(duì)應(yīng)的若干個(gè)觀點(diǎn),及其統(tǒng)計(jì)數(shù)據(jù),使得每個(gè)搜索結(jié)果不再是單一內(nèi)容,能夠基本滿足用戶真正的搜索意圖。
[0075]具體地,所獲得的所述每個(gè)觀點(diǎn)的統(tǒng)計(jì)數(shù)據(jù),可以包括但不限于下列數(shù)據(jù)中的至少一項(xiàng):
[0076]每個(gè)觀點(diǎn)的屬性信息;
[0077]每個(gè)觀點(diǎn)在所述目標(biāo)聚合問題所對(duì)應(yīng)的觀點(diǎn)類問題的答案中的出現(xiàn)情況;以及
[0078]每個(gè)觀點(diǎn)在所述目標(biāo)聚合問題所對(duì)應(yīng)的觀點(diǎn)類問題的答案中的出現(xiàn)情況統(tǒng)計(jì)圖。
[0079]在一個(gè)具體的實(shí)現(xiàn)過程中,每個(gè)觀點(diǎn)的屬性信息,可以用于描述每個(gè)觀點(diǎn)的傾向性類型。例如,積極類型或消極類型等。
[0080]在另一個(gè)具體的實(shí)現(xiàn)過程中,每個(gè)觀點(diǎn)在所述目標(biāo)聚合問題所對(duì)應(yīng)的觀點(diǎn)類問題的答案中的出現(xiàn)情況,可以用于描述每個(gè)觀點(diǎn)在其對(duì)應(yīng)的答案中所出現(xiàn)的出現(xiàn)情況。其中,所謂的出現(xiàn)情況,可以為出現(xiàn)比值,或者還可以為出現(xiàn)次數(shù),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0081]需要說明的是,每個(gè)觀點(diǎn)在同一個(gè)答案中的出現(xiàn)情況的統(tǒng)計(jì)可以按照需要進(jìn)行靈活設(shè)置,可以該觀點(diǎn)每出現(xiàn)一次,統(tǒng)計(jì)為一次,或者還可以只要該觀點(diǎn)出現(xiàn)一次,不管該觀點(diǎn)還出現(xiàn)了幾次,都統(tǒng)計(jì)為一次,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0082]在另一個(gè)具體的實(shí)現(xiàn)過程中,每個(gè)觀點(diǎn)在所述目標(biāo)聚合問題所對(duì)應(yīng)的觀點(diǎn)類問題的答案中的出現(xiàn)情況統(tǒng)計(jì)圖,可以用于描述每個(gè)觀點(diǎn)在其對(duì)應(yīng)的答案中所出現(xiàn)的出現(xiàn)情況統(tǒng)計(jì)圖。其中,所謂的出現(xiàn)情況,可以為出現(xiàn)比值,或者還可以為出現(xiàn)次數(shù),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0083]需要說明的是,每個(gè)觀點(diǎn)在同一個(gè)答案中的出現(xiàn)情況的統(tǒng)計(jì)可以按照需要進(jìn)行靈活設(shè)置,可以該觀點(diǎn)每出現(xiàn)一次,統(tǒng)計(jì)為一次,或者還可以只要該觀點(diǎn)出現(xiàn)一次,不管該觀點(diǎn)還出現(xiàn)了幾次,都統(tǒng)計(jì)為一次,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0084]可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103之前,還可以進(jìn)一步包括挖掘操作。具體地,具體可以對(duì)資源庫(kù)中問題進(jìn)行識(shí)別,以獲得觀點(diǎn)類問題,進(jìn)而,對(duì)所述觀點(diǎn)類問題進(jìn)行基于語(yǔ)義的聚合處理,以獲得至少一個(gè)候選聚合問題。然后,則可以根據(jù)所述至少一個(gè)候選聚合問題中每個(gè)候選聚合問題所對(duì)應(yīng)的觀點(diǎn)類問題的答案,獲得所述每個(gè)候選聚合問題所對(duì)應(yīng)的觀點(diǎn)數(shù)據(jù)。
[0085]具體地,具體可以多種方式,對(duì)資源庫(kù)中問題進(jìn)行識(shí)別,以獲得觀點(diǎn)類問題。所謂的資源庫(kù),其中所包含的資源,可以是預(yù)先在互聯(lián)網(wǎng)中,利用網(wǎng)頁(yè)爬蟲技術(shù),所采集的若干個(gè)網(wǎng)頁(yè)或者問答對(duì)(即問題-答案資源對(duì))。
[0086]在一個(gè)具體的實(shí)現(xiàn)過程中,具體可以利用問題模板,對(duì)資源庫(kù)中問題進(jìn)行識(shí)別,以獲得觀點(diǎn)類問題。
[0087]所謂的問題模版,指的是包含關(guān)鍵詞與語(yǔ)法結(jié)構(gòu)的句子結(jié)構(gòu)定義。其中所述的關(guān)鍵詞通常具有強(qiáng)烈的疑問傾向。
[0088]以下面這個(gè)問題模板為例:“NP+是+嗎”,其中,NP,代表名詞短語(yǔ),該問題模版表示問題中含有“是+嗎”這樣的關(guān)鍵字,同時(shí)在“是+嗎”之前包含名詞短語(yǔ),當(dāng)一個(gè)符合上述問題模板的問題出現(xiàn)時(shí),該問題就被識(shí)別為觀點(diǎn)類問題。
[0089]例如,“秦始皇是呂不韋的兒子嗎”這樣一個(gè)問題,由于符合上述問題模版,該問題就被識(shí)別為觀點(diǎn)類問題。除了名詞短語(yǔ),還可以在句子中通過短語(yǔ)或動(dòng)詞短語(yǔ)等語(yǔ)法結(jié)構(gòu)對(duì)問題模版中除關(guān)鍵字以外的部分進(jìn)行限定,在此不再特別贅述。
[0090]問題模版中的關(guān)鍵詞具有很強(qiáng)的疑問傾向,這是由于問題模版的關(guān)鍵詞提取是對(duì)數(shù)據(jù)庫(kù)中的優(yōu)質(zhì)提問的問題進(jìn)行統(tǒng)計(jì)分析后得到的,例如,可以將數(shù)據(jù)庫(kù)中得到較