一種搜索結(jié)果的生成方法及裝置制造方法
【專利摘要】本發(fā)明實施例提供了一種搜索結(jié)果的生成方法及裝置,該方法包括:接收客戶端發(fā)送的關(guān)鍵詞;依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù);依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于0的整數(shù);依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果;向所述客戶端發(fā)送所述搜索結(jié)果。本發(fā)明實施例提供的技術(shù)方案用以實現(xiàn)提高搜索結(jié)果的時效性。
【專利說明】一種搜索結(jié)果的生成方法及裝置
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù),尤其涉及一種搜索結(jié)果的生成方法及裝置。
【【背景技術(shù)】】
[0002]互聯(lián)網(wǎng)的搜索引擎能夠依據(jù)客戶端發(fā)送的關(guān)鍵詞(Query),獲得對應(yīng)的搜索結(jié)果,搜索結(jié)果與關(guān)鍵詞的相 關(guān)性、搜索結(jié)果的內(nèi)容質(zhì)量和搜索結(jié)果的時效性是衡量搜索引擎質(zhì)量的重要指標(biāo)。
[0003]然而,傳統(tǒng)的搜索方法中,搜索引擎都利用網(wǎng)頁排名(PageRank)算法計算網(wǎng)頁質(zhì)量,獲得網(wǎng)頁的排序結(jié)果,然后依據(jù)網(wǎng)頁的點擊數(shù)據(jù)對搜索結(jié)果中網(wǎng)頁的排序進(jìn)行調(diào)整;其中PageRank算法是依據(jù)網(wǎng)頁的入鏈數(shù)獲得網(wǎng)頁在搜索結(jié)果中排名的算法,對于某網(wǎng)頁而言,入鏈指的是該網(wǎng)頁的統(tǒng)一資源定位符(Uniform Resource Locator,URL)出現(xiàn)在其他網(wǎng)頁內(nèi)容中的次數(shù);因此,傳統(tǒng)的搜索方法會導(dǎo)致可以滿足用戶的搜索需求的新網(wǎng)頁,由于網(wǎng)頁的入鏈數(shù)較少或點擊次數(shù)較少,在搜索結(jié)果中排序較低,甚至不會出現(xiàn)在搜索結(jié)果中的問題,因此,搜索結(jié)果的時效性較差。
【
【發(fā)明內(nèi)容】
】
[0004]有鑒于此,本發(fā)明實施例提供了一種搜索結(jié)果的生成方法及裝置,以實現(xiàn)提高搜索結(jié)果的時效性。
[0005]本發(fā)明實施例提供了一種搜索結(jié)果的生成方法,包括:
[0006]接收客戶端發(fā)送的關(guān)鍵詞;
[0007]依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù);
[0008]依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于O的整數(shù);
[0009]依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果;
[0010]向所述客戶端發(fā)送所述搜索結(jié)果。
[0011]上述方法中,所述依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,包括:
[0012]獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K為大于或等于P的整數(shù);
[0013]依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁。
[0014]上述方法中,所述依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,包括:
[0015]依據(jù)預(yù)設(shè)的所述K個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值和預(yù)設(shè)的權(quán)重閾值,獲得R個第二網(wǎng)頁;所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值大于所述權(quán)重閾值;R為小于或等于K,且大于或等于P的整數(shù);
[0016]依據(jù)所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序,對所述R個第二網(wǎng)頁排序,以獲得排序結(jié)果;
[0017]獲得所述R個第二網(wǎng)頁中排序靠前的L個第二網(wǎng)頁;L為小于或等于R,且大于或者等于P的整數(shù);
[0018]獲得所述關(guān)鍵詞與所述L個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度;
[0019]依據(jù)所述相關(guān)度和預(yù)設(shè)的相關(guān)度閾值,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁與所述關(guān)鍵詞的相關(guān)度大于所述相關(guān)度閾值。
[0020]上述方法中,所述依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,包括:
[0021]依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值;
[0022]按照所述結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得排序結(jié)果;
[0023]依據(jù)所述排序結(jié)果,獲得排序靠前的T個第二網(wǎng)頁,所述T為小于或等于P的正整數(shù);
[0024]依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜
索結(jié)果。
[0025]上述方法中,所述獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值,包括:
[0026]利用如下公式獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值W (total):
[0027]W (total) = a X ffb+b X ffr+c X Wt
[0028]其中,Wb為依據(jù)所述第二網(wǎng)頁的質(zhì)量權(quán)重值獲得的第一中間權(quán)重值,Wr為依據(jù)關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度獲得的第二中間權(quán)重值,Wt為依據(jù)所述第二網(wǎng)頁的發(fā)布時間獲得的第三中間權(quán)重值,a、b和c為預(yù)設(shè)的調(diào)權(quán)因子。
[0029]上述方法中,所述依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,包括:
[0030]若所述T個第二網(wǎng)頁不包括所述M個第一網(wǎng)頁中任意一個第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,其中,所述T個第二網(wǎng)頁的排序位置高于所述M個第一網(wǎng)頁的排序位置;或者,
[0031]若所述T個第二網(wǎng)頁包括所述M個第一網(wǎng)頁中的全部第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁,獲得所述搜索結(jié)果;或者,[0032]若所述T個第二網(wǎng)頁包括M個第一網(wǎng)頁中W個第一網(wǎng)頁,W為大于或等于1,且小于M的整數(shù),在所述M個第一網(wǎng)頁中刪除所述W個第一網(wǎng)頁,以獲得Q個第一網(wǎng)頁,Q等于M減去W ;依據(jù)所述T個第二網(wǎng)頁和所述Q個第一網(wǎng)頁,獲得所述搜索結(jié)果;其中,所述T個第二網(wǎng)頁的排序位置高于所述Q個第一網(wǎng)頁的排序位置。
[0033]本發(fā)明實施例還提供了一種搜索結(jié)果的生成裝置,包括:
[0034]接收單元,用于接收客戶端發(fā)送的關(guān)鍵詞;
[0035]第一處理單元,用于依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù);
[0036]第二處理單元,用于依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于O的整數(shù);
[0037]搜索生成單元,用于依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果;
[0038]發(fā)送單元,用于向所述客戶端發(fā)送所述搜索結(jié)果。
[0039]上述裝置中,所述第二處理單元,具體用于:
[0040]獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K為大于或等于P的整數(shù);
[0041]依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁。
[0042]上述裝置中,所述第二處理單元,具體用于:
[0043]依據(jù)預(yù)設(shè)的所述K個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值和預(yù)設(shè)的權(quán)重閾值,獲得R個第二網(wǎng)頁;所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值大于所述權(quán)重閾值;R為小于或等于K,且大于或等于P的整數(shù);
[0044]依據(jù)所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序,對所述R個第二網(wǎng)頁排序,以獲得排序結(jié)果;
[0045]獲得所述R個第二網(wǎng)頁中排序靠前的L個第二網(wǎng)頁;L為小于或等于R,且大于或者等于P的整數(shù);
[0046]獲得所述關(guān)鍵詞與所述L個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度;
[0047]依據(jù)所述相關(guān)度和預(yù)設(shè)的相關(guān)度閾值,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁與所述關(guān)鍵詞的相關(guān)度大于所述相關(guān)度閾值。
[0048]上述裝置中,所述搜索生成單元,具體用于:
[0049]依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值;
[0050]按照所述結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得排序結(jié)果;
[0051]依據(jù)所述排序結(jié)果,獲得排序靠前的T個第二網(wǎng)頁,所述T為小于或等于P的正整數(shù);
[0052]依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜
索結(jié)果。
[0053]上述裝置中,所述搜索生成單元,具體用于:
[0054]利用如下公式獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值W (total):
[0055]W (total) = a X ffb+b X ffr+c X Wt
[0056]其中,Wb為依據(jù)所述第二網(wǎng)頁的質(zhì)量權(quán)重值獲得的第一中間權(quán)重值,Wr為依據(jù)關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度獲得的第二中間權(quán)重值,Wt為依據(jù)所述第二網(wǎng)頁的發(fā)布時間獲得的第三中間權(quán)重值,a、b和c為預(yù)設(shè)的調(diào)權(quán)因子。[0057]上述裝置中,所述搜索生成單元,具體用于:
[0058]若所述T個第二網(wǎng)頁不包括所述M個第一網(wǎng)頁中任意一個第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,其中,所述T個第二網(wǎng)頁的排序位置高于所述M個第一網(wǎng)頁的排序位置;或者,
[0059]若所述T個第二網(wǎng)頁包括所述M個第一網(wǎng)頁中的全部第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁,獲得所述搜索結(jié)果;或者,
[0060]若所述T個第二網(wǎng)頁包括M個第一網(wǎng)頁中W個第一網(wǎng)頁,W為大于或等于1,且小于M的整數(shù),在所述M個第一網(wǎng)頁中刪除所述W個第一網(wǎng)頁,以獲得Q個第一網(wǎng)頁,Q等于M減去W ;依據(jù)所述T個第二網(wǎng)頁和所述Q個第一網(wǎng)頁,獲得所述搜索結(jié)果;其中,所述T個第二網(wǎng)頁的排序位置高于所述Q個第一網(wǎng)頁的排序位置。
[0061]由以上技術(shù)方案可以看出,本發(fā)明實施例具有以下有益效果:
[0062]本發(fā)明實施例中依據(jù)關(guān)鍵詞對應(yīng)的第一網(wǎng)頁,獲得與其中部分第一網(wǎng)頁具有相同知識主體,且發(fā)布時間距離當(dāng)前時間最近的第二網(wǎng)頁,并依據(jù)第二網(wǎng)頁或者第二網(wǎng)頁和第一網(wǎng)頁,獲得搜索結(jié)果;由于第二網(wǎng)頁與對應(yīng)的第一網(wǎng)頁的知識主體相同,因此能夠保證第二網(wǎng)頁與關(guān)鍵詞的相關(guān)性,同時,第二網(wǎng)頁是發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁,因此,能夠保證獲得的搜索結(jié)果的時效性;與傳統(tǒng)技術(shù)方案相比,能夠?qū)崿F(xiàn)將時間較近的網(wǎng)頁排在搜索結(jié)果中靠前的位置,以便于用戶能夠及時獲得時間較近的網(wǎng)頁,可以滿足用戶的搜索需求,提高搜索結(jié)果的時效性。
【【專利附圖】
【附圖說明】】
[0063]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
[0064]圖1是本發(fā)明實施例所提供的技術(shù)方案使用的系統(tǒng);
[0065]圖2是本發(fā)明實施例所提供的搜索結(jié)果的生成方法的流程示意圖;
[0066]圖3是本發(fā)明實施例所提供的S203的具體實現(xiàn)方法的流程示意圖;
[0067]圖4是本發(fā)明實施例所提供的依據(jù)知識主體獲得網(wǎng)頁集合的示例圖;
[0068]圖5是本發(fā)明實施例所提供的S204的具體實現(xiàn)方法的流程示意圖;[0069]圖6是本發(fā)明實施例所提供的搜索結(jié)果的生成裝置的功能方塊圖。
【【具體實施方式】】
[0070]為了更好的理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖對本發(fā)明實施例進(jìn)行詳細(xì)描述。
[0071]應(yīng)當(dāng)明確,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護(hù)的范圍。
[0072]本發(fā)明實施例所提供的技術(shù)方案使用的系統(tǒng)如圖1所示,主要由客戶端和搜索引擎組成,本發(fā)明實施例所提供的方法和裝置可以在搜索引擎中實現(xiàn),主要用于接收客戶端發(fā)送的關(guān)鍵詞,然后向客戶端發(fā)送該關(guān)鍵詞對應(yīng)的搜索結(jié)果,以便于客戶端顯示搜索結(jié)果。本發(fā)明實施例對客戶端的功能沒有進(jìn)行變更,即客戶端接收用戶輸入的關(guān)鍵詞,并向搜索引擎發(fā)送該關(guān)鍵詞,最后將來自搜索引擎的搜索結(jié)果展現(xiàn)給用戶。其中,所述客戶端可以為瀏覽器,所述瀏覽器包括所有用戶設(shè)備上運行的瀏覽器,所述用戶設(shè)備可以包括個人計算機(jī)(Personal Computer, PC)、筆記本電腦、手機(jī)或平板電腦。
[0073]本發(fā)明實施例給出一種搜索結(jié)果的生成方法,請參考圖2,其為本發(fā)明實施例所提供的搜索結(jié)果的生成方法的流程示意圖,如圖所示,該方法包括以下步驟:
[0074]S201,接收客戶端發(fā)送的關(guān)鍵詞。
[0075]具體的,客戶端顯示關(guān)鍵詞的輸入框,用戶在輸入框輸入關(guān)鍵詞后,客戶端可以接收到輸入的關(guān)鍵詞,并向搜索引擎發(fā)送該關(guān)鍵詞,搜索引擎接收客戶端發(fā)送的關(guān)鍵詞。
[0076]S202,依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù)。
[0077]具體的,搜索引擎依據(jù)獲得的關(guān)鍵詞,并利用PageRank算法計算M個第一網(wǎng)頁中每個第一網(wǎng)頁的網(wǎng)頁質(zhì)量,并依據(jù)網(wǎng)頁質(zhì)量對M個第一網(wǎng)頁進(jìn)行排序,然后依據(jù)排序后獲得的M個第一網(wǎng)頁中每個第一網(wǎng)頁的點擊數(shù)據(jù),對M個第一網(wǎng)頁的排序進(jìn)行調(diào)整,以獲得排
序結(jié)果。
[0078]需要說明的是,傳統(tǒng)的搜索方法中,搜索引擎在獲得排序后的M個第一網(wǎng)頁后,將該M個第一網(wǎng)頁作為所述關(guān)鍵詞的搜索結(jié)果,發(fā)送給客戶端,完成本次搜索任務(wù),但是,本發(fā)明實施例的技術(shù)方案需要對該M個第一網(wǎng)頁進(jìn)一步處理,以生成搜索結(jié)果,具體參見S203 ~S204。
[0079]S203,依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于O的整數(shù)。
[0080]S204,依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果。
[0081]S205,向所述客戶端發(fā)送所述搜索結(jié)果。
[0082]具體的,搜索引擎在獲得搜索結(jié)果后,向客戶端發(fā)送該搜索結(jié)果,以便于客戶端顯示收到的搜索結(jié)果,以向用戶提供關(guān)鍵詞對應(yīng)的搜索結(jié)果。
[0083]請參見圖3,其為本發(fā)明實施例所提供的S203的具體實現(xiàn)方法的流程示意圖,如圖所示,S203的具體實現(xiàn)方法包括以下步驟:
[0084]S301,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K為大于或等于P的整數(shù)。
[0085]具體的,本發(fā)明實施例的技術(shù)方案中,需要預(yù)先在搜索引擎上配置網(wǎng)頁集合的標(biāo)識與網(wǎng)頁集合的對應(yīng)關(guān)系、以及網(wǎng)頁集合的標(biāo)識與網(wǎng)頁的對應(yīng)關(guān)系。
[0086]其中,網(wǎng)頁集合指的是由具有相同知識主體的網(wǎng)頁組成的集合,知識主體指的是網(wǎng)頁陳述的主要實體信息,例如,網(wǎng)頁標(biāo)題為“國慶節(jié)放假安排”,則知識主體為“國慶節(jié)”和“放假”,知識主體相當(dāng)于該網(wǎng)頁的關(guān)鍵詞。
[0087]本發(fā)明實施例中,生成網(wǎng)頁集合的方法是:首先,網(wǎng)頁數(shù)據(jù)庫中有海量的網(wǎng)頁,可以依據(jù)這些網(wǎng)頁的標(biāo)題(Title)或者網(wǎng)頁的元信息所包括的關(guān)鍵詞(Keywords)信息,獲得知識主體;其中,關(guān)鍵詞信息是預(yù)先配置好的網(wǎng)頁信息,其中包括用戶依據(jù)網(wǎng)頁的內(nèi)容確定的關(guān)鍵詞,因此,可以依據(jù)關(guān)鍵詞信息直接獲得知識主體;還可以對網(wǎng)頁的標(biāo)題進(jìn)行分詞處理,以獲得至少一個詞條,對至少一個詞條進(jìn)行篩選,保留其中屬于名詞或?qū)傩栽~的至少一個詞條,然后計算至少一個詞條中每個詞條的權(quán)重值,依據(jù)每個詞條的權(quán)重值對至少一個詞條進(jìn)行排序,依據(jù)排序結(jié)果,將權(quán)重值最高的至少一個詞條作為知識主體;這里,若至少一個詞條中存在至少一個詞條與關(guān)鍵詞信息中的關(guān)鍵詞相同,則通過提高相應(yīng)詞條的權(quán)重值,來保留這些詞條,使得這些詞條作為知識主體,這是因為對網(wǎng)頁的標(biāo)題進(jìn)行分詞處理時可能會產(chǎn)生誤差,使得詞條中與關(guān)鍵詞信息中相同的關(guān)鍵詞沒有被選為知識主體,而關(guān)鍵詞信息中的關(guān)鍵詞是比較準(zhǔn)確的關(guān)鍵詞,應(yīng)該作為知識主體被保留,因此,可以通過提高相應(yīng)詞條的權(quán)重值,來保證 標(biāo)題中的詞條被選為知識主體。
[0088]然后,在獲得知識主體后,將具有相同知識主體的網(wǎng)頁歸為同一個網(wǎng)頁集合,從而生成網(wǎng)頁集合。網(wǎng)頁集合包括具有相同知識主體的網(wǎng)頁,這些網(wǎng)頁是對應(yīng)同一知識主體但發(fā)布時間不同的網(wǎng)頁。例如,請參考圖4,其為本發(fā)明實施例所提供的依據(jù)知識主體獲得網(wǎng)頁集合的示例圖,如圖所示,圖4中三個網(wǎng)頁的標(biāo)題中都包括知識主體“蘇州”、“寬帶”和“多少錢”,因此,可以由這三個網(wǎng)頁組成一個網(wǎng)頁集合,該網(wǎng)頁集合中的三個網(wǎng)頁具有相同的知識主體“蘇州”、“寬帶”和“多少錢”,且這三個網(wǎng)頁的發(fā)布時間不同。
[0089]最后,隨機(jī)為網(wǎng)頁集合生成網(wǎng)頁集合的標(biāo)識,如網(wǎng)頁集合ID,以獲得網(wǎng)頁集合的標(biāo)識與網(wǎng)頁集合的對應(yīng)關(guān)系,例如,網(wǎng)頁集合的標(biāo)識與網(wǎng)頁集合的對應(yīng)關(guān)系可以為:網(wǎng)頁集合ID ?+網(wǎng)頁集合(包括網(wǎng)頁的URL、網(wǎng)頁的質(zhì)量權(quán)重值、網(wǎng)頁的發(fā)布時間);對于每個網(wǎng)頁集合中的每個網(wǎng)頁,可以生成該網(wǎng)頁與該網(wǎng)頁所屬網(wǎng)頁集合的標(biāo)識的對應(yīng)關(guān)系,例如,網(wǎng)頁與網(wǎng)頁集合的標(biāo)識的對應(yīng)關(guān)系可以為:網(wǎng)頁的URLO網(wǎng)頁集合ID,以便于在獲得某網(wǎng)頁后,可以很快查詢到該網(wǎng)頁是否有對應(yīng)的網(wǎng)頁集合。其中,網(wǎng)頁集合中還包括每個網(wǎng)頁的質(zhì)量權(quán)重值和發(fā)布時間;網(wǎng)頁的質(zhì)量權(quán)重值可以依據(jù)網(wǎng)頁的入鏈數(shù)、內(nèi)容質(zhì)量、網(wǎng)頁內(nèi)容豐富度和網(wǎng)站的權(quán)重值獲得。需要說明的是,一個網(wǎng)頁只能屬于一個網(wǎng)頁集合,不能同時屬于兩個以上網(wǎng)頁集合。
[0090]由于預(yù)先生成網(wǎng)頁集合的標(biāo)識與網(wǎng)頁集合的對應(yīng)關(guān)系、以及網(wǎng)頁集合的標(biāo)識與網(wǎng)頁的對應(yīng)關(guān)系,因此,搜索引擎在獲得M個第一網(wǎng)頁后,依據(jù)M個第一網(wǎng)頁中的前N個第一網(wǎng)頁、以及網(wǎng)頁集合的標(biāo)識與網(wǎng)頁的對應(yīng)關(guān)系,獲得前N個第一網(wǎng)頁中每個第一網(wǎng)頁所對應(yīng)的網(wǎng)頁集合的標(biāo)識,然后依據(jù)該網(wǎng)頁集合的標(biāo)識、以及網(wǎng)頁集合的標(biāo)識與網(wǎng)頁集合的對應(yīng)關(guān)系,獲得網(wǎng)頁集合,由于第一網(wǎng)頁與網(wǎng)頁集合有對應(yīng)關(guān)系,因此該第一網(wǎng)頁屬于對應(yīng)的網(wǎng)頁集合,網(wǎng)頁集合包括第一網(wǎng)頁和K個第二網(wǎng)頁,因此在獲得網(wǎng)頁集合后,可以獲得前N個第一網(wǎng)頁中每個第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K個第二網(wǎng)頁與第一網(wǎng)頁同屬于一個網(wǎng)頁集合,因此,K個第二網(wǎng)頁為與第一網(wǎng)頁就有相同知識主體的網(wǎng)頁。
[0091]這里,對于依據(jù)關(guān)鍵詞獲得的M個第一網(wǎng)頁,可以不依據(jù)每個第一網(wǎng)頁都獲得K個第二網(wǎng)頁,而是依據(jù)M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得對應(yīng)的K個第二網(wǎng)頁,這樣,可以降低搜索引擎的計算量,同時由于M個第一網(wǎng)頁中前N個第一網(wǎng)頁的網(wǎng)頁質(zhì)量比較高,M個第一網(wǎng)頁中后面的第一網(wǎng)頁的網(wǎng)頁質(zhì)量較低,因此,獲得后面的第一網(wǎng)頁的網(wǎng)頁集合的意義不大。
[0092]S302,依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁。
[0093]具體的,首先,在獲得前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁后,搜索引擎將前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值與預(yù)設(shè)的權(quán)重閾值進(jìn)行比較,獲得質(zhì)量權(quán)重值大于權(quán)重閾值的R個第二網(wǎng)頁;R為小于或等于K,且大于或等于P的整數(shù)。
[0094]然后,搜索引擎依據(jù)所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序,對所述R個第二網(wǎng)頁排序,以獲得排序結(jié)果;依據(jù)R個第二網(wǎng)頁的排序結(jié)果,獲得所述R個第二網(wǎng)頁中排序靠前的L個第二網(wǎng)頁;L為小于或等于R,且大于或者等于P的整數(shù)。
[0095]最后,對于獲得的L個第二網(wǎng)頁,搜索引擎可以利用相關(guān)度算法,計算關(guān)鍵詞與所述L個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度;比較所述相關(guān)度與預(yù)設(shè)的相關(guān)度閾值的大小,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,該P(yáng)個第二網(wǎng)頁中,每個第二網(wǎng)頁與關(guān)鍵詞的相關(guān)度都大于預(yù)設(shè)的相關(guān)度閾值。在確定知識主體的過程中,由于對網(wǎng)頁的標(biāo)題或內(nèi)容提取關(guān)鍵詞,可能會丟失一些附屬信息,因此,這里再次校驗第二網(wǎng)頁與關(guān)鍵詞的相關(guān)度,可以最大程度保證搜索結(jié)果的質(zhì)量。
[0096]對于每個網(wǎng)頁集合,搜索引擎都執(zhí)行S301和S302的處理過程,這樣,依據(jù)M個第一網(wǎng)頁中的前N個第一網(wǎng)頁和關(guān)鍵詞,可以獲得前N個第一網(wǎng)頁中每個第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;由于S302中按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序?qū)Φ诙W(wǎng)頁進(jìn)行排序,并提取其中排序靠前的第二網(wǎng)頁,因此P個第二網(wǎng)頁就是與第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁。
[0097]請參見圖5,其為本發(fā)明實施例所提供的S204的具體實現(xiàn)方法的流程示意圖,如圖所示,S204的具體實現(xiàn)方法包括以下步驟:
[0098]S501,依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值。
[0099]具體的,搜索引擎可以依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,并利用如下公式,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值W (total):
[0100]ff(total) = aXffb+bXffr+cXfft
[0101]其中,Wb為依據(jù)第二網(wǎng)頁的質(zhì)量權(quán)重值獲得的第一中間權(quán)重值,Wr為依據(jù)關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度獲得的第二中間權(quán)重值,Wt為依據(jù)所述第二網(wǎng)頁的發(fā)布時間獲得的第三中間權(quán)重值,a、b和C為調(diào)權(quán)因子;結(jié)果權(quán)重值W(total) < 100。
[0102]例如,第一中間權(quán)重值Wb = currentBasicWeight/MaxBasicWeight X 100,其中,currentBasicWeight為第二網(wǎng)頁的質(zhì)量權(quán)重值,MaxBasicffeight為預(yù)設(shè)的最大質(zhì)量權(quán)重值,currentBas icWeight 的取值范圍是[0,MaxBasicWeight]。
[0103]例如,第二中間權(quán)重值Wr = currentRelateffeightX 100,其中,currentRelateffeight為關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度,currentReIateffeight的取值范圍是[O, I] ο
[0104]例如,第三中間權(quán)重值Wt = 100-ΛΤ,其中,AT等于當(dāng)前時間與第二網(wǎng)頁的發(fā)布時間之間間隔的天數(shù)。
[0105]其中,所述a+b+c = I。
[0106]S502,按照所述結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得排序結(jié)果。
[0107]具體的,在獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值后,搜索引擎按照結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得所有第二網(wǎng)頁的排序結(jié)果。
[0108]S503,依據(jù)所述排序結(jié)果,獲得排序靠前的T個第二網(wǎng)頁,所述T為小于或等于P的正整數(shù)。
[0109]具體的,搜索引擎依據(jù)排序結(jié)果,在獲得的所有第二網(wǎng)頁中獲得排序靠前的T個第二網(wǎng)頁,T為小于或等于P的正整數(shù)。
[0110]S504,依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果。
[0111]具體的,搜索引擎依據(jù)獲得的T個第二網(wǎng)頁,判斷T個第二網(wǎng)頁與M個第一網(wǎng)頁是否存在相同的網(wǎng)頁。
[0112]若所述T個第二網(wǎng)頁不包括所述M個第一網(wǎng)頁中任意一個第一網(wǎng)頁,則搜索引擎依據(jù)所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,其中,所述T個第二網(wǎng)頁的排序位置高于所述M個第一網(wǎng)頁的排序位置。也就是說,當(dāng)T個第二網(wǎng)頁與M個第一網(wǎng)頁之間不存在相同的網(wǎng)頁時,搜索引擎獲得的搜索結(jié)果包括T個網(wǎng)頁和M個第一網(wǎng)頁,為了提高利用傳統(tǒng)方法獲得的搜索結(jié)果的時效性,可以在搜索結(jié)果中,將T個網(wǎng)頁放在M個第一網(wǎng)頁的前面,用以優(yōu)先顯示T個網(wǎng)頁。
[0113]若所述T個第二網(wǎng)頁包括所述M個第一網(wǎng)頁中的全部第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁,獲得所述搜索結(jié)果;也就是說,M個第一網(wǎng)頁全部位于T個第二網(wǎng)頁中,則需要刪除相同的網(wǎng)頁,因此,這里將M個第一網(wǎng)頁全部刪除,僅依據(jù)T個第二網(wǎng)頁獲得搜索結(jié)果,搜索結(jié)果中只包括T個第二網(wǎng)頁。例如,依據(jù)關(guān)鍵詞獲得I個第一網(wǎng)頁,依據(jù)第一網(wǎng)頁獲得10個第二網(wǎng)頁,第二網(wǎng)頁中包括該第一網(wǎng)頁,在刪除該I個第一網(wǎng)頁,直接依據(jù)10個第二網(wǎng)頁獲得搜索結(jié)果。
[0114]若所述T個第二網(wǎng)頁包括M個第一網(wǎng)頁中W個第一網(wǎng)頁,W大于或等于I且小于M,且W為整數(shù),在所述M個第一網(wǎng)頁中刪除所述W個第一網(wǎng)頁,以獲得Q個第一網(wǎng)頁,Q等于M減去W ;依據(jù)所述T個第二網(wǎng)頁和所述Q個第一網(wǎng)頁,獲得所述搜索結(jié)果;其中,所述T個第二網(wǎng)頁的排序位置高于所述Q個第一網(wǎng)頁的排序位置。也就是說,當(dāng)T個第二網(wǎng)頁與M個第一網(wǎng)頁存在部分相同的網(wǎng)頁時,需要在M個第一網(wǎng)頁中刪除與T個第二網(wǎng)頁相同的部分網(wǎng)頁,從而獲得Q個第一網(wǎng)頁,搜索引擎獲得的搜索結(jié)果包括T個網(wǎng)頁和Q個第一網(wǎng)頁,為了提高利用傳統(tǒng)方法獲得的搜索結(jié)果的時效性,可以在搜索結(jié)果中,將T個網(wǎng)頁放在Q個第一網(wǎng)頁的前面,用以優(yōu)先顯示T個網(wǎng)頁。
[0115]本發(fā)明實施例進(jìn)一步給出實現(xiàn)上述方法實施例中各步驟及方法的裝置實施例。
[0116]請參考圖6,其為本發(fā)明實施例所提供的搜索結(jié)果的生成裝置的功能方塊圖,該搜索結(jié)果的生成裝置通常為圖1所示的搜索引擎。如圖6所示,該裝置包括:接收單元60、第一處理單元61、第二處理單元62、搜索生成單元63和發(fā)送單元64。
[0117]接收單元60用于接收客戶端發(fā)送的關(guān)鍵詞。
[0118]第一處理單元61用于依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù)。
[0119]第二處理單元62用于依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于O的整數(shù)。
[0120]具體的,所述第二處理單元62可以獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K為大于或等于P的整數(shù);依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁。
[0121]其中,所述第二處理單元62依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁具體為:
[0122]依據(jù)預(yù)設(shè)的所述K個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值和預(yù)設(shè)的權(quán)重閾值,獲得R個第二網(wǎng)頁;所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值大于所述權(quán)重閾值;R為小于或等于K,且大于或等于P的整數(shù);
[0123]依據(jù)所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序,對所述R個第二網(wǎng)頁排序,以獲得排序結(jié)果;
[0124]獲得所述R個第二網(wǎng)頁中排序靠前的L個第二網(wǎng)頁;L為小于或等于R,且大于或者等于P的整數(shù);
[0125]獲得所述關(guān)鍵詞與所述L個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度;
[0126]依據(jù)所述相關(guān)度和預(yù)設(shè)的相關(guān)度閾值,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁與所述關(guān)鍵詞的相關(guān)度大于所述相關(guān)度閾值。
[0127]搜索生成單元63用于依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果。[0128]具體的,所述搜索生成單元63可以依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值;按照所述結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得排序結(jié)果;依據(jù)所述排序結(jié)果,獲得排序靠前的T個第二網(wǎng)頁,所述T為小于或等于P的正整數(shù);依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果。
[0129]其中,所述搜索生成單元63獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值具體為:
[0130]利用如下公式獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值W (total):
[0131]W (total) = a X ffb+b X ffr+c X Wt
[0132]其中,Wb為依據(jù)所述第二網(wǎng)頁的質(zhì)量權(quán)重值獲得的第一中間權(quán)重值,Wr為依據(jù)關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度獲得的第二中間權(quán)重值,Wt為依據(jù)所述第二網(wǎng)頁的發(fā)布時間獲得的第三中間權(quán)重值,a、b和c為預(yù)設(shè)的調(diào)權(quán)因子。
[0133]其中,所述搜索生成單元63可以依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果具體為:
[0134]若所述T個第二網(wǎng)頁不包括所述M個第一網(wǎng)頁中任意一個第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,其中,所述T個第二網(wǎng)頁的排序位置高于所述M個第一網(wǎng)頁的排序位置;或者,
[0135]若所述T個第二網(wǎng)頁包括所述M個第一網(wǎng)頁中的全部第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁,獲得所述搜索結(jié)果;或者,
[0136]若所述T個第二網(wǎng)頁包括M個第一網(wǎng)頁中W個第一網(wǎng)頁,W為大于或等于1,且小于M的整數(shù),在所述M個第一網(wǎng)頁中刪除所述W個第一網(wǎng)頁,以獲得Q個第一網(wǎng)頁,Q等于M減去W ;依據(jù)所述T個第二網(wǎng)頁和所述Q個第一網(wǎng)頁,獲得所述搜索結(jié)果;其中,所述T個第二網(wǎng)頁的排序位置高于所述Q個第一網(wǎng)頁的排序位置。
[0137]發(fā)送單元64用于向所述客戶端發(fā)送所述搜索結(jié)果。
[0138]由于本實施例中的生成裝置能夠執(zhí)行圖2所示的方法,本實施例未詳細(xì)描述的部分,可參考對圖2的相關(guān)說明。
[0139]由以上描述可以看出,本發(fā)明實施例所提供的方法和裝置具備以下優(yōu)點:
[0140]本發(fā)明實施例所提供的技術(shù)方案中,依據(jù)關(guān)鍵詞對應(yīng)的第一網(wǎng)頁,獲得與其中部分第一網(wǎng)頁具有相同知識主體,且發(fā)布時間距離當(dāng)前時間最近的第二網(wǎng)頁,并依據(jù)第二網(wǎng)頁或者第二網(wǎng)頁和第一網(wǎng)頁,獲得搜索結(jié)果;由于第二網(wǎng)頁與對應(yīng)的第一網(wǎng)頁的知識主體相同,因此能夠保證第二網(wǎng)頁與關(guān)鍵詞的相關(guān)性,同時,第二網(wǎng)頁是發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁,因此,能夠保證獲得的搜索結(jié)果的時效性;與傳統(tǒng)技術(shù)方案中,僅依據(jù)點擊次數(shù)和入鏈數(shù)獲得搜索結(jié)果的方法相比,能夠?qū)崿F(xiàn)將時間較近的網(wǎng)頁排在搜索結(jié)果中靠前的位置,以便于用戶能夠及時獲得時間較近的網(wǎng)頁,可以滿足用戶的搜索需求,用以解決傳統(tǒng)技術(shù)方案中,由于網(wǎng)頁的入鏈數(shù)較少或點擊次數(shù)較少,在搜索結(jié)果中排序較低或不會出現(xiàn)在搜索結(jié)果中的問題,因此,本發(fā)明實施例所提供的技術(shù)方案能夠提高搜索結(jié)果的時效性,從而提高搜索引擎質(zhì)量,提升用戶體驗。
[0141]在本發(fā)明所提供的技術(shù)方案中,應(yīng)該理解到,所披露的裝置和方法,可以通過其他的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式。
[0142]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分不到多個網(wǎng)絡(luò)單元上,可以依據(jù)實際的需求選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0143]另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中,上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0144]上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)或處理器執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:通用串行總線(Universal Serial Bus, USB)閃存驅(qū)動器、移動硬盤、只讀存儲器(Read Only Memory,ROM)、隨機(jī)存取存儲器(Random AccessMemory, RAM)、磁盤或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0145]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種搜索結(jié)果的生成方法,其特征在于,所述方法包括: 接收客戶端發(fā)送的關(guān)鍵詞; 依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù); 依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于O的整數(shù); 依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果; 向所述客戶端發(fā)送所述搜索結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,包括: 獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K為大于或等于P的整數(shù); 依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中 每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,包括: 依據(jù)預(yù)設(shè)的所述K個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值和預(yù)設(shè)的權(quán)重閾值,獲得R個第二網(wǎng)頁;所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值大于所述權(quán)重閾值;R為小于或等于K,且大于或等于P的整數(shù); 依據(jù)所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序,對所述R個第二網(wǎng)頁排序,以獲得排序結(jié)果; 獲得所述R個第二網(wǎng)頁中排序靠前的L個第二網(wǎng)頁;L為小于或等于R,且大于或者等于P的整數(shù); 獲得所述關(guān)鍵詞與所述L個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度; 依據(jù)所述相關(guān)度和預(yù)設(shè)的相關(guān)度閾值,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁與所述關(guān)鍵詞的相關(guān)度大于所述相關(guān)度閾值。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,包括: 依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值; 按照所述結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得排序結(jié)果;依據(jù)所述排序結(jié)果,獲得排序靠前的T個第二網(wǎng)頁,所述T為小于或等于P的正整數(shù); 依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果O
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值,包括: 利用如下公式獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值W (total):
ff(total) = aXffb+bXffr+cXfft 其中,Wb為依據(jù)所述第二網(wǎng)頁的質(zhì)量權(quán)重值獲得的第一中間權(quán)重值,Wr為依據(jù)關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度獲得的第二中間權(quán)重值,Wt為依據(jù)所述第二網(wǎng)頁的發(fā)布時間獲得的第三中間權(quán)重值,a、b和c為預(yù)設(shè)的調(diào)權(quán)因子。
6.根據(jù)權(quán)要求4或5所述的方法,其特征在于,所述依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,包括: 若所述T個第二網(wǎng)頁不包括所述M個第一網(wǎng)頁中任意一個第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,其中,所述T個第二網(wǎng)頁的排序位置高于所述M個第一網(wǎng)頁的排序位置;或者, 若所述T個第二網(wǎng)頁包括所述M個第一網(wǎng)頁中的全部第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁,獲得所述搜索結(jié)果;或者, 若所述T個第二網(wǎng)頁包括M個第一網(wǎng)頁中W個第一網(wǎng)頁,W為大于或等于1,且小于M的整數(shù),在所述M個第一網(wǎng)頁中刪除所述W個第一網(wǎng)頁,以獲得Q個第一網(wǎng)頁,Q等于M減去W ;依據(jù)所述T個第二網(wǎng)頁和所述Q個第一網(wǎng)頁,獲得所述搜索結(jié)果;其中,所述T個第二網(wǎng)頁的排序位置高于所述Q個第一網(wǎng)頁的排序位置。
7.一種搜索結(jié)果的生成裝置,其特征在于,所述裝置包括: 接收單元,用于接收客戶端發(fā)送的關(guān)鍵詞; 第一處理單元,用于依據(jù)所述關(guān)鍵詞,獲得M個第一網(wǎng)頁,M為正整數(shù); 第二處理單元,用于依據(jù)所述關(guān)鍵詞和所述M個第一網(wǎng)頁中的前N個第一網(wǎng)頁,獲得所述前N個第一網(wǎng)頁中,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁;每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁為與該第一網(wǎng)頁具有相同知識主體且發(fā)布時間距離當(dāng)前時間最近的網(wǎng)頁;N為小于或等于M的正整數(shù),P為大于或等于O的整數(shù); 搜索生成單元,用于依據(jù)每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,或者每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得搜索結(jié)果; 發(fā)送單元,用于向所述客戶端發(fā)送所述搜索結(jié)果。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第二處理單元,具體用于: 獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的K個第二網(wǎng)頁,K為大于或等于P的整數(shù); 依據(jù)所述關(guān)鍵詞、所述K個第二網(wǎng)頁和所述K個第二網(wǎng)頁中每個第二網(wǎng)頁的發(fā)布時間,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第二處理單元,具體用于: 依據(jù)預(yù)設(shè)的所述K個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值和預(yù)設(shè)的權(quán)重閾值,獲得R個第二網(wǎng)頁;所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值大于所述權(quán)重閾值;R為小于或等于K,且大于或等于P的整數(shù); 依據(jù)所述R個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,按照發(fā)布時間距離當(dāng)前時間由近至遠(yuǎn)的順序,對所述R個第二網(wǎng)頁排序,以獲得排序結(jié)果; 獲得所述R個第二網(wǎng)頁中排序靠前的L個第二網(wǎng)頁;L為小于或等于R,且大于或者等于P的整數(shù); 獲得所述關(guān)鍵詞與所述L個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度; 依據(jù)所述相關(guān)度和預(yù)設(shè)的相關(guān)度閾值,獲得所述前N個第一網(wǎng)頁中每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁,每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁與所述關(guān)鍵詞的相關(guān)度大于所述相關(guān)度閾值。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述搜索生成單元,具體用于: 依據(jù)預(yù)設(shè)的每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的質(zhì)量權(quán)重值、所述關(guān)鍵詞與每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的相關(guān)度和每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的發(fā)布時間,獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值; 按照所述結(jié)果權(quán)重值由大到小的順序,對每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁排序,以獲得排序結(jié)果; 依據(jù)所述排序結(jié)果,獲 得排序靠前的T個第二網(wǎng)頁,所述T為小于或等于P的正整數(shù); 依據(jù)所述T個第二網(wǎng)頁,或者所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果O
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述搜索生成單元,具體用于: 利用如下公式獲得每個所述第一網(wǎng)頁所對應(yīng)的P個第二網(wǎng)頁中每個所述第二網(wǎng)頁的結(jié)果權(quán)重值W (total):
ff(total) = aXffb+bXffr+cXfft 其中,Wb為依據(jù)所述第二網(wǎng)頁的質(zhì)量權(quán)重值獲得的第一中間權(quán)重值,Wr為依據(jù)關(guān)鍵詞與所述第二網(wǎng)頁的相關(guān)度獲得的第二中間權(quán)重值,Wt為依據(jù)所述第二網(wǎng)頁的發(fā)布時間獲得的第三中間權(quán)重值,a、b和c為預(yù)設(shè)的調(diào)權(quán)因子。
12.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述搜索生成單元,具體用于: 若所述T個第二網(wǎng)頁不包括所述M個第一網(wǎng)頁中任意一個第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁和所述M個第一網(wǎng)頁,獲得所述搜索結(jié)果,其中,所述T個第二網(wǎng)頁的排序位置高于所述M個第一網(wǎng)頁的排序位置;或者, 若所述T個第二網(wǎng)頁包括所述M個第一網(wǎng)頁中的全部第一網(wǎng)頁,依據(jù)所述T個第二網(wǎng)頁,獲得所述搜索結(jié)果;或者, 若所述T個第二網(wǎng)頁包括M個第一網(wǎng)頁中W個第一網(wǎng)頁,W為大于或等于1,且小于M的整數(shù),在所述M個第一網(wǎng)頁中刪除所述W個第一網(wǎng)頁,以獲得Q個第一網(wǎng)頁,Q等于M減去W ;依據(jù)所述T個第二網(wǎng)頁和所述Q個第一網(wǎng)頁,獲得所述搜索結(jié)果;其中,所述T個第二網(wǎng)頁的排序位置高于所述Q個第一網(wǎng)頁的排序位置。
【文檔編號】G06F17/30GK103902687SQ201410114576
【公開日】2014年7月2日 申請日期:2014年3月25日 優(yōu)先權(quán)日:2014年3月25日
【發(fā)明者】梁爽, 牛章鵬 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司