推送包含新聞信息的網頁的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種推送包含新聞信息的網頁的方法和裝置,方法包括:將查詢詞與預存的時效性關鍵詞進行匹配;如查詢詞與時效性關鍵詞匹配,則獲取查詢詞的時效性;根據查詢詞的時效性強弱,確定在結果頁中插入的與時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。根據本發(fā)明,在查詢詞與預設時效性關鍵詞匹配時,分析查詢詞的時效性,查詢詞的時效性高低反映了新聞信息對于用戶的新聞性高低程度,所以基于查詢詞時效性高低對包含新聞信息的網頁URL進行排序,可將對用戶來說新聞性較高的新聞信息所在網頁URL排序在前。
【專利說明】推送包含新聞信息的網頁的方法和裝置
【技術領域】
[0001]本發(fā)明涉及計算機【技術領域】,具體而言,涉及一種推送包含新聞信息的網頁的方法和裝置。
【背景技術】
[0002]根據目前搜索引擎技術,用戶在其終端上輸入查詢詞后,搜索引擎會獲取與查詢詞對應的多個網頁URL,該多個網頁URL返回到用戶終端后,會在用戶終端的結果頁上展現。
[0003]由于網頁URL的數量為多個,則在結果頁上展現時必然存在排序問題。根據目前的搜索引擎技術,一般排序在前的都是較舊的網頁URL。這種排序對于包含新聞信息的網頁URL來說存在較大缺陷:在用戶輸入查詢詞來搜索新聞的場景下,所以目前的搜索引擎技術只能將舊新聞的網頁URL排序在前,而最新新聞的網頁URL排序在后,但由于新聞具有時效性的特點,大部分新聞的新聞性都是隨著時間的推移而降低,則用戶最終查看到的很可能是新聞性較低的新聞,新聞性較高的新聞由于其網頁URL排序靠后,用戶難以發(fā)現并打開。
[0004]由此可見,現有的搜索引擎技術難以分析新聞信息對用戶的新聞性,難以恰當地對包含新聞信息的網頁URL進行排序,進而無法完成對包含新聞信息的網頁的有效推送。
【發(fā)明內容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的推送包含新聞信息的網頁的方法和裝置。
[0006]依據本發(fā)明的一個方面,提供了一種推送包含新聞信息的網頁的方法,其包括:將查詢詞與預存的時效性關鍵詞進行匹配;如所述查詢詞與所述時效性關鍵詞匹配,則獲取所述查詢詞的時效性;根據所述查詢詞的時效性強弱,確定在結果頁中插入的與所述時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。
[0007]可選地,所述獲取所述查詢詞的時效性的步驟包括:獲取所述查詢詞對應的多個網頁的URL ;計算所述多個網頁與所述包含新聞信息的網頁之間的差別;根據所述多個網頁與所述包含新聞信息的網頁之間的差別,計算所述查詢詞的時效性。
[0008]可選地,所述計算所述多個網頁與所述包含新聞信息的網頁之間的差別的步驟包括:計算所述多個網頁的第一時效屬性特征;將所述第一時效屬性特征與預存的所述包含新聞信息的網頁的第二時效屬性特征進行比較,得到所述多個網頁與所述包含新聞信息的網頁之間的差別。
[0009]可選地,所述第一時效屬性特征包括所述多個網頁的分類、所述多個網頁的生成時間、所述查詢詞在所述多個網頁中出現的頻度和/或所述查詢詞在所述多個網頁中的出現次數與已知歷史出現次數之間的對比數據。
[0010]可選地,所述根據所述查詢詞的時效性強弱,確定在結果頁中插入的與所述時效性關鍵詞對應的包含新聞信息的網頁的URL的位置的步驟包括:在所述結果頁上劃分多個區(qū)間,分別對應不同強弱程度的時效性;選擇與所述查詢詞的時效性強弱匹配的區(qū)間,并將所述包含新聞信息的網頁的URL置于所選區(qū)間中。
[0011]可選地,每個區(qū)間分為自上而下的三個部分,且每個區(qū)間具有對應的置信度,所述將所述包含新聞信息的網頁的URL置于所選區(qū)間中的步驟還包括:如所述查詢詞的時效性高于所選區(qū)間的置信度,則將所述包含新聞信息的網頁的URL置于所選區(qū)間中的最上部分,如所述查詢詞的時效性與所選區(qū)間的置信度一致,則將所述包含新聞信息的網頁的URL置于所選區(qū)間中的中間部分,如所述查詢詞的時效性低于所選區(qū)間的置信度,則將所述包含新聞信息的網頁的URL置于所選區(qū)間中的最下部分。
[0012]依據本發(fā)明的另一方面,還提供一種推送包含新聞信息的網頁的裝置,其包括:關鍵詞數據庫,用于預存時效性關鍵詞;關鍵詞匹配模塊,用于將查詢詞與預存的時效性關鍵詞進行匹配;查詢詞時效性獲取模塊,用于如所述查詢詞與所述時效性關鍵詞匹配,則獲取所述查詢詞的時效性;新聞網頁展示模塊,用于根據所述查詢詞的時效性強弱,確定在結果頁中插入的與所述時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。
[0013]可選地,還包括:網頁URL獲取模塊,用于獲取所述查詢詞對應的多個網頁的URL ;差別計算模塊,用于計算所述多個網頁與所述包含新聞信息的網頁之間的差別;所述查詢詞時效性獲取模塊根據所述多個網頁與所述包含新聞信息的網頁之間的差別,計算所述查詢詞的時效性。
[0014]可選地,還包括:特征計算器,用于計算所述多個網頁的第一時效屬性特征;所述差別計算模塊,用于將所述第一時效屬性特征與預存的所述包含新聞信息的網頁的第二時效屬性特征進行比較,得到所述多個網頁與所述包含新聞信息的網頁之間的差別。
[0015]可選地,所述第一時效屬性特征包括所述多個網頁的分類、所述多個網頁的生成時間、所述查詢詞在所述多個網頁中出現的頻度和/或所述查詢詞在所述多個網頁中的出現次數與已知歷史出現次數之間的對比數據。
[0016]可選地,所述新聞網頁展示模塊包括:區(qū)間劃分模塊,用于在所述結果頁上劃分多個區(qū)間,分別對應不同強弱程度的時效性;區(qū)間選擇模塊,用于選擇與所述查詢詞的時效性強弱匹配的區(qū)間,并將所述包含新聞信息的網頁的URL置于所選區(qū)間中。
[0017]可選地,每個區(qū)間分為自上而下的三個部分,且每個區(qū)間具有對應的置信度,如所述查詢詞的時效性高于所選區(qū)間的置信度,則所述區(qū)間選擇模塊將所述包含新聞信息的網頁的URL置于所選區(qū)間中的最上部分,如所述查詢詞的時效性與所選區(qū)間的置信度一致,則所述區(qū)間選擇模塊將所述包含新聞信息的網頁的URL置于所選區(qū)間中的中間部分,如所述查詢詞的時效性低于所選區(qū)間的置信度,則所述區(qū)間選擇模塊將所述包含新聞信息的網頁的URL置于所選區(qū)間中的最下部分。
[0018]根據本發(fā)明的推送包含新聞信息的網頁的方法和裝置,在查詢詞與預設時效性關鍵詞匹配時,說明時效性關鍵詞對應的包含新聞信息的網頁也是查詢詞對應的搜索結果,此時分析查詢詞的時效性,查詢詞的時效性高低反映了新聞信息對于用戶的新聞性高低程度,所以基于查詢詞時效性高低對包含新聞信息的網頁URL進行排序,可將對用戶來說新聞性較高的新聞信息所在網頁URL排序在前,方便用戶及時查看到所需的新聞信息,從而實現包含新聞信息的網頁的有效推送。[0019]上述說明僅是本發(fā)明技術方案的概述,為了能夠更清楚了解本發(fā)明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0020]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0021]圖1示出了根據本發(fā)明的一個實施例的推送包含新聞信息的網頁的方法的流程圖;
[0022]圖2示出了根據本發(fā)明的一個實施例的推送包含新聞信息的網頁的方法的部分流程圖;
[0023]圖3示出了根據本發(fā)明的一個實施例的推送包含新聞信息的網頁的方法的部分流程圖;
[0024]圖4示出了根據本發(fā)明的一個實施例的推送包含新聞信息的網頁的裝置的框圖;
[0025]圖5示出了根據本發(fā)明的一個實施例的推送包含新聞信息的網頁的裝置的框圖;
[0026]圖6示出了根據本發(fā)明的一個實施例的推送包含新聞信息的網頁的裝置的單個模塊框圖。
【具體實施方式】
[0027]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
[0028]如圖1所示,本發(fā)明的一個實施例提供了一種推送包含新聞信息的網頁的方法,其包括:步驟110,將查詢詞與預存的時效性關鍵詞進行匹配。本實施例中的時效性關鍵詞可以是能夠反映新聞信息時效性的所有內容,例如,可以是一些當前熱點詞匯,具體可以表示人物、事件、地點等。
[0029]步驟120,如查詢詞與時效性關鍵詞匹配,則獲取查詢詞的時效性。本實施例中查詢詞和時效性關鍵詞匹配的情況包括但不限于:查詢詞與時效性關鍵詞全部或部分相同、查詢詞與時效性關鍵詞為不同語言的同一釋義、查詢詞與時效性關鍵詞為同義詞、查詢詞為時效性關鍵詞的拼音。查詢詞與時效性關鍵詞相匹配,說明包含新聞信息的網頁也是查詢詞對應的查詢結果。由于新聞信息具有時效性特點,所以對包含新聞信息的網頁的URL排序需要按新聞信息的新聞性大小來排序,而本實施例中計算出的查詢詞的時效性正是量化的新聞性。
[0030]步驟130,根據查詢詞的時效性強弱,確定在結果頁中插入的與時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。在本實施例的技術方案中,實際上是對用戶來說新聞性較高的新聞信息所在網頁的URL排序在前,從而便于用戶進行點擊打開,利于實現包含新聞信息的網頁的推送。[0031]如圖2所示,本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的方法。本實施例的推送包含新聞信息的網頁的方法,步驟120包括:步驟121,獲取查詢詞對應的多個網頁的URL;步驟122,計算多個網頁與包含新聞信息的網頁之間的差別,可以將網頁的所有內容都用于進行比較,也可以從網頁中提取具有代表性的關鍵內容進行比較;步驟123,根據多個網頁與包含新聞信息的網頁之間的差別,計算查詢詞的時效性。
[0032]在本實施例的技術方案中,由于新聞信息往往是突發(fā)性事件,所以包含新聞信息的網頁與多個網頁之間的差別,往往能夠反映新聞信息的新聞性,也即查詢詞的時效性。
[0033]本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的方法,本實施例的推送包含新聞信息的網頁的方法,步驟122包括:計算多個網頁的第一時效屬性特征,并將第一時效屬性特征與預存的包含新聞信息的網頁的第二時效屬性特征進行比較,得到多個網頁與包含新聞信息的網頁之間的差別。
[0034]本實施例中不限制第一時效屬性特征的計算過程和結果形式,第一時效屬性特征包含但不限于具體的數值或向量。本實施例中不限制第二時效屬性特征的計算過程和結果形式,與第一時效屬性特征的計算過程和結果形式一致即可,以便于兩者進行比較。
[0035]本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的方法,本實施例的推送包含新聞信息的網頁的方法,第一時效屬性特征包括多個網頁的分類、多個網頁的生成時間、查詢詞在多個網頁中出現的頻度和/或查詢詞在多個網頁中的出現次數與已知歷史出現次數之間的對比數據。在本實施例的技術方案中,網頁的分類可以是多層。例如首先可分為bbs、blog、新聞三大類,進而對新聞繼續(xù)分國內、國際、軍事……等。需要注意的是,網頁的生成時間不同于被抓取時間,生成時間較近則說明新聞信息內容較新,更可能是突發(fā)性新聞,所以其可作為時效 屬性特征。時效性關鍵詞出現頻率較高,或出現次數相對于歷史出現次數有顯著提高,都說明新聞信息可能是突發(fā)性或熱點新聞,所以其可作為時效屬性特征。
[0036]如圖3所示,本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的方法,本實施例的推送包含新聞信息的網頁的方法,步驟130包括:步驟131,在結果頁上劃分多個區(qū)間,分別對應不同強弱程度的時效性;步驟132,選擇與查詢詞的時效性強弱匹配的區(qū)間,并將包含新聞信息的網頁的URL置于所選區(qū)間中。在本實施例的技術方案中,提供了一種有效的排序方式,本實施例的一個具體實現方式如下:結果頁的首頁一般有10個位置可以展現搜索結果URL (從上到下命名為位置I到位置10)。本發(fā)明將結果頁首頁的搜索結果劃分為多個區(qū)間,比如位置I到位置3劃分為一個區(qū)間標記為區(qū)間1,將位置4到位置6劃分為第二個區(qū)間標記為區(qū)間2,將位置7到位置9劃分為第3個區(qū)間標記為區(qū)間3,將位置10劃分為第4個區(qū)間標記為區(qū)間4。另外,增加一個區(qū)間為標記為區(qū)間5,區(qū)間5不顯示在首頁上。當查詢詞的時效性強弱與區(qū)間1、2、3或4對應時,則將包含新聞信息的網頁的URL顯示在結果頁首頁對應的區(qū)間內,當查詢詞的時效性強弱對應區(qū)間5的時候,認為時效性的結果不適合出來在搜索結果中,最終不會在結果頁的首頁上展現出來。模型數據準備:收集用戶在新聞頻道的搜索詞,人工對這些搜索詞進行標注,根據搜索詞的時效性強弱,指定應該劃分的區(qū)間。例如,如果查詢詞為“360商業(yè)化”,經過計算后這個查詢詞與區(qū)間I的時效性強弱一致,則將包含新聞信息的網頁“360搜索首次披露商業(yè)化進程”的URL置于區(qū)間I。[0037]本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的方法,本實施例的推送包含新聞信息的網頁的方法,每個區(qū)間分為自上而下的三個部分,且每個區(qū)間具有對應的置信度,步驟132還包括:如查詢詞的時效性高于所選區(qū)間的置信度,則將包含新聞信息的網頁的URL置于所選區(qū)間中的最上部分;如查詢詞的時效性與所選區(qū)間的置信度一致,則將包含新聞信息的網頁的URL置于所選區(qū)間中的中間部分;如查詢詞的時效性低于所選區(qū)間的置信度,則將包含新聞信息的網頁的URL置于所選區(qū)間中的最下部分。在本實施例的技術方案中,對每個區(qū)間又進行了細分,更細致地布置了包含新聞信息的網頁的URL的位置。在本實施例的一個具體實現方式中,用戶輸入一個查詢詞,經過計算后查詢詞的時效性對應的區(qū)間,該區(qū)間對應的時效性強弱為一個范圍值,即置信度,比如置信度區(qū)間指定為
0.7-0.9,假如判斷當前查詢詞的時效性大于置信度區(qū)間的上限值0.9,則將包含新聞信息的網頁的URL劃分到該區(qū)間的最上部分,假如查詢詞的時效性強弱在置信度區(qū)間內(即0.7和0.9)之間,則將包含新聞信息的網頁的URL劃分到本區(qū)間的中間部分,假如查詢詞的時效性小于置信度區(qū)間的下限值0.7,則劃分到區(qū)間的最下部分。
[0038]如圖4所示,本發(fā)明的另一實施例還提供一種推送包含新聞信息的網頁的裝置,其包括:關鍵詞數據庫210,用于預存時效性關鍵詞。本實施例中的時效性關鍵詞可以是能夠反映新聞信息時效性的所有內容,例如,可以是一些當前熱點詞匯,具體可以表示人物、事件、地點等。關鍵詞匹配模塊220,用于將查詢詞與預存的時效性關鍵詞進行匹配。查詢詞時效性獲取模塊230,用于如查詢詞與時效性關鍵詞匹配,則獲取查詢詞的時效性。本實施例中查詢詞和時效性關鍵詞匹配的情況包括但不限于:查詢詞與時效性關鍵詞全部或部分相同、查詢詞與時效性關鍵詞為不同語言的同一釋義、查詢詞與時效性關鍵詞為同義詞、查詢詞為時效性關鍵詞的拼音。查詢詞與時效性關鍵詞相匹配,說明包含新聞信息的網頁也是查詢詞對應的查詢結果。由于新聞信息具有時效性特點,所以對包含新聞信息的網頁的URL排序需要按新聞信息的新聞性大小來排序,而本實施例中計算出的查詢詞的時效性正是量化的新聞性。新聞網頁展示模塊240,用于根據查詢詞的時效性強弱,確定在結果頁中插入的與時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。在本實施例的技術方案中,實際上是對用戶來說新聞性較高的新聞信息所在網頁的URL排序在前,從而便于用戶進行點擊打開,利于實現包含新聞信息的網頁的推送。
[0039]如圖5所示,本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的裝置,本實施例的推送包含新聞信息的網頁的裝置,還包括:網頁URL獲取模塊250,用于獲取查詢詞對應的多個網頁的URL ;差別計算模塊260,用于計算多個網頁與包含新聞信息的網頁之間的差別,可以將網頁的所有內容都用于進行比較,也可以從網頁中提取具有代表性的關鍵內容進行比較;查詢詞時效性獲取模塊240根據多個網頁與包含新聞信息的網頁之間的差別,計算查詢詞的時效性。在本實施例的技術方案中,由于新聞信息往往是突發(fā)性事件,所以包含新聞信息的網頁與多個網頁之間的差別,往往能夠反映新聞信息的新聞性,也即查詢詞的時效性。
[0040]如圖5所示,本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的裝置,本實施例的推送包含新聞信息的網頁的裝置,還包括:特征計算器270,用于計算多個網頁的第一時效屬性特征;差別計算模塊280,用于將第一時效屬性特征與預存的包含新聞信息的網頁的第二時效屬性特征進行比較,得到多個網頁與包含新聞信息的網頁之間的差別。本實施例中不限制第一時效屬性特征的計算過程和結果形式,第一時效屬性特征包含但不限于具體的數值或向量。本實施例中不限制第二時效屬性特征的計算過程和結果形式,與第一時效屬性特征的計算過程和結果形式一致即可,以便于兩者進行比較。
[0041]本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的裝置,本實施例的推送包含新聞信息的網頁的裝置,第一時效屬性特征包括多個網頁的分類、多個網頁的生成時間、查詢詞在多個網頁中出現的頻度和/或查詢詞在多個網頁中的出現次數與已知歷史出現次數之間的對比數據。在本實施例的技術方案中,網頁的分類可以是多層,例如首先可分為bbs、blog、新聞三大類,進而對新聞繼續(xù)分國內、國際、軍事……等。需要注意的是,網頁的生成時間不同于被抓取時間,生成時間較近則說明新聞信息內容較新,更可能是突發(fā)性新聞,所以其可作為時效屬性特征。時效性關鍵詞出現頻率較高,或出現次數相對于歷史出現次數有顯著提高,都說明新聞信息可能是突發(fā)性或熱點新聞,所以其可作為時效屬性特征。
[0042]如圖6所示,本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的裝置,本實施例的推送包含新聞信息的網頁的裝置,新聞網頁展示模塊240包括:區(qū)間劃分模塊241,用于在結果頁上劃分多個區(qū)間,分別對應不同強弱程度的時效性;區(qū)間選擇模塊242,用于選擇與查詢詞的時效性強弱匹配的區(qū)間,并將包含新聞信息的網頁的URL置于所選區(qū)間中。在本實施例的技術方案中,提供了一種有效的排序方式,本實施例的一個具體實現方式如下:結果頁的首頁一般有10個位置可以展現搜索結果URL (從上到下命名為位置I到位置10)。本發(fā)明將結果頁首頁的搜索結果劃分為多個區(qū)間,比如位置I到位置3劃分為一個區(qū)間標記為區(qū)間1,將位置4到位置6劃分為第二個區(qū)間標記為區(qū)間2,將位置7到位置9劃分為第3個區(qū)間標記為區(qū)間3,將位置10劃分為第4個區(qū)間標記為區(qū)間4。另外,增加一個區(qū)間為標記為區(qū)間5,區(qū)間5不顯示在首頁上。當查詢詞的時效性強弱與區(qū)間1、2、3或4對應時,則將包含新聞信息的網頁的URL顯示在結果頁首頁對應的區(qū)間內。當查詢詞的時效性強弱對應區(qū)間5的時候,認為時效性的結果不適合出來在搜索結果中,最終不會在結果頁的首頁上展現出來。模型數據準備:收集用戶在新聞頻道的搜索詞,人工對這些搜索詞進行標注,根據搜索詞的時效性強弱,指定應該劃分的區(qū)間。例如,如果查詢詞為“360商業(yè)化”,經過計算后這個查詢詞與區(qū)間I的時效性強弱一致,則將包含新聞信息的網頁“360搜索首次披露商業(yè)化進程”的URL置于區(qū)間I。
[0043] 本發(fā)明的另一實施例提出一種推送包含新聞信息的網頁的裝置,本實施例的推送包含新聞信息的網頁的裝置,每個區(qū)間分為自上而下的三個部分,且每個區(qū)間具有對應的置信度。如查詢詞的時效性高于所選區(qū)間的置信度,則區(qū)間選擇模塊242將包含新聞信息的網頁的URL置于所選區(qū)間中的最上部分。如查詢詞的時效性與所選區(qū)間的置信度一致,則區(qū)間選擇模塊242將包含新聞信息的網頁的URL置于所選區(qū)間中的中間部分。如查詢詞的時效性低于所選區(qū)間的置信度,則區(qū)間選擇模塊242將包含新聞信息的網頁的URL置于所選區(qū)間中的最下部分。在本實施例的技術方案中,對每個區(qū)間又進行了細分,更細致地布置了包含新聞信息的網頁的URL的位置。在本實施例的一個具體實現方式中,用戶輸入一個查詢詞,經過計算后查詢詞的時效性對應的區(qū)間,該區(qū)間對應的時效性強弱為一個范圍值,即置信度。比如置信度的區(qū)間指定為0.7-0.9,假如判斷當前查詢詞的時效性大于置信度區(qū)間的上限值0.9,則將包含新聞信息的網頁的URL劃分到該區(qū)間的最上部分;假如查詢詞的時效性強弱在置信度區(qū)間內(即0.7和0.9之間),則將包含新聞信息的網頁的URL劃分到本區(qū)間的中間部分;假如查詢詞的時效性小于置信度區(qū)間的下限值0.7,則劃分到區(qū)間的最下部分。
[0044]在此提供的算法和顯示不與任何特定計算機、虛擬系統或者其它設備固有相關。各種通用系統也可以與基于在此的示教一起使用。根據上面的描述,構造這類系統所要求的結構是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現在此描述的本發(fā)明的內容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
[0045]在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。
[0046]類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面的權利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權利要求書由此明確地并入該【具體實施方式】,其中每個權利要求本身都作為本發(fā)明的單獨實施例。
[0047]本領域那些技術人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0048]此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內并且形成不同的實施例。例如,在下面的權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
[0049]本發(fā)明的各個部件實施例可以以硬件實現,或者以在一個或者多個處理器上運行的軟件模塊實現,或者以它們的組合實現。本領域的技術人員應當理解,可以在實踐中使用微處理器或者數字信號處理器(DSP)來實現根據本發(fā)明實施例的推送包含新聞信息的網頁的方法和裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現為用于執(zhí)行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產品)。這樣的實現本發(fā)明的程序可以存儲在計算機可讀介質上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網網站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0050]應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。
【權利要求】
1.一種推送包含新聞信息的網頁的方法,其包括: 將查詢詞與預存的時效性關鍵詞進行匹配; 如所述查詢詞與所述時效性關鍵詞匹配,則獲取所述查詢詞的時效性; 根據所述查詢詞的時效性強弱,確定在結果頁中插入的與所述時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。
2.根據權利要求1所述的方法,其中,所述獲取所述查詢詞的時效性的步驟包括: 獲取所述查詢詞對應的多個網頁的URL ; 計算所述多個網頁與所述包含新聞信息的網頁之間的差別; 根據所述多個網頁與所述包含新聞信息的網頁之間的差別,計算所述查詢詞的時效性。
3.根據權利要求1-2任一項所述的方法,其中,所述計算所述多個網頁與所述包含新聞信息的網頁之間的差別的步驟包括: 計算所述多個網頁的第一時效屬性特征; 將所述第一時效屬性特征與預存的所述包含新聞信息的網頁的第二時效屬性特征進行比較,得到所述多個網頁與所述包含新聞信息的網頁之間的差別。
4.根據權利要 求1-3中任一項所述的方法,其中,所述第一時效屬性特征包括所述多個網頁的分類、所述多個網頁的生成時間、所述查詢詞在所述多個網頁中出現的頻度和/或所述查詢詞在所述多個網頁中的出現次數與已知歷史出現次數之間的對比數據。
5.根據權利要求1至4中任一項所述的方法,其中,所述根據所述查詢詞的時效性強弱,確定在結果頁中插入的與所述時效性關鍵詞對應的包含新聞信息的網頁的URL的位置的步驟包括: 在所述結果頁上劃分多個區(qū)間,分別對應不同強弱程度的時效性; 選擇與所述查詢詞的時效性強弱匹配的區(qū)間,并將所述包含新聞信息的網頁的URL置于所選區(qū)間中。
6.根據權利要求1-5中任一項所述的方法,其中,每個區(qū)間分為自上而下的三個部分,且每個區(qū)間具有對應的置信度,所述將所述包含新聞信息的網頁的URL置于所選區(qū)間中的步驟還包括: 如所述查詢詞的時效性高于所選區(qū)間的置信度,則將所述包含新聞信息的網頁的URL置于所選區(qū)間中的最上部分,如所述查詢詞的時效性與所選區(qū)間的置信度一致,則將所述包含新聞信息的網頁的URL置于所選區(qū)間中的中間部分,如所述查詢詞的時效性低于所選區(qū)間的置信度,則將所述包含新聞信息的網頁的URL置于所選區(qū)間中的最下部分。
7.—種推送包含新聞信息的網頁的裝置,其包括: 關鍵詞數據庫,用于預存時效性關鍵詞; 關鍵詞匹配模塊,用于將查詢詞與預存的時效性關鍵詞進行匹配; 查詢詞時效性獲取模塊,用于如所述查詢詞與所述時效性關鍵詞匹配,則獲取所述查詢詞的時效性; 新聞網頁展示模塊,用于根據所述查詢詞的時效性強弱,確定在結果頁中插入的與所述時效性關鍵詞對應的包含新聞信息的網頁的URL的位置。
8.根據權利要求7所述的裝置,其中,還包括:網頁URL獲取模塊,用于獲取所述查詢詞對應的多個網頁的URL ; 差別計算模塊,用于計算所述多個網頁與所述包含新聞信息的網頁之間的差別;所述查詢詞時效性獲取模塊根據所述多個網頁與所述包含新聞信息的網頁之間的差別,計算所述查詢詞的時效性。
9.根據權利要求7-8任一項所述的裝置,其中,還包括: 特征計算器,用于計算所述多個網頁的第一時效屬性特征; 所述差別計算模塊,用于將所述第一時效屬性特征與預存的所述包含新聞信息的網頁的第二時效屬性特征進行比較,得到所述多個網頁與所述包含新聞信息的網頁之間的差別。
10.根據權利要求7-9任一項所述的裝置,其中,所述第一時效屬性特征包括所述多個網頁的分類、所述多個網頁的生成時間、所述查詢詞在所述多個網頁中出現的頻度和/或所述查詢詞在所述多 個網頁中的出現次數與已知歷史出現次數之間的對比數據。
【文檔編號】G06F17/30GK103942264SQ201410116836
【公開日】2014年7月23日 申請日期:2014年3月26日 優(yōu)先權日:2014年3月26日
【發(fā)明者】常富洋, 秦吉勝, 蘇文杰 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司