两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

檢測(cè)互聯(lián)網(wǎng)信息傳播的網(wǎng)頁(yè)關(guān)聯(lián)評(píng)價(jià)裝置的制作方法

文檔序號(hào):6575512閱讀:138來(lái)源:國(guó)知局
專利名稱:檢測(cè)互聯(lián)網(wǎng)信息傳播的網(wǎng)頁(yè)關(guān)聯(lián)評(píng)價(jià)裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種互聯(lián)網(wǎng)信息傳播檢測(cè)技術(shù),用于評(píng)價(jià)互聯(lián)網(wǎng)網(wǎng)頁(yè)間相互的關(guān)聯(lián)關(guān)系。

發(fā)明內(nèi)容
近年來(lái),企業(yè)和個(gè)人利用網(wǎng)頁(yè)、博客和SNS (Social Network Service)來(lái)發(fā)布信息。所發(fā) 布的信息時(shí)常受到其它信息資源的影響。例如,某個(gè)企業(yè)在網(wǎng)頁(yè)上宣布將推出新產(chǎn)品,而看 到了這個(gè)網(wǎng)頁(yè)的某個(gè)人則在博客上公開該信息以及對(duì)該新產(chǎn)品的意見。如此,信息藍(lán)網(wǎng)頁(yè)傳 播開來(lái)。然而,也有對(duì)公布網(wǎng)頁(yè)的信息之傳播感到不快的情況。例如,盡管沒(méi)有真正發(fā)生丑 聞,但如果中傷企業(yè)的信息蔓延至大量的網(wǎng)站且為多人所知,那么就有可能會(huì)影響并阻礙該 企業(yè)的經(jīng)濟(jì)活動(dòng)。在此情形下,企業(yè)會(huì)希望了解該信息的傳播路徑。如能弄清構(gòu)成傳播路徑 的核心網(wǎng)頁(yè)或信息源頭在何處,就可定期檢閱此站點(diǎn),迅速察知不利信息的流傳并盡早采取 對(duì)策。
另外,有時(shí)也會(huì)出現(xiàn)尋求廣告效果而在網(wǎng)頁(yè)、博客和SNS等公開信息的情況。例如,企業(yè) 即將發(fā)售新產(chǎn)品這一事實(shí)在本公司網(wǎng)站上作為新聞發(fā)布時(shí),而一般人通常則經(jīng)由新網(wǎng)網(wǎng)站或 有名的博客網(wǎng)站了解此事實(shí)。在這種情況下,該企業(yè)從屬人員會(huì)希望了解信息是經(jīng)何種途徑 傳播。如能確定將信息直接或通過(guò)影響其它有名博客間接傳播給多數(shù)民眾的新聞網(wǎng)站或有名 博客,便可將焦點(diǎn)集中于此類站點(diǎn),進(jìn)行更有效率的廣告行為。然而,目前尚不存在對(duì)通過(guò) 網(wǎng)頁(yè)擴(kuò)散信息的傳播路徑進(jìn)行精確定義的技術(shù)。也就是說(shuō),不存在對(duì)網(wǎng)頁(yè)之間的相互關(guān)聯(lián)關(guān) 系進(jìn)行精確定義的技術(shù)。
本發(fā)明的目的是,提供一種可對(duì)互聯(lián)網(wǎng)網(wǎng)頁(yè)之間的相互關(guān)聯(lián)關(guān)系進(jìn)行精確定義的網(wǎng)頁(yè)關(guān)系 評(píng)價(jià)裝置。
為解決所述課題并達(dá)成上述目的,本發(fā)明中的網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置包括 -可獲取多個(gè)判斷對(duì)象網(wǎng)頁(yè)中各自構(gòu)成信息的獲取部分;
-基于上述獲取部件所取得的信息,檢測(cè)多個(gè)判斷對(duì)象網(wǎng)頁(yè)其生成時(shí)刻的檢測(cè)部分,_基于上述信息獲取部分所取得的信息,計(jì)算其他判斷對(duì)象網(wǎng)頁(yè)其各自之間相似度的相似 度計(jì)算部分;
-在根據(jù)上述相似度計(jì)算部分所得出的相似性度量值中,對(duì)于達(dá)到所規(guī)定的閾值以上的相 似度值,作為判斷兩個(gè)對(duì)象網(wǎng)頁(yè)相互關(guān)聯(lián)程度的關(guān)聯(lián)關(guān)系定義部分。
同時(shí),本發(fā)明的另一形式是,使本發(fā)明的網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置中的各構(gòu)件功能在計(jì)算機(jī)上得 以程序?qū)崿F(xiàn)。
本發(fā)明可提供一種可對(duì)關(guān)聯(lián)網(wǎng)網(wǎng)頁(yè)之間的相互關(guān)系進(jìn)行精確定義的網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置。


圖1為本發(fā)明實(shí)施方式中的網(wǎng)頁(yè)關(guān)聯(lián)分析系統(tǒng)結(jié)構(gòu)圖
圖2為本發(fā)明實(shí)施方式中網(wǎng)頁(yè)分析部件的結(jié)構(gòu)圖
圖3為本發(fā)明實(shí)施方式中網(wǎng)頁(yè)分析系統(tǒng)的工作概要說(shuō)明圖
圖4為表示圖2中檢索關(guān)鍵詞生成部件所進(jìn)行的檢索關(guān)鍵詞生成工作各步驟的流程圖
圖5為表示圖2中網(wǎng)頁(yè)關(guān)聯(lián)程度評(píng)價(jià)部件所進(jìn)行的網(wǎng)頁(yè)相互關(guān)系評(píng)價(jià)工作的各步驟的流程圖
圖6 (A)為表示按照生成時(shí)刻順序排列的4個(gè)判斷對(duì)象網(wǎng)頁(yè)、與各判斷對(duì)象的網(wǎng)頁(yè)之間的
相似度的關(guān)系圖
圖6 (B)為圖6 (A)中4個(gè)判斷對(duì)象網(wǎng)頁(yè)的相關(guān)網(wǎng)頁(yè)之間以線連結(jié)生成的網(wǎng)絡(luò)關(guān)系圖 圖7為表示圖2的網(wǎng)站評(píng)價(jià)部件所進(jìn)行的網(wǎng)站評(píng)價(jià)工作各步驟的流程圖 圖8為網(wǎng)站的示意圖
其中符號(hào)說(shuō)明為1 0 0網(wǎng)頁(yè)分析部件、2 0 0客戶終端裝置、3 0 0 檢索部 件、4 0 0通信網(wǎng)絡(luò)、5 0 0網(wǎng)站訪問(wèn)量推算部件、 2 5 0顯示裝置、 1 0 通訊部件、2 0檢索關(guān)鍵詞生成部件、3 0網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件、4 0 網(wǎng)站評(píng)價(jià) 部件、1獲取部分、2生成時(shí)刻檢驗(yàn)部分、3相似度計(jì)算部分、4 相似度 修正部分、5關(guān)聯(lián)網(wǎng)頁(yè)定義部分、6網(wǎng)絡(luò)關(guān)系圖生成部分、7 輸出部分。
具體實(shí)施例方式
以下將參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行說(shuō)明。
首先,利用圖1說(shuō)明本實(shí)施方式的網(wǎng)頁(yè)關(guān)聯(lián)分析系統(tǒng)的結(jié)構(gòu)。圖1為本實(shí)施方式的網(wǎng)頁(yè)關(guān) 聯(lián)分析系統(tǒng)的結(jié)構(gòu)圖,包括網(wǎng)頁(yè)分析部件100、客戶終端裝置200、檢索部件300、通信網(wǎng)絡(luò)
5400與網(wǎng)站訪問(wèn)量推算部件500。
網(wǎng)頁(yè)分析部件100,是對(duì)在通信網(wǎng)絡(luò)400中明示的網(wǎng)頁(yè)進(jìn)行分析的模塊。網(wǎng)頁(yè)分析部件IOO 的詳細(xì)結(jié)構(gòu)將通過(guò)圖2進(jìn)行詳述??蛻艚K端200是供用戶使用的裝置,從用戶那里接受檢索 關(guān)鍵詞或檢索與檢索關(guān)鍵詞相關(guān)的網(wǎng)頁(yè)等指令(以下簡(jiǎn)稱"檢索命令")。客戶終端200將 所接受的指令發(fā)送給網(wǎng)頁(yè)分析部件100或檢索部件300,并從網(wǎng)頁(yè)分析部件100及檢索部件 300那里接收其得到的結(jié)果。如圖1所示,客戶終端裝置200中連接著顯示裝置250,客戶終 端裝置200所接收的信息將通過(guò)顯示裝置250展示。
檢索部件300,是在通信網(wǎng)絡(luò)400中明示的網(wǎng)頁(yè)中對(duì)與檢索關(guān)鍵詞相關(guān)的網(wǎng)頁(yè)進(jìn)行檢索的模 塊。通信網(wǎng)絡(luò)400,是將因特網(wǎng)等數(shù)據(jù)連通的網(wǎng)絡(luò)。網(wǎng)站訪問(wèn)量推算部件500,是用于推定網(wǎng) 站訪問(wèn)數(shù)的模塊。網(wǎng)頁(yè)分析部件IOO、客戶終端裝置200、檢索部件300以及網(wǎng)站訪問(wèn)量推算 部件500,皆與通信網(wǎng)絡(luò)400相連接,相互之間可進(jìn)行通信。
這里用圖2說(shuō)明網(wǎng)頁(yè)分析部件100的結(jié)構(gòu)。如上所述,網(wǎng)頁(yè)分析部件100是對(duì)通信網(wǎng)絡(luò)400 中明示的網(wǎng)頁(yè)進(jìn)行分析的模塊,如圖2所示,具有通信部件IO、檢索關(guān)鍵詞生成部件20、網(wǎng) 頁(yè)關(guān)聯(lián)評(píng)估部件30以及網(wǎng)站評(píng)價(jià)部件40。
通信部件10進(jìn)行數(shù)據(jù)傳輸。檢索關(guān)鍵詞生成部件20基于用戶所選擇的關(guān)鍵詞,生成經(jīng)過(guò) 適當(dāng)變換處理、更精確的檢索關(guān)鍵詞。
網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30,是基于檢索關(guān)鍵詞生成部件20所生成的檢索關(guān)鍵詞,對(duì)在檢索部 件300中檢索出的多個(gè)網(wǎng)頁(yè)之間的相互關(guān)系進(jìn)行評(píng)價(jià)。網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置30如圖2所示,包 括獲取部分l、生成時(shí)間檢測(cè)部分2、相似度計(jì)算部分3、相似度修正部分4、關(guān)聯(lián)網(wǎng)頁(yè)定義 部分5、網(wǎng)絡(luò)關(guān)系圖生成部分6和輸出部分7。
獲取部分1獲取在檢索部件300中檢索出的多個(gè)網(wǎng)頁(yè)的綜合信息。由于檢索部件300中檢 索出的網(wǎng)頁(yè)即為網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30所評(píng)價(jià)的網(wǎng)頁(yè),因此以下將檢索部件300所檢索出的網(wǎng) 頁(yè)稱為"判斷對(duì)象網(wǎng)頁(yè)"。網(wǎng)頁(yè)生成時(shí)間檢測(cè)部分2基于獲取部分1所獲取的信息,檢出多 個(gè)判斷對(duì)象網(wǎng)頁(yè)其各自的生成時(shí)刻。
相似度計(jì)算部分3基于獲取部分1所取得的信息,對(duì)多個(gè)判斷對(duì)象網(wǎng)頁(yè),計(jì)算出各個(gè)網(wǎng)頁(yè)與其他的判斷對(duì)象網(wǎng)頁(yè)之間的相似度。具體來(lái)說(shuō),相似度計(jì)算部分3在計(jì)算2個(gè)判斷對(duì)象網(wǎng) 頁(yè)的相似度時(shí),對(duì)該2個(gè)判斷對(duì)象網(wǎng)頁(yè)各自的結(jié)構(gòu)信息的進(jìn)行語(yǔ)言分析,運(yùn)用T F_ I D F (Term Frequency—InverseDocument Frequen c y)以及向量空間模型,計(jì)算出該2個(gè)判斷對(duì)象網(wǎng)頁(yè)之間的相似度。另外,也可使用任意 在計(jì)算網(wǎng)頁(yè)相似度時(shí)常用的文本相似度計(jì)算法,如可以使用N-Gram法代替TF-IDF法。
相似度修正部分4用于修正相似度計(jì)算部分3中計(jì)算出來(lái)的相似度。以下將相似度修正部 分4中所得到的值稱為"修正相似度"。另外,由于相似度修正部分4運(yùn)用多個(gè)方法修正相 似度,對(duì)于各種方法將在說(shuō)明相似度修正部分4的工作時(shí)進(jìn)行說(shuō)明。
關(guān)聯(lián)網(wǎng)頁(yè)定義部分5用于檢測(cè)在相似度修正部分4中得到的多個(gè)修正相似度中各個(gè)達(dá)到判 斷2個(gè)網(wǎng)頁(yè)之間互相關(guān)聯(lián)所需閾值以上的修正相似度值。同時(shí),關(guān)聯(lián)網(wǎng)頁(yè)定義部分5對(duì)于檢 測(cè)出的各個(gè)修正相似度,將計(jì)算該修正相似度時(shí)所使用的2個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián) 的網(wǎng)頁(yè)。
網(wǎng)絡(luò)關(guān)系圖生成部分6,對(duì)于在關(guān)聯(lián)網(wǎng)頁(yè)定義部分5中所定義出的2個(gè)網(wǎng)頁(yè)的對(duì),將構(gòu)成該 對(duì)的2個(gè)網(wǎng)頁(yè)按照生成時(shí)刻檢測(cè)部分2中檢測(cè)出來(lái)的生成時(shí)刻的順序,進(jìn)行虛擬排序,并以 虛擬線條連接,生成關(guān)聯(lián)網(wǎng)頁(yè)的網(wǎng)絡(luò)關(guān)系圖。也就是說(shuō),網(wǎng)絡(luò)關(guān)系圖生成部分6將關(guān)聯(lián)網(wǎng)頁(yè) 按照生成時(shí)刻的順序進(jìn)行樹狀連接,生成網(wǎng)絡(luò)關(guān)系圖。
輸出部分7將網(wǎng)絡(luò)關(guān)系圖生成部分6中生成的網(wǎng)絡(luò)關(guān)系圖輸出至通信部件10。 網(wǎng)站評(píng)價(jià)部件40對(duì)通信網(wǎng)絡(luò)400中明示的網(wǎng)站進(jìn)行評(píng)價(jià)。
接下來(lái),對(duì)本實(shí)施方式中的網(wǎng)頁(yè)分析系統(tǒng)的工作進(jìn)行說(shuō)明。圖3為本實(shí)施方式中網(wǎng)頁(yè)分析 系統(tǒng)的工作概要說(shuō)明圖,具體分為用于精確搜索的檢索關(guān)鍵詞的生成動(dòng)作(F2)和網(wǎng)站評(píng)價(jià) 動(dòng)作(F3)。為此,下面將對(duì)本實(shí)施方式的網(wǎng)頁(yè)分析系統(tǒng)的工作就各相位進(jìn)行說(shuō)明。
生成檢索關(guān)鍵詞的工作。首先,對(duì)生成用于精確搜索的檢索關(guān)鍵詞的工作(Fl)進(jìn)行說(shuō)明。 用戶將檢索關(guān)鍵詞和對(duì)與該檢索關(guān)鍵詞相關(guān)的網(wǎng)頁(yè)的檢索命令(檢索命令)輸入客戶終端 裝置200??蛻艚K端裝置200接受所輸入的檢索關(guān)鍵詞和檢索命令,將其通過(guò)通信網(wǎng)絡(luò)400發(fā)送至檢索部件300.檢索部件300接收到發(fā)自客戶終端裝置200的檢索關(guān)鍵詞和檢索命令, 從通信網(wǎng)絡(luò)400上明示的網(wǎng)頁(yè)之中,檢索出與接收的關(guān)鍵詞相關(guān)聯(lián)的網(wǎng)頁(yè)。為了說(shuō)明方便, 假設(shè)檢索部件300已經(jīng)檢索出了多個(gè)網(wǎng)頁(yè)。檢索裝置300將檢索出的多個(gè)網(wǎng)頁(yè)的標(biāo)題通過(guò)通 信網(wǎng)絡(luò)400發(fā)送至客戶終端裝置200.
客戶終端裝置200接收到來(lái)自檢索部件300的多個(gè)網(wǎng)頁(yè)的標(biāo)題和正文內(nèi)容概要,將其按照 檢索裝置300中規(guī)定的順序在顯示裝置250中顯示。用戶閱讀顯示裝置250中顯示的各網(wǎng)頁(yè) 標(biāo)題,選擇任意網(wǎng)頁(yè),并在客戶終端裝置200中下達(dá)獲取所選網(wǎng)頁(yè)的命令。
客戶終端裝置200獲取用戶選擇的網(wǎng)頁(yè),并將其顯示在顯示裝置250上。如果用戶判斷顯 示裝置250中所顯示的網(wǎng)頁(yè)作為生成更精確的檢索關(guān)鍵詞的題材較為合適,便將該判斷結(jié)果 輸入客戶終端裝置200。
客戶終端裝置200將用于定義該種網(wǎng)頁(yè)的信息通過(guò)通信網(wǎng)絡(luò)400發(fā)送至網(wǎng)頁(yè)分析部件100. 定義網(wǎng)頁(yè)的信息,假設(shè)其為該網(wǎng)頁(yè)的URL (Uniform Resource Locator)。如上所述,用戶 選擇多個(gè)用于生成更精確關(guān)鍵詞的網(wǎng)頁(yè),客戶終端裝置200接收用戶選擇的多個(gè)網(wǎng)頁(yè)的定義 信息并發(fā)送至網(wǎng)頁(yè)分析部件100。同時(shí),客戶終端裝置200也將用戶輸入的檢索關(guān)鍵詞發(fā)送 至網(wǎng)頁(yè)分析部件100.
在網(wǎng)頁(yè)分析部件100中,通信部件10接收來(lái)自客戶終端裝置的、用于生成更精確檢索關(guān)鍵 詞的多個(gè)網(wǎng)頁(yè)的定義信息,以及用戶輸入的檢索關(guān)鍵詞。 圖4表示檢索關(guān)鍵詞生成部件20中所進(jìn)行的檢索關(guān)鍵詞生成工作的流程圖。
檢索關(guān)鍵詞生成部件20可獲取經(jīng)由通信裝置10接收的用于生成更精確檢索關(guān)鍵詞的多個(gè) 網(wǎng)頁(yè)定義信息,以及用戶輸入的檢索關(guān)鍵詞(Sl)。然后,檢索關(guān)鍵詞生成裝置20通過(guò)通信 網(wǎng)絡(luò)400,獲取用于生成更精確的檢索關(guān)鍵詞的多個(gè)網(wǎng)頁(yè)各自的結(jié)構(gòu)信息。
檢索關(guān)鍵詞生成部件20基于所獲取的信息,對(duì)多個(gè)網(wǎng)頁(yè)相關(guān)聯(lián)的關(guān)鍵詞進(jìn)行定義。具體來(lái) 說(shuō),檢索關(guān)鍵詞生成部件20根據(jù)所獲取的信息,對(duì)多個(gè)網(wǎng)頁(yè)的內(nèi)容進(jìn)行分析,從使用TF-IDF 方法得到的值較大一端開始,將所定數(shù)目的關(guān)鍵詞定義為與多個(gè)網(wǎng)頁(yè)向關(guān)聯(lián)的關(guān)鍵詞(S3)。另外,檢索關(guān)鍵詞生成部件20還將所定義的關(guān)鍵詞加入用戶輸入的檢索關(guān)鍵詞,生成進(jìn)行精 確搜索所需的新檢索關(guān)鍵詞(S4)。本方法僅是實(shí)現(xiàn)方法的一例,如以Key-Graph方法生成 檢索關(guān)鍵詞也可。
如此,通訊部件10通過(guò)通信網(wǎng)絡(luò)400,將檢索關(guān)鍵詞生成部件20生成的新檢索關(guān)鍵詞發(fā)送 至檢索部件300。檢索部件300從網(wǎng)頁(yè)分析部件100的通信部件10那里接收新檢索關(guān)鍵詞, 從通信網(wǎng)絡(luò)400中明示的網(wǎng)頁(yè)之中檢索關(guān)于新檢索關(guān)鍵詞的網(wǎng)頁(yè)。這里為了說(shuō)明方便,也假 設(shè)檢索部件300已經(jīng)檢索出多個(gè)網(wǎng)頁(yè)。檢索部件300通過(guò)通信網(wǎng)絡(luò)400,將檢索出的多個(gè)網(wǎng) 頁(yè)的各自的構(gòu)成信息發(fā)送至網(wǎng)頁(yè)分析部件100。
下面通過(guò)圖5,對(duì)多個(gè)網(wǎng)頁(yè)相互關(guān)系的評(píng)價(jià)工作(相F2)進(jìn)行說(shuō)明。圖5為表示網(wǎng)頁(yè)關(guān)系 評(píng)價(jià)部件30中進(jìn)行的網(wǎng)頁(yè)相互關(guān)系評(píng)價(jià)工作的各步驟的流程圖。
網(wǎng)頁(yè)分析部件100的通訊部件IO,接收在FI的最后步驟中檢索部件300檢索出的多個(gè)網(wǎng)頁(yè) (判斷對(duì)象網(wǎng)頁(yè))的構(gòu)成信息。在網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30中,獲取部分1獲取由通訊部件10 接收的多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自的構(gòu)成信息(S11)。生成時(shí)刻檢測(cè)部分2根據(jù)獲取部分1所獲 取的信息,檢測(cè)多個(gè)判斷對(duì)象網(wǎng)頁(yè)的各自的生成時(shí)刻(S12)。
相似度計(jì)算部分3根據(jù)獲取部分1所取得的信息,對(duì)多個(gè)判斷對(duì)象網(wǎng)頁(yè),計(jì)算出各個(gè)網(wǎng)頁(yè) 與其他判斷對(duì)象網(wǎng)頁(yè)各自之間的相似度(S13)。
相似度修正部分4對(duì)相似度計(jì)算部分3中計(jì)算出的相似度進(jìn)行修正(S14)?,F(xiàn)舉出多個(gè)判 斷對(duì)象網(wǎng)頁(yè)中的2個(gè)判斷對(duì)象網(wǎng)頁(yè),對(duì)相似度修正部分4的工作進(jìn)行具體說(shuō)明。為了說(shuō)明方 便,設(shè)2個(gè)判斷對(duì)象網(wǎng)頁(yè)分別為網(wǎng)頁(yè)X及網(wǎng)頁(yè)Y,網(wǎng)頁(yè)X先于網(wǎng)頁(yè)Y生成。另外,相似度計(jì) 算部3中計(jì)算出的網(wǎng)頁(yè)X與網(wǎng)頁(yè)Y的相似度設(shè)為"相似度S"。
此時(shí),相似度修正部分4根據(jù)獲取部分1所取得的信息,判斷網(wǎng)頁(yè)Y是否鏈接在網(wǎng)頁(yè)X上。 若判斷為網(wǎng)頁(yè)Y鏈接在網(wǎng)頁(yè)X上,則相似度修正部分4賦予相似度S以第一修正系數(shù)C1。若 判斷網(wǎng)頁(yè)Y沒(méi)有鏈接在網(wǎng)頁(yè)X上,則不賦予相似度S以第一修正系數(shù)Cl.
同時(shí),相似度修正部分4根據(jù)獲取部分1所取得的信息,對(duì)網(wǎng)頁(yè)X及網(wǎng)頁(yè)Y是否都鏈接在 其他網(wǎng)頁(yè)a上進(jìn)行判斷。若判斷2個(gè)網(wǎng)頁(yè)都鏈接在其他網(wǎng)頁(yè)a,則相似度修正部分4賦予相 似度S以第二修正系數(shù)C2。若判斷2個(gè)網(wǎng)頁(yè)中至少有l(wèi)個(gè)沒(méi)有鏈接在其他網(wǎng)頁(yè)a,則相似度 修正部分4不賦予相似度S以第二修正系數(shù)C2。
另外,相似度修正部分4根據(jù)生成時(shí)刻檢測(cè)部分2中檢測(cè)出的生成時(shí)刻,對(duì)網(wǎng)頁(yè)X與網(wǎng)頁(yè)Y 的生成時(shí)刻的差進(jìn)行判斷,并賦予相似度S以與其差值相對(duì)應(yīng)的第三修正系數(shù)C3。例如,相 似度修正部分4根據(jù)如下所示算式(1),對(duì)相似度S賦以特定的第三修正系數(shù)C3。<formula>formula see original document page 10</formula>其中,a為根據(jù)實(shí)驗(yàn)確定的常數(shù)(其取值范圍在O與l之間),sp為網(wǎng)頁(yè)X的生成時(shí)刻與網(wǎng) 頁(yè)Y的生成時(shí)刻之差,tp為所有判斷對(duì)象網(wǎng)頁(yè)中,最初生成的網(wǎng)頁(yè)與最后生成網(wǎng)頁(yè)之間的生 成時(shí)刻之差。
另外,相似度修正部分4根據(jù)生成時(shí)刻檢測(cè)部2中檢測(cè)出的生成時(shí)刻,測(cè)出在網(wǎng)頁(yè)X的生 成時(shí)刻與網(wǎng)頁(yè)Y的生成時(shí)刻之間所生成的其他判斷對(duì)象網(wǎng)頁(yè)的數(shù)目。相似度修正部分4根據(jù) 如下所示算式(2),對(duì)相似度S給以特定的第四修正系數(shù)C4。
C4 = exp(—pX(sn/tn) (2)
其中,e為根據(jù)試驗(yàn)確定的常數(shù)(其取值范圍在O與l之間),sn為所有判斷對(duì)象網(wǎng)頁(yè)中, 在網(wǎng)頁(yè)X的生成時(shí)刻與網(wǎng)頁(yè)Y的生成時(shí)刻之間所生成的網(wǎng)頁(yè)數(shù)目,tn為所有判斷對(duì)象網(wǎng)頁(yè)的 數(shù)目。
另外,相似度修正部分4對(duì)相似度計(jì)算部分3中算出的相似度S,給以與網(wǎng)頁(yè)X的單位時(shí)間 段訪問(wèn)數(shù)相對(duì)應(yīng)的第五修正系數(shù)C5。此時(shí),相似度修正部分4首先令獲取部分1取得包括網(wǎng) 頁(yè)X及網(wǎng)頁(yè)Y在內(nèi)的所有判斷對(duì)象網(wǎng)頁(yè)各自的單位時(shí)間段的訪問(wèn)數(shù)。然后,相似度修正部分 4根據(jù)如下所示算式(3),對(duì)相似度S給以特定的第五修正系數(shù)C5。
C 5 = e x p (— Y X ( n / N)…(3 ) Y為根據(jù)實(shí)驗(yàn)確定的常數(shù)(其取值范圍在0與1之間),n為網(wǎng)頁(yè)X的單位時(shí)間段訪問(wèn)數(shù),N 為包含網(wǎng)頁(yè)X及網(wǎng)頁(yè)Y在內(nèi)的多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自的單位時(shí)間段訪問(wèn)數(shù)的最大值。
另外,相似度修正部分4計(jì)算上述所有修正系數(shù)(第一修正系數(shù)C1一第五修正系數(shù)C5)之 和,并將求得的合計(jì)修正系數(shù)乘以相似度S,以此對(duì)相似度S進(jìn)行修正。
到此,對(duì)相似度修正部分4核對(duì)相似度計(jì)算部分3中算出的網(wǎng)頁(yè)X與網(wǎng)頁(yè)Y的相似度S進(jìn) 行修正的過(guò)程進(jìn)行了說(shuō)明。相似度修正部分4對(duì)相似度計(jì)算部3中算出的所有相似度執(zhí)行同
10樣動(dòng)作,以此修正相似度計(jì)算部分3中算出的所有相似度,并對(duì)所有的相似度計(jì)算出其修正 相似度。
關(guān)聯(lián)網(wǎng)頁(yè)定義部分5對(duì)相似度修正部分4中得出的多個(gè)修正相似度,檢測(cè)出其中達(dá)到判斷 兩個(gè)網(wǎng)頁(yè)相互關(guān)聯(lián)的閾值以上的修正相似度。然后,關(guān)聯(lián)網(wǎng)頁(yè)定義部分5對(duì)于檢出的各個(gè)修 正相似度,將計(jì)算該修正相似度時(shí)所使用的2個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)網(wǎng)頁(yè)(S15)。
網(wǎng)絡(luò)關(guān)系圖生成部分6,對(duì)于各個(gè)在關(guān)聯(lián)網(wǎng)頁(yè)定義部分5中所定義出的2個(gè)網(wǎng)頁(yè)的對(duì),將構(gòu) 成該對(duì)的2個(gè)網(wǎng)頁(yè)按照生成時(shí)刻檢測(cè)部2中檢測(cè)出來(lái)的生成時(shí)刻的順序,進(jìn)行虛擬排序,并 以虛擬線條連接,生成關(guān)聯(lián)網(wǎng)頁(yè)的網(wǎng)絡(luò)關(guān)系圖(S16)。
在此,通過(guò)圖6 (A)及圖6 (B)對(duì)關(guān)聯(lián)網(wǎng)頁(yè)定義部分5及網(wǎng)絡(luò)關(guān)系圖生成部分6的工作通 過(guò)具體例子進(jìn)行說(shuō)明。圖6 (A)為表示按照生成時(shí)刻順序排列的4個(gè)判斷對(duì)象網(wǎng)頁(yè)、與各判 斷對(duì)象的網(wǎng)頁(yè)之間的相似度的關(guān)系圖,圖6 (B)為圖6 (A)中4個(gè)判斷對(duì)象網(wǎng)頁(yè)的相關(guān)網(wǎng) 頁(yè)之間以線連結(jié)生成的網(wǎng)絡(luò)關(guān)系圖。圖6 (A)及圖6 (B)中的橫軸t為時(shí)間軸。
為了說(shuō)明方便,設(shè)圖6 (A)及圖6 (B)中顯示的4個(gè)判斷對(duì)象網(wǎng)頁(yè)為網(wǎng)頁(yè)A、網(wǎng)頁(yè)B、網(wǎng) 頁(yè)C及網(wǎng)頁(yè)D。圖6 (A)及圖6 (B)中的圓圈為網(wǎng)頁(yè)。另外,假設(shè)圖6 (A)及圖6 (B)中 的4個(gè)網(wǎng)頁(yè)之中,網(wǎng)頁(yè)A最先生成,其次為網(wǎng)頁(yè)B,再次為網(wǎng)頁(yè)C,最后生成網(wǎng)頁(yè)D。
另外,如圖6 (A)所示,假設(shè)網(wǎng)頁(yè)A與網(wǎng)頁(yè)B的修正相似度為0.8,網(wǎng)頁(yè)A與網(wǎng)頁(yè)C的修 正相似度為0. 8,網(wǎng)頁(yè)A與網(wǎng)頁(yè)D的修正相似度為0. 3,網(wǎng)頁(yè)B與網(wǎng)頁(yè)C的修正相似度為0. 2, 網(wǎng)頁(yè)B與網(wǎng)頁(yè)D的修正相似度為0. 3,網(wǎng)頁(yè)C與網(wǎng)頁(yè)D的修正相似度為0. 6。并且設(shè)2個(gè)網(wǎng)頁(yè) 相互關(guān)聯(lián)的判斷閾值為0.5。
此時(shí),關(guān)聯(lián)網(wǎng)頁(yè)定義部5將網(wǎng)頁(yè)A與網(wǎng)頁(yè)B、網(wǎng)頁(yè)A與網(wǎng)頁(yè)C,網(wǎng)頁(yè)C與網(wǎng)頁(yè)D各自定義為 相互關(guān)聯(lián)的網(wǎng)頁(yè)。網(wǎng)絡(luò)關(guān)系圖生成部分6在網(wǎng)頁(yè)A與網(wǎng)頁(yè)B、網(wǎng)頁(yè)A與網(wǎng)頁(yè)C、網(wǎng)頁(yè)C與網(wǎng)頁(yè) D各自之間畫線,形成如圖6 (B)所示的網(wǎng)絡(luò)關(guān)系圖。
輸出部分7將網(wǎng)絡(luò)關(guān)系圖生成部分6中生成的網(wǎng)頁(yè)網(wǎng)絡(luò)關(guān)系圖輸出至通訊部件10。 通訊部件10通過(guò)通信網(wǎng)絡(luò)400,將來(lái)自網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30的網(wǎng)頁(yè)網(wǎng)絡(luò)關(guān)系圖輸出至客戶終端裝置200。客戶終端裝置200接收網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30中得到的網(wǎng)頁(yè)網(wǎng)絡(luò)關(guān)系圖,顯示 在顯示裝置250中。
由此,用戶可對(duì)于與自己決定的檢索關(guān)鍵詞、以及與該檢索關(guān)鍵詞相關(guān)網(wǎng)頁(yè)中自己選擇的 網(wǎng)頁(yè)相關(guān)聯(lián)的網(wǎng)頁(yè),了解其按照生成時(shí)刻的順序相關(guān)聯(lián)的網(wǎng)絡(luò)關(guān)系。也就是說(shuō),用戶可以知 道與自己所定的檢索關(guān)鍵詞相關(guān)聯(lián)的多個(gè)網(wǎng)頁(yè)之間的相互關(guān)聯(lián)性。
另外,上述說(shuō)明中,相似度修正部分4計(jì)算第一修正系數(shù)C1--第五修正系數(shù)C5的所有修正 系數(shù)之和,并將求得的合計(jì)修正系數(shù)乘以相似度S,以此對(duì)相似度S進(jìn)行修正。然而,相似 度修正部分4也可以將第一修正系數(shù)C1—第五修正系數(shù)C5的部分修正系數(shù)相加得出合計(jì)修 正系數(shù),將其乘以相似度S,對(duì)相似度S進(jìn)行修正。另外,相似度修正部分4也可以將第一 修正系數(shù)C1一第五修正系數(shù)C5中的某一個(gè)修正系數(shù)乘以相似度S,對(duì)相似度S進(jìn)行修正。
同時(shí),上述說(shuō)明中,關(guān)聯(lián)網(wǎng)頁(yè)定義部分5對(duì)相似度修正部分4中得出的多個(gè)修正相似度, 檢測(cè)出其中達(dá)到判斷2個(gè)網(wǎng)頁(yè)相互關(guān)聯(lián)的閾值以上的修正相似度。然而,關(guān)聯(lián)網(wǎng)頁(yè)定義部分 5也可以檢測(cè)相似度計(jì)算部3中得到的(修正前的)多個(gè)相似度中上述閾值以上的相似度。 此時(shí),關(guān)聯(lián)網(wǎng)頁(yè)定義部分5對(duì)于檢出的各相似度,將計(jì)算該相似度時(shí)使用的2個(gè)判斷對(duì)象網(wǎng) 頁(yè)定義為相互關(guān)聯(lián)的網(wǎng)頁(yè)。
下面通過(guò)圖7對(duì)網(wǎng)站評(píng)價(jià)工作(F3)進(jìn)行說(shuō)明。圖7為表示網(wǎng)站評(píng)價(jià)部件40所進(jìn)行的網(wǎng)站 評(píng)價(jià)工作的各步驟的流程圖。
網(wǎng)站評(píng)價(jià)部件40將經(jīng)通訊部件10接收的所有判斷對(duì)象網(wǎng)頁(yè)按域名(Domain)進(jìn)行分類, 并由此定義出各網(wǎng)站(S21)。網(wǎng)站為判斷對(duì)象網(wǎng)頁(yè)中擁有共通域名的網(wǎng)頁(yè)的集合,通過(guò)圖8 對(duì)網(wǎng)站進(jìn)行說(shuō)明。網(wǎng)頁(yè)H、網(wǎng)頁(yè)J、網(wǎng)頁(yè)K及網(wǎng)頁(yè)M是擁有同樣域名的網(wǎng)頁(yè),這些網(wǎng)頁(yè)的集合 即為網(wǎng)站。
因此,在圖8中,網(wǎng)頁(yè)H、網(wǎng)頁(yè)J、網(wǎng)頁(yè)K及網(wǎng)頁(yè)M,是網(wǎng)站G的下級(jí)網(wǎng)頁(yè)。而網(wǎng)頁(yè)H、網(wǎng) 頁(yè)J、網(wǎng)頁(yè)K及網(wǎng)頁(yè)M的排序(Rank)分別為h、 j、 k及m。排序是由檢索部件300所決定的 值。例如,若使用一般的搜索引擎作為檢索部件,則排序?yàn)闄z索結(jié)果的顯示順序。然后,網(wǎng)站評(píng)價(jià)部件40通過(guò)通訊部件10,使用網(wǎng)站訪問(wèn)量推定裝置500,獲取對(duì)各個(gè)站點(diǎn) 的訪問(wèn)量(圖7的S22)。在圖8的例子中為獲取網(wǎng)站G的訪問(wèn)量g。
然后,網(wǎng)站評(píng)價(jià)裝置40通過(guò)通訊部件10,對(duì)每一個(gè)網(wǎng)站獲取與該網(wǎng)站有相同域名的網(wǎng)頁(yè)的 排序(圖7的S22)。在圖8的例子中,網(wǎng)站評(píng)價(jià)部件40獲取了網(wǎng)頁(yè)H、網(wǎng)頁(yè)J、網(wǎng)頁(yè)K及 網(wǎng)頁(yè)M各自的排序。
隨后,網(wǎng)頁(yè)評(píng)價(jià)部件40對(duì)每一個(gè)網(wǎng)站,運(yùn)用該網(wǎng)站的訪問(wèn)量和屬于該網(wǎng)站的網(wǎng)頁(yè)排序,通 過(guò)任意方法,計(jì)算出該網(wǎng)站的重要度。
最后,網(wǎng)站評(píng)價(jià)部件40按照重要度由大到小的順序,給所有網(wǎng)站以名次(圖7的S25)。
通訊部件10通過(guò)通信網(wǎng)絡(luò)400,將網(wǎng)站評(píng)價(jià)部件40中得出的各網(wǎng)站標(biāo)題按照其名次,與其 重要度一起發(fā)送給客戶終端裝置200??蛻艚K端裝置200接收由網(wǎng)站評(píng)價(jià)部件得出的各網(wǎng)站 的標(biāo)題、名次及重要度,將各網(wǎng)站的標(biāo)題按照名次顯示在顯示裝置250上。此時(shí),客戶終端 裝置200將各網(wǎng)站的重要度與標(biāo)題配對(duì),在顯示裝置250上顯示。
如上所述,本實(shí)施方式中,網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30將多個(gè)判斷對(duì)象網(wǎng)頁(yè)按照生成時(shí)刻的順序 進(jìn)行虛擬排序,并將其中有關(guān)聯(lián)的網(wǎng)頁(yè)用虛擬線條連接,由此生成樹狀的網(wǎng)頁(yè)網(wǎng)絡(luò)關(guān)系圖。 在生成的網(wǎng)絡(luò)關(guān)系中,時(shí)間排序靠前的網(wǎng)站意味著對(duì)信息敏感,時(shí)間排序靠后的關(guān)聯(lián)網(wǎng)站較 多的網(wǎng)站則意味著將信息傳播至其他網(wǎng)站的能力強(qiáng)。同時(shí),網(wǎng)站評(píng)價(jià)部件40計(jì)算每個(gè)網(wǎng)站的 重要度。在根據(jù)重要度進(jìn)行排序的網(wǎng)站一覽上排名靠前的網(wǎng)站,在訪問(wèn)量和檢索裝置排序等 觀點(diǎn)上來(lái)說(shuō),意味著對(duì)信息傳播具有較高影響力。
對(duì)于本發(fā)明裝置,比如,如果輸入與對(duì)企業(yè)的毫無(wú)根據(jù)的中傷信息之傳播案例相關(guān)聯(lián)的關(guān) 鍵詞得出上述分析結(jié)果,可以由此找出該案例中在信息傳播上發(fā)揮較大作用的網(wǎng)站。也可以 通過(guò)要求該網(wǎng)站自我約束,引發(fā)對(duì)防止再犯措施的探討。再比如,如果制造商想對(duì)公布本公 司產(chǎn)品發(fā)售信息的廣告效果進(jìn)行分析,可以將多個(gè)該公司產(chǎn)品名稱輸入本發(fā)明裝置,得到上 述分析結(jié)果。在得到的分析結(jié)果中,對(duì)那些結(jié)果傾向于在多個(gè)本公司產(chǎn)品分析案例中擁有較 高信息傳播能力的網(wǎng)站,可以認(rèn)為其在今后的公司產(chǎn)品發(fā)售消息的公布上也擁有較大的信息 傳播功用??梢酝ㄟ^(guò)對(duì)該網(wǎng)站施加影響來(lái)取得更好的廣告效果。另外,構(gòu)成網(wǎng)頁(yè)分析部件100的各功能模塊,是通過(guò)計(jì)算機(jī)的CPU、內(nèi)存等硬件與計(jì)算機(jī)程 序共同運(yùn)轉(zhuǎn)才能實(shí)現(xiàn)。不過(guò),上述各種功能也可以通過(guò)任意方式如專用線路等得到實(shí)現(xiàn)。
同時(shí),網(wǎng)頁(yè)關(guān)系評(píng)價(jià)部件30可以擁有與生成時(shí)刻檢測(cè)部分2、相似度計(jì)算部分3、相似度 修正部分4、關(guān)聯(lián)網(wǎng)頁(yè)定義部分5以及網(wǎng)絡(luò)關(guān)系圖生成部分6各自相對(duì)應(yīng)的專用內(nèi)存,也可 以讓這些部件使用共同的內(nèi)存。這些部件也可將用來(lái)處理的數(shù)據(jù)及處理結(jié)果存入專用或共同 內(nèi)存中。
權(quán)利要求
1.一種互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)聯(lián)關(guān)系評(píng)價(jià)裝置,其特征在于,具有可獲取多個(gè)判斷對(duì)象網(wǎng)頁(yè)中各自構(gòu)成信息的獲取部分;基于所述獲取部分所取得的信息,檢測(cè)多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自生成時(shí)刻的生成時(shí)刻檢測(cè)部分;基于所述獲取部分所取得的信息,對(duì)多個(gè)判斷對(duì)象網(wǎng)頁(yè),計(jì)算各網(wǎng)頁(yè)與其他判斷對(duì)象網(wǎng)頁(yè)各自之間相似度的相似度計(jì)算部分;在根據(jù)所述相似度計(jì)算部分所得出的多個(gè)相似度之中,對(duì)于達(dá)到判斷兩個(gè)網(wǎng)頁(yè)間互相關(guān)聯(lián)所需閾值以上的相似度值,將計(jì)算該相似度值所使用的這兩個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)網(wǎng)頁(yè)的關(guān)聯(lián)網(wǎng)頁(yè)定義部分。
2. 根據(jù)權(quán)利要求項(xiàng)l所記載的互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置,其特征在于,具有 各個(gè)在所述關(guān)聯(lián)網(wǎng)頁(yè)定義部中所定義出的兩個(gè)網(wǎng)頁(yè)的對(duì),將構(gòu)成該對(duì)的兩個(gè)網(wǎng)頁(yè),按照所述生成時(shí)刻檢測(cè)部分中檢測(cè)出來(lái)的生成時(shí)刻的順序進(jìn)行虛擬排序,并以虛擬線條連接,生成 關(guān)聯(lián)網(wǎng)頁(yè)的網(wǎng)絡(luò)關(guān)系圖。
3. 根據(jù)權(quán)利要求項(xiàng)l記載的互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置,其特征在于具有根據(jù)所述獲取部分取得的信息,對(duì)于所述相似度計(jì)算部中得出的各相似度,當(dāng)計(jì)算該 相似度時(shí)使用的2個(gè)判斷對(duì)象網(wǎng)頁(yè)中的某一方鏈接至另一方時(shí),將該相似度乘以修正系數(shù)從 而算出修正相似度;而且所述關(guān)聯(lián)網(wǎng)頁(yè)定義部分對(duì)于基于所述相似度修正部得出的多個(gè)修正 相似度中高于前述閾值的各個(gè)修正相似度,將算出該修正相似度時(shí)使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè) 定義為相互關(guān)聯(lián)的網(wǎng)頁(yè)。
4. 根據(jù)權(quán)利要求項(xiàng)l記載的互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置,其特征在于-具有根據(jù)所述獲取部分取得的信息,對(duì)于所述相似度計(jì)算部中得出的各相似度,當(dāng)計(jì)算該 相似度時(shí)使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)同時(shí)鏈接至其他網(wǎng)頁(yè)時(shí),將該相似度乘以修正系數(shù)從而算 出修正相似度的相似度修正部分;而且所述關(guān)聯(lián)網(wǎng)頁(yè)定義部分對(duì)于所述相似度修正部分得出 的多個(gè)修正相似度中高于前述閾值的各個(gè)修正相似度,將算出該修正相似度時(shí)使用的兩個(gè)判 斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)的網(wǎng)頁(yè)。
5. 根據(jù)權(quán)利要求項(xiàng)l記載的互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置,其特征在于-具有根據(jù)所述生成時(shí)刻檢測(cè)部分檢測(cè)出的生成時(shí)刻,對(duì)于所述相似度計(jì)算部分中得出的各 相似度,將與計(jì)算該相似度時(shí)使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)之間的生成時(shí)刻差相對(duì)應(yīng)的修正系數(shù) 乘以該相似度,從而計(jì)算出修正相似度;而且所述關(guān)聯(lián)網(wǎng)頁(yè)定義部分對(duì)于所述相似度修正部 分得出的多個(gè)修正相似度中高于前述閾值的各個(gè)修正相似度,將算出該修正相似度時(shí)使用的 兩個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)的網(wǎng)頁(yè)。
6. 根據(jù)權(quán)利要求項(xiàng)l記載的互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置,其特征在于具有根據(jù)所述生成時(shí)刻檢測(cè)部分檢測(cè)出的生成時(shí)刻,對(duì)于所述相似度計(jì)算部分中得出的各 相似度,將與計(jì)算該相似度時(shí)使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)的生成時(shí)刻之間生成的其他判斷對(duì)象 網(wǎng)頁(yè)數(shù)目相對(duì)應(yīng)的修正系數(shù)乘以該相似度,從而計(jì)算出修正相似度;而且所述關(guān)聯(lián)網(wǎng)頁(yè)定義 部分對(duì)于所述相似度修正部分得出的多個(gè)修正相似度中高于前述閼值的各個(gè)修正相似度,將 算出該修正相似度時(shí)使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)的網(wǎng)頁(yè)。
7. 根據(jù)權(quán)利要求項(xiàng)l記載的互聯(lián)網(wǎng)網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置,其特征在于 具有對(duì)所述相似度計(jì)算部分得出的各相似度進(jìn)行修正的相似度修正部分; 所述獲取部分獲取多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自單位時(shí)間段內(nèi)的訪問(wèn)量;所述相似度修正部分根據(jù)所述獲取部分所取得的多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自的單位時(shí)間段訪問(wèn) 量,對(duì)于所述相似度計(jì)算部分所得出的各相似度,將該相似度乘以與計(jì)算該相似度時(shí)所使用 的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)中先生成的網(wǎng)頁(yè)的單位時(shí)間段訪問(wèn)量相對(duì)應(yīng)的修正系數(shù),從而計(jì)算出修 正相似度;所述關(guān)聯(lián)網(wǎng)頁(yè)定義部分對(duì)于所述相似度修正部分得出的多個(gè)修正相似度中高于前述閾值的 各個(gè)修正相似度,將算出該修正相似度時(shí)使用的2個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)的網(wǎng)頁(yè)。
8. 根據(jù)權(quán)利要求項(xiàng)1所述的檢測(cè)互聯(lián)網(wǎng)信息傳播的網(wǎng)頁(yè)關(guān)聯(lián)評(píng)價(jià)裝置,作為一種在計(jì)算機(jī) 中實(shí)現(xiàn)的程序,其特征在于,具有獲取多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自的構(gòu)成信息的功能, 根據(jù)獲取的信息,檢測(cè)出多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自生成時(shí)刻的功能,根據(jù)獲取的信息,對(duì)于多個(gè)判斷對(duì)象網(wǎng)頁(yè),計(jì)算各網(wǎng)頁(yè)與其他判斷對(duì)象網(wǎng)頁(yè)各自之間的相 似度的功能,對(duì)于計(jì)算出的多個(gè)相似度中各個(gè)達(dá)到判斷兩個(gè)網(wǎng)頁(yè)之間互相關(guān)聯(lián)所需閾值以上的相似度值, 將計(jì)算該相似度值時(shí)所使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)網(wǎng)頁(yè)的功能。
全文摘要
檢測(cè)互聯(lián)網(wǎng)信息傳播的網(wǎng)頁(yè)關(guān)聯(lián)評(píng)價(jià)裝置,屬于互聯(lián)網(wǎng)信息傳播技術(shù)領(lǐng)域,其特征在于,所述網(wǎng)頁(yè)關(guān)系評(píng)價(jià)裝置30具有檢測(cè)多個(gè)判斷對(duì)象網(wǎng)頁(yè)各自的生成時(shí)刻的生成時(shí)刻檢測(cè)部分2,計(jì)算判斷對(duì)象網(wǎng)頁(yè)與其他判斷對(duì)象網(wǎng)頁(yè)之間相似度的相似度計(jì)算部分3,對(duì)于計(jì)算出的多個(gè)相似度中達(dá)到閾值以上的相似度、將計(jì)算該相似度時(shí)使用的兩個(gè)判斷對(duì)象網(wǎng)頁(yè)定義為相互關(guān)聯(lián)網(wǎng)頁(yè)的關(guān)聯(lián)網(wǎng)頁(yè)定義部分5。本發(fā)明解決了互聯(lián)網(wǎng)網(wǎng)頁(yè)之間的相互關(guān)聯(lián)關(guān)系精確定位技術(shù)問(wèn)題。
文檔編號(hào)G06Q10/00GK101639856SQ20091009235
公開日2010年2月3日 申請(qǐng)日期2009年9月11日 優(yōu)先權(quán)日2009年9月11日
發(fā)明者古川和年, 李春平, 犬塚裕介, 王益斌, 阿部昌平, 明 顧, 松 高 申請(qǐng)人:清華大學(xué);株式會(huì)社野村綜合研究所
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
平安县| 乐业县| 阜南县| 钟祥市| 宝坻区| 昌宁县| 聂拉木县| 河曲县| 周口市| 孟津县| 新源县| 呼伦贝尔市| 杭州市| 濮阳县| 泸水县| 卫辉市| 仙居县| 禄丰县| 修文县| 米脂县| 呈贡县| 府谷县| 广德县| 本溪| 临潭县| 那坡县| 浮梁县| 双流县| 南开区| 江口县| 大田县| 宁都县| 隆化县| 夹江县| 承德市| 托克逊县| 沧源| 故城县| 安义县| 清苑县| 浦东新区|