两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

統(tǒng)一資源定位符url間相似度計(jì)算的方法及裝置制造方法

文檔序號(hào):6631236閱讀:657來(lái)源:國(guó)知局
統(tǒng)一資源定位符url間相似度計(jì)算的方法及裝置制造方法
【專利摘要】本公開(kāi)是關(guān)于統(tǒng)一資源定位符URL間相似度計(jì)算的方法及裝置,用于提高URL間相似度計(jì)算的準(zhǔn)確性。所述方法包括:對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。本公開(kāi)能夠利用多個(gè)維度計(jì)算URL間相似度,提高了URL間相似度的準(zhǔn)確性。
【專利說(shuō)明】統(tǒng)一資源定位符URL間相似度計(jì)算的方法及裝置

【技術(shù)領(lǐng)域】
[0001]本公開(kāi)涉及計(jì)算機(jī)網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,尤其涉及統(tǒng)一資源定位符URL間相似度計(jì)算的方法及裝置。

【背景技術(shù)】
[0002]相關(guān)技術(shù)中,計(jì)算統(tǒng)一資源定位符URL間相似度的方法為:將URL當(dāng)成字符串,按字符串間相似度的計(jì)算方法計(jì)算URL間相似度。例如,按編輯距離算法或最長(zhǎng)公共子串算法計(jì)算兩個(gè)字符串間相似度,以該計(jì)算所得相似度作為URL間相似度。其中,編輯距離算法是根據(jù)兩個(gè)字符串之間,由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù),計(jì)算字符串間相似度;最長(zhǎng)公共子串算法是根據(jù)兩個(gè)字符串間最長(zhǎng)的相同子串,計(jì)算字符串間相似度。相關(guān)技術(shù)中計(jì)算URL間相似度的方法的缺陷在于:所計(jì)算的相似度不夠準(zhǔn)確。例如,URLl為畫(huà).miu1.com/music/123, html, URL 2 為 www.miu1.com/music/456, html, URL 3 為 www.miu1.com/music/abc.html,按相關(guān)技術(shù),該3個(gè)URL相互間的相似度相同,但是,事實(shí)上,URLl和URL2間的相似度大于,URL 3與URLl間的相似度。


【發(fā)明內(nèi)容】

[0003]為克服相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)實(shí)施例提供統(tǒng)一資源定位符URL間相似度計(jì)算的方法,用于提高URL間相似度計(jì)算的準(zhǔn)確性。
[0004]根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種統(tǒng)一資源定位符URL間相似度計(jì)算的方法,其特征在于,包括:
[0005]對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;
[0006]根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
[0007]在一實(shí)施例中,方法還可包括:
[0008]判斷所述URL間相似度是否大于預(yù)設(shè)閾值;
[0009]當(dāng)所述URL間相似度大于預(yù)設(shè)閾值時(shí),判定所述URL相似。
[0010]在一實(shí)施例中,所述根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量,可包括:
[0011]判斷URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值是否相同;
[0012]當(dāng)URL中所述特征參量值相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值;
[0013]當(dāng)URL中所述特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值;
[0014]所述第一預(yù)設(shè)值大于所述第二預(yù)設(shè)值。
[0015]在一實(shí)施例中,當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),所述根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量,可包括:
[0016]利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;或者
[0017]根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量。
[0018]在一實(shí)施例中,所述預(yù)設(shè)特征參量包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、二級(jí)目錄參量和/或尾部頁(yè)面參量。
[0019]根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種統(tǒng)一資源定位符URL間相似度計(jì)算的裝置,包括:
[0020]計(jì)算模塊,用于對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;
[0021]加權(quán)求和模塊,用于根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
[0022]在一實(shí)施例中,所述裝置還可包括:
[0023]判斷模塊,用于判斷所述URL間相似度是否大于預(yù)設(shè)閾值;
[0024]判定模塊,用于當(dāng)所述URL間相似度大于預(yù)設(shè)閾值時(shí),判定所述URL相似。
[0025]在一實(shí)施例中,所述計(jì)算模塊,可包括:
[0026]判斷子模塊,用于判斷URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值是否相同;
[0027]第一確定子模塊,用于當(dāng)URL中所述特征參量值相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值;
[0028]第二確定子模塊,用于當(dāng)URL中所述特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值;
[0029]所述第一預(yù)設(shè)值大于所述第二預(yù)設(shè)值。
[0030]在一實(shí)施例中,所述計(jì)算模塊,可包括
[0031]第一計(jì)算子模塊,用于當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;或者
[0032]第二計(jì)算子模塊,用于當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量。
[0033]在一實(shí)施例中,所述預(yù)設(shè)特征參量可包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、二級(jí)目錄參量和/或尾部頁(yè)面參量。
[0034]根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種統(tǒng)一資源定位符URL間相似度計(jì)算的裝置,包括:
[0035]處理器;
[0036]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0037]其中,所述處理器被配置為:
[0038]對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;
[0039]根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
[0040]本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:根據(jù)URL的多個(gè)預(yù)設(shè)特征參量,計(jì)算URL間相似度,能夠利用多個(gè)維度計(jì)算URL間相似度,提高了 URL間相似度的準(zhǔn)確性。
[0041]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。

【專利附圖】

【附圖說(shuō)明】
[0042]此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本公開(kāi)的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本公開(kāi)的原理。
[0043]圖1是根據(jù)一示例性實(shí)施例示出的URL間相似度計(jì)算的方法的流程圖。
[0044]圖2是根據(jù)一示例性實(shí)施例示出的URL間相似度計(jì)算的方法的流程圖。
[0045]圖3是根據(jù)一示例性實(shí)施例一示出的URL間相似度計(jì)算的方法的流程圖。
[0046]圖4是根據(jù)一示例性實(shí)施例示出的一種URL間相似度計(jì)算的裝置的框圖。
[0047]圖5是根據(jù)一示例性實(shí)施例示出的另一種URL間相似度計(jì)算的裝置的框圖。
[0048]圖6是根據(jù)一示例性實(shí)施例示出的另一種URL間相似度計(jì)算的裝置的框圖。
[0049]圖7是根據(jù)一示例性實(shí)施例示出的一種適用于URL間相似度計(jì)算的裝置的框圖(終端設(shè)備的一般結(jié)構(gòu))。

【具體實(shí)施方式】
[0050]這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開(kāi)相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書(shū)中所詳述的、本公開(kāi)的一些方面相一致的裝置和方法的例子。
[0051]圖1是根據(jù)一示例性實(shí)施例示出的一種URL間相似度計(jì)算的方法的流程圖;如圖1所示,該URL間相似度計(jì)算的方法用于多種設(shè)備如手機(jī)、個(gè)人電腦、服務(wù)器、路由器中,包括以下步驟S101-S102:
[0052]在步驟SlOl中、對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量。
[0053]舉例而言,預(yù)設(shè)特征參量可包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、二級(jí)目錄參量、以及尾部頁(yè)面參量。
[0054]在一實(shí)施例中,上述步驟SlOl可包括如下步驟A1-A3:
[0055]在步驟Al中、判斷URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的特征參量值是否相同。
[0056]在步驟A2中、當(dāng)URL中特征參量值相同時(shí),確定URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值。
[0057]在步驟A3中、當(dāng)URL中特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值。
[0058]其中,第一預(yù)設(shè)值大于第二預(yù)設(shè)值。
[0059]上述的預(yù)設(shè)特征參量可以是字符串類型,也可以是整數(shù)類型。
[0060]舉例而言,預(yù)設(shè)特征參量包括尾部頁(yè)面參量和目錄深度參量,尾部頁(yè)面參量為字符串類型,目錄深度參量為整數(shù)類型。針對(duì)尾部頁(yè)面參量,判斷URL中對(duì)應(yīng)于尾部頁(yè)面參量的字符串是否相同,如果相同,則URL間對(duì)應(yīng)于尾部頁(yè)面參量的相似度分量為I,如果不相同,則URL間對(duì)應(yīng)于尾部頁(yè)面參量的相似度分量為O。針對(duì)目錄深度參量,判斷URL中對(duì)應(yīng)于目錄深度參量的數(shù)值是否相同,如果相同,則URL間對(duì)應(yīng)于目錄深度參量的相似度分量為1,如果不相同,則URL間對(duì)應(yīng)于目錄深度參量的相似度分量為O。例如,
[0061]URLl 為 www.miu1.com/music/artist/1234, html,
[0062]URL2 為 www.miu1.com/photo/picture/abed, html
[0063]針對(duì)尾部頁(yè)面參量,URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串分別為“ 1234.html”和“abed, html”,兩者不相同,URLl和URL2間對(duì)應(yīng)于尾部頁(yè)面參量的相似度分量為O ;URL1和URL2中對(duì)應(yīng)于目錄深度參量的數(shù)值都為3,兩者相同,URLl和URL2間對(duì)應(yīng)于目錄深度參量的相似度分量為I。
[0064]在一實(shí)施例中,當(dāng)預(yù)設(shè)特征參量的類型為字符串時(shí),上述步驟SlOl可包括:利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量。
[0065]例如,針對(duì)尾部頁(yè)面參量,URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串分別為“ 1234.html ”和“abed, html ”,利用編輯距離算法或最長(zhǎng)公共子串算法,計(jì)算字符串“ 1234.html”和“abed, html”間相似度,將計(jì)算所得的字符串間相似度作為URLl和URL2間對(duì)應(yīng)于尾部頁(yè)面參量的相似度分量。
[0066]在一實(shí)施例中,當(dāng)預(yù)設(shè)特征參量的類型為字符串時(shí),上述步驟SlOl可包括:根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量。
[0067]舉例而言,上述步驟SlOl可實(shí)現(xiàn)為:判斷URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串中字符的類型是否相同;當(dāng)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串中字符的類型相同時(shí),URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量為第三預(yù)設(shè)值;當(dāng)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串中字符的類型不相同時(shí),URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量為第四預(yù)設(shè)值。其中,第三預(yù)設(shè)值大于第四預(yù)設(shè)值。
[0068]例如,URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串分別為“ 1234.html”和“abed,html", URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串中字符的類型分別為數(shù)字和字母,兩者不相同,URLl和URL2間對(duì)應(yīng)于尾部頁(yè)面參量的相似度分量為O。
[0069]在步驟S102中、根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到URL間相似度。
[0070]舉例而言,預(yù)設(shè)特征參量包括:站點(diǎn)名稱特征參量、目錄深度特征參量、一級(jí)目錄特征參量、以及尾部頁(yè)面特征參量;對(duì)應(yīng)的URL間相似度分量分別為F1、F2、F3和F4 ;設(shè)置預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,分別為Wl、W2、W3和W4。URL間相似度=F1XW1+F2XW2+F3XW3+F4XW4。其中,可根據(jù)預(yù)設(shè)特征參量是否需要被考量,將預(yù)設(shè)權(quán)重值設(shè)置為I或O ;也可根據(jù)預(yù)設(shè)特征參量的重要性,將預(yù)設(shè)權(quán)重值設(shè)置為百分比,例如,WUW2.W3 和 W4 分別為 10%、10%、20%、和 60%。
[0071]本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:根據(jù)URL的多個(gè)預(yù)設(shè)特征參量,計(jì)算URL間相似度,能夠利用多個(gè)維度計(jì)算URL間相似度,提高了 URL間相似度的準(zhǔn)確性。
[0072]圖2是根據(jù)一示例性實(shí)施例示出的一種URL間相似度計(jì)算的方法的流程圖;如圖2所示,該URL間相似度計(jì)算的方法用于多種設(shè)備如手機(jī)、個(gè)人電腦、服務(wù)器、路由器中,包括以下步驟S201-S204:
[0073]在步驟S201中、對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量。
[0074]在步驟S202中、根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到URL間相似度。
[0075]在步驟S203中、判斷URL間相似度是否大于預(yù)設(shè)閾值。
[0076]在步驟S204中、當(dāng)URL間相似度大于預(yù)設(shè)閾值時(shí),判定URL相似。
[0077]舉例而言,URLl與URL2間相似度大于預(yù)設(shè)閾值,則判定URLl與URL2相似。
[0078]本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:根據(jù)計(jì)算所得的URL間相似度,判斷兩個(gè)URL是否相似,進(jìn)而能夠查找出給定URL的相似URL。
[0079]實(shí)施例一
[0080]圖3是根據(jù)一示例性實(shí)施例一示出的一種URL間相似度計(jì)算的方法的流程圖;實(shí)施例一應(yīng)用在如下場(chǎng)景:預(yù)設(shè)特征參量包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、以及尾部頁(yè)面參量,計(jì)算URLl和URL2間相似度;其中,URLl為www.miu1.com/music/artist/1234.html,URL2 為 www.miu1.com/photo/picture/abed, html。如圖 3 所不,該 URL間相似度計(jì)算的方法用于服務(wù)器中,包括以下步驟:
[0081]在步驟S301中、對(duì)應(yīng)于URL的站點(diǎn)名稱參量,判斷URLl和URL2中對(duì)應(yīng)于站點(diǎn)名稱參量的字符串是否相同。
[0082]其中,URLl和URL2中對(duì)應(yīng)于站點(diǎn)名稱參量的字符串都為www.miu1.com,兩者相同。
[0083]在步驟S302中、判定URLl和URL2中對(duì)應(yīng)于站點(diǎn)名稱參量的字符串相同,得出URLl和URL2間對(duì)應(yīng)于站點(diǎn)名稱參量的相似度分量為I。
[0084]在步驟S303中、對(duì)應(yīng)于URL的目錄深度參量,判斷URLl和URL2中對(duì)應(yīng)于目錄深度參量的數(shù)值是否相同。
[0085]其中,URLl和URL2中對(duì)應(yīng)于目錄深度參量的數(shù)值都為3,兩者相同。
[0086]在步驟S304中、判定URLl和URL2中對(duì)應(yīng)于目錄深度參量的數(shù)值相同,得出URLl和URL2間對(duì)應(yīng)于目錄深度參量的相似度分量為I。
[0087]在步驟S305中、對(duì)應(yīng)于URL的一級(jí)目錄參量,利用最長(zhǎng)公共子串算法得出URLl和URL2中對(duì)應(yīng)于一級(jí)目錄參量的相似度分量為O。
[0088]其中,URLl和URL2中對(duì)應(yīng)于一級(jí)目錄參量的字符串分別為“music”和“photo”,
兩者沒(méi)有公共子串。
[0089]在步驟S306中、對(duì)應(yīng)于URL的尾部頁(yè)面參量,判斷URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串中字符類型是否相同。
[0090]其中,URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串分別為“ 1234.html”和“abed,html ”,兩者的字符類型分別為數(shù)字和字母,兩者的字符類型不相同。
[0091]在步驟S307中、判定URLl和URL2中對(duì)應(yīng)于尾部頁(yè)面參量的字符串中字符類型不相同,得出URLl和URL2間對(duì)應(yīng)于尾部頁(yè)面參量的相似度分量為O。
[0092]在步驟S308中、根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到URL間相似度。
[0093]站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、以及尾部頁(yè)面參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,分別為10%、10%、20%、和60%。根據(jù)該些預(yù)設(shè)權(quán)重值,將URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,加權(quán)求和,得到URLl與URL2間相似度為1X10% +1X10% +0X20%+0X60%= 0.2。
[0094]在步驟S309中、判斷URLl和URL2間相似度是否大于預(yù)設(shè)閾值0.5。
[0095]在步驟S310中、判定URLl和URL2間相似度小于預(yù)設(shè)閾值0.5,確定URLl和URL2不相似。
[0096]實(shí)施例一提供的技術(shù)方案可以包括以下有益效果:根據(jù)URL的多個(gè)預(yù)設(shè)特征參量,計(jì)算URL間相似度,能夠利用多個(gè)維度計(jì)算URL間相似度,提高了 URL間相似度的準(zhǔn)確性;根據(jù)計(jì)算所得的URL間相似度,能夠判斷兩個(gè)URL是否相似。
[0097]圖4是根據(jù)一示例性實(shí)施例示出的URL間相似度計(jì)算的裝置的框圖。如圖4所示,該URL間相似度計(jì)算的裝置用于多種設(shè)備如手機(jī)、個(gè)人電腦、服務(wù)器、路由器中,包括:
[0098]計(jì)算模塊41被配置為對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量;
[0099]加權(quán)求和模塊42被配置為根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到URL間相似度。
[0100]在一實(shí)施例中,如圖5所示,裝置還可包括:
[0101]判斷模塊51被配置為判斷URL間相似度是否大于預(yù)設(shè)閾值;
[0102]判定模塊52被配置為當(dāng)URL間相似度大于預(yù)設(shè)閾值時(shí),判定URL相似。
[0103]在一實(shí)施例中,如圖6所示,計(jì)算模塊42,可包括:
[0104]判斷子模塊61被配置為判斷URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的特征參量值是否相同;
[0105]第一確定子模塊62被配置為當(dāng)URL中特征參量值相同時(shí),確定URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值;
[0106]第二確定子模塊63被配置為當(dāng)URL中特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值;
[0107]第一預(yù)設(shè)值大于第二預(yù)設(shè)值。
[0108]在一實(shí)施例中,計(jì)算模塊,可包括:
[0109]第一計(jì)算子模塊被配置為當(dāng)預(yù)設(shè)特征參量的類型為字符串時(shí),利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量;或者
[0110]第二計(jì)算子模塊被配置為當(dāng)預(yù)設(shè)特征參量的類型為字符串時(shí),根據(jù)URL中對(duì)應(yīng)于預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于預(yù)設(shè)特征參量的相似度分量。
[0111]在一實(shí)施例中,預(yù)設(shè)特征參量包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、二級(jí)目錄參量和/或尾部頁(yè)面參量。
[0112]本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:根據(jù)URL的多個(gè)預(yù)設(shè)特征參量,計(jì)算URL間相似度,能夠利用多個(gè)維度計(jì)算URL間相似度,提高了 URL間相似度的準(zhǔn)確性。
[0113]關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。
[0114]圖7是根據(jù)一示例性實(shí)施例示出的一種用于URL間相似度計(jì)算的裝置1200的框圖,該裝置適用于終端設(shè)備。例如,裝置1200可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
[0115]參照?qǐng)D7,裝置1200可以包括以下一個(gè)或多個(gè)組件:處理組件1202,存儲(chǔ)器1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(I/O)的接口 1212,傳感器組件1214,以及通信組件1216。
[0116]處理組件1202通??刂蒲b置1200的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件1202可以包括一個(gè)或多個(gè)處理器1220來(lái)執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個(gè)或多個(gè)模塊,便于處理組件1202和其他組件之間的交互。例如,處理部件1202可以包括多媒體模塊,以方便多媒體組件1208和處理組件1202之間的交互。
[0117]存儲(chǔ)器1204被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在設(shè)備1200的操作。這些數(shù)據(jù)的示例包括用于在裝置1200上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器1204可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(R0M),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤或光盤。
[0118]電力組件1206為裝置1200的各種組件提供電力。電力組件1206可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置1200生成、管理和分配電力相關(guān)聯(lián)的組件。
[0119]多媒體組件1208包括在所述裝置1200和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件1208包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備1200處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
[0120]音頻組件1210被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件1210包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置1200處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器1204或經(jīng)由通信組件1216發(fā)送。在一些實(shí)施例中,音頻組件1210還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
[0121]I/O接口 1212為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
[0122]傳感器組件1214包括一個(gè)或多個(gè)傳感器,用于為裝置1200提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件1214可以檢測(cè)到設(shè)備1200的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置1200的顯示器和小鍵盤,傳感器組件1214還可以檢測(cè)裝置1200或裝置1200 —個(gè)組件的位置改變,用戶與裝置1200接觸的存在或不存在,裝置1200方位或加速/減速和裝置1200的溫度變化。傳感器組件1214可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件1214還可以包括光傳感器,如CMOS或CXD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件1214還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
[0123]通信組件1216被配置為便于裝置1200和其他設(shè)備之間有線或無(wú)線方式的通信。裝置1200可以接入基于通信標(biāo)準(zhǔn)的無(wú)線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信部件1216經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件1216還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。
[0124]在示例性實(shí)施例中,裝置1200可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
[0125]在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器1204,上述指令可由裝置1200的處理器820執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
[0126]一種URL間相似度計(jì)算的裝置,包括:
[0127]處理器;
[0128]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0129]其中,處理器被配置為:
[0130]對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;
[0131]根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
[0132]該處理器還被配置為:判斷所述URL間相似度是否大于預(yù)設(shè)閾值;
[0133]當(dāng)所述URL間相似度大于預(yù)設(shè)閾值時(shí),判定所述URL相似。
[0134]該處理器被配置為:判斷URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值是否相同;當(dāng)URL中所述特征參量值相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值;當(dāng)URL中所述特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值;所述第一預(yù)設(shè)值大于所述第二預(yù)設(shè)值。
[0135]該處理器被配置為:當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;或者
[0136]根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量。
[0137]一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種URL間相似度計(jì)算的方法,所述方法包括:
[0138]對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;
[0139]根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
[0140]所述方法還可包括:
[0141]判斷所述URL間相似度是否大于預(yù)設(shè)閾值;
[0142]當(dāng)所述URL間相似度大于預(yù)設(shè)閾值時(shí),判定所述URL相似。
[0143]所述根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量,可包括:
[0144]判斷URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值是否相同;
[0145]當(dāng)URL中所述特征參量值相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值;
[0146]當(dāng)URL中所述特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值;
[0147]所述第一預(yù)設(shè)值大于所述第二預(yù)設(shè)值。
[0148]當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),所述根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量,可包括:
[0149]利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;或者
[0150]根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量。
[0151]本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐這里公開(kāi)的公開(kāi)后,將容易想到本公開(kāi)的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本【技術(shù)領(lǐng)域】中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的權(quán)利要求指出。
[0152]應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限制。
【權(quán)利要求】
1.一種統(tǒng)一資源定位符URL間相似度計(jì)算的方法,其特征在于,包括: 對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量; 根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 判斷所述URL間相似度是否大于預(yù)設(shè)閾值; 當(dāng)所述URL間相似度大于預(yù)設(shè)閾值時(shí),判定所述URL相似。
3.如權(quán)利要求1所述的方法,其特征在于, 所述根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量,包括: 判斷URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值是否相同; 當(dāng)URL中所述特征參量值相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值; 當(dāng)URL中所述特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值; 所述第一預(yù)設(shè)值大于所述第二預(yù)設(shè)值。
4.如權(quán)利要求1所述的方法,其特征在于, 當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),所述根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量,包括: 利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;或者 根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量。
5.如權(quán)利要求1所述的方法,其特征在于, 所述預(yù)設(shè)特征參量包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、二級(jí)目錄參量和/或尾部頁(yè)面參量。
6.一種統(tǒng)一資源定位符URL間相似度計(jì)算的裝置,其特征在于,包括: 計(jì)算模塊,用于對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量; 加權(quán)求和模塊,用于根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
7.如權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 判斷模塊,用于判斷所述URL間相似度是否大于預(yù)設(shè)閾值; 判定模塊,用于當(dāng)所述URL間相似度大于預(yù)設(shè)閾值時(shí),判定所述URL相似。
8.如權(quán)利要求6所述的裝置,其特征在于, 所述計(jì)算模塊,包括: 判斷子模塊,用于判斷URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值是否相同; 第一確定子模塊,用于當(dāng)URL中所述特征參量值相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第一預(yù)設(shè)值; 第二確定子模塊,用于當(dāng)URL中所述特征參量值不相同時(shí),確定URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量為第二預(yù)設(shè)值; 所述第一預(yù)設(shè)值大于所述第二預(yù)設(shè)值。
9.如權(quán)利要求6所述的裝置,其特征在于, 所述計(jì)算模塊,包括 第一計(jì)算子模塊,用于當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),利用編輯距離算法或最長(zhǎng)公共子串算法,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量;或者 第二計(jì)算子模塊,用于當(dāng)所述預(yù)設(shè)特征參量的類型為字符串時(shí),根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的字符串中字符的類型,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量。
10.如權(quán)利要求6所述的裝置,其特征在于, 所述預(yù)設(shè)特征參量包括:站點(diǎn)名稱參量、目錄深度參量、一級(jí)目錄參量、二級(jí)目錄參量和/或尾部頁(yè)面參量。
11.一種統(tǒng)一資源定位符URL間相似度計(jì)算的裝置,其特征在于,包括: 處理器; 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器; 其中,所述處理器被配置為: 對(duì)應(yīng)于URL的各個(gè)預(yù)設(shè)特征參量,根據(jù)URL中對(duì)應(yīng)于所述預(yù)設(shè)特征參量的特征參量值,計(jì)算URL間對(duì)應(yīng)于所述預(yù)設(shè)特征參量的相似度分量; 根據(jù)各個(gè)預(yù)設(shè)特征參量對(duì)應(yīng)的預(yù)設(shè)權(quán)重值,將所述URL間對(duì)應(yīng)于各個(gè)預(yù)設(shè)特征參量的相似度分量,進(jìn)行加權(quán)求和,得到所述URL間相似度。
【文檔編號(hào)】G06F17/30GK104281703SQ201410568402
【公開(kāi)日】2015年1月14日 申請(qǐng)日期:2014年10月22日 優(yōu)先權(quán)日:2014年10月22日
【發(fā)明者】譚國(guó)斌, 沈建榮, 馬哲 申請(qǐng)人:小米科技有限責(zé)任公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
安平县| 大名县| 巴彦县| 阿坝县| 泸定县| 荣成市| 潞城市| 桑植县| 临城县| 菏泽市| 定西市| 宁津县| 三都| 塔河县| 且末县| 安岳县| 阳谷县| 崇明县| 交城县| 比如县| 织金县| 滨州市| 广元市| 沛县| 县级市| 辽源市| 弥勒县| 黑河市| 太和县| 沿河| 志丹县| 康平县| 林州市| 双江| 阿拉善盟| 武陟县| 泸州市| 昌吉市| 苍溪县| 临湘市| 蛟河市|