两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

不良網(wǎng)頁檢測方法及裝置的制作方法

文檔序號:8003246閱讀:252來源:國知局
專利名稱:不良網(wǎng)頁檢測方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)安全技術(shù),尤其涉及一種不良網(wǎng)頁檢測方法及裝置。
技術(shù)背景
互聯(lián)網(wǎng)技術(shù)的突飛猛進推動了信息社會的不斷發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為社會活動必不可少的一部分。但是,互聯(lián)網(wǎng)也成為了色情等不良信息傳播的媒介,嚴(yán)重影響網(wǎng)民、特別是青少年對互聯(lián)網(wǎng)的正常應(yīng)用,阻礙互聯(lián)網(wǎng)健康有序的發(fā)展。
對色情網(wǎng)站等不良網(wǎng)站的檢測,關(guān)鍵詞過濾是一種簡單、易于實現(xiàn),且容易進行分布式處理的互聯(lián)網(wǎng)色情信息檢測技術(shù),被廣泛應(yīng)用。但純粹依賴關(guān)鍵詞進行不良網(wǎng)站的檢測會造成對眾多網(wǎng)站的誤檢,檢測效果不佳。發(fā)明內(nèi)容
本發(fā)明提供一種不良網(wǎng)頁檢測方法及裝置,以提高對不良網(wǎng)頁的檢測效果。
本發(fā)明第一個方面提供一種不良網(wǎng)頁檢測方法,包括
根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取所述疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;
對所述疑似不良網(wǎng)頁進行解析,生成解析結(jié)果;
當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
本發(fā)明另一個方面提供一種不良網(wǎng)頁檢測裝置,其特征在于,包括
不良網(wǎng)址列表生成模塊,用于根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取所述疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;
解析模塊,用于對所述疑似不良網(wǎng)頁進行解析,生成解析結(jié)果;
第一刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
由上述技術(shù)方案可知,本發(fā)明第一個方面提供的不良網(wǎng)頁檢測方法,根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,對疑似不良網(wǎng)頁進行解析,若疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn), 則將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對通過不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁進行了進一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁,提高了對不良網(wǎng)頁的檢測效果。
本發(fā)明另一個方面提供的不良網(wǎng)頁檢測裝置,不良網(wǎng)址列表生成模塊根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,解析模塊對疑似不良網(wǎng)頁進行解析,若疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn),則第一刪除模塊將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對通過不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁進行了進一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁,提高了對不良網(wǎng)頁的檢測效果。


圖1為本發(fā)明實施例一提供的不良網(wǎng)頁檢測方法流程圖2為本發(fā)明實施例二提供的不良網(wǎng)頁檢測方法流程圖3為本發(fā)明實施例三提供的不良網(wǎng)頁檢測裝置結(jié)構(gòu)示意圖4為本發(fā)明實施例四提供的不良網(wǎng)頁檢測裝置結(jié)構(gòu)示意圖。
具體實施方式
實施例一
圖1為本發(fā)明實施例一提供的不良網(wǎng)頁檢測方法流程圖。如圖1所示,本實施例提供的不良網(wǎng)頁檢測方法具體可以應(yīng)用于對不良網(wǎng)站的檢測,不良網(wǎng)站具體可以包括色情、 賭博、暴力以及反動等網(wǎng)站??梢酝ㄟ^不良網(wǎng)頁檢測裝置來執(zhí)行,該不良網(wǎng)頁檢測裝置具體可以通過軟和/或硬件的方式來實現(xiàn)。
本實施例提供的不良網(wǎng)頁檢測方法具體包括
步驟10、根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表;
具體地,不良關(guān)鍵詞可以包括涉黃詞匯等不良信息,可以通過搜索引擎對不良關(guān)鍵詞進行搜索,以獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,即疑似不良網(wǎng)頁中包含有該不良關(guān)鍵詞。不良關(guān)鍵詞可以根據(jù)具體的檢測需要來設(shè)置。疑似不良網(wǎng)頁對應(yīng)的原始地址即為通過搜索引擎被不良關(guān)鍵詞進行搜索時,搜索到的網(wǎng)頁所顯示的地址,但是該疑似不良網(wǎng)頁在加載過程中可能會發(fā)生跳轉(zhuǎn)。該跳轉(zhuǎn)可以是Jav必cript跳轉(zhuǎn),Meta跳轉(zhuǎn)和統(tǒng)一資源定位符(Uniform/Universal Resource Locator,簡稱URL)跳轉(zhuǎn),則跳轉(zhuǎn)到的地址即為目標(biāo)地址。將搜索到的疑似不良網(wǎng)頁對應(yīng)的原始地址記錄形成不良網(wǎng)址列表。
步驟20、對疑似不良網(wǎng)頁進行解析,生成解析結(jié)果;
具體地,可以對疑似不良網(wǎng)頁的源代碼和動態(tài)腳本等進行解析,動態(tài)腳本通常為 JavaScript腳本。Javakript腳本既包含網(wǎng)頁內(nèi)的Javakript腳本,也包含嵌入的外部 JavaScript Ρ*。
步驟30、當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
具體地,若疑似不良網(wǎng)頁中存在JavMcript跳轉(zhuǎn),即該跳轉(zhuǎn)行為是通過 Jav必cript行為實現(xiàn)的,則該跳轉(zhuǎn)為網(wǎng)頁跳轉(zhuǎn)作弊,即惡意跳轉(zhuǎn)。通常網(wǎng)頁跳轉(zhuǎn)作弊行為的網(wǎng)站不是色情、賭博等網(wǎng)站,可以將存在惡意跳轉(zhuǎn)的疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
本實施例提供的不良網(wǎng)頁檢測方法,根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,對疑似不良網(wǎng)頁進行解析,若疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn),則將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對通過不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁進行了進一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁,提高了對不良網(wǎng)頁的檢測效果。
實施例二
圖2為本發(fā)明實施例二提供的不良網(wǎng)頁檢測方法流程圖。如圖2所示,本實施例提供的不良網(wǎng)頁檢測方法在實施例一的基礎(chǔ)上,進一步地,步驟20,對疑似不良網(wǎng)頁進行解析,生成解析結(jié)果之后,還可以包括如下步驟
步驟40、當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在隱藏作弊時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
具體地,疑似不良網(wǎng)頁中存在被隱藏的、人的眼睛無法直接看到的文字,即為隱藏作弊。通常存在隱藏作弊行為的網(wǎng)站都不是色情、賭博等網(wǎng)站。對疑似不良網(wǎng)頁進行解析, 若該疑似不良網(wǎng)頁中存在隱藏作弊,則將該疑似不良網(wǎng)頁的原始地址從不良網(wǎng)址列表中刪除。通過對存在隱藏作弊的網(wǎng)頁的檢測,可以進一步提高對不良網(wǎng)頁檢測的準(zhǔn)確性。
進一步地,步驟20,對疑似不良網(wǎng)頁進行解析,生成解析結(jié)果之后,還可以包括如下步驟
步驟50、當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過預(yù)設(shè)閾值時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
疑似不良網(wǎng)頁是基于一系列不良關(guān)鍵詞過濾所得,這樣導(dǎo)致了相當(dāng)數(shù)量的正規(guī)成人網(wǎng)站、美容類網(wǎng)站和醫(yī)療類網(wǎng)站等進入該疑似數(shù)據(jù)集,本實施例進行共現(xiàn)詞分析,共現(xiàn)詞可以包括“價格”、“熱線”、“電話”、“促銷”、“醫(yī)院”、“公司”、“整形”、“銷售”、“專家”等,若疑似不良網(wǎng)頁中包含的上述共現(xiàn)詞的數(shù)量超過預(yù)設(shè)閾值,則可以認(rèn)為該網(wǎng)頁不是不良網(wǎng)頁, 則將該網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過共現(xiàn)詞對疑似不良網(wǎng)頁進行進一步地的過濾,可以進一步提高對不良網(wǎng)頁檢測的準(zhǔn)確性。
在本實施例中,步驟30,當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時, 將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除,具體可以包括如下步驟
當(dāng)根據(jù)解析結(jié)果識別出在允許動態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名與在禁止動態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名不同時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
具體地,對Jav必cript腳本進行解析,可以通過匹配以下字符串“window, location, href ">"window. navigate,,、"self, location,,禾口"top. location,,,角軍析出重新定位的URL,即目標(biāo)地址。進一步將URL映射到域名,例如URL為http //sports, sina. com. cn/basket2010/,該URL對應(yīng)的域名為sina. com. cn。在實際網(wǎng)頁解析過程中,可以通過如下代碼對惡意跳轉(zhuǎn)進行檢測
if (destDomain(EnableJS) = domainName) {不存在惡意跳轉(zhuǎn); }else if (destDomain(EnableJS) !=destDomain(DisableJS)){存在惡意跳轉(zhuǎn); }else{不存在惡意跳轉(zhuǎn);}
其中,domainName、destDomain(EnableJS)禾口 destDomain(DisableJS)分另Ij表示原始地址對應(yīng)的原始域名、允許動態(tài)腳本執(zhí)行狀態(tài)下的目標(biāo)地址對應(yīng)的域名和禁止動態(tài)執(zhí)行狀態(tài)下的目標(biāo)地址對應(yīng)的域名。當(dāng)destDomain(EnableJS)與destDomain(DisableJS) 不同時,說明存在惡意跳轉(zhuǎn)。
在本實施例中,步驟40中的識別出疑似不良網(wǎng)頁中存在隱藏作弊具體可以包括下述至少一種
當(dāng)識別到疑似不良網(wǎng)頁的可視范圍外存在不良關(guān)鍵詞時,確定識別出疑似不良網(wǎng)頁中存在隱藏作弊;
當(dāng)識別到疑似不良網(wǎng)頁的快速滾動內(nèi)容中存在不良關(guān)鍵詞時,確定識別出疑似不良網(wǎng)頁中存在隱藏作弊;
當(dāng)識別到疑似不良網(wǎng)頁對應(yīng)的級聯(lián)樣式表隱藏內(nèi)容中存在不良關(guān)鍵詞時,確定識別出疑似不良網(wǎng)頁中存在隱藏作弊;
當(dāng)識別到疑似不良網(wǎng)頁中的不良關(guān)鍵詞的顏色與疑似不良網(wǎng)頁的背景顏色相同時,確定識別出疑似不良網(wǎng)頁中存在隱藏作弊。
其中,對疑似不良網(wǎng)頁的可視范圍外存在不良關(guān)鍵詞的檢測,可以對不良關(guān)鍵詞對應(yīng)的超文本標(biāo)記語言(Hypertext Markup Language,簡稱HTML)標(biāo)簽進行分析,若top或 left等屬性的值為負(fù)數(shù),則說明該疑似不良網(wǎng)頁的可視范圍外存在不良關(guān)鍵詞。
對疑似不良網(wǎng)頁的快速滾動內(nèi)容中存在不良關(guān)鍵詞的檢測,首先解析網(wǎng)頁中有無存在用于指示文字滾動的關(guān)鍵字Marquee,若存在該關(guān)鍵字且該關(guān)鍵字對應(yīng)的文字內(nèi)容中存在不良關(guān)鍵詞,則對根據(jù)延時時間進行判斷,若延時時間很短,以致肉眼無法看清文字, 則可以判定該疑似不良網(wǎng)頁存在包含有不良關(guān)鍵詞的快速滾動內(nèi)容。
對疑似不良網(wǎng)頁對應(yīng)的級聯(lián)樣式表(Cascading Style Sieet,簡稱CSS)隱藏內(nèi)容中存在不良關(guān)鍵詞的檢測,具體可以根據(jù)<div style = " display:none" >或<(1& style ="visibility:hidden〃 >等來進行檢測。
對疑似不良網(wǎng)頁中的不良關(guān)鍵詞的顏色與疑似不良網(wǎng)頁的背景顏色相同的檢測, 由于網(wǎng)頁顏色的決定因素眾多,包括HTML、CSS和JavMcript等,可以分別對上述因素進行檢測。也可以只對HTML Tag進行判斷,對color元素(包括bgcolor、font color等)進行匹配,以不良關(guān)鍵詞的顏色與網(wǎng)頁背景是否相同,而對隱藏作弊進行檢測,實現(xiàn)簡單。
實施例三
圖3為本發(fā)明實施例三提供的不良網(wǎng)頁檢測裝置結(jié)構(gòu)示意圖。如圖3所示,本實施例提供的不良網(wǎng)頁檢測裝置具體可以實現(xiàn)本發(fā)明任意實施例提供的不良網(wǎng)頁檢測方法的各個步驟,此不再贅述。
本實施例提供的不良網(wǎng)頁檢測裝置具體包括不良網(wǎng)址列表生成模塊11、解析模塊 12和第一刪除模塊13。不良網(wǎng)址列表生成模塊11用于根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表。解析模塊12用于對疑似不良網(wǎng)頁進行解析,生成解析結(jié)果。第一刪除模塊13用于當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。
本實施例提供的不良網(wǎng)頁檢測裝置,不良網(wǎng)址列表生成模塊11根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表,解析模塊12對疑似不良網(wǎng)頁進行解析,若疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn),則第一刪除模塊13將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。由于對通過不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁進行了進一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁,提高了對不良網(wǎng)頁的檢測效果。
實施例四
圖4為本發(fā)明實施例四提供的不良網(wǎng)頁檢測裝置結(jié)構(gòu)示意圖。如圖4所示,在本實施例中,不良網(wǎng)頁檢測裝置具體還可以包括第二刪除模塊14,第二刪除模塊14用于當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在隱藏作弊時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過第二刪除模塊14的設(shè)置,對存在隱藏作弊的網(wǎng)頁的檢測,可以進一步提高對不良網(wǎng)頁檢測的準(zhǔn)確性。
進一步地,在本實施例中,該不良網(wǎng)頁檢測裝置還可以包括第三刪除模塊15。第三刪除模塊15用于當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過預(yù)設(shè)閾值時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過第三刪除模塊的設(shè)置15,可以通過共現(xiàn)詞對疑似不良網(wǎng)頁進行進一步地的過濾,可以進一步提高對不良網(wǎng)頁檢測的準(zhǔn)確性。
在本實施例中,第一刪除模塊13還可以用于當(dāng)根據(jù)解析結(jié)果識別出在允許動態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名與在禁止動態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名不同時,將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。通過將允許動態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名與在禁止動態(tài)腳本執(zhí)行狀態(tài)下疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名進行比較,可以便捷地檢測出惡意跳轉(zhuǎn),提高檢測效率。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括R0M、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
最后應(yīng)說明的是以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。
權(quán)利要求
1.一種不良網(wǎng)頁檢測方法,其特征在于,包括根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取所述疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;對所述疑似不良網(wǎng)頁進行解析,生成解析結(jié)果;當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
2.根據(jù)權(quán)利要求1所述的不良網(wǎng)頁檢測方法,其特征在于,對所述疑似不良網(wǎng)頁進行解析,生成解析結(jié)果之后,還包括當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在隱藏作弊時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
3.根據(jù)權(quán)利要求1或2所述的不良網(wǎng)頁檢測方法,其特征在于,對所述疑似不良網(wǎng)頁進行解析,生成解析結(jié)果之后,還包括當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過預(yù)設(shè)閾值時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
4.根據(jù)權(quán)利要求3所述的不良網(wǎng)頁檢測方法,其特征在于,當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除,包括當(dāng)根據(jù)所述解析結(jié)果識別出在允許動態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名與在禁止動態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名不同時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
5.根據(jù)權(quán)利要求2所述的不良網(wǎng)頁檢測方法,其特征在于,識別出所述疑似不良網(wǎng)頁中存在隱藏作弊包括下述至少一種當(dāng)識別到所述疑似不良網(wǎng)頁的可視范圍外存在所述不良關(guān)鍵詞時,確定識別出所述疑似不良網(wǎng)頁中存在隱藏作弊;當(dāng)識別到所述疑似不良網(wǎng)頁的快速滾動內(nèi)容中存在所述不良關(guān)鍵詞時,確定識別出所述疑似不良網(wǎng)頁中存在隱藏作弊;當(dāng)識別到所述疑似不良網(wǎng)頁對應(yīng)的級聯(lián)樣式表隱藏內(nèi)容中存在所述不良關(guān)鍵詞時,確定識別出所述疑似不良網(wǎng)頁中存在隱藏作弊;當(dāng)識別到所述疑似不良網(wǎng)頁中的所述不良關(guān)鍵詞的顏色與所述疑似不良網(wǎng)頁的背景顏色相同時,確定識別出所述疑似不良網(wǎng)頁中存在隱藏作弊。
6.一種不良網(wǎng)頁檢測裝置,其特征在于,包括不良網(wǎng)址列表生成模塊,用于根據(jù)不良關(guān)鍵詞獲取所述不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取所述疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有所述原始地址的不良網(wǎng)址列表;解析模塊,用于對所述疑似不良網(wǎng)頁進行解析,生成解析結(jié)果;第一刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn)時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
7.根據(jù)權(quán)利要求6所述的不良網(wǎng)頁檢測裝置,其特征在于,還包括第二刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在隱藏作弊時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
8.根據(jù)權(quán)利要求6或7所述的不良網(wǎng)頁檢測裝置,其特征在于,還包括第三刪除模塊,用于當(dāng)根據(jù)所述解析結(jié)果識別出所述疑似不良網(wǎng)頁中存在的預(yù)設(shè)共現(xiàn)詞的數(shù)量超過預(yù)設(shè)閾值時,將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
9.根據(jù)權(quán)利要求8所述的不良網(wǎng)頁檢測裝置,其特征在于所述第一刪除模塊還用于當(dāng)根據(jù)所述解析結(jié)果識別出在允許動態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名與在禁止動態(tài)腳本執(zhí)行狀態(tài)下所述疑似不良網(wǎng)頁的目標(biāo)地址對應(yīng)的域名不同時, 將所述疑似不良網(wǎng)頁對應(yīng)的原始地址從所述不良網(wǎng)址列表中刪除。
全文摘要
本發(fā)明提供一種不良網(wǎng)頁檢測方法及裝置,該不良網(wǎng)頁檢測方法包括根據(jù)不良關(guān)鍵詞獲取不良關(guān)鍵詞對應(yīng)的疑似不良網(wǎng)頁,獲取疑似不良網(wǎng)頁對應(yīng)的原始地址,生成包含有原始地址的不良網(wǎng)址列表;對疑似不良網(wǎng)頁進行解析,生成解析結(jié)果;當(dāng)根據(jù)解析結(jié)果識別出疑似不良網(wǎng)頁中存在惡意跳轉(zhuǎn),則將疑似不良網(wǎng)頁對應(yīng)的原始地址從不良網(wǎng)址列表中刪除。本發(fā)明提供的不良網(wǎng)頁檢測方法及裝置,由于對通過不良關(guān)鍵詞獲取的疑似不良網(wǎng)頁進行了進一步地分析,排除了存在惡意跳轉(zhuǎn)的網(wǎng)頁,提高了對不良網(wǎng)頁的檢測效果。
文檔編號H04L29/06GK102523130SQ201110401720
公開日2012年6月27日 申請日期2011年12月6日 優(yōu)先權(quán)日2011年12月6日
發(fā)明者洪博, 王利明, 耿光剛 申請人:中國科學(xué)院計算機網(wǎng)絡(luò)信息中心
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
客服| 大兴区| 神木县| 兴安盟| 临泉县| 奇台县| 乡宁县| 屏南县| 古浪县| 昭苏县| 阿克| 民丰县| 察哈| 尼勒克县| 大安市| 海伦市| 长寿区| 延长县| 太保市| 苍溪县| 柳江县| 绥江县| 鲁山县| 绵竹市| 虎林市| 泾阳县| 奉新县| 乐陵市| 且末县| 抚宁县| 呼伦贝尔市| 太保市| 青浦区| 敦煌市| 山西省| 伊吾县| 莱阳市| 和静县| 镇江市| 嵊州市| 新津县|