一種識別請求的方法及網(wǎng)站服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及搜索技術(shù)領(lǐng)域,具體涉及一種識別請求的方法及網(wǎng)站服務(wù)器。
【背景技術(shù)】
[0002]蜘蛛請求(又被稱為網(wǎng)頁蜘蛛,網(wǎng)絡(luò)機器人)是一種按照一定規(guī)則,自動的抓取互聯(lián)網(wǎng)信息的程序或者腳本;蜘蛛請求一般由提供搜索服務(wù)的搜索公司發(fā)出,搜索公司通過蜘蛛請求可定向抓取相關(guān)的網(wǎng)站信息(如網(wǎng)站的網(wǎng)頁信息等),并將抓取到的網(wǎng)站信息整合到搜索引擎中,提升搜索引擎輸出搜索結(jié)果的全面性和準確性;由于網(wǎng)站信息被蜘蛛請求抓取后,能夠被搜索公司整合入搜索引擎中,提升網(wǎng)站被用戶搜索到的可能性,因此大多數(shù)的網(wǎng)站對于由搜索公司所發(fā)出的蜘蛛請求是持歡迎態(tài)度的,并不對其進行屏蔽。
[0003]本發(fā)明的發(fā)明人在研宄過程中發(fā)現(xiàn),目前一些非搜索公司出于竊取網(wǎng)站信息的目的,存在偽造蜘蛛請求,惡意采集網(wǎng)站信息的情況;出于保證網(wǎng)站信息的安全,對于偽造的蜘蛛請求進行識別,從而在后續(xù)加以屏蔽,顯得尤為必要;然而,偽造的蜘蛛請求與由搜索公司發(fā)出的合法蜘蛛請求在內(nèi)容上基本一致,目前并沒有一種能夠有效識別偽造的蜘蛛請求的技術(shù)。
[0004]因此,如何提供一種能夠識別偽造的蜘蛛請求的方法,成為本領(lǐng)域技術(shù)人員需要考慮的問題。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明實施例提供一種識別請求的方法及網(wǎng)站服務(wù)器,以實現(xiàn)有效識別偽造的蜘蛛請求的目的。
[0006]為實現(xiàn)上述目的,本發(fā)明實施例提供如下技術(shù)方案:
[0007]一種識別請求的方法,包括:
[0008]獲取接入網(wǎng)站的請求;
[0009]判斷所述請求是否攜帶蜘蛛標識;
[0010]若所述請求中攜帶蜘蛛標識,確定所述請求的IP地址;
[0011]根據(jù)所述IP地址,判斷所述請求是否由搜索公司發(fā)出;
[0012]若所述請求由搜索公司發(fā)出,則確定所述請求為合法蜘蛛請求;
[0013]若所述請求不是由搜索公司發(fā)出,則確定所述請求為偽造的蜘蛛請求。
[0014]其中,所述方法還包括:
[0015]放行所述合法蜘蛛請求,以便所述合法蜘蛛請求抓取網(wǎng)站信息;
[0016]屏蔽所述偽造的蜘蛛請求。
[0017]其中,所述根據(jù)所述IP地址,判斷所述請求是否由搜索公司發(fā)出包括:
[0018]判斷所述IP地址是否為合法IP地址,所述合法IP地址為搜索公司對應的IP地址;
[0019]若是,則確定所述請求由搜索公司發(fā)出;
[0020]若否,則確定所述請求不是由搜索公司發(fā)出。
[0021]其中,所述判斷所述IP地址是否為合法IP地址包括:
[0022]調(diào)取預設(shè)的合法IP地址,判斷所述IP地址是否與預設(shè)的合法IP地址對應,若是,則確定所述IP地址為合法IP地址,若否,則確定所述IP地址不為合法IP地址;
[0023]或,確定所述IP地址對應的域名信息,判斷所述域名信息是否與預設(shè)的搜索公司的域名信息對應,若是,則確定所述IP地址為合法IP地址,若否,則確定所述IP地址不為合法IP地址。
[0024]其中,所述根據(jù)所述IP地址,判斷所述請求是否由搜索公司發(fā)出包括:
[0025]確定所述IP地址的歸屬地址;
[0026]判斷所述歸屬地址與設(shè)定的搜索公司的所在地址是否對應;
[0027]若是,則確定所述請求由搜索公司發(fā)出;
[0028]若否,則確定所述請求不是由搜索公司發(fā)出。
[0029]其中,所述根據(jù)所述IP地址,判斷所述請求是否由搜索公司發(fā)出包括:
[0030]判斷所述IP地址是否為合法IP地址,所述合法IP地址為搜索公司對應的IP地址;
[0031]若否,則確定所述請求不是由搜索公司發(fā)出;
[0032]若是,確定所述IP地址的歸屬地址,并判斷所述歸屬地址與設(shè)定的搜索公司的所在地址是否對應;
[0033]若所述歸屬地址與設(shè)定的搜索公司的所在地址相對應,則確定所述請求由搜索公司發(fā)出;
[0034]若所述歸屬地址與設(shè)定的搜索公司的所在地址不對應,則確定所述請求不是由搜索公司發(fā)出。
[0035]本發(fā)明實施例還提供一種網(wǎng)站服務(wù)器,包括:
[0036]請求獲取模塊,用于獲取接入網(wǎng)站的請求;
[0037]標識判斷模塊,用于判斷所述請求是否攜帶蜘蛛標識;
[0038]地址確定模塊,用于若所述請求中攜帶蜘蛛標識,確定所述請求的IP地址;
[0039]判斷模塊,用于根據(jù)所述IP地址,判斷所述請求是否由搜索公司發(fā)出;
[0040]第一結(jié)果確定模塊,用于若所述請求由搜索公司發(fā)出,則確定所述請求為合法蜘蛛請求;
[0041]第二結(jié)果確定模塊,用于若所述請求不是由搜索公司發(fā)出,則確定所述請求為偽造的蜘蛛請求。
[0042]其中,所述判斷模塊包括:
[0043]第一地址合法判斷單元,用于判斷所述IP地址是否為合法IP地址,所述合法IP地址為搜索公司對應的IP地址;
[0044]第一合法確定單元,用于若第一地址合法判斷單元的判斷結(jié)果為是,則確定所述請求由搜索公司發(fā)出;
[0045]第二合法確定單元,用于若第一地址合法判斷單元的判斷結(jié)果為否,則確定所述請求不是由搜索公司發(fā)出;
[0046]所述地址合法判斷單元包括:
[0047]第一判斷執(zhí)行子單元,用于調(diào)取預設(shè)的合法IP地址,判斷所述IP地址是否與預設(shè)的合法IP地址對應,若是,則確定所述IP地址為合法IP地址,若否,則確定所述IP地址不為合法IP地址;
[0048]或,第二判斷執(zhí)行子單元,用于確定所述IP地址對應的域名信息,判斷所述域名信息是否與預設(shè)的搜索公司的域名信息對應,若是,則確定所述IP地址為合法IP地址,若否,則確定所述IP地址不為合法IP地址。
[0049]其中,所述判斷模塊包括:
[0050]第一歸屬地址判斷單元,用于確定所述IP地址的歸屬地址,判斷所述歸屬地址與設(shè)定的搜索公司的所在地址是否對應;
[0051]第一地址確定單元,用于若所述第一歸屬地址判斷單元的判斷結(jié)果為是,則確定所述請求由搜索公司發(fā)出;
[0052]第二地址確定單元,用于若所述第一歸屬地址判斷單元的判斷結(jié)果為否,則確定所述請求不是由搜索公司發(fā)出。
[0053]其中,所述判斷模塊包括:
[0054]第二地址合法判斷單元,用于判斷所述IP地址是否為合法IP地址,所述合法IP地址為搜索公司對應的IP地址;
[0055]第一確定單元,用于若所述第二地址合法判斷單元的判斷結(jié)果為否,則確定所述請求不是由搜索公司發(fā)出;
[0056]第二歸屬地址判斷單元,用于若第二地址合法判斷單元的判斷結(jié)果為是,確定所述IP地址的歸屬地址,并判斷所述歸屬地址與設(shè)定的搜索公司的所在地址是否對應;
[0057]第二確定單元,用于若所述第二歸屬地址判斷單元的判斷結(jié)果為是,則確定所述請求由搜索公司發(fā)出;
[0058]第三確定單元,用于若所述第二歸屬地址判斷單元的判斷結(jié)果為否,則確定所述請求不是由搜索公司發(fā)出。
[0059]基于上述技術(shù)方案,本發(fā)明實施例提供的識別請求的方法,包括:獲取接入網(wǎng)站的請求;判斷所述請求是否攜帶蜘蛛標識;若所述請求中攜帶蜘蛛標識,確定所述請求的IP地址;根據(jù)所述IP地址,判斷所述請求是否由搜索公司發(fā)出;若所述請求由搜索公司發(fā)出,則確定所述請求為合法蜘蛛請求;若所述請求不是由搜索公司發(fā)出,則確定所述請求為偽造的蜘蛛請求??梢钥闯觯景l(fā)明實施例通過蜘蛛標識,可從接入網(wǎng)站的請求中確定出請求的識別范圍,即合法蜘蛛請求和偽造的蜘蛛請求;從而根據(jù)攜帶有蜘蛛標識的請求的IP地址,判斷所述請求是否由搜索公司,當確定所述請求由搜索公司發(fā)出時,則確定所述請求為合法蜘蛛請求,當確定所述請求不是由搜索公司發(fā)出時,貝lJ確定所述請求為偽造的蜘蛛請求;進而實現(xiàn)從接入網(wǎng)站的請求中有效識別偽造的蜘蛛請求的目的,為后續(xù)屏蔽偽造的蜘蛛請求,保證網(wǎng)站信息的安全提供了可能。
【附圖說明】
[0060]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
[0061]圖