一種搜索網(wǎng)頁(yè)的方法和裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種搜索網(wǎng)頁(yè)的方法和裝置,屬于網(wǎng)絡(luò)【技術(shù)領(lǐng)域】。所述方法包括:根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè);獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息;從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。本發(fā)明通過(guò)根據(jù)已經(jīng)獲得的第一網(wǎng)頁(yè)地址,訪問(wèn)該第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),獲取到訪問(wèn)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,每個(gè)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中含有大量網(wǎng)頁(yè)地址信息,通過(guò)遍歷此網(wǎng)頁(yè)信息,從網(wǎng)頁(yè)信息中提取大量第二網(wǎng)頁(yè)地址,解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法搜索網(wǎng)頁(yè)的數(shù)量受到局限、效率低下的問(wèn)題,同時(shí)解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法成本高的問(wèn)題。
【專利說(shuō)明】 一種搜索網(wǎng)頁(yè)的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別涉及一種搜索網(wǎng)頁(yè)的方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展、網(wǎng)頁(yè)內(nèi)容的不斷豐富,網(wǎng)頁(yè)瀏覽的速度會(huì)受到影響。為了優(yōu)化網(wǎng)頁(yè),提高網(wǎng)頁(yè)瀏覽的速度,現(xiàn)有技術(shù)通常通過(guò)搜索網(wǎng)頁(yè)并獲取網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,對(duì)網(wǎng)頁(yè)信息加以分析,從而得到網(wǎng)頁(yè)優(yōu)化的方法,進(jìn)而提高網(wǎng)頁(yè)瀏覽的速度。而其中搜索網(wǎng)頁(yè)的方法一般是通過(guò)手動(dòng)搜索網(wǎng)頁(yè),該手動(dòng)搜索網(wǎng)頁(yè)的過(guò)程包括:技術(shù)人員手動(dòng)填寫指定網(wǎng)頁(yè),并對(duì)其進(jìn)行訪問(wèn),每當(dāng)訪問(wèn)完成吋,繼續(xù)對(duì)其他指定網(wǎng)頁(yè)進(jìn)行訪問(wèn),在訪問(wèn)過(guò)程中獲取網(wǎng)頁(yè)信息,直到所有指定網(wǎng)頁(yè)訪問(wèn)完畢。
[0003]在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題:
[0004]手動(dòng)對(duì)指定網(wǎng)頁(yè)進(jìn)行捜索,在整個(gè)搜索過(guò)程中均需要技術(shù)人員參與,不僅搜索網(wǎng)頁(yè)的數(shù)量受到局限、效率低下,且成本高。
【發(fā)明內(nèi)容】
[0005]為了解決搜索網(wǎng)頁(yè)時(shí)數(shù)量受到局限、效率低下,成本高的問(wèn)題,本發(fā)明實(shí)施例提供了一種搜索網(wǎng)頁(yè)的方法和裝置。所述技術(shù)方案如下:
[0006]一種搜索網(wǎng)頁(yè)的方法,所述方法包括:
[0007]根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè);
[0008]獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息;
[0009]從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
[0010]根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之前包括:
[0011]獲取預(yù)先配置的捜索配置信息,所述搜索配置信息包括第一網(wǎng)頁(yè)地址;
[0012]和/或,
[0013]獲取提取到的所述第二網(wǎng)頁(yè)地址,將所述第二網(wǎng)頁(yè)地址作為所述第一網(wǎng)頁(yè)地址。
[0014]所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度;
[0015]相應(yīng)地,從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,之后包括:
[0016]當(dāng)所述第二網(wǎng)頁(yè)地址達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),結(jié)束;
[0017]當(dāng)所述第二網(wǎng)頁(yè)地址未達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),繼續(xù)執(zhí)行搜索網(wǎng)頁(yè)過(guò)程。
[0018]所述搜索配置信息還包括預(yù)設(shè)線程數(shù),所述預(yù)設(shè)線程數(shù)用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)數(shù)量;
[0019]相應(yīng)地,根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),包括:
[0020]根據(jù)所述捜索配置信息指示的符合所述預(yù)設(shè)線程數(shù)的多個(gè)第一網(wǎng)頁(yè)地址,同時(shí)訪問(wèn)所述多個(gè)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)。
[0021]所述搜索配置信息還包括日志配置信息,所述日志配置信息用于指示待保存的信息類型;[0022]相應(yīng)地,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,包括:
[0023]根據(jù)所述日志配置信息,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中符合所述日志配置信息的信息。
[0024]根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之后包括:
[0025]檢測(cè)所述搜索配置信息是否發(fā)生變化,當(dāng)所述搜索配置信息中的任ー項(xiàng)發(fā)生變化時(shí),根據(jù)變化后的捜索配置信息更新所述搜索配置信息。
[0026]所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型,
[0027]相應(yīng)地,從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,包括:
[0028]遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址;
[0029]從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。
[0030]獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,之后包括:
[0031]當(dāng)獲取到訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),判斷是否已保存過(guò)所述網(wǎng)頁(yè)信息,如果是,則丟棄所述網(wǎng)頁(yè)信息,如果否,則保存所述網(wǎng)頁(yè)信息。
[0032]所述網(wǎng)頁(yè)信息為所訪問(wèn)網(wǎng)頁(yè)的源代碼。
[0033]一種搜索網(wǎng)頁(yè)的裝置,所述裝置包括:
[0034]訪問(wèn)模塊,用于根據(jù)第一網(wǎng)頁(yè)地址訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè);
[0035]第一獲取模塊,用于獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息;
[0036]提取模塊,用于從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
[0037]所述裝置還包括:
[0038]第二獲取模塊,用于獲取預(yù)先配置的捜索配置信息,所述搜索配置信息包括第一網(wǎng)頁(yè)地址;
[0039]和/或,
[0040]第三獲取模塊,用于獲取提取到的所述第二網(wǎng)頁(yè)地址,將所述第二網(wǎng)頁(yè)地址作為所述第一網(wǎng)頁(yè)地址。
[0041]所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度;
[0042]相應(yīng)地,所述裝置還包括:
[0043]第一判斷模塊,用于判斷所述第二網(wǎng)頁(yè)地址是否達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度;
[0044]當(dāng)所述第二網(wǎng)頁(yè)地址達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度吋,結(jié)束;
[0045]當(dāng)所述第二網(wǎng)頁(yè)地址未達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),繼續(xù)執(zhí)行搜索網(wǎng)頁(yè)過(guò)程。
[0046]所述搜索配置信息還包括預(yù)設(shè)線程數(shù),所述預(yù)設(shè)線程數(shù)用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)
數(shù)量;
[0047]相應(yīng)地,所述訪問(wèn)模塊具體用于根據(jù)所述搜索配置信息指示的符合所述預(yù)設(shè)線程數(shù)的多個(gè)第一網(wǎng)頁(yè)地址,同時(shí)訪問(wèn)所述多個(gè)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)。
[0048]所述搜索配置信息還包括日志配置信息,所述日志配置信息用于指示待保存的信息類型;
[0049]相應(yīng)地,所述第一獲取模塊具體用于根據(jù)所述日志配置信息,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中符合所述日志配置信息的信息。
[0050]所述裝置還包括:
[0051]檢測(cè)模塊,用于檢測(cè)所述搜索配置信息是否發(fā)生變化,所述搜索配置信息中的任一項(xiàng)發(fā)生變化時(shí),則觸發(fā)用于根據(jù)變化后的捜索配置信息更新所述搜索配置信息的更新模塊。
[0052]所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型,
[0053]相應(yīng)地,所述提取模塊包括:
[0054]遍歷單元,用于遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址;
[0055]提取單元,用于從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。
[0056]所述裝置還包括:
[0057]第二判斷模塊,用于當(dāng)獲取到訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),判斷是否已保存過(guò)所述網(wǎng)頁(yè)信息;
[0058]處理模塊,用于根據(jù)所述第二判斷模塊判斷的結(jié)果處理所述網(wǎng)頁(yè)信息;
[0059]當(dāng)所述第二判斷模塊確定已經(jīng)保存過(guò)所述網(wǎng)頁(yè)信息,則觸發(fā)所述處理模塊丟棄所述網(wǎng)頁(yè)信息,當(dāng)所述判斷模塊確定未保存過(guò)所述網(wǎng)頁(yè)信息,則觸發(fā)所述處理模塊保存所述網(wǎng)頁(yè)信息。
[0060]所述網(wǎng)頁(yè)信息為所訪問(wèn)網(wǎng)頁(yè)的源代碼。
[0061]本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
[0062]通過(guò)根據(jù)已經(jīng)獲得的第一網(wǎng)頁(yè)地址,訪問(wèn)該第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),獲取到訪問(wèn)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,每個(gè)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中含有大量網(wǎng)頁(yè)地址信息,通過(guò)遍歷此網(wǎng)頁(yè)信息,從網(wǎng)頁(yè)信息中提取大量第二網(wǎng)頁(yè)地址,解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法捜索網(wǎng)頁(yè)的數(shù)量受到局限、效率低下的問(wèn)題,同時(shí)解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法成本高的問(wèn)題。
【專利附圖】
【附圖說(shuō)明】
[0063]為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0064]圖1是本發(fā)明實(shí)施例提供的一種搜索網(wǎng)頁(yè)的方法流程圖;
[0065]圖2是本發(fā)明實(shí)施例提供的一種搜索網(wǎng)頁(yè)的方法流程圖;
[0066]圖3是本發(fā)明實(shí)施例提供的一種搜索網(wǎng)頁(yè)的裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0067]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)ー步地詳細(xì)描述。
[0068]實(shí)施例一
[0069]圖1是本發(fā)明實(shí)施例提供的一種搜索網(wǎng)頁(yè)的方法的流程圖。該實(shí)施例的執(zhí)行主體為搜索網(wǎng)頁(yè)的裝置,該裝置可位于具有網(wǎng)絡(luò)功能的終端或服務(wù)器上,參見(jiàn)圖1,該實(shí)施例具體包括:
[0070]101、根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè);
[0071]102、獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息;[0072]103、從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
[0073]可選地,
[0074]根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之前包括:
[0075]獲取預(yù)先配置的捜索配置信息,所述搜索配置信息包括第一網(wǎng)頁(yè)地址;
[0076]和/或,
[0077]獲取提取到的所述第二網(wǎng)頁(yè)地址,將所述第二網(wǎng)頁(yè)地址作為所述第一網(wǎng)頁(yè)地址。
[0078]可選地,
[0079]所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度;
[0080]相應(yīng)地,從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,之后包括:
[0081]當(dāng)所述第二網(wǎng)頁(yè)地址達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),結(jié)束;
[0082]當(dāng)所述第二網(wǎng)頁(yè)地址未達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),繼續(xù)執(zhí)行搜索網(wǎng)頁(yè)過(guò)程。
[0083]可選地,
[0084]所述搜索配置信息還包括預(yù)設(shè)線程數(shù),所述預(yù)設(shè)線程數(shù)用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)
數(shù)量;
[0085]相應(yīng)地,根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),包括:
[0086]根據(jù)所述捜索配置信息指示的符合所述預(yù)設(shè)線程數(shù)的多個(gè)第一網(wǎng)頁(yè)地址,同時(shí)訪問(wèn)所述多個(gè)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)。
[0087]可選地,
[0088]所述搜索配置信息還包括日志配置信息,所述日志配置信息用于指示待保存的信息類型;
[0089]相應(yīng)地,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,包括:
[0090]根據(jù)所述日志配置信息,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中符合所述日志配置信息的信息。
[0091]可選地,
[0092]根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之后包括:
[0093]檢測(cè)所述搜索配置信息是否發(fā)生變化,當(dāng)所述搜索配置信息中的任ー項(xiàng)發(fā)生變化時(shí),根據(jù)變化后的捜索配置信息更新所述搜索配置信息。
[0094]可選地,
[0095]所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型,
[0096]相應(yīng)地,從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,包括:
[0097]遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址;
[0098]從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。
[0099]在本發(fā)明實(shí)施例中,通過(guò)根據(jù)已經(jīng)獲得的第一網(wǎng)頁(yè)地址,訪問(wèn)該第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),獲取到訪問(wèn)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,每個(gè)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中含有大量網(wǎng)頁(yè)地址信息,通過(guò)遍歷此網(wǎng)頁(yè)信息,從網(wǎng)頁(yè)信息中提取大量第二網(wǎng)頁(yè)地址,解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法捜索網(wǎng)頁(yè)的數(shù)量受到局限、效率低下的問(wèn)題,同時(shí)解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法成本高的問(wèn)題。
[0100]實(shí)施例ニ
[0101]圖2是本發(fā)明實(shí)施例提供的一種搜索網(wǎng)頁(yè)的方法的流程圖,該實(shí)施例的執(zhí)行主體為搜索網(wǎng)頁(yè)的裝置,該裝置可位于具有網(wǎng)絡(luò)功能的終端或服務(wù)器上,參見(jiàn)圖2,該實(shí)施例具體包括:
[0102]201:獲取預(yù)先配置的捜索配置信息,該搜索配置信息至少包括第一網(wǎng)頁(yè)地址;
[0103]在本實(shí)施例中,捜索配置信息的獲取可以有多種方式,包括但不限于下述兩種:
(1)為技術(shù)人員提供用于設(shè)置捜索配置信息的接ロ,由技術(shù)人員在操作過(guò)程中輸入數(shù)據(jù),當(dāng)該裝置接收到數(shù)據(jù)時(shí),將數(shù)據(jù)作為捜索配置信息。(2)該搜索配置信息還可以為技術(shù)人員在開(kāi)發(fā)該捜索功能的過(guò)程中設(shè)置的默認(rèn)搜索配置信息,每當(dāng)啟動(dòng)該搜索功能時(shí),即將該默認(rèn)搜索配置信息獲取為預(yù)先配置的搜索配置信息。
[0104]第一網(wǎng)頁(yè)地址是該捜索網(wǎng)頁(yè)過(guò)程開(kāi)始時(shí)所使用的網(wǎng)址,第一網(wǎng)頁(yè)地址可以是技術(shù)人員在操作過(guò)程中,通過(guò)為技術(shù)人員提供的用于設(shè)置捜索配置信息的接ロ,輸入網(wǎng)頁(yè)的網(wǎng)址,該裝置通過(guò)接ロ接收到網(wǎng)頁(yè)的網(wǎng)址后,將該接收到的網(wǎng)頁(yè)的網(wǎng)址作為第一網(wǎng)頁(yè)地址;該第一網(wǎng)頁(yè)地址也可以是技術(shù)人員在開(kāi)發(fā)該捜索功能的過(guò)程中設(shè)置的,例如:技術(shù)人員在開(kāi)發(fā)該搜索功能的過(guò)程中,將第一網(wǎng)頁(yè)地址設(shè)置為WWW.a.com,姆當(dāng)啟動(dòng)該搜索功能時(shí),獲取預(yù)先配置的搜索配置信息,該搜索配置信息包含第一網(wǎng)頁(yè)地址www.a.com。
[0105]需要說(shuō)明的是,該搜索配置信息至少包括兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址,也即是,在該搜索網(wǎng)頁(yè)過(guò)程開(kāi)始時(shí)所使用的第一網(wǎng)頁(yè)地址可以是ー個(gè),還可以是兩個(gè)或兩個(gè)以上,本發(fā)明對(duì)此不做具體限定。
[0106]本領(lǐng)域技術(shù)人員可以獲知,當(dāng)用戶有搜索網(wǎng)頁(yè)的需求時(shí),啟動(dòng)捜索網(wǎng)頁(yè)功能,步驟201即為該捜索網(wǎng)頁(yè)過(guò)程的第一歩。
[0107]202、根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè);
[0108]本領(lǐng)域技術(shù)人員可以獲知,根據(jù)網(wǎng)頁(yè)地址訪問(wèn)所指示的網(wǎng)頁(yè)是現(xiàn)有技術(shù),在本發(fā)明中不做贅述。
[0109]進(jìn)ー步地,捜索配置信息還包括預(yù)設(shè)線程數(shù),預(yù)設(shè)線程數(shù)是用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)數(shù)量,其中,該預(yù)設(shè)線程數(shù)由技術(shù)人員進(jìn)行設(shè)置或調(diào)整,本發(fā)明實(shí)施例對(duì)此不做具體限定。
[0110]相應(yīng)地,步驟202具體包括:當(dāng)捜索配置信息包括兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址時(shí),終端同時(shí)訪問(wèn)兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址中符合預(yù)設(shè)線程數(shù)所指示的網(wǎng)頁(yè)。
[0111]例如,當(dāng)捜索配置信息包括的預(yù)設(shè)線程數(shù)為10,則當(dāng)搜索配置信息包括兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址時(shí),終端同時(shí)對(duì)兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址中10個(gè)地址所指示的網(wǎng)頁(yè)進(jìn)行訪問(wèn)。
[0112]進(jìn)ー步地,終端記錄每次捜索網(wǎng)頁(yè)過(guò)程時(shí)所使用的線程數(shù)及該次搜索網(wǎng)頁(yè)過(guò)程的捜索速度,根據(jù)線程數(shù)和捜索速度進(jìn)行分析,獲取使得捜索網(wǎng)頁(yè)過(guò)程捜索速度最快、效果最好的線程數(shù)作為最優(yōu)線程數(shù),在后續(xù)的搜索過(guò)程中,可應(yīng)用該最優(yōu)線程數(shù),以使搜索網(wǎng)頁(yè)的效率大大提尚。
[0113]203、獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息;
[0114]其中,網(wǎng)頁(yè)信息是指當(dāng)前坊問(wèn)網(wǎng)頁(yè)的源代碼。源代碼(source code)是指未編譯的按照一定的程序設(shè)計(jì)語(yǔ)言規(guī)范書寫的文本文件。在對(duì)網(wǎng)頁(yè)進(jìn)行訪問(wèn)時(shí),獲取該網(wǎng)頁(yè)的源代碼。
[0115]進(jìn)ー步地,當(dāng)獲取到訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),獲取該網(wǎng)頁(yè)的URL(UniversalResource Locator,統(tǒng)ー資源定位符),相應(yīng)地,當(dāng)獲取到訪問(wèn)的網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),判斷是否保存過(guò)該網(wǎng)頁(yè)的網(wǎng)頁(yè)信息。具體地,,判斷是否保存過(guò)該網(wǎng)頁(yè)的網(wǎng)頁(yè)信息包括:判斷是否保存過(guò)該網(wǎng)頁(yè)的URL,如果是,則認(rèn)為保存過(guò)該網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,丟棄(或不保存)獲取到的所述網(wǎng)頁(yè)信息;如果否,則認(rèn)為未保存過(guò)該網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,保存獲取到的所述網(wǎng)頁(yè)信息。需要說(shuō)明的是,由于每個(gè)網(wǎng)頁(yè)的URL具有唯一性,即ー個(gè)網(wǎng)頁(yè)對(duì)應(yīng)ー個(gè)唯一的URL,因此可將網(wǎng)頁(yè)的URL作為判斷是否已保存過(guò)該網(wǎng)頁(yè)的網(wǎng)頁(yè)信息的條件。
[0116]當(dāng)捜索配置信息包括兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址時(shí),分別獲取所訪問(wèn)的兩個(gè)或兩個(gè)以上第一網(wǎng)頁(yè)地址中每ー個(gè)第一網(wǎng)頁(yè)地址所指示網(wǎng)頁(yè)的網(wǎng)頁(yè)信息。
[0117]進(jìn)ー步地,捜索配置信息還包括日志配置信息,日志配置信息用于指示保存的信息類型,該日志配置信息可以由技術(shù)人員進(jìn)行設(shè)置和調(diào)整,本發(fā)明實(shí)施例對(duì)此不做具體限定。由于每個(gè)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息很多,終端僅對(duì)獲取到的網(wǎng)頁(yè)信息中符合日志配置信息所指示的信息類型的信息進(jìn)行保存,達(dá)到了有針對(duì)性保存信息,并節(jié)約了存儲(chǔ)空間。
[0118]204、從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址;
[0119]具體地,該步驟204包括:遍歷該網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,在遍歷過(guò)程中從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
[0120]其中,在遍歷過(guò)程中從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,具體包括:提取獲取到的源代碼中的超文本引用外部鏈接中的網(wǎng)頁(yè)地址,將超文本引用外部鏈接中的網(wǎng)頁(yè)地址作為第二網(wǎng)頁(yè)地址。本領(lǐng)域技術(shù)人員可以獲知,該超文本引用外部鏈接是指〈a href =〃URL〃>name</a>。
[0121]進(jìn)ー步地,所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型,該預(yù)設(shè)網(wǎng)頁(yè)類型用于指示該次捜索的目標(biāo)網(wǎng)頁(yè)類型,該預(yù)設(shè)網(wǎng)頁(yè)類型可以根據(jù)網(wǎng)頁(yè)鏈接的后綴區(qū)分,如后綴為CSS,jsp, pngo
[0122]相應(yīng)地,該步驟204包括:根據(jù)預(yù)設(shè)網(wǎng)頁(yè)類型,遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址;從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。例如,當(dāng)用戶需要對(duì)后綴為CSS的網(wǎng)頁(yè)進(jìn)行搜索時(shí),可將網(wǎng)頁(yè)類型預(yù)設(shè)為CSS,根據(jù)預(yù)設(shè)網(wǎng)頁(yè)類型,遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址;從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取后綴為CSS的第二網(wǎng)頁(yè)地址。
[0123]進(jìn)ー步地,捜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度,其中,該網(wǎng)頁(yè)深度為網(wǎng)站域名的級(jí)另IJ,該級(jí)別可以包括一級(jí)網(wǎng)頁(yè)、ニ級(jí)網(wǎng)頁(yè)、三級(jí)網(wǎng)頁(yè)等等。
[0124]例如:登錄首頁(yè)為www.a.com/的網(wǎng)頁(yè),在首頁(yè)里有很多子網(wǎng)頁(yè)可供選擇,其中“視頻”網(wǎng)頁(yè)的網(wǎng)址為V.a.com/,則定義此“視頻”網(wǎng)頁(yè)為一級(jí)網(wǎng)頁(yè);在“視頻”網(wǎng)頁(yè)里按分類索引有“電影”、“電視劇”、“動(dòng)漫”、“綜藝”等,其中“電影”網(wǎng)頁(yè)的網(wǎng)址為V.a.com/movie/index, html/,則定義此“電影”網(wǎng)頁(yè)為ニ級(jí)網(wǎng)頁(yè);在“電影”網(wǎng)頁(yè)里按類型索引有“動(dòng)作”、“喜劇”、“愛(ài)情”等,其中“動(dòng)作”網(wǎng)頁(yè)的網(wǎng)址為 V.a.com/list2/l_0_-l_-l_l_0_0_20_-l_-l.html/,則定義此“動(dòng)作”網(wǎng)頁(yè)為三級(jí)網(wǎng)頁(yè),依次類推;
[0125]在所述網(wǎng)頁(yè)信息中提取到第二網(wǎng)頁(yè)地址之后,該實(shí)施例還包括:判斷該第二網(wǎng)頁(yè)地址的網(wǎng)頁(yè)深度是否達(dá)到捜索配置信息所包括的預(yù)設(shè)網(wǎng)頁(yè)深度;當(dāng)?shù)诙W(wǎng)頁(yè)地址達(dá)到捜索配置信息里的網(wǎng)頁(yè)深度吋,則結(jié)束捜索網(wǎng)頁(yè)過(guò)程;當(dāng)?shù)诙W(wǎng)頁(yè)地址未達(dá)到捜索配置信息里的網(wǎng)頁(yè)深度吋,則繼續(xù)搜索網(wǎng)頁(yè)過(guò)程。[0126]例如,捜索配置信息所包括的預(yù)設(shè)網(wǎng)頁(yè)深度為ー級(jí)網(wǎng)頁(yè),比如捜索到的首頁(yè)為WWW.b.com,則首頁(yè)所包括的所有子網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)均為ー級(jí)網(wǎng)頁(yè),當(dāng)提取到的第二網(wǎng)頁(yè)地址已經(jīng)包括了所有的ー級(jí)網(wǎng)頁(yè)時(shí),則認(rèn)為該第二網(wǎng)頁(yè)地址的網(wǎng)頁(yè)深度達(dá)到了捜索配置信息所包括的預(yù)設(shè)網(wǎng)頁(yè)深度。
[0127]需要說(shuō)明的是,由于每個(gè)網(wǎng)頁(yè)所含有的網(wǎng)頁(yè)信息都不同,因此網(wǎng)頁(yè)信息中所包含的第二網(wǎng)頁(yè)地址也就不同,因此需要對(duì)各個(gè)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息分別進(jìn)行提取。
[0128]205:把第二網(wǎng)頁(yè)地址作為第一網(wǎng)頁(yè)地址,并執(zhí)行202 ;
[0129]通過(guò)把第二網(wǎng)頁(yè)地址作為第一網(wǎng)頁(yè)地址,并執(zhí)行202,以達(dá)到循環(huán)往復(fù)的搜索網(wǎng)頁(yè),直到第二網(wǎng)頁(yè)地址達(dá)到捜索配置信息的網(wǎng)頁(yè)深度,則搜索結(jié)束,因而達(dá)到了捜索大量網(wǎng)頁(yè)的目的,使得網(wǎng)頁(yè)搜索可以持續(xù)進(jìn)行,井根據(jù)已得到的第二網(wǎng)頁(yè)地址獲取到更多的網(wǎng)頁(yè);
[0130]進(jìn)ー步地,該實(shí)施例還包括:實(shí)時(shí)檢測(cè)搜索配置信息是否發(fā)生變化,當(dāng)在捜索網(wǎng)頁(yè)的過(guò)程中,檢測(cè)到捜索配置信息的任一項(xiàng)發(fā)生變化時(shí),則更新所述搜索配置信息。其中,搜索配置信息具體包括第一網(wǎng)頁(yè)地址、預(yù)設(shè)線程數(shù)、日志配置信息、網(wǎng)頁(yè)類型和網(wǎng)頁(yè)深度中的任ー項(xiàng)或幾項(xiàng),
[0131]例如:檢測(cè)到捜索配置信息中的第一網(wǎng)頁(yè)地址發(fā)生變化,則在步驟202中,根據(jù)變化后的第一網(wǎng)頁(yè)地址訪問(wèn)該所述變化后的第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之后再繼續(xù)進(jìn)行后續(xù)步驟;又如,在步驟202之前,檢測(cè)到捜索配置信息中的預(yù)設(shè)線程數(shù)發(fā)生變化,則步驟202中,終端同時(shí)訪問(wèn)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)的數(shù)量要根據(jù)變化后的預(yù)設(shè)線程數(shù)進(jìn)行同時(shí)訪問(wèn),之后再繼續(xù)進(jìn)行后續(xù)步驟;又如,在步驟203之前,檢測(cè)到捜索配置信息中的日志配置信息發(fā)生變化,則步驟203中,保存的網(wǎng)頁(yè)信息要根據(jù)變化后的日志配置信息進(jìn)行保存,之后再繼續(xù)進(jìn)行后續(xù)步驟;又如,在步驟204之前,檢測(cè)到捜索配置信息中的網(wǎng)頁(yè)類型發(fā)生變化,則步驟204中,從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取的第二網(wǎng)頁(yè)地址要根據(jù)變化后的網(wǎng)頁(yè)類型進(jìn)行提取,之后再繼續(xù)進(jìn)行后續(xù)步驟;再如,在步驟204之前,檢測(cè)到捜索配置信息中的網(wǎng)頁(yè)深度發(fā)生變化,則步驟204中,第二網(wǎng)頁(yè)地址要達(dá)到變化后的網(wǎng)頁(yè)深度,之后再繼續(xù)進(jìn)行后續(xù)步驟。
[0132]進(jìn)ー步地,該步驟205之后,還包括:
[0133]根據(jù)獲取的網(wǎng)頁(yè)信息,對(duì)網(wǎng)頁(yè)信息進(jìn)行分析,從而可以獲知網(wǎng)頁(yè)信息的中各個(gè)類型信息的數(shù)據(jù)量,井根據(jù)訪問(wèn)需要以及各個(gè)類型信息的數(shù)據(jù)量對(duì)網(wǎng)頁(yè)瀏覽方法進(jìn)行設(shè)置和調(diào)整,可以優(yōu)化網(wǎng)頁(yè),提高網(wǎng)頁(yè)瀏覽的速度。
[0134]在本發(fā)明實(shí)施例中,通過(guò)根據(jù)已經(jīng)獲得的第一網(wǎng)頁(yè)地址,訪問(wèn)該第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),獲取到訪問(wèn)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,每個(gè)網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中含有大量網(wǎng)頁(yè)地址信息,通過(guò)遍歷此網(wǎng)頁(yè)信息,從網(wǎng)頁(yè)信息中提取大量第二網(wǎng)頁(yè)地址,解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法捜索網(wǎng)頁(yè)的數(shù)量受到局限、效率低下的問(wèn)題,同時(shí)解決了現(xiàn)有技術(shù)中手動(dòng)搜索網(wǎng)頁(yè)方法成本高的問(wèn)題。進(jìn)ー步地,從網(wǎng)頁(yè)信息中提取大量第二網(wǎng)頁(yè)地址后,把第二網(wǎng)頁(yè)地址作為第一網(wǎng)頁(yè)地址,再繼續(xù)訪問(wèn)第一網(wǎng)頁(yè)地址所指示的網(wǎng)頁(yè),使得對(duì)網(wǎng)頁(yè)的捜索可以循環(huán)往復(fù)。
[0135]實(shí)施例三
[0136]圖3是本發(fā)明實(shí)施例提供的一種搜索網(wǎng)頁(yè)的裝置結(jié)構(gòu)示意圖,參見(jiàn)圖3,該裝置包括:
[0137]訪問(wèn)模塊301,用于根據(jù)第一網(wǎng)頁(yè)地址訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè);
[0138]第一獲取模塊302,用于獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息;
[0139]提取模塊303,用于從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
[0140]可選地,所述裝置還包括:
[0141]第二獲取模塊304,用于獲取預(yù)先配置的捜索配置信息,所述搜索配置信息包括第ー網(wǎng)頁(yè)地址;
[0142]和/或,
[0143]第三獲取模塊305,用于獲取提取到的所述第二網(wǎng)頁(yè)地址,將所述第二網(wǎng)頁(yè)地址作為所述第一網(wǎng)頁(yè)地址。
[0144]可選地,所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度;
[0145]相應(yīng)地,所述裝置還包括:
[0146]第一判斷模塊306,用于判斷所述第二網(wǎng)頁(yè)地址是否達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度;
[0147]當(dāng)所述第二網(wǎng)頁(yè)地址達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度吋,結(jié)束;
[0148]當(dāng)所述第二網(wǎng)頁(yè)地址未達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),繼續(xù)執(zhí)行搜索網(wǎng)頁(yè)過(guò)程。
[0149]可選地,所述搜索配置信息還包括預(yù)設(shè)線程數(shù),所述預(yù)設(shè)線程數(shù)用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)數(shù)量;
[0150]相應(yīng)地,所述訪問(wèn)模塊301具體用于根據(jù)所述搜索配置信息指示的符合所述預(yù)設(shè)線程數(shù)的多個(gè)第一網(wǎng)頁(yè)地址,同時(shí)訪問(wèn)所述多個(gè)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)。
[0151 ] 可選地,所述搜索配置信息還包括日志配置信息,所述日志配置信息用于指示待保存的信息類型;
[0152]相應(yīng)地,所述第一獲取模塊302具體用于根據(jù)所述日志配置信息,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中符合所述日志配置信息的信息。
[0153]可選地,所述裝置還包括:
[0154]檢測(cè)模塊307,用于檢測(cè)所述搜索配置信息是否發(fā)生變化,所述搜索配置信息中的任一項(xiàng)發(fā)生變化時(shí),則觸發(fā)用于根據(jù)變化后的捜索配置信息更新所述搜索配置信息的更新模塊308。
[0155]可選地,所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型,
[0156]相應(yīng)地,所述提取模塊303包括:
[0157]遍歷單元,用于遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址;
[0158]提取單元,用于從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。
[0159]可選地,所述裝置還包括:
[0160]第二判斷模塊309,用于當(dāng)獲取到訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),判斷是否已保存過(guò)所述網(wǎng)頁(yè)信息;
[0161]處理模塊310,用于根據(jù)所述第二判斷模塊判斷的結(jié)果處理所述網(wǎng)頁(yè)信息;
[0162]當(dāng)所述第二判斷模塊309確定已經(jīng)保存過(guò)所述網(wǎng)頁(yè)信息,則觸發(fā)所述處理模塊310丟棄所述網(wǎng)頁(yè)信息,當(dāng)所述第二判斷模塊309確定未保存過(guò)所述網(wǎng)頁(yè)信息,則觸發(fā)所述處理模塊310保存所述網(wǎng)頁(yè)信息。[0163]可選地,所述網(wǎng)頁(yè)信息為所訪問(wèn)網(wǎng)頁(yè)的源代碼。
[0164]需要說(shuō)明的是:上述實(shí)施例提供的捜索網(wǎng)頁(yè)的裝置在捜索網(wǎng)頁(yè)時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說(shuō)明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的一種搜索網(wǎng)頁(yè)的方法和一種搜索網(wǎng)頁(yè)的裝置實(shí)施例屬于同ー構(gòu)思,其具體實(shí)現(xiàn)過(guò)程詳見(jiàn)方法實(shí)施例,這里不再贅述。
[0165]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
[0166]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于ー種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
[0167]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種搜索網(wǎng)頁(yè)的方法,其特征在于,所述方法包括: 根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè); 獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息; 從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之前包括: 獲取預(yù)先配置的捜索配置信息,所述搜索配置信息包括第一網(wǎng)頁(yè)地址; 和/或, 獲取提取到的所述第二網(wǎng)頁(yè)地址,將所述第二網(wǎng)頁(yè)地址作為所述第一網(wǎng)頁(yè)地址。
3.根據(jù)權(quán)利要求2所述的方法,其特征在干, 所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度; 相應(yīng)地,從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,之后包括: 當(dāng)所述第二網(wǎng)頁(yè)地址達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),結(jié)束; 當(dāng)所述第二網(wǎng)頁(yè)地址未達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),繼續(xù)執(zhí)行搜索網(wǎng)頁(yè)過(guò)程。
4.根據(jù)權(quán)利要求2所述的方法,其特征在干,` 所述搜索配置信息還包括預(yù)設(shè)線程數(shù),所述預(yù)設(shè)線程數(shù)用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)數(shù)量; 相應(yīng)地,根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),包括: 根據(jù)所述捜索配置信息指示的符合所述預(yù)設(shè)線程數(shù)的多個(gè)第一網(wǎng)頁(yè)地址,同時(shí)訪問(wèn)所述多個(gè)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)。
5.根據(jù)權(quán)利要求2所述的方法,其特征在干, 所述搜索配置信息還包括日志配置信息,所述日志配置信息用于指示待保存的信息類型; 相應(yīng)地,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,包括: 根據(jù)所述日志配置信息,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中符合所述日志配置信息的信息。
6.根據(jù)權(quán)利要求2-5任一項(xiàng)所述的方法,其特征在于,根據(jù)第一網(wǎng)頁(yè)地址,訪問(wèn)所述第ー網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè),之后包括: 檢測(cè)所述搜索配置信息是否發(fā)生變化,當(dāng)所述搜索配置信息中的任ー項(xiàng)發(fā)生變化吋,根據(jù)變化后的捜索配置信息更新所述搜索配置信息。
7.根據(jù)權(quán)利要求1所述的方法,其特征在干, 所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型, 相應(yīng)地,從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址,包括: 遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址; 從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息,之后包括: 當(dāng)獲取到訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),判斷是否已保存過(guò)所述網(wǎng)頁(yè)信息,如果是,則丟棄所述網(wǎng)頁(yè)信息,如果否,則保存所述網(wǎng)頁(yè)信息。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述網(wǎng)頁(yè)信息為所訪問(wèn)網(wǎng)頁(yè)的源代碼。
10.一種搜索網(wǎng)頁(yè)的裝置,其特征在于,所述裝置包括: 訪問(wèn)模塊,用于根據(jù)第一網(wǎng)頁(yè)地址訪問(wèn)所述第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè); 第一獲取模塊,用于獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息; 提取模塊,用于從所述網(wǎng)頁(yè)信息中提取第二網(wǎng)頁(yè)地址。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括: 第二獲取模塊,用于獲取預(yù)先配置的捜索配置信息,所述搜索配置信息包括第一網(wǎng)頁(yè)地址; 和/或, 第三獲取模塊,用于獲取提取到的所述第二網(wǎng)頁(yè)地址,將所述第二網(wǎng)頁(yè)地址作為所述第一網(wǎng)頁(yè)地址。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在干, 所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)深度; 相應(yīng)地,所述裝置還包 括: 第一判斷模塊,用于判斷所述第二網(wǎng)頁(yè)地址是否達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度; 當(dāng)所述第二網(wǎng)頁(yè)地址達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),結(jié)束; 當(dāng)所述第二網(wǎng)頁(yè)地址未達(dá)到所述預(yù)設(shè)網(wǎng)頁(yè)深度時(shí),繼續(xù)執(zhí)行搜索網(wǎng)頁(yè)過(guò)程。
13.根據(jù)權(quán)利要求11所述的裝置,其特征在干, 所述搜索配置信息還包括預(yù)設(shè)線程數(shù),所述預(yù)設(shè)線程數(shù)用于指示同時(shí)訪問(wèn)的網(wǎng)頁(yè)數(shù)量; 相應(yīng)地,所述訪問(wèn)模塊具體用于根據(jù)所述搜索配置信息指示的符合所述預(yù)設(shè)線程數(shù)的多個(gè)第一網(wǎng)頁(yè)地址,同時(shí)訪問(wèn)所述多個(gè)第一網(wǎng)頁(yè)地址指示的網(wǎng)頁(yè)。
14.根據(jù)權(quán)利要求11所述的裝置,其特征在干, 所述搜索配置信息還包括日志配置信息,所述日志配置信息用于指示待保存的信息類型; 相應(yīng)地,所述第一獲取模塊具體用于根據(jù)所述日志配置信息,獲取訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息中符合所述日志配置信息的信息。
15.根據(jù)權(quán)利要求11-14任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括: 檢測(cè)模塊,用于檢測(cè)所述搜索配置信息是否發(fā)生變化,所述搜索配置信息中的任ー項(xiàng)發(fā)生變化時(shí),則觸發(fā)用于根據(jù)變化后的捜索配置信息更新所述搜索配置信息的更新模塊。
16.根據(jù)權(quán)利要求11所述的裝置,其特征在干, 所述搜索配置信息還包括預(yù)設(shè)網(wǎng)頁(yè)類型, 相應(yīng)地,所述提取模塊包括: 遍歷單元,用于遍歷所述網(wǎng)頁(yè)信息中的網(wǎng)頁(yè)地址; 提取單元,用于從所述網(wǎng)頁(yè)信息的網(wǎng)頁(yè)地址中提取符合所述預(yù)設(shè)網(wǎng)頁(yè)類型的第二網(wǎng)頁(yè)地址。
17.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括: 第二判斷模塊,用于當(dāng)獲取到訪問(wèn)的所述網(wǎng)頁(yè)的網(wǎng)頁(yè)信息時(shí),判斷是否已保存過(guò)所述網(wǎng)頁(yè)信息;處理模塊,用于根據(jù)所述第二判斷模塊判斷的結(jié)果處理所述網(wǎng)頁(yè)信息; 當(dāng)所述第二判斷模塊確定已經(jīng)保存過(guò)所述網(wǎng)頁(yè)信息,則觸發(fā)所述處理模塊丟棄所述網(wǎng)頁(yè)信息,當(dāng)所述第二判斷模塊確定未保存過(guò)所述網(wǎng)頁(yè)信息,則觸發(fā)所述處理模塊保存所述網(wǎng)頁(yè)信息。
18.根據(jù)權(quán)利要求10 所述的裝置,其特征在于,所述網(wǎng)頁(yè)信息為所訪問(wèn)網(wǎng)頁(yè)的源代碼。
【文檔編號(hào)】G06F17/30GK103455492SQ201210171234
【公開(kāi)日】2013年12月18日 申請(qǐng)日期:2012年5月29日 優(yōu)先權(quán)日:2012年5月29日
【發(fā)明者】袁建發(fā), 廖志, 葉方正, 寧京, 王偉, 郭宗飛, 李潔 申請(qǐng)人:騰訊科技(深圳)有限公司