两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種電話號(hào)碼識(shí)別方法及裝置與流程

文檔序號(hào):12068418閱讀:610來源:國(guó)知局
一種電話號(hào)碼識(shí)別方法及裝置與流程

本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種電話號(hào)碼識(shí)別方法及裝置。



背景技術(shù):

隨著通信技術(shù)的快速發(fā)展,詐騙電話犯罪呈高發(fā)態(tài)勢(shì),對(duì)詐騙電話進(jìn)行識(shí)別并提示用戶,可在一定程度上減少用戶的損失。傳統(tǒng)的詐騙電話的識(shí)別方法為:當(dāng)通話結(jié)束時(shí)提示用戶對(duì)來電進(jìn)行標(biāo)記(例如用戶可以將來電標(biāo)記為詐騙電話或廣告推銷等),存儲(chǔ)電話號(hào)碼及其對(duì)應(yīng)的標(biāo)記信息,當(dāng)將該電話號(hào)碼標(biāo)記為詐騙電話的用戶量達(dá)到預(yù)設(shè)閾值時(shí),將該電話號(hào)碼識(shí)別為詐騙電話,用戶在接聽該電話號(hào)碼時(shí)提示用戶該電話號(hào)碼為詐騙電話。傳統(tǒng)的詐騙電話的識(shí)別方法中用戶對(duì)來電的標(biāo)記行為比較主觀,以此為依據(jù)識(shí)別電話號(hào)碼為詐騙電話的準(zhǔn)確率較低。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例所要解決的技術(shù)問題在于,提供一種電話號(hào)碼識(shí)別方法及裝置,可提高電話號(hào)碼識(shí)別的精準(zhǔn)度。

為了解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種電話號(hào)碼識(shí)別方法,包括:

對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,所述網(wǎng)頁(yè)包括電話號(hào)碼和文本信息;

對(duì)所述電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息;

對(duì)所述電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息;

根據(jù)所述第一特征信息和所述第二特征信息,識(shí)別所述電話號(hào)碼的號(hào)碼類型。

相應(yīng)地,本發(fā)明實(shí)施例還提供了一種電話號(hào)碼識(shí)別裝置,包括:

內(nèi)容解析單元,用于對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì) 應(yīng)的文本信息,所述網(wǎng)頁(yè)包括電話號(hào)碼和文本信息;

特征提取單元,用于對(duì)所述電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息;

所述特征提取單元,還用于對(duì)所述電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息;

號(hào)碼類型識(shí)別單元,用于根據(jù)所述第一特征信息和所述第二特征信息,識(shí)別所述電話號(hào)碼的號(hào)碼類型。

實(shí)施本發(fā)明實(shí)施例,通過對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息,對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息,根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型,相對(duì)傳統(tǒng)的電話號(hào)碼識(shí)別方法統(tǒng)計(jì)將電話號(hào)碼標(biāo)記為指定類型的用戶量,當(dāng)用戶量大于預(yù)設(shè)閾值時(shí)將該電話號(hào)碼識(shí)別為指定類型,本發(fā)明實(shí)施例可基于至少兩個(gè)維度識(shí)別電話號(hào)碼的號(hào)碼類型,可提高電話號(hào)碼識(shí)別的精準(zhǔn)度。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖;

圖1是本發(fā)明實(shí)施例中提供的一種電話號(hào)碼識(shí)別方法的流程示意圖;

圖2是本發(fā)明實(shí)施例中提供的一種電話號(hào)碼識(shí)別系統(tǒng)的框架示意圖;

圖3是本發(fā)明實(shí)施例中提供的另一種電話號(hào)碼識(shí)別方法的流程示意圖;

圖4是本發(fā)明實(shí)施例中提供的另一種電話號(hào)碼識(shí)別方法的流程示意圖;

圖5是本發(fā)明實(shí)施例中提供的一種電話號(hào)碼識(shí)別裝置的結(jié)構(gòu)示意圖;

圖6是本發(fā)明實(shí)施例中提供的一種終端的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是 全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

上述電話號(hào)碼識(shí)別方法可以運(yùn)行在安全服務(wù)器中,例如手機(jī)管家服務(wù)器、360衛(wèi)士服務(wù)器或者搜狗號(hào)碼通服務(wù)器等。其中,手機(jī)管家客戶端與手機(jī)管家服務(wù)器相對(duì)應(yīng),手機(jī)管家客戶端可以安裝在手機(jī)中;360衛(wèi)士服務(wù)器與360衛(wèi)士客戶端相對(duì)應(yīng),360衛(wèi)士客戶端可以安裝在手機(jī)、電腦或者個(gè)人計(jì)算機(jī)(Personal Computer,PC)等終端中,搜狗號(hào)碼通服務(wù)器與搜狗號(hào)碼通客戶端相對(duì)應(yīng),搜狗號(hào)碼通客戶端可以安裝在手機(jī)、電腦或者個(gè)人計(jì)算機(jī)等終端中。

請(qǐng)參見圖1,圖1是本發(fā)明實(shí)施例公開的一種電話號(hào)碼識(shí)別方法的流程示意圖。如圖1所示,該電話號(hào)碼識(shí)別方法可以包括以下步驟:

S101,對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,網(wǎng)頁(yè)包括電話號(hào)碼和文本信息。

安全服務(wù)器可以對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。其中,網(wǎng)頁(yè)可以包括電話號(hào)碼和文本信息,示例性的,預(yù)設(shè)網(wǎng)頁(yè)可以為瀏覽器頁(yè)面、微博頁(yè)面或者微信頁(yè)面等。

在可選實(shí)施例中,安全服務(wù)器可以根據(jù)第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第一關(guān)鍵字,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè),對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。具體實(shí)現(xiàn)中,安全服務(wù)器可以搜索包含第一關(guān)鍵字的網(wǎng)頁(yè),或者搜索與第一關(guān)鍵字關(guān)聯(lián)的網(wǎng)頁(yè),安全服務(wù)器可以對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,獲取網(wǎng)頁(yè)中的電話號(hào)碼和文本信息,安全服務(wù)器還可以建立電話號(hào)碼和文本信息之間的對(duì)應(yīng)關(guān)系,并存儲(chǔ)電話號(hào)碼及其對(duì)應(yīng)的文本信息。進(jìn)一步的,當(dāng)該網(wǎng)頁(yè)包含多個(gè)電話號(hào)碼時(shí),安全服務(wù)器可以獲取該網(wǎng)頁(yè)中的所有文本信息,建立不同電話號(hào)碼和該網(wǎng)頁(yè)中的所有文本信息的對(duì)應(yīng)關(guān)系,存儲(chǔ)各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。

研究表明,用戶通過互聯(lián)網(wǎng)可以搜索并獲取到各種各樣的內(nèi)容,但是各種虛假、詐騙信息也被廣泛傳播,例如用戶通過搜索引擎輸入搜索詞“支付寶人工客服電話”,響應(yīng)該搜索詞以顯示的網(wǎng)頁(yè)中可能包含假冒的支付寶人工客服電話,用戶撥打假冒的支付寶人工客服電話,將會(huì)存在風(fēng)險(xiǎn),導(dǎo)致被騙取財(cái)物或者個(gè)人信息等。對(duì)此,安全服務(wù)器可以預(yù)先建立第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù),第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)可以包括至少一個(gè)第一關(guān)鍵字。安全服務(wù)器搜索與第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù) 中的第一關(guān)鍵字匹配的網(wǎng)頁(yè),并對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。其中第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)所包含的第一關(guān)鍵字可以為:客服、熱線、電話或者號(hào)碼等。本發(fā)明實(shí)施例對(duì)與第一關(guān)鍵字匹配的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,無需對(duì)任一網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,可提高資源利用率。

在可選實(shí)施例中,當(dāng)用戶通過安全客戶端將呼入的電話號(hào)碼標(biāo)記為指定類型時(shí),安全客戶端可以將該電話號(hào)碼發(fā)送給安全服務(wù)器,安全服務(wù)器通過互聯(lián)網(wǎng)獲取包含該電話號(hào)碼的網(wǎng)頁(yè),對(duì)獲取到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到該電話號(hào)碼及其對(duì)應(yīng)的文本信息。

S102,對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息。

安全服務(wù)器獲取到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息之后,針對(duì)任一電話號(hào)碼,安全服務(wù)器可以對(duì)該電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息。

在可選實(shí)施例中,第一特征信息包括以下至少一項(xiàng):獲取電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù),檢測(cè)電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同,統(tǒng)計(jì)用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例,統(tǒng)計(jì)用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。

具體實(shí)現(xiàn)中,安全服務(wù)器可以通過安全客戶端統(tǒng)計(jì)預(yù)設(shè)時(shí)間段內(nèi)不同終端與該電話號(hào)碼進(jìn)行通話的通話次數(shù),將統(tǒng)計(jì)得到的不同終端與該電話號(hào)碼進(jìn)行通話的通話次數(shù)總和作為該電話號(hào)碼通話在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù)。其中,預(yù)設(shè)時(shí)間段為預(yù)先設(shè)置的時(shí)間間隔,例如最近一個(gè)月的時(shí)間段內(nèi)等。示例性的,有三個(gè)終端安裝安全客戶端,則安全客戶端的用戶量為3人,安全客戶端統(tǒng)計(jì)得到第一終端在最近一個(gè)月內(nèi)與該電話號(hào)碼進(jìn)行通話的通話次數(shù)為15次,第二終端在最近一個(gè)月內(nèi)與該電話號(hào)碼進(jìn)行通話的通話次數(shù)為3次,第三終端在最近一個(gè)月內(nèi)與該電話號(hào)碼進(jìn)行通話的通話次數(shù)為10次,安全客戶端將不同終端在最近一個(gè)月內(nèi)與該電話號(hào)碼進(jìn)行通話的通話次數(shù)發(fā)送給安全服務(wù)器,則安全服務(wù)器可以確定該電話號(hào)碼在最近一個(gè)月內(nèi)的通話次數(shù)為28次。

安全服務(wù)器可以預(yù)先建立號(hào)碼數(shù)據(jù)庫(kù),判斷該電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同。其中,號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼可以為政府部門、公檢法機(jī)關(guān)、企業(yè)黃頁(yè)或者知名客服等的電話號(hào)碼??蛇x的,安全服務(wù)器可以預(yù)先建 立第一號(hào)碼數(shù)據(jù)庫(kù)和第二號(hào)碼數(shù)據(jù)庫(kù),分別判斷該電話號(hào)碼與第一號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同,該電話號(hào)碼與第二號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同。其中,第一號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼可以為政府部門、公檢法機(jī)關(guān)、企業(yè)黃頁(yè)或者知名客服等的電話號(hào)碼,第二號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼可以為通過用戶舉報(bào)或者警方報(bào)案等途徑獲取到的黑名單。

安全服務(wù)器可以統(tǒng)計(jì)安裝該安全客戶端的終端數(shù)量,將該終端數(shù)量作為安全客戶端的用戶量。安裝在各個(gè)終端上的安全客戶端可以檢測(cè)用戶對(duì)該電話號(hào)碼的標(biāo)記次數(shù),安全客戶端將用戶對(duì)該電話號(hào)碼的標(biāo)記次數(shù)發(fā)送給安全服務(wù)器,安全服務(wù)器將不同用戶對(duì)該電話號(hào)碼的標(biāo)記次數(shù)總和作為對(duì)該電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù),安全服務(wù)器可以將對(duì)該電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)除以安全客戶端的用戶量,得到用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例。例如安全客戶端的用戶量為20萬人,對(duì)該電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)為2000次,則用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例為1:100。

安裝在各個(gè)終端上的安全客戶端可以檢測(cè)用戶對(duì)該電話號(hào)碼的標(biāo)記次數(shù)以及每次進(jìn)行標(biāo)記的號(hào)碼類型,安全客戶端將用戶對(duì)該電話號(hào)碼的標(biāo)記次數(shù)以及每次進(jìn)行標(biāo)記的號(hào)碼類型發(fā)送給安全服務(wù)器,安全服務(wù)器將不同用戶對(duì)該電話號(hào)碼的標(biāo)記次數(shù)總和作為對(duì)該電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù),將不同用戶將該電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)總和作為將該電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù),安全服務(wù)器可以將將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)除以對(duì)該電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù),得到將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。例如,對(duì)該電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)為2000次,將該電話號(hào)碼標(biāo)記為詐騙電話的標(biāo)記次數(shù)為1200次,將該電話號(hào)碼標(biāo)記為騷擾電話的標(biāo)記次數(shù)為600次,將該電話號(hào)碼標(biāo)記為廣告推銷的標(biāo)記次數(shù)為200次,則安全服務(wù)器可以得到將電話號(hào)碼標(biāo)記為詐騙電話的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例為3:5,將電話號(hào)碼標(biāo)記為騷擾電話的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例為3:10,將電話號(hào)碼標(biāo)記為廣告推銷的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例為1:10。

S103,對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息。

安全服務(wù)器獲取到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息之后,針對(duì)任一電話號(hào)碼,安全服務(wù)器可以對(duì)該電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息。

在可選實(shí)施例中,第二特征信息可以包括以下至少一項(xiàng):檢測(cè)電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的其他網(wǎng)頁(yè)中的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配。

具體實(shí)現(xiàn)中,安全服務(wù)器可以預(yù)先建立第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù),第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)可以包括至少一個(gè)第二關(guān)鍵字。安全服務(wù)器獲取到電話號(hào)碼對(duì)應(yīng)的文本信息之后,可以將文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字進(jìn)行比較,檢測(cè)文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配。其中,第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)所包含的第二關(guān)鍵字可以為:詐騙、欺詐、虛假、仿冒、偽裝或者惡意等。例如,用戶可以通過互聯(lián)網(wǎng)舉報(bào)指定電話號(hào)碼為詐騙電話等,則安全服務(wù)器可以檢測(cè)該電話號(hào)碼對(duì)應(yīng)的文本信息是否與詐騙類關(guān)鍵字匹配,以此確定該電話號(hào)碼的號(hào)碼類型是否為詐騙電話。

安全服務(wù)器可以預(yù)先建立第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù),第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)可以包括至少一個(gè)第二關(guān)鍵字。安全服務(wù)器獲取到電話號(hào)碼對(duì)應(yīng)的文本信息之后,可以將文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字進(jìn)行比較,檢測(cè)文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配。其中,第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)所包含的第二關(guān)鍵字可以為:免費(fèi)轉(zhuǎn)賬、免費(fèi)提現(xiàn)或者低息套現(xiàn)等。例如,安全客戶端通過統(tǒng)計(jì)分析,某些仿冒網(wǎng)頁(yè)通常顯示免費(fèi)提現(xiàn)或者低息套現(xiàn)等第二關(guān)鍵字,而被仿冒網(wǎng)頁(yè)通常不會(huì)顯示上述第二關(guān)鍵字,則安全服務(wù)器可以檢測(cè)該電話號(hào)碼對(duì)應(yīng)的文本信息是否與免費(fèi)類關(guān)鍵字匹配,以此確定該電話號(hào)碼的號(hào)碼類型是否為詐騙電話。

安全服務(wù)器可以通過互聯(lián)網(wǎng)搜索包含該電話號(hào)碼的其他網(wǎng)頁(yè),對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析得到該網(wǎng)頁(yè)中的文本信息,將該文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字進(jìn)行比較,檢測(cè)包含該電話號(hào)碼的其他文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配。

安全服務(wù)器可以預(yù)先建立網(wǎng)頁(yè)數(shù)據(jù)庫(kù),網(wǎng)頁(yè)數(shù)據(jù)庫(kù)可以包括至少一個(gè)網(wǎng)頁(yè)的網(wǎng)址等信息,安全服務(wù)器可以通過互聯(lián)網(wǎng)搜索包含該電話號(hào)碼的所有網(wǎng)頁(yè)的網(wǎng)址,當(dāng)包含該電話號(hào)碼的任一網(wǎng)頁(yè)的網(wǎng)址與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的任一網(wǎng)頁(yè)的網(wǎng)址相同時(shí),安全服務(wù)器可以確定包含該電話號(hào)碼的網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)匹配;當(dāng)包含該電話號(hào)碼的任一網(wǎng)頁(yè)的網(wǎng)址與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的所有網(wǎng)頁(yè)的網(wǎng)址都不相同時(shí),安全服務(wù)器可以確定包含該電話號(hào)碼的網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)不匹配。

S104,根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型。

安全服務(wù)器可以根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型。其中,電話號(hào)碼的號(hào)碼類型可以包括:詐騙電話、騷擾電話、廣告推銷、房產(chǎn)中介或者快遞送餐等。

例如,安全服務(wù)器可以基于兩個(gè)維度識(shí)別電話號(hào)碼的號(hào)碼類型,示例性的,當(dāng)?shù)谝惶卣餍畔樵撾娫捥?hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù),第二特征信息為檢測(cè)該電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配時(shí),如果該電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù)大于預(yù)設(shè)次數(shù)閾值,且該電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字匹配,則安全服務(wù)器可以識(shí)別該電話號(hào)碼的號(hào)碼類型為詐騙電話。

又如,安全服務(wù)器可以基于三個(gè)維度識(shí)別電話號(hào)碼的號(hào)碼類型,示例性的,當(dāng)?shù)谝惶卣餍畔樵撾娫捥?hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù),以及用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例,第二特征信息為檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配時(shí),如果該電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù)大于預(yù)設(shè)次數(shù)閾值,將電話號(hào)碼標(biāo)記為詐騙電話的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例為3:5,將電話號(hào)碼標(biāo)記為騷擾電話的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例為3:10,將電話號(hào)碼標(biāo)記為廣告推銷的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例為1:10,且包含該電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)匹配,則安全服務(wù)器可以識(shí)別該電話號(hào)碼的號(hào)碼類型為詐騙電話。

需要說明的是,安全服務(wù)器可以基于至少兩個(gè)維度識(shí)別電話號(hào)碼的號(hào)碼類 型,研發(fā)人員可結(jié)合不同場(chǎng)景進(jìn)行相應(yīng)的修改,具體不受本發(fā)明實(shí)施例的限制。

在可選實(shí)施例中,安全服務(wù)器識(shí)別電話號(hào)碼的號(hào)碼類型之后,可以向安全客戶端發(fā)送風(fēng)險(xiǎn)提示信息,其中風(fēng)險(xiǎn)提示信息包括電話號(hào)碼的號(hào)碼類型。例如,安全服務(wù)器將風(fēng)險(xiǎn)提示信息發(fā)送給安全客戶端之后,安全客戶端可以本地存儲(chǔ)電話號(hào)碼及其對(duì)應(yīng)的號(hào)碼類型,用戶在呼入或者呼出該電話號(hào)碼時(shí),安全客戶端可以輸出風(fēng)險(xiǎn)提示信息。又如,安全服務(wù)器識(shí)別電話號(hào)碼的號(hào)碼類型之后,用戶在呼入或者呼出該電話號(hào)碼時(shí),安全客戶端可以向安全服務(wù)器發(fā)送針對(duì)該電話號(hào)碼的風(fēng)險(xiǎn)提示信息獲取請(qǐng)求,安全服務(wù)器將風(fēng)險(xiǎn)提示信息發(fā)送給安全客戶端,進(jìn)而安全客戶端在終端的顯示屏幕上顯示風(fēng)險(xiǎn)提示信息,以提示用戶該電話號(hào)碼的號(hào)碼類型。

本發(fā)明實(shí)施例中,對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息,對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息,根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型,可提高電話號(hào)碼識(shí)別的精準(zhǔn)度。

請(qǐng)參見圖2,圖2是本發(fā)明實(shí)施例公開的一種電話號(hào)碼識(shí)別系統(tǒng)的框架示意圖。如圖2所示,該電話號(hào)碼識(shí)別系統(tǒng)可以包括爬蟲模塊、解析模塊、特征提取模塊以及號(hào)碼判斷模塊,爬蟲模塊與解析模塊建立通信連接,解析模塊與特征提取模塊建立通信連接,特征提取模塊與號(hào)碼判斷模塊建立通信連接,其中:

爬蟲模塊,用于搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。具體實(shí)現(xiàn)中,爬蟲模塊可以預(yù)先建立第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù),例如,第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)所包含的第一關(guān)鍵字可以為:客服、熱線、電話或者號(hào)碼等,第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第一關(guān)鍵字可以通過用戶舉報(bào)、人工審核或者人工添加的方式構(gòu)成。爬蟲模塊還可以預(yù)先建立網(wǎng)頁(yè)數(shù)據(jù)庫(kù),網(wǎng)頁(yè)數(shù)據(jù)庫(kù)所包含的網(wǎng)頁(yè)可以通過搜索引擎(例如QQ瀏覽器或者谷歌瀏覽器等)、論壇或者微博等互聯(lián)網(wǎng)獲得。則爬蟲模塊可以在網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

解析模塊,用于對(duì)搜索到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到該網(wǎng)頁(yè)中的電話號(hào)碼和文本信息,并建立電話號(hào)碼和文本信息的對(duì)應(yīng)關(guān)系。可選的,當(dāng)該網(wǎng)頁(yè)包含多個(gè)電話號(hào)碼時(shí),解析模塊可以獲取該網(wǎng)頁(yè)中的所有文本信息,建立不同電話 號(hào)碼和該網(wǎng)頁(yè)中的所有文本信息的對(duì)應(yīng)關(guān)系,存儲(chǔ)各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。

特征提取模塊,用于對(duì)該電話號(hào)碼及其對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到多個(gè)特征信息。具體實(shí)現(xiàn)中,特征提取模塊可以對(duì)電話號(hào)碼進(jìn)行特征提取,得到第一特征信息,其中第一特征信息可以包括以下至少一項(xiàng):獲取電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù),檢測(cè)電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同,統(tǒng)計(jì)用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例,統(tǒng)計(jì)用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。進(jìn)一步的,特征提取模塊還可以對(duì)該電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到第二特征信息,其中第二特征信息可以包括以下至少一項(xiàng):檢測(cè)電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的其他網(wǎng)頁(yè)中的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配。

號(hào)碼判斷模塊,用于根據(jù)各個(gè)特征信息,識(shí)別該電話號(hào)碼的號(hào)碼類型。例如,號(hào)碼判斷模塊可以通過機(jī)器學(xué)習(xí)方法,對(duì)各個(gè)特征信息進(jìn)行統(tǒng)計(jì)學(xué)習(xí)并分類,以判斷該電話號(hào)碼的號(hào)碼類型是否為詐騙電話。

基于圖2所示的電話號(hào)碼識(shí)別系統(tǒng)的架構(gòu)示意圖,圖3公開了本發(fā)明實(shí)施例的另一種電話號(hào)碼識(shí)別方法的流程示意圖。如圖3所示,該電話號(hào)碼識(shí)別方法可以包括以下步驟:

S301,通過爬蟲模塊搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

具體實(shí)現(xiàn)中,安全服務(wù)器可以通過爬蟲模塊搜索包含第一關(guān)鍵字的網(wǎng)頁(yè),或者搜索與第一關(guān)鍵字關(guān)聯(lián)的網(wǎng)頁(yè)。第一關(guān)鍵字可以為:客服、熱線、電話或者號(hào)碼等。例如,第一關(guān)鍵字包含“支付寶人工客服電話”,則爬蟲模塊搜索到的與該第一關(guān)鍵字匹配的網(wǎng)頁(yè)可以為:官方或者假冒的支付寶人工客服電話,關(guān)于支付寶相關(guān)信息的論壇,等等。

S302,通過解析模塊對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到電話號(hào)碼及其對(duì)應(yīng)的文本信息。

具體實(shí)現(xiàn)中,安全服務(wù)器可以通過解析模塊對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解 析,分離出該網(wǎng)頁(yè)中的電話號(hào)碼和文本信息,并建立電話號(hào)碼和文本信息的對(duì)應(yīng)關(guān)系。當(dāng)該網(wǎng)頁(yè)包含多個(gè)電話號(hào)碼時(shí),安全服務(wù)器可以通過解析模塊建立不同電話號(hào)碼和該網(wǎng)頁(yè)中的所有文本信息的對(duì)應(yīng)關(guān)系。

S303,通過特征提取模塊對(duì)電話號(hào)碼及其對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到多個(gè)特征信息。

具體實(shí)現(xiàn)中,安全服務(wù)器可以通過特征提取模塊對(duì)電話號(hào)碼進(jìn)行特征提取,得到第一特征信息,安全服務(wù)器還可以通過特征提取模塊對(duì)該電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到第二特征信息。其中,第一特征信息可以包括以下至少一項(xiàng):獲取電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù),檢測(cè)電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同,統(tǒng)計(jì)用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例,統(tǒng)計(jì)用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。第二特征信息可以包括以下至少一項(xiàng):檢測(cè)電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的其他網(wǎng)頁(yè)中的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配。

S304,通過號(hào)碼判斷模塊對(duì)各個(gè)特征信息進(jìn)行識(shí)別,得到該電話號(hào)碼的號(hào)碼類型。

具體實(shí)現(xiàn)中,安全服務(wù)器可以通過號(hào)碼判斷模塊對(duì)各個(gè)特征信息進(jìn)行識(shí)別,得到該電話號(hào)碼的號(hào)碼類型,其中電話號(hào)碼的號(hào)碼類型可以為詐騙電話、騷擾電話、廣告推銷、房產(chǎn)中介或者快遞送餐等。例如,安全服務(wù)器可以通過號(hào)碼判斷模塊對(duì)各個(gè)特征信息進(jìn)行統(tǒng)計(jì)學(xué)習(xí)并分類,以判斷該電話號(hào)碼的號(hào)碼類型是否為詐騙電話。本發(fā)明實(shí)施例通過對(duì)網(wǎng)頁(yè)中的電話號(hào)碼及其對(duì)應(yīng)的文本信息進(jìn)行識(shí)別,得到該電話號(hào)碼的號(hào)碼類型,能找到在互聯(lián)網(wǎng)傳播的大量詐騙電話或者廣告推銷等,擴(kuò)充安全服務(wù)器中的號(hào)碼類型數(shù)據(jù)庫(kù),以便終端呼入或者呼出電話號(hào)碼時(shí),通過安全客戶端提示該電話號(hào)碼的號(hào)碼類型,保護(hù)用戶的財(cái)產(chǎn)安全或者個(gè)人信息等。

本發(fā)明實(shí)施例中,爬蟲模塊搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè),解析模塊對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到電話號(hào)碼及其對(duì)應(yīng)的文本信息,特征提取模塊對(duì)電話號(hào)碼及其對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到多個(gè)特征信息,號(hào)碼判 斷模塊對(duì)各個(gè)特征信息進(jìn)行識(shí)別,得到該電話號(hào)碼的號(hào)碼類型,可提高電話號(hào)碼識(shí)別的精準(zhǔn)度。

請(qǐng)參見圖4,圖4是本發(fā)明實(shí)施例中提供的另一種電話號(hào)碼識(shí)別方法的流程示意圖,如圖4所示,該電話號(hào)碼識(shí)別方法可以包括以下步驟:

S401,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

S402,對(duì)搜索到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,網(wǎng)頁(yè)包括電話號(hào)碼和文本信息。

S403,對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息。

具體實(shí)現(xiàn)中,針對(duì)任一電話號(hào)碼,安全服務(wù)器可以對(duì)該電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息。其中,第一特征信息包括以下至少一項(xiàng):獲取電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù),檢測(cè)電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同,統(tǒng)計(jì)用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例,統(tǒng)計(jì)用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。

示例性的,安全服務(wù)器提取到的第一特征信息可以如表一所示:

表一

S404,對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息。

具體實(shí)現(xiàn)中,針對(duì)任一電話號(hào)碼,安全服務(wù)器可以對(duì)該電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息。其中,第二特征信息可以包括以下至少一項(xiàng):檢測(cè)電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的其他網(wǎng)頁(yè)中的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配,檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配。

示例性的,安全服務(wù)器提取到的第二特征信息可以如表二所示:

表二

S405,根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型。

本發(fā)明實(shí)施例中,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè),對(duì)該網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息,對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息,根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型,可提高電話號(hào)碼識(shí)別的精準(zhǔn)度。

請(qǐng)參見圖5,圖5是本發(fā)明實(shí)施例中提供的一種電話號(hào)碼識(shí)別裝置的結(jié)構(gòu)示意圖,本發(fā)明實(shí)施例中的電話號(hào)碼識(shí)別裝置可以為安全服務(wù)器,安全服務(wù)器可以安裝在手機(jī)、電腦或者個(gè)人計(jì)算機(jī)等中,如圖所示本實(shí)施例中的電話號(hào)碼識(shí)別裝置至少可以包括內(nèi)容解析單元501、特征提取單元502以及號(hào)碼類型識(shí)別單元503,其中:

內(nèi)容解析單元501,用于對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,網(wǎng)頁(yè)包括電話號(hào)碼和文本信息。

特征提取單元502,用于對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息。

所述特征提取單元502,還用于對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取, 得到至少一個(gè)第二特征信息。

號(hào)碼類型識(shí)別單元503,用于根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型。

在可選實(shí)施例中,特征提取單元502對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息,具體用于:

根據(jù)第一特征提取項(xiàng)對(duì)電話號(hào)碼進(jìn)行特征提取,得到各個(gè)第一特征信息,其中,第一特征提取項(xiàng)包括電話號(hào)碼的號(hào)碼歷史熱度、號(hào)碼字符串特點(diǎn)、號(hào)碼行為模式、電話號(hào)碼是否屬于黃頁(yè)、電話號(hào)碼是否屬于黑名單、電話號(hào)碼在安全客戶端的標(biāo)記情況或者電話號(hào)碼在安全客戶端被標(biāo)記為指定號(hào)碼類型的情況中的一種或者多種。

在可選實(shí)施例中,第一特征信息可以包括以下至少一項(xiàng):

獲取電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù);

檢測(cè)電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同;

統(tǒng)計(jì)用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例;

統(tǒng)計(jì)用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。

在可選實(shí)施例中,特征提取單元502對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息,具體用于:

根據(jù)第二特征提取項(xiàng)對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到各個(gè)第二特征信息,其中,第二特征提取項(xiàng)包括電話號(hào)碼在搜索引擎的返回頁(yè)面結(jié)果,電話號(hào)碼在指定網(wǎng)頁(yè)被用戶提到的內(nèi)容,電話號(hào)碼是否在指定網(wǎng)址頁(yè)面出現(xiàn)中的一種或者多種。

在可選實(shí)施例中,第二特征信息可以包括以下至少一項(xiàng):

檢測(cè)電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配;

檢測(cè)包含電話號(hào)碼的其他網(wǎng)頁(yè)中的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配;

檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配。

在可選實(shí)施例中,本發(fā)明實(shí)施例中的內(nèi)容解析單元501,具體用于:

根據(jù)第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第一關(guān)鍵字,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。

在可選實(shí)施例中,內(nèi)容解析單元501根據(jù)第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第一關(guān)鍵字,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè),具體用于:

通過爬蟲模塊爬取與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

在可選實(shí)施例中,號(hào)碼類型識(shí)別單元503根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型,具體用于:

通過機(jī)器學(xué)習(xí)方法,對(duì)第一特征信息和第二特征信息進(jìn)行統(tǒng)計(jì)學(xué)習(xí),以判斷電話號(hào)碼的號(hào)碼類型是否為詐騙電話。

在可選實(shí)施例中,本發(fā)明實(shí)施例中的電話號(hào)碼識(shí)別裝置還可以包括:

提示信息發(fā)送單元504,用于號(hào)碼類型識(shí)別單元503根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型之后,向安全客戶端發(fā)送風(fēng)險(xiǎn)提示信息,風(fēng)險(xiǎn)提示信息包括電話號(hào)碼的號(hào)碼類型。

本發(fā)明實(shí)施例中,內(nèi)容解析單元501對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,網(wǎng)頁(yè)包括電話號(hào)碼和文本信息,特征提取單元對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息,特征提取單元502對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息,號(hào)碼類型識(shí)別單元503根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型,可提高電話號(hào)碼識(shí)別的精準(zhǔn)度。

請(qǐng)參見圖6,圖6為本發(fā)明另一實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖,本發(fā)明實(shí)施例提供的終端可以用于實(shí)施上述圖1、圖3或者圖4所示的本發(fā)明實(shí)施例實(shí)現(xiàn)的方法,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請(qǐng)參照?qǐng)D1、圖3或者圖4所示的本發(fā)明實(shí)施例。

如圖6所示,該終端包括:至少一個(gè)處理器601,例如CPU,至少一個(gè)輸入裝置603,至少一個(gè)輸出裝置604,存儲(chǔ)器605,至少一個(gè)通信總線602。其中,通信總線602用于實(shí)現(xiàn)這些組件之間的連接通信。其中,輸入裝置603、輸出裝置604具體可以為網(wǎng)絡(luò)接口,用于與安全客戶端進(jìn)行通信。其中,存儲(chǔ)器605可能包含高速RAM存儲(chǔ)器,也可能還包括非不穩(wěn)定的存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器,具體用于存儲(chǔ)電話號(hào)碼及其對(duì)應(yīng)的文本信息。存儲(chǔ)器605可選 的可以包含至少一個(gè)位于遠(yuǎn)離前述處理器601的存儲(chǔ)裝置。處理器601可以結(jié)合圖5所示的電話號(hào)碼識(shí)別裝置。存儲(chǔ)器605中存儲(chǔ)一組程序代碼,且處理器601調(diào)用存儲(chǔ)器605中存儲(chǔ)的程序代碼,用于執(zhí)行以下操作:

對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,網(wǎng)頁(yè)包括電話號(hào)碼和文本信息。

對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息。

對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息。

根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型。

在可選實(shí)施例中,處理器601對(duì)電話號(hào)碼進(jìn)行特征提取,得到至少一個(gè)第一特征信息,具體可以為:

根據(jù)第一特征提取項(xiàng)對(duì)電話號(hào)碼進(jìn)行特征提取,得到各個(gè)第一特征信息,其中,第一特征提取項(xiàng)包括電話號(hào)碼的號(hào)碼歷史熱度、號(hào)碼字符串特點(diǎn)、號(hào)碼行為模式、電話號(hào)碼是否屬于黃頁(yè)、電話號(hào)碼是否屬于黑名單、電話號(hào)碼在安全客戶端的標(biāo)記情況或者電話號(hào)碼在安全客戶端被標(biāo)記為指定號(hào)碼類型的情況中的一種或者多種。

在可選實(shí)施例中,第一特征信息包括以下至少一項(xiàng):

獲取電話號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)的通話次數(shù)。

檢測(cè)電話號(hào)碼與號(hào)碼數(shù)據(jù)庫(kù)中的電話號(hào)碼是否相同。

統(tǒng)計(jì)用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)與安全客戶端的用戶量之間的比例。

統(tǒng)計(jì)用戶通過安全客戶端將電話號(hào)碼標(biāo)記為指定號(hào)碼類型的標(biāo)記次數(shù)與用戶通過安全客戶端對(duì)電話號(hào)碼進(jìn)行標(biāo)記的標(biāo)記次數(shù)之間的比例。

在可選實(shí)施例中,處理器601對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到至少一個(gè)第二特征信息,具體可以為:

根據(jù)第二特征提取項(xiàng)對(duì)電話號(hào)碼對(duì)應(yīng)的文本信息進(jìn)行特征提取,得到各個(gè)第二特征信息,其中,第二特征提取項(xiàng)包括電話號(hào)碼在搜索引擎的返回頁(yè)面結(jié)果,電話號(hào)碼在指定網(wǎng)頁(yè)被用戶提到的內(nèi)容,電話號(hào)碼是否在指定網(wǎng)址頁(yè)面出現(xiàn)中的一種或者多種。

在可選實(shí)施例中,第二特征信息包括以下至少一項(xiàng):

檢測(cè)電話號(hào)碼對(duì)應(yīng)的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹 配。

檢測(cè)包含電話號(hào)碼的其他網(wǎng)頁(yè)中的文本信息與第二關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第二關(guān)鍵字是否匹配。

檢測(cè)包含電話號(hào)碼的任一網(wǎng)頁(yè)與網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中的網(wǎng)頁(yè)是否匹配。

在可選實(shí)施例中,處理器601對(duì)預(yù)設(shè)網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息,具體可以為:

處理器601根據(jù)第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第一關(guān)鍵字,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

處理器601對(duì)搜索得到的網(wǎng)頁(yè)進(jìn)行內(nèi)容解析,得到各個(gè)電話號(hào)碼及其對(duì)應(yīng)的文本信息。

在可選實(shí)施例中,處理器601根據(jù)第一關(guān)鍵字?jǐn)?shù)據(jù)庫(kù)中的第一關(guān)鍵字,搜索與第一關(guān)鍵字匹配的網(wǎng)頁(yè),具體可以為:

通過爬蟲模塊爬取與第一關(guān)鍵字匹配的網(wǎng)頁(yè)。

在可選實(shí)施例中,處理器601根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型,具體可以為:

通過機(jī)器學(xué)習(xí)方法,對(duì)第一特征信息和第二特征信息進(jìn)行統(tǒng)計(jì)學(xué)習(xí),以判斷電話號(hào)碼的號(hào)碼類型是否為詐騙電話。

在可選實(shí)施例中,處理器601根據(jù)第一特征信息和第二特征信息,識(shí)別電話號(hào)碼的號(hào)碼類型之后,還可以執(zhí)行以下操作:

輸出裝置604向安全客戶端發(fā)送風(fēng)險(xiǎn)提示信息,風(fēng)險(xiǎn)提示信息包括電話號(hào)碼的號(hào)碼類型。

具體的,本發(fā)明實(shí)施例中介紹的終端可以用以實(shí)施本發(fā)明結(jié)合圖1、圖3或者圖4介紹的方法實(shí)施例中的部分或全部流程。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(Read-Only Memory,ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory,RAM)等。

以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
溧水县| 平安县| 封开县| 台南县| 周口市| 金川县| 安达市| 阳曲县| 大宁县| 乌什县| 昌图县| 木兰县| 青岛市| 宜城市| 武威市| 格尔木市| 嵊州市| 商水县| 于田县| 沂水县| 申扎县| 临泉县| 延津县| 孝感市| 景洪市| 天津市| 昭苏县| 高清| 长丰县| 东山县| 临沂市| 广南县| 波密县| 伊宁市| 通化县| 永平县| 石狮市| 原平市| 都安| 华池县| 衡水市|