本發(fā)明實(shí)施例涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種偽基站短信識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
偽基站是一種高科技儀器,一般由主機(jī)和筆記本電腦組成,通過(guò)短信群發(fā)器、短信發(fā)信機(jī)等相關(guān)設(shè)備能夠搜取以其為中心、一定半徑范圍內(nèi)的手機(jī)卡信息,通過(guò)偽裝成運(yùn)營(yíng)商的基站,任意冒用他人手機(jī)號(hào)碼強(qiáng)行向用戶手機(jī)發(fā)送詐騙、廣告推銷等短信息。從2014年開始,偽基站短信數(shù)量不斷攀升,月均偽基站短信數(shù)量接近一億條,2015年,全國(guó)偽基站短信數(shù)量達(dá)到23.2億條,較2014年的11.9億條,同比上漲95%。廣告促銷、色情違法、房產(chǎn)中介是偽基站短信的三大類型。
偽基站短信偽裝性很高,往往冒充權(quán)威號(hào)碼(如95588,10086)給用戶發(fā)送欺騙性極高的詐騙短信,普通用戶往往不能很好地分辨。近年來(lái),偽基站電信詐騙案件層出不窮,因此,找到一個(gè)可靠地識(shí)別偽基站的方法是非常必要的。
目前,偽基站短信識(shí)別技術(shù)有如下幾種:第一種,傳統(tǒng)的偽基站識(shí)別技術(shù),采用硬件設(shè)備,通過(guò)頻率和功率探測(cè)周圍的偽基站設(shè)備;第二種,客戶端在收到短信時(shí)向云端發(fā)起一個(gè)業(yè)務(wù)請(qǐng)求,如果不能正常受到請(qǐng)求響應(yīng),則判斷為偽基站短信。第三種,與第三方平臺(tái)約定短信密語(yǔ),第三方平臺(tái)在發(fā)送短信時(shí)將攜帶該密語(yǔ),如果在收到第三方平臺(tái)短信時(shí)沒(méi)有攜帶密語(yǔ),則判斷為偽基站短信。第四種,基于正?;編?kù)來(lái)判斷,如果用戶收到短信的所接入的基站不在基站庫(kù)中或者地理位置不正常,則判斷為偽基站短信。
現(xiàn)有方法的主要問(wèn)題在于:第一種方法,受限于硬件設(shè)備的成本,且探測(cè)距離有限,無(wú)法做到大范圍的查找;第二種方法,不能很好地處理用戶通過(guò)wifi連接到網(wǎng)絡(luò)的情況;第三種方法,不是很靈活,對(duì)約定好的第三方平臺(tái)外的偽基站短信無(wú)能為力。第四種方法,只是基于基站信息來(lái)判斷,由于一些移動(dòng)基站的存在,或者一些偽基站冒用正?;镜纳矸輼?biāo)識(shí),會(huì)導(dǎo)致較多的誤判和漏判。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種偽基站短信識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),可以提高偽基站短信的正確識(shí)別率。
第一方面,本發(fā)明實(shí)施例提供了一種偽基站短信識(shí)別方法,該方法包括:
采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別;
根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
第二方面,本發(fā)明實(shí)施例還提供了一種偽基站短信識(shí)別裝置,該裝置包括:
異常識(shí)別模塊,用于采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別;
偽基站短信確定模塊,用于根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
第三方面,本發(fā)明實(shí)施例還提供了一種設(shè)備,包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)本發(fā)明實(shí)施例任一所述的偽基站短信識(shí)別方法。
第四方面,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明實(shí)施例任一所述的偽基站短信識(shí)別方法。
本發(fā)明實(shí)施例通過(guò)預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別,并根據(jù)輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信,可以提高偽基站短信的正確識(shí)別率。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例一提供的一種偽基站短信識(shí)別方法的流程圖;
圖2是本發(fā)明實(shí)施例二提供的一種偽基站短信識(shí)別方法的流程圖;
圖3是本發(fā)明實(shí)施例三提供的一種偽基站短信識(shí)別方法的流程圖;
圖4是本發(fā)明實(shí)施例四提供的一種偽基站短信識(shí)別方法的流程圖;
圖5是本發(fā)明實(shí)施例五提供的一種偽基站短信識(shí)別裝置的結(jié)構(gòu)圖;
圖6是本發(fā)明實(shí)施例六提供的一種計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例作進(jìn)一步的詳細(xì)描述??梢岳斫獾氖牵颂幩枋龅木唧w實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。
另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部?jī)?nèi)容。在更加詳細(xì)地討論示例性實(shí)施例之前應(yīng)當(dāng)提到的是,一些示例性實(shí)施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項(xiàng)操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發(fā)地或者同時(shí)實(shí)施。此外,各項(xiàng)操作的順序可以被重新安排。當(dāng)其操作完成時(shí)所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對(duì)應(yīng)于方法、函數(shù)、規(guī)程、子例程、子程序等等。
實(shí)施例一
圖1為本發(fā)明實(shí)施例一提供的一種偽基站短信識(shí)別方法的流程圖,本實(shí)施例可適用于偽基站短信識(shí)別的情況,該方法可以由本發(fā)明實(shí)施例提供的偽基站短信識(shí)別裝置來(lái)執(zhí)行,該裝置可采用軟件和/或硬件的方式實(shí)現(xiàn),該裝置可集成在終端設(shè)備中或終端設(shè)備的應(yīng)用端中。其中,終端設(shè)備可以為但不限于為移動(dòng)終端(平板電腦或智能手機(jī))。
其中,應(yīng)用端可以為內(nèi)嵌于終端設(shè)備中的某個(gè)客戶端的插件,或者為所述終端設(shè)備的操作系統(tǒng)的插件,與內(nèi)嵌于終端設(shè)備中的偽基站短信識(shí)別客戶端或者終端設(shè)備的操作系統(tǒng)中的偽基站短信識(shí)別應(yīng)用程序配合使用;應(yīng)用端也可以為所述終端設(shè)備中一個(gè)獨(dú)立的可提供偽基站短信識(shí)別的客戶端,本實(shí)施例對(duì)此不進(jìn)行限制。
如圖1所述,本實(shí)施例的方法具體包括:
s101、采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別。
其中,短信異常識(shí)別模型基于待識(shí)別短信的文本特征對(duì)待識(shí)別短信進(jìn)行偽基站短信識(shí)別,可預(yù)先根據(jù)已知偽基站短信的文本特征和/或已知正常短信的文本特征訓(xùn)練得到,使其具有偽基站短信識(shí)別能力。
s102、根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
其中,短信異常識(shí)別模型的輸出結(jié)果可以為以下任意一種:偽基站短信、正常短信、為偽基站短信的概率和為正常短信的概率。當(dāng)短信異常識(shí)別模型的輸出結(jié)果是為偽基站短信的概率時(shí),根據(jù)為偽基站短信的概率確定待識(shí)別短信是否為偽基站短信,例如,當(dāng)為偽基站短信的概率大于預(yù)設(shè)概率(例如,90%)時(shí),則確定待識(shí)別短信為偽基站短信,否則確定待識(shí)別短信為正常短信。當(dāng)短信異常識(shí)別模型的輸出結(jié)果是為正常短信的概率時(shí),根據(jù)為正常短信的概率確定待識(shí)別短信是否為偽基站短信,例如,當(dāng)為正常短信的概率小于預(yù)設(shè)概率(例如,90%)時(shí),則確定待識(shí)別短信為偽基站短信,否則確定待識(shí)別短信為正常短信。
本實(shí)施例通過(guò)預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別,并根據(jù)輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信,可以提高偽基站短信的正確識(shí)別率。
實(shí)施例二
圖2是本發(fā)明實(shí)施例二提供的一種偽基站短信識(shí)別方法的流程圖。本實(shí)施例以上述實(shí)施例為基礎(chǔ)進(jìn)行優(yōu)化,在本實(shí)施例中,進(jìn)一步包括如下步驟:提取已知偽基站短信的文本特征和/或已知正常短信的文本特征,并進(jìn)行標(biāo)記;采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型。
相應(yīng)的,本實(shí)施例的方法具體包括:
s201、提取已知偽基站短信的文本特征和/或已知正常短信的文本特征,并進(jìn)行標(biāo)記。
其中,提取的文本特征包括但不限于以下至少一種:短信內(nèi)容、發(fā)送號(hào)碼、發(fā)送時(shí)間等。
具體的,首先獲取大量的已知偽基站短信和已知正常短信,例如,可采用現(xiàn)有技術(shù)的偽基站識(shí)別方法獲取,或者人工獲取。然后,提取已知偽基站短信的文本特征和/或已知正常短信的文本特征作為訓(xùn)練樣本數(shù)據(jù),并根據(jù)短信類型對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記,例如,偽基站短信對(duì)應(yīng)的樣本數(shù)據(jù)標(biāo)記為1,正常短信對(duì)應(yīng)的樣本數(shù)據(jù)標(biāo)記為0。
s202、采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型。
例如,可采用的機(jī)器學(xué)習(xí)算法包括但限于樸素貝葉斯算法、支持向量機(jī)算法和神經(jīng)網(wǎng)絡(luò)模型等。
為保證得到的短信異常識(shí)別模型的輸出結(jié)果更為準(zhǔn)確,本步驟可選的一種實(shí)施方式是,將標(biāo)記后的文本特征劃分為訓(xùn)練數(shù)據(jù)樣本集和驗(yàn)證數(shù)據(jù)樣本集;采用機(jī)器學(xué)習(xí)算法對(duì)所述訓(xùn)練數(shù)據(jù)樣本集進(jìn)行模型訓(xùn)練,得到初始短信異常識(shí)別模型;采用所述驗(yàn)證數(shù)據(jù)樣本集對(duì)所述初始短信異常識(shí)別模型進(jìn)行驗(yàn)證,若通過(guò)驗(yàn)證,則將所述初始短信異常識(shí)別模型作為所述短信異常識(shí)別模型。
具體的,首先采用機(jī)器學(xué)習(xí)算法對(duì)訓(xùn)練數(shù)據(jù)樣本集進(jìn)行模型訓(xùn)練,得到初始短信異常識(shí)別模型,然后將驗(yàn)證數(shù)據(jù)樣本集輸入初始短信異常識(shí)別模型進(jìn)行識(shí)別,將初始短信異常識(shí)別模型的輸出結(jié)果與驗(yàn)證數(shù)據(jù)樣本集的標(biāo)記進(jìn)行比對(duì),如果正確率達(dá)到100%,或者超過(guò)預(yù)設(shè)比例(例如95%),則認(rèn)為初始短信異常識(shí)別模型通過(guò)驗(yàn)證,則將其作為最終的短信異常識(shí)別模型,如果初始短信異常識(shí)別模型未通過(guò)驗(yàn)證,則重新劃分訓(xùn)練數(shù)據(jù)樣本集和驗(yàn)證數(shù)據(jù)樣本集,重新訓(xùn)練得到模型并驗(yàn)證,直至通過(guò)驗(yàn)證。
s203、采用短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別。
s204、根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
本實(shí)施例通過(guò)提取已知偽基站短信的文本特征和/或已知正常短信的文本特征,并進(jìn)行標(biāo)記;采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型;并根據(jù)短信異常識(shí)別模型的輸出結(jié)果確定待識(shí)別短信是否為偽基站短信,可以提高偽基站短信的正確識(shí)別率。
實(shí)施例三
圖3是本發(fā)明實(shí)施例三提供的一種偽基站短信識(shí)別方法的流程圖。本實(shí)施例以上述實(shí)施例為基礎(chǔ)進(jìn)行優(yōu)化,在本實(shí)施例中,進(jìn)一步包括如下步驟:根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常;若確定所述基站異常,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
相應(yīng)的,本實(shí)施例的方法具體包括:
s301、根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常。
若確定所述基站異常,則執(zhí)行步驟s302,若確定所述基站正常,則確定所述待識(shí)別短信為正常短信,無(wú)需再執(zhí)行偽基站短信識(shí)別。
本步驟可選的一種實(shí)施方式是,所述云端接口請(qǐng)求消息中包含基站信息,根據(jù)所述基站信息查詢正常基站信息庫(kù);若在所述正?;拘畔?kù)中未查詢到所述基站信息,則確定對(duì)應(yīng)的基站異常,若在所述正?;拘畔?kù)中查詢到所述基站信息。若在所述正常基站信息庫(kù)中查詢到所述基站信息,則確定對(duì)應(yīng)基站的地理位置是否正常;若所述地理位置不正常,則確定所述基站異常,若所述地理位置正常,則確定對(duì)應(yīng)的基站正常。
其中,所述正?;拘畔?kù)中包含基站信息和/或終端設(shè)備的定位信息。所述基站信息包含但不限于以下至少一項(xiàng)信息:移動(dòng)國(guó)家號(hào)mcc、移動(dòng)網(wǎng)絡(luò)號(hào)碼mnc、位置區(qū)碼lac和基站標(biāo)識(shí)cid。
具體可通過(guò)如下方式建立正?;拘畔?kù):當(dāng)用戶請(qǐng)求云端接口時(shí),在請(qǐng)求參數(shù)中攜帶終端設(shè)備(例如,手機(jī))當(dāng)前接入基站的信息,包括mcc、mnc、lac和cid這四個(gè)參數(shù),且這四個(gè)參數(shù)可以唯一標(biāo)識(shí)一個(gè)基站,以及當(dāng)前終端設(shè)備的定位信息,包括文全球定位系統(tǒng)(globalpositioningsystem,gps)信息或者周圍wifi信息,當(dāng)上傳的數(shù)據(jù)中只有wifi信息時(shí),云端處理模塊可根據(jù)wifi的bssid標(biāo)識(shí)反查出定位信息。并將基站的mcc|mnc|lac|cid以及當(dāng)前定位信息、記錄次數(shù)count(表示有幾個(gè)用戶接入基站)、持續(xù)時(shí)間duration作為鍵值對(duì)存儲(chǔ)在數(shù)據(jù)庫(kù)中,數(shù)據(jù)格式為mcc|mnc|lac|cid:[((latitude1,longitude1):(count1,duration1)),((latitude2,longitude2):(count2,duration2))],其中,count1和duration1為接入用戶1和接入持續(xù)時(shí)間,latitude1和longitude1為接入用戶1位置的經(jīng)度和緯度,count2和duration2為接入用戶2和接入持續(xù)時(shí)間,latitude2和longitude2為接入用戶2位置的經(jīng)度和緯度,當(dāng)紀(jì)錄次數(shù)和持續(xù)時(shí)間達(dá)到預(yù)設(shè)閾值,該對(duì)應(yīng)的mcc|mnc|lac|cid:(latitude,longitude)寫入正常基站信息庫(kù)。因此,本實(shí)施例中的正?;拘畔?kù)不僅包含了基站信息,還包括了終端設(shè)備的定位信息,從而避免了偽基站冒用正?;镜纳矸輼?biāo)識(shí)導(dǎo)致的較多誤判和漏判,能夠更加準(zhǔn)確的識(shí)別基站是否異常。
s302、若確定所述基站異常,采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別。
s303、根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
本實(shí)施例通過(guò)根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常,只有確定基站異常時(shí),才觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作,進(jìn)一步提高偽基站識(shí)別效率。
實(shí)施例四
圖4是本發(fā)明實(shí)施例四提供的一種偽基站短信識(shí)別方法的流程圖。本實(shí)施例以上述實(shí)施例為基礎(chǔ)進(jìn)行優(yōu)化,在本實(shí)施例中,進(jìn)一步包括如下步驟:在所述終端設(shè)備接收到所述待識(shí)別短信時(shí),確定所述終端設(shè)備當(dāng)前使用的通信網(wǎng)絡(luò)類型;根據(jù)所述網(wǎng)絡(luò)通信類型觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
相應(yīng)的,本實(shí)施例的方法具體包括:
s401、在所述終端設(shè)備接收到所述待識(shí)別短信時(shí),確定所述終端設(shè)備當(dāng)前使用的通信網(wǎng)絡(luò)類型。
其中,通信網(wǎng)絡(luò)類型包括但不限于移動(dòng)網(wǎng)絡(luò)類型和wifi網(wǎng)絡(luò)類型。
s402、根據(jù)所述網(wǎng)絡(luò)通信類型采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別。
具體的,若所述網(wǎng)絡(luò)通信類型為移動(dòng)網(wǎng)絡(luò)類型,且采用所述移動(dòng)網(wǎng)絡(luò)類型首次請(qǐng)求云端接口失敗后,則緩存所述待識(shí)別短信信息(例如,短信內(nèi)容、接收短信時(shí)的基站信息及周邊掃描到的wifi信息),待移動(dòng)網(wǎng)絡(luò)恢復(fù)后再次請(qǐng)求云端接口,并觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作;或所述網(wǎng)絡(luò)通信類型為wifi網(wǎng)絡(luò)類型,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
例如,當(dāng)用戶接收到短信時(shí)判斷當(dāng)前網(wǎng)絡(luò)通信類型,如果是移動(dòng)網(wǎng)絡(luò),則請(qǐng)求云端接口,如果超時(shí)失敗,則在客戶端緩存該條短信、接收短信時(shí)的基站信息及周邊掃描到的wifi信息。待網(wǎng)絡(luò)恢復(fù)后再請(qǐng)求云端接口,并觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。如果識(shí)別為偽基站短信,則給用戶發(fā)出預(yù)警,提示這條歷史短信為偽基站短信;如果請(qǐng)求云端接口成功,則識(shí)別為非偽基站短信。當(dāng)用戶當(dāng)前網(wǎng)絡(luò)是wifi網(wǎng)絡(luò)時(shí),則請(qǐng)求云端接口,并觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。如果識(shí)別為偽基站短信,給用戶發(fā)出預(yù)警,提示用戶注意風(fēng)險(xiǎn)。從而解決了現(xiàn)有技術(shù)中,在終端設(shè)備連接網(wǎng)絡(luò)為wifi網(wǎng)絡(luò)時(shí),不能很好的進(jìn)行偽基站識(shí)別的問(wèn)題。
s403、根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
本實(shí)施例通過(guò)根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常,只有確定基站異常時(shí),才觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作,進(jìn)一步提高偽基站識(shí)別效率。
實(shí)施例五
圖5是本發(fā)明實(shí)施例五提供的一種偽基站短信識(shí)別裝置的結(jié)構(gòu)圖。本實(shí)施例可適用于偽基站短信識(shí)別的情況,該裝置可采用軟件和/或硬件的方式實(shí)現(xiàn),該裝置可集成在終端設(shè)備中或終端設(shè)備的應(yīng)用端中。其中,終端設(shè)備可以為但不限于為移動(dòng)終端(平板電腦或智能手機(jī))。
其中,應(yīng)用端可以為內(nèi)嵌于終端設(shè)備中的某個(gè)客戶端的插件,或者為所述終端設(shè)備的操作系統(tǒng)的插件,與內(nèi)嵌于終端設(shè)備中的偽基站短信識(shí)別客戶端或者終端設(shè)備的操作系統(tǒng)中的偽基站短信識(shí)別應(yīng)用程序配合使用;應(yīng)用端也可以為所述終端設(shè)備中一個(gè)獨(dú)立的可提供偽基站短信識(shí)別的客戶端,本實(shí)施例對(duì)此不進(jìn)行限制。
如圖5所示,所述裝置包括:異常識(shí)別模塊501和偽基站短信確定模塊502,其中:
異常識(shí)別模塊501用于采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別;
偽基站短信確定模塊502用于根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
本實(shí)施例的偽基站短信識(shí)別裝置用于執(zhí)行上述各實(shí)施例的偽基站短信識(shí)別方法,其技術(shù)原理和產(chǎn)生的技術(shù)效果類似,這里不再贅述。
在上述各實(shí)施例的基礎(chǔ)上,所述裝置還包括:文本提取模塊503和模型訓(xùn)練模塊504;
文本提取模塊503用于提取已知偽基站短信的文本特征和/或已知正常短信的文本特征,并進(jìn)行標(biāo)記;
模型訓(xùn)練模塊504用于采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型。
在上述各實(shí)施例的基礎(chǔ)上,所述模型訓(xùn)練模塊504具體用于:將標(biāo)記后的文本特征劃分為訓(xùn)練數(shù)據(jù)樣本集和驗(yàn)證數(shù)據(jù)樣本集;采用機(jī)器學(xué)習(xí)算法對(duì)所述訓(xùn)練數(shù)據(jù)樣本集進(jìn)行模型訓(xùn)練,得到初始短信異常識(shí)別模型;采用所述驗(yàn)證數(shù)據(jù)樣本集對(duì)所述初始短信異常識(shí)別模型進(jìn)行驗(yàn)證,若通過(guò)驗(yàn)證,則將所述初始短信異常識(shí)別模型作為所述短信異常識(shí)別模型。
在上述各實(shí)施例的基礎(chǔ)上,所述裝置還包括:基站異常確定模塊505;
基站異常確定模塊505用于根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常;若確定所述基站異常,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
在上述各實(shí)施例的基礎(chǔ)上,所述基站異常確定模塊505具體用于:所述云端接口請(qǐng)求消息中包含基站信息,根據(jù)所述基站信息查詢正?;拘畔?kù);若在所述正?;拘畔?kù)中未查詢到所述基站信息,則確定對(duì)應(yīng)的基站異常。
在上述各實(shí)施例的基礎(chǔ)上,所述基站異常確定模塊505還用于:若在所述正?;拘畔?kù)中查詢到所述基站信息,則確定對(duì)應(yīng)基站的地理位置是否正常;若所述地理位置不正常,則確定所述基站異常。
在上述各實(shí)施例的基礎(chǔ)上,所述裝置還包括:網(wǎng)絡(luò)類型確定模塊506;
網(wǎng)絡(luò)類型確定模塊506用于在所述終端設(shè)備接收到所述待識(shí)別短信時(shí),確定所述終端設(shè)備當(dāng)前使用的通信網(wǎng)絡(luò)類型;根據(jù)所述網(wǎng)絡(luò)通信類型觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
在上述各實(shí)施例的基礎(chǔ)上,所述網(wǎng)絡(luò)類型確定模塊具體用于:若所述網(wǎng)絡(luò)通信類型為移動(dòng)網(wǎng)絡(luò)類型,且采用所述移動(dòng)網(wǎng)絡(luò)類型首次請(qǐng)求云端接口失敗后,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作;或所述網(wǎng)絡(luò)通信類型為wifi網(wǎng)絡(luò)類型,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
在上述各實(shí)施例的基礎(chǔ)上,所述正?;拘畔?kù)中包含基站信息和/或終端設(shè)備的定位信息。
在上述各實(shí)施例的基礎(chǔ)上,所述基站信息包含以下至少一項(xiàng)信息:移動(dòng)國(guó)家號(hào)mcc、移動(dòng)網(wǎng)絡(luò)號(hào)碼mnc、位置區(qū)碼lac和基站標(biāo)識(shí)cid。
上述各實(shí)施例所提供的偽基站短信識(shí)別裝置可執(zhí)行本發(fā)明任意實(shí)施例所提供的偽基站短信識(shí)別方法,具備執(zhí)行偽基站短信識(shí)別方法相應(yīng)的功能模塊和有益效果。
實(shí)施例六
圖6為本發(fā)明實(shí)施例六提供的一種設(shè)備的結(jié)構(gòu)示意圖。圖6示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)設(shè)備12的框圖。圖6顯示的計(jì)算機(jī)設(shè)備12僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來(lái)任何限制。
如圖6所示,計(jì)算機(jī)設(shè)備12以通用計(jì)算設(shè)備的形式表現(xiàn)。計(jì)算機(jī)設(shè)備12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器或者處理單元16,系統(tǒng)存儲(chǔ)器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲(chǔ)器28和處理單元16)的總線18。
總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來(lái)說(shuō),這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(isa)總線,微通道體系結(jié)構(gòu)(mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)協(xié)會(huì)(vesa)局域總線以及外圍組件互連(pci)總線。
計(jì)算機(jī)設(shè)備12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計(jì)算機(jī)設(shè)備12訪問(wèn)的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。
系統(tǒng)存儲(chǔ)器28可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(ram)30和/或高速緩存存儲(chǔ)器32。計(jì)算機(jī)設(shè)備12可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,存儲(chǔ)系統(tǒng)34可以用于讀寫不可移動(dòng)的、非易失性磁介質(zhì)(圖6未顯示,通常稱為“硬盤驅(qū)動(dòng)器”)。盡管圖6中未示出,可以提供用于對(duì)可移動(dòng)非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動(dòng)器,以及對(duì)可移動(dòng)非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過(guò)一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線18相連。存儲(chǔ)器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。
具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲(chǔ)在例如存儲(chǔ)器28中,這樣的程序模塊42包括——但不限于——操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。
計(jì)算機(jī)設(shè)備12也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該計(jì)算機(jī)設(shè)備12交互的設(shè)備通信,和/或與使得該計(jì)算機(jī)設(shè)備12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口22進(jìn)行。并且,計(jì)算機(jī)設(shè)備12還可以通過(guò)網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖6所示,網(wǎng)絡(luò)適配器20通過(guò)總線18與計(jì)算機(jī)設(shè)備12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合計(jì)算機(jī)設(shè)備12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。
處理單元16通過(guò)運(yùn)行存儲(chǔ)在系統(tǒng)存儲(chǔ)器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的偽基站短信識(shí)別方法:
采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別;
根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
進(jìn)一步的,所述方法還包括:
提取已知偽基站短信的文本特征和/或已知正常短信的文本特征,并進(jìn)行標(biāo)記;
采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型。
進(jìn)一步的,所述采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型包括:
將標(biāo)記后的文本特征劃分為訓(xùn)練數(shù)據(jù)樣本集和驗(yàn)證數(shù)據(jù)樣本集;
采用機(jī)器學(xué)習(xí)算法對(duì)所述訓(xùn)練數(shù)據(jù)樣本集進(jìn)行模型訓(xùn)練,得到初始短信異常識(shí)別模型;
采用所述驗(yàn)證數(shù)據(jù)樣本集對(duì)所述初始短信異常識(shí)別模型進(jìn)行驗(yàn)證,若通過(guò)驗(yàn)證,則將所述初始短信異常識(shí)別模型作為所述短信異常識(shí)別模型。
進(jìn)一步的,所述方法還包括:
根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常;
若確定所述基站異常,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
進(jìn)一步的,所述根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常包括:
所述云端接口請(qǐng)求消息中包含基站信息,根據(jù)所述基站信息查詢正?;拘畔?kù);
若在所述正?;拘畔?kù)中未查詢到所述基站信息,則確定對(duì)應(yīng)的基站異常。
進(jìn)一步的,所述方法還包括:
若在所述正?;拘畔?kù)中查詢到所述基站信息,則確定對(duì)應(yīng)基站的地理位置是否正常;
若所述地理位置不正常,則確定所述基站異常。
進(jìn)一步的,所述方法還包括:
在所述終端設(shè)備接收到所述待識(shí)別短信時(shí),確定所述終端設(shè)備當(dāng)前使用的通信網(wǎng)絡(luò)類型;
根據(jù)所述網(wǎng)絡(luò)通信類型觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
進(jìn)一步的,所述根據(jù)所述網(wǎng)絡(luò)通信類型觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作包括:
若所述網(wǎng)絡(luò)通信類型為移動(dòng)網(wǎng)絡(luò)類型,且采用所述移動(dòng)網(wǎng)絡(luò)類型首次請(qǐng)求云端接口失敗后,則緩存所述待識(shí)別短信信息,待移動(dòng)網(wǎng)絡(luò)恢復(fù)后再次請(qǐng)求云端接口,并觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作;或所述網(wǎng)絡(luò)通信類型為wifi網(wǎng)絡(luò)類型,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
進(jìn)一步的,所述正?;拘畔?kù)中包含基站信息和/或終端設(shè)備的定位信息。
進(jìn)一步的,所述基站信息包含以下至少一項(xiàng)信息:移動(dòng)國(guó)家號(hào)mcc、移動(dòng)網(wǎng)絡(luò)號(hào)碼mnc、位置區(qū)碼lac和基站標(biāo)識(shí)cid。
實(shí)施例七
本發(fā)明實(shí)施例7還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本申請(qǐng)所有發(fā)明實(shí)施例提供的偽基站短信識(shí)別方法:
采用預(yù)先建立的短信異常識(shí)別模型對(duì)待識(shí)別短信進(jìn)行異常識(shí)別;
根據(jù)所述短信異常識(shí)別模型的輸出結(jié)果確定所述待識(shí)別短信是否為偽基站短信。
進(jìn)一步的,所述方法還包括:
提取已知偽基站短信的文本特征和/或已知正常短信的文本特征,并進(jìn)行標(biāo)記;
采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型。
進(jìn)一步的,所述采用機(jī)器學(xué)習(xí)算法對(duì)標(biāo)記后的文本特征進(jìn)行訓(xùn)練到短信異常識(shí)別模型包括:
將標(biāo)記后的文本特征劃分為訓(xùn)練數(shù)據(jù)樣本集和驗(yàn)證數(shù)據(jù)樣本集;
采用機(jī)器學(xué)習(xí)算法對(duì)所述訓(xùn)練數(shù)據(jù)樣本集進(jìn)行模型訓(xùn)練,得到初始短信異常識(shí)別模型;
采用所述驗(yàn)證數(shù)據(jù)樣本集對(duì)所述初始短信異常識(shí)別模型進(jìn)行驗(yàn)證,若通過(guò)驗(yàn)證,則將所述初始短信異常識(shí)別模型作為所述短信異常識(shí)別模型。
進(jìn)一步的,所述方法還包括:
根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常;
若確定所述基站異常,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
進(jìn)一步的,所述根據(jù)接收所述待識(shí)別短信的終端設(shè)備發(fā)送的云端接口請(qǐng)求消息確定當(dāng)前發(fā)送所述待識(shí)別短信的基站是否異常包括:
所述云端接口請(qǐng)求消息中包含基站信息,根據(jù)所述基站信息查詢正?;拘畔?kù);
若在所述正常基站信息庫(kù)中未查詢到所述基站信息,則確定對(duì)應(yīng)的基站異常。
進(jìn)一步的,所述方法還包括:
若在所述正?;拘畔?kù)中查詢到所述基站信息,則確定對(duì)應(yīng)基站的地理位置是否正常;
若所述地理位置不正常,則確定所述基站異常。
進(jìn)一步的,所述方法還包括:
在所述終端設(shè)備接收到所述待識(shí)別短信時(shí),確定所述終端設(shè)備當(dāng)前使用的通信網(wǎng)絡(luò)類型;
根據(jù)所述網(wǎng)絡(luò)通信類型觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
進(jìn)一步的,所述根據(jù)所述網(wǎng)絡(luò)通信類型觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作包括:
若所述網(wǎng)絡(luò)通信類型為移動(dòng)網(wǎng)絡(luò)類型,且采用所述移動(dòng)網(wǎng)絡(luò)類型首次請(qǐng)求云端接口失敗后,則緩存所述待識(shí)別短信信息,待移動(dòng)網(wǎng)絡(luò)恢復(fù)后再次請(qǐng)求云端接口,并觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作;或所述網(wǎng)絡(luò)通信類型為wifi網(wǎng)絡(luò)類型,則觸發(fā)執(zhí)行對(duì)待識(shí)別短信進(jìn)行短信異常識(shí)別的操作。
進(jìn)一步的,所述正?;拘畔?kù)中包含基站信息和/或終端設(shè)備的定位信息。
進(jìn)一步的,所述基站信息包含以下至少一項(xiàng)信息:移動(dòng)國(guó)家號(hào)mcc、移動(dòng)網(wǎng)絡(luò)號(hào)碼mnc、位置區(qū)碼lac和基站標(biāo)識(shí)cid。
本發(fā)明實(shí)施例的計(jì)算機(jī)存儲(chǔ)介質(zhì),可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于無(wú)線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設(shè)計(jì)語(yǔ)言或其組合來(lái)編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、smalltalk、c++,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如“c”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。
注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過(guò)以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說(shuō)明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。