两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

短信攔截方法及裝置、云端服務(wù)器的制造方法

文檔序號(hào):7812039閱讀:323來(lái)源:國(guó)知局
短信攔截方法及裝置、云端服務(wù)器的制造方法
【專利摘要】本發(fā)明提供了一種短信攔截方法及裝置、云端服務(wù)器,其中,所述短信攔截方法包括:接收短信攔截裝置上傳的短信;對(duì)短信的文本內(nèi)容進(jìn)行分詞處理,獲得文本內(nèi)容的關(guān)鍵詞;獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;獲取關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;根據(jù)第一聯(lián)合概率和所述第二聯(lián)合概率,確定短信是否屬于垃圾短信;向短信攔截裝置發(fā)送通知信息,通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。上述方法能夠解決現(xiàn)有技術(shù)中垃圾短信識(shí)別率低、攔截效率低,成本高的問(wèn)題。
【專利說(shuō)明】短信攔截方法及裝置、云端服務(wù)器

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種短信攔截方法及裝置、云端服務(wù)器。

【背景技術(shù)】
[0002]隨著移動(dòng)通信業(yè)務(wù)的發(fā)展、手機(jī)的普及和短信的資費(fèi)的下降,用戶使用短信傳遞信息越來(lái)越多。但是,用戶接收廣告短信、詐騙短信等垃圾短信的次數(shù)越來(lái)越多,垃圾短信越來(lái)越泛濫,已經(jīng)嚴(yán)重影響到用戶對(duì)短信使用的感受,超出了用戶的忍受限度。針對(duì)垃圾短信進(jìn)行治理已經(jīng)刻不容緩。
[0003]目前,垃圾短信治理主要采用了自動(dòng)過(guò)濾和人工過(guò)濾兩種手段。垃圾短信的攔截主要有三種方式:(I)通過(guò)關(guān)鍵字自動(dòng)過(guò)濾滿足條件的用戶進(jìn)入黑名單;(2)滿足一定寬松過(guò)濾條件的短信由人工臺(tái)審核,人工臺(tái)確認(rèn)是垃圾短信的將用戶加入黑名單;(3)接收垃圾短信用戶發(fā)送短信舉報(bào),人工臺(tái)審核確認(rèn)是垃圾短信后將被舉報(bào)手機(jī)號(hào)碼加入黑名單。
[0004]從目前的垃圾短信的治理所采用的幾種手段的結(jié)果來(lái)看,垃圾短信發(fā)送者往往通過(guò)特殊格式變化和發(fā)送流量控制來(lái)規(guī)避自動(dòng)過(guò)濾,所以自動(dòng)過(guò)濾的攔截效率很低。
[0005]人工臺(tái)審核確認(rèn)需要人工臺(tái)24小時(shí)的值班人員來(lái)審核用戶通過(guò)短信舉報(bào)所舉報(bào)的垃圾內(nèi)容,確認(rèn)是垃圾短信則將用戶添加到黑名單。如果不進(jìn)行人工審核,往往會(huì)發(fā)生惡意舉報(bào)別人或誤舉報(bào)的情況。而通過(guò)人工臺(tái)來(lái)過(guò)濾垃圾短信成本太高,而且信息安全受影響。
[0006]綜上所述,從目前的垃圾短信的治理情況來(lái)看,垃圾短信自動(dòng)過(guò)濾效果不好,而人工臺(tái)過(guò)濾垃圾短信則成本太高。


【發(fā)明內(nèi)容】

[0007]針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種短信攔截方法及裝置、云端服務(wù)器,解決現(xiàn)有技術(shù)中垃圾短信識(shí)別率低、攔截效率低,成本高的問(wèn)題。
[0008]第一方面,本發(fā)明提供了一種短信攔截方法,包括:
[0009]接收短信攔截裝置上傳的短信;
[0010]對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞;
[0011]獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;
[0012]獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;
[0013]根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信;
[0014]向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0015]可選地,所述獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值,包括:
[0016]針對(duì)每一個(gè)關(guān)鍵詞,
[0017]在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值;
[0018]將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值;
[0019]將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0020]可選地,對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,包括:
[0021]在所述文本內(nèi)容包括特殊符號(hào)時(shí),剔除所述文本內(nèi)容的特殊符號(hào),對(duì)剔除特殊符號(hào)的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性;
[0022]根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0023]可選地,對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,還包括:
[0024]在所述文本內(nèi)容包括數(shù)字和/或字母時(shí),對(duì)所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0025]相應(yīng)地,根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信為垃圾短信之后,所述方法還包括:
[0026]判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種;
[0027]如果是,則將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中。
[0028]可選地,接收短信攔截裝置上傳的短信之后,所述方法還包括:
[0029]確定所述短信的源號(hào)碼,并確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量;
[0030]若所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量超過(guò)預(yù)設(shè)閾值,則向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息,且不執(zhí)行對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理的步驟。
[0031]第二方面,本發(fā)明提供一種短信攔截方法,包括:
[0032]對(duì)終端中的短信接收事件進(jìn)行監(jiān)測(cè),獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼;
[0033]確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信;
[0034]接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短的息;
[0035]根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0036]可選地,確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之前,所述方法還包括:
[0037]接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞;
[0038]所述確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之后,所述方法還包括:
[0039]提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;
[0040]在所述敏感詞與所述特征詞匹配時(shí),將當(dāng)前接收的短信作為攔截對(duì)象進(jìn)行攔截,則不執(zhí)行所述將上述短信上傳云端服務(wù)器的步驟;
[0041]在所述敏感詞與所述特征詞不匹配時(shí),執(zhí)行所述將所述短信上傳云端服務(wù)器的步驟。
[0042]可選地,所述提取所述短信的文本內(nèi)容中的敏感詞,包括:
[0043]對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個(gè)敏感詞和最后一個(gè)敏感詞;
[0044]所述查看所述敏感詞與所述特征詞是否匹配的步驟,包括:
[0045]查看所述第一個(gè)敏感詞與所述特征詞是否匹配,或者,查看所述最后一個(gè)敏感詞與所述特征詞是否匹配。
[0046]第三方面,本發(fā)明提供一種云端服務(wù)器,包括:
[0047]接收模塊,用于接收短信攔截裝置上傳的短信;
[0048]關(guān)鍵詞獲取模塊,用于對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞;
[0049]關(guān)鍵詞的概率權(quán)重值獲取模塊,用于獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;
[0050]關(guān)鍵詞的聯(lián)合概率獲取模塊,用于獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;
[0051]判斷模塊,用于根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信;
[0052]發(fā)送模塊,還用于向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0053]可選地,關(guān)鍵詞的概率權(quán)重值獲取模塊,具體用于:
[0054]針對(duì)每一個(gè)關(guān)鍵詞,
[0055]在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值;
[0056]將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值;
[0057]將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0058]可選地,所述關(guān)鍵詞獲取模塊,具體用于
[0059]在所述文本內(nèi)容包括特殊符號(hào)時(shí),剔除所述文本內(nèi)容的特殊符號(hào),對(duì)剔除特殊符號(hào)的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性;
[0060]根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0061]可選地,所述關(guān)鍵詞獲取模塊,還用于
[0062]在所述文本內(nèi)容包括數(shù)字和/或字母時(shí),對(duì)所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0063]所述云端服務(wù)器還包括:
[0064]號(hào)碼判斷模塊,用于判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種;
[0065]黑名單更新模塊,用于在所述號(hào)碼判斷模塊確定所述文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種時(shí),將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中。
[0066]可選地,所述云端服務(wù)器還包括:
[0067]源號(hào)碼獲取模塊,用于確定所述短信的源號(hào)碼,并確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量;
[0068]相應(yīng)地,所述發(fā)送模塊,還用于在所述源號(hào)碼獲取模塊確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息。
[0069]第四方面,本發(fā)明提供一種短信攔截裝置,包括:
[0070]監(jiān)控模塊,用于對(duì)終端中的短信接收事件進(jìn)行監(jiān)測(cè),獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼;
[0071]判斷模塊,用于確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼;
[0072]發(fā)送模塊,用于在所述判斷模塊確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信;
[0073]接收模塊,用于接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息;
[0074]短信攔截模塊,用于根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0075]可選地,所述接收模塊,還用于在判斷模塊確定所述短信對(duì)應(yīng)的電話號(hào)碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之前,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞;
[0076]所述裝置還包括:
[0077]提取模塊,用于在所述判斷模塊確定所述短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之后,提取所述短信的文本內(nèi)容中的敏感詞;
[0078]查看匹配模塊,用于查看所述提取模塊提取的敏感詞與所述特征詞是否匹配;
[0079]所述短信攔截模塊,還用于在所述查看匹配模塊確定所述敏感詞與所述特征詞不匹配時(shí),將當(dāng)前接收的短信作為攔截對(duì)象進(jìn)行攔截。
[0080]可選地,所述提取模塊,具體用于
[0081]對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個(gè)敏感詞和最后一個(gè)敏感詞;
[0082]查看匹配模塊,具體用于
[0083]查看所述第一個(gè)敏感詞與所述特征詞是否匹配,或者,查看所述最后一個(gè)敏感詞與所述特征詞是否匹配。
[0084]由上述技術(shù)方案可知,本發(fā)明的短信攔截方法及裝置、云端服務(wù)器,通過(guò)短信攔截裝置將短信上報(bào)到云端服務(wù)器,由云端服務(wù)器通過(guò)短信對(duì)應(yīng)的關(guān)鍵詞屬于正常短信和垃圾短信的概率,確定短信是否為垃圾短信,進(jìn)而可提高垃圾短信的識(shí)別率,同時(shí)提高垃圾短信的攔截效率,降低短信攔截的成本。

【專利附圖】

【附圖說(shuō)明】
[0085]圖1為本發(fā)明一實(shí)施例提供的短信攔截方法的流程示意圖;
[0086]圖2A為本發(fā)明另一實(shí)施例提供的短信攔截方法的流程示意圖;
[0087]圖2B為本發(fā)明一實(shí)施例提供的短信攔截記錄的示意圖;
[0088]圖2C為垃圾短信的文本內(nèi)容的示意圖;
[0089]圖3為本發(fā)明一實(shí)施例提供的云端服務(wù)器的結(jié)構(gòu)示意圖;
[0090]圖4為本發(fā)明一實(shí)施例提供的短信攔截裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0091]下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說(shuō)明本發(fā)明,但不用來(lái)限制本發(fā)明的范圍。
[0092]圖1示出了本發(fā)明一實(shí)施例提供的短信攔截方法的流程示意圖,如圖1所示,本實(shí)施例的短信攔截方法如下所述。
[0093]步驟101,接收短信攔截裝置上傳的短信。
[0094]在本實(shí)施例中,短信攔截裝置可位于終端內(nèi),用于監(jiān)控終端接收的短信。該終端可為能夠接收短信的終端。
[0095]步驟102,對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0096]為了準(zhǔn)確識(shí)別文本內(nèi)容的關(guān)鍵詞,可先剔除短信的文本內(nèi)容中的特殊字符,再?gòu)奶蕹厥庾址蟮亩绦诺奈谋緝?nèi)容進(jìn)行分詞處理,將分詞處理后的每一詞/字可與預(yù)先設(shè)定的關(guān)鍵詞數(shù)據(jù)庫(kù)進(jìn)行比對(duì),將屬于關(guān)鍵詞數(shù)據(jù)庫(kù)中的詞/字作為該短信的文本內(nèi)容的關(guān)鍵詞。
[0097]預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫(kù)可包括:票、發(fā)票、稅、平方、抵押等。上述待剔除的特殊字符可包括:空格、下劃線,“<§”、“#”、“&” “一”等等,本實(shí)施例僅為舉例說(shuō)明。
[0098]當(dāng)短信的文本內(nèi)容為“發(fā)@票&代#開(kāi),請(qǐng)#聯(lián)!系1223322”,剔除特殊字符后,該短信的文本內(nèi)容變?yōu)椤鞍l(fā)票代開(kāi),請(qǐng)聯(lián)系1223322”。其對(duì)應(yīng)的關(guān)鍵詞可為“發(fā)票、代、聯(lián)系”。
[0099]舉例來(lái)說(shuō),采用當(dāng)前的分詞處理系統(tǒng)對(duì)短信的文本內(nèi)容進(jìn)行分詞處理,進(jìn)而采用條件隨機(jī)場(chǎng)模型/關(guān)鍵詞正則方式/統(tǒng)計(jì)方式獲取所述分詞處理后的文本內(nèi)容的關(guān)鍵詞/關(guān)鍵信息。例如,可從剔除特殊字符后的短信的文本內(nèi)容進(jìn)行分詞處理后,采用條件隨機(jī)場(chǎng)模型獲取所述分詞處理后的文本內(nèi)容的關(guān)鍵詞/關(guān)鍵信息??衫斫獾氖?,短信的文本內(nèi)容中的沒(méi)有實(shí)際意義的虛詞(如標(biāo)點(diǎn)、助動(dòng)詞、語(yǔ)氣詞、嘆詞、擬聲詞等)可不作為該短信的文本內(nèi)容的關(guān)鍵詞。
[0100]本實(shí)施例中,對(duì)短信的文本內(nèi)容進(jìn)行分詞獲取關(guān)鍵詞的方式可以有多種,本實(shí)施例不對(duì)其進(jìn)行限定。
[0101]步驟103,獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值。
[0102]可理解的是,可根據(jù)預(yù)先訓(xùn)練的貝葉斯模型確定第一概率權(quán)重值和第二概率權(quán)重值。
[0103]具體地,針對(duì)每一個(gè)關(guān)鍵詞,可在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取該特征詞的正向權(quán)重值和負(fù)向權(quán)重值,將該特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值,將該特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0104]在本實(shí)施例中,一個(gè)關(guān)鍵詞對(duì)應(yīng)的第一概率權(quán)重值用于表不包含該關(guān)鍵詞的短信為垃圾短信的概率,相應(yīng)的,第二概率權(quán)重值用于表示包含該關(guān)鍵詞的短信為正常短信的概率。
[0105]步驟104,獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率。
[0106]可理解的是,該步驟中的第一聯(lián)合概率是用于表示短信文本內(nèi)容中所有關(guān)鍵詞組合在一起屬于垃圾短信的概率,第二聯(lián)合概率是用于表示短信的文本內(nèi)容中所有關(guān)鍵詞組合在一起屬于正常短信的概率。
[0107]在具體應(yīng)用中,第一聯(lián)合概率可以為各個(gè)關(guān)鍵詞對(duì)應(yīng)的第一概率權(quán)重值的加和,第二聯(lián)合概率可以為各個(gè)關(guān)鍵詞對(duì)應(yīng)的第二概率權(quán)重值的加和?;蛘咭部梢詾榈谝宦?lián)合概率還可以為各個(gè)關(guān)鍵詞對(duì)應(yīng)的第一概率權(quán)重值的加權(quán)乘積,第二聯(lián)合概率可以為各個(gè)關(guān)鍵詞對(duì)應(yīng)的第二概率權(quán)重值的加權(quán)乘積等,本實(shí)施例不對(duì)其進(jìn)行限定。
[0108]步驟105,根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信。
[0109]也就是說(shuō),可以根據(jù)第一聯(lián)合概率和所述第二聯(lián)合概率的大小確定所述的短信是否為垃圾短信,或者也可以根據(jù)第一聯(lián)合概率和第二聯(lián)合概率的差值與預(yù)設(shè)值之間的關(guān)系確定所述的短信是否為垃圾短信。其具體的判斷方式,可根據(jù)實(shí)際需求設(shè)置。
[0110]步驟106,向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短?目。
[0111]本發(fā)明實(shí)施例中,在短信攔截裝置無(wú)法確定監(jiān)控的終端中的短信是否為垃圾短信時(shí),將短信上報(bào)云端,由云端確定短信是否為垃圾信息,可節(jié)省終端本地側(cè)的存儲(chǔ)空間,同時(shí),提高垃圾短信的識(shí)別率,以及垃圾短信的攔截效率,降低短信攔截的成本。
[0112]在具體應(yīng)用中,短信的文本內(nèi)容可能包括特殊符號(hào)和字母等信息,此時(shí)針對(duì)圖1中所示方法的步驟102,可具體說(shuō)明如下:
[0113]在短信的文本內(nèi)容包括特殊符號(hào)時(shí),剔除所述文本內(nèi)容的特殊符號(hào),對(duì)剔除特殊符號(hào)的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性,確定相鄰中文詞/字的組合性;
[0114]進(jìn)而可根據(jù)分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲取短信的文本內(nèi)容的關(guān)鍵詞。
[0115]例如,包含“代開(kāi)發(fā)丨丨票”的文本內(nèi)容,可剔除特殊符號(hào)“丨丨”進(jìn)而可對(duì)“代開(kāi)發(fā)票”進(jìn)行分詞處理,得到“代開(kāi)”、“開(kāi)”、“發(fā)票”,根據(jù)該分詞處理后的詞性,以及相鄰中文詞的組合性,獲得短信的文本內(nèi)容的關(guān)鍵詞“發(fā)票”或“開(kāi)發(fā)票”等。
[0116]另外,在短信的文本內(nèi)容包括數(shù)字和/或字母時(shí),對(duì)短信的文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0117]在上述圖1所示的方法中,若云端服務(wù)器確定短信的文本內(nèi)容屬于垃圾短信,則可執(zhí)行判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種的步驟;
[0118]在判斷文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號(hào)碼/座機(jī)號(hào)碼/賬號(hào)信息時(shí),將該手機(jī)號(hào)碼/座機(jī)號(hào)碼/賬號(hào)信息加入發(fā)送短信攔截裝置的黑名單中。
[0119]例如,一個(gè)短信的文本內(nèi)容如下:“錢打到這個(gè)卡上就可以了。建設(shè)銀行:62270007 3030 0027 930李婷”,由此,可將該建設(shè)銀行的賬號(hào)加入黑名單中。
[0120]可將更新的黑名單下發(fā)至短信攔截裝置,后續(xù)如果短信的文本內(nèi)容中包括上述的賬號(hào)信息,可將該短信直接攔截。
[0121]如圖2C所示,在圖2C所示的短信中,短信的文本內(nèi)容包括:數(shù)字和字母,但是,該數(shù)字“6”、“500”、“199”、“100”等不屬于電話號(hào)碼,也不屬于座機(jī)號(hào)碼及賬號(hào)信息,不對(duì)該短信內(nèi)容中的數(shù)字/字母進(jìn)行任何處理。
[0122]在實(shí)際應(yīng)用中,還可能出現(xiàn)的情況是:某一短信的文本內(nèi)容即包括特殊符號(hào),同時(shí)也包括數(shù)字,此時(shí),可預(yù)先將短信的文本內(nèi)容的特殊符號(hào)去除/剔除,在對(duì)剔除特殊符號(hào)之后的文本內(nèi)容進(jìn)行分詞處理,并提取剔除特殊符號(hào)之后的文本內(nèi)容中的數(shù)字。
[0123]當(dāng)然,在另一種具體應(yīng)用中,云端服務(wù)器在接收短信攔截裝置上傳的短信之后,在對(duì)短信的文本內(nèi)容進(jìn)行分詞處理之前,短信攔截方法還可包括如下的圖1中未示出的步驟:
[0124]步驟A01、確定發(fā)送短信的源號(hào)碼,并確定源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量。
[0125]例如,短信攔截裝置向云端服務(wù)器上傳一個(gè)短信,該短信包括發(fā)送短信的源號(hào)碼以及短信的文本內(nèi)容,此時(shí),根據(jù)發(fā)送短信的源號(hào)碼“ 1065980530022935”,確定該源號(hào)碼在一天之內(nèi)發(fā)送短信的數(shù)量。
[0126]另外,在確定短信的源號(hào)碼時(shí),可將附加在源號(hào)碼之前的部分?jǐn)?shù)字和/或符號(hào)去除,例如,源號(hào)碼為 “+086133XXXX”、“ 1069095599”,則可將“+086”、“ 10690” 去除,剩余“133XXXX”、“95599”為真正的源號(hào)碼。
[0127]步驟A02、若源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量超過(guò)預(yù)設(shè)閾值,則向短信攔截裝置發(fā)送短信為垃圾短信的信息。
[0128]如果上述源號(hào)碼“1065980530022935”在一天之內(nèi)發(fā)送短信的數(shù)量超過(guò)300條,則可認(rèn)為該源號(hào)碼的短信為垃圾短信。
[0129]當(dāng)然,云端服務(wù)器根據(jù)發(fā)送短信的源號(hào)碼確定短信為垃圾短信之后,可不再執(zhí)行前述的圖1中所示的對(duì)短信的文本內(nèi)容進(jìn)行分詞處理的步驟,以及后續(xù)的步驟。
[0130]在實(shí)際應(yīng)用中,云端服務(wù)器根據(jù)發(fā)送短信的源號(hào)碼不能確定短信為垃圾短信,如源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量沒(méi)有超過(guò)預(yù)設(shè)閾值,此時(shí),云端服務(wù)器可執(zhí)行前述的圖1中所示的對(duì)短信的文本內(nèi)容進(jìn)行分詞處理,以及后續(xù)的步驟。
[0131]在一種可能的實(shí)現(xiàn)方式中,前述圖1所示的方法中的步驟103可具體說(shuō)明如下:
[0132]針對(duì)每一個(gè)關(guān)鍵詞,可在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取該特征詞的正向權(quán)重值和負(fù)向權(quán)重值,將該特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值,將該特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0133]預(yù)先訓(xùn)練的貝葉斯模型中包括有多個(gè)特征詞,每一特征詞對(duì)應(yīng)有屬于正常短信的正向權(quán)重值,以及對(duì)應(yīng)有屬于垃圾短信的負(fù)向權(quán)重值。
[0134]通常,可根據(jù)特征詞的numl及預(yù)先設(shè)定的訓(xùn)練集中正常短信的文本總數(shù),計(jì)算該特征詞的正向權(quán)重值,其中,該numl為所述訓(xùn)練集中正常短信中包含該特征詞的文本的數(shù)量,特征詞的正向權(quán)重值可表征該特征詞屬于正常短信的概率/概率權(quán)重值。
[0135]根據(jù)特征詞的num2以及預(yù)先設(shè)定的訓(xùn)練集中垃圾短信的文本總數(shù),計(jì)算該特征詞的負(fù)向權(quán)重值,其中,num2為所述訓(xùn)練集中垃圾短信中包含該特征詞的文本的數(shù)量,特征詞的負(fù)向權(quán)重值可表征該特征詞屬于垃圾短信的概率/概率權(quán)重值。
[0136]舉例來(lái)說(shuō),如果包含特征詞“發(fā)票”的短信有100條,其中80條為垃圾短信,20條為正常短信,那么特征詞“發(fā)票”對(duì)應(yīng)的正向權(quán)重值為0.8,負(fù)向權(quán)重值為0.2。
[0137]上述實(shí)施例中的短信攔截方法,可用于通知短信攔截裝置是否對(duì)短信攔截裝置所屬終端接收到的短信是否進(jìn)行攔截,上述方法可在云端服務(wù)器中執(zhí)行,或者其他服務(wù)器中執(zhí)行,本實(shí)施例僅為舉例說(shuō)明。
[0138]圖2A示出了本發(fā)明另一實(shí)施例提供的短信攔截方法的流程示意圖,如圖2A所示,本實(shí)施例的短信攔截方法如下所述。
[0139]步驟201,對(duì)終端中的短信接收事件進(jìn)行監(jiān)測(cè),獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼。
[0140]在本實(shí)施例中,各個(gè)步驟的執(zhí)行主體可以是一運(yùn)行在移動(dòng)終端設(shè)備上的應(yīng)用程序,也即,在實(shí)際應(yīng)用中,可以開(kāi)發(fā)一款應(yīng)用程序,使其在運(yùn)行時(shí)能夠執(zhí)行本實(shí)施例中的各步驟操作。當(dāng)然,該應(yīng)用程序可以是一個(gè)獨(dú)立的應(yīng)用程序,也可以是另一應(yīng)用程序中的一個(gè)功能模塊,例如,在某手機(jī)安全軟件中增加本發(fā)明中的短信攔截功能等。
[0141]由于終端設(shè)備中的操作系統(tǒng)一般會(huì)為應(yīng)用程序開(kāi)放一些接口,供應(yīng)用程序從系統(tǒng)中獲取所需的信息。因此,本實(shí)施例中,難為了能夠?qū)K端設(shè)備中的短信事件進(jìn)行監(jiān)測(cè),可以利用終端的操作系統(tǒng)的這一特性,在操作系統(tǒng)中對(duì)應(yīng)用程序進(jìn)行注冊(cè),這樣,當(dāng)操作系統(tǒng)廣播通知消息時(shí),注冊(cè)的應(yīng)用程序能夠收聽(tīng)到這種通知消息,進(jìn)而可從中獲取所需的短信。
[0142]步驟202,確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短/[目是否屬于垃圾短/[目。
[0143]在本實(shí)施例中,預(yù)先設(shè)置的黑名單、白名單中的具體內(nèi)容本實(shí)施例不限定,為了能夠根據(jù)預(yù)先設(shè)置的黑、白名單來(lái)篩選需要攔截或放行的通信信息,本實(shí)施例提供的方法中,黑名單包括需要攔截的號(hào)碼,用于篩選需要攔截的短信,白名單包括可放行的號(hào)碼,用于篩選需要放行的短信。預(yù)先設(shè)置黑名單/白名單時(shí),可根據(jù)通訊錄中記錄的電話號(hào)碼來(lái)設(shè)置黑名單/白名單中的號(hào)碼,或者,將用戶輸入的號(hào)碼設(shè)置為黑名單/白名單中的號(hào)碼,本實(shí)施例不對(duì)設(shè)置黑名單/白名單的方式進(jìn)行限定。
[0144]可選地,該處的黑名單還可為預(yù)先從云端服務(wù)器下載的黑名單,本實(shí)施例不對(duì)其進(jìn)行限定。
[0145]本實(shí)施例中,云端服務(wù)器可根據(jù)前述圖1所示的方法確定短信是佛屬于垃圾短?目。
[0146]步驟203,接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息;
[0147]步驟204,根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0148]結(jié)合圖2Β所示,圖2Β示出了本實(shí)施例中采用上述方法對(duì)短信進(jìn)行攔截的短信攔截記錄。本實(shí)施例中,首先確定終端接收到的短信對(duì)應(yīng)的電話號(hào)碼是否為白名單或者黑名單中的號(hào)碼,如果不是,則說(shuō)明終端本身不能確定該短信是否需要攔截,此時(shí),短信攔截裝置將該短信上報(bào)云端服務(wù)器,由云端服務(wù)器執(zhí)行短信是否為垃圾信息的判斷。這樣一方面,由于短信攔截裝置不執(zhí)行這樣的判斷,減少了短信攔截裝置的資源消耗,另一方面,由于云端服務(wù)器具有更為強(qiáng)大的計(jì)算和存儲(chǔ)資源,能夠進(jìn)行更為復(fù)雜的判斷,可以提高判斷的準(zhǔn)確性。
[0149]本實(shí)施例中的短信攔截方法可提高短信攔截的準(zhǔn)確率,提高攔截效果,減少了用戶的操作量,節(jié)省了終端本地的存儲(chǔ)空間。
[0150]在具體應(yīng)用中,在步驟202之前,圖2Α所示的方法還可包括如下圖中未示出的子步驟201a:
[0151]步驟201a,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表中包括:需要攔截的短信的特征詞。
[0152]本實(shí)施例中的待攔截信息列表中的特征詞可為云端服務(wù)器中設(shè)置的屬于垃圾短信的特征詞。如“發(fā)票”、“買房”等等。如圖2C所示,圖2C中的“爆款”、“大牌”等屬于待攔截信息列表中的特征詞。
[0153]相應(yīng)地,在短信攔截方法中包括前述的步驟201a時(shí),圖2A所示的方法中的步驟202之前,該方法還可包括下述的圖中未示出的子步驟202a:
[0154]步驟202a,提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;在所述敏感詞與所述特征詞匹配時(shí),將當(dāng)前接收的短信作為攔截對(duì)象進(jìn)行攔截。
[0155]舉例來(lái)說(shuō),對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個(gè)敏感詞和最后一個(gè)敏感詞;
[0156]所述查看所述敏感詞與所述特征詞是否匹配的步驟,包括:
[0157]查看所述第一個(gè)敏感詞與所述特征詞是否匹配,或者,查看所述最后一個(gè)敏感詞與所述特征詞是否匹配。
[0158]通常,可對(duì)短信的文本內(nèi)容進(jìn)行特殊符號(hào)的剔除,在剔除特殊符號(hào)之后,可對(duì)文本內(nèi)容進(jìn)行分詞處理,以便獲取文本內(nèi)容中的敏感詞。
[0159]可選地,在本實(shí)施例的一個(gè)短信攔截方法,可包括步驟201、步驟201a和步驟202a?;蛘撸砂ú襟E201、步驟201a和確定短信的號(hào)碼不屬于黑名單和白名單的步驟,以及和步驟202a。
[0160]當(dāng)然,如果在步驟202a中,提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;在所述敏感詞與所述特征詞不匹配時(shí),將所述短信上傳云端服務(wù)器。
[0161]通過(guò)本實(shí)施例的短信攔截方法,能夠避免擴(kuò)大短信攔截裝置的攔截范圍,避免將明顯屬于攔截對(duì)象的短信上報(bào),避免對(duì)相應(yīng)資源的消耗。
[0162]圖3示出了本發(fā)明一實(shí)施例提供的云端服務(wù)器的結(jié)構(gòu)示意圖,如圖3所示,本實(shí)施例的云端服務(wù)器可包括:接收模塊31、關(guān)鍵詞獲取模塊32、關(guān)鍵詞的概率權(quán)重值獲取模塊33、關(guān)鍵詞的聯(lián)合概率獲取模塊34、判斷模塊35和發(fā)送模塊36 ;
[0163]其中,接收模塊31用于接收短信攔截裝置上傳的短信;
[0164]關(guān)鍵詞獲取模塊32用于對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞;
[0165]關(guān)鍵詞的概率權(quán)重值獲取模塊33用于獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;
[0166]關(guān)鍵詞的聯(lián)合概率獲取模塊34用于獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;
[0167]判斷模塊35用于根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信;
[0168]發(fā)送模塊36還用于向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0169]本實(shí)施例的云端服務(wù)器,通過(guò)獲取上報(bào)短信的文本內(nèi)容中的關(guān)鍵詞,確定關(guān)鍵詞屬于正常短信和垃圾短信的概率,進(jìn)而確定短信是否為垃圾短信,進(jìn)而可提高垃圾短信的識(shí)別率,同時(shí)提高垃圾短信的攔截效率,降低短信攔截的成本。
[0170]舉例來(lái)說(shuō),前述的關(guān)鍵詞的概率權(quán)重值獲取模塊33可具體用于:
[0171]針對(duì)每一個(gè)關(guān)鍵詞,
[0172]在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值;
[0173]將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值;
[0174]將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0175]另外,在具體應(yīng)用中,前述的關(guān)鍵詞獲取模塊32可具體用于,
[0176]在所述文本內(nèi)容包括特殊符號(hào)時(shí),對(duì)所述文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后中各中文詞/字的詞性、確定相鄰中文詞/字的組合性;
[0177]根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0178]或者,關(guān)鍵詞獲取模塊32還可用于,在所述文本內(nèi)容包括數(shù)字和/或字母時(shí),對(duì)所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0179]相應(yīng)地,前述的云端服務(wù)器還可包括圖中未示出的號(hào)碼判斷模塊37和黑名單更新模塊38,其中,該號(hào)碼判斷模塊37用于判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種;
[0180]黑名單更新模塊38用于在所述號(hào)碼判斷模塊確定所述文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種時(shí),將所述文本內(nèi)容中的數(shù)字和/或字母加入黑名單中。
[0181]在另一種可能的實(shí)現(xiàn)方式中,前述的云端服務(wù)器還可包括圖中未示出的源號(hào)碼獲取模塊39,該源號(hào)碼獲取模塊39用于確定所述短信的源號(hào)碼,并確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量;
[0182]相應(yīng)地,所述發(fā)送模塊36還用于在所述源號(hào)碼獲取模塊確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息。
[0183]本實(shí)施例的云端服務(wù)器能夠提高垃圾短信的識(shí)別率,以及垃圾短信的攔截效率,降低短信攔截的成本。
[0184]圖4示出了本發(fā)明一實(shí)施例提供的短信攔截裝置的結(jié)構(gòu)示意圖,如圖4所示,本實(shí)施例的短信攔截裝置可包括:監(jiān)控模塊41、判斷模塊42、發(fā)送模塊43和接收模塊44、短信攔截模塊45 ;
[0185]其中,監(jiān)控模塊41用于對(duì)終端中的短信接收事件進(jìn)行監(jiān)測(cè),獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼;
[0186]判斷模塊42用于確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼;
[0187]發(fā)送模塊43用于在所述判斷模塊42確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信;
[0188]接收模塊44用于接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息;
[0189]短信攔截模塊45用于根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0190]在具體應(yīng)用中,上述的接收模塊44還用于在判斷模塊42確定所述短信對(duì)應(yīng)的電話號(hào)碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之前,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞;
[0191]相應(yīng)地,前述的短信攔截裝置還可包括圖4中未示出的提取模塊46和查看匹配模塊47 ;該提取模塊46用于在所述判斷模塊42確定所述短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之后,提取所述短信的文本內(nèi)容中的敏感詞;
[0192]查看匹配模塊47用于查看所述提取模塊46提取的敏感詞與所述特征詞是否匹配;
[0193]所述短信攔截模塊45還用于在所述查看匹配模塊47確定所述敏感詞與所述特征詞不匹配時(shí),將當(dāng)前接收的短信作為攔截對(duì)象進(jìn)行攔截。
[0194]舉例來(lái)說(shuō),所述提取模塊46可具體用于,對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個(gè)敏感詞和最后一個(gè)敏感詞;
[0195]查看匹配模塊47可具體用于,查看所述第一個(gè)敏感詞與所述特征詞是否匹配,或者,查看所述最后一個(gè)敏感詞與所述特征詞是否匹配。
[0196]本實(shí)施例中的短信攔截裝置與云端服務(wù)器交互,可提高短信攔截的準(zhǔn)確率,提高攔截效果,減少了用戶的操作量,節(jié)省了終端本地的存儲(chǔ)空間。
[0197]本發(fā)明的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。
[0198]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本發(fā)明公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋呈反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書(shū)由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0199]本領(lǐng)域技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在于該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是互相排斥之處,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
[0200]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
[0201 ] 本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的一種瀏覽器終端的設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0202]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
[0203]最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說(shuō)明書(shū)的范圍當(dāng)中。
【權(quán)利要求】
1.一種短信攔截方法,其特征在于,包括: 接收短信攔截裝置上傳的短信; 對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞; 獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率; 根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信; 向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值,包括: 針對(duì)每一個(gè)關(guān)鍵詞, 在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值; 將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值; 將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值; 和/或, 對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,包括: 在所述文本內(nèi)容包括特殊符號(hào)時(shí),剔除所述文本內(nèi)容的特殊符號(hào),對(duì)剔除特殊符號(hào)的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性; 根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,還包括: 在所述文本內(nèi)容包括數(shù)字和/或字母時(shí),對(duì)所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母; 相應(yīng)地,根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信為垃圾短信之后,所述方法還包括: 判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種; 如果是,則將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,接收短信攔截裝置上傳的短信之后,所述方法還包括: 確定所述短信的源號(hào)碼,并確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量; 若所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量超過(guò)預(yù)設(shè)閾值,則向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息,且不執(zhí)行對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理的步驟。
5.一種短信攔截方法,其特征在于,包括: 對(duì)終端中的短信接收事件進(jìn)行監(jiān)測(cè),獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼; 確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信; 接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息; 根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之前,所述方法還包括: 接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞; 所述確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之后,所述方法還包括: 提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;在所述敏感詞與所述特征詞匹配時(shí),將當(dāng)前接收的短信作為攔截對(duì)象進(jìn)行攔截,則不執(zhí)行所述將上述短信上傳云端服務(wù)器的步驟; 在所述敏感詞與所述特征詞不匹配時(shí),執(zhí)行所述將所述短信上傳云端服務(wù)器的步驟; 和/或, 所述提取所述短信的文本內(nèi)容中的敏感詞,包括: 對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個(gè)敏感詞和最后一個(gè)敏感詞; 所述查看所述敏感詞與所述特征詞是否匹配的步驟,包括: 查看所述第一個(gè)敏感詞與所述特征詞是否匹配,或者,查看所述最后一個(gè)敏感詞與所述特征詞是否匹配。
7.—種云端服務(wù)器,其特征在于,包括: 接收模塊,用于接收短信攔截裝置上傳的短信; 關(guān)鍵詞獲取模塊,用于對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞; 關(guān)鍵詞的概率權(quán)重值獲取模塊,用于獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值; 關(guān)鍵詞的聯(lián)合概率獲取模塊,用于獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率; 判斷模塊,用于根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信; 發(fā)送模塊,還用于向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短。
8.根據(jù)權(quán)利要求7所述的云端服務(wù)器,其特征在于,關(guān)鍵詞的概率權(quán)重值獲取模塊,具體用于: 針對(duì)每一個(gè)關(guān)鍵詞, 在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值; 將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值; 將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值; 和/或, 所述關(guān)鍵詞獲取模塊,具體用于 在所述文本內(nèi)容包括特殊符號(hào)時(shí),剔除所述文本內(nèi)容的特殊符號(hào),對(duì)剔除特殊符號(hào)的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性; 根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞; 和/或, 所述關(guān)鍵詞獲取模塊,還用于 在所述文本內(nèi)容包括數(shù)字和/或字母時(shí),對(duì)所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母; 所述云端服務(wù)器還包括: 號(hào)碼判斷模塊,用于判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種; 黑名單更新模塊,用于在所述號(hào)碼判斷模塊確定所述文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號(hào)碼、座機(jī)號(hào)碼、賬號(hào)信息中的一種或多種時(shí),將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中; 和/或, 所述云端服務(wù)器還包括: 源號(hào)碼獲取模塊,用于確定所述短信的源號(hào)碼,并確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量; 相應(yīng)地,所述發(fā)送模塊,還用于在所述源號(hào)碼獲取模塊確定所述源號(hào)碼在預(yù)設(shè)時(shí)間段內(nèi)發(fā)送短信的數(shù)量超過(guò)預(yù)設(shè)閾值時(shí),向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信肩、O
9.一種短信攔截裝置,其特征在于,包括: 監(jiān)控模塊,用于對(duì)終端中的短信接收事件進(jìn)行監(jiān)測(cè),獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼; 判斷模塊,用于確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼; 發(fā)送模塊,用于在所述判斷模塊確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信; 接收模塊,用于接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息; 短信攔截模塊,用于根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于, 所述接收模塊,還用于在判斷模塊確定所述短信對(duì)應(yīng)的電話號(hào)碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之前,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞; 所述裝置還包括: 提取模塊,用于在所述判斷模塊確定所述短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼之后,提取所述短信的文本內(nèi)容中的敏感詞; 查看匹配模塊,用于查看所述提取模塊提取的敏感詞與所述特征詞是否匹配; 所述短信攔截模塊,還用于在所述查看匹配模塊確定所述敏感詞與所述特征詞不匹配時(shí),將當(dāng)前接收的短信作為攔截對(duì)象進(jìn)行攔截; 和/或, 所述提取模塊,具體用于 對(duì)所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個(gè)敏感詞和最后一個(gè)敏感詞; 查看匹配模塊,具體用于 查看所述第一個(gè)敏感詞與所述特征詞是否匹配,或者,查看所述最后一個(gè)敏感詞與所述特征詞是否匹配。
【文檔編號(hào)】H04W12/12GK104168548SQ201410415794
【公開(kāi)日】2014年11月26日 申請(qǐng)日期:2014年8月21日 優(yōu)先權(quán)日:2014年8月21日
【發(fā)明者】任寰, 段培堃, 丁超, 李振博, 常富洋, 李雨石 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
堆龙德庆县| 苏尼特右旗| 平遥县| 金平| 济南市| 永嘉县| 龙井市| 怀宁县| 璧山县| 农安县| 清河县| 正定县| 赤水市| 通化县| 简阳市| 孟连| 册亨县| 郧西县| 青河县| 宁夏| 敖汉旗| 长垣县| 电白县| 大港区| 米脂县| 定结县| 扶风县| 敦化市| 石河子市| 佛教| 阿合奇县| 商都县| 镇原县| 阿拉善左旗| 溧水县| 郎溪县| 突泉县| 洛扎县| 鄄城县| 普陀区| 车险|