本發(fā)明涉及數(shù)據(jù)分析與監(jiān)測,是基于短信數(shù)據(jù)與ai融合的欺詐行為識別方法及預(yù)警系統(tǒng)。
背景技術(shù):
1、短信注冊行為在各類在線服務(wù)中已成為用戶身份驗證和注冊的主要手段,然而,隨之而來的欺詐行為也呈現(xiàn)出多樣化和智能化的趨勢,給企業(yè)和用戶帶來了巨大的風(fēng)險和損失。現(xiàn)有的欺詐行為識別技術(shù)雖然在一定程度上能夠檢測和預(yù)防欺詐行為,但仍存在以下幾個顯著的不足之處:現(xiàn)有的欺詐行為識別方法通常依賴于單一平臺的數(shù)據(jù)分析,缺乏對用戶跨平臺行為的全面跟蹤和分析,導(dǎo)致了無法全面把握用戶的行為特征,容易遺漏跨平臺欺詐行為的線索;現(xiàn)有的欺詐識別模型多為靜態(tài)分析模型,難以應(yīng)對動態(tài)變化的欺詐手段,欺詐者可以通過不斷變化的ip地址、設(shè)備id等信息來規(guī)避檢測,使得靜態(tài)模型難以捕捉到這些變化;此外,傳統(tǒng)的欺詐識別系統(tǒng)通常是基于歷史數(shù)據(jù)進行分析,針對于電子欺詐行為識別這一類需要高度時效性的數(shù)據(jù)分析過程,缺乏實時性,無法及時捕捉到瞬時出現(xiàn)的高風(fēng)險行為,動態(tài)性不足。
技術(shù)實現(xiàn)思路
1、本部分的目的在于概述本發(fā)明的實施例的一些方面以及簡要介紹一些較佳實施例。在本部分以及本技術(shù)的說明書摘要和發(fā)明名稱中可能會做些簡化或省略以避免使本部分、說明書摘要和發(fā)明名稱的目的模糊,而這種簡化或省略不能用于限制本發(fā)明的范圍。
2、本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)中,欺詐行為識別方法通常依賴于單一平臺的歷史數(shù)據(jù)分析,容易遺漏重要欺詐線索且欺詐行為識別數(shù)據(jù)時效性低的問題,提出了基于短信數(shù)據(jù)與ai融合的欺詐行為識別方法及預(yù)警系統(tǒng)。
3、為了達(dá)到上述目的,本發(fā)明基于短信數(shù)據(jù)與ai融合的欺詐行為識別方法的技術(shù)方案包括如下步驟:
4、s1:接入運營商云端數(shù)據(jù)庫端口,實時提取各個基站的短信注冊行為相關(guān)的行為狀態(tài)數(shù)據(jù);
5、s2:將所述行為狀態(tài)數(shù)據(jù)導(dǎo)入注冊行為可疑指數(shù)評估策略中,計算獲取每個短信注冊行為的可疑指數(shù);
6、s3:根據(jù)所述可疑指數(shù),對短信注冊行為進行初步動態(tài)識別處理,獲得第一可疑短信注冊行為集合;
7、s4:對第一可疑短信注冊行為集合中的所有可疑短信注冊行為對應(yīng)的請求客戶端進行跨平臺活動跟蹤處理,獲得跨平臺行徑跟蹤數(shù)據(jù);
8、s5:構(gòu)建ai融合分析模型,將所述可疑指數(shù)和所述跨平臺行徑跟蹤數(shù)據(jù)導(dǎo)入ai融合分析模型,輸出可疑指數(shù)置信度;
9、s6:將可疑指數(shù)置信度導(dǎo)入信用波動分析策略中,輸出可疑指數(shù)置信度的波動比率,并根據(jù)可疑指數(shù)置信度的波動比率對短信注冊行為進行行為最終識別處理。
10、具體地,s2中,所述注冊行為可疑指數(shù)評估策略包括:基站可疑評估子策略和用戶可疑評估子策略;
11、所述基站可疑評估子策略具體為:
12、s21:實時提取當(dāng)前時間點下,各個基站的短信注冊行為總數(shù)量以及行為狀態(tài)數(shù)據(jù),其中,基站總數(shù)為g;
13、在時間點為time時,各個基站的短信注冊行為總數(shù)量為j,j為下標(biāo),是短信注冊行為總數(shù)量的索引;
14、s22:以第j個短信注冊行為評估中心,計算第j個短信注冊行為評估中心與請求基站的注冊位置距離,同步計算剩余的j-1短信注冊行為與請求基站的注冊位置距離,構(gòu)成剩余注冊位置距離集合a,,;h為集合a中數(shù)據(jù)量的總數(shù),h為集合a的索引,為第h個短信注冊行為與請求基站的注冊位置距離;
15、s23:根據(jù)s21-s22,計算獲取基站可疑因子,具體為:
16、;
17、其中,表示第j個短信注冊行為的基站可疑因子。
18、具體地,所述用戶可疑評估子策略具體包括:
19、s24:以第j個短信注冊行為評估中心,計算剩余的j-1短信注冊行為與第j個短信注冊行為之間的ip地址八位組的重復(fù)數(shù)量;
20、s25:預(yù)設(shè)注冊ip地址的標(biāo)準(zhǔn)重復(fù)數(shù)量,篩選所述重復(fù)數(shù)量中,大于或等于所述標(biāo)準(zhǔn)重復(fù)數(shù)量的短信注冊行為,提取篩選獲得的短信注冊行為的注冊完成時間戳,構(gòu)成注冊完成時間戳集合b,,,g為集合b中數(shù)據(jù)量的總數(shù),g為集合b的索引,為第g個短信注冊行為的注冊完成時間戳;
21、s26:根據(jù)s24-s25,計算獲取用戶可疑因子,具體為:
22、;
23、其中,表示第j個短信注冊行為的用戶可疑因子;
24、為第j個短信注冊行為的注冊完成時間戳;
25、s27:根據(jù)s21-s26,融合計算短信注冊行為的可疑指數(shù)s,具體為:,分別為基站可疑因子和用戶可疑因子的比例系數(shù)。
26、具體地,s3中,所述初步動態(tài)識別處理包括:在當(dāng)前時間點下,獲取同一基站中所有短信注冊行為的可疑指數(shù),并將所有所有短信注冊行為的可疑指數(shù)進行升序排列,取序列的中位可疑指數(shù)作為動態(tài)識別基線,標(biāo)記可疑指數(shù)超過動態(tài)識別基線的短信注冊行為為第一可疑短信注冊行為集合,同時對第一可疑短信注冊行為集合中所有短信注冊行為的請求客戶端發(fā)出欺詐疑似提醒,其中,第一可疑短信注冊行為集合中可疑短信注冊行為的總數(shù)量為i,i為第一可疑短信注冊行為集合的索引;第一可疑短信注冊行為集合中,可疑短信注冊行為的可疑指數(shù)集合c為。
27、具體地,s4包括如下具體步驟:
28、s41:對第一可疑短信注冊行為集合中的所有可疑短信注冊行為對應(yīng)的請求客戶端進行跨平臺獲得跟蹤處理,其中,所述跨平臺活動跟蹤處理包括:在短信注冊行為完成后,對短信注冊行為的請求客戶端進行跨平臺活動跟蹤處理;
29、s42:提取跨平臺行徑跟蹤數(shù)據(jù),當(dāng)跟蹤到請求客戶端出現(xiàn)5次跨平臺活動時,觸發(fā)ai融合分析模型運行,執(zhí)行步驟s5,反之,繼續(xù)進行跨平臺活動跟蹤。
30、進一步地,所述跨平臺行徑跟蹤數(shù)據(jù)包括:跨平臺登陸時,請求客戶端的ip地址數(shù)據(jù)、登錄時間、登錄設(shè)備id數(shù)據(jù)、瀏覽器指紋、屏幕分辨率和手機號碼。
31、具體地,s5包括如下具體步驟:
32、s51:構(gòu)建ai融合分析模型;
33、s52:將所述可疑指數(shù)和所述跨平臺行徑跟蹤數(shù)據(jù)導(dǎo)入ai融合分析模型,輸出可疑指數(shù)置信度,其中,所述ai融合分析模型的輸出公式為:
34、;
35、其中,為第i個可疑短信注冊行為的可疑指數(shù)置信度;
36、表示第i個可疑短信注冊行為的請求客戶端的跨平臺行徑跟蹤數(shù)據(jù)的類別總數(shù)量,為跨平臺行徑跟蹤數(shù)據(jù)的序號索引;
37、x為下標(biāo),是5次跨平臺活動的序號索引;
38、為跨平臺活動的權(quán)重系數(shù);
39、表示第x次跨平臺活動的跨平臺行徑跟蹤數(shù)據(jù)的數(shù)據(jù)量;
40、表示5次跨平臺活動的跨平臺行徑跟蹤數(shù)據(jù)的數(shù)據(jù)量均值;
41、為可疑指數(shù)集合c中可疑指數(shù)的平均值。
42、具體地,s6中,所述信用波動分析策略具體如下:
43、;
44、其中,第i個可疑短信注冊行為的請求客戶端,第5次被跟蹤到跨平臺活動的時間點與第i個可疑短信注冊行為完成時間點距離e個欺詐監(jiān)測單位時段,e為下標(biāo),為欺詐監(jiān)測單位時段的索引;
45、bd可疑指數(shù)置信度的波動比率;
46、第e個欺詐監(jiān)測單位時段內(nèi),表示第i個可疑短信注冊行為的可疑指數(shù)置信度;分別表示,i個可疑短信注冊行為的最大可疑指數(shù)置信度和最小可疑指數(shù)置信度。
47、具體地,s6中,所述行為最終識別處理包括:預(yù)設(shè)可疑指數(shù)置信度的波動比率的最大波動承受值,當(dāng)可疑短信注冊行為的可疑指數(shù)置信度的波動比率超過最大波動承受值時,返回提取可疑短信注冊行為中的短信內(nèi)文本,對短信文本進行文本預(yù)處理,包括:去除文本中的特殊符號、標(biāo)點符號、html標(biāo)簽及噪音信息,篩選并過濾停用詞,接入欺詐短信大語言模型,在欺詐短信大語言模型中匹配與本個短信注冊行為中的短信內(nèi)文本重復(fù)的單詞或短語序列,根據(jù)文本匹配度重復(fù)確認(rèn)該短信注冊行為是否存在欺詐。
48、具體地,s6中,所述行為最終識別處理還包括:當(dāng)可疑短信注冊行為的可疑指數(shù)置信度的波動比率小于或等于最大波動承受值時,確認(rèn)該短信注冊行為存在欺詐,將該短信注冊行為對應(yīng)的請求客戶端標(biāo)記并可視化于欺詐管理平臺的欺詐行為分布地圖中,同時根據(jù)短信注冊行為的可疑指數(shù)s生成梯度熱力圖像,進行分類警示處理。
49、另外,本發(fā)明基于短信數(shù)據(jù)與ai融合的欺詐行為預(yù)警系統(tǒng)包括如下模塊:
50、行為狀態(tài)數(shù)據(jù)采集模塊、可疑指數(shù)評估模塊、初步動態(tài)識別模塊、活動跟蹤模塊、可疑指數(shù)置信評價模塊、行為最終識別模塊和欺詐報警模塊;
51、所述行為狀態(tài)數(shù)據(jù)采集模塊用于接入運營商云端數(shù)據(jù)庫端口,實時提取各個基站的短信注冊行為相關(guān)的行為狀態(tài)數(shù)據(jù);
52、所述可疑指數(shù)評估模塊用于將所述行為狀態(tài)數(shù)據(jù)導(dǎo)入注冊行為可疑指數(shù)評估策略中,計算獲取每個短信注冊行為的可疑指數(shù);
53、所述初步動態(tài)識別模塊根據(jù)所述可疑指數(shù),對短信注冊行為進行初步動態(tài)識別處理,獲得第一可疑短信注冊行為集合;
54、所述活動跟蹤模塊用于對第一可疑短信注冊行為集合中的所有可疑短信注冊行為對應(yīng)的請求客戶端進行跨平臺活動跟蹤處理,獲得跨平臺行徑跟蹤數(shù)據(jù);
55、所述可疑指數(shù)置信評價模塊用于構(gòu)建ai融合分析模型,將所述可疑指數(shù)和所述跨平臺行徑跟蹤數(shù)據(jù)導(dǎo)入ai融合分析模型,輸出可疑指數(shù)置信度;
56、所述行為最終識別模塊用于將可疑指數(shù)置信度導(dǎo)入信用波動分析策略中,輸出可疑指數(shù)置信度的波動比率,并根據(jù)可疑指數(shù)置信度的波動比率對短信注冊行為進行行為最終識別處理;
57、所述欺詐報警模塊根據(jù)行為最終識別處理結(jié)果,進行分類警示處理。
58、一種存儲介質(zhì),所述存儲介質(zhì)中存儲有指令,當(dāng)計算機讀取所述指令時,使所述計算機執(zhí)行所述的基于短信數(shù)據(jù)與ai融合的欺詐行為識別方法。
59、一種電子設(shè)備,包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述的基于短信數(shù)據(jù)與ai融合的欺詐行為識別方法。
60、與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)效果如下:
61、1、本發(fā)明通過實時跟蹤用戶在不同平臺上的注冊和登錄行為,有效捕捉跨平臺欺詐行為的線索,打破了數(shù)據(jù)孤島問題,提高了欺詐識別的全面性和準(zhǔn)確性。
62、2、本發(fā)明通過融合多種行為數(shù)據(jù)(如ip地址、設(shè)備id、瀏覽器指紋等),提供了多維度的分析視角,避免單一維度數(shù)據(jù)的局限性,增強了欺詐行為的識別能力,同時通過ai融合分析模型輸出的可疑指數(shù)置信度和信用波動分析,提供了更為科學(xué)的風(fēng)險評估結(jié)果,幫助欺詐平臺管理人員在決策過程中減少誤判,提高欺詐風(fēng)險管理的效率和欺詐識別的準(zhǔn)確率。
63、3、本發(fā)明利用動態(tài)識別處理機制和實時數(shù)據(jù)提取,系統(tǒng)能夠迅速捕捉到異常行為,并及時發(fā)出預(yù)警,大大縮短了從發(fā)現(xiàn)可疑行為到預(yù)警的時間間隔,有效提升了系統(tǒng)的實時性。
64、4、本發(fā)明相比于現(xiàn)有的欺詐識別方法中直接依賴短信文本內(nèi)容進行分析,考慮到設(shè)備信息(如ip地址、設(shè)備id、瀏覽器指紋等)能夠提供更為客觀和穩(wěn)定的行為特征,相比短信文本內(nèi)容更為可靠且處理起來更為迅速;在面對動態(tài)變化的欺詐手段時,本發(fā)明通過先初步動態(tài)識別處理(設(shè)備信息)后行為最終識別處理(短信文本內(nèi)容)的輔助驗證模式,顯著提高了欺詐行為識別效率且形成了多層次的防御體系,避免了對正常用戶的誤判,有效減少了誤報率。