本發(fā)明實施例涉及數(shù)據(jù)評估技術領域,尤其涉及一種信用評估方法及裝置。
背景技術:
信用制度是銀行等機構開展個人消費信貸業(yè)務的基礎,銀行等機構通過獲取用戶的金融消費數(shù)據(jù)、網(wǎng)絡行為數(shù)據(jù)等預測用戶的金融信用,并定期更新該金融信用,根據(jù)金融信用為用戶提供信用業(yè)務。例如,芝麻信用通過呈現(xiàn)個人的信用情況,在酒店、租房、航空等場景為用戶、商戶提供信用服務。金融信用中,每個用戶就是一個具體的實體,通過該用戶在線下的金融消費數(shù)據(jù),以及網(wǎng)絡行為數(shù)據(jù)(即線上數(shù)據(jù))從而預測用戶的金融信用,通過線下與線上,實現(xiàn)閉環(huán)交易。
目前,一般通過金融信用來評估用戶在114分類信息網(wǎng)、58同城、趕集網(wǎng)等分類信息平臺上的信用。
然而,金融信息獲取的網(wǎng)絡行為數(shù)據(jù),僅僅是用戶在一些交易平臺上的數(shù)據(jù),只能反映用戶的金融信用,并不能反映用戶在分類信息平臺上的發(fā)帖表現(xiàn)等行為。
技術實現(xiàn)要素:
本發(fā)明提供一種信用評估方法及裝置,通過獲取用戶在分類信息平臺上的行為實現(xiàn)正確評估用戶在分類信息平臺上的信用的目的。
第一方面,本發(fā)明實施例提供一種信用評估方法,包括:
在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù);
對所述行為數(shù)據(jù)進行過濾獲取訓練樣本,并對所述行為數(shù)據(jù)進行訓練獲取行為特征;
將所述訓練樣本與所述行為特征輸入分類模型,以確定所述第一賬號在所述分類信息平臺上的置信度;
根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用。
在一種可行的實現(xiàn)方式中,所述對所述行為數(shù)據(jù)進行過濾獲取訓練樣本,包括:
確定預設規(guī)則,根據(jù)所述預設規(guī)則獲取預設數(shù)量的樣本;
對所述預設數(shù)量的樣本進行驗證;
若所述預設數(shù)量的樣本中每個樣本滿足預設條件,則根據(jù)所述預設規(guī)則,過濾所述行為數(shù)據(jù)。
在一種可行的實現(xiàn)方式中,上述方法還包括:
確定與所述第一賬號關聯(lián)的第二賬號;
對所述第二賬號在所述分類信息平臺上的行為數(shù)據(jù)進行訓練,得到所述第二賬號的訓練樣本;
將所述第二賬號的訓練樣本加入至所述第一賬號的訓練樣本中。
在一種可行的實現(xiàn)方式中,所述對所述行為數(shù)據(jù)進行訓練獲取行為特征,包括:
確定與所述第一賬號關聯(lián)的第二賬號;
對所述第二賬號在所述分類信息平臺上的行為數(shù)據(jù)進行訓練,得到所述第二賬號的行為特征;
將所述第二賬號的行為特征加入至所述第一賬號的行為特征中。
在一種可行的實現(xiàn)方式中,所述在第一時間段內(nèi)獲取用戶在分類信息平臺上的行為數(shù)據(jù)之前,還包括:
獲取至少一個用戶在所述分類信息平臺上的行為數(shù)據(jù);
采用機器學習模塊對所述至少一個用戶在所述分類信息平臺上的數(shù)據(jù)進行學習,生成所述分類模型。
在一種可行的實現(xiàn)方式中,根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用之后,還包括:
更新所述第一賬號在所述分類信息平臺上的信用。
第二方面,本發(fā)明實施例提供一種信用評估裝置,包括:
獲取模塊,用于在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù);
處理模塊,用于對所述行為數(shù)據(jù)進行過濾獲取訓練樣本,并對所述行為數(shù)據(jù)進行訓練獲取行為特征;
置信度確定模塊,用于將所述訓練樣本與所述行為特征輸入分類模型,以確定所述第一賬號在所述分類信息平臺上的置信度;
預測模塊,用于根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用。
在一種可行的實現(xiàn)方式中,所述處理模塊,具體用于確定預設規(guī)則,根據(jù)所述預設規(guī)則獲取預設數(shù)量的樣本,對所述預設數(shù)量的樣本進行驗證,若所述預設數(shù)量的樣本中每個樣本滿足預設條件,則根據(jù)所述預設規(guī)則,過濾所述行為數(shù)據(jù)。
在一種可行的實現(xiàn)方式中,所述處理模塊,還用于確定與所述第一賬號關聯(lián)的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數(shù)據(jù)進行訓練,得到所述第二賬號的訓練樣本,將所述第二賬號的訓練樣本加入至所述第一賬號的訓練樣本中。
在一種可行的實現(xiàn)方式中,所述處理模塊,還用于確定與所述第一賬號關聯(lián)的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數(shù)據(jù)進行訓練,得到所述第二賬號的行為特征,將所述第二賬號的行為特征加入至所述第一賬號的行為特征中。
在一種可行的實現(xiàn)方式中,所述處理模塊,在所述獲取模塊在第一時間段內(nèi)獲取用戶在分類信息平臺上的行為數(shù)據(jù)之前,還用于獲取至少一個用戶在所述分類信息平臺上的行為數(shù)據(jù);采用機器學習模塊對所述至少一個用戶在所述分類信息平臺上的數(shù)據(jù)進行學習,生成所述分類模型。
在一種可行的實現(xiàn)方式中,所述處理模塊,在所述預測模塊根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用之后,還用于更新所述第一賬號在所述分類信息平臺上的信用。
本發(fā)明實施例提供的信用評估方法及裝置,在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù),根據(jù)該行為數(shù)據(jù),獲取訓練樣本及行為特征,將訓練樣本及行為特征輸入至分類模型,獲取到第一時間段內(nèi)第一賬號在分類信息平臺上的置信度后,根據(jù)該置信度,預測第二時間段內(nèi),第一賬號在分類信息平臺上的信用。該過程中,通過獲取第一賬號在分類信息平臺上的行為數(shù)據(jù),通過對該行為數(shù)據(jù)進行分析預測未來時間段內(nèi)第一賬號在分類信息平臺上的信用,實現(xiàn)正確評估用戶在分類信息平臺上的信用的目的。
附圖說明
為了更清楚地說明本發(fā)明方法實施例的技術方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明方法的一些實施例,對于本領域技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明信用評估方法的過程示意圖;
圖2為本發(fā)明信用評估方法實施例一的流程圖;
圖3為本發(fā)明信用評估裝置的結構示意圖。
具體實施方式
為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。以下內(nèi)容為結合附圖及較佳實施例,對依據(jù)本發(fā)明申請的具體實施方式、結構、特征及其功效的詳細說明。
本發(fā)明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”、“第三”、“第四”等(如果存在)是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例例如能夠以除了在這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
一般來說,用戶的金融信用,用于反映用戶的誠信度、償還債務的信譽等。與金融信用不同,第一賬號在分類信息平臺上的信用,用于反映該賬號為低質量賬號的概率、為違規(guī)賬號的概率或具有虛假行為的概率等。本發(fā)明實施例中,通過分析評估第一賬號在過去的一段時間,即第一時間段內(nèi)的行為數(shù)據(jù),結合通過機器學習學習得到的分類模型,預測未來時間段內(nèi),即第二時間段內(nèi)第一賬號為低質量賬號的概率、為違規(guī)賬號的概率、具有虛假行為的概率。具體的,可參見圖1,圖1為本發(fā)明信用評估方法的過程示意圖。
請參照圖1,第一時間段例如為1個月,第二時間段也例如為一個月,第一時間段與第二時間段相鄰,在評分點,即第一時間端與第二時間端相交的點,分析第一賬號在第一時間段的行為數(shù)據(jù),結合過濾規(guī)則過濾出訓練樣本,結合訓練規(guī)則訓練出行為數(shù)據(jù),將訓練樣本和行為數(shù)據(jù)輸入至通過機器學習學習到的分類模型中,得出置信度,并根據(jù)該置信度,分析預測未來時間段內(nèi)第一賬號在分類信息平臺上的信用。
另外,第二時間段結束后,可以對第二時間段的行為數(shù)據(jù)進行分析,結合過濾規(guī)則過濾出訓練樣本,結合訓練規(guī)則訓練出行為數(shù)據(jù),將訓練樣本和行為數(shù)據(jù)輸入至通過機器學習學習到的分類模型中,得出置信度,并根據(jù)該置信度得出第一賬號在第二時間段內(nèi)的實際信用,對比該信用與預測出的信用,從而對預測出的信用進行驗證。
上述是以第一時間段、第二時間段以月為單位對本發(fā)明信用評估方法進行說明的,然而,本發(fā)明并不以此為限制,在其他可行的實現(xiàn)方式中,第一時間段、第二時間段也可以以天為單位、以周為單位;或者,第一時間段以月為單位、第二時間段以周為單位;或者,第一時間段以周為單位、第二時間段以天為單位等。在根據(jù)置信度,預測第二時間段內(nèi)第一賬號在分類信息平臺上的信用之后,還更新第一賬號在分類信息平臺上的信用,及時發(fā)現(xiàn)信用顯著降低的賬號并預警。
接下來,在上述圖1的基礎上,對本發(fā)明信用評估方法進行詳細說明。具體的,可參見圖2。
圖2為本發(fā)明信用評估方法的流程圖。本實施例包括:
101、在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù)。
一般來說,不同的用戶在同一信息分類平臺上具有不同的賬號,同一個用戶在同一個信息分類平臺上甚至具有多個不同的賬號。通過賬號注冊方式,用戶在信息分類平臺上進行發(fā)帖、訪問特定信息等。與金融賬號不同的是,每個金融賬號都對應一個具體的實體,即對應一個具體的用戶,而分類信息平臺的賬號可能是隨便注冊的,因此無法對應到具體的線下實體。
本步驟中,對于一個具體分類信息平臺的一個具體賬號,即第一賬號,獲取該第一賬號在該平臺上的行為數(shù)據(jù),如發(fā)帖數(shù)量、發(fā)帖內(nèi)容等。
102、對所述行為數(shù)據(jù)進行訓練獲取訓練樣本,并對所述行為數(shù)據(jù)進行訓練獲取行為特征。
在獲取到行為數(shù)據(jù)后,對行為數(shù)據(jù)進行過濾,刪除其中的冗余數(shù)據(jù)或無用的數(shù)據(jù)等,從而獲得能夠真實反映第一賬號對應的用戶的行為的數(shù)據(jù),將該些能夠真實反映第一賬號對應的用戶的行為的數(shù)據(jù)作為訓練樣本。同時,對行為數(shù)據(jù)進行訓練從而獲得第賬號對應的用戶的行為特征,如第一賬號是異地登錄的賬號、第一賬號是多次被投訴過的賬號等。
103、將訓練樣本與行為特征輸入分類模型,以確定第一賬號在分類信息平臺上的置信度。
本步驟中,將獲取到對訓練樣本和行為特征輸入分類模型,從而確定第一賬號在分類信息平臺上的置信度。其中,類型模型例如為對分類信息平臺歷史上存在的賬號的行為數(shù)據(jù)采用機器學習模型進行學習生成的。生成分類模型的過程中,獲取至少一個用戶在分類信息平臺上的行為數(shù)據(jù);采用機器學習模塊對至少一個用戶在分類信息平臺上的數(shù)據(jù)進行學習,生成分類模型。該過程中,機器學習模型例如為邏輯回歸學習模型、隨機森林學習模型等,多模型之間采用加權平均獲得分類模型。
104、根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用。
在獲取到第一時間段內(nèi)第一賬號在分類信息平臺上的置信度后,將該置信度線性拉伸到350~950區(qū)間并輸出,將輸出值作為第一時間段內(nèi)第一賬號在分類信息平臺上的信用。然后,預測第二時間段內(nèi),第一賬號在分類信息平臺上的信用為根據(jù)置信度得出的信用。
本發(fā)明實施例提供的信用評估方法,在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù),根據(jù)該行為數(shù)據(jù),獲取訓練樣本及行為特征,將訓練樣本及行為特征輸入至分類模型,獲取到第一時間段內(nèi)第一賬號在分類信息平臺上的置信度后,根據(jù)該置信度,預測第二時間段內(nèi),第一賬號在分類信息平臺上的信用。該過程中,通過獲取第一賬號在分類信息平臺上的行為數(shù)據(jù),通過對該行為數(shù)據(jù)進行分析預測未來時間段內(nèi)第一賬號在分類信息平臺上的信用,實現(xiàn)正確評估用戶在分類信息平臺上的信用的目的。
可選的,上述實施例中,為獲取海量高質量訓練樣本,根據(jù)經(jīng)驗等設置預設規(guī)則,根據(jù)預設規(guī)則從行為數(shù)據(jù)中提取出部分樣本,即預設數(shù)量的樣本,驗證該部分樣本是否合理,即是否滿足預設條件,若滿足,則根據(jù)預設規(guī)則,過濾行為數(shù)據(jù)以得到訓練樣本;否則,重新設置預設規(guī)則。該過程中,預設規(guī)則、預設條件以及預設數(shù)量等根據(jù)需求設置。
可選的,上述實施例中,提取出的第一賬號的行為數(shù)據(jù)有可能是有限的,對有限的行為數(shù)據(jù)進行分析,無法獲取到覆蓋全部行為的訓練樣本,進而并不能準確的預測出未來時間段內(nèi)第一賬號的信用。此時,利用關系網(wǎng)絡挖掘與第一賬號關聯(lián)的第二賬號,對第二賬號的行為數(shù)據(jù)進行分析獲取第二賬號訓練樣本,通過第二賬號的訓練樣本擴充第一賬號的訓練樣本,保證樣本的覆蓋度。
具體的,確定與第一賬號關聯(lián)的第二賬號,對第二賬號在分類信息平臺上的行為數(shù)據(jù)進行訓練,得到第二賬號的訓練樣本,將第二賬號的訓練樣本加入至第一賬號的訓練樣本中。
可選的,上述實施例中,有些賬號活期較短,即存在的周期較短,提取出的第一賬號的行為數(shù)據(jù)有可能是有限的,對有限的行為數(shù)據(jù)進行分析,無法獲取到覆蓋全部行為的行為特征,進而不能準確的預測出未來時間段內(nèi)第一賬號的信用。此時,利用關系網(wǎng)絡挖掘與第一賬號關聯(lián)的第二賬號,對第二賬號的行為數(shù)據(jù)進行分析獲取第二賬號的行為特征,通過第二賬號的行為特征擴充第一賬號的行為特征,保證行為特征的覆蓋度。
具體的,確定與第一賬號關聯(lián)的第二賬號;對第二賬號在分類信息平臺上的行為數(shù)據(jù)進行訓練,得到第二賬號的行為特征;將第二賬號的行為特征加入至第一賬號的行為特征中。
圖3為本發(fā)明信用評估裝置的結構示意圖,包括:
獲取模塊11,用于在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù);
處理模塊12,用于對所述行為數(shù)據(jù)進行過濾獲取訓練樣本,并對所述行為數(shù)據(jù)進行訓練獲取行為特征;
置信度確定模塊13,用于將所述訓練樣本與所述行為特征輸入分類模型,以確定所述第一賬號在所述分類信息平臺上的置信度;
預測模塊14,用于根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用。
本發(fā)明實施例提供的信用評估裝置,在第一時間段內(nèi)獲取第一賬號在分類信息平臺上的行為數(shù)據(jù),根據(jù)該行為數(shù)據(jù),獲取訓練樣本及行為特征,將訓練樣本及行為特征輸入至分類模型,獲取到第一時間段內(nèi)第一賬號在分類信息平臺上的置信度后,根據(jù)該置信度,預測第二時間段內(nèi),第一賬號在分類信息平臺上的信用。該過程中,通過獲取第一賬號在分類信息平臺上的行為數(shù)據(jù),通過對該行為數(shù)據(jù)進行分析預測未來時間段內(nèi)第一賬號在分類信息平臺上的信用,實現(xiàn)正確評估用戶在分類信息平臺上的信用的目的。
可選的,在本發(fā)明一實施例中,所述處理模塊12,具體用于確定預設規(guī)則,根據(jù)所述預設規(guī)則獲取預設數(shù)量的樣本,對所述預設數(shù)量的樣本進行驗證,若所述預設數(shù)量的樣本中每個樣本滿足預設條件,則根據(jù)所述預設規(guī)則,過濾所述行為數(shù)據(jù)。
可選的,在本發(fā)明一實施例中,所述處理模塊12,還用于確定與所述第一賬號關聯(lián)的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數(shù)據(jù)進行訓練,得到所述第二賬號的訓練樣本,將所述第二賬號的訓練樣本加入至所述第一賬號的訓練樣本中。
可選的,在本發(fā)明一實施例中,所述處理模塊12,還用于確定與所述第一賬號關聯(lián)的第二賬號,對所述第二賬號在所述分類信息平臺上的行為數(shù)據(jù)進行訓練,得到所述第二賬號的行為特征,將所述第二賬號的行為特征加入至所述第一賬號的行為特征中。
可選的,在本發(fā)明一實施例中,所述處理模塊12,在所述獲取模塊11在第一時間段內(nèi)獲取用戶在分類信息平臺上的行為數(shù)據(jù)之前,還用于獲取至少一個用戶在所述分類信息平臺上的行為數(shù)據(jù);采用機器學習模塊對所述至少一個用戶在所述分類信息平臺上的數(shù)據(jù)進行學習,生成所述分類模型。
可選的,在本發(fā)明一實施例中,所述處理模塊12,在所述預測模塊14根據(jù)所述置信度,預測第二時間段內(nèi),所述第一賬號在所述分類信息平臺上的信用之后,還用于更新所述第一賬號在所述分類信息平臺上的信用。
本領域普通技術人員可以理解:實現(xiàn)上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質中。該程序在執(zhí)行時,執(zhí)行包括上述各方法實施例的步驟;而前述的存儲介質包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質。
最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的范圍。