本發(fā)明涉及一種基于用戶畫像的征信應(yīng)用方法,在妥善解決個(gè)人信息安全與隱私保護(hù)的前提下,以客戶為中心的用戶畫像研究,有利于企業(yè)充分利用現(xiàn)有的數(shù)據(jù)資源,有效實(shí)現(xiàn)精準(zhǔn)營(yíng)銷和個(gè)性化服務(wù),同時(shí)在個(gè)人征信方面也可實(shí)施有益的探索與實(shí)踐。
背景技術(shù):
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,“數(shù)據(jù)即資源”的大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。用戶畫像是企業(yè)實(shí)現(xiàn)“數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)與運(yùn)營(yíng)”的重要舉措,用戶畫像與應(yīng)用大數(shù)據(jù)技術(shù)對(duì)客戶分類密切相關(guān),是單個(gè)客戶的眾多屬性標(biāo)簽的累積;另一方面,在企業(yè)涉足的消費(fèi)金融領(lǐng)域,對(duì)用戶所進(jìn)行的個(gè)人信用評(píng)價(jià),是對(duì)用戶畫像中的用戶諸多特征實(shí)施再組合與分類的應(yīng)用過(guò)程。
用戶畫像是個(gè)形象的比喻。在大數(shù)據(jù)技術(shù)的幫助下,我們可以了解用戶的更多信息,但由于實(shí)施成本和隱私保護(hù)的限制,這個(gè)畫像其實(shí)不是全息的“照相”或“錄像”,是按需設(shè)計(jì)的,不可能無(wú)限細(xì)化,即用戶“畫像”不考慮成本與需求而具有超高“像素”是不現(xiàn)實(shí)的。一般而言,用戶畫像與客戶分類密切相關(guān)。在大數(shù)據(jù)分析中對(duì)客戶群進(jìn)行分類,如聚類分析、判斷邏輯分析等,可以按特征將用戶劃分為不同的類別;這些多維角度的客戶分類,形成了一系列不同的屬性標(biāo)簽。對(duì)于單個(gè)客戶,正是這些分類范圍的相互交集,即是單個(gè)客戶身上的眾多標(biāo)簽的累積,使得客戶形象逐漸豐滿,依稀呈現(xiàn)。同時(shí),眾多特征的迭加也可視同從量變到質(zhì)變的“涌突”現(xiàn)象,在標(biāo)簽信息的基礎(chǔ)上,可以再?gòu)母黜?xiàng)特征中重新按需組合,形成相對(duì)完整的“大屬性”標(biāo)簽,實(shí)施進(jìn)一步的分類。從這個(gè)角度來(lái)看,用戶的個(gè)人信用評(píng)價(jià),也是用戶畫像中的諸多特征再組合分類的應(yīng)用過(guò)程。
個(gè)人信用評(píng)價(jià)實(shí)質(zhì)是一個(gè)類別識(shí)別問(wèn)題。由于個(gè)人征信的基本過(guò)程,是將分散于不同來(lái)源的局部信息,整合成為可以完整描述消費(fèi)者信用狀況,因此企業(yè)的用戶畫像方法同樣適用于個(gè)人信用測(cè)評(píng)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種基于用戶畫像的征信應(yīng)用方法,通過(guò)該方法將分散于不同來(lái)源的局部信息,整合成為可以完整描述消費(fèi)者信用狀況,有利于企業(yè)充分利用現(xiàn)有的數(shù)據(jù)資源,有效實(shí)現(xiàn)精準(zhǔn)營(yíng)銷和個(gè)性化服務(wù),同時(shí)在個(gè)人征信方面也可實(shí)施有益的探索與實(shí)踐。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下。
基于用戶畫像的征信應(yīng)用方法,包括以下步驟。
(1)先由企業(yè)風(fēng)險(xiǎn)管控部門人員根據(jù)企業(yè)自身的信用評(píng)級(jí)標(biāo)準(zhǔn)(層次分析法,簡(jiǎn)稱AHP法)對(duì)所有樣本進(jìn)行打分。
(2)根據(jù)征信應(yīng)用的情景需求,將用戶畫像的量化具體指標(biāo)進(jìn)行重新歸并與組合。
(3)將所有樣本進(jìn)一步分為兩部分,一部分為測(cè)試集,樣本數(shù)占60%;另一部分為檢驗(yàn)集,樣本數(shù)占40%,并讓這兩個(gè)樣本集中的可授信和不可授信樣本占有相同比率。
(4)以企業(yè)傳統(tǒng)評(píng)級(jí)結(jié)果為依據(jù),運(yùn)用監(jiān)督學(xué)習(xí)算法中的支持向量機(jī),對(duì)測(cè)試樣本中的用戶畫像特征進(jìn)行維度約簡(jiǎn),找出關(guān)鍵屬性值組合。
(5)按上述得到的用戶畫像的屬性值組合,對(duì)檢驗(yàn)樣本進(jìn)行分類,并將分類結(jié)果與傳統(tǒng)的企業(yè)AHP法進(jìn)行對(duì)比,符合率達(dá)到91.35%,效果基本達(dá)標(biāo)。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
用戶畫像法的可予授信樣本數(shù)小于企業(yè)傳統(tǒng)方法的可予授信數(shù),說(shuō)明該方法授信標(biāo)準(zhǔn)更嚴(yán),更趨保守,具有較好的穩(wěn)健性,從中可以發(fā)現(xiàn),運(yùn)用用戶畫像的方式進(jìn)行征信在“薄信息”狀態(tài)下,具有較高的有效性。當(dāng)然,在“厚信息”情景中,也具有一定的信息補(bǔ)充功能,綜合利用效果更佳。
附圖說(shuō)明
圖1為本發(fā)明的流程圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,本發(fā)明的實(shí)施方式包括但不限于下列實(shí)施例。
圖1為本發(fā)明的流程圖,以廣州速鴻信息科技有限公司企業(yè)數(shù)據(jù)庫(kù)的銀行數(shù)據(jù)為例,對(duì)部分申請(qǐng)貸款的個(gè)人用戶進(jìn)行實(shí)證分析。首先,選取5000個(gè)申請(qǐng)個(gè)人貸款的銀行用戶為樣本,運(yùn)用兩種方法進(jìn)行信用評(píng)價(jià),其中,一種方法是銀行根據(jù)現(xiàn)有的申請(qǐng)人的審核資料進(jìn)行征信,另一種方法是通過(guò)用戶畫像的方法進(jìn)行征信,實(shí)施流程如下。
1、先由銀行風(fēng)險(xiǎn)管控部門人員根據(jù)銀行自身的信用評(píng)級(jí)標(biāo)準(zhǔn)(層次分析法,簡(jiǎn)稱AHP法)對(duì)所有樣本進(jìn)行打分;指標(biāo)中個(gè)人信息分為:年齡、工作崗位、性別、學(xué)歷、健康狀況等,收入水平分為個(gè)人年收入和家庭年收入等,財(cái)產(chǎn)情況分為住房、存款、其他資產(chǎn)等,支出情況分為贍養(yǎng)人口、債務(wù)負(fù)擔(dān)等,個(gè)人信用歷史分為違法違紀(jì)情況、信用違約記錄等,我們以銀行最終放貸決定為依據(jù),將樣本分為“可予授信”樣本和“不予授信”樣本兩種。(當(dāng)然,可授信樣本中也不能保證以后就不發(fā)生呆壞賬,一定程度的小額壞賬率也是銀行業(yè)務(wù)中的正?,F(xiàn)象)。
2、根據(jù)征信應(yīng)用的情景需求,將用戶畫像的量化具體指標(biāo)進(jìn)行重新歸并與組合,其中個(gè)人信息是否真實(shí)中,年齡與行為特征匹配(0,1兩檔)、手機(jī)號(hào)與地區(qū)符合(0,1兩檔)、社會(huì)交往正常(0,1兩檔)等,個(gè)人經(jīng)濟(jì)狀況分為終端類別(1-5檔)、套餐類型(1-3檔)、近期用戶ARPU值(1-5檔)等,信用狀況與環(huán)境分為雙停時(shí)長(zhǎng)與頻數(shù)(1-3檔)、社交網(wǎng)絡(luò)ARPU均值等(1-5檔)等。
3、將所有樣本進(jìn)一步分為兩部分,一部分為測(cè)試集,樣本數(shù)占60%;另一部分為檢驗(yàn)集,樣本數(shù)占40%,并讓這兩個(gè)樣本集中的可授信和不可授信樣本占有相同比率。
4、以銀行傳統(tǒng)評(píng)級(jí)結(jié)果為依據(jù),運(yùn)用監(jiān)督學(xué)習(xí)算法中的支持向量機(jī),對(duì)測(cè)試樣本中的用戶畫像特征進(jìn)行維度約簡(jiǎn),找出關(guān)鍵屬性值組合。在分類過(guò)程中,變量多所獲得的信息也相對(duì)多,其判斷正確性也將會(huì)比較高。但是變量多,代表著收集樣本的成本和時(shí)間增加,最好的方法是能以較少的變量,卻能獲得不錯(cuò)的判斷正確性。
5、按上述得手機(jī)用戶畫像的屬性值組合,對(duì)檢驗(yàn)樣本進(jìn)行分類,并將分類結(jié)果與傳統(tǒng)的銀行AHP法進(jìn)行對(duì)比,符合率達(dá)到91.35%,效果基本達(dá)標(biāo)。
按照上述實(shí)施例,便可很好地實(shí)現(xiàn)本發(fā)明。