两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用戶價值評分方法和系統(tǒng)與流程

文檔序號:11217177閱讀:451來源:國知局
用戶價值評分方法和系統(tǒng)與流程

本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別是涉及用戶價值評分方法和用戶價值評分系統(tǒng)。



背景技術(shù):

一個企業(yè)的用戶是企業(yè)價值的基石,對用戶的了解影響企業(yè)服務(wù)質(zhì)量,而了解用戶的一個有效的手段就是對用戶價值進行評分。用戶價值評分可用于對不同的價值的用戶進行分層管理;或者用于篩選出高價值用戶,對高價值用戶給予更多關(guān)注,提升高價值用戶群體的質(zhì)量;又或者作為運營分析的市場監(jiān)控,正常來講用戶價值分布處于一個正常范圍內(nèi),若發(fā)現(xiàn)分值的分布有顯著變化,則反饋這個異常,由分析師進一步分析產(chǎn)生異常的原因,降低市場風(fēng)險等。因此,正確評估用戶價值對企業(yè)來說至關(guān)重要。而傳統(tǒng)技術(shù)中一般是主觀判斷用戶的價值,因此無法準(zhǔn)確反映用戶價值。



技術(shù)實現(xiàn)要素:

基于此,有必要針對上述用戶價值判斷不準(zhǔn)確的問題,提供一種用戶價值評分方法和系統(tǒng),能夠根據(jù)用戶屬性客觀判斷用戶價值,提高了用戶價值判斷的準(zhǔn)確性。

一種用戶價值評分方法,包括步驟:

獲取正樣本和負(fù)樣本,其中,所述正樣本為產(chǎn)生實際價值的用戶的若干個屬性,所述負(fù)樣本為未產(chǎn)生實際價值的用戶的若干個屬性,用戶的屬性包括數(shù)值型的屬性和分類型的屬性;

根據(jù)所述正樣本和所述負(fù)樣本計算每個屬性的信息值,其中所述信息值用于評估一個屬性對所述正樣本的影響程度;

根據(jù)每個屬性的信息值與所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重;

根據(jù)用戶的若干個屬性的屬性值和對應(yīng)的權(quán)重獲得用戶的用戶價值評分。

一種用戶價值評分系統(tǒng),包括:

樣本獲取模塊,用于獲取正樣本和負(fù)樣本,其中,所述正樣本為產(chǎn)生實際價值的用戶的若干個屬性,所述負(fù)樣本為未產(chǎn)生實際價值的用戶的若干個屬性,用戶的屬性包括數(shù)值型的屬性和分類型的屬性;

信息值計算模塊,用于根據(jù)所述正樣本和所述負(fù)樣本計算每個屬性的信息值,其中所述信息值用于評估一個屬性對所述正樣本的影響程度;

權(quán)重獲得模塊,用于根據(jù)每個屬性的信息值與所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重;

用戶價值評分模塊,用于根據(jù)用戶的若干個屬性的屬性值和對應(yīng)的權(quán)重獲得用戶的用戶價值評分。

上述用戶價值評分方法和系統(tǒng),基于用戶的屬性計算出屬性的權(quán)重,根據(jù)屬性的屬性值和屬性的權(quán)重對用戶價值進行評分,由于用戶價值評分根據(jù)客觀數(shù)據(jù)(用戶屬性)自適應(yīng)地自動化計算得到,因此該用戶價值評分能夠客觀反映用戶價值,提高了用戶價值判斷的準(zhǔn)確性。

附圖說明

圖1為一實施例的用戶價值評分方法的流程示意圖;

圖2為一實施例的用戶價值評分系統(tǒng)的結(jié)構(gòu)示意圖。

具體實施方式

為更進一步闡述本發(fā)明所采取的技術(shù)手段及取得的效果,下面結(jié)合附圖及較佳實施例,對本發(fā)明的技術(shù)方案,進行清楚和完整的描述。

如圖1所示,一種用戶價值評分方法,包括步驟:

s110、獲取正樣本和負(fù)樣本,其中,所述正樣本為產(chǎn)生實際價值的用戶的若干個屬性,所述負(fù)樣本為未產(chǎn)生實際價值的用戶的若干個屬性,用戶的屬性包括數(shù)值型的屬性和分類型的屬性;

s120、根據(jù)所述正樣本和所述負(fù)樣本計算每個屬性的信息值,其中所述信息值用于評估一個屬性對所述正樣本的影響程度;

s130、根據(jù)每個屬性的信息值與所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重;

s140、根據(jù)用戶的若干個屬性的屬性值和對應(yīng)的權(quán)重獲得用戶的用戶價值評分。

上述用戶價值評分方法可以通過相應(yīng)的程序?qū)崿F(xiàn),程序運行在終端中,例如電腦或者手機中。該方法根據(jù)屬性的屬性值和屬性的權(quán)重對用戶價值進行評分,由于用戶價值的判斷基于客觀數(shù)據(jù),因此能夠客觀判斷用戶價值,提高了用戶價值判斷的準(zhǔn)確性。為了更好地理解該方法,下面對各個步驟進行詳細介紹。

在步驟s110中,用戶并不限制于是一個企業(yè)相關(guān)的用戶,還可以是個人創(chuàng)辦的網(wǎng)站中所訪問的用戶等,本發(fā)明并不對此做出限定。用戶的屬性包括用戶行為和用戶基本信息,用戶行為指的是用戶通過中間資源購買、使用和評價某種產(chǎn)品的記錄,同時輔以用戶資源產(chǎn)品自身及環(huán)境的信息,用戶基本信息也可以稱之為用戶基本屬性,一般包括用戶的姓名、年齡和性別等等。用戶的價值由用戶行為和用戶基本屬性綜合得到,而不同的屬性有不同的價值,因此準(zhǔn)確判斷用戶價值的關(guān)鍵點在于準(zhǔn)確確定每個屬性的權(quán)重,下面將對如何確定各個屬性的權(quán)重進行介紹。

用戶價值可以為用戶帶來的流水、用戶通過產(chǎn)品進行有效數(shù)據(jù)交換的數(shù)量和質(zhì)量、用戶幫助推廣產(chǎn)品的力度、用戶對產(chǎn)品反饋意見等等。正樣本為產(chǎn)生實際價值的用戶的屬性,負(fù)樣本為未產(chǎn)生實際價值的用戶的屬性,是否產(chǎn)生實際價值可以根據(jù)實際場景進行確定。例如,在某購物網(wǎng)站中,如果用戶在該購物網(wǎng)站購買了產(chǎn)品,則認(rèn)定為該用戶產(chǎn)生了實際價值,如果用戶只是瀏覽了該購物網(wǎng)站,并沒有購買任何產(chǎn)品,則認(rèn)定為該用戶未產(chǎn)生實際價值。

獲取正負(fù)樣本的方式有很多種,例如,在一個實施例中,獲取正樣本和負(fù)樣本的步驟可以包括:獲取所有用戶的屬性,對每個屬性進行清洗,獲得屬性的全量樣本;按照預(yù)設(shè)的正樣本和負(fù)樣本的比例,從所述全量樣本中選取正樣本和負(fù)樣本。正樣本和負(fù)樣本的比例可以根據(jù)實際需要進行設(shè)定,考慮到未產(chǎn)生實際價值的用戶一般多于產(chǎn)生實際價值的用戶,可選的,選取的負(fù)樣本的數(shù)量一般多于正樣本的數(shù)量,例如,正樣本和負(fù)樣本的比例為1:9。

對數(shù)據(jù)進行清洗的方法有很多種,例如,在一個實施例中,對每個屬性進行清洗的步驟可以包括:

s1、若獲取的某條記錄中屬性的屬性值不在設(shè)定范圍內(nèi),將該條記錄刪除或者將該屬性值替換為空值;

事先設(shè)定每個屬性取值的范圍,如果獲取的某條記錄中屬性的屬性值不在設(shè)定的范圍內(nèi),則確定該屬性值為異常值,將該條記錄刪除或者將該屬性值替換為空值。以性別為例,設(shè)定性別的屬性值的范圍為女性、男性和中性,如果獲取的一條記錄中性別的屬性值為13,則可以確定該屬性值為記錄錯誤的數(shù)據(jù),即異常值,將該條記錄刪除或者將13替換為空值。如果某一個屬性下所有的屬性值都不在設(shè)定的范圍內(nèi),將該屬性刪除;

s2、對若干個屬性進行計算,衍生出新的屬性;

該步驟實質(zhì)上是指標(biāo)衍生的過程,通過多個變量的計算衍生出新的有意義的變量可以根據(jù)現(xiàn)有技術(shù)中已有的方式實現(xiàn);

s3、若屬性為數(shù)值型的屬性,將該數(shù)值型的屬性的所有屬性值從小到大進行排序,獲得在預(yù)設(shè)位置的分位數(shù),將大于所述分位數(shù)的屬性值替換為所述分位數(shù);預(yù)設(shè)位置為所有屬性值的總數(shù)量與預(yù)設(shè)比值的乘積;

該步驟實質(zhì)上是對一個屬性的極大值的處理,避免不合理的極大值影響后續(xù)計算的結(jié)果。預(yù)設(shè)比值可以根據(jù)實際需要進行確定,例如預(yù)設(shè)位置為總數(shù)量*99%。對數(shù)值型的屬性,計算分布的x%分位數(shù),將大于x%分位數(shù)的屬性值替換為x%分位數(shù)。x%分位數(shù)為將變量所有屬性值從小到大排序,排名在總樣本量*x%的那個屬性值,即小于x%分位數(shù)的樣本量占總樣本量的x%。

在步驟s120中,若某個屬性下的某個屬性值中正樣本比例遠遠大于全量樣本中正樣本的比例,則認(rèn)為這個屬性的這個屬性值對正樣本是正相關(guān)的,反之則為負(fù)相關(guān),即對于數(shù)值型的屬性,正樣本的比例隨著屬性的屬性值的增大而增大,則認(rèn)為這個屬性的這個屬性值對正樣本是正相關(guān)的,反之則為負(fù)相關(guān)。因此定義信息值(iv值,informationvalue),評估一個變量對正樣本的判斷量(影響程度),信息值越大,包含的信息越多,權(quán)重也就越大。

在一個實施例中,根據(jù)所述正樣本和所述負(fù)樣本計算每個屬性的信息值的步驟可以包括:

s1201、通過分箱法獲取抽樣樣本的所有分箱,其中所述抽樣樣本包括所述正樣本和所述負(fù)樣本;

分箱為將抽樣樣本的數(shù)據(jù)分為若干組,屬性一般包括數(shù)值型的屬性和分類型的屬性,屬性的性質(zhì)不同,分箱獲取的方法不同。在一個實施例中,獲取抽樣樣本的所有分箱的步驟可以包括:

s1201a、若屬性為數(shù)值型的屬性,將抽樣樣本按照預(yù)設(shè)排序規(guī)則進行排序,并將排序后的抽樣樣本分成若干個分箱,得到抽樣樣本的所有分箱;

預(yù)設(shè)排序規(guī)則可以為從小到大排序或者從大到小排序??蛇x的,對排序后的抽樣樣本分箱時可以采用等頻的方式,即每個分箱內(nèi)的樣本數(shù)目相同。另外,具體分箱的數(shù)目可以根據(jù)實際情況確定。例如,抽樣樣本有100個,將抽樣樣本從小到大排序,按等頻的方式分成10個分箱,每個分箱內(nèi)的樣本數(shù)目相同,均為10。又例如,抽樣樣本有100個,將抽樣樣本從小到大排序,按等頻的方式分成20個分箱,每個分箱內(nèi)的樣本數(shù)目相同,均為5。

s1201b、若屬性為分類型的屬性,將每個分類型的屬性作為一個分箱,得到抽樣樣本的所有分箱;

若一個變量(屬性)是分類型的屬性,則不需要進行分箱,一個分類型的屬性本身就是一個分箱,有多少個分類變量即為有多少個分箱。

s1202、計算每個分箱內(nèi)的正樣本占全部正樣本的第一比例,以及每個分箱內(nèi)的負(fù)樣本占全部負(fù)樣本的第二比例;

統(tǒng)計每個分箱內(nèi)正樣本占全部正樣本的比例,以及負(fù)樣本占全部負(fù)樣本的比例。設(shè)第i個分箱中的正樣本占全部正樣本比例為ri,第i個分箱中的負(fù)樣本占全部負(fù)樣本比例為ni。

s1203、根據(jù)所述第一比例和所述第二比例的差值與所述第一比例和所述第二比例比值的自然對數(shù)的乘積,獲得每個分箱的信息值;

根據(jù)下述公式計算第i個分箱的iv值:

s1204、對包含同一屬性的所有分箱的信息值進行求和,獲得每個屬性的信息值;

變量x(屬性x)的所有分箱的iv值之和為變量x的iv值,具體為:

在步驟s130中,步驟s120中已經(jīng)獲取每個屬性的信息值,那么一個屬性的信息值/所有屬性的信息值的和,即可以得到該屬性的權(quán)重??紤]到一般收集到的屬性是很多的,如果計算出所有屬性的權(quán)重則計算量較大,因此在不影響用戶價值評分準(zhǔn)確性的情況下,可以對一些屬性進行剔除,因此在一個實施例中,根據(jù)每個屬性的信息值與所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重的步驟可以包括:

s1301、按照預(yù)設(shè)篩選規(guī)則對所有屬性進行篩選,獲得保留的各個屬性;

屬性的篩選需要在保證用戶價值評分準(zhǔn)確性的基礎(chǔ)上進行。對屬性的篩選有多種實現(xiàn)方式,例如,在一個實施例中,按照預(yù)設(shè)篩選規(guī)則對所有屬性進行篩選,獲得保留的各個屬性的步驟可以包括以下的任意一種或任意組合:

s1301a、若兩個屬性的相關(guān)性大于預(yù)設(shè)閾值,將兩個屬性中信息值較大的屬性進行保留;

該步驟針對的是一些相關(guān)性很強的屬性,因此預(yù)設(shè)閾值可以設(shè)置的較大些,例如預(yù)設(shè)閾值可以設(shè)置為0.8。計算兩兩變量的相關(guān)性,對于相關(guān)性很強的兩個變量,只取其中一個變量用來計算最后的評分,例如將兩個變量中iv值較小的變量剔除,保留iv值較大的變量,避免相似的變量重復(fù)評分。

在進行相關(guān)性剔除之后剩余的變量也很多,往往不需要保留那么多變量,因此可以采用步驟s1301b和s1301c對剩余的變量中進行二次篩選。

s1301b、將信息值大于預(yù)設(shè)值的屬性進行保留;

該步驟是為了保留iv值較大的屬性,所以預(yù)設(shè)值可以設(shè)置的較小,例如預(yù)設(shè)值設(shè)置為0.3,將iv值小于0.3的變量剔除。

s1301c、按照信息值從大到小的順序,從信息值最大的屬性開始選取預(yù)設(shè)個數(shù)的屬性,將選取的屬性進行保留,得到保留的各個屬性;

預(yù)設(shè)個數(shù)可以根據(jù)實際需要進行確定,例如,保留iv值最大的前20%的變量,如總共有100個變量,保留iv值最高的20個變量。

需要說明的是,本發(fā)明并不對上述s1301a~s1301c的先后順序進行限定。

s1302、根據(jù)保留的每個屬性的信息值與保留的所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重;

前面計算了每個屬性的iv值,且對屬性進行了精簡,接下來則利用屬性的iv值,確定精簡后的屬性x的權(quán)重wx,計算公式如下:

上式中,ivx為精簡后的屬性的iv值,為精簡后的所有屬性的iv值的和,那么得到的權(quán)重wx為精簡后的屬性x的權(quán)重。

在步驟s140中,在一個實施例中,根據(jù)用戶的若干個屬性的屬性值和對應(yīng)的權(quán)重獲得用戶的用戶價值評分之前,還可以包括步驟:

s1401、若屬性為分類型的屬性,根據(jù)所述第一比例和所述第二比例比值的自然對數(shù)獲得每個分類型的屬性的證據(jù)權(quán)重,將每個分類型的屬性的屬性值替換為對應(yīng)的證據(jù)權(quán)重;

由于分類型的屬性的屬性值不可直接進行計算,因此需要將分類型的屬性的屬性值轉(zhuǎn)成數(shù)值型再進行權(quán)重求和??梢愿鶕?jù)下式計算分類型的屬性的woe值(weightofevidence,證據(jù)權(quán)重):

s1402、對每個屬性的屬性值進行標(biāo)準(zhǔn)化,并將每個屬性的屬性值替換為標(biāo)準(zhǔn)化后的屬性值;

該步驟中的每個屬性為所有類型的屬性,即包括分類型的屬性和數(shù)值型的屬性。分類型的屬性的屬性值先通過步驟s1401轉(zhuǎn)換為數(shù)值型,然后再通過步驟s1402進行標(biāo)準(zhǔn)化,數(shù)值型的屬性的屬性值直接通過步驟s1402進行標(biāo)準(zhǔn)化。

由于每個屬性的量級不一致且單位不一樣,例如屬性a的屬性值都是萬級的,屬性b的屬性值是100以下的值,若直接根據(jù)屬性值*權(quán)重計算用戶價值評分,那么即使屬性a的權(quán)重很小,但由于其量級大,會使得屬性a的分值非常大,因此需要將每個屬性的屬性值標(biāo)準(zhǔn)化,消除量綱和量級的影響。在一個實施例中,對每個屬性的屬性值進行標(biāo)準(zhǔn)化的步驟可以包括:

s1402a、計算同一屬性下所有屬性值的均值和標(biāo)準(zhǔn)差,得到每個屬性的均值和標(biāo)準(zhǔn)差;

例如,對于某一屬性x,計算屬性x下所有屬性值的均值,得到屬性x的均值計算屬性x下所有屬性值的標(biāo)準(zhǔn)差,得到屬性x的標(biāo)準(zhǔn)差為σ。對每一個屬性都進行該處理,則得到每個屬性的均值和標(biāo)準(zhǔn)差;

s1402b、計算每個屬性的屬性值和對應(yīng)均值的差值與對應(yīng)標(biāo)準(zhǔn)差的比值,得到各個標(biāo)準(zhǔn)化后的屬性值;

根據(jù)屬性x的均值和標(biāo)準(zhǔn)差為σ,通過下式對屬性x下每個屬性值進行標(biāo)準(zhǔn)化:

上式中,xi為屬性x的第i個屬性值,為xi標(biāo)準(zhǔn)后的屬性值。

每個屬性值均按上述方式進行處理,然后將所有屬性值替換為標(biāo)準(zhǔn)化后的屬性值,得到用于用戶價值評分的數(shù)據(jù)。

獲得各個屬性的屬性值以及的權(quán)重后,就可以根據(jù)下述公式確定每個用戶的用戶價值評分:

vx表示用戶在屬性x的取值,即屬性值,wx表示屬性x的權(quán)重。若在計算權(quán)重時未對屬性進行篩選,則上式中的表示用戶所有的屬性,即計算用戶中每一個屬性的值與權(quán)重的乘積,然后將所有的乘積相加,得到該用戶的用戶價值評分。若在計算權(quán)重時對屬性進行篩選,則上式中的表示對篩選后保留的該用戶的所有的屬性,即計算用戶中保留的每一個屬性的值與權(quán)重的乘積,然后將所有的乘積相加,得到該用戶的用戶價值評分。

基于同一發(fā)明構(gòu)思,本發(fā)明還提供一種用戶價值評分系統(tǒng),下面結(jié)合附圖對本發(fā)明系統(tǒng)的具體實施方式做詳細描述。

如圖2所示,一種用戶價值評分系統(tǒng),包括:

樣本獲取模塊110,用于獲取正樣本和負(fù)樣本,其中,所述正樣本為產(chǎn)生實際價值的用戶的若干個屬性,所述負(fù)樣本為未產(chǎn)生實際價值的用戶的若干個屬性,用戶的屬性包括數(shù)值型的屬性和分類型的屬性;

信息值計算模塊120,用于根據(jù)所述正樣本和所述負(fù)樣本計算每個屬性的信息值,其中所述信息值用于評估一個屬性對所述正樣本的影響程度;

權(quán)重獲得模塊130,用于根據(jù)每個屬性的信息值與所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重;

用戶價值評分模塊140,用于根據(jù)用戶的若干個屬性的屬性值和對應(yīng)的權(quán)重獲得用戶的用戶價值評分。

上述用戶價值評分系統(tǒng)可以運行在終端中,例如電腦或者手機中。該系統(tǒng)根據(jù)屬性的屬性值和屬性的權(quán)重對用戶價值進行評分,由于用戶價值的判斷基于客觀數(shù)據(jù),因此能夠客觀判斷用戶價值,提高了用戶價值判斷的準(zhǔn)確性。為了更好地理解該方法,下面對各個模塊進行詳細介紹。

用戶的屬性包括用戶行為和用戶基本信息,用戶行為指的是用戶通過中間資源購買、使用和評價某種產(chǎn)品的記錄,同時輔以用戶資源產(chǎn)品自身及環(huán)境的信息,用戶基本信息也可以稱之為用戶基本屬性,一般包括用戶的姓名、年齡和性別等等。正樣本為產(chǎn)生實際價值的用戶的屬性,負(fù)樣本為未產(chǎn)生實際價值的用戶的屬性,是否產(chǎn)生實際價值可以根據(jù)實際場景進行確定。

樣本獲取模塊110獲取正負(fù)樣本的方式有很多種,例如,在一個實施例中,樣本獲取模塊110獲取所有用戶的屬性,對每個屬性進行清洗,獲得屬性的全量樣本;按照預(yù)設(shè)的正樣本和負(fù)樣本的比例,從所述全量樣本中選取正樣本和負(fù)樣本。

樣本獲取模塊110對數(shù)據(jù)進行清洗的方式有很多種,例如,在一個實施例中,樣本獲取模塊110在獲取的某條記錄中屬性的屬性值不在設(shè)定范圍內(nèi)時,將該條記錄刪除或者將該屬性值替換為空值;對若干個屬性進行計算,衍生出新的屬性;在屬性為數(shù)值型的屬性時,將該數(shù)值型的屬性的所有屬性值從小到大進行排序,獲得在預(yù)設(shè)位置的分位數(shù),將大于所述分位數(shù)的屬性值替換為所述分位數(shù);預(yù)設(shè)位置為所有屬性值的總數(shù)量與預(yù)設(shè)比值的乘積;

在一個實施例中,所述信息值計算模塊120可以包括:

分箱獲取單元1201,用于通過分箱法獲取抽樣樣本的所有分箱,其中所述抽樣樣本包括所述正樣本和所述負(fù)樣本;

比例計算單元1202,用于計算每個分箱內(nèi)的正樣本占全部正樣本的第一比例,以及每個分箱內(nèi)的負(fù)樣本占全部負(fù)樣本的第二比例;

分箱信息值獲得單元1203,用于根據(jù)所述第一比例和所述第二比例的差值與所述第一比例和所述第二比例比值的自然對數(shù)的乘積,獲得每個分箱的信息值;

屬性信息值獲得單元1204,用于對包含同一屬性的所有分箱的信息值進行求和,獲得每個屬性的信息值。

在一個實施例中,分箱獲取單元1201在屬性為數(shù)值型的屬性時,將抽樣樣本按照預(yù)設(shè)排序規(guī)則進行排序,并將排序后的抽樣樣本分成若干個分箱,得到抽樣樣本的所有分箱;在屬性為分類型的屬性時,將每個分類型的屬性作為一個分箱,得到抽樣樣本的所有分箱。

權(quán)重獲得模塊130根據(jù)一個屬性的信息值/所有屬性的信息值的和,得到該屬性的權(quán)重。在保證用戶價值評分準(zhǔn)確性的基礎(chǔ)上,為了降低計算量,在一個實施例中,權(quán)重獲得模塊130按照預(yù)設(shè)篩選規(guī)則對所有屬性進行篩選,獲得保留的各個屬性;根據(jù)保留的每個屬性的信息值與保留的所有屬性的信息值的和的比值,獲得每個屬性的權(quán)重。

在一個實施例中,權(quán)重獲得模塊130在兩個屬性的相關(guān)性大于預(yù)設(shè)閾值時,將兩個屬性中信息值較大的屬性進行保留;將信息值大于預(yù)設(shè)值的屬性進行保留;按照信息值從大到小的順序,從信息值最大的屬性開始選取預(yù)設(shè)個數(shù)的屬性,將選取的屬性進行保留,得到保留的各個屬性。

在一個實施例中,所述用戶價值評分模塊140根據(jù)用戶的若干個屬性的屬性值和對應(yīng)的權(quán)重獲得用戶的用戶價值評分之前,還用于在屬性為分類型的屬性時,根據(jù)所述第一比例和所述第二比例比值的自然對數(shù)獲得每個分類型的屬性的證據(jù)權(quán)重,將每個分類型的屬性的屬性值替換為對應(yīng)的證據(jù)權(quán)重,對每個屬性的屬性值進行標(biāo)準(zhǔn)化,并將每個屬性的屬性值替換為標(biāo)準(zhǔn)化后的屬性值。

在一個實施例中,所述用戶價值評分模塊140計算同一屬性下所有屬性值的均值和標(biāo)準(zhǔn)差,得到每個屬性的均值和標(biāo)準(zhǔn)差,計算每個屬性的屬性值和對應(yīng)均值的差值與對應(yīng)標(biāo)準(zhǔn)差的比值,得到各個標(biāo)準(zhǔn)化后的屬性值。

獲得各個屬性的屬性值以及的權(quán)重后,用戶價值評分模塊140就可以根據(jù)下述公式確定每個用戶的用戶價值評分:

vx表示用戶在屬性x的取值,wx表示屬性x的權(quán)重。若在計算權(quán)重時未對屬性進行篩選,則上式中的表示用戶所有的屬性,即用戶價值評分模塊140計算用戶中每一個屬性的值與權(quán)重的乘積,然后將所有的乘積相加,得到該用戶的用戶價值評分。若在計算權(quán)重時對屬性進行篩選,則上式中的表示篩選后保留的該用戶的所有的屬性,即用戶價值評分模塊140計算用戶中保留的每一個屬性的值與權(quán)重的乘積,然后將所有的乘積相加,得到該用戶的用戶價值評分。

上述用戶價值評分方法和系統(tǒng),根據(jù)用戶屬性自適應(yīng)地自動化計算用戶價值評分,有新的屬性加進來的時候只需計算新進來的屬性的iv值,就可以快速地更新各個屬性的權(quán)重,提高了用戶價值判斷的準(zhǔn)確性和便捷性。根據(jù)本發(fā)明提供的用戶價值評分,可以準(zhǔn)確對用戶分層管理,有助于篩選高價值用戶,對高價值用戶給予更多關(guān)注,提升高價值用戶群體的質(zhì)量,也可作為運營分析的市場監(jiān)控,若發(fā)現(xiàn)分值的分布有顯著變化,則反饋這個異常,由分析師進一步分析產(chǎn)生異常的原因,降低市場風(fēng)險等。

本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(read-onlymemory,rom)或隨機存儲記憶體(randomaccessmemory,ram)等。

以上所述實施例的各技術(shù)特征可以進行任意的組合,為使描述簡潔,未對上述實施例中的各個技術(shù)特征所有可能的組合都進行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說明書記載的范圍。

以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
会理县| 巩留县| 四川省| 高安市| 无棣县| 盘山县| 应用必备| 大庆市| 财经| 绥化市| 儋州市| 潞西市| 同江市| 彝良县| 依兰县| 阿克陶县| 潍坊市| 青浦区| 达州市| 阿合奇县| 黔东| 沂源县| 来宾市| 牟定县| 福海县| 南康市| 龙山县| 贵州省| 新昌县| 晴隆县| 孝义市| 镇坪县| 卫辉市| 白城市| 郴州市| 五家渠市| 新郑市| 徐州市| 建德市| 云和县| 吉木乃县|