本發(fā)明屬于計算機應(yīng)用
技術(shù)領(lǐng)域:
,具體涉及一種基于評分者印象的電子商務(wù)信用計算方法。
背景技術(shù):
:社會心理學(xué)研究表明,印象形成于人在過去的經(jīng)驗中對事物的理解和行為習(xí)慣,并會對人今后的行為產(chǎn)生持續(xù)的影響,根據(jù)印象我們可以把人或者事物進行分類,印象形成的心理效應(yīng)中其中一種是定型效應(yīng),也就是說印象一旦形成就很容易固定,不會輕易改變。在電子商務(wù)中,對于賣方提供的商品或者服務(wù),不同的買方由于自身的主觀感受不同,就會產(chǎn)生不同的評價,同一種商品或者服務(wù),有的人給出的評價較高,而有的人則給出了較差的評分,如果電商市場中不誠實的評分者(買家)占所有評分者的比例增加(大于50%)時,或者不誠實賣家的不誠實比例上升時(大于50%),導(dǎo)致現(xiàn)有的算法崩潰或者性能下降。技術(shù)實現(xiàn)要素:針對現(xiàn)有技術(shù)中存在的上述技術(shù)問題,本發(fā)明提出了一種基于評分者印象的電子商務(wù)信用計算方法,設(shè)計合理,克服了現(xiàn)有技術(shù)的不足,具有良好的效果。為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:一種基于評分者印象的電子商務(wù)信用計算方法,包括如下步驟:步驟1:對所有買家聚類輸出寬松型買家和嚴苛型買家集合;步驟1.1:在所有買家中找第一個寬松型買家和嚴苛型買家;步驟1.1.1:設(shè)計ic(impressioncoefficientic<<1)參數(shù)來設(shè)定寬松型買家的數(shù)量v和嚴苛型買家的數(shù)量v,ic表示寬松型買家占所有評分較高買家的比例,同時也是嚴苛型買家占所有評分較低買家的比例;步驟1.1.2:計算每個買家的評分均值和均方差,將買家按照均值從大到小的順序排列,在最前5個買家中選方差最小的一個買家作為寬松型買家的質(zhì)心,并把此買家劃歸到寬松型買家集合中,在最后5個買家中選方差最小的一個買家作為嚴苛型買家的質(zhì)心,并把此買家劃歸到嚴苛型買家集合中;步驟1.2:在所有剩余的買家中找其余的v-1個寬松型買家和嚴苛型買家;步驟1.2.1:對除去寬松型買家以外的剩余買家,計算每個買家到質(zhì)心的歐式距離,選擇歐式距離最小的一個買家,把它規(guī)劃到寬松型買家集合中,并更新質(zhì)心的屬性值;步驟1.2.2:將步驟1.2.1重復(fù)執(zhí)行v-1次,得到最終的寬松型買家聚類子集;步驟1.2.3:對除去嚴苛型買家以外的剩余買家,計算每個買家到質(zhì)心的歐式距離,選擇歐式距離最小的一個買家,把它規(guī)劃到嚴苛型買家集合中,并更新質(zhì)心的屬性值;步驟1.2.4:將步驟1.2.3重復(fù)執(zhí)行v-1次,得到最終的嚴苛型買家聚類子集;步驟1.3:剔除掉寬松型買家聚類子集和嚴苛型買家聚類子集的交集;步驟1.4:輸出結(jié)果;步驟2:根據(jù)步驟1的結(jié)果過濾出部分誠信賣家和非誠信賣家;步驟3:根據(jù)步驟2的結(jié)果對買家進行分類得到誠信買家、非誠信買家和不確定買家三類;步驟4:對所有的賣家按照公式(5)計算其信用值;tr(sj)=wh×rep(bhonest,sj)+wu×rep(buncertain,sj)+wd×rep(blie,sj)(5);其中,tr(sj)為賣家的信用值;bhonest∪buncertain∪blie=b,b={bi|i=1,2,...,n}為買家的集合;s={sj|j=1,2,...,m}為賣家的集合;rep(bhonest,sj)、rep(buncertain,sj)、rep(blie,sj)分別是買家子集bhonest、買家子集buncertain和買家子集blie對賣家sj的信譽分,可由公式(3)得出;wh、wu和wd分別是誠信買家、不確定買家和非誠信買家在式中所占的權(quán)重,其權(quán)重值可由公式(6)得出;其中,npos(bi,sj)是買家bi對賣家sj的好評次數(shù),nneg(bi,sj)是買家bi對賣家sj的差評次數(shù);其中,hd(hd>1,wh+wu+wd=1)表示誠信和非誠信的對比度。優(yōu)選地,在步驟2中,具體包括如下步驟:步驟2.1:嚴苛型買家給出的好評是可以信賴的,被嚴苛型買家評分好的賣家的商品或者服務(wù)是真的好,跟嚴苛型買家有過交易的賣家中,被嚴苛型買家評分為好評的賣家被劃歸到初始的誠信賣家子集中;步驟2.2:寬松型買家給出的差評是可以信賴的,被寬松型買家評分差的賣家的商品或服務(wù)是真的差,跟寬松型買家有過交易的賣家中,被寬松型買家評分為差評的賣家被劃歸到初始的非誠信賣家子集;步驟2.3:剔除掉誠信賣家子集和非誠信賣家子集的交集;步驟2.4:輸出結(jié)果。優(yōu)選地,在步驟3中,具體包括如下步驟:步驟3.1:按照公式(4)計算所有買家集合b對所有賣家集合s的信譽分即市場的基準信譽值rep(b,s);其中,b={bi|i=1,2,...,n}為買家的集合;s={sj|j=1,2,...,m}為賣家的集合;npos(bi,sj)為買家bi對賣家sj的好評次數(shù);nneg(bi,sj)為買家bi對賣家sj的差評次數(shù);步驟3.2:按照公式(2)計算買家對誠信賣家子集的信譽值rep(bi,shonest)和買家對非誠信賣家子集的信譽值rep(bi,slie),對誠實賣家打高分且對不誠賣家打低分的被認為是誠信買家,反之被認為是非誠信買家,剩余的是不確定買家;其中,s'表示某個賣家子集;步驟3.3:輸出結(jié)果。本發(fā)明所帶來的有益技術(shù)效果:1、考慮了評分者評分的主觀因素,根據(jù)常理做出了寬松型和嚴苛性評分者行為習(xí)慣的假設(shè)。2、對常見的不誠實評分攻擊,本算法都有較好的表現(xiàn);對于組合的攻擊方式算法也表現(xiàn)不俗。3、當市場中不誠實買家和賣家的比例上升時,算法仍然可以有效的工作,算法的健壯性較好。4、在篩選嚴苛型和寬松型買家時,考慮到此兩類買家的稀少性(通過參數(shù)ic設(shè)定其數(shù)量)采用一種不完全聚類的算法,提高了聚類精度,加快了聚類收斂速度。5、算法沒有考慮買家的間接經(jīng)驗,不需要建立龐大的信任網(wǎng)絡(luò),節(jié)省了大量的計算好友信譽和權(quán)重的時間,響應(yīng)速度快。附圖說明圖1為一種基于評分者印象的電子商務(wù)信用計算方法的流程框圖。圖2為采用本發(fā)明方法抵御各種攻擊的marhs變化圖。圖3為采用本發(fā)明方法抵御各種攻擊的準確性變化圖。圖4為市場中不誠實的賣家比例上升算法的健壯性表現(xiàn)示意圖。圖5為市場中不誠實的買家比例上升算法的健壯性表現(xiàn)示意圖。具體實施方式下面結(jié)合附圖以及具體實施方式對本發(fā)明作進一步詳細說明:同一種商品或者服務(wù),有的人給出的評價較高,而有的人則給出了較差的評分。根據(jù)這一特性,我們把經(jīng)常給高分的買家稱之為寬松型(lenient)買家,經(jīng)常給低分的買家稱之為嚴苛型(strict)買家。以下是本算法中相關(guān)的定義和形式化表述。假設(shè)在電子商務(wù)市場中買家的集合可表示成b={bi|i=1,2,...,n},賣家的集合可表示成s={sj|j=1,2,...,m}。表示買家bi在時刻t對賣家sj的評分(上標k>2,表示評分等級共有k級,且表示評分值只有兩個等級(好評1,差評-1)。定義1-4屬于兩級評分,定義5屬于多級評分。定義1假設(shè)買家bi對賣家sj的好評次數(shù)用npos(bi,sj)表示,差評次數(shù)用nneg(bi,sj)表示,則bi對sj的信譽分由rep(bi,sj)表示,其表達式如公式(1)所示:npos(bi,sj)是買家bi對賣家sj的好評次數(shù),nneg(bi,sj)是買家bi對賣家sj的差評次數(shù)。定義2買家bi對某個賣家集合s'的信譽分由rep(bi,s')表示,其表達式如公式(2)所示:npos(bi,sj)是買家bi對賣家sj的好評次數(shù),nneg(bi,sj)是買家bi對賣家sj的差評次數(shù)。定義3某個買家集合b'對賣家sj的信譽分由rep(b',sj)表示,其表達式如公式(3)所示:npos(bi,sj)是買家bi對賣家sj的好評次數(shù),nneg(bi,sj)是買家bi對賣家sj的差評次數(shù)。定義4所有買家集合b對所有賣家集合s的信譽分(市場的基準信譽分)由rep(b,s)表示,其表達式如公式(4)所示:npos(bi,sj)是買家bi對賣家sj的好評次數(shù),nneg(bi,sj)是買家bi對賣家sj的差評次數(shù)。定義5在多級評分體系中,假定買家對賣家評分從最差到最好共有有k個等級,設(shè)k(1≤k≤k)是賣方sj的真實等級值。我們按照以下規(guī)則對買家歸類:1、當買家bi對賣家sj的評分總是比賣家的真實等級k至少高一個等級,即if我們定義這類買家為寬松型買家(lenient)。特別注意的是當賣家的真實等級k=k時,令寬松型買家的評分值等于k(最高分打到k),即2、當買家bi對賣家sj的評分總是比賣家的真實等級k至少低一個等級,即if我們定義這類買家為嚴苛型買家(strict)。特別注意的是當賣家的真實等級k=1時,令嚴苛型買家的評分值等于1(最低分打到1),即假定1根據(jù)買家以往的評分信息,如果判定他是寬松型或者嚴苛型的買家,那么他的評分習(xí)慣會在隨后的評分中得到延續(xù),并且存在以下規(guī)律。1、寬松型買家給出的差評是可以信賴的,被寬松型買家評分差的賣家的商品或服務(wù)是真的差。2、嚴苛型買家給出的好評也是可以信賴的,被嚴苛型買家評分好的賣家的商品或者服務(wù)是真的好。在給出算法之前,我們先將有關(guān)的問題作出以下約定:(1)在集中式或者分布式評分數(shù)據(jù)庫中,截取最近一段時間(t)的評分數(shù)據(jù)。在算法中將評分數(shù)據(jù)存放在評分矩陣中,實驗中k=5,即評分是從1到5五個等級。(2)算法中的買家bi和賣家sj都是指較活躍的買家和賣家。(3)算法中我們認為交易即評分,用交易量表示評分的次數(shù)。從評分矩陣中選取的交易量應(yīng)該足夠大以保證算法能夠收斂,選取大小參考實驗1。(4)算法給出的是計算一次賣家信譽的過程,信譽的更新既可以按固定的周期進行也可以按固定的交易量來進行?;谠u分者印象的族分類算法(imc):基于以上假定,我們給出具體實現(xiàn)過程,由于算法需要交易者的歷史交易信息,因此我們設(shè)定算法的初始運行條件是市場的總交易量大于300次。更新賣家信用值的周期可由平臺管理者根據(jù)需要自行設(shè)定。一種基于評分者印象的電子商務(wù)信用計算方法(如圖1所示),具體包括如下步驟:步驟1:對所有買家聚類輸出寬松型買家和嚴苛型買家集合;步驟1.1:在所有買家中找第一個寬松型買家和嚴苛型買家;步驟1.1.1:設(shè)計ic(impressioncoefficientic<<1)參數(shù)來設(shè)定寬松型買家的數(shù)量v和嚴苛型買家的數(shù)量v,ic表示寬松型買家占所有評分較高買家的比例,同時也是嚴苛型買家占所有評分較低買家的比例;步驟1.1.2:計算每個買家的評分均值和均方差,將買家按照均值從大到小的順序排列,在最前5個買家中選方差最小的一個買家作為寬松型買家的質(zhì)心,并把此買家劃歸到寬松型買家集合中,在最后5個買家中選方差最小的一個買家作為嚴苛型買家的質(zhì)心,并把此買家劃歸到嚴苛型買家集合中;步驟1.2:在所有剩余的買家中找其余的v-1個寬松型買家和嚴苛型買家;步驟1.2.1:對除去寬松型買家以外的剩余買家,計算每個買家到質(zhì)心的歐式距離,選擇歐式距離最小的一個買家,把它規(guī)劃到寬松型買家集合中,并更新質(zhì)心的屬性值;步驟1.2.2:將步驟1.2.1重復(fù)執(zhí)行v-1次,得到最終的寬松型買家聚類子集;步驟1.2.3:對除去嚴苛型買家以外的剩余買家,計算每個買家到質(zhì)心的歐式距離,選擇歐式距離最小的一個買家,把它規(guī)劃到嚴苛型買家集合中,并更新質(zhì)心的屬性值;步驟1.2.4:將步驟1.2.3重復(fù)執(zhí)行v-1次,得到最終的嚴苛型買家聚類子集;步驟1.3:剔除掉寬松型買家聚類子集和嚴苛型買家聚類子集的交集;步驟1.4:輸出結(jié)果。步驟2:根據(jù)步驟1的結(jié)果過濾出部分誠信賣家和非誠信賣家;具體包括如下步驟:步驟2.1:嚴苛型買家給出的好評是可以信賴的,被嚴苛型買家評分好的賣家的商品或者服務(wù)是真的好,跟嚴苛型買家有過交易的賣家中,被嚴苛型買家評分為好評的賣家被劃歸到初始的誠信賣家子集中;步驟2.2:寬松型買家給出的差評是可以信賴的,被寬松型買家評分差的賣家的商品或服務(wù)是真的差,跟寬松型買家有過交易的賣家中,被寬松型買家評分為差評的賣家被劃歸到初始的非誠信賣家子集;步驟2.3:剔除掉誠信賣家子集和非誠信賣家子集的交集;步驟2.4:輸出結(jié)果。步驟3:根據(jù)步驟2的結(jié)果對買家進行分類得到誠信買家、非誠信買家和不確定買家三類;具體包括如下步驟:步驟3.1:按照公式(4)計算所有買家集合b對所有賣家集合s的信譽分即市場的基準信譽值rep(b,s);其中,b={bi|i=1,2,...,n}為買家的集合;s={sj|j=1,2,...,m}為賣家的集合;npos(bi,sj)為買家bi對賣家sj的好評次數(shù);nneg(bi,sj)為買家bi對賣家sj的差評次數(shù);步驟3.2:按照公式(2)計算買家對誠信賣家子集的信譽值rep(bi,shonest)和買家對非誠信賣家子集的信譽值rep(bi,slie),對誠實賣家打高分且對不誠賣家打低分的被認為是誠信買家,反之被認為是非誠信買家,剩余的是不確定買家;其中,s'表示某個賣家子集;步驟3.3:輸出結(jié)果。步驟4:對所有的賣家按照公式(5)計算其信用值。公式5賣家的信用值tr(sj)可由下式計算:tr(sj)=wh×rep(bhonest,sj)+wu×rep(buncertain,sj)+wd×rep(blie,sj)(5);其中,bhonest∪buncertain∪blie=b;wh、wu和wd分別是誠實買家、不確定買家和不誠實買家在式中所占的權(quán)重,其權(quán)重值由公式(6)得出,rep(bhonest,sj)、rep(buncertain,sj)和rep(blie,sj)由公式(3)得出。定義6誠實買家、不確定買家和不誠實買家的權(quán)重值如公式(6)所示:其中,hd(hd>1,wh+wu+wd=1)表示誠信和非誠信的對比度,此參數(shù)也可根據(jù)需要自行設(shè)定。提供發(fā)明的實驗數(shù)據(jù)、圖、表等能說明此發(fā)明的優(yōu)點、有益效果的材料:模擬實驗?zāi)康氖球炞C、分析本文算法的有效性、準確率和健壯性。第一套實驗的目的是分析一組固定參數(shù)下,過濾準確性隨市場交易量的變化趨勢,觀察算法對抗各種攻擊方式的收斂速度。第二套實驗的目的是在市場交易量足夠大(能夠使過濾準確性達到穩(wěn)定)情況下,分析在參數(shù)ic和hd多種組合下,過濾準確性隨市場交易量的變化趨勢,從而給出參數(shù)的最佳取值范圍。第三套實驗的目的是在市場交易量足夠大(能夠使過濾準確性達到穩(wěn)定)情況下,分別增加不誠賣家和不誠買家的占比,分析算法的健壯性。表1列出了各模擬實驗的環(huán)境參數(shù)設(shè)定值。表1評估標準在實驗中,我們采用所有誠信賣家信用均值(marhs)作為算法的有效性和性能的評估標準,公式(7)給出了marhs的計算方法;其中,tr(sj)可由公式(5)得出;shonest是模擬實驗平臺中的真實誠信賣家集合;marhs的取值在0到1之間,值越接近真實的誠信買家均值表明算法越有效,性能也就越高,本實驗中真實買家均值=0.9。mcc用來檢驗算法的準確率,其表達式如公式(8)所示:其中,fp表示非誠信的賣家被算法錯誤的判定成誠信賣家的數(shù)量;tp表示誠信的賣家被算法正確的判定成誠信賣家的數(shù)量;fn表示誠信的賣家被算法錯誤的判定成非誠信賣家的數(shù)量;tn表示非誠信的賣家被算法正確的判定成非誠信賣家的數(shù)量;mcc的值在-1到1之間,1表示結(jié)果完全正確,-1表示完全錯誤,0則表示結(jié)果跟隨機的沒有差別。實驗1:有效性和準確型實驗結(jié)果及分析圖2顯示了隨著交易量(從300開始)的增加算法在對抗各種攻擊marhs的變化趨勢。對于camouflage和sybil_camouflage的攻擊在整個過程中marhs的值一直穩(wěn)定在0.9附近。在交易初始階段(e.g.transactions300-1300)sybil_whitewashing和whitewashing的marhs值在不穩(wěn)定的增長,隨后上升到0.9并穩(wěn)定下來。sybil和alwaysunfair的marhs值在市場交易次數(shù)超過1500的時候才穩(wěn)定下來。對所有的攻擊模式marhs值最后都穩(wěn)定在0.9左右,說明算法對所有的攻擊模式都是有效的,其中camouflage、whitewashing、sybil_whitewashing和sybil_camouflage效果最好,alwaysunfair次之,sybil最差。圖3顯示了mcc的結(jié)果。從變化趨勢中我們能看到對所有的攻擊模式,隨著市場交易量的增加算法的準確率也在不斷提高。sybil收斂的很慢,但交易量超過1500以后也收斂到1了??傊惴▽垢鞣N攻擊方式的準確率還是很令人滿意的。實驗2:算法設(shè)計了兩個參數(shù):ic(impressioncoefficient)和hd(theratioofhonesttodishonest)。這一部分是通過改變ic參數(shù)的值,令hd=100來觀察算法的性能。表2顯示了參數(shù)hd和ic變化時,算法對抗各種攻擊得到的mcc的均值和方差。表2icalwaysunfaicamouflagewhitewashingsybilsybil_camouflagsybil_whitewashing0.0750.75±0.200.93±0.030.97±0.020.75±0.230.92±0.030.97±0.020.10.81±0.200.91±0.020.97±0.020.79±0.200.92±0.020.97±0.020.1250.86±0.150.90±0.010.97±0.020.85±0.170.90±0.010.97±0.020.150.89±0.130.90±0.010.97±0.020.89±0.140.90±0.000.97±0.020.1750.90±0.160.90±0.000.97±0.020.88±0.170.90±0.000.97±0.020.20.83±0.200.90±0.000.97±0.020.88±0.140.90±0.000.97±0.02從表2可以看出,對于whitewashing和sybil_whitewashing的攻擊方式,算法準確率mcc的值幾乎不受參數(shù)ic變化的影響;對于其它的攻擊方式,當0.12≤ic≤0.15時準確率表現(xiàn)最好,當ic>0.15或者ic<0.12時準確率開始下降(mcc均值降低方差增大)。綜合以上分析,我們建議參數(shù)取0.12≤ic≤0.15。在此條件下,算法的準確率對于camouflage、whitewashing、sybil_whitewashing和sybil_camouflage的攻擊方式表現(xiàn)優(yōu)良,alwaysunfair的攻擊方式次之,sybil的攻擊方式最差。實驗3:健壯性和可靠性實驗圖4顯示了市場中不誠實賣家的比例上升(30%~70%)時,marhs的變化趨勢。從marhs圖中我們明顯看出,alwaysunfair和sybil在不誠賣家比例上升到50%的時候marhs開始下降;但在比例達到70%的時候,marhs還在0.7附近,這還是可以接受的。算法對抗其余的幾種攻擊方式都表現(xiàn)很好(marhs的值穩(wěn)定在0.8-0.9之間),算法的性能并沒有隨不誠賣方的比例增大而明顯下降。圖5顯示了市場中不誠實買家的比例上升(30%~70%)時,marhs的變化趨勢。從圖中可以看出,算法對抗camouflage和sybil_camouflage的攻擊表現(xiàn)優(yōu)良(marhs的值穩(wěn)定在0.9附近),并沒有隨不誠買家的比例上升而明顯下降。whitewashing和sybil_whitewashing的marhs值在比例大于60%的時候略微下降。sybil和alwaysunfair的marhs值在比例為50%的時候達到最高,而后隨不誠買家比例的上升而下降,當比例大于70%的時候算法對抗sybil的性能明顯下降。綜上所述,除了個別的攻擊方式(sybil)外,算法的健壯性和可靠性表現(xiàn)優(yōu)良。當然,上述說明并非是對本發(fā)明的限制,本發(fā)明也并不僅限于上述舉例,本
技術(shù)領(lǐng)域:
的技術(shù)人員在本發(fā)明的實質(zhì)范圍內(nèi)所做出的變化、改型、添加或替換,也應(yīng)屬于本發(fā)明的保護范圍。當前第1頁12