本發(fā)明涉及防偽溯源領(lǐng)域,更具體地,涉及一種基于防偽溯源系統(tǒng)的用戶群體劃分方法及系統(tǒng)。
背景技術(shù):
現(xiàn)階段的防偽溯源系統(tǒng),消費(fèi)者通過(guò)產(chǎn)品上粘貼的rfid或二維碼查詢?cè)摦a(chǎn)品從生產(chǎn)到流通再到自己手里的全過(guò)程信息。系統(tǒng)接收用戶特征,商品特征,并返回商品的真?zhèn)谓Y(jié)果,商品生產(chǎn)、制作、批發(fā)、零售等環(huán)節(jié)記錄。電商平臺(tái)收集用戶的線上購(gòu)物信息,根據(jù)用戶以往的購(gòu)買記錄對(duì)用戶進(jìn)行商品推薦。
通過(guò)上述現(xiàn)有方案防偽溯源系統(tǒng)未有效挖掘系統(tǒng)獲取的數(shù)據(jù)信息價(jià)值,傳統(tǒng)電商平臺(tái)僅利用用戶線上購(gòu)物相關(guān)數(shù)據(jù)進(jìn)行用戶群體劃分,采集的用戶相關(guān)特征信息不夠全面。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明為克服上述現(xiàn)有技術(shù)所述的至少一種缺陷,提供一種基于防偽溯源系統(tǒng)的用戶群體劃分方法及系統(tǒng)。
為解決上述技術(shù)問(wèn)題,本發(fā)明的技術(shù)方案如下:
一種基于防偽溯源系統(tǒng)的用戶群體劃分方法,包括以下步驟:
s1:獲取用戶的特征信息,商品的特征信息和查詢的特征信息;
s2:根據(jù)獲取的信息,利用數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)歸約方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,得到的樣本集d,d={x1,x2,…,xm}包含m個(gè)無(wú)標(biāo)記樣本,每個(gè)樣本xi=(xi1;xi2,...,xin)是一個(gè)n維特征向量,反映了用戶的相關(guān)特征信息;
s3:根據(jù)預(yù)處理得到的樣本集,利用改進(jìn)的模糊聚類算法對(duì)用戶群體進(jìn)行劃分并標(biāo)記,同時(shí)得到分類模型;
s4:根據(jù)分類模型對(duì)新用戶進(jìn)行劃分,并修正模型參數(shù)和更新所有用戶的劃分結(jié)果;
s5:發(fā)送用戶群體劃分結(jié)果到數(shù)據(jù)庫(kù),分類儲(chǔ)存信息。
在一種優(yōu)選的技術(shù)方案中,步驟s1中,用戶的特征信息包括id、性別和年齡,商品的特征信息包括種類和價(jià)格,查詢的特征信息包括查詢地理位置、查詢時(shí)間、真?zhèn)吻闆r、查詢次數(shù)。
在一種優(yōu)選的技術(shù)方案中,步驟s2中,具體包括以下步驟:
s2.1:檢查各項(xiàng)信息是否為空,如果為空,則直接刪除;
s2.2:對(duì)輸入價(jià)格的格式進(jìn)行統(tǒng)一,價(jià)格只保留整數(shù)部分,表示貨幣的符號(hào)和小數(shù)點(diǎn)皆刪除;
s2.3:對(duì)自動(dòng)定位的空間位置提取有用信息,包括省、市、區(qū)、街道、門牌號(hào)信息;
s2.4:將數(shù)據(jù)依據(jù)一定的規(guī)則進(jìn)行變換,對(duì)年齡按照預(yù)設(shè)的間隔(1-10,11-20,…,101-110)劃分為(1,2,…,11),對(duì)地理位置依據(jù)城市、農(nóng)村二元?jiǎng)澐譃?0、1)。
在一種優(yōu)選的技術(shù)方案中,步驟s3中,根據(jù)預(yù)處理得到的樣本集d,利用改進(jìn)的模糊聚類算法將d劃分為k個(gè)不相交的簇{cl|l=1,2,...,k},其中
在一種優(yōu)選的技術(shù)方案中,步驟s3中,具體包括以下步驟:
s3.1:設(shè)改進(jìn)的模糊聚類算法目標(biāo)函數(shù)為:
其中,c為聚類的數(shù)目,n為樣本的數(shù)目,
s3.2:當(dāng)目標(biāo)函數(shù)取最小值時(shí),即可得到聚類的最好效果,使用下列迭代方法來(lái)實(shí)現(xiàn):
a、更新隸屬度劃分矩陣:
b、更新聚類中心:
s3.3:循環(huán)步驟s3.2,滿足||vnew-vold||<ε時(shí),即為理想聚類結(jié)果,其中vnew為新的聚類中心,vold為舊的聚類中心,ε為預(yù)設(shè)的閾值。
在一種優(yōu)選的技術(shù)方案中,步驟s4中,將新引入的用戶數(shù)據(jù)加入數(shù)據(jù)集,利用步驟s3的方法,對(duì)原有參數(shù)uik和vi進(jìn)行修正,使分類模型的精確度更高,更新所有用戶聚類結(jié)果。
在一種優(yōu)選的技術(shù)方案中,步驟s5中,將用戶聚類到簇,根據(jù)簇將其相應(yīng)的用戶群體信息分類存儲(chǔ)到數(shù)據(jù)庫(kù),即確定
一種基于防偽溯源系統(tǒng)的用戶群體劃分系統(tǒng),包括:
信息采集模塊:用于采集聚類所需信息,用戶的特征信息,商品的特征信息和查詢的特征信息;
信息預(yù)處理模塊:用于對(duì)信息采集模塊得到的數(shù)據(jù)進(jìn)行預(yù)處理,得到的樣本集d={x1,x2,...,xm}包含m個(gè)無(wú)標(biāo)記樣本,每個(gè)樣本xi=(xi1;xi2,...,xin)是一個(gè)n維特征向量,反映了用戶的相關(guān)特征信息;
模糊聚類模塊:用于根據(jù)預(yù)處理得到的樣本集d,利用改進(jìn)的模糊聚類算法將d劃分為k個(gè)不相交的簇{cl|l=1,2,...,k},其中
更新模塊:用于根據(jù)得到的新樣本x和模糊聚類模塊得到的分類模型對(duì)新樣本進(jìn)行分類,并修正分類模型的參數(shù)和更新所有用戶的分類結(jié)果;
發(fā)送模塊:用于發(fā)送用戶群體劃分結(jié)果到數(shù)據(jù)庫(kù),依據(jù)聚類結(jié)果,分類儲(chǔ)存用戶信息。
與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案的有益效果是:本發(fā)明提供一種基于防偽溯源系統(tǒng)的用戶群體劃分方法及系統(tǒng),用戶通過(guò)防偽溯源系統(tǒng)查詢商品真?zhèn)文芙Y(jié)合用戶自身的特征信息,商品的特征信息,查詢信息,對(duì)用戶群體進(jìn)行劃分,使后期商家的營(yíng)銷,廠家的生產(chǎn)更具有針對(duì)性。將防偽溯源系統(tǒng)中得到的信息充分挖掘。提高系統(tǒng)的創(chuàng)造性。本發(fā)明具有以下優(yōu)點(diǎn):
1、利用防偽溯源系統(tǒng)的信息進(jìn)行有效挖掘,對(duì)用戶群體進(jìn)行劃分,使后期商家的營(yíng)銷,廠家的生產(chǎn)更具有針對(duì)性;
2、收集到用戶線上購(gòu)買和線下購(gòu)買的商品信息,與僅挖掘線上購(gòu)物數(shù)據(jù)的劃分方式相比,本創(chuàng)意能更全面地反映用戶的特性;
3、本創(chuàng)意對(duì)收集到客戶的基本信息進(jìn)行數(shù)據(jù)清理,保證其結(jié)構(gòu)的一致性和數(shù)據(jù)的有效性,為后續(xù)信息處理提供便利;
4、本創(chuàng)意使用改進(jìn)的fcm算法對(duì)用戶數(shù)據(jù)集進(jìn)行準(zhǔn)確分類,健壯性比原始fcm算法更高,特別在有噪聲和異常點(diǎn)時(shí),效果更明顯。另外,經(jīng)典fcm算法計(jì)算量大,改進(jìn)的fcm算法計(jì)算量減少,計(jì)算效率更高。
附圖說(shuō)明
圖1為本發(fā)明基于防偽溯源系統(tǒng)的用戶群體劃分方法的流程圖。
圖2為本發(fā)明基于防偽溯源系統(tǒng)的用戶群體劃分系統(tǒng)的示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的說(shuō)明。
實(shí)施例1
如圖1所示,一種基于防偽溯源系統(tǒng)的用戶群體劃分方法,包括以下步驟:
s1:獲取用戶的特征信息,商品的特征信息和查詢的特征信息;
s2:根據(jù)獲取的信息,利用數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)歸約方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,得到的樣本集d,d={x1,x2,…,xm}包含m個(gè)無(wú)標(biāo)記樣本,每個(gè)樣本xi=(xi1;xi2,...,xin)是一個(gè)n維特征向量,反映了用戶的相關(guān)特征信息;
s3:根據(jù)預(yù)處理得到的樣本集,利用改進(jìn)的模糊聚類算法對(duì)用戶群體進(jìn)行劃分并標(biāo)記,同時(shí)得到分類模型;
s4:根據(jù)分類模型對(duì)新用戶進(jìn)行劃分,并修正模型參數(shù)和更新所有用戶的劃分結(jié)果;
s5:發(fā)送用戶群體劃分結(jié)果到數(shù)據(jù)庫(kù),分類儲(chǔ)存信息。
步驟s1中,用戶的特征信息包括id、性別和年齡,商品的特征信息包括種類和價(jià)格,查詢的特征信息包括查詢地理位置、查詢時(shí)間、真?zhèn)吻闆r、查詢次數(shù)。
步驟s2中,具體包括以下步驟:
s2.1:檢查各項(xiàng)信息是否為空,如果為空,則直接刪除;
s2.2:對(duì)輸入價(jià)格的格式進(jìn)行統(tǒng)一,價(jià)格只保留整數(shù)部分,表示貨幣的符號(hào)和小數(shù)點(diǎn)皆刪除;
s2.3:對(duì)自動(dòng)定位的空間位置提取有用信息,包括省、市、區(qū)、街道、門牌號(hào)信息;
s2.4:將數(shù)據(jù)依據(jù)一定的規(guī)則進(jìn)行變換,對(duì)年齡按照預(yù)設(shè)的間隔(1-10,11-20,…,101-110)劃分為(1,2,…,11),對(duì)地理位置依據(jù)城市、農(nóng)村二元?jiǎng)澐譃?0、1)。
步驟s3中,根據(jù)預(yù)處理得到的樣本集d,利用改進(jìn)的模糊聚類算法將d劃分為k個(gè)不相交的簇{cl|l=1,2,...,k},其中
步驟s3中,具體包括以下步驟:
s3.1:設(shè)改進(jìn)的模糊聚類算法目標(biāo)函數(shù)為:
其中,c為聚類的數(shù)目,n為樣本的數(shù)目,
s3.2:當(dāng)目標(biāo)函數(shù)取最小值時(shí),即可得到聚類的最好效果,使用下列迭代方法來(lái)實(shí)現(xiàn):
a、更新隸屬度劃分矩陣:
b、更新聚類中心:
s3.3:循環(huán)步驟s3.2,滿足||vnew-vold||<ε時(shí),即為理想聚類結(jié)果,其中vnew為新的聚類中心,vold為舊的聚類中心,ε為預(yù)設(shè)的閾值。
步驟s4中,將新引入的用戶數(shù)據(jù)加入數(shù)據(jù)集,利用步驟s3的方法,對(duì)原有參數(shù)uik和vi進(jìn)行修正,使分類模型的精確度更高,更新所有用戶聚類結(jié)果。
步驟s5中,將用戶聚類到簇,根據(jù)簇將其相應(yīng)的用戶群體信息分類存儲(chǔ)到數(shù)據(jù)庫(kù),即確定
實(shí)施例2
如圖2所示,一種基于防偽溯源系統(tǒng)的用戶群體劃分系統(tǒng),包括:
信息采集模塊201:用于采集聚類所需信息,用戶的特征信息,商品的特征信息和查詢的特征信息;
信息預(yù)處理模塊202:用于對(duì)信息采集模塊得到的數(shù)據(jù)進(jìn)行預(yù)處理,得到的樣本集d={x1,x2,…,xm}包含m個(gè)無(wú)標(biāo)記樣本,每個(gè)樣本xi=(xi1;xi2,...,xin)是一個(gè)n維特征向量,反映了用戶的相關(guān)特征信息;
模糊聚類模塊203:用于根據(jù)預(yù)處理得到的樣本集d,利用改進(jìn)的模糊聚類算法將d劃分為k個(gè)不相交的簇{cl|l=1,2,...,k},其中
更新模塊204:用于根據(jù)得到的新樣本x和模糊聚類模塊得到的分類模型對(duì)新樣本進(jìn)行分類,并修正分類模型的參數(shù)和更新所有用戶的分類結(jié)果;
發(fā)送模塊205:用于發(fā)送用戶群體劃分結(jié)果到數(shù)據(jù)庫(kù),依據(jù)聚類結(jié)果,分類儲(chǔ)存用戶信息。
本發(fā)明提供一種基于防偽溯源系統(tǒng)的用戶群體劃分方法及系統(tǒng),用戶通過(guò)防偽溯源系統(tǒng)查詢商品真?zhèn)文芙Y(jié)合用戶自身的特征信息,商品的特征信息,查詢信息,對(duì)用戶群體進(jìn)行劃分,使后期商家的營(yíng)銷,廠家的生產(chǎn)更具有針對(duì)性。將防偽溯源系統(tǒng)中得到的信息充分挖掘。提高系統(tǒng)的創(chuàng)造性。本發(fā)明具有以下優(yōu)點(diǎn):
1、利用防偽溯源系統(tǒng)的信息進(jìn)行有效挖掘,對(duì)用戶群體進(jìn)行劃分,使后期商家的營(yíng)銷,廠家的生產(chǎn)更具有針對(duì)性;
2、收集到用戶線上購(gòu)買和線下購(gòu)買的商品信息,與僅挖掘線上購(gòu)物數(shù)據(jù)的劃分方式相比,本創(chuàng)意能更全面地反映用戶的特性;
3、本創(chuàng)意對(duì)收集到客戶的基本信息進(jìn)行數(shù)據(jù)清理,保證其結(jié)構(gòu)的一致性和數(shù)據(jù)的有效性,為后續(xù)信息處理提供便利;
4、本創(chuàng)意使用改進(jìn)的fcm算法對(duì)用戶數(shù)據(jù)集進(jìn)行準(zhǔn)確分類,健壯性比原始fcm算法更高,特別在有噪聲和異常點(diǎn)時(shí),效果更明顯。另外,經(jīng)典fcm算法計(jì)算量大,改進(jìn)的fcm算法計(jì)算量減少,計(jì)算效率更高。
顯然,本發(fā)明的上述實(shí)施例僅僅是為清楚地說(shuō)明本發(fā)明所作的舉例,而并非是對(duì)本發(fā)明的實(shí)施方式的限定。對(duì)于所屬領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在上述說(shuō)明的基礎(chǔ)上還可以做出其它不同形式的變化或變動(dòng)。這里無(wú)需也無(wú)法對(duì)所有的實(shí)施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。