基于用戶標(biāo)簽的用戶屬性挖掘方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及數(shù)據(jù)挖掘的【技術(shù)領(lǐng)域】,提出了一種基于用戶標(biāo)簽的用戶屬性挖掘方法和系統(tǒng)。該方法中首先建立起多維度的用戶標(biāo)簽庫;每天載入互聯(lián)網(wǎng)用戶的訪問日志,根據(jù)用戶標(biāo)簽庫配置加載各維度的標(biāo)簽;形成一個用戶標(biāo)簽對應(yīng)表,整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。有了這個行為標(biāo)簽庫后,可以采用各種用戶屬性的挖掘模型和算法,生成用戶屬性的挖掘結(jié)果。挖掘結(jié)果的輸出可以根據(jù)具體的需要輸入各種屬性,也可以分析一些興趣偏好,購物偏好,心理傾向等信息。本發(fā)明不需要用戶樣本就可以分析挖掘用戶基本屬性,多維度標(biāo)簽庫涵蓋了各個行業(yè),可以對用戶的全方位畫像提供支持用戶屬性具備可擴(kuò)展性,對用戶標(biāo)識更為全面。
【專利說明】基于用戶標(biāo)簽的用戶屬性挖掘方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)挖掘的【技術(shù)領(lǐng)域】,特別涉及一種基于用戶的行為標(biāo)簽來分析挖掘用戶屬性的方法和系統(tǒng)。
【背景技術(shù)】
[0002]在網(wǎng)絡(luò)統(tǒng)計分析中,識別用戶屬性是進(jìn)行精準(zhǔn)內(nèi)容推薦/廣告投放的重要前提。目前,在互聯(lián)網(wǎng)中識別用戶屬性的現(xiàn)有技術(shù)方案都是基于樣本用戶的,需要首先收集用戶樣本,整理樣本用戶的數(shù)據(jù),整理URL樣本庫,對URL進(jìn)行分類整理,比如,某個URL代表“購物”,“時尚”,“服飾”等內(nèi)容;然后再根據(jù)URL樣本庫和互聯(lián)網(wǎng)用戶的URL進(jìn)行匹配,來識別用戶屬性,比如如果一個男性用戶喜歡訪問“軍事”、“理財”內(nèi)容的URL,那么所有訪問“軍事”,“理財”類URL的用戶都是男性的概率較大。即,現(xiàn)有的技術(shù)方案基于樣本數(shù)據(jù),通過機(jī)器學(xué)習(xí),再配以數(shù)據(jù)模型進(jìn)行訓(xùn)練,進(jìn)行互聯(lián)網(wǎng)用戶屬性的判斷。
[0003]但是現(xiàn)有技術(shù)存在以下缺陷:
[0004]用戶標(biāo)簽方面,現(xiàn)有的技術(shù)方案在用戶標(biāo)簽庫的方案都沒有完整提出標(biāo)簽的多維度,均是單從主要行業(yè)維度和購物等細(xì)分維度的分析,都是僅僅簡單的對URL進(jìn)行分類和標(biāo)識,有的會加上一些權(quán)重處理,但不會從多個維度給URL打標(biāo)簽。
[0005]用戶樣本方面,現(xiàn)有的技術(shù)方案都要求有一個已知的用戶樣本,然后通過用戶樣本的行為偏好進(jìn)行機(jī)器學(xué)習(xí),分析未知用戶的用戶屬性。
[0006]用戶屬性分析方面,現(xiàn)有的技術(shù)方案對用戶屬性的分析只能分析樣本用戶屬性中的已知屬性,對未知的屬性無法識別和挖掘。
【發(fā)明內(nèi)容】
[0007](一)本發(fā)明解決的技術(shù)問題:
[0008]本發(fā)明不需要樣本用戶的數(shù)據(jù),直接通過用戶的多維度標(biāo)簽來挖掘用戶的屬性,消除了對數(shù)據(jù)樣本的依賴。并增加了數(shù)據(jù)維度。
[0009]本發(fā)明生成用戶標(biāo)簽數(shù)據(jù)庫既可以分析互聯(lián)網(wǎng)用戶的人口屬性也可以分互聯(lián)網(wǎng)用戶興趣屬性集消費(fèi)層次等。可以為用戶提供一個完整的畫像。
[0010]本發(fā)明中從用戶標(biāo)簽到用戶屬性的分析過程,可以使用多種分析方法,即可以采用簡單的數(shù)據(jù)統(tǒng)計的方法,也可以使用聚類,Svm等模型算法。而且由于用戶標(biāo)簽是多維度的,所以對用戶屬性的分析可以很廣,既包括人口屬性,也包括興趣偏好,購物層次甚至心理傾向等信息都可以通過用戶標(biāo)簽分析。
[0011](二)技術(shù)方案
[0012]為實(shí)現(xiàn)上述目的,本發(fā)明提出了一種基于用戶標(biāo)簽的用戶屬性挖掘方法和系統(tǒng)。首先建立起多維度的用戶標(biāo)簽庫;每天載入互聯(lián)網(wǎng)用戶的訪問日志,根據(jù)用戶標(biāo)簽庫配置加載各維度的標(biāo)簽;形成一個用戶標(biāo)簽對應(yīng)表,整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。有了這個行為標(biāo)簽庫后,可以采用各種用戶屬性的挖掘模型和算法,生成用戶屬性的挖掘結(jié)果。挖掘結(jié)果的輸出可以根據(jù)具體的需要輸入各種屬性,比如性別、年齡、收入、家庭狀況、婚姻狀況、學(xué)歷,職業(yè)等。也可以分析一些興趣偏好,購物偏好,心理傾向等信息。最后還要對挖掘的用戶的屬性進(jìn)行存儲和展示,為下一環(huán)節(jié)的調(diào)用提供服務(wù)。
[0013]本發(fā)明通過建立多維度用戶標(biāo)簽庫,從多個方面描述用戶的行為,再通過用戶行為標(biāo)簽分析用戶的屬性,可以采取聚類,svm等模型算法進(jìn)行分析挖掘,使得用戶屬性的挖掘更加準(zhǔn)確完善。
[0014]具體地,一方面,本發(fā)明提供一種基于用戶標(biāo)簽的用戶屬性挖掘方法,其特征在于,所述方法包括步驟:用戶標(biāo)簽庫建立階段和用戶屬性分析挖掘階段,
[0015](I)用戶標(biāo)簽庫建立階段,建立多維度的用戶標(biāo)簽庫,基于該用戶標(biāo)簽庫,結(jié)合互聯(lián)網(wǎng)的用戶訪問日志,形成用戶行為標(biāo)簽庫;
[0016](2)用戶屬性分析挖掘階段,根據(jù)行為標(biāo)簽庫采用用戶屬性的挖掘模型,生成用戶屬性的挖掘結(jié)果;
[0017]步驟(I)和步驟(2)可重復(fù)進(jìn)行。
[0018]優(yōu)選地,步驟(I)中建立多維度用戶標(biāo)簽庫具體為:通過程序采集、人工整理的方式生成多維度的用戶標(biāo)簽庫。
[0019]優(yōu)選地,步驟(I)中形成用戶行為標(biāo)簽庫具體為:加載標(biāo)簽庫后,形成一個用戶〈_>標(biāo)簽的對應(yīng)表,一個用戶可生成多個維度的標(biāo)簽,每個維度內(nèi)包含細(xì)分的標(biāo)簽,形成用戶標(biāo)簽對應(yīng)表后,根據(jù)需要整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。
[0020]優(yōu)選地,步驟(I)每天定時啟動或由特定事件觸發(fā)啟動。
[0021]優(yōu)選地,方法進(jìn)一步包括存儲并輸出挖掘結(jié)果、根據(jù)具體的需要輸出各種用戶屬性、分析興趣偏好,購物偏好,心理傾向。
[0022]另一方面,本發(fā)明提供一種基于用戶標(biāo)簽的用戶屬性挖掘系統(tǒng),其特征在于,所述系統(tǒng)包括模塊:用戶標(biāo)簽庫建立模塊和用戶屬性分析挖掘模塊,
[0023](I)用戶標(biāo)簽庫建立模塊,建立多維度的用戶標(biāo)簽庫,基于該用戶標(biāo)簽庫,結(jié)合互聯(lián)網(wǎng)的用戶訪問日志,形成用戶行為標(biāo)簽庫;
[0024](2)用戶屬性分析挖掘模塊,根據(jù)行為標(biāo)簽庫采用用戶屬性的挖掘模型,生成用戶屬性的挖掘結(jié)果;
[0025]用戶標(biāo)簽庫建立模塊和用戶屬性分析挖掘模塊可重復(fù)執(zhí)行。
[0026]優(yōu)選地,用戶標(biāo)簽庫建立模塊中建立多維度用戶標(biāo)簽庫具體為:通過程序采集、人工整理的方式生成多維度的用戶標(biāo)簽庫。
[0027]優(yōu)選地,用戶標(biāo)簽庫建立模塊中形成用戶行為標(biāo)簽庫具體為:加載標(biāo)簽庫后,形成一個用戶〈_>標(biāo)簽的對應(yīng)表,一個用戶可生成多個維度的標(biāo)簽,每個維度內(nèi)包含細(xì)分的標(biāo)簽,形成用戶標(biāo)簽對應(yīng)表后,根據(jù)需要整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。
[0028]優(yōu)選地,用戶標(biāo)簽庫建立模塊每天定時啟動或由特定事件觸發(fā)啟動。
[0029]優(yōu)選地,系統(tǒng)進(jìn)一步包括結(jié)果顯示模塊,用于存儲并輸出挖掘結(jié)果、根據(jù)具體的需要輸出各種用戶屬性、分析興趣偏好,購物偏好,心理傾向。
[0030](三)技術(shù)效果
[0031]本發(fā)明不需要用戶樣本就可以分析挖掘用戶基本屬性,識別用戶屬性的應(yīng)用范圍大大擴(kuò)大,可以分析整個互聯(lián)網(wǎng)用戶的基本屬性。[0032]本發(fā)明的多維度標(biāo)簽庫涵蓋了各個行業(yè),可以很有針對性的分析用戶的屬性,也可以分析用戶的偏好,能對用戶的全方位畫像提供支持。
[0033]本發(fā)明輸出的用戶屬性具備可擴(kuò)展性,不依賴任何樣本,既可以分析人口屬性,也可以分析情感心理屬性,對用戶標(biāo)識更為全面。
【專利附圖】
【附圖說明】
[0034]圖1是本發(fā)明中基于用戶標(biāo)簽的用戶屬性挖掘方法流程示意圖;
[0035]圖2是本發(fā)明中本發(fā)明中基于用戶標(biāo)簽的用戶屬性挖掘的方法的數(shù)據(jù)處理流程圖;
[0036]圖3是本發(fā)明中基于用戶標(biāo)簽的用戶屬性挖掘系統(tǒng)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0037]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0038]本發(fā)明是一種基于用戶標(biāo)簽的用戶屬性挖掘方法和系統(tǒng)。通過用戶網(wǎng)絡(luò)行為建模,為用戶打上各個維度的行為標(biāo)簽,然后再在行為標(biāo)簽的基礎(chǔ)上挖掘用戶屬性的方法,多維度的標(biāo)簽基于網(wǎng)絡(luò)訪問信息行程的專家?guī)?,可以從多個維度分析挖掘用戶屬性,和以往的基于已知樣本的用戶挖掘相比,具有準(zhǔn)確,高效的優(yōu)點(diǎn),并克服了樣本數(shù)量不足的缺陷。
[0039]圖1是本發(fā)明中基于用戶標(biāo)簽的用戶屬性挖掘的方法流程示意圖。在本發(fā)明公開的方法分為兩個階段:用戶標(biāo)簽庫建立階段和用戶屬性分析挖掘階段。用戶標(biāo)簽庫建立階段是用戶屬性分析挖掘階段的基礎(chǔ),但兩者并不具有絕對的先后順序,可以同步進(jìn)行,可以先后進(jìn)行,也可以交叉順序進(jìn)行,在用戶屬性分析挖掘階段之后,還可以進(jìn)一步完善用戶標(biāo)簽庫,隨著用戶標(biāo)簽庫的不斷完善,對用戶屬性進(jìn)行挖掘分析的也越全面準(zhǔn)確。為了豐富完善用戶標(biāo)簽庫,可以每天定時或由特定事件觸發(fā)啟動執(zhí)行用戶標(biāo)簽庫的建立階段。
[0040]圖2是本發(fā)明中基于用戶標(biāo)簽的用戶屬性挖掘的方法的數(shù)據(jù)處理流程圖。
[0041]首先是用戶標(biāo)簽庫建立階段,該階段主要過程如下所述:
[0042]S1:生成多維度的用戶標(biāo)簽庫。首先通過程序采集、人工整理的方式生成多維度的用戶標(biāo)簽庫,用戶標(biāo)簽包括興趣標(biāo)簽、品類標(biāo)簽、行業(yè)標(biāo)簽、電商標(biāo)簽、移動終端標(biāo)簽等各個維度的用戶標(biāo)簽。通過建立多維度用戶標(biāo)簽庫,從多個方面描述用戶的行為。
[0043]S2:獲取互聯(lián)網(wǎng)用戶的訪問日志。為了提高標(biāo)簽的準(zhǔn)確性,降低用戶屬性的誤判率,載入訪問日志后,對訪問日志做基本地整理,如過濾和清洗。
[0044]S3:加載多維度標(biāo)簽庫。根據(jù)配置加載各維度的用戶標(biāo)簽庫,用戶標(biāo)簽庫有多個,分別對應(yīng)相應(yīng)維度,包括但不限制于興趣、品類、行業(yè)、購物標(biāo)簽庫等。
[0045]S4:形成用戶標(biāo)簽對應(yīng)表。加載標(biāo)簽庫后,形成一個用戶〈_>標(biāo)簽的對應(yīng)表。由于標(biāo)簽是多維度的,所以一個用戶可能生成很多維度的標(biāo)簽,每個維度內(nèi)也有很多細(xì)分的標(biāo)簽,比如購物標(biāo)簽包括購物網(wǎng)站標(biāo)簽、購物類別標(biāo)簽、購物轉(zhuǎn)化標(biāo)簽、熱銷商品標(biāo)簽、消費(fèi)層次標(biāo)簽等等。[0046]S5:形成用戶行為標(biāo)簽庫。形成用戶標(biāo)簽對應(yīng)表后,還要根據(jù)需要整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。
[0047]本發(fā)明中的標(biāo)簽庫,僅列舉了興趣、品類、行業(yè)、購物等標(biāo)簽庫,實(shí)際上標(biāo)簽庫可以有很多個維度。比如上網(wǎng)習(xí)慣標(biāo)簽、終端標(biāo)簽、情感標(biāo)簽等。只要能從URL或者網(wǎng)絡(luò)內(nèi)容上能分析出來的標(biāo)簽都是可以作為一個維度加入到這個系統(tǒng)中的。其中行業(yè)標(biāo)簽是一個很大的類別,所有的行業(yè)都可以包括在其中,大到農(nóng)林牧漁等各大產(chǎn)業(yè),也可以是金融、信息、旅游等垂直行業(yè),金融行業(yè)內(nèi)也可以包括財經(jīng)、投資、股票、期貨等細(xì)分領(lǐng)域。標(biāo)簽可以分機(jī)呈現(xiàn),每一個細(xì)分維度的標(biāo)簽都可以打在一個用戶上,并可以查詢到標(biāo)簽的所屬關(guān)系。是一個多維立體的標(biāo)簽數(shù)據(jù)庫。
[0048]用戶標(biāo)簽庫建立階段后進(jìn)入用戶屬性分析挖掘階段。
[0049]通過用戶標(biāo)簽庫建立階段建立起用戶行為標(biāo)簽庫后,可以采用各種用戶屬性的挖掘模型和算法,包括svm、貝葉斯、聚類等各種算法模型,最后生成用戶屬性的挖掘結(jié)果。挖掘結(jié)果的輸出可以根據(jù)具體的需要輸入各種屬性,比如性別、年齡、收入、家庭狀況、婚姻狀況、學(xué)歷,職業(yè)等。也可以分析一些興趣偏好,購物偏好,心理傾向等信息。最后還要對挖掘的用戶的屬性進(jìn)行存儲和展示,為下一環(huán)節(jié)的調(diào)用提供服務(wù)。
[0050]圖3是本發(fā)明中基于用戶標(biāo)簽的用戶屬性挖掘系統(tǒng)結(jié)構(gòu)示意圖
[0051]基于用戶標(biāo)簽的用戶屬性挖掘系統(tǒng)主要包括兩大模塊:用戶標(biāo)簽庫建立模塊和用戶屬性分析挖掘模塊,分別對應(yīng)基于用戶標(biāo)簽的用戶屬性挖掘方法的兩大階段。
[0052](I)用戶標(biāo)簽庫建立模塊,建立多維度的用戶標(biāo)簽庫,基于該用戶標(biāo)簽庫,結(jié)合互聯(lián)網(wǎng)的用戶訪問日志,形成用戶行為標(biāo)簽庫;
[0053](2)用戶屬性分析挖掘模塊,根據(jù)行為標(biāo)簽庫采用用戶屬性的挖掘模型,生成用戶屬性的挖掘結(jié)果;
[0054]用戶標(biāo)簽庫建立模塊和用戶屬性分析挖掘模塊可重復(fù)執(zhí)行。
[0055]下面通過一個具體的實(shí)施例對本發(fā)明的方法作進(jìn)一步的說明。
[0056]基于用戶標(biāo)簽的用戶屬性挖掘在精準(zhǔn)內(nèi)容推薦用戶選擇媒體時做媒體用戶洞察的應(yīng)用。
[0057]如果一個內(nèi)容推薦用戶希望在互聯(lián)網(wǎng)上將自己一項內(nèi)容推薦給他人,他需要將該內(nèi)容或該內(nèi)容的摘要或鏈接顯示在他人會瀏覽的網(wǎng)站/媒體資源中。那么首選要做的就是該網(wǎng)站/媒體的用戶洞察,內(nèi)容推薦用戶需要知道選擇的網(wǎng)站/媒體的用戶屬性是否和內(nèi)容推薦的目標(biāo)網(wǎng)站/媒體相匹配。匹配程度越大,推薦被接收的效果就越好。而作為一個網(wǎng)站/媒體,一般情況下網(wǎng)站/媒體本身并不清楚自己的用戶到底有多少是男性、多少是女性,多少用戶是年輕人,多少用戶是老人。很多的網(wǎng)站/媒體的訪問并不需要提前注冊,這樣就無法獲得樣本。那么傳統(tǒng)的基于用戶樣本的用戶屬性分析的方法就不適用了。
[0058]采用本發(fā)明的基于用戶標(biāo)簽的用戶屬性挖掘的方法,不需要實(shí)現(xiàn)提供用戶樣本。
[0059]具體來說,比如一個內(nèi)容推薦用戶推薦一項內(nèi)容,這項內(nèi)容只適合年輕的中低收入的女性用戶。這時如果這個內(nèi)容推薦用戶在一個奢侈品網(wǎng)站中進(jìn)行內(nèi)容推薦,那么從表面上看,該內(nèi)容推薦被接受的可能性會比較低。但是如果瀏覽這個奢侈品網(wǎng)站的用戶中大多數(shù)為年輕的中低收入的女性時,該內(nèi)容推薦被接受的可能性又會大大增高。此時,就需要對該網(wǎng)站的用戶屬性作詳細(xì)的統(tǒng)計分析。[0060]首先,獲取該奢侈品網(wǎng)站上的用戶訪問日志,應(yīng)用多維標(biāo)簽庫,根據(jù)訪問日志的記載,形成用戶〈_>標(biāo)簽對應(yīng)表,整理對應(yīng)表,形成用戶的行為標(biāo)簽庫。
[0061]然后使用svm方法基于行為標(biāo)簽庫對這個奢侈品網(wǎng)站的用戶的性別、年齡、收入三個基本屬性做分析挖掘。挖掘結(jié)果顯示這個奢侈品網(wǎng)站的用戶有70%都是中低收入人群,并且有75%是女性訪問者。年齡比例上60%人在25-35這個年齡段。那么從數(shù)據(jù)分析的結(jié)果看這個網(wǎng)站的瀏覽人群大多數(shù)為中低收入的年輕女性用戶,比較適合這款推薦的內(nèi)容。
[0062]經(jīng)過行業(yè)標(biāo)簽進(jìn)一步分析,發(fā)現(xiàn)上這個網(wǎng)站的用戶瀏覽商品的比例很大,而實(shí)際轉(zhuǎn)化率幾乎為O。這就可以解釋為什么這個網(wǎng)站上都是中低收入的年輕女性偏多了。這種分析方法可以很好的幫助內(nèi)容推薦用戶找到價值高的網(wǎng)站/媒體。
[0063]雖然以上結(jié)合優(yōu)選實(shí)施例對本發(fā)明進(jìn)行了描述,但本領(lǐng)域的技術(shù)人員應(yīng)該理解,本發(fā)明所述的方法和系統(tǒng)并不限于【具體實(shí)施方式】中所述的實(shí)施例,在不背離由所附權(quán)利要求書限定的本發(fā)明精神和范圍的情況下,可對本發(fā)明作出各種修改、增加、以及替換。
【權(quán)利要求】
1.一種基于用戶標(biāo)簽的用戶屬性挖掘方法,其特征在于,所述方法包括步驟:用戶標(biāo)簽庫建立階段和用戶屬性分析挖掘階段, (1)用戶標(biāo)簽庫建立階段,建立多維度的用戶標(biāo)簽庫,基于該用戶標(biāo)簽庫,結(jié)合互聯(lián)網(wǎng)的用戶訪問日志,形成用戶行為標(biāo)簽庫; (2)用戶屬性分析挖掘階段,根據(jù)行為標(biāo)簽庫采用用戶屬性的挖掘模型,生成用戶屬性的挖掘結(jié)果; 步驟(I)和步驟(2 )可重復(fù)進(jìn)行。
2.如權(quán)利要求1所述的方法,其特征在于:步驟(I)中建立多維度用戶標(biāo)簽庫具體為:通過程序采集、人工整理的方式生成多維度的用戶標(biāo)簽庫。
3.如權(quán)利要求1所述的方法,其特征在于:步驟(I)中形成用戶行為標(biāo)簽庫具體為:力口載標(biāo)簽庫后,形成一個用戶〈_>標(biāo)簽的對應(yīng)表,一個用戶可生成多個維度的標(biāo)簽,每個維度內(nèi)包含細(xì)分的標(biāo)簽,形成用戶標(biāo)簽對應(yīng)表后,根據(jù)需要整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。
4.如權(quán)利要求1所述的方法,其特征在于:步驟(I)每天定時啟動或由特定事件觸發(fā)啟動。
5.如權(quán)利要求1所述的方法,其特征在于:方法進(jìn)一步包括存儲并輸出挖掘結(jié)果、根據(jù)具體的需要輸出各種用戶屬性、分析興趣偏好,購物偏好,心理傾向。
6.一種基于用戶標(biāo)簽的用戶屬性挖掘系統(tǒng),其特征在于,所述系統(tǒng)包括模塊:用戶標(biāo)簽庫建立模塊和用戶屬性分析挖掘模塊, (1)用戶標(biāo)簽庫建立模塊,建立多維度的用戶標(biāo)簽庫,基于該用戶標(biāo)簽庫,結(jié)合互聯(lián)網(wǎng)的用戶訪問日志,形成用戶行為標(biāo)簽庫; (2)用戶屬性分析挖掘模塊,根據(jù)行為標(biāo)簽庫采用用戶屬性的挖掘模型,生成用戶屬性的挖掘結(jié)果; 用戶標(biāo)簽庫建立模塊和用戶屬性分析挖掘模塊可重復(fù)執(zhí)行。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于:用戶標(biāo)簽庫建立模塊中建立多維度用戶標(biāo)簽庫具體為:通過程序采集、人工整理的方式生成多維度的用戶標(biāo)簽庫。
8.如權(quán)利要求6所述的系統(tǒng),其特征在于:用戶標(biāo)簽庫建立模塊中形成用戶行為標(biāo)簽庫具體為:加載標(biāo)簽庫后,形成一個用戶〈_>標(biāo)簽的對應(yīng)表,一個用戶可生成多個維度的標(biāo)簽,每個維度內(nèi)包含細(xì)分的標(biāo)簽,形成用戶標(biāo)簽對應(yīng)表后,根據(jù)需要整理成統(tǒng)一格式的互聯(lián)網(wǎng)用戶行為標(biāo)簽庫。
9.如權(quán)利要求6所述的系統(tǒng),其特征在于:用戶標(biāo)簽庫建立模塊每天定時啟動或由特定事件觸發(fā)啟動。
10.如權(quán)利要求6所述的系統(tǒng),其特征在于:系統(tǒng)進(jìn)一步包括結(jié)果顯示模塊,用于存儲并輸出挖掘結(jié)果、根據(jù)具體的需要輸出各種用戶屬性、分析興趣偏好,購物偏好,心理傾向。
【文檔編號】G06Q30/02GK103778555SQ201410025975
【公開日】2014年5月7日 申請日期:2014年1月21日 優(yōu)先權(quán)日:2014年1月21日
【發(fā)明者】崔晶晶, 林佳婕, 劉立娜, 單曉龍 申請人:北京集奧聚合科技有限公司