两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用戶選取方法和裝置與流程

文檔序號:12748743閱讀:295來源:國知局
用戶選取方法和裝置與流程

本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別是涉及一種用戶選取方法和裝置。



背景技術(shù):

隨著大數(shù)據(jù)應(yīng)用的發(fā)展,即時通信和社交應(yīng)用平臺中存儲了大量的用戶信息,比如用戶的喜好、年齡、職業(yè)和需求等等,而這些用戶信息對于是否可進行信息的推送,比如商品廣告等信息的推送,有著重要的參考價值。

傳統(tǒng)的技術(shù)方案中,通常都是對所獲取的海量用戶進行簡單的篩選,比如篩選出瀏覽過與服務(wù)商準備推送的信息相同或相似的用戶,作為目標用戶,并向其投放相關(guān)服務(wù)商的推送信息。而現(xiàn)實中,由于每個用戶都是一個獨立的存在,具有多樣化的特性,僅通過這種簡單的篩選所確定的用于投放信息的目標用戶不夠精準。



技術(shù)實現(xiàn)要素:

基于此,有必要針對上述技術(shù)問題,提供一種能夠提高目標用戶選取的精準度的用戶選取方法和裝置。

一種用戶選取方法,所述方法包括:

獲取每個種子用戶的特征標簽向量;

根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心;

獲取所述每個類別的信息對應(yīng)的特征權(quán)值向量;

獲取潛在用戶群中的每個潛在用戶的特征標簽向量;

根據(jù)所述潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離;

從所述第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶。

一種用戶選取裝置,所述裝置包括:

特征標簽向量獲取模塊,用于獲取每個種子用戶的特征標簽向量;

聚類中心計算模塊,用于根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心;

特征權(quán)值向量獲取模塊,用于獲取所述每個類別的信息對應(yīng)的特征權(quán)值向量;

所述特征標簽向量獲取模塊還用于獲取潛在用戶群中的每個潛在用戶的特征標簽向量;

第一距離計算模塊,用于根據(jù)所述潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離;

目標用戶選取模塊,用于從所述第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶。

上述用戶選取方法和裝置,根據(jù)所獲取的每個種子用戶的特征向量以及預(yù)設(shè)的第一數(shù)量的信息類別,計算出每個類別的信息對應(yīng)的聚類中心,然后根據(jù)潛在用戶的特征標簽向量、特征權(quán)值向量以及所計算出的聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離;再從所計算出的所有潛在用戶的第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為可向該目標用戶發(fā)送相應(yīng)的推送信息的目標用戶。由于該第一距離可反映出對應(yīng)潛在用戶與相應(yīng)類別信息的匹配程度,且距離越小,則說明越適合向該用戶發(fā)送相應(yīng)類別的信息,從而使得所選取出的目標用戶更加精準。

附圖說明

圖1為一個實施例中用戶選取方法的應(yīng)用環(huán)境圖;

圖2為一個實施例中用于實現(xiàn)用戶選取方法的服務(wù)器的內(nèi)部結(jié)構(gòu)圖;

圖3為一個實施例中用戶選取方法的流程示意圖;

圖4為一個實施例中聚類的示意圖;

圖5為一個實施例中根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心的步驟的流程示意圖;

圖6為一個實施例中獲取每個類別的信息對應(yīng)的特征權(quán)值向量的步驟的流程示意圖;

圖7為一個實施例中根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心和特征權(quán)值向量的步驟的流程示意圖;

圖8為一個實施例中根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心和特征權(quán)值向量的步驟的流程示意圖;

圖9為一個實施例中用戶選取裝置的結(jié)構(gòu)框圖;

圖10為另一個實施例中用戶選取裝置的結(jié)構(gòu)框圖;

圖11為又一個實施例中用戶選取裝置的結(jié)構(gòu)框圖;

圖12為一個實施例中聚類中心計算模塊的結(jié)構(gòu)框圖;

圖13為一個實施例中特征權(quán)值向量獲取模塊的結(jié)構(gòu)框圖;

圖14為再一個實施例中用戶選取裝置的結(jié)構(gòu)框圖。

具體實施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

本發(fā)明實施例所提供的用戶選取方法可應(yīng)用于如圖1所示的應(yīng)用場景中。參考圖1所示,客戶終端110可通過預(yù)先設(shè)置的網(wǎng)絡(luò)與服務(wù)器120進行交互??蛻艚K端110為需要向用戶發(fā)送推送信息的服務(wù)商的終端,包括但不限于具有通信功能的智能手機、平板電腦、掌上電腦等設(shè)備。服務(wù)器120為存儲有大量的用戶信息的社交、即時通信或購物等平臺的服務(wù)器,該大量的用戶即構(gòu)成一個潛在用戶群。服務(wù)器120中的每個潛在用戶均具有多個特征信息,根據(jù)該多個特征信息可構(gòu)成特征標簽向量,通過該特征標簽向量可反映用戶的特征。客戶終端110可向服務(wù)器120發(fā)送用于選取合適的用戶的選取請求,以便于向所選取的用戶發(fā)送相關(guān)的推送信息。服務(wù)器120可根據(jù)該請求來獲取每個種子用戶的特征標簽向量,種子用戶一般為購買過或收藏過服務(wù)商的相關(guān)產(chǎn)品的用戶;根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心。其中,第一數(shù)量與該服務(wù)商準備推薦的信息所包含的種類數(shù)量相匹配,每種類別的信息均對應(yīng)具有一個聚類中心。服務(wù)器120中還設(shè)有與特征標簽向量對應(yīng)的特征權(quán)值向量,根據(jù)潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離;然后從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶,從而實現(xiàn)了對用戶的選取。

在一個實施例中,圖1中的服務(wù)器120的內(nèi)部結(jié)構(gòu)如圖2所示,該服務(wù)器包括通過系統(tǒng)總線連接的處理器、存儲介質(zhì)、內(nèi)存和網(wǎng)絡(luò)接口。其中,該服務(wù)器的存儲介質(zhì)存儲有操作系統(tǒng)、數(shù)據(jù)庫和一種用戶選取裝置。數(shù)據(jù)庫用于存儲數(shù)據(jù),如存儲每個潛在用戶的特征標簽向量、每個類別的信息的聚類中心以及特征權(quán)值向量等。該操作系統(tǒng)用于實現(xiàn)一種用戶選取方法。該服務(wù)器的處理器用于提供計算和控制能力,支撐整個接入服務(wù)器的運行。該服務(wù)器的內(nèi)存為存儲介質(zhì)中的用戶選取系統(tǒng)的運行提供環(huán)境。該服務(wù)器的網(wǎng)絡(luò)接口用于與外部的終端或服務(wù)器通過網(wǎng)絡(luò)連接通信,比如接收終端110發(fā)送的選取請求或向所選取的用戶對應(yīng)的終端發(fā)送推送信息等。

在一個實施例中,如圖3所示,提供了一種用戶選取方法,該方法可應(yīng)用于如圖1所示的服務(wù)器中,具體包括以下步驟:

步驟302,獲取每個種子用戶的特征標簽向量。

本實施例中,服務(wù)器可預(yù)先接收服務(wù)商的客戶終端所發(fā)送的用戶選取請求,該用戶選取請求中包含服務(wù)商所需推送信息的具體分類、以及一定數(shù)量的種子用戶的特征信息,并根據(jù)服務(wù)商所提供的種子用戶的特征信息構(gòu)建對應(yīng)的特征標簽向量。其中,該推送信息可為任意信息,對推送信息所分的類別的數(shù)量即為第一數(shù)量。以推送信息為服裝信息為例,當(dāng)該具體分類被分為男士服裝、女士服裝和兒童服裝三類時,則相應(yīng)的第一數(shù)量即為3。以推送信息為體育用品為例,當(dāng)該具體分類被分為籃球、足球、排球和網(wǎng)球四類時,則相應(yīng)的第一數(shù)量即為4。

種子用戶為服務(wù)器所提供的樣本用戶,種子用戶一般為購買過或收藏過服務(wù)商的相關(guān)產(chǎn)品的用戶,種子用戶的數(shù)量可為10000、50000等任意數(shù)量,所有數(shù)量的種子用戶則構(gòu)成一個種子用戶群。特征信息可包括用戶的年齡、性別、職業(yè)、收入、學(xué)歷、所在城市以及購物習(xí)慣等其中的一種或多種。服務(wù)器可按照預(yù)設(shè)量化規(guī)則對每個種子用戶的特征信息進行相應(yīng)的量化,根據(jù)預(yù)設(shè)的所需類型的特征標簽構(gòu)建對應(yīng)種子用戶的特征標簽向量。特征標簽向量是具有一定長度的維度,其每個維度上的參數(shù)均對應(yīng)表征種子用戶的一種特征信息,即該特征標簽向量由所選取種子用戶的多個特征信息構(gòu)成。

設(shè)所選取的特征信息的種類為n,對于第i個種子用戶的特征標簽向量,其表示方式可為(yi1,yi2,...yin),其中,參數(shù)yim用于表征第i個種子用戶的第m個特征信息,舉例來說,所選取的特征信息的種類分別包括年齡、性別、職業(yè)、收入、學(xué)歷、所在城市這6種,則n為6。依次按照該種類順序構(gòu)建相應(yīng)的特征標簽向量,則yi1至yi6分別表征第i個種子用戶的年齡、性別、職業(yè)、收入、學(xué)歷、所在城市這些具體的特征信息。

步驟304,根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心。

本實施例中,服務(wù)器可根據(jù)所分類的具體的信息類別,將每個種子用戶也進行相應(yīng)的分類,使得對種子用戶的分類與信息類別的分類相對應(yīng),從而可形成第一數(shù)量的聚類,每個聚類分別與信息的種類一一對應(yīng)。特征標簽向量反映在空間坐標系中則為一個具體的點,被劃分為相同類別的種子用戶的特征標簽向量則處于同一聚類中,服務(wù)器可根據(jù)由所有種子用戶的特征標簽向量所形成的第一數(shù)量的聚類,計算出每個聚類的中心點,將該中心點作為該類別的信息的聚類中心。其中,每個聚類分別與信息的種類一一對應(yīng)。具體的,可根據(jù)預(yù)設(shè)的聚類算法計算出每個類別的信息對應(yīng)的聚類中心,該聚類算法可為K-means、K-medoids或Clara等任意一種聚類算法。

所計算出的聚類中心是用于表征某一類別的信息對應(yīng)的種子用戶所共有的特征信息,聚類中心的形式與特征標簽向量相同,具有與特征標簽向量相同長度的維度,其每個維度上的參數(shù)均對應(yīng)表征種子用戶所共有的一種特征信息。反映在空間坐標系中則為一個具體的點。對于第k類的信息的n維聚類中心,其表示方式可為(xk1,xk2,...xkn),其中,參數(shù)xkm用于表征第k類的信息對應(yīng)的種子用戶所共有的第m個特征信息。

如圖4所示,為一個實施例中對特征標簽向量進行聚類的示意圖。圖中的每一個點表示對應(yīng)一個種子用戶的特征標簽向量,處于同一圓圈中的點構(gòu)成了一個聚類,通過該圓圈中的所有點,可計算出對應(yīng)的中心點,該中心點即為相應(yīng)類別信息的聚類中心。

舉例來說,推送信息為服裝信息,該信息分類被分為男士服裝信息、女士服裝信息和兒童服裝信息三類時,服務(wù)器可按照預(yù)設(shè)的聚類算法將形成的如圖4中上方、左下方、右下方的聚類分別與男士服裝信息、女士服裝信息和兒童服裝信息對應(yīng)。所計算出的三個聚類中心分別為與男士服裝信息、女士服裝信息和兒童服裝信息對應(yīng)的聚類中心。

步驟306,獲取每個類別的信息對應(yīng)的特征權(quán)值向量。

本實施例中,服務(wù)器還根據(jù)所需推送信息的具體分類設(shè)置了對應(yīng)第一數(shù)量的特征權(quán)值向量,每個特征權(quán)值向量與相應(yīng)的類別的信息一一對應(yīng)。其中,不同類別的信息的聚類中心對應(yīng)的特征權(quán)值向量可相同或者不同。同樣的,特征權(quán)值向量的維數(shù)與特征標簽向量的維數(shù)相同。特征權(quán)值向量的每個參數(shù)為特征標簽向量中對應(yīng)特征標簽向量的參數(shù)的權(quán)值。其表示方式可為(wk1,wk2,...wkn),其中,wki用于反映對應(yīng)于第k類信息的特征標簽向量第i個參數(shù)yi所占的權(quán)重。特征標簽向量中不同參數(shù)對應(yīng)的權(quán)值可相同或不同,對于與待推送的類型的信息關(guān)聯(lián)度較大的特征信息,可對應(yīng)設(shè)置較大的權(quán)值。舉例來說,當(dāng)信息類別為男士服裝信息、女士服裝信息和兒童服裝信息三類,且特征向量標簽中表示年齡、性別和職業(yè)等參數(shù),可分別將與男士服裝信息、女士服裝信息對應(yīng)的特征權(quán)值向量中反映性別的參數(shù)設(shè)置一個相對較大的權(quán)值,而將與兒童服裝信息對應(yīng)的特征權(quán)值向量中反映性別的參數(shù)設(shè)置一個相對較小的權(quán)值。

步驟306,獲取潛在用戶群中的每個潛在用戶的特征標簽向量。

本實施例中,服務(wù)器中存儲有大量的用戶,該用戶即為可被適用于推送信息的潛在用戶,服務(wù)器中所存儲的用戶即構(gòu)成相應(yīng)的潛在用戶群。同樣的,潛在用戶也同樣具有包括年齡、性別、職業(yè)、收入、學(xué)歷、所在城市以及購物習(xí)慣等其中的一種或多種的特征信息。服務(wù)器可按照種子用戶的特征標簽向量的構(gòu)建方式,構(gòu)建潛在用戶的特征標簽向量,潛在用戶的特征標簽向量與種子用戶的特征標簽向量以及聚類中心的形式均相同,且三者中的參數(shù)所表示的含義也相同。

在一個實施例中,上述的步驟302~304、306以及308之間的執(zhí)行順序可不做限定,即對于聚類中心的計算、特征權(quán)值向量以及潛在用戶的特征標簽向量的獲取的順序不做限定。

步驟310,根據(jù)潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離。

本實施例中,服務(wù)器可對潛在用戶群中的潛在用戶,計算其與每個聚類中心的距離??蓪⒛骋痪唧w的潛在用戶的特征標簽向量中的每個參數(shù),其與一個類別信息的聚類中心中的對應(yīng)參數(shù)相減,得到差值,然后將該差值進行平方運算,將該平方值與該類別信息所對應(yīng)的特征權(quán)值向量中對應(yīng)的參數(shù)相乘,得到相應(yīng)的乘積。再對每個參數(shù)的乘積進行求和,所得到的數(shù)值即為相應(yīng)類別的聚類中心的第一距離。

具體的,可通過公式來計算第一距離。其中,dkj表示第j個潛在用戶與第k類信息對應(yīng)的聚類中心的第一距離,n表示特征標簽向量、特征權(quán)值向量以及聚類中心的維度,wkj表示第k類信息對應(yīng)的n維特征權(quán)值向量中的第j個參數(shù),zij表示第i可潛在用戶的n維特征標簽向量中第j個參數(shù),ykj表示第k類信息的n維聚類中心的第j個參數(shù)。通過上述的計算公式,分別可計算出每個潛在用戶和每個類別的聚類中心的第一距離。

步驟312,從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶。

本實施例中,第一距離的大小可反映出是否適合向該潛在用戶發(fā)送對應(yīng)類別信息的匹配程度。即若所計算出的距離越小,則說明該潛在用戶與對應(yīng)類別信息的聚類中心越接近,則與對應(yīng)類別信息的匹配程度越高,從而也就越適合向該用戶發(fā)送相應(yīng)類別的信息。

繼續(xù)以信息分類為男士服裝信息、女士服裝信息和兒童服裝信息三類為例來說明,則可分別計算出每個用戶的特征標簽向量分別與男士服裝信息的聚類中心的第一距離、與女士服裝信息的聚類中心的第一距離、與兒童服裝信息的聚類中心的第一距離。針對一個具體的潛在用戶,若這三個第一距離中,與女士服裝信息的聚類中心的第一距離的數(shù)值最小,則判斷該用戶在此三類的信息中,最適合向其推送女士服裝信息。針對處于潛在用戶群中的所有潛在用戶,可對每一類的第一距離進行大小排名,從其中選取預(yù)設(shè)數(shù)量的在對應(yīng)類型中的第一距離最小的潛在用戶,作為用于推送與該類型相匹配的推送信息。

在一個實施例中,第二數(shù)量可為預(yù)先設(shè)置的數(shù)量,即預(yù)先設(shè)置了要獲取的目標用戶的數(shù)量。服務(wù)器可對所計算出所有第一距離進行排名,根據(jù)該排名選取出對應(yīng)數(shù)量的最小的第一距離,將其對應(yīng)的用戶作為目標用戶,從而可向該目標用戶發(fā)送相應(yīng)的推送信息。

在另一個實施例中,服務(wù)器中還可不設(shè)置第二數(shù)量,轉(zhuǎn)而設(shè)置距離閾值,將小于距離閾值的第一距離對應(yīng)的潛在用戶設(shè)置為目標用戶。統(tǒng)計所設(shè)置的目標用戶的數(shù)量,該數(shù)量即作為第二數(shù)量。

本實施例所提供的用戶選取方法,通過根據(jù)所獲取的每個種子用戶的特征向量以及預(yù)設(shè)的第一數(shù)量的信息類別,計算出每個類別的信息對應(yīng)的聚類中心,然后根據(jù)潛在用戶的特征標簽向量、特征權(quán)值向量以及所計算出的聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離;再從所計算出的所有潛在用戶的第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為可向該目標用戶發(fā)送相應(yīng)的推送信息的目標用戶。由于該方法預(yù)先信息進行了分類,且計算出的第一距離可反映出對應(yīng)潛在用戶與相應(yīng)類別信息的匹配程度,距離越小,則說明越適合向該用戶發(fā)送相應(yīng)類別的信息,從而使得所選取出的目標用戶更加精準。

在一個實施例中,根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心的步驟,包括:當(dāng)種子用戶的信息中包含類別標識時,根據(jù)類別標識確定對應(yīng)種子用戶的特征標簽向量所歸屬的類別,形成第一數(shù)量的類別的聚類;計算每個聚類的中心點,將該中心點作為對應(yīng)類別的信息的聚類中心。

本實施例中,服務(wù)器在接收到用戶選取請求后,可檢測種子用戶的信息中是否包含類別標識,該類別標識用于標識對應(yīng)種子用戶所收藏或購買服務(wù)商的相關(guān)產(chǎn)品或者該產(chǎn)品的所屬類別。

當(dāng)種子用戶的信息中包含類別標識時,可根據(jù)該類別標識獲知對應(yīng)種子用戶所收藏或購買的服務(wù)商的相關(guān)產(chǎn)品或者該產(chǎn)品的所屬類別,從而可確定與該產(chǎn)品或者產(chǎn)品的所屬類別相匹配的推送信息的類別。然后將該種子用戶的特征標簽向量劃分到所確定的類別的信息的聚類之中。服務(wù)器可對每個種子用戶的特征標簽向量的進行類別的劃分,從而形成了第一數(shù)量的類別的聚類。

在形成了第一數(shù)量的類別的聚類之后,可根據(jù)每個聚類中所包含的特征標簽向量,計算出相應(yīng)的中心點,該中心點即為對應(yīng)類別的信息的聚類中心。具體的,可對每個聚類中的特征標簽向量進行算術(shù)平均,將所得到的平均值作為相應(yīng)的聚類中心。

由于種子用戶的信息中包含了類別標識,因而根據(jù)該類別標識可準確對相應(yīng)的種子用戶進行聚類,從而可提高所計算出的聚類中心的準確度。且由于第一距離與聚類中心相關(guān),因而還可提高后續(xù)對第一距離的計算的準確度,進而提高了對目標用戶選取的精準度。

在一個實施例中,如圖5所示,根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心的步驟,包括:

步驟502,當(dāng)種子用戶的信息中不包含類別標識時,從種子用戶群中選取第一數(shù)量的特征標簽向量,將所選取出的每個特征標簽向量分別作為其中一個類別的信息的初始聚類中心,使得每個類別的信息均具有一個初始聚類中心。

當(dāng)種子用戶的信息中不包含類別標識時,服務(wù)器可從種子用戶群中選取出與信息類別的數(shù)量等同的種子用戶的特征標簽向量,并分別將所選取的每個特征標簽向量作為對應(yīng)一種類別的信息的初始聚類中心,使得每個類別的信息均具有一個初始聚類中心。其中,服務(wù)器可采取預(yù)設(shè)的隨機函數(shù)來選取第一數(shù)量的特征標簽向量,并隨機地將每個選取出的特征標簽向量作為對應(yīng)的一個初始聚類中心。

步驟504,計算種子用戶群的每個特征標簽向量與每個類別的信息的上一次聚類中心的第二距離,根據(jù)第二距離確定對應(yīng)的特征標簽向量所歸屬的類別,形成第一數(shù)量的類別的聚類。

在每個類別的信息均具有了聚類中心之后,則分別計算剩下的種子用戶的特征標簽向量與每個初始聚類中心的第二距離,根據(jù)第二距離確定與種子用戶最近的一個初始聚類中心,然后將該種子用戶的特征標簽向量劃分到該初始聚類中心所對應(yīng)類別之中。服務(wù)器可對每個種子用戶的特征標簽向量的進行類別的劃分,從而形成了第一數(shù)量的類別的聚類。

其中,第一次的聚類中心即為初始聚類中心,對于后續(xù)需再次執(zhí)行步驟504的時候,每個類別的上一次的聚類中心即為在步驟506中所計算出的對應(yīng)聚類的中心點。

步驟506,計算每個聚類的中心點。

本實施例中,在形成了第一數(shù)量的類別的聚類之后,可根據(jù)每個聚類中所包含的特征標簽向量,計算出相應(yīng)的中心點,該中心點即為對應(yīng)類別的信息的聚類中心。具體的,可對每個聚類中的特征標簽向量進行算術(shù)平均,將所得到的平均值作為相應(yīng)的聚類中心。

步驟508,判斷聚類的中心點是否已收斂。若是,則執(zhí)行步驟510,否則,繼續(xù)執(zhí)行步驟504~508,直至判斷結(jié)果為是。

具體的,判斷所計算出的新的中心點與前一次的中心點之間的差值是否小于預(yù)設(shè)距離值。若是,則判斷所計算出的中心點收斂,否則,判斷不收斂。

本實施例中,服務(wù)器中對應(yīng)預(yù)設(shè)有一個距離值,該預(yù)設(shè)距離值用于作為判斷對應(yīng)中心點是否收斂的標準。當(dāng)其中的一個或多個聚類的中心點不收斂時,可繼續(xù)執(zhí)行步驟504,將每個類別的信息,進行重新聚類。該每個聚類的中心點即為對應(yīng)類別的信息的上一次的聚類中心。若所計算出的新的中心點與前一次的差值處于小于該預(yù)設(shè)距離值,則說明所計算出的新的中心點收斂,可將其作為該類別的信息最終的聚類中心。

步驟510,將該中心點作為對應(yīng)類別的信息的聚類中心。

當(dāng)在判斷出所有聚類的中心點已均經(jīng)收斂時,則可將該中心點作為對應(yīng)類別的信息最終的聚類中心。

本實施例中,通過判斷所形成的聚類中心是否收斂,若否,則循對每個類別的信息進行聚類,根據(jù)所形成的新的聚類重新計算中心點,直至每個類別的中心點均收斂,則可將該中心點作為對應(yīng)類別的信息最終的聚類中心,從而也可提高所計算出的聚類中心的準確度,進而提高了對目標用戶選取的精準度。

在一個實施例中,如圖6所示,獲取每個類別的信息對應(yīng)的特征權(quán)值向量的步驟,包括:

步驟602,將種子用戶群中的特征標簽向量作為正樣本特征標簽向量。

本實施例中,可將種子用戶群中的所有種子用戶或選取出部分種子用戶的特征標簽向量,將其作為正樣本特征標簽向量,作為正樣本,形成正樣本向量集。

步驟604,從潛在用戶群中獲取與種子用戶數(shù)量相同的特征標簽向量,作為負樣本特征標簽向量。

其中,可采用預(yù)設(shè)的隨機函數(shù)選取中與正樣本特征標簽向量數(shù)量等同的負樣本特征標簽向量,作為負樣本,形成負樣本向量集。

在一個實施例中,步驟602和步驟604的執(zhí)行順序可不做限定。

步驟606,根據(jù)正樣本特征標簽向量和負樣本特征標簽向量,按照預(yù)設(shè)分類模型進行訓(xùn)練學(xué)習(xí),生成特征權(quán)值向量。

本實施例中,該預(yù)設(shè)分類模型可為任意的二分類模型,具體的,可為邏輯回歸分類模型。服務(wù)器可基于正樣本向量集和負樣本向量集進行二分類模型訓(xùn)練,進而可獲得各聚類下的特征權(quán)值向量。即該特征權(quán)值向量是訓(xùn)練二分類模型之后得到的,是二分類模型訓(xùn)練之后獲得的參數(shù)。

本實施例中,通過上述的預(yù)設(shè)模型可提高所獲取的特征權(quán)值向量的準確度,從而也相應(yīng)提高了對第一距離的計算的準確度,同樣提高了對目標用戶選取的精準度。

在一個實施例中,根據(jù)潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離的步驟,包括:根據(jù)分類模型對潛在用戶群中的特征標簽向量進行篩選;計算篩選出的每個潛在用戶和每個類別的聚類中心的第一距離。

本實施例中,分類模型與上述步驟606中的分類模型相同,可為任意的二分類模型。服務(wù)器可將潛在用戶群中的潛在用戶的特征標簽向量輸入到該分類模型中,并計算輸出結(jié)果。若輸出結(jié)果為1,則表示對應(yīng)的潛在用戶與推送信息具有一定的匹配度,為可投放推送信息的用戶。若輸出結(jié)果為0,則表示對應(yīng)的潛在用戶與推送信息不相符,可將其剔除,不作為投放推送信息的用戶。其中,計算結(jié)果為1的潛在用戶即為篩選出的潛在用戶。服務(wù)器可僅對所篩選出的每個潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算對應(yīng)潛在用戶和每個類別的聚類中心的第一距離。

本實施例中,服務(wù)器可對所存儲的海量的潛在用戶在求取第一距離之前,進行篩選,以將剔除一部分與推送信息不匹配的潛在用戶,使得無需再對該部分潛在用戶進行第一距離的計算,從而可減少計算量,降低了對資源的占用,提高了對目標用戶的選取效率。

在一個實施例中,從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶的步驟,包括:對第一距離進行總的排名;從總的排名中選取排名靠前的對應(yīng)數(shù)量的潛在用戶,作為用于推送信息的目標用戶。

本實施例中,所述總的排名為不考慮分類而進行的混合排名,通過進行總的排名,可使得所選取的目標用戶為所有潛在用戶中,與準備推送的信息的某一個或多個種類的匹配度均是最高的,從而提高了目標用戶選取的精準度。

在一個實施例中,從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶的步驟,包括:分別對每個類別對應(yīng)的第一距離進行單獨排名;從每個類別的排名中選取排名靠前的對應(yīng)數(shù)量的潛在用戶,作為目標用戶。

本實施例中,服務(wù)器還可直接提取每個類別下的潛在用戶對應(yīng)的第一距離,針對每個類別進行單獨排名,分別從每個類別的排名中選取排名靠前的對應(yīng)數(shù)量的潛在用戶,作為目標用戶。

進一步的,服務(wù)器還可在計算出對應(yīng)潛在用戶和每個類別的聚類中心的第一距離后,可在該每個類別的聚類中心的第一距離中選取出最小第一距離,作為第三距離。并將該潛在用戶設(shè)置一個與該最小第一距離對應(yīng)的類別信息的類別標識。通過該類別標識,可獲知對應(yīng)潛在用戶與那種類別的信息最匹配。

服務(wù)器可分別針對具有同一類別標識的所有潛在用戶的第三距離進行排名,并從每種類別標識對應(yīng)的潛在用戶中選取出距離最小的對應(yīng)數(shù)量的潛在用戶,將其作為用于推送信息的目標用戶。

其中,該對應(yīng)數(shù)量既可根據(jù)不同類別的信息的需求進行配置。還可以根據(jù)針對每個類別信息對應(yīng)設(shè)置一個距離閾值,并選取出對應(yīng)類別中,小于該距離閾值的第三距離對應(yīng)的潛在用戶,將所選取出的潛在用戶作為目標用戶。所選取出的目標用戶的數(shù)量即為第二數(shù)量。

本實施例中,通過針對每個類別對應(yīng)的第一距離進行單獨排名,并從每個類別的排名中選取排名靠前的對應(yīng)數(shù)量的潛在用戶,作為目標用戶,使得所選取的目標用戶的數(shù)量可按照待推送的信息的類型進行合理的配置。

在一個實施例中,在從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶的步驟之后,還包括:向目標用戶的終端發(fā)送與對應(yīng)類別相匹配的推送信息。

本實施例中,服務(wù)器在選取出目標用戶后,可對該目標用戶設(shè)置相應(yīng)的類別標識,并從準備推薦的信息中,選取與該類別標識相匹配的類別的信息,作為推送信息發(fā)送給目標用戶。其中,服務(wù)器可采用短信或郵件等一種或多種推送方式向目標用戶的終端發(fā)送與對應(yīng)類別相匹配的推送信息。由于所選取的目標用戶的精準度高,從而向目標用戶發(fā)送對應(yīng)的推送信息后,被目標用戶所接受的概率也相對較高。

在一個實施例中,在從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶的步驟之后,還包括:將目標用戶的信息發(fā)送給客戶終端,以使客戶終端推送信息至目標用戶的終端。

本實施例中,服務(wù)器可將所選取出的目標用戶的信息發(fā)送給服務(wù)商的客戶終端,目標用戶的信息包括目標用戶的聯(lián)系電話、郵箱以及與服務(wù)器對應(yīng)的應(yīng)用的使用賬號(比如即時通訊賬號)等其中的一種或多種,還包括對應(yīng)的類別標識,使得客戶終端在接收到該目標用戶的信息后,可根據(jù)該類別標識獲知與對應(yīng)目標用戶相匹配的推薦信息,進而可自己將相匹配的推薦信息發(fā)送給目標用戶。同樣的,客戶終端也可采用短信或郵件等一種或多種推送方式向目標用戶的終端發(fā)送與對應(yīng)類別相匹配的推送信息,由于所選取的目標用戶的精準度高,從而向目標用戶發(fā)送對應(yīng)的推送信息后,被目標用戶所接受的概率也相對較高。

在一個實施例中,在向目標用戶的終端發(fā)送與對應(yīng)類別相匹配的推送信息的步驟之后,還包括:獲取目標用戶的反饋信息;根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心和特征權(quán)值向量。

本實施例中,目標用戶的反饋信息包括對應(yīng)目標用戶對所推薦的信息是否感興趣的信息。目標用戶的終端在接收到服務(wù)商的推薦信息后,可向服務(wù)器發(fā)送對該推薦信息感興趣或者不感興趣的反饋信息,服務(wù)器可接收目標用戶的終端所發(fā)送的反饋信息,根據(jù)該反饋信息可獲知目標用戶對該推薦信息是否感興趣。

進一步的,服務(wù)器可檢測所獲取的目標用戶的反饋信息的數(shù)量是否達到預(yù)設(shè)數(shù)量,當(dāng)反饋信息的數(shù)量達到預(yù)設(shè)數(shù)量時,則執(zhí)行根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心和特征權(quán)值向量。

對于有反饋信息的目標用戶,可獲取對該目標用戶所劃分的聚類。若該反饋信息表示目標用戶對推薦信息感興趣,則將該目標用戶歸類到對應(yīng)類別的種子用戶群中,根據(jù)歸類后的種子用戶群中對應(yīng)用戶的特征標簽向量來更新對應(yīng)的種子中心。若該反饋信息表示目標用戶對推薦信息不感興趣,則可將該目標用戶的特征標簽向量劃分到負樣本向量集中,并根據(jù)新形成的種子用戶群中的特征標簽向量所構(gòu)成的正樣本向量集,按照預(yù)設(shè)分類模型進行訓(xùn)練學(xué)習(xí),生成新的特征權(quán)值向量。從而實現(xiàn)了對聚類中心和特征權(quán)值向量的更新,使獲得的聚類中心和特征權(quán)值向量更加準確,從而在后續(xù)再次選取目標用戶時,可使得所選取的目標用戶更加精準。

在一個實施例中,如圖7所示,根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心和特征權(quán)值向量的步驟,包括:

步驟702,根據(jù)反饋信息確定目標用戶是否為種子用戶。

本實施例中,當(dāng)該反饋信息表示目標用戶對推薦信息感興趣時,則可將該目標用戶作為種子用戶,將其歸入到種子用戶群中;當(dāng)反饋信息表示目標用戶對推薦信息不感興趣時,則不將該目標用戶歸入到種子用戶群中。

步驟704,當(dāng)目標用戶為種子用戶時,將目標用戶的特征標簽向量加入到對應(yīng)類別的聚類中。

對于劃分為種子用戶的目標用戶,可根據(jù)該目標用戶的類別標識獲取到對應(yīng)的信息的類別,并將該目標用戶的特征標簽向量加入到對應(yīng)類別的聚類中,該聚類為由服務(wù)商所提供的種子用戶的特征標簽向量所形成的聚類。

步驟706,更新聚類的中心點,將更新后的中心點作為對應(yīng)類別信息的聚類中心。

具體的,可按照上述的步驟510的計算方法,計算出相應(yīng)的中心點,將該中心點作為對應(yīng)類別的信息的聚類中心。通過更新聚類中心,可使得所確定的聚類中心的準確度更高,從而使得根據(jù)該聚類中心所選取的目標用戶更加精準。

在一個實施例中,如圖8所示,根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心和特征權(quán)值向量的步驟,包括:

步驟802,根據(jù)反饋信息對目標用戶劃分所屬樣本向量集。

本實施例中,服務(wù)器可分別篩選出反饋信息表示對推薦信息感興趣以及不感興趣的目標用戶,將所篩選出的感興趣的目標用戶的特征標簽向量作為正樣本,增加到正樣本向量集中,將所篩選出的不感興趣的目標用戶的特征標簽向量作為負樣本,增加到負樣本向量集中。

檢測正樣本向量集和負樣本向量集中的樣本數(shù)量是否相同,若不相同,可對正樣本向量集或負樣本向量集中的樣本進行增加或刪減,以使得正樣本數(shù)量與負樣本數(shù)量相同。

具體的,當(dāng)負樣本向量集的樣本數(shù)量大于正樣本向量集中的樣本數(shù)量時,可對從負樣本向量集中刪減出超過數(shù)量的樣本,其中,可優(yōu)先刪減之前的潛在用戶群中獲取的負樣本特征標簽向量。當(dāng)負樣本向量集的樣本數(shù)量小于正樣本向量集中的樣本數(shù)量時,則可從潛在用戶群中繼續(xù)選取一定數(shù)量的潛在用戶的特征標簽向量,作為負樣本,增加到負樣本向量集中,以保持正樣本數(shù)量與負樣本數(shù)量相同。

步驟804,根據(jù)劃分后的樣本向量集,按照預(yù)設(shè)分類模型進行訓(xùn)練學(xué)習(xí),更新特征權(quán)值向量。

分類模型與上述步驟606中的分類模型相同,可為任意的二分類模型。服務(wù)器可基于新的正樣本向量集和負樣本向量集進行二分類模型訓(xùn)練,重新計算各聚類下的特征權(quán)值向量,將重新計算出的特征權(quán)值向量作為對應(yīng)類別的信息的特征權(quán)值向量。

本實施例中,通過根據(jù)反饋信息重新對相應(yīng)的目標用戶進行正負樣本向量集的劃分,并根據(jù)劃分后的樣本向量集來重新計算特征權(quán)值向量,使得所計算出的特征權(quán)值向量更能反映出對應(yīng)特征標簽所占的比重,從而使得根據(jù)該特征權(quán)值向量所選取的目標用戶更加精準。

在一個實施例中,如圖9所示,提供了一種用戶選取裝置,該裝置包括:

特征標簽向量獲取模塊902,用于獲取每個種子用戶的特征標簽向量。

聚類中心計算模塊904,用于根據(jù)所有種子用戶的特征標簽向量計算預(yù)設(shè)的第一數(shù)量的信息類別中,每個類別的信息對應(yīng)的聚類中心。

特征權(quán)值向量獲取模塊906,用于獲取特征權(quán)值向量。

特征標簽向量獲取模塊902還用于獲取潛在用戶群中的每個潛在用戶的特征標簽向量。

第一距離計算模塊908,用于根據(jù)潛在用戶的特征標簽向量、特征權(quán)值向量以及聚類中心,計算潛在用戶和每個類別的聚類中心的第一距離。

目標用戶選取模塊910,用于從第一距離中選取距離最短的第二數(shù)量的潛在用戶,作為用于推送信息的目標用戶。

在一個實施例中,第一距離計算模塊908還用于根據(jù)分類模型對潛在用戶群中的特征標簽向量進行篩選;計算篩選出的每個潛在用戶和每個類別的聚類中心的第一距離。

在一個實施例中,目標用戶選取模塊910還用于分別對每個類別對應(yīng)的第一距離進行單獨排名;從每個類別的排名中選取排名靠前的對應(yīng)數(shù)量的潛在用戶,作為目標用戶。

在一個實施例中,如圖10所示,提供了另一種用戶選取裝置,該裝置還包括:

信息推送模塊912,用于向目標用戶的終端發(fā)送與對應(yīng)類別相匹配的推送信息。

在一個實施例中,如圖11所示,提供了又一種用戶選取裝置,該裝置還包括:

反饋信息獲取模塊914,用于獲取目標用戶的反饋信息。

聚類中心計算模塊904還用于根據(jù)反饋信息更新每個類別的信息對應(yīng)的聚類中心。

特征權(quán)值向量獲取模塊906還用于根據(jù)反饋信息更新每個類別的信息對應(yīng)的特征權(quán)值向量。

在一個實施例中,如圖12所示,聚類中心計算模塊904還包括:

種子用戶確定單元1202,用于根據(jù)反饋信息確定目標用戶是否為種子用戶;

聚類更新單元1204,用于當(dāng)目標用戶為種子用戶時,將目標用戶的特征標簽向量加入到對應(yīng)類別的聚類中;

聚類中心更新單元1206,用于更新聚類的中心點,將更新后的中心點作為對應(yīng)類別信息的聚類中心。

在一個實施例中,如圖13所示,特征權(quán)值向量獲取模塊906還包括:

樣本向量集劃分單元1302,用于根據(jù)反饋信息對目標用戶劃分所屬樣本向量集;

特征權(quán)值向量更新單元1304,用于根據(jù)劃分后的樣本向量集,按照預(yù)設(shè)模型進行訓(xùn)練學(xué)習(xí),更新特征權(quán)值向量。

在一個實施例中,如圖14所示,提供了再一種用戶選取裝置,該裝置還包括:

目標用戶推送模塊916,用于將目標用戶的信息發(fā)送給客戶終端,以使客戶終端推送信息至目標用戶的終端。

本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM)等非易失性存儲介質(zhì),或隨機存儲記憶體(Random Access Memory,RAM)等。

以上所述實施例的各技術(shù)特征可以進行任意的組合,為使描述簡潔,未對上述實施例中的各個技術(shù)特征所有可能的組合都進行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認為是本說明書記載的范圍。

以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
永仁县| 宁南县| 西乌珠穆沁旗| 大连市| 江华| 乌拉特后旗| 旅游| 阿巴嘎旗| 镇雄县| 开封县| 巴东县| 柳林县| 三穗县| 通城县| 安图县| 新晃| 浠水县| 迭部县| 大庆市| 龙门县| 那曲县| 高安市| 凤庆县| 开平市| 神木县| 奉贤区| 济宁市| 碌曲县| 安吉县| 乐平市| 南召县| 宜黄县| 吴堡县| 湾仔区| 新泰市| 随州市| 五原县| 固阳县| 会宁县| 财经| 花垣县|