本發(fā)明涉及網(wǎng)絡(luò)數(shù)據(jù)分析領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)用戶屬性的匹配方法及裝置。
背景技術(shù):
:在網(wǎng)絡(luò)數(shù)據(jù)分析領(lǐng)域,網(wǎng)絡(luò)用戶的屬性數(shù)據(jù)通常是各網(wǎng)絡(luò)服務(wù)提供商最關(guān)心的數(shù)據(jù)之一。其中,網(wǎng)絡(luò)用戶的屬性例如包括性別、年齡、所在區(qū)域、職業(yè)等用戶特征。目前,不同的網(wǎng)絡(luò)服務(wù)提供商在對(duì)網(wǎng)絡(luò)用戶的屬性數(shù)據(jù)進(jìn)行分析時(shí),得出的結(jié)果可能有所不同。例如,當(dāng)同一用戶通過(guò)同一臺(tái)終端訪問(wèn)A網(wǎng)站和B網(wǎng)站后,對(duì)于該用戶的性別分析,A網(wǎng)站和B網(wǎng)站可能給出不同的分析結(jié)果。由于對(duì)用戶的屬性數(shù)據(jù)分析無(wú)法達(dá)到100%的精準(zhǔn)度,而不同數(shù)據(jù)分析機(jī)構(gòu)又可能提供不同的分析結(jié)果,為了保護(hù)網(wǎng)絡(luò)服務(wù)提供商及其客戶的利益,本著公平公正的原則,網(wǎng)絡(luò)服務(wù)提供商及其客戶們通常會(huì)選擇獨(dú)立的第三方機(jī)構(gòu)對(duì)數(shù)據(jù)進(jìn)行監(jiān)測(cè)分析,并以第三方機(jī)構(gòu)出具的數(shù)據(jù)監(jiān)測(cè)報(bào)告為準(zhǔn)。例如,在網(wǎng)絡(luò)廣告投放領(lǐng)域,媒體企業(yè)與廣告主通?;谔囟◤V告對(duì)定向人群的投放比例來(lái)結(jié)算該廣告的投放費(fèi)用。而鑒于媒體企業(yè)和廣告主之間存在直接利益關(guān)系,通常雙方會(huì)邀請(qǐng)第三方數(shù)據(jù)監(jiān)測(cè)機(jī)構(gòu)出具廣告投放比例監(jiān)測(cè)報(bào)告,并以第三方所監(jiān)測(cè)的數(shù)據(jù)為準(zhǔn)進(jìn)行結(jié)算。第三方監(jiān)測(cè)機(jī)構(gòu)通過(guò)媒體端收集廣告曝光的數(shù)據(jù)及瀏覽媒體端的用戶的屬性數(shù)據(jù)。通過(guò)對(duì)數(shù)據(jù)進(jìn)行分析,進(jìn)而推算出在一定時(shí)間和特定區(qū)域內(nèi),訪問(wèn)該廣告的定向人群的屬性比例。通常情況下,為了實(shí)現(xiàn)利益最大化,避免流量浪費(fèi)及網(wǎng)絡(luò)活動(dòng)的精準(zhǔn)投放,在不影響用戶隱私和公平交易的原則下,第三方監(jiān)測(cè)機(jī)構(gòu)會(huì)將宏觀監(jiān)測(cè) 結(jié)果提供給媒體企業(yè),以便媒體企業(yè)適當(dāng)?shù)卣{(diào)整投放機(jī)制,此種做法同時(shí)可以保障媒體企業(yè)和廣告主的利益。通過(guò)現(xiàn)有技術(shù)中第三方機(jī)構(gòu)出具的數(shù)據(jù)監(jiān)測(cè)報(bào)告,網(wǎng)絡(luò)服務(wù)提供商的某些業(yè)務(wù)需要可以得到滿足。但是,網(wǎng)絡(luò)服務(wù)提供商自身對(duì)網(wǎng)絡(luò)用戶屬性分析匹配的能力仍未得到提高。技術(shù)實(shí)現(xiàn)要素:為了解決上述技術(shù)問(wèn)題,本發(fā)明提供一種網(wǎng)絡(luò)用戶屬性的匹配方法及裝置,能夠提高網(wǎng)絡(luò)用戶屬性的定位精準(zhǔn)度。為了達(dá)到上述技術(shù)目的,本發(fā)明提供一種網(wǎng)絡(luò)用戶屬性的匹配方法,包括:步驟S1:收集網(wǎng)絡(luò)用戶數(shù)據(jù),計(jì)算各網(wǎng)絡(luò)用戶的各屬性的概率值;步驟S2:針對(duì)一組用戶,獲取該組用戶中各屬性的用戶比例;步驟S3:分別比較各屬性在該組用戶中的用戶比例與各屬性在該組用戶中的參考比例;當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值小于或等于第一閾值時(shí),確認(rèn)該屬性在該組用戶中所覆蓋的用戶;當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值大于該第一閾值時(shí),根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,并返回步驟S2。進(jìn)一步地,所述針對(duì)一組用戶,獲取該組用戶中各屬性的用戶比例,包括:針對(duì)一組用戶,根據(jù)不同屬性對(duì)該組用戶中的各用戶進(jìn)行分類標(biāo)記,其中,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)互斥屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)互斥屬性中概率值最大的屬性,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)概率值相同或非互斥的屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)其中概率值大于第二閾值的屬性;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量與該組用戶總數(shù)量的比值,得到該組用戶中各屬性的用戶比例。進(jìn)一步地,所述根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,包括:將該組用戶中的各用戶按照該屬性的概率值由高至低的順序排序;按照所述由高至低的順序篩選用戶,直至篩選出的用戶在該組用戶中所占比例與所述參考比例的差值在一預(yù)設(shè)范圍內(nèi);將篩選出的用戶的該屬性的概率值增加第一數(shù)值,其余未被篩選出的用戶的該屬性的概率值減小第二數(shù)值。進(jìn)一步地,所述確認(rèn)該屬性在該組用戶中所覆蓋的用戶之后,該方法還包括:判斷是否滿足預(yù)設(shè)條件,若不滿足,返回步驟S2,若滿足預(yù)設(shè)條件,確認(rèn)各網(wǎng)絡(luò)用戶的各屬性。進(jìn)一步地,所述預(yù)設(shè)條件包括:不同組用戶中每個(gè)屬性的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值連續(xù)小于或等于第一閾值的次數(shù)為第三數(shù)值。本發(fā)明還提供一種網(wǎng)絡(luò)用戶屬性的匹配裝置,包括:數(shù)據(jù)采集模塊,用于收集網(wǎng)絡(luò)用戶數(shù)據(jù),并計(jì)算各網(wǎng)絡(luò)用戶的各屬性的概率值;第一處理模塊,用于針對(duì)一組用戶,獲取該組用戶中各屬性的用戶比例;第二處理模塊,用于分別比較各屬性在該組用戶中的用戶比例與各屬性在該組用戶中的參考比例,當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值小于或等于第一閾值時(shí),確認(rèn)該屬性在該組用戶中所覆蓋的用戶;當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值大于該第一閾值時(shí),根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,并通知所述第一處理模塊針對(duì)另一組用戶進(jìn)行處理。進(jìn)一步地,所述第一處理模塊,具體用于:針對(duì)一組用戶,根據(jù)不同屬性對(duì)該組用戶中的各用戶進(jìn)行分類標(biāo)記,其中,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)互斥屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)互斥屬性中概率值最大的屬性,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)概率值相同或非互斥的屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)其中概率值大于第二閾值的屬性;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量與該組用戶總數(shù)量的比值,得到該組用戶中各屬性的用戶比例。進(jìn)一步地,所述第二處理模塊,用于根據(jù)所述參考比例調(diào)整該組用戶中 各用戶的該屬性的概率值,包括:將該組用戶中的各用戶按照該屬性的概率值由高至低的順序排序;按照所述由高至低的順序篩選用戶,直至篩選出的用戶在該組用戶中所占比例與所述參考比例的差值在一預(yù)設(shè)范圍內(nèi);將篩選出的用戶的該屬性的概率值增加第一數(shù)值,其余未被篩選出的用戶的該屬性的概率值減小第二數(shù)值。進(jìn)一步地,該裝置還包括:控制模塊,用于在所述第二處理模塊確認(rèn)該屬性在該組用戶中所覆蓋的用戶之后,判斷是否滿足預(yù)設(shè)條件,若不滿足預(yù)設(shè)條件,通知所述第一處理模塊及所述第二處理模塊針對(duì)另一組用戶進(jìn)行處理,若滿足預(yù)設(shè)條件,確認(rèn)各網(wǎng)絡(luò)用戶的各屬性。進(jìn)一步地,所述預(yù)設(shè)條件包括:不同組用戶中每個(gè)屬性的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值連續(xù)小于或等于第一閾值的次數(shù)為第三數(shù)值。通過(guò)本發(fā)明,根據(jù)各屬性在不同組用戶中的參考比例,調(diào)整各屬性在不同組用戶中的用戶比例,進(jìn)而確定不同組用戶中各屬性所覆蓋的用戶,從而提高網(wǎng)絡(luò)用戶屬性的定位精準(zhǔn)度,提高網(wǎng)絡(luò)活動(dòng)的效果。于實(shí)際應(yīng)用中,網(wǎng)絡(luò)服務(wù)提供商可以根據(jù)自身收集的網(wǎng)絡(luò)用戶數(shù)據(jù)以第三方監(jiān)測(cè)機(jī)構(gòu)提供的參考數(shù)據(jù)為準(zhǔn),調(diào)整自身收集的網(wǎng)絡(luò)用戶數(shù)據(jù),從而提高網(wǎng)絡(luò)服務(wù)提供商定位網(wǎng)絡(luò)用戶屬性的精確度,如此,有益于提高網(wǎng)絡(luò)活動(dòng)推廣及投放的精準(zhǔn)度,進(jìn)而提高網(wǎng)絡(luò)活動(dòng)的效果。附圖說(shuō)明圖1為本發(fā)明實(shí)施例提供的網(wǎng)絡(luò)用戶屬性的匹配方法的流程圖;圖2為本發(fā)明實(shí)施例提供的網(wǎng)絡(luò)用戶屬性的匹配裝置的示意圖。具體實(shí)施方式以下結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說(shuō)明,應(yīng)當(dāng)理解,以下所說(shuō)明的實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。圖1為本發(fā)明實(shí)施例提供的網(wǎng)絡(luò)用戶屬性的匹配方法的流程圖。如圖1所示,本實(shí)施例提供的網(wǎng)絡(luò)用戶屬性的匹配方法,包括以下步驟:步驟S1:收集網(wǎng)絡(luò)用戶數(shù)據(jù),計(jì)算各網(wǎng)絡(luò)用戶的各屬性的概率值。其中,網(wǎng)絡(luò)用戶的屬性例如包括性別信息、年齡信息、所在區(qū)域信息、職業(yè)信息等用戶特征信息。于實(shí)際應(yīng)用中,網(wǎng)絡(luò)服務(wù)提供商可以根據(jù)用戶注冊(cè)信息獲取部分用戶屬性,并利用用戶行為作為特征,用支持向量機(jī)(SVM,SupportVectorMachine)、決策樹等機(jī)器學(xué)習(xí)方法計(jì)算出各用戶數(shù)據(jù)中各屬性的概率值,并將收集的網(wǎng)絡(luò)用戶數(shù)據(jù)及各用戶的各屬性的概率值存儲(chǔ)至數(shù)據(jù)庫(kù)。步驟S2:針對(duì)一組用戶,獲取該組用戶中各屬性的用戶比例。其中,步驟S2包括:針對(duì)一組用戶,根據(jù)不同屬性對(duì)該組用戶中的各用戶進(jìn)行分類標(biāo)記,其中,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)互斥屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)互斥屬性中概率值最大的屬性,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)概率值相同或非互斥的屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)其中概率值大于第二閾值的屬性;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量與該組用戶總數(shù)量的比值,得到該組用戶中各屬性的用戶比例。舉例而言,以用戶的性別為例,當(dāng)一用戶的男性屬性的概率值大于女性屬性的概率值時(shí),標(biāo)記該用戶為男性,反之,標(biāo)記該用戶為女性。當(dāng)一用戶的男性屬性的概率值等于女性屬性的概率值時(shí)(如均為50%),隨機(jī)選擇該用戶性別的確定方式,例如在下述兩種方式中任意選擇一種:若該用戶的男性屬性的概率值大于第二閾值(如50%),則標(biāo)記該用戶為男性,反之,標(biāo)記該用戶為女性;若該用戶的女性屬性的概率值大于第二閾值(如50%),則標(biāo)記該用戶為女性,反之,標(biāo)記該用戶為男性。另外,當(dāng)一用戶的男性屬性的概率值等于女性屬性的概率值時(shí)(如均為50%),可固定該用戶性別的確定方式,例如:若該用戶的男性屬性的概率值大于第二閾值(如50%),則標(biāo)記該用戶為男性,反之,標(biāo)記該用戶為女性。另外,以不同年齡段的屬性為例,若一用戶屬于30歲以下年齡段的概率值為40%,屬于30歲以上50歲以下年齡段的概率值為50%,屬于50歲以上年齡段的概率值為20%,則標(biāo)記該用戶對(duì)應(yīng)30歲以上50歲以下的年齡段。步驟S3:分別比較各屬性在該組用戶中的用戶比例與各屬性在該組用戶中的參考比例;當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值小于或等于第一閾值時(shí),確認(rèn)該屬性在該組用戶中所覆蓋的用戶;當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值大于該第一閾值時(shí),根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,并返回步驟S2。于實(shí)際應(yīng)用中,該屬性在該組用戶中的參考比例例如由第三方監(jiān)測(cè)機(jī)構(gòu)提供。其中,所述根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,包括:將該組用戶中的各用戶按照該屬性的概率值由高至低的順序排序;按照所述由高至低的順序篩選用戶,直至篩選出的用戶在該組用戶中所占比例與所述參考比例的差值在一預(yù)設(shè)范圍內(nèi);將篩選出的用戶的該屬性的概率值增加第一數(shù)值,其余未被篩選出的用戶的該屬性的概率值減小第二數(shù)值。其中,所述預(yù)設(shè)范圍例如為-A~A,A為小于第一閾值的正數(shù)。于此,第一閾值為10%,第一數(shù)值等于第二數(shù)值例如為10%,然而,本發(fā)明對(duì)此并不限定。所述預(yù)設(shè)范圍、第一閾值、第一數(shù)值以及第二數(shù)值的設(shè)置可根據(jù)實(shí)際需要確定。進(jìn)一步地,所述確認(rèn)該屬性在該組用戶中所覆蓋的用戶之后,該方法還包括:判斷是否滿足預(yù)設(shè)條件,若不滿足,返回步驟S2,若滿足預(yù)設(shè)條件,確認(rèn)各網(wǎng)絡(luò)用戶的各屬性。其中,所述預(yù)設(shè)條件包括:不同組用戶中每個(gè)屬性的用戶比例與對(duì)應(yīng)的 參考比例的差值的絕對(duì)值連續(xù)小于或等于第一閾值的次數(shù)為第三數(shù)值。其中,第三數(shù)值例如為10次。然而,本發(fā)明對(duì)此并不限定。于實(shí)際應(yīng)用中,可根據(jù)需要進(jìn)行設(shè)定。另外,不同組用戶中的用戶總數(shù)量可相同或不同,不同組用戶中可包括相同的用戶或不同的用戶。本發(fā)明對(duì)此并不限定。以下通過(guò)一具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。于本實(shí)施例中,以在網(wǎng)絡(luò)服務(wù)提供商的終端上的實(shí)際應(yīng)用為例進(jìn)行說(shuō)明。首先,網(wǎng)絡(luò)服務(wù)提供商與第三方監(jiān)測(cè)機(jī)構(gòu)同時(shí)收集網(wǎng)絡(luò)用戶數(shù)據(jù),其中,網(wǎng)絡(luò)服務(wù)提供商所計(jì)算出的各用戶的各屬性的概率值例如表1所示:用戶男性比率30歲以下北京用戶C180%40%10%C240%90%90%C359%10%74%C420%60%10%C565%40%70%C673%80%25%C724%34%75%C836%47%32%C940%63%43%C1015%41%70%表1網(wǎng)絡(luò)服務(wù)提供商從其所收集到的十個(gè)用戶中,隨機(jī)選取一組用戶(第一組用戶),如五個(gè)用戶:C1、C2、C5、C7、C10,上述五個(gè)用戶的男性概率值分別是:80%(C1)、40%(C2)、65%(C5)、24%(C7)、15%(C10)。由于男性與女性屬于互斥屬性,因此,根據(jù)用戶本身屬性的概率值確定用戶性別。于此,在所選五個(gè)隨機(jī)用戶中,C1為男性,C5為男性,C2為 女性,C7為女性,C10為女性。此時(shí),在上述五個(gè)用戶中男性占比為:(2/5)*100%=40%。即,男性在第一組用戶中的用戶比例為40%。同時(shí),網(wǎng)絡(luò)服務(wù)提供商將上述五個(gè)用戶的標(biāo)號(hào)(ID)發(fā)送至第三方監(jiān)測(cè)機(jī)構(gòu)。第三方監(jiān)測(cè)機(jī)構(gòu)根據(jù)其本身的分析方法給出該組五個(gè)用戶中,男性用戶的占比為60%。即,男性用戶在第一組用戶中的參考比例為60%。之后,比較網(wǎng)絡(luò)服務(wù)提供商得到的上述五個(gè)用戶中男性占比及第三方監(jiān)測(cè)機(jī)構(gòu)的得到的上述五個(gè)用戶中男性占比,通過(guò)比較可知:兩者差值的絕對(duì)值為20%,大于10%(第一閾值),此時(shí),以第三方監(jiān)測(cè)機(jī)構(gòu)的提供的上述五個(gè)用戶中男性占比為準(zhǔn),對(duì)網(wǎng)絡(luò)服務(wù)器提供商的數(shù)據(jù)進(jìn)行調(diào)整。具體而言,網(wǎng)絡(luò)服務(wù)提供商對(duì)該組五個(gè)用戶的男性屬性的概率值進(jìn)行如下調(diào)整:將所述五個(gè)用戶按照男性的概率值從高到底的順序排序,得到如下排序:C1(80%)、C5(65%)、C2(40%)、C7(24%)、C10(15%);根據(jù)第三方監(jiān)測(cè)機(jī)構(gòu)的結(jié)果判斷,在所述五個(gè)用戶中,其中有三個(gè)用戶為男性用戶,從上述排序中按照由高至低的順序篩選三個(gè)用戶,于此,篩選出C1、C5、C2三位用戶;將篩選出的用戶的男性的概率值各加10%(第一數(shù)值),將未篩選出的用戶的男性的概率值各減10%(第二數(shù)值),則重新獲得上述五個(gè)用戶的男性的概率值為:90%(C1)、50%(C2)、75%(C5)、14%(C7)、5%(C10)。將上述五個(gè)用戶ID的數(shù)據(jù)放回表1,更新表1中上述五個(gè)用戶的屬性數(shù)據(jù)后如表2所示:用戶男性比率30歲以下北京用戶C190%40%10%C250%90%90%C359%10%74%C420%60%10%C575%40%70%C673%80%25%C714%34%75%C836%47%32%C940%63%43%C105%41%70%表2之后,網(wǎng)絡(luò)服務(wù)提供商從表2中再隨機(jī)選出一組用戶(第二組用戶),如五個(gè)用戶:C2、C4、C6、C8、C9,上述五個(gè)用戶的男性概率值分別為:50%(C2)、20%(C4)、73%(C6)、36%(C8)、40%(C9)。由于男性與女性屬于互斥屬性,因此,根據(jù)用戶本身屬性的概率值確定用戶性別。于此,C6為男性,C4、C8及C9為女性。其中,C2的男性概率值與女性概率值相同,于此,以隨機(jī)確定C2的性別為男性為例進(jìn)行說(shuō)明。然而,本發(fā)明對(duì)此并不限定。于此,C2的性別也可能被隨機(jī)確定為女性?;蛘?,在其他實(shí)施例中,根據(jù)用戶設(shè)置,固定設(shè)置當(dāng)男性及女性概率值均為50%時(shí),確定用戶的性別為男性?;蛘撸谄渌麑?shí)施例中,根據(jù)用戶設(shè)置,固定設(shè)置當(dāng)男性及女性概率值均為50%時(shí),確定用戶的性別為女性。于本實(shí)施例中,上述五位用戶中C2、C6兩位用戶為男性,則該組用戶中男性用戶的占比為40%。即,男性用戶在第二組用戶中的用戶比例為40%。同時(shí),網(wǎng)絡(luò)服務(wù)提供商將上述五個(gè)用戶的ID發(fā)送至第三方監(jiān)測(cè)機(jī)構(gòu)。第三方監(jiān)測(cè)機(jī)構(gòu)根據(jù)其本身的分析方法給出該組五個(gè)用戶中,男性用戶的占比為40%。即,男性用戶在第二組用戶中的參考比例為40%。此時(shí),由于網(wǎng)絡(luò)服務(wù)提供商提供的結(jié)果與第三方監(jiān)測(cè)機(jī)構(gòu)的結(jié)果的差值為0,小于10%(第一閾值),則第二組中五個(gè)用戶的男性屬性得到確認(rèn),即,C2、C6為男性,C4、C8、C9為女性。將該組所有用戶數(shù)據(jù)放回表1,重復(fù)上述數(shù)據(jù)選擇、計(jì)算、比較過(guò)程。直至網(wǎng)絡(luò)服務(wù)提供商提供的男性用戶在相應(yīng)組用戶中的占比與第三方監(jiān)測(cè) 機(jī)構(gòu)所提供的男性用戶在相應(yīng)組用戶中的參考比例之間的差值的絕對(duì)值連續(xù)10次(第三閾值)小于10%(第一閾值),則所有樣本(如表1中用戶)的男性屬性匹配完畢,確定各用戶為男性或女性。表1中用戶的其余屬性同樣適用上述過(guò)程,通過(guò)上述過(guò)程可以確定表1中各用戶的其余屬性數(shù)據(jù),直至表1中各用戶的各屬性均確認(rèn)后,結(jié)束本流程。于此,表1中各用戶的其余屬性數(shù)據(jù)的匹配過(guò)程同男性屬性的匹配過(guò)程,故于此不再一一贅述。圖2為本發(fā)明實(shí)施例提供的網(wǎng)絡(luò)用戶屬性的匹配裝置。如圖2所示,本實(shí)施例提供的網(wǎng)絡(luò)用戶屬性的匹配裝置,包括:數(shù)據(jù)采集模塊,用于收集網(wǎng)絡(luò)用戶數(shù)據(jù),并計(jì)算各網(wǎng)絡(luò)用戶的各屬性的概率值;第一處理模塊,用于針對(duì)一組用戶,獲取該組用戶中各屬性的用戶比例;第二處理模塊,用于分別比較各屬性在該組用戶中的用戶比例與各屬性在該組用戶中的參考比例,當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值小于或等于第一閾值時(shí),確認(rèn)該屬性在該組用戶中所覆蓋的用戶;當(dāng)一屬性在該組用戶中的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值大于該第一閾值時(shí),根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,并通知所述第一處理模塊針對(duì)另一組用戶進(jìn)行處理。進(jìn)一步地,所述第一處理模塊,具體用于:針對(duì)一組用戶,根據(jù)不同屬性對(duì)該組用戶中的各用戶進(jìn)行分類標(biāo)記,其中,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)互斥屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)互斥屬性中概率值最大的屬性,當(dāng)一用戶對(duì)應(yīng)至少兩個(gè)概率值相同或非互斥的屬性時(shí),標(biāo)記該用戶對(duì)應(yīng)其中概率值大于第二閾值的屬性;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量;計(jì)算各屬性在該組用戶中所覆蓋的用戶數(shù)量與該組用戶總數(shù)量的比值,得到該組用戶中各屬性的用戶比例。進(jìn)一步地,所述第二處理模塊,用于根據(jù)所述參考比例調(diào)整該組用戶中各用戶的該屬性的概率值,包括:將該組用戶中的各用戶按照該屬性的概率值由高至低的順序排序;按照所述由高至低的順序篩選用戶,直至篩選出的用戶在該組用戶中所 占比例與所述參考比例的差值在一預(yù)設(shè)范圍內(nèi);將篩選出的用戶的該屬性的概率值增加第一數(shù)值,其余未被篩選出的用戶的該屬性的概率值減小第二數(shù)值。進(jìn)一步地,所述裝置還包括:控制模塊,用于在所述第二處理模塊確認(rèn)該屬性在該組用戶中所覆蓋的用戶之后,判斷是否滿足預(yù)設(shè)條件,若不滿足預(yù)設(shè)條件,通知所述第一處理模塊及所述第二處理模塊針對(duì)另一組用戶進(jìn)行處理,若滿足預(yù)設(shè)條件,確認(rèn)各網(wǎng)絡(luò)用戶的各屬性。進(jìn)一步地,所述預(yù)設(shè)條件包括:不同組用戶中每個(gè)屬性的用戶比例與對(duì)應(yīng)的參考比例的差值的絕對(duì)值連續(xù)小于或等于第一閾值的次數(shù)為第三數(shù)值。于實(shí)際應(yīng)用中,上述裝置例如設(shè)置在網(wǎng)絡(luò)服務(wù)提供商的終端上。于實(shí)際應(yīng)用中,上述各模塊的功能例如通過(guò)處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的程序/指令實(shí)現(xiàn)。然而,本發(fā)明對(duì)此并不限定。上述模塊的功能例如還可以通過(guò)固件/邏輯電路/集成電路實(shí)現(xiàn)。此外,關(guān)于上述裝置的具體處理流程同上述方法所述,故于此不再贅述。以上顯示和描述了本發(fā)明的基本原理和主要特征和本發(fā)明的優(yōu)點(diǎn)。本發(fā)明不受上述實(shí)施例的限制,上述實(shí)施例和說(shuō)明書中描述的只是說(shuō)明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi)。當(dāng)前第1頁(yè)1 2 3