一種公眾賬號的質(zhì)量評價方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種公眾賬號的質(zhì)量評價方法和裝置,用于實(shí)現(xiàn)對公眾賬號的質(zhì)量做出有效且準(zhǔn)確的評價。本發(fā)明實(shí)施例提供一種公眾賬號的質(zhì)量評價方法,包括:獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,所述樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù);將待評價的公眾賬號輸入到所述回歸模型中,通過所述回歸模型對所述待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測;獲取所述回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為所述待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。
【專利說明】
一種公眾賬號的質(zhì)量評價方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種公眾賬號的質(zhì)量評價方法和裝置。
【背景技術(shù)】
[0002]公眾平臺的最終定位在于為公眾服務(wù),用戶對公眾平臺給予很高的期望。公眾平臺擁有大量的用戶,公眾平臺希望能夠不斷挖掘自己用戶的價值,為這個平臺增加更優(yōu)質(zhì)的內(nèi)容,創(chuàng)造更好的粘性,形成一個不一樣的生態(tài)循環(huán),這是公眾平臺在發(fā)展階段的更重要方向。在公眾平臺中各種組織、企業(yè)以及個人都可以注冊進(jìn)來,不同的注冊使用方都有不同的公眾賬號,利用公眾賬號可以在公眾平臺上進(jìn)行自媒體活動,簡單來說就是進(jìn)行一對多的媒體行為活動,比如商家通過申請公眾平臺中的公眾賬號,可以展示商家的官網(wǎng)、各種活動等,從而形成了線上線下互動的營銷方式。
[0003]公眾賬號在公眾平臺中處于重要的地位,隨著公眾平臺的推出和積累,目前公眾賬號的數(shù)量越來越多,甚至達(dá)到數(shù)百億級別,但是各種公眾賬號的質(zhì)量參差不齊,比如存在很多的僵尸公眾賬號、傳銷公眾賬號等等。隨著公眾平臺的快速開展,高質(zhì)量的公眾賬號在很多場景下均有廣泛的需求,但是目前的公眾平臺中對于公眾賬號的質(zhì)量優(yōu)劣無法做出有效的評價。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供了一種公眾賬號的質(zhì)量評價方法和裝置,用于實(shí)現(xiàn)對公眾賬號的質(zhì)量做出有效的評價。
[0005]為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供以下技術(shù)方案:
[0006]第一方面,本發(fā)明實(shí)施例提供一種公眾賬號的質(zhì)量評價方法,包括:
[0007]獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,所述樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù);
[0008]將待評價的公眾賬號輸入到所述回歸模型中,通過所述回歸模型對所述待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測;
[0009]獲取所述回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為所述待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。
[0010]第二方面,本發(fā)明實(shí)施例還提供一種公眾賬號的質(zhì)量評價裝置,包括:
[0011]模型獲取模塊,用于獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,所述樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù);
[0012]模型預(yù)測模塊,用于將待評價的公眾賬號輸入到所述回歸模型中,通過所述回歸模型對所述待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測;
[0013]質(zhì)量評價模塊,用于獲取所述回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為所述待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。
[0014]從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):
[0015]在本發(fā)明實(shí)施例中,首先獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),然后將待評價的公眾賬號輸入到回歸模型中,通過回歸模型對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,最后獲取回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。本發(fā)明實(shí)施例中可以從公眾平臺中提取到樣本數(shù)據(jù)來訓(xùn)練得到回歸模型,通過回歸模型可以對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,從而得到待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。由于回歸模型是通過從公眾平臺中提取出的樣本數(shù)據(jù)訓(xùn)練得到,樣本數(shù)據(jù)來源于公眾平臺,公眾平臺中的公眾賬號可以通過該回歸模型進(jìn)行質(zhì)量評價,從而可以實(shí)現(xiàn)對公眾賬號的質(zhì)量做出有效的評價。
【附圖說明】
[0016]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域的技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0017]圖1為本發(fā)明實(shí)施例提供的一種公眾賬號的質(zhì)量評價方法的流程方框示意圖;
[0018]圖2為本發(fā)明實(shí)施例提供的公眾賬號的質(zhì)量評價方法的一種應(yīng)用場景示意圖;
[0019]圖3_a為本發(fā)明實(shí)施例提供的一種公眾賬號的質(zhì)量評價裝置的組成結(jié)構(gòu)示意圖;
[0020]圖3_b為本發(fā)明實(shí)施例提供的另一種公眾賬號的質(zhì)量評價裝置的組成結(jié)構(gòu)示意圖;
[0021]圖3-c為本發(fā)明實(shí)施例提供的一種模型訓(xùn)練模塊的組成結(jié)構(gòu)示意圖;
[0022]圖3-d為本發(fā)明實(shí)施例提供的另一種模型訓(xùn)練模塊的組成結(jié)構(gòu)示意圖;
[0023]圖3-e為本發(fā)明實(shí)施例提供的一種第一模型處理模塊的組成結(jié)構(gòu)示意圖;
[0024]圖4為本發(fā)明實(shí)施例提供的公眾賬號的質(zhì)量評價方法應(yīng)用于服務(wù)器的組成結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0025]本發(fā)明實(shí)施例提供了一種公眾賬號的質(zhì)量評價方法和裝置,用于實(shí)現(xiàn)對公眾賬號的質(zhì)量做出有效的評價。
[0026]為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而非全部實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域的技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0027]本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,以便包含一系列單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于那些單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它單元。
[0028]以下分別進(jìn)行詳細(xì)說明。
[0029]本發(fā)明公眾賬號的質(zhì)量評價方法的一個實(shí)施例,具體可以應(yīng)用于對公眾平臺中的公眾賬號進(jìn)行質(zhì)量評價,該公眾賬號可以是社交網(wǎng)站中的賬號,也可以是游戲場景中的賬號,也可以是支付場景中的賬號,此處不做限定。請參閱圖1所示,本發(fā)明一個實(shí)施例提供的公眾賬號的質(zhì)量評價方法,可以包括如下步驟:
[0030]101、獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)。
[0031]在本發(fā)明實(shí)施例中,首先獲取到可用于預(yù)測公眾賬號質(zhì)量得分的回歸模型,本發(fā)明實(shí)施例采用回歸模型來預(yù)測公眾賬號質(zhì)量得分,該回歸模型的實(shí)現(xiàn)方式可以有多種,例如,邏輯回歸(英文全稱:Logist Regress1n,英文簡稱:LR)模型,也可以是隨機(jī)森林回歸(英文全稱:Random Frorest Regressor,英文簡稱:RFReg)模型,隨機(jī)梯度下降(英文全稱:Stochastic Gradient Descent Regressor,英文簡稱:SGD Reg),支持向量回歸(英文全稱:Support Vector Regress1n,英文簡稱:SVR)模型等,具體實(shí)現(xiàn)方式不做限定。本發(fā)明實(shí)施例中回歸模型通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到,其中,樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)。在公眾平臺中記錄有多個公眾賬號,以及每個公眾賬號產(chǎn)生的指標(biāo)統(tǒng)計數(shù)據(jù),從公眾平臺中提取到樣本數(shù)據(jù),通過該樣本數(shù)據(jù)訓(xùn)練出來的回歸模型可以用于對公眾平臺中的公眾賬號進(jìn)行質(zhì)量評價。
[0032]在本發(fā)明的一些實(shí)施例中,步驟101獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型之前,本發(fā)明實(shí)施例提供的公眾賬號的質(zhì)量評價方法還可以包括如下步驟:
[0033]Al、從公眾平臺中獲取到多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù);
[0034]A2、以多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型。
[0035]其中,公眾平臺中記錄有大量的公眾賬號,可以從這些公眾賬號中選取部分公眾賬號用于樣本數(shù)據(jù),樣本數(shù)據(jù)中除了包括多個公眾賬號,還包括多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),公眾賬號的指標(biāo)統(tǒng)計數(shù)據(jù)是指針對多個指標(biāo)分別從公眾平臺中收集到的與該公眾賬號有關(guān)的數(shù)據(jù)。在實(shí)際應(yīng)用中可以根據(jù)公眾平臺中對公眾賬號設(shè)置的具體指標(biāo)來獲取統(tǒng)計數(shù)據(jù)。獲取到樣本數(shù)據(jù)之后,可以使用回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型。其中,可使用的回歸算法可以有多種,舉例說明如下:可以采用邏輯回歸、支持向量回歸等回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),當(dāng)回歸模型的特征數(shù)據(jù)滿足預(yù)置的條件要求時可以輸出學(xué)習(xí)得到的回歸模型,對于不同的回歸模型可以設(shè)置相應(yīng)的條件要求,此處不做限定。
[0036]在本發(fā)明的一些實(shí)施例中,步驟A2以多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型,具體可以包括如下步驟:
[0037]A20、以多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法分別對多個回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的多個回歸模型。
[0038]也就是說,本發(fā)明實(shí)施例中在模型訓(xùn)練階段可以使用樣本數(shù)據(jù)來訓(xùn)練多個回歸模型,則可以輸出學(xué)習(xí)得到的多個回歸模型。在這種實(shí)現(xiàn)場景下,步驟101獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,具體可以包括如下步驟:
[0039]1010、對多個回歸模型分別進(jìn)行預(yù)測效果評估,從多個回歸模型中選擇出評估效果最好的回歸模型作為獲取到的回歸模型。
[0040]在執(zhí)行步驟A20的實(shí)現(xiàn)場景下,本發(fā)明實(shí)施例可以執(zhí)行步驟1010,對多個回歸模型分別進(jìn)行預(yù)測效果評估,從多個回歸模型中選擇出評估效果最好的回歸模型作為獲取到的回歸模型。其中,可以使用效果評估方法來對多個回歸模型分別進(jìn)行評估,例如可以使用的效果評估方法是最小均方誤差(英文全稱:Mean squared error,英文簡稱:MSE),也可以采用平方相關(guān)系數(shù)(英文名稱:Squared Correlat1n Coefficient),具體此處不做限定。從多個回歸模型中選擇出的回歸模型可以作為后續(xù)步驟102中預(yù)測評分所用的模型。通過多個回歸模型的選擇,可以使用評估效果最好的回歸模型,從而提高對公眾賬號的質(zhì)量評分預(yù)測的準(zhǔn)確性。
[0041]在本發(fā)明的一些實(shí)施例中,公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)可以包括:運(yùn)營指標(biāo)統(tǒng)計數(shù)據(jù)、粉絲指標(biāo)統(tǒng)計數(shù)據(jù)、文章指標(biāo)統(tǒng)計數(shù)據(jù)和互動指標(biāo)統(tǒng)計數(shù)據(jù)。其中,運(yùn)營指標(biāo)統(tǒng)計數(shù)據(jù)是指從公眾平臺針對平臺運(yùn)營所設(shè)置的運(yùn)營指標(biāo)中收集到的數(shù)據(jù),該運(yùn)營指標(biāo)可以指的是公眾賬號的文章原創(chuàng)度、抄襲比例等,運(yùn)營指標(biāo)可以根據(jù)公眾平臺的具體實(shí)現(xiàn)來配置。粉絲指標(biāo)統(tǒng)計數(shù)據(jù)是指公眾平臺中從公眾賬號的粉絲指標(biāo)中收集到的數(shù)據(jù),粉絲指標(biāo)可以指的是公眾賬號所擁有的粉絲數(shù)據(jù),例如粉絲數(shù)量、粉絲的等級分布、粉絲的活躍程度等。文章指標(biāo)統(tǒng)計數(shù)據(jù)可以指的是從公眾平臺針對公眾賬號設(shè)置的文章指標(biāo)收集到的數(shù)據(jù),該文章指標(biāo)可以指的是公眾賬號的文章發(fā)表數(shù)據(jù)、文章被閱讀的數(shù)據(jù)、文章被轉(zhuǎn)發(fā)的數(shù)據(jù)等?;又笜?biāo)統(tǒng)計數(shù)據(jù)可以指的是從公眾平臺中公眾賬號和粉絲的互動指標(biāo)收集到的數(shù)據(jù),例如公眾賬號發(fā)送的消息數(shù)據(jù)、粉絲留言的消息數(shù)據(jù)等。針對上述描述的運(yùn)營指標(biāo)、粉絲指標(biāo)、文章指標(biāo)、互動指標(biāo)分別收集到的數(shù)據(jù)可以構(gòu)成公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)。
[0042]在本發(fā)明的另一些實(shí)施例中,公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)可以包括:粉絲對公眾賬號的上行行為指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號支付指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號對粉絲的下行消息指標(biāo)統(tǒng)計數(shù)據(jù)。其中,上行行為指標(biāo)統(tǒng)計數(shù)據(jù)指的是從公眾平臺中粉絲主動執(zhí)行的行為,例如粉絲發(fā)送消息給公眾賬號,粉絲閱讀公眾賬號發(fā)表的文章,粉絲轉(zhuǎn)發(fā)公眾賬號發(fā)表的文章等。公眾賬號支付指標(biāo)統(tǒng)計數(shù)據(jù)指的是公眾平臺中粉絲給公眾賬號轉(zhuǎn)賬的支付數(shù)據(jù),下行消息指標(biāo)統(tǒng)計數(shù)據(jù)指的是公眾平臺中公眾賬號為粉絲回復(fù)的消息數(shù)據(jù)。針對上述描述的上行行為指標(biāo)、支付指標(biāo)、下行消息指標(biāo)分別收集到的數(shù)據(jù)可以構(gòu)成公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)。
[0043]需要說明的是,在實(shí)際應(yīng)用中,公眾平臺中記錄的公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)可以有多種實(shí)現(xiàn)方式,具體取決于公眾平臺對公眾賬號的具體配置。舉例說明如下,在社交應(yīng)用的公眾平臺中,可以從公眾平臺上收集公眾賬號及其粉絲數(shù)據(jù)及粉絲對該公眾賬號的閱讀文章、點(diǎn)擊菜單、發(fā)送消息等指標(biāo)統(tǒng)計數(shù)據(jù)、該公眾賬號發(fā)送及接收消息數(shù)據(jù)、該公眾賬號發(fā)表的文章被閱讀或者轉(zhuǎn)發(fā)的數(shù)據(jù)、對應(yīng)粉絲通過該公眾賬號進(jìn)行支付行為的數(shù)據(jù)等等相關(guān)指標(biāo)等統(tǒng)計數(shù)據(jù)。
[0044]在本發(fā)明的一些實(shí)施例中,步驟A2以多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型,具體可以包括如下步驟:
[0045]A21、將樣本數(shù)據(jù)分為兩類,得到訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),訓(xùn)練樣本數(shù)據(jù)包括:訓(xùn)練公眾賬號以及訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),測試樣本數(shù)據(jù)包括:測試公眾賬號以及測試公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),其中,從公眾平臺獲取到的多個公眾賬號分為兩類:訓(xùn)練公眾賬號和測試公眾賬號;
[0046]A22、使用訓(xùn)練樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),根據(jù)回歸模型的第一特征數(shù)據(jù)對回歸模型進(jìn)行預(yù)測優(yōu)化后輸出訓(xùn)練完成的回歸模型;
[0047]A23、使用測試樣本數(shù)據(jù),通過回歸算法對訓(xùn)練完成的回歸模型進(jìn)行特征工程分析得到回歸模型的第二特征數(shù)據(jù),根據(jù)回歸模型的第二特征數(shù)據(jù)對回歸模型進(jìn)行評測優(yōu)化后輸出學(xué)習(xí)得到的回歸模型。
[0048]其中,在步驟A21中,首先將樣本數(shù)據(jù)分為兩類,得到訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),訓(xùn)練樣本數(shù)據(jù)是用來訓(xùn)練回歸模型的,測試樣本數(shù)據(jù)是回歸模型要識別的對象,在實(shí)際應(yīng)用中,可以按照數(shù)據(jù)比例來劃分樣本數(shù)據(jù),將樣本數(shù)據(jù)分為訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),例如,可以將總樣本數(shù)的70%-75%的樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),其余的樣本數(shù)據(jù)作為測試樣本數(shù)據(jù)。
[0049]對樣本數(shù)據(jù)進(jìn)行分類后,首先對訓(xùn)練樣本數(shù)據(jù)執(zhí)行步驟A22,使用訓(xùn)練樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),根據(jù)回歸模型的第一特征數(shù)據(jù)對回歸模型進(jìn)行預(yù)測優(yōu)化后輸出訓(xùn)練完成的回歸模型。其中,特征工程是將原始數(shù)據(jù)轉(zhuǎn)化為特征,更好表示預(yù)測模型處理的實(shí)際問題,提升對于未知數(shù)據(jù)的準(zhǔn)確性。它是用目標(biāo)問題所在的公眾賬號知識或者自動化的方法來生成、提取、刪減或者組合變化得到特征。本發(fā)明實(shí)施例中,對訓(xùn)練樣本數(shù)據(jù)進(jìn)行特征工程分析之后,可以得到回歸模型的第一特征數(shù)據(jù),該第一特征數(shù)據(jù)是通過回歸算法對訓(xùn)練樣本數(shù)據(jù)進(jìn)行分析后的特征向量,然后根據(jù)回歸模型的第一特征數(shù)據(jù)對回歸模型進(jìn)行預(yù)測優(yōu)化后輸出訓(xùn)練完成的回歸模型,具體的預(yù)測優(yōu)化方式可以結(jié)合采用的回歸算法和回歸模型來完成。
[0050]進(jìn)一步的,在本發(fā)明的一些實(shí)施例中,步驟A22使用訓(xùn)練樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),具體可以包括如下步驟:
[0051]A221、對訓(xùn)練樣本數(shù)據(jù)中訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)按照特征重要性進(jìn)行篩選分析,將篩選出來的特征數(shù)據(jù)寫入質(zhì)量特征列表;
[0052]A222、判斷質(zhì)量特征列表中的特征數(shù)據(jù)在歷史時間段內(nèi)是否發(fā)生變化,將質(zhì)量特征列表中按照穩(wěn)定性從高到低輸出的特征數(shù)據(jù)作為回歸模型的第一特征數(shù)據(jù)。
[0053]其中,在訓(xùn)練回歸模型時,可以對訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)按照特征重要性進(jìn)行篩選分析,按照重要程度可以將篩選出來的特征數(shù)據(jù)寫入質(zhì)量特征列表中,在質(zhì)量特征列表中可以包括多個特征數(shù)據(jù),然后再對質(zhì)量特征列表中的特征數(shù)據(jù)進(jìn)行穩(wěn)定性分析,例如可以設(shè)置一個歷史時間段,從公眾平臺中觀察質(zhì)量特征列表中的特征數(shù)據(jù)是否發(fā)變化,將質(zhì)量特征列表中按照穩(wěn)定性從高到低輸出的特征數(shù)據(jù)作為回歸模型的第一特征數(shù)據(jù)。本發(fā)明實(shí)施例中通過對收集的特征數(shù)據(jù)按照重要性分析、穩(wěn)定性分析等過程進(jìn)行特征篩選,最后得到的質(zhì)量特征列表中可以保留對最終分值預(yù)測有幫助的特征數(shù)據(jù)。
[0054]在輸出通過訓(xùn)練樣本數(shù)據(jù)訓(xùn)練完成的回歸模型之后,可以執(zhí)行步驟A23,用訓(xùn)練完成的回歸模型對測試樣本數(shù)據(jù)進(jìn)行測試。具體的,可以使用測試樣本數(shù)據(jù),通過回歸算法對訓(xùn)練完成的回歸模型進(jìn)行特征工程分析得到回歸模型的第二特征數(shù)據(jù),根據(jù)回歸模型的第二特征數(shù)據(jù)對回歸模型進(jìn)行評測優(yōu)化后輸出學(xué)習(xí)得到的回歸模型。該第二特征數(shù)據(jù)是通過回歸算法對測試樣本數(shù)據(jù)進(jìn)行分析后的特征向量,然后根據(jù)回歸模型的第二特征數(shù)據(jù)對回歸模型進(jìn)行評測優(yōu)化后輸出學(xué)習(xí)得到的回歸模型,,具體的預(yù)測優(yōu)化方式可以結(jié)合采用的回歸算法和回歸模型來完成。
[0055]在本發(fā)明的一些實(shí)施例中,步驟A22使用訓(xùn)練樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù)之前,本發(fā)明實(shí)施例提供的公眾賬號的質(zhì)量評價方法還可以包括如下步驟:
[0056]B1、對訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)標(biāo)注,得到標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和標(biāo)注后的測試樣本數(shù)據(jù);
[0057]B2、對標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和標(biāo)注后的測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)篩選。
[0058]其中,在對樣本數(shù)據(jù)進(jìn)行分類得到訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)之后,可以按照訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)標(biāo)注,以從訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)分別標(biāo)注出數(shù)據(jù),然后針對訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)篩選。舉例說明如下,對于標(biāo)注好的公眾賬號可以按照O?100分各個分?jǐn)?shù)范圍按照相同比例進(jìn)行篩選,從而可以有效的保證樣本均衡,例如共篩選出訓(xùn)練樣本數(shù)據(jù)大約2萬條,篩選出測試樣本數(shù)據(jù)大約I萬多條。
[0059]在本發(fā)明的一些實(shí)施例中,公眾賬號可以包括:訂閱型公眾賬號和服務(wù)型公眾賬號。例如,運(yùn)營主體是組織(比如企業(yè)、媒體、公益組織)的,可以申請服務(wù)型公眾賬號,運(yùn)營主體是組織和個人的可以申請訂閱型公眾賬號。則在數(shù)據(jù)標(biāo)注和篩選的過程中可以分別按照訂閱型公眾賬號和服務(wù)型公眾賬號進(jìn)行數(shù)據(jù)標(biāo)注和篩選,從而實(shí)現(xiàn)樣本數(shù)據(jù)的均衡。
[0060]102、將待評價的公眾賬號輸入到回歸模型中,通過回歸模型對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測。
[0061 ]在本發(fā)明實(shí)施例中,獲取到通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型之后,該回歸模型可以用于公眾賬號的質(zhì)量預(yù)測,通過前述步驟的描述可知,回歸模型通過樣本數(shù)據(jù)使用回歸算法進(jìn)行訓(xùn)練,該樣本數(shù)據(jù)的數(shù)據(jù)來源是公眾平臺中的多個公眾賬號,完成訓(xùn)練后的回歸模型可以識別出具體的公眾賬號的質(zhì)量高低。具體的,將待評價的公眾賬號輸入到回歸模型中,則通過該回歸模型中的特征數(shù)據(jù)可以對該評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測。其中,待評價的公眾賬號可以是一個公眾賬號,也可以指的是多個公眾賬號,此時可以通過回歸模型對多個待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測。
[0062]103、獲取回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。
[0063]在本發(fā)明實(shí)施例中,通過步驟102回歸模型對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測后,可以將回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。例如,回歸模型預(yù)測后輸出的分?jǐn)?shù)值的取值區(qū)間為從O到100,每個待評價的公眾賬號通過回歸模型預(yù)測后輸出的分?jǐn)?shù)值按照從高到低進(jìn)行排序,分?jǐn)?shù)值越高的公眾賬號代表其質(zhì)量越高。
[0064]通過以上實(shí)施例對本發(fā)明實(shí)施例的描述可知,首先獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),然后將待評價的公眾賬號輸入到回歸模型中,通過回歸模型對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,最后獲取回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。本發(fā)明實(shí)施例中可以從公眾平臺中提取到樣本數(shù)據(jù)來訓(xùn)練得到回歸模型,通過回歸模型可以對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,從而得到待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。由于回歸模型是通過從公眾平臺中提取出的樣本數(shù)據(jù)訓(xùn)練得到,樣本數(shù)據(jù)來源于公眾平臺,公眾平臺中的公眾賬號可以通過該回歸模型進(jìn)行質(zhì)量評價,從而可以實(shí)現(xiàn)對公眾賬號的質(zhì)量做出有效的評價。
[0065]為便于更好的理解和實(shí)施本發(fā)明實(shí)施例的上述方案,下面舉例相應(yīng)的應(yīng)用場景來進(jìn)行具體說明。
[0066]隨著公眾賬號平臺的商業(yè)化進(jìn)程的開展,具有優(yōu)質(zhì)文章質(zhì)量、高活躍粉絲等等特征的高質(zhì)量公眾賬號在很多業(yè)務(wù)比如像廣告投放、商業(yè)營銷、征信業(yè)務(wù)等等均有需求并使用到,而高質(zhì)量的公眾賬號更能達(dá)到事倍功半的效果,因此高質(zhì)量的公眾賬號挖掘迫在眉急,本發(fā)明實(shí)施例中可以將公眾賬號的質(zhì)量打通過回歸模型來實(shí)現(xiàn),并通過公眾平臺上的一些指標(biāo)統(tǒng)計數(shù)據(jù)(比如每周發(fā)布文章數(shù)、文章被閱讀比例、活躍粉絲等等)進(jìn)行再加工處理匯總成各個瑋度的特征數(shù)據(jù),并利用機(jī)器學(xué)習(xí)模型進(jìn)行質(zhì)量打分。其中,指標(biāo)統(tǒng)計數(shù)據(jù)可以包括:從公眾平臺上收集公眾賬號及其粉絲數(shù)據(jù)及粉絲對該公眾賬號的閱讀文章、點(diǎn)擊菜單、發(fā)送消息、該公眾賬號發(fā)送及接收消息數(shù)據(jù)、該公眾賬號發(fā)表的文章被閱讀或者轉(zhuǎn)發(fā)的數(shù)據(jù)、對應(yīng)粉絲通過該公眾賬號進(jìn)行支付行為的數(shù)據(jù)等等相關(guān)運(yùn)營指標(biāo)等統(tǒng)計數(shù)據(jù)。
[0067]請參閱圖2所示,為本發(fā)明實(shí)施例提供的公眾賬號的質(zhì)量評價方法的一種應(yīng)用場景示意圖。本發(fā)明實(shí)施例中可以將公眾賬號的質(zhì)量評分問題通過機(jī)器學(xué)習(xí)中的回歸模型來實(shí)現(xiàn),結(jié)合公眾平臺標(biāo)注出的數(shù)據(jù),利用回歸算法如邏輯回歸、支持向量回歸等等首先訓(xùn)練出回歸模型,最終實(shí)現(xiàn)對每個公眾賬號進(jìn)行分?jǐn)?shù)預(yù)測打分,分?jǐn)?shù)值范圍可以為[0,100],其中,分?jǐn)?shù)值越高越好代表該公眾賬號的質(zhì)量越好越優(yōu)質(zhì),其中O分為最差,100分為最好。整個回歸模型框架如圖2所示,可以分為:前期公眾賬號數(shù)據(jù)準(zhǔn)備分析、訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)的標(biāo)注以及篩選、特征工程分析、模型預(yù)測及評測優(yōu)化、結(jié)果預(yù)測等幾個步驟。其中,機(jī)器學(xué)習(xí)中需要對收集的特征進(jìn)行按照重要性分析、穩(wěn)定性分析等過程進(jìn)行特征篩選,從而得到對最終結(jié)果有幫助的特征。
[0068]如圖2所示,在本發(fā)明實(shí)施例提供的公眾賬號的質(zhì)量挖掘框架中,訓(xùn)練樣本數(shù)據(jù)首先對回歸模型進(jìn)行人工特征工程分析,從而完成對回歸模型的訓(xùn)練,測試樣本數(shù)據(jù)也對回歸模型進(jìn)行人工特征工程分析,從而完成對回歸模型的評測,接下來再對該回歸模型進(jìn)行迭代優(yōu)化,從而確定出回歸模型的特征數(shù)據(jù)。該回歸模型可以用于對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,然后輸出預(yù)測結(jié)果。
[0069]在本發(fā)明實(shí)施例中,樣本數(shù)據(jù)可以從公眾平臺中來選擇,回歸模型的特征數(shù)據(jù)通過對指標(biāo)統(tǒng)計數(shù)據(jù)進(jìn)行篩選后得到。例如,圖2中用到的基礎(chǔ)特征數(shù)據(jù)來自公眾賬號的底層一些統(tǒng)計數(shù)據(jù),主要有粉絲與公眾賬號的上行行為數(shù)據(jù)、公眾賬號支付數(shù)據(jù)、公眾賬號給粉絲的下行消息數(shù)據(jù)等三大類數(shù)據(jù)。其中,公眾賬號支付數(shù)據(jù)是指粉絲給該公眾賬號支付的數(shù)據(jù)。具體的,指標(biāo)統(tǒng)計數(shù)據(jù)可以包括公眾賬號相關(guān)數(shù)據(jù),以及相關(guān)的屬性信息,主要有公眾賬號粉絲情況、公眾賬號與粉絲上行消息數(shù)據(jù)、公眾賬號支付數(shù)據(jù)、公眾賬號與粉絲下行消息、公眾賬號接口數(shù)據(jù)等等,其中公眾賬號接口數(shù)據(jù)指的是在公眾賬號里面打開的一些外面鏈接數(shù)據(jù)。為增加模型的可信度及魯棒性,在模型訓(xùn)練的時候,同時考慮過去一段時間內(nèi)各類特征的相關(guān)統(tǒng)計數(shù)值。
[0070]在本發(fā)明實(shí)施例中,還可以按照訂閱型公眾賬號和服務(wù)型公眾賬號分別進(jìn)行數(shù)據(jù)標(biāo)注以及模型訓(xùn)練,例如,對于標(biāo)注好的公眾賬號可以按照O?100分各個分?jǐn)?shù)范圍按照相同比例進(jìn)行刷選,這樣保證樣本均衡問題,共篩選出訓(xùn)練樣本數(shù)據(jù)大約2萬條,測試樣本數(shù)據(jù)大約I萬多條。
[0071]需要說明的是,在本發(fā)明實(shí)施例中,可以使用的回歸模型有多種,例如LR模型,也可以是RFReg模型,S⑶Reg模型,SVR模型等,不限定的是,本發(fā)明實(shí)施例中采用的回歸模型還可以是其它可用的模型,比如決策樹及其變體、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等等模型。本發(fā)明實(shí)施例中提到特征數(shù)據(jù)的替換,還可以改用文本、文章等等公眾賬號其它可涉及的數(shù)據(jù)指標(biāo)等等。本發(fā)明實(shí)施例中可以使用機(jī)器學(xué)習(xí)模型,還可以替換成一些人工經(jīng)驗對一些相關(guān)指標(biāo),比如從運(yùn)營指標(biāo)、粉絲指標(biāo)、文章指標(biāo)和互動指標(biāo)這四個大出發(fā)分別計算相關(guān)統(tǒng)計指標(biāo),然后進(jìn)行加權(quán)組合算出最終的分?jǐn)?shù)值來表示這個公眾賬號的質(zhì)量分的方案。另外,本發(fā)明實(shí)施例中標(biāo)注數(shù)據(jù)除了圖2所示的人工進(jìn)行標(biāo)注之外,還可以利用主動學(xué)習(xí)(英文全稱:active I earning)方法進(jìn)行逐步標(biāo)注。例如,每次人工標(biāo)注少量樣本,然后回歸模型利用人工標(biāo)注的樣本進(jìn)行擴(kuò)學(xué)習(xí)更多的樣本,人工再對模型標(biāo)注的樣本進(jìn)行確認(rèn),整個過程不斷持續(xù),直到標(biāo)注樣本達(dá)到足夠數(shù)量。
[0072]通過前述對本發(fā)明的舉例說明可知,本發(fā)明實(shí)施例中利用回歸算法對公眾賬號的指標(biāo)進(jìn)行重要性篩選,并結(jié)合過去一段時間內(nèi)的這些指標(biāo)值的變化情況,匯總成公眾賬號的質(zhì)量特征列表,然后利用回歸模型進(jìn)行訓(xùn)練和預(yù)測,因此更具有魯棒性和穩(wěn)定性。本發(fā)明實(shí)施例產(chǎn)出的高質(zhì)量的公眾賬號有著廣泛的應(yīng)用場景,比如像廣告投放、商業(yè)營銷活動、征信業(yè)務(wù)等等,通常情況下,20%的高質(zhì)量公眾賬號能夠覆蓋80%的用戶群體,因此能夠在這些應(yīng)用場景中往往能達(dá)到事倍功半的效果。
[0073]需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。
[0074]為便于更好的實(shí)施本發(fā)明實(shí)施例的上述方案,下面還提供用于實(shí)施上述方案的相關(guān)裝置。
[0075]請參閱圖3-a所示,本發(fā)明實(shí)施例提供的一種公眾賬號的質(zhì)量評價裝置300,可以包括:模型獲取模塊301、模型預(yù)測模塊302和質(zhì)量評價模塊303,其中,
[0076]模型獲取模塊301,用于獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,所述樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù);
[0077]模型預(yù)測模塊302,用于將待評價的公眾賬號輸入到所述回歸模型中,通過所述回歸模型對所述待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測;
[0078]質(zhì)量評價模塊303,用于獲取所述回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為所述待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。
[0079]在本發(fā)明的一些實(shí)施例中,請參閱圖3-b所示,所述公眾賬號的質(zhì)量評價裝置300,還包括:數(shù)據(jù)獲取模塊304和模型訓(xùn)練模塊305,其中,
[0080]所述數(shù)據(jù)獲取模塊304,用于所述模型獲取模塊301獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型之前,從公眾平臺中獲取到多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù);
[0081]所述模型訓(xùn)練模塊305,用于以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型。
[0082]在本發(fā)明的一些實(shí)施例中,請參閱圖3-c所示,所述模型訓(xùn)練模塊305,包括:
[0083]數(shù)據(jù)分類模塊3051,用于將樣本數(shù)據(jù)分為兩類,得到訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括:訓(xùn)練公眾賬號以及所述訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),所述測試樣本數(shù)據(jù)包括:測試公眾賬號以及所述測試公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),其中,從公眾平臺獲取到的所述多個公眾賬號分為兩類:所述訓(xùn)練公眾賬號和所述測試公眾賬號;
[0084]第一模型處理模塊3052,用于使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),根據(jù)所述回歸模型的第一特征數(shù)據(jù)對所述回歸模型進(jìn)行預(yù)測優(yōu)化后輸出訓(xùn)練完成的回歸模型;
[0085]第二模型處理模塊3053,用于使用所述測試樣本數(shù)據(jù),通過所述回歸算法對所述訓(xùn)練完成的回歸模型進(jìn)行特征工程分析得到回歸模型的第二特征數(shù)據(jù),根據(jù)所述回歸模型的第二特征數(shù)據(jù)對所述回歸模型進(jìn)行評測優(yōu)化后輸出學(xué)習(xí)得到的回歸模型。
[0086]在本發(fā)明的一些實(shí)施例中,請參閱圖3-d所示,相對于圖3-c所示,所述模型訓(xùn)練模塊300,還包括:數(shù)據(jù)標(biāo)注模塊3054和數(shù)據(jù)篩選模塊3055,其中,
[0087]所述數(shù)據(jù)標(biāo)注模塊3054,用于所述第一模型處理模塊3052使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù)之前,對所述訓(xùn)練樣本數(shù)據(jù)和所述測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)標(biāo)注,得到標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和標(biāo)注后的測試樣本數(shù)據(jù);
[0088]所述數(shù)據(jù)篩選模塊3055,用于對所述標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和所述標(biāo)注后的測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)篩選。
[0089]在本發(fā)明的一些實(shí)施例中,請參閱圖3-e所示,所述第一模型處理模塊3052,包括:
[0090]重要性分析模塊30521,用于對所述訓(xùn)練樣本數(shù)據(jù)中所述訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)按照特征重要性進(jìn)行篩選分析,將篩選出來的特征數(shù)據(jù)寫入質(zhì)量特征列表;
[0091]穩(wěn)定性分析模塊30522,用于判斷所述質(zhì)量特征列表中的特征數(shù)據(jù)在歷史時間段內(nèi)是否發(fā)生變化,將所述質(zhì)量特征列表中按照穩(wěn)定性從高到低輸出的特征數(shù)據(jù)作為所述回歸模型的第一特征數(shù)據(jù)。
[0092]在本發(fā)明的一些實(shí)施例中,所述模型訓(xùn)練模塊305,具體用于以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法分別對多個回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的多個回歸模型;
[0093]所述模型獲取模塊301,具體用于對所述多個回歸模型分別進(jìn)行預(yù)測效果評估,從所述多個回歸模型中選擇出評估效果最好的回歸模型作為獲取到的回歸模型。
[0094]在本發(fā)明的一些實(shí)施例中,所述指標(biāo)統(tǒng)計數(shù)據(jù),包括:運(yùn)營指標(biāo)統(tǒng)計數(shù)據(jù)、粉絲指標(biāo)統(tǒng)計數(shù)據(jù)、文章指標(biāo)統(tǒng)計數(shù)據(jù)和互動指標(biāo)統(tǒng)計數(shù)據(jù)。
[0095]在本發(fā)明的一些實(shí)施例中,所述指標(biāo)統(tǒng)計數(shù)據(jù),包括:粉絲對公眾賬號的上行行為指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號支付指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號對粉絲的下行消息指標(biāo)統(tǒng)計數(shù)據(jù)。
[0096]通過以上實(shí)施例對本發(fā)明實(shí)施例的描述可知,首先獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),然后將待評價的公眾賬號輸入到回歸模型中,通過回歸模型對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,最后獲取回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。本發(fā)明實(shí)施例中可以從公眾平臺中提取到樣本數(shù)據(jù)來訓(xùn)練得到回歸模型,通過回歸模型可以對待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測,從而得到待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。由于回歸模型是通過從公眾平臺中提取出的樣本數(shù)據(jù)訓(xùn)練得到,樣本數(shù)據(jù)來源于公眾平臺,公眾平臺中的公眾賬號可以通過該回歸模型進(jìn)行質(zhì)量評價,從而可以實(shí)現(xiàn)對公眾賬號的質(zhì)量做出有效的評價。
[0097]圖4是本發(fā)明實(shí)施例提供的一種服務(wù)器結(jié)構(gòu)示意圖,該服務(wù)器1100可因配置或性能不同而產(chǎn)生比較大的差異,可以包括一個或一個以上中央處理器(central processingunits,CPU) 1122(例如,一個或一個以上處理器)和存儲器1132,一個或一個以上存儲應(yīng)用程序1142或數(shù)據(jù)1144的存儲介質(zhì)1130(例如一個或一個以上海量存儲設(shè)備)。其中,存儲器1132和存儲介質(zhì)1130可以是短暫存儲或持久存儲。存儲在存儲介質(zhì)1130的程序可以包括一個或一個以上模塊(圖示沒標(biāo)出),每個模塊可以包括對服務(wù)器中的一系列指令操作。更進(jìn)一步地,中央處理器1122可以設(shè)置為與存儲介質(zhì)1130通信,在服務(wù)器1100上執(zhí)行存儲介質(zhì)1130中的一系列指令操作。
[0098]服務(wù)器1100還可以包括一個或一個以上電源1126,一個或一個以上有線或無線網(wǎng)絡(luò)接口 1150,一個或一個以上輸入輸出接口 1158,和/或,一個或一個以上操作系統(tǒng)1141,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM等等。
[0099]上述實(shí)施例中由服務(wù)器所執(zhí)行的公眾賬號的質(zhì)量評價方法步驟可以基于該圖4所示的服務(wù)器結(jié)構(gòu)。
[0100]另外需說明的是,以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,本發(fā)明提供的裝置實(shí)施例附圖中,模塊之間的連接關(guān)系表示它們之間具有通信連接,具體可以實(shí)現(xiàn)為一條或多條通信總線或信號線。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實(shí)施。
[0101]通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來實(shí)現(xiàn),當(dāng)然也可以通過專用硬件包括專用集成電路、專用CPU、專用存儲器、專用元器件等來實(shí)現(xiàn)。一般情況下,凡由計算機(jī)程序完成的功能都可以很容易地用相應(yīng)的硬件來實(shí)現(xiàn),而且,用來實(shí)現(xiàn)同一功能的具體硬件結(jié)構(gòu)也可以是多種多樣的,例如模擬電路、數(shù)字電路或?qū)S秒娐返?。但是,對本發(fā)明而言更多情況下軟件程序?qū)崿F(xiàn)是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在可讀取的存儲介質(zhì)中,如計算機(jī)的軟盤,U盤、移動硬盤、只讀存儲器(R0M,Read-0nly Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述的方法。
[0102]綜上所述,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照上述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對上述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項】
1.一種公眾賬號的質(zhì)量評價方法,其特征在于,包括: 獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,所述樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù); 將待評價的公眾賬號輸入到所述回歸模型中,通過所述回歸模型對所述待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測; 獲取所述回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為所述待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型之前,所述方法還包括: 從公眾平臺中獲取到多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù); 以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型,包括: 將樣本數(shù)據(jù)分為兩類,得到訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括:訓(xùn)練公眾賬號以及所述訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),所述測試樣本數(shù)據(jù)包括:測試公眾賬號以及所述測試公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),其中,從公眾平臺獲取到的所述多個公眾賬號分為兩類:所述訓(xùn)練公眾賬號和所述測試公眾賬號; 使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),根據(jù)所述回歸模型的第一特征數(shù)據(jù)對所述回歸模型進(jìn)行預(yù)測優(yōu)化后輸出訓(xùn)練完成的回歸申旲型; 使用所述測試樣本數(shù)據(jù),通過所述回歸算法對所述訓(xùn)練完成的回歸模型進(jìn)行特征工程分析得到回歸模型的第二特征數(shù)據(jù),根據(jù)所述回歸模型的第二特征數(shù)據(jù)對所述回歸模型進(jìn)行評測優(yōu)化后輸出學(xué)習(xí)得到的回歸模型。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù)之前,所述方法還包括: 對所述訓(xùn)練樣本數(shù)據(jù)和所述測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)標(biāo)注,得到標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和標(biāo)注后的測試樣本數(shù)據(jù); 對所述標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和所述標(biāo)注后的測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)篩選。5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),包括: 對所述訓(xùn)練樣本數(shù)據(jù)中所述訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)按照特征重要性進(jìn)行篩選分析,將篩選出來的特征數(shù)據(jù)寫入質(zhì)量特征列表; 判斷所述質(zhì)量特征列表中的特征數(shù)據(jù)在歷史時間段內(nèi)是否發(fā)生變化,將所述質(zhì)量特征列表中按照穩(wěn)定性從高到低輸出的特征數(shù)據(jù)作為所述回歸模型的第一特征數(shù)據(jù)。6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型,包括: 以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法分別對多個回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的多個回歸模型; 所述獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,包括: 對所述多個回歸模型分別進(jìn)行預(yù)測效果評估,從所述多個回歸模型中選擇出評估效果最好的回歸模型作為獲取到的回歸模型。7.根據(jù)權(quán)利要求1至6中任一項所述的方法,其特征在于,所述指標(biāo)統(tǒng)計數(shù)據(jù),包括:運(yùn)營指標(biāo)統(tǒng)計數(shù)據(jù)、粉絲指標(biāo)統(tǒng)計數(shù)據(jù)、文章指標(biāo)統(tǒng)計數(shù)據(jù)和互動指標(biāo)統(tǒng)計數(shù)據(jù)。8.根據(jù)權(quán)利要求1至6中任一項所述的方法,其特征在于,所述指標(biāo)統(tǒng)計數(shù)據(jù),包括:粉絲對公眾賬號的上行行為指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號支付指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號對粉絲的下行消息指標(biāo)統(tǒng)計數(shù)據(jù)。9.一種公眾賬號的質(zhì)量評價裝置,其特征在于,包括: 模型獲取模塊,用于獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型,所述樣本數(shù)據(jù)包括:公眾平臺中的多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù); 模型預(yù)測模塊,用于將待評價的公眾賬號輸入到所述回歸模型中,通過所述回歸模型對所述待評價的公眾賬號進(jìn)行分?jǐn)?shù)值預(yù)測; 質(zhì)量評價模塊,用于獲取所述回歸模型預(yù)測后輸出的分?jǐn)?shù)值作為所述待評價的公眾賬號的質(zhì)量分?jǐn)?shù)。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述公眾賬號的質(zhì)量評價裝置,還包括:數(shù)據(jù)獲取模塊和模型訓(xùn)練模塊,其中, 所述數(shù)據(jù)獲取模塊,用于所述模型獲取模塊獲取通過回歸算法從樣本數(shù)據(jù)中學(xué)習(xí)得到的回歸模型之前,從公眾平臺中獲取到多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù); 所述模型訓(xùn)練模塊,用于以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法對回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的回歸模型。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述模型訓(xùn)練模塊,包括: 數(shù)據(jù)分類模塊,用于將樣本數(shù)據(jù)分為兩類,得到訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),所述訓(xùn)練樣本數(shù)據(jù)包括:訓(xùn)練公眾賬號以及所述訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),所述測試樣本數(shù)據(jù)包括:測試公眾賬號以及所述測試公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù),其中,從公眾平臺獲取到的所述多個公眾賬號分為兩類:所述訓(xùn)練公眾賬號和所述測試公眾賬號; 第一模型處理模塊,用于使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù),根據(jù)所述回歸模型的第一特征數(shù)據(jù)對所述回歸模型進(jìn)行預(yù)測優(yōu)化后輸出訓(xùn)練完成的回歸模型; 第二模型處理模塊,用于使用所述測試樣本數(shù)據(jù),通過所述回歸算法對所述訓(xùn)練完成的回歸模型進(jìn)行特征工程分析得到回歸模型的第二特征數(shù)據(jù),根據(jù)所述回歸模型的第二特征數(shù)據(jù)對所述回歸模型進(jìn)行評測優(yōu)化后輸出學(xué)習(xí)得到的回歸模型。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述模型訓(xùn)練模塊,還包括:數(shù)據(jù)標(biāo)注模塊和數(shù)據(jù)篩選模塊,其中, 所述數(shù)據(jù)標(biāo)注模塊,用于所述第一模型處理模塊使用所述訓(xùn)練樣本數(shù)據(jù),通過回歸算法對所述回歸模型進(jìn)行特征工程分析得到回歸模型的第一特征數(shù)據(jù)之前,對所述訓(xùn)練樣本數(shù)據(jù)和所述測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)標(biāo)注,得到標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和標(biāo)注后的測試樣本數(shù)據(jù); 所述數(shù)據(jù)篩選模塊,用于對所述標(biāo)注后的訓(xùn)練樣本數(shù)據(jù)和所述標(biāo)注后的測試樣本數(shù)據(jù)分別進(jìn)行數(shù)據(jù)篩選。13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第一模型處理模塊,包括: 重要性分析模塊,用于對所述訓(xùn)練樣本數(shù)據(jù)中所述訓(xùn)練公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)按照特征重要性進(jìn)行篩選分析,將篩選出來的特征數(shù)據(jù)寫入質(zhì)量特征列表; 穩(wěn)定性分析模塊,用于判斷所述質(zhì)量特征列表中的特征數(shù)據(jù)在歷史時間段內(nèi)是否發(fā)生變化,將所述質(zhì)量特征列表中按照穩(wěn)定性從高到低輸出的特征數(shù)據(jù)作為所述回歸模型的第一特征數(shù)據(jù)。14.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述模型訓(xùn)練模塊,具體用于以所述多個公眾賬號以及所述多個公眾賬號對應(yīng)的指標(biāo)統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),通過回歸算法分別對多個回歸模型進(jìn)行訓(xùn)練學(xué)習(xí),輸出學(xué)習(xí)得到的多個回歸模型; 所述模型獲取模塊,具體用于對所述多個回歸模型分別進(jìn)行預(yù)測效果評估,從所述多個回歸模型中選擇出評估效果最好的回歸模型作為獲取到的回歸模型。15.根據(jù)權(quán)利要求9至14中任一項所述的裝置,其特征在于,所述指標(biāo)統(tǒng)計數(shù)據(jù),包括:運(yùn)營指標(biāo)統(tǒng)計數(shù)據(jù)、粉絲指標(biāo)統(tǒng)計數(shù)據(jù)、文章指標(biāo)統(tǒng)計數(shù)據(jù)和互動指標(biāo)統(tǒng)計數(shù)據(jù)。16.根據(jù)權(quán)利要求9至14中任一項所述的裝置,其特征在于,所述指標(biāo)統(tǒng)計數(shù)據(jù),包括:粉絲對公眾賬號的上行行為指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號支付指標(biāo)統(tǒng)計數(shù)據(jù)、公眾賬號對粉絲的下行消息指標(biāo)統(tǒng)計數(shù)據(jù)。
【文檔編號】G06F17/27GK105824806SQ201610420186
【公開日】2016年8月3日
【申請日】2016年6月13日
【發(fā)明人】陳明星, 陳謙, 萬偉
【申請人】騰訊科技(深圳)有限公司