本發(fā)明涉及網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)預(yù)測(cè)領(lǐng)域,尤其涉及一種面向網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)方法和裝置。
背景技術(shù):
1、業(yè)務(wù)量是衡量網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)發(fā)展和運(yùn)營(yíng)狀況的重要指標(biāo),也是平臺(tái)未來(lái)戰(zhàn)略規(guī)劃的依據(jù)。網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量與用戶需求、政策調(diào)整、公共事件等因素密切相關(guān),具有一定的波動(dòng)性和間歇性。例如,節(jié)假日期間公眾辦事需求較少,而在通知發(fā)布或重要事件發(fā)生時(shí),平臺(tái)訪問(wèn)量和辦理量可能激增。
2、通過(guò)準(zhǔn)確的業(yè)務(wù)量預(yù)測(cè),網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)可以優(yōu)化資源配置、精細(xì)化管理運(yùn)營(yíng),及時(shí)調(diào)整運(yùn)行策略,從而提升用戶體驗(yàn)。
3、業(yè)務(wù)量數(shù)據(jù)是一種多變量時(shí)間序列數(shù)據(jù)。當(dāng)前傳統(tǒng)模型,包括:自回歸積分移動(dòng)平均模型(arima)等線性模型已被用于時(shí)間序列預(yù)測(cè)任務(wù),但這些模型忽略了數(shù)據(jù)的非線性特性,實(shí)際數(shù)據(jù)一般不滿足線性和平滑的假設(shè),因此線性模型在實(shí)際應(yīng)用中的精度較低?;跈C(jī)器學(xué)習(xí)的預(yù)測(cè)方法在處理時(shí)間序列數(shù)據(jù),特別是非線性問(wèn)題方面表現(xiàn)突出,例如:支持向量機(jī)(svr)、人工神經(jīng)網(wǎng)絡(luò)(ann)。然而這種方法雖然考慮了非線性特性,對(duì)提高預(yù)測(cè)性能有積極作用,但難以表示不同時(shí)間序列數(shù)據(jù)之間的相關(guān)性和不同時(shí)間步長(zhǎng)之間的依賴關(guān)系,并且隨著數(shù)據(jù)規(guī)模和數(shù)據(jù)屬性的增長(zhǎng),模型的預(yù)測(cè)性能表現(xiàn)不佳。
4、深度學(xué)習(xí)預(yù)測(cè)方法已被應(yīng)用于時(shí)間序列預(yù)測(cè),包括:時(shí)間卷積網(wǎng)絡(luò)(tcn)、長(zhǎng)短期記憶(lstm),此類方法顯示出較高的準(zhǔn)確性,由于它們依賴于復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),可以以更抽象的方式提取更深層的特征,足以捕捉不同時(shí)間步長(zhǎng)之間的長(zhǎng)期依賴關(guān)系和不同時(shí)間序列之間的相關(guān)性,具有更強(qiáng)的建模能力。
5、此后大量基于深度學(xué)習(xí)的時(shí)間預(yù)測(cè)方法被用于多變量時(shí)間序列的預(yù)測(cè)任務(wù)。然而,針對(duì)網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)模型較為少見,并多為單一模型。由于網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量與用戶需求、政策調(diào)整、公共事件等因素密切相關(guān),具有一定的波動(dòng)性和間歇性,單一模型預(yù)測(cè)精度低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種面向網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)方法和裝置,本發(fā)明能夠有效提取業(yè)務(wù)量數(shù)據(jù)中多變量時(shí)間序列數(shù)據(jù)的非線性特征和時(shí)間波動(dòng)性,有效提高業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確率和可靠性,從而幫助網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)可以優(yōu)化資源配置、精細(xì)化管理運(yùn)營(yíng),及時(shí)調(diào)整運(yùn)行策略,以提升用戶體驗(yàn),詳見下文描述:
2、第一方面、一種面向網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)方法,所述方法包括:
3、利用pearson相關(guān)系數(shù),構(gòu)建需要預(yù)測(cè)的業(yè)務(wù)量與網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)業(yè)務(wù)量數(shù)據(jù)集中所有特征變量之間的相關(guān)系數(shù)矩陣,對(duì)輸入變量之間的線性關(guān)系進(jìn)行評(píng)估,確定dabnet模型的輸入變量;
4、基于編碼器dstcn提取多變量時(shí)間序列特征;引入self-attention,對(duì)編碼器dstcn輸出的多變量時(shí)間序列特征進(jìn)行提取、并融合時(shí)間步特征和變量特征,對(duì)編碼器dstcn輸出的對(duì)網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)業(yè)務(wù)量數(shù)據(jù)集提取的時(shí)間步特征與變量特征增加權(quán)重;
5、使用bigru網(wǎng)絡(luò)模型構(gòu)建解碼器bigru,融合self-attention輸出特征獲得預(yù)測(cè)結(jié)果;以網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)業(yè)務(wù)量數(shù)據(jù)集作為模型輸入,利用粒子群優(yōu)化pso對(duì)模型進(jìn)行模型訓(xùn)練及參數(shù)調(diào)優(yōu),確定最優(yōu)的編碼器和解碼器層數(shù),以獲得網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)業(yè)務(wù)量預(yù)測(cè)結(jié)果。
6、其中,所述確定dabnet模型的輸入變量為:
7、利用pearson相關(guān)系數(shù)對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行相關(guān)性分析,挖掘需要預(yù)測(cè)目標(biāo)業(yè)務(wù)量與網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)業(yè)務(wù)量數(shù)據(jù)集各特征變量的相關(guān)性根據(jù)pearson相關(guān)系數(shù)分析的結(jié)果;
8、按關(guān)聯(lián)性數(shù)值篩選得到關(guān)聯(lián)性高于閾值的特征,計(jì)算多個(gè)特征之間的pearson相關(guān)系數(shù),對(duì)輸入變量之間的線性關(guān)系進(jìn)行評(píng)估,將與所要預(yù)測(cè)業(yè)務(wù)量的負(fù)相關(guān)的特征剔除,減少數(shù)據(jù)冗余。
9、其中,所述基于編碼器dstcn提取多變量時(shí)間序列特征為:經(jīng)數(shù)據(jù)預(yù)處理后的網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)數(shù)據(jù)集轉(zhuǎn)化為具有時(shí)間序列的一維矩陣,輸入到dstcn網(wǎng)絡(luò)模型中;
10、其中,dstcn網(wǎng)絡(luò)的計(jì)算方法:
11、
12、d(t)=d1(t)×d2(t)
13、y(t)=relu[d(t)+x(t)]
14、y′(t)=wty(t)+bt
15、式中,x是一維時(shí)間序列,x=x0,x1,x2,…,xt,t是總的時(shí)刻,d表示膨脹因子,k是濾波器大小,d1(t)和d2(t)分別為兩個(gè)通道的擴(kuò)張卷積輸出,d(t)是輸出信息合并結(jié)果,x(t)為輸入的一維時(shí)間序列,y(t)為使用激活函數(shù)relu與原始輸入特征融合結(jié)果,y′(t)為模型經(jīng)過(guò)卷積后的輸出,wt是可學(xué)習(xí)參數(shù),bt是偏移量,xt-d·i是輸入序列中與空洞卷積核運(yùn)算相對(duì)應(yīng)的元素。
16、其中,所述bigru網(wǎng)絡(luò)模型由兩個(gè)獨(dú)立的gru單元組成,一個(gè)按照時(shí)間序列正向處理數(shù)據(jù),另一個(gè)按照時(shí)間序列的逆向處理數(shù)據(jù);通過(guò)這種雙向結(jié)構(gòu),bigru網(wǎng)絡(luò)模型能夠同時(shí)捕捉序列數(shù)據(jù)的前向和后向信息。
17、第二方面、一種面向網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)裝置,所述裝置包括:處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有程序指令,所述處理器調(diào)用存儲(chǔ)器中存儲(chǔ)的程序指令以使裝置執(zhí)行第一方面中的任一項(xiàng)所述的方法。
18、第三方面、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括程序指令,所述程序指令被處理器執(zhí)行時(shí)使所述處理器執(zhí)行第一方面中的任一項(xiàng)所述的方法。
19、本發(fā)明提供的技術(shù)方案的有益效果是:
20、1、本發(fā)明以異構(gòu)編解碼結(jié)構(gòu)為基本框架dabnet,融合了改進(jìn)時(shí)間卷積網(wǎng)絡(luò)dstcn、雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)bigru以及時(shí)間步特征與變量特征注意力機(jī)制self-attention,其中,采用dstcn作為編碼器,提取多變量時(shí)間序列特征,從而更好地捕捉特征數(shù)據(jù)在長(zhǎng)距離上的依賴性;然后利用self-attention提取融合時(shí)間步特征和變量特征,對(duì)特征增加權(quán)重,從而增強(qiáng)模型對(duì)非線性特征和時(shí)間波動(dòng)性特征的理解;最后,使用bigru作為解碼器進(jìn)一步融合特征,以獲得更準(zhǔn)確的網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)數(shù)據(jù)量預(yù)測(cè)結(jié)果;
21、2、本發(fā)明的一個(gè)網(wǎng)絡(luò)是由多層串聯(lián)dstcn構(gòu)成的編碼器,通過(guò)對(duì)tcn的模型結(jié)構(gòu)、信息通道數(shù)、及激活函數(shù)進(jìn)行調(diào)整,得到模型性能更優(yōu)秀的改進(jìn)tcn模型,以更好地捕獲特征數(shù)據(jù)在長(zhǎng)距離上的依賴性;
22、3、本發(fā)明的另一個(gè)網(wǎng)絡(luò)是由bigru和self-attention構(gòu)成的解碼器,self-attention能夠?qū)μ卣髟黾訖?quán)重,增強(qiáng)模型對(duì)非線性特征和時(shí)間波動(dòng)性特征的理解,bigru在面對(duì)較長(zhǎng)的序列輸入時(shí)進(jìn)一步融合特征,以獲得更準(zhǔn)確的網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)數(shù)據(jù)量預(yù)測(cè)結(jié)果,及時(shí)優(yōu)化資源配置、及時(shí)調(diào)整運(yùn)行策略,從而提升用戶體驗(yàn);
23、4、本發(fā)明以均方根誤差(rmse)、均方誤差(mse)、平均絕對(duì)誤差(mae)、對(duì)稱平均絕對(duì)百分比誤差(smape)、標(biāo)準(zhǔn)化絕對(duì)誤差(nae)、決定系數(shù)(r2)和綜合評(píng)估指標(biāo)(ia)共六個(gè)指標(biāo)對(duì)神經(jīng)網(wǎng)絡(luò)框架進(jìn)行效果評(píng)估,實(shí)驗(yàn)表明本發(fā)明泛化性能好、預(yù)測(cè)精度高、誤差小,有效適用于網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)預(yù)測(cè)任務(wù);
24、5、通過(guò)網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)的業(yè)務(wù)量數(shù)據(jù)精確預(yù)測(cè),幫助網(wǎng)絡(luò)業(yè)務(wù)平臺(tái)可以優(yōu)化資源配置、精細(xì)化管理運(yùn)營(yíng),及時(shí)調(diào)整運(yùn)行策略,從而提升用戶體驗(yàn)。