一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法
【專利摘要】本發(fā)明涉及一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法,屬于移動通信【技術(shù)領(lǐng)域】。該方法在傳統(tǒng)時間序列預(yù)測方法的基礎(chǔ)之上,考慮流量特性與社會因素之間的關(guān)聯(lián)性,將流量預(yù)測分為工作日和休息日兩個不同的角度進行:針對任意一天工作日的流量預(yù)測,采用與這一天相關(guān)性最強的兩天流量序列進行組合,并與上一周該天產(chǎn)生的流量序列求平均值,作為工作日流量預(yù)測最終模型;針對任意一天休息日的流量預(yù)測,采用對工作日進行流量尺度補償后,取與這一天相關(guān)性最強的五天的流量序列進行組合,并與上一周該天產(chǎn)生的流量序列求平均值,作為休息日流量預(yù)測最終模型。本方法減小了非相關(guān)天數(shù)產(chǎn)生的流量對預(yù)測準確性的影響,計算量較低,并能夠達到較高的預(yù)測效果。
【專利說明】一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于移動通信【技術(shù)領(lǐng)域】,涉及一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法,特 別是一種將社會因素與時間序列預(yù)測相結(jié)合的移動數(shù)據(jù)流量分析及預(yù)測方法。
【背景技術(shù)】
[0002] 過去幾十年里,移動網(wǎng)絡(luò)以其可移動性、高傳輸速率、易于擴展和良好的性價比等 優(yōu)勢獲得了迅猛的發(fā)展,網(wǎng)絡(luò)中承載的數(shù)據(jù)業(yè)務(wù)流量越來越大,業(yè)務(wù)類型越來越多,流量特 性也越來越復(fù)雜。根據(jù)Cisco統(tǒng)計,2012年,全球移動數(shù)據(jù)流量是2000年的12倍,并預(yù)測 2012年至2017年里,全球移動數(shù)據(jù)流量將增長13倍。此外,統(tǒng)計還表明移動流量已經(jīng)由語 音向多媒體多元化發(fā)展,其中視頻流量占據(jù)全球移動數(shù)據(jù)總流量的三分之二。
[0003] 日益增長的網(wǎng)絡(luò)規(guī)模和用戶需求給移動網(wǎng)絡(luò)帶來了諸多挑戰(zhàn),其中急劇增長的網(wǎng) 絡(luò)流量給當前網(wǎng)絡(luò)架構(gòu)造成了巨大的壓力,同時也降低了用戶體驗。
[0004] 網(wǎng)絡(luò)流量預(yù)測是對網(wǎng)絡(luò)進行有效管理、維護和安全保障的重要手段,通過對歷史 數(shù)據(jù)進行分析,可以了解網(wǎng)絡(luò)的運營環(huán)境以及網(wǎng)絡(luò)服務(wù)狀態(tài)等方面的情況,為網(wǎng)絡(luò)的升級 和改進提供必要的參考。然而,隨著移動網(wǎng)絡(luò)的迅速發(fā)展,終端設(shè)備的不斷增多,網(wǎng)絡(luò)流量 數(shù)據(jù)將呈現(xiàn)大幅度的增長,網(wǎng)絡(luò)流量即將邁向大數(shù)據(jù)時代。在大數(shù)據(jù)流量背景下,終端業(yè)務(wù) 類型的急劇增加導(dǎo)致流量性質(zhì)發(fā)生改變,傳統(tǒng)的流量預(yù)測方法已不適用于當今乃至未來移 動網(wǎng)絡(luò)的分析與預(yù)測。
[0005] 目前,大多數(shù)預(yù)測方法僅從微觀層面、網(wǎng)絡(luò)的角度來探究流量特性變化的原因, 如,終端數(shù)據(jù)包傳輸機制、多樣化業(yè)務(wù)類型以及其產(chǎn)生的相關(guān)協(xié)議是導(dǎo)致流量特性變化的 重要因素。然而,隨著移動網(wǎng)絡(luò)的發(fā)展,流量變化現(xiàn)象的出現(xiàn)并不局限于此,對于宏觀層面 分析流量變化,將流量特性變化與社會因素相關(guān)聯(lián)也是十分必要的。此外,針對流量分析及 預(yù)測提出的方法,如基于神經(jīng)網(wǎng)絡(luò)的預(yù)測方法、小波算法等能夠達到較高的預(yù)測效果,卻因 其結(jié)構(gòu)復(fù)雜、參數(shù)眾多,導(dǎo)致算法收斂速度慢、預(yù)測時間較長而無法用于實際網(wǎng)絡(luò)流量預(yù)測 中,因此對網(wǎng)絡(luò)流量的分析及預(yù)測勢在必行。
【發(fā)明內(nèi)容】
[0006] 有鑒于此,本發(fā)明的目的在于提供一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法,該方 法在傳統(tǒng)時間序列預(yù)測原理基礎(chǔ)之上,考慮流量特性與社會因素之間的關(guān)聯(lián)性,將流量預(yù) 測分為工作日和休息日兩個不同的角度進行。
[0007] 為達到上述目的,本發(fā)明提供如下技術(shù)方案:
[0008] -種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法,該方法在傳統(tǒng)時間序列預(yù)測方法的基礎(chǔ) 之上,考慮流量特性與社會因素之間的關(guān)聯(lián)性,將流量預(yù)測分為工作日和休息日兩個不同 的角度進行:針對任意一天工作日的流量預(yù)測,采用與這一天相關(guān)性最強的兩天流量序列 進行組合,并與上一周該天產(chǎn)生的流量序列求平均值,作為工作日流量預(yù)測最終模型;針對 任意一天休息日的流量預(yù)測,采用對工作日進行流量尺度補償后,取與這一天相關(guān)性最強 的五天的流量序列進行組合,并與上一周該天產(chǎn)生的流量序列求平均值,作為休息日流量 預(yù)測最終模型。
[0009] 進一步,該預(yù)測方法具體包括以下步驟:
[0010] 步驟一:對上一周原始流量數(shù)據(jù)進行采集,形成原始數(shù)據(jù)集;
[0011] 步驟二:將原始數(shù)據(jù)集劃分為工作日數(shù)據(jù)集和休息日數(shù)據(jù)集;
[0012] 步驟三:分析工作日數(shù)據(jù)集和休息日數(shù)據(jù)集之間的相關(guān)性;
[0013] 步驟四:對于工作日的流量預(yù)測,首先,綜合考慮工作日與休息日數(shù)據(jù)集之間的相 關(guān)性,根據(jù)相關(guān)性大小次序,用上一周的流量相關(guān)性組合來表征需要預(yù)測的時間段的流量, 其非連續(xù)時間相關(guān)性組合可以表示為:
【權(quán)利要求】
1. 一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法,其特征在于:該方法在傳統(tǒng)時間序列預(yù)測 方法的基礎(chǔ)之上,考慮流量特性與社會因素之間的關(guān)聯(lián)性,將流量預(yù)測分為工作日和休息 日兩個不同的角度進行:針對任意一天工作日的流量預(yù)測,采用與這一天相關(guān)性最強的兩 天流量序列進行組合,并與上一周該天產(chǎn)生的流量序列求平均值,作為工作日流量預(yù)測最 終模型;針對任意一天休息日的流量預(yù)測,采用對工作日進行流量尺度補償后,取與這一天 相關(guān)性最強的五天的流量序列進行組合,并與上一周該天產(chǎn)生的流量序列求平均值,作為 休息日流量預(yù)測最終模型。
2. 根據(jù)權(quán)利要求1所述的一種移動網(wǎng)絡(luò)數(shù)據(jù)流量分析及預(yù)測方法,其特征在于:該預(yù) 測方法具體包括以下步驟: 步驟一:對上一周原始流量數(shù)據(jù)進行采集,形成原始數(shù)據(jù)集; 步驟二:將原始數(shù)據(jù)集劃分為工作日數(shù)據(jù)集和休息日數(shù)據(jù)集; 步驟三:分析工作日數(shù)據(jù)集和休息日數(shù)據(jù)集之間的相關(guān)性; 步驟四:對于工作日的流量預(yù)測,首先,綜合考慮工作日與休息日數(shù)據(jù)集之間的相關(guān) 性,根據(jù)相關(guān)性大小次序,用上一周的流量相關(guān)性組合來表征需要預(yù)測的時間段的流量,其 非連續(xù)時間相關(guān)性組合可以表示為:
其中,fjt) (t = 1,2, · · ·,n. i = 1,2, · · ·,m)表示在時間 t 上的組合序列 i,yweekdays(t) (t = I, 2,. . . , η)表示A (t)的序列組合;m個序列的組合向量表示為w = (W1, w2,. . . , wm), 并且滿足下面條件: eTw = I ;w ^ O ;eT = (1,1,...,1); 步驟五:對于休息日的流量預(yù)測,采用補償因子來減少工作日和休息日產(chǎn)生的流量的 尺度的差別,補償因子可以由以下公式獲得:
其中,fj (t) (j = 1,2,. . .,5. t = 1,2,. . .,η),表示工作日中第 j 天的序列,fs (t) (t = 1,2,···,η)表示要預(yù)測的星期天數(shù)在上一周產(chǎn)生的流量序列,p(t)是&(〇和仁(〇的比 值; 步驟六:將得到的補償因子用于對工作日流量尺度的補償,從而得到新的流量序列,如 下列公式所給出: fnew_j (t) = CF (t) * f j (t) 其中,表示經(jīng)過補償因子修復(fù)后得到的工作日流量序列,因此,休息日的非連 續(xù)時間相關(guān)性組合表示為:
其中,y_kmdS⑴(t = 1,2,. . .,n)表示相關(guān)天數(shù)產(chǎn)生的流量相關(guān)性組合; 步驟七:通過如下最優(yōu)模型,得到最佳組合:
其中,fk(t)表示需要預(yù)測的序列對應(yīng)上周工作日的流量值,fs(t)表示需要預(yù)測的 序列對應(yīng)上周休息日的流量值,fA,&分別表示fk(t)和4(〇的平均值,y A,^分別表示 Keekdays ⑴和 yweekends(t)的平均值; 步驟八:求解得到最優(yōu)組合向量后,通過以下公式求解流量預(yù)測序列:
其中,P^kdays⑴,Pwedtmds⑴分別表示工作曰和休息曰流量預(yù)測公式。
【文檔編號】H04W24/00GK104394538SQ201410712877
【公開日】2015年3月4日 申請日期:2014年11月28日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】賈云健, 萬貝利, 梁靚 申請人:重慶大學(xué)