一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法
【專利摘要】本發(fā)明屬于網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,具體涉及一種可用于內(nèi)容中心網(wǎng)絡(luò)中數(shù)據(jù)緩存的面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法。本發(fā)明包括:將緩存放置方案編碼為二進制符號串,1代表緩存對象,0代表不緩存對象,隨機產(chǎn)生初始種群;計算每種緩存放置方案的收益值,找出最大收益值存入數(shù)組max;基于個體適應(yīng)度劃分的選擇運算;基于個體相關(guān)性的交叉運算;基于基因塊的變異運算;產(chǎn)生新的種群,即新的緩存放置方案;判斷數(shù)組max是否趨于穩(wěn)定,如果穩(wěn)定,得到最大收益緩存放置。本發(fā)明有效降低了用戶訪問延遲,減少了內(nèi)容重復請求率和網(wǎng)絡(luò)內(nèi)容冗余,增強了網(wǎng)絡(luò)數(shù)據(jù)多樣性,顯著提高了全網(wǎng)緩存性能,具有更高的緩存效率。
【專利說明】—種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,具體涉及一種可用于內(nèi)容中心網(wǎng)絡(luò)中數(shù)據(jù)緩存的面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法。
【背景技術(shù)】
[0002]隨著Internet的迅速發(fā)展,互聯(lián)網(wǎng)在很多方面暴露出問題,如可擴展性方面的問題、動態(tài)性方面的問題以及網(wǎng)絡(luò)安全性問題等等。針對當前互聯(lián)網(wǎng)出現(xiàn)的一系列問題,國內(nèi)外研究者已經(jīng)提出很多的解決方案,包括P2P和CDN等。2009年,施樂公司帕洛阿托研究中心的 Van Jacobson 提出內(nèi)容中心網(wǎng)絡(luò)(Content Centric Network,簡稱 CCN)。
[0003]CCN中每個節(jié)點都設(shè)有緩存空間,采用“經(jīng)過即緩存”策略來緩存數(shù)據(jù)。CCN節(jié)點自身具備的緩存特性雖然有一定的優(yōu)勢,但是這種對內(nèi)容不加區(qū)分地緩存特性容易產(chǎn)生無效緩存,帶來不必要開銷,造成有限的緩存空間內(nèi)大量內(nèi)容冗余,大大降低緩存空間的利用率,從而降低網(wǎng)絡(luò)的緩存性能。
[0004]本發(fā)明將緩存放置問題轉(zhuǎn)化為一個最優(yōu)化問題,對影響緩存性能的幾個因素包括對象被訪問頻率、距離、對象大小等進行綜合考慮,構(gòu)建了一種最大化收益緩存放置模型,稱為Max-Benefit模型。同時,為了使模型中對象被訪問頻率能夠更好地反映對象的熱度情況,本發(fā)明在Max-Benefit模型中引入了預測機制,用對象被訪問頻率的預測值代替實際值,更準確地表示對象被訪問的頻率趨勢,提出基于預測的最大化收益的緩存放置模型(Predict1n based Max-Benefit,簡稱 PB-Max-Benefit)。
[0005]此外,相比于其他求解最優(yōu)化模型的算法,如最小斯坦納樹算法、貪婪算法、動態(tài)規(guī)劃法等,本發(fā)明中使用的遺傳算法運算過程簡單而且并行搜索問題的解。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供一種解決內(nèi)容中心網(wǎng)絡(luò)中因?qū)?nèi)容不加區(qū)分進行緩存而產(chǎn)生無效緩存,帶來不必要開銷,造成有限的緩存空間內(nèi)大量數(shù)據(jù)冗余,大大降低緩存空間的利用率的一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法。
[0007]本發(fā)明的目的是這樣實現(xiàn)的:
[0008](I)將緩存放置方案編碼為二進制符號串,I代表緩存對象,O代表不緩存對象,隨機產(chǎn)生初始種群;
[0009](2)計算每種緩存放置方案的收益值,找出最大收益值存入數(shù)組max ;
[0010](3)基于個體適應(yīng)度劃分的選擇運算;
[0011](4)基于個體相關(guān)性的交叉運算;
[0012](5)基于基因塊的變異運算;
[0013](6)產(chǎn)生新的種群,即新的緩存放置方案;
[0014](7)判斷數(shù)組max是否趨于穩(wěn)定,如果穩(wěn)定,得到最大收益緩存放置;否則重新執(zhí)行步驟⑵。
[0015]步驟(I)中,對于每一種緩存放置方案都對應(yīng)一種0、1編碼串。
[0016]步驟⑵包括:
[0017]計算最大化緩存收益Max-Benefit步驟,其中,為新對象Oi到達節(jié)點Vi,緩存新對象Oi給節(jié)點Vi帶來的收益:
[0018]Max ^ Xi.benefi^
?=1
[0019]其中,Xie {0,1}, Σ?=ι Xi'(free) -f 5126^(^(0))J* size(ο),
[0020]X = {χ1; χ2,...χη} , X1, χ2,..., Xn 對應(yīng)的是節(jié)點 V1, ν2,.., νη 的值,對于對象 ο,Xi = O表示節(jié)點Vi上不對O進行緩存,Xi = I表示節(jié)點Vi上緩存對象O ;
[0021]對象ο,將O緩存在節(jié)點Vi上,所有經(jīng)過Vi對O的請求可以直接從節(jié)點Vi
得到對象O,由節(jié)點Vi緩存對象ο而節(jié)省的訪問開銷稱為緩存對象ο獲得的緩存收益,每個相關(guān)節(jié)點 ' 獲得的收益為:
[0022]
ifΜ
[0023]其中,表示任意相關(guān)節(jié)點Vj上觀察到的對對象O的訪問頻率,(y表示節(jié)點
V1上緩存對象O時,以Vi為新的最近源節(jié)點的節(jié)點Vj請求ο節(jié)省的跳數(shù),size (ο)表示對象ο的大小,w表示傳輸單位大小對象的開銷;
[0024]其他節(jié)點稱為節(jié)點Vi的相關(guān)節(jié)點,節(jié)點Vi的相關(guān)節(jié)點有k個,節(jié)點Vi緩存對象得到的收益為-^mnefit(Vi) = Ι*=1οω ?:...: ^:.y);
[0025]任意與Vi相關(guān)的節(jié)點產(chǎn)生的緩存損耗表示為:
[0026]loss(r,) = fv.(rl?i(σ))為rsize (ο)).w
[0027]節(jié)點Vi為了緩存對象ο而替換掉對象集合' (°)帶來的緩存損耗表示為
[0028]計算出緩存中各對象被訪問頻率的預測值Gi O),根據(jù)預測值的大小將緩存中
f^(°)的值相對較小的對象替換出緩存;
[0029]緩存新對象Oi給節(jié)點Vi帶來的收益為:
,fsize(fr€e) > sizefo)
[0030]benefit^, = { 0α?η1}εηφφ^ — 1sSbenefit(Vi)f others。
[0031]步驟⑵中影響緩存性能的因素包括:⑴對象被訪問的頻率;(2)由于某個節(jié)點緩存對象而節(jié)省的跳數(shù);(3)對象大小;(4)傳輸單位大小對象的開銷;(5)節(jié)點的存儲開銷。
[0032]本發(fā)明的有益效果在于:
[0033]本發(fā)明的主要內(nèi)容就是要找到對于任意需要被緩存的對象的一個緩存部署,構(gòu)建一種基于預測的最大化收益的緩存放置模型,即PB-Max-Benefit模型,使得在該緩存部署下緩存對象給網(wǎng)絡(luò)帶來的收益最大化。對于任意一個緩存部署,PB-Max-Benefit模型對應(yīng)一個收益值,尋找該模型的一個最大收益值,對應(yīng)的就是一個最大化收益的緩存部署,那么這個緩存部署就是所求的最優(yōu)化緩存放置方案。仿真實驗結(jié)果表明,在不同環(huán)境中PB-Max-benefit的緩存命中率都是最聞的,平均跳數(shù)和無效緩存率都低于其他二種緩存放置策略,有效降低了用戶訪問延遲,減少了內(nèi)容重復請求率和網(wǎng)絡(luò)內(nèi)容冗余,增強了網(wǎng)絡(luò)數(shù)據(jù)多樣性,顯著提高了全網(wǎng)緩存性能,具有更高的緩存效率。
【專利附圖】
【附圖說明】
[0034]圖1是本發(fā)明的總流程圖;
[0035]圖2是本發(fā)明的網(wǎng)絡(luò)拓撲示意圖;
[0036]圖3是本發(fā)明的實驗平臺環(huán)境示意圖;
[0037]圖4是本發(fā)明的簡單請求路徑示意圖;
[0038]圖5是本發(fā)明的對象訪問情況表示意圖;
[0039]圖6是本發(fā)明的緩存大小對緩存命中率的影響示意圖;
[0040]圖7是本發(fā)明的緩存大小對無效緩存率的影響示意圖;
[0041]圖8是本發(fā)明的緩存大小對網(wǎng)絡(luò)平均跳數(shù)的影響示意圖;
[0042]圖9是本發(fā)明的Zipf-1ike偏度參數(shù)α對緩存命中率的影響示意圖;
[0043]圖10是本發(fā)明的Zipf-1ike偏度參數(shù)α對平均跳數(shù)的影響示意圖;
[0044]圖11是本發(fā)明的網(wǎng)絡(luò)規(guī)模對緩存命中率的影響示意圖;
[0045]圖12是本發(fā)明的網(wǎng)絡(luò)規(guī)模對平均跳數(shù)的影響示意圖;
【具體實施方式】
[0046]下面結(jié)合附圖對本發(fā)明做更詳細地描述。
[0047]本發(fā)明要解決的技術(shù)問題是:提供一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法,找到對于任意需要被緩存的對象的一個緩存部署,使得在該緩存部署下緩存對象給網(wǎng)絡(luò)帶來的收益最大化。解決了內(nèi)容中心網(wǎng)絡(luò)中因?qū)?nèi)容不加區(qū)分進行緩存而產(chǎn)生無效緩存,帶來不必要開銷,造成有限的緩存空間內(nèi)大量數(shù)據(jù)冗余,大大降低緩存空間的利用率,從而降低網(wǎng)絡(luò)的緩存性能等問題。
[0048]技術(shù)方案
[0049]本發(fā)明提出了一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法,該策略通過優(yōu)化數(shù)據(jù)請求路徑上緩存副本的部署,減少服務(wù)器負載、用戶訪問延遲和節(jié)省網(wǎng)絡(luò)帶寬,減少網(wǎng)絡(luò)數(shù)據(jù)冗余,增強網(wǎng)絡(luò)數(shù)據(jù)多樣性,從而提高全網(wǎng)的緩存性能。其工作流程如下所示:
[0050]步驟1:將緩存放置方案編碼為二進制符號串(I代表緩存對象,O代表不緩存對象),隨機產(chǎn)生初始種群,即初始緩存放置方案。
[0051]步驟2:計算每種緩存放置方案的收益值,找出最大收益值存入數(shù)組max。
[0052]步驟3:基于個體適應(yīng)度劃分的選擇運算;
[0053]步驟4:基于個體相關(guān)性的交叉運算;
[0054]步驟5:基于基因塊的變異運算;
[0055]步驟6:產(chǎn)生新的種群,即新的緩存放置方案;
[0056]步驟7:判斷數(shù)組max是否趨于穩(wěn)定,如果否,則繼續(xù)步驟2 ;
[0057]步驟8:否則,得到最大收益緩存放置放置。
[0058]其執(zhí)行前提是各緩存節(jié)點上緩存的對象是有效的,并且節(jié)點可定位最近的緩存副本,任意時刻請求可以在距離請求節(jié)點最近的源節(jié)點上得到滿足,各緩存節(jié)點都能獲得當前緩存分布。
[0059]在CCN網(wǎng)絡(luò)中,所有節(jié)點都設(shè)有內(nèi)容存儲表(Content Store,簡稱CS),該數(shù)據(jù)結(jié)構(gòu)作為節(jié)點的緩存空間,用來緩存經(jīng)過該節(jié)點且未被該節(jié)點緩存的所有內(nèi)容,CCN這種緩存特點稱為經(jīng)過即緩存。如圖2所示網(wǎng)絡(luò)拓撲,圖中共有15個節(jié)點,其中V1是請求節(jié)點,S是服務(wù)器,可以用來響應(yīng)所有的請求,Vl->V2->…一 >v6->S是從節(jié)點V1到服務(wù)器S的一條請求路徑。在CCN網(wǎng)絡(luò)中,以V1請求對象Oi為例,該請求和響應(yīng)過程描述如下=V1查看自己的CS中是否有0i,如果有,則該請求得到滿足。否則,將請求轉(zhuǎn)發(fā)到V2,直到請求被轉(zhuǎn)發(fā)到S,請求得到滿足。S收到請求消息,將請求的對象沿著發(fā)送請求的路徑返回給V1,并且在返回路徑的所有節(jié)點上查看它們的CS中是否有Oi,如果有,不作任何處理,如果沒有,則在該節(jié)點的CS中存儲對象Oi的一個副本。
[0060]本發(fā)明研究的主要內(nèi)容就是要在請求路徑上找到對于任意需要被緩存的對象的一個緩存部署,使得在該緩存部署下緩存該對象給網(wǎng)絡(luò)帶來的收益最大化。
[0061]一條路徑上有η個節(jié)點,V = Iv1, V2,..., νη},如果對象ο被緩存到這η個節(jié)點的k 個節(jié)點 V' !,V' 2,...ν' k 上,其中 I ≤ k ≤ n,V' = {V χ,ν' 2,...,ν' k},Ff CF,那么,集合V'中包含的節(jié)點就是該路徑上對于對象ο的一個緩存部署。
[0062]步驟1,對于路徑上的任意一個節(jié)點和一個對象節(jié)點只有兩種狀態(tài),緩存對象或不緩存對象。將緩存放置方案進行編碼,O表示不緩存對象,I表示緩存對象。對于每一種緩存放置方案都對應(yīng)一種O、I編碼串。
[0063]步驟2包括:
[0064]計算最大化緩存收益Max-Benefit步驟,其中,-—,、為新對象0i到達節(jié)點Vi,緩存新對象Oi給節(jié)點Vi帶來的收益。
【權(quán)利要求】
1.一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法,其特征在于: (1)將緩存放置方案編碼為二進制符號串,I代表緩存對象,O代表不緩存對象,隨機產(chǎn)生初始種群,; (2)計算每種緩存放置方案的收益值,找出最大收益值存入數(shù)組max; (3)基于個體適應(yīng)度劃分的選擇運算; (4)基于個體相關(guān)性的交叉運算; (5)基于基因塊的變異運算; (6)產(chǎn)生新的種群,即新的緩存放置方案; (7)判斷數(shù)組max是否趨于穩(wěn)定,如果穩(wěn)定,得到最大收益緩存放置;否則重新執(zhí)行步驟⑵。
2.根據(jù)權(quán)利要求1所述的一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法,其特征在于:所述步驟(1)中,對于每一種緩存放置方案都對應(yīng)一種0、1編碼串。
3.根據(jù)權(quán)利要求1或2所述的一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法,其特征在于,所述步驟(2)包括: 計算最大化緩存收益M ax-Benefit步驟,其中,為新對象0i到達節(jié)點Vi,緩存新對象Oi給節(jié)點Vi帶來的收益:
其中,Xi e {0,1},
(X1, X2,..., xn},對應(yīng)的是節(jié)點V1, V2,..., Vn的值,對于對象O, Xi = O表示節(jié)點Vi上不對O進行緩存,Xi = I表示節(jié)點Vi上緩存對象O ; 對象O,將O緩存在節(jié)點Vi上,所有經(jīng)過V1的請求/ij0),可以直接從節(jié)點Vi得到對象O,由節(jié)點Vi緩存對象O而節(jié)省的訪問開銷稱為緩存對象O獲得的緩存收益,每個相關(guān)節(jié)點Vj獲得的收益為:
其中,Λ?/σ)表示任意相關(guān)節(jié)點Vj上觀察到的對對象O的訪問頻率,<1:表示節(jié)點Vi上緩存對象O時,以Vi為新的最近源節(jié)點的節(jié)點Vj請求ο節(jié)省的跳數(shù),size (ο)表示對象ο的大小,w表示傳輸單位大小對象的開銷; 其他節(jié)點稱為節(jié)點Vi的相關(guān)節(jié)點,節(jié)點Vi的相關(guān)節(jié)點有k個,節(jié)點Vi緩存對象得到的收益為
任意與Vi相關(guān)的節(jié)點產(chǎn)生的緩存損耗表示為:
節(jié)點V i為了緩存對象O而替換掉對象集合% b)帶來的緩存損耗表示為
計算出緩存中各對象被訪問頻率的預測值根據(jù)預測值的大小將緩存中的值相對較小的對象替換出緩存; 緩存新對象Oi給節(jié)點Vi帶來的收益為:
4.根據(jù)權(quán)利要求1所述的一種面向內(nèi)容中心網(wǎng)絡(luò)中基于預測的最優(yōu)化緩存放置方法,其特征在于:所述步驟(2)中影響緩存性能的因素包括:(I)對象被訪問的頻率;(2)由于某個節(jié)點緩存對象而節(jié)省的跳數(shù);(3)對象大??;(4)傳輸單位大小對象的開銷;(5)節(jié)點的存儲開銷。
【文檔編號】G06F12/08GK104166630SQ201410382200
【公開日】2014年11月26日 申請日期:2014年8月6日 優(yōu)先權(quán)日:2014年8月6日
【發(fā)明者】張國印, 邢志靜, 武俊鵬, 董玉增, 劉青, 唐濱, 李曉光 申請人:哈爾濱工程大學