本發(fā)明屬于移動(dòng)通信,涉及一種基于isac的車聯(lián)網(wǎng)協(xié)同感知資源分配方法。
背景技術(shù):
1、單個(gè)聯(lián)網(wǎng)自動(dòng)汽車(connected?automatic?vehicles,cav)的感知能力存在固有的局限性,基于車聯(lián)網(wǎng)的協(xié)同感知技術(shù)的出現(xiàn)可以克服這一缺陷,通過(guò)融合多個(gè)cav和rsu的感知數(shù)據(jù),可以大幅擴(kuò)展感知范圍并提高感知準(zhǔn)確性。然而,現(xiàn)有的單層協(xié)同感知方案仍存在一些問(wèn)題。首先是帶寬和計(jì)算能力利用率飽和或不足,早期融合中,過(guò)量的原始數(shù)據(jù)傳輸可能會(huì)導(dǎo)致帶寬飽和而計(jì)算能力未充分利用,后期融合中,本地處理后發(fā)送對(duì)象數(shù)據(jù)可能會(huì)導(dǎo)致計(jì)算能力飽和而帶寬未充分利用,即使是中期融合在動(dòng)態(tài)網(wǎng)絡(luò)條件下,仍存在上述問(wèn)題。其次,對(duì)于單個(gè)cav,其最關(guān)注的路況信息并不是全局的地圖信息而是較近范圍內(nèi)的路況信息,生成完整的全局環(huán)境地圖需要處理大量的感知數(shù)據(jù),給系統(tǒng)的計(jì)算和通信帶來(lái)巨大負(fù)擔(dān),導(dǎo)致整體延遲較高。因此需要設(shè)計(jì)更加靈活高效的協(xié)同感知方案,提高系統(tǒng)性能。
2、通感一體化(integrated?communication?and?sensing,isac)設(shè)備在協(xié)同感知中起著關(guān)鍵作用。這類設(shè)備可以同時(shí)執(zhí)行雷達(dá)感知和通信功能,為協(xié)同感知提供必要的硬件基礎(chǔ)。通過(guò)協(xié)調(diào)雷達(dá)和通信資源的利用,isac設(shè)備能夠在感知和通信之間實(shí)現(xiàn)有效的平衡,為整個(gè)協(xié)同感知系統(tǒng)的性能優(yōu)化提供重要支撐。然而,現(xiàn)有的isac設(shè)備在感知和通信性能平衡以及本地計(jì)算資源利用方面存在一些問(wèn)題。由于感知和通信功能之間存在干擾,很難在二者之間實(shí)現(xiàn)最佳的資源配置。同時(shí),沒(méi)有考慮到車載計(jì)算能力的引入,導(dǎo)致整個(gè)協(xié)同感知過(guò)程中出現(xiàn)較高的時(shí)延。通過(guò)分析不同持續(xù)時(shí)間分配比率對(duì)感知和通信性能的影響,并結(jié)合車載計(jì)算能力,得出了cav和rsu最佳的時(shí)間分配比范圍,可以降低了整個(gè)協(xié)同感知過(guò)程的時(shí)延。為isac設(shè)備在協(xié)同感知場(chǎng)景中的應(yīng)用提供了一種靈活高效的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于isac的車聯(lián)網(wǎng)協(xié)同感知資源分配方法,能夠?qū)崿F(xiàn)對(duì)車聯(lián)網(wǎng)協(xié)同感知資源分配策略的優(yōu)化,降低協(xié)同感知的執(zhí)行延遲。
2、為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于isac的車聯(lián)網(wǎng)協(xié)同感知資源分配方法,其包括以下步驟:
4、s1、在車聯(lián)網(wǎng)場(chǎng)景下構(gòu)建基于相對(duì)位置的多層協(xié)同感知關(guān)心區(qū)域方案;
5、s2、根據(jù)當(dāng)前車輛的感知關(guān)心區(qū)域與路測(cè)單元、其他車聯(lián)網(wǎng)車輛的相對(duì)位置確認(rèn)共同感知者;
6、s3、構(gòu)建基于時(shí)分動(dòng)態(tài)幀結(jié)構(gòu)的通感一體化isac時(shí)間分配方案,獲取共同感知者的雷達(dá)感測(cè)持續(xù)時(shí)間的總感知互信息smi、通信持續(xù)時(shí)間的平均通信速率以及各個(gè)處理方式的執(zhí)行延遲;
7、s4、建立以最小化協(xié)同感知任務(wù)完成延遲為目標(biāo)的感知任務(wù)分配、卸載和計(jì)算資源分配的聯(lián)合問(wèn)題;
8、s5、采用混合動(dòng)作空間的多智能體深度確定性策略梯度算法求解優(yōu)化問(wèn)題得到最小任務(wù)完成延遲的資源分配方案。
9、進(jìn)一步,在步驟s1中,車聯(lián)網(wǎng)場(chǎng)景包括若干車聯(lián)網(wǎng)自動(dòng)車輛cav、若干路測(cè)單元rsu以及若干移動(dòng)邊緣服務(wù)器mes,cav通過(guò)各種傳感器采集車內(nèi)外數(shù)據(jù),沿路部署的若干rsu通過(guò)高速有線鏈路相互連接,每個(gè)rsu均通過(guò)有線鏈路與mes連接;
10、當(dāng)前cav根據(jù)感知關(guān)心區(qū)域中的rsu和其他cav的相對(duì)位置選擇共同感知者,當(dāng)前cav或共同感知者對(duì)于感知數(shù)據(jù)的處理包括本地處理和卸載處理;
11、設(shè)n={1,...,i,...,n}為系統(tǒng)中cav的集合,感知關(guān)心區(qū)域?yàn)閜pac,prsu表示rsu的覆蓋范圍,當(dāng)前車輛v1無(wú)法感知ppac中的所有區(qū)域,將ppac分為p1、pf和pb,p1為v1視野范圍內(nèi)的區(qū)域,pf和pb分別為v1前后的遮擋區(qū)域,則:
12、ppac=p1+pf+pb
13、將三個(gè)區(qū)域的感知任務(wù)分別定義為t1,tf,tb,cav感知關(guān)心區(qū)域的感知任務(wù)表示為:
14、tpac=t1+tf+tb
15、cav進(jìn)行感知任務(wù)處理的方式包括本地處理或者卸載處理。
16、進(jìn)一步,在步驟s2中,將當(dāng)前車輛從當(dāng)前rsu的覆蓋范圍轉(zhuǎn)移到下一個(gè)rsu覆蓋范圍的過(guò)程分為以下五個(gè)階段,每個(gè)階段的共同感知者的選擇范圍為:
17、在第一個(gè)階段,tpac完全處于rsuj的覆蓋范圍,其共同感知者可選擇rsuj和處于pb,pf的cav;
18、
19、vf表示ppac中v1之前的cav,vb表示ppac中v1之后的cav,vf和vb可能有多個(gè)也可能沒(méi)有,vv2v為v1通信范圍內(nèi)的cav集合,uj表示v1當(dāng)前所處范圍的rsuj,uj+1表示v1即將進(jìn)入的rsuj+1;
20、在第二個(gè)階段,tpac的pf部分進(jìn)入rsuj+1的覆蓋范圍,共同感知者可選擇rsuj、rsuj+1和處于pb,pf的cav;
21、
22、在第三個(gè)階段,tpac的pf進(jìn)入rsuj+1的覆蓋范圍,pb未進(jìn)入,其共同感知者可選擇rsuj、rsuj+1和處于pf的cav;
23、
24、在第四個(gè)階段,tpac的pb部分進(jìn)入rsuj+1的覆蓋范圍,其共同感知者可選擇rsuj、rsuj+1和處于pb,pf的cav;
25、
26、在第五個(gè)階段中,tpac的已經(jīng)完全進(jìn)入rsuj+1的覆蓋范圍。其共同感知者可選擇rsuj+1和處于pb,pf的cav;
27、
28、將任務(wù)分配函數(shù)定義為y=ta(x),表明tpac中的協(xié)作任務(wù)分配給y,根據(jù)相對(duì)位置信息,在rsu和cav中選擇一組共同感知者來(lái)協(xié)助v1完成感知任務(wù);設(shè)ω表示選定的共同感知者的集合,其滿足:
29、ω=ta(t1)∪taρ(tf)∪taρ(tb)
30、式中taρ(t1)、taρ(tf)、taρ(tb)分別表示能夠感知t0、tf、tb的感知者,ρ=1,2,3,4,5表示所處的階段。
31、進(jìn)一步,在步驟s3中,首先構(gòu)建包括s個(gè)感測(cè)子幀、p個(gè)計(jì)算子幀和q個(gè)通信子幀的可調(diào)幀格式,每個(gè)周期中有ns個(gè)子幀,設(shè)每個(gè)子幀的持續(xù)時(shí)間為τs,將每個(gè)車輛isac設(shè)備的時(shí)間分配決策描述為χvi={ai,bi,ci},其中,vi∈ωv,ai,bi,ci分別為vi對(duì)應(yīng)的歸一化感知持續(xù)時(shí)間、計(jì)算持續(xù)時(shí)間和感知持續(xù)時(shí)間,ai+bi+ci=1,其中,
32、雷達(dá)探測(cè)過(guò)程中,vi在雷達(dá)感測(cè)持續(xù)時(shí)間ai的平均感知互信息(sensing?mutualinformation,smi)表示為:
33、
34、其中,bi表示為分配給vi的帶寬;為vi的信號(hào)和干擾加噪聲比,其表示為:
35、
36、式中pi是vi的發(fā)射功率,表示路徑傳播增益,nr-rad和nr-com分別表示其他cav對(duì)vi的雷達(dá)信號(hào)造成的雷達(dá)干擾和通信干擾;n0表示熱噪聲功率譜密度。
37、進(jìn)一步,在步驟s3中,通信過(guò)程中,vi在通信持續(xù)時(shí)間ci過(guò)程的總通信數(shù)據(jù)量為:
38、
39、vi在通信持續(xù)時(shí)間ci的平均通信速率為:
40、
41、其中,表示vi通信信號(hào)的信噪比,其表示為:
42、
43、式中,gt和gr表示天線發(fā)射增益和天線接收增益,表示i到j(luò)的通信信道增益,和分別為所受雷達(dá)干擾和所受通信干擾。
44、進(jìn)一步,在步驟s3中,對(duì)于各個(gè)執(zhí)行時(shí)延,將感知任務(wù)描述為li={si,di,τi},si表示感知任務(wù)中需要提取的環(huán)境信息量,di表示處理一位環(huán)境信息需要的cpu周期數(shù),τi表示整個(gè)感知任務(wù)完成的最大可容忍延遲,有:
45、車輛本地處理感知數(shù)據(jù)的執(zhí)行延遲為:
46、
47、式中,表示分配給本地任務(wù)的cpu周期頻率,定義有cav的最高cpu周期頻率滿足
48、車輛卸載到服務(wù)器的執(zhí)行延遲為:
49、
50、式中,為rsuj的最高cpu周期頻率,μvi表示分配給vi的計(jì)算資源的比例。
51、rsu側(cè)的執(zhí)行延遲為:
52、
53、式中,表示uj分配用于任務(wù)處理的計(jì)算資源的比例。
54、進(jìn)一步,在步驟s4中,將協(xié)同感知任務(wù)分配、卸載和計(jì)算資源分配優(yōu)化方案制定為最小化協(xié)同感知任務(wù)處理時(shí)延最小化問(wèn)題,優(yōu)化問(wèn)題表示為:
55、
56、其中為車輛卸載決策,為車輛isac設(shè)備時(shí)間分配比例,為mes為車輛分配的計(jì)算資源比例,ωv表示被選為共同感知者的cav,ωu表示被選為共同感知者的rsu;
57、c1表示選擇共同感知者;c2表示vi和uj的總處理時(shí)間不能超過(guò)最大可容忍延遲;c3表示vi分配的歸一化感知、通信和計(jì)算時(shí)間比例之和為1;c4表示在同一個(gè)周期內(nèi),通信的數(shù)據(jù)量不能超過(guò)感知的數(shù)據(jù)量;c5表示實(shí)際需要的感知、通信和計(jì)算的時(shí)間不大于分配的感知、通信和計(jì)算的時(shí)間;c6表示提供卸載服務(wù)的rsu分配的資源比例之和不大于1。
58、進(jìn)一步,在步驟s5中,將優(yōu)化問(wèn)題轉(zhuǎn)化為馬爾可夫決策過(guò)程,狀態(tài)空間設(shè)置為:
59、
60、其中,b,g,l分別表示mes的剩余計(jì)算資源狀態(tài)、cav和mes之間的通信鏈路的信道增益、cav和mes之間的連接狀態(tài);
61、動(dòng)作空間:
62、以卸載決策βvi、時(shí)間比例分配的離散動(dòng)作和計(jì)算資源分配比例μ的連續(xù)變量共同作為cav的混合動(dòng)作
63、獎(jiǎng)勵(lì):
64、
65、其中β為常數(shù),當(dāng)延遲降低時(shí),獎(jiǎng)勵(lì)增大;
66、訓(xùn)練價(jià)值網(wǎng)絡(luò)的目標(biāo)是最小化狀態(tài)-動(dòng)作價(jià)值函數(shù)的預(yù)測(cè)誤差,假設(shè)每個(gè)cav的參數(shù)為θ={θ1,θ2,,...,θi...,θn},對(duì)每個(gè)cavi,使用目標(biāo)網(wǎng)絡(luò)計(jì)算目標(biāo)值;計(jì)算目標(biāo)動(dòng)作a'j,其中a'j=μ'j(s')表示第j個(gè)智能體在下一狀態(tài)s'j下的目標(biāo)動(dòng)作,j∈{1,2,...,n},則目標(biāo)值為:
67、yi=ri+γq'i(s',ai)
68、其中q'i為cavi的目標(biāo)價(jià)值網(wǎng)絡(luò);
69、通過(guò)最小化均方誤差損失來(lái)更新價(jià)值網(wǎng)絡(luò)參數(shù)θi:
70、
71、其中b為從經(jīng)驗(yàn)回放區(qū)中抽取的一個(gè)批次;
72、訓(xùn)練策略網(wǎng)絡(luò)時(shí),假設(shè)每個(gè)cav的策略網(wǎng)絡(luò)參數(shù)為ω={ω1,ω2,...ωi,...ωn},對(duì)于每個(gè)cavi,使用策略梯度更新策略網(wǎng)絡(luò),策略梯度為:
73、
74、使用梯度上升法更新策略網(wǎng)絡(luò)參數(shù)ωi;
75、對(duì)于價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò)參數(shù),使用軟更新:
76、θi'=τθi'+(1-τ)θi
77、ωi'=τωi'+(1-τ)ωi
78、其中,τ表示軟更新參數(shù)。
79、進(jìn)一步,在步驟s5中,采用混合動(dòng)作空間的多智能體深度確定性策略梯度算法求解優(yōu)化問(wèn)題的具體過(guò)程包括:
80、s51:初始化每個(gè)cav的actor網(wǎng)絡(luò)和critic網(wǎng)絡(luò);
81、s52:在每次迭代中,初始化一個(gè)隨機(jī)進(jìn)程用于動(dòng)作探索,獲取每個(gè)cav的初始觀測(cè)即環(huán)境的初始狀態(tài);
82、s53:在每個(gè)時(shí)隙,根據(jù)當(dāng)前的策略和狀態(tài),每個(gè)cav選擇動(dòng)作并執(zhí)行;
83、s54:在每個(gè)時(shí)隙,所有cav與環(huán)境交互獲得各自的獎(jiǎng)勵(lì)并且跳到下一狀態(tài),將經(jīng)驗(yàn)數(shù)據(jù)儲(chǔ)存在經(jīng)驗(yàn)回放池中;
84、s55:對(duì)每個(gè)cav,從經(jīng)驗(yàn)池中隨機(jī)抽取小批量的樣本;
85、s56:對(duì)每個(gè)cav,計(jì)算critic的目標(biāo)狀態(tài)值,計(jì)算損失函數(shù),并最小化損失來(lái)更新critic網(wǎng)絡(luò),計(jì)算策略梯度,更新actor網(wǎng)絡(luò);
86、s57:完成每個(gè)cav后軟更新價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò)參數(shù),然后返回s53,否則返回s55;
87、s58:完成每個(gè)時(shí)隙后返回s52,否則返回s53;
88、s59:完成迭代后停止,否則返回s52。
89、本發(fā)明的有益效果在于:
90、本發(fā)明針對(duì)現(xiàn)有車聯(lián)網(wǎng)中協(xié)同感知融合方案帶寬和計(jì)算資源利用率飽和或不足、生成全局地圖數(shù)據(jù)量大,以及isac設(shè)計(jì)未能平衡感知和通信性能而導(dǎo)致系統(tǒng)高延遲的問(wèn)題,提出了一種基于isac的車聯(lián)網(wǎng)協(xié)同感知資源分配方案。首先,為減少傳輸數(shù)據(jù)量并合理利用帶寬和計(jì)算資源,提出一種基于相對(duì)位置的多層協(xié)同感知關(guān)心區(qū)域方案。其次,提出基于時(shí)分動(dòng)態(tài)幀結(jié)構(gòu)的isac感知、通信和計(jì)算時(shí)間分配方案,分析不同時(shí)間分配比對(duì)感知和通信互信息(mi)的影響,并根據(jù)cav的計(jì)算能力進(jìn)行時(shí)間分配。本發(fā)明能夠?qū)崿F(xiàn)對(duì)車聯(lián)網(wǎng)協(xié)同感知資源分配策略的優(yōu)化,降低協(xié)同感知的執(zhí)行延遲。
91、本發(fā)明的其他優(yōu)點(diǎn)、目標(biāo)和特征在某種程度上將在隨后的說(shuō)明書中進(jìn)行闡述,并且在某種程度上,基于對(duì)下文的考察研究對(duì)本領(lǐng)域技術(shù)人員而言將是顯而易見的,或者可以從本發(fā)明的實(shí)踐中得到教導(dǎo)。本發(fā)明的目標(biāo)和其他優(yōu)點(diǎn)可以通過(guò)下面的說(shuō)明書來(lái)實(shí)現(xiàn)和獲得。