本發(fā)明涉及多車輛路徑規(guī)劃優(yōu)化領域。
背景技術(shù):
1、最短路尋徑問題旨在為道路網(wǎng)絡中多個車輛規(guī)劃其不同起點和終點之間的距離或行駛時間最短的路徑,這類尋徑問題在交通出行、貨物運輸?shù)葌鹘y(tǒng)領域和無人駕駛、自主交通等新興領域有著重要的應用價值。在為車輛規(guī)劃路徑時,如果不考慮車輛之間的合作,則會為多個車輛選擇包含相同路段的路徑,造成交通擁堵,進而影響車輛個體的行駛時間。現(xiàn)有工作主要集中于小范圍區(qū)域內(nèi)的多車輛路徑規(guī)劃,當考慮實際的大規(guī)模路網(wǎng)、大量車輛時,現(xiàn)有方法在求解性能和效率方面存在不足,可擴展性差。
2、實際交通路網(wǎng)中路段、交叉路口、車流會在空間上呈現(xiàn)聚集現(xiàn)象,例如,在一些主要的商業(yè)區(qū)、居民區(qū)附近的路網(wǎng)分布往往更加密集,且流入/流出這些區(qū)域的車流量較大。
3、目前最短路尋徑方法可分為兩類:
4、1.直接求解從起點到終點的完整路徑,這類方法通過傳統(tǒng)的最短路算法如dijkstra算法、a*算法根據(jù)靜態(tài)的路段長度信息或車輛從起點出發(fā)時的路況信息,計算從起點到終點的距離最短或出發(fā)時行駛時間最短的路徑,這類方法計算簡單,但是缺少對車輛之間合作的考慮,為多個起點、終點相近的車輛選擇的路徑會包含多個相同的路段,造成這些路段的擁堵,同時,這類方法不能在車輛的行駛過程中根據(jù)路況變化對車輛的路徑做出適應性的調(diào)整。
5、2.基于下一跳節(jié)點的求解方法則在車輛每到達一個交叉路口后,根據(jù)路況為車輛更新路徑并重新選擇下一跳節(jié)點。這類方法通過強化學習算法為車輛或交叉路口訓練路徑選擇策略,根據(jù)當前的交通狀況為車輛自身或靠近交叉路口的車輛選擇下一跳節(jié)點,能夠根據(jù)路況動態(tài)地調(diào)整路徑選擇結(jié)果,也有通過多智能體強化學習方法建模車輛之間的交互,但是這類方法需要過于頻繁地更新車輛路徑,且智能體數(shù)量隨著車輛數(shù)量、路網(wǎng)規(guī)模增大而顯著增大,求解效率和擴展性差。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有方法在多起點終點的尋徑問題求解方面存在的問題,本發(fā)明將多智能體強化學習技術(shù)應用于這一問題的求解,通過圖劃分算法將原始的路網(wǎng)劃分為多個區(qū)域,并將每個區(qū)域作為智能體。區(qū)域智能體可以獲得區(qū)域內(nèi)車輛的起點、終點信息,并為車輛選擇下一個到達的區(qū)域和到達該區(qū)域經(jīng)過的路徑。通過多智能體強化學習技術(shù),能夠?qū)崿F(xiàn)區(qū)域智能體之間的合作,并且在路徑選擇時,考慮到車輛之間的相互影響,會為終點接近的車輛選擇不同的路徑,從而避免全部選擇同一路徑造成的部分路段的擁堵。
2、技術(shù)方案:
3、基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,將交通系統(tǒng)內(nèi)原始路網(wǎng)劃分為多個區(qū)域,并將每個區(qū)域建模為一個智能體,智能體為區(qū)域內(nèi)的車輛規(guī)劃跨域的路徑,通過強化學習算法學習到自適應、合作式的策略。實現(xiàn)了多車輛間的合作,解決了現(xiàn)有域內(nèi)車輛路徑規(guī)劃方法在可擴展性方面的不足。
4、本發(fā)明利用人工智能技術(shù)為路網(wǎng)上的多車輛尋徑問題給出了新的解決方案,通過強化學習算法訓練路徑選擇策略,能夠提供自適應的、合作式的路徑優(yōu)化算法,避免交通擁堵的發(fā)生,提高路網(wǎng)的吞吐率,并降低車輛的平均行駛時間。本發(fā)明技術(shù)應用前景廣闊,有望在交通出行、貨物運輸、自主交通等領域得到應用。
1.基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,其特征在于,將交通系統(tǒng)內(nèi)原始路網(wǎng)劃分為多個區(qū)域,并將每個區(qū)域建模為一個智能體,智能體為區(qū)域內(nèi)的車輛規(guī)劃跨域的路徑,通過強化學習算法學習到自適應、合作式的策略。
2.如權(quán)利要求1所述的基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,其特征在于,
3.如權(quán)利要求2所述的基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,其特征在于,
4.如權(quán)利要求2所述的基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,其特征在于,
5.如權(quán)利要求2所述的基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,其特征在于,
6.如權(quán)利要求2所述的基于多智能體強化學習的跨域車輛路徑優(yōu)化方法,其特征在于,