本發(fā)明屬于智能交通領域,具體涉及基于時空圖卷積網(wǎng)絡的分段迭代長期交通流量預測方法。
背景技術:
1、隨著物聯(lián)網(wǎng)和5g通信技術的快速發(fā)展,人們可以通過各種設備或系統(tǒng)獲得廣泛的交通信息,這推動了智能交通系統(tǒng)的發(fā)展。智能交通系統(tǒng)通擁堵的有效方法,為出行者提供可靠的出行路線,并為城市交通管理提供參考建議。作為智能交通系統(tǒng)領域的一個重要研究課題,使用深度學習方法進行交通流量預測近年來備受關注。通過深度學習方法可以更好地理解隱藏在復雜交通網(wǎng)絡中的隱藏著的信息,極大的提高了我們對交通流預測的準確性。交通流量預測分為短期預測和長期預測,劃分的依據(jù)是根據(jù)回顧窗口和預測范圍的大小。短期交通流量預測使用較短的回顧窗口,即使用少量的歷史數(shù)據(jù)進行預測近期的變化,長期交通流量預測使用較長的回顧窗口,即考慮大量的歷史數(shù)據(jù)來進行長時間的預測。然而,現(xiàn)有的許多研究主要集中在短期交通流量預測上。長期交通流量預測在處理過長的回顧窗口和預測范圍時面臨著挑戰(zhàn)。
技術實現(xiàn)思路
1、針對現(xiàn)有技術中存在的不足,本發(fā)明提供基于時空圖卷積網(wǎng)絡的分段迭代長期交通流量預測方法。本發(fā)明旨在開發(fā)一種新的一種基于時空圖卷積網(wǎng)絡的分段迭代長期交通流預測的深度學習方法來預測路段路網(wǎng)中各個觀測點的車流量,該技術利用時空圖卷積網(wǎng)絡,以期解決上述技術中的難題。
2、基于時空圖卷積網(wǎng)絡的分段迭代長期交通流量預測方法,實現(xiàn)過程如下:
3、步驟(1)空間依賴性建模:
4、將應用場景中涉及的傳感器的實體映射成圖論的節(jié)點權重信息以實現(xiàn)問題模型化,獲取圖模型即加權無向全連通圖,得到加權鄰接矩陣w;
5、步驟(2)時間依賴性建模:
6、基于p時間內的每個傳感器采集得到的交通量得到交通特征矩陣。使用樣本歸一化策略緩解時間序列數(shù)據(jù)的分布偏移問題。
7、步驟(3)編碼階段encoding:
8、將樣本歸一化策略處理后的交通特征矩陣劃分多個分段,作為時空圖卷積網(wǎng)絡的輸入,得到包含空間特征和時間特征的最終隱藏特征。
9、首先將劃分后的交通特征矩陣和加權鄰接矩陣w輸入到空間相關性提取模塊中來提取深層的空間特征,再輸入到時間相關性提取模塊中提取深層的時間特征,最終得到包含空間特征和時間特征的特征隱藏特征hn。
10、步驟(4)解碼階段decoding:
11、利用并行多步預測pmf的方法,基于得到的隱藏特征hn對所有分段進行并行預測,得到各個分段的預測結果,將各個分段的預測結果結合位置嵌入獲得接下來t個時刻的交通信息。
12、步驟5:對基于分段迭代的時空圖卷積網(wǎng)絡模型segt-gcn(encoding+decoding)進行訓練。
13、進一步的,步驟(1)具體方法如下:
14、對于道路網(wǎng)絡上設置的n個傳感器,采用加權無向全連通圖g=(v,e,w)描述道路網(wǎng)絡的拓撲結構,將每個傳感器視為節(jié)點v,v={v_1,v_2,…,v_n}表示傳感器的集合,其中n是節(jié)點的數(shù)量。節(jié)點成對連接,形成一組邊e,e=n*n-1)/2,加權鄰接矩陣w用于表示節(jié)點之間的接近度。
15、為了表示兩點之間的空間相關性,通過等式計算基于高斯相似性的加權鄰接矩陣w,其中節(jié)點i和節(jié)點j之間的權重w(i,j)的計算公式如下:
16、w(i,j)=exp(-dist(i,j)2/σ2)
17、其中dist(i,j)表示節(jié)點i和節(jié)點j之間的距離,鄰域的寬度由距離的標準偏差σ控制。
18、計算加權無向全連通圖中的所有節(jié)點之間的權重從而得到加權鄰接矩陣w。兩點之間的相關性越大,權重越大。加權鄰接矩陣w具體如下:
19、
20、進一步的,步驟(2)具體方法如下:
21、基于p時間內的每個傳感器采集得到的交通量得到交通特征矩陣x∈rn×p,交通特征矩陣x具體如下:
22、
23、其中p表示節(jié)點時間序列特征的數(shù)量(即歷史時間序列的長度),n表示傳感器的數(shù)量。xi∈rn×i,表示在時間i上的每個傳感器上的交通量。
24、使用樣本歸一化策略緩解時間序列數(shù)據(jù)的分布偏移問題。
25、樣本歸一化策略包括從第k個傳感器上采集得到的值中減去序列的最后一個值然后在解碼階段后加回該值,公式如下:
26、
27、其中p表示歷史時間序列的長度,t表示預測的時間序列的長度,k表示第k個傳感器。表示第k個傳感器上采集得到的值。表示對k個傳感器預測得到的值。
28、在定義了加權鄰接矩陣w、交通特征矩陣x之后,交通量預測問題被轉換為學習映射函數(shù)f的問題,通過該映射函數(shù)f能夠計算接下來t個時刻的交通信息,映射函數(shù)f如下式所示:
29、f(w,x)=[xp+1,xp+2,...,xp+t]
30、其中w表示加權鄰接矩陣,x表示交通特征矩陣,xp+1,xp+2,…,xp+t表示接下來t個時刻上每個傳感器上的交通量。
31、進一步地,所述步驟(3)中具體實現(xiàn)過程如下:
32、3.1數(shù)據(jù)準備:在長期時間序列預測中,在處理過長的回顧窗口和預測范圍,基于rnn的方法進行預測時,會出現(xiàn)大量的重復迭代,導致不理想的預測精度和推理速度。使用分段迭代和并行多步預測來減少迭代次數(shù),獲取較好的預測精度和推理速度。
33、將交通特征矩陣x∈rn×p,根據(jù)設定的窗口長度l劃分為n個分段,單個分段的交通特征矩陣表示為其中l(wèi)表示每個段的窗口長度,表示段的數(shù)量。
34、3.2通過空間相關性提取模塊提取深層的空間特征:
35、所述的空間相關性提取模塊采用2層gcn模型從交通數(shù)據(jù)中學習空間特征。2層gcn模型表示如下:
36、
37、其中,w表示加權鄰接矩陣,表示預處理步驟,是一個具有自連接結構的矩陣,in是單位矩陣,是一個度矩陣,w0和w1分別表示第1層和第2層gcn模型的權重矩陣,σ(?)和relu(?)表示激活函數(shù)。
38、3.3通過時間相關性提取模塊提取深層的時間特征:
39、分段的交通特征矩陣經(jīng)過2層gcn模型提取空間相關性后輸入時間相關性提取模塊中,通過線性投影wpri∈rl×d和relu()激活函數(shù)進行維度的轉換,其中d表示門控循環(huán)單元gru的隱藏狀態(tài)的維度。轉換后的輸出和隱藏特征hi被送到門控循環(huán)單元gru中用于捕獲時間特征。gru單元內的整個過程能夠公式化為:
40、
41、
42、
43、
44、其中,zi表示更新門和ri表示重置門,br和bz表示偏移量,wz、wr、wh代表相應的權重矩陣,hi表示當前時間步i的隱藏特征,hi表示包含當前時間步信息的候選隱藏特征,表示圖的卷積運算。
45、在n次循環(huán)迭代之后,從最后一步獲得的最終隱藏特征hn已經(jīng)封裝了原始序列x的所有時間特征。這個隱藏的特征將被傳遞到解碼部分,用于后續(xù)的推理和預測步驟。
46、進一步的,步驟4具體方法如下:
47、4.1位置嵌入:在解碼階段,由于循環(huán)遞歸的中斷,段之間的順序丟失。為了解決這個問題,生成了m個相應的位置嵌入,單個表示為pe(j)∈rm×d,來識別段的位置。其中表示將預測范圍劃分為m個分段,t表示預測范圍,l表示每個段的窗口長度。
48、4.2并行多步預測pmf:采用傳統(tǒng)的遞歸多步預測rmf會導致誤差累積,同時遞歸的順序性阻礙了訓練示例中的并行計算,并限制了推理速度的提高。為了解決這些限制,采用一種新的預測策略,即并行多步預測pmf,具體操作如下:在解碼階段,共享在編碼階段使用的相同gru單元。具體地,將從編碼階段獲得的最終隱藏特征hn復制m次,并分別與m個位置嵌入pe(j)相組合作為gru單元的輸入。
49、位置嵌入pe(j)反映需要預測的每個片段在完整序列中的位置。gru單元同時并行處理m個輸入,生成m個預測片段表示預測的第j個片段,片段內包含了所預測的n個傳感器的d個時間步的結果。并行解碼實現(xiàn)了樣本內并行計算,從而提高了推理速度。此外,預測誤差不會隨著迭代次數(shù)的增加而累積,從而提高了預測精度。
50、4.3預測與序列恢復:經(jīng)過dropout層,出于正則化目的隨機丟棄20%的值,然后使用可學習的線性預測層wprd∈rd×l將其轉換為由于在時間依賴性建模中進行了樣本歸一化操作,第k個傳感器上采集得到的值中減去序列的最后一個值,把所有的組合在一起后同時加回該值,獲得最終的預測結果
51、進一步的,步驟5具體方法如下:
52、基于道路網(wǎng)絡上設置的n個傳感器采集數(shù)據(jù),構建數(shù)據(jù)集來訓練評估由編碼階段encoding和解碼階段decoding組成的segt-gcn模型的預測性能。
53、采用平均絕對誤差mae,均方根誤差rmse這兩個損失函數(shù)來評估實驗結果,表示為:
54、
55、其中t表示預測的時間序列的長度,n表示傳感器的數(shù)量,表示第k個傳感器在t時刻的真實值,表示第k個傳感器在t時刻預測值。
56、本發(fā)明有益效果如下:
57、本發(fā)明時間相關性提取模塊采用分段迭代代替逐點迭代,預測時用并行多步預測pmf代替遞歸多步預測rmf。本發(fā)明通過分段迭代策略顯著減少了提取時間特征所需的遞歸迭代次數(shù),從而解決了在長序列上有效訓練gru的挑戰(zhàn)。此外,pmf的采用進一步緩解了傳統(tǒng)rmf方法中固有的誤差累積問題。通過采用這些創(chuàng)新策略,segt-gcn不僅在預測精度取得較好的結果,而且還顯著提高了效率。