本發(fā)明涉及智能交通,尤其涉及一種相位式交叉口的交通狀態(tài)精細化辨識方法。
背景技術:
1、數(shù)據(jù)顯示,截止至2023年初,我國城鎮(zhèn)化率已達65.22%,城際出行需求不斷增長,機動車保有量突破4億輛。近年來,城市道路與高速公路銜接區(qū)的交通流狀態(tài)復雜,擁堵現(xiàn)象嚴重。交通需求持續(xù)增加,在城市內外道路交通銜接區(qū)交叉口的交通供需矛盾日益凸顯,交通擁堵已成為制約區(qū)域經濟發(fā)展、影響交通服務質量、破壞區(qū)域生態(tài)環(huán)境的嚴重隱患。其中,城市內外道路交通銜接區(qū)交叉口作為道路交通系統(tǒng)的重要節(jié)點,大量車流在此匯集、交織,極易產生交通擁堵,限制著路網運行效率。交通信息處理與應用的結構、算法、通信等技術,是現(xiàn)代智能交通系統(tǒng)(intelligent?transportation?systems,?its)領域重點研究的對象。目前,交管部門主要通過its的交通誘導系統(tǒng)和交通控制系統(tǒng)來緩解道路擁堵狀況,如果能夠對交叉口附近基本路段的交通狀態(tài)變化進行適時、準確地判斷,可提升交通誘導的精度和交通管控的效果,并同時提高城市交通和公路交通的可靠性及有效性。
2、目前,在智能交通系統(tǒng)研究領域中,交通運行狀態(tài)的辨識已經成為一個研究熱點.準確、實時的交通狀態(tài)辨識有助于交通管理部門及時了解和掌握交通運行狀況,同時也便于交通管理部門提前預估并制定交通擁堵的疏導決策方案,對緩解交通擁堵具有重要意義.。因此,國內外許多學者對交通狀態(tài)辨識的研究給予了高度的關注。
3、早期的交通狀態(tài)辨識大多采用單一原理的設計方法,如統(tǒng)計分析、比較法及理論模型等。隨著先進技術在交通領域的發(fā)展,交通狀態(tài)辨識算法的發(fā)展方向已經由單一方法的改進,轉變?yōu)榉椒ㄅc理論的多元化發(fā)展,并取得了較好的成果。然而,目前主要的研究重點主要集中在路網整體或聚焦于擁堵路段,普遍將交叉口作為路網中的一個節(jié)點進行研究,或者只是簡單的尋找表示交叉口處狀態(tài)的參數(shù),對交通狀態(tài)進行劃分,對受交叉口相位影響的附近路段交通狀態(tài)進行精細化辨識的研究較少。由于交叉口附近路段受信號燈相位影響,若粗略的將不同相位下的交通狀態(tài)進行統(tǒng)一的劃分,不考慮不同相位下受信號燈影響導致的車輛停車排隊現(xiàn)象,容易對交通狀態(tài)產生錯誤辨識,如:直行紅燈相位下,行駛車輛受交叉口處紅燈影響會出現(xiàn)減速或停車,該情形下斷面交通量低、車道空間占有率高、平均行車速度低。若采用傳統(tǒng)辨識方法容易錯誤的將該情形與直行綠燈相位下的斷面交通量低、車道空間占有率高、平均行車速度低情形同樣辨識為堵塞狀態(tài),未考慮信號相位的影響,對管理者產生誤導。同時,城市外圍高速公路往往受到其連接道路交通影響,尤其受城市內外道路交通銜接區(qū)交叉口的影響,而針對此類受交叉口影響的附近路段交通狀態(tài)進行精細化辨識的研究較少。
4、對此本發(fā)明提出一種針對不同相位下交叉口附近路段交通狀態(tài)的精細化判別方法,實現(xiàn)對交叉口交通狀態(tài)的快速判別,為交通管理者制定交叉口信號控制策略提供依據(jù)。同時在使用傳統(tǒng)fcm算法對交通狀態(tài)進行劃分時,受初始聚類中心的影響,易導致誤判或者錯判的情況,因此提出一種基于霜冰優(yōu)化算法的fcm算法(rime-fcm),用于優(yōu)化聚類初始中心點,以較小的概率接受非優(yōu)質解為優(yōu)質解,且因此使用shap對模型進行解釋性分析,明確各交通參數(shù)如何對模型辨識產生影響。
5、為了解決上述問題,本發(fā)明提出一種相位式交叉口的交通狀態(tài)精細化辨識方法。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提出一種相位式交叉口的交通狀態(tài)精細化辨識方法以解決背景技術中所提出的問題:
2、現(xiàn)有技術普遍將交叉口作為路網中的一個節(jié)點進行研究,或者只是簡單的尋找表示交叉口處狀態(tài)的參數(shù),對交通狀態(tài)進行劃分,無法對受交叉口相位影響的附近路段交通狀態(tài)進行精細化辨識。
3、為了實現(xiàn)上述目的,本發(fā)明采用了如下技術方案:
4、一種相位式交叉口的交通狀態(tài)精細化辨識方法,包括如下步驟:
5、s1:采集交叉口交通數(shù)據(jù)并按照交叉口處的相位進行預處理操作,將交叉口交通數(shù)據(jù)劃分為不同相位下的數(shù)據(jù)集;
6、s2:針對不同相位下的數(shù)據(jù)基于rime-fcm算法進行交通狀態(tài)的模糊劃分,獲得含有交通狀態(tài)標簽的數(shù)據(jù)集;
7、s3:基于bo-xgboost模型進行交通狀態(tài)識別分類訓練,并使用shap值對模型進行解釋。
8、優(yōu)選地,所述s1中,選取交通量、路段平均行程速度和空間占有率三個交通參數(shù)作為辨識指標,形成交通狀態(tài)辨識指標體系。
9、優(yōu)選地,所述s1中,設定對交通狀態(tài)進行劃分的相對度量標準,將交通狀態(tài)劃分為順暢、平穩(wěn)、擁擠和阻塞四類。
10、優(yōu)選地,所述s2中的rime-fcm算法具體如下:
11、s2.1:設置初始參數(shù);
12、s2.2:更新fcm算法的聚類中心和隸屬度矩陣;
13、s2.3:定義適應度函數(shù),適應度函數(shù)選取為:,其中,為目標函數(shù);為聚類中心;為隸屬度矩陣;
14、s2.4:通過rime算法不斷更新聚類中心中各維度的值,即每個聚類中心中三個辨識指標的值,對應粒子;
15、s2.5:更新全局最優(yōu)個體,判斷是否達到最大迭代次數(shù),若是轉至s2.6,否則進入s2.2;
16、s2.6:算法結束,取粒子適應度最大的個體為fcm算法初始聚類中心,對樣本進行劃分;
17、s2.2中所述fcm算法具體如下:
18、s2.2.1:基于s2.1設置的初始參數(shù)獲得初始聚類中心,并計算初始化隸屬度矩陣;
19、s2.2.2:計算聚類中心并更新隸屬度矩陣;具體如下:
20、所述聚類中心計算如下:
21、
22、其中,為樣本的數(shù)量;為樣本序號;為聚類中心的數(shù)量;為聚類中心的序號;為模糊指數(shù);為樣本屬于第類聚類中心的隸屬度;
23、s2.2.3:計算目標函數(shù),若或達到最大迭代次數(shù),則終止計算,否則返回s2.2.3繼續(xù)迭代;具體如下:
24、以特征空間中的數(shù)據(jù)樣本集為,表示聚類中心,以各個樣本到各個聚類中心的歐式距離的和為目標函數(shù),具體如下:
25、
26、約束條件如下:
27、
28、其中,為樣本的數(shù)量;為樣本序號;為聚類中心的數(shù)量;為聚類中心的序號;為模糊指數(shù);為樣本屬于第類聚類中心的隸屬度;為樣本到聚類中心的歐式距離;
29、其中隸屬度計算如下:
30、
31、其中,為第個聚類中心;
32、s2.4中所述rime算法具體如下:
33、所述rime算法中,每個霜冰個體由若干個粒子組成,霜冰種群由若干個個體組成,具體如下;
34、
35、
36、其中,為霜冰種群,表示為一個矩陣,每一行代表一個個體;為第個霜冰個體的第個粒子,粒子對應維度的值,即解的第個維度的值,為霜冰個體的數(shù)量,即種群大小,為每個個體的維度數(shù)量,每個個體的維度對應辨識指標,維度數(shù)量對應辨識指標的數(shù)量;表示第個霜冰個體,對應交通狀態(tài);
37、基于軟霜搜索策略進行霜冰個體尋優(yōu),具體如下:
38、
39、
40、
41、
42、其中,為軟霜搜索策略更新后的粒子新位置,對應為由不同粒子的變量值構成的向量坐標;為霜冰種群中最優(yōu)個體的第個粒子,根據(jù)適應度函數(shù)計算獲得;為范圍為的隨機數(shù),控制粒子運動的方向;和分別表示粒子運動的角度和環(huán)境因子;為粘附系數(shù),范圍為內的隨機數(shù),控制兩個粒子中心的距離;為第個霜冰個體的第個粒子的上界;為第個霜冰個體的第個粒子的下界;為粘附系數(shù);為范圍為內的隨機數(shù),控制粒子的凝結;為當前迭代次數(shù);為最大迭代次數(shù);為控制值,用于控制階躍函數(shù)的段數(shù);
43、基于硬霜穿刺機制模擬硬霜個體之間的交叉行為,具體如下:
44、
45、其中,為硬霜穿刺機制更新后的粒子新位置;表示當前個體適應度值的歸一化值;是范圍為的隨機數(shù);
46、歸一化值計算如下:
47、
48、其中,為歸一化之后的第個數(shù)據(jù),取值范圍為;為第個原始輸入數(shù)據(jù);為原始數(shù)據(jù)中的最大值;為原始數(shù)據(jù)中的最小值;
49、所述rime算法基于貪婪選擇機制進行,具體如下:
50、s2.4.1:初始化霜冰種群與相關參數(shù);
51、s2.4.2:獲取當前最優(yōu)個體和最優(yōu)適應值;
52、s2.4.3:當時,依次執(zhí)行步驟a、b、c:
53、步驟a:如果,則根據(jù)軟霜搜索策略更新霜冰個體位置;
54、步驟b:如果,則通過硬霜穿刺機制在個體之間進行交叉更新;
55、步驟c:如果,則使用積極的貪婪選擇機制選擇最優(yōu)解并替換次優(yōu)解,具體為:將個體的更新適應度值與更新前的適應度值進行比較,如果更新適應值優(yōu)于更新前的值,則替換兩個個體的解;若滿足終止條件,執(zhí)行s2.4.5,反之,執(zhí)行s2.4.4;
56、s2.4.4:進化迭代次數(shù)加1,轉至s2.4.3;
57、s2.4.5:輸出全局最優(yōu)值,算法結束。
58、優(yōu)選地,所述s3中的bo-xgboost模型流程具體如下:
59、s3.1:根據(jù)目標函數(shù)和正則化策略確定xgboost模型的尋優(yōu)參數(shù)和解空間,在解空間采集個參數(shù)組合;
60、s3.2:將個參數(shù)組合輸入到xgboost模型并得到目標函數(shù)值,將輸出效果最優(yōu)的參數(shù)組合作為初始最優(yōu)解;
61、s3.3:采用高斯回歸過程模型對初始參數(shù)組合和目標函數(shù)值進行擬合,并依據(jù)高斯回歸過程模型的輸出值與預設值相比,初步選取最優(yōu)參數(shù)組合;
62、s3.4:在解空間基于ei算法重新選取若干參數(shù)組合,使用高斯過程預測選取的參數(shù)組合的分布均值和標準差;
63、s3.5:使用采集函數(shù)分布均值和標準差進行打分,評估各參數(shù)組合的效果;
64、s3.6:基于若干評估指標選擇效果最優(yōu)的參數(shù)組合作為本次迭代最優(yōu)解;
65、s3.7:將本次迭代最優(yōu)解替換上一輪迭代最優(yōu)解;
66、s3.8:將當前最優(yōu)的參數(shù)組合及目標函數(shù)值,加入到原始個參數(shù)組合中,更新高斯過程擬合模型;
67、s3.9:判斷是否達到預設最大迭代次數(shù),若達到則輸出評估最優(yōu)的解作為xgboost最優(yōu)參數(shù)組合;否則轉向步驟s3.4;
68、s3.10:使用找到的最優(yōu)參數(shù)組合訓練xgboost模型,然后用訓練后的xgboost模型對樣本數(shù)據(jù)進行預測,根據(jù)模型輸出的預測結果來判斷交通狀態(tài)。
69、優(yōu)選地,所述xgboost模型的搭建具體如下:
70、所述xgboost模型的目標函數(shù)定義如下:
71、
72、其中,表示真實數(shù)據(jù);為前個學習器的預測值和第個學習器預測值相加之和;表示模型損失函數(shù);為正則化策略;為常數(shù);
73、泰勒展開式的二階近似公式如下:
74、
75、其中,表示所求點;
76、對損失函數(shù)的一階導數(shù)和二階導數(shù)分別定義如下:
77、
78、
79、將目標函數(shù)用泰勒展開式展開,并用倒數(shù)形式替換,得到:
80、
81、設置第棵決策樹葉子對數(shù)據(jù)的預測值為:
82、
83、其中,表示樣本數(shù)據(jù)的葉子節(jié)點;表示葉子的預測數(shù)據(jù);
84、在正則化中加入對葉子節(jié)點個數(shù)的懲罰:
85、
86、其中,為葉子節(jié)點數(shù)量;和為正則化參數(shù),將預測值和正則化帶入目標函數(shù)公式,省略常數(shù)項,將對樣本預測的誤差和改為對每個葉子預測值誤差求和:
87、
88、其中,為分到第個葉子中的所有樣本集合;
89、令,,對目標函數(shù)求導,即求得目標函數(shù)極小值,得到最優(yōu)的值:
90、
91、代入到目標函數(shù)中,得到:
92、
93、得到信息增益如下:
94、
95、其中,、為右面葉子結點的值;、為左面葉子結點的值。
96、優(yōu)選地,所述s3.3中的高斯回歸過程模型具體如下:
97、設定高斯回歸過程模型的輸出如下:
98、
99、其中,為服從高斯分布的噪聲;為目標函數(shù),表示對于輸入生成的真實值或響應值;
100、采用高斯過程對函數(shù)進行描述,先驗分布由其均值函數(shù)和協(xié)方差函數(shù)確定;
101、對于數(shù)據(jù),為數(shù)據(jù)數(shù)量,分布函數(shù)的多元高斯分布為:
102、
103、其中,,且是的矩陣元素,為向量的轉置;
104、基于上述步驟搭建的高斯回歸過程模型返回的即為函數(shù)中的預測值高斯分布均值和方差。
105、優(yōu)選地,所述s3.4中的ei算法具體如下:
106、
107、
108、其中,為最高期望改進值;為期望值;表示算法當前尋得的最優(yōu)超參數(shù)組合;為新輸入點的預測分布均值;表示當前已知的最優(yōu)目標函數(shù)值;表示新輸入點的標準差;為替代函數(shù);表示標準正態(tài)分布的累積分布函數(shù);表示標準正態(tài)分布的概率密度函數(shù)。
109、優(yōu)選地,所述s3.4中,在解空間基于ei算法通過如下方式選取參數(shù)組合:
110、對于給出的樣本數(shù)據(jù),使用所述高斯回歸過程模型更新函數(shù)的后驗期望;
111、尋找ei算法中對應ei值最大的數(shù)據(jù),令;
112、并計算數(shù)據(jù)點的函數(shù)值;
113、重復上述計算過程,直到達到算法停止閾值。
114、優(yōu)選地,所述s3中的shap值計算如下;
115、對于每個預測樣本,shap模型生成一個夏普利值,具體為分配給每個特征的值的總和,解釋為:
116、
117、其中,為各變量的解釋模型;為聯(lián)合矢量;為最大聯(lián)合規(guī)模;為特征的特征屬性。
118、與現(xiàn)有技術相比,本發(fā)明提供了一種相位式交叉口的交通狀態(tài)精細化辨識方法,具備以下有益效果:
119、本發(fā)明將不同相位下的交通流參數(shù)進行劃分,然后對不同相位下的數(shù)據(jù)利用rime-fcm模型分別進行聚類,避免粒子過分快速地聚集于當前最優(yōu)解而陷入局部極值;實現(xiàn)對于交通流參數(shù)的初步劃分;通過貝葉斯優(yōu)化的方式優(yōu)化xgboost模型的超參數(shù),進行交通狀態(tài)識別分類訓練;克服了目前xgboost交通識別算法訓練過程無法觀察,其產生結果難以解釋,影響結果可靠性的問題;還使用shap對模型識別過程進行解釋性分析,提升擁堵識別結果的可靠性。