本發(fā)明屬于城市交通領(lǐng)域,具體涉及一種基于深度學習網(wǎng)絡及多源異構(gòu)數(shù)據(jù)的城市健康狀態(tài)估計方法。
背景技術(shù):
1、智慧城市通常采用與數(shù)據(jù)相結(jié)合的傳感器基礎(chǔ)設(shè)施,實時監(jiān)測和檢測可能發(fā)生異常或城市中感興趣的事件,如交通事故、航空事故和污染等。傳感器設(shè)備正在成為智能城市基礎(chǔ)設(shè)施的一部分,可以是嵌入式城市基礎(chǔ)設(shè)施(例如監(jiān)控相機),也可以是移動設(shè)備(例如智能手機或移動應用程序),還可以是靜態(tài)設(shè)備(例如污染監(jiān)測站),以提供改善公共福利和居民生活質(zhì)量的服務。這些服務涉及交通管理、環(huán)境監(jiān)測、智能交通、家政服務等方面。智能城市系統(tǒng)通常會生成大量數(shù)據(jù),在其運行過程中,這些數(shù)據(jù)使我們能夠研究、了解和模擬城市的多個參數(shù),如交通模式、人群行為、動態(tài)以及整個城市的空氣污染擴散情況。
2、因此,數(shù)字技術(shù)正在改變智慧城市的規(guī)劃和監(jiān)控方式。其中一個具有挑戰(zhàn)性的問題是如何綜合考慮空間和時間因素來評估城市區(qū)域內(nèi)居民的健康狀況,包括交通狀況和空氣污染等因素。通過監(jiān)測空氣污染排放和傳遞這些信息給公眾,可以了解城市的健康狀況對人們在城市環(huán)境中的生活、行為和選擇產(chǎn)生的影響。例如,兒童、老年人或進行戶外運動的人(如騎自行車或慢跑)可以借助這些信息避開污染水平較高或擁擠地方,從而受益。同時,這些信息還可以鼓勵人們使用替代交通工具,并避開可能導致交通擁堵的地區(qū)壓力和擁堵程度。因此,辨識和利用城市異構(gòu)數(shù)據(jù)類型在提升公眾福利和增強公眾意識方面發(fā)揮著重要作用。
3、之前的研究已經(jīng)分析了城市生活問題的各種觀點。比如,利用地理信息確定新零售店最佳位置的標準,其中考慮了不同類型和附近地區(qū)的密度特征,以及用戶流動性標準,包括場館之間的過渡和來自遠處地區(qū)的移動用戶。過去已經(jīng)有一些工作專注于基于眾包方案或環(huán)形傳感器網(wǎng)絡來推斷交通信息,以及使用城市數(shù)據(jù)來評估城市的環(huán)境足跡。然而,這些研究的局限性在于它們關(guān)注城市生活問題的特定方面(如交通或空氣污染),而沒有考慮到多種類型的城市數(shù)據(jù),我們的目標是利用異構(gòu)的多源城市數(shù)據(jù),即污染和交通數(shù)據(jù),來評估城市的健康狀況。交通數(shù)據(jù)是從多個大規(guī)模來源獲取的,包括北京交通發(fā)展研究院、清華大學數(shù)據(jù)科學研究院交通大數(shù)據(jù)研究中心、賽文交通網(wǎng)和百度地圖智能交通聯(lián)合實驗室等多家機構(gòu)。這些數(shù)據(jù)可能存在噪聲、缺失值和測量誤差。城市空氣質(zhì)量的數(shù)據(jù)來源于中國環(huán)境監(jiān)測總站,中國生態(tài)環(huán)境部負責收集全國空氣質(zhì)量數(shù)據(jù)并向市民提供有關(guān)空氣污染的信息。空氣質(zhì)量并不是固定不變的,它每小時都在變化,甚至每個社區(qū)的空氣質(zhì)量也會有很大的差異。因此,利用空氣污染和交通數(shù)據(jù)來評估城市的健康狀況是一項具有挑戰(zhàn)性的任務。
技術(shù)實現(xiàn)思路
1、為了解決上述現(xiàn)有技術(shù)存在的問題,本發(fā)明提出了一種基于深度學習網(wǎng)絡及多源異構(gòu)數(shù)據(jù)的城市健康狀態(tài)估計方法。我們提出了一個hotp的框架,通過整合城市數(shù)據(jù)的異構(gòu)來源來識別城市的健康狀態(tài)。首先對空氣質(zhì)量數(shù)據(jù)進行數(shù)據(jù)預處理和數(shù)據(jù)特征處理。然后我們對交通擁堵數(shù)據(jù)進行預處理和數(shù)據(jù)特征處理。最后把以上兩種數(shù)據(jù)特征提取結(jié)果進行數(shù)據(jù)融合,以推理評判斷城市健康狀況,預測結(jié)果符合實際城市運行規(guī)律,說明我們提出的htop方法有機融合了城市的交通數(shù)據(jù)與空氣污染數(shù)據(jù),能準確評估整個城市的健康水平。
2、本發(fā)明提出了一種基于深度學習網(wǎng)絡及多源異構(gòu)數(shù)據(jù)的城市健康狀態(tài)估計方法,具體包括如下步驟:
3、步驟1:采集城市空氣質(zhì)量數(shù)據(jù);
4、步驟2:獲取城市交通擁堵情況;
5、步驟3:對城市空氣質(zhì)量數(shù)據(jù)預處理;
6、步驟4:對城市交通擁堵情況進行預處理;
7、步驟5:獲得空氣質(zhì)量預處理數(shù)據(jù)和城市交通擁堵情況預處理數(shù)據(jù),整合兩個預處理數(shù)據(jù);
8、步驟6:對城市健康狀況進行推理和評估。
9、進一步地,步驟1具體為:
10、精確采集目標城市的空氣質(zhì)量數(shù)據(jù),涵蓋pm2.5、pm10、so2、no2、co、o3等關(guān)鍵污染物的濃度數(shù)據(jù),確保數(shù)據(jù)的全面性和準確性。
11、采集的數(shù)據(jù)表示為向量形式:
12、
13、其中cx表示污染物x的濃度。
14、進一步地,步驟2具體為:
15、系統(tǒng)性地獲取目標城市的交通擁堵情況數(shù)據(jù),包括道路擁堵指數(shù)、交通流量、平均車速等核心交通參數(shù),以全面反映城市交通狀況。
16、交通擁堵情況用以下向量表示:
17、交通擁堵數(shù)據(jù)=(i擁堵指數(shù),f交通流量,v平均車速)
18、其中i擁堵指數(shù)、f交通流量、v平均車速分別表示擁堵指數(shù)、交通流量和平均車速。
19、進一步地,步驟3具體為:
20、綜合空氣中各污染物的含量濃度值,共同計算出空氣質(zhì)量指數(shù)。單項污染物的空氣質(zhì)量指數(shù),即空氣質(zhì)量分指數(shù)(iaqi),由公式(1)計算:
21、
22、其中,iaqi為單項污染物的空氣質(zhì)量指數(shù),cp為污染物項目的質(zhì)量濃度值,bph為cp相近的污染物濃度限值的高位值,bph為cp相近的污染物濃度限值的高位值,bpl為cp相近的污染物濃度限值的低位值,iaqih為與bph對應的空氣質(zhì)量分指數(shù),iaqil為與bpl對應的空氣質(zhì)量分指數(shù)。那么空氣質(zhì)量指數(shù)(aqi)為
23、aqi=max{iaqi1,iaqi2,iaqi3,...,iaqin}
24、最后利用區(qū)域c在當前t時刻的空氣質(zhì)量指數(shù)除以標注危險污染條件的閾值,得到用以評估空氣質(zhì)量的影響因子。
25、
26、進一步地,步驟4具體為:
27、利用交通數(shù)據(jù)來評估一下交通狀況。選用擁堵指數(shù)來作為交通狀況的評估標準。擁堵指數(shù)為實際行程時間與暢通行程時間的比值,擁堵指數(shù)越大代表擁堵程度越高。擁堵指數(shù)可以由下式計算:
28、
29、其中vf為該路段自由流速度,v為該路段當前車速,f為可變參數(shù)。
30、進一步地,步驟5具體為:
31、結(jié)合空氣污染數(shù)據(jù)與交通運輸數(shù)據(jù),可以對城市的健康狀況進行預測:
32、
33、其中,ωt為交通指數(shù)權(quán)重參數(shù),ωp為空氣指數(shù)權(quán)重參數(shù),kt為交通擁堵指數(shù)歸一值,kp為空氣指數(shù)歸一值。當?shù)玫娇諝馕廴緮?shù)據(jù)和交通擁堵數(shù)據(jù)的準確預測值后,將預測值進行融合,即可對城市的健康狀態(tài)進行預測。
34、進一步地,步驟6具體為:
35、根據(jù)交通數(shù)據(jù)和空氣數(shù)據(jù)的不同特點,分別使用gbdt決策樹算法和長短期記憶網(wǎng)絡lstm算法預測出未來的交通擁堵狀態(tài)和空氣污染指數(shù)。選取mad(median?absolutedeviation,絕對中位差)、mae(mean?absolute?error,平均絕對誤差)、rmse(root?meansquare?error,均方根誤差)、std(standard?deviation,標準偏差)四個參數(shù)來評估預測的準確性。最后將交通擁堵數(shù)據(jù)與空氣污染數(shù)據(jù)進行融合共同對城市的健康狀態(tài)進行評估。
36、相對于現(xiàn)有技術(shù),本專利具有如下有益效果:
37、本發(fā)明提出的一種基于深度學習網(wǎng)絡及多源異構(gòu)數(shù)據(jù)的城市健康狀態(tài)估計方法,針對當前研究主要聚焦于分析來自單一來源的數(shù)據(jù)以及近來利用異構(gòu)數(shù)據(jù)源但未判斷污染信息和交通數(shù)據(jù)這兩個因素及其相互作用從而判斷城市健康水平的見解,重點是通過污染信息與交通數(shù)據(jù)結(jié)合來判斷城市健康水平。在步驟一中,我們根據(jù)城市不同地區(qū)的污染程度與污染源的不同選取主要的污染信息。這對于理解影響城市污染的因素至關(guān)重要。在步驟二中,我們對于不同地區(qū)的交通狀況有所不同這一特性,選取來自集體交通監(jiān)測網(wǎng)絡的數(shù)據(jù),這些數(shù)據(jù)的時空分布或統(tǒng)計特征有助于識別典型交通狀況,并提取有助于交通規(guī)劃的信息。在步驟三、四中我們對于獲取到的空氣質(zhì)量數(shù)據(jù)與城市交通擁堵情況根據(jù)我們方法的需要進行預處理,將這兩種數(shù)據(jù)通過數(shù)字的形式表現(xiàn)出來以便后續(xù)實驗的進一步進行。對數(shù)據(jù)預處理之后將空氣污染數(shù)據(jù)與交通擁堵數(shù)據(jù)相融合,共同計算出一個城市的健康狀態(tài)。這一創(chuàng)新策略突破了當前大部分學者只利用單一數(shù)據(jù)源推斷交通或污染狀態(tài),有機融合了城市的交通數(shù)據(jù)與空氣污染數(shù)據(jù),能夠清楚的了解到整個城市的健康水平并對判斷預測算法的優(yōu)異提供了基礎(chǔ);此外,為了更加精確地判斷預測算法的誤差,選取了mad(median?absolute?deviation,絕對中位差)、mae(mean?absolute?error,平均絕對誤差)、rmse(root?mean?square?error,均方根誤差)、std(standard?deviation,標準偏差)四個參數(shù)來評估預測的準確性,進一步提高了預測算法的可靠性。