本發(fā)明涉及路面紋理數(shù)據(jù)集數(shù)據(jù)擴(kuò)充領(lǐng)域。
背景技術(shù):
1、瀝青路面的濕滑狀態(tài)與人民群眾的出行安全息息相關(guān),機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等方法有望實(shí)現(xiàn)路面抗滑性能的精準(zhǔn)預(yù)測。但這類人工智能方法的預(yù)測精度與數(shù)據(jù)集高度關(guān)聯(lián),數(shù)據(jù)集的數(shù)據(jù)量和準(zhǔn)確性越好,意味著預(yù)測精度的增加。
2、路面紋理數(shù)據(jù)集主要用于路表抗滑性能預(yù)測,包括路面狀況、氣候條件、交通荷載、集料類型及構(gòu)造深度數(shù)據(jù),利用構(gòu)造深度數(shù)據(jù)評價路表抗滑性能,總體包含十二個輸入特征和一個輸出特征。輸入特征包括:在路面狀況上選用代表層厚度作為輸入特征指標(biāo),有助于評估路面性能;在氣候條件上,綜合考慮降水、風(fēng)速、平均溫度、最高氣溫、凍結(jié)指數(shù)、地表短波輻射、濕度等7大因素影響;在交通荷載考慮上,由于重載交通對路面抗滑性能的影響更大,因此選用第9類大型車輛的年度累計(jì)交通量,該數(shù)據(jù)代表著該車道在特定年份內(nèi)承載的第9類大型車輛(通常是載重較重的貨車或大型車輛);此外,綜合考慮各類重載卡車的疊加影響,選用重型卡車(車輛類別4、6-13)的年度累積交通量作為特征參數(shù);在集料類型考慮上,選用通過4.75毫米和0.075毫米篩孔的百分比作為特征參數(shù),可以較好的表征集料的顆粒級配。輸出特征為路面構(gòu)造深度,用于表征抗滑。
3、路面紋理數(shù)據(jù)集的主要數(shù)據(jù)均為人工或機(jī)器采集,采集周期為每月或每年,且為多路段小樣本數(shù)據(jù)。受限于采集技術(shù),往往存在采集到的各特征不匹配以及數(shù)據(jù)缺失等問題,極大程度影響路面抗滑性能的預(yù)測,不利于人工智能技術(shù)在路面抗滑性能預(yù)測領(lǐng)域的開展。
4、例如在基于深度學(xué)習(xí)的路面抗滑性能預(yù)測中,首先需要對采集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和預(yù)處理。然而,數(shù)據(jù)清洗后會發(fā)現(xiàn),由于受限于采集年份,往往會出現(xiàn)數(shù)據(jù)量不足的問題,由于路面的紋理特征變化較慢,大多數(shù)情況以年為單位,因此數(shù)據(jù)的補(bǔ)充采集極為困難。而即使對多個路段同時采集,這種多路段小樣本數(shù)據(jù)依然會影響深度學(xué)習(xí)預(yù)測的精準(zhǔn)度,無法讓深度學(xué)習(xí)捕捉其在時間序列上的依賴性。因此,針對該問題,現(xiàn)有的方法常采用降低模型的復(fù)雜度,采用線性插值方法補(bǔ)充數(shù)據(jù),但效果甚微。
技術(shù)實(shí)現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,為了克服現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明提出了一種基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法。該方法基于holt指數(shù)平滑對采集到的路面紋理數(shù)據(jù)集的缺失值進(jìn)行橫向補(bǔ)充,形成以12個輸入特征和1個輸出特征為代表的完整數(shù)據(jù)集;再利用python環(huán)境,采用pchipinterpolator插值方法,對每個路段的數(shù)據(jù)進(jìn)行縱向插值,將小樣本數(shù)據(jù)進(jìn)行擴(kuò)充,以滿足深度學(xué)習(xí)模型預(yù)測路面抗滑性能的需要。本發(fā)明可充分挖掘路面紋理數(shù)據(jù)之間的時序關(guān)聯(lián)性,實(shí)現(xiàn)路面紋理數(shù)據(jù)集的非線性擴(kuò)充,有效解決現(xiàn)有以路面紋理數(shù)據(jù)為訓(xùn)練集的卷積神經(jīng)網(wǎng)絡(luò)面臨的訓(xùn)練數(shù)據(jù)不足問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
3、基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,包括以下步驟:
4、步驟1:從長期路面性能數(shù)據(jù)庫中,采集匹配以厚度m1、降水m2、風(fēng)速m3、平均溫度m4、最高氣溫m5、凍結(jié)指數(shù)m6、地表短波輻射m7、濕度m8、第9類車交通量m9、重載卡車交通量m10、4.75毫米篩孔通過率m11、0.075毫米篩孔通過率m12為代表的輸入特征數(shù)據(jù)mi,以及以構(gòu)造深度數(shù)據(jù)為代表的輸出特征數(shù)據(jù)n,形成原始路面紋理數(shù)據(jù)集a1;
5、步驟2:基于原始路面紋理數(shù)據(jù)集,對數(shù)據(jù)特征分類排序,路面紋理數(shù)據(jù)集更新為路面紋理數(shù)據(jù)集a2;
6、步驟3:構(gòu)建holt指數(shù)平滑模型,進(jìn)行橫向缺失值填補(bǔ),路面紋理數(shù)據(jù)集更新為路面紋理數(shù)據(jù)集a3;
7、步驟4:構(gòu)建?pchipinterpolator?插值器,進(jìn)行縱向缺失值填補(bǔ),路面紋理數(shù)據(jù)集更新為路面紋理數(shù)據(jù)集a4;
8、步驟5:動態(tài)調(diào)整步驟3和步驟4,形成多層次數(shù)據(jù)填補(bǔ)擴(kuò)充方法,根據(jù)數(shù)據(jù)的特征變化自動調(diào)整holt模型的平滑參數(shù)以及pchipinterpolator的插值控制點(diǎn),形成最終的路面紋理數(shù)據(jù)集a5;
9、步驟6:對比插值前后的數(shù)據(jù),確保插值后數(shù)據(jù)的趨勢和原始數(shù)據(jù)一致。
10、具體的,所述步驟2:以路段為分組依據(jù)進(jìn)行分類,確保每個路段是獨(dú)立的,再以采集年月為時序特征進(jìn)行各特征的數(shù)據(jù)排列,確保插值時的自變量即時間是單調(diào)遞增的,路面紋理數(shù)據(jù)集更新為路面紋理數(shù)據(jù)集a2。
11、具體的,所述步驟3:先采用時序聚類技術(shù),對具有相似特征的時間序列進(jìn)行聚類分析,再通過平滑原始數(shù)據(jù),捕捉每個特征的趨勢和水平變化,對數(shù)據(jù)進(jìn)行擬合,并生成平滑后的序列,使用模型的平滑結(jié)果,對路面紋理數(shù)據(jù)集中各特征的缺失值進(jìn)行橫向填補(bǔ),路面紋理數(shù)據(jù)集更新為路面紋理數(shù)據(jù)集a3。
12、具體的,所述步驟4:以路段作為分類依據(jù),在每個相鄰的年月中,生成更密集的插值點(diǎn),進(jìn)行數(shù)據(jù)縱向擴(kuò)充,在所有路段的數(shù)據(jù)都進(jìn)行了插值處理后,將這些結(jié)果合并回路面紋理數(shù)據(jù)集a3中,形成更加密集的路面紋理數(shù)據(jù)集a4。
13、優(yōu)選的,所述的13類特征數(shù)據(jù)的采集頻率均以年為單位,但年份可以不連續(xù),每類在同一路段至少包含3年以上采集記錄。
14、優(yōu)選的,所述的各類特征數(shù)據(jù)所用單位需為國際單位,若不是,需要換算成國際單位。
15、優(yōu)選的,?holt指數(shù)平滑和pchipinterpolator插值為動態(tài)機(jī)制,可根據(jù)數(shù)據(jù)的特征變化進(jìn)行自動調(diào)整。
16、優(yōu)選的,所述的重載卡車交通量為重型卡車(車輛類別4、6-13)的年度累積交通量。
17、本發(fā)明具有如下優(yōu)點(diǎn)和有益效果:
18、1、本發(fā)明匹配12個輸入特征和1個輸出特征,構(gòu)建holt指數(shù)平滑模型,先進(jìn)行k-means時序聚類,對具有相似特征的時間序列進(jìn)行聚類分析,再進(jìn)行橫向缺失值補(bǔ)充,形成完整紋理數(shù)據(jù)集。再構(gòu)建?pchipinterpolator?插值器,生成更密集的縱向插值點(diǎn),形成最終的路面紋理數(shù)據(jù)集,數(shù)據(jù)擴(kuò)充精度高,擴(kuò)充量可控,可實(shí)現(xiàn)數(shù)據(jù)集的非線性擴(kuò)充。
19、2、本發(fā)明采用計(jì)算機(jī)編程技術(shù)補(bǔ)充數(shù)據(jù)集,區(qū)別于過往的人工數(shù)據(jù)采集補(bǔ)充,在已有數(shù)據(jù)基礎(chǔ)上,充分挖掘各特征數(shù)據(jù)內(nèi)部的時間關(guān)聯(lián)性,可以有效避免對路段進(jìn)行多次數(shù)據(jù)采集所造成的高昂時間和經(jīng)濟(jì)成本。
20、3、本發(fā)明所有流程和算法均可通過計(jì)算機(jī)編輯循環(huán)程序快速實(shí)現(xiàn)。
1.基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,所述步驟2:
3.如權(quán)利要求1所述的基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,所述步驟3:
4.如權(quán)利要求3所述的基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,
5.如權(quán)利要求1所述的基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,所述步驟4:
6.如權(quán)利要求5所述的基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,
7.如權(quán)利要求1所述基于holt指數(shù)平滑和pchipinterpolator插值的路面紋理數(shù)據(jù)集擴(kuò)充方法,其特征在于,13類特征數(shù)據(jù)的采集頻率均以年為單位,每類在同一路段至少包含3年以上采集記錄。