本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種面向狀態(tài)預測的全固廢混凝土檢測數(shù)據(jù)處理方法。
背景技術:
1、隨著城市化進程加快,雨水管路和防洪問題日益突出,透水混混凝土因其優(yōu)良的透水性能而收到廣泛關注。全固廢透水混凝土不僅有助于改善城市排水系統(tǒng),還能有小利用固體廢物資源,降低環(huán)境污染,因此對于混凝土的檢測十分重要。傳統(tǒng)的檢測和評估方法通常依賴于小規(guī)模試驗數(shù)據(jù),導致在實際應用中難以準確預測混凝土的性能,如抗壓強度、滲透性等。這種數(shù)據(jù)不足的問題限制了模型的泛化能力,使得預測結果的可靠性降低。此外,現(xiàn)有的特征提取和分類技術在處理高維數(shù)據(jù)時效率低下,容易導致信息丟失。
2、現(xiàn)有專利cn202311722685.6了提出一種基于大數(shù)據(jù)的新拌混凝土工作性能預測方法,包括以下步驟:統(tǒng)計歷史工程項目的混凝土配合比數(shù)據(jù),建立混凝土工作性能信息數(shù)據(jù)庫;建立混凝土砂漿富余量和凈漿富余量求解方程,對混凝土工作性能信息數(shù)據(jù)庫中凈漿富余量和砂漿富余量進行計算;對影響混凝土工作性能的變量進行機器學習訓練,建立砂漿富余量、凈漿富余量、混凝土用水量、水膠比、砂率對混凝土坍落度與混凝土坍落度的映射模型和坍落度求解表達式sv2;根據(jù)擬采用的混凝土配比信息以及表達式sv2進行坍落度預測值求解。本發(fā)明保證混凝土質(zhì)量的前提下能為項目施工提供所需工作性能的混凝土,減少現(xiàn)場試驗檢測人員工作量的同時,提高工程施工質(zhì)量和施工效率。
3、現(xiàn)有專利cn202110718615.8提出一種超高性能混凝土的力學性能預測方法,首先建立微觀尺度uhpc水化微結構模型和水泥-粉煤灰-硅灰三相復合水泥基材料水化微結構演變模型,建立對應的微觀尺度下uhpc有限元數(shù)值模型,確定出微觀尺度下uhpc硬化漿體力學性能,其次建立細觀尺度下uhpc骨料堆積模型和細觀尺度下uhpc有限元數(shù)值模型,根據(jù)uhpc硬化凈漿力學屬性與骨料三維空間分布,分析計算出下uhpc砂漿力學性能;最后建立了uhpc纖維的隨機動態(tài)堆積模型,并建立相應細觀尺度下uhpc有限元數(shù)值模型,根據(jù)uhpc砂漿材料本構參數(shù)與纖維三維空間分布,計算得到uhpc宏觀力學本構關系,本發(fā)明計算精準,穩(wěn)定性高。
4、現(xiàn)有專利cn202410423447.3提出一種基于機器學習的便攜式寒區(qū)混凝土檢測裝置,所述裝置包括儀器主體、測量模塊、處理模塊、電源、電極、智能顯示屏、usb接口和連接槽,其中:所述測量模塊位于儀器主體的右側(cè),通過連接槽與儀器主體相連;所述儀器主體的上部設置有智能顯示屏,下部設置有電源;所述處理模塊位于智能顯示屏的后側(cè);所述電極位于電源的前側(cè);所述usb接口設置在電極的下方。本發(fā)明依據(jù)受混凝土含水率影響的表層電阻率為特征值,通過回歸擬合建立混凝土抗壓強度預測模型,從而預測工程混凝土的抗壓強度,能夠在無損檢測的同時進一步提升準確性。
5、上述現(xiàn)有技術雖然能夠較準確的預測混凝土性能,但是仍存在以下不足:
6、1、在數(shù)據(jù)采集與標注過程中,樣本數(shù)量常常不足,導致訓練模型時泛化能力收到限制,增加了過擬合的風險;
7、2、傳統(tǒng)特征提取方法在處理高維數(shù)據(jù)時,容易出現(xiàn)梯度消失或者爆炸現(xiàn)象,影響模型的穩(wěn)定性和性能,導致訓練效率低下;
8、3、特征降維技術未能有效保留數(shù)據(jù)的重要信息,導致在分類階段模型的準確性降低,無法充分利用輸入數(shù)據(jù)的潛在價值;
9、4、現(xiàn)有的支持向量機方法在處理非線性特征時靈活性不足,難以適應高維數(shù)據(jù)的復雜性,限制了分類器的識別能力和決策邊界的適應性。
技術實現(xiàn)思路
1、為了解決上述技術問題,本發(fā)明提供了一種面向狀態(tài)預測的全固廢透水混凝土檢測數(shù)據(jù)處理方法,以達到通過改進的數(shù)據(jù)擴充、特征提取、特征降維和分類技術,解決現(xiàn)有技術在樣本數(shù)量不足、特征處理不穩(wěn)定和分類準確性不足等問題,以提升混凝土狀態(tài)預測的精度和可靠性,實現(xiàn)對全固廢透水混凝土的全面評估和質(zhì)量控制。
2、為實現(xiàn)此技術目的,本發(fā)明采用如下方案:
3、一種面向狀態(tài)預測的全固廢混凝土檢測數(shù)據(jù)處理方法,按照如下步驟進行:
4、s1、數(shù)據(jù)采集與標注
5、對全固廢透水混凝土檢測數(shù)據(jù)的采集與標注,得到原始數(shù)集;
6、s2、數(shù)據(jù)的擴充
7、基于對抗增強的生成對抗網(wǎng)絡算法進行樣本生成,進而實現(xiàn)數(shù)據(jù)擴充;基于對抗增強的生成對抗網(wǎng)絡由生成器和判別器組成,生成器用于生成新樣本,判別器則負責評估生成樣本的真實度;通過對抗樣本增強技術生成新的虛擬樣本;
8、s3、特征提取模型訓練
9、基于動態(tài)群體進化優(yōu)化的神經(jīng)網(wǎng)絡算法作為特征提取模型,將擴充后的數(shù)據(jù)輸入到特征提取模型中進行特征提取模型的訓練;
10、s4、特征降維模型訓練
11、基于特征細化的自編碼神經(jīng)網(wǎng)絡作為降維模型,將特征提取后的數(shù)據(jù)輸入到特征降維模型中進行特征降維模型的訓練;
12、s5、分類器模型訓練
13、采用基于量子相空間映射的支持向量機算法作為分類算法,將特征提取后的數(shù)據(jù)輸入到分類器中進行分類器模型的訓練,該方法利用特征耦合技術優(yōu)化核函數(shù)的參數(shù),增強模型對高維數(shù)據(jù)的適應性;
14、基于量子相空間映射的支持向量機算法訓練流程如下:
15、s501、初始化持向量機的權重參數(shù)和高階核函數(shù)參數(shù),表示為:
16、;
17、;
18、式中,為支持向量機的權重,為分類器的初始權重向量,為高階核函數(shù)的初始參數(shù);
19、s502、將降維后的訓練樣本的特征傳入模型,并根據(jù)高階核函數(shù)計算相似度矩陣,表示為:
20、;
21、式中,為第個樣本和第個樣本之間的相似度,為特征映射函數(shù),為樣本總數(shù),為第個樣本,為第個樣本;
22、特征輸入中的特征映射函數(shù)的計算方式表示為:
23、;
24、式中,為高斯核的寬度,為冪次,為正弦函數(shù)的頻率;
25、s503、將相似度矩陣映射到量子態(tài)空間,利用量子疊加原理生成對應的量子特征映射,進行量子態(tài)的構建,表示為:
26、;
27、式中,為量子態(tài),為與樣本相關的量子振幅;
28、s504、在量子特征空間中,構建支持向量機的決策邊界,并根據(jù)訓練樣本調(diào)整支持向量的選擇,計算決策邊界的方式表示為:
29、;
30、式中,為決策函數(shù),為支持向量機的偏置項;
31、支持向量機的偏置項的計算方式表示為:
32、;
33、式中,為第個樣本的真實標簽,為第i個樣本對應的量子態(tài);
34、s505、采用改進的損失函數(shù),通過梯度下降法最小化分類錯誤,更新權重參數(shù),損失函數(shù)的計算方式表示為:
35、;
36、式中,為支持向量機的損失函數(shù),為第i個樣本對應的量子態(tài),為第個樣本的真實標簽,為支持向量機的正則化參數(shù),表示l2范數(shù);
37、支持向量機權重的l2范數(shù)的計算方式表示為:
38、;
39、式中,為輸入到支持向量機的特征維度,為權重向量的第個分量;
40、s506、根據(jù)損失函數(shù)的反饋,動態(tài)調(diào)整高階核函數(shù)的參數(shù),優(yōu)化核函數(shù)的表現(xiàn),高階核函數(shù)的更新方式表示為:
41、;
42、式中,為支持向量機的學習率,表示第次迭代的核函數(shù)的參數(shù),表示第次迭代的核函數(shù)的參數(shù),為支持向量機的損失函數(shù)對高階核函數(shù)參數(shù)的梯度;
43、進一步地,損失函數(shù)對高階核函數(shù)參數(shù)的梯度計算方式表示為:
44、;
45、式中,為相似度矩陣對高階核參數(shù)的導數(shù),表示相似度如何受參數(shù)變化的影響;為取最大值函數(shù);
46、進一步地,在迭代訓練過程中,更新支持向量機權重的方式表示為:
47、;
48、式中,為第次迭代的支持向量機的權重,為第次迭代的支持向量機的權重;
49、進一步地,損失函數(shù)對權重的梯度計算方式表示為:
50、;
51、式中,為指示函數(shù),表示當?shù)趥€樣本的預測不正確時為1,其他情況為0;
52、s507、重復迭代上述步驟,直至滿足預設的停止迭代條件,即表示模型訓練完成;
53、s6、混凝土樣本檢驗
54、利用訓練完成的模型進行混凝土樣本檢驗。
55、與現(xiàn)有技術相比,本發(fā)明的有益效果在于:
56、本方法采用基于對抗增強的生成對抗網(wǎng)絡算法進行數(shù)據(jù)擴充,通過生成器和判別器的相互作用,生成具有真實度的新樣本,解決了訓練數(shù)據(jù)不足導致模型泛化能力差的問題;采用動態(tài)群體進化優(yōu)化的神經(jīng)網(wǎng)絡算法進行特征提取,有效應對了傳統(tǒng)神經(jīng)網(wǎng)絡在梯度消失和爆炸等問題,實現(xiàn)了對高維數(shù)據(jù)的準確特征捕捉,提升了模型的泛化能力和訓練效率;采用基于特征細化的自編碼神經(jīng)網(wǎng)絡進行特征降維,有效保留了數(shù)據(jù)重要信息,減小了數(shù)據(jù)維度,提高了后續(xù)分類器處理效率;采用量子相空間映射的支持向量機算法,優(yōu)化了核函數(shù)參數(shù),使得模型在處理非線性特征時更加靈活,提升了分類精度和決策邊界的適應性。
57、進一步的,本發(fā)明的優(yōu)選方案為:
58、步驟s1中數(shù)據(jù)采集的來源主要包括實驗室測試、現(xiàn)場施工監(jiān)測及歷史檢驗記錄,所采集的數(shù)據(jù)存儲為標準化的結構化格式,具體采用csv或數(shù)據(jù)庫格式;所采集的數(shù)據(jù)屬性包括
59、抗壓強度,反映混凝土抵抗壓力的能力,單位為mpa;
60、滲透性,表示水在混凝土中的滲透速度,單位為m/s;
61、孔隙率,表示混凝土內(nèi)空隙體積占總?cè)萘康谋壤?,單位?;
62、含水率,表示混凝土中水分含量,單位為%;
63、溫度,采集時環(huán)境溫度,單位為°c;
64、濕度,采集時環(huán)境濕度,單位為%;
65、養(yǎng)護時間,從混凝土澆筑到測試的時間,單位為天;
66、固廢比例,表示混凝土中固體廢物的比例,單位為%;
67、試件尺寸,表示試件的長度、寬度和高度,單位為mm;
68、施工方法,采用的施工技術使用字符標識;
69、步驟s1中對所采集到的數(shù)據(jù)進行標注,標注類別包括:
70、合格:表示混凝土達到相關標準;
71、不合格:表示混凝土未達到相關標準;
72、待檢:表示需要進一步檢測的樣本。
73、步驟s2中基于對抗增強的生成對抗網(wǎng)絡算法的訓練過程如下:
74、s201、初始化設定生成器和判別器的參數(shù),包括權重和偏置,偏置初始化為0,權重初始化的方式表示為:
75、;
76、式中,表示生成器初始權重,表示判別器初始權重,為均值為0、方差為的正態(tài)分布,表示正態(tài)分布,表示服從于特定分布;
77、s202、將原始數(shù)據(jù)集輸入到生成器,生成一定數(shù)量的虛擬樣本,表示為:
78、;
79、式中,為生成的樣本,表示生成器函數(shù),為從潛在空間隨機抽取的噪聲向量,表示第次迭代的生成器的權重;
80、s203、將生成的樣本輸入到判別器中進行評估,獲取生成樣本的真實度評分,表示為:
81、;
82、式中,為判別器對生成樣本的評分,表示判別器函數(shù),表示第次迭代的判別器的權重;
83、s204、通過優(yōu)化算法調(diào)整判別器的參數(shù),以提高其對生成樣本的區(qū)分能力,對于判別器優(yōu)化,其損失函數(shù)的計算方式表示為:
84、;
85、式中,為判別器損失,為真實數(shù)據(jù)分布,為生成樣本分布,為期望,為真實數(shù)據(jù);
86、s205、對生成器反饋調(diào)整,根據(jù)判別器的評估結果,反饋給生成器,調(diào)整生成器的參數(shù),使其生成的樣本在真實度上更接近于真實樣本,其損失函數(shù)的計算方式表示為:
87、;
88、式中,為生成器損失;
89、s206、對生成樣本進行小幅度擾動,以獲取更加豐富的樣本,實現(xiàn)對抗樣本增強,表示為:
90、;
91、式中,為對抗增強樣本,為擾動幅度,表示判別器對生成樣本的梯度,為符號函數(shù);
92、判別器對生成樣本的梯度的計算方式表示為:
93、;
94、式中,的計算方式為:
95、;
96、s207、根據(jù)損失函數(shù),更新生成器和判別器的參數(shù),更新方式表示為:
97、;
98、;
99、式中,和分別為判別器和生成器的學習率,為第次迭代的判別器權重,為第次迭代的生成器權重;
100、s208、重復迭代上述步驟,直至滿足預設的停止迭代條件,即表示數(shù)據(jù)擴充模型訓練完成;
101、數(shù)據(jù)擴充模型訓練完成后,利用訓練好的數(shù)據(jù)擴充模型進行樣本數(shù)量的增加。
102、步驟s3中基于動態(tài)群體進化優(yōu)化的神經(jīng)網(wǎng)絡算法作為特征提取模型對擴充數(shù)據(jù)進行特征提取模型的具體訓練過程如下:
103、s301、根據(jù)仿生算法初始化方式,在初始化階段,生成一個初始的種群,每個個體代表一種網(wǎng)絡權重的配置,具體的,設種群大小為,為第個個體初始化權重和偏置,表示為:
104、;
105、;
106、式中,為第個個體對應的神經(jīng)網(wǎng)絡的權重,為第個個體對應的神經(jīng)網(wǎng)絡的偏置,表示第個個體在初始狀態(tài)的權重矩陣;表示第個個體在初始狀態(tài)的偏置;表示初始化的方差;表示均值為0、方差為的正態(tài)分布;為正態(tài)分布;
107、s302、對于種群中的每個個體,利用其對應的神經(jīng)網(wǎng)絡配置來處理輸入的訓練數(shù)據(jù),計算模型的輸出,并根據(jù)預定的損失函數(shù)評估其性能,具體的,對于第個個體,利用其權重和偏置計算在訓練數(shù)據(jù)集上的損失,表示為:
108、;
109、式中,為第個個體對應的神經(jīng)網(wǎng)絡的損失;表示當前批次輸入的樣本數(shù)量;表示復合損失函數(shù),表示神經(jīng)網(wǎng)絡模型函數(shù);表示第個樣本的特征;表示第個樣本的標簽;
110、復合損失函數(shù)包含正則化項,能夠增加模型的泛化能力,計算方式表示為:;
111、式中,是均方誤差函數(shù),是正則化項,為正則化參數(shù);
112、進一步地,正則化項的計算方式表示為:
113、;
114、式中,為為第個個體對應的神經(jīng)網(wǎng)絡的第個權重;
115、s303、根據(jù)個體的適應度,從當前種群中選擇表現(xiàn)最好的個體進行保留,作為下一代的候選解,具體的,基于個體的適應度進行選擇,優(yōu)秀個體有更高概率被選中,個體被選擇的概率的計算方式表示為:
116、;
117、式中,表示第個個體被選擇的概率;是控制選擇壓力的參數(shù);為第個個體對應的神經(jīng)網(wǎng)絡的損失;
118、s304、通過交叉和變異操作生成新的個體,交叉操作允許兩個優(yōu)秀個體交換部分基因,生成新的子代;變異操作則是隨機改變個體中的部分基因,以增加種群的多樣性,具體的,交叉操作隨機選擇兩個個體進行基因交換,表示為:
119、;
120、;
121、式中,是交叉率,為選定的第一個個體對應的神經(jīng)網(wǎng)絡的權重,為選定的第一個個體對應的神經(jīng)網(wǎng)絡的偏置,為選定的第二個個體對應的神經(jīng)網(wǎng)絡的權重,為選定的第二個個體對應的神經(jīng)網(wǎng)絡的偏置,為交叉操作后的個體對應的神經(jīng)網(wǎng)絡的權重,為交叉操作后的個體對應的神經(jīng)網(wǎng)絡的偏置;
122、且,變異操作對新生成的個體權重進行小幅度隨機擾動,表示為:
123、;
124、;
125、式中,表示變異的方差,為變異操作后的個體對應的神經(jīng)網(wǎng)絡的權重,為變異操作后的個體對應的神經(jīng)網(wǎng)絡的偏置;
126、s305、重復迭代上述步驟,直至滿足預設的停止迭代條件,即表示模型訓練完成。
127、步驟s4中基于特征細化的自編碼神經(jīng)網(wǎng)絡由編碼器、解碼器、特征調(diào)整模塊三部分構成,編碼器負責將高維輸入數(shù)據(jù)映射到低維特征空間,解碼器用于將降維后的特征重構回原始空間,以保證降維過程的可逆性;調(diào)整模塊通過遞歸特征自適應優(yōu)化動態(tài)調(diào)整降維后的特征空間,使得重要特征能夠得到強化,次要特征被逐步弱化,從而使得降維后的特征表示在保留數(shù)據(jù)信息的同時具備較好的簡潔性;
128、基于特征細化的自編碼神經(jīng)網(wǎng)絡算法的訓練流程如下:
129、s401、首先,設輸入到自編碼神經(jīng)網(wǎng)絡的數(shù)據(jù)為,編碼器采用多層非線性映射結構,將高維數(shù)據(jù)映射到初始的低維特征空間,表示為:
130、;
131、式中,表示初始低維特征,為編碼器的權重矩陣,為編碼器的偏置向量,為編碼器的多層sigmoid激活函數(shù);
132、s402、在低維特征生成后,特征調(diào)整模塊根據(jù)當前特征空間中的特征重要性,自動生成特征權重,該模塊初始化時對所有特征賦予相同的初始權重,以便后續(xù)步驟中根據(jù)特征貢獻逐步調(diào)整,初始權重矩陣的計算方式表示為:
133、;
134、式中,為初始權重矩陣;為特征權重向量,中的每個元素初始化為相同的值,表示所有特征在初始階段具有相同的重要性;為提取矩陣的對角線元素的函數(shù);
135、進一步地,調(diào)整后的特征可以表示為:
136、;
137、式中,為經(jīng)過特征權重調(diào)整后的特征表示;
138、s403、特征調(diào)整模塊對初步生成的低維特征進行遞歸優(yōu)化,在每一輪迭代中,模塊會根據(jù)前一輪特征的表現(xiàn),調(diào)整各個特征的權重,逐步增強有重要影響的特征,并逐步削弱冗余或噪聲特征,設第輪迭代中,權重的更新規(guī)則如下:
139、;
140、式中,表示第輪迭代的特征權重,表示第輪迭代的特征權重,為自編碼神經(jīng)網(wǎng)絡的學習率,為自編碼神經(jīng)網(wǎng)絡的損失函數(shù),為標簽數(shù)據(jù),表示損失函數(shù)對特征權重的梯度;
141、s404、為了確保降維過程的有效性,解碼器將低維特征重新映射回高維空間,以確保降維過程沒有丟失重要信息,解碼器的重構過程表示為:
142、;
143、式中,為重構后的高維數(shù)據(jù),為解碼器的權重矩陣,為解碼器的偏置向量,為解碼器的多層sigmoid激活函數(shù);
144、s405、重復迭代上述步驟,直至滿足預設的停止迭代條件,即表示模型訓練完成。