本發(fā)明屬于大地電磁數(shù)據(jù)降噪,具體涉及一種基于自監(jiān)督對比學(xué)習(xí)的大地電磁信號去噪方法及系統(tǒng)。
背景技術(shù):
1、大地電磁測深法是一種關(guān)鍵的地球物理勘探技術(shù),通過利用天然交變電磁場作為場源,分析地下巖層的電學(xué)性質(zhì)和分布特點(diǎn)。然而,由于大地電磁信號本身非常微弱,容易受到各種噪聲的干擾,特別是隨著科技的進(jìn)步,重工業(yè)導(dǎo)致的電磁干擾也越來越嚴(yán)重。因此,在進(jìn)行大地電磁探測時(shí),如何消除強(qiáng)干擾,提升大地電磁測深數(shù)據(jù)質(zhì)量的同時(shí)保留盡可能多的有用信息,是該領(lǐng)域的重要研究課題。
2、眾多學(xué)者已將多種信號處理方法應(yīng)用于該領(lǐng)域,并在一定程度上改善了大地電磁測深數(shù)據(jù)的質(zhì)量。然而,現(xiàn)有的有監(jiān)督學(xué)習(xí)方法需要大量帶標(biāo)簽的數(shù)據(jù)集,而對海量大地電磁數(shù)據(jù)進(jìn)行標(biāo)注顯然非常困難且不實(shí)際,從而導(dǎo)致現(xiàn)有的有監(jiān)督學(xué)習(xí)方法的局限性,此外,開發(fā)適用于多地點(diǎn)、多種類噪聲特征的模型也是本領(lǐng)域一個極具挑戰(zhàn)性的任務(wù)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是解決現(xiàn)有有監(jiān)督學(xué)習(xí)方法需要大量帶標(biāo)簽的數(shù)據(jù)集,并且難以訓(xùn)練出適用于多地點(diǎn)、多種類噪聲特征的模型的問題。進(jìn)而提出了一種基于自監(jiān)督對比學(xué)習(xí)的大地電磁信號去噪方法及系統(tǒng),即通過自監(jiān)督預(yù)訓(xùn)練對比學(xué)習(xí)方法進(jìn)行大地電磁降噪。本發(fā)明技術(shù)方案同時(shí)利用時(shí)域、頻域兩個維度的特征,并通過頻域和時(shí)頻一致性進(jìn)行對比學(xué)習(xí),其中,在本發(fā)明設(shè)定的時(shí)間域編碼器與頻率域編碼器的網(wǎng)絡(luò)架構(gòu)相同的前提下,模型從同一大地電磁數(shù)據(jù)中學(xué)習(xí)到基于時(shí)間的表示和基于頻率的表示在聯(lián)合時(shí)頻特征空間中彼此距離更近,與不同的大地電磁數(shù)據(jù)學(xué)習(xí)到的表示則距離更遠(yuǎn),因此,本發(fā)明充分利用該時(shí)頻一致性的特性進(jìn)行模型訓(xùn)練,使得基于時(shí)頻一致性所開發(fā)的模型可以捕獲大地電磁數(shù)據(jù)時(shí)頻域潛在的共同特征,并進(jìn)一步增強(qiáng)不同大地電磁數(shù)據(jù)集之間的知識轉(zhuǎn)移,更適應(yīng)不同的大地電磁數(shù)據(jù)由于跨地區(qū)、跨時(shí)間的動態(tài)變化引起的復(fù)雜化,進(jìn)而采用對比學(xué)習(xí)框架,實(shí)現(xiàn)自我監(jiān)督的訓(xùn)練,無需在預(yù)訓(xùn)練數(shù)據(jù)集中使用標(biāo)簽,使得后續(xù)僅在微調(diào)階段使用小部分帶標(biāo)簽數(shù)據(jù)。
2、一方面,本發(fā)明提供一種基于自監(jiān)督對比學(xué)習(xí)的大地電磁信號去噪方法,包括以下步驟:
3、步驟s1:構(gòu)建含噪信號樣本以及獲取所述含噪信號樣本的噪聲輪廓樣本和/或純凈信號樣本;
4、步驟s2:利用所述含噪信號樣本采用自監(jiān)督對比學(xué)習(xí)方法訓(xùn)練出基于對比學(xué)習(xí)框架的預(yù)訓(xùn)練去噪模型,所述去噪模型的輸入為大地電磁含噪信號,輸出為降噪的大地電磁信號或大地電磁信號的噪聲輪廓;
5、其中,所述基于對比學(xué)習(xí)框架的預(yù)訓(xùn)練去噪模型包括時(shí)間域編碼器、頻率域編碼器以及分別與對應(yīng)所述時(shí)間域編碼器、頻率域編碼器連接的兩個相同架構(gòu)的跨空間投影儀,所述時(shí)間域編碼器與所述頻率域編碼器的網(wǎng)絡(luò)架構(gòu)相同,所述跨空間投影儀將基于時(shí)間和基于頻率的表示映射到相同的時(shí)頻空間,所述時(shí)間域編碼器的輸入為大地電磁含噪信號的時(shí)域信息;所述頻率域編碼器的輸入為大地電磁含噪信號的頻域信息;自監(jiān)督對比學(xué)習(xí)過程是基于時(shí)間-頻率一致性的對比學(xué)習(xí);
6、步驟s3:將帶標(biāo)簽的含噪信號樣本輸入訓(xùn)練好的所述基于對比學(xué)習(xí)框架的預(yù)訓(xùn)練去噪模型其中,參照所述預(yù)訓(xùn)練去噪模型固定對比學(xué)習(xí)框架中除回歸層之外各層模型參數(shù),利用帶標(biāo)簽的含噪信號樣本對所述對比學(xué)習(xí)框架的回歸層進(jìn)行調(diào)整,得到訓(xùn)練好的去噪模型;
7、步驟s4:利用訓(xùn)練好的去噪模型對待降噪的含噪信號樣本進(jìn)行降噪。
8、自監(jiān)督學(xué)習(xí)的對比學(xué)習(xí)的核心在于從無標(biāo)注的數(shù)據(jù)中學(xué)習(xí)特征表示,并將其應(yīng)用于下游任務(wù)。其指導(dǎo)思想是通過構(gòu)造相似實(shí)例和不相似實(shí)例,訓(xùn)練一個表示學(xué)習(xí)模型,使相似實(shí)例在投影空間中更接近,而不相似實(shí)例在投影空間中距離更遠(yuǎn)。對比學(xué)習(xí)具有三個關(guān)鍵問題:編碼器的設(shè)計(jì)、損失函數(shù)的選取和正負(fù)樣本對(本技術(shù)將時(shí)域和頻域作為一個樣本對,通過兩者的時(shí)頻一致性的對比實(shí)現(xiàn)模型預(yù)訓(xùn)練)的構(gòu)造。通過對比學(xué)習(xí),可以減少對有標(biāo)簽數(shù)據(jù)的依賴,更高效地處理大地電磁數(shù)據(jù),并提升去噪的精度和可靠性。引入對比學(xué)習(xí)后,模型能夠在不同環(huán)境和噪聲條件下更好地提取和區(qū)分信號特征,從而提高大地電磁測深數(shù)據(jù)的整體質(zhì)量。本發(fā)明的方法不僅為大地電磁信噪分離提供了新的解決方案,也為自監(jiān)督學(xué)習(xí)在地球物理領(lǐng)域的應(yīng)用開辟了新的方向。
9、本發(fā)明使用一種時(shí)間-頻率一致性的對比學(xué)習(xí)模型,該模型是基于個體判別代理任務(wù)進(jìn)行訓(xùn)練。時(shí)間頻率一致性的核心思想是跨地區(qū)跨時(shí)間大地電磁數(shù)據(jù)集的噪聲時(shí)頻特征保持不變,并利用它來誘導(dǎo)有效的預(yù)訓(xùn)練對比學(xué)習(xí)模型,本發(fā)明的數(shù)據(jù)集是時(shí)域和頻域的樣本,那么他們就會在特征空間中表現(xiàn)出一定的差異,視為跨地區(qū)跨時(shí)間,這樣可以使模型更好地在時(shí)間和空間上捕捉到不同的信息維度。大地電磁時(shí)間域波形展示了傳感器讀數(shù)隨時(shí)間變化的方式,而頻率域則顯示了信號在整個頻譜中每個頻率分量的占比??紤]頻率域可以為大地電磁時(shí)域波形中的噪聲形態(tài)做更好的理解,這是僅通過時(shí)間域波形無法直接捕捉到的。然而,現(xiàn)有的利用機(jī)器學(xué)習(xí)完成大地電磁數(shù)據(jù)去噪的方法僅專注于對時(shí)間域的建模,完全忽視了頻率域。
10、本發(fā)明假設(shè)模型從同一大地電磁數(shù)據(jù)中學(xué)習(xí)到基于時(shí)間的表示和基于頻率的表示在聯(lián)合時(shí)頻特征空間中彼此距離更近,與不同的大地電磁數(shù)據(jù)學(xué)習(xí)到的表示則距離更遠(yuǎn)。上述假設(shè)在本發(fā)明技術(shù)方案下是成立的,因?yàn)闀r(shí)間域和頻率域的特征是通過相同的網(wǎng)絡(luò)架構(gòu)提取的,它們就會在特征空間中表現(xiàn)得更接近。因?yàn)橥粋€樣本在時(shí)間域和頻率域中的表示都來自相同的數(shù)據(jù)源,盡管表達(dá)方式不同,但它們的語義信息本質(zhì)上是相同的。因此,基于時(shí)頻一致性的對比學(xué)習(xí),相似的實(shí)例在投影空間中較接近,不相似的實(shí)例在投影空間中距離較遠(yuǎn),從而進(jìn)行模型更新。進(jìn)而本發(fā)明采用對比學(xué)習(xí)框架,基于時(shí)頻表示的一致性開發(fā)模型實(shí)現(xiàn)自我監(jiān)督的訓(xùn)練,無需在預(yù)訓(xùn)練數(shù)據(jù)集中使用標(biāo)簽,后續(xù)僅在微調(diào)階段使用小部分帶標(biāo)簽數(shù)據(jù),微調(diào)階段調(diào)整的回歸層參數(shù)主要指代跨空間投影儀和輸出層。
11、進(jìn)一步可選地,步驟s2中自監(jiān)督對比學(xué)習(xí)過程是基于設(shè)定的損失函數(shù)進(jìn)行自監(jiān)督對比學(xué)習(xí),設(shè)定的損失函數(shù)至少包含下述時(shí)頻一致性的損失函數(shù):
12、
13、式中,lc,i為時(shí)頻一致性的損失函數(shù),表示針對輸入樣本的基于時(shí)間的特征與基于頻率的特征之間的距離,δ是給定的常數(shù)邊界;
14、使用表示特征和特征之間的距離,使用表示特征和特征之間的距離,使用表示特征和特征之間的距離,使用表示特征和特征之間的距離;
15、每個輸入樣本分別進(jìn)行時(shí)域增廣、頻域增廣得到增廣樣本進(jìn)而模型得到四個特征,分別為
16、rt、rf分別表示對應(yīng)時(shí)間域編碼器、頻率域編碼器連接的兩個跨空間投影儀的全連接層,為樣本輸入時(shí)間域編碼器得到的,為樣本的頻譜輸入頻率域編碼器得到的。
17、應(yīng)當(dāng)理解,上述損失函數(shù)是本發(fā)明的舉例說明,其他可行的實(shí)施例中,還有諸多損失函數(shù)可以滿足本發(fā)明的需求。
18、進(jìn)一步可選地,步驟s2中自監(jiān)督對比學(xué)習(xí)過程是基于設(shè)定的損失函數(shù)進(jìn)行自監(jiān)督對比學(xué)習(xí),所述損失函數(shù)除時(shí)頻一致性的損失函數(shù)外,還設(shè)有基于時(shí)域的損失函數(shù)以及基于頻域的損失函數(shù)。
19、進(jìn)一步可選地,基于時(shí)域的損失函數(shù)如下:
20、
21、式中,lt,i為基于時(shí)域的損失函數(shù),為之間的距離,是輸入樣本和輸入樣本的時(shí)域增廣樣本輸入時(shí)間域編碼器得到的;sim(,)表示余弦相似度,τ表示調(diào)節(jié)尺度的溫度函數(shù),為輸入樣本輸入時(shí)間域編碼器gt得到的;
22、基于頻域的損失函數(shù)如下:
23、
24、式中,lf,i為基于頻域的損失函數(shù),為之間的距離,是輸入樣本和輸入樣本的頻域增廣樣本輸入頻率域編碼器得到的;sim(,)表示余弦相似度,τ表示調(diào)節(jié)尺度的溫度函數(shù),為輸入樣本輸入頻率域編碼器gt得到的。
25、在對比學(xué)習(xí)方法的訓(xùn)練過程中,本發(fā)明技術(shù)方案優(yōu)選利用基于時(shí)域、頻域和時(shí)頻一致性的損失函數(shù),即在時(shí)頻一致性對比基礎(chǔ)上,優(yōu)選原始樣本與增廣樣本的時(shí)域特征進(jìn)行對比,原始樣本與增廣樣本的頻域特征進(jìn)行對比。首先,時(shí)域?qū)Ρ葥p失函數(shù)促使模型對原始樣本和增廣樣本學(xué)習(xí)相近的時(shí)域特征。其次,頻域?qū)Ρ葥p失函數(shù)促使模型對于原始樣本頻譜和增廣后樣本頻譜學(xué)習(xí)到相近的頻域特征。最后,時(shí)頻一致性損失函數(shù)引導(dǎo)模型保持基于時(shí)域和頻域特征之間的一致性。利用這三個損失函數(shù)訓(xùn)練使模型能夠?qū)W習(xí)到更多的正樣本特性,從而更好地滿足大地電磁數(shù)據(jù)的去噪需求。
26、而上述基于時(shí)域的損失函數(shù)以及基于頻域的損失函數(shù)均為本發(fā)明的優(yōu)選實(shí)例,可以促使時(shí)間域或頻率域編碼器為正樣本對(同一樣本)生成更緊密的基于時(shí)域或頻域的特征,并將負(fù)樣本對(不同樣本)彼此分開,這是對于損失函數(shù)的要求。其他可行的實(shí)施例中,采用能夠?qū)崿F(xiàn)對比的時(shí)域損失函數(shù)、頻域損失函數(shù)也是滿足本發(fā)明需求的。
27、進(jìn)一步可選地,頻率域編碼器的網(wǎng)絡(luò)架構(gòu)與時(shí)間域編碼器的相同,均設(shè)有三個resnets模塊,每個resnets模塊由1個卷積層、1個批歸一化層和1個激活函數(shù)層構(gòu)成;
28、其中,在輸入后設(shè)有兩個輸出方向,一個輸出方向指向第一個resnets模塊,另一個輸出方向經(jīng)輸入之后跳躍連接與第一個resnets模塊中經(jīng)卷積層特征提取后輸出的元素進(jìn)行相加組成第一個局部殘差網(wǎng)絡(luò);第一個局部殘差網(wǎng)絡(luò)的輸出有兩個輸出方向,一個輸出方向指向第二個resnets模塊,另一個輸出方向經(jīng)輸入之后跳躍連接與第二個resnets模塊中經(jīng)卷積層特征提取后輸出的元素進(jìn)行相加組成第二個局部殘差網(wǎng)絡(luò);第二個局部殘差網(wǎng)絡(luò)的輸出有兩個輸出方向,一個輸出方向指向第三個resnets模塊,另一個輸出方向經(jīng)輸入之后跳躍連接與第三個resnets模塊中經(jīng)卷積層特征提取后輸出的元素進(jìn)行相加組成第三個局部殘差網(wǎng)絡(luò)。
29、其中,這四個組件的協(xié)同工作,使得對比學(xué)習(xí)模型能夠充分利用大地電磁數(shù)據(jù)在時(shí)間和頻率上的信息,從而提高模型的學(xué)習(xí)和分析能力。時(shí)間域和頻率域編碼器分別從不同維度對信號進(jìn)行編碼,而跨空間投影儀則在統(tǒng)一的時(shí)頻空間內(nèi)對這些編碼進(jìn)行融合和比較,這種設(shè)計(jì)能夠使模型更全面地捕捉信號中的重要特征,為后續(xù)的信號處理和分析提供更豐富的信息。
30、舉例說明:在實(shí)例中,對比學(xué)習(xí)框架采用的是一維resnet骨干網(wǎng)絡(luò),編碼器由按層卷積塊組成,所有核的大小均為8,步長分別是8、1、1,深度分別為32、64、128,跨空間投影層中包含兩個全連接層,輸出尺度分別為256和128。在預(yù)訓(xùn)練中,使用學(xué)習(xí)率為0.0003,l2范數(shù)懲罰系數(shù)為0.0005,批大小為64,訓(xùn)練epoch為40,對于微調(diào)階段的回歸任務(wù)采用2層全連接層作為映射器,緯度分別為64和128,使用mse損失優(yōu)化映射器;
31、進(jìn)一步可選地,所述兩個相同架構(gòu)的跨空間投影儀均為全連接層,全連接層的權(quán)重相同或采用相同方法初始化全連接層的權(quán)重。另外,激活函數(shù)也可以選擇一致。
32、本發(fā)明技術(shù)方案采用時(shí)域和頻域兩種不同的數(shù)據(jù)增強(qiáng)技術(shù),確保在一個域中進(jìn)行數(shù)據(jù)增強(qiáng)后,另一個域的特征仍與原始數(shù)據(jù)特征相似,為后續(xù)對比學(xué)習(xí)方法奠定良好的數(shù)據(jù)增強(qiáng)基礎(chǔ)。
33、其中,該方法還包括:對含噪信號樣本進(jìn)行時(shí)頻一致性的時(shí)域增廣、頻域增廣;
34、所述頻率增廣的過程包括移除頻率分量和/或增強(qiáng)頻率分量,其中,定義一個預(yù)設(shè)值e,表示移除頻率分量、增強(qiáng)頻率分量被操作的頻率分量的個數(shù);
35、移除頻率分量:從整個頻譜中隨機(jī)選擇e個頻率分量,將其幅值設(shè)置為0,用以模擬頻率信息的缺失或減弱;
36、增強(qiáng)頻率分量:將整個頻譜幅值小于α·am的頻率分量中隨機(jī)選擇e個分量進(jìn)行增強(qiáng),幅值增強(qiáng)為α·am,am是頻譜中的最大幅值,α預(yù)設(shè)值,用于調(diào)整擾動頻率分量的尺度。
37、通過上述頻率移除和添加的步驟,可以為原始信號生成一個新的增廣序列。該增廣序列包含了頻域擾動后的信號,模擬了可能存在的頻率缺失和增強(qiáng)情況,進(jìn)而增加了模型在不同頻率分布情況下的魯棒性。
38、在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,除了網(wǎng)絡(luò)本身模型的特征提取外,神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本庫也起到了重要的作用。數(shù)據(jù)增廣是對比學(xué)習(xí)個體判別代理任務(wù)中構(gòu)建正負(fù)樣本對的基礎(chǔ)。時(shí)間序列數(shù)據(jù)常使用的時(shí)域增廣方式有減均值、幅值反轉(zhuǎn)、前后反轉(zhuǎn)、隨機(jī)清零、添加高斯白噪聲等,這些數(shù)據(jù)增廣方法或多或少的更改了原始樣本的時(shí)域特征,使增廣后的樣本集具有更多的數(shù)據(jù)多樣性,擴(kuò)展訓(xùn)練數(shù)據(jù)的規(guī)模,更有助于模型學(xué)習(xí)到同一物體在不同視角和變化下的特征,提高模型在真實(shí)場景中的適應(yīng)能力。
39、由于本發(fā)明需要從時(shí)域和頻域兩個角度對同一個樣本進(jìn)行學(xué)習(xí),所以需要增廣樣本與原始樣本保持時(shí)頻一致性。為了滿足時(shí)頻一致性,需要在一個域做增廣的同時(shí),保證增廣后的樣本在另一個域的特征與原樣本盡可能保持一致。這樣模型才能在時(shí)、頻兩個不同的特征空間中找到同一樣本的聯(lián)系。
40、進(jìn)一步可選地,本發(fā)明所述時(shí)域增廣方法為減均值、幅值反轉(zhuǎn)和前后反轉(zhuǎn)三種數(shù)據(jù)增廣方式。這三種數(shù)據(jù)增廣方法在時(shí)域波形上與原始樣本存在較大差異,但對原始樣本的頻譜幅值不會有改變,即頻譜特征不變,保持了增廣樣本與原始樣本的時(shí)頻一致性;
41、其中,減均值是將信號或數(shù)據(jù)的每個元素減去其均值,使數(shù)據(jù)的均值變?yōu)榱?;幅值反轉(zhuǎn)是將信號的每個元素乘以-1,使得信號的正值變?yōu)樨?fù)值,負(fù)值變?yōu)檎?;前后反轉(zhuǎn)是將信號或數(shù)據(jù)按時(shí)間順序反轉(zhuǎn),即將信號的時(shí)間序列從最后一個元素到第一個元素排列。
42、需要說明的是,盡管在時(shí)域上進(jìn)行了變換,但增廣后的樣本在頻率域上與原始樣本具有相同的特性,這確保了時(shí)頻一致性。這種特性對于許多應(yīng)用場景尤為重要,如信號處理和機(jī)器學(xué)習(xí)中的時(shí)序數(shù)據(jù)分析,能夠在增強(qiáng)數(shù)據(jù)多樣性的同時(shí),保留原始樣本的關(guān)鍵頻譜信息,從而提升算法的魯棒性和泛化能力。
43、進(jìn)一步可選地,本發(fā)明所述頻域增廣方法為通過擾動原始樣本的頻譜特征完成增廣,具體為引入低頻單點(diǎn)、低頻多點(diǎn)、高頻單點(diǎn)、高頻多點(diǎn)四種方式,保證頻率增廣的多樣性;
44、其中,低頻單點(diǎn)為在原始樣本的低頻段擾動一個頻點(diǎn),低頻多點(diǎn)為在原始樣本的低頻段擾動多個頻點(diǎn),高頻單點(diǎn)為在原始樣本的高頻段擾動一個頻點(diǎn),高頻多點(diǎn)為在原始樣本的高頻段擾動多個頻點(diǎn)。
45、需要說明的是,由于頻譜中的每個頻率分量表示一個具有相應(yīng)頻率和幅度的基函數(shù)(例如傅里葉變換的正弦函數(shù)),在上述低頻單點(diǎn)、低頻多點(diǎn)、高頻單點(diǎn)、高頻多點(diǎn)四種方式下,本發(fā)明還提出通過添加或移除頻率分量來擾動頻譜。頻域中的小擾動可能導(dǎo)致時(shí)間域中的波形發(fā)生較大變化,為了確保擾動后的大地電磁時(shí)間序列在時(shí)域和頻率域仍然與原始樣本相似,本發(fā)明采取了一系列措施。這些措施包括精確控制添加或移除的頻率分量的幅度和相位,以在不引起過大偏差的前提下實(shí)現(xiàn)信號的擾動。同時(shí),通過對頻譜進(jìn)行細(xì)致的分析和調(diào)節(jié),保證擾動后的信號在關(guān)鍵特性上與原始信號保持一致,從而確保在實(shí)際應(yīng)用中,擾動后的信號依然具有相同的物理和統(tǒng)計(jì)性質(zhì)。
46、進(jìn)一步可選地,步驟s1中構(gòu)建含噪信號樣本以及獲取所述含噪信號樣本的噪聲輪廓樣本和/或純凈信號樣本的過程如下:
47、步驟s1-1:構(gòu)建大地電磁信號的噪聲輪廓初始樣本庫和純凈信號初始樣本庫,其中,噪聲輪廓初始樣本是含噪信號樣本庫中大地電磁信號樣本的對應(yīng)噪聲輪廓;
48、步驟s1-2:將噪聲輪廓樣本和純凈信號樣本均進(jìn)行時(shí)域增廣和頻域增廣;
49、步驟s1-3:將增廣后的噪聲輪廓作為新增噪聲輪廓樣本,以及將增廣后的純凈信號作為新增純凈信號樣本,進(jìn)而擴(kuò)充噪聲輪廓樣本庫和純凈信號樣本庫;
50、步驟s1-4:將進(jìn)行增廣前的噪聲輪廓樣本與增廣后的噪聲輪廓樣本共同組成噪聲輪廓樣本庫,將進(jìn)行增廣前的純凈信號樣本與增廣后的純凈信號樣本共同組成純凈信號樣本庫,后將這兩個樣本庫相加得到含噪信號樣本庫。
51、第二方面,本發(fā)明技術(shù)方案提供一種基于所述大地電磁信號去噪方法的系統(tǒng),包括:
52、樣本庫構(gòu)建模塊,用于構(gòu)建含噪信號樣本以及獲取所述含噪信號樣本的噪聲輪廓樣本和/或純凈信號樣本;
53、模型構(gòu)建模塊,用于利用所述含噪信號樣本采用自監(jiān)督對比學(xué)習(xí)方法訓(xùn)練出基于對比學(xué)習(xí)框架的預(yù)訓(xùn)練去噪模型,所述去噪模型的輸入為大地電磁含噪信號,輸出為降噪的大地電磁信號或大地電磁信號的噪聲輪廓;
54、其中,所述基于對比學(xué)習(xí)框架的預(yù)訓(xùn)練去噪模型包括時(shí)間域編碼器、頻率域編碼器以及分別與對應(yīng)所述時(shí)間域編碼器、頻率域編碼器連接的兩個相同架構(gòu)的跨空間投影儀,所述時(shí)間域編碼器與所述頻率域編碼器的網(wǎng)絡(luò)架構(gòu)相同,所述跨空間投影儀將基于時(shí)間和基于頻率的表示映射到相同的時(shí)頻空間,所述時(shí)間域編碼器的輸入為大地電磁含噪信號的時(shí)域信息;所述頻率域編碼器的輸入為大地電磁含噪信號的頻域信息;自監(jiān)督對比學(xué)習(xí)過程是基于時(shí)間-頻率一致性的對比學(xué)習(xí);
55、微調(diào)模塊,用于將帶標(biāo)簽的含噪信號樣本輸入訓(xùn)練好的所述基于對比學(xué)習(xí)框架的預(yù)訓(xùn)練去噪模型,其中,其中,參照所述預(yù)訓(xùn)練去噪模型固定對比學(xué)習(xí)框架中除回歸層之外各層模型參數(shù),利用帶標(biāo)簽的含噪信號樣本對所述對比學(xué)習(xí)框架的回歸層進(jìn)行調(diào)整,得到訓(xùn)練好的去噪模型;
56、噪聲處理模塊,用于利用訓(xùn)練好的去噪模型對待降噪的含噪信號樣本進(jìn)行降噪。
57、第三方面,本發(fā)明技術(shù)方案還提供一種電子終端包括:一個或多個處理器;以及存儲了一個或多個計(jì)算機(jī)程序的存儲器;
58、其中,所述處理器調(diào)用所述計(jì)算機(jī)程序以實(shí)現(xiàn):一種基于自監(jiān)督對比學(xué)習(xí)的大地電磁信號去噪方法的步驟。
59、第四方面,本發(fā)明技術(shù)方案提供一種計(jì)算機(jī)可讀存儲介質(zhì),存儲了計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器調(diào)用以實(shí)現(xiàn):一種基于自監(jiān)督對比學(xué)習(xí)的大地電磁信號去噪方法的步驟。
60、有益效果
61、與現(xiàn)有方法相比,本發(fā)明的優(yōu)點(diǎn)有:
62、1、本發(fā)明提供了一種基于自監(jiān)督對比學(xué)習(xí)模型的大地電磁信號去噪方法及系統(tǒng)。相較于傳統(tǒng)有監(jiān)督學(xué)習(xí)方法需要大量帶標(biāo)簽的數(shù)據(jù),本發(fā)明通過自監(jiān)督對比學(xué)習(xí)技術(shù),減少了對有標(biāo)簽數(shù)據(jù)的依賴,還能夠在不同環(huán)境和噪聲條件下更好地提取和區(qū)分信號特征,大幅度提高了處理效率和噪聲分離的精度與可靠性。具體的,本發(fā)明利用時(shí)間-頻率一致性的對比學(xué)習(xí)模型,通過設(shè)計(jì)頻率域編碼器和時(shí)間域編碼器的網(wǎng)絡(luò)架構(gòu)的一致性確保了時(shí)間域和頻率域在特征提取過程中的對稱性,從而有助于最終映射到相同的時(shí)頻空間。保證了在處理不同域的數(shù)據(jù)時(shí),編碼器能夠以類似的方式進(jìn)行特征提取,從而有助于實(shí)現(xiàn)域之間的轉(zhuǎn)換和比較。該模型基于噪聲時(shí)頻特征保持不變的假設(shè),誘導(dǎo)有效的預(yù)訓(xùn)練對比學(xué)習(xí)模型,從而在聯(lián)合時(shí)頻特征空間中捕獲大地電磁數(shù)據(jù)的潛在共同特征。這種方法不僅考慮了時(shí)間域波形的變化,還充分利用了頻率域信息,彌補(bǔ)了現(xiàn)有方法僅專注于時(shí)間域建模的不足,提供了對噪聲形態(tài)更全面的理解。該模型包含時(shí)間域和頻率域編碼器及跨空間投影儀,能夠在微調(diào)階段僅使用少量帶標(biāo)簽數(shù)據(jù),實(shí)現(xiàn)高效去噪,為大地電磁信噪分離提供了創(chuàng)新解決方案。
63、2、本發(fā)明進(jìn)一步的優(yōu)化方案,使用時(shí)域和頻域進(jìn)行增廣,構(gòu)建對比學(xué)習(xí)的正負(fù)樣本對。通過結(jié)合時(shí)域和頻域增廣方法,顯著提升了大地電磁信號去噪的效果和模型的適應(yīng)能力。時(shí)域增廣方法如減均值、幅值反轉(zhuǎn)和前后反轉(zhuǎn)在引入數(shù)據(jù)多樣性的同時(shí),保持頻域特征不變,確保時(shí)頻一致性。頻域增廣通過低頻和高頻的單點(diǎn)、多點(diǎn)擾動,精確控制頻率分量的幅度和相位,保證擾動后的信號在時(shí)域和頻域與原始樣本相似。這種創(chuàng)新性的增廣策略,不僅擴(kuò)展了訓(xùn)練數(shù)據(jù)的多樣性,還增強(qiáng)了模型的魯棒性和泛化能力,為大地電磁信號處理提供了更加高效和可靠的解決方案。
64、3、本發(fā)明更進(jìn)一步的優(yōu)化方案,在對比學(xué)習(xí)方法的訓(xùn)練過程中,提出了一種基于時(shí)域、頻域和時(shí)頻一致性的損失函數(shù)。通過結(jié)合時(shí)域?qū)Ρ葥p失、頻域?qū)Ρ葥p失和時(shí)頻一致性損失,模型能夠更好地學(xué)習(xí)正樣本特性,滿足大地電磁數(shù)據(jù)去噪需求。時(shí)域?qū)Ρ葥p失函數(shù)促使模型對原始樣本和時(shí)域增廣樣本學(xué)習(xí)相近的時(shí)域特征;頻域?qū)Ρ葥p失函數(shù)則促使模型學(xué)習(xí)原始樣本頻譜和增廣后樣本頻譜的相似性;時(shí)頻一致性損失則引導(dǎo)模型保持時(shí)域和頻域特征的一致性。綜合使用這些損失函數(shù),顯著提升了模型的去噪效果和適應(yīng)能力。