本發(fā)明涉及音頻技術(shù)領(lǐng)域,尤其涉及一種基于聲振動信號的目標檢測與識別方法及系統(tǒng)。
背景技術(shù):
安防系統(tǒng)是以維護社會公共安全為目的,運用安全防范產(chǎn)品和其它相關(guān)產(chǎn)品所構(gòu)成的入侵報警系統(tǒng)、視頻安防監(jiān)控系統(tǒng)、出入口控制系統(tǒng)、防爆安全檢查等的系統(tǒng)。目前,安防系統(tǒng)通常采用人工、視頻及紅外等監(jiān)控方式,由于維護成本高、環(huán)境敏感度低、檢測精度和范圍受硬件設(shè)備限制,從而使現(xiàn)有安防系統(tǒng)的使用范圍存在一定的局限性。因此,如何進一步提高安防系統(tǒng)的可靠性和魯棒性并降低監(jiān)控成本,成為需要研究的重點問題之一。
當?shù)孛婺繕诉\行時,所激發(fā)的聲音和振動信號分別通過空氣和地球表面向四面?zhèn)鞑?,利用聲音?或地震動傳感器采集上述聲音和振動信號進行分析,可以對地面目標進行探測、分類和定位等。并且,振動對于其他信號而言,不易偽裝在探測行進人員方面具有獨特的優(yōu)勢。
例如,美軍開發(fā)的“倫巴斯”(REMBASS)系統(tǒng)包括聲震、紅外和電磁模塊,利用電池供電,可以對地面的人員和車輛進行探測及報警。該“論巴斯”系統(tǒng)升級后,可以探測75m以外的人員和250m以外的車輛。又如,美國史蒂文森理工學院研究的地震動傳感器可以分別探測到67m、83m和140m以外的人員走動、跑動和跳動信號。
在實現(xiàn)本發(fā)明技術(shù)方案的過程中,發(fā)明人發(fā)現(xiàn):基于聲音和振動信號的地面目標識別已經(jīng)經(jīng)過了多年的發(fā)展,各種新技術(shù)如自適應濾波、頻譜分析、人工神經(jīng)網(wǎng)絡(luò)等都被應用于地面目標識別中,取到了一定的成果。但是,地面目標檢測與識別時,實際環(huán)境復雜多變,目標類型多種多樣,導致現(xiàn)有振動信號目標識別系統(tǒng)在真實數(shù)據(jù)條件下的識別正確率在80%左右,距離高探測率、高準確識別率和低虛警率的實用需求仍有一定距離。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種基于聲振動信號的目標檢測與識別方法及系統(tǒng),用以解決現(xiàn)有技術(shù)中在實際環(huán)境復雜多變、目標類型多種多樣時振動目標識別系統(tǒng)識別正確率80%左右無法滿足實際需求的情況。
第一方面,本發(fā)明提供了一種基于聲振動信號的目標檢測與識別方法,所述方法包括:
利用M個或等效為M個光纖傳感器獲取預設(shè)節(jié)點位置且預設(shè)時間段內(nèi)的振動信號,并保存所有預設(shè)節(jié)點位置的振動信號數(shù)據(jù)得到振動數(shù)據(jù)矩陣;M為非零自然數(shù);
利用預加重方法對所述振動數(shù)據(jù)矩陣進行預處理以獲取K幀雙極性信號數(shù)據(jù);
根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從所述K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀;
利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征;
根據(jù)每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征以及對應加權(quán)值獲取一個較長的特征向量矩陣并對其降維處理;
根據(jù)雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量獲取長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型,并根據(jù)該模塊輸出每一雙極性數(shù)據(jù)幀中振動信號類別。
可選地,所述利用預加重方法對所述振動數(shù)據(jù)矩陣進行預處理以獲取K幀雙極性信號數(shù)據(jù)的步驟包括:
利用預加重公式對所述振動數(shù)據(jù)矩陣中每列數(shù)據(jù)進行濾波以得到對應的雙極性信號;
將預設(shè)數(shù)量的雙極性信號作為一幀雙極性信號數(shù)據(jù)從而得到K幀雙極性信號數(shù)據(jù),并且相鄰兩幀雙極性信號數(shù)據(jù)中前一幀的后半幀為后一幀的前半幀;
利用漢明函數(shù)對上述K幀雙極性信號數(shù)據(jù)加窗。
可選地,所述根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從所述K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀的步驟包括:
獲取每幀雙極性信號數(shù)據(jù)內(nèi)所有項數(shù)據(jù)的平方和即能量E以及每幀雙極性信號數(shù)據(jù)內(nèi)各項數(shù)據(jù)穿過橫軸次數(shù)之和即過零率Z,并獲取每項數(shù)據(jù)的能量E和過零率Z之積;
將上述每項數(shù)據(jù)的能量E和過零率Z之積與預設(shè)閾值比較,若積超過預設(shè)閾值則該幀雙極性信號數(shù)據(jù)內(nèi)存在目標信號并保存。
可選地,所述利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征的步驟包括:
對包括目標信號的雙極性數(shù)據(jù)幀做小波變換;
對小波變換后的雙極性數(shù)據(jù)幀的每層系數(shù)量化處理,并將量化后系數(shù)與設(shè)定閾值比較,將量化后系數(shù)小于設(shè)定閾值的當前層所有項數(shù)據(jù)置零;
逆小波變換重構(gòu)去噪信號;
隨后去除每行數(shù)據(jù)最開始的一些零值,統(tǒng)計移除零的個數(shù)作為速度特征。
可選地,所述利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征的步驟包括:
對包括目標信號的雙極性數(shù)據(jù)幀做小波變換;
計算小波變換不同層內(nèi)的能量分布作為能量分布特征。
可選地,所述利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征的步驟包括:
計算包括目標信號的雙極性數(shù)據(jù)幀的線性預測系數(shù)LPC特征;
利用牛頓-拉夫遜算法或者倒譜法計算線性預測系數(shù)LPC特征全極點模型中分母多項式A(z)的復根,根據(jù)所得復根確定共振峰;
計算所述共振峰的形狀統(tǒng)計量作為譜估計特征。
可選地,所述根據(jù)每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征以及對應加權(quán)值獲取一個較長的特征向量矩陣并對其降維處理的步驟包括:
分別定義每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征的加權(quán)值,計算每個預設(shè)節(jié)點的雙極性數(shù)據(jù)幀的加權(quán)聯(lián)合特征Vi,k;
將相同時刻將每個預設(shè)節(jié)點的加權(quán)聯(lián)合特征Vi,k進行聯(lián)合得到每個預設(shè)節(jié)點每類信號聯(lián)合特征Vk;
將M個預設(shè)節(jié)點的聯(lián)合特征Vk進行聯(lián)合得到每類信號特征V即較長的特征向量。
可選地,所述根據(jù)每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征以及對應加權(quán)值獲取一個較長的特征向量矩陣并對其降維處理的步驟包括:
對所述每類信號特征V求平均值,然后將每類信號特征V減去對應的平均值得到V’;
根據(jù)協(xié)方差公式計算特征協(xié)方差矩陣得到該特征協(xié)方差矩陣的特征值和特征向量;
從按照順序排序的特征值中選取特征值較大的前G個特征值對應的特征向量作為列向量構(gòu)成特征向量矩陣w;
將每類信號特征V與特征向量矩陣w相乘得到降維后的較長的特征向量矩陣。
可選地,所述長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型包括:輸入模塊、第一Tanh函數(shù)模塊、第二Tanh函數(shù)模塊、第一輸入門、第一記憶細胞、第二記憶細胞、遺忘門、輸出門、第一選擇門、第二選擇門、隱藏層模塊、輸出模塊、第一乘法器、第二乘法器和第三乘法器;其中,
所述第一Tanh函數(shù)的第一輸入端連接所述輸入模塊的輸出端,其第二輸入端連接所述第二選擇門的輸出端,其輸出端連接所述第一乘法器的第一輸入端;
所述輸入門的第一輸入端連接所述第二選擇門的輸出端,其第二輸入端連接所述第二記憶細胞的輸出端,其輸出端連接所述第一乘法器的第二輸入端;所述第一乘法器的輸出端連接所述第一記憶細胞的第一輸入端;
所述第二乘法器的第一輸入端連接所述第二記憶細胞的輸出端,其第二輸入端連接所述遺忘門的輸出端,其輸出端連接所述第一記憶細胞的第二輸入端;所述第一記憶細胞的輸出端連接所述第二Tanh函數(shù)模塊的輸入端;所述第二Tanh函數(shù)模塊的輸出端連接所述第三乘法器的輸入端;
所述遺忘門的輸入端連接所述第二選擇門的輸出端;
所述輸出門的第一輸入端連接所述第二選擇門的輸出端,其第二輸入端連接所述第二記憶細胞的輸出端,其第三輸入端連接所述第一Tanh函數(shù)模塊的輸出端,其輸出端連接所述第三乘法器的第二輸入端;所述第三乘法器的輸出端連接所述第一選擇門的輸入端;
所述隱藏層的輸入端連接所述第一選擇門的輸出端,其輸出端連接所述輸出模塊。
第二方面,本發(fā)明實施例還提供了一種基于聲振動信號的目標檢測與識別系統(tǒng),所述系統(tǒng)包括:
振動數(shù)據(jù)矩陣獲取模塊,用于利用M個或等效為M個光纖傳感器獲取預設(shè)節(jié)點位置且預設(shè)時間段內(nèi)的振動信號,并保存所有預設(shè)節(jié)點位置的振動信號數(shù)據(jù)得到振動數(shù)據(jù)矩陣;M為非零自然數(shù);
預處理模塊,用于利用預加重方法對所述振動數(shù)據(jù)矩陣進行預處理以獲取K幀雙極性信號數(shù)據(jù);
雙極性數(shù)據(jù)幀獲取模塊,用于根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從所述K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀;
特征提取模塊,用于利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征;
降維處理模塊,用于根據(jù)每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征以及對應加權(quán)值獲取一個較長的特征向量矩陣并對其降維處理;
振動信號類別識別模塊,用于根據(jù)雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量獲取長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型,并根據(jù)該模塊輸出每一雙極性數(shù)據(jù)幀中振動信號類別。
本發(fā)明通過利用M個或等效為M個光纖傳感器獲取預設(shè)節(jié)點位置且預設(shè)時間段內(nèi)的振動信號,并保存所有預設(shè)節(jié)點位置的振動信號數(shù)據(jù)得到振動數(shù)據(jù)矩陣,這樣可以采集到每個節(jié)點的C類振動信號;然后利用預加重方法對上述振動數(shù)據(jù)矩陣預處理獲取K幀雙極性信號數(shù)據(jù);根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從所述K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀,這樣方便后續(xù)過程中僅對有目標信號的雙極性數(shù)據(jù)幀進行處理,減少計算量;利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征,并根據(jù)上述各特征得到一個較長的特征向量矩陣,然后對該特征向量矩陣進行降維處理,這樣通過提取表征不同類型聲源引起的聲振動信號,有利于提高區(qū)分精度;最后利用長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型識別出不同步驟中雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量對應的振動信號類別,本發(fā)明實施例中長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型可以根據(jù)不同步驟的信息的共同作用決定聲振動信號識別,提高目標識別的辨識正確率。
附圖說明
通過參考附圖會更加清楚的理解本發(fā)明的特征和優(yōu)點,附圖是示意性的而不應理解為對本發(fā)明進行任何限制,在附圖中:
圖1是本發(fā)明實施例提供的基于聲振動信號的目標檢測與識別方法流程示意圖;
圖2是本發(fā)明實施例提供的長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖;
圖3是本發(fā)明實施例提供的基于聲振動信號的目標檢測與識別系統(tǒng)結(jié)構(gòu)框圖。
具體實施方式
為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實施方式對本發(fā)明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。
本發(fā)明提供了一種基于聲振動信號的目標檢測與識別方法,如圖1所示,所述方法包括:
S1、利用M個或等效為M個光纖傳感器獲取預設(shè)節(jié)點位置且預設(shè)時間段內(nèi)的振動信號,并保存所有預設(shè)節(jié)點位置的振動信號數(shù)據(jù)得到振動數(shù)據(jù)矩陣;M為非零自然數(shù);
S2、利用預加重方法對所述振動數(shù)據(jù)矩陣進行預處理以獲取K幀雙極性信號數(shù)據(jù);
S3、根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從所述K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀;
S4、利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征;
S5、根據(jù)每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征以及對應加權(quán)值獲取一個較長的特征向量矩陣并對其降維處理;
S6、根據(jù)雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量獲取長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型,并根據(jù)該模塊輸出每一雙極性數(shù)據(jù)幀中振動信號類別。
本發(fā)明實施例步驟S1中,利用M個或等效為M個光纖傳感器作為信號采集設(shè)備,實際應用中一個分布式傳感器可以采集多個預設(shè)節(jié)點位置的數(shù)據(jù),此時該分布式傳感器可以等效為M個光纖傳感器。每個光纖傳感器可以采用C(C為非零自然數(shù))類振動信號(如腳步聲、車輪碾壓聲、鏟土聲等)。每個光纖傳感器采集預設(shè)節(jié)點位置在一預設(shè)時間段(例如,5分鐘、10分鐘等,甚至更長時間)內(nèi)的振動信號。對于每類振動信號,以N*M大小的矩陣形式保存從而得到振動數(shù)據(jù)矩陣。其中,N為上述預設(shè)時間段,M為預設(shè)節(jié)點總數(shù)。并且,上述振動數(shù)據(jù)矩陣的每一行代表同一時刻所有預設(shè)節(jié)點的光纖傳感器采集到的振動信號數(shù)據(jù),每一列代表同一預設(shè)節(jié)點位置在預設(shè)時間段內(nèi)采集的振動信號數(shù)據(jù)。上述N、M值為非零自然數(shù),根據(jù)具體使用場景進行設(shè)置。
本發(fā)明實施例步驟S2中,由于聲振動信號具有低頻段能量大、高頻段能量小的特點,因此本發(fā)明實施例中采用預加重方法對振動信號數(shù)據(jù)進行預處理。首先將上述振動數(shù)據(jù)矩中第i列振動信號數(shù)據(jù)定義為xi,i∈[1,M]。根據(jù)預加重公式對各列振動信號數(shù)據(jù)進行濾波,從而得到無直流分量的雙極性信號,類似于語音信號。其中預加重公式如下所示:
yi(t)=xi(t)-0.95*x(t-1); (1)
式中,t為采集時刻;x(t-1)為t-1時刻采集的振動信號數(shù)據(jù);x(t)為t時刻采集的振動信號數(shù)據(jù)。
其次,對預處理后的振動數(shù)據(jù)yi(t)進行分幀,將預設(shè)數(shù)量的雙極性信號作為一幀雙極性信號從而得到K幀雙極性信號數(shù)據(jù),例如L個相鄰的yi(t)作為一幀,并且相鄰兩幀雙極性信號數(shù)據(jù)中前一幀的后半幀為后一幀的前半幀即前一幀和后一幀有1/2的交疊,這樣可得K幀雙極性信號數(shù)據(jù)Frame(l)。
最后,本發(fā)明實施例采用漢明窗函數(shù)對上述K幀雙極性信號數(shù)據(jù)加窗得到K幀加窗后的數(shù)據(jù)。上述漢明窗函數(shù)如下所示:
式中,L為雙極性信號數(shù)據(jù)的數(shù)量。
本發(fā)明實施例步驟S3中,獲取將每幀加窗后的雙極性信號數(shù)據(jù)的能量E和過零率Z。上述能量E為幀內(nèi)所有項數(shù)據(jù)的平方和,過零率Z為幀內(nèi)數(shù)據(jù)中各項數(shù)據(jù)信號穿過橫軸次數(shù)之和。
然后計算每幀雙極性信號數(shù)據(jù)的能量E和過零率Z之積,若該積大于預設(shè)閾值,則說明該幀雙極性信號數(shù)據(jù)內(nèi)存在目標信號,需要保存該幀雙極性信號數(shù)據(jù);若該積小于預設(shè)閾值,則說明該幀雙極性信號數(shù)據(jù)內(nèi)不存在目標信號,則丟棄該幀雙極性信號數(shù)據(jù)。
實際應用中,由于包含目標信號的雙極性信號數(shù)據(jù)的數(shù)量較少,因此本發(fā)明通過丟棄不存在目標信號的數(shù)據(jù)有利于提高后續(xù)計算效率。
本發(fā)明實施例步驟S4中利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征。其中:
一、速度特征的提取過程包括:
1、對包括目標信號的雙極性數(shù)據(jù)幀做小波變換。
2、對小波變換后的雙極性數(shù)據(jù)幀的每層系數(shù)作量化處理,并將量化后系數(shù)與設(shè)定閾值比較。若量化后系數(shù)小于設(shè)定閾值時,將當前層所有項數(shù)據(jù)置零。
3、逆小波變換重構(gòu)去噪信號。
4、隨后去除每行數(shù)據(jù)開始的無事件點即零值,統(tǒng)計移除零的個數(shù)作為速度特征。另外,去除每行開始的零值并對齊事件數(shù)據(jù)可以減少計算量,且方便后續(xù)特征提取。
二、能量分布特征的提取過程包括:
1、對包括目標信號的雙極性數(shù)據(jù)幀做小波變換;
2、計算小波變換不同層內(nèi)的能量分布作為能量分布特征。
三、譜估計特征的提取過程包括:
1、計算包括目標信號的雙極性數(shù)據(jù)幀的線性預測系數(shù)LPC特征。其中,LPC參數(shù)可以表征頻譜包絡(luò),如下式所示:
式中,P為階數(shù),根據(jù)LPC系數(shù)ak即可獲得頻譜包絡(luò)。上述ak可以采用杜賓遞推算法獲取。
2、利用牛頓-拉夫遜算法或者倒譜法計算線性預測系數(shù)LPC特征全極點模型中分母多項式A(z)的復根,根據(jù)所得復根確定共振峰??梢?,本發(fā)明實施例中通過獲取共振峰可以反映聲道諧振特性,代表聲振動信號的最直接來源。
3、計算所述共振峰的形狀統(tǒng)計量作為譜估計特征,例如上述共振峰的形狀統(tǒng)計量可以包括均值、方差、偏度、峰度等特征。還可以根據(jù)具體場景選擇其他特征,本發(fā)明不作限定。
可理解的是,本發(fā)明實施例中通過獲取聲振動信號的速度特征、能量分布特征和譜估計特征,可以提取多種表征不同類型聲源聲振動信號,防止遺漏有些聲源引起的聲振動信號,這樣有利于提高區(qū)分精度。
本發(fā)明實施例步驟S5中在得到上述雙極性數(shù)據(jù)幀的全部特征后,對這些特征進行加權(quán)聯(lián)合處理,包括:
分別定義每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征的加權(quán)值為vi,k,1、vi,k,2、vi,k,3,則可計算每個預設(shè)節(jié)點的雙極性數(shù)據(jù)幀的加權(quán)聯(lián)合特征vi,k為:
其中,wi,i=1,2,3分別為上述三類特征的常數(shù)加權(quán)值。通常情況下,可令wi=1。然后將同一時刻每個節(jié)點的加權(quán)聯(lián)合特征vi,k進行聯(lián)合可得每類信號聯(lián)合特征Vk:
式中,M為預設(shè)節(jié)點總數(shù),且k∈[1,K]。
將M個預設(shè)節(jié)點的聯(lián)合特征Vk進行聯(lián)合得到每類信號特征v即較長的特征向量。
隨后對每類信號特征v進行降維,包括:
1、對每類信號特征v求平均值,然后將每類信號特征V減去對應的平均值得到
2、然后根據(jù)下式計算協(xié)方差矩陣A:
式中,C為聲振動信號類別。
3、從按照順序排序的特征值中選取特征值較大的前G個特征值對應的特征向量作為列向量構(gòu)成特征向量矩陣w。
4、將每類信號特征v與特征向量矩陣w相乘得到降維后的較長的特征向量矩陣v”=v*w,該較長的特征向量矩陣v”的維數(shù)為[1,G]。
實際應用中,長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM-RNN模型是一種更適合處理和預測事件滯后且時間不定的長時序列的模型,即通過增加記憶模塊,將深度神經(jīng)網(wǎng)絡(luò)的多層次表征能力與循環(huán)神經(jīng)網(wǎng)絡(luò)靈活利用長跨度上下文的能力結(jié)合。但是聲振動信號是由聲源發(fā)出的震動通過介質(zhì)傳遞到傳感器而被捕獲到的,其傳遞和轉(zhuǎn)換的過程都是非線性的,且實際采集環(huán)境復雜多變、目標數(shù)據(jù)的分布不確定等因素,在采用一般的深度神經(jīng)網(wǎng)絡(luò)進行識別時,仍然在正確率上沒有得到滿意的提升。為此,本發(fā)明實施例步驟S6中采用以下長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型對步驟S2、步驟S3、步驟S4和步驟S5,即利用長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型識別雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量的振動信號類別。
如圖2所示,本發(fā)明實施例中長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型包括:輸入模塊、第一Tanh函數(shù)模塊、第二Tanh函數(shù)模塊、第一輸入門、第一記憶細胞、第二記憶細胞、遺忘門、輸出門、第一選擇門、第二選擇門、隱藏層模塊、輸出模塊、第一乘法器、第二乘法器和第三乘法器;其中,
所述第一Tanh函數(shù)的第一輸入端連接所述輸入模塊的輸出端,其第二輸入端連接所述第二選擇門的輸出端,其輸出端連接所述第一乘法器的第一輸入端;
所述輸入門的第一輸入端連接所述第二選擇門的輸出端,其第二輸入端連接所述第二記憶細胞的輸出端,其輸出端連接所述第一乘法器的第二輸入端;所述第一乘法器的輸出端連接所述第一記憶細胞的第一輸入端;
所述第二乘法器的第一輸入端連接所述第二記憶細胞的輸出端,其第二輸入端連接所述遺忘門的輸出端,其輸出端連接所述第一記憶細胞的第二輸入端;所述第一記憶細胞的輸出端連接所述第二Tanh函數(shù)模塊的輸入端;所述第二Tanh函數(shù)模塊的輸出端連接所述第三乘法器的輸入端;
所述遺忘門的輸入端連接所述第二選擇門的輸出端;
所述輸出門的第一輸入端連接所述第二選擇門的輸出端,其第二輸入端連接所述第二記憶細胞的輸出端,其第三輸入端連接所述第一Tanh函數(shù)模塊的輸出端,其輸出端連接所述第三乘法器的第二輸入端;所述第三乘法器的輸出端連接所述第一選擇門的輸入端;
所述隱藏層的輸入端連接所述第一選擇門的輸出端,其輸出端連接所述輸出模塊。
例如,假設(shè)信號特征xt為長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型的輸入,yt為輸出,在t時刻有:
it=sigmoid(Wix xt+αt-1 Wim mt-1+Wic ct-1+bi) (7)
ft=sigmoid(Wfx xt+αt-1Wfm mt-1+Wfc ct-1+bf) (8)
ot=sigmoid(Wox xt+αt-1Wom mt-1+Woc ct+bo) (10)
yt=softmax(αt Wym mt+by) (12)
其中it為t時刻輸入門的輸出,ft為t時刻遺忘門的輸出,ct為t時刻記憶細胞的輸出,ot為t時刻輸出門的輸出,mt為t時刻隱藏層的輸入,yt為t時刻的輸出;xt為t時刻的輸入,mt-1為t-1時刻隱藏層的輸入,ct-1為t-1時刻記憶細胞的輸出;Wix為t時刻輸入門i與輸入x之間的權(quán)重,Wim為t時刻輸入門i與t-1時刻隱藏層輸入m之間的權(quán)重,Wic為t時刻輸入門i與t-1時刻記憶細胞c之間的權(quán)重,αt-1為t-1時刻選擇門的輸出,bi為輸入門i的偏差量;Wfx為t時刻輸入門i與t時刻輸入x之間的權(quán)重,Wfm為t時刻輸入門i與t-1時刻隱藏層輸入m之間的權(quán)重,Wfc為t時刻遺忘門f與t-1時刻記憶細胞c之間的權(quán)重,bf為遺忘門f的偏差量;Wcx為t時刻記憶細胞c與輸入x之間的權(quán)重,Wcm為t時刻記憶細胞c與t-1時刻隱藏層輸入m之間的權(quán)重,bc為記憶細胞c的偏差量;Wox為t時刻輸出門o與輸入x之間的權(quán)重,Wom為t時刻輸出門o與t-1時刻隱藏層輸入m之間的權(quán)重,Woc為t時刻輸出門o與t時刻記憶細胞c之間的權(quán)重,bo為輸出門o的偏差量;by為輸出y的偏差量;代表矩陣元素相乘。
本發(fā)明實施例中步驟S2中雙極性信號數(shù)據(jù)、步驟S3中雙極性信號數(shù)據(jù)幀、步驟S4中速度特征、能量分布特征、譜估計特征和步驟S5中較長的特征向量輸入到上述長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型,然后輸出每一雙極性數(shù)據(jù)幀中振動信號所屬類別。
本發(fā)明實施例還提供了一種基于聲振動信號的目標檢測與識別系統(tǒng),如圖3所示,所述系統(tǒng)包括:
振動數(shù)據(jù)矩陣獲取模塊M1,用于利用M個或等效為M個光纖傳感器獲取預設(shè)節(jié)點位置且預設(shè)時間段內(nèi)的振動信號,并保存所有預設(shè)節(jié)點位置的振動信號數(shù)據(jù)得到振動數(shù)據(jù)矩陣;M為非零自然數(shù);
預處理模塊M2,用于利用預加重方法對所述振動數(shù)據(jù)矩陣進行預處理以獲取K幀雙極性信號數(shù)據(jù);
雙極性數(shù)據(jù)幀獲取模塊M3,用于根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從所述K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀;
特征提取模塊M4,用于利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征;
降維處理模塊M5,用于根據(jù)每一雙極性數(shù)據(jù)幀的速度特征、能量分布特征和譜估計特征以及對應加權(quán)值獲取一個較長的特征向量矩陣并對其降維處理;
振動信號類別識別模塊M6,用于根據(jù)雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量獲取長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型,并根據(jù)該模塊輸出每一雙極性數(shù)據(jù)幀中振動信號類別。
需要說明的是,本發(fā)明實施例提供的目標檢測與識別裝置基于上文所述的目標檢測與識別方法實現(xiàn),包括方法實施例的全部技術(shù)特征,因此可以解決相同的技術(shù)問題,達到相同的技術(shù)效果,具有內(nèi)容可以參見上述實施例的內(nèi)容,在此不再贅述。
綜上所述,本發(fā)明實施例提供的基于聲振動信號的目標檢測與識別方法及系統(tǒng),利用M個或等效為M個光纖傳感器獲取預設(shè)節(jié)點位置且預設(shè)時間段內(nèi)的振動信號,并保存所有預設(shè)節(jié)點位置的振動信號數(shù)據(jù)得到振動數(shù)據(jù)矩陣,這樣可以采集到每個節(jié)點的C類即多種振動信號;然后利用預加重方法對上述振動數(shù)據(jù)矩陣預處理獲取K幀雙極性信號數(shù)據(jù);根據(jù)每幀雙極性信號數(shù)據(jù)的能量E和過零率Z從K幀雙極性信號數(shù)據(jù)選取包括目標信號的雙極性數(shù)據(jù)幀,這樣方便后續(xù)過程中僅對有目標信號的雙極性數(shù)據(jù)幀進行處理,減少計算量;利用小波變換方法從包括目標信號的雙極性數(shù)據(jù)幀中提取每類信號每一列的速度特征、能量分布特征和譜估計特征,并根據(jù)上述各特征得到一個較長的特征向量矩陣,然后對該特征向量矩陣進行降維處理,這樣通過提取表征不同類型聲源引起的聲振動信號,有利于提高區(qū)分精度;最后利用長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型識別出不同步驟中雙極性信號數(shù)據(jù)、雙極性信號數(shù)據(jù)幀及其速度特征、能量分布特征和譜估計特征和降維處理后的較長的特征向量對應的振動信號類別,本發(fā)明實施例中長短期選擇記憶神經(jīng)網(wǎng)絡(luò)模型可以根據(jù)不同步驟的信息的共同作用決定聲振動信號識別,提高目標識別的辨識正確率。
在本發(fā)明中,術(shù)語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性。術(shù)語“多個”指兩個或兩個以上,除非另有明確的限定。
雖然結(jié)合附圖描述了本發(fā)明的實施方式,但是本領(lǐng)域技術(shù)人員可以在不脫離本發(fā)明的精神和范圍的情況下做出各種修改和變型,這樣的修改和變型均落入由所附權(quán)利要求所限定的范圍之內(nèi)。