本發(fā)明專利屬于測距領域,尤其涉及一種基于多尺度檢測的深度神經(jīng)網(wǎng)絡。
背景技術:
隨著中國汽車抱有輛的增多,中國的車禍也隨之增多。因此adas(高級行車輔助系統(tǒng))應運而生,并大大提高了行車的安全性。但是傳統(tǒng)的adas有其先天的缺陷:對環(huán)境感知的性能不佳,只能感知有限的物體。近年來隨著深度學習的發(fā)展,其強大的環(huán)境認知能力得到了越來越多研究者和工程師的認可,并將越來越廣泛的得到應用。在汽車領域,環(huán)境感知也是也是其系統(tǒng)的重要組成部分,深度學習其強大的感知能力也應用到汽車系統(tǒng)上。但是汽車有其特殊的需求:1.車載相機為了實時性,其分辨率比常用的相機分辨率小,2.在相機視野范圍內(nèi),很多不同大小的目標,最小的只有不到16x16個像素,最大的目標可以覆蓋整個畫面。這些都為檢測提出了非常高的需求。本發(fā)明就是為了解決這樣的尺度問題,并著重解決小目標的檢測問題。
發(fā)明專利內(nèi)容
本發(fā)明旨在解決adas中的環(huán)境感知問題,并且尤其解決的是深度神經(jīng)網(wǎng)絡中對尺度變化的物體效果較差,尤其在物體上的性能最差。傳統(tǒng)的深度神經(jīng)網(wǎng)絡為了能應用于物體檢測,將目標定位和目標分類分為2個子網(wǎng)絡進行。首先使用一個簡單的定位網(wǎng)絡,對圖像中的目標進行定位,然后使用roipooling技術,使用第一個字網(wǎng)絡的輸出從共享層中提取物體的特征,然后送入第二個子網(wǎng)中進行識別。這里就有一個問題目標識別的精度取決于特征的分辨率。傳統(tǒng)的算法中,使用的是下采16x16的特征層進行特征提取,因此理論上識別物體的最小大小為16x16個像素,再加上特征的誤差,因此實際上物體最小大小可能為24x24或者32x32。綜上所述,深度神經(jīng)網(wǎng)絡在檢測小目標物體中性能較差。此問題大大制約了深度神經(jīng)網(wǎng)絡在adas中的應用。
一種基于多尺度檢測的深度神經(jīng)網(wǎng)絡,在不同的網(wǎng)絡層上設置多個檢測網(wǎng)絡,這樣就解決了尺度變化的問題,即可以檢測出小物體也可以檢測大物體;在同一個網(wǎng)絡層上設置多個不同大小不同形狀的檢測器,這樣就解決了形狀變化的問題;設置一個全新的合并層,將上面多個檢測結(jié)果進行合并,共下面的分類網(wǎng)絡使用;為了同時保留低層的細節(jié)信息和高層的全局信息,使用了一個特殊的反卷積層,對高層的特征層進行升維處理,并和低層的特征層進行特征合并,形成了新的特征圖,然后對這個新的特征層進行roipooling處理。
結(jié)構為一個典型的倒金字塔結(jié)構,越靠近輸入端的網(wǎng)絡層,其特征圖越大,越靠近輸出層的網(wǎng)絡層,其特征圖越小。
深度神經(jīng)網(wǎng)絡中,越靠近輸入層的網(wǎng)絡層,特征圖對目標的細節(jié)保留的越好,越靠近輸出層的網(wǎng)絡層,特征圖越表達高層信息,對大目標描述的越細致。
本發(fā)明的有益效果在于:1、本發(fā)明使用了不同尺度的檢測器,可以在不同尺度的特征層上進行目標定位,這樣便解決了尺度變化的問題。
2.本發(fā)明在也使用了不同形狀的檢測器,可以對不同的形狀的物體進行定位,解決了物體的形變問題。
3.使用了特殊的反卷積層,對高層特征層進行升維處理,并和低層的特征層進行特征合并,這樣生成的新的特征層即保留了高層的全局信息,也保留了低層的細節(jié)信息,這樣進一步的提升檢測的性能。
附圖說明
圖1為本發(fā)明專利一種基于多尺度檢測的深度神經(jīng)網(wǎng)絡測距算法示意圖。
具體實施方式
實施例:本發(fā)明旨在解決adas中的環(huán)境感知問題,并且尤其解決的是深度神經(jīng)網(wǎng)絡中對尺度變化的物體效果較差,尤其在物體上的性能最差。傳統(tǒng)的深度神經(jīng)網(wǎng)絡為了能應用于物體檢測,將目標定位和目標分類分為2個子網(wǎng)絡進行。首先使用一個簡單的定位網(wǎng)絡,對圖像中的目標進行定位,然后使用roipooling技術,使用第一個字網(wǎng)絡的輸出從共享層中提取物體的特征,然后送入第二個子網(wǎng)中進行識別。這里就有一個問題目標識別的精度取決于特征的分辨率。傳統(tǒng)的算法中,使用的是下采16x16的特征層進行特征提取,因此理論上識別物體的最小大小為16x16個像素,再加上特征的誤差,因此實際上物體最小大小可能為24x24或者32x32。綜上所述,深度神經(jīng)網(wǎng)絡在檢測小目標物體中性能較差。此問題大大制約了深度神經(jīng)網(wǎng)絡在adas中的應用。
一種基于多尺度檢測的深度神經(jīng)網(wǎng)絡,在不同的網(wǎng)絡層上設置多個檢測網(wǎng)絡,這樣就解決了尺度變化的問題,即可以檢測出小物體也可以檢測大物體;在同一個網(wǎng)絡層上設置多個不同大小不同形狀的檢測器,這樣就解決了形狀變化的問題;設置一個全新的合并層,將上面多個檢測結(jié)果進行合并,共下面的分類網(wǎng)絡使用;為了同時保留低層的細節(jié)信息和高層的全局信息,使用了一個特殊的反卷積層,對高層的特征層進行升維處理,并和低層的特征層進行特征合并,形成了新的特征圖,然后對這個新的特征層進行roipooling處理。
結(jié)構為一個典型的倒金字塔結(jié)構,越靠近輸入端的網(wǎng)絡層,其特征圖越大,越靠近輸出層的網(wǎng)絡層,其特征圖越小。
深度神經(jīng)網(wǎng)絡中,越靠近輸入層的網(wǎng)絡層,特征圖對目標的細節(jié)保留的越好,越靠近輸出層的網(wǎng)絡層,特征圖越表達高層信息,對大目標描述的越細致。
盡管已經(jīng)示出和描述了本發(fā)明的實施例,對于本領域的普通技術人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權利要求及其等同物限定。