基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)及其訓(xùn)練方法與流程

文檔序號(hào)：11920858閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)及其訓(xùn)練方法與流程

技術(shù)特征：

1.一種基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述方法包括下述步驟：

(1)確定訓(xùn)練圖片集，所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練圖片的集合，以及每張訓(xùn)練圖片的類別標(biāo)簽，所述類別標(biāo)簽用于表示該訓(xùn)練圖中包含哪一類或多類目標(biāo)示例，并選擇每張訓(xùn)練圖片中的多個(gè)候選區(qū)域；

(2)獲得所述訓(xùn)練圖片集中訓(xùn)練圖片的卷積特征圖，并將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上，得到訓(xùn)練圖片的各候選區(qū)域的卷積特征；

(3)將訓(xùn)練圖片的各候選區(qū)域的卷積特征輸入到全連接層中，得到訓(xùn)練圖片的各候選區(qū)域的特征向量；

(4)構(gòu)建一個(gè)基準(zhǔn)示例分類器，并根據(jù)所述訓(xùn)練圖片的各候選區(qū)域的特征向量和所述基準(zhǔn)示例分類器構(gòu)建多個(gè)精化示例分類器，通過更新每個(gè)候選區(qū)域得分的權(quán)重，進(jìn)行在線示例分類器精化；

(5)合并整個(gè)網(wǎng)絡(luò)中的損失函數(shù)，包含基準(zhǔn)示例分類器的損失函數(shù)和多個(gè)精化示例分類器的損失函數(shù)，訓(xùn)練端到端的多示例檢測網(wǎng)絡(luò)。

2.如權(quán)利要求1所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述步驟(4)具體包括：

(4.1)首先構(gòu)建基準(zhǔn)示例分類器，所述基準(zhǔn)示例分類器為基礎(chǔ)的多示例目標(biāo)檢測網(wǎng)絡(luò)，訓(xùn)練圖片的各候選區(qū)域的特征向量計(jì)算各候選區(qū)域的得分，并根據(jù)各候選區(qū)域的得分計(jì)算訓(xùn)練圖片的分?jǐn)?shù)，利用圖片的標(biāo)簽信息和由候選區(qū)域得分計(jì)算的圖片分?jǐn)?shù)來訓(xùn)練基準(zhǔn)示例分類器；

(4.2)利用圖像候選區(qū)域的特征向量和上述的基準(zhǔn)示例分類器，構(gòu)建多個(gè)精化示例分類器，所述精化示例分類器將步驟(4.1)訓(xùn)練的基準(zhǔn)示例分類器中候選區(qū)域的分?jǐn)?shù)結(jié)果作為第一個(gè)精化示例分類器中候選區(qū)域的分?jǐn)?shù)的權(quán)重系數(shù)，將K-1次訓(xùn)練的精化示例分類器中候選區(qū)域的分?jǐn)?shù)結(jié)果作為第K個(gè)訓(xùn)練的精化示例分類器中候選區(qū)域的分?jǐn)?shù)的權(quán)重，通過更新每個(gè)候選區(qū)域得分的權(quán)重，進(jìn)行在線示例分類器精化，所述K為精化示例分類器的個(gè)數(shù)。

3.如權(quán)利要求2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述步驟(4.1)具體包括：

(4.1.1)將訓(xùn)練圖片的所有候選區(qū)域的特征向量輸入兩個(gè)全連接層，得到兩個(gè)C維度大小的向量X^c和X^d，其中C為類別標(biāo)簽的數(shù)目，其中X^c和X^d∈R^C*|R|，|R|為每張圖片的候選區(qū)域的數(shù)目；

(4.1.2)將X^c和X^d分別輸入兩個(gè)softmax層，經(jīng)過該兩個(gè)softmax層后，得到每個(gè)候選區(qū)域的兩組分?jǐn)?shù)σ(X^c)和σ(X^d)，σ(X^c)表示每個(gè)候選區(qū)域占標(biāo)簽類別中某個(gè)類別的概率分?jǐn)?shù)，σ(X^d)表示每個(gè)候選區(qū)域占該圖片做出標(biāo)簽貢獻(xiàn)的概率分?jǐn)?shù)，σ(X^c)和σ(X^d)的取值范圍為(0，1)；兩者逐點(diǎn)乘積得到該候選區(qū)域的分?jǐn)?shù)X^R；

其中兩個(gè)softmax層，表示為：

$<mrow> <msub> <mrow> <mo>[</mo> <mi>σ</mi> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mi>c</mi> </msup> <mo>)</mo> </mrow> <mo>]</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>c</mi> </msubsup> </msup> <mrow> <msubsup> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>C</mi> </msubsup> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mi>j</mi> </mrow> <mi>c</mi> </msubsup> </msup> </mrow> </mfrac> </mrow>$

$<mrow> <msub> <mrow> <mo>[</mo> <mi>σ</mi> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mi>d</mi> </msup> <mo>)</mo> </mrow> <mo>]</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>d</mi> </msubsup> </msup> <mrow> <msubsup> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <mi>R</mi> <mo>|</mo> </mrow> </msubsup> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> <mi>d</mi> </msubsup> </msup> </mrow> </mfrac> </mrow>$

X^R表示為：

X^R＝σ(X^c)⊙σ(X^d)。

(4.1.3)將該訓(xùn)練圖片所有候選區(qū)域的分?jǐn)?shù)加和表示為該訓(xùn)練圖片的分?jǐn)?shù)表示為：

每張圖片的分?jǐn)?shù)是求和池化的結(jié)果，其取值范圍為(0，1)，該分?jǐn)?shù)表示該圖片被分類為類別c的概率；

(4.1.4)利用(4.1.3)得到的圖片分?jǐn)?shù)，采用標(biāo)準(zhǔn)的多分類交叉熵?fù)p失函數(shù)訓(xùn)練基準(zhǔn)示例分類器；損失函數(shù)表示為：

其中Y為訓(xùn)練圖片的類別標(biāo)簽，記為：

Y＝[y₁，y₂，…，y_C]^T∈R^C*1

其中，y_c的值為1或0，表示該圖片中包括或不包括目標(biāo)c，總共有C個(gè)目標(biāo)類別。

4.如權(quán)利要求3所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述步驟(4.2)具體包括：

(4.2.1)將所有候選區(qū)域的特征向量輸入到一個(gè)全連接層，得到C+1維度大小的向量X^Rk，記為：

$<mrow> <msubsup> <mi>X</mi> <mi>j</mi> <mrow> <mi>R</mi> <mi>k</mi> </mrow> </msubsup> <mo>&Element;</mo> <msup> <mi>R</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mo>×</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <mi>k</mi> <mo>&Element;</mo> <mo>{</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>K</mi> <mo>}</mo> </mrow>$

其中，j表示第j個(gè)候選區(qū)域，k表示第k次精化訓(xùn)練，精化訓(xùn)練的分類器的類別為{C+1}；

(4.2.2)將(4.2.1)得到的C+1維度大小的向量X^Rk輸入到一個(gè)softmax層，得到每個(gè)候選區(qū)域的分?jǐn)?shù)，取值范圍為(0，1)，該分?jǐn)?shù)表示該候選區(qū)域占{C+1}類別的概率分?jǐn)?shù)；

(4.2.3)根據(jù)候選區(qū)域的分?jǐn)?shù)確定每個(gè)候選區(qū)域的類別；

(4.2.4)利用損失函數(shù)：

$<mrow> <msubsup> <mi>L</mi> <mi>r</mi> <mi>k</mi> </msubsup> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <mo>|</mo> <mi>R</mi> <mo>|</mo> </mrow> </mfrac> <msubsup> <mi>Σ</mi> <mrow> <mi>r</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <mi>R</mi> <mo>|</mo> </mrow> </msubsup> <msubsup> <mi>Σ</mi> <mrow> <mi>c</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>C</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <msubsup> <mi>w</mi> <mi>r</mi> <mi>k</mi> </msubsup> <msubsup> <mi>y</mi> <mrow> <mi>c</mi> <mi>r</mi> </mrow> <mi>k</mi> </msubsup> <msubsup> <mi>logx</mi> <mrow> <mi>c</mi> <mi>r</mi> </mrow> <mrow> <mi>R</mi> <mi>k</mi> </mrow> </msubsup> </mrow>$

經(jīng)過多次精化訓(xùn)練逐漸逼近目標(biāo)示例的位置，訓(xùn)練各精化示例分類器。

其中，Y_j^k為所述訓(xùn)練圖片集的所有候選區(qū)域的標(biāo)簽集：

$<mrow> <msubsup> <mi>Y</mi> <mi>j</mi> <mi>k</mi> </msubsup> <mo>=</mo> <msup> <mrow> <mo>[</mo> <mrow> <msubsup> <mi>y</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>,</mo> <msubsup> <mi>y</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msubsup> <mi>y</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> </mrow> <mo>]</mo> </mrow> <mi>T</mi> </msup> <mo>&Element;</mo> <msup> <mi>R</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mo>×</mo> <mn>1</mn> </mrow> </msup> </mrow>$

權(quán)重系數(shù)為第k-1個(gè)精化示例分類器訓(xùn)練的分?jǐn)?shù)結(jié)果，

5.如權(quán)利要求4所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述步驟(5)具體為：

將(4.1.4)的基準(zhǔn)示例分類器的損失函數(shù)和(4.2.4)的K個(gè)精化示例分類器的損失函數(shù)合并，得到多示例檢測網(wǎng)絡(luò)的損失函數(shù)如下：

$<mrow> <mi>L</mi> <mo>=</mo> <msub> <mi>L</mi> <mi>b</mi> </msub> <mo>+</mo> <msubsup> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </msubsup> <msubsup> <mi>L</mi> <mi>r</mi> <mi>k</mi> </msubsup> <mo>,</mo> </mrow>$

該優(yōu)化損失函數(shù)，將基準(zhǔn)示例分類器訓(xùn)練和分類器精化兩個(gè)階段融合到一個(gè)網(wǎng)絡(luò)中。

6.如權(quán)利要求4或5所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述步驟(4.2.3)具體為：

選擇訓(xùn)練圖片的|R|個(gè)候選區(qū)域的分?jǐn)?shù)X^Rk中分?jǐn)?shù)最大的那個(gè)候選區(qū)域，用該訓(xùn)練圖片的類別標(biāo)簽來標(biāo)記該候選區(qū)域的類別；

選擇與分?jǐn)?shù)最大的那個(gè)候選區(qū)域的覆蓋率大于設(shè)定覆蓋率閾值的鄰近候選區(qū)域，并用該訓(xùn)練圖片的類別標(biāo)簽來標(biāo)記這些鄰近候選區(qū)域的類別。

7.如權(quán)利要求4或5所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，在更新權(quán)重系數(shù)的過程中，當(dāng)鄰近候選區(qū)域與當(dāng)前分?jǐn)?shù)最大的候選區(qū)域的IoU最大時(shí)，將該最大分?jǐn)?shù)賦給該鄰近候選區(qū)域的權(quán)重。

8.如權(quán)利要求1或2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，所述步驟(1)中選擇每張訓(xùn)練圖片中的多個(gè)候選區(qū)域，具體為：

采用Selective Search方法為每張訓(xùn)練圖片選取可能為目標(biāo)位置的候選區(qū)域。

9.如權(quán)利要求1或2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法，其特征在于，在所述步驟(2)中將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上，具體為：

將訓(xùn)練圖片的卷積特征圖及訓(xùn)練圖片的各候選區(qū)域輸入到具有SPP-NET網(wǎng)絡(luò)結(jié)構(gòu)的卷積層，從而將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上，得到訓(xùn)練圖片的各候選區(qū)域的卷積特征。

10.如權(quán)利要求1-9任一項(xiàng)所述方法訓(xùn)練得到的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

opencv車輛檢測分類器相關(guān)技術(shù)

人臉檢測分類器相關(guān)技術(shù)

神經(jīng)網(wǎng)絡(luò)分類器相關(guān)技術(shù)

matlab神經(jīng)網(wǎng)絡(luò)分類器相關(guān)技術(shù)

bp神經(jīng)網(wǎng)絡(luò)分類器相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)分類器相關(guān)技術(shù)