两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)及其訓(xùn)練方法與流程

文檔序號(hào):11920858閱讀:來源:國知局

技術(shù)特征:

1.一種基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述方法包括下述步驟:

(1)確定訓(xùn)練圖片集,所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練圖片的集合,以及每張訓(xùn)練圖片的類別標(biāo)簽,所述類別標(biāo)簽用于表示該訓(xùn)練圖中包含哪一類或多類目標(biāo)示例,并選擇每張訓(xùn)練圖片中的多個(gè)候選區(qū)域;

(2)獲得所述訓(xùn)練圖片集中訓(xùn)練圖片的卷積特征圖,并將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上,得到訓(xùn)練圖片的各候選區(qū)域的卷積特征;

(3)將訓(xùn)練圖片的各候選區(qū)域的卷積特征輸入到全連接層中,得到訓(xùn)練圖片的各候選區(qū)域的特征向量;

(4)構(gòu)建一個(gè)基準(zhǔn)示例分類器,并根據(jù)所述訓(xùn)練圖片的各候選區(qū)域的特征向量和所述基準(zhǔn)示例分類器構(gòu)建多個(gè)精化示例分類器,通過更新每個(gè)候選區(qū)域得分的權(quán)重,進(jìn)行在線示例分類器精化;

(5)合并整個(gè)網(wǎng)絡(luò)中的損失函數(shù),包含基準(zhǔn)示例分類器的損失函數(shù)和多個(gè)精化示例分類器的損失函數(shù),訓(xùn)練端到端的多示例檢測網(wǎng)絡(luò)。

2.如權(quán)利要求1所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4)具體包括:

(4.1)首先構(gòu)建基準(zhǔn)示例分類器,所述基準(zhǔn)示例分類器為基礎(chǔ)的多示例目標(biāo)檢測網(wǎng)絡(luò),訓(xùn)練圖片的各候選區(qū)域的特征向量計(jì)算各候選區(qū)域的得分,并根據(jù)各候選區(qū)域的得分計(jì)算訓(xùn)練圖片的分?jǐn)?shù),利用圖片的標(biāo)簽信息和由候選區(qū)域得分計(jì)算的圖片分?jǐn)?shù)來訓(xùn)練基準(zhǔn)示例分類器;

(4.2)利用圖像候選區(qū)域的特征向量和上述的基準(zhǔn)示例分類器,構(gòu)建多個(gè)精化示例分類器,所述精化示例分類器將步驟(4.1)訓(xùn)練的基準(zhǔn)示例分類器中候選區(qū)域的分?jǐn)?shù)結(jié)果作為第一個(gè)精化示例分類器中候選區(qū)域的分?jǐn)?shù)的權(quán)重系數(shù),將K-1次訓(xùn)練的精化示例分類器中候選區(qū)域的分?jǐn)?shù)結(jié)果作為第K個(gè)訓(xùn)練的精化示例分類器中候選區(qū)域的分?jǐn)?shù)的權(quán)重,通過更新每個(gè)候選區(qū)域得分的權(quán)重,進(jìn)行在線示例分類器精化,所述K為精化示例分類器的個(gè)數(shù)。

3.如權(quán)利要求2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4.1)具體包括:

(4.1.1)將訓(xùn)練圖片的所有候選區(qū)域的特征向量輸入兩個(gè)全連接層,得到兩個(gè)C維度大小的向量Xc和Xd,其中C為類別標(biāo)簽的數(shù)目,其中Xc和Xd∈RC*|R|,|R|為每張圖片的候選區(qū)域的數(shù)目;

(4.1.2)將Xc和Xd分別輸入兩個(gè)softmax層,經(jīng)過該兩個(gè)softmax層后,得到每個(gè)候選區(qū)域的兩組分?jǐn)?shù)σ(Xc)和σ(Xd),σ(Xc)表示每個(gè)候選區(qū)域占標(biāo)簽類別中某個(gè)類別的概率分?jǐn)?shù),σ(Xd)表示每個(gè)候選區(qū)域占該圖片做出標(biāo)簽貢獻(xiàn)的概率分?jǐn)?shù),σ(Xc)和σ(Xd)的取值范圍為(0,1);兩者逐點(diǎn)乘積得到該候選區(qū)域的分?jǐn)?shù)XR;

其中兩個(gè)softmax層,表示為:

<mrow> <msub> <mrow> <mo>&lsqb;</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mi>c</mi> </msup> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>c</mi> </msubsup> </msup> <mrow> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>C</mi> </msubsup> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mi>j</mi> </mrow> <mi>c</mi> </msubsup> </msup> </mrow> </mfrac> </mrow>

<mrow> <msub> <mrow> <mo>&lsqb;</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msup> <mi>X</mi> <mi>d</mi> </msup> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>d</mi> </msubsup> </msup> <mrow> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <mi>R</mi> <mo>|</mo> </mrow> </msubsup> <msup> <mi>e</mi> <msubsup> <mi>x</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> <mi>d</mi> </msubsup> </msup> </mrow> </mfrac> </mrow>

XR表示為:

XR=σ(Xc)⊙σ(Xd)。

(4.1.3)將該訓(xùn)練圖片所有候選區(qū)域的分?jǐn)?shù)加和表示為該訓(xùn)練圖片的分?jǐn)?shù)表示為:

每張圖片的分?jǐn)?shù)是求和池化的結(jié)果,其取值范圍為(0,1),該分?jǐn)?shù)表示該圖片被分類為類別c的概率;

(4.1.4)利用(4.1.3)得到的圖片分?jǐn)?shù),采用標(biāo)準(zhǔn)的多分類交叉熵?fù)p失函數(shù)訓(xùn)練基準(zhǔn)示例分類器;損失函數(shù)表示為:

其中Y為訓(xùn)練圖片的類別標(biāo)簽,記為:

Y=[y1,y2,…,yC]T∈RC*1

其中,yc的值為1或0,表示該圖片中包括或不包括目標(biāo)c,總共有C個(gè)目標(biāo)類別。

4.如權(quán)利要求3所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4.2)具體包括:

(4.2.1)將所有候選區(qū)域的特征向量輸入到一個(gè)全連接層,得到C+1維度大小的向量XRk,記為:

<mrow> <msubsup> <mi>X</mi> <mi>j</mi> <mrow> <mi>R</mi> <mi>k</mi> </mrow> </msubsup> <mo>&Element;</mo> <msup> <mi>R</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mo>&times;</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <mi>k</mi> <mo>&Element;</mo> <mo>{</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>K</mi> <mo>}</mo> </mrow>

其中,j表示第j個(gè)候選區(qū)域,k表示第k次精化訓(xùn)練,精化訓(xùn)練的分類器的類別為{C+1};

(4.2.2)將(4.2.1)得到的C+1維度大小的向量XRk輸入到一個(gè)softmax層,得到每個(gè)候選區(qū)域的分?jǐn)?shù),取值范圍為(0,1),該分?jǐn)?shù)表示該候選區(qū)域占{C+1}類別的概率分?jǐn)?shù);

(4.2.3)根據(jù)候選區(qū)域的分?jǐn)?shù)確定每個(gè)候選區(qū)域的類別;

(4.2.4)利用損失函數(shù):

<mrow> <msubsup> <mi>L</mi> <mi>r</mi> <mi>k</mi> </msubsup> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <mo>|</mo> <mi>R</mi> <mo>|</mo> </mrow> </mfrac> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>r</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <mi>R</mi> <mo>|</mo> </mrow> </msubsup> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>c</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>C</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <msubsup> <mi>w</mi> <mi>r</mi> <mi>k</mi> </msubsup> <msubsup> <mi>y</mi> <mrow> <mi>c</mi> <mi>r</mi> </mrow> <mi>k</mi> </msubsup> <msubsup> <mi>logx</mi> <mrow> <mi>c</mi> <mi>r</mi> </mrow> <mrow> <mi>R</mi> <mi>k</mi> </mrow> </msubsup> </mrow>

經(jīng)過多次精化訓(xùn)練逐漸逼近目標(biāo)示例的位置,訓(xùn)練各精化示例分類器。

其中,Yjk為所述訓(xùn)練圖片集的所有候選區(qū)域的標(biāo)簽集:

<mrow> <msubsup> <mi>Y</mi> <mi>j</mi> <mi>k</mi> </msubsup> <mo>=</mo> <msup> <mrow> <mo>&lsqb;</mo> <mrow> <msubsup> <mi>y</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>,</mo> <msubsup> <mi>y</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msubsup> <mi>y</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mi>j</mi> </mrow> <mi>k</mi> </msubsup> </mrow> <mo>&rsqb;</mo> </mrow> <mi>T</mi> </msup> <mo>&Element;</mo> <msup> <mi>R</mi> <mrow> <mo>(</mo> <mi>C</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mo>&times;</mo> <mn>1</mn> </mrow> </msup> </mrow>

權(quán)重系數(shù)為第k-1個(gè)精化示例分類器訓(xùn)練的分?jǐn)?shù)結(jié)果,

5.如權(quán)利要求4所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(5)具體為:

將(4.1.4)的基準(zhǔn)示例分類器的損失函數(shù)和(4.2.4)的K個(gè)精化示例分類器的損失函數(shù)合并,得到多示例檢測網(wǎng)絡(luò)的損失函數(shù)如下:

<mrow> <mi>L</mi> <mo>=</mo> <msub> <mi>L</mi> <mi>b</mi> </msub> <mo>+</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </msubsup> <msubsup> <mi>L</mi> <mi>r</mi> <mi>k</mi> </msubsup> <mo>,</mo> </mrow>

該優(yōu)化損失函數(shù),將基準(zhǔn)示例分類器訓(xùn)練和分類器精化兩個(gè)階段融合到一個(gè)網(wǎng)絡(luò)中。

6.如權(quán)利要求4或5所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4.2.3)具體為:

選擇訓(xùn)練圖片的|R|個(gè)候選區(qū)域的分?jǐn)?shù)XRk中分?jǐn)?shù)最大的那個(gè)候選區(qū)域,用該訓(xùn)練圖片的類別標(biāo)簽來標(biāo)記該候選區(qū)域的類別;

選擇與分?jǐn)?shù)最大的那個(gè)候選區(qū)域的覆蓋率大于設(shè)定覆蓋率閾值的鄰近候選區(qū)域,并用該訓(xùn)練圖片的類別標(biāo)簽來標(biāo)記這些鄰近候選區(qū)域的類別。

7.如權(quán)利要求4或5所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,在更新權(quán)重系數(shù)的過程中,當(dāng)鄰近候選區(qū)域與當(dāng)前分?jǐn)?shù)最大的候選區(qū)域的IoU最大時(shí),將該最大分?jǐn)?shù)賦給該鄰近候選區(qū)域的權(quán)重。

8.如權(quán)利要求1或2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(1)中選擇每張訓(xùn)練圖片中的多個(gè)候選區(qū)域,具體為:

采用Selective Search方法為每張訓(xùn)練圖片選取可能為目標(biāo)位置的候選區(qū)域。

9.如權(quán)利要求1或2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,在所述步驟(2)中將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上,具體為:

將訓(xùn)練圖片的卷積特征圖及訓(xùn)練圖片的各候選區(qū)域輸入到具有SPP-NET網(wǎng)絡(luò)結(jié)構(gòu)的卷積層,從而將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上,得到訓(xùn)練圖片的各候選區(qū)域的卷積特征。

10.如權(quán)利要求1-9任一項(xiàng)所述方法訓(xùn)練得到的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
临江市| 甘谷县| 龙口市| 尚义县| 宁阳县| 华宁县| 梓潼县| 手游| 汉沽区| 海兴县| 永和县| 海林市| 梅河口市| 奈曼旗| 宁武县| 乌海市| 库尔勒市| 黄大仙区| 昂仁县| 南江县| 西昌市| 遵义县| 常德市| 郯城县| 龙海市| 安平县| 阳原县| 安宁市| 阳信县| 五台县| 于都县| 清原| 思茅市| 鞍山市| 东丽区| 抚顺市| 定南县| 龙川县| 灵寿县| 陆良县| 渭南市|