1.一種基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述方法包括下述步驟:
(1)確定訓(xùn)練圖片集,所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練圖片的集合,以及每張訓(xùn)練圖片的類別標(biāo)簽,所述類別標(biāo)簽用于表示該訓(xùn)練圖中包含哪一類或多類目標(biāo)示例,并選擇每張訓(xùn)練圖片中的多個(gè)候選區(qū)域;
(2)獲得所述訓(xùn)練圖片集中訓(xùn)練圖片的卷積特征圖,并將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上,得到訓(xùn)練圖片的各候選區(qū)域的卷積特征;
(3)將訓(xùn)練圖片的各候選區(qū)域的卷積特征輸入到全連接層中,得到訓(xùn)練圖片的各候選區(qū)域的特征向量;
(4)構(gòu)建一個(gè)基準(zhǔn)示例分類器,并根據(jù)所述訓(xùn)練圖片的各候選區(qū)域的特征向量和所述基準(zhǔn)示例分類器構(gòu)建多個(gè)精化示例分類器,通過更新每個(gè)候選區(qū)域得分的權(quán)重,進(jìn)行在線示例分類器精化;
(5)合并整個(gè)網(wǎng)絡(luò)中的損失函數(shù),包含基準(zhǔn)示例分類器的損失函數(shù)和多個(gè)精化示例分類器的損失函數(shù),訓(xùn)練端到端的多示例檢測網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4)具體包括:
(4.1)首先構(gòu)建基準(zhǔn)示例分類器,所述基準(zhǔn)示例分類器為基礎(chǔ)的多示例目標(biāo)檢測網(wǎng)絡(luò),訓(xùn)練圖片的各候選區(qū)域的特征向量計(jì)算各候選區(qū)域的得分,并根據(jù)各候選區(qū)域的得分計(jì)算訓(xùn)練圖片的分?jǐn)?shù),利用圖片的標(biāo)簽信息和由候選區(qū)域得分計(jì)算的圖片分?jǐn)?shù)來訓(xùn)練基準(zhǔn)示例分類器;
(4.2)利用圖像候選區(qū)域的特征向量和上述的基準(zhǔn)示例分類器,構(gòu)建多個(gè)精化示例分類器,所述精化示例分類器將步驟(4.1)訓(xùn)練的基準(zhǔn)示例分類器中候選區(qū)域的分?jǐn)?shù)結(jié)果作為第一個(gè)精化示例分類器中候選區(qū)域的分?jǐn)?shù)的權(quán)重系數(shù),將K-1次訓(xùn)練的精化示例分類器中候選區(qū)域的分?jǐn)?shù)結(jié)果作為第K個(gè)訓(xùn)練的精化示例分類器中候選區(qū)域的分?jǐn)?shù)的權(quán)重,通過更新每個(gè)候選區(qū)域得分的權(quán)重,進(jìn)行在線示例分類器精化,所述K為精化示例分類器的個(gè)數(shù)。
3.如權(quán)利要求2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4.1)具體包括:
(4.1.1)將訓(xùn)練圖片的所有候選區(qū)域的特征向量輸入兩個(gè)全連接層,得到兩個(gè)C維度大小的向量Xc和Xd,其中C為類別標(biāo)簽的數(shù)目,其中Xc和Xd∈RC*|R|,|R|為每張圖片的候選區(qū)域的數(shù)目;
(4.1.2)將Xc和Xd分別輸入兩個(gè)softmax層,經(jīng)過該兩個(gè)softmax層后,得到每個(gè)候選區(qū)域的兩組分?jǐn)?shù)σ(Xc)和σ(Xd),σ(Xc)表示每個(gè)候選區(qū)域占標(biāo)簽類別中某個(gè)類別的概率分?jǐn)?shù),σ(Xd)表示每個(gè)候選區(qū)域占該圖片做出標(biāo)簽貢獻(xiàn)的概率分?jǐn)?shù),σ(Xc)和σ(Xd)的取值范圍為(0,1);兩者逐點(diǎn)乘積得到該候選區(qū)域的分?jǐn)?shù)XR;
其中兩個(gè)softmax層,表示為:
XR表示為:
XR=σ(Xc)⊙σ(Xd)。
(4.1.3)將該訓(xùn)練圖片所有候選區(qū)域的分?jǐn)?shù)加和表示為該訓(xùn)練圖片的分?jǐn)?shù)表示為:
每張圖片的分?jǐn)?shù)是求和池化的結(jié)果,其取值范圍為(0,1),該分?jǐn)?shù)表示該圖片被分類為類別c的概率;
(4.1.4)利用(4.1.3)得到的圖片分?jǐn)?shù),采用標(biāo)準(zhǔn)的多分類交叉熵?fù)p失函數(shù)訓(xùn)練基準(zhǔn)示例分類器;損失函數(shù)表示為:
其中Y為訓(xùn)練圖片的類別標(biāo)簽,記為:
Y=[y1,y2,…,yC]T∈RC*1
其中,yc的值為1或0,表示該圖片中包括或不包括目標(biāo)c,總共有C個(gè)目標(biāo)類別。
4.如權(quán)利要求3所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4.2)具體包括:
(4.2.1)將所有候選區(qū)域的特征向量輸入到一個(gè)全連接層,得到C+1維度大小的向量XRk,記為:
其中,j表示第j個(gè)候選區(qū)域,k表示第k次精化訓(xùn)練,精化訓(xùn)練的分類器的類別為{C+1};
(4.2.2)將(4.2.1)得到的C+1維度大小的向量XRk輸入到一個(gè)softmax層,得到每個(gè)候選區(qū)域的分?jǐn)?shù),取值范圍為(0,1),該分?jǐn)?shù)表示該候選區(qū)域占{C+1}類別的概率分?jǐn)?shù);
(4.2.3)根據(jù)候選區(qū)域的分?jǐn)?shù)確定每個(gè)候選區(qū)域的類別;
(4.2.4)利用損失函數(shù):
經(jīng)過多次精化訓(xùn)練逐漸逼近目標(biāo)示例的位置,訓(xùn)練各精化示例分類器。
其中,Yjk為所述訓(xùn)練圖片集的所有候選區(qū)域的標(biāo)簽集:
權(quán)重系數(shù)為第k-1個(gè)精化示例分類器訓(xùn)練的分?jǐn)?shù)結(jié)果,
5.如權(quán)利要求4所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(5)具體為:
將(4.1.4)的基準(zhǔn)示例分類器的損失函數(shù)和(4.2.4)的K個(gè)精化示例分類器的損失函數(shù)合并,得到多示例檢測網(wǎng)絡(luò)的損失函數(shù)如下:
該優(yōu)化損失函數(shù),將基準(zhǔn)示例分類器訓(xùn)練和分類器精化兩個(gè)階段融合到一個(gè)網(wǎng)絡(luò)中。
6.如權(quán)利要求4或5所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(4.2.3)具體為:
選擇訓(xùn)練圖片的|R|個(gè)候選區(qū)域的分?jǐn)?shù)XRk中分?jǐn)?shù)最大的那個(gè)候選區(qū)域,用該訓(xùn)練圖片的類別標(biāo)簽來標(biāo)記該候選區(qū)域的類別;
選擇與分?jǐn)?shù)最大的那個(gè)候選區(qū)域的覆蓋率大于設(shè)定覆蓋率閾值的鄰近候選區(qū)域,并用該訓(xùn)練圖片的類別標(biāo)簽來標(biāo)記這些鄰近候選區(qū)域的類別。
7.如權(quán)利要求4或5所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,在更新權(quán)重系數(shù)的過程中,當(dāng)鄰近候選區(qū)域與當(dāng)前分?jǐn)?shù)最大的候選區(qū)域的IoU最大時(shí),將該最大分?jǐn)?shù)賦給該鄰近候選區(qū)域的權(quán)重。
8.如權(quán)利要求1或2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述步驟(1)中選擇每張訓(xùn)練圖片中的多個(gè)候選區(qū)域,具體為:
采用Selective Search方法為每張訓(xùn)練圖片選取可能為目標(biāo)位置的候選區(qū)域。
9.如權(quán)利要求1或2所述的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,在所述步驟(2)中將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上,具體為:
將訓(xùn)練圖片的卷積特征圖及訓(xùn)練圖片的各候選區(qū)域輸入到具有SPP-NET網(wǎng)絡(luò)結(jié)構(gòu)的卷積層,從而將訓(xùn)練圖片的各候選區(qū)域在其原始訓(xùn)練圖片中的位置映射到該訓(xùn)練圖片的卷積層特征圖上,得到訓(xùn)練圖片的各候選區(qū)域的卷積特征。
10.如權(quán)利要求1-9任一項(xiàng)所述方法訓(xùn)練得到的基于在線示例分類器精化的多示例檢測網(wǎng)絡(luò)。