本發(fā)明涉及圖像分類技術(shù),具體為一種基于多樣本特征遷移的長尾圖像分類方法及系統(tǒng)。
背景技術(shù):
1、深度學(xué)習(xí)廣泛應(yīng)用在各種視覺任務(wù)中,通常情況下,深度學(xué)習(xí)模型在大量且分布均勻的數(shù)據(jù)集上才能表現(xiàn)出良好的效果。而現(xiàn)實中的數(shù)據(jù)通常呈現(xiàn)長尾分布的形式,這限制了深度學(xué)習(xí)在長尾數(shù)據(jù)集上的表現(xiàn)及應(yīng)用。長尾圖像分類的數(shù)據(jù)集中頭類的樣本數(shù)目最多,尾類的樣本數(shù)目最少。這樣的數(shù)據(jù)分布在訓(xùn)練過程中會導(dǎo)致模型出現(xiàn)偏差,影響尾類的分類效果。
2、目前,研究人員提出了許多方法解決長尾數(shù)據(jù)集的樣本不平衡問題,包括:類平衡的方法、解耦學(xué)習(xí)的方法以及多分支模型的方法等。類平衡的方法有重采樣和重加權(quán)等,重采樣和重加權(quán)方法雖然可以提高整體分類準(zhǔn)確率,但是會存在模型過擬合或某些類別丟失信息的風(fēng)險;解耦學(xué)習(xí)的方法可以提高尾部類別的分類性能,但是這種兩階段策略在實踐中需要繁雜的超參數(shù)調(diào)整;多分支模型的存在有助于發(fā)掘各個分支之間的互補(bǔ)性,但并不一定能夠明顯提升單個分支模型的識別性能。因此,在長尾圖像分類中,需要進(jìn)一步探索新的方法來解決尾部類別的分類問題,提升尾部類別的分類準(zhǔn)確率同時兼顧整體準(zhǔn)確率。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)所存在的問題,本發(fā)明提出了一種基于多樣本特征遷移的長尾圖像分類方法及系統(tǒng),通過將頭類樣本豐富的特征信息融合到尾類樣本中,從而增加分類模型對尾類樣本的關(guān)注,能有效改善長尾數(shù)據(jù)集的分類效果。
2、本發(fā)明所采用的技術(shù)方案為:一種基于多樣本特征遷移的長尾圖像分類方法,包括以下步驟:
3、s1、從分批次輸入的長尾數(shù)據(jù)集的訓(xùn)練樣本中提取原始特征;
4、s2、對原始特征進(jìn)行多樣本特征遷移處理;
5、s3、對原始特征進(jìn)行多樣本特征互異處理;
6、s4、根據(jù)多樣本特征遷移處理得到的輸出特征以及多樣本特征互異處理得到的互異特征,采用全連接層分類器對樣本特征進(jìn)行訓(xùn)練分類,獲得訓(xùn)練預(yù)測輸出結(jié)果;
7、所述長尾圖像分類方法通過對原始特征進(jìn)行多樣本特征遷移、互異處理,將長尾圖像的頭類樣本特征信息遷移到尾類樣本,使用于對長尾圖像進(jìn)行分類的分類模型的關(guān)注得到偏移,并保持對原有頭類樣本特征信息的關(guān)注。
8、本發(fā)明實施例中還采用以下技術(shù)方案:一種基于多樣本特征遷移的長尾圖像分類系統(tǒng),包括以下模塊:
9、骨干網(wǎng)絡(luò),用于從分批次輸入的長尾數(shù)據(jù)集的訓(xùn)練樣本中提取原始特征;
10、多樣本特征遷移模塊,對原始特征進(jìn)行多樣本特征遷移處理;
11、多樣本特征互異模塊,對原始特征進(jìn)行多樣本特征互異處理;
12、訓(xùn)練模塊,用于根據(jù)多樣本特征遷移處理得到的輸出特征以及多樣本特征互異處理得到的互異特征,采用全連接層分類器對樣本特征進(jìn)行訓(xùn)練分類,獲得訓(xùn)練預(yù)測輸出結(jié)果;
13、所述長尾圖像分類系統(tǒng)通過對原始特征進(jìn)行多樣本特征遷移、互異處理,將長尾圖像的頭類樣本特征信息遷移到尾類樣本,使用于對長尾圖像進(jìn)行分類的分類模型的關(guān)注得到偏移,并保持對原有頭類樣本特征信息的關(guān)注。
14、相對于現(xiàn)有技術(shù),本發(fā)明取得的技術(shù)效果包括:
15、本發(fā)明通過對樣本的原始特征進(jìn)行操作,將頭類樣本豐富的特征信息融合到尾類樣本中,從而增加模型對尾類樣本的關(guān)注,提升尾類的分類準(zhǔn)確率。此外,本發(fā)明可以增大頭類樣本和尾類樣本的類間間距,減少類內(nèi)間距。
1.一種基于多樣本特征遷移的長尾圖像分類方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的長尾圖像分類方法,其特征在于,步驟s2中多樣本特征遷移處理的過程,包括以下步驟:
3.根據(jù)權(quán)利要求2所述的長尾圖像分類方法,其特征在于,共享特征的表達(dá)式為:
4.根據(jù)權(quán)利要求2所述的長尾圖像分類方法,其特征在于,輸出特征的表達(dá)式為:
5.根據(jù)權(quán)利要求1所述的長尾圖像分類方法,其特征在于,步驟s3中多樣本特征互異處理的過程,首先根據(jù)多樣本特征遷移所得的相關(guān)性分?jǐn)?shù)計算各個樣本之間的互異分?jǐn)?shù);再根據(jù)互異分?jǐn)?shù),生成代表樣本之間差異性的互異特征。
6.根據(jù)權(quán)利要求5所述的長尾圖像分類方法,其特征在于,互異特征的表達(dá)式為:
7.根據(jù)權(quán)利要求1所述的長尾圖像分類方法,其特征在于,步驟s4中全連接層分類器包括第一訓(xùn)練分類器、第二訓(xùn)練分類器;
8.根據(jù)權(quán)利要求1所述的長尾圖像分類方法,其特征在于,所述長尾圖像分類方法還包括步驟:
9.一種基于多樣本特征遷移的長尾圖像分類系統(tǒng),其特征在于,包括以下模塊:
10.根據(jù)權(quán)利要求9所述的長尾圖像分類系統(tǒng),其特征在于,多樣本特征遷移模塊的遷移處理過程,包括: