本公開涉及數(shù)據(jù)處理,尤其涉及一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置。
背景技術(shù):
1、深度學(xué)習(xí)任務(wù)通常需要大量的訓(xùn)練數(shù)據(jù)。為了獲得大量的訓(xùn)練數(shù)據(jù),可以對(duì)已有的訓(xùn)練數(shù)據(jù)采用數(shù)據(jù)增強(qiáng)策略進(jìn)行數(shù)據(jù)增強(qiáng),以提升模型的性能和效果。
2、相關(guān)技術(shù)中,數(shù)據(jù)增強(qiáng)策略設(shè)定大多是基于人的先驗(yàn)知識(shí),例如,在訓(xùn)練一個(gè)視覺模型時(shí),基于人的先驗(yàn)知識(shí),人為地加入數(shù)據(jù)增強(qiáng)操作,這種人為地添加數(shù)據(jù)增強(qiáng)操作,需要繁瑣地調(diào)節(jié)參數(shù),由于這些參數(shù)的搜索空間很大,很難取得最優(yōu)的一組參數(shù),導(dǎo)致數(shù)據(jù)增強(qiáng)策略的搜索效果不佳。
技術(shù)實(shí)現(xiàn)思路
1、本公開實(shí)施例提供一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置。
2、根據(jù)本公開實(shí)施例的第一方面,提供了一種數(shù)據(jù)增強(qiáng)策略搜索方法,所述方法包括:
3、獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合;其中,不同類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍不同;
4、獲取待增強(qiáng)的訓(xùn)練集的特征分布;
5、根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作;
6、根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述預(yù)設(shè)長(zhǎng)度,用于將同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合成數(shù)據(jù)增強(qiáng)策略。
7、在一個(gè)實(shí)施例中,所述獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合,包括:
8、根據(jù)所述訓(xùn)練集與未標(biāo)記標(biāo)簽的測(cè)試集之間的樣本屬性的差異,確定多個(gè)增強(qiáng)操作以及各所述增強(qiáng)操作的執(zhí)行概率和強(qiáng)度參數(shù);
9、根據(jù)各所述增強(qiáng)操作的執(zhí)行概率與預(yù)設(shè)概率之間的比較結(jié)果,確定形成所述增強(qiáng)操作集合的至少兩類增強(qiáng)操作。
10、在一個(gè)實(shí)施例中,所述獲取待增強(qiáng)的訓(xùn)練集的特征分布,包括:
11、根據(jù)預(yù)訓(xùn)練模型的第一損失函數(shù)、以及所述預(yù)訓(xùn)練模型對(duì)所述訓(xùn)練集中的各樣本圖像提取的特征描述,獲取所述訓(xùn)練集的特征分布;
12、其中,所述第一損失函數(shù)中包含:以所述訓(xùn)練集中所有樣本圖像的特征描述的特征中心作為球心、以距離閾值作為半徑的球的球面外的特征描述到所述球面的距離。
13、在一個(gè)實(shí)施例中,所述根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作,包括:
14、將所述增強(qiáng)操作集合中的所有增強(qiáng)操作的執(zhí)行概率調(diào)整為同一概率;
15、針對(duì)所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作,執(zhí)行以下操作:
16、根據(jù)所述增強(qiáng)操作的強(qiáng)度參數(shù),分別對(duì)所述訓(xùn)練集中各樣本圖像執(zhí)行數(shù)據(jù)增強(qiáng);
17、獲取所述預(yù)訓(xùn)練模型對(duì)經(jīng)所述增強(qiáng)操作增強(qiáng)后的各所述樣本圖像提取的特征描述;
18、獲取所述訓(xùn)練集的特征分布的中心與經(jīng)所述增強(qiáng)操作增強(qiáng)后的各所述樣本圖像的特征描述之間的第一距離;
19、根據(jù)多個(gè)所述第一距離以及所述距離閾值,確定所述增強(qiáng)操作是否為所述目標(biāo)增強(qiáng)操作。
20、在一個(gè)實(shí)施例中,所述根據(jù)多個(gè)所述第一距離以及所述距離閾值,確定所述增強(qiáng)操作是否為所述目標(biāo)增強(qiáng)操作,包括:
21、確定與所述距離閾值之間的差值絕對(duì)值小于預(yù)設(shè)差值的所述第一距離的個(gè)數(shù);
22、當(dāng)確定的所述第一距離的個(gè)數(shù)占所述第一距離的總個(gè)數(shù)的比值超過(guò)第一預(yù)設(shè)比值時(shí),確定所述增強(qiáng)操作為所述目標(biāo)增強(qiáng)操作;
23、當(dāng)確定的所述第一距離的個(gè)數(shù)占所述第一距離的總個(gè)數(shù)的比值未超過(guò)所述第一預(yù)設(shè)比值時(shí),確定所述增強(qiáng)操作不是所述目標(biāo)增強(qiáng)操作。
24、在一個(gè)實(shí)施例中,所述目標(biāo)增強(qiáng)操作包括:屬于第一類增強(qiáng)操作的第一目標(biāo)增強(qiáng)操作以及屬于第二類增強(qiáng)操作的第二目標(biāo)增強(qiáng)操作;其中,所述第一類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍的下限值大于所述第二類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍的上限值;
25、所述根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略,包括:
26、將第一數(shù)據(jù)增強(qiáng)集合中的每一個(gè)數(shù)據(jù)增強(qiáng)策略分別確定為第一目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述第一數(shù)據(jù)增強(qiáng)集合包括:根據(jù)各所述第一目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)對(duì)不同所述第一目標(biāo)增強(qiáng)操作進(jìn)行所述預(yù)設(shè)長(zhǎng)度的隨機(jī)組合得到的數(shù)據(jù)增強(qiáng)策略;
27、和/或,
28、根據(jù)所述訓(xùn)練集的特征分布,在第二數(shù)據(jù)增強(qiáng)集合中搜索第二目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述第二數(shù)據(jù)增強(qiáng)集合包括:根據(jù)各所述第二目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)對(duì)不同所述第二目標(biāo)增強(qiáng)操作進(jìn)行所述預(yù)設(shè)長(zhǎng)度的隨機(jī)組合得到的數(shù)據(jù)增強(qiáng)策略。
29、在一個(gè)實(shí)施例中,所述根據(jù)所述訓(xùn)練集的特征分布,在第二數(shù)據(jù)增強(qiáng)集合中搜索第二目標(biāo)數(shù)據(jù)增強(qiáng)策略,包括:
30、針對(duì)所述第二數(shù)據(jù)增強(qiáng)集合中的每一個(gè)數(shù)據(jù)增強(qiáng)策略,執(zhí)行以下操作:
31、根據(jù)所述數(shù)據(jù)增強(qiáng)策略的強(qiáng)度參數(shù),對(duì)所述訓(xùn)練集中各樣本圖像執(zhí)行數(shù)據(jù)增強(qiáng);
32、獲取所述預(yù)訓(xùn)練模型對(duì)經(jīng)所述數(shù)據(jù)增強(qiáng)策略增強(qiáng)后的各所述樣本圖像提取的特征描述;
33、獲取所述訓(xùn)練集的特征分布的中心與經(jīng)所述數(shù)據(jù)增強(qiáng)策略增強(qiáng)后的各所述樣本圖像的特征描述之間的第二距離;
34、根據(jù)多個(gè)所述第二距離以及所述距離閾值,確定所述數(shù)據(jù)增強(qiáng)策略是否為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略。
35、在一個(gè)實(shí)施例中,所述根據(jù)多個(gè)所述第二距離以及所述距離閾值,確定所述數(shù)據(jù)增強(qiáng)策略是否為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略,包括:
36、確定與所述距離閾值之間的差值絕對(duì)值小于預(yù)設(shè)差值的所述第二距離的個(gè)數(shù);
37、當(dāng)確定的所述第二距離的個(gè)數(shù)占所述第二距離的總個(gè)數(shù)的比值超過(guò)第二預(yù)設(shè)比值時(shí),確定所述數(shù)據(jù)增強(qiáng)策略為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略;
38、當(dāng)確定的所述第二距離的個(gè)數(shù)占所述第二距離的總個(gè)數(shù)的比值未超過(guò)所述第二預(yù)設(shè)比值時(shí),確定所述數(shù)據(jù)增強(qiáng)策略不是所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略。
39、在一個(gè)實(shí)施例中,所述方法還包括:
40、根據(jù)增強(qiáng)后的所述訓(xùn)練集以及所述訓(xùn)練集的標(biāo)簽數(shù)據(jù),對(duì)所述預(yù)訓(xùn)練模型進(jìn)行微調(diào);
41、基于微調(diào)后的所述預(yù)訓(xùn)練模型,重復(fù)執(zhí)行獲取所述特征分布的步驟、搜索所述目標(biāo)增強(qiáng)操作的步驟、搜索所述目標(biāo)數(shù)據(jù)增強(qiáng)策略的步驟以及微調(diào)所述預(yù)訓(xùn)練模型的步驟,直至達(dá)到訓(xùn)練結(jié)束條件。
42、在一個(gè)實(shí)施例中,所述預(yù)訓(xùn)練模型為:經(jīng)由所述訓(xùn)練集預(yù)訓(xùn)練的多任務(wù)學(xué)習(xí)模型;所述多任務(wù)學(xué)習(xí)模型包括特征提取網(wǎng)絡(luò)、單分類頭以及與目標(biāo)任務(wù)對(duì)應(yīng)的任務(wù)頭;所述特征提取網(wǎng)絡(luò)分別連接所述任務(wù)頭與所述單分類頭;
43、其中,所述特征提取網(wǎng)絡(luò),用于對(duì)所述訓(xùn)練集中的各樣本圖像進(jìn)行特征提??;
44、所述單分類頭,用于從所述特征提取網(wǎng)絡(luò)輸出的特征提取結(jié)果中提取各所述樣本圖像的特征描述;所述單分類器的損失函數(shù)為所述第一損失函數(shù)。
45、根據(jù)本公開實(shí)施例的第二方面,提供了一種數(shù)據(jù)增強(qiáng)策略搜索裝置,所述裝置包括:
46、第一獲取模塊,用于獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合;其中,不同類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍不同;
47、第二獲取模塊,用于獲取待增強(qiáng)的訓(xùn)練集的特征分布;
48、第一搜索模塊,用于根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作;
49、第二搜索模塊,用于根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述預(yù)設(shè)長(zhǎng)度,用于將同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合成數(shù)據(jù)增強(qiáng)策略。
50、根據(jù)本公開實(shí)施例的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)所述的數(shù)據(jù)增強(qiáng)策略搜索方法。
51、根據(jù)本公開實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)所述的數(shù)據(jù)增強(qiáng)策略搜索方法。
52、本公開實(shí)施例提供一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置,通過(guò)根據(jù)待增強(qiáng)的訓(xùn)練集的特征分布以及增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作,由于增強(qiáng)操作集合包含至少兩類增強(qiáng)操作,這樣能夠使得不同類增強(qiáng)操作中的每個(gè)增強(qiáng)操作都能夠參與到目標(biāo)增強(qiáng)操作的搜索過(guò)程中,保證了增強(qiáng)操作的多樣性,并且由于目標(biāo)增強(qiáng)操作是結(jié)合訓(xùn)練集的特征分布以及每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)確定的,因此能夠提高對(duì)目標(biāo)增強(qiáng)操作的搜索效果。
53、另外,通過(guò)根據(jù)訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略,由于目標(biāo)數(shù)據(jù)增強(qiáng)是從基于預(yù)設(shè)長(zhǎng)度對(duì)同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合的數(shù)據(jù)增強(qiáng)策略中搜索到的,搜索范圍并未包含屬于不同類增強(qiáng)操作的目標(biāo)增強(qiáng)操作所形成的數(shù)據(jù)增強(qiáng)策略,這樣在數(shù)據(jù)增強(qiáng)策略搜索過(guò)程中,可以有效減少數(shù)據(jù)增強(qiáng)策略搜索空間,能夠提高數(shù)據(jù)增強(qiáng)策略的搜索效率。
54、并且,整個(gè)搜索過(guò)程只需要確定增強(qiáng)操作的執(zhí)行概率以及用于增強(qiáng)操作組合的預(yù)設(shè)長(zhǎng)度,由于需要設(shè)置的參數(shù)較少,由此極大地簡(jiǎn)化了數(shù)據(jù)增強(qiáng)策略的搜索過(guò)程,降低了計(jì)算復(fù)雜度。
55、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。