两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

數(shù)據(jù)增強(qiáng)策略搜索方法及裝置與流程

文檔序號(hào):40633798發(fā)布日期:2025-01-10 18:39閱讀:3來(lái)源:國(guó)知局
數(shù)據(jù)增強(qiáng)策略搜索方法及裝置與流程

本公開涉及數(shù)據(jù)處理,尤其涉及一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置。


背景技術(shù):

1、深度學(xué)習(xí)任務(wù)通常需要大量的訓(xùn)練數(shù)據(jù)。為了獲得大量的訓(xùn)練數(shù)據(jù),可以對(duì)已有的訓(xùn)練數(shù)據(jù)采用數(shù)據(jù)增強(qiáng)策略進(jìn)行數(shù)據(jù)增強(qiáng),以提升模型的性能和效果。

2、相關(guān)技術(shù)中,數(shù)據(jù)增強(qiáng)策略設(shè)定大多是基于人的先驗(yàn)知識(shí),例如,在訓(xùn)練一個(gè)視覺模型時(shí),基于人的先驗(yàn)知識(shí),人為地加入數(shù)據(jù)增強(qiáng)操作,這種人為地添加數(shù)據(jù)增強(qiáng)操作,需要繁瑣地調(diào)節(jié)參數(shù),由于這些參數(shù)的搜索空間很大,很難取得最優(yōu)的一組參數(shù),導(dǎo)致數(shù)據(jù)增強(qiáng)策略的搜索效果不佳。


技術(shù)實(shí)現(xiàn)思路

1、本公開實(shí)施例提供一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置。

2、根據(jù)本公開實(shí)施例的第一方面,提供了一種數(shù)據(jù)增強(qiáng)策略搜索方法,所述方法包括:

3、獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合;其中,不同類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍不同;

4、獲取待增強(qiáng)的訓(xùn)練集的特征分布;

5、根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作;

6、根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述預(yù)設(shè)長(zhǎng)度,用于將同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合成數(shù)據(jù)增強(qiáng)策略。

7、在一個(gè)實(shí)施例中,所述獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合,包括:

8、根據(jù)所述訓(xùn)練集與未標(biāo)記標(biāo)簽的測(cè)試集之間的樣本屬性的差異,確定多個(gè)增強(qiáng)操作以及各所述增強(qiáng)操作的執(zhí)行概率和強(qiáng)度參數(shù);

9、根據(jù)各所述增強(qiáng)操作的執(zhí)行概率與預(yù)設(shè)概率之間的比較結(jié)果,確定形成所述增強(qiáng)操作集合的至少兩類增強(qiáng)操作。

10、在一個(gè)實(shí)施例中,所述獲取待增強(qiáng)的訓(xùn)練集的特征分布,包括:

11、根據(jù)預(yù)訓(xùn)練模型的第一損失函數(shù)、以及所述預(yù)訓(xùn)練模型對(duì)所述訓(xùn)練集中的各樣本圖像提取的特征描述,獲取所述訓(xùn)練集的特征分布;

12、其中,所述第一損失函數(shù)中包含:以所述訓(xùn)練集中所有樣本圖像的特征描述的特征中心作為球心、以距離閾值作為半徑的球的球面外的特征描述到所述球面的距離。

13、在一個(gè)實(shí)施例中,所述根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作,包括:

14、將所述增強(qiáng)操作集合中的所有增強(qiáng)操作的執(zhí)行概率調(diào)整為同一概率;

15、針對(duì)所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作,執(zhí)行以下操作:

16、根據(jù)所述增強(qiáng)操作的強(qiáng)度參數(shù),分別對(duì)所述訓(xùn)練集中各樣本圖像執(zhí)行數(shù)據(jù)增強(qiáng);

17、獲取所述預(yù)訓(xùn)練模型對(duì)經(jīng)所述增強(qiáng)操作增強(qiáng)后的各所述樣本圖像提取的特征描述;

18、獲取所述訓(xùn)練集的特征分布的中心與經(jīng)所述增強(qiáng)操作增強(qiáng)后的各所述樣本圖像的特征描述之間的第一距離;

19、根據(jù)多個(gè)所述第一距離以及所述距離閾值,確定所述增強(qiáng)操作是否為所述目標(biāo)增強(qiáng)操作。

20、在一個(gè)實(shí)施例中,所述根據(jù)多個(gè)所述第一距離以及所述距離閾值,確定所述增強(qiáng)操作是否為所述目標(biāo)增強(qiáng)操作,包括:

21、確定與所述距離閾值之間的差值絕對(duì)值小于預(yù)設(shè)差值的所述第一距離的個(gè)數(shù);

22、當(dāng)確定的所述第一距離的個(gè)數(shù)占所述第一距離的總個(gè)數(shù)的比值超過(guò)第一預(yù)設(shè)比值時(shí),確定所述增強(qiáng)操作為所述目標(biāo)增強(qiáng)操作;

23、當(dāng)確定的所述第一距離的個(gè)數(shù)占所述第一距離的總個(gè)數(shù)的比值未超過(guò)所述第一預(yù)設(shè)比值時(shí),確定所述增強(qiáng)操作不是所述目標(biāo)增強(qiáng)操作。

24、在一個(gè)實(shí)施例中,所述目標(biāo)增強(qiáng)操作包括:屬于第一類增強(qiáng)操作的第一目標(biāo)增強(qiáng)操作以及屬于第二類增強(qiáng)操作的第二目標(biāo)增強(qiáng)操作;其中,所述第一類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍的下限值大于所述第二類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍的上限值;

25、所述根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略,包括:

26、將第一數(shù)據(jù)增強(qiáng)集合中的每一個(gè)數(shù)據(jù)增強(qiáng)策略分別確定為第一目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述第一數(shù)據(jù)增強(qiáng)集合包括:根據(jù)各所述第一目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)對(duì)不同所述第一目標(biāo)增強(qiáng)操作進(jìn)行所述預(yù)設(shè)長(zhǎng)度的隨機(jī)組合得到的數(shù)據(jù)增強(qiáng)策略;

27、和/或,

28、根據(jù)所述訓(xùn)練集的特征分布,在第二數(shù)據(jù)增強(qiáng)集合中搜索第二目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述第二數(shù)據(jù)增強(qiáng)集合包括:根據(jù)各所述第二目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)對(duì)不同所述第二目標(biāo)增強(qiáng)操作進(jìn)行所述預(yù)設(shè)長(zhǎng)度的隨機(jī)組合得到的數(shù)據(jù)增強(qiáng)策略。

29、在一個(gè)實(shí)施例中,所述根據(jù)所述訓(xùn)練集的特征分布,在第二數(shù)據(jù)增強(qiáng)集合中搜索第二目標(biāo)數(shù)據(jù)增強(qiáng)策略,包括:

30、針對(duì)所述第二數(shù)據(jù)增強(qiáng)集合中的每一個(gè)數(shù)據(jù)增強(qiáng)策略,執(zhí)行以下操作:

31、根據(jù)所述數(shù)據(jù)增強(qiáng)策略的強(qiáng)度參數(shù),對(duì)所述訓(xùn)練集中各樣本圖像執(zhí)行數(shù)據(jù)增強(qiáng);

32、獲取所述預(yù)訓(xùn)練模型對(duì)經(jīng)所述數(shù)據(jù)增強(qiáng)策略增強(qiáng)后的各所述樣本圖像提取的特征描述;

33、獲取所述訓(xùn)練集的特征分布的中心與經(jīng)所述數(shù)據(jù)增強(qiáng)策略增強(qiáng)后的各所述樣本圖像的特征描述之間的第二距離;

34、根據(jù)多個(gè)所述第二距離以及所述距離閾值,確定所述數(shù)據(jù)增強(qiáng)策略是否為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略。

35、在一個(gè)實(shí)施例中,所述根據(jù)多個(gè)所述第二距離以及所述距離閾值,確定所述數(shù)據(jù)增強(qiáng)策略是否為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略,包括:

36、確定與所述距離閾值之間的差值絕對(duì)值小于預(yù)設(shè)差值的所述第二距離的個(gè)數(shù);

37、當(dāng)確定的所述第二距離的個(gè)數(shù)占所述第二距離的總個(gè)數(shù)的比值超過(guò)第二預(yù)設(shè)比值時(shí),確定所述數(shù)據(jù)增強(qiáng)策略為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略;

38、當(dāng)確定的所述第二距離的個(gè)數(shù)占所述第二距離的總個(gè)數(shù)的比值未超過(guò)所述第二預(yù)設(shè)比值時(shí),確定所述數(shù)據(jù)增強(qiáng)策略不是所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略。

39、在一個(gè)實(shí)施例中,所述方法還包括:

40、根據(jù)增強(qiáng)后的所述訓(xùn)練集以及所述訓(xùn)練集的標(biāo)簽數(shù)據(jù),對(duì)所述預(yù)訓(xùn)練模型進(jìn)行微調(diào);

41、基于微調(diào)后的所述預(yù)訓(xùn)練模型,重復(fù)執(zhí)行獲取所述特征分布的步驟、搜索所述目標(biāo)增強(qiáng)操作的步驟、搜索所述目標(biāo)數(shù)據(jù)增強(qiáng)策略的步驟以及微調(diào)所述預(yù)訓(xùn)練模型的步驟,直至達(dá)到訓(xùn)練結(jié)束條件。

42、在一個(gè)實(shí)施例中,所述預(yù)訓(xùn)練模型為:經(jīng)由所述訓(xùn)練集預(yù)訓(xùn)練的多任務(wù)學(xué)習(xí)模型;所述多任務(wù)學(xué)習(xí)模型包括特征提取網(wǎng)絡(luò)、單分類頭以及與目標(biāo)任務(wù)對(duì)應(yīng)的任務(wù)頭;所述特征提取網(wǎng)絡(luò)分別連接所述任務(wù)頭與所述單分類頭;

43、其中,所述特征提取網(wǎng)絡(luò),用于對(duì)所述訓(xùn)練集中的各樣本圖像進(jìn)行特征提??;

44、所述單分類頭,用于從所述特征提取網(wǎng)絡(luò)輸出的特征提取結(jié)果中提取各所述樣本圖像的特征描述;所述單分類器的損失函數(shù)為所述第一損失函數(shù)。

45、根據(jù)本公開實(shí)施例的第二方面,提供了一種數(shù)據(jù)增強(qiáng)策略搜索裝置,所述裝置包括:

46、第一獲取模塊,用于獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合;其中,不同類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍不同;

47、第二獲取模塊,用于獲取待增強(qiáng)的訓(xùn)練集的特征分布;

48、第一搜索模塊,用于根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作;

49、第二搜索模塊,用于根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略;其中,所述預(yù)設(shè)長(zhǎng)度,用于將同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合成數(shù)據(jù)增強(qiáng)策略。

50、根據(jù)本公開實(shí)施例的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)所述的數(shù)據(jù)增強(qiáng)策略搜索方法。

51、根據(jù)本公開實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)所述的數(shù)據(jù)增強(qiáng)策略搜索方法。

52、本公開實(shí)施例提供一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置,通過(guò)根據(jù)待增強(qiáng)的訓(xùn)練集的特征分布以及增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù),搜索目標(biāo)增強(qiáng)操作,由于增強(qiáng)操作集合包含至少兩類增強(qiáng)操作,這樣能夠使得不同類增強(qiáng)操作中的每個(gè)增強(qiáng)操作都能夠參與到目標(biāo)增強(qiáng)操作的搜索過(guò)程中,保證了增強(qiáng)操作的多樣性,并且由于目標(biāo)增強(qiáng)操作是結(jié)合訓(xùn)練集的特征分布以及每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)確定的,因此能夠提高對(duì)目標(biāo)增強(qiáng)操作的搜索效果。

53、另外,通過(guò)根據(jù)訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù),搜索用于增強(qiáng)訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略,由于目標(biāo)數(shù)據(jù)增強(qiáng)是從基于預(yù)設(shè)長(zhǎng)度對(duì)同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合的數(shù)據(jù)增強(qiáng)策略中搜索到的,搜索范圍并未包含屬于不同類增強(qiáng)操作的目標(biāo)增強(qiáng)操作所形成的數(shù)據(jù)增強(qiáng)策略,這樣在數(shù)據(jù)增強(qiáng)策略搜索過(guò)程中,可以有效減少數(shù)據(jù)增強(qiáng)策略搜索空間,能夠提高數(shù)據(jù)增強(qiáng)策略的搜索效率。

54、并且,整個(gè)搜索過(guò)程只需要確定增強(qiáng)操作的執(zhí)行概率以及用于增強(qiáng)操作組合的預(yù)設(shè)長(zhǎng)度,由于需要設(shè)置的參數(shù)較少,由此極大地簡(jiǎn)化了數(shù)據(jù)增強(qiáng)策略的搜索過(guò)程,降低了計(jì)算復(fù)雜度。

55、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
东丽区| 蓝田县| 荆门市| 卫辉市| 上虞市| 天水市| 汝州市| 伊春市| 宝鸡市| 迭部县| 衢州市| 集贤县| 万年县| 盐城市| 志丹县| 马公市| 阿合奇县| 鲁山县| 哈尔滨市| 高清| 阿拉善左旗| 吉木乃县| 光泽县| 五原县| 精河县| 陇川县| 灵山县| 宝鸡市| 高碑店市| 都江堰市| 惠水县| 安西县| 怀来县| 沙田区| 莲花县| 东平县| 沅江市| 福海县| 万盛区| 五原县| 常州市|