數(shù)據(jù)增強(qiáng)策略搜索方法及裝置與流程

文檔序號(hào)：40633798發(fā)布日期：2025-01-10 18:39閱讀：3來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本公開涉及數(shù)據(jù)處理，尤其涉及一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置。

背景技術(shù)：

1、深度學(xué)習(xí)任務(wù)通常需要大量的訓(xùn)練數(shù)據(jù)。為了獲得大量的訓(xùn)練數(shù)據(jù)，可以對(duì)已有的訓(xùn)練數(shù)據(jù)采用數(shù)據(jù)增強(qiáng)策略進(jìn)行數(shù)據(jù)增強(qiáng)，以提升模型的性能和效果。

2、相關(guān)技術(shù)中，數(shù)據(jù)增強(qiáng)策略設(shè)定大多是基于人的先驗(yàn)知識(shí)，例如，在訓(xùn)練一個(gè)視覺模型時(shí)，基于人的先驗(yàn)知識(shí)，人為地加入數(shù)據(jù)增強(qiáng)操作，這種人為地添加數(shù)據(jù)增強(qiáng)操作，需要繁瑣地調(diào)節(jié)參數(shù)，由于這些參數(shù)的搜索空間很大，很難取得最優(yōu)的一組參數(shù)，導(dǎo)致數(shù)據(jù)增強(qiáng)策略的搜索效果不佳。

技術(shù)實(shí)現(xiàn)思路

1、本公開實(shí)施例提供一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置。

2、根據(jù)本公開實(shí)施例的第一方面，提供了一種數(shù)據(jù)增強(qiáng)策略搜索方法，所述方法包括：

3、獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合；其中，不同類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍不同；

4、獲取待增強(qiáng)的訓(xùn)練集的特征分布；

5、根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索目標(biāo)增強(qiáng)操作；

6、根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略；其中，所述預(yù)設(shè)長(zhǎng)度，用于將同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合成數(shù)據(jù)增強(qiáng)策略。

7、在一個(gè)實(shí)施例中，所述獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合，包括：

8、根據(jù)所述訓(xùn)練集與未標(biāo)記標(biāo)簽的測(cè)試集之間的樣本屬性的差異，確定多個(gè)增強(qiáng)操作以及各所述增強(qiáng)操作的執(zhí)行概率和強(qiáng)度參數(shù)；

9、根據(jù)各所述增強(qiáng)操作的執(zhí)行概率與預(yù)設(shè)概率之間的比較結(jié)果，確定形成所述增強(qiáng)操作集合的至少兩類增強(qiáng)操作。

10、在一個(gè)實(shí)施例中，所述獲取待增強(qiáng)的訓(xùn)練集的特征分布，包括：

11、根據(jù)預(yù)訓(xùn)練模型的第一損失函數(shù)、以及所述預(yù)訓(xùn)練模型對(duì)所述訓(xùn)練集中的各樣本圖像提取的特征描述，獲取所述訓(xùn)練集的特征分布；

12、其中，所述第一損失函數(shù)中包含：以所述訓(xùn)練集中所有樣本圖像的特征描述的特征中心作為球心、以距離閾值作為半徑的球的球面外的特征描述到所述球面的距離。

13、在一個(gè)實(shí)施例中，所述根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索目標(biāo)增強(qiáng)操作，包括：

14、將所述增強(qiáng)操作集合中的所有增強(qiáng)操作的執(zhí)行概率調(diào)整為同一概率；

15、針對(duì)所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作，執(zhí)行以下操作：

16、根據(jù)所述增強(qiáng)操作的強(qiáng)度參數(shù)，分別對(duì)所述訓(xùn)練集中各樣本圖像執(zhí)行數(shù)據(jù)增強(qiáng)；

17、獲取所述預(yù)訓(xùn)練模型對(duì)經(jīng)所述增強(qiáng)操作增強(qiáng)后的各所述樣本圖像提取的特征描述；

18、獲取所述訓(xùn)練集的特征分布的中心與經(jīng)所述增強(qiáng)操作增強(qiáng)后的各所述樣本圖像的特征描述之間的第一距離；

19、根據(jù)多個(gè)所述第一距離以及所述距離閾值，確定所述增強(qiáng)操作是否為所述目標(biāo)增強(qiáng)操作。

20、在一個(gè)實(shí)施例中，所述根據(jù)多個(gè)所述第一距離以及所述距離閾值，確定所述增強(qiáng)操作是否為所述目標(biāo)增強(qiáng)操作，包括：

21、確定與所述距離閾值之間的差值絕對(duì)值小于預(yù)設(shè)差值的所述第一距離的個(gè)數(shù)；

22、當(dāng)確定的所述第一距離的個(gè)數(shù)占所述第一距離的總個(gè)數(shù)的比值超過(guò)第一預(yù)設(shè)比值時(shí)，確定所述增強(qiáng)操作為所述目標(biāo)增強(qiáng)操作；

23、當(dāng)確定的所述第一距離的個(gè)數(shù)占所述第一距離的總個(gè)數(shù)的比值未超過(guò)所述第一預(yù)設(shè)比值時(shí)，確定所述增強(qiáng)操作不是所述目標(biāo)增強(qiáng)操作。

24、在一個(gè)實(shí)施例中，所述目標(biāo)增強(qiáng)操作包括：屬于第一類增強(qiáng)操作的第一目標(biāo)增強(qiáng)操作以及屬于第二類增強(qiáng)操作的第二目標(biāo)增強(qiáng)操作；其中，所述第一類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍的下限值大于所述第二類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍的上限值；

25、所述根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略，包括：

26、將第一數(shù)據(jù)增強(qiáng)集合中的每一個(gè)數(shù)據(jù)增強(qiáng)策略分別確定為第一目標(biāo)數(shù)據(jù)增強(qiáng)策略；其中，所述第一數(shù)據(jù)增強(qiáng)集合包括：根據(jù)各所述第一目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)對(duì)不同所述第一目標(biāo)增強(qiáng)操作進(jìn)行所述預(yù)設(shè)長(zhǎng)度的隨機(jī)組合得到的數(shù)據(jù)增強(qiáng)策略；

27、和/或，

28、根據(jù)所述訓(xùn)練集的特征分布，在第二數(shù)據(jù)增強(qiáng)集合中搜索第二目標(biāo)數(shù)據(jù)增強(qiáng)策略；其中，所述第二數(shù)據(jù)增強(qiáng)集合包括：根據(jù)各所述第二目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)對(duì)不同所述第二目標(biāo)增強(qiáng)操作進(jìn)行所述預(yù)設(shè)長(zhǎng)度的隨機(jī)組合得到的數(shù)據(jù)增強(qiáng)策略。

29、在一個(gè)實(shí)施例中，所述根據(jù)所述訓(xùn)練集的特征分布，在第二數(shù)據(jù)增強(qiáng)集合中搜索第二目標(biāo)數(shù)據(jù)增強(qiáng)策略，包括：

30、針對(duì)所述第二數(shù)據(jù)增強(qiáng)集合中的每一個(gè)數(shù)據(jù)增強(qiáng)策略，執(zhí)行以下操作：

31、根據(jù)所述數(shù)據(jù)增強(qiáng)策略的強(qiáng)度參數(shù)，對(duì)所述訓(xùn)練集中各樣本圖像執(zhí)行數(shù)據(jù)增強(qiáng)；

32、獲取所述預(yù)訓(xùn)練模型對(duì)經(jīng)所述數(shù)據(jù)增強(qiáng)策略增強(qiáng)后的各所述樣本圖像提取的特征描述；

33、獲取所述訓(xùn)練集的特征分布的中心與經(jīng)所述數(shù)據(jù)增強(qiáng)策略增強(qiáng)后的各所述樣本圖像的特征描述之間的第二距離；

34、根據(jù)多個(gè)所述第二距離以及所述距離閾值，確定所述數(shù)據(jù)增強(qiáng)策略是否為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略。

35、在一個(gè)實(shí)施例中，所述根據(jù)多個(gè)所述第二距離以及所述距離閾值，確定所述數(shù)據(jù)增強(qiáng)策略是否為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略，包括：

36、確定與所述距離閾值之間的差值絕對(duì)值小于預(yù)設(shè)差值的所述第二距離的個(gè)數(shù)；

37、當(dāng)確定的所述第二距離的個(gè)數(shù)占所述第二距離的總個(gè)數(shù)的比值超過(guò)第二預(yù)設(shè)比值時(shí)，確定所述數(shù)據(jù)增強(qiáng)策略為所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略；

38、當(dāng)確定的所述第二距離的個(gè)數(shù)占所述第二距離的總個(gè)數(shù)的比值未超過(guò)所述第二預(yù)設(shè)比值時(shí)，確定所述數(shù)據(jù)增強(qiáng)策略不是所述第二目標(biāo)數(shù)據(jù)增強(qiáng)策略。

39、在一個(gè)實(shí)施例中，所述方法還包括：

40、根據(jù)增強(qiáng)后的所述訓(xùn)練集以及所述訓(xùn)練集的標(biāo)簽數(shù)據(jù)，對(duì)所述預(yù)訓(xùn)練模型進(jìn)行微調(diào)；

41、基于微調(diào)后的所述預(yù)訓(xùn)練模型，重復(fù)執(zhí)行獲取所述特征分布的步驟、搜索所述目標(biāo)增強(qiáng)操作的步驟、搜索所述目標(biāo)數(shù)據(jù)增強(qiáng)策略的步驟以及微調(diào)所述預(yù)訓(xùn)練模型的步驟，直至達(dá)到訓(xùn)練結(jié)束條件。

42、在一個(gè)實(shí)施例中，所述預(yù)訓(xùn)練模型為：經(jīng)由所述訓(xùn)練集預(yù)訓(xùn)練的多任務(wù)學(xué)習(xí)模型；所述多任務(wù)學(xué)習(xí)模型包括特征提取網(wǎng)絡(luò)、單分類頭以及與目標(biāo)任務(wù)對(duì)應(yīng)的任務(wù)頭；所述特征提取網(wǎng)絡(luò)分別連接所述任務(wù)頭與所述單分類頭；

43、其中，所述特征提取網(wǎng)絡(luò)，用于對(duì)所述訓(xùn)練集中的各樣本圖像進(jìn)行特征提??；

44、所述單分類頭，用于從所述特征提取網(wǎng)絡(luò)輸出的特征提取結(jié)果中提取各所述樣本圖像的特征描述；所述單分類器的損失函數(shù)為所述第一損失函數(shù)。

45、根據(jù)本公開實(shí)施例的第二方面，提供了一種數(shù)據(jù)增強(qiáng)策略搜索裝置，所述裝置包括：

46、第一獲取模塊，用于獲取包含至少兩類增強(qiáng)操作的增強(qiáng)操作集合；其中，不同類增強(qiáng)操作對(duì)應(yīng)的執(zhí)行概率范圍不同；

47、第二獲取模塊，用于獲取待增強(qiáng)的訓(xùn)練集的特征分布；

48、第一搜索模塊，用于根據(jù)所述訓(xùn)練集的特征分布以及所述增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索目標(biāo)增強(qiáng)操作；

49、第二搜索模塊，用于根據(jù)所述訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)所述目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索用于增強(qiáng)所述訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略；其中，所述預(yù)設(shè)長(zhǎng)度，用于將同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合成數(shù)據(jù)增強(qiáng)策略。

50、根據(jù)本公開實(shí)施例的第三方面，提供了一種電子設(shè)備，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)所述的數(shù)據(jù)增強(qiáng)策略搜索方法。

51、根據(jù)本公開實(shí)施例的第四方面，提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)所述的數(shù)據(jù)增強(qiáng)策略搜索方法。

52、本公開實(shí)施例提供一種數(shù)據(jù)增強(qiáng)策略搜索方法及裝置，通過(guò)根據(jù)待增強(qiáng)的訓(xùn)練集的特征分布以及增強(qiáng)操作集合中的每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索目標(biāo)增強(qiáng)操作，由于增強(qiáng)操作集合包含至少兩類增強(qiáng)操作，這樣能夠使得不同類增強(qiáng)操作中的每個(gè)增強(qiáng)操作都能夠參與到目標(biāo)增強(qiáng)操作的搜索過(guò)程中，保證了增強(qiáng)操作的多樣性，并且由于目標(biāo)增強(qiáng)操作是結(jié)合訓(xùn)練集的特征分布以及每個(gè)增強(qiáng)操作的強(qiáng)度參數(shù)確定的，因此能夠提高對(duì)目標(biāo)增強(qiáng)操作的搜索效果。

53、另外，通過(guò)根據(jù)訓(xùn)練集的特征分布、預(yù)設(shè)長(zhǎng)度以及各個(gè)目標(biāo)增強(qiáng)操作的強(qiáng)度參數(shù)，搜索用于增強(qiáng)訓(xùn)練集的目標(biāo)數(shù)據(jù)增強(qiáng)策略，由于目標(biāo)數(shù)據(jù)增強(qiáng)是從基于預(yù)設(shè)長(zhǎng)度對(duì)同一類增強(qiáng)操作中的不同目標(biāo)增強(qiáng)操作隨機(jī)組合的數(shù)據(jù)增強(qiáng)策略中搜索到的，搜索范圍并未包含屬于不同類增強(qiáng)操作的目標(biāo)增強(qiáng)操作所形成的數(shù)據(jù)增強(qiáng)策略，這樣在數(shù)據(jù)增強(qiáng)策略搜索過(guò)程中，可以有效減少數(shù)據(jù)增強(qiáng)策略搜索空間，能夠提高數(shù)據(jù)增強(qiáng)策略的搜索效率。

54、并且，整個(gè)搜索過(guò)程只需要確定增強(qiáng)操作的執(zhí)行概率以及用于增強(qiáng)操作組合的預(yù)設(shè)長(zhǎng)度，由于需要設(shè)置的參數(shù)較少，由此極大地簡(jiǎn)化了數(shù)據(jù)增強(qiáng)策略的搜索過(guò)程，降低了計(jì)算復(fù)雜度。

55、應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本公開。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：林露樾,段紀(jì)偉,黃達(dá)一
技術(shù)所有人：珠海金山辦公軟件有限公司
我是此專利的發(fā)明人

上一篇：一種車籃的制作方法
上一篇：一種帶有擋雨結(jié)構(gòu)的汽車充電樁的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

數(shù)據(jù)增強(qiáng)策略搜索方法及裝置與流程