本發(fā)明涉及邊緣計(jì)算,尤其涉及一種基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法、系統(tǒng)、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著人工智能和物聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,邊緣計(jì)算設(shè)備在處理實(shí)時(shí)、大規(guī)模數(shù)據(jù)方面(例如圖像識(shí)別、自然語(yǔ)言處理以及傳感器數(shù)據(jù)分析)發(fā)揮著越來(lái)越重要的作用。然而,邊緣設(shè)備有限的計(jì)算資源和存儲(chǔ)能力難以滿足深度學(xué)習(xí)模型的高性能需求。
2、為解決上述問(wèn)題,現(xiàn)有技術(shù)中提出利用cuda(compute?unified?devicearchitecture,統(tǒng)一計(jì)算設(shè)備架構(gòu))在gpu(graphic?processing?unit,圖形處理器)上實(shí)現(xiàn)深度學(xué)習(xí)網(wǎng)絡(luò)的加速,但是現(xiàn)有技術(shù)中在邊緣端通過(guò)cuda來(lái)加速深度學(xué)習(xí)網(wǎng)絡(luò)模型的處理效率的方式存在模型優(yōu)化困難,計(jì)算性能低的問(wèn)題,從而導(dǎo)致輸出的數(shù)據(jù)解析結(jié)果效率低以及準(zhǔn)確度不高。
3、因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的在于提供一種基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法、系統(tǒng)、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中在邊緣端通過(guò)cuda來(lái)加速深度學(xué)習(xí)網(wǎng)絡(luò)模型的處理效率存在優(yōu)化困難、計(jì)算性能低,從而導(dǎo)致輸出的數(shù)據(jù)解析結(jié)果效率低以及準(zhǔn)確度不高的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,所述基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法包括如下步驟:
3、獲取原始深度學(xué)習(xí)網(wǎng)絡(luò)模型,對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行矢量轉(zhuǎn)換處理以及行向量計(jì)算處理,得到第一優(yōu)化結(jié)果;
4、對(duì)所述第一優(yōu)化結(jié)果進(jìn)行量化加速處理,得到第二優(yōu)化結(jié)果;
5、對(duì)所述第二優(yōu)化結(jié)果進(jìn)行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果;
6、根據(jù)所述第三優(yōu)化結(jié)果對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行深度學(xué)習(xí)框架重構(gòu)處理,得到目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型;
7、獲取目標(biāo)圖像數(shù)據(jù),并將所述目標(biāo)圖像數(shù)據(jù)輸入至所述目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標(biāo)圖像解析結(jié)果。
8、可選地,所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,其中,所述獲取原始深度學(xué)習(xí)網(wǎng)絡(luò)模型,對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行矢量轉(zhuǎn)換處理以及行向量計(jì)算處理,得到第一優(yōu)化結(jié)果,具體包括:
9、獲取原始深度學(xué)習(xí)網(wǎng)絡(luò)模型以及目標(biāo)三維數(shù)據(jù),并將所述目標(biāo)三維數(shù)據(jù)輸入至所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型;
10、獲取圖像向量化函數(shù),并采用并行計(jì)算設(shè)備架構(gòu)編程對(duì)所述圖像向量化函數(shù)進(jìn)行重寫(xiě)處理,得到重寫(xiě)圖像向量化函數(shù);
11、根據(jù)所述重寫(xiě)圖像向量化函數(shù)對(duì)輸入所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型中的目標(biāo)三維數(shù)據(jù)進(jìn)行矢量轉(zhuǎn)換處理,得到目標(biāo)二維矩陣;
12、采用通用矩陣乘法優(yōu)化策略對(duì)所述目標(biāo)二維矩陣進(jìn)行行向量計(jì)算處理,得到第一優(yōu)化結(jié)果。
13、可選地,所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,其中,所述對(duì)所述第一優(yōu)化結(jié)果進(jìn)行量化加速處理,得到第二優(yōu)化結(jié)果,具體包括:
14、獲取量化神經(jīng)網(wǎng)絡(luò)包,并根據(jù)所述量化神經(jīng)網(wǎng)絡(luò)包構(gòu)建微內(nèi)核基元;
15、采用高性能矩陣乘法根據(jù)所述微內(nèi)核基元對(duì)所述第一優(yōu)化結(jié)果進(jìn)行量化加速處理,得到第二優(yōu)化結(jié)果。
16、可選地,所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,其中,所述對(duì)所述第二優(yōu)化結(jié)果進(jìn)行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果,具體包括:
17、獲取所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型的輸入緩沖區(qū),并采用間接卷積算法根據(jù)所述輸入緩沖區(qū)構(gòu)建得到間接緩沖區(qū);
18、采用指針模擬方法根據(jù)所述間接緩沖區(qū)對(duì)所述第二優(yōu)化結(jié)果進(jìn)行訪存模擬處理,得到第三優(yōu)化結(jié)果。
19、可選地,所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,其中,所述根據(jù)所述第三優(yōu)化結(jié)果對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行深度學(xué)習(xí)框架重構(gòu)處理,得到目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型,具體包括:
20、獲取深度學(xué)習(xí)推理參數(shù),根據(jù)所述深度學(xué)習(xí)推理參數(shù)對(duì)所述第三優(yōu)化結(jié)果進(jìn)行矩陣矢量化處理,得到矢量化結(jié)果,其中,所述深度學(xué)習(xí)推理參數(shù)包括工作空間大小、輸入圖像矩陣格式以及量化浮點(diǎn)操作;
21、根據(jù)所述并行計(jì)算設(shè)備架構(gòu)編程對(duì)所述矢量化結(jié)果進(jìn)行深度學(xué)習(xí)框架重構(gòu)處理,得到目標(biāo)深度神經(jīng)網(wǎng)絡(luò)框架。
22、可選地,所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,其中,所述獲取目標(biāo)圖像數(shù)據(jù),并將所述目標(biāo)圖像數(shù)據(jù)輸入至所述目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標(biāo)圖像解析結(jié)果,具體包括:
23、獲取目標(biāo)圖像數(shù)據(jù),并將所述目標(biāo)圖像數(shù)據(jù)輸入至所述目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型;
24、通過(guò)所述目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型對(duì)所述目標(biāo)圖像數(shù)據(jù)進(jìn)行圖像解析處理,輸出目標(biāo)圖像解析結(jié)果。
25、可選地,所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法,其中,所述通用矩陣乘法優(yōu)化策略包括地址偏移處理、簡(jiǎn)化循環(huán)處理以及內(nèi)存對(duì)齊處理。
26、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理系統(tǒng),其中,所述基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理系統(tǒng)包括:
27、第一優(yōu)化處理模塊,用于獲取原始深度學(xué)習(xí)網(wǎng)絡(luò)模型,對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行矢量轉(zhuǎn)換處理以及行向量計(jì)算處理,得到第一優(yōu)化結(jié)果;
28、第二優(yōu)化處理模塊,用于對(duì)所述第一優(yōu)化結(jié)果進(jìn)行量化加速處理,得到第二優(yōu)化結(jié)果;
29、第三優(yōu)化處理模塊,用于對(duì)所述第二優(yōu)化結(jié)果進(jìn)行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果;
30、深度學(xué)習(xí)框架重構(gòu)模塊,用于根據(jù)所述第三優(yōu)化結(jié)果對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行深度學(xué)習(xí)框架重構(gòu)處理,得到目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型;
31、圖像結(jié)果輸出模塊,用于獲取目標(biāo)圖像數(shù)據(jù),并將所述目標(biāo)圖像數(shù)據(jù)輸入至所述目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標(biāo)圖像解析結(jié)果。
32、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種終端,其中,所述終端包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理程序,所述基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法的步驟。
33、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理程序,所述基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的基于邊緣計(jì)算的深度學(xué)習(xí)網(wǎng)絡(luò)模型的圖像處理方法的步驟。
34、本發(fā)明中,獲取原始深度學(xué)習(xí)網(wǎng)絡(luò)模型,對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行矢量轉(zhuǎn)換處理以及行向量計(jì)算處理,得到第一優(yōu)化結(jié)果;對(duì)所述第一優(yōu)化結(jié)果進(jìn)行量化加速處理,得到第二優(yōu)化結(jié)果;對(duì)所述第二優(yōu)化結(jié)果進(jìn)行間接緩沖區(qū)構(gòu)建處理,得到第三優(yōu)化結(jié)果;根據(jù)所述第三優(yōu)化結(jié)果對(duì)所述原始深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行深度學(xué)習(xí)框架重構(gòu)處理,得到目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型;獲取目標(biāo)圖像數(shù)據(jù),并將所述目標(biāo)圖像數(shù)據(jù)輸入至所述目標(biāo)深度神經(jīng)網(wǎng)絡(luò)模型,輸出目標(biāo)圖像解析結(jié)果。本發(fā)明基于gemm(通用矩陣乘法)矢量計(jì)算、cuda(并行計(jì)算設(shè)備架構(gòu))量化編程和tensorrt(深度學(xué)習(xí)推理參數(shù))張量推理等技術(shù)性處理,有效地解決了現(xiàn)有技術(shù)中在邊緣計(jì)算cuda加速深度學(xué)習(xí)網(wǎng)絡(luò)模型的學(xué)習(xí)成本高、邊緣設(shè)備計(jì)算性能低和模型優(yōu)化困難等問(wèn)題。同時(shí),實(shí)現(xiàn)了深度學(xué)習(xí)模型在邊緣計(jì)算設(shè)備中實(shí)時(shí)計(jì)算、快速高效的學(xué)習(xí)推理任務(wù),有效提高了圖像數(shù)據(jù)在邊緣端的處理效率以及準(zhǔn)確性。