本發(fā)明涉及圖像識(shí)別,尤其涉及一種基于神經(jīng)網(wǎng)絡(luò)的罕見(jiàn)疾病識(shí)別系統(tǒng)。
背景技術(shù):
1、全球有超過(guò)6000種罕見(jiàn)病,影響著超過(guò)3億人群。早期的準(zhǔn)確診斷一直是罕見(jiàn)病臨床實(shí)踐的重要目標(biāo)。其中,約80%與遺傳因素有關(guān)。罕見(jiàn)病診斷難度大、確診耗時(shí)長(zhǎng)。罕見(jiàn)病病灶區(qū)域的準(zhǔn)確識(shí)別是一項(xiàng)很大的挑戰(zhàn)。如今,計(jì)算機(jī)視覺(jué)快速發(fā)展,如何將計(jì)算機(jī)視覺(jué)技術(shù)引入檢測(cè)醫(yī)學(xué)影像的工作,以提高影像診斷的效率和準(zhǔn)確度,在計(jì)算機(jī)視覺(jué)識(shí)別方法中,卷積神經(jīng)網(wǎng)絡(luò)(cnn)是一種特別適合處理圖像數(shù)據(jù)的深度學(xué)習(xí)模型。cnn由多個(gè)卷積層和池化層組成,能夠自動(dòng)學(xué)習(xí)圖像的分層特征表示,并且具有強(qiáng)大的表達(dá)能力和泛化能力,在圖像分類(lèi)、目標(biāo)檢測(cè)、語(yǔ)義分割等領(lǐng)域取得了巨大的成功,同時(shí)也被廣泛應(yīng)用于影像分析中。
2、公開(kāi)號(hào)為cn112472048a的專(zhuān)利文獻(xiàn)公開(kāi)了一種用于心血管疾病患者脈象識(shí)別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括下述步驟:s1,脈象數(shù)據(jù)采集;s2,脈象數(shù)據(jù)預(yù)處理;s3,建立所述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);s4,訓(xùn)練過(guò)程;由此可見(jiàn),現(xiàn)有的疾病檢測(cè)技術(shù)中,缺乏一種適應(yīng)于肺部罕見(jiàn)病的識(shí)別系統(tǒng),通過(guò)準(zhǔn)確快速且準(zhǔn)確地對(duì)輸入的影響數(shù)據(jù)集進(jìn)行篩選,從而將高質(zhì)量影像輸入cnn模型,以精準(zhǔn)截取病灶區(qū)域的粗分割區(qū)域,提高識(shí)別效率。
技術(shù)實(shí)現(xiàn)思路
1、為此,本發(fā)明提供一種基于神經(jīng)網(wǎng)絡(luò)的罕見(jiàn)疾病識(shí)別系統(tǒng),用以克服現(xiàn)有技術(shù)中由于缺乏對(duì)輸入的大量數(shù)據(jù)集進(jìn)行快速精準(zhǔn)篩選,使輸入cnn模型的影像質(zhì)量低下,導(dǎo)致識(shí)別效率低的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于神經(jīng)網(wǎng)絡(luò)的罕見(jiàn)疾病識(shí)別系統(tǒng),包括,
3、樣本采集模塊,其與外部的大數(shù)據(jù)平臺(tái)相連,用以以預(yù)設(shè)采集周期采集罕見(jiàn)病樣本,得到原始數(shù)據(jù)集;
4、樣本篩分模塊,對(duì)所述原始數(shù)據(jù)集依次進(jìn)行預(yù)處理和篩選,得到目標(biāo)數(shù)據(jù)集;
5、樣本掃描模塊,用以獲取所述目標(biāo)數(shù)據(jù)集中的各掃描圖像,根據(jù)第一標(biāo)準(zhǔn)線條區(qū)域占比和第二標(biāo)準(zhǔn)線條區(qū)域占比對(duì)實(shí)時(shí)線條區(qū)域占比進(jìn)行判定,根據(jù)判斷結(jié)果選擇處理模式,根據(jù)所述處理模式和卷積神經(jīng)網(wǎng)絡(luò)識(shí)別各所述掃描圖像中對(duì)應(yīng)的病灶區(qū)域并進(jìn)行分割,得到粗分割圖像;
6、樣本識(shí)別模塊,對(duì)所述粗分割圖像進(jìn)行識(shí)別,提取圖像特征,將所述圖像特征與病變特征進(jìn)行對(duì)比,將匹配的所述粗分割圖像標(biāo)記為目標(biāo)影像樣本;
7、樣本評(píng)估模塊,計(jì)算模型正確預(yù)測(cè)的目標(biāo)影像樣本個(gè)數(shù)占總影像樣本的百分比,得到實(shí)時(shí)準(zhǔn)確率,以確定是否對(duì)篩選參數(shù)進(jìn)行調(diào)整;
8、其中,所述篩選參數(shù)為第二標(biāo)準(zhǔn)線條區(qū)域占比。
9、進(jìn)一步地,所述樣本篩分模塊包括預(yù)處理單元、初篩單元和迭代篩選單元,其中,
10、所述預(yù)處理單元,用以獲取所述原始數(shù)據(jù)集中的影像數(shù)據(jù)作為原始圖像,對(duì)所述原始圖像進(jìn)行輪廓增強(qiáng)處理,得到中間圖像;
11、所述初篩單元,對(duì)各所述中間圖像進(jìn)行初次篩選,以刪除質(zhì)量不合格的中間圖像,得到中間數(shù)據(jù)集;
12、所述迭代篩選單元,對(duì)所述中間數(shù)據(jù)集中的中間圖像進(jìn)行連續(xù)擴(kuò)展掃描,得到所述目標(biāo)數(shù)據(jù)集。
13、進(jìn)一步地,所述樣本掃描模塊包括窗口滑動(dòng)單元、分析單元、選擇處理單元和分割單元,其中,
14、所述窗口滑動(dòng)單元能夠獲取任一掃描圖像的像素總數(shù),根據(jù)滑動(dòng)掃描系數(shù)與像素總數(shù)計(jì)算預(yù)設(shè)滑動(dòng)窗口尺寸,以預(yù)設(shè)滑動(dòng)窗口尺寸將所述掃描圖像劃分為若干待掃描區(qū)域,對(duì)所述待掃描區(qū)域進(jìn)行滑動(dòng)掃描;
15、所述分析單元,用以獲取所述待掃描區(qū)域內(nèi)的標(biāo)記線條像素,根據(jù)標(biāo)記線條像素計(jì)算單元線條像素占比和實(shí)時(shí)線條區(qū)域占比;
16、所述選擇處理單元,用以根據(jù)所述判斷結(jié)果選擇處理模式,以根據(jù)各處理模式和卷積神經(jīng)網(wǎng)絡(luò)識(shí)別各所述掃描圖像中對(duì)應(yīng)的病灶區(qū)域并進(jìn)行分割,得到粗分割圖像;
17、所述分割單元,用以對(duì)所述待分析圖像和所述待掃描區(qū)域進(jìn)行分割,得到粗分割圖像。
18、進(jìn)一步地,所述分析單元包括判定子單元、標(biāo)記子單元和計(jì)算子單元,其中,
19、所述判定子單元用以將單元線條像素占比與標(biāo)準(zhǔn)線條像素占比進(jìn)行對(duì)比;
20、所述標(biāo)記子單元用以在單元線條像素占比大于等于標(biāo)準(zhǔn)線條像素占比時(shí),對(duì)當(dāng)前滑動(dòng)窗口對(duì)應(yīng)圖像區(qū)域進(jìn)行標(biāo)記,標(biāo)記為線條區(qū)域;
21、所述計(jì)算子單元用以獲取線條區(qū)域的個(gè)數(shù)占總待掃描區(qū)域的個(gè)數(shù)的百分比,得到實(shí)時(shí)線條區(qū)域占比。
22、進(jìn)一步地,所述選擇處理單元包括比對(duì)子單元和處理子單元,其中,
23、所述比對(duì)子單元用以根據(jù)第一標(biāo)準(zhǔn)線條區(qū)域占比和第二標(biāo)準(zhǔn)線條區(qū)域占比對(duì)實(shí)時(shí)線條區(qū)域占比進(jìn)行比對(duì);
24、所述處理子單元,用以在實(shí)時(shí)線條區(qū)域占比在第一標(biāo)準(zhǔn)線條區(qū)域占比和第二標(biāo)準(zhǔn)線條區(qū)域占比之間時(shí),對(duì)所述待掃描區(qū)域的線條輪廓邊緣進(jìn)行加強(qiáng)處理,得到待分析圖像。
25、進(jìn)一步地,所述分割單元包括第一分割子單元、第二分割子單元和第三分割子單元,其中,
26、所述第一分割子單元在實(shí)時(shí)線條區(qū)域占比小于第一標(biāo)準(zhǔn)線條區(qū)域占比時(shí),根據(jù)卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述待掃描區(qū)域進(jìn)行結(jié)節(jié)特征識(shí)別和分割,得到粗分割圖像;
27、其中,所述第一分割子單元根據(jù)卷積神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)節(jié)特征,對(duì)結(jié)節(jié)特征所處的區(qū)域進(jìn)行分割,得到粗分割圖像;
28、所述第二分割子單元,用以對(duì)所述待分析圖像進(jìn)行識(shí)別,得到粗分割圖像;
29、所述第三分割子單元,用以在實(shí)時(shí)線條區(qū)域占比大于第二標(biāo)準(zhǔn)線條區(qū)域占比時(shí),根據(jù)卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述待掃描區(qū)域進(jìn)行識(shí)別和分割,以識(shí)別非結(jié)節(jié)性肺部病變區(qū)域,得到粗分割圖像。
30、進(jìn)一步地,所述處理子單元對(duì)線條輪廓邊緣的各漸變過(guò)渡層進(jìn)行徑向漸變過(guò)渡處理,以對(duì)線條輪廓邊緣進(jìn)行加強(qiáng)處理。
31、進(jìn)一步地,所述初篩單元包括數(shù)據(jù)刪除子單元和數(shù)據(jù)增強(qiáng)子單元,其中,
32、所述數(shù)據(jù)刪除子單元用以根據(jù)切片厚度確定是否對(duì)中間圖像進(jìn)行刪除;
33、所述數(shù)據(jù)增強(qiáng)子單元用以對(duì)所述中間圖像區(qū)域中畫(huà)面區(qū)域的邊緣像素點(diǎn)進(jìn)行輪廓邊緣標(biāo)記,依次將各原始亮度值調(diào)整為對(duì)應(yīng)的修正亮度值,以對(duì)中間圖像的亮度數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)處理。
34、進(jìn)一步地,所述數(shù)據(jù)增強(qiáng)子單元分別獲取輪廓內(nèi)區(qū)域各像素點(diǎn)的亮度值,作為若干原始亮度值,根據(jù)各原始亮度值計(jì)算平均輪廓內(nèi)亮度,獲取輪廓外區(qū)域各像素亮度值計(jì)算平均輪廓外亮度,將平均輪廓外亮度減去平均輪廓內(nèi)亮度得到實(shí)時(shí)亮度差值,依次將各原始亮度值與實(shí)時(shí)亮度差值相加,得到對(duì)應(yīng)的修正亮度值,以對(duì)中間圖像的亮度數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)處理。
35、進(jìn)一步地,所述樣本評(píng)估模塊包括比較單元和校正單元,其中,
36、所述比較單元內(nèi)設(shè)定有準(zhǔn)確率閾值,比較單元將實(shí)時(shí)準(zhǔn)確率與準(zhǔn)確率閾值進(jìn)行比較,得到比較結(jié)果;
37、所述校正單元獲取所述比較結(jié)果,在實(shí)時(shí)準(zhǔn)確率小于準(zhǔn)確率閾值時(shí),將第二標(biāo)準(zhǔn)線條區(qū)域占比修正為第二修正線條區(qū)域占比。
38、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于,通過(guò)與大數(shù)據(jù)平臺(tái)相連,自動(dòng)化采集罕見(jiàn)病樣本,提高數(shù)據(jù)收集的效率和一致性,通過(guò)樣本篩分模塊對(duì)原始數(shù)據(jù)集進(jìn)行預(yù)處理和篩選,提高數(shù)據(jù)處理的效率,確保數(shù)據(jù)質(zhì)量,樣本掃描模塊通過(guò)圖像識(shí)別技術(shù),精確分割出掃描圖像中的病灶區(qū)域,為后續(xù)分析提供了準(zhǔn)確的基礎(chǔ),通過(guò)樣本評(píng)估模塊計(jì)算實(shí)時(shí)準(zhǔn)確率,以根據(jù)實(shí)時(shí)準(zhǔn)確率動(dòng)態(tài)調(diào)整篩選參數(shù),優(yōu)化識(shí)別過(guò)程,提高識(shí)別的準(zhǔn)確性。
39、進(jìn)一步地,通過(guò)對(duì)圖像的切片厚度進(jìn)行判定,以自動(dòng)篩選出切片厚度符合標(biāo)準(zhǔn)的圖像,以確保足夠的細(xì)節(jié)捕捉。
40、進(jìn)一步地,通過(guò)設(shè)置掃描系數(shù),以根據(jù)實(shí)際待處理圖像尺寸計(jì)算對(duì)應(yīng)的預(yù)設(shè)滑動(dòng)窗口尺寸,提高對(duì)圖像處理的適用性。
41、進(jìn)一步地,在判定實(shí)時(shí)線條區(qū)域占比在第一標(biāo)準(zhǔn)線條區(qū)域占比和第二標(biāo)準(zhǔn)線條區(qū)域占比之間時(shí),可能存在某些線條邊緣模糊不清,由于模糊或不清晰的邊緣也與病變相關(guān),則先通過(guò)對(duì)線條輪廓邊緣進(jìn)行加強(qiáng)處理,保障線條識(shí)別的清晰度,避免誤識(shí)別,增強(qiáng)處理后,再次對(duì)線條邊緣像素進(jìn)行分析,若仍然存在模糊和不清晰,將對(duì)應(yīng)的區(qū)域標(biāo)記為病灶區(qū)域,關(guān)聯(lián)圖像處理技術(shù),以更準(zhǔn)確地分析圖像中的特征。
42、進(jìn)一步地,為了訓(xùn)練一個(gè)高性能的cnn模型,通常需要數(shù)千到數(shù)萬(wàn)張經(jīng)過(guò)標(biāo)注的訓(xùn)練圖像,這些圖像需要精確標(biāo)明圖像中的目標(biāo)或類(lèi)別,以便模型學(xué)習(xí)特征并進(jìn)行有效的預(yù)測(cè),因此,通過(guò)在一個(gè)較小的目標(biāo)數(shù)據(jù)集上對(duì)篩選參數(shù)第二標(biāo)準(zhǔn)線條區(qū)域占比進(jìn)行微調(diào),以適應(yīng)調(diào)整選擇處理單元的選擇處理模式的過(guò)程,使模型針對(duì)目標(biāo)任務(wù)進(jìn)行細(xì)化學(xué)習(xí),以提高其在特定數(shù)據(jù)集上的表現(xiàn),提升了模型的適用性,同時(shí)也減少了對(duì)大規(guī)模標(biāo)注數(shù)據(jù)的依賴(lài),節(jié)省訓(xùn)練深度學(xué)習(xí)模型需要的算力資源。