两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的方法和系統(tǒng)與流程

文檔序號(hào):40648714發(fā)布日期:2025-01-10 18:55閱讀:5來(lái)源:國(guó)知局
對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的方法和系統(tǒng)與流程

本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的方法和系統(tǒng)。


背景技術(shù):

1、脫敏技術(shù)作為防范敏感信息泄露的核心手段之一,對(duì)于防止身份盜竊、欺詐、騷擾等嚴(yán)重后果至關(guān)重要,有效維護(hù)了個(gè)人隱私權(quán)益。在實(shí)際業(yè)務(wù)場(chǎng)景中,尤其是涉及圖片信息時(shí),如身份證、駕照、護(hù)照等證件上的個(gè)人敏感信息,以及人臉、車牌等身份識(shí)別特征,均需通過(guò)圖片脫敏處理來(lái)加強(qiáng)保護(hù)。這通常包括模糊處理、遮擋或替換敏感區(qū)域等手段,以有效阻止未授權(quán)人員識(shí)別和利用這些信息。當(dāng)前市場(chǎng)上,針對(duì)圖片中敏感信息的識(shí)別與替換,主要采用人工圈定結(jié)合生成對(duì)抗網(wǎng)絡(luò)gan、深度擴(kuò)散概率模型ddpm等圖像補(bǔ)全技術(shù)的方式。這些技術(shù)通過(guò)訓(xùn)練好的敏感信息位置識(shí)別模型如基于cnn的目標(biāo)檢測(cè)模型來(lái)自動(dòng)識(shí)別和替換人為圈定的敏感區(qū)域。然而,這種方法在人工圈定的自動(dòng)化程度上存在局限,且對(duì)于不連接公網(wǎng)或缺乏大量場(chǎng)景敏感信息位置標(biāo)注數(shù)據(jù)的場(chǎng)景,其實(shí)用性受到限制。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明針對(duì)現(xiàn)有技術(shù)中的不足,提供了對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的方法,所述個(gè)人敏感信息包括姓名信息、手機(jī)號(hào)信息和身份證號(hào)信息,包括如下步驟:

2、s1,將待處理圖片拆分成多個(gè)大小相同的圖像塊,其中相鄰圖像塊之間存在重疊區(qū)域,將每個(gè)圖像塊用sift算法提取為一個(gè)多維向量,組成包含有各圖像塊對(duì)應(yīng)的多維向量的待處理圖片向量集;

3、s2,制作三個(gè)對(duì)比圖片組,其中第一圖片組所包含的各不同樣本圖片中均僅包含有姓名信息,第二圖片組所包含的各不同樣本圖片中均僅包含有手機(jī)號(hào)信息,第三圖片組所包含的各不同樣本圖片中均僅包含有身份證號(hào)信息,使用sift算法將第一圖片組、第二圖片組和第三圖片組中的各樣本圖片提取為對(duì)應(yīng)多維向量,將三對(duì)比圖片組的所有多維向量合并成一比對(duì)圖片向量數(shù)據(jù)集;

4、s3,計(jì)算所述待處理圖片向量集中各多維向量與比對(duì)圖片向量數(shù)據(jù)集的差異,若存在至少一圖像塊對(duì)應(yīng)的多維向量與一對(duì)比圖片組的各多維向量相接近,則將該圖像塊作為包含有相接近對(duì)比圖片組所對(duì)應(yīng)的敏感信息類型的脫敏位置區(qū)域;

5、s4,對(duì)獲得的脫敏位置區(qū)域進(jìn)行遮蔽并使用圖像生成模型對(duì)遮蔽區(qū)域進(jìn)行補(bǔ)全后,獲得最終的脫敏圖片。

6、優(yōu)選的,所述步驟s2包括:

7、s21,使用sift算法將各樣本圖片提取為對(duì)應(yīng)128維的多維向量,對(duì)圖片向量數(shù)據(jù)集中的各128維多維向量y進(jìn)行乘積量化處理,將多維向量y分成16段子向量,每個(gè)子向量的長(zhǎng)度為8,具體如下:

8、;

9、其中為128維向量y中的其中一維向量,為向量y的一個(gè)子向量。

10、s22,將16個(gè)子向量進(jìn)行16次k-means聚類,每個(gè)聚類存儲(chǔ)50個(gè)質(zhì)心。

11、優(yōu)選的,所述步驟s3包括:

12、s31,使用以下近似公式計(jì)算待處理圖片向量集中各圖像塊的128維的多維向量x與圖片向量數(shù)據(jù)集中的多維向量y的近似距離:

13、

14、其中,x為待處理圖片向量集中的一個(gè)向量,y為圖片向量數(shù)據(jù)集中的一個(gè)向量,為向量y的一個(gè)子向量,為映射為其對(duì)應(yīng)的k-means算法的質(zhì)心,?為向量x的一個(gè)子向量。

15、s32,計(jì)算待處理圖片向量集中的所有多維向量x與圖片向量數(shù)據(jù)集中所有多維向量y的近似距離,獲取近似距離排列在前的設(shè)定個(gè)數(shù)的候選向量組,所述候選向量組包含一多維向量x和一多維向量y,判斷該候選向量組中的多維向量x是否屬于某一類型的敏感信息。

16、優(yōu)選的,所述步驟s32包括:根據(jù)候選向量組中的多維向量y所來(lái)自的不同對(duì)比圖片組進(jìn)行分類集合,分別計(jì)算各分類候選向量組集合中的近似距離平均值,若所述近似距離平均值超過(guò)設(shè)定閾值,則認(rèn)為該待處理圖片中包含有超過(guò)設(shè)定閾值的候選向量組集合所對(duì)應(yīng)的敏感信息類型。

17、優(yōu)選的,所述步驟s32還包括:若所述近似距離平均值超過(guò)設(shè)定閾值,則獲取超過(guò)設(shè)定閾值的候選向量組集合所對(duì)應(yīng)的各候選向量組中的多維向量x,將該多維向量x所對(duì)應(yīng)圖像塊區(qū)域作為包含有所在分類候選向量組對(duì)應(yīng)的敏感信息類型的位置區(qū)域。

18、優(yōu)選的,所述步驟s4包括:先將獲取的脫敏位置區(qū)域位置標(biāo)注為掩蓋,然后利用ddpm模型來(lái)進(jìn)行圖片補(bǔ)全:具體ddpm補(bǔ)全公式如下:

19、;

20、其中為用待處理圖片的未掩蓋部分采樣出來(lái)的圖片區(qū)域,為ddpm模型的默認(rèn)參數(shù),為原始被掩蓋后的圖片區(qū)域,為由ddpm模型采樣出來(lái)的圖片區(qū)域,為上輪采樣后的圖片樣本,為本輪采樣后的圖片樣本;和為訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)其輸入為,參數(shù)為;為單位矩陣,為特殊乘積在這里代表掩碼,首先從開(kāi)始,然后循環(huán)運(yùn)算上面的公式,直到達(dá)到設(shè)定次數(shù)。達(dá)到使用未掩蓋部分采樣出來(lái)的,拼接從模型采樣出來(lái),進(jìn)行圖片補(bǔ)全。

21、本發(fā)明還公開(kāi)了對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的系統(tǒng),所述個(gè)人敏感信息包括姓名信息、手機(jī)號(hào)信息和身份證號(hào)信息,包括圖像拆分模塊、樣本生成模塊、差異對(duì)比模塊和脫敏補(bǔ)全模塊,其中圖像拆分模塊,用于將待處理圖片拆分成多個(gè)大小相同的圖像塊,其中相鄰圖像塊之間存在重疊區(qū)域,將每個(gè)圖像塊用sift算法提取為一個(gè)多維向量,組成包含有各圖像塊對(duì)應(yīng)的多維向量的待處理圖片向量集;樣本生成模塊,用于制作三個(gè)對(duì)比圖片組,其中第一圖片組所包含的各不同樣本圖片中均僅包含有姓名信息,第二圖片組所包含的各不同樣本圖片中均僅包含有手機(jī)號(hào)信息,第三圖片組所包含的各不同樣本圖片中均僅包含有身份證號(hào)信息,使用sift算法將第一圖片組、第二圖片組和第三圖片組中的各樣本圖片提取為對(duì)應(yīng)多維向量,將三對(duì)比圖片組的所有多維向量合并成一比對(duì)圖片向量數(shù)據(jù)集;差異對(duì)比模塊,用于計(jì)算所述待處理圖片向量集中各多維向量與比對(duì)圖片向量數(shù)據(jù)集的差異,若存在至少一圖像塊對(duì)應(yīng)的多維向量與一對(duì)比圖片組的各多維向量相接近,則將該圖像塊作為包含有相接近對(duì)比圖片組所對(duì)應(yīng)的敏感信息類型的脫敏位置區(qū)域;脫敏補(bǔ)全模塊,用于對(duì)獲得的脫敏位置區(qū)域進(jìn)行遮蔽并使用圖像生成模型對(duì)遮蔽區(qū)域進(jìn)行補(bǔ)全后,獲得最終的脫敏圖片。

22、優(yōu)選的,所述樣本生成模塊包括向量模塊和聚類模塊,其中向量模塊,用于使用sift算法將各樣本圖片提取為對(duì)應(yīng)128維的多維向量,對(duì)圖片向量數(shù)據(jù)集中的各128維多維向量y進(jìn)行乘積量化處理,將多維向量y分成16段子向量,每個(gè)子向量的長(zhǎng)度為8,具體如下:

23、,其中為128維向量y中的其中一維向量,為向量y的一個(gè)子向量;聚類模塊,用于將16個(gè)子向量進(jìn)行16次k-means聚類,每個(gè)聚類存儲(chǔ)50個(gè)質(zhì)心。

24、本發(fā)明還公開(kāi)了一種對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的裝置,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如前述任一所述方法的步驟。

25、本發(fā)明還公開(kāi)了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如前述任一所述方法的步驟。

26、本發(fā)明公開(kāi)的對(duì)具有個(gè)人敏感信息的圖片進(jìn)行脫敏的方法和系統(tǒng),利用傳統(tǒng)的圖形特征抽取sift算法結(jié)合圖像生成模型的方式,實(shí)現(xiàn)對(duì)圖片中敏感信息的自動(dòng)標(biāo)定和脫敏,通過(guò)將包含敏感信息的待處理圖片拆分成大小相同且存在重疊區(qū)的圖像塊,并將每個(gè)圖像塊用sift算法提取為一個(gè)多維向量組成待處理圖片向量集后,分別制作僅包含有姓名信息、手機(jī)號(hào)信息、身份證號(hào)信息圖片的三個(gè)對(duì)比圖片組,并使用sift算法將其中圖片提取為對(duì)應(yīng)多維向量并合并成一比對(duì)圖片向量數(shù)據(jù)集。進(jìn)而計(jì)算所述待處理圖片向量集中各多維向量與比對(duì)圖片向量數(shù)據(jù)集的差異,若存在至少一圖像塊對(duì)應(yīng)的多維向量與一對(duì)比圖片組的各多維向量相接近,則將該圖像塊作為包含有相接近對(duì)比圖片組所對(duì)應(yīng)的敏感信息類型的脫敏位置區(qū)域;最后遮蔽脫敏位置區(qū)域并使用圖像生成模型對(duì)遮蔽區(qū)域補(bǔ)全獲得最終的脫敏圖片,使企業(yè)或組織可在不連接公網(wǎng)或缺乏大量場(chǎng)景敏感信息位置標(biāo)注數(shù)據(jù)的場(chǎng)景中獲取規(guī)避敏感信息的圖片,提升了圖片處理的適用范圍和處理速度,降低了用戶個(gè)人信息泄露風(fēng)險(xiǎn)。

27、本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
上犹县| 河源市| 辽宁省| 彰化县| 定陶县| 上犹县| 新密市| 延川县| 全椒县| 错那县| 桑日县| 富平县| 德庆县| 绥化市| 中宁县| 庆安县| 玛曲县| 永泰县| 湟中县| 临安市| 邵阳市| 清水县| 休宁县| 额敏县| 肇州县| 长岛县| 石河子市| 井研县| 巴塘县| 榆社县| 雷波县| 通渭县| 东阳市| 益阳市| 商城县| 高清| 吴旗县| 太仆寺旗| 萍乡市| 阳山县| 大新县|