本技術(shù)涉及計算機,特別是涉及一種個人信息合規(guī)性檢測方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著信息技術(shù)的快速發(fā)展和移動應(yīng)用的廣泛部署,個人信息保護成為社會關(guān)注的焦點。移動應(yīng)用在提供便利服務(wù)的同時,也收集了大量的用戶個人信息,為確保收集到的用戶個人信息的合規(guī)性,需對個人信息合規(guī)性進行檢測。
2、目前,個人信息合規(guī)性檢測主要依賴人工審核移動應(yīng)用的隱私權(quán)聲明,該方法效率低下且易出錯。為了提高個人信息合規(guī)性檢測的效率和準確性,研究人員提出了多種自動化檢測方法,如基于規(guī)則引擎的檢測方法、基于文本挖掘的檢測方法以及基于機器學習的檢測方法等。然而,上述方法均存在一定的局限性,例如,基于規(guī)則引擎的方法需要不斷更新規(guī)則以適應(yīng)法律法規(guī)的變化,維護成本較高;基于文本挖掘的方法對文本的語義理解能力有限,難以準確把握法律法規(guī)的復(fù)雜要求,從而導(dǎo)致檢測的準確性較低;基于機器學習的方法需要大量的標注數(shù)據(jù)進行訓練,從而導(dǎo)致檢測效率較低。
3、因此,如何提高個人信息合規(guī)性檢測效率和準確性成為了一個亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供了一種個人信息合規(guī)性檢測方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,可提高個人信息合規(guī)性檢測效率和準確性。
2、第一方面,本技術(shù)實施例提供了一種個人信息合規(guī)性檢測方法,該方法包括:
3、從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;目標規(guī)則文本包括進行數(shù)據(jù)預(yù)處理后的與個人信息相關(guān)的多個法律法規(guī)文本中的一個或多個;
4、基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜;
5、從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系;目標隱私權(quán)聲明文本是通過對目標應(yīng)用程序的隱私權(quán)聲明文本進行數(shù)據(jù)預(yù)處理得到的;
6、基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜;
7、基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果;
8、其中,多個第一實體和多個第二實體均包括信息收集主體/信息處理主體、數(shù)據(jù)所屬主體和個人信息類型;各個第一實體之間的關(guān)系和各個第二實體之間的關(guān)系包括信息用途和信息收集方式。
9、在其中一個實施例中,基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果,包括:將通過目標應(yīng)用程序收集和處理的個人信息與第一合規(guī)性知識圖譜進行匹配,得到第一合規(guī)性檢測結(jié)果;將個人信息與第二合規(guī)性知識圖譜進行匹配,得到第二合規(guī)性檢測結(jié)果;基于第一合規(guī)性檢測結(jié)果和第二合規(guī)性檢測結(jié)果,得到針對個人信息的合規(guī)性檢測結(jié)果。
10、在其中一個實施例中,從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系,以及,從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系,包括:將目標規(guī)則文本輸入至預(yù)先確定的信息抽取模型中,得到用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;以及,將目標隱私權(quán)聲明文本輸入至信息抽取模型中,得到用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系。
11、在其中一個實施例中,基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜,包括:基于目標規(guī)則文本,確定用于構(gòu)建第一合規(guī)性知識圖譜的第一大語言模型,以及,確定用于構(gòu)建第一知識圖譜的第一實體類型和第一關(guān)系類型;基于第一實體類型和第一關(guān)系類型,構(gòu)建第一知識圖譜;利用第一大語言模型,將抽取的多個第一實體和各個第一實體之間的關(guān)系映射至第一知識圖譜中,得到第一合規(guī)性知識圖譜。
12、在其中一個實施例中,基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜,包括:基于目標隱私權(quán)聲明文本,確定用于構(gòu)建第二合規(guī)性知識圖譜的第二大語言模型,以及,確定用于構(gòu)建第二知識圖譜的第二實體類型和第二關(guān)系類型;基于第二實體類型和第二關(guān)系類型,構(gòu)建第二知識圖譜;利用第二大語言模型,將抽取的多個第二實體和各個第二實體之間的關(guān)系映射至第二知識圖譜中,得到第二合規(guī)性知識圖譜。
13、在其中一個實施例中,該方法還包括:基于合規(guī)性檢測結(jié)果,生成針對個人信息的合規(guī)性檢測報告;合規(guī)性檢測報告中包括針對個人信息的多項合規(guī)性檢測的檢測結(jié)果。
14、在其中一個實施方式中,該方法還包括:在確定合規(guī)性檢測結(jié)果中存在任意一項檢測結(jié)果為不合規(guī)的情況下,禁止目標應(yīng)用程序使用個人信息。
15、第二方面,本技術(shù)提供了一種個人信息合規(guī)性檢測裝置,該裝置包括:
16、抽取單元,用于從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;目標規(guī)則文本包括進行數(shù)據(jù)預(yù)處理后的與個人信息相關(guān)的多個法律法規(guī)文本中的一個或多個;
17、構(gòu)建單元,用于基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜;
18、抽取單元,還用于從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系;目標隱私權(quán)聲明文本是通過對目標應(yīng)用程序的隱私權(quán)聲明文本進行數(shù)據(jù)預(yù)處理得到的;
19、構(gòu)建單元,還用于基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜;
20、檢測單元,用于基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果;
21、其中,多個第一實體和多個第二實體均包括信息收集或處理主體、數(shù)據(jù)所屬主體和個人信息類型;各個第一實體之間的關(guān)系和各個第二實體之間的關(guān)系包括信息用途和信息收集方式。
22、第三方面,本技術(shù)提供了一種計算機設(shè)備,包括存儲器和處理器,存儲器存儲有計算機程序,處理器執(zhí)行計算機程序時實現(xiàn)以下步驟:
23、從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;目標規(guī)則文本包括進行數(shù)據(jù)預(yù)處理后的與個人信息相關(guān)的多個法律法規(guī)文本中的一個或多個;
24、基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜;
25、從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系;目標隱私權(quán)聲明文本是通過對目標應(yīng)用程序的隱私權(quán)聲明文本進行數(shù)據(jù)預(yù)處理得到的;
26、基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜;
27、基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果;
28、其中,多個第一實體和多個第二實體均包括信息收集或處理主體、數(shù)據(jù)所屬主體和個人信息類型;各個第一實體之間的關(guān)系和各個第二實體之間的關(guān)系包括信息用途和信息收集方式。
29、第四方面,本技術(shù)還提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:
30、從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;目標規(guī)則文本包括進行數(shù)據(jù)預(yù)處理后的與個人信息相關(guān)的多個法律法規(guī)文本中的一個或多個;
31、基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜;
32、從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系;目標隱私權(quán)聲明文本是通過對目標應(yīng)用程序的隱私權(quán)聲明文本進行數(shù)據(jù)預(yù)處理得到的;
33、基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜;
34、基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果;
35、其中,多個第一實體和多個第二實體均包括信息收集或處理主體、數(shù)據(jù)所屬主體和個人信息類型;各個第一實體之間的關(guān)系和各個第二實體之間的關(guān)系包括信息用途和信息收集方式。
36、第五方面,本技術(shù)還提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:
37、從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;目標規(guī)則文本包括進行數(shù)據(jù)預(yù)處理后的與個人信息相關(guān)的多個法律法規(guī)文本中的一個或多個;
38、基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜;
39、從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系;目標隱私權(quán)聲明文本是通過對目標應(yīng)用程序的隱私權(quán)聲明文本進行數(shù)據(jù)預(yù)處理得到的;
40、基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜;
41、基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果;
42、其中,多個第一實體和多個第二實體均包括信息收集或處理主體、數(shù)據(jù)所屬主體和個人信息類型;各個第一實體之間的關(guān)系和各個第二實體之間的關(guān)系包括信息用途和信息收集方式。
43、上述個人信息合規(guī)性檢測方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,計算機設(shè)備可從目標規(guī)則文本中抽取用于構(gòu)建第一合規(guī)性知識圖譜的多個第一實體以及各個第一實體之間的關(guān)系;目標規(guī)則文本包括進行數(shù)據(jù)預(yù)處理后的與個人信息相關(guān)的多個法律法規(guī)文本中的一個或多個;基于抽取的多個第一實體以及各個第一實體之間的關(guān)系,構(gòu)建第一合規(guī)性知識圖譜;從目標隱私權(quán)聲明文本中,抽取用于構(gòu)建與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的多個第二實體和各個第二實體之間的關(guān)系;目標隱私權(quán)聲明文本是通過對目標應(yīng)用程序的隱私權(quán)聲明文本進行數(shù)據(jù)預(yù)處理得到的;基于抽取的多個第二實體以及各個第二實體之間的關(guān)系,構(gòu)建第二合規(guī)性知識圖譜;基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜,對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,得到針對個人信息的合規(guī)性檢測結(jié)果;其中,多個第一實體和多個第二實體均包括信息收集或處理主體、數(shù)據(jù)所屬主體和個人信息類型;各個第一實體之間的關(guān)系和各個第二實體之間的關(guān)系包括信息用途和信息收集方式。采用該方法,計算機設(shè)備通過從目標規(guī)則文本中抽取多個第一實體以及各個第一實體之間的關(guān)系,以及,從目標隱私權(quán)聲明文本中,抽取多個第二實體和各個第二實體之間的關(guān)系,這樣,可提高后續(xù)構(gòu)建第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜的效率,從而,可提高構(gòu)建與法律法規(guī)相關(guān)的第一合規(guī)性知識圖譜和與目標應(yīng)用程序相關(guān)的第二合規(guī)性知識圖譜的效率,進而,基于第一合規(guī)性知識圖譜和第二合規(guī)性知識圖譜對通過目標應(yīng)用程序收集和處理的個人信息進行合規(guī)性檢測,不但可以提高個人信息合規(guī)性檢測的效率,而且能夠更準確地理解和匹配個人信息與移動應(yīng)用的隱私權(quán)聲明和法律法規(guī)的要求,即提高個人信息合規(guī)性檢測準確性。