本申請涉及數(shù)據(jù)通信傳輸,具體涉及一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法及系統(tǒng)。
背景技術(shù):
1、藥品研發(fā)過程數(shù)據(jù),主要分為藥物發(fā)現(xiàn)階段、臨床前研究階段、臨床試驗(yàn)階段、藥品注冊和生產(chǎn)階段的數(shù)據(jù),涉及大量保密信息,因此研發(fā)過程中對數(shù)據(jù)傳輸?shù)陌踩砸蠛芨?,在客戶端將?shù)據(jù)傳輸至服務(wù)器端時(shí),會使用ssl/tls協(xié)議對通信通道進(jìn)行加密,中間需要對訪問者進(jìn)行身份驗(yàn)證。
2、由于參與人員較多,且工作內(nèi)容存在交叉性,相同數(shù)據(jù)可能會經(jīng)過不同的工作人員,導(dǎo)致文件管理系統(tǒng)出現(xiàn)冗余,增大了文件查找所需時(shí)間,所以為保證傳輸效率,通常賦予每個(gè)工作人節(jié)點(diǎn)可訪問的實(shí)際權(quán)限偏大,若出現(xiàn)中間人攻擊也就容易造成數(shù)據(jù)泄露,使得藥品研發(fā)過程數(shù)據(jù)傳輸?shù)陌踩暂^低。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本申請的目的在于提供一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法及系統(tǒng),所采用的技術(shù)方案具體如下:
2、第一方面,本申請實(shí)施例提供了一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,該方法包括以下步驟:
3、s1,獲取藥品研發(fā)過程中各工作人員的客戶端每天的工作日志和處理的各類文件;
4、s2,根據(jù)工作人員每天的工作日志分別與所有文件的文件名稱、所有文本類文件的文本內(nèi)容的詞匯匹配情況,得到工作日志的文件文本關(guān)聯(lián)程度;
5、s3,獲取各工作人員的從屬部門;根據(jù)各工作人員與其他各工作人員的部門從屬關(guān)系以及文件的相似程度,得到各工作人員的流程相關(guān)性;綜合各工作人員所有天的流程相關(guān)性以及工作日志的文件文本關(guān)聯(lián)程度的變化波動情況,得到各工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性;
6、s4,根據(jù)工作人員與其他的與其具有文件傳送關(guān)系的所有工作人員的文件相似程度和請求類文件的占有情況,得到工作人員的協(xié)同相關(guān)性;綜合工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性和協(xié)同相關(guān)性,得到工作人員的節(jié)點(diǎn)可信度;根據(jù)工作人員的節(jié)點(diǎn)可信度對數(shù)據(jù)進(jìn)行安全傳輸。
7、進(jìn)一步,所述根據(jù)工作人員每天的工作日志分別與所有文件的文件名稱、所有文本類文件的文本內(nèi)容的詞匯匹配情況,得到工作日志的文件文本關(guān)聯(lián)程度,包括:
8、對各工作日志進(jìn)行分詞處理,得到各工作日志的日志詞匯;對各文件的文件名稱進(jìn)行分詞處理,得到各文件的代表詞匯;對于所有文件中的文本類文件,對每個(gè)文本類文件的文本內(nèi)容進(jìn)行分詞處理,得到每個(gè)文本類文件的詞匯集;
9、若所有文件的全部代表詞匯中存在工作日志中的第m個(gè)日志詞匯,則工作日志中的第m個(gè)日志詞匯的標(biāo)簽匹配函數(shù)的值為1,反之為0;
10、若所有文本類文件的詞匯集中存在工作日志中的第m個(gè)日志詞匯,則工作日志中的第m個(gè)日志詞匯的內(nèi)容匹配函數(shù)為的值1,反之為0;
11、對于任意一天,根據(jù)工作日志中所有日志詞匯的標(biāo)簽匹配函數(shù)和內(nèi)容匹配函數(shù),得到工作日志的文件文本關(guān)聯(lián)程度。
12、進(jìn)一步,所述根據(jù)工作日志中所有日志詞匯的標(biāo)簽匹配函數(shù)和內(nèi)容匹配函數(shù),得到工作日志的文件文本關(guān)聯(lián)程度,包括:將工作日志的文件文本關(guān)聯(lián)程度記為p,;其中,表示工作日志的所有日志詞匯中,標(biāo)簽匹配函數(shù)與內(nèi)容匹配函數(shù)之和大于0的日志詞匯數(shù)量;表示工作日志的日志詞匯數(shù)量;表示工作日志中的第m個(gè)日志詞匯的標(biāo)簽匹配函數(shù)的值;表示工作日志中的第m個(gè)日志詞匯的內(nèi)容匹配函數(shù)的值。
13、進(jìn)一步,所述根據(jù)各工作人員與其他各工作人員的部門從屬關(guān)系以及文件的相似程度,得到各工作人員的流程相關(guān)性,包括:
14、將各工作人員與其他各工作人員的所有文件中相同文件的數(shù)量,作為各工作人員與其他各工作人員的關(guān)聯(lián)值;
15、將與各工作人員存在文件傳送關(guān)系的工作人員,記為各工作人員的相關(guān)人員;若工作人員的從屬部門與其各相關(guān)人員的從屬部門存在從屬關(guān)系,則工作人員的流程規(guī)范函數(shù)的值為1,反之為0;
16、綜合各工作人員與其所有相關(guān)人員的關(guān)聯(lián)值和流程規(guī)范函數(shù),得到各工作人員的流程相關(guān)性。
17、進(jìn)一步,所述綜合各工作人員與其所有相關(guān)人員的關(guān)聯(lián)值和流程規(guī)范函數(shù),得到各工作人員的流程相關(guān)性,包括:
18、計(jì)算每個(gè)工作人員與其所有相關(guān)人員的關(guān)聯(lián)值的和值;將每個(gè)工作人員與其各相關(guān)人員的關(guān)聯(lián)值與所述和值的比值,作為每個(gè)工作人員與其各相關(guān)人員的關(guān)聯(lián)權(quán)重;以每個(gè)工作人員與其各相關(guān)人員的關(guān)聯(lián)權(quán)重為權(quán)值,計(jì)算每個(gè)工作人員與其所有相關(guān)人員的流程規(guī)范函數(shù)的加權(quán)平均值,得到每個(gè)工作人員的流程相關(guān)性。
19、進(jìn)一步,所述各工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性的計(jì)算方法,包括:
20、
21、其中,表示工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性;表示工作人員所有天的工作日志的文件文本關(guān)聯(lián)程度均值;表示總天數(shù);表示工作人員第t天的工作日志的文件文本關(guān)聯(lián)程度;表示所有天的流程相關(guān)性的均值;表示第t天工作人員的流程相關(guān)性;exp()為以自然常數(shù)為底數(shù)的指數(shù)函數(shù);norm[]為線性歸一化函數(shù)。
22、進(jìn)一步,所述工作人員的協(xié)同相關(guān)性的獲取方法,包括:
23、對于各工作人員,獲取工作人員的所有相關(guān)人員中擁有請求類文件的相關(guān)人員數(shù)量與工作人員的所有相關(guān)人員的數(shù)量之比,記為工作人員的關(guān)聯(lián)占比;計(jì)算工作人員與其所有擁有請求類文件的相關(guān)人員的關(guān)聯(lián)值之和與關(guān)聯(lián)占比的乘積,記為工作人員的協(xié)同相關(guān)性。
24、進(jìn)一步,所述綜合工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性和協(xié)同相關(guān)性,得到工作人員的節(jié)點(diǎn)可信度,具體包括:
25、將工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性與協(xié)同相關(guān)性的乘積作為工作人員的節(jié)點(diǎn)可信度。
26、進(jìn)一步,所述根據(jù)工作人員的節(jié)點(diǎn)可信度對數(shù)據(jù)進(jìn)行安全傳輸,包括:當(dāng)工作人員的節(jié)點(diǎn)可信度大于預(yù)設(shè)閾值時(shí),對該工作人員對應(yīng)的客戶端進(jìn)行數(shù)據(jù)傳輸。
27、第二方面,本申請實(shí)施例還提供了一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述任意一項(xiàng)所述一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法的步驟。
28、本申請至少具有如下有益效果:
29、本申請通過分析藥品研發(fā)過程中數(shù)據(jù)傳輸?shù)陌踩詥栴},首先分析了工作人員在藥品研發(fā)的過程中,其上傳或下載的文件內(nèi)容和順序通常與工作日志具有較大的關(guān)聯(lián)的特點(diǎn),對所有工作人員的工作日志和關(guān)聯(lián)數(shù)據(jù)進(jìn)行相關(guān)性分析,得到文件文本關(guān)聯(lián)程度,反映了工作人員處理的文件在藥品研發(fā)流程中與工作日志的相關(guān)關(guān)系;進(jìn)一步分析了一段時(shí)間內(nèi)研發(fā)流程中不同部門之間的文件傳輸?shù)年P(guān)聯(lián)情況,計(jì)算數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性,反映了工作人員連續(xù)時(shí)間下處理的文件與工作日志關(guān)聯(lián)程度的穩(wěn)定性;進(jìn)一步結(jié)合了工作人員之間存在工作關(guān)聯(lián)、內(nèi)容相似的特點(diǎn),對請求文件的相關(guān)性進(jìn)行分析,綜合確定工作人員對應(yīng)節(jié)點(diǎn)的可信度,完成客戶端的身份驗(yàn)證,有利于提高藥品研發(fā)數(shù)據(jù)傳輸?shù)陌踩浴?/p>
技術(shù)特征:
1.一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,該方法包括以下步驟:
2.如權(quán)利要求1所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述根據(jù)工作人員每天的工作日志分別與所有文件的文件名稱、所有文本類文件的文本內(nèi)容的詞匯匹配情況,得到工作日志的文件文本關(guān)聯(lián)程度,包括:
3.如權(quán)利要求2所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述根據(jù)工作日志中所有日志詞匯的標(biāo)簽匹配函數(shù)和內(nèi)容匹配函數(shù),得到工作日志的文件文本關(guān)聯(lián)程度,包括:將工作日志的文件文本關(guān)聯(lián)程度記為p,;其中,表示工作日志的所有日志詞匯中,標(biāo)簽匹配函數(shù)與內(nèi)容匹配函數(shù)之和大于0的日志詞匯數(shù)量;表示工作日志的日志詞匯數(shù)量;表示工作日志中的第m個(gè)日志詞匯的標(biāo)簽匹配函數(shù)的值;表示工作日志中的第m個(gè)日志詞匯的內(nèi)容匹配函數(shù)的值。
4.如權(quán)利要求1所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述根據(jù)各工作人員與其他各工作人員的部門從屬關(guān)系以及文件的相似程度,得到各工作人員的流程相關(guān)性,包括:
5.如權(quán)利要求4所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述綜合各工作人員與其所有相關(guān)人員的關(guān)聯(lián)值和流程規(guī)范函數(shù),得到各工作人員的流程相關(guān)性,包括:
6.如權(quán)利要求1所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述各工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性的計(jì)算方法,包括:
7.如權(quán)利要求4所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述工作人員的協(xié)同相關(guān)性的獲取方法,包括:
8.如權(quán)利要求1所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述綜合工作人員的數(shù)據(jù)關(guān)聯(lián)穩(wěn)定性和協(xié)同相關(guān)性,得到工作人員的節(jié)點(diǎn)可信度,具體包括:
9.如權(quán)利要求1所述的一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法,其特征在于,所述根據(jù)工作人員的節(jié)點(diǎn)可信度對數(shù)據(jù)進(jìn)行安全傳輸,包括:當(dāng)工作人員的節(jié)點(diǎn)可信度大于預(yù)設(shè)閾值時(shí),對該工作人員對應(yīng)的客戶端進(jìn)行數(shù)據(jù)傳輸。
10.一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-9任意一項(xiàng)所述一種面向藥品研發(fā)過程數(shù)據(jù)的安全傳輸方法的步驟。