本發(fā)明涉及電子信息,具體涉及有心臟副作用的藥物數據庫的建立方法、裝置及設備。
背景技術:
1、心臟病是一種常見的致死性疾病,根據世界衛(wèi)生組織的統計,每年有約1700萬人死于心臟病。心臟病的主要原因是心血管系統的功能障礙,導致心肌缺血、缺氧、壞死或心律失常。藥物引發(fā)的心臟疾病案例逐年增多,每年至少250萬人因藥物毒性導致心臟病入院,死亡人數更是高達19萬人。目前市場上和曾經上市的藥物中,有400余種可引發(fā)不同程度的心臟毒副作用。藥物毒性監(jiān)管愈發(fā)嚴格,24%的新藥由于心血管毒副作用被終止研發(fā),即便成功上市,仍有45%左右的藥物由于藥物毒性被迫撤市。所以針對有心臟副作用的藥物信息的總結和有效使用對于醫(yī)務人員、研發(fā)機構、患者及普通人群都至關重要。
2、目前,針對有心臟副作用的藥物的專利信息分散在各個國家和地區(qū)的專利數據庫中,此外,不同的專利數據庫之間的數據格式和內容也存在差異,難以進行統一的檢索和分析,給醫(yī)藥公司進行藥物的研發(fā)和市場調研工作帶來了困難。
技術實現思路
1、有鑒于此,本發(fā)明提供了一種有心臟副作用的藥物數據庫的建立方法、裝置及設備,以解決針對有心臟副作用的藥物不同的專利數據庫之間的數據格式和內容存在差異導致難以進行統一的檢索和分析的問題。
2、第一方面,本發(fā)明提供了一種有心臟副作用的藥物數據庫的建立方法,該方法包括:
3、獲取包括有心臟副作用的藥物的初始數據;
4、對初始數據進行轉換,得到語言和數據格式統一的包括有心臟副作用的藥物數據信息,并提取初始數據中與有心臟副作用的藥物相關的關鍵詞;
5、基于包括有心臟副作用的藥物數據信息以及與有心臟副作用的藥物相關的關鍵詞對初始數據建立對應索引;
6、對包含對應索引的有心臟副作用的藥物數據信息進行數據挖掘,形成包括有心臟副作用的藥物數據庫。
7、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,對初始數據進行轉換,得到語言和數據格式統一的包括有心臟副作用的藥物數據信息,并提取初始數據中與有心臟副作用的藥物相關的關鍵詞,基于包括有心臟副作用的藥物數據信息以及與有心臟副作用的藥物相關的關鍵詞對初始數據建立對應索引,并對包含對應索引的有心臟副作用的藥物數據信息進行數據挖掘,最終建立一個針對有心臟副作用的藥物的數據庫,將不同數據來源的數據信息進行整合和標準化,提供了統一的檢索和分析接口,解決了針對有心臟副作用的藥物不同的專利數據庫之間的數據格式和內容存在差異導致難以進行統一的檢索和分析的問題,以便于后續(xù)進行有效的數據挖掘和知識發(fā)現。
8、在一種可選的實施方式中,獲取包括有心臟副作用的藥物的初始數據包括:
9、確定包括有心臟副作用的藥物的多個數據來源、數據范圍、數據結構和數據內容;數據來源包括中文專利數據庫和外文專利數據庫;
10、基于多個數據來源、數據范圍、數據結構和數據內容生成包括有心臟副作用的藥物的初始數據。
11、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,獲取包括多個數據來源、數據范圍、數據結構和數據內容生成的包括有心臟副作用的藥物初始數據,數據涵蓋范圍廣泛全面,為后續(xù)針對有心臟副作用的藥物生成數據庫提供了數據基礎。
12、在一種可選的實施方式中,對初始數據進行轉換,得到語言和數據格式統一的數據信息包括:
13、采用數據挖掘技術從多個數據來源中抓取有心臟副作用的藥物數據信息;
14、采用自然語言處理技術對抓取的有心臟副作用的藥物數據信息進行語言識別、語言轉換和語義分析,得到語言和數據格式統一的包括有心臟副作用的藥物數據信息。
15、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,采用數據挖掘技術從多個數據來源中抓取有心臟副作用的藥物數據信息;采用自然語言處理技術對抓取的有心臟副作用的藥物數據信息進行語言識別、語言轉換和語義分析,得到語言和數據格式統一的包括有心臟副作用的藥物數據信息,將不同來源、不同語言、不同格式的專利信息進行整合和標準化,并提供統一的檢索和分析接口,以便于后續(xù)進行有效的數據挖掘和知識發(fā)現。
16、在一種可選的實施方式中,與有心臟副作用的藥物相關的關鍵詞包括有心臟副作用的藥物名稱;
17、基于包括有心臟副作用的藥物數據信息以及與有心臟副作用的藥物相關的關鍵詞對初始數據建立對應索引包括:
18、以有心臟副作用的藥物名稱作為主鍵,建立包括有心臟副作用的藥物數據信息與有心臟副作用的藥物名稱之間的對應索引。
19、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,以有心臟副作用的藥物名稱作為主鍵,建立有心臟副作用的藥物數據信息與有心臟副作用的藥物名稱之間的對應索引,對應索引方便對有心臟副作用的藥物數據信息進行快速檢索,提供了檢索和分析入口。
20、在一種可選的實施方式中,數據挖掘包括數據清洗、數據校驗和數據補充;
21、對包含對應索引的有心臟副作用的藥物數據信息進行數據挖掘,形成有心臟副作用的藥物數據庫包括:
22、采用數據挖掘技術對包含對應索引的有心臟副作用的藥物數據信息進行去除有心臟副作用的藥物數據信息的錯誤數據的數據清洗操作,修正缺失數據的數據校驗操作以及增加新出現數據或更新變化數據的數據補充操作;
23、基于對應索引和數據挖掘完成后的有心臟副作用的藥物數據信息生成有心臟副作用的藥物數據庫。
24、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,采用數據挖掘技術對包含對應索引的有心臟副作用的藥物數據信息進行去除有心臟副作用的藥物數據庫的錯誤數據的數據清洗操作,修正缺失數據的數據校驗操作以及增加新出現數據或更新變化數據的數據補充操作,基于對應索引和數據挖掘完成后的有心臟副作用的藥物數據信息生成有心臟副作用的藥物數據庫,保證了數據庫的數據質量,提高了數據可靠性、準確性、完整性和全面性,為后續(xù)進行藥物的研發(fā)和市場調研工作提供了一個可靠、完備和最新數據源。
25、在一種可選的實施方式中,有心臟副作用的藥物數據庫的建立方法還包括:
26、采用數據聚類方式對包括有心臟副作用的藥物數據庫進行數據分類、數據關聯和數據預測操作,以發(fā)現或驗證有心臟副作用的藥物數據庫中數據之間的關聯性和趨勢性。
27、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,采用數據聚類方式對包括有心臟副作用的藥物數據庫進行數據分類、數據關聯和數據預測操作,以發(fā)現或驗證有心臟副作用的藥物數據庫中數據之間的關聯性和趨勢性,為后續(xù)進行藥物的研發(fā)和市場調研工作提供了一個有價值、有意義和有啟示的數據支持。
28、在一種可選的實施方式中,有心臟副作用的藥物數據庫的建立方法還包括:
29、對包括有心臟副作用的藥物數據庫中的數據進行可視化展示。
30、本發(fā)明提供的有心臟副作用的藥物數據庫的建立方法,對包括有心臟副作用的藥物數據庫中的數據進行可視化展示,實現了將復雜或抽象的數據以直觀或美觀的方式呈現給用戶,使得有心臟副作用的藥物數據庫中的數據更加直觀,增強了用戶體驗感。
31、第二方面,本發(fā)明提供了一種有心臟副作用的藥物數據庫的建立裝置,該裝置包括:
32、數據獲取模塊,用于獲取包括有心臟副作用的藥物的初始數據;
33、數據轉換模塊,用于對初始數據進行轉換,得到語言和數據格式統一的包括有心臟副作用的藥物數據信息,并提取初始數據中與有心臟副作用的藥物相關的關鍵詞;
34、索引建立模塊,用于基于包括有心臟副作用的藥物數據信息以及與有心臟副作用的藥物相關的關鍵詞對初始數據建立對應索引;
35、數據挖掘模塊,用于對包含對應索引的有心臟副作用的藥物數據信息進行數據挖掘,形成包括有心臟副作用的藥物數據庫。
36、第三方面,本發(fā)明提供了一種計算機設備,包括:存儲器和處理器,存儲器和處理器之間互相通信連接,存儲器中存儲有計算機指令,處理器通過執(zhí)行計算機指令,從而執(zhí)行上述第一方面或其對應的任一實施方式的有心臟副作用的藥物數據庫的建立方法。
37、第四方面,本發(fā)明提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機指令,計算機指令用于使計算機執(zhí)行上述第一方面或其對應的任一實施方式的有心臟副作用的藥物數據庫的建立方法。