一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法、裝置和系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法、裝置和系統(tǒng),在實(shí)現(xiàn)知識(shí)挖掘的基礎(chǔ)上,創(chuàng)立了一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,并較好地完成了知識(shí)挖掘與知識(shí)導(dǎo)航功能的整合。其技術(shù)方案為:本發(fā)明將知識(shí)挖掘型乙肝專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典同乙肝病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)該關(guān)聯(lián)整合,構(gòu)建出一個(gè)應(yīng)用于乙肝蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航系統(tǒng),并完成基于乙肝病毒蛋白本體的知識(shí)導(dǎo)航功能。
【專(zhuān)利說(shuō)明】
一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法、裝置和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及知識(shí)導(dǎo)航技術(shù),尤其涉及能夠提供基于病毒蛋白本體的知識(shí)導(dǎo)航服務(wù)的技術(shù)。
【背景技術(shù)】
[0002]本體的一個(gè)普遍公認(rèn)的概念定義為:共享概念模型的、明確的、形式化的規(guī)范說(shuō)明[Studer R, Benjamins VR, Fensel D.Knowledge engineering, principles and methods.Data and Knowledge engineering[J],1998,25],從該定義可以看出本體主要包含了 4重含義:共享、概念模型、明確和形式化。簡(jiǎn)單的講,就是用了描述一個(gè)領(lǐng)域內(nèi)甚至更廣的范圍內(nèi)的概念以及概念之間的關(guān)系,從而形成大家公認(rèn)的,明確的概念以及關(guān)系的定義,進(jìn)而實(shí)現(xiàn)人機(jī)以及計(jì)算機(jī)之間的交流[杜小勇,李曼,王珊.本體學(xué)習(xí)研究綜述.軟件學(xué)報(bào)[J], 2006, (9):1837-1847]ο
[0003]隨著各學(xué)科領(lǐng)域?qū)Ρ倔w的深入研究,各領(lǐng)域本體的研究構(gòu)建也正在迅速的趨于成熟。本體作為能在語(yǔ)義和知識(shí)層次上描述系統(tǒng)的概念模型,其目的是在于以一種通用的方式來(lái)獲取領(lǐng)域中的知識(shí),提供對(duì)領(lǐng)域概念的共同一致的理解,從而實(shí)現(xiàn)知識(shí)在不同的應(yīng)用程序和組織之間的共享和重復(fù)利用,本體是某一領(lǐng)域中的術(shù)語(yǔ)及術(shù)語(yǔ)之間關(guān)系的規(guī)范說(shuō)明,目前基于本體的應(yīng)用目的主要是針對(duì)知識(shí)組織管理,語(yǔ)義網(wǎng)絡(luò)和人工智能等方面[劉耀,穗志方.領(lǐng)域ontology概念描述體系構(gòu)建方法探析.大學(xué)圖書(shū)館學(xué)報(bào)[J],2006, (5):28-33]。在生命科學(xué)領(lǐng)域,生物學(xué)不同研究領(lǐng)域的本體在不斷被研發(fā)、構(gòu)建和相繼出現(xiàn),如基因本體(Gene Ontology) [Gene ontology tool for the unificat1nof b1logy.Gene Ontology Consortium]、蛋白本體(Protein Ontology) [Darren ANatale, Cecilia N Arighi, Winona C Barker, Judith Blake, T1-Cheng Chang, ZhangzhiHu, Hongfang Liu, Barry Smith and Cathy H ffu.Framework for a Protein Ontology.BMC B1informatics[J]2007, 8(Suppl9):SI]> 序列本體(Sequence Ontology) [KarenEilbeck and Suzanna E.Lewis.Sequence Ontology Annotat1n Guide.Comparativeand Funct1nal Genomics Volume [J],2004,5,(8): 642-647]以及疾病本體(DiseaseOntology)[Pan Du, Gang Feng, Jared Flatow, Jie Song, Michelle Holko, Warren A.Kibbeand Simon M.Lin.From disease ontology to disease-ontology lite:statisticalmethods to adapt a general-purpose ontology for the test of gene—ontologyassociat1ns.B1Informatics [J], 2009, 25 (12)]等等,這些都推動(dòng)了生物學(xué)領(lǐng)域本體的發(fā)展。將本體應(yīng)用到信息整合與知識(shí)挖掘過(guò)程中,不僅能夠很好的對(duì)知識(shí)進(jìn)行組織分類(lèi)和導(dǎo)航,而且能夠更好地引導(dǎo)用戶進(jìn)行信息的檢索分析[陳霞,魏玲玲,邱桃榮,劉萍.基于本體論的關(guān)聯(lián)規(guī)則的挖掘.計(jì)算機(jī)與數(shù)字工程,2007,(2):32-34]。此外,本體為專(zhuān)業(yè)領(lǐng)域提供了一套共享的規(guī)范說(shuō)明,使其術(shù)語(yǔ)達(dá)到了領(lǐng)域共識(shí),因而能夠更好地實(shí)現(xiàn)知識(shí)的組織、管理、導(dǎo)航、發(fā)現(xiàn)與抽取,提高知識(shí)的挖掘質(zhì)量與效率[邢平平,施鵬飛,趙奕.基于本體論的數(shù)據(jù)挖掘方法.計(jì)算機(jī)工程,2001,(5)]。就目前研究現(xiàn)狀而言,在生命科學(xué)領(lǐng)域,將本體應(yīng)用到知識(shí)組織管理與導(dǎo)航的技術(shù)在國(guó)外已有過(guò)一些報(bào)道,而在國(guó)內(nèi)幾乎還是個(gè)空白。一個(gè)比較有名的例子是,由德國(guó)Transinsight公司和德累斯頓技術(shù)大學(xué)的生物信息集團(tuán)合作,將本體同信息整合和數(shù)據(jù)挖掘相整合,聯(lián)合開(kāi)發(fā)了一個(gè)比較新的信息檢索技術(shù):GOPubMed[Heiko Dietze, Dimitra Alexopoulou, Michael R.Alvers, LilianaBarr1-Alversj Bill Andreopoulosj Andreas Domsj J0..rg Hakenbergj Jan M0..nnich,Conrad Plakej Andreas Reischuckj Lo1..c Royer, Thomas Wa..chter,MatthiasZschunkej and Michael Schroeder.GoPubMed:Exploring PubMed with OntologicalBackground Knowledge.B1informatics for Systems B1logy [J],2009,PartV,385-399]。它是一種基于GO(基因本體)和MeSH(醫(yī)學(xué)主題詞表)的檢索技術(shù),其將PubMed的檢索結(jié)果返回到GOPubMed中,通過(guò)語(yǔ)義智能檢索,將結(jié)果按GO和MeSH進(jìn)行分類(lèi),形成臨時(shí)GO和臨時(shí)MeSH,最終將用戶檢索結(jié)果形成可視化的知識(shí)分類(lèi)導(dǎo)航,從而提高了用戶的檢索效率[張士靖,杜建.GOPubMed:基于GO和MeSH的信息檢索與分析研究.醫(yī)學(xué)信息學(xué)雜志[J],2009,30,(7):6-11 ;李健康.專(zhuān)業(yè)化的語(yǔ)義智能搜索引擎GoPubMed.圖書(shū)館論壇[J], 2009, (6):152-154]。
[0004]從以往本體相關(guān)技術(shù)的了解中可知,現(xiàn)有的基于本體的知識(shí)導(dǎo)航技術(shù)一個(gè)缺陷就是,知識(shí)挖掘與知識(shí)導(dǎo)航?jīng)]有很好整合。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于解決上述問(wèn)題,提供了一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法、裝置和系統(tǒng),在實(shí)現(xiàn)知識(shí)挖掘的基礎(chǔ)上,創(chuàng)立了一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,并較好地完成了知識(shí)挖掘與知識(shí)導(dǎo)航功能的整合。
[0006]本發(fā)明的技術(shù)方案為:本發(fā)明揭示了一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,包括病毒知識(shí)挖掘的流程以及專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)本體構(gòu)建及知識(shí)導(dǎo)航流程,其中:
[0007]病毒知識(shí)挖掘的流程進(jìn)一步包括:
[0008]構(gòu)建專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)和確立能夠進(jìn)行對(duì)應(yīng)的蛋白質(zhì)關(guān)聯(lián)和整合的科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù);
[0009]以現(xiàn)存的蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表為依據(jù),以專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中出現(xiàn)的病毒蛋白質(zhì)名詞為挖掘和發(fā)現(xiàn)對(duì)象,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰;
[0010]根據(jù)國(guó)外蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)提供的協(xié)議將標(biāo)識(shí)號(hào)轉(zhuǎn)換成超鏈接信息,生成面向主題和應(yīng)用的專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù);
[0011]專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)本體構(gòu)建及知識(shí)導(dǎo)航流程包括:
[0012]提取病毒相關(guān)術(shù)語(yǔ);
[0013]確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系;
[0014]構(gòu)建病毒蛋白本體,將知識(shí)挖掘型專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典和病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)整合關(guān)聯(lián),構(gòu)建應(yīng)用于蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航,完成基于病毒蛋白本體的知識(shí)導(dǎo)航。
[0015]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的一實(shí)施例,在生成專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù)的步驟之后還包括:
[0016]去除數(shù)據(jù)挖掘和信息整合結(jié)果中的非法信息,去除假陽(yáng)性蛋白質(zhì)挖掘結(jié)果。
[0017]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的一實(shí)施例,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰使得專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)名詞與蛋白質(zhì)科學(xué)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表進(jìn)行一一對(duì)應(yīng)的關(guān)聯(lián)和整合,實(shí)現(xiàn)對(duì)專(zhuān)題文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù)的病毒蛋白質(zhì)相關(guān)文本挖掘和標(biāo)注。
[0018]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的一實(shí)施例,提取病毒相關(guān)術(shù)語(yǔ)的步驟包括:
[0019]通過(guò)對(duì)病毒生活史的學(xué)習(xí)和理解,從中提取代表性的術(shù)語(yǔ)詞匯、蛋白質(zhì)名稱(chēng)以及對(duì)術(shù)語(yǔ)詞匯的解釋和蛋白質(zhì)功能的注釋?zhuān)?duì)這些詞匯及蛋白質(zhì)名詞進(jìn)行整理分類(lèi),劃分為感染過(guò)程相關(guān)術(shù)語(yǔ)、結(jié)構(gòu)組分相關(guān)術(shù)語(yǔ)以及蛋白質(zhì)名稱(chēng)。
[0020]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的一實(shí)施例,確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系的步驟包括:
[0021]通過(guò)學(xué)習(xí)與理解,分析提取出的術(shù)語(yǔ)間存在的屬性關(guān)系,并最終確定具有代表性的關(guān)系屬性。
[0022]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的一實(shí)施例,構(gòu)建病毒蛋白本體的步驟包括:
[0023]將術(shù)語(yǔ)、術(shù)語(yǔ)注釋以及關(guān)系屬性進(jìn)行關(guān)聯(lián)整合,構(gòu)建出一個(gè)蛋白本體框架,并最終通過(guò)反復(fù)分析修改更正來(lái)完善該本體。
[0024]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的一實(shí)施例,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù),蛋白本體是乙肝蛋白本體。
[0025]本發(fā)明還揭示了一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,包括病毒知識(shí)挖掘模塊以及專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的蛋白質(zhì)挖掘和發(fā)現(xiàn)模塊,其中:
[0026]病毒知識(shí)挖掘模塊包括:
[0027]數(shù)據(jù)庫(kù)構(gòu)建單元,構(gòu)建專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)和確立能夠進(jìn)行對(duì)應(yīng)的蛋白質(zhì)關(guān)聯(lián)和整合的科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù);
[0028]翻譯編撰單元,以現(xiàn)存的蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表為依據(jù),以專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中出現(xiàn)的病毒蛋白質(zhì)名詞為挖掘和發(fā)現(xiàn)對(duì)象,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰;
[0029]數(shù)據(jù)倉(cāng)庫(kù)生成單元,根據(jù)國(guó)外蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)提供的協(xié)議將標(biāo)識(shí)號(hào)轉(zhuǎn)換成超鏈接信息,生成面向主題和應(yīng)用的專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù);
[0030]專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)本體構(gòu)建及知識(shí)導(dǎo)航模塊包括:
[0031]術(shù)語(yǔ)提取單元,提取病毒相關(guān)術(shù)語(yǔ);
[0032]關(guān)系確立單元,確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系;
[0033]本體構(gòu)建單元,構(gòu)建病毒蛋白本體,將知識(shí)挖掘型專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典和病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)整合關(guān)聯(lián),構(gòu)建應(yīng)用于蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航,完成基于病毒蛋白本體的知識(shí)導(dǎo)航。
[0034]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的一實(shí)施例,病毒知識(shí)挖掘模塊還包括:
[0035]非法信息去除單元,去除數(shù)據(jù)挖掘和信息整合結(jié)果中的非法信息,去除假陽(yáng)性蛋白質(zhì)挖掘結(jié)果。
[0036]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的一實(shí)施例,翻譯編撰單元進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰使得專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)名詞與蛋白質(zhì)科學(xué)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表進(jìn)行一一對(duì)應(yīng)的關(guān)聯(lián)和整合,實(shí)現(xiàn)對(duì)專(zhuān)題文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù)的病毒蛋白質(zhì)相關(guān)文本挖掘和標(biāo)注。
[0037]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的一實(shí)施例,術(shù)語(yǔ)提取單元通過(guò)對(duì)病毒生活史的學(xué)習(xí)和理解,從中提取代表性的術(shù)語(yǔ)詞匯、蛋白質(zhì)名稱(chēng)以及對(duì)術(shù)語(yǔ)詞匯的解釋和蛋白質(zhì)功能的注釋?zhuān)?duì)這些詞匯及蛋白質(zhì)名詞進(jìn)行整理分類(lèi),劃分為感染過(guò)程相關(guān)術(shù)語(yǔ)、結(jié)構(gòu)組分相關(guān)術(shù)語(yǔ)以及蛋白質(zhì)名稱(chēng)。
[0038]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的一實(shí)施例,關(guān)系確立單元通過(guò)學(xué)習(xí)與理解,分析提取出的術(shù)語(yǔ)間存在的屬性關(guān)系,并最終確定具有代表性的關(guān)系屬性。
[0039]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的一實(shí)施例,本體構(gòu)建單元將術(shù)語(yǔ)、術(shù)語(yǔ)注釋以及關(guān)系屬性進(jìn)行關(guān)聯(lián)整合,構(gòu)建出一個(gè)蛋白本體框架,并最終通過(guò)反復(fù)分析修改更正來(lái)完善該本體。
[0040]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的一實(shí)施例,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù),蛋白本體是乙肝蛋白本體。
[0041]本發(fā)明還揭示了一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng),包括專(zhuān)題文獻(xiàn)服務(wù)器、病毒本體庫(kù)服務(wù)器、web服務(wù)器和查詢(xún)請(qǐng)求解釋器、以及查詢(xún)請(qǐng)求終端,其中:
[0042]查詢(xún)請(qǐng)求終端,接收用戶請(qǐng)求;
[0043]web服務(wù)器和查詢(xún)請(qǐng)求解釋器,接收用戶請(qǐng)求,通過(guò)查詢(xún)請(qǐng)求解釋器將用戶請(qǐng)求進(jìn)行規(guī)范化處理;
[0044]病毒本體庫(kù)服務(wù)器,存放病毒本體構(gòu)建和管理程序以及構(gòu)建好的病毒本體庫(kù);
[0045]專(zhuān)題文獻(xiàn)服務(wù)器,存放專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)及文獻(xiàn)處理程序和管理程序。
[0046]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng)的一實(shí)施例,查詢(xún)請(qǐng)求終端的查詢(xún)方式有關(guān)鍵詞請(qǐng)求和本體庫(kù)知識(shí)導(dǎo)航目錄查詢(xún)。
[0047]根據(jù)本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng)的一實(shí)施例,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)。
[0048]本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果:本發(fā)明將知識(shí)挖掘型乙肝專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典同乙肝病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)該關(guān)聯(lián)整合,構(gòu)建出一個(gè)應(yīng)用于乙肝蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航系統(tǒng),并完成基于乙肝病毒蛋白本體的知識(shí)導(dǎo)航功能。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的優(yōu)點(diǎn):
[0049]①通過(guò)基于病毒蛋白本體的知識(shí)導(dǎo)航服務(wù),讀者可較為迅速及準(zhǔn)確地獲得所需信息及文獻(xiàn)。
[0050]②本發(fā)明與知識(shí)挖掘技術(shù)相結(jié)合,通過(guò)病毒蛋白本體中的術(shù)語(yǔ),能在數(shù)據(jù)庫(kù)的檢索服務(wù)中,為用戶提供更加準(zhǔn)確的檢索結(jié)果,以方便用戶的知識(shí)獲取與檢索效率。
[0051]③將病毒蛋白本體的概念應(yīng)用到文獻(xiàn)情報(bào)數(shù)據(jù)庫(kù)的信息整合與知識(shí)挖掘中,可在一定程度上減少在進(jìn)行知識(shí)挖掘時(shí)產(chǎn)生的“假陽(yáng)性”問(wèn)題,提高知識(shí)挖掘的質(zhì)量與效率。
[0052]④通過(guò)將病毒蛋白本體引入到文獻(xiàn)檢索中,使得檢索結(jié)果不再單一化,而具有其內(nèi)在的知識(shí)結(jié)構(gòu)。
[0053]⑤基于病毒蛋白本體的知識(shí)導(dǎo)航系統(tǒng)的設(shè)計(jì),可避免該研究領(lǐng)域在術(shù)語(yǔ)詞匯定義中的混亂問(wèn)題。
[0054]⑥使知識(shí)挖掘與知識(shí)導(dǎo)航功能整合得更為完美。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0055]圖1示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的較佳實(shí)施例的流程圖。
[0056]圖2示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的流程示意圖。
[0057]圖3示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的較佳實(shí)施例的原理圖。
[0058]圖4示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng)的較佳實(shí)施例的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0059]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述。
_0] 基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的實(shí)施例
[0061]圖1和圖2示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法的較佳實(shí)施例的流程,請(qǐng)同時(shí)參見(jiàn)圖1和圖2,本實(shí)施例的知識(shí)導(dǎo)航方法包括病毒知識(shí)挖掘的流程(步驟S1- S4)以及專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白本體構(gòu)建及知識(shí)導(dǎo)航的流程(步驟S5 - S7),其實(shí)施步驟詳述如下。
[0062]步驟S1:構(gòu)建專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)和確立能夠進(jìn)行對(duì)應(yīng)的蛋白質(zhì)關(guān)聯(lián)和整合的科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)(來(lái)源于國(guó)外的全英文數(shù)據(jù)庫(kù))。
[0063]步驟S2:以現(xiàn)存的蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表為依據(jù),以專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中出現(xiàn)的病毒蛋白質(zhì)名詞為挖掘和發(fā)現(xiàn)對(duì)象,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰。
[0064]進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰的目的是使得專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)名詞與蛋白質(zhì)科學(xué)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表進(jìn)行一一對(duì)應(yīng)的關(guān)聯(lián)和整合,實(shí)現(xiàn)對(duì)專(zhuān)題文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù)的病毒蛋白質(zhì)相關(guān)文本挖掘和標(biāo)注。
[0065]步驟S3:根據(jù)國(guó)外蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)提供的協(xié)議將標(biāo)識(shí)號(hào)轉(zhuǎn)換成超鏈接信息,生成面向主題和應(yīng)用的專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù)。
[0066]步驟S4:去除數(shù)據(jù)挖掘和信息整合結(jié)果中的非法信息,去除假陽(yáng)性蛋白質(zhì)挖掘結(jié)果。這是一個(gè)可選步驟。
[0067]步驟S5:提取病毒相關(guān)術(shù)語(yǔ)。
[0068]通過(guò)對(duì)病毒生活史的學(xué)習(xí)和理解,從中提取代表性的術(shù)語(yǔ)詞匯、蛋白質(zhì)名稱(chēng)以及對(duì)術(shù)語(yǔ)詞匯的解釋和蛋白質(zhì)功能的注釋?zhuān)?duì)這些詞匯及蛋白質(zhì)名詞進(jìn)行整理分類(lèi),劃分為感染過(guò)程相關(guān)術(shù)語(yǔ)、結(jié)構(gòu)組分相關(guān)術(shù)語(yǔ)以及蛋白質(zhì)名稱(chēng)。
[0069]步驟S6:確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系。
[0070]通過(guò)學(xué)習(xí)與理解,分析提取出的術(shù)語(yǔ)間存在的屬性關(guān)系,并最終確定具有代表性的關(guān)系屬性。
[0071]步驟S7:構(gòu)建病毒蛋白本體,將術(shù)語(yǔ)、術(shù)語(yǔ)注釋以及關(guān)系屬性進(jìn)行關(guān)聯(lián)整合,構(gòu)建出一個(gè)蛋白本體框架,并最終通過(guò)反復(fù)分析修改更正來(lái)完善該本體。
[0072]將知識(shí)挖掘型專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典和病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)整合關(guān)聯(lián),構(gòu)建應(yīng)用于蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航,完成基于病毒蛋白本體的知識(shí)導(dǎo)航。
[0073]在本發(fā)明中,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù),蛋白本體是乙肝蛋白本體。
[0074]基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的實(shí)施例
[0075]圖3示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置的較佳實(shí)施例的原理,請(qǐng)參見(jiàn)圖3,本實(shí)施例的知識(shí)導(dǎo)航裝置包括病毒知識(shí)挖掘模塊I以及專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白本體構(gòu)建及知識(shí)導(dǎo)航模塊2。
[0076]病毒知識(shí)挖掘模塊I包括數(shù)據(jù)庫(kù)構(gòu)建單元11、翻譯編撰單元12、數(shù)據(jù)倉(cāng)庫(kù)生成單元13、以及非法信息去除單元14 (可選單元)。
[0077]數(shù)據(jù)庫(kù)構(gòu)建單元11構(gòu)建專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)和確立能夠進(jìn)行對(duì)應(yīng)的蛋白質(zhì)關(guān)聯(lián)和整合的科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)。
[0078]翻譯編撰單元12以現(xiàn)存的蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表為依據(jù),以專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中出現(xiàn)的病毒蛋白質(zhì)名詞為挖掘和發(fā)現(xiàn)對(duì)象,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰,目的是使得專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)名詞與蛋白質(zhì)科學(xué)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表進(jìn)行一一對(duì)應(yīng)的關(guān)聯(lián)和整合,實(shí)現(xiàn)對(duì)專(zhuān)題文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù)的病毒蛋白質(zhì)相關(guān)文本挖掘和標(biāo)注。
[0079]數(shù)據(jù)倉(cāng)庫(kù)生成單元13根據(jù)國(guó)外蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)提供的協(xié)議將標(biāo)識(shí)號(hào)轉(zhuǎn)換成超鏈接信息,生成面向主題和應(yīng)用的專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù)。
[0080]非法信息去除單元14去除數(shù)據(jù)挖掘和信息整合結(jié)果中的非法信息,去除假陽(yáng)性蛋白質(zhì)挖掘結(jié)果。
[0081]專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白本體構(gòu)建及知識(shí)導(dǎo)航模塊2包括術(shù)語(yǔ)提取單元21、關(guān)系確立單元22、本體構(gòu)建單元23。
[0082]術(shù)語(yǔ)提取單元21提取病毒相關(guān)術(shù)語(yǔ),通過(guò)對(duì)病毒生活史的學(xué)習(xí)和理解,從中提取代表性的術(shù)語(yǔ)詞匯、蛋白質(zhì)名稱(chēng)以及對(duì)術(shù)語(yǔ)詞匯的解釋和蛋白質(zhì)功能的注釋?zhuān)?duì)這些詞匯及蛋白質(zhì)名詞進(jìn)行整理分類(lèi),劃分為感染過(guò)程相關(guān)術(shù)語(yǔ)、結(jié)構(gòu)組分相關(guān)術(shù)語(yǔ)以及蛋白質(zhì)名稱(chēng)。
[0083]關(guān)系確立單元22確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系,通過(guò)學(xué)習(xí)與理解,分析提取出的術(shù)語(yǔ)間存在的屬性關(guān)系,并最終確定具有代表性的關(guān)系屬性。
[0084]本體構(gòu)建單元23構(gòu)建病毒蛋白本體,將術(shù)語(yǔ)、術(shù)語(yǔ)注釋以及關(guān)系屬性進(jìn)行關(guān)聯(lián)整合,構(gòu)建出一個(gè)蛋白本體框架,并最終通過(guò)反復(fù)分析修改更正來(lái)完善該本體。將知識(shí)挖掘型專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典和病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)整合關(guān)聯(lián),構(gòu)建應(yīng)用于蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航,完成基于病毒蛋白本體的知識(shí)導(dǎo)航。
[0085]在本實(shí)施例中,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù),蛋白本體是乙肝蛋白本體。
[0086]基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng)的實(shí)施例
[0087]圖4示出了本發(fā)明的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng)的較佳實(shí)施例的結(jié)構(gòu),請(qǐng)參見(jiàn)圖4,本實(shí)施例的系統(tǒng)包括專(zhuān)題文獻(xiàn)服務(wù)器3、病毒本體庫(kù)服務(wù)器4、web服務(wù)器和查詢(xún)請(qǐng)求解釋器5、以及查詢(xún)請(qǐng)求終端6。
[0088]查詢(xún)請(qǐng)求終端6接收用戶請(qǐng)求。查詢(xún)請(qǐng)求終端6的查詢(xún)方式有關(guān)鍵詞請(qǐng)求和本體庫(kù)知識(shí)導(dǎo)航目錄查詢(xún)。
[0089]web服務(wù)器和查詢(xún)請(qǐng)求解釋器5接收用戶請(qǐng)求,通過(guò)查詢(xún)請(qǐng)求解釋器將用戶請(qǐng)求進(jìn)行規(guī)范化處理(如通過(guò)同義詞典將用戶請(qǐng)求轉(zhuǎn)化為標(biāo)準(zhǔn)化的本體名稱(chēng),自動(dòng)更正錯(cuò)別字,自動(dòng)將用空格分隔的關(guān)鍵詞連接為組合的查詢(xún)條件等)。
[0090]病毒本體庫(kù)服務(wù)器4存放病毒本體構(gòu)建和管理程序以及構(gòu)建好的病毒本體庫(kù)。
[0091]專(zhuān)題文獻(xiàn)服務(wù)器3存放專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)及文獻(xiàn)處理(知識(shí)挖掘)程序和管理程序。
[0092]在本實(shí)施例中,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)。
[0093]上述實(shí)施例是提供給本領(lǐng)域普通技術(shù)人員來(lái)實(shí)現(xiàn)和使用本發(fā)明的,本領(lǐng)域普通技術(shù)人員可在不脫離本發(fā)明的發(fā)明思想的情況下,對(duì)上述實(shí)施例做出種種修改或變化,因而本發(fā)明的保護(hù)范圍并不被上述實(shí)施例所限,而應(yīng)該是符合權(quán)利要求書(shū)所提到的創(chuàng)新性特征的最大范圍。
【權(quán)利要求】
1.一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,包括病毒知識(shí)挖掘的流程以及專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的蛋白質(zhì)挖掘和發(fā)現(xiàn)的流程,其中: 病毒知識(shí)挖掘的流程進(jìn)一步包括: 構(gòu)建專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)和確立能夠進(jìn)行對(duì)應(yīng)的蛋白質(zhì)關(guān)聯(lián)和整合的科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù); 以現(xiàn)存的蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表為依據(jù),以專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中出現(xiàn)的病毒蛋白質(zhì)名詞為挖掘和發(fā)現(xiàn)對(duì)象,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編4-05?共; 根據(jù)國(guó)外蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)提供的協(xié)議將標(biāo)識(shí)號(hào)轉(zhuǎn)換成超鏈接信息,生成面向主題和應(yīng)用的專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù); 專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)本體的構(gòu)建及知識(shí)導(dǎo)航流程包括: 提取病毒相關(guān)術(shù)語(yǔ); 確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系; 構(gòu)建病毒蛋白本體,將知識(shí)挖掘型專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典和病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)整合關(guān)聯(lián),構(gòu)建應(yīng)用于蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航,完成基于病毒蛋白本體的知識(shí)導(dǎo)航功能。
2.根據(jù)權(quán)利要求1所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,其特征在于,在生成專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù)的步驟之后還包括: 去除數(shù)據(jù)挖掘和信息整合結(jié)果中的非法信息,去除假陽(yáng)性蛋白質(zhì)挖掘結(jié)果。
3.根據(jù)權(quán)利要求1所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,其特征在于,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰使得專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)名詞與蛋白質(zhì)科學(xué)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表進(jìn)行一一對(duì)應(yīng)的關(guān)聯(lián)和整合,實(shí)現(xiàn)對(duì)專(zhuān)題文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù)的病毒蛋白質(zhì)相關(guān)文本的挖掘和標(biāo)注。
4.根據(jù)權(quán)利要求1所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,其特征在于,提取病毒相關(guān)術(shù)語(yǔ)的步驟包括: 通過(guò)對(duì)病毒生活史的學(xué)習(xí)和理解,從中提取代表性的術(shù)語(yǔ)詞匯、蛋白質(zhì)名稱(chēng)以及對(duì)術(shù)語(yǔ)詞匯的解釋和蛋白質(zhì)功能的注釋?zhuān)?duì)這些詞匯及蛋白質(zhì)名詞進(jìn)行整理分類(lèi),劃分為感染過(guò)程相關(guān)術(shù)語(yǔ)、結(jié)構(gòu)組分相關(guān)術(shù)語(yǔ)以及蛋白質(zhì)名稱(chēng)。
5.根據(jù)權(quán)利要求1所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,其特征在于,確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系的步驟包括: 通過(guò)學(xué)習(xí)與理解,分析提取出的術(shù)語(yǔ)間存在的屬性關(guān)系,并最終確定具有代表性的關(guān)系屬性。
6.根據(jù)權(quán)利要求1所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,其特征在于,構(gòu)建病毒蛋白本體的步驟包括: 將術(shù)語(yǔ)、術(shù)語(yǔ)注釋以及關(guān)系屬性進(jìn)行關(guān)聯(lián)整合,構(gòu)建出一個(gè)蛋白本體框架,并最終通過(guò)反復(fù)分析修改更正來(lái)完善該本體。
7.根據(jù)權(quán)利要求1一 6中任一項(xiàng)所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的方法,其特征在于,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù),蛋白本體是乙肝病毒蛋白本體。
8.一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,包括病毒知識(shí)挖掘模塊以及專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的蛋白質(zhì)挖掘和發(fā)現(xiàn)模塊,其中: 病毒知識(shí)挖掘模塊包括: 數(shù)據(jù)庫(kù)構(gòu)建單元,構(gòu)建專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)和確立能夠進(jìn)行對(duì)應(yīng)的蛋白質(zhì)關(guān)聯(lián)和整合的科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù); 翻譯編撰單元,以現(xiàn)存的蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表為依據(jù),以專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中出現(xiàn)的病毒蛋白質(zhì)名詞為挖掘和發(fā)現(xiàn)對(duì)象,進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰; 數(shù)據(jù)倉(cāng)庫(kù)生成單元,根據(jù)國(guó)外蛋白質(zhì)科學(xué)數(shù)據(jù)型數(shù)據(jù)庫(kù)提供的協(xié)議將標(biāo)識(shí)號(hào)轉(zhuǎn)換成超鏈接信息,生成面向主題和應(yīng)用的專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)倉(cāng)庫(kù); 專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)本體構(gòu)建及知識(shí)導(dǎo)航模塊包括: 術(shù)語(yǔ)提取單元,提取病毒相關(guān)術(shù)語(yǔ); 關(guān)系確立單元,確立病毒相關(guān)術(shù)語(yǔ)間的關(guān)系; 本體構(gòu)建單元,構(gòu)建病毒蛋白本體,將知識(shí)挖掘型專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)的文本挖掘字典和病毒蛋白本體進(jìn)行關(guān)聯(lián)整合,并通過(guò)整合關(guān)聯(lián),構(gòu)建應(yīng)用于蛋白質(zhì)挖掘模塊的知識(shí)組織與分類(lèi)導(dǎo)航,完成基于病毒蛋白本體的知識(shí)導(dǎo)航。
9.根據(jù)權(quán)利要求8所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,其特征在于,病毒知識(shí)挖掘模塊還包括: 非法信息去除單元,去除數(shù)據(jù)挖掘和信息整合結(jié)果中的非法信息,去除假陽(yáng)性蛋白質(zhì)挖掘結(jié)果。
10.根據(jù)權(quán)利要求8所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,其特征在于,翻譯編撰單元進(jìn)行病毒蛋白質(zhì)相關(guān)文本挖掘字典的翻譯和編撰使得專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)中的病毒蛋白質(zhì)名詞與蛋白質(zhì)科學(xué)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)控制詞表進(jìn)行一一對(duì)應(yīng)的關(guān)聯(lián)和整合,實(shí)現(xiàn)對(duì)專(zhuān)題文獻(xiàn)基礎(chǔ)數(shù)據(jù)庫(kù)的病毒蛋白質(zhì)相關(guān)文本挖掘和標(biāo)注。
11.根據(jù)權(quán)利要求8所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,其特征在于,術(shù)語(yǔ)提取單元通過(guò)對(duì)病毒生活史的學(xué)習(xí)和理解,從中提取代表性的術(shù)語(yǔ)詞匯、蛋白質(zhì)名稱(chēng)以及對(duì)術(shù)語(yǔ)詞匯的解釋和蛋白質(zhì)功能的注釋?zhuān)?duì)這些詞匯及蛋白質(zhì)名詞進(jìn)行整理分類(lèi),劃分為感染過(guò)程相關(guān)術(shù)語(yǔ)、結(jié)構(gòu)組分相關(guān)術(shù)語(yǔ)以及蛋白質(zhì)名稱(chēng)。
12.根據(jù)權(quán)利要求8所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,其特征在于,關(guān)系確立單元通過(guò)學(xué)習(xí)與理解,分析提取出的術(shù)語(yǔ)間存在的屬性關(guān)系,并最終確定具有代表性的關(guān)系屬性。
13.根據(jù)權(quán)利要求8所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,其特征在于,本體構(gòu)建單元將術(shù)語(yǔ)、術(shù)語(yǔ)注釋以及關(guān)系屬性進(jìn)行關(guān)聯(lián)整合,構(gòu)建出一個(gè)蛋白本體框架,并最終通過(guò)反復(fù)分析修改更正來(lái)完善該本體。
14.根據(jù)權(quán)利要求8— 13中任一項(xiàng)所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的裝置,其特征在于,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)知識(shí)數(shù)據(jù)庫(kù),蛋白本體是乙肝病毒蛋白本體。
15.一種基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng),包括專(zhuān)題文獻(xiàn)服務(wù)器、病毒本體庫(kù)服務(wù)器、服務(wù)器和查詢(xún)請(qǐng)求解釋器、以及查詢(xún)請(qǐng)求終端,其中: 查詢(xún)請(qǐng)求終端,接收用戶請(qǐng)求; 服務(wù)器和查詢(xún)請(qǐng)求解釋器,接收用戶請(qǐng)求,通過(guò)查詢(xún)請(qǐng)求解釋器將用戶請(qǐng)求進(jìn)行規(guī)范化處理; 病毒本體庫(kù)服務(wù)器,存放病毒本體構(gòu)建和管理程序以及構(gòu)建好的病毒本體庫(kù); 專(zhuān)題文獻(xiàn)服務(wù)器,存放專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)及文獻(xiàn)處理程序和管理程序。
16.根據(jù)權(quán)利要求15所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng),其特征在于,查詢(xún)請(qǐng)求終端的查詢(xún)方式有關(guān)鍵詞請(qǐng)求和本體庫(kù)知識(shí)導(dǎo)航目錄查詢(xún)。
17.根據(jù)權(quán)利要求15— 16中任一項(xiàng)所述的基于病毒蛋白質(zhì)本體的知識(shí)導(dǎo)航的系統(tǒng),其特征在于,病毒是乙肝病毒,專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)是乙肝專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)。
【文檔編號(hào)】G06F19/28GK104424399SQ201310391096
【公開(kāi)日】2015年3月18日 申請(qǐng)日期:2013年8月30日 優(yōu)先權(quán)日:2013年8月30日
【發(fā)明者】陳恒, 張珅, 趙 衍, 張永娟, 陳成材 申請(qǐng)人:中國(guó)科學(xué)院上海生命科學(xué)研究院