專(zhuān)利名稱(chēng):分子功能網(wǎng)絡(luò)的生成方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于含有生物學(xué)事件信息的生物分子數(shù)據(jù)庫(kù)的制作方法和使用方法。
近年來(lái),基因組的發(fā)展十分迅猛,以人為主的多種生物物種的基因組序列得到解析,關(guān)于基因和基因產(chǎn)物-蛋白質(zhì)的序列、每種臟器的蛋白質(zhì)的表達(dá)、蛋白-蛋白相互作用等基因組范圍內(nèi)的系統(tǒng)研究不斷深入。其大部分研究成果均以數(shù)據(jù)庫(kù)的形式公開(kāi)供全世界使用。關(guān)于基因和蛋白質(zhì)的功能、疾病的原因以及背景基因的推測(cè)、基因多型性的關(guān)系等正在一點(diǎn)點(diǎn)闡明,人們對(duì)以遺傳信息為基礎(chǔ)的醫(yī)療和新藥開(kāi)發(fā)的期望不斷升高。
一方面,遺傳信息的載體是核酸,但能量代謝、物質(zhì)交換、信號(hào)傳導(dǎo)等生命功能等大多數(shù)是依靠核酸以外的分子執(zhí)行。蛋白質(zhì)和其它種類(lèi)的分子不同,它是以基因設(shè)計(jì)圖為基礎(chǔ)而直接產(chǎn)生的,其種類(lèi)很多。酶、小分子的生物體內(nèi)生理活性化合物的靶標(biāo)生物分子、蛋白質(zhì)性質(zhì)的生物體內(nèi)生理活性化合物的靶標(biāo)生物分子(多數(shù)進(jìn)行了糖修飾)全部是蛋白質(zhì)。疾病的根本原因,歸根結(jié)底可以說(shuō)多數(shù)疾病和癥狀是蛋白質(zhì)和小分子化合物的量之間的平衡、由于情況不同導(dǎo)致的質(zhì)(功能)的異常。大部分現(xiàn)行醫(yī)藥都是以蛋白質(zhì)為靶標(biāo)并對(duì)其功能進(jìn)行調(diào)控的化合物。和蛋白質(zhì)不同,由于核酸的立體結(jié)構(gòu)決定了它很難作為小分子藥物的靶標(biāo)而發(fā)揮其特異性作用,因此抗生素和抗菌藥或者農(nóng)藥的殺蟲(chóng)劑和抗霉劑的靶標(biāo)都是蛋白質(zhì)。
因此,為了對(duì)以遺傳信息為基礎(chǔ)的醫(yī)療和新藥進(jìn)行開(kāi)發(fā),必須闡明生物體內(nèi)各種蛋白質(zhì)和小分子化合物的功能和它們的分子間的特異性關(guān)系。而且,不同的酶漸次生物合成相關(guān)的必要分子,不同的分子漸次結(jié)合而傳導(dǎo)信號(hào),這些分子在功能和生物合成上存在直接或者間接的相互關(guān)聯(lián)。這種關(guān)聯(lián)(分子功能網(wǎng)絡(luò))信息十分重要。此外,到目前的研究為止,已經(jīng)闡明了多種與各種臨床癥狀、生理現(xiàn)象以及生物反應(yīng)發(fā)生直接相關(guān)的介質(zhì)和激素等分子,與分子功能網(wǎng)絡(luò)的關(guān)系是適當(dāng)?shù)闹委煵豢扇钡?。此外,?chuàng)新藥物的戰(zhàn)略要在考慮到副作用風(fēng)險(xiǎn)之同時(shí)設(shè)定恰當(dāng)?shù)陌袠?biāo)分子,因此必須考慮到含有靶標(biāo)分子的分子功能網(wǎng)絡(luò)。
蛋白質(zhì)相關(guān)的數(shù)據(jù)庫(kù)有SwissPort(the Swiss Institute ofBioinformatics,Europaen Bioinformatics Institute(EBI)、PIR(NationalBiomedical Research foundation(NBRF))。任何一個(gè)數(shù)據(jù)庫(kù)除了含有序列信息之外,還提供生物種類(lèi)、功能、功能機(jī)制、發(fā)現(xiàn)者、文獻(xiàn)、其它注解信息。
著眼于分子關(guān)聯(lián)的分子網(wǎng)絡(luò)型的數(shù)據(jù)庫(kù)有與代謝途徑相關(guān)的有KEGG(金久等,京都大學(xué))、Biochemical Pathways(BoehringerMannheim)、WIT(Russian Academy of Sciences)、Biofrontier(吳羽化學(xué))、Protein Pathway(AxCell)、bioSCOUT(LION)、EcoCyc(DoubleTwist)、UM-BBD(Minnesota Univ)。
KEGG的PATHWAY數(shù)據(jù)庫(kù)中有新陳代謝途徑和信號(hào)傳導(dǎo)途徑,前者收集了物質(zhì)代謝、能量代謝相關(guān)的一般小分子化合物的代謝途徑,后者收集了信號(hào)傳導(dǎo)體系的蛋白質(zhì)。任何一種都以靜態(tài)Gif的格式提供事先定義的分子網(wǎng)絡(luò)。前者中,酶和配體的信息是從另外的文本形式分子數(shù)據(jù)庫(kù)LIGAND(金久等,京都大學(xué))和ENZYME(IUPAC-IUBMB)中收錄的。不包括與生理活性肽的生成相關(guān)的酶和靶標(biāo)生物分子。
EcoCyc是大腸桿菌物質(zhì)代謝的數(shù)據(jù)庫(kù),是以每一個(gè)酶反應(yīng)相關(guān)數(shù)據(jù)和已知途徑相關(guān)數(shù)據(jù)(將屬于這種途徑的酶反應(yīng)集中在一起進(jìn)行表述)為基礎(chǔ)、用圖形的形式表示途徑。EcoCyc的檢索功能是提供根據(jù)與分子名和途徑名稱(chēng)相對(duì)應(yīng)的文字列和略號(hào)的檢索方法。不能指定任意分子檢索新的途徑。
信號(hào)傳導(dǎo)相關(guān)的數(shù)據(jù)庫(kù)有CSNDB(國(guó)立醫(yī)藥食品衛(wèi)生研究所,日本)、SPAD(久原等,九州大學(xué))、Gene Net(Institute of Cytology & GeneticsNovosibrisk,Russia),GeNet(Maria G.Samsonova)。
蛋白-蛋白相互作用的數(shù)據(jù)庫(kù)有DIP(UCLA)、PathCalling(CuraGen)、ProNet(Myriad)。
基因、蛋白表達(dá)數(shù)據(jù)庫(kù)有BodyMap(東京大學(xué)、大阪大學(xué))、SWIS8-2DPAGE(Swiss Institute of Bioinformatics),Human and mouse 2D PAGEdatabase(Danish Centre for Human Genome Research),HEART-2DPAGE(GermanHeart)、PDD Protein Disease Databases(NIMH-NCI),WashingtonUniversity Inner Ear Protein Database(Washington Univ.),PMMA-2DPAGE(Purkyne Military Medical Academy),Mito-Pick(CEA,F(xiàn)rance),MolecularAnatomy Laboratory(Indiana University),Human Colon Carcinoma ProteinDatabase(Ludwig Institute for Cancer Research)。
生物反應(yīng)模擬型的分子網(wǎng)絡(luò)數(shù)據(jù)庫(kù)包括E-Cell(富田等,慶應(yīng)大學(xué))、e E.coli(B.Palsson)、Cell(D.Lauffenburger,MIT)、Virtual Cell(L.Leow,Conneticut Univ.)、Virtual patient(Entelos,Inc.)。
關(guān)于生物分子和功能的關(guān)系,除了SwissPort收集了廣泛的蛋白信息之外,COPE(University of Munich)以文本的形式公開(kāi)了細(xì)胞因子的功能信息。ARIS((股份)日本電子計(jì)算)以醫(yī)學(xué)、藥學(xué)領(lǐng)域?yàn)橹行膹拇蠹s400多家國(guó)內(nèi)雜志和20家海外雜志中收錄了與藥品的副作用、相互作用、農(nóng)藥、化學(xué)物質(zhì)導(dǎo)致的中毒相關(guān)的文獻(xiàn)信息。但關(guān)于生物分子的生理作用和細(xì)胞水平以上的應(yīng)答方面的數(shù)據(jù)庫(kù)至今還沒(méi)有。關(guān)于基因和疾病,OMIM(NIH)對(duì)遺傳疾病和蛋白質(zhì)的氨基酸變異信息進(jìn)行了收集。任何信息都以文本形式的數(shù)據(jù)記述、用關(guān)鍵詞進(jìn)行檢索。
著眼于分子間關(guān)聯(lián)的已有數(shù)據(jù)庫(kù)存在以下幾點(diǎn)問(wèn)題。分子網(wǎng)絡(luò)型數(shù)據(jù)庫(kù)是針對(duì)分子和分子間的關(guān)聯(lián)已經(jīng)清楚的體系制作的??梢允孪瓤紤]到分子間的關(guān)系進(jìn)行配置,并用靜態(tài)Gif等形式表現(xiàn)出來(lái)??墒牵@種方式造成難以添加新的分子和分子間的關(guān)聯(lián)的后果。如果將今后明確其存在的分子也包括在內(nèi)大約有10萬(wàn)以上(在KEGG中收錄的分子包括醫(yī)藥分子大約有1萬(wàn))。而且一旦這些分子間的關(guān)系通過(guò)今后的研究查清楚,可以推想分子網(wǎng)絡(luò)的復(fù)雜性正以加速度的狀態(tài)增加。為了適應(yīng)既能追加新分子又能夠保持不斷增多的分子之間關(guān)系的信息,人們需要能生成含有必要信息的部分分子網(wǎng)絡(luò)的新方法。
2001年9月7日至今,KEGG將分子間的關(guān)聯(lián)以2個(gè)分子成對(duì)信息的形式進(jìn)行保存,使用該信息,能夠探索代謝途徑中的任意2個(gè)分子間的關(guān)聯(lián)途徑??墒?,該途徑探索方法存在的問(wèn)題是隨著關(guān)聯(lián)2個(gè)分子間的途徑的增長(zhǎng),計(jì)算時(shí)間也隨著級(jí)數(shù)地增長(zhǎng)。
另一個(gè)方面,文本形式的數(shù)據(jù)庫(kù)中分子數(shù)據(jù)的追加沒(méi)有界限??墒牵瑥拿總€(gè)分子的數(shù)據(jù)中對(duì)功能上或者合成上相關(guān)聯(lián)的分子逐個(gè)反復(fù)檢索,導(dǎo)致難以生成表示多個(gè)分子關(guān)聯(lián)的分子網(wǎng)絡(luò)。因此需要開(kāi)發(fā)一種在檢索時(shí),能夠主動(dòng)或者自動(dòng)得到必要分子的關(guān)聯(lián)信息的數(shù)據(jù)的保持方法和檢索方法。此外為了在分子水平上理解疾病和病況,需要有記述生物分子及其網(wǎng)絡(luò)與生物應(yīng)答、生理作用的關(guān)系的新方法。
本發(fā)明者等人為了解決上述課題進(jìn)行了刻苦的研究,結(jié)果發(fā)現(xiàn),將直接結(jié)合的生物分子對(duì)作為部分信息而收集起耒,由此網(wǎng)羅了生物分子間的關(guān)系,針對(duì)生物分子中與生物應(yīng)答的表達(dá)直接相關(guān)的關(guān)鍵分子,在其與靶標(biāo)生物分子的對(duì)的信息中,添加了由生理作用、生物應(yīng)答、臨床癥狀等組成的生物學(xué)事件信息并加以保存,通過(guò)對(duì)包含指定的1個(gè)以上的任意生物分子以及生物學(xué)事件的關(guān)聯(lián)自動(dòng)逐個(gè)探索,制成分子功能網(wǎng)絡(luò),解決了上述課題。
即,本發(fā)明提供了使用儲(chǔ)存了直接結(jié)合的生物分子對(duì)相關(guān)信息的生物分子連鎖數(shù)據(jù)庫(kù)生成分子功能網(wǎng)絡(luò)的方法。根據(jù)本發(fā)明的優(yōu)選方案,能夠提供使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù)制成與生物學(xué)事件信息有關(guān)的分子功能網(wǎng)絡(luò)的上述方法、使用含有與生物分子自身相關(guān)信息的生物分子信息數(shù)據(jù)庫(kù)的上述方法、以及生成含有生物學(xué)事件信息相關(guān)的醫(yī)藥分子的分子功能網(wǎng)絡(luò)的上述方法。此外,根據(jù)本發(fā)明還可以提供一種推測(cè)方法,即通過(guò)使用儲(chǔ)存有直接結(jié)合的生物分子對(duì)的相關(guān)生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),對(duì)任意生物分子或者醫(yī)藥分子有直接或者間接關(guān)系的生物學(xué)事件進(jìn)行推測(cè)的方法。并且,本發(fā)明還提供了當(dāng)生物分子是其他數(shù)據(jù)庫(kù)或者文獻(xiàn)中的基因所編碼的蛋白質(zhì)時(shí),可以通過(guò)制成與該生物分子的分子略稱(chēng)以及該基因名稱(chēng)或ID或略稱(chēng)相對(duì)應(yīng)的數(shù)據(jù)庫(kù),使用分子功能網(wǎng)絡(luò)分析基因的多型性或者表達(dá)的信息的方法。
根據(jù)本發(fā)明的更優(yōu)選方案,可以提供根據(jù)網(wǎng)絡(luò)上的相互關(guān)聯(lián)、以成組的生物分子對(duì)數(shù)據(jù)為子網(wǎng)絡(luò)、之后,基于歸屬的子網(wǎng)絡(luò)以及子網(wǎng)絡(luò)間的包含關(guān)系將分子功能網(wǎng)絡(luò)層次化并且以此為特征的上述方法;還可以提供基于分子對(duì)的歸屬路徑名、歸屬子網(wǎng)絡(luò)名等把生物分子對(duì)相關(guān)信息層次化后加以保存,并且以此為特征的上述方法;基于基因群中的表達(dá)模式和到達(dá)細(xì)胞表面的模式等把生物分子自身相關(guān)信息層次化后保存,并以此為特征的上述方法;而且還能夠提供基于該生物學(xué)事件的上位概念進(jìn)行的分類(lèi)和病態(tài)事件的關(guān)聯(lián)、把該事件相關(guān)信息層次化保存,并以此為特征的上述方法。并且,本發(fā)明還提供分別針對(duì)生物分子對(duì)相關(guān)的上位層次、生物分子自身相關(guān)的上位層次、生物學(xué)事件相關(guān)的上位層次的保存項(xiàng)目,保存項(xiàng)目間的關(guān)聯(lián)性和依存關(guān)系等的相關(guān)信息并以此為特征的上述方法;利用生物分子信息數(shù)據(jù)庫(kù)以及生物分子連鎖數(shù)據(jù)庫(kù)中保存的層次化信息,簡(jiǎn)便地生成分子功能網(wǎng)絡(luò)并以此為特征的上述方法;利用生物分子信息數(shù)據(jù)庫(kù)以及生物分子連鎖數(shù)據(jù)庫(kù)中所保存的層次化信息對(duì)分子功能網(wǎng)絡(luò)所表現(xiàn)的詳細(xì)程度進(jìn)行控制并以此為特征的上述方法。
并且本發(fā)明提供如下所示的方法和數(shù)據(jù)庫(kù)。1.賦予生物學(xué)事件信息和生物分子關(guān)系的方法。2.和生物學(xué)事件信息有關(guān)系的分子功能網(wǎng)絡(luò)的生成方法。3.含有和生物學(xué)事件信息有關(guān)系的醫(yī)藥分子的功能網(wǎng)絡(luò)的生成方法。4.對(duì)任意生物分子有直接或者間接關(guān)系的生物學(xué)事件進(jìn)行推測(cè)的方法。5.使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),對(duì)任意的生物分子直接或者間接相關(guān)的生物事件進(jìn)行推測(cè)的方法。6.使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),對(duì)任意的生物分子相關(guān)的分子功能網(wǎng)絡(luò)以及該分子直接或者間接相關(guān)的生物事件進(jìn)行推測(cè)的方法。7.在直接結(jié)合的生物分子對(duì)信息中補(bǔ)加與生物事件的發(fā)生直接相關(guān)的關(guān)鍵分子和它的靶標(biāo)生物分子對(duì)以及該生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù)。8.含有源自關(guān)鍵分子的生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù)。9.含有攜帶生物事件信息的關(guān)鍵分子的生物分子連鎖數(shù)據(jù)庫(kù)。10.通過(guò)生物分子連鎖數(shù)據(jù)庫(kù)的連接(connect)檢索得到的分子功能網(wǎng)絡(luò)。11.使用上述的7~9的任意一個(gè)生物分子連鎖數(shù)據(jù)庫(kù),對(duì)任意生物分子相關(guān)的分子功能網(wǎng)絡(luò)和生物學(xué)事件進(jìn)行推測(cè)的方法。12.使用上述7~9的任意一個(gè)生物分子連鎖數(shù)據(jù)庫(kù)和醫(yī)藥分子連鎖數(shù)據(jù)庫(kù),對(duì)任意生物分子或醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò)和生物學(xué)事件進(jìn)行推測(cè)的方法。13.含有與生物學(xué)事件信息中的關(guān)鍵分子的量或者質(zhì)的變化相對(duì)應(yīng)的波動(dòng)信息的上述1~12所記載的方法或者生物分子連鎖數(shù)據(jù)庫(kù)以及功能網(wǎng)絡(luò)。14.含有與生物學(xué)事件的信息中的關(guān)鍵分子的生成臟器和生物學(xué)事件的發(fā)生臟器信息的上述1~12所記載的方法或者生物分子連鎖數(shù)據(jù)庫(kù)以及功能網(wǎng)絡(luò)。15.含有與生物學(xué)事件的信息中的關(guān)鍵分子的量或者質(zhì)的變化相對(duì)應(yīng)的波動(dòng)信息同時(shí)含有關(guān)鍵分子的生成臟器和生物學(xué)事件的發(fā)生臟器信息的上述1~12所記載的方法或生物分子連鎖數(shù)據(jù)庫(kù)以及功能網(wǎng)絡(luò)。16.通過(guò)保存直接結(jié)合的生物分子對(duì)和表明該結(jié)合關(guān)系的信息,制作與1個(gè)以上任意生物分子在功能上或生物合成上有直接或間接關(guān)系的分子功能網(wǎng)絡(luò)的方法。17.使用直接結(jié)合的生物分子對(duì)信息的集合,對(duì)與任意生物分子在功能上或生物合成上有直接或間接關(guān)系的關(guān)鍵分子進(jìn)行探索的方法。18.在權(quán)利要求17項(xiàng)中所記載的方法的基礎(chǔ)上對(duì)與任意生物分子有直接或間接關(guān)系的生物學(xué)事件進(jìn)行推測(cè)的方法。19.通過(guò)保存直接結(jié)合的生物分子對(duì)和表明該結(jié)合關(guān)系的信息,制作表示生物分子間在功能上或生物合成上的關(guān)系的分子功能網(wǎng)絡(luò)的方法。20.將直接結(jié)合的生物分子對(duì)和表明該結(jié)合關(guān)系的信息作為一部分保存起耒,通過(guò)連接檢索,制作與任意1個(gè)以上生物分子相關(guān)的分子功能網(wǎng)絡(luò)的方法。21.將直接結(jié)合的生物分子對(duì)和表明該結(jié)合關(guān)系的信息作為一部分保存起耒,通過(guò)連接檢索,找出與指定的1個(gè)以上的生物分子在生物合成上以及功能上有直接或間接關(guān)系的生物分子組的方法。22.基于與疾病相關(guān)的生物學(xué)事件群,對(duì)與該疾病相關(guān)的分子功能網(wǎng)絡(luò)進(jìn)行推測(cè)的方法。23.基于與疾病相關(guān)的生物學(xué)事件群,對(duì)與該疾病相關(guān)的分子功能網(wǎng)絡(luò)進(jìn)行推測(cè),進(jìn)而推測(cè)可能的創(chuàng)新藥物靶點(diǎn)的方法。24.基于與疾病相關(guān)的生物學(xué)事件群,將與該疾病相關(guān)的分子功能網(wǎng)絡(luò)上的生物分子作為創(chuàng)新性藥物靶點(diǎn)時(shí),對(duì)其副作用風(fēng)險(xiǎn)進(jìn)行推測(cè)的方法。25.根據(jù)與某些疾病相關(guān)的分子功能網(wǎng)絡(luò)上的任意生物分子的功能調(diào)控,對(duì)生物學(xué)事件的波動(dòng)進(jìn)行預(yù)測(cè)的方法。26.利用關(guān)鍵分子的量的變動(dòng)和生物學(xué)事件的波動(dòng)信息,輔助選定創(chuàng)新性藥物靶點(diǎn)的方法。27.上述26所記載的方法中所使用的生物分子連鎖數(shù)據(jù)庫(kù)。28.含有醫(yī)藥分子和靶標(biāo)生物分子對(duì)的信息的生物分子連鎖數(shù)據(jù)庫(kù)。29.添加有醫(yī)藥分子和靶標(biāo)生物分子的對(duì)信息以及作用和副作用信息的生物分子連鎖數(shù)據(jù)庫(kù)。30.使用添加有醫(yī)藥分子和靶標(biāo)生物分子對(duì)的信息以及作用和副作用信息的生物分子連鎖數(shù)據(jù)庫(kù),對(duì)醫(yī)藥化合物的副作用風(fēng)險(xiǎn)以及藥物間的相互作用進(jìn)行推測(cè)以及回避的方法。31.使用添加有醫(yī)藥分子和靶標(biāo)生物分子對(duì)的信息以及作用和副作用信息的生物分子連鎖數(shù)據(jù)庫(kù),根據(jù)需要與基因多型的信息連接、對(duì)治療疾病的醫(yī)藥化合物進(jìn)行選擇和用量設(shè)定的方法。32.以生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)中的蛋白質(zhì)與基因數(shù)據(jù)庫(kù)連接為特征的上述1~31中所記載的方法或生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)。33.以生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)和基因組序列相對(duì)應(yīng)的基因信息連接為特征的上述1~31中所記載的方法或生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)。34.以生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)與每個(gè)臟器的蛋白的表達(dá)信息和相對(duì)應(yīng)的基因信息相連接為特征的上述1~31中的方法或生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)。35.以生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)和與基因多型相關(guān)的基因的信息相連接為特征的上述1~31的方法以及生物分子功能網(wǎng)絡(luò)。36.以生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)與其他生物種的基因組以及基因序列相對(duì)應(yīng)的基因組或者基因信息相連接為特征的上述1~31的方法或者生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)。37.利用由于使用醫(yī)藥分子而引起的特定臟器中蛋白表達(dá)的變動(dòng)信息,對(duì)疾病的機(jī)制進(jìn)行推測(cè)的上述1~31的方法或者生物分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。38.為了分析特定疾病中常見(jiàn)的基因多型群的信息所使用的上述1~31的方法或生物分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。39.將生物分子對(duì)關(guān)系模式化,以此為特征的上述16~21的方法或生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)。40.將生物學(xué)事件以模式化的形式表現(xiàn),以此為特征的上述1~31的方法或生物分子連鎖數(shù)據(jù)庫(kù)或分子功能網(wǎng)絡(luò)。41.將與關(guān)鍵分子的量變動(dòng)相對(duì)應(yīng)的生物學(xué)事件的波動(dòng)信息模式化,以此為特征的上述13~15的方法或生物分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。42.根據(jù)需要,將2個(gè)以上的生物分子作為一個(gè)假想生物分子對(duì)待,以此為特征的上述1~41所記載的方法或分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。43.將分散配置的1個(gè)以上的生物分子連鎖數(shù)據(jù)庫(kù)以通信手段加以利用,以此為特征的上述1~41所記載的方法或生物分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。44.以制作含有與生物學(xué)事件的表現(xiàn)直接相關(guān)的生物分子信息的數(shù)據(jù)庫(kù),和并用不一定含有生物學(xué)事件信息的分子功能網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)為特征的上述1~41的方法或生物分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。45.從不一定含有生物學(xué)事件信息的分子功能網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中抽出與任意分子相關(guān)的部分分子功能網(wǎng)絡(luò),基于構(gòu)成該網(wǎng)絡(luò)的分子,對(duì)包含與生物學(xué)事件的表現(xiàn)直接相關(guān)的生物分子的方法的數(shù)據(jù)庫(kù)進(jìn)行檢索,以此為特征的上述1~41的方法或生物分子連鎖數(shù)據(jù)庫(kù)或者分子功能網(wǎng)絡(luò)。46.根據(jù)生成臟器或作用臟器等的信息,交叉(絞り込む)作為對(duì)象的生物分子或者生物分子對(duì)而得的生物分子連鎖數(shù)據(jù)庫(kù)或利用該數(shù)據(jù)庫(kù)作成的分子功能網(wǎng)絡(luò)或生成該分子功能網(wǎng)絡(luò)的方法。47.對(duì)生物分子功能數(shù)據(jù)庫(kù)進(jìn)行連接檢索,最終生成分子功能網(wǎng)絡(luò),根據(jù)各個(gè)網(wǎng)絡(luò)所含有的生物分子和生物學(xué)事件信息等將此網(wǎng)絡(luò)進(jìn)行再次交叉的方法或者交叉后得到的分子功能網(wǎng)絡(luò)。48.根據(jù)生成臟器以及作用臟器等的信息,使用以作為對(duì)象的生物分子或生物分子對(duì)交叉而得的生物分子連鎖數(shù)據(jù)庫(kù),制成分子功能網(wǎng)絡(luò),根據(jù)各個(gè)網(wǎng)絡(luò)中所含有的生物分子或者生物學(xué)事件等的信息,將該網(wǎng)絡(luò)再次進(jìn)行交叉的方法或再交叉后生成的分子功能網(wǎng)絡(luò)。49.由實(shí)施上述1~48所記載方法的程序和數(shù)據(jù)庫(kù)組成的計(jì)算機(jī)系統(tǒng)。50.記錄上述1~48所記載的數(shù)據(jù)庫(kù)的計(jì)算機(jī)可以讀取的媒體。51.記錄上述1~48所記載的與分子功能網(wǎng)絡(luò)相關(guān)信息的計(jì)算機(jī)可讀取的媒體。52.記錄上述1~48所記載的數(shù)據(jù)庫(kù)和記錄實(shí)施上述1~48所記載的程序的計(jì)算機(jī)可讀取的媒體。53.使層次化的生物學(xué)事件信息和生物分子關(guān)聯(lián)的方法。54.與層次化的生物學(xué)事件信息相關(guān)聯(lián)的分子功能網(wǎng)絡(luò)的生成方法。55.以將生物分子對(duì)的信息層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。56.以將生物分子的集合狀態(tài)層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。57.與層次化保存的生物分子對(duì)的信息相對(duì)應(yīng)的生物學(xué)事件建立關(guān)聯(lián)的方法。58.與層次化保存的生物分子的集合狀態(tài)信息相對(duì)應(yīng)的生物學(xué)事件建立關(guān)聯(lián)的方法。59.以將基因群的轉(zhuǎn)錄信息層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。60.以將蛋白表達(dá)信息層次化并保存為特征的分子功能網(wǎng)絡(luò)的生成方法。61.對(duì)于數(shù)據(jù)庫(kù)中的任意數(shù)據(jù)項(xiàng)目,基于關(guān)鍵詞、數(shù)值參數(shù)、分子構(gòu)造、氨基酸序列、堿基序列等進(jìn)行檢索,基于該檢索結(jié)果生成分子功能網(wǎng)絡(luò)的方法。62.對(duì)于制成的分子功能網(wǎng)絡(luò),對(duì)于其中所含的生物分子、生物分子對(duì)、生物學(xué)事件的數(shù)據(jù),根據(jù)關(guān)鍵詞、數(shù)值參數(shù)、分子構(gòu)造、氨基酸序列、堿基序列等進(jìn)行檢索,從而得到該網(wǎng)絡(luò)部分集合的方法。63.對(duì)制成的分子功能網(wǎng)絡(luò),對(duì)于其中所含的生物分子、生物分子對(duì)、生物學(xué)事件的數(shù)據(jù),根據(jù)關(guān)鍵詞、數(shù)值參數(shù)、分子構(gòu)造、氨基酸序列、堿基序列等進(jìn)行檢索,強(qiáng)調(diào)表示該生物分子、生物分子對(duì)、生物學(xué)事件的方法。
圖的簡(jiǎn)單說(shuō)明
圖1是表示本發(fā)明方法的基本概念的圖。
圖2是表示本發(fā)明的方法用于醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)時(shí)的概念的圖。
圖3是表示本發(fā)明的方法用于遺傳信息數(shù)據(jù)庫(kù)時(shí)的概念的圖。
圖4是表示在實(shí)施例1中作為對(duì)象的腎素-血管緊張素系統(tǒng)的概念的圖。
圖5表示的是實(shí)施例1中的生物分子信息數(shù)據(jù)庫(kù)內(nèi)容的圖。
圖6表示的是實(shí)施例1中的生物分子連鎖數(shù)據(jù)庫(kù)內(nèi)容的圖。
圖7表示的是通過(guò)有關(guān)實(shí)施例1中的生物分子的檢索得到的分子功能網(wǎng)絡(luò)圖。用于提問(wèn)的生物分子和生物學(xué)事件用粗體表示。
圖8是表示實(shí)施例1中的醫(yī)藥分子信息數(shù)據(jù)庫(kù)的內(nèi)容的圖。
圖9是表示實(shí)施例1中的醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)的內(nèi)容的圖。
圖10是表示通過(guò)有關(guān)實(shí)施例1中的醫(yī)藥分子的檢索所得到的分子功能網(wǎng)絡(luò)的圖。用于提問(wèn)的醫(yī)藥分子和生物學(xué)事件用粗體表示。
圖11是表示實(shí)施例2中的分子功能網(wǎng)絡(luò)檢索·表示程序的流程圖。
圖12是表示實(shí)施例2中的連接檢索(1點(diǎn)指定)的輸入項(xiàng)目的圖。
圖13是表示實(shí)施例2中的連接檢索(2點(diǎn)指定)的輸入項(xiàng)目的圖。實(shí)施發(fā)明的最佳狀態(tài)在本說(shuō)明書(shū)中用語(yǔ)的意思及其定義如下所釋。
“生物”其概念包含例如細(xì)胞器、細(xì)胞、組織、臟器、生物個(gè)體以及集合體等、寄生在生物上的生命體。
“生物學(xué)事件”的概念包括在生物中的內(nèi)因以及外因所表現(xiàn)的所有現(xiàn)象、應(yīng)答、反應(yīng)、癥狀。具體的例子如轉(zhuǎn)錄、細(xì)胞游走、細(xì)胞接觸附著、細(xì)胞分裂、神經(jīng)回路興奮、血管收縮、血壓上升、血糖下降、發(fā)熱、痙攣、通過(guò)異種生物以及病毒等寄生物的感染及其他。此外,對(duì)于生物外部的如光和熱等物理性刺激的反應(yīng)也包含在生物學(xué)事件的概念當(dāng)中。
“病態(tài)事件”是包含在“生物學(xué)事件”中的概念。“生物學(xué)事件”超過(guò)了量和質(zhì)上的某一閾值,即可判斷為到了疾病或者病態(tài)的狀態(tài)。例如血壓上升的“生物學(xué)事件”異??哼M(jìn)導(dǎo)致的“病態(tài)事件”就是高血壓或者高血壓癥,血糖不能控制在正常范圍的“病態(tài)事件”即為高血糖或者糖尿病。此外,不僅有與上述例示的單一生物學(xué)事件相關(guān)的病態(tài)事件,還有與多種生物學(xué)事件相關(guān)的病態(tài)事件。
“生物分子”指的是在生物中存在的核酸、蛋白質(zhì)、脂質(zhì)、糖、一般小分子化合物及其它結(jié)構(gòu)的有機(jī)分子以及其集合體,也包括金屬離子、水、質(zhì)子(proton)。
“關(guān)鍵分子”主要指的是在生物分子中,介質(zhì)、激素、神經(jīng)遞質(zhì)、自體有效物質(zhì)等的分子群。已知,在大多數(shù)情況下,在體內(nèi)存在特定的靶標(biāo)生物分子,與該分子之直接結(jié)合是上述“生物學(xué)事件”的導(dǎo)火索。這些分子在生物內(nèi)生成后發(fā)揮作用,一般情況下,從生物系統(tǒng)外部給予時(shí),會(huì)發(fā)生與其量相對(duì)應(yīng)的生物學(xué)事件。具體的例子有腎上腺素、血管緊張素II、胰島素、雌激素等。
“靶標(biāo)生物分子”指的是介質(zhì)、激素、神經(jīng)遞質(zhì)、自體有效物質(zhì)等生物分子以及醫(yī)藥分子的受體這樣的特定分子。通過(guò)直接結(jié)合引發(fā)特定的生物學(xué)事件。
“生物學(xué)事件的波動(dòng)信息”指的是與關(guān)鍵分子或者靶標(biāo)生物分子的量變或者質(zhì)變相對(duì)應(yīng)的生物學(xué)事件的亢進(jìn)、上升或者低下·減少等的信息。也包括當(dāng)關(guān)鍵分子的量超過(guò)一定的閾值時(shí)初次引起的該生物學(xué)事件的情況。
“分子略號(hào)”是以識(shí)別或指定分子為目的的分子名稱(chēng)的代稱(chēng)。它必須與各個(gè)分子單一對(duì)應(yīng)??梢允欠肿用Q(chēng)縮短的略稱(chēng),也可以是和分子名稱(chēng)無(wú)關(guān)的英文數(shù)字以及短的文字。對(duì)于已經(jīng)有在世界上使用的分子略號(hào)的分子,希望仍使用該分子略號(hào)。對(duì)于一個(gè)分子根據(jù)不同的方式可賦予多個(gè)略號(hào)的,可以根據(jù)結(jié)構(gòu)基團(tuán)和功能等進(jìn)行層次化。
“直接結(jié)合”指的是不通過(guò)共價(jià)結(jié)合而是通過(guò)分子間的作用力形成或有可能形成穩(wěn)定的復(fù)合體的情況。有時(shí)會(huì)有少見(jiàn)的以共價(jià)的形式結(jié)合,這種情況也包括在這個(gè)概念中。大多數(shù)情況下稱(chēng)為“相互作用”,相互作用這種稱(chēng)法含有更廣的含義。
“生物分子對(duì)”指的是在生物中能夠直接結(jié)合或推測(cè)為直接結(jié)合的一對(duì)生物分子。具體的例子有雌二醇和雌激素受體、血管緊張素轉(zhuǎn)換酶和血管緊張素I等。在酶反應(yīng)中當(dāng)酶和生成物作為分子對(duì)時(shí),不能認(rèn)為這個(gè)復(fù)合體是穩(wěn)定的,但也包括在生物分子對(duì)中。此外,例如像用雙雜交的試驗(yàn)方法確定有相互作用的這樣的2個(gè)蛋白質(zhì)分子,雖然對(duì)二者的相互作用還不明確,也可以包括在生物分子對(duì)的范疇中。對(duì)于光、聲音、溫度變化、磁場(chǎng)、重力、壓力、振動(dòng)等來(lái)自生物外部的物理化學(xué)刺激,也可以把這些刺激看作假想的生物分子,定義為與相應(yīng)的靶標(biāo)生物分子的生物分子對(duì)。
“結(jié)構(gòu)編碼”指的是生物分子表明DNA類(lèi)、RNA類(lèi)、蛋白質(zhì)類(lèi)、肽類(lèi)、一般小分子類(lèi)等的結(jié)構(gòu)特征的分類(lèi)編碼。
“功能編碼”是表明生物分子的分子水平功能的分類(lèi)編碼。例如“結(jié)構(gòu)編碼”為“蛋白質(zhì)”這樣的生物分子時(shí),表示膜受體、核內(nèi)受體、轉(zhuǎn)運(yùn)蛋白、介質(zhì)、水解酶、磷酸化酶、脫磷酸化酶等分類(lèi)。當(dāng)“結(jié)構(gòu)編碼”為小分子類(lèi)的生物分子時(shí),表示底物、生成物、前體、活性肽、代謝產(chǎn)物等分類(lèi)。
“關(guān)系編碼”指的是表示構(gòu)成生物分子對(duì)的2個(gè)分子間的關(guān)系的分類(lèi)編碼。例如象激動(dòng)劑和受體是10,酶和底物是21,底物和生成物是22這樣進(jìn)行的類(lèi)型化。例如用雙雜交的試驗(yàn)方法確定有相互作用但是對(duì)于2個(gè)分子間的相互作用還不清楚的的2個(gè)蛋白,希望使用能夠區(qū)別該本質(zhì)的編碼。
“關(guān)系功能編碼”是表示和構(gòu)成生物分子對(duì)的2個(gè)分子的直接結(jié)合相伴隨產(chǎn)生的現(xiàn)象和變化的分類(lèi)編碼。例如采用水解、磷酸化、脫磷酸化、活化、失活等分類(lèi)。
“可靠性編碼”是表示每個(gè)生物分子對(duì)直接結(jié)合的可靠性水平和作為直接結(jié)合根據(jù)的實(shí)驗(yàn)方法等的編碼。
“連接檢索”指的是指定1個(gè)以上任意生物分子或者生物學(xué)事件,對(duì)包含其的在功能上或生物合成上相關(guān)分子的關(guān)聯(lián)進(jìn)行自動(dòng)搜索。
“分子功能網(wǎng)絡(luò)”指的是使用生物分子連鎖數(shù)據(jù)庫(kù),指定1個(gè)以上任意的生物分子或者生物學(xué)事件,通過(guò)連接檢索得到的功能上或生物合成上相互關(guān)聯(lián)的分子的關(guān)系網(wǎng)。
“醫(yī)藥分子”指的是作為醫(yī)藥制造的用于治療的化合物分子。包括用于醫(yī)學(xué)、藥學(xué)研究的化合物和專(zhuān)利說(shuō)明書(shū)及文獻(xiàn)所記載的化合物等生理活性已知的化合物。
“生物學(xué)事件信息和賦予關(guān)系”指的是某些生物學(xué)事件發(fā)生時(shí),所呈現(xiàn)或發(fā)現(xiàn)的某些生物分子或者醫(yī)藥分子或遺傳信息或分子功能網(wǎng)的相關(guān)情況。
“模式化”指的是對(duì)生物分子、生物分子對(duì)、生物學(xué)事件等相關(guān)的信息進(jìn)行數(shù)據(jù)庫(kù)記錄時(shí),不是原封不動(dòng)的記錄所得到的信息,而是按照事先規(guī)定的種類(lèi)對(duì)該信息進(jìn)行分類(lèi),用表示該種類(lèi)的記號(hào)表示該信息。上述的“結(jié)構(gòu)編碼”、“功能編碼”、“關(guān)系編碼”、“關(guān)系功能編碼”所舉的例子即為模式化的例子。
“生成臟器”指的是生成生物分子的臟器、組織、臟器或組織內(nèi)的部位、臟器或組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等。
“存在臟器”指的是儲(chǔ)存生成后的生物分子臟器、組織、臟器或組織內(nèi)的部位、臟器或組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等。
“作用臟器”指的是生物分子或關(guān)鍵分子在引發(fā)生物學(xué)事件的臟器、組織、臟器或組織內(nèi)的部位、臟器或組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等。
作為本發(fā)明的1個(gè)實(shí)施方案,提供了以下方法(圖1)。首先,制作儲(chǔ)存有直接結(jié)合的2個(gè)生物分子對(duì)相關(guān)信息的“生物分子連鎖數(shù)據(jù)庫(kù)”。生物分子分子略號(hào)的賦予等、生物分子自身相關(guān)的信息也可以包含在該數(shù)據(jù)庫(kù)中,但最好用別的數(shù)據(jù)庫(kù)-“生物分子信息數(shù)據(jù)庫(kù)”進(jìn)行。接著,從上述的“生物分子連鎖數(shù)據(jù)庫(kù)”中,指定1個(gè)以上任意分子,進(jìn)行連接檢索,由此得到表現(xiàn)1個(gè)以上生物分子的功能上或者生物合成上關(guān)聯(lián)的“分子功能網(wǎng)絡(luò)”。
通過(guò)對(duì)與生物分子對(duì)中,至少是關(guān)鍵分子和它的靶標(biāo)生物分子組成的生物分子對(duì),相對(duì)應(yīng)的生物學(xué)事件的信息賦予關(guān)聯(lián)關(guān)系,與“分子功能網(wǎng)絡(luò)”一起,可以對(duì)分子功能網(wǎng)絡(luò)中的與該分子有直接或間接關(guān)系的生物學(xué)事件進(jìn)行推測(cè)。在此基礎(chǔ)上,補(bǔ)加關(guān)鍵分子的量或者質(zhì)的變動(dòng)和生物學(xué)事件的波動(dòng)關(guān)系的信息,對(duì)分子功能網(wǎng)絡(luò)的任意分子的量或者質(zhì)的變動(dòng)引發(fā)的生物學(xué)事件的亢進(jìn)、上升或者抑制、低下等進(jìn)行推測(cè)。
“生物分子信息數(shù)據(jù)庫(kù)”的主要作用是對(duì)相應(yīng)于各個(gè)生物分子的正式名稱(chēng)的分子略號(hào)或者ID進(jìn)行定義,此外保留生物分子自身的必要信息。例如對(duì)分子名稱(chēng)、分子代號(hào)、結(jié)構(gòu)編碼、功能編碼、生物種類(lèi)、生成臟器、存在臟器等相關(guān)的信息進(jìn)行保存。此外,即使對(duì)試驗(yàn)中尚未分離和確證存在的分子,例如,也可以對(duì)從其他生物種的試驗(yàn)推測(cè)存在的分子給于假定的分子略號(hào)的其他信息,并進(jìn)行定義。
“生物分子信息數(shù)據(jù)庫(kù)”也可以包含和各個(gè)生物分子的氨基酸序列和結(jié)構(gòu)相關(guān)的信息,但最好將該信息在序列數(shù)據(jù)庫(kù)和結(jié)構(gòu)數(shù)據(jù)庫(kù)中另外保存,根據(jù)需要用分子代號(hào)進(jìn)行取用。對(duì)于生物分子中的低分子量物質(zhì),根據(jù)需要為了能在分子功能網(wǎng)絡(luò)的展示中添加物質(zhì)的化學(xué)結(jié)構(gòu),不僅要把正式的分子名稱(chēng),還要把表示化學(xué)結(jié)構(gòu)的相應(yīng)數(shù)據(jù)保存在生物分子信息數(shù)據(jù)庫(kù)或者另外的數(shù)據(jù)庫(kù)中。
2個(gè)以上的生物分子的多聚體或者集合體具有活性或者功能等,將多個(gè)生物分子集中對(duì)待比較方便時(shí),可以將其定義為1個(gè)假想的生物分子,賦以分子略號(hào),在“生物分子信息數(shù)據(jù)庫(kù)”中登記。這種場(chǎng)合,在各種組成分子已知的情況下,也可以分別為其賦以分子略號(hào)進(jìn)行登記,在假想生物分子的記錄中建立記述組成分子的分子略號(hào)文件。在不明由何種生物分子構(gòu)成的情況下,也可以作為集體,對(duì)具有特定功能的假想的生物分子進(jìn)行定義,用于生物分子對(duì)的定義中。
此外,生物分子由2個(gè)以上的結(jié)構(gòu)域組成,并且由于它們各自具有不同的功能,需要對(duì)各個(gè)結(jié)構(gòu)域獨(dú)立對(duì)待更好時(shí),也可以將各個(gè)結(jié)構(gòu)域作為獨(dú)立的分子進(jìn)行處理。例如和原始的生物分子一起,將各個(gè)結(jié)構(gòu)域賦以分子略號(hào),在生物分子信息數(shù)據(jù)庫(kù)中登記。在最初的生物分子記錄中,建立記述分開(kāi)的結(jié)構(gòu)域的分子略號(hào)文件,對(duì)1個(gè)生物分子具有2個(gè)以上不同功能進(jìn)行記述。不是基因的基因組序列上的特定序列,具有某些功能或者可以通過(guò)特定的生物分子識(shí)別時(shí),可以將該序列部分作為獨(dú)立的生物分子對(duì)待,賦以分子略號(hào),用于生物分子對(duì)的定義中。
生物分子對(duì)的信息保存在“生物分子連鎖數(shù)據(jù)庫(kù)”中。每個(gè)生物分子對(duì)收錄了組成該分子對(duì)的2個(gè)生物分子的分子略號(hào)、關(guān)系編碼、關(guān)系功能編碼、可靠性編碼、生物學(xué)事件、作用臟器、共作用分子以及其他附加信息等。對(duì)于關(guān)鍵分子和它的目標(biāo)生物分子的分子對(duì),最好盡量輸入生物學(xué)事件、兩分子的量或者質(zhì)的變動(dòng)引起的生物學(xué)事件波動(dòng)的信息、病態(tài)事件等的信息。對(duì)于關(guān)鍵分子以外的生物分子對(duì),當(dāng)存在與該生物分子對(duì)的表達(dá)直接相關(guān)的生物學(xué)事件或者病態(tài)事件時(shí),要求將該生物學(xué)事件和病態(tài)事件輸入保存。作為關(guān)鍵分子的量或者質(zhì)的變動(dòng)相對(duì)應(yīng)的生物學(xué)事件波動(dòng)信息,可以是例如,和正常范圍相比,當(dāng)關(guān)鍵分子增加時(shí),生物學(xué)事件產(chǎn)生單純的亢進(jìn)或者低下等的信息。1種酶催化2種以上的底物進(jìn)行反應(yīng),分別生成不同的反應(yīng)生成物時(shí),要附加指定酶、底物和反應(yīng)生成物的關(guān)系的表現(xiàn)。
由于“生物分子信息數(shù)據(jù)庫(kù)”和“生物分子連鎖數(shù)據(jù)庫(kù)”的內(nèi)容和組成不同,在本說(shuō)明書(shū)中作為概念上分別獨(dú)立的數(shù)據(jù)庫(kù)對(duì)待。從本發(fā)明的宗旨出發(fā),當(dāng)然也可以將2者合并為1個(gè)含有2種數(shù)據(jù)的數(shù)據(jù)庫(kù)。“生物分子信息數(shù)據(jù)庫(kù)”和“生物分子連鎖數(shù)據(jù)庫(kù)”也可分別2有個(gè)以上,此時(shí),可以根據(jù)各個(gè)數(shù)據(jù)庫(kù)進(jìn)行適當(dāng)?shù)倪x擇或者結(jié)合使用。例如用特定的檔案進(jìn)行區(qū)別,不同生物種數(shù)據(jù)可以同時(shí)保存在“生物分子信息數(shù)據(jù)庫(kù)”和“生物分子連鎖數(shù)據(jù)庫(kù)”中,也可以將人和鼠分別制作不同的數(shù)據(jù)庫(kù)進(jìn)行保存。
“關(guān)系編碼”可以輸入成構(gòu)成該生物分子對(duì)的2個(gè)分子如拮抗劑和受體、酶和底物這樣的單詞。但最好用代表拮抗劑和受體關(guān)系的10,酶和底物關(guān)系的21、酶和生成物關(guān)系的22的方法進(jìn)行類(lèi)型化輸入。此外,“關(guān)系功能編碼”可以方便的采用水解、磷酸化、脫磷酸化、活化、失活等功能分別加以保存的方法,但最好也進(jìn)行類(lèi)型化輸入。
不僅有酶和底物那樣相互關(guān)系明確的情況,也有例如用雙雜交的試驗(yàn)方法證明有蛋白-蛋白相互作用的2個(gè)蛋白分子,二者的相互作用機(jī)制不明確的情況。對(duì)包括這樣的生物分子對(duì)進(jìn)行連接檢索時(shí),根據(jù)組成生物分子對(duì)的2個(gè)分子是否有方向性而區(qū)別對(duì)待比較方便。對(duì)于各個(gè)生物分子對(duì),最好采用能區(qū)別屬于哪種情況的關(guān)系編碼。前者的情況下,對(duì)于作用方向確定的分子對(duì)的表現(xiàn)中,在進(jìn)行檢索時(shí)只要考慮2個(gè)分子的輸入順序,在后者的情況下,檢索時(shí)還要考慮作用方向不明的相反方向的關(guān)系。
直接結(jié)合的生物分子對(duì)信息包括通過(guò)試驗(yàn)明確證明的和假定的生物分子對(duì)等多種情況。此外,通過(guò)試驗(yàn)法,由于存在假陽(yáng)性,也會(huì)產(chǎn)生錯(cuò)誤的生物分子對(duì)。這時(shí),可以附加表示各個(gè)生物分子對(duì)的信息可靠性水平和試驗(yàn)方法的“可靠性編碼”。在檢索生成的分子功能網(wǎng)絡(luò)過(guò)多的情況下,可以組合使用這個(gè)編碼。
生物分子如果除了持有生成臟器的信息以外、還持有儲(chǔ)存生物分子的存在臟器以及作用臟器的信息,那么,生成分子功能網(wǎng)絡(luò)時(shí),例如,很容易表現(xiàn)臟器生成的分子到達(dá)細(xì)胞外部后與其它細(xì)胞膜上的靶標(biāo)生物分子在細(xì)胞外發(fā)生作用的現(xiàn)象。最好將生物分子的生成臟器和存在臟器的信息輸入到“生物分子信息數(shù)據(jù)庫(kù)”中,將作用臟器的信息輸入到“生物分子連鎖數(shù)據(jù)庫(kù)”中。這樣,不必限定于對(duì)生成臟器、存在臟器、作用臟器的記述,也可以包括組織、臟器或者臟器內(nèi)的部位、臟器或者組織內(nèi)的特定細(xì)胞、細(xì)胞內(nèi)的部位等的信息。
證實(shí)直接結(jié)合的試驗(yàn)和推測(cè)的方法、生物學(xué)事件的種類(lèi)、關(guān)鍵分子的量的變動(dòng)相對(duì)應(yīng)的生物學(xué)事件波動(dòng)、細(xì)胞內(nèi)的部位和組織、臟器、臟器內(nèi)的部位的表現(xiàn),只要簡(jiǎn)單,任何一種都可以用。推薦使用進(jìn)行類(lèi)型化、變換成短的英文數(shù)字記號(hào)等方法。如果用同義詞詞典進(jìn)行定義,可以用同義詞同時(shí)進(jìn)行處理,這樣可使輸入的錯(cuò)誤最小化。
以下所示的是由“生物分子連鎖數(shù)據(jù)庫(kù)”生成“分子功能網(wǎng)絡(luò)”時(shí)進(jìn)行“連接檢索”的概念。本發(fā)明的“連接檢索”只要能夠?qū)崿F(xiàn)這個(gè)概念,使用任何方法都可以。例如可以利用Sedgewick的“運(yùn)算法則C(近代科學(xué)社、1996)”的第29章中所記錄的“深入優(yōu)先探索”的運(yùn)算法則等。
用分子略號(hào)a~z表示生物分子,用(n,m)的形式表示由生物分子組成的各個(gè)生物分子對(duì),在生物分子連鎖數(shù)據(jù)庫(kù)中按照下面的表示方法表示生物分子對(duì)的集合。(a,c)(a,g)(b,f)(b,k)(c,j)(c,r)(d,v)(d,y)(e,k)(e,s)(g,u)(j,p)(k,t)(k,y)(p,q)(p,y)(x,z)用連接檢索,例如指定生成含有c和e的分子功能網(wǎng)絡(luò),會(huì)對(duì)共同擁有分子對(duì)中的一個(gè)分子的分子對(duì)(c,j)(j,p)(p,y)(y,k)(k,e)逐個(gè)搜索。得到分子c、j、p、y、k、e關(guān)聯(lián)的c j p y k e分子功能網(wǎng)絡(luò)。
在所得到的“分子功能網(wǎng)絡(luò)”的基礎(chǔ)上,按照下面的方法對(duì)生物學(xué)事件進(jìn)行推測(cè)。生物分子e是關(guān)鍵分子,當(dāng)擁有該生物學(xué)事件E的信息時(shí),能夠推測(cè)生物分子c、j、p、y、k與發(fā)生生物學(xué)事件E的直接或間接關(guān)系。此外,例如當(dāng)分子e減少、產(chǎn)生E的表達(dá)亢進(jìn)的生物學(xué)事件的波動(dòng)信息時(shí),可以對(duì)(c,j)(j,p)(p,y)(y,k)(k,e)的關(guān)系分別加以考慮,推測(cè)c、j、p、y、k中任意分子的量或者質(zhì)的變動(dòng)對(duì)生物學(xué)事件E發(fā)生的影響。
并且,在從某個(gè)生物分子到關(guān)鍵分子的分子功能網(wǎng)絡(luò)中有N個(gè)生物分子,這些生物分子對(duì)生物學(xué)事件發(fā)生量QE的影響可以通過(guò)下面的式子進(jìn)行預(yù)測(cè)。這里的Si是第i個(gè)生物分子的狀態(tài)的質(zhì)的評(píng)價(jià)值,Ri是表示第i個(gè)生物分子的量的值,Vi是表示第i個(gè)生物分子的存在環(huán)境的評(píng)價(jià)值,f是擁有3×N個(gè)輸入值的多價(jià)函數(shù)。
QE=f(S1,R1,V1,...SN,RN,VN)1個(gè)分子功能網(wǎng)絡(luò)所關(guān)聯(lián)的生物學(xué)事件不限定為1種,此外,可以推斷出1種生物分子事件所關(guān)聯(lián)的分子功能網(wǎng)絡(luò)有數(shù)個(gè),可將與生物學(xué)事件的一方面有關(guān)聯(lián)的分子功能網(wǎng)絡(luò)交叉。例如指定1個(gè)以上的生物分子生成“分子功能網(wǎng)絡(luò)”的情況下,生成含有很多生物分子的“分子功能網(wǎng)絡(luò)”時(shí),有可能添加生物學(xué)事件信息,“分子功能網(wǎng)絡(luò)”的范圍有所交叉。當(dāng)然,以任何一個(gè)介質(zhì)分子或和該分子的靶標(biāo)分子的關(guān)系作為條件,也可以生成“分子功能網(wǎng)絡(luò)”。
此外,對(duì)“生物分子連鎖數(shù)據(jù)庫(kù)”的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆指睿蛘咴黾雍Y選程序,或者抽出部分集合,或者進(jìn)行層次化,都能生成必要范圍的分子功能網(wǎng)絡(luò)。分割和增加篩選程序和抽出部分集合可以通過(guò)對(duì)本發(fā)明數(shù)據(jù)庫(kù)特有的數(shù)據(jù)項(xiàng)目的檢索、采用關(guān)鍵詞的一般性文字檢索、相對(duì)于氨基酸序列、或者核酸序列的相同性檢索、化學(xué)結(jié)構(gòu)式的部分結(jié)構(gòu)檢索等檢索方法進(jìn)行。事先對(duì)“生物分子連鎖數(shù)據(jù)庫(kù)”或者“生物分子情報(bào)數(shù)據(jù)庫(kù)”進(jìn)行這些檢索,可以生成加以限定的分子功能網(wǎng)絡(luò)和賦以特征的分子功能網(wǎng)絡(luò)。例如使用生成臟器和作用臟器的信息,從在肝臟生成的生物分子,在皮膚引發(fā)生物學(xué)事件的角度出發(fā),制作交叉的部分?jǐn)?shù)據(jù)庫(kù),采用連接檢索,可以生成限定范圍的“分子功能網(wǎng)絡(luò)”。此外,針對(duì)通過(guò)連接檢索所生成的分子功能網(wǎng)絡(luò),對(duì)其中包含的生物分子或者生物分子對(duì)進(jìn)行上述的檢索,通過(guò)分割、篩選程序和抽出部分集合,又可以生成含有所希望特征的分子功能網(wǎng)絡(luò)和所希望范圍的分子功能網(wǎng)絡(luò)。這樣限定和賦以特征,不僅方便檢索,而且在分子功能網(wǎng)絡(luò)上可以對(duì)特定的生物分子群和生物分子對(duì)進(jìn)行強(qiáng)調(diào)表示,有助于有效地理解分子功能網(wǎng)絡(luò)。
“生物分子連鎖數(shù)據(jù)庫(kù)”的分割、篩選程序和抽出部分集合,可根據(jù)網(wǎng)絡(luò)的關(guān)聯(lián)視情況進(jìn)行,保存并利用表示該包含關(guān)系的信息,可以使“分子功能網(wǎng)絡(luò)”進(jìn)行層次化。即使含有一部分尚未闡明的分子和分子間的關(guān)系,也可以將其整理收集作為1個(gè)假想的生物分子與其他分子作為分子對(duì)進(jìn)行定義,進(jìn)而生成假定的分子功能網(wǎng)絡(luò)。當(dāng)所含的分子數(shù)目過(guò)多,生成的網(wǎng)絡(luò)過(guò)于復(fù)雜時(shí),可以在網(wǎng)絡(luò)上將連接的2個(gè)以上的生物分子群定義為假定的1個(gè)生物分子,實(shí)現(xiàn)網(wǎng)絡(luò)的簡(jiǎn)化。
通過(guò)這樣利用層次化,可以實(shí)現(xiàn)連接檢索的高速化,還可以對(duì)網(wǎng)絡(luò)展示的詳細(xì)程度進(jìn)行調(diào)節(jié),適當(dāng)?shù)幕乇苓^(guò)度復(fù)雜。在本說(shuō)明書(shū)中,把在網(wǎng)絡(luò)上連接的由2個(gè)以上的生物分子對(duì)組成的部分網(wǎng)絡(luò)稱(chēng)為“子網(wǎng)絡(luò)”。
可以指定任意部分的網(wǎng)絡(luò)作為子網(wǎng)絡(luò),優(yōu)選代謝系統(tǒng)中的TCA循環(huán)和磷酸戊糖循環(huán)這樣研究人員所熟知的級(jí)聯(lián)反應(yīng)、途徑、循環(huán)等作為子網(wǎng)絡(luò)更為便利。此外,即使某些子網(wǎng)絡(luò)包含有其他的子網(wǎng)絡(luò)也可以,例如代謝系統(tǒng)自身可以視為是含有多個(gè)子網(wǎng)絡(luò)的上位子網(wǎng)絡(luò)。
也有把各個(gè)子網(wǎng)絡(luò)作為一個(gè)假想生物分子的處理方法,但將與構(gòu)成子網(wǎng)絡(luò)的生物分子對(duì)和子網(wǎng)絡(luò)階層相關(guān)的信息保存在“生物分子連鎖網(wǎng)絡(luò)”中更為方便。此外在“生物分子連鎖網(wǎng)絡(luò)”中建立表示子網(wǎng)絡(luò)的上位數(shù)據(jù)層,也可以在此處對(duì)該子網(wǎng)絡(luò)的信息加以保存。生物分子對(duì)的子網(wǎng)絡(luò)的層次化不限定為2層,將多個(gè)子網(wǎng)絡(luò)的集合保存為上位子網(wǎng)絡(luò)也可以。在生成分子功能網(wǎng)絡(luò)時(shí),為了便于每個(gè)分子對(duì)的數(shù)據(jù)和上位階層的子網(wǎng)絡(luò)之間的相互參照,最好將表示每個(gè)分子對(duì)的數(shù)據(jù)與各個(gè)子網(wǎng)絡(luò)數(shù)據(jù)之間的相互關(guān)聯(lián)的信息進(jìn)行歸納。即使1個(gè)分子對(duì)與多個(gè)子網(wǎng)絡(luò)有關(guān)也沒(méi)有關(guān)系。
優(yōu)選地,層次化的“生物分子連鎖數(shù)據(jù)庫(kù)”的子網(wǎng)絡(luò)數(shù)據(jù)中,不僅要求含有和下位階層的生物分子對(duì)的關(guān)聯(lián),而且還要含有子網(wǎng)絡(luò)間的相互關(guān)聯(lián)的信息。例如在代謝體系中,糖解系統(tǒng)和TCA循環(huán)是連續(xù)作用的子網(wǎng)絡(luò),可以將這些子網(wǎng)絡(luò)間的關(guān)系在上位階層中作為“對(duì)”的關(guān)系保存起來(lái)。這種情況下,優(yōu)選地,不僅要求有子網(wǎng)絡(luò)對(duì)的信息,而且要求添加作為子網(wǎng)絡(luò)間的連接點(diǎn)的生物分子的信息。
此外,本發(fā)明的特征是除網(wǎng)絡(luò)可層次化外,生物分子本身也能層次化,可以將此信息保存在“生物分子信息數(shù)據(jù)庫(kù)”中而加以利用。為了快速檢索和方便多樣地展示網(wǎng)絡(luò),最好將生物分子的信息和生物分子對(duì)的信息雙方都進(jìn)行層次化。把生物分子作為層次化的對(duì)象,舉例如下。在生物分子中,多種不同的分子特異聚集后會(huì)表現(xiàn)出某些功能。很多時(shí)候分子聚集狀態(tài)的差別會(huì)控制功能展現(xiàn)的狀態(tài)和類(lèi)型。此外,以免疫細(xì)胞等為例,有時(shí),細(xì)胞表面表達(dá)的多個(gè)分子的組合,控制著和生物學(xué)事件的關(guān)聯(lián)和細(xì)胞的功能。這種情況下,可以采用將上述的分子集合狀態(tài)假定為1個(gè)假想的生物分子的處理方法。其他的方法還有,為了表示“生物分子信息數(shù)據(jù)庫(kù)”中的分子集合狀態(tài),可以建立上位數(shù)據(jù)層,并將該集合狀態(tài)的信息收集于此。優(yōu)選地,在生成分子功能網(wǎng)絡(luò)時(shí),為了便于生物分子數(shù)據(jù)和上位階層數(shù)據(jù)進(jìn)行相互參照,可以將表示生物分子數(shù)據(jù)和上位階層數(shù)據(jù)關(guān)聯(lián)的信息分別進(jìn)行歸納。即使1個(gè)生物分子和多個(gè)上位階層數(shù)據(jù)相關(guān)也沒(méi)有關(guān)系。
有很多和特定生物分子對(duì)沒(méi)有相互關(guān)聯(lián)的生物學(xué)事件、病態(tài)事件。例如生物學(xué)事件、病態(tài)事件和某些子網(wǎng)絡(luò)的形成之間的關(guān)系已經(jīng)清楚,但該事件的直接的生物分子對(duì)尚有未知的情況。在這樣的情況下,利用上述生物分子對(duì)數(shù)據(jù)的層次化,可以將生物學(xué)事件和病態(tài)事件和生物分子對(duì)的上位階層的子網(wǎng)絡(luò)的數(shù)據(jù)聯(lián)系起來(lái),對(duì)該事件和生物分子網(wǎng)絡(luò)的關(guān)系進(jìn)行記述。
此外,某些生物學(xué)事件、病態(tài)事件的發(fā)生和特定分子的集合狀態(tài)、到達(dá)細(xì)胞表面的特定分子的表達(dá)狀態(tài)相關(guān)的情況下,利用上述分子集合狀態(tài)和分子表達(dá)狀態(tài)的層次化,將生物學(xué)事件、病態(tài)事件和分子集合狀態(tài)以及分子表達(dá)狀態(tài)的階層數(shù)據(jù)聯(lián)系起來(lái),可以對(duì)該事件和生物分子網(wǎng)絡(luò)的關(guān)系進(jìn)行記述。
另外,也存在某些生物學(xué)事件、病態(tài)事件和特定的生物分子對(duì)和子網(wǎng)絡(luò)沒(méi)有任何關(guān)聯(lián)的相關(guān)的情況。作為這樣的例子,炎癥性細(xì)胞因子的游離、白細(xì)胞向組織的浸潤(rùn)、毛細(xì)血管的通透性提高等各種各樣的生物學(xué)事件組合在一起引起了“炎癥”這種病態(tài)事件。為了處理這樣的事件,將生物學(xué)事件、病態(tài)事件層次化,在下位階層中記述與生物分子對(duì)和子網(wǎng)絡(luò)相關(guān)的事件,最好在上位階層中對(duì)與下層事件相關(guān)而引起的事件進(jìn)行記述。這樣的層次化中,即使使用包括2個(gè)層次以上的層次構(gòu)造也沒(méi)有關(guān)系。為了便于各個(gè)階層間的事件進(jìn)行相互參照,最好在各個(gè)階層的事件數(shù)據(jù)中收集表示上下階層的數(shù)據(jù)關(guān)聯(lián)的信息。這樣,通過(guò)對(duì)生物學(xué)事件、病態(tài)事件的信息進(jìn)行層次化,也可以記述對(duì)特定的生物分子對(duì)和子網(wǎng)絡(luò)沒(méi)有直接關(guān)系的事件與分子功能網(wǎng)絡(luò)的關(guān)系。
如上所示,對(duì)“生物分子信息數(shù)據(jù)庫(kù)”以及“生物分子連鎖數(shù)據(jù)庫(kù)”的數(shù)據(jù)進(jìn)行層次化,并且保存起來(lái),可以有效的生成多種用途的分子功能網(wǎng)絡(luò)。
為了對(duì)在糖解體系中存在的某些生物分子(分子A)和某些激酶級(jí)聯(lián)反應(yīng)中存在的某些蛋白(分子B)的關(guān)聯(lián)進(jìn)行研究,采用未層次化數(shù)據(jù)的方法時(shí),必須要以巨大數(shù)目的分子對(duì)為對(duì)象進(jìn)行連接檢索,分子A和分子B之間的路徑很長(zhǎng)的情況下,這種檢索事實(shí)上不可能實(shí)現(xiàn)。一方面,若采用層次化的數(shù)據(jù),對(duì)“糖解系統(tǒng)”這個(gè)子網(wǎng)絡(luò)和“某些激酶級(jí)聯(lián)”這個(gè)子網(wǎng)絡(luò)之間的關(guān)聯(lián)在子網(wǎng)絡(luò)上位階層進(jìn)行連接檢索,在發(fā)現(xiàn)上位階層的路徑時(shí),根據(jù)需要可以在路徑上的各子網(wǎng)絡(luò)的下位階層進(jìn)行連接檢索。這樣一來(lái),通過(guò)把路徑探索問(wèn)題分割成不同階層的問(wèn)題,可以生成在不采用層次化時(shí)不可能生成的分子功能網(wǎng)絡(luò)。
另外,上述利用層次化數(shù)據(jù)進(jìn)行連接檢索中,需要頻繁的參照特定的子網(wǎng)絡(luò)時(shí),可以在該子網(wǎng)絡(luò)內(nèi)部先進(jìn)行連接檢索,將該子網(wǎng)絡(luò)內(nèi)部的分子功能網(wǎng)絡(luò)信息保存下來(lái)。通過(guò)這樣的處理,能夠更有效率的生成完整的分子功能網(wǎng)絡(luò)。
另外,例如生成和“炎癥”這樣的病態(tài)事件相關(guān)的分子功能網(wǎng)絡(luò)時(shí),可以對(duì)“炎癥”上位階層事件相關(guān)的下位階層事件進(jìn)行探索,從該下位階層事件相關(guān)的生物分子對(duì)或者子網(wǎng)絡(luò)出發(fā),進(jìn)行連接檢索,進(jìn)而可以生成包括范圍更廣的分子功能網(wǎng)絡(luò)。
如上所述,根據(jù)本發(fā)明從生物分子間的直接結(jié)合關(guān)系信息出發(fā),可以生成和任意分子相關(guān)的分子功能網(wǎng)絡(luò)。更加容易對(duì)直接或者間接相關(guān)的生物學(xué)事件和病態(tài)事件進(jìn)行推測(cè)。此外,本發(fā)明的另外一方面,從以疾病為特征而表現(xiàn)的生物學(xué)事件和病態(tài)事件、生物分子的量變化等知識(shí)出發(fā),對(duì)和疾病關(guān)聯(lián)可能性高的分子功能網(wǎng)絡(luò)進(jìn)行選擇,將其用于推測(cè)疾病的分子機(jī)制的目的。此外,根據(jù)本發(fā)明,有可能構(gòu)成在特定的疾病和癥狀的治療中,阻斷網(wǎng)絡(luò)的哪個(gè)過(guò)程有效,網(wǎng)絡(luò)中的哪個(gè)分子作為創(chuàng)新性藥物靶點(diǎn)(醫(yī)藥開(kāi)發(fā)中作為標(biāo)靶的蛋白質(zhì)或者其他生物分子)有希望,根據(jù)創(chuàng)新性藥物靶點(diǎn)可以預(yù)想到的副作用有哪些?在回避這些副作用方面用哪種檢測(cè)(assay)體系來(lái)進(jìn)行候選開(kāi)發(fā)藥物的篩選等提供創(chuàng)新藥物的戰(zhàn)略。
醫(yī)藥分子通常在體內(nèi)和以蛋白質(zhì)為主的生物大分子相結(jié)合,通過(guò)調(diào)控其功能發(fā)揮藥理活性。對(duì)這些分子的作用進(jìn)行了比生物分子的作用更為詳細(xì)的研究,在對(duì)象疾病的分子機(jī)理的闡明中起作用。在這里,著眼于將允許制造的用于醫(yī)療的醫(yī)藥分子和藥理學(xué)研究等的藥物分子及其靶標(biāo)生物分子的成對(duì)關(guān)系添加到上述的生物分子以及生物分子間的信息中,由此提高本發(fā)明方法的有用性。靶標(biāo)生物分子在大多數(shù)情況下是被蛋白質(zhì)或者糖等修飾的蛋白質(zhì)。從含有靶標(biāo)生物分子的分子功能網(wǎng)絡(luò)出發(fā)可以對(duì)與副作用有關(guān)的生物學(xué)事件進(jìn)行推測(cè)。根據(jù)與并用的藥物的相關(guān)分子功能網(wǎng)絡(luò)的交叉,有可能對(duì)藥物間的相互作用進(jìn)行推測(cè)。其結(jié)果,有可能對(duì)考慮副作用的風(fēng)險(xiǎn)和藥物間的相互作用風(fēng)險(xiǎn)的藥物進(jìn)行選擇和用量的設(shè)定。
以下對(duì)在本發(fā)明中添加醫(yī)藥分子和靶標(biāo)生物分子對(duì)的關(guān)系的方法舉例說(shuō)明。針對(duì)醫(yī)藥分子的正式名稱(chēng),對(duì)分子略號(hào)進(jìn)行定義,對(duì)該分子相關(guān)的所有信息進(jìn)行收錄,制成“醫(yī)藥分子相信數(shù)據(jù)庫(kù)”。在這里,對(duì)醫(yī)藥分子的名稱(chēng)、分子略號(hào)、適用疾病、用量、靶標(biāo)分子及其它信息進(jìn)行保存。和生物分子信息數(shù)據(jù)庫(kù)的的情況一樣,醫(yī)藥分子的化學(xué)結(jié)構(gòu)、氨基酸序列(肽或蛋白質(zhì)的情況下)、立體結(jié)構(gòu)等的信息包括在“醫(yī)藥分子信息數(shù)據(jù)庫(kù)”中,但最好保存在其它的數(shù)據(jù)庫(kù)中。為了區(qū)別醫(yī)藥分子和生物分子、蛋白質(zhì)和小分子等,可以用結(jié)構(gòu)編碼等進(jìn)行區(qū)別,也可以采用第1個(gè)文字即可以進(jìn)行區(qū)別的分子略號(hào)。并且,參照醫(yī)藥的附加說(shuō)明書(shū)和其他文獻(xiàn),輸入藥物的顯著副作用、和其它藥物的相互作用、代謝酶的情況等,有助于根據(jù)分子功能網(wǎng)絡(luò),對(duì)和基因多型有關(guān)的藥物進(jìn)行適當(dāng)?shù)倪x擇。
進(jìn)一步,作成含有醫(yī)藥分子和靶標(biāo)蛋白質(zhì)對(duì)之間的關(guān)系的信息的數(shù)據(jù)庫(kù)“醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)”,保存醫(yī)藥分子的分子略號(hào)、靶標(biāo)生物分子的分子略號(hào)、關(guān)系編碼、藥理作用、適用疾病以及其他信息。對(duì)于靶標(biāo)生物分子的分子略號(hào),必須采用在生物分子信息數(shù)據(jù)庫(kù)中定義的分子略號(hào)。對(duì)于關(guān)系編碼等生物分子連鎖數(shù)據(jù)庫(kù)共同的數(shù)據(jù)項(xiàng)目,可以按照生物分子連鎖數(shù)據(jù)庫(kù)的標(biāo)記方法使用。
制作“醫(yī)藥分子信息數(shù)據(jù)庫(kù)”和“醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)”,通過(guò)摘取醫(yī)藥分子以及醫(yī)藥分子對(duì)的信息,可以按照?qǐng)D2所示對(duì)本發(fā)明的方法進(jìn)行擴(kuò)充。這里通過(guò)連接檢索,生成分子功能網(wǎng)絡(luò)和推測(cè)生物學(xué)事件等,采用上述只用生物分子連鎖數(shù)據(jù)庫(kù)和生物分子信息數(shù)據(jù)庫(kù)情況下相同的方法進(jìn)行,能夠同時(shí)得到以該網(wǎng)絡(luò)上的分子作為靶標(biāo)的現(xiàn)有醫(yī)藥分子的信息。此外,可以從只用生物分子連鎖數(shù)據(jù)庫(kù)和生物分子信息數(shù)據(jù)庫(kù)就作成的分子功能網(wǎng)絡(luò)中,抽取和指定醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò),有目的的加以利用。
一方面,以人類(lèi)基因組分析為主的從多個(gè)角度對(duì)遺傳信息的分析正在迅速進(jìn)展。基因組范圍內(nèi)的cDNA分離、orf(open reading frame,可讀框)和基因序列的闡明不斷深入,各個(gè)基因在基因組上的定位也在進(jìn)行。這里,作為本發(fā)明的另一方案,可以制成對(duì)生物分子中的蛋白質(zhì)分子略號(hào)和編碼該蛋白質(zhì)基因的名稱(chēng)、略稱(chēng)、ID及其他信息賦以關(guān)聯(lián)的生物分子基因數(shù)據(jù)庫(kù),并如下所示對(duì)本發(fā)明的方法進(jìn)行擴(kuò)充。即,根據(jù)基因和生物分子的對(duì)應(yīng)關(guān)系,可以從分子功能網(wǎng)絡(luò)上的分子以及生物學(xué)事件關(guān)聯(lián)的方面,對(duì)疾病標(biāo)記基因和蛋白所含的意義、疾病和基因多型的關(guān)系等知識(shí)進(jìn)行理解。最好在生物分子-基因數(shù)據(jù)庫(kù)中,在含有生物種、基因組上的位置、基因序列、功能以外、還含有基因多型的氨基酸變異和略稱(chēng)、功能的關(guān)聯(lián)等信息,根據(jù)需要可以生成2個(gè)以上的數(shù)據(jù)庫(kù)。
根據(jù)在基因組序列上定位的基因名稱(chēng)和基因的排列,明確了通過(guò)特定的關(guān)鍵分子作用于核內(nèi)受體而轉(zhuǎn)錄產(chǎn)生的蛋白,有可能將生物分子間相互調(diào)控的關(guān)系反映到分子功能網(wǎng)絡(luò)中。此外,已經(jīng)知道臟器所表達(dá)的基因和蛋白是不同的,根據(jù)本發(fā)明的方法,將這些表達(dá)信息收取到“生物分子信息數(shù)據(jù)庫(kù)”中,可以生成各個(gè)臟器不同的“分子功能網(wǎng)絡(luò)”。例如可以對(duì)在不同的臟器中的以核內(nèi)受體為靶標(biāo)的醫(yī)藥分子的作用有差異或相反的現(xiàn)象進(jìn)行說(shuō)明。此外,已經(jīng)知道,使用醫(yī)藥分子的情況下,蛋白表達(dá)發(fā)生變化的事實(shí),根據(jù)本發(fā)明的方法,可以在與靶標(biāo)生物分子相關(guān)的分子功能網(wǎng)絡(luò)上對(duì)每個(gè)表達(dá)蛋白量的增減進(jìn)行解釋?zhuān)瑢?duì)考慮到基因的多型性的藥物的選擇很有用處。
在保存上述的基因轉(zhuǎn)錄和蛋白表達(dá)的信息時(shí),也可以利用層次化的概念,生成更有效并且范圍廣的分子功能網(wǎng)絡(luò)。例如針對(duì)通過(guò)特定的核內(nèi)受體而轉(zhuǎn)錄、表達(dá)的多個(gè)基因、蛋白質(zhì),在“生物分子信息數(shù)據(jù)庫(kù)”中設(shè)定表示基因群的轉(zhuǎn)錄、蛋白群的表達(dá)的上位階層,并將該基因群、該蛋白群的數(shù)據(jù)保存于此即可。在存在該基因群的轉(zhuǎn)錄和該蛋白群的表達(dá)相關(guān)的生物學(xué)事件、病態(tài)事件的情況下,通過(guò)在“生物分子連鎖數(shù)據(jù)庫(kù)”中記錄該基因群和該蛋白群的上層階層數(shù)據(jù)和該事件的關(guān)聯(lián)關(guān)系,可以生成不表示每個(gè)基因、分子和該事件之間的關(guān)聯(lián)的分子功能網(wǎng)絡(luò)。
在上述的基因轉(zhuǎn)錄和蛋白表達(dá)的信息層次化保存方法中,當(dāng)對(duì)該基因群的每個(gè)基因或者該蛋白群的每個(gè)蛋白的轉(zhuǎn)錄或者表達(dá)的量的信息清楚的情況下,將這些信息都作為數(shù)值參數(shù)在“生物分子信息數(shù)據(jù)庫(kù)”中保存即可。通過(guò)利用這些數(shù)值參數(shù),根據(jù)每個(gè)基因的轉(zhuǎn)錄量或者每個(gè)蛋白的表達(dá)量的差異,可以對(duì)相關(guān)的生物學(xué)事件、病態(tài)事件的變化情況進(jìn)行記錄。
此外,隨著對(duì)基因組和基因的個(gè)體多樣性的闡明不斷進(jìn)展,通過(guò)將這些信息和本發(fā)明的方法進(jìn)行連接,可以推動(dòng)對(duì)個(gè)體差異的理解,使建立在個(gè)體差異上的治療成為可能。對(duì)于特定的生物分子(蛋白質(zhì))的功能受到損害的基因多型,通過(guò)在分子功能網(wǎng)絡(luò)上進(jìn)行說(shuō)明,可以推測(cè)對(duì)生物學(xué)事件的影響。將由于1個(gè)基因的缺損或者異常引發(fā)的遺傳性疾病的癥狀,以及生物學(xué)事件異常的信息與本發(fā)明的方法連接,也有助于對(duì)其的理解。
據(jù)報(bào)道,在幾個(gè)有代表性的疾病中,存在有各個(gè)疾病的患者中高頻出現(xiàn)的多個(gè)基因、疾病背景基因。假定實(shí)際上存在易患特定疾病相關(guān)的遺傳體質(zhì)的情況下,例如與血壓調(diào)節(jié)相關(guān)的分子功能網(wǎng)絡(luò)有2個(gè)以上,因其中任何一個(gè)網(wǎng)絡(luò)中的任何分子異常,出現(xiàn)相當(dāng)數(shù)量的高血壓背景的基因,也是可以理解。為了解釋這樣的多基因問(wèn)題,本發(fā)明的方法是不可缺少的。
此外,近年來(lái),小鼠、大鼠等動(dòng)物的基因組和基因的分析工作迅速進(jìn)展,并且對(duì)人的基因組和基因進(jìn)行了對(duì)應(yīng)關(guān)聯(lián)工作。雖然認(rèn)為這些動(dòng)物的和人的生理功能調(diào)節(jié)相關(guān)的蛋白具有相當(dāng)大的相似性,但是由于存在相當(dāng)大的差異,妨礙了醫(yī)藥開(kāi)發(fā)。在已知這些動(dòng)物和人之間蛋白和蛋白功能存在很大的差異的情況下,通過(guò)與本方法連接,可以搞清楚和人的分子功能網(wǎng)絡(luò)的差異,繼而有助于醫(yī)藥開(kāi)發(fā)。而且,一般,對(duì)于開(kāi)發(fā)用于人的醫(yī)藥轉(zhuǎn)用到動(dòng)物的很多藥物,可以根據(jù)恰當(dāng)?shù)哪康倪M(jìn)行使用。
在醫(yī)藥開(kāi)發(fā)中,存在有和人的疾病以及病態(tài)相似的病態(tài)動(dòng)物。以這種動(dòng)物的藥理活性作為指標(biāo)進(jìn)行開(kāi)發(fā)的情況很多。這樣的病態(tài)動(dòng)物的基因研究也不斷深入,根據(jù)本發(fā)明的方法,可以和人的遺傳信息進(jìn)行對(duì)照,有助于對(duì)人的這種疾病的機(jī)理進(jìn)行解釋。
并且,為了明確基因功能,大多數(shù)是采用作成特定基因受到破壞的基因敲除動(dòng)物和基因功能變?nèi)?、基因過(guò)度表達(dá)的轉(zhuǎn)基因動(dòng)物的方法。據(jù)說(shuō)這些動(dòng)物,很多時(shí)候會(huì)由于產(chǎn)生致死性而無(wú)法出生或者對(duì)生理功能和行動(dòng)看不出任何影響的情況,對(duì)出生的動(dòng)物觀(guān)察其有何異常時(shí),這些動(dòng)物試驗(yàn)的結(jié)果分析也非常困難。在這樣的試驗(yàn)中,使用本發(fā)明的方法,因可以對(duì)該基因操作的影響進(jìn)行預(yù)測(cè),而便于功能的分析。
基因相關(guān)信息和分析的進(jìn)展一起推動(dòng)從序列ID角度進(jìn)行統(tǒng)一的嘗試,并且推動(dòng)了在基因組的序列上對(duì)基因進(jìn)行定位的嘗試。也有人認(rèn)為考慮到和上述的“生物分子連鎖數(shù)據(jù)庫(kù)”的聯(lián)合關(guān)系,構(gòu)筑獨(dú)立的遺傳信息數(shù)據(jù)庫(kù),可以用于上述目的,但考慮到這項(xiàng)信息量的擴(kuò)充和公開(kāi)的方向,可以根據(jù)本發(fā)明的方法隨時(shí)將將來(lái)公開(kāi)的信息收錄進(jìn)來(lái),上述方法的實(shí)施可行性很高(圖3)。
采用本發(fā)明方法的生物分子連鎖數(shù)據(jù)庫(kù),并非一定需要在同一個(gè)場(chǎng)所管理、保存,可以根據(jù)統(tǒng)一分子略號(hào),對(duì)在不同場(chǎng)所管理、保存的1個(gè)以上的生物分子連鎖數(shù)據(jù)庫(kù),適當(dāng)選擇,以通信手段,使之接續(xù)使用。不僅是生物分子連鎖數(shù)據(jù)庫(kù),使用本發(fā)明的方法的生物分子信息數(shù)據(jù)庫(kù)、醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)、醫(yī)藥分子信息數(shù)據(jù)庫(kù)、遺傳信息數(shù)據(jù)庫(kù)也可以采用同樣的處理方法。
作為本發(fā)明的實(shí)施的其他方案,提供了制作含有生物學(xué)事件發(fā)生直接相關(guān)的生物分子和該生物學(xué)事件的信息的數(shù)據(jù)庫(kù)(生物學(xué)事件-生物分子數(shù)據(jù)庫(kù)),并和不一定含有生物學(xué)事件信息的分子網(wǎng)絡(luò)數(shù)據(jù)庫(kù)并用的方法。其他方案還有,提供了一種方法,該方法從不一定含有生物學(xué)事件信息的分子網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中,抽出與任意分子相關(guān)的部分分子網(wǎng)絡(luò),基于構(gòu)成該網(wǎng)絡(luò)的分子,對(duì)上述生物學(xué)事件生物分子數(shù)據(jù)庫(kù)進(jìn)行檢索。
本發(fā)明的實(shí)施的其他方案還有,針對(duì)“生物分子信息數(shù)據(jù)庫(kù)”、“生物連鎖數(shù)據(jù)庫(kù)”、“醫(yī)藥分子信息數(shù)據(jù)庫(kù)”、“醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)”、“生物分子-基因數(shù)據(jù)庫(kù)”等各個(gè)數(shù)據(jù)項(xiàng)目,進(jìn)行關(guān)鍵詞、數(shù)值參數(shù)、分子結(jié)構(gòu)、氨基酸序列、堿基序列等的檢索。提供基于該檢索結(jié)果生成分子功能網(wǎng)絡(luò)的方法。以下,舉出基于檢索生成分子功能網(wǎng)絡(luò)的例子進(jìn)行悅明,不過(guò)本發(fā)明的范圍并不僅僅限于例子中。
在各個(gè)數(shù)據(jù)庫(kù)中,分子名稱(chēng)、分子略號(hào)、生物種類(lèi)、生成臟器、存在臟器等各種信息以文本的形式保存。針對(duì)這些文本,基于文字序列完全一致、部分一致進(jìn)行檢索,可以得到交叉的生物分子、生物分子對(duì)、生物學(xué)事件、病態(tài)事件、醫(yī)藥分子、醫(yī)藥分子-生物分子對(duì)、基因-蛋白的相應(yīng)數(shù)據(jù)?;谶@些交叉的信息,對(duì)連接檢索的起點(diǎn)和終點(diǎn)進(jìn)行設(shè)定,利用連接檢索,可以縮小作為對(duì)象的分子對(duì)的范圍,有可能生成符合使用目的的分子功能網(wǎng)絡(luò)。
對(duì)“醫(yī)藥分子信息數(shù)據(jù)庫(kù)”中的醫(yī)藥分子的化學(xué)機(jī)構(gòu)、立體結(jié)構(gòu)進(jìn)行保存時(shí),通過(guò)基于與這些相對(duì)應(yīng)的全部結(jié)構(gòu)一致、部分結(jié)構(gòu)一致、結(jié)構(gòu)相似性等進(jìn)行檢索,可以得到交叉的醫(yī)藥分子數(shù)據(jù)。基于交叉的醫(yī)藥分子,生成與該醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò)??梢詫?duì)該醫(yī)藥分子相關(guān)的生物學(xué)事件、病態(tài)事件進(jìn)行檢索。
在“生物分子信息數(shù)據(jù)庫(kù)”中,保存基因轉(zhuǎn)錄、蛋白表達(dá)等的數(shù)值參數(shù)時(shí),基于這項(xiàng)數(shù)值參數(shù)進(jìn)行檢索,根據(jù)基因的轉(zhuǎn)錄量、蛋白表達(dá)量可以生成相應(yīng)的分子功能網(wǎng)絡(luò)。
將蛋白氨基酸序列保存到“生物分子信息數(shù)據(jù)”或相關(guān)聯(lián)的數(shù)據(jù)庫(kù)中時(shí),基于相對(duì)于這些氨基酸序列的同源性和部分序列類(lèi)型的一致性進(jìn)行檢索,可使生物分子交叉而能生成基于該生物分子的分子功能網(wǎng)絡(luò)。對(duì)于功能未知的蛋白質(zhì)及其部分序列信息,這個(gè)方法可以對(duì)與該蛋白質(zhì)相關(guān)的可能性高的分子功能網(wǎng)絡(luò)進(jìn)行推測(cè),進(jìn)一步還可以推測(cè)該蛋白的功能。
將蛋白相對(duì)應(yīng)的基因的堿基序列保存到“生物分子信息數(shù)據(jù)庫(kù)”、“生物分子-基因數(shù)據(jù)庫(kù)”或關(guān)連數(shù)據(jù)庫(kù)中時(shí),基于與這些堿基序列相對(duì)應(yīng)的序列同源性和部分序列類(lèi)型的一致性進(jìn)行檢索,可使生物分子交叉,繼而生成有關(guān)該生物分子的分子功能網(wǎng)絡(luò)。對(duì)于功能未知的基因及其部分的序列信息,用這個(gè)方法,可以對(duì)與該基因翻譯得到的蛋白相關(guān)的可能性高的分子功能網(wǎng)絡(luò)進(jìn)行推測(cè),進(jìn)一步還可以有效推測(cè)該蛋白的功能。
實(shí)施本發(fā)明的其他方案包括,提供了為了實(shí)施本發(fā)明的方法的由程序和數(shù)據(jù)庫(kù)組成的計(jì)算機(jī)系統(tǒng)、記錄為了實(shí)施本發(fā)明的方法的程序和數(shù)據(jù)的計(jì)算機(jī)可以讀取的媒體、記錄為了在本發(fā)明的方法中使用的數(shù)據(jù)庫(kù)的計(jì)算機(jī)可以讀取的媒體、記錄根據(jù)本發(fā)明的方法生成的分子功能網(wǎng)絡(luò)相關(guān)的信息的計(jì)算機(jī)可以讀取的媒體等等。
總結(jié)本發(fā)明的方法的特征,如下所示-包括生物學(xué)事件信息、通過(guò)儲(chǔ)存直接結(jié)合生物分子對(duì)的信息,做成生物內(nèi)的分子間的相關(guān)數(shù)據(jù)庫(kù)。
-由部分集合的上述數(shù)據(jù)庫(kù)中進(jìn)行連接檢索,作成與任意的生物分子以及生物學(xué)事件相關(guān)的分子功能網(wǎng)絡(luò)。
-基于分子功能網(wǎng)絡(luò),對(duì)任意的分子直接間接相關(guān)的生物學(xué)事件進(jìn)行推測(cè)。
-從帶有生物學(xué)事件信息的分子功能網(wǎng)絡(luò),對(duì)疾病的機(jī)理、可能的創(chuàng)新藥物作用的靶點(diǎn)、副作用風(fēng)險(xiǎn)等進(jìn)行推測(cè)。
-從生物分子的量或者質(zhì)的變動(dòng)中對(duì)生物學(xué)事件的波動(dòng)進(jìn)行推測(cè)。
-含有生物分子的生成臟器、存在臟器以及作用臟器的信息的分子功能網(wǎng)絡(luò)。
-使用醫(yī)藥分子信息和分子功能網(wǎng)絡(luò)對(duì)副作用、藥物之間的相互作用進(jìn)行推測(cè)。
-在分子功能網(wǎng)絡(luò)上對(duì)由于使用醫(yī)藥分子導(dǎo)致的蛋白表達(dá)的變化進(jìn)行解釋。
-根據(jù)和遺傳信息的連接對(duì)基因多型對(duì)分子功能網(wǎng)絡(luò)的影響、疾病背景基因等進(jìn)行分析。
第7圖所示是以生物分子之一的“血管緊張素I”和生物學(xué)事件之一的“血壓上升”作為問(wèn)題提出而生成的分子功能網(wǎng)絡(luò)。在生物分子連鎖數(shù)據(jù)庫(kù)中進(jìn)行連接檢索,得到了從“血管緊張素I”到“血壓上升”的相關(guān)生物分子,并且據(jù)此制作成分子功能網(wǎng)絡(luò)。
此外,制作具有血壓下降作用的醫(yī)藥分子相關(guān)的醫(yī)藥分子信息數(shù)據(jù)庫(kù)(第8圖)和醫(yī)藥分子連鎖數(shù)據(jù)庫(kù)(第9圖),將其與生物分子信息數(shù)據(jù)庫(kù)(第5圖)以及生物分子連鎖數(shù)據(jù)庫(kù)(第6圖)并用,進(jìn)行醫(yī)藥分子相關(guān)的分子功能網(wǎng)絡(luò)生成的嘗試。
第10圖表示的是的以一種醫(yī)藥分子依那普利和“血壓上升”這個(gè)生物學(xué)事件作為問(wèn)題提出而生成的分子功能網(wǎng)絡(luò)。因?yàn)橐滥瞧绽麑?duì)與其直接結(jié)合的血管緊張素轉(zhuǎn)換酶有阻礙關(guān)系,故而阻斷了和血管緊張素轉(zhuǎn)換酶有直接結(jié)合關(guān)系(酶-底物關(guān)系)的血管緊張素II的連鎖關(guān)系,所以表現(xiàn)出其下游的、網(wǎng)絡(luò)上存在的“血壓上升”事件被抑制(停止)。
本程序由以下步驟組成為了得到進(jìn)行連接檢索所必須的分子名、子網(wǎng)絡(luò)以及生物學(xué)事件名等進(jìn)行的檢索1101~1103步;進(jìn)行連接檢索、表示分子功能網(wǎng)絡(luò)的1104~1108步;以及對(duì)生成的分子功能網(wǎng)絡(luò)進(jìn)行再處理而添加的1109~1110步。
使用者首先在1101步驟中指定與分子名、分子略號(hào)、子網(wǎng)絡(luò)名、生物學(xué)事件名、病態(tài)事件名、疾病名、氨基酸序列、核酸堿基序列、外部數(shù)據(jù)庫(kù)ID、醫(yī)藥分子結(jié)構(gòu)等相關(guān)的檢索方法,輸入提問(wèn)的文字。作為檢索方法,使用者可選擇使用針對(duì)上述項(xiàng)目進(jìn)行個(gè)別檢索的方法,和針對(duì)多個(gè)項(xiàng)目的采用共同的提問(wèn)文字列進(jìn)行檢索的方法等。提問(wèn)文字,也可以不是和數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)目完全一致的文字,也可以是含有表示名字的一部分的文字和所謂通配符文字等的文字。當(dāng)指定蛋白質(zhì)的氨基酸序列或者核酸堿基序列為檢索項(xiàng)目時(shí),作為提問(wèn)文字,使用者可以輸入表示氨基酸序列或者堿基序列的文字代碼(例丙氨酸=A、甘氨酸=G、鳥(niǎo)嘌呤=g、胞嘧啶=c等)的文字。指定醫(yī)藥分子結(jié)構(gòu)為檢索項(xiàng)目時(shí),使用者可以輸入以MOLFILE形式表現(xiàn)提問(wèn)分子結(jié)構(gòu)的數(shù)據(jù)。
對(duì)于使用者輸入的檢索項(xiàng)目,程序在步驟1102中對(duì)生物分子信息數(shù)據(jù)庫(kù)、生物分子連鎖數(shù)據(jù)庫(kù)以及相關(guān)的數(shù)據(jù)庫(kù)的數(shù)據(jù)項(xiàng)目,通過(guò)關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、序列檢索等方法進(jìn)行檢索。關(guān)鍵詞檢索不僅允許文字列完全一致、還允許和文字列部分一致,和按照通配符與多個(gè)文字列相一致。步驟1101中,當(dāng)指定氨基酸序列或者堿基序列為檢索項(xiàng)目時(shí),程序針對(duì)生物分子信息數(shù)據(jù)庫(kù)以及相關(guān)的序列數(shù)據(jù)庫(kù)中的氨基酸序列、堿基序列,根據(jù)和提問(wèn)文字列(序列)的一致程度和相同性進(jìn)行檢索,給出一致度和相同性高的序列的ID或者相對(duì)應(yīng)的分子名作為檢索結(jié)果。當(dāng)指定醫(yī)藥分子結(jié)構(gòu)為提問(wèn)項(xiàng)目時(shí),程序根據(jù)部分結(jié)構(gòu)匹配(マッチンク)的方法對(duì)部分結(jié)構(gòu)一致或者類(lèi)似的醫(yī)藥分子進(jìn)行檢索,給出相應(yīng)的醫(yī)藥分子名作為檢索結(jié)果。
在步驟1102中檢索得到的命中(ヒット)項(xiàng)目在步驟1103中用列表的形式表示。程序根據(jù)對(duì)列表中的位置進(jìn)行區(qū)分的方法和賦予圖標(biāo)(アイコン)的方法等區(qū)別表示列表中的各個(gè)命中項(xiàng)目、分子名、子網(wǎng)絡(luò)、生物學(xué)事件名的每個(gè)相應(yīng)的位置。
其次,使用者在步驟1104中指定連接檢索方法和作為檢索端點(diǎn)的分子名、子網(wǎng)絡(luò)名以及生物分子事件名(包括病態(tài)事件)。在本實(shí)施例中,提供指定1點(diǎn),并對(duì)其周邊相關(guān)的網(wǎng)絡(luò)進(jìn)行檢索的方法和指定2點(diǎn)檢索聯(lián)系二者的網(wǎng)絡(luò)的檢索方法。在第12圖和第13圖中分別表示了這2個(gè)檢索方法所必須輸入的項(xiàng)目。使用者根據(jù)從步驟1103所示的列表中選擇適當(dāng)?shù)捻?xiàng)目,輸入分子名、子網(wǎng)絡(luò)名以及生物學(xué)事件名。當(dāng)列表中沒(méi)有適合的項(xiàng)目時(shí),使用者可以返回到步驟1101重新輸入檢索項(xiàng)目,重復(fù)從步驟1101到1103步驟的檢索步驟,直到找到適合的項(xiàng)目為止。
在步驟1105中,使用者輸入連接檢索的限定條件。限定條件可以指定生成的分子功能網(wǎng)絡(luò)中所含的分子數(shù)的上限和在2點(diǎn)間檢索時(shí)該2點(diǎn)間的相關(guān)數(shù)(路徑數(shù))的上限。在步驟1106中,使用者指定檢索得到的分子功能網(wǎng)絡(luò)的表示方法。表示方法可以選擇如對(duì)組成網(wǎng)絡(luò)的全部分子進(jìn)行明示的方法(分子網(wǎng)絡(luò)表示法),和將所屬分子在子網(wǎng)絡(luò)中進(jìn)行歸納,使之成為一個(gè)節(jié)點(diǎn)的表示方法(子網(wǎng)絡(luò)表示法)等,使用者可以從多種方法中進(jìn)行選擇。
根據(jù)從步驟1104到步驟1105指定的條件,程序在步驟1107對(duì)生物分子連鎖數(shù)據(jù)庫(kù)進(jìn)行連接檢索。檢索得到的分子功能網(wǎng)絡(luò),使用者根據(jù)在步驟1106中指定的表示方法,在步驟1108中表示為含有分子、子網(wǎng)絡(luò)或者生物學(xué)事件作為節(jié)點(diǎn)的組。
使用者在對(duì)步驟1108中所展示的分子功能網(wǎng)絡(luò)進(jìn)行視覺(jué)檢測(cè)時(shí),根據(jù)需要有時(shí)可返回到1104變更連接檢索的條件,反復(fù)檢索,有時(shí)也可返回到步驟1101,重復(fù)進(jìn)行分子名、子網(wǎng)絡(luò)以及生物學(xué)事件名的檢索。
此外,根據(jù)本程序中附加的步驟1109以及步驟1110,可以對(duì)生成的分子功能網(wǎng)絡(luò)進(jìn)行再次處理。在步驟1109中,使用者可以進(jìn)行多個(gè)分子功能網(wǎng)絡(luò)間的理論計(jì)算。為了實(shí)施步驟1109,將進(jìn)行到步驟1108的步驟反復(fù)進(jìn)行多次是生成多個(gè)分子功能網(wǎng)絡(luò)所必須的。針對(duì)這些多個(gè)分子功能網(wǎng)絡(luò),程序可以求得網(wǎng)絡(luò)間的共同部分(AND演算)和非共同部分(XOR演算),或者得到多個(gè)網(wǎng)絡(luò)的總的集合(OR演算)。這個(gè)功能對(duì)于調(diào)查不同的生物種和臟器間的分子功能網(wǎng)絡(luò)的差異等有用。
步驟1110中,便用者針對(duì)生成的分子功能網(wǎng)絡(luò),再次進(jìn)行交叉檢索,對(duì)該分子功能網(wǎng)絡(luò)中的分子和部分網(wǎng)絡(luò)可以強(qiáng)調(diào)表示,或者抽出來(lái)表示。這種交叉檢索可以用在步驟1101~1103的任何一步所用的方法中。根據(jù)步驟1110,例如對(duì)于在特定的臟器表達(dá)的生物分子,可以在分子功能網(wǎng)絡(luò)中強(qiáng)調(diào)表示,或者從范圍廣泛的分子功能網(wǎng)絡(luò)中只抽出屬于指定的子網(wǎng)絡(luò)的進(jìn)行表示。
產(chǎn)業(yè)上利用的可能性作為包含有生物學(xué)事件的生物分子對(duì)信息的集合,本發(fā)明的生物分子連鎖數(shù)據(jù)庫(kù),通過(guò)檢索生成該分子間在必要范圍內(nèi)的功能上或者生物合成上有關(guān)聯(lián)的分子功能網(wǎng)絡(luò),可用于對(duì)與任意生物分子的表達(dá)有直接或者間接關(guān)系的生物學(xué)事件進(jìn)行推測(cè),此外,通過(guò)與醫(yī)藥分子的信息以及遺傳信息相連接,能夠得到基于新藥開(kāi)發(fā)和個(gè)體差異的醫(yī)療上必要的知識(shí)。
權(quán)利要求
1.生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò)的方法,包括使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),進(jìn)行連接檢索。
2.推測(cè)方法,包括使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),進(jìn)行連接檢索,生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò),對(duì)該網(wǎng)絡(luò)中的任意的生物分子和任意的生物學(xué)事件之間的路徑進(jìn)行推測(cè)。
3.推測(cè)方法,包括使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),進(jìn)行連接檢索,生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò),對(duì)該網(wǎng)絡(luò)中的任意的生物分子相關(guān)的生物學(xué)事件進(jìn)行推測(cè)。
4.生成分子功能網(wǎng)絡(luò)的方法,包括使用對(duì)生物分子對(duì)的信息層次化并保存的生物分子連鎖數(shù)據(jù)庫(kù),進(jìn)行連接檢索。
5.權(quán)利要求1~3中任意一項(xiàng)的方法,其特征在于將生物分子對(duì)的信息進(jìn)行層次化并保存在生物分子連鎖數(shù)據(jù)庫(kù)中。
6.權(quán)利要求1~5中任意一項(xiàng)的方法,其特征在于使用層次化保存生物分子和/或生物學(xué)事件信息的數(shù)據(jù)庫(kù)。
7.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于針對(duì)數(shù)據(jù)庫(kù)中的項(xiàng)目,采用關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、以及序列相同性檢索中的任何1種或者2種以上并用進(jìn)行檢索。
8.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于通過(guò)針對(duì)數(shù)據(jù)庫(kù)中的項(xiàng)目,采用關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、以及序列相同性檢索中的任意一種或者2種以上進(jìn)行檢索,將用于連接檢索的數(shù)據(jù)交叉,生成限定的分子功能網(wǎng)絡(luò)。
9.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于針對(duì)生成的分子功能網(wǎng)絡(luò),再次進(jìn)行關(guān)鍵詞檢索、分子結(jié)構(gòu)檢索、序列相同性檢索中的任何1種或者2種以上方法并用,生成該網(wǎng)絡(luò)的部分網(wǎng)絡(luò)。
10.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于在生物學(xué)事件的信息中含有與關(guān)鍵分子的量或者質(zhì)的變化相對(duì)應(yīng)的波動(dòng)信息。
11.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于在生物學(xué)事件中含有與疾病相關(guān)的病名、病態(tài)、診斷基準(zhǔn)以及治療藥物等信息中的任何1種或2種以上的信息。
12.權(quán)利要求1到6中任意一項(xiàng)的方法,其特征在于合并使用將特定的生物分子作為靶標(biāo)的醫(yī)藥分子的信息。
13.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于合并使用生物分子和基因的對(duì)應(yīng)關(guān)系的信息。
14.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于合并使用每種臟器的蛋白的表達(dá)信息和/或者基因表達(dá)信息。
15.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于生物分子與基因多型相關(guān)的基因信息相連接。
16.權(quán)利要求1~6中任意一項(xiàng)的方法,其特征在于合并使用在特定的關(guān)鍵分子中表達(dá)被調(diào)控的基因或者蛋白質(zhì)的信息。
17.推測(cè)醫(yī)藥分子副作用的方法,其特征在于采用權(quán)利要求12的方法。
18.推測(cè)新藥靶點(diǎn)的方法,其特征在于使用權(quán)利要求1~16中任意一項(xiàng)的方法。
19.推測(cè)以特定的生物分子作為創(chuàng)新藥物靶點(diǎn)時(shí)的副作用風(fēng)險(xiǎn)的方法,其特征在于使用權(quán)利要求1~16中任意一項(xiàng)的方法。
20.計(jì)算機(jī)系統(tǒng),由用于實(shí)施權(quán)利要求1~19中任意一項(xiàng)的方法的程序和數(shù)據(jù)庫(kù)組成。
21.計(jì)算機(jī)可以讀取的媒體,記錄有用于實(shí)施權(quán)利要求1~19中任意一項(xiàng)的方法的程序和/或數(shù)據(jù)庫(kù)。
全文摘要
使用含有生物學(xué)事件信息的生物分子連鎖數(shù)據(jù)庫(kù),通過(guò)連接檢索,生成含有生物學(xué)事件的分子功能網(wǎng)絡(luò)的方法、以及推測(cè)該網(wǎng)絡(luò)中任意生物分子和任意生物學(xué)事件間的路徑的方法或者推測(cè)該網(wǎng)絡(luò)中的任意生物分子相關(guān)的生物學(xué)事件的方法。
文檔編號(hào)G06F19/12GK1479900SQ01818734
公開(kāi)日2004年3月3日 申請(qǐng)日期2001年9月10日 優(yōu)先權(quán)日2000年9月12日
發(fā)明者板井昭子 申請(qǐng)人:株式會(huì)社醫(yī)藥分子設(shè)計(jì)研究所