專利名稱:免疫原性減弱的經(jīng)修飾角質(zhì)形成細(xì)胞生長因子(kgf)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及尤其是用于對人施用的、特別是用于治療的多肽。所述的多肽是經(jīng)修飾的多肽,其中,所述的修飾使得上述多肽在施用于人體時引起免疫應(yīng)答的傾向減弱。本發(fā)明特別涉及對角質(zhì)形成細(xì)胞生長因子(KGF)進(jìn)行修飾以產(chǎn)生KGF蛋白變異體,該變異體在體內(nèi)使用時基本上無免疫原性,或比未經(jīng)修飾的相應(yīng)蛋白的免疫原性低。本發(fā)明還涉及來自上述未經(jīng)修飾蛋白的T-細(xì)胞表位肽,由此可以構(gòu)建免疫原性減弱的經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF)變異體。
背景技術(shù):
有許多例子表明治療蛋白的效率受限于針對所述治療蛋白的干擾性免疫反應(yīng)。已有若干種小鼠單克隆抗體表現(xiàn)出治療多種人類疾病的前景,但在某些情況下由于誘導(dǎo)出相當(dāng)程度的人抗小鼠抗體(HAMA)應(yīng)答而未能成功應(yīng)用[Schroff,R.W.等(1985)Cancer Res.45879-885;Shawler,D.L.等(1985)J.Immunol.1351530-1535]。對于單克隆抗體,已發(fā)展了多種技術(shù)以試圖減弱HAMA應(yīng)答[WO 89/09622;EP0239400;EP 0438310;WO 91/06667l。這些重組DNA方法通常是減少最終的抗體構(gòu)建體中小鼠的遺傳信息,同時增加最終構(gòu)建體中人的遺傳信息。盡管如此,在許多個體中,所得的“人源化”抗體仍然引起患者的免疫應(yīng)答[Issaes J.D.(1990)Sem.Immunol.2449,456;Rebello,P.R.等(1999)Transplantation 681417-1420]。
抗體并不是唯一一類作為治療劑施用并可引起免疫應(yīng)答的多肽分子。即使是來源于人且具有與人體內(nèi)蛋白相同氨基酸序列的蛋白也可以在人體內(nèi)誘導(dǎo)免疫應(yīng)答。值得注意的例子包括粒細(xì)胞-巨噬細(xì)胞集落刺激因子[Wadhwa,M.等(1999)Clin.Cancer Res.51353-1361]和干擾素α2[Russo,D.等(1996)Bri.J.Haem.94300-305;Stein,R.等(1988)New Engl.J.Med.3181409-1413]等的治療性應(yīng)用。
誘導(dǎo)免疫應(yīng)答的主要因素是在蛋白中存在可經(jīng)由MHC II類分子的呈遞作用激活T-細(xì)胞活性的肽(即所謂的T-細(xì)胞表位)。這種潛在的T-細(xì)胞表位通常定義為任何具有與MHC II類分子結(jié)合能力的氨基酸序列??蓽y定此種T-細(xì)胞表位以建立MHC結(jié)合。隱含地,"T-細(xì)胞表位"是指當(dāng)其與MHC分子結(jié)合時可被T-細(xì)胞受體(TCR)識別的表位,并且至少原則上,這種表位可以通過使TCR促進(jìn)T-細(xì)胞應(yīng)答而激活這些T-細(xì)胞。但可以理解,某些可與MHC II類分子結(jié)合的肽可能存留在蛋白序列中,因為這種肽在施用此最終蛋白的生物中被識別為“自身的”。
已知這些T-細(xì)胞表位肽中的某些可在肽、多肽或蛋白在細(xì)胞中降解的過程中釋放出來,隨后由主要組織相容性復(fù)合體(MHC)分子呈遞以便引發(fā)T-細(xì)胞激活作用。對于MHC II類分子呈遞的肽,這種T-細(xì)胞激活作用可,例如通過直接刺激B細(xì)胞產(chǎn)生抗體而引起抗體應(yīng)答。
MHC II類分子是一組高度多態(tài)的蛋白,其對輔助T細(xì)胞篩選和激活起重要作用。人白細(xì)胞抗原群DR(HLA-DR)是這組蛋白的主要同種型也是本發(fā)明的焦點所在。鑒于同種型HLA-DQ和HLA-DP行使類似的功能,本發(fā)明對此兩者均適用。MHC II類DR分子由α和β鏈組成,其C-末端插入并穿越細(xì)胞膜。每一異源二聚體都具有可與長度在9到20個氨基酸范圍內(nèi)變化的肽相結(jié)合的配體結(jié)合結(jié)構(gòu)域,但是結(jié)合溝中最多容納11個氨基酸。配體結(jié)合結(jié)構(gòu)域由α鏈的1-85位氨基酸和β鏈的1-94位氨基酸組成。最近的研究表明DQ分子具有同源的結(jié)構(gòu),預(yù)期DP家族蛋白也非常類似。在人中已發(fā)現(xiàn)了DR同種型的約70種不同同種異型,對于DQ有30種不同的同種異型,對于DP有47種不同的同種異型。每一個體帶有2到4個DR等位基因,兩個DQ及兩個DP等位基因。許多DR分子的結(jié)構(gòu)已闡明,這種結(jié)構(gòu)指向一種帶有許多疏水口袋的開口肽結(jié)合溝,所述的疏水口袋與肽的疏水殘基(口袋殘基)相互作用[Brown等,Nature(1993)36433;Stern等,(1994)Nature 368215]。確立不同II類分子同種異型的多態(tài)性有助于肽結(jié)合溝中的不同肽結(jié)合表面的廣泛多樣性,并且在群體水平保證有關(guān)識別外來蛋白和引發(fā)針對病原生物免疫應(yīng)答的最大靈活性。在配體結(jié)合結(jié)構(gòu)域內(nèi)存在相當(dāng)數(shù)量的多態(tài)性,并且在不同地域和種族群體存在著顯著不同的“家族”。這一多態(tài)性影響著肽結(jié)合結(jié)構(gòu)域的結(jié)合特性,因此,不同的DR分子“家族”對不同序列屬性的肽具有特異性,但也可以有一些重疊。這種特異性決定了最終負(fù)責(zé)驅(qū)動針對B細(xì)胞表位的抗體應(yīng)答的Th-細(xì)胞表位識別(II類T-細(xì)胞應(yīng)答),所述的B細(xì)胞表位存在于衍生所述Th-細(xì)胞表位的相同蛋白上。因此,個體中針對蛋白的免疫應(yīng)答在很大程度上受到T-細(xì)胞表位識別作用的影響,這種識別作用是個體中與HLA-DR同種異型的肽結(jié)合特異性的函數(shù)。因而,為對全球種群背景下的肽或蛋白中的T-細(xì)胞表位進(jìn)行鑒定,需要考慮到盡可能多樣的HLA-DR同種異型組的結(jié)合特性,由此覆蓋盡可能高比例的世界上的種群。
針對治療性蛋白(如本發(fā)明的目的蛋白)的免疫應(yīng)答通過MHC II類肽呈遞途徑進(jìn)行。其間外來蛋白經(jīng)吞噬和加工后與DR、DQ或DP型MHC II類分子結(jié)合以進(jìn)行呈遞。MHC II類分子由專門抗原呈遞細(xì)胞(APC)如巨噬細(xì)胞、樹突狀細(xì)胞等表達(dá)。通過在T細(xì)胞表面的關(guān)聯(lián)性T-細(xì)胞受體與MHC II類肽復(fù)合物相互作用,加之與某些其他共同受體,如CD4分子交聯(lián)可誘導(dǎo)T-細(xì)胞進(jìn)入激活狀態(tài)。上述激活作用可導(dǎo)致細(xì)胞因子釋放,進(jìn)一步激活其他淋巴細(xì)胞如B細(xì)胞,產(chǎn)生抗體或激活T殺傷細(xì)胞形成完整的細(xì)胞免疫應(yīng)答。
肽與給定的MHC II類分子結(jié)合以備在APC表面呈遞的能力依賴于多種因素,最主要的是肽的一級結(jié)構(gòu)。這影響其蛋白酶剪切傾向及其在MHC II類分子的肽結(jié)合隙中的結(jié)合親和性。在APC表面的MHC II類/肽復(fù)合物向能識別決定簇的特定T-細(xì)胞受體(TCR)呈遞一個結(jié)合面,其中所述決定簇由肽和MHC II類分子的暴露殘基共同提供。
本領(lǐng)域中有鑒定能結(jié)合MHC II類分子的合成肽的方法(例如WO98/52976和WO00/34317)。這種肽不是在所有情況下都行使T細(xì)胞表位的功能,特別是在體內(nèi)會受加工途徑和其他現(xiàn)象的影響。T-細(xì)胞表位鑒定是表位清除的第一步。鑒定及從蛋白中去除潛在T-細(xì)胞表位先前已有公開。本領(lǐng)域中已有檢測T-細(xì)胞表位的方法,通常是通過計算機手段在經(jīng)試驗確定的T-細(xì)胞表位中掃描公認(rèn)的序列基元,或利用計算機技術(shù)預(yù)測MHC II類結(jié)合肽,特別是DR-結(jié)合肽。
WO98/52976和WO00/34317中公開了鑒定具有與人MHC II類DR同種異型亞群結(jié)合的潛在能力的多肽序列的計算機穿線方法(computational threading approaches)。這些教導(dǎo)中,通過在人源或非人源治療性抗體或非抗體蛋白一級序列中進(jìn)行準(zhǔn)確的氨基酸替換以去除預(yù)測的T-細(xì)胞表位。
此外,利用重組MHC分子與合成肽的可溶性復(fù)合物(該復(fù)合物能與來自于人或受試實驗動物外周血液樣品中的T-細(xì)胞克隆相結(jié)合)的技術(shù)也在本領(lǐng)域中有所應(yīng)用[Kern,F(xiàn).等(1998)Nature Medicine 4975-978;Kwok,W.W.等(2001)TRENDS in Immunology 22583-588],這些技術(shù)也可以用于表位鑒定策略中。
根據(jù)上述描述,由此可能期望鑒定、去除或至少減少給定的具有重要的治療價值但原本具有免疫原性的肽、多肽或蛋白中的T-細(xì)胞表位。
“角質(zhì)形成細(xì)胞生長因子(KGF)”是這些有治療價值的分子之一。KGF是成纖維細(xì)胞生長因子(FGF)/肝素結(jié)合生長因子蛋白家族的成員。它是一種主要在肺部表達(dá)的分泌糖蛋白,可通過刺激角質(zhì)細(xì)胞和其他上皮細(xì)胞的生長促進(jìn)傷口的愈合[Finch等(1989),Science 24752-755;Rubin等(1989),Proc.Natl.Acad.Sci.U.S.A.86802-806]。該糖蛋白的成熟(加工后的)形式包含163個氨基酸殘基,可通過培養(yǎng)特定的細(xì)胞系,從條件培養(yǎng)基中分離得到[Rubin等,(1989)出處同上],或利用重組技術(shù)生產(chǎn)[Ron等(1993)J.Biol.Chem.2682984-2988]。該蛋白在多種重要的疾病和損傷修復(fù)情況中對于刺激上皮細(xì)胞的生長具有治療價值。本發(fā)明特別涉及具有163個氨基酸殘基的人KGF蛋白的成熟(經(jīng)加工的)形式。
也有人公開了KGF分子[例如US 6,008,328;WO 90/08771 ],包括經(jīng)修飾的KGF[Ron等(1993)出處同上;WO 95/01434]。但這些教導(dǎo)并沒有認(rèn)識到T-細(xì)胞表位對所述蛋白免疫原性的重要性,也不能據(jù)此聯(lián)想到按照本發(fā)明的方案以特異的、可控制的方式直接影響所述蛋白的性質(zhì)。
角質(zhì)形成細(xì)胞生長因子(KGF)的氨基酸序列(以單字母密碼表示)如下MCNDMTPEQMATNVNCSSPERHTRSYDYMEGGDIRVRRLFCRTQWYLRIDKRGKVKGTQEMKNNYNIMEIRTVAVGIVAIKGVESEFYLAMNKEGKLYAKKECNEDCNFKELILENHYNTYASAKWTHNGGEMFVALNQKGIPVRGKKTKKEQKTAHFLPMAIT但是,一直存在對具有改進(jìn)的性質(zhì)的角質(zhì)形成細(xì)胞生長因子(KGF)類似物的需要。所需要的改進(jìn)包括用于表達(dá)和純化所述治療劑的可供選擇的方案和形式,以及尤其是所述蛋白生物學(xué)性質(zhì)的改善。特別需要改進(jìn)的是在施用于人體時在體內(nèi)的特性。在這方面,非常需要提供對人體具有減弱的或沒有誘導(dǎo)免疫應(yīng)答可能性的角質(zhì)形成細(xì)胞生長因子(KGF)。
發(fā)明概述及內(nèi)容本發(fā)明提供了經(jīng)修飾的“角質(zhì)形成細(xì)胞生長因子(KGF)”,其中,通過減少或去除大量潛在的T-細(xì)胞表位的方式對該因子的免疫學(xué)特性進(jìn)行修飾。本發(fā)明提供去除了一個或多個T細(xì)胞表位的角質(zhì)形成細(xì)胞生長因子(KGF)的修飾形式。
由其他哺乳動物或脊椎動物中鑒定的KGF蛋白與與本發(fā)明中公開的肽序列之間存在大量共有序列,且與列表中公開的肽序列間存在大量基本上相同的共有序列。這些蛋白序列也落入本發(fā)明的范圍內(nèi)。
本發(fā)明公開了在角質(zhì)形成細(xì)胞生長因子一級序列內(nèi)鑒定的序列,由于它們具有與MHC II類分子結(jié)合的可能性,所以是潛在的T-細(xì)胞表位。本發(fā)明特別涉及具有163個氨基酸殘基的人KGF蛋白。
本發(fā)明還公開了在基本上不影響生物學(xué)活性的前提下需要通過特定的氨基酸替代、添加或缺失進(jìn)行改變的本發(fā)明分子的一級序列中的特定位點。在只有同時喪失生物學(xué)活性才能去掉免疫原性的情況下,可通過在所述蛋白的氨基酸序列中做進(jìn)一步的改造以恢復(fù)所述的活性。
本發(fā)明還公開了生產(chǎn)這種經(jīng)修飾的分子的方法,尤其是鑒定需要改變以減少或去除免疫原性位點的T-細(xì)胞表位的方法。
本發(fā)明可應(yīng)用于任何具有與本發(fā)明公開的一級氨基酸序列基本相同的氨基酸序列的KGF分子,因此可包括利用基因工程手段或其他方法獲得的、可能不是包含163個氨基酸殘基的KGF分子。
預(yù)期本發(fā)明的蛋白在人體中的循環(huán)時間會延長,因此對慢性或復(fù)發(fā)性疾病,如角質(zhì)形成細(xì)胞生長因子(KGF)的多種適應(yīng)癥特別有益。本發(fā)明提供經(jīng)修飾的KGF蛋白,預(yù)期其在體內(nèi)將表現(xiàn)出改進(jìn)的性質(zhì)。這些經(jīng)修飾的KGF分子可應(yīng)用于藥物組合物。
總之,本發(fā)明涉及下述內(nèi)容●一種經(jīng)修飾的分子,其具有角質(zhì)形成細(xì)胞生長因子(KGF)的生物學(xué)活性,且當(dāng)其在體內(nèi)應(yīng)用時基本上無免疫原性或免疫原性低于任何具有相同生物學(xué)活性但未經(jīng)修飾的分子;●如上所述的分子,其中,所述的免疫原性喪失是通過從原始的未經(jīng)修飾的分子中去除一個或多個T-細(xì)胞表位而實現(xiàn)的;●如上所述的分子,其中,所述的免疫原性喪失是通過減少能與由所述分子衍生的肽相結(jié)合的MHC同種異型的數(shù)量來實現(xiàn)的;●如上所述的分子,其中,去除了一個T-細(xì)胞表位;●如上所述的分子,其中,原本存在的T-細(xì)胞表位是MHC II類配體,或表現(xiàn)出經(jīng)II類分子呈遞作用后有刺激或結(jié)合T-細(xì)胞的能力的肽序列;●如上所述的分子,其中,所述的肽序列選自如表1所示的組;
●如上所述的分子,其中,任何原本存在的T-細(xì)胞表位中的1-9個氨基酸殘基,優(yōu)選1個氨基酸殘基發(fā)生了改變;●如上所述的分子,其中,所述氨基酸殘基的改變是用其他的氨基酸殘基在特定的位置替代、添加或缺失原本存在的氨基酸殘基;●如上所述的分子,其中,按表2所示進(jìn)行一個或多個氨基酸殘基的替代;●如上所述的分子,其中,另外還按表3所示進(jìn)行一個或多個氨基酸殘基的替代以減少能與由所述分子衍生的肽相結(jié)合的MHC同種異型的數(shù)量;●如上所述的分子,其中,在需要時常通過替代、添加或缺失特定的氨基酸作進(jìn)一步改變以恢復(fù)所述分子的生物學(xué)活性;●編碼任何上述和下述經(jīng)修飾的分子的DNA序列或分子;●藥物組合物,其包含如上述和/或權(quán)利要求中定義的具有角質(zhì)形成細(xì)胞生長因子(KGF)生物學(xué)活性的經(jīng)修飾分子,并可任選地包含藥學(xué)上可接受的載體、稀釋劑或賦形劑;●制造如上引用的任何權(quán)利要求中所定義的具有角質(zhì)形成細(xì)胞生長因子(KGF)生物學(xué)活性的經(jīng)修飾分子的方法,該方法包括下述步驟(i)確定所述多肽或其中一部分的氨基酸序列;(ii)通過任意方法,包括利用體外或計算機(in silico)技術(shù)或生物學(xué)試驗確定所述肽與MHC分子的結(jié)合,由此鑒定所述蛋白的氨基酸序列中潛在的一個或多個T-細(xì)胞表位;(iii)設(shè)計新的序列變異體,其中,經(jīng)鑒定的潛在T-細(xì)胞表位內(nèi)有一個或多個氨基酸經(jīng)過修飾,由此基本上減弱或去除了所述T-細(xì)胞表位的活性,這一效果可由體外或計算機技術(shù)或生物學(xué)試驗通過所述肽與MHC分子的結(jié)合來確定;(iv)通過重組DNA技術(shù)構(gòu)建所述序列變異體,并檢測所述的變異體以便鑒定一個或多個具有所需性質(zhì)的變異體;和(v)任選地重復(fù)步驟(ii)-(iv);●如上所述的方法,其中步驟(iii)是通過在任何原本存在的T-細(xì)胞表位中替代、添加或缺失1-9個氨基酸殘基來進(jìn)行的;●如上所述的方法,其中,所述的改變是參照同源蛋白質(zhì)序列和/或計算機模擬技術(shù)進(jìn)行的;●如上所述的方法,其中步驟(ii)是通過下述步驟進(jìn)行的(a)在所述的肽中選擇一個具有已知氨基酸序列的區(qū)域;(b)然后由所選擇的區(qū)域中順序抽取預(yù)定統(tǒng)一大小且至少由3個氨基酸殘基組成的重疊氨基酸殘基片段;(c)通過對存在于抽樣氨基酸殘基片段中的每個疏水氨基酸殘基側(cè)鏈賦值求和,計算每一抽樣片段的MHC II類分子結(jié)合分值;和(d)根據(jù)計算出的該片段的MHC II類分子結(jié)合分值鑒定至少一個適于修飾的片段,以在基本上不減弱所述肽的治療功效的前提下改變整體的MHC II類結(jié)合分值;步驟(c)優(yōu)選地通過下述步驟利用經(jīng)改進(jìn)而包含了12-6范德華配體-蛋白能量排斥項和配體構(gòu)象能量項的Bhm評分函數(shù)(scoring function)進(jìn)行,所述步驟為(1)提供MHCII類分子模型第一數(shù)據(jù)庫;(2)提供所述MHC II類分子模型的容許肽主鏈(allowed peptide backbone)的第二數(shù)據(jù)庫;(3)從第一數(shù)據(jù)庫中篩選模型;(4)從第二數(shù)據(jù)庫中篩選容許肽主鏈;(5)鑒定在每個抽樣片段中存在的氨基酸殘基側(cè)鏈;(6)確定存在于每個抽樣片段中的所有側(cè)鏈的結(jié)合親和性值;以及對每一模型和每一所述的主鏈重復(fù)步驟(1)到(5);●選自表1的具有潛在的MHC II類結(jié)合活性且由未經(jīng)免疫遺傳修飾的角質(zhì)形成細(xì)胞生長因子(KGF)構(gòu)建的13肽T-細(xì)胞表位肽,及其在制造在體內(nèi)使用時基本上沒有免疫原性或免疫原性低于具有相同生物學(xué)活性的任何未經(jīng)修飾的分子的KGF中的用途;●由上述的13肽T-細(xì)胞表位肽中的至少9個連續(xù)的氨基酸殘基組成的肽序列,及其在制造在體內(nèi)使用時基本上沒有免疫原性或免疫原性低于具有相同生物學(xué)活性的任何未經(jīng)修飾的分子的KGF中的用途。
根據(jù)對本發(fā)明的理解,術(shù)語"T-細(xì)胞表位"是指具有下述能力的氨基酸序列,即能結(jié)合MCH II、能刺激T-細(xì)胞和/或以與MHC II的復(fù)合物的形式結(jié)合(但不一定可測量地激活)T-細(xì)胞。此處及后附權(quán)利要求中所用的術(shù)語“多肽”是指包含兩個或多個氨基酸的化合物。氨基酸之間通過肽鍵相連(定義見下)。肽的生物生產(chǎn)中涉及20種不同的天然氨基酸,任意數(shù)量的所述氨基酸可按任意的順序連接形成肽鏈或環(huán)。用于生物生產(chǎn)肽中的天然氨基酸全部具有L-構(gòu)型。可應(yīng)用常規(guī)的合成方法利用L-氨基酸、D-氨基酸或兩種不同構(gòu)型的氨基酸的各種組合制備合成肽。一些肽僅包含少量的氨基酸單元。例如含有不到10個氨基酸的短肽有時被稱作“寡肽”。其他的包含大量氨基酸殘基,例如達(dá)100個或更多個氨基酸殘基的肽稱作“多肽”。習(xí)慣上將含有3個或3個以上氨基酸的任何肽鏈多看作“多肽”,而將“寡肽”視為特定類型的短“多肽”。因而本文所提到的“多肽”也包括“寡肽”。而且,所用到的“肽”包括多肽、寡肽和蛋白。不同的氨基酸排列形式形成不同的多肽或蛋白。因此,多肽的數(shù)量以及可形成的蛋白的數(shù)量實際上是無限的?!唉撂?Cα)”是肽鏈中碳-氫(CH)組分中的碳原子?!皞?cè)鏈”是Cα的側(cè)基,其可包含簡單的或復(fù)雜的基團(tuán)或部分,且具有與所述肽的大小相比可顯著變化的外形大小。
本發(fā)明可應(yīng)用于與此處公開的角質(zhì)形成細(xì)胞生長因子(KGF)具有基本上相同的一級氨基酸序列的任何角質(zhì)形成細(xì)胞生長因子(KGF)分子,因此包括利用基因工程手段或其他方法獲得的、可能不是包含163個氨基酸殘基的角質(zhì)形成細(xì)胞生長因子(KGF)。
角質(zhì)形成細(xì)胞生長因子(KGF)蛋白,例如從其他哺乳動物來源中鑒定出的相關(guān)蛋白與本發(fā)明中公開的肽序列之間存在大量共有序列,且與列表中公開的肽序列間存在大量基本上相同的共有序列。因此這樣的蛋白序列也落入本發(fā)明的保護(hù)范圍。
本發(fā)明是為了克服實際應(yīng)用中存在的下述問題,即將可溶性蛋白引入自體生物中可引發(fā)免疫應(yīng)答,產(chǎn)生可與所述可溶性蛋白相結(jié)合的宿主抗體。其中的一個例子是干擾素α2,盡管這一蛋白是內(nèi)源產(chǎn)生的,但許多病人都會產(chǎn)生針對它的抗體[Russo,D.等(1996)出處同上;Stein,R.等(1988)出處同上]。將角質(zhì)形成細(xì)胞生長因子(KGF)用于治療用途時也可能存在類似的問題,本發(fā)明試圖通過提供在施用于人體時引發(fā)免疫應(yīng)答的傾向發(fā)生改變的角質(zhì)形成細(xì)胞生長因子(KGF)蛋白來解決這一問題。
本發(fā)明中形成經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF)的總的方法包括下述步驟(a)確定多肽或其中一部分的氨基酸序列;(b)通過任意方法,包括利用體外或計算機技術(shù)或生物學(xué)試驗確定所述肽與MHC分子的結(jié)合,由此鑒定所述蛋白的氨基酸序列中潛在的一個或多個T-細(xì)胞表位;(c)設(shè)計新的序列變異體,其中,經(jīng)鑒定的潛在T-細(xì)胞表位內(nèi)有一個或多個氨基酸經(jīng)過修飾,由此基本上減弱或去除了所述T-細(xì)胞表位的活性,這一效果可由體外或計算機技術(shù)或生物學(xué)試驗通過所述肽與MHC分子的結(jié)合來確定。構(gòu)建此序列變異體以避免由所述的序列變異體產(chǎn)生新的潛在T-細(xì)胞表位,否則所述的新的潛在T細(xì)胞表位又通過此種方式進(jìn)行修飾以基本上減弱或消除T-細(xì)胞表位活性;和(d)通過重組DNA技術(shù)構(gòu)建所述序列變異體,并檢測所述的變異體以便根據(jù)已知的重組技術(shù)鑒定一個或多個具有所需功能的變異體。
對于步驟(b)中對潛在T-細(xì)胞表位的鑒定可依照本領(lǐng)域已公知的方法進(jìn)行。在WO 98/59244;WO 98/52976;WO 00/34317中也公開了適當(dāng)?shù)姆椒?,并?yōu)選用于鑒定角質(zhì)形成細(xì)胞生長因子(KGF)-衍生的肽對MHC II類分子的結(jié)合傾向。
在實施例部分公開了另一種非常有效的通過計算鑒定T-細(xì)胞表位的方法,它是本發(fā)明的優(yōu)選實施方案。
實踐中,將制備許多角質(zhì)形成細(xì)胞生長因子(KGF)蛋白變異體并檢測所需的免疫和功能特性。最優(yōu)選通過重組DNA技術(shù)生產(chǎn)所述的變異體蛋白,同時也可以利用其他的方法,包括化學(xué)合成角質(zhì)形成細(xì)胞生長因子(KGF)片段。
涉及163個氨基酸殘基的角質(zhì)形成細(xì)胞生長因子(KGF)蛋白序列的根據(jù)上述方案中步驟(b)的分析結(jié)果列于表1。
表1具有潛在人MHC II類結(jié)合活性的角質(zhì)形成細(xì)胞生長因子(KGF)的肽序列NDMTPEQMATNVN,DMTPEQMATNVNC,EQMATNVNCSSPE,TNVNCSSPERHTR,RSYDYMEGGDIRV,YDYMEGGDIRVRR,DYMEGGDIRVRRL,GDIRVRRLFCRTQ,IRVRRLFCRTQWY,RRLFCRTQWYLRI,RLFCRTQWYLRID,TQWYLRIDKRGKV,QWYLRIDKRGKVK,WYLRIDKRGKVKG,LRIDKRGKVKGTQ,GKVKGTQEMKNNY,QEMKNNYNIMEIR,NNYNIMEIRTVAV,YNIMEIRTVAVGI,NIMEIRTVAVGIV,MEIRTVAVGIVAI,RTVAVGIVAIKGV,VAVGIVAIKGVES,VGIVAIKGVESEF,VAIKGVESEFYLA,KGVESEFYLAMNK,SEFYLAMNKEGKL,EFYLAMNKEGKLY,F(xiàn)YLAMNKEGKLYA,LAMNKEGKLYAKK,GKLYAKKECNEDC,KLYAKKECNEDCN,CNFKELILENHYN,KELILENHYNTYA,ELILENHYNTYAS,LILENHYNTYASA,NHYNTYASAKWTH,NTYASAKWTHNGG,AKWTHNGGEMFVA,GEMFVALNQKGIP,EMFVALNQKGIPV,F(xiàn)VALNQKGIPVRG,VALNQKGIPVRGK,KGIPVRGKKTKKE,IPVRGKKTKKEQK,KTKKEQKTAHFLP肽是13肽,氨基酸用單字母表示。
涉及本發(fā)明的經(jīng)修飾分子的根據(jù)上述方案中步驟(c)和(d)所得的設(shè)計結(jié)果和構(gòu)建體列于表2和表3。
表2導(dǎo)致角質(zhì)形成細(xì)胞生長因子(KGF)的潛在T-細(xì)胞表位消除的替代(WT=野生型)。
表3導(dǎo)致相應(yīng)于一個或多個MHC同種異型的潛在T-細(xì)胞表位去除的額外替代
本發(fā)明涉及角質(zhì)形成細(xì)胞生長因子(KGF)類似物,其中,在可以導(dǎo)致所述蛋白中潛在的T細(xì)胞表位的活性明顯減弱或從所述蛋白中去除一個或多個潛在的T-細(xì)胞表位活性的位點替代了至少一個氨基酸殘基。表1中鑒定的任何潛在的MHC II類配體中特定位點的一個或多個氨基酸的替代,可產(chǎn)生當(dāng)作為治療劑施用于人體時具有減弱的潛在免疫原性的角質(zhì)形成細(xì)胞生長因子(KGF)分子。優(yōu)選地,在預(yù)計可以實現(xiàn)基本上減弱或去除T-細(xì)胞表位活性的肽序列中的適當(dāng)位點進(jìn)行氨基酸替代。實踐中,合適的位點優(yōu)選等同于在MHC II類結(jié)合溝內(nèi)提供的疏水口袋之一中結(jié)合的氨基酸殘基。
最優(yōu)選是在所述肽中稱作P1或P1錨的位置改變裂縫中第一口袋內(nèi)的結(jié)合。公認(rèn)地,肽的P1錨殘基和MHC II類結(jié)合溝第一口袋之間的結(jié)合相互作用的質(zhì)量是對整個肽的總結(jié)合親和性的主要決定因素。在所述肽這一位置的適當(dāng)替代應(yīng)當(dāng)是替換為不易容納到所述口袋中的殘基,例如替換為更親水的殘基。所述肽中相應(yīng)與MHC結(jié)合裂縫內(nèi)其他口袋區(qū)域結(jié)合的位置處的氨基酸殘基也被認(rèn)為是落入本發(fā)明的范圍內(nèi)。
可以理解,由給定的潛在T-細(xì)胞表位內(nèi)的單一氨基酸替代導(dǎo)致該表位去除的路線是最優(yōu)選的。也可以進(jìn)行單一表位內(nèi)的組合替代,例如,這對于單獨定義的表位間彼此重疊的情況特別適宜。此外,在給定的表位內(nèi)一個一個地進(jìn)行或在一個表位內(nèi)組合進(jìn)行的氨基酸替代也可以發(fā)生在非對應(yīng)于MHC II類結(jié)合溝的"口袋殘基"的位置,而是在所述肽內(nèi)的任意位點進(jìn)行。替代可參照同源結(jié)構(gòu)或由本領(lǐng)域已知的計算機技術(shù)產(chǎn)生的結(jié)構(gòu)方法,也可以根據(jù)本發(fā)明分子的已知結(jié)構(gòu)特征進(jìn)行。所有此類替代均落入本發(fā)明的范圍內(nèi)。
也可以考慮不在上面所鑒定的肽內(nèi)進(jìn)行氨基酸替代,特別是與在所列肽內(nèi)進(jìn)行的替代相結(jié)合的情況下。例如可以考慮利用某種改變恢復(fù)變異體分子的結(jié)構(gòu)或生物學(xué)功能。這種補償性的改變和由角質(zhì)形成細(xì)胞生長因子(KGF)多肽中缺失或添加特定的氨基酸殘基得到具有所需活性的變異體的改變,以及任何本發(fā)明公開的肽中的改變均落入本發(fā)明的范圍內(nèi)。
本發(fā)明的范圍涉及經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF),含有上述經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF)蛋白或經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF)蛋白片段的組合物,及其相關(guān)的組合物應(yīng)認(rèn)為均落入本發(fā)明的范圍內(nèi)。另一方面,本發(fā)明涉及編碼經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF)實體的核酸。另一方面本發(fā)明涉及利用經(jīng)修飾的角質(zhì)形成細(xì)胞生長因子(KGF)蛋白對人進(jìn)行治療的方法。
實施例有多種因素對決定蛋白或多肽的總體結(jié)構(gòu)起重要作用。首先是肽鍵,即將氨基酸連接在一起形成鏈的鍵,它是一種共價鍵。這種鍵是平面結(jié)構(gòu)的,實質(zhì)上是一種取代的酰胺?!磅0贰敝负?CONH-基團(tuán)的一組有機化合物中的任何一個化合物。
連接相鄰氨基酸的Cα的平面肽鍵如下所示 由于O=C和C-N原子位于一個相對剛性的平面中,所以不會發(fā)生沿這些軸的自由旋轉(zhuǎn)。因此,圖中虛線所示的平面有時被稱作“酰胺”平面或“肽平面”,肽主鏈中的氧(O)、碳(C)、氮(N)和氫(H)原子位于其中。Cα原子位于酰胺平面中相對的角上。由于肽或酰胺平面中的O=C和C-N原子基本上不發(fā)生旋轉(zhuǎn),所以多肽鏈包含一系列連接Cα原子的平面肽鍵。
第二個對決定多肽或蛋白的整體結(jié)構(gòu)或構(gòu)象起重要作用的因素是繞共有Cα鍵的每一酰胺平面的轉(zhuǎn)角。此后術(shù)語"轉(zhuǎn)角"和"扭轉(zhuǎn)角"是等同的術(shù)語。假定O、C、N和H原子保留在酰胺平面中(這通常是一種正確的假設(shè),盡管在一些構(gòu)象中這些原子會輕微的偏移平面),這些轉(zhuǎn)角確定了N和R多肽主鏈構(gòu)象,即相鄰殘基之間的結(jié)構(gòu)。這兩個轉(zhuǎn)角稱為φ和ψ。因此,一套φi和ψi角(其中,腳標(biāo)i代表多肽鏈中的特定殘基)有效地規(guī)定了多肽鏈的二級結(jié)構(gòu)。在文獻(xiàn)中定義了用于確定φ和ψ角的慣例,即在給定的多肽中酰胺平面形成0度角的參考點,以及哪個角是φ角,哪個角是ψ角的定義。參見Ramachandran等,Adv.Prot.Chem.23283-437(1968),285-94頁,這些頁中的內(nèi)容在此引入作為參考。本發(fā)明的方法可應(yīng)用于任何蛋白,并部分基于下述發(fā)現(xiàn),即人MHC II類分子結(jié)合溝的初級口袋1錨定位點可以具有設(shè)計好的對特定氨基酸側(cè)鏈的特異性。這一口袋的特異性由MHC II類分子β鏈第86位的氨基酸的身份來確定。這一位點位于口袋1的底部并決定可容納于這一口袋中的氨基酸側(cè)鏈的大小。Marshall,K.W.,J.Immunol.,1524946-4956(1994)。如果這一殘基是甘氨酸,則所有的疏水性脂肪族和芳香族氨基酸(疏水性脂肪族氨基酸是纈氨酸、亮氨酸、異亮氨酸、甲硫氨酸,芳香族氨基酸是苯丙氨酸、酪氨酸和色氨酸)均可容納于所述的口袋中,優(yōu)選芳香族側(cè)鏈。如果這一口袋殘基是纈氨酸,則該氨基酸的側(cè)鏈伸到口袋中并限制了可容納的肽側(cè)鏈的大小,所以只有疏水性脂肪族側(cè)鏈可容納進(jìn)去。因此在氨基酸殘基序列中,無論哪里發(fā)現(xiàn)了帶有疏水性脂肪族或芳香族側(cè)鏈的氨基酸,即有存在MHC II類限制性T-細(xì)胞表位的可能性。但是,如果所述的側(cè)鏈?zhǔn)鞘杷灾咀鍌?cè)鏈,其與T-細(xì)胞表位結(jié)合的可能性約是芳香族側(cè)鏈的兩倍(假定1型口袋近似平均地分布于全球種群中)。
將本發(fā)明具體化的計算機方法描繪出肽區(qū)域包含T-細(xì)胞表位的可能性,該方法如下(1)掃描預(yù)定長度肽片段的一級序列,并鑒定存在的所有疏水性脂肪族和芳香族側(cè)鏈。(2)對疏水性脂肪族側(cè)鏈賦予比芳香族側(cè)鏈高的值;優(yōu)選兩倍于賦予芳香族側(cè)鏈的值,例如,給疏水性脂肪族側(cè)鏈賦值為2,給芳香族側(cè)鏈賦值為1。(3)將所述肽中的預(yù)定統(tǒng)一長度的每一重疊氨基酸殘基片段(窗口)中確定存在的值總和起來,再將某一特定片段(窗口)的總值賦予該片段(窗口)中間位置的某個單個氨基酸殘基,優(yōu)選賦予處于抽樣片段(窗口)中間點的氨基酸。將這一過程對每一抽樣的重疊氨基酸殘基片段(窗口)重復(fù)進(jìn)行。因此,所述肽的每一氨基酸殘基均被賦予了一個值,該值與T-細(xì)胞表位存在于此特定片段(窗口)中的可能性相關(guān)。(4)用按照上述步驟3中的描述計算、賦予的值對被評估的整個氨基酸殘基序列的氨基酸坐標(biāo)作圖。(5)序列中具有預(yù)定值(例如該值為1)的所有部分均被認(rèn)為可能包含T細(xì)胞表位,并且在需要時可進(jìn)行修飾。在這一方面本發(fā)明提供了通用的方法,由此可描述可能包含T-細(xì)胞表位的肽區(qū)域。在這些區(qū)域中對所述的肽進(jìn)行修飾有可能改變MHC II類的結(jié)合特性。
依照本發(fā)明的另一方面,可利用更復(fù)雜的計算方法更精確地預(yù)測T-細(xì)胞表位,該方法考慮了肽與MHC II等位基因模型之間的相互作用。根據(jù)這一方面,計算機預(yù)測存在于所述肽中的T-細(xì)胞表位包括,根據(jù)所有已知的MHC II類分子結(jié)構(gòu)構(gòu)建至少42個MHC II類等位基因模型,將這些模型應(yīng)用于T-細(xì)胞表位計算機鑒定的方法,構(gòu)建每一模型的肽主鏈文庫以便允許在相關(guān)肽主鏈α碳(Cα)位置具有已知的變異性,對于在肽和MHC II類分子相互作用的關(guān)鍵位置上的20種可供選擇的氨基酸中的每一種,構(gòu)建與每個模型對接的每一主鏈的氨基酸側(cè)鏈構(gòu)象文庫,利用這些主鏈和側(cè)鏈構(gòu)象文庫并結(jié)合評分函數(shù)選擇對與特定MHC II類分子結(jié)合的特定肽而言最佳的主鏈和側(cè)鏈構(gòu)象,并從這一相互作用推導(dǎo)出結(jié)合分?jǐn)?shù)。
MHC II類分子模型可從Brookhaven蛋白數(shù)據(jù)庫("PDB")中的許多類似的結(jié)構(gòu)出發(fā)通過同源建模推導(dǎo)得出。它們可通過使用引入了模擬退火算法的半自動同源建模軟件(Modeller,Sali A.& Blundell TL.,1993.J.Mol Biol 234779-815)并結(jié)合用于能量最小化的CHARMm力場(購自Molecular Simulations Inc.,San Diego,Ca.)來制備。也可以應(yīng)用其他的建模方法。
本發(fā)明的方法與下述的其他計算方法有著顯著的不同,這些方法為利用從實驗中得來的關(guān)于一小組MHC II類分子結(jié)合溝中每一位點的每一種氨基酸選項的結(jié)合數(shù)據(jù)文庫的方法(Marshall,K.W.等,Biomed.Pept.Proteins Nucleic Acids,1(3)157-162)(1995);或利用類似的實驗結(jié)合數(shù)據(jù)以定義所述的溝中特定結(jié)合口袋類型的結(jié)合特性(同樣利用相對小的MHC II類分子亞組)然后將這一口袋文庫中的口袋類型進(jìn)行‘混合和匹配’以人工構(gòu)建更“實際的”MHC II類分子的方法(Sturniolo T.等,Nat.Biotech,17(6)555-561(1999)。這兩種現(xiàn)有方法的主要缺陷在于實驗的復(fù)雜性和需要合成大量的肽變異體造成僅有少量的MHC II類分子可通過實驗掃描。因此第一種已知的方法僅能預(yù)測少量的MHC II類分子。第二種已知的方法還假設(shè)在不同II類等位基因的背景下在一個分子中襯有類似氨基酸的口袋將具有相同的結(jié)合特性,并且其另外的缺陷在于,僅僅可“實際地”地構(gòu)建出那些包含口袋文庫中所包含的口袋的MHC II類分子。利用本發(fā)明的建模方法可推導(dǎo)出任意數(shù)量和類型的MHC II類分子的結(jié)構(gòu),因此可特異性地選擇等位基因以代表全球種群的特征。此外,掃描的MHC H類分子的數(shù)量可通過構(gòu)建更多的模型而增加而無需通過復(fù)雜的實驗獲得額外的數(shù)據(jù)。利用主鏈文庫使得被掃描的各種肽在與特定的MHC II類分子結(jié)合時其Cα原子位置處可進(jìn)行變化。這也與上述現(xiàn)有技術(shù)中的計算機方法不同,在那些方法中依賴于利用簡化的肽主鏈來掃描結(jié)合在特定口袋中的氨基酸。這些簡化的主鏈不可能代表在“真正的”肽中的主鏈文庫構(gòu)象,導(dǎo)致對肽結(jié)合的預(yù)測不準(zhǔn)確。本發(fā)明的主鏈文庫是通過疊加蛋白數(shù)據(jù)庫中所有與MHC II類分子結(jié)合的肽的主鏈,并考慮到位于結(jié)合溝內(nèi)的11個氨基酸的每個氨基酸的Cα原子之間的均方根(RMS)差而構(gòu)建的。盡管該文庫可來自少量合適的可獲得的小鼠和人的結(jié)構(gòu)(當(dāng)前為13種),為了允許存在甚至更大變異的可能性,將每一C″-□位點的RMS數(shù)字提高50%。然后確定每一氨基酸的平均Cα位置,圍繞這一點劃一個球,其半徑等于在該位置的RMS差加50%。該球體代表所有可允許的Cα位置。自具有最小RMS差的Cα(上述口袋1中氨基酸殘基的Cα,等同于結(jié)合溝中11個殘基的位置2)起運作,將所述的球三維網(wǎng)格化,網(wǎng)格內(nèi)的每個頂點作為該氨基酸Cα的可能位置。將后續(xù)的酰胺平面(相應(yīng)于與后續(xù)氨基酸的肽鍵)移動到這些Cα的每一個上面,將φ和ψ角以設(shè)定的間隔逐步地轉(zhuǎn)動以便于安置后續(xù)的Cα。如果后續(xù)的Cα落入對這一Cα而言‘可被允許的位置球’中,則此二肽的方向即可被接受,如果其落入所述球之外則所得的二肽不能被接受。對每一后續(xù)Cα位置均重復(fù)這一過程,使肽從所述的口袋1Cα‘種子’開始生長,直到全部9個后續(xù)的Cα的位置均根據(jù)之前Cα的所有可能排列確定下來。
然后對口袋1前的單個Cα重復(fù)上述步驟1次以上以構(gòu)建定位于結(jié)合溝內(nèi)的主鏈Cα位置文庫。生成的主鏈數(shù)目取決于幾種因素‘可被允許的位置球’的大?。粚诖?位點處′最初的球′網(wǎng)格化的細(xì)度;用于定位后續(xù)Cα的φ和ψ角逐步旋轉(zhuǎn)的細(xì)度。利用這一程序可以構(gòu)建大的主鏈文庫。主鏈文庫越大越可能發(fā)現(xiàn)對MHC II類分子結(jié)合溝內(nèi)特定肽的最適主鏈。
鑒于和結(jié)合結(jié)構(gòu)域的氨基酸可能存在沖突,所以不是所有的主鏈均適合于與所有MHC II類分子模型‘對接’(docking),故對每個等位基因建立包含適合于該等位基因的主鏈的亞文庫。利用所述的主鏈文庫并結(jié)合MHC II類分子模型可以構(gòu)建出由與每一容許主鏈對接的每一MHC II類分子結(jié)合溝的每一位點中的每一氨基酸的容許側(cè)鏈構(gòu)象所組成的詳盡數(shù)據(jù)庫??梢岳煤唵蔚牧Ⅲw重疊函數(shù)構(gòu)建這一數(shù)據(jù)組,其中,主鏈與MHC II類分子對接,氨基酸側(cè)鏈在所需位置被嫁接到主鏈上。將側(cè)鏈上可旋轉(zhuǎn)的鍵以設(shè)定的間隔逐步旋轉(zhuǎn),記錄下依賴于該鍵的原子的最終定位。將所述原子與結(jié)合溝側(cè)鏈原子間的相互作用記錄下來,根據(jù)下述的標(biāo)準(zhǔn)確定是否接受這些位置如此定位的所有原子的重疊總量不能超過預(yù)定值。因此,構(gòu)象搜索的嚴(yán)謹(jǐn)度是在鍵的逐步旋轉(zhuǎn)中所用間隔及對總重疊的預(yù)定限度的函數(shù)。如果已知特定的口袋是剛性的,則后一值可較小,但若已知口袋側(cè)鏈位置相對靈活則嚴(yán)謹(jǐn)度可放松。這樣便可以模擬結(jié)合溝口袋內(nèi)靈活性的變化。針對與每一MHC II類分子對接后每一主鏈的所有位點上的所有氨基酸重復(fù)這種構(gòu)象搜索以建立詳盡的側(cè)鏈構(gòu)象數(shù)據(jù)庫。
用適當(dāng)?shù)臄?shù)學(xué)表達(dá)式評價MHC II類分子模型與肽配體構(gòu)象的結(jié)合能量,所述的肽配體構(gòu)象需通過掃描上述的主鏈/側(cè)鏈大數(shù)據(jù)庫根據(jù)經(jīng)驗獲得。這樣,通過對每一長度在9-20個氨基酸范圍內(nèi)變化(盡管對于每一次掃描長度是一定的)的可能肽進(jìn)行下述計算,掃描蛋白以搜索潛在的T-細(xì)胞表位選擇MHC II類分子及適合于該分子的肽主鏈,將相應(yīng)于所需肽序列的側(cè)鏈移植到其上。對于氨基酸的每一容許構(gòu)象(由上述數(shù)據(jù)庫獲得),收集與主鏈上特定位點的特定側(cè)鏈相關(guān)的原子身份和原子間距數(shù)據(jù)。對沿主鏈的每一側(cè)鏈重復(fù)此過程,利用評分函數(shù)推導(dǎo)肽得分。保留該主鏈的最佳得分,對所選模型的每一容許主鏈重復(fù)該過程。比較所有容許主鏈的得分,最高的得分被認(rèn)為是該MHC II類模型中所需肽的得分。對每一模型用從掃描的蛋白得到的所有可能肽重復(fù)上述過程,列出肽相對于模型的得分。
在本發(fā)明中,用于結(jié)合親和力計算的每種配體都是選自上述肽或蛋白的氨基酸片段。因此所述配體為來自已知序列的肽、多肽或蛋白的長度為約9到20個氨基酸的選定氨基酸鏈。此后術(shù)語“氨基酸”和“殘基”視為等同的術(shù)語。將移植到選自上述主鏈文庫的主鏈上的待檢測肽中的連續(xù)氨基酸形式的配體,通過肽主鏈上C″-□原子坐標(biāo)定位到來自MHC II類分子模型庫的MHC II類分子的結(jié)合裂縫中,并從所允許的構(gòu)象數(shù)據(jù)選擇每一側(cè)鏈的允許構(gòu)象。相關(guān)的原子身份和原子間距也來自這一數(shù)據(jù)庫并用于計算肽結(jié)合分?jǐn)?shù)。將對MHC II類結(jié)合口袋具有高親和力的配體作為侯選標(biāo)記出來用于定點誘變。在標(biāo)記的配體中(也由此在目的蛋白中)進(jìn)行氨基酸替代,然后用評分函數(shù)重新測定以確定使結(jié)合親和力降低到預(yù)定的閾值以下的變化。這些變化即可引入到目的蛋白中以去除T-細(xì)胞表位。肽配體與MHC II類分子結(jié)合溝的結(jié)合涉及非共價鍵相互作用,其包括但不限于氫鍵、靜電相互作用、疏水(親脂)相互作用和范德華相互作用。它們包括在下面將詳細(xì)描述的肽評分函數(shù)中。應(yīng)當(dāng)理解,氫鍵是非共價鍵,其可在極性或帶電的基團(tuán)之間形成,由被兩個其他原子共享的氫原子構(gòu)成。
氫供體中的氫帶正電荷,而氫受體帶有部分負(fù)電荷。為肽/蛋白相互作用的目的,氫鍵供體可以是連接氫的氮,或連接在氧或氮上的氫。氫鍵受體原子可以是沒有連接氫的氧、沒有連接氫并具有一或兩個連接的氮或僅有一個連接的硫。某些原子,如連接了氫的氧或亞胺氮(如C=NH),既可以是氫受體也可以是氫供體。氫鍵的能量在3-7 Kcal/mol,大大強于范德化鍵,但弱于共價鍵。氫鍵具有高度的方向性,且當(dāng)供體原子、氫原子和受體原子共線時最強。靜電鍵是在帶有相反電荷的離子對間形成的,根據(jù)庫侖定律這種相互作用的強度與原子間距離的平方成反比。離子對間的最佳距離是約2.8。在肽/蛋白相互作用中,可在精氨酸、組氨酸或賴氨酸和天冬氨酸或谷氨酸之間形成靜電鍵。該鍵的強度依賴于電離基團(tuán)的pKa和介質(zhì)的介電常數(shù),盡管其與氫鍵的強度類似。親脂相互作用是蛋白和肽配體之間發(fā)生的有利疏水-疏水相互作用。這種相互作用通常出現(xiàn)在埋于結(jié)合溝口袋中的肽的疏水性氨基酸側(cè)鏈間,以使它們不暴露在溶劑中。將疏水殘基暴露于溶劑中是非常不利的,因為周圍的溶劑分子被迫在彼此間形成氫鍵而形成籠狀結(jié)構(gòu)。所致的熵值降低是非常不利的。親脂性原子可以是既非極性又不是氫受體的硫和非極性的碳原子。范德華鍵是相距3-4的原子間的非特異性的力。它比氫鍵和靜電鍵弱、特異性低。原子周圍的電荷分布隨時間變化,并且在任何瞬間電荷分布均是不對稱的。這種瞬間的電荷不對稱性誘導(dǎo)臨近原子中的類似不對稱性。在范德華接觸距離所導(dǎo)致的原子之間的吸引力達(dá)到最大,而在約1到2處迅速消失。相反,當(dāng)原子間隔的距離小于此接觸距離時,由于原子外部的電子云重疊使不斷增強的斥力成為主導(dǎo)。盡管與靜電和氫鍵相比,此吸引力相對較弱(約0.6Kcal/mol),但所述斥力對于決定肽配體是否能與蛋白成功結(jié)合可能非常重要。
在一個實施方案中,利用Bhm評分函數(shù)(SCORE1方法)評估結(jié)合常數(shù)(Bhm,H.J.,J.Comput Aided Mol.Des.,8(3)243-256(1994),該文獻(xiàn)在此全文引入作為參考)。在另一個實施方案中,用評分函數(shù)(SCORE2方法)評估結(jié)合親和力作為含有T-細(xì)胞表位的配體的指示物(Bhm,H.J.,J.Comput Aided Mol.Des.,12(4)309-323(1998),該文獻(xiàn)在此全文引入作為參考)。但是上述文獻(xiàn)中描述的Bhm評分函數(shù)是用于評估下述情況中配體對蛋白的結(jié)合親和力的,即已知所述的配體可成功地與所述蛋白結(jié)合,且蛋白/配體復(fù)合物的結(jié)構(gòu)已解析,這一結(jié)構(gòu)已列于蛋白數(shù)據(jù)庫("PDB")中。因此,利用已知的陽性結(jié)合數(shù)據(jù)對評分函數(shù)作了發(fā)展。為了區(qū)分陽性和陰性的結(jié)合體,需向方程中加入排斥項。此外,可通過以成對的方式計算親脂相互作用,而非利用上述Bhm函數(shù)中基于面積的能量項來進(jìn)行更理想的結(jié)合能量評估。因此,在一個優(yōu)選實施方案中,用經(jīng)修飾的Bhm評分函數(shù)評估結(jié)合能。在經(jīng)修飾的Bhm評分函數(shù)中,在評估蛋白和配體之間的結(jié)合能(ΔGbind)時考慮了下述參數(shù)由于配體的平移和轉(zhuǎn)動熵的整體損失造成的結(jié)合能減低(ΔG0);理想氫鍵的貢獻(xiàn)(ΔGhb),其中至少一個配對物是中性的;無擾離子相互作用的貢獻(xiàn)(ΔGionic);親脂配體原子和親脂受體原子之間的親脂相互作用(ΔGlipo);由于配體中內(nèi)在自由度的凍結(jié),即繞每一C-C鍵的旋轉(zhuǎn)自由度降低造成的結(jié)合能損失(ΔGrot);蛋白和配體之間相互作用的能量(EvdW)??紤]到這些項給出等式1(ΔGbind)=(ΔG0)+(ΔGhb×Nhb)+(ΔGionic×Nionic)+(ΔGlipo×Nlipo)+(ΔGrot+Nrot)+(EvdW)其中N是對于特定項限定的相互作用數(shù)目,在一個實施方案中,ΔG0、ΔGhb、ΔGionic、ΔGlipo和ΔGrot是常數(shù),其值分別為5.4、-4.7、-4.7、-0.17和1.4。
Nhb項依照等式2計算Nhb=∑h-bondf(ΔR,Δα)×f(Nneighb)×fpcsf(ΔR,Δα)是罰函數(shù),其解決氫鍵自理想情況的巨大偏離,其依照等式3計算f(ΔR,Δ-□)=f1(ΔR)×f2(Δα)其中如果ΔR<=TOL 則f1(ΔR)=1,或者如果ΔR<=0.4+TOL 則f1(ΔR)=1-(ΔR-TOL)/0.4,或者如果ΔR>0.4+TOL 則f1(ΔR)=0并且如果Δα<30° 則f2(Δα)=1,或者如果Δα<=80° 則f2(Δα)=1-(Δα-30)/50,或者如果Δα>80° 則f2(Δα)=0TOL是氫鍵鍵長=0.25中所能允許的偏差ΔR是H-O/N氫鍵鍵長與理想值=1.9的偏差Δα是氫鍵鍵角∠N/O-H..O/N與180°理想值的偏差f(Nneighb)區(qū)分蛋白表面的凹凸部分,并因此賦予口袋中而非蛋白表面的極性相互作用更高的權(quán)重。這一函數(shù)根據(jù)下述等式4計算f(Nneighb)=(Nneighb/Nneighb,0)α,其中α=0.5Nneighb為蛋白中與任意給定蛋白原子之間的距離小于5的非氫原子的數(shù)量。
Nneighb,0是常數(shù)=25fpcs是用于估計每氫鍵的極性接觸表面面積的函數(shù),由此區(qū)分強和弱的氫鍵,其值由下述的標(biāo)準(zhǔn)確定當(dāng)Apolar/NHB<102時fpcs=β當(dāng)Apolar/NHB>102時fpcs=1
Apolar是極性蛋白-配體接觸面的大小NHR是氫鍵的數(shù)目β是常數(shù)=1.2由于假定了相同的幾何相關(guān)性,在實施經(jīng)修飾的Bhm評分函數(shù)時,離子相互作用的貢獻(xiàn)ΔGionic用與上述有關(guān)氫鍵的類似方式計算。Nlipo項按下述的等式5計算Nlipo=∑lLf(rlL)根據(jù)下述標(biāo)準(zhǔn),對于所有親脂配體原子l和所有親脂蛋白原子L,計算f(rlL)當(dāng)rlL<=R1時 f(rlL)=1當(dāng)R2<rlL>R1時 f(rlL)=(rlL-R1)/(R2-R1)當(dāng)rlL>=R2時 f(rlL)=0其中R1=rlvdw+rLvdw+0.5R2=R1+3.0rlvdw是原子l的范德華半徑rLvdw是原子L的范德華半徑Nrot項是氨基酸側(cè)鏈中可旋轉(zhuǎn)的鍵的數(shù)目,其被視為無環(huán)的sp3-sp3及sp3-sp2鍵的數(shù)目。末端-CH3或-NH3的旋轉(zhuǎn)未考慮進(jìn)去。
最終,項Evdw依照如下等式6計算Evdw=ε1ε2((r1vdw+r2vdw)12/r12-(r1vdw+r2vdw)6/r6),其中ε1和ε2是取決于原子身份的常數(shù)rlvdw+r2vdw是范德華原子半徑r是原子對間的距離。
關(guān)于式6,在一個實施方案中,ε1和ε2常數(shù)被賦予如下原子值,分別為C0.245,N0.283,O0.316,S0.316(即分別對于碳、氮、氧和硫原子)。對于式5和6,給予范德華半徑如下原子值,分別為C1.85,N1.75,O1.60,S2.00。
應(yīng)當(dāng)理解上述等式中所有預(yù)定的值和給定的常數(shù)都是在現(xiàn)有的對蛋白配體相互作用的理解局限內(nèi)具體相對于此處所用的計算類型確定的。因此,隨著這種評分函數(shù)的進(jìn)一步精練,這些值和常數(shù)也會因此而改變,任何能在蛋白和配體結(jié)合能的評估方面給出所需結(jié)果的適宜數(shù)值均可使用,而且,其也落入本發(fā)明的保護(hù)范圍。
如上所述,所述的評分函數(shù)應(yīng)用于由上述側(cè)鏈構(gòu)象、原子身份和原子間距數(shù)據(jù)庫中提取的數(shù)據(jù)。為本說明書的目的,該數(shù)據(jù)庫中包含的MHC II類分子數(shù)是42個模型加上4個已解析的結(jié)構(gòu)。從上述描述中可清楚地了解到,本發(fā)明的計算機構(gòu)建方法的模塊性質(zhì)意味著,可簡單地添加新的模型,并利用肽主鏈文庫和側(cè)鏈構(gòu)象搜索功能進(jìn)行掃描以創(chuàng)建其它的可通過上述的肽評分函數(shù)處理的數(shù)據(jù)集。這使得經(jīng)掃描的MHCII類分子庫可以很容易地增加,或者如果可以獲得相關(guān)數(shù)據(jù),則可以替換結(jié)構(gòu)和相關(guān)數(shù)據(jù)以創(chuàng)建現(xiàn)有等位基因的更精確的模型。
本發(fā)明的預(yù)測方法可以相對于包含大量已通過實驗確定了其對不同MHC II類分子的親和力的肽的數(shù)據(jù)集進(jìn)行校準(zhǔn)。將計算值與實驗數(shù)據(jù)相比較,可確定一截斷值,已知該值之上所有經(jīng)實驗確定的T-細(xì)胞表位都得以正確的預(yù)測。
應(yīng)當(dāng)理解,盡管上述評分函數(shù)與現(xiàn)有的一些復(fù)雜方法相比相對簡單,但計算進(jìn)行得非常迅速。還應(yīng)當(dāng)理解的是,其目的并不在于計算出對接到所選擇的MHC II類蛋白結(jié)合溝內(nèi)的每種肽的真正結(jié)合能本身。根本的目的在于獲得相對的結(jié)合能數(shù)據(jù)以助于根據(jù)所選蛋白的一級結(jié)構(gòu)(即氨基酸序列)預(yù)測T-細(xì)胞表位的定位。相對高的結(jié)合能或結(jié)合能高于選定的閾值意味著在配體中存在T-細(xì)胞表位。然后可以將所述配體進(jìn)行至少一輪氨基酸替代,并再次計算結(jié)合能。由于計算可迅速進(jìn)行,對肽序列的這些操作可在現(xiàn)有成本劃算的計算機硬件上于程序用戶界面中互動進(jìn)行。由此不需要對計算機硬件進(jìn)行大量投資。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)了解,也可使用其他軟件達(dá)到相同的目的。特別是可以使用能將配體對接入蛋白結(jié)合位點的更復(fù)雜的軟件,并與能量最小化相結(jié)合。對接軟件的例子包括DOCK(Kuntz等,J.Mol.Biol.,161269-288(1982)),LUDI(Bhm,H.J.,J.Comput Aided Mol.Des.,8623-632(1994))和FLEXX(Rarey M.等,ISMB,3300-308(1995))。分子建模和操作軟件的例子包括AMBER(Tripos)和CHARMm(MolecularSimulations Inc.)。使用這些計算機方法將嚴(yán)重限制本發(fā)明方法的信息吞吐量,這是由于進(jìn)行必要的計算所需的處理時間導(dǎo)致的。但是可行的方式為,將這些方法作為‘二級篩選’以獲得關(guān)于通過本發(fā)明的方法發(fā)現(xiàn)為‘陽性結(jié)合體’的肽的更精確的肽結(jié)合能計算值。用于復(fù)雜的分子機械或分子動力學(xué)計算的處理時間的限制是由進(jìn)行所述計算的軟件設(shè)計和目前計算機硬件技術(shù)限制共同確定的??梢灶A(yù)期在將來,隨著編寫更高效的代碼和計算機處理器速度的不斷提高,在更易控制的時間框架內(nèi)進(jìn)行上述計算是可行的。
有關(guān)用于大分子的能量函數(shù)的其他信息和有關(guān)在折疊蛋白結(jié)構(gòu)內(nèi)發(fā)生的多種相互作用的考慮可參考下述文獻(xiàn)Brooks,B.R.,等.,J.Comput.Chem.,4187-217(1983),有關(guān)蛋白-配體一般相互作用的信息參見Dauber-Osguthorpe等,Proteins 4(1)31-47(1988),這些文獻(xiàn)均全文引入作為參考。其他有用的背景資料也可參見Fasman,G.D.編,Prediction of Protein Structure and the Principles of ProteinConformation,Plenum Press,New York,ISBN0-306 4313-9。
權(quán)利要求
1.一種經(jīng)修飾的分子,其具有角質(zhì)形成細(xì)胞生長因子(KGF)的生物學(xué)活性,且當(dāng)其在體內(nèi)應(yīng)用時基本上無免疫原性或免疫原性低于任何具有相同生物學(xué)活性但未經(jīng)修飾的分子。
2.如權(quán)利要求1所述的分子,其中,所述的免疫原性喪失是通過從原始的未經(jīng)修飾的分子中去除一個或多個T-細(xì)胞表位而實現(xiàn)的。
3.如權(quán)利要求1或2所述的分子,其中,所述的免疫原性喪失是通過減少能與由所述分子衍生的肽相結(jié)合的MHC同種異型的數(shù)量來實現(xiàn)的。
4.如權(quán)利要求2或3所述的分子,其中,去除了一個T-細(xì)胞表位。
5.如權(quán)利要求2-4中任意一項所述的分子,其中,原本存在的T-細(xì)胞表位是MHC II類配體,或表現(xiàn)出經(jīng)II類分子呈遞作用后有刺激或結(jié)合T-細(xì)胞的能力的肽序列。
6.如權(quán)利要求5所述的分子,其中,所述的肽序列選自如表1所示的組。
7.如權(quán)利要求2-6中任意一項所述的分子,其中,任何原本存在的T-細(xì)胞表位中的1-9個氨基酸殘基發(fā)生了改變。
8.如權(quán)利要求7所述的分子,其中,有一個氨基酸殘基發(fā)生了改變。
9.如權(quán)利要求7或8所述的分子,其中,所述氨基酸殘基的改變是用其他的氨基酸殘基在特定的位置替代原本存在的氨基酸殘基。
10.如權(quán)利要求9所述的分子,其中,按表2所示進(jìn)行一個或多個氨基酸殘基的替代。
11.如權(quán)利要求10所述的分子,其中,另外還按表3所示進(jìn)行一個或多個氨基酸殘基的替代以減少能與由所述分子衍生的肽相結(jié)合的MHC同種異型的數(shù)量。
12.如權(quán)利要求9所述的分子,其中,按表3所示進(jìn)行一個或多個氨基酸的替代。
13.如權(quán)利要求7或8所述的分子,其中,所述氨基酸殘基的改變是在特定的位置缺失原本存在的氨基酸殘基。
14.如權(quán)利要求7或8所述的分子,其中,所述氨基酸殘基的改變是在特定的位置向原始序列中添加氨基酸殘基。
15.如權(quán)利要求7-14中任意一項所述的分子,其中,通過進(jìn)一步的改變恢復(fù)所述分子的生物學(xué)活性。
16.如權(quán)利要求15所述的分子,其中,進(jìn)一步的改變是替代、添加或缺失特定的氨基酸。
17.如權(quán)利要求7-16中任意一項所述的分子,其中,所述氨基酸的改變是參照同源蛋白序列進(jìn)行的。
18.如權(quán)利要求7-16中任意一項所述的分子,其中,所述氨基酸的改變是參照計算機模擬技術(shù)進(jìn)行的。
19.編碼權(quán)利要求1-18中任意一項所述的經(jīng)修飾角質(zhì)形成細(xì)胞生長因子(KGF)的DNA序列。
20.一種藥物組合物,其包含上述任意一項權(quán)利要求中所定義的具有角質(zhì)形成細(xì)胞生長因子(KGF)生物學(xué)活性的經(jīng)修飾分子,并可任選地包含藥學(xué)上可接受的載體、稀釋劑或賦形劑。
21.制造上述任意一項權(quán)利要求中所定義的具有角質(zhì)形成細(xì)胞生長因子(KGF)生物學(xué)活性的經(jīng)修飾分子的方法,該方法包括下述步驟(i)確定所述多肽或其中一部分的氨基酸序列;(ii)通過任意方法,包括利用體外或計算機技術(shù)或生物學(xué)試驗確定所述肽與MHC分子的結(jié)合,由此鑒定所述蛋白的氨基酸序列中潛在的一個或多個T-細(xì)胞表位;(iii)設(shè)計新的序列變異體,其中,經(jīng)鑒定的潛在T-細(xì)胞表位內(nèi)有一個或多個氨基酸經(jīng)過修飾,由此基本上減弱或去除了所述T-細(xì)胞表位的活性,這一效果可由體外或計算機技術(shù)或生物學(xué)試驗通過所述肽與MHC分子的結(jié)合來確定,或通過肽-MHC復(fù)合物與T-細(xì)胞的結(jié)合來確定;(iv)通過重組DNA技術(shù)構(gòu)建所述序列變異體,并檢測所述的變異體以便鑒定一個或多個具有所需性質(zhì)的變異體;和(v)任選地重復(fù)步驟(ii)-(iv)。
22.如權(quán)利要求21所述的方法,其中步驟(iii)是通過在任何原本存在的T-細(xì)胞表位中替代、添加或缺失1-9個氨基酸殘基來進(jìn)行的。
23.如權(quán)利要求22所述的方法,其中,所述的改變是參照同源蛋白序列和/或計算機模擬技術(shù)進(jìn)行的。
24.如權(quán)利要求21-23中任意一項所述的方法,其中,步驟(ii)是通過下述步驟進(jìn)行的(a)在所述的肽中選擇一個具有已知氨基酸序列的區(qū)域;(b)然后由所選擇的區(qū)域中順序抽取預(yù)定統(tǒng)一大小且至少由3個氨基酸殘基組成的重疊氨基酸殘基片段;(c)通過對存在于抽樣氨基酸殘基片段中的每個疏水氨基酸殘基側(cè)鏈賦值求和,計算每一抽樣片段的MHC II類分子結(jié)合值;和(d)根據(jù)計算出的該片段的MHC II類分子結(jié)合分值鑒定至少一個適于修飾的片段,以在基本上不減弱所述肽的治療功效的前提下改變整體的MHC II類的結(jié)合分值。
25.如權(quán)利要求24所述的方法,其中,步驟(c)通過下述步驟利用經(jīng)改進(jìn)而包含了12-6范德華配體-蛋白能量排序項和配體構(gòu)象能量項的Bhm評分函數(shù)進(jìn)行,所述步驟為(1)提供MHC II類分子模型第一數(shù)據(jù)庫;(2)提供所述MHC II類分子模型的容許肽主鏈的第二數(shù)據(jù)庫;(3)從所述的第一數(shù)據(jù)庫中篩選模型;(4)從所述的第二數(shù)據(jù)庫中篩選容許肽主鏈;(5)鑒定在每個抽樣片段中存在的氨基酸殘基側(cè)鏈;(6)確定存在于每個抽樣片段中的所有側(cè)鏈的結(jié)合親和性值;以及對每一模型和每一所述的主鏈重復(fù)步驟(1)到(5)。
26.一種選自表1所示組的13肽T-細(xì)胞表位肽,其具有潛在的MHC II類結(jié)合活性且由未經(jīng)免疫遺傳修飾的角質(zhì)形成細(xì)胞生長因子(KGF)構(gòu)建。
27.一種肽序列,其由如權(quán)利要求26所述的13肽T-細(xì)胞表位肽中的至少9個連續(xù)的氨基酸殘基組成。
28.如權(quán)利要求26所述的13肽T-細(xì)胞表位肽用于生產(chǎn)在體內(nèi)使用時基本上沒有免疫原性或免疫原性低于具有相同生物學(xué)活性的任何未經(jīng)修飾的分子的角質(zhì)形成細(xì)胞生長因子(KGF)的用途。
29.如權(quán)利要求27所述的肽序列用于生產(chǎn)在體內(nèi)使用時基本上沒有免疫原性或免疫原性低于具有相同生物學(xué)活性的任何未經(jīng)修飾的分子的角質(zhì)形成細(xì)胞生長因子(KGF)的用途。
全文摘要
本發(fā)明涉及尤其是用于對人施用的、特別是用于治療的多肽。所述的多肽是經(jīng)修飾的多肽,其中,所述的修飾使得上述多肽在施用于人體時引起免疫應(yīng)答的傾向減弱。本發(fā)明特別涉及對角質(zhì)形成細(xì)胞生長因子(KGF)進(jìn)行修飾以產(chǎn)生角質(zhì)形成細(xì)胞生長因子(KGF)蛋白,該蛋白在體內(nèi)使用時基本上無免疫原性,或比未經(jīng)修飾的相應(yīng)蛋白的免疫原性低。
文檔編號G06F19/16GK1491231SQ02804610
公開日2004年4月21日 申請日期2002年2月5日 優(yōu)先權(quán)日2001年2月6日
發(fā)明者F·J·卡爾, F J 卡爾, G·卡特, T·瓊斯, S·威廉斯 申請人:默克專利有限公司