两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

確定蛋白溶解性的方法

文檔序號(hào):440462閱讀:2150來(lái)源:國(guó)知局

專利名稱::確定蛋白溶解性的方法
技術(shù)領(lǐng)域
:本發(fā)明涉及在候選蛋白的表達(dá)文庫(kù)中篩選可溶候選蛋白表達(dá)的方法。所述方法包括將文庫(kù)中的每種候選蛋白融合到肽底物上,并且通過(guò)檢測(cè)所述肽底物的酶促修飾而鑒定表達(dá)可溶候選蛋白的細(xì)胞。本文引用的所有出版物、專利和專利申請(qǐng)通過(guò)參考完全結(jié)合于此。
背景技術(shù)
:最近幾年來(lái)結(jié)構(gòu)基因組已經(jīng)引起了逐漸增加的興趣。蛋白結(jié)構(gòu)的闡明對(duì)于增加對(duì)蛋白功能的理解并且由此促進(jìn)藥物開(kāi)發(fā)是重要的。蛋白表達(dá)和純化是這樣的研究的主要步驟,并且通常受到產(chǎn)生正確折疊的重組蛋白的能力的限制。應(yīng)用大腸桿菌(Escherichiacoli(E.coli))表達(dá)系統(tǒng)進(jìn)行結(jié)構(gòu)和功能分析的蛋白制備通常受到形成不溶的細(xì)胞內(nèi)蛋白聚集物(包涵體)、蛋白酶降解或缺少表達(dá)的干擾。大腸桿菌是一種常見(jiàn)的表達(dá)宿主,當(dāng)迫使其過(guò)量產(chǎn)生非自身的基因產(chǎn)物時(shí),其常常形成錯(cuò)誤折疊的蛋白。這嚴(yán)重地限制了蛋白在諸如通過(guò)結(jié)晶學(xué)和NMR進(jìn)行結(jié)構(gòu)分析的領(lǐng)域內(nèi)的應(yīng)用,并且限制了目前結(jié)構(gòu)基因組工程的綜合成功率。用于不溶表達(dá)蛋白難題的常規(guī)方法包括低溫表達(dá),應(yīng)用具有不同強(qiáng)度的啟動(dòng)子、各種增強(qiáng)溶解度的融合標(biāo)記(KapustRB&WaughDS.‘Escherichiacolimaltose-bindingproteinisuncommonlyeffectiveatpromotingthesolubilityofpolypeptidestowhichitisfused’.ProteinSci.1999Aug;8(8)1668-74),并且改進(jìn)生長(zhǎng)培養(yǎng)基(MakridesSC‘Strategiesforachievinghigh-levelexpressionofgenesinEscherichiacoli’.MicrobiolRev.1996Sep;60(3)512-38.綜述)。另一種克服這一難題的方法是通過(guò)從目的蛋白的氨基酸序列進(jìn)行結(jié)構(gòu)預(yù)測(cè)。將諸如同源性比對(duì)和二級(jí)結(jié)構(gòu)預(yù)測(cè)的信息用于預(yù)測(cè)穩(wěn)定的、可溶的結(jié)構(gòu)域的位置。首先構(gòu)建目標(biāo)蛋白的剪截體或突變體,然后表達(dá)并且檢測(cè)溶解性。盡管持續(xù)地進(jìn)展,但是完全‘推理性地’設(shè)計(jì)具有理想的特性諸如穩(wěn)定性或可溶性表達(dá)的蛋白,至少到目前為止通常是不可行的。即使存在大量的結(jié)構(gòu)和機(jī)械論信息,也很難預(yù)測(cè)所需要的必要的序列剪截體。關(guān)于氨基酸序列怎樣影響蛋白結(jié)構(gòu)的每一方面,從其在異源宿主中表達(dá)的穩(wěn)定性到其在非自身環(huán)境中折疊的能力,仍然只有很少的信息。實(shí)驗(yàn)已經(jīng)證明,蛋白特性的變化由許多小調(diào)整的累積效應(yīng)引起,許多這些小調(diào)整沿著蛋白分子內(nèi)的顯著距離分布或者擴(kuò)散,并且目前生物信息程序不能準(zhǔn)確地預(yù)測(cè)哪些剪截或突變將增加蛋白的可溶性。在常規(guī)結(jié)構(gòu)工程中,可以構(gòu)建幾十種克隆并且檢測(cè)可溶蛋白的表達(dá)。在這樣的工程中,可能的多樣性遠(yuǎn)遠(yuǎn)沒(méi)有得到充分地取樣,并且通常找不到解決方案。另外,由于許多蛋白從基因組序列預(yù)測(cè)而來(lái),沒(méi)有已知的同源性,并且這限制了生物信息方法的作用。當(dāng)標(biāo)準(zhǔn)方法不起作用時(shí),可以證明高通量的篩選策略能有效地發(fā)現(xiàn)可溶的構(gòu)建體。這些需要對(duì)大量的表達(dá)克隆進(jìn)行準(zhǔn)確的分析,以鑒定適宜的構(gòu)建體用于結(jié)構(gòu)確定。如果完整的蛋白不表達(dá)或結(jié)晶,下一步驟是產(chǎn)生剪截體或隨機(jī)突變體并且重新檢測(cè)。盡管(i)現(xiàn)有的方法允許產(chǎn)生非常大的表達(dá)文庫(kù);和(ii)文庫(kù)含有可溶蛋白的機(jī)會(huì)隨著文庫(kù)的大小而增加,但是,由現(xiàn)有的篩選表達(dá)文庫(kù)的方法強(qiáng)加的應(yīng)用局限限制了這一應(yīng)用。希望表達(dá)可溶的或結(jié)晶形式的目的蛋白的實(shí)驗(yàn)者的最終目的是合成目的蛋白的所有可能的變體,并且篩選它們的可溶表達(dá)。表達(dá)可溶蛋白的克隆可以直接應(yīng)用,或者可以用于接種下一輪的文庫(kù)構(gòu)建和篩選。這樣的實(shí)驗(yàn)將產(chǎn)生大量的克隆,然后其必須進(jìn)行可溶目的蛋白表達(dá)的篩選。已經(jīng)描述了一些具有鑒定目的候選蛋白的可溶變體(通過(guò)隨機(jī)誘變或剪截而產(chǎn)生)目的的系統(tǒng)。在融合報(bào)道分子方法中,候選蛋白和具有易于檢測(cè)特征或生物活性的報(bào)道蛋白作為遺傳融合體進(jìn)行表達(dá)。關(guān)于所述蛋白折疊狀態(tài)的信息可以來(lái)源于所述融合報(bào)道結(jié)構(gòu)域的篩選或選擇活性。融合報(bào)道分子方法通常包括C端伴侶“可溶性報(bào)道分子”(例如,綠色熒光蛋白(GFP)、氯霉素乙?;D(zhuǎn)移酶(CAT)或β半乳糖酐酶)的融合。在GFP融合報(bào)道分子方法中,GFP的熒光產(chǎn)量提供關(guān)于其融合伴侶的折疊狀態(tài)的信息。表達(dá)融合到很差折疊的不溶蛋白上的GFP的細(xì)胞發(fā)出的熒光不如表達(dá)融合到很好折疊的可溶蛋白上的GFP的那些細(xì)胞亮。GFP監(jiān)測(cè)檢測(cè)蛋白的折疊產(chǎn)量,其隨后進(jìn)行沒(méi)有GFP標(biāo)記的表達(dá)(WaldoGS‘Geneticscreensanddirectedevolutionforproteinsolubility’.CurrOpinChemBiol.2003Feb;7(1)33-8.綜述)。本發(fā)明人先前已經(jīng)研發(fā)了一種融合報(bào)道分子系統(tǒng),其基于生物素羧基載體蛋白(BCCP)作為蛋白-折疊標(biāo)記的應(yīng)用。在這一系統(tǒng)中,將來(lái)自大腸桿菌BCCP的生物素化結(jié)構(gòu)域融合到檢測(cè)蛋白上。這一結(jié)構(gòu)域正確折疊的二級(jí)和三級(jí)結(jié)構(gòu)由內(nèi)源宿主細(xì)胞生物蛋白連接酶識(shí)別,其將所述結(jié)構(gòu)域生物素化。對(duì)于生物素基團(tuán)的存在,表達(dá)正確折疊的檢測(cè)蛋白和BCCP結(jié)構(gòu)域的宿主細(xì)胞將檢測(cè)為陽(yáng)性(WO03/064656‘Proteintagcomprisingabiotinylationdomainandmethodforincreasingsolubilityanddeterminingfoldingstate’)。然而,存在與這些系統(tǒng)相關(guān)的問(wèn)題,這限制了它們的適用性。自動(dòng)折疊報(bào)道分子蛋白的應(yīng)用(例如,GFP,CAT,β-gal或BCCP結(jié)構(gòu)域),由于它們的巨大和可溶的性質(zhì),可以產(chǎn)生有疑問(wèn)的假陽(yáng)性率。由于所述報(bào)道分子可以耐受另外不溶的蛋白X片段或全長(zhǎng)蛋白的融合,而其自身沒(méi)有變得不溶,所以這可以產(chǎn)生大量的假陽(yáng)性率。當(dāng)標(biāo)記可以位于適當(dāng)?shù)奈恢?,例如,?dāng)通過(guò)標(biāo)記固定蛋白或者在純化的蛋白上進(jìn)行生物化學(xué)分析時(shí),這可以不是問(wèn)題,但是,許多應(yīng)用,例如,蛋白結(jié)晶學(xué),需要通過(guò)蛋白酶分解或遺傳刪除而去除所述標(biāo)記;通過(guò)處理一旦標(biāo)記去除隨后就將聚集或降解的克隆而失去了許多時(shí)間和花費(fèi),并且因此是不可用的。對(duì)于融合蛋白,也可以在體內(nèi)表達(dá)過(guò)程中通過(guò)蛋白水解而降解,其留下產(chǎn)生假陽(yáng)性結(jié)果的可溶熒光報(bào)道分子。對(duì)于融合蛋白,諸如那些含有麥芽糖結(jié)合蛋白、谷胱甘肽-S-轉(zhuǎn)移酶、GFP、硫氧還蛋白的融合蛋白,這些作用是非常常見(jiàn)的,并且大概是一種普遍作用。因此,高度可溶的融合伴侶作為可溶性報(bào)道分子的存在強(qiáng)烈地?cái)_亂了與之融合的蛋白的可溶性。此外,先前公開(kāi)的大多數(shù)融合蛋白是大蛋白。例如,GFP融合增加了蛋白的大小約37kDa。在大腸桿菌中表達(dá)大融合蛋白是有困難的,其具有約100kDa的應(yīng)用限制。當(dāng)與實(shí)驗(yàn)和序列/結(jié)構(gòu)數(shù)據(jù)庫(kù)分析組合時(shí),模擬研究可以幫助描述負(fù)責(zé)蛋白定型的主要進(jìn)化因素。然而,這樣的研究的潛力還沒(méi)有得到充分地開(kāi)發(fā)。因此,在本領(lǐng)域中,存在這樣的主要需求,即,研發(fā)一種在從克隆到結(jié)構(gòu)確定的全過(guò)程中盡可能早的快速的、高通量的和可靠的篩選表達(dá)蛋白的方法,其允許選擇可溶表達(dá)的蛋白。適宜的方法應(yīng)該允許大量含有不同變體序列的分子的高通量篩選,選擇步驟允許容易地鑒定具有提高的溶解度的分子。這樣的方法對(duì)個(gè)體蛋白變體表達(dá)文庫(kù)的高通量分析的服從性,特別當(dāng)與突變或剪截方法策略組合應(yīng)用以能夠鑒定并且分離不溶蛋白的可溶變體時(shí),將使得有問(wèn)題的蛋白的高水平表達(dá)的最優(yōu)化更能夠獲得并且更不費(fèi)力。另外,所述方法應(yīng)該尋求i)將任何融合伴侶的干擾作用(pertubatoryeffects)減到最小,并且ii)應(yīng)該將結(jié)構(gòu)分析所需要的下游步驟諸如移除融合的標(biāo)記的步驟減到最少;蛋白通常與小肽一起結(jié)晶,但是很少作為二結(jié)構(gòu)域融合體結(jié)晶。發(fā)明概述本發(fā)明包括可以選擇不溶蛋白的可溶變體的機(jī)制。在這些機(jī)制中,可以操作、翻譯和表達(dá)不溶蛋白的編碼區(qū),以確定特殊的操作是否產(chǎn)生可溶變體。因此,影響不溶蛋白的溶解的因素可以通過(guò)對(duì)其編碼核酸分子測(cè)序而確定。因此,所述機(jī)制還給出影響溶解性的蛋白特征的重要理解。按照本發(fā)明的一方面,提供了在多種變體候選蛋白中篩選可溶候選蛋白的方法,其中將每種候選蛋白融合到肽底物上,以致可溶的候選蛋白通過(guò)檢測(cè)所述肽底物的酶促修飾而得到鑒定。這種新穎的方法不依賴于展現(xiàn)出某種可檢測(cè)活性的肽底物本身,諸如在GFP情形中的內(nèi)在熒光,或者在氯霉素乙?;D(zhuǎn)移酶情形中的酶促周轉(zhuǎn)。將這樣的肽用作溶解性報(bào)道分子的潛在原理是,只有可溶的分子是酶的有效底物。因此,只有當(dāng)肽融合到可溶的候選蛋白上時(shí),它才可以作為酶的直接底物,而不需要肽本身的折疊。然而,如果它被融合到不溶的蛋白上,那么它與肽-修飾的酶活性位點(diǎn)的相互作用由于空間和擴(kuò)散原因而被嚴(yán)重地限制,并且將發(fā)生可以忽略的酶促修飾,這導(dǎo)致陰性的、未修飾的表型。另外,如果肽在大腸桿菌中獨(dú)立地表達(dá)(如果融合到基因或基因片段的閱讀框之外,這將發(fā)生),它們通常是不穩(wěn)定的、易蛋白水解的,并且因此從細(xì)胞中去除,這又導(dǎo)致默認(rèn)的陰性表型。所述方法適用于表達(dá)文庫(kù)的高通量分析,例如,當(dāng)與蛋白剪截策略組合應(yīng)用時(shí)。由于制備并且在單一步驟中檢測(cè)大量的變體,這極大地增加了成功鑒定可溶并且理想地高度表達(dá)的候選蛋白的機(jī)會(huì)。所述肽底物是小的并且惰性的,并且因此不能顯著地改變它與之融合的候選蛋白的物理特征。在這種情形中,術(shù)語(yǔ)“不顯著”,或者其變體,與物理特征的改變的關(guān)系意指在+/-50%之間或更少的物理特征的變化,例如,+/-45%或更少,+/-40%或更少,+/-35%或更少,+/-30%或更少,+/-25%或更少,+/-20%或更少,+/-15%或更少,+/-13%或更少,+/-10%或更少,或者更少。優(yōu)選地,所述肽底物沒(méi)有改變與之融合的候選蛋白的物理特征。這樣的物理特征包括候選蛋白的溶解性、大小、電荷、折疊和組裝機(jī)制。特別的優(yōu)點(diǎn)是候選蛋白的溶解性既不被干擾也不被增強(qiáng)。這限制了假陽(yáng)性結(jié)果的發(fā)生,假陽(yáng)性結(jié)果是現(xiàn)有技術(shù)方法中常見(jiàn)的并且與耐受另外不溶的蛋白片段的融合的大的、折疊的、可溶報(bào)道分子的應(yīng)用相關(guān)。本發(fā)明的另一個(gè)優(yōu)點(diǎn)是所述方法允許要制備的候選蛋白的產(chǎn)量和溶解性的定量分析以及定性分析。這允許使用者選擇編碼特別可溶的候選蛋白的克隆用于分析和/或操作和篩選的其它步驟。當(dāng)用于本文時(shí),術(shù)語(yǔ)“候選蛋白”可以是任何蛋白或肽,合成的或天然存在的,包括蛋白片段、多肽、多聚體蛋白、重組蛋白、融合體和雜交蛋白、抗體等。按照本發(fā)明,“肽底物”包括任何肽的短區(qū)域,其包括通過(guò)肽鍵和修飾的肽鍵彼此連接的氨基酸,即,肽等構(gòu)物。這一術(shù)語(yǔ)是指5和20個(gè)氨基酸之間的短肽鏈,以及20和50個(gè)氨基酸之間的更長(zhǎng)的肽鏈。這樣的肽可以融合到候選蛋白上,并且必須能夠作用為酶的底物,以致當(dāng)可溶時(shí),所述肽底物被酶促作用修飾。優(yōu)選地,所述肽底物相對(duì)于與之融合的候選蛋白是小的。例如,在大的候選蛋白的情形中,肽底物的大小應(yīng)該逐漸變小就不是那么重要,并且可以耐受稍微更大的肽底物,其不會(huì)干擾候選蛋白結(jié)構(gòu)干擾并且因此引起假陽(yáng)性結(jié)果。相反,在小的候選蛋白的情形中,所述肽底物理想地應(yīng)該盡可能小。優(yōu)選地,所述肽底物的長(zhǎng)度不超過(guò)候選蛋白長(zhǎng)度的20%;更優(yōu)選地,不超過(guò)候選蛋白長(zhǎng)度的15%;甚至更優(yōu)選地,不超過(guò)候選蛋白長(zhǎng)度的10%;并且甚至更優(yōu)選地,不超過(guò)候選蛋白長(zhǎng)度的5%。優(yōu)選地,所述肽底物是短的,長(zhǎng)度為50個(gè)氨基酸或更小,例如,45個(gè)或更少、40個(gè)或更少、35個(gè)或更少、30個(gè)或更少、25個(gè)或更少、20個(gè)或更少、15個(gè)或更少、13個(gè)或更少、10個(gè)或更少氨基酸、或更小。優(yōu)選地,所述肽底物是線性的,并且沒(méi)有三級(jí)結(jié)構(gòu)。這意味著,所述肽不能折疊成二級(jí)結(jié)構(gòu)基序的有結(jié)構(gòu)的、三維排列。優(yōu)選的肽底物包括作為生物素蛋白連接酶的底物的肽。這樣的肽底物的一個(gè)實(shí)例是由Schatz(1993)和Beckett等.(1999)描述的15個(gè)氨基酸的肽[SchatzPJ(1993)Useofpeptidelibrariestomapsubstratespecificityofapeptide-modifyingenzymea13residueconsensuspeptidespecifiesbiotinylationinEscherichiacoliBiotechnology,11138-1143;Becket等.(1999)Aminimalpeptidesubstrateinbiotinholoenzymesynthetase-catalysedbiotinylationProteinScience8921-929]。這一肽的序列是GLNDIFEAQKIEWHE,并且還存在一些相近的變體。當(dāng)與可溶蛋白融合時(shí),所述肽作為生物素蛋白連接酶的底物,所述生物素蛋白連接酶是一種將生物素-AMP的生物素分子轉(zhuǎn)移到所述序列下劃線標(biāo)記的賴氨酸殘基上的酶。當(dāng)不融合,或者融合到不溶伴侶上時(shí),它是效率很低的底物。用于生物素蛋白連接酶底物的肽底物的應(yīng)用允許蛋白通過(guò)使用鏈霉抗生物素蛋白綴合物檢測(cè)而篩選溶解性。例如,可以應(yīng)用蛋白質(zhì)印跡類型或點(diǎn)印跡,其中鏈霉抗生物素蛋白-過(guò)氧化物酶綴合物可以用化學(xué)發(fā)光進(jìn)行檢測(cè),或者直接使用熒光標(biāo)記的鏈霉抗生物素和熒光成像儀器例如AmershamTyphoon進(jìn)行檢測(cè)。能夠與生物素結(jié)合的其它化合物包括中性抗生物素蛋白(neutravidin)、抗生物素蛋白和單聚體抗生物素蛋白。優(yōu)選的肽底物還包括作用為共表達(dá)的激酶諸如例如酪蛋白激酶II(一種在真核細(xì)胞中普遍存在的絲氨酸/蘇氨酸蛋白激酶)的底物的肽。當(dāng)與可溶蛋白融合時(shí),肽(例如,RRRDDDSDDD)作用為所述激酶的底物,并且在特異性殘基(S)被磷酸化。如先前所述,當(dāng)不融合,或者融合到不溶的伴侶上時(shí),肽的有效的磷酸化不會(huì)發(fā)生。使用特異性的抗磷酸抗體檢測(cè)磷酸化的肽底物??沽姿峥贵w與磷酸肽的結(jié)合可以直接檢測(cè),例如,使用熒光標(biāo)記的抗磷酸抗體綴合物。正如有經(jīng)驗(yàn)的讀者應(yīng)該理解的那樣,存在許多方法,其中所述肽底物可以被融合到候選蛋白上。例如,所述肽底物可以通過(guò)非共價(jià)鍵融合到候選蛋白上。所述肽底物可以在翻譯后融合到候選蛋白上,例如,通過(guò)內(nèi)含肽生物學(xué)。優(yōu)選地,所述肽底物可以通過(guò)共價(jià)鍵融合到候選蛋白上,例如,通過(guò)肽鍵,通過(guò)化學(xué)連接等。優(yōu)選地,所述肽底物作為遺傳融合體,與候選蛋白形成重組融合蛋白而表達(dá)。在這樣的遺傳融合體的情形中,所述肽底物與候選蛋白成分的附著可以優(yōu)選地使用編碼融合蛋白氨基酸序列的重組DNA構(gòu)建體而獲得,所述重組DNA構(gòu)建體使得編碼所述肽底物的DNA在編碼候選蛋白的DNA的相同的閱讀框內(nèi)。所述肽底物可以位于候選蛋白的氨基或羧基末端,或者可以在蛋白內(nèi)部,例如,作為位于候選蛋白結(jié)構(gòu)外的環(huán)。優(yōu)選地,將所述肽底物融合到候選蛋白的氨基或羧基末端。按照本發(fā)明,‘酶促修飾’包括肽底物的任何可被檢測(cè)到的修飾,例如,通過(guò)與標(biāo)記或標(biāo)簽結(jié)合,從肽上添加或者刪除化學(xué)部分,化學(xué)狀態(tài)的改變,諸如磷酸化、甲基化、乙?;?、遍在蛋白化、蘇素化、豆蔻酰化或糖基化而實(shí)現(xiàn)。例如,由于肽底物的適當(dāng)設(shè)計(jì),由修飾酶賦予的變化可以激活抗生素抗性基因的表達(dá),這允許用抗生素選擇成功的候選子,或者激活表型標(biāo)記基因的表達(dá),諸如編碼綠色熒光蛋白或β-半乳糖酐酶的基因,這允許一種物理富集方法,諸如FACS(fluorescentactivatedcellsorting,熒光活化的細(xì)胞分類)。優(yōu)選地,所述肽底物通過(guò)酶促反應(yīng)而被生物素化。其它適當(dāng)類型的修飾對(duì)于有經(jīng)驗(yàn)的讀者是顯而易見(jiàn)的。在一個(gè)備選實(shí)施方案中,所述肽底物可以以某種方式影響底物修飾蛋白的活性,例如,通過(guò)作用為酶促反應(yīng)的輔因子,以致底物修飾蛋白的活性作為候選蛋白的溶解性的結(jié)果而被特異性地升高或者降低。在這種方法中,如果表達(dá)的候選分子是可溶的,那么可以基于底物修飾蛋白的活性或無(wú)活性,例如,用攜帶減輕突變的作用的肽的蛋白來(lái)互補(bǔ)(complementation)無(wú)活性的突變酶,而將編碼候選分子的具體的細(xì)胞分離出來(lái)。在按照本發(fā)明應(yīng)用的優(yōu)選的肽的情形中,所述肽為生物素蛋白連接酶的底物,所述酶促修飾是肽的生物素化狀態(tài)的改變。為了發(fā)生酶促修飾,需要存在一種能夠進(jìn)行需要的修飾反應(yīng)的酶。所述酶可以獨(dú)立地添加到反應(yīng)混合物中,或者它可以內(nèi)在包含在反應(yīng)系統(tǒng)中,例如,在其中進(jìn)行篩選方法的宿主細(xì)胞中天然表達(dá)。例如,所述細(xì)胞可以組成型地表達(dá)具有作為修飾底物-修飾酶的底物活性的蛋白。在一個(gè)備選實(shí)施方案中,所述宿主細(xì)胞轉(zhuǎn)化染色體外的元件,諸如質(zhì)粒、附加體、人造染色體等,它們含有編碼肽底物修飾酶的多聚核苷酸序列。按照本發(fā)明,‘檢測(cè)’是指允許已經(jīng)進(jìn)行肽底物酶促修飾鑒定的任何適宜的方法。一旦被酶改變,肽標(biāo)記必須在某些方面不同,以允許其與未改變的肽底物的區(qū)分。在這種方式中,可溶的候選蛋白可以與不溶的候選蛋白區(qū)分開(kāi)來(lái)。檢測(cè)修飾的肽底物的適當(dāng)方法對(duì)于本領(lǐng)域的技術(shù)人員是顯而易見(jiàn)的,并且當(dāng)然,取決于要應(yīng)用的修飾酶的特性。檢測(cè)可以是關(guān)于改變的肽底物或者未改變的肽底物。優(yōu)選地,檢測(cè)是改變的肽底物的陽(yáng)性檢測(cè)。例如,在本發(fā)明應(yīng)用其生物素化狀態(tài)被改變的肽底物的優(yōu)選實(shí)施方案中,選擇可以是關(guān)于生物素狀態(tài)的改變,并且可以利用由抗生物素蛋白和鏈霉抗生物素蛋白表現(xiàn)出的對(duì)于生物素的高結(jié)合親和力,以允許基于這一結(jié)合對(duì)的高結(jié)合親和力進(jìn)行檢測(cè)。備選地,質(zhì)譜可以通過(guò)監(jiān)測(cè)質(zhì)量變化而提供一種檢測(cè)標(biāo)記修飾的方法。使用這種檢測(cè)方法,不需要結(jié)合伴侶。本發(fā)明候選蛋白的篩選可以在體外進(jìn)行,例如,使用沒(méi)有細(xì)胞的翻譯系統(tǒng),在其中候選蛋白被轉(zhuǎn)錄和翻譯而不是在細(xì)胞中表達(dá)。在這種情形中,在基因型和表型之間必須存在某種聯(lián)系,以致可溶的候選蛋白的選擇允許編碼核酸的伴隨選擇。這允許所述方法的重疊合法(deconvolution),以致引起可溶蛋白產(chǎn)生的有利序列特征可以得到評(píng)估。本領(lǐng)域已知適當(dāng)?shù)姆椒?。例如,最近在?guó)際專利申請(qǐng)WO99/02671中發(fā)表的一種體外系統(tǒng)報(bào)道了用水-在-油乳狀液制備的微膠囊的應(yīng)用,以區(qū)分并且因此分離翻譯系統(tǒng)的成分。優(yōu)選地,候選蛋白在宿主細(xì)胞中表達(dá)。正如有經(jīng)驗(yàn)的讀者應(yīng)該理解的那樣,候選蛋白在其中表達(dá)的任何宿主細(xì)胞系統(tǒng)都應(yīng)該是適宜的,包括原核表達(dá)系統(tǒng),諸如鏈球菌(streptococci)、葡萄球菌(staphylococci)、大腸桿菌、鏈霉菌(Streptomyces)和枯草芽孢桿菌(Bacillussubtilis)細(xì)胞,和真核系統(tǒng),諸如酵母菌(例如,釀酒酵母(S.cerevisiae)和曲霉菌(Aspergillus)細(xì)胞)、昆蟲(chóng)細(xì)胞、植物細(xì)胞和哺乳動(dòng)物細(xì)胞培養(yǎng)物。大腸桿菌是按照本發(fā)明應(yīng)用的一種優(yōu)選的宿主細(xì)胞,部分是由于它表達(dá)內(nèi)源性生物素蛋白連接酶,其這樣允許在宿主細(xì)胞自身內(nèi)進(jìn)行與候選蛋白融合的肽底物的修飾。這一機(jī)制的一種優(yōu)點(diǎn)是基因型和表型之間需要的聯(lián)系維持在每個(gè)細(xì)胞內(nèi),并且因此所述方法允許對(duì)發(fā)現(xiàn)是可溶的候選蛋白的DNA序列進(jìn)行分析。然而,通過(guò)在篩選之前將酶的編碼序列引入所述細(xì)胞,還可以應(yīng)用與這種具體的肽相容的不表達(dá)生物素蛋白連接酶的其它宿主細(xì)胞。對(duì)于在宿主細(xì)胞中的表達(dá),編碼候選蛋白的核酸序列,任選地作為具有肽底物的融合蛋白,應(yīng)該被克隆到一種或多種適當(dāng)?shù)妮d體上。宿主細(xì)胞可以用這樣的載體轉(zhuǎn)化、轉(zhuǎn)染或轉(zhuǎn)導(dǎo),以影響要篩選的候選蛋白的表達(dá)。適當(dāng)?shù)谋磉_(dá)方法對(duì)于本領(lǐng)域的技術(shù)人員是公知的,并且許多方法由Sambrook等(如前所述)和Fernandez與Hoeffler(1998,eds.″Geneexpressionsystems.Usingnaturefortheartofexpression″.AcademicPress,SanDiego,London,Boston,NewYork,Sydney,Tokyo,Toronto)詳細(xì)地描述。一般地,將編碼基因置于控制元件的控制下,諸如啟動(dòng)子、核糖體結(jié)合位點(diǎn)(用于細(xì)菌表達(dá))和,任選地,操縱子,以致編碼需要的多肽的DNA序列在轉(zhuǎn)化的宿主細(xì)胞中轉(zhuǎn)錄成RNA。所述編碼核酸分子可以包括編碼控制序列的序列,諸如信號(hào)肽和前導(dǎo)序列,當(dāng)需要時(shí),例如,用于將翻譯的多肽分泌到內(nèi)質(zhì)網(wǎng)腔內(nèi),分泌到壁膜間隙中或者分泌到胞外環(huán)境中。這些信號(hào)對(duì)于多肽可以是內(nèi)源的,或者它們可以是異源信號(hào)。前導(dǎo)序列可以通過(guò)細(xì)菌宿主在翻譯后加工中被去除。優(yōu)選地,候選蛋白存在于同底物-修飾酶相同的細(xì)胞區(qū)室中。例如,生物素蛋白連接酶是一種細(xì)胞質(zhì)蛋白,并且因此,潛在地用作這種酶的底物的候選蛋白應(yīng)該保留在細(xì)胞質(zhì)中。除了控制序列,可以必要地添加調(diào)控序列,其相對(duì)于宿主細(xì)胞的生長(zhǎng),允許調(diào)控多肽的表達(dá)。所述候選蛋白可以從重組細(xì)胞回收和純化以用于分析,例如,使用公知的方法,諸如硫酸銨或乙醇沉淀、酸提取和層析。然而,為了保持表型和基因型之間的聯(lián)系,必須應(yīng)用某種方法來(lái)允許跟蹤所回收的蛋白的來(lái)源。更簡(jiǎn)單的,可以將表達(dá)候選蛋白的宿主細(xì)胞裂解,并且分析所述肽底物的修飾。通過(guò)記錄可溶的候選蛋白來(lái)源的克隆的歷史(history)而保留基因型和表型之間的必要的聯(lián)系。例如,在本發(fā)明篩選可溶的候選蛋白在宿主細(xì)胞中表達(dá)的實(shí)施方案中,所述宿主細(xì)胞可以簡(jiǎn)單地在硝化-纖維素膜上原位裂解,并且檢測(cè)所述肽底物的修飾,例如,通過(guò)用抗體、鏈霉抗生物素蛋白或其它識(shí)別所修飾的肽底物的檢測(cè)試劑進(jìn)行印跡檢測(cè)。還可以使用專門的載體構(gòu)建來(lái)促進(jìn)蛋白純化,當(dāng)需要時(shí),通過(guò)將編碼本發(fā)明的多肽的序列與編碼促進(jìn)可溶蛋白純化的多肽結(jié)構(gòu)域的核苷酸序列連接而實(shí)現(xiàn)。這樣的純化-促進(jìn)結(jié)構(gòu)域的實(shí)例包括金屬螯合肽,諸如允許在固定的金屬上純化的六組氨酸標(biāo)記和組氨酸-色氨酸組件,允許在固定的免疫球蛋白上純化的蛋白質(zhì)A結(jié)構(gòu)域,和用于FLAGS延伸/親和力純化系統(tǒng)(ImmunexCorp.,Seattle,WA)的結(jié)構(gòu)域。在純化結(jié)構(gòu)域和候選蛋白之間包含的可分解連接序列,諸如對(duì)于因子X(jué)A或腸激酶特異性的那些序列(Invitrogen,SanDiego,CA),可以用來(lái)促進(jìn)純化。由生物素蛋白連接酶產(chǎn)生的生物素化的蛋白也可以使用抗生物素蛋白-衍生的瓊脂糖進(jìn)行純化。所述載體還可以包括功能性選擇標(biāo)記。所述功能性選擇標(biāo)記可以是,例如,抗性基因,諸如卡那霉素、氨芐青霉素、殺稻瘟素、羧芐青霉素、四環(huán)素或氯霉素。所述載體還可以包括缺少關(guān)鍵元件的雙功能選擇標(biāo)記,并且其中當(dāng)用所述元件成功轉(zhuǎn)化細(xì)胞時(shí),所述關(guān)鍵元件由核酸元件提供。所述雙功能選擇標(biāo)記可以是,例如,抗性基因或報(bào)道分子基因,諸如lacZ基因等。當(dāng)然,這些可能的排列可以混合,以致反應(yīng)系統(tǒng)的一些成分從生物體的基因組表達(dá),并且一些從染色體外的元件諸如表達(dá)載體表達(dá)。為了提高成功選擇可溶的候選蛋白的機(jī)會(huì),所述反應(yīng)系統(tǒng)應(yīng)該在適于所述肽底物-修飾蛋白的活性的條件下溫育。例如,在當(dāng)將外源底物修飾蛋白添加到反應(yīng)介質(zhì)中的情形中,應(yīng)該將這一介質(zhì)放置于適于所添加蛋白的活性的條件下。在當(dāng)?shù)孜?修飾蛋白在本篩選方法所用的宿主細(xì)胞中表達(dá)的情形中,宿主細(xì)胞應(yīng)該在適于它們健康生長(zhǎng)和適于所表達(dá)的蛋白的活性的條件下生長(zhǎng)。在這樣的情形中,應(yīng)該在所述系統(tǒng)中存在適當(dāng)?shù)霓D(zhuǎn)錄和翻譯機(jī)制(machinery),以允許底物修飾蛋白從其編碼基因表達(dá)。在大多數(shù)情形中,這一機(jī)制應(yīng)該來(lái)源于細(xì)胞自身。所述方法允許篩選多種候選蛋白變體。實(shí)際上,所述方法的一個(gè)長(zhǎng)處是它允許非常大量的不同變體平行地進(jìn)行活性篩選。這意味著,如果需要,由于所述方法適于高通量的分析,所以,可能對(duì)于一種或多種具體的蛋白的全部或非常大量的可能變體進(jìn)行窮盡的篩選。制備文庫(kù)的方法在本領(lǐng)域內(nèi)是公知的。例如,剪截基因的文庫(kù)可以通過(guò)核酸外切酶III消化進(jìn)行構(gòu)建(Ostermeir&Lutz,“ThecreationofITCHYhybridproteinlibraries”,在MethodsinMolecularBiology第231卷第129-141頁(yè))。例如,為了鑒定已經(jīng)證明很難溶解的蛋白的具體的可溶變體,可以制備剪截體的文庫(kù)。這樣的文庫(kù)可以含有,例如,在所述蛋白N端和C端任一端或者兩端的漸進(jìn)的單個(gè)或多個(gè)氨基酸剪截。在一個(gè)優(yōu)選的實(shí)施方案中,制備并且檢測(cè)了蛋白的所有可能的剪截。為了合理地確定已經(jīng)進(jìn)行了窮盡篩選,有必要將每種剪截體過(guò)量采樣至少3倍,優(yōu)選地至少5倍,更優(yōu)選地至少10倍。剪截體文庫(kù)可以是增加的剪截體文庫(kù),其中候選蛋白的一端固定,并且另一端可變。例如,可以將C端固定,并且N端可變,或者將N端固定,并且C端可變。作為這樣的策略的一個(gè)實(shí)例,對(duì)于一種770個(gè)氨基酸的蛋白,存在670種剪截體,其產(chǎn)生長(zhǎng)度大于100個(gè)氨基酸的蛋白(對(duì)于在大腸桿菌中表達(dá)和篩選的蛋白的近似實(shí)踐更低的大小限制)。在DNA水平上,這對(duì)應(yīng)2010個(gè)核苷酸。10倍的過(guò)量取樣將需要構(gòu)建并且篩選20,100個(gè)克隆。這些克隆的三分之一將在閱讀框內(nèi),而三分之二將含有移碼,并且因此不表達(dá)有用的肽-標(biāo)記的蛋白。剪截體文庫(kù)可以是內(nèi)部片段文庫(kù),其中所述候選多肽已經(jīng)在兩端被剪截。這避免了這種情形,即,其中具體固定的末端引起一些出乎意料的和不可預(yù)知的問(wèn)題,例如,表達(dá)問(wèn)題,其因而導(dǎo)致有偏倚的或無(wú)用的結(jié)果,例如,易于細(xì)胞蛋白水解或與細(xì)胞毒性相互作用。對(duì)于“N”個(gè)殘基的一種具體的蛋白,存在大約N2/2個(gè)片段。為了確保蛋白編碼序列在兩端處于正確的方向并且在閱讀框內(nèi),需要18倍的過(guò)量取樣。以編碼500個(gè)氨基酸的蛋白的基因?yàn)槔?,這產(chǎn)生兩百萬(wàn)個(gè)可能的連接產(chǎn)物;因此,10倍的過(guò)量取樣意指必須取樣200,000,000個(gè)克隆的文庫(kù)。剪截的方法是本領(lǐng)域的技術(shù)人員已知的。影響這種類型剪截的最簡(jiǎn)單的方法是使用各種遺傳工程的公知技術(shù),以在任一端或兩端選擇性地刪除編碼核酸序列,并且然后將所需要的編碼序列插入到選擇的載體中。優(yōu)選地,使用3’和/或5’核酸外切酶策略分別選擇性地去除編碼核酸的3’和/或5’端,而產(chǎn)生候選蛋白的剪截體。用于產(chǎn)生剪截體文庫(kù)的一種優(yōu)選技術(shù)是使用核酸的可控的或隨機(jī)的核酸外切酶III消化,優(yōu)選地與限制性內(nèi)切酶消化的應(yīng)用組合。例如,某些限制性酶在產(chǎn)生3’突出端的位點(diǎn)切割(例如,NsiI)。其它的在產(chǎn)生5’突出端的位點(diǎn)切割(例如,Not1)。通過(guò)在這些位點(diǎn)的其余的一個(gè)位點(diǎn)切割,并且使用3’和/或5’核酸外切酶,并且將反應(yīng)溫育可控的時(shí)間階段,可以獲得消化的選擇程度和方向。適于應(yīng)用本發(fā)明的方法的適宜載體構(gòu)建的實(shí)例在本文包含的實(shí)施例中描述。備選地,使用隨機(jī)引物對(duì)目標(biāo)基因進(jìn)行PCR擴(kuò)增可以用來(lái)產(chǎn)生在兩端剪截的基因片段(Kawasaki等,RandomPCR-basedscreeningforsolubleproteinsusinggreenfluorescentprotein,Biochem.&Biophys.Res.Comm.2001第280卷第842-844頁(yè))。其它等價(jià)方法包括DNAseI消化、超聲和點(diǎn)沉式片段化(pointsinkfragmentation)??梢灾苽淦渲幸呀?jīng)制備了突變變的變體文庫(kù)。誘變可以是隨機(jī)的誘變,或者可以是合理的、定點(diǎn)誘變。適宜的操作方法應(yīng)該時(shí)本領(lǐng)域的技術(shù)人員已知的,并且包括點(diǎn)誘變(錯(cuò)誤傾向的PCR、化學(xué)誘變、特異性突變宿主株系的應(yīng)用)、循環(huán)全體誘變(recursiveensemblemutagenesis)(Delagrave和Youvan(1993)Bio-Technology,111548-1552)、組合盒式誘變(Black等.,1996)、DNA改組(Stemmer等.,1994)或者通過(guò)密碼子置換誘變而實(shí)現(xiàn)。對(duì)于最近在體外重組方法中的改善的綜述,參見(jiàn)Giver和Arnold,1998(CurrentOpinioninChemicalBiology,2(3)335-338)。例如,一種或多種具體的氨基酸可以選擇性地從野生型序列突變到另一種氨基酸。這樣的突變體可以包括變體候選蛋白,其中一個(gè)或多個(gè)氨基酸殘基被保守或非保守的氨基酸殘基取代(優(yōu)選地保守氨基酸殘基)。例如,高構(gòu)象撓性的殘基諸如Arg或Lys可以與低熵的那些殘基諸如Ala交換,目的是提高結(jié)晶的均一性,以便獲得更好質(zhì)量的蛋白晶體用于X-射線分析。這樣取代的氨基酸殘基可以或者可以不是由遺傳密碼編碼的氨基酸。典型的這樣的取代在Ala、Val、Leu和Ile之間;在Ser和Thr之間;在酸性殘基Asp和Glu之間;在Asn和Gln之間;在堿性殘基Lys和Arg之間;或者在芳香殘基Phe和Tyr之間。特別優(yōu)選的是這樣的變體,其中一些,即,在5和10之間,1和5之間,1和3之間,1和2之間或者只有1個(gè)氨基酸被取代、刪除或以任何組合添加。特別優(yōu)選的是不改變蛋白的功能性特性或活性的取代、添加和刪除。在這一點(diǎn)上還特別優(yōu)選的是保守的取代。這樣的突變體還包括其中一個(gè)或多個(gè)氨基酸殘基包括取代基團(tuán)的多肽??梢灾苽渥凅w文庫(kù),其中插入片段已經(jīng)被加入到序列中,例如,一個(gè)或多個(gè)氨基酸的序列,或者一段氨基酸序列以便,例如,在所述候選蛋白中形成或者刪除環(huán)。特別地,如果包含親水氨基酸,那么可以導(dǎo)致候選蛋白的溶解性的增加。然后篩選這些候選蛋白文庫(kù)的表現(xiàn)出最大程度溶解性的具體的變體。按照本發(fā)明的這一方面,候選蛋白的文庫(kù)可以含有多于103個(gè)不同的克隆,,多于105個(gè)不同的克隆,多于106個(gè)不同的克隆,多于107個(gè)不同的克隆,多于108個(gè)不同的克隆或者甚至更多。優(yōu)選地,所述文庫(kù)含有表達(dá)候選蛋白的每一種可能的剪截體和變體的克隆。由于所有可能的剪截體的產(chǎn)生和檢測(cè)極大地增加了成功的機(jī)會(huì),并且允許分析大量的數(shù)據(jù),所述數(shù)據(jù)可以將溶解性變化與蛋白序列特征聯(lián)系起來(lái),所以這是有利的。此外,所有位置的全面篩選允許一種確定要放棄的實(shí)驗(yàn)應(yīng)該只獲得陰性結(jié)果。克隆的文庫(kù)可以包括多種轉(zhuǎn)化的細(xì)胞,其每個(gè)細(xì)胞表達(dá)不同的候選蛋白。這樣的文庫(kù)可以通過(guò)用適當(dāng)載體的文庫(kù)轉(zhuǎn)化細(xì)胞制備物而產(chǎn)生。在適當(dāng)?shù)臈l件下,用這樣的載體的轉(zhuǎn)化可以這樣進(jìn)行,以確?;旧显谖膸?kù)的每個(gè)細(xì)胞中只有一種類型的候選蛋白表達(dá)。這將從所述核酸表達(dá)的蛋白限制在相同的細(xì)胞內(nèi),并且促進(jìn)編碼目的分子的核酸的選擇;如果每個(gè)細(xì)胞包括多個(gè)核酸分子,那么當(dāng)分離所述細(xì)胞時(shí),將不會(huì)清楚是哪一種核酸分子編碼了引起所需作用的蛋白。形成本發(fā)明的部分的改進(jìn)的選擇技術(shù)允許簡(jiǎn)單應(yīng)用反復(fù)分子進(jìn)化循環(huán),以致可以通過(guò)一系列的重復(fù)攜帶大容量的潛在的候選子。優(yōu)選地,表達(dá)高度可溶候選蛋白的克隆應(yīng)該從克隆的文庫(kù)獲得,無(wú)需任何其它操作。然而,為了最優(yōu)化已經(jīng)通過(guò)本發(fā)明方法鑒定為可溶的候選蛋白的溶解性,可以必要地或理想地進(jìn)行反復(fù)的序列改變和篩選步驟。例如,初始文庫(kù)篩選可以選擇許多具有增加的溶解性的候選子,盡管這一文庫(kù)將顯著地受到表達(dá)不溶的或不穩(wěn)定表達(dá)的蛋白的克隆的污染。然而,使將在第一輪篩選后選擇的可溶的候選子用作下一代候選子的親本,反復(fù)循環(huán)允許所述過(guò)程被重復(fù);通過(guò)進(jìn)行額外的序列改變和篩選步驟,可以將這些可溶的候選子進(jìn)一步向可溶性進(jìn)化。庫(kù)的含量將愈加被更多的可溶(“更適合的”)候選子占據(jù)。在一系列的反復(fù)循環(huán)后,可以采用成功的候選子庫(kù)并且操作以產(chǎn)生新的文庫(kù),用來(lái)在更嚴(yán)謹(jǐn)?shù)倪x擇標(biāo)準(zhǔn)下開(kāi)始新的系列的反復(fù)循環(huán)。優(yōu)選地,只進(jìn)行操作和篩選步驟的一次反復(fù),更優(yōu)選地3次,更優(yōu)選地4次或更多次。自動(dòng)化操作的可能性可以允許應(yīng)用更多的循環(huán),如果需要,可能超過(guò)100、500或1000次。為了將本發(fā)明的方法用到其在高通量篩選方法中的完全的潛力,必要地所述篩選可以在與文庫(kù)大小相稱的規(guī)模上起作用。為了充分利用這種類型的技術(shù)的潛力,克隆挑選器和陣列機(jī)器人的應(yīng)用應(yīng)該用來(lái)將平板化的轉(zhuǎn)化轉(zhuǎn)換成有秩序的文庫(kù),并且篩選這些的陽(yáng)性克隆。理想地,每個(gè)克隆給予一個(gè)與在平板中具體的孔相對(duì)應(yīng)的“地址”。條形碼的應(yīng)用可能使這容易。任選地,所述文庫(kù)可以準(zhǔn)確地安全地復(fù)制。優(yōu)選地,使用與96腿(pin)挑選頭等組合的視頻技術(shù),克隆的篩選和選擇是自動(dòng)化的。384孔平板可以通過(guò)允許更多的克隆進(jìn)行篩選而促進(jìn)這一過(guò)程。使用這一技術(shù),每小時(shí)大約2500個(gè)克隆的挑選速度是很容易獲得的。在將本發(fā)明方法付諸應(yīng)用的優(yōu)選的方法中,將轉(zhuǎn)化子文庫(kù)作為接種子排列在覆蓋LB瓊脂的硝化纖維素膜上,形成集落點(diǎn)陣(colonyarray)(Buessow等,1998NucleicAcidsResearch第26卷,第5007-5008頁(yè))。誘導(dǎo)蛋白的表達(dá),例如,通過(guò)將所述膜轉(zhuǎn)移到含有IPTG和生物素的瓊脂上,并且使細(xì)胞在適宜的溫度生長(zhǎng)3小時(shí)。然后將細(xì)胞在原位裂解。然后對(duì)于蛋白和/或DNA內(nèi)容物,進(jìn)行大規(guī)模的點(diǎn)印跡分析。以這種方式,每22×22cm的膜上,可以排列并且檢測(cè)60,000個(gè)克隆。由于克隆本身作為表達(dá)容器,并且表達(dá)和檢測(cè)這樣多的克隆的管理(logistics)極大地被簡(jiǎn)化,所以,應(yīng)用這樣的檢測(cè)形式在將克隆表達(dá)在微量滴定平板上具有優(yōu)點(diǎn)。如果排列在容易去卷積的(deconvolutable)幾何點(diǎn)陣中,表達(dá)水平和溶解度水平的定量通過(guò)應(yīng)用點(diǎn)陣分析軟件而更容易;克隆可以相對(duì)表達(dá)水平排列并且按先后次序排列。所述方法允許容易的、平行的處理大量的檢測(cè)點(diǎn)并且簡(jiǎn)單的將檢測(cè)點(diǎn)追溯回到物理的初始克隆。這樣的處理優(yōu)選地是受軟件控制的。在這種類型的方法中,通過(guò)將具有克隆的膜置于浸透氫氧化鈉的襯墊上將細(xì)胞原位裂解后,將來(lái)自排列克隆的細(xì)胞蛋白保存在膜上。蛋白可以通過(guò)針對(duì)標(biāo)記的抗體檢測(cè),所述抗體對(duì)翻譯后修飾(例如,生物素化)不敏感,并且這允許對(duì)蛋白產(chǎn)量進(jìn)行評(píng)估,盡管沒(méi)有顯示蛋白的溶解性狀況。更重要地,可以使用對(duì)克隆的溶解性狀況敏感的檢測(cè)方法,例如,在指示溶解性的蛋白翻譯后生物素化作用的情形中,鏈霉抗生物素蛋白結(jié)合提供了關(guān)于所述標(biāo)記是否已被修飾的讀出結(jié)果,而檢測(cè)所述蛋白。另外,關(guān)于表達(dá)條件的有用信息可以通過(guò)比較抗體和鏈霉抗生物素蛋白信號(hào),例如,在XY分散圖表中,由此允許評(píng)估可溶的總蛋白的分?jǐn)?shù)而獲得。如果將鏈霉抗生物素蛋白綴合到過(guò)氧化物酶或堿性磷酸酶上,檢測(cè)可以通過(guò)化學(xué)發(fā)光進(jìn)行,或者綴合到熒光染料上,顯現(xiàn)可以通過(guò)熒光成像進(jìn)行。然后,可以將鑒定為生物素陽(yáng)性的克隆從文庫(kù)分離,并且在常規(guī)方法中檢測(cè),以驗(yàn)證可溶表達(dá)??梢詫⒈憩F(xiàn)出生物素陽(yáng)性表型的這樣的克隆生長(zhǎng)在液體培養(yǎng)基中,通過(guò)加入IPTG誘導(dǎo)蛋白表達(dá),并且通過(guò)裂解證實(shí)溶解性狀況,并且隨后將裂解物分成不溶的和可溶的制備物,例如,通過(guò)離心或過(guò)濾。然后可以對(duì)蛋白進(jìn)行分析和特征性描述,諸如通過(guò)SDS-PAGE和蛋白質(zhì)印跡。因此,用抗體和鏈霉抗生物素蛋白探針復(fù)制膜的比較允許具體的變體例如剪截體的溶解性狀況的讀出結(jié)果,表達(dá)或者沒(méi)有表達(dá),可溶的或者不溶的。在這種方式中,可以產(chǎn)生“表達(dá)圖譜”,其允許測(cè)定單一氨基酸剪截體的溶解作用。當(dāng)設(shè)計(jì)用于蛋白表達(dá)的構(gòu)建體時(shí),這是結(jié)構(gòu)生物學(xué)家需要的信息類型,并且可以導(dǎo)致對(duì)影響蛋白表達(dá)的因子的更深的理解。更詳細(xì)地,克隆可以測(cè)序,以鑒定剪截體的確切身份,并且鑒定連接和復(fù)制。使用這些數(shù)據(jù),可以將克隆按照從在可溶表達(dá)圖譜(圖6)中獲得的信息的表達(dá)水平和大小進(jìn)行先后順序排列,其與針對(duì)編碼基因序列中的剪截點(diǎn)的構(gòu)建體的溶解性相關(guān)。如可從圖6看出那樣,在描述按照編碼基因序列排列的各種克隆的溶解性程度中明顯地存在一定程度的次序。相似的溶解度水平在具有連續(xù)剪截的構(gòu)建體中是明顯的(參見(jiàn)通過(guò)標(biāo)記點(diǎn)所畫(huà)的直線),并且據(jù)信,這些與溶劑暴露接頭中的連續(xù)殘基區(qū)域相對(duì)應(yīng)。相反,低溶解度的缺口在屬于蛋白結(jié)構(gòu)區(qū)域(參見(jiàn)圖11中標(biāo)記為“結(jié)合結(jié)構(gòu)域”的區(qū)域)的剪截界線是明顯的。在本文中假設(shè),這種類型的分析允許對(duì)蛋白剪截變體的溶解性進(jìn)行窮盡分析,以揭示關(guān)于蛋白結(jié)構(gòu)諸如結(jié)構(gòu)域邊界的信息,和蛋白一級(jí)結(jié)構(gòu)中的殘基的溶劑暴露程度。因此,在另一方面,本發(fā)明提供用于獲得關(guān)于蛋白結(jié)構(gòu)信息的方法,所述方法包括進(jìn)行按照上述本發(fā)明的任一實(shí)施方案篩選的方法,并且將關(guān)于每種構(gòu)建體的溶解性的信息與蛋白序列的剪截點(diǎn)相聯(lián)系。優(yōu)選地,通過(guò)將構(gòu)建體的溶解性針對(duì)編碼基因序列中的剪截點(diǎn)作圖,將從本發(fā)明的任一實(shí)施方案獲得的數(shù)據(jù)用來(lái)產(chǎn)生可溶表達(dá)圖譜。溶劑暴露接頭區(qū)域被鑒定為具有顯著可溶性的連續(xù)殘基區(qū)域。在溶劑暴露接頭區(qū)域之間的缺口被鑒定為蛋白序列中的結(jié)構(gòu)區(qū)域。溶劑暴露殘基和結(jié)構(gòu)區(qū)域之間的拐點(diǎn)被鑒定為蛋白序列內(nèi)的結(jié)構(gòu)域邊界。在進(jìn)行上述點(diǎn)陣形式的表達(dá)檢測(cè)之前,應(yīng)該通過(guò)分析基因片段大小的分布而測(cè)定所述基因剪截文庫(kù)的質(zhì)量。這樣的特征性描述應(yīng)該典型地包括使用側(cè)連插入片段的引物進(jìn)行的PCR篩選。這樣得到關(guān)于插入片段大小的概念。然后,通過(guò)使用在其識(shí)別位點(diǎn)中包含ATG的限制性酶(例如,NdeI)消化PCR產(chǎn)物,而證實(shí)起始密碼子。在點(diǎn)陣形式的表達(dá)檢測(cè)并且從所述文庫(kù)分離陽(yáng)性子后,可以將克隆測(cè)序,以鑒定所述剪截體的確切身份。當(dāng)與上述方法聯(lián)合時(shí),應(yīng)該優(yōu)選地使用適當(dāng)?shù)膶?duì)照,以確??紤]到假陽(yáng)性和假陰性結(jié)果。例如,陽(yáng)性對(duì)照應(yīng)該使用一種已知在篩選所用的條件下是可溶的蛋白。陽(yáng)性對(duì)照的一個(gè)實(shí)例可以是肽底物與之融合的麥芽糖-結(jié)合蛋白(MBP)。這種蛋白可溶地表達(dá),并且因此經(jīng)歷通過(guò)底物修飾蛋白進(jìn)行的肽底物修飾。在本發(fā)明應(yīng)用融合到候選蛋白上的生物素化肽的實(shí)施方案中,因此,陽(yáng)性對(duì)照克隆將是融合到生物素化肽上的MBP。陰性對(duì)照可以是,例如,在肽編碼序列中含有移碼的克隆,以致所述肽不被表達(dá)或者表達(dá)但不會(huì)融合到可溶蛋白上。一種備選的、并且任選地互補(bǔ)的陰性對(duì)照克隆可以編碼一種符合所述肽的讀框(inframe)的不溶蛋白。由于是不溶的,所述肽將不能作為底物修飾蛋白的有效底物。本發(fā)明的其它方面涉及按照上述方法應(yīng)用的試劑盒。例如,一種用于鑒定候選蛋白的可溶變體的適宜的試劑盒可以包括a)一種表達(dá)載體,用于在宿主細(xì)胞中表達(dá)變體候選蛋白;其中所述載體含有允許編碼候選蛋白的目的基因插入的限制性位點(diǎn),以致編碼生物素化肽的序列遺傳性地融合到所述目的基因上;b)一種陽(yáng)性對(duì)照載體,其表達(dá)遺傳性融合到編碼生物素化肽的核酸上的麥芽糖結(jié)合蛋白;c)一種如同b)中的陰性對(duì)照載體,但是其包括在生物素化肽編碼序列中的移碼,因此麥芽糖結(jié)合蛋白沒(méi)有被生物素化;和d)另一種陰性對(duì)照載體,其表達(dá)符合生物素化肽的讀框的不溶蛋白。所述試劑盒還可以包含關(guān)于產(chǎn)生編碼目的候選蛋白的基因的剪截體文庫(kù)和克隆所述剪截體以致它們?nèi)诤系骄幋a肽底物的序列上的用法說(shuō)明?,F(xiàn)在將通過(guò)實(shí)例的方式更詳細(xì)地描述本發(fā)明的各個(gè)方面和實(shí)施方案。應(yīng)該理解,在不背離本發(fā)明范圍的條件下可以進(jìn)行細(xì)節(jié)的改進(jìn)。附圖簡(jiǎn)述圖1質(zhì)粒pHAR1111,其編碼在3’末端符合讀框地與編碼生物素化肽的DNA融合的候選基因,并且所述基因5’末端的限制性位點(diǎn)設(shè)計(jì)成允許構(gòu)成所述蛋白的N端剪截體系列。圖2質(zhì)粒pHAR1112,其編碼在3’末端符合讀框地與編碼生物素化肽的DNA融合的人NF-κB基因,并且所述基因5’末端的限制性位點(diǎn)設(shè)計(jì)成允許構(gòu)成所述蛋白的N端剪截體系列。圖3質(zhì)粒pMAS106,其編碼在5’末端與相鄰物符合讀框,但是在3’末端不與在編碼生物素化肽的DNA符合讀框的人NF-κB基因,并且所述基因3’末端的限制性位點(diǎn)設(shè)計(jì)成允許構(gòu)成所述蛋白的C端剪截體系列。圖4表達(dá)分析。照片1a顯示在立即裂解后使用針對(duì)肽標(biāo)記的抗體探針的全部點(diǎn)陣。全表達(dá)(非溶解溶表達(dá))是明顯的。圖5顯示指示可溶性的生物素化蛋白的鑒定的表達(dá)分析。在圖5a和5b中顯示6個(gè)中的1個(gè)視野,并且包括5×5點(diǎn)陣(每個(gè)視野24個(gè)平板)。通過(guò)鏈霉抗生物素蛋白-辣根綴合物結(jié)合而鑒定蛋白。結(jié)果從在細(xì)胞裂解前沒(méi)有誘導(dǎo)的(圖5a)和用IPTG誘導(dǎo)的(圖5b)復(fù)制點(diǎn)陣獲得??梢詮牡诙埬ど峡闯鯥PTG-誘導(dǎo)蛋白表達(dá)的證據(jù)。使用成像分析軟件(VisualGrid;GPCBiotech),定量地分析幻燈片(5c)。圖6通過(guò)PCR,剪截的NF-κB剪截插入片段的大小顯示出隨機(jī)大小分布。圖7使用側(cè)連寡核苷酸引物,通過(guò)PCR衡量表達(dá)質(zhì)粒的DNA片段大小。表達(dá)可溶的剪截NFκB蛋白的克隆可以組成2群,指示兩個(gè)結(jié)構(gòu)域構(gòu)建體的一種(大約25kDa和40kDa的預(yù)測(cè)大小)。圖8NF-κB蛋白的結(jié)構(gòu),顯示當(dāng)從C端剪截時(shí),兩個(gè)結(jié)構(gòu)域蛋白片段之一的大小。圖9通過(guò)蛋白質(zhì)印跡進(jìn)行的48種最好的表達(dá)NF-κB的克隆的蛋白表達(dá)篩選。對(duì)于每一克隆,在總(T)和可溶(S)級(jí)分之間沒(méi)有顯著的差異,這表明通過(guò)所述篩選鑒定的克隆是可溶的。由于它是細(xì)胞中唯一另一種生物素化的蛋白,大腸桿菌內(nèi)源BCCP蛋白的微弱表達(dá)也是可見(jiàn)的。圖10通過(guò)將在剪截的3’末端DNA測(cè)序數(shù)據(jù)的最后18個(gè)堿基對(duì)與全長(zhǎng)基因序列相比對(duì),確定準(zhǔn)確的剪截末端。圖11編碼先前不表達(dá)的蛋白的基因的可溶表達(dá)圖譜,其使得溶解性與遺傳剪截點(diǎn)相關(guān)。在構(gòu)建N端剪截體文庫(kù)的過(guò)程中產(chǎn)生的新的起始密碼子位置針對(duì)全長(zhǎng)基因序列進(jìn)行比對(duì)。在2400個(gè)位置中,61個(gè)顯示可溶蛋白表達(dá)。本圖顯示二元輸出(在閾值界限上的表達(dá)對(duì)不表達(dá)),然而,一些克隆比另一些表達(dá)得好得多(顯示了低和高表達(dá)克隆的實(shí)例)。圖12通過(guò)隨機(jī)篩選鑒定的可溶地表達(dá)NF-κB的構(gòu)建體與預(yù)先確定的、全長(zhǎng)蛋白結(jié)構(gòu)的比對(duì)。結(jié)構(gòu)域邊界的高分辨率定義(high-resolutiondefinition)從用點(diǎn)標(biāo)記的克隆而顯而易見(jiàn)。存在1-和2-結(jié)構(gòu)域構(gòu)建體的最緊湊的形式。圖13使用蛋白質(zhì)印跡分析確定的蛋白表達(dá)。將在質(zhì)粒pHAR1111中的基因的剪截體文庫(kù)的96種陽(yáng)性克隆生長(zhǎng)在LB中。將細(xì)胞裂解,分離,并且將可溶級(jí)分通過(guò)用Str-HRP進(jìn)行蛋白質(zhì)印跡而分析。顯示了一些代表性的克隆。來(lái)自蛋白質(zhì)印跡分析群的重組蛋白依照3種大小范圍(大約10,20,30kDa),如從圖11的可溶表達(dá)圖譜中可見(jiàn)。也顯示了內(nèi)源宿主蛋白BCCP。圖14由質(zhì)粒消化揭示的質(zhì)粒pHAR1111(見(jiàn)圖1)的基因插入片段的大小分布。明顯地,這里進(jìn)行的核酸外切酶剪截過(guò)程產(chǎn)生基因片段大小的線性和相對(duì)沒(méi)有偏倚的分布,這允許所有大小的目標(biāo)基因的隨機(jī)剪截體的篩選。圖15質(zhì)粒pHAR1111的隨機(jī)剪截基因的PCR分析結(jié)果,顯示在可溶性篩選前文庫(kù)中克隆樣品的大小分布。圖16由質(zhì)粒pHAR1111中基因的隨機(jī)剪截體文庫(kù)克隆表達(dá)的蛋白的可溶性篩選。這里,點(diǎn)陣使用Alexa488熒光團(tuán)綴合的鏈霉抗生物素蛋白探測(cè),并且通過(guò)Typhoon熒光掃描儀(Amersham)捕獲圖像。表達(dá)可溶蛋白的克隆以一式兩份的形式顯示。圖17質(zhì)粒pHAR1111的隨機(jī)剪截的基因的PCR分析結(jié)果,顯示表達(dá)可溶蛋白的剪截體的非隨機(jī)大小分布。圖18使用溶解性篩選鑒定的可溶蛋白片段的純化圖表。首先,將所述基因片段亞克隆到一種大腸桿菌表達(dá)載體中,以添加N端六組氨酸標(biāo)記促進(jìn)純化(圖19)。圖19pTriEX載體(Novagen)的衍生物,其用來(lái)亞克隆基因片段,以用于蛋白表達(dá)的按比例擴(kuò)大。將TEV蛋白酶切割的六組氨酸標(biāo)記添加到構(gòu)建體的N末端,以允許親和性純化。圖20在將剪截的基因融合到麥芽糖結(jié)合蛋白上以輔助表達(dá)和純化后,獲得的從pHAR1111表達(dá)的蛋白的多結(jié)構(gòu)域30kDa片段。圖2115N標(biāo)記的蛋白的HQSCNMR譜分析結(jié)果,其證實(shí)從隨機(jī)文庫(kù)篩選鑒定的純化結(jié)構(gòu)域除了高度可溶之外也是很好地折疊的。結(jié)果和方法實(shí)施例-用于下列各項(xiàng)的方法的概念證據(jù)1)編碼先前不表達(dá)的蛋白的候選基因,和2)編碼已知結(jié)構(gòu)的蛋白的人NF-κB基因,用于驗(yàn)證目的構(gòu)建允許分析由目的插入基因編碼的蛋白N端剪截體的載體在溶解性篩選中通用的質(zhì)粒最初通過(guò)將含有目的基因的載體與賦予剪截處理的相關(guān)特征的一起組裝而構(gòu)建。這一初始構(gòu)建體用于分析候選基因,但是還用作質(zhì)粒的來(lái)源,用于通過(guò)將候選閱讀框直接、簡(jiǎn)單置換成另一種而克隆任何其它目的基因。描述了含有候選基因的構(gòu)建體的構(gòu)建,之后描述了含有不同的、不相關(guān)基因,NF-κB的衍生構(gòu)建體的構(gòu)建。a)候選基因的PCR候選基因通過(guò)從含有開(kāi)放閱讀框的先前的質(zhì)粒進(jìn)行PCR而克隆。按照提供的用法說(shuō)明,PCR反應(yīng)在50μl反應(yīng)液中進(jìn)行,使用PWO聚合酶(Roche)。在一種策略中,PCR構(gòu)建使用了4種寡核苷酸引物,其中小的外部引物擴(kuò)增由大的寡核苷酸引發(fā)而產(chǎn)生的初始擴(kuò)增子(以增加反應(yīng)效率)[5’GATCCTAGCATATGAAATGCATGGATCCGCGGCCGCTGAXXXXXXXXXXXXXXXXXXXXXXXXXXX-3’]60nMfor1其中X表示與省略ATG起始密碼子的候選基因序列互補(bǔ)的堿基,600nMfor2[5’-GATCCTAGCATATGAAATGCATGG-3’],60nMFse1rev1[5’-GATCCTAGGGCCGGCCXXXXXXXXXXXXXXXXXXXXXXXXXXX-3’]和600nMFse1rev2[5’-GATCCTAGGGCCGGCCXXXXX-3’]。PCR條件是94℃,2min,然后25個(gè)循環(huán)的94℃,30sec;45℃,30sec;72℃,2min。PCR在1%TBE瓊脂糖上電泳,切下條帶,并且使用QIAEXII試劑盒(Qiagen)純化DNA產(chǎn)物。為了產(chǎn)生克隆的插入片段,將1μgPCR產(chǎn)物用NdeI和FseI消化完全,然后通過(guò)QIAEXII凝膠純化2230bp的DNA片段。b)構(gòu)建含有編碼生物素化肽的DNA和用于克隆候選PCR產(chǎn)物的適宜限制性位點(diǎn)的載體通過(guò)將2種寡核苷酸biot-1_for[5’-AGCTTGCTTGGTGGCGGTCTGAACGACATCTTCGAGGCTCAGAAAATCGAATGGCACGAATAATGAG-3’]和biot-1_rev[5’-AGCTCTCATTATTCGTGCCATTCGATTTTCTGAGCCTCGAAGATGTCGTTCAGACCGCCACCAAGCA-3’]退火而產(chǎn)生寡核苷酸盒。這被連接到pMAL-c2g[NewEnglandBiolabs]的HindIII位點(diǎn),形成中間質(zhì)粒pMAS103,然后將其用NdeI和FseI消化。將5521堿基對(duì)的片段(載體骨架)按上述進(jìn)行凝膠純化,并且用Shrimp堿式磷酸酶(Amersham)去磷酸化。c)將PCR產(chǎn)物克隆到大腸桿菌表達(dá)載體中然后使用T4DNA連接酶(RapidLigationKit,Roche)將2230堿基對(duì)的候選基因連接到5521堿基對(duì)的pMAS103-源性的骨架上,并且隨后使用PCRQuick柱將反應(yīng)物脫鹽,并且洗脫在35μl10mMTrisClpH8.0中。將大腸桿菌菌株DH5α用2μl的脫鹽連接反應(yīng)物通過(guò)電穿孔轉(zhuǎn)化,在SOC培養(yǎng)基中復(fù)蘇1小時(shí),并且接種到補(bǔ)充氨芐青霉素到70μg/ml的LB瓊脂上。從一些克隆分離質(zhì)粒,并且通過(guò)限制性消化和DNA測(cè)序進(jìn)行特征性描述,以證實(shí)構(gòu)建的正確性pHAR1111(見(jiàn)圖1)。質(zhì)粒pHAR1111用于候選基因的基因剪截體實(shí)驗(yàn)。它還用作分析其它基因的起始載體通過(guò)用NotI和FseI進(jìn)行質(zhì)粒消化而將候選基因切下,并且通過(guò)使用具有由PCR引入的兼容NotI和FseI位點(diǎn)的連接基因,將備用基因插入到相對(duì)于開(kāi)放閱讀框起始和終止密碼子的相同位置。例如,最初將人NF-κB基因突變,以沉默移除內(nèi)部的NsiI位點(diǎn)。然后,將其使用寡核苷酸引物NFκBfor1[5’-GGATCCGCGGCCGCTGAGCAGATGGCCCATACCTTCAAATATTAGAGC-3’]和NfκBFseRev1[5’-GGGATCCGGCCGGCCCCTTCTGACGTTTCCTCTGCACTTCTTC-3’]通過(guò)PCR擴(kuò)增,形成其中初始的起始密碼子已被移除的基因。將PCR產(chǎn)物用NotI和FseI消化,并且連接到源于NotI和FseI消化的pHAR1111的載體骨架中。這樣,以與由所述基因編碼的蛋白的N端刪除兼容的形式產(chǎn)生了NF-κB基因(載體pHAR1112;圖2)。概括來(lái)說(shuō),產(chǎn)生了2種相似的載體,其允許制備5’刪除的文庫(kù)pHAR1111,其含有先前不表達(dá)的候選基因;pHAR1112,其含有轉(zhuǎn)錄因子NF-κB基因,NF-κB是一種已知結(jié)構(gòu)的蛋白,可以用于驗(yàn)證目的。d)構(gòu)建允許分析由插入的目的基因編碼的蛋白的C端剪截體的載體載體pMAS103(上文所述)形成能夠在目的基因3’末端進(jìn)行消化的第二種構(gòu)建體的基礎(chǔ)。這里,候選基因作為DNA片段全長(zhǎng)克隆,其中起始密碼子(ATG)位于NdeI位點(diǎn)(CATATG)中,并且其中終止密碼子后接著與pMAS103載體的BamHI、XbaI、SalI或HindIII位點(diǎn)兼容的任何形式的末端(作為兼容性突出端或通過(guò)平端連接)。為了示例其,將人NF-κB基因通過(guò)NdeI和BamHI消化從另一質(zhì)粒(pHAR307)上切下,所述質(zhì)粒pHAR307含有融合到編碼C端六組氨酸標(biāo)記(所述標(biāo)記在本實(shí)驗(yàn)中沒(méi)有意義)的DNA上的基因。將這一片段連接到通過(guò)NdeI和BamHI消化制備的pMAS103載體骨架上。概括來(lái)說(shuō),質(zhì)粒pMAS106(圖3)含有與由所述基因編碼的蛋白的C端刪除兼容的形式的NF-κB插入片段。由于NF-κB的蛋白結(jié)構(gòu)是充分特征性描述的,所以這隨后用于驗(yàn)證目的。剪截流程(描述含有先前不表達(dá)的蛋白的基因的載體pHAR1111)剪截流程按照ITCHY方法(參見(jiàn)TheCreationITCHYHybridProteinLibrariesinMethodsinMolecularBiologybyOstermeier,M.&Lutz,S.,第231卷,第129-141頁(yè))進(jìn)行。簡(jiǎn)要地,為了酶促剪截目的基因,將10微克質(zhì)粒pHAR1111用NotI和NsiI消化完全。將4微克純化的、線性的載體稀釋在1×緩沖液1(NewEnglandBiolabs),80mMNaCl(除了在緩沖液中的NaCl之外)中,并且終體積是120微升。立即,將30微升移到150微升的PB緩沖液(Qiagen)中,形成t=0sec對(duì)照。向在22℃的剩余的90微升中加入150單位的核酸外切酶III,并且混合。在30秒的時(shí)間間隔,移出0.5微升的酶-DNA反應(yīng)物,并且加入到在冰上的含有300微升PB緩沖液的單一“猝滅管”中。這總共持續(xù)1h,直到90微升的反應(yīng)混合物被轉(zhuǎn)移。剩余的30微升形成t=1h對(duì)照,并且也加入150微升的PB緩沖液。使用PCR凈化(cleanup)離心柱(Qiagen),將3種反應(yīng)物(t=0,t=1h和所述文庫(kù))凈化,并且分別洗脫在30微升、30微升和50微升的EB緩沖液中。對(duì)照樣品在凝膠上分析,以驗(yàn)證核酸外切酶反應(yīng)(數(shù)據(jù)未顯示)。為了去除核酸外切酶消化后留下的單鏈突出端,將50微升的文庫(kù)混合物稀釋在1×綠豆核酸酶(MBN)緩沖液(NewEnglandBiolabs)中,并且加入3單位的MBN酶,終體積大約55微升。然后,將反應(yīng)物在37℃溫育30min。將反應(yīng)物使用PCR凈化離心柱凈化,并且洗脫在65微升EB中。在連接之前,為了使載體的末端光滑,將48微升文庫(kù)DNA稀釋在1×T4DNA聚合酶緩沖液(NewEnglandBiolabs)中,具有2.5mMdNTPs和1單位T4DNA聚合酶,終體積100微升。將反應(yīng)物在12℃溫育20min,然后通過(guò)加入EDTA至10mM終濃度并且加熱到75℃持續(xù)20min而進(jìn)行猝滅。將反應(yīng)混合物上樣到0.5%TBE瓊脂糖凝膠上,并且進(jìn)行電泳,以通過(guò)大小分離DNA片段。將目的大小范圍的DNA(>5.5kb)從凝膠上切下,用QIAEXII樹(shù)脂(Qiagen)純化,并且洗脫在60微升的EB中。與含有剪截基因片段的線性載體相對(duì)應(yīng)的選擇大小的DNA通過(guò)用T4DNA連接酶連接而重新環(huán)化,按照制造者的用法說(shuō)明,將8微升的QIAEXII純化DNA溶液與Roche應(yīng)用科學(xué)連接試劑盒(RocheAppliedScienceLigationKit)的試劑一起溫育而實(shí)現(xiàn)。使用PCR凈化離心柱將連接混合物脫鹽,并且將2微升用于通過(guò)電穿孔轉(zhuǎn)化大腸桿菌DH5α感受態(tài)細(xì)胞。將轉(zhuǎn)化混合物在SOC培養(yǎng)基中復(fù)蘇后,將文庫(kù)接種到22cm方形瓊脂平板(Genetix,UK)上。在37℃過(guò)夜生長(zhǎng)后,從瓊脂上刮下大約24,000個(gè)克隆,將克隆重懸在PBS中,并且使用miniprep試劑盒(Qiagen)從少量等分的細(xì)胞制備質(zhì)粒。將這一質(zhì)粒用于轉(zhuǎn)化大腸桿菌蛋白表達(dá)菌株,BL21密碼子+RIL(Stratagene)。通過(guò)用側(cè)面引物進(jìn)行96個(gè)克隆的克隆PCR篩選和瓊脂糖凝膠電泳,而證實(shí)剪截體的平均大小分布。文庫(kù)的機(jī)器人操作.克隆挑選將轉(zhuǎn)化了質(zhì)粒文庫(kù)的BL21密碼子+RIL以每平板大約4,000個(gè)克隆的密度接種到22cm方形LB瓊脂平板上(氨芐青霉素70mg/l;氯霉素30mg/l),在30℃生長(zhǎng)。使用Kbiosystemsgridder-picker機(jī)器人,將26,880個(gè)克隆機(jī)械性地挑選到384孔平板中,所述平板每孔裝滿70微升的LB-HBFM培養(yǎng)基(補(bǔ)充了氨芐青霉素和氯霉素)。將液體培養(yǎng)物在30℃HiGro搖動(dòng)培養(yǎng)箱中過(guò)夜生長(zhǎng)達(dá)到飽和。網(wǎng)格到膜上剪切方形的硝化纖維素膜(Amersham),并且置于22cmLB瓊脂平板(補(bǔ)充了氨芐青霉素和氯霉素)頂部。使用網(wǎng)格釘工具和排列機(jī)器人,將培養(yǎng)物以高密度印到膜上。然后將平板在25℃培養(yǎng)過(guò)夜,直到克隆剛好肉眼可見(jiàn)。將膜從瓊脂上揭起,并且放到新鮮LB瓊脂平板(補(bǔ)充了氨芐青霉素和氯霉素)上,所述平板補(bǔ)充了終濃度為0.1mM的IPTG,以誘導(dǎo)克隆內(nèi)的重組蛋白表達(dá)。在這一點(diǎn)上的立即裂解并且用針對(duì)生物素化肽的抗體檢測(cè)全部點(diǎn)陣,導(dǎo)致檢測(cè)到表達(dá)蛋白的克隆(可溶的或不可溶的;圖4)。將膜在30℃溫育4.5h,從誘導(dǎo)瓊脂上揭起,并且置于-80℃。在進(jìn)行分析前,將膜溫育至室溫,并且在室溫下放到浸透了0.5MNaOH,1.5MNaCl的濾紙上持續(xù)10mins。然后,將膜在1MTrisHCl,pH7.5;1.5MNaCl中中和2×5min,然后在2×SSC緩沖液中持續(xù)15min。然后,將膜用Superblock(Pierce)封閉過(guò)夜。用鏈霉抗生物素蛋白和針對(duì)肽標(biāo)記的抗體雜交表達(dá)蛋白的檢測(cè)將小鼠單克隆抗-生物素標(biāo)記抗體(Avidity)1∶7,500稀釋在40mlPBS-T中,并且添加到膜上,在RollerBlot雜交烘箱(Techne)中在室溫持續(xù)2h。然后,將膜用PBS-T緩沖液洗滌,更換3次緩沖液,每次5min。將抗小鼠過(guò)氧化物酶綴合物1∶25,000稀釋在40mlPBS-T中,并且添加到膜上,在RollerBlot雜交烘箱(Techne)中在室溫持續(xù)1h。然后,將膜用PBS-T緩沖液洗滌,更換3次緩沖液,每次5min。使用辣根過(guò)氧化物酶的化學(xué)發(fā)光底物(AmershamECLreagent)和放射自顯影法進(jìn)行蛋白檢測(cè)(圖4)。信號(hào)通過(guò)密度計(jì)量學(xué)進(jìn)行定量。膜的剝離通過(guò)將膜在室溫下在剝離緩沖液(PBS;2%SDSw/v;100mMβ巰基乙醇)中溫育30min,而將抗體去除。然后將膜在PBS-T中洗滌30min,然后用Superblock封閉。生物素化蛋白的檢測(cè)通過(guò)在PBS-T洗滌5min而將過(guò)量的封閉試劑去除。將鏈霉抗生物素-辣根過(guò)氧化物酶1∶25,000稀釋在40mlPBS-T中,并且添加到膜上,在RollerBlot雜交烘箱(Techne)中在室溫持續(xù)1h。然后,將膜用PBS-T緩沖液洗滌,更換3次緩沖液,每次5min。使用辣根過(guò)氧化物酶的化學(xué)發(fā)光底物(AmershamECLreagent)和放射自顯影法進(jìn)行蛋白檢測(cè)。圖5顯示了可溶蛋白鏈霉抗生物素蛋白篩選的結(jié)果。顯示了從沒(méi)有誘導(dǎo)的和在細(xì)胞裂解前用IPTG誘導(dǎo)的一式兩份點(diǎn)陣獲得的結(jié)果(分別為圖5a和5b)。IPTG-誘導(dǎo)的蛋白表達(dá)的證據(jù)可以在第二張膜上看出(5b)。除了上述化學(xué)發(fā)光方法外,一種檢測(cè)的備選的、更能定量的方法使用熒光,并且得到描述將候選基因的相同的文庫(kù)按上文制備成點(diǎn)陣,然后使用熒光Alexa488-鏈霉抗生物素綴合物(MolecularProbes)檢測(cè)生物素化的蛋白。然后,使用Typhoon成像儀(Amersham)掃描膜,并且使用軟件VisualGrid(GPCBiotech)分析圖像(Figure16)。數(shù)據(jù)分析將來(lái)自點(diǎn)陣的信號(hào)通過(guò)密度計(jì)量法定量,并且使用圖像分析軟件將克隆按表達(dá)水平排列(5c),并且按先后順序排列以備將來(lái)研究。在分析的27000個(gè)克隆中,由于數(shù)據(jù)表明可溶蛋白的表達(dá),有大約300個(gè)選作將來(lái)分析。未選擇和選擇的克隆的分析使用gridder-picker機(jī)器人的重排列功能,將來(lái)自pHAR1111先前不表達(dá)的候選基因的文庫(kù)的克隆機(jī)械性地從冷凍庫(kù)提取,所述文庫(kù)從點(diǎn)陣數(shù)據(jù)被鑒定為表達(dá)可溶的、穩(wěn)定的蛋白。使用兩側(cè)引物對(duì)96個(gè)克隆進(jìn)行PCR篩選和瓊脂糖凝膠電泳,而篩選插入片段的大小。為了確定文庫(kù)的質(zhì)量,在從文庫(kù)中隨機(jī)選擇的克隆上也進(jìn)行相同的分析用來(lái)比較。隨機(jī)挑取的克隆的PCR結(jié)果在圖15中顯示。顯示這一PCR數(shù)據(jù)分析的圖表在圖14中顯示,并且它可以觀察到存在剪截長(zhǎng)度的線性的并且相對(duì)無(wú)偏倚的分布。將PCR產(chǎn)物用NdeI消化,以確定起始密碼子。對(duì)于從熒光分析被鑒定為最好的可溶表達(dá)子的克隆的PCR分析顯示在圖17中,并且很清楚地,剪截體大小的分布不再是隨機(jī)的,而是大約相似大小的一群。第一批96個(gè)最好的表達(dá)子(相同的文庫(kù)但是來(lái)自更早的化學(xué)發(fā)光檢測(cè)方法)的蛋白表達(dá)通過(guò)蛋白質(zhì)印跡進(jìn)行驗(yàn)證,并且通過(guò)表達(dá)裂解物基于過(guò)濾的分離(圖13)證實(shí)蛋白是可溶的,并且與預(yù)計(jì)插入片段大小相匹配。然后,使用載體特異性引物對(duì)先前不表達(dá)候選基因的可溶表達(dá)克隆進(jìn)行測(cè)序,使用沿著剪截基因讀取的序列來(lái)鑒定剪截體邊界的確切身份(identity)和重復(fù)(這里相同的克隆被發(fā)現(xiàn)多次)。后者的發(fā)生是由于,平均起來(lái),蛋白的每個(gè)位置被檢測(cè)7倍。使用這些數(shù)據(jù),將實(shí)驗(yàn)確定的克隆針對(duì)全長(zhǎng)基因進(jìn)行序列比對(duì),形成可溶表達(dá)圖譜(圖11)。這樣的圖譜是獨(dú)特的,并且先前對(duì)于蛋白從未產(chǎn)生過(guò)。它闡明了蛋白中可以被剪截并且產(chǎn)生可溶蛋白的位置。鑒定了多個(gè)克隆,并且這些克隆可以通過(guò)下述各項(xiàng)而進(jìn)一步按先后順序排列a)當(dāng)用鏈霉抗生物素蛋白探測(cè)時(shí),選擇在膜點(diǎn)陣上給出高信號(hào)即,很好地表達(dá)的那些克?。籦)當(dāng)連續(xù)的氨基酸被鑒定為剪截點(diǎn)時(shí),選擇最小的那些克隆。由于具有有序末端的緊密蛋白通常比具有附加的、無(wú)序肽的蛋白更有效地結(jié)晶,所以,當(dāng)克隆用于X-射線結(jié)晶學(xué)時(shí),后者是有利的。只有由于所述篩選方法的高通量性質(zhì)使得可以進(jìn)行實(shí)驗(yàn)的過(guò)量取樣,這一信息的確定才是可能的。可以看出,在描述按照編碼基因序列排列的各種克隆的溶解性程度中明顯地存在一定程度的次序。在具有連續(xù)剪截的構(gòu)建體中,相似水平的溶解度是明顯的(參見(jiàn)通過(guò)標(biāo)記點(diǎn)所畫(huà)的直線),并且據(jù)信,這些與溶劑暴露接頭中連續(xù)殘基區(qū)域相對(duì)應(yīng)。相反,低溶解度的缺口在屬于蛋白結(jié)構(gòu)區(qū)域(參見(jiàn)圖11中標(biāo)記為“結(jié)合結(jié)構(gòu)域”的區(qū)域)的剪截界線是明顯的。在本文中假設(shè),這種類型的分析允許對(duì)蛋白剪截變體的溶解性進(jìn)行窮盡分析,以揭示關(guān)于蛋白結(jié)構(gòu)諸如結(jié)構(gòu)域邊界的信息,和蛋白一級(jí)結(jié)構(gòu)中的殘基的溶劑暴露程度。這構(gòu)成了本發(fā)明的另一方面。蛋白表達(dá)集落vs液體圖13顯示陽(yáng)性克隆的蛋白質(zhì)印跡分析,陽(yáng)性克隆在LB培養(yǎng)基中生長(zhǎng),裂解并且分離成可溶級(jí)分。盡管可以區(qū)分出10kDa、20kDa和30kDa的3簇,這在可溶表達(dá)圖譜上也是明顯的(圖11),但是寬范圍的表達(dá)水平是明顯的。全長(zhǎng)蛋白是86kDa,并且認(rèn)為沒(méi)有更大的構(gòu)建體是這種特殊目標(biāo)物的結(jié)構(gòu)的結(jié)果。這一結(jié)果還表明,在集落中測(cè)定的蛋白表達(dá)很好地與更標(biāo)準(zhǔn)的液體培養(yǎng)物形式相關(guān)聯(lián)。蛋白表達(dá)的規(guī)?;瓦M(jìn)一步描述將上述鑒定為表達(dá)純化蛋白的一種遺傳構(gòu)建體亞克隆到pTriEX衍生載體(Novagen)中(圖19),以便通過(guò)應(yīng)用基于T7的更強(qiáng)的啟動(dòng)子提高蛋白表達(dá),并且通過(guò)添加可以通過(guò)TEV蛋白酶切割而被去除的N端六組氨酸標(biāo)記而輔助純化。這一具體的構(gòu)建體的表達(dá)良好,每升大約40mg,并且形成容易純化的物質(zhì)。這通過(guò)純化級(jí)分的SDS-PAGE分析得到證明(圖18)。使用NMR,這里顯示的純化蛋白得到關(guān)于折疊性的進(jìn)一步特征性描述,N15標(biāo)記物質(zhì)的HQSC譜在圖21中顯示。將這種具體的蛋白通過(guò)NMR進(jìn)行全面結(jié)構(gòu)解析,這表明它確實(shí)包括來(lái)自先前從未成功地過(guò)量表達(dá)的蛋白的折疊的、可溶的和球狀的結(jié)構(gòu)域,因此證明本發(fā)明的有用性。這一克隆已經(jīng)用于結(jié)晶學(xué)研究。另外,使用來(lái)自可溶表達(dá)圖譜的信息指導(dǎo)克隆選擇(圖11),已經(jīng)產(chǎn)生了這一目標(biāo)物的第二大的30kDa蛋白,并且其包括上述更小的結(jié)構(gòu)域加另一種20kDa的物質(zhì)。預(yù)計(jì)這包括至少2個(gè)結(jié)構(gòu)域。這種蛋白有效地從pTriEX系統(tǒng)(圖19)和pMAL載體(NewEnglandBiolabs)表達(dá),pMAL載體產(chǎn)生一種容易純化的麥芽糖結(jié)合蛋白融合體,這里所述融合體在圖20中顯示。分析NF-κB本發(fā)明應(yīng)用已知結(jié)構(gòu)的蛋白作為驗(yàn)證目的的另一個(gè)實(shí)例上文詳細(xì)顯示的第一個(gè)實(shí)例是一種先前很難處理的蛋白,原因在于在本工作之前是不可能表達(dá)這種蛋白的。然而,為了進(jìn)一步驗(yàn)證本方法,考慮到還有必要在已知結(jié)構(gòu)的蛋白上進(jìn)行相同的處理方法。由于它具有非常確定的結(jié)構(gòu)域結(jié)構(gòu),所以選擇了蛋白NF-κB。將pHAR1112用于N端剪截體(圖2),將pMAS106(圖3)用于C端剪截體,構(gòu)建了2個(gè)文庫(kù)。除了在核酸外切酶剪截步驟之前,將pMAS106用FseI和XbaI消化以外,文庫(kù)按照上述實(shí)例進(jìn)行構(gòu)建。如上文那樣,通過(guò)用兩側(cè)引物對(duì)基因片段插入物進(jìn)行PCR,而測(cè)定pMAS106C端剪截體文庫(kù)的質(zhì)量,并且結(jié)果顯示在圖6中。使用上文所述Alexa488-鏈霉抗生物素蛋白綴合物的熒光方法分析集落點(diǎn)陣。使用gridder-picker機(jī)器人的cherrypicking功能,將陽(yáng)性克隆從主文庫(kù)分離,并且將最強(qiáng)的96個(gè)克隆用PCR進(jìn)行分析。結(jié)果(圖7)顯示2種大小的DNA簇,預(yù)測(cè)其編碼大約25kDa和40kDa的蛋白。這些預(yù)測(cè)的大小很好地與NF-κB的結(jié)構(gòu)域結(jié)構(gòu)(圖8)相關(guān)。將第一批48個(gè)克隆在LB液體培養(yǎng)物中表達(dá),并且制備全部和可溶的裂解物。蛋白質(zhì)印跡分析(圖9)表明所有的蛋白都是完全可溶的,并且觀察到的蛋白大小與通過(guò)PCR篩選(圖7)預(yù)測(cè)的大小緊密相匹配。將所有可溶的克隆測(cè)序,并且將通過(guò)剪截產(chǎn)生的新的C端針對(duì)蛋白序列進(jìn)行序列比對(duì),形成NF-κB的可溶表達(dá)圖譜(圖10)。清楚地揭示了所述蛋白的結(jié)構(gòu)域結(jié)構(gòu),并且通過(guò)選擇最小的、最緊湊形式的每種結(jié)構(gòu)域,而將結(jié)構(gòu)域的邊緣定位到單個(gè)氨基酸分辨率(圖12)。2個(gè)40kDa結(jié)構(gòu)域和1個(gè)25kDa結(jié)構(gòu)域的構(gòu)建體先前在科學(xué)文獻(xiàn)中被特征性描述為具有DNA結(jié)合的功能。因此,通過(guò)篩選隨機(jī)剪截的NF-κB基因的可溶表達(dá)而鑒定的結(jié)構(gòu)域是可溶的和有功能的。權(quán)利要求1.一種在多種變體候選蛋白中篩選可溶候選蛋白的方法,其中將每種候選蛋白融合到肽底物上,以致可溶的候選蛋白通過(guò)檢測(cè)所述肽底物的酶促修飾而得到鑒定。2.按照權(quán)利要求1的方法,當(dāng)可溶時(shí),其中所述肽底物通過(guò)酶促作用而被修飾。3.按照權(quán)利要求1或權(quán)利要求2的方法,其中所述肽底物沒(méi)有顯著地干擾與之融合的候選蛋白的物理特征。4.按照權(quán)利要求3的方法,其中所述肽底物沒(méi)有顯著地干擾與之融合的候選蛋白的溶解性。5.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述肽底物長(zhǎng)度在5和20個(gè)氨基酸之間。6.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述肽底物是生物素蛋白連接酶的底物。7.按照權(quán)利要求6的方法,其中所述肽底物是BCCP的15個(gè)氨基酸的肽模擬物,具有序列GLNDIFEAQKIEWHE。8.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述肽底物通過(guò)肽鍵融合到每種候選蛋白上。9.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述肽底物融合在候選蛋白的羧基端。10.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述肽底物融合在候選蛋白的氨基端。11.按照前述權(quán)利要求任一項(xiàng)的方法,其中多種變體候選蛋白從包含在宿主細(xì)胞文庫(kù)內(nèi)的載體表達(dá)。12.按照權(quán)利要求11的方法,其中文庫(kù)中的每種宿主細(xì)胞表達(dá)一種能夠修飾所述肽底物的底物-修飾酶。13.按照權(quán)利要求11的方法,其中所述宿主細(xì)胞是大腸桿菌(E.coli)細(xì)胞。14.按照權(quán)利要求13的方法,其中所述大腸桿菌細(xì)胞表達(dá)生物素蛋白連接酶。15.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述多種變體候選蛋白包括候選蛋白的剪截體文庫(kù)。16.按照權(quán)利要求15的方法,其中所述文庫(kù)通過(guò)用核酸外切酶消化編碼所述蛋白的核酸而產(chǎn)生。17.按照前述權(quán)利要求任一項(xiàng)的方法,其中所述多種變體候選蛋白通過(guò)使用集落點(diǎn)陣進(jìn)行溶解性篩選。18.按照權(quán)利要求17的方法,其中通過(guò)使用修飾肽選擇性的抗體或其它檢測(cè)試劑(例如,鏈霉抗生物素蛋白)檢測(cè)修飾的肽底物,從而篩選由點(diǎn)陣中的集落表達(dá)的候選蛋白的溶解性。19.按照權(quán)利要求15-17中任一項(xiàng)的方法,其還包括使得關(guān)于文庫(kù)內(nèi)多種候選蛋白的溶解性的信息與蛋白序列中的剪截點(diǎn)相關(guān)聯(lián)的步驟。20.一種用于獲得關(guān)于蛋白結(jié)構(gòu)的信息的方法,所述方法包括按照權(quán)利要求15-17中任一項(xiàng)的篩選方法,還包括使得關(guān)于文庫(kù)內(nèi)多種候選蛋白的溶解性的信息與蛋白序列中的剪截點(diǎn)相關(guān)聯(lián)的步驟。21.一種用于鑒定候選蛋白的可溶變體的試劑盒,所述試劑盒包括a)一種表達(dá)載體,用于在宿主細(xì)胞中表達(dá)變體候選蛋白;其中所述載體含有允許編碼候選蛋白的目的基因插入的限制性位點(diǎn),以致編碼生物素化肽的序列遺傳性地融合到所述目的基因;b)一種陽(yáng)性對(duì)照載體,其表達(dá)遺傳性融合到編碼生物素化肽的核酸上的麥芽糖結(jié)合蛋白;c)一種如同b)中的陰性對(duì)照載體,但是其包括在生物素化肽編碼序列中的移碼,因此麥芽糖結(jié)合蛋白沒(méi)有被生物素化;和d)另一種陰性對(duì)照載體,其表達(dá)符合生物素化肽的讀框的不溶蛋白。全文摘要本發(fā)明涉及在候選蛋白的表達(dá)文庫(kù)中篩選可溶候選蛋白表達(dá)的方法。所述方法包括將文庫(kù)中的每種候選蛋白融合到肽底物上,并且通過(guò)檢測(cè)所述肽底物的酶促修飾而鑒定表達(dá)可溶候選蛋白的細(xì)胞。文檔編號(hào)C12N15/62GK101040188SQ200580035335公開(kāi)日2007年9月19日申請(qǐng)日期2005年9月5日優(yōu)先權(quán)日2004年9月3日發(fā)明者達(dá)瑞恩·詹姆斯·哈特申請(qǐng)人:歐洲分子生物學(xué)實(shí)驗(yàn)室
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
宝坻区| 云梦县| 嘉义县| 北京市| 饶平县| 新巴尔虎右旗| 饶阳县| 普宁市| 广宁县| 平乡县| 佛山市| 商水县| 拉萨市| 临湘市| 两当县| 明溪县| 沂源县| 岗巴县| 定州市| 黎平县| 新和县| 吉林市| 永州市| 申扎县| 上杭县| 宁南县| 湟源县| 昔阳县| 丽水市| 新邵县| 永靖县| 乌兰浩特市| 高邮市| 鸡西市| 江山市| 龙江县| 抚宁县| 宜君县| 周口市| 惠来县| 新田县|