用于gnn的鋅指結合結構域的制作方法

文檔序號：1078565閱讀：461來源：國知局

專利名稱：用于gnn的鋅指結合結構域的制作方法
技術領域：
本發(fā)明領域為結合靶核苷酸的鋅指蛋白。更具體地說，本發(fā)明涉及特異性結合式5’-(GNN)-3’靶核苷酸的鋅指α螺旋域中的氨基酸殘基序列。
背景技術：
1967年確立了控制基因表達的主要機制涉及以序列特異性方式結合DNA的蛋白質開關模式(Ptashne，M.(1967)Nature(London)214，323-4)。已描述了各種結構家族的DNA結合蛋白。盡管存在大量的結構多樣性，但是在真核生物中Cys2-His2鋅指基元是最常用的核酸結合基元。在酵母和人類均觀測到這樣的相同結果。最早在DNA和RNA結合轉錄因子TFIIIA中鑒定了Cys2-His2鋅指基元(Miller，J.，McLachlan，A.D.& Klug，A.(1985)Embo J4，1609-14)，它可能是構建序列特異性蛋白的理想結構支架。一個鋅指域包括約30個氨基酸，它具有由疏水性相互作用和一個鋅離子的螯合作用穩(wěn)定的簡單ββα折疊(Miller，J.，McLachlan，A.D.& Klug，A.(1985)Embo J4，1609-14，Lee，M.S.，Gippert，G.P.，Soman，K.V.，Case，D.A.& Wright，P.E.(1989)Science245，635-7)。鋅指域α螺旋插入(presentation)DNA大溝使得允許發(fā)生序列特異性的堿基接觸。每個鋅指域通常識別DNA的三個堿基對(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-1180，Elrod-Erickson，M.，Benson，T.E，& Pabo，C.O.(1998)Structure (London)6，451-464，Kim，C.A.&Berg，J.M.(1996)Natrue Structural Biology 3，940-945)，雖然螺旋插入變化使得可以識別更長的位點(Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C.，18833-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，F(xiàn)airall，L.，Schwabe，J.W.R.，Chapman，L.，F(xiàn)inch，J.T.& Rhodes，D.(1993)Nature (London)366，483-7，Wuttke，D.S.，F(xiàn)oster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)，Mol.Biol.273，183-206)。大多數(shù)轉錄因子依賴于蛋白域的二聚作用以增加對更長DNA序列或位置(address)的蛋白-DNA接觸，與此不同，鋅指域的簡單共價串聯(lián)重復使得該基元可以識別更長的非對稱性DNA序列。
我們最近描述了含有6個鋅指結構域而且結合18個堿基對連續(xù)DNA序列的多指鋅指蛋白(Liu，Q.，Segal，D.J.，Ghiara，J.B.& BarbasIII，C.F.(1997)PNAS 94，5525-5530)。識別18bps DNA足以描述所有已知基因組中的獨特DNA位置(address)，這種獨特的DNA位置是使用多指蛋白作高度特異性基因開關的要求。實際上在模型系統(tǒng)中采用這些多指蛋白已經(jīng)證實對基因激活和抑制的控制(Liu，Q.，Segal，D.J.，Ghiara，J.B.& BarbasIII，C.F.(1997)PNAS 94，5525-5530)。
因為每個鋅指結構域通常結合3個堿基對序列，所以一個完整識別表(alphabet)需要特征鑒定64個結構域?？芍笇嫿ㄟ@些結構域的現(xiàn)存資料得自以下3種類型的研究結構測定(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)4，1171-1180，Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)NatureStructural Biology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，F(xiàn)airall，L.，Schwabe，J.W.R.，Chapman，L.，F(xiàn)inch，J.T.& Rhodes，D.(1993)Nature(London)366，483-7.，11，Wuttke，D.S.，F(xiàn)oster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol.Biol.273，183-206.，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.& Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943，Narayan，V.A.，Kriwacki，R.W.&Caradonna，J.P.(1997)J.Biol.Chem.272，7801-7809)、定點誘變(Isalan，M.，Choo，Y.& Klug，A.(1997)Proc.Natl.Acad Sci U.S.A.94，5617-5621，Nardelli，J.，Gibson，T.J.，Vesque，C.& Chamay，P.(1991)Nature349，175-178，Nardelli，J.，Gibson，T.& Charnay，P.(1992)Nucleic AcidsRes.20，4137-44，Taylor，W.E.，Suruki，H.K.，Lin，A.H.T.，Naraghi-Arani，P.，Igarashi，R.Y.，Younessian，M.，Katkus，P.& Vo，N.V.(1995)Biochemistry 34，3222-3230，Desjarlais，J.R.& Berg，J.M.(1992)ProteinsStruct.，F(xiàn)unct.，Genet.12，101-4，Desjarlais，J.R.& Berg，J.M.(1992)Proc Natl Acad Sci USA 89，7345-9)以及噬菌體展示選擇(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Wahington，D.C.)275，657-661.23，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A& Choo，Y.(1998)Biochemistry 37，12026-33，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。所有這些研究明顯有助于我們了解鋅指/DNA識別，但是每一種研究均有其局限性。結構研究鑒定了各種各樣的蛋白/DNA相互作用，但是還不能解釋是否其它相互作用可能更好。此外，盡管觀測到允許序列特異性識別的相互作用，但是關于其它序列如何排除在識別之外知之甚少。對現(xiàn)有蛋白的誘變已經(jīng)部分闡明了這些問題，但是所述資料總是受限于可特征鑒定的突變體數(shù)目。隨機文庫的噬菌體展示以及選擇克服了一定的突變體數(shù)量限制，但是提供確保特異性和親和性均驅動選擇的合適選擇壓力是困難的。幾個實驗室的實驗研究(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，1113-7，Greisman，H.A.&Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1 994)Biochemistry33，5689-5695.25，Jamieson，A.C.，Wang，H.& Kim，S.-H(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1 998)Biochemistry 37，12026-33)，包括我們自己的實驗(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)證實可以設計或選擇該識別表的幾種成員。然而，在這些早期研究中幾乎沒有以嚴格而系統(tǒng)的方式研究這些結構域與其靶DNA的特異性和親和性。
自從Jacob和Monod研究了阻抑物的化學性質，而且提出用其可以刺激或抑制細胞內各種蛋白的合成的方案，具體的實驗性控制基因表達成為一個令人感興趣的課題(Jacob，F(xiàn).& Monod，J.(1961)，Mol.Biol.3，318-356)。目前已經(jīng)確證，主要通過稱為轉錄因子的蛋白作用在轉錄水平調節(jié)基因組，轉錄因子以序列特異性方式結合DNA。通常這些蛋白因子以復雜的聯(lián)合方式起作用，使得可以對基因表達進行時序控制、空間控制以及環(huán)境應答性控制(Ptashne，M.(1997)NatureMedicine 3，1069-1072)。轉錄因子常常既通過將蛋白定位到基因組特定位點的DNA結合域發(fā)揮作用，又通過在所述位點或其附近刺激(激活)或抑制轉錄的輔助效應結構域發(fā)揮作用(Cowell，I.G.(1994)TrendsBiochem.Sci.19，38-42)。效應結構域如激活域VP16(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)和阻抑結構域KRAB(Margolin，J.F.，F(xiàn)redman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F(xiàn).J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-4513)通常是模塊式的，而且當它們與其它DNA結合蛋白融合時仍然保持其活性。鑒于通過將轉錄因子導向基因組的特定位點可容易地控制基因，所以設計適合結合任何特定序列的DNA結合蛋白成為使人畏懼的挑戰(zhàn)。
本發(fā)明公開內容基于對Cys2-His2類結合核酸鋅指蛋白的獨特結構特征的認識。Cys2-His2鋅指結構域由約30個氨基酸長度的簡單ββα折疊組成。通過疏水性相互作用以及保守的Cys2-His2殘基對一個鋅離子的螯合作用獲得該折疊的線構穩(wěn)定性(Lee，M.S.，Gippert，G.P.，Soman，K.V.，Case，D.A.& Wright，P.E.(1989)Science 245，635-637)。通過源自所述結構域的α螺旋的特定氨基酸側鏈的接觸達到識別核酸，所述接觸通常結合3個堿基對的DNA序列(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure 4，1171-1180)。與其它核酸識別基元不同，多鋅指結構域的簡單共價鍵連接使得可以識別更長的非對稱DNA序列。對天然鋅指蛋白的研究表明，3個鋅指結構域可結合9bp連續(xù)DNA序列(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17.，Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。盡管識別9bp序列不足以指定(specify)甚至大腸桿菌這樣的小基因組內的獨特位點，但是含有6個鋅指結構域的多指蛋白可指定對18-bp的識別(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。就開發(fā)基因控制通用系統(tǒng)而言，18-bp位置足以指定在所有已知基因組中的單一位點。盡管本質上還不了解這類多指蛋白，但是最近已經(jīng)證實其在活的人體細胞中的基因活化和抑制中的效能(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。
發(fā)明概述一方面，本發(fā)明提供分離純化的鋅指-核苷酸的結合多肽，它包括SEQ ID NO1-16中任一種的氨基酸殘基序列。在一個相關方面，本發(fā)明進一步提供含有2至約12個這種鋅指-核苷酸結合多肽的組合物。所述組合物優(yōu)選包含2至約6個多肽。在一個優(yōu)選的實施方案中，所述鋅指-核苷酸結合多肽最好通過具有SEQ ID NO 111序列的氨基酸殘基接頭有效連接。本發(fā)明組合物特異性結合含有序列5’-(GNN)n-3’的核苷酸靶，其中在所有N不能是C的條件下每個N均為A、C、G或T，而且n優(yōu)選為2-6。多肽或組合物可進一步有效鏈接一種或多種轉錄調節(jié)因子例如轉錄激活劑或轉錄抑制劑或阻抑物。本發(fā)明還提供分離純化的編碼本發(fā)明多肽或組合物的多核苷酸以及含有所述多核苷酸的表達載體。
再一方面，本發(fā)明提供調節(jié)核苷酸序列功能的方法，所述核苷酸序列含有序列5’-(GNN)n-3’，其中n為1-6的整數(shù)，所述方法包括所述核苷酸序列暴露于有效量的本發(fā)明組合物，該組合物與一種或多種轉錄調節(jié)因子有效連接。5’-(GNN)n-3’序列可見于所述核苷酸的轉錄區(qū)或啟動子區(qū)或見于表達的序列標記。
本發(fā)明公開的內容證實簡單有效的快速產(chǎn)生基因開關的通用策略。構建并特征鑒定特異性識別新的9-bp序列或者18-bp(首次)序列的多指蛋白，該多指蛋白含有一系列識別64成員鋅指表的5’-(GNN)n-3’亞組序列的已知鋅指結構域。制備并證實有效的轉錄因子既控制基因活化又控制基因抑制。采用單純皰疹病毒VP16活化域(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)和其基本活化域的重組四聚體重復實現(xiàn)基因活化。采用以下3個人源效應子域可實現(xiàn)基因阻抑或沉默krüppel結合盒(KRAB)(Margolin，J.F.，F(xiàn)riedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F(xiàn).J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-4513)、ERF阻抑結構域(ERD)(Sgouras，D.N.，Athanasiou，M.A，Beal，G.J.，Jr.，F(xiàn)isher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)和mSIN3相互作用結構域(SID)(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.& Eisenman，R.N.(1996)Mol.Cell.Biol.16，5772-5781)。在人上皮細胞中利用熒光素酶報道基因測定，數(shù)據(jù)表明設計用于靶向原癌基因erbB-2/HER-2的啟動子的人工轉錄調節(jié)劑可以特異性方式消除或激活基因表達。通過對基因轉錄物的尋靶首次實現(xiàn)基因活化或抑制，說明從表達的序列標記(EST)獲得的信息足以構建基因開關。本文所述的新方法和材料有希望在基因治療、轉基因生物、功能基因組學(functional genomics)以及細胞生物學和分子生物學的其它領域具有各種用途。
附圖簡述在構成本說明書的一部分的附圖中，

圖1(以6個為一組顯示)顯示本發(fā)明鋅指-核苷酸結合多肽各區(qū)的結合特異性。
發(fā)明詳述I.發(fā)明本發(fā)明提供鋅指-核苷酸結合多肽、含有一種或多種這種多肽的組合物以及應用這種多肽和組合物調節(jié)基因表達。II.化合物本發(fā)明化合物是分離的鋅指-核苷酸結合多肽，該多肽結合 GNN核苷酸序列并調節(jié)所述核苷酸序列的功能。所述多肽可增強或抑制基因轉錄并可結合到DNA或RNA。鋅指-核苷酸結合多肽是指衍生形式的野生型鋅指蛋白多肽或重組產(chǎn)生的鋅指蛋白多肽。多肽可以是一種雜種多肽，例如它含有一種蛋白的鋅指結構域和與其連接的第二種蛋白的鋅指結構域。所述結構域可以是野生型或突變型結構域。多肽包括截短形式的野生型鋅指蛋白。可由其產(chǎn)生多肽的鋅指蛋白實例包括TFIIIA和zif268。
本發(fā)明鋅指-核苷酸結合多肽在所述多肽的α螺旋結構域中含有一個獨特的七聚體(7個氨基酸殘基的連續(xù)序列)，該七聚體序列決定與靶核苷酸的結合特異性。該七聚體序列可位于α螺旋結構域的任何位置，但是按本領域常規(guī)殘基編碼所述七聚體優(yōu)選從位置-1延伸至位置6。本發(fā)明多肽可包括本領域已知的任何β折疊和構架序列以構成鋅指蛋白的一部分。制備了許多鋅指-核苷酸結合多肽并測試了它們對含有GNN三聯(lián)體的靶核苷酸的結合特異性。研究結果總結于圖1。在圖1中，右側欄表示每種肽的GNN三聯(lián)體結合特異性，最高的特異性列于第一個并以粗體表示。在圖1中，括號內表示SEQ ID NO。對于每種具體GNN(例如示于圖1右側欄的 GAA)靶，所述序列按與所述三聯(lián)體的特異性降低的順序排列。
如圖1所示，所述數(shù)據(jù)表明，實際上在特定靶的所有克隆中觀測到明顯保守的全部3個主要DNA接觸位置(-1，3和6)。盡管以前選擇小得多的全文庫后在這些位置上觀測到其中許多殘基，但是本文所觀測到保守程度明顯高于以前的研究(Choo，Y.& Klug，A.(1994)ProcNatl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Wahington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。本發(fā)明揭示，鋅指結構域的-1、3和6的3個螺旋位置足以詳細描述所述結構域的DNA結合特異性的現(xiàn)有技術的觀點是不正確的。
已經(jīng)證實噬菌體選擇通常只在這些位置中的1個或2個位置顯示共有選擇。最大序列變異發(fā)生于位置1和5的殘基，所述殘基不會在Zif268/DNA結構中產(chǎn)生堿基接觸，而且以前預期它們并不明顯協(xié)助識別(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.&Pabo，C.O.(1996)Structure(London)4，1171-1180)。位置1和5的變異還預示著，其它位置的保守性是因為其與所述DNA的相互作用而不是簡單地因為其它原因所引起的偶然性擴增單一克隆所致。還觀測到位置2的保守性殘基同一性。位置-2的保守作用多少有點人為原因；NNK文庫的該殘基恒定為絲氨酸。該殘基在Zif268結構中與DNA主鏈接觸。兩個文庫均在位置4含有恒定的亮氨酸，亮氨酸是穩(wěn)定該結構域折疊的疏水核心中的一個重要殘基。
給人們留下深刻印象的是，觀測到保守氨基酸識別不同靶的相同的核苷酸。例如實際上總是選擇位置3的Asn(Asn3)識別中間位置的腺嘌呤，無論是在GAG、GAA、GAT還是在GAC的序列中。無論鄰近位置如何，總是分別選擇Gln-1和Arg-1識別3’位置的腺嘌呤或鳥嘌呤。大量結構研究文獻證明Gln或Asn是以酰胺側鏈為基礎識別腺嘌呤，同樣識別鳥嘌呤的Arg胍側鏈接觸3’或5’鳥嘌呤(Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure (London)6，451-464，Kim，C.A.& Berg，J.M.(1996)Nature Structural Biology 3，940-945.，F(xiàn)airall，L.，Schwabe，J.W.R.，Chapman，L.，F(xiàn)inch，J.T.&Rhodes，D.(1993)Nature (London)366，483-7)。然而更常見的是，選擇2個或3個氨基酸識別核苷酸。選擇His3或Lys3(在較低程度上為Gly3)識別中間的鳥嘌呤。選擇Ser3和Ala3識別中間的胸腺嘧啶。選擇Thr3、Asp3和Glu3識別中間的胞嘧啶。在位置-1選擇Asp和Glu識別3’胞嘧啶，而選擇Thr-1和Ser-1識別3’胸腺嘧啶。
將選定的Zif268變異體亞克隆入細菌表達載體，而且過量表達所述蛋白(鋅指-2蛋白，此后用淘選它們的亞位點表示)。重要的是研究可溶性蛋白而不是噬菌體融合蛋白，因為已知這兩種蛋白在其結合特性方面可能明顯不同(Crameri，A.，Cwirla，S.& Stemmer，W.P.(1996)Nat.Med.2，100-102)。使用多靶ELISA測定方法測試所述蛋白識別16個5’-GNN-3’鋅指-2亞位點中每一個的能力。該測定法提供極其嚴格的特異性測試，因為總是存在6個“非特異性”位點，它們只是由于9核苷酸靶中的一個核苷酸而不同于所述“特異性”位點。許多噬菌體選擇的鋅指-2蛋白具有高度特異性，而其它蛋白顯示不同程度的交叉反應性。某些多肽實際上與亞位點結合更佳，而不是選定的位點。
試圖利用定點誘變修飾識別螺旋以提高結合特異性。用我們的選擇數(shù)據(jù)和結構資料指導突變設計。作為迄今進行的最全面的研究，對100多個突變蛋白進行了特征鑒定，試圖努力增強我們對DNA識別規(guī)律的認識。盡管預測螺旋位置1和5在DNA識別中不起直接作用，但是最好的特異性改善總是涉及這些位置的修飾。觀測到這些殘基與磷酸主鏈接觸，以非序列特異性方式產(chǎn)生結合。去除非特異性接觸提高特異性接觸對所述復合物總體穩(wěn)定性的重要性，由此增強特異性。例如，用較小的不帶電荷殘基取代位置1和5的非典型電荷殘基就可提高多肽與靶三聯(lián)體GAC、GAA和GAG的特異性。
另一類修飾涉及同時改變結合殘基和非結合殘基。通過修飾His3Lys和Thr5Val消除多肽與GGG和鋅指-2亞位點GAG的交叉反應性。值得注意的是，淘選期間一致選擇His3識別中間的鳥嘌呤，即使Lys3更好地區(qū)別A和G。提示該蛋白的淘選條件可能通過參數(shù)如親和力較通過特異性選擇更佳。在Zif268結構中，His3與中間鳥嘌呤的N7產(chǎn)生一個氫鍵(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-1180)。也可以與腺嘌呤的N7產(chǎn)生此氫鍵，而且實際上Zif268不能區(qū)別該位置的G和A(Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。在靶向GGA，GGC和GGT的多肽中，發(fā)現(xiàn)His3只指定中間的鳥嘌呤，雖然淘選GGC和GGT時選擇Lys3。同樣，通過修飾LyslSer和Ser3Glu降低靶向GTG的多肽的多重交叉反應性，使親和力降低5倍。已經(jīng)在Zif268的結合位點選擇研究中證實，Glu3與胞嘧啶的特異性非常高(Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。沒有結構研究表明Glu3與中間胸腺嘧啶相互作用，在我們的研究或任何其它研究中從未選擇Glu3識別中間的胸腺嘧啶(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Washigton，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。盡管如此，Ser3Glu修飾有利于識別中間胸腺嘧啶而不是胞嘧啶。這些實例說明了依賴以前的結構和選擇數(shù)據(jù)了解構成特異性的基礎的結構因素的局限性。還應該強調的是，不能通過現(xiàn)有的“識別密碼”預測涉及位置1和5的修飾性改進(Desjarlais，J.R.& Berg，J.M.(1992)ProcNatl Acad Sci USA 89，7345-9.Suzuki，M.，Gerstein，M.& Yagi，N.(1994)Nucleic Acids Res.22，3397-405，Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.U.S.A.91，11168-72，Choo，Y.& Klug，A.(1997)Curr.Opin.Struct.Biol.7，117-125)，所述“識別密碼”通常只考慮位置-1、2、3和6。只有通過聯(lián)合選擇和定點誘變，我們才能開始充分了解鋅指/DNA識別的復雜性。
從選擇和誘變組合的資料來看，對多數(shù)核苷酸的特異性識別最好利用基元而不是一個氨基酸完成。例如聯(lián)合采用Arg-1、Ser1和Asp2(RSD基元)可實現(xiàn)對3’鳥嘌呤的最佳指定。通過利用Val5和Arg6指定5’鳥嘌呤，可用僅在3位殘基不同(Lys3與GGG、Asn3與GAG、Glu3與GTG以及Asp3與GGG)的通用螺旋結構(SRSD-X-LVR)實現(xiàn)對亞位點GGG、GAG、GTG和GCG的識別。同樣，用最終克隆的Thr-1、Ser1和Gly2(TSG基元)指定3’胸腺嘧啶。此外，可用Asp-1、Pro1和Gly2(DPG基元)指定3’胞嘧啶，除亞位點為GCC外；該亞位點不能接受Pro1。在2個克隆中用Gln-1、Ser1、Ser2(QSS基元)指定3’腺嘌呤。研究所述基元位置1和2的殘基與各3’堿基的關系，如本文所述發(fā)現(xiàn)它們對特定3’堿基提供最佳特異性。
多靶ELISA測定法假定，所有蛋白優(yōu)選5’位置的鳥嘌呤，因為所有蛋白含有Arg6，而且由結構研究已知該殘基接觸該位置的鳥嘌呤(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-1180，Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure (London)6，451-464，Kim，C.A.&Berg，J.M.(1996)Nature Structural Biology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993)Science(Washington，D.C，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc NatlAcad Sci USA 93，13577-82，F(xiàn)airall，L.，Schwabe，J.W.R.，Chapman，L.，F(xiàn)inch，J.T.& Rhodes，D.(1993)Nature (London)366，483-7，Wuttke，D.S.，F(xiàn)oster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)，Mol.Biol.273，183-206，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.&Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943)。本文利用5’結合位點特征測定證實該相互作用((Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.U.S.A.91，11168-72)；圖2，白色條框)。將每種蛋白用于16種寡核苷酸靶的合并物，其中鋅指-2亞位點的5’核苷酸固定為G、A、T或C，中間核苷酸和3’核苷酸是隨機的。所有蛋白優(yōu)選GNN合并物，基本上無交叉反應。
純化蛋白的親和力研究證實多靶ELISA測定的結果。如果交叉反應性在ELISA測定中最小，則單個核苷酸錯配通常導致親和力降低100倍以上。還需要用鋅指蛋白證實特異性的此程度。一般來說，選擇或設計結合中間位置和3’位置含有G或A的亞位點的蛋白的親和力最高，其次為結合在中間位置或3’位置只有一個G或A的亞位點的蛋白，再次為結合僅含有T或C的亞位點的蛋白。前面一組與其靶的親和力較Zif268高(10nM)，后一組與其靶的親和力多少有點降低，而且?guī)缀跛械鞍椎挠H和力低于親代C7蛋白的親和力。結合親和力和結合特異性并沒有相關性，說明特異性不僅源自特異性蛋白-DNA接觸，而且源自僅包括正確核苷酸的相互作用。
在靶亞位點為GNG的所有蛋白中，Asp2總是與Arg-1共選擇?，F(xiàn)在應該知道的是，對此存在2個原因。根據(jù)對Zif268的結構研究(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-1180)，已知鋅指2的Asp2與Arg-1產(chǎn)生一對支柱性氫鍵以及一定的水性接觸，所述氫鍵穩(wěn)定Arg-1/3’鳥嘌呤相互作用。然而，Asp2的羧酸鹽還與胞嘧啶的N4產(chǎn)生一個氫鍵，所述胞嘧啶與鋅指-1亞位點的5’鳥嘌呤進行堿基配對。與該位置的T配對的腺嘌呤堿基可產(chǎn)生針對胞嘧啶觀測到的類似接觸。這種相互作用特別重要，因為它使鋅指2的識別亞位點從3個核苷酸(GNG)擴展為4個核苷酸(GNG(G/T))(Isalan，M.，Choo，Y.& Klug，A.(1997)Proc.Natl.Acad.Sci.U.S.A.94，5617-5621.，Jamieson，A.C.，Wang，H.&Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo Y.(1998)Biohemistry 37，12026-33)。這種現(xiàn)象稱為“靶位點重疊”，而且具有3個重要結果。首先，因為我們的鋅指-1亞位點含有5’鳥嘌呤，所以當鋅指-2亞位點為GNG時，選擇我們的文庫優(yōu)選Asp2。第二，它可限制在該研究中使用的文庫用于對GNN或TNN鋅指-2亞位點的選擇，因為這些文庫的指3含有一個Asp2，它可幫助指定鋅指-25’核苷酸為G或T。在指2含有Thr6的Zif268和C7中，指3的Asp2增強識別5’位置(T/G)GG的對G或T的識別。這種相互作用還可以解釋為什么以前的噬菌體展示研究(都使用基于Zif268的文庫)發(fā)現(xiàn)選擇主要限于GNN識別(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA91，11163-7.，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kin，S.-H & Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33，Wu，H.，Yang，W.-P & Barbas III，C.F.(1995)PNAS 92，344-348)。
最后，靶位點重疊潛在地限制這些鋅指用作模塊構件(modularbuilding blocks)。由結構資料已知，存在其中靶位點重疊非常廣泛的某些鋅指，例如GLI和YY1中的鋅指以及類似于Zif268而且僅具有中度重疊的其它鋅指。在我們的最后一組蛋白中，結合GGG、GAG、GTG和GCG的多肽中發(fā)現(xiàn)Asp2。見于位置2的其它殘基的重疊潛力大部分是未知的，然而結構研究提示，見于該位置的其它許多殘基可能參與這樣的亞位點交叉的接觸。含有Asp2的指可能限制模塊性，因為它們要求每個GNG亞位點后為T或G。
下表1總結了對GNN靶三聯(lián)體16個實施方案具有最高選擇性的序列(SEQ ID NO；1-16)。表1

上表數(shù)據(jù)顯示，鋅指結構域能夠以精確特異性識別所有可能的GNN三聯(lián)體序列。優(yōu)化的鋅指結構域能夠通過親和力降低100倍以上區(qū)別單個堿基不同。盡管見于優(yōu)化蛋白的關鍵接觸位置-1、3和6的許多氨基酸是與簡單識別密碼一致的氨基酸，但是發(fā)現(xiàn)優(yōu)化的特異性識別對這些殘基的鄰近位置殘基敏感。發(fā)現(xiàn)位置1、2和5的殘基對特異性識別是重要的。此外，所述數(shù)據(jù)首次證實，對3’堿基的高度特異性識別要求位置-1、1和2的序列基元而不是位置1殘基的簡單相同。這些殘基可能為所述螺旋在識別特異性堿基和排除其它堿基方面的相互作用提供合適的立體化學環(huán)境，最終結果是高度特異性的相互作用。如果這些結構域在其與DNA和其它鋅指結構域相互作用中是模塊式的，則它們具有廣泛的用途。利用靶位點重疊的可能限制作用可達到此目的，即應該靶向5’-(GNN)n-3’型序列。此外，所公開的結構域的現(xiàn)成重組可產(chǎn)生具有已知特異性的多指蛋白，而不需要在其制備中產(chǎn)生噬菌體展示文庫。這些多指蛋白已用于激活和阻抑人erbB-2啟動子在活細胞中驅動的轉錄。本文所述鋅指結構域家族可能足以構建166或17×106種結合5’-(GNN)6-3’型DNA序列的新型蛋白。
通過截短或延長野生型鋅指蛋白，或通過定點誘變作為野生型衍生多肽的變異體或組合上述程序以衍生或產(chǎn)生鋅指-核苷酸結合多肽衍生物。術語“截短的”是指含有的鋅指數(shù)少于天然鋅指結合蛋白總鋅指數(shù)的鋅指-核苷酸結合多肽或缺失非需要序列的鋅指-核苷酸結合多肽。例如天然TFIIIA含有9個鋅指，截短的鋅指-核苷酸結合蛋白TFIIIA可以為只有1-3個鋅指的多肽。延長是指其上加有額外鋅指模塊的鋅指多肽。例如TFIIIA可以通過添加3個鋅指結構域擴展至12個指。此外，截短的鋅指-核苷酸結合多肽可以含有一個以上的野生型多肽的鋅指模塊，因此產(chǎn)生“雜種”鋅指-核苷酸結合多肽。
術語“誘變的”是指利用任何已知方法對編碼所述蛋白的DNA進行的隨機或定點誘變獲得的鋅指衍生的核苷酸結合多肽。例如可對TFIIIA進行誘變以取代一個或多個重復共有序列的非保守殘基。也可以誘變截短的鋅指-核苷酸結合蛋白。
可以按照本發(fā)明截短、延長和/或誘變以抑制含有鋅指-核苷酸結合基元的核苷酸序列的功能的已知鋅指-核苷酸結合多肽的實例包括TFIIIA和Zif268。其它鋅指-核苷酸結合蛋白是本領域技術人員周知的。
可用本領域周知的各種標準技術制備本發(fā)明多肽(參見例如1995年1月18日提交的美國專利申請第08/676,318號，其全部內容通過引用結合到本文中)。在有利于富集序列特異性蛋白的條件下制備并選擇鋅指蛋白的噬菌體展示文庫。識別許多序列的鋅指結構域需要噬菌體選擇資料和結構信息指導的定點誘變進行精確定位(refinement)。
鼠Cys2-His2鋅指蛋白Zif268用于構建噬菌體展示文庫(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。Zif268是在結構上最充分特征鑒定的鋅指蛋白(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washinton，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-1180，Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-87)。主要接觸所述DNA的單鏈上的3個核苷酸的α螺旋N末端殘基介導該蛋白3個鋅指結構域中每個結構域的DNA識別。該3指蛋白的操縱基因結合位點(operator binding site)是5’-GCGTGGGCG-3’(下劃線是指-2亞位點)。Zif268和其它相關鋅指-DNA復合物的結構研究(Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)Nature StructuralBiology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993) Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，F(xiàn)airall，L.，Schwabe，J.W.R.，Chapman，L.，F(xiàn)inch，J.T.& Rhodes，D.(1993)Nature (London)366，483-7，Wuttke，D.S.，F(xiàn)oster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol. Biol.273，183-206.，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.& Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943，Narayan，V.A.，Kriwacki，R.W.&Caradonna，J.P.(1997)J.Biol.Chem.272，7801-7809)表明，α螺旋3個主要位置-1、3和6的殘基參與特異性堿基接觸。通常α螺旋位置-1的殘基接觸所述指亞位點的3’堿基，而位置3和6的殘基分別接觸中間的堿基和5’堿基。
為了選擇識別5’-GNN-3’亞組序列的一系列鋅指結構域，以噬菌體展示載體pComb3H構建2個高度不同的鋅指文庫(Barbas III，C.F.，Kang，A.S.，Lemer，R.A.& Benkovic，S.J.(1991)Proc.Natl.Acad.Sci.USA 88，7978-7982.，Rader，C.& Barbas III，C.F.(1997)Curr.Opin.Biotechnol.8，503-508)。2個文庫均涉及Zif268變異體C7指2的α螺旋中的殘基隨機化作用(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。用NNK摻雜策略通過隨機化位置-1、1、2、3、5、6構建文庫1，而采用隨機化位置-2、-1、1、2、3、5、6的VNS摻雜策略構建文庫2。NNK摻雜策略允許所有氨基酸組合在32個密碼子中，而VNS策略在其24個密碼子組中排除了Tyr、Phe、Cys和所有終止密碼子。所述文庫分別包括4.4×109和3.5×109成員，每個文庫均能識別5’-GCGNNNGCG-3’型序列。NNK文庫的大小保證它能夠以99％置信度進行研究，而VNS文庫高度多樣性，但是多少有點不完整。然而這些文庫明顯大于以前報道的鋅指文庫(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemiry 37，12026-33)。用溶液結合方案以16個5’-GCGGNNGCG-3’生物素化發(fā)夾DNA靶對鋅指展示-噬菌體進行7輪選擇。通過加入競爭DNA增加每輪的嚴格性。提供剪切的鯡魚精子DNA，以對與DNA非特異性結合的噬菌體進行選擇。通過提供5’-GCGNNNGCG-3’型DNA作特異性競爭物獲得序列特異性的嚴格選擇壓力。加入過量的5’-GCGGNNGCG-3’型DNA以對一個或兩個堿基改變的DNA的結合提供更嚴格的選擇，與生物素化靶相比。用鏈霉抗生物素蛋白包被珠回收結合單個生物素化DNA靶序列的噬菌體。在某些情況下重復所述選擇過程。本發(fā)明資料表明，這些結構域是功能模塊，而且可與另一個模塊重組產(chǎn)生多指蛋白，所述多指蛋白能夠能夠以亞納摩爾親和力結合18-bp序列。本文所述鋅指結構域家族足以構建17×106結合5’-(GNN)6-3’DNA序列家族的新型蛋白。
本發(fā)明包括編碼鋅指-核苷酸結合多肽的核苷酸序列?？梢酝ㄟ^幾種方法獲得編碼本發(fā)明鋅指-核苷酸結合多肽(包括天然、截短和延長的多肽)的DNA序列。例如可用本領域周知的雜交方法分離所述DNA。所述方法包括但不限于(1)用探針與基因組文庫或cDNA文庫雜交，檢測共有的核苷酸序列；(2)用抗體篩選表達文庫，檢測共同結構特征；和(3)用聚合酶鏈反應(PCR)合成?？捎帽绢I域已知的方法獲得本發(fā)明的RNA序列(參見例如Current Protocols in MolecularBiology，Ausubel等編輯，1989)。
用以下方法可獲得編碼本發(fā)明的鋅指-核苷酸結合多肽的特異性DNA序列(1)從基因組DNA分離雙鏈DNA序列；(2)化學制備提供目的多肽必需密碼子的DNA序列；和(3)通過對分離自真核供體細胞的mRNA進行逆轉錄，體外合成雙鏈DNA序列。在后一種情況下，最后制得mRNA的雙鏈DNA互補物，一般稱為cDNA。在制備用于重組方法的特異性DNA序列的這3種方法中，最少用分離基因組DNA。當因為存在內含子最好是微生物表達哺乳動物多肽時，尤其如此。
為了獲得鋅指衍生-DNA結合多肽，當已知目的多肽產(chǎn)物的完整氨基酸殘基序列時，通常合成DNA序列是優(yōu)選方法。當目的多肽的完整氨基酸殘基序列未知時，直接合成DNA序列是不可能的，優(yōu)選方法是制備cDNA序列。分離目的cDNA序列的標準方法有制備質粒攜帶的cDNA文庫，反轉錄mRNA獲得cDNA文庫，所述mRNA在高水平遺傳表達的供體細胞中是豐余的。當聯(lián)合使用聚合酶鏈反應技術時，甚至可以克隆表達極少的產(chǎn)物。在已知所述多肽氨基酸序列的重要部分時，在對變性為單鏈形式的克隆拷貝cDNA進行DNA/DNA雜交方法中，可制備標記的單鏈或雙鏈DNA或RNA探針序列，該探針序列與推測存在于靶cDNA中的序列相同(Jay等，Nucleic AcidResearch 112325，1983)。
另一方面，本發(fā)明提供的包含治療有效量鋅指-核苷酸結合多肽或治療有效量編碼鋅指-核苷酸結合多肽的核苷酸序列和藥學上可接受的載體的藥用組合物。
本文使用的術語“藥學上可接受的”、“生理上可耐受的”及其符合語法規(guī)則的不同表述，當它們是指組合物、載體、稀釋劑和試劑時，它們可以交換使用，而且表示所述物質可以給予人類或而不會產(chǎn)生妨礙給予所述組合物程度的不需要的生理作用，例如惡心、頭暈、腸胃不適等。
含有溶解或分散其中的活性成分的藥用組合物制劑是本領域周知的。通常這類組合物制成可無菌注射的液體溶液或懸浮液、水溶液或非水溶液，也可制成適用于使用前配制成溶液或懸浮液、液體的固體形式。所述制劑也可以是乳化制劑。
以適用于本文所述治療法的量將所述活性成分與賦形劑混合，所述賦形劑是藥學上可接受的而且與所述活性成分親和。合適的賦形劑例如水、鹽水、葡萄糖、甘油、乙醇等以及它們的組合。此外，如果需要的話，所述組合物可以含有少量輔助物質，例如濕潤劑或乳化劑，以及增強所述活性成分療效的pH緩沖劑等。
本發(fā)明治療性藥用組合物可以包含其中組分的藥學上可接受的鹽。藥學上可接受的鹽包括與無機酸(例如鹽酸或磷酸)或有機酸(例如乙酸、酒石酸、扁桃酸等)形成的酸加成鹽(與所述多肽的游離氨基形成)。與游離羧基形成的鹽也可以衍生自無機堿，例如氫氧化鈉、氫氧化鉀、氫氧化銨、氫氧化鈣或氫氧化鐵，以及也可以衍生自有機堿，例如異丙胺、三甲胺、2-乙氨基乙醇、組氨酸、普魯卡因等。
生理學上耐受的載體是本領域周知的。典型的液體載體為無菌水溶液，除了所述活性成分和水之外它不含任何其它物質，或者它含有生理pH的緩沖劑，例如磷酸鈉或生理鹽水或此二者如磷酸緩沖鹽溶液。水溶液載體還可以含有一種以上的緩沖鹽以及鹽，例如氯化鈉和氯化鉀、葡萄糖、丙二醇、聚乙二醇以及其它溶質。液體組合物除了水相之外還可以含有液體相。這樣的其它典型液體相為甘油、植物油如棉籽油、有機酯如油酸乙酯以及水-油乳液。III。組合物另一方面，本發(fā)明提供多種鋅指-核苷酸結合多肽，其有效結合方式使得可以特異性結合定義為5’-(GNN)n-3’的核苷酸靶基元，其中n是大于1的整數(shù)。最好n是2至6左右的整數(shù)。
下文的實施例和1995年1月18日提交的美國專利申請第08/676，318號描述了鋅指-核苷酸結合多肽的連接方法。優(yōu)選用寡肽接頭連接各個多肽。這樣的接頭最好類似于見于天然鋅指蛋白的接頭。用于本發(fā)明的優(yōu)選接頭為氨基酸殘基序列TGEKP(SEQ ID NO111)。
為了檢測制備這樣的組合物及其用于基因控制的效能，選擇人erbB-2基因作模型。特異性識別該基因5’非翻譯區(qū)的18bp序列的多指蛋白與KRAB、ERD或SID阻抑結構域融合轉化為轉錄阻抑物。通過與單純皰疹VP16激活結構域或稱為VP64的VP16基本激活結構域的四聚體重復融合制備轉錄激活物。該資料首次表明，使設計蛋白導向基因轉錄區(qū)的單一位點可以實現(xiàn)基因阻抑和基因活化。
選擇人類erbB-2基因作為模型靶，以開發(fā)鋅指為基礎的轉錄開關。ErbB受體家族成員在人類惡性腫瘤發(fā)生中起作重要的作用。具體來說，在多個部位(包括乳腺、卵巢、肺、胃和唾液腺)發(fā)病率高的人類腺癌中，由于基因擴增和/或轉錄失調引起erbB-2過量表達(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184)。ErbB-2的表達增加導致組成型激活其固有的酪氨酸激酶，而且已經(jīng)證實erbB-2表達增加使培養(yǎng)細胞轉化。許多臨床研究表明，患有ErbB-2表達水平增高的腫瘤的患者的預后較差(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184)。erbB-2除了涉及人類癌癥之外，它在成年哺乳動物以及哺乳動物胚胎發(fā)育中均起作重要的生物學作用(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184，Altiok，N.，Bessereau，J.-L.& Changeux，J.-P.(1995)EMBO J.14，4258-4266，Lee，K.-F.，Simon，H.，Chen，H.，Bates，B.，Hung，M.-C.&Hauser，C.(1995)Nature 378，394-398)。
所以erbB-2啟動子是開發(fā)人工轉錄調節(jié)物的有趣實驗案例。已經(jīng)詳細特征鑒定了該啟動子，并證實它較復雜，它含有TATA依賴性和TATA非依賴性轉錄起始位點(Ishii，S.，Imamoto，F(xiàn).，Yamanashi，Y.，Toyoshima，K.& Yamamoto，T.(1987)Proc.Natl.Acad.Sci.USA 84，4374-4378)。盡管早期的研究表明多指蛋白可用作特異性激活或抑制轉錄的轉錄調節(jié)物，但是這些蛋白結合人工啟動子上游至蛋白結合位點的6個串聯(lián)重復序列(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。此外，該研究應用其結合特異性未提高的多指蛋白。在本文中，我們測試了由預定構件裝配的多指蛋白結合天然erbB-2啟動子單一位點的效能。如上所述制備并特征鑒定結合16個5’-GNN-3’三聯(lián)體中每一個的鋅指結構域家族。我們關注產(chǎn)生此識別結構域家族的一個原因是，大多數(shù)生物的啟動子區(qū)的堿基組成相對富含GC。因此，如果用這組明確的鋅指結構域易于裝配成識別5’-(GNN)x-3’位點的蛋白，則能夠快速并特異地對許多基因進行調節(jié)。含有6個鋅指結構域并識別18bp DNA的蛋白應該足以界定所有已知基因組中的單一位置。erbB-2啟動子區(qū)的檢測顯示2個5’-(GNN)6-3’位點和1個5’-(GNN)9-3’位點。其中一個位點本文鑒定為e2c，它屬于erbB-2基因的5’非翻譯區(qū)，將其選擇為制備基因特異性轉錄開關的靶位點。對GenBank數(shù)據(jù)庫的BLAST序列相似性檢索證實，該序列是erbB-2獨特序列。e2c靶序列位于2個主要轉錄起始位點下游鄰近區(qū)域，使得可以通過抑制轉錄起始或延長檢測阻抑作用。e2c靶位點的有趣特征是，它存在于一段短的序列中，該序列在人類、大鼠和小鼠erbB-2基因之間是保守的(White，M.R.-A.& Hung，M.-C.(1992)Oncogene 7，677-683)。所以，對該位點的尋靶使得可以在用于人類疾病之前用動物模型研究此策略。
為了制備具有需要DNA-結合特異性的多指蛋白，本研究集中于裝配預定鋅指結構域，它與Greisman和Pabo提出的序貫選擇策略相反(Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)。這種策略需要對各個需要蛋白序貫制備和選擇6個鋅指文庫，使大多數(shù)實驗室無法利用這種實驗方法而且極其費時。此外，因為在此策略中難以應用特異性負選擇以排除結合其它可選序列，所以可能產(chǎn)生相對非特異的蛋白，見最近的報道(Kim，J.-S.& Pabo，C.O.(1997)J.Biol.Chem.272，29795-29800)。
研究制備識別9bp DNA序列的3指蛋白的2種不同策略的一般適用性。每個策略均以鋅指結構域的模塊性質為基礎，而且利用識別5’-GNN-3’三聯(lián)體的鋅指結構域家族。在第一個策略中，用PCR裝配策略將預定的指2(F2)結構域變異體融合在一起，從而制備識別5’-(GNN)6-3’erbB-2靶位點e2c的半位點(HS)1和2的2種三指蛋白。為了檢測該方法的普遍性，用相同的方法制備3種另外的識別5’-(GNN)3-3’型序列的三指蛋白。以與麥芽糖結合蛋白(MBP)的融合物制備純化鋅指蛋白。ELISA分析提示，順序連接的F2蛋白能夠協(xié)調作用以特異性識別需要的9-bp DNA靶序列。所示5種蛋白中的每種蛋白能夠區(qū)分靶和非靶5’-(GNN)3-3’序列。
通過電泳遷移率變動分析測定每種蛋白對其靶的親和力。這些研究證實所述鋅指肽與Zif268和Kd值3-70nM的其它天然轉錄因子具有相當?shù)挠H和力。在本文中，Zif268與其操縱基因的Kd是10nM。必須注意的是，因為仍待解釋的原因，一個研究小組報道天然Zif268蛋白的Kd值范圍為6nM-10 pM，有600倍的變化(Pavletich，N.P.&Pabo，C.O.(1991)Science 252，809-17.，Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)。大多數(shù)研究報道Zif268-DNA相互作用的Kd值為3-10nM，Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.USA 91，11163-11167，Hamilton，T.B.，Borel，F(xiàn).& Romaniuk，P.J.(1998)Biochemistry 37，2051-2058)。因此，為了比較本文報道的結果與其它報道結果，應該比較相對Kds，即(突變體Kd)/(Zif268 Kd)，其中2個值均來自相同報道?，F(xiàn)有資料相對優(yōu)于用噬菌體展示制備的新型三指蛋白的其它研究，其中報道所述三指蛋白的親和力比Zif268弱10-200倍(Greisman，H.A.& Pabo，C.0.(1997)Science 275，657-661，Choo，Y.，Sanchez-Garcia，I.& Klug，A(1994)Nature 372，642-5)。
在第二種策略中，作為順序連接F2結構域變異體的替代方法，通過“螺旋嫁接(helix grafting)”制備對2個e2c 5’-(GNN)3-3’半位點特異性的三指蛋白。鋅指結構域的構架殘基，即那些支持識別螺旋形式的殘基在不同蛋白中是不同的。我們預測構架殘基在親和性和特異性方面具有作用。為了嫁接螺旋，將DNA識別螺旋的位置-2到6的氨基酸嫁接入Zif268(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17)或Sp1C構架(Desjarlais，J.R.& Berg，J.M.(1993)Proc.Natl.Acad.Sci.USA 90，2256-60)。Sp1C蛋白是設計的共有蛋白，其對螯合劑的穩(wěn)定性提高。通過基于PCR的快速基因裝配策略制備DNA模板，由此模板表達所述蛋白。在每種情況下，對MBP融合蛋白的ELISA分析表明，保有用F2構架構建物觀測到的DNA結合特異性和親和性。
如上所述，識別9bp DNA序列不足以指定復雜基因組中的獨特位點。相反，識別18bp連續(xù)DNA序列的6指蛋白能夠確定人類基因組中的單一位點，因此實現(xiàn)了產(chǎn)生基因特異性轉錄開關的重要先決條件。通過簡單的限制酶消化并用F2、Zif268和Sp1C構架模板DNA克隆，由三指構建物制備結合erbB-2靶序列e2c的六指蛋白。對純化MBP融合蛋白的ELISA分析表明，各六指蛋白能夠識別特異性靶序列，與非靶5’-(GNN)6-3’位點或串聯(lián)重復的Zif268靶位點幾乎沒有交叉反應性。
用凝膠移位分析測定每種蛋白對e2c DNA靶位點的親和性。用F2構架構建的E2C(F2)六指蛋白觀測到中等大小的Kd值25nM，僅為其組成成分三指蛋白2-3倍。在我們先前對六指蛋白的研究中，我們觀測到六指蛋白對其DNA配體的親和力與其三指組成成分相比，增強約70倍(Lir，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。E2C(F2)肽親和力沒有明顯增加提示串聯(lián)連接的F2結構域不理想?？赡芰傅鞍椎腇2結構域周期性在延長序列上與DNA的周期性不匹配，而且該蛋白的主要結合能部分可能用于解旋DNA(Shi，Y.& Berg，J.M.(1996)Biochemistry 35，3845-8)。與F2結構域蛋白相反，與其原三指蛋白組分相比，E2C(Zif)和E2C(Sp1)六指蛋白的親和力增加40-70倍，Kd值分別為1.6nM和0.5nM。重要的是，這些蛋白的2個三指蛋白均參與結合，因為任何一個半位點突變均導致親和力降低約100倍。多數(shù)已知轉錄因子以納摩爾親和力結合其特異性DNA配體，提示正常生存期的蛋白/DNA復合物控制基因表達。因此，不需要親和力增加的鋅指蛋白，而且鋅指蛋白親和力增加可能是不利的，尤其是還增加與非特異性DNA的結合時。
一般認為鋅指結構域本質上是模塊性的，每個鋅指識別3-bp亞位點(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17)。我們能夠重組鋅指結構域成為任何需要序列，獲得識別結構5’-(GNN)x-3’延長序列的多指蛋白，就支持這種觀點。然而，應該指出的是，至少在某些情況下，鋅指結構域似乎可指定重疊的4bp位點而不是單獨的3bp位點。在Zif268時，除了位于螺旋位置-1、3和6殘基之外其它殘基也參與接觸DNA(Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.&Pabo，C.O.(1996)Structure 4，1171-1180)。具體來說，F(xiàn)2的螺旋位置2的天冬氨酸在識別中起作幾種作用，并產(chǎn)生多種接觸。天冬氨酸側鏈的羧基與位置-1的精氨酸形成氫鍵結合，穩(wěn)定其與靶位點的3’-鳥嘌呤的相互作用。該天冬氨酸還參加與鳥嘌呤的互補胞嘧啶的水介導性接觸。此外，觀測到所述羧基直接接觸指1結合位點5’-鳥嘌呤堿基的互補鏈上胞嘧啶堿基的N4。正是這種相互作用形成靶位點重疊的化學基礎。事實上，對4個5’-GCG GNG GCG-3’序列選擇Zif268 F2文庫時，得到位置-1為精氨酸，位置2為天冬氨酸，類似于天然Zif268的殘基。因為e2c靶序列(5’-GGG GCC GGA GCC GCA GTG-3’)(SEQID NO112)后面是A而不是G，所以預期對于e2c特異性六指蛋白的指1存在潛在的靶位點重疊問題。但是在Zif-和Sp1C-構架的六指蛋白中，根據(jù)其與靶位點e2c-a和e2c-g的親和力非常相似指示，似乎在位置2上含有天冬氨酸的GTG-特異性指1同樣好地識別序列5’-GTGA-3’和5’-GTGG-3’。
上述本發(fā)明多核苷酸或組合物能夠與一種或多種轉錄調節(jié)因子有效連接。調節(jié)因子例如轉錄激活物或轉錄抑制物或阻抑物是本領域周知的。有效連接多肽與這類因子的方法也是本領域周知的。下文詳細討論典型優(yōu)選的這類因子及其調節(jié)基因表達的應用。II.用途在一個實施方案中，本發(fā)明方法包括調節(jié)(抑制)含鋅指核苷酸結合基元的核苷酸序列的作用的方法，該方法包括使鋅指核苷酸結合基元與有效量結合所述基元的鋅指核苷酸結合多肽接觸。在所述核苷酸序列是啟動子時，所述方法包括抑制轉錄反式激活含鋅指-DNA結合基元的啟動子。術語“抑制”是指例如抑制與啟動子有效連接的結構基因的轉錄激活水平，所述啟動子含有鋅指-核苷酸結合基元。另外，鋅指-核苷酸結合多肽衍生物可結合結構基因或RNA序列中的基元。
術語“有效量”包括使先前激活的啟動子失活的量或使含鋅指-核苷酸結合基元啟動子失活的量，或阻斷結構基因轉錄或RNA翻譯的量。鋅指衍生-核苷酸結合多肽需要量為替代現(xiàn)成蛋白/啟動子復合物中的天然鋅指-核苷酸結合蛋白的必需量，或與天然鋅指-核苷酸結合蛋白競爭而本身與啟動子形成復合物的必需量。同樣，阻斷結構基因或RNA的需要量分別為結合并阻止RNA聚合酶從所述基因閱讀的量或抑制翻譯的量。所述方法最好在細胞內進行。通過功能性失活啟動子或結構基因抑制轉錄或翻譯。通過本文所述的機理之一例如逆轉錄病毒載體或脂質體、或本領域周知的其它方法能夠傳遞有效量抑制蛋白，使其結合或“接觸”含鋅指-核苷酸結合蛋白基元的細胞核苷酸序列。
術語“調節(jié)”是指抑制、增強或誘導一種功能。例如本發(fā)明的鋅指-核苷酸結合多肽可通過結合啟動子內的基元，因此增強或抑制與該啟動子核苷酸序列有效連接的基因轉錄，從而調節(jié)啟動子序列?；蛘哒{節(jié)可以包括抑制基因轉錄，其中鋅指-核苷酸結合多肽結合結構基因，并阻止DNA依賴性RNA聚合酶從該基因開始閱讀，由此抑制基因轉錄。結構基因可以例如是正常細胞基因或癌基因。另一方面，調節(jié)可以包括抑制轉錄物的翻譯。
基因啟動子區(qū)包括通常位于結構基因5’的調節(jié)元件。如果需要激活基因，稱為轉錄因子的蛋白結合到該基因的啟動子區(qū)。該裝配類似于“開”，使酶能夠從DNA轉錄第二個遺傳區(qū)段為RNA。在多數(shù)情況下，產(chǎn)生的RNA分子用作合成特定蛋白質的模板；有時RNA本身就是終產(chǎn)物。
所述啟動子區(qū)可以是正常細胞啟動子或例如癌啟動子(onco-promoter)。癌啟動子一般是病毒性啟動子。例如逆轉錄病毒的長末端重復序列(LTR)是可以成為本發(fā)明鋅指結合多肽變異體的靶的啟動子區(qū)。慢病毒組成員的啟動子是病毒啟動子區(qū)實例，所述慢病毒組成員包括病原體如人嗜T淋巴細胞病毒(HTLV)1和2或人類免疫缺陷病毒(HIV)1或2，本發(fā)明鋅指結合多肽可以靶向所述病毒啟動子區(qū)進行轉錄調節(jié)。
為了測試應用鋅指蛋白作基因特異性轉錄調節(jié)物的原理，使E2C(Sp1)六指蛋白與多個效應結構域融合。使3個人源阻抑物結構域中任何一個與鋅指蛋白連接產(chǎn)生轉錄阻抑物。用ERF阻抑結構域(ERD)制備第一種阻抑蛋白(Sgouras，D.N.，Athanasiou，M.A，Beal，G.J.，Jr.，F(xiàn)isher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)，ERF阻抑結構域定義為ets2阻抑因子(ERE)的氨基酸473-530。該結構域介導ERF對ets家族轉錄因子活性的拮抗作用。將該結構域與鋅指蛋白的C末端融合構建合成阻抑物。用Krüppel-結合盒(Krüppel-associated box，KRAB)結構域制備第二種阻抑蛋白(Margolin，J.F.，F(xiàn)riedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F(xiàn).J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-4513)。該阻抑結構域通常見于鋅指蛋白的N末端，而且推測它通過與RING指蛋白KAP-1相互作用(Friedman，J.R.，F(xiàn)redericks，W.J.，Jensen，D.E.，Speicher，D.W.，Huang，X.-P，Neilson，E.G.& Rauscher III，F(xiàn).J.(1996)Genes & Dev.10，2067-2078)，以不依賴于距離和方向的方式對TATA依賴性轉錄發(fā)揮阻抑作用(Pengue，G.& Lania，L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020)。我們利用位于鋅指蛋白KOX1的氨基酸1-97的KRAB結構域(Margolin，J.F.，F(xiàn)riedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F(xiàn).J.(1994)Proc.Natl.Acad.Sci USA 91，4509-4513)。在這種情況下，構建與六指蛋白的N末端融合物。最后，為了探索組蛋白去乙酰化用于阻抑的作用，將MadmSIN3相互作用結構域(SID)的氨基酸1-36與鋅指蛋白N末端融合(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.&Eisenman，R.N.(1996)Mol.Cell..Biol.16，5772-5781)。這種小結構域位于轉錄因子Mad的末端，它作用于mSIN3，mSIN3再作用于輔阻抑物N-CoR和組蛋白去乙酰化酶mRPD1，從而介導其轉錄抑制作用(Heinzel，T.，Lavinsky，R.M.，Mullen，T.-M.，Ssderstrsm，M.，Laherty，C.D.，Torchia，J.，Yang，W.-M.，Brard，G.，Ngo，S.D.&其他人，e.(1997)Nature 387，43-46)。為了檢測基因特異性激活，將鋅指蛋白與單純皰疹病毒VP16蛋白的氨基酸413-489(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)或VP16基本活化結構域DALDDFDLDNL(SEQ ID NO113)的人工四聚體重復(Seipel，K.，Georgiev，O.& Schaffner，W.(1992)EMBO J.11，4961-4968)(稱為VP64)融合制備轉錄激活物。
制備包含與熒光素酶報道基因連接的erbB-2啟動子片段的報道構建物以測試我們設計的轉錄調節(jié)物的比活。靶報道質粒含有自ATG起始密碼子的核苷酸-758至-1，而對照報道質粒含有核苷酸-1571至-24，因此僅保留了包括在位置-24至-7內的E2C結合位點的一個核苷酸。當瞬時轉染入HeLa細胞時，兩個啟動子片段均具有相似活性，與以前的觀測結果一致(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)。為了測試鋅指-阻抑結構域融合構建物對erbB-2啟動子活性的影響，用各鋅指表達載體和熒光素酶報道構建物瞬時共轉染HeLa細胞(圖5A)。觀測到每個構建物的明顯阻抑作用。ERD和SID融合蛋白分別產(chǎn)生約50％和80％的阻抑作用。最有效的阻抑物是KRAB融合蛋白。該蛋白完全阻抑erbB-2啟動子活性。所觀測到的殘余活性為弱啟動子pGL3報道物(promoter-less pGL3 reporter)的背景水平。相反，沒有一種蛋白明顯抑制缺乏E2C靶位點的對照erbB-2報道構建物，證實E2C(Sp1)蛋白與其靶位點特異性結合才真正介導阻抑作用。缺乏任何效應子結構域的鋅指蛋白表達產(chǎn)生弱阻抑，約30％的阻抑，說明于SID和KRAB構建物觀測到阻抑作用主要由其效應子結構域產(chǎn)生，而不是單純的DNA-結合。此觀測結果強有力地說明，阻抑機制是有效抑制了轉錄起始而不是延長。RNA聚合酶II一旦開始轉錄，似乎聚合酶作用可容易地從DNA移去鋅指蛋白。
應用2個相同報道構建物研究基因特異性多指蛋白用于介導轉錄激活的效用。發(fā)現(xiàn)VP16融合蛋白刺激轉錄增加至約5倍，而VP64融合蛋白產(chǎn)生27倍激活。鑒于鋅指蛋白結合基因轉錄區(qū)的事實，基于單一VP16的轉錄激活物對啟動子活性的明顯刺激作用是例外情況。這又再次證實，在RNA聚合酶II途徑中鋅指蛋白僅僅是結合、即使亞納摩爾親和力的鋅指蛋白的結合也不一定負面影響基因表達。
本文資料表明，用識別5’-GNN-3’位點的預定結構域能夠快速制備可結合新型9-和18-bp DNA靶位點的鋅指蛋白。該信息足以制備166或17×106新型六指蛋白，每個鋅指蛋白均能結合18 bp DNA序列。構建新型鋅指蛋白的這種快速方法學優(yōu)于其它學者提出的序貫產(chǎn)生并選擇鋅指結構域(Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)，該方法利用提示在靶向5’-GNN-3’位點的蛋白中可避免可能的上述靶重疊問題的結構信息。應用復雜而充分研究的erbB-2啟動子和活的人體細胞的資料證實，當這些蛋白提供合適效應結構域時，在這些實驗中它們可用于刺激或激活表達以及產(chǎn)生各級水平的阻抑至背景水平。這些研究提示，作為轉錄抑制物的KRAB結構域明顯強于ERD或SID結構域，既能夠抑制該啟動子的TATA依賴性轉錄起始又能夠抑制TATA非依賴性轉錄起始。以前沒有直接比較過這些阻抑結構域。利用預定鋅指結構域構建與效應結構域連接的多指蛋白的本發(fā)明策略明顯優(yōu)于試圖僅通過競爭或干擾參與轉錄復合物的蛋白抑制轉錄的策略(Kim，J.-S.& Pabo，C.O.(1997)J.Biol.Chem.272，29795-29800，Kim，J.-S.，Kim，J.，Cepek，K.L.，Sharp，P.A.& Pabo，C.O.(1997)Proc.Natl.Acad.Sci.USA 94，3616-3620)。使用具有遠距離作用潛力的效應結構域使得可以將這些基因開關用于調節(jié)未特征鑒定的基因和啟動子。因為可用我們的PCR裝配策略以高通量方式制備這些轉錄調節(jié)物，所以我們認為評價其潛在實際用途是適當?shù)摹Ｒ赃@種方式制備的新型DNA結合蛋白在基于DNA的診斷應用中具有潛在效用。為了研究基因功能，我們認為既能激活基因轉錄又能阻抑基因轉錄、必要的話能夠以階梯水平激活以及阻抑基因轉錄，有助于鑒定基因功能。因為這些蛋白通過反式作用發(fā)揮其控制作用，所以可以在雜合轉基因動物使功能性基因失活或激活。這可以使在整體動物使基因失活需要的時間明顯減少，而且可以擴大失活技術適用的生物類型。這些蛋白也可用于基因治療以抑制產(chǎn)生病毒基因產(chǎn)物或激活參與抗病的基因。有意義的是，制備這些蛋白的簡便性將有助于科學團體研究這些設想。
以下實施例舉例說明本發(fā)明的優(yōu)選實施方案，而不是以任何方式限制本說明書或權利要求書。實施例1利用噬菌體展示進行選擇基本上按以前方法(Shi，Y.& Berg，J.M.(1996)Biochemistry 35，3845-8)通過PCR重疊延伸構建鋅指文庫。如前所述(Pengue，G.& Lania，L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020，F(xiàn)riedman，J.R.，F(xiàn)redericks，W.J.，Jensen，D.E.，Speicher，D.W.，Huang，X.-P.，Neilson，E.G.& Rauscher III，F(xiàn).J.(1996)Genes & Dev.10，2067-2078)培養(yǎng)以及沉淀噬菌體，不同的是用ER2537細胞(New England Biolabs)繁殖噬菌體，并在生長培養(yǎng)基中加入90μM氯化鋅。將沉淀的噬菌體再懸浮于鋅緩沖液A(ZBA；10mM Tris，pH 7.5/90 mM KCl，1mM氯化鎂，90μM氯化鋅)/1％BSA/5mM DTT中。加入72nM生物素化發(fā)夾靶寡核苷酸之前，使結合反應物(500μlZBA/5mM DTT/1％Blotto(BioRad)/寡核苷酸競爭物/4μg剪切鯡魚精DNA(Sigma)/100μl過濾的噬菌體(約1013集落形成單位)在室溫下溫育30分鐘。再在恒速輕輕混合下繼續(xù)溫育3.5小時。用500μl ZBA/1％BSA洗滌鏈霉抗生物素蛋白包被的磁珠(50μl；Dynal)2次，然后用500μl ZBA/5％Blotto/抗體-展示(不相關)的噬菌體(約1012集落形成單位)在室溫下封閉約4小時。結合結束時，用結合反應物置換封閉溶液，并在室溫下溫育1小時。用500μl ZBA/5mMDTT/2％吐溫20在1小時內將珠子洗滌10次，然后用不含吐溫20的該溶液洗滌1次。用10μg/μl胰蛋白酶洗脫結合噬菌體30分鐘。
發(fā)夾靶核苷酸的序列為5’-生物素-GGACGCN’N’N’CGCGGGTTTTCCCGCGNNNGCGTCC-3’(SEQ IDNO114)，其中NNN是3-核苷酸指2-靶序列，而N’N’N’為其互補堿基。每輪選擇包含7.2nM的相似非生物素化寡核苷酸(其中靶序列是TGG(compTGG))，以對污染的親本噬菌體進行選擇。此外，非生物素化寡核苷酸的2個合并物用作競爭物一個含有全部64種可能的3-核苷酸靶序列(compNNN)，另一個除了目前的選擇靶(compGNN)之外包含所有GNN靶序列。通常如下使用這些合并物第一輪，無compNNN或compGNN；第二輪，7.2 nM compGNN；第三輪，10.8nM compGNN；第四輪，1.8μM compNNN，25nM compGNN；第五輪，2.7μM compNNN，90nM compGNN；第六輪，2.7μM compNNN，250nM compGNN；第七輪，3.6μM compNNN，250nM compGNN。實施例2多靶特異性測定將含鋅指編碼序列的pComb3H(Pengue，G.& Lania，L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020，Heinzel，T.，Lavinsky，R.M.，Mullen，T.-M.，Ssderstrsm，M.，Laherty，C.D.，Torchia，J.，Yang，W.-M.，Brard，G.，Ngo，S.D.&其他人，e.(1997)Nature 387，43-46)噬菌粒RFDNA的片段亞克隆入修飾的pMAL-c2(New England Biolabs)細菌表達載體，并將其轉化入XL1-Blue(Stratagene)中。用蛋白融合及純化系統(tǒng)(New England Biolabs)由IPTG誘導的培養(yǎng)物制備含過量表達的麥芽糖結合蛋白-鋅指融合蛋白的凍融提取物。在96孔ELISA板的各孔中加入0.2μg鏈霉抗生物素蛋白(Pierce)，以37℃溫育1小時，然后用水洗滌2次。同樣加入生物素化靶寡核苷酸(0.025μg)。加入ZBA/3％BSA封閉，但是在溫育后不洗滌各孔。之后所有溫育在室溫下進行。用1×結合緩沖液(ZAB/1％BSA/5mM DTT/0.12μg/μl剪切鯡魚精子DNA)連續(xù)2倍稀釋提取物8次。將樣品溫育1小時，然后用水洗滌10次。將小鼠抗麥芽糖結合蛋白單克隆抗體(Sigma)的ZBA/1％BSA加于各孔處理30分鐘，然后用水洗滌10次。將綴合堿性磷酸酶的山羊抗小鼠IgG單克隆抗體(Sigma)加于各孔處理30分鐘，然后用水洗滌10次。加入堿性磷酸酶底物(Sigma)，用SOFTmax 2.35(Molecular Devices)定量OD405。實施例3凝膠遷移率變動分析用蛋白融合及純化系統(tǒng)(New England Biolabs)將融合蛋白純化至90％以上的均一性，其中例外的是ZAB/5mMDTT用作柱緩沖液。根據(jù)考馬斯亮藍染色的15％SDS-PAGE凝膠，與BSA標準品比較，確定蛋白純度和濃度。用[32P]于其5’或3’端標記靶寡核苷酸，并凝膠純化。連續(xù)3倍稀釋11次的蛋白在20μl結合反應物(1×結合緩沖液/10％甘油/約1pM靶寡核苷酸)中于室溫下溫育3小時，然后用0.5×TBE緩沖液在5％聚丙烯酰胺凝膠上分離。用PhosphorImager和ImageQuant軟件(Molecular Dynamics)定量干燥凝膠，通過斯卡查德分析確定KD。實施例4利用需要的DNA結合特異性制備多指蛋白本文報道的研究應用附圖(accompanying manuscript)中定義的指2(F2)變異體pmGAC、pmGAG、pGCA、pGCC、pmGGA、pmGGC、pmGGG和pGTG(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)。為了制備編碼多指蛋白的DNA，用PCR從選定或設計的F2變異體擴增F2編碼區(qū)，并通過PCR重疊延伸裝配。或者分別由8或6個重疊寡核苷酸合成編碼具有Zif268或Sp1C構架的三指蛋白的DNA。Sp1C構架構建物用于本報道所述的所有報道分析，其制備如下如果為E2C-HS1(Sp1)時，將寡核苷酸SPE2-3(5’-GCG AGC AAG GTC GCG GCA GTC ACT AAA AGA TTTGCC GCA CTC TGG GCA TTT ATA CGG TTT TTC ACC-3’)(SEQ IDNO115)和SPE2-4(5’-GTG ACT GCC GCG ACC TTG CTC GCC ATCAAC GCA CTC ATA CTG GCG AGA AGC CAT ACA AAT GTC CAGAAT GTG GC-3’)(SEQ ID NO116)各0.4pmole與寡核苷酸SEP2-2(5’-GGT AAG TCC TTC TCT CAG AGC TCT CAC CTG GTG CGCCAC CAG CGT ACC CAC ACG GGT GAA AAA CCG TAT AAA TGCCCA GAG-3’)(SEQ ID NO117)和SPE2-5(5’-ACG CAC CAG CTTGTC AGA GCG GCT GAA AGA CTT GCC ACA TTC TGG ACA TTTGTA TGG C-3’)(SEQ ID NO118)各40pmole按標準PCR混合物混合，循環(huán)25次(94℃30秒，60℃30秒，72℃30秒)。然后利用相同的循環(huán)條件以引物SPE2-1(5’-GAG GAG GAG GAG GTG GCCCAG GCG GCC CTC GAG CCC GGG GAG AAG CCC TAT GCT TGTCCG GAA TGT GGT AAG TCC TTC TCT CAG AGC-3’)(SEQ ID NO119)和SPE2-6(5’-GAG GAG GAG GAG CTG GCC GGC CTG GCCACT AGT TTT TTT ACC GGT GTG AGT ACG TTG GTG ACG CACCAG CTT GTC AGA GCG－3’)(SEQ ID NO120)各40pmole擴增等份此預裝配反應物。應用僅在識別螺旋編碼區(qū)不同的一組類似的寡核苷酸以相同方式制備E2C-HS2(Sp1)DNA。所有裝配的三指編碼區(qū)用限制性內切核酸酶Sfi1消化，并將其克隆入pMal-CSS中，pMal-CSS是細菌表達載體pMal-C2的衍生物(New Englnd Biolabs)。利用三指編碼區(qū)側翼序列包含的Xma1和BsrF1限制性位點將編碼具有各不同構架的六指蛋白的DNA裝配在pMal-CSS中。用大腸桿菌菌株XL1-blue表達各鋅指蛋白，用附圖所述的ELISA和凝膠變動分析(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)，Biol.Chem.265，4389-4393)研究結合性質。實施例5構建鋅指效應結構域融合蛋白為了構建鋅指效應結構域融合蛋白，用Taq DNA聚合酶由重疊寡核苷酸裝配編碼ets阻抑因子(ERF)阻抑結構域(ERD)的氨基酸473-530(Sgouras，D.N.，Athanasiou，M.A.，Beal，G.J.，Jr.，F(xiàn)isher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)、KOX1的KRAB結構域的氨基酸1-97(Margolin，J.F.，F(xiàn)riedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，H.-J.&Rauscher III，F(xiàn).J.(1994)Proc.Natl.Acad.Sci USA 91，4509-4513)或Mad mSIN3作用結構域(SID)的氨基酸1-36(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.& Eisenman，R.N.(1996)Mol.Cell.Biol.16，5772-5781)的DNA。利用PCR由pcDNA3/C7-C7-VP16(10)擴增VP16轉錄活化結構域的氨基酸413-489的編碼區(qū)(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)。用2對互補寡核苷酸制備VP64 DNA，VP64 DNA編碼VP16基本活化結構域的四聚體重復，其中VP16基本活化結構域包含氨基酸437-447(Seipel，K.，Georgiev，O.& Schaffner，W.(1992)EMBO J.11，4961-4968)。用標準克隆方法將所得的片段與鋅指編碼區(qū)融合，這樣所獲得的每個構建物含有內部SV40核定位信號以及C末端HA十肽標記。將融合構建物克隆在原核表達載體pcDNA3(Invitrogen)中。實施例6構建熒光素酶報道質粒用TaqExpand DNA聚合酶混合物(Boehringer Mannheim)通過PCR從人骨髓基因組DNA擴增包含自ATG起始密碼子的核苷酸-758至-1的erbB-2啟動子片段，并于螢火蟲熒光素酶基因上游將其克隆入pGL3basic(Promega)中。通過Hind3消化從pSVOALΔ5’/erbB-2(N-N)(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-4393)切下包含核苷酸-1571至-24的人erbB-2啟動子片段，并將其于螢火蟲熒光素酶基因上游亞克隆入pGL3basic中。實施例7熒光素酶測定融合40-60％的HeLa細胞用于所有轉染。一般來說，用脂質轉染胺試劑(Gibco BRL)在6孔板的孔內，用400 ng報道質粒(pGL3-啟動子構建物或用作陰性對照的pGL3basic)、50ng效應質粒(pcDNA3中的鋅指構建物或用作陰性對照的空pcDNA3)和200 ng內標質粒(phrAct-βGal)轉染細胞。轉染后約48小時制備細胞提取物。用MicroLumatLB96P發(fā)光計(EG&G Berthold)以熒光素酶檢測試劑(Promega)檢測熒光素酶活性、用Galacto-Light(Tropix)檢測βGal活性。熒光素酶活性根據(jù)βGal活性歸一化。實施例8HeLa細胞erbB-2基因的調節(jié)對erbB-2基因施以調節(jié)。erbB-2基因通常在人類癌癥、尤其是乳腺癌和卵巢癌中過量表達，ErbB-2水平升高與患者的預后較差相關(N.E.Hynes和D.F.Stern，Biochim.Biophys.Acta 1198，165(1994))。為了調節(jié)天然erbB-2基因，使用稱為E2C-KRAB的合成阻抑蛋白和稱為E2C-VP64的反式激活蛋白(R.R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))。兩種蛋白均含有相同設計的鋅指蛋白E2C，識別原癌基因erbB-2 5’非翻譯區(qū)中的18-bp DNA序列5’-GGG GCC GGA GCC GCA GTG-3’(SEQ ID NO121)。由6個預定模塊鋅指結構域構建這種DNA-結合蛋白(D.J.Segal，B.Dreier，R.R.Beerli，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 96，2758(1999))。阻抑蛋白含有Kox-1 KRAB結構域(J.F.Margolin等，Proc.Natl.Acad.Sci.USA 91，4509(1994))，而反式激活物VP64含有衍生自單純皰疹病毒蛋白VP16的基本活化結構域的四聚體重復(K.Seipel，O.Georgiev，W.Schaffner，EMBO J.11，4961(1992))，。
使用人宮頸癌細胞系HeLa衍生物HeLa/tet-off(M.Gossen和H.Bujard，Proc.Natl.Acad.Sci.USA 89，5547(1992))。因為HeLa細胞是上皮來源，所以它們表達ErbB-2而且非常適用于研究erbB-2基因尋靶。HeLa/tet-off細胞產(chǎn)生四環(huán)素控制的反式激活物，從而可以通過從生長培養(yǎng)基去除四環(huán)素或其衍生物多西環(huán)素(Dox)誘導四環(huán)素反應元件(TRE)控制的目的基因。我們應用該系統(tǒng)將我們的轉錄因子置于化學控制之下。因此，構建pRevTRE/E2C-SKD和pRevTRE/E2C-VP64質粒(由pcDNA3為基礎的表達質粒經(jīng)PCR擴增E2C(Sp1)-KRAB和E2C(Sp1)-VP64編碼區(qū)(R.R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))，并利用BamH1和Clal限制位點將其亞克隆入pRevTRE(Clontech)以及利用BamH1和Not1限制位點亞克隆入pMX-IRES-GFP[X.Liu等，Proc.Natl.Acad.Sci.USA 94，10669(1997)]。通過測序證實PCR擴增的保真性)，將其轉染入HeLa/tet-off細胞，獨立分離20個穩(wěn)定克隆并各自分析Dox依賴性靶基因調節(jié)(利用Lipofectamine Plus試劑(Gibco BRL)將pRevTRE/E2C-KRAB和pRevTRE/E2C-VP64構建物轉染入HeLa/tet-off細胞系(M.Gossen和H.Bujard，Proc.Natl.Acad.Sci.USA 89，5547(1992))。在存在2μg/ml Dox下于含潮霉素的培養(yǎng)基中選擇2周后，分離穩(wěn)定克隆并分析對ErbB-2表達的Dox依賴性調節(jié)。基本上按所述[D.Graus-Porta，R.R.Beerli，N.E.Hynes，Mol.Cell.Biol.15，1182(1995)]進行蛋白質印跡分析、免疫沉淀、RNA印跡分析和流式細胞分析)。用蛋白質印跡分析初步分析ErbB-2蛋白水平，作為erbB-2啟動子活性的結果。其中相當部分克隆表明，去除Dox4天時存在對ErbB-2表達的調節(jié)，即在E2C-KRAB克隆中向下調節(jié)ErbB-2表達而在E2C-VP64克隆中向上調節(jié)ErbB-2表達。ErbB-2蛋白水平與其特定mRNA變化水平有關，說明對ErbB-2表達的調節(jié)是由于阻抑或激活轉錄所致。在E2C-VP64克隆中額外表達的ErbB-2蛋白與天然表達蛋白無法區(qū)分并且具有生物活性，因為表皮生長因子(EGF)容易誘導其酪氨酸磷酸化。因為其EGF誘導的酪氨酸磷酸化，在沒有Dox的情況下，E2C-KRAB克隆#27的ErbB-2水平低于檢測水平。所以，還用流式細胞儀分析ErbB-2表達，提示在E2C-KRAB克隆#27未檢測到ErbB-2表達，與ErbB-2在E2C-VP64克隆#18中的明顯向上調節(jié)(5.6倍)形成鮮明的對比。因此，對erbB-2基因的調節(jié)程度為從完全阻抑(E2C-KRAB克隆#27)至差不多6倍的激活(E2C-VP64克隆#18)。未觀測到對相關的ErbB-1蛋白表達的明顯作用，說明對ErbB-2表達的調節(jié)不是因為一般的向下或向上調節(jié)轉錄的所致。與這些利用6個鋅指結構域靶向18bp DNA序列的轉錄因子的效能相比，用3個鋅指結構域制備的結合E2C靶序列的任一9bp半位點的轉錄激活物不能激活ebrB-2熒光素酶報道物的轉錄。這些結果提示，需要特異性和親和力提高的六指蛋白以對基因調節(jié)產(chǎn)生明顯作用。實施例9在逆轉錄病毒載體pMX-IRES-GFP中導入E2C-KRAB和E2C-VP64蛋白編碼區(qū)為了在幾種其它細胞系中表達E2C-KRAB和E2C-VP64蛋白，將其編碼區(qū)導入逆轉錄病毒載體pMX-IRES-GFP中。由pcDNA3為基礎的表達質粒經(jīng)PCR擴增E2C(Sp1)-KRAB和E2C(Sp1)-VP64編碼區(qū)(R.R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))，并利用BamH1和Cla1限制位點將其亞克隆入pRevTRE(Clontech)以及利用BamH1和Not1限制位點亞克隆入pMX-IRES-GFP[X.Liu等，Proc.Natl.Acad.Sci.USA 94，10669(1997)]。通過測序證實PCR擴增的保真性。此載體表達一個雙順反子信使用于翻譯鋅指蛋白以及從內核糖體結合位點(IRES)翻譯綠色熒光蛋白(GFP)。因為兩個編碼區(qū)共有同一個mRNA，所以其表達彼此密切相關，GFP表達是鋅指蛋白表達的一個指標。然后應用由這些質粒制備的病毒感染人類癌細胞系A431(用脂質轉染胺Plus試劑(GibcoBRL)將pMX-IRES-GFP/E2C-KRAB和pMX-IRES-GFP/E2C-VP64質粒瞬時轉染入兼性包裝細胞系Phoenix Ampho中，2天后，在存在8μg/ml聚凝胺(polybrene)的情況下用培養(yǎng)上清液感染靶細胞。感染3天后收獲細胞用于分析)。感染3天后，用流式細胞儀測量ErbB-2表達。重要的是，約59％E2C-KRAB病毒處理細胞基本上為ErbB-2陰性，而約27％E2C-VP64病毒處理細胞中的ErbB-2水平升高。GFP熒光對ErbB-2熒光作圖提示存在2個細胞群，一個細胞群為GFP陰性的正常ErbB-2水平的細胞群，另一個為GFP陽性的ErbB-2水平改變的細胞群。通過檢測相關ErbB-1和ErbB-3蛋白的表達水平研究基因尋靶的特異性。未檢測到這些蛋白的明顯改變，說明erbB-2基因尋靶是特異性的，而不是基因表達的一般變化或效應結構域的過量表達的非特異性結果。尤其值得注意的是，對erbB-3缺乏任何明顯的調節(jié)作用，這是因為其5’-UTR含有18bp序列5’-GGa GCC GGA GCC GgA GTc-3’(SEQ ID NO122)，該序列與設計的E2C靶序列只有3個堿基不匹配(15bp相同-小寫字母表示不同)(M.H.Kraus，W.Issing，T.Miki，N.C.Popescu，S.A.Aaronson，Proc.Natl.Acad.Sci.USA 86，9193(1989))。實施例10對非人類靈長類細胞erbB-2基因的調節(jié)作用
erbB-2的5’-UTR中的鋅指靶序列位于在許多物種中保守的28bp序列段中。為了研究對erbB-2基因在非人類靈長類細胞中表達的調節(jié)作用，用雙順反子E2C-KRAB逆轉錄病毒感染COS-7成纖維細胞，并用流式細胞儀進行分析。與在人類細胞中一樣，以GFP標記指示的阻抑蛋白表達與缺失EbrB-2蛋白密切相關。同樣，通過用編碼E2C-KRAB和E2C-VP64的逆轉錄病毒感染NIH/3T3細胞評價在小鼠細胞中的基因尋靶。然后用蛋白質印跡分析而不是流式細胞儀(因為單克隆抗體缺乏與鼠ErbB-2胞外結構域的反應性)監(jiān)測ErbB-2表達水平。在此再次觀測到用E2C-KRAB校正感染細胞時完全沒有轉錄。然而，與人類細胞系不同的是，E2C-VP64誘導的ErbB-2向上調節(jié)在NIH/3T3細胞中非常溫和，校正感染效率時約為1.8倍。這種差異的可能解釋是人和小鼠啟動子的結構不同。小鼠erbB-2啟動子與人的啟動子不同，它沒有TATA盒(M.R.White和M.C.Hung，Oncogene 7，677(1992))。VP16激活的轉錄至少部分是其與TFIID相互作用介導的，TFIID是也含有TATA-結合蛋白的多蛋白復合物(C.J.Ingles，M.Shales，W.D.Cress，S.J.Triezenberg，J.Greenblatt，Nature 351，588(1991))。似乎原因是缺乏TATA盒時E2C-VP64蛋白激活轉錄的效率較低。這些資料提示，雖然DNA結合位點就序列和在靶細胞中的相對位置而言是可能保守的，但是由于鄰近序列效應可能需要優(yōu)化效應結構域以使效率最大化。盡管如此，雖然本文所述的人工轉錄因子的效力可能不同，但是它們能夠在衍生自不同物種的細胞中對erbB-2基因的轉錄加以調節(jié)，為研究基因在各種生物中的作用提供策略。實施例11特異性誘導ErbB-2過量表達腫瘤細胞的G1累積ErbB-2過量表達導致組成型激活其本身酪氨酸激酶活性(P.P.DiFiore等，Science 237，178(1987))，而且證實ErbB-2在過量表達所述受體的腫瘤細胞中的向下調節(jié)導致生長抑制(R.M.Hudziak等，Mol.Cell.Biol.9，1165(1989)；J.Deshane等，Gene Ther.1，332(1994)；J.M.Daly等，Cancer Res.57，3804(1997))?？磥砩L抑制的機制是阻止所述細胞從細胞周期的G1期進入S期(R.M.Neve，H.Sutterluty，N.Pullen，H.A.Lane，J.M.Daly，W.Krek，N.E.Hynes，出版中)。因此，我們研究了我們設計的轉錄阻抑物在erbB-2過量表達的腫瘤細胞中的表達是否導致G1期阻滯。因此用E2C-KRAB逆轉錄病毒感染SKBR3乳腺癌細胞，并用流式細胞儀分析與ErbB-2表達水平有關的細胞周期分布(22)。觀測到2個細胞群約40％細胞未感染而且其ErbB-2水平正常，而感染細胞約60％，3天后的受體水平降低約7倍。與正常受體水平的細胞相比，絕大部分ErbB-2表達水平降低的細胞處于細胞周期的G1期。為了確定于SKBR3細胞觀測到的G1累積是ErbB-2過量表達腫瘤細胞特異性的，用其ErbB-2水平不高的T47D乳腺癌細胞系進行了相似的分析(圖4B)。事實上，用E2C-KRAB逆轉錄病毒感染T47D細胞并使其進行流式細胞分析時，發(fā)現(xiàn)ErbB-2水平正常的細胞群和ErbB-2水平降低的細胞群的DNA含量沒有差別。所以，我們設計的阻抑蛋白能夠特異性誘導ErbB-2過量表達腫瘤細胞的G1累積。能夠抑制細胞周期過程，因此抑制ErbB-2過量表達腫瘤細胞生長的能力說明，我們所設計的轉錄因子具有用于基因治療癌癥的潛力。
序列表<110>Novartis AG<120>用于GNN的鋅指結合結構域<130>30746/A<140><141><160>122<170>PatentIn Ver.2.1<210>1<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>1Gln Ser Ser Asn Leu Val Arg1 5<210>2<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>2Asp Pro Gly Asn Leu Val Arg1 5<210>3<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>3Arg Ser Asp Asn Leu Val Arg1 5<210>4<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>4Thr Ser Gly Asn Leu Val Arg1 5<210>5<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>5Gln Ser Gly Asp Leu Arg Arg1 5<210>6<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>6Asp Cys Arg Asp Leu Ala Arg1 5<210>7<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>7Arg Ser Asp Asp Leu Val Lys1 5<210>8<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>8Thr Ser Gly Glu Leu Val Arg1 5<210>9<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>9Gln Arg Ala His Leu Glu Arg1 5<210>10<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>10Asp Pro Gly His Leu Val Arg1 5<210>11<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>11Arg Ser Asp Lys Leu Val Arg1 5<210>12<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>12Thr Ser Gly His Leu Val Arg1 5<210>13<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>13Gln Ser Ser Ser Leu Val Arg1 5<210>14<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>14Asp Pro Gly Ala Leu Val Arg1 5<210>15<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>15Arg Ser Asp Glu Leu Val Arg1 5<210>16<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>16Thr Ser Gly Ser Leu Val Arg1 5<210>17<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>17Gln Arg Ser Asn Leu Val Arg1 5<210>18<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>18Gln Ser Gly Asn Leu Val Arg1 5<210>19<211>7<212>PRT<223>人工序列說明核苷酸結合多肽<400>22Lys Ser Ala Asn Leu Val Arg1 5<210>23<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>23Arg Ser Asp Asn Leu Val Lys1 5<210>24<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>24Lys Ser Ala Gln Leu Val Arg1 5<210>25<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>19Gln Pro Gly Asn Leu Val Arg1 5<210>20<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>20Asp pro Gly Asn Leu Lys Arg1 5<210>21<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>21Arg Ser Asp Asn Leu Arg Arg1 5<210>22<211>7<212>PRT<213>人工序列<220><400>25Gln Ser Ser Thr Leu Val Arg1 5<210>26<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>26Gln Ser Gly Thr Leu Arg Arg1 5<210>27<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>27Gln Pro Gly Asp Leu Val Arg1 5<210>28<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>28Gln Gly Pro Asp Leu Val Arg1 5<210>29<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>29Gln Ala Gly Thr Leu Met Arg1 5<210>30<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>30Gln Pro Gly Thr Leu Val Arg1 5<210>31<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>31Gln Gly Pro Glu Leu Val Arg1 5<210>32<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>32Gly Cys Arg Glu Leu Ser Arg1 5<210>33<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>33Asp Pro Ser Thr Leu Lys Arg1 5<210>34<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>34Asp Pro Ser Asp Leu Lys Arg1 5<210>35<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>35Asp Ser Gly Asp Leu Val Arg1 5<210>36<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>36Asp Ser Gly Glu Leu Val Arg1 5<210>37<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>37Asp Ser Gly Glu Leu Lys Arg1 5<210>38<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>38Arg Leu Asp Thr Leu Gly Arg1 5<210>39<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>39Arg Pro Gly Asp Leu Val Arg1 5<210>40<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>40Arg Ser Asp Thr Leu Val Arg1 5<210>41<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>41Lys Ser Ala Asp Leu Lys Arg1 5<210>42<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>42Arg Ser Asp Asp Leu Val Arg1 5<210>43<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>43Arg Ser Asp Thr Leu Val Lys1 5<210>44<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>44Lys Ser Ala Glu Leu Lys Arg1 5<210>45<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>45Lys Ser Ala Glu Leu Val Arg1 5<210>46<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>46Arg Gly Pro Glu Leu Val Arg1 5<210>47<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>47Lys Pro Gly Glu Leu Val Arg1 5<210>48<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>48Ser Ser Gln Thr Leu Thr Arg1 5<210>49<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>49Thr Pro Gly Glu Leu Val Arg1 5<210>50<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>50Thr Ser Gly Asp Leu Val Arg1 5<210>51<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>51Ser Ser Gln Thr Leu Val Arg1 5<210>52<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>52Thr Ser Gln Thr Leu Thr Arg1 5<210>53<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>53Thr Ser Gly Glu Leu Lys Arg1 5<210>54<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>54Gln Ser Ser Asp Leu Val Arg1 5<210>55<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>55Ser Ser Gly Thr Leu Val Arg1 5<210>56<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>56Thr Pro Gly Thr Leu Val Arg1 5<210>57<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>57Thr Ser Gln Asp Leu Lys Arg1 5<210>58<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>58Thr Ser Gly Thr Leu Val Arg1 5<210>59<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>59Gln Ser Ser His Leu Val Arg1 5<210>60<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>60Gln Ser Gly His Leu Val Arg1 5<210>61<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>61Gln Pro Gly His Leu Val Arg1 5<210>62<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>62Glu Arg Ser Lys Leu Ala Arg1 5<210>63<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>63Asp Pro Gly His Leu Ala Arg1 5<210>64<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>64Gln Arg Ala Lys Leu Glu Arg1 5<210>65<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>65Gln Ser Ser Lys Leu Val Arg1 5<210>66<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>66Asp Arg Ser Lys Leu Ala Arg1 5<210>67<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>67Asp Pro Gly Lys Leu Ala Arg1 5<210>68<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>68Arg Ser Asp Lys Leu Thr Arg1 5<210>69<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>69Arg Ser Asp His Leu Thr Arg1 5<210>70<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>70Lys Ser Ala Lys Leu Glu Arg1 5<210>71<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>71Thr Ala Asp His Leu Ser Arg1 5<210>72<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>72Thr Ala Asp Lys Leu Ser Arg1 5<210>73<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>73Thr Pro Gly His Leu Val Arg1 5<210>74<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>74Thr Ser Ser His Leu Val Arg1 5<210>75<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>75Thr Ser Gly Lys Leu Val Arg1 5<210>76<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>76Gln Pro Gly Glu Leu Val Arg1 5<210>77<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>77Gln Ser Gly Glu Leu Val Arg1 5<210>78<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>78Gln Ser Gly Glu Leu Arg Arg1 5<210>79<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>79Asp Pro Gly Ser Leu Val Arg1 5<210>80<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>80Arg Lys Asp Ser Leu Val Arg1 5<210>81<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>81Arg Ser Asp Val Leu Val Arg1 5<210>82<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>82Arg His Asp Ser Leu Leu Arg1 5<210>83<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>83Arg Ser Asp Ala Leu Val Arg1 5<210>84<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>84Arg Ser Ser Ser Leu Val Arg1 5<210>85<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>85Arg Ser Ser Ser His Val Arg1 5<210>86<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>86Arg Ser Asp Glu Leu Val Lys1 5<210>87<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>87Arg Ser Asp Ala Leu Val Lys1 5<210>88<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>88Arg Ser Asp Val Leu Val Lys1 5<210>89<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>89Arg Ser Ser Ala Leu Val Arg1 5<210>90<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>90Arg Lys Asp Ser Leu Val Lys1 5<210>91<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>91Arg Ser Ala Ser Leu Val Arg1 5<210>92<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>92Arg Ser Asp Ser Leu Val Arg1 5<210>93<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>93Arg Ile His Ser Leu Val Arg1 5<210>94<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>94Arg Pro Gly Ser Leu Val Arg1 5<210>95<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>95Arg Gly Pro Ser Leu Val Arg1 5<210>96<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>96Arg Pro Gly Ala Leu Val Arg1 5<210>97<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>97Lys Ser Ala Ser Leu Val Arg1 5<210>98<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>98Lys Ser Ala Ala Leu Val Arg1 5<210>99<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>99Lys Ser Ala Val Leu Val Arg1 5<210>100<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>100Thr Ser Gly Ser Leu Thr Arg1 5<210>101<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>101Thr Ser Gln Ser Leu Val Arg1 5<210>102<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>102Thr Ser Ser Ser Leu Val Arg1 5<210>103<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>103Thr Pro Gly Ser Leu Val Arg1 5<210>104<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>104Thr Ser Gly Ala Leu Val Arg1 5<210>105<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>105Thr Pro Gly Ala Leu Val Arg1 5<210>106<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>106Thr Gly Gly Ser Leu Val Arg1 5<210>107<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>107Thr Ser Gly Glu Leu Val Arg1 5<210>108<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>108Thr Ser Gly Glu Leu Thr Arg1 5<210>109<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>109Thr Ser Ser Ala Leu Val Lys1 5<210>110<211>7<212>PRT<213>人工序列<220><223>人工序列說明核苷酸結合多肽<400>110Thr Ser Ser Ala Leu Val Arg1 5<210>111<211>5<212>PRT<213>人工序列<220><223>人工序列說明肽接頭<400>111Thr Gly Glu Lys Pro1 5<210>112<211>18<212>DNA<213>人工序列<220><223>人工序列說明e2c靶序列<400>112ggggccggag ccgcagtg 18<210>113<211>11<212>PRT<213>人工序列<220><223>人工序列說明VP16基本活化結構域<400>113Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu1 5 10<210>114<211>34<212>DNA<213>人工序列<220><223>人工序列說明發(fā)夾靶寡核苷酸<400>114ggacgcnnnc gcgggttttc ccgcgnnngc gtcc34<210>115<211>66<212>DNA<213>人工序列<220><223>人工序列說明寡核苷酸SPE2-3<400>115gcgagcaagg tcgcggcagt cactaaaaga tttgccgcac tctgggcatt tatacggttt 60ttcacc66<210>116<211>74<212>DNA<213>人工序列<220><223>人工序列說明寡核苷酸SPE2-4<400>116gtgactgccg cgaccttgct cgccatcaac gcactcatac tggcgagaag ccatacaaat 60gtccagaatg tggc 74<210>117<211>81<212>DNA<213>人工序列<220><223>人工序列說明寡核苷酸SPE2-2<400>117ggtaagtcct tctctcagag ctctcacctg gtgcgccacc agcgtaccca cacgggtgaa 60aaaccgtata aatgcccagag81<210>118<211>58<212>DNA<213>人工序列<220><223>人工序列說明寡核苷酸SPE2-5<400>118acgcaccagc ttgtcagagc ggctgaaaga cttgccacat tctggacatt tgtatggc58<210>119<211>87<212>DNA<213>人工序列<220><223>人工序列說明寡核苷酸SPE2-1<400>119gaggaggagg aggtggccca ggcggccctc gagcccgggg agaagcccta tgcttgtccg 60gaatgtggta agtccttctc tcagagc 87<210>120<211>81<212>DNA<213>人工序列<220><223>人工序列說明寡核苷酸SPE2-6<400>120gaggaggagg agctggccgg cctggccact agttttttta ccggtgtgag tacgttggtg 60acgcaccagc ttgtcagagc g 81<210>121<211>18<212>DNA<213>人工序列<220><223>人工序列說明部分erbB-2 5’UTR<400>121ggggccggag ccgcagtg 18<210>122<211>18<212>DNA<213>人工序列<220><223>人工序列說明部分erbB-3 5’UTR<400>122ggagccggag ccggagtc 18
權利要求
1.一種分離并純化的鋅指-核苷酸結合多肽，它包含具有SEQ IDNO1-16中任一序列的核苷酸結合區(qū)。
2.一種組合物，它包含2至約12種權利要求1所述多肽。
3.權利要求2的組合物，它包含2至約6種多肽。
4.權利要求2或3的組合物，其中所述多肽是有效連接的多肽。
5.權利要求2-4任一項的組合物，其中所述多肽利用具有SEQ IDNO 111序列的接頭連接。
6.權利要求2-5任一項的組合物，其中各所述多肽與不同核苷酸序列結合。
7.權利要求2-6任一項的組合物，它與包含序列5’-(GNN)n-3’的的核苷酸結合，其中各個N為A、C、G或T，前提是所有N不能均為C而其中n為2-6。
8.權利要求1的多肽，它還與一種或多種轉錄調節(jié)因子有效連接。
9.權利要求2-7任一項的組合物，它還與一種或多種轉錄調節(jié)因子有效連接。
10.一種分離并純化的多核苷酸，它編碼權利要求1的所述多肽。
11.一種分離并純化的多核苷酸，它編碼權利要求2-7任一項的組合物。
12.一種表達載體，它含有權利要求10的多核苷酸。
13.一種表達載體，它含有權利要求11的多核苷酸。
14.一種調節(jié)包含序列5’-(GNN)n-3’的核苷酸序列的方法，其中n為1-6的整數(shù)，所述方法包括使所述核苷酸序列與有效量的 2-7任一項的組合物接觸。
15.權利要求14的方法，其中所述序列5’-(GNN)n-3’位于所述核苷酸序列的轉錄區(qū)中。
16.權利要求14的方法，其中所述序列5’-(GNN)n-3’位于所述核苷酸序列的啟動子區(qū)中。
17.權利要求14的方法，其中所述序列5’-(GNN)n-3’位于表達的序列標記中。
18.權利要求14的方法，其中所述組合物與一種或多種轉錄調節(jié)因子有效連接。
19.一種藥物，它包括權利要求2-7任一項的組合物。
20.權利要求2-7任一項的組合物的用途，用于生產(chǎn)用于人類治療的藥物。
21.權利要求2-7任一項的組合物的用途，用于生產(chǎn)用于治療癌癥的藥物。
全文摘要
提供與含有一個三聯(lián)體或GNN三聯(lián)體的靶核苷酸具有結合特異性的鋅指核苷酸結合多肽。還提供含有所述多肽的組合物以及這類多肽和組合物用于調節(jié)核苷酸功能的用途。
文檔編號A61P35/00GK1330713SQ99814340
公開日2002年1月9日申請日期1999年10月14日優(yōu)先權日1998年10月16日
發(fā)明者C·F·巴巴斯申請人:諾瓦蒂斯有限公司, 斯克里普斯研究學院

完整全部詳細技術資料下載