两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于增加轉(zhuǎn)錄的基質(zhì)附著區(qū)(mar)及其應(yīng)用的制作方法

文檔序號:438807閱讀:926來源:國知局

專利名稱::用于增加轉(zhuǎn)錄的基質(zhì)附著區(qū)(mar)及其應(yīng)用的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及包含對應(yīng)于或基于已分離和純化的人類和非人類動物來源MAR序列的核苦酸序列的核酸。這些核酸通常具有增強轉(zhuǎn)錄和/或蛋白質(zhì)生成的活性。本發(fā)明還涉及用于鑒定這些序列的方法以及應(yīng)用這些方法的系統(tǒng),例如用于才是高蛋白質(zhì)產(chǎn)量。
背景技術(shù)
:為了闡釋本發(fā)明特別是提供與其實施相關(guān)的額外細(xì)節(jié),將本文釆用的公開文件和其他材料包括專利均通過引用的方式結(jié)合于此。為了方^_,這些z^開文件,如果在正文中未詳細(xì)陳述,則在所附的參考文獻(xiàn)部分按字母順序列出。EMBL登錄號AC102666以及位于EMBL登錄號BH101870和BH101901側(cè)翼的序列以及EMBL登錄號(同物異名)126658,23119391,22981746也全部結(jié)合于此供參考。現(xiàn)在,真核染色體形成約50至100kb的染色質(zhì)環(huán)形結(jié)構(gòu)域的才莫型已#皮廣;乏公i人[BodnarJW,BreyeneP,VanMontaguMandGheyseuQRazinSV]??蒳人為這些環(huán)的外端對應(yīng)于附著于核基質(zhì)(一種由RNP(核糖核蛋白)和其它非組氨酸蛋白質(zhì)構(gòu)成的蛋白質(zhì)質(zhì)網(wǎng)狀系統(tǒng))的特異DNA序列[BodeJ,BenhamC,KnoppAandMielkeC]。連接于核基質(zhì)的染色體DNA序列在支架(分裂中期)或基質(zhì)(分裂間期)附著區(qū)分別稱為SAR或MAR。S/MAR、MAR元件或MAR序列或者簡稱MAR通常為長度為300至3000bp的多態(tài)區(qū)域。據(jù)估計哺乳動物細(xì)胞核內(nèi)存在約100000個MAR[BodeJ,Stengert-IberM,KayV,SchlakeTandDietz-PfeilstetterA]。通過結(jié)構(gòu)性和功能性地將染色質(zhì)分成環(huán)形結(jié)構(gòu)域,可i人為MAR在復(fù)制和基因表達(dá)的調(diào)節(jié)中發(fā)揮重要作用,例如促進(jìn)哺乳動物核內(nèi)轉(zhuǎn)錄座位(foci)的序列組合和解離。現(xiàn)已得到大量間接證據(jù)可支持這種觀念;例如在各種真核基因組內(nèi),DNA復(fù)制起始點位于MAR元<牛內(nèi)部[AmatiBandGasserSM(1988),AmatiBandGasserSM(1990)]。還發(fā)現(xiàn)MAR幾乎總是存在于非編碼基因間區(qū)、內(nèi)含子內(nèi)部[GirodPA,Zahn-ZabalMandMermodN]或轉(zhuǎn)錄單位的邊緣[GasserSMandLaemmliUK;NationalCenterforBiotechnologyInformation],其中MAR可結(jié)合普遍性和/或組織特異性轉(zhuǎn)錄因子。總體說來,在植物和動物細(xì)胞系的轉(zhuǎn)基因試驗中,MAR元件已成功用來增加轉(zhuǎn)基因的表達(dá)和穩(wěn)定性[AllenGC,SpikerS,ThompsonWF,BodeJ,SchlakeT,Rios-RamirezM,MielkeC,StengartM,KayVandKlehr畫WirthD,GirodPA,Zahn-ZabalMandMermodN]。例d口,MAR已經(jīng)用來增加各種與生物技術(shù)和治療性應(yīng)用相關(guān)的重組蛋白質(zhì)在細(xì)胞例如CHO(中國倉鼠卵巢)細(xì)胞內(nèi)的產(chǎn)量[GirodPA,Zahn-ZabalMandMermodN,KimJM,KimJS,ParkDH,KangHS,YoonJ,BaekKandYoonY,Zahn-ZabalM,KobrM,GirodPA,ImhofM,ChatellardP,deJesusM,WurmFandMermodN](Mermodetal""Developmentofstablecelllinesforproductionorregulatedexpressionusingmatrixattachmentregions,"WO02074969,以及美國專利/>開文件20030087342)。已將MAR的功能活性與其結(jié)構(gòu)特性而非其一級DNA序列相關(guān)聯(lián)。實際上,MAR的A和T含量較高[BoulikasT(1993)],且已經(jīng)觀察到一些特殊的構(gòu)象和理化性質(zhì),例如分子的固有曲率、狹窄的小溝、高解旋/解鏈潛在可能性或變性敏感性[BodeJ,SchlakeT,Rios-RamirezM,MielkeC,StengartM,KayVandKlehr-WirthD,BoulikasT(1993),BoulikasT(1995)]。事實上,正是通過稱為SMAR掃描(SMARScan)的方法,利用這些性質(zhì)鑒定MAR。此外,MAR活性還可由DNA結(jié)合蛋白質(zhì)介導(dǎo),例如可識別MAR元件特異結(jié)構(gòu)特征例如單鏈和/或彎曲DNA的染色質(zhì)重塑酶和/或轉(zhuǎn)錄因子[BodeJ,Stengert-IberM,KayV,SchlakeTandDietz-PfeilstetterA]。尚未發(fā)現(xiàn)明確的蛋白質(zhì)結(jié)合位點或MAR共有序列[BoulikasT(1993)],這使得難以從基因組序列預(yù)測MAR。盡管已經(jīng)描述了MAR的某些功能和結(jié)構(gòu)性質(zhì),但由于其一級結(jié)構(gòu)幾乎無共有序列,因此其鑒定是困7*的。真核基因組內(nèi)MAR元件可能在功能上4交為保守,一個,li殳可由動物MAR可結(jié)合于才直物核支架并且反之亦然這個事實而4尋到支持[BreyneP,VanMontaguM,DepickerAandGheysenQMielkeC,KohwiY,Kohwi-ShigematsuTandBodeJ]J旦關(guān)于是什么特征使得MAR序列成為如有效的蛋白質(zhì)生成序列則知之甚少。此外,根據(jù)所采用的分析不同,可得到不同的結(jié)果[RazinSV,BoulikasT(1995),KayVandBodeJ]??紤]到真核生物內(nèi)預(yù)期MAR的巨大數(shù)量以及基因組計劃發(fā)布的序列數(shù)量,已開發(fā)了工具/程序用來4企測MARDNA序列的結(jié)構(gòu)特征(SMARScanI)或者功能序列例如作為調(diào)節(jié)蛋白質(zhì)或轉(zhuǎn)錄因子的特殊蛋白質(zhì)的結(jié)合位點(SMARScanII)[2007年8月3日提交的美國臨時專利申i青60/953,910,Mermodetal的美國專利7^開文^f牛20070178469.]。設(shè)計這些程序是為了通過4企測對應(yīng)于DNA彎曲、大溝深度和d、溝寬度潛在可能性,以及用于特異轉(zhuǎn)錄調(diào)節(jié)蛋白質(zhì)的結(jié)合位點的多種DNA序列特征簇,來鑒定新的潛在MAR序列。這些程序已用來掃描人類基因組,以鑒定公認(rèn)的MARDNA序列,已i正實其中幾種/>《人的MARDNA序列當(dāng)導(dǎo)入^皮轉(zhuǎn)染入CHO細(xì)胞內(nèi)的表達(dá)質(zhì)粒內(nèi)時可增力。轉(zhuǎn)基因的表達(dá),(Girodetal.,"IdentificationofS/MARfromgenomicsequenceswithbioinformaticsandusetoincreaseproteinproductioninindustrialandtherapeuticprocesses,,,Mermodetal.的美國專利公開文4牛20070178469]。這表明SMARScan程序可有效地鑒定人類遺傳元件,其依次可用來增加蛋白質(zhì)合成。盡管到目前為止所開展的功能篩查限于人類基因組,但在大規(guī)模生產(chǎn)中,感興趣的蛋白質(zhì)常常在非人類哺乳動物細(xì)胞中進(jìn)行表達(dá)。已通過SMARScan在人類基因組中鑒定了大約1600種MAR,且已證實八分之六當(dāng)置于增強子/啟動子上游時,可導(dǎo)致CHO細(xì)胞內(nèi)基因(例如用于綠色萸光蛋白質(zhì)(GFP)、抗體和受體的基因)表達(dá)增力o。已i正實具有異^f立MAR活性的DNA長度在2.5kb至6kb的范圍內(nèi)。然而,缺乏對MAR結(jié)構(gòu)的表征現(xiàn)在已經(jīng)限制了"設(shè)計者"MAR的生產(chǎn)。因此,需要對MAR特別是MAR的功能和/或結(jié)構(gòu)區(qū)i或進(jìn)行表征,以實現(xiàn)MAR改造和i殳計。到目前為止開展的功能篩查限于人類基因組。因為在大規(guī)模生產(chǎn)中,感興趣蛋白質(zhì)常常在哺乳動物細(xì)胞中進(jìn)行表達(dá),因此還需要鑒定更多有效的天然發(fā)生的MAR,其可促進(jìn)人類和/或非人類哺乳動物細(xì)胞內(nèi)的轉(zhuǎn)錄和/或基因表達(dá)和/或有效的蛋白質(zhì)生成細(xì)胞??偟膩韎兌,存在例如通過鑒定另外天然發(fā)生的MAR、通過改利性質(zhì)的MAR的需求。有利性質(zhì)本身包括但不限于轉(zhuǎn)錄和/或蛋白質(zhì)生成/基因表達(dá)的性質(zhì)增強;相對于天然發(fā)生的MAR長度減小從而使得例如在遺傳改造中具有更多用途;組織、細(xì)胞或器官特異性和/或加入外來刺激物例如藥物時的可i秀導(dǎo)性。為了實現(xiàn)一種或多種這些需求以及在下文的4皮露內(nèi)容中將變得明顯的其他需求,可采用幾種途徑包括對小鼠基因組進(jìn)行大規(guī)模生物信息分析,以鑒定公認(rèn)的MARDNA序列。利用MAR預(yù)測軟件SMARScanI對小鼠基因組加以分析。評估新鑒定的嚙齒動物序列介導(dǎo)改善乂人培養(yǎng)細(xì)胞生成藥物感興趣重組蛋白質(zhì)的能力。為此,可在轉(zhuǎn)基因的轉(zhuǎn)染分析中對新鑒定MAR的轉(zhuǎn)錄活性加以評估。此外,對MAR如人類1—68MAR和小鼠MARS4進(jìn)4亍研究。鑒定了模塊特別是包含MAR某些結(jié)構(gòu)的模塊/序列特異性模塊的模塊,并利用這些才莫塊改造具有有利性質(zhì)的MAR,例如通過序列的重組、缺失和/或復(fù)制。才莫塊還可與其他元件例如包含某些結(jié)合位點特別是轉(zhuǎn)錄因子結(jié)合位點(TFBS)的合成核苷酸序列結(jié)合。
發(fā)明內(nèi)容在一個實施方式中,本發(fā)明是針對至少一種基因的高水平表達(dá)的表達(dá)系統(tǒng),包括用于可操作性地連接編碼感興趣基因的核苷酸序列的啟動子,以及至少一種非人類哺乳動物MAR核香酸序列,用于促進(jìn)所述基因在轉(zhuǎn)染了所述表達(dá)系統(tǒng)的細(xì)胞內(nèi)表達(dá),其中用所述構(gòu)建體轉(zhuǎn)染所述細(xì)胞時,所述非人類哺乳動物MAR核苷酸序列4吏所述基因表達(dá)增力口約2、約3、約4、約5、約6、約7、約8、約9、約10倍或更多倍。所述非人類哺乳動物MAR核芬酸序列可包括,主要由以下序列或由以下序列《且成(i)SEQIDNo.3、SEQIDNo.10或其功能片4殳;或者(ii)與(i)中4壬4可一個序列具有約80%、約90%、約95%或約98%的序列一致性的核苦酸序列。本發(fā)明還針對分離并純化的核酸分子,包括,主要由以下序列或由以下序列纟且成(a)SEQIDNo.3或SEQIDNo.IO或者其功能片段的核苷酸序列;或者(b)與(a)中序列具有至少約80%、約90%、約95%或約98%的序列一致性且具有MAR活性的核苷酸序列。本發(fā)明進(jìn)一步針對一種用于鑒定非人類哺乳動物MAR序列的方法,包括提供至少一種非人類哺乳動物核酸分子,優(yōu)選非人類哺乳動物基因組或其一部分。令所述核酸分子經(jīng)受針對MAR序列的一個掃描過程,包括i殳定用于待評估核酸分子的窗口大小,選才奪至少i個或至少2個,優(yōu)選3個,更優(yōu)選4個或更多個MAR相關(guān)4爭4正,設(shè)定用于表現(xiàn)這個/這些特征的序列的闊值,以及選擇超過這些閾值的MAR候選核苷酸序列,統(tǒng)專^ft人和/或非人類哺乳動物細(xì)力包時,所述非人類哺乳動物MAR核苷酸序列使基因表達(dá)增加約2、約3、約4、約5、約6、約7、約8、約9、約10倍或更多倍。因此,該特4正可以為DNA彎曲角度,其4直乘以窗口值;得到在約320和1320之間的乘積值,例如約420和約1220、約520和約1120、約620和約1020、約720和約920;因》匕,該特4正可以為大溝深度值,其乘以窗口值得到在約900和約4000之間、例如約1200和3700、約1500和約3400、約1800和約3100、約2100和約2800的乘積值以及/或者因此,該特征可以為小溝深度值,其乘以窗口值得到在約500和約2500、例如約750和約2250、約1000和約2000、約1250和1750的乘積W直。本發(fā)明還4十對MAR構(gòu)建體,包4舌(a)(i)分離的核苷酸序列,包括已鑒定MAR末端區(qū)域的至少一4卩分,以及(ii)另外分離的核苷酸序列,包括所述已鑒定MAR或另一已鑒定MAR的約10%、約15%、約20%、約25%、約30%或者更多;或^"(b)(i)—個核普酸序列,具有與(a)(i)中核苷酸序列約90%、約95%、約96%、約97%、約98%、約99%的序列一致'性,以及(ii)一個核香酸序列,具有與(b)(i)中核苷酸序列約70%、約80%、優(yōu)選約90%、約95%、約96%、約97%、約98%、約99%的序列一致性。根據(jù)本發(fā)明所述的其他MAR構(gòu)建體包括連續(xù)4非列的已鑒定MAR序列區(qū)i或或其一部分,其中順序和/或方向不同于已鑒定MAR序列。此外,才艮據(jù)本發(fā)明所述的其他MAR構(gòu)建體還包括(a)—個核心核普酸序列,包括(i)至少一個分離的或合成的已鑒定MAR序列的富含AT區(qū);或(ii)至少一個與(a)(i)中富含AT區(qū)具有至少80%、85%、90%、95%、98%或99%序列一致性的富含AT區(qū),(b)—個核香酸序列,包4舌至少一個與(a)中所述核苷酸序列相鄰的DNA蛋白質(zhì)結(jié)合位點,其中所述結(jié)合4立點是(i)另外已鑒定MAR序列的DNA蛋白質(zhì)結(jié)合位點,(ii)(a)中已鑒定MAR序列的DNA蛋白質(zhì)結(jié)合位點,其中在該已鑒定MAR序列中,所述DNA蛋白質(zhì)結(jié)合位點位于(a)的核心核苷酸序列外部,或者(iii)存在于(a)的核心內(nèi)但與至少一個另外DNA蛋白質(zhì)結(jié)合位點相鄰的第一DNA蛋白質(zhì)結(jié)合位點,其中在(a)的核心內(nèi),該第一和至少一個所述另外DNA蛋白質(zhì)結(jié)合位點中不相鄰,或者(iv)非MAR序列的DNA蛋白質(zhì)結(jié)合位點。本發(fā)明還針對包括任何列舉的MAR構(gòu)建體的表達(dá)系統(tǒng)、包括列舉的表達(dá)系統(tǒng)的試劑盒以及任何該MAR構(gòu)建體、表達(dá)系統(tǒng)、細(xì)胞、轉(zhuǎn)基因的非人類動物、本文所提到的試劑盒和/或方法在(1)生成蛋白質(zhì)例如識別人病原體蛋白質(zhì)或人細(xì)胞表面蛋白質(zhì)的抗體,以及蛋白質(zhì)諸如促紅細(xì)胞生成素、干擾素或其他治療性或診斷性蛋白質(zhì)的應(yīng)用以及/或者(2)在體外、體內(nèi)基因治療、細(xì)胞治療或組織再生治療中的應(yīng)用。圖1示出了各種MAR對重組綠色熒光蛋白(GFP)生成的影響。圖2示出了各種人類和小鼠MAR元件對CHO細(xì)胞中重組綠色熒光蛋白(GFP)的極高生產(chǎn)者(%M3)的百分位數(shù)的影響。圖3示出了各種人類1_68和小鼠S4MAR元件對重組綠色熒光蛋白(GFP)表達(dá)的影響。圖4示出了小鼠MAR元件對重組單克隆抗體生成的影響。圖5示出了穩(wěn)定的多克隆種群可從用促使IgG重鏈和輕鏈表達(dá)的載體轉(zhuǎn)染的CHO細(xì)胞群中產(chǎn)生,該載體無MAR(沒有MAR)或以順式力。入MARS4。圖6(A)和(B)示出了穩(wěn)定的單個克隆可通過限制性稀釋來自促使IgG重鏈和輕鏈表達(dá)的載體轉(zhuǎn)染的CHO細(xì)胞群中生成,在(B)中無MAR(沒有MAR)或以順式加入MARS4和MAR1—68。圖7(A)和(B)示出了在(A)中無MAR和在(B)中有MAR時基因(GFP)隨時間的表達(dá)情況(2周和26周)。圖8(A)和(B)示出了人類1—68MAR的彎曲(A)和序列(B)特征。圖9(A)至(C):(A)示出了通過已鑒定區(qū)域組合得到的不同MAR構(gòu)建體及所獲得轉(zhuǎn)錄增強;(B)示出了MAR構(gòu)建體6的的彎曲模式;(C)提供了結(jié)構(gòu)參數(shù)的細(xì)節(jié)例如MAR構(gòu)建體6的結(jié)合位點。圖10示出了各種MARS4構(gòu)建體對重組綠色熒光蛋白(GFP)表達(dá)的影響,如通過分析全種群平均焚光(AvgGmeanMO)所揭示的。圖11示出了重組綠色熒光蛋白(GFP)表達(dá)所衍生的各種MARS4構(gòu)建體,如通過分才斤全種群平均焚光(AvgGmeanMO)所揭示的。圖12示出了人類1_68MAR的可能轉(zhuǎn)錄因子結(jié)合位點圖譜,^口通過MATInspector庫欠4牛所予貞測的。圖13是用來測試合成MAR活性的質(zhì)粒的圖譜,該合成MAR是用富含AT的沖亥心(MAR1429-2880)和用于專爭錄因子(置于啟動子和綠色熒光蛋白質(zhì)(GFP)上游)的化學(xué)合成DNA結(jié)合位點組合而構(gòu)建成的。圖14圖示了通過如圖13中所述而構(gòu)建的合成MAR的增強轉(zhuǎn)錄。圖15圖示了通過包含表5中所列出的DNA結(jié)合位點的合成MAR的增強轉(zhuǎn)錄。具體實施例方式本發(fā)明涉及來自非人類動物的分離并純化的MAR序列、鑒定這些序列的方法以及采用這些序列胞如嚙齒動物細(xì)胞中生產(chǎn)高產(chǎn)量蛋白質(zhì)的系統(tǒng)'本發(fā)明還針對MAR構(gòu)建體特別是增強的MAR構(gòu)建體、表達(dá)系統(tǒng)以及采用這些MAR構(gòu)建體的試劑盒及其在蛋白質(zhì)生產(chǎn)特別是大規(guī)^t生產(chǎn)和治療中的應(yīng)用。除非另外聲明,本文采用的所有技術(shù)和科學(xué)術(shù)語均具有與本發(fā)明所涉及
技術(shù)領(lǐng)域
中普通技術(shù)人員通常理解的相同意思。盡管不同于本文所述的方法和材沖+可用于實施本發(fā)明,下文描述了示例性的適當(dāng)方法和材料。根據(jù)本發(fā)明所述的表達(dá)盒是包括至少一個基因以及該基因轉(zhuǎn)錄所需元^牛的4亥酸。根據(jù)本發(fā)明所述的啟動子是DNA的調(diào)節(jié)區(qū)域,當(dāng)其位于基因上游時,促進(jìn)該基因的轉(zhuǎn)錄。細(xì)胞內(nèi)表達(dá)例如在非人類哺乳動物細(xì)胞中的表達(dá)在本文中指的是體外和體內(nèi)表達(dá)。體外表達(dá)包4舌例如在細(xì)月包系如HeLa細(xì)月包系或CHO細(xì)胞系以及體外基因治療中使用的細(xì)胞內(nèi)表達(dá)。體內(nèi)表達(dá)包括在轉(zhuǎn)基因的非人類動物中表達(dá)以及在體內(nèi)基因治療或體外基因治療中使用的將該細(xì)胞重新導(dǎo)入人類基因治療受體后在人類細(xì)月包內(nèi)的表達(dá)。根據(jù)本發(fā)明所述的哺乳動物細(xì)胞,例如非人類哺乳動物細(xì)胞,能夠在細(xì)胞培養(yǎng)條件下保存。該類型細(xì)胞的一個非限制性實例是中國倉鼠卵巢(CHO)細(xì)胞。根據(jù)本發(fā)明所述的MAR構(gòu)建體、MAR元件、MAR序列、S/MAR或僅僅MAR是與天然發(fā)生的"SAR"或"MAR"共有一個或多個(例如2個、3個或4個)特征且具有至少一個促進(jìn)任何受所述MAR影響的基因的蛋白質(zhì)表達(dá)的特性的核苷酸序列。MAR構(gòu)^fc體還具有一個特征,即為具有MAR活性特別地具有轉(zhuǎn)錄調(diào)節(jié)優(yōu)選增強活性的分離和/或純化的核酸,但還具有例如表達(dá)穩(wěn)定活性和/或其他以"增強的MAR構(gòu)建體"闡述的活性。MAR構(gòu)建體還可根據(jù)其主要基于的已鑒定MAR加以定義因此,MARS4構(gòu)建體即一種大部分核苦酸(>50%)基于MARS4的MAR構(gòu)建體。根據(jù)一種廣泛接受的才莫型,天然發(fā)生的SAR或MAR介導(dǎo)特異DNA序列與核基質(zhì)的錨定,所產(chǎn)生的染色質(zhì)環(huán)狀結(jié)構(gòu)域從異染色質(zhì)的核心向外延伸。盡管SAR或MAR不包含任何明顯的共有序列或可識別序列,但看來其最一致的特征是高的總體A和T含量,且石威基C主要位于一條《連上。通常MAR傾向于形成彎曲的二級結(jié)構(gòu),其可能易于發(fā)生鏈分離。SAR和/或MAR內(nèi)部常常存在幾個A和T含量高的簡單基序,但對于其大部分而言,尚未明確其功能重要性和可能的作用方式。這些包括A盒、T盒、DNA解鏈基序、SATB1結(jié)合位點(H-box、A/T/C25)以及用于脊推動物或果蠅屬的共有拓樸異構(gòu)酶II位點。才艮據(jù)本發(fā)明所述的MAR4矣選物或MARl矣i^列,是與天然發(fā)生的SAR或MAR共有1個或多個特4正例如2個、3個或4個特4i的序列。沖艮據(jù)本發(fā)明所述的已鑒定MAR或已鑒定MAR序列是已分離的核脊酸序列,且相當(dāng)于天然發(fā)生的MAR序列,因為它包4舌實現(xiàn)充分促進(jìn)其天然對應(yīng)物蛋白質(zhì)/基因表達(dá)的所有區(qū)域("模塊"或"元件,,)。一個已鑒定的MAR的這些模塊(本文中也稱之為"區(qū)域"、"DNA區(qū)域"、"部分"、"結(jié)構(gòu)域")就是允許對天然發(fā)生的MAR的能力實現(xiàn)蛋白質(zhì)/基因表達(dá)的增強所必需的全部條件。這些模塊通常均不能單獨獲得該MAR的全部活性。這些區(qū)域中一部分是序列特異的,例如下文所述富含AT二核苷酸的彎曲區(qū)域以及轉(zhuǎn)錄因子結(jié)合位點(TFBS)區(qū)域。其他"區(qū)域"由其定位而表征,例如已鑒定MAR序列的5'和3,末端區(qū)i或。富含AT/TA二核普酸的彎曲DNA區(qū)(下文稱為"富含AT區(qū)")是包含大量A和T特別是二核苷酸AT和TA形式的彎曲DNA區(qū)。在一個優(yōu)選的實施方式中,在一l殳100個相鄰石咸基對中,其包含至少10。/。的二核普酸TA和/或至少12Q/。的二核苷酸AT,優(yōu)選在一段100個相鄰堿基對中(或者,如果富含AT區(qū)長度更短,則分別位于一條更短鏈上),其包含至少33。/。的二fe苷酸TA和/或至少33%的二核香酸AT,同時具有彎曲的二級結(jié)構(gòu)。然而,該"富含AT區(qū)"可以4豆至約30個核苦酸或更少,但J尤選長約50個片亥香酸、約75個沖亥苷酸、約100個核苷酸、約150個、約200個、約250個、約300個、約350個或約400個核苷酸或更長。如下文將討論的,富含AT區(qū)可通過例如其相對較高的彎曲角度而與鄰近區(qū)域如結(jié)合位點區(qū)相區(qū)別。某些結(jié)合位點還常常具有相對較高的A和T含量如SATB1結(jié)合位點(H-box,A/T/C25)以及用于脊推動物和果蠅屬的共有拓樸異構(gòu)酶II結(jié)合位點。然而,一個結(jié)^H^點區(qū)(模塊),特別是包括一簇結(jié)合位點的一個TFBS區(qū),可通過比較這些區(qū)域的彎曲模式將A和T含量高的結(jié)合位點與富含AT和TA二核苷酸的區(qū)域("富含AT區(qū)")容易地區(qū)別開。例如,對于人類MAR1_68,后者可具有超過約3.8或約4.0的平均曲率度,而TFBS區(qū)則可具有^f氐于約3.5或約3.3的平均曲率度。已鑒定MAR區(qū)域如本文其他部分所述,可通過可替代方式例如但不限于解鏈溫度確定。然而,這些值是種屬特異性的,并因此可隨種屬而不同,并例如可以更^f氐。因此,各個富含AT和TA二核香酸區(qū)i或可具有更低的曲率度例如從約3.2至約3.4,或從約3.4至約3.6,或從約3.6至約3.8,且TFBS區(qū)可具有按比例更低的曲率度,例如低于約2.7、4氐于約2.9、4氐于約3.1、低于約3.3。在SMARScanII中,將由熟練技術(shù)人員選擇各自更低的窗口值。根據(jù)本發(fā)明所述已鑒定MAR/MAR序列的末端區(qū)域包括已鑒定MAR的至少約5%、約6%、約7%、約8%、約9%或約10%。結(jié)合位點或DNA蛋白質(zhì)結(jié)^^位點是任何可以結(jié)合DNA結(jié)合蛋白質(zhì)的核苷酸序列。用于DNA結(jié)合蛋白質(zhì)的結(jié)合位點通常是TFBS。TFBS是可以結(jié)合轉(zhuǎn)錄因子的任何序列。TFBS可以為任何來源例如但不限于人類或小鼠。TFBS還可以為改造的或合成的。然而,在某些實施方式中,該TFBS在MAR序列例如相同生物、相同種或相同屬的MAR序列中具有乂于應(yīng)物。然而,TFBS可以來自不同種或不同屬的MAR序列。此外,MAR序列中不含有目前已知對應(yīng)物的TFBS也在本發(fā)明的范圍之內(nèi)。這種TFBS可包括但不限于用于USFl(上游刺激因子1)或鋅指蛋白質(zhì)CTCF的結(jié)合位點。TFBS可由l、2、3、4、5或更多個耳又4戈、添加和/或缺失而^f奮飾,且可全部或部分合成。優(yōu)化的TFBS,即具有對各個DNA結(jié)合蛋白質(zhì)的最優(yōu)結(jié)合親和性且常常不具有已知的天然對應(yīng)物,也在本發(fā)明的范圍之內(nèi)。那些優(yōu)化的TFBS可通過對天然發(fā)生的TFBS進(jìn)行上述修飾或者通過合成特別是化學(xué)合成而得到。在本發(fā)明的某些實施方式中,通過例如結(jié)合于組織特異性天然的、改造的或合成的調(diào)節(jié)蛋白質(zhì)或者其他例如可對特定藥物和分子起反應(yīng)的天然的、改造的或合成蛋白質(zhì),結(jié)合位點或TFBS賦予MAR組織特異性?;蚝?或細(xì)胞療法是從組織特異性以及MAR對某些藥物發(fā)生特異性反應(yīng)(即,其可由藥物i秀導(dǎo))的能力受益的典型例子。前者,該例如感興趣基因?qū)H在特異器官或組織中表達(dá),后者,表達(dá)則可例如僅在對某藥物起反應(yīng)時而啟動。轉(zhuǎn)錄因子(其可能包含TFBS)的其他非限制性實例為例如SATB1、NMP4、MEF2、S8、DLX1、FREAC7、BRN2、GATA1/3、TATA、Bright、MSX、AP1、C/EBP、CREBP1、FOX、Freac7、HFH1、麗F3a、Nkx25、POU3F2、Pitl、TTF1、XFD1、AR、C/EBPy、Cdc5、FOXD3、HFH3、HNF3|3、MRF2、Octl、POU6Fl、SRF、V$MTATAB、XFD2、Bach2、CDPCR3、Cdx2、FOXJ2、HFL、HP1、Myc、PBX、Pax3、TEF、VBP、XFD3、Brn2、COMPl、Evil、FOXP3、GATA4、HFN1、Lhx3、NKX3A、POUIFI、Pax6和/或TFIIA。如果該核心核香酸序列與該結(jié)合位點由不超過約200個優(yōu)選不超過約100個核苷酸,甚至更優(yōu)選不超過約50個核苷酸,甚至更優(yōu)選不超過約25個、不超過約15個、不超過約5個或無核苷酸而隔開,則稱結(jié)合位點如TFBS與核心核苷酸序列相鄰。在一個優(yōu)選的實施方式中,結(jié)合位點特別是TFBS本身在TFBS每一側(cè)面上均包4舌更短的4妄頭或適配子(可達(dá)25個核苷酸)。在一個甚至更優(yōu)選實施方式中,TFBS是可達(dá)約50個核苷酸、約40個核苷酸或約30個核香酸的寡聚物的一部分。一系列結(jié)合位點,例如根據(jù)本發(fā)明所述TFBS,是一列彼此按順序排列的TFBS。如果該系列中與核心鄰近的TFBS具有上文指定的距離,則稱該系列TFBS與核心核苷酸序列相鄰。如果該結(jié)合4立點是核心核苷酸序列的一部分且在天然發(fā)生的MAR中相同位置具有對應(yīng)物,則稱該結(jié)合4立點位于"富含AT區(qū)"側(cè)翼。結(jié)合4立點可由1、2、3、4、5或更多個取4戈、添加和/或在夾失而修飾。優(yōu)選地,導(dǎo)入這些取代、添加和/或缺失,從而使得該結(jié)合位點與各個結(jié)合位點的共有序列匹配。多種增強的MAR構(gòu)建體都是本發(fā)明的一部分,且具有構(gòu)成相對天然發(fā)生的和/或已鑒定MAR增強的性質(zhì),其中沖艮據(jù)本發(fā)明所述MAR構(gòu)建體可基于天然發(fā)生的和/或已鑒定MAR,特別是天然發(fā)生的MAR(核心核酸序列基于此)。這種性質(zhì)包括^旦不限于相對于天然發(fā)生的和/或已鑒定MAR全長的長度減少、基因表達(dá)/轉(zhuǎn)錄增強、表達(dá)穩(wěn)定性增強、組織特異性、可誘導(dǎo)性或它們的組合。因此,增強的MAR構(gòu)建體可例如包括少于已鑒定MAR中核苷酸數(shù)量的約90%、優(yōu)選少于約80%、甚至更優(yōu)選少于約70%、少于約60%或少于約50%。用所述構(gòu)建體轉(zhuǎn)染適當(dāng)細(xì)胞時,MAR構(gòu)建體可促進(jìn)基因表達(dá)和/或基因轉(zhuǎn)錄。在本發(fā)明正文中,如果提到MAR構(gòu)建體/MAR(核苷酸)序列"促*達(dá)"、具有"基因表達(dá)增強活性"、"促進(jìn)蛋白質(zhì)表達(dá)"或類似的,該"促進(jìn)"是相對于例如基因在其他同等條件^旦無該序列時的表達(dá)而言的。該促進(jìn)可為例如約2倍、約3倍、約44咅、約5倍、約6倍、約74咅、約8倍、約9倍、約10倍或約15倍、約20倍或約25倍或更多。MAR構(gòu)^^體還可增加極高生成細(xì)胞的平均百分位數(shù)達(dá)約5倍、約10倍、約15倍或更多。因此,除了更高的平均基因表達(dá),極高表達(dá)細(xì)胞百分位數(shù)的增加以及穩(wěn)定("抗性,,)克隆(約100%、約200%、約300%或約400%或更高的增加)形成,以及/或者更低的表達(dá)變異性(cv(變異系數(shù))下降約30%、約40%、約50%或更多))也在本發(fā)明的范圍之內(nèi)。MAR構(gòu)建體或類似物可"增強表i^t定性"。該"增強"是相對于例如基因在其他同等條件但無該MAR構(gòu)建體/MAR序列時的表達(dá)而言的。穩(wěn)、定性增強可例如在達(dá)到約5、10、20、25、30、35、40、45或50周之后仍寸呆持100%增力口。MAR構(gòu)建體可對例如月幾肉、肝臟、中樞神經(jīng)系統(tǒng)或其他組織是特異的和/或可在癥會予諸如抗體、;敫素和/或代z射中間物時而"i秀導(dǎo)。MAR構(gòu)建體/MAR序列優(yōu)選可插入啟動子區(qū)的上游,而感興趣基因是或者可以可操作性連接于該啟動子區(qū)。然而,在某些實施方式中,將MAR構(gòu)建體定位于感興趣基因/核苷酸序列的上游以及下游或者4又下游則是有好處的。其4也多種順式和/或反式MAR4非列也在本發(fā)明的范圍之內(nèi)。MAR構(gòu)建體或MAR的一個區(qū)域可稱為基于例如已鑒定MAR或已鑒定MAR的一個區(qū)域,如果其與天然發(fā)生的"SAR"或"MAR"或者其各自的區(qū)域共有一個或多個(例如2、3或4個)特征且具有至少一個可促進(jìn)任何受所述MAR影響的基因的蛋白質(zhì)表達(dá)的性質(zhì)。4要照本文4是供的術(shù)語定義,這些MAR構(gòu)建體或MAR區(qū)域通常與其所基于的已鑒定MAR具有"大體一致性"。盡管存在這些和/或其核苷酸序列的^f奮飾,其仍將保持該已鑒定基礎(chǔ)MAR的至少一種功能性/特征。本發(fā)明還涉及MAR構(gòu)建體包4舌增強的MAR構(gòu)建體的應(yīng)用,在這些應(yīng)用中,MAR構(gòu)建體還可與一種或多種非MAR表》見遺傳學(xué)的基因調(diào)節(jié)工具例如但不限于組蛋白調(diào)節(jié)物比如組蛋白脫乙?;?HDAC)、其他DNA元件如基因座控制區(qū)(LCR)、隔離子如cHS4或抗阻遏物元件例如穩(wěn)定劑和抗阻遏物元件(STAR或UCOE元件)或者熱點(突變)(KwaksTHJandOtteAP)。合成的,當(dāng)用于述及MAR/MAR構(gòu)建體時,指MAR的設(shè)計不4又4又涉及到已鑒定MAR或其所基于的MAR序列/區(qū)域或局部區(qū)域的簡單重組、復(fù)制和/或4夾失。特別地,合成MAR/MAR構(gòu)建體通常包括已鑒定MAR的一個或多個優(yōu)選一個區(qū)域,然而,在某些實施方式中,其可為合成的或修飾的以及特別設(shè)計、良好表征的元件,如單個或一系列TFBS,在一個優(yōu)選實施方式中其通過合成而得到。在多種實施方式中,這些設(shè)計元件都相對較短,特別地,其通常不長于約300bp,優(yōu)選不長于約100、約50、約40、約30、約20或約10bp。在某些實施方式中,這些元件可^皮多聚化(multimerized)。類哺乳動物生物的基因組或者部分基因組而確定的MAR/MAR序列。這包括例如通過分析嚙齒動物類基因組例如但不限于小鼠基因組而鑒定的MAR/MAR序列。根據(jù)本發(fā)明所述的載體是能夠轉(zhuǎn)運另一種已與其連接的核酸分子的核酸分子。例如,質(zhì)粒是一種載體,逆轉(zhuǎn)錄病毒或慢病毒是另一種載體。根據(jù)本發(fā)明所述的轉(zhuǎn)染是將核酸導(dǎo)入受體真核細(xì)胞內(nèi),例如但不限于通過病毒載體或通過化學(xué)方法進(jìn)行電穿孔、脂質(zhì)轉(zhuǎn)染。本文中使用的轉(zhuǎn)化指的是通過加入核酸而修飾真核細(xì)胞。例如轉(zhuǎn)化細(xì)胞可包括例如通過電穿孔將DNA載體導(dǎo)入細(xì)胞內(nèi)而用核酸轉(zhuǎn)染該細(xì)胞。然而,在本發(fā)明的多種實施方式中,將本發(fā)明所述的增強MAR導(dǎo)入細(xì)胞內(nèi)的方式,不限于任何特定的方法。轉(zhuǎn)錄指從DNA模板合成RNA。順式指兩個或多個元件(如染色質(zhì)元件)在同一核酸分子例如4旦不限于在同一載體或染色體上排列。反式指兩個或多個元件(如染色質(zhì)元件)在兩個或多個核酸分子例如^f旦不限于兩個或多個載體或染色體上排列。一個序列如果表現(xiàn)出順式/反式定位的活性,則稱其在例如基因上順式和/或反式^L揮作用。根據(jù)本發(fā)明所述的窗口描述了在SMARScan過程中用于評估MAR的》咸基對lt量。該數(shù)量通常為約50bp、約100bp、約200bp、約300bp。然而,400、500、600或更多bp的窗口也在本發(fā)明的范圍內(nèi)。如果與另一個核苦酸序列(或其互補鏈)具有最佳排列(具有恰當(dāng)?shù)暮塑账岵迦牖蛉笔?時,在核苷酸石威基的至少約60%、通常至少約70%、更通常至少約80%、優(yōu)選至少約90%、且更優(yōu)選至少約95-98%存在核普酸序列一致性,則核苦酸序列或其片段與另一序列具有大體一致性。一致性指的是兩個核普酸序列之間的序列相關(guān)禾呈度,如通過兩串這種序列如全長且完整序列之間的匹配一致性所確定的。一致性可易于計算。盡管存在多種方法測定兩個核苷酸序列之間的一致性,術(shù)語"一致性"是熟練技術(shù)人員所熟知的(ComputationalMolecularBiology,Lesk,A.M.,ed.,OxfordUniversityPress,NewYork,1988;Biocomputing:InformaticsandGenomeProjects,Smith,D.W"ed.,AcademicPress,NewYork,1993;ComputerAnalysisofSequenceData,PartI,Griffin,A.M.,andGriffin,H.G,eds.,HumanaPress,NewJersey,1994;SequenceAnalysisinMolecularBiology,vonHeinje,G.,AcademicPress,1987;andSequenceAnalysisPrimer,Gribskov,M.andDevereux,J.,eds.,MStocktonPress,NewYork,1991)。通常用來測定兩個序列之間一致性的方法包括j旦不限于GuidetoHugeComputers,MartinJ.Bishop,ed.,AcademicPress,SanDiego,1994,和Carillo,H.,andLipman,D,,SIAMJAppliedMath.48:1073(1988)中4皮露的那些方法。優(yōu)選的測定一致性的方法經(jīng)設(shè)計可給出兩個待測序列之間的最大匹配。這些方法在計算機程序中進(jìn)行編纂。優(yōu)選用來測定兩個序列之間一致性的計算機程序方法包4舌^f旦不卩艮于GCG(GeneticsComputerGroup,MadisonWis.)專欠件包(Devereux,J.,etal"NucleicAcidsResearch12(1).387(1984)),BLASTP,BLASTN,F(xiàn)ASTA(Altschuletal.(1990);Altschuletal.(1997))。人們熟知的SmithWaterman算法也可用來測定一致性。例如,核酸所包含的核香酸序列與參照核苦酸序列具有例如95%的"一致性",意思為該核酸的核香酸序列等同于參照序列,只是該核苦酸序列可包括每100個參照核苷酸序列的核苦酸有達(dá)5個點突變。也就是說,為了獲得其核苦酸序列至少95%等同于參照核香酸序列的核苦酸,該參照序列中核苦酸的達(dá)到5%可缺失或#皮另一核苦酸:f又代,或者占參照序列總體核苷酸達(dá)5%的核苷酸凄1量可插入該參照序列中。參照序列的這些突變可發(fā)生于該參照序列的5,或3,末端位置或者這些末端位置之間的4壬何位置,在該參照序列的核香酸之間單個散開或者在參照序列內(nèi)以一個或多個相鄰基團而散開。核苷酸序列的功能片段也是本發(fā)明的一部分。只要它們具有天然發(fā)生的對應(yīng)序列的預(yù)期功能,特別是增加受其影響的基因的表達(dá),則認(rèn)為片段是功能性的。如果其缺失降低了MAR/區(qū)域增強轉(zhuǎn)錄的活性但未徹底將其滅活,則仍認(rèn)為MAR/MAR區(qū)域的片4殳是功能片段。"完全功能片段"是這樣一個片段,即當(dāng)該片段(沒有其他MAR序列)應(yīng)用時,其中活性的任何降低,只要可觀察到,均不能用統(tǒng)計學(xué)-驗i正。此外,4要照本文所提供的定義,與例如天然發(fā)生的MAR、已鑒定MAR、MAR區(qū)域或者這些中^f壬^f可一種的片|殳具有大體一致性的功能片段也包括在本發(fā)明的范圍之內(nèi)。在本文中將詳細(xì)闡述的,在某些實施方式中,其才莫塊或部分可被重組、復(fù)制和/或經(jīng)受缺失。本領(lǐng)域熟練技術(shù)人員將認(rèn)為,區(qū)域的這種重組和/或復(fù)制可形成例如新的酶切位點,其隨后可形成如此所得構(gòu)建體的新酶切方式,且可引起序列長度的調(diào)整。那些調(diào)整可影響^f旦不限于l、2、3、4、5、6、7、8、9、10、10至15、15至20、20至25、25至30、30至35、35至40個核苷酸。這些調(diào)整以及其他修飾也在本發(fā)明的范圍之內(nèi)。該重排的MAR特別是重組和/或復(fù)制的MAR的序列,4安照本文纟是供的定義與其各個元件(或者區(qū)域/模塊)和/或片段具有大體一致性,也在本發(fā)明的范圍之內(nèi)。MAR序列可從植物轉(zhuǎn)移到哺乳動物細(xì)胞,反之亦然,且在異源宿主細(xì)胞內(nèi)將保持核基質(zhì)附著活性[BreyneP,VanMontaguM,DepickerAandGheysenG,MielkeC,KohwiY,Kohwi-ShigematsuTandBodeJ]??紤]到MAR功能在所有高《及真核生物中的這種〗呆守性,人們將預(yù)期來自一個屬的MAR序列在其所來源的屬內(nèi)與另一屬內(nèi)均可發(fā)揮作用。成重組蛋白質(zhì),可利用SMARScanI篩查整個小鼠基因組以鑒定MAR4芙選序列,如下文所述,SMARScanI是一種才全觀、JDNA序列結(jié)構(gòu)特征(例如DNA彎曲)的計算機程序。如下文將討論的,意外地發(fā)現(xiàn)非人類特別是嚙齒動物(這里是小鼠)MAR序列在例如CHO細(xì)胞以及人類細(xì)胞如HeLA細(xì)胞中的表達(dá)增強更加有效。甚至更意外的是,發(fā)現(xiàn)某些非人類MAR序列在非人類細(xì)胞例如CHO細(xì)胞以及人類細(xì)胞例如HeLa細(xì)胞中基本上均比人類MAR序列工作得更好。已證實,新鑒定的小鼠源S/MARDNA序列中有幾種可增加轉(zhuǎn)基因的表達(dá),乂人而4是供了證4居即MARScanI(—種設(shè)計用于人類MAR序列并用其測試的程序)是一種用于鑒定來自例如除人類之外小鼠來源的大量基因組來源的S/MAR元件的有效工具。然而,重要的是,發(fā)現(xiàn)通過篩查嚙齒動物(例如小鼠)基因組比篩查人類基因組可鑒定更加有歲文的MAR元4牛。凈爭別;也,本發(fā)明i正實了來自小鼠基因組的高活性S/MAR元件可增加多種細(xì)胞特別是小鼠和人類細(xì)胞中重組蛋白質(zhì)例如具有藥學(xué)用途的重組蛋白質(zhì)的生產(chǎn)。已證實小鼠S/MARS4是新分離的小鼠MAR以及之前克隆的人類MAR中最有效的。因此本發(fā)明針對具有增強的蛋白質(zhì)生成的非人類MAR和/或增強隨時間蛋白質(zhì)表達(dá)穩(wěn)定的MAR。SMARScanI是一種壽欠件工具,其基于這些序列的結(jié)構(gòu)和理化特征鑒定MAR候選序列。其他地方已經(jīng)提供了對該方法的詳細(xì)論述(Mermodetal的美國專利^^開文件20070178469)?;旧?SMARScan"闡述的生物信息學(xué)工具,包括可識別圖譜的算法,其可纟艮據(jù)二核苷酸質(zhì)量-基質(zhì)來計算DNA構(gòu)象和理化性質(zhì)的理i侖值。優(yōu)選地,SMARScan利用大小不同的掃描窗口以多種不同組合來評估對應(yīng)于DNA彎曲、大溝深度和小溝寬度潛在可能性、解鏈溫度的DNA序列特征。對于每一個特征,已經(jīng)設(shè)定了截斷值或閾值。每一次當(dāng)給定區(qū)域計算出的分?jǐn)?shù)高于設(shè)定的截斷/閾值時,程序記錄一次?,F(xiàn)在有兩種數(shù)據(jù)輸出模式可處理這些采樣數(shù),第一種(稱"圖譜樣,,)簡單返回查詢序列上的所有采樣位置及對所選不同標(biāo)準(zhǔn)其相應(yīng)的值。第二種(稱"連續(xù)采樣,,)僅返回幾個連續(xù)采樣的位置及其對應(yīng)序列。對于該模式,連續(xù)采樣的最低數(shù)量是可設(shè)定的另一個截斷/閾值且具有可調(diào)的窗口大小。為了調(diào)節(jié)用于例如四種理論結(jié)構(gòu)標(biāo)準(zhǔn)的默認(rèn)截斷/閾值,可采用例如來自SMARtDB經(jīng)實驗驗證的MAR。在該方式中,例如,來自數(shù)據(jù)庫的全部人類MAR序列通過SMARScan利用"圖譜樣,,模式進(jìn)行檢索分析,該模式具有4種標(biāo)準(zhǔn),且未設(shè)定截斷/閾值。這將允許設(shè)定每一個用于序列每個位置的函H隨后4艮據(jù)這些H據(jù)計算每種標(biāo)準(zhǔn)的分布(見Mermodetal的美國專利7>開文件20070178469的圖1和圖3)。盡管優(yōu)選應(yīng)用SMARScan技術(shù)用于MAR序列的鑒定,本領(lǐng)域的普通技術(shù)人員將認(rèn)識到其他可用于鑒定選擇性類似或甚至稍微更低的S/MAR模序的生物信息學(xué)工具也可用于本發(fā)明中。優(yōu)選地,這些工具可i殳定,4吏得^又那些表現(xiàn)出這些高于某個值(即i殳定的閾值或截斷值)的特征的MAR相關(guān)特征可得到或經(jīng)設(shè)定可得到陽性采才羊。然而,i午多用來鑒定MAR的生物信息學(xué)工具^皮i殳計用來鑒定基質(zhì)結(jié)合活性。該活性并非必須與增加基因表達(dá)的能力相關(guān)[Phi-Van,L.&Stratling,W.H.]。SMARScanI已被開發(fā)用來鑒定人類MAR,因此,其利用從已知人類MAR收集的結(jié)構(gòu)lt據(jù)而開發(fā)。一個人類經(jīng)"調(diào)節(jié)"的SMARScanI程序用于本發(fā)明中評估小鼠基因組的MAR序列。然而,小鼠和人基因組石威基組成的差異妨礙應(yīng)用具有的前定義設(shè)置(用來掃描人基因組)的SMARScan程序(Mermodetal的美國專利7>開文件20070178469)。因此必須通過反復(fù)實驗確定獨特的窗口大小和結(jié)構(gòu)參數(shù)閾值,直到該程序?qū)⒛軌蜩b定易處理的候選小鼠MAR序列集合。測試時,發(fā)現(xiàn)那些序列中有幾種是"超級MAR序列",例如當(dāng)置于含有編碼各個蛋白質(zhì)的基因的載體上并導(dǎo)入嚙齒動物細(xì)胞系內(nèi)時,這些MAR序列可使蛋白質(zhì)生成的大大提高。小鼠MARS4和小鼠MARS46是本發(fā)明范圍內(nèi)的^齒齒動物MAR序列實例。這些MAR序列在所附的序列列表中以SEQIDNo.3和SEQIDNo.10示出。然而,本4頁i或的普通沖支術(shù)人員一尋理解,石威基對插入、缺失、取代特別是本身可能包含》成基對插入、缺失或取代的這些以及其他非人類MAR片段只要其保持野生型序列的預(yù)期功能特別是增加受其影響的基因的表達(dá),即屬于發(fā)明的范圍之內(nèi)。例如,一個降低MAR序列的轉(zhuǎn)錄/基因表達(dá)增強活性但未徹底-使其滅活的插入祐:認(rèn)為基本未干擾MAR的預(yù)期功能,這里為促進(jìn)基因表達(dá)。類似地,例如一個已鑒定MAR的片l殳相對于該已鑒定MAR具有的轉(zhuǎn)錄增強活性稍微降低但并未完全丟失轉(zhuǎn)錄增強活性,可認(rèn)為其是功能片段。"完全功能片段"是這樣的片段,即其中活性的任何降j氐,如果可》見察到,也不能通過統(tǒng)計學(xué)而證實。如本文中其他部分詳細(xì)描述的,與天然發(fā)生的MAR或其片I殳的核苷酸序列具有"大體一致性"的序列也包括在本發(fā)明的范圍之內(nèi)。MAR的模塊'性對已鑒定MAR進(jìn)行分析,以確定其是否包含模塊(或區(qū)域)特別是序列特異'l^j^:,其可用于改造已鑒定MAR或生成合成的MAR,包括包含合成區(qū)域的MAR。實/或全部或部分復(fù)制甚至缺失得到增強的MAR,如上文所述。人類1一68MAR和小鼠S4MAR將用作通過區(qū)域組合、缺失和/或復(fù)制而產(chǎn)生MAR構(gòu)建體的才莫型。然而,正如本領(lǐng)域熟練:技術(shù)人員所易于理解的,本發(fā)明是針對操作任何已鑒定MAR以及從其得到的MAR構(gòu)建體。對于調(diào)節(jié)不同MAR包括不同來源的MAR可能必需的恰當(dāng)調(diào)整,已為普通技術(shù)人員所掌握。實例包括但不限于真核生物優(yōu)選哺乳動物,特別是諸如小鼠的模型生物,以及具有經(jīng)濟重要性的種屬例4口牛、豬、羊以及人類。人類MAR的模塊性人類1—68MAR用作通過區(qū)域組合和/或復(fù)制而產(chǎn)生MAR構(gòu)建體的模型。利用如下文所述確定的模塊或其部分,可基于已鑒定MAR如人類1—68MAR產(chǎn)生MAR構(gòu)建體。特別地,該MAR構(gòu)建體利用區(qū)域(模塊)或其部分的組合和/或復(fù)制而產(chǎn)生。該1—68MAR的實例證明,一個已鑒定MAR的模塊(本文中也稱為區(qū)域或元件)就是允許對天然發(fā)生的MAR的能力實現(xiàn)基因表達(dá)的增強所必需的全部條件。已鑒定模塊中沒有一個能夠獨自獲得MAR其自身的全部活性。意外的是,發(fā)現(xiàn)某些模塊的組合以及全部或部分復(fù)制可引起基因表達(dá)的進(jìn)一步增強。已鑒定了幾種非重復(fù)(non-redundant)的序列特異性模塊(區(qū)域)。這些模塊協(xié)同影響局部染色質(zhì)結(jié)構(gòu)。MAR的該構(gòu)造有點類似于多細(xì)胞動物轉(zhuǎn)錄的控制模塊的不同組合,其從起始位點分散達(dá)幾kb,共同控制轉(zhuǎn)錄起始位點。已鑒定的序列特異性模塊特別是(1)A和T含量高的區(qū)域如對稱的富含A-T區(qū)(A和T交替)特別是"富含AT區(qū)"以及(2)富含結(jié)合位點特別是但不限于由富含A-T區(qū)隔開的TFBS的區(qū)域。已有文獻(xiàn)才艮道,A和T含量專交高的彎曲DNA通常存在于啟動子區(qū)、MAR和復(fù)制子中[AladjemandFanning2004])。之前i人為A和T含量高的序列(如上文所述的"對稱,,序列以及"非對稱,,序列,后者序列的一條鏈上主要是A,另一條鏈上主要是T)主要有利于雙鏈體打開。然而,這些區(qū)域可能具有廣泛的功能。例如,核纖層蛋白質(zhì)B2復(fù)制區(qū)中A和T含量較高的序列結(jié)合復(fù)制起點識別復(fù)合體(ORC)[Abdurashidova,Danailovetal.2003;Stefanovic,Stanojcicetal.2003],并可促進(jìn)Mcm4/6〃解螺力走酶的加載以及體外雙《連DNA的解鏈[You,Ishimietal.2003]。還"i人為A和T含量專交高的固有彎曲DNA具有構(gòu)造作用。裂殖酵母ORC4的"AT鉤狀DNA結(jié)合基序"類似于高活動性蛋白質(zhì)HMG-I/Y的那些序列,可能具有構(gòu)造作用[StrickandLaemmli1995;Bell2002]。還可形成蛋白質(zhì)介導(dǎo)的彎曲,類似于HMG-I/Y介導(dǎo)的促進(jìn)V(D)J重組的DNA彎曲,以及真核生物中增強子和啟動子處轉(zhuǎn)錄復(fù)合體的裝配和穩(wěn)定[LevineandTjian2003]。并非所有A和T含量高的區(qū)i或均對應(yīng)彎曲DNA。然而,那些彎曲DNA可作為"組蛋白質(zhì)磁體"吸引組蛋白質(zhì),在該彎曲DNA正上方形成核小體,使鄰近區(qū)域留出空間作為復(fù)制/轉(zhuǎn)錄前蛋白質(zhì)的著陸區(qū)。如上文所述,MAR還包括用于其他蛋白質(zhì)的結(jié)合位點特別是在"富含結(jié)合位點區(qū)"或僅"結(jié)^^位點區(qū)"(見上文(2))。那些其他蛋白質(zhì)可包括但不限于DNA解旋元件結(jié)合蛋白質(zhì)(DUE-B)以及轉(zhuǎn)錄因子例如Hox蛋白質(zhì)、SATBI、CEBP等,如在1_68MAR中發(fā)生的。突變分析表明這些結(jié)合位點促進(jìn)MAR的功能。人類1_68MAR可通過反轉(zhuǎn)其方向以及通過移去彎曲DNA以增大啟動子區(qū)上游轉(zhuǎn)錄因子的結(jié)合位點區(qū)而得以改良。如在圖9中可以看到的,大量這種重排MAR(例如構(gòu)建體6)大大增強相對于無MAR構(gòu)建體(10倍)甚至相對于包含天然發(fā)生的MAR構(gòu)建體(構(gòu)建體1和16;約2倍)的轉(zhuǎn)錄。所示出數(shù)據(jù)還強烈表明遠(yuǎn)端轉(zhuǎn)錄控制元件本身限制下游染色質(zhì)中的轉(zhuǎn)錄起始。在天然發(fā)生的MAR中以正向陰影線框示出的位于該區(qū)域3,末端的223bp片段,相比構(gòu)建體ll,在構(gòu)建體7中可保留該區(qū)域的全部活性。這表明,在這種情況下,該重要部分必須與該彎曲區(qū)i或以及構(gòu)建體6中該元件其余部分(核苷酸1-1425)的5,末端一起發(fā)揮作用。已發(fā)現(xiàn)兩個HMG-I/Y位點位于該末端附近。構(gòu)建體2示出,將兩個已鑒定MAR序列連接在一起,也可增加表達(dá)。小鼠MAR的^性和長度減小基于S4MAR(表3)構(gòu)建了幾種MAR,并對其加以表征(圖10)。如在圖10中可以看到的,內(nèi)部缺失一個長于1600bp長的片段并未引起MAR活性的大幅度丟失(S4-1-703—2328-5457)。然而,缺失啟動子附近795bp的片段,或用類似長度的熒光素酶基因片段取4戈該序列(S4—1-4661;S4—1-466l-Luc5489),則引起該活性的完全丟失。非序列特異'hM^:3,末端MAR序列的活性對人類1_68MAR(圖9)進(jìn)行的實驗已經(jīng)證明了人類1—68MAR的3,端HoxF和SATBI結(jié)合位點區(qū)域的重要性。該區(qū)域的重要性進(jìn)一步通過圖10中示出的以小鼠MARS4進(jìn)行的實驗證明。如圖11中所示出的,為了進(jìn)一步分析MARS43'末端序列的活性,通過去除或復(fù)制此部分進(jìn)一步分解MAR該部分。圖11也示出了不同MARS4衍生物對基因表達(dá)的影響。有趣的是,一種具有截短3,末端的這種書T生物(原始MARS4的4658-5054vs.4658-5457),相比于更長的原始MARS4序列,平均表現(xiàn)出輕微更高的轉(zhuǎn)基因表達(dá)(104%vsl00%)。這表明可獲得更加有效且更短的MAR元件布亍生物。因此,本發(fā)明包括長度大大短于其天然對應(yīng)物且活性高的MAR構(gòu)建體,因此其長度更方便用于例如載體設(shè)計和轉(zhuǎn)移。特別地,包括少于已鑒定MAR序列核苦酸數(shù)量約90%、優(yōu)選少于約80%、甚至更優(yōu)選少于約70%、少于約60%或少于約50%的MAR構(gòu)建體屬于本發(fā)明的范圍之內(nèi)。那些構(gòu)建體優(yōu)選包含已鑒定MAR的3,末端區(qū)域,甚至更優(yōu)選已鑒定MAR/MAR序列3,末端區(qū)》或的至少約5%、約6%、約7%、約8%、約9%或約10%。然而,包含已鑒定MAR的5,末端區(qū)i或的MAR構(gòu)建體也在本發(fā)明的范圍之內(nèi)。合成的MAR人類1—68MAR的重排證明,在某些實施方式中,一個位于已分離MAR正向陰影線部分3,末端富含Hox區(qū)域的223bp片段保留了全長區(qū)域的活性。這表明在本發(fā)明的某些實施方式中該部分可在與其他元件協(xié)同作用時比4交重要。圖12示出了MAR1—68中一組可能的轉(zhuǎn)錄因子結(jié)合位點,如通過MATInspector軟件預(yù)測的。C/EBP、NMP4、FASTI、SATB1和HoxF結(jié)合位點的位置作為實例示出,說明了其在5,(正向陰影線)側(cè)翼序列中的富集。發(fā)現(xiàn)富含AT的彎曲DNA區(qū)與人類MAR1—68中轉(zhuǎn)錄因子結(jié)合位點之間可能的協(xié)同作用,促進(jìn)了構(gòu)建包含MAR1-68中富含AT區(qū)(鄰近一個或幾個轉(zhuǎn)錄因子結(jié)合位點)的MAR/MAR構(gòu)建體。圖13描繪了用來測試合成MAR活性的質(zhì)粒的圖譜,該合成MAR乂人包括富含AT區(qū)以及位于該富含AT區(qū)每一個末端的已鑒定MAR的TFBS的核心(MAR1429-2880)與轉(zhuǎn)錄因子的4匕學(xué)合成DNA結(jié)合位點(置于綠色熒光蛋白質(zhì)(GFP)啟動子上游)的組裝而構(gòu)建。圖13特別示出了轉(zhuǎn)錄因子結(jié)合位點插入富含AT的結(jié)構(gòu)域與促使GFP轉(zhuǎn)基因表達(dá)的SV40啟動子之間,模擬圖9中存在的情形,其中,在最有用的情形(構(gòu)建體6)中,包含結(jié)合位點的MAR部分插入啟動子與彎曲DNA區(qū)之間。表4示出了所采用化學(xué)合成寡沖亥香酸的DNA序列。/人MAR1-68序列(圖12)中鑒定出了用于C/EBP、NMP4、FAST1、SATBl和HoxF(也稱為Gsh)轉(zhuǎn)錄因子的結(jié)合位點。這些結(jié)合位點如其在MAR1-68中存在的一樣而應(yīng)用,未作任何改變(FASTI、C/EBP、HOXF/Gsh),或者如果與共有(即正確的)序列(HoxF,SatBl,NMP4)相比其含有一個或兩個4普配,則加以4交正。如從圖14可以看出的,添加該(這里是)合成的結(jié)合位點在幾乎所有的情形中一些(在某些情形中)提供顯著的轉(zhuǎn)錄增強,可與包括富含AT區(qū)的核心MAR序列相比擬。C/EBP和Hox或Gsh2是最有效的,然后是SatBl和Fastl,而NMP4位點則不具有可抬r觀'J的歲文應(yīng)。圖14示出了一個意外的結(jié)果,即插入核心序列(側(cè)翼是富含AT區(qū)所基于的已鑒定MAR的結(jié)合位點),這里為基于MAR1—68的MAR1429-2880,未引起顯著的表達(dá)增加,^旦另外包含一個或多個結(jié)合位點的MAR構(gòu)建體,特別是當(dāng)插入富含AT核心的下游但位于啟動子上游時,則引起處于啟動子控制之下基因的蛋白質(zhì)表達(dá)/產(chǎn)量的顯著增加(這里利用M3細(xì)胞的百分比而鑒定)。盡管在優(yōu)選的實施方式中,在富含AT核心的下游但位于啟動子上游,還存在額外結(jié)合位點,1"旦其他結(jié)構(gòu)例如Y旦不限于該核心的富含AT區(qū)上游、富含AT區(qū)內(nèi)部、鄰近富含AT區(qū)或者該基因下游的位點,也在本發(fā)明的范圍之內(nèi)。在一個優(yōu)選的實施方式中,蛋白質(zhì)結(jié)合位點(合成的或分離的)的某些組合也在考慮之中,例如兩種不同蛋白質(zhì)結(jié)合位點的組合、3種不同蛋白質(zhì)結(jié)合位點的組合、4、5、6、7、8、9、IO或更多種蛋白質(zhì)結(jié)合位點的組合。這些組合可全部或部分多聚化。在一個優(yōu)選實施方式中,該組合包含Hox/Gsh和SATB1。在例如核心與適宜啟動子之間插入這些組合或多聚化組合,相對f在其他同等條件下采用包含MAR構(gòu)建體/MAR序列的載體時高表達(dá)克隆的形成,可使高表達(dá)子克隆形成增加約2倍或更多倍例如但不限于約3、4、5、6、7、8、9倍或更多倍,優(yōu)選約IO倍或更多倍,甚至更優(yōu)選約11、12、13、14、15、16、17、18、194咅或更多4咅或者約20或甚至約25倍或約30倍或更多倍。簡單而言,MAR構(gòu)建體可從組成部件組裝而成。這些組成部件可包括或基于已鑒定MAR或其部分的區(qū)域如特殊區(qū)域的序列、合成的組成部件(包括用來優(yōu)化其功能的修飾)如一系列化學(xué)合成的轉(zhuǎn)錄因子結(jié)合位點(TFBS)、來自或基于非MAR序列的組成部件或者來自或基于不同種或?qū)俚腗AR序列的組成部件。在一個優(yōu)選實施方式中,這種MAR包括偶聯(lián)于TFBS區(qū)的富含AT區(qū)或特殊的轉(zhuǎn)錄因子DNA結(jié)合位點組合,如表5中示出的那些組合。本領(lǐng)域中的熟練技術(shù)人員將理解,這些原則不限于本文4皮露的特殊序列或結(jié)合位點,并且其他4汙生物、同系物或序列組合也在本發(fā)明的范圍之內(nèi)。如上所述,本發(fā)明所述MAR構(gòu)建體、表達(dá)系統(tǒng)和/或試劑盒可用于蛋白質(zhì)生產(chǎn)。這里,可將MAR構(gòu)建體包括入處于啟動子控制之下已包含感興趣蛋白質(zhì)例如胰島素的基因的載體中。將該載體導(dǎo)入細(xì)胞內(nèi)并培養(yǎng)該細(xì)胞。隨后將該過程按比例放大而用于胰島素的大4比量生產(chǎn)。高力夷島素生產(chǎn)例如比無MAR構(gòu)建體時高3至54咅,可維持3周。如上所述,本發(fā)明所述MAR構(gòu)建體、表達(dá)系統(tǒng)和/或試劑盒可用于體外和/或體內(nèi)基因治療以及用于細(xì)胞和組織替代治療,例如,在體外基因治療中,可將MAR構(gòu)建體包括入處于啟動子控制下的已包含患者(需要體外基因治療)缺乏的基因的載體中。隨后,將MAR構(gòu)建體導(dǎo)入細(xì)胞內(nèi)例如患者的骨髓細(xì)胞。用MAR構(gòu)建體轉(zhuǎn)化后,將骨髓細(xì)月包導(dǎo)入患者體內(nèi),與無MAR構(gòu)建體相比,感興趣基因表達(dá)將高5倍的水平。這樣,即可表達(dá)有效量蛋白質(zhì)。在體內(nèi)基因治療中,包含MAR構(gòu)建體的載體可通過例如注射直接導(dǎo)入需要其的患者細(xì)胞內(nèi)。類似地,可將本發(fā)明的表達(dá)系統(tǒng)導(dǎo)入干細(xì)胞內(nèi)用于組織再生的移植物,或者用于例如神經(jīng)細(xì)胞療法而治療神經(jīng)退行性疾病。可用于本發(fā)明該實例中的干細(xì)胞的非限制性實例,是從任何年齡個體的骨髓組織或新生兒臍帶血中獲得的造血干細(xì)胞(HSC)和間充質(zhì)干細(xì)胞(MSC)。用根據(jù)本發(fā)明所述的表達(dá)系統(tǒng)轉(zhuǎn)染干細(xì)胞,并將成功的轉(zhuǎn)化體移纟直或重新導(dǎo)入需要細(xì)胞治療或組織再生治療的患者體內(nèi)。現(xiàn)在存在幾種方法用于獲得轉(zhuǎn)化的干細(xì)胞例如Nucleofection(CellLineSolutionV(VCA-畫3)、amaxaGmbH,Germany)。轉(zhuǎn)基因動物,其可產(chǎn)生大量蛋白質(zhì)包括結(jié)合人類抗原的抗體,可利用已知方法生成(例如但不限于Lonbergetal提交的美國專利號5,770,428、5,569,825、5,545,806、5,625,126、5,625,825、5,633,425、5,661,016和5,789,650)。該表達(dá)系統(tǒng)和MAR構(gòu)建體可用于蛋白質(zhì)生產(chǎn)中,通過例如轉(zhuǎn)基因牛、綿羊、山羊或豬,通常通過將蛋白質(zhì)分泌入體液(例如奶)中。參見例如Meadeetal的美國專利號5,750,172。關(guān)于轉(zhuǎn)基因動物的生成還可參見Lubonetal.的美國專利6,518,482。實例本發(fā)明將在下面的實例中進(jìn)一步闡述,而該實例不限制權(quán)利要求、本發(fā)明
發(fā)明內(nèi)容或本文其他部分中列出的發(fā)明范圍。該材料、方法和實例僅為了舉例說明而非出于限制的目的。在本文提供的指導(dǎo)下,本領(lǐng)域中的普通技術(shù)人員能夠進(jìn)行修改、添加和改進(jìn),這些均在本發(fā)明的范圍之內(nèi)。小鼠基因纟且的S/MAR預(yù)測SMARScanI通過SMARScanI匯集并分析對應(yīng)于NCBIm34小鼠組件的全部小鼠染色體序列。低嚴(yán)謹(jǐn)性和高嚴(yán)謹(jǐn)性篩查分別利用DNA彎曲標(biāo)準(zhǔn)閾值3.6度和最低窗口大小300bp或者閾值4.2度和最低窗口大小lOObp而實施。通過SMARScanI低嚴(yán)謹(jǐn)性分析小鼠全基因組,共得到1496個公認(rèn)的S/MAR(候選MAR),共占622,410bp(小鼠全基因組的0.024%)。表1示出了每一個染色體的大小、基因數(shù)量、所預(yù)測MAR的數(shù)量(候選MAR)、每個基因的MAR密度以及S/MAR之間的平均距離(kb)。該表表明,在不同染色體上,每一個預(yù)測S/MAR(候選MAR)存在各種的基因密度(標(biāo)準(zhǔn)差占每個MAR基因密度的約50%)。每個MAR較高與較低基因密度之間的倍數(shù)差是6,未考慮染色體Y,相對于其大小和其基因數(shù)量而言,染色體Y富含預(yù)測MAR(候選MAR),表明這些MAR的分布存在強烈且意外的偏差。表l還示出了S/MAR之間的平均距離(kb/S/MAR)是可變的(標(biāo)準(zhǔn)差占每個S/MARkb的平均值的38%,且每個S/MAR較高與較低kb密度之間的倍數(shù)差是8.3)。染色體IO、11、X和Y明顯使這些密度的標(biāo)準(zhǔn)差升高。最初,SMARScanI設(shè)計用于人類序列,因而當(dāng)利用最嚴(yán)謹(jǐn)參數(shù)時從小鼠基因組序列得到少量MAR:因此,對于高嚴(yán)謹(jǐn)性篩查(DNA彎曲標(biāo)準(zhǔn)的閾值4.2度),將默認(rèn)截斷值調(diào)整至利用lOObp而非300bp的窗口^f直時可i人為MAR的最小連續(xù)采才羊tt。利用大于4.2度的值的DNA彎曲標(biāo)準(zhǔn),通過SMARScanI分析小鼠基因組預(yù)觀'J出49個"超級"MAR。表l:每一個小鼠染色體預(yù)測的S/MAR和"超級"S/MAR數(shù)量。<table>tableseeoriginaldocumentpage42</column></row><table>每一個染色體的基因數(shù)量對應(yīng)于NCBIm34組件(assembly)(國家生物技術(shù)信息中心)。染色體大小是相應(yīng)小鼠參考序列重疊群長度的總和。利用新鑒定小鼠MAR增加重組蛋白質(zhì)的產(chǎn)量從利用SMARScan高嚴(yán)謹(jǐn)性篩查小鼠全基因組得到的公認(rèn)MAR(候選MAR)中選擇5個MAR元件。將它們從小鼠基因組DNA細(xì)菌人工染色體(購自兒童醫(yī)院Oakland研究所(CHORI,http:〃bacpac.chori.org/))克隆入質(zhì)并立載體中。這些新鑒定的小鼠MAR被命名為S4、S8、S15、S32和S46(按照利用SMARScanI鑒定的順序,"超級"MARSI至S49)。之前已經(jīng)鑒定了人類MAR1—3、1—6、1—9、1—42、1—68、3_S5和X—S29,MAR1_68和X_S29是最有效的人類元件(Mermodetal.."HighefficiencygenetransferandexpressioninmammaliancellsbyamultipletransfectionprocedureofMARsequences,"WO2005/040377,還可參見Mermodetal的美國專利7>開文件20070178469)。將這些MAR插入pGEGFP對照載體促進(jìn)綠色熒光蛋白質(zhì)表達(dá)的SV40啟動子和增強子上游,并將這些質(zhì)粒轉(zhuǎn)染入培養(yǎng)的CHO細(xì)胞中,如之前曾描述的[GirodPA,Zahn-ZabelMandMermodN]。然后利用熒光細(xì)胞分選器(FACS)分析整個穩(wěn)定轉(zhuǎn)染的細(xì)胞群中該轉(zhuǎn)基因的表達(dá)。圖1示出了各種S/MAR對重組綠色熒光蛋白質(zhì)(GFP)生轉(zhuǎn)染的CHO細(xì)胞群(如通過熒光激活細(xì)胞分選器(FACS⑧所示))和典型的圖i普。該圖中僅示出了最有效的人類MAR1—68和X—S29。圖譜顯示了作為GFP熒光水平的函數(shù)而計算的細(xì)胞數(shù)量。示出了代表相對光單位熒光值小于2(Ml)或大于102(M2)或103(M3)的細(xì)月包亞群Ml,M2和M3的水平才奉。如從圖l可以看出的,與^f又由GFP而無MAR促進(jìn)的表達(dá)相比,所有新鑒定的小鼠MAR均顯著增加轉(zhuǎn)基因的表達(dá),其中"超級"小鼠MARS4是所有示出MAR中最有效的。表2:具體分析來自多克隆CHO細(xì)胞群的GFP焚光<table>tableseeoriginaldocumentpage44</column></row><table>用抗生素選擇質(zhì)粒和pGEGFP報告基因構(gòu)建體或包含人類MAR1—68和X_S29或者所指出小鼠S4、S8、S15、S32或S46MAR的pGEGFP衍生物共同轉(zhuǎn)染CHO細(xì)胞。在2周內(nèi)選4奪穩(wěn)定轉(zhuǎn)染的多克隆細(xì)胞群的抗生素抗性,并通過FACS分析測試GFP熒光,如圖1中示出的。該表格示出了平均熒光值、其變異系數(shù)以及表現(xiàn)出的焚光值相對光單位小于2(M1)或大于102(M2)或103(M3)的細(xì)胞百分位數(shù)。這些結(jié)果是平均值,且平均值的標(biāo)準(zhǔn)差(SEM)從3次獨立實驗獲得。將最有效的人類MAR1—68和X—S29的轉(zhuǎn)錄活性與通過新鑒定小鼠MAR獲得的轉(zhuǎn)錄活性加以比較。最初用GFP表達(dá)分析測試5種小鼠MAR,并發(fā)現(xiàn)其均增加GFP的表達(dá)至不同的水平。小鼠MARS15和S32是轉(zhuǎn)錄活性相對最低的MAR(與僅GFP相比,增力口2倍),S8和S46表5見出中度活性(增力口3至44咅),且MARS4表現(xiàn)出極高的轉(zhuǎn)錄活性(增加7倍)。而且,小鼠MARS4是該研究所測i式全部MAR中最有效的。比4交人類MAR1-68與小鼠MARS4之間的轉(zhuǎn)錄活性,表明全種群(GmeanMO)和高GFP生成細(xì)胞(M2)的平均熒光增加50%,而利用小鼠MARS4的極高GFP生成纟田月包(M3)的百分4立i丈高出175%。就GFP焚光來"i兌,全種群的均質(zhì)性(CVMO)總比用小鼠MARS4時低1%至2%,這是有利的,因為其表現(xiàn)出更高的細(xì)胞生產(chǎn)穩(wěn)定性。需要確定高活性MAR元件是否可始終乂人小鼠基因組獲得。因而,對另外兩個小鼠MAR(S6和S10)進(jìn)行克隆和表征。將這些新鑒定的小鼠MAR插入pGEGFP對照載體中,并如上文利用FACS進(jìn)行分析。在用FACS分析的全部不同參數(shù)中,'J、鼠MARS10也表現(xiàn)出比最好的人類MAR更有效,且?guī)缀跖cMARS4具有一樣的轉(zhuǎn)錄活性,以增加整體表達(dá)。為了"i平^f介才及高生成細(xì)月包,將M3細(xì)月包的百分比沖示準(zhǔn)4匕為人類MAR1—68得到的百分位數(shù)。結(jié)果在圖2中給出。圖2示出了各種人類和小鼠S/MAR元件對才及高重組綠色熒光蛋白質(zhì)(GFP)生成細(xì)月包百分位ft(%M3)的影響。通過熒光激活的細(xì)胞分選器(FACS)對通過如所示出的包含或不包含MAR元件的GFP表達(dá)載體轉(zhuǎn)染的CHO細(xì)胞群加以分析。將極高生成細(xì)胞的百分位數(shù)標(biāo)準(zhǔn)化為對于這個標(biāo)準(zhǔn)最好的人類MAR(MAR1—68),將它的值設(shè)為100。平均來說,小鼠MARS10和S4分別比人類MAR1—68多提供80%和180%的極高生成細(xì)胞。總體上,從7種小鼠MAR與7種人類MAR進(jìn)行的比較,可以推斷利用嚙齒動物MAR可從CHO細(xì)胞獲得較高的表達(dá)。新鑒定的小鼠MAR在不同細(xì)胞類型中效果的評價在CHO細(xì)月包中評^介S4MAR的效應(yīng)。此夕卜,包含人類MAR1-68,小鼠MARS4或不包含MAR的EGFP表達(dá)載體在人類HeLa細(xì)胞中穩(wěn)定轉(zhuǎn)染,并分析EGFP熒光。圖3示出了各種人類1-68和小鼠S4MAR元件對重組綠色熒光蛋白(GFP)表達(dá)的影響。HeLa細(xì)月包群如表2所述進(jìn)4亍轉(zhuǎn)染和分片斤。比4交S4和1-68MAR在HeLa細(xì)胞中的效果,發(fā)現(xiàn)S4在幾個方面勝過了1-68:S4產(chǎn)生更高的平均GFP熒光(平均GmeanM0)以及更多的中和高水平表達(dá)范圍內(nèi)的細(xì)力包(分別是Ml和M2)和更^f氐的表達(dá)變異(平均CVMO)。利用HeLa細(xì)胞未發(fā)現(xiàn)處于極高表達(dá)范圍(M3)的細(xì)胞。利用小鼠MAR增強單克隆抗體表達(dá)為了確定小鼠MAR特別是最有效的MAR是否可用來增加藥學(xué)應(yīng)用的蛋白質(zhì)生成,將其插入編碼恒河猴-D識別的免疫球蛋白重鏈和輕《連的pMZ37和pMZ59載體中[MiescherS,Zahn-ZabalM,DeJesus,M,Moudry,R,F(xiàn)isch,I,Vogel,M,Kobr,M,Imboden,MA,Kragten,E,Bichler,J,Mermod,N,Stadler,BC,Amstutz,H.,Wurm,F]。將這些質(zhì)粒轉(zhuǎn)染入CHO細(xì)胞中,如前所述實施選擇和免疫球蛋白分析[GirodPA,Zahn-ZabalMandMermodN]。圖4示出了S/MAR元件對重組單克隆抗體生成的影響。這里,CHO細(xì)胞用上述促進(jìn)IgG重鏈和輕鏈表達(dá)的載體轉(zhuǎn)染,其中該載體不包含MAR(沒有MAR),或包含順式加入的MARS4。24、48和72小時后,測定上清中的IgG滴度。此外,如圖5中所示,從用上文提到的促進(jìn)IgG重鏈和輕鏈表達(dá)的載體轉(zhuǎn)染的CHO細(xì)胞群中產(chǎn)生穩(wěn)定克隆,其中該載體不包含MAR(沒有MAR),或包含順式加入的MARS4。選擇后,測定培養(yǎng)基中所分泌IgG的滴度,并利用細(xì)胞計數(shù)分析比生產(chǎn)率。圖6(A)示出了通過限制性稀釋從用促進(jìn)IgG重鏈和輕鏈表達(dá)的載體轉(zhuǎn)染的CHO細(xì)胞群產(chǎn)生穩(wěn)定的單個克隆后獲得的結(jié)果,其中該載體不包含MAR(沒有MAR),或包含順式加入的MARS4。選擇后,測定培養(yǎng)基中的分泌IgG滴度,并利用細(xì)胞計數(shù)分析比生產(chǎn)率。通過MAR1—68獲得的相當(dāng)結(jié)果以及(B)中通過不含MAR的克隆獲得的結(jié)果也包括在內(nèi)。圖3至6獲得并描述的結(jié)果表明,新鑒定的小鼠MAR特別是MARS4可用來提高藥用蛋白質(zhì)如單克隆抗體在瞬時轉(zhuǎn)染子(圖4)和穩(wěn)定轉(zhuǎn)染子(圖5和6)中的產(chǎn)量。當(dāng)利用MARS4時,比生產(chǎn)率為約5pg/細(xì)月包/天(pcd)或以上的穩(wěn)定克隆可易于通過分析幾個候選克隆而鑒定(圖6(A))。實際上,有或無MARS4的情況下,21個最佳克隆的平均生產(chǎn)率分別為7.28土0.78pcd(圖6(A))和2.61±1.09pcd。這些結(jié)果與通過已知雞溶菌酶MAR(低于1.5mg/L)或無MAR時(低于0.5mg/L)獲得的滴度水平形成對比。特別地,這些結(jié)果表明,新鑒定小鼠MAR可用來纟是高藥用蛋白質(zhì)例如^f旦不限于單克隆抗體的產(chǎn)量,佳_得d、鼠MAR如MARS4對于重組蛋白質(zhì)的生成特別有利。利用人類MAR1—68的表ii^t定'hi利用MAR^68證實,由不包含MAR的克隆產(chǎn)生的基因表達(dá)#皮逐步沉默,而包含MAR的等效克隆,不4又隨時間^f呆持高水平表達(dá),且沉默細(xì)胞也恢復(fù)了表達(dá)。圖7示出了將包含MAR1-68的pEGFP表達(dá)質(zhì)粒與G418抗生素抗性基因共轉(zhuǎn)染入CHO細(xì)胞內(nèi),且在G418存在時,選才奪穩(wěn)定表達(dá)的細(xì)月包達(dá)3周,如Girodetal.,2005中所述。通過限制性稀釋獲-彈細(xì)月包克隆,并分神斤9個獨立克隆的GFP熒光。兩個種群中的每一個選擇表達(dá)GFP的典型克隆用于進(jìn)一步分析,并在抗生素選擇存在或不存在的情況下繼續(xù)培養(yǎng)達(dá)26周。左側(cè)圖譜表示培養(yǎng)2周后的GFP熒光水平(x軸)和細(xì)胞計數(shù)的值(y軸),而右側(cè)圖譜則從培養(yǎng)26周的細(xì)胞而獲得。如可以看出的,缺乏MAR的克隆示出了在不存在抗生素的情況下,相對于2周后水平,26周后的GFP熒光水平有所降低,而包含MAR的克隆可在抗生素選擇存在與否的情況下,保持26周時的GFP熒光水平,使得包含表達(dá)系統(tǒng)的MAR對于感興趣基因的穩(wěn)定表達(dá)非常有用。MAR的模塊性以U因表達(dá)增強的相關(guān)性MAR的結(jié)構(gòu)分析揭示了每一個促進(jìn)基因表達(dá)增強的DNA序列區(qū)/模塊。圖8描繪了通過1—68MAR結(jié)構(gòu)分析獲得的結(jié)果。在圖8(A)中表明,中心富含AT區(qū)描繪了MAR168基因座中的彎曲DNA。圖8(B)表明,該富含AT區(qū)由富含專爭錄因子結(jié)合4立點的區(qū)i或包圍,^口利用Matlnspector鑒定的(Cartharius,F(xiàn)reehetal.2005)。利用Matlnspector沿著MAR序列檢測到精確的729個潛在的TFBS。圖8(B)的下面部分示出了已鑒定區(qū)域的性質(zhì)。圖9(A)示出了1一68MAR以及左側(cè)的不同MAR,其整合了1—68MAR區(qū)域或部分且改變了該區(qū)域或其部分的順序和/或方向以及/或者復(fù)制這些區(qū)域或它們的部分。右側(cè)示出了由構(gòu)建體1至16獲得的轉(zhuǎn)錄增強程度以及由1_68MAR或無MAR時獲得的轉(zhuǎn)錄增強。所示出的全部MAR序列均插入驅(qū)動eGFP基因標(biāo)志物的啟動子上游。箭頭描繪了該區(qū)域或其部分相對于圖8中所述野生型MAR序列的方向。富含AT區(qū)i或周圍的序列以帶箭頭(向左)的反向陰影線框和以帶箭頭(不成比例;向右)的正向陰影線框表示。彎曲區(qū)以畫有陰影交叉線的沖匡示出。圖9(B)示出了MAR的彎曲才莫式,其對應(yīng)于圖9A中的構(gòu)建體6。這些彎曲才莫式通過SMARScanI而確定。圖9(C)示出了Matlnspector[Cartharius,Freehetal.2005]分析的結(jié)果。利用Matlnspector[Cartharius,Freehetal.2005]鑒定潛在的轉(zhuǎn)錄因子結(jié)合位點(TFBS)。利用Matlnspector沿著MAR序列才全測到731個潛在的TFBS。在圖9(C)的下部,利用^f應(yīng)于圖8(B)和圖9(A)的編石馬示出構(gòu)建體6。該圖下部的編;s馬對應(yīng)圖9(A)中示出并討i侖的編碼。圖9中描述的實驗表明該區(qū)域中沒有一個可獨立顯示完全的MAR活性。例如,將來自天然發(fā)生的人類1_68MAR的DNA完全地增強轉(zhuǎn)錄需要3個獨特序列(圖8):—個1189bp的節(jié)段,其包含用于多個轉(zhuǎn)錄因子的結(jié)合位點(即CEBP)(圖9A頂部),以帶箭頭的反向陰影線框示出,一個固有的彎曲DNA,其由一個763bp的對稱富含AT區(qū)(A和T交替)描述(圖9A頂部,畫有陰影交叉線的框)以及額外的1648bp的節(jié)段,其包括多個HoxF和SATBI結(jié)合位點(圖9A頂部,以帶箭頭的正向陰影線框示出)。圖9表明,通過移去該彎曲DNA以增加啟動子區(qū)i或上游轉(zhuǎn)錄因子結(jié)合位點區(qū)域的尺寸,可改善人類1_68MAR。為了實現(xiàn)該增力口,將鄰近富含AT區(qū)(SEQID.No.18)的轉(zhuǎn)錄因子結(jié)合位點(TFBS)區(qū),這里是富含Hox的區(qū)域(SEQIDNo.19)(下文為帶箭頭的正向陰影線框)連接于富含CEBP的區(qū)域(SEQIDNo.17)(下文也為帶箭頭的反向陰影線框(圖9))。比較如圖9A中右側(cè)描繪的所得不同MAR構(gòu)建體的轉(zhuǎn)錄增強活性,表明帶箭頭的正向陰影線框的方向?qū)τ谵D(zhuǎn)錄增強比4交重要(比4交構(gòu)建體5和6)。所示出lt據(jù)還強烈表明,遠(yuǎn)端轉(zhuǎn)錄控制元件本身限制下游染色質(zhì)的轉(zhuǎn)錄起始。如果位于帶箭頭的正向陰影線框的3'末端的223bp片段(SEQIDNO.20)保留構(gòu)建體7中區(qū)域的全部活性,提示在該情形中,該重要部分必須與彎曲區(qū)域及構(gòu)建體6中元件剩余部分(核苷酸1-1425)的5,末端協(xié)同作用。發(fā)現(xiàn)兩個HMG-I/Y位點定位于該末端。小鼠MAR的^性和長度減少根據(jù)人類1—68MAR的觀察結(jié)果,也分析了S4MAR的模塊特別是那些成就其轉(zhuǎn)錄活性的才莫塊。實施該分析的目的是降4氐S4MAR的長度,而S4MAR相對4交長。因而,乂人S4MAR構(gòu)建了幾種MAR(表3)并對其進(jìn)行表征(圖10)。圖10左側(cè)示出了特殊的MARS4構(gòu)建體,且右側(cè)示出了各種MARS4對重組綠色熒光蛋白(GFP)表達(dá)的影響,如通過分4斤全種群的平均熒光而揭示的(AvgGmeanM0)。轉(zhuǎn)染了包含或不包含如所示出MAR構(gòu)建體的GFP表達(dá)載體的CHO細(xì)胞群,通過利用FACScalibur細(xì)月包計凄t器(BectonDickinson)的流式細(xì)月包計凄t術(shù)加以分沖斤。通過人類MAR1—68獲得的熒光(其值設(shè)為100)對全種群的平均熒光進(jìn)行標(biāo)準(zhǔn)化,而GFP表示不存在MAR時的表達(dá)。其他MAR構(gòu)建體按照其相對全長1547bpS4MAR的堿基含量而命名(見表3)。斑點框表示MARS4中富含AT的彎曲區(qū)域,S—41-4662-Luc5489表示一個構(gòu)建體,其中末端(3')795個堿基對被去除并用熒光素酶基因的一部分(黑框)取代。有趣地是,從圖IO中可以看到的,發(fā)現(xiàn)1624-bp£coRI片段可從S4MAR(S4-1-703—2328-5457)中缺失而未顯著丟失其MAR活性。然而,缺失啟動子近端795bp片段或用類似長度的熒光素酶基因片^殳取^該序列(S4—1-4661;S4—1-4661-Luc5489),則引起該活性的徹底丟失。這表明小鼠S4MAR的某些變異體可表現(xiàn)出高活性,雖然長度更短,從而使得其更方便用于例如載體設(shè)計和轉(zhuǎn)移。表3:pGEGFP載體中的MARS4構(gòu)建體<table>tableseeoriginaldocumentpage50</column></row><table>3,末端MAR序列的活性為了進(jìn)一步分析MARS43,末端序列的活性,通過去除或復(fù)制其部分進(jìn)一步分解MAR該部分。圖11也示出了各種MARS44汙生物對重組綠色熒光蛋白質(zhì)(GFP)表達(dá)的影響,如通過分析全種群平均熒光(AvgGmeanMO)所揭示的。CHO細(xì)胞群如上所述生成并測定。有趣的是,一種具有截短3,末端的這種書t生物(原始MARS4的4658-5054vs.4658-5457),相比于更長的原始MARS4序列,平均表現(xiàn)出輕微更高的轉(zhuǎn)基因表達(dá)(104%vs100%)。這表明,可獲得更加有效且更短的MAR元件衍生物。合成的MAR圖12示出了[1—68MAR的]潛在的轉(zhuǎn)錄因子結(jié)合位點圖語,如通過MATInspector軟件預(yù)測的。C/EBP、NMP4、FAST1、SATB1和HoxF(也稱Gsh)結(jié)合位點的位置作為實例示出,說明了其在5,正向陰影線側(cè)翼序列中的富集。這些結(jié)合位點如其在MAR1-68中發(fā)生的一樣而應(yīng)用,未作任《可改變(FASTI、C/EBP、HOXF/Gsh),或者如果與共有(即正確的)序列(HoxF、SatBl、NMP4)相比其含有一個或兩個確普配,貝,J力口以才交正。發(fā)現(xiàn)富含AT的彎曲DNA區(qū)與人類MAR1—68中轉(zhuǎn)錄因子結(jié)合位點之間可能的協(xié)同作用,促進(jìn)了構(gòu)建包含MAR1-68中富含AT區(qū)(鄰近一個或幾個轉(zhuǎn)錄因子結(jié)合位點)的合成MAR。圖13描繪了用來測試合成MAR活性的質(zhì)粒的圖鐠,該合成MAR從包括富含AT區(qū)的核心(MAR1429-2880)與轉(zhuǎn)錄因子的化學(xué)合成DNA結(jié)合位點(置于啟動子和綠色熒光蛋白(GFP)上游)的組裝而構(gòu)建。圖13示出了轉(zhuǎn)錄因子結(jié)合位點插入富含AT的核心與促進(jìn)GFP轉(zhuǎn)基因表達(dá)的SV40啟動子之間,模擬圖9中存在的情形,其中,在最有用的情形中,包含結(jié)合位點的MAR部分插入啟動子與彎曲DNA區(qū)之間。表4示出了所采用化學(xué)合成寡核普酸的DNA序列。表4.來自人類MAR168的z〉認(rèn)轉(zhuǎn)錄因子結(jié)合位點<table>tableseeoriginaldocumentpage52</column></row><table>將具有粘性末端的成對30-mer寡聚體克隆入包含MAR1—68中富含AT的核心區(qū)的載體中。斜體堿基對是轉(zhuǎn)錄因子結(jié)合位點(下劃線是最保守的堿基)的序列及來自MAR1_68的側(cè)翼序列。常失見字體的序列是不與MAR1_68序列對應(yīng)的接頭或適配子序列。在這些接頭序列上,修改來自MAR1一68且含有1個或2個4昔配的寡聚體,4吏其與通用序列匹配。圖14示出了通過如圖13中所述合成MAR構(gòu)建體的轉(zhuǎn)錄增強。除核心外,所插入元件還包含1個或幾個蛋白質(zhì)DNA結(jié)合4立點,如所示出的。轉(zhuǎn)染除核心序列(包括富含AT區(qū),即富含AT核心)外還包含1個或幾個結(jié)合位點的質(zhì)粒,表明相比于僅富含AT核心,包含結(jié)合位點促進(jìn)轉(zhuǎn)錄增強,且C/EBP和Hox或Gsh2是最有效的,然后是SatBl和Fastl,而NMP4^f立點則不具有可4企測的效果。還測試了有效結(jié)合位點的不同混合物以確定能否觀察到協(xié)同效應(yīng)。為此,將包含不同轉(zhuǎn)錄因子結(jié)合位點的寡核苷酸的各種組合混合于DNA連4妄反應(yīng)中,并通過DNA測序來確定結(jié)合4立點的沖奮確順序和排列。表5中示出了所得到的組合。克隆號轉(zhuǎn)錄因子位點位點總數(shù)1Gsh,2(SATBl)32SATBl,Hox23SATBl,F(xiàn)astl242(Hox),SATBl,Hox46Gsh,2(SATBl),CEBP,Hox572(Fastl),2(Gsh),SATBl58Hox,SATB1,Hox,Gsh,SATB1,Hox69Gsh,2(Fastl)3103(CEBP),SATBl,Hox,F(xiàn)astl611Hox,Fast,Hox,Fast412Hox,SATB1,Hox,Gsh,Hox,Hox6132(Hox),3(SATBl),Fast,CEBP,Hox,CEBP914Gsh,Gsh215CEBP,Hox,Hox3表5包含各種轉(zhuǎn)錄因子結(jié)合位點異源多聚體的合成MAR構(gòu)建體如上文,通過轉(zhuǎn)染測試得到的質(zhì)粒。圖15示出了利用表5中示出的DNA結(jié)合位點組合構(gòu)建的合成MAR引起的轉(zhuǎn)錄增強。最有效的纟且合用星號表示,并指出了HoxF/Gsh2或SatBl的存在。圖15中示出的結(jié)果表明,在該情形中,合成MAR的活性不依賴于所插入結(jié)合位點的數(shù)量,但結(jié)合位點的特殊組合表現(xiàn)出高促進(jìn)活性,而其他組合則缺乏活性或甚至抑制基因表達(dá)。該情形中,具有較高活性的構(gòu)建體包括Hox/Gsh2與SATB1蛋白質(zhì)的組合,且最有效的構(gòu)建體則^f又由這些元件組成。與缺乏4壬4可MAR序列的pEGFP對照載體相比,插入該合成MAR增加了高表達(dá)克隆的形成約10倍。參考文獻(xiàn)AbdurashidovaQDanailovB,etal.,"LocalizationofproteinsboundtoareplicationoriginofhumanDNAalongthecellcycle."£MS(9>/_22:42944303,2003.Aladjem,MIandFanningE.,"Therepliconrevisited:anoldmodellearnsnewtricksinmetazoanchromosomes."五MS(95(7):686-91:2004.AllenGC,SpikerS,ThompsonWF,Useofmatrixattachmentregions(MARs)tominimizetransgenesilencing,尸/arwfMo/S/o/.,43(2-3):361-376,2000.AmatiBandGasserSM,ChromosomalARSandCENelementsbindspecificallytotheyeastnuclearscaffold,Ce〃,54:967-978,1988.AmatiBandGasserSM,Drosophiliascaffold-attachedregionsbindnuclearscaffoldsandcanfunctionasARSelementsinbothbuddingandfissionyeasts,Mo/.CW/.腸/.,10:5442-5454,1990.BellSP,"Theoriginrecognitioncomplex:fromsimpleoriginstocomplexfunctions."Gewes£)ev16:659672,2002.BodeJ,SchlakeT,Rios畫RamirezM,MielkeC,StengartM,KayVandKlehrWirthD,Scaffold/matrix-attachedregions:structuralpropertiescreatingtranscriptionallyactiveloci,》w"wra/"wdFwwWo""/162A:389-453,1995.BodeJ,BenhamC,KnoppAandMielkeC,Transcriptionalaugmentation:modulationofgeneexpressionbyscaffold/matrix-attachedregions(S/MARelements),O"7ev嵐a一G騰五,,10(1):73-90,2000.BodeJ,Stengert-IberM,KayV,SchlakeTandDietz-PfeilstetterA,Scaffold/matrix-attachedregions:topologicalswitcheswithmultipleregulatoryfunctions,O".五x/.,6:115-138,1996.BodnarJW,AdomainmodelforeukaryoticDNAorganization:amolecularbasisforcelldifferentiationandchromosomeevolution,/Tte腸/.,Vol.132:479-507,1988.BoulikasT,NatureofDNAsequencesattheattachmentregionsofgenestothenuclearmatrix,</Ce〃,52:14-22,1993.BoulikasT,ChromatindomainsandpredictionofMARsequences.InStructuralandFunctionalOrganizationoftheNuclearMatrix:InternationalReviewofCytology,AcademicPress,Orlando,162A:279-388,1995.BreyeneP,VanMontaguMandGheyseuG,Theroleofscaffoldattachmentregionsinthestructuralandfunctionalorganizationofplantchromatin,rnmsgem.ci^s.,7>wwgew'c,3:195-202,1994.BreyneP,VanMontaguM,DepickerAandGheysenQCharacterizationofaplantscaffoldattachmentregioninaDNAfragmentthatnormalizestransgeneexpressionintobacco,尸/"wfCe〃,4:463-471,1992.Cartharius,K.,K.Freeh,etal.,Matlnspectorandbeyond:promoteranalysisbasedontranscriptionfactorbindingsites,5/0/w7fer附a"cs21:2933-42,2005.<table>tableseeoriginaldocumentpage56</column></row><table>correlationofpropertiesinvitroandfunctioninvivo,J5/oc/^w/s^y,29:7475-7485,1990.MiescherS,Zahn-ZabalM,DeJesusM,MoudryR,FischI,VogelM,KobrM,ImbodenMA,KragtenE,BichlerJ,MermodN,StadlerBC,AmstutzH,WurmF,CHO,ExpressionofaNovelHumanRecombinantIgGlanti-RhDAntibodyIsolatedbyPhageDisplay,Br".//7"e腿to/"111,157-166,2000.NationalCenterforBiotechnologyInformation(http:〃www.ncbi.nih.gov),PhiVanLandStratlingWH,Dissectionoftheabilityofthechickenlysozymegene5'matrixattachmentregiontostimulatetransgeneexpressionandtodampenpositioneffects,5/oc/^w/欲乂35:10735-10742,1996.RazinSV,FunctionalarchitectureofchromosomalDNAdomains,細(xì)£x/r,6:247-269,1996.StefanovicD,StanojcicSetal"InvitroproteinDNAinteractionsatthehumanlaminB2replicationorigin,/5/o/CA謡278:4273742743,2003.StrickRandLaemmliUK,SARsarecisDNAelementsofchromosomedynamics:synthesisofaSARrepressorprotein,CW/83(7):1137-48,2005.VogelsteinB,PardollDandCoffeyD,SupercoiledloopsandeukaryoticDNAreplication,Ce〃,22:79-85,1980.YouZ,IshimiY,etal.,Thymine-richsingle-stmndedDNAactivatesMcm4/6/7helicaseonY畫forkandbubble-likesubstrates,£7WBC>/22:61486160(2003).Zahn-ZabalM,KobrM,GirodPA,ImhofM,ChatellardP,deJesusM,WurmFandMermodN,Developmentofstablecelllinesforproductionorregulatedexpressionusingmatrixattachmentregions./腸tec/z"o/,87(1):29-42,2001.權(quán)利要求1.用于高水平表達(dá)至少一種基因的一種表達(dá)系統(tǒng),包括用于可操作地連接編碼一種感興趣基因的一種核苷酸序列的一種啟動子,以及在一種用所述表達(dá)系統(tǒng)轉(zhuǎn)化的細(xì)胞內(nèi)用于增強一種所述基因表達(dá)的至少一種非人類哺乳動物MAR核苷酸序列,其中用所述構(gòu)建體轉(zhuǎn)化所述細(xì)胞時,所述非人類哺乳動物MAR核苷酸序列使所述基因表達(dá)增加約2、約3、約4、約5、約6、約7、約8、約9、約10倍或更多倍。2.根據(jù)權(quán)利要求1所述的表達(dá)系統(tǒng),其中包括所述啟動子和編碼一種感興趣基因的所述核普酸序列的一種表達(dá)盒可纟喿作地連,接于該啟動子。3.才艮據(jù)以上權(quán)利要求中任一項所述的表達(dá)系統(tǒng),其中所述至少一種非人類哺乳動物MAR核苷酸序列是一種嚙齒動物MAR核香酸序列,例如一種小鼠或倉鼠MAR核苷酸序列。4.根據(jù)以上權(quán)利要求中任一項所述的表達(dá)系統(tǒng),其中所述非人類哺乳動物MAR核苦酸序列包4舌(i)SEQIDNo.3、SEQIDNo.IO或它的一個功能片段;或者(ii)與(i)中任何一個序列具有約80%,約90%,約95%或約98%的序列一致性的一種核苷酸序列。5.根據(jù)以上權(quán)利要求中任一項所述的表達(dá)系統(tǒng),其中所述基因在一種非人類哺乳動物細(xì)胞例如一種嚙齒動物細(xì)胞特別是一種小鼠或倉鼠細(xì)胞或者在一種人類細(xì)胞如一種HeLa細(xì)胞內(nèi)表達(dá)。6.根據(jù)以上權(quán)利要求中任一項所述的表達(dá)系統(tǒng),其中所述至少一種非人類哺乳動物MAR核苷酸序列在所述基因上以順式或反式發(fā)揮作用。7.用于增加在一種細(xì)月包內(nèi)蛋白質(zhì)產(chǎn)量的一種方法,包括「提供一種人類或非人類哺乳動物細(xì)胞,將以上權(quán)利要求中任一項所述的表達(dá)系統(tǒng)導(dǎo)入所述細(xì)胞內(nèi),使基因表達(dá)增加約2、約3、約4、約5、約6、約7、約8、約9、約l(H咅或更多。8.—種分離并純化的核酸分子,包括(a)SEQIDNo.3或SEQIDNo.IO或它的一個功能片,段的核芬酸序列,或者(b)與(a)中的序列具有至少約80%、約90%、約95%或約98%的序列一致性且具有MAR活性的一種核苷酸序列。9.用于鑒定非人類哺乳動物MAR序列的一種方法,包括4是供至少一種非人類哺乳動物核酸分子,優(yōu)選一種非人類哺乳動物基因組或其一部分,令所述核酸分子經(jīng)受針對MAR序列的一個掃描過程,包括i殳定^f寺評估的核酸分子的窗口大小,選才奪至少1個或至少2個,優(yōu)選3個,更優(yōu)選4個或更多個與MAR相關(guān)的特4正,為表現(xiàn)這個/這些特征的序列設(shè)定多個閾值,以及選擇超過這些閾值的MAR候選核苷酸序列,確定通過包含所述非人類哺乳動物MAR核苷酸序列的一種表達(dá)系統(tǒng)轉(zhuǎn)化一種人和/或非人類哺乳動物細(xì)胞時,所述非人類哺乳動物MAR核苷酸序列使基因表達(dá)增加約2、約3、約4、約5、約6、約7、約8、約9、約1(H咅或更多4咅。10.根據(jù)權(quán)利要求9所述的一種方法,其中所述至少一個特征可以是一個DNA彎曲角度、大溝深度、小溝寬度、解鏈溫度或它Cl的纟且^。11.根據(jù)權(quán)利要求10所述的方法,其中DNA彎曲角度值包括在約3和約5度(基團的角度(radicaldegree))之間,優(yōu)選在3.8和約4.4度之間,包括約3.9、約4.0、約4.1、約4.2和約4.3度。12.根據(jù)權(quán)利要求10或11所述的方法,其中大溝深度值在約8.9至約9.3A之間并且小溝寬度值在約5.2至約5.8A之間,優(yōu)選地,該大溝深度值在約9.0至約9.2A之間包括約9.1A并且該小溝寬度值可在約5.4至約5.7A之間包括約5.5A和約5.6A。13.才艮據(jù)權(quán)利要求10至12所述的方法,其中該解鏈溫度在約55和約75°C之間,4爭別在約55和約62°C之間,包4舌約56、約57、約58、約59、約60和約61°C。14.沖艮據(jù)權(quán)利要求10所述的方法,其中DNA彎曲角度值在約4.0至約5.0度之間,包4舌約4.1、約4.2、約4.3、約4.4、約4.5、約4.6、約4.7、約4.8和約4.9度。15.根據(jù)權(quán)利要求14所述的方法,其中所述DNA彎曲角度值是與范圍乂人約50bp至約150bp,包括例如約80bp、約lOObp和約120bp的窗口值相結(jié)合。16.根據(jù)權(quán)利要求10所述的方法,其中該DNA彎曲角度值乘以一個窗口值是在約320和約1320之間,例如在約420和約1220、約520和約1120、約620和約1020、約720和約920之間,該大溝深度值乘以該窗口值是在約900和約4000之間、例如在約1200和3700、約1500和約3400、約1800和約3100、約2100和約2800之間,和/或小溝深度值乘以該窗口值是在約500和約2500之間,例如在約750和約2250、約1000和約2000、約1250和1750之間。17.根據(jù)權(quán)利要求9至16所述的方法,進(jìn)一步包括提供經(jīng)實驗證實的人類或非人類來源的MAR;利用所述經(jīng)實驗證實的人類或非人類來源的MAR確定所述閾值。18.—種MAR構(gòu)建體,包括(a)(i)—種分離的核苷酸序列,包括一個已鑒定MAR的一個末端區(qū)i或的至少一部分,以及(ii)另一個分離的核苷酸序列,包括所述已鑒定MAR或另一種已鑒定MAR的約10%、約15%、約20%、約25%、約30%或者更多;或者(b)(i)—種核苦酸序列,具有與(a)(i)的核苦酸序列約90%、約95%、約96%、約97%、約98%、約99%的序列一至丈性,以及(ii)一種核苦酸序列,具有與(b)(i)的核苷酸序列約70%、約80%、優(yōu)選約90%、約95%、約96%、約97%、約98%、約99%的序列一致性。19.根據(jù)權(quán)利要求18所述的MAR構(gòu)建體,其中(a)(ii)中所述核苷酸序列包4舌一個富含AT區(qū)。20.才艮據(jù)權(quán)利要求18或19所述的一種MAR構(gòu)建體,其中所述MAR構(gòu)建體包括一種已鑒定MAR序列的核苷酸數(shù)量的少于約90%、優(yōu)選少于約80%、甚至更優(yōu)選少于約70%、少于約60%或少于約50%。21.根據(jù)權(quán)利要求18至20中4壬一項所述的一種MAR構(gòu)建體,其中所述MAR構(gòu)建體包括與已鑒定MAR序列的核苷酸凄t量的約相同j直或至少約110%22.—種MAR構(gòu)建體,包括連續(xù)4非列的一種已鑒定的MAR序列的多個區(qū)i或,其中一種順序和/或一種方向不同于一種已鑒定MAR序列的順序和/或方向。23.根據(jù)權(quán)利要求22所述的MAR構(gòu)建體,其中所述區(qū)域包括至少一個富含AT區(qū)域和至少一個結(jié)合位點區(qū)域。24.才艮才居4又利要求22至23所述的MAR構(gòu)建體,其中所述MAR構(gòu)建體進(jìn)一步包括至少一個結(jié)合位點區(qū)域的至少一部分,并且任選地,其中所述至少一個結(jié)合位點區(qū)域的所述至少一部分來自所述已鑒定MAR序列。25.根據(jù)權(quán)利要求22至24所述的MAR構(gòu)建體,其中所述已鑒定MAR序列是一種人MAR或一種小鼠MAR。26.根據(jù)權(quán)利要求22至25所述的MAR構(gòu)建體,其中所述已鑒定MAR序列的所述區(qū)域或其部分與該天然發(fā)生的人1_68MAR或小鼠MARS4區(qū)域或者它們的部分具有約70%的序列一致性、約80%的序列一致性、約90%的序列一致性、約95%的序列一致性、或約98%的序列一致性。27.根據(jù)權(quán)利要求22至26所述的MAR構(gòu)建體,其中所述區(qū)域分別^f應(yīng)于一種天然發(fā)生的人1—68MAR的bp1至1189、1190至1952以及1953至3600。28.根據(jù)權(quán)利要求22至27所述的MAR構(gòu)建體,其中這些區(qū)域是序列特異性區(qū)域。29.—種MAR構(gòu)建體,包4舌(a)—個核心核苷酸序列,包括r(i)一個已鑒定MAR序列的至少一個分離的或合成的富含AT區(qū);或(ii)與(a)(i)中富含AT區(qū)具有至少80%、85%、90%、95%、98%或99%的序列一致性的至少一個富含AT區(qū),(b)—個核普酸序列,包括與(a)中所述核苷酸序列相鄰的至少一個DNA蛋白質(zhì)結(jié)合位點,其中所述結(jié)合位點是(i)另一個已鑒定MAR序列的一個DNA蛋白質(zhì)結(jié)合位點,(ii)(a)中該已鑒定MAR序列的一個DNA蛋白質(zhì)結(jié)合位點,其中在該已鑒定MAR序列中,所述DNA蛋白質(zhì)結(jié)合位點位于(a)的該核心核苷酸序列外部,或者(iii)存在于(a)的核心內(nèi)^f旦與至少一個另外的DNA蛋白質(zhì)結(jié)合位點相鄰的一個第一DNA蛋白質(zhì)結(jié)合位點,其中在(a)的核心內(nèi),該第一和至少一個所述另外的DNA蛋白質(zhì)結(jié)合位點不相鄰,或者(iv)—種非MAR序列的一個DNA蛋白質(zhì)結(jié)合位點。30.根據(jù)權(quán)利要求29所述的MAR構(gòu)建體,其中在將所述MAR構(gòu)建體導(dǎo)入一種細(xì)胞內(nèi)時,所述構(gòu)建體使可操作性地連接于一種啟動子的一種基因的表達(dá)增強約2、約3、約4、約5、約6、約7、約8、約9、約1(H咅或更多倍。31.根據(jù)權(quán)利要求29或30所述的MAR構(gòu)建體,其中所述MAR構(gòu)建體長度少于500個核苷酸,優(yōu)選少于約250個核苷酸,甚至更4尤選少于約200個、約150個或約100個核苷酸。32.根據(jù)權(quán)利要求29至31所述的MAR構(gòu)建體,其中(a)中所述核心核酸序列包括所述已鑒定MAR的至少一個TFBS,其中在該已鑒定MAR內(nèi),所述至少一個TFBS^f立于所述富含AT區(qū)的一煩'J或兩4則。33.根據(jù)權(quán)利要求29至32所述的MAR構(gòu)建體,其中(b)中所述至少一個DNA蛋白質(zhì)結(jié)合位點是一個TFBS,并且由1個、2個、3個、4個、5個或更多的取4戈、添力口和/或缺失力。以^f'務(wù)飾,并且/或者是全部或部分合成的。34.根據(jù)權(quán)利要求29至33所述的MAR構(gòu)建體,其中位于所述富含AT區(qū)傷'J翼的戶斤述TFBS#皮1個、2個、3個、4個、5個或更多的耳又^f戈、添加和/或在夾失^多飾。35.根據(jù)權(quán)利要求33或34所述的MAR構(gòu)建體,其中所述TFBS是無已知天然對應(yīng)物的一種優(yōu)化的TFBS。36.根據(jù)權(quán)利要求29至35所述的MAR構(gòu)建體,其中所述結(jié)合位點選自下組,其組成為SATB1、NMP4、HOX、HOXF、Gsh、CEBP、Fastl和SATB1或者這些轉(zhuǎn)錄因子中的兩種或多種的一個組合。37.根據(jù)權(quán)利要求29至36所述的MAR構(gòu)建體,其中(b)的所述DNA蛋白結(jié)合位點的一個系列是與(a)的所述核酸序列相鄰。38.才艮據(jù)權(quán)利要求29至37所述的MAR構(gòu)建體,其中所述MAR構(gòu)建體是一個增強的MAR構(gòu)建體。39.—種表達(dá)系統(tǒng),包括以上權(quán)利要求中任一項所述的至少一個MAR構(gòu)建體,并JU任選地5一個啟動子和至少一個限制性內(nèi)切酶結(jié)合位點,用于在所述啟動子控制下導(dǎo)入一個感興趣的核苷酸序列。40.—種細(xì)胞,包含以上權(quán)利要求中任一項所述的一個表達(dá)系統(tǒng)。41.一種轉(zhuǎn)基因非人類動物,包含以上權(quán)利要求中任一項所述的一個表達(dá)系統(tǒng)。42.—個試劑盒,包括以上權(quán)利要求中任一項所述的表達(dá)系統(tǒng),以及如何使用所述表達(dá)系統(tǒng)的說明。43.用于增強一種基因的表達(dá)的一種方法,包括在一種啟動子以及以上4又利要求中4壬一項所述的一種MAR構(gòu)建體的控制下提供包含所述基因的一種表達(dá)系統(tǒng);用所述表達(dá)系統(tǒng)轉(zhuǎn)染一種細(xì)胞,以增強所述基因的表達(dá)。44.根據(jù)權(quán)利要求43所述的一種方法,其中所述表達(dá)系統(tǒng)進(jìn)一步增強所述基因表達(dá)的穩(wěn)定性。45.以上權(quán)利要求中任一項所述的MAR構(gòu)建體、表達(dá)系統(tǒng)、轉(zhuǎn)基因非人類動物、試劑盒和/或方法在生產(chǎn)蛋白質(zhì)例如識別人病原體蛋白質(zhì)或人細(xì)胞表面蛋白質(zhì)的抗體,以及蛋白質(zhì)諸如促紅細(xì)胞生成素、干擾素或其他治療性或診斷性蛋白質(zhì)中的應(yīng)用。46.以上^又利要求中^f壬一項所述的MAR構(gòu)建體、表達(dá)系統(tǒng)、細(xì)月包、試劑盒和/或方法在體外和/或體內(nèi)基因治療和/或在細(xì)胞或組織替代療法中的應(yīng)用。全文摘要本發(fā)明披露了人類以及非人類動物來源的分離且純化的MAR序列以及對應(yīng)于或基于它們的核苷酸序列。特別地,本發(fā)明披露了具有較高轉(zhuǎn)錄和/或蛋白質(zhì)生成增強活性的MAR以及MAR構(gòu)建體以及用于鑒定這些MAR的方法、設(shè)計這些MAR構(gòu)建體的方法以及將其用于例如高產(chǎn)率的蛋白質(zhì)生產(chǎn)的方法。文檔編號C12N15/09GK101541959SQ200780029732公開日2009年9月23日申請日期2007年8月22日優(yōu)先權(quán)日2006年8月23日發(fā)明者亞歷山大·雷加梅,尼古拉斯·梅爾莫,戴維·卡拉布雷塞,皮埃爾·阿蘭·吉羅德,薩里內(nèi)·多尼內(nèi)利-阿羅佩申請人:思蘭克斯有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鹤壁市| 汶上县| 石泉县| 吉水县| 鹤庆县| 赣榆县| 酉阳| 习水县| 洛浦县| 临朐县| 莆田市| 乐安县| 错那县| 奎屯市| 濮阳县| 广宗县| 达拉特旗| 桦南县| 桦甸市| 外汇| 莎车县| 浪卡子县| 双柏县| 贺兰县| 遂宁市| 湘乡市| 凤冈县| 达尔| 抚顺县| 彰化市| 九龙县| 沁源县| 宜都市| 泗阳县| 大足县| 芮城县| 永康市| 蒙山县| 南投市| 苏州市| 河北省|