两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

通過載體構(gòu)建體與細胞dna的非同源重組來表達內(nèi)源基因的制作方法

文檔序號:452965閱讀:530來源:國知局

專利名稱::通過載體構(gòu)建體與細胞dna的非同源重組來表達內(nèi)源基因的制作方法
背景技術
:發(fā)明領域本發(fā)明的領域是通過原位重組法來活化基因表達或?qū)е禄蜻^表達。本發(fā)明涉及使內(nèi)源基因在細胞中以高于通??梢娪诩毎械乃竭M行表達。在一個活化基因表達的調(diào)控序列通過非同源或非法重組整合到細胞后該基因的表達被活化或提高。由于整合不需要導向序列,該方法能夠鑒定和表達用目前方法無法發(fā)現(xiàn)的基因。因此,可以由那種未被測序和實際上不知道其存在的以及已非常明確的基因獲得與人類疾病和發(fā)育相關的基因產(chǎn)物。所述方法提供了用于治療和診斷目的的這些基因的基因產(chǎn)物。相關現(xiàn)有技術鑒定和過表達與人類疾病相關的新基因是開發(fā)新的治療藥物的一個重要步驟。目前建立用于過表達蛋白質(zhì)的細胞文庫的方法是建立在制備和克隆cDNA的基礎上。因此,為了用這種方法鑒定新基因,必須在用于構(gòu)建文庫的細胞中表達該基因。該基因還必須以足以在文庫中以足夠量出現(xiàn)的水平表達。這其中是有疑問的,因為許多基因僅在少數(shù)細胞群中、或者在短暫的發(fā)育期間以極低的量表達。另外,由于某些mRNA的體積太大,很難或不可能制備能表達生物活性蛋白質(zhì)的全長cDNA分子。對于小mRNA也發(fā)現(xiàn)有缺少全長cDNA分子的情況,這被認為是與遺傳信息中那些難于通過反轉(zhuǎn)錄來制備的序列或者在細菌中的增殖期間不穩(wěn)定的序列有關。因此,即使最完整的cDNA文庫也只能表達全部可能基因組中的一部分。最后,許多cDNA文庫是在細菌載體中制備的,用這些載體來表達生物活性哺乳動物蛋白質(zhì)有很大的局限性,因為多數(shù)哺乳動物蛋白質(zhì)在細菌中不能正確地折疊和/或不恰當?shù)靥腔?。因此,建立一個更有代表性的表達蛋白質(zhì)的文庫的方法將非常有價值,該文庫能便于真實地表達生物活性蛋白質(zhì)。目前用于過表達蛋白質(zhì)的方法包括克隆目的基因,將其轉(zhuǎn)入一個構(gòu)建體,鄰接合適的啟動子/增強子、多腺苷酸化信號以及剪接位點,并將該構(gòu)建體導入適當?shù)乃拗骷毎R环N替代方法包括利用同源重組通過將一個強啟動子或其他調(diào)控序列靶定到預先確定的基因上來活化該基因的表達。WO90/14092描述了在哺乳動物細胞中,原位修復編碼目的蛋白質(zhì)的基因。該申請描述了用來對編碼目的蛋白質(zhì)的基因進行定點修飾的單鏈寡核苷酸。也可包括一個標記物。但是,這些方法局限于提供與靶位點有相當同源性的寡核苷酸序列。因此,所述方法需要已知通過定點修飾和同源重組進行活化所需要的位點。用這類方法不能發(fā)現(xiàn)新基因。WO91/06667描述了原位表達哺乳動物基因的方法。利用所述方法,通過同源重組將擴增基因?qū)肽康幕蜞徫?。然后在合適的培養(yǎng)基中培養(yǎng)細胞,擴增基因和目的基因均被擴增,目的基因表達增強。如上,導入擴增基因的方法限于同源重組,不能用來活化未知其序列或(存在)的新基因。WO91/01140描述了通過同源重組修飾細胞,從而使內(nèi)源基因失活。通過這些方法,同源重組被用來修飾和失活基因,并能制備可作為基因療法中的供體的細胞。WO92/20808描述了原位修飾基因組靶位點的方法。文中描述的是一些小修飾,例如在DNA中改變單個堿基。該方法依賴于利用用于導向的同源DNA進行基因組修飾。WO92/19255描述了一種通過同源重組來增強目的基因表達的方法,其中將一個DNA序列整合到基因組或大的基因組片段中。然后可以將被修飾的序列轉(zhuǎn)入次級宿主中進行表達??梢栽谀繕嘶蚺赃呎弦粋€擴增基因從而使目標區(qū)域可被擴增用于增強表達。同源重組是該定向方法所必須的。WO93/09222描述了通過活化編碼所需產(chǎn)物的內(nèi)源基因來制備蛋白質(zhì)的方法。通過同源重組并將通常與希望其表達的基因相聯(lián)的區(qū)域替換或失活來靶定調(diào)控區(qū)域。這一失活或替換導致基因以高于正常的水平表達。WO94/12650描述了一種活化內(nèi)源基因在細胞中原位表達和擴增的方法,其中所述基因在細胞中不表達或不以所需水平表達。用這樣的一個外源DNA序列轉(zhuǎn)染細胞,該序列修復、改變、缺失或替換細胞中存在的一段序列或者它是通常不與細胞中的內(nèi)源基因功能性地連接的調(diào)控序列。為了達到這一目的,用與基因組DNA序列在預選位點上同源的DNA序列來靶定內(nèi)源基因。另外,可以包括編碼選擇標記的擴增DNA。通過在選擇用于擴增的條件下培養(yǎng)同源重組細胞,內(nèi)源基因和擴增標記共擴增,并使基因表達提高。WO95/31560描述了用于同源重組的DNA構(gòu)建體。該構(gòu)建體包括一個靶定序列,一個調(diào)控序列、一個外顯子和一個未配對的剪接供體位點。通過構(gòu)建體與細胞內(nèi)的基因組序列之間的同源重組實現(xiàn)靶定,使得能在體外或體內(nèi)制備蛋白質(zhì)。WO96/29411描述了利用外源調(diào)控序列,通過同源重組將外源外顯子(編碼或非編碼)及剪接供體位點導入基因組中一個預先選定的位點。在此申請中,定位了所導入的DNA,從而使外源調(diào)控區(qū)域控制下的轉(zhuǎn)錄子包括存在于血小板生成素、DnaseⅠ或β-干擾素基因中的外源外顯子和內(nèi)源外顯子,從而得到其中外源和外源外顯子可操縱地連接在一起的轉(zhuǎn)錄子。這些新的轉(zhuǎn)錄單位是通過同源重組得到的。美國專利5272071描述了通過插入一個能增強細胞內(nèi)常規(guī)表達基因的表達水平的DNA調(diào)控元件使得該細胞內(nèi)的轉(zhuǎn)錄沉默基因發(fā)生轉(zhuǎn)錄活化。插入調(diào)控元件使得它與正常情況下沉默的基因可操縱地連接在一起。借助同源重組以下述方式來實現(xiàn)插入用通常情況下沉默的基因的一個片段(靶向DNA)和用來誘導所需轉(zhuǎn)錄的DNA調(diào)控元件來建立DNA構(gòu)建體。美國專利5578461討論了通過同源重組活化哺乳動物目的基因表達。將一個DNA序列整合到基因組或一個大基因組片段中來增強目的基因的表達。然后可以將該修飾過的構(gòu)建體轉(zhuǎn)入次級宿主中??梢栽谀康幕蜞徑幷弦粋€擴增基因從而使目的區(qū)域發(fā)生擴增以實現(xiàn)增強表達。上述兩種方法(通過克隆或通過體內(nèi)同源重組構(gòu)建過表達構(gòu)建體)均要求在其可被過表達之前將基因克隆并測序。另外,利用同源重組,還必須要知道基因組序列和結(jié)構(gòu)。不幸的是,許多基因還未被鑒定和/或測序。因此,無論目的基因是否以前已被克隆、其序列和結(jié)構(gòu)是否已知,用于過表達該基因的方法將十分有用。發(fā)明簡述因此,本發(fā)明一般性地涉及在細胞內(nèi)過表達內(nèi)源基因的方法,所述方法包括將含有轉(zhuǎn)錄調(diào)控序列的載體導入細胞,使載體通過非同源重組整合到該細胞的基因組中,使內(nèi)源基因在細胞內(nèi)過表達。該方法不需要預先已知內(nèi)源基因的序列,甚至不需要知道它的其存在。本發(fā)明還包括用于經(jīng)非同源重組來活化基因的表達或過表達基因的新載體構(gòu)建體。該新構(gòu)建體不含同源導向序列。這就是說,它不含有這樣一些核苷酸序列,該序列靶定宿主細胞DNA并促進在靶位點進行內(nèi)源重組,從而導致細胞基因借助所導入的轉(zhuǎn)錄調(diào)控序列而過表達。新載體構(gòu)建體包括這樣的載體,它含有與一個未配對的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,并還含有1或多個擴增標記。新載體構(gòu)建體包括下列構(gòu)建體具有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、分泌信號序列以及未配對的剪接供體位點可操縱地連接在一起;具有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、表位標記以及未配對的剪接供體位點可操縱地連接在一起;含有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、信號序列和表位標記以及未配對的剪接供體位點可操縱地連接在一起;含有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、分泌信號序列、表位標記以及序列特異的蛋白酶位點和未配對的剪接供體位點可操縱地連接在一起。載體構(gòu)建體可以含有1或多個用于挑選重組宿主細胞的選擇標記。可選擇地,可通過由活化內(nèi)源基因產(chǎn)物提供的性狀的表型選擇來實現(xiàn)挑選。這些載體,和實際上本文公開的任何載體,以及本領域技術人員很容易想到這些載體的變異體可被用于在本文公開的任何方法中配制可由這些方法制備的任何組合物。用于本發(fā)明載體構(gòu)建體中的轉(zhuǎn)錄調(diào)控序列包括,但不限于啟動子。在優(yōu)選實施方案中,所述啟動子是一個病毒啟動子。在更優(yōu)選的實施方案中,病毒啟動子是巨細胞病毒立即早期啟動子。在另一個具體實施方案中,啟動子是細胞非病毒啟動子或誘導型啟動子。用于本發(fā)明載體構(gòu)建體中的轉(zhuǎn)錄調(diào)控序列也可以包括,但不限于增強子。在優(yōu)選實施方案中,所述增強子是病毒增強子。在更優(yōu)選的實施方案中,該病毒增強子是巨細胞病毒立即早期增強子。在另一個具體實施方案中,增強子是細胞非病毒增強子。在文中公開的方法的優(yōu)選實施方案中,載體構(gòu)建體是,或者可以含有線性RNA或DNA??梢院Y選基因表達的含有載體的細胞??梢杂隗w外在利于由細胞產(chǎn)生預期量內(nèi)源基因的基因產(chǎn)物(文中又可互換地稱為“表達產(chǎn)物”)的條件下,培養(yǎng)過表達所述基因的細胞,其中該內(nèi)源基因已被活化或其表達已提高。然后可分離并純化表達產(chǎn)物,用來進行如蛋白質(zhì)治療或發(fā)現(xiàn)藥物。另一方面,使表達所需基因產(chǎn)物的細胞在體內(nèi)表達基因產(chǎn)物。在本發(fā)明這些具體方面,在利于基因被真核生物體內(nèi)細胞進行過表達或活化的條件下,可以將含有本發(fā)明所述載體構(gòu)建體(已整合到其基因組中)的細胞導入真核生物(比如脊椎動物,尤其是哺乳動物,更特別是人)。在本發(fā)明這些相關方面,可以在將細胞導入真核生物之前將其分離和克隆。本發(fā)明還涉及在細胞內(nèi)過表達內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和1或多個擴增標記的載體導入細胞,使載體通過非同源重組整合到細胞基因組中,使內(nèi)源基因在細胞內(nèi)過表達。可以篩選過表達所述基因的含有載體的細胞。培養(yǎng)過表達基因的細胞,從而獲得內(nèi)源基因的擴增。然后可以體外培養(yǎng)細胞來制備已發(fā)生擴增的內(nèi)源基因的預期量基因產(chǎn)物,其中所述內(nèi)源基因已被活化或者其表達已提高。然后可以分離并純化基因產(chǎn)物??蛇x擇地,擴增之后,可令細胞在體內(nèi)表達內(nèi)源基因并產(chǎn)生預期量基因產(chǎn)物。但是應當明白,任何用于文中所述方法的載體可以包括1或多個擴增標記。因此,在細胞內(nèi),載體和目的DNA(即含有被過表達的基因的DNA)都被擴增,并獲得內(nèi)源基因進一步增強的表達。與此相應,所述方法可以包括一個擴增內(nèi)源基因的步驟。本發(fā)明還涉及在細胞內(nèi)過表達內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和未配對剪接供體序列的載體導入細胞,使載體經(jīng)非同源重組整合到細胞基因組中,在細胞中過表達所述內(nèi)源基因。可以篩選基因表達的含有載體的細胞。可以在體外培養(yǎng)過表達基因的細胞以便制備預期量的其表達已被活化或提高的基因的基因產(chǎn)物。然后可以分離并純化所述基因產(chǎn)物??蛇x擇地,可令細胞在體內(nèi)表達所需基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和1或多個擴增標記。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和剪接供體序列。本發(fā)明的任何載體構(gòu)建體還可以包含分泌信號序列。分泌信號序列被安排在構(gòu)建體中,這樣它將與被活化的內(nèi)源蛋白可操縱地連接在一起。因此,目的蛋白質(zhì)會在細胞內(nèi)發(fā)生分泌,方便了該蛋白質(zhì)的純化。與此相應,所述方法可以包括一個使蛋白質(zhì)表達產(chǎn)物從細胞中分泌出來的步驟。本發(fā)明還包括通過任何上述方法制得的細胞。本發(fā)明包括含有所述載體構(gòu)建體的細胞、其中的載體構(gòu)建體已整合到細胞基因組中的細胞、以及由內(nèi)源基因在所導入的轉(zhuǎn)錄調(diào)控序列的引導下過表達所需基因產(chǎn)物的細胞??蓪⒓毎蛛x并克隆。可以在任何真核生物來源(比如真菌、植物或動物)的細胞內(nèi)實施所述方法。在優(yōu)選實施方案中,可以在脊椎動物細胞內(nèi)尤其是哺乳動物細胞(包括但不限于大鼠、小鼠、牛、豬、綿羊、山羊和人細胞,更特別是在人細胞中)中實施本發(fā)明的方法。通過上述方法制得的單個細胞可以過表達單個基因或多個基因。可以通過將單一類型的構(gòu)建體整合到基因組中的多個位置來活化細胞內(nèi)的多個基因。類似地,可以通過將多重構(gòu)建體(即多個類型的構(gòu)建體)整合到基因組中的多個位置來活化細胞內(nèi)的多個基因。因此,一個細胞可以只含一類載體構(gòu)建體或不同類型的載體構(gòu)建體,每個均能活化一個內(nèi)源基因。本發(fā)明還涉及通過下列一或多項,制備上述細胞的方法將本發(fā)明的一或多個載體構(gòu)建體導入細胞;使導入的構(gòu)建體通過非同源重組整合到細胞基因組中;在細胞內(nèi)過表達一或多個內(nèi)源基因;分離和克隆細胞。本發(fā)明還涉及由這些方法制得的細胞,其中該細胞可能是分離的細胞。本發(fā)明還包括利用上述細胞來過表達基因(比如內(nèi)源的細胞基因)的方法,所述基因已被鑒定(例如,已測序)、未鑒定(例如,一個功能已知但未被克隆或測序的基因),或是在過表達之前,不知道其存在的基因。可以用細胞來在體外或體內(nèi)制備預期量的表達產(chǎn)物。如果必要,可以隨后通過例如裂解細胞或從生長培養(yǎng)基中分離(當載體含有分泌信號序列時)來分離并純化該表達產(chǎn)物。本發(fā)明還包括由上述方法制得的細胞文庫。每個文庫可以包括得自一次轉(zhuǎn)染實驗的所有克隆或得自一次轉(zhuǎn)染實驗的一個亞組的克隆。所述亞組可以過表達相同的基因或多個基因,例如,一類基因。轉(zhuǎn)染可以用單個構(gòu)建體或多個構(gòu)建體進行??梢酝ㄟ^將得自兩次或多次轉(zhuǎn)染實驗的所有重組細胞合并、將得自一次轉(zhuǎn)染實驗的1或多個細胞亞組合并、或者將得自不同轉(zhuǎn)染實驗的細胞亞組合并從而形成所述文庫。所得文庫可以表達相同的基因或多個基因,例如一類基因。同樣,在每次轉(zhuǎn)染中,可以使用單個構(gòu)建體或多個構(gòu)建體。文庫可由相同或不同的細胞類型構(gòu)成。本發(fā)明還涉及通過從相同或不同轉(zhuǎn)染實驗中挑選各種細胞亞組來制備文庫的方法。本發(fā)明還涉及利用上述細胞或細胞文庫來過表達或活化內(nèi)源基因的方法,或者獲得這些過表達或活化基因的基因表達產(chǎn)物的方法。根據(jù)本發(fā)明的這一方面,可以篩選細胞或細胞文庫來表達某因,并可挑選出能表達所需基因產(chǎn)物的細胞。然后用這些細胞來分離或純化用于后續(xù)用途的基因產(chǎn)物??梢酝ㄟ^下述方式在細胞內(nèi)進行表達在有利于由細胞產(chǎn)生內(nèi)源基因的表達產(chǎn)物的條件下體外培養(yǎng)所述細胞,或者使細胞在體內(nèi)表達基因。在本發(fā)明的優(yōu)選實施方案中,所述方法包括一個分離或純化表達產(chǎn)物的過程。在非常優(yōu)選的實施方案中,培養(yǎng)能表達內(nèi)源基因產(chǎn)物的細胞,培養(yǎng)條件為有利于產(chǎn)生足夠量的基因產(chǎn)物以便用于商業(yè)應用,尤其是診斷、治療和藥物開發(fā)等用途。任何上述方法都可進一步包括在載體整合之前或同時,向細胞的基因組DNA導入雙鏈斷裂片段。根據(jù)以下附圖和說明書及權(quán)利要求,本發(fā)明的其它優(yōu)選實施方案對本領域普通技術人員是顯而易見的。附圖簡述圖1.本文所述基因活化過程的示意圖。將活化構(gòu)建體轉(zhuǎn)染到細胞內(nèi),并使其在DNA斷裂處整合到宿主細胞染色體中。如果斷裂發(fā)生在目的基因的上游(例如Epo),并且合適的活化構(gòu)建體在斷裂處整合,這樣調(diào)控序列與目的基因可操縱地連接在一起,基因就被活化。轉(zhuǎn)錄和剪接產(chǎn)生嵌合RNA分子,該分子含有來自活化構(gòu)建體和內(nèi)源基因的外顯子序列。隨后的翻譯將產(chǎn)生目的蛋白質(zhì)。將重組細胞分離后,可以進一步借助基因擴增來增強基因表達。圖2.非翻譯活化構(gòu)建體的示意圖。箭頭代表啟動子序列。外顯子序列表示為開放盒,S/D表示剪接供體序列。與下面說明對應的構(gòu)建體編號示于左邊。選擇和擴增標記未示出。圖3.翻譯活化構(gòu)建體的示意圖,箭頭代表啟動子序列。外顯子序列表示為開放盒,S/D表示剪接供體序列。翻譯的信號肽、表位標記以及蛋白酶切割序列示于構(gòu)建體下的圖標中。與下面說明對應的構(gòu)建體編號示于左邊。選擇和擴增標記未示出。圖4.能活化內(nèi)源基因的活化構(gòu)建體的示意圖。圖5A-5D.pRIG8R1-CD2的核苷酸序列(SEQIDNO7)。圖6A-6C.pRIG8R2-CD2的核苷酸序列(SEQIDNO8)。圖7A-7C.pRIG8R3-CD2的核苷酸序列(SEQIDNO9)。發(fā)明詳述通過非同源重組活化基因大大優(yōu)于其它基因活化方法。與以前蛋白質(zhì)過表達不同,本文描述的方法不需克隆(從細胞中分離出來)目的基因。它們也不需了解將要過表達的基因的DNA序列或結(jié)構(gòu)(即ORF、內(nèi)含子、外顯子或上游和下游調(diào)控元件的序列)或該基因的表達方式(即組織特異性、發(fā)育調(diào)控等)。另外,這些方法不需要有關目的基因的基因結(jié)構(gòu)(即內(nèi)含子和外顯子結(jié)構(gòu))的知識。因此,本發(fā)明的方法涉及載體構(gòu)建體,其中該載體構(gòu)建體不含有用于同源重組的靶核苷酸序列。靶序列能使載體DNA與細胞DNA在細胞DNA上的預定位點進行同源重組,所述位點與載體中的序列具有同源性,在預定位點發(fā)生的同源重組導致轉(zhuǎn)錄調(diào)控序列被導入基因組,內(nèi)源基因隨即被活化。本發(fā)明的方法不包括載體在預定位點處整合。相反,本方法涉及本發(fā)明的載體構(gòu)建體通過非同源或“非法重組”整合到細胞DNA(例如,細胞基因組)中。本文中描述的載體不含靶序列。靶序列是載體上的這樣一個序列,它與待活化的基因內(nèi)部的或者其上游的一或多個序列同源,其中上游區(qū)域到達并且包括目的基因相同的編碼鏈上第一個功能剪接受體位點,借助該同源性,將能活化目的基因的轉(zhuǎn)錄調(diào)控序列整合到含有待活化基因的細胞的基因組中。在用增強子整合載體來活化內(nèi)源基因的情況中,在增強子能起到作用的距離內(nèi),所述載體不與目的基因的基因組的上游或下游(或在目的基因內(nèi)部)的任何序列有同源性。因此這些方法能夠鑒定到那些已被或可能被常規(guī)和現(xiàn)有克隆技術丟失的新基因。利用本文描述的構(gòu)建體和方法,可以快速鑒定未知和/或未鑒定的基因,并使其過表達以產(chǎn)生蛋白質(zhì)。這些蛋白質(zhì)的用途包括人類治療和診斷,及作為藥物開發(fā)的靶。所述方法還能用于已知和/或已鑒定基因的過表達,以便體外或體內(nèi)制備蛋白質(zhì)。“已知基因”涉及基因的鑒定水平。本發(fā)明能表達已被鑒定和未被鑒定的基因。不同程度的鑒定都是可能的。這些包括詳細的鑒定,比如克隆、DNA、RNA和/或蛋白質(zhì)測序,以及確定基因的調(diào)控和功能與克隆序列的關系(例如,識別啟動子和增強子序列、開放讀碼框的功能,內(nèi)含子等)。鑒定可以較粗略,比如將基因和相關功能作圖,或得到部分氨基酸序列或核苷酸序列,或已將蛋白質(zhì)純化并確定了功能。鑒定可能是極基本的,如已知核苷酸或氨基酸序列或者已將蛋白質(zhì)分離,但功能未知??蛇x擇地,功能可能是已知的,但相關的蛋白質(zhì)或核苷酸序列未知,或者雖然知道序列但沒有與功能建立聯(lián)系。最后,也可能沒有做任何鑒定,因為基因的存在及其功能均是未知的。本發(fā)明可以在任何上述或其它具體的鑒定程度的水平上表達任何基因。利用一個活化構(gòu)建體并在一組轉(zhuǎn)染中可以活化或過表達許多不同蛋白質(zhì)(在本文中還可互換地稱為“基因產(chǎn)物”或“表達產(chǎn)物”)。因此,在用相同或不同構(gòu)建體轉(zhuǎn)染之后,一組轉(zhuǎn)染子(文庫)中的一個細胞或不同細胞可以過表達多個蛋白質(zhì)。而以前的活化方法要求給每個待活化基因建立一個獨特的構(gòu)建體。此外,利用一個構(gòu)建體可以同時形成和檢測一個基因附近的許多不同整合位點。這就使得能快速確定用于蛋白質(zhì)表達的活化構(gòu)建體的最佳基因組位置。利用以前的方法,對于目的基因5’端的序列和結(jié)構(gòu)必須做廣泛的鑒定。必須給每個要制備的活化構(gòu)建體分離一個合適的靶序列。通常,靶序列必須是分離自與待活化細胞相同的人或動物實驗株的純合序列。在某些情下,該DNA可能是來自目的基因的50kb或更長片段。因此,制備每個導向構(gòu)建體要對內(nèi)源基因進行大量克隆和測序工作。而因為本發(fā)明的方法不需要序列和結(jié)構(gòu)信息,可以活化未知基因和帶有未做鑒定的上游區(qū)域的基因。這就有可能利用內(nèi)源DNA序列與胞內(nèi)DNA進行的非同源重組做原位基因活化。本發(fā)明即提供了利用非同源重組實現(xiàn)的這種原位基因活化所需的方法和組分(例如,載體構(gòu)建體)。DNA分子可以通過幾種不同的獨立機制發(fā)生重組從而重新分配其遺傳內(nèi)容,所述機制包括同源重組、位點特異性重組、以及非同源/非法重組。同源重組涉及那些序列極其類似的DNA片段之間的重組、已經(jīng)證實,同源重組涉及在遺傳物重新分配之前,同源序列沿其鏈形成配對。交叉的確切位點可以是同源片段中的任何位點。重組效率與同源導向序列的長度(Hope,發(fā)育113399(1991);Reddy等,病毒學雜志651507(1991))、兩個發(fā)生重組的序列之間的序列相同程度(VonMelchner等,基因進展6919(1992))、以及構(gòu)建體中同源與非同源DNA的比率(Letson,遺傳學117759(1987))成比例。另一方面,位點特異性重組涉及遺傳物質(zhì)在預定位點(由特異DNA序列決定)的交換。在該反應中,蛋白質(zhì)重組酶結(jié)合到重組信號序列上,形成一個鏈斷裂,并促進DNA鏈交換。Cre/Lox重組就是位點特異性重組的實例。非同源/非法重組,比如本發(fā)明的方法有利地所采用的,包括沒有顯著序列同源性的遺傳物質(zhì)的連接(交換或重新分配)并且不是發(fā)生在位點特異性重組序列處。非同源重組的例子包括外源DNA在非同源位點整合到染色體中、染色體易位和缺失,DNA末端連接,染色體末端的雙鏈斷裂修復,橋裂合以及轉(zhuǎn)染序列的連環(huán)化。在多數(shù)情況中,認為非同源重組是通過“游離DNA未端”的連接發(fā)生的。游離末端是這樣的DNA分子,它含有一個能夠與第二個DNA末端直接連接、或者在修復或加工后與第二個DNA末端連接的末端。該DNA末端可能含有5′突出端,3′突出端,或者平末端。在本文中,可以廣泛地將逆轉(zhuǎn)錄病毒插入和其它轉(zhuǎn)座反應看作是非同源重組。這些反應不涉及利用發(fā)生重組的分子間的同源性。而且,與位點特異性重組不同,這些類型的重組反應不是在離散位點之間進行的。相反,僅在重組配偶體(即,逆轉(zhuǎn)錄病毒或轉(zhuǎn)座子)之一上需要有特異蛋白質(zhì)/DNA復合體,而第二個DNA配偶體(即,細胞基因組)通常是相當非特異性的。結(jié)果,這些“載體”不是以定向方式整合到細胞基因組,因此可以根據(jù)本發(fā)明用它們來遞送活化構(gòu)建體??捎糜诒疚乃龇椒ǖ妮d體構(gòu)建體理想情況下可以含有一個轉(zhuǎn)錄調(diào)控序列,它與細胞內(nèi)的基因組序列發(fā)生非同源重組從而在該細胞內(nèi)過表達內(nèi)源基因。本發(fā)明的載體構(gòu)建體還缺少同源靶序列。即,它們不含有靶定宿主細胞DNA并促進在靶位點處發(fā)生同源重組的DNA序列。因此,本發(fā)明的載體構(gòu)建體通過非同源重組整合到細胞基因組中,并借助所導入的包含在整合進來的載體構(gòu)建體中的轉(zhuǎn)錄調(diào)控序列來過表達細胞基因。本發(fā)明一般性地涉及用于在細胞內(nèi)過表達內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列的載體導入細胞中,使載體通過非同源重組整合到細胞基因組中,使內(nèi)源基因在細胞內(nèi)過表達。該方法不需要預先了解內(nèi)源基因的序列甚至其存在。而在待活化基因序列已知的情況下,可以將構(gòu)建體改造為含有合適的載體元件構(gòu)型(例如,起始密碼子的位置,內(nèi)源基因的第一個外顯子中存在的附加密碼子、以及合適的讀框)從而獲得最大程度的過表達和/或適當?shù)牡鞍踪|(zhì)序列。在本發(fā)明的某些實施方案中,可以篩選基因表達的含有載體的細胞??梢泽w外培養(yǎng)過表達所述基因的細胞,培養(yǎng)條件為有利于該細胞產(chǎn)生那些已被活化或其表達已提高的內(nèi)源基因的預期量的基因產(chǎn)物。如果需要,可以隨后將基因產(chǎn)物分離或純化以便用于,例如,蛋白質(zhì)療法或藥物開發(fā)??蛇x擇地,可以將表達所需基因產(chǎn)物的細胞在體內(nèi)表達所述基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列。可選擇地,所述載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和1或多個擴增標記。因此,本發(fā)明還涉及在細胞內(nèi)過表達內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和擴增標記的載體導入細胞中,使載體通過非同源重組整合到細胞基因組中,使內(nèi)源基因在細胞內(nèi)過表達。篩選過表達所述基因的含有載體的細胞。培養(yǎng)過表達所述基因的細胞從而使內(nèi)源基因的擴增。然后將細胞體外培養(yǎng)從而得到擴增后的內(nèi)源基因的預期量基因產(chǎn)物,該內(nèi)源基因已被活化,或者其表達已提高,然后可以對基因產(chǎn)物進行分離和純化。可選擇地,擴增后,使細胞在體內(nèi)表達內(nèi)源基因并產(chǎn)生預期量基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和剪接供體序列。因此,本發(fā)明還涉及在細胞內(nèi)過表達內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和未配對的剪接供體序列的載體導入細胞中,使載體通過非同源重組整合到細胞基因組中,使內(nèi)源基因在細胞內(nèi)過表達。篩選表達所述基因的含有載體的細胞。體外培養(yǎng)過表達基因的細胞從而得到預期量的內(nèi)源基因的基因產(chǎn)物,該內(nèi)源基因的表達已被活化,或者其表達已提高,然后可以對基因產(chǎn)物進行分離和純化??蛇x擇地,可以使細胞在體內(nèi)表達所需基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有可操縱地連接到未配對剪接供體序列的轉(zhuǎn)錄調(diào)控序列,并且還含有擴增標記。其它活化載體包括下列一些構(gòu)建體具有轉(zhuǎn)錄調(diào)控序列和含有起始密碼子的外顯子序列的構(gòu)建體;具有轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子及分泌信號序列的外顯子序列的構(gòu)建體;具有轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子及表位標記的外顯子序列的構(gòu)建體;具有轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子、信號序列及表位標記的外顯子序列的構(gòu)建體;包含轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子、分泌信號序列、表位標記及序列特異性蛋白酶位點的外顯子序列的構(gòu)建體。在上述每個構(gòu)建體中,構(gòu)建體上的外顯子緊鄰未配對的剪接供體位點的上游。構(gòu)建體還可以含有調(diào)控序列、缺少polyA信號的選擇標記、內(nèi)部核糖體進入位點(ires)以及未配對的剪接供體位點(圖4)。任選在ires和未配對的剪接供體位點之間包括起始密碼子、分泌信號序列、表位標記、和/或蛋白酶切割位點。當該構(gòu)建體整合到基因上游時,由于內(nèi)源基因可以提供一個polyA位點,選擇標記可以被有效地表達。此外,下游基因也被表達,因為ires使得在下游開放讀框(即內(nèi)源基因)處開始進行蛋白質(zhì)翻譯。因此,由該活化構(gòu)建體產(chǎn)生的信息是多順反子的。該構(gòu)建體的優(yōu)點在于整合事件不在基因附近進行,并且適當取向,不會產(chǎn)生抗藥性集落。其原因是沒有polyA尾部(內(nèi)源基因所提供的),新霉素抗性基因不能有效地表達。通過減少無效整合的次數(shù),可以在不影響其覆蓋面(被活化的基因的數(shù)量)的情況下,降低文庫的復雜程度,這能便利篩選過程。在所述構(gòu)建體的另一個實施方案中,可以在調(diào)控序列和neo起始密碼子之間以及ires和未配對的剪接供體位點之間(在ires和起始密碼子(如果有)之間)包括上crx-lox重組序列。分離出其目的基因已被活化的細胞后,可以用編碼cre重組酶的質(zhì)粒轉(zhuǎn)染該細胞,從而除去neo基因和ires。這能消除多順反子信息,使得內(nèi)源基因直接從被整合上來的活化構(gòu)建體上的調(diào)控序列進行表達。利用Cre重組來協(xié)助從哺乳動物染色體上缺失遺傳元件已有描述(Gu等,科學265103(1994);Sauer,酶學方法225890-900(1993))。因此,可用于本文描述的方法的構(gòu)建體包括,但不限于,下列構(gòu)建體(見圖1-4)1)具有調(diào)控序列和缺少翻譯起始密碼子的外顯子的構(gòu)建體。2)具有調(diào)控序列和缺少翻譯起始密碼子的外顯子,其后是剪接供體位點的構(gòu)建體。3)具有調(diào)控序列和讀碼框1(相對剪接供體位點而言)中含有翻譯起始密碼子的外顯子,其后是未配對剪接供體位點的構(gòu)建體。4)具有調(diào)控序列和讀碼框2(相對剪接供體位點而言)中含有翻譯起始密碼子的外顯子,其后是未配對剪接供體位點的構(gòu)建體。5)具有調(diào)控序列和讀碼框3(相對剪接供體位點而言)中含有翻譯起始密碼子的外顯子,其后是未配對剪接供體位點的構(gòu)建體。6)具有調(diào)控序列以及讀碼框1(相對剪接供體位點而言)中含有翻譯起始密碼子和分泌信號序列的外顯子,其后是未配對剪接供體位點的構(gòu)建體。7)具有調(diào)控序列以及讀碼框2(相對剪接供體位點而言)中含有翻譯起始密碼子和分泌信號序列的外顯子,其后是未配對剪接供體位點的構(gòu)建體。8)具有調(diào)控序列以及讀碼框3(相對剪接供體位點而言)中含有翻譯起始密碼子和分泌信號序列的外顯子,其后是未配對剪接供體位點的構(gòu)建體。9)具有調(diào)控序列以及讀碼框1(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子和表位標記的外顯子,其后是未配對剪接供體位點的構(gòu)建體。10)具有調(diào)控序列以及讀碼框2(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子和表位標記的外顯子,其后是未配對剪接供體位點的構(gòu)建體。11)具有調(diào)控序列以及讀碼框3(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子和表位標記的外顯子,其后是未配對剪接供體位點的構(gòu)建體。12)具有調(diào)控序列以及讀碼框1(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號序列和表位標記的外顯子,其后是未配對剪接供體位點的構(gòu)建體。13)具有調(diào)控序列以及讀碼框2(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號序列和表位標記的外顯子,其后是未配對剪接供體位點的構(gòu)建體。14)具有調(diào)控序列以及讀碼框3(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號序列和表位標記的外顯子,其后是未配對剪接供體位點的構(gòu)建體。15)具有調(diào)控序列以及讀碼框1(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號序列、表位標記和序列特異的蛋白酶位點的外顯子,其后是未配對剪接供體位點的構(gòu)建體。16)具有調(diào)控序列以及讀碼框2(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號序列、表位標記和序列特異的蛋白酶位點的外顯子,其后是未配對剪接供體位點的構(gòu)建體。17)具有調(diào)控序列以及讀碼框3(相對剪接供體位點而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號序列、表位標記和序列特異的蛋白酶位點的外顯子,其后是未配對剪接供體位點的構(gòu)建體。18)具有與選擇標記連接在一起的調(diào)控序列,其后是內(nèi)部核糖體進入位點和未配對剪接供體位點的構(gòu)建體。19)構(gòu)建體18,其中cre/lox重組信號位于a)調(diào)控序列和選擇標記的開放讀碼框之間以及b)ires和未配對剪接供體位點之間。20)具有調(diào)控序列,該序列與含有缺少終止密碼子的綠色熒光蛋白的外顯子可操縱地連接在一起,其后是未配對剪接供體位點的構(gòu)建體。但是應當明白,任何用于文中所述方法的載體可以包括一或多個(即,1、2、3、4、5或更多,最優(yōu)選1或2個)擴增標記。與此相應,所述方法可以包括一個擴增內(nèi)源基因的步驟。在活化構(gòu)建體上插入一或多個擴增標記使得在被活化細胞中,目的基因與一或多個擴增標記并列。一旦分離出被活化細胞,可以通過挑選這樣一些細胞進一步提供表達,所述細胞包含帶有目的基因和活化構(gòu)建體的基因座拷貝數(shù)增加??梢酝ㄟ^本領域已知的挑選方染來實現(xiàn)這一目的,例如在含有1或多種選擇試劑的選擇培養(yǎng)基上培養(yǎng)細胞,其中所述選擇試劑對基因構(gòu)建體或載體上含有的1或多個擴增標記有特異性。經(jīng)上述任何載體的非同源整合使內(nèi)源基因活化后,可以通過挑選位于整合載體中的拷貝數(shù)增加的擴增標記來進一步提高內(nèi)源基因的表達。雖然可以用整合載體上的一個擴增標記來實施該方法,但在本發(fā)明的替代實施方案中,提供了這樣的方法,其中載體可包含2或多個(即2、3、4、5或更多,最優(yōu)選2個)擴增標記來協(xié)助更有效地挑選出那些載體和旁側(cè)目的基因均被擴增的細胞。這種方案對于某些細胞尤其有用,所述細胞有載體上所含的一或多個擴增標記的一個功能性內(nèi)源拷貝,因為選擇步驟可以分離出那些不正確地擴增了內(nèi)源擴增標記,而不是載體編碼的擴增標記的細胞。該方法也可用于淘汰那些通過不涉及基因擴增的機制對選擇試劑產(chǎn)生抗性的細胞。在這些情況下,使用兩或多種擴增標記的方法是有益的,因為一個細胞在沒有擴增整合載體和旁側(cè)目的基因的情況下,對兩或多種選擇試劑產(chǎn)生抗性的可能性顯著低于細胞對任何一種選擇試劑產(chǎn)生抗性的可能性。因此,通過同時或連續(xù)選擇兩或多個載體編碼的擴增標記,將有更大百分比的最后分離到的細胞含有被擴增的載體和目的基因。因此,在另一個實施方案中,本發(fā)明的載體可以含有兩或多種(即2,3,4,5,或更多,最優(yōu)選2種)擴增標記,該方法能夠在活化表達后更有效地擴增載體序列和鄰近的目的基因??梢杂糜跇?gòu)建所述載體的擴增標記的例子包括,但不限于二氫葉酸還原酶、腺苷脫氨酶、天冬氨酸轉(zhuǎn)氨甲酰酶、二氫乳清酸酶以及氨甲酰磷酸合成酶。還應當明白,本文所述的任何構(gòu)建體可以含有真核生物病毒的復制起點替代擴增標記或與其相連。病毒復制起點的存在使得整合載體和相鄰的內(nèi)源基因作為游離體分離和/或在導入適當?shù)牟《緩椭频鞍踪|(zhì)的情況下,擴增到高拷貝數(shù)。有用的病毒起點的例子包括,但不限于SV40ori和EBVoriP。本發(fā)明還包括一些實施方案,其中本文公開的構(gòu)建體本質(zhì)上含有以上具體描述的用于這些構(gòu)建體的成分。還應當明白,上述構(gòu)建體是可以用于本文所述方法的構(gòu)建體的例子,而本發(fā)明包括這些構(gòu)建體的功能等同物。術語“載體”應理解為一般性地指將核苷酸序列導入細胞中的運載物。它并不試圖限定到任何具體序列。載體本身可以是活化內(nèi)源基因的核苷酸序列或者可以含有活化內(nèi)源基因的序列。因此,載體可以僅是一個本質(zhì)上只含有活化所需的序列的線形成環(huán)形多核苷酸,或者可以是存在于較大多核苷酸中的這些序列或者其它構(gòu)建體,比如一個DNA或RNA病毒基因組、完整的毒?;蚱渌脕韺㈥P鍵核苷酸或其它序列導入細胞中的生物構(gòu)建體。載體可以含有天然存在的或者是通過基因工程或合成法制得的DNA序列。當構(gòu)建體非同源整合到細胞基因組中時,其能夠活化內(nèi)源基因的表達。內(nèi)源基因的表達可能產(chǎn)生全長蛋白質(zhì),或產(chǎn)生內(nèi)源蛋白質(zhì)的截短的生物活性形態(tài),這取決于整合位點(如在上游區(qū)域還是內(nèi)含子2)。被活化的基因可以是已知基因(例如,已被克隆或鑒定的)或未知基因(未被克隆或鑒定的),基因的功能可以是已知或未知的?;钚砸阎牡鞍踪|(zhì)的例子包括,但不限于,細胞因子、生長因子、神經(jīng)遞質(zhì)、酶、結(jié)構(gòu)蛋白質(zhì)、細胞表面受體,胞內(nèi)受體、激素、抗體以及轉(zhuǎn)錄因子??梢杂帽痉椒ㄖ苽涞囊阎鞍踪|(zhì)的具體例子包括,但不限于,紅細胞生成素、胰島素、生長激素、葡糖腦苷脂酶,組織纖溶酶原活化物、粒細胞集落刺激因子(G-CSF)、粒細胞/巨噬細胞集落刺激因子(GM-CSF)、干擾素α、干擾素β、干擾素δ,白介素-2、白介素-3、白介素-4、白介素-6、白介素-8、白介素-10、白介素-11、白介素-12、白介素-13、白介素-14、TGF-β,凝血因子Ⅴ,凝血因子-Ⅶ、凝血因子-Ⅷ、凝血因子-Ⅸ、凝血因子-Ⅹ、TSH-β、骨骼生長因子-2、骨骼生長因子-7,腫瘤壞死因子、α-Ⅰ抗胰蛋白酶、抗凝血酶Ⅲ,白血病抑制因子、胰高血糖素、蛋白C、蛋白激酶C、巨噬細胞集落刺激因子(M-CSF)、干細胞因子、促卵泡激素β、尿激酶、神經(jīng)生長因子、類胰島素生長因子、促胰島素、甲狀旁腺激素、乳鐵蛋白、補體抑制因子、血小板衍生生長因子,角質(zhì)細胞生長因子、肝細胞生長因子、內(nèi)皮細胞生長因子、神經(jīng)營養(yǎng)蛋白-3、血小板生成素、絨膜促性腺激素、凝血調(diào)節(jié)蛋白、α糖苷、表皮生長因子以及成纖維細胞生長因子。本發(fā)明還能活化許多表達跨膜蛋白質(zhì)的基因,并制備和分離這些蛋白質(zhì),它們包括但不限于生長因子的細胞表面受體、激素、神經(jīng)遞質(zhì)和細胞因子如上面描述的那些、跨膜離子通道、膽固醇受體、脂蛋白(包括LDL和HDL)和其它類脂部分的受體、整合蛋白和其它胞外基質(zhì)受體、細胞骨架錨蛋白、免疫球蛋白受體、CD抗原(包括CD2、CD3、CD4、CD8和CD34抗原),以及其它本領域已知的細胞表面跨膜的結(jié)構(gòu)和功能蛋白質(zhì)。正如本領域普遍技術人員能想到的,通過本發(fā)明的方法還可以制備其它本領域已知的其它細胞蛋白質(zhì)和受體。本文所述方法的一個優(yōu)點是它實際上能活化任何基因。但是,由于基因有不同的基因組結(jié)構(gòu),包括不同的內(nèi)含子/外顯子界線和起始密碼的位置,為了在一群細胞中活化最大數(shù)量的不同基因,要提供許多活化構(gòu)建體??梢詫⑦@些構(gòu)建體分別轉(zhuǎn)染到細胞中制備文庫,每個文庫含有的細胞帶有獨特的一組活化基因。某些基因被幾種不同的活化構(gòu)建體活化。另外,可以活化基因的某些部分來產(chǎn)生截短的、生物活性蛋白質(zhì)。截短的蛋白質(zhì)可以這樣制備,例如將活化構(gòu)建體整合到內(nèi)源基因中部的內(nèi)含子或外顯子中,而不是整合到第二個外顯子的上游。使用不同構(gòu)建體還可以使活化了的基因被修飾從而使其含有新的序列。例如,可以在活化構(gòu)建體上包含分泌信號序列來促進活化基因的分泌。在某些情況中,根據(jù)內(nèi)含子/外顯子結(jié)構(gòu)和目的基因的情況,分泌信號序列可以取代內(nèi)源基因的全部或部分信號序列,在另外一些情況中,信號序列能使通常位于胞內(nèi)的蛋白質(zhì)分泌出去。載體上的調(diào)控序列可以是組成型啟動子??蛇x擇地,啟動子可以是誘導型的,使用誘導型啟動子能使細胞在常規(guī)培養(yǎng)和擴展過程中只產(chǎn)生低基底水平的活化蛋白質(zhì)。然后例如在制備或篩選過程中,細胞可以被誘導以產(chǎn)生大量所需蛋白質(zhì)。誘導型啟動子的例子包括,但不限于,四環(huán)素誘導型啟動子和金屬硫蛋白啟動子。在本發(fā)明的優(yōu)選實施方案中,載體上的調(diào)控序列可以是組織特異性啟動子或增強子。載體上的調(diào)控序列可以分離自細胞或病毒基因組。細胞調(diào)控序列的例子包括,但不限于,來自肌動蛋白基因、金屬硫蛋白Ⅰ基因、免疫球蛋白基因、酪蛋白Ⅰ基因、血清白蛋白基因、膠原蛋白基因、球蛋白基因、層粘連蛋白基因、血影蛋白基因、錨蛋白基因、Na/KATP酶基因和微管蛋白基因的調(diào)控元件。病毒調(diào)控序列的例子包括,但不限于,來自巨細胞病毒(CMV)立即早期基因、腺病毒晚期基因、SV40基因、逆轉(zhuǎn)錄病毒LTRs和皰疹病毒基因的調(diào)控元件。通常,調(diào)控序列含有轉(zhuǎn)錄因子(比如NF-kB、SP-1、TATA結(jié)合蛋白、AP-1、和CAAT結(jié)合蛋白)的結(jié)合位點。從功能上說,調(diào)控序列是由其啟動、增強或者改變內(nèi)源基因轉(zhuǎn)錄的能力所定義的。在優(yōu)選實施方案中,調(diào)控序列是病毒啟動子。在極優(yōu)選的實施方案中,啟動子是CMV立即早期基因啟動子。在替代實施方案中,增強子是細胞非病毒啟動子。在優(yōu)選實施方案中,調(diào)控元件含有一個增強子。在極優(yōu)選的實施方案中,增強子是CMV立即早期基因增強子。在替代實施方案中,調(diào)控元件是細胞、非病毒增強子。轉(zhuǎn)錄調(diào)控序列可以由支架結(jié)構(gòu)結(jié)合區(qū)或基質(zhì)結(jié)合位點、負調(diào)控元件以及轉(zhuǎn)錄因子結(jié)合位點組成。調(diào)控序列還可以包括基因座控制區(qū)。本發(fā)明包括逆轉(zhuǎn)錄病毒轉(zhuǎn)錄調(diào)控序列,例如長末端重復的使用。但是當用這些序列時,它們不必與任何逆轉(zhuǎn)錄病毒序列相連,后者能極大地影響轉(zhuǎn)錄調(diào)控序列作為待活化的內(nèi)源基因(即轉(zhuǎn)錄調(diào)控序列將要與之重組以便活化的細胞基因)的轉(zhuǎn)錄啟動子或增強子的功能。構(gòu)建體可以含有一個不與載體上的外顯子序列可操縱地連接在一起的調(diào)控序列。例如,當調(diào)控元件是一個增強子,它可以在內(nèi)源基因附近(例如,上游、下游、或在內(nèi)含子內(nèi)部)進行整合并刺激該基因從其內(nèi)源啟動子處開始表達。通過這個活化機制,在被活化基因的轉(zhuǎn)錄產(chǎn)物中不存在來自載體的外顯子序列??蛇x擇地,調(diào)控元件可以與外顯子可操縱地連接在一起,該外顯子可以是天然產(chǎn)生的序列或者可以是非天然產(chǎn)生的(例如合成制備的)序列。為了活化在其第一個外顯子中缺少起始密碼子的內(nèi)源基因(例如,促卵泡激素β),優(yōu)選將載體上的外顯子的起始密碼子缺失。為了活化其第一個外顯子中含有起始密碼子的內(nèi)源基因(例如,紅細胞生成素和生長激素),優(yōu)選載體上的外顯子含有起始密碼子,通常是ATG,優(yōu)選是一個高效翻譯起始位點(kozak,分子生物學雜志196947(1987))。外顯子可以含有跟在起始密碼子后面的附加密碼子。這些密碼子可以來源于天然產(chǎn)生的基因或者是非天然產(chǎn)生的(例如,合成的)。密碼子可以與待活化內(nèi)源基因的第一個外顯子中的密碼子相同。可選擇地,密碼子可與內(nèi)源基因的第一個外顯子中的密碼子不同。例如,所述密碼子可以編碼一個表位標記、分泌信號序列、跨膜結(jié)構(gòu)域、選擇標記或篩選標記。任選,緊鄰外顯子序列3’端有一個未配對的剪接供體位點。當待活化的基因的結(jié)構(gòu)已知時,應將剪接供體位點放在緊鄰載體外顯子的位置,這樣在剪接之后,載體中的密碼子將與內(nèi)源基因的第二個外顯子的密碼子讀框一致。當待活化的內(nèi)源基因的結(jié)構(gòu)未知時,使用分別含有不同讀碼框的構(gòu)建體??刹倏v地連接被定義為一個允許通過指定序列進行轉(zhuǎn)錄的構(gòu)型。例如,與外顯子序列可操縱地連接的調(diào)控序列表明該外顯子序列被轉(zhuǎn)錄。載體上存在起始密碼子時,可操縱地連接還表明載體外顯子的開放讀碼框與內(nèi)源基因的開放讀碼框是讀框一致的。在非同源整合之后,載體上的調(diào)控序列(例如,啟動子)變成與內(nèi)源基因可操縱地連接在一起,并在一個通常稱為CAP位點的位點上協(xié)助轉(zhuǎn)錄起始。轉(zhuǎn)錄連續(xù)通過載體上的外顯子元件(以及如果有的話,通過起始密碼子、開放讀碼框,和/或未配對的剪接供體位點)和通過內(nèi)源基因。由這個可操縱連接產(chǎn)生的初級轉(zhuǎn)錄產(chǎn)物被剪接以產(chǎn)生一個含有來自載體和內(nèi)源基因兩者的外顯子序列的嵌合轉(zhuǎn)錄產(chǎn)物。翻譯后,該轉(zhuǎn)錄產(chǎn)物能產(chǎn)生一個內(nèi)源蛋白質(zhì)。外顯子或“外顯子序列”定義為存在于成熟RNA分子中的任何被轉(zhuǎn)錄的序列。載體上的外顯子可以含有非翻譯序列,例如,5’非翻譯區(qū)??蛇x擇地,或者與非翻譯序列連接在一起,外顯子可以含有編碼序列,比如起始密碼子和開放讀碼框。開放讀碼框可以編碼天然產(chǎn)生的氨基酸序列或非天然產(chǎn)生的氨基酸序列(例如,合成密碼子)。開放讀碼框還可以編碼分泌信號序列、表位標記、外顯子、選擇標記、篩選標記或者核苷酸,當與內(nèi)源基因進行剪接時,該核苷酸用于保護該開放讀碼框。初級轉(zhuǎn)錄產(chǎn)物的剪接(通過該過程去除內(nèi)含子)由分別位于內(nèi)含子5’和3’端的剪接供體位點和剪接受體位點引導進行。剪接供體位點的共有序列是(A/C)AGGURAGU(其中R代表嘌呤核苷酸),1-3位的核苷酸位于外顯子中,核苷酸GURAGU位于內(nèi)含子中。未配對的剪接供體位點在本文中定義為位于活化構(gòu)建體上的沒有下游剪接受體位點的剪接供體位點。當載體通過非同源重組整合到宿主細胞的基因組中時,未配對的剪接供體位點與來自內(nèi)源基因的剪接受體位點形成配對。來自載體的剪接供體位點,與來自內(nèi)源基因的剪接受體位點一起,將引導載體剪接受體位點和內(nèi)源剪接受體位點之間的所有序列的切除。這些間插序列的切除去掉了干擾內(nèi)源蛋白質(zhì)翻譯的序列。本文中所用的術語“上游”和“下游”,意指相對編碼鏈,分別是5’或3’方向。術語基因的“上游區(qū)域”定義為基因的第二個外顯子到達并包括具有相同編碼鏈的第一個相鄰基因的最后一個外顯子的核苷酸序列5’(相對于編碼鏈)。從功能上來說,上游區(qū)域是內(nèi)源基因第二個外顯子5’方向的任何位點,它能使非同源整合的載體與內(nèi)源基因可操縱地連接在一起。載體構(gòu)建體可以含有選擇標記以便協(xié)助鑒定和分離含有進行了非同源整合的活化構(gòu)建體的細胞。選擇標記的例子包括編碼下列物質(zhì)的基因新霉素抗性(neo)、次黃嘌呤磷酸核糖轉(zhuǎn)移酶(HPRT)、嘌呤霉素(pac)、二氫乳清酸酶谷氨酰胺合成酶(GS)、組氨酸D(hisD)、氨甲酰磷酸合成酶(CAD)、二氫葉酸還原酶(DHFR)、多抗藥性1(mdr1)、天冬氨酸轉(zhuǎn)氨甲酰酶、黃嘌呤-鳥嘌呤磷酸核糖轉(zhuǎn)移酶(gpt)和腺苷脫氨酶(ada)??蛇x擇地,載體可以含有一個篩選標記,代替選擇標記或除選擇標記以外。篩選標記能使含有載體的細胞分離出來,而不需給它們施加藥物或其它選擇壓力。篩選標記的例子包括編碼細胞表面蛋白質(zhì)、熒光蛋白和酶的基因。包含載體的細胞可以通過FACS(熒光激活細胞分選儀)利用細胞表面蛋白的熒光標記的抗體或者用能被載體編碼的酶轉(zhuǎn)化為熒光產(chǎn)物的底物來分離。可選擇地,可以通過由內(nèi)源基因產(chǎn)物提供的性狀進行表型選擇來挑選。因此,活化構(gòu)建體可以不含選擇標記,而不是由內(nèi)源基因自身提供的“標記”。在該實施方案中,可以基于活化基因賦予的表型來挑選活化細胞。選擇表型的例子包括細胞增殖、生長因子獨立型生長、集落形成、細胞分化(例如,分化成神經(jīng)細胞,肌細胞、上皮細胞等)、不依賴于貼壁的生長、對細胞因子的活化作用(例如,激酶,轉(zhuǎn)錄因子,核酸酶等)、細胞表面受體/蛋白的表達、獲得或喪失細胞-細胞粘著性、遷移和細胞活化(例如,休眠或活化的T細胞)。當篩選轉(zhuǎn)染細胞以得到基因活化產(chǎn)物而不是篩選穩(wěn)定的整合子,可以刪除構(gòu)建體上的選擇標記。當穩(wěn)定整合效率高時,這一點尤其有用。載體可以含有一或多個(即1、2、3、4、5或更多,最優(yōu)選1或2個)擴增標記以便挑選出包含拷貝數(shù)增加的整合載體和相鄰活化內(nèi)源基因的細胞。擴增標記的例子包括,但不限于二氫葉酸還原酶(DHFR)、腺苷脫氨酶(ada)、二氫乳清酸酶谷氨酰胺合成酶(GS)和氨甲酰磷酸合成酶(CAD)。載體可以含有用于基因擴增的真核生物病毒復制起點。這些起點可以取代擴增標記或者與擴增標記共存。載體還可以含有用于構(gòu)建體在微生物中增殖的遺傳元件。有用的遺傳元件的例子包括微生物的復制起點和抗生素抗性標記。這些載體和文中公開的任何載體,以及本領域普通技術人員容易想到的變體可以用于上文描述的任何方法從而形成可由這些方法制得的任何組合物。構(gòu)建體非同源整合到細胞基因組中使來自載體的調(diào)控元件和來自內(nèi)源基因的外顯子之間形成可操縱的連接。在優(yōu)選實施方案中,利用載體調(diào)控序列的插入來上調(diào)內(nèi)源基因的表達。上調(diào)基因表達包括將一個轉(zhuǎn)錄上的沉默基因轉(zhuǎn)化為轉(zhuǎn)錄上的活化基因。它還包括使那些已具轉(zhuǎn)錄活性的基因,但蛋白質(zhì)產(chǎn)生量低于所需量的基因的基因表達增強。在其它實施方案中,可以用其它方法來影響內(nèi)源基因的表達,比如下調(diào)表達、建立誘導型表型或改變表達的組織特異性。根據(jù)本發(fā)明,制備基因表達產(chǎn)物的體外方法可能包括,例如,(a)將本發(fā)明的載體導入細胞;(b)使載體通過非同源重組整合到細胞基因組中;(c)由載體上所含的轉(zhuǎn)錄調(diào)控序列上調(diào)細胞中的內(nèi)源基因,從而使其過表達;(d)篩選過表達內(nèi)源基因的細胞;以及(e)在有利于細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下培養(yǎng)細胞。本發(fā)明的這種體外方法可能還包含分離表達產(chǎn)物來制備分離的基因表達產(chǎn)物。在這種方法中,可以有利地使用任何本領域已知的分離蛋白質(zhì)的方法,包括但不限于層析(例如,HPLC、FPLC、LC、離子交換、親合、體積排阻等)、沉淀(例如,硫酸銨沉淀、免疫沉淀等)、電泳及其它為本領域普通技術人員所熟知的蛋白質(zhì)分離和純化方法。類似地,體內(nèi)制備基因表達產(chǎn)物的方法可能包括,例如(a)將本發(fā)明的載體導入細胞;(b)使載體通過非同源重組整合到細胞基因組中;(c)由載體上所含的轉(zhuǎn)錄調(diào)控序列上調(diào)細胞中的內(nèi)源基因,從而使其過表達;(d)篩選過表達內(nèi)源基因的細胞;以及(e)在有利于所述細胞在真核生物體內(nèi)過表達內(nèi)源基因的條件下,將分離且克隆的細胞導入真核生物中。根據(jù)發(fā)明的這個方面,可以有利地使用任何真核生物,包括真菌(尤其是酵母),植物和動物,更優(yōu)選動物,還優(yōu)選的是脊椎動物,最優(yōu)選哺乳動物,尤其是人。在某些相關實施方案中,本發(fā)明提供了這樣的方法,它還進一步包括在將細胞導入真核生物之前對它進行分離和克隆。本文中所用的短語在細胞中或由細胞在體外“有利于制備表達產(chǎn)物的條件”,“有利于基因過表達的條件”以及“有利于基因活化的條件”是指任何和所有適宜的環(huán)境、物理、營養(yǎng)或生化參數(shù),這些參數(shù)能夠允許、協(xié)助或促進細胞在體外產(chǎn)生表達產(chǎn)物、或者過表達或活化基因。這類條件當然包括使用培養(yǎng)基、保溫、光照、濕度等,其可能是最佳或能夠允許、協(xié)助或促進細胞在體外產(chǎn)生表達產(chǎn)物、或者使基因過表達或活化的條件。類似地,本文中所用的的短語在細胞中或由細胞在體內(nèi)“有利于制備表達產(chǎn)物的條件”,“有利于基因過表達的條件”以及“有利于基因活化的條件”是指是指任何和所有適宜的環(huán)境、物理、營養(yǎng)或生化、行為、遺傳和情感參數(shù),在這些條件下維持含有所述細胞的動物,這些條件能夠允許、協(xié)助或促進由真核生物的細胞體內(nèi)產(chǎn)生表達產(chǎn)物或者使基因過表達或活化。利用已描述過的篩選方法和下面例舉的方法,或者其它本領域常規(guī)的測量基因表達、活化或過表達的方法,本領域普通技術人員可以確定給定的一組條件是否有利于體外或體外進行基因表達、活化或過表達。本發(fā)明還包括由上述任何方法制得的細胞。本發(fā)明包括含有所述載體構(gòu)建體的細胞,已整合了載體構(gòu)建體的細胞以及那些在所導入的轉(zhuǎn)錄調(diào)控序列的驅(qū)動下,由內(nèi)源基因過表達所需基因產(chǎn)物的細胞。用于本發(fā)明的細胞可以來源于任何真核物種,可以是初級、次級或無限增殖化的細胞。此外,細胞可以來源于生物體內(nèi)的任何組織??捎脕韽闹蟹蛛x和活化細胞的組織的例子包括,但不限于,肝、腎、脾、骨髓、胸腺、心臟、肌肉、肺、腦、睪丸、卵巢、胰島、腸、骨髓、皮膚、骨、膽囊、前列腺、膀胱、胚胎以及免疫和造血系統(tǒng)。細胞類型包括成纖維細胞、上皮細胞、神經(jīng)細胞、干細胞和濾泡細胞。但是,利用本發(fā)明,可以用任何細胞或細胞類型來活化基因表達??梢栽趤碓从谡婧松锉热缯婢?、植物或動物的任何細胞中實施所述方法。優(yōu)選實施方案包括脊椎動物,尤其是哺乳動物,更特別是人??梢詫?gòu)建體整合到初級、次級或無限增殖化的細胞中。初級細胞是分離自脊椎動物,并且未被傳代的細胞。次級細胞是已被傳代的初級細胞,但未被無限增殖化。無限增殖化的細胞是可以無限傳代的細胞系。在優(yōu)選實施方案中,細胞是無限增殖化的細胞系。無限增殖化的細胞系的例子包括,但不限于,HT1080、HeLa、Jurkat、293細胞、KB癌、T84結(jié)腸上皮細胞系、Raji、HepG2或Hep3B肝癌細胞系、A2058黑素瘤、U937淋巴瘤和WI38成纖維細胞系、體細胞雜種及雜交瘤。用于本發(fā)明的細胞可以來源于任何真核生物物種,包括但不限于哺乳動物細胞(比如大鼠、小鼠、牛、豬、綿羊、山羊和人)、鳥類細胞、魚類細胞、兩棲動物細胞、爬行動物細胞、植物細胞和酵母細胞。優(yōu)選地,通過活化來自某物種的細胞中的基因表達來過表達特定物種的內(nèi)源基因或基因產(chǎn)物。例如,使用人類細胞來過表達內(nèi)源人類蛋白質(zhì)。類似地,要過表達內(nèi)源牛蛋白質(zhì)(例如牛生長激素),使用牛細胞。所述細胞可以來源于真核生物中的任何組織??捎脕韽闹蟹蛛x和活化細胞的脊椎動物組織的例子包括,但不限于,肝、腎、脾、骨髓、胸腺、心臟、肌肉、肺、腦、免疫系統(tǒng)(包括淋巴系統(tǒng))、睪丸、卵巢、胰島、腸、胃、骨髓、皮膚、骨、膽囊、前列腺、膀胱、受精卵、胚胎和造血組織。有用的脊椎動物細胞類型包括,但不限于,成纖維細胞、上皮細胞、神經(jīng)細胞、種系細胞(即精母細胞/精子以及卵母細胞)、干細胞和濾泡細胞??捎脕韽闹蟹蛛x和活化細胞的植物組織包括,但不限于葉組織、子房組織、雄蕊組織、雌蕊組織、根組織、塊莖、配子、種子、胚芽等。但本領域普通技術人員會想到,利用本發(fā)明可以用任何真核的細胞或細胞類型來活化基因表達。上述任何方法制備的任何細胞都可用來篩選所需基因產(chǎn)物的表達,并提供所需量的細胞內(nèi)過表達的基因產(chǎn)物??梢詫⒃摷毎蛛x和克隆。可用以該方法制得的細胞來在體外(例如用于蛋白質(zhì)治療)或體內(nèi)(用于細胞療法)制備蛋白質(zhì)。工業(yè)上的生長和制備條件經(jīng)常與用于分析用途(例如克隆、蛋白質(zhì)或核酸測序、制備抗體、X-射線晶體學分析、酶學分析等)的細胞生長和制備條件不同。用于搖瓶中生長的細胞放大試驗包括提高細胞可以附著的表面積。因此經(jīng)常加入微載體珠來提高工業(yè)生長用的表面積。旋轉(zhuǎn)器培養(yǎng)中的細胞放大試驗可能涉及體積的較大提高。微載體和旋轉(zhuǎn)器培養(yǎng)可能需要5升或更大體積。根據(jù)目的蛋白質(zhì)的固有效價(比活),體積低至1-10升。常見的是10-15升。但是,可能會需要達到50-100升,體積可能會高至10,000-15,000升。在某些情況中,可能需要更高體積。還可以在大量T型燒瓶(例如50-100個)中培養(yǎng)細胞。除了生長條件,工業(yè)規(guī)模上的蛋白質(zhì)純化也與分析用純化相當不同。在工業(yè)實踐中,可以由相當于10升(大約104細胞/ml)細胞量等同物開始純化蛋白質(zhì)。開始蛋白質(zhì)純化的細胞量等同物可以達到10升(高達106或107細胞/ml)的細胞。但本領域普通技術人員會想到,更高或更低一些的起始細胞量等同物也可用于本方法。另一種工業(yè)培養(yǎng)條件,特別在當終產(chǎn)物要臨床使用時,是在無血清培養(yǎng)基中培養(yǎng)細胞,無血清培養(yǎng)基是指不含血清或所含血清沒有達到細胞生長所需量的培養(yǎng)基。很顯然,這避免了對有毒污染物(例如病毒)或其它類型污染物(例如會使純化過程復雜的蛋白質(zhì))的不希望的共純化。用于細胞生長的無血清培養(yǎng)基、這種培養(yǎng)基的工業(yè)來源及在無血清培養(yǎng)基中培養(yǎng)細胞的方法是本領域普通技術人員熟知的。由上面描述的方面獲得的單個細胞能夠過表達一個基因或多個基因。通過整合一個構(gòu)建體或在同一細胞中整合多重構(gòu)建體(即多種類型的構(gòu)建體)可以活化多個基因。因此,一個細胞可以只含一類載體構(gòu)建體或不同類型的構(gòu)建體,每種構(gòu)建體能活化一個內(nèi)源基因。本發(fā)明還涉及通過下列一或多項步驟來制備上述細胞的方法導入一或多個載體構(gòu)建體;使導入的構(gòu)建體通過非同源重組整合到細胞基因組中;在細胞內(nèi)過表達1或多個內(nèi)源基因;以及分離和克隆所述細胞。方便起見,當討論將多核苷酸導入細胞中時,本文采用術語“轉(zhuǎn)染”。但是,應當明白該術語的特定用途已被用來泛指將多核苷酸導入細胞的方法,也用來指用其它本文描述的方法實現(xiàn)的導入,比如電穿孔,脂質(zhì)體介導的導入,逆轉(zhuǎn)錄病毒介導的導入等(以及依照其自身特定含義的導入方法)可以通過許多本領域已知方法將載體導入細胞。這些方法包括,但不限于,電穿孔、磷酸鈣沉淀、DEAE右旋糖苷、脂質(zhì)體轉(zhuǎn)染和受體介導的胞吞、1,5-二甲基-1,5-二氮十一亞基聚甲溴化物(polybrene)、粒子轟擊和顯微注射。可選擇地,可臺將載體以病毒顆粒(可復制感受態(tài)病毒或復制缺陷型病毒)的形式遞送到細胞中??捎糜谶f送核苷酸的病毒的例子包括,但不限于,腺病毒、腺病毒相關病毒、逆轉(zhuǎn)錄病毒、皰疹病毒和痘苗病毒。本領域技術人員知道的其它適用于將核苷酸分子遞送到細胞中的病毒可以被等效地用于該方法。轉(zhuǎn)染之后,在一定條件下培養(yǎng)細胞,該條件是本領域已知的適合載體和宿主細胞基因組之間進行非同源整合的條件??梢赃M一步在本領域已知的使被活化內(nèi)源基因進行表達的條件下,培養(yǎng)含有非同源整合的載體的細胞??梢栽谝粋€DNA構(gòu)建體或各自獨立的構(gòu)建體上將載體構(gòu)建體導入細胞,并發(fā)生連環(huán)化。盡管在優(yōu)選實施方案中,載體構(gòu)建體是雙鏈DNA載體構(gòu)建體,載體構(gòu)建體也包括單鏈DNA、單鏈和雙鏈DNA的結(jié)合形式、單鏈RNA、雙鏈RNA、以及單鏈和雙鏈RNA的結(jié)合形式。因此,例如,載體構(gòu)建體可以是單鏈RNA,其由逆轉(zhuǎn)錄酶將其轉(zhuǎn)化為cDNA,cDNA再被轉(zhuǎn)化為雙鏈DNA,而雙鏈DNA最終與宿主細胞基因組發(fā)生重組。在優(yōu)選實施方案中,導入細胞之前將構(gòu)建體線性化?;罨瘶?gòu)建體的線性化產(chǎn)生游離DNA末端,它能在整合過程中與染色體末端反應。一般來說,構(gòu)建體在調(diào)控元件(以及外顯子和剪接供體序列,如果有這些序列)下游被線性化??梢酝ㄟ^,例如在調(diào)控序列下游加入一個獨特的限制位點并在轉(zhuǎn)染前用相應的限制酶處理構(gòu)建體來促進線性化。在構(gòu)建體上的線性化位點和近端最具功能的元件(例如未配對的剪接供體位點)之間插入一個“間隔區(qū)”序列是有利的,但這一作法不是必須的。有間隔區(qū)序列存在能夠保護載體上的重要功能元件在轉(zhuǎn)染過程中免受外切核苷酶的降解。所述間隔區(qū)可以由任何不會改變文中所述載體的基本功能的核苷酸序列構(gòu)成。也可以用環(huán)形構(gòu)建體來活化內(nèi)源基因表達。本領域已知,環(huán)形質(zhì)粒在轉(zhuǎn)染到細胞中時能夠整合到宿主細胞基因組中。據(jù)推測,轉(zhuǎn)染過程中在環(huán)形質(zhì)粒中發(fā)生DNA斷裂,從而產(chǎn)生能連接到染色體末端的游離DNA末端。構(gòu)建體中的某些斷裂將發(fā)生在不破壞載體的關鍵功能的位置(例如,斷裂發(fā)生在調(diào)控序列下游),因此可以使構(gòu)建體以能活化內(nèi)源基因的構(gòu)型整合到染色體中。如上所述,可以在構(gòu)建體上插入間隔區(qū)序列(例如,調(diào)控序列下游)。轉(zhuǎn)染過程中,發(fā)生在間隔區(qū)的斷裂將在構(gòu)建體上的某個位點形成游離末端,該游離末端適合構(gòu)建體整合到宿主細胞基因組中后活化內(nèi)源基因。本發(fā)明還包括由上述方法制得的細胞文庫。一個文庫可以包括得自一次轉(zhuǎn)染實驗的所有克隆或者得自一次轉(zhuǎn)染實驗的一個亞組的克隆,所述亞組可以過表達相同的基因或多個基因,例如,一類基因。轉(zhuǎn)染可以用單個類型的構(gòu)建體或多個類型的構(gòu)建體進行。可以將得自兩次或多次轉(zhuǎn)染實驗的所有重組細胞合并,將得自一次轉(zhuǎn)染實驗的1或多個亞組的細胞合并或者將得自多次轉(zhuǎn)染實驗的亞組的細胞合并來構(gòu)成文庫。所得文庫可以表達相同基因,或多個基因,例如,一類基因。同樣,在每次轉(zhuǎn)染過程中,可以使用一個構(gòu)建體或多個構(gòu)建體。所述文庫可以由相同細胞類型或不同細胞類型構(gòu)成。所述文庫可以由一類細胞組成,該細胞含有一種類型活化構(gòu)建體,所述構(gòu)建體在自發(fā)DNA斷裂形成的斷裂處或由同時施加(給相同細胞)或者分別施加(給各個細胞群,然后將細胞合并在一起構(gòu)成文庫)的輻射、限制酶、和/或DNA斷裂劑導致的斷裂處整合到染色體中。文庫可以由多類細胞組成,這些細胞含有一個或多個構(gòu)建體,所述構(gòu)建體整合到用輻射、限制酶,和/或DNA斷裂劑一起施加給相同細胞或者分別(施加給各個細胞群,然后將細胞合并在一起構(gòu)成文庫)處理過的細胞的基因組中。本發(fā)明還涉及從相同或不同轉(zhuǎn)染實驗中挑選各種細胞亞組來制備文庫的方法。例如,可以將所有表達核因子的細胞(由轉(zhuǎn)染構(gòu)建體20的細胞中核綠色熒光蛋白的存在來確定)合并以形成含有活化核因子的細胞文庫。類似地,可以合并表達膜蛋白或分泌蛋白的細胞。也可以將細胞根據(jù)表型分組,例如,生長因子獨立型生長、生長因子獨立型增殖、集落形成、細胞分化(例如分化為神經(jīng)細胞、肌細胞、上皮細胞等)、不依賴于貼壁的生長、活化細胞因子(例如,激酶、轉(zhuǎn)錄因子、核酸酶等),細胞-細胞粘附的獲得或喪失、遷移或細胞活化(例如休眠或活化T細胞)。本發(fā)明還涉及利用細胞文庫來過表達內(nèi)源基因的方法。篩選文庫用于基因的表達,并挑選出能表達所需基因產(chǎn)物的細胞。然后,可以用細胞來純化基因產(chǎn)物,用作隨后使用。可以體外培養(yǎng)細胞或者使細胞體內(nèi)表達基因來使細胞進行表達。本發(fā)明還涉及利用文庫來鑒定新基因和基因產(chǎn)物的方法。本發(fā)明還涉及通過用能刺激或影響非同源整合方式的試劑處理細胞來提高基因活化效率的方法。已經(jīng)證實,不同細胞類型的基因表達方式、染色質(zhì)結(jié)構(gòu)以及甲基化方式顯著不同。即使來自相同細胞類型的不同細胞系也可能有明顯差異。這些差異能夠通過影響DNA斷裂方式和修復過程而影響非同源整合的方式。例如,染色質(zhì)化的DNA片段(可能與失活基因有關的性狀)可能對限制酶和化學試劑引起的斷裂作用的抗性更高,而對輻射引起的斷裂作用敏感。此外,可將失活基因甲基化,在這種情況中,被CpG甲基化阻斷的限制酶不能在失活基因附近切割甲基化位點,從而更難用甲基化敏感酶來活化該基因。通過用各種DNA斷裂劑在多個細胞系中建立活化文庫可以避開這些問題。這樣做,可以產(chǎn)生更完全的整合方式,并能最大可能地活化給定基因。本發(fā)明的方法可包括給含有將要過表達的內(nèi)源基因的細胞的DNA中導入雙鏈斷裂。這些方法在載體整合之前或同時給細胞內(nèi)的基因組DNA中導入雙鏈斷裂。DNA斷裂的機制對基因組中DNA的斷裂方式會有顯著影響。這樣,用輻射、限制酶、博來霉素或其它斷裂劑可以在不同位置自發(fā)或人為地產(chǎn)生DNA斷裂。為了提高整合效率以及整合位點分布的隨機性,可以在轉(zhuǎn)染之前或之后用低、中或高劑量輻射處理細胞。借助人工誘導的雙鏈斷裂,這時作為DNA修復過程的一部分,轉(zhuǎn)染DNA可以整合到宿主細胞染色體中。通常,形成用作整合位點的雙鏈斷裂是限速步驟。因此,通過用輻射(或其它DNA破壞劑)來增加染色體斷裂,在給定轉(zhuǎn)染中能得到更多整合子。此外,由輻射引起的DNA斷裂的機制與自發(fā)斷裂的機制不同。當高能光子擊中DNA分子時,輻射能直接誘導DNA斷裂??蛇x擇地,輻射可以活化細胞中的某些化合物,后者接著與DNA鏈反應并使其斷裂。而另一方面,自發(fā)斷裂被認為是由細胞內(nèi)產(chǎn)生的反應性化合物(比如超氧化物和過氧化物)和DNA分子之間的相互作用導致的。但是細胞內(nèi)的DNA不是以裸露、去蛋白化的聚合物的形式存在,而是與染色質(zhì)結(jié)合,并以凝聚狀態(tài)存在。因此在細胞內(nèi)導致雙鏈斷裂的試劑無法接近某些區(qū)域。輻射產(chǎn)生的光子波長具有擊中DNA的高度凝聚區(qū)的足夠短的波長,從而誘發(fā)那些不能發(fā)生自發(fā)斷裂的DNA區(qū)域的斷裂。因此,輻射能產(chǎn)生不同的DNA斷裂方式,后者接下去導致不同的整合方式。這樣,利用經(jīng)過/未經(jīng)過輻射處理的細胞中的相同活化構(gòu)建體制得的文庫可能含有不同活化基因組。最后,輻射處理能將非同源整合效率提高5-10倍,這使得能用較少細胞產(chǎn)生完整的文庫。因此,輻射處理能提高基因活化效率并在轉(zhuǎn)染細胞中形成新的整合和活化方式。有用的輻射類型包括α、β、γ、x-射線,以及紫外照射。適用的輻射劑量隨細胞類型而不同,但通常來說,導致0.1%到99%細胞存活的劑量范圍是有用的。對于HT1080細胞,這相當于大約0.1rads到1000rads的137Cs源的輻射劑量。也可以使用其它劑量,只要該劑量能夠提高整合頻率或者改變整合位點的形式。除了輻射,也可以用限制酶來人工誘導轉(zhuǎn)染細胞內(nèi)的染色體斷裂。與輻射一樣,DNA限制酶能夠形成染色體斷裂,后者隨之作為轉(zhuǎn)染DNA的整合位點。該大量的DNA斷裂使得活化構(gòu)建體的整體整合效率提高。另外,由限制酶導致的斷裂機制與輻射斷裂不同,染色體斷裂的方式也很可能不同。較之光子和能破壞DNA的小代謝物,限制酶是相對大的分子。因此,限制酶傾向于將比整個基因組的緊密程度小的區(qū)域斷裂。如果目的基因存在于基因組的可接近區(qū)域內(nèi),則用限制酶處理細胞能提高活化構(gòu)建體整合到目的基因上游的可能性。由于限制酶識別特異序列,并且由于給定的限制位點不存在于目的基因的上游,可以使用多種限制酶。由于每種酶有不同的特性(例如大小、穩(wěn)定性、切割甲基化位點的能力以及最適反應條件),這些特性會影響到宿主染色體中哪個位點被切割,因此使用多種限制酶是重要的。每種酶,由于其可切割的限制位點的不同分布,將產(chǎn)生不同的整合方式。因此,在導入活化構(gòu)建體之前、期間或之后,導入限制酶(或能夠表達限制酶的質(zhì)粒)將導致不同基因組的活化。最后,限制酶誘導的斷裂使整合效率提高5-10倍(Yorifuji等,突變研究243121(1990)),這就使得可以轉(zhuǎn)染較少的細胞而制備到完整的文庫。這樣,可以用限制酶形成新的整合方式,以便使那些在自發(fā)斷裂或其他人工誘導的斷裂處通過非同源重組產(chǎn)生的文庫中不能被活化的基因活化。還可以用限制酶使活化構(gòu)建體偏性整合到基因組中的預期位點。例如,已描述過幾種罕見的限制酶,它們能平均每50-1000kb切割真核DNA。如果一個罕見的限制酶識別序列恰巧位于目的基因的上游,通過在活化構(gòu)建體進行轉(zhuǎn)染的同時導入該限制酶,可以擇優(yōu)地在目的基因上游形成DNA斷裂。然后,這些斷裂可以作為活化構(gòu)建體的整合位點。能在目的基因內(nèi)部或附近的合適位置進行切割并且其識別位點在基因組的其他位置不多出現(xiàn),或者在所述基因附近過多出現(xiàn)(例如,含有CpG的限制位點),任何這樣的酶都可以。對于以前未被鑒定的基因,可以使用具有8bp識別位點的限制酶(例如,NotⅠ、SfiⅠ、PmeⅠ、SwaⅠ、SseⅠ、SfrⅠ、SgrAl、PacⅠ、AscⅠ、SgfⅠ和Sse8387Ⅰ)、識別含有CpG的位點的酶(例如WagⅠ、Bsi-WⅠ、MluⅠ和BssHⅡ)以及其他罕見的切割酶。以這種方法,可以形成富含特定類型活化基因的“偏性”文庫。就這方面來說,含有CpG二核苷酸的限制酶位點尤其有用,因為這些位點在整個基因組中含量少,而在許多基因5’端的CpG島(正是用于基因活化的位置)中含量豐富。因此,識別這些位點的酶能優(yōu)先在基因序列5’端切割??梢酝ㄟ^幾種方法將限制酶導入宿主細胞。首先,可以通過電穿孔將限制酶導入細胞(Yorifuji等,突變研究243121(1990);Winegar等,突變研究22549(1989))。通常,導入細胞的限制酶的量與它在電穿孔介質(zhì)中的濃度成比例。必須通過調(diào)節(jié)電壓、電容和電阻來優(yōu)化每個細胞系的脈沖條件。其次,可以由編碼該酶的質(zhì)粒在真核生物調(diào)控元件的控制下瞬時表達限制酶。可以通過使用誘導型啟動子以及改變誘導的強度來控制所產(chǎn)生的酶的含量。在某些情況中,可能希望限制所產(chǎn)生的限制酶的量(由于其毒性)。在這些情況中,可以利用弱的或突變的啟動子、剪接位點、翻譯起始密碼子和polyA尾部來降低所產(chǎn)生的酶量。再次,可以通過能與細胞膜融合或通透的試劑來導入限制酶。脂質(zhì)體和鏈球菌溶血素O(Pimplikar等,細胞生物學雜志1251025(1994))是這類試劑的例子。最后,可以利用機械穿孔和顯微注射來將核酸酶和其他蛋白質(zhì)導入細胞。但是,任何能將活性酶遞送到活細胞中的方法都是適用的。由博萊霉素和其他DNA損傷劑誘導的DNA斷裂也可以產(chǎn)生不同的DNA斷裂方式。因此,任何能在細胞中產(chǎn)生雙鏈斷裂的試劑或培養(yǎng)條件都可以用來提高非同源重組的效率和/或改變其位點。各類化學DNA損傷劑的例子包括,但不限于,過氧化物和其他能產(chǎn)生自由基的化合物、烷基化試劑、拓撲異構(gòu)酶抑制劑、抗腫瘤藥物、酸、取代核苷酸和烯二炔(enediyne)抗生素。特異性化學DNA損傷劑包括,但不限于,博萊霉素、過氧化氫、氫過氧化枯烯、氫過氧化叔丁基、次氯酸(與苯胺、1-萘胺或1-萘酚反應)、硝酸、磷酸、阿霉素、9-脫氧阿霉素、去甲基-6-阿霉素、5-亞氨基柔紅霉素、亞德里亞霉素(adriamycin)、4-(9-丫啶氨基)甲磺間茴香胺、新制癌菌素、8-甲氧咖啡因、依托泊甙、橢圓玫瑰樹堿、碘代脫氧尿嘧啶核苷和溴脫氧尿苷。已經(jīng)證明可以通過將細胞預先暴露于低劑量DNA斷裂劑,比如輻射或博萊霉素中,來誘導細胞內(nèi)的DNA修復機制。在轉(zhuǎn)染前用這些試劑將細胞預處理大約24小時,細胞在轉(zhuǎn)染后能更有效地修復DNA斷裂和整合DNA。另外,可以使用較高劑量的輻射或其他DNA斷裂劑,因為預處理后的LD50(導致50%處理細胞死亡的劑量)更高。這就使得能以多種劑量產(chǎn)生隨機活化文庫并在宿主細胞的染色體中形成分布不同的整合位點。篩選一旦制備了一個活化文庫(或多個文庫),就可以用許多檢測方法來篩選。根據(jù)目的蛋白質(zhì)的特性(例如分泌的與胞內(nèi)蛋白)和用于形成文庫的活化構(gòu)建體的性質(zhì),可以使用以下描述的任何或所有檢測方法。也可以使用其他檢測形式。ELISA.可以利用酶聯(lián)免疫吸附檢測法(ELISA)來檢測已活化的蛋白質(zhì)。如果活化的基因產(chǎn)物被分泌出來,在含有結(jié)合的目的蛋白質(zhì)的特異抗體的孔中溫育活化文庫細胞集的培養(yǎng)物上清液。如果一個或一群細胞已經(jīng)活化了目的基因,蛋白質(zhì)將分泌到培養(yǎng)基中。通過篩選文庫克隆集(所述集合可以是1到100,000個以上文庫成員),可以鑒定到含有目的基因已被活化的細胞的集合。然后可以通過同胞選擇、有限稀釋或其他本領域已知技術將目的細胞從其他文庫成員中純化出來。除了分泌蛋白,還可以使用ELISA來篩選表達胞內(nèi)或膜結(jié)合蛋白質(zhì)的細胞。在這些情況下,不是篩選培養(yǎng)物上清液,而是從文庫集合(每個細胞在每個集合中至少出現(xiàn)100-1000次)中取出少量細胞、裂解、澄清并加入包被抗體的小孔。ELISA斑點檢測將ELISA斑點包被目的蛋白質(zhì)的特異抗體。包被后,用1%BSA/PBS將小孔于37℃封閉1小時。隨后,將隨機活化文庫中的100,000到500,000個細胞加入每個孔中(代表全部集合的約10%)。通常,每個孔加入一個集合。如果細胞表達目的蛋白質(zhì)的頻率是1/10000(即集合包含10000個單克隆,其中之一表達目的蛋白質(zhì)),則每孔鋪500000個細胞將產(chǎn)生50個特異細胞。將細胞在孔中于37℃無移動或無干擾地溫育24到48小時。溫育結(jié)束時,吸出細胞并將培養(yǎng)板用PBS/0.05%Tween20洗3次,用PBS/1%BSA洗3次。以適當?shù)臐舛葘⒍辜尤肟字?,于室溫溫?小時或者4℃溫育16小時。可以將這些抗體生物素化或者直接用辣根過氧化酶(HRP)標記。吸出二抗,用PBS/1%BSA將培養(yǎng)板洗3次。加入標記了HRP的三抗或鏈霉抗生物素蛋白,并于室溫溫育1小時。FACS檢測可以利用熒光激活細胞分選儀(FACS)以多種方法來篩選隨機活化文庫。如果目的基因編碼細胞表面蛋白質(zhì),則可以將熒光標記的抗體與來自活化文庫的細胞一起溫育。如果目的基因編碼分泌蛋白質(zhì),則可以將細胞生物素化,并與偶聯(lián)到目的蛋白質(zhì)的特異抗體的鏈霉抗生物素蛋白一起溫育(Manz等,美國科學院學報921921(1995))。溫育后,將細胞放入高濃度明膠中(或其他聚合物,比如瓊脂糖或甲基纖維素)以便限制分泌蛋白質(zhì)的擴散。當細胞分泌出蛋白質(zhì)時,它被結(jié)合到細胞表面上的抗體捕獲。就可以通過熒光標記的二抗來檢測是否存在目的蛋白質(zhì)。對于分泌和膜結(jié)合蛋白質(zhì),都可以隨后根據(jù)其熒光信號分選細胞。然后可以分離出熒光細胞,擴增并進一步經(jīng)FACS、有限稀釋或其他本領域已知的細胞純化技術將其富集。磁珠分離這項技術的原理與FACS類似。通過將活化文庫與偶聯(lián)抗體的、目的蛋白質(zhì)特異的磁珠一起溫育來檢測膜結(jié)合蛋白質(zhì)和捕獲的分泌蛋白質(zhì)。如果蛋白質(zhì)存在于細胞表面,磁珠會與該細胞結(jié)合。利用一個磁體,可以將表達目的蛋白質(zhì)的細胞從文庫中的其他細胞中純化出來。然后將細胞從小珠上釋放、擴增、分析并在需要時進一步純化。RT-PCR收集少量細胞(至少等于集合中各克隆的數(shù)目)并裂解以便純化RNA。分離后,用逆轉(zhuǎn)錄酶將RNA進行逆轉(zhuǎn)錄。然后用目的基因的cDNA的特異性引物進行PCR。可供選擇的是,可以使用跨越活化構(gòu)建體中的合成外顯子和內(nèi)源基因的外顯子的引物。該引物不會與內(nèi)源表達的目的基因雜交,也不使其擴增。反之,如果活化構(gòu)建體整合到目的基因的上游,并活化了基因表達,則該引物與所述基因的第二個特異引物一起,依靠剪接到內(nèi)源基因的外顯子上的合成外顯子的存在而使被活化基因發(fā)生擴增。因此,可以用這個方法來檢測那些通常情況下目的基因的表達低于預期水平的細胞內(nèi)的活化基因。表型分組在這個實施方案中,可以根據(jù)活化基因賦予的表型來挑選細胞??梢赃x擇的表型的例子包括增殖、生長因子獨立型生長、集落形成、細胞分化(例如分化成神經(jīng)細胞、肌細胞、上皮細胞等)、不依賴于貼壁的生長、對細胞因子的活化作用(例如,激酶,轉(zhuǎn)錄因子,核酸酶等)、獲得或喪失細胞-細胞粘著性、遷移和細胞活化(例如,休眠或活化的T細胞)。分離顯示一種表型(比如上面描述的)的活化細胞非常重要,因為預計是由整合構(gòu)建體使內(nèi)源基因活化導致了所觀察到的細胞表型。因此,活化基因可能是重要的治療藥物或者是治療或誘導所觀察到的表型的藥物靶。可以通過瞬時上調(diào)文庫細胞中的基因表達來有效地提高上述每一檢測方法的靈敏度。對于含有NF-kB位點的啟動子(在活化構(gòu)建體上),通過向文庫中加入PMA和腫瘤壞死因子-α可以做到這一點。單獨加入丁酸鈉或者它與PMA和腫瘤壞死因子-α一起可以進一步增強基因表達。加入這些試劑可以提高目的基因的表達,從而可以利用較低靈敏度的檢測方法來鑒定目的基因已活化的細胞。由于建立了巨大的活化文庫以便盡可能多地活化許多基因,將文庫克隆組織為集合是有益的。每個集合可以含有1到100000個以上單個克隆。因此,在給定集合中,通常產(chǎn)生稀釋濃度的許多活化蛋白質(zhì)(原因在于集合的整個尺寸和該集合內(nèi)產(chǎn)生給定活化蛋白質(zhì)的有限數(shù)目的細胞)。因此,篩選前將蛋白質(zhì)濃縮能有效地提高在篩選方法中檢測活化蛋白質(zhì)的能力。一個特別有用的濃縮方法是超濾;但是,也可以用其他方法。例如,在結(jié)合所存在的多數(shù)或全部蛋白質(zhì)的條件下,通過吸附到離子交換、疏水、染料、羥基磷灰石、凝集素以及其他合適的樹脂上來非特異或半特異地濃縮蛋白質(zhì)。這樣在篩選前可以將結(jié)合蛋白質(zhì)以小體積移走。有益的做法是使細胞在無血清培養(yǎng)基中生長以便協(xié)助蛋白質(zhì)的濃縮。在另一個實施方案中,活化構(gòu)建體上可以包括的有用序列是表位標記。所述表位標記可以包含一個能夠親合純化(例如在免疫親合或螯合基質(zhì)上)活化蛋白質(zhì)的氨基酸序列。因此,通過在活化構(gòu)建體上包括表位標記可以純化活化文庫中所有的活化蛋白質(zhì)。通過將活化蛋白質(zhì)從其他細胞和培養(yǎng)基蛋白質(zhì)中純化出來,可以協(xié)助篩選新的蛋白質(zhì)和酶活性。在某些情況中,可能會希望在將活化蛋白質(zhì)提純后除去表位標記。通過在活化構(gòu)建體上的表位標記下游包括一個蛋白酶識別序列(例如,因子Ⅱa或腸激酶切割位點)可以達到該目的。將純化的活化蛋白與合適的蛋白酶一起溫育可以從蛋白質(zhì)上釋放出表位標記。在那些表位標記位于活化構(gòu)建體上的文庫中,可以利用親合純化將所有活化蛋白質(zhì)從所有其他細胞和培養(yǎng)基蛋白質(zhì)中純化出來。這不僅使活化蛋白質(zhì)得到濃縮,還使其從可能干擾用于篩選文庫的檢測方法的其它活性中純化出來。一旦鑒定到含有過表達目的基因的細胞的克隆集合,可以采取措施來分離活化細胞。利用許多本領域已知的方法可以實現(xiàn)活化細胞的分離。細胞純化方法的例子包括有限稀釋、熒光活化細胞分選、磁珠分離、同胞選擇和利用克隆環(huán)進行的單克隆純化。在本發(fā)明的優(yōu)選實施方案中,所述方法包括一個純化表達產(chǎn)物的步驟。在極其優(yōu)選的實施方案中,培養(yǎng)表達內(nèi)源基因產(chǎn)物的細胞以便產(chǎn)生工業(yè)應用上,特別是在診斷和治療以及藥物開發(fā)用途上可行用量的基因產(chǎn)物。任何用于本文所述方法中的載體可以包括一個擴增標記。這樣,可以在細胞內(nèi)使載體和目的DNA(即含有過表達的基因)得到擴增,并進一步增強內(nèi)源基因的表達。與此相應,所述方法可以包括一個擴增內(nèi)源基因的步驟。一旦已經(jīng)分離了活化細胞,可以通過使含有目的基因和活化構(gòu)建體的基因座擴增來進一步提高表達。通過以下描述的各種方法,單獨或組合使用可以做到這一點。擴增標記是能夠挑選到更高拷貝數(shù)的基因。擴增標記的例子包括二氫葉酸還原酶、腺苷脫氨酶、天冬氨酸轉(zhuǎn)氨甲酰酶、二氫乳清酸酶以及氨甲酰磷酸合成酶。對于這些例子,可以選擇拷貝數(shù)增加的擴增標記和旁側(cè)序列(包括目的基因)用作由擴增標記起作用的藥物或毒性代謝物??傊?,隨著藥物或毒性代謝物濃度升高,含有較少拷貝擴增標記的細胞死亡,而含有拷貝增加的標記的細胞存活并形成集落。可以將這些集落分離、擴增并分析目的基因產(chǎn)物的增加水平。在活化構(gòu)建體上插入一個擴增標記將導致活化細胞中的目的基因與擴增標記并列。在存在增加量選擇劑(通常是藥物或代謝物)的情況下培養(yǎng)細胞,就可以挑選出含有拷貝數(shù)增加的擴增標記和目的基因的活化細胞。例如,可以用氨甲喋呤來選擇二氫葉酸還原酶(DHFR)的擴增。當在每個升高藥物濃度下得到抗藥集落時,可以挑選出單個集落并鑒定擴增標記和目的基因的拷貝數(shù),并分析目的基因的表達。可以挑選出活化基因表達水平最高的單個克隆用于在更高藥物濃度下的進一步擴增。在最高藥物濃度下,克隆會表達量已經(jīng)大大增加的目的蛋白質(zhì)。擴增DHFR時,可以方便地在幾個不同濃度的氨甲喋呤處鋪上大約1×107細胞。有用的氨甲喋呤的起始濃度在大約5到100nM之間。但是必須針對每個細胞系和整合位點根據(jù)經(jīng)驗確定氨甲喋呤的最佳濃度。在含有氨甲喋呤的培養(yǎng)基中生長之后,從最高濃度氨甲喋呤中挑出集落并分析目的基因表達的提高。然后將具有最高濃度氨甲喋呤的克隆生長在更高濃度的氨甲喋呤中以便挑選出進一步擴增的DHFR和目的基因。對于含有最高程度基因擴增的克隆可以使用微摩和毫摩范圍的氨甲喋呤濃度。在活化構(gòu)建體上插入一個病毒復制起點(例如,人細胞中的oriP或SV40以及小鼠細胞中的多瘤ori)將導致在活化細胞中目的基因與病毒復制起點并列。通過以反式導入病毒復制蛋白可以使起點和旁側(cè)序列擴增。例如,使用oriP(Epstein-Barr病毒的復制起點)時,可以瞬時或穩(wěn)定表達EBNA-Ⅰ。EBNA-Ⅰ能夠起始從整合的oriP基因座開始復制。所述復制可以從起點雙向延伸。當產(chǎn)生各個復制產(chǎn)物時,它又能起始復制。結(jié)果,可以得到許多拷貝病毒起點和包括目的基因的旁側(cè)基因組序列。該更高的拷貝數(shù)使細胞能產(chǎn)生更大量的目的基因。在某個頻率處,復制產(chǎn)物會重新結(jié)合形成含有旁側(cè)基因組序列(包括目的基因)的環(huán)形分子。通過單細胞克隆以及Hirt提取和Southern印跡分析可以分離出含有攜帶目的基因的環(huán)形分子的細胞。一旦得到純化,可以將含有拷貝數(shù)增加(通常10-50拷貝)的附加體基因組座位的細胞在培養(yǎng)基中增殖。為了獲得更高的擴增,可以通過在原始構(gòu)建體中的第一個起點鄰近出包括一個第二起點來進一步增加附加體。例如,可以用T抗原來使oriP/SV40附加體拷貝數(shù)增加到約1000(Heinzel等,病毒雜志623738(1988))。這種拷貝數(shù)的顯著增加能夠明顯地提高蛋白質(zhì)的表達。本發(fā)明包括體外和體內(nèi)過表達內(nèi)源基因。因此,可以在體外用細胞以產(chǎn)生預期量的基因產(chǎn)物或者可以在體內(nèi)用細胞以在完整動物提供基因產(chǎn)物。本發(fā)明還包括由本文所述方法產(chǎn)生的蛋白質(zhì)。這些蛋白質(zhì)得自已知或未知基因。可以用所述方法制備的已知蛋白質(zhì)的例子包括,但不限于,紅細胞生成素、胰島素、生長激素、葡糖腦苷脂酶,組織纖溶酶原活化物、粒細胞集落刺激因子(G-CSF)、粒細胞/巨噬細胞集落刺激因子(GM-CSF)、干擾素α、干擾素β、干擾素γ,白介素-2、白介素-6、白介素-11、白介素-12、TGF-β,凝血因子Ⅴ,凝血因子-Ⅶ、凝血因子-Ⅷ、凝血因子-Ⅸ、凝血因子-Ⅹ、TSH-β、骨骼生長因子-2、骨骼生長因子-7,腫瘤壞死因子、α-1抗胰蛋白酶、抗凝血酶Ⅲ,白血病抑制因子、胰高血糖素、蛋白C、蛋白激酶C、巨噬細胞集落刺激因子(M-CSF)、干細胞因子、促卵泡激素β、尿激酶、神經(jīng)生長因子、類胰島素生長因子、促胰島素、甲狀旁腺激素、乳鐵蛋白、補體抑制因子、血小板衍生生長因子,角質(zhì)細胞生長因子、神經(jīng)營養(yǎng)蛋白-3、血小板生成素、絨膜促性腺激素、凝血調(diào)節(jié)蛋白、α糖苷、表皮生長因子、FGF、巨噬細胞集落刺激因子以及上述每個蛋白質(zhì)的細胞表面受體。從活化細胞中純化蛋白質(zhì)產(chǎn)物時,可以采用任何本領域已知的蛋白質(zhì)純化方法。分離含有活化膜蛋白編碼基因的細胞從藥物開發(fā)的觀點來看,那些編碼膜相關蛋白質(zhì)的基因特別令人感興趣??梢杂眠@些基因和它們編碼的蛋白質(zhì)利用組合化學庫和高產(chǎn)量篩選方法來,例如,開發(fā)小分子藥物。另一方面,可以用這些蛋白質(zhì)或蛋白質(zhì)的可溶形式(例如缺少跨膜區(qū)的截短的蛋白質(zhì))作為人或動物的治療活性劑。還可以使用膜蛋白的鑒定利用雙元雜交法或親合捕集技術來鑒定新配體(例如,細胞因子、生長因子以及其他效應分子)。膜蛋白還可能有許多其他應用。目前鑒定編碼完整膜蛋白的基因的手段包括從cDNA文庫中分離所述基因并將其測序。然后利用能鑒定蛋白質(zhì)的跨膜區(qū)的疏水性曲線通過ORF分析來鑒定完整膜蛋白質(zhì)。不幸的是,用這個方法不能鑒定編碼完整膜蛋白的基因,除非該基因能在用于制備cDNA文庫的細胞中表達。另外,許多基因只在很少的細胞中,在很短的發(fā)育時期內(nèi),和/或以極低水平表達。因此,不能用現(xiàn)有的方法來有效地鑒定這些基因。利用本發(fā)明能在不知道基因的序列、結(jié)構(gòu)、功能或表達方式的情況下活化內(nèi)源基因。利用本發(fā)明公開的方法,可以只在轉(zhuǎn)錄水平下活化基因,或者在轉(zhuǎn)錄和翻譯水平下活化基因。因此,可以在含有已整合載體的細胞中制備由活化內(nèi)源基因編碼的蛋白質(zhì)。此外,利用本文公開的特異載體,可以將由活化內(nèi)源基因產(chǎn)生的蛋白質(zhì)進行修飾以便如包括一個表位標記。其他載體(例如,上面描述的載體12-17)可以編碼一個跟有表位標記的信號肽??梢杂迷撦d體來分離那些已經(jīng)活化完整膜蛋白質(zhì)表達的細胞(見以下實施例5)。還可以用該載體引導通常不分泌的蛋白質(zhì)的分泌。因此,本發(fā)明還涉及鑒定編碼細胞完整膜蛋白質(zhì)或跨膜蛋白質(zhì)的內(nèi)源基因的方法。本發(fā)明的這些方法可以包括一或多個步驟。例如,本發(fā)明的一個這種方法可包括(a)將本發(fā)明的一個或多個載體導入細胞中;(b)使載體通過非同源重組整合到細胞基因組中;(c)由整合載體構(gòu)建體上所含的轉(zhuǎn)錄調(diào)控序列上調(diào)細胞中的內(nèi)源基因,使其過表達;(d)篩選過表達內(nèi)源基因的細胞;以及(e)鑒定活化基因以便確定它作為編碼細胞完整膜蛋白質(zhì)的基因的同一性。在相關實施方案中,本發(fā)明提供的這類方法還包括在鑒定活化基因之前從細胞中分離活化基因。為了鑒定編碼完整膜蛋白質(zhì)的基因,整合到細胞基因組的載體應包含一個與外顯子序列連接在一起的調(diào)控序列,所述外顯子序列含有起始密碼子、信號序列和表位標記,隨后是未配對的剪接供體位點。當內(nèi)源基因發(fā)生整合和活化時,產(chǎn)生含有來自載體的信號肽和表位標記的嵌合蛋白質(zhì),所述載體與由內(nèi)源基因的下游外顯子編碼的蛋白質(zhì)融合在一起。該嵌合蛋白質(zhì),通過載體編碼的信號肽的存在,被引導到分泌途徑,在此完成蛋白質(zhì)的翻譯并分泌蛋白。但是,如果活化內(nèi)源基因編碼完整膜蛋白質(zhì),并且該基因的跨膜區(qū)由位于載體整合位點3’處的外顯子編碼,則該嵌合蛋白質(zhì)會到達細胞表面,表位標記將會在細胞表面顯示出來。利用已知的細胞分離方法(例如流式細胞計分選、磁珠細胞分選、免疫吸附或其他本領域技術人員熟悉的方法),可用該表位標記的抗體從細胞群中分離出顯示表位標記且已活化完整膜蛋白質(zhì)編碼的基因的細胞。然后用這些細胞來研究膜蛋白質(zhì)的功能。另一方面,用本領域已知的任何方法來從這些細胞中分離出活化基因,例如通過與載體編碼的外顯子具有特異性的DNA探針進行雜交來對篩選由這些細胞制備到的cDNA文庫,或者利用本文描述的遺傳構(gòu)建體。由載體外顯子編碼的表位標記可以是一個能結(jié)合到抗體上的短肽、一個能結(jié)合到底物(例如多組氨酸/二價金屬離子載體、麥芽糖結(jié)合蛋白/麥芽糖載體、谷胱苷肽S-轉(zhuǎn)移酶/谷胱苷肽載體)上的短肽或者一個來自其上存在抗體或配體的完整膜蛋白質(zhì)的胞外區(qū)(缺少跨膜區(qū))。但是,應當理解,可以根據(jù)本發(fā)明等效地使用本領域技術人員熟悉的其他類型的表位標記。對本文描述的方法和應用的其他合適的改進和變化對本領域技術人員是顯而易見的,并且可以在不脫離本發(fā)明的范圍或其實施方案下而進行。上面已詳細描述了本發(fā)明,參照以下實施例可以更清楚地理解本發(fā)明,這些實施例在此僅做例證,而非意在限制本發(fā)明。實施例實施例1轉(zhuǎn)染細胞以活化內(nèi)源基因表達方法構(gòu)建pRIG-1人DHFR由cDNA通過PCR進行擴增,所述cDNA是由HT1080細胞使用引物DHFR-F1(5’TCCTTCGAAGCTTGTCATGGTTGGTTCGCTAAACTGCAT3’)(SEQIDNO1)和DHFR-R1(5’AAACTTAAGATCGATTAATCATTCTTCTCATATACTTCAA3’)(SEQIDNO2)通過PCR制備的,并將人DHFR克隆至pTARGETTM(Promega)中的T位點產(chǎn)生pTARGETDHFR。用NheⅠ和XbaⅠ消化PREP9分離RSV啟動子,并將其插入pTARGETDHFR的NheⅠ位點產(chǎn)生pTgTRSV+DHFR。將寡核苷酸JH169(5’ATCCACCATGGCTACAGGTGAGTACTCG3’)(SEQIDNO3)和JH170(5’GATCCGAGTACTCACCTGTAGCCATGGTGGATTTAA3’)(SEQIDNO4)退火,并將其插入pTgTRSV+DHFR的Ⅰ-Ppo-Ⅰ和NheⅠ位點以產(chǎn)生pTgTRSV+DHFR+Exl。用引物TetF1(5’GGCGAGATCTAGCGCTATATGCGTTGATGCAAT3’)(SEQIDNO5)和TetF2(5’GGCCAGATCTGCTACCTTAAGAGAGCCGAAACAAGCGCTCATGAGCCCGAA3’)(SEQIDNO6)將相應于pBR322的230-508位核苷酸的279bp區(qū)進行PCR擴增。用BglⅡ消化擴增產(chǎn)物,并將其克隆至pTgTRSV+RSV+DHFR+Exl的BamHⅠ位點產(chǎn)生pRIG-1。轉(zhuǎn)染-在HT1080細胞中形成pRIG-1基因活化文庫為了活化基因表達,從上述構(gòu)建體組中選擇合適的活化構(gòu)建體。然后將所選的活化構(gòu)建體通過本領域任何已知轉(zhuǎn)染方法導入細胞。轉(zhuǎn)染方法的例子包括電穿孔、脂質(zhì)體轉(zhuǎn)染、磷酸鈣沉淀、DEAE右旋糖和受體介導的胞吞。導入細胞中之后,使DNA經(jīng)非同源重組整合到宿主細胞的基因組中。整合可以在自發(fā)染色體斷裂處或人工誘導的染色體斷裂處進行。方法用pRIG-1轉(zhuǎn)染人細胞。使2×109HH1細胞(HT1080細胞的HPRT亞克隆)在150mm組織培養(yǎng)板中生長至90%鋪滿。將培養(yǎng)液從細胞中吸出,作為條件培養(yǎng)液保存(參見下文)。通過將細胞與胰蛋白酶短暫溫育而使其從培養(yǎng)板上脫落,將其加入培養(yǎng)液/10%胎牛血清中以便中和胰蛋白酶,并在Jouan離心機中于1000rpm沉淀5分鐘。將細胞在1XPBS中洗滌、計數(shù)并如上述重新沉淀。將細胞沉淀以終濃度2.5×107細胞/ml重新懸浮在1XPBS(GibcoBRLCat#14200-075)中。然后將細胞暴露于50rads來自137Cs源的γ照射中。用BamHⅠ將pRIG-1線性化,用酚/氯仿提純,用乙醇沉淀并重懸于PBS中。將純化和線性化的活化構(gòu)建體加入細胞懸浮液中至終濃度為40μg/ml。然后將DNA/照射過的細胞混合物混勻,向每個0.4cm的電穿孔管(Biorad)中移入400μl該混合物。用電穿孔裝置(Biorad)給小管以250伏、600微法拉、50歐姆輸送脈沖。電脈沖后,將細胞于室溫培養(yǎng)10分鐘,然后移入含有青霉素/鏈霉素(Gibco/BRL)的αMEM/10%FBS中。將細胞鋪在含有35mlαMEM/10%FBS/penstrep(33%條件培養(yǎng)液/67%新鮮培養(yǎng)液)的培養(yǎng)板上,濃度為大約7×106細胞/150mm板。于37℃培養(yǎng)24小時后,將取自60mg/ml儲液的G418(Gibco/BRL)加入到每個培養(yǎng)板中至終濃度為500μg/ml。經(jīng)4天選擇后,用新鮮的αMEM/10%FBS/penstrep/500μg/mlG418替換培養(yǎng)液。然后再將細胞保溫7-10天,培養(yǎng)物上清液用于檢測新的蛋白因子的存在或者儲存在-80℃用于后面的分析。藥物抗性克隆可以保存在液氮中用于后面的分析。實施例2利用電離輻射來提高DNA整合的頻率和隨機性方法HH1細胞90%鋪滿時收集,在1XPBS中洗滌,以7.5×106細胞/ml的細胞濃度重懸于1XPBS中。向細胞中加入15μg線性化的DNA(pRIG-1),并混勻。將400μl加入各電穿孔管(Biorad)中,用電穿孔儀(Biorad)以250伏、600微法拉、50歐姆輸送脈沖。電脈沖后,將細胞于室溫培養(yǎng)10分鐘,然后移入2.5mlαMEM/10%FBS/1Xpenstrep中。從每次脈沖照射中取300μl細胞在轉(zhuǎn)染前或者轉(zhuǎn)染后1或4小時以0、50、500和5000rads照射。照射后,立即將細胞鋪在含完全培養(yǎng)基的組織培養(yǎng)板上。鋪板24小時后,向培養(yǎng)物中加入G418至終濃度為500μg/ml。選擇后7天時,將培養(yǎng)基換成含有500μg/mlG418的新鮮完全培養(yǎng)基。選擇后10天時,從培養(yǎng)板中吸出培養(yǎng)基,用考馬斯藍/90%甲醇/10%乙酸將細胞集落染色,并計數(shù)多于50個細胞的集落。實施例3用限制酶在基因組中產(chǎn)生隨機、半隨機或?qū)虻臄嗔逊椒℉HI細胞90%鋪滿時收集,在1XPBS中洗滌,以7.5×106細胞/ml的細胞濃度重懸于1XPBS中。為了檢測整合效率,向每份400μl等分的細胞中加入15μg線性化的DNA(PGK-βgeo)并混勻。然后向幾份細胞中加入限制酶XbaⅠ、NotⅠ、HindⅢ、IppoⅠ(10-500單位)以便分離細胞/DNA混合物。取400μl加入每個電穿孔管中,用電穿孔儀(Biorad)以250伏、600微法拉、50歐姆輸送脈沖。電脈沖后,將細胞于室溫培養(yǎng)10分鐘,然后移入2.5mlαMEM/10%FBS/1Xpenstrep中。從每次脈沖照射的2.5ml總細胞中取300μl細胞鋪在含完全培養(yǎng)基的組織培養(yǎng)板上。鋪板24小時后,向培養(yǎng)物中加入G418至終濃度為600μg/ml。選擇后7天時,將培養(yǎng)基換成含有600μg/mlG418的新鮮完全培養(yǎng)基。選擇后10天時,從培養(yǎng)板中吸出培養(yǎng)基,用考馬斯藍/90%甲醇/10%乙酸將細胞集落染色,并計數(shù)多于50個細胞的集落。實施例4通過對位于整合載體上的兩個擴增標記進行選擇來進行擴增載體整合到宿主細胞基因組后,可以通過同時或連續(xù)選擇位于整合載體上的1或多個擴增標記使遺傳基因座的拷貝數(shù)擴增。例如,可以使包含兩個擴增標記的載體整合到基因組中,并通過對位于載體上的這兩個擴增標記進行選擇來提高給定基因(即位于載體整合位點處的基因)的表達。這種方法大大方便了分離已經(jīng)擴增了正確基因座(即含有整合載體的基因座)的細胞克隆。一旦載體通過非同源重組整合到基因組中,則可將含有在獨特位置處整合的載體的細胞的單個克隆與其他含有在基因組中其它位置處整合的載體的細胞分離開。另一種方法是可選擇混合的細胞群體用于擴增。然后在對第一擴增標記具有特異性的第一種選擇試劑的存在下培養(yǎng)含有整合載體的細胞。該試劑挑選出已經(jīng)擴增載體和內(nèi)源染色體上的擴增標記的細胞。然后,通過在對第二擴增標記具有特異性的第二種選擇試劑的存在下培養(yǎng)細胞選擇這些細胞用于第二個選擇標記的擴增。經(jīng)過該第二個選擇步驟,載體和旁側(cè)基因組DNA均已擴增的細胞能夠存活,而只擴增了內(nèi)源的第一擴增標記的細胞或者是具備了非特異性抗性的細胞不能存活。當含有兩個以上(如3,4,5或更多)的擴增標記的載體整合到細胞基因組中時,可以以類似的方式,通過在對整合載體上所含的其他擴增標記具有特異性的選擇試劑的存在下對細胞進行連續(xù)培養(yǎng)來做附加選擇。挑選后,檢測存活細胞的所需基因的表達水平,并選出表達水平最高的細胞做進一步擴增。替代的做法是,可以進一步培養(yǎng)對兩種(如果使用了兩個擴增標記)或全部(如果使用了兩個以上擴增標記)選擇試劑具有抗性的細胞的集合,而不分離出單個克隆。然后將這些細胞擴展,并在更高濃度的第一種選擇試劑(通常是高兩倍)的存在下進行培養(yǎng)。重復該過程直至達到預期的表達水平??蛇x擇地,可以同時針對兩種(如果使用了兩個擴增標記)或全部(如果使用了兩個以上擴增標記)擴增標記來挑選含有整合載體的細胞。通過將兩種(如果使用了兩個標記)或全部(如果使用了兩個以上標記)選擇試劑加入其中培養(yǎng)了轉(zhuǎn)染細胞的選擇培養(yǎng)基中來實現(xiàn)同時挑選。大多數(shù)存活細胞已擴增了整合載體。然后可以將這些克隆分別篩選來鑒定表達水平最高的細胞,或者把它們作為一個集合來進行。給這些細胞施加更高濃度的各選擇試劑(通常是高兩倍)。然后再檢測存活細胞的表達水平。重復該過程直至達到預期表達水平。利用任何一種選擇策略(即同時或連續(xù)選擇),通過從沒有細胞毒性的低濃度到導致多數(shù)細胞死亡的高濃度滴定選擇試劑來獨立地確定所述選擇試劑的起始濃度。通常,選擇能形成離散集落(例如,所鋪的每100000個細胞形成幾百個集落)的濃度作為起始濃度。實施例5分離編碼跨膜蛋白質(zhì)的cDNApRIG8R1-CD2(圖5A-5D;SEQIDNO7)、pRIG8R2-CD2(圖6A-6C;SEQIDNO8)和pRIG8R3-CD2(圖7A-7C;SEQIDNO9)載體含有可操縱地連接到外顯子上的CMV立即早期啟動子,其后是一個未配對剪接供體位點。載體上的外顯子編碼一個信號肽,該信號肽連接到CD2的胞外結(jié)構(gòu)域(缺少框內(nèi)終止密碼子)。每個載體在相對剪接供體位點來說是不同的讀碼框內(nèi)編碼CD2。為了建立活化基因文庫,用50rads137Cs源照射2×107細胞,并用15μg線性化的pRIG8R1-CD2(SEQIDNO7)進行電穿孔。然后分別用pRIG8R2-CD2(SEQIDNO8),再用pRIG8R3-CD2(SEQIDNO9)重復該過程。轉(zhuǎn)染后,將三組細胞合并,以每皿5×106細胞的濃度鋪入150mm培養(yǎng)皿中,來建立文庫#1。轉(zhuǎn)染后24小時,用500μg/mlG418將文庫#1選擇14天。將含有整合至宿主細胞基因組中的載體的藥物抗性克隆合并、等分并冷凍以便分析。如上所述建立文庫#2,但其中用pRIG8R1-CD2、pRIG8R2-CD2和pRIG8R3-CD2分別轉(zhuǎn)染3×107細胞、3×107細胞和1×107細胞。為了分離含有編碼完整膜蛋白質(zhì)的活化基因的細胞,培養(yǎng)來自各文庫的3×106細胞并如下處理.用4ml胰蛋白酶-EDTA將細胞胰蛋白酶消化。.在細胞脫落后,添加8mlαMEM/10%FBS中和胰蛋白酶。.用無菌PBS將細胞洗一次,經(jīng)800g離心7分鐘收集。將細胞沉淀重懸于2mlαMEM/10%FBS中。1ml用于分選,另1ml重鋪在含有500μg/mlG418的αMEM/10%FBS中,擴展并保存。.將用于分選的細胞用無菌αMEM/10%FBS洗一次,經(jīng)800g離心7分鐘收集。.吸去上清液,將沉淀重新懸浮于1mlαMEM/10%FBS中。取100μl所述細胞用同種型對照物染色。.向900μl細胞中加入200μl抗-CD2FITC(Pharmingen目錄號#30054X),而向100μl細胞中加入20μl小鼠IgG1同種型對照物(Pharmingen目錄號#33814X)。將上述細胞在冰上培養(yǎng)20分鐘。.向含有用抗人CD2FITC染色的細胞的試管中加入5mlPBS/1%FBS。向同種型對照物中加入900μlPBS/1%FBS。以600g離心6分鐘收集細胞。.從試管中吸出上清液。將已用同種型對照物染色的細胞重懸于500μlαMEM/10%FBS中,將已用抗CD2FITC染色的細胞重懸于1.5mlαMEM/10%FBS中。.在FACSVantage流式細胞計(BectonDickinsonImmunocytometrySystems;MountainView,CA)上通過連續(xù)分選細胞5次來分選細胞。在每次分選中,收集所示的細胞總數(shù)的百分比的代表熒光最強的細胞(見下文),將其擴展,再分選。分選HT1080細胞作為陰性對照物。每次分選中分選并收集到以下細胞群<tablesid="table1"num="001"><table>文庫#1文庫#2文庫#3#1分選收集到500,000個細胞(最高10%)收集到100,000個細胞(最高10%)收集到40,000個細胞(最高10%)#2分選收集到300,000個細胞(最高5%)收集到220,000個細胞(最高11%)收集到14,000個細胞(最高5%)#3分選收集到90,000個細胞(最高5%)收集到40,000個細胞(最高的10%)收集到120,000個細胞(最高10%)#4分選收集到600,000個細胞(最高40%)(a)收集到6,000個細胞(最高5%)(b)收集到10,000個細胞(次高5%)收集到280,000個細胞(最高13%)#5分選(a)收集到260,000個細胞(最高10%)(b)收集到530,000個細胞(次高25%)(a)從#4分選的(a)組中收集到100,000個細胞(最高10%)和350,000個細胞(次高35%)(b)從#4分選的(b)組中收集到120,000個細胞(最高10%)未做</table></tables>將每個文庫最后一次分選得到的細胞擴展并保存于液氮中。從FACS分選細胞中分離活化基因一旦經(jīng)如上所述將細胞進行了分選,通過基于PCR的克隆從所述分選細胞中分離活化內(nèi)源基因。但本領域技術人員容易想到,可以等效地使用本領域公知的任何克隆基因的方法來從FACS分選的細胞中分離活化基因。按照以下方案分離基因(1)利用PolyATractSystem1000mRNA分離試劑盒(Promega),從來自文庫#1和#2的3×107CD2+細胞(如上所述,通過FACS分選5輪)中分離mRNA。(2)分離mRNA后,通過將0.5μl分離的mRNA稀釋到99.5μl水中并測定OD260來確定mRNA的濃度。從CD2+細胞回收到21μgmRNA。(3)然后如下合成第一鏈cDNA(a)PCR儀維持在4℃,通過連續(xù)添加以下成分制備第一鏈反應混合物41微升DEPC處理過的ddH2O4微升10mM各種dNTP8微升0.1MDTT16微升5xMMLV第一鏈緩沖液(Gibco-BRL)5微升(10pmol/μl)共有區(qū)多腺苷酸化位點引物GDR1(SEQIDNO10)1微升RNAsin(Promega)3微升(1.25μg/μl)mRNA備注GDR1,5’TTTTTTTTTTTTCGTCAGCGGCCGCATCNNNNTTTATT3’(SEQIDNO10)是用于由mRNA合成第一鏈cDNA的“基因開發(fā)”引物;該引物被設計成能與多腺苷酸化信號AATAAA和下游的多腺苷酸區(qū)退火。它能給第一鏈導入一個NotⅠ位點。一旦制備好樣品,即如下進行溫育(b)70℃1分鐘(c)維持于42℃,然后向每份樣品中加入2μl400U/μl的SuperScriptⅡ(Gibco-BRL;Rockville,MD),以產(chǎn)生82μl的最終總體積。大約3分鐘后,如下溫育樣品(d)37℃30分鐘(e)94℃2分鐘(f)4℃5分鐘然后向各樣品中加入2μl20U/μl的RNace-IT(Stratagene),將樣品于37℃溫育10分鐘。(4)第一鏈合成后,用PCR洗滌試劑盒(Qiagen)如下純化cDNA(a)將80μl第一鏈反應產(chǎn)物轉(zhuǎn)移入1.7ml硅氧烷化的eppendorf管,并加入400μlPB。(b)然后將樣品移入PCR洗滌柱子,于14000RPM離心2分鐘(c)將柱子拆下,傾析出徑流,向沉淀中加入750μlPE,然后將試管于14000RPM離心2分鐘。(d)將柱子拆下,傾析出徑流,將試管于14000RPM離心2分鐘以便干燥樹脂。(e)用50μlEB通過轉(zhuǎn)移柱將cDNA洗脫至新的硅氧烷化的eppendorf管中,然后以14000RPM離心2分鐘。(5)如下合成第二鏈cDNA(a)于室溫,連續(xù)添加以下成分制備第二鏈反應混合物ddH2O55μl10xPCR緩沖液10μl50mMMgCl25μl10mMdNTP2μl25pmol/μlRIG.751-Bio*4μl25pmol/μlGD.R2**4μl第一鏈產(chǎn)物20μl*備注RIG.751-Bio,5’生物素-CAGATCACTAGAAGCTTTATTGCGG3’(SEQIDNO11),在由pRIG載體表達得到的轉(zhuǎn)錄產(chǎn)物的帽子位點處退火。**備注GD.R2,5’TTTTCGTCAGCGGCCGCATC3’(SEQIDNO12)是用于PCR擴增cDNA的引物,所述cDNA是使用引物GDR1(SEQIDNO10)制備的。GD.R2是GDR1的亞序列,其帶有到達polyA信號序列前的簡并堿基的配對序列。(b)開始合成第二鏈94℃1分鐘,加入1μlTaq(5U/μl,Gibco-BRL),加入1μlVentDNApol(0.1U/μl,NewEnglandBiolabs),(c)于63℃溫育2分鐘,(d)于72℃溫育3分鐘,(e)將步驟(b)重復4次,(f)于72℃溫育6分鐘,(g)于4℃溫育(維持),(h)結(jié)束。(6)用STE洗3次制備200μl1mg/ml鏈霉抗生物素蛋白-Paramagnetic顆粒(SA-PMP)。(7)將第二鏈反應產(chǎn)物直接加入SA-PMP中,于室溫溫育30分鐘。(8)結(jié)合后,利用磁體收集SA-PMP,并回收徑流物質(zhì)。(9)用500μlSTE將磁珠洗3次。(10)將磁珠重懸于50μlSTE中,用磁體在試管底部收集磁珠。然后小心地將STE上清液吸出。(11)將磁珠重懸于50μlddH2O中,在100℃水浴中放置2分鐘,從PMP上釋放出純化的cDNA。(12)在磁體上收集PMP,并小心地吸出含有cDNA的上清液,從而回收到純化的cDNA。(13)將純化產(chǎn)物移至干凈試管中,于14000RPM離心2分鐘除去所有殘存的PMP。(14)然后如下進行PCR反應以便特異擴增RIG活化cDNA(a)通過于室溫連續(xù)添加以下成分來制備PCR反應混合物H2O59μl10xPCR緩沖液10μl50mMMgCl25μl10mMdNTP2μl25pmol/μlRIG.F781*2μl25pmol/μlGD.R22μl第二鏈產(chǎn)物20μl*備注RIG.F781,5’ACTCATAGGCCATAGAGGCCTATCACAGTTAAATTGCTAACGCAG3’(SEQIDNO13),在GD.F1、GD.F3、GD.F5-Bio以及RIG.F751-Bio的下游退火,并引入一個SfiⅠ位點用于cDNA的5’克隆。該引物用于巢式PCR擴增RIGExonl特異第二鏈cDNA。(b)啟動熱循環(huán)器94℃3分鐘,加入1μlTaq(5U/μl,Gibco-BRL),加入1μl0.1U/μl的VentDNA聚合酶(NewEnglandBiolabs),將步驟(c)到(e)循環(huán)10次做PCR(c)94℃30秒,(d)60℃40秒,(e)72℃3分鐘。然后進行以下步驟完成PCR(f)94℃30秒,(g)60℃40秒,(h)72℃3分鐘,(i)72℃,每個循環(huán)20秒,共10個循環(huán),(j)72℃5分鐘,(k)維持于4℃。(15)用50μlEB將文庫材料洗脫后,加入10μlNEB緩沖液2、40μldH2O和2μlSfiⅠ,并于50℃消化1小時將樣品進行消化,以便在由正向引物(RIG.F781;SEQIDNO13)編碼的SfiⅠ位點處切割cDNA的5’端。(16)SfiⅠ消化后,向每份樣品中加入5μl1MNaCl和2μlNotⅠ,于37℃將樣品消化1小時以便在由第一鏈引物(GD.R1;SEQIDNO10)所編碼的NotⅠ位點處切割cDNA的3’端。(17)然后,在1%低熔點瓊脂糖膠上分離消化過的cDNA。從膠上切下大小為1.2Kb到8Kb范圍的cDNA。(18)用QiaexⅡGelExtraction(Qiagen)從切下的瓊脂糖膠上回收cDNA。在總共10μl的1XT4連接酶緩沖液(NEB)中,用400單位T4DNA連接酶(NEB)將2μlcDNA(大約30mg)與7μl(35ng)pBS-HSB(用SfiⅠ/NotⅠ線性化過的)連接在一起。(19)用得自步驟(18)的0.5μl連接反應混合物轉(zhuǎn)化成大腸桿菌DH10B。(20)回收103個菌落/0.5μl連接的DNA。(21)用引物M13F20和JH182(RIGExonl特異性)經(jīng)PCR在12.5μl體積中如下篩選這些菌落的外顯子(a)將100μlLB(含有選擇抗生素)分裝到適當數(shù)量的96孔培養(yǎng)板中(b)挑選出單菌落,接種到96孔培養(yǎng)板的各個孔中,將培養(yǎng)板在37℃培養(yǎng)廂中不震蕩放置2-3小時。(c)在冰上如下制備PCR反應的“主混物”<tablesid="table2"num="002"><table>96孔培養(yǎng)板12.5μlPCRrxn的全部#1個板2個板3個板4個板96192288384dH2O755μl1.47ml2.20ml2.94ml5XPCR預混液-4250μl500μl750μl1.0mlF引物預混液(25pmol/微升)10μl20μl30μl40μlR引物預混液(25pmol/微升)10μl20μl30μl40μlRNace-Itcocktail3.2μl6.3μl9.6μl12.8μlTaq聚合酶(5U/μl)3.2μl6.3μl9.6μl12.8μl總體積(ml)1.012.023.034.04</table></tables>(d)將10μl主混合物分裝到PCR反應板的每個孔中(e)從每份100μl大腸桿菌培養(yǎng)物中取2.5μl移入PCR反應板上的相應孔中(f)采用典型的PCR循環(huán)條件進行PCR反應(ⅰ)94℃/2分鐘(細菌裂解和質(zhì)粒變性),(ⅱ)92℃變性15秒;60℃引物退火20秒;72℃引物延伸40秒;做30個循環(huán),(ⅲ)72℃最終延伸5分鐘,(ⅳ)維持于4℃。(g)向PCR反應中加入溴酚藍;將樣品混勻、離心,然后將全部反應混合物裝入瓊脂糖凝膠上。(23)在所篩選的200個克隆中,78%是載體外顯子陽性的。這些克隆中的96個作為小量制備物,并依照Qiagen小量制備手冊(1997年4月)用Qiagen96孔turbo-prep純化。(24)將2μlDNA同時用NotⅠ、BamHⅠ、XhoⅠ、HindⅢ、EcoRⅠ在NEB緩沖液3中(總體積為22μl)進行消化,然后在1%瓊脂糖凝膠上電泳來除去許多重復克隆。結(jié)果用所述方案篩選兩個不同的cDNA文庫。在第一個文庫(TMT#1)中,將分離到的活化基因中的8個測序。在這8個基因中,4個基因編碼已知的完整膜蛋白質(zhì),6個是新基因。在第二個文庫(TMT#2)中,將11個分離到的活化基因進行測序。11個基因中,一個基因編碼已知的完整膜蛋白質(zhì),一個基因編碼部分測序的與一個完整膜蛋白同源的基因,9個是新基因。在分離出的基因?qū)炎鲨b定的已知基因的所有情況下,該基因是完整膜蛋白質(zhì)。以下顯示分離自每個文庫的基因的示范性的顯著性比對(得自GenBank)TMT#1顯著性比對179761|gb|M76559|HUMCACNLB人神經(jīng)DHP-敏感性電壓依賴性,鈣通道α-2b亞單位mRNA完整CD長度=3600>gi|3183974|emb|Y10183|HSMEMD人MEMD蛋白質(zhì)的mRNA長度=4235TMT#2顯著性比對>gi|476590|gb|U06715|HSU06715人細胞色素B561,HCYTOB561,mRNA部分CD長度=2463>gi|2184843|gb|AA459959|AA459959zx66c01.s1soarestotalfetusNb2HF89w人cDNA克隆7964143’類似于gbJ03171干擾素α受體前體(人)長度=431。為了清楚理解的目的,通過闡述和實施例對本發(fā)明進行詳細描述后,本領域技術人員容易想到,可以在更寬和等效的條件、配方以及其他參數(shù)范圍內(nèi)對本發(fā)明進行改進或變化,而不會影響本發(fā)明的范圍或其任何具體實施方案,并且所述改進或變化包括在所附權(quán)利要求書的范圍內(nèi)。本說明書提及的所有出版物、專利和專利申請用于表明與本發(fā)明相關的本領域技術人員的技術水平,此處相同程度地引入作為參考文獻,并視作每篇出版物、專利和專利申請均是具體并單獨地引入作為參考文獻。權(quán)利要求1.一種本質(zhì)上由與未配對的剪接供體序列及一或多個擴增標記可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列組成的載體構(gòu)建體。2.一種本質(zhì)上由與翻譯起始密碼子、分泌信號序列及未配對的剪接供體位點可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列組成的載體構(gòu)建體。3.一種本質(zhì)上由與翻譯起始密碼子、表位標記及未配對的剪接供體位點可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列組成的載體構(gòu)建體。4.一種含有與翻譯起始密碼子、分泌信號序列、表位標記及未配對的剪接供體位點可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體構(gòu)建體。5.一種含有與翻譯起始密碼子、分泌信號序列、表位標記、序列特異性蛋白酶位點及未配對的剪接供體位點可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體構(gòu)建體。6.權(quán)利要求2-5任何一項的載體構(gòu)建體,其中所述構(gòu)建體還包含一個用于產(chǎn)生多順反子信息的內(nèi)部核糖體進入位點。7.權(quán)利要求2-5任何一項的載體構(gòu)建體,其中所述構(gòu)建體還包含一或多個擴增標記。8.權(quán)利要求6的載體構(gòu)建體,其中所述構(gòu)建體還包含一或多個擴增標記。9.權(quán)利要求1-5任何一項的載體構(gòu)建體,其中所述轉(zhuǎn)錄調(diào)控序列是一個啟動子。10.權(quán)利要求9的載體構(gòu)建體,其中所述啟動子是一個病毒啟動子。11.權(quán)利要求10的載體構(gòu)建體,其中所述病毒啟動子是一個巨細胞病毒立即早期啟動子。12.權(quán)利要求9的載體構(gòu)建體,其中所述啟動子是一個非病毒啟動子。13.權(quán)利要求9的載體構(gòu)建體,其中所述啟動子是一個誘導型啟動子。14.權(quán)利要求1-5任何一項的載體構(gòu)建體,其中所述轉(zhuǎn)錄調(diào)控序列是一個增強子。15.權(quán)利要求14的載體構(gòu)建體,其中所述增強子是一個病毒增強子。16.權(quán)利要求15的載體構(gòu)建體,其中所述病毒增強子是一個巨細胞病毒立即早期增強子。17.權(quán)利要求14的載體構(gòu)建體,其中所述增強子是一個非病毒增強子。18.含有權(quán)利要求1-5任何一項所述載體構(gòu)建體的細胞。19.權(quán)利要求18的細胞,其中所述載體構(gòu)建體已整合到細胞基因組中。20.權(quán)利要求19的細胞,其中通過所述載體構(gòu)建體上的所述轉(zhuǎn)錄調(diào)控序列上調(diào)基因,內(nèi)源基因在該細胞內(nèi)被過表達。21.權(quán)利要求18的細胞,其中所述細胞是一種分離的細胞。22.一種制備重組細胞的方法,包括將權(quán)利要求1-5任何一項所述構(gòu)建體導入細胞中。23.一種在細胞內(nèi)過表達內(nèi)源基因的方法,包括(a)將權(quán)利要求1-5任何一項的構(gòu)建體導入細胞中;(b)使該構(gòu)建體通過非同源重組整合到所述細胞的基因組中;和(c)使所述內(nèi)源基因在所述細胞內(nèi)過表達。24.權(quán)利要求23的方法,其中所述過表達在體外完成。25.權(quán)利要求23的方法,其中所述過表達在體內(nèi)完成。26.一種制備內(nèi)源細胞基因的分離的表達產(chǎn)物的方法,包括(a)根據(jù)權(quán)利要求23的方法在細胞內(nèi)過表達內(nèi)源基因,其中所述所述內(nèi)源基因的表達產(chǎn)物由所述細胞產(chǎn)生;以及(b)從所述細胞分離所述表達產(chǎn)物。27.一個包含用權(quán)利要求1-5任一項的構(gòu)建體轉(zhuǎn)化的細胞集合的細胞文庫,其中所述構(gòu)建體通過非同源重組整合到所述細胞的基因組中。28.一種從細胞文庫中獲得過表達基因產(chǎn)物的方法,包括篩選權(quán)利要求27的文庫用于所述基因產(chǎn)物的表達,從所述文庫中篩選過表達所述基因產(chǎn)物的細胞,并從所述選擇的細胞中獲得所述基因產(chǎn)物。29.一種制備內(nèi)源細胞基因的分離的表達產(chǎn)物的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導入細胞;(b)使所述載體通過非同源重組整合到所述細胞的基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;(e)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞;以及(f)分離所述表達產(chǎn)物。30.一種制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含非逆轉(zhuǎn)錄病毒轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞。31.一種制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含與分泌信號序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使內(nèi)源基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞。32.一種制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含與分泌信號序列可操縱地連接在一起的非逆轉(zhuǎn)錄病毒轉(zhuǎn)錄調(diào)控序列的載體導入細胞;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使所述基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞。33.一種制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含與未配對剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使所述基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞。34.權(quán)利要求30-33任一項的方法,還包括分離所述表達產(chǎn)物。35.一種在細胞中體內(nèi)過表達內(nèi)源細胞基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使所述基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞體內(nèi)過表達所述內(nèi)源基因的條件下,將所述分離和克隆的細胞導入動物中。36.一種體內(nèi)制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含與未配對剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使所述基因在細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞體內(nèi)過表達所述內(nèi)源基因的條件下將所述分離和克隆的細胞導入動物中。37.一種制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列和一或多個擴增標記的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;(e)在所述載體和所述基因在所述細胞內(nèi)發(fā)生擴增的條件下培養(yǎng)所述細胞;以及(f)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞。38.權(quán)利要求37的方法,還包括分離所述表達產(chǎn)物。39.一種在細胞中體內(nèi)過表達內(nèi)源細胞基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列和一或多個擴增標記的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在有利于所述細胞體內(nèi)過表達所述內(nèi)源基因的條件下,將所述分離和克隆的細胞導入動物中。40.權(quán)利要求26、28-33、35-37或39任何一項的方法,其中所述轉(zhuǎn)錄調(diào)控序列是一個啟動子。41.權(quán)利要求40的方法,其中所述啟動子是病毒啟動子。42.權(quán)利要求41的方法,其中所述病毒啟動子是一個巨細胞病毒立即早期啟動子。43.權(quán)利要求40的方法,其中所述啟動子是非病毒啟動子。44.權(quán)利要求40的方法,其中所述啟動子是誘導型的。45.權(quán)利要求26、28-33、35-37或39任何一項的方法,其中所述轉(zhuǎn)錄調(diào)控序列是一個增強子。46.權(quán)利要求45的方法,其中所述增強子是一個病毒增強子。47.權(quán)利要求46的方法,其中所述病毒增強子是一個巨細胞病毒立即早期增強子。48.權(quán)利要求45的方法,其中所述增強子是一個非病毒增強子。49.權(quán)利要求26、28-33、35-37或39任何一項的方法,還包括在所述載體發(fā)生整合之前或同時向所述細胞基因組DNA中導入雙鏈斷裂片段。50.由權(quán)利要求26、28-33、35-37或39任何一項的方法制備的細胞。51.權(quán)利要求29-33、35-37或39任何一項的方法,其中所述載體構(gòu)建體是線性的。52.一種在細胞內(nèi)過表達內(nèi)源細胞基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;和(e)在無血清培養(yǎng)基中培養(yǎng)所述細胞。53.一種制備內(nèi)源細胞基因的表達產(chǎn)物的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選過表達所述內(nèi)源基因的所述細胞;(e)在有利于所述細胞產(chǎn)生所述內(nèi)源基因的表達產(chǎn)物的條件下,培養(yǎng)所述細胞;以及(f)從相當于10升104細胞/ml的細胞生物量中分離所述表達產(chǎn)物。54.一種活化基因表達的方法,包括(a)將載體導入細胞基因組,其中所述載體包含調(diào)控序列和未配對的剪接供體位點并且缺少靶序列;以及(b)篩選表達基因的所述細胞。55.權(quán)利要求54的方法,還包括分離產(chǎn)生活化蛋白質(zhì)的細胞。56.一種活化基因表達的方法,包括(a)將載體通過非同源重組整合到細胞內(nèi),其中所述載體含有調(diào)控序列和未配對的剪接供體位點;以及(b)篩選表達基因的非同源重組細胞,其中所述基因和該基因的上游區(qū)域與載體沒有同源性。57.一種在細胞內(nèi)原位增強表型已知的基因表達的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對的剪接供體序列的載體;(b)將載體拷貝遞送至大量細胞;(c)在允許在插入的載體和細胞基因組之間發(fā)生非同源重組的條件下,培養(yǎng)細胞,以及(d)通過分析表型來篩選重組細胞以便鑒定到其中基因表達已被增強的細胞。58.權(quán)利要求57的方法,其中所述表型由一個特定蛋白質(zhì)產(chǎn)生,并通過檢測蛋白質(zhì)產(chǎn)量的增加來進行分析。59.一種在細胞內(nèi)原位增強表型已知的基因表達的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對的剪接供體序列的載體;(b)將載體拷貝遞送至大量細胞;(c)在能提高在載體和細胞基因組之間發(fā)生非同源重組可能性的條件下培養(yǎng)細胞,以及(d)通過分析表型來篩選重組細胞以便鑒定到其中基因表達已被增強的細胞。60.一種在細胞內(nèi)原位活化基因表達的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對的剪接供體序列的載體;(b)使載體通過非同源重組整合到至少100000個細胞中;以及(c)通過分析表型來篩選重組細胞以便鑒定到其中基因表達已被活化的細胞。61.一種其基因組中包含插入的遺傳構(gòu)建體的分離細胞,所述遺傳構(gòu)建體包含與未配對的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,其中所述構(gòu)建體插入基因或基因的上游區(qū)域并活化該基因的表達,并且該基因和基因的上游區(qū)域不含與遺傳構(gòu)建體同源的核苷酸序列。62.權(quán)利要求61的細胞,其中整合的遺傳構(gòu)建體另外含有一或多個擴增標記。63.一種其基因組中包含插入的遺傳構(gòu)建體的分離細胞,所述遺傳構(gòu)建體包含與未配對的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,其中該構(gòu)建體不合與所述基因或基因的上游區(qū)域同源的核苷酸序列。64.一種活化基因表達的方法,包括(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對的剪接供體序列的載體;(b)將所述載體導入細胞中;(c)在允許在插入的載體和細胞基因組之間發(fā)生非同源重組的條件下培養(yǎng)細胞;以及(d)通過分析基因表達來篩選重組細胞,其中所述基因和基因的上游區(qū)域沒有與載體同源的核苷酸序列。65.一種其基因組包含插入的遺傳構(gòu)建體的分離細胞,所述構(gòu)建體包含與未配對的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,其中該構(gòu)建體通過非同源重組插入基因或基因的上游區(qū)域中并且所述遺傳構(gòu)建體活化該基因的表達。66.一種增強基因表達的方法,包括(a)將載體導入細胞基因組,所述載體含有一個增強子序列和一或多個擴增標記并且缺少靶序列;以及(b)篩選表達基因的所述細胞。67.權(quán)利要求66的方法,還包括分離產(chǎn)生活化蛋白質(zhì)的細胞。68.一種增強基因表達的方法,包括(a)使載體通過非同源重組整合到細胞內(nèi),所述載體含有一個增強子序列;以及(b)篩選表達基因的非同源重組細胞,其中增強子是活性的該基因和該基因的上下游與載體沒有同源性。69.一種在細胞內(nèi)原位增強表型已知的基因表達的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含增強子的載體;(b)將載體拷貝遞送至大量細胞;(c)在允許在載體和細胞基因組之間發(fā)生非同源重組的條件下培養(yǎng)所述細胞,以及(d)通過分析表型來篩選重組細胞以便鑒定到其中基因表達已被增強的所述細胞。70.權(quán)利要求69的方法,其中所述表型由一個特定蛋白質(zhì)產(chǎn)生,并通過檢測蛋白質(zhì)產(chǎn)量的增加來進行分析。71.一種在細胞內(nèi)原位增強表型已知的基因表達的方法,該方法不需利用該基因的任何序列信息,包括以下步驟(a)構(gòu)建包含增強子的載體;(b)將載體拷貝遞送至大量細胞;(c)在能提高在載體和細胞基因組之間發(fā)生非同源重組可能性的條件下培養(yǎng)所述細胞,以及(d)通過分析表型來篩選重組細胞以便鑒定到其中基因表達已被增強的所述細胞。72.一種在細胞內(nèi)原位增強基因表達的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含增強子的載體;(b)使載體通過非同源重組整合到至少100000個細胞中;以及(c)通過分析表型來篩選重組細胞以便鑒定到其中基因表達被提高的所述細胞。73.一種其基因組中包含插入的人工遺傳構(gòu)建體的純化細胞,所述遺傳構(gòu)建體包含能有效增強基因在細胞系內(nèi)表達的增強子,所述遺傳構(gòu)建體插入其中增強子是有效的基因或基因的上下游區(qū)域,該基因及其上下游區(qū)域與遺傳構(gòu)建體中的任何序列沒有同源性。74.權(quán)利要求73的細胞,其中所述整合遺傳構(gòu)建體另外含有一或多個擴增標記。75.一種其基因組中包含插入的人工遺傳構(gòu)建體的分離細胞,所述遺傳構(gòu)建體包含能有效增強基因在細胞系內(nèi)表達的增強子,所述遺傳構(gòu)建體與其中增強子是有效的該基因及其上下游區(qū)域的任何序列沒有同源性。76.一種增強基因表達的方法,包括(a)構(gòu)建包含增強子的載體;(b)將所述載體導入所述細胞中;(c)在允許在插入的載體和細胞基因組之間發(fā)生非同源重組的條件下培養(yǎng)所述細胞;以及(d)通過分析基因表達來篩選重組細胞,在其中增強子是有效的所述基因和該基因的上下游區(qū)域與載體沒有同源性。77.一種其基因組中包含插入的遺傳構(gòu)建體的分離細胞,所述遺傳構(gòu)建體包含在細胞系中能有效活化內(nèi)源基因在所述細胞中表達的增強子,該遺傳構(gòu)建體通過非同源重組插入基因或基因的上下游區(qū)域。78.權(quán)利要求7的載體構(gòu)建體,其中所述載體構(gòu)建體包含1、2、3、4或5個擴增標記。79.權(quán)利要求8的載體構(gòu)建體,其中所述載體構(gòu)建體包含1、2、3、4或5個擴增標記。80.權(quán)利要求78或79的載體構(gòu)建體,其中所述載體構(gòu)建體包含1個擴增標記。81.權(quán)利要求78或79的載體構(gòu)建體,其中所述載體構(gòu)建體包含2個擴增標記。82.權(quán)利要求37、39或66任何一項的方法,其中所述載體構(gòu)建體包含1、2、3、4或5個擴增標記。83.權(quán)利要求82的方法,其中所述載體構(gòu)建體包含1個擴增標記。84.權(quán)利要求82的方法,其中所述載體構(gòu)建體包含2個擴增標記。85.權(quán)利要求62或74的細胞,其中所述整合遺傳構(gòu)建體包含1、2、3、4或5個擴增標記。86.權(quán)利要求85的細胞,其中所述整合遺傳構(gòu)建體包含1個擴增標記。87.權(quán)利要求85的細胞,其中所述整合遺傳構(gòu)建體包含2個擴增標記。88.權(quán)利要求26、28-33、35-37、39、52或53任何一項的方法,其中所述內(nèi)源基因編碼跨膜蛋白。89.權(quán)利要求23的方法,其中所述內(nèi)源基因編碼細胞跨膜蛋白。90.權(quán)利要求54、56、57、59、60、64、66、68、69、71、72或76任何一項的方法,其中所述基因編碼細胞跨膜蛋白。91.權(quán)利要求35、36或39任何一項的方法,還包括在將所述細胞導入動物之前分離和克隆該細胞。92.權(quán)利要求35、36或39任何一項的方法,其中所述動物是哺乳動物。93.權(quán)利要求92的方法,其中所述哺乳動物是人。94.一種鑒定編碼細胞完整膜蛋白的內(nèi)源基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導入細胞中;(b)使所述載體通過非同源重組整合到所述細胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對內(nèi)源基因的上調(diào),使該基因在所述細胞內(nèi)過表達;(d)篩選能過表達所述內(nèi)源基因的所述細胞;和(e)鑒定所述活化基因以便確定其與編碼細胞完整膜蛋白的基因的同一性。95.權(quán)利要求94的方法,其中在所述鑒定前從所述細胞分離所述活化基因。全文摘要本發(fā)明一般性地涉及通過原位重組法來活化基因表達或?qū)е禄蜻^表達。本發(fā)明還一般性地涉及使內(nèi)源基因在細胞中以高于正常細胞中所見的水平進行表達的方法。在本發(fā)明的一個實施方案中,在整合到細胞中后,通過活化基因表達的調(diào)控系列的一個能活化內(nèi)源基因表達的調(diào)控序列的非同源或非法重組;來活化或提高該內(nèi)源基因的表達。在另一個實施方案中,通過共整合一或多個擴增標記并選擇位于整合載體上的拷貝數(shù)增加的該一或多個擴增標記,從而進一步提高所述內(nèi)源基因的表達。本發(fā)明還提供了鑒定和表達那些用目前技術無法發(fā)現(xiàn)的基因的方法,因為整合不需要靶序列。本發(fā)明還提供了分離編碼跨膜蛋白質(zhì)的核酸分子(特別是cDNA分子)的方法,以及分離能表達這種可能是其異源跨膜蛋白質(zhì)的跨膜蛋白的細胞的方法。本發(fā)明還涉及分離的基因、基因產(chǎn)物、核酸分子和含有這些基因、基因產(chǎn)物及核酸分子的組合物,所述組合物可用于多種治療和診斷用途。因此,利用本發(fā)明,可以活化和分離內(nèi)源基因,包括那些與人類疾病和發(fā)育相關的基因,而不需要預先知道這些基因的序列、結(jié)構(gòu)、功能或表達特性。文檔編號C12P21/00GK1280615SQ98811571公開日2001年1月17日申請日期1998年9月25日優(yōu)先權(quán)日1997年9月26日發(fā)明者約翰·J·哈林頓申請人:阿瑟西斯公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
凤山县| 泰州市| 闻喜县| 潢川县| 铁力市| 邵阳县| 科技| 安新县| 湟源县| 永平县| 邯郸县| 萨迦县| 福海县| 镇宁| 高邑县| 乌兰浩特市| 鄂州市| 凭祥市| 沙田区| 韶山市| 南投县| 卫辉市| 彝良县| 吴桥县| 衡阳县| 陇西县| 甘南县| 汉寿县| 息烽县| 临沧市| 剑川县| 彝良县| 本溪市| 集贤县| 高安市| 茶陵县| 安丘市| 上栗县| 诏安县| 营口市| 峨边|