對細胞基因組的預(yù)定位點進行基因改造的方法
【專利摘要】本發(fā)明公開了重組細胞、用于對細胞進行基因改造的試劑以及對細胞基因組的預(yù)定位點進行基因改造的方法,其中該重組細胞過表達:第一核酸分子,所述第一核酸分子編碼Cas9蛋白或其衍生物,所述Cas9蛋白的衍生物與所述Cas9蛋白相比,缺失DNA切割活性,但保留靶點識別活性。利用該重組細胞,能夠有效地通過將Che-chiRNA,或Che-gRNA以及tracrRNA轉(zhuǎn)入本發(fā)明的重組細胞中,即可容易地執(zhí)行基因組編輯或基因表達調(diào)控,從而有效地實現(xiàn)對細胞基因組的預(yù)定位點進行基因改造。
【專利說明】對細胞基因組的預(yù)定位點進行基因改造的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物【技術(shù)領(lǐng)域】,更具體的,本發(fā)明涉及重組細胞、用于對細胞進行基因 改造的試劑以及對細胞基因組的預(yù)定位點進行基因改造的方法。
【背景技術(shù)】
[0002] CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9 是近兩年被廣泛認可的由RNA指導(dǎo)Cas核酸酶對靶向基因進行特定DNA修飾的技術(shù)。在該 技術(shù)中,crRNA(CRISPR_derived RNA)通過喊基配對與 tracrRNA (trans-activating RNA) 結(jié)合形成雙鏈RNA,得到tracrRNA/crRNA二兀復(fù)合體。所得到的tracrRNA/crRNA二兀復(fù)合 體能夠指導(dǎo)Cas9蛋白在與crRNA引導(dǎo)序列匹配的靶定位點剪切雙鏈DNA,從而達到對基因 組DNA進行修飾的目的。CRISPR/Cas9系統(tǒng)能夠?qū)Χ喾N物種的基因組特定基因位點進行精 確編輯,目前已經(jīng)成功應(yīng)用于大、小鼠、人源細胞等基因敲除和敲入的模型制備。
[0003] Cas9系統(tǒng)進行有效工作需要三種元件,即crRNA (CRISPR-derived RNA,靶標(biāo)識別 20 個或 30 個喊基)、tracrRNA(trans-activating RNA)及 Cas9 蛋白。
[0004] 由于crRNA和tracrRNA可以串聯(lián)操作,所以三元件系統(tǒng)也可以簡化成兩元件系 統(tǒng),即chiRNA(由crRNA及tracrRNA串聯(lián)簡并而成,祀標(biāo)識別20個堿基)、Cas9蛋白。故 而目前利用Cas9系統(tǒng)進行基因組編輯及基因表達調(diào)控的主流策略共有兩種:三元件系統(tǒng)、 -兀件系統(tǒng)。
[0005] 然而,目前利用Cas9系統(tǒng)進行基因組編輯及基因表達調(diào)控的方法仍有待改進。
【發(fā)明內(nèi)容】
[0006] 需要說明的是,本發(fā)明是基于發(fā)明人的下列發(fā)現(xiàn)而完成的:
[0007] 現(xiàn)階段,利用Cas9系統(tǒng)進行基因組編輯及基因表達調(diào)控,主要有兩種策略:一是 外源質(zhì)粒系統(tǒng)策略;二是體外轉(zhuǎn)錄合成chiRNA策略。
[0008] 其中,第一種策略(即外源質(zhì)粒系統(tǒng)策略),是將Cas9系統(tǒng)相關(guān)的元件組裝在外源 表達質(zhì)粒系統(tǒng)中,即為將三元件系統(tǒng)或兩元件系統(tǒng)中的元件全部整合在一個外源表達載體 上,針對基因組中不同的靶點,每次只需對相應(yīng)的crRNA或chiRNA部分進行質(zhì)粒的重組即 可,其他部分不用操作,然后將質(zhì)粒轉(zhuǎn)入相應(yīng)的實驗?zāi)P椭芯涂梢允蛊涔ぷ鳌T摬呗跃哂幸?下缺點:
[0009] 1.靶點選擇的局限:目前常用的靶向識別位點長度為20個堿基,由于U6啟動子 后連接的第一個堿基必須為G(鳥嘌呤),因此限定了該20個堿基的第一個堿基必須為G, 這就造成了很強的限制,致使靶點的選擇喪失了極大的選擇空間;
[0010] 2.單質(zhì)粒系統(tǒng):構(gòu)建好的外源質(zhì)粒過大,會產(chǎn)生不易轉(zhuǎn)染(尤其對于轉(zhuǎn)染效率本 來就很低的細胞尤甚)或轉(zhuǎn)染拷貝數(shù)過低的問題,而這是Cas9系統(tǒng)常見的效率低下的主 因;
[0011] 3.多質(zhì)粒系統(tǒng):如需使Cas9系統(tǒng)起效,就要要求全部元件共轉(zhuǎn)入同一細胞,而共 轉(zhuǎn)效率卻是此技術(shù)策略的瓶頸;
[0012] 4.病毒載體系統(tǒng):Cas9蛋白過大,為4千多個bp,不易包裝,致使病毒的包裝成功 率過低,難以高效的行使功能;
[0013] 5.針對不同位點:需要多次構(gòu)建crRNA或chiRNA的載體表達部分,操作不便;
[0014] 6. -次性針對多位點操作:需要多個質(zhì)粒共同轉(zhuǎn)染,共轉(zhuǎn)效率低,致使針對多靶 點的操作效率低下;
[0015] 7. Cas9蛋白表達量不穩(wěn)定:外源表達的Cas9基因轉(zhuǎn)入每個細胞的拷貝數(shù)不同,造 成細胞中Cas9蛋白的表達量不穩(wěn)定、均一,限制了 Cas9系統(tǒng)的工作效率;
[0016] 8.針對高、中通量操作,周期長,時間成本、人力成本過高。
[0017] 第二種策略(即體外轉(zhuǎn)錄合成chiRNA策略),是將現(xiàn)有的Cas9二元件系統(tǒng)分 離,即分為:體外轉(zhuǎn)錄chiRNA和cas9蛋白。體外轉(zhuǎn)錄chiRNA是通過質(zhì)粒構(gòu)建的方式將 靶點序列插入到譬如pT7-gRNA這樣的載體上,再用T7或SP6等轉(zhuǎn)錄酶在實驗室體外環(huán)境 下制備成chiRNA ;Cas9蛋白的表達在這一方案中有多種形式:通過轉(zhuǎn)染實現(xiàn)的外源表達, Cas9mRNA (亦為體外轉(zhuǎn)錄)的胚胎注射,通過病毒載體整合到基因組中,將Cas9基因序列定 點敲入到基因組中。該策略具有以下缺點:
[0018] 1.體外轉(zhuǎn)錄ChiRNA靶點選擇的局限:目前常用的靶向識別位點長度為20個堿 基,由于T7或SP6啟動子后連接的第一或前兩個堿基必須為G(鳥嘌呤),因此限定了該20 個堿基的第一或前兩個堿基必須為G,這就造成了很強的限制,致使靶點的選擇喪失了極大 的選擇空間;
[0019] 2.體外轉(zhuǎn)錄chiRNA操作環(huán)境要求高、技術(shù)要求高,轉(zhuǎn)錄制備出的RNA在體外環(huán)境 中極其不穩(wěn)定,要極其小心處理以避免環(huán)境中無處不在的RNA酶;全流程的操作技術(shù)要求 也遠高于其他分子生物學(xué)實驗;
[0020] 3.體外轉(zhuǎn)錄chiRNA成本高,中間過程多用到RNA相關(guān)的試劑盒,而RNA試劑盒往 往價格不菲,造成全流程成本不低;
[0021] 4.體外轉(zhuǎn)錄chiRNA制備步驟多,周期長,流程復(fù)雜:需要訂購祀點的Oligo、退火 鏈接、轉(zhuǎn)化、測序鑒定、質(zhì)粒制備、PCR、PCR產(chǎn)物純化、轉(zhuǎn)錄、轉(zhuǎn)錄產(chǎn)物純化、質(zhì)量鑒定等諸多 步驟;
[0022] 5. Cas9蛋白如需共轉(zhuǎn)染,共轉(zhuǎn)染效率亦是問題。
[0023] 6.針對高、中通量操作,周期長,時間成本、人力成本過高。
[0024] 本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本發(fā)明的一個目的 在于提出一種相對于現(xiàn)有技術(shù)操作更簡便、更加安全穩(wěn)定、更加高效快速、通量更高,適用 于各種通量的,利用改進的Cas9系統(tǒng)對細胞基因組的預(yù)定位點進行基因改造的方法。
[0025] 因而,根據(jù)本發(fā)明的一個方面,本發(fā)明提供了一種重組細胞。根據(jù)本發(fā)明的實施 例,所述細胞過表達:第一核酸分子,所述第一核酸分子編碼Cas9蛋白或其衍生物,所述 Cas9蛋白的衍生物與所述Cas9蛋白相比,缺失DNA切割活性,但保留靶點識別活性。發(fā)明人 驚奇地發(fā)現(xiàn),利用該重組細胞,能夠有效地通過將Che-chiRNA,或Che-gRNA以及tracrRNA 轉(zhuǎn)入本發(fā)明的重組細胞中,即可容易地執(zhí)行基因組編輯或基因表達調(diào)控,從而有效地實現(xiàn) 對細胞基因組的預(yù)定位點進行基因改造。
[0026] 另外,根據(jù)本發(fā)明上述實施例的重組細胞還可以具有如下附加的技術(shù)特征:
[0027] 根據(jù)本發(fā)明的實施例,所述第一核酸分子定位于所述細胞基因組中的H3F3A基因 中。這是因為,H3F3A位于常染色體,將第一核酸分子定位于H3F3A基因操作方便;H3F3A在 任何組織中均有表達,可以保證外源基因的有效表達;而融合表達可以盡可能的避免外源 DNA的非同源重組。
[0028] 根據(jù)本發(fā)明的實施例,所述細胞過表達:第二核酸分子,所述第二核酸分子編碼 tracrRNA〇
[0029] 根據(jù)本發(fā)明的實施例,所述第一核酸分子具有如下所示的核苷酸序列:atgCCaaag aagaagcggaaggtcggtatccacggagtcccagcagccgacaagaagtacagcatcggcctggacatcggcaccaa ctctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgacc ggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaag agaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggc caaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcacc ccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactg gtggacagcaccgacaaggccgacctgcggctgatetatctggccctggcccacatgatcaagttccggggccactt cctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaacc agctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagc agacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgag cctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacct acgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctg tccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgat caagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtaca aagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctac aagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgct gcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggc ggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctac tacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctg gaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacc tgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtg aaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgtt caagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtgg aaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaag gacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagaga gatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagat acaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggat ttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagagga catccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgcca ttaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaac atcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggat cgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgaga agctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgac tacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcga caagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgc tgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggat aaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccg gatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgt ccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctg aacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggt gtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagca acatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaac ggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagt gaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgata agctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtg ctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcat ggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctga tcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactg cagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaa gggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagc agatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcac cgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgc cttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatcc accagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggcgacaaaaggccggcggccacg aaaaaggccggccaggcaaaaaagaaaaagtaa(SEQIDNO:l),SEQIDNO:l所不核苷酸序列編碼 野生型Cas9蛋白;
[0030] 所述第二核酸分具有如下所示的核苷酸序列:GGTAGTATTAAGTATTGTTTTATGGCTGA TAAATTTCTTTGAATTTCTCCTTGATTATTTGTTATAAAAGTTATAAAATAATCTTGTTGGAACCATTCAAAACAG CATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT(SEQ ID NO :2),SEQ ID NO :2所示的核苷酸序列編碼tracrRNA。
[0031] 根據(jù)本發(fā)明的實施例,所述第二核酸分子定位于所述細胞基因組中的H3F3A基因 中。由此,將第二核酸分子定位于H3F3A基因的操作方便,能夠保證第二核酸分子的有效表 達,且融合表達可以盡可能的避免第二核酸分子的非同源重組。
[0032] 根據(jù)本發(fā)明的實施例,沿著5'端至3'端的方向,所述第一核酸分子位于所述第二 核酸分子的上游。
[0033] 根據(jù)本發(fā)明的實施例,所述Cas9蛋白的衍生物與所述Cas9蛋白相比具有下列突 變至少之一:D10A和H840A。其中,"D10A"表示與所述Cas9蛋白相比,所述Cas9蛋白的衍 生物的第10個氨基酸D突變?yōu)锳,"H840A"表示與所述Cas9蛋白相比,所述Cas9蛋白的衍 生物的第840個氨基酸由Η突變?yōu)锳。由此,重組細胞中Cas9蛋白的衍生物過表達效率高, Cas9蛋白與Che-chiRNA,或Che-gRNA以及tracrRNA高度匹配,有利于用于進行后續(xù)的基 因組預(yù)定位點的基因改造。需要說明的是,本發(fā)明所采用的表達方式"Cas9蛋白"即為野生 型Cas9蛋白,"Cas9蛋白的衍生物"即為Cas9蛋白突變體。
[0034] 根據(jù)本發(fā)明的實施例,所述基因組過表達基因表達調(diào)控元件。需要說明的是,利用 無核酸酶切割活性的Cas9蛋白與特異的轉(zhuǎn)錄調(diào)節(jié)元件(VP16、VP48、VP64、KRAB、SID4X等) 融合表達,能夠?qū)蚪M內(nèi)源基因的表達進行人為干預(yù)、調(diào)控。進而,根據(jù)本發(fā)明的一個具 體示例,所述基因表達調(diào)控元件為SID4X或VP64。其中,SID4X由四個mSin3interacting domain串聯(lián)而成,可以與轉(zhuǎn)錄調(diào)控基因 Sin3A、Sin3B的PAH2結(jié)構(gòu)域結(jié)合,從而達到抑制基 因表達的效果。VP64由四個VP16結(jié)構(gòu)域串聯(lián)而成,可以與0ctl、HCF等轉(zhuǎn)錄因子結(jié)合進而 啟動基因的表達。
[0035] 根據(jù)本發(fā)明的實施例,沿著5'端至3'端的方向,所述第一核酸分子位于所述 SID4X的下游。由此,能夠盡可能的降低其他轉(zhuǎn)錄因子的競爭結(jié)合,使SID4X的作用更穩(wěn)定。
[0036] 根據(jù)本發(fā)明的實施例,沿著5'端至3'端的方向,所述第一核酸分子位于所述VP64 的上游。由此,有利于VP64招募轉(zhuǎn)錄因子進行基因表達,減少Cas9蛋白對VP64或被招募 蛋白的干擾。
[0037] 根據(jù)本發(fā)明的又一方面,本發(fā)明還提供了一種用于對細胞進行基因改造的試劑。 根據(jù)本發(fā)明的實施例,該試劑包含:Che-chiRNA ;或者Che-gRNA以及任選地Che-tracrRNA。 由此,將本發(fā)明的針對靶基因的試劑轉(zhuǎn)入前述的重組細胞中,即可容易地執(zhí)行基因組編輯 或基因表達調(diào)控,從而有效地實現(xiàn)對細胞基因組的預(yù)定位點進行基因改造。
[0038] 根據(jù)本發(fā)明的實施例,Che-chiRNA 包含序列:5 ' - (N) 2(iGUUUUAGAGCUAGAAAUAGCA AGUUAAAAU-3'(SEQ ID NO :3),N = A、U、G或C。由此,由此,相對于現(xiàn)有技術(shù),本發(fā)明的 Che-chiRNA的長度為20個堿基的靶向識別位點的第一或前兩個堿基不需要必須為G (鳥嘌 呤),從而Che-chiRNA轉(zhuǎn)染靶點的選擇局限小。進而,利用本發(fā)明的試劑對細胞基因組的預(yù) 定位點進行基因改造時,效率高,效果好。
[0039] 根據(jù)本發(fā)明的實施例,Che-gRNA包含序列:5'-(N)2QGUUUUAGAGCUA-3'(SEQ ID N0 : 4),N = A、U、G或C。由此,相對于現(xiàn)有技術(shù),本發(fā)明的Che-gRNA的長度為20個堿基的靶 向識別位點的第一或前兩個堿基不需要必須為G (鳥嘌呤),從而Che-gRNA轉(zhuǎn)入祀點的選擇 局限小。進而,利用本發(fā)明的試劑對細胞基因組的預(yù)定位點進行基因改造時,效率高,效果 好。
[0040] 根據(jù)本發(fā)明的實施例,Che_chiRNA、Che_gRNA以及Che-tracrRNA的至少之一是化 學(xué)合成的。由此,當(dāng)用于對細胞基因組的預(yù)定位點進行基因改造時,RNA靶向識別區(qū)域不受 啟動子等因素的限制,靶點選擇更廣泛,RNA質(zhì)量安全穩(wěn)定、定量準(zhǔn)確,操作簡便、高效,整合 后起效快速、通量高。
[0041] 根據(jù)本發(fā)明的另一方面,本發(fā)明還提供了一種對細胞基因組的預(yù)定位點進行基因 改造的方法。根據(jù)本發(fā)明的實施例,該方法包括:提供前面所述的重組細胞;以及將前面所 述的試劑引入到所述重組細胞中,其中,所述Che-chiRNA或Che-gRNA的基序(N) 2(|是基于 所述預(yù)定位點的序列設(shè)計的。由此,能夠容易地執(zhí)行基因組編輯或基因表達調(diào)控,從而有效 地實現(xiàn)對細胞基因組的預(yù)定位點進行基因改造,且相對于現(xiàn)有技術(shù)操作更簡便、更加安全 穩(wěn)定、更加高效快速、通量更高,適用于各種通量。
[0042] 根據(jù)本發(fā)明的實施例,所述基因改造包括對預(yù)定位點進行基因敲除或表達調(diào)控。
[0043] 需要說明的是,在本文中所使用的術(shù)語"基因改造"應(yīng)做廣義理解,其指任何能夠 影響基因轉(zhuǎn)錄、翻譯、表達、序列的任何操作,例如,可以上調(diào)或者下調(diào)相關(guān)基因的表達,啟 動相關(guān)基因的轉(zhuǎn)錄和翻譯,切斷相關(guān)基因的序列,在相關(guān)基因的序列中造成突變,諸如插 入、缺失以及置換等。當(dāng)然,本領(lǐng)域技術(shù)人員能夠理解的是,可以在相同的基因中同時進行 多個基因改造的操作。
[0044] 另外,根據(jù)本發(fā)明的實施例,相對于現(xiàn)有的利用Cas9系統(tǒng)進行基因組編輯及基因 表達調(diào)控的方法,本發(fā)明的對細胞基因組的預(yù)定位點進行基因改造的方法至少具有以下優(yōu) 占·
[0045] 1.根據(jù)本發(fā)明的實施例,化學(xué)合成RNA靶向識別區(qū)域不受啟動子等因素的限制, 靶點選擇更廣泛;
[0046] 2.根據(jù)本發(fā)明的實施例,化學(xué)合成RNA質(zhì)量安全穩(wěn)定、定量準(zhǔn)確:由于是通過化學(xué) 合成方法制備而成,全流程得到標(biāo)準(zhǔn)質(zhì)控監(jiān)督,通過對RNA進行5'端、3'端、單鏈或雙鏈等 修飾,可以達到RNA即有效又穩(wěn)定的效果;且合成過程中分子量已知、合成量已知,可以做 到精確定量,方便后續(xù)的操作;
[0047] 3.根據(jù)本發(fā)明的實施例,化學(xué)合成RNA高效、操作簡便:由于RNA的分子量較小, 在轉(zhuǎn)染效率相同的情況下,當(dāng)與前述現(xiàn)階段的兩種利用Cas9系統(tǒng)進行基因組編輯及基因 表達調(diào)控的策略使用相同質(zhì)量的轉(zhuǎn)染物時,RNA的拷貝數(shù)更高,會招募更多的Cas9蛋白進 行工作,所以更加高效;由于是通過化學(xué)合成方法制備而成,RNA的轉(zhuǎn)染可像siRNA轉(zhuǎn)染一 般輕松完成,而且轉(zhuǎn)染試劑與siRNA轉(zhuǎn)染試劑相同,方便實驗室的使用;
[0048] 4.根據(jù)本發(fā)明的實施例,化學(xué)合成RNA起效快速、通量高:因為Cas9蛋白已整合 到基因組中,在細胞內(nèi)已經(jīng)表達,所以RNA進入到細胞內(nèi)部即開始招募Cas9蛋白進行工作; 可將多個合成RNA混合在一起進行多靶點操作,亦可用多個合成RNA進行并行實驗,以此提 高工作通量及效率;
[0049] 5.根據(jù)本發(fā)明的實施例,Cas9蛋白精確整合到基因組中的特定位點,表達穩(wěn)定, 可做到在表達時間及表達量上的準(zhǔn)確調(diào)通;不會造成對基因組造成安全性和穩(wěn)定性等方面 的破壞。
[0050] 本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【專利附圖】
【附圖說明】
[0051] 本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變 得明顯和容易理解,其中 :
[0052] 圖1顯示了根據(jù)本發(fā)明一個實施例,流式細胞術(shù)檢測基因重組效率的結(jié)果;
[0053] 圖2顯示了根據(jù)本發(fā)明一個實施例,用于鑒定Cas9基因插入H3F3A基因中的PCR 示意圖以及PCR產(chǎn)物的電泳結(jié)果;
[0054] 圖3顯示了根據(jù)本發(fā)明一個實施例,T7內(nèi)切酶檢測細胞靶點破壞情況的電泳結(jié) 果;
[0055] 圖4顯示了根據(jù)本發(fā)明一個實施例,qPCR檢測細胞內(nèi)CXCR4和MyoDl基因的表達 量的結(jié)果。
【具體實施方式】
[0056] 下面詳細描述本發(fā)明的實施例,需要說明的是,下列實施例僅僅是為了解釋本發(fā) 明,而不對本發(fā)明的范圍造成任何限制。
[0057] 實施例1 :在HELA細胞中進行基因敲除
[0058] 1、制備攜帶外源基因的細胞
[0059] 將H3F3A基因內(nèi)部靶點破壞質(zhì)粒pDSB-H3. 3與帶有插入基因片段的同源重組工具 質(zhì)粒Donor-KI-l/Donor-KI-2共轉(zhuǎn)染到Hela細胞中。
[0060] 其中,pDSB-H3. 3依次包含下列序列:U6啟動子,H3F3A gRNA-1,U6啟動子, H3F3A gRNA-2, CBh啟動子,F(xiàn)lag標(biāo)簽蛋白的編碼基因,Cas9(D10A)蛋白的編碼基因。其 中Cas9(D10A)蛋白為野生型Cas9蛋白的衍生物,其相對于野生型Cas9蛋白(SEQ ID N0 : 1所示核苷酸序列編碼的蛋白)具有D10A突變,Cas9(D10A)蛋白的編碼基因,相對于SEQ ID N0 :1所示核苷酸序列第74位堿基由A突變?yōu)镃。
[0061] Donor-ΚΙ-Ι依次包含下列序列:H3F3A同源重組臂左臂,SA剪切序列,H3F3A最后 一個外顯子上的⑶S序列(不含終止密碼子),2A自斷裂序列,puromycin抗性基因 ,polyA 尾,CBh啟動子,F(xiàn)lag標(biāo)簽蛋白的編碼基因,Cas9基因(序列如SEQ ID NO :1所示),bGH polyA尾,H3F3A同源重組臂右臂。
[0062] Donor-KI-2依次包含下列序列:H3F3A同源重組臂左臂,SA剪切序列,H3F3A最后 一個外顯子上的⑶S序列(不含終止密碼子),2A自斷裂序列,puromycin抗性基因 ,polyA 尾,CBh啟動子,F(xiàn)lag標(biāo)簽蛋白,Cas9基因(序列如SEQ ID NO :1所示),bGH polyA尾,HI 啟動子,short tracrRNA序列,H3F3A同源重組臂右臂。
[0063] 需要說明的是,上述各載體均是通過PCR方法獲得上述的相應(yīng)各組件片段,然后 依次添加到T載體上而構(gòu)建獲得的。
[0064] 共轉(zhuǎn)染前24小時,將細胞以40%的密度接種到24孔板的一個孔中。
[0065] 上述轉(zhuǎn)染是采用轉(zhuǎn)染試劑:X_tremeGENE HP DNA Transfection Reagent,按說明 書進行操作的。具體地,將DNA總量1 μ g稀釋于lOOuL 0ΡΤΙ-ΜΕΜ培養(yǎng)基中,再加入3 μ L X-tremeGENE HP DNA Transfection Reagent混勻靜置15分鐘,取50 μ L加入有細胞培養(yǎng) 的孔中,震蕩混勻,24小時后更換培養(yǎng)基即可。
[0066] 然后,通過流式細胞術(shù)檢測基因重組效率,圖1顯示了流式細胞術(shù)的結(jié)果。其中, 如圖1所示,通過特異性抗體anti-Flag將Cas9蛋白標(biāo)記上綠色突光,WT為野生型對照。 進而,基于流式細胞術(shù)的結(jié)果,將綠色熒光陽性的細胞分選出,進行培養(yǎng)之后,PCR鑒定外源 片段(即Cas9基因)準(zhǔn)確插入到H3F3A的基因中。圖2顯示了 PCR示意圖以及PCR產(chǎn)物 的電泳結(jié)果。如圖2所示,分別用同源重組臂外側(cè)的兩個引物P1、P2,和插入片段內(nèi)部的兩 個引物P3、P4,三種組合方式對綠色熒光陽性細胞樣品進行PCR,并將PCR產(chǎn)物進行1%瓊 脂糖凝膠電泳;其中,PCR示意圖中KI fragment表示插入H3F3A基因中的Cas9基因,電 泳圖中ΚΙ-l泳道為采用pDSB-H3. 3與Donor-ΚΙ-Ι共轉(zhuǎn)染后的PCR產(chǎn)物,KI-2泳道為采用 PDSB-H3. 3與Donor-KI-2共轉(zhuǎn)染后的PCR產(chǎn)物。
[0067] 由此,制備獲得僅攜帶Cas9的Hela細胞(即采用Donor-ΚΙ-Ι共轉(zhuǎn)染獲得的重組 細胞)、同時攜帶Cas9+tracrRNA的Hela細胞(即采用Donor-KI-2共轉(zhuǎn)染獲得的重組細 胞)。
[0068] 2、針對人基因組中基因 EMX1、PVALB的靶點設(shè)計、合成che-chiRNA和che-gRNA。
[0069] 其中,che-chiRNA和che-gRNA的設(shè)計原則為:
[0070] a.序列必須符合(N)2CINGG的序列,(N)2CI靶向識別區(qū)域,NGG為Cas9切割位點;
[0071] b.所使用的靶點序列在全基因組出現(xiàn)錯配的概率盡可能的接近0。
[0072] 分別在EMX1和PVALB基因的全長中搜索符合上述原則的靶點,然后按照 che-chiRNA和che-gRNA設(shè)計的原則生成相應(yīng)的RNA序列。本實施例的RNA由美國IDT公 司生產(chǎn)。
[0073] 結(jié)果如下所示:
[0074] 針對EMX1基因:
[0075] che-gRNA 序列為:GGGGCCACUAGGGACAGGAUGUUUUAGAGCUAUGCUGUUUUG(SEQ ID N0 : 5);
[0076] che-chiRNA 序列為:GGGGCCACUAGGGACAGGAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUA AGGCUAGUCCG(SEQ ID NO :6)〇
[0077] 針對PVALB基因:
[0078] che-gRNA 序列為:AUUGGGUGUUCAGGGCAGAGGUUUUAGAGCUAUGCUGUUUUG (SEQ ID NO : 7);
[0079] che-chiRNA 序列為:AUUGGGUGUUCAGGGCAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUA AGGCUAGUCCG(SEQ ID NO :8)。
[0080] 3、轉(zhuǎn)染
[0081] 利用前面針對EMX1、PVALB的靶點合成的che-chiRNA分別轉(zhuǎn)染前面獲得的僅攜 帶Cas9的Hela細胞(即采用Donor-ΚΙ-Ι共轉(zhuǎn)染獲得的重組細胞);利用前面針對EMX1、 PVALB的靶點合成的che-gRNA分別轉(zhuǎn)染同時攜帶Cas9+tracrRNA的Hela細胞(即采用 Donor-KI-2共轉(zhuǎn)染獲得的重組細胞)。其中,每一個細胞的每一個基因的che-chiRNA或 che-gRNA的轉(zhuǎn)染均是單獨進行,即均是獨立地實驗,由此,每個獨立實驗都是一種細胞敲除 一個基因,從而僅攜帶Cas9的Hela細胞能夠分別檢測兩個基因,攜帶Cas9+tracrRNA的細 胞也能夠分別檢測兩個基因。
[0082] 在進行上述轉(zhuǎn)染前24小時,將細胞以40%的密度接種到24孔板的一個孔中。
[0083] 上述轉(zhuǎn)染是采用轉(zhuǎn)染試劑"Lipofectamine? RNAiMAX Transfection Reagent"(Life technologies),按說明書操作進行的。具體地,將lOpmol RNA稀釋于50μ L 0ΡΤΙ-ΜΕΜ 培養(yǎng)基中,3 μ L Lipoibctamine? RNAiMAX Transfection Reagent 稀釋于 50 μ L 0ΡΤΙ-ΜΕΜ培養(yǎng)基中,將兩者混合室溫靜置5分鐘,取50 μ L加入有細胞培養(yǎng)的孔中,震蕩混 勻,24小時后更換培養(yǎng)基。
[0084] 4、使用T7內(nèi)切酶檢測靶點破壞情況。
[0085] 將細胞轉(zhuǎn)染后48小時收集細胞,分別使用試劑QuickExtract? DNA Extraction Solution (Epicentre)制備基因組 DNA。
[0086] 然后,使用針對靶點附近區(qū)域設(shè)計的引物進行PCR。
[0087] 其中,PCR采用的引物為:
[0088] EMXl-test-F:AAAACCACCCTTCTCTCTGGC(SEQ ID NO :9),
[0089] EMXl-test-R:GGAGATTGGAGACACGGAGAG(SEQ ID NO: 10),
[0090] PVALB-test-F:CTGGAAAGCCAATGCCTGAC(SEQ ID NO: 11),
[0091] PVALB-test-R:GGCAGCAAACTCCTTGTCCT(SEQ ID NO :12)。
[0092] PCR 試劑:Qfflot Start High-Fidelity2X Master Mix (NEB),反應(yīng)體系(總體積 40 μ L) :2X Master Mix20 μ L,基因組DNA樣品 5 μ L,引物混合液(10 μ Μ) 3 μ L,ddH2012 μ L。 反應(yīng)程序:1. 98°C 30s ;2· 98°C 5s ;3· 60°C 10s ;4· 72°C 30s ;5· 72°C lm,其中第 2 至第 4 步 進行35個循環(huán)。
[0093] 然后,將PCR反應(yīng)產(chǎn)物重新的變性退火:向10uL PCR產(chǎn)物中加入2yL NEB buffer2, ddH20補足至20yL,退火程序為:1.95°C 10分鐘,2.每秒遞減2°C至85°C,3.每 秒遞減0· 2°C至25°C,4. 25°C 1分鐘。
[0094] 退火后,向退火產(chǎn)物中加入1 μ L T7內(nèi)切酶(NEB),37°C反應(yīng)30分鐘(T7內(nèi)切酶 可以對靶點已破壞和未破壞鏈的退火產(chǎn)生的雙鏈DNA進行切割),再將反應(yīng)產(chǎn)物進行電泳, 以便利用?7內(nèi)切酶檢測靶點破壞情況。圖3顯示了 T7內(nèi)切酶檢測靶點破壞情況的電泳結(jié) 果。從圖3的電泳結(jié)果中可以看出,利用本發(fā)明的技術(shù),有效地在攜帶Cas9的細胞中分別 敲除了 EMX1基因和PVALB基因,并且也有效地在攜帶Cas9和tracrRNA的細胞中分別敲除 了 EMX1基因和PVALB基因。
[0095] 實施例2在Hela細胞中進行基因表達調(diào)控
[0096] 按照與實施例1類似的方法,構(gòu)建同時攜帶Cas9突變體(D10A,H840A)和轉(zhuǎn)錄調(diào) 控元件(SID4X或VP64)的Hela細胞。其中,SID4X或VP64是和Cas9突變體(D10A,H840A) 串聯(lián)在載體上的,其載體構(gòu)建方法也是使用常用的PCR和分子克隆的方法;細胞重組的方 法和策略與實施例1相同,僅是Donor中的Cas9(D10A,H840A)DNA序列前面多了 SID4X或 后面多了 VP64 ;其他包括轉(zhuǎn)染條件等與實施例1完全相同。其中Cas9(D10A,H840A)蛋白 為野生型Cas9蛋白的衍生物,其相對于野生型Cas9蛋白(SEQ ID N0:1所示核苷酸序列編 碼的蛋白)同時具有D10A和H840A突變。
[0097] 然后,以 SID4X-Cas9(D10A,H840A)、Cas9(D10A,H840A)-VP64 敲入基因組為例,在 Hela細胞中進打基因表達調(diào)控,具體如下:
[0098] 靶點選擇在目的基因(hMyoDl、hCXCR4)的轉(zhuǎn)錄因子結(jié)合區(qū)域或5' UTR區(qū)域。各 Che-chiRNA序列如下:
[0099] hMYOD 1 -1:GCCUGGGCUCCGGGGCGUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG(SEQ ID NO :13);
[0100] hMYOD 1 -2 :GGGCCCCUGCGGCCACCCCGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG(SEQ ID NO :14)
[0101] hMY0Dl-3 :CCUCCCUCCCUGCCCGGUAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG(SEQ ID NO :15);
[0102] hMYOD 1 -4:GAGGUUUGGAAAGGGCGUGCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG (SEQ ID NO :16);
[0103] hCXCR4-l :ACUUACACUGAUCCCCUCCAGUUUUAGAGCUAGAAAUAGCAAGUUAMAUAAGGCUAGUC CG (SEQ ID NO :17);
[0104] hCXCR4-2 :AGGUAGCAAAGUGACGCCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG (SEQ ID NO :18);
[0105] hCXCR4-3 :GAACCAGCGGUUACCAUGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG(SEQ ID NO :19);
[0106] hCXCR4-4 :CAAACUGAAGUUUCUGGCCGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUC CG(SEQ ID NO :20)。
[0107] 將 hMyoDl、hCXCR4 的 che-chiRNA 分別轉(zhuǎn)入 Hela-Cas9a、Hela-Cas9i 細胞系,其 中 Hela_Cas9a 細胞系為攜帶 Cas9 (D10A,H840A)-VP64 的 Hela 細胞,Hela_Cas9i 細胞系為 攜帶SID4X-Cas9(D10A,H840A)的Hela細胞系。轉(zhuǎn)染條件與實施例1相同,轉(zhuǎn)染后48小時 收集細胞,并米用試劑 iScript? RT-qPCR Sample Preparation Reagent (Bio-Rad)制備總 RNA,然后采用試劑 iScript? One-St印 RT-PCR Kit with SYBR? Green (Bio-Rad)進行 一步法qPCR反應(yīng)。結(jié)果見圖4。圖4顯示了 qPCR檢測細胞內(nèi)CXCR4和MyoDl基因的相對 表達量的結(jié)果。如圖4所示,縱坐標(biāo)表示相對表達量,單位為倍數(shù)。由圖4可知,內(nèi)源基因 CXCR4的表達被明顯抑制,內(nèi)源基因 MyoDl被激活,大量表達。其中,需要說明的是,內(nèi)源基 因 MyoDl大量表達主要是因為,本實施例采用的Cas9突變體(D10A,H840A)不具備基因組 的破壞能力,只是識別靶點,而本實施例的靶點設(shè)計在基因的轉(zhuǎn)錄調(diào)控區(qū)域,而與Cas9串 聯(lián)的VP64招募了轉(zhuǎn)錄因子將被識別的基因激活、啟動表達。
[0108] 在本說明書的描述中,參考術(shù)語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特 點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不 一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何 的一個或多個實施例或示例中以合適的方式結(jié)合。
[0109] 盡管已經(jīng)示出和描述了本發(fā)明的實施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不 脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本 發(fā)明的范圍由權(quán)利要求及其等同物限定。
【權(quán)利要求】
1. 一種重組細胞,其特征在于,所述細胞過表達: 第一核酸分子,所述第一核酸分子編碼Cas9蛋白或其衍生物,所述Cas9蛋白的衍生物 與所述Cas9蛋白相比,缺失DNA切割活性,但保留靶點識別活性。
2. 根據(jù)權(quán)利要求1所述的重組細胞,其特征在于,所述第一核酸分子定位于所述細胞 基因組中的H3F3A基因中。
3. 根據(jù)權(quán)利要求1所述的重組細胞,其特征在于,所述細胞過表達: 第二核酸分子,所述第二核酸分子編碼tracrRNA。
4. 根據(jù)權(quán)利要求3所述的重組細胞,其特征在于,所述第一核酸分子具有SEQ ID NO: 1所示的核苷酸序列,所述第二核酸分子具有SEQ ID NO :2所示的核苷酸序列。
5. 根據(jù)權(quán)利要求3所述的重組細胞,其特征在于,所述第二核酸分子定位于所述細胞 基因組中的H3F3A基因中。
6. 根據(jù)權(quán)利要求5所述的重組細胞,其特征在于,沿著5'端至3'端的方向,所述第一 核酸分子位于所述第二核酸分子的上游。
7. 根據(jù)權(quán)利要求1所述的重組細胞,其特征在于,所述Cas9蛋白的衍生物與所述Cas9 蛋白相比具有下列突變至少之一:D10A和H840A。
8. 根據(jù)權(quán)利要求5所述的重組細胞,其特征在于,所述基因組過表達基因表達調(diào)控元 件。
9. 根據(jù)權(quán)利要求8所述的重組細胞,其特征在于,所述基因表達調(diào)控元件為SID4X或 VP64。
10. 根據(jù)權(quán)利要求9所述的重組細胞,其特征在于,沿著5'端至3'端的方向,所述第一 核酸分子位于所述SID4X的下游。
11. 根據(jù)權(quán)利要求9所述的重組細胞,其特征在于,沿著5'端至3'端的方向,所述第一 核酸分子位于所述VP64的上游。
12. -種用于對細胞進行基因改造的試劑,其包含: Che-chiRNA ;或者 Che-gRNA 以及任選地 Che-tracrRNA。
13. 根據(jù)權(quán)利要求12所述的試劑,其特征在于,Che-chiRNA包含序列: 5' - (N) 2(lGUUUUAGAGCUAGAAAUAGCAAGUUAAAAU-3',N = A、U、G 或 C。
14. 根據(jù)權(quán)利要求12所述的試劑,其特征在于,Che-gRNA包含序列: 5' - (N) 20GUUUUAGAGCUA-3',N = A、U、G 或 C。
15. 根據(jù)權(quán)利要求12所述的試劑,其特征在于,Che-chiRNA、Che-gRNA以及 Che-tracrRNA的至少之一是化學(xué)合成的。
16. -種對細胞基因組的預(yù)定位點進行基因改造的方法,其特征在于,包括: 提供權(quán)利要求1?11任一項所述的重組細胞;以及 將權(quán)利要求12?15任一項所述的試劑引入到所述重組細胞中, 其中,所述Che-chiRNA或Che-gRNA的基序(N)2CI是基于所述預(yù)定位點的序列設(shè)計的。
17. 根據(jù)權(quán)利要求16所述的方法,其特征在于,所述基因改造包括對預(yù)定位點進行基 因敲除或表達調(diào)控。
【文檔編號】C12N15/63GK104152414SQ201410346231
【公開日】2014年11月19日 申請日期:2014年7月18日 優(yōu)先權(quán)日:2014年7月18日
【發(fā)明者】李卓, 裴端卿 申請人:中國科學(xué)院廣州生物醫(yī)藥與健康研究院