專利名稱:對大腸桿菌059的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及大腸桿菌O59(Escherichia coli O59)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O59中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測人體及環(huán)境中的大腸桿菌O59并鑒定這些致病菌中的O-抗原。
O-抗原是革蘭氏陰性細(xì)菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個(gè)固定在細(xì)胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過轉(zhuǎn)運(yùn)酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個(gè)糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負(fù)責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個(gè)基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4495-503]。在大腸桿菌、志賀氏菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichiacoli O111 and Salmonella enterica O35 gene clustersgene clusters encodingthe same colitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉(zhuǎn)運(yùn)酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細(xì)菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因?yàn)镺-抗原是極強(qiáng)的抗原,是大腸桿菌重要的致病因素之一,同時(shí)它又具有極強(qiáng)的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來一直被用于對細(xì)菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時(shí)長、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個(gè)推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111.Gene 16417-23],而在其它細(xì)菌的O-抗原的結(jié)構(gòu)中也可能有這個(gè)糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的。
大腸桿菌O59中含有產(chǎn)shiga毒素的stx1基因和致病因子eae基因,大腸桿菌O59能與產(chǎn)毒素的大腸桿菌(Shigatoxin-producing Escherichiacoli,STEC)共同引起人的幾種疾病[Terrance M.Arthur etal(2002)“Prevalence and characterization of Non-O157 shiga toxin-producingEscherichia coli on carcasses in commercia1 beef cattle processingplants”Applied and Environmental Microbiology Oct.4847-4852]。因此,及時(shí)而準(zhǔn)確地檢出大腸桿菌O59是重要的。
本發(fā)明的一個(gè)目的是提供了大腸桿菌O59的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的次一目的是提供了構(gòu)成大腸桿菌O59的O-抗原基因簇的基因聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orfl、orf3、orf4基因;糖合成路徑基因,包括manB、manC基因。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O59的O-抗原基因簇中編碼糖基轉(zhuǎn)移酶的基因包括orf1、orf3、orf4基因;源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對大腸桿菌O59的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對大腸桿菌O59的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O59的O-抗原也是高度特異的。
本發(fā)明的另一目的是提供的上述寡核苷酸可作為引物用于核酸擴(kuò)增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定大腸桿菌O59的O-抗原及檢測和鑒定大腸桿菌O59。
本發(fā)明的再一目的是提供了分離大腸桿菌O59的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細(xì)菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細(xì)菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實(shí)現(xiàn)的。
本發(fā)明對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,其是如SEQID NO1所示的分離的核苷酸,全長10450個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,其由6個(gè)基因組成,都位于galF基因和gnd基因之間。前述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,所述的基因包括聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf1、orf3、orf4基因;其中所述的wzy基因是SEQ ID NO1中的2552至3721堿基的核苷酸;orf1基因是SEQ ID NO1中的1354至2565堿基的核苷酸;orf3基因是SEQ ID NO1中的3705至4781堿基的核苷酸;orf4基因是SEQ ID NO1中的4919至5962堿基的核苷酸。
前述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,其源于所述的wzy基因或糖基轉(zhuǎn)移酶基因orf1、orf3、orf4基因;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
源于orf1基因的寡核苷酸對是SEQ ID NO1中的1701至1720堿基的核苷酸和2221至2239堿基的核苷酸,SEQ ID NO1中的1396至1414堿基的核苷酸和2354至2372堿基的核苷酸,SEQ ID NO1中的1969至1987堿基的核苷酸和2410至2429堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的2857至2875堿基的核苷酸和3607至3625堿基的核苷酸,SEQ ID NO1中的2676至2694堿基的核苷酸和3379至3397堿基的核苷酸,
SEQ ID NO1中的2925至2943堿基的核苷酸和3687至3707堿基的核苷酸;源于orf3基因的寡核苷酸對是SEQ ID NO1中的4165至4283堿基的核苷酸和4694至4712堿基的核苷酸,SEQ ID NO1中的3914至3933堿基的核苷酸和4535至4552堿基的核苷酸,SEQ ID NO1中的3714至3733堿基的核苷酸和4478至4497堿基的核苷酸;源于orf4基因的寡核苷酸對是SEQ ID NO1中的4967至4985堿基的核苷酸和5758至5776堿基的核苷酸,SEQ ID NO1中的5120至5139堿基的核苷酸和5518至5536堿基的核苷酸,SEQ ID NO1中的5253至5271堿基的核苷酸和5896至5914堿基的核苷酸。
前述的對大腸桿菌O59的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
前述的對大腸桿菌O59的O-抗原特異的核苷酸的重組分子,而且通過插入表達(dá)可提供表達(dá)大腸桿菌O59的O-抗原,并成為細(xì)菌疫苗。
前述的對大腸桿菌O59的O-抗原特異的核苷酸的應(yīng)用,其特征在于它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,可用這些方法檢測人體和環(huán)境中的細(xì)菌。
前述的對大腸桿菌O59的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O5 9,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10u l0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;
(2)通過PCR擴(kuò)增大腸桿菌O59中的O-抗原基因簇以大腸桿菌O59的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的JumpStart序列設(shè)計(jì)上游引物(5’-ATT GTG GCT GCA GGGATC AAA GAA AT-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCG CGT GNG CCT GGA TTA AGT TCG C-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1u1 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾,此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5□細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5□混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O59的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的100個(gè)克隆由上海生物工程有限公司用ABI 377型DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,再通過將相聯(lián)系的序列進(jìn)行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O59的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個(gè)方面來保證1)對大腸桿菌O59的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率;在得到大腸桿菌O59的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到9個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu);(6)特異基因的篩選針對大腸桿菌O59的O-抗原基因簇中的orf1、wzy、orf3、orf4基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了三對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,所有引物都在大腸桿菌O59中得到陽性結(jié)果,在其他組中都沒有擴(kuò)增到任何大小正確的帶,也就是說,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以orf1、wzy、orf3、orf4基因?qū)Υ竽c桿菌O59及其O-抗原都是高度特異的。
也就是,本發(fā)明的第一個(gè)方面,提供了大腸桿菌O59的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長10450個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu),如表3所述,它的6個(gè)基因都位于galF基因和gnd基因之間,它的wzx基因在galF基因和gnd基因之外。
本發(fā)明的第二個(gè)方面,提供了大腸桿菌O59的O-抗原基因簇中的基因,即聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因,包括orf1、orf3、orf4;細(xì)菌多糖抗原中特殊的糖合成路徑基因,包括manB、manC基因;它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在圖2中。本發(fā)明尤其涉及到糖基轉(zhuǎn)移酶基因和聚合酶基因,因?yàn)樘呛铣陕窂交蚣春铣珊塑斩姿釂翁堑幕颥F(xiàn)在被預(yù)示對較多胞外多糖是常見的、共同的,對細(xì)菌的O-抗原并不是很特異的,而本發(fā)明涉及到的糖基轉(zhuǎn)移酶基因和聚合酶基因?qū)Υ竽c桿菌O59的O-抗原是高度特異的。本發(fā)明的第三個(gè)方面,提供了源于大腸桿菌O59的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因,包括orf1、orf3、orf4基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中的寡核苷酸對,在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進(jìn)行。這些引物只在以大腸桿菌O59為模板進(jìn)行的PCR擴(kuò)增中得到預(yù)期大小的產(chǎn)物,而在以表2所列的其它菌為模板進(jìn)行的PCR擴(kuò)增中都未得到預(yù)期大小的產(chǎn)物。更詳細(xì)地說,以這些寡核苷酸對為引物所做的PCR反應(yīng)在大多數(shù)細(xì)菌中均未得到任何產(chǎn)物,雖然在有些菌中得到了PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,這是由于引物結(jié)合到基因組的別的位置造成,這種問題可通過用基因內(nèi)的其它引物做PCR來避免。所以,可以確定這些引物即表1所列的寡核苷酸對大腸桿菌O59及它們的O-抗原是高度特異的。
所述的對大腸桿菌O59的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提取;2)PCR擴(kuò)增大腸桿菌O59中的O-抗原基因簇;3)O-抗原基因簇文庫的構(gòu)建;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析,最終獲得O-抗原基因簇的結(jié)構(gòu);6)特異基因的篩選。
本發(fā)明的其他方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所述,“寡核苷酸”主要是指來源于O-抗原基因簇中的編碼糖基轉(zhuǎn)移酶的基因、編碼聚合酶基因內(nèi)的一段核苷酸分子,它們在長度上可改變,一般在10到20個(gè)核苷酸范圍內(nèi)改變。更確切的說這些寡核苷酸是orf1基因(核苷酸位置是從SEQ ID NO1的1354至2565堿基),wzy基因(核苷酸位置是從SEQ ID NO1的2552至3721堿基),orf3基因(核苷酸位置是從SEQID NO1的3705至4781堿基),orf4基因(核苷酸位置是從SEQ ID NO1的4919至5962堿基)。源于以上基因內(nèi)的寡核苷酸對大腸桿菌O59都是高度特異的。
此外,有時(shí)兩個(gè)遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細(xì)菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對寡核苷酸的混合物,它們源于糖基轉(zhuǎn)移酶基因;源于聚合酶基因,包括wzy基因或與wzy有相似功能的基因;也源于糖合成路徑基因。這些基因的混合物對一個(gè)特殊的細(xì)菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個(gè)細(xì)菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉(zhuǎn)移酶基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸與源于糖合成路徑基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達(dá)O-抗原的細(xì)菌和在診斷中鑒定細(xì)菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O59??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
本發(fā)明者考慮到以下情況當(dāng)單個(gè)的特異的寡核苷酸檢測無效時(shí),寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼糖基轉(zhuǎn)移酶的基因、編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個(gè)特殊的細(xì)菌的O-抗原來說是特異的,這一特殊的細(xì)菌O-抗原是由大腸桿菌O59表達(dá)的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交。這些細(xì)菌是大腸桿菌O59??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個(gè)寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個(gè)寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時(shí),至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個(gè)特殊的基因簇中所有基因都獨(dú)一無二時(shí),此方法也能應(yīng)用于識別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼糖基轉(zhuǎn)移酶的基因、編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個(gè)特殊的細(xì)菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法。樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原可以使樣品能與以下至少一個(gè)基因中的一對寡核苷酸中的一個(gè)特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與樣品中的至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O59??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過雜交反應(yīng),或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
更詳細(xì)地說,以上描述的方法可以理解為當(dāng)寡核苷酸對被使用時(shí),其中的一個(gè)寡核苷酸分子能雜交到一個(gè)并不是來源于糖基轉(zhuǎn)移酶基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當(dāng)兩個(gè)寡核苷酸都能雜交上時(shí),它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問題時(shí),可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測所有表達(dá)O-抗原和鑒定O-抗原的細(xì)菌。由于O-抗原合成和其他多糖抗原(如細(xì)菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了大腸桿菌O59的O-抗原基因簇的全長序列,而且可從這個(gè)未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達(dá)可產(chǎn)生表達(dá)大腸桿菌O59的O-抗原,并成為有用的疫苗。
在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O59,離心收集細(xì)胞。用500ul50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中。基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測。實(shí)施例2通過PCR擴(kuò)增大腸桿菌O59中的O-抗原基因簇以大腸桿菌O59的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的JumpStart序列設(shè)計(jì)上游引物(5’-ATT GTG GCT GCA GGG ATC AAA GAA AT-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCG CGT GNG CCT GGA TTA AGT TCG C-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。實(shí)施例3構(gòu)建O-抗原基因簇文庫。
首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pHS.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細(xì)胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細(xì)胞大腸桿菌DH5□。取一環(huán)大腸桿菌DH5□單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時(shí)后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃ 250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃ 4000rpm離心15分鐘。傾盡上清液,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃ 4000rpm離心15分鐘。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃ 4000rpm離心15分鐘。用冷的冰預(yù)冷的10%的甘油懸浮細(xì)胞,4℃ 6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細(xì)胞,即為感受態(tài)細(xì)胞。將制得的感受態(tài)細(xì)胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細(xì)胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5□混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍(lán)白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了大腸桿菌O59的O-抗原基因簇文庫。實(shí)施例4對文庫中的克隆測序。
從文庫中挑選插入片段在700bp以上的100個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率。剩余20%的序列再通過反向測序及將有些序列測通得到,最后獲得O-抗原基因簇的所有序列。實(shí)施例5核苷酸序列的拼接及分析。
用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O59的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個(gè)方面來保證1)對大腸桿菌O59的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到大腸桿菌O59的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到6個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,發(fā)現(xiàn)orf1與Pseudomonas syringae pv.tomato str.DC3000的糖基轉(zhuǎn)移酶在362個(gè)氨基酸序列中有32%的相同性,50%的相似性。這個(gè)糖基轉(zhuǎn)移酶屬于糖基轉(zhuǎn)移酶家族1(pfam00534,Glycos_transf_1),而且和Agrobacterium tumefaciens的糖基轉(zhuǎn)移酶在403個(gè)氨基酸中有25%的相同性,51%的相似性,所以可以確定orf1也是一個(gè)糖基轉(zhuǎn)移酶基因,命名為orf1。orf2與Shewanella oneidensis MR-1的脂多糖生物合成中的wzy基因編碼的O-抗原聚合酶在303個(gè)氨基酸中有20%的相同性,有45%的相似性,與Yersinia pseudotuberculosis的O-抗原聚合酶在280個(gè)氨基酸中有20%的相同性,45%的相似性,另外orf2經(jīng)算法得知它帶有10個(gè)跨膜片段的蛋白,它的內(nèi)膜的拓?fù)浣Y(jié)構(gòu)具有眾所周知的O-抗原聚合酶的典型特征,所以orf2命名為wzy基因。orf3與Brucella suis 1330的WbkA在349個(gè)氨基酸序列中有37%的相同性,55%的相似性,WbkA是一個(gè)甘露糖基轉(zhuǎn)移酶。orf3也與Leptospira interrogans serovar lai str的mtfA基因編碼的甘露糖基轉(zhuǎn)移酶A在336個(gè)氨基酸序列中有32%的相同性,48%的相似性。此外,它與其他菌的甘露糖基轉(zhuǎn)移酶也表現(xiàn)出較高的相同性和相似性。所以,可以確定orf3是一個(gè)糖基轉(zhuǎn)移酶基因,命名為orf3。 orf4與Escherichia coliO6K5H1的一個(gè)糖基轉(zhuǎn)移酶在347個(gè)氨基酸序列中有41%的相同性,59%的相似性。另外orf4與Clostridium acetobutylicum ATCC 824的糖基轉(zhuǎn)移酶基因在333個(gè)氨基酸序列中有29%的相同性,50%的相似性,所以認(rèn)為orf4是一個(gè)糖塞轉(zhuǎn)移酶基因,命名為orf4。orf5與Escherichia coli O157H7的ManC在468個(gè)氨基酸序列中有65%的相同性,79%的相似性,與其他菌的ManC的氨基酸序列也表現(xiàn)出高度的相同性和相似性,所以orf5被命名為manC。orf6與Shigella boydii 5的ManB在471個(gè)氨基酸序列中有92%的相同性,97%的相似性。因此orf6被命名為manB。在大腸桿菌O59的O-抗原基因簇里沒有發(fā)現(xiàn)WZX基因,WZX基因不在galF與gnd之間,還需進(jìn)一步研究。實(shí)施例6特異基因的篩選針對大腸桿菌O59的O-抗原基因簇中的wzy、orf1、orf3、orf4基因設(shè)計(jì)引物,這些基因在核苷酸序列中的位置見表1。
在表1中列出了大腸桿菌O59的O抗原基因簇的糖基轉(zhuǎn)移酶基因和聚合酶基因及它們的相應(yīng)的功能和大小。在每個(gè)基因內(nèi),我們各設(shè)計(jì)了三對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個(gè)引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進(jìn)行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個(gè)基因,所以我們根據(jù)mdh基因設(shè)計(jì)了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然后從166株大腸桿菌中提取基因組,方法如前所述。用這對引物從166株大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質(zhì)量。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個(gè)菌分為一組,總共27組,它們的來源都列于表中。
在第9組中含有大腸桿菌O59的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在94℃預(yù)變性2分鐘后,94℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時(shí)間是50秒,72℃延伸2分鐘,這樣進(jìn)行30個(gè)循環(huán)。最后在72℃繼續(xù)延伸10分鐘,反應(yīng)體系是25ul。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測擴(kuò)增出的片段。
對于wzy、orf1、orf3、orf4基因,每個(gè)基因都有三對引物被檢測,每對引物除了在第9組中做PCR后得到了預(yù)期大小的正確的一條帶外,在其他組中都沒有擴(kuò)增到任何大小正確的帶。也就是說,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzy、orf1、orf3、orf4基因?qū)Υ竽c桿菌O59及其O-抗原都是高度特異的。
最后,通過PCR從大腸桿菌O59中篩選到對大腸桿菌O59的O-抗原高度特異的基因wzy和三個(gè)糖基轉(zhuǎn)移酶基因。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對大腸桿菌O59的O-抗原是特異的,尤其是上述每個(gè)基因中的引物即寡核苷酸對經(jīng)PCR檢測后證實(shí)對大腸桿菌O59是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測人體和環(huán)境中的大腸桿菌O59,并能鑒定它們的O-抗原。
表3是大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu),共由6個(gè)基因組成,每個(gè)基因用方框表示,并在方框內(nèi)寫入基因的名稱,數(shù)字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設(shè)計(jì)引物來擴(kuò)增O-抗原基因簇的全長序列。
表4是大腸桿菌O59的O-抗原基因簇中的基因的位置表,在表中列出了大腸桿菌O59的O-抗原基因簇中的所有開放閱讀框在全序列中的準(zhǔn)確位置,在每個(gè)開放閱讀框的起始密碼子和終止密碼子的下面劃線。在細(xì)菌中開放閱讀框的起始密碼子有兩個(gè)ATG和GTG。
序列列表SEQUENCE LISTING<110> 南開大學(xué)<120> 對大腸桿菌O59的O-抗原特異的核苷酸<160> 1<170> PatentIn version 3.1<210> 1<211> 10450<212> DNA<213> Escherichia coli<400> 1attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc 60gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgagcagcg cgtgaagcgt120caactactgg cggaagtaca gtccatttgc ccgccgggag tgaccattat gaacgtgcgt180cagggcgaac ctttaggttt gggccactcc attttatgtg cacgacccgc cattggtgac240aacccatttg tcgtggtgct gccagacgtt gtgatcgatg acgccagcgc cgacccgctg300cgctacaacc ttgcggccat gattgcgcgc ttcaacgaaa cgggccgcag ccaggtgctg360gcaaaacgta tgccaggtga cctctctgaa tactccgtca ttcagaccaa agagccgctg420gaccgcgaag gtaaagtcag ccgcattgtt gaattcatcg aaaaaccgga tcagccgcaa480acgctggact cagatattat ggccgtgggc cgttatgtgc tttctgccga tatttggccg540gaacttgaac gcactcagcc tggtgcatgg gggcgtattc agctgactga tgctattgcc600gaactggcga aaaaacagtc tgttgatgca atgctgatga ctggtgacag ttacgactgc660ggcaaaaaaa tgggctatat gcaggcgttt gtgaagtatg gactacgcaa cctgaaagaa720ggggcgaagt tccgcaaagg gattgagaag ctgttaagcg aataatgaaa atctgaccgg780atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt840tgcgaatatt cctgccgttg ttttatataa acaatcagaa taacaacgag ttagcaatag900gattttagtc aaagttttcc aggattttcc ttgtttccag agctgattgg taagacaatt960agcgtttgaa tttatgaggg ctttgcgggg ttagatgcag agttcgtgac atccattgag 1020aatctacgca gtgcactggt agctgttaag ccaggggcgg tagcgtgggt gaaacgttta 1080ataatgagat ataagttatg attatttcta aacttagccg gcataaaatt gcttgtgctg 1140agtcagagtt agaacttgta aattatagta tataaattaa actgtgaaat attattgcgg 1200taatcttacc aaaaagctgt atgaatttac cataaaacaa atattgattg tgttcttggt 1260tttttattaa gcagatcaat agttgttatc tattgccttg ttgggtaata aggcatctat 1320aaatcttgat ggttaatatt taagtcccaa taaatgaaaa ttttgattgt aaatactttt 1380ttttatccaa atgaaattgg tggtgctgag ttttcatgta aggtattagc agaagctctt 1440gcggaacggg ggcatgatgt gtctgtttta tctacaacaa atggggaatc aagacaaact 1500aggttaggta aattgaagtt gtattattta aaattaagta atgtgttctg gcatggtaaa 1560tcaaaaaaac aaggagcaat aaaagggatt atatggcatg ctatggattc atttaacccg 1620attatgttct ttaaattatt aaaattattt aaagaaatca ggcctgatgt tatacataca 1680aataatatag ttggctttag ttgctcatta tggtttgctg ctttagtttt aaatattcct 1740gttgtccaca cgttacgtga ttattattta aaatgttatc gttcatgcat gcggaaaaat 1800aataaaaatt gtgattctca atgtgttgca tgtaagttat taacaacacc aagaaaaatt 1860atttcatcga atgtaaatgc tgttattggc aatagccagt atatgattaa ctctcatttg 1920aaaaataatt atttttcaaa tacaccgatg aaaaaagtaa tatttaatgc atggaaccca 1980tcaacagacc ttcaaaaaca tcaaaattta ctttggcaac gagtagaaca tgcacgattc 2040ggttttattg gaagaatcac agaggaaaaa ggaattgaac tattgttaag gtcgttcaaa 2100aatataaaga accaaccttt tagcaataaa atcagcttaa tagttgcggg ggaaggagat 2160gacaattata taaagaaatt atctgatgaa tattcagata cagatggcat attattcgtt 2220gggaaagtag aacccgaaga tttctataag cggattgatt ttactattgt tccgtcttta 2280tgggaagagc cattagcaag agttgttttt gagtcatttt tcttttcatt gcctgttttg 2340acaacagctc gaggaggaaa tgccgaagtt gtgaagcatg ggcagaatgg gtttattttc 2400tccgaaacag tagagtcttt gtcggcaaca atgcagatgg cactgaatgt aaattatatt 2460gagatgtcta aggctgcttt ttatagtcga ttaaaattta cgaatgaaaa tctggtttca 2520tcctatgaaa atatatatcg aagaataaaa catgaagaaa agtgaatttc aagcagaaaa 2580actaataatt ttgttttatt ttataataaa tctttgcacc tttataatta ttacatcgtc 2640atcgatatat ataggtgatc cagcgggtga atattatact gtgccgcttg atatagctat 2700aatattattt attagtaata ctgctatata ttatctttta tacttgatct atcgttgttg 2760tgtatcacat attgcattcc acaatgaagt tatcataaaa agaattgaaa ctttattgtt 2820tttaggtgtt acaattgcat tattaggctt tttttggatt gattatggac gagctgaata 2880tcaaagtaca tctccatttg gttttgtctt taggttaata ccttattccg tcatttggct 2940tctctatgtt tcaattaatt caaaatggaa tgcaaaaagt atattcctta ttgtttacta 3000tgttgccgct aaaataataa tgggatggag tggtatatta ttagcactct tctgggtttt 3060gtttataaaa tattacaatg cgaagaaacg tagtttttta tttatgtgta tgtgcatgac 3120tctgctagtc atattgtatt tttcggctcc tatagtttat tatttgaaat attacataag 3180atatgctggt cagtttgaat ttaattatcc tgtgctatta tcgaagctta cggcaagatt 3240atctactatt cagaatgtgt tgtatattta tcaaaatact aatgtattca caaacttata 3300taataagtat ttatttgatg gtttttattt tatcgaacca ataacatcta tcttgcctag 3360agctctttta ggtataagtg caactaactt tgaaactata tatgtaaaca tcgtaactgg 3420agagttcaac ccaggtgtca tattttattt gggattgttt ggtaaactat tagcttactt 3480taatacaggg atatataatt ttggcaactt tttcattgta acctttgttc ttcttggggg 3540gctatttata ttactcaaat taaactttaa aaaagcagcc aaccctttta ttttttatac 3600aatcatacaa tttgctctta gtggctcgat agaggaacta tcatatacac tatacggtat 3660ttgtcttgtt ttaatatttt gtaaaatacg gtttggtatt cataatgaaa ataggtattg 3720attcaactgc acttgtaaaa aatagaactg gagtaggtaa ttatatatat tcaattttaa 3780acgaattagt taaaaataca gaacatcaat ttattttata ttctaacaaa gaaatatttt 3840atcctgattt gccaaatgtt agaaaagtta ttcattcatc gacttataaa gggccagtat 3900ggcaaaatac aagtttgatt tattccctct tcaaagatag acctgatgtt ttttgggggg 3960ggaatgggta tttaccaatg ttagttccga agaaaacaaa gctgatttta acagttcatg 4020atcttgtata taaatatgct ggtcgtacaa tgcctaccat cagtagatta tctcgtaggt 4080tttttcagcc attatctgta aataaagctg atgcaatagt tgcagtcagt catgcaactg 4140cagatgaggt atataaagaa tatggtgtcc gacctgattg tgtggtccat cctcagatat 4200ctccgttatt ttcattacaa gaaaaatcta acttagcgaa aattaaagaa aaataccagc 4260ttaatgagta tatattgaca attggaaccc ttgaaccacg aaaaaatatg gtggctttaa 4320tccaggcata tctaaacgta gtatcattgg gttataaatt acctgtactg gcaattgctg 4380gaggtaaagg ctggatgcag ggagagttag ataaattagt agagaagggg gtggcaaaag 4440gtattatcag aaaattaggt tatgtatctg atccggattt agcggttctt tattcaggag 4500ctcaactttt tgttttagca tctatttatg aaggttttgg tatgccgatt ctggaggctc 4560aagccagcgg gtgtcctgtg cttatatcca gaataaaatc tatgatagag gccgcaggtg 4620atatttgctg tacttttgag ccagatatac agtctattga gaactctctt ataaatctat 4680caaaagggaa tcagcctctt atttgtcggc taccatatac tattgaaaat aaaattgata 4740ttgcagctaa aaaatatgaa aaattgatga ggttatcttg aagaaaatat tggtaattac 4800cccaagattt ccatatccag tgatcggagg agatagatta cgtatttatg aaatatgtaa 4860agagctgtct cgtaaatact cattgactct ggttagtttg tgtgagtcga atgaagaaat 4920gacatatcct atccctgatg atggtgttta tacatcagta tatagatgtc atcatccacg 4980aatcatatcg tatttttcat gcttactagc actgcctact aacataccac tgcaagttgc 5040ttattactat tctcccaaat ttaaaaaaat aattaataag ttagttcctg aacatgattt 5100attattacct catttaattc gtgttgctgg gtatgtaaaa aaaaactcaa ctcctaaaat 5160attagaaatg actgatgcta tttctatgaa ttatgagaga gtatgtaaat taaaaaatag 5220tacaggaatt aaaggtctta tatataaaat tgagcgtaac cgtctaaatc aatatgaaaa 5280atcaatagca aaatactttg atcagacaat ttttgtatct caacatgata agaactacct 5340ttttagaaat ttaccagact tatatcataa gtcattagtt tgtacaaatg gagttgatgt 5400tgctaacttt aaaaatacat tgtttaaaag aagctacaaa cttattttta ttggcaacat 5460gttttctgtt caaaattttg atgcggcttt ttggttttgt gaatctgtat tacctatact 5520tcgtcaatat ggaccattta cctttcatgt tataggtaaa atatcgttag aaaactcaaa 5580aaaactttca gcatatgagg gggttttcgt tactggggct gtagataatg ttatggacta 5640tgcaaataat tctttggcgg gcatatgttc agtaagatta gctgcgggtg tacagaataa 5700aattttagag tacatggcta tgggaatacc ggcaataaca acatcgattg gtttggaggg 5760gttattcgct gttgacggcg aaagtatagt tgtggctaat acacctcatg agtttgtatc 5820aacaatattg aaattgttta atgatccaag ttttggaaaa accatttcaa aaaatggatt 5880aggttatgtt caacaaaatc attcgtggtc tgagaaatta caacccctaa ttcaagtaat 5940taataattta atcgaagagt agtttatgtc tagtataatt cctgttatta tggctggcgg 6000ttctggtagt cgtttatggc ctctttcgcg cgaacttcgt ccaaagcaat tccttaagct 6060tgatggtgag ctaacaatgc tgcaagcgac tatcaatcgt ttaaaaaatt tcgttacgac 6120gcaaccattg gttatttgta atgaagatca ccgattttta gttgctgaac agttacgtta 6180tttaggtaaa cttgaaaata atatcatctt agagccattt ggacgtaata ctgcgccagc 6240aatagctttg gctgcattca cagctttaca gagctcttct cttaaggaag atcctatatt 6300gttagtatta gcggcagatc atgttatccg agatgaagag tcatttaaaa gatcagttca 6360acaagcagtt ccttatgcta aatctggaaa acttgttact tttggcattg tacctaccca 6420tgcggaaacc ggatatggat atatacaacg aggaaaggaa ttaaatgatg cttattcagt 6480taaacaattt gtcgaaaagc ccgagcttga aaccgcacaa caatatttta atagcggaga 6540atattattgg aatagtggta tgttcttgtt tcgtgctagc cgctatcttg atgaactggc 6600attattccga ccagatattt atactgcttg tggtaaagca ataggggcta ttgacccaga 6660tcatgacttt gttcgtattg ataaagatgc attcaattct tgtccaagtg attctattga 6720ttatgctgta atggaaaaaa cttcagatgc agtagtcgtt ccgatggatg ctggttggtc 6780tgatgttgga tcttggctat cgttatggga gctttcaaaa aaagattcta tggggaattc 6840atttcatggt gatgtgattc aacatagtag taaaaataat tttgttttta cagagagctg 6900tttggttagt ttggttggtg ttgaaaaact tgtagtcgta caaacaaaag atgcaatatt 6960agttgctgat cagaataaag ttcaagatgt aaaaaatata gttgagaaac taaaaaatag 7020ctgccgtaca gaacatcgta tacaccggga agtttttcgc ccttggggaa agcatgattt 7080aattgacgat ggagatgtat atcgagtcaa aaggataagt gttaaaccgg gtgagaggct 7140ttcattgcaa atgcatcatc atagagctga acactggata gttgtatctg gtatagctaa 7200agttacgaat ggtgacaata tatatctttt aaaagaaaat gaatcaacat tcataccttc 7260aggtacgatt catgccttag aaaatccagg agaaataatg ctggagctta ttgaggtgca 7320atcgggagta tgcttggatg aaaatgatat tatccgttta taaggtcact tataattgaa 7380gttaaagagt ttctattaaa ataggctatt tggagctttg acagttgttt agtatttaat 7440cgcaaaaatg atatctttat ttataatgtt aaaggtagtg tcctatgact aagtataata 7500gttcttcatt aatagccaat agtaatgtga attttggtac tagtggtgct cgtggattag 7560tcgttgattt tactcacaat gtttgtgctg cttttactca tgcatttctt tcggttatcg 7620aaaaacactt taagtttgac acagtggctg tagcaataga taacagacct agtagtttta 7680atatagcaca agcatgtgtt ttcgctataa aacagcatgg atatggcatc gaatatcatg 7740gtgtcattcc gactcctgca ttagctcatt attcgatgca gaaaaatatt ccctgtataa 7800tggtcactgg gagtcatata ccttttgatc gtaatggttt aaaattctac cgaccagatg 7860gtgaaatcac aaaagaggat gagctcgcaa ttgtaaatag tgaatataca ttttctcctg 7920taggtgtatt acctcatctt gaaacaagct ctcaaggtgc ggactgctac ttggaacgtt 7980atgtttctct tttttattct gatattttaa aggggaaaag aataggggta tatgaacatt 8040ctagtgcggg gcgcgattta tatgcttctc tttttaatca attgggtgca gaggtcattt 8100ccctaggcag aagtgatgag ttcgttccga ttgatacgga agcagtaagt gatgaagatc 8160gtgtacttgc aagagagtgg tctaaaaaat ataatcttga tgctattttc tcaacagatg 8220gcgatggtga tcgtccttta gttgccgatg aaaatggtga atggttaaga ggcgatattc 8280tgggactact tactgctatt gaacttaata tcaaggcgtt ggctattcca gtgagttgta 8340atacagcaat tgaagagtct aataaatttg caagtataca acgaacgaaa ataggttctc 8400cttatgtaat tgcagcattt gcagatcttg ctaagcaatt tgattcagtc gctggttttg 8460aagctaatgg tggttttctc cttgcctccg atttacaaat taatgacaag gaattaaaat 8520cgttgcctac acgagatgct gtgttaccag cattaatgct cttaatagct tctcgcaata 8580gtactatttc tcaactgatt aataatcttc ctcagcgatt cacttggtca gatagagtta 8640aaaacttccc ttcagattca agtcaacaaa ttataaagaa tgccatatcg tcacccaata 8700atttctttaa tagtttaggt tatgaatcat tatcctgttc ctctattgat gaaacggatg 8760gtgcaagatt tactttaaat aatggtgata ttatacatct ccgtccttcc ggtaatgctc 8820cagaactccg ttgttatgct gaggccagtg atgaaaatca ggctaagcaa tatgttacga 8880atgtgctggg aaatattacc tctttgattt cttgatgtta taggtttatc tacgcttata 8940tgtgtgcgta ggtttgatta cacgtagatg ctggtataca gaattgaaga acggtatttg 9000ttgcattaat gaaattcagc actacacaca ttcgtgcaac ttgagataac atctcaatca 9060tattcaagtc gcgcatacat cgcggtgaac accccctgac aggagtaaac aatgtcaaag 9120caacagatcg gcgtcgtcgg tatggcagtg atggggcgca accttgcgct caacatcgaa 9180agccgtggtt ataccgtctc tattttcaac cgttcccgtg agaaaacgga agaagtgatt 9240gccgaaaatc caggcaagaa actggttcct tactatacgg tgaaagagtt tgttgaatct 9300ctggaaacgc ctcgtcgcat cctgttaatg gtgaaagcag gtgcaggcac ggatgctgct 9360attgattccc tcaagccata cctcgataaa ggtgacatca ttattgatgg tggtaatacc 9420ttcttccagg acaccattcg tcgtaaccgt gagctttctg ccgaaggttt taacttcatc 9480ggtaccggtg tttccggcgg tgaagaaggt gcgctgaaag gtccttccat tatgcctggt 9540gggcagaaag aagcctatga actggttgca ccgatcctga ccaaaatcgc cgcagtggct 9600gaagactgtg agccatgcgt tacctatatt ggtgccgatg gtgcaggtca ctatgtgaag 9660atggttcaca acggtattga atacggcgat atgcagctga ttgctgaagc ctattctctg 9720cttaaaggtg gcttgaacct ttccaacgaa gaactggcgc agacctttac cgagtggaat 9780aacggtgaac tgagcagcta cctgattgac atcactaaag acatcttcac taaaaaagat 9840gaagacggta actacctggt tgatgtgatt ctggatgaag cggctaacaa aggtaccggt 9900aaatggacca gccagagcgc gctggatctc ggcgaaccgc tgtcgctgat taccgagtct 9960gtgtttgcac gttatatctc ttctctgaaa gatcagcgtg ttgccgcatc taaagttctc 10020tctggcccgc aagcacagcc agcaggcgac aaagctgagt ttatcgagaa agttcgccgt 10080gcgctgtatc tgggcaaaat cgtttcttac gctcagggct tctctcagct acgcgccgcg 10140tcggaagatt acaattggga tctgaactac ggcgaaatcg cgaagatttt ccgtgctggt 10200tgcatcatcc gtgcgcagtt cctgcagaaa atcaccgatg cgtatgccga aaatcccaaa 10260atcgctaacc tgctgttggc tccgtacttt aagcaaatcg ccgacgacta ccagcaggca 10320ctgcgtgatg tcgtcgctta tgcagtgcaa aacggtattc cggttccaac cttctctacg 10380gcggttgcct attacgatag ctaccgtgcc gcggtgctgc ctgcgaacct aattcaggct 10440cagcgcgact 10450表1大腸桿菌O59的O抗原基因簇中糖基轉(zhuǎn)移酶基因和wzy基因及其中的引物及PCR數(shù)據(jù)
*在一組中產(chǎn)生一條錯(cuò)誤大小的帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株來源1 野生型大腸桿菌O1,O2,O3,O4,O10,O16,O18,O39 IMVSa2 野生型大腸桿菌O40,O41,O48,O49,O71,O73,O88,O100 IMVS3 野生型大腸桿菌O102,O109,O119,O120,O121,O125,O126,O137 IMVS4 野生型大腸桿菌O138,O139,O149,O7,O5,O6,O11,O12 IMVS5 野生型大腸桿菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS6 野生型大腸桿菌O23,O24,O25,O26,O27,O28,O29,O30 IMVS7 野生型大腸桿菌O32,O33,O34,O35,O36,O37,O38,O42 IMVS8 野生型大腸桿菌O43,O44,O45,O46,O50,O51,O52,O53 IMVS9 野生型大腸桿菌O54,O55,O56,O57,O58,O59,O60,O61 IMVS10野生型大腸桿菌O62,O63,O64,O65,O66,O68,O69,O70 IMVS11野生型大腸桿菌O74,O75,O76,O77,O78,O79,O80,O81 IMVS12野生型大腸桿菌O82,O83,O84,O85,O86,O87,O89,O90 IMVS13野生型大腸桿菌O91,O92,O95,O96,O97,O98,O99,O101 IMVS14野生型大腸桿菌O112,O162,O113,O114,O115,O116,O117,O118 IMVS15野生型大腸桿菌O123,O165,O166,O167,O168,O169,O170,O171 See b16野生型大腸桿菌O172,O173,O127,O128,O129,O130,O131,O132, See c17野生型大腸桿菌O133,O134,O135,O136,O140,O141,O142,O143 IMVS18野生型大腸桿菌O144,O145,O146,O147,O148,O150,O151,O152 IMVS19野生型大腸桿菌O153,O154,O155,O156,O157,O158,O159,O164 IMVS20野生型大腸桿菌O160,O161,O1 63,O8,O9,O124,O111IMVS21野生型大腸桿菌O103,O104,O105,O106,O107,O108,O110 IMVS22鮑氏志賀氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14See d23鮑氏志賀氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18 See d24痢疾志賀氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8 See d25痢疾志賀氏菌血清D9,D10,D11,D12,D13 See d26弗氏志賀氏菌F6a,F(xiàn)1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4a,F(xiàn)4b,F(xiàn)5(v7)F5(v4)See d27宋內(nèi)氏志賀氏菌D5,DR See da. Institude of Medical and Veterinary Science,Anelaide,Australiab. O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc. 172 and173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd. 中國預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3是大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu)表表3是大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu)表 表4是大腸桿菌O59的O-抗原基因簇中的基因的位置表ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ACGCGTCCAA GAACGCGGTC 60GAAAACCACT TCGACACCTC TTATGAATTA GAATCTCTCC TTGAGCAGCG CGTGAAGCGT 120CAACTACTGG CGGAAGTACA GTCCATTTGC CCGCCGGGAG TGACCATTAT GAACGTGCGT 180CAGGGCGAAC CTTTAGGTTT GGGCCACTCC ATTTTATGTG CACGACCCGC CATTGGTGAC 240AACCCATTTG TCGTGGTGCT GCCAGACGTT GTGATCGATG ACGCCAGCGC CGACCCGCTG 300CGCTACAACC TTGCGGCCAT GATTGCGCGC TTCAACGAAA CGGGCCGCAG CCAGGTGCTG 360GCAAAACGTA TGCCAGGTGA CCTCTCTGAA TACTCCGTCA TTCAGACCAA AGAGCCGCTG 420GACCGCGAAG GTAAAGTCAG CCGCATTGTT GAATTCATCG AAAAACCGGA TCAGCCGCAA 480ACGCTGGACT CAGATATTAT GGCCGTGGGC CGTTATGTGC TTTCTGCCGA TATTTGGCCG 540GAACTTGAAC GCACTCAGCC TGGTGCATGG GGGCGTATTC AGCTGACTGA TGCTATTGCC 600GAACTGGCGA AAAAACAGTC TGTTGATGCA ATGCTGATGA CTGGTGACAG TTACGACTGC 660GGCAAAAAAA TGGGCTATAT GCAGGCGTTT GTGAAGTATG GACTACGCAA CCTGAAAGAA 720GGGGCGAAGT TCCGCAAAGG GATTGAGAAG CTGTTAAGCG AATAATGAAA ATCTGACCGG 780ATGTAACGGT TGATAAGAAA ATTATAACGG CAGTGAAGAT TCGTGGCGAA AGTAATTTGT 840TGCGAATATT CCTGCCGTTG TTTTATATAA ACAATCAGAA TAACAACGAG TTAGCAATAG 900GATTTTAGTC AAAGTTTTCC AGGATTTTCC TTGTTTCCAG AGCTGATTGG TAAGACAATT 960AGCGTTTGAA TTTATGAGGG CTTTGCGGGG TTAGATGCAG AGTTCGTGAC ATCCATTGAG1020AATCTACGCA GTGCACTGGT AGCTGTTAAG CCAGGGGCGG TAGCGTGGGT GAAACGTTTA1080ATAATGAGAT ATAAGTTATG ATTATTTCTA AACTTAGCCG GCATAAAATT GCTTGTGCTG1140AGTCAGAGTT AGAACTTGTA AATTATAGTA TATAAATTAA ACTGTGAAAT ATTATTGCGG1200TAATCTTACC AAAAAGCTGT ATGAATTTAC CATAAAACAA ATATTGATTG TGTTCTTGGT1260TTTTTATTAA GCAGATCAAT AGTTGTTATC TATTGCCTTG TTGGGTAATA AGGCATCTAT1320orf1基因的起始密碼子AAATCTTGAT GGTTAATATT TAAGTCCCAA TAAATGAAAA TTTTGATTGT AAATACTTTT1380TTTTATCCAA ATGAAATTGG TGGTGCTGAG TTTTCATGTA AGGTATTAGC AGAAGCTCTT1440GCGGAACGGG GGCATGATGT GTCTGTTTTA TCTACAACAA ATGGGGAATC AAGACAAACT1500AGGTTAGGTA AATTGAAGTT GTATTATTTA AAATTAAGTA ATGTGTTCTG GCATGGTAAA1560TCAAAAAAAC AAGGAGCAAT AAAAGGGATT ATATGGCATG CTATGGATTC ATTTAACCCG1620ATTATGTTCT TTAAATTATT AAAATTATTT AAAGAAATCA GGCCTGATGT TATACATACA1680AATAATATAG TTGGCTTTAG TTGCTCATTA TGGTTTGCTG CTTTAGTTTT AAATATTCCT1740GTTGTCCACA CGTTACGTGA TTATTATTTA AAATGTTATC GTTCATGCAT GCGGAAAAAT1800AATAAAAATT GTGATTCTCA ATGTGTTGCA TGTAAGTTAT TAACAACACC AAGAAAAATT1860ATTTCATCGA ATGTAAATGC TGTTATTGGC AATAGCCAGT ATATGATTAA CTCTCATTTG1920AAAAATAATT ATTTTTCAAA TACACCGATG AAAAAAGTAA TATTTAATGC ATGGAACCCA1980TCAACAGACC TTCAAAAACA TCAAAATTTA CTTTGGCAAC GAGTAGAACA TGCACGATTC2040GGTTTTATTG GAAGAATCAC AGAGGAAAAA GGAATTGAAC TATTGTTAAG GTCGTTCAAA2100AATATAAAGA ACCAACCTTT TAGCAATAAA ATCAGCTTAA TAGTTGCGGG GGAAGGAGAT2160GACAATTATA TAAAGAAATT ATCTGATGAA TATTCAGATA CAGATGGCAT ATTATTCGTT2220GGGAAAGTAG AACCCGAAGA TTTCTATAAG CGGATTGATT TTACTATTGT TCCGTCTTTA2280TGGGAAGAGC CATTAGCAAG AGTTGTTTTT GAGTCATTTT TCTTTTCATT GCCTGTTTTG2340ACAACAGCTC GAGGAGGAAA TGCCGAAGTT GTGAAGCATG GGCAGAATGG GTTTATTTTC2400TCCGAAACAG TAGAGTCTTT GTCGGCAACA ATGCAGATGG CACTGAATGT AAATTATATT2460GAGATGTCTA AGGCTGCTTT TTATAGTCGA TTAAAATTTA CGAATGAAAA TCTGGTTTCA2520orf2基因的起始密碼子orf1基因的終止密碼子TCCTATGAAA ATATATATCG AAGAATAAAA CATGAAGAAA AGTGAATTTC AAGCAGAAAA2580ACTAATAATT TTGTTTTATT TTATAATAAA TCTTTGCACC TTTATAATTA TTACATCGTC2640ATCGATATAT ATAGGTGATC CAGCGGGTGA ATATTATACT GTGCCGCTTG ATATAGCTAT2700AATATTATTT ATTAGTAATA CTGCTATATA TTATCTTTTA TACTTGATCT ATCGTTGTTG2760TGTATCACAT ATTGCATTCC ACAATGAAGT TATCATAAAA AGAATTGAAA CTTTATTGTT2820TTTAGGTGTT ACAATTGCAT TATTAGGCTT TTTTTGGATT GATTATGGAC GAGCTGAATA2880TCAAAGTACA TCTCCATTTG GTTTTGTCTT TAGGTTAATA CCTTATTCCG TCATTTGGCT2940TCTCTATGTT TCAATTAATT CAAAATGGAA TGCAAAAAGT ATATTCCTTA TTGTTTACTA3000TGTTGCCGCT AAAATAATAA TGGGATGGAG TGGTATATTA TTAGCACTCT TCTGGGTTTT3060GTTTATAAAA TATTACAATG CGAAGAAACG TAGTTTTTTA TTTATGTGTA TGTGCATGAC3120TCTGCTAGTC ATATTGTATT TTTCGGCTCC TATAGTTTAT TATTTGAAAT ATTACATAAG3180ATATGCTGGT CAGTTTGAAT TTAATTATCC TGTGCTATTA TCGAAGCTTA CGGCAAGATT3240ATCTACTATT CAGAATGTGT TGTATATTTA TCAAAATACT AATGTATTCA CAAACTTATA3300TAATAAGTAT TTATTTGATG GTTTTTATTT TATCGAACCA ATAACATCTA TCTTGCCTAG3360AGCTCTTTTA GGTATAAGTG CAACTAACTT TGAAACTATA TATGTAAACA TCGTAACTGG3420AGAGTTCAAC CCAGGTGTCA TATTTTATTT GGGATTGTTT GGTAAACTAT TAGCTTACTT3480TAATACAGGG ATATATAATT TTGGCAACTT TTTCATTGTA ACCTTTGTTC TTCTTGGGGG3540GCTATTTATA TTACTCAAAT TAAACTTTAA AAAAGCAGCC AACCCTTTTA TTTTTTATAC3600AATCATACAA TTTGCTCTTA GTGGCTCGAT AGAGGAACTA TCATATACAC TATACGGTAT3660orf3基因的起始密碼子 orf2基因的終止密碼子TTGTCTTGTT TTAATATTTT GTAAAATACG GTTTGGTATT CATAATGAAA ATAGGTATTG3720ATTCAACTGC ACTTGTAAAA AATAGAACTG GAGTAGGTAA TTATATATAT TCAATTTTAA3780ACGAATTAGT TAAAAATACA GAACATCAAT TTATTTTATA TTCTAACAAA GAAATATTTT3840ATCCTGATTT GCCAAATGTT AGAAAAGTTA TTCATTCATC GACTTATAAA GGGCCAGTAT3900GGCAAAATAC AAGTTTGATT TATTCCCTCT TCAAAGATAG ACCTGATGTT TTTTGGGGGG3960GGAATGGGTA TTTACCAATG TTAGTTCCGA AGAAAACAAA GCTGATTTTA ACAGTTCATG4020ATCTTGTATA TAAATATGCT GGTCGTACAA TGCCTACCAT CAGTAGATTA TCTCGTAGGT4080TTTTTCAGCC ATTATCTGTA AATAAAGCTG ATGCAATAGT TGCAGTCAGT CATGCAACTG4140CAGATGAGGT ATATAAAGAA TATGGTGTCC GACCTGATTG TGTGGTCCAT CCTCAGATAT4200CTCCGTTATT TTCATTACAA GAAAAATCTA ACTTAGCGAA AATTAAAGAA AAATACCAGC4260TTAATGAGTA TATATTGACA ATTGGAACCC TTGAACCACG AAAAAATATG GTGGCTTTAA4320TCCAGGCATA TCTAAACGTA GTATCATTGG GTTATAAATT ACCTGTACTG GCAATTGCTG4380GAGGTAAAGG CTGGATGCAG GGAGAGTTAG ATAAATTAGT AGAGAAGGGG GTGGCAAAAG4440GTATTATCAG AAAATTAGGT TATGTATCTG ATCCGGATTT AGCGGTTCTT TATTCAGGAG4500CTCAACTTTT TGTTTTAGCA TCTATTTATG AAGGTTTTGG TATGCCGATT CTGGAGGCTC4560AAGCCAGCGG GTGTCCTGTG CTTATATCCA GAATAAAATC TATGATAGAG GCCGCAGGTG4620ATATTTGCTG TACTTTTGAG CCAGATATAC AGTCTATTGA GAACTCTCTT ATAAATCTAT4680CAAAAGGGAA TCAGCCTCTT ATTTGTCGGC TACCATATAC TATTGAAAAT AAAATTGATA4740orf3基因的終止密碼子TTGCAGCTAA AAAATATGAA AAATTGATGA GGTTATCTTG AAGAAAATAT TGGTAATTAC4800CCCAAGATTT CCATATCCAG TGATCGGAGG AGATAGATTA CGTATTTATG AAATATGTAA4860orf4基因的起始密碼子AGAGCTGTCT CGTAAATACT CATTGACTCT GGTTAGTTTG TGTGAGTCGA ATGAAGAAAT4920GACATATCCT ATCCCTGATG ATGGTGTTTA TACATCAGTA TATAGATGTC ATCATCCACG4980AATCATATCG TATTTTTCAT GCTTACTAGC ACTGCCTACT AACATACCAC TGCAAGTTGC5040TTATTACTAT TCTCCCAAAT TTAAAAAAAT AATTAATAAG TTAGTTCCTG AACATGATTT5100ATTATTACCT CATTTAATTC GTGTTGCTGG GTATGTAAAA AAAAACTCAA CTCCTAAAAT5160ATTAGAAATG ACTGATGCTA TTTCTATGAA TTATGAGAGA GTATGTAAAT TAAAAAATAG5220TACAGGAATT AAAGGTCTTA TATATAAAAT TGAGCGTAAC CGTCTAAATC AATATGAAAA5280ATCAATAGCA AAATACTTTG ATCAGACAAT TTTTGTATCT CAACATGATA AGAACTACCT5340TTTTAGAAAT TTACCAGACT TATATCATAA GTCATTAGTT TGTACAAATG GAGTTGATGT5400TGCTAACTTT AAAAATACAT TGTTTAAAAG AAGCTACAAA CTTATTTTTA TTGGCAACAT5460GTTTTCTGTT CAAAATTTTG ATGCGGCTTT TTGGTTTTGT GAATCTGTAT TACCTATACT5520TCGTCAATAT GGACCATTTA CCTTTCATGT TATAGGTAAA ATATCGTTAG AAAACTCAAA5580AAAACTTTCA GCATATGAGG GGGTTTTCGT TACTGGGGCT GTAGATAATG TTATGGACTA5640TGCAAATAAT TCTTTGGCGG GCATATGTTC AGTAAGATTA GCTGCGGGTG TACAGAATAA5700AATTTTAGAG TACATGGCTA TGGGAATACC GGCAATAACA ACATCGATTG GTTTGGAGGG5760GTTATTCGCT GTTGACGGCG AAAGTATAGT TGTGGCTAAT ACACCTCATG AGTTTGTATC5820AACAATATTG AAATTGTTTA ATGATCCAAG TTTTGGAAAA ACCATTTCAA AAAATGGATT5880AGGTTATGTT CAACAAAATC ATTCGTGGTC TGAGAAATTA CAACCCCTAA TTCAAGTAAT5940orf4基因的終止密碼子 orf5基因的起始密碼子TAATAATTTA ATCGAAGAGT AGTTTATGTC TAGTATAATT CCTGTTATTA TGGCTGGCGG6000TTCTGGTAGT CGTTTATGGC CTCTTTCGCG CGAACTTCGT CCAAAGCAAT TCCTTAAGCT6060TGATGGTGAG CTAACAATGC TGCAAGCGAC TATCAATCGT TTAAAAAATT TCGTTACGAC6120GCAACCATTG GTTATTTGTA ATGAAGATCA CCGATTTTTA GTTGCTGAAC AGTTACGTTA6180TTTAGGTAAA CTTGAAAATA ATATCATCTT AGAGCCATTT GGACGTAATA CTGCGCCAGC6240AATAGCTTTG GCTGCATTCA CAGCTTTACA GAGCTCTTCT CTTAAGGAAG ATCCTATATT6300GTTAGTATTA GCGGCAGATC ATGTTATCCG AGATGAAGAG TCATTTAAAA GATCAGTTCA6360ACAAGCAGTT CCTTATGCTA AATCTGGAAA ACTTGTTACT TTTGGCATTG TACCTACCCA6420TGCGGAAACC GGATATGGAT ATATACAACG AGGAAAGGAA TTAAATGATG CTTATTCAGT6480TAAACAATTT GTCGAAAAGC CCGAGCTTGA AACCGCACAA CAATATTTTA ATAGCGGAGA6540ATATTATTGG AATAGTGGTA TGTTCTTGTT TCGTGCTAGC CGCTATCTTG ATGAACTGGC6600ATTATTCCGA CCAGATATTT ATACTGCTTG TGGTAAAGCA ATAGGGGCTA TTGACCCAGA6660TCATGACTTT GTTCGTATTG ATAAAGATGC ATTCAATTCT TGTCCAAGTG ATTCTATTGA6720TTATGCTGTA ATGGAAAAAA CTTCAGATGC AGTAGTCGTT CCGATGGATG CTGGTTGGTC6780TGATGTTGGA TCTTGGCTAT CGTTATGGGA GCTTTCAAAA AAAGATTCTA TGGGGAATTC6840ATTTCATGGT GATGTGATTC AACATAGTAG TAAAAATAAT TTTGTTTTTA CAGAGAGCTG6900TTTGGTTAGT TTGGTTGGTG TTGAAAAACT TGTAGTCGTA CAAACAAAAG ATGCAATATT6960AGTTGCTGAT CAGAATAAAG TTCAAGATGT AAAAAATATA GTTGAGAAAC TAAAAAATAG7020CTGCCGTACA GAACATCGTA TACACCGGGA AGTTTTTCGC CCTTGGGGAA AGCATGATTT7080AATTGACGAT GGAGATGTAT ATCGAGTCAA AAGGATAAGT GTTAAACCGG GTGAGAGGCT7140TTCATTGCAA ATGCATCATC ATAGAGCTGA ACACTGGATA GTTGTATCTG GTATAGCTAA7200AGTTACGAAT GGTGACAATA TATATCTTTT AAAAGAAAAT GAATCAACAT TCATACCTTC7260AGGTACGATT CATGCCTTAG AAAATCCAGG AGAAATAATG CTGGAGCTTA TTGAGGTGCA7320orf5基因的終止密碼子ATCGGGAGTA TGCTTGGATG AAAATGATAT TATCCGTTTATAAGGTCACT TATAATTGAA7380GTTAAAGAGT TTCTATTAAA ATAGGCTATT TGGAGCTTTG ACAGTTGTTT AGTATTTAAT7440orf6基因的起始密碼子CGCAAAAATG ATATCTTTAT TTATAATGTT AAAGGTAGTG TCCTATGACT AAGTATAATA7500GTTCTTCATT AATAGCCAAT AGTAATGTGA ATTTTGGTAC TAGTGGTGCT CGTGGATTAG7560TCGTTGATTT TACTCACAAT GTTTGTGCTG CTTTTACTCA TGCATTTCTT TCGGTTATCG7620AAAAACACTT TAAGTTTGAC ACAGTGGCTG TAGCAATAGA TAACAGACCT AGTAGTTTTA7680ATATAGCACA AGCATGTGTT TTCGCTATAA AACAGCATGG ATATGGCATC GAATATCATG7740GTGTCATTCC GACTCCTGCA TTAGCTCATT ATTCGATGCA GAAAAATATT CCCTGTATAA7800TGGTCACTGG GAGTCATATA CCTTTTGATC GTAATGGTTT AAAATTCTAC CGACCAGATG7860GTGAAATCAC AAAAGAGGAT GAGCTCGCAA TTGTAAATAG TGAATATACA TTTTCTCCTG7920TAGGTGTATT ACCTCATCTT GAAACAAGCT CTCAAGGTGC GGACTGCTAC TTGGAACGTT7980ATGTTTCTCT TTTTTATTCT GATATTTTAA AGGGGAAAAG AATAGGGGTA TATGAACATT8040CTAGTGCGGG GCGCGATTTA TATGCTTCTC TTTTTAATCA ATTGGGTGCA GAGGTCATTT8100CCCTAGGCAG AAGTGATGAG TTCGTTCCGA TTGATACGGA AGCAGTAAGT GATGAAGATC8160GTGTACTTGC AAGAGAGTGG TCTAAAAAAT ATAATCTTGA TGCTATTTTC TCAACAGATG8220GCGATGGTGA TCGTCCTTTA GTTGCCGATG AAAATGGTGA ATGGTTAAGA GGCGATATTC8280TGGGACTACT TACTGCTATT GAACTTAATA TCAAGGCGTT GGCTATTCCA GTGAGTTGTA8340ATACAGCAAT TGAAGAGTCT AATAAATTTG CAAGTATACA ACGAACGAAA ATAGGTTCTC8400CTTATGTAAT TGCAGCATTT GCAGATCTTG CTAAGCAATT TGATTCAGTC GCTGGTTTTG8460AAGCTAATGG TGGTTTTCTC CTTGCCTCCG ATTTACAAAT TAATGACAAG GAATTAAAAT8520CGTTGCCTAC ACGAGATGCT GTGTTACCAG CATTAATGCT CTTAATAGCT TCTCGCAATA8580GTACTATTTC TCAACTGATT AATAATCTTC CTCAGCGATT CACTTGGTCA GATAGAGTTA8640AAAACTTCCC TTCAGATTCA AGTCAACAAA TTATAAAGAA TGCCATATCG TCACCCAATA8700ATTTCTTTAA TAGTTTAGGT TATGAATCAT TATCCTGTTC CTCTATTGAT GAAACGGATG8760GTGCAAGATT TACTTTAAAT AATGGTGATA TTATACATCT CCGTCCTTCC GGTAATGCTC8820CAGAACTCCG TTGTTATGCT GAGGCCAGTG ATGAAAATCA GGCTAAGCAA TATGTTACGA8880orf6基因的終止密碼子ATGTGCTGGG AAATATTACC TCTTTGATTT CTTGATGTTA TAGGTTTATC TACGCTTATA8940TGTGTGCGTA GGTTTGATTA CACGTAGATG CTGGTATACA GAATTGAAGA ACGGTATTTG9000TTGCATTAAT GAAATTCAGC ACTACACACA TTCGTGCAAC TTGAGATAAC ATCTCAATCA9060TATTCAAGTC GCGCATACAT CGCGGTGAAC ACCCCCTGAC AGGAGTAAAC AATGTCAAAG9120CAACAGATCG GCGTCGTCGG TATGGCAGTG ATGGGGCGCA ACCTTGCGCT CAACATCGAA9180AGCCGTGGTT ATACCGTCTC TATTTTCAAC CGTTCCCGTG AGAAAACGGA AGAAGTGATT9240GCCGAAAATC CAGGCAAGAA ACTGGTTCCT TACTATACGG TGAAAGAGTT TGTTGAATCT9300CTGGAAACGC CTCGTCGCAT CCTGTTAATG GTGAAAGCAG GTGCAGGCAC GGATGCTGCT9360ATTGATTCCC TCAAGCCATA CCTCGATAAA GGTGACATCA TTATTGATGG TGGTAATACC9420TTCTTCCAGG ACACCATTCG TCGTAACCGT GAGCTTTCTG CCGAAGGTTT TAACTTCATC9480GGTACCGGTG TTTCCGGCGG TGAAGAAGGT GCGCTGAAAG GTCCTTCCAT TATGCCTGGT9540GGGCAGAAAG AAGCCTATGA ACTGGTTGCA CCGATCCTGA CCAAAATCGC CGCAGTGGCT9600GAAGACTGTG AGCCATGCGT TACCTATATT GGTGCCGATG GTGCAGGTCA CTATGTGAAG9660ATGGTTCACA ACGGTATTGA ATACGGCGAT ATGCAGCTGA TTGCTGAAGC CTATTCTCTG9720CTTAAAGGTG GCTTGAACCT TTCCAACGAA GAACTGGCGC AGACCTTTAC CGAGTGGAAT9780AACGGTGAAC TGAGCAGCTA CCTGATTGAC ATCACTAAAG ACATCTTCAC TAAAAAAGAT9840GAAGACGGTA ACTACCTGGT TGATGTGATT CTGGATGAAG CGGCTAACAA AGGTACCGGT9900AAATGGACCA GCCAGAGCGC GCTGGATCTC GGCGAACCGC TGTCGCTGAT TACCGAGTCT9960GTGTTTGCAC GTTATATCTC TTCTCTGAAA GATCAGCGTG TTGCCGCATC TAAAGTTCTC10020TCTGGCCCGC AAGCACAGCC AGCAGGCGAC AAAGCTGAGT TTATCGAGAA AGTTCGCCGT10080GCGCTGTATC TGGGCAAAAT CGTTTCTTAC GCTCAGGGCT TCTCTCAGCT ACGCGCCGCG10140TCGGAAGATT ACAATTGGGA TCTGAACTAC GGCGAAATCG CGAAGATTTT CCGTGCTGGT10200TGCATCATCC GTGCGCAGTT CCTGCAGAAA ATCACCGATG CGTATGCCGA AAATCCCAAA10260ATCGCTAACC TGCTGTTGGC TCCGTACTTT AAGCAAATCG CCGACGACTA CCAGCAGGCA10320CTGCGTGATG TCGTCGCTTA TGCAGTGCAA AACGGTATTC CGGTTCCAAC CTTCTCTACG10380GCGGTTGCCT ATTACGATAG CTACCGTGCC GCGGTGCTGC CTGCGAACCT AATTCAGGCT10440CAGCGCGACT 10450以上僅是本發(fā)明較佳實(shí)施例,并非對本發(fā)明作任何限制,凡依本發(fā)明技術(shù)實(shí)質(zhì)對以上實(shí)施例作修改、等同變化與修飾,均屬本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的核苷酸,全長10450個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,其由6個(gè)基因組成,都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,所述的基因包括聚合酶基因,其包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,其包括orf1、orf3、orf4基因;其中所述的聚合酶基因是SEQ ID NO1中的2552至3721堿基的核苷酸;orf1基因是SEQ ID NO1中的1354至2565堿基的核苷酸;orf3基因是SEQ ID NO1中的3705至4781堿基的核苷酸;orf4基因是SEQ ID NO1中的4919至5962堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,其源于所述的wzy基因或糖基轉(zhuǎn)移酶基因即orf1、orf3、orf4基因;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對大腸桿菌O59的O-抗原特異的核苷酸,其特征在于,所述的源于orf1基因的寡核苷酸對是SEQ ID NO1中的1701至1720堿基的核苷酸和2221至2239堿基的核苷酸,SEQ ID NO1中的1396至1414堿基的核苷酸和2354至2372堿基的核苷酸,SEQ ID NO1中的1969至1987堿基的核苷酸和2410至2429堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的2857至2875堿基的核苷酸和3607至3625堿基的核苷酸,SEQ ID NO1中的2676至2694堿基的核苷酸和3379至3397堿基的核苷酸,SEQ ID NO1中的2925至2943堿基的核苷酸和3687至3707堿基的核苷酸;源于orf3基因的寡核苷酸對是SEQ ID NO1中的4165至4283堿基的核苷酸和4694至4712堿基的核苷酸,SEQ ID NO1中的3914至3933堿基的核苷酸和4535至4552堿基的核苷酸,SEQ ID NO1中的3714至3733堿基的核苷酸和4478至4497堿基的核苷酸;源于orf4基因的寡核苷酸對是SEQ ID NO1中的4967至4985堿基的核苷酸和5758至5776堿基的核苷酸,SEQ ID NO1中的5120至5139堿基的核苷酸和5518至5536堿基的核苷酸,SEQ ID NO1中的5253至5271堿基的核苷酸和5896至5914堿基的核苷酸。
6.權(quán)利要求1所述的對大腸桿菌O59的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
7.權(quán)利要求1所述的對大腸桿菌O59的O-抗原特異的核苷酸的重組分子,而且通過插入表達(dá)可提供表達(dá)大腸桿菌O59的O-抗原,并成為細(xì)菌疫苗。
8.權(quán)利要求1所述的對大腸桿菌O59的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細(xì)菌。
9.權(quán)利要求1所述的對大腸桿菌O59的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O59,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)的溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O59中的O-抗原基因簇以大腸桿菌O59的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的JumpStart序列設(shè)計(jì)上游引物(5’-ATT GTG GCT GCA GGGATC AAA GAA AT-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(5’-TAG TCG CGT GNG CCT GGA TTA AGT TCG C-3’)。用Boehr inger Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個(gè)循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫;反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1MMnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5□細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5□混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O59的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的100個(gè)克隆由上海生物工程有限公司用ABI 377型DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,再通過將相聯(lián)系的序列進(jìn)行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列。(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O59的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個(gè)方面來保證1)對大腸桿菌O59的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率;在得到大腸桿菌O59的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到9個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O59的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對大腸桿菌O59的O-抗原基因簇中orf1、wzy、orf3、orf4基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)三對引物,每對引物分布在相應(yīng)基因內(nèi)不同地方以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌基因組為模板進(jìn)行PCR,所有引物在大腸桿菌O59中得到陽性結(jié)果,在其他組中沒有擴(kuò)增到任何大小正確的帶,也就是,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以orf1、wzy、orf3、orf4基因?qū)Υ竽c桿菌O59及其O-抗原都是高度特異的。
全文摘要
本發(fā)明提供一種對大腸桿菌059(Escherichia coli059)的O-抗原特異的核苷酸,它是大腸桿菌059中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長10450個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌059的O-抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因的寡核苷酸。本發(fā)明通過PCR證實(shí)寡核苷酸對大腸桿菌059的O-抗原都有高度的特異性。本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定人體及環(huán)境中的大腸桿菌059的方法。
文檔編號C12P19/34GK1453358SQ0312993
公開日2003年11月5日 申請日期2003年5月27日 優(yōu)先權(quán)日2003年5月27日
發(fā)明者王磊, 楊靜華, 馮露 申請人:南開大學(xué)