專利名稱:對(duì)鮑氏志賀氏菌8型和大腸桿菌0143的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及鮑氏志賀氏菌8型(Shigella boydii 8)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及鮑氏志賀氏菌8型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對(duì)O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測人體及環(huán)境中的鮑氏志賀氏菌8型和大腸桿菌O143(Escherichia coliO143)并鑒定這些致病菌中的O-抗原。
O-抗原是革蘭氏陰性細(xì)菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個(gè)固定在細(xì)胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過轉(zhuǎn)運(yùn)酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個(gè)糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負(fù)責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個(gè)基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“TheEscherichia coli O111 and Salmonella enterica O35 gene clustersgeneclusters encoding the same col itose-containing O antigen are highlyconserved”.Journal of Bacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因。其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉(zhuǎn)運(yùn)酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細(xì)菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的合成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因?yàn)镺-抗原是極強(qiáng)的抗原,是志賀氏菌重要的致病因素之一,同時(shí)它又具有極強(qiáng)的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測志賀氏菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來一直被用于對(duì)細(xì)菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲(chǔ)存中也存在一些困難。另一方面此法耗時(shí)長、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對(duì)不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用針對(duì)E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia oli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個(gè)推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111.Gene 16417-23],而在其它細(xì)菌的O-抗原的結(jié)構(gòu)中也可能有這個(gè)糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的。
志賀氏菌有46種血清型,大腸桿菌有166種不同的O-抗原,二者親緣關(guān)系非常近,并且有12種O-抗原是大腸桿菌和志賀氏菌共有的,其中鮑氏志賀氏菌8型和大腸桿菌O143就擁有相同的O-抗原[Ewing,W.H.(1986)“Edwardsand Ewing’s identification of the Enterobacteriaceae”.ElsevierScience Publishers,Amsterdam,The Netherlands;T.cheasty,et al.(1983)“Antigenic relationships between the enteroinvasive Escherichiacoli antigens O28ac,O112ac,O124,O136,O143,O144,O152 and O164 andShigella O antigens”J.clin Microbiol,17(4)681-684],傳統(tǒng)的血清型方法不能將它們區(qū)分。
本發(fā)明的次一目的是提供了鮑氏志賀氏菌8型的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的另一目的是提供了構(gòu)成鮑氏志賀氏菌8型的O-抗原基因簇的基因轉(zhuǎn)運(yùn)酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf3、orf6、orf7、orf10基因。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于鮑氏志賀氏菌8型的O-抗原基因簇中編碼糖基轉(zhuǎn)移酶的基因包括orf3、orf6、orf7、orf10基因;源于編碼轉(zhuǎn)運(yùn)酶的基因即wzx基因或與wzx有相似功能的基因、源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原也是高度特異的。
本發(fā)明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴(kuò)增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原及檢測和鑒定鮑氏志賀氏菌8型和大腸桿菌O143。
本發(fā)明的還一目的是提供了分離鮑氏志賀氏菌8型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細(xì)菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細(xì)菌的基因簇的全序列。
本發(fā)明為實(shí)現(xiàn)上述目的所采用的技術(shù)方案是本發(fā)明對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其是如SEQ ID NO1所示的分離的核苷酸,全長15124個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其由10個(gè)基因組成,它們都位于galF基因和gnd基因之間。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其中所述的基因是轉(zhuǎn)運(yùn)酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf3、orf6、orf7、orf10基因;其中所述的基因orf3是SEQ ID NO1中的3311至4228堿基的核苷酸;wzx是SEQ ID NO1中的4664至5869堿基的核苷酸;orf6是SEQ ID NO1中的5851至6744堿基的核苷酸;orf7是SEQ ID NO1中的6741至7856堿基的核苷酸;wzy是SEQ ID NO1中的7853至8935堿基的核苷酸;orf10是SEQ ID NO1中的12131至12934堿基的核苷酸。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其中源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因orf3、orf6、orf7、orf10基因;以及它們的混合或它們的重組。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其中源于orf3基因的寡核苷酸對(duì)是SEQ ID NO1中的3455至3471堿基的核苷酸和3929至3946堿基的核苷酸;SEQ ID NO1中的3635至3653堿基的核苷酸和4037至4056堿基的核苷酸;SEQ ID NO1中的3740至3759堿基的核苷酸和4201至4220堿基的核苷酸;源于wzx基因的寡核苷酸對(duì)是SEQ ID NO1中的4843至4860堿基的核苷酸和5377至5394堿基的核苷酸;SEQ ID NO1中的4889至4906堿基的核苷酸和5461至5479堿基的核苷酸;SEQ ID NO1中的5391至5408堿基的核苷酸和5830至5847堿基的核苷酸;源于orf6基因的寡核苷酸對(duì)是SEQ ID NO1中的6032至6051堿基的核苷酸和6417至6435堿基的核苷酸;SEQ ID NO1中的6220至6239堿基的核苷酸和6671至6689堿基的核苷酸;SEQ ID NO1中的6087至6106堿基的核苷酸和6671至6689堿基的核苷酸;源于orf7基因的寡核苷酸對(duì)是SEQ ID NO1中的7194至7211堿基的核苷酸和7822至7839堿基的核苷酸;SEQ ID NO1中的6780至6797堿基的核苷酸和7222至7239堿基的核苷酸;SEQ ID NO1中的7010至7028堿基的核苷酸和7592至7626堿基的核苷酸;源于wzy基因的寡核苷酸對(duì)是SEQ ID NO1中的8211至8228堿基的核苷酸和8844至8861堿基的核苷酸;SEQ ID NO1中的7892至7911堿基的核苷酸和8414至8431堿基的核苷酸;SEQ ID NO1中的8038至8056堿基的核苷酸和8565至8582堿基的核苷酸;源于orf10基因的寡核苷酸對(duì)是SEQ ID NO1中的12152至12171堿基的核苷酸和12915至12932堿基的核苷酸;SEQ ID NO1中的12312至12329堿基的核苷酸和12843至12860堿基的核苷酸;SEQ ID NO1中的9934至9952堿基的核苷酸和10513至10530堿基的核苷酸。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的重組分子,且通過插入表達(dá)可提供表達(dá)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原,并成為細(xì)菌疫苗。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的應(yīng)用,其中它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細(xì)菌。
前述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)志賀氏菌,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分,之后加入3ul20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃ 30分,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增鮑氏志賀氏菌8型中的O-抗原基因簇鮑氏志賀氏菌8型的O-抗原基因簇通過Long PCR擴(kuò)增,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動(dòng)子區(qū)的JumpStart序列設(shè)計(jì)上游引物(#1523-ATT GTG GCT GCA GGG ATCAAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(#1524-TAGTCG CGT GNG CCT GGA TTA AGT TCG C)。用Boehringer Mannheim公司的ExpandLong Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分;然后94℃變性10秒,60℃退火30秒,68℃延伸15分,這樣進(jìn)行30個(gè)循環(huán)。最后,在68℃繼續(xù)延伸7分,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,分別用等體積的酚和酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提兩次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5uldNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃ 30分,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分,使DNA的3’端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用BiO-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5 a細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5 a混合后,轉(zhuǎn)到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨卞青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了鮑氏志賀氏8型的O-抗原基因簇文庫;(4)對(duì)文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動(dòng)測序儀對(duì)克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率。剩余20%的序列再根據(jù)已得到的序列設(shè)計(jì)引物,該對(duì)引物,如下所示5’-TCGAGTTGGTGATATAGC-3’和5’-TTATTAATAGTCTCCGCG-3’,再從鮑氏志賀氏菌8型的基因組DNA中直接PCR并對(duì)PCR產(chǎn)物測序,從而獲得O-抗原基因簇的所有序列。
(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌8型的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個(gè)方面來保證1)對(duì)鮑氏志賀氏菌8型的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到鮑氏志賀氏菌8型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到14個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu)。
(6)特異基因的篩選針對(duì)鮑氏志賀氏菌8型的O-抗原基因簇中的wzx、wzy、orf3、orf6、orf7、orf10基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了三對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,所有引物都在大腸桿菌O143中得到陽性結(jié)果,在其他組中都沒有擴(kuò)增到任何大小正確的帶,即在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PDR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy、orf3、orf6、orf7、orf10基因?qū)︴U氏志賀氏菌8型和大腸桿菌O143及其O-抗原都是高度特異的。
也就是本發(fā)明的第一個(gè)方面,提供了鮑氏志賀氏菌8型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長15124個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu),如表3所示,它總共由10個(gè)基因組成,都位于galF基因和gnd基因之間。
本發(fā)明的第二個(gè)方面,提供了鮑氏志賀氏菌8型的O-抗原基因簇中的基因,即轉(zhuǎn)運(yùn)酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因,包括orf3、orf6、orf7、orf10基因,它們?cè)贠-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發(fā)明尤其涉及到糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因,因?yàn)樘呛铣陕窂交蚣春铣珊塑斩姿釂翁堑幕颥F(xiàn)在被預(yù)示對(duì)較多胞外多糖是常見的、共同的,對(duì)細(xì)菌的O-抗原并不是很特異的,而本發(fā)明涉及到的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因?qū)︴U氏志賀氏菌8型和大腸桿菌O143的O-抗原是高度特異的。
本發(fā)明的第三個(gè)方面,提供了源于鮑氏志賀氏菌8型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因,包括orf3、orf6、orf7、orf10基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中的寡核苷酸對(duì),在表1中也列出了這些寡核苷酸對(duì)在O-抗原基因簇中的位置及以這些寡核苷酸對(duì)為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進(jìn)行。這些引物只在以鮑氏志賀氏菌8型和大腸桿菌O143為模板進(jìn)行的PCR擴(kuò)增中得到預(yù)期大小的產(chǎn)物,而在以表2所列的其余165株大腸桿菌和42株志賀氏菌為模板進(jìn)行的PCR擴(kuò)增中都未得到預(yù)期大小的產(chǎn)物。更詳細(xì)地說,以這些寡核苷酸對(duì)為引物所做的PCR反應(yīng)在大多數(shù)細(xì)菌中均未得到任何產(chǎn)物。所以可以確定這些引物即表1所列的寡核苷酸對(duì)鮑氏志賀氏菌8型和大腸桿菌O143及它們的O-抗原是高度特異的。
本發(fā)明提供的對(duì)痢疾志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的分離方法包括下述步驟(1)基因組的提??;(2)PCR擴(kuò)增鮑氏志賀氏菌8型中的O-抗原基因簇;(3)構(gòu)建O-抗原基因簇文庫的構(gòu)建;(4)對(duì)文庫中的克隆測序(5)核苷酸序列的拼接及分析(6)特異基因的篩選。
本發(fā)明的其他方面由于本文的技術(shù)的公開,對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所用,“寡核苷酸”是指來源于O-抗原基因簇中的編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶的基因和編碼聚合酶的基因內(nèi)的一段核苷酸分子,它們?cè)陂L度上可改變,一般在10到20個(gè)核苷酸范圍內(nèi)改變。更確切的說這些寡核苷酸是源于orf3基因(核苷酸位置是從SEQ ID NO1的3311至4228堿基),wzx基因(核苷酸位置是從SEQ ID NO1的4664至5869堿基),orf6基因(核苷酸位置是從SEQ ID NO1的5851至6744堿基),orf7基因(核苷酸位置是從SEQ ID NO1的6741至7856堿基),wzy基因(核苷酸位置是從SEQ IDNO1的7853至8935堿基),orf10基因(核苷酸位置是從SEQ ID NO1的12131至12934堿基)。源于以上基因內(nèi)的寡核苷酸對(duì)鮑氏志賀氏菌8型(SEQ ID NO1)和大腸桿菌O143都是高度特異的。
此外,有時(shí)兩個(gè)遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細(xì)菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對(duì)寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對(duì)寡核苷酸的混合物,它們?cè)从谔腔D(zhuǎn)移酶基因;源于轉(zhuǎn)運(yùn)酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因;也源于糖合成路徑基因。這些基因的混合物對(duì)一個(gè)特殊的細(xì)菌多糖抗原來說是特異的,從而使這套寡核苷酸對(duì)這個(gè)細(xì)菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy或與wzy有相似功能的基因中的寡核苷酸與源于糖合成路徑基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達(dá)O-抗原的細(xì)菌和在診斷中鑒定細(xì)菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是鮑氏志賀氏菌8型或大腸桿菌O143??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
本發(fā)明者考慮到以下情況當(dāng)單個(gè)的特異的寡核苷酸檢測無效時(shí),寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對(duì)一個(gè)特殊的細(xì)菌的O-抗原來說是特異的,這一特殊的細(xì)菌O-抗原是由鮑氏志賀氏菌8型或大腸桿菌O143表達(dá)的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個(gè)基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交。這些細(xì)菌是鮑氏志賀氏菌8型或大腸桿菌O143??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
一般,一對(duì)寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個(gè)寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個(gè)寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時(shí),至少能選出一對(duì)寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對(duì)寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個(gè)特殊的基因簇中所有基因都獨(dú)一無二時(shí),此方法也能應(yīng)用于識(shí)別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對(duì)寡核苷酸,在這里多對(duì)寡核苷酸是源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對(duì)一個(gè)特殊的細(xì)菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原的方法。樣品中的一個(gè)或多個(gè)細(xì)菌多糖抗原可以使樣品能與以下至少一個(gè)基因中的一對(duì)寡核苷酸中的一個(gè)特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運(yùn)酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個(gè)寡核苷酸能與樣品中的至少一個(gè)表達(dá)特殊的O-抗原的細(xì)菌的一個(gè)以上的那樣的基因特異性雜交,這些細(xì)菌是鮑氏志賀氏菌8型或大腸桿菌O143。可用本發(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過雜交反應(yīng),或通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
更詳細(xì)地說,以上描述的方法可以理解為當(dāng)寡核苷酸對(duì)被使用時(shí),其中的一個(gè)寡核苷酸分子能雜交到一個(gè)并不是來源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當(dāng)兩個(gè)寡核苷酸都能雜交上時(shí),它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問題時(shí),可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測所有表達(dá)O-抗原和鑒定O-抗原的細(xì)菌。而且,由于O-抗原合成和其他多糖抗原(如細(xì)菌胞外抗原)合成之間的相似性,發(fā)明者相信本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了鮑氏志賀氏菌8型的O-抗原基因簇的全長序列,而且可從這個(gè)未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達(dá)可產(chǎn)生表達(dá)鮑氏志賀氏菌8型的O-抗原,并成為有用的疫苗。
其次是感受態(tài)細(xì)胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細(xì)胞大腸桿菌DH5α。取一環(huán)大腸桿菌DH5α單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時(shí)后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃ 250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分,于4℃ 4000rpm離心15分。傾盡上清液,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃4000rpm離心15分。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃ 4000rpm離心15分。用冷的冰預(yù)冷的10%的甘油懸浮細(xì)胞,4℃ 6000rpm離心10分,棄上清液,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細(xì)胞,即為感受態(tài)細(xì)胞。將制得的感受態(tài)細(xì)胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細(xì)胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒-6.0ms毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍(lán)白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了鮑氏志賀氏菌8型的O-抗原基因簇文庫。實(shí)施例4對(duì)文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動(dòng)測序儀對(duì)克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到90%的覆蓋率。剩余10%的序列再根據(jù)已得到的序列設(shè)計(jì)引物,再從鮑氏志賀氏菌8型的基因組DNA中直接PCR并對(duì)PCR產(chǎn)物測序,從而獲得O-抗原基因簇的所有序列。在鮑氏志賀氏菌8型中我們?cè)O(shè)計(jì)了一對(duì)引物,如下所示5’-TCGAGTTGGTGATATAGC-3’和5’-TTATTAATAGTCTCCGCG-3’實(shí)施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌8型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個(gè)方面來保證1)對(duì)鮑氏志賀氏菌8型的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到鮑氏志賀氏菌8型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到10個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,發(fā)現(xiàn)orf1與Bacillus anthracis的氨基轉(zhuǎn)移酶基因在370個(gè)氨基酸的序列中有27%的相同性,49%的相似性,表明它們之間有很高的同源性,所以可以推測orf1是氨基轉(zhuǎn)移酶基因,命名為orf1。orf2與Clostridium acetobutylicum的磷酸酶基因在213個(gè)氨基酸的序列中有25%的相同性,46%的相似性,表明它們之間有很高的同源性,所以可以推測orf2是磷酸酶基因,命名為orf2。orf3與Methanosarcina maze的糖基轉(zhuǎn)移酶基因在311個(gè)氨基酸的序列中38%的相同性,55%的相似性,另外還與Streptococcus thermophilus的EpsllQ基因在428個(gè)氨基酸的序列中37%的相同性,56%的相似性,EpsllQ是一個(gè)糖基轉(zhuǎn)移酶基因,所以推測orf3是一個(gè)編碼糖基轉(zhuǎn)移酶的基因,命名為orf3。orf4與Clostridiumacetobutylicum的乙?;D(zhuǎn)移酶基因在182個(gè)氨基酸的序列中有29%的相同性,47%的相似性,表明它們之間有高度的同源性。所以,可以推測orf4是乙酰基轉(zhuǎn)移酶基因。Orf5與Escherichia coli K-12的wzx基因在415個(gè)氨基酸中有17%的相同性,43%的相似性,與Shigella bodyii的wzx基因在409個(gè)氨基酸中有18%的相同性,44%的相似性,并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.etal(1984).Analysis of membrane and surfaceprotein sequences with the hydrophobic moment plot.J.Mol.Biol.179125-142]發(fā)現(xiàn)orf5有12個(gè)潛在的穿膜區(qū),它與許多wzx蛋白相似,而且在wzx蛋白的氨基端有一個(gè)大約50個(gè)氨基酸的保守基序,所以可以確定orf5是wzx基因,命名為wzx。Orf6與Lactobacillus delbrueckii的EpsH基因在268個(gè)氨基酸序列中有28%的相同性,49%的相似性,另外還與Streptococcus agalactiae中的cpsIbJ基因在313個(gè)氨基酸序列中有28%的相同性,48%的相似性,而EpsH基因是一個(gè)半乳糖基轉(zhuǎn)移酶基因,cpsIbJ基因也是一個(gè)糖基轉(zhuǎn)移酶基因,所以推測orf6是一個(gè)編碼糖基轉(zhuǎn)移酶的基因,命名為orf6。Orf7與Methanosarcina mazei Goe1的糖基轉(zhuǎn)移酶基因在379個(gè)氨基酸序列中有23%的相同性,42%的相似性,另外還與Nostoc sp.PCC7120中的糖基轉(zhuǎn)移酶基因在429個(gè)氨基酸序列中有22%的相同性,43%的相似性,所以推測orf7是一個(gè)編碼糖基轉(zhuǎn)移酶的基因,命名為orf7。orf8與Escherichia coli K-12的wzy基因在388個(gè)氨基酸序列中有19%的相同性,41%的相似性,與Streptococcus pneumoniae的O-抗原聚合酶在447個(gè)氨基酸序列中有20%的相同性,39%的相似性,另外通過Eisenberg算法得知orf8有10個(gè)潛在的穿膜區(qū),與其他的O-抗原聚合酶有相似的二級(jí)結(jié)構(gòu),所以確定orf8是wzy基因,命名為wzy。orf9與Edwardsiellaictaluri的gne基因在338個(gè)氨基酸序列中有70%的相同性,80%的相似性,表明它們之間有極高的同源性,所以確定orf9是gne基因,命名為gne。orf10與Streptococcus agalactiaei的CpsVII基因在322個(gè)氨基酸序列中有35%的相同性,54%的相似性,此外與Lactobacillus delbrueckii的EpsM基因在336個(gè)氨基酸序列中有29%的相同性,47%的相似性,而這兩個(gè)基因都是糖基轉(zhuǎn)移酶基因,所以推測orf10也是一個(gè)糖基轉(zhuǎn)移酶基因,命名為orf10。實(shí)施例6特異基因的篩選針對(duì)鮑氏志賀氏菌8型的O-抗原基因簇中的wzx、wzy、orf3、orf6、orf7、orf10基因設(shè)計(jì)引物,這些基因在核苷酸序列中的位置見表1。
表1列出了鮑氏志賀氏菌8型的O抗原基因簇中糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及基因內(nèi)的引物及PCR數(shù)據(jù)。在表中列出了鮑氏志賀氏菌8型的O抗原基因簇的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運(yùn)酶基因和聚合酶基因及它們的相應(yīng)的功能和大小。在每個(gè)基因內(nèi),我們各設(shè)計(jì)了三對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個(gè)引物在SEQ IDNO1中的位置和大小。以每對(duì)引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進(jìn)行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個(gè)基因,所以我們根據(jù)mdh基因設(shè)計(jì)了引物#101(-TTC ATC CTAAAC TCC TTA TT)和#102(-TAA TCG CAG GGG AAA GCA GG),然后從166株大腸桿菌中提取基因組,方法如前所述。用這對(duì)引物從166株大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質(zhì)量。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個(gè)菌分為一組,總共27組,它們的來源都列于表中。
在第22組中含有鮑氏志賀氏菌8型的基因組DNA作為陽性對(duì)照。以每組菌做模板,用表1中的每對(duì)引物按如下條件做PCR在94℃預(yù)變性2分后,94℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時(shí)間是50秒,72℃延伸2分,這樣進(jìn)行30個(gè)循環(huán)。最后在72℃繼續(xù)延伸10分,反應(yīng)體系是25ul。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測擴(kuò)增出的片段。
對(duì)于wzx、wzy、orf3、orf6、orf7、orf10基因,每個(gè)基因都有三對(duì)引物被檢測,每對(duì)引物除了在第22組中做PCR后得到了預(yù)期大小的正確的一條帶外,在第17組中也都得到同樣大小的特異性帶。以第17組中的每個(gè)菌的基因組DNA做模板PCR后,發(fā)現(xiàn)只在大腸桿菌O143中得到了陽性結(jié)果。更詳細(xì)地說,以上每個(gè)基因的每一對(duì)引物都在大腸桿菌O143中得到預(yù)期大小的正確的PCR產(chǎn)物帶。據(jù)報(bào)道,鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原結(jié)構(gòu)是一樣的,我們的結(jié)果從另一個(gè)側(cè)面證實(shí)了這一點(diǎn)。此外,所有的引物在其他組中都沒有擴(kuò)增到任何帶,所以wzx、wzy、orf3、orf6、orf7、orf10基因?qū)︴U氏志賀氏菌8型和大腸桿菌O143及其O-抗原都是高度特異的。
最后,通過PCR從鮑氏志賀氏菌8型中篩選到對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原高度特異的基因wzx、wzy和四個(gè)糖基轉(zhuǎn)移酶基因。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原是特異的,尤其是上述每個(gè)基因中的引物即寡核苷酸對(duì)經(jīng)PCR檢測后證實(shí)對(duì)鮑氏志賀氏菌8型和大腸桿菌O143是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測人體和環(huán)境中的鮑氏志賀氏菌8型和大腸桿菌O143,并能鑒定它們的O-抗原。
表3是鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu),共由10個(gè)基因組成,每個(gè)基因用方框表示,并在方框內(nèi)寫入基因的名稱,數(shù)字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,這兩個(gè)基因不負(fù)責(zé)O-抗原的合成,我們只是用它們的一段序列設(shè)計(jì)引物來擴(kuò)增O-抗原基因簇的全長序列。
表4是鮑氏志賀氏菌8型的O-抗原基因簇中的基因的位置表,在表中列出了鮑氏志賀氏菌8型的O-抗原基因簇中的所有開放閱讀框在全序列中的準(zhǔn)確位置,在每個(gè)開放閱讀框的起始密碼子和終止密碼子的下面劃線。
序列列表SEQUENCE LISTING<110>南開大學(xué)<120>對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸<130>對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸<160>1<170>PatentIn version 3.1<210>1<211>15124<212>DNA<213>Shigella boydii<400>1attgtggctg cagggatcaa agaaatcctc ctggtaactc atgcgtccaa gaacgcagtc60gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgaacagcg cgtgaagcgt 120caactgctgg cggaagtaca gtccatttgc ccgccgggcg tgaccattat gaacgtgcgt 180cagggcgaac ctttaggttt aggccactcc attttatgtg cacgacctgc tattggtgac 240aacccatttg tcgcggtgct gccagacgtt gttatcgatg acgccagcgc cgacccgctg 300cgctacaacc ttgctgccat gattgcgcgc ttcaacgaaa cgggccgcag ccaagtgctg 360gcaaaacgta tgccgggtga cctctctgaa tactccgtca ttcagaccaa agagccgctg 420gaccgcgaag gtaaagtcag ccgcattgtt gaatttatcg aaaaaccgga tcagccgcag 480acgctggact cagacatcat ggctgtaggg cgttatgtgc tttctgccga tatttggcct 540gaactggagc gtactcaacc tggagcatgg ggacgtattc agttgactga tgccattgct 600gagttggcaa aaaaacaagc agttgacgca atgctgatga ctggggacag ttacgactgc 660ggaaagaaaa tgggttatat gcaagcgttt gtgaagtatg ggctgcgtaa cctgaaggaa 720ggcgctaagt tccgcaaagg cattgagaag ttgttaagcg agtaatgaaa atctgaccgg 780atgtaacggt tgataagaaa attataacgg ctgtgaagat ttgcggcgaa ggtaatttgt 840tgcgaatatt cctgccgttg ttttatataa acaatcagaa taacaaagag ttagcaatag 900gattttcgtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt 960agcgtttgaa tttttcgggt ttagcgcgag tgggtaacgc tcgtcacatc gtaggcatgc 1020atgcagtgct ctggtagctg taaagccagg ggcggtagcg tgcatataag agaaaacatg 1080tggcactgat tttttactaa acaattggcg ataaatattc aataatggag attttcctta 1140acatcaaacg ctattatttt atatattata aatgtccaaa tactcagtat atatacaaaa 1200agagtaagat aaaacttaaa aatttaataa ggtgtctcta tatttctgac tacagacaag 1260catggaaagt ataatatatt gaatattctg tttctgatta cttatgctct caatttgcag 1320aagttagtga agatattcag tatgtggaat agatatatat tttttttgac acaatatgtc 1380gattattctt cacgagatta tattaagaat agaataaaat aaatgtatgg gcttatatac 1440gaattatgaa acataggagc aattctgaaa attatctaag ataagatatt gtgttttctt 1500gagtatgttt aaattcttta aatgttatgc acagaacgta atggagtaaa aattgaataa 1560gttcgtaaaa aaaatgaagc catataaact tgcatcccac gctatatggg agagtgaaaa 1620taaagaaaca atattaaaat tagattggaa cgaatctact attgaaccgc cagaaagagt 1680aaaaaatgca ttaatgaatt cgttggtaaa taatctaatt aggtattatc cagatgtgag 1740caataaagat ttaataataa agatatcaaa ctatgtgggg gtgccaaagg aatatatcca 1800gtatttttgt agttcagact cagcacacga gtctatcatt cgtacattaa ttaatgaaaa 1860tgataaaata ttgatgttag cacctacgta tgataatttc agaacaacag gtgaagctca 1920aggggcaaca atttgttatt caatttttga agataattac tattggtcat taaagaagtt 1980tgaaagcgat ctcaataagt ttcaacctca aatggcctat ttatgtaacc caaataatcc 2040tacaggtact cttattccta aaggagatat acattatctt gtagaaaaat ataaaggaat 2100atattttatt atcgatgaag cctattatga atttgcaaaa ttaacgtgtg ctgattttgt 2160aaactccttt aataacataa ttattacgcg aacattttcc aaagcatttt cattggcagg 2220gatgcgaatg ggatatataa tagcgtcaca agatttgtta ggtgcaataa ataaagtcag 2280aaatgcaaaa aatatacctc agctaagtca gattgccgct ttgaatgcat tagacgaagt 2340tgaatatatg aataattatg ttaaggaagt taatcaggct aagcgttttt tttatgataa 2400gttgaaaaat ataaatatag gtcaaaaaaa tattgtatat ggagagggaa actttttggt 2460tattgagttt aaatcgatga atgataaaaa agcattcatt gaacgtttaa aatctaattt 2520aatatttgtt cgtgatttat ctcatatgaa agaggtcgag ttatgtgtca gaattactat 2580tggaacgaaa aaacaaatgt tgtatgtaat cagaatttta gagcagatgt atgaagttaa 2640aaaagatagc attatttgat ctgtgtgaaa ccttagttga ttttcaaact ggcgatgggt 2700ttatatacta tgtaatagat cgtttgggga tatgtaataa catcaaaata cagactttaa 2760atagggtggc atcttcatta tccattttca aaatcgaaca aataataaat aaaataagat 2820tgggggaaag tttaaggaaa agaattttat tgtatatgtt aaaaaatatt gaaagggata 2880ttcttaatgt aatggctcgt gattacgtta atgaaattat attgcgcaga gttaatcctg 2940ccataattaa gatattgaat aagcatttaa aagatggaga tgaggttatt attatttctg 3000gaggctatga tatttatatt caatatttag ttaaagcatt agagattaat agctttgtat 3060gcacaaaaat taaatttgat aatagaggca ggtgtttagg gagaattagt ggcaagaatt 3120gcatgggata taataaagta ttaatgttaa aaggtgtttt gtcgttagat gtttctgagt 3180atcatataac aacttactct gattctatta gcgatttacc aatattaaaa atgagcaacg 3240ttggggtagt agtatcgaaa ggccaggcaa gagaatgggt aagacagcat aaattatttg 3300agattctaat atgaatagaa aaaatctttc catgaaattg atgtatatat tgtataatat 3360aaagtattta ttgaaatgct ttgtcgttct gattactcca gatagcttga ttataaaaaa 3420gcagtttctt gaatatcagg gataccctct cggattgaac aatccgaaga cattaaatca 3480aaagttacaa tggttgaaac taaatgacag aacaccatta catacaatat gtgctgataa 3540aattagagtg cgagaatatg tggaaaatag gctgggaacg agagataata taattgattt 3600gttaaaggtt tatgataccc cttttgatat tacctttgag tctttaccac agggtaagtt 3660tgttataaaa tcgaaccact attgtggcga ttattttatt gttagagaca agaatttatt 3720gaatattgat gaggttaagt ggaaatttat tagaacactt aattgtaata tttaccatca 3780cggaagagaa tggcaatata aaaatattga taggcgtata attgttgaaa ggttattaga 3840ggatgaggca gggaaagttc ctaatgatat aaaaattcat tgttttaatg gagaaccgaa 3900atttatttat gtgtcgttag atcgtgaggg agggaattat cgttctatat atgatactag 3960ttggaatatg ttagattttt gctgggcgag aaggggaaaa gatctttcaa aatttaatgt 4020gaagaatatt agtaaaccaa gtcagttaga aaacgctcta aatatatcta aaaaactaag 4080tcaaggtttc aaatatctta gggttgattt atatcttgtt caagaaaaaa tatatgtagg 4140cgaattaaca tttcatcaag gatcggggta tgataagata actccatttg aatgggatga 4200aaggctcgga aaggagttaa agctatgagc atattctcta gaattcaatt aatatggtat 4260aaattatgtt ttatctgtga gtttggagta aaacgttata agcaatccca tatttatggt 4320ccttataaga tagtagaacc atcgaatctt aaattcggta attccttttc aattaatgat 4380tttgtgtata taaatgctag tggaggagtc attttaggcc ataatgtagt actgtctgct 4440ggtagtaaaa ttctcagtac aggtttggta tttgaaaaga aaatctttaa atataaaaaa 4500gataaggtag taataaaaga taatgttcag ttaggtgctg gagcaattgt tttaccggga 4560gtggagatct gtagtaatat tattgttggt gccggagcga tagttacaaa aaacttagag 4620gaaccaggtg tatatgttgg gcaaccggct agaaaaataa aagatgtcta gttttttaag 4680aagtattatc tctgtaagtg ctctaaagct agtggattat attgtcccaa taataattat 4740gccgctggtt ttaactagat ttaatttaga gggatatgga gtttattctt atgtgttaac 4800tatatcaact tttatttcat ttatttatga tgcttgtcta aatacagtag gcgtacaaca 4860attaaataag cttaagggta atgaaattgc tcagcagtcg tttgttattt cagcgatttt 4920ctttaagtta gtgttttttt ttgtatgtgc gattgtgttt attataattt cagagactgc 4980agggaagagt gattattttt gtgtcgtaat attctcgttt ggatttggca tgcttaatag 5040ttggtactat atagcaaagg ataactttag gtttataata atagtgtcct tggtagttaa 5100aattttagcg gttttatttg ttttatatta tgcttttgaa ttacacatgt ttatttttat 5160tcaggcgata gcatctgctc tggttggact tattagtttg ataaaaataa agaatgataa 5220taggttggga aaaatatcat ttagacatat taaaaattat ttgaaaaaca ttaagcatat 5280gtacatatat agcggggtaa atgcacttat tcagcctata attaattctg ctatattggc 5340atcaggaaat gctagcttgt tagggatata taacgtcgtt atgcgatttg tggcagtatc 5400cgtaacattt tccaattcaa ttatcactgt cttaaataaa tgtaattcag aggtttttta 5460ttccgtaggg cacaaaacta actatgtgga agtaaaatac agaagtcagc tactcaaatt 5520gttgttttac agcatcgttg tttttatatg tgtggctgca atatcatatg tctctattta 5580tatgacaaag ggagaaatat ctcgtttttt tatttttcta atattttcat ttagcctagc 5640tgttatccca agtatactca atcaatattt aactcaatta attcatatga tacactcatc 5700aaaaaatata gtaaaatatg agatttgttc gaatgtacta tcgttaatat ctattttttt 5760attttcttca ttattcccat attattatat agtatatgct gtagttctat cgccaattat 5820tattacaatt tgctgtctgt gggatttgaa atgcaaaaac ttgctgtaat catgacttac 5880tataatgaga gttacataat actaaaaaag gcagtagaca gtactcttca ggatctggaa 5940agattggaaa agaagaatgt gaaatataaa ttaataattg gagtcgatag gagaaatgaa 6000gatattcctc atattgagag tttatattta aaagaagtta gtgccagaaa tgatgtgtgc 6060gttgtttttt ttaatgagaa cgaagggttg gcggcaagtt taaataaatt aatttttggc 6120gcgtgtaatg gctatgattt tattgccaga atggatgctg atgatattgt tattaacggg 6180cgttttaaaa agcaattaga atatctgaat aagcattctg atgtcagttt agtcggtgga 6240caggctgttg ttattgatga gaacgataat gttgttaggg attattttaa tatgaaccca 6300gtagattttt cgtgggggaa tgaaataatt catccaactt ggttgttaag gtcagagctt 6360tattataaat taggtggtta caggcgttta gatgctgctc aagattatga ttttttgtgt 6420agggctgtat tgagtggatg tattgtaagg aatatagatg acgtggtttt attttatagg 6480ataaggcatg gctcaattgg cagttgtaag aagtttatcc aaataaaaaa caagactatt 6540ttatctaaat ttttcagaaa aaatgaagtt gcacctattc atttatttaa tgcaaccaac 6600ttttcagttg agtttttttt attctctgtc attgaatcaa taaaaatcaa gcacaatatt 6660gtggggaaat gtattgggtg gttgtctcca ctccatgcta aaaattatta tttaaattta 6720agaaaacgaa tggggaaaaa atgagagtac ttgtttttgg ccctatgata tctggtcata 6780ttagtaactg gattcatggt tccaaagaat atattgatta tagaattgtc acactacact 6840atgacaaaag tatttctgag aatgttggaa taggagagat atataagata ccaagactta 6900caaaaactaa atttgatttt atatacgcac ctgtttttct tcttttttat ttttttttat 6960taaagcctga gttggttcat gtccattttt ttagttctta tggtttaatt tcatgtgttt 7020tgcctagaaa agtaaagaag atactctcag tatggggaag tgacattaac aatactataa 7080aaaagagagg gatattagga aaaatatatg taaaagcaat gaaaagtttt tgtgttgtaa 7140attcacccgc caggcatata acaaataaaa taatatcgta tttcaatgtg aatcaggagc 7200gaatacatac ttttcaatat ggtgtagatg tggggttctt ttcagatgaa aaaacgtcaa 7260gcataaggga cgataaatgt ataacaataa cttctgtaag aaattgggat aatatttata 7320acatagagtc ctttttagaa gctgttattg atatgaaaga ttatgattgt aaagggtact 7380tttttaatat caatatacta ggccgctcat cgtcaaagac cacacatgat aagataatag 7440aactcacaaa aaaatgtgag ggagataatt ataaagtaaa tttaataggg tttattcaaa 7500aagaggaatt aaggtcgatt cttcataaat ctgattttgt tcttagtatt cctagcaatg 7560atggtgctcc attatctttg atggagggcg ttttatgtaa ttgttttccg atagtatcag 7620acatcgatgc aaacagagag ctattaggaa atcatgcaat gtatttgaat ctgcatgatg 7680atattgacat gaaatctgtt ttttcaaggt gtgtgaaatt aatagatagt aatcaatata 7740ggtgttcgat tgaatataac cgagatacaa taataaaaat gtttgatata aataaaaaca 7800caaagcgtat ggttgatatt tattatcggg tcgtgtcaca aaaggaattt ttatgaaggt 7860tttttttgat gtatttttgt tgtttttatt tgtgtttgct tttagcatcc ctgttttttt 7920taattcaggc tatcttatat atattttttc cttgatttat ttaattacaa atatcaggat 7980aaggactgtt ttttttagtc taataagtac aagaatattt tttattgcgt ttttgtcttt 8040ggcctgcatg ctcttttttt cttgtatttc attggtatta aatggtacag gagatttatc 8100tatcatgggg gttatcttta ataatttagc tgcattattc agctctgtta taattgcgtc 8160gcatttaatc cagcataaca atgataatgt gttgaaattg ttttttctaa ttgccctctt 8220acaatccttt tttattattc tgatgatgtt ttttcccagt ataaatgctt atattcaaag 8280tattattaga acaaaagaag aaatagaatt tatgagtaat acatatggag gcatcagggg 8340attaggtata tcaggttctg ttgcctttgg tcttgctata attatgtcat tattatcttt 8400tctttcaatt gtttggttta atgaggaaga ctgtaatatt cctttctttt taaaattatt 8460ttttatcata ctcttgctgt tcgcgtcaat ttctgctggg cgtacggctg ttttggggtt 8520tgtcctcgga ggggtatata gttttatttg ctctgattat aaaaagaagt tttatcgggc 8580gcttcaaatt ttgatttatg tatctctgtt tttatttatt ttttggagat tttttttaaa 8640tgaacatgtt tatgatatct tgaaaaaata ttcggattat tcttttcaaa tgttatatta 8700ttatttagat tcaggaaagt tatcaacaac atctacagat gaattattta atatgtattt 8760cccgttaaca gaaaaacaga tcttcattgg ttatgggtac cataccgtta aaggatggga 8820catattatct cgggaccgat gctggattta tgcggttagc attatttttg ggtgcggtac 8880catcggttat tttttatttt ttgtttttta tttttttgac tatttatgct gctaatagca 8940tcaaacctaa aatagttgca ttaatgatta caatactcag tttttctttt cattataaag 9000gcgaggttat atttttgaat gttgcatata tgaaaataat atatatatat atattttcat 9060ctttttatat ttgtcataaa aaaagattaa taagaagggg ttcggttaat gcatgattat 9120tattttaatt gcaggttttt attaacaaac aacagtagaa actcgttaat tgttgacata 9180ttatcttatt ctagatatct gtaaaacaaa ttggtttttg cctttgtttt tatgggtatt 9240taaagactat agggtaatag cgcaacaatt taatttaagt tttttgagaa ctgtaagaat 9300agtgaactac atagatcaca aatctataac tgaaccaggt gataatccca tgaatacaat 9360ctataataaa taatgttttg gattagtaag tgttataaat ttacgtggaa attctatttg 9420cgtgtttatg ttgctatttc atggaatggt tttattgcca ttgctgtagt gttattttga 9480actaatttat ttggtgaaag attactgagt aatcttttga tactaaatcg attgtgtttt 9540atatctttga attaaatatt tttgccaaag cactccttca ctcttatata ttcagatact 9600ccttgtgtta taagagtaag gaatataaat tggaatatgg aaaaaggcgt gacatatttc 9660tgttgtcttt ggttatgtac acgatgggca gagtgtaagt tttcagagat gttgcaattg 9720tctccagata agaaaggaga gattgttatg ttgaaccaac atatcggcgt caggtgtttc 9780gggcattacc gtgcaacaat ctatgcgatg gaatacaatg ccatgcctga tattgcaaaa 9840ttaagaatga aaaccctgca ttttagggaa agacatggaa tcaatgcatc cgcagaaaat 9900ttttgtgtat caatacgcgt ttaatatata ggctcggaag tgcttatctc aagtagtaaa 9960tctttctagt atgtcttaca aaactatgac atccagaaat tttgaaagaa atatgatgaa 10020ttagaatagg acttctcaac cttggaaaag aacagatttt tgaccgtctg aatctgtagt 10080gtgaacagta gcatttggcc tgcccgagcg tctccactat tggaggaatg agctaggcag 10140cacatgataa aatgtggcta atactggtgt aactgggttc ccagacttca agtccaaggt 10200actattagcc cgctaaagac cggtgagctt atattgagct cagaatcggc gttatgttat 10260taccgtgatt gacgaacgca gcaactacgc tttggcggtg gcggtaacgt cgcttaacag 10320tgatgtaatc atgagtttct tctgccatca agctcggttg ttacctgttg gaatcaacca 10380gaatataccc gattatgggg aagagttcct gggaaaattt gacaaaaagc tacaggaagc 10440cgctatcagg caccaatagg cttatctcga tacgccgaaa atgaacacca tctgtgagcg 10500ctttaaccga tcactgagat agccgtttat tgagtttaat gaagaattgc tctttgaaaa 10560tctgaatatg tcaatcataa acaggctcaa tattgcatac tgtacaagaa taaaaggcct 10620cataaattgc tcgaattact gacaccacta gaacataatt tacacgaaaa aaatgcaata 10680tagtgttaga ctcatacaat atgtcgagat gtttagaaaa ataacgtata cttacatatt 10740gtatttttat agtaacattg ggcttaacta ttctaaattt ttattctttc acagtttata 10800ctatttataa tgtgtttata ttcttgtttt atatcctagg cagatagatg aaatataagg 10860agttttatga ctattttggt tactggtggt gcaggttaca ttggttcaca tactgtatta 10920tccttattat catacggaaa aaatgtggtg gtgttggata atctatcgaa ctcatcgtct 10980aagtcgttag aaagggtcga aaaaatttgt ggacgtaggc ctctatttta tcatggtgat 11040gtgcgtgata ggaaaaaact caaacatatt ttccagtatc atgatattac agatgttatt 11100cattttgcag gattaaaagc cgtcgctgaa tctgtttcaa atccattgga atattatgat 11160cacaatgtta acggaactat tgttttactt gaagaaatga tgcgcgctgg cgttattagt 11220tttattttta gctcctccgc aacagtgtat ggtaagcctg aaactattcc tttgaaggaa 11280gatagtagcg ttggcggaac aactaatcca tatggctttt caaaacttat agtagagagg 11340gttttgaagg atatagcttt ggctgagcca acaatgcgta ttactatttt gcgttatttc 11400aatcctgtag gagcccactc ttctggtcta ttaggtgaag atcctaatgg tgttccaaat 11460aatttaatcc cttatattac tcaagtggct attggtaatc taaaatattt atcagtattc 11520ggaaatgatt atcctacacc tgatggaaca ggcattagag attatattca tgttatggat 11580ttggctgaag ggcacatagc tgctttagaa caccgtaatt ttgggggaaa ttataaagta 11640tataatcttg gtacaggggt tggttattca gttcttgatg tgataaatac ctttaaacgt 11700tgtactggaa ttgatatccc ttattgtttc aaacctcgtc gagttggtga tatagctgaa 11760tgttggtctg atccatctct agcattttta gaattagggt ggtcttctcg atatgattta 11820gatacaatga taattgattc ttggcgttgg caaaaaaaca atcccaaagg atataaataa 11880gacgatttta atgtgctatt ttattcactg tcaatatttt tataaaacca tctttgcttt 11940gctttgcttt gctttgcttt gctttgcttt gtagttactc tcttaattaa cggcttttta 12000tattagggtg ggatgttaat gaaatacttg ataaatattt aatatgtgaa atttcttaat 12060aagctaccaa ggatggatat gataaacatg atattatata atgaaactta tgtaagtttg 12120agatgattct atgagtaccg ataaatattt agtttcagtc ataacaccca catataattc 12180tgaaagaacg attagatgta caattgattc tgttctatct caatcatata ataatataga 12240aatgattatt gtcgatgatt gttcgttaga taatacagtg tctatttgca gggaatatca 12300aaaaaaagat tcaagagttg ttctcatttc aaatgagaag aattatgggg ctggtatgtc 12360aagaaatata gcgatcagta aagctaaagg tcggtttatc gcttttttag atagtgatga 12420tttttggcat aaagagaaaa taaaaaaaca gatagacttt atgctttcaa ataattatgc 12480tttcacttat acctcatatc aaaaggttag ttttagcggg aaacttttat cccaaattaa 12540tcctgtttct aaagttaatt attctgaatt attaaagact aatgtaatag gttgcttgac 12600agctgtatat gatacttcat ctcttggtaa aatgtttatg ccaacaatca ggaaaagaca 12660ggacatggca ctatggctga gcattttaga taaaattgat tatgcatatt gtttgaacga 12720aatactggcc tactatcgag taggcaccga tacactctcg tcaaataaat taaaaataat 12780attttcacaa tgggcctttt acagaaaata tttaaagttt ggtctgttta aatctcttta 12840ttatttctcc cactatgctg ttaatgctgt tgccaaacat catataaatc cgctgtgttt 12900gttttttaag cgccactttg cctcttggag ataattcggc aaatcttata aagaaatatt 12960ggataatgct tttgatttgc aaatgtattt ttatatttga tgatgtcatg gatgagtttt 13020aagtgaattt caatagaata gggaaatgtg ggtctgtgtg gacaagaagt gtgattaatg 13080tttttgtatc agattataat ctgcaatcta tttagtaaaa ttatgtttac caagtgcctc 13140tcctgaagaa ttatttttat aaagccttta gttatcattg aaatgaattc tgaggttaat 13200tggtgcgaat gaacttagta ttatgataaa gattgtcttt attttactta aaagtataga 13260atagttcatt gcattatttg tgttgtataa aacttcagag tcaggaacag tcttaagttt 13320tattttttct aaattcattg gtggctatca tatggttatt agatgactgt gttaagatat 13380atttcattgg ctttaaggtt ttagtacata tgacgaatag aaccaatttg aatattctgg 13440aaacaccaac agcctcgttg tttgtcaaaa ttattttgag gttgataatt tgactctcga 13500ttattgtaat ttataaaata taagtgagtt gaaagatata tttgaggcat ggcagttaaa 13560tctcttatat atcgcggaga ctattaataa tagttagtct gagacactgg aaactagagt 13620gtggagagca acgttagttt tgagtatttt ctgtaattaa tttaatataa gtttaattac 13680atatacaatt atctgttgtt tgtcttatgc aatattttcc atatgacata tttttatatg 13740tgtttcaata cgtttattat tctgctaatt aaataggagt gaaaatgtca aaaaaacaga 13800ttggggttat cggtatggcg gtaatggggc gtaatcttgc actaaatatc gaaagtcacg 13860gctatactgt ttcaattttt aaccgttctc gtgaaaaaac agaaaaaatt atagctactc 13920attcggataa gaagttattt ccttactata caataaaaga gtttgttgaa tctctggaaa 13980cgcctcgtcg catcctgtta atggtgaaag caggtgcagg cacggatgct gctattgatt 14040ctctcaagcc atacctcgat aaaggtgaca tcatcattga tggtggtaac accttcttcc 14100gagacaccat tcgtcgtaac cgtgagctgt ctgcagaagg ctttaacttt atcggtagcg 14160gtgtttctgg tggtgaagaa ggtgcgctga aaggaccttc catcatgcca ggtggccaga 14220aagaagccta tgaactggtc gcaccgatcc tgaccaaaat cgccgcagtg gctgaagatg 14280gggagccatg tgttacctat attggtgccg atggcgcagg tcactatgtg aagatggttc 14340acaacggtat tgaatacgga gatatgcagc tgattgctga agcctattct ctgcttaaag 14400gtggcctgaa cctcaccaac gaagaactgg cgcagacctt taccgagtgg aataatggtg 14460aactaagcag ctacctgatc gacatcacca aagacaactt cactaaaaaa gatgaagatg 14520gtaactacct ggttgatgtg attctggatg aagcggctaa caaaggtacc ggtaaatgga 14580ccagccaaag cgcgctagat ctcggtgaac cgctgtcgct cattaccgag tctgtgtttg 14640cacgatacat ctcttctctg aaagagcagc gtgttgccgc gtccaaagta ctgtctggtc 14700cgcaagcgca gccagcaggc gacaaggctg agttcatcga aaaagttcgt cgtgctctgt 14760atctgggcaa aatcgtttct tacgcccagg gcttctctca gttgcgtgct gcgtctgaag 14820agtacaactg ggatctgaac tatggcgaaa tcgcgaagat tttccgtgct ggctgcatta 14880tccgtgcgca gttcctgcag aaaatcaccg atgcttatgc cgaaaatccg cagatcgcta 14940acctgctgct ggctccgtat ttcaagcaaa ttgccgatga ctaccagcag gcgctgcgcg 15000atgtcgtcgc ttatgcggta cagaacggta tcccggttcc gaccttcgcc gctgcggttg 15060cctattatga cagctaccgc gccgctgttc ttcctgcgaa cctaatccag gcccagcgcg 15120acta 15124表1 鮑氏志賀氏菌8型O抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及其中的引物及PCR數(shù)據(jù)
表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號(hào)該組中含有的菌株 來源1 野生型大腸桿菌O1,O2,O3,O4,O10,O16,O18,O39 IMVSa2 野生型大腸桿菌O40,O41,O48,O49,O71,O73,O88,O100 IMVS3 野生型大腸桿菌O102,O109,O119,O120,O121,O125,O126,O137 IMVS4 野生型大腸桿菌O138,O139,O149,O7,O5,O6,O11,O12 IMVS5 野生型大腸桿菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS6 野生型大腸桿菌O23,O24,O25,O26,O27,O28,O29,O30 IMVS7 野生型大腸桿菌O32,O33,O34,O35,O36,O37,O38,O42 IMVS8 野生型大腸桿菌O43,O44,O45,O46,O50,O51,O52,O53 IMVS9 野生型大腸桿菌O54,O55,O56,O57,O58,O59,O60,O61 IMVS10 野生型大腸桿菌O62,O63,O64,O65,O66,O68,O69,O70 IMVS11 野生型大腸桿菌O74,O75,O76,O77,O78,O79,O80,O81 IMVS12 野生型大腸桿菌O82,O83,O84,O85,O86,O87,O89,O90 IMVS13 野生型大腸桿菌O91,O92,O95,O96,O97,O98,O99,O101 IMVS14 野生型大腸桿菌O112,O162,O113,O114,O115,O116,O117,O118 IMVS15 野生型大腸桿菌O123,O165,O166,O167,O168,O169,O170,O171 See b16 野生型大腸桿菌O172,O173,O127,O128,O129,O130,O131,O132, see c17 野生型大腸桿菌O133,O134,O135,O136,O140,O141,O142,O143 IMVS18 野生型大腸桿菌O144,O145,O146,O147,O148,O150,O151,O152 IMVS19 野生型大腸桿菌O153,0154,O155,O156,O157,O158,O159,O164 IMVS20 野生型大腸桿菌O160,O161,O163,O8,O9,O124,O111IMVS21 野生型大腸桿菌O103,O104,O105,O106,O107,O108,O110IMVS22 鮑氏志賀氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14 See d23 鮑氏志賀氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18See d24 痢疾志賀氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8 See d25 痢疾志賀氏菌血清D9,D10,D11,D12,D13See d26 弗氏志賀氏菌F6a,F(xiàn)1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4a,F(xiàn)4b,F(xiàn)5(v7)F5(v4) See d27 宋內(nèi)氏志賀氏菌D5,DR See da. Institude of Medical and Veterinary Science,Anelaide,Australiab. O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc. 172 and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd. 中國預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3是鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu)表 表4是鮑氏志賀氏菌8型的O-抗原基因簇中的基因的位置表attgtggctg cagggatcaa agaaatcctc ctggtaactc atgcgtccaa gaacgcagtc60gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgaacagcg cgtgaagcgt 120caactgctgg cggaagtaca gtccatttgc ccgccgggcg tgaccattat gaacgtgcgt 180cagggcgaac ctttaggttt aggccactcc attttatgtg cacgacctgc tattggtgac 240aacccatttg tcgcggtgct gccagacgtt gttatcgatg acgccagcgc cgacccgctg 300cgctacaacc ttgctgccat gattgcgcgc ttcaacgaaa cgggccgcag ccaagtgctg 360gcaaaacgta tgccgggtga cctctctgaa tactccgtca ttcagaccaa agagccgctg 420gaccgcgaag gtaaagtcag ccgcattgtt gaatttatcg aaaaaccgga tcagccgcag 480acgctggact cagacatcat ggctgtaggg cgttatgtgc tttctgccga tatttggcct 540gaactggagc gtactcaacc tggagcatgg ggacgtattc agttgactga tgccattgct 600gagttggcaa aaaaacaagc agttgacgca atgctgatga ctggggacag ttacgactgc 660ggaaagaaaa tgggttatat gcaagcgttt gtgaagtatg ggctgcgtaa cctgaaggaa 720ggcgctaagt tccgcaaagg cattgagaag ttgttaagcg agtaatgaaa atctgaccgg 780atgtaacggt tgataagaaa attataacgg ctgtgaagat ttgcggcgaa ggtaatttgt 840tgcgaatatt cctgccgttg ttttatataa acaatcagaa taacaaagag ttagcaatag 900gattttcgtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt 960agcgtttgaa tttttcgggt ttagcgcgag tgggtaacgc tcgtcacatc gtaggcatgc 1020atgcagtgct ctggtagctg taaagccagg ggcggtagcg tgcatataag agaaaacatg 1080tggcactgat tttttactaa acaattggcg ataaatattc aataatggag attttcctta 1140acatcaaacg ctattatttt atatattata aatgtccaaa tactcagtat atatacaaaa 1200agagtaagat aaaacttaaa aatttaataa ggtgtctcta tatttctgac tacagacaag 1260catggaaagt ataatatatt gaatattctg tttctgatta cttatgctct caatttgcag 1320aagttagtga agatattcag tatgtggaat agatatatat tttttttgac acaatatgtc 1380gattattctt cacgagatta tattaagaat agaataaaat aaatgtatgg gcttatatac 1440gaattatgaa acataggagc aattctgaaa attatctaag ataagatatt gtgttttctt 1500gagtatgttt aaattcttta aatgttatgc acagaacgta atggagtaaa aattgaataa 1560orf1的起始gttcgtaaaa aaaatgaagc catataaact tgcatcccac gctatatggg agagtgaaaa 1620taaagaaaca atattaaaat tagattggaa cgaatctact attgaaccgc cagaaagagt 1680aaaaaatgca ttaatgaatt cgttggtaaa taatctaatt aggtattatc cagatgtgag 1740caataaagat ttaataataa agatatcaaa ctatgtgggg gtgccaaagg aatatatcca 1800gtatttttgt agttcagact cagcacacga gtctatcatt cgtacattaa ttaatgaaaa 1860tgataaaata ttgatgttag cacctacgta tgataatttc agaacaacag gtgaagctca 1920aggggcaaca atttgttatt caatttttga agataattac tattggtcat taaagaagtt 1980tgaaagcgat ctcaataagt ttcaacctca aatggcctat ttatgtaacc caaataatcc 2040tacaggtact cttattccta aaggagatat acattatctt gtagaaaaat ataaaggaat 2100atattttatt atcgatgaag cctattatga atttgcaaaa ttaacgtgtg ctgattttgt 2160aaactccttt aataacataa ttattacgcg aacattttcc aaagcatttt cattggcagg 2220gatgcgaatg ggatatataa tagcgtcaca agatttgtta ggtgcaataa ataaagtcag 2280aaatgcaaaa aatatacctc agctaagtca gattgccgct ttgaatgcat tagacgaagt 2340tgaatatatg aataattatg ttaaggaagt taatcaggct aagcgttttt tttatgataa 2400gttgaaaaat ataaatatag gtcaaaaaaa tattgtatat ggagagggaa actttttggt 2460tattgagttt aaatcgatga atgataaaaa agcattcatt gaacgtttaa aatctaattt 2520aatatttgtt cgtgatttat ctcatatgaa agaggtcgag ttatgtgtca gaattactat 2580orf2的起始tggaacgaaa aaacaaatgt tgtatgtaat cagaatttta gagcagatgtatgaagttaa 2640orf1的終止aaaagatagc attatttgat ctgtgtgaaa ccttagttga ttttcaaact ggcgatgggt 2700ttatatacta tgtaatagat cgtttgggga tatgtaataa catcaaaata cagactttaa 2760atagggtggc atcttcatta tccattttca aaatcgaaca aataataaat aaaataagat 2820tgggggaaag tttaaggaaa agaattttat tgtatatgtt aaaaaatatt gaaagggata 2880ttcttaatgt aatggctcgt gattacgtta atgaaattat attgcgcaga gttaatcctg 2940ccataattaa gatattgaat aagcatttaa aagatggaga tgaggttatt attatttctg 3000gaggctatga tatttatatt caatatttag ttaaagcatt agagattaat agctttgtat 3060gcacaaaaat taaatttgat aatagaggca ggtgtttagg gagaattagt ggcaagaatt 3120gcatgggata taataaagta ttaatgttaa aaggtgtttt gtcgttagat gtttctgagt 3180atcatataac aacttactct gattctatta gcgatttacc aatattaaaa atgagcaacg 3240ttggggtagt agtatcgaaa ggccaggcaa gagaatgggt aagacagcat aaattatttg 3300orf3的起始,orf2的終止agattctaatatgaatagaa aaaatctttc catgaaattg atgtatatat tgtataatat 3360aaagtattta ttgaaatgct ttgtcgttct gattactcca gatagcttga ttataaaaaa 3420gcagtttctt gaatatcagg gataccctct cggattgaac aatccgaaga cattaaatca 3480aaagttacaa tggttgaaac taaatgacag aacaccatta catacaatat gtgctgataa 3540aattagagtg cgagaatatg tggaaaatag gctgggaacg agagataata taattgattt 3600gttaaaggtt tatgataccc cttttgatat tacctttgag tctttaccac agggtaagtt 3660tgttataaaa tcgaaccact attgtggcga ttattttatt gttagagaca agaatttatt 3720gaatattgat gaggttaagt ggaaatttat tagaacactt aattgtaata tttaccatca 3780cggaagagaa tggcaatata aaaatattga taggcgtata attgttgaaa ggttattaga 3840ggatgaggca gggaaagttc ctaatgatat aaaaattcat tgttttaatg gagaaccgaa 3900atttatttat gtgtcgttag atcgtgaggg agggaattat cgttctatat atgatactag 3960ttggaatatg ttagattttt gctgggcgag aaggggaaaa gatctttcaa aatttaatgt 4020gaagaatatt agtaaaccaa gtcagttaga aaacgctcta aatatatcta aaaaactaag 4080tcaaggtttc aaatatctta gggttgattt atatcttgtt caagaaaaaa tatatgtagg 4140cgaattaaca tttcatcaag gatcggggta tgataagata actccatttg aatgggatga 4200orf4的起始,orf3的終止aaggctcgga aaggagttta agctatgagc atattctcta gaattcaatt aatatggtat 4260aaattatgtt ttatctgtga gtttggagta aaacgttata agcaatccca tatttatggt 4320ccttataaga tagtagaacc atcgaatctt aaattcggta attccttttc aattaatgat 4380tttgtgtata taaatgctag tggaggagtc attttaggcc ataatgtagt actgtctgct 4440ggtagtaaaa ttctcagtac aggtttggta tttgaaaaga aaatctttaa atataaaaaa 4500gataaggtag taataaaaga taatgttcag ttaggtgctg gagcaattgt tttaccggga 4560gtggagatct gtagtaatat tattgttggt gccggagcga tagttacaaa aaacttagag 4620orf5的起始,orf4的終止gaaccaggtg tatatgttgg gcaaccggct agaaaaataa aagatgtctagttttttaag4680aagtattatc tctgtaagtg ctctaaagct agtggattat attgtcccaa taataattat 4740gccgctggtt ttaactagat ttaatttaga gggatatgga gtttattctt atgtgttaac 4800tatatcaact tttatttcat ttatttatga tgcttgtcta aatacagtag gcgtacaaca 4860attaaataag cttaagggta atgaaattgc tcagcagtcg tttgttattt cagcgatttt 4920ctttaagtta gtgttttttt ttgtatgtgc gattgtgttt attataattt cagagactgc 4980agggaagagt gattattttt gtgtcgtaat attctcgttt ggatttggca tgcttaatag 5040ttggtactat atagcaaagg ataactttag gtttataata atagtgtcct tggtagttaa 5100aattttagcg gttttatttg ttttatatta tgcttttgaa ttacacatgt ttatttttat 5160tcaggcgata gcatctgctc tggttggact tattagtttg ataaaaataa agaatgataa 5220taggttggga aaaatatcat ttagacatat taaaaattat ttgaaaaaca ttaagcatat 5280gtacatatat agcggggtaa atgcacttat tcagcctata attaattctg ctatattggc 5340atcaggaaat gctagcttgt tagggatata taacgtcgtt atgcgatttg tggcagtatc 5400cgtaacattt tccaattcaa ttatcactgt cttaaataaa tgtaattcag aggtttttta 5460ttccgtaggg cacaaaacta actatgtgga agtaaaatac agaagtcagc tactcaaatt 5520gttgttttac agcatcgttg tttttatatg tgtggctgca atatcatatg tctctattta 5580tatgacaaag ggagaaatat ctcgtttttt tatttttcta atattttcat ttagcctagc 5640tgttatccca agtatactca atcaatattt aactcaatta attcatatga tacactcatc 5700aaaaaatata gtaaaatatg agatttgttc gaatgtacta tcgttaatat ctattttttt 5760attttcttca ttattcccat attattatat agtatatgct gtagttctat cgccaattat 5820orf6的起始 orf5的終止tattacaatt tgctgtctgt gggatttgaaatgcaaaaacttgctgtaat catgacttac5880tataatgaga gttacataat actaaaaaag gcagtagaca gtactcttca ggatctggaa 5940agattggaaa agaagaatgt gaaatataaa ttaataattg gagtcgatag gagaaatgaa 6000gatattcctc atattgagag tttatattta aaagaagtta gtgccagaaa tgatgtgtgc 6060gttgtttttt ttaatgagaa cgaagggttg gcggcaagtt taaataaatt aatttttggc 6120gcgtgtaatg gctatgattt tattgccaga atggatgctg atgatattgt tattaacggg 6180cgttttaaaa agcaattaga atatctgaat aagcattctg atgtcagttt agtcggtgga 6240caggctgttg ttattgatga gaacgataat gttgttaggg attattttaa tatgaaccca 6300gtagattttt cgtgggggaa tgaaataatt catccaactt ggttgttaag gtcagagctt 6360tattataaat taggtggtta caggcgttta gatgctgctc aagattatga ttttttgtgt 6420agggctgtat tgagtggatg tattgtaagg aatatagatg acgtggtttt attttatagg 6480ataaggcatg gctcaattgg cagttgtaag aagtttatcc aaataaaaaa caagactatt 6540ttatctaaat ttttcagaaa aaatgaagtt gcacctattc atttatttaa tgcaaccaac 6600ttttcagttg agtttttttt attctctgtc attgaatcaa taaaaatcaa gcacaatatt 6660gtggggaaat gtattgggtg gttgtctcca ctccatgcta aaaattatta tttaaattta 6720orf7的起始,orf6的終止agaaaacgaa tggggaaaaaatgagagtac ttgtttttgg ccctatgata tctggtcata 6780ttagtaactg gattcatggt tccaaagaat atattgatta tagaattgtc acactacact 6840atgacaaaag tatttctgag aatgttggaa taggagagat atataagata ccaagactta 6900caaaaactaa atttgatttt atatacgcac ctgtttttct tcttttttat ttttttttat 6960taaagcctga gttggttcat gtccattttt ttagttctta tggtttaatt tcatgtgttt 7020tgcctagaaa agtaaagaag atactctcag tatggggaag tgacattaac aatactataa 7080aaaagagagg gatattagga aaaatatatg taaaagcaat gaaaagtttt tgtgttgtaa 7140attcacccgc caggcatata acaaataaaa taatatcgta tttcaatgtg aatcaggagc 7200gaatacatac ttttcaatat ggtgtagatg tggggttctt ttcagatgaa aaaacgtcaa 7260gcataaggga cgataaatgt ataacaataa cttctgtaag aaattgggat aatatttata 7320acatagagtc ctttttagaa gctgttattg atatgaaaga ttatgattgt aaagggtact 7380tttttaatat caatatacta ggccgctcat cgtcaaagac cacacatgat aagataatag 7440aactcacaaa aaaatgtgag ggagataatt ataaagtaaa tttaataggg tttattcaaa 7500aagaggaatt aaggtcgatt cttcataaat ctgattttgt tcttagtatt cctagcaatg 7560atggtgctcc attatctttg atggagggcg ttttatgtaa ttgttttccg atagtatcag 7620acatcgatgc aaacagagag ctattaggaa atcatgcaat gtatttgaat ctgcatgatg 7680atattgacat gaaatctgtt ttttcaaggt gtgtgaaatt aatagatagt aatcaatata 7740ggtgttcgat tgaatataac cgagatacaa taataaaaat gtttgatata aataaaaaca 7800orf8的起始,orf7的終止caaagcgtat ggttgatatt tattatcggg tcgtgtcaca aaaggaattt ttatgaaggt 7860tttttttgat gtatttttgt tgtttttatt tgtgtttgct tttagcatcc ctgttttttt 7920taattcaggc tatcttatat atattttttc cttgatttat ttaattacaa atatcaggat 7980aaggactgtt ttttttagtc taataagtac aagaatattt tttattgcgt ttttgtcttt 8040ggcctgcatg ctcttttttt cttgtatttc attggtatta aatggtacag gagatttatc 8100tatcatgggg gttatcttta ataatttagc tgcattattc agctctgtta taattgcgtc 8160gcatttaatc cagcataaca atgataatgt gttgaaattg ttttttctaa ttgccctctt 8220acaatccttt tttattattc tgatgatgtt ttttcccagt ataaatgctt atattcaaag 8280tattattaga acaaaagaag aaatagaatt tatgagtaat acatatggag gcatcagggg 8340attaggtata tcaggttctg ttgcctttgg tcttgctata attatgtcat tattatcttt 8400tctttcaatt gtttggttta atgaggaaga ctgtaatatt cctttctttt taaaattatt 8460ttttatcata ctcttgctgt tcgcgtcaat ttctgctggg cgtacggctg ttttggggtt 8520tgtcctcgga ggggtatata gttttatttg ctctgattat aaaaagaagt tttatcgggc 8580gcttcaaatt ttgatttatg tatctctgtt tttatttatt ttttggagat tttttttaaa 8640tgaacatgtt tatgatatct tgaaaaaata ttcggattat tcttttcaaa tgttatatta 8700ttatttagat tcaggaaagt tatcaacaac atctacagat gaattattta atatgtattt 8760cccgttaaca gaaaaacaga tcttcattgg ttatgggtac cataccgtta aaggatggga 8820catattatct cgggaccgat gctggattta tgcggttagc attatttttg ggtgcggtac 8880orf8的終止catcggttat tttttatttt ttgtttttta tttttttgac tatttatgct gctaatagca 8940tcaaacctaa aatagttgca ttaatgatta caatactcag tttttctttt cattataaag 9000gcgaggttat atttttgaat gttgcatata tgaaaataat atatatatat atattttcat 9060ctttttatat ttgtcataaa aaaagattaa taagaagggg ttcggttaat gcatgattat 9120tattttaatt gcaggttttt attaacaaac aacagtagaa actcgttaat tgttgacata 9180ttatcttatt ctagatatct gtaaaacaaa ttggtttttg cctttgtttt tatgggtatt 9240taaagactat agggtaatag cgcaacaatt taatttaagt tttttgagaa ctgtaagaat 9300agtgaactac atagatcaca aatctataac tgaaccaggt gataatccca tgaatacaat 9360ctataataaa taatgttttg gattagtaag tgttataaat ttacgtggaa attctatttg 9420cgtgtttatg ttgctatttc atggaatggt tttattgcca ttgctgtagt gttattttga 9480actaatttat ttggtgaaag attactgagt aatcttttga tactaaatcg attgtgtttt 9540atatctttga attaaatatt tttgccaaag cactccttca ctcttatata ttcagatact 9600ccttgtgtta taagagtaag gaatataaat tggaatatgg aaaaaggcgt gacatatttc 9660tgttgtcttt ggttatgtac acgatgggca gagtgtaagt tttcagagat gttgcaattg 9720tctccagata agaaaggaga gattgttatg ttgaaccaac atatcggcgt caggtgtttc 9780gggcattacc gtgcaacaat ctatgcgatg gaatacaatg ccatgcctga tattgcaaaa 9840ttaagaatga aaaccctgca ttttagggaa agacatggaa tcaatgcatc cgcagaaaat 9900ttttgtgtat caatacgcgt ttaatatata ggctcggaag tgcttatctc aagtagtaaa 9960tctttctagt atgtcttaca aaactatgac atccagaaat tttgaaagaa atatgatgaa 10020ttagaatagg acttctcaac cttggaaaag aacagatttt tgaccgtctg aatctgtagt 10080gtgaacagta gcatttggcc tgcccgagcg tctccactat tggaggaatg agctaggcag 10140cacatgataa aatgtggcta atactggtgt aactgggttc ccagacttca agtccaaggt 10200actattagcc cgctaaagac cggtgagctt atattgagct cagaatcggc gttatgttat 10260taccgtgatt gacgaacgca gcaactacgc tttggcggtg gcggtaacgt cgcttaacag 10320tgatgtaatc atgagtttct tctgccatca agctcggttg ttacctgttg gaatcaacca 10380gaatataccc gattatgggg aagagttcct gggaaaattt gacaaaaagc tacaggaagc 10440cgctatcagg caccaatagg cttatctcga tacgccgaaa atgaacacca tctgtgagcg 10500ctttaaccga tcactgagat agccgtttat tgagtttaat gaagaattgc tctttgaaaa 10560tctgaatatg tcaatcataa acaggctcaa tattgcatac tgtacaagaa taaaaggcct 10620cataaattgc tcgaattact gacaccacta gaacataatt tacacgaaaa aaatgcaata 10680tagtgttaga ctcatacaat atgtcgagat gtttagaaaa ataacgtata cttacatatt 10740gtatttttat agtaacattg ggcttaacta ttctaaattt ttattctttc acagtttata 10800ctatttataa tgtgtttata ttcttgtttt atatcctagg cagatagatg aaatataagg 10860orf9的起始agttttatga ctattttggt tactggtggt gcaggttaca ttggttcaca tactgtatta 10920tccttattat catacggaaa aaatgtggtg gtgttggata atctatcgaa ctcatcgtct 10980aagtcgttag aaagggtcga aaaaatttgt ggacgtaggc ctctatttta tcatggtgat 11040gtgcgtgata ggaaaaaact caaacatatt ttccagtatc atgatattac agatgttatt 11100cattttgcag gattaaaagc cgtcgctgaa tctgtttcaa atccattgga atattatgat 11160cacaatgtta acggaactat tgttttactt gaagaaatga tgcgcgctgg cgttattagt 11220tttattttta gctcctccgc aacagtgtat ggtaagcctg aaactattcc tttgaaggaa 11280gatagtagcg ttggcggaac aactaatcca tatggctttt caaaacttat agtagagagg 11340gttttgaagg atatagcttt ggctgagcca acaatgcgta ttactatttt gcgttatttc 11400aatcctgtag gagcccactc ttctggtcta ttaggtgaag atcctaatgg tgttccaaat 11460aatttaatcc cttatattac tcaagtggct attggtaatc taaaatattt atcagtattc 11520ggaaatgatt atcctacacc tgatggaaca ggcattagag attatattca tgttatggat 11580ttggctgaag ggcacatagc tgctttagaa caccgtaatt ttgggggaaa ttataaagta 11640tataatcttg gtacaggggt tggttattca gttcttgatg tgataaatac ctttaaacgt 11700tgtactggaa ttgatatccc ttattgtttc aaacctcgtc gagttggtga tatagctgaa 11760tgttggtctg atccatctct agcattttta gaattagggt ggtcttctcg atatgattta 11820orf9的終止gatacaatga taattgattc ttggcgttgg caaaaaaaca atcccaaagg atataaataa11880gacgatttta atgtgctatt ttattcactg tcaatatttt tataaaacca tctttgcttt 11940gctttgcttt gctttgcttt gctttgcttt gtagttactc tcttaattaa cggcttttta 12000tattagggtg ggatgttaat gaaatacttg ataaatattt aatatgtgaa atttcttaat 12060aagctaccaa ggatggatat gataaacatg atattatata atgaaactta tgtaagtttg 12120orf10的起始agatgattctatgagtaccg ataaatattt agtttcagtc ataacaccca catataattc 12180tgaaagaacg attagatgta caattgattc tgttctatct caatcatata ataatataga 12240aatgattatt gtcgatgatt gttcgttaga taatacagtg tctatttgca gggaatatca 12300aaaaaaagat tcaagagttg ttctcatttc aaatgagaag aattatgggg ctggtatgtc 12360aagaaatata gcgatcagta aagctaaagg tcggtttatc gcttttttag atagtgatga 12420tttttggcat aaagagaaaa taaaaaaaca gatagacttt atgctttcaa ataattatgc 12480tttcacttat acctcatatc aaaaggttag ttttagcggg aaacttttat cccaaattaa 12540tcctgtttct aaagttaatt attctgaatt attaaagact aatgtaatag gttgcttgac 12600agctgtatat gatacttcat ctcttggtaa aatgtttatg ccaacaatca ggaaaagaca 12660ggacatggca ctatggctga gcattttaga taaaattgat tatgcatatt gtttgaacga 12720aatactggcc tactatcgag taggcaccga tacactctcg tcaaataaat taaaaataat 12780attttcacaa tgggcctttt acagaaaata tttaaagttt ggtctgttta aatctcttta 12840ttatttctcc cactatgctg ttaatgctgt tgccaaacat catataaatc cgctgtgttt 12900orf10的終止gttttttaag cgccactttg cctcttggag ataattcggc aaatcttata aagaaatatt 12960ggataatgct tttgatttgc aaatgtattt ttatatttga tgatgtcatg gatgagtttt 13020aagtgaattt caatagaata gggaaatgtg ggtctgtgtg gacaagaagt gtgattaatg 13080tttttgtatc agattataat ctgcaatcta tttagtaaaa ttatgtttac caagtgcctc 13140tcctgaagaa ttatttttat aaagccttta gttatcattg aaatgaattc tgaggttaat 13200tggtgcgaat gaacttagta ttatgataaa gattgtcttt attttactta aaagtataga 13260atagttcatt gcattatttg tgttgtataa aacttcagag tcaggaacag tcttaagttt 13320tattttttct aaattcattg gtggctatca tatggttatt agatgactgt gttaagatat 13380atttcattgg ctttaaggtt ttagtacata tgacgaatag aaccaatttg aatattctgg 13440aaacaccaac agcctcgttg tttgtcaaaa ttattttgag gttgataatt tgactctcga 13500ttattgtaat ttataaaata taagtgagtt gaaagatata tttgaggcat ggcagttaaa 13560tctcttatat atcgcggaga ctattaataa tagttagtct gagacactgg aaactagagt 13620gtggagagca acgttagttt tgagtatttt ctgtaattaa tttaatataa gtttaattac 13680atatacaatt atctgttgtt tgtcttatgc aatattttcc atatgacata tttttatatg 13740tgtttcaata cgtttattat tctgctaatt aaataggagt gaaaatgtca aaaaaacaga 13800ttggggttat cggtatggcg gtaatggggc gtaatcttgc actaaatatc gaaagtcacg 13860gctatactgt ttcaattttt aaccgttctc gtgaaaaaac agaaaaaatt atagctactc 13920attcggataa gaagttattt ccttactata caataaaaga gtttgttgaa tctctggaaa 13980cgcctcgtcg catcctgtta atggtgaaag caggtgcagg cacggatgct gctattgatt 14040ctctcaagcc atacctcgat aaaggtgaca tcatcattga tggtggtaac accttcttcc 14100gagacaccat tcgtcgtaac cgtgagctgt ctgcagaagg ctttaacttt atcggtagcg 14160gtgtttctgg tggtgaagaa ggtgcgctga aaggaccttc catcatgcca ggtggccaga 14220aagaagccta tgaactggtc gcaccgatcc tgaccaaaat cgccgcagtg gctgaagatg 14280gggagccatg tgttacctat attggtgccg atggcgcagg tcactatgtg aagatggttc 14340acaacggtat tgaatacgga gatatgcagc tgattgctga agcctattct ctgcttaaag 14400gtggcctgaa cctcaccaac gaagaactgg cgcagacctt taccgagtgg aataatggtg 14460aactaagcag ctacctgatc gacatcacca aagacaactt cactaaaaaa gatgaagatg 14520gtaactacct ggttgatgtg attctggatg aagcggctaa caaaggtacc ggtaaatgga 14580ccagccaaag cgcgctagat ctcggtgaac cgctgtcgct cattaccgag tctgtgtttg 14640cacgatacat ctcttctctg aaagagcagc gtgttgccgc gtccaaagta ctgtctggtc 14700cgcaagcgca gccagcaggc gacaaggctg agttcatcga aaaagttcgt cgtgctctgt 14760atctgggcaa aatcgtttct tacgcccagg gcttctctca gttgcgtgct gcgtctgaag 14820agtacaactg ggatctgaac tatggcgaaa tcgcgaagat tttccgtgct ggctgcatta 14880tccgtgcgca gttcctgcag aaaatcaccg atgcttatgc cgaaaatccg cagatcgcta 14940acctgctgct ggctccgtat ttcaagcaaa ttgccgatga ctaccagcag gcgctgcgcg 15000atgtcgtcgc ttatgcggta cagaacggta tcccggttcc gaccttcgcc gctgcggttg 15060cctattatga cagctaccgc gccgctgttc ttcctgcgaa cctaatccag gcccagcgcg 15120acta15124以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其特征在于,它是如SEQ ID NO1所示的分離的核苷酸,全長15124個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其特征在于,它是由10個(gè)基因組成,它們都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其特征在于,所述的基因是轉(zhuǎn)運(yùn)酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf3、orf6、orf7、orf10基因;其中所述的基因orf3是SEQ ID NO1中的3311至4228堿基的核苷酸;wzx是SEQ ID NO1中的4664至5869堿基的核苷酸;orf6是SEQ ID NO1中的5851至6744堿基的核苷酸;orf7是SEQ ID NO1中的6741至7856堿基的核苷酸;wzy是SEQ ID NO1中的7853至8935堿基的核苷酸;orf10是SEQ ID NO1中的12131至12934堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其特征在于它是源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因,即orf3、orf6、orf7、orf10基因;以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸,其特征在于,所述的源于orf3基因的寡核苷酸對(duì)是SEQ IDNO1中的3455至3471堿基的核苷酸和3929至3946堿基的核苷酸;SEQ IDNO1中的3635至3653堿基的核苷酸和4037至4056堿基的核苷酸;SEQ IDNO1中的3740至3759堿基的核苷酸和4201至4220堿基的核苷酸;源于wzx基因的寡核苷酸對(duì)是SEQ ID NO1中的4843至4860堿基的核苷酸和5377至5394堿基的核苷酸;SEQ ID NO1中的4889至4906堿基的核苷酸和5461至5479堿基的核苷酸;SEQ ID NO1中的5391至5408堿基的核苷酸和5830至5847堿基的核苷酸;源于orf6基因的寡核苷酸對(duì)是SEQ ID NO1中的6032至6051堿基的核苷酸和6417至6435堿基的核苷酸;SEQ ID NO1中的6220至6239堿基的核苷酸和6671至6689堿基的核苷酸;SEQ ID NO1中的6087至6106堿基的核苷酸和6671至6689堿基的核苷酸;源于orf7基因的寡核苷酸對(duì)是SEQ ID NO1中的7194至7211堿基的核苷酸和7822至7839堿基的核苷酸;SEQ ID NO1中的6780至6797堿基的核苷酸和7222至7239堿基的核苷酸;SEQ ID NO1中的7010至7028堿基的核苷酸和7592至7626堿基的核苷酸;源于wzy基因的寡核苷酸對(duì)是SEQ ID NO1中的8211至8228堿基的核苷酸和8844至8861堿基的核苷酸;SEQ ID NO1中的7892至7911堿基的核苷酸和8414至8431堿基的核苷酸;SEQ ID NO1中的8038至8056堿基的核苷酸和8565至8582堿基的核苷酸;源于orf10基因的寡核苷酸對(duì)是SEQ ID NO1中的12152至12171堿基的核苷酸和12915至12932堿基的核苷酸;SEQ ID NO1中的12312至12329堿基的核苷酸和12843至12860堿基的核苷酸;SEQ ID NO1中的9934至9952堿基的核苷酸和10513至10530堿基的核苷酸。
6.權(quán)利要求1所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
7.權(quán)利要求1所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的重組分子,而且通過插入表達(dá)可提供表達(dá)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原,并成為細(xì)菌疫苗。
8.按照權(quán)利要求1所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的應(yīng)用,其特征在于它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,檢測人體和環(huán)境中的細(xì)菌。
9.權(quán)利要求1所述的對(duì)鮑氏志賀氏菌8型和大腸桿菌O143的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)志賀氏菌,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分,之后加入3ul20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時(shí),再加入3ul 10mg/ml的RNase,65℃ 30分,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增鮑氏志賀氏菌8型中的O-抗原基因簇鮑氏志賀氏菌8型的O-抗原基因簇通過Long PCR擴(kuò)增,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動(dòng)子區(qū)的JumpStart序列設(shè)計(jì)上游引物(#1523-ATT GTG GCT GCA GGG ATCAAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計(jì)下游引物(#1524-TAGTCG CGT GNG CCT GGA TTA AGT TCG C)。用Boehringer Mannheim公司的ExpandLong Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分;然后94℃變性10秒,60℃退火30秒,68℃延伸15分,這樣進(jìn)行30個(gè)循環(huán)。最后,在68℃繼續(xù)延伸7分,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,分別用等體積的酚和酚∶氯仿∶異戊醇(25∶24∶1)抽提一次,再用等體積的乙醚抽提兩次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5uldNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃ 30分,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分,使DNA的3’端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇抽提和等體積乙醚抽提后與Promega公司的3×10-5的pGEM-T-Easy載體于16℃連接24小時(shí),總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用BiO-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5 a細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5 a混合后,轉(zhuǎn)到Bi0-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時(shí)間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨卞青霉素的LB固體培養(yǎng)基上培養(yǎng),同時(shí)從每個(gè)克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了鮑氏志賀氏8型的0-抗原基因簇文庫;(4)對(duì)文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個(gè)克隆由上海生物工程有限公司用ABI377型DNA自動(dòng)測序儀對(duì)克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率。剩余20%的序列再根據(jù)已得到的序列設(shè)計(jì)引物,該對(duì)引物,如下所示5’-TCGAGTTGGTGATATAGC-3’和5’-TTATTAATAGTCTCCGCG-3’,再從鮑氏志賀氏菌8型的基因組DNA中直接PCR并對(duì)PCR產(chǎn)物測序,從而獲得O-抗原基因簇的所有序列。(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實(shí)驗(yàn)室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到鮑氏志賀氏菌8型的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個(gè)方面來保證1)對(duì)鮑氏志賀氏菌8型的基因組作6個(gè)Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對(duì)每個(gè)堿基,保證3個(gè)以上高質(zhì)量的覆蓋率。在得到鮑氏志賀氏菌8型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到10個(gè)開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對(duì),最后得到鮑氏志賀氏菌8型的O-抗原基因簇的結(jié)構(gòu),如表3所示。(6)特異基因的篩選針對(duì)鮑氏志賀氏菌8型的O-抗原基因簇中的wzx、wzy、orf3、orf6、orf7、orf10基因設(shè)計(jì)引物;在每個(gè)基因內(nèi)各設(shè)計(jì)了三對(duì)引物,每對(duì)引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,所有引物都在大腸桿菌O143中得到陽性結(jié)果,在其他組中都沒有擴(kuò)增到任何大小正確的帶,即在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy、orf3、orf6、orf7、orf10基因?qū)︴U氏志賀氏菌8型和大腸桿菌O143及其O-抗原都是高度特異的。
全文摘要
本發(fā)明提供一種對(duì)鮑氏志賀氏菌8型和大腸桿菌0143的O-抗原特異的核苷酸,它是鮑氏志賀氏菌8型(Shigellaboydii8)中控制O-抗原合成的基因簇的核苷酸全序列,它是如SEQ ID NO1所示的分離的核苷酸,全長15124個(gè)堿基;或者具有一個(gè)或多個(gè)插入、缺失或取代的堿基,同時(shí)保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。還包括源于鮑氏志賀氏菌8型的O-抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因的寡核苷酸。本發(fā)明通過PCR證實(shí)它們對(duì)鮑氏志賀氏菌8型和大腸桿菌0143的O-抗原都有高度的特異性。本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定人體及環(huán)境中的鮑氏志賀氏菌8型和大腸桿菌0143的方法。
文檔編號(hào)G01N33/569GK1439645SQ0310035
公開日2003年9月3日 申請(qǐng)日期2003年1月20日 優(yōu)先權(quán)日2003年1月20日
發(fā)明者王磊, 郭宏杰, 馮露 申請(qǐng)人:南開大學(xué)