專利名稱:一種水稻全基因組snp芯片及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分子生物學(xué)、功能基因組學(xué)、生物信息學(xué)和基因組育種領(lǐng)域,更具體涉及一種水稻全基因組SNP芯片及制備方法,同時(shí)還涉及這種水稻SNP芯片的用途。
背景技術(shù):
分子標(biāo)記(Molecular marker)是指應(yīng)用大分子化合物,蛋白質(zhì)和DNA,在生物個(gè)體間的差異來標(biāo)識(shí)遺傳變異的技術(shù)方法。由于蛋白質(zhì)在個(gè)體間的差異較DNA小,而且難以檢測,因此,大部分分子標(biāo)記是利用DNA水平上的遺傳多態(tài)性,也稱為DNA分子標(biāo)記。分子標(biāo)記技術(shù)(Molecular marker technology)主要是指檢測DNA變異的分子生物學(xué)技術(shù)。分子標(biāo)記技術(shù)在作物研究中主要有以下4個(gè)方面的用途(I)遺傳連鎖圖的構(gòu)建和基因定位;
(2)種質(zhì)資源研究和品種鑒定;(3)生物性狀關(guān)聯(lián)分析和系統(tǒng)進(jìn)化研究;(4)分子育種和作物遺傳改良。隨著分子生物學(xué)、基因組學(xué)和生物信息學(xué)的發(fā)展,分子標(biāo)記技術(shù)也逐漸向低成本、高通量、高精度方向發(fā)展。傳統(tǒng)分子標(biāo)記技術(shù),如RFLP(Restriction Fragment LengthPolymorphism,限制性片段長度多態(tài)性)和SSR(Simple Sequence Repeat,簡單序列重復(fù))技術(shù)在過去的30年里發(fā)揮著重要作用。但是,傳統(tǒng)的分子標(biāo)記技術(shù)存在許多局限性,如通量低、數(shù)量少、操作過程繁瑣,不能滿足功能基因組研究的需求。另外,現(xiàn)代分子育種技術(shù)對分子標(biāo)記的要求越來越高,要求對基因進(jìn)行準(zhǔn)確操作,要求對全基因組遺傳背景進(jìn)行精確控制,要求對特定性狀進(jìn)行精準(zhǔn)改良,迫切需要大規(guī)模高通量的分子標(biāo)記技術(shù)。因此,開發(fā)和利用新型分子標(biāo)記技術(shù),對于功能基因組研究和作物遺傳改良具有重要的理論和實(shí)踐意義。SNP(Single Nucleotide Polymorphism,單核苷酸多態(tài)性),是指在基因組上單個(gè)核苷酸的變異形成的DNA序列上的多態(tài)性。理論上講,基因組DNA上任何一個(gè)核苷酸都有四種可能的堿基組成形式,但大多數(shù)情況下只有兩種堿基的變異,由一個(gè)堿基發(fā)生轉(zhuǎn)換(Transitions)或顛換(Transversion)而變成另一個(gè)堿基,通常轉(zhuǎn)換發(fā)生的頻率要高于顛換,所以SNP標(biāo)記通常為雙等位基因(Vignal等,A review on SNP and other typesof molecular markers and their use in animal genetics. Genet Sel EvoI.2002,34:275-306.)。SNP標(biāo)記數(shù)量多,在基因組上分布廣。基于SNP的新型高通量分子標(biāo)記技術(shù)主要有兩大類一類是基于新一代測序技術(shù)的高通量分子標(biāo)記技術(shù);另一類是基于基 因芯片技術(shù)的分子標(biāo)記技術(shù)?;诘诙鷾y序技術(shù)開發(fā)分子標(biāo)記的方法已經(jīng)在水稻中得到了大量應(yīng)用,如Huang等利用Illumina/Solexa測序技術(shù)對水稻中一個(gè)包含150個(gè)家系的RIL (Recombinant Inbred Line,重組自交系)群體進(jìn)行了全基因組低覆蓋度測序獲得SNP標(biāo)記,對RIL進(jìn)行基因分型和構(gòu)建高密度遺傳連鎖圖(Huang等,High-throughputgenotyping by whoIe-genome resequencing. Genome Res. 2009,19 :1068-1076) ;Xie 等發(fā)明了一種不依賴于親本的RIL群體基因分型方法,利用最簡約重組(Maximum Parsimonyof Recombination, MPR)原則從低覆蓋度測序RIL群體基因組序列信息中獲得SNP標(biāo)記推測親本基因型,大大降低了測序成本(Xie等,Parent-independent genotyping forconstructing an ultrahigh-density linkage map based on population sequencing.Proc Natl Acad Sci USA. 2010,107 :10578-10583) ;Yu 等對基于第二代測序技術(shù)開發(fā)的SNP標(biāo)記構(gòu)建的遺傳連鎖圖與用傳統(tǒng)分子標(biāo)記RFLP/SSR構(gòu)建的連鎖圖進(jìn)行了比較,闡述了基于測序的SNP構(gòu)建遺傳連鎖圖在基因定位中的優(yōu)勢(Yu等,Gains in QTL detectionusing an ultra-high density SNP map based on population sequencing relativeto traditional RFLP/SSR markers. PLoS One. 2011,6 :el7595)。最近,利用第二代測序技術(shù)對大量水稻品種進(jìn)行全基因組測序開發(fā)SNP標(biāo)記,用全基因組關(guān)聯(lián)分析(Genome-WideAssociation Study,GffAS)得到了許多與重要農(nóng)藝性狀相關(guān)的位點(diǎn)(Huang等,Genome-wideassociation studies of 14 agronomic traits in rice landraces. Nat Genet. 2010,42 :961-967 ;Huang 等,Genome-wide association study of flowering time and grainyield traits in a worldwide collection of rice germplasm. Nat Genet. 2011)。但是,該方法也有一些不足,低覆蓋度的測序數(shù)據(jù)不能使標(biāo)記覆蓋每個(gè)個(gè)體,具有測序隨機(jī)性,大多數(shù)個(gè)體SNP位點(diǎn)基因型是通過生物信息學(xué)計(jì)算得到的,不同個(gè)體之間測序的單個(gè)SNP基 因分型數(shù)據(jù)很難進(jìn)行直接比較;而直接進(jìn)行深度測序,即使是像水稻這樣的小基因組,目前測序成本仍然很高,難以滿足大規(guī)模育種需求。利用測序獲得SNP標(biāo)記的另一種做法是對基因組DNA先經(jīng)過酶切等方法處理減小基因組的復(fù)雜性構(gòu)建復(fù)雜性降低的基因組DNA文庫,然后利用第二代測序技術(shù)進(jìn)行深度測序,如RAD (Restriction site Associated DNA,酶切位點(diǎn)關(guān)聯(lián) DNA)標(biāo)簽測序(Baird 等,Rapid SNP discovery and genetic mappingusing sequenced RAD markers. PLoS One. 2008, 3 :e3376)?;诘诙鷾y序技術(shù)的分子標(biāo)記技術(shù)雖然通量高、靈活高效,但是短片段測序依賴于參照基因組序列、位于重復(fù)序列區(qū)域或者在參照基因組上沒有的區(qū)域很難檢測和分析,測序數(shù)據(jù)的處理、序列基因組定位和基因分型的計(jì)算等復(fù)雜過程對數(shù)據(jù)分析的要求較高,需要專業(yè)生物信息學(xué)人員才能完成。這些缺點(diǎn)一定程度上限制了該方法的廣泛使用,特別是在分子育種中大規(guī)模使用。另一種高通量分子標(biāo)記技術(shù)是基于基因芯片的技術(shù)。基因芯片(gene chip)又稱DNA芯片(DNA chip)或DNA陣列(DNA array),指固定在玻片、硅片、尼龍膜等支持介質(zhì)上的核酸分子探針?biāo)鶚?gòu)成的點(diǎn)陣列(array)。基因芯片技術(shù)是20世紀(jì)80年代提出來的,在21世紀(jì)初進(jìn)入飛速發(fā)展時(shí)期?;蛐酒谘邪l(fā)初期主要應(yīng)用于基因表達(dá)譜和調(diào)控網(wǎng)絡(luò)的研究(Birnbaum 等,Agene expression map of the Arabidopsis root.Science. 2003,302 :1956-1960 ;Wang 等,A dynamic gene expression atlas coveringthe entire life cycle of rice. Plant J.2010,61 :752-766 ;ffest 等,Global eQTLmapping reveals the complex genetic architecture of transcript-level variationin Arabidopsis. Genetics. 2007,175 :1441-1450 ;ffang 等,Aglobal analysis of QTLsfor expression variations in rice shoots at the early seedling stage. PlantJ. 2010,63 :1063-1074) 0現(xiàn)在更多地用于基因型分型和功能基因組學(xué)的研究?;诨蛐酒姆肿訕?biāo)記技術(shù)主要有SNP基因芯片(McNally等,Genomewide SNP variationreveals relationships among landraces and modern varieties of rice. Proc NatlAcad Sci USA. 2009,106 :12273-12278)、SFP (Single Feature Polymorphism,單片段多態(tài)性)(Borevitz 等,Large-scale identification of single-feature polymorphismsin complex genomes. Genome Res. 2003,13 :513-523)、DArT 技術(shù)(Diversity ArrayTechnology,多樣性芯片技術(shù))(Jaccoud 等,Diversity arrays a solid statetechnology for sequence information independent genotyping. Nucleic AcidsRes. 2001,29 :E25)、RAD 技術(shù)(Miller 等,RAD marker microarrays enable rapidmapping of zebrafish mutations. Genome Biol. 2007,8 R105 ;Miller 等,Rapid andcost-effective polymorphism identification and genotyping using restrictionsite associated DNA(RAD)markers. Genome Res. 2007,17 :240-248.)等。最初開發(fā)的基因表達(dá)譜芯片就可以應(yīng)用于檢測SFP,,用基因組DNA或RNA與基因表達(dá)譜芯片上的寡居核苷酸探針雜交即可,不需要專門開發(fā)標(biāo)記基因芯片,但是該方法獲得的標(biāo)記檢測結(jié)果假陽性高(Kumar 等,Single feature polymorphism discovery in rice. PLoS One. 2007,2 e284 ;Luo 等,SFP genotyping from affymetrix arrays is robust but largelydetects cis-acting expression regulators. Genetics. 2007,176 :789-800.)。DArT和RAD技術(shù)雖然不依賴于基因組序列,但是構(gòu)建基因組文庫費(fèi)時(shí)費(fèi)力,并且只能達(dá)到中等密度和通量,很難滿足分子育種中大規(guī)模、高密度和高精度要求。RAD芯片技術(shù)后來發(fā)展為利用第二代測序技術(shù)開發(fā)SNP標(biāo)記(Hohenlohe等,Population genomics ofparallel adaptation in threespine stickleback using sequenced RAD tags. PLoS Genet. 2010,6 e 1000862 ;Emerson 等,Resolving postglacial phylogeography usinghigh-throughput sequencing. Proc Natl Acad Sci USA. 2010,107 :16196-16200)。SNP芯片是基因芯片技術(shù)中最適合用于大規(guī)模育種的基因分型技術(shù)。目前,玉米中IllrnninaInfinium MaizeSNP50芯片用于種質(zhì)資源鑒定和關(guān)聯(lián)分析(Ganal等,A large maize (Zeamays L.)SNP genotyping array !development and germplasm genotyping, and geneticmapping to compare with the B73 reference genome. PLoS One. 2011,6 e28334 ;Cook等,Genetic architecture of maize kernel composition in the nested associationmapping and inbred association panels. Plant physiology. 2011),水稻中 AffymetrixGeneChip Rice 44K基因芯片用于水稻種質(zhì)資源遺傳多樣性分型和全基因組關(guān)聯(lián)分析(Zhao 等,Genome-wide association mapping reveals a rich genetic architectureof complex traits in Oryza sativa. Nat Commun. 2011,2 :467),而不同密度的 IlluminaGoldenGate SNP基因芯片已經(jīng)應(yīng)用于水稻分子育種(Zhao等,Genomic diversity andintrogression in 0. sativa reveal the impact of domestication and breeding onthe rice genome. PLoS One. 2010,5 el0780 ;Chen 等,Development and applicationof a set of breeder-friendly SNP markers for genetic analyses and molecularbreeding of rice(Oryza sativa L.). Theor Appl Genet. 2011,123 :869-879 ;Thomson等,High-throughput single nucleotide polymorphism genotyping for breedingapplications in rice using the BeadXpress platform. Mol Breeding. 2011 :1-12)。水稻中GoldenGate SNP芯片雖然很多,但是由于技術(shù)的限制,一張芯片上的標(biāo)記數(shù)一般不超過3000,很難滿足育種中全基因組背景精確控制的需求,迫切需要高通量、重復(fù)性好、技術(shù)成熟的水稻育種芯片。 Illumina公司的Infinium SNP芯片技術(shù)是目前比較成熟和應(yīng)用廣泛的全基因組SNP檢測平臺(tái)。它應(yīng)用激光共聚焦光纖微珠芯片技術(shù)和獨(dú)特的微珠陣列BeadAiray技術(shù)生產(chǎn)的芯片可以承載巨大的微珠——SNP數(shù)目。目前該公司生產(chǎn)的人類SNP芯片最多可容納110萬個(gè)SNP標(biāo)記(http://www. illumina. com)。在芯片制作時(shí),每個(gè)包含50個(gè)脫氧核苷酸的SNP探針序列與特定的微珠耦聯(lián),微珠種類根據(jù)承載的SNP數(shù)目決定,從幾千至百萬以上,每類微珠由其特定的地址序列和SNP探針序列進(jìn)行編碼和檢測。每種類型的微珠在每張芯片上平均重復(fù)30次,從而保證每個(gè)SNP被檢測的成功率和可重復(fù)性。IlluminaInfinium SNP芯片在人類、小鼠、玉米等物種的基因組變異研究中已得到廣泛應(yīng)用,但在水稻中還沒有這類芯片的報(bào)道。為了使水稻功能基因組研究成果得到利用,不斷滿足水稻大規(guī)模商業(yè)化育種需求,申請人設(shè)計(jì)制作了這款SNP基因芯片。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供了一種水稻全基因組SNP芯片,命名為RICE6K水稻SNP芯片。該芯片上的SNP位點(diǎn)包括兩類,一類是從水稻品種測序數(shù)據(jù)中篩選出的多態(tài)性好并且具有代表性的SNP位點(diǎn)設(shè)計(jì)探針(本文稱為第一類探針),另一種是根據(jù)文獻(xiàn)報(bào)道的已克隆的水稻重要功能基因的與功能相關(guān)的SNP/INDEL位點(diǎn)設(shè)計(jì)的探針(本文稱為第二類探針)。其中,第一類探針包含從核心親本基因組序列及520個(gè)水稻品種重測序數(shù)據(jù)比較分析中篩選出的5,556個(gè)SNP位點(diǎn),第二類探針包含與40個(gè)水稻功能基因的功能位點(diǎn)相關(guān)的80個(gè)SNP/INDEL位點(diǎn),總共檢測5,636個(gè)SNP/INDEL位點(diǎn)。RICE6K水稻SNP芯片是采用IlluminaInfinium專利制造技術(shù)(美國專利,US Patent#US6, 429, 027)制作的光纖微珠芯片,每張芯片可同時(shí)檢測24個(gè)樣品。本發(fā)明的另一個(gè)目的是提供了一種水稻全基因組SNP芯片及制備方法,用于本發(fā)明的水稻SNP檢測芯片的特異性探針。本發(fā)明獲得的5,636個(gè)SNP/INDEL位點(diǎn)具有SEQIDNo. 0001 SEQ ID No. 5636所示的DNA序列和特征。本發(fā)明所說的RICE6K水稻全基因組SNP芯片是指根據(jù)這5,636條序列利用Infinium專利設(shè)計(jì)制造技術(shù)(美國專利,USPatent#US 6,429,027)制作的芯片。本發(fā)明所說的RICE6K水稻全基因組SNP芯片上的SNP/INDEL位點(diǎn)是指SEQ ID No. 0001 SEQ ID No. 5636所示的序列中方括號(hào)([])中的核苷酸。本發(fā)明的再一個(gè)目的在于提供了一種水稻全基因組SNP芯片在檢測水稻DNA樣品(水稻種質(zhì)資源分子標(biāo)記指紋分析、秈稻和粳稻雜交群體基因型、育種材料的遺傳背景、水稻種子)中的應(yīng)用,由于該芯片設(shè)計(jì)時(shí)傾向于挑選在秈稻和粳稻兩個(gè)亞種間具有多態(tài)性的SNP位點(diǎn),所以優(yōu)選檢測秈稻和粳稻兩個(gè)亞種間的雜交群體,同時(shí)還適用于檢測秈稻或粳稻亞種內(nèi)的雜交群體。該芯片可以對水稻品種資源進(jìn)行分子標(biāo)記指紋分析、對雜交群體后代進(jìn)行基因型鑒定、對具體材料的重要功能基因進(jìn)行鑒定和表型預(yù)測。一種水稻全基因組SNP芯片的制備方法,包括以下步驟URICE6K SNP芯片上的第一類探針的獲得申請人:利用Illumina新一代測序技術(shù)對水稻核心親本材料進(jìn)行了基因組測序。另外,2010年年底,Huang等公布了 520個(gè)水稻地方品種的基因組重測序數(shù)據(jù)(Huang等,Genome-wide association studies of 14 agronomic traits in rice landraces. NatGenet. 2010,42 :961-967)。申請人從公共數(shù)據(jù)庫下載了此數(shù)據(jù),并以日本晴基因組(MSU第 6. I 版,http:"rice. plantbioloRY. msu. edu/)為參考序列,使用 MAQ 軟件(http://sourceforRe. net/pro iects/maq)將這些基因組序列數(shù)據(jù)進(jìn)行匹配分析。探針設(shè)計(jì)的具體步驟如下(I)先按照下述標(biāo)準(zhǔn)鑒定得到了 4,236,029個(gè)高質(zhì)量SNP 僅當(dāng)測序序列在基因組上的匹配分?jǐn)?shù)(mapping quality)至少為20時(shí),該序列才用于鑒定SNP ; 計(jì)算基因組上每位點(diǎn)不同堿基的測序質(zhì)量分?jǐn)?shù)(base quality)的總和,SNP位點(diǎn)必須只有兩種堿基的測序質(zhì)量分?jǐn)?shù)總和大于100,并且這兩種堿基每種都有至少10條測序序列支持;SNP位點(diǎn)的兩種堿基每種至少有5條匹配分?jǐn)?shù)超過40的序列支持,并且對應(yīng)的堿基測序質(zhì)量都超過20 ;該SNP位點(diǎn)總的測序覆蓋度大于或等于50并小于或等于1000。(2)進(jìn)一步使用更嚴(yán)格的標(biāo)準(zhǔn)獲得1,559,745個(gè)候選SNP 除去在至少5個(gè)品種中呈現(xiàn)雜合狀態(tài)的SNP位點(diǎn);
除去測序覆蓋度小于80或大于800的SNP位點(diǎn); 將所有品種分為秈稻和粳稻,并計(jì)算SNP的次要等位基因在這兩個(gè)亞種中的頻率,除去在所有品種、秈粳亞種中次要等位基因頻率均小于0. 2的SNP ; 除去仍然與左右兩側(cè)SNP距離均小于50bp的SNP。(3)由于探針長度為50bp,設(shè)計(jì)時(shí)需要選擇較保守序列,以免影響雜交。為了獲得合適的探針,申請人還做了以下分析 分別提取SNP左側(cè)和右側(cè)50bp序列(如果50bp內(nèi)含有其他SNP,則不提取),使用 BLAT 程序(Kent 等,BLAT-the BLAST-Iike alignment tool. Genome Res. 2002,12 656-664.)比對基因組。如果兩側(cè)序列在基因組上均存在兩個(gè)或以上同一性(identity)超過85%的匹配,則去除該SNP ; 分別提取秈稻品種珍汕97和明恢63(見遺傳資源表I)對應(yīng)的SNP左側(cè)和右側(cè)50bp序列,并與粳稻日本晴參照序列(MSU第6. I版,http://rice. plantbioloRY. msu.edu/)相比較,如果兩側(cè)序列均不一致,去除該SNP。通過上述分析,申請人獲得了 105,5959個(gè)符合探針設(shè)計(jì)要求的SNP,其中有35. 5%的SNP基本已在秈粳亞種中固定(秈粳亞種內(nèi)占主要地位的等位基因類型不同,并分別占據(jù)90%以上的比例),42. I %的SNP在秈稻亞種中具有多態(tài)性,而16. 9%的SNP在粳稻亞種中具有多態(tài)性。申請人:進(jìn)一步分析了 SNP之間的連鎖不平衡。將染色體分為每IOOkb—個(gè)區(qū)段,計(jì)算區(qū)段內(nèi)所有SNP兩兩之間的r2(r為皮爾森相關(guān)系數(shù),Pearson correlationcoefficient)。經(jīng)過嘗試,申請人以r2 = 0. 64作為閾值,利用一種貪婪算法(Carlson等,Selecting a maximally informative set of single-nucleotide polymorphismsfor association analyses using linkage disequilibrium. Am J Hum Genet. 2004,74 106-120.),將相互間r2彡0. 64的SNP分為一組,一共獲得86,075組SNP。由于組內(nèi)的SNP高度連鎖不平衡,只需要取一個(gè)代表性的SNP即可提供同組SNP的大部分信息。每組選擇最多 3 個(gè) SNP,共獲得 187,284 個(gè)“標(biāo)簽 SNP(tag SNP) ”。這些 SNP 由 Illumina 公司(http://www. illumina. com/)進(jìn)行打分,去除Score分值小于0. 6的SNP,共獲得115,740可供定制芯片的SNP。由于該芯片設(shè)計(jì)主要針對秈稻和粳稻兩個(gè)亞種間雜交群體的鑒定及分型,因此申請人根據(jù)SNP在秈粳亞種中的分布情況,將染色體分為IOOkb —個(gè)區(qū)間,每個(gè)區(qū)間優(yōu)先選擇秈粳兩個(gè)亞種間基本固定的SNP,如果不夠兩個(gè),則選擇其他類型的SNP。由于Infinium技術(shù)的原因,A/T、G/C變化的SNP需要使用兩個(gè)探針檢測(Infinium I),而其他類型的SNP只需要一個(gè)探針(Infinium II)。為了在芯片上放置盡可能多的SNP,申請人定義了一套打分系統(tǒng)。根據(jù)經(jīng)驗(yàn)嘗試的結(jié)果,定義:總分S = MAF*100+ (非A/T、G/C變化的SNP) *3. 5 (其中MAF為Minor allele frequency,最小等位基因頻率)。去除總分S小于33的SNP,最后共獲得5,556個(gè)SNP位點(diǎn)。2、RICE6K SNP芯片上的第二類探針的獲得到2010年年底,水稻中已經(jīng)成功克隆了 600多個(gè)基因,其中大量基因控制重要農(nóng)藝性狀如產(chǎn)量、品質(zhì)、抗生物和非生物脅迫、營養(yǎng)利用效率等,這些基因具有很大的育種潛力(Jiang Rice functional genomics research Progress and implications forcrop genetic improvement. Biotechnol Adv. 2011)。申請人希望能夠一次性對部分功能基因進(jìn)行鑒定,于是設(shè)計(jì)了基因功能性SNP/INDEL探針。具體步驟如下
首先,查詢大量文獻(xiàn)從公共數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov)中獲得功能基因的不同等位基因形式,特別是在水稻品種間能夠反映基因功能的序列差異。如果不同等位基因之間的功能性差異為單堿基的差異(SNP)并且單側(cè)有50個(gè)堿基是相同的,那么直接用這50個(gè)堿基的保守序列作為候選探針位點(diǎn);如果功能性位點(diǎn)是插入或缺失(INDEL)的差異,則使用兩種方法設(shè)計(jì)探針,一種是將INDEL轉(zhuǎn)換為SNP檢測,即根據(jù)INDEL單側(cè)保守序列設(shè)計(jì)探針,插入序列的第一個(gè)堿基和缺失序列的下一個(gè)堿基差異作為待測SNP(共顯性標(biāo)記),另一種方法是探針直接設(shè)計(jì)在INDEL序列上,使得插入的等位基因能夠雜交檢測到信號(hào),而缺失的等位基因雜交不上只有極低的檢測信號(hào)(顯性標(biāo)記)。用這種方法共設(shè)計(jì)了 80個(gè)SNP/INDEL候選探針位點(diǎn),可檢測40個(gè)水稻功能基因。以上兩種方法獲得的候選探針序列位點(diǎn)共5,636個(gè),按照Illumina InfiniumiSelectHD要求設(shè)計(jì)探針制作芯片。兩種方法獲得的探針序列位點(diǎn)特征沒有明顯差異,在芯片制作過程中不加以區(qū)分,芯片制成之后兩類探針的芯片檢測實(shí)驗(yàn)操作也完全相同,視為同一套探針組。第一批芯片制作得到符合檢測要求的有效位點(diǎn)數(shù)5,102個(gè),包含30多個(gè)基因的68個(gè)功能性位點(diǎn)。以下實(shí)驗(yàn)檢測結(jié)果均指第一批芯片的檢測結(jié)果。一種RICE6K水稻SNP芯片在檢測水稻DNA樣品中的應(yīng)用,包括下列步驟I.水稻基因組DNA提取根據(jù)檢測需要從水稻種子、葉片等組織抽提基因組DNA。其中水稻幼嫩葉片DNA抽提推薦采用Promega植物基因組抽提試劑盒按照標(biāo)準(zhǔn)流程抽提。2. DNA樣品質(zhì)量檢測用質(zhì)量分?jǐn)?shù)為I %的瓊脂糖凝膠電泳檢測,用凝膠成像系統(tǒng)判斷電泳結(jié)果,保證基因組DNA完整性好,且該基因組DNA片段長度大于IOkb ;用紫外分光光度計(jì)測量基因組DNA中蛋白質(zhì)和有機(jī)物質(zhì)污染水平,基因組DNAA260/280比值應(yīng)在I. 8-2. 0之間,A260/230比值應(yīng)在I. 8-2. 2之間。將DNA濃度稀釋到工作濃度50ng/ul。3.基因芯片檢測按照11 lumina Infinium基因芯片檢測標(biāo)準(zhǔn)流程操作(Infinium HD Assay Ultra Protocol Guide, http://www.illumina.com/)。芯片掃描使用Illumina HiScan芯片掃描儀。4.數(shù)據(jù)分析Illumina HiScan掃描結(jié)果用GenomeStudio軟件分析基因型。本發(fā)明與其他分子標(biāo)記技術(shù)相比,具有以下優(yōu)點(diǎn)和效果I)通量高。芯片上包含5000多個(gè)SNP位點(diǎn),按照Illumina Inf inium檢測標(biāo)準(zhǔn)流程3天就可以得到一個(gè)樣本的分布于全基因組的約4500個(gè)位點(diǎn)的基因型,I張芯片可以同時(shí)檢測24個(gè)樣品,一個(gè)流程可以做8張芯片,即3天可以得到192個(gè)樣品共86. 4萬個(gè)數(shù)據(jù)點(diǎn)(4500*24*8);2)重復(fù)性好。不同批次檢測同一份樣品技術(shù)重復(fù)達(dá)到99. 9%以上,其重復(fù)性和準(zhǔn)確性比同類芯片技術(shù)好;3)適用性廣。由于大多數(shù)SNP位點(diǎn)是來自于520多個(gè)水稻品種的測序數(shù)據(jù),這些SNP位點(diǎn)具有廣泛的代表性。根據(jù)申請人對100多份水稻種質(zhì)資源初步檢測結(jié)果,秈稻之間、粳稻之間、秈稻和粳稻之間能夠檢測到的多態(tài)性SNP位點(diǎn)平均分別約為800、1000和2600個(gè),可廣泛適用于不同類型的水稻品種特別是秈稻和粳稻兩個(gè)亞種間雜交群體的基因分型;4)基因功能預(yù)測。芯片中包含已克隆的40個(gè)水稻重要功能基因的80個(gè)功能性SNP/INDEL位點(diǎn),檢測這些位點(diǎn)就知道材料中這些基因的功能,根據(jù)基因功能推測其表型,普通分子標(biāo)記技術(shù)僅針對個(gè)別基因開發(fā)功能性標(biāo)記。
圖I.為一種基因功能性SNP/INDEL探針設(shè)計(jì)例子的示意圖。圖中顯示的是水稻中的“綠色革命基因” Sd-I兩種等位基因一高桿基因型(Nipponbare,日本晴)與DGWG(Dee-geo_woo-gee,矮源低腳烏尖)類半矮桿基因型(Milyang 23,密陽23)的序列比對。相對于野生型Sd_l,DGWG類突變型sd_l從第一個(gè)外顯子中部起有383 bp的缺失,包括外顯子I和2的278 bp序列及105 bp的內(nèi)含子(Monna等,Positional cloning of rice semidwarfing gene, sd_l rice “green revolutiongene,,encodes a mutant enzyme involved in gibberellin synthesis. DNA Res. 2002,9 :11-17.)。針對這383bp的INDEL申請人設(shè)計(jì)了 3條探針探針I(yè)DOlgOOSDl. I和IDOlgOOSDl. 2為INDEL探針,探針序列位于INDEL內(nèi)部,野生型基因組DNA與探針雜交分別延伸一個(gè)堿基A和C而檢測到高信號(hào),DGWG類突變型由于缺失探針對應(yīng)的基因組序列不能與探針雜交而只有極低的信號(hào);0s01g66100. I為SNP探針,探針序列位于INDEL邊界,邊界正好有個(gè)SNP的差異(T/A),可以作為普通SNP探針檢測,檢測該位點(diǎn)為T則為野生型,A為突變型。方框表示Sd-I基因起始密碼子ATG,箭頭表示探針序列所在位置和方向,三角型指不的喊基為探針與基因組DNA雜交后延伸的喊基。圖2.為一種Sd-I基因功能性SNP和INDEL探針檢測效果示意圖。水稻株高基因Sd-I功能性SNP/INDEL探針設(shè)計(jì)見圖I.該圖顯示71個(gè)水稻DNA樣品的檢測結(jié)果。SNP探針0s01g66100. I檢測結(jié)果表明,26個(gè)樣品為野生型(AA基因型),21個(gè)為DGWG (Dee-geo-woo-gee,矮源低腳烏尖)類(BB基因型),另外21個(gè)為雜合(AB基因型);INDEL探針I(yè)DOlgOOSDl. I檢測結(jié)果表明50個(gè)樣品的Sd-I基因至少有一個(gè)等位基因383 bp沒有缺失,與野生型一致,其他的樣品與DGWG類一致。圖3.為一種RICE6K水稻SNP芯片上所有探針位點(diǎn)在全基因組上分布示意圖。參照基因組為日本晴(水稻基因組MSU注釋第6. I版),染色體上的每一條短線表示I個(gè)SNP位點(diǎn),三角形指示著絲粒的位置。圖4.為一種秈稻之間、粳稻之間以及秈稻和粳稻之間多態(tài)性SNP頻率分布示意圖。RICE6K SNP芯片檢測106份水稻種質(zhì)資源(18個(gè)粳稻,88個(gè)秈稻)后兩兩之間的比較。4a為秈稻(indica)之間,4b為粳稻(japonica)之間,4c為秈稻和粳稻兩個(gè)亞種之間。圖5.為一種RICE6K水稻SNP芯片對秈稻和粳稻雜交得到的一個(gè)F2植株檢測的
結(jié)果示意圖。粳稻巴里拉(Balilla)和秈稻南京11 (Nanjing 11)雜交F2植株全基因基因型。AA為巴里拉純合基因型,BB為南京11純合基因型,AB為雜合基因型,圓點(diǎn)表示著絲粒位置。圖6.為一種回交育種定向改良材料的背景分析示意圖。
該圖顯示B親本供體基因?qū)階親本回交BC4F1的兩個(gè)家系基因型。染色體上的短線表示含有供體親本基因型,即為雜合基因型AB,圓點(diǎn)表示目標(biāo)基因所在的位置,三角形指示著絲粒位置。圖7.為秈稻品種93-11與其衍生系安選6號(hào)之間差異位點(diǎn)分布示意圖。第8染色體上每條黑色短線代表一個(gè)差異SNP位置。三角形指示著絲粒位置。
具體實(shí)施例方式實(shí)施例I :RICE6K SNP芯片制備方法URICE6K SNP芯片上的第一類探針的獲得申請人:利用Illumina新一代測序技術(shù)對水稻核心親本材料進(jìn)行了基因組測序。另外,2010年年底,Huang等公布了 520個(gè)水稻地方品種的基因組重測序數(shù)據(jù)(Huang等,Genome-wide association studies of 14 agronomic traits in rice landraces. NatGenet. 2010,42 :961-967)。申請人從公共數(shù)據(jù)庫下載了此數(shù)據(jù),并以日本晴基因組(MSU第 6. I 版,http:"rice. plantbioloRY. msu. edu/)為參考序列,使用 MAQ 軟件(http://sourceforRe. net/pro iects/maq)將所有品種重測序數(shù)據(jù)匹配到參考序列。探針設(shè)計(jì)的具體步驟如下(2)先按照下述標(biāo)準(zhǔn)鑒定得到了 4,236,029個(gè)高質(zhì)量SNP 僅當(dāng)測序序列在基因組上的匹配分?jǐn)?shù)(mapping quality)至少為20時(shí),該序列才用于鑒定SNP ; 計(jì)算基因組上每位點(diǎn)不同堿基的測序質(zhì)量分?jǐn)?shù)(base quality)的總和,SNP位點(diǎn)必須只有兩種堿基的測序質(zhì)量分?jǐn)?shù)總和大于100,并且這兩種堿基每種都有至少10條測序序列支持;SNP位點(diǎn)的兩種堿基每種至少有5條匹配分?jǐn)?shù)超過40的序列支持,并且對應(yīng)的堿基測序質(zhì)量都超過20 ;該SNP位點(diǎn)總的測序覆蓋度大于或等于50并小于或等于1000。。(2)進(jìn)一步使用更嚴(yán)格的標(biāo)準(zhǔn)獲得1,559,745個(gè)候選SNP 除去在至少5個(gè)品種中呈現(xiàn)雜合狀態(tài)的SNP位點(diǎn); 除去測序覆蓋度小于80或大于800的SNP位點(diǎn); 將所有品種分為秈稻和粳稻,并計(jì)算SNP的次要等位基因在這兩個(gè)亞種中的頻率,除去在所有品種、秈粳亞種中次要等位基因頻率均小于0. 2的SNP ; 除去通過上一步后仍然與左右兩側(cè)SNP距離均小于50bp的SNP。
(3)由于探針長度為50bp,設(shè)計(jì)時(shí)需要選擇較保守序列,以免影響雜交。為了獲得合適的探針,申請人還做了以下分析 分別提取SNP左側(cè)和右側(cè)50bp序列(如果50bp內(nèi)含有其他SNP,則不提取),使用 BLAT 程序(Kent 等,BLAT-the BLAST-Iike alignment tool. Genome Res. 2002,12 656-664.)比對基因組。如果兩側(cè)序列在基因組上均存在兩個(gè)或以上同一性(identity)超過85%的匹配,則去除該SNP ; 分別提取秈稻品種珍汕97和明恢63 (見遺傳資源表I)對應(yīng)的SNP左側(cè)和右側(cè)50 bp序列,并與粳稻日本晴參照序列(MSU第6. I版,http://rice, plantbiology. msu.edu/)相比較,如果兩側(cè)序列均不一致,去除該SNP。通過上述分析,申請人獲得了 105,5959個(gè)符合探針設(shè)計(jì)要求的SNP,其中有35. 5%的SNP基本已在秈粳亞種中固定(秈粳亞種內(nèi)占主要地位的等位基因類型不同,并占據(jù)90 %以上的比例),42. I %的SNP在秈稻亞種中具有多態(tài)性,而16. 9 %的SNP在粳稻亞種中具有多態(tài)性。 申請人:進(jìn)一步分析了 SNP之間的連鎖不平衡。將染色體分為每IOOkb—個(gè)區(qū)段,計(jì)算區(qū)段內(nèi)所有SNP兩兩之間的r2(r為皮爾森相關(guān)系數(shù),Pearson correlationcoefficient)。經(jīng)過嘗試,申請人以r2 = 0. 64作為閾值,利用一種貪婪算法(Carlson等,Selecting a maximally informative set of single-nucleotide polymorphismsfor association analyses using linkage disequilibrium. Am J Hum Genet. 2004,74 106-120.),將相互間r2彡0. 64的SNP分為一組,一共獲得86,075組SNP。由于組內(nèi)的SNP高度連鎖不平衡,只需要取一個(gè)代表性的SNP即可提供同組SNP的大部分信息。每組選擇最多 3個(gè)SNP,共獲得 187,284 個(gè)“標(biāo)簽 SNP (tag SNP)”。這些 SNP 由 Illumina 公司(http://www. illumina. com/)進(jìn)行打分,去除Score分值小于0. 6的SNP,共獲得115,740可供定制芯片的SNP。由于該芯片設(shè)計(jì)的主要針對秈稻和粳稻兩個(gè)亞種間雜交群體的鑒定及分型,因此申請人根據(jù)SNP在秈粳亞種中的分布情況,將染色體分為IOOkb —個(gè)區(qū)間,每個(gè)區(qū)間優(yōu)先選擇兩個(gè)秈粳亞種間基本固定的SNP,如果不夠兩個(gè),貝U選擇其他類型的SNP。由于Infinium技術(shù)的原因,A/T、G/C變化的SNP需要使用兩個(gè)探針檢測(Infinium I),而其他類型的SNP只需要一個(gè)探針(Infinium II)。為了在芯片上放置盡可能多的SNP,申請人定義了一套打分系統(tǒng)。根據(jù)經(jīng)驗(yàn)嘗試的結(jié)果,定義:總分S = MAF*100+ (非A/T、G/C變化的SNP) *3. 5 (其中MAF為Minor allele frequency,最小等位基因頻率)。去除總分S小于33的SNP,最后共獲得5,556個(gè)SNP位點(diǎn)。2、RICE6K SNP芯片上的第二類探針的獲得到2010年年底,水稻中已經(jīng)成功克隆了 600多個(gè)基因,其中大量基因控制重要農(nóng)藝性狀如產(chǎn)量、品質(zhì)、抗生物和非生物脅迫、營養(yǎng)利用效率等,這些基因具有很大的育種潛力(Jiang Rice functional genomics research Progress and implications forcrop genetic improvement. Biotechnol Adv. 2011)。申請人希望能夠一次性對部分功能基因進(jìn)行鑒定,于是設(shè)計(jì)了基因功能性SNP/INDEL探針。具體步驟如下首先,查詢大量文獻(xiàn)從公共數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov)中獲得功能基因的不同等位基因形式,特別是在水稻品種間能夠反映基因功能的序列差異。如果不同等位基因之間的功能性差異為單堿基的差異(SNP)并且單側(cè)有50個(gè)堿基是相同的,那么直接用這50個(gè)堿基的保守序列作為候選探針位點(diǎn);如果功能性位點(diǎn)是插入或缺失(INDEL)的差異,則使用兩種方法設(shè)計(jì)探針,一種是將INDEL轉(zhuǎn)換為SNP檢測,即根據(jù)INDEL單側(cè)保守序列設(shè)計(jì)探針,插入序列的第一個(gè)堿基和缺失序列的下一個(gè)堿基差異作為待測SNP(共顯性標(biāo)記),另一種方法是探針直接設(shè)計(jì)在INDEL序列上,使得插入的等位基因能夠雜交檢測到信號(hào),而缺失的等位基因雜交不上只有極低的檢測信號(hào)(顯性標(biāo)記)(圖I和圖2)。用這種方法共設(shè)計(jì)了 80個(gè)SNP/INDEL候選探針位點(diǎn),可檢測40個(gè)水稻功能基因。以上兩種方法獲得的候選探針序列位點(diǎn)共5,636個(gè),按照Illumina InfiniumiSelectHD要求設(shè)計(jì)探針制作芯片。第一批芯片制作得到符合檢測要求的有效SNP/INDEL位點(diǎn)為5,102個(gè),這些位點(diǎn)在全基因組上的分布如圖3所示。實(shí)施例2 RICE6K水稻SNP芯片在檢測水稻DNA樣品中的應(yīng)用
I.水稻基因組DNA提取根據(jù)檢測需要從水稻種子、葉片等組織抽提基因組DNA。其中水稻幼嫩葉片DNA抽提采用Promega植物基因組抽提試劑盒按照標(biāo)準(zhǔn)流程抽提(Wizard Magnetic 96 DNA Plant System Kit,貨號(hào) FF3760 或 FF3761,美國 Promega 公司)。2. DNA樣品質(zhì)量檢測用質(zhì)量分?jǐn)?shù)為I % (W/W)的瓊脂糖凝膠電泳檢測,用凝膠成像系統(tǒng)(Gel Doc XR System,美國Bio-Rad公司)判斷電泳結(jié)果,保證基因組DNA完整性好,且該基因組DNA片段長度大于IOkb ;用紫外分光光度計(jì)(NanoDrop2000,美國ThermoScientific公司)測量基因組DNA中蛋白質(zhì)和有機(jī)物質(zhì)污染水平,基因組DNA A260/280比值應(yīng)在I. 8-2. 0之間,A260/230比值應(yīng)在I. 8-2. 2之間。將DNA濃度稀釋到工作濃度50ng/
ul O3.基因芯片檢測按照11 lumina Inf inium基因芯片檢測標(biāo)準(zhǔn)流程操作(Infinium HD Assay Ultra Protocol Guide, http://www.illumina.com/)。芯片掃描使用 Illumina HiScan 芯片掃描儀(HiScan,美國 Illumina 公司)。4.數(shù)據(jù)分析Illumina HiScan 掃描結(jié)果用 GenomeStudio 軟件(http://www.illumina. com/)分析基因型實(shí)施例3 RICE6K水稻SNP芯片在水稻種質(zhì)資源分子標(biāo)記指紋分析中的應(yīng)用利用RICE6K SNP芯片,申請人對106份微核心水稻種質(zhì)資源進(jìn)行分子標(biāo)記指紋分析。RICE6K芯片檢測這106份水稻品種基因組DNA,在5,102個(gè)有效檢測位點(diǎn)中,有636個(gè)位點(diǎn)在大于3個(gè)品種中檢測基因型為雜合位點(diǎn),申請人認(rèn)為這些位點(diǎn)的檢測能力較差,剩余4466個(gè)高質(zhì)量位點(diǎn)用于106個(gè)品種的基因分型。根據(jù)基因分型結(jié)果對這106份水稻品種進(jìn)行聚類分析,結(jié)果發(fā)現(xiàn)全部18份粳稻聚為一類,其他88份秈稻聚為另一類。申請人分析了這批RICE6K SNP芯片能夠檢測到的任意兩個(gè)品種之間多態(tài)性SNP位點(diǎn)數(shù)。結(jié)果表明,粳稻與粳稻之間,秈稻與秈稻之間,秈稻與粳稻兩亞種之間多態(tài)性SNP比例平均分別為18. 2%、23. 4%和 58. 9% (圖 4),對應(yīng)位點(diǎn)數(shù)為 813、1046 和 2630 個(gè)。該結(jié)果表明,RICE6K SNP芯片可優(yōu)先適用于檢測秈稻與粳稻兩亞種之間雜交群體基因分型,也可用于粳稻與粳稻之間、秈稻與秈稻之間雜交群體,具有廣泛的適應(yīng)性。實(shí)施例4 RICE6K水稻SNP芯片在檢測秈稻和粳稻雜交F2群體基因型中的應(yīng)用粳稻巴里拉(Balilla)和秈稻南京11 (Nanjing 11)(見遺傳資源表2)雜交Fl植株上收獲的種子在室內(nèi)發(fā)芽,取發(fā)芽一周的幼嫩葉片抽提基因組DNA進(jìn)行基因芯片實(shí)驗(yàn),同時(shí)以親本巴里拉、南京11以及雜種Fl為對照(親本一次重復(fù),雜種兩次重復(fù))。經(jīng)過分析,親本巴里拉和南京11之間有差異,并且在雙親中判斷為純合基因型、在雜種Fl兩次重復(fù)均判斷為雜合基因型的位點(diǎn)共有3,775個(gè),占有效位點(diǎn)數(shù)的74.0% (3775/5102),用這些位點(diǎn)對F2群體的67個(gè)單株進(jìn)行基因分型(圖5)。兩親本巴里拉和南京11具有明顯的表型差異。巴里拉是典型的粳稻品種,半矮桿、植株緊湊、穗子小、籽粒卵圓形,而南京11是典型的秈稻品種,高桿、植株披散、穗子大、籽粒橢圓型。利用RICE6K SNP芯片檢測,兩親本相關(guān)功能基因基因型結(jié)果與表型相符(表I),并且在F2群體中有分離。例如水稻Sd-I基因(MSU L0C_0s01g66100)SNP探針0s01g66100. I檢測71個(gè)單株(2親本+2雜種F1+67雜種F2)有26個(gè)為巴里拉純合基因型(AA),21個(gè)為南京11純合基因型(BB),其余24個(gè)為雜合基因型(AB)(圖2a) ;INDEL探針I(yè)DOlgOOSDl. I檢測結(jié)果有50個(gè)單株為插入基因型(巴里拉純合基因型和雜合基因型),其余21個(gè)為缺失基因型(南京11純合基因型)(圖2b),兩者結(jié)果一致。
該結(jié)果表明,RICE6K SNP芯片對秈稻和粳稻兩個(gè)亞種間的雜交群體具有很好的基因分型能力,并且對重要功能基因型具有很好的檢測能力。表I.巴里拉和南京11部分功能基因檢測結(jié)果
某K型
基因 MSU位點(diǎn)探針 m田護(hù)土口土古丄”_巴里拉南足11
Sd-IL0c_0s01g66100IDOlgOOSDl. I半矮桿高桿
IDOlgOOSDl.2半矮桿高桿
0s01g66100.1半矮桿高桿
TAClL0c_0s09g359800s09g35980.1植株緊湊植株披散
GnlaLOC—OsOlglOl 10OsOlglOl 10.1小穗大穗
OsOlglOl 10.2小穗大穗
SaFL0c_0s01g396700s01g39670.1粳型秈型
S5L0c_0s06gll0100s06gll010.1粳型秈型
0s06gl 1010.2 粳型秈型GW2 L0c_0s02gl4720 0s02gl4720.2 寬粒窄粒qSW5/GW5 GeneBank AB433345 Os05g00GW5.1 寬粒窄粒_ID05g00GW5.3 寬粒_窄粒實(shí)施例5 RICE6K水稻SNP芯片在檢測水稻育種材料的遺傳背景中的應(yīng)用為了檢驗(yàn)RICE6K水稻SNP芯片在育種中的應(yīng)用效果,申請人對回交育種中間材料進(jìn)行了遺傳背景分析。供體親本B (秈稻)兩個(gè)優(yōu)異基因?qū)胧荏w親本A(粳稻)以改良A親本的缺陷。經(jīng)過4輪回交得到BC4F1,回交過程中用傳統(tǒng)分子標(biāo)記(SSR)進(jìn)行目標(biāo)基因前景選擇,以保證優(yōu)異基因在回交過程中沒有丟失。用RICE6K SNP芯片檢測了經(jīng)過表型篩選和SSR分子標(biāo)記輔助選擇得到的BC4F1材料29份,具有代表性的兩個(gè)家系基因型結(jié)果如圖6所示。圖6a所示的家系除了目標(biāo)基因區(qū)段以外,其他背景基因型都與受體親本一致,而圖6b所示的家系除目標(biāo)基因區(qū)段以外,在第4、8和9染色體有三個(gè)區(qū)段帶有供體親本片段。為了盡量保持A親本的優(yōu)良特性,優(yōu)先選擇圖6a所示的家系進(jìn)行后續(xù)育種工作。該結(jié)果表明,RICE6K水稻SNP芯片可以成功分析秈稻和粳稻兩個(gè)亞種間回交育種群體的遺傳背景,并指導(dǎo)育種。用傳統(tǒng)SSR等分子標(biāo)記分析遺傳背景不僅費(fèi)時(shí)費(fèi)力,并且由于數(shù)量有限不能覆蓋整個(gè)基因組。RICE6K水稻SNP芯片可以準(zhǔn)確、快速、高效地進(jìn)行全基因組遺傳背景選擇,優(yōu)先用于秈稻和粳稻兩個(gè)亞種間雜交群體,即使是用于亞種內(nèi)的雜交群體,其標(biāo)記密度也遠(yuǎn)高于傳統(tǒng)SSR等分子標(biāo)記。實(shí)施例6 RICE6K水稻SNP芯片在檢測水稻種子真實(shí)性中的應(yīng)用 目前我國三系雜交水稻種子真實(shí)性檢測僅使用24個(gè)SSR位點(diǎn)判斷是否是相同品種(中華人民共和國國家標(biāo)準(zhǔn)GB/T20396-2006)。申請人使用RICE6K水稻SNP芯片檢測了兩份雜交水稻種子真實(shí)性,第I份待測樣品與標(biāo)準(zhǔn)樣品(特優(yōu)009)(見遺傳資源表3)共檢測到4,968個(gè)位點(diǎn),其中僅I個(gè)位點(diǎn)基因型不一致,一致性為99. 98 %,第2份待測種子與標(biāo)準(zhǔn)樣品(岳優(yōu)9264)(見遺傳資源表4)共檢測到4,876個(gè)位點(diǎn),全部位點(diǎn)基因一致,一致性為100%。第I份樣品經(jīng)國標(biāo)規(guī)定的24個(gè)SSR標(biāo)記檢測基因型完全一致。申請人:還用RICE6K水稻SNP芯片檢測了 2份常規(guī)稻,第I份待測樣品與標(biāo)準(zhǔn)樣品(玉香油占)(見遺傳資源表5)共檢測到4,794個(gè)位點(diǎn),其中僅2個(gè)位點(diǎn)基因型不一致,一致性為99. 96%,第2份待測樣品與標(biāo)準(zhǔn)樣品(R1303)(見遺傳資源表5)共檢測到4,696個(gè)位點(diǎn),其中有4個(gè)位點(diǎn)基因型不一致,一致性為99. 91%。申請人:用RICE6K水稻SNP芯片檢測了 5份被稱為93_11的待測樣品(見遺傳資源表6,7),以I份93-11的標(biāo)準(zhǔn)樣品(見遺傳資源表2)和93-11衍生系安選6號(hào)標(biāo)準(zhǔn)樣品(見遺傳資源表7)為對照。結(jié)果發(fā)現(xiàn)其中的2份待測樣品與93-11標(biāo)準(zhǔn)樣品基因型一致性達(dá)到99. 9%以上,4,900多個(gè)位點(diǎn)中僅有1-4個(gè)位點(diǎn)基因型不一致;而與安選6號(hào)標(biāo)準(zhǔn)樣品基因型一致性為99. 3%,有約70個(gè)SNP位點(diǎn)有差異。于是,申請者比較了 93-11和安選6號(hào)之間的差異,結(jié)果發(fā)現(xiàn)它們之間約70個(gè)差異位點(diǎn)都集中在第8染色體的一個(gè)區(qū)間(圖7)。從以上檢測結(jié)果可以看出,RICE6K水稻SNP芯片適合于進(jìn)行三系雜交水稻和常規(guī)稻的真實(shí)性檢測,其結(jié)果比SSR分子標(biāo)記更具有說服力。同時(shí)也反映出RICE6K水稻SNP芯片檢測同樣的樣品技術(shù)重復(fù)可達(dá)到99. 9%以上。序列表
權(quán)利要求
1.一種水稻全基因組SNP芯片,其特征在于所說的SNP芯片是指根據(jù)SEQ No. OOfSEQID No. 5636所示序列利用Infinium專利設(shè)計(jì)制造技術(shù)制作的芯片。
2.權(quán)利要求I所述的一種水稻全基因組SNP芯片在水稻種質(zhì)資源分子標(biāo)記指紋分析中的應(yīng)用。
3.權(quán)利要求I所述的一種水稻全基因組SNP芯片在檢測水稻雜交群體基因型中的應(yīng)用。
4.權(quán)利要求I所述的一種水稻全基因組SNP芯片在檢測水稻育種材料的遺傳背景中的應(yīng)用。
5.權(quán)利要求I所述的一種水稻全基因組SNP芯片在檢測水稻種子中的應(yīng)用。
全文摘要
本發(fā)明公開了一種水稻全基因組SNP芯片及其應(yīng)用,步驟(1)芯片上第一類探針的獲得通過測序獲得親本的基因組序列,結(jié)合公共數(shù)據(jù)庫中的其他水稻品種重測序數(shù)據(jù),以日本晴基因組為參考序列,使用MAQ軟件將所有測序數(shù)據(jù)進(jìn)行匹配、分析,最后從中篩選出SNP標(biāo)記;(2)芯片上第二類探針的獲得從公共數(shù)據(jù)庫獲得水稻功能基因,尋找反映基因功能的序列差異,據(jù)此設(shè)計(jì)出SNP/INDEL探針;(3)利用Infinium芯片制造技術(shù)制作SNP芯片。(4)測試芯片的準(zhǔn)確性和應(yīng)用效率。本芯片可應(yīng)用于水稻種質(zhì)資源分子標(biāo)記指紋分析、種子真實(shí)性檢測、雜交后代基因分型,以及其他相關(guān)研究中。
文檔編號(hào)C40B40/06GK102747138SQ20121005577
公開日2012年10月24日 申請日期2012年3月5日 優(yōu)先權(quán)日2012年3月5日
發(fā)明者周發(fā)松, 喻輝輝, 張啟發(fā), 李菁, 謝為博 申請人:中國種子集團(tuán)有限公司