專利名稱:用于乳腺癌風險評估的遺傳變型的制作方法
用于乳腺癌風險評估的遺傳變型引言乳腺癌是迄今為止全世界婦女最常見的癌癥。目前全球發(fā)病率每年超過 1,151,000 新診斷的病例[Parkin,等人,(2005),CA Cancer J Clin,55,74-108]。乳腺癌發(fā) 病在發(fā)達國家特別是在北歐人族源(ethnic origin)的人群中最高,并且正日益增加。在美 國,每年年齡標準化的發(fā)病率為每100,000人口大約125例,是世界平均水平的3倍以上。 北歐國家的發(fā)病率相似地高。在2008年,據估計將在美國診斷出184,450例浸潤性乳腺癌 新病例并且 40,930 人將死于該疾病[Jemal,等人,(2008),CA Cancer J Clin,58,71-96]。 必須將該數字加上2008中預計的另外67,770例原位導管癌和小葉原位癌診斷。從個體角 度來看,在美國婦女中發(fā)生乳腺癌的終生概率為12. 3% (即,8個婦女中有1個將在其生命 中發(fā)生乳腺癌)。與大多數癌癥一樣,早期檢出和適當的治療是非常重要的因素。總體上, 乳腺癌的5年存活率是89%。然而,在呈現(xiàn)局部浸潤性(invasive)或轉移性疾病的個體 中,該比率分別下降至 84%和 27% [Jemal,等人,(2008),CA Cancer J Clin,58,71-96]。逐漸地,重點落在了鑒定處于患原發(fā)性或復發(fā)性乳腺癌的高風險中的個體。此類 個體可利用更密集的篩查、預防性化學療法、激素療法和在當個體處于極高風險的情況下 預防性手術來治療。普查程序對衛(wèi)生服務造成了巨大的經濟負擔,然而預防性治療與風險 度和生活質量后果相關。對乳腺癌的遺傳易感性(Genetic Predisposition)兩個主要的已知乳腺癌風險因素類別是內分泌因素和遺傳因素。關于后者,大約 12%的乳腺癌患者具有一個或多個患乳腺癌的一級親屬K2001),Lancet, 358,1389-99]。 眾所周知的顯性乳腺癌易感基因BRCAl和BRCA2賦予攜帶者顯著增加的患乳腺癌的風險, 終生外顯率估計在40至80%的范圍內。BRCAl和BRCA2突變的存在可解釋大多數具有6例 或更多例乳腺癌的家族以及解釋大部分包括乳腺癌和卵巢癌或男性乳腺癌的家族。然而, 此類家族事實上非常罕見。在具有更少的病例的家族或特征在于只有乳腺癌病家族中發(fā)現(xiàn) BRCAl和BRCA2突變的頻率要低得多。結合起來,BRCAl和BRCA2中的突變可解釋15-20%的 患家族性乳腺癌的風險。在非祖先個體(non-founder)群體中,如果可檢測所有常見BRCA 突變,那么預期2至3%的偶發(fā)性乳腺癌患者(incident breast cancer patient)可具有 突變[Gorski,等人,(2005),Breast Cancer Res Treat,92,19-24 ; (2000),Br J Cancer, 83,1301-8]。該低“發(fā)現(xiàn)概率(chance to find) ”統(tǒng)計量將BRCA突變測試的可靠使用排 除在具有明顯的遺傳易感性(hereditary predisposition)的家族之外(Anon[ (2003), J Clin Oncol,21,2397-406])。已知罕見的高外顯率突變在TP53和PTEN基因中發(fā)生,然 而,這些一起解釋不超過5%的患乳腺癌的總遺傳風險度[Easton,(1999), Breast Cancer Res, 1,14-7]。連鎖研究在鑒定賦予患乳腺癌的高風險度的廣泛突變中很大程度上不再成 功[Smith,等人,(2006),Genes Chromosomes Cancer,45,646-55]。最近的流行病學研究已表明大多數乳腺癌病例發(fā)生在易患病、易感性的少數群體 中[Antoniou,等人,(2002),Br J Cancer,86,76-83 ;Pharoah,等人,(2002),Nat Genet, 31,33-6]。來自雙胞胎研究和原發(fā)性乳腺癌存活患者的對側乳腺中癌癥的恒定的高發(fā)病率的觀察數據表明大部分未表征的患乳腺癌的風險與內源性因素,很可能遺傳因素相 失[Lichtenstein,·入,(2000), N Engl J Med, 343, 78-85 ;Peto andMack, (2000), Nat Genet二6,411-4]。支持該廣泛的風險遺傳因素的知識極為有限。分離分析預測未表征的患 乳腺癌的遺傳風險在本質上很可能是多基因的,因為風險性等位基因賦予低至中度的風險 并且可以彼此之間以及與激素風險因子相互作用。然而,此類研究預測多達40倍的可通過 捕獲此類低至中度的風險性等位基因的遺傳特征(geneticprofiling)確定的最高分布分 位數與最低分布分位數之間的相對風險度的差異[Antoniou,等人,(2002),Br J Cancer, 86,76-83 ;Pharoah,等人,(2002),Nat Genet,31,33-6]。預期 88% 的所有乳腺癌病例在易 感染的50%的群體中發(fā)生并且12%的處于最高風險的群體占據了 50%的所有乳腺癌病例 [Pharoah,等人,(2002),Nat Genet, 31, 33-6 ;Pharoah, (2003),Recent Results Cancer Res, 163,7-18 ;discussion264-6]。因此許多精力集中在鑒定此類具有遺傳易感性的個體 和發(fā)展針對他們的個性化醫(yī)學管理策略。我們和其他研究小組已證明在冰島存在顯著的乳腺癌的家族風險性,其擴展至至 少第五級親屬[Amundadottir,等人,(2004),PLoS Med, 1, e65 ;Tulinius,等人,(2002),J Med Genet,39,457-62]。在冰島,BRCAl突變對家族風險性的貢獻被認為是最小的[Arason, 等人,(1998),J Med Genet,35,446-9 ;Bergthorsson,等人,(1998),Hum Mutat,Suppl 1, S195-7]。BRCA2基因中的單個祖先個體突變(founder mutation) (999del5)在普通冰島 人群中以0. 6-0. 8%的攜帶者頻率和在女性乳腺癌患者中以7. 7-8. 6%的攜帶者頻率存在 [Thorlacius,等人,(1997),Am J Hum Genet,60,1079-84 ;Gudmundsson,等人,(1996) ,Am J Hum Genet, 58,749-56]。該單個突變估計可解釋針對一至三級親屬的大約40%的遺傳性乳 腺癌風險[Tulinius,等人,(2002), J Med Genet,39,457-62]。雖然該估計高于 15-25% 的 歸因于非祖先個體群體中組合的所有BRCA 1和2突變的家族風險性,但仍然有大約60%的 冰島人家族乳腺癌風險有待解釋。BRCA2 999del5測試為陰性的患者的一級親屬保持1.72 倍的患乳腺癌的群體風險(95% CI 1. 49-1. 96) [Tulinius,等人,(2002),JMed Genet,39, 457-62]。遺傳風險由人群中個體間基因組中的細微差異賦予。人基因組中的變異最頻繁地 由單核苷酸多態(tài)型(SNP)引起,雖然其它變異也是非常重要的。在人基因組中平均每1000 個堿基對存在一個SNP。因此,包含250,000個堿基對的典型人基因可包含250個不同的 SNP。只有少數SNP位于外顯子中并且改變由該基因編碼的蛋白質的氨基酸序列。大多數 SNP對基因功能可能幾乎沒有影響或沒有影響,然而其它SNP可改變由基因編碼的mRNA的 轉錄、剪接、翻譯或穩(wěn)定性。人基因組中的另外的遺傳多態(tài)型是由DNA的短區(qū)段或長區(qū)段的 插入、缺失、易位或倒位引起的。賦予患疾病風險的遺傳多態(tài)型可直接改變蛋白質的氨基酸 序列,可增加從基因產生的蛋白質的量,或可減少由基因產生的蛋白質的量。隨著賦予患常見疾病風險的遺傳多態(tài)型被發(fā)現(xiàn),此類風險因素的遺傳檢測對于臨 床醫(yī)學變得日益重要。實例是鑒定癡呆患者中apoE4多態(tài)型的基因攜帶者以進行阿爾茨 海默病的鑒別診斷的載脂蛋白E測試、和對深部靜脈血栓形成的易感性的因子V的Leiden 測試。更重要地,在癌癥的治療中,腫瘤細胞的遺傳變型的診斷對于個體患者的最適當治療 方案的選擇是有用的。在乳腺癌中,雌激素受體表達或神經生長因子2型(Herf)受體酪氨 酸激酶表達的遺傳變異決定是否要將抗雌激素藥(他莫昔芬)或抗Her2抗體(赫賽汀)整合入治療方案。在慢性髓樣白血病(CML)中,融合編碼Bcr和Abl受體酪氨酸激酶的基 因的費城染色體基因易位(genetic translocation)的診斷表明應當將Gleevec (STI571) (Bcr-Abl激酶的特異性抑制劑)用于治療癌癥。對于具有這樣的遺傳改變的CML患者, Bcr-Abl激酶的抑制導致腫瘤細胞的快速消除和白血病緩解。此外,遺傳檢測服務現(xiàn)今是可 獲得的,從而為個體提供關于他們的患疾病風險的信息(基于特定SNP已與患許多常見疾 病的風險關聯(lián)的發(fā)現(xiàn))。對引起患乳腺癌的殘余遺傳風險的遺傳因素的了解非常有限。2個基因的變體 已被嚴格地證實為低外顯率乳腺癌風險基因;CHEK2和ATM[Renwick,等人,Q006),Nat Genet,38,873-5 ; (2004),Am J HumGenet, 74,1175-82] 此外,最近的報導建立 了染色 體2q35和16ql2上的變體與增加的患雌激素受體陽性乳腺癌的風險之間的關聯(lián)(Simon, SN.等人 Nat Genet 39 865-9 (2007)) 此夕卜,已報導了 FGFR2、TNRC9、MAP3K1 和 LSPl 基因(Easton,D. F.,等人Nature 447 :1087-93(2007))以及FGFR2基因中或其附近的 變體(Hunter,D. J.,et al Nat Genet39 :870-4 (2007)) 許多其他基因已被涉及,然而 它們對乳腺癌風險的貢獻在使用很大的樣品組的分析中還未得到驗證[Breast Cancer Association, (2006), J Natl Cancer Inst,98,1382-96]。用于預防或治療乳腺癌的通用成功方法目前是不可獲得的。乳腺癌的治療目前依 賴于一級預防、早期診斷、適當的治療和二級預防的組合。存在將基因測定整合入這些管理 領域的所有方面的明確的臨床緊迫性。癌癥易感性基因的鑒定還可揭示可進行操作(例 如,使用小或大分子量的藥物)并且可帶來更有效的治療的至關重要的分子途徑。本發(fā)明 提供了針對乳腺癌的另外的遺傳變型,可將其整合在乳腺癌的預防程序中。發(fā)明概述本發(fā)明涉及評估對乳腺癌的易感性的方法。本發(fā)明包括通過評估某些已經發(fā)現(xiàn)與 增加的或減少的患乳腺癌的易感性關聯(lián)的標志或單倍型,診斷增加的對乳腺癌的易感性的 方法以及診斷減少的對乳腺癌的易感性或診斷抗癌保護作用的方法。本發(fā)明還涉及評估經 診斷患有乳腺癌的個體的預后的方法、評估對乳腺癌治療劑或乳腺癌治療的反應可能性的 方法以及監(jiān)控經診斷患有乳腺癌的個體的治療進展的方法。在一個方面,本發(fā)明涉及診斷人個體中對乳腺癌的易感性的方法,所述方法 包括測定至少一個多態(tài)型標志的至少一個等位基因在獲自個體的核酸樣品中存在或 不存在,所述多態(tài)型標志選自下組rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQID NO :5)、rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、 rs6001954(SEQ ID NO :9)和與它們處于連鎖不平衡中的標志,其中至少一個等位基因的 存在標示著對乳腺癌的易感性。本發(fā)明還涉及通過測定至少一個多態(tài)型的至少一個等位 基因在獲自個體的核酸品中的存在或不存在來測定對乳腺癌的易感性的方法,所述多態(tài)型 標志選自下組rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026 (SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQID NO :8)、rs6001954 (SEQ ID NO :9)和與它 們處于連鎖不平衡中的標志,其中至少一個等位基因的存在的確定標示著對乳腺癌的易感 性。
在另一個方面,本發(fā)明涉及測定人個體中對乳腺癌的易感性的方法,所述方法 包括測定至少一個多態(tài)型標志上的至少一個有風險的等位基因是否存在于來源于該 個體的基因型數據集中,其中至少一個多態(tài)型標志選自下組rs20051M(SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)和與它們處于連鎖不平衡中的標志, 并且其中至少一個有風險的等位基因的存在的確定標示著該個體中增加的對乳腺癌的易 感性。本發(fā)明是還涉及測定人個體中對乳腺癌的易感性的方法,其包括確定至少一 個多態(tài)型標志的至少一個等位基因是否存在于獲自該個體的核酸樣品中或來源于該 個體的基因型數據集中,其中所述至少一個多態(tài)型標志選自rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQID NO :8)、rs6001954(SEQ ID NO :9)和與它們處于連鎖不平衡中的標志, 并且其中所述至少一個等位基因的存在標示著個體中對乳腺癌的易感性。在一個實施方案中,基因型數據集包括關于標志本體和個體的等位基因狀態(tài)的信 息,即關于由個體攜帶的所述標志的2個等位基因的本體的信息?;蛐蛿祿砂P 于一個或多個標志(包括2個或更多個標志、3個或更多個標志、5個或更多個標志、100個 或更多個標志等)的等位基因信息。在一些實施方案中,基因型數據集包括來自個體的全 基因組評估(可包括數十萬個標志或甚至1百萬個或更多個標志)的基因型信息。在某些實施方案中,所述至少一個多態(tài)型標志與PAX5(成對基因盒5,也稱為 BSAP)基因、TUB (Tubby同源物(小鼠,rd5))基因、SERPINH1 (絲氨酸蛋白酶抑制劑、 clade H(熱激蛋白47)、成員1(膠原結合蛋白1))基因、RAD51L1(REC2 ;R51H2 ;hREC2 ; RAD51B ;MGC34245)基因、FH0D3 (含形成素同源性2域3,也稱為FH0S2 ;Formactin2)基因 或TNRC6B (含三核苷酸串聯(lián)重復的6B或KIAA1093)基因中的任意一個關聯(lián)。在某些此類實施方案中,至少一個多態(tài)型標志與上述基因的任意一個即PAX5(成 對基因盒5,也稱為BSAP)基因、TUB (Tubby同源物(小鼠,rd5))基因、SERPINH1 (絲氨酸 蛋白酶抑制劑,clade H(熱激蛋白47),成員1,(膠原結合蛋白1))基因、RAD51L1 (REC2 ; R51H2 ;hREC2 ;RAD51B ;MGC34245)基因、FH0D3 (含形成素同源性 2 域 3,也稱為 FH0S2 ; Formactin2)基因禾口 TNRC6B (含三核昔酸重復序列 6B (trinucleotide repeat containing 6B)或KIAA1093)基因的任意一個處于連鎖不平衡中。本發(fā)明的另一個方面涉及測定人個體中對乳腺癌的易感性的方法,所述方法包 括獲得關于人個體的核酸序列數據,鑒定至少一個多態(tài)型標志的至少一個等位基 因,所述標志選自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546 (SEQID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)和與它們 處于連鎖不平衡的標志,其中所述至少一個多態(tài)型標志的不同等位基因與人中對乳腺癌的 不同易感性關聯(lián),和根據核酸序列數據測定對乳腺癌的易感性。
在一般意義上,遺傳標志在核酸水平上導致替代序列(alternate sequence) 0如 果核酸標志改變由核酸編碼的多肽的密碼子,那么該標志也將在氨基酸水平上導致所編碼 的多肽(多肽標志)的替代序列。核酸中的多態(tài)型標志上的特定等位基因或多肽標志上的 特定等位基因的本體的測定包括特定等位基因是否存在于序列的特定位置上。鑒定標志上 的特定等位基因的序列數據包括足以檢測所述特定等位基因的序列。對于本文中描述的單 核苷酸多態(tài)型(SNP)或氨基酸多態(tài)型,序列數據可包括單個位置上的序列,即,序列內單個 位置上的核苷酸或氨基酸的本體。鑒定多態(tài)型標志的特定等位基因的核酸序列數據有時也 稱為基因型數據??梢岳缤ㄟ^分析該個體的生物樣品中至少一個多態(tài)型標志的序列來獲 取核酸序列數據??蛇x擇地,從來自人個體的基因型數據集中可獲取核酸序列數據并且分 析數據集中至少一個多態(tài)型標志的序列。此類分析在某些實施方案中包括確定特定多態(tài)型 標志的特定等位基因的存在或不存在。一般術語中特定等位基因的鑒定應被用來表示進行 等位基因的存在或不存在的確定。通常,通過測定特定多態(tài)型的所有可能的等位基因在特 定個體中的存在來進行個體的基因組中兩個等位基因拷貝的測定(對于SNP,2個可能的核 苷酸中的每一個對于等位基因位點都是可能的)。還可能確定只有特定的等位基因存在還 是不存在。例如,在某些實施方案中,確定已顯示與青光眼的風險關聯(lián)的某些等位基因的存 在或不存在,但不必確定特定標志的其他等位基因的存在或不存在,基于這樣的確定來進 行易感性的測定。在某些實施方案中,就至少2個多態(tài)型標志測定核酸序列可能是有用的。在其它 實施方案中,測定至少3個、至少4個或至少5個或更多個多態(tài)型標志的核酸序列。單倍型 信息可來源于2個或更多個多態(tài)型標志的分析。因此,在某些實施方案中,進行另外的步 驟,通過該步驟基于至少2個多態(tài)型標志的序列數據產生單倍型信息。本發(fā)明還提供了測定人個體中對乳腺癌的易感性的方法,該方法包括獲得關于 人個體的核酸序列數據鑒定至少2個多態(tài)型標志和與它們處于連鎖不平衡中的標志的 這兩個等位基因,所述多態(tài)型標志選自rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO: 5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、rsl1912922(SEQID NO :8)、 rs6001954 (SEQ ID NO :9),基于序列數據測定至少一個單倍型的本體,和由單倍型數據測 定對乳腺癌的易感性。在某些實施方案中,易感性的測定包括將核酸序列數據與數據庫相比較,所述數 據庫包含至少一個多態(tài)型標志與對乳腺癌的易感性之間的關聯(lián)數據。在一些實施方案中, 數據庫包括針對至少一個標志的對乳腺癌的易感性的至少一個風險測量??梢岳缫圆檎?表的方式提供序列數據庫,所述查找表包含針對任何一個或多個特定多態(tài)型標示對乳腺癌 的易感性的數據。所述數據庫還可包括針對包含至少2個多態(tài)型標志的特定單倍型標示易 感性的數據。獲取核酸序列數據可以在某些實施方案中包括獲取源自人個體的生物樣品和分 析該樣品的核酸中的至少一個多態(tài)型標志的序列。分析序列可包括確定至少一個多態(tài)型標 志的至少一個等位基因是否存在。特定易感性等位基因(例如,有風險的等位基因)的存 在的確定標示著人個體中對乳腺癌的易感性。特定易感性等位基因的不存在的確定標示著 所述特定易感性不存在于個體。
在一些實施方案中,獲取核酸序列數據包括從既存記錄獲取核酸序列信息。所述 既存記錄可以例如是包含序列數據的計算機文件或數據庫,所述序列數據例如人個體的、 至少一個多態(tài)型標志的基因型數據??蓪⑼ㄟ^本發(fā)明的診斷方法測定的易感性報告給特定的實體。在一些實施方案 中,所述至少一個實體選自下組個體、個體的監(jiān)護人、基因服務提供商、醫(yī)生、醫(yī)療機構和 醫(yī)療保險公司。在本發(fā)明的某些實施方案中,易感性的測定包括將核酸序列數據與數據庫相比 較,所述數據庫包含至少一個多態(tài)型標志與對乳腺癌的易感性之間的關聯(lián)數據。在一個這 樣的實施方案中,數據庫包括針對至少一個多態(tài)型標志的對乳腺癌的易感性的至少一個風 險測量。在另一個實施方案中,數據庫包括查找表,所述查找表包括針對至少一個多態(tài)型標 志的至少一個病癥的至少一個風險測量。在某些實施方案中,獲取核酸序列數據包括獲取源自人個體的生物樣品和分析該 樣品的核酸中的至少一個多態(tài)型標志的序列。分析至少一個多態(tài)型標志的序列可包括確定 至少一個多態(tài)型標志的至少一個等位基因的存在或不存在。獲取核酸序列數據還可包括從 既存記錄獲取核酸序列信息。本發(fā)明的某些實施方案涉及獲得關于至少2個多態(tài)型標志的核酸序列數據,所 述標志選自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ IDNO :2)、rs2224696 (SEQ ID NO: 3)、rs2242503(SEQ ID NO 4), rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)和與它們 處于連鎖不平衡中的標志。在本發(fā)明的某些實施方案中,至少一個多態(tài)型標志選自表4中所示的標志。在一 個實施方案中,至少一個多態(tài)型標志選自SEQ ID NO :1-562中所示的標志。在一個實施方案 中,至少一個標志與 rs2005154,rs2184380,rs2224696,rs2242503,rsl2291026,rs999737, rs9956546, rsll912922和rs6001卯4中的至少一個處于連鎖不平衡中。在一個實施方案 中,與rs999737處于連鎖不平衡中的標志選自下組rs999737、rsl0134446、rsl0138140、 rsl0146772、rsl0467820、rsl0483812、rsl0483813、rslll58749、rslll58751、rsll621276、 rsll624097、rsll624164、rsll624333、rsll628293、rsll846360、rsll847185、rsll849916、 rsl2878761、rsl2879200、rsl2886864、rsl2889251、rsl2894230、rsl468279、rsl468280、 rsl547012、rsl7105675、rsl7755657、rsl7755734、rsl7755752、rsl7755925、rsl7756000、 rsl7828691、rsl7828721、rsl7828763、rsl7828907、rsl7828955、rsl956534、rs2074563、 rs2074565、 rs2097800、 rs2107340、 rs2145157、 rs2158357、 rs2189517、 rs2253317、 rs2257111、 rs2257116、 rs2257127、 rs2331701、 rs2331705、 rs2331775、 rs2525503、 rs2525530、rs2842327、rs3784121、rs4531674、rs4899246、rs4902604、rs4902606、 rs4902608、rs5004090、rs6573837、rs7140266、rs7146456、rs7153476、rs739874、 rs746663、rs8007194、rs8010439、rs8012610、rs9323512、rs9323513 和 rs9323514。在一個實施方案中,與rs20051M處于連鎖不平衡中的標志選自下組 rs2005154、rs4878662 和 rs4880019。在一個實施方案中,與rs2184380處于連鎖不平衡中的標志選自下組 rs2184380、rsl0466295、rsl0508363、rsl0508364、rsl0508365、rsl0795670、rsl090541Ursl0905414、rsl0905415、rsl0905430、rsl0905437、rsl0905439、rsl0905440、rsl0905443、 rsl0905444、rsl0905445、rsl0905446、rsl0905447、rsl0905454、rsll255764、rsll255776、 rsll255777、rsll255778、rsll255779、rsll255790、rsll255795、rsll255797、rsll255800、 rsll255804、rsll255805、rsll255820、rsll255821、rsll255822、rsll255832、rsll255836、 rsll255840、rsll255858、rsll255862、rsll255869、rsll255870、rsll255871、rsll255882、 rsll255884、rsl2049705、rsl2218610、rsl2250379、rsl2259226、rsl325874、rsl334549、 rsl334550、rsl334559、rsl360749、rsl413678、rsl413683、rsl537601、rsl537602、 rsl537603、rsl7407711、rsl7407781、rsl7407830、rsl7408204、rsl7408337、rsl7408580、 rsl7484150、rsl7485426、rsl7485998、rsl7486082、rsl7486795、rsl7486816、rsl970170、 rsl999638、 rs2031561、 rs2182292、 rs2388821、 rs2388825、 rs2388826、 rs2892613、 rs4112287、rs4112288、rs4345867、rs4454616、rs4747806、rs4749805、rs4749807、 rs4749812、rs6602328、rs6602329、rs7069110、rs7080765、rs7083359、rs7477023、 rs7904921、rs7912413、rs7912704、rs791283Urs827389 和 rs966562。在一個實施方案中,與rs2224696處于連鎖不平衡中的標志選自下組 rs2224696、rsl0905509, rsll256045、rsl2761213、rsl2761461、rsl2766048、rsl2772042、 rsl2776383、 rsl2778120、 rsl2780218、 rsl2781427、 rsl475189、 rsl573109、 rsl573110、 rsl7145088、rsl7145095、rsl7145118、rsl7145120、rsl7145151、rsl7145164、rsl7145169、 rsl7145188、 rsl7145193、 rsl7145221、 rsl7363338、 rsl775559、 rsl857230、 rsl891532、 rsl935813、 rs2013364、 rs2025289、 rs2057442、 rs2093625、 rs2093626、 rs2146598、 rs2185817、rs2397336、rs2760204、rs2797266、rs391733、rs4550140、rs7081544、 rs852273、rs860418、rs861172、rs962993 和 rs965307。在一個實施方案中,與rs2M2503處于連鎖不平衡中的標志選自下組 rs2242503、rsl0431029、rsl055233、rsl0734629、rsl0743052、rsl0743053、rsl0743054、 rsl0743055、rsl0769872、rsl0769873、rsl0769878、rsl0769882、rsl0839976、rsl0839984、 rsll041740、rsll041742、rsll041788、rsll041791、rsll041794、rsll08277、rsl2146654、 rsl2808387、 rsl528125、 rsl569128、 rsl970880、 rsl997262、 rs2049684、 rs2141321、 rs2242501, rs2272383、rs3750955、rs3752898、rs3849986、rs3849990、rs3911309、 rs3911310、 rs4340037、 rs4343012、 rs4385931、 rs4575312、 rs4578424、 rs4636658、 rs4758040、 rs4758042、 rs4758287、 rs4758309、 rs4758310、 rs7103334、 rs7112519、 rs7115706、和 rs7122690、rs7127738、rs7358396、rs7479156、rs7479738、rs7480804、 rs7481667、rs7481683、rs748261U rs7927368 和 rs7940668。在一個實施方案中,與處于連鎖不平衡中的標志選自下組 rsl2291026、rsl004856、rsl0899091、rsll236449、rsll236452、rsll236454、rsl2362081、 rsl540210、 rsl54021U rsl557471、 rsl631470、 rsl783551、 rsl783556、 rsl783559、 rsl790144、 rsl790152、 rsl790307、 rsl793396、 rsl793397、 rsl793398、 rsl793399、 rsl793414、rsl938800、rs2853066、rs499613、rs504793、rs514477、rs549034、rs550881、 rs581007、rs589724、rs600387、rs606460、rs617617、rs618202、rs628972、rs640649、 rs662279、rs667410、rs667531、rs670100、rs670491、rs682292、rs7128888、rs7129014、 rs7129150 和 rs947844。
在一個實施方案中,與rsll9U922處于連鎖不平衡中的標志選自下組 rsll912922、rsll089967、rsll704971、rsll705454、rsl7406386、rsl7406434、rs2071771、 rs2958650、 rs2958651、 rs2958659、 rs7284488、 rs7285507、 rs7291782、 rs739145、 rs9611246 和 rs9611265。在一個實施方案中,與rs6001%4處于連鎖不平衡中的標志選自下組 rs6001954、rsl0483203、rsl0483204、rsl0483205、rsl0483206、rsll06673、rsll913132、 rsl2158399、rsl2158872、rsl2159200、rsl2159970、rsl2484697、rsl2627881、rsl33036、 rsl33038、rsl6985899、rsl7001846、rsl7001868、rsl7001943、rsl7001974、rsl7001977、 rsl7001993,rsl7001994,rsl7001997,rsl7002019,rsl7002020,rsl7002026,rsl7002027, rsl7002034、rsl7002036、rsl7002038、rsl7002069、rs2075764、rs2187832、rs2235318、 rs2280790、 rs2294348、 rs2294350, rs2294352、 rs2413624、 rs3788577、 rs3788578、 rs3788579、rs3827381、rs3827382、rs4140512、rs470113、rs5750957、rs5750960、 rs5750966、rs5757976、rs5757998、rs5758001、rs5995849、rs5995856、rs5995870、 rs5995871、 rs5995886、 rs6001900、 rs6001910、 rs600191U rs6001912、 rs6001913、 rs6001930、rs6001931、rs6001932、rs6001935、rs6001950、rs6001974、rs6001980、 rs6001990、rs6002000、rs718193、rs7292804、rs7293100、rs742140、rs760700、rs760701、 rs9306345、rs932379、rs9607721、rs9611310、rs9611311、rs9611312、rs9611316、 rs9611318、rs9611324、rs9611325、rs9611328 和 rs9611329。在發(fā)明的某些實施方案中,進行估量至少一個單倍型在個體中的頻率的額外步 驟。在此類實施方案中,單倍型中可包括2個或更多個標志,包括3、4、5、6、7、8、9或10 或更多個標志。在某些實施方案中,所述至少一個單倍型包括全部都與rs20051M(SEQ ID NO 1), rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQID NO :7)、 rsll912922(SEQ ID NO :8)和 rs6001954(SEQ ID NO :9)的至少一個處于 LD 中的標志。在 此類實施方案中,所述至少一個單倍型代表上述標志的任意一個存在于其中的特定基因組 區(qū)域(LD區(qū)段)的基因組結構。在一個實施方案中,單倍型包括與rs999737處于連鎖不平 衡中的標志。可將本文中描述的賦予乳腺癌的風險的標志與乳腺癌的其他遺傳標志組 合。此類標志通常不與本文中描述的任一標志,特別是標志rs2005154(SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、 rsll912922 (SEQID NO :8)、rs6001954 (SEQ ID NO :9)和與它們處于連鎖不平衡中的標志處 于連鎖不平衡中??赏ㄟ^將本文中描述的遺傳風險因素與針對乳腺癌的另外的遺傳風險因 素組合來實施本文中描述的任何方法。因此,在某些實施方案中,包括另外的步驟,其包括確定乳腺癌的至少一個有風險 的變體(其不與表1和/或表4中所示的任一個標志處于連鎖不平衡中)的至少一個有 風險的等位基因是否存在于個體中。換句話說,可將基因組的其他位置中的遺傳標志與本 發(fā)明的標志組合使用,以基于多個遺傳因素測定乳腺癌的總體風險。不處于連鎖不平衡中 (不在LD中)的標志的選擇可基于對連鎖不平衡的適當測量,如本文中進一步描述的。在某些實施方案中,不處于連鎖不平衡中的標志具有小于0. 2的標志之間的LD測量r2值。在 某些其他實施方案中,不存在于LD中的標志具有小于0. 15、包括小于0. 10、小于0. 05、小于 0.02和小于0.01的標志之間的r2值。涉及確定標志不處于LD中的其他適當的截斷值,包 括此類值的任意值之間的值。此類遺傳風險因素的實例包括染色體5pl2和染色體10明6 上的標志,例如,標志rsl0941679和標志rsl219648??蛇x擇地,可評估與任一個此類標志 處于LD中的標志。還可將已知賦予患乳腺癌的風險的其他標志與本文中描述的標志一起 評估,包括染色體2ql4 (例如,標志rs4848543或與其處于連鎖不平衡中的標志)、2q35 (例 如,標志rs 13387042或與其處于連鎖不平衡中的標志)和染色體16 (例如,標志rs3803662 或與其處于連鎖不平衡中的標志)上的標志。在某些實施方案中,確定本文中描述的多個標志以測定患乳腺癌的總體風險 度。因此,在某些實施方案中,包括另外的步驟,所述步驟包括在包含源自人個體的基因 組DNA的樣品中或來源于人個體的基因型數據集中確定至少一個等位基因在至少2個多 態(tài)型標志的每一個標志中是否存在,其中所述至少一個等位基因在至少2個多態(tài)型標志 中的存在標示著增加的對乳腺癌的易感性。在一個實施方案中,標志選自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)和rs6001卯4(SEQ ID NO :9)以及與它們處于連鎖不平衡中的 標志ο還可將基于本發(fā)明的標志的風險評估與乳腺癌的至少一個高外顯率遺傳因素在 獲自個體的核酸樣品中或在來源于個體的基因型數據集中的存在或不存在的評估組合。乳 腺癌的高外顯率遺傳因子可以例如是BRCAl突變、BRCA2突變、TP53突變或PTEN突變。結 合起來,BRCAl和BRCA2中的突變可解釋15-20%的患家族性乳腺癌的風險,并且這些突變 可解釋2至3%的偶發(fā)性乳腺癌患者[Gorski,等人,(2005),Breast Cancer Res Treat, 92,19-24 ; (2000), Br J Cancer,83,1301-8]。TP53 和 PTEN 基因中的已知突變解釋大約 5%的患乳腺癌的總體遺傳風險[Easton,(1999) ,Breast Cancer Res, 1,14-7] 在一個實 施方案中,高外顯率遺傳因子是BRCA2 999del5。還可將本發(fā)明的遺傳標志與非遺傳信息組合以確定個體的總體風險度。因此,在 某些實施方案中,包括另外的步驟,所述步驟包括分析非遺傳信息以進行個體的風險度評 估、診斷或預后。非遺傳信息可以是涉及個體的疾病狀態(tài)的任何信息或可影響個體患乳腺 癌的總體風險度的評估的其他信息。在一個實施方案中,非遺傳信息選自受試者的年齡、性 別、種族性、社會經濟地位、以前的疾病診斷、醫(yī)療史、乳腺癌的家族史、生物化學測量和臨 床測量。在另一個方面,本發(fā)明涉及評估在之前經診斷患有乳腺癌的個體中發(fā)生至少第二 原發(fā)腫瘤的風險度的方法,所述方法包括確定至少一個多態(tài)型標志的至少一個等位基因在 獲自個體的核酸樣品中的存在或不存在,其中所述至少一個多態(tài)型標志選自表1和4中所 列的多態(tài)型標志和與它們處于連鎖不平衡中的標志組成的組,其中所述至少一個等位基 因的存在標示著發(fā)生至少第二原發(fā)腫瘤的風險??蛇x擇地,本發(fā)明涉及測定之前經診斷 患有乳腺癌的個體中發(fā)生至少第二原發(fā)腫瘤的風險度的方法,所述方法包括確定至少一 個多態(tài)型標志的至少一個等位基因存在于獲自個體的核酸樣品中或來源于個體的基因型數據集中,其中所述至少一個多態(tài)型標志選自rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503 (SEQ ID NO :4)、rsl2291026 (SEQ ID NO: 5)、rs999737(SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)禾口 rs6001954(SEQ ID NO :9)以及與它們處于連鎖不平衡中的標志,并且其中所述至少一個等 位基因的存在標示著發(fā)生至少第二原發(fā)腫瘤的風險。在一個這樣的實施方案中,所述至少 一個多態(tài)型標志選自表4中所列的標志。本發(fā)明還提供了計算機實現(xiàn)的方面。在一個這樣的方面中,本發(fā)明提供 了具有用于測定個體中對乳腺癌的易感性的計算機可執(zhí)行指令的計算機可讀介質 (computer-readable medium),該計算機可讀介質包括標示著至少一個多態(tài)型標志的數據;和存儲在計算機可讀介質上并且適合于用處理器執(zhí)行以基于所述至少一個多態(tài)型 標志的至少一個等位基因在個體中的等位基因狀態(tài)確定個體中對乳腺癌的易感性的例程。在一個實施方案中,代表至少一個多態(tài)型標志的所述數據包括至少一個標示著 對與所述至少一個多態(tài)型標志關聯(lián)的乳腺癌的易感性的參數。在另一個實施方案中, 代表至少一個多態(tài)型標志的所述數據包括標示著所述至少一個等位基因標志的至少一 個等位基因在所述個體中的等位基因狀態(tài)的數據。在另一個實施方案中,所述例程適 合于接受標示著所述至少一個等位基因標志的至少一個等位基因在所述個體中的等位 基因狀態(tài)的輸入數據。在優(yōu)選實施方案中,所述至少一個標志選自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4), rsl2291026 (SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)和與它們處于連鎖不平衡中的標志。 在另一個優(yōu)選實施方案中,所述至少一個多態(tài)型標志選自表4中所示的標志。本發(fā)明還提供了用于測定針對人個體的乳腺癌的遺傳指標(indicator)的裝置, 其包括處理器,計算機可讀存儲器,其具有適合在處理器上執(zhí)行用以就至少一個乳腺癌分析至少 一個人個體的標志和/或單倍型信息的計算機可執(zhí)行指令,和產生基于標志或單倍型信息 的輸出,其中所述輸出包括至少一個標志或單倍型的風險度測量作為人個體的乳腺癌的遺 傳指標。在一個實施方案中,計算機可讀存儲器包括標示著至少一個多態(tài)型標志的至少一 個等位基因或至少一個單倍型在多個經診斷患有乳腺癌的個體中的頻率的數據,和標示著 至少一個多態(tài)型標志的至少一個等位基因或至少一個單倍型在多個參照個體中的頻率的 數據,其中風險度測量基于人個體的至少一個標志和/或單倍型狀態(tài)與標示著多個經診斷 患有乳腺癌的個體的至少一個標志和/或單倍型頻率的信息的數據的比較。在可選擇的 實施方案中,計算機可讀存儲器還包括標示著發(fā)生與至少一個多態(tài)型標志的至少一個等位 基因或至少一個單倍型關聯(lián)的乳腺癌的風險的數據,其中人個體的風險度測量基于人個體 的基因型狀態(tài)與與至少一個多態(tài)型標志的至少一個等位基因或至少一個單倍型關聯(lián)的風 險度的比較。在另一個實施方案中,計算機可讀存儲器還包括標示著至少一個多態(tài)型標 志的至少一個等位基因或至少一個單倍型在多個經診斷患有乳腺癌的個體中的頻率的數 據,以及標示著至少一個多態(tài)型標志的至少一個等位基因或至少一個單倍型在多個參照個體中的頻率的數據,并且其中發(fā)生乳腺癌的風險度基于至少一個等位基因或單倍型在 經診斷患有乳腺癌的個體中的頻率與參照個體中的頻率的比較。在優(yōu)選實施方案中,至 少一個標志選自 rs20051M(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQID NO :8)、rs6001954 (SEQ ID NO :9)和與它們 處于連鎖不平衡中的標志。在另一個優(yōu)選實施方案中,至少一個多態(tài)型標志選自表4中所 示的標志。在另一個方面,本發(fā)明涉及鑒定用于評估對乳腺癌的易感性的標志的方法,所述 方法包括鑒定與rs2005154(SEQ ID NO :1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQ ID NO :8)和 rs6001954 (SEQID NO :9)中的至 少一個處于連鎖不平衡中的至少一個多態(tài)型標志;確定經診斷患有乳腺癌或具有對其的易 感性的個體的樣品的基因型狀態(tài);和確定對照個體的樣品的基因型狀態(tài);其中,與至少一 個等位基因在對照樣品中的頻率相比較,至少一個多態(tài)型的至少一個等位基因在經診斷患 有乳腺癌或具有對其的易感性的個體中的頻率的顯著差異標示著至少一個多態(tài)型對于評 估對乳腺癌的易感性是有用的。可基于乳腺癌患者和對照中特定多態(tài)型標志上的等位基因 的計數的統(tǒng)計分析來評估顯著差異。在一個實施方案中,顯著差異基于小于0. 05的乳腺癌 患者與對照之間計算的P值。在其他實施方案中,顯著差異基于計算的P值的更小的值,例 如小于0. 005,0. 0005或0. 00005的值。在一個實施方案中,與至少一個等位基因在對照樣 品中的頻率相比較,至少一個多態(tài)型的至少一個等位基因在經診斷患有乳腺癌或具有對其 的易感性的個體中的頻率的增加標示著所述至少一個多態(tài)型對于評估增加的對乳腺癌的 易感性是有用的。在另一個實施方案中,與至少一個等位基因在對照樣品中的頻率相比較, 至少一個多態(tài)型中的至少一個等位基因在經診斷患有乳腺癌或具有對乳腺癌易感性的個 體中的頻率的增加標示著所述至少一個多態(tài)型對于評估減少的對乳腺癌的易感性或抗乳 腺癌的保護性是有用的。本發(fā)明還涉及對獲自人個體的核酸樣品進行基因分型的方法,其包括確定至少一 個多態(tài)型標志的至少一個等位基因是否存在于來自個體樣品的核酸樣品中,其中所述至少 一個標志選自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQID NO :4)、rsl2291026 (SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQ ID NO :8)和 rs6001954 (SEQID NO :9)以及與 它們處于連鎖不平衡中的標志,并且其中至少一個等位基因在樣品中的存在的確定標示著 個體中對乳腺癌的易感性。在一個實施方案中,rs20051M等位基因T、rs2184380等位基 因G、rs2224696等位基因T、rs2242503等位基因C、rsl2291(^6等位基因G、rs999737等位 基因C、rs9956546等位基因A、rsll912922等位基因T和rs6001卯4等位基因G的存在的 確定標示著個體中增加的對乳腺癌的易感性。在一個實施方案中,基因分型包括使用側翼 連接至少一個多態(tài)型標志的核苷酸引物對,通過聚合酶鏈式反應(PCR)擴增核酸的區(qū)段, 所述核酸的區(qū)段包括所述至少一個多態(tài)型標志。在另一個實施方案中,使用方法進行基因 分型,所述方法選自等位基因特異性探針雜交、等位基因特異性引物延伸、等位基因特異性 擴增、核酸測序、5'-外切核酸酶降解、分子信標測定、寡核苷酸連接測定、大小分析、單鏈構象多態(tài)型分析(single-stranded conformation analysis)和微陣列技術。在一個實施 方案中,微陣列技術是Molecular Inversion Probe陣列技術或BeadArray技術。在一個 實施方案中,方法包括等位基因特異性探針雜交。在另一個實施方案中,方法包括微陣列技 術。一個優(yōu)選實施方案包括步驟(1)將核酸的拷貝在用于寡核苷酸探針與所述核酸的特 異性雜交的條件下與檢測寡核苷酸探針和增強子寡核苷酸探針接觸;其中(a)檢測寡核苷 酸探針在長度上為5至100個核苷酸并且與核酸的第一區(qū)段特異性雜交,所述核酸的第一 區(qū)段的核苷酸序列由SEQ ID NO :1-562中的任一個提供;(b)檢測寡核苷酸探針在其3' 末端包含可檢測標記并且在其5 ‘末端包含猝滅部分;(c)增強子寡核苷酸在長度上為5至 100個核苷酸并且與核酸序列的第二區(qū)段互補,所述核酸的第二區(qū)段的核苷酸序列相對于 寡核苷酸探針為5',以便當兩個寡核苷酸探針都與核酸雜交時增強子寡核苷酸探針相對 于檢測寡核苷酸探針位于3';和(d)在第一區(qū)段與第二區(qū)段之間存在單個堿基缺口,以便 當寡核苷酸探針和增強子寡核苷酸探針都與核酸雜交時,單個堿基缺口存在于寡核苷酸之 間;( 用內切核酸酶處理核酸,當檢測探針與核酸雜交時,所述內切核酸酶將從檢測探針 的3'末端切割可檢測的標記以釋放游離的可檢測標記;和(3)測量游離的可檢測標記,其 中游離可檢測標記的存在表明所述檢測探針與核酸的第一區(qū)段特異性雜交,以及表明多態(tài) 型位點的序列為檢測探針的互補序列。本發(fā)明的另外的方面涉及就對乳腺癌治療劑的反應的可能性評估個體的方法,其 包括確定至少一個多態(tài)型標志的至少一個等位基因在獲自個體的核酸樣品中或在來源 于個體的基因型數據集中的存在或不存在,其中至少一個多態(tài)型標志選自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)和rs6001954(SEQ ID NO :9)以及與它們處于連鎖不平衡中的 標志,其中所述至少一個標志的至少一個等位基因的存在標示著對治療劑的陽性反應的可 能性。本發(fā)明在另一方面涉及預測經診斷患有乳腺癌的個體的預后的方法,所述方法 包括確定至少一個多態(tài)型標志的至少一個等位基因在獲自個體的核酸樣品中或來源于個 體的基因型數據集中的存在或不存在,其中所述至少一個多態(tài)型標志選自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)和rs6001954(SEQ ID NO :9)以及與它們處于連鎖不平衡中的 標志,其中至少一個等位基因的存在標示著個體的乳腺癌的惡化預后。本發(fā)明的另一個方面涉及監(jiān)控正在經歷乳腺癌治療的個體的治療進展的方 法,所述方法包括確定至少一個多態(tài)型標志的至少一個等位基因在獲自個體的核酸樣 品中或來源于個體的基因型數據集中的存在或不存在,其中至少一個多態(tài)型標志選 自 rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、 rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)和rs6001954 (SEQ ID NO :9)以及與 它們處于連鎖不平衡中的標志,其中至少一個等位基因的存在標示著個體的治療結果。在 一個實施方案中,所述治療是利用手術的治療、利用放射療法的治療或利用藥物施用的治療。本發(fā)明還涉及寡核苷酸探針在用于診斷和/或評估人個體中對乳腺癌的易感性 的試劑的制造中的用途,其中將探針與具有SEQ ID NO :1-562的任一個中所示的核苷酸序 列的核酸的區(qū)段雜交,其中探針在長度上為15至500個核苷酸。在某些實施方案中,探針 在長度上為大約16至大約100個核苷酸。在某些其他實施方案中,探針在長度上為大約20 至大約50個核苷酸。在某些其他實施方案中,探針在長度上為大約20至大約30個核苷酸。乳腺癌表型的各種診斷和分類在本發(fā)明的范圍內。在其廣義上,本發(fā)明涉及任何 乳腺癌表型。在某些實施方案中,乳腺癌包括乳腺癌的任何臨床診斷,包括但不限于浸潤 性導管癌、浸潤性小葉癌、管狀癌或浸潤性或混合浸潤性髓性DCIS (導管原位癌),LCIS (小 葉原位癌)或非浸潤性癌;浸潤性乳腺癌,包括0期、1期、2期(包括加期和2b期)、3期 (包括3a期、北期和3c期)以及4期乳腺癌。在某些實施方案中,乳腺癌表型選自所有乳 腺癌,多原發(fā)性乳腺癌和早發(fā)性乳腺癌。在一些實施方案中,本發(fā)明的標志與具有乳腺癌家 族史的個體的乳腺癌的風險關聯(lián)。在一個這樣的實施方案中,總計家族史(summed family history) (FHS)是與乳腺癌關聯(lián)的表型。在另一個實施方案中,與本發(fā)明的變體關聯(lián)的乳腺 癌是雌激素受體(ER)陽性和/或孕激素受體(PR)陽性乳腺癌。在一個實施方案中,與本 發(fā)明的變體關聯(lián)的乳腺癌是雌激素受體(ER)陽性的。在另一個實施方案中,與本發(fā)明的變 體關聯(lián)的乳腺癌是孕激素受體(ER)陽性的。在一個這樣的實施方案中,本文中描述的與增 加的患乳腺癌的風險或易感性關聯(lián)的標志賦予增加的患ER陽性和/或PR陽性乳腺癌的風 險或易感性。因此,在某些實施方案中,本發(fā)明的至少一個有風險的變體的存在標示著個體 的ER陽性或ra陽性乳腺癌。在本發(fā)明的方法的一些實施方案中,方法中測定的易感性是增加的易感性。在一 個這樣的實施方案中,增加的易感性的特征在于至少1. 10的相對風險度(RR)。在另一個實 施方案中,增加的易感性的特征在于至少1. 20的相對風險度。在另一個實施方案中,增加 的易感性的特征在于至少1. 30的相對風險度。在另一個實施方案中,增加的易感性的特征 在于至少L40的相對風險度。在另一個實施方案中,增加的易感性的特征在于至少1.50 的相對風險度。在其他實施方案中,增加的易感性的特征在于至少1.70的相對風險度。在 另一個實施方案中,增加的易感性的特征在于至少2. 0的相對風險度。其他實施方案的特 征在于至少 1. 10,1. 11、1. 12,1. 13,1. 14,1. 15,1. 16,1. 17,1. 18,1. 19、1. 20、1. 21、1. 22、 1. 23,1. 24,1. 25,1. 26,1. 27,1. 28,1. 29,1. 30,1. 31,1. 32,1. 33,1. 34,1. 35 的相對風險度。 上述這類值的任意值之間的風險度的其他數值也是可能的,并且這類數值也在本發(fā)明的范 圍內。在本發(fā)明的方法的一些實施方案中,方法中測定的易感性是減少的易感性。在一 個這樣的實施方案中,減少的易感性的特征在于小于0.9的相對風險度(I )。在另一個實 施方案中,減少的易感性的特征在于小于0.8的相對風險度(I )。在另一個實施方案中, 減少的易感性的特征在于小于0.7的相對風險度(I )。在另一個實施方案中,減少的易感 性的特征在于小于0. 5的相對風險度(RR)。其他截斷值,例如小于0. 89,0. 88,0. 87,0. 86、 0. 85,0. 84,0. 83,0. 82,0. 81,0. 80,0. 79,0. 78,0. 77,0. 76,0. 75,0. 74,0. 73,0. 72,0. 71、 0. 70等的相對風險度在本發(fā)明的范圍內。本發(fā)明還涉及試劑盒。在一個這樣的方面,本發(fā)明涉及用于評估人個體中對乳腺癌的易感性的試劑盒,所述試劑盒包括選擇性檢測個體的基因組中至少一個多態(tài) 型標志的至少一個等位基因所必需的試劑,所述多態(tài)型標志選自rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)和與它們處于連鎖不平衡中的標 志,其中至少一個等位基因的存在標示著增加的對乳腺癌的易感性。在一個實施方案中, 試劑盒還包括包含至少一個多態(tài)型與對乳腺癌的易感性之間的關聯(lián)數據的數據集。關聯(lián) 數據可以以任何適當的形式例如相對風險度測量0 )、比值比(OR)或本領域技術人員已 知的其他方便的測量存在。在一個實施方案中,數據集存在于計算機可讀介質上。在另一 個方面,本發(fā)明涉及用于評估人個體中對乳腺癌的易感性的試劑盒,所述試劑盒包括選擇 性檢測個體的基因組中至少一個多態(tài)型標志的至少一個等位基因所必需的試劑,其中所述 多態(tài)型標志選自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQID NO :8)和 rs6001954 (SEQ ID N0:9),并且其 中所述至少一個等位基因的存在標示著對乳腺癌的易感性。在一個實施方案中,至少一個 多態(tài)型標志選自表4中所示的標志。在一個實施方案中,試劑盒試劑可包括至少一個連續(xù)寡核苷酸,所述寡核苷酸 與包含至少一個多態(tài)型標志的個體的基因組的片段雜交。在另一個實施方案中,試劑盒 包括至少一對寡核苷酸,所述至少一對寡核苷酸與獲自受試者的基因組區(qū)段的相反鏈 (opposite strand)雜交,其中每一個寡核苷酸引物對經設計用以選擇性擴增包含一個多 態(tài)型的個體的基因組的片段,其中所述多態(tài)型選自表4中定義的多態(tài)型組成的組,其中所 述片段大小為至少20個堿基對。在一個實施方案中,寡核苷酸與個體的基因組完全互補。 在另一個實施方案中,試劑盒還包括用于擴增所述區(qū)段的緩沖液和酶。在另一個實施方案 中,試劑還包括用于檢測所述片段的標記。在一個優(yōu)選實施方案中,試劑盒包括長度為5至100個核苷酸的檢測寡核苷酸探 針;長度為5至100個核苷酸的增強子寡核苷酸探針;和內切核酸酶;其中所述檢測寡核苷 酸探針與其核苷酸序列示于SEQ ID NO :1-562的任一個中的核酸的第一區(qū)段特異性雜交, 并且其中所述檢測寡核苷酸探針在其3'末端包含可檢測標記和在其5'末端包含猝滅部 分;其中所述增強子寡核苷酸在長度上為5至100個核苷酸并且與相對于寡核苷酸探針為 5'的核酸序列的第二區(qū)段互補,以便當這兩個寡核苷酸都與核酸雜交時增強子寡核苷酸 相對于檢測寡核苷酸探針位于3';其中單個堿基缺口存在于第一區(qū)段與第二區(qū)段之間,以 便當寡核苷酸探針和增強子寡核苷酸探針都與核酸雜交時,單個堿基缺口存在于寡核苷酸 之間;以及其中當檢測探針與核酸雜交時,用內切核酸酶處理核酸將從檢測探針的3'末 端切割可檢測標記以釋放游離可檢測標記。根據本發(fā)明的方法還可用于本發(fā)明的其他方法,包括評估在之前經診斷患有乳腺 癌的個體中發(fā)生至少第二原發(fā)性腫瘤的風險的方法,就對乳腺癌治療劑起反應的可能性評 估個體的方法和監(jiān)控經診斷患有乳腺癌并且接受疾病治療的個體的治療進展的方法。本文中描述的與乳腺癌關聯(lián)的標志可全部用于本發(fā)明的不同方面,包括本文中描 述的方法、試劑盒、用途、裝置和程序。在一般意義上,本發(fā)明涉及與本文中定義的LD區(qū)段 C09、LD 區(qū)段 C10A、LD 區(qū)段 10B、LD ±夬 C11A、LD 區(qū)段 C11B、LD 區(qū)段 C14、LD 區(qū)段 C18、LD 區(qū)段C22A和LD區(qū)段C22B的任一個關聯(lián)的標志。在某些實施方案中,本發(fā)明涉及表1或 表4中所示的標志和與它們處于連鎖不平衡中的標志。在某些其他實施方案中,本發(fā)明涉 及表4中所示的標志。在某些其他實施方案中,本發(fā)明涉及標志rs2005154、rs2184380、 rs2224696、rs2242503、rsl2291026、rs999737、rs9956546、rsll912922 和 rs6001954 以及 與它們處于連鎖不平衡中的標志。在一些其他優(yōu)選實施方案中,本發(fā)明涉及rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsl 1912922 (SEQ ID NO :8)和 rs6001954 (SEQ ID NO :9)中的任一個。在某些實施方案中,賦予增加的患乳腺癌的風險的至少一個標志等位基因選自 rs2005154等位基因T、rs2184380等位基因G、rs2224696等位基因T、rs2242503等位基因 C,rsl2291026 等位基因 G、rs999737 等位基因 C、rs9956546 等位基因 A,rsll912922 等位 基因T和rs6001%4等位基因G。在此類實施方案中,等位基因(有風險的等位基因)的存 在標示著增加的患乳腺癌的風險度。在本發(fā)明的某些實施方案中,使用連鎖不平衡測量r2和ID' I測定連鎖不平衡, 所述r2和ID' I給出兩個遺傳成分(例如,多態(tài)型標志)之間的連鎖不平衡(LD)的程度。 針對特定標志的此類測量的某些數值標示著標志處于連鎖不平衡中,如本文中進一步描述 的。在本發(fā)明的一個實施方案中,標志之間的連鎖不平衡(即,標示著標志處于連鎖不平衡 中的LD值)被定義為r2> 0.1。在另一個實施方案中,連鎖不平衡被定義為r2> 0.2。其 它實施方案可包括連鎖不平衡的其它定義,例如r2 > 0. 25、r2 > 0. 3、r2 > 0. 35、r2 > 0. 4、 r2 > 0. 45、r2 > 0. 5、r2 > 0. 55、r2 > 0. 6、r2 > 0. 65、r2 > 0. 7、r2 > 0. 75、r2 > 0. 8、r2 > 0. 85、r2 > 0. 9、r2 > 0. 95、r2 > 0. 96、r2 > 0. 97、r2 > 0. 98 或 r2 > 0. 99。在某些實施方 案中連鎖不平衡還可定義為ID' I >0.2或定義為|D' |>o.3、|D' |>O.4、|D' > 0.5、|d' I >0.6、|D' |>O.7、|D' |>O.8、|D' |>O.9、|D' |>O.95、|D' > 0.98或|D' I >0.99。在某些實施方案中,連鎖不平衡被定義為滿足r2和|D' |兩個標 準,例如r2>0.2并且ID' I >0.8。r2和ID' I的值的其它組合也是可能的并且在本發(fā) 明的范圍內,包括但不限于上文所示的這些參數的值。應當理解,本文中描述的特征的所有組合是被涉及的,即使特征的組合未明確地 見于本文中相同的句子或段落中。這特別地包括本文中公開的全部標志,單獨地或組合地 用于個別分析或在單倍型中,在本文中描述的本發(fā)明的所有方面中的用途。附圖概述本發(fā)明的上述和其它目的、特征和有利方面由以下本發(fā)明的優(yōu)選實施方案的更具 體的描述將變得透徹。
圖1提供了舉例說明利用本文中描述的風險變體的計算機實現(xiàn)系統(tǒng)的圖解。詳述本發(fā)明公開了已發(fā)現(xiàn)與乳腺癌關聯(lián)的多態(tài)型變體和單倍型。已發(fā)現(xiàn)染色體9、10、 11、14、18和22上的多態(tài)型標志上的特定等位基因與發(fā)生乳腺癌的風險關聯(lián)。此類標志和 單倍型用于診斷目的、用于預測藥物反應的方法和用于預測治療進展的方法,如本文中進 一步描述的。本發(fā)明的其他應用包括利用本發(fā)明的多態(tài)型標志來評估對利用手術或放射療法進行的乳腺癌治療的反應的方法以及用于本發(fā)明的方法的試劑盒。定義除非另外指出,否則核酸序列以5'至3'方向從左向右書寫。說明書中引用的數 值范圍包括界定范圍的數字并且包括界定的范圍內的每一個整數或任意非整數分數。除非 另外定義,否則本文中使用的全部技術和科學術語具有與本發(fā)明所屬領域的技術人員的通 常理解相同的意義。在本說明書中下列術語將具有所指出的意義如本文中所描述的“多態(tài)型標志”,有時稱為“標志”意指基因組多態(tài)型位點。每一 個多態(tài)型標志在多態(tài)型位點上具有特定等位基因的至少2個序列差異特征。因此,多態(tài)型 標志的遺傳關聯(lián)性(genetic association)意指存在與該特定多態(tài)型標志的至少一個特定 等位基因的關聯(lián)性。標志可包括基因組中發(fā)現(xiàn)的任何變型的任何等位基因,包括單核苷酸 多態(tài)型(SNP)、小衛(wèi)星或微衛(wèi)星、易位和拷貝數變化(插入、缺失、重復)。多態(tài)型標志在群 體中可具有任何可測量的頻率。為了定位疾病基因,具有高于5-10%的群體頻率的多態(tài)型 標志通常最為有用。然而,多態(tài)型標志還可具有更低的頻率,例如1-5%的頻率或甚至更低 的頻率,特別是拷貝數變異(CNV)。在本發(fā)明書中,術語將被用來包括具有任何群體頻率的 多態(tài)型標志?!暗任换颉币庵溉旧w上給定的基因座(位置)的核苷酸序列。因此多態(tài)型標 志等位基因意指染色體上標志的組成(即,序列)。個體的基因組DNA對于任何給定的多 態(tài)型標志包含2個等位基因,代表每一條染色體上標志的每一個拷貝。本文中使用的核苷 酸的序列碼是A = 1、C = 2、G = 3、T = 4。對于微衛(wèi)星等位基因,將CEPH樣品(Centre d' Etudesdu Polymorphisme Humain、基因組數據庫、CEPH 樣品 1347-02)用作參照,將該 樣品中每一個微衛(wèi)星的較短等位基因設置為0并且根據該參照給其它樣品中所有其它等 位基因編號。因此,例如等位基因1比CEPH樣品中的所述較短等位基因長lbp,等位基因2 比CEPH樣品中的所述較短等位基因長2bp,等位基因3比CEPH樣品中的所述較短等位基 因長3bp等,以及等位基因-1比CEPH樣品中的所述較短等位基因短lbp,等位基因-2比 CEPH樣品中的所述較短等位基因短2bp等?!皢魏塑账岫鄳B(tài)型”或“SNP”是當基因組中特定位置上單個核苷酸在種的成員之間 或個體的成對染色體之間不同時存在的DNA序列差異。大多數SNP多態(tài)型具有2個等位基 因。每一個個體在該情況下對于多態(tài)型的一個等位基因是純合的(即個體的兩個染色體拷 貝在該SNP位置都具有相同的核苷酸)或個體是雜合的(即個體的兩個姊妹染色體包含不 同的核苷酸)。本文中報導的SNP命名是指由美國國家生物技術信息中心(NCBI)分配給每 一個獨特的SNP的官方參考SNP (official Reference SNP) (rs) ID標識符。本文中所述的序列共核苷酸錯讀(Sequence conucleotide ambiguity)是如 IUPAC-IUB所提出的。此類代碼與由EMBL、GenBank和MR數據庫使用的代碼兼容。
權利要求
1.測定人個體中對乳腺癌的易感性的方法,其包括確定至少一個多態(tài)型標志的至少 一個等位基因是否存在于獲自個體的核酸樣品中或來源于個體的基因型數據集中,其中 所述至少一個多態(tài)型標志選自下組rs999737(SEQ ID NO 6), rs2005154 (SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、 rs6001954(SEQ ID NO :9)和與它們處于連鎖不平衡中的標志,并且其中至少一個等位基因 的存在的確定標示著個體中對乳腺癌的易感性。
2.權利要求1的方法,其中所述至少一個多態(tài)型標志選自表4中所示的標志。
3.權利要求1或權利要求2的方法,其中所述至少一個多態(tài)型標志選自rs999737(SEQ ID NO :6)、rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO: 3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)。
4.前述權利要求的任一項的方法,其還包括評估個體中至少一個單倍型的頻率。
5.前述權利要求的任一項的方法,其中由至少一個等位基因或單倍型的存在賦予的易 感性是增加的易感性。
6.權利要求6的方法,其中rs20051M中的等位基因T、rs2184380中的等位基因 G、rs2224696中的等位基因T、rs2242503中的等位基因C、rsl2291026中的等位基因 G、rs999737中的等位基因C、rs9956546中的等位基因A、rsll912922中的等位基因T、 rs6001954中的等位基因G的存在標示著個體中增加的對乳腺癌的易感性。
7.權利要求5或6的方法,其中至少一個等位基因或單倍型的存在標示著相對風險度 (RR)或比值比(OR)為至少1.08的增加的對乳腺癌的易感性。
8.權利要求5或6的方法,其中至少一個等位基因或單倍型的存在標示著相對風險 度(RR)或比值比(OR)為至少1. 09,包括至少1. 10、至少1. 11、至少1. 12、至少1. 13、至少 1. 14、至少1. 15、至少1. 16和至少1. 17的增加的易感性。
9.權利要求1至4的任一項的方法,其中由至少一個等位基因或單倍型的存在賦予的 易感性是減少的易感性。
10.前述權利要求的任一項的方法,其還包括確定不與表4中所示的標志中的任意一 個處于連鎖不平衡中的至少一個對于乳腺癌有風險的變體的至少一個有風險的等位基因 是否存在于包含源自人個體的基因組DNA的樣品中或來源于人個體的基因型數據集中。
11.權利要求1至9的任一項的方法,其包括在包含源自人個體的基因組DNA的樣品中 或來源于人個體的基因型數據集中確定至少一個等位基因在至少2個多態(tài)型標志的每一 個標志中是否存在,其中所述至少一個等位基因在至少2個多態(tài)型標志中的存在標示著增 加的對乳腺癌的易感性。
12.前述權利要求的任一項的方法,其還包括確定至少一個乳腺癌的高外顯率遺傳因 子在獲自個體的核酸樣品中或來源于個體的基因型數據集中的存在或不存在的步驟。
13.權利要求12的方法,其中所述高外顯率遺傳因子是BRCAl、BRCA2、TP53和/或PTEN 中的突變。
14.前述權利要求的任一項的方法,其還包括分析非遺傳信息以進行個體的風險度評 估、診斷或預后。
15.權利要求14的方法,其中所述非遺傳信息選自受試者的年齡、性別、種族、社會經 濟地位、以前的疾病診斷、醫(yī)療史、乳腺癌的家族史、生物化學測量和臨床測量。
16.權利要求11至15的任一項的方法,其還包括計算組合風險度。
17.測定之前經診斷患有乳腺癌的個體中發(fā)生至少第二原發(fā)腫瘤的風險度的方法,所 述方法包括確定至少一個多態(tài)型標志的至少一個等位基因是否存在于獲自個體的核酸樣 品中或來源于個體的基因型數據集中,其中所述至少一個多態(tài)型標志選自rs999737(SEQ ID NO :6)、rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQID NO:3)、rs2242503(SEQ ID NO :4)、rsl2291026 (SEQ ID NO :5)、rs9956546 (SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954 (SEQID NO :9)和與它們處于連鎖不平衡中的標志,以及其中所述至少一個等位基因的存在標示著發(fā)生至少第二原發(fā)腫瘤的風險。
18.權利要求17的方法,其中所述至少一個多態(tài)型標志選自表4中所示的標志。
19.用于評估人個體中對乳腺癌的易感性的試劑盒,所述試劑盒包括用于選擇性檢測個體基因組中至少一個多態(tài)型標志的至少一個等位基因的試劑,其中 所述多態(tài)型標志選自 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO: 5)、rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQID NO :9)和與 它們處于連鎖不平衡中的標志,和包括至少一個多態(tài)型與對乳腺癌的易感性之間的關聯(lián)數據的數據集。
20.權利要求19的試劑盒,其中所述至少一個多態(tài)型標志選自表4中所示的標志。
21.權利要求19或20的試劑盒,其中所述試劑包括至少一個連續(xù)寡核苷酸、緩沖劑和 可檢測標記,所述寡核苷酸與包含至少一個多態(tài)型標志的個體的基因組的片段雜交。
22.權利要求19至21的任一項的試劑盒,其中所述試劑包括至少一對與獲自受試者 的基因組核酸區(qū)段的相反鏈雜交的寡核苷酸,其中每一個寡核苷酸引物對經設計用以選擇 性擴增包括一個多態(tài)型標志的個體的基因組的片段,并且其中所述片段在大小上是至少30 個堿基對。
23.權利要求21或權利要求22的試劑盒,其中所述至少一個寡核苷酸與個體的基因組 完全互補。
24.權利要求19至22的任一項的試劑盒,其中所述試劑盒包括用于檢測個體的基因組 中不超過100個等位基因的試劑。
25.具有用于測定人個體中對乳腺癌的易感性的計算機可執(zhí)行指令的計算機可讀介 質,所述計算機可讀介質包括標示著至少一個多態(tài)型標志的數據;存儲在計算機可讀介質上并且適合于用處理器執(zhí)行以針對至少一個多態(tài)型標志測定 發(fā)生乳腺癌的風險度的例程,其中所述至少一個多態(tài)型標志選自rs999737(SEQ ID NO 6), rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO:4)、rsl2291026(SEQID NO :5)、rs9956546 (SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)、 rs6001954(SEQID NO :9)以及與它們處于連鎖不平衡中的標志。
26.權利要求25的計算機可讀介質,其中所述計算機可讀介質包含標示著至少2個多態(tài)型標志的數據。
27.權利要求25或權利要求沈的計算機可讀介質,其中所述至少一個多態(tài)型標志選自 表4中所示的標志。
28.權利要求25至27的任一項的計算機可讀介質,其中所述至少一個多態(tài)型標 志選自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ IDNO :2)、rs2224696 (SEQ ID NO: 3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQID NO :7)、rsl1912922(SEQ ID NO :8)和 rs6001954(SEQ ID NO :9)。
29.權利要求25至28的任一項的計算機可讀介質,其還包括表示包含2個或更多個多 態(tài)型標志的至少一個單倍型的數據。
30.用于測定人個體中的乳腺癌的遺傳指標的裝置,其包括處理器,計算機可讀存儲器,其具有適合在處理器上執(zhí)行用以就至少一個多態(tài)型標志分 析至少一個人個體的標志和/或單倍型信息的計算機可執(zhí)行指令,所述多態(tài)型標志選 自 rs999737(SEQ ID NO :6)、rs2005154(SEQID NO 1)、rs2184380(SEQ ID NO :2)、 rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546 (SEQID NO :7)、rsll912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)以及與它 們處于連鎖不平衡中的標志,和產生基于所述標志或單倍型信息的輸出,其中所述輸出包括至少一個標志或單倍型的 風險度測量作為人個體的乳腺癌的遺傳指標。
31.權利要求30的裝置,其中計算機可讀存儲器還包括標示發(fā)生與至少一個多態(tài)型標 志的至少一個等位基因或至少一個單倍型關聯(lián)的乳腺癌的風險度的數據,并且其中人個體 的風險度測量基于人個體的基因型狀態(tài)與發(fā)生與至少一個等位基因或至少一個單倍型關 聯(lián)的乳腺癌的風險度的比較。
32.權利要求31的裝置,其中計算機可讀存儲器還包括標示著多個經診斷患有乳腺癌 的個體中至少一個多態(tài)型標志的至少一個等位基因或至少一個單倍型的頻率的數據,和標 示著多個參照個體中至少一個多態(tài)型標志的至少一個等位基因或至少一個單倍型的頻率 的數據,并且其中發(fā)生與至少一個等位基因或單倍型關聯(lián)的乳腺癌的風險度基于經診斷患 有乳腺癌的個體與參照個體中至少一個等位基因或單倍型的頻率的比較。
33.權利要求30至32的任一項的裝置,其中至少一個標志或單倍型包括選自表4中所 示的標志的至少一個標志。
34.權利要求30至33的任一項的裝置,其中至少一個標志或單倍型選自下組 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、 rs2224696(SEQ ID NO :3)、rs2242503 (SEQID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)。
35.權利要求30至34的任一項的裝置,其中風險度測量以比值比(OR)或相對風險度 (RR)來表征。
36.鑒定用于評估對乳腺癌的易感性的標志的方法,所述方法包括a.鑒定至少一個多態(tài)型標志,所述多態(tài)型標志與選自下組的至少一個標志處于連鎖 不平衡中rs999737(SEQ ID NO :6)、rs2005154 (SEQID NO 1)、rs2184380 (SEQ ID NO:2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQID NO :7)、rsl1912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9);b.測定經診斷患有乳腺癌或具有對乳腺癌易感性的個體的樣品針對至少一個多態(tài)型 標志的基因型狀態(tài);和c.測定對照個體的樣品針對至少一個多態(tài)型標志的基因型狀態(tài);其中經診斷患有乳腺癌或具有對乳腺癌易感性的個體中至少一個多態(tài)型中的至少一 個等位基因的頻率與對照樣品中所述至少一個等位基因的頻率相比的顯著差異標示著所 述至少一個多態(tài)型對于評估對乳腺癌的易感性是有用的。
37.權利要求36的方法,其中經診斷患有乳腺癌或具有對乳腺癌易感性的個體的至少 一個多態(tài)型中的至少一個等位基因的頻率與對照樣品中所述至少一個等位基因的頻率相 比較的增加標示著所述至少一個多態(tài)型對于評估增加的對乳腺癌的易感性是有用的。
38.權利要求36或權利要求37的方法,其中經診斷患有乳腺癌或具有對乳腺癌易感性 的個體中至少一個多態(tài)型中的至少一個等位基因的頻率與對照樣品中所述至少一個等位 基因的頻率相比較的減少標示著所述至少一個多態(tài)型對于評估減少的對乳腺癌的易感性 或對抗乳腺癌的保護作用是有用的。
39.對獲自人個體的核酸樣品進行基因分型的方法,所述方法包括確定至少一個多 態(tài)型標志的至少一個等位基因是否存在于來自個體樣品的核酸樣品中,其中所述至少一 個標志選自 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO: 2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)、rs6001954 (SEQID NO :9)以及與它 們處于連鎖不平衡中的標志,并且其中所述至少一個等位基因在樣品中的存在的確定標示 著個體中對乳腺癌的易感性。
40.權利要求39的方法,其中rs20051M中的等位基因T、rs2184380中的等位基因 G、rs2224696中的等位基因T、rs2242503中的等位基因C、rsl2291026中的等位基因G、 rs999737中的等位基因C、rs9956546中的等位基因A、rsll912922中的等位基因T或 rs6001954中的等位基因G的存在的確定標示著個體的增加的對乳腺癌的易感性。
41.就對乳腺癌治療劑的反應的可能性評估個體的方法,所述方法包括確定至 少一個多態(tài)型標志的至少一個等位基因是否存在于獲自個體的核酸樣品中或來源于 個體的基因型數據集中,其中所述至少一個多態(tài)型標志選自rs999737(SEQ ID NO 6)、rs2005154(SEQ ID NO : 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、 rs2242503(SEQID NO :4)、rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)以及與它們處于連鎖不平衡中的標 志,其中所述至少一個標志的所述至少一個等位基因的存在標示著對所述治療劑的陽性反 應的可能性。
42.預測經診斷患有乳腺癌的個體的預后的方法,所述方法包括確定至少一個多態(tài) 型標志的至少一個等位基因是否存在于獲自個體的核酸樣品中或來源于個體的基因型數 據集中,其中所述至少一個多態(tài)型標志選自rs999737(SEQ ID NO 6), rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO 9)以及與它們處于連鎖不平衡中的標志,其中所述至少一個等位基 因的存在標示著個體的乳腺癌的惡化預后。
43.監(jiān)控正在經歷乳腺癌治療的個體的治療進展的方法,所述方法包括確定至少一個 多態(tài)型標志的至少一個等位基因是否存在于獲自個體的核酸樣品或來源于個體的基因型 數據集中,其中所述至少一個多態(tài)型標志選自rs999737(SEQ ID NO 6), rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQID NO: 4), rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、rsll912922(SEQ ID NO :8)、 rs6001954(SEQ ID NO :9)以及與它們處于連鎖不平衡中的標志,其中所述至少一個等位基 因的存在標示著個體的治療結果。
44.權利要求41至43的任一項的方法,其中所述至少一個多態(tài)型標志選自表4中所示 的標志。
45.寡核苷酸探針在用于診斷和/或評估人個體中對乳腺癌的易感性的試劑的制造中 的用途,其中所述探針與具有SEQ ID NO :1-562的任意一個中所示的核苷酸序列的核酸的 區(qū)段雜交,并且其中所述探針在長度上為15至500個核苷酸。
46.測定人個體中對乳腺癌的易感性的方法,所述方法包括獲得關于人個體的核酸序列數據鑒定至少一個多態(tài)型標志的至少一個等位基因,所 述標志選自 rs999737(SEQ ID NO :6)、rs2005154 (SEQID NO :1)、rs2184380 (SEQ ID NO: 2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546 (SEQID NO :7)、rsll912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)以及與它 們處于連鎖不平衡中的標志,其中所述至少一個多態(tài)型標志的不同等位基因與人中對乳腺 癌的不同易感性關聯(lián),和根據核酸序列數據測定對乳腺癌的易感性。
47.權利要求46的方法,其包括獲得關于至少2個多態(tài)型標志的核酸序列數據,所 述標志選自 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO: 2)、rs2224696(SEQ ID NO :3)、rs2242503 (SEQ ID NO :4)、rsl2291026 (SEQ ID NO :5)、 rs9956546 (SEQID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)以及與它 們處于連鎖不平衡中的標志。
48.權利要求46或權利要求47的方法,其中易感性的測定包括將核酸序列數據與包含 至少一個多態(tài)型標志與對乳腺癌的易感性之間的關聯(lián)數據的數據庫相比較。
49.權利要求48的方法,其中所述數據庫包括針對至少一個多態(tài)型標志的對乳腺癌的 易感性的至少一個風險度測量。
50.權利要求48的方法,其中所述數據庫包括查找表,其包括針對至少一個多態(tài)型標 志的至少一個病癥的至少一個風險度測量。
51.權利要求46至50的任一項的方法,其中獲取核酸序列數據包括獲取源自人個體的 生物樣品和分析該樣品的核酸中的至少一個多態(tài)型標志的序列。
52.權利要求51的方法,其中分析至少一個多態(tài)型標志的序列包括確定所述至少一個 多態(tài)型標志的至少一個等位基因的存在或不存在。
53.權利要求46至50的任一項的方法,其中獲取核酸序列數據包括從既存記錄獲取核 酸序列信息。
54.權利要求46至53的任一項的方法,其還包括將易感性報告給至少一個實體,所述 實體選自個體、個體的監(jiān)護人、基因服務提供商、醫(yī)生、醫(yī)療機構和醫(yī)療保險公司。
55.權利要求46至M的任一項的方法,其中所述至少一個多態(tài)型標志選自表4中所列 的標志組成的組。
56.權利要求46至55的任一項的方法,其中所述至少一個多態(tài)型標志選自 rs999737(SEQ ID NO :6)、rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、 rs2224696(SEQ ID NO :3)、rs2242503 (SEQID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)。
57.前述權利要求的任一項的方法、試劑盒、用途、介質或裝置,其中針對乳腺癌等位基 因的至少一個風險性等位基因的存在的確定預示著雌激素受體陽性或孕激素受體陽性乳 腺癌。
58.前述權利要求的任一項的方法、試劑盒、用途、介質或裝置,其中標志之間的連鎖不 平衡由連鎖不平衡測量r2和/或ID' ι的特定數值表征。
59.前述權利要求的任一項的方法、試劑盒、用途、介質或裝置,標志之間的連鎖不平衡 由為至少0.2的r2值表征。
60.前述權利要求的任一項的方法、試劑盒、用途、介質或裝置,其中所述人個體是包括 歐洲人祖先的祖先。
全文摘要
本發(fā)明涉及經測定為乳腺癌的易感性變體的某些遺傳變型。描述了疾病處治包括診斷增加的對乳腺癌的易感性的方法,預測對治療的反應的方法和使用變體預測預后的方法。本發(fā)明還涉及用于本發(fā)明的方法的試劑盒。
文檔編號C12Q1/68GK102144036SQ200980134453
公開日2011年8月3日 申請日期2009年7月3日 優(yōu)先權日2008年7月7日
發(fā)明者P·蘇勒姆, S·斯達賽 申請人:解碼遺傳學私營有限責任公司