專利名稱:用于檢測生物學(xué)特征的系統(tǒng)和方法
相關(guān)申請的交叉參考根據(jù)35U.S.C.§119(e)的規(guī)定,本申請要求2004年6月5日提交的美國臨時專利申請?zhí)?0/577,416的優(yōu)先權(quán),該申請被全文納入本文作為參考。根據(jù)35U.S.C.§119(e)的規(guī)定,本申請還要求2003年9月29日提交的美國臨時專利申請?zhí)?0/507,381的優(yōu)先權(quán),該申請被全文納入本文作為參考。根據(jù)35U.S.C.§119(e)的規(guī)定,本申請還要求2003年9月29日提交的美國臨時專利申請?zhí)?0/507,445的優(yōu)先權(quán),該申請被全文納入本文作為參考。本申請是2004年6月4日提交的美國專利申請?zhí)?0/861,216的部分繼續(xù)申請,該申請被全文納入本文作為參考。本發(fā)明還是2004年6月4日提交的美國專利申請?zhí)?0/861,177的部分繼續(xù)申請,該申請被全文納入本文作為參考。
1.發(fā)明領(lǐng)域本發(fā)明涉及鑒定生物學(xué)標(biāo)本中的生物學(xué)特征如疾病的系統(tǒng)和方法。
2.發(fā)明背景合理治療疾病的第一步是按照疾病的類別來評價患者,將其結(jié)果用來確定患者患有何種類型的疾病以及用來預(yù)測患者對各種療法的反應(yīng)。該方法的有效性取決于分類的質(zhì)量。至少對癌癥而言,用來分析腫瘤細(xì)胞的DNA、RNA或蛋白質(zhì)的微陣列方法的出現(xiàn)開始細(xì)化并改進(jìn)了癌細(xì)胞的分類。參見,例如,Golub等,1999,Science286,p.531。
此外,van′t Veer等,2002,Nature 415,p.530中舉例說明了這種“分子序型分析”是如何改進(jìn)癌分類的。Van′t Veer等顯示,在外科手術(shù)切除乳腺腫瘤之后進(jìn)行的乳腺腫瘤基因表達(dá)序型分析的結(jié)果能被用來預(yù)測哪些患者將發(fā)生臨床轉(zhuǎn)移(腫瘤擴(kuò)展到其它部位并在該處發(fā)展成繼發(fā)性腫瘤)。對個體乳腺癌患者的治療方法根據(jù)各種標(biāo)準(zhǔn)進(jìn)行選擇,例如腫瘤擴(kuò)展程度(包括確定腫瘤大小)、癌細(xì)胞是否已經(jīng)擴(kuò)展到輔助淋巴結(jié)以及已經(jīng)有多少淋巴結(jié)受到侵襲、以及是否存在遠(yuǎn)距離的臨床轉(zhuǎn)移。在無轉(zhuǎn)移證據(jù)的婦女中,治療該病的主要方法是切除腫瘤和進(jìn)行放療。不幸的是,其中一些患者后來會發(fā)展為臨床轉(zhuǎn)移。因此,需要確定那些婦女,她們在手術(shù)之后需要進(jìn)一步(“輔助”)的治療以顯微沉積出可能已經(jīng)從原發(fā)性腫瘤發(fā)生擴(kuò)散的癌細(xì)胞。參見,例如,Caldas和Aparicio,2002,Nature 415,p.484;和Goldhirsch等,1998,J.Natl.Cancer Inst.90,p.1601。
輔助療法使用藥學(xué)試劑,如雌激素調(diào)節(jié)劑或者能通過血流到達(dá)癌細(xì)胞的細(xì)胞毒性藥物。這種治療通常有毒副作用。鑒定出可能需要這種治療的婦女通常取決于各種臨床和組織病理學(xué)指標(biāo)(例如,患者的年齡、癌細(xì)胞與其正常對應(yīng)物相似的程度、‘腫瘤級別’、以及癌細(xì)胞是否表達(dá)雌激素受體)。然而,即便綜合考慮,這些指標(biāo)的預(yù)見性還是很差。因此,為拯救數(shù)目巨大但比例很小的生命,多數(shù)已經(jīng)通過手術(shù)和放療治療的患者會繼續(xù)接受不必要而且有毒的輔助治療。
van′t Veer等(2002,Nature 415,p.530)的研究結(jié)果和其它研究結(jié)果開始用于分類方法,該方法試圖將患者的生物學(xué)標(biāo)本(如腫瘤)分成多個生物樣品種類(如需要輔助療法的乳腺癌和不需要輔助療法的乳腺癌)。由AvonFoundation、Millennium Pharmaceuticals、歐洲腫瘤研究與治療組織(EuropeanOrganization for Research and Treatment of Cancer)以及國立腫瘤研究所(National Cancer Institute)等公司和組織資助的許多臨床試驗(yàn)已經(jīng)發(fā)現(xiàn)并認(rèn)可了這種分類方法。參見,例如,Branca,2003,Science 300,p.238。
對于乳腺癌,可以使用許多的生物學(xué)分類方法。例如,Ramaswamy等,2003,Nature Genetics 33,p.49提供能夠?qū)⒃l(fā)性腺癌基因區(qū)別于轉(zhuǎn)移性腺癌基因的表達(dá)圖。Su等,2001,Cancer Research 61,p.7388描述了用大規(guī)模RNA序型分析和受檢控的機(jī)械學(xué)習(xí)算法(supervised machine-learningalgorithm)來構(gòu)建第一代分子分類方法以鑒定前列腺癌、乳腺癌、肺癌、卵巢癌、結(jié)腸直腸癌、腎癌、胰癌、膀胱癌/輸尿管癌和胃食管癌。Su等的分子分類方法被用來診斷原發(fā)性腫瘤的來源未確定的轉(zhuǎn)移性癌癥。Wilson等,2002,American Journal of Pathology 161,提供了與節(jié)陽性(node-positive)乳腺癌患者的低存活率有關(guān)的HER2/neu陽性組織的表達(dá)特征圖。Richer等,2002,The Journal of Biological Chemistry 277,p.5209,提供了過度表達(dá)孕酮受體-A(PR-A)的人乳腺癌細(xì)胞的遺傳特征和過度表達(dá)孕酮受體-B(PR-B)的人乳腺癌細(xì)胞的遺傳特征。如Richer等(2002)所述,一種或另一種PR異形體過量可能導(dǎo)致腫瘤的預(yù)后性和激素反應(yīng)性特征不同于具有等摩爾兩種PR異形體水平的腫瘤。Gruvberger等,2001,Cancer Research 61,p.5979,提供了一種基于DNA微陣列數(shù)據(jù)的分子分類,它可根據(jù)雌激素受體狀態(tài)來區(qū)分腫瘤。
上述生物學(xué)分類方法僅是許多現(xiàn)有的乳腺癌生物學(xué)分類方法的例子。此外,乳腺癌僅代表了許多感興趣的生物學(xué)分類中的一種。其它代表性的生物學(xué)分類在廣義上包括癌癥的診斷,甚至更廣義上包括疾病的診斷。上述這些生物學(xué)分類方法中每種方法存在的一個問題是它們都需要專門的輸入(例如,格式化的微陣列數(shù)據(jù))。因此,在表征生物學(xué)標(biāo)本時必需采用每種生物學(xué)分類方法專門的輸入和輸出。由于這種障礙,醫(yī)學(xué)護(hù)理專業(yè)人員通常最多僅使用這些生物學(xué)分類方法中的有限的幾種。
因此,考慮到上述原因,本領(lǐng)域需要的是可能導(dǎo)致生物學(xué)分類方法用于將標(biāo)本分入生物類別的改進(jìn)方法。
本發(fā)明所討論或引用的參考資料并不能解釋為承認(rèn)這些參考資料是本發(fā)明的現(xiàn)有技術(shù)。
3.發(fā)明概述本發(fā)明的第一個實(shí)施方案提供了具有中央處理單元和與該中央處理單元連接的存儲器的計算機(jī)。該存儲器儲存接收數(shù)據(jù)的指令,其中該數(shù)據(jù)包括多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征,該特征在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得。該存儲器還儲存計算多個模型中的模型的指令,其中該模型以模型記分為特征,該模型標(biāo)記代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的一種生物學(xué)特征的存在或缺失情況。計算該模型包括用多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定模型記分。該存儲器還包括重復(fù)所述計算指令一次或多次從而計算多個模型的指令。該存儲器還儲存使各個計算出的模型記分進(jìn)行通信的指令。
在一些實(shí)施方案中,兩個或更多個模型記分通過所述通信指令進(jìn)行通信,且這些兩個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。在一些實(shí)施方案中,五個或更多個模型記分通過所述通信指令進(jìn)行通信,且其中所述五個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
在一些實(shí)施方案中,所述接收數(shù)據(jù)的指令包括通過因特網(wǎng)等廣域網(wǎng)從遠(yuǎn)程計算機(jī)接收所述數(shù)據(jù)的指令。在一些實(shí)施方案中,所述通信指令包括通過因特網(wǎng)等廣域網(wǎng)將每個所述模型記分傳送到遠(yuǎn)程計算機(jī)的指令。
在一些實(shí)施方案中,當(dāng)所述模型記分在分值的第一范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為具有多個模型中的模型所代表的生物學(xué)特征;而當(dāng)所述模型記分在分值的第二范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為不具有該模型所代表的生物學(xué)特征。在一些實(shí)施方案中,所述生物學(xué)特征是疾病,如癌癥(例如乳腺癌、肺癌、前列腺癌、結(jié)腸直腸癌、卵巢癌、膀胱癌、胃癌或直腸癌等)。
在一些實(shí)施方案中,所述多個模型包括以第一模型記分為特征的第一模型和以第二模型記分為特征的第二模型;且一個或多個特征被用來計算所述第一模型記分的細(xì)胞成分的身份不同于其一個或多個特征被用來計算所述第二模型記分的細(xì)胞成分的身份。
在一些實(shí)施方案中,用來確定所述多個模型中的模型的所述模型記分的一種或多種細(xì)胞成分的所述一個或多個特征中的特征包括所述物種的所述試驗(yàn)生物或該物種生物的所述試驗(yàn)生物學(xué)標(biāo)本中的一種或多種細(xì)胞成分的豐度。在一些例子中,所述物種是人。在一些例子中,所述試驗(yàn)生物學(xué)標(biāo)本是來自腫瘤、血液、骨骼、乳腺、肺、前列腺、結(jié)腸直腸、卵巢、膀胱、胃或直腸的樣品的活檢組織或其它形式。
在一些實(shí)施方案中,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或該物種生物的所述生物學(xué)標(biāo)本中至少100、至少500、至少5,000或1,000-20,000種細(xì)胞成分的細(xì)胞成分豐度。在一些實(shí)施方案中,所述多種細(xì)胞成分中的細(xì)胞成分是mRNA、cRNA或cDNA。
在本發(fā)明的在一些實(shí)施方案中,所述一種或多種細(xì)胞成分中的細(xì)胞成分是核酸或核糖核酸,且所述所述細(xì)胞成分的一個或多個特征中的特征是通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所有或部分細(xì)胞成分的轉(zhuǎn)錄狀態(tài)獲得的。在一些實(shí)施方案中,所述一種或多種細(xì)胞成分中的細(xì)胞成分是蛋白質(zhì),且所述所述細(xì)胞成分的一個或多個特征中的特征是在通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中所述細(xì)胞成分的翻譯狀態(tài)獲得的。在一些實(shí)施方案中,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是用同位素親和標(biāo)記然后用獲自試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本的樣品進(jìn)行細(xì)胞成分串聯(lián)質(zhì)譜分析確定的。在一些實(shí)施方案中,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是通過測量試驗(yàn)生物的樣品或試驗(yàn)生物學(xué)標(biāo)本中的細(xì)胞成分的活性或翻譯后修飾確定的。
在一些實(shí)施方案中,所述生物學(xué)特征是藥物敏感性。在一些實(shí)施方案中,用所述計算指令計算模型記分的多個模型共同代表兩個或更多個生物學(xué)特征的存在或缺失情況。在一些實(shí)施方案中,所述兩個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。在一些實(shí)施方案中,所述兩個或更多個生物學(xué)特征包括第一疾病和第二疾病。
在一些實(shí)施方案中,用所述計算指令計算模型記分的多個模型共同代表五個或更多個生物學(xué)特征的存在或缺失情況。在一些例子中,所述五個或更多個生物學(xué)特征中的每一個代表不同的癌來源。在一些例子中,所述五個或更多個生物學(xué)特征包括第一疾病和第二疾病。
在一些實(shí)施方案中,用所述計算指令計算模型記分的多個模型共同代表2-20個生物學(xué)特征的存在或缺失情況。在一些實(shí)施方案中,所述2-20個生物學(xué)特征中的每個生物學(xué)特征是癌來源。在一些實(shí)施方案中,所述2-20個生物學(xué)特征包括第一疾病和第二疾病。
本發(fā)明的另一方面包括具有中央處理單元和與該中央處理單元連接的存儲器的計算機(jī)。該存儲器儲存接收數(shù)據(jù)的指令。該數(shù)據(jù)包括在桌一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。該存儲器還儲存(ii)計算多個模型的指令。其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的一種生物學(xué)特征的存在或缺失情況。計算所述多個模型中的單個模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定與該單個模型有關(guān)的模型記分。該存儲器還儲存使所述計算指令計算出的各個模型記分進(jìn)行通信的指令。
本發(fā)明的另一方面包括與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品。該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制。該計算機(jī)程序機(jī)制包括接收數(shù)據(jù)的指令。該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。該計算機(jī)程序機(jī)制還包括計算多個模型中的模型的指令。該模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的存在或缺失情況,且計算該模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分。該計算機(jī)程序產(chǎn)品還包括重復(fù)所述計算指令一次或多次從而計算多個模型的指令。更進(jìn)一步地,該計算機(jī)程序產(chǎn)品包括使所述計算指令計算出的各個模型記分進(jìn)行通信的指令。
本發(fā)明的另一方面提供了一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品。該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制。該計算機(jī)程序機(jī)制包括接收數(shù)據(jù)的指令。該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。該計算機(jī)程序機(jī)制還包括計算多個模型的指令。在該多個模型中的每個模型以模型記分為特征,該模型標(biāo)記代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的存在或缺失情況,且計算所述多個模型中的單個模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定與該單個模型有關(guān)的模型記分。該計算機(jī)程序機(jī)制還包括使所述計算指令計算出的各個模型記分進(jìn)行通信的指令。
本發(fā)明的另一方面包括一種獲得數(shù)據(jù)的方法。該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。該方法還包括計算多個模型中的模型。該模型以模型記分為特征,該模型標(biāo)記代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的存在或缺失情況。計算該模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分。該方法還包括重復(fù)所述計算指令一次或多次從而計算所述多個模型。該方法還包括還包括使所述計算指令計算出的各個模型記分進(jìn)行通信的指令。
本發(fā)明的再一方面包括接收數(shù)據(jù)。該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。計算多個模型。所述多個模型中的每個模型以模型記分為特征,該模型標(biāo)記代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的存在或缺失情況,且計算所述多個模型中的單個模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定與該單個模型有關(guān)的模型記分。然后,使所述計算計算出的各個模型記分進(jìn)行通信。
本發(fā)明的再一方面提供了具有中央處理單元和與該中央處理單元連接的存儲器的計算機(jī)。該存儲器儲存發(fā)送數(shù)據(jù)的指令。該數(shù)據(jù)包括在桌一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。該存儲器還儲存接收多個模型記分的指令。每個模型記分對應(yīng)于多個模型中的模型。所述多個模型中的每個模型以模型記分為特征,該模型標(biāo)記代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的存在或缺失情況,且計算該模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分。
本發(fā)明的另一方面提供了具有中央處理單元和與該中央處理單元連接的存儲器的計算機(jī)。該存儲器儲存接收數(shù)據(jù)的指令,其中該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面。該存儲器還儲存計算多個模型中的模型的指令。該計算指令產(chǎn)生所述模型的模型特征,該模型特征表明所述物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。計算所述模型的指令包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征該模型。該存儲器還儲存重復(fù)所述計算指令一次或多次從而計算多個模型的指令。該存儲器還儲存使所述計算指令計算出的各個模型特征進(jìn)行通信的指令。在一些實(shí)施方案中,該接收數(shù)據(jù)的指令包括通過因特網(wǎng)等廣域網(wǎng)從遠(yuǎn)程計算機(jī)接收所述數(shù)據(jù)的指令。在一些實(shí)施方案中,所述生物樣品種類是疾病,如癌癥。
本發(fā)明的另一方面提供了具有中央處理單元和與該中央處理單元連接的存儲器的計算機(jī)。該存儲器儲存接收數(shù)據(jù)的指令。該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面。該存儲器還儲存計算多個模型的指令。該計算產(chǎn)生所述多個模型中的每個模型的模型特征,該模型特征表明所述物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。該計算包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述多個模型中的各個模型。該存儲器還儲存使所述計算指令計算出的各個模型特征進(jìn)行通信的指令。
本發(fā)明的再一方面提供了一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品。該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制。該計算機(jī)程序機(jī)制還包括接收數(shù)據(jù)的指令。該數(shù)據(jù)包括在桌一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面。該計算機(jī)程序機(jī)制還包括計算多個模型中的模型的指令。這種計算產(chǎn)生該模型的模型特征,該模型特征表明所述物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。計算該模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征該模型。該計算機(jī)程序機(jī)制還包括重復(fù)所述計算指令一次或多次從而計算多個模型的指令。該計算機(jī)程序機(jī)制還包括使所述計算指令計算出的各個模型特征進(jìn)行通信的指令。
本發(fā)明的再一方面包括一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品。該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制。該計算機(jī)程序機(jī)制包括接收數(shù)據(jù)的指令。該數(shù)據(jù)包括在桌一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面。該計算機(jī)程序機(jī)制還包括計算多個模型的指令。該計算產(chǎn)生所述多個模型中的每個模型的模型特征,該模型特征表明所述物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。該計算包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述多個模型中的各個模型。該計算機(jī)程序機(jī)制還包括使所述計算指令計算出的各個模型特征進(jìn)行通信的指令。
本發(fā)明的另一方面提供了一種方法,該方法包括接收數(shù)據(jù)。這種數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面。計算多個模型中的模型。該計算產(chǎn)生該模型的模型特征,該模型特征表明所述物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。計算該模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述模型。重復(fù)所述計算指令一次或多次從而計算所述多個模型。然后,使所述計算計算出的各個模型特征進(jìn)行通信。
本發(fā)明的再一方面包括接收數(shù)據(jù)。該數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面。計算多個模型。這種計算產(chǎn)生所述多個模型中的每個模型的模型特征,該模型特征表明所述物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。該計算包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述多個模型中的每個模型。使計算出的各個模型特征進(jìn)行通信。
4.附圖簡述
圖1顯示了本發(fā)明的一個實(shí)施方案中的對生物學(xué)標(biāo)本進(jìn)行分類的計算機(jī)系統(tǒng)。
圖2顯示了本發(fā)明的一個實(shí)施方案中的用多個分類器來分類標(biāo)本的處理步驟。
圖3顯示了本發(fā)明的一個實(shí)施方案中儲存多個模型(分類器)的數(shù)據(jù)結(jié)構(gòu)。
在這幾幅附圖中相同的參考數(shù)字表示相應(yīng)的部分。
5.發(fā)明詳述圖1顯示了按照本發(fā)明一個實(shí)施方案所操作的系統(tǒng)10。圖3顯示了用來儲存本發(fā)明所使用的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。圖2顯示了根據(jù)本發(fā)明一個實(shí)施方案用來檢測多個模型的處理步驟。用圖2所示的處理步驟,這種模型能夠確定標(biāo)本是否具有一個或多個生物學(xué)特征。為揭示本發(fā)明的優(yōu)點(diǎn)和特征,將在本部分參考這些附圖。代表性的生物學(xué)特征公開在下文的5.4部分。
系統(tǒng)10包括至少一臺計算機(jī)20(圖1)。計算機(jī)20包括標(biāo)準(zhǔn)組件,包括中央處理單元22、儲存程序模塊和數(shù)據(jù)結(jié)構(gòu)的存儲器24、用戶輸入/輸出裝置26、通過通訊網(wǎng)絡(luò)(未顯示)將計算機(jī)20與系統(tǒng)10中的其它計算機(jī)或其它計算機(jī)連接的網(wǎng)絡(luò)接口卡28,以及一個或多個使這些組件相互連接的總線33。用戶輸入/輸出裝置26包括一個或多個用戶輸入/輸出組件,如鼠標(biāo)36、顯示器38和鍵盤34。計算機(jī)20還包括受磁盤控制器30控制的磁盤32。存儲器24和磁盤32一起儲存本發(fā)明所使用的程序模塊和數(shù)據(jù)結(jié)構(gòu)。
存儲器24包括許多本發(fā)明所使用的模塊和數(shù)據(jù)結(jié)構(gòu)。應(yīng)理解,在該系統(tǒng)操作的任何時刻,儲存在存儲器24中的模塊和/或數(shù)據(jù)結(jié)構(gòu)的一部分被儲存在隨機(jī)存取存儲器中,而該模塊和/或數(shù)據(jù)結(jié)構(gòu)的另一部分被儲存在非易失性存儲器32中。在一典型的實(shí)施方案中,存儲器24包括操作系統(tǒng)50。操作系統(tǒng)50包括處理各種基礎(chǔ)系統(tǒng)服務(wù)和進(jìn)行硬件依賴性任務(wù)的程序。存儲器24還包括用于文件管理的文件系統(tǒng)(未顯示)。在一些實(shí)施方案中,該文件系統(tǒng)是操作系統(tǒng)50的組件。
盡管已經(jīng)詳細(xì)描述了如本發(fā)明所述的示例性計算機(jī)系統(tǒng)的概況,按本發(fā)明一個實(shí)施方案使用的示例性數(shù)據(jù)結(jié)構(gòu)的概況仍列于下文的5.1部分。然后,在5.2部分描述了采用這種示例性數(shù)據(jù)結(jié)構(gòu)來檢測多個模型的詳細(xì)處理步驟。在5.3部分提供了用本發(fā)明獲得的結(jié)果的例子。
5.1.示例性數(shù)據(jù)結(jié)構(gòu)用于本發(fā)明的一個實(shí)施方案的示例性數(shù)據(jù)結(jié)構(gòu)示于圖1。模型檢測應(yīng)用軟件52使用運(yùn)行時間數(shù)據(jù)庫120。運(yùn)行時間數(shù)據(jù)庫120被模制,從而使其包括運(yùn)行時間分析模式300和運(yùn)行時間模型模式200。這些模式描述了在運(yùn)行時間數(shù)據(jù)庫120中的許多不同類型的表的結(jié)構(gòu)。在優(yōu)選的實(shí)施方案中,數(shù)據(jù)庫120是任何形式的數(shù)據(jù)存儲設(shè)備,包括但不限于平面文件、關(guān)系數(shù)據(jù)庫(SQL)和OLAP數(shù)據(jù)庫(MDX和/或其變化形式)。在一些具體的實(shí)施方案中,數(shù)據(jù)庫120是分級OLAP立方塊。在一些具體的實(shí)施方案中,數(shù)據(jù)庫120包括不作為立方塊儲存,而是具有限定層級的量綱表的星模式。此外,在一些實(shí)施方案中,數(shù)據(jù)庫120具有層級,該層級在基礎(chǔ)數(shù)據(jù)庫(underlying database)或數(shù)據(jù)庫模式中未被明顯取用(例如量綱表不分級排列)。在一些實(shí)施方案中,數(shù)據(jù)庫120是Oracle、MS Access 95/97/2000或者更高版本、Informix、Sybase、Interbase、IBM DB2、Paradox、dBase、SQLAnywhere、Ingres、MsSQL、MS SQL server、ANSI Level 2或PostgreSQL等格式的數(shù)據(jù)庫。在一些實(shí)施方案中,運(yùn)行時間數(shù)據(jù)庫120包括運(yùn)行時間模型模式200和運(yùn)行時間分析模式300。
運(yùn)行時間模型模式200規(guī)定的一種基礎(chǔ)的表類型是模型202。模型202的目標(biāo)是試圖確定生物學(xué)標(biāo)本(例如腫瘤)具有生物學(xué)特征(例如,乳腺癌、肺癌等)的可能性。如此,每個模型202都與一種生物學(xué)特征關(guān)聯(lián)。在本發(fā)明中,生物學(xué)特征是一種或多種生物學(xué)標(biāo)本所表現(xiàn)出的任何可區(qū)分的表型。例如,在本發(fā)明的一種應(yīng)用中,每個生物學(xué)特征是指來源或原發(fā)性腫瘤類型。據(jù)估計,大約有4%癌癥患者帶有轉(zhuǎn)移性腫瘤,而其原發(fā)性腫瘤的來源得不到確定。參見,例如,Hillen,200,Postgrad. Med.J.76,p.690。有時,即便在病理分析之后仍然不清楚轉(zhuǎn)移性腫瘤的原發(fā)部位。因此,預(yù)測這些癌癥其中一些的原始來源腫瘤部位是一重要的臨床目標(biāo)。對于未知原始來源的腫瘤,典型的生物樣品種類包括前列腺癌、乳腺癌、結(jié)腸直腸癌、肺癌(腺癌和鱗狀細(xì)胞癌)、肝癌、胃食管癌、胰腺癌、卵巢癌、腎癌以及膀胱/輸尿管癌,在美國,它們總共占所有癌癥相關(guān)死亡的約70%。參見,例如,Greenlee等,2001,CA Cancer J.Clin.51,p.15。下文的5.4部分描述了本發(fā)明所述生物樣品種類的其它例子。
為了闡述如何用模型202確定生物學(xué)標(biāo)本是否是一類生物樣品的成員的可能性,考慮特定模型202代表生物樣品具有肺癌的可能性的情況。進(jìn)一步地,假設(shè)將該肺癌模型用于生物學(xué)標(biāo)本且檢測結(jié)果表明該生物學(xué)標(biāo)本具有肺癌的可能性很高。在一些實(shí)施方案中,運(yùn)行時間數(shù)據(jù)庫120中的每個模型202包括唯一辨別各個模型的模型標(biāo)識符110。此外,每個模型202規(guī)定一次或多次計算204(也稱為檢測)。在一些實(shí)施方案中,模型202規(guī)定2-1,000次計算。在更優(yōu)選的實(shí)施方案中,每個模型202規(guī)定3-500次計算,3-100次計算,或3-50次計算。
模型202的每次計算204規(guī)定某種細(xì)胞成分的身份。例如,在一種情況下,每次單一計算204規(guī)定第一細(xì)胞成分和第二細(xì)胞成分。舉例來說,考慮模型202中包括四次計算204的情況,如表1所述表1示例性計算204
因此,計算1規(guī)定第一細(xì)胞成分AAA和第二細(xì)胞成分DDD,依此類推。
除了規(guī)定計算204,每個模型202還規(guī)定用于模型中每次計算204的計算算法212。當(dāng)模型202中的計算204被計算時,計算算法212規(guī)定細(xì)胞成分的豐度值之間的操作關(guān)系。細(xì)胞成分的豐度值取自用模型202來分類的生物學(xué)標(biāo)本。
計算算法212的一個例子是比值,該比值的分子由生物學(xué)標(biāo)本中第一細(xì)胞成分的豐度確定,而該比值的分母由生物學(xué)標(biāo)本中第二細(xì)胞成分的豐度確定。在這種情況下,當(dāng)按照計算算法212計算計算204時,計算算法212規(guī)定取兩種細(xì)胞成分豐度值的比例,而計算204規(guī)定所用的試驗(yàn)生物學(xué)標(biāo)本細(xì)胞成分的實(shí)際身份。例如,一種計算算法212規(guī)定取第一細(xì)胞成分的豐度作為分子,取第二細(xì)胞成分的豐度作為分母。該計算算法212被用于示例性模型202中的每次計算204。在表1的計算1中,示例性計算算法212規(guī)定取基因AAA和基因DDD的比例,在計算2中,該計算算法212規(guī)定取基因CCC和基因DDD的比例,依此類推。
除第一細(xì)胞成分和第二細(xì)胞成分的比例外,本發(fā)明包括多種計算算法212。例如,在一些實(shí)施方案中,計算算法212可以規(guī)定將第一細(xì)胞成分的豐度值乘以第二細(xì)胞成分的豐度值(A×B)。實(shí)際上,計算算法212可規(guī)定將頭兩種細(xì)胞成分的豐度值的乘積乘以第三種細(xì)胞成分的豐度值(A×B×C)?;蛘撸嬎闼惴?12可以規(guī)定將頭兩種細(xì)胞成分的豐度值的乘積除以第三細(xì)胞成分的豐度值[(A×B)/C]]。如這些實(shí)施例所述,計算算法是對任意細(xì)胞成分組合的任何數(shù)學(xué)運(yùn)算或是數(shù)學(xué)運(yùn)算的組合(例如乘、除、對數(shù)等)。計算算法212不表明用來計算任何給定計算204的細(xì)胞成分的實(shí)際身份。另一方面,計算204規(guī)定了一組細(xì)胞成分但不表明用來計算該計算204的細(xì)胞成分之間的運(yùn)算關(guān)系。將計算算法212用于計算204,可以按照本發(fā)明的方法對計算204進(jìn)行計算。
在一些實(shí)施方案中,每次單一的計算204包括模型標(biāo)識符110,該標(biāo)識符規(guī)定了所述計算所屬的模型202。此外,每次計算包括閾值114。例如,在一些實(shí)施方案中,每次計算204包括低閾值和高閾值。這種實(shí)施方案中,通過將模型202的計算算法212用于上述計算計算出了模型202的每次計算204。當(dāng)計算出的計算204低于低閾值時該計算為負(fù)。當(dāng)計算出的計算204高于高閾值時該計算為正。當(dāng)計算出的計算204在低閾值和高閾值之間時該計算表征為不確定。為了了解如何計算出這種閾值的更多信息以及模型和它們在本發(fā)明中的應(yīng)用的更詳細(xì)的實(shí)施例,可參見Anderson的題為“用于臨床診斷的分析基因表達(dá)數(shù)據(jù)的系統(tǒng)和方法”(Systems and Methods forAnalyzing Gene Expression Date For Clinical Diagnostics)的共同未決美國專利申請序列號60/507,381以及2004年6月4日提交的Moraleda和Anderson的題為“用于臨床診斷的分析基因表達(dá)數(shù)據(jù)的系統(tǒng)和方法”(Systems andMethods for Analyzing Gene Expression Date For Clinical Diagnostics)的序列號待審批的美國專利申請。
為闡述使用高和低閾值的計算(檢測),考慮表1計算1的情況,其中生物學(xué)標(biāo)本中基因AAA的豐度([AAA])為1,000,DDD的豐度([DDD])為100。此外,計算1規(guī)定低閾值為0.8,高閾值為5。模型202的計算算法212包括計算1,其指明取第一基因和第二基因的比例。當(dāng)將該計算算法212用于計算204時,計算出的計算([AAA]/[DDD]的比值)的值為10(1,000/100)。由于該比值大于比值的高閾值,所以計算204表征為“正”。
在另一個實(shí)施例中,生物學(xué)標(biāo)本中[AAA]的值為70,而生物學(xué)標(biāo)本中[DDD]的值為100。此外,計算1規(guī)定低閾值為0.8而高閾值為5。此時,[AAA]/[DDD]的比值為0.7(70/100)。由于該比值低于低閾值,所以計算表征為“負(fù)”。
在再一個實(shí)施例中,生物學(xué)標(biāo)本中[AAA]的值為120,而生物學(xué)標(biāo)本中[DDD]的值為100。此外,計算1規(guī)定低閾值為0.8而高閾值為5。此時,[AAA]/[DDD]的比值為1.2(120/100)。由于該比值大于低閾值但小于高閾值,所以計算表征為“不確定”。
除了計算算法212,每個模型202包括規(guī)定如何將給定模型202的計算204組合以表征(計算)該模型的集合算法214。集合算法214的一個例子是投票法(voting scheme),其中,如果模型中的多數(shù)計算在計算時先正后負(fù),則模型202表征為具有高概率或可能性。例如,考慮將計算算法212用于上表1的計算的情況,計算1和2為正,計算3為不確定,而計算4為負(fù)。當(dāng)結(jié)果是這樣時,用由表1的計算組成的模型檢測的生物將被表征為有可能具有與該模型有關(guān)的生物學(xué)特征。
每個模型202任選包含模型前置條件116。模型前置條件116規(guī)定在將計算算法212用于模型的計算204之前需要被滿足的要求。模型前置條件116的一個例子是要求在計算與前置條件116有關(guān)的模型202的計算204之前計算另一預(yù)定模型202的計算204。例如,考慮模型202是肺癌而另一模型202是肺腺癌的情況。肺癌模型被用來確定特定腫瘤是否是肺癌陽性。此時,肺腺癌模型202可具有要求在運(yùn)行肺腺癌模型之前運(yùn)行肺癌模型的前置條件116。前置條件116還可要求在運(yùn)行肺腺癌模型之前肺癌檢測模型為正。
除模型202的表類型外,運(yùn)行時間模型模式200規(guī)定層級形式的其它表。該層級的頂端為程序類型220。每個程序類型220規(guī)定計算算法212和集合算法214。而且,每個程序類型220任選包括程序標(biāo)識符221。
一個或多個模型202可以與程序類型220關(guān)聯(lián)。當(dāng)模型202與程序類型220關(guān)聯(lián)時,該模型使用由該程序類型220規(guī)定的計算算法212和集合算法214。在一實(shí)施例中,模型202包括該模型所使用的程序220的程序標(biāo)識符221。該實(shí)施例中,模型202不需要包括將被該模型使用的計算算法212和集合算法214的明確信息,這是因?yàn)檫@些信息可以從由模型202中的程序標(biāo)識符域221指定的程序220獲得。
如圖1所示和上面的討論,每個模型202包括一次或多次計算204。事實(shí)上,在一些實(shí)施方案中,每次計算204被儲存在運(yùn)行時間模型模式200中發(fā)現(xiàn)的表的其它形式中。每次計算204規(guī)定一種或多種細(xì)胞成分的豐度值(未顯示)。此外,每次計算204可任選包括指示與計算204關(guān)聯(lián)的模型202的模型標(biāo)識符110。例如,模型標(biāo)識符110可指示與模型202-1關(guān)聯(lián)的計算204-1。此外,每次計算204可具有計算標(biāo)識符112和閾值114。當(dāng)每次計算204包括模型標(biāo)識符110時,運(yùn)行時間數(shù)據(jù)庫120的模型202不需要明確描述作為該模型一部分的計算204。如果需要給定模型202的計算204,可通過在運(yùn)行時間數(shù)據(jù)庫120的計算204中尋找具有與給定模型匹配的模型標(biāo)識符110的計算來鑒定它們。
如圖1所示和上面的討論,每個模型202包括一個或多個模型前置條件224。事實(shí)上,每個模型前置條件224是在運(yùn)行時間模型模式200中發(fā)現(xiàn)的數(shù)據(jù)結(jié)果的另一種形式。每個前置條件224規(guī)定在運(yùn)行與該前置條件關(guān)聯(lián)的模型之前需要滿足的前置條件116。此外,每個模型前置條件224可任選包括指示與該前置條件關(guān)聯(lián)的模型202的模型標(biāo)識符110。例如,模型標(biāo)識符110可指示與模型202-1關(guān)聯(lián)的前置條件224-1。當(dāng)每個前置條件224包括模型標(biāo)識符110時,運(yùn)行時間數(shù)據(jù)庫120的模型202不需要明確描述作為該模型一部分的前置條件224。此時,為確定用于給定模型202的前置條件224,可在運(yùn)行時間數(shù)據(jù)庫120的前置條件中尋找具有與給定模型匹配的模型標(biāo)識符110的前置條件。
5.2.示例性處理步驟在5.1部分介紹了本發(fā)明一個實(shí)施方案的示例性數(shù)據(jù)結(jié)構(gòu)。本部分描述了如何將這種新的數(shù)據(jù)結(jié)構(gòu)用來檢測多個模型202。在5.3部分將描述這種計算的結(jié)果。
步驟402在步驟402中獲得了細(xì)胞成分特征數(shù)據(jù)。通常,細(xì)胞成分特征數(shù)據(jù)的形式是細(xì)胞成分豐度數(shù)據(jù)文件,其由遠(yuǎn)程臨床醫(yī)師提交。在一些例子中,當(dāng)提交數(shù)據(jù)文件時,計算機(jī)20通過網(wǎng)絡(luò)接口卡28接收該文件。在典型的實(shí)施方案中,遠(yuǎn)程計算機(jī)通過因特網(wǎng)之類的廣域網(wǎng)(WAN)將數(shù)據(jù)傳遞到計算機(jī)20。
細(xì)胞成分特征數(shù)據(jù)文件通常包括多種細(xì)胞成分中的每種細(xì)胞成分的生物狀態(tài)的多個方面(也稱為性狀)。例如,在一些實(shí)施方案中,細(xì)胞成分特征文件包含給定生物學(xué)標(biāo)本或生物體的一些細(xì)胞成分的豐度數(shù)據(jù)。該細(xì)胞成分豐度數(shù)據(jù)文件可以包含給定生物學(xué)標(biāo)本的100種以上細(xì)胞成分的數(shù)據(jù)。事實(shí)上,該細(xì)胞成分豐度數(shù)據(jù)文件可以包含給定生物學(xué)標(biāo)本的500種以上、1,000種以上、10,000種以上或15,000種以上細(xì)胞成分的數(shù)據(jù)。在一些實(shí)施方案中,該細(xì)胞成分豐度數(shù)據(jù)文件包含多個生物學(xué)標(biāo)本的數(shù)據(jù)。這些實(shí)施方案中,該數(shù)據(jù)文件明確指示了哪些生物學(xué)標(biāo)本與文件中每種細(xì)胞成分的豐度水平相關(guān)。
在一些實(shí)施方案中,細(xì)胞成分特征數(shù)據(jù)文件的格式設(shè)定為Affymetrix(Santa Clara,加利福尼亞)GeneChip探針陣列(例如用AffymetrixMAS4。0軟件和U95A或U133基因芯片生成的具有CHP延伸的Affymetrix芯片文件)、Agilent(Palo Alto,加利福尼亞)DNA微陣列、Amersham(LittleChalfont,英格蘭)CodeLink微陣列、Imaging Research(St.Catharines,加拿大)的陣列Vision文件格式、Axon(Union City,加利福尼亞)GenePix文件格式、BioDiscovery(Marina del Rey,加利福尼亞)ImaGene文件格式、Rosetta(Kirkland,Washington)基因表達(dá)組成語言(GEML)文件格式、Incyte(Palo Alto,加利福尼亞)GEM微陣列或Molecular Dynamics(Sunnyvale,加利福尼亞)cDNA微陣列。
在一些實(shí)施方案中,上述細(xì)胞成分特征文件包含經(jīng)過處理的生物學(xué)標(biāo)本的微陣列圖象。例如,在一個這種實(shí)施方案中,該文件包含陣列上出現(xiàn)的每種細(xì)胞成分的細(xì)胞成分豐度信息、任選的背景信號信息以及任選的描述所述單一細(xì)胞成分所使用的探針的有關(guān)注釋信息。在一些實(shí)施方案中,細(xì)胞成分豐度的測量是下文5.5部分所述的轉(zhuǎn)錄狀態(tài)的測量。
在本發(fā)明的在一些實(shí)施方案中,除轉(zhuǎn)錄狀態(tài)之外的生物狀態(tài)的方面(性狀),例如翻譯狀態(tài)、活性狀態(tài),或生物狀態(tài)的混合方面表現(xiàn)在上述細(xì)胞成分特征文件中。參見,例如下文的5.6部分。例如,在一些實(shí)施方案中,該細(xì)胞成分特征文件包含所研究的生物學(xué)標(biāo)本中各種蛋白質(zhì)的蛋白質(zhì)水平。在一些具體實(shí)施方案中,該細(xì)胞成分特征文件包含所研究的生物學(xué)標(biāo)本的組織中的細(xì)胞成分的量或濃度、一種或多種生物學(xué)標(biāo)本組織中的細(xì)胞成分的活性水平、或生物學(xué)標(biāo)本一種或多種細(xì)胞成分的修飾(例如磷酸化)狀態(tài)。
在本發(fā)明的一個方面,生物學(xué)標(biāo)本的基因的表達(dá)水平是通過測量與所研究的生物學(xué)標(biāo)本的一個或多個細(xì)胞中的基因相對應(yīng)的至少一種細(xì)胞成分的量來確定的。在一實(shí)施方案中,所測量的至少一種細(xì)胞成分的量包括該生物學(xué)標(biāo)本的一個或多個細(xì)胞中存在的至少一種RNA種類的豐度。這種豐度可通過包括使基因轉(zhuǎn)錄物陣列接觸來自該生物的一個或多個細(xì)胞的RNA或接觸從其衍生的cDNA的方法來測量?;蜣D(zhuǎn)錄物陣列包括含有附著的核酸或核酸模擬物的表面。該核酸或核酸模擬物能夠與所述RNA種類或與從該RNA種類衍生的cDNA雜交。在一具體實(shí)施方案中,RNA的豐度是通過使基因轉(zhuǎn)錄物陣列接觸來自所研究的生物的一個或多個細(xì)胞的RNA或接觸衍生自該RNA的核酸來測量的,從而所述基因轉(zhuǎn)錄物陣列包括位置可尋址的含有附著的核酸或核酸模擬物的表面,其中所述核酸或核酸模擬物能夠與所述RNA種類或與從該RNA種類衍生的核酸雜交。
在一些實(shí)施方案中,上述細(xì)胞成分特征文件包含多個基因的基因表達(dá)數(shù)據(jù)(或與多個基因相對應(yīng)的細(xì)胞成分)。在一實(shí)施方案中,所述多個基因包括至少5個基因。在另一實(shí)施方案中,所述多個基因包括至少100個基因、至少1,000個基因、至少20,000個基因、或30,000個以上的基因。在一些實(shí)施方案中,所述多個基因包括5,000-20,000個基因。
在步驟402的一些實(shí)例中,豐度數(shù)據(jù)被預(yù)加工。在一些實(shí)施方案中,這種預(yù)加工包括標(biāo)準(zhǔn)化,其中將給定生物學(xué)標(biāo)本的所有細(xì)胞成分特征值除以對該生物學(xué)標(biāo)本所測得的細(xì)胞成分豐度中值。在一些實(shí)施方案中,將給定生物學(xué)標(biāo)本或生物的所有細(xì)胞成分豐度值除以對該生物學(xué)標(biāo)本所測得的細(xì)胞成分豐度值的25%和75%的平均值。
當(dāng)細(xì)胞成分豐度測量的來源是微陣列時,當(dāng)不匹配的探針測量值大于較佳匹配探針時可獲得負(fù)的細(xì)胞成分豐度值。當(dāng)主要基因(代表一種細(xì)胞成分)以低水平表達(dá)時通常會發(fā)生這種情況。在一些典型的情況下,某給定細(xì)胞成分豐度文件中有30%的豐度值是負(fù)的。在本發(fā)明的預(yù)處理的一些例子中,所有等于或小于0的細(xì)胞成分豐度值被固定的值代替。當(dāng)細(xì)胞成分豐度測量的來源是Affymetrix GeneChip MAS 5.0時,在某些實(shí)施方案中,可用固定值,如20或100代替負(fù)的細(xì)胞成分豐度值。更通常的情況是,在一些實(shí)施方案中,所有等于或小于0的細(xì)胞成分豐度值被給定生物學(xué)標(biāo)本中細(xì)胞成分豐度的中值,即0.001-0.5之間的固定值(例如0.1或0.01)代替。在一些實(shí)施方案中,所有的細(xì)胞成分豐度值被該值的變換形式替代,所述變換形式在中間值和0之間,與被替代的細(xì)胞成分豐度值的絕對值成反比。在一些實(shí)施方案中,所有小于0的細(xì)胞成分豐度值被基于其原始負(fù)值大小的函數(shù)所確定的值代替。在一些例子中,該函數(shù)是S形函數(shù)。
在一些實(shí)施方案中,計算機(jī)20上的網(wǎng)頁或計算機(jī)20可尋址的網(wǎng)頁促進(jìn)了步驟402。該網(wǎng)頁使遠(yuǎn)程使用者能夠選擇運(yùn)行哪個模型并促進(jìn)細(xì)胞成分?jǐn)?shù)據(jù)文件從遠(yuǎn)程地點(diǎn)傳遞到計算機(jī)20上。在一些實(shí)施方案中,該網(wǎng)頁能夠傳遞任何以下信息要求計算一個或多個模型的實(shí)驗(yàn)室的地址;應(yīng)用細(xì)胞成分特征數(shù)據(jù)文件運(yùn)行的一個或多個模型(套件)的身份;辨別提交的標(biāo)本的唯一標(biāo)本標(biāo)識符;辨別用來測量細(xì)胞成分特征數(shù)據(jù)的微陣列格式的標(biāo)識符;辨別用細(xì)胞成分特征數(shù)據(jù)文件表示的患者的標(biāo)識符;對從中獲得細(xì)胞成分特征數(shù)據(jù)而形成細(xì)胞成分特征文件的生物學(xué)標(biāo)本的描述;和/或要求在生物學(xué)標(biāo)本上運(yùn)行模型的醫(yī)生或其它健康護(hù)理人員的身份。
在一些實(shí)施方案中,不是使用基于網(wǎng)頁的界面,或者除了使用基于網(wǎng)頁的界面之外,在遠(yuǎn)端發(fā)信計算機(jī)上運(yùn)行軟件模塊(未顯示)。這種軟件模塊使遠(yuǎn)程醫(yī)生能夠使用文件傳送協(xié)議、網(wǎng)間協(xié)議或其它類型的文件共享技術(shù)將必需的數(shù)據(jù)上傳到計算機(jī)20中。在一些實(shí)施方案中,步驟402(以及步驟424)中計算機(jī)20之間的所有通訊用秘鑰密碼學(xué)、雜亂信號、報文摘譯和/或公鑰算法等本領(lǐng)域已知的加密算法加密。這種技術(shù)公開在,例如,Kaufman,Network Security,1995,Prentice-Hall,New Jersey;以及Schneier,Applied CryptographyProtocols,Algorithms,and Source Code in C,第二版,John-Wiley & Sons,Inc.,它們分別被全文納入本文作為參考。
步驟404和406
在步驟404中做出應(yīng)該運(yùn)行(計算)哪個模型202的決定。例如,在一些情況下,將運(yùn)行時間數(shù)據(jù)庫120內(nèi)的模型202分成若干套模型。在一實(shí)施例中,有一套用來檢測未知原發(fā)性癌的模型,和另一套專門設(shè)計來檢測肺癌的模型等。每一套模型202包括一個或多個模型。因此,在一些例子中,步驟404包括確定哪套模型202是用戶詢問的。在步驟406中,選擇來自在步驟404中選擇的一系列模型的模型。
步驟408步驟408是任選的。在一些實(shí)施方案中,不運(yùn)行步驟408而運(yùn)行在步驟402中遠(yuǎn)程用戶指定的所有模型(例如,所選套件中的所有模型)。在任選的步驟408中,需要確定步驟406中選擇的模型202是否已經(jīng)滿足模型前置條件116。例如,在一些實(shí)施方案中,模型前置條件116可規(guī)定運(yùn)行模型202,該模型202是較寬生物樣品種類的指示(例如更加常見的表型),而不規(guī)定必須在某個模型202之前運(yùn)行步驟406的最后一種情況中選擇的是較窄生物樣品種類的指示的模型。舉例來說,作為特定肺癌形式的指示的第一模型202的模型前置條件116可要求通常作為肺癌指示的第二模型202在運(yùn)行第一模型之前檢測為正。此外,第二模型202可以包括模型前置條件116,以要求作為癌癥指示的第三模型在運(yùn)行第二模型之前檢測為正。在一些實(shí)施方案中,模型前置條件116包括要求多個模型中的另一個模型在檢測所選模型之前鑒定為負(fù)、為正或者不確定。下文是如何用前置條件116分層排列模型202的其它一些例子。
在第一個例子中,模型B的前置條件要求在運(yùn)行模型B之前模型A有特定的結(jié)果。很有可能,模型A運(yùn)行但沒有得到模型B所要求的特定結(jié)果。在這種情況下,模型B不運(yùn)行。然而,如果模型A運(yùn)行后產(chǎn)生模型B要求的特定結(jié)果則模型B運(yùn)行。這個例子可表示為如果(A=結(jié)果),則B可運(yùn)行。
在另一個例子中,模型C的前置條件116要求在運(yùn)行模型C之前模型A有特定的結(jié)果或模型B有特定的結(jié)果。這個例子可表示為如果((A=第一結(jié)果)或(B=第二結(jié)果)),則C可運(yùn)行。
舉例來說,模型C可要求在運(yùn)行模型C之前運(yùn)行模型A并檢測癌癥為陽性或者運(yùn)行模型B并檢測肺癌為陽性?;蛘?,模型C的前置條件116可要求模型A和模型B都得到特定的結(jié)果如果((A=第一結(jié)果)和(B=第二結(jié)果)),則C可運(yùn)行。
在另一個例子中,模型D的前置條件116要求在運(yùn)行模型D之前模型C有特定的結(jié)果。而模型C的前置條件116又要求在運(yùn)行模型C之前模型A有第一結(jié)果,同時模型B有第二結(jié)果。這個例子可表示為如果((A=第一結(jié)果)和(B=第二結(jié)果)),則C可運(yùn)行如果(C=第三結(jié)果),則D可運(yùn)行。
這些例子闡述了提供模型前置條件116的優(yōu)點(diǎn)。由于本發(fā)明新的前置條件116,模型202可分層排列,其中在運(yùn)行其它模型202之前運(yùn)行特定的模型202。通常,第一次運(yùn)行模型202設(shè)計來將生物學(xué)標(biāo)本分成較寬的生物樣品種類(如寬的表型)。一旦將生物樣品大致分類后,就可運(yùn)行模型202以將初步分類進(jìn)一步細(xì)分成較窄的生物樣品種類(例如更加具體的生物樣品種類)。
當(dāng)步驟406中選擇的模型202的模型前置條件116得到滿足時(408-是),則過程控制進(jìn)行到步驟410。當(dāng)模型202的模型前置條件116未得到滿足時(408-否),過程控制回到步驟406,并從在步驟404中鑒定的系列模型中選出另一個模型202。
步驟410模型中的計算204在步驟410中選擇。計算204指示兩個或更多個細(xì)胞成分,該細(xì)胞成分的特征(細(xì)胞成分的生物狀態(tài)的若干方面)將在被研究的生物學(xué)標(biāo)本中檢測。例如,計算204可以規(guī)定基因AAA和BBB的細(xì)胞成分豐度值。在一些實(shí)施方案中,計算指定了至少一種在標(biāo)本中上調(diào)或下調(diào)的細(xì)胞成分。相對于不具有由模型202代表的生物學(xué)特征和/或具有不同生物特征的生物學(xué)標(biāo)本,該標(biāo)本具有在步驟406的最后一種情況中選擇的模型202代表的生物學(xué)特征。
相比具有其它生物學(xué)特征的標(biāo)本,在具有某些生物學(xué)特征的標(biāo)本中上調(diào)或下調(diào)的細(xì)胞成分可通過常規(guī)的試驗(yàn)或在公開的參考資料中獲得。例如,Su等,2001,Cancer Research 61,p.7388提供了(i)在特定的原發(fā)性腫瘤類型中上調(diào)以及(ii)預(yù)測這種腫瘤類型的基因的名稱。Su等鑒定了表2中所列細(xì)胞成分和前列腺腫瘤的表達(dá)。
表2Su等,在前列腺腫瘤中上調(diào)的細(xì)胞成分
在一些實(shí)施方案中,在測量了多種細(xì)胞成分的豐度之后,當(dāng)具有某生物學(xué)特征的生物學(xué)標(biāo)本的桌細(xì)胞成分的豐度大于具有這種生物學(xué)特征的生物學(xué)標(biāo)本的至少60%、至少70%、至少80%或至少90%的細(xì)胞成分的豐度時,則認(rèn)為該細(xì)胞成分在具有這種生物學(xué)特征的該生物學(xué)標(biāo)本內(nèi)被上調(diào)。在一些實(shí)施方案中,當(dāng)具有某生物學(xué)特征的生物學(xué)標(biāo)本的某細(xì)胞成分的平均豐度高于不具有這種生物學(xué)特征的生物學(xué)標(biāo)本的該細(xì)胞成分的豐度時,則認(rèn)為相對于該不具有這種生物學(xué)特征的生物學(xué)標(biāo)本,這種細(xì)胞成分在具有這種生物學(xué)特征的標(biāo)本內(nèi)被上調(diào)。在一些實(shí)施方案中,在測量了多種細(xì)胞成分的豐度之后,當(dāng)具有某生物學(xué)特征的生物學(xué)標(biāo)本內(nèi)某細(xì)胞成分的豐度小于具有這種生物學(xué)特征的生物學(xué)標(biāo)本的至少40%、至少30%、至少20%或至少10%的細(xì)胞成分的豐度時,則認(rèn)為該細(xì)胞成分在具有這種生物學(xué)特征的標(biāo)本內(nèi)被下調(diào)。在一些實(shí)施方案中,當(dāng)具有某生物學(xué)特征的生物學(xué)標(biāo)本的桌細(xì)胞成分的平均豐度低于不具有這種生物學(xué)特征的生物學(xué)標(biāo)本的該細(xì)胞成分的豐度時,則認(rèn)為相對于該不具有這種生物學(xué)特征的生物樣品或生物,這種細(xì)胞成分在具有這種生物學(xué)特征的生物樣品內(nèi)被下調(diào)。
在一些實(shí)施方案中,計算204中規(guī)定的細(xì)胞成分各自是核酸或核糖核酸,且生物學(xué)標(biāo)本的這些細(xì)胞成分的豐度是通過測量該生物學(xué)標(biāo)本的全部或部分第一細(xì)胞成分和第二細(xì)胞成分的轉(zhuǎn)錄狀態(tài)獲得的。在一些實(shí)施方案中,計算204中規(guī)定的細(xì)胞成分各自獨(dú)立地是完整的mRNA、cRNA或cDNA或其片段。在一些實(shí)施方案中,計算204中規(guī)定的細(xì)胞成分各自是蛋白質(zhì),且這些細(xì)胞成分的豐度是通過測量全部或部分細(xì)胞成分的翻譯狀態(tài)獲得的。在一些實(shí)施方案中,計算204中規(guī)定的細(xì)胞成分的豐度是通過測量該細(xì)胞成分的活性或翻譯后修飾確定的。
步驟412在步驟412中,在步驟410最后一種情況中選擇的計算204指定的細(xì)胞成分特征值是從步驟402中提交的細(xì)胞成分特征獲得的。因此,在計算204規(guī)定基因AAA和基因BBB的例子中,從細(xì)胞成分豐度文件獲得了基因AAA和基因BBB的細(xì)胞成分的豐度值(或由該計算指定的一些其它特征)。
步驟414在步驟414中,根據(jù)所述模型指定的計算算法212計算步驟410最后一種情況中選擇的計算204。例如,計算算法可規(guī)定取示例性計算204指定的第一細(xì)胞成分與示例性計算204指定的第二細(xì)胞成分的豐度值的比值。按照計算算法214對計算204進(jìn)行計算的其它的例子已經(jīng)在上文的5.1部分得到描述。這些例子描述了在計算204得到計算之后如何基于計算出的計算值相對于該計算的閾值對其進(jìn)行表征。例如,如果計算出的計算204的值大于該計算的最小值,則該計算出的計算204為正。
步驟416
在步驟416中,最后一次計算204的計算結(jié)果被儲存。在一些實(shí)施方案中,儲存包括儲存模型標(biāo)識符,其識別運(yùn)行計算204的模型202;模型版本標(biāo)識符,其指示運(yùn)行模型202哪個版本;表達(dá)數(shù)據(jù)文件標(biāo)識符,其識別細(xì)胞成分特征數(shù)據(jù)文件,該文件提供用來對計算204進(jìn)行計算的細(xì)胞成分特征值;與計算204相關(guān)聯(lián)的計算標(biāo)識符112(圖1)以及計算結(jié)果代碼(如″極可能″、″不可能″等)。
步驟418在步驟418中,確定模型202中的所有計算204是否已經(jīng)根據(jù)該模型的計算算法212得到計算。如果不是(418-否),過程控制回到步驟410并從模型202中選出另一個計算(檢測)202進(jìn)行計算。如果是(418-是),則網(wǎng)絡(luò)控制進(jìn)行到步驟420。
步驟420在步驟420中,按照由模型202指定的集合算法214匯集對步驟406最后一種情況中選出的模型所進(jìn)行的所有計算(檢測)204。這種匯集得到該模型的模型特征。這種模型特征表明所述物種的所述試驗(yàn)生物或該物種生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員。
在一實(shí)施方案中,收集表318中每行的結(jié)果代碼,該代碼具有與在步驟406的最后一種情況中選出的模型202的模型標(biāo)識符相匹配的模型標(biāo)識符。例如,考慮模型202包括5次計算204的情況。在步驟414中計算每次計算204并儲存結(jié)果。當(dāng)閾值與每次計算204相關(guān)時,計算的結(jié)果可作為計算是否為正、負(fù)或不確定的指示。
考慮模型202包括5次計算(檢測)204的情況。計算結(jié)果表318中將有5行,一行對應(yīng)于5次計算204中的每一次。這5行中的每一行將包括結(jié)果代碼。在這種用戶情況中,每個結(jié)果代碼要么為正、要么為負(fù),或者是不確定。另外,與模型202相關(guān)的集合算法將規(guī)定如何組合這5個結(jié)果代碼來表征該模型202。例如,該集合算法可規(guī)定用投票法組合這5個結(jié)果代碼,其中,如果模型中計算出的計算為正多于為負(fù),則認(rèn)為模型202是正的(表示為正)。
集合算法214的一個例子是投票法,其中,當(dāng)計算出的模型的計算為正多于為負(fù)時,則該模型202為正。例如,考慮將計算算法212用于上表1的計算的情況,且計算1和2為正,計算3不確定,計算4為負(fù)。當(dāng)結(jié)果是這樣時,由表1的計算構(gòu)成的模型將被表示為正。然而,在本發(fā)明的在一些實(shí)施方案中,可采用加權(quán)法(weighting scheme),其中,模型中的每個正計算被賦予與該模型中每個負(fù)計算所不同的權(quán)重。例如,模型中每個正計算的權(quán)重賦予為3.0,而該模型中每個負(fù)計算的權(quán)重賦予為1.0。在這種加權(quán)法中,即便當(dāng)模型由1個正計算和2個負(fù)計算組成時該模型也表征為正。
在優(yōu)選的實(shí)施方案中,每個表征的模型產(chǎn)生某一生物學(xué)標(biāo)本或生物具有該模型所代表的生物學(xué)特征的可能性。這種可能性代表計算出的模型的模型記分。換句話說,每個表征的模型會產(chǎn)生能過表明物種的試驗(yàn)生物或物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員的模型特征(例如,模型記分)。在一些實(shí)施方案中,模型記分越高,則其細(xì)胞成分值被用來計算該模型的生物學(xué)標(biāo)本或生物就越可能(i)具有該模型所代表的生物學(xué)特征,或(ii)是該模型所代表的生物樣品種類的成員。在一些實(shí)施方案中,模型確定了某一生物學(xué)標(biāo)本或生物是否極有可能、可能、不確定、不可能或非常不可能具有與該模型相關(guān)的生物學(xué)特征或者是該檢測所代表的一類生物樣品的成員。在一些實(shí)施方案中,模型所代表的生物學(xué)特征是對組合治療的敏感性和/或抗性。在一些實(shí)施方案中,模型所代表的生物學(xué)特征是特定疾病的轉(zhuǎn)移潛能和/或該疾病在生物有機(jī)體內(nèi)復(fù)發(fā)的可能性。在一些實(shí)施方案中,模型所代表的生物學(xué)特征是癌癥和/或5.4部分提到的任何示例性生物學(xué)特征。在記錄疾病復(fù)發(fā)可能性的實(shí)施方案中,可用″敏感″、″低風(fēng)險″或″高風(fēng)險″等對模型進(jìn)行記分。在記錄疾病轉(zhuǎn)移潛能的實(shí)施方案中,可用″惡性″、″不確定″或″非惡性″等對模型進(jìn)行記分。在評價疾病的惡性的實(shí)施方案中,可用″惡性″、″不確定″或″慢性″等對模型進(jìn)行記分。
步驟422和424在步驟422中,確定在給定細(xì)胞成分豐度文件上運(yùn)行(計算)的模型系列中的所有模型是否都已經(jīng)進(jìn)行了運(yùn)行。如果不是(422-否),則過程控制回到步驟406并選擇另一個模型202。如果所有模型都已經(jīng)被運(yùn)行,則報告結(jié)果(步驟424)。在一些實(shí)施方案中,報告的結(jié)果是多個模型中的每個模型的特征。
在典型的實(shí)施方案中,報告的結(jié)果是已經(jīng)運(yùn)行的模型系列中的每個模型202的特征。已經(jīng)運(yùn)行過的每個單個模型202根據(jù)該模型的單一集合算法214來表征。在典型的實(shí)施方案中,結(jié)果被報告給提交原始細(xì)胞成分豐度文件的遠(yuǎn)程用戶計算機(jī)。步驟424中做出的示例性的報告描述在5.3部分中。
5.3.示例性結(jié)果在一些實(shí)施方案中,步驟424提供的報告被從計算機(jī)20發(fā)送到遠(yuǎn)程計算機(jī)上,該遠(yuǎn)程計算機(jī)在圖4的步驟402中生成細(xì)胞成分特征數(shù)據(jù)文件。在一些實(shí)施方案中,該報告具有提供以下信息的標(biāo)題要求計算一個或多個模型的實(shí)驗(yàn)室的地址;要求的唯一順序標(biāo)識符;辨別提交的標(biāo)本的唯一標(biāo)本標(biāo)識符;辨別用來測量細(xì)胞成分特征數(shù)據(jù)的微陣列格式的標(biāo)識符;細(xì)胞成分特征數(shù)據(jù)文件提交到步驟402的計算機(jī)20的日期;步驟424的報告生成的日期;辨別用細(xì)胞成分特征數(shù)據(jù)文件表示的患者的標(biāo)識符;對從中獲得細(xì)胞成分特征數(shù)據(jù)而形成細(xì)胞成分特征文件的生物學(xué)標(biāo)本的描述;和/或要求在生物學(xué)標(biāo)本上運(yùn)行模型的醫(yī)生或其它健康護(hù)理人員的身份。
下面的表3和4一起表示模型前列腺套件的報告的一個例子。表3和4中的每一行表示不同的模型。在表3中,每個報告的模型具有臨床檢測名稱,其提供了該模型是檢驗(yàn)什么的指示;提供了一個或多個研究項(xiàng)目(或臨床檢驗(yàn)的其它形式)的參考,其為選擇細(xì)胞成分用來檢驗(yàn)?zāi)P吞峁┝丝茖W(xué)依據(jù);還提供了模型結(jié)果以及關(guān)于該模型結(jié)果的臨床描述。表3提供的模型指出了(i)患者會復(fù)發(fā)前列腺癌的可能性程度或(ii)患者對具體治療形式的敏感性。表4不同于表3,表4的每一行(模型)代表確定患者是否患有前列腺癌的確認(rèn)檢測。
表3.前列腺癌套件/臨床檢測
表4.前列腺癌套件/確認(rèn)檢測
表5和6描述了本發(fā)明另一例子的化學(xué)敏感性模型,其是在步驟424中發(fā)送的另一種報告類型中發(fā)現(xiàn)的。
表5.化學(xué)敏感性(Chemosensivity)模型報告
表6.化學(xué)敏感性模型
表7和8描述了在本發(fā)明另一個例子的結(jié)腸直腸模型,其是在步驟424中發(fā)送的另一種報告類型中發(fā)現(xiàn)的。
表7.結(jié)腸直腸模型報告
表8.結(jié)腸直腸模型報告
表9描述了在本發(fā)明另一個實(shí)施方案的一套模型的來源部位,該模型是在步驟424中發(fā)送的另一種報告類型中發(fā)現(xiàn)的。
表9.來源部位報告
5.4.示例性生物學(xué)特征本發(fā)明可用來開發(fā)確定生物學(xué)標(biāo)本是否具有多個生物學(xué)特征中的任何一個的模型。換句話說,本發(fā)明可用來開發(fā)表明物種的試驗(yàn)生物或物種生物的試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員的模型。考慮生物學(xué)特征的寬陣列(例如生物樣品種類)。在一實(shí)施例中,兩個生物學(xué)特征分別是(i)野生型狀態(tài)和(ii)疾病狀態(tài)。在另一個實(shí)施例中,兩個生物學(xué)特征分別是(i)第一疾病狀態(tài)和第二疾病狀態(tài)。在又一個實(shí)施例中,兩個生物學(xué)特征分別是(i)藥物應(yīng)答狀態(tài)和(ii)藥物非應(yīng)答狀態(tài)。在這種情況下,第一模型202檢測第一生物樣品特征的缺失或存在,第二模型202檢測第二生物學(xué)特征的缺失或存在。本發(fā)明不限于僅對樣品檢測兩種生物學(xué)特征的缺失或存在的情況。實(shí)際上,采用本發(fā)明的方法、計算機(jī)和計算機(jī)程序產(chǎn)品可檢測任何數(shù)目的生物學(xué)特征(例如,一個生物學(xué)特征,兩個或更多個生物學(xué)特征,3-10個生物學(xué)特征,5-20個生物學(xué)特征,25個以上的生物學(xué)特征等)。此時通常用不同的模型202來檢測每個生物學(xué)特征的存在或缺失(例如,為確定該標(biāo)本是否是表征為存在這種特征的生物樣品種類的成員,或者是否是表征為不存在這種特征的一類生物樣品的成員)。在一些實(shí)施方案中,檢測多個模型以了解相同生物學(xué)特征的缺失或存在。換句話說,檢測多個模型以確定生物樣品是否是特定生物樣品種類的成員。本部分描述了示例性的生物學(xué)特征。具有給定生物學(xué)特征的生物可被認(rèn)為是相應(yīng)的生物樣品種類的成員。
5.4.1乳腺癌Pusztai等.用一些不同的輔助化療方法來治療乳腺癌。并不是所有方案對所有患者都具有相同的效果。目前還無法為特定個體選擇最有效的方案。一種已被接受的在乳腺癌化療后可延長無復(fù)發(fā)性存活的替代方法是對新輔助療法的全病理性應(yīng)答(pCR)。Pusztai等(ASCO 2003摘要1)報道說發(fā)現(xiàn)了基因表達(dá)圖,該表達(dá)圖可預(yù)測在每周新近輔助性給予紫衫醇然后連續(xù)進(jìn)行FAC化療(T/FAC)后的pCR。從24種早期乳腺癌的細(xì)針抽吸物中產(chǎn)生了預(yù)測性標(biāo)記物(Pusztai等)。24名患者中有6人獲得了pCR(25%)。在Pusztai等人的報道中,在含30,000種人轉(zhuǎn)錄物的eDNA微陣列上測定每種樣品的RNA特征。通過信噪比選擇在pCR和剩余疾病(RD)組之間具有差異表達(dá)的基因。評價了一些監(jiān)督的研究方法以確定最佳分類預(yù)測算法,以及采用一次挑一個(leave-one out)交叉驗(yàn)證得到預(yù)測結(jié)果所需基因的最佳數(shù)目。使用5個基因(3EST、核因子1/A和組蛋白乙酰轉(zhuǎn)移酶)的支持向量機(jī)產(chǎn)生了最大的預(yù)計準(zhǔn)確度。在接受T/FAC新輔助療法的獨(dú)立病例中檢測預(yù)測性標(biāo)記物系列。Pusztai等人報告了在確認(rèn)檢測中包含的21名患者的結(jié)果。Pusztai等人基于基因表達(dá)圖的應(yīng)答預(yù)測的總確度為81%。總特異性為93%。敏感性為50%(6個pCR中有3個被錯誤分類為RD)。Pusztai等人發(fā)現(xiàn),被預(yù)測為對T/FAC手術(shù)前化療會產(chǎn)生pCR的患者出了現(xiàn)pCR的幾率為75%,而未經(jīng)篩選的患者僅有25-30%的幾率。Pusztai等人的發(fā)現(xiàn)可用來建立模型202,該模型然后可被用來幫助醫(yī)生選擇最可能從T/FAC輔助化療中受益的患者。
Cobleigh等.具有10個或更多陽性結(jié)節(jié)的乳腺癌患者的預(yù)后非常差,但仍有一些可以長期存活。Cobleigh等(ASCO 2003摘要3415)試圖鑒定這種高風(fēng)險患者群中的長期無病存活(DDFS,distant disease-free survival)的預(yù)言子(predictor)。鑒定了在1979-1999年期間診斷出的具有10個或更多陽性結(jié)節(jié)的侵襲性乳腺癌患者。從3個10微米的切片中提取RNA并用RT-PCR量化7個參考基因和185個癌癥相關(guān)基因的表達(dá)?;诠_的文獻(xiàn)和微陣列試驗(yàn)的結(jié)果來選擇基因。總共研究了79名患者。54%的患者接受激素治療,而80%的患者接受化療。隨訪中值為15.1年。在2002年8月,77%的患者出現(xiàn)遠(yuǎn)端復(fù)發(fā)或死于乳腺癌。臨床變量的單變量Cox存活分析顯示,有關(guān)結(jié)節(jié)的數(shù)量與DDFS顯著相關(guān)(p=0.02)。Cobleigh等使用了一多變量模型,其中包括年齡、腫瘤大小、涉及到的結(jié)節(jié)、腫瘤級別、輔助激素治療和化療,產(chǎn)生了13%的DDFS時間改變。對185種癌癥相關(guān)基因的單變量Cox存活分析顯示,許多基因與DDFS相關(guān)(5個的p<0.01;16個的p<0.05)。對HER2配體Grb7和巨噬細(xì)胞標(biāo)記CD68而言,較高的表達(dá)與較短的DDFS相關(guān)(p<0.01)。對TP53BP2(腫瘤蛋白p53結(jié)合蛋白2)、PR和Bcl2而言,較高的表達(dá)與較長的DDFS相關(guān)(p<0.01)。包括5種基因的多變量模型產(chǎn)生了45%的DDFS時間改變。多變量分析還顯示,基因表達(dá)是對臨床變量進(jìn)行控制之后的顯著預(yù)言子。Cobleigh等的發(fā)現(xiàn)可用來建立模型202,該模型然后可被用來幫助確定哪些患者可能與DDFS有關(guān),哪些可能與DDFS無關(guān)。
van′t Veer.相同疾病階段的乳腺癌患者可有明顯不同的治療反應(yīng)和總結(jié)果。例如,轉(zhuǎn)移(結(jié)果差)、淋巴結(jié)狀態(tài)和組織等級的預(yù)言子無法根據(jù)其臨床行為將乳腺腫瘤準(zhǔn)確分類。為了克服這一缺點(diǎn),van′t Veer(2002,Nature415,530-535)在117名患者的原發(fā)性乳腺腫瘤上使用了DNA微量分析,并用監(jiān)督分類法來鑒定基因表達(dá)圖,該基因表達(dá)圖強(qiáng)烈預(yù)測在診斷時在局部淋巴結(jié)內(nèi)無腫瘤細(xì)胞(淋巴結(jié)陰性)的患者的短期和長期轉(zhuǎn)移(‘弱預(yù)后’特征)。此外,van′t Veer建立了建立BRCA1攜帶者的腫瘤的鑒定特征。van′t Veer的發(fā)現(xiàn)可用來建立模型202,該模型然后可被用來幫助確定患者的預(yù)后。
其它參考資料.可用來建立檢測乳腺癌的模型202的其它乳腺癌研究的代表性樣品包括但不限于Soule等,ASCO 2003摘要3466;Ikeda等,ASCO 2003摘要34;Schneider等,2003,British Journal of Cancer 88,p.96;Long等,ASCO 2003摘要3410;和Chang等,2002,Peer View Press,摘要1700,“多西他賽化學(xué)敏感性的基因表達(dá)圖(Gene Expression Profiles forDocetaxel Chemosensitivity)”。
5.4.2肺癌Rosell-Costa等.ERCC1 mRNA水平與DNA修復(fù)能力(DRC)和對順鉑的臨床耐受性相關(guān)。在受吉西他濱損傷后的DNA修復(fù)期間觀察到了酶活性和核糖核苷酸還原酶(RR)M1或M2亞單位基因表達(dá)的變化。Rosell-Costa等(ASCO 2003摘要2590)通過對分離自100名IV期(NSCLC)患者腫瘤活檢樣品的RNA進(jìn)行定量PCR,估算出了ERCC1和RRM1的mRNA水平,這100名患者來自具有570名患者的實(shí)驗(yàn),該570名患者隨機(jī)接受gem/cis對gem/cis/vrb對gem/vrb,然后接受vrb/ifos(Alberola等ASCO 2001摘要1229)。獲得了81名患者的ERCC1和RRM1數(shù)據(jù)。這81名患者總的反應(yīng)速度、進(jìn)展時間(TTP)和生存中值(MS)與所有570名患者的結(jié)果類似。發(fā)現(xiàn)ERCC1和RRM1水平強(qiáng)烈相關(guān)(P=0.00001)。在gem/cis臂中發(fā)現(xiàn)ERCC1和RRM1的水平顯著不同,而在其它臂中沒有發(fā)現(xiàn)不同。在該gem/cis臂中,具有低ERCC1的患者的TTP為8.3個月,而具有高ERCC1的患者為5.1個月(P=0.07),具有低RRM1的患者為8.3個月而具有高RRM1的患者為2.7個月(P=0.01),具有低ERCC1和RRM1的患者為10個月,而具有高ERCC1和RRM1的患者為4.1個月(P=0.009)。具有低ERCC1的患者的MS為13.7個月,而具有高ERCC1的患者為9.5個月(P=0.19),具有低RRM1的患者為13.7個月,而具有高RRM1的患者為3.6個月(P=0.009),具有低ERCC1和RRM1的患者未觀察到,而具有高ERCC1和RRM1的患者為6.8個月(P=0.004)。ERCC1和RRM1水平低(表示DRC低)的患者是gem/cis的理想候選人,而水平高的患者結(jié)果較差。因此,包括ERCC1和RRM1在內(nèi)的比值可用來建立模型202,該模型決定對肺癌患者使用哪種治療。
Hayes等.盡管肺癌的發(fā)病率高,但是通過預(yù)后和治療反應(yīng)隊患者進(jìn)行健康分級仍然很難。肺癌基因表達(dá)陣列的最初研究顯示可能存在之前未認(rèn)識的腺癌亞類。這些研究未得到重現(xiàn),亞類與臨床結(jié)果的之間的關(guān)系仍然不完全清楚。為了比較三大病例系列的亞類,Hayes等(ASCO 2003摘要2526)在數(shù)據(jù)池中分析了它們的基因表達(dá)陣列,該陣列包括366種腫瘤組織和正常組織樣品。共有的表達(dá)數(shù)據(jù)組被重新調(diào)整,并采用基因過濾來選擇基因亞組,該基因亞組在復(fù)制對中表達(dá)一致但在所有樣品中可變表達(dá)。對共有數(shù)據(jù)組進(jìn)行分級聚類分析,并將得到的類別與原稿作者假設(shè)的類別進(jìn)行比較。為與最初的分類法進(jìn)行直接比較,構(gòu)造一分類器并將其用于確定來自具有366種腫瘤的腫瘤庫的樣品。在分析的各個步驟中,確認(rèn)與最初公布的種類之間的類別一致性在統(tǒng)計學(xué)上是有意義的。在另一個確認(rèn)步驟中,在分類程序中比較了描述最初公布的亞型的基因列表。另外,用來描述腺癌亞類的基因列表在統(tǒng)計學(xué)上也是顯著重疊的。最后,存活曲線證實(shí)腺癌的一個亞型的存活率一直是降低的。Hayes等的分析有助于建立可重現(xiàn)的、可用mRNA表達(dá)序型分析來描述的腺癌亞型。因此,Hayes等的結(jié)果可用來建立模型202,該模型可被用來鑒定腺癌亞型。
5.4.3前列腺癌Li 等.泰索帝(Taxotere)顯示具有抗實(shí)體瘤,包括前列腺癌的抗腫瘤活性。然而還未完全闡明泰索帝作用的分子機(jī)制。為在非激素敏感性(PC3)和激素敏感性(LNCaP)前列腺癌細(xì)胞內(nèi)建立泰索帝作用的分子機(jī)制,用Affymetrix人類基因組U133A陣列獲得了廣泛的基因表達(dá)圖。見Li等ASCO 2003摘要1677。對未處理得和用2nM泰索帝處理6、36和72小時的細(xì)胞的總RNA進(jìn)行微陣列分析,并用Microarray Suite和DataMining、Cluster和Tree View以及Onto-express軟件分析數(shù)據(jù)。處理6小時時就觀察到基因表達(dá)發(fā)生改變,處理時間越長發(fā)生改變的基因越多。此外,泰索帝對LNCaP和PC3細(xì)胞的基因表達(dá)圖顯示出不同的效果。6、36和72小時后,PC3細(xì)胞中總共有166、365和1785個基因顯示出2倍以上的變化,而在LNCaP細(xì)胞中分別為57、823和964個基因。Li等發(fā)現(xiàn)對雄激素受體無影響,盡管在LNCaP細(xì)胞中觀察到一些基因的上調(diào)參與類固醇非依賴型AR活化(IGFBP2、FGF13、EGF8等)。聚類分析顯示了在這兩種細(xì)胞系中負(fù)責(zé)細(xì)胞增殖和細(xì)胞周期(細(xì)胞周期蛋白和CDK、Ki-67等)、信號轉(zhuǎn)導(dǎo)(IMPA2、ERBB2IP等)、轉(zhuǎn)錄因子(HMG-2、NFYB、TRIP13、PIR等)和腫瘤發(fā)生(STK15、CHK1、存活素等)的基因下調(diào)。相反,泰索帝上調(diào)與誘導(dǎo)凋亡(GADD45A、FasApo-1等)、細(xì)胞周期停滯(p21CIP1、p27KIP1等)和腫瘤抑制有關(guān)的基因。從這些結(jié)果Li等得出結(jié)論,泰索帝使大量基因發(fā)生改變,其中的許多基因可能參與泰索帝影響前列腺癌細(xì)胞的分子機(jī)制。還可能進(jìn)一步發(fā)掘這些信息來設(shè)計泰索帝治療效果的優(yōu)化策略用于治療轉(zhuǎn)移性前列腺癌。
用本部分所述的結(jié)果,可開發(fā)出將患者分成對泰索帝和對相關(guān)治療方案有不同反應(yīng)程度的組的模型202(例如,第一生物學(xué)特征對泰索帝高度響應(yīng),第二生物學(xué)特征不響應(yīng)泰索帝等)。在另一種方法中,可部分基于Cox-2表達(dá)建立生物學(xué)特征,以作為D2期前列腺癌的存活預(yù)言子。
5.4.4結(jié)腸直腸癌Kwon等.為鑒定一組與結(jié)腸直腸癌發(fā)生的發(fā)展有關(guān)的基因,Kwon等(ASCO 2003摘要1104)用具有4608個基因的cDNA微陣列方法分析了結(jié)腸直腸癌細(xì)胞的基因表達(dá)圖,該結(jié)腸直腸癌細(xì)胞來自具有相應(yīng)的非癌結(jié)腸上皮細(xì)胞的12種腫瘤。Kwon等通過雙相聚類分析將樣品和基因進(jìn)行分類,并鑒定了在癌組織和非癌組織之間差異表達(dá)的基因。通過逆轉(zhuǎn)錄酶PCR(RT-PCR)證實(shí)在所選基因內(nèi)基因表達(dá)水平的改變。用受檢控的學(xué)習(xí)技術(shù),評價了根據(jù)淋巴結(jié)轉(zhuǎn)移的基因表達(dá)圖。在75%以上的腫瘤中觀察到122個基因的表達(dá)發(fā)生變化,即77個上調(diào)的基因和45個下調(diào)的基因。最經(jīng)常改變的基因?qū)儆谝韵鹿δ茴愋托盘栟D(zhuǎn)導(dǎo)(19%)、代謝(17%)、細(xì)胞結(jié)構(gòu)/運(yùn)動性(14%)、細(xì)胞周期(13%)以及基因蛋白質(zhì)表達(dá)(13%)。隨機(jī)選擇的基因的RT-PCR分析表現(xiàn)出與cDNA微陣列中的發(fā)現(xiàn)一致。Kwon等用交叉確認(rèn)環(huán)(cross-validation loop)能夠預(yù)測12名患者中10人的淋巴結(jié)轉(zhuǎn)移。Kwon等的結(jié)果可用來建立確定患者是否患有結(jié)腸直腸癌的模型202。此外,Kwon等的結(jié)果可進(jìn)一步用來鑒定結(jié)腸直腸癌的亞類。
可用來建立結(jié)腸直腸癌模型202(包括鑒定生物學(xué)標(biāo)本具有結(jié)腸直腸癌的模型以及預(yù)測結(jié)腸直腸癌亞群的其它可能的模型)的其它研究包括但不限于Nasir等,2002,In Vivo.16,p.501,其中總結(jié)了發(fā)現(xiàn)COX-2表達(dá)提高與腫瘤誘導(dǎo)和進(jìn)展有關(guān)的研究,以及Longley等,2003 Clin.Colorectal Cancer.2,p.223;McDermott等,2002,Ann Oncol. 13,p.235;和Longley等,2002,Pharmacogenomics J.2,p.209。
5.4.5卵巢癌Spentzos等.為鑒定與上皮卵巢癌(EOC)的臨床結(jié)果有關(guān)的表達(dá)圖,Spentzos等(ASCO 2003摘要1800)評價了接受基于鉑/紫杉烷的一線化療的EOC患者的38種腫瘤樣品。將RNA探針逆轉(zhuǎn)錄、熒光標(biāo)記、與含有12675個人類基因的寡核苷酸陣列雜交并表達(dá)序列標(biāo)記。分析表達(dá)數(shù)據(jù)以得到化學(xué)敏感性、無病存活率(DFS)和整體存活率(OS)的預(yù)測性特征。根據(jù)基因在化學(xué)敏感性和存活率不同的腫瘤中差異表達(dá)的可能性,用Bayesian模型來將它們進(jìn)行分類。上述特征分別包括最可能在結(jié)果不同的腫瘤亞群之間差異表達(dá)的基因。Spealtzos等發(fā)現(xiàn)了在化學(xué)抗性腫瘤中過度表達(dá)的一組基因,以及在化學(xué)敏感性腫瘤中過度表達(dá)的另一組基因。Spentzos等發(fā)現(xiàn)了45個在與短時間無病存活(DFS,short disease free survival)有關(guān)的腫瘤中過度表達(dá)的基因,以及18個在與長時間DFS有關(guān)的腫瘤中過度表達(dá)的基因。這些基因?qū)⒒颊呷悍殖蒁FS中間值為7.5和30.5個月(p<0.00001)的兩組。Spentzos等發(fā)現(xiàn)了20個在具有短時間整體存活率(OS)的腫瘤中過度表達(dá)的基因,以及29個在具有長時間OS的基因中過度表達(dá)的基因(OS中間值為22和40月,p=0.00008)。Spenizos等鑒定的過度表達(dá)的基因可用來建立將生物學(xué)標(biāo)本分成化學(xué)抗性卵巢癌、化學(xué)敏感性卵巢癌、短時間DFS卵巢癌、長時間DFS卵巢癌、短時間OS卵巢癌和長時間OS卵巢癌等類型的模型202。
可用來建立卵巢癌模型202的其它研究包括但不限于Presneau等,2003,Oncogene 13,p.1568;和Takano等ASCO 2003摘要1856。
5.4.6膀胱癌Wulfing 等.已顯示Cox-2(一種參與花生四烯酸代謝的可誘導(dǎo)酶)在各種人類癌癥中通常過度表達(dá)。最近的研究顯示,Cox-2的表達(dá)對由于某種腫瘤實(shí)體而接受放療或化療的患者具有預(yù)后價值。在膀胱癌中,Cox-2表達(dá)還沒有與存活率數(shù)據(jù)建立起良好關(guān)聯(lián)。為了解決這一問題,Wulfing等(ASCO2003摘要1621)研究了157名連續(xù)性患者,這些患者都已經(jīng)因?yàn)榍忠u性膀胱癌而接受過根治性膀胱切除術(shù)。其中,有61名患者接受過含順鉑的化學(xué)療法作為輔助治療或?yàn)榱酥委熂膊∞D(zhuǎn)移。用單克隆Cox-2抗體對石蠟包埋的組織塊進(jìn)行標(biāo)準(zhǔn)的免疫組織化學(xué)測定。將半定量結(jié)果與臨床和病理學(xué)數(shù)據(jù)、長期存活率(3-177個月)和化療細(xì)節(jié)建立關(guān)聯(lián)。26(16.6%)名病例為Cox-2陰性。對于所有的陽性病例(n=131,83.4%),59人(37.6%)顯示低Cos-2表達(dá),53人(33.8%)顯示中度Cos-2表達(dá),并有19人(12.1%)顯示強(qiáng)Cos-2表達(dá)。表達(dá)與TNM-級別和組織學(xué)等級無關(guān)。Cox-2表達(dá)與腫瘤的組織學(xué)類型顯著相關(guān)(膀胱上皮相比鱗狀細(xì)胞癌,P=0.01)。在所有被研究的病例中,Kaplan-Meier分析未顯示整體存活率和無病存活率之間有任何統(tǒng)計學(xué)關(guān)聯(lián)。然而,通過對那些接受過含順鉑的化學(xué)療法的患者進(jìn)行亞群分析發(fā)現(xiàn),Cox-2表達(dá)與較差的整體存活時間顯著相關(guān)(P=0.03)。根據(jù)Wulfing等,Cox-2的免疫組織化學(xué)過度表達(dá)是膀胱癌中非常常見的事件。當(dāng)Cox-2在腫瘤中過度表達(dá)時接受化療的患者似乎有更差的存活率。因此,Wulfing等認(rèn)為,Cox-2的表達(dá)能夠?yàn)橛没陧樸K的化學(xué)療法治療的膀胱癌患者提供額外的預(yù)后信息,并且可以是對個體患者進(jìn)行更具進(jìn)攻性的療法、或是使用選擇性Cox-2抑制劑的風(fēng)險調(diào)節(jié)向靶療法的基礎(chǔ)。Wulfing等的結(jié)果可用來建立將膀胱癌人群分成不同治療組的模型202。
5.4.7胃癌Terashima等.為檢測人類胃癌中的化學(xué)抗性相關(guān)基因,Terashima等(ASCO 2003摘要1161)用DNA微陣列研究了基因表達(dá)圖,并將結(jié)果與體外藥物敏感性進(jìn)行了比較。從總共16名胃癌患者獲得新鮮的腫瘤組織,然后用包含12,000個人類基因和EST序列的GeneChip Human U95Av2陣列(Affymetrix,Santa Clara,加利福尼亞)檢測基因表達(dá)圖。將結(jié)果與通過ATP檢測確定的體外藥物敏感性結(jié)果進(jìn)行比較。研究的藥物和藥物濃縮物為順鉑(CDDP)、多柔比星(DOX)、絲裂霉素C(MMC)、依托泊甙(ETP)、伊立替康(CPT,如SN-38)、5-氟尿嘧啶(5-FU)、去氧氟尿苷(5′-DFUR)、紫衫醇(TXL)和多西他賽(TXT)。以每種藥物的Cmax濃度加入藥物72小時。藥物敏感性表示為藥物治療組與對照組的ATP含量的比值(T/C%)。評價有關(guān)基因表達(dá)量和T/C%之間的皮爾遜相關(guān)系數(shù),并用通過相關(guān)性選出的基因進(jìn)行了聚類分析。通過這些分析可知,CDDP中的51個基因、DOX中的34個基因、MMC中的26個基因、ETP中的52個基因、CPT中的51個基因、5-FU中的85個基因、5′-DFUR中的42個基因、TXL中的11個基因以及TXT中的32個基因在藥物抗性腫瘤中上調(diào)。這些基因中的大多數(shù)與細(xì)胞生長、細(xì)胞周期調(diào)節(jié)、凋亡、熱休克蛋白或泛素-蛋白酶體路徑有關(guān)。然而,一些基因,如核糖體蛋白、CD44和延伸因子α,在每種藥物抗性腫瘤中都特異性上調(diào)。Terashima等鑒定出的上調(diào)的基因可用來建立模型202,該模型不僅能診斷胃癌患者,而且可提供患者是否具有藥物抗性胃部腫瘤的指示,以及如果是的話,指示是哪種類型的藥物抗性腫瘤。
可用來建立胃癌模型202的其它參考資料包括但不限于Kim等ASCO2003摘要560;Arch-Ferrer等ASCO 2003摘要1101;HobdayASCO 2003摘要1078;Song等ASCO 2003摘要1056(Rb基因的過度表達(dá)是預(yù)測無復(fù)發(fā)存活的獨(dú)立的預(yù)后因子);Leichman等,ASCO 2003摘要1054(胸苷酸合成酶的表達(dá)作為食道癌/胃癌化學(xué)益處的預(yù)言子)。
5.4.8直腸癌Lenz等.局部復(fù)發(fā)是直腸癌患者面臨的一個重要的臨床問題。因此,Lenz等(ASCO 2003摘要1185)試圖建立可預(yù)測用輔助化學(xué)放射療法治療的直腸癌患者骨盆復(fù)發(fā)的遺傳圖譜。從1991年到2000年總共治療了73名局部發(fā)展為直腸癌的患者(UICCII和III期),其中女性25人、男性48人,平均年齡52.1歲。組織學(xué)分類將22名患者分為T2期,51人分為T3期。共有35名患者為淋巴結(jié)陰性,38名患者有一處或多處淋巴結(jié)轉(zhuǎn)移。所有患者都經(jīng)過癌癥切除術(shù),然后用5-FU加骨盆放射治療。從福爾馬林固定的、石蠟包埋的、激光捕獲顯微切割的組織提取RNA。Lenz等通過定量RT-PCR(Taqman)測定了腫瘤組織和附近正常組織中與5FU途徑(TS、DPD)、血管發(fā)生(VEGF)和DNA修復(fù)(ERCC1、RAD51)有關(guān)的基因的mRNA水平。Lenz等發(fā)現(xiàn)局部腫瘤復(fù)發(fā)與附近正常組織中ERCCI和TS的較高mRNA水平顯著相關(guān),這說明5-FU途徑、DNA修復(fù)、血管發(fā)生的靶基因的基因表達(dá)水平可用來鑒定有骨盆復(fù)發(fā)風(fēng)險的患者。Lenz等的結(jié)果可用來建立鑒定有骨盆復(fù)發(fā)風(fēng)險的患者的模型202。
5.4.9其它示例性生物學(xué)特征其它代表性的生物學(xué)特征包括但不限于痤瘡、肢端肥大癥、急性膽囊炎、艾迪生病、子宮內(nèi)膜異位、成人生長激素缺乏、成人軟組織肉瘤、酒精依賴、過敏性鼻炎、變態(tài)反應(yīng)、脫發(fā)、阿耳茨海默病、羊膜穿刺、心力衰竭中的貧血、貧血、心絞痛、強(qiáng)直性脊柱炎、焦慮癥、卵巢男性細(xì)胞瘤、心律失常、關(guān)節(jié)炎、與關(guān)節(jié)炎有關(guān)的眼部問題、哮喘、動脈粥樣硬化、異位性濕疹、萎縮性陰道炎、注意力缺陷障礙、注意力紊亂、自身免疫性疾病、龜頭包皮炎、禿發(fā)癥、前庭大腺膿腫、出生缺陷、出血障礙、骨癌、腦和脊髓腫瘤、腦干膠質(zhì)瘤、腦瘤、乳腺癌、乳腺癌風(fēng)險、乳腺疾病、癌癥、腎癌、心肌病、頸動脈疾病、頸動脈內(nèi)膜切除術(shù)、腕管綜合征、大腦性麻痹、子宮頸癌、軟下疳、水痘、兒童腎變病綜合征、衣原體、慢性腹瀉、慢性心力衰竭、跛行、絞痛、結(jié)腸或直腸癌、結(jié)腸直腸癌、普通感冒、濕疣(生殖疣)、先天性甲狀腺腫、充血性心力衰竭、結(jié)膜炎、角膜病、角膜潰瘍、冠心病、隱孢子蟲病、柯興氏綜合癥、囊性纖維化病、膀胱炎、膀胱鏡檢查或輸尿管鏡檢查、德凱爾費(fèi)恩病、癡呆、抑郁、躁狂癥、多尿癥、尿崩癥、糖尿病、糖尿病視網(wǎng)膜病、唐氏綜合征、青春期痛經(jīng)、性交痛、耳變態(tài)反應(yīng)、耳感染、進(jìn)食障礙、濕疹、氣腫、心內(nèi)膜炎、子宮內(nèi)膜癌、子宮內(nèi)膜異位癥、兒童遺尿、附睪炎、癲癇、會陰切開術(shù)、勃起功能障礙、眼癌、fatal abstraction、大便失禁、女性性功能障礙、胎兒異常、胎兒乙醇綜合征、纖維肌痛、流感、濾泡炎、真菌感染、陰道加德菌病、生殖器念珠菌病、生殖器皰疹、妊娠糖尿病、青光眼、腎小球疾病、淋病、痛風(fēng)和假痛風(fēng)、生長疾病、齦疾病、毛發(fā)疾病、口臭、Hamburger病、血友病、肝炎、乙型肝炎、遺傳性結(jié)腸癌、皰疹感染、人胎盤促乳素、甲狀旁腺功能亢進(jìn)癥、高血壓、甲狀腺機(jī)能亢進(jìn)、低血糖癥、性腺功能減退癥、尿道下裂、甲狀腺功能減退癥、子宮切除、陽萎、不育癥、炎性腸病、腹股溝疝、遺傳性心率不齊、眼內(nèi)黑素瘤、腸易激綜合征、卡波西肉瘤、白血病、肝癌、肺癌、肺病、瘧疾、躁狂抑郁癥、麻疹、記憶喪失、兒童腦膜炎、月經(jīng)過多、間皮瘤、微量白蛋白、偏頭痛、經(jīng)間痛、口腔癌、運(yùn)動失調(diào)、腮腺炎、宮頸腺體囊腫、發(fā)作性睡病、鼻變態(tài)反應(yīng)、鼻腔和鼻旁竇癌、成神經(jīng)細(xì)胞瘤、神經(jīng)纖維瘤病、神經(jīng)障礙、新生兒黃疸、肥胖、強(qiáng)迫性神經(jīng)失調(diào)、睪丸炎或附睪炎、口面肌功能障礙、骨關(guān)節(jié)炎、骨質(zhì)疏松、骨質(zhì)疏松、骨肉瘤、卵巢癌、卵巢囊腫、胰腺癌、嵌頓包莖、帕金森病、部分性癲癇、盆腔炎性疾病、消化性潰瘍、圍產(chǎn)期心肌病、陰莖硬結(jié)癥、多囊性卵巢綜合征、先兆子癇、孕二醇、月經(jīng)前期綜合征、陰莖異常勃起、催乳素瘤、前列腺癌、銀屑病、風(fēng)濕熱、唾液腺癌、SARS、性傳播疾病、性傳播的腸道傳染、性傳播的感染、希恩綜合征、鼻竇炎、皮膚癌、睡眠障礙、天花、味覺障礙、打鼾、社交恐怖癥、脊柱裂、胃癌、梅毒、睪丸癌、甲狀腺癌、甲狀腺疾病、扁桃體炎、牙病、滴蟲病、結(jié)核病、腫瘤、H型糖尿病、潰瘍性結(jié)腸炎、尿路感染、泌尿外科癌癥、子宮平滑肌瘤、陰道癌、陰道囊腫、外陰痛和外陰陰道炎。
5.5轉(zhuǎn)錄狀態(tài)測量該部分提供了測量作為細(xì)胞成分的一種類型的基因的表達(dá)水平的一些示例性方法。精通本領(lǐng)域的技術(shù)人員將知道本發(fā)明不限于以下測量多種生物中每個生物基因表達(dá)水平的具體方法。
5.5.1采用微陣列的轉(zhuǎn)錄物測定這部分描述的技術(shù)包括提供可用來同時確定多個基因的表達(dá)水平的多核苷酸探針陣列。這些技術(shù)還可用來設(shè)計和制造這種多核苷酸探針陣列。
可用任何高通量技術(shù)測量基因中核苷酸序列的表達(dá)水平。然而測量時,結(jié)果是轉(zhuǎn)錄物或應(yīng)答數(shù)據(jù)的絕對量亦或相對量,包括但不限于豐度值或豐度比。優(yōu)選地,表達(dá)圖的測量是通過與轉(zhuǎn)錄物陣列雜交完成的,如本部分所述。在一實(shí)施方案中,使用了“轉(zhuǎn)錄物陣列”或“序型分析陣列”。轉(zhuǎn)錄物陣列可用來分析細(xì)胞樣品的表達(dá)圖,尤其可用來測量特定組織類型或發(fā)展?fàn)顟B(tài)或暴露于感興趣藥物的細(xì)胞樣品的表達(dá)圖。
在一實(shí)施方案中,表達(dá)圖是通過使可檢測標(biāo)記的、代表細(xì)胞內(nèi)存在的mRNA轉(zhuǎn)錄物的核苷酸序列的多核苷酸(例如,從細(xì)胞總mRNA合成的熒光標(biāo)記的cDNA)與微陣列雜交獲得的。微陣列是一種在支持物上的、位置可尋址的結(jié)合(例如雜交)位點(diǎn)的陣列,其可以呈現(xiàn)細(xì)胞或生物基因組內(nèi)的多個核苷酸序列,優(yōu)選呈現(xiàn)大多數(shù)或幾乎所有的基因。這些結(jié)合位點(diǎn)中的每一個都由結(jié)合到該支持物預(yù)定區(qū)域的多核苷酸探針組成??捎迷S多方法來制造微陣列,下面描述了其中的一些方法。然而在制造時,微陣列具有某些特性。這種陣列是可復(fù)制的,從而可制造某給定陣列的多個拷貝并易于相互比較。優(yōu)選地,微陣列是由在結(jié)合(例如核酸雜交)條件下穩(wěn)定的材料制造的。微陣列宜較小,例如在1-25cm2之間,優(yōu)選在1-3cm2之間。然而,也可以有更大或更小的陣列,并且,其對于例如為同時評價數(shù)目非常大或非常小的不同探針來說是優(yōu)選的。
優(yōu)選地,微陣列上某給定結(jié)合位點(diǎn)或結(jié)合位點(diǎn)的特定系列將特異性結(jié)合(例如雜交)來自細(xì)胞或組織的單個基因內(nèi)的核苷酸序列(例如結(jié)合來自它們的特定mRNA或特定cDNA的外顯子)。
使用的微陣列可包括一個或多個檢測探針,每個檢測探針都具有與待測RNA或DNA的亞序列互補(bǔ)的多核苷酸序列。每個探針通常具有不同的核酸序列,且該陣列的固體表面上的每個探針的位置通常是已知的。實(shí)際上,該微陣列優(yōu)選為可尋址陣列,更優(yōu)選為位置可尋址陣列。該陣列的每個探針優(yōu)選位于固體支持物上的已知預(yù)定位置,從而可從其在該陣列上(例如在支持物或表面上)的位置來確定每個探針的身份(例如序列)。在一些實(shí)施方案中,所述陣列是有序陣列。
優(yōu)選地,微陣列或微陣列系列上的探針的密度為每平方厘米有100個差異(例如不相同的)探針,或者更多。更優(yōu)選地,用于本發(fā)明方法的微陣列每平方厘米上至少有550個探針、至少1,000個探針、至少1,500個探針、至少2,000個探針、至少8,000個探針或至少15,000個探針,或者更多。因此,用于本發(fā)明的微陣列優(yōu)選含有至少25,000、至少50,000、至少100,000、至少150,000、至少200,000、至少250,000、至少500,000或至少550,000個差異(例如不相同的)探針。
在一實(shí)施方案中,所述微陣列是一種其中每個位置代表由一基因編碼的轉(zhuǎn)錄物的核苷酸序列(例如由其衍生的mRNA或cDNA的外顯子)的離散結(jié)合位點(diǎn)的陣列(例如矩陣)。微陣列上結(jié)合位點(diǎn)的集合含有多組多個基因的結(jié)合位點(diǎn)。例如,在不同的實(shí)施方案中,本發(fā)明的微陣列可包含由某生物基因組中50%以下的基因編碼的產(chǎn)物的結(jié)合位點(diǎn)。或者,本發(fā)明的微陣列可具含有由某生物基因組中至少50%、至少75%、至少85%、至少90%、至少95%、至少99%或100%的基因編碼的產(chǎn)物的結(jié)合位點(diǎn)。在其它實(shí)施方案中,本發(fā)明的微陣列可具有由少于50%、至少50%、至少75%、至少85%、至少90%、至少95%、至少99%或100%的某生物的細(xì)胞表達(dá)的基因編碼的產(chǎn)物的結(jié)合位點(diǎn)。所述結(jié)合位點(diǎn)可以是特定RNA可與之特異性雜交的DNA或DNA類似物。所述DNA或DNA類似物可以是,例如,合成的低聚物或基因片段,例如與外顯子相對應(yīng)的低聚物或基因片段。
在本發(fā)明的在一些實(shí)施方案中,基因或基因的外顯子在序列分析陣列中是由一系列結(jié)合位點(diǎn)表示的,所述結(jié)合位點(diǎn)包含具有與該基因或外顯子的不同序列區(qū)段互補(bǔ)的不同多核苷酸的探針。這種多核苷酸的長度優(yōu)選為15-200個堿基,更優(yōu)選為20-100個堿基,最優(yōu)選為40-60個堿基。每個探針序列除了與其靶序列互補(bǔ)的序列之外也可含有接頭序列。在本發(fā)明中,接頭序列是位于與其靶序列互補(bǔ)的序列和支持物表面之間的序列。例如,在優(yōu)選的實(shí)施方案中,本發(fā)明的序型分析陣列包括一個特異于各靶基因或外顯子的探針。然而,如果需要的話,所述序型分析陣列可含有至少2、5、10、100或1000個或更多特異于一些靶基因或外顯子的探針。例如,在一個堿基間距處,所述陣列含有的探針可平鋪基因的最長mRNA剪切體的序列。
在本發(fā)明具體的實(shí)施方案中,當(dāng)一外顯子具有其它剪切變異體時,該外顯子的序型分析陣列中可包括一套連續(xù)重疊序列(即平鋪序列)的多核苷酸探針,該重疊序列與含有外顯子的最長變異體的基因組區(qū)域重疊。在預(yù)定堿基間隔距離,例如1、5或10個堿基間隔距離中,該套多核苷酸探針可含有跨越或平鋪含有最長變異體的mRNA的連續(xù)重疊序列。因此,該系列探針可用來掃描含有外顯子變體的基因組區(qū)域,以確定表達(dá)的變異體或該外顯子的變異體。此外,外顯子序型分析陣列中可包括一套含有外顯子特異性探針和/或變體結(jié)合探針的多核苷酸探針。在本發(fā)明中,變體結(jié)合探針是指對特定外顯子變異體和相鄰?fù)怙@子結(jié)合的區(qū)域具有特異性的探針。在一些情況下,所述探針系列含有變異體接合探針,其與該外顯子的所有不同的剪切結(jié)合序列中的每一個發(fā)生特異性雜交。在另一些情況下,所述探針系列含有外顯子特異性的探針,其能夠與該外顯子的所有不同的變異體中的共同序列發(fā)生特異性雜交,和/或可與該外顯子的不同剪切結(jié)合序列發(fā)生特異性雜交。
在一些情況下,外顯子通過含有與全長外顯子互補(bǔ)的多核苷酸的探針顯示在外顯子序型分析陣列中。在這種情況下,通過序列分析陣列上的單個結(jié)合位點(diǎn)顯示外顯子。在一些優(yōu)選的情況中,外顯子由序型分析陣列上的一個或多個結(jié)合位點(diǎn)顯示,每個結(jié)合位點(diǎn)包含具有與標(biāo)靶外顯子的實(shí)質(zhì)性部分的RNA片段互補(bǔ)的多核苷酸序列的探針。這種探針的長度通常為15-600個堿基,優(yōu)選為20-200個堿基,更優(yōu)選為30-100個堿基,最優(yōu)選為40-80個堿基。外顯子的平均長度約為200個堿基(參見,例如,Lewin,GenesV,Oxford University Press,Oxford,1994)。相比長度較短的探針,長度為40-80的探針更加特異性結(jié)合該外顯子,因此增加了探針對標(biāo)靶外顯子的特異性。對于某些基因,一個或多個標(biāo)靶外顯子的序列長度可小于40-80個堿基。在這些情況下,如果使用了序列長度長于標(biāo)靶外顯子的探針,則可能需要設(shè)計探針,使其包括含有完整標(biāo)靶外顯子的序列,該標(biāo)靶外顯子的側(cè)翼序列來自相鄰的組成型剪切外顯子,從而使該探針序列與mRNA中相應(yīng)的序列區(qū)段互補(bǔ)。采用來自相鄰的組成型剪切外顯子的側(cè)翼序列而不采用基因的組側(cè)翼序列,即內(nèi)含子序列,與具有相同長度的其它探針相比較,更具有雜交嚴(yán)謹(jǐn)性。使用的側(cè)翼序列優(yōu)選相鄰的組成型剪切外顯子或者來自不參與任何其它途徑的外顯子。使用的側(cè)翼序列更優(yōu)選不包含相鄰?fù)怙@子或外顯子的序列的顯著部分,這樣可使交叉雜交最小化。在一些實(shí)施方案中,當(dāng)短于理想探針長度的標(biāo)靶外顯子參與選擇剪切時,設(shè)計探針在不同的選擇剪切的mRNA中含有側(cè)翼序列,從而測量在不同選擇剪切的mRNA中表達(dá)的外顯子的表達(dá)水平。
在一些例子中,當(dāng)要區(qū)別選擇剪切途徑和/或分離的基因內(nèi)的外顯子復(fù)制時,所述DNA陣列或陣列系列也可包含與橫跨兩個相鄰?fù)怙@子連接區(qū)的序列互補(bǔ)的探針。優(yōu)選地,這種探針包括來自兩個外顯子的序列,每個外顯子基本上都不與探針重疊,從而可使交叉雜交最小化。如果外顯子出現(xiàn)在一個或多個選擇剪切mRNA和/或一個或多個含有復(fù)制的外顯子的單獨(dú)基因中,而不出現(xiàn)在其它選擇剪切的mRNA中和/或含有復(fù)制的外顯子的其它基因中,則包含一個以上外顯子的序列的探針可用于區(qū)別選擇剪切途徑和/或在單獨(dú)基因內(nèi)進(jìn)行復(fù)制的外顯子的表達(dá)?;蛘?,對于在單獨(dú)基因內(nèi)的外顯子副本,如果來自不同基因的外顯子顯示出完全不同的序列同源性,則它優(yōu)選包括不同的探針,因而可區(qū)別來自不同基因的外顯子。
本領(lǐng)域的技術(shù)人員將了解,上述任何探針方法可聯(lián)合用于相同的序型分析陣列和/或用于相同序型分析序列系列的不同陣列,從而能夠更加精確地確定多個基因的表達(dá)圖。本領(lǐng)域的技術(shù)人員能夠了解,不同的探針方法也可用于精確性水平不同的序列分析。例如,含有各個外顯子的小探針系列的序型分析陣列或陣列系列,在某些特定條件下可用來確定相關(guān)基因和/或RNA剪切途徑。含有感興趣外顯子的較大探針系列的陣列或陣列系列則可用來更加精確地確定這種特定條件下的外顯子表達(dá)圖??梢愿行У厥褂貌煌结樂椒ǖ钠渌麯NA陣列策略也包括在內(nèi)。
優(yōu)選地,用于本發(fā)明的微陣列具有一個或多個基因的外顯子系列的結(jié)合位點(diǎn)(即探針),該基因與感興趣的藥物的作用相關(guān),或者處于感興趣的生物路徑內(nèi)。這里所述的“基因”是由RNA聚合酶轉(zhuǎn)錄的DNA的一部分,它可包括5’非翻譯區(qū)(“UTR”)、內(nèi)含子、外顯子和3’UTR??捎杉?xì)胞或生物表達(dá)的mRNA的數(shù)目,或者通過推斷基因組已經(jīng)良好表征的部分來估計基因組中基因的數(shù)目。如果感興趣生物的基因組已經(jīng)被測序,那么可確定ORF的數(shù)目并可通過分析DNA序列來鑒定mRNA編碼區(qū)。例如,釀酒酵母(Saccharomyces cerevisiae)的基因組已被完全測序,據(jù)報道說含有約6,275個長度大于99個氨基酸殘基的ORF編碼序列。對這些ORF進(jìn)行分析得知,有5,885個ORF可能編碼蛋白質(zhì)產(chǎn)物(Goffeau等,1996,Science 274546-567)。相反,預(yù)計人類基因組含有約30,000-130,000個基因(見Crollius等,2000,Nature Genetics 25235-238;Ewing等,2000,Nature Genetics 25232-234)。其它生物基因組測序,其中包括但不限于果蠅(Drosophila)、秀麗隱桿線蟲(C.elegans)、植物如水稻和阿布屬植物等植物、以及小鼠和人類等哺乳動物,也已完成或快要完成。因此,在本發(fā)明優(yōu)選的實(shí)施方案中,提供了含有生物基因組的所有已知或預(yù)測的外顯子的全部探針的陣列系列。一個非限制性實(shí)施例是,本發(fā)明提供了含有人類基因組每個已知或預(yù)測的外顯子的一個或兩個探針的陣列系列。
應(yīng)當(dāng)了解,當(dāng)制得與細(xì)胞的RNA互補(bǔ)的cDNA并使其在合適的雜交條件下與微陣列雜交時,在該陣列中與任何特定基因的外顯子相對應(yīng)的位點(diǎn)的雜交水平將反映出該細(xì)胞內(nèi)含有該基因轉(zhuǎn)錄出的外顯子的一個或多個mRNA的普遍性。例如,當(dāng)與細(xì)胞總mRNA互補(bǔ)的可檢測標(biāo)記的(例如,用熒光團(tuán)標(biāo)記的)cDNA與微陣列雜交時,該陣列上與未轉(zhuǎn)錄的或在細(xì)胞的RNA剪切期間被除去的基因(例如,能夠特異性結(jié)合一種或多種基因表達(dá)產(chǎn)物)的外顯子相對應(yīng)的位點(diǎn)將產(chǎn)生極少或不產(chǎn)生信號(例如熒光信號),而編碼的mRNA普遍表達(dá)的外顯子的基因中,該外顯子將具有相對較強(qiáng)的信號。然后通過該基因所監(jiān)控的所有外顯子的信號強(qiáng)度模式,確定由相同基因通過選擇剪切產(chǎn)生的不同mRNA的相對豐度。
在一實(shí)施方案中,采用二色法使來自兩種不同條件的細(xì)胞樣品的cDNA與微陣列的結(jié)合位點(diǎn)雜交。在藥物應(yīng)答中,一種細(xì)胞樣品暴露于藥物而另一種相同類型的細(xì)胞樣品不暴露于藥物。在路徑應(yīng)答中,一種細(xì)胞暴露于路徑干擾而另一種相同類型的細(xì)胞不暴露于路徑干擾。來自兩種細(xì)胞類型的每一種細(xì)胞的cDNA被不同地標(biāo)記(例如用Cy3和Cy5標(biāo)記)以使它們可被辨別。在一實(shí)施方案中,例如,用熒光素標(biāo)記的dNTP合成來自用藥物處理過的(或暴露于路徑干擾的)細(xì)胞的cDNA,用羅丹明標(biāo)記的dNTP合成來自第二種未暴露于藥物的細(xì)胞的cDNA。當(dāng)將兩種cDNA混合并與微陣列雜交時,確定了陣列每個位置上各cDNA組的相對信號強(qiáng)度,并檢測了特定外顯子豐度的任何相對差異。
在上述實(shí)施例中,當(dāng)熒光團(tuán)被激發(fā)時來自用藥物處理過的(或路徑干擾的)細(xì)胞的cDNA將呈現(xiàn)熒光綠色,而來自未處理細(xì)胞的cDNA將呈現(xiàn)熒光紅色。其結(jié)果是,當(dāng)藥物處理對細(xì)胞內(nèi)特定基因的轉(zhuǎn)錄和/或轉(zhuǎn)錄后剪切無直接或間接影響時,則兩種細(xì)胞內(nèi)的外顯子表達(dá)模式將無法區(qū)分,紅色標(biāo)記的和綠色標(biāo)記的cDNA在逆轉(zhuǎn)錄時將是等量的。當(dāng)與微陣列雜交時,RNA的結(jié)合位點(diǎn)將發(fā)射出兩種熒光團(tuán)的特征波長。相反,當(dāng)用直接或間接改變細(xì)胞內(nèi)特定基因的轉(zhuǎn)錄和/或轉(zhuǎn)錄后加工的藥物處理暴露于藥物的細(xì)胞時,用每個外顯子結(jié)合位點(diǎn)的綠色和紅色熒光比例表示的外顯子表達(dá)模式將改變。當(dāng)該藥物增加一種mRNA的量時,則這種mRNA中表達(dá)的各個外顯子的比例將上升,而當(dāng)該藥物降低一種mRNA的量時,則這種mRNA中表達(dá)的各個外顯子的比例將下降。
關(guān)于mRNA的檢測,已有描述用雙色熒光標(biāo)記和檢測方法來鑒定基因表達(dá)的變化,例如,在Schena等,1995,Quantitative monitoring of geneexpression patterns with a complementary DNA microarray,Science 270467-470,出于所有目的,該文獻(xiàn)被全文納入本文作為參考。該方法也可用來標(biāo)記和檢測外顯子。使用用兩種不同熒光團(tuán)標(biāo)記的cDNA的優(yōu)點(diǎn)在于,可直接并內(nèi)部可控地比較在兩種細(xì)胞狀態(tài)中每種排列基因所對應(yīng)的mRNA或外顯子的表達(dá)水平,且由于試驗(yàn)條件(例如雜交條件)的細(xì)微差異導(dǎo)致的變化不會影響隨后的分析。然而,也可使用來自一種細(xì)胞的cDNA,并且比較(例如)比如用藥物處理過的或路徑干擾的細(xì)胞以及未處理細(xì)胞中的特定外顯子的絕對量。此外,本發(fā)明還考慮了用兩種以上的顏色進(jìn)行標(biāo)記。在本發(fā)明的在一些實(shí)施方案中,可用至少5、10、20或100種不同顏色的染料來標(biāo)記。這種標(biāo)記可使可區(qū)分標(biāo)記的cDNA群與相同的陣列同時雜交,并因此測量并任選比較來自兩種以上樣品的mRNA分子的表達(dá)水平??墒褂玫娜玖习ǖ幌抻跓晒馑丶捌溲苌?、羅丹明及其衍生物、得克薩斯紅、5-羧基-熒光素(″FMA″)、2,7-二甲氧基-4,5-二氯-6-羧基-熒光素(″JOE″)、N,N,N′,N′-四甲基-6-羧基-羅丹明(″TAMRA″)、6-羧基-X-羅丹明(″ROX″)、HEX、TET、IRD40和IRD41;包括但不限于Cy3、Cy3.5和Cy5的氰胺(cyamine)染料;包括但不限于BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650和BODIPY-650/670的BODIPY染料;以及包括但不限于ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568和ALEXA-594的ALEXA染料;以及精通本領(lǐng)域的技術(shù)人員已知的其它熒光染料。
在本發(fā)明的在一些實(shí)施方案中,測量了多個不同雜交時間的雜交數(shù)據(jù)從而可確定平衡雜交水平的變化。這種實(shí)施方案中,用標(biāo)記的多核苷酸測量雜交水平,最優(yōu)選在從零點(diǎn)到超過對結(jié)合的多核苷酸(即一個或多個探針)進(jìn)行取樣所需的時間的雜交時間跨度范圍內(nèi)進(jìn)行測量,以使混合物接近平衡,且雙鏈體的濃度取決于親和力和豐度而不是擴(kuò)散程度。然而,雜交時間宜盡可能短以使標(biāo)記的多核苷酸與探針和/或表面之間不發(fā)生不可逆的結(jié)合相互作用,或者至少使這種作用是有限的。例如,在用多核苷酸陣列探測片段化的多核苷酸的復(fù)雜混合物的實(shí)施方案中,雜交時間通常為0-72小時。其它實(shí)施方案的合適雜交時間將取決于特定的多核苷酸序列和所用探針,并且可由精通本領(lǐng)域的技術(shù)人員決定(參見,例如,Sambrook等編,1989,Molecular Cloning.A Laboratory Manual,第二版,第1-3卷,Cold SpringHarbor Laboratory,Cold Spring Harbor,New York)。
在一實(shí)施方案中,在不同的同種微陣列上分別測量不同雜交時間的雜交水平。對于每種這樣的測量,在測量雜交水平的雜交時間上,簡單洗滌微陣列,優(yōu)選在室溫下用高至中等鹽濃度(例如,0.5-3M鹽濃度)的水溶液在能保留所有結(jié)合或雜交的多核苷酸而除去所有未結(jié)合的多核苷酸的條件下進(jìn)行洗滌。然后用適合所用特定標(biāo)記方法的方法來測量各個探針上保留的雜交的多核苷酸分子上的可檢測標(biāo)記。然后將所得雜交水平組合而形成雜交曲線。在另一實(shí)施方案中,雜交水平是用單個微陣列實(shí)時測量的。在該實(shí)施方案中,使微陣列無干擾地與樣品雜交,并在每個雜交時間點(diǎn)以非侵入性的方式檢測微陣列。在其它實(shí)施方案中,可以使用一個陣列,短時間雜交,洗滌并測量雜交水平,將該陣列加入到相同樣品中,再雜交一段時間,洗滌并再次測量以得到雜交時間曲線。
優(yōu)選測量兩個不同雜交時間內(nèi)的至少兩種雜交水平,第一雜交水平的測量在與交叉雜交平衡的時間范圍接近的雜交時間內(nèi)進(jìn)行,第二雜交水平的測量在長于第一雜交時間的雜交時間內(nèi)進(jìn)行。交叉雜交平衡的時間范圍取決于樣品條件和探針序列,并且可由本領(lǐng)域的技術(shù)人員來確定。在優(yōu)選的實(shí)施方案中,第一雜交水平在約1-10小時內(nèi)進(jìn)行測量,第二雜交在第一雜交時間的2、4、6、10、12、16、18、48或72倍時間時進(jìn)行測量。
5.5.1.1制備微陣列的探針如上所述,根據(jù)本發(fā)明,與特定多核苷酸分子如外顯子特異性雜交的″探針″是互補(bǔ)的多核苷酸序列。優(yōu)選為每個靶外顯子選擇一個或多個探針。例如,當(dāng)用最小數(shù)目的探針來檢測外顯子時,該探針通常包含長度大于40個堿基的核苷酸序列?;蛘撸?dāng)用一大組冗余探針來檢測外顯子時,該探針通常包含40-60個堿基的核苷酸序列。所述探針還可以包含與全長外顯子互補(bǔ)的序列。外顯子的長度可從小于50個堿基到大于200個堿基。因此,當(dāng)使用長度大于外顯子的探針時,優(yōu)選用相鄰組成型剪切外顯子序列來擴(kuò)增該外顯子序列,從而使探針序列與含有標(biāo)靶外顯子的連續(xù)的mRNA片段互補(bǔ)。這樣可使外顯子序型分析陣列的探針之間具有可比較的雜交嚴(yán)謹(jǐn)性。應(yīng)理解,除了與其靶序列互補(bǔ)的序列之外,各個探針序列也可含有接頭序列。
所述探針可包含與生物基因組中各個基因的各個外顯子的部分相對應(yīng)的DNA或DNA″模擬物″(例如,衍生物或類似物)。在一實(shí)施方案中,微陣列的探針與RNA或RNA模擬物互補(bǔ)。DNA模擬物是由能夠與DNA特異性Watson-Crick樣雜交或與RNA特異性雜交的亞單位構(gòu)成的聚合物。核酸可在堿基部分、糖部分或在磷酸主鏈上被修飾。示例性的DNA模擬物包括,例如硫代磷酸酯。例如,可通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增來自基因組DNA、cDNA(例如通過RT-PCR)或克隆序列的外顯子片段來獲得DNA。優(yōu)選基于外顯子或cDNA的已知序列選擇PCR引物,這樣可擴(kuò)增出獨(dú)特的片段(例如,不與微陣列上的任何其它片段共享10個以上堿基的連續(xù)相同序列的片段)。本領(lǐng)域熟知的用來設(shè)計具有所需特異性和最佳擴(kuò)增特性的引物的計算機(jī)程序例如有Oligo 5.0版(National Biosciences)。微陣列上的各個探針的長度通常為20-600個堿基,且經(jīng)常為30-200個堿基。PCR方法是本領(lǐng)域熟知的,并描述在,例如,Innis等編,1990,戶CRProtocolsA Guide to Methods andApplications,Academic Press Inc.,San Diego,CA中。精通本領(lǐng)域的技術(shù)人員將知道,可用受控的機(jī)器人系統(tǒng)來分離和擴(kuò)增核酸。
產(chǎn)生微陣列多核苷酸探針的可選優(yōu)選方法是用例如N-膦酸鹽或亞磷酰胺化學(xué)方法來合成合成的多核苷酸或寡核苷酸(Froehler等,1986,NucleicAcid Res.145399-5407;McBride等,1983,Tetrahedron Lett.24246-248)。合成序列的長度通常為15-600個堿基,更通常為20-100個堿基,最優(yōu)選為40-70個堿基。在一些實(shí)施方案中,合成的核酸包括非天然堿基,例如但不限于肌苷。如上所述,核酸類似物可被用作雜交的結(jié)合位點(diǎn)。合適的核酸類似物的例子是肽核酸(參見,例如,Egholm等,1993,Nature 363566-568;以及美國專利第5,539,083號)。
在另一個實(shí)施方案中,雜交位點(diǎn)(即探針)是從質(zhì)?;蚴删w的克隆基因、cDNA(例如表達(dá)的序列標(biāo)記)或其插入物制得的(Nguyen等,1995,Genomics 29207-209)。
5.5.1.2.將核酸結(jié)合到固體表面可將已經(jīng)形成的多核苷酸探針沉積到支持物上以形成陣列?;蛘呖稍谥С治锷现苯雍铣啥嗪塑账崽结榿硇纬申嚵?。將探針結(jié)合到固體支持物或表面,該固體支持物或表面可由,例如玻璃、塑料(例如聚丙烯、尼龍)、聚丙烯酰胺、硝基纖維素膜、凝膠或其它多孔或無孔材料制成。
將核酸結(jié)合到表面的優(yōu)選方法是在玻璃板上印刷,該方法通常描述在Schena等,1995,Science 270467-470。該方法對于制備cDNA微陣列特別有效(也可參見DeRisi等,1996,Nature Genetics 14457-460;Shalon等,1996,Genome Res.6639-645;和Schena等,1995,Proc.Natl.Acad.Sci.U.S.A.9310539-11286)。
制造微陣列的第二優(yōu)選方法是制造高密度多核苷酸陣列。已知制造在表面的預(yù)定位置,制造含有數(shù)千個與預(yù)定序列互補(bǔ)的寡核苷酸陣列的技術(shù)是已知的,有原位合成的照相平版印刷術(shù)(參見,F(xiàn)odor等,1991,Science 251767-773;Lockhart等,1996,Nature Biotechnology 141675;美國專利No.5,578,832;5,556,752和5,510,270),或快速合成并沉積預(yù)定的多核苷酸的其它方法(Blanchard等,Biosensors & Bioelectronics 11687-690)。當(dāng)使用這些方法時,已知序列的寡核苷酸(例如,60聚體)是在衍生的玻璃載玻片等表面直接合成的。制得的陣列可以是冗余的,每個外顯子具有多個多核苷酸分子。
也可使用制造微陣列的其它方法,例如,通過掩蔽(Maskos和Southern,1992,Nucl.Acids.Res.201679-1684)。原則上,如上文所述,可使用任何類型的陣列,例如尼龍雜交膜斑點(diǎn)印跡雜交(參見Sambrook等,同上)。然而,精通本領(lǐng)域的技術(shù)人員將知道,由于雜交體積較小,較小的陣列通常是優(yōu)選的。
在特別優(yōu)選的實(shí)施方案中,本發(fā)明的微陣列是用合成寡核苷酸的噴墨印刷裝置制造的,例如使用以下文獻(xiàn)中描述的方法和系統(tǒng)Blanchard的1998年9月24日公開的國際專利公開WO 98/41531;Blanchard等,1996,Biosensors and Bioelectronics 11687-690;Blanchard,1998,Synthetic DNAArray in Genetic Engineering,第20卷,J.K.Setlow編,Plenum Press,NewYork,第111-123頁;以及Blanchard的美國專利號6,028,189。具體地說,這種微陣列中的多核苷酸探針優(yōu)選在例如玻璃載玻片上的陣列中,通過連續(xù)沉積碳酸丙烯等高表面張力溶劑的“微滴”中的各個核苷酸堿基來合成。所述微滴的體積較小(例如,100pL或更小,更優(yōu)選50pL或更小)并且在微陣列上是相互分離的(例如,通過疏水結(jié)構(gòu)域)以形成限定陣列元素(例如,不同的探針)位置的圓形表面張力孔。多核苷酸探針通常在多核苷酸的3’端共價結(jié)合到表面?;蛘?,多核苷酸探針可在多核苷酸的5’端共價結(jié)合到表面(參見,例如,Blanchard,1998,Synthetic DNA Array in Genetic Engineering 20,Setlow編,Plenum Press,New York,第111-123頁)。
5.5.1.3.靶多核苷酸分子可用本發(fā)明的方法和組合物分析靶多核苷酸,其中包括RNA分子,例如但不限于信使RNA(mRNA)分子、核糖體RNA(rRNA)分子、cRNA分子(即從體內(nèi)轉(zhuǎn)錄的cDNA分子制得的RNA分子)及其片段。也可用本發(fā)明的方法和組合物分析靶多核苷酸,其中包括但不限于染色體組DNA分子、cDNA分子以及包括寡核苷酸、EST、STS的它們的片段等的DNA分子。
所述靶多核苷酸可來自任何來源。例如,所述靶多核苷酸分子可以是天然產(chǎn)生的核酸分子,如分離自生物體的染色體DNA或染色體組外DNA分子,或是RNA分子,如分離自生物體的mRNA分子?;蛘撸龆嗪塑账岱肿涌梢允呛铣傻?,其中包括例如在體內(nèi)或體外通過酶法合成的核酸分子,如cDNA分子,或是通過PCR合成的多核苷酸分子,通過體外轉(zhuǎn)錄合成的RNA分子等。靶多核苷酸樣品可包括,例如,DNA分子、RNA分子或是DNA和RNA共聚物的分子。在優(yōu)選的實(shí)施方案中,本發(fā)明的靶多核苷酸將與特定的基因或特定的基因轉(zhuǎn)錄物(例如,與細(xì)胞中表達(dá)的特定mRNA序列或與衍生自這種mRNA序列的特定cDNA序列)相對應(yīng)。然而,在許多實(shí)施方案中,尤其是在其中的多核苷酸分子衍生自哺乳動物細(xì)胞的那些實(shí)施方案中,所述靶多核苷酸可與基因轉(zhuǎn)錄物的特定片段相對應(yīng)。例如,所述靶多核苷酸可與相同基因的不同外顯子相對應(yīng),從而可檢測和/或分析該基因的不同剪切變異體。
在優(yōu)選的實(shí)施方案中,待分析的靶多核苷酸是用提取自細(xì)胞的核酸在體外制備的。例如,一實(shí)施方案中,RNA提取自細(xì)胞(例如,總細(xì)胞RNA、多聚(A)+信使RNA或其片段),而信使RNA是從提取的總RNA純化的。制備總RNA和多聚(A)+RNA的方法是本領(lǐng)域熟知的且通常如Sambrook等所述,同上。在一實(shí)施方案中,通過用硫氰酸胍溶胞從細(xì)胞中提取本發(fā)明感興趣的各種類型的RNA,然后通過CsCl離心并用寡dT純化從(Chirgwin等,1979,Biochemistry 185294-5299)。在另一實(shí)施方案中,通過用硫氰酸胍溶胞從細(xì)胞中提取RNA然后在Rneasy柱(Qiagen)上進(jìn)行純化。然后用例如寡-dT或隨機(jī)引物從純化的mRNA中分析cDNA。在優(yōu)選的實(shí)施方案中,所述靶多核苷酸是從提取自細(xì)胞的純化的信使RNA制備的cRNA。在本發(fā)明中,cRNA被定義為與來源RNA互補(bǔ)的RNA。提取的RNA用一種方法擴(kuò)增,在該方法中,雙鏈cDNA是在進(jìn)行反義RNA轉(zhuǎn)錄的方向上,用連接到RNA聚合酶啟動子的引物從RNA上合成的。然后用RNA聚合酶,從雙鏈cDNA的第二鏈轉(zhuǎn)錄反義RNA或cRNA(參見,例如,美國專利號5,891,636、5,716,785、5,545,522和6,132,997;也可參見美國專利號6,271,002和2002年11月28日提交的Ziman等的美國臨時專利申請序列號60/253,641)。含有RNA聚合酶啟動子或其補(bǔ)體的寡-dT引物(美國專利號5,545,522和6,132,997)或隨機(jī)引物(2002年11月28日提交的Ziman等的美國臨時專利申請序列號60/253,641)都可使用。優(yōu)選地,靶多核苷酸是代表所述細(xì)胞的原始核酸種類的短的多核苷酸分子和/或片段化的多核苷酸分子。
優(yōu)選地,要用本發(fā)明的方法和組合物分析的靶多核苷酸被可檢測地標(biāo)記。例如,cDNA可用例如核苷酸類似物直接進(jìn)行標(biāo)記,或者用第一鏈作為模板,用標(biāo)記的第二cDNA鏈間接進(jìn)行標(biāo)記。或者可將雙鏈cDNA轉(zhuǎn)錄入cRNA并進(jìn)行標(biāo)記。
優(yōu)選地,可檢測的標(biāo)記是熒光標(biāo)記,例如,摻入核苷酸類似物。適合用于本發(fā)明的其它標(biāo)記包括但不限于生物素、免疫生物素、抗原、輔因子、二硝基酚、硫辛酸、烯類化合物、可檢測的多肽、富含電子的分子、通過對底物的作用能夠產(chǎn)生可檢測信號的酶以及放射性同位素。優(yōu)選的放射性同位素包括32P、35S、14C、15N和125I。適合用于本發(fā)明的熒光分子包括但不限于熒光素及其衍生物、羅丹明及其衍生物、得克薩斯紅、5-羧基-熒光素(″FMA″)、2,7-二甲氧基-4,5-二氯-6-羧基-熒光素(″JOE″)、N,N,N′,N′-四甲基-6-羧基-羅丹明(″TAMRA″)、6-羧基-X-羅丹明(″ROX″)、HEX、TET、IRD40和IRD41。適合用于本發(fā)明的熒光分子還包括包括但不限于Cy3、Cy3.5和Cy5的氰胺(cyamine)染料;包括但不限于BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650和BODIPY-650/670的BODIPY染料;以及包括但不限于ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568和ALEXA-594的ALEXA染料;以及精通本領(lǐng)域的技術(shù)人員已知的其它熒光染料。適合用于本發(fā)明的富含電子的指示分子包括但不限于鐵蛋白、血藍(lán)蛋白和膠體金?;蛘撸诓皇謨?yōu)選的實(shí)施方案中,可通過使第一基團(tuán)與多核苷酸特異性復(fù)合來標(biāo)記靶多核苷酸。與對第一基團(tuán)具有親和力的指示分子共價結(jié)合的第二基團(tuán)可用來間接檢測靶多核苷酸。在這種實(shí)施方案中,適合用作第一基團(tuán)的化合物包括但不限于生物素和免疫生物素。適合用作第二基團(tuán)的化合物包括但不限于抗生物素蛋白和鏈霉抗生物素蛋白。
5.5.1.4.與微陣列雜交如上所述,選擇核酸雜交和洗滌條件,使本發(fā)明待分析的多核苷酸分子(在此稱為“靶多核苷酸分子”)與陣列的互補(bǔ)多核苷酸序列,優(yōu)選與特定的陣列位點(diǎn)特異性結(jié)合或特異性雜交,其中其互補(bǔ)DNA是定位的。
含有定位在其上的雙鏈探針DNA的陣列優(yōu)選被置于變性條件,以使DNA在接觸靶多核苷酸分子之前先單鏈化。含有單鏈化的探針DNA(例如,合成的寡脫氧核糖核酸)的陣列可能需要在接觸靶多核苷酸分子之前被變性,例如,以除去由于自身互補(bǔ)序列形成的發(fā)夾或二聚體。
最佳的雜交條件取決于探針和靶核酸的長度(例如,大于200個堿基的寡聚體和多核苷酸)和類型(例如,RNA或DNA)。特定的(即嚴(yán)謹(jǐn)?shù)?核酸雜交參數(shù)的一般闡述描述在Sambrook等(同上)和Ausubel等,1987,CurrentProtocols in Molecular Biology,Greene Publishing and Wiley-Interscience,NewYork中。當(dāng)使用Schena等的cDNA微陣列時,典型的雜交條件是在5×SSC+0.2%SDS中于65℃雜交4小時,然后在25℃用低嚴(yán)謹(jǐn)性洗滌緩沖液(1×SSC+0.2%SDS)洗滌,然后在25℃用較高嚴(yán)謹(jǐn)性洗滌緩沖液(0.1×SSC+0.2%SDS)洗滌10分鐘(Schena等,1996,Proc.Natl.Acad.Sci.U.S.A.9310614)。有效的雜交條件如下列文獻(xiàn)所述,例如,Tijessen,1993,HybridizationWith Nucleic Acid Probes,Elsevier Science Publishers B.V.和Kricka,1992,Nonisotopic DNA Probe Techniques,Academic Press,San Diego,CA。
特別優(yōu)選的用來篩選本發(fā)明芯片和/或使其產(chǎn)生信號的雜交條件包括在接近探針平均接連溫度的溫度下(例如,在5℃內(nèi),優(yōu)選2℃內(nèi))在1M NaCl、50mM MES緩沖液(pH 6.5)、0.5%肌氨酸鈉和30%甲酰胺中雜交。
5.5.1.5.信號檢測和數(shù)據(jù)分析應(yīng)該理解,當(dāng)制得與細(xì)胞的RNA互補(bǔ)的靶序列(例如cDNA或cRNA)并使其在合適的雜交條件下與微陣列雜交時,與陣列中與任何特定基因的外顯子相應(yīng)的位點(diǎn)的雜交水平將反映該細(xì)胞中含有從該基因轉(zhuǎn)錄的外顯子的一個或多個mRNA的豐度。例如,當(dāng)使與細(xì)胞的總mRNA互補(bǔ)的可檢測地標(biāo)記的(例如,用熒光團(tuán))cDNA與微陣列雜交時,該陣列中與未轉(zhuǎn)錄的或在細(xì)胞的RNA剪切期間被除去的基因的外顯子(即能夠特異性結(jié)合該基因的一種或多種表達(dá)產(chǎn)物)相對應(yīng)的位點(diǎn)將產(chǎn)生極少或不產(chǎn)生信號(例如,熒光信號),而編碼的mRNA普遍表達(dá)外顯子的基因的該外顯子將具有相對較強(qiáng)的信號。然后通過為該基因所監(jiān)控的所有外顯子系列的信號強(qiáng)度模式確定,由相同基因通過選擇剪切產(chǎn)生的不同mRNA的相對豐度。
在優(yōu)選的實(shí)施方案中,來自兩種不同細(xì)胞的靶序列,例如cDNA或cRNA,與微陣列的結(jié)合位點(diǎn)雜交。在藥物應(yīng)答中,一種細(xì)胞樣品暴露于藥物而另一種相同類型的細(xì)胞樣品不暴露于藥物。在路徑應(yīng)答中,一種細(xì)胞暴露于路徑干擾而另一種相同類型的細(xì)胞不暴露于路徑干擾。來自兩種細(xì)胞類型中每一種的cDNA被不同標(biāo)記以使它們可被辨別。在一實(shí)施方案中,例如,用熒光素標(biāo)記的dNTP合成了來自用藥物處理過的(或暴露于路徑干擾的)細(xì)胞的cDNA,用羅丹明標(biāo)記的dNTP合成了來自第二種未暴露于藥物的細(xì)胞的cDNA。當(dāng)將兩種cDNA混合并與微陣列雜交時,確定了陣列每個位置上各cDNA組的相對信號強(qiáng)度,并檢測了特定外顯子豐度的任何相對差異。
在上述實(shí)施例中,當(dāng)熒光團(tuán)被激發(fā)時來自用藥物處理過的(或路徑干擾的)細(xì)胞的cDNA將呈現(xiàn)熒光綠色,而來自未處理細(xì)胞的cDNA將呈現(xiàn)熒光紅色。其結(jié)果是,當(dāng)藥物處理對細(xì)胞內(nèi)特定基因的轉(zhuǎn)錄和/或轉(zhuǎn)錄后剪切無直接或間接影響時,則兩種細(xì)胞內(nèi)的外顯子表達(dá)模式將無法區(qū)分,紅色標(biāo)記的和綠色標(biāo)記的cDNA在逆轉(zhuǎn)錄時將是等量的。當(dāng)與微陣列雜交時,RNA的結(jié)合位點(diǎn)將發(fā)射出兩種熒光團(tuán)的特征波長。相反,當(dāng)用直接或間接改變細(xì)胞內(nèi)特定基因的轉(zhuǎn)錄和/或轉(zhuǎn)錄后加工的藥物處理暴露于藥物的細(xì)胞時,用每個外顯子結(jié)合位點(diǎn)的綠色和紅色熒光比例表示的外顯子表達(dá)模式將改變。當(dāng)該藥物增加一種mRNA的量時,則這種mRNA中表達(dá)的各個外顯子的比例將上升,而當(dāng)該藥物降低一種mRNA的量時,則這種mRNA中表達(dá)的各個外顯子的比例將下降。
關(guān)于mRNA的檢測,已有描述用雙色熒光標(biāo)記和檢測方法來鑒定基因表達(dá)的變化,例如,在Schena等,1995,Science 270467-470,出于所有目的,該文獻(xiàn)被全文納入本文作為參考。該方法也可用來標(biāo)記和檢測外顯子。使用用兩種不同熒光團(tuán)標(biāo)記的靶序列,如cDNA或cRNA的優(yōu)點(diǎn)在于,可直接并內(nèi)部可控地比較在兩種細(xì)胞狀態(tài)中,每種排列的基因所對應(yīng)的mRNA或外顯子的表達(dá)水平,且由于試驗(yàn)條件(例如,雜交條件)的細(xì)微差異導(dǎo)致的變化不會影響隨后的分析。然而,也可使用來自一種細(xì)胞的cDNA,并且比較(例如)比如用藥物處理過的或路徑干擾的細(xì)胞以及未處理細(xì)胞中特定外顯子的絕對量。
當(dāng)使用熒光標(biāo)記的探針時,轉(zhuǎn)錄物陣列各個位點(diǎn)的熒光輻射可優(yōu)選通過掃描共焦激光顯微鏡來檢測。在一實(shí)施方案中,使用合適的激發(fā)線對所使用的兩個熒光團(tuán)中的每一個進(jìn)行獨(dú)立掃描?;蛘呖梢允褂眉す?,從而可以在這兩種熒光團(tuán)的特異性波長下同時照射標(biāo)本,并可同時分析這兩種熒光團(tuán)的發(fā)射(見Shalon等,1996,Genome Res.6639-645)。在優(yōu)選的實(shí)施方案中,該陣列用具有計算機(jī)控制的X-Y鏡臺的激光熒光掃描儀和顯微鏡物鏡掃描。用多線混合氣體激光獲得兩種熒光團(tuán)的連續(xù)激發(fā),按照波長拆分發(fā)射光并用兩個光電倍增管檢測。這種熒光激光掃描裝置描述在,例如,Schena等,1996,Genome Res.6639-645中?;蛘?,可用Ferguson等(1996,Nature Biotech.141681-1684)描述的光導(dǎo)纖維束來同時監(jiān)測大量位點(diǎn)的mRNA豐度水平。
在優(yōu)選的實(shí)施方案中,信號是通過計算機(jī)記錄和分析的,例如用數(shù)字板的12位模擬器。在一實(shí)施方案中,掃描圖象用圖形程序(例如,HijaakGraphics Suite)降噪,然后用圖象網(wǎng)格程序(image gridding program)來分析,該程序可產(chǎn)生每個位點(diǎn)在各個波長下的平均雜交的電子數(shù)據(jù)表。如果需要的話,可以對兩種熒光染料通道之間的“串?dāng)_”(或重疊)進(jìn)行實(shí)驗(yàn)驗(yàn)證性校正。對轉(zhuǎn)錄物陣列上任何特定的雜交位點(diǎn),可計算出兩種熒光團(tuán)的發(fā)射比。該比值與同源基因的絕對表達(dá)水平無關(guān),但對于其表達(dá)受給藥、基因缺失或其它任何待檢事件顯著調(diào)控的基因是有用的。
根據(jù)本發(fā)明的方法,mRNA和/或在兩種細(xì)胞或細(xì)胞系的mRNA中表達(dá)的外顯子的相對豐度被記錄為受干擾(即兩種被檢mRNA來源的豐度不同)或不受干擾(即相對豐度相同)。在本發(fā)明中,兩種RNA來源之間的差異因子至少為25%(例如,一種來源的RNA比另一種來源的豐度大25),更通常為50%,更通常為2(例如多兩倍),3(多三倍)或5(多5倍),這被記錄為干擾。目前的檢測方法能夠可靠檢測1.5倍到3倍的差異。
然而,檢測mRNA和/或在兩種細(xì)胞或細(xì)胞系的mRNA中表達(dá)的外顯子豐度的相對差異幅度也是有益的。如上所述,這可通過計算用來區(qū)分標(biāo)記的兩種熒光團(tuán)的發(fā)射比或通過本領(lǐng)域的技術(shù)人員易于了解的類似方法來進(jìn)行。
5.5.2測量轉(zhuǎn)錄狀態(tài)的其它方法細(xì)胞的轉(zhuǎn)錄狀態(tài)可通過本領(lǐng)域已知的其它基因表達(dá)技術(shù)來測量。這種技術(shù)中的一些產(chǎn)生具有有限復(fù)雜性的用于電泳分析的限制性片段的庫,如將雙限制性酶消化和定相引物相結(jié)合的方法(參見,例如,Zabeau等于1992年9月24日提交的歐洲專利534858A1),或選擇具有與預(yù)定的mRNA末端最接近的位點(diǎn)的限制性片段的方法(參見,例如,Prashar等,1996,Proc.Natl.Acad.Sci.USA 93659-663)。其它方法包括從cDNA庫統(tǒng)計學(xué)取樣,如對多個cDNA中每一個的足夠堿基(例如,20-50個堿基)進(jìn)行測序以鑒定每個cDNA,或在相應(yīng)于預(yù)定的mRNA末端的已知位置上對產(chǎn)生的短標(biāo)記(例如,9-10個堿基)進(jìn)行測序(見,例如,Velculescu,1995,Science 270484-487)。
細(xì)胞的轉(zhuǎn)錄狀態(tài)也可通過逆轉(zhuǎn)錄-聚合酶鏈?zhǔn)椒磻?yīng)(RT-PCR)來測量。RT-PCR是一種檢測和量化mRNA的技術(shù)。RT-PCR的敏感性足以量化單個細(xì)胞的RNA。參見,例如,Pfaffl和Hageleit,2001,Biotechnology Letters 23,275-282;Tadesse等,2003,Mol Genet Genomics 269,p.789-796;以及Kabir和Shimizu,2003,J.Biotech.9,p.105。
5.6生物學(xué)狀態(tài)其它方面的測量在本發(fā)明不同的實(shí)施方案中,可測量轉(zhuǎn)錄狀態(tài)之外的生物學(xué)狀態(tài)方面,例如翻譯狀態(tài)、活性狀態(tài)或混合方面。因此,在這些實(shí)施方案中,細(xì)胞成分豐度數(shù)據(jù)可包括翻譯狀態(tài)的測量值或者甚至蛋白質(zhì)表達(dá)的測量值。本部分描述了轉(zhuǎn)錄狀態(tài)之外的生物學(xué)狀態(tài)方面的細(xì)節(jié)。
5.6.1翻譯狀態(tài)的測量可用若干種方法來測量翻譯狀態(tài)。例如,可通過構(gòu)建微陣列來進(jìn)行蛋白質(zhì)(例如,“蛋白質(zhì)組”)的染色體組檢測,該微陣列的結(jié)合位點(diǎn)包含固定的、優(yōu)選單克隆的、對由所述細(xì)胞的基因組編碼的多種蛋白質(zhì)有特異性的抗體。優(yōu)選地,抗體呈現(xiàn)編碼的蛋白質(zhì)的實(shí)質(zhì)性部分或至少呈現(xiàn)那些與感興趣藥物的作用有關(guān)的蛋白質(zhì)。制造單克隆抗體的方法是熟知的(參見,例如,Harlow和Lane,1988,AntibodiesA Laboratory Manual,Cold Spring Harbor,New York,出于所有目的該文獻(xiàn)被全文納入本文)。在一實(shí)施方案中,培育的單克隆抗體對基于細(xì)胞的染色體組序列而設(shè)計的合成的多肽片段有抗性。用這種抗體陣列,來自該細(xì)胞的蛋白質(zhì)可與該陣列接觸,并用本領(lǐng)域已知的測定方法檢測了它們的結(jié)合。
或者,蛋白質(zhì)可通過雙相凝膠電泳系統(tǒng)分離。雙相凝膠電泳是本領(lǐng)域熟知的,通常包括第一相的等電聚焦和第二相的SDS-PAGE電泳。參見,例如,Hames等,1990,Gel Electrophoresis of ProteinsA Practical Approach,IRL Press,New York;Shevchenko等,1996,Proc.Natl.Acad.Sci.USA931440-1445;Sagliocco等,1996,Yeast 121519-1533;Lander,1996,Science274536-539。所得電泳圖可用多種技術(shù)進(jìn)行分析,其中包括質(zhì)譜技術(shù)、Western印跡和使用多克隆和單克隆抗體的免疫印跡分析,以及內(nèi)部和N-末端微測序。使用這些技術(shù)能夠鑒定在給定的生理?xiàng)l件下,包括在暴露于藥物的細(xì)胞(例如,酵母)內(nèi)或在通過例如缺失或過度表達(dá)特定基因進(jìn)行修飾的細(xì)胞內(nèi)產(chǎn)生的所有蛋白質(zhì)的實(shí)質(zhì)性部分。
5.6.2細(xì)胞成分豐度其它類型的測量本發(fā)明的方法可用于任何可監(jiān)測的細(xì)胞成分。例如,當(dāng)測量蛋白質(zhì)活性時,本發(fā)明的實(shí)施方案可采用這種測定方法??捎眠m于被表征的特定活性的任何功能、生化或物理方法來測量活性。當(dāng)活性涉及化學(xué)轉(zhuǎn)化時,可使細(xì)胞蛋白質(zhì)接觸天然底物并測量轉(zhuǎn)化率。當(dāng)活性涉及多個測量單位之間的聯(lián)系,例如活化的DNA結(jié)合復(fù)合體與DNA的關(guān)系時,可測量有關(guān)蛋白質(zhì)的量或這種關(guān)聯(lián)的二級結(jié)果,如轉(zhuǎn)錄的mRNA的量。同樣,當(dāng)僅僅已知功能活性時,例如在細(xì)胞周期控制中,可觀察這種功能的表現(xiàn)。盡管是已知地和經(jīng)過測量的,蛋白質(zhì)活性的改變構(gòu)成用本發(fā)明的上述方法分析的應(yīng)答數(shù)據(jù)。
在本發(fā)明的在一些實(shí)施方案中,細(xì)胞成分的測量來自細(xì)胞表型技術(shù)。這種細(xì)胞表型技術(shù)之一使用細(xì)胞的呼吸作用作為通用指標(biāo)。在一實(shí)施方案中,提供了在每個孔中含有其特有化學(xué)物質(zhì)的96孔微量滴定板。每種特有化學(xué)物質(zhì)設(shè)計來檢測特定的表型。將感興趣生物的細(xì)胞吸取到每個孔中。如果細(xì)胞顯示出合適的表型,它們將進(jìn)行呼吸并主動減少四唑染料,形成非常深的紫色。弱表型將導(dǎo)致較淺的顏色。無色意味著該細(xì)胞不具有特定的表型。可以以每小時數(shù)次的頻率記錄顏色變化。在一次溫育時,可檢測5000種以上的表型。參見,例如,Bochner等,2001,Genome Research 11,p.1246。
在本發(fā)明的在一些實(shí)施方案中,細(xì)胞成分的測量來自細(xì)胞表型技術(shù)。這種細(xì)胞表型技術(shù)之一使用細(xì)胞的呼吸作用作為通用指標(biāo)。在一實(shí)施方案中,提供了在每個孔中含有其特有化學(xué)物質(zhì)的96孔微量滴定板。每種特有化學(xué)物質(zhì)設(shè)計來檢測特定的表型。將感興趣生物的細(xì)胞吸取到每個孔中。如果細(xì)胞顯示出合適的表型,它們將進(jìn)行呼吸并主動減少四唑染料,形成非常深的紫色。弱表型將導(dǎo)致較淺的顏色。無色意味著該細(xì)胞不具有特定的表型??梢砸悦啃r數(shù)次的頻率記錄顏色變化。在一次溫育時,可檢測5000種以上的表型。參見,例如,Bochner等,2001,Genome Research 11,p.1246。
在本發(fā)明的在一些實(shí)施方案中,測量的細(xì)胞成分是代謝物。代謝物包括但不限于氨基酸、金屬、可溶性糖類、磷酸糖類和復(fù)合碳水化合物。這種代謝物可在例如全細(xì)胞水平用諸如以下方法測量熱解質(zhì)譜(Irwin,1982,Analytical PyrolysisA Comprehensive Guide,Marcel Dekker,New York;Meuzelaar等,1982,Pyrolysis MassSpectrometry of Recent and FossilBiomaterials,Elsevier,Amsterdam)、傅里葉變換紅外光譜(Griffiths和deHaseth,1986,F(xiàn)ourier transform infrared spectrometry,John Wiley,New York;Helm等,1991,J.Gen.Microbiol.137,69-79;Naumann等,1991,Nature351,81-82;Naumann等,1991,摘自Nelson,W.H.編的Modern techniquesfor rapid microbiological analysis,43-96,VCH Publishers,New York)、拉曼光譜、氣相色譜-質(zhì)譜(GC-MS)(Fiehn等,2000,Nature Biotechnology 18,1157-1161)、毛細(xì)管電泳(CE)/MS、高效液相色譜/質(zhì)譜(HPLC/MS)以及液相色譜(LC)-電霧化和毛細(xì)管-LC-串聯(lián)-電霧化質(zhì)譜。這些方法可與使用人造神經(jīng)網(wǎng)絡(luò)和遺傳程序的已有化學(xué)檢測法聯(lián)合來區(qū)別極其相關(guān)的樣品。
5.7分析試劑盒的使用在一實(shí)施方案中,可以通過使用試劑盒來實(shí)施本發(fā)明的方法以開發(fā)和使用生物學(xué)分類器。這種試劑盒含有微陣列,如以上章節(jié)所述。這種試劑盒所含的微陣列包含固相,例如表面,探針在所述固相的已知位置與其雜交或結(jié)合。優(yōu)選地,這些探針由已知的不同序列的核酸構(gòu)成,每種核酸能夠與產(chǎn)生該核酸的RNA種類或cDNA種類雜交。在具體的實(shí)施方案中,本發(fā)明試劑盒中所含的探針是能夠與來自從感興趣的生物中收集的細(xì)胞的RNA種類的核酸序列特異性雜交的核酸。
在優(yōu)選的實(shí)施方案中,本發(fā)明的試劑盒還含有一種或多種上文和圖1-3和/或5中所述的在計算機(jī)可讀介質(zhì)上編碼的數(shù)據(jù)結(jié)構(gòu)和/或軟件模塊,和/或遠(yuǎn)程網(wǎng)絡(luò)計算機(jī)使用上述數(shù)據(jù)庫的訪問授權(quán)。
在另一個優(yōu)選的實(shí)施方案中,本發(fā)明的試劑盒含有能夠加載到計算機(jī)系統(tǒng)的存儲器中的軟件,所述存儲器如上文所述并示于圖1。本發(fā)明的試劑盒中所含的軟件與上文結(jié)合圖1描述的軟件在本質(zhì)上是相同的。
用來實(shí)施本發(fā)明分析方法的其它試劑盒對于精通本領(lǐng)域的技術(shù)人員而言是顯而易見的,并且包括在附加的權(quán)利要求范圍之內(nèi)。
6.引用的參考資料出于所有目的,這里引用的所有參考資料被全文納入本文作為參考,就如同出于所有目的,各個出版物或?qū)@暾埍恢鹨徊为?dú)全文納入本文作為參考一樣。
本發(fā)明可由計算機(jī)程序產(chǎn)品來實(shí)施,該產(chǎn)品包括嵌入計算機(jī)可讀存儲介質(zhì)中的計算機(jī)程序機(jī)制。例如,所述計算機(jī)程序產(chǎn)品可包含圖1所示的程序模塊和/或圖2和3所示的數(shù)據(jù)庫模式。這些程序模塊可被儲存在CD-ROM、磁盤存儲產(chǎn)品或任何其它計算機(jī)可讀數(shù)據(jù)或程序儲存產(chǎn)品中。所述計算機(jī)程序產(chǎn)品內(nèi)的軟件模塊也可通過電子方法通過因特網(wǎng)散布,或者通過在載體波上傳輸計算機(jī)數(shù)據(jù)信號(其中已嵌入軟件模塊)來散布。
本領(lǐng)域的一般技術(shù)人員顯然應(yīng)該理解,可根據(jù)本發(fā)明公開的技術(shù),可對其進(jìn)行一些改變和修飾,這些改變和修飾仍在所附權(quán)利要求的精神和范圍內(nèi)。這里描述的特定實(shí)施方案僅作為例子提供,本發(fā)明的范圍僅由附加權(quán)利要求以及與其完全等價的范圍決定。
權(quán)利要求
1.計算機(jī),該計算機(jī)包括中央處理單元;與該中央處理單元連接的存儲器,該存儲器儲存(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;(ii)計算多個模型中的模型的指令,其中所述模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,其中所述模型的所述計算包括用多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定模型記分;(iii)重復(fù)所述計算指令一次或多次從而計算所述多個模型的指令;和(iv)使所述計算指令中計算出的各個所述模型記分進(jìn)行通信的指令。
2.如權(quán)利要求1所述的計算機(jī),其特征在于,兩個或更多個模型記分通過所述通信指令進(jìn)行通信,其中所述兩個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
3.如權(quán)利要求1所述的計算機(jī),其特征在于,五個或更多個模型記分通過所述通信指令進(jìn)行通信,其中所述五個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
4.如權(quán)利要求1所述的計算機(jī),其特征在于,所述接收數(shù)據(jù)的指令包括通過廣域網(wǎng)從遠(yuǎn)程計算機(jī)接收所述數(shù)據(jù)的指令。
5.如權(quán)利要求4所述的計算機(jī),其特征在于,所述廣域網(wǎng)是因特網(wǎng)。
6.如權(quán)利要求1所述的計算機(jī),其特征在于,所述通信指令包括通過廣域網(wǎng)將每個所述模型記分發(fā)送到遠(yuǎn)程計算機(jī)的指令。
7.如權(quán)利要求6所述的計算機(jī),其特征在于,所述廣域網(wǎng)是因特網(wǎng)。
8.如權(quán)利要求1所述的計算機(jī),其特征在于,當(dāng)所述模型記分在分值的第一范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為具有多個模型中的模型所代表的生物學(xué)特征;而當(dāng)所述模型記分在分值的第二范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為不具有該模型所代表的生物學(xué)特征。
9.如權(quán)利要求1所述的計算機(jī),其特征在于,所述生物學(xué)特征是疾病。
10.如權(quán)利要求9所述的計算機(jī),其特征在于,所述疾病是癌。
11.如權(quán)利要求9所述的計算機(jī),其特征在于,所述疾病是乳腺癌、肺癌、前列腺癌、結(jié)腸直腸癌、卵巢癌、膀胱癌、胃癌或直腸癌。
12.如權(quán)利要求1所述的計算機(jī),其特征在于,所述多個模型包括以第一模型記分為特征的第一模型和以第二模型記分為特征的第二模型;且其一個或多個特征被用來計算所述第一模型記分的細(xì)胞成分的身份不同于其一個或多個特征被用來計算所述第二模型記分的細(xì)胞成分的身份。
13.如權(quán)利要求1所述的計算機(jī),其特征在于,用來確定所述多個模型中的模型的模型記分的一種或多種細(xì)胞成分的所述一個或多個特征中的特征包括所述物種的所述試驗(yàn)生物或所述物種生物的所述試驗(yàn)生物學(xué)標(biāo)本中的所述一種或多種細(xì)胞成分的豐度。
14.如權(quán)利要求1所述的計算機(jī),其特征在于,所述物種是人。
15.如權(quán)利要求1所述的計算機(jī),其特征在于,所述試驗(yàn)生物學(xué)標(biāo)本是來自腫瘤、血液、骨骼、乳腺、肺、前列腺、結(jié)腸直腸、卵巢、膀胱、胃或直腸的樣品的活檢組織或其它形式。
16.如權(quán)利要求1所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少100種細(xì)胞成分的細(xì)胞成分豐度。
17.如權(quán)利要求1所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少500種細(xì)胞成分的細(xì)胞成分豐度。
18.如權(quán)利要求1所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少5,000種細(xì)胞成分的細(xì)胞成分豐度。
19.如權(quán)利要求1所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的1,000-20,000種細(xì)胞成分的細(xì)胞成分豐度。
20.如權(quán)利要求1所述的計算機(jī),其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分是mRNA、cRNA或cDNA。
21.如權(quán)利要求1所述的計算機(jī),其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是核酸或核糖核酸,且所述細(xì)胞成分的所述一個或多個特征中的特征是通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所有或部分所述細(xì)胞成分的轉(zhuǎn)錄狀態(tài)而獲得的。
22.如權(quán)利要求1所述的計算機(jī),其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是蛋白質(zhì),且所述細(xì)胞成分的所述一個或多個特征中的特征是通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所述細(xì)胞成分的翻譯狀態(tài)獲得的。
23.如權(quán)利要求1所述的計算機(jī),其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是用同位素親和標(biāo)記然后用獲自試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本的樣品進(jìn)行細(xì)胞成分串聯(lián)質(zhì)譜分析確定的。
24.如權(quán)利要求1所述的計算機(jī),其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是通過測量試驗(yàn)生物的樣品或試驗(yàn)生物學(xué)標(biāo)本中的細(xì)胞成分的活性或翻譯后修飾確定的。
25.如權(quán)利要求1所述的計算機(jī),其特征在于,所述生物學(xué)特征是藥物敏感性。
26.如權(quán)利要求1所述的計算機(jī),其特征在于,用所述計算指令計算模型記分的多個模型共同代表兩個或更多個生物學(xué)特征中每一個的可能性。
27.如權(quán)利要求26所述的計算機(jī),其特征在于,所述兩個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
28.如權(quán)利要求26所述的計算機(jī),其特征在于,所述兩個或更多個生物學(xué)特征包括第一疾病和第二疾病。
29.如權(quán)利要求1所述的計算機(jī),其特征在于,用所述計算指令計算模型記分的多個模型共同代表五個或更多個生物學(xué)特征中的每一個的可能性。
30.如權(quán)利要求29所述的計算機(jī),其特征在于,所述五個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
31.如權(quán)利要求29所述的計算機(jī),其特征在于,所述五個或更多個生物學(xué)特征包括第一疾病和第二疾病。
32.如權(quán)利要求1所述的計算機(jī),其特征在于,用所述計算指令計算模型記分的多個模型共同代表2-20個生物學(xué)特征各自的可能性。
33.如權(quán)利要求32所述的計算機(jī),其特征在于,所述2-20個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
34.如權(quán)利要求32所述的計算機(jī),其特征在于,所述2-20個生物學(xué)特征包括第一疾病和第二疾病。
35.計算機(jī),該計算機(jī)包括中央處理單元;與該中央處理單元連接的存儲器,該存儲器儲存(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;(ii)計算多個模型的指令,其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且計算所述多個模型中的單個模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定與該單個模型有關(guān)的模型記分;和(iii)使通過所述計算指令計算出的各個所述模型記分進(jìn)行通信的指令。
36.一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制,該計算機(jī)程序機(jī)制包括(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;(ii)計算多個模型中的模型的指令,其中所述模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分;(iii)重復(fù)所述計算指令一次或多次從而計算多個模型的指令;和(iv)使在所述計算指令中計算出的各個所述模型記分進(jìn)行通信的指令。
37.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,兩個或更多個模型記分通過所述通信指令進(jìn)行通信,且其中所述兩個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
38.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,五個或更多個模型記分通過所述通信指令進(jìn)行通信,且其中所述五個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
39.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,當(dāng)所述模型記分在分值的第一范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為具有多個模型中的模型所代表的生物學(xué)特征;而當(dāng)所述模型記分在分值的第二范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為不具有該模型所代表的生物學(xué)特征。
40.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述生物學(xué)特征是疾病。
41.如權(quán)利要求40所述的計算機(jī)程序產(chǎn)品,其特征在于,所述疾病是癌。
42.如權(quán)利要求40所述的計算機(jī)程序產(chǎn)品,其特征在于,所述疾病是乳腺癌、肺癌、前列腺癌、結(jié)腸直腸癌、卵巢癌、膀胱癌、胃癌或直腸癌。
43.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述多個模型包括以第一模型記分為特征的第一模型和以第二模型記分為特征的第二模型;且其一個或多個特征被用來計算所述第一模型記分的細(xì)胞成分的身份不同于其一個或多個特征被用來計算所述第二模型記分的細(xì)胞成分的身份。
44.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,用來確定所述多個模型中的模型的模型記分的一種或多種細(xì)胞成分的所述一個或多個特征中的特征包括所述物種的所述試驗(yàn)生物或該物種生物的所述試驗(yàn)生物學(xué)標(biāo)本中的所述一種或多種細(xì)胞成分的豐度。
45.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述物種是人。
46.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述試驗(yàn)生物學(xué)標(biāo)本是來自腫瘤、血液、骨骼、乳腺、肺、前列腺、結(jié)腸直腸、卵巢、膀胱、胃或直腸的樣品的活檢組織或其它形式。
47.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少100種細(xì)胞成分的細(xì)胞成分豐度。
48.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少500種細(xì)胞成分的細(xì)胞成分豐度。
49.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少5,000種細(xì)胞成分的細(xì)胞成分豐度。
50.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少1,000-20,000種細(xì)胞成分的細(xì)胞成分豐度。
51.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分是mRNA、cRNA或cDNA。
52.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是核酸或核糖核酸,且所述細(xì)胞成分的所述一個或多個特征中的特征是通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所有或部分所述細(xì)胞成分的轉(zhuǎn)錄狀態(tài)而獲得的。
53.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是蛋白質(zhì),且所述所述細(xì)胞成分的一個或多個特征中的特征在通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所述細(xì)胞成分的翻譯狀態(tài)而獲得的。
54.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是用同位素親和標(biāo)記然后用獲自試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本的樣品進(jìn)行細(xì)胞成分串聯(lián)質(zhì)譜分析確定的。
55.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是通過測量試驗(yàn)生物的樣品或試驗(yàn)生物學(xué)標(biāo)本中的細(xì)胞成分的活性或翻譯后修飾確定的。
56.如權(quán)利要求36所述的計算機(jī)程序產(chǎn)品,其特征在于,所述生物學(xué)特征是藥物敏感性。
57.一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制,該計算機(jī)程序機(jī)制包括(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;(ii)計算多個模型的指令,其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且計算所述多個模型中的單個模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定與該單個模型有關(guān)的模型記分;和(iii)使在所述計算指令中計算出的各個所述模型記分進(jìn)行通信的指令。
58.一種方法,該方法包括接收數(shù)據(jù),其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;計算多個模型中的模型,其中所述模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分;重復(fù)所述計算指令一次或多次從而計算所述多個模型;和使在所述計算中計算出的各個所述模型記分進(jìn)行通信。
59.如權(quán)利要求58所述的方法,其特征在于,兩個或更多個模型記分是通過所述通信步驟進(jìn)行通信的,且其中所述兩個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
60.如權(quán)利要求58所述的方法,其特征在于,五個或更多個模型記分是通過所述通信指令進(jìn)行通信的,且其中所述兩個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
61.如權(quán)利要求58所述的方法,其特征在于,當(dāng)所述模型記分在分值的第一范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為具有多個模型中的模型所代表的生物學(xué)特征;而當(dāng)所述模型記分在分值的第二范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為不具有該模型所代表的生物學(xué)特征。
62.如權(quán)利要求58所述的方法,其特征在于,所述生物學(xué)特征是疾病。
63.如權(quán)利要求62所述的方法,其特征在于,所述疾病是癌。
64.如權(quán)利要求62所述的方法,其特征在于,所述疾病是乳腺癌、肺癌、前列腺癌、結(jié)腸直腸癌、卵巢癌、膀胱癌、胃癌或直腸癌。
65.如權(quán)利要求58所述的方法,其特征在于,所述多個模型包括以第一模型記分為特征的第一模型和以第二模型記分為特征的第二模型;且其一個或多個特征被用來計算所述第一模型記分的細(xì)胞成分的身份不同于其一個或多個特征被用來計算所述第二模型記分的細(xì)胞成分的身份。
66.如權(quán)利要求58所述的方法,其特征在于,用來確定所述多個模型中的模型的模型記分的一種或多種細(xì)胞成分的所述一個或多個特征中的特征包括所述物種的所述試驗(yàn)生物或該物種生物的所述試驗(yàn)生物學(xué)標(biāo)本中的所述一種或多種細(xì)胞成分的豐度。
67.如權(quán)利要求58所述的方法,其特征在于,所述物種是人。
68.如權(quán)利要求58所述的方法,其特征在于,所述試驗(yàn)生物學(xué)標(biāo)本是來自腫瘤、血液、骨骼、乳腺、肺、前列腺、結(jié)腸直腸、卵巢、膀胱、胃或直腸的樣品的活檢組織或其它形式。
69.如權(quán)利要求58所述的方法,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少100種細(xì)胞成分的細(xì)胞成分豐度。
70.如權(quán)利要求58所述的方法,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少500種細(xì)胞成分的細(xì)胞成分豐度。
71.如權(quán)利要求58所述的方法,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少5,000種細(xì)胞成分的細(xì)胞成分豐度。
72.如權(quán)利要求58所述的方法,其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少1,000-20,000種細(xì)胞成分的細(xì)胞成分豐度。
73.如權(quán)利要求58所述的方法,其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分是mRNA、cRNA或cDNA。
74.如權(quán)利要求58所述的方法,其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是核酸或核糖核酸,且所述所述細(xì)胞成分的一個或多個特征中的特征是通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所有或部分所述細(xì)胞成分的轉(zhuǎn)錄狀態(tài)獲得的。
75.如權(quán)利要求58所述的方法,其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是蛋白質(zhì),且所述所述細(xì)胞成分的一個或多個特征中的特征在通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所述細(xì)胞成分的翻譯狀態(tài)獲得的。
76.如權(quán)利要求58所述的方法,其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是用同位素親和標(biāo)記然后用獲自試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本的樣品進(jìn)行細(xì)胞成分串聯(lián)質(zhì)譜分析確定的。
77.如權(quán)利要求58所述的方法,其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是通過測量試驗(yàn)生物的樣品或試驗(yàn)生物學(xué)標(biāo)本中的細(xì)胞成分的活性或翻譯后修飾確定的。
78.如權(quán)利要求58所述的方法,其特征在于,所述生物學(xué)特征是藥物敏感性。
79.如權(quán)利要求58所述的方法,其特征在于,用所述計算計算出模型記分的多個模型共同代表兩個或更多個生物學(xué)特征中的每一個特征的可能性。
80.如權(quán)利要求79所述的方法,其特征在于,所述兩個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
81.如權(quán)利要求79所述的方法,其特征在于,所述兩個或更多個生物學(xué)特征包括第一疾病和第二疾病。
82.如權(quán)利要求58所述的方法,其特征在于,用所述計算計算出模型記分的多個模型共同代表五個或更多個生物學(xué)特征中每一個的可能性。
83.如權(quán)利要求82所述的方法,其特征在于,所述五個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
84.如權(quán)利要求82所述的方法,其特征在于,所述五個或更多個生物學(xué)特征包括第一疾病和第二疾病。
85.如權(quán)利要求58所述的方法,其特征在于,用所述計算計算出模型記分的多個模型共同代表2-20個生物學(xué)特征各自的可能性。
86.如權(quán)利要求85所述的方法,其特征在于,所述2-20個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
87.如權(quán)利要求85所述的方法,其特征在于,所述2-20個生物學(xué)特征包括第一疾病和第二疾病。
88.一種方法,該方法包括接收數(shù)據(jù),其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;計算多個模型,其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且計算所述多個模型中的單個模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定與該單個模型有關(guān)的模型記分;和使在所述計算中計算出的各個所述模型記分進(jìn)行通信。
89.計算機(jī),該計算機(jī)包括中央處理單元;與該中央處理單元連接的存儲器,該存儲器儲存(i)發(fā)送數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;和(ii)接收多個模型記分的指令,其中每個模型記分對應(yīng)于多個模型中的模型,且其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分。
90.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多個模型記分包含兩個或更多個模型記分,且其中所述兩個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
91.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多個模型記分包含五個或更多個通過所述通信指令進(jìn)行通信的模型記分,且其中所述五個或更多個模型記分中的每個模型記分對應(yīng)于所述多個模型中的不同模型。
92.如權(quán)利要求89所述的計算機(jī),其特征在于,所述發(fā)送數(shù)據(jù)的指令包括通過廣域網(wǎng)將所述數(shù)據(jù)從所述遠(yuǎn)程計算機(jī)發(fā)送到移動式計算機(jī)的指令。
93.如權(quán)利要求92所述的計算機(jī),其特征在于,所述廣域網(wǎng)是因特網(wǎng)。
94.如權(quán)利要求89所述的計算機(jī),其特征在于,所述接收指令包括通過廣域網(wǎng)從遠(yuǎn)程計算機(jī)接收所述多個模型記分的指令。
95.如權(quán)利要求94所述的計算機(jī),其特征在于,所述廣域網(wǎng)是因特網(wǎng)。
96.如權(quán)利要求89所述的計算機(jī),其特征在于,當(dāng)所述模型記分在分值的第一范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為具有多個模型中的模型所代表的生物學(xué)特征;而當(dāng)所述模型記分在分值的第二范圍時,所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本被認(rèn)為不具有該模型所代表的生物學(xué)特征。
97.如權(quán)利要求89所述的計算機(jī),其特征在于,所述生物學(xué)特征是疾病。
98.如權(quán)利要求97所述的計算機(jī),其特征在于,所述疾病是癌。
99.如權(quán)利要求97所述的計算機(jī),其特征在于,所述疾病是乳腺癌、肺癌、前列腺癌、結(jié)腸直腸癌、卵巢癌、膀胱癌、胃癌或直腸癌。
100.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多個模型包括以第一模型記分為特征的第一模型和以第二模型記分為特征的第二模型;且其一個或多個特征被用來計算所述第一模型記分的細(xì)胞成分的身份不同于其一個或多個特征被用來計算所述第二模型記分的細(xì)胞成分的身份。
101.如權(quán)利要求89所述的計算機(jī),其特征在于,用來確定所述多個模型中的模型的模型記分的一種或多種細(xì)胞成分的所述一個或多個特征中的特征包括所述物種的所述試驗(yàn)生物或該物種生物的所述試驗(yàn)生物學(xué)標(biāo)本中的所述一種或多種細(xì)胞成分的豐度。
102.如權(quán)利要求89所述的計算機(jī),其特征在于,所述物種是人。
103.如權(quán)利要求89所述的計算機(jī),其特征在于,所述試驗(yàn)生物學(xué)標(biāo)本是來自腫瘤、血液、骨骼、乳腺、肺、前列腺、結(jié)腸直腸、卵巢、膀胱、胃或直腸的樣品的活檢組織或其它形式。
104.如權(quán)利要求89所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少100種細(xì)胞成分的細(xì)胞成分豐度。
105.如權(quán)利要求89所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少500種細(xì)胞成分的細(xì)胞成分豐度。
106.如權(quán)利要求89所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少5,000種細(xì)胞成分的細(xì)胞成分豐度。
107.如權(quán)利要求89所述的計算機(jī),其特征在于,所述一個或多個特征包括細(xì)胞成分豐度,且所述數(shù)據(jù)包括所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本中的至少1,000-20,000種細(xì)胞成分的細(xì)胞成分豐度。
108.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分是mRNA、cRNA或cDNA。
109.如權(quán)利要求89所述的計算機(jī),其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是核酸或核糖核酸,且所述細(xì)胞成分的所述一個或多個特征中的特征是通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所有或部分所述細(xì)胞成分的轉(zhuǎn)錄狀態(tài)獲得的。
110.如權(quán)利要求89所述的計算機(jī),其特征在于,所述一種或多種細(xì)胞成分中的細(xì)胞成分是蛋白質(zhì),且所述所述細(xì)胞成分的一個或多個特征中的特征在通過測量所述試驗(yàn)生物或所述試驗(yàn)生物學(xué)標(biāo)本中的所述細(xì)胞成分的翻譯狀態(tài)獲得的。
111.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是用同位素親和標(biāo)記然后用獲自試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本的樣品進(jìn)行細(xì)胞成分串聯(lián)質(zhì)譜分析確定的。
112.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多種細(xì)胞成分中的細(xì)胞成分的一個或多個特征中的特征是通過測量試驗(yàn)生物的樣品或試驗(yàn)生物學(xué)標(biāo)本中的細(xì)胞成分的活性或翻譯后修飾確定的。
113.如權(quán)利要求89所述的計算機(jī),其特征在于,所述生物學(xué)特征是藥物敏感性。
114.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多個模型共同代表兩個或更多個生物學(xué)特征中的每一個特征的可能性。
115.如權(quán)利要求114所述的計算機(jī),其特征在于,所述兩個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
116.如權(quán)利要求114所述的計算機(jī),其特征在于,所述兩個或更多個生物學(xué)特征包括第一疾病和第二疾病。
117.如權(quán)利要求89所述的計算機(jī),其特征在于,所述多個模型共同代表五個或更多個生物學(xué)特征中每一個的可能性。
118.如權(quán)利要求117所述的計算機(jī),其特征在于,所述五個或更多個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
119.如權(quán)利要求117所述的計算機(jī),其特征在于,所述五個或更多個生物學(xué)特征包括第一疾病和第二疾病。
120.如權(quán)利要求89所述的計算機(jī),其特征在于,用所述計算指令計算模型記分的多個模型共同代表2-20個生物學(xué)特征各自的可能性。
121.如權(quán)利要求120所述的計算機(jī),其特征在于,所述2-20個生物學(xué)特征中的每個生物學(xué)特征是癌來源。
122.如權(quán)利要求120所述的計算機(jī),其特征在于,所述2-20個生物學(xué)特征包括第一疾病和第二疾病。
123.一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制,該計算機(jī)程序機(jī)制包括(i)發(fā)送數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;和(ii)接收多個模型記分的指令,其中每個模型記分對應(yīng)于多個模型中的模型,且其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分。
124.一種方法,所述方法包括(i)發(fā)送數(shù)據(jù),其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征;和(ii)接收多個模型記分,其中每個模型記分對應(yīng)于多個模型中的模型,且其中所述多個模型中的每個模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性,且所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定該模型記分。
125.如權(quán)利要求58所述的方法,其特征在于,所述生物學(xué)特征包括對治療的敏感性或抗性。
126.如權(quán)利要求125所述的方法,其特征在于,所述治療是施用藥物。
127.如權(quán)利要求58所述的方法,其特征在于,所述生物學(xué)特征包括對組合治療的敏感性或抗性。
128.如權(quán)利要求127所述的方法,其特征在于,所述組合治療是施用藥物組合。
129.如權(quán)利要求58所述的方法,其特征在于,所述生物學(xué)特征包括疾病的轉(zhuǎn)移潛能或復(fù)發(fā)。
130.計算機(jī),該計算機(jī)包括中央處理單元;與該中央處理單元連接的存儲器,該存儲器儲存(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面;(ii)計算多個模型中的模型的指令,其中所述計算產(chǎn)生該模型的模型特征,該模型特征表明所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員,且其中所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述模型;(iii)重復(fù)所述計算指令一次或多次從而計算多個模型的指令;和(iv)使在所述計算指令中計算出的各個所述模型特征進(jìn)行通信的指令。
131.如權(quán)利要求130所述的計算機(jī),其特征在于,所述接收數(shù)據(jù)的指令包括通過廣域網(wǎng)從遠(yuǎn)程計算機(jī)接收所述數(shù)據(jù)的指令。
132.如權(quán)利要求131所述的計算機(jī),其特征在于,所述廣域網(wǎng)是因特網(wǎng)。
133.如權(quán)利要求130所述的計算機(jī),其特征在于,所述生物樣品種類是疾病。
134.如權(quán)利要求133所述的計算機(jī),其特征在于,所述疾病是癌。
135.計算機(jī),該計算機(jī)包括中央處理單元;與該中央處理單元連接的存儲器,該存儲器儲存(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面;(ii)計算多個模型的指令,其中所述計算產(chǎn)生所述多個模型中的每個模型的模型特征,該模型特征表明所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員,且其中所述計算包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征各個所述模型;和(iii)使通過所述計算指令計算出的各個所述模型特征進(jìn)行通信的指令。
136.一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制,該計算機(jī)程序機(jī)制包括(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面;(ii)計算多個模型中的模型的指令,其中所述計算產(chǎn)生該模型的模型特征,該模型特征表明所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員,且其中所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述模型;(iii)重復(fù)所述計算指令一次或多次從而計算多個模型的指令;和(iv)使在所述計算指令中計算出的各個所述模型特征進(jìn)行通信的指令。
137.一種與計算機(jī)系統(tǒng)聯(lián)合使用的計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)可讀存儲介質(zhì)和嵌入其中的計算機(jī)程序機(jī)制,該計算機(jī)程序機(jī)制包括(i)接收數(shù)據(jù)的指令,其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面;(ii)計算多個模型的指令,其中所述計算產(chǎn)生所述多個模型中每個模型的模型特征,該模型特征表明所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員,且其中所述計算包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征各個所述模型;和(iii)使通過所述計算指令計算出的各個所述模型特征進(jìn)行通信的指令。
138.一種方法,所述方法包括接收數(shù)據(jù),其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面;計算多個模型中的模型,其中所述計算產(chǎn)生模型的模型特征,該模型特征表明所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員,且其中所述計算所述模型包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述模型;重復(fù)所述計算指令一次或多次從而計算所述多個模型;和使在所述計算中計算出的各個所述模型特征進(jìn)行通信。
139.一種方法,所述方法包括接收數(shù)據(jù),其中所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面;計算多個模型,其中所述計算產(chǎn)生所述多個模型中每個模型的模型特征,該模型特征表明所述物種的所述試驗(yàn)生物或所述物種所述生物的所述試驗(yàn)生物學(xué)標(biāo)本是否是一類生物樣品的成員,且其中所述計算包括用所述多種細(xì)胞成分中的一種或多種細(xì)胞成分的生物學(xué)狀態(tài)的一個或多個方面來表征所述多個模型中的每個所述模型;和使計算出的各個所述模型特征進(jìn)行通信。
全文摘要
具有儲存接收數(shù)據(jù)指令的存儲器的計算機(jī)。所述數(shù)據(jù)包括在某一物種的試驗(yàn)生物或該物種生物的試驗(yàn)生物學(xué)標(biāo)本中測得的多種細(xì)胞成分中的每種細(xì)胞成分的一個或多個特征。該存儲器還儲存計算多個模型中的模型的指令,其中所述模型以模型記分為特征,該模型記分代表所述試驗(yàn)生物或試驗(yàn)生物學(xué)標(biāo)本中的生物學(xué)特征的可能性。計算模型包括用多種細(xì)胞成分中的一種或多種細(xì)胞成分的一個或多個特征來確定模型記分。所述存儲器還儲存重復(fù)所述計算指令一次或多次從而計算多個模型的指令。所述存儲器還儲存使計算出的模型記分進(jìn)行通信的指令。
文檔編號G01N33/48GK1886658SQ200480034992
公開日2006年12月27日 申請日期2004年9月29日 優(yōu)先權(quán)日2003年9月29日
發(fā)明者格蘭達(dá)·G·安德森 申請人:帕斯沃克斯資訊有限公司