两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

用于評估肺癌狀態(tài)的方法與流程

文檔序號:12509560閱讀:639來源:國知局
用于評估肺癌狀態(tài)的方法與流程
本申請要求2014年7月14日提交的美國臨時申請No.62/024,456和2015年5月12日提交的美國臨時申請No.62/160,403的優(yōu)先權(quán),據(jù)此通過援引完整收錄它們的完整內(nèi)容用于所有目的。電子提交的文本文件的描述通過援引將電子提交文本文件的內(nèi)容完整收入本文:計算機(jī)可讀格式拷貝的序列表(文件名:VRCT-008_02WO_ST25.txt,記錄日期:2015年7月14日;文件大?。?千字節(jié))。發(fā)明領(lǐng)域本公開文本一般涉及使用基因表達(dá)信息評估癌癥的方法和組合物。發(fā)明背景診斷肺癌(特別是在它能最有效治療的早期階段)中的一項挑戰(zhàn)是獲取細(xì)胞來診斷疾病。早期階段肺癌通常與小損害有關(guān),它們還可能出現(xiàn)于特別難以通過標(biāo)準(zhǔn)技術(shù)諸如支氣管鏡檢到達(dá)的肺氣道的周圍區(qū)域。發(fā)明概述本文中提供的是用于為受試者確立適宜的診斷性干預(yù)計劃和/或治療計劃及用于在確立適宜的診斷性干預(yù)計劃和/或治療計劃方面幫助健康護(hù)理提供者的方法。在一些實施方案中,該方法基于氣道損傷場概念。在一些實施方案中,該方法涉及基于信息性基因的表達(dá)水平建立肺癌風(fēng)險得分,它們對于評估受試者具有癌癥的可能性是有用的。在一些實施方案中,本文中提供的方法涉及基于例行細(xì)胞或組織取樣規(guī)程期間自受試者獲得的生物學(xué)樣品中信息性基因的表達(dá)水平進(jìn)行評估。在一些實施方案中,該生物學(xué)樣品包含組織學(xué)上正常的細(xì)胞。在一些實施方案中,本公開文本的多個方面至少部分基于確定自氣道第一位置獲得的表觀組織學(xué)上正常的細(xì)胞中某些信息性基因的表達(dá)水平可用于評估氣道中第二位置處(例如氣道中與該組織學(xué)上正常的細(xì)胞取樣的位置遠(yuǎn)離的位置處)的癌癥的可能性。在一些實施方案中,與涉及獲得可疑損害的組織(它們可能少得多地可重復(fù)取樣)的規(guī)程相比,組織學(xué)上正常的細(xì)胞(例如支氣管的細(xì)胞)的取樣是有利的,因為含有此類細(xì)胞的組織一般容易獲得,而且因此有可能可重復(fù)地獲得有用的樣品。在一些實施方案中,該方法涉及基于自受試者的支氣管收集的細(xì)胞學(xué)上看來正常的細(xì)胞中信息性基因的表達(dá)水平進(jìn)行肺癌評估。在一些實施方案中,表1,11,和26中提供對于預(yù)測肺癌的可能性有用的信息性基因。依照本公開文本的一些方面,提供確定受試者具有肺癌的可能性的方法,其涉及對自受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中一種或多種與肺癌狀態(tài)有關(guān)的信息性基因(例如選自表11的信息性基因)的mRNA表達(dá)水平。在一些實施方案中,該方法包括測定該生物學(xué)樣品中與該受試者的一種或多種可自我報告特征有關(guān)的一種或多種基因組關(guān)聯(lián)基因的mRNA表達(dá)水平。在一些實施方案中,該方法進(jìn)一步包括將上文測定的表達(dá)水平轉(zhuǎn)換成肺癌風(fēng)險得分,其指示該受試者具有肺癌的可能性。在一些實施方案中,該受試者的一種或多種可自我報告特征選自:吸煙包年數(shù),吸煙狀態(tài),年齡和性別。在一些實施方案中,依照具有大于90%的在預(yù)期使用人群中排除肺癌的負(fù)面預(yù)測值(NPV)的模型確定肺癌風(fēng)險得分。在一些實施方案中,依照具有大于85%的診斷有COPD的受試者的負(fù)面預(yù)測值(NPV)的模型確定肺癌風(fēng)險得分。在一些實施方案中,至少部分基于該肺癌風(fēng)險得分確立適宜的診斷性干預(yù)計劃。在一些實施方案中,該方法幫助健康護(hù)理提供者做出早期和準(zhǔn)確診斷。在一些實施方案中,該方法幫助健康護(hù)理提供者基于住院患者的臨床評估及早確立適宜的治療性干預(yù)。在一些實施方案中,該方法涉及評估支氣管鏡檢規(guī)程期間獲得的生物學(xué)樣品。在一些實施方案中,該方法相對于其它情況下非信息性支氣管鏡檢是有益的,因為它們使得健康護(hù)理提供者能夠關(guān)于患者診斷和/或治療做出信息性決策。在一些實施方案中,該風(fēng)險或可能性評估通向用于監(jiān)測低風(fēng)險損害的適宜監(jiān)視。在一些實施方案中,該風(fēng)險或可能性評估對于某些癌癥通向更快的診斷及因此更快的療法。本文中描述的某些方法單獨或與其它方法組合為健康護(hù)理提供者提供有用的信息幫助他們?yōu)榛颊咦龀鲈\斷性和治療性決策。在其它方法關(guān)于患者的肺癌狀態(tài)提供有用信息已經(jīng)失敗的情況中采用本文中公開的某些方法。本文中公開的某些方法為評估或診斷例行支氣管鏡檢規(guī)程期間獲得的細(xì)胞或組織樣品提供替代或互補(bǔ)方法,且提高該規(guī)程會得出對于管理患者的護(hù)理有用的信息的可能性。本文中公開的方法是高度靈敏的,且自可以自遠(yuǎn)離惡性肺組織的位置獲得的細(xì)胞或組織樣品(例如組織學(xué)上正常的組織)產(chǎn)生關(guān)于受試者具有肺癌的可能性的信息。本文中描述的某些方法可用于通過評估例行細(xì)胞或組織取樣規(guī)程(例如輔助性支氣管鏡檢規(guī)程,諸如刷檢,諸如使用細(xì)胞刷;活檢;灌洗;和針穿刺)期間獲得的組織學(xué)上正常的細(xì)胞或組織來評估受試者具有肺癌的可能性。然而,應(yīng)當(dāng)領(lǐng)會,可使用任何合適的組織或細(xì)胞樣品。通常,通過該方法評估的細(xì)胞或組織在組織學(xué)上看來是正常的。在一些實施方案中,該受試者已經(jīng)鑒定為支氣管鏡檢的候選人和/或具有呼吸道中的可疑損害。在一些實施方案中,本文中公開的方法是有用的,因為它們使得健康護(hù)理提供者能夠通過平衡受試者具有肺癌的風(fēng)險同與目的在于確認(rèn)受試者中肺癌的存在或缺失的某些侵入性診斷性規(guī)程有關(guān)的風(fēng)險來確定適宜的診斷性干預(yù)和/或治療計劃。在一些實施方案中,一個目標(biāo)是使用可能不能排除癌癥但具有更低風(fēng)險的干預(yù)排列具有低疾病概率的受試者。依照本公開文本的一些方面,提供方法利用基因表達(dá)信息來評估受試者的肺癌狀態(tài),其涉及一個或多個下面的動作:(a)自受試者的呼吸道獲得生物學(xué)樣品,其中該受試者已經(jīng)求助于支氣管鏡檢(例如,已經(jīng)鑒定為具有呼吸道中的可疑損害且因此求助于支氣管鏡檢以評估該損害),(b)對該生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中多數(shù)信息性基因的表達(dá)水平,(c)基于該多數(shù)信息性基因的表達(dá)水平運(yùn)算肺癌風(fēng)險得分,(d)如果該肺癌風(fēng)險得分的水平超過(例如在上)第一閾水平的話,確定該受試者需要第一診斷性干預(yù)來評估肺癌狀態(tài),并(e)如果該肺癌風(fēng)險得分的水平超過(例如在下)第二閾水平的話,確定該受試者需要第二診斷性干預(yù)來評估肺癌狀態(tài)。在一些實施方案中,該方法進(jìn)一步包括(f)如果該肺癌風(fēng)險得分的水平介于該第一閾和該第二閾水平之間的話,確定該受試者需要第三診斷性干預(yù)來評估肺癌狀態(tài)。在特定的實施方案中,當(dāng)受試者求助于支氣管鏡檢且支氣管鏡檢規(guī)程得出不確定性的或非診斷性的信息時可使用本文中的辦法。因而,本文中公開的是用于將此類受試者指派至低風(fēng)險的方法,其包括一個或多個下面的步驟:(a)自該受試者的呼吸道獲得生物學(xué)樣品,其中該受試者已經(jīng)經(jīng)歷非診斷性支氣管鏡檢規(guī)程,(b)對該生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中多數(shù)信息性基因的表達(dá)水平,(c)基于該多數(shù)信息性基因的表達(dá)水平運(yùn)算肺癌風(fēng)險得分,并(d)如果該肺癌風(fēng)險得分的水平超過(例如在下)第一閾水平的話,確定該受試者是低肺癌風(fēng)險,并任選(e)對該低風(fēng)險受試者指派一種或多種非侵入性跟蹤規(guī)程;例如CT監(jiān)視。此類辦法容許一群受試者避免后續(xù)侵入性辦法。對于不在該閾水平下的受試者,可以繼以非診斷性支氣管鏡檢繼以傳統(tǒng)辦法。在一些實施方案中,該第一診斷性干預(yù)包括實施經(jīng)胸針穿刺,縱隔鏡檢查術(shù)或開胸術(shù)。在一些實施方案中,該第二診斷性干預(yù)包括進(jìn)行留置觀察(watchfulwaiting)(例如定期監(jiān)測)。在一些實施方案中,留置觀察包括對呼吸道定期成像以評估可疑損害。在一些實施方案中,留置觀察包括多至一年,兩年,四年,五年或更多對呼吸道定期成像以評估可疑損害。在一些實施方案中,留置觀察包括每年至少一次對呼吸道成像以評估可疑損害。在一些實施方案中,留置觀察包括每年至少兩次對呼吸道成像以評估可疑損害。在一些實施方案中,留置觀察包括定期監(jiān)測受試者,除非和直至該受試者診斷為沒有癌癥。在一些實施方案中,留置觀察包括定期監(jiān)測受試者,除非和直至該受試者診斷為具有癌癥。在一些實施方案中,留置觀察包括定期重復(fù)前一段中記錄的步驟(a)至(f)中的一個或多個。在一些實施方案中,該第三診斷性干預(yù)包括實施支氣管鏡檢規(guī)程。在一些實施方案中,該第三診斷性干預(yù)包括重復(fù)前一段中記錄的步驟(a)至(e)。在某些實施方案中,該第三診斷性干預(yù)包括在確定該肺癌風(fēng)險得分介于該第一閾和該第二閾水平之間六個月內(nèi)重復(fù)步驟(a)至(e)。在某些實施方案中,該第三診斷性干預(yù)包括在確定該肺癌風(fēng)險得分介于該第一閾和該第二閾水平之間三個月內(nèi)重復(fù)步驟(a)至(e)。在一些實施方案中,該第三診斷性干預(yù)包括在確定該肺癌風(fēng)險得分介于該第一閾和該第二閾水平之間一個月內(nèi)重復(fù)步驟(a)至(e)。在一些實施方案中,該多數(shù)信息性基因選自表11中的基因的組。在一些實施方案中,評估這些基因的一個子集的表達(dá)水平并與參照表達(dá)水平(例如沒有癌癥的正?;颊叩?比較。在一些實施方案中,該子集包括a)其表達(dá)升高與肺癌或升高的肺癌風(fēng)險有關(guān)的基因,b)其表達(dá)降低與肺癌或升高的肺癌風(fēng)險有關(guān)的基因,或二者。在一些實施方案中,子集中至少5%,至少10%,至少20%,至少30%,至少40%,或約50%的基因具有與升高的肺癌風(fēng)險有關(guān)的水平升高的表達(dá)。在一些實施方案中,子集中至少5%,至少10%,至少20%,至少30%,至少40%,或約50%的基因具有與升高的肺癌風(fēng)險有關(guān)的水平降低的表達(dá)。在一些實施方案中,評估(例如測定或其它方式調(diào)查)選自表11中基因的10-80或更多種基因(例如5-10,10-20,20-30,30-40,40-50,50-60,60-70,70-80,約10,約15,約17,約25,約35,約45,約55,約65,約75,或更多種基因)每一種的表達(dá)水平。在一些實施方案中,還評估一種或多種對照基因(例如1,2,3,4,或5種對照基因)的表達(dá)水平。應(yīng)當(dāng)領(lǐng)會,測定法還能包括其它基因,例如參照基因或其它基因(不管它們的信息性如何)。然而,如果本文中描述的信息性基因子集任一的表達(dá)概況指示升高的肺癌風(fēng)險,那么能如本文中描述的那樣做出適宜的治療性或診斷性推薦。在一些實施方案中,來自表11的基因的一個或多個子集的表達(dá)水平的變化的鑒定可以以任何合適的格式提供給內(nèi)科醫(yī)師或其它健康護(hù)理專業(yè)人員。在一些實施方案中,單獨的這些基因表達(dá)概況和/或本文中公開的預(yù)測模型的結(jié)果可能足以做出診斷,提供預(yù)后,或推薦進(jìn)一步的診斷或特定的治療。然而,在一些實施方案中,基因表達(dá)概況和/或本文中公開的預(yù)測模型的結(jié)果可能連同其它信息(例如其它表達(dá)信息,和/或關(guān)于該受試者的其它物理或化學(xué)信息,包括家族史)一起幫助受試者的診斷,預(yù)后,和/或治療。在一些實施方案中,通過對呼吸道成像,受試者鑒定為具有呼吸道中的可疑損害。在某些實施方案中,對呼吸道成像包括實施計算機(jī)輔助斷層攝影術(shù),磁共振成像,超聲波掃描術(shù)或胸部X射線。在一些實施方案中,提供用于自患者獲得生物學(xué)樣品的方法。這些生物學(xué)樣品中信息性基因的表達(dá)水平為評估該患者具有肺癌的可能性提供基礎(chǔ)。提供用于處理生物學(xué)樣品的方法。在一些實施方案中,該處理方法確保RNA質(zhì)量和完整性,使得能夠進(jìn)行對信息性基因的下游分析及確保所獲得的結(jié)果的質(zhì)量。因而,在這些方法中可以采用各種質(zhì)量控制步驟(例如RNA大小分析)。提供用于包裝和保存生物學(xué)樣品的方法。提供用于航運(yùn)或運(yùn)輸生物學(xué)樣品(例如到達(dá)可以處理該生物學(xué)樣品和/或可以實施基因表達(dá)分析的測定實驗室)的方法。提供用于對生物學(xué)樣品實施基因表達(dá)分析以測定該樣品中信息性基因的表達(dá)水平的方法。提供用于分析和解讀信息性基因的基因表達(dá)分析的結(jié)果的方法。提供用于生成匯總基因表達(dá)分析的結(jié)果的報告及用于將測定法結(jié)果和/或測定法解讀傳輸或傳送給健康護(hù)理提供者(例如內(nèi)科醫(yī)師)的方法。而且,提供用于基于該基因表達(dá)測定法結(jié)果做出治療決策的方法,包括對于進(jìn)一步的治療或侵入性診斷性規(guī)程做出推薦。在一些實施方案中,本公開文本的多個方面涉及確定受試者具有肺癌的可能性,其通過對自受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中至少一種信息性基因(例如至少兩種選自表11的基因)的表達(dá)水平,并使用該表達(dá)水平來幫助確定該受試者具有肺癌的可能性。在一些實施方案中,該測定步驟包括將該表達(dá)水平轉(zhuǎn)換成肺癌風(fēng)險得分,其指示該受試者具有肺癌的可能性。在一些實施方案中,該肺癌風(fēng)險得分是加權(quán)表達(dá)水平的組合。在一些實施方案中,該肺癌風(fēng)險得分是加權(quán)表達(dá)水平之和。在一些實施方案中,該表達(dá)水平是以它們對預(yù)測具有肺癌的可能性升高的相對貢獻(xiàn)加權(quán)的。在一些實施方案中,本公開文本的多個方面涉及為受試者確定治療過程,其通過對自該受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中至少兩種信息性基因(例如至少兩種選自表11的mRNA)的表達(dá)水平,并基于該表達(dá)水平為該受試者確定治療過程。在一些實施方案中,該治療過程是基于自該表達(dá)水平推導(dǎo)的肺癌風(fēng)險得分確定的。在一些實施方案中,基于指示該受試者具有相對高的具有肺癌的可能性的肺癌風(fēng)險得分將該受試者鑒定為肺癌療法的候選人。在一些實施方案中,基于指示該受試者具有相對高的具有肺癌的可能性的肺癌風(fēng)險得分將該受試者鑒定為侵入性肺規(guī)程的候選人。在一些實施方案中,該侵入性肺規(guī)程是經(jīng)胸針穿刺,縱隔鏡檢查術(shù)或開胸術(shù)。在一些實施方案中,基于指示該受試者具有相對低的具有肺癌的可能性的肺癌風(fēng)險得分將該受試者鑒定為不是肺癌療法或侵入性肺規(guī)程的候選人。在一些實施方案中,創(chuàng)建匯總該基因表達(dá)分析的結(jié)果的報告。在一些實施方案中,該報告指出該肺癌風(fēng)險得分。在一些實施方案中,本公開文本的多個方面涉及確定受試者具有肺癌的可能性,其通過對自受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中至少一種信息性基因(例如至少一種選自表11的信息性mRNA)的表達(dá)水平,并至少部分基于該表達(dá)水平確定該受試者具有肺癌的可能性。在一些實施方案中,本公開文本的多個方面涉及確定受試者具有肺癌的可能性,其通過對自受試者的呼吸上皮獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測定該生物學(xué)樣品中至少一種信息性基因(例如至少一種選自表11的信息性mRNA)的表達(dá)水平,并至少部分基于該表達(dá)水平確定該受試者具有肺癌的可能性,其中該生物學(xué)樣品包含組織學(xué)上正常的組織。在一些實施方案中,本公開文本的多個方面涉及一種處理基因組信息的計算機(jī)執(zhí)行方法,其通過獲得代表生物學(xué)樣品中至少兩種信息性基因(例如至少兩種來自表11的信息性mRNA)的表達(dá)水平的數(shù)據(jù),其中該生物學(xué)樣品是自受試者獲得,并使用該表達(dá)水平來幫助確定該受試者具有肺癌的可能性。計算機(jī)執(zhí)行方法可包括經(jīng)由用戶界面輸入數(shù)據(jù),使用處理器運(yùn)算(例如計算,比較,或其它方式分析),和/或經(jīng)由顯示器或其它用戶界面輸出結(jié)果。在一些實施方案中,該確定步驟包括計算風(fēng)險得分,其指示該受試者具有肺癌的可能性。在一些實施方案中,運(yùn)算風(fēng)險得分涉及確定加權(quán)表達(dá)水平的組合(例如單獨的或連同一種或多種基因組關(guān)聯(lián)基因一起的一種或多種信息性基因的表達(dá)水平),其中該表達(dá)水平是以它們對預(yù)測具有肺癌的可能性升高的相對貢獻(xiàn)加權(quán)的。在一些實施方案中,基因組關(guān)聯(lián)基因是與特定臨床變量(例如可自我報告變量)相關(guān)或有關(guān)的基因。在一些實施方案中,此類臨床變量與癌癥(例如肺癌)有關(guān)。在一些實施方案中,不是使用多種基因的表達(dá)水平,而是可以將在一群受試者內(nèi)共線變化的多組相關(guān)基因(例如彼此相關(guān)的)組合或分解成單個數(shù)值(例如一組相關(guān)基因的均值)。在一些實施方案中,計算機(jī)執(zhí)行方法包括生成指出該風(fēng)險得分的報告。在一些實施方案中,將該報告?zhèn)鬏斀o該受試者的健康護(hù)理提供者。在一些實施方案中,計算機(jī)執(zhí)行方法包括獲得代表生物學(xué)樣品中至少2,3,4,5,6,7,8,9,或10種選自表11中在簇1,2,3,4,5,6,7,8,9,10,或11中鑒定的基因集合的基因的表達(dá)水平的數(shù)據(jù)。在一些實施方案中,該基因包含MYOT。應(yīng)當(dāng)領(lǐng)會,在本文中描述的任何實施方案或方面,可以自該受試者的呼吸上皮獲得生物學(xué)樣品。呼吸上皮可以是口,鼻,咽,氣管,支氣管,細(xì)支氣管,或肺泡的。然而,也可以使用呼吸上皮的其它來源。該生物學(xué)樣品可以包含組織學(xué)上正常的組織。該生物學(xué)樣品可以使用支氣管刷檢,諸如細(xì)胞刷或組織刷;支氣管-肺泡灌洗;支氣管活檢;口腔清洗;觸摸制備;細(xì)針穿刺;或痰收集來獲得。該受試者可以展現(xiàn)肺癌的一種或多種癥狀和/或具有通過計算機(jī)輔助斷層攝影術(shù)或胸部X射線可觀察的損害。在一些情況中,該受試者在通過本文中公開的方法評估之前尚未診斷有原發(fā)性肺癌。在本文中描述的任何實施方案或方面,該表達(dá)水平可以使用定量逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng),基于珠的核酸檢測測定法或寡核苷酸陣列測定法(例如微陣列測定法)或其它技術(shù)來測定。在本文中描述的任何實施方案或方面,該肺癌可以是腺癌,鱗狀細(xì)胞癌,小細(xì)胞癌或非小細(xì)胞癌。在一些實施方案中,本公開文本的多個方面涉及一種本質(zhì)上由至少一種核酸探針組成的組合物,其中該至少一種核酸探針每一種與信息性基因(例如至少一種選自表11的信息性mRNA)特異性雜交。在一些實施方案中,本公開文本的多個方面涉及一種包含多至5種,多至10種,多至25種,多至50種,多至100種,或多至200種核酸探針的組合物,其中該核酸探針每一種與信息性基因(例如至少一種選自表1或11的信息性mRNA)特異性雜交。在一些實施方案中,組合物包含至少1,2,3,4,5,6,7,8,9,或10種核酸探針。在一些實施方案中,至少2,3,4,5,6,7,8,9,或10種該核酸探針與自選自表11簇1,2,3,4,5,6,7,8,9,10,或11的不同基因表達(dá)的mRNA雜交。在一些實施方案中,核酸探針是直接或間接綴合至珠的。在一些實施方案中,該珠是磁珠。在一些實施方案中,該核酸探針是固定化至固體支持物的。在一些實施方案中,該固體支持物是玻璃,塑料或硅芯片。在一些實施方案中,本公開文本的多個方面涉及一種試劑盒,其包含至少一個裝有本文中描述的任何核酸探針組合物的容器或包裝。在一些實施方案中,表達(dá)水平是使用定量逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng)測定的。在一些實施方案中,本公開文本的多個方面涉及其表達(dá)水平可用于確定受試者(例如人受試者)具有肺癌的可能性的基因。在一些實施方案中,一種或多種本文中描述的基因的表達(dá)水平(例如mRNA水平)可以在氣道樣品(例如支氣管鏡檢期間獲得的上皮細(xì)胞或其它樣品或來自適宜的支氣管灌洗樣品)中測定。在一些實施方案中,可以測定本文中描述的信息性基因(例如1-5,5-10,10-15,15-20,20-25,25-50,50-80,或更多種基因)的一個或多個子集的升高的和/或降低的mRNA表達(dá)水平的樣式并用于診斷性,預(yù)后性,和/或治療性目的。應(yīng)當(dāng)領(lǐng)會,一種或多種本文中描述的表達(dá)樣式可以單獨使用,或者可以連同一種或多種另外的患者特異性標(biāo)記或癥狀一起有助于為患者提供個性化診斷性,預(yù)后性,和/或治療性預(yù)測或推薦。在一些實施方案中,提供區(qū)分有和無肺癌的吸煙者(當(dāng)前或從前)的信息性基因的集合,它們對于以高準(zhǔn)確度預(yù)測肺癌風(fēng)險是有用的。在一些實施方案中,該信息性基因選自表1或11。在一些實施方案中,本文中提供的方法用于確定受試者具有肺癌的可能性,其涉及對自受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,包括測定該生物學(xué)樣品中一種或多種與肺癌狀態(tài)有關(guān)的信息性基因(例如選自表1或11的信息性基因)的mRNA表達(dá)水平。在一些實施方案中,該方法包括測定該生物學(xué)樣品中與該受試者的一種或多種可自我報告特征有關(guān)的一種或多種基因組關(guān)聯(lián)基因的mRNA表達(dá)水平。在一些實施方案中,該方法進(jìn)一步包括將上文測定的表達(dá)水平轉(zhuǎn)換成肺癌風(fēng)險得分,其指示該受試者具有肺癌的可能性。在一些實施方案中,該受試者的一種或多種可自我報告特征選自:吸煙包年數(shù),吸煙狀態(tài),年齡和性別。在一些實施方案中,該肺癌風(fēng)險得分是依照下面的方程確定的:其中:X得分1=W0+W1xGG+W2xGS+W3xGPY+W4xGA+W5xC1A+W6xC1B+W7xC2+W8xC3+W9xC4A+W10xC4B且x得分2=W0+W1xGG+W2xGS+W3xGPY+W4x所報告的年齡+W5xC1A+W6xC1B+W7xC2+W8xC3+W9xC4A+W10xC4B,且其中GG,GS,GPY,GA,C1A,C1B,C2,C3,C4A和C4B是依照本文中公開的方程確定的。在一些實施方案中,信息性基因選自表1或11。在一些實施方案中,可以將在一群受試者內(nèi)共線變化的多組相關(guān)基因(例如彼此相關(guān)的的)組合或分解成單個數(shù)值(例如一組相關(guān)基因的均值)。在一些實施方案中,多組相關(guān)基因是相關(guān)的,因為它們與相同細(xì)胞和/或分子途徑有關(guān)。在一些實施方案中,在單個數(shù)值中將至少2,至少3,至少4,至少5或更多種相關(guān)基因(例如相關(guān)基因,一個共同簇內(nèi)的基因)組合到一起。在一些實施方案中,通過對自多名受試者(例如2至100,2至500,2至1000或更多名受試者)獲得的表達(dá)水平實施簇分析,鑒定多組相關(guān)基因??梢允褂萌魏芜m宜的簇分析來鑒定此類相關(guān)基因,包括例如基于質(zhì)心(centroid)的聚簇(例如k均值聚簇),基于連通性的聚簇(例如等級聚簇)和其它合適的辦法。表11中鑒定此類簇的非限制性例子,欄2中的數(shù)值規(guī)定歸于其中的每種基因的簇,使得有關(guān)基因(例如相關(guān)基因)在相同簇內(nèi)。在一些實施方案中,反映相關(guān)基因的集合的表達(dá)狀態(tài)的數(shù)值是相關(guān)基因的集合的均值表達(dá)水平。例如,可以在用于預(yù)測受試者具有癌的可能性的模型中使用一項或多項下面的數(shù)值:CIA,C1B,C2,C3,C4A,和C4B,其中CIA=(BST1,CD177.1,CD177.2)的均值,C1B=(ATP12A,TSPAN2)的均值,C2=(GABBRI,MCAM,NOVA1,SDC2)的均值,C3=(CDR1,CGREF1,CLND22,NKX3-1)的均值,C4A=(EPHX3,LYPD2)的均值,且C4B=(MIA,RNF150)的均值。在一些實施方案中,簇內(nèi)的多種基因可以彼此替代。如此,在一些實施方案中,需要在預(yù)測模型中評估或使用一個簇內(nèi)所有基因。在一些實施方案中,獨立選擇簇內(nèi)的僅1,2,3,4,5,6,7,8,9,或10種基因進(jìn)行本文中描述的分析。在一些實施方案中,鑒定表11的簇內(nèi)的至少1,2,3,4,5,6,7,8,9,或10種基因。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇1的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇2的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇3的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇4的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇5的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇6的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇7的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇8的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇9的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇10的基因集合。在一些實施方案中,一種或多種信息性基因選自表11中鑒定為簇11的基因集合。在一些實施方案中,該信息性基因包含MYOT。在一些實施方案中,將選自簇的多種基因簡化成單個數(shù)值,諸如例如選定基因的表達(dá)水平的均值,中值,模式或其它匯總統(tǒng)計量。在一些實施方案中,本文中提供的是用于為受試者確立適宜的診斷性干預(yù)計劃和/或治療計劃及用于幫助健康護(hù)理提供者確立適宜的診斷性干預(yù)計劃和/或治療計劃的方法。在一些實施方案中,提供如下的方法,其涉及基于例行細(xì)胞或組織取樣規(guī)程期間自受試者獲得的生物學(xué)樣品中信息性基因的表達(dá)水平做出風(fēng)險評估。在一些實施方案中,提供如下的方法,其涉及基于信息性基因的表達(dá)水平確立肺癌風(fēng)險得分。在一些實施方案中,至少部分基于該肺癌風(fēng)險得分確立適宜的診斷性干預(yù)計劃。在一些實施方案中,本文中提供的方法幫助健康護(hù)理提供者做出早期和準(zhǔn)確診斷。在一些實施方案中,本文中提供的方法幫助健康護(hù)理提供者基于住院患者的臨床評估及其確立適宜的治療性干預(yù)。在一些實施方案中,本文中提供的方法涉及評估支氣管鏡檢規(guī)程期間獲得的生物學(xué)樣品。在一些實施方案中,該方法相對于其它情況下非信息性支氣管鏡檢是有益的,因為它們使得健康護(hù)理提供者能夠關(guān)于患者診斷和/或治療做出信息性決策。在一些實施方案中,該風(fēng)險評估通向用于監(jiān)測低風(fēng)險損害的適宜監(jiān)視。在一些實施方案中,該風(fēng)險評估對于某些癌癥通向更快的診斷及因此更快的療法。本文中提供的是用于確定受試者具有肺癌(諸如腺癌,鱗狀細(xì)胞癌,小細(xì)胞癌或非小細(xì)胞癌)的可能性的方法。該方法單獨或與其它方法組合為健康護(hù)理提供者提供有用的信息來幫助他們?yōu)榛颊咦龀鲈\斷性和治療性決策。常常在其它方法關(guān)于患者的肺癌狀態(tài)提供有用信息已經(jīng)失敗的情況中采用本文中公開的方法。例如,大約50%的支氣管鏡檢規(guī)程得出不確定性的或非診斷性信息。不確定性的結(jié)果有多種來源,而且可能取決于不同醫(yī)學(xué)中心處可得的訓(xùn)練和規(guī)程。然而,在某些實施方案中,分子方法與支氣管鏡檢組合預(yù)期改善癌癥檢測準(zhǔn)確度。在一些實施方案中,本文中提供的是確定受試者具有肺癌的可能性的方法。在一些實施方案中,提供如下的方法,其涉及對自受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析,其中該基因表達(dá)分析包括測量一種或多種與肺癌狀態(tài)有關(guān)的信息性基因的cDNA水平,并測量與該受試者的一種或多種可自我報告特征有關(guān)的一種或多種基因組關(guān)聯(lián)基因的cDNA水平;并基于(a)和(b)中測定的cDNA水平確定肺癌風(fēng)險得分,其指示該受試者具有肺癌的可能性;其中該cDNA是自來自該生物學(xué)樣品的mRNA制備的。在一些實施方案中,本公開文本的方法包括將mRNA轉(zhuǎn)變成cDNA。在又一些實施方案中,擴(kuò)增cDNA。本文中更為詳細(xì)地描述了這些和其它方面并以非限制性附圖和實施例例示。附圖簡述圖1是來自所有合格的AEGISI樣品的所有基因表達(dá)數(shù)據(jù)的成對相關(guān)性的相關(guān)系數(shù)的圖的非限制性例子;相關(guān)系數(shù)<0.955的樣品鑒定為異常值并從進(jìn)一步分析中排除;保留總共597份樣品;圖2是基于一個訓(xùn)練樣品集合的預(yù)測模型的ROC曲線的非限制性例子;和圖3是基于一個支氣管鏡檢陰性訓(xùn)練樣品集合的預(yù)測模型的ROC曲線的非限制性例子。圖4描繪以下顏色編碼:滿足研究納入標(biāo)準(zhǔn)的患者(藍(lán)色);排除的患者(黃色);包括在最終分析中的患者(綠色)。圖5描繪在AEGIS1(左)和AEGIS2(右)分支中的全部患者(淺灰色)和具有非診斷性支氣管鏡檢的患者子集(黑色)的ROC曲線。在AEGIS1中,兩個組分別為AUC=0.78(95%CI,0.73至0.83)和AUC=0.76(95%CI,0.68至0.83)(p=0.31)。在AEGIS2中,兩個組中的AUC=0.74(95%CI,0.68至0.80)和AUC=0.75(95%CI,0.68至0.82)(p=0.85)。對于具有非診斷性支氣管鏡檢的患者,AUC就比較AEGIS1和AEGIS2而言也沒有顯著差異(p=0.61)。圖6A和圖6B。圖6A描繪基于為分類器與支氣管鏡檢組合計算的負(fù)分類器調(diào)用(實線;使用負(fù)似然比調(diào)整)和正分類器調(diào)用(虛線;使用正似然比調(diào)整),與測試前POM相關(guān)的測試后POM。負(fù)分類器調(diào)用曲線顯示,對于測試前POM<66%的患者,當(dāng)支氣管鏡檢為陰性且分類器為負(fù)時,測試后POM<10%。對于陰性支氣管鏡檢和正分類器得分的患者,當(dāng)測試前可能性大于5%時,癌癥的測試后可能性>10%。圖6B描繪基于分類器和支氣管鏡檢的測試前概率和負(fù)似然比的測試后癌癥概率。測試后肺癌概率是與基于非診斷性支氣管鏡檢檢查和負(fù)分類器得分(使用負(fù)似然比調(diào)整)的測試前概率相關(guān)顯示的。該曲線顯示對于測試前癌癥概率小于66%的患者(短垂直線),當(dāng)支氣管鏡檢發(fā)現(xiàn)為陰性且分類器得分為負(fù)時,測試后概率小于10%(虛線)。圖7描繪具有癌癥相關(guān)基因表達(dá)的基因的成對相關(guān)性。評估具有癌癥相關(guān)基因表達(dá)的基因的所有可能對之間的相關(guān)性(n=232)以鑒定共享相似基因表達(dá)模式的基因的組。使用無監(jiān)督分級聚簇將相關(guān)基因分組成11個簇,其中在y軸上指示建立簇的樹狀圖閾水平(綠色線)。使用線性回歸以節(jié)約方式自簇中選擇基因以預(yù)測肺癌狀態(tài)。分類器基因來自特定的簇(用藍(lán)色表示),使用來自每個簇的2-4種基因。簇4和7含有在肺癌中上調(diào)的基因,而簇1,2,9,和10在肺癌中下調(diào)。圖8描繪測試集合中具有非診斷性支氣管鏡檢的患者的ROC曲線。支氣管鏡檢沒有導(dǎo)致肺癌診斷的123名患者的AUC=0.81(其中肺癌的流行度為31%)。圖9描繪與訓(xùn)練集合中的所有患者對應(yīng)的基因表達(dá)數(shù)據(jù)(黑線),而且使用鎖定的分類器分析具有非診斷性支氣管鏡檢的患者子集(灰線)。對于兩個組,AUC分別計算為0.78(95%CI,0.73-0.82)和0.78(95%CI,0.71-0.85)。圖10A和圖10B描繪用于與由基因分類器CD177代表的核酸序列雜交的核酸探針。圖10A公開了CD177.1中的19種核酸探針(SEQIDNO:24-42,從頂部到底部的次序),圖10B公開了CD177.2中的4種核酸探針(SEQIDNO:43-46,從頂部到底部)。發(fā)明詳述本文中公開的方法為評估通過支氣管鏡檢規(guī)程(或用于評估呼吸組織的其它規(guī)程)獲得的細(xì)胞或組織樣品提供替代或互補(bǔ)辦法,且提高該規(guī)程會得出對于管理該患者的護(hù)理有用的信息的可能性。本文中公開的方法是高度靈敏的,且自常常自氣道中遠(yuǎn)離惡性肺組織的區(qū)域獲得的細(xì)胞或組織樣品(例如氣道上皮細(xì)胞的支氣管刷檢)產(chǎn)生關(guān)于受試者具有肺癌的可能性的信息。一般而言,本文中公開的方法涉及對自受試者獲得的生物學(xué)樣品進(jìn)行基因表達(dá)分析以評估基因表達(dá)水平。然而,在一些實施方案中,在別的部分中基于該生物學(xué)樣品的組織學(xué)檢查的結(jié)果或通過考慮其它診斷性指標(biāo)諸如蛋白質(zhì)水平,mRNA水平,成像結(jié)果,胸部X射線檢查結(jié)果等來確定該受試者具有肺癌的可能性。如本文中使用的,術(shù)語“受試者”一般指哺乳動物。典型地,該受試者是人。然而,該術(shù)語涵蓋其它物種,例如豬,小鼠,大鼠,犬,貓,或其它靈長類動物。在某些實施方案中,該受試者是實驗受試者,諸如小鼠或大鼠。該受試者可以是雄性/男性或雌性/女性。該受試者可以是嬰兒,幼兒,兒童,年輕成人,成人或老人。該受試者可以是吸煙者,以前的吸煙者或非吸煙者。該受試者可以具有癌癥的個人或家族史。該受試者可以具有無癌癥個人或家族史。該受試者可以展現(xiàn)肺癌或其它肺病癥(例如肺氣腫,COPD)的一種或多種癥狀。例如,該受試者可以具有新的或持久的咳嗽,已有的慢性咳嗽的惡化,痰中帶血,持久的支氣管炎或反復(fù)的呼吸道感染,胸痛,未解釋的重量減輕和/或疲勞,或呼吸困難諸如呼吸急促或哮鳴。該受試者可以具有可以是通過計算機(jī)輔助斷層攝影術(shù)或胸部X射線可觀察的損害。該受試者可以是已經(jīng)經(jīng)歷支氣管鏡檢或已經(jīng)鑒定為支氣管鏡檢的候選人(例如由于存在可檢測損害或可疑成像結(jié)果)的個體。在一些實施方案中,受試者具有或已經(jīng)診斷有慢性阻塞性肺病(COPD)。在一些實施方案中,受試者不具有或尚未診斷有COPD。在內(nèi)科醫(yī)師或其它健康護(hù)理提供者護(hù)理下的受試者可稱作“患者”。如本文中使用的,術(shù)語“約”指加或減“約”修飾的對象的10%。如此,短語“約10,20,或30”分別涵蓋8-11,18-22,27-33。信息性基因本公開文本的基因的表達(dá)水平已經(jīng)鑒定為關(guān)于受試者的肺癌狀態(tài)提供有用的信息。這些基因在本文中稱作“信息性基因”。信息性基因包括蛋白質(zhì)編碼基因和非蛋白質(zhì)編碼基因。熟練技術(shù)人員會領(lǐng)會,信息性基因的表達(dá)水平可以通過評估適宜的基因產(chǎn)物(例如mRNA,miRNA,蛋白質(zhì)等)的水平來測定。因此,某些mRNA的表達(dá)水平已經(jīng)鑒定為提供關(guān)于受試者的肺癌狀態(tài)有用的信息。這些mRNA在本文中稱作“信息性mRNA”。表11提供在癌癥中差異表達(dá)的信息性基因的列表。在一些實施方案中,在肺癌中差異表達(dá)的信息性基因選自:BST1,CD177.1,CD177.2,ATP12A,TSPAN2,GABBR1,MCAM,NOVA1,SDC2,CDR1,CGREF1,CLND22,NKX3-1,EPHX3,LYPD2,MIA,RNF150。在一些實施方案中,在肺癌中差異表達(dá)的信息性基因選自:TMEM51,CR1L,PDZKlIP1,MICAL2,VWA5A,ACAD8,SAA4,GLYATL2,ETV6,CD177,CEACAM7,QPCT,CASP10,PI3,BST1,MTNR1A,STARD4,CFB,SLC26A8,VNN2,HDAC9,SLC26A4,和LCN2。在一些實施方案中,在肺癌中差異表達(dá)的信息性基因選自:CCDC18,F(xiàn)AM72D,NUF2,F(xiàn)BXO28,GPR137B,STIL,DEPDC1,TSPAN2,ASPM,KIF14,KIF20B,RAD51AP1,GAS2L3,SPIC,SMAGP,ATP12A,BRCA2,BORA,SKA3,DLGAP5,CASC5,LRRC28,PYCARD,TXNL4B,EFCAB5,SPAG5,ABCAl2,AURKA,SGOL1,BANK1,CENPE,CASP6,MAD2L1,CCNA2,CCNB1,KIF20A,CENPK,ERAP1,F(xiàn)AM54A,PHTF2,CLDN12,BPGM,PCMTD1,MELK,和MST4。在一些實施方案中,在肺癌中差異表達(dá)的信息性基因選自:CR1,GOS2,CSF3R,S100Al2,SELL,NCF2,LIPN,ZNF438,NAMPT,CBL,CASP5,CARD16,CARD17,CLEC4A,LRRK2,HMGN2P46,AQP9,BCL2A1,ITGAX,GPR97,CCL4,PSTPIP2,IFI30,F(xiàn)FAR2,EMR3,F(xiàn)PR1,LILRA5,PLEK,MXD1,TNFAIP6,CXCR2,IL1B,CXCR1,SIRPB1,NCF4,IRAK2,PROK2,TLR2,TREM1,SOD2,CREB5,TNFRSF10C,CSGALNACT1,和ASAP1。在一些實施方案中,在肺癌中差異表達(dá)的信息性基因選自:PLA2G2A,NFYC,RASSF10,GLB1L3,TRIM3,MCAM,MSRB3,SLITRK5,GAS6,NOVA1,GABRG3,ABCA3,LPO,F(xiàn)SCN2,RASD1,HILS1,SDK2,NTN5,KCNA7,ATOH8,KCNIP3,INHBB,VSTM2L,ZNRF3,PLEKHG4B,GNMT,GABBR1,ARHGEF10,SDC2,CRB2,GAS1,PNPLA7,和RAI2。本文中公開的某些方法涉及測定該生物學(xué)樣品中至少一種信息性基因的表達(dá)水平。然而,在一些實施方案中,該表達(dá)分析涉及測定該生物學(xué)樣品中至少2,至少3,至少4,至少5,至少6,至少7,至少8,至少9,至少10,至少20,至少30,至少40,至少50,至少60,至少70,或至少80種信息性基因的表達(dá)水平。在一些實施方案中,該表達(dá)分析涉及測定該生物學(xué)樣品中1至5,1至10,5至10,5至15,10至15,10至20,15至20,15至25,20至30,25至50,25至75,50至100,50至200或更多種信息性基因,諸如表11中的那些的表達(dá)水平。在一些實施方案中,該表達(dá)分析涉及測定該生物學(xué)樣品中至少1至5,1至10,2至10,5至10,5至15,10至15,10至20,15至20,15至25,20至30,25至50,25至75,50至100,50至200或更多種信息性基因,諸如表11中的那些的表達(dá)水平。在一些實施方案中,用于表達(dá)分析的信息性基因的數(shù)目足以提供預(yù)測結(jié)局中在臨床上有用的置信度水平。這種置信度水平(例如預(yù)測模型的效能)可以通過多種性能參數(shù)來評估,包括但不限于準(zhǔn)確度,靈敏度,特異性,和接受者操作特征(ROC)曲線的曲線下面積(AUC)。可以用不同數(shù)目的特征(例如基因,mRNA的數(shù)目)評估這些參數(shù)以確定信息性基因的最佳數(shù)目和集合。當(dāng)單獨或與其它信息組合使用時,至少60%,70%,80%,90%的準(zhǔn)確度,靈敏度或特異性可能是有用的??梢允褂萌魏芜m宜的系統(tǒng)或方法來測定信息性基因的表達(dá)水平??梢越?jīng)由使用基于雜交的測定法來測定基因表達(dá)水平。如本文中使用的,術(shù)語“基于雜交的測定法”指任何涉及核酸雜交的測定法。基于雜交的測定法可以涉及或不涉及核酸的擴(kuò)增?;陔s交的測定法是本領(lǐng)域公知的且包括但不限于基于陣列的測定法(例如寡核苷酸陣列,微陣列),寡核苷酸綴合的珠測定法(例如多路基于珠的測定法),分子倒置探針測定法,和定量RT-PCR測定法。多路系統(tǒng)(諸如寡核苷酸陣列或基于珠的核酸測定系統(tǒng))對于同時評估多數(shù)基因的水平是特別有用的。其它用于測定核酸的水平的適宜方法對于熟練技術(shù)人員會是顯而易見的。如本文中使用的,“水平”指指示物質(zhì)(例如mRNA)的量或發(fā)生的數(shù)值。水平可以是絕對值,例如樣品中mRNA的數(shù)量,或相對值,例如樣品中mRNA的數(shù)量相對于參照樣品(對照樣品)中mRNA的數(shù)量。該水平還可以是二元值,指示物質(zhì)的存在或缺失。例如,當(dāng)樣品中物質(zhì)的數(shù)量的測量(例如來自PCR反應(yīng)或微陣列的熒光測量)超出背景值時,可以鑒定為該樣品中存在該物質(zhì)。類似地,當(dāng)樣品中分子的數(shù)量的測量處于或不及背景值時,可以鑒定為該樣品中缺失該物質(zhì)(或該樣品中檢測不到該物質(zhì))。應(yīng)當(dāng)領(lǐng)會,可以直接或間接測定物質(zhì)的水平。例如,下面的專利申請(通過援引將其內(nèi)容完整收入本文中用于所有目的)中公開了信息性mRNA的別的非限制性例子:2006年5月12日提交的,題目為ISOLATIONOFNUCLEICACIDFROMMOUTHEPITHELIALCELLS的美國專利公開文本No.US2007/148650;2009年1月9日提交的,題目為ISOLATIONOFNUCLEICACIDFROMMOUTHEPITHELIALCELLS的美國專利公開文本No.US2009/311692;2010年9月17日提交的,題目為ISOLATIONOFNUCLEICACIDFROMMOUTHEPITHELIALCELLS的美國申請No.12/884,714;2005年12月6日提交的,題目為DETECTIONMETHODSFORDISORDEROFTHELUNG的美國專利公開文本No.US2006/154278;2008年2月8日提交的,題目為DIAGNOSTICFORLUNGDISORDERSUSINGCLASSPREDICTION的美國專利公開文本No.US2010/035244;2010年8月26日提交的,題目為DIAGNOSTICFORLUNGDISORDERSUSINGCLASSPREDICTION的美國申請No.12/869,525;2008年9月19日提交的,題目為BIOMARKERSFORSMOKEEXPOSURE的美國申請No.12/234,368;2010年10月154日提交的,題目為BIOMARKERSFORSMOKEEXPOSURE的美國申請No.12/905,897;2008年9月19日提交的,題目為IDENTIFICATIONOFNOVELPATHWAYSFORDRUGDEVELOPMENTFORLUNGDISEASE的美國專利申請No.US2009/186951;2008年9月9日提交的,題目為DIAGNOSTICANDPROGNOSTICMETHODSFORLUNGDISORDERSUSINGGENEEXPRESSIONPROFILES的美國公開文本No.US2009/061454;2010年11月5日提交的,題目為DIAGNOSTICANDPROGNOSTICMETHODSFORLUNGDISORDERSUSINGGENEEXPRESSIONPROFILES的美國申請No.12/940,840;2009年3月30日提交的,題目為MULTIFACTORIALMETHODSFORDETECTINGLUNGDISORDERS的美國公開文本No.US2010/055689;和2013年4月26日提交的,題目為METHODSFOREVALUATINGLUNGCANCERSTATUS的國際專利申請No.PCT/US13/38449。cDNAcDNA分子是由本領(lǐng)域普通技術(shù)人員自mRNA分子合成的非天然發(fā)生多核苷酸序列。在一些實施方案中,獲得或獲取本發(fā)明的cDNA分子。利用酶逆轉(zhuǎn)錄酶將RNA轉(zhuǎn)變成cDNA創(chuàng)建cDNA,是缺乏內(nèi)含子的非天然發(fā)生分子。依賴于cDNA的方法必然依賴于自然中并非天然發(fā)生的人工分子,例如cDNA分子的蛋白質(zhì)表達(dá)或cDNA分子的雜交。在某些方面,利用生物學(xué)樣品中的mRNA使用至少一種引物通過mRNA的逆轉(zhuǎn)錄自樣品生成cDNA;使用多核苷酸作為有義和反義引物擴(kuò)增cDNA以擴(kuò)增其中的cDNA;并檢測擴(kuò)增cDNA的存在。在進(jìn)一步的方面,可以通過任何合適的方法測定擴(kuò)增cDNA的序列。在一個實施方案中,一旦自樣品獲得mRNA,就將它轉(zhuǎn)變成互補(bǔ)DNA(cDNA)。cDNA在體內(nèi)不存在且因此是非天然分子。在一個進(jìn)一步的實施方案中,然后擴(kuò)增cDNA,例如通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或本領(lǐng)域普通技術(shù)人員知道的其它擴(kuò)增方法。這個擴(kuò)增反應(yīng)的產(chǎn)物(即擴(kuò)增cDNA)必然是非天然產(chǎn)物。如上文提到的,cDNA是非天然分子。其次,在PCR的情況中,擴(kuò)增過程用來為起始材料的每一個cDNA分子個體創(chuàng)建數(shù)以億計的cDNA拷貝。所生成的拷貝的數(shù)目大大超出體內(nèi)存在的mRNA的拷貝的數(shù)目。在一個實施方案中,用將另外的DNA序列(銜接頭序列)引入到片段的引物(憑借銜接頭特異性引物的使用)擴(kuò)增cDNA。因此,擴(kuò)增用來通過將條形碼,銜接頭和/或報告物序列引入到早就是非天然的cDNA上,自非天然單鏈cDNA創(chuàng)建非天然雙鏈分子。在一個實施方案中,在用銜接頭特異性引物擴(kuò)增期間,將可檢測標(biāo)記物(例如熒光團(tuán))添加至單鏈cDNA分子。因此,擴(kuò)增也用來創(chuàng)建自然中不發(fā)生的DNA復(fù)合物,至少因為(i)cDNA在體內(nèi)不存在,(i)將銜接頭序列添加至cDNA分子的末端以生成在體內(nèi)不存在的DNA序列,(ii)與擴(kuò)增有關(guān)的錯誤率進(jìn)一步創(chuàng)建在體內(nèi)不存在的DNA序列,(iii)cDNA分子與自然中存在的相比根本不同的結(jié)構(gòu)和(iv)可檢測標(biāo)記物對cDNA分子的化學(xué)添加。在一個實施方案中,經(jīng)由與探針的雜交(例如經(jīng)由微陣列)在固體表面上固定化合成cDNA(例如擴(kuò)增cDNA)。在另一個實施方案中,經(jīng)由實時聚合酶鏈?zhǔn)椒磻?yīng)(PCR)經(jīng)由引入與cDNA產(chǎn)物雜交的熒光探針來檢測DNA產(chǎn)物。例如,在一個實施方案中,通過定量發(fā)熒光RT-PCR(例如用探針)來評估生物標(biāo)志物檢測。對于PCR分析,本領(lǐng)域有公知方法用于確定供分析中使用的引物序列。在一個實施方案中,為了合成及擴(kuò)增cDNA,可使用5’AmpliFINDERRACE試劑盒(由Clontech制造)和使用PCR的5’-RACE方法(Frohman,M.A.etal.,Proc.Natl.Acad.Sci.USA(1988)85:8998-9002;Belyaysky,A.etal.,NucleicAcidsResearch.(1989)17:2919-2932)。在此類cDNA合成過程中,可以將限制酶位點引入cDNA的兩端?;蚪M關(guān)聯(lián)如本文中公開的,某些基因的表達(dá)水平已經(jīng)鑒定為與受試者的某些可自我報告特征有關(guān)(相關(guān))。此類基因在本文中稱作“基因組關(guān)聯(lián)基因”或“基因組關(guān)聯(lián)”且是有用的,因為它們?yōu)槠渌闆r下可能不正確和/或不精確報告的受試者特征提供替代標(biāo)志物。例如,在一些實施方案中,受試者可能不正確地評估諸如包年數(shù),吸煙狀態(tài)或年齡等信息(例如通過提供此類信息的低估)。在此類實施方案中,使用基于基因組關(guān)聯(lián)基因的預(yù)測模型能降低或消除與不正確的報告有關(guān)的可變性,因為它基于基因組關(guān)聯(lián)基因的表達(dá)而非受試者做出的關(guān)于報告什么信息的決策和/或受試者對情況的回憶。熟練技術(shù)人員會領(lǐng)會,可以通過評估適宜的基因產(chǎn)物(例如mRNA,miRNA,蛋白質(zhì)等)的水平來測定此類基因組關(guān)聯(lián)基因的表達(dá)水平??梢耘c肺癌狀態(tài)的信息性基因(例如選自表11的信息性基因)平行地或與此類基因獨立地測定基因組關(guān)聯(lián)基因的表達(dá)水平。在一些實施方案中,基因組關(guān)聯(lián)反映個體對環(huán)境危險(例如吸煙)的響應(yīng)。在一些實施方案中,基因組關(guān)聯(lián)反映對風(fēng)險的暴露。在一些實施方案中,基于一種或多種基因組關(guān)聯(lián)基因確定受試者的性別。在一些實施方案中,與性別相關(guān)的基因組關(guān)聯(lián)基因是RPS4Y1。在一些實施方案中,如果RPS4Y1的表達(dá)在閾下,那么將該受試者鑒定為男性,且如果RPS4Y1的表達(dá)在閾上,那么將該受試者鑒定為女性。在一些實施方案中,對于感興趣基因,閾是準(zhǔn)確區(qū)分男性和女性的相對表達(dá)水平。在一些實施方案中,基于一種或多種基因組關(guān)聯(lián)基因確定受試者的吸煙狀態(tài)(例如當(dāng)前的或以前的)。在一些實施方案中,與吸煙狀態(tài)相關(guān)的基因組關(guān)聯(lián)基因是SLC7A11,CLND10或TKT。在一些實施方案中,依照下面的模型來確定受試者的吸煙狀態(tài):吸煙狀態(tài)(也稱作基因組吸煙(GS))=exp(x)/(l+exp(x)),其中其中是回歸模型的回歸權(quán)重且基因符號代表每一種各自基因的相對表達(dá)強(qiáng)度。在一些實施方案中,吸煙者是一生中已經(jīng)抽煙至少100根紙煙的受試者。在一些實施方案中,以前的吸煙者是戒掉或在支氣管鏡檢之前1個月內(nèi)沒有抽吸一根紙煙的受試者。在一些實施方案中,基于一種或多種基因組關(guān)聯(lián)基因確定受試者的吸煙史。在一些實施方案中,與吸煙史相關(guān)的基因組關(guān)聯(lián)基因是AKR1C2或RUNX1T1。在一些實施方案中,依照下面的模型來確定受試者的吸煙史:吸煙史(也稱作基因組包年數(shù)(GPY))=exp(x)/(l+exp(x)),其中其中是該模型的回歸權(quán)重且基因符號代表每一種各自基因的相對表達(dá)強(qiáng)度。在一些實施方案中,基于一種或多種基因組關(guān)聯(lián)基因確定受試者的年齡。在一些實施方案中,與年齡相關(guān)的基因組關(guān)聯(lián)基因是CD52,SYT8,TNNT3,ALX1,KLRK1,RASA3,CERS3,ASPA,GRP,APOC1,EPHX3,REEP1,F(xiàn)AM198B,PCDHB4,PCDHB16,F(xiàn)OXD1,SPARC,NKAPL,或GPR110。在一些實施方案中,依照下面的模型來確定受試者的年齡:年齡(也稱作基因組年齡其中是該模型的回歸權(quán)重且基因符號代表每一種各自基因的相對表達(dá)強(qiáng)度。生物學(xué)樣品該方法一般涉及獲得自受試者生物學(xué)樣品。如本文中使用的,短語“獲得生物學(xué)樣品”指任何用于直接或間接自受試者獲取生物學(xué)樣品的過程。例如,可以通過自受試者獲取組織或流體樣品(例如在護(hù)理點設(shè)施(point-of-carefacility),內(nèi)科醫(yī)師的辦公室,醫(yī)院處)來獲得生物學(xué)樣品?;蛘?,可以通過自直接自受試者獲取樣品的一個或多個人接收樣品(例如在實驗室設(shè)施處)來獲得生物學(xué)樣品。術(shù)語“生物學(xué)樣品”指自受試者(例如患者)衍生的樣品。典型地,生物學(xué)樣品包含組織,細(xì)胞和/或生物分子。在一些實施方案中,生物學(xué)樣品是在它是組織學(xué)上正常(例如通過內(nèi)窺鏡檢(例如支氣管鏡檢)確定的)的基礎(chǔ)上獲得的。在一些實施方案中,生物學(xué)樣品是自并非懷疑含有癌性細(xì)胞的區(qū)域(例如支氣管或其它部位或區(qū)域)獲得的。在一些實施方案中,實施組織學(xué)或細(xì)胞學(xué)檢查。然而,應(yīng)當(dāng)領(lǐng)會,組織學(xué)或細(xì)胞學(xué)檢查可以是任選地。在一些實施方案中,生物學(xué)樣品是呼吸上皮的樣品。呼吸上皮可以是受試者的口,鼻,咽,氣管,支氣管,細(xì)支氣管,或肺泡的。生物學(xué)樣品可以包含支氣管的上皮。在一些實施方案中,生物學(xué)樣品沒有可檢測的癌細(xì)胞,例如通過標(biāo)準(zhǔn)組織學(xué)或細(xì)胞學(xué)方法確定的。在一些實施方案中,獲得組織學(xué)上正常的樣品來進(jìn)行評估。通常,通過刮檢或刷檢(例如支氣管刷檢)來獲得生物學(xué)樣品。然而,應(yīng)當(dāng)領(lǐng)會,可以使用其它規(guī)程,包括例如刷檢,刮檢,支氣管-肺泡灌洗,支氣管活檢或經(jīng)支氣管針穿刺。要理解的是,可以以任何適宜的方式加工生物學(xué)樣品以便于測定表達(dá)水平。例如,可以恰當(dāng)?shù)厥褂蒙锘瘜W(xué),機(jī)械和/或熱處理方法自生物學(xué)樣品分離感興趣的生物分子,例如RNA。因而,可以通過使用本領(lǐng)域公知的方法處理樣品自生物學(xué)樣品分離RNA或其它分子。肺癌評估本文中公開的方法可以涉及比較信息性基因的表達(dá)水平與一種或多種適宜的參照?!斑m宜的參照”是特定信息性基因的指示已知肺癌狀態(tài)的表達(dá)水平(或表達(dá)水平的范圍)??梢杂稍摲椒ǖ膹臉I(yè)人員憑經(jīng)驗確定適宜的參照,或者可以是預(yù)先存在的數(shù)值或數(shù)值范圍。適宜的參照代表指示肺癌的表達(dá)水平(或表達(dá)水平的范圍)。例如,適宜的參照可以代表自已知具有肺癌的受試者獲得的參照(對照)生物學(xué)樣品中信息性基因的表達(dá)水平。當(dāng)適宜的參照指示肺癌時,自需要表征或診斷肺癌的受試者測定的表達(dá)水平和適宜的參照之間缺乏可檢測差異(例如缺乏統(tǒng)計學(xué)上顯著的差異)可指示該受試者中的肺癌。當(dāng)適宜的參照指示肺癌時,自需要表征或診斷肺癌的受試者測定的表達(dá)水平和適宜的參照之間的差異可指示該受試者沒有肺癌。或者,適宜的參照可以是指示受試者沒有肺癌的基因的表達(dá)水平(或表達(dá)水平的范圍)。例如,適宜的參照可以代表自已知沒有肺癌的受試者獲得的參照(對照)生物學(xué)樣品中特定信息性基因的表達(dá)水平。當(dāng)適宜的參照指示受試者沒有肺癌時,自需要診斷肺癌的受試者測定的表達(dá)水平和適宜的參照之間的差異可以指示該受試者中的肺癌。或者,當(dāng)適宜的參照指示受試者沒有肺癌時,自需要診斷肺癌的受試者測定的表達(dá)水平和適宜的參照水平之間缺乏可檢測差異(例如缺乏統(tǒng)計學(xué)上顯著的差異)可以指示該受試者沒有肺癌。在一些實施方案中,參照標(biāo)準(zhǔn)提供變化的閾水平,使得如果樣品中基因的表達(dá)水平在變化(升高或降低,取決于特定的標(biāo)志物)的閾水平內(nèi),那么將該受試者鑒定為沒有肺癌,但是如果該水平在該閾以上,那么將該受試者鑒定為有風(fēng)險具有肺癌。在一些實施方案中,該方法涉及比較信息性基因的表達(dá)水平與代表鑒定為沒有肺癌的對照受試者中信息性基因的表達(dá)水平的參照標(biāo)準(zhǔn)。這種參照標(biāo)準(zhǔn)可以是例如一群鑒定為沒有肺癌的對照受試者中信息性基因的平均表達(dá)水平。統(tǒng)計學(xué)上顯著的表達(dá)水平和適宜的參照之間差異的量級可以變化。例如,當(dāng)生物學(xué)樣品中信息性基因的表達(dá)水平比該基因的適宜參照要高或低至少1%,至少5%,至少10%,至少25%,至少50%,至少100%,至少250%,至少500%,或至少1000%時,可以檢測到指示肺癌的顯著差異。類似地,當(dāng)生物學(xué)樣品中信息性基因的表達(dá)水平比該基因的適宜參照要高或低至少1.1倍,1.2倍,1.5倍,2倍,至少3倍,至少4倍,至少5倍,至少6倍,至少7倍,至少8倍,至少9倍,至少10倍,至少20倍,至少30倍,至少40倍,至少50倍,至少100倍,或更多時,可以檢測到顯著差異。在一些實施方案中,信息性基因和適宜參照之間表達(dá)中至少20%至50%的差異是顯著的。顯著差異可以使用適宜的統(tǒng)計學(xué)檢驗來鑒定。用于統(tǒng)計學(xué)顯著性的檢驗是本領(lǐng)域公知的且例示于AppliedStatisticsforEngineersandScientistsbyPetruccelli,ChenandNandram1999ReprintEd。要理解的是,為了評估受試者的肺癌狀態(tài),可以比較多數(shù)表達(dá)水平與多數(shù)適宜參照水平,例如在基因-接-基因的基礎(chǔ)上??梢宰鳛槭噶坎顏磉M(jìn)行該比較。在此類情況中,可以使用多變量檢驗(例如Hotelling氏T2檢驗)來評估觀察到的差異的顯著性。此類多變量檢驗是本領(lǐng)域公知的且例示于AppliedMultivariateStatisticalAnalysisbyRichardArnoldJohnsonandDeanW.WichernPrenticeHall;6thedition(April2,2007)。分類方法該方法還可以涉及比較自受試者獲得的生物學(xué)樣品中信息性基因的表達(dá)水平集合(稱作表達(dá)樣式或概況)與多數(shù)參照水平集合(稱作參照樣式),每一種參照樣式與一種已知的肺癌狀態(tài)有關(guān),鑒定與該表達(dá)樣式最密切相像的參照樣式,并將該參照樣式的已知肺癌狀態(tài)與該表達(dá)樣式關(guān)聯(lián)起來,由此對該受試者的肺癌狀態(tài)的分類(表征)。該方法還可以涉及建造或構(gòu)建能用于對受試者的疾病狀態(tài)分類的預(yù)測模型,其也可以稱作分類器或預(yù)測器。如本文中使用的,“肺癌分類器”指基于在自受試者獲得的生物學(xué)樣品中測定的表達(dá)水平表征該受試者的肺癌狀態(tài)的預(yù)測模型。典型地,該模型是使用分類(肺癌狀態(tài))早就確定的樣品構(gòu)造的。一旦構(gòu)造該模型(分類器),就可以將它應(yīng)用于自其肺癌狀態(tài)未知的受試者的生物學(xué)樣品獲得的表達(dá)水平以預(yù)測該受試者的肺癌狀態(tài)。如此,該方法可涉及將肺癌分類器應(yīng)用于該表達(dá)水平,使得該肺癌分類器基于該表達(dá)水平表征受試者的肺癌狀態(tài)??梢曰陬A(yù)測的肺癌狀態(tài)進(jìn)一步治療或評估該受試者,例如由健康護(hù)理提供者進(jìn)行。該分類方法可涉及將該表達(dá)水平轉(zhuǎn)換成肺癌風(fēng)險得分,其指示該受試者具有肺癌的可能性。在一些實施方案中,諸如例如當(dāng)使用線性判別式分類器時,該肺癌風(fēng)險得分可以作為加權(quán)表達(dá)水平的組合(例如和,積,或其它組合)獲得,其中該表達(dá)水平是以它們對預(yù)測具有肺癌的可能性升高的相對貢獻(xiàn)加權(quán)的。應(yīng)當(dāng)領(lǐng)會,可以使用本領(lǐng)域已知的多種預(yù)測模型作為肺癌分類器。例如,肺癌分類器可以包含選自邏輯回歸,偏最小二乘,線性判別式分析,二次判別式分析,神經(jīng)網(wǎng)絡(luò),樸素貝葉斯,C4.5決策樹,k-最近鄰,隨機(jī)森林,支持向量機(jī),或其它適宜方法的算法??梢栽诎澡b定為具有肺癌的多數(shù)受試者獲得的生物學(xué)樣品中多數(shù)信息性基因的表達(dá)水平的數(shù)據(jù)集合上訓(xùn)練肺癌分類器。例如,可以在包含自基于組織學(xué)發(fā)現(xiàn)鑒定為具有肺癌的多數(shù)受試者獲得的生物學(xué)樣品中多數(shù)信息性基因的表達(dá)水平的數(shù)據(jù)集合上訓(xùn)練肺癌分類器。典型地,訓(xùn)練集合還會包含鑒定為沒有肺癌的對照受試者。正如熟練技術(shù)人員會領(lǐng)會的,訓(xùn)練數(shù)據(jù)集合的受試者群體可以故意具有多種特征,例如該群體的特征可取決于如下的受試者的特征,使用該分類器的診斷性方法對于該受試者可能是有用的。例如,該群體可以全部由男性組成,全部由女性組成或由男性和女性二者組成。該群體可以由具有癌癥歷史的受試者,沒有癌癥歷史的受試者,或來自這兩個范疇的受試者組成。該群體可以包括是吸煙者,以前的吸煙者,和/或非吸煙者的受試者。還可以測量類別預(yù)測力度以測定該模型對生物學(xué)樣品分類的置信度程度。這種置信度程度可以用作該受試者屬于由該模型預(yù)測的特定類別的可能性的估值。因而,該預(yù)測力度傳達(dá)樣品分類的置信度程度且評估何時不能對樣品分類。可能有這樣的情況,其中測試了樣品,但是它不屬于,或不能可靠地指派至特定類別。這可以例如通過利用閾或范圍來實現(xiàn),其中得分在所確定的閾以上或以下或者在特定范圍內(nèi)的樣品不是不能分類的樣品(例如“無調(diào)用”)。一旦構(gòu)造了模型,就能使用本領(lǐng)域已知方法測試該模型的有效性。測試該模型的有效性的一種方式是通過數(shù)據(jù)集合的交叉驗證。為了實施交叉驗證,消除一份或一個子集的樣品并在沒有所消除樣品的情況下如上文所述構(gòu)造模型,形成“交叉驗證模型”。然后如本文所述依照該模型對所消除樣品分類。對初始數(shù)據(jù)集合的所有樣品或子集進(jìn)行這個過程并確定誤差率。然后評估該模型的準(zhǔn)確度。對于已知的類別或先前已經(jīng)確認(rèn)的類別,這種模型以高準(zhǔn)確度對要測試的樣品分類。驗證模型的另一種方式是將模型應(yīng)用于獨立的數(shù)據(jù)集合,諸如新的具有未知肺癌狀態(tài)的生物學(xué)樣品。正如熟練技術(shù)人員會領(lǐng)會的,可以通過多種參數(shù)來評估模型的力度,包括但不限于準(zhǔn)確度,靈敏度和特異性。用于運(yùn)算準(zhǔn)確度,靈敏度和特異性的方法是本領(lǐng)域已知且本文中有描述(見例如實施例)。肺癌分類器可以具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少99%,或更多的準(zhǔn)確度。肺癌分類器可以具有約60%至70%,70%至80%,80%至90%,或90%至100%的范圍中的準(zhǔn)確度。肺癌分類器可以具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少99%,或更多的靈敏度。該肺癌分類器可以具有約60%至70%,70%至80%,80%至90%,或90%至100%的范圍中的靈敏度。肺癌分類器可以具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少99%,或更多的特異性。肺癌分類器可以具有約60%至70%,70%至80%,80%至90%,或90%至100%的范圍中的特異性。在預(yù)期使用人群中排除肺癌的負(fù)面預(yù)測值(NegativePredictiveValue,NPV)可以大于40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%。預(yù)期使用人群可以具有處于或約40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%的癌癥流行度。臨床治療/管理在某些方面,提供用于為受試者確定治療過程的方法。典型地,該方法涉及測定自該受試者獲得的生物學(xué)樣品中一種或多種信息性基因的表達(dá)水平,并基于該表達(dá)水平為該受試者確定治療過程。通常,治療過程是基于自該表達(dá)水平推導(dǎo)的肺癌風(fēng)險得分確定的??梢曰谥甘驹撌茉囌呔哂邢鄬Ω叩木哂蟹伟┑目赡苄缘姆伟╋L(fēng)險得分將該受試者鑒定為肺癌療法的候選人??梢曰谥甘驹撌茉囌呔哂邢鄬Ω叩木哂蟹伟┑目赡苄缘姆伟╋L(fēng)險得分(例如大于60%,大于70%,大于80%,大于90%)將該受試者鑒定為侵入性肺規(guī)程(例如經(jīng)胸針穿刺,縱隔鏡檢查術(shù),或開胸術(shù))的候選人??梢曰谥甘驹撌茉囌呔哂邢鄬Φ偷木哂蟹伟┑目赡苄缘姆伟╋L(fēng)險得分(例如小于50%,小于40%,小于30%,小于20%)將該受試者鑒定為不是肺癌療法或侵入性肺規(guī)程的候選人。在一些情況中,獲得的是中等風(fēng)險得分且不指示該受試者在高風(fēng)險或低風(fēng)險范疇中。在一些實施方案中,在做出風(fēng)險確定后不久,健康護(hù)理提供者可參與“留置觀察”并對在一個或多個稍晚的時間點采集的生物學(xué)樣品重復(fù)分析,或采取進(jìn)一步的診斷性規(guī)程以排除肺癌,或做出存在癌癥的判定。在一個特定的例子中,由于非診斷性支氣管鏡檢將受試者鑒定為中等風(fēng)險,并遵循使用本文中的方法做出的該患者處于低癌癥風(fēng)險的判定,重新指派非侵入性監(jiān)測(諸如CT監(jiān)視)。在另一個特定的例子中,可以使用如本文所述測定的樣品。該方法還可涉及創(chuàng)建匯總該基因表達(dá)分析的結(jié)果的報告。典型地,該報告還會包括指出該肺癌風(fēng)險得分。計算機(jī)執(zhí)行方法本文中公開的方法可以以眾多方式任一執(zhí)行。例如,某些實施方案可以使用硬件,軟件或其組合執(zhí)行。當(dāng)以軟件執(zhí)行時,該軟件代碼可以在任何合適的處理器或處理器集合上執(zhí)行,無論是在單一計算機(jī)中提供或者在分散在多臺計算機(jī)間。此類處理器可以作為集成電路執(zhí)行,其中一個或多個處理器在一個集成電路組件中??墒牵幚砥骺梢允褂萌魏魏线m型式的電路執(zhí)行。而且,應(yīng)當(dāng)領(lǐng)會,計算機(jī)可以體現(xiàn)為多種形式任一,諸如機(jī)架式計算機(jī),臺式計算機(jī),膝上式計算機(jī),或平板計算機(jī)。另外,計算機(jī)可以體現(xiàn)為一般不認(rèn)為是計算機(jī)但具有合適的處理能力的設(shè)備,包括個人數(shù)字助理(PDA),智能電話或任何其它合適的便攜式或固定式電子設(shè)備。還有,計算機(jī)可以具有一種或多種輸入和輸出設(shè)備。除其它事項外,這些設(shè)備可以用于呈現(xiàn)用戶界面。能用于提供用戶界面的輸出設(shè)備的例子包括用于視覺呈現(xiàn)輸出的打印機(jī)或顯示屏和用于聽覺呈現(xiàn)輸出的揚(yáng)聲器或其它聲音產(chǎn)生設(shè)備。能用于用戶界面的輸入設(shè)備的例子包括鍵盤,和指點設(shè)備,諸如鼠標(biāo),觸摸板,和數(shù)字化平板。又例如,計算機(jī)可經(jīng)由語音識別或以其它音頻型式接收輸入信息。此類計算機(jī)可以互聯(lián)一種或多種任何合適形式的網(wǎng)絡(luò),包括作為局域網(wǎng)或廣域網(wǎng),諸如企業(yè)網(wǎng)絡(luò)或因特網(wǎng)。此類網(wǎng)絡(luò)可基于任何合適的技術(shù),而且可以依照任何合適的協(xié)議操作,而且可包括無線網(wǎng)絡(luò),有線網(wǎng)絡(luò)或光纖網(wǎng)絡(luò)。還有,本文中概述的各種方法或過程可編碼為在采用多種操作系統(tǒng)或平臺任一的一個或多個處理器上可執(zhí)行的軟件。另外,此類軟件可使用多種合適的編程語言和/或編程或腳本工具任一來編寫,而且還可編譯為在框架或虛擬機(jī)上執(zhí)行的可執(zhí)行機(jī)器語言代碼或中間代碼。在這方面,本公開文本的各方面可體現(xiàn)為計算機(jī)可讀介質(zhì)(或多種計算機(jī)可讀介質(zhì))(例如計算機(jī)存儲器,一個或多個軟盤,壓縮盤(CD),光盤,數(shù)字視頻盤(DVD)),磁帶,閃存,現(xiàn)場可編程門陣列或其它半導(dǎo)體器件中的電路配置,或其它非暫時性有形計算機(jī)存儲介質(zhì)),其編碼有一種或多種程序,在一臺或多臺計算機(jī)或其它處理器上執(zhí)行時,實施執(zhí)行上文討論的本公開文本的各種實施方案的方法。計算機(jī)可讀介質(zhì)可以是可傳輸?shù)?,使得存儲在其上的程序能加載到一臺或多臺不同計算機(jī)或其它處理器上,以執(zhí)行如上文討論的本公開文本的各個方面。如本文中使用的,術(shù)語“非暫時性計算機(jī)可讀存儲介質(zhì)”僅涵蓋可認(rèn)為是產(chǎn)品(即制品)或機(jī)器的計算機(jī)可讀介質(zhì)。術(shù)語“程序”或“軟件”在本文中在一般意義上用于指可用于對計算機(jī)或其它處理器進(jìn)行編程以執(zhí)行如上文討論的本公開文本的各個方面的任何類型的計算機(jī)代碼或計算機(jī)可執(zhí)行指令集合。另外,應(yīng)當(dāng)領(lǐng)會,依照此實施例的一個方面,在執(zhí)行時實施本公開文本的方法的一種或多種計算機(jī)程序不需要駐留在單個計算機(jī)或處理器上,而是可以以模塊方式分散在多臺不同計算機(jī)或處理器上以執(zhí)行本公開文本的各個方面。如本文中使用的,術(shù)語“數(shù)據(jù)庫”一般指為了搜索和檢索的容易和速度而安排的數(shù)據(jù)的集合。而且,數(shù)據(jù)庫通常包含邏輯和物理數(shù)據(jù)結(jié)構(gòu)。本領(lǐng)域技術(shù)人員會認(rèn)識到,本文中描述的方法可以與包括關(guān)系數(shù)據(jù)庫,對象關(guān)系數(shù)據(jù)庫和基于XML的數(shù)據(jù)庫(其中XML代表“可擴(kuò)展標(biāo)記語言”)的任何類型的數(shù)據(jù)庫一起使用。例如,基因表達(dá)信息可以存儲在數(shù)據(jù)庫中并從數(shù)據(jù)庫中檢索?;虮磉_(dá)信息可以以將基因表達(dá)信息與多種其它相關(guān)信息(例如與創(chuàng)建幫助醫(yī)生建立治療方案和/或做出診斷確定的報告或文檔相關(guān)的信息或幫助跟蹤患者樣品的信息)相關(guān)聯(lián)的方式存儲或索引。此類相關(guān)信息可以包括例如患者識別信息,訂購醫(yī)生識別信息,關(guān)于訂購醫(yī)生辦公室的信息(例如地址,電話號碼),關(guān)于生物學(xué)樣品的來源的信息(例如組織類型,采樣日期),生物學(xué)樣品處理信息,樣品質(zhì)量控制信息,生物學(xué)樣品儲存信息,基因注釋信息,肺癌風(fēng)險分類器信息,肺癌風(fēng)險因素信息,支付信息,訂單日期信息,等。計算機(jī)可執(zhí)行指令可以是由一臺或多臺計算機(jī)或其它設(shè)備執(zhí)行的許多形式,諸如程序模塊。一般而言,程序模塊包括實施特定任務(wù)或執(zhí)行特定抽象數(shù)據(jù)類型的例程,程序,對象,組件,數(shù)據(jù)結(jié)構(gòu),等。通常,程序模塊的功能性可以依照各種實施方案中的需要組合或分配。在本公開文本的一些方面,提供了用于處理基因組信息的計算機(jī)執(zhí)行方法。該方法一般涉及獲得代表生物學(xué)樣品中一種或多種信息性基因的表達(dá)水平的數(shù)據(jù),并至少部分基于該表達(dá)水平確定受試者具有肺癌的可能性。本文中公開的任何統(tǒng)計或分類方法可以并入計算機(jī)執(zhí)行方法中。在一些實施方案中,該方法涉及計算指示受試者具有肺癌的可能性的風(fēng)險得分。計算風(fēng)險得分可涉及確定加權(quán)表達(dá)水平的組合(例如和,積或其它組合),其中該表達(dá)水平是以它們對預(yù)測具有肺癌的可能性升高的相對貢獻(xiàn)加權(quán)的。該計算機(jī)執(zhí)行方法還可以涉及生成匯總該基因表達(dá)分析的結(jié)果的報告,諸如通過規(guī)定風(fēng)險得分。此類方法還可以涉及將該報告?zhèn)鬏斀o該受試者的健康護(hù)理提供者。Affymetrix陣列在一些方面中,使用Affymetrix人基因1.0ST陣列(Affymetrix產(chǎn)品目錄號901087)來鑒定生物學(xué)樣品中的mRNA或cDNA。Affymetrix人基因1.0ST陣列利用在www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1處公開的眾多探針。存在與特定基因的區(qū)段對應(yīng)的多種探針,也就是說,不是每種基因一種探針的1:1比率,而是存在與一種基因的多個區(qū)段對應(yīng)的多種探針。在一個例子中,LYPD2基因由人基因1.0ST陣列(版本32)中的三個探針集代表,探針基ID8153343,8153344,和8153345,如在Affymetrix人基因1.0ST陣列(HuGene-1_0-st-v1探針集注釋。陣列的例示性合適構(gòu)件包括版本32(09/30/2011),版本33(03/27/2013),版本34(04/07/2014),版本35(04/15/2015),和版本36)中公開的。還可以使用別的版本,包括未來的版本。關(guān)聯(lián)探針集和核酸序列的信息可以見Affymetrix.com,包括www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1。此外,數(shù)據(jù)集可在www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244處在NCBIGeneExpressionOmnibus網(wǎng)站上在PlatformGPL6244下獲得,其詳述可用于實施本公開文本的方法的探針和基因。這些文件(包括那些將探針集和基因符號相關(guān)聯(lián)的)通過援引收入本文。組合物和試劑盒在一些方面,提供了可用于測定信息性基因的表達(dá)水平的組合物和相關(guān)方法。例如,提供了基本上由與信息性基因或與具有與信息性基因互補(bǔ)的序列的核酸特異性雜交的核酸探針組成的組合物。這些組合物還可以包括與對照基因或與其互補(bǔ)的核酸特異性雜交的探針。這些組合物還可以包括適宜的緩沖劑,鹽或檢測試劑。該核酸探針可以直接或間接固定至固體支持物(例如玻璃,塑料或硅芯片)或珠(例如磁珠)。可以定制核酸探針以用于基于珠的核酸檢測測定法中。在一些實施方案中,提供了包含多至5,多至10,多至25,多至50,多至100,或多至200種核酸探針的組合物。在一些情況中,每種核酸探針與選自表11的mRNA或與具有與該mRNA互補(bǔ)的序列的核酸特異性雜交。在一些實施方案中,還包括檢測信息性mRNA的探針。在一些情況中,至少2,至少3,至少4,至少5,至少6,至少7,至少8,至少9,至少10,或至少20種核酸探針每一種與選自表11的mRNA或與具有與該mRNA互補(bǔ)的序列的核酸特異性雜交。在一些實施方案中,制備該組合物用于在生物化學(xué)上分開的反應(yīng)中檢測不同基因,或用于在相同的生物化學(xué)反應(yīng)中檢測多種基因。在一些實施方案中,制備該組合物用于實施多重反應(yīng)。本文中還提供的是在用于同時測定多種信息性基因的水平的方法中有用的寡核苷酸(核酸)陣列。此類陣列可以從商業(yè)來源獲得或生產(chǎn)。用于生成核酸陣列的方法也是本領(lǐng)域公知的。例如,核酸陣列可以通過將能夠與對應(yīng)于基因或其部分的核酸雜交的大量寡核苷酸,多核苷酸,或cDNA固定化至固體支持物來構(gòu)建。本領(lǐng)域技術(shù)人員可參見CurrentProtocolsInMolecularBiology(Eds.Ausubeletal.JohnWileyand#38;SonsNY,2000)第22章“NucleicAcidArrays”或LiuCG,etal.,Anoligonucleotidemicrochipforgenome-widemicroRNAprofilinginhumanandmousetissues.ProcNallAcadSciUSA.2004Jun29;101(26):9740-4,其提供與核酸陣列構(gòu)建有關(guān)及在檢測感興趣核酸中使用的方法的非限制性例子。在一些實施方案中,該陣列包含至少2,至少5,至少10,至少20,至少50,至少60,至少70或更多種信息性基因的結(jié)合探針或基本上由其組成。在一些實施方案中,該陣列包含至多2,至多5,至多10,至多20,至多50,至多60,至多70或更多種信息性基因的結(jié)合探針或基本上由其組成。在一些實施方案中,陣列包含1,2,3,4,5,6,7,8,9,或10種選自表11的mRNA或由其組成。在一些實施方案中,陣列包含4,5,或6種選自表11的mRNA或由其組成。還提供了包含該寡核苷酸陣列的試劑盒。試劑盒可包括核酸標(biāo)記試劑和使用該陣列測定表達(dá)水平的說明書。本文中描述的組合物可以作為試劑盒提供用于測定和評估信息性基因的表達(dá)水平。該組合物可以組裝成診斷或研究試劑盒以便于它們在診斷或研究應(yīng)用中的使用。試劑盒可以包括容納本公開文本的成分的一個或多個容器和使用說明書。具體而言,此類試劑盒可以包括本文中描述的一種或多種組合物,連同描述這些組合物的預(yù)期應(yīng)用和適當(dāng)使用的說明書。試劑盒可以含有適宜濃度或數(shù)量的成分用于運(yùn)行各種實驗。該試劑盒可以設(shè)計成便于研究人員,健康護(hù)理提供者,診斷實驗室,或其他實體使用本文中描述的方法,而且可以采取許多形式。該試劑盒的每種組合物(在適用時)可以以液體形式(例如以溶液)或以固體形式(例如干粉)提供。在某些情況中,一些組合物可以是可構(gòu)建的或以其它方式可加工的,例如通過添加合適的溶劑或其它物質(zhì),其可以與或不與該試劑盒一起提供。如本文中使用的,“說明書”可以定義指令和/或宣傳的組件,而且通常涉及在本公開文本的包裝上或與其關(guān)聯(lián)的書面說明書。說明書還可以包括以任何方式提供的任何口頭或電子指令,使得用戶會清楚地認(rèn)識到該說明書與該試劑盒相關(guān)聯(lián),例如視聽(例如視頻磁帶,DVD,等),因特網(wǎng),和/或基于網(wǎng)絡(luò)的通信,等。書面說明書可以是由管理診斷或生物學(xué)產(chǎn)品的制造,使用或銷售的政府機(jī)構(gòu)規(guī)定的形式,該說明書還可以反映該機(jī)構(gòu)的批準(zhǔn)。試劑盒可以在一個或多個容器中含有本文中描述的任何一種或多種成分。例如,在一個實施方案中,該試劑盒可包括關(guān)于混合該試劑盒的一種或多種成分和/或分離并混合樣品并應(yīng)用于受試者的說明書。該試劑盒可以包括容納本文中描述的藥劑的容器。該成分可以是液體,凝膠或固體(例如粉末)的形式。該成分可以無菌制備及冷藏運(yùn)輸?;蛘?,它們可以容納在管形瓶或其它容器中用于儲存。第二容器可以具有無菌制備的其它成分。如本文中使用的,提到數(shù)值的術(shù)語“大約”或“約”一般認(rèn)為包括在任一方向上(大于或小于)落入1%,5%,10%,15%,或20%范圍內(nèi)的數(shù)值,除非另有說明或從上下文另外明顯可得的(除非此類數(shù)值會小于可能值的0%或超過可能值的100%的情況)。通過援引收錄本文中描述的所有參考文獻(xiàn)用于本文中描述的目的。會通過下面的實施例更為詳細(xì)地描述本公開文本的例示性實施方案。這些實施方案是本公開文本的例示,本領(lǐng)域技術(shù)人員會認(rèn)識到本公開文本不限于該例示性實施方案。實施例實施例1:基于微陣列的預(yù)測模型的開發(fā)導(dǎo)言此實施例描述一種用于開發(fā)預(yù)測算法的方法。描述了一種最終的經(jīng)過優(yōu)化的模型,包括該模型中使用的基因的組合。該方法使用臨床因素基因組關(guān)聯(lián)(CFGC)來幫助選擇癌癥特異性簽名。目標(biāo)是在通過派生基因組關(guān)聯(lián)考慮更加特異性地歸結(jié)于臨床因素的基因表達(dá)信號后開發(fā)和表征一種新的有效預(yù)測肺癌狀態(tài)的癌癥預(yù)測模型?;蚪M關(guān)聯(lián)本文中定義為預(yù)測特定臨床特征,諸如受試者性別,吸煙狀態(tài),和吸煙史的基因表達(dá)算法。一個目標(biāo)是開發(fā)滿足下面的特定性能表征的預(yù)測算法:大于90%的在預(yù)期使用人群中排除肺癌的負(fù)面預(yù)測值(NPV),和大于85%的診斷有COPD的受試者的NPV。材料和方法樣品加工和分析自因懷疑肺癌安排接受支氣管鏡檢的患者收集臨床標(biāo)本。在安排的支氣管鏡檢規(guī)程期間使用標(biāo)準(zhǔn)支氣管刷自受試者的主干支氣管收集支氣管上皮細(xì)胞(BEC)。使用基因1.0ST微陣列(Affymetrix)在基因表達(dá)微陣列上分析樣品。對陣列數(shù)據(jù)進(jìn)行成對關(guān)聯(lián)分析以鑒定離群值(本文中描述的)。保留總共597份樣品作為最終的數(shù)據(jù)集合。然后以隨機(jī)化方式將該數(shù)據(jù)集合拆分成等同大小的訓(xùn)練和驗證集合。使用微陣列CEL文件來開發(fā)預(yù)測算法。首先將受試者指派至獨立的訓(xùn)練和驗證集合,并在訓(xùn)練集合內(nèi)進(jìn)行預(yù)測模型的基因選擇和優(yōu)化。優(yōu)化并鎖定該模型,之后預(yù)測驗證集合樣品的癌癥狀態(tài)。標(biāo)準(zhǔn)化/批次調(diào)整使用RMA來運(yùn)算來自基因1.0ST(Affymetrix)CEL文件的基因表達(dá)值。使用ComBat批次調(diào)整來校正批次效應(yīng)。在5項分開的微陣列實驗(即批次)內(nèi)分析所有樣品。在RMA和ComBat預(yù)加工中組合訓(xùn)練和測試樣品。如先前描述的那樣,后續(xù)開發(fā)局限于訓(xùn)練集合。排除與RIN得分小于4的樣品對應(yīng)的CEL文件,亦如平均配對關(guān)聯(lián)小于.955的樣品(見圖1)。基因組關(guān)聯(lián)作為精確預(yù)測相應(yīng)臨床特征的基因表達(dá)簽名,建立基因組關(guān)聯(lián)。在預(yù)測算法中組合該基因組關(guān)聯(lián),與分開的預(yù)測癌癥狀態(tài)的基因組合。開發(fā)并評估下面的臨床特征的關(guān)聯(lián):性別吸煙狀態(tài)(當(dāng)前的對以前的)吸煙史(包-年;PY)年齡該基因組關(guān)聯(lián)是通過選擇區(qū)分感興趣的臨床特征的排序頭等的基因并使用邏輯回歸將那些基因擬合至模型而開發(fā)的。臨床特征的評分基于那些選定基因的基因表達(dá)。平行開發(fā)了兩種模型以在驗證集合中同時測試。第一模型(得分1)基于本文中描述的方法并將報告的年齡歸為預(yù)測算法的因素與基因組信號一樣。使用年齡的基因組關(guān)聯(lián)開發(fā)第二模型(得分2),然后將其并入預(yù)測算法。初始基因選擇使用癌癥狀態(tài)(0/1)對年齡,性別,吸煙狀態(tài),和包裝年的邏輯回歸來開發(fā)臨床因素模型。使用來自臨床因素模型的殘差選擇基因,使用經(jīng)驗貝葉斯線性模型測試每種基因與殘差的關(guān)聯(lián)?;趤碜源四P偷膒值和倍數(shù)變化選擇頭等232種基因。該頭等232種基因列于表11。聚簇/最終基因選擇以自動化交叉驗證辦法進(jìn)行基因選擇和模型擬合,以便在選擇過程期間使偏差最小化及提供穩(wěn)健有力的最終選擇?;蜻x擇由以下步驟組成。使用分級聚簇將基因分成11個簇。每種基因的簇成員關(guān)系在表11的欄2中標(biāo)識。對于每個簇,使用每個簇內(nèi)的所有基因運(yùn)算簇均值。在數(shù)據(jù)的重復(fù)隨機(jī)子集合中使用LASSO和反向選擇的組合,以鑒定一致地選擇與癌癥狀態(tài)具有獨立預(yù)測性關(guān)聯(lián)的六個簇。然后使用交叉驗證來確定每個簇內(nèi)會保留簇均值的預(yù)測強(qiáng)度的基因的近似數(shù)目。進(jìn)行基因滴定分析以確定模型對來自最終模型內(nèi)所選擇的簇的基因數(shù)量增加的靈敏度。這被包括作為優(yōu)化的一部分以確定互補(bǔ)基因是否能為模型增加另外的臨床靈敏度。軟件使用R(版本3.01)進(jìn)行分析,包括軟件包rms,limma,verification,和sva。結(jié)果基因組關(guān)聯(lián)的派生使用整個訓(xùn)練集合選擇基因來代表臨床特征。這些“基因組關(guān)聯(lián)基因”基于最小限度的基因集合來盡可能準(zhǔn)確地代表臨床因素。使用單種基因以100%的準(zhǔn)確度定義基因組性別(GG)。數(shù)值設(shè)置如下:如果RPS4Y1<閾值,則GG=1(男性),否則,GG=0(女性)。對于基因組吸煙狀態(tài),基于經(jīng)驗貝葉斯t檢驗篩選基因。將p值的頭等基因包括在邏輯回歸模型中,其中吸煙狀態(tài)是因變量。所得預(yù)測的基因組吸煙(GS)值源自此模型(使用基因符號來代表相對表達(dá)強(qiáng)度),其中,其中是該基因組回歸模型的回歸權(quán)重,且GS=exp(x)/(1+exp(x))。對于基因組包年數(shù),基于經(jīng)驗貝葉斯t檢驗篩選基因。將p值的頭等基因包括在邏輯回歸模型中,其中包年數(shù)<10是因變量。所得預(yù)測的基因組包年數(shù)(GPY)值源自此模型,其中,其中是該基因組包年數(shù)回歸模型的回歸權(quán)重,且GPY=exp(x)/(1+exp(x))。對于基因組年齡,基于經(jīng)驗貝葉斯線性模型篩選基因。將p值的頭等基因包括在罰分線性回歸模型(LASSO)中,其中年齡(以年計)是因變量。所得預(yù)測的基因組年齡(GA)值源自此模型,其中,其中是該基因組年齡回歸模型的回歸權(quán)重。癌癥基因的派生最初選擇頭等232種基因,接著使用方法部分中描述的聚簇分析來縮減選擇基因。然后使用交叉驗證來確定每個簇內(nèi)會保留簇均值的預(yù)測強(qiáng)度的基因的近似數(shù)目。發(fā)現(xiàn)此數(shù)目在每個簇2和4種基因之間。每個簇內(nèi)的最終基因選擇基于來自文獻(xiàn)的癌癥關(guān)聯(lián)的p值,倍數(shù)變化,和證據(jù)強(qiáng)度。使用每個簇內(nèi)簡化的基因集合重新運(yùn)算簇均值,如下:CIA=(BST1,CD177.1,CD177.2)的均值C1B=(ATP12A,TSPAN2)的均值C2=(GABBRI,MCAM,NOVA1,SDC2)的均值C3=(CDR1,CGREF1,CLND22,NKX3-1)的均值C4A=(EPHX3,LYPD2)的均值C4B=(MIA,RNF150)的均值。最終模型的描述為了評估最終的模型系數(shù),使用了罰分邏輯回歸模型,其中年齡(以年計),基因組性別(GG),基因組吸煙狀態(tài)(GS),基因組包年(GPY),和6項縮減基因簇均值(標(biāo)記為CIA,C1B,C2,C3,C4A,C4B)作為獨立預(yù)測因子和癌癥狀態(tài)(0/1)作為因變量。懲罰因子(λ),對于臨床/基因組關(guān)聯(lián)為0,對于每個基因表達(dá)簇為10。第二種模型的構(gòu)建使用相同的辦法,但是用如上文定義的基因組年齡(GA)替換年齡。然后重新評估模型系數(shù)。最終的分類算法為如下形式的:x得分1=W0+W1xGG+W2xGS+W3xGPY+W4x所報告的年齡+W5xC1A+W6xC1B+W7xC2+W8xC3+W9xC4A+W10xC4BX得分2=W0+W1xGG+W2xGS+W3xGPY+W4xGA+W5xC1A+W6xC1B+W7xC2+W8xC3+W9xC4A+W10xC4B。然后使用如下方程將該邏輯回歸得分轉(zhuǎn)換成范圍為0至1的預(yù)測得分:預(yù)測模型的評估使用交叉驗證辦法,其中分別將訓(xùn)練集合樣品隨機(jī)分拆(90:10)成訓(xùn)練和測試組。記錄臨床精確度,并將該過程重復(fù)100倍。以每份樣本的總迭代的平均值報告訓(xùn)練集合的分?jǐn)?shù)。以ROC曲線,AUC,及在定義得分閾以產(chǎn)生50%特異性及最大化臨床靈敏度之后的靈敏度和特異性報告結(jié)果。生成所有訓(xùn)練集合樣品的得分,并與記錄的臨床狀態(tài)比較。對于得分1和得分2的ROC曲線,所有樣品的顯示于圖2中,支氣管鏡檢陰性樣品的顯示于圖3中。對于AUC,所有樣品的計算為得分1=0.803,得分2=0.785,支氣管陰性集合的計算為得分1=0.808,得分2=0.778。表1提供了在預(yù)測得分模型中使用的信息性基因的列表。表1.1提供了用于檢測此類基因的表達(dá)的探針序列的非限制性列表。表1:基因列表和功能表1.1:用于檢測信息性基因的探針序列的非限制性例子下文表2提供了訓(xùn)練集合中用于支氣管鏡檢陰性受試者的兩種模型的性能特征的匯總。支氣管陰性受試者的數(shù)目(N)對應(yīng)于用于靈敏度的CA+受試者和用于特異性的CA-受試者。*NPV是假設(shè)50%的癌癥流行度與觀察到的支氣管鏡檢和預(yù)測模型的靈敏度和特異性組合而計算的。模型性能使用特定得分閾來進(jìn)行預(yù)測模型(基于得分1和2)的靈敏度和特異性的計算,以區(qū)分CA+和CA-樣品的預(yù)測。在驗證集合中使用在訓(xùn)練集合中為這兩種模型選擇的相同閾(模型得分=0.65)。首先在支氣管鏡檢陰性樣品(預(yù)期用途病例)中確定兩種模型的預(yù)測準(zhǔn)確度,并匯總于還針對驗證集合內(nèi)的數(shù)個亞組范疇計算預(yù)測模型的靈敏度。這兩種模型的結(jié)果顯示于表3-9中。子范疇含有影響置信區(qū)間的不同數(shù)目的樣品。表3–作為觀察到的損傷的塊大小的函數(shù)的預(yù)測模型的靈敏度–得分1塊大小NSensSens.Sens.PM+BRSens.<113100.00%83.30%100.00%1至23587.50%50.00%100.00%2至34190.60%53,10%96.90%>315585.10%79.40%95.00%浸潤物32100.00%100.00%100.00%未知21100.00%80.00%100.00%PM=預(yù)測模型;BR=支氣管鏡檢表4–作為觀察到的損傷的塊大小的函數(shù)的預(yù)測模型的靈敏度–得分2塊大小NPMs.Senens.BRSens.PM+BRS<11366.70%83.30%100.00%1至23587.50%50.00%93.80%2至34181.30%53.10%93.80%>315583.00%79.40%95.70%浸潤物3290.00%100.00%100.00%未知21100.00%80.00%100.00%表5–作為肺中觀察到的損傷的定位的函數(shù)的預(yù)測模型的靈敏度(得分1)塊大小NPMSensBRSensPM+BRSens中央9784.40%79.20%93.50%周圍8690.70%61.10%96.30%二者9090.50%78.40%100.00%未知2586.70%80.00%93.30%表6–作為肺中觀察到的損傷的定位的函數(shù)的預(yù)測模型的靈敏度(得分2)表7–作為如病理學(xué)中確定的癌癥亞型的函數(shù)的預(yù)測模型的靈敏度(得分1)癌癥類型NPMSens.BRSens.PM+BRSens.AC6783.60%70.10%94.00%SCC7294.40%75.00%95.80%LC771.40%85.70%100.00%NSCLC2692.30%73.10%76.90%SCLC3789.20%86.50%97.30%NSCLC/SCLC250.00%100.00%100,00%未知8675.00%37.50%100.00%表8–作為如病理學(xué)中確定的癌癥亞型的函數(shù)的預(yù)測模型的靈敏度(得分2)癌癥類型NPMSens.BRSens.PM+BRSens.AC6780,60%70.10%94,00%SCC7287.50%75.00%97.20%LC785.70%85.70%100.00%NSCLC2669.20%73.10%80.80%SCLC3789.20%86.50%97.30%NSCLC/SCLC20.00%100.00%100.00%未知8662.50%37.50%87.50%PM=預(yù)測模型;BR=支氣管鏡檢表9–作為癌癥階段的函數(shù)的預(yù)測模型的靈敏度訓(xùn)練和驗證集合中性能的比較在訓(xùn)練和驗證集合中比較預(yù)測模型的總體預(yù)測準(zhǔn)確度,以評估模型在獨立分支中的再現(xiàn)性。結(jié)果提供于表10中。表10-訓(xùn)練和驗證集合中兩種模型的靈敏度,特異性和AUC的比較對于任一模型在訓(xùn)練和驗證集合之間沒有觀察到靈敏度或特異性的顯著差異(p>0.05)。同樣,對于每種模型,兩個分支之間的AUC的小差異不是統(tǒng)計學(xué)上顯著的(基于p>0.05)。與所有樣品(組合的支氣管陰性和支氣管陽性)相比,支氣管陰性樣品的靈敏度和特異性也是類似的。得分1和得分2之間的總體性能有相對較小的下降,得分2顯示AUC與得分1相比降低2-4%點。表11:232種差異表達(dá)的基因和簇成員性實施例2:用于經(jīng)歷診斷性支氣管鏡檢的肺癌患者的支氣管基因組分類器的驗證導(dǎo)言支氣管鏡檢在具有疑似肺癌的肺部損害的患者中常常是非診斷性。這常常導(dǎo)致另外的侵入性測試,盡管許多損害是良性的。我們尋求驗證能改善支氣管鏡檢的診斷性性能的支氣管基因表達(dá)分類器。在胸部成像中常常鑒定出疑似肺癌的損害。是否進(jìn)行監(jiān)視成像或需要組織采樣的侵入性評估的決定是復(fù)雜的,而且需要評估惡性的可能性,活檢的能力,手術(shù)風(fēng)險,和患者偏好[1]。當(dāng)需要活檢時,該辦法可以包括支氣管鏡檢,經(jīng)胸腔針活檢(TTNB),或外科肺活檢(SLB)。這些模態(tài)之間的選擇通常由諸如損害大小和位置,腺病變的存在,規(guī)程的風(fēng)險和當(dāng)?shù)貙iL的考慮來決定。支氣管鏡檢是一種安全的規(guī)程,氣胸并發(fā)少于1%[2]。在美國每年實施大約500,000例支氣管鏡檢[3],其中大約一半用于肺癌的診斷性檢查。然而,支氣管鏡檢受到其靈敏度的限制,范圍在34-88%之間,取決于損害的位置和大小[4]。即使使用較新的支氣管鏡引導(dǎo)技術(shù),針對周圍損害的靈敏度只有約70%[5]。具有非診斷性支氣管鏡檢的患者常常經(jīng)歷進(jìn)一步的侵入性測試以建立確定性診斷。鑒于固有風(fēng)險,并發(fā)率為大約5%,30天死亡率為約1%,SLB不是首選的辦法[6]。重要的是,在最終診斷為良性損害的患者中實施20-25%的SLB[7,8]。而且,TTNB與顯著的發(fā)病有關(guān),包括15%氣胸率[9],其中6%需要胸管引流[10,11]。鑒于侵入性規(guī)程的缺陷,需要備選辦法來鑒定適合于成像監(jiān)視的惡性可能性較低的患者。使用臨床標(biāo)本的基因表達(dá)測量對生物學(xué)疾病狀態(tài)(包括癌癥)進(jìn)行分類是良好建立的[12]。在肺癌的設(shè)置中,在自吸煙者的近端氣道收集的細(xì)胞學(xué)正常上皮中存在獨特的癌癥相關(guān)基因表達(dá)樣式[13]。最近,我們開發(fā)了經(jīng)由支氣管鏡檢自主干支氣管收集的支氣管上皮細(xì)胞(BEC)中在當(dāng)前的和以前的吸煙者區(qū)分有和沒有肺癌的患者的基因表達(dá)分類器(提交的手稿)。我們進(jìn)行了本研究以在為疑似肺癌經(jīng)歷支氣管鏡檢的患者的兩項前瞻性多中心試驗中驗證這種分類器及評估這種分類器如何改變支氣管鏡檢的診斷性能。材料和方法研究設(shè)計,群體,和方案為疑似肺癌經(jīng)歷支氣管鏡檢的當(dāng)前的和以前的吸煙者登記AEGIS1和AEGIS2,兩項獨立的,前瞻性的,多中心的觀察性研究(NCT01309087和NCT00746759)?;颊咴诿绹幽么?,和愛爾蘭的28個地點登記。使用細(xì)胞刷自主干支氣管收集看來正常的BEC并浸沒在RNA防腐劑中。分類器的結(jié)果沒有報告給醫(yī)生或患者。在支氣管鏡檢之前篩選患者以確定他們是否滿足研究方案的要求。排除標(biāo)準(zhǔn)包括<21歲的受試者,從不吸煙者(定義為生命中吸煙<100支香煙),及具有并發(fā)的癌癥或肺癌的歷史的患者。排除了臨支氣管鏡檢前在呼吸機(jī)上>24小時,或不能同意或服從研究的患者。跟蹤患者直至確立最終的診斷或直至支氣管鏡檢后12個月。在指引支氣管鏡檢時或通過隨后使用TTNB,SLB,第二支氣管鏡檢,或其它侵入性規(guī)程的活檢建立肺癌的診斷。使用的具體支氣管鏡檢方法和非診斷性支氣管鏡檢后實施的后續(xù)監(jiān)視成像或規(guī)程憑主治醫(yī)師斟酌。診斷為無癌癥的患者在12個月的隨訪中具有特定的良性診斷或放射照相術(shù)穩(wěn)定性/分辨率。沒有確定性癌癥診斷,12個月隨訪中的特定良性診斷或穩(wěn)定性/分辨率的患者排除在進(jìn)一步分析之外。主治醫(yī)師使用五級量表(<10%,10-39%,40-60%,61-85%,和>85%)在支氣管鏡檢前評估每名患者的測試前惡性概率(POM)。該研究方案得到每個參與中心的機(jī)構(gòu)審查委員會批準(zhǔn),而且所有患者在登記前提供知情同意書。在美國,加拿大,和愛爾蘭的28個醫(yī)學(xué)中心,AEGIS1中的總共855名患者和AEGIS2中的總共502名患者合格并在2009年1月至2012年8月之間登記(圖4)(表12)。這些地點是三級/學(xué)術(shù)醫(yī)學(xué)中心(n=20),社區(qū)醫(yī)院(n=6),和退伍軍人管理局的醫(yī)院(n=2)的混合。在登記后,基于以下標(biāo)準(zhǔn)將另外的患者從研究中排除(見圖4)。首先,AEGIS1中的總共111名患者和AEGIS2中的總共71名患者由于以下方案偏差而不合格:在AEGIS1中,24名患者或是在審查時不滿足研究登記標(biāo)準(zhǔn),收集的標(biāo)本不滿足進(jìn)入的接受標(biāo)準(zhǔn),或是登記了但沒有收集標(biāo)本。在RNA分離后,另外87份樣品不符合最低QC標(biāo)準(zhǔn),或是由于RIN得分<4或是RNA產(chǎn)量<1μg。在AEGIS2中,由于收集的標(biāo)本不符合進(jìn)入的接受標(biāo)準(zhǔn),有3名不合格患者,及不符合RNA最低QC標(biāo)準(zhǔn)的68份樣品。第二,排除診斷為非原發(fā)性肺癌的患者,包括AEGIS1中的40名患者和AEGIS2中的10名患者。此外,在12個月時審查時,沒有最終診斷的患者也被排除在研究之外,包括AEGIS1中的91名受試者和AEGIS2中的71名患者。來自AEGIS1和2的這162名患者中的大約三分之二(n=106)在其初始支氣管鏡檢后失去隨訪,而剩余的三分之一(n=56)在支氣管鏡檢后12個月時沒有確定性診斷。最后,我們排除了AEGIS1中的16名患者和AEGIS2中的9名患者,其中基因表達(dá)數(shù)據(jù)未能通過測定法QC標(biāo)準(zhǔn)(在下面微陣列處理方法下描述)。AEGIS1分支先前已經(jīng)以隨機(jī)化方式分成相等的訓(xùn)練和測試集合。使用訓(xùn)練集合(n=299名患者)來派生由23種基因加年齡構(gòu)成的基因表達(dá)分類器,而且在別處已經(jīng)描述(提交的手稿)。在訓(xùn)練集合中,發(fā)現(xiàn)分類器在支氣管鏡檢未導(dǎo)致肺癌診斷(n=134)的患者中具有0.78(95%CI,0.71-0.85)的AUC,靈敏度為93%,特異性為57%。當(dāng)前的研究聚焦于鎖定的分類器在兩個獨立驗證集合中的驗證。在表1中比較了最終的AEGIS1和AEGIS2驗證集合的基線人口統(tǒng)計學(xué)和臨床特征。在表12中提供了每個分支內(nèi)診斷為具有癌癥和良性疾病的患者的單獨比較。表12–AEGIS1和AEGIS2測試集合中的患者的特征。a)以中值(和四分位間范圍;IQR)報告。使用Mann-Whitney檢驗計算P值。b)為白種人對非白種人計算P值。收集每名患者的臨床和人口統(tǒng)計學(xué)數(shù)據(jù)并記錄在研究臨床報告表(CRF)上。在每名患者的醫(yī)學(xué)記錄中保存了另外的病理學(xué)和放射學(xué)報告,并且可用于審查。所有源文件都被監(jiān)測并輸入由研究發(fā)起人維護(hù)的數(shù)據(jù)庫。肺部損害的大小和位置自CT掃描報告獲得。對受試者隨訪至支氣管鏡檢后12個月以收集用于臨床診斷的數(shù)據(jù)。肺癌的診斷基于來自病理學(xué)的結(jié)果,并且自醫(yī)學(xué)中心收集病理學(xué)報告的拷貝。導(dǎo)致癌癥的臨床診斷的標(biāo)本或是在支氣管鏡檢期間獲得,或是當(dāng)支氣管鏡檢是非診斷性時自隨后的侵入性獲得。在研究期間收集在非診斷性支氣管鏡檢后實施的所有臨床規(guī)程的數(shù)據(jù)。隨后用非診斷性支氣管鏡檢對患者的評估憑每個研究中心的主治醫(yī)師斟酌。在一些情況中,支氣管鏡檢后需要多于一個規(guī)程來成功地做出診斷,但是在所有情況中,收集導(dǎo)致肺癌診斷的規(guī)程。侵入性隨訪規(guī)程定義為第二支氣管鏡檢,TTNB,或手術(shù)肺活檢(SLB),其可包括縱隔鏡檢查,胸腔鏡檢查,開胸手術(shù),或視頻輔助胸腔鏡手術(shù)(VATS)。未診斷有癌癥的患者的記錄經(jīng)歷了判定過程,以宣布受試者是無癌癥的。該過程由五名肺病學(xué)家的小組審查每名患者的可得醫(yī)學(xué)記錄組成。來自此小組的兩名肺病學(xué)家獨立審查了每個病例,如果他/她符合以下標(biāo)準(zhǔn)之一,那么確定患者無癌癥:患者診斷為解釋了最初的可疑異常的其它診斷,異常確定是穩(wěn)定的,或異常解決了。在12個月隨訪期結(jié)束時不滿足這些標(biāo)準(zhǔn)的患者沒有最終的診斷,并且排除在研究的進(jìn)一步分析之外。對診斷有原發(fā)性肺癌的患者分析組織學(xué)(表13)和癌癥分期(表14)數(shù)據(jù)。從研究CRF中提取數(shù)據(jù),并通過審查完整醫(yī)學(xué)記錄來確認(rèn)。在全部癌癥中,AEGIS1中的80%(175/220;95%CI,74-84%)和AEGIS2中的83%(222/267;95%CI,78-87%)是NSCLC。分別有17%(38/220;95%CI,13-23%)和16%(42/26795%CI,12-21%)SCLC癌癥。在具有已知癌癥分期數(shù)據(jù)的NSCLC患者中,AEGIS1中的40%(53/139;95%CI,32-48%)和AEGIS2中的37%(67/199;95%CI,30-44%)存在早期階段(I和2期)。表13–研究參與者的人口統(tǒng)計學(xué)和臨床特征的匯總:在所有臨床特征間實施AEGIS1對AEGIS2患者的比較。顯著性差異由*p<.05,**p<.001指示。計算白種人對非白種人的人種p值,以及使用NSCLC對SCLC的肺癌組織學(xué)p值。表14–診斷有原發(fā)性肺癌的患者的分期數(shù)據(jù)。自醫(yī)學(xué)記錄提取關(guān)于每例良性診斷的數(shù)據(jù),并匯總在表15中。在兩項研究中,大約三分之二的無癌癥受試者具有其它診斷,每項研究的具體其它診斷在表S4中列舉。具有異常的患者確定為已經(jīng)解決或是穩(wěn)定的診斷基于對醫(yī)學(xué)記錄的審查,包括支氣管鏡檢后12個月時的隨訪成像,而且大約三分之一的無癌患者在兩項研究中均在這個范疇中。表15–具有良性疾病的患者的其它診斷在臨床指示的支氣管鏡檢期間,研究參與者使用與支氣管壁摩擦的標(biāo)準(zhǔn)一次性細(xì)胞刷經(jīng)歷右或左主干支氣管的粘膜刷樣的收集。自每名受試者獲得兩份刷樣;訓(xùn)練醫(yī)生獲得看來正常的上皮組織的刷樣,并避免對腫瘤組織或發(fā)育不良的細(xì)胞采樣。所有樣品儲存在RNA防腐劑(RNAprotect;Qiagen)中,并運(yùn)送至中心CLIA認(rèn)證實驗室用于進(jìn)入和加工。中心被要求于4℃存儲樣品長達(dá)14天,并且于環(huán)境溫度以下(4-20℃)使用由發(fā)起人提供的2天運(yùn)輸和隔熱運(yùn)輸容器(NanoCool)運(yùn)輸。實驗室方法在基因表達(dá)分析之前處理所有BEC標(biāo)本以分離和分析RNA的質(zhì)量和產(chǎn)量;只有RNA產(chǎn)量為至少1μg且RIN得分>4的標(biāo)本在Gene-ST1.0微陣列上運(yùn)行。所有微陣列數(shù)據(jù)已經(jīng)作為GSE66499保存于GEO。裂解樣品,并使用基于柱的方法(miRNeasy試劑盒;Qiagen)和制造商推薦的方案分離RNA。在分光光度計(Nanodrop;ThermoFisher)上分析大RNA級分以測定濃度,純度,和產(chǎn)量。還分析樣品的RNA完整性(Bioanalyzer),作為RIN得分報告。自研究中排除產(chǎn)量<1μg且RIN評分<4的樣品。由于RNA質(zhì)量或數(shù)量不足,排除了AEGIS1中大約10%的標(biāo)本和AEGIS2中大約13%的標(biāo)本。然后冷凍(-80℃)保存RNA,直至進(jìn)一步處理。使用AmbionWT表達(dá)試劑盒(Lifetechnologies產(chǎn)品目錄號4440536)將200ng總RNA轉(zhuǎn)變成有義鏈cDNA,隨后用Affymetrix基因芯片WT末端標(biāo)記試劑盒(Affymetrix產(chǎn)品目錄號900671)標(biāo)記。對于雜交,使用雜交,清洗和染色試劑盒(Affymetrix產(chǎn)品目錄號900720)制備雜交混合物并添加至經(jīng)過標(biāo)記的cDNA靶,應(yīng)用于人基因1.0ST陣列(Affymetrix產(chǎn)品目錄號901087),并于45℃溫育16小時。雜交后,清洗陣列,并使用標(biāo)準(zhǔn)Affymetrix規(guī)程染色,之后在Affymetrix基因芯片掃描儀上掃描它們。使用ExpressionConsole軟件(Affymetrix)提取數(shù)據(jù)。Affymetrix人基因1.0ST陣列(Affymetrix產(chǎn)品目錄號901087)利用在www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1處公開的眾多探針。存在與特定基因的區(qū)段對應(yīng)的多種探針,也就是說,不是每種基因一種探針的1:1比率,而是存在與一種基因的多個區(qū)段對應(yīng)的多種探針。在一個例子中,LYPD2基因由人基因1.0ST陣列(版本32)中的三個探針集合代表,探針集ID8153343,8153344,和8153345,如在Affymetrix人基因1.0ST陣列(HuGene-1_0-st-v1探針集注釋,2011年9月30日版本32,2013年3月27日版本33,和2014年4月7日版本34)中公開的。關(guān)聯(lián)探針集和核酸序列的信息可以在Affymetrix.com處找到,包括在www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1處。而且,數(shù)據(jù)集可在NCBIGeneExpressionOmnibus網(wǎng)站在PlatformGPL6244下獲得,其詳述www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244處可在實施本公開文本的方法中利用的探針和基因。這些文件(包括那些關(guān)聯(lián)探針集和基因符號的)通過援引收入本文。使用RMA[22]標(biāo)準(zhǔn)化與每個分支的最終的數(shù)據(jù)集中的樣品對應(yīng)的微陣列數(shù)據(jù)(CEL文件)。AEGIS1樣品以總共5個批次運(yùn)行,并且使用ComBat[23]來校正批次效應(yīng)。AEGIS2樣品全部在一個微陣列批次中運(yùn)行。在標(biāo)準(zhǔn)化后,作為在全局基因表達(dá)中具有小于0.955的全基因組成對相關(guān)性鑒定異常值。所有微陣列數(shù)據(jù)已經(jīng)以編號GSE66499保存于GEO。微陣列數(shù)據(jù)的標(biāo)準(zhǔn)化和預(yù)處理在補(bǔ)充附錄中描述。登記在AEGIS1中的受試者先前已經(jīng)隨機(jī)指派至獨立的訓(xùn)練和驗證集合(圖4),并且如前所述,嚴(yán)格地在AEGIS1訓(xùn)練集內(nèi)派生分類器算法并鎖定。使用基于23種基因的表達(dá)和患者年齡的此預(yù)先規(guī)定的分類器產(chǎn)生AEGIS1驗證集中的每份樣品和所有AEGIS2樣品的得分。使用預(yù)先規(guī)定的閾值將這些得分二分為測試陽性和測試陰性。使用接受者操作特征(ROC)曲線,曲線下面積(AUC)的計算[14],及靈敏度,特異性,陰性預(yù)測值(NPV),陽性預(yù)測值(PPV)和定義為(1-靈敏度)/特異性的負(fù)似然比(NLR)的估值來評估分類器的性能。將Mann-Whitney非參數(shù)檢驗用于連續(xù)變量的分析,并將Fisher氏精確檢驗用于分類變量。以雙側(cè)二項式95%置信區(qū)間(95%CI)報告所有置信區(qū)間。使用R軟件(版本3.01)實現(xiàn)統(tǒng)計分析。要求醫(yī)生基于專家意見和支氣管鏡檢前可得的醫(yī)學(xué)記錄,使用以下范疇之一評估所有登記的受試者的測試前POM:<10%,10-39%,40-60%,61-85%,和>85%。結(jié)果分入<10%,10-60%,和>60%的范疇。然后,我們計算癌癥在每個POM范疇中的實際流行度,以比較癌癥在分層POM水平中的實際流行度(表16)。另外,我們發(fā)現(xiàn)非診斷性支氣管鏡檢后的肺癌流行度在<10%,10-60%和>60%POM組中分別為3%,29%和80%。表16–內(nèi)科醫(yī)師評估的POM和癌癥流行度的相關(guān)性。a)POM=惡性的概率;在支氣管鏡檢之前由主治內(nèi)科醫(yī)師評估。b)作為每個POM范疇內(nèi)診斷有肺癌的分?jǐn)?shù)計算流行度。通過損害大小分層的支氣管基因組分類器的預(yù)測準(zhǔn)確度匯總于表2中,而且通過測試前POM的匯總于表3中。對于診斷有通過階段和組織學(xué)分層的肺癌的患者,還在表S5和S6中報告分類器的靈敏度。分類器與支氣管鏡檢組合導(dǎo)致所有范疇的靈敏度>90%。表17–根據(jù)放射學(xué)成像特征,分類器,支氣管鏡檢,和組合辦法的靈敏度。對于每個范疇中的肺癌患者確定支氣管鏡檢的靈敏度。對于在支氣管鏡檢期間沒有診斷出的具有肺癌的患者確定分類器的靈敏度。對于每個范疇中的所有肺癌患者,計算分類器與支氣管鏡檢組合的靈敏度。結(jié)果研究參與者的特征來自AEGIS1的298名患者充當(dāng)?shù)谝或炞C集合,來自AEGIS2的滿足研究標(biāo)準(zhǔn)的所有341名患者用作第二驗證集合(圖4和表13)。AEGIS1和AEGIS2分支的肺癌流行度分別為74%和78%。具有肺癌的患者年齡較大(p<0.001),與沒有癌癥的患者相比具有更高的累積煙草暴露(p<0.001),而且更有可能是當(dāng)前的吸煙者(AEGIS1中p=0.07,AEGIS2中p=0.03;表12)。癌癥階段和良性診斷的范疇的匯總分別顯示于表15和16中。支氣管鏡檢的性能總共639名患者為疑似肺癌經(jīng)歷支氣管鏡檢。其中,272例(43%;95%CI,39至46)是非診斷性的,包括最終診斷為肺癌的487名患者中的120例(25%;95%CI,21至29)。支氣管鏡檢對肺癌的靈敏度分別為AEGIS1和AEGIS2中的74%(95%CI,68至79)和76%(95%CI,71至81)。具有非診斷性支氣管鏡檢的患者中98%(267/272)的隨訪規(guī)程數(shù)據(jù)可得。在267名患者中的170例(64%,95%CI,58至69)中在非診斷性支氣管鏡檢后實施了侵入性規(guī)程,包括具有良性損害的147例中的52例(35%;95%CI,24至38)和具有癌癥的120例中的118例(98%;95%CI,94至99)。在76名患者中實施了SLB,其中27例(36%;95%CI,26至47)具有良性損害?;虮磉_(dá)分類器的性能在AEGIS1中,該分類器單獨具有AUC=0.78(95%CI,0.73至0.83)且準(zhǔn)確鑒定了220名具有癌癥的患者中的194例(88%靈敏度;95%CI,83至92)和78名無癌癥的患者中的37例(47%特異性;95%CI,37至58)(圖5)。在AEGIS2中,該分類器具有AUC=0.74(95%CI,0.68至0.80)且正確鑒定了267名具有癌癥的患者中的237例(89%靈敏度;95%CI,84至92)和74名無癌癥的患者中的35例(47%特異性;95%,36至59)。該分類器與支氣管鏡檢的組合分別將AEGIS1和2中的靈敏度提高至96%(95%CI,93至98)和98%(95%CI,96至99),相比之下單獨的支氣管鏡檢分別為74%和76%(p<0.001)。在具有非診斷性支氣管鏡檢的患者中,該分類器準(zhǔn)確地鑒定了AEGIS1中的57位患者中的49例(86%靈敏度;95%CI,74至94)中和AEGIS2中的67位患者中的62例(92%靈敏度;95%CI,82至97)中的癌癥。由于在所有患者間(p=0.32)或?qū)τ诰哂蟹窃\斷性支氣管鏡檢的患者(p=0.61)兩個分支中的患者之間就分類器AUC而言沒有顯著差異(圖5),我們組合兩個分支用于后續(xù)亞組分析。單獨的支氣管鏡檢的靈敏度在<3cm(p<0.001)或位于周圍(p<0.001)的損害中較低(表17)。相比之下,單獨的分類器和與支氣管鏡檢組合的分類器的靈敏度一致地較高,而且與損害的大小或位置(表17),癌癥階段(表18)或組織學(xué)亞型(表19)沒有顯著關(guān)聯(lián)。表18–根據(jù)癌癥階段,分類器和支氣管鏡檢的靈敏度。表19–根據(jù)組織學(xué),分類器和支氣管鏡檢的靈敏度。分類器在具有中等癌癥概率的患者中的準(zhǔn)確度我們將內(nèi)科醫(yī)師評估的惡性概率(POM)組合入低(<10%),中等(10-60%),和高(>60%)POM(表3)的范疇中,以與用于評估肺癌風(fēng)險的指導(dǎo)方針建議比對[1]。支氣管鏡檢在83%的具有中等測試前POM(n=101)的患者中對于癌癥是非診斷性的,盡管具有41%的癌癥流行率。在這組患者中,該分類器在那些具有非診斷性支氣管鏡檢中實現(xiàn)91%(95%CI,75至98)的NPV和40%(95%CI,28至54)的PPV(表20)。表20–支氣管鏡檢和分類器分層的測試前POM的性能。(a)在所顯示的POM范疇間有總共639名患者。(b)支氣管鏡檢對于639名患者中的272例(43%;95%CI,39至46)是非診斷性的,包括診斷有肺癌的487名患者中的120例(25%;95%CI,21至29)。(c)該分類器準(zhǔn)確地預(yù)測了具有癌癥的120名總體全部患者中的107例(89%;95%CI,82至94)。對于具有非診斷性支氣管鏡檢規(guī)程的患者,報告了每個POM范疇中的靈敏度。(d)該分類器準(zhǔn)確地預(yù)測了沒有癌癥的152名總體患者中的72例(47%;95%CI,40至55)。對于具有非診斷性支氣管鏡檢規(guī)程的患者,報告了每個POM范疇中的特異性。對于具有非診斷性支氣管鏡檢規(guī)程的患者,報告了(e)NPV和(f)PPV。雖然該分類器在具有非診斷性支氣管鏡檢的患者中具有高NPV,但是存在13名具有肺癌和負(fù)分類器得分的具有非診斷性支氣管鏡檢的患者(即假陰性)。大多數(shù)(13例中的10例)具有高(>60%)POM,只有3名患者在10-60%測試前POM組中。計算分類器與支氣管鏡檢組合的NLR以確定測試前POM中測試后概率會是<10%的范圍。當(dāng)與分類器組合時,支氣管鏡檢的NLR(0.244;95%CI,0.21至0.29)改善至0.056(95%CI,0.03至0.10)。結(jié)果是,當(dāng)支氣管鏡檢和分類器二者均為陰性時,對于具有高達(dá)66%的測試前POM的患者,測試后POM降低至<10%(圖6)。結(jié)果的評估此研究描述一種在經(jīng)歷支氣管鏡檢的患者中鑒定沒有肺癌的那些的支氣管基因組分類器在兩個獨立的前瞻性分支中的驗證。我們發(fā)現(xiàn)該基因表達(dá)分類器在組合分支中在不同大小,位置,階段,和細(xì)胞類型的肺癌間具有高靈敏度。該分類器和支氣管鏡檢的組合在AEGIS-1和AEGIS-2驗證分支中分別具有96%和98%的靈敏度。我們還報告了數(shù)項另外的發(fā)現(xiàn),支持這種類型的分類器的臨床需要。首先,我們的研究確認(rèn)了先前報告的觀察結(jié)果,即常常在最終發(fā)現(xiàn)沒有肺癌的患者中,非診斷性支氣管鏡檢是常見的(特別是在中等測試前POM的患者中)且導(dǎo)致進(jìn)一步的侵入性測試,包括SLB。第二,與該分類器的高靈敏度相比,我們發(fā)現(xiàn)支氣管鏡檢在小的,周圍的或早期階段的癌癥中表現(xiàn)較差。第三,該分類器在具有中等POM和非診斷性支氣管鏡檢的患者中具有高NPV。這些發(fā)現(xiàn)提示,這種分類器有潛力在具有中等POM的患者(其中肺癌的流行度為41%但支氣管鏡檢的靈敏度僅為41%)中幫助做出臨床決策。由于高NPV,在具有非診斷性支氣管鏡檢和中等POM的患者中的負(fù)分類器得分批準(zhǔn)更加保守的診斷策略,經(jīng)由成像的主動監(jiān)視。雖然該分類器的高NPV會有助于在具有分類器負(fù)的中等POM的患者中避免不必要的侵入性規(guī)程,但是在這組中存在少數(shù)具有肺癌的患者;負(fù)的基因表達(dá)分類器結(jié)果可能延遲這些患者中的進(jìn)一步侵入性測試。然而,這組患者會經(jīng)歷經(jīng)由成像進(jìn)行的主動監(jiān)測,這是當(dāng)不采用立即侵入性策略時的標(biāo)準(zhǔn)實踐[1,15]。這會容許鑒定損害生長,觸發(fā)另外的侵入性測試以建立確定性診斷。與在具有中等POM的患者中觀察到的高NPV相反,該分類器在此設(shè)置中具有40%的適度PPV。如此,該分類器的正結(jié)果不保證診斷策略的改變;進(jìn)一步的測試會需要基于用于在侵入性與成像監(jiān)視策略之間選擇的傳統(tǒng)因素。此基因表達(dá)分類器在近端BEC中,而不是自肺損害內(nèi)的細(xì)胞測量。細(xì)胞學(xué)正常的近端氣道中基因表達(dá)改變檢測肺實質(zhì)內(nèi)肺癌的存在的能力直接源自“損傷場”范例[13]。Spira等人先前已經(jīng)顯示,在具有肺癌的當(dāng)前的和以前的吸煙者中,細(xì)胞學(xué)正常的支氣管上皮細(xì)胞中有基因表達(dá)改變的獨特樣式[13,16]。此外,致癌信號傳導(dǎo)途徑在具有肺癌的吸煙者和具有惡變前氣道損害的吸煙者的近端氣道上皮中被激活[17]。最近,Kadara等人[18]證明,在非小細(xì)胞肺癌本身和鄰近的小氣道上皮中表達(dá)改變的基因在那些在近端氣道上皮中改變的基因中富集,提示近端氣道內(nèi)的基因表達(dá)變化部分地反映在肺腫瘤中觀察到的改變的轉(zhuǎn)錄組。僅當(dāng)支氣管鏡檢產(chǎn)生肺癌診斷時,認(rèn)為該規(guī)程是“診斷性的”。有相對較少數(shù)目的支氣管鏡檢,潛在診斷為特定的良性病因,但大多數(shù)這些患者接受進(jìn)一步的侵入性測試,包括最終診斷有肺癌的患者,提示盡管最初支氣管鏡檢發(fā)現(xiàn)是良性的但對肺癌的擔(dān)憂仍然升高。最后,我們沒有評估并入與臨床變量組合的分類器的模型的準(zhǔn)確性。雖然已經(jīng)為孤立性肺結(jié)節(jié)開發(fā)了臨床風(fēng)險預(yù)測模型[1,20,21],但是對于選擇經(jīng)歷診斷性支氣管鏡檢的患者(其包括具有較寬范圍的發(fā)現(xiàn)的患者,包括較大的損害(即>3cm),浸潤物或其它特征諸如淋巴結(jié)病)沒有經(jīng)過驗證的模型。如此,基于內(nèi)科醫(yī)生對肺癌概率的定性評估,選擇大多數(shù)患者進(jìn)行支氣管鏡檢。重要的是,我們證明我們的分類器在具有通過醫(yī)生評估(一種并入可用臨床風(fēng)險因素的過程)確定的中等POM的患者中實施良好。這項工作的潛在影響得到其研究設(shè)計中的許多關(guān)鍵實力所支持。首先,這些是兩項獨立的前瞻性驗證研究,其中在臨床上會使用該測試的設(shè)置中(即在診斷之前)測量分類器。這是將分子生物標(biāo)志物自發(fā)現(xiàn)研究轉(zhuǎn)移至其最終臨床應(yīng)用的一個關(guān)鍵步驟。第二,大型多中心設(shè)計使得能夠包括來自不同的實踐設(shè)置和地理位置的經(jīng)歷支氣管鏡檢的患者。第三,我們的數(shù)據(jù)證明肺癌在具有非診斷性支氣管鏡檢和中等測試前POM的患者中的高流行度,并且顯示該分類器在存在關(guān)于癌癥狀態(tài)的最大不確定性的這種設(shè)置中具有91%的NPV。在這種設(shè)置中,使用對肺癌具有高靈敏度的分類器的機(jī)會容許對沒有肺癌的患者進(jìn)行可信的鑒定,其后可以進(jìn)行主動監(jiān)視,由此避免潛在有害的侵入性跟蹤測試。實施例3:經(jīng)歷診斷性支氣管鏡檢的患者中用于肺癌患者的支氣管基因組分類器的派生導(dǎo)言肺癌仍然是美國癌癥死亡的首要原因,估計2014年有224,000例新診斷和160,000例死亡,其中90%是由于吸煙[24]。最近,國家肺癌篩查試驗顯示,低劑量計算機(jī)斷層掃描(CT)篩查導(dǎo)致高風(fēng)險個體中20%的相對死亡率降低[25]。然而,死亡率降低伴隨著高比例(約96%)的假陽性CT結(jié)果,這繼而引起了對侵入性診斷規(guī)程的過度利用的擔(dān)憂[26]。具有疑似肺癌的患者常常被提及支氣管鏡檢,其中主要目的是采集可疑肺部損害的樣品用于病理學(xué)分析。據(jù)估計,美國每年實施500,000例支氣管鏡檢[27],其中大約一半用于診斷肺癌。支氣管鏡檢被認(rèn)為比其它侵入性采樣方法更加安全,諸如經(jīng)胸針活檢(TTNB)或手術(shù)技術(shù)。然而,支氣管鏡檢的診斷靈敏度是亞最佳的,范圍從34%(對于<2cm的周圍結(jié)節(jié))至88%(對于較大的,位于中央的損害)[28]。采用引導(dǎo)技術(shù)已經(jīng)將支氣管鏡檢的適用性擴(kuò)展到更具挑戰(zhàn)性的可疑損害(即常常在肺中周圍的孤立性肺結(jié)節(jié)),但是支氣管鏡檢對肺癌的整體臨床敏感度沒有實質(zhì)性改善[29,30]。當(dāng)支氣管鏡檢是非診斷性的時,常常給內(nèi)科醫(yī)師留下模糊性,是否進(jìn)行進(jìn)一步的侵入性診斷規(guī)程,相關(guān)的并發(fā)癥[31,32],或選擇成像監(jiān)視。在當(dāng)前的實踐中,當(dāng)實施這些侵入性規(guī)程時,大約三分之一的患者被確定為具有良性疾病[33],提示這些規(guī)程是可避免的。通過實質(zhì)性改善支氣管鏡檢的診斷產(chǎn)率來減少這種模糊性的方法能改善患者護(hù)理。先前已經(jīng)證明,香煙煙霧在整個呼吸道襯里的氣道上皮細(xì)胞中產(chǎn)生損害的分子場[34]。已經(jīng)表征了香煙煙霧對支氣管氣道轉(zhuǎn)錄組的可逆和不可逆影響,并且已經(jīng)在具有肺癌的當(dāng)前的和以前的吸煙者中鑒定了支氣管上皮中的一組基因表達(dá)改變[35]。這些癌癥相關(guān)的基因表達(dá)概況先前已經(jīng)顯示產(chǎn)生用于在支氣管鏡檢是非診斷性的時候檢測肺癌的靈敏分類器。在測試結(jié)果為陰性時,這種分類器的高靈敏度(在支氣管鏡檢期間容易獲得的生物學(xué)標(biāo)本中測量)導(dǎo)致很低的肺癌概率,并且提示可以使得內(nèi)科醫(yī)師能夠自信地在無肺癌的受試者中進(jìn)行主動監(jiān)視及減少危險的侵入性規(guī)程。材料和方法訓(xùn)練集合患者群體患者登記在AEGIS試驗(肺癌的診斷中的氣道上皮基因表達(dá))中,其設(shè)計為作為其診斷工作的一部分經(jīng)歷支氣管鏡檢的懷疑具有肺癌的當(dāng)前的和以前的吸煙者的前瞻性,觀察性,分支研究(登記為NCT01309087和NCT00746759)。選擇來自分支之一(“AEGIS1”)的一組患者用于訓(xùn)練基因表達(dá)分類器的唯一目的。該研究得到每個參與的醫(yī)學(xué)中心處的IRB批準(zhǔn),并且所有患者在登記前簽署知情同意書。在支氣管鏡檢后跟蹤所有登記的患者,直到做出最終的診斷或12個月?;谠谥夤茜R檢時或隨后的肺活檢(諸如當(dāng)支氣管鏡檢沒有導(dǎo)致肺癌診斷時,TTNB或手術(shù)肺活檢(SLB))獲得的細(xì)胞病理學(xué)診斷患者為具有原發(fā)性肺癌?;趯︶t(yī)學(xué)記錄的審查和在支氣管鏡檢后12個月時的隨訪規(guī)程(在附加文件1中更加詳細(xì)地描述),診斷患者為具有良性疾病。當(dāng)在支氣管鏡檢規(guī)程時收集的臨床樣品經(jīng)由細(xì)胞學(xué)或病理學(xué)產(chǎn)生經(jīng)過確認(rèn)的肺癌診斷時,認(rèn)為支氣管鏡檢是“診斷性的”。在NIH注冊的AEGIS研究(NCT01309087和NCT00746759)中登記的患者是為懷疑肺癌經(jīng)歷臨床上指示的支氣管鏡檢的患者,年齡為至少21歲且在其一生中吸煙至少100支香煙。研究排除包括先前已經(jīng)診斷有原發(fā)性肺癌的,臨支氣管鏡檢之前已經(jīng)連續(xù)使用呼吸機(jī)≥24小時的,或不能同意或遵守該研究的患者。在訓(xùn)練分類器之前排除另外的患者以排除具有除原發(fā)性肺癌以外的惡性腫瘤的患者。這包括排除具有任何惡性腫瘤歷史,經(jīng)過確認(rèn)的對肺的轉(zhuǎn)移性癌癥,或在登記后發(fā)現(xiàn)具有活動性非肺原發(fā)性癌癥的患者。還有,排除沒有最終的確定性診斷的患者。最后,在標(biāo)本處理后,那些RNA產(chǎn)量(<1μg)或質(zhì)量(RIN<4)不足的排除在進(jìn)一步分析之外。在支氣管鏡檢后跟蹤患者長達(dá)12個月,并審查記錄以確認(rèn)或確定最終的臨床診斷。癌癥的診斷基于在支氣管鏡檢期間或當(dāng)支氣管鏡檢是非診斷性時在隨訪規(guī)程中收集的細(xì)胞/組織的細(xì)胞病理學(xué)。導(dǎo)致診斷的隨訪規(guī)程由第二支氣管鏡檢,經(jīng)胸針穿刺(TTNA),手術(shù)肺活檢(SLB),或規(guī)程組合組成。未被診斷有癌癥且已經(jīng)跟蹤了12個月的患者的記錄由五名肺病學(xué)家的小組進(jìn)行了判決過程。該過程由對可得醫(yī)學(xué)記錄的審查組成,并且如果患者滿足以下標(biāo)準(zhǔn)之一,那么患者只宣布為無癌癥:診斷有解釋初始可疑異常的其它診斷,異常確定是穩(wěn)定的,或異常消除了。在12個月隨訪期完成時不滿足這些標(biāo)準(zhǔn)的患者標(biāo)記為“不確定”,并且由于缺乏診斷性“事實”而排除在訓(xùn)練之外。樣品收集指示25個參與醫(yī)學(xué)中心中每一個處的內(nèi)科醫(yī)師使用標(biāo)準(zhǔn)支氣管鏡檢細(xì)胞刷在支氣管鏡檢期間自右主干支氣管(或左側(cè),如果在右邊觀察到任何異常的話)收集看來正常的支氣管上皮細(xì)胞(BEC)。收集后,在收集后立即切割細(xì)胞刷并置于RNA防腐劑(QiagenRNAProtect,產(chǎn)品目錄76526)中,并保存于4℃。然后將標(biāo)本于4-20℃運(yùn)輸至中心實驗室進(jìn)行進(jìn)一步處理。向所有地點提供運(yùn)輸容器,使得能夠在48小時時段內(nèi)于4-20℃運(yùn)輸標(biāo)本。要求各地點使用2天船運(yùn)服務(wù)發(fā)送標(biāo)本。在中心實驗室接收后,檢查標(biāo)本并加入實驗室信息系統(tǒng)。在RNA分離之前將接收的標(biāo)本保存于4℃,RNA分離通常在接收后7天內(nèi)進(jìn)行。保留所有儲存和運(yùn)輸時間的記錄,并且標(biāo)本收集和RNA分離之間的累積時間小于30天(與制造商對RNA防腐劑的建議一致)。RNA分離使用渦旋混合器自細(xì)胞刷分離BEC,然后使其形成團(tuán)粒并使用QIAzol裂解試劑(Qiagen)處理。通過酚/氯仿提取來分離RNA,并依照制造商的建議在二氧化硅膜旋轉(zhuǎn)柱(QiagenmiRNeasy試劑盒,產(chǎn)品目錄號217004)上純化。在NanoDropND-1000分光光度計(ThermoScientific)上分析RNA以測定濃度和純度,并在2100Bioanalyzer(AgilentTechnologies)上測量RNA完整性(RIN)。然后將每份樣品保存于-80℃直至在微陣列上進(jìn)一步處理。cDNA制備將總RNA轉(zhuǎn)變成有義鏈cDNA,使用設(shè)計成與Affymetrix微陣列一起使用的AmbionWT表達(dá)試劑盒(LifeTechnologies,產(chǎn)品目錄號4440536)擴(kuò)增。以200ng總RNA開始,使用T7啟動子引物方案經(jīng)由逆轉(zhuǎn)錄制備單鏈cDNA。使用DNA聚合酶將單鏈cDNA轉(zhuǎn)變成雙鏈cDNA。微陣列加工用AffymetrixGeneChipWT末端標(biāo)記試劑盒(Affymetrix,產(chǎn)品目錄號900671)標(biāo)記自總RNA獲得的cDNA。將經(jīng)過標(biāo)記的cDNA與Gene1.0ST微陣列(Affymetrix,產(chǎn)品目錄號901085)雜交,并在AffymetrixGeneChip掃描儀上分析。使用標(biāo)準(zhǔn)AffymetrixGene1.0STCDF和RMA[38]對每份患者樣品的個體CEL文件進(jìn)行標(biāo)準(zhǔn)化。使用設(shè)計用于與Affymetrix微陣列一起使用的商業(yè)試劑盒(AmbionWT;LifeTechnologies,產(chǎn)品目錄號4440536)將總RNA轉(zhuǎn)變成有義鏈cDNA。以200ng總RNA開始,使用T7啟動子引物方案經(jīng)由逆轉(zhuǎn)錄制備單鏈cDNA。使用DNA聚合酶將單鏈cDNA轉(zhuǎn)變成雙鏈cDNA。雙鏈cDNA充當(dāng)模板用于cRNA的體外轉(zhuǎn)錄,然后將其純化以去除酶,鹽,無機(jī)磷酸鹽和未摻入的核苷酸。使用UV吸收測量cRNA的產(chǎn)量,然后用隨機(jī)引物和dUTP/dNTP混合物通過逆轉(zhuǎn)錄使用10μg經(jīng)過純化的cRNA產(chǎn)生經(jīng)過標(biāo)記的有義鏈cDNA,片段化,并使用GeneChipWT末端標(biāo)記試劑盒(Affymetrix,產(chǎn)品目錄號900671)標(biāo)記。使用雜交,清洗和染色試劑盒(Affymetrix,產(chǎn)品目錄號900720)將經(jīng)過標(biāo)記的cDNA與Gene1.0ST微陣列(Affymetrix,產(chǎn)品目錄號901085)雜交,并于45℃溫育16小時。雜交后,使用標(biāo)準(zhǔn)Affymetrix規(guī)程對陣列清洗和染色,之后在AffymetrixGeneChip掃描儀上掃描,并使用ExpressionConsole軟件(Affymetrix)提取數(shù)據(jù)。如此,本文中描述的微陣列不測量天然分子的表達(dá),而是該微陣列測量非天然發(fā)生的cDNA分子的表達(dá)。分類器開發(fā)在一個多步驟過程中派生了基因表達(dá)分類器。初始建模由使用訓(xùn)練數(shù)據(jù)來選擇與三個臨床協(xié)變量(性別,煙草使用,和吸煙史)相關(guān)聯(lián)的基因(“基因表達(dá)關(guān)聯(lián)”)以鑒定這些臨床變量的基因表達(dá)關(guān)聯(lián)組成。然后選擇肺癌相關(guān)基因,并最后確定基于癌基因,基因表達(dá)關(guān)聯(lián),和患者年齡的組合預(yù)測肺癌可能性的分類器。使用交叉驗證并僅使用來自訓(xùn)練集合樣品的數(shù)據(jù)來確定此分類器開發(fā)規(guī)程的所有方面。臨床因素基因表達(dá)關(guān)聯(lián)(CFGC)模擬此研究群體中肺癌的協(xié)變量,包括性別(男性/女性),吸煙狀態(tài)(當(dāng)前的/以前的),和包年(<10/>10),以鑒定臨床因素的基因表達(dá)關(guān)聯(lián)。使用經(jīng)驗貝葉斯t檢驗來鑒定其表達(dá)與每個臨床因素顯著相關(guān)的基因。接下來,以可用于預(yù)測每個臨床因素的價值的稀疏方式[36]選擇基因。最后,對于每名患者計算來自性別(GG),吸煙狀態(tài)(GS),和包-年(GPY)的基因表達(dá)關(guān)聯(lián)的預(yù)測值,并用于選擇具有肺癌相關(guān)基因表達(dá)的基因和下文描述的肺癌分類器。肺癌基因的選擇使用訓(xùn)練數(shù)據(jù),CFGC,和患者年齡作為預(yù)測因子,擬合以肺癌狀態(tài)(1=癌癥陽性且0=癌癥陰性)作為因變量的邏輯回歸模型。接下來,使用基因表達(dá)值作為自變量和邏輯回歸模型殘差作為因變量擬合經(jīng)驗貝葉斯線性模型。將這用于選擇與疾病狀態(tài)最直接相關(guān)而不依賴于臨床協(xié)變量的基因。使用分級聚簇對來自此分析的頭等肺癌相關(guān)基因進(jìn)行分組。以迭代方式選擇基因以使用交叉驗證最大化AUC以評估預(yù)測準(zhǔn)確度。目的是選擇累積提供最佳分類器性能的簇,以及最好地代表每個簇的具體基因。還實施基因滴定分析以確定提供最佳性能的每個簇的基因數(shù)目。對于所選擇的簇,對頭等基因取平均,為每個患者/簇組合產(chǎn)生簇均值估值。使用DAVID[37]實施每個癌癥簇內(nèi)的基因的功能分析,以鑒定描述該分類器中的癌癥相關(guān)基因的生物學(xué)項。肺癌分類器使用肺癌狀態(tài)作為輸出變量和癌癥基因表達(dá)估值,患者年齡,和性別(GG),吸煙狀態(tài)(GS),包年(GPY)的CFGC作為預(yù)測因子,開發(fā)了肺癌分類器。使用罰分邏輯回歸模型擬合模型;對于臨床/基因表達(dá)關(guān)聯(lián),懲罰因子(λ)為0,對于每種基因表達(dá)簇估值,懲罰因子(λ)為10。所得得分在0到1的度量上。建立了用于預(yù)測肺癌狀態(tài)的得分閾,以對于具有非診斷性支氣管鏡檢的患者實現(xiàn)大約90%的靈敏度。通過在邏輯回歸模型中產(chǎn)生包括年齡,性別,吸煙狀態(tài),和包-年(臨床確定)的預(yù)測肺癌狀態(tài)的“臨床模型”來實施基因表達(dá)分類器與單獨的臨床因素相比預(yù)測肺癌的益處的評價。通過在訓(xùn)練集合中比較每種模型的AUC來評估完全基因表達(dá)分類器和臨床因素分類器之間預(yù)測肺癌狀態(tài)的性能的差異。獨立測試集合的分析使用來自先前研究[35]的數(shù)據(jù)作為獨立測試集合以評估在此研究中派生的鎖定分類器的性能。在該研究中,自為懷疑肺癌經(jīng)歷支氣管鏡檢的患者在支氣管鏡檢時收集了BEC,并在微陣列(AffymetrixHG-U133A)上分析RNA。使用BioconductorR包(版本1.28.1)中的RobustMultiarrayAverage(RMA)[38]將來自該研究的CEL文件(n=163)重新標(biāo)準(zhǔn)化以產(chǎn)生基因水平表達(dá)值。此處理使用EntrezGene特異性探針集芯片定義文件(CDF)[39]代替由Affymetrix提供的標(biāo)準(zhǔn)U133ACDF,以便于跨平臺分析。使用用于統(tǒng)計運(yùn)算的R環(huán)境(版本2.9.2)實施分析。將該分類器應(yīng)用于測試集合中的患者,具有兩項修改以考慮微陣列平臺中的差異。首先,通過逐個基因常數(shù)調(diào)整HG-U133ARMA表達(dá)值,該常數(shù)將測試集合中每種基因的表達(dá)水平的均值移動至在訓(xùn)練集合中觀察到的均值。其次,對于不存在相應(yīng)的HG-U133A探針集的分類器基因(LYPD2和RNF150),將該基因在訓(xùn)練集合中的均值表達(dá)值用于所有測試集合樣品。統(tǒng)計方法使用預(yù)測準(zhǔn)確度的標(biāo)準(zhǔn)測量來評估分類器準(zhǔn)確度:曲線下面積(AUC),靈敏度,特異性,NPV和PPV。使用10%樣品抽取集合,在訓(xùn)練集合中使用交叉驗證來評估使用這些辦法產(chǎn)生的預(yù)測分類器的性能[40]。使用這些性能估值來指導(dǎo)分類器發(fā)現(xiàn)規(guī)程的開發(fā)。設(shè)置最終的模型,之后實施測試集合的一次性分析。使用Fisher氏精確檢驗來計算所有分類變量的統(tǒng)計學(xué)顯著性,并將t檢驗用于連續(xù)變量。結(jié)果研究群體使用來自AEGIS1的299名患者的集合(由223名診斷有肺癌的患者和76名診斷有良性疾病的患者組成)(表1)來派生我們的基因表達(dá)分類器。獨立測試集合的特征先前已有描述[錯誤!書簽未定義。],并在此處匯總。雖然研究設(shè)計與此處描述的相似,但是研究群體中存在一些差異。與測試集合相比,訓(xùn)練集合中的患者平均而言年齡更大(p<0.001)(盡管對于診斷有肺癌的患者而言年齡沒有顯著差異(p=0.959))。訓(xùn)練集合也由較少的當(dāng)前的吸煙者(p=0.050);和較低比例的具有<3cm損害的患者(p<0.001)組成。另外,肺癌的流行度在訓(xùn)練集合中更高(75%對48%;p<0.001)。表21–用于訓(xùn)練分類器的患者的臨床和人口統(tǒng)計學(xué)特征。分類器的派生和性能的評估對于陣列上的大部分基因而言,基因表達(dá)與當(dāng)前的吸煙狀態(tài)相關(guān)(6477種基因,p<0.001;表22中報告的頭10種基因)?;诮徊骝炞C,選擇三種排序頭等的基因(SLC7A11,TKT,和CLND10)充當(dāng)基于邏輯回歸的吸煙狀態(tài)分類器。此吸煙狀態(tài)分類器在訓(xùn)練集合內(nèi)具有0.93的AUC。不依賴于吸煙狀態(tài),為吸煙史派生另一個CFGC,并且基于以包-年測量的累積煙霧暴露。吸煙史(<10PY對>10PY)與531種基因的表達(dá)顯著相關(guān)(p<0.001;表23中報告的頭10種基因)。選擇兩種頭等基因充當(dāng)基于邏輯回歸的吸煙史分類器(RUNX1T1,AKR1C2),其在訓(xùn)練集合內(nèi)具有0.78的AUC。性別與339種基因顯著相關(guān)(p<0.001;表24中報告的頭10種基因)。排序頭等的基因(RPS4Y1)是訓(xùn)練集合內(nèi)性別的完美分類器(AUC=1)。表22:頭等的與吸煙狀態(tài)相關(guān)的差異表達(dá)的基因表23:頭等的與吸煙史相關(guān)的差異表達(dá)的基因表24:頭等的與性別相關(guān)的差異表達(dá)的基因如方法中描述的,我們鑒定了其表達(dá)與來自用于肺癌的CFGC模型的殘差顯著相關(guān)的基因??偣?32種癌癥相關(guān)基因(表25)滿足顯著性標(biāo)準(zhǔn)(T得分>2.7)。檢查了232種基因的成對相關(guān)性,接著是分級聚簇,以鑒定具有相似表達(dá)樣式的基因,并將基因劃分成11個簇(圖7)。由于基因關(guān)聯(lián)在每個簇內(nèi),因此我們假設(shè)每個簇內(nèi)的一小組基因的均值可以用于以稀疏方式代表該簇。我們優(yōu)化了分類器,使用交叉驗證來評估AUC。我們選擇基因來代表其表達(dá)與肺癌最強(qiáng)相關(guān)的基因簇,并確定了包含簇1,2,4,7,9和10給出最佳的AUC。我們還確定了,每個簇超過2-4種基因,測試的性能沒有改善。在交叉驗證中,對于訓(xùn)練集合中的所有患者(n=299),AUC=0.80(95%CI0.75-0.84);對于具有非診斷性支氣管鏡檢的患者子集(n=134),性能是類似的(AUC=0.81;95%CI0.74-0.87)。表25:包括在分類器中的與癌癥相關(guān)的基因然后使用完成的分類器發(fā)現(xiàn)規(guī)程在整個訓(xùn)練集合上確定最終的肺癌分類器。該分類器由作為預(yù)測因子的六個癌癥基因簇組合(由總共17種基因代表),患者年齡,和基因表達(dá)關(guān)聯(lián)(GG,GS,GPY)(表26)組成。使用0.65的得分閾實施二分分類(得分>/=0.65的患者預(yù)測為癌癥陽性且得分<0.65的患者預(yù)測為癌癥陰性)。該分類器在訓(xùn)練集合中具有93%的靈敏度和57%的特異性,而且與其支氣管鏡檢對肺癌是非診斷性的患者的子集(AUC=0.78;95%CI0.71-0.85)相比,對于整個訓(xùn)練集合(0.78;95%CI,0.73-0.82)而言,分類器的AUC沒有差異(見圖9)。表26–基因表達(dá)分類器的描述aa)若RPS4Y1<7.5,則基因組性別定義為GG=1(女性),否則為0(男性)。派生預(yù)測的基因組吸煙(GS)值,其中x=40.8579-0.4462*SLC7A11-2.1298*CLND10-1.8256*TKT,且基因組吸煙GS=ex/(1+ex)。派生預(yù)測的基因組包-年(GPY)值,其中x=-5.1429+2.1891*RUNX1T1-0.9506*AKR1C2,且基因組包-年GPY=exp(x)/(1+exp(x))。預(yù)測分類器的廣義方程為:得分=ey/(1+ey),其中,y=b0+Σ(bi*xi),其中b0是截距,bi是系數(shù),且xi是特征(如顯示的)。b)特征包括如方法中描述的患者年齡(如報告的),GG,GS,GPY,和CA(i),肺癌基因簇(圖7中顯示)。在訓(xùn)練集合中,與單獨使用臨床因素的模型(AUC=0.72;95%CI,0.67-0.77)相比,該基因表達(dá)分類器的性能顯著更好(AUC=0.78;95%CI,0.73-0.82)(p<0.001)。分開匯總17種癌癥基因的功能分析(表27)。與癌癥相關(guān),9種基因下調(diào),且8種上調(diào)。表27:分類器基因的生物學(xué)表征。在獨立測試集合中的驗證在獨立測試集合的具有非診斷性支氣管鏡檢的患者(n=123)中,該分類器的AUC為0.81(95%CI,0.73-0.88)(圖8),其類似于在訓(xùn)練集合中具有非診斷性支氣管鏡檢的患者中的性能(AUC=0.78;95%0.71-0.85;p=0.495)。靈敏度為92%,特異性為55%,NPV為94%(95%CI,83-99%)(見表28)。有趣的是,我們沒有觀察到癌癥組織學(xué)或階段(表29)或損害大小(表30)對分類器關(guān)于癌癥的靈敏度的任何影響。此外,在測試集合中,該分類器具有當(dāng)前吸煙者中0.79和以前吸煙者中0.82的AUC,提示吸煙狀態(tài)對分類器性能沒有顯著影響(p=0.710)。當(dāng)與單獨的支氣管鏡檢相比時,基因表達(dá)分類器與支氣管鏡檢的組合將靈敏度自51%提高至95%(p<0.001)。表28–支氣管鏡檢,分類器,和組合規(guī)程在測試集合中的性能。a)診斷有癌癥的患者=CA+和良性疾病=CA-b)在支氣管鏡檢未導(dǎo)致發(fā)現(xiàn)癌癥的患者(n=123)中評估分類器的性能。表29–支氣管鏡檢,分類器,和組合程序?qū)y試集合中具有肺癌的患者的靈敏度。在為懷疑肺癌經(jīng)歷診斷性支氣管鏡檢規(guī)程的163名患者中,78例診斷有癌癥。在支氣管鏡檢(a)時,在40名患者(51%;95%CI,40-62%)中做出了肺癌診斷,而且在支氣管鏡檢時未做出診斷的剩余肺癌患者中,該分類器正確預(yù)測了他們中的34例(b)(89%;95%CI,75-96%)。分類器與支氣管鏡檢組合產(chǎn)生了78名具有肺癌的患者中74例的檢測(95%,95%CI,87-98%)(c)。還顯示了支氣管鏡檢,分類器,和組合程序?qū)τ诜伟┮勒諄喰秃碗A段的靈敏度。表30–支氣管鏡檢,分類器,和組合規(guī)程在通過可疑損害的大小分層的測試集合中的靈敏度。包括診斷有肺癌的患者和具有良性疾病的患者。表26列出了感興趣的多個基因表達(dá)分類器。下面的表,表31,提供了在NCBI上可得的基因ID,提供了對基因表達(dá)分類器的描述性支持?;蚍诸惼鰿D177在表31中用兩個名稱描述,即CD177.1和CD177.2。.1和.2標(biāo)記標(biāo)識在檢測由基因分類器代表的基因的差異表達(dá)的陣列中使用兩種不同的探針集。圖10A公開了用于與CD177雜交的19種探針,說明CD177.1。圖10B公開了用于與CD177雜交的4種探針,說明CD177.2。表31–與基因表達(dá)分類器對應(yīng)的NCBI基因ID號?;蚍诸惼骰騃D號基因分類器基因ID號RPS4Y16192MCAM4162SLC7A1123657NOVA14857CLDN109071SDC16382TKT7086CDR11038AKR1C21646CGREF110669BST1683CLDN2253842CD177.157126(見圖10A)NKX3-14824CD177.257126(見圖10B)EPHX379852ATP12A479LYPD2137797TSPAN210100MIA8190GABBR12550RNF15057484RUNX1T1862結(jié)果的評估工作已經(jīng)證明在來自支氣管氣道的正常上皮細(xì)胞中存在與暴露于香煙煙霧和當(dāng)前和以前吸煙者中肺癌的存在相關(guān)的持久基因表達(dá)改變[32,41,42,43]。這些癌癥相關(guān)差異可用于派生能夠在支氣管鏡檢期間獲得的這些相對非侵入性收集的生物標(biāo)本中準(zhǔn)確檢測肺癌的分類器[35]。在當(dāng)前的實踐中,當(dāng)支氣管鏡檢沒有導(dǎo)致發(fā)現(xiàn)惡性,而且假陰性率的范圍可為20-70%時,排除肺癌是具有挑戰(zhàn)性的[28]。當(dāng)前的指導(dǎo)方針建議,疾病風(fēng)險升高的患者應(yīng)當(dāng)進(jìn)行更具侵入性的隨訪診斷規(guī)程[28],其具有升高的并發(fā)癥風(fēng)險[31]。然而,由于不確定性,這些規(guī)程常常在發(fā)現(xiàn)具有良性疾病的患者中實施[33]。因此,我們的目標(biāo)是在支氣管鏡檢期間自近端氣道派生基因表達(dá)分類器,以提高總體靈敏度,當(dāng)支氣管鏡檢是非診斷性時最小化模糊性,及減少對不必要的侵入性規(guī)程的需要。在這項研究中,我們利用了來自一項更大的多中心研究的為疑似肺癌經(jīng)歷支氣管鏡檢的當(dāng)前和以前吸煙者的分支以派生用于肺癌的基因表達(dá)分類器。該分類器是具有高靈敏度和高NPV的多變量邏輯回歸模型。重要的是,我們已經(jīng)在一個獨立分支中驗證了該分類器的性能,使用來自先前發(fā)表的自為疑似肺癌經(jīng)歷支氣管鏡檢的吸煙者收集的氣道樣品的研究的數(shù)據(jù)。在具有55%的特異性的測試集合中,支氣管鏡檢是非診斷性的患者中的靈敏度為92%。測試集合中的NPV為94%,比較而言,單獨的支氣管鏡檢的NPV為69%,提示該分類器能幫助內(nèi)科醫(yī)師在非診斷性支氣管鏡檢后可靠地鑒定不太可能具有肺癌的患者。差異表達(dá)的基因在具有肺癌的當(dāng)前和以前吸煙者中看來正常的氣道上皮中的功能提供了對損害場根本的生物學(xué)的了解。在受到遏制的基因中,有多種涉及免疫應(yīng)答,包括CD177和BST1,提示具有肺癌的吸煙者的氣道中受損的免疫應(yīng)答。基因TSPAN2(其表達(dá)受到p53敲減阻抑且與肺腺癌中的不良預(yù)后相關(guān)[44])在具有癌癥的患者中也以較低水平表達(dá)。還有,EPHX3(一種涉及異型生物質(zhì)代謝,煙草煙霧中致癌物的處理,和其它上皮癌中的癌發(fā)生的基因[45])下調(diào)。在肺癌中上調(diào)的分類器基因中,NOVA1和CDR1主要在神經(jīng)元中表達(dá),但是也在腫瘤中表達(dá),而且在數(shù)種惡性腫瘤(包括小細(xì)胞肺癌)中與副腫瘤抗體(para-neoplasticantibodies)相關(guān)[46,47,48,49,50]。而且,在肺癌中上調(diào)的MCAM在基底支氣管上皮細(xì)胞中表達(dá)[51]。MCAM在修復(fù)期間在氣管上皮中也強(qiáng)烈且瞬時上調(diào)[52],是氣管上皮再生所需的[53],而且在具有COPD[54]和哮喘[55]的患者的支氣管上皮中上調(diào)。調(diào)節(jié)細(xì)胞生長和增殖的多種分類器基因在具有肺癌的患者中上調(diào),包括SDC2和NKX3-1以及細(xì)胞周期阻滯介導(dǎo)物CGREF1。最后,選擇用于在我們的分類器中預(yù)測吸煙狀態(tài)(SLC7A11,CLDN10,TKT)和吸煙史(RUNX1T1,AKR1C2)的CFGC基因先前已經(jīng)報告為通過煙霧暴露而改變,確認(rèn)了吸煙對氣道上皮生物學(xué)的穩(wěn)健有力影響[11,18,33]。我們的發(fā)現(xiàn)辦法擴(kuò)展了早期關(guān)于基于基因表達(dá)的肺癌診斷的工作[35],主要是在選擇具有肺癌相關(guān)表達(dá)的特征之前,作為預(yù)測性模型的成分,臨床協(xié)變量的顯式建模。已知對環(huán)境危害和其它臨床因素的響應(yīng)可以在個體間有實質(zhì)性變化。因此,我們的辦法是使用基因表達(dá)來捕獲對環(huán)境危害(例如累積煙暴露)的患者水平生理反應(yīng),因為此反應(yīng)可能比實際報告的值更能反映疾病風(fēng)險[57]。我們的辦法的另一個成分是選擇在考慮建模臨床因素后其表達(dá)與癌癥相關(guān)的基因。我們假設(shè)這種辦法會有助于確保由具有癌癥相關(guān)基因表達(dá)的基因關(guān)于癌癥的可能性捕獲的信息獨立于由建模的臨床因素關(guān)于癌癥捕獲的信息。我們的分類器發(fā)現(xiàn)辦法的另一個重要方面是我們通過聚簇,然后作為每個癌癥相關(guān)基因表達(dá)模塊的加性效應(yīng)對癌癥建模來鑒定獨立的癌癥相關(guān)基因表達(dá)的樣式的辦法。這與僅選擇根據(jù)其與癌癥的關(guān)聯(lián)而全局排序頭等的基因(這能潛在導(dǎo)致選擇反映單一癌癥相關(guān)分子過程的整組基因)形成對比。在看來正常的氣道上皮細(xì)胞中派生基因表達(dá)分類器以預(yù)測肺癌風(fēng)險的先前研究已經(jīng)描述了當(dāng)支氣管鏡檢是非診斷性的時候具有高靈敏度和NPV的類似結(jié)果[35]。雖然該分類器與本文所述分類器相比沒有共同的基因,但是我們相信,鑒于獨立測試集合中的強(qiáng)性能,我們的新分類器代表類似的作用機(jī)制。然而,所選擇的具體基因的差異這可能是由于特征選擇過程的差異。我們已經(jīng)使用來自近端氣道的細(xì)胞派生出用于肺癌的基因表達(dá)分類器,其可以與支氣管鏡檢聯(lián)合用于疑似肺癌。我們已經(jīng)在一個獨立測試集合中驗證了這個分類器的性能。該分類器對支氣管鏡檢規(guī)程增加了實質(zhì)性靈敏度,導(dǎo)致高NPV。通過鑒定處于低風(fēng)險具有肺癌的患者,當(dāng)支氣管鏡檢是非診斷性的時候,此分類器可用于幫助做出決策。如此已經(jīng)描述了本公開文本的至少一個實施方案的數(shù)個方面,要領(lǐng)會,本領(lǐng)域技術(shù)人員會容易想到各種改變,修改,和改進(jìn)。此類改變,修改,和改進(jìn)意圖作為本公開文本的一部分,而且意圖在本公開文本的精神和范圍內(nèi)。因而,前面的描述和附圖僅僅是例示性的,而且通過所附權(quán)利要求書詳細(xì)地描述本公開文本。在權(quán)利要求中使用諸如“第一”,“第二”,“第三”,等序數(shù)術(shù)語來修飾權(quán)利要求元素本身并不意味著任何優(yōu)先,在先,或一個權(quán)利要求元素相對于另一個的次序或?qū)嵤┓椒ǖ膭幼鞯臅r間次序,而是僅僅用作標(biāo)記來區(qū)分具有某個名稱的一個權(quán)利要求元素與具有相同名稱(但是使用該序數(shù)術(shù)語)的另一個元素以區(qū)分各權(quán)利要求元素。援引加入通過援引完整收錄本文中引用的所有參考文獻(xiàn),論文,出版物,專利,專利公開文本,和專利申請用于所有目的。參考文獻(xiàn)1.Gould,M.K.,Donington,J.,Lynch,W.R.,etal.Evaluationofindividualswithpulmonarynodules:Whenisitlungcancer?:Diagnosisandmanagementoflungcancer:AmericanCollegeofChestPhysiciansevidence-basedclinicalpracticeguidelines.CHESTJournal2013;143(5_suppl):e93S-e120S.2.Tukey,M.H.,&Wiener,R.S..Population-basedestimatesoftransbronchiallungbiopsyutilizationandcomplications.Respiratorymedicine2012;106(11):1559-1565.3.ErnstA,SilvestriG,JohnstoneD.InterventionalPulmonaryProcedures:GuidelinesfromtheAmericanCollegeofChestPhysicians.Chest2003;123;1693-17174.RiveraMP,MehtaAC,WahidiMM.EstablishingtheDiagnosisofLungCancer:DiagnosisandManagementofLungCancer,3rded:AmericanCollegeofChestPhysiciansEvidence-BasedClinicalPracticeGuidelines.Chest2013;143:e142S-65S.5.Memoli,J.S.W.,Nietert,P.J.,&Silvestri,G.A.Meta-analysisofguidedbronchoscopyfortheevaluationofthepulmonarynodule.CHESTJournal2012;142(2):385-393.6.Ost,D.,Fein,A.M.,&Feinsilver,S.H.(2003).Thesolitarypulmonarynodule.NewEnglandJournalofMedicine,348(25),2535-2542.7.Grogan,E.L.,Weinstein,J.J.,Deppen,S.A.,etal.Thoracicoperationsforpulmonarynodulesarefrequentlynotfutileinpatientswithbenigndisease.Journalofthoraciconcology:officialpublicationoftheInternationalAssociationfortheStudyofLungCancer2011,6(10):1720.8.Detterbeck,F.C.,Mazzone,P.J.,Naidich,D.P.,&Bach,P.B.Screeningforlungcancer:diagnosisandmanagementoflungcancer:AmericanCollegeofChestPhysiciansevidence-basedclinicalpracticeguidelines.CHESTJournal2013;143(5_suppl):e78S-e92S.9.Wiener,R.S.,Wiener,D.C.,&Gould,M.K.RisksofTransthoracicNeedleBiopsy:HowHigh?Clinicalpulmonarymedicine2013;20(1):29.10.Covey,A.M.,Gandhi,R.,Brody,L.A.,Getrajdman,G.,Thaler,H.T.,&Brown,K.T.Factorsassociatedwithpneumothoraxandpneumothoraxrequiringtreatmentafterpercutaneouslungbiopsyin443consecutivepatients.Journalofvascularandinterventionalradiology2004;15(5):479-483.11.Geraghty,P.R.,Kee,S.T.,McFarlane,G.,Razavi,M.K.,Sze,D.Y.,&Dake,M.D.CT-guidedTransthoracicNeedleAspirationBiopsyofPulmonaryNodules:NeedleSizeandPneumothoraxRate1.Radiology2003;229(2):475-481.12.Golub,T.R.,Slonim,D.K.,Tamayo,P.,etal.Molecularclassificationofcancer:classdiscoveryandclasspredictionbygeneexpressionmonitoring.Science1999;286(5439):531-537.13.SpiraA,BeaneJE,ShahV,etal.Airwayepithelialgeneexpressioninthediagnosticevaluationofsmokerswithsuspectlungcancer.Naturemedicine2007;13:361-6.14.HanleyJA,McNeilBJ.Themeaninganduseoftheareaunderareceiveroperatingcharacteristic(ROC)curve.Radiology1982;143:29-36.15.MacMahon,H.,Austin,J.H.,Gamsu,G.,etal.GuidelinesformanagementofsmallpulmonarynodulesdetectedonCTscans:astatementfromtheFleischnerSociety1.Radiology2005,237(2):395-400..16.Beane,J.,Sebastiani,P.,Whitfield,T.H.,etal.Apredictionmodelforlungcancerdiagnosisthatintegratesgenomicandclinicalfeatures.CancerPreventionResearch2008;1(1):56-64.17.Gustafson,A.M.,Soldi,R.,Anderlind,C.,etal.AirwayPI3Kpathwayactivationisanearlyandreversibleeventinlungcancerdevelopment.Sciencetranslationalmedicine2010;2(26):26ra25-26ra25.18.Kadara,H.,Fujimoto,J.,Yoo,S.Y.,Maki,etal.Transcriptomicarchitectureoftheadjacentairwayfieldcancerizationinnon–smallcelllungcancer.JournaloftheNationalCancerInstitute2014;106(3):dju004.19.Alexander,E.K.,Kennedy,G.C.,Baloch,etal.Preoperativediagnosisofbenignthyroidnoduleswithindeterminatecytology.NewEnglandJournalofMedicine2012,367(8):705-715.20.McWilliamsA,TammemagiMC,MayoJR,etal.ProbabilityofcancerinpulmonarynodulesdetectedonfirstscreeningCT.NEnglJMed2013;369:910-9.21.OstDE,GouldMK.Decisionmakinginpatientswithpulmonarynodules.Americanjournalofrespiratoryandcriticalcaremedicine2012;185:363-72.22.Irizarry,R.A.,Bolstad,B.M.,Collin,F.,Cope,L.M.,Hobbs,B.,&Speed,T.P.(2003).SummariesofAffymetrixGeneChipprobeleveldata.Nucleicacidsresearch,31(4),e15-e15.23.JohnsonWE,LiC,RabinovicA.AdjustingbatcheffectsinmicroarrayexpressiondatausingempiricalBayesmethods.Biostatistics2007;8:118–127.24.HowladerN,NooneAM,KrapchoM,etal.SEERstatfactsheets:lungandbronchus.Availableonline:http://seer.cancer.gov/statfacts/html/lungb.html.25.TheNationalLungScreeningTrialResearchTeam.ReducedLung-CancerMortalitywithLow-DoseComputedTomographicScreening.NEnglJMed2011;365:395-40926.TanoueLT,TannerNT,GouldMK,SilvestriGA.LungCancerScreening.AmJRespirCritCareMed.publishedonline04Nov201427.ErnstA,SilvestriG,JohnstoneD.InterventionalPulmonaryProcedures:GuidelinesfromtheAmericanCollegeofChestPhysicians.Chest2003;123;1693-171728.Rivera,M.P.,Mehta,A.C.,&Wahidi,M.M.(2013).EstablishingtheDiagnosisofLungCancerDiagnosisandManagementofLungCancer,3rded:AmericanCollegeofChestPhysiciansEvidence-BasedClinicalPracticeGuidelines.CHESTSupplement.Chest,143,e143S.29.Silvestri,G.A.,Feller-Kopman,D.,Chen,A.,Wahidi,M.,Yasufuku,K.,&Ernst,A.(2012).LatestAdvancesinAdvancedDiagnosticandTherapeuticPulmonaryProceduresUpdateonPulmonaryProcedures.CHESTJournal,142(6),1636-1644.30.Gildea,T.R.,Mazzone,P.J.,Karnak,D.,Meziane,M.,&Mehta,A.C.(2006).Electromagneticnavigationdiagnosticbronchoscopy:aprospectivestudy.Americanjournalofrespiratoryandcriticalcaremedicine,174(9),982-989.31.Wiener,R.S.,Schwartz,L.M.,Woloshin,S.,&Welch,H.G.(2011).Population-basedriskforcomplicationsaftertransthoracicneedlelungbiopsyofapulmonarynodule:ananalysisofdischargerecords.Annalsofinternalmedicine,155(3),137-144.32.Fontaine-Delaruelle,C.,Ferretti,G.,Gamondes,D.,Pradat,E.,Souquet,P.J.,&Couraud,S.(2014).IstransthoraciccoreneedlebiopsyunderCTscanagooddealforbenigndiseases′diagnosis?.EuropeanRespiratoryJournal,44(Suppl58),P679.33.SmithMA,BattafaranoRJ,MeyersBF,ZooleJB,CooperJD,PattersonGA.Prevalenceofbenigndiseaseinpatientsundergoingresectionforsuspectedlungcancer.TheAnnalsofthoracicsurgery2006;81:1824-1828;discussion1828-182934.Beane,J.,Sebastiani,P.,Liu,G.,Brody,J.S.,Lenburg,M.E.,&Spira,A.(2007).Reversibleandpermanenteffectsoftobaccosmokeexposureonairwayepithelialgeneexpression.GenomeBiol,8(9),R201.35.SpiraA,BeaneJE,ShahV,SteilingK,LiuG,SchembriF,GilmanS,DumasYM,CalnerP,SebastianiP,SridharS,BeamisJ,LambC,AndersonT,GerryN,KeaneJ,LenburgME,BrodyJ.Airwayepithelialgeneexpressioninthediagnosticevaluationofsmokerswithsuspectlungcancer.NatureMedicine2007;13(3):361-636.Tibshirani,R.(1996).Regressionshrinkageandselectionviathelasso.JournaloftheRoyalStatisticalSociety.SeriesB(Methodological),267-288.37.DaWeiHuang,B.T.S.,&Lempicki,R.A.(2008).SystematicandintegrativeanalysisoflargegenelistsusingDAVIDbioinformaticsresources.Natureprotocols,4(1),44-57.38.Irizarry,R.A.,Hobbs,B.,Collin,F.,Beazer‐Barclay,Y.D.,Antonellis,K.J.,Scherf,U.,&Speed,T.P.(2003).Exploration,normalization,andsummariesofhighdensityoligonucleotidearrayprobeleveldata.Biostatistics,4(2),249-264.39.Dai,M.,Wang,P.,Boyd,A.D.,Kostov,G.,Athey,B.,Jones,E.G.,etal.,(2005).Evolvinggene/transcriptdefinitionssignificantlyaltertheinterpretationofGeneChipdata.Nucleicacidsresearch,33(20),e175-e175.40.Golub,T.R.,Slonim,D.K.,Tamayo,P.,Huard,C.,Gaasenbeek,M.,Mesirov,J.P.,etal.,(1999).Molecularclassificationofcancer:classdiscoveryandclasspredictionbygeneexpressionmonitoring.Science,286(5439),531-537.41.Kadara,H.,Fujimoto,J.,Yoo,S.Y.,Maki,Y.,Gower,A.C.,Kabbout,M.,etal.,(2014).TranscriptomicArchitectureoftheAdjacentAirwayFieldCancerizationinNon–Smallcelllungcancer.JournaloftheNationalCancerInstitute,106(3)42.Steiling,K.,Ryan,J.,Brody,J.S.,&Spira,A.(2008).Thefieldoftissueinjuryinthelungandairway.Cancerpreventionresearch,1(6),396-403.43.Bossé,Y.,Postma,D.S.,Sin,D.D.,Lamontagne,M.,Couture,C.,Gaudreault,N.,etal.,(2012).Molecularsignatureofsmokinginhumanlungtissues.Cancerresearch,72(15),3753-3763.44.Otsubo,C.,Otomo,R.,Miyazaki,M.,Matsushima-Hibiya,Y.,Kohno,T.,Iwakawa,R.,etal.,(2014).TSPAN2IsInvolvedinCellInvasionandMotilityduringLungCancerProgression.Cellreports,7(2),527-538.45.B.,Thorsen,K.,Lamy,P.,Wojdacz,T.K.,Hansen,L.L.,Birkenkamp‐K.,etal.,(2011).IdentificationandvalidationofhighlyfrequentCpGislandhypermethylationincolorectaladenomasandcarcinomas.Internationaljournalofcancer,129(12),2855-2866.46.Knudsen,A.,Monstad,S.E.,A.,P.E.,Salvesen,H.B.,Drivsholm,L.,etal.,(2006).Riantibodiesinpatientswithbreast,ovarianorsmallcelllungcancerdeterminedbyasensitiveimmunoprecipitationtechnique.CancerImmunology,Immunotherapy,55(10),1280-1284.47.Buckanovich,R.J.,Posner,J.B.,&Darnell,R.B.(1993).Nova,theparaneoplasticRiantigen,ishomologoustoanRNA-bindingproteinandisspecificallyexpressedinthedevelopingmotorsystem.Neuron,11(4),657-672.48.Salemi,M.,Fraggetta,F.,Galia,A.,Pepe,P.,Cimino,L.,Condorelli,R.A.,&Calogero,A.E.(2013).Cerebellardegeneration-relatedautoantigen1(CDR1)geneexpressioninprostatecancercelllines.TheInternationaljournalofbiologicalmarkers,30;29(3):e288-9049.Tanaka,M.,Tanaka,K.,Onodera,O.,&Tsuji,S.(1995).Trialtoestablishananimalmodelofparaneoplasticcerebellardegenerationwithanti-Yoantibody:1.MousestrainsbearingdifferentMHCmoleculesproduceantibodiesonimmunizationwithrecombinantYoprotein,butdonotcausePurkinjecellloss.Clinicalneurologyandneurosurgery,97(1),95-100.50.Furneaux,H.M.,Rosenblum,M.K.,Dalmau,J.,Wong,E.,Woodruff,P.,Graus,F.,&Posner,J.B.(1990).SelectiveexpressionofPurkinje-cellantigenstumortissuefrompatientswithparaneoplasticcerebellardegeneration.NewEnglandJournalofMedicine,322(26),1844-1851.51.Shih,I.M.,Nesbit,M.,Herlyn,M.,&Kurman,R.J.(1998).AnewMel-CAM(CD146)-specificmonoclonalantibody,MN-4,onparaffin-embeddedtissue.Modernpathology:anofficialjournaloftheUnitedStatesandCanadianAcademyofPathology,Inc,11(11),1098-1106.52.Tsukamoto,Y.,Taira,E.,Miki,N.,&Sasaki,F.(2001).Theroleofgicerin,novelcelladhesionmolecule,indevelopment,regenerationandneoplasia.HistolHistopathol.2001;16(2):563-71.53.Tsukamoto,Y.,Taira,E.,Kotani,T.,Yamate,J.,Wada,S.,Takaha,N.,etal.,(1996).Involvementofgicerin,acelladhesionmolecule,intrachealdevelopmentandregeneration.CellGrowthDiffer.7(12),1761-1767.54.Schulz,C.,Petrig,V.,Wolf,K.,K.,M.,Becker,B.,&M.(2003).UpregulationofMCAMinprimarybronchialepithelialcellsfrompatientswithCOPD.EurRespirJ.2003;22(3):450-6.55.Simon,G.C.,Martin,R.J.,Smith,S.,Thaikoottathil,J.,Bowler,R.P.,Barenkamp,S.J.,&Chu,H.W.(2011).Up-regulationofMUC18inairwayepithelialcellsbyIL-13:implicationsinbacterialadherence.AmJRespCellMolBiol,44(5),606-613.56.Penning,T.M.,&Lerman,C.(2008).Genomicsofsmokingexposureandcessation:lessonsforcancerpreventionandtreatment.CancerPreventionResearch,1(2),80-83.57.Lampe,J.W.,Stepaniants,S.B.,Mao,M.,Radich,J.P.,Dai,H.,Linsley,P.S.,etal.,(2004).Signaturesofenvironmentalexposuresusingperipheralleukocytegeneexpression:tobaccosmoke.CancerEpidemiologyBiomarkers&Prevention,13(3),445-453.序列表<110>D·H·惠特尼M·埃拉斯霍夫<120>用于評估肺癌狀態(tài)的方法<130>VRCT-008/02US<150>US62/024,456<151>2014-07-14<150>US62/160,403<151>2015-05-12<160>46<170>PatentInversion3.5<210>1<211>25<212>DNA<213>人工序列<220><223>TSPAN2探針序列<400>1tcaacattaagaagtcttaattcag25<210>2<211>25<212>DNA<213>人工序列<220><223>MCAM探針序列<400>2gctttaatccccatgaaggacagtg25<210>3<211>25<212>DNA<213>人工序列<220><223>ATP12A探針序列<400>3gcggtggagataccggcggcggcgc25<210>4<211>25<212>DNA<213>人工序列<220><223>NOVA1探針序列<400>4gacgaaattcagacatggagcatca25<210>5<211>25<212>DNA<213>人工序列<220><223>MIA探針序列<400>5atgacaccaaggcacaccagggacc25<210>6<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>6gacccgtctgtggctggtaatctct25<210>7<211>25<212>DNA<213>人工序列<220><223>EPHX3探針序列<400>7gctccactggaagagaggtataccc25<210>8<211>25<212>DNA<213>人工序列<220><223>CD177.2探針序列<400>8ttcctgtgtcccattgagcaggttg25<210>9<211>25<212>DNA<213>人工序列<220><223>CGREF1<400>9tagggtacagcacttaacgcaatct25<210>10<211>25<212>DNA<213>人工序列<220><223>BST1探針序列<400>10tgtttgccgtttcccgttccagaca25<210>11<211>25<212>DNA<213>人工序列<220><223>RNF150探針序列<400>11tggttaatccaagccgcagcctggt25<210>12<211>25<212>DNA<213>人工序列<220><223>CLDN22探針序列<400>12ggtgtttctcgtctccagttcttga25<210>13<211>25<212>DNA<213>人工序列<220><223>GABBR1探針序列<400>13tacggagccattacctgggcagtgc25<210>14<211>25<212>DNA<213>人工序列<220><223>SDC2探針序列<400>14tgagcctgcttctccgggctcccct25<210>15<211>25<212>DNA<213>人工序列<220><223>NKX3-1探針序列<400>15tttgtgctggctagtactccggtcg25<210>16<211>25<212>DNA<213>人工序列<220><223>LYPD2探針序列<400>16ttcttcaaggcattcggggctgggc25<210>17<211>25<212>DNA<213>人工序列<220><223>CDR1<400>17aacaactccgggtcttccagcgact25<210>18<211>25<212>DNA<213>人工序列<220><223>RPS4Y1探針序列<400>18taaaccgcaggaagtcagatgagtg25<210>19<211>25<212>DNA<213>人工序列<220><223>SLC7A11<400>19ggttgaagcaactagaagcgtgaca25<210>20<211>25<212>DNA<213>人工序列<220><223>CLDN10探針序列<400>20gacagcgtttcatgctcggatggcc25<210>21<211>25<212>DNA<213>人工序列<220><223>TKT探針序列<400>21ggtttattctctccagacggtcagg25<210>22<211>25<212>DNA<213>人工序列<220><223>RUNX1T1探針序列<400>22taacagggaggaggtcaaatctatc25<210>23<211>25<212>DNA<213>人工序列<220><223>AKR1C2探針序列<400>23tagctgtagcttactgaagtcgcca25<210>24<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>24gacgtgaaccagaccaatgaagggc25<210>25<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>25tcccatagggcaagtccggatgctc25<210>26<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>26agcaggaagggcaaaccactcccca25<210>27<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>27ccaagtgagagactccaggccctca25<210>28<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>28aggaggctgcacatcacgcttctca25<210>29<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>29ggaggctgcacatcacgcttctcac25<210>30<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>30acaagaagctggaaggttgggccac25<210>31<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>31aatgctcattttggtggacagccca25<210>32<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>32ctacatctaggagcagcagcgtctc25<210>33<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>33agcagcgtctcctgacacacctgcc25<210>34<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>34tcttgagccaagtttccgtgtgtca25<210>35<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>35tccgtgtgtcataatggtggtcccc25<210>36<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>36gttaacgaggttgttgcagaagtcc25<210>37<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>37ttggagagcaccaggctcacttggg25<210>38<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>38tctcaatgagcatcaacgtgtcctg25<210>39<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>39gcaggtcggacaccttccacacatg25<210>40<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>40agggccagcagtaataccgcgctca25<210>41<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>41gggccagcagtaataccgcgctcat25<210>42<211>25<212>DNA<213>人工序列<220><223>CD177.1探針序列<400>42gacccgtctgtggctggtaatctct25<210>43<211>25<212>DNA<213>人工序列<220><223>CD177.2探針序列<400>43ttcctgtgtcccattgagcaggttg25<210>44<211>25<212>DNA<213>人工序列<220><223>CD177.2探針序列<400>44tcccattgagcaggttgcaaactgg25<210>45<211>25<212>DNA<213>人工序列<220><223>CD177.2探針序列<400>45cctgaggaggccatcataacagtgt25<210>46<211>25<212>DNA<213>人工序列<220><223>CD177.2探針序列<400>46aggccatcataacagtgtgtggtcc25當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
江永县| 承德县| 丰都县| 宁安市| 皮山县| 新源县| 朝阳县| 嘉定区| 申扎县| 孝义市| 宜州市| 宁晋县| 青铜峡市| 东兴市| 女性| 永德县| 平定县| 南靖县| 禹城市| 东海县| 义马市| 石棉县| 神木县| 唐海县| 平凉市| 连南| 旬阳县| 宣城市| 洛宁县| 化德县| 新巴尔虎左旗| 新源县| 台山市| 台北县| 安岳县| 阳原县| 成安县| 江都市| 安阳县| 靖西县| 南丹县|