專利名稱::基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜的煙氣化學(xué)組分預(yù)測(cè)方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種煙草行業(yè)中可用于煙氣化學(xué)組分釋放量的預(yù)測(cè)方法,通過(guò)檢測(cè)捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜和校正模型計(jì)算得到煙氣化學(xué)組分釋放量。
背景技術(shù):
:煙氣化學(xué)組分釋放量是巻煙制品的重要指標(biāo),巻煙配方部門在進(jìn)行葉組配方試驗(yàn)時(shí),一些重要煙氣化學(xué)組分能否達(dá)到標(biāo)準(zhǔn)直接關(guān)系到配方試驗(yàn)的成敗。對(duì)一些重要煙氣化學(xué)指標(biāo)的檢測(cè),如煙堿、焦油等,目前國(guó)家行業(yè)煙氣分析的標(biāo)準(zhǔn)方法是,用吸煙機(jī)對(duì)煙支抽吸完成之后,先采用差重法計(jì)算總粒相物的釋放量,然后對(duì)捕集到的總粒相物進(jìn)行萃取,應(yīng)用氣相色譜法測(cè)定萃取液中的煙堿和水分含量,減去煙堿和水分含量,即得焦油含量。該過(guò)程涉及較多步驟和儀器,分析結(jié)果嚴(yán)重依賴于分析人員的技巧和各儀器的穩(wěn)定性;分析速度慢,特別是進(jìn)行大批量測(cè)定時(shí),分析成本較高。傳統(tǒng)方法通常需要對(duì)捕集了煙氣粒相物的劍橋?yàn)V片進(jìn)行萃取,然后利用各種色譜學(xué)方法對(duì)煙氣化學(xué)組分進(jìn)行定量,這種做法一般會(huì)產(chǎn)生大量廢液,污染環(huán)境;如果需檢測(cè)的組分較多,往往需要不同的色譜學(xué)方法,同時(shí)也經(jīng)常會(huì)涉及一些必要的前處理步驟,如濃縮、快速衍生等,這大大增加了煙氣多指標(biāo)同時(shí)測(cè)定的經(jīng)濟(jì)成本和時(shí)間成本;另外,萃取過(guò)程需要近30分鐘左右的振搖,分析人員更傾向于將樣品集中成一批,利用吸煙機(jī)抽吸然后進(jìn)行檢測(cè),因此分析結(jié)果的獲得往往需要經(jīng)歷一個(gè)漫長(zhǎng)的周期,并非"立等可取"。由于無(wú)法對(duì)大量樣品進(jìn)行快速檢測(cè),數(shù)據(jù)不能及時(shí)反饋,配方模擬試驗(yàn)的時(shí)間成本很高;另外,由于庫(kù)存原料本身數(shù)量和質(zhì)量的變化,需要不斷地進(jìn)行配方上的維護(hù)和調(diào)整,現(xiàn)有的分析方法很大程度上限制了配方維護(hù)工作的速度,對(duì)配方人員開發(fā)符合要求的新型巻煙產(chǎn)品也難以提供高效的支持。近年來(lái),由于近紅外光譜分析技術(shù)、化學(xué)計(jì)量學(xué)以及計(jì)算科學(xué)的發(fā)展,使得結(jié)合化學(xué)計(jì)量學(xué)的近紅外光譜分析技術(shù)在各領(lǐng)域都得到了廣泛的應(yīng)用。煙草領(lǐng)域,如在煙葉化學(xué)組分預(yù)測(cè)方面,王東丹等人采用傅立葉變換近紅外漫反射光譜儀,對(duì)300個(gè)煙草樣品建立了近紅外光譜與總糖、還原糖、尼古丁、總氮4種主要成分含量間的關(guān)系模型,相對(duì)誤差不超過(guò)5%;王家俊等人利用1210個(gè)烤煙各個(gè)生長(zhǎng)期的根、莖、葉樣品的近紅外光譜數(shù)據(jù)建立了預(yù)測(cè)根莖和煙葉氮、磷、氯和鉀等主要營(yíng)養(yǎng)元素含量的校正模型;杜文等研究了用于提高近紅外分析模型的轉(zhuǎn)移性能的小波變換光譜前處理方法,結(jié)果表明小波變換在消除干擾信息的同時(shí)不引入新的干擾因素,并且能夠同時(shí)進(jìn)行扣除基線和濾噪的計(jì)算,應(yīng)用于近紅外光譜前處理時(shí)具有突出的優(yōu)點(diǎn)。在煙氣化學(xué)組分預(yù)測(cè)方面,何智慧等利用煙葉粉末的近紅外光譜和煙氣煙堿的化學(xué)分析數(shù)據(jù)建立了煙氣煙堿的預(yù)測(cè)方法,能夠較準(zhǔn)確預(yù)測(cè)巻煙的煙氣煙堿,并具有良好的重現(xiàn)性。然而利用煙葉粉末預(yù)測(cè)煙氣化學(xué)組分含量的預(yù)測(cè)范圍有限,因?yàn)闊焿A由煙葉向煙氣轉(zhuǎn)移的規(guī)律性較強(qiáng),因而可以實(shí)現(xiàn)較好的預(yù)測(cè)效果,但對(duì)于一些含量稍低的組分的預(yù)測(cè)則未必能夠獲得令人滿意的結(jié)果。王家俊等采用化學(xué)計(jì)量學(xué)的多元校正技術(shù)結(jié)合傅里葉變換近紅外光譜同時(shí)測(cè)定煙氣中的焦油、煙堿和一氧化碳含量,該方法應(yīng)用多元校正技術(shù)中的偏最小二乘法,建立總粒相物萃取液的近紅外光譜與焦油、煙堿和一氧化碳釋放量的校正模型。然而該方法采用總粒相物萃取液的近紅外光譜進(jìn)行建模,仍然需要對(duì)總粒相物進(jìn)行萃取,并未解決樣本制備上的繁瑣問(wèn)題,萃取劑的使用也增加了檢測(cè)和環(huán)境成本;同時(shí),由于低含量組分被溶液稀釋,該方法很難擴(kuò)展到其他組分的預(yù)測(cè);此外,該方法的預(yù)測(cè)范圍有限,如煙堿的預(yù)測(cè)范圍僅為L(zhǎng)15mg1.45mg,對(duì)于大量的、煙氣組分含量波動(dòng)范圍較大的單等級(jí)煙葉很難實(shí)現(xiàn)有效的預(yù)測(cè)。另外,因?yàn)闉V片萃取液中并未溶解一氧化碳,該方法對(duì)一氧化碳的預(yù)測(cè)實(shí)際上是一種間接預(yù)測(cè)方法,是利用了煙氣化學(xué)組分之間的協(xié)調(diào)相關(guān)性完成預(yù)測(cè)的,而一氧化碳釋放量在吸煙機(jī)抽吸結(jié)束以后可由儀器直接讀取,似乎并無(wú)必要利用模型再進(jìn)行計(jì)算。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種煙氣化學(xué)組分含量快速檢測(cè)方法,該方法通過(guò)直接檢測(cè)捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜,通過(guò)校正模型計(jì)算得到煙氣化學(xué)組分含量,檢測(cè)過(guò)程無(wú)需進(jìn)行萃取,可實(shí)現(xiàn)多組分同時(shí)檢測(cè),提高檢測(cè)效率,大大降低檢測(cè)和環(huán)境成本,同時(shí)具有操作簡(jiǎn)便和安全的特點(diǎn)。本發(fā)明通過(guò)以下技術(shù)方案實(shí)現(xiàn)首先選擇和制備校正樣本集,收集不同產(chǎn)地、不同品種、不同等級(jí)、不同年份、不同品牌的巻煙樣本,通過(guò)吸煙機(jī)抽吸獲得捕集了煙氣粒相物的劍橋?yàn)V片;然后將劍橋?yàn)V片捕集了粒相物的一側(cè)用低羥基石英片覆蓋,壓實(shí);對(duì)捕集了煙氣粒相物的劍橋?yàn)V片進(jìn)行直接近紅外光譜檢測(cè);同時(shí),采用傳統(tǒng)常規(guī)方法檢測(cè)煙氣化學(xué)組分含量;利用化學(xué)計(jì)量學(xué)多元校正技術(shù)建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與煙氣化學(xué)組分定量數(shù)據(jù)之間的校正模型,并進(jìn)行校正模型的優(yōu)化;對(duì)于未知樣本只需利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,并掃描其近紅外光譜,利用校正模型計(jì)算即可得到未知樣本中相應(yīng)煙氣化學(xué)組分的含量。本發(fā)明具體的步驟中優(yōu)選的方式包括利用低羥基石英片覆蓋劍橋?yàn)V片捕集了粒相物的一側(cè),并朝向檢測(cè)口置于檢測(cè)臺(tái)上,濾片上用等直徑壓錘垂直壓實(shí),利用近紅外光譜儀旋轉(zhuǎn)采集劍橋?yàn)V片的近紅外光譜。利用化學(xué)計(jì)量學(xué)偏最小二乘法建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與煙氣化學(xué)組分定量數(shù)據(jù)之間的校正模型。近紅外光譜的波段范圍為9000cm"4000cnT1中的一段或數(shù)段,取8994.5cm"4246.6cm-1區(qū)域。對(duì)近紅外光譜進(jìn)行預(yù)處理,所述的預(yù)處理的方法包括均值中心化、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、矢量歸一化、直線扣除法、多元散射校正中的一種或幾種組合。校正模型采用交互檢驗(yàn)法以及對(duì)光譜殘差和化學(xué)組分預(yù)測(cè)殘差的F檢驗(yàn)進(jìn)行模型優(yōu)化和異常樣本診斷。巻煙樣本最優(yōu)選為單料煙。因?yàn)閱瘟蠠熑~的煙氣化學(xué)組分波動(dòng)較大,我們因此可獲得較寬的模型預(yù)測(cè)范圍,從而可以實(shí)現(xiàn)各種單等級(jí)煙葉和成品煙的預(yù)測(cè);本發(fā)明所涉及的煙氣化學(xué)組分包括煙堿、焦油和總粒相物等其它適合的可檢測(cè)的煙氣化學(xué)組分。本發(fā)明可通過(guò)采用單料煙葉樣本,片煙制絲,平均切絲寬度l.lmm,未膨化,未用添加劑,并采用標(biāo)準(zhǔn)化輔料巻接,單支重1.00g;然后,利用吸煙機(jī)和國(guó)標(biāo)方法進(jìn)行抽吸,獲得捕集了煙氣粒相物的劍橋?yàn)V片。近紅外光譜儀開機(jī)預(yù)熱lh,自檢通過(guò)后,在環(huán)境溫度2(TC25'C,相對(duì)濕度小于70%的條件下,將劍橋?yàn)V片捕集了粒相物的一側(cè)用低羥基石英片覆蓋,并朝向檢測(cè)口置于檢測(cè)臺(tái)上,濾片上用等直徑壓錘垂直壓實(shí),旋轉(zhuǎn)采集近紅外光譜,掃描范圍9000cm"4000cm",掃描次數(shù)64次,分辨率8cm";最后,利用國(guó)標(biāo)方法、行業(yè)標(biāo)準(zhǔn)方法或其他傳統(tǒng)方法測(cè)定煙氣化學(xué)組分釋放量,應(yīng)用化學(xué)計(jì)量學(xué)偏最小二乘法(PLS)建立濾片的近紅外光譜與濾片捕集的煙氣組分含量之間的模型。對(duì)于待測(cè)的未知樣本,只需獲得其捕集了煙氣粒相物的劍橋?yàn)V片,掃描其近紅外光譜,利用相應(yīng)的校正模型計(jì)算即可得到煙氣中相應(yīng)化學(xué)組分的釋放量。整個(gè)過(guò)程時(shí)間短、速度快、結(jié)果準(zhǔn)確且"立等可取",可多組分同時(shí)檢測(cè),大大提高檢測(cè)效率,節(jié)省大量的人力和物力,檢測(cè)范圍寬,是煙氣化學(xué)組分定量檢測(cè)的一大創(chuàng)新,經(jīng)濟(jì)和社會(huì)效益巨大。另外值得指出的是,該方法也可利用成品煙獲得校正模型。選取不同品牌的成品煙樣本,利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,掃描其近紅外光譜,同時(shí)對(duì)煙氣化學(xué)組分進(jìn)行定量,建立校正模型。與單料煙不同的是,成品煙的單支重量可能各不相同,我們需要測(cè)定煙支燃燒段重量,然后把煙氣化學(xué)組分釋放量換算成標(biāo)準(zhǔn)含量,例如單克煙絲化學(xué)組分釋放量,然后利用換算過(guò)的煙氣化學(xué)組分含量與捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜建模。由于成品煙的重要煙氣化學(xué)指標(biāo),如煙堿、焦油等都得到了比較好的控制,因此由成品煙建立的校TH模型的預(yù)測(cè)范圍有限,對(duì)于煙氣化學(xué)組分釋放量超出預(yù)測(cè)范圍的煙葉樣本可能無(wú)法實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè);而由單料煙葉樣本建立的模型具有較寬的預(yù)測(cè)范圍,可大大降低樣本的煙氣化學(xué)組分釋放量超出預(yù)測(cè)范圍的概率。由于本發(fā)明直接檢測(cè)捕集了煙氣粒相物的劍橋?yàn)V片的近紅外光譜,因此不同規(guī)格的成型紙、巻煙紙、接裝紙、咀棒和不同的香精、香料等對(duì)煙氣化學(xué)組分的影響直接體現(xiàn)在濾片的近紅外光譜上,并不會(huì)對(duì)模型產(chǎn)生影響,因此本發(fā)明可實(shí)現(xiàn)對(duì)各種單料煙和成品煙的煙氣化學(xué)組分含量的測(cè)定。本發(fā)明有效地解決了煙氣化學(xué)組分在樣本制備上的繁瑣問(wèn)題,可實(shí)現(xiàn)多組分同時(shí)檢測(cè),提高了檢測(cè)效率,同時(shí)避免了萃取劑的使用,大大地降低了檢測(cè)和環(huán)境成本。由于煙氣化學(xué)組成比煙葉的化學(xué)組成復(fù)雜,且很多組分含量較低,因此對(duì)煙氣化學(xué)組分的預(yù)測(cè)遠(yuǎn)比煙葉組分預(yù)測(cè)困難。本發(fā)明利用捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜和煙氣化學(xué)組分定量數(shù)據(jù),采用化學(xué)計(jì)量學(xué)多元校正方法建立煙氣化學(xué)組分的校正模型,能夠準(zhǔn)確測(cè)定各種單料煙、成品煙的煙氣化學(xué)組分釋放量,定量結(jié)果具有較高的準(zhǔn)確性和較好的重現(xiàn)性。同時(shí)該方法還具有速度快、成本低、使用安全、環(huán)境友好等特點(diǎn)。值得指出的是,由于該發(fā)明避免了萃取劑的使用而是直接檢測(cè)劍橋?yàn)V片的光譜,這使得煙氣中低含量組分的光譜貢獻(xiàn)大大增加,不存在被溶液的光譜信號(hào)湮沒(méi)的問(wèn)題,使得煙氣中一些低含量組分的預(yù)測(cè)成為可能,這就大大擴(kuò)展了煙氣組分可預(yù)測(cè)范圍。圖l焦油模型預(yù)測(cè)殘差值與化學(xué)值的散點(diǎn)圖。圖2總粒相物模型交互檢驗(yàn)均方差(a)和決定系數(shù)(b)與隱變量數(shù)的關(guān)系。圖3實(shí)施例1煙堿模型預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)曲線。圖4實(shí)施例2總粒相物模型預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)曲線。圖5實(shí)施例3焦油模型預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)曲線。具體實(shí)施例方式以下具體的實(shí)施方式旨在對(duì)本發(fā)明的做詳細(xì)說(shuō)明,而不是對(duì)本發(fā)明的進(jìn)一步限定。本發(fā)明由以下步驟實(shí)現(xiàn)71、選擇和制備校正樣本集。收集不同產(chǎn)地(如湖南、湖北、云南、貴州、四川、福建、美國(guó)、巴西、津巴布韋等)、不同品種(K326、9511、云85、云87、G80等)、不同等級(jí)(如Bf、C2L、X3F等)、不同年份(如2004年、2005年等)的煙葉樣本300個(gè)左右,片煙制絲,采用德國(guó)HAUNI實(shí)驗(yàn)室用煙草切絲機(jī),平均切絲寬度l.lmm,未膨化,未用添加劑,采用長(zhǎng)沙巻煙廠盒白沙標(biāo)準(zhǔn)輔料巻接,單支重1.00g。按照GB/T19609-2004規(guī)定,將巻煙置于溫度(22±l)'C、相對(duì)濕度(60±2)%的恒溫恒濕箱中平衡48h,進(jìn)行重量和吸阻選擇;在FILTRONASM400型直線式吸煙機(jī)上抽吸,抽吸時(shí)大氣環(huán)境控制(22土2)。C、相對(duì)濕度(60±5)%,抽吸時(shí)間2s,抽吸間隔58s,抽吸容量35mL;抽吸結(jié)束后獲得捕集了煙氣粒相物的劍橋?yàn)V片。2、煙氣化學(xué)組分含量的檢測(cè)。采用國(guó)標(biāo)方法、行業(yè)標(biāo)準(zhǔn)方法或其它傳統(tǒng)方法檢測(cè)煙氣化學(xué)組分釋放量,如煙堿、焦油和總粒相物的檢測(cè),用差重法檢測(cè)總粒相物的釋放量,然后按照YC/T156-2001規(guī)定,將主流煙氣的總粒相物溶解于含有內(nèi)標(biāo)物的萃取劑中,用氣相色譜法測(cè)定萃取液的煙堿和水分含量,從總粒相物中減去煙堿和水分含量即得焦油釋放量。3、采集光譜與建立校正模型。采集巻煙制品經(jīng)抽吸后獲得的捕集了煙氣粒相物的劍橋?yàn)V片后,將劍橋?yàn)V片捕集了粒相物的一側(cè)用低羥基石英片覆蓋,并朝向檢測(cè)口置于檢測(cè)臺(tái)上,濾片上用等直徑壓錘垂直壓實(shí),利用近紅外光譜儀旋轉(zhuǎn)采集劍橋?yàn)V片的近紅外光譜。檢測(cè)儀器為布魯克MPA型傅立葉變換近紅外光譜儀(BRUKEROPTICS公司,德國(guó));檢測(cè)條件為近紅外光譜儀開機(jī)預(yù)熱lh,自檢通過(guò),環(huán)境溫度2(TC25。C,相對(duì)濕度小于70%,采用PbS檢測(cè)器,測(cè)定范圍9000cm"4000cm—1,分辨率8cm—1,掃描次數(shù)64次,背景以金片反射至積分球內(nèi)的信號(hào)為背景,每個(gè)樣本重復(fù)掃描3次,取平均光譜,使用OPUS5.0集成軟件設(shè)置工作參數(shù)和編寫光譜數(shù)據(jù)采集方法。采用OPUS/QUANT-2定量分析軟件進(jìn)行光譜數(shù)據(jù)預(yù)處理,利用化學(xué)計(jì)量學(xué)偏最小二乘法建立劍橋?yàn)V片的近紅外光譜與煙氣化學(xué)組分定量數(shù)據(jù)之間的校正模型。4、模型的優(yōu)化。(一)光譜數(shù)據(jù)的預(yù)處理儀器采集的原始光譜中除包含與樣品組成有關(guān)的信息外,同時(shí)也包含來(lái)自各方面因素所產(chǎn)生的噪聲信號(hào),這些噪聲信號(hào)會(huì)對(duì)譜圖信息產(chǎn)生干擾,光譜的預(yù)處理主要是解決光譜噪聲的濾除、數(shù)據(jù)的篩選、光譜范圍的優(yōu)化及消除其他因素對(duì)譜圖信息的影響。光譜預(yù)處理包括兩個(gè)方面一是噪聲和其他譜圖不規(guī)則影響因素的濾除,如消除隨機(jī)噪聲、樣品背景干擾、測(cè)樣器件引起光譜差異等因素對(duì)校正結(jié)果產(chǎn)生的影響;二是譜圖信息的優(yōu)化,即在上述基礎(chǔ)上對(duì)反映樣品信息突出的光譜區(qū)域進(jìn)行選擇,篩選出最有效的光譜區(qū)域,提高運(yùn)算效率。8對(duì)于第一個(gè)方面,我們利用交互檢驗(yàn)法(crossvalidation—leaveoneout)比較了一階導(dǎo)數(shù)法(firstderivation)、矢量歸一化(vectornormalization)、直線扣除法(straightlinesubtraction)、多元散射校正(multiplicativescatteringcorrection)禾n不進(jìn)行預(yù)處理(nospectraldatapreprocessing)。以煙堿為例,表1我們列出了煙堿模型采用不同光譜預(yù)處理方法所獲得的交互檢驗(yàn)均方差(rootmeansquarederrorofcrossvalidation,RMSECV)。從表1我們可以看到采用一階導(dǎo)數(shù)法進(jìn)行光譜數(shù)據(jù)預(yù)處理具有較小的交互檢驗(yàn)均方差和較少的變量數(shù)(注意到矢量歸一化法和多元散射校正法雖然具有最少的變量數(shù),但交互檢驗(yàn)均方差卻明顯偏大),因此對(duì)煙堿模型我們采用一階導(dǎo)數(shù)法作為光譜數(shù)據(jù)預(yù)處理方法。_表1煙堿模型光譜預(yù)處理方法的選擇_~"預(yù)處理方法交互檢驗(yàn)均方差SI^7ft,392矢量歸一化0.195383直線扣除法0.1774124多元散射校正0.194985不進(jìn)行預(yù)處理0.175110在建模之前,對(duì)建模的光譜信息進(jìn)行選擇,對(duì)減少噪聲信號(hào)的影響,提高運(yùn)算效率和模型的穩(wěn)定性都是有益的。在所檢測(cè)的近紅外光譜區(qū)域中,不同波數(shù)的光譜信息對(duì)于模型的貢獻(xiàn)不同。在某些波數(shù)范圍,雜質(zhì)或千擾的貢獻(xiàn)比較大,且很難通過(guò)現(xiàn)有數(shù)據(jù)處理手段對(duì)特征信息進(jìn)行有效提取,應(yīng)當(dāng)排除在建模波段以外。我們?cè)谶x定的光譜預(yù)處理方法的情況下對(duì)不同波段進(jìn)行偏最小二乘不同隱變量數(shù)的交互檢驗(yàn),通過(guò)檢驗(yàn)結(jié)果確定建模的波段范圍。進(jìn)行波段選擇時(shí),在很多情況下,具有最小交互檢驗(yàn)均方差的波段不見得是最好的模型參數(shù),我們往往還要考慮偏最小二乘隱變量數(shù)。通常,在交互檢驗(yàn)均方差相差不大的情況下,我們盡量選擇具有較小隱變量數(shù)和較寬波段范圍的組合。這是因?yàn)?,在交互檢驗(yàn)均方差相差不大的情況下,較寬的波段范圍將可能包含更多的信息而不會(huì)過(guò)多地?fù)p害模型的預(yù)測(cè)能力,而較小的隱變量數(shù)則更有可能避免過(guò)擬合現(xiàn)象。仍以煙堿為例,從表2中我們可以看到,在8994.5~4246.6cnT1內(nèi)模型的交互檢驗(yàn)均方差雖不是最小,但由于其具有較小的隱變量數(shù)和較寬波段范圍,因此我們?nèi)匀贿x擇這一波段范圍建立初始模型。_表2煙堿模型波段范圍的選擇_變量數(shù)波段范圍(cm—1)交互檢驗(yàn)均M"~~18994.5~6097.9,5453.84246.60.16902108994.5~5449.9,4601.4~4246.60.16993108994.5~7498.0,5453.8~4246.60.17095117501.9~6097.9,5453.8~4246.60.1710由于有些模型采用了導(dǎo)數(shù)類方法作為光譜預(yù)處理方法,而導(dǎo)數(shù)類預(yù)處理方法涉及窗口大小選擇,通常窗口數(shù)據(jù)點(diǎn)過(guò)少,達(dá)不到理想的濾噪效果,窗口過(guò)大,則可能丟失有用的光譜信息。我們?cè)谶x定預(yù)處理方法、波段范圍和最優(yōu)隱變量數(shù)后,對(duì)不同窗口尺寸的交互檢驗(yàn)均方差和決定系數(shù)(coefficientofdetermination)進(jìn)行比較。以煙堿為例,從表3的結(jié)果來(lái)看,最優(yōu)的窗口尺寸為9。表3煙堿模型導(dǎo)數(shù)窗口尺寸的選擇窗口尺寸_決定系數(shù)交互檢驗(yàn)均方差^0.96180.08709謹(jǐn)29謹(jǐn)5S130.96260.0861170.96210.0867210.96230.0865(二)校正模型的優(yōu)化采用偏最小二乘法建立初始模型后,要對(duì)模型進(jìn)行不斷優(yōu)化。對(duì)模型的優(yōu)化過(guò)程是一個(gè)不斷剔除異常點(diǎn)和確定最優(yōu)隱變量數(shù)的過(guò)程。對(duì)于最優(yōu)隱變量數(shù)的選擇,我們可以根據(jù)交互檢驗(yàn)均方差和決定系數(shù)隨變量數(shù)的變化趨勢(shì)來(lái)判斷。對(duì)于異常值的判斷我們使用光譜殘差(spectralresidual)與化學(xué)值預(yù)測(cè)誤差兩個(gè)指標(biāo)分別對(duì)光譜和化學(xué)值進(jìn)行異常值檢驗(yàn)(outliertest)。光譜殘差是指樣本原始光譜與重構(gòu)光譜的殘差,它反映了樣本剩余信息的多少,可用來(lái)檢驗(yàn)光譜異常,尤其是光譜測(cè)量異常和特征峰異常,光譜殘差由下式計(jì)算其中x,.為經(jīng)過(guò)預(yù)處理的原始光譜,、為利用偏最小二乘隱變量重構(gòu)的光譜,Si,.為第/個(gè)樣本的光譜殘差。我們計(jì)算每一個(gè)樣本的光譜殘差與其他樣本光譜殘差均值的比值得到F值巧=IW(2)其中M為樣本數(shù)。如果某樣本光譜不能為偏最小二乘隱變量重構(gòu),則該光譜具有較高的F值。我們可以利用F值計(jì)算F-概率i^,顯著性水平設(shè)定為0.05,若尸/K《",M-7)>ftW,則該樣本可認(rèn)定為光譜異常樣本。這一方法可以理解為,當(dāng)一個(gè)樣本的原始光譜與隱變量重建光譜之間的差異較大時(shí)(由顯著性水平?jīng)Q定),這一樣本的有效光譜信息并未為所建模型充分使用,這標(biāo)志著該樣本可能為離群樣本,故而作為異常樣本予以去除。化學(xué)異常值的判斷我們采用了類似的方法,當(dāng)一個(gè)樣本的預(yù)測(cè)誤差明顯高于其他樣本預(yù)測(cè)誤差的均值時(shí)(F-檢驗(yàn)),可以認(rèn)為該樣本為一化學(xué)測(cè)量值離群樣本。圖1為一焦油模型優(yōu)化過(guò)程去除化學(xué)測(cè)量值異常樣本的例子,在模型拒絕掉點(diǎn)A和B后,模型的參數(shù)明顯變好。拒絕之前,隱變量數(shù)6,決定系數(shù)W為0.9228,交互檢驗(yàn)均方差RMSECV為0.6340,預(yù)測(cè)平均相對(duì)偏差^為2.89%;拒絕之后,隱變量數(shù)6,112為0.9502,RMSECV為0.5038,預(yù)測(cè)平均相對(duì)偏差麗為2.67%。隨著異常樣本的不斷去除和模型的不斷優(yōu)化,模型的最優(yōu)隱變量數(shù)也會(huì)發(fā)生變化。這是因?yàn)槿コ惓颖竞竽P蛷?fù)雜度降低的緣故。確定模型的最優(yōu)隱變量數(shù)我們需要考察交互檢驗(yàn)均方差和決定系數(shù)與隱變量數(shù)的關(guān)系。一般來(lái)說(shuō),交互檢驗(yàn)均方差隨著隱變量數(shù)的增大而降低,決定系數(shù)隨著隱變量數(shù)的增大而增大。當(dāng)交互檢驗(yàn)均方差和決定系數(shù)隨隱變量數(shù)的增大而趨向微小變化時(shí),我們就可以確定模型的最優(yōu)隱變量數(shù)。從圖2和表4中我們可以看到,當(dāng)總粒相物模型隱變量數(shù)達(dá)到8以后,交互檢驗(yàn)均方差和決定系數(shù)不再有明顯的變化,因此確定該模型的隱變量數(shù)為8是合理的。表4總粒相物模型隱變量數(shù)的選擇<table>tableseeoriginaldocumentpage11</column></row><table>(三)模型精密度驗(yàn)證驗(yàn)證所建模型的精密度。選取10個(gè)樣本,對(duì)樣本的重量和吸阻進(jìn)行精密選擇,利用吸煙機(jī)抽吸,同時(shí)采集3張濾片進(jìn)行掃描,用建立的模型對(duì)煙堿進(jìn)行預(yù)測(cè),所得結(jié)果見表5。大部分樣本的預(yù)測(cè)平均偏差不超過(guò)0.01mg,平均相對(duì)偏差不超1%,說(shuō)明模型具有很好的測(cè)量精度。表5煙堿模型精密度實(shí)驗(yàn)("=3)<table>tableseeoriginaldocumentpage12</column></row><table>5、未知樣本煙氣化學(xué)組分的預(yù)測(cè)。對(duì)于未知樣本只需利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,掃描器其近紅外光譜,利用校正模型計(jì)算即可得到未知樣本中相應(yīng)煙氣化學(xué)組分的實(shí)施例1制備320個(gè)單等級(jí)煙葉樣本,利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,并掃描其傅立葉變換近紅外光譜,光譜掃描范圍MOOcm-'-WOOcm-1,取SQg^Scn^^ZAGAcm-1區(qū)域,采用一階導(dǎo)數(shù)法處理近紅外光譜,導(dǎo)數(shù)窗口尺寸為9;按照YC/T156-2001規(guī)定,將主流煙氣的總粒相物溶解于含有內(nèi)標(biāo)物的萃取劑中,用氣相色譜法測(cè)定萃取液的煙堿含量;按本發(fā)明方法利用化學(xué)計(jì)量學(xué)偏最小二乘法建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與煙堿定量數(shù)據(jù)之間的校正模型,并通過(guò)交互檢驗(yàn)法以及對(duì)光譜殘差和化學(xué)組分預(yù)測(cè)殘差的F檢驗(yàn)優(yōu)化模型,得到含有300個(gè)樣本的校正模型,如圖3所示,預(yù)測(cè)值與實(shí)測(cè)值吻合較好,樣品比較集中地分布在中心線附近,煙堿預(yù)測(cè)值與化學(xué)實(shí)測(cè)值的偏差分布在i0.2mg之間,模型的決定系數(shù)為0.9629,交互檢驗(yàn)均方差為0.0858,隱變量數(shù)為6,校正集樣本預(yù)測(cè)平均相對(duì)偏差為2.67%,預(yù)測(cè)范圍為0.4255mg3.100mg。為了驗(yàn)證模型的實(shí)際預(yù)測(cè)能力,我們以市售巻煙40個(gè)品牌的巻煙樣品作為獨(dú)立樣本集,用建立的模型進(jìn)行預(yù)測(cè),將所得到的數(shù)據(jù)與國(guó)標(biāo)方法測(cè)定的數(shù)據(jù)相比較,結(jié)果見表6。從表6可以看出,大部分樣本煙堿的預(yù)測(cè)偏差在i0.05mg以內(nèi),與實(shí)測(cè)值的平均相對(duì)偏差為1.99%,說(shuō)明模型具有很好的預(yù)測(cè)能力。表6成品煙煙堿的模型預(yù)測(cè)值與實(shí)測(cè)值的比較<table>tableseeoriginaldocumentpage13</column></row><table>實(shí)施例2制備320個(gè)單等級(jí)煙葉樣本,利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,并掃描其傅立葉變換近紅外光譜,光譜掃描范圍MOOcn^-WOOcm-1,取SSQlScn^^SAG^cm-1區(qū)域,光譜均值中心化;用差重發(fā)測(cè)定總粒相物含量;按本發(fā)明方法利用化學(xué)計(jì)量學(xué)偏最小二乘法建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與總粒相物定量數(shù)據(jù)之間的校正模型,并通過(guò)交互檢驗(yàn)法以及對(duì)光譜殘差和化學(xué)組分預(yù)測(cè)殘差的F檢驗(yàn)優(yōu)化模型,得到含有306個(gè)樣本的校正模型,如圖4所示,總粒相物預(yù)測(cè)值與化學(xué)實(shí)測(cè)值的偏差分布在士1.0mg之間,預(yù)測(cè)值與實(shí)測(cè)值吻合較好,樣品比較集中地分布在中心線附近,模型的決定系數(shù)為0.9759,交互檢驗(yàn)均方差為0.4613,隱變量數(shù)為8,校正集樣本預(yù)測(cè)平均相對(duì)偏差為1.96%,預(yù)測(cè)范圍為9.169mg~27.24mg。為了驗(yàn)證模型的實(shí)際預(yù)測(cè)能力,我們以市售巻煙40個(gè)品牌的巻煙樣品作為獨(dú)立樣本集,用建立的模型進(jìn)行預(yù)測(cè),將所得到的數(shù)據(jù)與國(guó)標(biāo)方法測(cè)定的數(shù)據(jù)相比較,結(jié)果見表7。從表7可以看出,大部分樣本總粒相物的預(yù)測(cè)偏差在士1.00mg以內(nèi),與實(shí)測(cè)值的平均相對(duì)偏差為3.67%,說(shuō)明模型具有很好的預(yù)測(cè)能力。表7成品煙總粒相物的模型預(yù)測(cè)值與實(shí)測(cè)值的比較樣品號(hào)實(shí)測(cè)值預(yù)測(cè)值偏差樣品號(hào)實(shí)測(cè)值預(yù)測(cè)值偏差119.950019.9430-0.00702115.275014.3050-0.9700215.175015.31000.13502215.700016.71601.0160317.625017.5050-0.12002319.975019.4160-0.5590416.750016.3590-0.39102416.650016.87000.2200514.400014.66800.26802516.375017,06400.6890616.725017.14400.41902617.800016.9190-0.8810717.850017.99100.14102715.725014.7120-1.0130817.525017.91400.38902817.250017.66200.4120917.225017.87700.65202919.825018.7380-1.08701016.450015.9860-0.46403017.200016.4890-0.71101120.400020.50600.10603117.450018.27100.82101217細(xì)017.02300.02303215.600015.84700.24701315.475015.64600.17103318.550018.71300.16301417.950018.74400.79403414.700012.8130-1.88701515.875017.12901.25403515.425015.0830-0.34201614.325014.48200.15703614.350015.09200.74201719.700019.4280-0.27203717.375017.80500.43001816.575017.72301,14803813.150013.91800.76801914.675015.74801.07303916.525015.0870-1.43802013.600014.18500.58504016.325015.5050-0.8200實(shí)施例3制備320個(gè)單等級(jí)煙葉樣本,利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,并掃描其傅立葉變換近紅外光譜,光譜掃描范圍9000cn^4000cm'1,取8994.5cm"4246.6cnf1區(qū)域,光譜均值中心化;按照YC/T156-2001規(guī)定,將主流煙氣的總粒相物溶解于含有內(nèi)標(biāo)物的萃取劑中,用氣相色譜法測(cè)定萃取液的煙堿和水分含量,從總粒相物中減去煙堿和水分含量即得焦油釋放量;按本發(fā)明方法利用化學(xué)計(jì)量學(xué)偏最小二乘法建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與焦油定量數(shù)據(jù)之間的校正模型,并通過(guò)交互檢驗(yàn)法以及對(duì)光譜殘差和化學(xué)組分預(yù)測(cè)殘差的F檢驗(yàn)優(yōu)化模型,得到含有278個(gè)樣本的校正模型,如圖5所示,預(yù)測(cè)值與實(shí)測(cè)值吻合較好,焦油預(yù)測(cè)值與化學(xué)實(shí)測(cè)值的偏差分布在il.Omg之間,模型的決定系數(shù)為0.9502,交互檢驗(yàn)均方差為0.5038,隱變量數(shù)為6,校正集樣本預(yù)測(cè)平均相對(duì)偏差為3.91%,預(yù)測(cè)范圍為146.974mg21.36mg。為了驗(yàn)證模型的實(shí)際預(yù)測(cè)能力,我們以市售巻煙40個(gè)品牌的巻煙樣品作為獨(dú)立樣本集,用建立的模型進(jìn)行預(yù)測(cè),將所得到的數(shù)據(jù)與國(guó)標(biāo)方法測(cè)定的數(shù)據(jù)相比較,結(jié)果見表8。從表8可以看出,大部分樣本總粒相物的預(yù)測(cè)偏差在土1.0mg以內(nèi),與實(shí)測(cè)值的平均相對(duì)偏差為2.60%,說(shuō)明模型具有很好的預(yù)測(cè)能力。表8成品煙總粒相物的模型預(yù)測(cè)值與實(shí)測(cè)值的比較樣品號(hào)實(shí)測(cè)值預(yù)測(cè)值偏差樣品號(hào)實(shí)測(cè)值預(yù)測(cè)值偏差116.110015.8240-0.28602112.615011.7320-0.8830212.495012.1570-0.33802212.960013.17800.2180314.105014.20600.10102315.855015.2610-0.5940413.480013.66400.18402413.150013.82100.6710512.130011.7880-0.34202513.505013.54900.0440613.385013.63800.25302614.300013.3420-0.9580714.440014.1070-0.33302712.525011.8960-0.6290814.455014.4170-0.03802813.950013.8220-0.1280914.575014.3230-0.25202915.695015.1970-0.49801013.320013.1950-0.12503013.870013.4650-0.40501116.290016.49600.20603114.030014.71100.68101213細(xì)013.3920-0.46803212.970013.17700.20701312.595012.1250-0.47003314.370014.45400細(xì)01414.380014.74900.36903411.120010.7390-0.38101513.135013.39100.25603512.705012.2820-0.42301611.885011.8310-0.05403611.960012.40200.44201715.710015.5070-0.20303713.495013.4100-0.08501813.325013.58800.26303810.690011.30900.61901911.635011.4810-0.15403912.545012.4210-0.12402011.510011.3470-0.16304013.365012.4990-0.8660偏最小二乘法的應(yīng)用理論偏最小二乘(PLS)法是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,該算法可同時(shí)實(shí)現(xiàn)回歸建模、數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化以及兩組變量之間的相關(guān)性分析,可以較好的解決許多以往用普通多元回歸無(wú)法解決的問(wèn)題。偏最小二乘回歸的主要目的是要建立一個(gè)線性模型Y-XB+E(3)其中Y為M個(gè)樣本、7V個(gè)組分的響應(yīng)矩陣,X為M個(gè)樣本、J個(gè)波長(zhǎng)的光譜矩陣,B為回歸系數(shù)矩陣,E為噪聲矩陣,與Y具有相同的維數(shù)。在通常情況下,矩陣X和Y被標(biāo)準(zhǔn)化后再用于計(jì)算,即減去它們的平均值并除以標(biāo)準(zhǔn)偏差。首先構(gòu)造光譜矩陣X的列隱變量15T=XW(4)則響應(yīng)矩陣Y可由T表出Y=TP+F(5)其中F為誤差矩陣,且P-T+Y,將式(4)代入式(5),有Y=XWP(6)所以有B=WP(7)對(duì)于未知樣本,由未知樣本的光譜矩陣X^利用式(7)和式(3)即可求出。評(píng)價(jià)校正模型的參數(shù)-(1)決定系數(shù)R2(coefficientofdetermination)i、1-、2(8)其中艦=2>^]2(9)Res為擬合值與真實(shí)值殘差。及2越接近1,表示校正模型預(yù)測(cè)值與真實(shí)值越接近,i2=l,則說(shuō)明預(yù)測(cè)值與真實(shí)值完全相符;^可以為負(fù)值,當(dāng)隱變量數(shù)較小時(shí),擬合殘差有可能大于真實(shí)值方差,此時(shí)^為負(fù)值,說(shuō)明擬合效果很差。(2)交互檢驗(yàn)均方差(RMSECV,rootmeansquareerrorofcrossvalidation)及M腿Cr=、^jf;("晚r,)2(10)其中Z)欲^,為交互檢驗(yàn)預(yù)測(cè)值與真實(shí)值之間的殘差,iMSSCF越小,則模型的預(yù)測(cè)精度越高。(3)F概率"ro6,:^-(11)如果FPrc^-0,說(shuō)明該樣本為異常樣本的概率為0;如果FPro6,=1,說(shuō)明該樣本為異常樣本的概率為100%。1權(quán)利要求1.一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征在于首先選擇和制備校正樣本集,收集不同產(chǎn)地、不同品種、不同等級(jí)、不同年份、不同品牌的卷煙樣本,通過(guò)吸煙機(jī)抽吸,獲得捕集了煙氣粒相物的劍橋?yàn)V片;然后將劍橋?yàn)V片捕集了粒相物的一側(cè)用低羥基石英片覆蓋,壓實(shí);對(duì)捕集了煙氣粒相物的劍橋?yàn)V片直接進(jìn)行近紅外光譜檢測(cè);同時(shí),采用傳統(tǒng)常規(guī)方法檢測(cè)煙氣化學(xué)組分含量;利用化學(xué)計(jì)量學(xué)多元校正技術(shù)建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與煙氣化學(xué)組分定量數(shù)據(jù)之間的校正模型,并進(jìn)行校正模型的優(yōu)化;對(duì)于未知樣本只需利用吸煙機(jī)獲得捕集了煙氣粒相物的劍橋?yàn)V片,并掃描其近紅外光譜,利用校正模型計(jì)算即可得到未知樣本中相應(yīng)煙氣化學(xué)組分的含量。2.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是利用低羥基石英片覆蓋劍橋?yàn)V片捕集了粒相物的一側(cè),并朝向檢測(cè)口置于檢測(cè)臺(tái)上,濾片上用等直徑壓錘垂直壓實(shí),利用近紅外光譜儀旋轉(zhuǎn)采集劍橋?yàn)V片的近紅外光譜。3.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是利用化學(xué)計(jì)量學(xué)偏最小二乘法建立捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜與煙氣化學(xué)組分定量數(shù)據(jù)之間的校正模型。4.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是近紅外光譜的波段范圍為9000cm"4000cm—1中的一段或數(shù)段。5.根據(jù)權(quán)利要求1或4所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是光譜掃描范圍9000cm"4000cm",取8994.5cm"4246.6cm-1區(qū)域。6.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是在建立校正模型之前對(duì)近紅外光譜進(jìn)行預(yù)處理,所述的預(yù)處理的方法包括均值中心化、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、矢量歸一化、直線扣除法、多元散射校正中的一種或幾種組合。7.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是校正模型采用交互檢驗(yàn)法以及對(duì)光譜殘差和化學(xué)組分預(yù)測(cè)殘差的F檢驗(yàn)進(jìn)行模型優(yōu)化和異常樣本診斷。8.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是所述的巻煙樣本為單料煙。9.根據(jù)權(quán)利要求1所述的一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,其特征是所述的煙氣化學(xué)組分包括煙堿、焦油和總粒相物。全文摘要一種基于捕集了煙氣粒相物的劍橋?yàn)V片的傅立葉變換近紅外光譜技術(shù)快速預(yù)測(cè)煙氣中化學(xué)組分含量的方法,可實(shí)現(xiàn)煙氣中各種化學(xué)組分的快速測(cè)定。首先選擇和制備卷煙樣本,利用吸煙機(jī)抽吸獲得捕集了煙氣粒相物的劍橋?yàn)V片;然后采集劍橋?yàn)V片的傅立葉變換近紅外光譜,同時(shí)采用傳統(tǒng)方法測(cè)定煙氣化學(xué)組分含量;最后應(yīng)用化學(xué)計(jì)量學(xué)多元校正技術(shù)建立劍橋?yàn)V片的近紅外光譜與煙氣化學(xué)組分定量數(shù)據(jù)之間的校正模型,并對(duì)模型進(jìn)行優(yōu)化。對(duì)未知卷煙產(chǎn)品的捕集了煙氣粒相物的劍橋?yàn)V片采集近紅外光譜,利用校正模型計(jì)算即可獲得未知樣本中相應(yīng)煙氣化學(xué)組分的含量。與傳統(tǒng)方法相比,該方法具有樣品制備簡(jiǎn)單、可多組分同時(shí)檢測(cè)、速度快、安全、成本低、環(huán)境友好等特點(diǎn)。文檔編號(hào)G01N21/17GK101498658SQ20091004243公開日2009年8月5日申請(qǐng)日期2009年1月6日優(yōu)先權(quán)日2009年1月6日發(fā)明者劉建福,文杜,王志國(guó),錢曉春,銀董紅申請(qǐng)人:湖南中煙工業(yè)有限責(zé)任公司