一種混合k調(diào)和聚類的蘋果品種近紅外光譜分類方法
【專利摘要】本發(fā)明公開了一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法,其包括以下步驟:(1)蘋果樣本近紅外光譜采集;(2)對蘋果樣本近紅外光譜進行降維處理;(3)用混合K調(diào)和聚類方法進行蘋果品種的分類。本發(fā)明具有檢測速度快,分類準確率高,分類效率高,對蘋果不造成損壞等優(yōu)點??蓪崿F(xiàn)蘋果品種的正確分類。
【專利說明】一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法
【技術領域】
[0001]本發(fā)明涉及一種蘋果品種分類方法,具體涉及一種基于混合K調(diào)和聚類方法和近紅外光譜技術的蘋果品種分類方法。
【背景技術】
[0002]蘋果是人們經(jīng)常食用的水果之一。蘋果果實里包含了一些與健康和感官有關的成分,包括單糖、礦物質、膳食纖維和各種生活性物質,如維生素C和酚類化合物。不同品種的蘋果其內(nèi)部的糖度,酸度和可溶性固形物等是不相同的。即蘋果品種不同,其內(nèi)部品質是不同的。所以,優(yōu)選好的品種的蘋果是農(nóng)業(yè)科技人員的重要任務。
[0003]近紅外光譜技術是利用物質對光的吸收、散射、反射和透射等特性來確定其成分含量的一種非破壞性檢測技術。近紅外光譜技術具有非破壞性檢測,檢測速度快,可同時檢測多種成分等優(yōu)點。近紅外光譜射向蘋果后得到漫反射光譜,在不同品種的蘋果上獲得的漫反射光譜是不同的,利用這個原理,可以將不同品種的蘋果區(qū)分開來,即實現(xiàn)不同品種蘋果的分類。
[0004]K調(diào)和均值聚類是一種無監(jiān)督的學習方法,是一種基于中心的迭代聚類方法。K調(diào)和均值聚類將所有數(shù)據(jù)點到每個聚類中心的調(diào)和平均值的和作為聚類的目標函數(shù)。K均值聚類對初始聚類中心敏感,而由于提升函數(shù)的作用使K調(diào)和均值聚類對初始聚類中心不敏感。另外一方面,K調(diào)和均 值聚類容易陷入局部極小點。為了解決這個問題,一些學者提出了一些改進算法,比如=Yang等人提出一種粒子群優(yōu)化的K調(diào)和均值聚類方法(PS0KHM),PSOKHM能避免局部極小點,并且解決了粒子群優(yōu)化收斂速度慢問題。Jiang等人提出一種基于蟻群聚類的K調(diào)和均值聚類方法。在給定初始溫度值后模擬退火用來搜尋一些空間分子的平衡狀態(tài),它是一種求解組合優(yōu)化問題的方法。GUng^r和Onler在模擬退火和K調(diào)和均值聚類基礎上提出一種新的聚類算法以求得K調(diào)和均值聚類的全局最優(yōu)解。Gilng0r和Cnler利用禁忌搜索方法提出禁忌K調(diào)和均值聚類方法,該方法解決了 K調(diào)和均值聚類的局部極小點問題。但是,K調(diào)和均值聚類還存在著對噪聲敏感的問題。因為K調(diào)和均值聚類建立在可能性約束條件基礎上,K調(diào)和均值聚類使數(shù)據(jù)點在所有類中的隸屬度之和為I??赡苄约s束條件避免了所有隸屬度為O的平凡解,但是造成了 K調(diào)和均值聚類對噪聲敏感。為了解決K調(diào)和均值聚類對噪聲敏感的問題,本發(fā)明提出一種混合調(diào)和聚類方法。
[0005]近紅外光譜技術作為一種無損、快速的檢測方法,已被廣泛用于農(nóng)產(chǎn)品和食品檢測領域。目前,在應用近紅外光譜技術分類水果時對近紅外光譜的分類方法主要有軟獨立模式分類(SMCA),偏最小二乘判別分析(PLSDA),人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVM)、K-近鄰法(KNN)等方法。這些方法屬于有監(jiān)督的學習方法,即它們需要學習樣本來獲取先驗知識。在沒有學習樣本,或者學習樣本比較少的情況下運用以上方法進行水果分類時會導致分類準確率低而難以實現(xiàn)水果的正確分類。為解決這個問題,本發(fā)明應用提出的一種混合調(diào)和聚類方法進行蘋果品種的分類,屬于無監(jiān)督的蘋果品種分類方法。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的是在于克服現(xiàn)有技術存在的上述缺陷,提供一種運用近紅外漫反射光譜技術和一種混合K調(diào)和聚類方法的蘋果品種分類方法,具有檢測速度快,分類準確率高,無需學習樣本,對蘋果不造成損壞等優(yōu)點。
[0007]本發(fā)明依據(jù)的原理:研究表明,蘋果的近紅外漫反射光譜包含了蘋果內(nèi)部的糖度,酸度和可溶性固形物等內(nèi)部品種信息,不同品種的蘋果所對應的近紅外漫反射光譜也不同。運用主成分分析壓縮不同品種蘋果的近紅外光譜數(shù)據(jù)。再根據(jù)一種混合調(diào)和聚類方法將不同品種蘋果進行分類。
[0008]根據(jù)上述原理,采用的技術方案包括以下步驟:
步驟一、蘋果樣本近紅外光譜采集:針對不同品種的蘋果樣本,用近紅外光譜儀對這些蘋果樣本投射近紅外,獲取蘋果樣本的近紅外漫反射光譜信息,將光譜信息存儲在計算機里。實驗過程中,盡量保持室內(nèi)的溫度和濕度基本一致。
[0009]步驟二、對蘋果樣本近紅外光譜數(shù)據(jù)進行壓縮:將蘋果樣本近紅外光譜采用主成分分析方法(PCA)進行壓縮。
[0010]步驟三、用一種混合K調(diào)和聚類方法進行蘋果品種的分類:運行一種混合K調(diào)和聚類方法得到模糊隸屬度和典型值,根據(jù)模糊隸屬度和典型值可將不同品種蘋果進行分類。
[0011]所述步驟一中近紅外漫反射光譜信息是指光譜的波數(shù)范圍為lOOOOlOOOcnT1,采集到每個蘋果樣本的光譜是1557維的數(shù)據(jù)。
[0012]所述步驟二中用主成分分析方法進行降維時,在滿足主成分的累計可信度≥98%條件下選取主成分個數(shù)。
[0013]所述步驟三中的一種混合K調(diào)和聚類方法方法如下:
1.初始化
(1)確定類別數(shù)樣本數(shù)/7和權重指數(shù)》和『的值,且滿足n>k>l,+ OO ym, ;設置迭代次數(shù)初始值r =0和最大迭代次數(shù)為rmax ;設置迭代最大誤差參數(shù)ε ;
(2)確定聚類的初始類中心;
(3)計算樣本的協(xié)方差¥:
【權利要求】
1.一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法,具體包括如下步驟: (1)蘋果樣本近紅外光譜采集:針對不同品種的蘋果樣本,用近紅外光譜儀對這些蘋果樣本投射近紅外,獲取蘋果樣本的近紅外漫反射光譜信息,將光譜信息存儲在計算機里; (2)對蘋果樣本近紅外光譜數(shù)據(jù)進行壓縮:將蘋果樣本近紅外光譜采用主成分分析方法進行壓縮; (3)用一種混合K調(diào)和聚類方法進行蘋果品種的分類:運行一種混合K調(diào)和聚類方法得到模糊隸屬度和典型值,根據(jù)模糊隸屬度和典型值將不同品種蘋果進行分類。
2.根據(jù)權利要求1所述的一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法,其特征在于:所述步驟(1)中,保持室內(nèi)的溫度和濕度一致。
3.根據(jù)權利要求1所述的一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法,其特征在于:所述步驟(1)中,近紅外漫反射光譜信息是指光譜的波數(shù)范圍為lOOOOlOOOcnT1,采集到每個蘋果樣本的光譜是1557維的數(shù)據(jù)。
4.根據(jù)權利要求1所述的一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法,其特征在于:所述步驟(2)中,用主成分分析方法進行降維時,在滿足主成分的累計可信度≥98%條件下選取主成分個數(shù)。
5.根據(jù)權利要求1所述的一種混合K調(diào)和聚類的蘋果品種近紅外光譜分類方法,其特征在于:所述步驟(3)中,所述一種混合K調(diào)和聚類方法的具體步驟為: A、初始化: a、確定類別數(shù)I樣本數(shù)/?和權重指數(shù)》和PF的值,且滿足/?>左>1,+00 >m,w>l ;設置迭代次數(shù)初始值r =0和最大迭代次數(shù)為rmax ;設置迭代最大誤差參數(shù)ε ; b、確定聚類的初始類中心; C、計算樣本的協(xié)方差滬:
【文檔編號】G01N21/359GK103954582SQ201410143595
【公開日】2014年7月30日 申請日期:2014年4月11日 優(yōu)先權日:2014年4月11日
【發(fā)明者】武小紅, 武斌, 孫俊, 李敏 申請人:江蘇大學