專(zhuān)利名稱(chēng):使用得出的參量進(jìn)行圖象分類(lèi)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖象處理領(lǐng)域,具體地,涉及用于圖象分類(lèi)的圖案識(shí)別。
圖案識(shí)別技術(shù)常常被使用對(duì)圖象或部分圖象分類(lèi)。用于分類(lèi)的圖案識(shí)別的具體的應(yīng)用是制造物品的“視覺(jué)”監(jiān)視。傳統(tǒng)上,監(jiān)視人員在制造的不同階段觀察物品,查找制造誤差的警告證據(jù)。這種分階段方法被使用來(lái)在由繼續(xù)進(jìn)行有缺陷的物品制造而引起以后的花費(fèi)以前識(shí)別有缺陷的物品,和/或在缺陷的維修可經(jīng)濟(jì)地實(shí)行的階段識(shí)別缺陷??偠灾?,缺陷檢測(cè)和校正的花費(fèi)隨每個(gè)處理步驟而指數(shù)地增加。
視覺(jué)監(jiān)視的具體的例子是在制造顯示器件,諸如陰極射線管(CRT)時(shí)。CRT的制造是多個(gè)步驟的過(guò)程。各種材料層在管子被密封和抽真空之前被施加到顯示器表面的內(nèi)部。在施加任何材料層時(shí)的關(guān)鍵缺陷會(huì)使得CRT不適合于銷(xiāo)售,所以在管子被密封以前實(shí)行監(jiān)視程序過(guò)程來(lái)識(shí)別這樣的缺陷。通常,關(guān)鍵缺陷是可以通過(guò)“不進(jìn)行”后面的制造步驟,并返回到引起關(guān)鍵缺陷的步驟而被校正。在CRT處理過(guò)程中,可以去除材料層,或可以在施加下一層以前校正缺陷。另外,如果引起缺陷的制造過(guò)程中的誤差是系統(tǒng)性的,而不是隨機(jī)性的,則快速識(shí)別缺陷可以使得由這種系統(tǒng)性誤差產(chǎn)生的隨后的物品數(shù)目最小化。制造誤差常常產(chǎn)生視覺(jué)上明顯的異常結(jié)構(gòu),它具有的特征可被使用來(lái)識(shí)別由異常結(jié)構(gòu)造成的特定的制造誤差。在CRT例子中,內(nèi)部的部件之一是“多孔障板”,它在屏幕上具有相應(yīng)于每個(gè)象素位置的一個(gè)孔,電子束在撞擊到相應(yīng)于每個(gè)象素的想要的顏色內(nèi)容的發(fā)光的紅色、綠色和藍(lán)色熒光點(diǎn)之前穿過(guò)這個(gè)孔行進(jìn)。多孔障板上的缺陷在視覺(jué)上呈現(xiàn)為覆蓋所有三個(gè)熒光點(diǎn)的異常結(jié)構(gòu)。如果三個(gè)相鄰的紅色、綠色、藍(lán)色點(diǎn)位置基本上比周?chē)狞c(diǎn)更模糊,則多半是多孔障板上的相應(yīng)的孔被遮擋,以及可以在進(jìn)行其它的制造步驟(這會(huì)使得校正難以經(jīng)濟(jì)地實(shí)行)以前采取適當(dāng)?shù)男U源胧?,清除遮擋物。帶有不同的視覺(jué)特征的異常結(jié)構(gòu)暗示其它類(lèi)別的缺陷,以及不同的校正性措施典型地被施加來(lái)校正每種類(lèi)型的缺陷。缺陷分類(lèi)任務(wù)的自動(dòng)化可以通過(guò)處理屏幕圖象來(lái)搜索對(duì)于每種缺陷類(lèi)別的特征圖案,諸如三個(gè)相鄰的模糊點(diǎn),而被實(shí)施。
圖案識(shí)別的另一個(gè)應(yīng)用是圖象的分類(lèi),用于以后的恢復(fù)。例如,可以把美術(shù)展覽中每個(gè)圖畫(huà)分類(lèi)為肖像畫(huà),風(fēng)景畫(huà),圖形,海景等等。分類(lèi)任務(wù)的自動(dòng)化可以包括,例如,掃描圖畫(huà)檢測(cè)到中心的大面積的淺色(肖像畫(huà)),上部的大的面積的藍(lán)色和/或下面是白色帶有一點(diǎn)藍(lán)色含量(風(fēng)景畫(huà)),等等。邊緣檢測(cè)和邊緣特征處理也常常被使用來(lái)分類(lèi)圖象的內(nèi)容。
各種各樣的技術(shù)可被提供來(lái)根據(jù)特征圖案分類(lèi)圖象。如上所述,相應(yīng)于每種分類(lèi)可以規(guī)定一些算法、或法則,諸如“如果3個(gè)相鄰的模糊點(diǎn),則多孔障板有缺陷”,或“如果上部的區(qū)域是藍(lán)色以及下部區(qū)域不是藍(lán)色,則是風(fēng)景畫(huà)”,等等。當(dāng)對(duì)于每種分類(lèi)可以確定一組法則時(shí),這樣的系統(tǒng)是可行的。用于每種分類(lèi)的法則必須足夠?qū)挘员惆菝糠N分類(lèi)內(nèi)特征圖案的可能的范圍,然而不要太寬到包括不正確地屬于每個(gè)類(lèi)別內(nèi)的圖象。
作為需要特定的規(guī)則的、基于法則的系統(tǒng)的替換例,通常采用學(xué)習(xí)系統(tǒng)來(lái)根據(jù)每種分類(lèi)的代表性樣本展開(kāi)特征處理。通常采用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)施這樣的學(xué)習(xí)系統(tǒng)。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)包括一個(gè)或多個(gè)輸入節(jié)點(diǎn),一個(gè)或多個(gè)輸出節(jié)點(diǎn),以及單個(gè)中間的(或隱藏的)節(jié)點(diǎn),它們被安排在輸入與輸出節(jié)點(diǎn)之間的一系列層中。在通常的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,每個(gè)輸入節(jié)點(diǎn)被連接到在第一層節(jié)點(diǎn)的每個(gè)隱藏的節(jié)點(diǎn),第一層節(jié)點(diǎn)的每個(gè)隱藏節(jié)點(diǎn)被連接到第二層節(jié)點(diǎn)的每個(gè)隱藏的節(jié)點(diǎn),等等,直至最后一層節(jié)點(diǎn)的每個(gè)隱藏節(jié)點(diǎn)被連接到每個(gè)輸出節(jié)點(diǎn)為止。每個(gè)節(jié)點(diǎn)的輸出是加到節(jié)點(diǎn)的每個(gè)輸入加權(quán)的組合函數(shù)。在前饋神經(jīng)網(wǎng)絡(luò)中,當(dāng)一組輸入值被加到輸入節(jié)點(diǎn)時(shí),加權(quán)值被傳播到網(wǎng)絡(luò)的每個(gè)層,直至產(chǎn)生結(jié)果的一組輸出值為止。節(jié)點(diǎn)、互聯(lián)、和結(jié)果傳播的其它結(jié)構(gòu)配置也是通用的。
在學(xué)習(xí)模式時(shí),結(jié)果的一組輸出值與適當(dāng)?shù)赜?xùn)練的網(wǎng)絡(luò)產(chǎn)生的一組輸出值進(jìn)行比較,給出與每個(gè)輸出節(jié)點(diǎn)有關(guān)的誤差因子。在用于分類(lèi)的圖案匹配的情況下,每個(gè)輸出節(jié)點(diǎn)可以相應(yīng)于一個(gè)特定的類(lèi)別。相應(yīng)于一組輸入值的真實(shí)類(lèi)別的輸出節(jié)點(diǎn)應(yīng)當(dāng)具有大的輸出值,而不正確的類(lèi)別輸出值應(yīng)當(dāng)具有低的數(shù)值。誤差因子被傳播回網(wǎng)絡(luò),以便修改加到每個(gè)節(jié)點(diǎn)的每個(gè)輸入的加權(quán)量,以使得誤差因子的組合值最小化。觀念上,貢獻(xiàn)到不正確類(lèi)別的輸出的節(jié)點(diǎn)加權(quán)量被減小,而貢獻(xiàn)到正確類(lèi)別的輸出的節(jié)點(diǎn)加權(quán)量被增加。
此后,下一組輸入值被加上調(diào)整的加權(quán)量,誤差因子被重新計(jì)算,以及加權(quán)量被重新調(diào)整。這個(gè)處理過(guò)程對(duì)于每組被使用來(lái)進(jìn)行訓(xùn)練的輸入值重復(fù)進(jìn)行,然后,這個(gè)處理過(guò)程重復(fù)進(jìn)行固定次數(shù)的疊代,或直至以后的疊代表明收斂到正確的類(lèi)別為止,或直至達(dá)到某個(gè)其它的終結(jié)的準(zhǔn)則為止。一旦加權(quán)量組被確定,最終的網(wǎng)絡(luò)可被使用來(lái)通過(guò)從其它的物品的每個(gè)物品提供相應(yīng)的一組輸入值,和選擇具有最高的輸出節(jié)點(diǎn)值的類(lèi)別,而分類(lèi)其它的物品(不是訓(xùn)練組的一部分的物品)。應(yīng)當(dāng)指出,對(duì)加權(quán)量的反饋修改的幅度被選擇為在過(guò)校正與欠校正之間的平衡。對(duì)于每個(gè)訓(xùn)練輸入值的加權(quán)量的過(guò)校正會(huì)導(dǎo)致阻礙收斂的、加權(quán)值的振蕩;對(duì)于每個(gè)訓(xùn)練輸入值的加權(quán)量的欠校正可能需要為達(dá)到收斂的過(guò)多的疊代,或可能收斂到本地最小值。加權(quán)值的修改的幅度對(duì)于網(wǎng)絡(luò)的每一層可以是不同的。
對(duì)于給定的問(wèn)題組的神經(jīng)網(wǎng)絡(luò)的性能取決于各種各樣因素,包括網(wǎng)絡(luò)層的數(shù)目、每層中隱藏節(jié)點(diǎn)數(shù)目、加權(quán)調(diào)整因子等等。給定特定的網(wǎng)絡(luò)因子組,或網(wǎng)絡(luò)結(jié)構(gòu)以后,不同的問(wèn)題組將不同地執(zhí)行。也就是,用于根據(jù)圖案識(shí)別進(jìn)行分類(lèi)的神經(jīng)網(wǎng)絡(luò)的性能將取決于神經(jīng)網(wǎng)絡(luò)的選擇的結(jié)構(gòu)和與這種結(jié)構(gòu)有關(guān)的各種因素。同樣地,其它圖案識(shí)別系統(tǒng)(諸如基于法則的系統(tǒng))的性能將取決于對(duì)于識(shí)別過(guò)程所選擇的特定的參量。
本發(fā)明的一個(gè)目的是提供不需要事前規(guī)定法則的圖象分類(lèi)系統(tǒng)。本發(fā)明的另一個(gè)目的是提供不需要事前規(guī)定特定的學(xué)習(xí)系統(tǒng)結(jié)構(gòu)的圖象分類(lèi)系統(tǒng)。
這些目的和其它目的可以通過(guò)提供漸近的算法來(lái)達(dá)到,它提供用于圖象分類(lèi)系統(tǒng)的替換的結(jié)構(gòu)和參量。在優(yōu)選實(shí)施例中,采用一個(gè)學(xué)習(xí)系統(tǒng),以及在學(xué)習(xí)系統(tǒng)的訓(xùn)練時(shí)間間隔期間,得出學(xué)習(xí)系統(tǒng)的結(jié)構(gòu),以便創(chuàng)建很適合于特定的分類(lèi)問(wèn)題組的學(xué)習(xí)系統(tǒng)。同樣地,通過(guò)漸近算法(包括實(shí)施圖象特征化,進(jìn)行學(xué)習(xí)和分類(lèi)的算法)得出圖象分類(lèi)系統(tǒng)的其它參量。初始的參量組和結(jié)構(gòu)組被使用來(lái)創(chuàng)建一組嘗試分類(lèi)系統(tǒng)。多個(gè)預(yù)先分類(lèi)的估值圖象然后被加到每個(gè)系統(tǒng),以及用于每個(gè)測(cè)試事例的每個(gè)系統(tǒng)的結(jié)果的分類(lèi)與每個(gè)測(cè)試事例的正確的分類(lèi)進(jìn)行比較。根據(jù)較好的執(zhí)行分類(lèi)系統(tǒng)的參量和結(jié)構(gòu)得出以后的嘗試的分類(lèi)系統(tǒng)。最好地執(zhí)行的分類(lèi)系統(tǒng)然后被選擇為生產(chǎn)分類(lèi)系統(tǒng),用于分類(lèi)新的圖象。
現(xiàn)在參照附圖,通過(guò)實(shí)例,更詳細(xì)地說(shuō)明本發(fā)明,其中
圖1顯示按照本發(fā)明的圖象分類(lèi)系統(tǒng)的示例性方框圖。
圖2顯示用于按照本發(fā)明的圖象分類(lèi)系統(tǒng)的訓(xùn)練系統(tǒng)的示例性方框圖。
圖3顯示被包括在按照本發(fā)明的圖象分類(lèi)系統(tǒng)中的制造系統(tǒng)的示例性方框圖。
圖1顯示按照本發(fā)明的圖象分類(lèi)系統(tǒng)100的示例性方框圖。圖象分類(lèi)系統(tǒng)100包括圖象處理器110,圖案匹配器120,和分類(lèi)器130,每個(gè)可以從漸近算法150接收參量,正如下面進(jìn)一步討論的。
圖象處理器110處理圖象,產(chǎn)生一組描述圖象的圖象特征111。在技術(shù)上通??商峁└鞣N各樣的技術(shù)來(lái)提供一組描述圖象的特征111。通常的特征處理包括把圖象劃分成固定的數(shù)目的行和列,以及圖象特征組111是一組表示每個(gè)分割段的數(shù)值。例如,每個(gè)分割段可以具有這樣的特征分割段的平均亮度,或照度;或關(guān)于分割段的更多的細(xì)節(jié),分割段的主要顏色,或與每個(gè)顏色分量有關(guān)的平均亮度。圖象通常也具有這樣的特征圖象中邊緣的出現(xiàn)。圖象的每個(gè)分割段可以用分割段內(nèi)的水平線和垂直線的數(shù)目表示。每個(gè)分割段的頻率分析,諸如離散余弦變換(DCT),傳送大量的關(guān)于每個(gè)分割段的內(nèi)容的信息。
圖案匹配器120處理圖象特征,產(chǎn)生一組類(lèi)別或然率121,代表圖象相應(yīng)于一組預(yù)定的圖案類(lèi)別的每個(gè)圖案類(lèi)別或然率。在優(yōu)選實(shí)施例中,圖案匹配器120工作在兩個(gè)模式之一訓(xùn)練模式或執(zhí)行模式,由圖1的開(kāi)關(guān)129表示,雖然也可以使用非訓(xùn)練的圖案匹配器,諸如基于法則的系統(tǒng)。在訓(xùn)練模式中,圖案匹配器120發(fā)展在輸入圖象特征111與生產(chǎn)類(lèi)別或然率121之間的多尺寸關(guān)系,正如由以上討論的現(xiàn)有技術(shù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練方案表征的。在訓(xùn)練模式中,相應(yīng)于訓(xùn)練圖象102A的圖象特征111被提供給圖案匹配器120,以及相應(yīng)的正確的圖案類(lèi)別102B。也就是,每個(gè)訓(xùn)練圖象102A具有相應(yīng)的圖象類(lèi)別102B,例如由觀看和分類(lèi)訓(xùn)練圖象102A的專(zhuān)家提供。通過(guò)使用學(xué)習(xí)系統(tǒng)的現(xiàn)有技術(shù)神經(jīng)網(wǎng)絡(luò)例子,加到每個(gè)節(jié)點(diǎn)的每個(gè)輸入的加權(quán)值被調(diào)整,以使得導(dǎo)致在圖案匹配器產(chǎn)生的類(lèi)別與由專(zhuān)家提供的正確的類(lèi)別102B之間的差別的加權(quán)值被減小,而導(dǎo)致在產(chǎn)生的類(lèi)別與正確的類(lèi)別102B之間的一致性的加權(quán)值被增加。這樣,當(dāng)由開(kāi)關(guān)129設(shè)置在執(zhí)行模式時(shí),具有圖象特征111的新的圖象被加權(quán)值加偏置,產(chǎn)生類(lèi)別或然率輸出121,它類(lèi)似于相應(yīng)的正確的圖案類(lèi)別102B。如上所述,在技術(shù)上共同的各種各樣的技術(shù)提供在一組圖象特征111與預(yù)定的圖案類(lèi)別之間的一致性的度量121。
分類(lèi)器130處理類(lèi)別或然率因子121,來(lái)確定圖象的分類(lèi)。在簡(jiǎn)單的二進(jìn)制分類(lèi)中,類(lèi)別的成員或非成員,把類(lèi)別或然率因子121與門(mén)限值進(jìn)行比較。如果或然率大于門(mén)限值,則聲稱(chēng)一個(gè)類(lèi)別成員;否則,聲稱(chēng)一個(gè)非成員。正如技術(shù)上通常的情形,門(mén)限值的選擇涉及在“類(lèi)型I錯(cuò)誤”,把非成員聲稱(chēng)為成員,與“類(lèi)型II錯(cuò)誤”,把成員聲稱(chēng)為非成員之間進(jìn)行的折衷。高的門(mén)限值的選擇減小把非成員聲稱(chēng)為成員的潛在性,但增加不把成員聲稱(chēng)為成員的潛在性。這種折衷選擇典型地是根據(jù)不正確的確定的結(jié)果作出的。例如,在制造應(yīng)用的例子中,如果在類(lèi)別中聲稱(chēng)成員關(guān)系引入額外的制造步驟,諸如重新應(yīng)用以前的步驟,但非成員關(guān)系的錯(cuò)誤的聲稱(chēng)導(dǎo)致繼續(xù)制造不能銷(xiāo)售的物品,門(mén)限值將被設(shè)置得相當(dāng)?shù)?。相反,迫使物品被丟棄的成員關(guān)系的聲稱(chēng)可被設(shè)置得較高。
在多類(lèi)別系統(tǒng)中,分類(lèi)器130類(lèi)似地評(píng)估類(lèi)別或然率因子121,確定圖象是多個(gè)類(lèi)別的哪個(gè)類(lèi)別的成員。門(mén)限值的類(lèi)似的確定,典型地根據(jù)錯(cuò)誤的結(jié)果,通常被使用來(lái)實(shí)施這樣的許多個(gè)中的一個(gè)類(lèi)別。特定的圖象分類(lèi)也可以根據(jù)多個(gè)圖象類(lèi)別。例如特定的圖象分類(lèi)可以被規(guī)定為某些特定的圖案類(lèi)別的同時(shí)的高的或然率因子,與其它的特定的圖案類(lèi)別的低的或然率因子相聯(lián)系。另一個(gè)特定的圖象分類(lèi)可以包含“不關(guān)心”圖案類(lèi)別,其中特定的圖案或然率的特定的組合表示在圖象類(lèi)別中的成員,與“不關(guān)心”圖案類(lèi)別的或然率因子無(wú)關(guān)。應(yīng)當(dāng)指出,多類(lèi)別系統(tǒng)的類(lèi)別之一對(duì)于在任何的規(guī)定的類(lèi)別中不呈現(xiàn)占優(yōu)勢(shì)的高類(lèi)別或然率121的那些圖象,可以是“未知的”類(lèi)別。
如上所述,顯然,圖象分類(lèi)系統(tǒng)100的有效性取決于多個(gè)參量。每個(gè)處理塊110,120和130具有可以影響決定圖象101所屬于的類(lèi)別131的參量。在提供足夠的信息用于圖案識(shí)別時(shí)的圖案特征111的有效性將取決于表征圖象101的分割段的數(shù)目。有效性也可以取決于圖象是否由顏色、特定的邊緣取向等等表征。如上所述,在被使用于圖案識(shí)別的神經(jīng)網(wǎng)絡(luò)的例子中,在提供足夠的信息用于確定每個(gè)類(lèi)別的或然率121時(shí)圖案匹配器120的有效性將取決于一些參量,它們規(guī)定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),諸如每個(gè)級(jí)別的隱藏層和節(jié)點(diǎn)的數(shù)目。同樣地,有效性也可以取決于與學(xué)習(xí)處理過(guò)程有關(guān)的參量,諸如加權(quán)量修改的大小,如以上討論的。在圖案匹配器120的非學(xué)習(xí)實(shí)施方案中,諸如傳統(tǒng)的基于法則的系統(tǒng),參量可包括用于特定的法則的門(mén)限電平,在投票系統(tǒng)中每個(gè)法則的加權(quán)值,等等。同樣地,在提供許多個(gè)之一的選擇時(shí)分類(lèi)器130的有效性將取決于上述的、被使用來(lái)確定類(lèi)別成員的判決門(mén)限電平,或在圖象分類(lèi)定義中規(guī)定的特定的圖案類(lèi)別。應(yīng)當(dāng)指出,每個(gè)處理器110,120和130是相互有聯(lián)系的。圖象的粗的特征111可以需要在圖案匹配器120中的較少的輸入節(jié)點(diǎn),以及可能不需要許多隱藏層;在分類(lèi)器130中松弛的準(zhǔn)則組可以避免對(duì)于圖象的詳細(xì)的特征111的需要等等。在每個(gè)處理110,120和130中使用的參量之間的因果和相互依賴(lài)關(guān)系是難以用一個(gè)算法來(lái)描述的,如果不是不可能的話(huà)。因此,確定對(duì)于每個(gè)處理的每個(gè)參量的正確的值,和或在處理中間的測(cè)量值的組合以使得分類(lèi)系統(tǒng)100的有效性最大化,通常不能用算法裝置實(shí)行。
已經(jīng)發(fā)現(xiàn)一類(lèi)算法,被稱(chēng)為漸近算法,在確定產(chǎn)生最大的任務(wù)有效性的參量的組合而在執(zhí)行任務(wù)時(shí)不需要具體確定每個(gè)參量的單獨(dú)的或組合的有效性時(shí)是特別有用的。按照本發(fā)明,漸近算法被使用來(lái)進(jìn)行替換的結(jié)構(gòu)和參量的產(chǎn)生和評(píng)估,用來(lái)實(shí)施圖象分類(lèi)任務(wù)。
漸近算法通過(guò)疊代的支系產(chǎn)生過(guò)程運(yùn)行。漸近算法包括遺傳算法,突變算法等等。在典型的漸近算法中,某些屬性,或基因,被假定為與執(zhí)行給定的任務(wù)的能力有關(guān),基因的不同組合導(dǎo)致執(zhí)行該任務(wù)的有效性的不同水平。漸近算法對(duì)于其中在屬性的組合與執(zhí)行任務(wù)的有效性之間的關(guān)系沒(méi)有閉合形式解的問(wèn)題特別有效。
支系產(chǎn)生過(guò)程被使用來(lái)通過(guò)使用針對(duì)的試探和誤差搜索來(lái)確定基因的特定的組合,它對(duì)于執(zhí)行給定的任務(wù)是最有效的。基因或?qū)傩缘慕M合被稱(chēng)為染色體。在漸近算法的遺傳算法類(lèi)別中,重新產(chǎn)生-重新組合循環(huán)被使用來(lái)傳播支系的生成。具有不同染色體的族群的成員配對(duì)和生成支系。這些支系把屬性從父代傳下去,典型地來(lái)自每個(gè)父代的基因的某些隨機(jī)組合。在經(jīng)典的遺傳算法中,在執(zhí)行給定的任務(wù)時(shí)比其它更有效的各個(gè)被提供較高的機(jī)會(huì)來(lái)配對(duì)和生成支系。也就是,在希望支系繼承允許父代有效地執(zhí)行給定任務(wù)的基因時(shí),具有優(yōu)選的染色體的個(gè)體被給予較高的機(jī)會(huì)來(lái)生成支系。父代的下一代根據(jù)重新執(zhí)行給定任務(wù)的有效性的父代的偏愛(ài)來(lái)被選擇。這樣,具有有效地執(zhí)行給定任務(wù)的屬性的支系的數(shù)目將隨著每一代趨于增加。生成支系的其它方法的范例,諸如無(wú)性生殖、配對(duì)等等,也被使用來(lái)生成具有增加的改進(jìn)執(zhí)行給定任務(wù)的能力的或然率的支系在本發(fā)明的上下文中,父代和支系的屬性表示對(duì)于一個(gè)或多個(gè)處理過(guò)程110,120和130的參量151-153的選擇。漸近算法產(chǎn)生在針對(duì)的試探和誤差搜索中另一個(gè)參量組,用于檢測(cè)提供用于有效的圖象分類(lèi)系統(tǒng)的一組參量。
按照本發(fā)明已有多個(gè)漸近算法可被利用。已經(jīng)發(fā)現(xiàn)CHC自適應(yīng)搜索算法對(duì)于復(fù)雜的組合工程任務(wù)是特別有效的。95年2月14日發(fā)布的、Larry J.Eshelman和James D.Schaffer的,題目為“Methodfor Optimizing the Configuration of a Pick and PlaceMachine(用于最佳化采集和放置機(jī)的配置的方法)”的美國(guó)專(zhuān)利5,390,283給出用于確定接近最佳分配“采集和放置”機(jī)中的部件的CHC算法的使用,該專(zhuān)利在此引用,以供參考。當(dāng)與其它漸近算法進(jìn)行比較時(shí),CHC算法是利用“適者生存”選擇的遺傳算法,其中只有最好的執(zhí)行個(gè)體,或者父代或者支系,被使用來(lái)生成以后的支系。為了抵銷(xiāo)由這樣的選擇的生存會(huì)引入的有害的譜系影響,CHC算法避免亂倫配對(duì),即在具有非常相似的屬性的個(gè)體之間的配對(duì)。諸如本領(lǐng)域技術(shù)人員將會(huì)看到的,每個(gè)漸近算法對(duì)于被使用來(lái)實(shí)施疊代解決的方案都呈現(xiàn)正反兩個(gè)方面,以及在本發(fā)明中所使用的漸近算法的特定的選擇是可任選的。
圖2顯示按照本發(fā)明的示例性漸近算法150的更詳細(xì)的方框圖。初始族群201提供當(dāng)前族群210的初始成員。族群210的每個(gè)成員被表示為染色體,它是在圖象分類(lèi)系統(tǒng)100中使用的特定的參量值的編碼。在優(yōu)選實(shí)施例中,例如,染色體包含一組基因,它規(guī)定在圖案匹配器120中使用的神經(jīng)網(wǎng)絡(luò)中所使用的層數(shù);另一組基因代表在每層內(nèi)的隱藏節(jié)點(diǎn)數(shù);以及另一個(gè)組的基因代表對(duì)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)所使用的其它參量,諸如對(duì)于加到神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)的每個(gè)輸入所使用的加權(quán)量修改的幅度。其它參量,諸如上述的用于分類(lèi)的門(mén)限值,圖象劃分的數(shù)目,等等可作為基因編碼被包括在族群210的每個(gè)成員染色體中,正如上面討論的。應(yīng)當(dāng)指出,不是所有的、由圖象處理器110、圖案示波器120、和分類(lèi)器130使用的參量都需要被漸近算法150評(píng)估或提供。從一個(gè)或多個(gè)處理器110,120,130選擇參量被編碼用于漸近開(kāi)發(fā),典型地根據(jù)確定用于參量的適當(dāng)?shù)臄?shù)值的相對(duì)困難。選擇參量的選擇將取決于所利用的圖象分類(lèi)系統(tǒng)100的特定的結(jié)構(gòu)配置和復(fù)雜性,以及可供使用來(lái)執(zhí)行參量確定的時(shí)間。例如,確定神經(jīng)網(wǎng)絡(luò)中最有效的隱藏層數(shù)和節(jié)點(diǎn)數(shù),典型地比起確定對(duì)于類(lèi)別成員關(guān)系的有效的門(mén)限值更困難。在利用神經(jīng)網(wǎng)絡(luò)的優(yōu)選實(shí)施例中的漸近算法150包括對(duì)于在神經(jīng)網(wǎng)絡(luò)中的隱藏層和節(jié)點(diǎn)的數(shù)目的基因編碼,但門(mén)限值的基因編碼是可任選的。
按照本發(fā)明,性能估值器220提供相應(yīng)于族群210的每個(gè)成員的特征211,或染色體的參量給圖象分類(lèi)系統(tǒng)100。參量155包括圖1的參量組151、152和153的一個(gè)或多個(gè)參量。圖象分類(lèi)系統(tǒng)100把每個(gè)參量155加到圖1的它們相應(yīng)的塊110、120、130。也就是,例如,如果參量155包括圖案匹配器120的神經(jīng)網(wǎng)絡(luò)中的層數(shù)。則圖象分類(lèi)系統(tǒng)100配置圖案匹配器120,包含在它的神經(jīng)網(wǎng)絡(luò)中的特定的層數(shù)。如果圖象分類(lèi)系統(tǒng)100包含學(xué)習(xí)系統(tǒng),則以上討論的訓(xùn)練序列通過(guò)使用相應(yīng)于當(dāng)前族群210的特定的成員211的參量155的配置被加上。當(dāng)圖象分類(lèi)系統(tǒng)100被適當(dāng)?shù)嘏渲煤陀?xùn)練時(shí),一組評(píng)估圖象103A被提供給圖象分類(lèi)系統(tǒng)100用于分類(lèi)。每個(gè)評(píng)估圖象103A的結(jié)果的分類(lèi)通過(guò)圖1的開(kāi)關(guān)S2的相應(yīng)的開(kāi)關(guān)設(shè)置,被提供給性能估值器220。性能估值器220把評(píng)估圖象組103A的結(jié)果的類(lèi)別131與一組正確的圖象類(lèi)別103B進(jìn)行比較,以便估值圖象分類(lèi)系統(tǒng)100當(dāng)用族群210的每個(gè)成員211的特定的參量組155配置時(shí)的性能。對(duì)于每個(gè)估值圖象103A的適當(dāng)?shù)膱D象分類(lèi)103B典型地由特定的應(yīng)用領(lǐng)域中的專(zhuān)家給出。例如,數(shù)量控制工程師可以提供用于制造監(jiān)視系統(tǒng)的適當(dāng)?shù)膱D象分類(lèi)組103B;博物館館長(zhǎng)可以提供用于藝術(shù)分類(lèi)系統(tǒng)的適當(dāng)?shù)膱D象分類(lèi)組103B;或普通用戶(hù)可以提供用于個(gè)人的圖象分類(lèi)系統(tǒng)的適當(dāng)?shù)膱D象分類(lèi)組103B。在結(jié)果的分類(lèi)131與適當(dāng)?shù)姆诸?lèi)103B之間的一致性提供圖象分類(lèi)系統(tǒng)100在按照每個(gè)成員211的參量155被配置時(shí)的精度的度量。
性能估值器220提供相應(yīng)于族群210的每個(gè)成員211的性能指示221。這個(gè)性能指示221是可被使用來(lái)排名族群210的每個(gè)成員211的性能的度量。按照本發(fā)明的另一個(gè)方面,圖象分類(lèi)系統(tǒng)100提供在這個(gè)排名處理過(guò)程中使用的其它的度量199。其它的度量199包括,例如,在確定類(lèi)別或然率因子121時(shí)使用的中間值,或相關(guān)的性能度量,諸如對(duì)于圖象分類(lèi)系統(tǒng)100分類(lèi)每個(gè)評(píng)估圖象103A所需要的時(shí)間。如果對(duì)于一個(gè)成員的特征211被配置的系統(tǒng)100比起對(duì)于另一個(gè)成員的特征211’被配置的系統(tǒng)100’需要長(zhǎng)得多的時(shí)間間隔來(lái)達(dá)到稍微大一點(diǎn)的精度,則其它的成員211’可被給予較好的性能指示221。多變量排名技術(shù),包括加權(quán)平均等等,在技術(shù)上是常見(jiàn)的。
當(dāng)前的族群210的每個(gè)成員211的性能度量221被提供給最好的執(zhí)行者選擇器240。在示例性CHC基因算法中,族群的較高排名的成員被選擇為最好的執(zhí)行者組241。這些選擇的較高的排名成員在支系產(chǎn)生器260中生成支系。較高的排名成員和它們的支系形成新的族群261,它代替當(dāng)前的族群210,以及以上的處理過(guò)程被重復(fù)進(jìn)行。這樣,對(duì)于每次疊代,每次疊代的最好的執(zhí)行者被選擇來(lái)生成繼承它們的特征的支系,以便增加對(duì)于每次疊代產(chǎn)生更好的執(zhí)行支系特征或圖象分類(lèi)參量的或然率。
終結(jié)確定器250確定是否繼續(xù)進(jìn)行支系生成和重新估值的疊代。在優(yōu)選實(shí)施例中,終結(jié)是根據(jù)最好的執(zhí)行者組241是否收斂,或是否已進(jìn)行特定的疊代次數(shù),或是否達(dá)到適當(dāng)?shù)姆诸?lèi)性能,無(wú)論哪個(gè)事件首先發(fā)生。在優(yōu)選實(shí)施例中,終結(jié)確定器也可任選地用在終結(jié)后的更換的最好執(zhí)行者組重新啟動(dòng)處理過(guò)程,以避免可能收斂到本地最小值。當(dāng)在圖1上被設(shè)置在用于分類(lèi)新的圖象101的產(chǎn)生模式時(shí),當(dāng)處理過(guò)程在250處被終結(jié)時(shí),單個(gè)最好執(zhí)行成員241的特征251被選擇為用于圖象分類(lèi)系統(tǒng)100的優(yōu)選的參量。
圖3顯示按照本發(fā)明的制造系統(tǒng)300的示例性方框圖。制造設(shè)備310產(chǎn)生在裝配線315上出現(xiàn)的物品。照相機(jī)320提供相應(yīng)于在裝配線315上的物品的特定的方面的圖象。任選的缺陷檢測(cè)器325預(yù)先處理圖象321,以便確定是否存在缺陷,避免對(duì)于無(wú)缺陷物品的以后的缺陷分類(lèi)任務(wù)的化費(fèi)。缺陷檢測(cè)器325提供包含可疑的缺陷的圖象或部分圖象321’給缺陷分類(lèi)器330。按照本發(fā)明,缺陷分類(lèi)器330包括圖象分類(lèi)系統(tǒng)100,它提供缺陷分類(lèi)輸出331,它是根據(jù)由漸近算法150提供的至少一個(gè)參量值的,諸如以上討論的。數(shù)量控制器340使用缺陷分類(lèi)331來(lái)確定適當(dāng)?shù)男U袆?dòng)341,諸如重復(fù)利用監(jiān)視的物品,關(guān)閉系統(tǒng)等等。這種適當(dāng)?shù)男U袆?dòng)341,如果有的話(huà),被提供給制造設(shè)備310,以便實(shí)施所需要的校正行動(dòng)。
以上僅僅說(shuō)明了本發(fā)明的原理。因此,應(yīng)當(dāng)看到,雖然沒(méi)有在這里明顯地描述或顯示但本領(lǐng)域技術(shù)人員應(yīng)能夠作出各種體現(xiàn)本發(fā)明的原理的安排,因此屬于本發(fā)明的精神和范圍。例如,對(duì)于每個(gè)評(píng)估圖象103A的適當(dāng)?shù)膱D象分類(lèi)103B典型地由人提供,雖然可信任的自動(dòng)特征系統(tǒng)也可提供分類(lèi)103B。也就是,漸近算法150可以提供與已知的分類(lèi)系統(tǒng)相比的另一個(gè)配置結(jié)構(gòu),以便提供較低成本的或較快的替代系統(tǒng)。也應(yīng)當(dāng)指出,分類(lèi)不一定是“形式上的”。用戶(hù)可以創(chuàng)建圖象分類(lèi)系統(tǒng),其中例如汽車(chē)的圖象被分類(lèi)為“喜歡”和“不喜歡”。如果在汽車(chē)圖象中的圖案與用戶(hù)的“喜歡”和“不喜歡”的分類(lèi)之間有聯(lián)系,則系統(tǒng)100可以有效地被利用來(lái)識(shí)別用戶(hù)可能喜歡的新的汽車(chē)圖象。這樣的系統(tǒng)100可被部署來(lái)搜索和歸類(lèi)在互聯(lián)網(wǎng)上找到的圖象,以使得無(wú)論何時(shí)找到用戶(hù)可能喜歡的新的汽車(chē)圖象時(shí)提醒用戶(hù)。
在圖上給出了結(jié)構(gòu)配置和功能性劃分用于說(shuō)明的目的。例如,圖2的性能估值器220可被包括在圖象分類(lèi)系統(tǒng)100中,而不是在所顯示的漸近算法中。本發(fā)明的單元可以用硬件、軟件、或二者的組合來(lái)實(shí)施。例如圖案匹配器120可以用可編程門(mén)陣列來(lái)實(shí)施,硬件參量155被使用來(lái)重新編程門(mén)陣列,以便實(shí)施每個(gè)試探配置結(jié)構(gòu)。替換地,圖象處理器110可以是專(zhuān)用集成電路,而圖案識(shí)別器是運(yùn)行在通用處理器上的軟件程序。這些替換的配置結(jié)構(gòu)和系統(tǒng)最優(yōu)化從本發(fā)明看來(lái)在技術(shù)上對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)是顯而易見(jiàn)的,因此它們被包括在以下的權(quán)利要求的范圍內(nèi)。
權(quán)利要求
1.一種圖象分類(lèi)系統(tǒng)(100),包括圖象處理器(110),處理圖象(101)產(chǎn)生圖象特征(111),圖案匹配器(120),用來(lái)耦合到圖象處理器(110),處理圖象特征(111),產(chǎn)生至少一個(gè)類(lèi)別或然率因子(121),以及分類(lèi)器(130),用來(lái)耦合到圖案匹配器(120),處理所述至少一個(gè)類(lèi)別或然率因子(121),產(chǎn)生相應(yīng)于圖象(101)的圖象分類(lèi)(131),其中圖象處理器(110)使用圖象處理參量(151),圖案匹配器(120)使用圖案匹配參量(152),分類(lèi)器(130)使用分類(lèi)參量(153),以及漸近算法(150)根據(jù)一組評(píng)估圖象(103A)和相應(yīng)的適當(dāng)?shù)膱D象分類(lèi)(103B),確定以下參量的至少一個(gè)參量(155)圖象處理參量(151),圖案匹配參量(152),和分類(lèi)參量(153)。
2.權(quán)利要求1的圖象分類(lèi)系統(tǒng)(100),其特征在于,還包括漸近算法(150)。
3.權(quán)利要求1的圖象分類(lèi)系統(tǒng)(100),其特征在于圖案匹配器(120)包括神經(jīng)網(wǎng)絡(luò),以及由漸近算法(150)確定的至少一個(gè)參量(155)包括以下項(xiàng)目中的至少一項(xiàng)神經(jīng)網(wǎng)絡(luò)中的多個(gè)層,神經(jīng)網(wǎng)絡(luò)的至少一層中的多個(gè)隱藏節(jié)點(diǎn),和反饋學(xué)習(xí)參量。
4.權(quán)利要求1的圖象分類(lèi)系統(tǒng)(100),其特征在于圖象處理器(110)把圖象(101)劃分成多個(gè)圖象分割段,每個(gè)圖象分割段具有分割段度量,其數(shù)值提供圖象特征(111)的分量,以及由漸近算法(150)確定的至少一個(gè)參量(155)包括以下項(xiàng)目中的至少一項(xiàng)圖象分割段數(shù)目和分割段度量。
5.權(quán)利要求1的圖象分類(lèi)系統(tǒng)(100),其特征在于由漸近算法(150)確定的至少一個(gè)參量(155)是門(mén)限值,它由圖象處理器(110)、圖案匹配器(120)和分類(lèi)器(130)中的至少一個(gè)裝置被使用來(lái)分別產(chǎn)生圖象特征(111)、至少一個(gè)類(lèi)別或然率因子(121),和圖象分類(lèi)(131)。
6.一種制造系統(tǒng)(300),包括制造裝置(310),產(chǎn)生制造的物品;照相機(jī)(320),提供制造的物品的圖象(101),以及缺陷分類(lèi)器(330),用來(lái)被耦合到照相機(jī)(320),根據(jù)圖象(101)提供缺陷分類(lèi)(331),以便于確定要被施加到至少一個(gè)制造裝置(310)或制造的物品上的校正性行動(dòng)(341),其中缺陷分類(lèi)器(330)根據(jù)由漸近算法(150)提供的至少一個(gè)參量(155)提供缺陷分類(lèi)(331)。
7.權(quán)利要求6的制造系統(tǒng)(300),其特征在于,缺陷分類(lèi)器(330)包括圖象處理器(110),處理圖象(101)產(chǎn)生圖象特征(111),圖案匹配器(120),用來(lái)耦合到圖象處理器(110),處理圖象特征(111),產(chǎn)生至少一個(gè)類(lèi)別或然率因子(121),以及圖象分類(lèi)器(130),用來(lái)耦合到圖案匹配器(120),處理所述至少一個(gè)類(lèi)別或然率因子(121),產(chǎn)生相應(yīng)于制造的物品的缺陷分類(lèi)(331),其中圖象處理器(110)使用圖象處理參量(151),圖案匹配器(120)使用圖案匹配參量(152),分類(lèi)器(130)使用分類(lèi)參量(153),以及由漸近算法(150)提供的至少一個(gè)參量(155)包括以下參量的至少一個(gè)參量(155)圖象處理參量(151),圖案匹配參量(152),和分類(lèi)參量(153)。
8.權(quán)利要求7的制造系統(tǒng)(300),其特征在于圖案匹配器(120)包括神經(jīng)網(wǎng)絡(luò);以及由漸近算法(150)確定的至少一個(gè)參量(155)包括以下項(xiàng)目中的至少一項(xiàng)神經(jīng)網(wǎng)絡(luò)中的多個(gè)層,神經(jīng)網(wǎng)絡(luò)的至少一層中的多個(gè)隱藏節(jié)點(diǎn),和反饋學(xué)習(xí)參量。
9.權(quán)利要求7的制造系統(tǒng)(300),其特征在于圖象處理器(110)把圖象(101)劃分成多個(gè)圖象分割段,每個(gè)圖象分割段具有分割段度量,其數(shù)值提供圖象特征(111)的分量,以及由漸近算法(150)確定的至少一個(gè)參量(155)包括以下項(xiàng)目中的至少一項(xiàng)圖象分割段數(shù)目和分割段度量。
10.權(quán)利要求7的制造系統(tǒng)(300),其特征在于由漸近算法(150)確定的至少一個(gè)參量(155)是門(mén)限值,它由圖象處理器(110)、圖案匹配器(120)和圖象分類(lèi)器(130)中的至少一個(gè)裝置被使用來(lái)分別產(chǎn)生圖象特征(111)、至少一個(gè)類(lèi)別或然率因子(121),和缺陷分類(lèi)(331)。
11.權(quán)利要求6的制造系統(tǒng)(300),其特征在于由漸近算法(150)提供的至少一個(gè)參量(155)是基于一組評(píng)估圖象(103A)和相應(yīng)的適當(dāng)?shù)膱D象分類(lèi)(103B)。
12.權(quán)利要求6的制造系統(tǒng)(300),其特征在于缺陷檢測(cè)器,用來(lái)耦合到照相機(jī)(320),根據(jù)缺陷的檢測(cè)提供圖象(101)給缺陷分類(lèi)器(330)。
13.權(quán)利要求6的制造系統(tǒng)(300),其特征在于,還包括漸近算法(150)。
14.一種用于分類(lèi)圖象(101)的方法,包括根據(jù)圖象處理參量(151),處理圖象(101)產(chǎn)生圖象特征(111),根據(jù)圖象匹配參量(152),處理圖象特征(111),產(chǎn)生至少一個(gè)類(lèi)別或然率因子(121),以及根據(jù)分類(lèi)參量(153),處理所述至少一個(gè)類(lèi)別或然率因子(121),產(chǎn)生相應(yīng)于圖象(101)的圖象分類(lèi)(131),其中由漸近算法(150)提供以下參量的至少一個(gè)參量(155)圖象處理參量(151),圖案匹配參量(152),和分類(lèi)參量(153)。
15.權(quán)利要求14的方法,其特征在于還包括根據(jù)一組評(píng)估圖象(103A)和相應(yīng)的適當(dāng)?shù)膱D象分類(lèi)(103B),提供至少一個(gè)參量(155)。
16.權(quán)利要求14的方法,其特征在于,處理圖象特征(111)包括把圖象特征(111)加到神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn),操練神經(jīng)網(wǎng)絡(luò),產(chǎn)生神經(jīng)網(wǎng)絡(luò)的結(jié)果的輸出,以及根據(jù)神經(jīng)網(wǎng)絡(luò)的結(jié)果的輸出,產(chǎn)生至少一個(gè)類(lèi)別或然率因子(121),以及其中由漸近算法(150)確定的至少一個(gè)參量(155)包括多個(gè)神經(jīng)網(wǎng)絡(luò)中的層、在神經(jīng)網(wǎng)絡(luò)的至少一層中的多個(gè)隱藏節(jié)點(diǎn),以及反饋學(xué)習(xí)參量。
17.權(quán)利要求14的方法,其特征在于,處理圖象(101)包括把圖象(101)劃分成多個(gè)圖象分割段,每個(gè)圖象分割段具有分割段度量,其數(shù)值提供圖象特征(111)的分量,以及其中由漸近算法(150)確定的至少一個(gè)參量(155)包括以下項(xiàng)目中的至少一項(xiàng)圖象分割段數(shù)目和分割段度量。
18.權(quán)利要求14的方法,其特征在于由漸近算法(150)確定的至少一個(gè)參量(155)是門(mén)限值,它被使用來(lái)產(chǎn)生圖象特征(111)、至少一個(gè)類(lèi)別或然率因子(121),和圖象分類(lèi)(131)中的至少一項(xiàng)。
全文摘要
漸近算法得出用于圖象分類(lèi)系統(tǒng)的替換的結(jié)構(gòu)和參量。在優(yōu)選實(shí)施例中,采用一個(gè)學(xué)習(xí)系統(tǒng),以及在學(xué)習(xí)系統(tǒng)的訓(xùn)練時(shí)間間隔期間,得出學(xué)習(xí)系統(tǒng)的結(jié)構(gòu),以便創(chuàng)建很適合于特定的分類(lèi)問(wèn)題組的學(xué)習(xí)系統(tǒng)。同樣地,通過(guò)漸近算法(包括實(shí)施圖象特征化,進(jìn)行學(xué)習(xí)和分類(lèi)的算法)得出圖象分類(lèi)系統(tǒng)的其它參量。初始的參量組和結(jié)構(gòu)組被使用來(lái)創(chuàng)建一組嘗試分類(lèi)系統(tǒng)。多個(gè)預(yù)先分類(lèi)的估值圖象然后被加到每個(gè)系統(tǒng),以及用于每個(gè)測(cè)試事例的每個(gè)系統(tǒng)的結(jié)果的分類(lèi)與每個(gè)測(cè)試事例的正確的分類(lèi)進(jìn)行比較。根據(jù)較好的執(zhí)行分類(lèi)系統(tǒng)的參量和結(jié)構(gòu)得出以后的嘗試的分類(lèi)系統(tǒng)。最好地執(zhí)行的分類(lèi)系統(tǒng)然后被選擇為生產(chǎn)分類(lèi)系統(tǒng),用于分類(lèi)新的圖象。
文檔編號(hào)G06T1/00GK1327502SQ00801796
公開(kāi)日2001年12月19日 申請(qǐng)日期2000年6月27日 優(yōu)先權(quán)日1999年6月29日
發(fā)明者K·E·馬蒂爾斯, M·馬尼, J·D·沙菲爾 申請(qǐng)人:皇家菲利浦電子有限公司