本發(fā)明涉及一種適用于室內(nèi)軌道機(jī)器人的數(shù)字儀表圖像的識(shí)別方法。
背景技術(shù):
:變電站作為電力輸配送的重要環(huán)節(jié),其室內(nèi)設(shè)備是整個(gè)變電站的核心,里面放置著對(duì)變電站實(shí)時(shí)監(jiān)控的屏體設(shè)備、電源柜和后臺(tái)設(shè)備,需識(shí)別的設(shè)備有旋鈕、壓板、狀態(tài)燈、數(shù)字儀表等,其運(yùn)行狀態(tài)關(guān)系到整個(gè)變電站及直流輸電系統(tǒng)的安全運(yùn)行。保護(hù)室實(shí)時(shí)監(jiān)視著變電站的工作狀態(tài),它對(duì)整個(gè)變電站起監(jiān)視保護(hù)的作用,因此對(duì)保護(hù)室的運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)視和定期檢查是必不可少的。目前對(duì)保護(hù)室設(shè)備的巡檢已經(jīng)廣泛的使用智能軌道機(jī)器人來(lái)代替人工操作,在保護(hù)室里依靠預(yù)先鋪設(shè)的運(yùn)行軌道并以伺服電機(jī)驅(qū)動(dòng)可以使軌道機(jī)器人依次準(zhǔn)確到達(dá)多個(gè)??课粚?duì)設(shè)備進(jìn)行觀測(cè),通過(guò)可見(jiàn)光圖像處理和聲音識(shí)別等功能自動(dòng)分析、檢測(cè)保護(hù)室內(nèi)各種設(shè)備的顯示狀態(tài),獲取整個(gè)變電站的實(shí)時(shí)運(yùn)行狀態(tài)。數(shù)字儀表的識(shí)別工作是智能軌道機(jī)器人的重要工作內(nèi)容,在可見(jiàn)光圖像中需要機(jī)器人實(shí)時(shí)采集目標(biāo)設(shè)備圖像并與模板圖像進(jìn)行特征點(diǎn)匹配,在采集的圖像中準(zhǔn)確快速的獲取設(shè)備區(qū)域,快速識(shí)別數(shù)字儀表的讀數(shù)。因此,圖像特征提取和識(shí)別的準(zhǔn)確性、時(shí)效性直接關(guān)系著軌道機(jī)器人對(duì)保護(hù)室進(jìn)行巡檢的效率。當(dāng)前較為常用的數(shù)字儀表識(shí)別的方法是首先對(duì)圖像進(jìn)行預(yù)處理來(lái)獲取目標(biāo)與背景分離明顯的二值圖像;然后對(duì)圖像進(jìn)行傾斜校正;接著采用投影法對(duì)圖像中的字符進(jìn)行精確分割定位;最后利用模板匹配或穿線法或單元取點(diǎn)方案識(shí)別每一個(gè)數(shù)字字符。但這些方法并不能很好的應(yīng)用于實(shí)際中,并且圖像需要傾斜校正,增加識(shí)別圖像的時(shí)耗。技術(shù)實(shí)現(xiàn)要素:本發(fā)明為了解決上述問(wèn)題,提出了一種適用于室內(nèi)軌道機(jī)器人的數(shù)字儀表圖像的識(shí)別方法,本方法通過(guò)設(shè)定合適的閾值將其轉(zhuǎn)化為二值圖像,并利用腐蝕方法對(duì)其進(jìn)行預(yù)處理,以消除孤立點(diǎn)和小區(qū)域塊的干擾,充分利用圖像所攜帶的顏色信息,提取R分量;然后利用投影法進(jìn)行定位分割出每個(gè)數(shù)字字符;最后利用sift算法檢測(cè)特征點(diǎn),并與模板進(jìn)行相似度匹配,選擇匹配度最高的那個(gè)數(shù)字為識(shí)別結(jié)果,本發(fā)明能夠大幅提高圖像特征匹配的準(zhǔn)確率與識(shí)別的時(shí)效性,提高了軌道機(jī)器人的巡檢識(shí)別效率,具有很好的適用性和魯棒性,可以滿足變電站室內(nèi)屏柜識(shí)別應(yīng)用的需求。為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:一種適用于室內(nèi)軌道機(jī)器人的數(shù)字儀表圖像的識(shí)別方法,包括以下步驟:(1)對(duì)采集的儀表圖像進(jìn)行預(yù)處理,提取R分量獲得數(shù)字區(qū)域字符的信息,通過(guò)閾值分割,使字符前景和背景能夠區(qū)分開(kāi),獲取二值圖像,再利用腐蝕算法對(duì)二值圖像進(jìn)行處理;(2)對(duì)二值圖像進(jìn)行像素點(diǎn)的規(guī)劃,計(jì)算出圖像中的水平投影和垂直投影,進(jìn)行數(shù)字區(qū)域的定位與分割;(3)檢測(cè)每一個(gè)字符的特征點(diǎn),然后依次對(duì)檢測(cè)到的每一個(gè)數(shù)字的特征點(diǎn)與模板進(jìn)行匹配,比較匹配特征點(diǎn)的點(diǎn)數(shù)與檢測(cè)出的特征點(diǎn)的點(diǎn)數(shù)的比值大小,選擇最大比值對(duì)應(yīng)的數(shù)字;(4)確定最大比值對(duì)應(yīng)的數(shù)字為數(shù)字儀表的讀數(shù)。所述步驟(1)中,針對(duì)變電站屏柜中數(shù)字儀表都為紅色的數(shù)碼管顯示,通過(guò)提取R分量將數(shù)字區(qū)域的信息提取出來(lái)。所述步驟(1)中,二值圖像的取得方法為:當(dāng)灰色圖像的值大于等于閾值時(shí),二值化后的圖像為1,否則,二值化后的圖像為0,1表示圖像中的白色,0表示圖像中的黑色。所述步驟(1)中,通過(guò)計(jì)算最大類間方差法確定閾值大小。進(jìn)一步的,所述步驟(1)中,二值化方法替換為自適應(yīng)均值法、自適應(yīng)高斯法或自適應(yīng)Bersen法。所述步驟(1)中,確定閾值大小的方法為:雙峰法、P參數(shù)法、最大熵閾值法、迭代法、平均值法或近似一維Means方法。所述步驟(2)中,對(duì)二值圖像進(jìn)行像素點(diǎn)的規(guī)劃具體方法為:對(duì)圖像進(jìn)行定義行、列數(shù)目,表示每個(gè)像素點(diǎn)的像素值,確定水平方向和豎直方向的投影。所述步驟(2)中,進(jìn)行數(shù)字區(qū)域的定位與分割的具體方法為:依次分析水平和豎直方向投影,如果從小到大,在某一行上有一個(gè)突變,則說(shuō)明這一行是儀表區(qū)域的開(kāi)始;如果投影是從大到小,在某一行上有一個(gè)突變,則說(shuō)明這個(gè)位置是儀表區(qū)域的結(jié)束,同樣確定列方向上的儀表區(qū)域,分割出不同字符的區(qū)域。所述步驟(3)中,具體方法為:采用SIFT算法檢測(cè)每一個(gè)字符的特征點(diǎn),然后依次對(duì)檢測(cè)到的每一個(gè)單個(gè)數(shù)字的特征點(diǎn)與模板進(jìn)行匹配,比較匹配特征點(diǎn)的點(diǎn)數(shù)與檢測(cè)出的特征點(diǎn)的點(diǎn)數(shù)的比值大小,比值最大即匹配度最高,選擇最大比值對(duì)應(yīng)的數(shù)字即為數(shù)字儀表的讀數(shù)。所述步驟(3)中,具體方法為:利用ORB算法檢測(cè)字符的特征點(diǎn),使用FAST進(jìn)行特征點(diǎn)檢測(cè),然后用BREIF進(jìn)行特征點(diǎn)的特征描述。所述步驟(3)中,模板為0~9的10個(gè)數(shù)字字符模板。本發(fā)明的有益效果為:(1)本發(fā)明有效提高數(shù)字儀表的正確識(shí)別率,具有適用性和魯棒性,但計(jì)算時(shí)耗未縮短;(2)本發(fā)明利用腐蝕算法對(duì)二值圖像進(jìn)行處理,有效的消除孤立的白點(diǎn)和小區(qū)域的白色塊,去除干擾信息;(3)本發(fā)明采用SIFT算法檢測(cè)每一個(gè)字符的特征點(diǎn),不需要?dú)w一化處理,并且不受字符傾斜的影響;(4)本發(fā)明具有時(shí)效性,更加適用于軌道機(jī)器人在保護(hù)室的巡檢任務(wù)。附圖說(shuō)明圖1為本發(fā)明的流程示意圖;圖2(a)為本發(fā)明的軌道機(jī)器人采集的數(shù)字儀表原圖像;圖2(b)為本發(fā)明的R分量提取后的圖像;圖2(c)為本發(fā)明的二值化后的圖像;圖2(d)為本發(fā)明的利用腐蝕算法處理的二值圖像;圖3為本發(fā)明的軌道機(jī)器人采集的數(shù)字儀表原圖像。具體實(shí)施方式:下面結(jié)合附圖與實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。如圖1所示,本發(fā)明具體包括:一、數(shù)字儀表圖像的預(yù)處理變電站保護(hù)室的屏柜中數(shù)字儀表大都是紅色的數(shù)碼管顯示。軌道機(jī)器人拍攝獲取的圖像都是彩色圖像,占據(jù)的存儲(chǔ)空間比灰度圖像大很多,對(duì)彩色圖像進(jìn)行處理也會(huì)消耗較多的系統(tǒng)資源,會(huì)降低系統(tǒng)的執(zhí)行速度,影響效率。同時(shí)針對(duì)8段數(shù)碼管顯示的數(shù)字單純依靠顏色空間中的R分量就可以將數(shù)字區(qū)域的信息提取出來(lái),因此本發(fā)明通過(guò)提取R分量獲得灰度圖像。在實(shí)際應(yīng)用中,為加快運(yùn)算速度,提高獲取數(shù)字區(qū)域的精度,該方法通過(guò)設(shè)定合適的閾值,使得字符前景和背景能夠區(qū)分開(kāi),獲取二值圖像。通過(guò)閾值分割后的圖像具備良好的保形性,不丟失圖像中有用的形狀及輪廓信息,不會(huì)給圖像產(chǎn)生額外的空缺等優(yōu)點(diǎn)。設(shè)灰度圖像為f(x,y),二值化后的圖像為g(x,y),二值化過(guò)程表示如下:g(x,y)=1f(x,y)≥t0f(x,y)<t---(2.1)]]>式(2.1)中1表示圖像中的白色,0表示圖像中的黑色,閾值門限值t的選擇是關(guān)鍵。本發(fā)明中閾值的確定是通過(guò)最大類間方差法(Ostu法)計(jì)算得到的,利用這種方法可以自動(dòng)的算出二值化閾值大小。由于圖像本身受光照和拍攝角度等因素的影響,通過(guò)以上方法處理后獲取的二值圖像難免會(huì)有一些干擾信息的存在,如孤立的白點(diǎn)和小區(qū)域的白色塊,為消除這些信息的干擾,該方法利用腐蝕算法對(duì)二值圖像進(jìn)行處理,排除干擾信息。二、數(shù)字儀表圖像數(shù)字區(qū)域的定位與分割從室內(nèi)軌道機(jī)器人拍攝的圖像來(lái)看,屏柜里的數(shù)字儀表的類型不同,數(shù)字區(qū)域所處的位置也不一樣,但讀數(shù)區(qū)域一般是黑底紅字。目前有關(guān)數(shù)字區(qū)域定位的算法研究已提出了多種有效的方法,大體分為基于邊緣的分割方法、基于連通成分的分割方法、基于紋理的分割方法和基于學(xué)習(xí)的分割方法等。本發(fā)明采用投影法,該方法簡(jiǎn)單,適用于室內(nèi)軌道機(jī)器人對(duì)數(shù)字儀表識(shí)別的應(yīng)用環(huán)境。投影法的基本原理是計(jì)算出圖像中的水平投影和垂直投影,然后通過(guò)分析投影值的數(shù)值變化,來(lái)分析出含有七段式數(shù)顯儀表中數(shù)字字符的位置。設(shè)室內(nèi)軌道機(jī)器人拍攝到的圖像設(shè)為A,設(shè)圖像A的行數(shù)為height,列數(shù)為width。在圖像A中,我們把第i行第j列像素點(diǎn)的像素值表示為s(i,j)。根據(jù)投影的定義,能夠得到水平方向的投影為:f(i)=Σj=0widths(i,j)---(2.2)]]>豎直方向的投影為:g(j)=Σiheights(i,j)---(2.3)]]>通過(guò)式(2.2)和式(2.3)可以看出,水平方向的投影是關(guān)于列數(shù)的一個(gè)函數(shù)。第i行對(duì)應(yīng)的投影值,即為這一行中非零像素點(diǎn)的個(gè)數(shù)。豎直方向的投影是關(guān)于行數(shù)的一個(gè)函數(shù)。第j列對(duì)應(yīng)的投影值,即為這一列中非零像素點(diǎn)的個(gè)數(shù)。通過(guò)分析水平和豎直方向投影,就能夠大體確定含有七段式數(shù)顯儀表的圖像中數(shù)字字符的位置。對(duì)于得到的投影值來(lái)說(shuō),如果從小到大,在某一行上有一個(gè)突變,則說(shuō)明這一行是儀表區(qū)域的開(kāi)始;如果投影是從大到小,在某一行上有一個(gè)突變,則說(shuō)明這個(gè)位置是儀表區(qū)域的結(jié)束。在列上的投影同理。通過(guò)列的投影,能夠分割出不同字符的區(qū)域。三、數(shù)字儀表圖像中數(shù)字的識(shí)別對(duì)于數(shù)字字符的識(shí)別,目前人們提出了很多方法,如模板匹配法、穿線識(shí)別法、基于神經(jīng)網(wǎng)絡(luò)的方法和基于支持向量機(jī)的方法等,對(duì)于基于神經(jīng)網(wǎng)絡(luò)的方法和基于支持向量機(jī)的方法都需要一個(gè)訓(xùn)練的過(guò)程,即需要有一些先驗(yàn)信息,因此比較復(fù)雜。模板匹配法編程易實(shí)現(xiàn),思路較簡(jiǎn)單,缺點(diǎn)是在字符識(shí)別之前需要提前準(zhǔn)備好模板,并且計(jì)算量稍大,需歸一化。如果對(duì)于諸如不同長(zhǎng)寬比例或不同傾斜程度的數(shù)顯儀表字符,就很有可能出現(xiàn)錯(cuò)誤。穿線法的好處是不需要進(jìn)行歸一化處理,節(jié)省運(yùn)算量和運(yùn)算時(shí)間,也能在一定程度上克服字符的傾斜,但是不能完全克服字符的傾斜。室內(nèi)軌道機(jī)器人在室內(nèi)鋪設(shè)好的水平軌道上行進(jìn),通過(guò)云臺(tái)的水平俯仰及旋轉(zhuǎn)運(yùn)動(dòng)實(shí)現(xiàn)對(duì)保護(hù)室屏柜的大范圍細(xì)節(jié)巡檢。雖然軌道機(jī)器人沿軌道可以準(zhǔn)確的在設(shè)備檢測(cè)位置???,但云臺(tái)的旋轉(zhuǎn)還是會(huì)給采集的圖像帶來(lái)一定誤差,特別是當(dāng)相機(jī)焦距拉近放大時(shí),誤差角度也隨之成倍放大。因此,分割出的字符區(qū)域可能存在一定程度上的傾斜。為克服模板匹配法和穿線法存在的不足和適用室內(nèi)軌道機(jī)器人的應(yīng)用環(huán)境,本發(fā)明采用SIFT算法檢測(cè)每一個(gè)字符的特征點(diǎn),然后依次對(duì)檢測(cè)到的每一個(gè)數(shù)字的特征點(diǎn)與模板進(jìn)行匹配,比較匹配特征點(diǎn)的點(diǎn)數(shù)與檢測(cè)出的特征點(diǎn)的點(diǎn)數(shù)的比值大小(比值最大即匹配度最高),選擇最大比值對(duì)應(yīng)的數(shù)字即為數(shù)字儀表的讀數(shù)。該方法不需要?dú)w一化處理,并且不受字符傾斜的影響。圖2(a)、圖2(b)、圖2(c)、圖2(d)為軌道機(jī)器人采集到的某一數(shù)字儀表圖像,經(jīng)本發(fā)明提出的識(shí)別方法流程分解后,各處理節(jié)點(diǎn)的效果圖像。圖3為采用投影法定位分割獲取的單個(gè)數(shù)字字符。表1.待識(shí)別字符與10個(gè)模板的匹配度比較表1為待識(shí)別字符與10個(gè)數(shù)字字符模板的匹配度結(jié)果。通過(guò)對(duì)比可以發(fā)現(xiàn)匹配度最高的模板對(duì)應(yīng)的數(shù)字字符即為待測(cè)字符的正確值。通過(guò)實(shí)驗(yàn)可以看出本發(fā)明提出的數(shù)字儀表的識(shí)別方法的成功率較高,并且具有時(shí)效性,更加適用于軌道機(jī)器人在保護(hù)室的巡檢任務(wù)。上述雖然結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式進(jìn)行了描述,但并非對(duì)本發(fā)明保護(hù)范圍的限制,所屬領(lǐng)域技術(shù)人員應(yīng)該明白,在本發(fā)明的技術(shù)方案的基礎(chǔ)上,本領(lǐng)域技術(shù)人員不需要付出創(chuàng)造性勞動(dòng)即可做出的各種修改或變形仍在本發(fā)明的保護(hù)范圍以內(nèi)。當(dāng)前第1頁(yè)1 2 3