本發(fā)明屬于圖書館管理
技術領域:
,具體涉及一種基于圖像分割和隨機hough變換的架上圖書清點方法。
背景技術:
:圖書清點是圖書統(tǒng)計指標中的基礎數(shù)據(jù),是圖書館管理的一個難點問題。通過清點圖書可以準確確定圖書館現(xiàn)有的圖書財產(chǎn),對于客觀地反映學校辦學實力、爭取更多的經(jīng)費投入具有重要的參考價值。因此,圖書清點工作對于圖書館的日常管理非常必要,但是傳統(tǒng)的人工清點方式既耗時又費力,存在勞動力需求大、信息更新不及時等缺點。對于圖書館管理來說,將傳統(tǒng)的圖書清點工作進行數(shù)字化、自動化改進是一個重要的研究方向,近年來,圖像處理技術在圖書管理方面得到了卓有成效的應用,為圖書清點提供了一種新的方法。
背景技術:
[劉汝翠.基于書脊圖像特征和空域濾波的自動圖書清點方法:中國,ZL201410383904.7,2016.05.04],采用圖像特征和空域濾波的方法對書脊圖像進行處理,實現(xiàn)了單排圖書的自動清點,提高了圖書清點的效率,該方法的主要步驟為:1)采集書庫內(nèi)的書脊圖像,確保圖像內(nèi)只含有一排圖書;2)獲取圖書的排列方向傾角,對邊緣像素進行投影,獲得書脊文字投影波形圖;3)對邊緣投影波形圖進行濾波,得到平滑的邊緣投影波形圖;4)檢測邊緣投影波形中波峰的個數(shù),即為圖像中包含圖書的冊數(shù)。上述方法采用了圖像處理的方法實現(xiàn)了單排圖書的清點,提高了工作效率;但其主要針對簡單的單排圖書的圖像處理,即只能對書架上單個圖書擺放格內(nèi)的圖書進行清點,而現(xiàn)在圖書館的藏書數(shù)量十分巨大,每一書架上有多個圖書擺放格,上述方法難以高效清點這些海量藏書;另一方面,上述方法采用邊緣投影檢測的方法來計算書脊文字的積累峰值,該方法對書脊背景狀況要求較高;當圖書書脊上文字較少或者與背景區(qū)分不大時,容易導致圖書漏檢;而當文字較多,在書脊上呈兩列分布時,容易導致圖書虛報。上述問題的出現(xiàn),限制了
背景技術:
的實用性和應用范圍。技術實現(xiàn)要素:1.要解決的技術問題本發(fā)明的目的是提出一種基于圖像分割和隨機hough變換的架上圖書清點方法,從而克服現(xiàn)有技術的不足,大幅提高圖書清點的效率。2.技術方案本發(fā)明提供了一種基于圖像分割和隨機hough變換的架上圖書清點方法,采用技術方案步驟如下:步驟1:圖像預處理采集包含書架框體和書脊的彩色圖像,對圖片進行修正,得到水平方向一致的圖片,并確保書架框體占滿整幅圖像,該圖像記為P;以圖像左下角為原點,建立x-y直角坐標系,其中坐標系x軸方向與圖像下邊界重合,坐標系y軸方向與圖像左邊界重合;令i和j分別為圖像在坐標系x和y方向的像素單元數(shù),則圖像P可以表示成像素矩陣的形式其中p(i,j)為像素單元(i,j)處的像素值,I為圖P在x方向總的像素個數(shù),J為y方向總的像素個數(shù);步驟2:圖像分割(1)把彩色圖像P轉(zhuǎn)化為256級的灰度圖F,該灰度圖在x-y直角坐標系中可以表示成像素矩陣的形式其中f(i,j)為像素單元(i,j)處的像素值;對于任意像素單元f(i,j),通過鄰域單元像素進行微分處理計算x方向的梯度fx和y方向的梯度fy則圖像在坐標單元(i,j)處的梯度幅值為梯度方向為α(i,j)=arctan(fy/fx),其中arctan()表示求反正切函數(shù);(2)通過非極大值抑制來提取邊緣的局部極值,從而剔除部分非邊緣點的影響;首先,根據(jù)α(i,j)的取值,將像素單元f(i,j)處的梯度方向均勻劃分為四個扇區(qū)區(qū)間,分別代表水平方向、左傾方向、右傾方向和豎直方向的梯度:其中,s(i,j)為坐標單元(i,j)處梯度方向所屬的扇區(qū),π為180°角對應的弧度數(shù);然后根據(jù)s(i,j)取值,查找坐標單元(i,j)處同一梯度方向的兩個8鄰域坐標單元其中,和分別為(i,j)的兩個8鄰域坐標單元在坐標系x和y方向的像素單元數(shù);最后,將坐標單元(i,j)處的梯度幅值與同一梯度方向的鄰域像素比較,提取梯度幅值的局部極大值:(3)采用雙閾值門限對梯度幅值進行二值化處理,設低閾值門限為σlow,高閾值門限為σhigh,對圖像進行邊緣檢測得到二值化圖像其中b(i,j)為像素單元(i,j)處的二值化像素值:對于梯度幅值介于σlow和σhigh之間的坐標單元(i,j),b(i,j)的取值根據(jù)8鄰域像素單元的梯度確定其中,Mmax為坐標單元(i,j)處8鄰域像素單元梯度的極大值;(4)每一格書架框架的邊緣是水平和垂直方向的直線,而框架內(nèi)圖書的邊緣則存在較多對角的斜線,因此采用一個對角線矩陣對二值化圖像B進行濾波處理,得到新的像素值:b(i,j)=max[b(i,j),b(i-1,j-1),b(i+1,j+1),b(i-1,j+1),b(i+1,j-1)],其中,max[]表示取極大值運算;然后將二值圖像分別向水平和垂直方向投影,得到圖像在水平方向的積累參數(shù)Qx(i)和垂直方向的積累參數(shù)Qy(j):根據(jù)積累參數(shù)的水平檢測門限γx和垂直檢測門限γy,提取Qx(i)谷值對應的序列號存入數(shù)組Dx,提取Qy(j)谷值對應的序列號存入數(shù)組Dy:其中,arg[·]表示滿足約束條件[·]的序列號,則Dx數(shù)據(jù)對應書架框架在水平方向的坐標,Dy數(shù)據(jù)對應書架框架在垂直方向的坐標;(5)接下來利用框架的信息將原圖像分割成多個子圖像,每個子圖像對應書架中一個矩形擺放格中的書脊圖像;首先,提取書架框架的位置坐標Dx和Dy,從而實現(xiàn)對書架中各矩形擺放格的定位;然后,根據(jù)矩形擺放格的邊界對彩色圖像P進行分割,得到多個子圖像,實現(xiàn)原始圖像的分割處理:其中N為子圖像的總個數(shù),Pn表示第n個子圖像。步驟3:隨機采樣(1)對于第n個子圖像Pn,記In為其在x方向總的像素個數(shù),Jn為其在y方向總的像素個數(shù);進行預處理,得到像素單元(i,j)處的梯度方向αn(i,j);然后將αn(i,j)均勻劃分為四個扇區(qū)區(qū)間;用sn(i,j)表示子圖像Pn在坐標單元(i,j)處梯度方向所屬的扇區(qū);進行邊緣檢測得到二值化圖像其中bn(i,j)為子圖像Pn在像素單元(i,j)處的二值化像素值;(2)在二值化圖像Bn中隨機選取一個非零元素的像素單元(i1,j1),使得0.3Jn≤j1≤0.7Jn且bn(i1,j1)≠0,該像素單元對應的梯度方向區(qū)間為sn(i1,j1);(3)在二值化圖像Bn中選取第二個非零元素的像素單元(i2,j2)≠(i1,j1),使得0.3Jn≤j2≤0.7Jn且bn(i2,j2)≠0,該像素單元對應的梯度方向區(qū)間為sn(i2,j2);如果sn(i1,j1)≠sn(i2,j2),重新采樣,直到sn(i1,j1)=sn(i2,j2),將兩個像素單元(i1,j1)和(i2,j2)組成一個隨機采樣像素對;;(4)重復采樣,得到L個隨機采樣像素對。步驟4:參數(shù)積累計算積累單元距離,建立hough參數(shù)空間(ρ,θ),ρ和θ分別為空間中的距離和角度參數(shù);將隨機采樣的兩個像素單元(i1,j1)和(i2,j2)通過hough變換投影到參量空間,計算相應的參數(shù)單元(ρhough,θhough),ρhough和θhough分別為hough變換后參數(shù)空間中的距離和角度參數(shù);在相應的積累單元進行投票積累,使對應同一直線的采樣點能夠落入相同的積累單元,得到參數(shù)積累矩陣H(ρ,θ),具體方法如下:(1)根據(jù)離散間隔Δρ和Δθ對參數(shù)ρ和θ進行離散化處理,形成參數(shù)空間(ρ,θ),在(u,v)個參數(shù)單元的中心點參數(shù)為ρu和θv:ρu=(u-1/2)Δρ,u=1,2,…,U,θv=(v-1/2)Δθ-π/2,v=1,2,…,V,其中,u和v分別為參數(shù)ρ和θ的序號,ρ的參數(shù)單元數(shù)目U以及θ的參數(shù)單元數(shù)目V取值分別為:V=Int(π/Δθ),Int()表示取整運算,π為180°角對應的弧度數(shù);建立參數(shù)積累矩陣H(ρ,θ),置每一單元初始值為0;(2)將第一個隨機采樣的像素對(i1,j1)和(i2,j2)通過hough變換投影到參量空間,計算該像素對所確定的參數(shù)ρhough和θhough:θhough=arctan[-(i1-i2)/(j1-j2)];ρhough=0.5(i1+i2)cos(θhough)+0.5(j1+j2)sin(θhough);(3)在參數(shù)空間(ρ,θ)中查找相應的單元(ρu,θv),使得||ρhough-ρu||≤Δρ,||θhough-θv||≤Δθ;如果(ρu,θv)存在,則在參數(shù)積累矩陣H(ρ,θ)的存儲單元(ρu,θv)中進行累加:H(ρu,θv)=H(ρu,θv)+1;否則,將(ρhough,θhough)插入?yún)?shù)空間(ρ,θ),并取初始值H(ρhough,θhough)=1;(4)重復積累,直到L個隨機采樣像素對都映射到參數(shù)空間,得到參數(shù)積累矩陣H(ρ,θ)。步驟5:峰值檢測(1)根據(jù)檢測門限G1,對參數(shù)積累矩陣H(ρ,θ)進行檢測,令H(ρ,θ)中取值小于G1的元素值為零,檢測門限設置為G1=0.3Jn;考慮圖書傾斜角,設置角度約束值θT,令H(ρ,θ)中θ絕對值小于θT的元素值為零;(2)在H(ρ,θ)中任何一個不為零的參數(shù)單元(ρu,θv),定義其局部搜索區(qū)域Ω(ρu,θv)為:Ω(ρu,θv)={(ρ,θ)|[||ρ-ρu||≤5,θ=θv,H(ρ,θ)≠0]};(3)接下來根據(jù)Ω(ρu,θv)進行判斷:如果Ω(ρu,θv)為空,這參數(shù)單元(ρu,θv)為一個局部峰值;如果Ω(ρu,θv)不為空,若H(ρu,θv)的取值大于等于區(qū)域Ω(ρu,θv)中所有單元的取值:H(ρu,θv)≥H(ρ,θ),(ρ,θ)∈Ω(ρu,θv),則參數(shù)單元(ρu,θv)為一個局部峰值;(4)提取H(ρ,θ)所有的局部峰值單元,計算局部峰值的個數(shù)tn,則子圖像Pn中圖書的冊數(shù)為tn-1;步驟6:計數(shù)清點當n的取值從1到N變化時,對于所有的子圖像Pn,重復步驟3到步驟5的過程,檢測得到所有子圖像參數(shù)積累矩陣中的峰值個數(shù)tn,n=1,2,…,N,則整個書架上圖書的冊數(shù)T為:3.有益效果和
背景技術:
相比,本發(fā)明的有益效果說明:(1)本發(fā)明采用的一種基于圖像分割和隨機hough變換的架上圖書清點方法,首先通過圖像分割將圖像分割成多個子圖像,然后對每個子圖像進行圖書清點,可以解決海量架上圖書的清點問題,具有良好的實際應用價值;(2)通過隨機hough變換對圖書邊界區(qū)域進行快速積累,檢測確定邊界峰值的數(shù)量,可以降低處理的計算量,提高清點的準確性。附圖說明附圖1是本發(fā)明的整體流程圖;附圖2是本發(fā)明實施例中要處理的架上圖書圖像;附圖3是本發(fā)明實施例中二值化處理后的圖像;附圖4是本發(fā)明實施例中濾波處理后的圖像;附圖5是本發(fā)明實施例中水平和垂直方向像素積累結果圖;附圖6是本發(fā)明實施例中圖像分割后得到的子圖像;附圖7是本發(fā)明實施例中第一個子圖像邊緣檢測結果;附圖8是本發(fā)明實施例中第一個子圖像參數(shù)積累結果;附圖9是本發(fā)明實施例中門限檢測和角度約束后的參數(shù)積累圖;附圖10是本發(fā)明實施例中第一個子圖像中局部峰值檢測結果;具體實施方式本發(fā)明主要采用試驗的方法進行驗證,所有步驟、結論都在Matlab2010a上驗證。以下結合說明書附圖1對本發(fā)明的一種基于圖像分割和隨機hough變換的架上圖書清點方法進行詳細描述。如附圖1所示,本發(fā)明處理過程可以分成3個模塊:M1是圖像分割模塊,主要根據(jù)圖像信息提取書架框架,從而根據(jù)書架的擺放格進行分割,把圖像分成多個子圖像;M2是隨機hough變換處理模塊,主要通過hough映射實現(xiàn)子圖像中邊緣像素在參數(shù)空間中的積累;M3是峰值檢測模塊,主要通過參數(shù)空間局部峰值的檢測實現(xiàn)圖書冊數(shù)的計數(shù)清點。本發(fā)明的具體處理流程如下:步驟1:圖像預處理采集包含書架框體和書脊的彩色圖像,對圖片進行修正,得到水平方向一致的圖片,并確保書架框體占滿整幅圖像,該圖像記為P,如圖2所示;以圖像左下角為原點,建立x-y直角坐標系,其中坐標系x軸方向與圖像下邊界重合,坐標系y軸方向與圖像左邊界重合;令i和j分別為圖像在坐標系x和y方向的像素單元數(shù),則圖像P可以表示成像素矩陣的形式其中p(i,j)為像素單元(i,j)處的像素值,I為圖P在x方向總的像素個數(shù),J為y方向總的像素個數(shù);步驟2:圖像分割(1)把彩色圖像P轉(zhuǎn)化為256級的灰度圖F,該灰度圖在x-y直角坐標系中可以表示成像素矩陣的形式其中f(i,j)為像素單元(i,j)處的像素值;對于任意像素單元f(i,j),通過鄰域單元像素進行微分處理計算x方向的梯度fx和y方向的梯度fy,則圖像在坐標單元(i,j)處的梯度方向為α(i,j)=arctan(fy/fx),梯度幅值為(2)通過非極大值抑制來提取邊緣的局部極值,從而剔除部分非邊緣點的影響;首先,根據(jù)α(i,j)的取值,將像素單元f(i,j)處的梯度方向均勻劃分為四個扇區(qū)區(qū)間s(i,j),分別代表水平方向、左傾方向、右傾方向和豎直方向的梯度;然后根據(jù)s(i,j)取值,查找坐標單元(i,j)處同一梯度方向的兩個8鄰域坐標單元最后,將坐標單元(i,j)處的梯度幅值與同一梯度方向的鄰域像素比較,提取梯度幅值的局部極大值;(3)采用雙閾值門限對梯度幅值進行二值化處理,設低閾值門限為σlow,高閾值門限為σhigh,對圖像進行邊緣檢測得到二值化圖像其中b(i,j)為像素單元(i,j)處的二值化像素值;對于梯度幅值介于σlow和σhigh之間的坐標單元(i,j),b(i,j)的取值根據(jù)8鄰域像素單元的梯度確定;處理后得到的二值化圖像如圖3所示,可見書架框架像素與圖書像素之間存在細微差別,但是區(qū)分度不大;(4)每一格書架框架的邊緣是水平和垂直方向的直線,而框架內(nèi)圖書的邊緣則存在較多對角的斜線,因此采用一個對角線矩陣對二值化圖像B進行濾波處理,得到新的像素值;濾波后得到的圖像如圖4所示,可見經(jīng)過濾波處理后,有效降低了背景的影響,增加了框架像素與圖書像素之間的差異性;(5)將二值圖像分別向水平和垂直方向投影,得到圖像在水平方向的積累像素Qx(i)和垂直方向的積累像素Qy(j),如圖5所示,其中圖5(a)為水平方向的像素積累圖,圖5(b)為垂直方向的像素積累圖;對比圖2和圖5可以看出,圖5中像素積累的谷值正好對應圖2中書架的框架位置;(6)根據(jù)積累參數(shù)的水平檢測門限γx和垂直檢測門限γy,提取Qx(i)谷值對應的序列號存入數(shù)組Dx,提取Qy(j)谷值對應的序列號存入數(shù)組,則Dx數(shù)據(jù)對應書架框架在水平方向的坐標,Dy數(shù)據(jù)對應書架框架在垂直方向的坐標;利用框架的信息將原圖像分割成多個子圖像,每個子圖像對應書架中一個矩形擺放格中的書脊圖像,實現(xiàn)原始圖像的分割處理,得到圖像分割結果如圖6所示;可以看出,經(jīng)過圖像分割后,原始圖像按照書架擺放格的位置準確分割成了4個子圖像,分割效果較好;步驟3:隨機采樣(1)對于第n=1個子圖像,進行預處理,得到像素單元(i,j)處的梯度方向αn(i,j);然后將αn(i,j)均勻劃分為四個扇區(qū)區(qū)間;用sn(i,j)表示子圖像Pn在坐標單元(i,j)處梯度方向所屬的扇區(qū);進行邊緣檢測得到二值化圖像如圖7所示;可以看出,經(jīng)過處理后,圖書的邊緣較為明顯;(2)在二值化圖像Bn中隨機選取一個非零元素的像素單元(i1,j1),使得0.3Jn≤j1≤0.7Jn且bn(i1,j1)≠0,該像素單元對應的梯度方向區(qū)間為sn(i1,j1);(3)在二值化圖像Bn中選取第二個非零元素的像素單元(i2,j2)≠(i1,j1),使得0.3Jn≤j2≤0.7Jn且bn(i2,j2)≠0,該像素單元對應的梯度方向區(qū)間為sn(i2,j2);如果sn(i1,j1)≠sn(i2,j2),重新采樣,直到sn(i1,j1)=sn(i2,j2),將兩個像素單元(i1,j1)和(i2,j2)組成一個隨機采樣像素對;(4)重復采樣,得到L個隨機采樣像素對;步驟4:參數(shù)積累計算積累單元距離,建立hough參數(shù)空間(ρ,θ),ρ和θ分別為空間中的距離和角度參數(shù);將隨機采樣的兩個像素單元(i1,j1)和(i2,j2)通過隨機hough變換投影到參量空間,計算相應的參數(shù)單元(ρhough,θhough);在相應的積累單元進行投票積累,使對應同一直線的采樣點能夠落入相同的積累單元,得到參數(shù)積累矩陣H(ρ,θ),如圖8所示,其中圖8(a)為三維立體直方圖,圖8(b)為H(ρ,θ)向ρ-θ平面投影后得到的二維顯示圖;從圖中可以看出,由于采用了隨機hough變換進行積累,得到的參數(shù)積累矩陣是稀疏的,該方法只需進行有限采樣像素點的映射就能實現(xiàn)圖書邊界的稀疏積累,因此其計算量比傳統(tǒng)的hough變換要低;步驟5:峰值檢測(1)根據(jù)檢測門限G1=0.3Jn,對參數(shù)積累矩陣H(ρ,θ)進行檢測,令H(ρ,θ)中取值小于G1的元素值為零;考慮圖書傾斜角,設置角度約束值θT=10°,令H(ρ,θ)中θ絕對值小于θT的元素值為零,得到結果如圖9所示;與圖8(b)對比可知,經(jīng)過門限檢測和角度約束后,圖9中排除了大量無關積累單元;(2)在H(ρ,θ)中任何一個不為零的參數(shù)單元(ρu,θv),定義其局部搜索區(qū)域Ω(ρu,θv)為:Ω(ρu,θv)={(ρ,θ)|[||ρ-ρu||≤5,θ=θv,H(ρ,θ)≠0]};(3)接下來根據(jù)Ω(ρu,θv)進行判斷:如果Ω(ρu,θv)為空,參數(shù)單元(ρu,θv)為一個局部峰值;如果Ω(ρu,θv)不為空,若H(ρu,θv)的取值大于等于區(qū)域Ω(ρu,θv)中所有單元的取值:H(ρu,θv)≥H(ρ,θ),(ρ,θ)∈Ω(ρu,θv),則參數(shù)單元(ρu,θv)為一個局部峰值;(4)提取H(ρ,θ)所有的局部峰值單元,如圖10所示,其中白色矩形表示局部峰值的位置,對峰值數(shù)量進行計數(shù)可得t1=48,則子圖像P1中圖書的冊數(shù)為t1-1=47,這與該子圖像中圖書的冊數(shù)一致;步驟6:計數(shù)清點當n的取值從1到N變化時,對于所有的子圖像Pn,重復步驟3到步驟5的過程,檢測得到所有子圖像參數(shù)積累矩陣中的峰值個數(shù),如表1所示:表1圖書清點結果圖像類別實際冊數(shù)檢測冊數(shù)(θT=5°)檢測冊數(shù)(θT=10°)子圖像P1474747子圖像P2373737子圖像P3444444子圖像P4383538整體圖像P166163166為了便于比較,表1在角度約束值θT的取值分別為5°、10°的環(huán)境中進行驗證,可以看出θT的取值對方法的性能影響較大;例如,在子圖像P4中,由于部分圖書的傾斜角較大,當θT取值較小時,會造成漏檢;通過調(diào)整θT的取值,可以提高圖書清點的準確性,如果在圖書擺放時盡量使圖書垂直放置,本方法清點的效果更好。從實施例驗證結果可以看出,本發(fā)明很好地解決了架上圖書的清點問題:首先,根據(jù)圖像邊緣像素積累提取框架信息,從而把圖像分成多個子圖像,每個子圖像代表書架上一個擺放格中的書脊圖像;然后,通過隨機hough映射實現(xiàn)子圖像中圖書邊界直線在參數(shù)空間中的快速積累;最后,在參數(shù)空間中檢測局部峰值,從而實現(xiàn)書架上每一擺放格中圖書冊數(shù)的計數(shù)清點,并最終得到書架上所有圖書的冊數(shù);本發(fā)明較好地結合了圖像處理和隨機hough變換的優(yōu)點,采用計算機處理實現(xiàn)架上圖書的自動清點;方法簡單高效,易于實施,大大降低了圖書清點的工作量,具有較強的實用性和推廣應用價值。本實施例沒有詳細敘述的部分屬本行業(yè)公知的常用手段,這里不一一敘述。當前第1頁1 2 3