一種書法字風(fēng)格的識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機數(shù)字圖像分析和識別,屬于模式識別領(lǐng)域,尤其涉及一種書法 字風(fēng)格的識別方法。
【背景技術(shù)】
[0002] 在印刷技術(shù)發(fā)明之前,文字都是依靠手寫的。優(yōu)秀的手寫作品稱為書法。而中華 民族五千年文化中有著大量書法作品。為了文化的傳承,數(shù)字圖書館將這些書籍和作品用 高精度掃描儀掃描后,以數(shù)字化方式進(jìn)行傳播。書法作品的數(shù)字化是把頁面掃描成圖像,不 是技術(shù)難題;但數(shù)字化后對書法圖像內(nèi)容的分析和解釋存在著問題。特別是書法風(fēng)格的多 樣性,即書寫線條的多變性,使得書法風(fēng)格的描述和鑒別都停留在主觀上,缺少客觀的量化 過程?,F(xiàn)階段對中國書法風(fēng)格的描述和鑒賞是在藝術(shù)領(lǐng)域進(jìn)行的,是主觀的,會有下面的問 題:
[0003] 1、書法風(fēng)格的描述和鑒賞主要采用目測法,比如"望氣法",只需觀察一眼便可斷 定風(fēng)格,缺乏具體特征說明過程,充滿"只可意會而不可言傳"的"玄妙"。
[0004] 2、個人記憶力有限,研究側(cè)重點不同,單個書法家往往只掌握一個或幾個方面的 特征。
[0005] 3、主觀意識左右風(fēng)格鑒別結(jié)果,譬如啟功說的"挾長"、"護(hù)短"、"尊賢"、"遠(yuǎn)害",這 會導(dǎo)致糾紛和爭議。
[0006] 與藝術(shù)家對書法風(fēng)格的主觀描述相比,客觀的書法風(fēng)格的識別更有助于書法的學(xué) 習(xí)和鑒賞。而目前尚未見相應(yīng)的基于圖像內(nèi)容的書法風(fēng)格分類和風(fēng)格識別系統(tǒng)。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明提供一種書法字風(fēng)格的識別方法,采用風(fēng)格特征值對書法字風(fēng)格進(jìn)行量化 表達(dá),使在原先在藝術(shù)領(lǐng)域中主觀的書法風(fēng)格變成客觀的,可以用計算機進(jìn)行自動分類,為 書法真?zhèn)舞b別奠定了分類基礎(chǔ)。
[0008] 為了達(dá)到上述目的,本發(fā)明提供一種書法字風(fēng)格的識別方法,包含以下步驟:
[0009] 步驟S1、構(gòu)造書法字訓(xùn)練樣本,對訓(xùn)練樣本進(jìn)行風(fēng)格標(biāo)注,計算每種風(fēng)格字體的風(fēng) 格特征值;
[0010] 步驟S2、計算待識別書法字的風(fēng)格特征值;
[0011] 步驟S3、根據(jù)風(fēng)格特征值計算待識別書法字屬于書法字訓(xùn)練樣本中每一種風(fēng)格的 條件概率,根據(jù)條件概率的大小判斷待識別書法字的風(fēng)格。
[0012] 所述的步驟Sl包含以下步驟:
[0013] 步驟SI. 1、得到書法作品的單個書法字的圖像集合;
[0014] 對掃描得到的書法作品頁面圖像進(jìn)行全局二值化,接著根據(jù)作品列間距,利用投 影直方圖將頁面切分成多列,然后利用字間距把每一列切成單個書法字,得到單個書法字 的圖像集合;
[0015] 步驟SI. 2、對書法字圖像進(jìn)行風(fēng)格標(biāo)注;
[0016] 分為五種書法風(fēng)格:篆書,隸書,措書,行書和草書;
[0017] 步驟SI. 3、計算書法字的風(fēng)格特征值;
[0018] 步驟SI. 4、分別計算書法字訓(xùn)練樣本中各類風(fēng)格書法字的風(fēng)格特征值的平均值和 協(xié)方差。
[0019] 所述的步驟SI. 3包含以下步驟:
[0020] 步驟SI. 3. 1、對書法字圖像進(jìn)行二值化,提取骨架信息;
[0021] 步驟SI. 3. 2、提取書法字圖像的風(fēng)格特征值;
[0022] 所述的風(fēng)格特征值包含筆畫級風(fēng)格特征和字級風(fēng)格特征;
[0023] 所述的筆畫級風(fēng)格特征包含橫筆特征和豎筆特征;
[0024] 所述的橫筆特征包含橫筆個數(shù)、斜率、橫向碼比值、左斜碼比值、右斜碼比值、起筆 處斜率、收筆處斜率;
[0025] 所述的豎筆特征包含豎筆個數(shù)、斜率、豎向碼比值、左斜碼比值、右斜碼比值;
[0026] 所述的字級風(fēng)格特征包含平均筆寬、筆寬變化率、最大筆寬值、最細(xì)筆寬值、黑白 二值比、高寬比、重心位置、左右墨點比、字在X軸壓力變化、字在Y軸壓力變化、字在X軸傾 斜平衡、字在Y軸傾斜平衡。
[0027] 所述的步驟SI. 3. 1包含以下步驟:
[0028] 步驟SI. 3. 1. 1、將書法字圖像轉(zhuǎn)為二值化圖像;
[0029] 步驟SI. 3. 1. 2、利用中軸轉(zhuǎn)換算法獲取書法字的骨架,然后再把有兩個像素點寬 的骨架點變成一個像素點寬的骨架點;
[0030] 步驟SI. 3. 1. 3、從骨架的一個端點出發(fā),跟蹤一個像素點寬的骨架走勢,利用八鏈 碼序列表達(dá)書法字的橫筆和豎筆信息。
[0031] 所述的步驟SI. 3. 2中,所述的橫筆特征具體如下:
[0032] 檢測到的橫筆個數(shù)fh raunt;
[0033] 橫筆筆畫的平均斜率fh sl_,即所有橫筆筆畫斜率的平均值;
[0034] 橫筆筆畫的橫向碼比值fh MtlC],即計算橫筆筆畫八鏈碼中0和4的比例;
[0035] 橫筆筆畫的左斜碼比值fh2,即計算橫筆筆畫八鏈碼中1和5所占的比例;
[0036] 橫筆筆畫的右斜碼比值fh3,即計算橫筆筆畫八鏈碼中3和7所占的比例;
[0037] 橫筆的起筆處斜率fh head;
[0038] 橫筆的收筆處斜率fh end;
[0039] 所述的豎筆特征具體如下:
[0040] 檢測到的豎筆個數(shù)fv c_t;
[0041] 豎筆筆畫的平均斜率fv sl_,即所有豎筆筆畫斜率的平均值;
[0042] 豎筆筆畫的豎向碼比值fV MtlC],即計算豎筆筆畫八鏈編碼中6所占的比例;
[0043] 豎筆筆畫的左斜碼比值fv2,即計算豎筆筆畫八鏈編碼中1和5所占的比例;
[0044] 豎筆筆畫的右斜碼比值fv3,即計算豎筆筆畫八鏈編碼中3和7所占的比例;
[0045] 所述的字級風(fēng)格特征具體如下:
[0046] 對于每個字,以每個骨架點i為中心,圓內(nèi)像素點95%以上的點為二值前景色的 最大半徑Cl1,假設(shè)骨架信息圖上一共有η個像素點,則前4項字級風(fēng)格特征為: CN 105117741 A 說明書 3/9 頁
[0049] 最大筆寬值,即所有點寬度的前五分之一寬的平均寬度^ax wldth;
[0050] 最細(xì)筆寬值,即所有點寬度的后五分之一寬的平均寬度f__wldth;
[0051] 根據(jù)二值化圖像為M*N像素點,(X,y)為坐標(biāo),P (X,y)表示二值圖像像素點:
[0053] 則另外8項字級風(fēng)格特征值為:
[0055] 高寬比 faspe(:t-ratl。= N/M ;
[0056] 重心位置:
[0057] 字在橫線(X軸)的重心
[0058] 字在縱向(Y軸)的重心
[0059] 左右墨點比:
[0060] 字在X軸壓力變化特征
[0064] 傾斜率:
[0065] 字在X軸傾斜平衡fslant_x
[0066] CN 105117741 A 說明書 4/9 頁
[0069] 所述的步驟SI. 4中,五種書法風(fēng)格分別是篆書,隸書,楷書,行書和草書,用ω ,表 示,其中下標(biāo)k = 1,2. .. 5是5種風(fēng)格的標(biāo)號,每種風(fēng)格各有1個樣本,S jik代表數(shù)據(jù)庫存 儲的一個書法字樣本,其中j = 1,2,. . .,Mk,則書法字Sjik的24個特征變量為f I jik,其中1 =1,2,. .,24,每一個書法字樣本的24個特征值匕jik組成的特征值向量F jik= [f I jik,f2i。 ,k,· · ·,f 24, j,k];
[0070] 計算每種風(fēng)格的訓(xùn)練樣本的風(fēng)格特征值向量的平均值向量:
[0072] 計算每種風(fēng)格的訓(xùn)練樣本的風(fēng)格特征值向量的協(xié)方差矩陣:
[0074] 所述的步驟S2中,采用與步驟SI. 3中計算書法字的風(fēng)格特征值相同的方法來計 算待識別書法字的風(fēng)格特征值。
[0075] 所述的步驟S3中,根據(jù)基于高斯特征模型的線性分類器,計算待識別書法字屬于 每一種風(fēng)格的條件概率pk,計算出5個條件概率值,根據(jù)條件概率的值判斷書法字的風(fēng)格, 條件概率值最高的那個風(fēng)格即是這個待識別書法字的風(fēng)格;
[0077] 其中,忙=Q1a.,CV1是每種風(fēng)格的訓(xùn)練樣本的風(fēng)格特征值向量的協(xié)方差矩陣 的逆矩陣,μ k是每種風(fēng)格的訓(xùn)練樣本的風(fēng)格特征值向量的平均值向量,Q是待識別書法字, F是待識別書法字的風(fēng)格特征值,<^是書法風(fēng)格分類標(biāo)簽。
[0078] 本發(fā)明采用風(fēng)格特征值對書法字風(fēng)格進(jìn)行量化表達(dá),使在原先在藝術(shù)領(lǐng)域中主觀 的書法風(fēng)格變成客觀的,可以用計算機進(jìn)行自動分類,為書法真?zhèn)舞b別奠定了分類基礎(chǔ)。
【附圖說明】
[0079] 圖1是本發(fā)明的流程圖。
[0080] 圖2為頁面切分成單字的示意圖。
[0081] 圖3為骨架筆畫提取示例:原圖、二值圖像以及骨架提取圖像。
[0082] 圖4為8方向鏈碼、對應(yīng)的圖像像素位置及其數(shù)組編碼。
[0083] 圖5為骨架筆畫圖、跟蹤得到的鏈碼表達(dá)序列及8個鏈碼所占比例。
[0084] 圖6為基于每個骨架點的筆畫寬度計算示例。
[0085