两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

手語視頻的相似度評估模型的建立方法

文檔序號:6428707閱讀:204來源:國知局
專利名稱:手語視頻的相似度評估模型的建立方法
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理的技術(shù)領(lǐng)域,具體地涉及一種手語視頻的相似度評估模型的
建立方法。
背景技術(shù)
手語合成是近年來比較活躍的一個研究方向。從合成效果的真實感和可接受程度上看,基于真人視頻剪輯拼接的手語合成方法比基于三維模型的方法具有明顯的優(yōu)勢。并且基于真人視頻拼接的手語,可提高合成手語的可接受性,將其應(yīng)用于計算機等交互界面中,為聽障人群提供更為形象生動的視覺語言表達(dá)界面。視頻相似度研究主要包括兩方面,一是相似性度量,二是快速檢索方法。視頻檢索方面的研究已經(jīng)取得了一定的成果,如意大利巴勒莫大學(xué)開發(fā)的基于內(nèi)容的視頻查詢系統(tǒng) JACOB。它主要強調(diào)視頻數(shù)據(jù)流中時序的分割、基于時序的語義的提取,對于視頻的特征提取,除了顏色信息、紋理信息、形狀信息等圖像特征外,還可以利用運動信息。在特征提取和相似性度量方面,已經(jīng)有一些具有參考意義的研究結(jié)果,如清華大學(xué)的高躍等人提出了基于片段的視頻拼接方法,通過次采樣幀和層次累計聚類提取視頻特征,用比例化最大權(quán)二分匹配實現(xiàn)相似性度量;普林斯頓大學(xué)的董偉等人提出了隨機化視頻特征提取算法,將特征投影到基于位置敏感哈希(LSH)的直方圖上,并采用基于核的相似性度量方法。這些研究研究雖然在特征提取和相似性度量中獲得了一定的成功,但其所采用的計算過程一般較復(fù)雜,而且特征數(shù)量的增多也帶來了相似性度量的困難并且缺乏對特征的進一步篩選和特征計算的簡化。針對這些問題,曹政等人提出了一種快速相似視頻檢索方法,從視覺相似性出發(fā),根據(jù)視頻的時空分布特征統(tǒng)計計算壓縮視頻簽名,通過視頻簽名的距離度量視頻相似性,該方法對大規(guī)模數(shù)據(jù)庫亦快速有效,但也存在一個問題,就是該方法只解決了視頻的視覺相似性,不包含語義信息,而視覺相似的視頻可能包含不同的語義,反之語義相似的視頻內(nèi)容也可能完全不同。手語運動主要側(cè)重語義的理解,因此,除了視覺信息,還需要重點考慮手語運動的語義信息。手語是人體運動形式的一個子集,因此對人的運動分析的方法同樣適用于手語運動分析,手語視頻相似度評估和檢索的依據(jù)是邏輯相似性,即是否屬于同一類型的運動序列。Kovar等人利用多步搜索策略實現(xiàn)了這一目的,他們定義了一種基于DTW的索引結(jié)構(gòu)motion web作為度量運動間數(shù)值相似性的標(biāo)準(zhǔn),然后以已檢索出的數(shù)字相似的運動作為中間媒介,繼續(xù)搜索與它們數(shù)值相似的運動,該方法的問題是算法復(fù)雜度較高。在 SIGGRAPH2005中,Muller等提出了有效的基于內(nèi)容的運動檢索方法,用來搜索邏輯相似的運動序列,通過引入語義豐富的幾何特征,將運動庫中的運動數(shù)據(jù)按照特征分割為小段,對這些分割段建立索引,可以使相似性搜索在分割段的層次進行,而不是在幀的層次進行,有效地降低了運算復(fù)雜度,但該方法的檢索依賴于對輸入文本的分析,因而對交互過程中的用戶輸入要求比較高,不能實現(xiàn)通過解析輸入視頻進而檢索相似視頻的目的。

發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題是克服現(xiàn)有技術(shù)的不足,提供一種融合視覺特征和語義特征的手語視頻的相似度評估模型的建立方法。本發(fā)明的技術(shù)解決方案是這種手語視頻的相似度評估模型的建立方法,包括以下步驟(1)確定主觀評估值對隨機抽取N個人的每個視頻對進行整體相似度評估,并給出N個主觀評分,然后對N個主觀評分取平均值作為主觀評估值,N為正整數(shù);(2)進行特征提取對每個視頻逐幀進行標(biāo)注,包括肩、肘、腕三個關(guān)節(jié)位置的標(biāo)注,并存儲成.xml格式的文件,特征提取包括對用于軌跡評估的關(guān)節(jié)位置的提取和對用于輪廓評估的胳膊形態(tài)的提取,然后基于貪心算法提取出左右胳膊的樣例庫;(3)進行視覺相似度評估基于視頻時空分布特征計算得到壓縮視頻簽名,并通過計算視頻簽名距離進行視覺相似性度量;(4)進行輪廓相似度評估基于步驟( 的樣例庫,將視頻的每幀圖像與樣例庫中的樣例進行比較,提取出給定視頻的胳膊形態(tài)序列,通過比較的匹配程度進行輪廓相似度的評估;(5)進行運動軌跡相似度評估基于步驟O)的腕關(guān)節(jié)位置的標(biāo)注,生成運動軌跡,并確定軌跡的距離,該距離即DTW(Dynamic Time Warping,動態(tài)時間規(guī)整)失真度,然后將其轉(zhuǎn)換到W,l]區(qū)間作為其運動軌跡的相似度評估;(6)進行模型融合視覺相似度評估、輪廓相似度評估和運動軌跡相似度評估作為解釋變量,步驟(1)的主觀評估值作為響應(yīng)變量,將解釋變量與響應(yīng)變量進行多元線性回歸分析,然后融合成多元線性評估模型。由于本方法分別對視覺相似度和語義(包括輪廓和運動軌跡)相似度進行評估, 然后將它們進行模型融合,所以是一種融合視覺特征和語義特征的手語視頻的相似度評估模型的建立方法。


圖1是本方法的軟件應(yīng)用環(huán)境方框示意圖;圖2示出了本方法的流程圖;圖3是本方法的軟件應(yīng)用的數(shù)據(jù)傳輸路徑圖。
具體實施例方式這種手語視頻的相似度評估模型的建立方法,包括以下步驟(1)確定主觀評估值對隨機抽取N個人的每個視頻對進行整體相似度評估,并給出N個主觀評分,然后對N個主觀評分取平均值作為主觀評估值,N為正整數(shù);(2)進行特征提取對每個視頻逐幀進行標(biāo)注,包括肩、肘、腕三個關(guān)節(jié)位置的標(biāo)注,并存儲成.xml格式的文件,特征提取包括對用于軌跡評估的關(guān)節(jié)位置的提取和對用于輪廓評估的胳膊形態(tài)的提取,然后基于貪心算法提取出左右胳膊的樣例庫;(3)進行視覺相似度評估基于視頻時空分布特征計算得到壓縮視頻簽名,并通過計算視頻簽名距離進行視覺相似性度量;
(4)進行輪廓相似度評估基于步驟( 的樣例庫,將視頻的每幀圖像與樣例庫中的樣例進行比較,提取出給定視頻的胳膊形態(tài)序列,通過比較的匹配程度進行輪廓相似度的評估;(5)進行運動軌跡相似度評估基于步驟O)的腕關(guān)節(jié)位置的標(biāo)注,生成運動軌跡,并確定軌跡的距離,該距離即DTW(Dynamic Time Warping,動態(tài)時間規(guī)整)失真度,然后將其轉(zhuǎn)換到W,l]區(qū)間作為其運動軌跡的相似度評估;(6)進行模型融合視覺相似度評估、輪廓相似度評估和運動軌跡相似度評估作為解釋變量,步驟(1)的主觀評估值作為響應(yīng)變量,將解釋變量與響應(yīng)變量進行多元線性回歸分析,然后融合成多元線性評估模型。優(yōu)選地,所述步驟(2)包括以下分步驟(2. 1)設(shè)定一個初始樣例,并將其加入樣例庫;(2. 2)對采集的手語視頻的每幀圖像的肩、肘、腕三個關(guān)節(jié)的位置作為特征點與樣例庫中的樣例進行比較;(2. 3)如果待比較的胳膊形態(tài)與樣例庫中所有樣例的三個特征點的位置總差值超過閾值,則該胳膊為一個新樣例,將其加入樣例庫中,執(zhí)行步驟(2.2);否則執(zhí)行步驟 (2. 4);(2.4)結(jié)束。優(yōu)選地,所述步驟C3)包括以下分步驟(3. 1)根據(jù)以下公式得到視頻對應(yīng)的YCb(;直方圖
權(quán)利要求
1.手語視頻的相似度評估模型的建立方法,其特征在于,該方法包括以下步驟(1)確定主觀評估值對隨機抽取N個人的每個視頻對進行整體相似度評估,并給出N 個主觀評分,然后對N個主觀評分取平均值作為主觀評估值,N為正整數(shù);(2)進行特征提取對每個視頻逐幀進行標(biāo)注,包括肩、肘、腕三個關(guān)節(jié)位置的標(biāo)注,并存儲成.xml格式的文件,特征提取包括對用于軌跡評估的關(guān)節(jié)位置的提取和對用于輪廓評估的胳膊形態(tài)的提取,然后基于貪心算法提取出左右胳膊的樣例庫;(3)進行視覺相似度評估基于視頻時空分布特征計算得到壓縮視頻簽名,并通過計算視頻簽名距離進行視覺相似性度量;(4)進行輪廓相似度評估基于步驟( 的樣例庫,將視頻的每幀圖像與樣例庫中的樣例進行比較,提取出給定視頻的胳膊形態(tài)序列,通過比較的匹配程度進行輪廓相似度的評估;(5)進行運動軌跡相似度評估基于步驟O)的腕關(guān)節(jié)位置的標(biāo)注,生成運動軌跡,并確定軌跡的距離,該距離即動態(tài)時間規(guī)整DTW失真度,然后將其轉(zhuǎn)換到
區(qū)間作為其運動軌跡的相似度評估;(6)進行模型融合視覺相似度評估、輪廓相似度評估和運動軌跡相似度評估作為解釋變量,步驟(1)的主觀評估值作為響應(yīng)變量,將解釋變量與響應(yīng)變量進行多元線性回歸分析,然后融合成多元線性評估模型。
2.根據(jù)權(quán)利要求1所述的建立方法,其特征在于,所述步驟( 包括以下分步驟(2. 1)設(shè)定一個初始樣例,并將其加入樣例庫;(2. 2)對采集的手語視頻的每幀圖像的肩、肘、腕三個關(guān)節(jié)的位置作為特征點與樣例庫中的樣例進行比較;(2. 3)如果待比較的胳膊形態(tài)與樣例庫中所有樣例的三個特征點的位置總差值超過閾值,則該胳膊為一個新樣例,將其加入樣例庫中,執(zhí)行步驟(2. ;否則執(zhí)行步驟(2.4);(2. 4)結(jié)束。
3.根據(jù)權(quán)利要求2所述的建立方法,其特征在于,所述步驟C3)包括以下分步驟(3. 1)根據(jù)以下公式得到視頻對應(yīng)的YCb(;直方圖s = 2m1+m2+3m3NNN=Yj^Yi =YdCbi ;m3 = YjCrl /=1 /=1 /=1其中Y” Cbi, Cri是歸一化直方圖區(qū)間頻數(shù),i為對應(yīng)區(qū)間,頻數(shù)按從大到小降序排列, N取64,1 , ,! 是加權(quán)值;(3. 2)根據(jù)視頻幀的時空分布特性,視頻簽名形成了代表該視頻特征的埋單序列,表示為、和vd,計算公式如下v^ =Zsi/L'Vd =^isi-vj/L)^ ‘=1Tt其中Si是每幀圖像的編碼,L是視頻的幀數(shù);(3. 3)通過以下公式進行兩視頻片段的視覺相似度評估D_l In2I+Kn- IοmaxOml,vm2) + max(v⑴,vd2)°
4.根據(jù)權(quán)利要求3所述的建立方法,其特征在于,所述步驟(6)中的多元線性回歸模型為y = 1. 415χ1+0. 145χ2+0. 319χ3_0· 972其中y是響應(yīng)變量,Xi(i = 1、2、3)是解釋變量,X1,&,&分別對應(yīng)視覺,輪廓和運動軌跡三種特征的評估結(jié)果。
5.根據(jù)權(quán)利要求1所述的建立方法,其特征在于,在所述步驟(6)之后還包括對多元線性回歸模型的有效性進行驗證。
全文摘要
公開了一種融合視覺特征和語義特征的手語視頻的相似度評估模型的建立方法,包括以下步驟(1)確定主觀評估值;(2)進行特征提取對每個視頻逐幀進行標(biāo)注并存儲成.xml格式的文件,基于貪心算法提取出左右胳膊的樣例庫;(3)進行視覺相似度評估;(4)進行輪廓相似度評估;(5)進行運動軌跡相似度評估;(6)進行模型融合視覺、輪廓和運動軌跡相似度評估作為解釋變量,主觀評估值作為響應(yīng)變量,將解釋變量與響應(yīng)變量進行多元線性回歸分析,然后融合成多元線性評估模型。
文檔編號G06K9/64GK102222237SQ201110200160
公開日2011年10月19日 申請日期2011年7月14日 優(yōu)先權(quán)日2011年7月14日
發(fā)明者孔德慧, 尹寶才, 王立春, 王茹 申請人:北京工業(yè)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
涡阳县| 望江县| 垣曲县| 阿城市| 宝坻区| 鱼台县| 沅陵县| 长武县| 托克逊县| 阜城县| 北票市| 嵊州市| 黄石市| 宿松县| 旺苍县| 揭西县| 郓城县| 利川市| 榆中县| 左云县| 简阳市| 余姚市| 光山县| 彭泽县| 灌阳县| 武汉市| 赞皇县| 岢岚县| 寻乌县| 沈丘县| 常宁市| 佛坪县| 广灵县| 河间市| 新晃| 安塞县| 望城县| 健康| 墨竹工卡县| 栾城县| 紫金县|