一種視頻檢索方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種視頻檢索方法和系統(tǒng),包括:將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段;得到所述視頻的主題詞;根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注,制作每一個(gè)視頻片段的視頻摘要,根據(jù)所述文本標(biāo)注和視頻摘要構(gòu)建視頻的語義內(nèi)容索引,根據(jù)所述語義內(nèi)容索引快速瀏覽和檢索視頻內(nèi)容。本發(fā)明能夠?qū)⒁曨l切分成內(nèi)容相對獨(dú)立的多個(gè)視頻片段,得到每一個(gè)視頻片段的主題詞,并在此基礎(chǔ)上對視頻進(jìn)行結(jié)構(gòu)化,建立對視頻的語義內(nèi)容索引,從而方便用戶快速預(yù)覽視頻內(nèi)容,定位其感興趣的信息,提高了用戶瀏覽和檢索的效率。
【專利說明】一種視頻檢索方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多媒體【技術(shù)領(lǐng)域】,尤其涉及一種視頻檢索方法和系統(tǒng)。
【背景技術(shù)】
[0002]我國農(nóng)村醫(yī)療條件和設(shè)施薄弱,醫(yī)療衛(wèi)生建設(shè)步伐相對滯后,且由于經(jīng)濟(jì)相對落后,科學(xué)文化水平較低,農(nóng)村居民普遍缺乏醫(yī)療衛(wèi)生與營養(yǎng)健康意識,不利于群眾的營養(yǎng)健康保健和疾病的防御防范,尤其是婦女、兒童及老人等弱勢群體缺乏基本的營養(yǎng)知識及健康保健技術(shù),其營養(yǎng)健康水平嚴(yán)重落后于發(fā)達(dá)地區(qū)。
[0003]為了普及營養(yǎng)健康保健及常見疾病預(yù)防診治知識,可通過編制針對農(nóng)村重點(diǎn)人群如婦女、兒童、老人等的營養(yǎng)健康保健及常見疾病防治的營養(yǎng)健康視頻提高人們的營養(yǎng)健康意識,最大程度減少營養(yǎng)不良等健康問題的發(fā)生,并能對常見疾病進(jìn)行預(yù)防和治療。
[0004]但是對于一期長達(dá)I小時(shí)左右的營養(yǎng)健康視頻來說,觀眾可能只對視頻中的某些內(nèi)容感興趣。例如,一期以高血壓的預(yù)防治療為主題的健康教育視頻,有些觀眾可能只對其中大約5分鐘左右的高血壓的日常飲食方面內(nèi)容比較感興趣。但是,由于營養(yǎng)健康視頻沒有進(jìn)行結(jié)構(gòu)化,缺乏內(nèi)容索引,為了找到這部分內(nèi)容,觀眾往往需要瀏覽整個(gè)視頻,對于觀眾來說,瀏覽不感興趣的內(nèi)容不僅冗長乏味的,而且耗費(fèi)時(shí)間、精力。
【發(fā)明內(nèi)容】
[0005](一)要解決的技術(shù)問題
[0006]本發(fā)明提供一種視頻檢索方法和系統(tǒng),以解決現(xiàn)有技術(shù)中對感興趣部分查找困難的技術(shù)問題。
[0007](二)技術(shù)方案
[0008]為解決上述技術(shù)問題,本發(fā)明提供一種視頻檢索方法,包括:
[0009]將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段;
[0010]得到所述視頻的主題詞;
[0011]根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注,制作每一個(gè)視頻片段的視頻摘要,根據(jù)所述文本標(biāo)注和視頻摘要構(gòu)建視頻的語義內(nèi)容索引,根據(jù)所述語義內(nèi)容索引快速瀏覽和檢索視頻內(nèi)容。
[0012]進(jìn)一步地,所述將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段包括:
[0013]提取視頻的視覺特征;
[0014]度量相鄰兩幀的相似性;
[0015]通過預(yù)先設(shè)定的切分鏡頭邊緣的閾值,確定鏡頭切分位置,得到多個(gè)內(nèi)容獨(dú)立的視頻片段。
[0016]進(jìn)一步地,所述得到所述視頻的主題詞包括:
[0017]使用自動分詞法對視頻的字幕文檔進(jìn)行分句,對每一句使用全監(jiān)督式分詞模型進(jìn)行分詞;[0018]對每個(gè)詞使用全監(jiān)督式詞性標(biāo)注模型進(jìn)行詞性標(biāo)注;
[0019]統(tǒng)計(jì)其中詞性標(biāo)注為名詞的詞在視頻的字幕文檔中出現(xiàn)的詞頻,將詞頻前20位的名詞作為視頻的主題詞。
[0020]進(jìn)一步地,所述根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注包括:
[0021]以視頻的每個(gè)主題詞作為查詢詞,在每一個(gè)視頻片段的字幕文檔中進(jìn)行搜索,將成功搜索到的主題詞作為該視頻片段的文本標(biāo)注。
[0022]進(jìn)一步地,所述制作每一個(gè)視頻片段的視頻摘要包括:
[0023]提取每一個(gè)視頻片段的首尾幀,并隨機(jī)抽取中間的10幀,形成該視頻片段的視頻摘要。
[0024]另一方面,本發(fā)明還提供一種視頻檢索系統(tǒng),包括:視頻結(jié)構(gòu)化模塊、視頻內(nèi)容主題詞提取模塊和視頻語義索引自動生成模塊,視頻結(jié)構(gòu)化模塊和視頻內(nèi)容主題詞提取模塊與視頻語義索引自動生成模塊分別相連,其中:
[0025]視頻結(jié)構(gòu)化模塊,用于將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段;
[0026]視頻內(nèi)容主題詞提取模塊,用于得到所述視頻的主題詞;
[0027]視頻語義索引自動生成模塊,用于根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注,制作每一個(gè)視頻片段的視頻摘要,根據(jù)所述文本標(biāo)注和視頻摘要構(gòu)建視頻的語義內(nèi)容索引,根據(jù)所述語義內(nèi)容索引快速瀏覽和檢索視頻內(nèi)容。
[0028]進(jìn)一步地,所述視頻結(jié)構(gòu)化模塊包括:
[0029]視頻視覺特征提取模塊,用于提取視頻的視覺特征;
[0030]鏡頭相似度計(jì)算及鏡頭切分模塊,用于度量相鄰兩幀的相似性;通過預(yù)先設(shè)定的切分鏡頭邊緣的閾值,確定鏡頭切分位置,得到多個(gè)內(nèi)容獨(dú)立的視頻片段。
[0031]進(jìn)一步地,所述視頻內(nèi)容主題詞提取模塊包括:
[0032]自動分詞模塊,用于使用自動分詞法對視頻的字幕文檔進(jìn)行分句,對每一句使用全監(jiān)督式分詞模型進(jìn)行分詞;
[0033]詞頻統(tǒng)計(jì)和主題詞提取模塊,用于統(tǒng)計(jì)其中詞性標(biāo)注為名詞的詞在視頻的字幕文檔中出現(xiàn)的詞頻,將詞頻前20位的名詞作為視頻的主題詞。
[0034]進(jìn)一步地,所述視頻語義索引自動生成模塊包括:
[0035]文本標(biāo)注生成模塊,用于以視頻的每個(gè)主題詞作為查詢詞,在每一個(gè)視頻片段的字幕文檔中進(jìn)行搜索,將成功搜索到的主題詞作為該視頻片段的文本標(biāo)注。
[0036]進(jìn)一步地,所述視頻語義索引自動生成模塊包括:
[0037]視頻摘要提取模塊,用于提取每一個(gè)視頻片段的首尾幀,并隨機(jī)抽取中間的10幀,形成該視頻片段的視頻摘要。
[0038](三)有益效果
[0039]可見,在本發(fā)明提出的一種視頻檢索方法和系統(tǒng)中,能夠?qū)⒁曨l切分成內(nèi)容相對獨(dú)立的多個(gè)視頻片段,得到每一個(gè)視頻片段的主題詞,并在此基礎(chǔ)上對視頻進(jìn)行結(jié)構(gòu)化,建立對視頻的語義內(nèi)容索引,從而方便用戶快速預(yù)覽視頻內(nèi)容,定位其感興趣的信息,提高了用戶瀏覽和檢索的效率。
【專利附圖】
【附圖說明】[0040]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0041]圖1是本發(fā)明實(shí)施例1視頻檢索方法的流程不意圖;
[0042]圖2是本發(fā)明實(shí)施例2視頻檢索方法的流程不意圖;
[0043]圖3是本發(fā)明實(shí)施例3視頻檢索系統(tǒng)的基本結(jié)構(gòu)不意圖;
[0044]圖4是本發(fā)明實(shí)施例3視頻檢索系統(tǒng)的一個(gè)優(yōu)選結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0045]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0046]實(shí)施例1:
[0047]本發(fā)明實(shí)施例1提供一種視頻檢索方法,參見圖1,包括:
[0048]步驟101:將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段;
[0049]步驟102:得到所述視頻的主題詞;
[0050]步驟103:根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注,制作每一個(gè)視頻片段的視頻摘要,根據(jù)所述文本標(biāo)注和視頻摘要構(gòu)建視頻的語義內(nèi)容索引,根據(jù)所述語義內(nèi)容索引快速瀏覽和檢索視頻內(nèi)容。
[0051 ] 可見,在本發(fā)明實(shí)施例提出的一種視頻檢索方法中,能夠?qū)⒁曨l切分成內(nèi)容相對獨(dú)立的多個(gè)視頻片段,并得到視頻的主題詞,在此基礎(chǔ)上對視頻進(jìn)行結(jié)構(gòu)化,建立對視頻的語義內(nèi)容索引,從而方便用戶快速預(yù)覽視頻內(nèi)容,定位其感興趣的信息,提高了用戶瀏覽和檢索的效率。
[0052]優(yōu)選地,將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段可以包括:提取視頻的視覺特征;度量相鄰兩幀的相似性;通過預(yù)先設(shè)定的切分鏡頭邊緣的閾值,確定鏡頭切分位置,得到多個(gè)內(nèi)容獨(dú)立的視頻片段。
[0053]優(yōu)選地,得到所述視頻的主題詞可以包括:使用自動分詞法對視頻的字幕文檔進(jìn)行分句,對每一句使用全監(jiān)督式分詞模型進(jìn)行分詞;對每個(gè)詞使用全監(jiān)督式詞性標(biāo)注模型進(jìn)行詞性標(biāo)注;統(tǒng)計(jì)其中詞性標(biāo)注為名詞的詞在視頻的字幕文檔中出現(xiàn)的詞頻,將詞頻前20位的名詞作為視頻的主題詞。
[0054]優(yōu)選地,根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注可以包括:以視頻的每個(gè)主題詞作為查詢詞,在每一個(gè)視頻片段的字幕文檔中進(jìn)行搜索,將成功搜索到的主題詞作為該視頻片段的文本標(biāo)注。
[0055]優(yōu)選地,制作每一個(gè)視頻片段的視頻摘要可以包括:提取每一個(gè)視頻片段的首尾幀,并隨機(jī)抽取中間的10幀,形成該視頻片段的視頻摘要。
[0056]實(shí)施例2:
[0057]本發(fā)明實(shí)施例2提供一種基于內(nèi)容的營養(yǎng)健康視頻快速檢索方法,參見圖2,該方法包括:
[0058]步驟201:將輸入的營養(yǎng)健康視頻文件切分為多個(gè)內(nèi)容獨(dú)立的視頻片段。
[0059]本步驟中,可以通過鏡頭邊緣檢測技術(shù),如顏色直方圖法、絕對幀差法、圖像象素差法等檢測鏡頭邊緣,獲得相鄰鏡頭之間的邊緣,作為鏡頭切分的依據(jù)。具體為:首先,提取視頻的視覺特征,如顏色直方圖、像素塊等;然后,選擇度量相鄰幀之間相似度的計(jì)算方法,如可以通過計(jì)算相鄰兩幀圖像的直方圖差或者相鄰兩幀圖像的像素差等方法度量相鄰兩幀的相似性;最后,通過預(yù)先設(shè)定的切分鏡頭邊緣的閾值,確定鏡頭切分的位置,最終得到一系列的視頻片段。
[0060]在本發(fā)明實(shí)施例2中,對于給定的營養(yǎng)健康視頻,采用顏色直方圖法提取鏡頭邊緣。具體為:
[0061]I)分別獲取任意相鄰兩幀,即第i幀&的RGB顏色直方圖HistJfi, j)、HistJfi, j)、HistB(fi, j)和第 i+1 中貞 fi+1 的 RGB 顏色直方圖 HistE(fi+1, j)、Histc(fi+1, j)、HistB(fi+1,j),其中 i=0,1,2,…255。
[0062]2)計(jì)算相鄰兩幀fi和fi+1的直方圖差D (fi; fi+1),其中
[0063]D(fi; fi+1) =
【權(quán)利要求】
1.一種視頻檢索方法,其特征在于,包括: 將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段; 得到所述視頻的主題詞; 根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注,制作每一個(gè)視頻片段的視頻摘要,根據(jù)所述文本標(biāo)注和視頻摘要構(gòu)建視頻的語義內(nèi)容索引,根據(jù)所述語義內(nèi)容索引快速瀏覽和檢索視頻內(nèi)容。
2.根據(jù)權(quán)利要求1所述的視頻檢索方法,其特征在于,所述將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段包括: 提取視頻的視覺特征; 度量相鄰兩幀的相似性; 通過預(yù)先設(shè)定的切分鏡頭邊緣的閾值,確定鏡頭切分位置,得到多個(gè)內(nèi)容獨(dú)立的視頻片段。
3.根據(jù)權(quán)利要求1所述的視頻檢索方法,其特征在于,所述得到所述視頻的主題詞包括: 使用自動分詞法對視頻的字幕文檔進(jìn)行分句,對每一句使用全監(jiān)督式分詞模型進(jìn)行分詞; 對每個(gè)詞使用全監(jiān)督式詞性標(biāo)注模型進(jìn)行詞性標(biāo)注; 統(tǒng)計(jì)其中詞性標(biāo)注為名詞的詞在視頻的字幕文檔中出現(xiàn)的詞頻,將詞頻前20位的名詞作為視頻的主題詞。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的視頻檢索方法,其特征在于,所述根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注包括: 以視頻的每個(gè)主題詞作為查詢詞,在每一個(gè)視頻片段的字幕文檔中進(jìn)行搜索,將成功搜索到的主題詞作為該視頻片段的文本標(biāo)注。
5.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的視頻檢索方法,其特征在于,所述制作每一個(gè)視頻片段的視頻摘要包括: 提取每一個(gè)視頻片段的首尾幀,并隨機(jī)抽取中間的10幀,形成該視頻片段的視頻摘要。
6.一種視頻檢索系統(tǒng),其特征在于,包括:視頻結(jié)構(gòu)化模塊、視頻內(nèi)容主題詞提取模塊和視頻語義索引自動生成模塊,視頻結(jié)構(gòu)化模塊和視頻內(nèi)容主題詞提取模塊與視頻語義索引自動生成模塊分別相連,其中: 視頻結(jié)構(gòu)化模塊,用于將視頻切分為多個(gè)內(nèi)容獨(dú)立的視頻片段; 視頻內(nèi)容主題詞提取模塊,用于得到所述視頻的主題詞; 視頻語義索引自動生成模塊,用于根據(jù)所述主題詞對每一個(gè)視頻片段進(jìn)行文本標(biāo)注,制作每一個(gè)視頻片段的視頻摘要,根據(jù)所述文本標(biāo)注和視頻摘要構(gòu)建視頻的語義內(nèi)容索引,根據(jù)所述語義內(nèi)容索引快速瀏覽和檢索視頻內(nèi)容。
7.根據(jù)權(quán)利要求6所述的視頻檢索系統(tǒng),其特征在于,所述視頻結(jié)構(gòu)化模塊包括: 視頻視覺特征提取模塊,用于提取視頻的視覺特征; 鏡頭相似度計(jì)算及鏡頭切分模塊,用于度量相鄰兩幀的相似性;通過預(yù)先設(shè)定的切分鏡頭邊緣的閾值,確定鏡頭切分位置,得到多個(gè)內(nèi)容獨(dú)立的視頻片段。
8.根據(jù)權(quán)利要求6所述的視頻檢索系統(tǒng),其特征在于,所述視頻內(nèi)容主題詞提取模塊包括: 自動分詞模塊,用于使用自動分詞法對視頻的字幕文檔進(jìn)行分句,對每一句使用全監(jiān)督式分詞模型進(jìn)行分詞; 詞頻統(tǒng)計(jì)和主題詞提取模塊,用于統(tǒng)計(jì)其中詞性標(biāo)注為名詞的詞在視頻的字幕文檔中出現(xiàn)的詞頻,將詞頻前20位的名詞作為視頻的主題詞。
9.根據(jù)權(quán)利要求6至8中任一項(xiàng)所述的視頻檢索系統(tǒng),其特征在于,所述視頻語義索引自動生成模塊包括: 文本標(biāo)注生成模塊,用于以視頻的每個(gè)主題詞作為查詢詞,在每一個(gè)視頻片段的字幕文檔中進(jìn)行搜索,將成功搜索到的主題詞作為該視頻片段的文本標(biāo)注。
10.根據(jù)權(quán)利要求6至8中任一項(xiàng)所述的視頻檢索系統(tǒng),其特征在于,所述視頻語義索引自動生成模塊包括: 視頻摘要提取模塊,用于提取每一個(gè)視頻片段的首尾幀,并隨機(jī)抽取中間的10幀,形成該視頻片段的視 頻摘要。
【文檔編號】G06F17/30GK103761284SQ201410014651
【公開日】2014年4月30日 申請日期:2014年1月13日 優(yōu)先權(quán)日:2014年1月13日
【發(fā)明者】楊穎 , 高萬林, 陳瑛 申請人:中國農(nóng)業(yè)大學(xué)