两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

視頻識(shí)別方法及裝置與流程

文檔序號:11292612閱讀:418來源:國知局
視頻識(shí)別方法及裝置與流程

本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,具體地說,涉及一種視頻識(shí)別方法及裝置。



背景技術(shù):

隨著vr(虛擬現(xiàn)實(shí),virtualreality)技術(shù)的日趨成熟,vr設(shè)備已經(jīng)得到了廣泛的運(yùn)用和普及。vr模式下的資源可以生成一種三維動(dòng)態(tài)視景和實(shí)體行為的系統(tǒng)仿真環(huán)境,從而使用戶可以沉浸到該虛擬環(huán)境中。

vr模式下的視頻資源可以是圖像或者視頻,其中視頻可以分為多種類型,例如2d視頻、360度全景視頻等,且不同類型的視頻需要通過相應(yīng)的視頻播放工具才能打開?,F(xiàn)有技術(shù)中,在vr模式下觀看360度全景視頻時(shí),需要用戶手動(dòng)選擇視頻播放工具來播放相應(yīng)360度全景視頻。為了實(shí)現(xiàn)自動(dòng)選擇視頻播放工具,代替用戶手動(dòng)選擇,就需要對360度全景視頻的類型進(jìn)行識(shí)別。但是,目前沒有一種有效、準(zhǔn)確地方式可以識(shí)別360度全景視頻。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明提供了一種視頻識(shí)別方法及裝置,用以解決現(xiàn)有技術(shù)中無法有效、準(zhǔn)確地識(shí)別360度全景視頻的技術(shù)問題。

為了解決上述技術(shù)問題,本發(fā)明提供了一種視頻識(shí)別方法,包括:

獲取待識(shí)別視頻中的多幀圖像;

計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度;

基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

優(yōu)選地,所述獲取待識(shí)別視頻中的多幀圖像包括:

從所述待識(shí)別視頻的幀序列中等間隔獲取多幀圖像。

優(yōu)選地,所述計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度包括:

針對所述多幀圖像中的每一幀圖像,計(jì)算首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

根據(jù)所述像素色差值,確定首列與末列中像素點(diǎn)相似的相似個(gè)數(shù);

基于所述相似個(gè)數(shù)與列像素點(diǎn)總個(gè)數(shù),計(jì)算首列與末列的像素相似度。

優(yōu)選地,所述基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù)包括:

判斷所述每一幀圖像的像素相似度是否小于第一相似值;

如果是,確定所述每一幀圖像的權(quán)重系數(shù)為0;

如果否,判斷所述每一幀圖像的像素相似度是否大于第二相似值,如果是,確定所述每一幀圖像的權(quán)重系數(shù)為1;

否則,確定所述每一幀圖像的像素相似度作為所述每一幀圖像的權(quán)重系數(shù)。

優(yōu)選地,所述根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻包括:

判斷所述平均相似度是否大于相似度閾值;

如果是,識(shí)別所述待識(shí)別視頻為360度全景視頻;

如果否,識(shí)別所述待識(shí)別視頻為非360度全景視頻。

優(yōu)選地,所述根據(jù)所述像素色差值,確定首列與末列中像素點(diǎn)相似的相似個(gè)數(shù)包括:

如果首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值小于色差閾值,確定所述位置相對應(yīng)的兩個(gè)像素點(diǎn)相似;

統(tǒng)計(jì)獲得像素點(diǎn)相似的相似個(gè)數(shù)。

優(yōu)選地,所述針對所述多幀圖像中的每一幀圖像,計(jì)算首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值包括:

針對所述多幀圖像中的每一幀圖像,按照色差計(jì)算公式計(jì)算獲得首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

所述色差計(jì)算公式為:

其中,所述cn為第n行中首列與末列位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;所述ran、gan、ban分別表示第n行中首列像素點(diǎn)rgb值的紅、綠、藍(lán)值;所述rbn、gbn、bbn分別表示第n行中末列像素點(diǎn)rgb值的紅、綠、藍(lán)值。

優(yōu)選地,所述計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度包括:

將所述多幀圖像中的每一幀圖像進(jìn)行縮放處理,以使得所述多幀圖像尺寸相同;

計(jì)算縮放處理之后的每一幀圖像的首列與末列的像素相似度。

本發(fā)明提供了一種視頻識(shí)別裝置,包括:

第一獲取模塊,用于獲取待識(shí)別視頻中的多幀圖像;

第一計(jì)算模塊,用于計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度;

第一確定模塊,用于基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

第二計(jì)算模塊,用于基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

識(shí)別模塊,用于根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

優(yōu)選地,所述第一計(jì)算模塊包括:

像素色差值計(jì)算單元,用于針對所述多幀圖像中的每一幀圖像,計(jì)算首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

相似個(gè)數(shù)確定單元,用于根據(jù)所述像素色差值,確定首列與末列中像素點(diǎn)相似的相似個(gè)數(shù);

像素相似度計(jì)算單元,用于基于所述相似個(gè)數(shù)與列像素點(diǎn)總個(gè)數(shù),計(jì)算首列與末列的像素相似度。

優(yōu)選地,所述第一確定模塊包括:

第一判斷單元:用于判斷所述每一幀圖像的像素相似度是否小于第一相似值;如果是,則觸發(fā)

第一權(quán)重系數(shù)確定單元,用于確定所述每一幀圖像的權(quán)重系數(shù)為0;

如果否,則觸發(fā),

第二判斷單元,用于判斷所述每一幀圖像的像素相似度是否大于第二相似值;如果是,則觸發(fā)

第二權(quán)重系數(shù)確定單元,用于確定所述每一幀圖像的權(quán)重系數(shù)為1;

否則,觸發(fā)

第三權(quán)重系數(shù)確定單元,用于確定所述每一幀圖像的像素相似度作為所述每一幀圖像的權(quán)重系數(shù)。

與現(xiàn)有技術(shù)相比,本發(fā)明可以獲得包括以下技術(shù)效果:

本發(fā)明首先通過獲得所述待識(shí)別視頻中的多幀圖像,計(jì)算每一幀圖像的像素相似度,然后根據(jù)所述每一幀圖像的像素相似度以及權(quán)重系數(shù),加權(quán)計(jì)算得到多幀圖像的平均相似度。根據(jù)所述平均相似度識(shí)別所述待識(shí)別視頻是否為360度全景視頻。本發(fā)明通過多重判斷方法對所述待識(shí)別視頻進(jìn)行識(shí)別,從而可以有效、準(zhǔn)確地識(shí)別360度全景視頻。

附圖說明

此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:

圖1是本發(fā)明實(shí)施例的一種視頻識(shí)別方法的一個(gè)實(shí)施例的流程圖;

圖2是本發(fā)明實(shí)施例的一種視頻識(shí)別方法的另一個(gè)實(shí)施例的流程圖;

圖3是本發(fā)明實(shí)施例的一種視頻識(shí)別方法的又一個(gè)實(shí)施例的流程圖;

圖4是本發(fā)明實(shí)施例的一種視頻識(shí)別裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;

圖5是本發(fā)明實(shí)施例的一種視頻識(shí)別裝置的另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;

圖6是本發(fā)明實(shí)施例的一種視頻識(shí)別裝置的又一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。

具體實(shí)施方式

以下將配合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,藉此對本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。

隨著vr(虛擬現(xiàn)實(shí),virtualreality)技術(shù)的不斷發(fā)展,越來越多的用戶可以通過智能終端設(shè)備中vr模式或者專門的vr設(shè)備來觀看vr模式下的資源,從而可以沉浸到虛擬環(huán)境中來獲得更好地觀看體驗(yàn)。

vr模式下的資源可以包括不同類型的視頻,但不同類型的視頻必需要通過調(diào)用與視頻類型相應(yīng)的播放器才能打開。現(xiàn)有技術(shù)中,智能終端設(shè)備中vr模式或者專門的vr設(shè)備無法區(qū)分請求播放視頻的視頻類型,需要通過用戶手動(dòng)選擇相應(yīng)的播放器進(jìn)行視頻播放。

為了解決視頻類型誤判的技術(shù)問題,發(fā)明人經(jīng)過一系列研究提出了本發(fā)明的技術(shù)方案,在本發(fā)明中,可以通過對待識(shí)別視頻中的幀圖像進(jìn)行采樣獲得多幀圖像,并計(jì)算每一幀圖像的像素相似度及相應(yīng)的權(quán)重系數(shù),然后根據(jù)所述每一幀圖像的像素相似度以及權(quán)重系數(shù),加權(quán)計(jì)算得到多幀圖像的平均相似度,通過得到的多幀圖像的平均相似度,判斷所述待識(shí)別視頻是否為360度全景視頻,從而可以有效、準(zhǔn)確地識(shí)別360度全景視頻,大大提高了用戶體驗(yàn)。

下面將結(jié)合附圖對本發(fā)明技術(shù)方案進(jìn)行詳細(xì)描述。

圖1為本發(fā)明實(shí)施例的一種視頻識(shí)別方法的一個(gè)實(shí)施例的流程圖,該方法可以包括以下幾個(gè)步驟:

101:獲取待識(shí)別視頻中的多幀圖像;

102:計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度。

為了判斷所述待識(shí)別視頻是否為360度全景視頻,首先從所述待識(shí)別視頻中選取多幀圖像,并計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度。

360度全景視頻是通過將每一幀圖像的左右側(cè)拼合的方式實(shí)現(xiàn),每一幀圖像在左右兩側(cè)拼合后,其顏色的過渡是平滑的,并不存在明顯的拼接痕跡,也即每一幀圖像拼接處的像素點(diǎn)的像素值接近或者相同,從而可以在vr模式下由相應(yīng)的播放器播放實(shí)現(xiàn)視頻360度環(huán)視的效果,給用戶帶來三維立體的空間體驗(yàn)。

由于360度全景視頻是通過將每一幀圖像的左右側(cè)拼合的方式實(shí)現(xiàn),據(jù)此發(fā)明人想到可以通過對每一幀圖像的首列與末列進(jìn)行判斷,來確定待識(shí)別視頻是否為360度全景視頻。因此可以首先計(jì)算從待識(shí)別視頻中獲取的多幀圖像中每一幀圖像的首列與末列的像素相似度,判斷所多幀圖像是否可以實(shí)現(xiàn)每一幀圖像的左右側(cè)拼合的條件。

其中,所述每一幀圖像的首列與末列的像素相似度,可以是指所述每一幀圖像的首列的像素點(diǎn)的rgb(red、green、blue,三原色)值與對應(yīng)末列的像素點(diǎn)rgb值的相似度;還可以是指所述多幀圖像中每一幀圖像的首列的像素點(diǎn)灰度值與末列的灰度值的像素相似度。

103:基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

104:基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

其中,所述每一幀圖像的權(quán)重系數(shù)可以根據(jù)每一幀圖像的像素相似度在多幀圖像中的像素相似度中所具有的重要程度,分別給予不同的比例系數(shù),并將所述比例系數(shù)作為權(quán)重系數(shù)。根據(jù)所述權(quán)重系數(shù),對所述每一幀圖像的像素相似度進(jìn)行加權(quán)計(jì)算,獲得多幀圖像的平均相似度。

105:根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

可選地,所述根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻可以包括:

判斷所述平均相似度是否大于相似度閾值;

如果是,識(shí)別所述待識(shí)別視頻為360度全景視頻;

如果否,識(shí)別所述待識(shí)別視頻為非360度全景視頻。

需要說明的是,所述相似度閾值可以根據(jù)實(shí)際情況進(jìn)行設(shè)定,如果所述平均相似度大于所述相似度閾值時(shí),所述待識(shí)別視頻中的每一幀在左右兩側(cè)拼合后,其每一幀圖像顏色的過渡是平滑的,且不存在明顯的拼接痕跡,滿足拼接處的像素點(diǎn)的顏色值接近或者相同的條件。此時(shí),所述平均相似度大于相似度閾值即可確定所述待識(shí)別視頻為360度全景視頻。

在一個(gè)實(shí)際應(yīng)用中,平均相似度閾值可以設(shè)為0.5,如果所述平均相似度大于0.5,則識(shí)別該待識(shí)別視頻為360度全景視頻;如果所述平均相似度小于或等于0.5,則識(shí)別該待識(shí)別視頻為非360度全景視頻。

本實(shí)施例中,在獲得所述待識(shí)別視頻中的多幀圖像,計(jì)算每一幀圖像的像素相似度,以及每一幀圖像的像素相似度對應(yīng)權(quán)重系數(shù),通過加權(quán)計(jì)算得到多幀圖像的平均相似度。僅當(dāng)所得的平均相似度大于所述相似度閾值時(shí)識(shí)別所述待識(shí)別視頻為360度全景視頻。本發(fā)明通過計(jì)算多幀圖像的平均相似度對所述待識(shí)別視頻進(jìn)行識(shí)別,從而可以有效、準(zhǔn)確地識(shí)別360度全景視頻大大提高了用戶體驗(yàn)。

圖2為本發(fā)明實(shí)施例的一種視頻識(shí)別方法的另一個(gè)實(shí)施例的流程圖,該方法可以包括以下幾個(gè)步驟:

201:獲取待識(shí)別視頻中的多幀圖像;

202:針對所述多幀圖像中的每一幀圖像,計(jì)算首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

可選地,所述每個(gè)像素點(diǎn)的像素值可以用rgb值標(biāo)識(shí),所述多幀圖像中的每一幀圖像的首列的像素向量可以表示為:

an={{ra0,ga0,ba0},{ra1,ga1,ba1},......,{ran-1,gan-1,ban-1}};

所述多幀圖像中的每一幀圖像的末列的像素向量可以表示為:

bn={{rb0,gb0,bb0},{rb1,gb1,bb1},......,{rbn-1,gbn-1,bbn-1}};

其中,n為所述每一個(gè)幀圖像中像素的列像素點(diǎn)的總個(gè)數(shù),{ran-1,gan-1,ban-1}表示所述每一幀圖像中首列的第n行像素點(diǎn)的像素值,{rbn-1,gbn-1,bbn-1}表示所述每一幀圖像中末列的第n行像素點(diǎn)的像素值;

可以按照所述首列的像素向量an和末列的像素向量bn,計(jì)算所述采樣幀的色差向量c,色差向量c={c0,c1,......,cn-1};其中,cn即為首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值。

可選地,所述針對所述多幀圖像中的每一幀圖像,計(jì)算首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值可以包括:

針對所述多幀圖像中的每一幀圖像,按照色差計(jì)算公式計(jì)算獲得首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

所述色差計(jì)算公式為:

其中,所述cn為第n行中首列與末列位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;所述ran、gan、ban分別表示第n行中首列像素點(diǎn)rgb值的紅、綠、藍(lán)值;所述rbn、gbn、bbn分別表示第n行中末列像素點(diǎn)rgb值的紅、綠、藍(lán)值。

203:根據(jù)所述像素色差值,確定首列與末列中像素點(diǎn)相似的相似個(gè)數(shù);

204:基于所述相似個(gè)數(shù)與列像素點(diǎn)總個(gè)數(shù),計(jì)算首列與末列的像素相似度;

可選地,所述根據(jù)所述像素色差值,確定首列與末列中像素點(diǎn)相似的相似個(gè)數(shù)包括:

如果首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值小于色差閾值,確定所述位置相對應(yīng)的兩個(gè)像素點(diǎn)相似;

統(tǒng)計(jì)獲得像素點(diǎn)相似的相似個(gè)數(shù)。

在一個(gè)實(shí)際應(yīng)用中,色差閾值可以設(shè)為10,判斷所述色差向量中第n行的像素色差值cn是否小于色差閾值,如果cn<10,則可以確認(rèn)該色差向量中首列與末列第n行的像素點(diǎn)的顏色相似。此時(shí),首列與末列中像素點(diǎn)相似的相似個(gè)數(shù)可以累計(jì)加1,并通過依次判斷所述色差向量中每一個(gè)色差值是否小于色差閾值,來統(tǒng)計(jì)獲得像素點(diǎn)相似的相似個(gè)數(shù)。

可選地,所述基于所述相似個(gè)數(shù)與列像素點(diǎn)總個(gè)數(shù),計(jì)算首列與末列的像素相似度可以包括;

計(jì)算所述相似個(gè)數(shù)m與列像素點(diǎn)的總個(gè)數(shù)n的比值,獲得所述首列與末列的像素相似度sn;

所述像素相似度計(jì)算公式為:sn=m/n。

205:基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

206:基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

207:根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

其中,步驟201操作與圖1對應(yīng)的實(shí)施例中步驟101的操作相同、步驟205-207的操作與圖1對應(yīng)的實(shí)施例的中103-105步驟相同,在此不再贅述。

本實(shí)施例中,通過計(jì)算所述多幀圖像中每一幀圖像的色差值,判斷每一幀圖像中首列與末列像素點(diǎn)相似的個(gè)數(shù),根據(jù)像素點(diǎn)相似個(gè)數(shù)所占列像素點(diǎn)總個(gè)數(shù)的比例,計(jì)算得到每一幀圖像的像素相似度,從而可以提高每一幀圖像像素相似度的準(zhǔn)確性,從而可以大大提高了視頻識(shí)別的準(zhǔn)確度。

圖3為本發(fā)明實(shí)施例的一種視頻識(shí)別方法的又一個(gè)實(shí)施例的流程圖,該方法可以包括以下幾個(gè)步驟:

301:獲取待識(shí)別視頻中的多幀圖像;

302:計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度;

303:判斷所述每一幀圖像的像素相似度是否小于第一相似值;如果是,則執(zhí)行步驟304,如果否,則執(zhí)行步驟305;

304:確定所述每一幀圖像的權(quán)重系數(shù)為0;

305:判斷所述每一幀圖像的像素相似度是否大于第二相似值;如果是則執(zhí)行步驟306,否則執(zhí)行步驟307;

306:確定所述每一幀圖像的權(quán)重系數(shù)為1;

307:確定所述每一幀圖像的像素相似度作為所述每一幀圖像的權(quán)重系數(shù);

308:基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

其中,所述獲取所述每一幀圖像的權(quán)重系數(shù)為kn,所述每一幀圖像的像素相似度為sn;可選地,在一個(gè)實(shí)際應(yīng)用中,所述第一相似值可以設(shè)為0.4,所述第二相似值可以設(shè)為0.8,則權(quán)重系數(shù)

可選地,所述基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度可以包括:

所述多幀圖像的平均相似度計(jì)算公式為:

其中,p=(k0*s0+k1*s1+.......+kn-1*sn-1)/n。

309:根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

其中,步驟301-302操作與圖1對應(yīng)的實(shí)施例中步驟101-102的操作相同、步驟309的操作與圖1對應(yīng)的實(shí)施例的中105步驟相同,在此不再贅述。

本實(shí)施例中,通過確定所述多幀圖像中每一幀圖像的首列與末列的像素相似度的權(quán)重系數(shù),并通過加權(quán)計(jì)算多幀圖像的平均相似度,可以避免小概率采樣誤差對計(jì)算多幀圖像的平均相似度結(jié)果造成影響,進(jìn)一步提高識(shí)別360度全景視頻類型的準(zhǔn)確率。

在某些實(shí)施例中,可選地,所述獲取待識(shí)別視頻的多幀圖像可以包括:

從所述待識(shí)別視頻的幀序列中等間隔的獲取多幀圖像。

從待識(shí)別視頻中獲取多幀圖像可以通過對待識(shí)別視頻中的幀圖像采樣的方式實(shí)現(xiàn),可以是對所述待識(shí)別視頻中的幀圖像進(jìn)行隨機(jī)采樣,也可以是按照一定采樣規(guī)則對所述待識(shí)別視頻的幀圖像進(jìn)行等間隔采樣。為了避免采樣誤差的出現(xiàn),可以通過對所述待識(shí)別視頻的幀序列進(jìn)行等間隔采樣獲取待識(shí)別視頻的多幀圖像,從而可以避免由于獲取的幀圖像全部集中在視頻序列的某一部分而出現(xiàn)的采樣誤差。

可選地,為了進(jìn)一步避免采樣誤差,所述從所述待識(shí)別視頻的幀序列中等間隔獲取多幀圖像還可以包括:

基于所述待識(shí)別視頻的幀序列,從預(yù)設(shè)起始幀位置至預(yù)設(shè)結(jié)束幀位置之間等間隔獲取多幀圖像。

在從所述待識(shí)別視頻的幀序列中進(jìn)行等間隔采樣時(shí),由于待識(shí)別視頻的幀序列中包含的視頻的開始部分的幀圖像和結(jié)束部分的幀圖像并非視頻的主要內(nèi)容,且開始部分的幀圖像和結(jié)束部分的幀圖像通常情況下均為純色背景的幀圖像,這就會(huì)導(dǎo)致采樣誤差的出現(xiàn)。因此為了進(jìn)一步避免采樣誤差,可以在對待識(shí)別視頻的幀序列進(jìn)行采樣時(shí),去除視頻開始部分的幀圖像和視頻結(jié)束部分的幀圖像,即幀序列中視頻主要內(nèi)容的幀圖像與視頻開始部分的幀圖像連接的位置為預(yù)設(shè)起始幀位置,視頻主要內(nèi)容的幀圖像與視頻結(jié)束部分的幀圖像連接的位置為預(yù)設(shè)結(jié)束幀位置。

例如,待識(shí)別視頻的幀序列中,視頻的開始部分和視頻的結(jié)束部分往往是視頻的logo,并非視頻的主要內(nèi)容,所述幀序列中的幀數(shù)為n,幀序列中視頻開始部分的幀圖像為從0~n*0.2幀之間,結(jié)束部分的幀圖像為n*0.8~n幀之間。因此,所述待識(shí)別視頻的幀序列中的預(yù)設(shè)起始幀位置為n*0.2幀,預(yù)設(shè)結(jié)束幀位置為n*0.8幀,視頻主要部分的幀圖像為n*0.2~n*0.8幀之間,可以從幀序列的第n*0.2幀到第n*0.8幀之間等間隔選取20幀圖像作為采樣獲取的多幀圖像。

在某些實(shí)施例中,可選地,所述計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度,可以包括:

將所述多幀圖像中的每一幀圖像進(jìn)行縮放處理,以使得所述多幀圖像尺寸相同;

計(jì)算縮放處理之后的每一幀圖像的首列與末列的相似相似度。

由于從所述待識(shí)別視頻中采樣獲得的多幀圖像的分辨率可能存在大小不相同的問題,為了使所述多幀圖像中的每一幀圖像具有相同尺寸,可以對所述每一幀圖像按預(yù)設(shè)尺寸進(jìn)行縮放,例如,將所述每一幀圖像縮放到100*100,獲得縮放后的每一幀圖像。

圖4為本發(fā)明實(shí)施例的一種視頻識(shí)別裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,該裝置可以包括:

第一獲取模塊401,用于獲取待識(shí)別視頻中的多幀圖像;

第一計(jì)算模塊402,用于計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度。

為了判斷所述待識(shí)別視頻是否為360度全景視頻,首先從所述待識(shí)別視頻中選取多幀圖像,并計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度。

360度全景視頻是通過將每一幀圖像的左右側(cè)拼合的方式實(shí)現(xiàn),每一幀圖像在左右兩側(cè)拼合后,其顏色的過渡是平滑的,并不存在明顯的拼接痕跡,也即每一幀圖像拼接處的像素點(diǎn)的像素值接近或者相同,從而可以在vr模式下由相應(yīng)的播放器播放實(shí)現(xiàn)視頻360度環(huán)視的效果,給用戶帶來三維立體的空間體驗(yàn)。

由于360度全景視頻是通過將每一幀圖像的左右側(cè)拼合的方式實(shí)現(xiàn),據(jù)此發(fā)明人想到可以通過對每一幀圖像的首列與末列進(jìn)行判斷,來確定待識(shí)別視頻是否為360度全景視頻。因此可以首先計(jì)算從待識(shí)別視頻中獲取的多幀圖像中每一幀圖像的首列與末列的像素相似度,判斷所多幀圖像是否可以實(shí)現(xiàn)每一幀圖像的左右側(cè)拼合的條件。

第一確定模塊403,用于基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

第二計(jì)算模塊404,用于基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

其中,所述每一幀圖像的權(quán)重系數(shù)可以根據(jù)每一幀圖像的像素相似度在多幀圖像中的像素相似度中所具有的重要程度,分別給予不同的比例系數(shù),并將所述比例系數(shù)作為權(quán)重系數(shù)。根據(jù)所述權(quán)重系數(shù),對所述每一幀圖像的像素相似度進(jìn)行加權(quán)計(jì)算,獲得多幀圖像的平均相似度。

識(shí)別模塊405,用于根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

可選地,所述識(shí)別模塊405具體可以用于:

判斷所述平均相似度是否大于相似度閾值;

如果是,識(shí)別所述待識(shí)別視頻為360度全景視頻;

如果否,識(shí)別所述待識(shí)別視頻為非360度全景視頻。

需要說明的是,所述相似度閾值可以根據(jù)實(shí)際情況進(jìn)行設(shè)定,如果所述平均相似度大于所述相似度閾值時(shí),所述待識(shí)別視頻中的每一幀在左右兩側(cè)拼合后,其每一幀圖像顏色的過渡是平滑的,且不存在明顯的拼接痕跡,滿足拼接處的像素點(diǎn)的顏色值接近或者相同的條件。此時(shí),所述平均相似度大于相似度閾值即可確定所述待識(shí)別視頻為360度全景視頻。

在一個(gè)實(shí)際應(yīng)用中,平均相似度閾值可以設(shè)為0.5,如果所述平均相似度大于0.5,則識(shí)別該待識(shí)別視頻為360度全景視頻;如果所述平均相似度小于或等于0.5,則識(shí)別該待識(shí)別視頻為非360度全景視頻。

本實(shí)施例中,在獲得所述待識(shí)別視頻中的多幀圖像,計(jì)算每一幀圖像的像素相似度,以及每一幀圖像的像素相似度對應(yīng)權(quán)重系數(shù),通過加權(quán)計(jì)算得到多幀圖像的平均相似度。僅當(dāng)所得的平均相似度大于所述相似度閾值時(shí)識(shí)別所述待識(shí)別視頻為360度全景視頻。本發(fā)明通過計(jì)算多幀圖像的平均相似度對所述待識(shí)別視頻進(jìn)行識(shí)別,從而可以有效、準(zhǔn)確地識(shí)別360度全景視頻,大大提高了用戶體驗(yàn)。

圖5為本發(fā)明實(shí)施例的一種視頻識(shí)別裝置的另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,該裝置可以包括:

第一獲取模塊501,用于獲取待識(shí)別視頻中的多幀圖像。

第一計(jì)算模塊502,用于計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度;

所述第一計(jì)算模塊502可以包括:

像素色差值計(jì)算單元511,用于針對所述多幀圖像中的每一幀圖像,計(jì)算首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

可選地,所述每個(gè)像素點(diǎn)的像素值可以用rgb值標(biāo)識(shí),所述多幀圖像中的每一幀圖像的首列的像素向量可以表示為:

an={{ra0,ga0,ba0},{ra1,ga1,ba1},......,{ran-1,gan-1,ban-1}};

所述多幀圖像中的每一幀圖像的末列的像素向量可以表示為:

bn={{rb0,gb0,bb0},{rb1,gb1,bb1},......,{rbn-1,gbn-1,bbn-1}};

其中,n為所述每一個(gè)幀圖像中像素的列像素點(diǎn)的總個(gè)數(shù),{ran-1,gan-1,ban-1}表示所述每一幀圖像中首列的第n行像素點(diǎn)的像素值,{rbn-1,gbn-1,bbn-1}表示所述每一幀圖像中末列的第n行像素點(diǎn)的像素值;

可以按照所述首列的像素向量an和末列的像素向量bn,計(jì)算所述采樣幀的色差向量c,色差向量c={c0,c1,......,cn-1};其中,cn即為首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值。

可選地,所述像素色差值計(jì)算單元511具體可以用于:

針對所述多幀圖像中的每一幀圖像,按照色差計(jì)算公式計(jì)算獲得首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;

所述色差計(jì)算公式為:

其中,所述cn為第n行中首列與末列位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值;所述ran、gan、ban分別表示第n行中首列像素點(diǎn)rgb值的紅、綠、藍(lán)值;所述rbn、gbn、bbn分別表示第n行中末列像素點(diǎn)rgb值的紅、綠、藍(lán)值。

相似個(gè)數(shù)確定單元512,用于根據(jù)所述像素色差值,確定首列與末列中像素點(diǎn)相似的相似個(gè)數(shù);

像素相似度計(jì)算單元513,用于基于所述相似個(gè)數(shù)與列像素點(diǎn)總個(gè)數(shù),計(jì)算首列與末列的像素相似度;

可選地,所述相似個(gè)數(shù)確定單元512具體可以用于:

如果首列與末列中位置相對應(yīng)的兩個(gè)像素點(diǎn)的像素色差值小于色差閾值,確定所述位置相對應(yīng)的兩個(gè)像素點(diǎn)相似;

統(tǒng)計(jì)獲得像素點(diǎn)相似的相似個(gè)數(shù)。

在一個(gè)實(shí)際應(yīng)用中,色差閾值可以設(shè)為10,判斷所述色差向量中第n行的像素色差值cn是否小于色差閾值,如果cn<10,則可以確認(rèn)該色差向量中首列與末列第n行的像素點(diǎn)的顏色相似。此時(shí),首列與末列中像素點(diǎn)相似的相似個(gè)數(shù)可以累計(jì)加1,并通過依次判斷所述色差向量中每一個(gè)色差值是否小于色差閾值,來統(tǒng)計(jì)獲得像素點(diǎn)相似的相似個(gè)數(shù)。

可選地,所述像素相似度計(jì)算單元513具體可以用于;

計(jì)算所述相似個(gè)數(shù)m與列像素點(diǎn)的總個(gè)數(shù)n的比值,獲得所述首列與末列的像素相似度sn;

所述像素相似度計(jì)算公式為:sn=m/n。

第一確定模塊503,用于基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

第二計(jì)算模塊504,用于基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

識(shí)別模塊505,用于根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

其中,第一獲取模塊操501與圖4對應(yīng)的第一獲取模塊操401相同、第一確定模塊503與圖4對應(yīng)的第一確定模塊403相同、第二計(jì)算模塊504與圖4對應(yīng)的第二計(jì)算模塊404相同,識(shí)別模塊505與圖4對應(yīng)的識(shí)別模塊405相同,在此不再贅述。

本實(shí)施例中,通過計(jì)算所述多幀圖像中每一幀圖像的色差值,判斷每一幀圖像中首列與末列像素點(diǎn)相似的個(gè)數(shù),根據(jù)像素點(diǎn)相似個(gè)數(shù)所占列像素點(diǎn)總個(gè)數(shù)的比例,計(jì)算得到每一幀圖像的像素相似度,從而可以提高每一幀圖像像素相似度的準(zhǔn)確性,從而可以大大提高了視頻識(shí)別的準(zhǔn)確度。

圖6為本發(fā)明實(shí)施例的一種視頻識(shí)別裝置的又一個(gè)實(shí)施例的結(jié)構(gòu)示意圖,該裝置可以包括:

第一獲取模塊601,用于獲取待識(shí)別視頻中的多幀圖像;

第一計(jì)算模塊602,計(jì)算所述多幀圖像中每一幀圖像的首列與末列的像素相似度;

第一確定模塊603,用于基于所述每一幀圖像的像素相似度,確定所述每一幀圖像的權(quán)重系數(shù);

可選地,所述第一確定模塊603可以包括:

第一判斷單元611,用于判斷所述每一幀圖像的像素相似度是否小于第一相似值;如果是,則觸發(fā)第一權(quán)重系數(shù)確定單元612,如果否,則觸發(fā)第二判斷單元613;

第一權(quán)重系數(shù)確定單元612,用于確定所述每一幀圖像的權(quán)重系數(shù)為0;

第二判斷單元613,用于判斷所述每一幀圖像的像素相似度是否大于第二相似值;如果是,則觸發(fā)第二權(quán)重系數(shù)確定單元614,否則觸發(fā)第二權(quán)重系數(shù)確定單元614;

第二權(quán)重系數(shù)確定單元614,用于確定所述每一幀圖像的權(quán)重系數(shù)為1;

第二權(quán)重系數(shù)確定單元614,用于確定所述每一幀圖像的像素相似度作為所述每一幀圖像的權(quán)重系數(shù);

第二計(jì)算模塊604,用于基于所述每一幀圖像的權(quán)重系數(shù)以及像素相似度,加權(quán)計(jì)算所述多幀圖像的平均相似度;

其中,所述獲取所述每一幀圖像的權(quán)重系數(shù)為kn,所述每一幀圖像的像素相似度為sn;可選地,在一個(gè)實(shí)際應(yīng)用中,所述第一相似值可以設(shè)為0.4,所述第二相似值可以設(shè)為0.8,則權(quán)重系數(shù)

可選地,所述第二計(jì)算模塊604具體可以用于:

所述多幀圖像的平均相似度計(jì)算公式為:

其中,p=(k0*s0+k1*s1+.......+kn-1*sn-1)/n。

識(shí)別模塊605,用于根據(jù)所述平均相似度,識(shí)別所述待識(shí)別視頻是否為360度全景視頻。

其中,第一獲取模塊操601與圖4對應(yīng)的第一獲取模塊操401相同、第一計(jì)算模塊602與圖4對應(yīng)的第一計(jì)算模塊402相同、第二計(jì)算模塊604與圖4對應(yīng)的第二計(jì)算模塊404相同,識(shí)別模塊605與圖4對應(yīng)的識(shí)別模塊405相同,在此不再贅述。

本實(shí)施例中,通過確定所述多幀圖像中每一幀圖像的首列與末列的像素相似度的權(quán)重系數(shù),并通過加權(quán)計(jì)算多幀圖像的平均相似度,可以避免小概率采樣誤差對計(jì)算多幀圖像的平均相似度結(jié)果造成影響,進(jìn)一步提高識(shí)別360度全景視頻類型的準(zhǔn)確率。

在某些實(shí)施例中,可選地,所述第一獲取模塊具體可以用于:

從所述待識(shí)別視頻的幀序列中等間隔的獲取多幀圖像。

從待識(shí)別視頻中獲取多幀圖像可以通過對待識(shí)別視頻中的幀圖像采樣的方式實(shí)現(xiàn),可以是對所述待識(shí)別視頻中的幀圖像進(jìn)行隨機(jī)采樣,也可以是按照一定采樣規(guī)則對所述待識(shí)別視頻的幀圖像進(jìn)行等間隔采樣。為了避免采樣誤差的出現(xiàn),可以通過對所述待識(shí)別視頻的幀序列進(jìn)行等間隔采樣獲取待識(shí)別視頻的多幀圖像,從而可以避免由于獲取的幀圖像全部集中在視頻序列的某一部分而出現(xiàn)的采樣誤差。

可選地,為了進(jìn)一步避免采樣誤差,所述從所述待識(shí)別視頻的幀序列中等間隔獲取多幀圖像具體可以用于:

基于所述待識(shí)別視頻的幀序列,從預(yù)設(shè)起始幀位置至預(yù)設(shè)結(jié)束幀位置之間等間隔獲取多幀圖像。

在從所述待識(shí)別視頻的幀序列中進(jìn)行等間隔采樣時(shí),由于待識(shí)別視頻的幀序列中包含的視頻的開始部分的幀圖像和結(jié)束部分的幀圖像并非視頻的主要內(nèi)容,且開始部分的幀圖像和結(jié)束部分的幀圖像通常情況下均為純色背景的幀圖像,這就會(huì)導(dǎo)致采樣誤差的出現(xiàn)。因此為了進(jìn)一步避免采樣誤差,可以在對待識(shí)別視頻的幀序列進(jìn)行采樣時(shí),去除視頻開始部分的幀圖像和視頻結(jié)束部分的幀圖像,即幀序列中視頻主要內(nèi)容的幀圖像與視頻開始部分的幀圖像連接的位置為預(yù)設(shè)起始幀位置,視頻主要內(nèi)容的幀圖像與視頻結(jié)束部分的幀圖像連接的位置為預(yù)設(shè)結(jié)束幀位置。

例如,待識(shí)別視頻的幀序列中,視頻的開始部分和視頻的結(jié)束部分往往是視頻的logo,并非視頻的主要內(nèi)容,所述幀序列中的幀數(shù)為n,幀序列中視頻開始部分的幀圖像為從0~n*0.2幀之間,結(jié)束部分的幀圖像為n*0.8~n幀之間。因此,所述待識(shí)別視頻的幀序列中的預(yù)設(shè)起始幀位置為n*0.2幀,預(yù)設(shè)結(jié)束幀位置為n*0.8幀,視頻主要部分的幀圖像為n*0.2~n*0.8幀之間,可以從幀序列的第n*0.2幀到第n*0.8幀之間等間隔選取20幀圖像作為采樣獲取的多幀圖像。

在某些實(shí)施例中,可選地,所述第一計(jì)算模塊具體可以包括:

將所述多幀圖像中的每一幀圖像進(jìn)行縮放處理,以使得所述多幀圖像尺寸相同;

計(jì)算縮放處理之后的每一幀圖像的首列與末列的相似相似度。

由于從所述待識(shí)別視頻中采樣獲得的多幀圖像的分辨率可能存在大小不相同的問題,為了使所述多幀圖像中的每一幀圖像具有相同尺寸,可以對所述每一幀圖像按預(yù)設(shè)尺寸進(jìn)行縮放,例如,將所述每一幀圖像縮放到100*100,獲得縮放后的每一幀圖像。

在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。

內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。

計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲(chǔ)器(sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dram)、其他類型的隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、電可擦除可編程只讀存儲(chǔ)器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號和載波。

如在說明書及權(quán)利要求當(dāng)中使用了某些詞匯來指稱特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同名詞來稱呼同一個(gè)組件。本說明書及權(quán)利要求并不以名稱的差異來作為區(qū)分組件的方式,而是以組件在功能上的差異來作為區(qū)分的準(zhǔn)則。如在通篇說明書及權(quán)利要求當(dāng)中所提及的“包含”為一開放式用語,故應(yīng)解釋成“包含但不限定于”?!按笾隆笔侵冈诳山邮盏恼`差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問題,基本達(dá)到所述技術(shù)效果。此外,“耦接”一詞在此包含任何直接及間接的電性耦接手段。因此,若文中描述一第一裝置耦接于一第二裝置,則代表所述第一裝置可直接電性耦接于所述第二裝置,或通過其他裝置或耦接手段間接地電性耦接至所述第二裝置。說明書后續(xù)描述為實(shí)施本發(fā)明的較佳實(shí)施方式,然所述描述乃以說明本發(fā)明的一般原則為目的,并非用以限定本發(fā)明的范圍。本發(fā)明的保護(hù)范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。

還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素

上述說明示出并描述了本發(fā)明的若干優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述申請構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
广州市| 南汇区| 比如县| 崇信县| 孟村| 大冶市| 南和县| 沾化县| 安福县| 聂拉木县| 博兴县| 留坝县| 泗洪县| 峨边| 庆安县| 讷河市| 广饶县| 阿合奇县| 武宁县| 高台县| 利川市| 南城县| 耿马| 民和| 宁明县| 云林县| 阿城市| 漳州市| 宜宾县| 榆中县| 吴旗县| 高陵县| 雷山县| 仁怀市| 琼结县| 察隅县| 濉溪县| 固安县| 博客| 南岸区| 安徽省|