一種相似視頻和盜版視頻的檢測(cè)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻處理技術(shù)領(lǐng)域,特別是涉及一種相似視頻和盜版視頻的檢測(cè)方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速發(fā)展,大量的視頻資源不斷涌現(xiàn),方便人們隨隨時(shí)隨地進(jìn)行視頻觀看。與此同時(shí),盜版視頻也層出不窮,大量的視頻盜播給視頻版權(quán)獨(dú)享公司帶來(lái)了巨大損失。為了保護(hù)視頻版權(quán),可以通過(guò)檢測(cè)待檢測(cè)視頻與正版視頻是否相似來(lái)判斷待檢測(cè)視頻是否為盜版視頻。
[0003]現(xiàn)有技術(shù)中,一般是通過(guò)比對(duì)待檢測(cè)視頻與正版視頻的名稱,或者通過(guò)人工查看待檢測(cè)視頻與正版視頻的內(nèi)容等方式來(lái)判斷視頻是否為相似視頻,進(jìn)而確定待檢測(cè)視頻是否為盜版視頻。但是,視頻的名稱是很容易被修改的,對(duì)于一些修改了名稱的盜播視頻,通過(guò)比對(duì)視頻名稱的方法很難檢測(cè)出來(lái),而且,人工查看視頻內(nèi)容的檢測(cè)方法工作量較大,效率較低。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例的目的在于提供一種相似視頻和盜版視頻的檢測(cè)方法及裝置,大大提高了相似視頻和盜版視頻的檢測(cè)效率。
[0005]為達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種相似視頻的檢測(cè)方法,包括步驟:
[0006]根據(jù)第一預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù);
[0007]確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值;
[0008]根據(jù)所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值,確定所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片之間的每個(gè)漢明距離,針對(duì)每個(gè)漢明距離,判斷所述漢明距離是否小于預(yù)設(shè)第一閾值,如果是,確定對(duì)應(yīng)該漢明距離的所述第一圖片庫(kù)和第二圖片庫(kù)中的圖片為一組相似圖片;
[0009]統(tǒng)計(jì)所述第一圖片庫(kù)和第二圖片庫(kù)中相似圖片的組數(shù),并判斷所述第一圖片庫(kù)和第二圖片庫(kù)中相似圖片的組數(shù)與對(duì)比數(shù)量總量的比值是否大于預(yù)設(shè)第二閾值,如果是,則確定所述兩個(gè)待檢測(cè)視頻為相似視頻,其中所述對(duì)比數(shù)量總量為所述第一圖片庫(kù)中的圖片數(shù)量和第二圖片庫(kù)中的圖片數(shù)量的乘積。
[0010]可選的,所述確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值,包括:
[0011]將所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片,按照預(yù)設(shè)值進(jìn)行尺度變換,并對(duì)尺度變換后的所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片做離散余弦變換DCT,獲取所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值。
[0012]可選的,所述根據(jù)第一預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù),包括:
[0013]根據(jù)預(yù)設(shè)的時(shí)間間隔從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù)。
[0014]可選的,確定兩個(gè)待檢測(cè)視頻為相似視頻后,所述方法還包括:
[0015]根據(jù)第二預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù);采用局部二值模式LBP算法,分別確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片上每個(gè)像素點(diǎn)的LBP值,并根據(jù)每個(gè)像素點(diǎn)的LBP值繪ffjijLBP值直方圖;將所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片的LBP值直方圖進(jìn)行重疊,針對(duì)每對(duì)圖片確定重疊區(qū)域中像素點(diǎn)的數(shù)量,確定重疊區(qū)域中像素點(diǎn)的數(shù)量的平均值,根據(jù)所述平均值及所述圖片像素點(diǎn)的數(shù)量,確定所述第一圖片庫(kù)和第二圖片庫(kù)的相似度;判斷所述相似度是否大于預(yù)設(shè)第三閾值,如果是,確定所述兩個(gè)待檢測(cè)視頻為相似視頻。
[0016]可選的,確定所述兩個(gè)待檢測(cè)視頻為相似視頻后,所述方法還包括:
[0017]根據(jù)第三預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù);采用結(jié)構(gòu)相似性SSIM算法,確定所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片之間的每個(gè)SSIM值,并根據(jù)所述多個(gè)SS頂值,計(jì)算所述第一圖片庫(kù)和第二圖片庫(kù)的相似度;判斷所述相似度是否大于預(yù)設(shè)第四閾值,如果是,確定所述兩個(gè)待檢測(cè)視頻為相似視頻。
[0018]可選的,確定所述兩個(gè)待檢測(cè)視頻為相似視頻后,所述方法還包括:
[0019]根據(jù)第四預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù);采用加速健壯特征SURF算法,確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片上的多個(gè)極值點(diǎn),針對(duì)第一圖片庫(kù)中的每張圖片的每個(gè)極值點(diǎn),計(jì)算該極值點(diǎn)和第二圖片庫(kù)中每張圖片的每個(gè)極值點(diǎn)之間的歐式距離,若所述歐式距離的最小值小于預(yù)設(shè)第五閾值,則確定第二圖片庫(kù)的圖片中存在與該極值點(diǎn)匹配的極值點(diǎn),并記錄第一圖片庫(kù)中的該極值點(diǎn);統(tǒng)計(jì)記錄的第一圖片庫(kù)中的極值點(diǎn)的數(shù)量;判斷所述數(shù)量是否大于預(yù)設(shè)數(shù)量閾值,如果是,則確定所述兩個(gè)待檢測(cè)視頻為相似視頻。
[0020]為了達(dá)到上述目的,本發(fā)明實(shí)施例還公開了一種盜版視頻的檢測(cè)方法,包括步驟:
[0021]獲取待檢測(cè)視頻;
[0022]根據(jù)第一預(yù)設(shè)規(guī)則,從待檢測(cè)視頻中提取多張?zhí)卣鲌D片作為第二圖片庫(kù);
[0023]確定第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值,其中所述第一圖片庫(kù)為從正版視頻中提取出的多張?zhí)卣鲌D片構(gòu)成的;
[0024]根據(jù)所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值,確定所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片之間的每個(gè)漢明距離,針對(duì)每個(gè)漢明距離,判斷所述漢明距離是否小于預(yù)設(shè)第一閾值,如果是,確定對(duì)應(yīng)該漢明距離的所述第一圖片庫(kù)和第二圖片庫(kù)中的圖片為一組相似圖片;
[0025]統(tǒng)計(jì)所述第一圖片庫(kù)和第二圖片庫(kù)中相似圖片的組數(shù),并判斷所述第一圖片庫(kù)和第二圖片庫(kù)中相似圖片的組數(shù)與對(duì)比數(shù)量總量的比值是否大于預(yù)設(shè)第二閾值,如果是,則確定所述待檢測(cè)視頻為盜版視頻,其中所述對(duì)比數(shù)量總量為所述第一圖片庫(kù)中的圖片數(shù)量和第二圖片庫(kù)中的圖片數(shù)量的乘積。
[0026]可選的,所述確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值,包括:
[0027]將所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片,按照預(yù)設(shè)值進(jìn)行尺度變換,并對(duì)尺度變換后的所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片做離散余弦變換DCT,獲取所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值。
[0028]可選的,所述根據(jù)第一預(yù)設(shè)規(guī)則,從待檢測(cè)視頻中提取多張?zhí)卣鲌D片作為第二圖片庫(kù),包括:
[0029]根據(jù)預(yù)設(shè)的時(shí)間間隔從待檢測(cè)視頻中提取多張?zhí)卣鲌D片作為第二圖片庫(kù)。
[0030]可選的,確定所述待檢測(cè)視頻為盜版視頻后,所述方法還包括:
[0031]根據(jù)第二預(yù)設(shè)規(guī)則,從待檢測(cè)視頻中提取多張?zhí)卣鲌D片作為第二圖片庫(kù),第一圖片庫(kù)為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用局部二值模式LBP算法,分別確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片上每個(gè)像素點(diǎn)的LBP值,并根據(jù)每個(gè)像素點(diǎn)的LBP值繪制LBP值直方圖;將所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片的LBP值直方圖進(jìn)行重疊,針對(duì)每對(duì)圖片確定重疊區(qū)域中像素點(diǎn)的數(shù)量,確定重疊區(qū)域中像素點(diǎn)的數(shù)量的平均值,根據(jù)所述平均值及所述圖片像素點(diǎn)的數(shù)量,獲得所述第一圖片庫(kù)和第二圖片庫(kù)的相似度;判斷所述相似度是否大于預(yù)設(shè)第三閾值,如果是,確定所述待檢測(cè)視頻為盜版視頻。
[0032]可選的,所述確定所述待檢測(cè)視頻為盜版視頻后,所述方法還包括:
[0033]根據(jù)第三預(yù)設(shè)規(guī)則,從待檢測(cè)視頻中提取多張?zhí)卣鲌D片作為第二圖片庫(kù),第一圖片庫(kù)為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用結(jié)構(gòu)相似性SSIM算法,確定所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片之間的每個(gè)SSIM值,并根據(jù)所述多個(gè)SS頂值,計(jì)算所述第一圖片庫(kù)和第二圖片庫(kù)的相似度;判斷所述相似度是否大于預(yù)設(shè)第四閾值,如果是,確定所述待檢測(cè)視頻為盜版視頻。
[0034]可選的,所述確定所述待檢測(cè)視頻為盜版視頻后,所述方法還包括:
[0035]根據(jù)第四預(yù)設(shè)規(guī)則,從待檢測(cè)視頻中提取多張?zhí)卣鲌D片作為第二圖片庫(kù),第一圖片庫(kù)為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用加速健壯特征SURF算法,確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片上的多個(gè)極值點(diǎn),針對(duì)第一圖片庫(kù)中的每張圖片的每個(gè)極值點(diǎn),計(jì)算該極值點(diǎn)和第二圖片庫(kù)中每張圖片的每個(gè)極值點(diǎn)之間的歐式距離,若所述歐式距離的最小值小于預(yù)設(shè)第五閾值,則確定第二圖片庫(kù)的圖片中存在與該極值點(diǎn)匹配的極值點(diǎn),并記錄第一圖片庫(kù)中的該極值點(diǎn);統(tǒng)計(jì)記錄的第一圖片庫(kù)中的極值點(diǎn)的數(shù)量;判斷所述數(shù)量是否大于預(yù)設(shè)數(shù)量閾值,如果是,則確定所述待檢測(cè)視頻為盜版視頻。
[0036]為了達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種相似視頻的檢測(cè)裝置,包括:
[0037]圖片庫(kù)獲取模塊,用于根據(jù)第一預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù);
[0038]hash特征值確定模塊,用于確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值;
[0039]相似圖片確定模塊,用于根據(jù)所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值,確定所述第一圖片庫(kù)中每張圖片和第二圖片庫(kù)中每張圖片之間的每個(gè)漢明距離,針對(duì)每個(gè)漢明距離,判斷所述漢明距離是否小于預(yù)設(shè)第一閾值,如果是,確定對(duì)應(yīng)該漢明距離的所述第一圖片庫(kù)和第二圖片庫(kù)中的圖片為一組相似圖片;
[0040]相似視頻確定模塊,用于統(tǒng)計(jì)所述第一圖片庫(kù)和第二圖片庫(kù)中相似圖片的組數(shù),并判斷所述第一圖片庫(kù)和第二圖片庫(kù)中相似圖片的組數(shù)與對(duì)比數(shù)量總量的比值是否大于預(yù)設(shè)第二閾值,如果是,則確定所述兩個(gè)待檢測(cè)視頻為相似視頻,其中所述對(duì)比數(shù)量總量為所述第一圖片庫(kù)中的圖片數(shù)量和第二圖片庫(kù)中的圖片數(shù)量的乘積。
[0041 ]可選的,所述hash特征值確定模塊,具體用于:
[0042]將所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片,按照預(yù)設(shè)值進(jìn)行尺度變換,并對(duì)尺度變換后的所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片做離散余弦變換DCT,獲取所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片的hash特征值。
[0043]可選的,所述圖片庫(kù)獲取模塊,具體用于:
[0044]根據(jù)預(yù)設(shè)的時(shí)間間隔從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù)。
[0045]可選的,所述裝置還包括第一確定模塊,具體用于:
[0046]根據(jù)第二預(yù)設(shè)規(guī)則,從兩個(gè)待檢測(cè)視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫(kù)和第二圖片庫(kù);采用局部二值模式LBP算法,分別確定所述第一圖片庫(kù)和第二圖片庫(kù)中每張圖片上每個(gè)像素點(diǎn)的LBP值,并根據(jù)每個(gè)像素點(diǎn)的LBP值繪