两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

視頻檢測方法和裝置的制造方法

文檔序號:10613253閱讀:465來源:國知局
視頻檢測方法和裝置的制造方法
【專利摘要】本申請公開了視頻檢測方法和裝置。所述方法的一【具體實施方式】包括:從待檢測視頻中截取圖像以形成待檢測圖像序列;生成待檢測圖像序列中每個待檢測圖像的哈希簽名;將待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配;記錄樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以及哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視頻標識的出現(xiàn)次數(shù);將視頻標識出現(xiàn)次數(shù)大于第一閾值且視頻標識所關聯(lián)的圖像標識中不同圖像標識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為待檢測視頻的同源視頻。該實施方式實現(xiàn)了同源視頻的自動檢測。
【專利說明】
視頻檢測方法和裝置
技術領域
[0001] 本申請涉及計算機技術領域,具體涉及多媒體技術領域,尤其涉及視頻檢測方法 和裝置。
【背景技術】
[0002] 服務器中存在著大量的視頻,其中一些視頻可能是相同的內容。查找出內容相同 的同源視頻有助于發(fā)現(xiàn)侵犯版權、涉恐以及涉黃等非法視頻并進行封禁處理。此外,發(fā)現(xiàn)同 源視頻還可以用于減少同一資源的多個相同內容的副本,節(jié)省存儲和帶寬。
[0003] 然而,由于網(wǎng)絡中視頻的數(shù)量越來越多,使得無法單純靠人工鑒別和標注樣本的 方式來識別視頻。

【發(fā)明內容】

[0004] 本申請的目的在于提出一種改進的視頻檢測方法和裝置,來解決以上【背景技術】部 分提到的技術問題。
[0005] 第一方面,本申請?zhí)峁┝艘环N視頻檢測方法,所述方法包括:從待檢測視頻中截取 至少一個圖像以形成待檢測圖像序列;生成所述待檢測圖像序列中每個待檢測圖像的哈希 簽名;將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本 視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配,其中樣本視頻的視頻 標識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標識是關聯(lián)存儲的; 記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以及所述哈希簽名匹 配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視頻標識的出現(xiàn)次 數(shù);將視頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中不同圖像標識的 出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。
[0006] 在一些實施例中,所述從待檢測視頻中截取至少一個圖像以形成待檢測圖像序 列,包括:在所述待檢測視頻中的視頻片段中,每隔第一預設幀數(shù)截取圖像,以形成待檢測 圖像序列。
[0007] 在一些實施例中,所述視頻片段是位于所述待檢測視頻的中間部分且長度為第一 預設時長的視頻片段。
[0008] 在一些實施例中,所述樣本圖像序列是針對各個樣本視頻中位于樣本視頻的中間 部分且時長為第二預設時長的視頻片段、每隔第二預設幀數(shù)截取圖像所形成的,其中,所述 第二預設時長大于所述第一預設時長且所述第二預設幀數(shù)小于所述第一預設幀數(shù)。
[0009] 在一些實施例中,所述生成所述待檢測圖像序列中每個待檢測圖像的哈希簽名, 包括:提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。
[0010] 在一些實施例中,在所述提取各個待檢測圖像的全局特征向量,并基于所提取的 全局特征向量生成哈希簽名之前,所述生成所述圖像序列中每個圖像的哈希簽名還包括以 下一項或多項:將待檢測圖像從三通道圖像轉換為單通道圖像;對待檢測圖像進行腐蝕以 弱化待檢測圖像中的字幕;去除待檢測圖像的黑邊。
[0011] 在一些實施例中,所述提取各個待檢測圖像的全局特征向量,并基于所提取的全 局特征向量生成哈希簽名,包括:將待測試圖像均勻分塊,計算所分成的分塊的整體灰度均 值以及各個塊各自的灰度均值;根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關 系,生成與各個塊對應的二進制位,以形成哈希簽名。
[0012] 在一些實施例中,所述提取各個待檢測圖像的全局特征向量,并基于所提取的全 局特征向量生成哈希簽名,包括:對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像; 將已放縮圖像均勾分成行數(shù)與列數(shù)均為8的塊;計算每個塊的DCT(Discrete Cosine Transform,離散余弦變換)系數(shù)并量化;將每個已量化DCT系數(shù)中的前8位作為一行生成矩 陣;對于所述矩陣的每個列,計算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的 大小關系生成與各個元素對應的二進制位,以形成哈希簽名。
[0013] 在一些實施例中,所述提取各個待檢測圖像的全局特征向量,并基于所提取的全 局特征向量生成哈希簽名,包括:將待測試圖像均勻分塊,計算所分成的分塊的整體灰度均 值以及各個塊各自的灰度均值,根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關 系,生成與各個塊對應的二進制位,以形成待生成哈希簽名的第一部分;對待測試圖像放縮 為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計算 每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進行排序后的前8個作為矩陣的各行生 成矩陣;對于所述矩陣的每個列,計算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均 值的大小關系生成與各個元素對應的二進制位,以形成待生成哈希簽名的第二部分;基于 所述第一部分和所述第二部分生成哈希簽名。
[0014]在一些實施例中,在所述將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與 從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進 行匹配之前,所述方法還包括:基于所述待檢測圖像序列中各個待檢測圖像的哈希簽名對 所述待檢測圖像序列中的待檢測圖像進行去重處理。
[0015] 在一些實施例中,所述將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從 樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行 匹配,包括:依次計算所述樣本圖像序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽 名的漢明距離,并將漢明距離不大于預設漢明距離閾值的哈希簽名所對應的樣本圖像確定 為匹配成功的樣本圖像。
[0016] 在一些實施例中,所述依次計算所述樣本圖像序列中各個樣本圖像的哈希簽名將 與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預設漢明距離閾值k的哈希簽名所 對應的樣本圖像確定為匹配成功的樣本圖像,包括:將待測試圖像的哈希簽名按位數(shù)平均 分成m塊后從中選擇η塊作為查詢用子簽名,其中n<m-k;確定預先建立的子簽名索引中與 所述查詢用子簽名相同的子簽名,其中所述子簽名索引的各個子簽名是對樣本圖像序列中 各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提取出來而形成的,且各個子簽名與所 對應的樣本圖像是關聯(lián)的;對于與所述查詢用子簽名相同的各個子簽名,計算子簽名所關 聯(lián)的樣本圖像的哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用 子簽名外的其他m-n塊之間的漢明距離;將漢明距離不大于預設漢明距離閾值k的哈希簽名 所對應的樣本圖像確定為匹配成功的樣本圖像。
[0017] 在本實施例的一些可選實現(xiàn)方式中,所述樣本圖像序列中各個樣本圖像的哈希簽 名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。
[0018] 第二方面,本申請?zhí)峁┝艘环N視頻檢測裝置,所述裝置包括:截取單元,用于從待 檢測視頻中截取至少一個圖像以形成待檢測圖像序列;生成單元,用于生成所述待檢測圖 像序列中每個待檢測圖像的哈希簽名;匹配單元,用于將所述待檢測圖像序列中各個待檢 測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣 本圖像的哈希簽名進行匹配,其中樣本視頻的視頻標識與從該樣本視頻所提取出的樣本圖 像序列中各個樣本圖像的圖像標識是關聯(lián)存儲的;記錄單元,用于記錄所述樣本圖像序列 中哈希簽名匹配成功的樣本圖像的圖像標識以及所述哈希簽名匹配成功的樣本圖像所屬 的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視頻標識的出現(xiàn)次數(shù);確定單元,用于將視 頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中不同圖像標識的出現(xiàn)次數(shù) 大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。
[0019] 在一些實施例中,所述截取單元進一步用于:在所述待檢測視頻中的視頻片段中, 每隔第一預設幀數(shù)截取圖像,以形成待檢測圖像序列。
[0020] 在一些實施例中,所述視頻片段是位于所述待檢測視頻的中間部分且長度為第一 預設時長的視頻片段。
[0021 ]在一些實施例中,所述樣本圖像序列是針對各個樣本視頻中位于樣本視頻的中間 部分且時長為第二預設時長的視頻片段、每隔第二預設幀數(shù)截取圖像所形成的,其中,所述 第二預設時長大于所述第一預設時長且所述第二預設幀數(shù)小于所述第一預設幀數(shù)。
[0022] 在一些實施例中,所述生成單元包括:生成子單元,用于提取各個待檢測圖像的全 局特征向量,并基于所提取的全局特征向量生成哈希簽名。
[0023] 在一些實施例中,所述生成單元還包括以下一項或多項:轉換子單元,用于在所述 提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名之前, 將待檢測圖像從三通道圖像轉換為單通道圖像;腐蝕單元,用于在所述提取各個待檢測圖 像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名之前,對待檢測圖像進行 腐蝕以弱化待檢測圖像中的字幕;去黑邊單元,用于在所述提取各個待檢測圖像的全局特 征向量,并基于所提取的全局特征向量生成哈希簽名之前,去除待檢測圖像的黑邊。
[0024] 在一些實施例中,所述生成子單元進一步用于:將待測試圖像均勻分塊,計算所分 成的分塊的整體灰度均值以及各個塊各自的灰度均值;根據(jù)各個塊各自的灰度均值與所述 整體灰度均值的大小關系,生成與各個塊對應的二進制位,以形成哈希簽名。
[0025] 在一些實施例中,所述生成子單元進一步用于:對待測試圖像放縮為行數(shù)與列數(shù) 均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計算每個塊的DCT系 數(shù)并量化;將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣;對于所述矩陣的每個列,計 算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的大小關系生成與各個元素對應 的二進制位,以形成哈希簽名。
[0026] 在一些實施例中,所述生成子單元進一步用于:將待測試圖像均勻分塊,計算所分 成的分塊的整體灰度均值以及各個塊各自的灰度均值,根據(jù)各個塊各自的灰度均值與所述 整體灰度均值的大小關系,生成與各個塊對應的二進制位,以形成待生成哈希簽名的第一 部分;對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù) 與列數(shù)均為8的塊;計算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進行排序后的前 8個作為矩陣的各行生成矩陣;對于所述矩陣的每個列,計算列中元素的均值并根據(jù)列中每 個元素的數(shù)值與該均值的大小關系生成與各個元素對應的二進制位,以形成待生成哈希簽 名的第一部分;基于所述第一部分和所述第二部分生成哈希簽名。
[0027] 在一些實施例中,所述裝置還包括:去重單元,用于在所述將所述待檢測圖像序列 中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序 列中各個樣本圖像的哈希簽名進行匹配之前,基于所述待檢測圖像序列中各個待檢測圖像 的哈希簽名對所述待檢測圖像序列中的待檢測圖像進行去重處理。
[0028] 在一些實施例中,所述匹配單元,進一步用于:依次計算所述樣本圖像序列中各個 樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預設漢明距 離閾值的哈希簽名所對應的樣本圖像確定為匹配成功的樣本圖像。
[0029] 在一些實施例中,所述匹配單元進一步用于:將待測試圖像的哈希簽名按位數(shù)平 均分成m塊后從中選擇η塊作為查詢用子簽名,其中n<m-k;確定預先建立的子簽名索引中 與所述查詢用子簽名相同的子簽名,其中所述子簽名索引的各個子簽名是對樣本圖像序列 中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提取出來而形成的,且各個子簽名與 所對應的樣本圖像是關聯(lián)的;對于與所述查詢用子簽名相同的各個子簽名,計算子簽名所 關聯(lián)的樣本圖像的哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢 用子簽名外的其他m-n塊之間的漢明距離;將漢明距離不大于預設漢明距離閾值k的哈希簽 名所對應的樣本圖像確定為匹配成功的樣本圖像。
[0030] 在一些實施例中,所述樣本圖像序列中各個樣本圖像的哈希簽名以及待測試圖像 序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。
[0031] 本申請?zhí)峁┑囊曨l檢測方法和裝置,通過對待檢測視頻與樣本視頻中所截取的圖 像的哈希簽名進行匹配,并根據(jù)匹配成功的次數(shù)確定出同源視頻,實現(xiàn)了同源視頻的自動 檢測。
【附圖說明】
[0032] 通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它 特征、目的和優(yōu)點將會變得更明顯:
[0033]圖1是本申請可以應用于其中的示例性系統(tǒng)架構圖;
[0034] 圖2是根據(jù)本申請的視頻檢測方法的一個實施例的流程圖;
[0035] 圖3是根據(jù)本申請的視頻檢測方法的又一個實施例的流程圖;
[0036] 圖4是根據(jù)本申請的視頻檢測裝置的一個實施例的結構示意圖;
[0037] 圖5是適于用來實現(xiàn)本申請實施例的終端設備或服務器的計算機系統(tǒng)的結構示意 圖。
【具體實施方式】
[0038] 下面結合附圖和實施例對本申請作進一步的詳細說明??梢岳斫獾氖?,此處所描 述的具體實施例僅僅用于解釋相關發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了 便于描述,附圖中僅示出了與有關發(fā)明相關的部分。
[0039] 需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相 互組合。下面將參考附圖并結合實施例來詳細說明本申請。
[0040] 圖1示出了可以應用本申請的視頻檢測方法或視頻檢測裝置的實施例的示例性系 統(tǒng)架構1〇〇。
[0041] 如圖1所示,系統(tǒng)架構100可以包括終端設備101、102、103,網(wǎng)絡104和服務器105。 網(wǎng)絡104用以在終端設備101、102、103和服務器105之間提供通信鏈路的介質。網(wǎng)絡104可以 包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
[0042]用戶可以使用終端設備101、102、103通過網(wǎng)絡104與服務器105交互,以接收或發(fā) 送消息等。終端設備101、102、103上可以安裝有各種通訊客戶端應用,例如網(wǎng)頁瀏覽器應 用、網(wǎng)盤應用、視頻網(wǎng)站應用等。
[0043] 終端設備101、102、103可以是具有顯示屏并且支持視頻播放的各種電子設備,包 括但不限于智能手機、平板電腦、電子書閱讀器、MP3播放器(Moving Picture Experts Group Audio Layer III,動態(tài)影像專家壓縮標準音頻層面3)、MP4(Moving Picture Experts Group Audio Layer IV,動態(tài)影像專家壓縮標準音頻層面4)播放器、膝上型便攜 計算機和臺式計算機等等。
[0044] 服務器105可以是提供各種服務的服務器,例如對終端設備101、102、103上播放的 視頻提供支持的后臺服務器。后臺服務器可以對接收到的視頻請求等數(shù)據(jù)進行分析等處 理,并將處理結果(例如所請求的視頻數(shù)據(jù))反饋給終端設備。
[0045] 需要說明的是,本申請實施例所提供的視頻檢測方法一般由服務器105執(zhí)行,相應 地,視頻檢測裝置一般設置于服務器105中。
[0046] 應該理解,圖1中的終端設備、網(wǎng)絡和服務器的數(shù)目僅僅是示意性的。根據(jù)實現(xiàn)需 要,可以具有任意數(shù)目的終端設備、網(wǎng)絡和服務器。
[0047] 繼續(xù)參考圖2,示出了根據(jù)本申請的視頻檢測方法的一個實施例的流程200。所述 的視頻檢測方法,包括以下步驟:
[0048]步驟201,從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列。
[0049] 在本實施例中,視頻檢測方法運行于其上的電子設備(例如圖1所示的服務器)可 以首先從本地或通過有線連接方式或者無線連接方式從其他服務器或終端設備獲取待檢 測視頻。之后,電子設備可以對該待檢測視頻的部分或全部按幀進行截取,從而截取到至少 一個圖像,所截取的圖像形成待檢測圖像序列。
[0050] 需要指出的是,上述無線連接方式可以包括但不限于3G/4G連接、WiFi連接、藍牙 連接、WiMAX連接、Zigbee連接、UWB(ultra wideband)連接、以及其他現(xiàn)在已知或將來開發(fā) 的無線連接方式。
[0051]步驟202,生成待檢測圖像序列中每個待檢測圖像的哈希簽名。
[0052]在本實施例中,基于步驟201中得到的待檢測圖像序列,上述電子設備(例如圖1所 示的服務器)可以對每個待檢測圖像提取特征數(shù)據(jù),在對特征數(shù)據(jù)進行處理生成每個待檢 測圖像的哈希簽名。
[0053]在本實施例的一些可選實現(xiàn)方式中,步驟202中生成待檢測圖像的哈希簽名可以 包括:提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。
[0054]在本實施例的一些可選實現(xiàn)方式中,提取各個待檢測圖像的全局特征向量,并基 于所提取的全局特征向量生成哈希簽名,包括:將待測試圖像均勻分塊,計算所分成的分塊 的整體灰度均值以及各個塊各自的灰度均值;根據(jù)各個塊各自的灰度均值與整體灰度均值 的大小關系,生成與各個塊對應的二進制位,以形成哈希簽名。在該實現(xiàn)方式中,均值方法 在提取圖像全局特征對圖像降質、整體亮度與色度變化等過程中有較強的魯棒性。
[0055] 在本實施例的一些可選實現(xiàn)方式中,提取各個待檢測圖像的全局特征向量,并基 于所提取的全局特征向量生成哈希簽名,包括:對待測試圖像放縮為行數(shù)與列數(shù)均為8的整 數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計算每個塊的DCT系數(shù)并量化; 將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣;對于矩陣的每個列,計算列中元素的 均值并根據(jù)列中每個元素的數(shù)值與該均值的大小關系生成與各個元素對應的二進制位,以 形成哈希簽名。該方式中,DCT方法在提取全局特征時對圖像內容變形、水印與標志的添加、 一般性的濾鏡、邊界內容丟失等過程有較強的魯棒性。
[0056] 在本實施例的一些可選實現(xiàn)方式中,取各個待檢測圖像的全局特征向量,并基于 所提取的全局特征向量生成哈希簽名,可以通過以下方式執(zhí)行:
[0057] 首先,將待測試圖像均勻分塊,計算所分成的分塊的整體灰度均值以及各個塊各 自的灰度均值,根據(jù)各個塊各自的灰度均值與整體灰度均值的大小關系,生成與各個塊對 應的二進制位,以形成待生成哈希簽名的第一部分。具體的,可以將要處理的圖像拷貝一 份,再將圖像均勻分成8X8塊圖像的一個拷貝均勻分成8X8塊,去除上下邊界上的塊,計算 中間6X8塊的整體灰度均值以及每塊的灰度均值,用每塊的均值與整體均值做比較,量化 為48bit(位)整數(shù)。在執(zhí)行該步驟之前,還可以預先去除上下邊界上的塊。因為圖像內部塊 顏色的連續(xù)性要好于邊界上去除黑邊不徹底的塊,可以使提取的全局特征和獲取的哈希簽 名更穩(wěn)定。
[0058]之后,對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻 分成行數(shù)與列數(shù)均為8的塊;計算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進行排 序后的前8個作為矩陣的各行生成矩陣;對于矩陣的每個列,計算列中元素的均值并根據(jù)列 中每個元素的數(shù)值與該均值的大小關系生成與各個元素對應的二進制位,以形成待生成哈 希簽名的第二部分。具體的,可以首先將上述步驟得到的圖像拷貝放縮到16X16大小,并分 成大小為8X8的四塊,計算每塊的DCT系數(shù),DCT系數(shù)矩陣中的第一個(第一行第一列)系數(shù) 是直流(DC)系數(shù),對應的是均值信息,其他系數(shù)稱為交流(AC)系數(shù);再對各塊的DCT系數(shù)都 按"Z"排序,從低頻到高頻漸變,選取各塊排序后的DCT系數(shù)矩陣的第2,3,4,5個低頻系數(shù)并 量化,構成4X4矩陣,每列對應的是不同塊的同位置低頻系數(shù),按列求均值,每列元素與相 應列均值比較,量化為16bit整數(shù)。在圖像哈希簽名中,既要考慮簽名的區(qū)別性又要考慮其 魯棒性,在DCT系數(shù)中,高頻系數(shù)選的越多,則圖像的區(qū)別性越強,高頻系數(shù)選的越少,則圖 像的魯棒性越強。上述過程可以在區(qū)別性和魯棒性之間取得較好的平衡。
[0059]最后,基于第一部分和第二部分生成哈希簽名。例如,將前述過程中得到的48bit 的整數(shù)與16bit的整數(shù)結合,得到共64bit的整數(shù),即可作為哈希簽名。
[0060] 該實現(xiàn)方式,結合均值與DCT方法提取全局特征的方法保留了各自優(yōu)點,增強了所 生成的哈希簽名的魯棒性。
[0061] 在本實施例的一些可選實現(xiàn)方式中,在提取各個待檢測圖像的全局特征向量,并 基于所提取的全局特征向量生成哈希簽名之前,步驟202還可以包括以下步驟中的一項或 多項:將待檢測圖像從三通道圖像轉換為單通道圖像;對待檢測圖像進行腐蝕以弱化待檢 測圖像中的字幕;去除待檢測圖像的黑邊。
[0062]在該實現(xiàn)方式中,將待檢測圖像從三通道圖像轉換為單通道圖像。即,可以將圖像 統(tǒng)一轉換成灰度圖以進行后續(xù)處理,可以減少后續(xù)處理的數(shù)據(jù)量,有利于降低處理復雜度 以及提尚處理效率。
[0063]在該實現(xiàn)方式中,對待檢測圖像進行腐蝕以弱化待檢測圖像中的字幕,具體可以 通過如下方式執(zhí)行:用矩形核對圖像進行腐蝕操作,弱化字幕。矩形核寬高取為1/40倍圖像 寬、1/40倍圖像高,并且不超過9像素。腐蝕操作時可以利用形態(tài)學上的腐蝕算法對圖像進 行處理。腐蝕核如果太大,有可能會將圖像中實際內容部分的細節(jié)腐蝕掉,該細節(jié)所處的行 或列有可能會被誤判成黑邊。
[0064] 對黑邊區(qū)域有字幕的視頻,對圖像進行腐蝕操作,細化了文字,降低了黑邊區(qū)域內 的雜點比例,在去黑邊操作時使得該區(qū)域更容易去除,而腐蝕操作對其他區(qū)域去黑邊并無 影響。
[0065] 在該實現(xiàn)方式中,去除待檢測圖像的黑邊,具體可以通過如下方式執(zhí)行:從上下兩 個邊界同時逐行向內掃描圖像、從左右兩個邊界同時逐列向內掃描圖像,分別計算每條線 的灰度直方圖,用線直方圖峰值對應的像素點個數(shù)與閾值比較來判斷該線是否為黑邊,上 下往內掃描時直到有一條判斷為非黑邊則停止掃描,左右往內掃描時直到有一條判斷為非 黑邊則停止掃描,截取掃描終止時的上下左右邊界內的圖像內容為新圖像。本發(fā)明中指的 黑邊是廣義的黑邊,具體是指某單一顏色。有黑邊的影視圖像,黑邊區(qū)域是上下對稱、左右 對稱的,掃描時上下若不同時往內掃、左右不同時往內掃,則上下兩側去除的區(qū)域大小不一 致、左右兩側去除的區(qū)域大小不一致,這就造成全局特征的提取和哈希簽名的獲取和在圖 像實際內容區(qū)域內操作時相比存在偏差。如果上下同時掃描、左右同時掃描,上下兩行、左 右兩列必須同時滿足去除黑邊的條件時,掃描才會終止,按這種方式掃描完成后,新的圖像 即使還存在黑邊,黑邊區(qū)域仍然還是對稱的,上述所述的偏差將會降低很多。采用去黑邊操 作,可以保留下的是實際的圖像內容,對無黑邊的同源視頻,去黑邊操作對其實際影響并不 大,保留下來的是同樣的圖像內容。去黑邊操作增強了同源視頻的圖像哈希簽名的穩(wěn)定性。 [0066]需要說明的是,在對待檢測圖像作上述處理時,樣本圖像序列中的各個圖像也進 行相應的處理,以保證圖像匹配時的準確度。
[0067] 步驟203,將待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中 各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配。
[0068] 在本實施例中,電子設備可以將待檢測圖像序列中各個待檢測圖像的哈希簽名與 從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進 行匹配。其中,其中樣本視頻的視頻標識與從該樣本視頻所提取出的樣本圖像序列中各個 樣本圖像的圖像標識是關聯(lián)存儲的。其中,樣本視頻集合是預先存儲的,其包含的各個樣本 視頻用于與待檢測視頻進行比對,以判斷待檢測視頻是否與其中的一個樣本視頻為同源視 頻。
[0069]在本實施例的一些可選實現(xiàn)方式中,步驟203具體包括依次計算樣本圖像序列中 各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預設漢 明距離閾值的哈希簽名所對應的樣本圖像確定為匹配成功的樣本圖像。在對圖像進行匹配 時,通常是提取不同圖像中分塊均值的全局特征后并將向量歸一化,之后計算兩個特征向 量的歐式距離。該實現(xiàn)方式中,獲取哈希簽名的過程,是圖像特征損失的過程。但從實驗測 算中可以得出,在漢明空間比較哈希簽名,仍基本保持了在歐式空間中相同的相似性與不 相似性,提取哈希簽名的方法是局部敏感的。但是,哈希簽名之間的漢明距離計算圖像之間 的匹配度,計算簡單,因此操作速度快,且哈希簽名占用的存儲空間較小,因此有利于提高 處理效率。
[0070] 步驟204,記錄樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以及哈 希簽名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視頻標識 的出現(xiàn)次數(shù)。
[0071] 在本實施例中,在通過步驟203進行匹配時,電子設備可以對樣本圖像序列中哈希 簽名匹配成功的樣本圖像的圖像標識進行記錄,同時,還對這些匹配成功的樣本圖像所屬 的視頻的視頻標識進行記錄,并對各個圖像標識和各個視頻標識的出現(xiàn)次數(shù)進行統(tǒng)計。 [0072]步驟205,將視頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中不 同圖像標識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為待檢測視頻的同源視頻。
[0073]在本實施例中,基于步驟204中的統(tǒng)計結果,電子設備可以對各個樣本視頻對應的 視頻標識的出現(xiàn)次數(shù)與第一閾值進行比較。同時,電子設備還可以將各個樣本視頻的視頻 標識所關聯(lián)的圖像標識中不同圖像標識的出現(xiàn)次數(shù)與第二閾值進行比較。當某一樣本視頻 的視頻的視頻標識的出現(xiàn)次數(shù)大于第一閾值,且該樣本視頻的視頻標識所關聯(lián)的圖像標識 中不同圖像標識的出現(xiàn)次數(shù)大于第二閾值時,將該樣本視頻確定為待檢測視頻的同源視 頻。
[0074]在本實施例的一些可選實現(xiàn)方式中,在步驟204之前,上述視頻檢測方法還包括: 基于待檢測圖像序列中各個待檢測圖像的哈希簽名對待檢測圖像序列中的待檢測圖像進 行去重處理。在本實施例中,電子設備可以將哈希簽名的多個圖像進行去重處理,以減小后 續(xù)處理的數(shù)據(jù)量。需要說明的是,樣本圖像序列中的各個圖像也可以基于哈希簽名進行去 重處理。
[0075] 在本實施例的一些可選實現(xiàn)方式中,步驟201可以是在待檢測視頻中的視頻片段 中,每隔第一預設幀數(shù)截取圖像,以形成待測試圖像序列。在該實現(xiàn)方式中,電子設備可以 先從待檢測視頻選擇需要提取的視頻片段,并在選中的視頻片段中每隔第一預設幀數(shù)均勻 截取圖像。
[0076] 在本實施例的一些可選實現(xiàn)方式中,上述視頻片段可以是位于待檢測視頻的中間 部分且長度為第一預設時長的視頻片段。在本實施例中,可以采用待檢測視頻的中間部分 作為采集圖像的視頻片段。通常,上述第一預設時長的設置,可以避免將待檢測視頻開頭或 結尾的部分作為圖像截取的來源,從而避免同源視頻僅由于視頻開頭和結尾的不同而無法 被檢測出來。
[0077] 在本實施例的一些可選實現(xiàn)方式中,樣本圖像序列是針對各個樣本視頻中位于樣 本視頻的中間部分且時長為第二預設時長的視頻片段、每隔第二預設幀數(shù)截取圖像所形成 的。其中,該第二預設時長大于第一預設時長且第二預設幀數(shù)小于第一預設幀數(shù)。例如,對 于樣本視頻,可以從正中間部分截取10分鐘,每隔10幀密集截取獲得樣本圖像序列,計算每 個圖像的哈希簽名,并記錄下視頻序號和圖像序號。對于待檢測視頻,可以從正中間部分截 取5分鐘,每隔100幀稀疏截取獲得圖像序列。在該實現(xiàn)方式中,對樣本視頻的圖像截取為密 集截取,對待檢測視頻的圖像截取為稀疏截取,且樣本視頻中圖像截取的視頻片段比待檢 測視頻中圖像截取的視頻片段時間更長,從而能最大程度保障從待檢測視頻中截取的圖像 都能在從樣本視頻截取出的樣本圖像序列中匹配到,保證后續(xù)檢測的準確度。
[0078] 在上述實施例中,本通過對待檢測視頻與樣本視頻中所截取的圖像的哈希簽名進 行匹配,并根據(jù)匹配成功的次數(shù)確定出同源視頻,實現(xiàn)了同源視頻的自動檢測。本實施例的 方案可廣泛應用于認證、內容索引、版權視頻檢索、暴恐視頻檢索、大規(guī)模數(shù)據(jù)庫管理、拷貝 檢測以及其他相關的視頻處理領域。
[0079] 進一步參考圖3,其示出了視頻檢測方法的又一個實施例的流程300。該視頻檢測 方法的流程300,包括以下步驟:
[0080] 步驟301,從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列。
[0081 ] 在本實施例中,步驟301的處理可以參考圖2對應實施例中的步驟201,這里不再贅 述。
[0082]步驟302,生成待檢測圖像序列中每個待檢測圖像的哈希簽名。
[0083] 在本實施例中,步驟301的處理可以參考圖2對應實施例中的步驟201,這里不再贅 述。
[0084] 步驟303,將待測試圖像的哈希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢 用子簽名。
[0085] 在本實施例中,對于步驟302中各個待檢測圖像的哈希簽名,電子設備可以將哈希 簽名平均分成m塊。其中,m>k,其中可為預設的漢明距離閾值,將在步驟306中使用。對于所 分成的m塊,電子設備可以從中選擇η塊作為后續(xù)查詢過程中用于與各個索引中子簽名進行 匹配的查詢用子簽名。其中,n<m-k。因此,單個哈希簽名對應有的查詢用子簽名的數(shù)量是 C個。
[0086]步驟304,確定預先建立的子簽名索引中與查詢用子簽名相同的子簽名。
[0087] 在本實施例中,電子設備可以使用上述查詢用子簽名預先建立的子簽名索引中進 行查詢。其中,子簽名索引中的各個子簽名是對樣本圖像序列中各個樣本圖像的哈希簽名 平均分成m塊后、將每η塊提取出來而形成的,因此該子簽名索引中的索引數(shù)量也可以是 個。
[0088] 其中,子簽名索引的中各個子簽名與所對應的樣本圖像是關聯(lián)的。在查詢時,可以 將待查詢子簽名與相同組合的子簽名進行查詢。最終,可以確定子簽名索引中與查詢用子 簽名相同的子簽名。
[0089] 步驟305,對于與查詢用子簽名相同的各個子簽名,計算子簽名關聯(lián)的樣本圖像的 哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用子簽名外的其他 m-n塊之間的漢明距離。
[0090] 在本實施例中,在基于步驟304查詢到與查詢用子簽名相同的各個子簽名后,電子 設備可以對樣本圖像的哈希簽名以及待檢測圖像的哈希簽名中除子簽名外的其他m-n塊形 成的數(shù)位進行比對,計算兩者之間的漢明距離。
[0091] 步驟306,將漢明距離不大于預設漢明距離閾值k的哈希簽名所對應的樣本圖像確 定為匹配成功的樣本圖像。
[0092] 在本實施例中,對于步驟305中所計算的各個漢明距離,電子設備將漢明距離不大 于預設漢明距離閾值k的哈希簽名所對應的樣本圖像作為匹配成功的圖像。其中,對于漢明 距離閾值k,漢明距離不大于k的兩個哈希簽名之間不同的數(shù)位最多在m塊中的k個塊中各有 一個分布,因此在m塊中兩個哈希簽名至少在m-k個塊上完全一致。因此,將m塊中任意η塊組 合進行結合所形成的各個子簽名用來建立索引,可以以保證在用于匹配的各個索引所關聯(lián) 的所有哈希簽名中可以囊括所有與待檢測圖像的哈希簽名的漢明距離不大于k的哈希簽 名??蛇x的,可以將η設置為n=m-k。
[0093] 步驟307,記錄樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以及哈 希簽名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視頻標識 的出現(xiàn)次數(shù)。
[0094]在本實施例中,步驟307的具體處理可以參考圖2對應實施例的步驟204,這里不再 贅述。
[0095]步驟308,將視頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中不 同圖像標識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為待檢測視頻的同源視頻。
[0096]在本實施例中,步驟308的具體處理可以參考圖2對應圖實施例的步驟205,這里不 再贅述。
[0097] 在本實施例的一些可選實現(xiàn)方式中,上述樣本圖像序列中各個樣本圖像的哈希簽 名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。
[0098] 從圖3中可以看出,與圖2對應的實施例相比,本實施例中的視頻檢測方法的流程 300在匹配待檢測圖像序列中圖像的哈希簽名和樣本圖相同序列中圖像的哈希簽名時,使 用通過子簽名建立的索引進行查詢。若任選η塊所得到的哈希子簽名的位的最小值為min, 則對每個圖像每個索引下理論上最多線性查詢2 64^min次就能查詢到最多在k個位上不同的 相似圖像。這種查詢方式顯著地增加了查詢速度,且該查詢方案不會丟失匹配的圖像,從而 提高了整體的處理效率。
[0099] 進一步參考圖4,作為對上述各圖所示方法的實現(xiàn),本申請?zhí)峁┝艘环N視頻檢測裝 置的一個實施例,該裝置實施例與圖2所示的方法實施例相對應,該裝置具體可以應用于各 種服務器中。
[0?00] 如圖4所示,本實施例所述的視頻檢測裝置400包括:截取單元401、生成單元402、 匹配單元403、記錄單元404和確定單元405。其中,截取單元401用于從待檢測視頻中截取至 少一個圖像以形成待檢測圖像序列;生成單元402用于生成待檢測圖像序列中每個待檢測 圖像的哈希簽名;匹配單元403用于將待檢測圖像序列中各個待檢測圖像的哈希簽名與從 樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行 匹配,其中樣本視頻的視頻標識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像 的圖像標識是關聯(lián)存儲的;記錄單元404用于記錄樣本圖像序列中哈希簽名匹配成功的樣 本圖像的圖像標識以及哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個 圖像標識和各個視頻標識的出現(xiàn)次數(shù);而確定單元405,用于將視頻標識出現(xiàn)次數(shù)大于第一 閾值、且視頻標識所關聯(lián)的圖像標識中不同圖像標識的出現(xiàn)次數(shù)大于第二閾值的樣本視 頻,確定為待檢測視頻的同源視頻。
[0101] 在本實施例中,視頻檢測裝置400的截取單元401、生成單元402、匹配單元403、記 錄單元404和確定單元405的具體處理可以參考圖2對應實施例的步驟201、步驟202、步驟 203、步驟204和步驟205,這里不再贅述。
[0102] 在本實施例的一些可選實現(xiàn)方式中,截取單元401進一步用于:在待檢測視頻中的 視頻片段中,每隔第一預設幀數(shù)截取圖像,以形成待檢測圖像序列。該實現(xiàn)方式中的具體處 理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0103] 在本實施例的一些可選實現(xiàn)方式中,上述視頻片段是位于待檢測視頻的中間部分 且長度為第一預設時長的視頻片段。該實現(xiàn)方式中的具體處理可以參考圖2對應實施例中 相應的實現(xiàn)方式。
[0104] 在本實施例的一些可選實現(xiàn)方式中,上述樣本圖像序列是針對各個樣本視頻中位 于樣本視頻的中間部分且時長為第二預設時長的視頻片段、每隔第二預設幀數(shù)截取圖像所 形成的,其中,第二預設時長大于第一預設時長且第二預設幀數(shù)小于第一預設幀數(shù)。該實現(xiàn) 方式中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0105] 在本實施例的一些可選實現(xiàn)方式中,生成單元402包括:生成子單元(未示出),用 于提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。該 實現(xiàn)方式中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0106] 在本實施例的一些可選實現(xiàn)方式中,生成單元402還包括以下一項或多項:轉換子 單元(未示出),用于在提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向 量生成哈希簽名之前,將待檢測圖像從三通道圖像轉換為單通道圖像;腐蝕單元(未示出), 用于在提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名 之前,對待檢測圖像進行腐蝕以弱化待檢測圖像中的字幕;去黑邊單元(未示出),用于在提 取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名之前,去 除待檢測圖像的黑邊。該實現(xiàn)方式中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方 式。
[0107] 在本實施例的一些可選實現(xiàn)方式中,生成子單元進一步用于:將待測試圖像均勻 分塊,計算所分成的分塊的整體灰度均值以及各個塊各自的灰度均值;根據(jù)各個塊各自的 灰度均值與整體灰度均值的大小關系,生成與各個塊對應的二進制位,以形成哈希簽名。該 實現(xiàn)方式中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0108] 在本實施例的一些可選實現(xiàn)方式中,生成子單元進一步用于:對待測試圖像放縮 為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊;計算 每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣;對于矩陣的 每個列,計算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的大小關系生成與各個 元素對應的二進制位,以形成哈希簽名。該實現(xiàn)方式中的具體處理可以參考圖2對應實施例 中相應的實現(xiàn)方式。
[0109] 在本實施例的一些可選實現(xiàn)方式中,生成子單元進一步用于:將待測試圖像均勻 分塊,計算所分成的分塊的整體灰度均值以及各個塊各自的灰度均值,根據(jù)各個塊各自的 灰度均值與整體灰度均值的大小關系,生成與各個塊對應的二進制位,以形成待生成哈希 簽名的第一部分;對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均 勻分成行數(shù)與列數(shù)均為8的塊;計算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進行 排序后的前8個作為矩陣的各行生成矩陣;對于矩陣的每個列,計算列中元素的均值并根據(jù) 列中每個元素的數(shù)值與該均值的大小關系生成與各個元素對應的二進制位,以形成待生成 哈希簽名的第二部分;基于第一部分和第二部分生成哈希簽名。該實現(xiàn)方式中的具體處理 可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0110] 在本實施例的一些可選實現(xiàn)方式中,視頻裝置400還包括:去重單元(未示出),用 于在將待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻 所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配之前,基于待檢測圖像序列 中各個待檢測圖像的哈希簽名對待檢測圖像序列中的待檢測圖像進行去重處理。該實現(xiàn)方 式中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0111] 在本實施例的一些可選實現(xiàn)方式中,匹配單元403進一步用于:依次計算樣本圖像 序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于 預設漢明距離閾值的哈希簽名所對應的樣本圖像確定為匹配成功的樣本圖像。該實現(xiàn)方式 中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0112] 在本實施例的一些可選實現(xiàn)方式中,匹配單元403進一步用于:將待測試圖像的哈 希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢用子簽名,其中n<m-k;確定預先建立 的子簽名索引中與查詢用子簽名相同的子簽名,其中子簽名索引的各個子簽名是對樣本圖 像序列中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提取出來而形成的,且各個子 簽名與所對應的樣本圖像是關聯(lián)的;對于與查詢用子簽名相同的各個子簽名,計算子簽名 所關聯(lián)的樣本圖像的哈希簽名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查 詢用子簽名外的其他m-n塊之間的漢明距離;將漢明距離不大于預設漢明距離閾值k的哈希 簽名所對應的樣本圖像確定為匹配成功的樣本圖像。該實現(xiàn)方式中的具體處理可以參考圖 2對應實施例中相應的實現(xiàn)方式。
[0113] 在本實施例的一些可選實現(xiàn)方式中,上述樣本圖像序列中各個樣本圖像的哈希簽 名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,η = 2。該實現(xiàn) 方式中的具體處理可以參考圖2對應實施例中相應的實現(xiàn)方式。
[0114] 下面參考圖5,其示出了適于用來實現(xiàn)本申請實施例的終端設備或服務器的計算 機系統(tǒng)500的結構示意圖。
[0115] 如圖5所示,計算機系統(tǒng)500包括中央處理單元(CPU)501,其可以根據(jù)存儲在只讀 存儲器(R0M)502中的程序或者從存儲部分508加載到隨機訪問存儲器(RAM)503中的程序而 執(zhí)行各種適當?shù)膭幼骱吞幚?。在RAM 503中,還存儲有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。 CPU 501、R0M 502以及RAM 503通過總線504彼此相連。輸入/輸出(I/O)接口505也連接至總 線 504。
[0116] 以下部件連接至I/O接口 505:包括鍵盤、鼠標等的輸入部分506;包括諸如陰極射 線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分507;包括硬盤等的存儲部分508; 以及包括諸如LAN卡、調制解調器等的網(wǎng)絡接口卡的通信部分509。通信部分509經(jīng)由諸如因 特網(wǎng)的網(wǎng)絡執(zhí)行通信處理。驅動器510也根據(jù)需要連接至I/O接口 505??刹鹦督橘|511,諸如 磁盤、光盤、磁光盤、半導體存儲器等等,根據(jù)需要安裝在驅動器510上,以便于從其上讀出 的計算機程序根據(jù)需要被安裝入存儲部分508。
[0117] 特別地,根據(jù)本公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機 軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括有形地包含在機器可讀 介質上的計算機程序,所述計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這 樣的實施例中,該計算機程序可以通過通信部分509從網(wǎng)絡上被下載和安裝,和/或從可拆 卸介質511被安裝。
[0118] 附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程 序產(chǎn)品的可能實現(xiàn)的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代 表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個 用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應當注意,在有些作為替換的實現(xiàn)中,方框中所 標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框實際 上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要 注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用 執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指 令的組合來實現(xiàn)。
[0119] 描述于本申請實施例中所涉及到的單元可以通過軟件的方式實現(xiàn),也可以通過硬 件的方式來實現(xiàn)。所描述的單元也可以設置在處理器中,例如,可以描述為:一種處理器包 括截取單元、生成單元、匹配單元、記錄單元和確定單元。其中,這些單元的名稱在某種情況 下并不構成對該單元本身的限定,例如,截取單元還可以被描述為"從待檢測視頻中截取至 少一個圖像以形成待檢測圖像序列的單元"。
[0120] 作為另一方面,本申請還提供了一種非易失性計算機存儲介質,該非易失性計算 機存儲介質可以是上述實施例中所述裝置中所包含的非易失性計算機存儲介質;也可以是 單獨存在,未裝配入終端中的非易失性計算機存儲介質。上述非易失性計算機存儲介質存 儲有一個或者多個程序,當所述一個或者多個程序被一個設備執(zhí)行時,使得所述設備:從待 檢測視頻中截取至少一個圖像以形成待檢測圖像序列;生成所述待檢測圖像序列中每個待 檢測圖像的哈希簽名;將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻 集合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配,其中 樣本視頻的視頻標識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標 識是關聯(lián)存儲的;記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以及 所述哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視 頻標識的出現(xiàn)次數(shù);將視頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中 不同圖像標識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。
[0121] 以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人 員應當理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術特征的特定組合而成的技術 方案,同時也應涵蓋在不脫離所述發(fā)明構思的情況下,由上述技術特征或其等同特征進行 任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功 能的技術特征進行互相替換而形成的技術方案。
【主權項】
1. 一種視頻檢測方法,其特征在于,所述方法包括: 從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列; 生成所述待檢測圖像序列中每個待檢測圖像的哈希簽名; 將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集合中各個樣本 視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配,其中樣本視頻的視頻 標識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標識是關聯(lián)存儲的; 記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以及所述哈希簽 名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個視頻標識的出 現(xiàn)次數(shù); 將視頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中不同圖像標識的 出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。2. 根據(jù)權利要求1所述的方法,其特征在于,所述從待檢測視頻中截取至少一個圖像以 形成待檢測圖像序列,包括: 在所述待檢測視頻中的視頻片段中,每隔第一預設幀數(shù)截取圖像,以形成待檢測圖像 序列。3. 根據(jù)權利要求2所述的方法,其特征在于,所述視頻片段是位于所述待檢測視頻的中 間部分且長度為第一預設時長的視頻片段。4. 根據(jù)權利要求3所述的方法,其特征在于,所述樣本圖像序列是針對各個樣本視頻中 位于樣本視頻的中間部分且時長為第二預設時長的視頻片段、每隔第二預設幀數(shù)截取圖像 所形成的,其中,所述第二預設時長大于所述第一預設時長且所述第二預設幀數(shù)小于所述 第一預設幀數(shù)。5. 根據(jù)權利要求1所述的方法,其特征在于,所述生成所述待檢測圖像序列中每個待檢 測圖像的哈希簽名,包括: 提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向量生成哈希簽名。6. 根據(jù)權利要求5所述的方法,其特征在于,在所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名之前,所述生成所述圖像序列中每個圖像 的哈希簽名還包括以下一項或多項: 將待檢測圖像從三通道圖像轉換為單通道圖像; 對待檢測圖像進行腐蝕以弱化待檢測圖像中的字幕; 去除待檢測圖像的黑邊。7. 根據(jù)權利要求5所述的方法,其特征在于,所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名,包括: 將待測試圖像均勻分塊,計算所分成的分塊的整體灰度均值以及各個塊各自的灰度均 值; 根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關系,生成與各個塊對應的二 進制位,以形成哈希簽名。8. 根據(jù)權利要求5所述的方法,其特征在于,所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名,包括: 對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像; 將已放縮圖像均勻分成行數(shù)與列數(shù)均為8的塊; 計算每個塊的離散余弦變換DCT系數(shù)并量化; 將每個已量化DCT系數(shù)中的前8位作為一行生成矩陣; 對于所述矩陣的每個列,計算列中元素的均值并根據(jù)列中每個元素的數(shù)值與該均值的 大小關系生成與各個元素對應的二進制位,以形成哈希簽名。9. 根據(jù)權利要求5所述的方法,其特征在于,所述提取各個待檢測圖像的全局特征向 量,并基于所提取的全局特征向量生成哈希簽名,包括: 將待測試圖像均勻分塊,計算所分成的分塊的整體灰度均值以及各個塊各自的灰度均 值,根據(jù)各個塊各自的灰度均值與所述整體灰度均值的大小關系,生成與各個塊對應的二 進制位,以形成待生成哈希簽名的第一部分; 對待測試圖像放縮為行數(shù)與列數(shù)均為8的整數(shù)倍的圖像;將已放縮圖像均勻分成行數(shù) 與列數(shù)均為8的塊;計算每個塊的DCT系數(shù)并量化;將每個已量化DCT系數(shù)中進行排序后的前 8個作為矩陣的各行生成矩陣;對于所述矩陣的每個列,計算列中元素的均值并根據(jù)列中每 個元素的數(shù)值與該均值的大小關系生成與各個元素對應的二進制位,以形成待生成哈希簽 名的第二部分; 基于所述第一部分和所述第二部分生成哈希簽名。10. 根據(jù)權利要求1所述的方法,其特征在于,在所述將所述待檢測圖像序列中各個待 檢測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個 樣本圖像的哈希簽名進行匹配之前,所述方法還包括: 基于所述待檢測圖像序列中各個待檢測圖像的哈希簽名對所述待檢測圖像序列中的 待檢測圖像進行去重處理。11. 根據(jù)權利要求1所述的方法,其特征在于,所述將所述待檢測圖像序列中各個待檢 測圖像的哈希簽名與從樣本視頻集合中各個樣本視頻所提取出的樣本圖像序列中各個樣 本圖像的哈希簽名進行匹配,包括: 依次計算所述樣本圖像序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢 明距離,并將漢明距離不大于預設漢明距離閾值的哈希簽名所對應的樣本圖像確定為匹配 成功的樣本圖像。12. 根據(jù)權利要求11所述的方法,其特征在于,所述依次計算所述樣本圖像序列中各個 樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明距離不大于預設漢明距 離閾值k的哈希簽名所對應的樣本圖像確定為匹配成功的樣本圖像,包括: 將待測試圖像的哈希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢用子簽名,其中 n^im-k; 確定預先建立的子簽名索引中與所述查詢用子簽名相同的子簽名,其中所述子簽名索 引的各個子簽名是對樣本圖像序列中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提 取出來而形成的,且各個子簽名與所對應的樣本圖像是關聯(lián)的; 對于與所述查詢用子簽名相同的各個子簽名,計算子簽名所關聯(lián)的樣本圖像的哈希簽 名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用子簽名外的其他m-n塊 之間的漢明距離; 將漢明距離不大于預設漢明距離閾值k的哈希簽名所對應的樣本圖像確定為匹配成功 的樣本圖像。13. 根據(jù)權利要求12所述的方法,其特征在于,所述樣本圖像序列中各個樣本圖像的哈 希簽名以及待測試圖像序列中各個待測試圖像的哈希簽名均為64位,k = 4,m = 6,n = 2。14. 一種視頻檢測裝置,其特征在于,所述裝置包括: 截取單元,用于從待檢測視頻中截取至少一個圖像以形成待檢測圖像序列; 生成單元,用于生成所述待檢測圖像序列中每個待檢測圖像的哈希簽名; 匹配單元,用于將所述待檢測圖像序列中各個待檢測圖像的哈希簽名與從樣本視頻集 合中各個樣本視頻所提取出的樣本圖像序列中各個樣本圖像的哈希簽名進行匹配,其中樣 本視頻的視頻標識與從該樣本視頻所提取出的樣本圖像序列中各個樣本圖像的圖像標識 是關聯(lián)存儲的; 記錄單元,用于記錄所述樣本圖像序列中哈希簽名匹配成功的樣本圖像的圖像標識以 及所述哈希簽名匹配成功的樣本圖像所屬的視頻的視頻標識,并統(tǒng)計各個圖像標識和各個 視頻標識的出現(xiàn)次數(shù); 確定單元,用于將視頻標識出現(xiàn)次數(shù)大于第一閾值、且視頻標識所關聯(lián)的圖像標識中 不同圖像標識的出現(xiàn)次數(shù)大于第二閾值的樣本視頻,確定為所述待檢測視頻的同源視頻。15. 根據(jù)權利要求14所述的裝置,其特征在于,所述截取單元進一步用于: 在所述待檢測視頻中的視頻片段中,每隔第一預設幀數(shù)截取圖像,以形成待檢測圖像 序列。16. 根據(jù)權利要求15所述的裝置,其特征在于,所述視頻片段是位于所述待檢測視頻的 中間部分且長度為第一預設時長的視頻片段。17. 根據(jù)權利要求14所述的裝置,其特征在于,所述生成單元包括: 生成子單元,用于提取各個待檢測圖像的全局特征向量,并基于所提取的全局特征向 量生成哈希簽名。18. 根據(jù)權利要求17所述的裝置,其特征在于,所述生成單元還包括以下一項或多項: 轉換子單元,用于在所述提取各個待檢測圖像的全局特征向量,并基于所提取的全局 特征向量生成哈希簽名之前,將待檢測圖像從三通道圖像轉換為單通道圖像; 腐蝕單元,用于在所述提取各個待檢測圖像的全局特征向量,并基于所提取的全局特 征向量生成哈希簽名之前,對待檢測圖像進行腐蝕以弱化待檢測圖像中的字幕; 去黑邊單元,用于在所述提取各個待檢測圖像的全局特征向量,并基于所提取的全局 特征向量生成哈希簽名之前,去除待檢測圖像的黑邊。19. 根據(jù)權利要求14所述的裝置,其特征在于,所述匹配單元,進一步用于:依次計算所 述樣本圖像序列中各個樣本圖像的哈希簽名將與該圖像的哈希簽名的漢明距離,并將漢明 距離不大于預設漢明距離閾值的哈希簽名所對應的樣本圖像確定為匹配成功的樣本圖像。20. 根據(jù)權利要求19所述的裝置,其特征在于,所述匹配單元進一步用于: 將待測試圖像的哈希簽名按位數(shù)平均分成m塊后從中選擇η塊作為查詢用子簽名,其中 n^im-k; 確定預先建立的子簽名索引中與所述查詢用子簽名相同的子簽名,其中所述子簽名索 引的各個子簽名是對樣本圖像序列中各個樣本圖像的哈希簽名平均分成m塊后、將每η塊提 取出來而形成的,且各個子簽名與所對應的樣本圖像是關聯(lián)的; 對于與所述查詢用子簽名相同的各個子簽名,計算子簽名所關聯(lián)的樣本圖像的哈希簽 名中除子簽名外的其他m-n塊與待檢測圖像的哈希簽名中除查詢用子簽名外的其他m-n塊 之間的漢明距離; 將漢明距離不大于預設漢明距離閾值k的哈希簽名所對應的樣本圖像確定為匹配成功 的樣本圖像。
【文檔編號】G06K9/00GK105975939SQ201610298495
【公開日】2016年9月28日
【申請日】2016年5月6日
【發(fā)明人】申曉雷, 宋丙玉, 王源
【申請人】百度在線網(wǎng)絡技術(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
农安县| 渝中区| 兰西县| 龙海市| 海晏县| 江城| 逊克县| 密山市| 鄱阳县| 偃师市| 密山市| 洪湖市| 花莲县| 赤城县| 荥经县| 阜宁县| 应城市| 珠海市| 新疆| 教育| 榆中县| 会同县| 信宜市| 台山市| 乐至县| 凤山县| 辉县市| 宁城县| 伊金霍洛旗| 府谷县| 庆城县| 余江县| 井冈山市| 克拉玛依市| 黄龙县| 福泉市| 营山县| 锦屏县| 会昌县| 梧州市| 安乡县|