一種視頻的識別方法、裝置和系統(tǒng)與流程

文檔序號：12471101閱讀：來源：國知局

技術(shù)特征：

1.一種視頻的識別方法，其特征在于，包括：

獲取需要進行識別的視頻信息，所述視頻信息包括視頻內(nèi)容和視頻相關(guān)信息；

對所述視頻內(nèi)容中的圖片進行識別，得到圖片識別結(jié)果；

對所述視頻內(nèi)容中的語音進行識別，得到語音識別結(jié)果；

對所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本進行識別，得到文本識別結(jié)果；

將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算，得到視頻識別結(jié)果。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述圖片識別結(jié)果為惡意圖片概率，則所述對所述視頻內(nèi)容的圖片進行識別，得到圖片識別結(jié)果，包括：

從所述視頻內(nèi)容中提取圖片，得到圖片集合；

對所述圖片集合中的圖片分別進行解析，以識別出惡意圖片；

確定所述圖片集合中惡意圖片所占的比例，得到惡意圖片概率。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述對所述圖片集合中的圖片分別進行解析，以識別出惡意圖片，包括：

對所述圖片集合中的圖片進行解析，以提取圖片參數(shù)；

根據(jù)所述圖片參數(shù)確定相應(yīng)的圖片是否含有預設(shè)不良內(nèi)容；

若是，則確定所述圖片為惡意圖片；

若否，則確定所述當前圖片為非惡意圖片。

4.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述確定所述圖片集合中惡意圖片所占的比例，得到惡意圖片概率，包括：

統(tǒng)計所述圖片集合中圖片的總量、以及惡意圖片的數(shù)量；

計算所述惡意圖片的數(shù)量與所述圖片的總量的比值，得到惡意圖片概率。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述語音識別結(jié)果為惡意語音概率，則所述對所述視頻內(nèi)容中的語音進行識別，得到語音識別結(jié)果，包括：

從所述視頻內(nèi)容中提取語音，得到語音集合；

對所述語音集合中的語音分別進行解析，以識別出惡意語音；

確定所述語音集合中惡意語音所占的比例，得到惡意語音概率。

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述對所述語音集合中的語音分別進行解析，以識別出惡意語音，包括：

將所述語音集合中的語音轉(zhuǎn)換為相應(yīng)的文本信息；

將所述文本信息劃分為多個文本字段；

確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯；

若是，則確定所述詞匯所在文本字段所對應(yīng)的語音為惡意語音；

若否，則確定所述詞匯所在文本字段所對應(yīng)的語音為非惡意語音。

7.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述確定所述語音集合中惡意語音所占的比例，得到惡意語音概率，包括：

統(tǒng)計所述語音集合中語音的總量、以及惡意語音的數(shù)量；

計算所述惡意語音的數(shù)量與所述語音的總量的比值，得到惡意語音概率。

8.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述文本識別結(jié)果為惡意文本概率，則所述對所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本進行識別，得到文本識別結(jié)果，包括：

將所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本添加至文本集合；

對文本集合中的文本進行解析，以識別出惡意文本；

確定所述文本集合中惡意文本所占的比例，得到惡意文本概率。

9.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述對文本集合中的文本進行解析，以識別出惡意文本，包括：

將文本集合中的文本劃分為多個文本字段；

確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯；

若是，則確定所述詞匯所在文本字段為惡意文本；

若否，則確定所述詞匯所在文本字段為非惡意文本。

10.根據(jù)權(quán)利要求1至9任一項所述的方法，其特征在于，所述將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算，得到視頻識別結(jié)果，包括：

將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果分別乘以相應(yīng)的權(quán)重后，進行相加，得到視頻識別結(jié)果。

11.根據(jù)權(quán)利要求1至9任一項所述的方法，其特征在于，所述視頻信息還包括觀看用戶信息，則所述將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算，得到視頻識別結(jié)果之前，還包括：

根據(jù)所述觀看用戶信息確定觀看用戶數(shù)量隨時間變化的規(guī)律，得到變化特性信息；

根據(jù)所述觀看用戶信息確定觀看用戶的群體分布狀況，得到群體分布信息；

根據(jù)所述變化特性信息和群體分布信息計算初始識別結(jié)果；

所述將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算，得到視頻識別結(jié)果，包括：將所述圖片識別結(jié)果、語音識別結(jié)果、文本識別結(jié)果和初始識別結(jié)果分別乘以相應(yīng)的權(quán)重后，進行相加，得到視頻識別結(jié)果。

12.一種視頻識別裝置，其特征在于，包括：

獲取單元，用于獲取需要進行識別的視頻信息，所述視頻信息包括視頻內(nèi)容和視頻相關(guān)信息；

圖片識別單元，用于對所述視頻內(nèi)容中的圖片進行識別，得到圖片識別結(jié)果；

語音識別單元，用于對所述視頻內(nèi)容中的語音進行識別，得到語音識別結(jié)果；

文本識別單元，用于對所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本進行識別，得到文本識別結(jié)果；

融合單元，用于將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算，得到視頻識別結(jié)果。

13.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述圖片識別結(jié)果為惡意圖片概率，所述圖片識別單元包括圖片提取子單元、圖片解析子單元和圖片確定子單元；

所述圖片提取子單元，用于從所述視頻內(nèi)容中提取圖片，得到圖片集合；

所述圖片解析單元，用于對所述圖片集合中的圖片分別進行解析，以識別出惡意圖片；

圖片確定子單元，用于確定所述圖片集合中惡意圖片所占的比例，得到惡意圖片概率。

14.根據(jù)權(quán)利要求13所述的裝置，其特征在于，

所述圖片解析子單元，具體用于對所述圖片集合中的圖片進行解析，以提取圖片參數(shù)，根據(jù)所述圖片參數(shù)確定相應(yīng)的圖片是否含有預設(shè)不良內(nèi)容，若是，則確定所述圖片為惡意圖片；若否，則確定所述當前圖片為非惡意圖片。

15.根據(jù)權(quán)利要求13所述的裝置，其特征在于，

所述圖片確定子單元，具體用于統(tǒng)計所述圖片集合中圖片的總量、以及惡意圖片的數(shù)量，計算所述惡意圖片的數(shù)量與所述圖片的總量的比值，得到惡意圖片概率。

16.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述語音識別結(jié)果為惡意語音概率，所述語音識別單元包括語音提取子單元、語音解析子單元和語音確定子單元；

所述語音提取子單元，用于從所述視頻內(nèi)容中提取語音，得到語音集合；

所述語音解析子單元，用于對所述語音集合中的語音分別進行解析，以識別出惡意語音；

所述語音確定子單元，用于確定所述語音集合中惡意語音所占的比例，得到惡意語音概率。

17.根據(jù)權(quán)利要求16所述的裝置，其特征在于，

所述語音解析子單元，具體用于將所述語音集合中的語音轉(zhuǎn)換為相應(yīng)的文本信息，將所述文本信息劃分為多個文本字段，確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯，若是，則確定所述詞匯所在文本字段所對應(yīng)的語音為惡意語音；若否，則確定所述詞匯所在文本字段所對應(yīng)的語音為非惡意語音。

18.根據(jù)權(quán)利要求16所述的裝置，其特征在于，

所述語音確定子單元，具體用于統(tǒng)計所述語音集合中語音的總量、以及惡意語音的數(shù)量，計算所述惡意語音的數(shù)量與所述語音的總量的比值，得到惡意語音概率。

19.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述文本識別結(jié)果為惡意文本概率，所述文本識別單元包括添加子單元、文本解析子單元和文本確定子單元；

所述添加子單元，用于將所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本添加至文本集合；

所述文本解析子單元，用于對文本集合中的文本進行解析，以識別出惡意文本；

所述文本確定子單元，用于確定所述文本集合中惡意文本所占的比例，得到惡意文本概率。

20.根據(jù)權(quán)利要求19所述的裝置，其特征在于，

所述文本解析子單元，具體用于將文本集合中的文本劃分為多個文本字段，確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯，若是，則確定所述詞匯所在文本字段為惡意文本；若否，則確定所述詞匯所在文本字段為非惡意文本。

21.根據(jù)權(quán)利要求12至20任一項所述的裝置，其特征在于，

所述融合單元，具體用于將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果分別乘以相應(yīng)的權(quán)重后，進行相加，得到視頻識別結(jié)果。

22.根據(jù)權(quán)利要求12至20任一項所述的裝置，其特征在于，還包括用戶趨勢分析單元；

所述獲取單元，具體用于獲取需要進行識別的視頻信息，所述視頻信息包括視頻內(nèi)容、視頻相關(guān)信息和觀看用戶信息；

所述用戶趨勢分析單元，用于根據(jù)所述觀看用戶信息確定觀看用戶數(shù)量隨時間變化的規(guī)律，得到變化特性信息，根據(jù)所述觀看用戶信息確定觀看用戶的群體分布狀況，得到群體分布信息，根據(jù)所述變化特性信息和群體分布信息計算初始識別結(jié)果；

所述融合單元，具體用于將所述圖片識別結(jié)果、語音識別結(jié)果、文本識別結(jié)果和初始識別結(jié)果分別乘以相應(yīng)的權(quán)重后，進行相加，得到視頻識別結(jié)果。

23.一種視頻識別系統(tǒng)，其特征在于，包括權(quán)利要求12至22任一項所述的視頻識別裝置。

完整全部詳細技術(shù)資料下載

當前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

產(chǎn)品識別系統(tǒng)相關(guān)技術(shù)

如何識別網(wǎng)站相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種視頻的識別方法、裝置和系統(tǒng)與流程