1.一種視頻的識別方法,其特征在于,包括:
獲取需要進行識別的視頻信息,所述視頻信息包括視頻內(nèi)容和視頻相關(guān)信息;
對所述視頻內(nèi)容中的圖片進行識別,得到圖片識別結(jié)果;
對所述視頻內(nèi)容中的語音進行識別,得到語音識別結(jié)果;
對所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本進行識別,得到文本識別結(jié)果;
將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算,得到視頻識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述圖片識別結(jié)果為惡意圖片概率,則所述對所述視頻內(nèi)容的圖片進行識別,得到圖片識別結(jié)果,包括:
從所述視頻內(nèi)容中提取圖片,得到圖片集合;
對所述圖片集合中的圖片分別進行解析,以識別出惡意圖片;
確定所述圖片集合中惡意圖片所占的比例,得到惡意圖片概率。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述圖片集合中的圖片分別進行解析,以識別出惡意圖片,包括:
對所述圖片集合中的圖片進行解析,以提取圖片參數(shù);
根據(jù)所述圖片參數(shù)確定相應(yīng)的圖片是否含有預設(shè)不良內(nèi)容;
若是,則確定所述圖片為惡意圖片;
若否,則確定所述當前圖片為非惡意圖片。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定所述圖片集合中惡意圖片所占的比例,得到惡意圖片概率,包括:
統(tǒng)計所述圖片集合中圖片的總量、以及惡意圖片的數(shù)量;
計算所述惡意圖片的數(shù)量與所述圖片的總量的比值,得到惡意圖片概率。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音識別結(jié)果為惡意語音概率,則所述對所述視頻內(nèi)容中的語音進行識別,得到語音識別結(jié)果,包括:
從所述視頻內(nèi)容中提取語音,得到語音集合;
對所述語音集合中的語音分別進行解析,以識別出惡意語音;
確定所述語音集合中惡意語音所占的比例,得到惡意語音概率。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述語音集合中的語音分別進行解析,以識別出惡意語音,包括:
將所述語音集合中的語音轉(zhuǎn)換為相應(yīng)的文本信息;
將所述文本信息劃分為多個文本字段;
確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯;
若是,則確定所述詞匯所在文本字段所對應(yīng)的語音為惡意語音;
若否,則確定所述詞匯所在文本字段所對應(yīng)的語音為非惡意語音。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述確定所述語音集合中惡意語音所占的比例,得到惡意語音概率,包括:
統(tǒng)計所述語音集合中語音的總量、以及惡意語音的數(shù)量;
計算所述惡意語音的數(shù)量與所述語音的總量的比值,得到惡意語音概率。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述文本識別結(jié)果為惡意文本概率,則所述對所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本進行識別,得到文本識別結(jié)果,包括:
將所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本添加至文本集合;
對文本集合中的文本進行解析,以識別出惡意文本;
確定所述文本集合中惡意文本所占的比例,得到惡意文本概率。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述對文本集合中的文本進行解析,以識別出惡意文本,包括:
將文本集合中的文本劃分為多個文本字段;
確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯;
若是,則確定所述詞匯所在文本字段為惡意文本;
若否,則確定所述詞匯所在文本字段為非惡意文本。
10.根據(jù)權(quán)利要求1至9任一項所述的方法,其特征在于,所述將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算,得到視頻識別結(jié)果,包括:
將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果分別乘以相應(yīng)的權(quán)重后,進行相加,得到視頻識別結(jié)果。
11.根據(jù)權(quán)利要求1至9任一項所述的方法,其特征在于,所述視頻信息還包括觀看用戶信息,則所述將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算,得到視頻識別結(jié)果之前,還包括:
根據(jù)所述觀看用戶信息確定觀看用戶數(shù)量隨時間變化的規(guī)律,得到變化特性信息;
根據(jù)所述觀看用戶信息確定觀看用戶的群體分布狀況,得到群體分布信息;
根據(jù)所述變化特性信息和群體分布信息計算初始識別結(jié)果;
所述將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算,得到視頻識別結(jié)果,包括:將所述圖片識別結(jié)果、語音識別結(jié)果、文本識別結(jié)果和初始識別結(jié)果分別乘以相應(yīng)的權(quán)重后,進行相加,得到視頻識別結(jié)果。
12.一種視頻識別裝置,其特征在于,包括:
獲取單元,用于獲取需要進行識別的視頻信息,所述視頻信息包括視頻內(nèi)容和視頻相關(guān)信息;
圖片識別單元,用于對所述視頻內(nèi)容中的圖片進行識別,得到圖片識別結(jié)果;
語音識別單元,用于對所述視頻內(nèi)容中的語音進行識別,得到語音識別結(jié)果;
文本識別單元,用于對所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本進行識別,得到文本識別結(jié)果;
融合單元,用于將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果進行融合計算,得到視頻識別結(jié)果。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述圖片識別結(jié)果為惡意圖片概率,所述圖片識別單元包括圖片提取子單元、圖片解析子單元和圖片確定子單元;
所述圖片提取子單元,用于從所述視頻內(nèi)容中提取圖片,得到圖片集合;
所述圖片解析單元,用于對所述圖片集合中的圖片分別進行解析,以識別出惡意圖片;
圖片確定子單元,用于確定所述圖片集合中惡意圖片所占的比例,得到惡意圖片概率。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,
所述圖片解析子單元,具體用于對所述圖片集合中的圖片進行解析,以提取圖片參數(shù),根據(jù)所述圖片參數(shù)確定相應(yīng)的圖片是否含有預設(shè)不良內(nèi)容,若是,則確定所述圖片為惡意圖片;若否,則確定所述當前圖片為非惡意圖片。
15.根據(jù)權(quán)利要求13所述的裝置,其特征在于,
所述圖片確定子單元,具體用于統(tǒng)計所述圖片集合中圖片的總量、以及惡意圖片的數(shù)量,計算所述惡意圖片的數(shù)量與所述圖片的總量的比值,得到惡意圖片概率。
16.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述語音識別結(jié)果為惡意語音概率,所述語音識別單元包括語音提取子單元、語音解析子單元和語音確定子單元;
所述語音提取子單元,用于從所述視頻內(nèi)容中提取語音,得到語音集合;
所述語音解析子單元,用于對所述語音集合中的語音分別進行解析,以識別出惡意語音;
所述語音確定子單元,用于確定所述語音集合中惡意語音所占的比例,得到惡意語音概率。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,
所述語音解析子單元,具體用于將所述語音集合中的語音轉(zhuǎn)換為相應(yīng)的文本信息,將所述文本信息劃分為多個文本字段,確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯,若是,則確定所述詞匯所在文本字段所對應(yīng)的語音為惡意語音;若否,則確定所述詞匯所在文本字段所對應(yīng)的語音為非惡意語音。
18.根據(jù)權(quán)利要求16所述的裝置,其特征在于,
所述語音確定子單元,具體用于統(tǒng)計所述語音集合中語音的總量、以及惡意語音的數(shù)量,計算所述惡意語音的數(shù)量與所述語音的總量的比值,得到惡意語音概率。
19.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述文本識別結(jié)果為惡意文本概率,所述文本識別單元包括添加子單元、文本解析子單元和文本確定子單元;
所述添加子單元,用于將所述視頻內(nèi)容中的字幕和視頻相關(guān)信息的文本添加至文本集合;
所述文本解析子單元,用于對文本集合中的文本進行解析,以識別出惡意文本;
所述文本確定子單元,用于確定所述文本集合中惡意文本所占的比例,得到惡意文本概率。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,
所述文本解析子單元,具體用于將文本集合中的文本劃分為多個文本字段,確定所述文本字段是否存在與預設(shè)敏感關(guān)鍵字匹配的詞匯,若是,則確定所述詞匯所在文本字段為惡意文本;若否,則確定所述詞匯所在文本字段為非惡意文本。
21.根據(jù)權(quán)利要求12至20任一項所述的裝置,其特征在于,
所述融合單元,具體用于將所述圖片識別結(jié)果、語音識別結(jié)果和文本識別結(jié)果分別乘以相應(yīng)的權(quán)重后,進行相加,得到視頻識別結(jié)果。
22.根據(jù)權(quán)利要求12至20任一項所述的裝置,其特征在于,還包括用戶趨勢分析單元;
所述獲取單元,具體用于獲取需要進行識別的視頻信息,所述視頻信息包括視頻內(nèi)容、視頻相關(guān)信息和觀看用戶信息;
所述用戶趨勢分析單元,用于根據(jù)所述觀看用戶信息確定觀看用戶數(shù)量隨時間變化的規(guī)律,得到變化特性信息,根據(jù)所述觀看用戶信息確定觀看用戶的群體分布狀況,得到群體分布信息,根據(jù)所述變化特性信息和群體分布信息計算初始識別結(jié)果;
所述融合單元,具體用于將所述圖片識別結(jié)果、語音識別結(jié)果、文本識別結(jié)果和初始識別結(jié)果分別乘以相應(yīng)的權(quán)重后,進行相加,得到視頻識別結(jié)果。
23.一種視頻識別系統(tǒng),其特征在于,包括權(quán)利要求12至22任一項所述的視頻識別裝置。