本發(fā)明涉及圖像處理,尤其涉及一種視頻質(zhì)量檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和智能移動(dòng)設(shè)備的普及,短視頻平臺(tái)已成為人們分享生活、推廣產(chǎn)品和服務(wù)的重要渠道。其中,探店視頻作為一種新興的短視頻類(lèi)型,通過(guò)達(dá)人的親身體驗(yàn)和介紹,為消費(fèi)者提供了直觀(guān)、生動(dòng)的消費(fèi)指南。
2、目前,在對(duì)這些視頻進(jìn)行發(fā)布之前,需要先對(duì)視頻的質(zhì)量進(jìn)行審核,確保其內(nèi)容真實(shí)、豐富且符合平臺(tái)規(guī)范?,F(xiàn)有技術(shù)中,主要依賴(lài)于人工審核方式。然而,該審核方式效率低下,難以應(yīng)對(duì)海量視頻內(nèi)容的快速增長(zhǎng)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種視頻質(zhì)量檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),用以解決現(xiàn)有技術(shù)中視頻質(zhì)量審核的效率較低的缺陷,實(shí)現(xiàn)提高視頻質(zhì)量檢測(cè)的效率。
2、本發(fā)明提供一種視頻質(zhì)量檢測(cè)方法,包括:
3、獲取針對(duì)目標(biāo)場(chǎng)所的待檢測(cè)視頻;
4、在確定所述待檢測(cè)視頻不存在重復(fù)圖像、所述待檢測(cè)視頻不存在圖像黑邊、且所述待檢測(cè)視頻中視頻最大連續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)時(shí)長(zhǎng)的情況下,獲取所述待檢測(cè)視頻中的音頻信息;所述視頻最大連續(xù)時(shí)長(zhǎng)內(nèi)相鄰兩幀圖像之間的第一相似度大于第一預(yù)設(shè)閾值;
5、將所述音頻信息轉(zhuǎn)換為文本信息,并將所述文本信息進(jìn)行分詞處理,得到至少一個(gè)分詞;
6、針對(duì)各所述分詞,將所述分詞與所述目標(biāo)場(chǎng)所對(duì)應(yīng)的至少一個(gè)關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果;
7、基于各所述匹配結(jié)果,確定所述待檢測(cè)視頻的質(zhì)量檢測(cè)結(jié)果。
8、根據(jù)本發(fā)明提供的一種視頻質(zhì)量檢測(cè)方法,確定所述待檢測(cè)視頻不存在圖像黑邊,包括:
9、在所述待檢測(cè)視頻的所有圖像中,每隔預(yù)設(shè)數(shù)量幀抽取一幀目標(biāo)圖像;
10、針對(duì)任意相鄰兩幀目標(biāo)圖像,確定所述相鄰兩幀目標(biāo)圖像的第二相似度;
11、將小于第二預(yù)設(shè)閾值的第二相似度對(duì)應(yīng)的相鄰兩幀目標(biāo)圖像中的后一幀目標(biāo)圖像確定為關(guān)鍵幀圖像;
12、在大于第一預(yù)設(shè)數(shù)量的關(guān)鍵幀圖像中不存在圖像黑邊的情況下,確定所述待檢測(cè)視頻不存在圖像黑邊。
13、根據(jù)本發(fā)明提供的一種視頻質(zhì)量檢測(cè)方法,所述確定所述待檢測(cè)視頻不存在重復(fù)圖像,包括:
14、遍歷所有關(guān)鍵幀圖像,將當(dāng)前遍歷到的關(guān)鍵幀圖像的哈希值與所述當(dāng)前遍歷到的關(guān)鍵幀圖像之前的所有關(guān)鍵幀圖像的哈希值進(jìn)行比較,得到第一比較結(jié)果;
15、在所有第一比較結(jié)果均表征不存在相同哈希值的情況下,確定所述待檢測(cè)視頻不存在重復(fù)圖像。
16、根據(jù)本發(fā)明提供的一種視頻質(zhì)量檢測(cè)方法,所述在確定所述待檢測(cè)視頻不存在重復(fù)圖像、所述待檢測(cè)視頻不存在圖像黑邊、且所述待檢測(cè)視頻中視頻最大連續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)時(shí)長(zhǎng)的情況下,獲取所述待檢測(cè)視頻中的音頻信息,包括:
17、在確定所述待檢測(cè)視頻不存在重復(fù)圖像、所述待檢測(cè)視頻不存在圖像黑邊、且所述待檢測(cè)視頻中視頻最大連續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)時(shí)長(zhǎng)的情況下,將所述待檢測(cè)視頻中各關(guān)鍵幀圖像的哈希值均與視頻庫(kù)中各視頻的關(guān)鍵幀圖像的哈希值進(jìn)行比較,得到第二比較結(jié)果;所述視頻庫(kù)中存儲(chǔ)有針對(duì)與所述目標(biāo)場(chǎng)所類(lèi)型相同的其他場(chǎng)所進(jìn)行視頻采集得到的視頻;
18、在所有視頻的第二比較結(jié)果均表征相同哈希值的數(shù)量不大于第二預(yù)設(shè)數(shù)量的情況下,獲取所述待檢測(cè)視頻中的音頻信息。
19、根據(jù)本發(fā)明提供的一種視頻質(zhì)量檢測(cè)方法,所述基于各所述匹配結(jié)果,確定所述待檢測(cè)視頻的質(zhì)量檢測(cè)結(jié)果,包括:
20、在所有所述匹配結(jié)果中包括至少一個(gè)匹配結(jié)果表征存在與關(guān)鍵詞匹配的目標(biāo)分詞的情況下,確定所述質(zhì)量檢測(cè)結(jié)果為質(zhì)量檢測(cè)合格。
21、根據(jù)本發(fā)明提供的一種視頻質(zhì)量檢測(cè)方法,所述方法還包括:
22、將所述待檢測(cè)視頻在目標(biāo)平臺(tái)上進(jìn)行發(fā)布,并將所述目標(biāo)分詞確定為所述待檢測(cè)視頻的視頻標(biāo)簽,所述視頻標(biāo)簽用于在所述目標(biāo)平臺(tái)搜索所述待檢測(cè)視頻。
23、根據(jù)本發(fā)明提供的一種視頻質(zhì)量檢測(cè)方法,所述將所述音頻信息轉(zhuǎn)換為文本信息,包括:
24、將所述音頻信息輸入音頻轉(zhuǎn)換模型中,得到所述音頻轉(zhuǎn)換模型輸出的所述文本信息;
25、其中,所述音頻轉(zhuǎn)換模型為在將針對(duì)所述目標(biāo)場(chǎng)所采集的音頻樣本輸入初始音頻轉(zhuǎn)換模型得到的預(yù)測(cè)文本信息存在錯(cuò)誤的情況下,基于所述預(yù)測(cè)文本信息中包含的錯(cuò)誤文本對(duì)應(yīng)的音頻片段和所述音頻片段對(duì)應(yīng)的正確文本,對(duì)所述初始音頻轉(zhuǎn)換模型的模型參數(shù)進(jìn)行優(yōu)化得到的。
26、本發(fā)明還提供一種視頻質(zhì)量檢測(cè)裝置,包括:
27、獲取模塊,用于獲取針對(duì)目標(biāo)場(chǎng)所的待檢測(cè)視頻;
28、所述獲取模塊,還用于在確定所述待檢測(cè)視頻不存在重復(fù)圖像、所述待檢測(cè)視頻不存在圖像黑邊、且所述待檢測(cè)視頻中視頻最大連續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)時(shí)長(zhǎng)的情況下,獲取所述待檢測(cè)視頻中的音頻信息;所述視頻最大連續(xù)時(shí)長(zhǎng)內(nèi)相鄰兩幀圖像之間的第一相似度大于第一預(yù)設(shè)閾值;
29、轉(zhuǎn)換模塊,用于將所述音頻信息轉(zhuǎn)換為文本信息;
30、處理模塊,用于將所述文本信息進(jìn)行分詞處理,得到至少一個(gè)分詞;
31、匹配模塊,用于針對(duì)各所述分詞,將所述分詞與所述目標(biāo)場(chǎng)所對(duì)應(yīng)的至少一個(gè)關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果;
32、確定模塊,用于基于各所述匹配結(jié)果,確定所述待檢測(cè)視頻的質(zhì)量檢測(cè)結(jié)果。
33、本發(fā)明還提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述任一種所述視頻質(zhì)量檢測(cè)方法。
34、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述視頻質(zhì)量檢測(cè)方法。
35、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述視頻質(zhì)量檢測(cè)方法。
36、本發(fā)明提供的視頻質(zhì)量檢測(cè)方法、裝置、設(shè)備和存儲(chǔ)介質(zhì),通過(guò)獲取針對(duì)目標(biāo)場(chǎng)所的待檢測(cè)視頻,在確定待檢測(cè)視頻不存在重復(fù)圖像、待檢測(cè)視頻不存在圖像黑邊、且待檢測(cè)視頻中視頻最大連續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)時(shí)長(zhǎng)的情況下,獲取待檢測(cè)視頻中的音頻信息,將音頻信息轉(zhuǎn)換為文本信息,并將文本信息進(jìn)行分詞處理,得到至少一個(gè)分詞,針對(duì)各分詞,將分詞與目標(biāo)場(chǎng)所對(duì)應(yīng)的至少一個(gè)關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果后,基于各匹配結(jié)果,確定待檢測(cè)視頻的質(zhì)量檢測(cè)結(jié)果。由于可以將待檢測(cè)視頻分為圖像和音頻信息分別進(jìn)行檢測(cè),在圖像合格的情況下進(jìn)一步檢測(cè)音頻信息是否合格,從而可以基于圖像的檢測(cè)結(jié)果和音頻信息的檢測(cè)結(jié)果自動(dòng)檢測(cè)待檢測(cè)視頻的質(zhì)量,避免了現(xiàn)有技術(shù)中通過(guò)人工方式審核待檢測(cè)視頻的現(xiàn)象,不僅可以提高待檢測(cè)視頻質(zhì)量檢測(cè)的準(zhǔn)確性,而且可以提高檢測(cè)效率。
1.一種視頻質(zhì)量檢測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的視頻質(zhì)量檢測(cè)方法,其特征在于,確定所述待檢測(cè)視頻不存在圖像黑邊,包括:
3.根據(jù)權(quán)利要求2所述的視頻質(zhì)量檢測(cè)方法,其特征在于,所述確定所述待檢測(cè)視頻不存在重復(fù)圖像,包括:
4.根據(jù)權(quán)利要求1所述的視頻質(zhì)量檢測(cè)方法,其特征在于,所述在確定所述待檢測(cè)視頻不存在重復(fù)圖像、所述待檢測(cè)視頻不存在圖像黑邊、且所述待檢測(cè)視頻中視頻最大連續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)時(shí)長(zhǎng)的情況下,獲取所述待檢測(cè)視頻中的音頻信息,包括:
5.根據(jù)權(quán)利要求1所述的視頻質(zhì)量檢測(cè)方法,其特征在于,所述基于各所述匹配結(jié)果,確定所述待檢測(cè)視頻的質(zhì)量檢測(cè)結(jié)果,包括:
6.根據(jù)權(quán)利要求5所述的視頻質(zhì)量檢測(cè)方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的視頻質(zhì)量檢測(cè)方法,其特征在于,所述將所述音頻信息轉(zhuǎn)換為文本信息,包括:
8.一種視頻質(zhì)量檢測(cè)裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述視頻質(zhì)量檢測(cè)方法。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述視頻質(zhì)量檢測(cè)方法。
11.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述視頻質(zhì)量檢測(cè)方法。