本發(fā)明涉及視頻評估領(lǐng)域,尤其涉及一種影視視頻的數(shù)字化評估方法。
背景技術(shù):
1、隨著科技的發(fā)展,影音行業(yè)的視頻發(fā)布難度逐漸降低,因此,一些視頻制作經(jīng)驗較少的制作者的影視視頻易存在質(zhì)量問題,例如音畫不同步,由此,本領(lǐng)域技術(shù)人員對應常采用影音評估系統(tǒng)針對影視視頻進行質(zhì)量評估時,但是,針對多人員且音源豐富的連續(xù)畫面,音畫質(zhì)量評估難度較大,難以有效實現(xiàn)質(zhì)量的準確評估,因此,如何針對多人員且音源豐富的連續(xù)畫面進行有效的質(zhì)量評估,是本領(lǐng)域技術(shù)人員亟待解決的技術(shù)問題。
2、中國專利公開號cn117012228a公開了一種訓練評估模型、評估視頻質(zhì)量的方法及裝置,在訓練評估模型的方法中,獲取樣本集,其中包括,音畫同步的第一視頻樣本。對第一視頻樣本進行音畫分離,得到樣本圖像幀序列和對應的樣本音頻幀序列,并將其輸入評估模型進行模型處理,該評估模型包括第一編碼器和第二編碼器。上述模型處理包括,利用第一編碼器,對各樣本圖像幀進行編碼,得到各樣本圖像表征,以及利用第二編碼器,對各樣本音頻幀進行編碼,得到各樣本音頻表征。以最小化第一損失為目標,調(diào)整第一編碼器和第二編碼器的參數(shù),該第一損失正相關(guān)于,各樣本圖像表征與對應樣本音頻表征的不同模態(tài)間距離,以及各樣本圖像表征中相鄰樣本圖像表征的同模態(tài)間距離,但是,上述方案中存在以下問題:未考慮到視頻樣本中聲源數(shù)量以及音頻重疊情況對于音畫同步分析的影響,使得音畫同步情況的確定結(jié)果的準確性低下。
技術(shù)實現(xiàn)思路
1、為此,本發(fā)明提供一種影視視頻的數(shù)字化評估方法,用以克服現(xiàn)有技術(shù)中未能根據(jù)視頻樣本中的人員交流情況以及音頻的重復情況確定針對性的音畫同步情況的確定方式,導致對于音畫同步情況的確定結(jié)果的準確性低下,進而導致后續(xù)針對視頻的壓縮質(zhì)量低下的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供一種影視視頻的數(shù)字化評估方法,包括:
3、針對目標評估視頻進行音畫評估段落提取,并針對各音畫評估段落的交流復雜系數(shù)以及參考交流重合系數(shù)進行檢測;
4、根據(jù)交流復雜系數(shù)以及參考交流重合系數(shù)確定音畫評估段落的類別,并根據(jù)各音畫評估段落的類別確定對應的段落評估策略;
5、若一音畫評估段落為一類評估段落,則采用特征匹配方式確定同步評估系數(shù),根據(jù)特征匹配段落的數(shù)量確定對應的音畫評估段落的同步評估系數(shù);
6、若該音畫評估段落為二類評估段落,則采用時序匹配方式確定同步評估系數(shù),根據(jù)各語音段落與其對應的視頻段落的時間差異參考值確定同步評估系數(shù);
7、評估完成條件下,根據(jù)各音畫評估段落的互動有效參數(shù)與同步評估系數(shù)確定段落重點系數(shù),評估完成條件為目標評估視頻中各音畫評估段落的同步評估系數(shù)均確定完成;
8、重點分析完成條件下,根據(jù)重點段落占比確定目標評估視頻的執(zhí)行壓縮策略,執(zhí)行壓縮策略為采用動態(tài)執(zhí)行策略或靜態(tài)執(zhí)行策略進行目標評估視頻的壓縮,重點分析完成條件為目標評估視頻內(nèi)的重點段落均確定完成。
9、進一步地,根據(jù)交流復雜系數(shù)以及參考交流重合系數(shù)確定音畫評估段落的類別;
10、若一音畫評估段落的交流復雜系數(shù)大于預設(shè)交流復雜系數(shù)或參考交流重合系數(shù)大于預設(shè)交流重合系數(shù),則判定該音畫評估段落為一類評估段落;
11、若一音畫評估段落的交流復雜系數(shù)小于或等于交流復雜系數(shù)且參考交流重合系數(shù)小于或等于預設(shè)交流重合系數(shù),則判定該音畫評估段落為二類評估段落;
12、所述交流復雜系數(shù)根據(jù)音畫評估段落內(nèi)交流人員的數(shù)量以及參考交流頻率確定。
13、進一步地,任意一音畫評估段落對應的所述參考交流重合系數(shù)為該音畫評估段落內(nèi)各語音段落的交流重合系數(shù)的平均值;
14、針對該音畫評估段落對應時間的音頻進行語音段落分離,以獲取若干語音段落;
15、針對任意一語音段落,該語音段落的交流重合系數(shù)根據(jù)重合語音段落的數(shù)量以及重合段落占比確定。
16、進一步地,根據(jù)各音畫評估段落的類別確定段落評估策略;
17、針對任意一音畫評估段落,
18、若該音畫評估段落為一類評估段落,則采用特征匹配方式確定該音畫評估段落的同步評估系數(shù);
19、若該音畫評估段落為二類評估段落,則采用時序匹配方式確定該音畫評估段落的同步評估系數(shù),根據(jù)各語音段落與其對應的視頻段落的時間差異參考值確定同步評估系數(shù)。
20、進一步地,采用特征匹配方式確定任意一音畫評估段落的同步評估系數(shù)時,針對該音畫評估段落的各語音段落對應的語音持續(xù)周期內(nèi)各視頻段落的階段重合系數(shù)進行檢測,并將階段重合系數(shù)大于預設(shè)階段重合系數(shù)的視頻段落記為對應的語音段落的待評估視頻段落;
21、針對各待評估視頻段落與對應的語音段落的特征匹配系數(shù)進行檢測,根據(jù)各待評估視頻段落的特征匹配系數(shù)確定對應的語音段落的參考特征匹配系數(shù);
22、任意一音畫評估段落的同步評估系數(shù)與特征匹配段落的數(shù)量為正相關(guān)關(guān)系,所述特征匹配段落為參考特征匹配系數(shù)大于預設(shè)參考特征匹配系數(shù)的語音段落,所述參考特征匹配系數(shù)為各待評估視頻段落的特征匹配系數(shù)的平均值。
23、進一步地,任意一待評估視頻段落與對應的語音段落的特征匹配系數(shù)根據(jù)該待評估視頻段落與對應的語音段落的輸出速率匹配度以及參考匹配系數(shù)確定;
24、所述特征匹配系數(shù)分別與輸出速率匹配度以及參考匹配系數(shù)為正相關(guān)關(guān)系。
25、進一步地,所述輸出速率匹配度根據(jù)待評估視頻段落的標準匹配差異值確定,標準匹配差異值為負相關(guān)關(guān)系;
26、所述參考匹配系數(shù)與待評估視頻段落的各視頻幀的相關(guān)特征間隔時長的平均值為負相關(guān)關(guān)系。
27、進一步地,評估完成條件下,針對目標評估視頻各音畫評估段落對應的互動有效參數(shù)進行檢測,并根據(jù)各音畫評估段落的互動有效參數(shù)與同步評估系數(shù)確定段落重點系數(shù),將段落重點系數(shù)大于預設(shè)段落重點系數(shù)的音畫評估段落記為重點段落;
28、所述互動有效參數(shù)根據(jù)對應的同步評估段落的參考互動量以及互動豐富度確定。
29、進一步地,重點分析完成條件下,根據(jù)重點段落占比確定目標評估視頻的執(zhí)行壓縮策略,
30、若重點段落占比大于預設(shè)重點段落占比,則采用動態(tài)執(zhí)行策略進行目標評估視頻的壓縮;
31、若重點段落占比小于或等于預設(shè)重點段落占比,則采用靜態(tài)執(zhí)行策略進行目標評估視頻的壓縮。
32、進一步地,若采用動態(tài)執(zhí)行策略進行目標評估視頻的壓縮時,周期性針對各視頻檢測周期內(nèi)完成壓縮的部分目標評估視頻進行視頻體驗參數(shù)進行檢測,并根據(jù)視頻體驗參數(shù)確定是否針對壓縮參數(shù)進行調(diào)節(jié);
33、若視頻體驗參數(shù)小于或等于預設(shè)視頻體驗參數(shù),則判定針對該視頻檢測周期的下一視頻檢測周期的壓縮參數(shù)進行調(diào)節(jié);
34、若視頻體驗參數(shù)大于預設(shè)視頻體驗參數(shù),則判定不針對該視頻檢測周期的下一視頻檢測周期的壓縮參數(shù)進行調(diào)節(jié)。
35、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于,本發(fā)明技術(shù)方案中,根據(jù)各音畫評估段落的交流復雜系數(shù)以及參考交流重合系數(shù)確定各音畫評估段落的類別,并根據(jù)音畫評估段落的類別確定段落評估策略,即根據(jù)音畫評估段落中交流人員的復雜情況以及語音段落的重疊情況確定針對性的音畫同步的評估方式,使得針對視頻進行音畫同步情況的評估方式更符合實際評估情況,保證了對于視頻音畫同步情況的判斷結(jié)果的準確性,進而保證了后續(xù)壓縮過程中視頻效果的影響。
36、進一步地,本發(fā)明中針對交流復雜系數(shù)較大或參考交流重合系數(shù)較大的音畫評估段落,采用特征匹配方式確定此類音畫評估段落的同步評估系數(shù),通過根據(jù)其中所包含的各個語音段落與其待評估視頻段落的內(nèi)容輸出速率的匹配情況以及內(nèi)容的匹配情況確定特征匹配系數(shù),進而確定同步評估系數(shù),避免了針對此類音畫評估段落的音畫同步情況的判斷結(jié)果受到內(nèi)容重疊的影響,本發(fā)明提高了對于視頻音畫同步情況的判斷結(jié)果的準確性。
37、進一步地,本發(fā)明中根據(jù)獲取的同步評估系數(shù)以及互動有效參數(shù)確定重點段落,即將音視頻同步效果較差或有效互動較多的音畫評估段落記為重點段落,并根據(jù)重點段落占比確定針對性的視頻壓縮方式,使得壓縮過程更符合實際需要,避免了壓縮過程對于視頻效果造成進一步的影響。
38、進一步地,本發(fā)明中在重點段落占比較大時,周期性針對已壓縮完成部分的視頻進行壓縮質(zhì)量檢測,并根據(jù)壓縮質(zhì)量檢測結(jié)果針對當前執(zhí)行壓縮過程的參數(shù)進行調(diào)節(jié),由于重點段落占比較大,易由于壓縮過程對音畫同步效果造成影響,因此通過實時檢測視頻的壓縮質(zhì)量,并及時針對壓縮過程進行調(diào)節(jié),能夠有效降低壓縮過程針對視頻效果造成的影響。