一種基于圖像分析及人工智能的可變參數(shù)的自動(dòng)化視頻轉(zhuǎn)碼方法

文檔序號(hào)：7922321閱讀：241來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種基于圖像分析及人工智能的可變參數(shù)的自動(dòng)化視頻轉(zhuǎn)碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種視頻轉(zhuǎn)碼方法，并且尤其涉及一種基于圖像分析及人丄智能的可變參數(shù)的自動(dòng)化視頻轉(zhuǎn)碼方法。
背景技術(shù)：
隨著人們對(duì)各類數(shù)字視頻內(nèi)容需求的迅速增長(zhǎng)，以及數(shù)字視頻技術(shù)的不斷發(fā)展，出現(xiàn)了多種多樣的數(shù) 字視頻格式.如MPEG2、 MPEG4、 MPEG4 AVC(H.264)、 H.263、 R261、 Windows Media Video等等。對(duì)于不同的視頻格式，其t耍的應(yīng)用領(lǐng)域各不相同，同時(shí)對(duì)于不同的數(shù)字視頻業(yè)務(wù)，其需耍的編碼參數(shù)設(shè)置也各不相同。因此，我們經(jīng)常需要將各種不同格式、不同規(guī)格參數(shù)的視頻內(nèi)容(第一視頻)轉(zhuǎn)碼為特定規(guī)格參數(shù)的某種特定格式(第二視頻)，以滿足不同數(shù)字視頻業(yè)務(wù)的實(shí)際需要。由于數(shù)字視頻格式及其規(guī)格的多樣性與復(fù)雜性，無論我們期望將源視頻內(nèi)容轉(zhuǎn)碼為任何一種視頻格式，我們都需要為視頻編碼器設(shè)置我們期望的各項(xiàng)編碼參數(shù)，例如視頻畫面的寬度、視頻畫面的高度、視頻編碼碼率、視頻幀速率等等。因此，傳統(tǒng)的視頻轉(zhuǎn)碼流程必須要求人工的參與，或者使用固定的編碼參數(shù)對(duì)源視頻內(nèi)容進(jìn)行編碼。使用人工對(duì)視頻編碼器的各項(xiàng)編碼參數(shù)進(jìn)行手動(dòng)的設(shè)置是目前較為常見的方式，一個(gè)有經(jīng)驗(yàn)的視頻轉(zhuǎn) 碼操作人員會(huì)根據(jù)源視頻內(nèi)容的分辨率、幀速、畫面的運(yùn)動(dòng)程度以及視頻碼率等考慮因素，有效的判斷出既符合輸出視頻格式的參數(shù)耍求、又保證源視頻內(nèi)容在轉(zhuǎn)碼過程中的畫質(zhì)損失盡可能小的編碼參數(shù)。但是，使用人丄對(duì)視頻編碼器的各項(xiàng)編碼參數(shù)進(jìn)行手動(dòng)設(shè)置的方式也有著許多的缺陷。首先是其不適用于人批量甚至海量視頻內(nèi)容的轉(zhuǎn)碼丁作，由于視頻轉(zhuǎn)碼操作人員在設(shè)置編碼參數(shù)之前，需要首先對(duì)源視頻內(nèi)容進(jìn)行一定程度的預(yù)覽，同時(shí)在預(yù)覽后還需要逐項(xiàng)的去設(shè)置相關(guān)的編碼參數(shù)，因此當(dāng)需要轉(zhuǎn)碼的源視頻內(nèi)容的數(shù)量較多時(shí)，如果要求視頻轉(zhuǎn)碼操作人員逐個(gè)的預(yù)覽并設(shè)置每個(gè)源視頻內(nèi)容的編碼參數(shù)，無疑需耍投入大量的人員勞動(dòng)、消耗大量的時(shí)間，工作效率較低。其次是有經(jīng)驗(yàn)的視頻轉(zhuǎn)碼操作人員畢竟數(shù)量有限，而隨著家用DV市場(chǎng)的逐步發(fā)展，視頻轉(zhuǎn)碼的應(yīng)用己經(jīng)深入到了普通人們的生活中，我們不可能要求這些普通用戶也能像有經(jīng)驗(yàn)的視頻轉(zhuǎn)碼操作人員那樣具備正確判斷并設(shè)置相關(guān)編碼參數(shù)組合的能力和經(jīng)驗(yàn)。另一種較為常見的方式是使用固定的編碼參數(shù)對(duì)源視頻內(nèi)容進(jìn)行編碼，這種方式的好處是自動(dòng)化程度高，操作簡(jiǎn)單甚至無需人工操作，可以迅速的對(duì)大批量甚至海量的源視頻內(nèi)容進(jìn)行轉(zhuǎn)碼處理。但是，這種方式同樣也有一個(gè)嚴(yán)重的缺陷，那就是當(dāng)我們對(duì)大批量甚至海量的源視頻內(nèi)容進(jìn)行轉(zhuǎn)碼處理時(shí)，由于源視頻內(nèi)容的規(guī)格是多種多樣的，他們可能有著不同的畫面寬度、畫面高度、碼率、場(chǎng)設(shè)置、像素寬高比等規(guī) 格參數(shù)，一旦我們使用統(tǒng)一而固定的編碼參數(shù)對(duì)其進(jìn)行編碼，就會(huì)導(dǎo)致至少有一部分源視頻內(nèi)容的轉(zhuǎn)碼效果會(huì)很差，典型的問題如下對(duì)于場(chǎng)設(shè)置4:不相同的源視頻內(nèi)容，會(huì)造成其中的一部分在轉(zhuǎn)碼后無法達(dá)到最佳效果，比如源視頻內(nèi) 容中既包括一些逐行掃描的視頻內(nèi)容、也包括一些下場(chǎng)優(yōu)先的隔行掃描的視頻內(nèi)容、還包括一些上場(chǎng)優(yōu)先的隔行掃描的視頻內(nèi)容，那么無論我們?nèi)绾卧O(shè)置統(tǒng)一的編碼參數(shù)，這些源視頻內(nèi)容中-定會(huì)有一部分無法被正常轉(zhuǎn)碼、或者轉(zhuǎn)碼后的效果很差、I法正常觀看。另-個(gè)問題是導(dǎo)致參數(shù)的效益比降低，例如，對(duì)于一些碼率很高的源視頻內(nèi)容，當(dāng)我們使用一個(gè)較低的碼率對(duì)其進(jìn)行轉(zhuǎn)碼時(shí)，無疑會(huì)導(dǎo)致其畫質(zhì)損失比較嚴(yán)重，而同時(shí)這個(gè)固定碼率對(duì)于另外一些碼率很低的源視頻內(nèi)容來說，又明顯會(huì)造成碼率及存儲(chǔ)空間的浪費(fèi)。例如現(xiàn)在有2個(gè)源視頻內(nèi)容，它們的碼率分別是 800Kb/S和100Kb/S，假設(shè)我們?cè)O(shè)置的統(tǒng)一的固定編碼碼率是300Kb/S，那么對(duì)于碼率為800Kb/S的源視頻內(nèi)容來說，300Kb/S的編碼碼率無疑會(huì)導(dǎo)致其在轉(zhuǎn)碼后損失相當(dāng)程度的畫質(zhì)；而對(duì)于碼率為100Kb/S的源視頻內(nèi)容來說，300Kb/S的編碼碼率又會(huì)導(dǎo)致人量的碼率及存儲(chǔ)空間被浪費(fèi)了。無論我們?nèi)绾卧O(shè)置固定編碼碼率，這種情況都無法避免。再如，現(xiàn)在仍然有2個(gè)源視頻內(nèi)容，它們的分辨率分別是1024x768和352x264，假設(shè)我們?cè)O(shè)置的統(tǒng) 一的固定編碼分辨率是768 x 576，那么對(duì)于分辨率為1024 x 768的源視頻內(nèi)容來說，768 x 576的編碼分辨率無疑會(huì)導(dǎo)致其在轉(zhuǎn)碼后損失相當(dāng)程度的畫面細(xì)節(jié)質(zhì)量；而對(duì)于分辨率為352 x 264的源視頻內(nèi)容來說， 768 x 576的編碼分辨率不僅不會(huì)提高畫質(zhì)，還會(huì)導(dǎo)致視頻編碼器編碼性能的降低及帶寬消耗的增加。發(fā)明內(nèi)容本發(fā)明的主耍目的是為了解決上述問題，提供一種達(dá)到了專業(yè)視頻轉(zhuǎn)碼操作人員水平的自動(dòng)化的視頻轉(zhuǎn)碼方法，通過本方法，任何視頻轉(zhuǎn)碼軟件系統(tǒng)或視頻轉(zhuǎn)碼硬件系統(tǒng)都可以在無需人工操作的前提下，獲得與人丄操作相近似的輸出視頻結(jié)果，既優(yōu)化了轉(zhuǎn)碼后輸出視頻的尺寸及畫面質(zhì)量，又無需投入大量的人員勞動(dòng)，大幅度的提高了工作效率，可廣泛的應(yīng)用于各類需耍進(jìn)行視頻編碼及視頻轉(zhuǎn)碼的軟件系統(tǒng)或硬件系統(tǒng)中。本發(fā)明是一種基于圖像分析及人工智能的可變參數(shù)的自動(dòng)化視頻轉(zhuǎn)碼方法，它通過對(duì)源視頻內(nèi)容(也稱為第一視頻，下同)的分析，獲取到每個(gè)源視頻內(nèi)容的獨(dú)特的分析數(shù)據(jù)，然后再依據(jù)這些分析數(shù)據(jù)，自動(dòng)化的為其設(shè)置經(jīng)過優(yōu)化處理的編碼參數(shù)，使得轉(zhuǎn)碼后的輸出視頻(也稱為第二視頻，下同)在尺寸盡可能小的前提—卜—，獲得更好的畫面質(zhì)量。本發(fā)明提供的視頻轉(zhuǎn)碼方法中，第一視頻及轉(zhuǎn)碼后的第二視頻均支持任何已知的視頻編解碼格式。本發(fā)明提供的視頻轉(zhuǎn)碼方法包括如下步驟A 獲取第一視頻格式的各項(xiàng)編碼參數(shù)的限制條件；B對(duì)第一視頻進(jìn)行分析，獲取第一視頻的分析結(jié)果信息；C依據(jù)步驟B中對(duì)第一視頻進(jìn)行分析得到的結(jié)果信息，以及步驟A中獲取到的第二視頻格式的各項(xiàng)編碼參數(shù)的限制條件，計(jì)算出該第一視頻在編碼為第二視頻格式時(shí)的最優(yōu)編碼參數(shù)； D 將在步驟C中得到的編碼參數(shù)輸出至視頻編碼器，由視頻編碼器負(fù)責(zé)進(jìn)行視頻編碼。其中，步驟A為可選步驟，加入步驟A的目的是某些情況下，由于實(shí)際業(yè)務(wù)的需要，我們可能不希望第二視頻格式的某些編碼參數(shù)超出某個(gè)范圍，比如用于互聯(lián)網(wǎng)視頻點(diǎn)播業(yè)務(wù)的視頻內(nèi)容.由于互聯(lián)網(wǎng)的帶寬狀況，我們可能希望所有第二視頻的編碼碼率都不超過某個(gè)特定數(shù)值，以便使其可以在普通的帶寬環(huán) 境下被遠(yuǎn)程訪問并流暢播放。因此，我們可以依據(jù)不同的實(shí)際業(yè)務(wù)需求，對(duì)第二視頻格式的任意編碼參數(shù) 設(shè)置各種不同的限制條件，其設(shè)置方法可以是多種多樣的，只要我們能在步驟A中通過某種方式獲取到這些限制條件就可以了。步驟B的具體步驟包括Bl分析并獲取第一視頻的各項(xiàng)基本參數(shù)(met。data)信息，具體包括獲取第一視頻的畫面寬度、畫面高度、視頻碼率、幀速率、視頻編解碼器、偉拭、場(chǎng)信息、像素寬高比、屏幕寬高比、時(shí)間長(zhǎng)度，其中最主要的是第一視頻的畫面寬度、畫面卨度、以及視頻碼率；B2對(duì)第一視頻的視頻圖像進(jìn)行分析，獲取一個(gè)能夠反映第一視頻整體的畫面運(yùn)動(dòng)強(qiáng)度的值(視頻圖像的運(yùn)動(dòng)強(qiáng)度)、獲取一個(gè)能夠反映第一視頻整體的圖像復(fù)雜程度的值(圖像復(fù)雜度)，其中最主要的是能夠反映第一視頻整體的畫面運(yùn)動(dòng)強(qiáng)度的值(視頻圖像的運(yùn)動(dòng)強(qiáng)度)。步驟C的具體步驟包括Cl依據(jù)在步驟B1中獲取的第一視頻的畫面寬度、畫面卨度、視頻碼率、視頻編解碼器、在步驟B2 中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度、以及在步驟A中獲取到的第二視頻格式的編碼碼率的限制條件，計(jì)算出編碼第二視頻時(shí)的最優(yōu)編碼碼率；C2依據(jù)在步驟B1中獲取的第-視頻的畫面寬度、畫面高度、制式、像素寬高比、屏幕寬高比、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度、以及在步驟A中獲取到的第二視頻格式的畫面寬度和畫面高度的限制條件，計(jì)算出編碼第—視頻時(shí)的最優(yōu)畫面寬度、最優(yōu)畫面高度、像素寬高比和屏幕寬高比C3依據(jù)在步驟Bl中獲取的第一視頻的幀速率、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度，以及在步驟A中獲取到的第二視頻格式的幀速率的限制條件，計(jì)算出編碼第二視頻時(shí)的最優(yōu)幀速率；C4依據(jù)在# B十中獲取的第一視頻的帶1式、-場(chǎng)信息、以及在步驟A中獲取到的第二視頻格式的場(chǎng) 設(shè)置的限制條件，計(jì)算出解碼第一視頻時(shí)的場(chǎng)設(shè)置、以及編碼第二視頻時(shí)的場(chǎng)設(shè)置。C5依據(jù)在步驟Bl中獲取的第一視頻的畫面寬度、畫面高度、幀速率、視頻編解碼器等各項(xiàng)信息、在歩驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度、以及在步驟A中獲取到的第二視頻格式的各項(xiàng)編碼參數(shù)的限制條件，計(jì)算出編碼第二視頻時(shí)的各項(xiàng)高級(jí)編碼參數(shù)的最優(yōu)設(shè)置，依據(jù)第二視頻格式的不同，高級(jí)編碼參數(shù)包括但不限于色彩深度、編碼方式(CBR/VBR)、 TWO-PASS編碼、制式、色彩模式(4:0:0/4:l :1/4:2:0/4:2:2/4:4:4)、編解碼級(jí)別配置(Codec profile)、最小關(guān)鍵幀間隔、最大關(guān)鍵幀間隔、宏塊分割模式、參考P幀范圍(P-Frame reference)、運(yùn)動(dòng)偵測(cè)模式(Motion estimation)、運(yùn)動(dòng)偵測(cè) 范闈(Motion estimation r。nge)、 B幀數(shù)量、峰谷碼率比、加速模式、QP變化率、去馬賽克設(shè)置(deblock filter)。步驟D的具體步驟包括Dl將在歩驟C中得到的用于編碼第二視頻的各項(xiàng)編碼參數(shù)輸出至視頻編碼器；D2視頻編碼器使用在步驟C中得到的各項(xiàng)編碼參數(shù)將第一視頻轉(zhuǎn)碼為第二視頻格式，也可以依據(jù) 實(shí)際需要對(duì)在歩驟c中得到的各項(xiàng)編碼參數(shù)進(jìn)行人工的調(diào)整，然后再由視頻編碼器進(jìn)行編碼。按照本發(fā)明提供的白動(dòng)化視頻轉(zhuǎn)碼方法，一個(gè)典型的視頻轉(zhuǎn)碼系統(tǒng)包括下列模塊配置管理器，用于對(duì)不同類型的轉(zhuǎn)碼業(yè)務(wù)分別保存其特定的編碼參數(shù)的限制條竹或取值范圍；視頻分析器，用于對(duì)第一視頻進(jìn)行分析，獲取第一視頻的分析結(jié)果信息；參數(shù)生成器，用于根據(jù)第一視頻的分析結(jié)果信息及專家策略庫，生成編碼第二視頻時(shí)視頻編碼器的配置參數(shù)；專家策略庫，用于保存編碼參數(shù)生成策略；視頻編碼器，用于對(duì)第一視頻進(jìn)行編碼，將其編碼為第二視頻格式；其中，視頻分析器不僅會(huì)對(duì)第一視頻的各項(xiàng)基本參數(shù)(meta data)進(jìn)行分析，也會(huì)對(duì)第一視頻的視頻圖像進(jìn)行分析，得到第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度。專家策略庫中保存著多個(gè)編碼參數(shù)生成策略組，每個(gè)編碼參數(shù)生成策略組中又包含多條編碼參數(shù)生成策略，每條編碼參數(shù)生成策略均包括一個(gè)或多個(gè)激活條件、控制的編碼參數(shù)項(xiàng)、以及對(duì)應(yīng)該參數(shù)項(xiàng)的參數(shù) 生成算法，當(dāng)視頻分析器獲取的第一視頻的分析結(jié)果信息符合某條編碼參數(shù)生成策略的激活條件時(shí)，參數(shù) 生成器就會(huì)依據(jù)該條編碼參數(shù)生成策略對(duì)應(yīng)的生成算法計(jì)算出針對(duì)該參數(shù)項(xiàng)的配置參數(shù)，整個(gè)過程可以無需任何人工千預(yù)。問時(shí)，專家策略庫中的編碼參數(shù)生成策略具備優(yōu)先度屬性，當(dāng)兩條或多條編碼參數(shù)生成策略均對(duì)某個(gè) 參數(shù)項(xiàng)生成了配置參數(shù)時(shí)，優(yōu)先度最高的編碼參數(shù)生成策略所生成的配置參數(shù)會(huì)覆蓋其它優(yōu)先度較低的編碼參數(shù)生成策略所生成的配置參數(shù)。本發(fā)明的優(yōu)點(diǎn)是1、相對(duì)于傳統(tǒng)的自動(dòng)化編碼系統(tǒng)，大幅提高了轉(zhuǎn)碼后輸出視頻內(nèi)容的幽面質(zhì)量，同時(shí)大幅降低了轉(zhuǎn)碼后輸出視頻內(nèi)容的碼率及存儲(chǔ)空間，進(jìn)而大幅降低了存儲(chǔ)、傳輸這些視頻內(nèi)容需要花費(fèi)的成本；2、相對(duì)于人工設(shè)置編碼參數(shù)的轉(zhuǎn)碼方式，可節(jié)省人量的人力、物力和財(cái)力，同時(shí)大幅提高轉(zhuǎn) 碼工作的效率。

圖1為本發(fā)明提供的視頻轉(zhuǎn)碼方法的流程圖；圖2為按照本發(fā)明的視頻轉(zhuǎn)碼系統(tǒng)的結(jié)構(gòu)框圖；具體實(shí)施方式
下面結(jié)合附圖詳細(xì)描述本發(fā)明的實(shí)施例，下述實(shí)施例在以本發(fā)明提供的視頻轉(zhuǎn)碼方法為前提下實(shí)施，給出了詳細(xì)的實(shí)施方式和過程，但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。在具體實(shí)施過程中，第一視頻首先被進(jìn)行分析，基于對(duì)第一視頻的分析結(jié)果信息，針對(duì)不同特點(diǎn)的第一視頻，自動(dòng)計(jì)算出對(duì)應(yīng)的第二視頻格式的最優(yōu)編碼參數(shù)，然后將這些編碼參數(shù)輸出至視頻編碼器，由視頻編碼器負(fù)責(zé)進(jìn)行視頻編碼。本實(shí)施例可以分為以下兒個(gè)步驟。A獲取第-視頻格式的各項(xiàng)編碼參數(shù)的限制條件；本實(shí)施例中，第二視頻格式為H.264,其編解碼級(jí)別、視頻碼率、畫面寬度、畫面高度、場(chǎng)設(shè)置、以及像素寬高比有如下的限制條件編解碼級(jí)別Baseline profile;視頻碼率的限制條件為不小于50 Kbps、不大于450 Kbps; 畫而寬度的限制條件為不小于176、不大丁 1024; 畫面高度的限制條件為不小于176、不大于1024; 場(chǎng)設(shè)置的限制條件為無場(chǎng)，即逐行掃描的方式；像素寬高比必須為1:1;其它參數(shù)的限制條件為任意，即不做任何限制；B系統(tǒng)對(duì)第一視頻進(jìn)行分析，獲取第一視頻的分析結(jié)果信息，首先分析并獲取第一視頻的各項(xiàng)基本參數(shù)(meta data)信息，具體包括視頻寬度1920;視頻高度1080; 視頻格式DVCPRO100; 視頻幀速25FPS; 碼率100Mbps; 場(chǎng)設(shè)置下場(chǎng)優(yōu)先時(shí)間長(zhǎng)度5分25秒；其它屬性均為未知；然后，對(duì)第一視頻的視頻圖像進(jìn)行分析，獲取該視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度，具體為視頻圖像的運(yùn)動(dòng)強(qiáng)度22%，非常弱；圖像復(fù)雜度55%,普通；視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度均為相對(duì)值，有多種方法及于段可以獲取到，這里不再贅述，基于不同的獲取方法，最終得到的數(shù)值也會(huì)不同，我們只需要設(shè)定一個(gè)基準(zhǔn)值，然后將第一視頻的分析結(jié)果數(shù) 據(jù)與基準(zhǔn)值進(jìn)行比較，獲得一個(gè)相對(duì)的數(shù)值即可；C依據(jù)步驟B中對(duì)第一視頻進(jìn)行分析得到的結(jié)果信息，以及步驟A中獲取到的第二視頻格式的各項(xiàng) 編碼參數(shù)的限制條件，計(jì)算出該第一視頻在編碼為第二視頻格式時(shí)的最優(yōu)編碼參數(shù)，具體包括以下步驟Cl依據(jù)在步驟B1中獲取的第一視頻的畫面寬度、畫面高度、視頻碼率、視頻編解碼器、在步驟B2 中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度、以及在步驟A中獲取到的第二視頻格式的編碼碼率的限制條件，由于該第一視頻的視頻圖像的運(yùn)動(dòng)強(qiáng)度非常弱，圖像復(fù)雜度為普通，即使采用第二視頻允許的最大寬度1024及最大高度1024,仍然只需較低的碼率即可獲得很高的畫面質(zhì)量，因此計(jì)算出編碼第二視頻時(shí)的最優(yōu)編碼碼率為150Kbps;C2依據(jù)在步驟B1中獲取的第一視頻的畫面寬度、畫面高度、制式、像素寬高比、屏幕寬高比、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度、以及在步驟A中獲取到的第二視頻格式的畫面寬度和畫面高度的限制條件，由于該第一視頻的視頻圖像的運(yùn)動(dòng)強(qiáng)度非常弱，圖像復(fù)雜度為普通，即使只釆用很低的視頻編碼碼率仍然能保證第二視頻在高分辨率下獲得足夠的畫面質(zhì)量，第二視頻的最優(yōu)畫面寬度及最優(yōu) 畫面高度只需要考慮在步驟A屮獲取到的對(duì)這兩個(gè)參數(shù)的限制條件即可，因此最優(yōu)畫面寬度為第二視頻允許的最人寬度1024，最優(yōu)畫面高度為依據(jù)最優(yōu)畫面寬度等比計(jì)算得到的576、像素寬高比為1: 1、屏幕寬高比為16: 9;C3依據(jù)在步驟B1中獲取的第一視頻的幀速率、在步驟B2中獲取的第一視頻屮視頻圖像的運(yùn)動(dòng)強(qiáng)度，以及在步驟A屮獲取到的第—視頻格式的幀速率的限制條件，由于該第一視頻的視頻圖像的運(yùn)動(dòng)強(qiáng)度非常弱，岡此計(jì)算出編碼第二視頻時(shí)的最優(yōu)幀速率為15;C4依據(jù)在步驟Bl中獲取的第一視頻的制式、場(chǎng)信息、以及在步驟A中獲取到的第二視頻格式的場(chǎng) 設(shè)置的限制條件，由于第一視頻是下場(chǎng)優(yōu)先的隔行掃描方式，因此計(jì)算出解碼第一視頻時(shí)的場(chǎng)設(shè)置為采用下場(chǎng)優(yōu)先的設(shè)置進(jìn)行去場(chǎng)處理，同時(shí)編碼第二視頻時(shí)的場(chǎng)設(shè)置為無場(chǎng)(逐行掃描)的方式。C5依據(jù)在步驟B1中獲取的第一視頻的畫面寬度、畫面高度、幀速率、視頻編解碼器等各項(xiàng)信息、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度、以及在步驟八中獲取到的第二視頻格式的各項(xiàng)編碼參數(shù)的限制條件，計(jì)算出編碼第二視頻時(shí)的各項(xiàng)高級(jí)編碼參數(shù)的最優(yōu)設(shè)置，具體包括編碼方式為VBR、色彩模式為4:2:2、編解碼級(jí)別配置(Codec profile)為Baseline profile、最小關(guān)鍵幀間隔為3、最大關(guān)鍵幀間隔為500。D將在步驟C中得到的編碼參數(shù)輸出至視頻編碼器，由視頻編碼器負(fù)責(zé)進(jìn)行視頻編碼，具體包括以下步驟Dl將在步驟C中得到的用于編碼第二視頻的各項(xiàng)編碼參數(shù)輸出至視頻編碼器；D2視頻編碼器使用在步驟C中得到的各項(xiàng)編碼參數(shù)將第一視頻轉(zhuǎn)碼為第二視頻格式，也可以依據(jù)實(shí)際需要對(duì)在步驟C中得到的各項(xiàng)編碼參數(shù)進(jìn)行人工的調(diào)整，然后再由視頻編碼器進(jìn)行編碼。本發(fā)明與傳統(tǒng)的自動(dòng)化編碼系統(tǒng)相比，可以大幅提高轉(zhuǎn)碼后輸出視頻內(nèi)容的畫面質(zhì)量，同時(shí)大幅降低轉(zhuǎn)碼后輸出視頻內(nèi)容的碼率及存儲(chǔ)空間，進(jìn)而大幅降低了存儲(chǔ)、傳輸這些視頻內(nèi)容需要花費(fèi)的成本。
權(quán)利要求
1.一種基于圖像分析及人工智能的可變參數(shù)的自動(dòng)化視頻轉(zhuǎn)碼方法，用于自動(dòng)化地將第一視頻以更好的畫面質(zhì)量、更低的碼率轉(zhuǎn)碼為第二視頻格式，其特征在于基于對(duì)第一視頻的分析，針對(duì)不同特點(diǎn)的第一視頻，通過自動(dòng)化地動(dòng)態(tài)控制編碼第二視頻時(shí)視頻編碼器的配置參數(shù)，盡可能的提高第二視頻的畫面質(zhì)量，同時(shí)降低第二視頻的碼率及占用的存儲(chǔ)空間，可廣泛的應(yīng)用于各類需要進(jìn)行視頻編碼及視頻轉(zhuǎn)碼的軟件系統(tǒng)或便件系統(tǒng)中。
2. 如權(quán)利要求1所述的視頻轉(zhuǎn)碼方法，其特征在于，當(dāng)有多個(gè)第一視頻需要轉(zhuǎn)碼為第二視頻格式時(shí)，對(duì) 于不同的第一視頻，其對(duì)應(yīng)的第二視頻格式的編碼參數(shù)是動(dòng)態(tài)可變的，而不是固定的。
3. 如權(quán)利耍求1所述的視頻轉(zhuǎn)碼方法，其特征在于對(duì)第二視頻格式的每項(xiàng)編碼參數(shù)都可以設(shè)置各自的限制條件或取值范圍。
4. 如權(quán)利耍求1所述的視頻轉(zhuǎn)碼方法，其特征在于，當(dāng)有多個(gè)第一視頻需要轉(zhuǎn)碼為第二視頻格式時(shí)，對(duì) 于每個(gè)不同的第一視頻進(jìn)行分析處理，得到該視頻的獨(dú)特的分析結(jié)果信息，依據(jù)這些分析結(jié)果信息與權(quán)利要求3中的各項(xiàng)編碼參數(shù)的限制條件，白動(dòng)得出針對(duì)該第一視頻的第二視頻格式的最優(yōu)編碼參數(shù)，整個(gè)過程可以無需任何人工干預(yù)。
5. 如權(quán)利要求1所述的視頻轉(zhuǎn)碼方法，其特征在丁本方法中的第一視頻格式和第二視頻格式均可以是任意視頻編解碼格式。
6. —種基于圖像分析及人工智能的可變參數(shù)的S動(dòng)化視頻轉(zhuǎn)碼系統(tǒng)，用于自動(dòng)化地將第一視頻以更好的畫面質(zhì)輩、更低的碼率轉(zhuǎn)碼為第一視頻格式，其特征在于基于對(duì)第一視頻的分析，針對(duì)不同特點(diǎn)的第一視頻，通過自動(dòng)化地動(dòng)態(tài)控制編碼第二視頻時(shí)視頻編碼器的配置參數(shù)，盡可能的提高第二視頻的畫面質(zhì)量，同時(shí)降低第二視頻的碼率及占用的存儲(chǔ)空間，該系統(tǒng)包括配置管理器，用于對(duì)不同類荊的轉(zhuǎn)碼業(yè)務(wù)分別保存其特定的編碼參數(shù)的限制條件或取值范圍；視頻分析器，用于對(duì)第一視頻進(jìn)行分析，獲取第一視頻的分析結(jié)果信息；參數(shù)生成器，用于根據(jù)第一視頻的分析結(jié)果信息及專家策略庫，生成編碼第二視頻時(shí)視頻編碼器的配置參數(shù)；專家策略庫，用于保存編碼參數(shù)生成策略；視頻編碼器，用于對(duì)第一視頻進(jìn)行編碼，將其編碼為第二視頻格式；
7. 如權(quán)利要求6所述的視頻轉(zhuǎn)碼系統(tǒng)，其特征在于視頻分析器不僅會(huì)對(duì)第一視頻的各項(xiàng)基本參數(shù)(meta data)進(jìn)行分析，也會(huì)對(duì)第一視頻的視頻圖像進(jìn)行分析，得到第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度。
8. 如權(quán)利要求6所述的視頻轉(zhuǎn)碼系統(tǒng)，其特征在于專家策略庫中保存著多個(gè)編碼參數(shù)生成策略組，每個(gè) 編碼參數(shù)生成策略組中又包含多條編碼參數(shù)生成策略，每條編碼參數(shù)生成策略均包括一個(gè)或多個(gè)激活條件、控制的編碼參數(shù)項(xiàng)、以及對(duì)應(yīng)該參數(shù)項(xiàng)的參數(shù)生成算法，當(dāng)視頻分析器獲取的第一視頻的分析結(jié)果信息符合某條編碼參數(shù)生成策略的激活條件時(shí)，參數(shù)生成器就會(huì)依據(jù)該條編碼參數(shù)生成策略對(duì)應(yīng)的生成算法計(jì)算出針對(duì)該參數(shù)項(xiàng)的配置參數(shù)，整個(gè)過程可以無需任何人工干預(yù)。
9. 如權(quán)利要求6所述的視頻轉(zhuǎn)碼系統(tǒng)，其特征在于專家策略庫中的編碼參數(shù)生成策略具備優(yōu)先度屬性，當(dāng)兩條或多條編碼參數(shù)生成策略均對(duì)某個(gè)參數(shù)項(xiàng)生成了配置參數(shù)時(shí)，優(yōu)先度最高的編碼參數(shù)生成策略所生成的配置參數(shù)會(huì)覆蓋其它優(yōu)先度較低的編碼參數(shù)生成策略所生成的配置參數(shù)。
10. 如權(quán)利要求1所述的視頻轉(zhuǎn)碼方法，其步驟包括 A 獲取第二視頻格式的各項(xiàng)編碼參數(shù)的限制條件；B對(duì)笫一視頻進(jìn)行分析，獲取第一視頻的分析結(jié)果信息；C依據(jù)步驟B中對(duì)第視頻進(jìn)行分析得到的結(jié)果信息，以及步驟A中獲取到的第二視頻格式的各項(xiàng)編碼參數(shù)的限制條件，計(jì)算出該第一視頻在編碼為第二視頻格式時(shí)的最優(yōu)編碼參數(shù)；D將在步驟C中得到的編碼參數(shù)輸出至視頻編碼器，由視頻編碼器負(fù)責(zé)進(jìn)行視頻編碼。
11. 如權(quán)利要求IO所述的視頻轉(zhuǎn)碼方法，其特征在于，所述步驟B包括如下子步驟 Bl分析并獲取第一視頻的各項(xiàng)基本參數(shù)(meta data)信息；B2對(duì)第一視頻的視頻圖像進(jìn)行分析，獲取該視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度。
12. 如權(quán)利耍求11所述的視頻轉(zhuǎn)碼方法，其特征在于，所述步驟B1包括獲取第一視頻的畫面寬度、畫面高度、視頻碼率、幀速率、視頻編解碼器、制式、場(chǎng)信息、像素寬高比、屏幕寬高比、時(shí)間長(zhǎng)度，其屮最主耍的是第一視頻的畫面寬度、畫面高度、以及視頻碼率。
13. 如權(quán)利耍求11所述的視頻轉(zhuǎn)碼方法，其特征在于，所述步驟B2包括獲取一個(gè)能夠反映第一視頻整體的畫面運(yùn)動(dòng)強(qiáng)度的值(視頻圖像的運(yùn)動(dòng)強(qiáng)度)、獲取一個(gè)能夠反映第一視頻整體的圖像復(fù)雜程度的值(圖像復(fù)雜度)，其中最主要的是能夠反映第一視頻整體的畫面運(yùn)動(dòng)強(qiáng)度的值(視頻圖像的運(yùn)動(dòng)強(qiáng)度)。
14. 如權(quán)利要求IO所述的視頻轉(zhuǎn)碼方法，其特征在于，所述步驟C包括如下子步驟Cl依據(jù)在步驟B1中獲取的第一視頻的畫面寬度、畫面高度、視頻碼率、視頻編解碼器、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度、以及在步驟A中獲取到的第二視頻格式的編碼碼率的限制條件，計(jì)算出編碼第二視頻時(shí)的最優(yōu)編碼碼率；C2依據(jù)在步驟Bl中獲取的第一視頻的畫面寬度、畫面高度、制式、像素寬高比、屏幕寬高比、在步驟 B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度、以及在步驟A中獲取到的第二視頻格式的畫面寬度和畫面高度的限制條件，計(jì)算出編碼第二視頻時(shí)的最優(yōu)畫面寬度、最優(yōu)畫面高度、像素寬高比和屏幕寬高比； C3依據(jù)在步驟B1中獲取的第一視頻的幀速率、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度，以及在步驟A中獲取到的第二視頻格式的幀速率的限制條件，計(jì)算出編碼第二視頻時(shí)的最優(yōu)幀速率； C4依據(jù)在步驟Bl中獲取的第一視頻的制式、場(chǎng)信息、以及在步驟A中獲取到的第二視頻格式的場(chǎng)設(shè)置的限制條件，計(jì)算出解碼第一視頻時(shí)的場(chǎng)設(shè)置、以及編碼第二視頻時(shí)的場(chǎng)設(shè)置。C5依據(jù)在步驟Bl中獲取的第一視頻的畫面寬度、畫面高度、幀速率、視頻編解碼器等各項(xiàng)信息、在步驟B2中獲取的第一視頻中視頻圖像的運(yùn)動(dòng)強(qiáng)度及圖像復(fù)雜度，以及在步驟A中獲取到的第二視頻格式的各項(xiàng)編碼參數(shù)的限制條件，計(jì)算出編碼第二視頻時(shí)的各項(xiàng)高級(jí)編碼參數(shù)的最優(yōu)設(shè)置，依據(jù)第二視頻格式的不同，高級(jí)編碼參數(shù)包括但不限于色彩深度、編碼方式(CBR/VBR)、 TWO-PASS編碼、制式、色彩模式 (4:0:0/4:1:1/4:2:0/4:2:2/4:4:4)、編解碼器級(jí)別配置(Codec profile)、最小關(guān)鍵幀間隔、最人關(guān)鍵幀間隔、宏塊分割模式、參考P幀范圍(P-Frame reference)、運(yùn)動(dòng)偵測(cè)模式(Motion estimation),運(yùn)動(dòng)偵測(cè)范圍 (Motion estimation range)、 B幀數(shù)量、峰谷碼率比、加速模式、QP變化率、去馬賽克設(shè)置(deblock filter)。
15. 如權(quán)利耍求10所述的視頻轉(zhuǎn)碼方法，其特征在于，所述步驟D包括如下亍步驟Dl將在步驟C中得到的用于編碼第二視頻的各項(xiàng)編碼參數(shù)輸出至視頻編碼器；D2視頻編碼器使用在步驟C中得到的各項(xiàng)編碼參數(shù)將第一視頻轉(zhuǎn)碼為第二視頻格式，也可以依據(jù)實(shí)際需耍對(duì)在步驟C中得到的各項(xiàng)編碼參數(shù)進(jìn)行人T的調(diào)整，然后再由視頻編碼器進(jìn)行編碼。
全文摘要
本發(fā)明涉及視頻轉(zhuǎn)碼技術(shù)領(lǐng)域，尤其涉及一種基于圖像分析及人工智能的自動(dòng)優(yōu)化調(diào)整編碼參數(shù)的視頻轉(zhuǎn)碼方法。本發(fā)明用于將第一視頻轉(zhuǎn)碼為第二視頻格式，通過對(duì)第一視頻的分析，獲取到不同第一視頻的獨(dú)特的分析數(shù)據(jù)，然后再依據(jù)這些分析數(shù)據(jù)，自動(dòng)化的為其設(shè)置經(jīng)過優(yōu)化處理的編碼參數(shù)，使得轉(zhuǎn)碼后的第二視頻在尺寸盡可能小的前提下，獲得更好的畫面質(zhì)量。通過本發(fā)明，任何視頻轉(zhuǎn)碼系統(tǒng)都可以在無需人工操作的前提下，獲得與人工操作相近似的第二視頻畫面質(zhì)量，既優(yōu)化了轉(zhuǎn)碼后的第二視頻的尺寸及畫面質(zhì)量，又無需投入大量的人員勞動(dòng)，大幅度的提高了工作效率，可廣泛的應(yīng)用于各類需要進(jìn)行視頻編碼及視頻轉(zhuǎn)碼的軟件系統(tǒng)或硬件系統(tǒng)中。
文檔編號(hào)H04N7/26GK101404767SQ200810181078
公開日2009年4月8日申請(qǐng)日期2008年11月24日優(yōu)先權(quán)日2008年11月24日
發(fā)明者崔天龍申請(qǐng)人:崔天龍

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：崔天龍
技術(shù)所有人：崔天龍
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

人工智能圖像識(shí)別技術(shù)相關(guān)技術(shù)

人工智能與圖像識(shí)別相關(guān)技術(shù)

圖像處理和人工智能相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于圖像分析及人工智能的可變參數(shù)的自動(dòng)化視頻轉(zhuǎn)碼方法