本發(fā)明涉及視頻處理領域,更具體地,涉及一種視頻處理方法及系統(tǒng)。
背景技術:
IP視頻是指通過網絡來傳輸視頻,近年來IP視頻在視頻監(jiān)控被廣泛應用,它相比傳統(tǒng)的模擬視頻來說具有部署方便、利于共享等優(yōu)點,但是同樣也存在延時比較大的缺點,這在視頻監(jiān)控領域里,輕微的延時影響并不大,但是IP視頻技術應用到計算機控制領域中則對其的延時要求嚴格很多。
在計算機控制領域中有一種技術叫做網絡KVM,它采用網絡來傳輸計算機的輸出圖像和鼠標鍵盤等計算機控制指令,由于鼠標鍵盤的操作直接會導致計算機輸出圖像的變化,而使用者又需要依賴于圖像顯示內容來決定操作,因此一般需要控制計算機圖像的延時在40毫秒以內。傳統(tǒng)的視頻處理過程一般包括信號采集、視頻編碼、視頻傳輸、視頻解碼,最后到視頻顯示的過程,隨著信號分辨率的日益變大,在相同的處理方法下,每個模塊的處理時間都會相應增加,從而導致總的延時也相應增加。
現有技術中有一種解決方案是客戶端獲取待處理視頻文件,將待處理視頻文件拆分為若干個分片文件并壓縮后上傳至服務端,服務端接收并解壓縮分片文件,存入分布式文件系統(tǒng);從分布式文件系統(tǒng)中下載各分片文件進行壓縮解碼后存入分布式文件系統(tǒng),從分布式文件系統(tǒng)中獲取新的分片文件合并為一個完整的視頻文件。此方案在客戶端將視頻文件由大文件拆分為小文件,分片并行上傳,雖然可以提高傳輸效率,減少網絡流量耗費,而在服務端將多個小文件并行解碼壓縮處理,減少處理時間,但是視頻處理的過程不單單包括視頻的傳輸和視頻的解碼,還包括了視頻的采集和視頻的顯示等過程,每個處理過程都存在處理時間,每個過程都會產生延時,因此,此技術方案仍存在減少時延的空間。而且此技術方案將視頻文件拆分后,到最后還需要增加一個合并的過程,將待處理視頻文件的所有分片文件完成解碼壓縮處理后,生成一相應的合并任務放入合并隊列中,視頻合并處理服務器從合并隊列取得任務,將所有新的分片文件合并為一個完整的視頻文件后存入分布式文件系統(tǒng)中。此合并過程需要等待所有分片文件解碼壓縮處理后才進行,在一定程度上增加了視頻處理時延。
技術實現要素:
本發(fā)明為克服上述現有技術所述的至少一種缺陷(不足),提供一種時延低的視頻處理方法。
本發(fā)明還提供一種時延低的視頻處理系統(tǒng)。
為解決上述技術問題,本發(fā)明的技術方案如下:
一種視頻處理方法,包括:
對視頻數據進行分塊采集獲得分塊圖像,然后將分塊圖像分別進行編碼、傳輸、解碼,將解碼獲得的分塊圖像按照分塊圖像在原始圖像中的位置放到離屏緩存中。
本發(fā)明的方法對視頻處理的采集、編碼、傳輸、解碼全過程均采用分塊處理策略,將分塊的策略延伸到視頻數據的采集過程中,而且將解碼后的圖像數據按照分塊圖像在原始圖像中的位置并行放入到離屏緩存中,使得在解碼的過程中同時完成了分塊圖像的拼接操作,直接節(jié)省了分塊圖像的合并處理步驟,相對于現有技術中僅僅對視頻數據的編碼、傳輸、解碼過程進行分塊處理以及還需要合并處理步驟來說,本發(fā)明的方法將視頻處理的總延時進一步降低了,實現了視頻采集、編碼、傳輸、解碼過程中更低延時的處理,提高了視頻處理實時性和用戶體驗。
一種視頻處理系統(tǒng),包括采集模塊、編碼模塊、傳輸模塊、解碼模塊;采集模塊,用于對視頻數據進行分塊采集獲得分塊圖像;
編碼模塊、傳輸模塊分別用于對分塊圖像進行編碼和傳輸;
解碼模塊,用于將分塊圖像進行解碼并將解碼獲得的圖像數據按照分塊圖像在原始圖像中的位置放到離屏緩存中。
在本發(fā)明的系統(tǒng)中,采集模塊、編碼模塊、解碼模塊中均采用分塊處理策略,將分塊的策略延伸到視頻數據的采集過程中,而且解碼模塊將解碼后的圖像數據按照分塊圖像在原始圖像中的位置并行放入到離屏緩存中,使得解碼模塊具備解碼功能的同時還同時完成了分塊圖像的拼接功能,直接節(jié)省了分塊圖像解碼后的合并處理模塊,相對于現有技術中僅僅對視頻數據的編碼、傳輸、解碼過程進行分塊處理以及還需要合并處理模塊來說,本發(fā)明的系統(tǒng)將視頻處理的總延時進一步降低了,實現了視頻采集、編碼、傳輸、解碼過程中更低延時的處理,提高了視頻處理實時性和用戶體驗。
附圖說明
圖1為本發(fā)明一種視頻處理方法具體實施例的流程圖。
圖2為本發(fā)明在1*2分塊方式下的耗時分析圖。
圖3為發(fā)明一種視頻處理系統(tǒng)具體實施例的架構圖。
具體實施方式
附圖僅用于示例性說明,不能理解為對本專利的限制;
為了更好說明本實施例,附圖某些部件會有省略、放大或縮小,并不代表實際產品的尺寸;
對于本領域技術人員來說,附圖中某些公知結構及其說明可能省略是可以理解的。
在本發(fā)明的描述中,需要理解的是,此外,術語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或隱含所指示的技術特征的數量。由此,限定的“第一”、“第二”的特征可以明示或隱含地包括一個或者更多個該特征。在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。
在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術語“安裝”、“連接”應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以是通過中間媒介間接連接,可以說兩個元件內部的連通。對于本領域的普通技術人員而言,可以具體情況理解上述術語在本發(fā)明的具體含義。
下面結合附圖和實施例對本發(fā)明的技術方案做進一步的說明。
實施例1
如圖1所示,為本發(fā)明一種視頻處理方法具體實施例的流程圖。參見圖1,本具體實施例一種視頻處理方法具體包括如下步驟:
S101.對視頻數據進行分塊采集獲得分塊圖像;
S102.將分塊圖像分別進行編碼;
S103.將編碼后的分塊圖像分別進行傳輸;
S104.接收分塊圖像并進行解碼,將解碼獲得的分塊圖像按照分塊圖像在原始圖像中的位置放到離屏緩存中。
在本具體實施例中,視頻處理的分塊策略延伸到視頻數據的采集步驟中,在獲取視頻數據時,對視頻數據進行分塊采集獲得分塊圖像,然后將分塊圖像分別進行編碼后傳輸,在接收端接收分塊圖像并進行解碼,解碼后獲得的分塊圖像按照分塊圖像在原始圖像中的位置放到離屏緩存中,離屏緩存的存儲過程直接完成分塊圖像的拼接,此方式在視頻處理的全過程都采用分塊處理方式,而且在解碼過程中完成解碼操作的同時還完成分塊圖像拼接的步驟,大大減少視頻處理過程的時延,提高了視頻數據的實時性,對于IP視頻等對時延要求的應用領域,本具體實施例的方法更加適用。
在具體實施過程中,步驟S101的具體步驟包括:
從視頻數據源中獲取圖像數據,獲取時以預設單位對圖像數據進行掃描獲得預設單位大小的分塊圖像。
通常,預設單位為行像素或列像素,掃描時以圖像的行或列為單位對圖像進行掃描獲得1*N或N*1大小的分塊圖像,N表示分塊圖像的大小。在一種優(yōu)選的實施方式中,為了適應設備,對視頻數據的采集是以圖像的行作為單位進行掃描,分塊的策略采用1*N的方式進行,即在水平方向上不分塊,垂直方向上分塊,N為分塊的數量。
為了對分塊圖像進行標記,方便后續(xù)對分塊圖像進行拼接,步驟S101中對視頻數據進行分塊時為獲得的每個分塊圖像記錄幀編號和/或時間戳信息以及分塊圖像在原始圖像中的坐標區(qū)域信息。
在步驟S102中,編碼步驟直接對采集后的各分塊圖像進行編碼,編碼時每個分塊圖像是獨立進行的,而且多個分塊圖像的編碼時并行進行的,編碼過程中使用采集時記錄的幀編號和/或時間戳信息。
在步驟S103中,編碼后的分塊圖像數據通過網絡傳輸出去,如傳輸到接收端。傳輸時每個分塊圖像也是獨立進行的,而且可以是并行進行的。
在步驟S104中,并行接收到各個分塊圖像后,并行進行解碼并并行存放到離屏緩存中。解碼時根據各個分塊圖像的幀編號和/或時間戳進行,存入離屏緩存時根據每個分塊圖像的幀編號和/或時間戳信息以及分塊圖像在原始圖像中的坐標區(qū)域信息放到離屏緩存,分塊圖像在原始圖像中的位置是根據每個分塊圖像在原始圖像中的坐標區(qū)域信息得到的。在此步驟中,分塊圖像存入離屏緩存中時同時完成了分塊圖像的拼接和存放,節(jié)省了分塊圖像的合并過程。
在具體實施過程中,本具體實施例的方法還包括顯示步驟:
S105.將離屏緩存中緩存的圖像數據切換到到當前屏幕來顯示。
傳統(tǒng)視頻處理方式中,視頻數據不進行分塊處理,全部視頻數據統(tǒng)一進行采集、編碼、傳輸和解碼,用Tc、Te、Tt、Td分別表示采集、編碼、傳輸、解碼一幅圖像的時間,那么傳統(tǒng)視頻處理方案處理一幅圖像整個過程的延時至少為Tc+Te+Tt+Td。
而采用本發(fā)明的方案,如圖2所示,則延時降成約(Tc+Te+Tt+Td)/N + (N-1) * max(Tc/N,Te/N,Tt/N,Td/N),其中max(Tc/N,Te/N,Tt/N,Td/N)表示取Tc/N、Te/N、Tt/N、Td/N中最大的一個值。
假設對圖像進行1*2的分塊來處理,為了簡化說明,假設Tc、Te、Tt、Td的值相同,則一幅圖像從采集到顯示中間耗時為(Tc+Te+Tt+Td)+Td/2,會明顯優(yōu)于傳統(tǒng)視頻處理方案的Tc+Te+Tt+Td。
此外,如背景技術中所提及的現有技術一種解決方案,為了方便進行耗時計算,在此將其步驟簡化為編碼、傳輸、解碼過程進行分塊處理(從背景技術看,該視頻處理過程還包括先后兩次在分布式文件系統(tǒng)進行數據存儲等其他步驟),其延時至少包括Tc、Te/N、Tt/N、Td/N,還應當包括圖像合并處理的時間Th,因此其總的延時至少為Tc+Te/N+Tt/N+Td/N+Th,可見本發(fā)明的方法相對于該解決方案,在延時上仍有大幅度的降低。
實施例2
在實施例1的基礎上,本發(fā)明還提供一種視頻處理系統(tǒng)。如圖3所示,為本發(fā)明一種視頻處理系統(tǒng)的架構圖。參見圖2,本具體實施例一種視頻處理系統(tǒng)具體包括采集模塊201、編碼模塊202、傳輸模塊203、解碼模塊204;
采集模塊201,用于對視頻數據進行分塊采集獲得分塊圖像;
編碼模塊202,用于將分塊圖像分別進行編碼;
傳輸模塊203,用于將編碼好的分塊圖像進行傳輸;
解碼模塊204用于接收分塊圖像,將分塊圖像進行解碼并將解碼獲得的圖像數據按照分塊圖像在原始圖像中的位置并放到離屏緩存中。
在本具體實施例中,視頻處理的分塊策略延伸到視頻數據的采集模塊201中,采集模塊201在獲取視頻數據時,對視頻數據進行分塊采集獲得分塊圖像,然后編碼模塊202和傳輸模塊203將分塊圖像分別進行編碼后傳輸,解碼模塊204在接收端接收分塊圖像并進行解碼,解碼后獲得的分塊圖像按照分塊圖像在原始圖像中的位置放到離屏緩存中,離屏緩存的存儲過程直接完成分塊圖像的拼接,此方式在視頻處理的全過程都采用分塊處理方式,而且解碼模塊204在解碼過程中完成解碼操作的同時還完成分塊圖像的拼接,大大減少視頻處理過程的時延,提高了視頻數據的實時性,對于IP視頻等對時延要求的應用領域,本具體實施例的方法更加適用。
在具體實施過程中,采集模塊201具體用于:
從視頻數據源中獲取圖像數據,獲取時以圖像行像素或列像素為單位對圖像數據進行掃描獲得1*N或N*1大小的分塊圖像,N表示圖像中最大的列像素或者行像素。在一種優(yōu)選的實施方式中,為了適應設備,采集模塊201對視頻數據的采集是以圖像的行作為單位進行掃描,分塊的策略采用1*N的方式進行,即在水平方向上不分塊,垂直方向上分塊。
為了對分塊圖像進行標記,方便后續(xù)對分塊圖像進行拼接,采集模塊201對視頻數據進行分塊時為獲得的每個分塊圖像記錄幀編號和/或時間戳信息以及分塊圖像在原始圖像中的坐標區(qū)域信息。
在編碼模塊202中,直接對采集后的各分塊圖像進行編碼,編碼時每個分塊圖像是獨立進行的,而且多個分塊圖像的編碼時并行進行的,編碼過程中使用采集模塊201記錄的幀編號和/或時間戳信息。
在傳輸模塊203中,將編碼后的分塊圖像數據通過網絡傳輸出去,如傳輸到接收端。傳輸時每個分塊圖像也是獨立進行的,而且可以是并行進行的。
在解碼模塊204中,并行接收到各個分塊圖像后,并行進行解碼并并行存放到離屏緩存中。解碼時根據各個分塊圖像的幀編號和/或時間戳進行,存入離屏緩存時根據每個分塊圖像的幀編號和/或時間戳信息以及分塊圖像在原始圖像中的坐標區(qū)域信息放到離屏緩存,分塊圖像在原始圖像中的位置是根據每個分塊圖像在原始圖像中的坐標區(qū)域信息得到的。在此模塊中,分塊圖像存入離屏緩存中時同時完成了分塊圖像的拼接和存放,節(jié)省解碼后的合并模塊
在具體實施過程中,本具體實施例的系統(tǒng)還包括顯示模塊205,用于將離屏緩存中緩存的圖像數據切換到到當前屏幕來顯示。
傳統(tǒng)視頻處理系統(tǒng)中,視頻數據不進行分塊處理,全部視頻數據統(tǒng)一進行采集、編碼、傳輸和解碼,用Tc、Te、Tt、Td分別表示采集模塊、編碼模塊、傳輸模塊、解碼模塊來處理一幅圖像的時間,那么傳統(tǒng)視頻處理方案處理一幅圖像整個過程的延時至少為Tc+Te+Tt+Td。
而采用本發(fā)明的方案,如圖2所示,則延時降成約(Tc+Te+Tt+Td)/N + (N-1) * max(Tc/N,Te/N,Tt/N,Td/N),其中max(Tc/N,Te/N,Tt/N,Td/N)表示取Tc/N、Te/N、Tt/N、Td/N中最大的一個值。
假設對圖像進行1*2的分塊來處理,為了簡化說明,假設Tc、Te、Tt、Td的值相同,則一幅圖像從采集到顯示中間耗時為(Tc+Te+Tt+Td)+Td/2,會明顯優(yōu)于傳統(tǒng)視頻處理方案的Tc+Te+Tt+Td。
相同或相似的標號對應相同或相似的部件;
附圖中描述位置關系的用于僅用于示例性說明,不能理解為對本專利的限制;
顯然,本發(fā)明的上述實施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實施方式的限定。對于所屬領域的普通技術人員來說,在上述說明的基礎上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發(fā)明權利要求的保護范圍之內。