本發(fā)明涉及一種視頻錄播技術領域,尤其涉及教育錄播系統(tǒng)的控制技術。
背景技術:
隨著教育產(chǎn)業(yè)的發(fā)展,錄播技術也得到了廣泛的應用。但是,目前的錄播系統(tǒng)存在諸多缺點,例如,智能化程度不高,錄制時需要導播人工切換;后期的剪輯制作需要專業(yè)人員,比較復雜;音頻拾取需要用手拿著麥克風,否則達不到良好的錄音效果,等等。因此,錄播的效率較低。
綜上所述,本領域迫切需要一種效率更高的教育錄播技術。
技術實現(xiàn)要素:
本發(fā)明的目的就是提供一種具有智能切換功能的錄播方法及系統(tǒng),具有更高的智能化程度,效率更高,用戶體驗更好。
在本發(fā)明的第一個方面,提供了一種具有智能切換功能的錄播方法,包含:
通過第一攝像機拍攝講臺區(qū)域的第一視頻數(shù)據(jù),同時,通過第二攝像機拍攝學生區(qū)域的第二視頻數(shù)據(jù),并從該第一視頻數(shù)據(jù)中提取教師畫面,將當前的錄播畫面切換為該教師畫面;
實時地對該第二視頻數(shù)據(jù)進行圖像分析,獲得該第二視頻數(shù)據(jù)中的每一個臉部的中心位置對應的水平坐標值和垂直坐標值,和像素點總數(shù);
如果在相隔預定時長的兩個視頻幀中,存在一個臉部的垂直坐標值的變化量大于預定門限,且變化方向為向上,并且該臉部的像素點總數(shù)的變化量小于預定門限,確定該臉部為發(fā)言學生臉部,并從該第一視頻數(shù)據(jù)中提取教師畫面,從該第二視頻數(shù)據(jù)中提取該發(fā)言學生臉部畫面,并將當前的錄播畫面切換為該教師畫面和該發(fā)言學生臉部畫面的組合。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當錄播畫面為教師畫面和發(fā)言學生臉部畫面的組合狀態(tài)時,
如果在相隔預定時長的兩個視頻幀中,存在一個臉部的垂直坐標值的變化量大于預定門限,且變化方向為向下,并且該臉部的像素點總數(shù)的變化量小于預定門限,則從該第一視頻數(shù)據(jù)中提取教師畫面,并將當前的錄播畫面切換為該教師畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當錄播畫面為教師畫面時,如果在相隔預定時長的兩個視頻中,該第一視頻數(shù)據(jù)中臉部的像素點總數(shù)逐步減少為0,并且,
其中,分別為當前幀畫面R矩陣、B矩陣、G矩陣中第i點色彩數(shù)值的大小,分別為當n毫秒前的幀畫面R矩陣、B矩陣、G矩陣中第i點色彩數(shù)值的大小,N為整幅畫面的像素,σ為預先設定的第一閾值,
則將當前的錄播畫面切換為學生區(qū)域的畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當錄播畫面為學生區(qū)域的畫面時,
如果在相隔預定時長的兩個視頻中,該后一個時間的第二視頻數(shù)據(jù)中臉部的像素點總數(shù)比前一個時間的第一視頻數(shù)據(jù)中臉部的像素點總數(shù)的減少量大于預定的第二閾值時,則將當前的錄播畫面切換為該教師畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當錄播畫面為教師畫面時,如果在相隔預定時長的兩個視頻中,該后一個時間的第一視頻數(shù)據(jù)中臉部的像素點總數(shù)比前一個時間的第一視頻數(shù)據(jù)中臉部的像素點總數(shù)的減少量大于預定的第三閾值時,則將當前的錄播畫面切換為黑板區(qū)域的畫面。
在本發(fā)明的優(yōu)選例中,本方法還包括以下步驟:
當錄播畫面為黑板區(qū)域的畫面時,
如果在相隔預定時長的兩個視頻中,該第一視頻數(shù)據(jù)中臉部的像素點總數(shù)大于預定的第二閾值時,則將當前的錄播畫面切換為該教師的畫面。
在本發(fā)明的優(yōu)選例中,本方法還包含:
進行音頻采集;
對視頻和采集到的音頻進行合成并同步。
在本發(fā)明的優(yōu)選例中,本方法還包含:
在該講臺區(qū)域放置拾音器,將該講臺區(qū)域的拾音器保持開啟,
在該學生區(qū)域放置多個拾音器,每個拾音器預先設置有區(qū)域范圍坐標,
根據(jù)該發(fā)言學生臉部的中心位置,和該各拾音器的區(qū)域范圍坐標,確定該發(fā)言學生所在的區(qū)域范圍對應的拾音器,并開啟該拾音器。
在本發(fā)明的第二個方面,提供了一種具有智能切換功能的錄播系統(tǒng),包含:
起始錄播模塊,用于通過第一攝像機拍攝講臺區(qū)域的第一視頻數(shù)據(jù),同時,通過第二攝像機拍攝學生區(qū)域的第二視頻數(shù)據(jù),并從該第一視頻數(shù)據(jù)中提取教師畫面,將當前的錄播畫面切換為該教師畫面;
分析模塊,用于實時地對該第二視頻數(shù)據(jù)進行圖像分析,獲得該第二視頻數(shù)據(jù)中的每一個臉部的中心位置對應的水平坐標值和垂直坐標值,和像素點總數(shù);
切換模塊,用于當在相隔預定時長的兩個視頻幀中,存在一個臉部的垂直坐標值的變化量大于預定門限,且變化方向為向上,并且該臉部的像素點總數(shù)的變化量小于預定門限時,確定該臉部為發(fā)言學生臉部,并從該第一視頻數(shù)據(jù)中提取教師畫面,從該第二視頻數(shù)據(jù)中提取該發(fā)言學生臉部畫面,并將當前的錄播畫面切換為該教師畫面和該發(fā)言學生臉部畫面的組合。
本發(fā)明實施方式與現(xiàn)有技術相比,顯著提高了教育視頻錄播的效率。
應理解,在本發(fā)明范圍內中,本發(fā)明的上述各技術特征和在下文(如實施例)中具體描述的各技術特征之間都可以互相組合,從而構成新的或優(yōu)選的技術方案。限于篇幅,在此不再一一累述。
附圖說明
圖1示出了本發(fā)明的一個優(yōu)選例的具有智能切換功能的錄播系統(tǒng)的結構圖;
圖2示出了本發(fā)明的課堂錄播設備配件布置示意圖;
圖3示出了本發(fā)明的具有智能切換功能的錄播方法中的主要場景的切換關系示意圖;
圖4示出了本發(fā)明的一個優(yōu)選例中對所拍攝的畫面的剪輯方式示意圖;
圖5示出了本發(fā)明的另一個優(yōu)選例中對說拍攝的畫面的剪輯方式示意圖。
圖6示出了本發(fā)明的一個優(yōu)選例的具有智能切換功能的錄播方法的流程示意圖。
圖7示出了本發(fā)明的一個優(yōu)選例的具有智能切換功能的錄播系統(tǒng)的結構示意圖。
在各附圖中,
101:視頻圖像采集模塊
102:圖像算法模塊
103:視頻采集模塊
104:音頻采集模塊
105:輸出模塊
701:起始錄播模塊
702:分析模塊
703:切換模塊
具體實施方式
本發(fā)明通過攝像裝置采集教師上課及學生聽課的視頻,通過分析教師及學生的人體臉部坐標位置及坐標變化的趨勢以及臉部像素及RGB參數(shù)的變化,有效判斷師生的教學場景并對顯示的畫面進行切換。并且,可以根據(jù)不同的教學場景以確定輸出圖像的剪輯方式。并且,還可以根據(jù)不同的教學場景控制音頻的拾取方式。
在以下的敘述中,為了使讀者更好地理解本申請而提出了許多技術細節(jié)。但是,本領域的普通技術人員可以理解,即使沒有這些技術細節(jié)和基于以下各實施方式的種種變化和修改,也可以實現(xiàn)本申請各權利要求所要求保護的技術方案。
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明的實施方式作進一步地詳細描述。
在本發(fā)明中,四個主要場景分別是:
第一場景:老師在講臺上講課,學生在聽講。顯示的畫面為老師電腦屏幕VGA信號為主畫面,拍攝講臺區(qū)域的第一攝像機為畫中小畫面。
第二場景:學生起立回答老師的問題。拍攝講臺區(qū)域的第一攝像機為主畫面,拍攝學生區(qū)域的第二攝像機為畫中小畫面。
第三場景:老師走到講臺下與學生互動。拍攝學生區(qū)域的第二攝像機為主畫面,不設小畫中小畫面。
第四場景:老師在黑板上寫板書。拍攝講臺區(qū)域的第一攝像機為主畫面,不設小畫中小畫面。
在本發(fā)明的優(yōu)選例中,課堂錄播設備配件布置如圖2所示,其中包含兩路攝像機,攝像機A對著學生拍攝,攝像機B對著老師拍攝;包含5路拾音器,一路對著老師,四路均勻地分布在學生座位中間。
兩路攝像機的視頻數(shù)據(jù)經(jīng)過視頻采集卡傳輸?shù)街醒胫骺嘏_,中央主控臺的作用為:接收視頻數(shù)據(jù),通過算法對視頻數(shù)據(jù)進行分析,根據(jù)分析結果判斷教學場景,并根據(jù)不同的教學場景將相應的控制信號發(fā)送到各路攝像機、混音器,并根據(jù)算法進行導播,完成畫面的自動切換,同時,將播出的畫面存儲在中央主控臺的存儲裝置中。
下面參照圖3,進一步說明第一場景的進入和退出條件。如圖3所示,第一場景的進入條件有兩個,一個為開機運行,換句話說,開機運行即進入第一場景。另一個進入條件為滿足上述第二、第三和第四場景的退出條件時,即進入第一場景。另一方面,第一場景的推出條件為若滿足上述第二、第三和第四場景的進入條件時,即退出第一場景。
在本發(fā)明的優(yōu)選例中,兩路攝像機進行圖像處理,經(jīng)過相關的圖像處理算法,判斷的結果為攝像機B,即采集講臺區(qū)域的攝像機捕捉到有人臉畫面,攝像機A,即采集學生區(qū)域的攝像機沒有捕捉到到人臉移動的,此時,算法判斷的教學場景為,教師在講臺上講課,學生在聽講。算法計算出教師的臉部坐標的中心值為(x,y),臉部所占的像素點總數(shù)為t。
中央處理器自動剪輯所拍攝的畫面。
具體地說,在本發(fā)明的優(yōu)選例中,如圖4所示,對所拍攝的畫面的剪輯原則如下:
首先,調節(jié)截取拍攝的畫面的大小,保持原畫面的高寬比不變,臉部像素占畫面圖素的比例為a%;
然后,調節(jié)截取畫面的位置,臉部上邊緣距畫面上邊緣距離u1與臉部上邊緣距畫面下邊緣距離u2的比例為u,且臉部左邊緣距畫面左邊緣距離v1與臉部左邊緣距畫面右邊緣距離v2的比例為v。
進一步地說,在本發(fā)明的優(yōu)選例中,u、v、a為可配置的參數(shù)。例如,取值范圍為0.1<u<0.3,0.1<v<0.3,0.2<a<0.6,單位是像素點數(shù)。
通過上述剪輯方式,保證了人像在畫面中位置及大小固定。
另外,如圖2所示,第一場景通過拾音器E獲取錄入音頻。
實施例1:第一場景與第二場景的切換方法
第一場景切換到第二場景
在本實施例中,包含以下步驟:
步驟601:通過第一攝像機拍攝講臺區(qū)域的第一視頻數(shù)據(jù),同時,通過第二攝像機拍攝學生區(qū)域的第二視頻數(shù)據(jù),并從該第一視頻數(shù)據(jù)中提取教師畫面,將當前的錄播畫面切換為該教師畫面;
步驟602:實時地對該第二視頻數(shù)據(jù)進行圖像分析,獲得該第二視頻數(shù)據(jù)中的每一個臉部的中心位置對應的水平坐標值和垂直坐標值,和像素點總數(shù);
步驟603:如果在相隔預定時長的兩個視頻幀中,存在一個臉部的垂直坐標值的變化量大于預定門限,且變化方向為向上,并且該臉部的像素點總數(shù)的變化量小于預定門限,確定該臉部為發(fā)言學生臉部,并從該第一視頻數(shù)據(jù)中提取教師畫面,從該第二視頻數(shù)據(jù)中提取該發(fā)言學生臉部畫面,并將當前的錄播畫面切換為該教師畫面和該發(fā)言學生臉部畫面的組合。
第二場景切換到第一場景
在本發(fā)明的一個優(yōu)選例中,當錄播畫面為教師畫面和發(fā)言學生臉部畫面的組合狀態(tài)時,如果在相隔預定時長的兩個視頻幀中,存在一個臉部的垂直坐標值的變化量大于預定門限,且變化方向為向下,并且該臉部的像素點總數(shù)的變化量小于預定門限,則從所述第一視頻數(shù)據(jù)中提取教師畫面,并將當前的錄播畫面切換為該教師畫面。
具體地說,在上述方法中,當處于第一場景時,攝像機A捕捉學生的畫面,并根據(jù)算法識別出所有學生的臉部,并計算出學生的臉部坐標的中心值(α,β)及臉部所占的像素點總數(shù)為γ,且捕捉到的學生臉總數(shù)為n。學生臉部坐標的集合為σ={(α1,β1),(α2,β2),…,(αn,βn)},臉部像素點總數(shù)的集合為γ={γ1,γ2,…,γ3}。
當任何一個學生的臉部在垂直方向的移動大于一定的幅度時,可以用數(shù)學公式描述如下,攝像機中當前幀與前一幀的集合相關集合分別為σ,γ,σ’,γ’,它們滿足以下條件時,將進入學生起立回答老師問題的模式,即,第二場景。
或|βk-βk’|>b
或|γk-γk’|>γ
其中,k=1,2,…,n。
其中,a、b、γ為可配置的參數(shù),其具體參數(shù)值在本發(fā)明中不做限定。
其中,a、b、γ為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,1080P像素的視頻中,a、b、γ可以取滿足以下條件的任意值,a>20,b>20,γ>20??梢岳斫?,在其他優(yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調整。
如果滿足上述條件,則學生起立回答老師的問題。在這種情況下,由第一場景對應顯示的畫面切換到第二場景對應顯示的畫面。
當處于第二場景時,如果起立的學生的臉部移動大于一定的幅度時,則退出第二場景。可以用數(shù)學公式描述為,
|αk’-αk”|>a’
或|βk’-βk”|>b’
其中,該學生的臉部中心坐標值為(αk’,βk’),移動后的學生的臉部中心坐標值為(αk”,βk”)。
a’、b’為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,a、b可以取滿足以下條件的任意值,a>20,b>20,單位是像素點數(shù)。
可以理解,在其他優(yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調整。
在這種情況下,由第二場景對應顯示的畫面切換到第一場景對應顯示的畫面。
在本發(fā)明的優(yōu)選例中,當判斷為第二場景時,老師作為主畫面,將學生從學生攝像機中的畫面中截取出來,與老師講課的主畫面組成畫中畫的形式,其中,老師畫面的截取參數(shù)u、v、a與第一場景的定義相同,但是其值大小可以單獨配置。
學生臉部畫面配置方式如下:
1.調節(jié)截取畫面的大小,畫面的像素的寬高值分別為a、b;
2.確定學生人臉在畫中畫的大小,人臉像素占畫中畫圖素的比例為a’%;
3.確定學生人臉在畫中畫的位置,人臉左邊緣距畫中畫左邊緣為a1個像素點,人臉上邊緣距畫中畫上邊緣為b1個像素點;
4.確定畫中畫在整個畫面的位置,畫中畫上邊緣距畫面上邊緣距離u1’與畫中畫上邊緣距畫面下邊緣距離u2’的比例為u’,且畫中畫左邊緣距畫面左邊緣距離v1’與畫中畫左邊緣距畫面右邊緣距離v2’的比例為v’。
在本發(fā)明的優(yōu)選例中,a、b、a’%、a1、b1、u1’、u2’、u’、v1’、v2’、v’均為可配置在參數(shù),可以根據(jù)具體情況靈活調整。
處于第二場景時,講臺上的拾音器E一直開啟,講臺下的拾音器開啟由起立回答問題的學生的具體位置決定。
具體地說,在本發(fā)明的優(yōu)選例中,學生的臉中心位置的坐標(αk,βk)滿足以下條件時,拾音器A開啟:
Ax1<αk<Ax2;
Ay1<βk<Ay2;
其中,Ax1、Ax2、Ay1、Ay2為可配置的量。
同理,當滿足以下條件時,拾音器B開啟:
Bx1<αk<Bx2;
By1<βk<By2;
同理可以設定拾音器C、D的開啟條件。
實施例2:第一場景與第三場景的切換方法
第一場景切換到第三場景
在本實施例中,包含以下步驟:
當錄播畫面為教師畫面時,如果在相隔預定時長的兩個視頻中,該第一視頻數(shù)據(jù)中臉部的像素點總數(shù)逐步減少為0,并且,
其中,分別為當前幀畫面R矩陣、B矩陣、G矩陣中第i點色彩數(shù)值的大小,分別為當n毫秒前的幀畫面R矩陣、B矩陣、G矩陣中第i點色彩數(shù)值的大小,N為整幅畫面的像素,σ為預先設定的第一閾值,
則將當前的錄播畫面切換為學生區(qū)域的畫面。
第三場景切換到第一場景
當錄播畫面為學生區(qū)域的畫面時,
如果在相隔預定時長的兩個視頻中,所述后一個時間的第二視頻數(shù)據(jù)中臉部的像素點總數(shù)比前一個時間的第一視頻數(shù)據(jù)中臉部的像素點總數(shù)的減少量大于預定的第二閾值時,則將當前的錄播畫面切換為該教師畫面。
具體地說,在上述方法中,當處于第一場景時,攝像機B,即采集講臺區(qū)域的攝像機滿足如下條件時,是老師走下講臺與學生互動,換句話說,由第一場景切換到第三場景:
1.攝像機B當畫面幀臉部像素點總數(shù)為t1,與1秒鐘之前的畫面幀面像素點總數(shù)為t2,
t2<t1;
2.攝像機B畫面經(jīng)過若干幀后,t2變?yōu)?。
3.攝像機A,即采集學生區(qū)域的攝像機捕捉到的當前畫面與n毫秒前捕捉到的畫面RBG矩陣數(shù)值變化量之和大于某一值σ,其中n、σ可以根據(jù)具體情況靈活調整:
其中,分別為當前幀畫面R矩陣、B矩陣、G矩陣中第i點色彩數(shù)值的大小,分別為當n毫秒前的幀畫面R矩陣、B矩陣、G矩陣中第i點色彩數(shù)值的大小,N為整幅畫面的像素。
在這種情況下,由第一場景對應顯示的畫面切換到第三場景對應顯示的畫面。
當攝像機B再次采集到人臉時,即本次互動結束,退出第三場景。在這種情況下,由第三場景對應顯示的畫面切換到第一場景對應顯示的畫面。
實施例3:第一場景與第四場景的切換方法
第一場景切換到第四場景
在本實施例中,包含以下步驟:
當錄播畫面為教師畫面時,如果在相隔預定時長的兩個視頻中,該后一個時間的第一視頻數(shù)據(jù)中臉部的像素點總數(shù)比前一個時間的第一視頻數(shù)據(jù)中臉部的像素點總數(shù)的減少量大于預定的第三閾值時,則將當前的錄播畫面切換為黑板區(qū)域的畫面。
第四場景切換到第一場景
當錄播畫面為黑板區(qū)域的畫面時,
如果在相隔預定時長的兩個視頻中,該第一視頻數(shù)據(jù)中臉部的像素點總數(shù)大于預定的第二閾值時,則將當前的錄播畫面切換為該教師的畫面。
具體地說,在上述方法中,當處于第一場景時,攝像機B畫面幀臉部的中心位置坐標為(x1,y1),像素點總數(shù)為t1,此時如果教師開始轉身在黑板上板書,則經(jīng)過圖像處理算法,與1秒鐘之前的畫面幀對比,臉部的中心位置坐標為(x2,y2),像素點總數(shù)為t2,由于開始轉身,導致其臉部所占的像素是逐步減小??梢杂霉竭M行關系式如下描述:
|x1-x2|<δx;
且|y1-y2|<δy;
且t2-t1>ε
其中,δx、δy、ε為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,δx、δy、ε可以取滿足以下條件的值:δx<50,δy<50,ε>20,單位是像素點數(shù)??梢岳斫猓谄渌麅?yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調整。
在這種情況下,由第一場景對應顯示的畫面切換到第四場景對應顯示的畫面。
當前處于第四場景時,攝像機B畫面幀臉部的中心位置坐標為(x1’,y1’),像素點總數(shù)為t1’,當教師由面向黑板轉身面向學生區(qū)域時,與1秒鐘之前的畫面幀對比,臉部的中心位置坐標為(x2’,y2’),像素點總數(shù)為t2’,教師由于轉身,導致其臉部所占的像素是逐步增大??梢杂霉竭M行關系式如下描述:
|x1’-x2’|<δx’;
且|y1’-y2’|<δy’;
且t2’-t1’>ε’
其中,δx’、δy’、ε’為可配置的參數(shù),在本發(fā)明的優(yōu)選例中,δx’、δy’、ε’可以取滿足以下條件的值:δx’<50,δy’<50,ε’<50,單位是像素點數(shù)??梢岳斫猓谄渌麅?yōu)選例中,上述參數(shù)可以根據(jù)具體情況靈活調整。
在這種情況下,由第四場景對應顯示的畫面切換到第一場景對應顯示的畫面。
在本發(fā)明的優(yōu)選例中,算法模塊判斷進入第四場景,即,老師在黑板上寫板書。第四場景的視頻處理顯示模式與第一場景相同,僅視頻的尺寸參數(shù)不同。相應的參數(shù)進行重新設置,第二場景的顯示畫面中的參數(shù)設定為u’、v’、a’。
第四場景的音頻處理過程:第四場景由拾音器E獲取錄入音頻。
需要指出的是,在本發(fā)明的優(yōu)選例中,將所述教師區(qū)域的拾音器保持開啟,并且在所述學生區(qū)域分開地放置了第一至第四拾音器,學生臉部中心坐標為(x,y),當(x,y)滿足不同的條件時,系統(tǒng)開啟不同的拾音器,具體地說:
當Ax1<x<Ax2,Ay1<x<Ay2時,開啟第一拾音器;
當Bx1<x<Bx2,By1<x<By2時,開啟第二拾音器;
……
依次類推。
由此,通過在不同區(qū)域放置拾音器,提高了聲音錄制的質量和效果。
對于上述實施例1、2和3,可以通過如圖1所示的錄播系統(tǒng)實現(xiàn),如圖所述,該系統(tǒng)包含視頻圖像采集模塊101、圖像算法模塊102、視頻剪輯模塊103、音頻采集模塊104和輸出模塊105。
視頻圖像采集模塊101,用于采集老師側及老師側多路視頻數(shù)據(jù),并將視頻數(shù)據(jù)傳輸?shù)街醒胫骺嘏_。在本發(fā)明的優(yōu)選例中,視頻采集的路數(shù),即攝像機數(shù)量可以根據(jù)實際需要進行調整。
圖像算法模塊102,位于中央主控臺,用于分析及處理視頻圖像,根據(jù)輸入的圖像判斷出人體坐標及人臉所占的像素數(shù),根據(jù)前后幀的人體坐標及像素數(shù)的變化趨勢可以判斷出人的動態(tài),并得到相對應的教學場景。如老師轉身寫黑板的動作、學生站立的動作、老師走下講臺的動作,通過動作對應到相應的教學場景,再通過教學場景確定圖像剪輯輸出的方式及選取拾音的麥克風。
視頻剪輯模塊103,根據(jù)不同的教學場景對輸出的多路鏡頭自動進行剪輯及其它相應的視頻處理,并輸出最終錄播的視頻。
音頻采集模塊104,根據(jù)教學場景及人體的定位,確定并選取錄入視頻的拾音器。
輸出模塊105,將音頻與視頻合成并同步后,輸出到顯示裝置和存儲裝置中。
實施例4:具有智能切換功能的錄播系統(tǒng)
參見圖7,根據(jù)本發(fā)明的一個實施例的具有智能切換功能的錄播系統(tǒng)包含:起始錄播模塊701、分析模塊702和切換模塊703。
具體地說,起始錄播模塊701用于通過第一攝像機拍攝講臺區(qū)域的第一視頻數(shù)據(jù),同時,通過第二攝像機拍攝學生區(qū)域的第二視頻數(shù)據(jù),并從所述第一視頻數(shù)據(jù)中提取教師畫面,將當前的錄播畫面切換為該教師畫面。分析模塊702用于實時地對所述第二視頻數(shù)據(jù)進行圖像分析,獲得所述第二視頻數(shù)據(jù)中的每一個臉部的中心位置對應的水平坐標值和垂直坐標值,和像素點總數(shù)。切換模塊703,用于當在相隔預定時長的兩個視頻幀中,存在一個臉部的垂直坐標值的變化量大于預定門限,且變化方向為向上,并且該臉部的像素點總數(shù)的變化量小于預定門限時,確定該臉部為發(fā)言學生臉部,并從所述第一視頻數(shù)據(jù)中提取教師畫面,從所述第二視頻數(shù)據(jù)中提取該發(fā)言學生臉部畫面,并將當前的錄播畫面切換為該教師畫面和該發(fā)言學生臉部畫面的組合。
上述實施方式1-3是與本實施方式相對應的方法實施方式,本實施方式可與上述實施方式互相配合實施。上述實施方式中提到的相關技術細節(jié)在本實施方式中依然有效,為了減少重復,這里不再贅述。相應地,本實施方式中提到的相關技術細節(jié)也可應用在上述實施方式中。
本發(fā)明的主要優(yōu)點包括:
1)免去了后期人工復雜的制作、剪切、編輯,可以實現(xiàn)自動導播、自動跟拍、自動剪輯功能,錄制出滿足國家教育部規(guī)定的國家精品開放課程要求數(shù)學教學資源。
2)錄制時不需要人工導播即可以實現(xiàn)導播切換鏡頭的功能,節(jié)省大量的人力成本。
3)在不增加硬件的基礎上,實現(xiàn)自動導播、自動跟拍、自動剪輯功能,降低成本,能促進產(chǎn)品的推廣。
綜上所述,本發(fā)明提供的具有智能切換功能的錄播方法顯著提高了效率,因此,在教育錄播技術領域有十分廣闊的應用前景。
本發(fā)明的各方法實施方式均可以以軟件、硬件、固件等方式實現(xiàn)。不管本發(fā)明是以軟件、硬件、還是固件方式實現(xiàn),指令代碼都可以存儲在任何類型的計算機可訪問的存儲器中(例如永久的或者可修改的,易失性的或者非易失性的,固態(tài)的或者非固態(tài)的,固定的或者可更換的介質等等)。同樣,存儲器可以例如是可編程陣列邏輯(Programmable Array Logic,簡稱“PAL”)、隨機存取存儲器(Random Access Memory,簡稱“RAM”)、可編程只讀存儲器(Programmable Read Only Memory,簡稱“PROM”)、只讀存儲器(Read-Only Memory,簡稱“ROM”)、電可擦除可編程只讀存儲器(Electrically Erasable Programmable ROM,簡稱“EEPROM”)、磁盤、光盤、數(shù)字通用光盤(Digital Versatile Disc,簡稱“DVD”)等等。
需要說明的是,本發(fā)明各設備實施方式中提到的各單元都是邏輯單元,在物理上,一個邏輯單元可以是一個物理單元,也可以是一個物理單元的一部分,還可以以多個物理單元的組合實現(xiàn),這些邏輯單元本身的物理實現(xiàn)方式并不是最重要的,這些邏輯單元所實現(xiàn)的功能的組合才是解決本發(fā)明所提出的技術問題的關鍵。此外,為了突出本發(fā)明的創(chuàng)新部分,本發(fā)明上述各設備實施方式并沒有將與解決本發(fā)明所提出的技術問題關系不太密切的單元引入,這并不表明上述設備實施方式并不存在其它的單元。
需要說明的是,在本發(fā)明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應理解,在閱讀了本發(fā)明的上述講授內容之后,本領域技術人員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權利要求書所限定的范圍。
并且,在本專利的權利要求書和說明書中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。本專利的權利要求書和說明書中,如果提到根據(jù)某要素執(zhí)行某行為,則是指至少根據(jù)該要素執(zhí)行該行為的意思,其中包括了兩種情況:僅根據(jù)該要素執(zhí)行該行為、和根據(jù)該要素和其它要素執(zhí)行該行為。
雖然通過參照本發(fā)明的某些優(yōu)選實施例,已經(jīng)對本發(fā)明進行了圖示和描述,但本領域的普通技術人員應該明白,可以在形式上和細節(jié)上對其作各種改變,而不偏離本發(fā)明的精神和范圍。