一種信息處理方法以及信息處理裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種信息處理方法以及信息處理裝置。
【背景技術(shù)】
[0002]隨著科學(xué)技術(shù)的不斷發(fā)展,電子技術(shù)也得到了飛速的發(fā)展,電子產(chǎn)品的種類也越來(lái)越多,人們也享受到了科技發(fā)展帶來(lái)的各種便利。例如,光場(chǎng)相機(jī)在主透鏡與感光器陣列之間,設(shè)置了一個(gè)微型透鏡陣列,光線集合從主透鏡經(jīng)每個(gè)微透鏡傳送到感光器前,析出聚焦光線及將光線資料轉(zhuǎn)換,以數(shù)碼方式記下,這個(gè)系統(tǒng)可以捕捉相關(guān)場(chǎng)景光線的所有方向的信息,因此它在拍攝完成后可以“聚焦”照片中的任何深度,使用者可以更快地完成拍照,即便非專業(yè)攝影師也不必?fù)?dān)心對(duì)焦問(wèn)題,特別是在攝錄視頻文件的時(shí)候,光場(chǎng)相機(jī)具有普通相機(jī)無(wú)法達(dá)到的優(yōu)點(diǎn),普通相機(jī)拍攝視頻的時(shí)候,若焦點(diǎn)不正確,則無(wú)法對(duì)視頻文件進(jìn)行修改,而光場(chǎng)相機(jī)由于能夠先拍照后進(jìn)行對(duì)焦,所以在視頻文件拍攝完成后對(duì)視頻文件的焦點(diǎn)進(jìn)行修改,使得該視頻文件能夠滿足用戶的需求,因此光場(chǎng)相機(jī)因?yàn)檫@種先拍照后對(duì)焦的特點(diǎn)在越來(lái)越多的場(chǎng)合被使用。
[0003]但是,光場(chǎng)相機(jī)攝錄獲得的視頻文件沒(méi)有焦點(diǎn),不便于預(yù)覽,需要用戶在為視頻文件設(shè)置對(duì)應(yīng)的焦點(diǎn),才能夠形成滿足用戶預(yù)覽需求的預(yù)覽視頻文件。用戶在為視頻文件設(shè)置對(duì)應(yīng)的焦點(diǎn)時(shí),會(huì)耗費(fèi)一定的時(shí)間,在一些實(shí)時(shí)性要求特別高的場(chǎng)合,例如視頻電話會(huì)議等等場(chǎng)合,本地會(huì)議室的光場(chǎng)相機(jī)攝錄的視頻文件傳輸給遠(yuǎn)端會(huì)議室的時(shí)候沒(méi)有焦點(diǎn),遠(yuǎn)端會(huì)議室就無(wú)法及時(shí)地觀看本地會(huì)議室的光場(chǎng)相機(jī)攝錄的視頻文件。
[0004]因此,現(xiàn)有技術(shù)中存在由于光場(chǎng)相機(jī)攝錄獲得的視頻文件沒(méi)有焦點(diǎn),不便于預(yù)覽的技術(shù)問(wèn)題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例通過(guò)提供一種信息處理方法以及信息處理裝置,用以解決現(xiàn)有技術(shù)中存在的由于光場(chǎng)相機(jī)攝錄獲得的視頻文件沒(méi)有焦點(diǎn),不便于預(yù)覽的技術(shù)問(wèn)題。
[0006]第一方面,本發(fā)明實(shí)施例提供一種信息處理方法,包括:獲取光場(chǎng)攝像單元攝錄的視頻文件;根據(jù)所述視頻文件中的音頻信息和/或人臉信息,確定所述視頻文件中光場(chǎng)圖像幀的焦點(diǎn);基于已確定焦點(diǎn)的光場(chǎng)圖像幀,生成所述視頻文件的預(yù)覽視頻文件。
[0007]結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述視頻文件為一視頻會(huì)議的視頻文件;所述根據(jù)所述視頻文件中的音頻信息和/或人臉信息,確定所述視頻文件中光場(chǎng)圖像幀的焦點(diǎn),具體包括:通過(guò)對(duì)所述光場(chǎng)圖像幀進(jìn)行人臉識(shí)別,確定所述光場(chǎng)圖像幀中的參會(huì)者所在的位置;根據(jù)參會(huì)者所在的位置,并通過(guò)所述視頻文件中的音頻信息和/或唇動(dòng)識(shí)別,確定參會(huì)者中的講話者所在的位置;將所述講話者所在的位置確定為所述視頻文件中光場(chǎng)圖像幀的焦點(diǎn)。
[0008]結(jié)合第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述通過(guò)所述視頻文件中的音頻信息,確定參會(huì)者中的講話者所在的位置,具體包括:對(duì)所述視頻文件中的音頻信息進(jìn)行分析,確定所述講話者所在的位置,所述音頻信息由一麥克風(fēng)陣列在所述光場(chǎng)攝像單元攝錄所述視頻文件時(shí)同步獲得。
[0009]結(jié)合第一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述通過(guò)唇動(dòng)識(shí)別,確定參會(huì)者中的講話者所在的位置,具體包括:對(duì)所述光場(chǎng)圖像幀進(jìn)行唇動(dòng)識(shí)別,并根據(jù)唇動(dòng)識(shí)別的結(jié)果,確定所述光場(chǎng)圖像幀中唇動(dòng)的人臉?biāo)诘奈恢?;確定所述唇動(dòng)的人臉?biāo)诘奈恢脼樗鲋v話者所在的位置。
[0010]結(jié)合第一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述通過(guò)所述視頻文件中的音頻信息和唇動(dòng)識(shí)別,確定參會(huì)者中的講話者所在的位置,具體包括:對(duì)所述音頻信息進(jìn)行分析,獲得所述光場(chǎng)圖像幀對(duì)應(yīng)的最強(qiáng)聲音;對(duì)所述光場(chǎng)圖像幀進(jìn)行唇動(dòng)識(shí)別,并根據(jù)唇動(dòng)識(shí)別的結(jié)果,確定所述光場(chǎng)圖像幀中唇動(dòng)的人臉;匹配所述最強(qiáng)聲音與所述唇動(dòng)的人臉的唇部動(dòng)作,確定與所述最強(qiáng)聲音匹配的唇動(dòng)的人臉?biāo)诘奈恢脼樗鲋v話者所在的位置。
[0011]第二方面,本發(fā)明實(shí)施例提供一種信息處理裝置,包括:光場(chǎng)攝像單元,用于攝錄視頻文件;處理單元,用于獲取光場(chǎng)攝像單元攝錄的視頻文件,并根據(jù)所述視頻文件中的音頻信息和/或人臉信息,確定所述視頻文件中光場(chǎng)圖像幀的焦點(diǎn),并基于已確定焦點(diǎn)的光場(chǎng)圖像幀,生成所述視頻文件的預(yù)覽視頻文件。
[0012]結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述視頻文件為一視頻會(huì)議的視頻文件,所述處理單元具體用于通過(guò)對(duì)所述光場(chǎng)圖像幀進(jìn)行人臉識(shí)別,確定所述光場(chǎng)圖像幀中的參會(huì)者所在的位置,并根據(jù)參會(huì)者所在的位置,并通過(guò)所述視頻文件中的音頻信息和/或唇動(dòng)識(shí)別,確定參會(huì)者中的講話者所在的位置,并將所述講話者所在的位置確定為所述視頻文件中光場(chǎng)圖像幀的焦點(diǎn)。
[0013]結(jié)合第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述處理單元具體用于對(duì)所述視頻文件中的音頻信息進(jìn)行分析,確定所述講話者所在的位置,所述音頻信息由一麥克風(fēng)陣列在所述光場(chǎng)攝像單元攝錄所述視頻文件時(shí)同步獲得。
[0014]結(jié)合第一種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述處理單元具體用于對(duì)所述光場(chǎng)圖像幀進(jìn)行唇動(dòng)識(shí)別,并根據(jù)唇動(dòng)識(shí)別的結(jié)果,確定所述光場(chǎng)圖像幀中唇動(dòng)的人臉?biāo)诘奈恢茫⒋_定所述唇動(dòng)的人臉?biāo)诘奈恢脼樗鲋v話者所在的位置。
[0015]結(jié)合第一種可能的實(shí)現(xiàn)方式,在第四種可能的實(shí)現(xiàn)方式中,所述處理單元具體用于對(duì)所述音頻信息進(jìn)行分析,獲得所述光場(chǎng)圖像幀對(duì)應(yīng)的最強(qiáng)聲音,并對(duì)所述光場(chǎng)圖像幀進(jìn)行唇動(dòng)識(shí)別,并根據(jù)唇動(dòng)識(shí)別的結(jié)果,確定所述光場(chǎng)圖像幀中唇動(dòng)的人臉,并匹配所述最強(qiáng)聲音與所述唇動(dòng)的人臉的唇部動(dòng)作,確定與所述最強(qiáng)聲音匹配的唇動(dòng)的人臉?biāo)诘奈恢脼樗鲋v話者所在的位置。
[0016]第三方面,本發(fā)明實(shí)施例還提供一種通信終端,包括:光場(chǎng)攝像單元,用于攝錄一通信場(chǎng)景的視頻文件;處理單元,與所述光場(chǎng)攝像單元相連,用于確定視頻文件中光場(chǎng)圖像幀的焦點(diǎn),并基于已確定焦點(diǎn)的光場(chǎng)圖像幀,生成視頻文件的預(yù)覽視頻文件。
[0017]本發(fā)明實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
[0018]由于采用了獲取光場(chǎng)攝像單元攝錄的視頻文件,并確定視頻文件中光場(chǎng)圖像幀的焦點(diǎn),并基于已確定焦點(diǎn)的光場(chǎng)圖像幀,生成視頻文件的預(yù)覽視頻文件的技術(shù)方案,所生成的視頻文件的預(yù)覽視頻文件中的光場(chǎng)圖像幀是具有焦點(diǎn)的,也即該預(yù)覽視頻文件能夠方便地供用戶預(yù)覽,所以解決了現(xiàn)有技術(shù)中存在的由于光場(chǎng)相機(jī)攝錄獲得的視頻文件沒(méi)有焦點(diǎn),不便于預(yù)覽的技術(shù)問(wèn)題,實(shí)現(xiàn)了將光場(chǎng)相機(jī)攝錄的視頻文件轉(zhuǎn)換為具有焦點(diǎn)的預(yù)覽視頻文件,從而便于預(yù)覽的技術(shù)效果。
【附圖說(shuō)明】
[0019]圖1為本發(fā)明實(shí)施例提供的信息處理方法的流程圖;
[0020]圖2為本發(fā)明實(shí)施例提供的通過(guò)視頻文件中的音頻信息,確定參會(huì)者中的講話者所在的位置的示意圖;
[0021]圖3為本發(fā)明實(shí)施例提供的通過(guò)唇動(dòng)識(shí)別,確定參會(huì)者中的講話者所在的位置的示意圖;
[0022]圖4為本發(fā)明實(shí)施例提供的通過(guò)視頻文件中的音頻信息和唇動(dòng)識(shí)別,確定參會(huì)者中的講話者所在的位置的示意圖;
[0023]圖5為本發(fā)明實(shí)施例提供的通信終端的功能模塊圖;
[0024]圖6為本發(fā)明實(shí)施例提供的信息處理裝置的功能模塊圖。
【具體實(shí)施方式】
[0025]本發(fā)明實(shí)施例通過(guò)提供一種信息處理方法以及信息處理裝置,用以解決現(xiàn)有技術(shù)中存在的由于光場(chǎng)相機(jī)攝錄獲得的視頻文件沒(méi)有焦點(diǎn),不便于預(yù)覽的技術(shù)問(wèn)題。
[0026]本發(fā)明實(shí)施例中的技術(shù)方案為解決上述技術(shù)問(wèn)題,總體思路如下:
[0027]本發(fā)明實(shí)施例提供一種信息處理方