本發(fā)明涉及通信
技術(shù)領(lǐng)域:
,尤其涉及一種多媒體數(shù)據(jù)處理方法和裝置。
背景技術(shù):
:隨著4G時(shí)代的到來,移動互聯(lián)網(wǎng)的技術(shù)發(fā)展和移動終端智能操作系統(tǒng)的普及,移動用戶對即時(shí)消息、聊天、文件傳輸?shù)榷喾N社交通信的訴求越來越強(qiáng)烈;即已有越來越多的用戶通過在移動終端上加載各式各樣的社交應(yīng)用來進(jìn)行快速、有效的信息傳遞。例如,用戶可選擇簡單的文字來傳遞彼此之間的思緒,也可在自帶的表情面板中選擇相應(yīng)的表情符號來表達(dá)彼此的心情和狀態(tài),還可在已下載的表情包中選擇相應(yīng)的表情圖來進(jìn)行信息交流。然而,在表情面板中大多數(shù)的表情包都僅僅只展示了一些圖案信息(比如,簡單的人臉表情包),圖片的顯示效果比較單一;與此同時(shí),在表情面板中還存在一種擴(kuò)展的攜帶文字的表情包,但是,這些擴(kuò)展的表情包大多都是在相應(yīng)的應(yīng)用程序?qū)?yīng)的表情商店中下載并安裝的表情包。換言之,這些表情包需要后臺運(yùn)營人員預(yù)先搜尋到恰當(dāng)?shù)膱D片素材和文字素材,并對搜索到的圖片素材和文字素材進(jìn)行人工合成,以形成攜帶文字信息的組合圖片,并將這些組合圖片上傳至表情商店供用戶進(jìn)行下載??梢姡捎眠@種方式形成的表情包是極為耗費(fèi)人力成本的,且制作過程極為繁瑣和耗時(shí)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例所要解決的技術(shù)問題在于,提供一種多媒體數(shù)據(jù)處理方法和裝置,可提供一種快捷的多媒體數(shù)據(jù)制作方法,可以豐富表情圖片的展示效果并降低人工成本。為了解決上述技術(shù)問題,本發(fā)明實(shí)施例第一方面提供了一種多媒體處理方法,包括:接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。本發(fā)明實(shí)施例第二方面提供了一種多媒體數(shù)據(jù)處理裝置,包括:提取掃描模塊,用于接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;狀態(tài)確定模塊,用于根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;圖文融合模塊,用于篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。本發(fā)明實(shí)施例通過接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置可在接收到用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并根據(jù)確定的狀態(tài)信息自動篩選出與所述狀態(tài)信息相匹配的文本信息,并生成包含文本信息的融合圖片數(shù)據(jù),以提供一種在制作多媒體數(shù)據(jù)時(shí)能快速進(jìn)行文字搭配的方法,進(jìn)而降低制作時(shí)的人工成本,并可根據(jù)用戶需求豐富多媒體數(shù)據(jù)的顯示效果。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例提供的一種多媒體數(shù)據(jù)處理方法的流程示意圖;圖2是本發(fā)明實(shí)施例提供的另一種多媒體數(shù)據(jù)處理方法的流程示意圖;圖3是本發(fā)明實(shí)施例提供的又一種多媒體數(shù)據(jù)處理方法的流程示意圖;圖4是本發(fā)明實(shí)施例提供的一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;圖5是本發(fā)明實(shí)施例提供的一種狀態(tài)確定模塊的結(jié)構(gòu)示意圖;圖6是本發(fā)明實(shí)施例提供的一種圖文融合模塊的結(jié)構(gòu)示意圖;圖7是本發(fā)明實(shí)施例提供的另一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;圖8是本發(fā)明實(shí)施例提供的又一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“包括”和“具有”以及它們?nèi)魏巫冃危鈭D在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產(chǎn)品或設(shè)備固有的其他步驟或單元。本發(fā)明實(shí)施例中提及的多媒體數(shù)據(jù)處理方法的執(zhí)行依賴于計(jì)算機(jī)程序,可運(yùn)行于馮若依曼體系的計(jì)算機(jī)系統(tǒng)之上。該計(jì)算機(jī)程序可集成在應(yīng)用中,也可作為獨(dú)立的工具類應(yīng)用運(yùn)行。該計(jì)算機(jī)系統(tǒng)可以是個人電腦、平板電腦、筆記本電腦、智能手機(jī)等終端設(shè)備。以下分別進(jìn)行詳細(xì)說明。請參見圖1,是本發(fā)明實(shí)施例提供的一種多媒體數(shù)據(jù)處理方法的流程示意圖。如圖1所示,所述多媒體數(shù)據(jù)處理方法至少包括:步驟S101,接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;具體地,多媒體數(shù)據(jù)處理裝置接收用戶在當(dāng)前圖片數(shù)據(jù)對應(yīng)的顯示區(qū)域中執(zhí)行的對所述當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中人和/或物的圖像分布面積,并根據(jù)所述分布面積確定所述當(dāng)前圖片數(shù)據(jù)中人或物的優(yōu)先級,并將優(yōu)先級最高的人或物對應(yīng)的圖像確定為所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;其中,所述圖像特征可以包括面部輪廓特征和五官輪廓特征和肢體輪廓特征;其中,所述多媒體數(shù)據(jù)處理裝置可以包括:智能手機(jī)、移動互聯(lián)網(wǎng)設(shè)備、可穿戴設(shè)備(例如智能手表(如iwatch等)、智能手環(huán))或其他可安裝即時(shí)通訊應(yīng)用客戶端的終端設(shè)備;其中,所述編輯指令的執(zhí)行包括但不限于:按壓操作、雙擊操作或者滑屏操作等各類型觸摸觸控屏的操作。通常,在具有觸控屏功能的終端中,其觸控屏的結(jié)構(gòu)包括至少三層:屏幕玻璃層、觸控面板層和顯示面板層。其中屏幕玻璃層為保護(hù)層,觸控面板層用于感知用戶的觸控操作,顯示面板層用于顯示圖像。比如,以圖片A中有一個人和一只狗為例,對于圖片A而言,當(dāng)該圖片A對應(yīng)的顯示區(qū)域中接收到用戶對所述當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),可根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中人和狗對應(yīng)的圖像的分布面積,例如,圖片A中的當(dāng)前圖片數(shù)據(jù)為一個小女孩牽著一只狗(吉娃娃),且小女孩的分布面積大于吉娃娃的分布面積,則可根據(jù)預(yù)設(shè)規(guī)則中人的優(yōu)先級大于狗的優(yōu)先級的規(guī)則,將該圖片A中小女孩對應(yīng)的圖像作為所述當(dāng)前圖片數(shù)據(jù)中優(yōu)先級較高的圖像,并將該優(yōu)先級較高的小女孩的圖像確定為目標(biāo)物體圖像,并掃描該小女孩對應(yīng)的目標(biāo)物體圖像的圖像特征(比如,小女孩的面部輪廓特征、五官輪廓特征)。步驟S102,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;具體地,所述多媒體數(shù)據(jù)處理裝置可在預(yù)設(shè)的映射關(guān)系表中查找與所述圖像特征相關(guān)聯(lián)的至少一種預(yù)設(shè)圖像特征,并可根據(jù)預(yù)設(shè)的選擇規(guī)則在查找到的所述至少一種預(yù)設(shè)圖像特征中選擇目標(biāo)預(yù)設(shè)圖像特征,并將所述目標(biāo)預(yù)設(shè)圖像特征對應(yīng)的狀態(tài)信息確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;其中,所述表情狀態(tài)信息包括:欣喜、憤怒、悲哀、快樂中的一種或多種情感狀態(tài);其中,所述行為狀態(tài)包括:睡覺、吃飯、唱歌和表演;其中,所述預(yù)設(shè)的映射關(guān)系表中包含:各種狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系;進(jìn)一步地,所述映射關(guān)系表中還包括:所述各狀態(tài)信息和各文本信息之間的映射關(guān)系。步驟S103,篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù);具體地,所述多媒體數(shù)據(jù)處理裝置可用于檢測當(dāng)前網(wǎng)絡(luò)狀態(tài),并在檢測到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),可從所述本地文本數(shù)據(jù)庫中獲取預(yù)設(shè)的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第一文本信息,并將所述第一文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第一文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第一文本信息的融合圖片數(shù)據(jù)。比如,以用戶通過手機(jī)拍到正在酣睡的哈士奇為例,在圖片B中,哈士奇的頭搭在小窩邊,雙眼緊閉,舌頭微微伸出,嘴角微微咧開;當(dāng)用戶用相機(jī)記錄下這一幕,并打算把自己的愛犬(哈士奇)這搞笑的一幕制作成專屬的表情包時(shí),用戶可在該手機(jī)中圖片B對應(yīng)的顯示區(qū)域進(jìn)行編輯,以為圖片B進(jìn)行圖文搭配。具體地,當(dāng)該手機(jī)根據(jù)接收到的編輯指令掃描哈士奇的圖像特征時(shí),可根據(jù)所掃描到的圖像特征確定該圖片B中哈士奇對應(yīng)的行為狀態(tài)信息(酣睡)和表情狀態(tài)信息(舌頭微微伸出,嘴角微微咧開),并在檢測到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)的狀況下,在本地的映射關(guān)系表中篩選與該哈士奇對應(yīng)狀態(tài)信息(高興)具有映射關(guān)系的文本信息(比如,今天的午飯不錯),并將所述文本信息與該哈士奇的酣睡圖片B進(jìn)行數(shù)據(jù)融合,以生成攜帶所述文本信息的融合圖片C(包含原有的圖片B對應(yīng)的圖片數(shù)據(jù),還包含篩選出的文本信息),并控制屏幕顯示所述融合圖片C。由此可見,所述多媒體數(shù)據(jù)處理裝置首先接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;然后,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;最后,篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置可在接收到用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并根據(jù)確定的狀態(tài)信息自動篩選出與所述狀態(tài)信息相匹配的文本信息,并生成包含文本信息的融合圖片數(shù)據(jù),以提供一種多媒體數(shù)據(jù)的快捷制作方法,以節(jié)約制作時(shí)間,并可根據(jù)用戶需求豐富多媒體數(shù)據(jù)的顯示效果。進(jìn)一步地,請參見圖2,是本發(fā)明實(shí)施例提供的另一種多媒體數(shù)據(jù)處理方法的流程示意圖。如圖2所示,所述多媒體數(shù)據(jù)處理方法至少包括:步驟S201,設(shè)置多種狀態(tài)信息,并為各狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,并將各狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系添加至預(yù)設(shè)的映射關(guān)系表中;其中,對于直接獲取到的圖像,不同的人就可能對該圖像有不同的見解(尤其是一張圖中有多個人或者物時(shí),不同的人的關(guān)注點(diǎn)則會不同),于是,就需要用戶預(yù)先對各種狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,以更加形象地描繪當(dāng)前數(shù)據(jù)圖片中人或者物的狀態(tài)信息。其中,預(yù)設(shè)圖像特征包括預(yù)設(shè)的面部輪廓特征、五官輪廓特征和肢體輪廓特征,可用于對圖像中目標(biāo)物體對應(yīng)的目標(biāo)特征進(jìn)行圖像識別,且目標(biāo)物體對應(yīng)的目標(biāo)特征代表了目標(biāo)區(qū)域的特性,在進(jìn)行圖像識別的過程中,往往借助于直觀性特征,如圖像的邊沿、輪廓、紋理和區(qū)域等進(jìn)行圖像特征的掃描,這些都屬于圖像灰度的直觀特征,它們的物理意義明確,可通過相應(yīng)的提取算法進(jìn)行特征提?。痪唧w地,請參見表1給出的部分映射關(guān)系表;圖像特征表情狀態(tài)信息行為狀態(tài)信息A欣喜狀態(tài)睡覺狀態(tài)B憤怒狀態(tài)無C傷悲狀態(tài)吃飯狀態(tài)D快樂狀態(tài)奔跑狀態(tài)表1由上述表1給出的部分映射關(guān)系表可知,當(dāng)設(shè)置的狀態(tài)信息下的表情狀態(tài)信息為欣喜狀態(tài),且行為狀態(tài)信息為睡覺狀態(tài)時(shí),所分配的圖像特征A可以具體包括一個人躺著,且嘴角上揚(yáng)<15度時(shí)的特征;當(dāng)設(shè)置的狀態(tài)信息下的表情狀態(tài)信息為憤怒狀態(tài),且無對應(yīng)的行為狀態(tài)信息時(shí),所分配的圖像特征B可為面部扭曲時(shí)的特征;當(dāng)設(shè)置的狀態(tài)信息下的表情狀態(tài)信息為傷悲狀態(tài),且行為狀態(tài)信息為吃飯狀態(tài)時(shí),所分配的圖像特征C可為眉頭緊鎖時(shí)的特征;當(dāng)設(shè)置的狀態(tài)信息下的表情狀態(tài)信息為快樂狀態(tài),且行為狀態(tài)信息為奔跑狀態(tài)時(shí),所分配的圖像特征D可以具體包括一個人在奔跑,且張嘴幅度>1厘米時(shí)的特征。步驟S202,設(shè)置與所述各狀態(tài)信息分別對應(yīng)的文本信息,并將所述各狀態(tài)信息和各文本信息之間的映射關(guān)系添加至所述映射關(guān)系表中;其中,所述預(yù)設(shè)的映射關(guān)系表中包含:上述步驟S201中的各種狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系;進(jìn)一步地,所述映射關(guān)系表中還包括:所述各狀態(tài)信息和各文本信息之間的映射關(guān)系。例如,以狀態(tài)信息為快樂狀態(tài)為例,其對應(yīng)的文本信息可以為“哈哈哈哈”,也可以是“心情美的像過年一樣”。步驟S203,將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫;步驟S204,接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;具體地,多媒體數(shù)據(jù)處理裝置接收用戶在當(dāng)前圖片數(shù)據(jù)對應(yīng)的顯示區(qū)域中執(zhí)行的對所述當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中人和/或物的圖像分布面積,并根據(jù)所述分布面積確定所述當(dāng)前圖片數(shù)據(jù)中人或物的優(yōu)先級,并將優(yōu)先級最高的人或物對應(yīng)的圖像確定為所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;其中,所述多媒體數(shù)據(jù)處理裝置可以包括:智能手機(jī)、移動互聯(lián)網(wǎng)設(shè)備、可穿戴設(shè)備(例如智能手表(如iwatch等)、智能手環(huán))或其他可安裝即時(shí)通訊應(yīng)用客戶端的終端設(shè)備;其中,所述編輯指令的執(zhí)行包括但不限于:按壓操作、雙擊操作或者滑屏操作等各類型觸摸觸控屏的操作。通常,在具有觸控屏功能的終端中,其觸控屏的結(jié)構(gòu)包括至少三層:屏幕玻璃層、觸控面板層和顯示面板層。其中屏幕玻璃層為保護(hù)層,觸控面板層用于感知用戶的觸控操作,顯示面板層用于顯示圖像。比如,以圖片D中陽光下的4個人為例,對于圖片D而言,當(dāng)該圖片D對于的顯示區(qū)域中接收到用戶對所述當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),可根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中從左往右的人臉輪廓線和每個人的分布面積,具體地,請參見表2給出的圖像特征情況表;特征分類特征A特征B特征C特征D人臉輪廓線方臉圓臉橢圓臉三角臉分布面積1/62/61/61/6表2如上述表2所示的圖像特征情況表可知,陽光下的4個人分別對應(yīng)的特征為特征A,特征B,特征C,和特征D,在該圖片D中,具有特征A的人臉輪廓線為方臉,在圖片D中的分布面積達(dá)1/6;而具有特征B的人的人臉輪廓線為圓臉,在圖片D中的分布面積達(dá)2/6;具有特征C的人臉輪廓線為橢圓臉,在圖片D中的分布面積達(dá)1/6;具有特征D的人臉輪廓線為三角臉,在圖片D中的分布面積達(dá)1/6;于是可按照4個人在圖片D中的分布面積的大小確定目標(biāo)物體圖像為具有特征B的人對應(yīng)的圖像。步驟S205,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;具體地,所述多媒體數(shù)據(jù)處理裝置可在預(yù)設(shè)的映射關(guān)系表中查找與所述目標(biāo)物體圖像(所述目標(biāo)物體圖像包括唯一一個目標(biāo)物體)對應(yīng)的圖像特征相關(guān)聯(lián)的目標(biāo)預(yù)設(shè)圖像特征,并將所述目標(biāo)預(yù)設(shè)圖像特征對應(yīng)的狀態(tài)信息確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;其中,所述表情狀態(tài)信息包括:欣喜、憤怒、悲哀、快樂中的一種或多種情感狀態(tài);其中,所述行為狀態(tài)包括:睡覺、吃飯、唱歌和表演;其中,所述預(yù)設(shè)的映射關(guān)系表中包含:各種狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系;進(jìn)一步地,所述映射關(guān)系表中還包括:所述各狀態(tài)信息和各文本信息之間的映射關(guān)系。步驟S206,篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù);具體地,所述多媒體數(shù)據(jù)處理裝置可用于檢測當(dāng)前網(wǎng)絡(luò)狀態(tài),并在檢測到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),可從所述本地文本數(shù)據(jù)庫中獲取預(yù)設(shè)的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第一文本信息,并將所述第一文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第一文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第一文本信息的融合圖片數(shù)據(jù)??蛇x地,當(dāng)用戶感覺在所述本地文本數(shù)據(jù)庫中篩選出的所述第一文本信息并非是用戶想要的文本信息時(shí),所述多媒體數(shù)據(jù)處理裝置可接收用戶的設(shè)置指令,并根據(jù)所述設(shè)置指令將所述當(dāng)前網(wǎng)絡(luò)狀態(tài)對應(yīng)的網(wǎng)絡(luò)未連接狀態(tài)調(diào)整為網(wǎng)絡(luò)連接狀態(tài),并可獲取所述云端文本數(shù)據(jù)庫中的映射關(guān)系表,并可在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第二文本信息,以生成新的第一文本信息,以使所述第一文本信息和所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合。由此可見,所述多媒體數(shù)據(jù)處理裝置首先設(shè)置多種狀態(tài)信息,并為各狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,并將各狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系添加至預(yù)設(shè)的映射關(guān)系表中;其次,設(shè)置與所述各狀態(tài)信息分別對應(yīng)的文本信息,并將所述各狀態(tài)信息和各文本信息之間的映射關(guān)系添加至所述映射關(guān)系表中;緊接著,將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫;隨后,接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;然后,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;最后,篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置可根據(jù)用戶需求預(yù)先設(shè)置多種狀態(tài)信息對應(yīng)的圖像特征和文本信息,并在接收到用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并根據(jù)確定的狀態(tài)信息篩選出與所述狀態(tài)信息相匹配的文本信息,并生成包含文本信息的融合圖片數(shù)據(jù),以提供一種多媒體數(shù)據(jù)的制作方法,并可根據(jù)用戶需求豐富多媒體數(shù)據(jù)的顯示效果。進(jìn)一步地,請參見圖3,是本發(fā)明實(shí)施例提供的又一種多媒體數(shù)據(jù)處理方法的流程示意圖。如圖3所示,所述多媒體數(shù)據(jù)處理方法至少包括:步驟S301,設(shè)置映射關(guān)系表,并將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫;其中,所述映射關(guān)系表中包括設(shè)置的多種狀態(tài)信息和與所述多種狀態(tài)信息對應(yīng)的文本信息;其中,所述步驟S301的具體實(shí)施方式可參見上述圖2所對應(yīng)實(shí)施例中步驟S201-步驟S203,這里不再進(jìn)行贅述。步驟S302,接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;比如,可選地,仍以上述圖2所對應(yīng)實(shí)施例中表2給出的例子為例,所述多媒體數(shù)據(jù)處理裝置還可所述當(dāng)前圖片數(shù)據(jù)中四個人的圖像作為目標(biāo)物體圖像,并掃描所述當(dāng)前數(shù)據(jù)圖片中四個人的圖像特征(特征A,特征B,特征C,特征D)。步驟S303,在預(yù)設(shè)的映射關(guān)系表中查找與所述圖像特征相關(guān)聯(lián)的至少一種預(yù)設(shè)圖像特征;比如,以步驟S301中給出的例子為例,掃描到的目標(biāo)物體圖像(該目標(biāo)物體圖像包括4個人的圖像)對應(yīng)的圖像特征包括特征A,特征B,特征C,特征D,由于這4個人的特征(即特征A,特征B,特征C,特征D)均不相同,故而可在預(yù)設(shè)的映射關(guān)系表中分別查找與特征A、特征B、特征C、特征D分別對應(yīng)的預(yù)設(shè)圖像特征。例如,具有特征A的人對應(yīng)的圖像特征為嘴角上揚(yáng)5度,則可對應(yīng)的在映射關(guān)系表中查找到與特征A對應(yīng)的預(yù)設(shè)圖像特征可以為開心類型圖像特征;同理可得,也可分別在映射關(guān)系表中查找到所述當(dāng)前圖片數(shù)據(jù)中剩下三個人對應(yīng)的目標(biāo)圖像特征(比如,特征B為嘴角上揚(yáng)2度,特征C為嘴角上揚(yáng)4度,特征D為嘴角上揚(yáng)7度)的預(yù)設(shè)圖像特征。步驟S304,根據(jù)預(yù)設(shè)的選擇規(guī)則在查找到的所述至少一種預(yù)設(shè)圖像特征中選擇目標(biāo)預(yù)設(shè)圖像特征,并將所述目標(biāo)預(yù)設(shè)圖像特征對應(yīng)的狀態(tài)信息確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;其中,預(yù)設(shè)的選擇規(guī)則包括圖像特征對應(yīng)的分布面積大小和所述圖像特征對應(yīng)的表情優(yōu)先級。例如,以用戶A在游樂場游玩,且抓拍到的當(dāng)前圖片數(shù)據(jù)中具有4個不同狀態(tài)信息的圖片為例,可根據(jù)上述步驟S303的具體執(zhí)行方式對應(yīng)的獲得這4個人分別對應(yīng)的預(yù)設(shè)圖像特征,即可在預(yù)設(shè)的映射關(guān)系表中查找到與該圖片相關(guān)聯(lián)的4種預(yù)設(shè)圖像特征對應(yīng)的四種不同的表情狀態(tài)信息(一個微笑,一個大笑,一個興奮,一個驚恐),于是,所述多媒體數(shù)據(jù)處理裝置則可根據(jù)表情的優(yōu)先級情況(興奮>微笑>大笑>驚恐),將該圖片中的興奮確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息。步驟S305,檢測當(dāng)前網(wǎng)絡(luò)狀態(tài);其中,所述當(dāng)前網(wǎng)絡(luò)狀態(tài)包括網(wǎng)絡(luò)未連接狀態(tài)和網(wǎng)絡(luò)連接狀態(tài),其中,當(dāng)檢查到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),則可進(jìn)一步執(zhí)行步驟S306-步驟S307;可選地,在執(zhí)行完步驟S305之后,還可進(jìn)一步執(zhí)行步驟S308-步驟S311。步驟S306,當(dāng)檢測到當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),獲取所述本地文本數(shù)據(jù)庫中預(yù)設(shè)的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第一文本信息。步驟S307,將所述第一文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第一文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第一文本信息的融合圖片數(shù)據(jù)。步驟S308,當(dāng)檢測到當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)連接狀態(tài)時(shí),獲取所述云端文本數(shù)據(jù)庫中的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第二文本信息。步驟S309,判斷所述第二文本信息對應(yīng)的出現(xiàn)頻率和點(diǎn)擊率是否均滿足預(yù)設(shè)的融合條件。步驟S310,若判斷為滿足所述融合條件,則將所述第二文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第二文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第二文本信息的融合圖片數(shù)據(jù)。步驟S311,若判斷為不滿足所述融合條件,則顯示文本輸入界面,并在所述文本輸入界面中接收到用戶輸入的第三文本信息時(shí),將所述第三文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第三文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第三文本信息的融合圖片數(shù)據(jù)。比如,當(dāng)在檢測到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)連接狀態(tài)時(shí),所述多媒體數(shù)據(jù)處理裝置則可根據(jù)所述云端中的映射關(guān)系表查找到與所述表情信息(失望)和行為信息(吃飯)具有映射關(guān)系的第二文本信息(好難吃),此時(shí),所述多媒體數(shù)據(jù)處理裝置將判斷所述第二文本信息對應(yīng)的出現(xiàn)頻率和點(diǎn)擊率是否滿足融合條件(比如,點(diǎn)擊率大于60%,出現(xiàn)頻率大于70%),若所述第二文本信息對應(yīng)的點(diǎn)擊率為50%和/或出現(xiàn)頻率50%,則認(rèn)為所述第二文本信息不滿足所述融合條件,則顯示所述文本輸入界面,并接收用戶在所述文本輸入界面中輸入的第三文本信息(太可怕的黑暗料理),并將所述第三文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,以生成攜帶所述第三文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置首先設(shè)置多種狀態(tài)信息,并為各狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,并將各狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系添加至預(yù)設(shè)的映射關(guān)系表中;其次,設(shè)置與所述各狀態(tài)信息分別對應(yīng)的文本信息,并將所述各狀態(tài)信息和各文本信息之間的映射關(guān)系添加至所述映射關(guān)系表中;緊接著,將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫;隨后,接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;然后,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;最后,檢測當(dāng)前網(wǎng)絡(luò)狀態(tài),并根據(jù)所述當(dāng)前網(wǎng)絡(luò)狀態(tài)篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置可根據(jù)用戶需求預(yù)先設(shè)置多種狀態(tài)信息對應(yīng)的圖像特征和文本信息,并在接收到用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并在相應(yīng)的網(wǎng)絡(luò)狀態(tài)下篩選出與所述狀態(tài)信息相匹配的文本信息,以生成包含相應(yīng)文本信息的融合圖片數(shù)據(jù),以貼合用戶對多媒體數(shù)據(jù)的制作要求,進(jìn)而可在制作多媒體數(shù)據(jù)的同時(shí),一并實(shí)現(xiàn)快捷的圖文搭配,以節(jié)約多媒體數(shù)據(jù)制作的時(shí)間,并豐富多媒體數(shù)據(jù)的顯示效果。進(jìn)一步地,請參見圖4,是本發(fā)明實(shí)施例提供的一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。如圖4所示,所述多媒體數(shù)據(jù)處理裝置1至少包括:提取掃描模塊10,狀態(tài)確定模塊20和圖文融合模塊30;所述提取掃描模塊10,用于接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;具體地,所述多媒體數(shù)據(jù)處理裝置1中的所述提取掃描模塊10,具體用于接收用戶在當(dāng)前圖片數(shù)據(jù)對應(yīng)的顯示區(qū)域中執(zhí)行的對所述當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中人和/或物對應(yīng)的圖像的分布面積,并根據(jù)所述分布面積確定所述當(dāng)前圖片數(shù)據(jù)中人或物的優(yōu)先級,并將優(yōu)先級最高的人或物對應(yīng)的圖像確定為所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;其中,所述多媒體數(shù)據(jù)處理裝置1可以包括:智能手機(jī)、移動互聯(lián)網(wǎng)設(shè)備、可穿戴設(shè)備(例如智能手表(如iwatch等)、智能手環(huán))或其他可安裝即時(shí)通訊應(yīng)用客戶端的終端設(shè)備;其中,所述編輯指令的執(zhí)行包括但不限于:按壓操作、雙擊操作或者滑屏操作等各類型觸摸觸控屏的操作。通常,在具有觸控屏功能的終端中,其觸控屏的結(jié)構(gòu)包括至少三層:屏幕玻璃層、觸控面板層和顯示面板層。其中屏幕玻璃層為保護(hù)層,觸控面板層用于感知用戶的觸控操作,顯示面板層用于顯示圖像。所述狀態(tài)確定模塊20,用于根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;具體地,所述狀態(tài)確定模塊20,可用于在預(yù)設(shè)的映射關(guān)系表中查找與所述圖像特征相關(guān)聯(lián)的至少一種預(yù)設(shè)圖像特征,并可根據(jù)預(yù)設(shè)的選擇規(guī)則在查找到的所述至少一種預(yù)設(shè)圖像特征中選擇目標(biāo)預(yù)設(shè)圖像特征,并將所述目標(biāo)預(yù)設(shè)圖像特征對應(yīng)的狀態(tài)信息確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;其中,所述表情狀態(tài)信息包括:欣喜、憤怒、悲哀、快樂中的一種或多種情感狀態(tài);其中,所述行為狀態(tài)包括:睡覺、吃飯、唱歌和表演;其中,所述預(yù)設(shè)的映射關(guān)系表中包含:各種狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系;進(jìn)一步地,所述映射關(guān)系表中還包括:所述各狀態(tài)信息和各文本信息之間的映射關(guān)系。所述圖文融合模塊30,用于篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù);具體地,所述圖文融合模塊30,可用于檢測當(dāng)前網(wǎng)絡(luò)狀態(tài),并在檢測到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),可從所述本地文本數(shù)據(jù)庫中獲取預(yù)設(shè)的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第一文本信息,并將所述第一文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第一文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第一文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置1首先接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;然后,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;最后,篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置1可在接收到用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并根據(jù)確定的狀態(tài)信息篩選出與所述狀態(tài)信息相匹配的文本信息,并生成包含文本信息的融合圖片數(shù)據(jù),以對多媒體數(shù)據(jù)提供一種快捷的圖文搭配方法,并可根據(jù)用戶需求豐富多媒體數(shù)據(jù)的顯示效果。進(jìn)一步地,請參見圖5,是本發(fā)明實(shí)施例提供的另一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。如圖5所示,所述多媒體數(shù)據(jù)處理裝置1包含上述圖4所對應(yīng)實(shí)施例中的所述提取掃描模塊10,狀態(tài)確定模塊20和圖文融合模塊30;進(jìn)一步地,所述多媒體數(shù)據(jù)處理裝置1還包括:狀態(tài)設(shè)置模塊40,文本設(shè)置模塊50和存儲模塊60;所述狀態(tài)設(shè)置模塊40,用于設(shè)置多種狀態(tài)信息,并為各狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,并將各狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系添加至預(yù)設(shè)的映射關(guān)系表中;其中,預(yù)設(shè)圖像特征可用于對圖像中目標(biāo)物體對應(yīng)的目標(biāo)特征的進(jìn)行圖像識別,且目標(biāo)物體對應(yīng)的目標(biāo)特征代表了目標(biāo)區(qū)域的特性,在進(jìn)行圖像識別的過程中,往往借助于直觀性特征,如圖像的邊沿、輪廓、紋理和區(qū)域等進(jìn)行圖像特征的掃描,這些都屬于圖像灰度的直觀特征,它們的物理意義明確,可通過相應(yīng)的提取算法進(jìn)行特征提取。具體地,請參見上述圖2所對應(yīng)實(shí)施例中對表1給出的部分映射關(guān)系表的描述,這里不再進(jìn)行一一贅述。所述文本設(shè)置模塊50,用于設(shè)置與所述各狀態(tài)信息分別對應(yīng)的文本信息,并將所述各狀態(tài)信息和各文本信息之間的映射關(guān)系添加至所述映射關(guān)系表中。所述存儲模塊60,用于將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫。進(jìn)一步地,請參見圖6,是本發(fā)明實(shí)施例提供的一種狀態(tài)確定模塊的結(jié)構(gòu)示意圖。如圖6所示,所述狀態(tài)確定模塊20包括:特征查找單元201和選擇確定單元202;所述特征查找單元201,用于在預(yù)設(shè)的映射關(guān)系表中查找與所述圖像特征相關(guān)聯(lián)的至少一種預(yù)設(shè)圖像特征;所述選擇確定單元202,用于根據(jù)預(yù)設(shè)的選擇規(guī)則在查找到的所述至少一種預(yù)設(shè)圖像特征中選擇目標(biāo)預(yù)設(shè)圖像特征,并將所述目標(biāo)預(yù)設(shè)圖像特征對應(yīng)的狀態(tài)信息確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;其中,預(yù)設(shè)的選擇規(guī)則包括圖像特征對應(yīng)的分布面積大小和所述圖像特征對應(yīng)的表情優(yōu)先級。進(jìn)一步地,請參見圖7,是本發(fā)明實(shí)施例提供的一種圖文融合模塊的結(jié)構(gòu)示意圖。如圖7所示,所述圖文融合模塊30包括:網(wǎng)絡(luò)檢測單元301,本地篩選單元302,本地融合單元303,云端篩選單元304,條件判斷單元305,第一融合單元306和第二融合單元307;所述網(wǎng)絡(luò)檢測單元301,用于檢測當(dāng)前網(wǎng)絡(luò)狀態(tài);其中,所述當(dāng)前網(wǎng)絡(luò)狀態(tài)包括網(wǎng)絡(luò)未連接狀態(tài)和網(wǎng)絡(luò)連接狀態(tài),其中,當(dāng)檢查到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),所述多媒體數(shù)據(jù)處理裝置1的具體實(shí)現(xiàn)方式可進(jìn)一步執(zhí)行上述圖3所對應(yīng)實(shí)施例中對步驟S306-步驟S307的描述;可選地,所述多媒體數(shù)據(jù)處理裝置1的具體實(shí)現(xiàn)方式還可進(jìn)一步參見上述圖3所對應(yīng)實(shí)施例中對步驟S308-步驟S311的描述;這里不再進(jìn)行贅述。所述本地篩選單元302,用于當(dāng)檢測到當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),獲取所述本地文本數(shù)據(jù)庫中預(yù)設(shè)的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第一文本信息;所述本地融合單元303,用于將所述第一文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第一文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第一文本信息的融合圖片數(shù)據(jù)??蛇x地,所述云端篩選單元304,用于當(dāng)檢測到當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)連接狀態(tài)時(shí),獲取所述云端文本數(shù)據(jù)庫中的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第二文本信息;所述條件判斷單元305,用于判斷所述第二文本信息對應(yīng)的出現(xiàn)頻率和點(diǎn)擊率是否均滿足預(yù)設(shè)的融合條件;所述第一融合單元306,用于若判斷為滿足所述融合條件,則將所述第二文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第二文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第二文本信息的融合圖片數(shù)據(jù);所述第二融合單元307,用于若判斷為不滿足所述融合條件,則顯示文本輸入界面,并在所述文本輸入界面中接收到用戶輸入的第三文本信息時(shí),將所述第三文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第三文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第三文本信息的融合圖片數(shù)據(jù)。比如,當(dāng)在檢測到所述當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)連接狀態(tài)時(shí),所述多媒體數(shù)據(jù)處理裝置則可根據(jù)所述云端中的映射關(guān)系表查找到與所述表情信息(失望)和行為信息(吃飯)具有映射關(guān)系的第二文本信息(好難吃),此時(shí),所述多媒體數(shù)據(jù)處理裝置將判斷所述第二文本信息對應(yīng)的出現(xiàn)頻率和點(diǎn)擊率是否滿足融合條件(比如,點(diǎn)擊率大于60%,出現(xiàn)頻率大于70%),可選地,當(dāng)所述第二文本信息對應(yīng)的點(diǎn)擊率為70%和/或出現(xiàn)頻率80%時(shí),認(rèn)為所述第二文本信息滿足所述融合條件,并將所述第二文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,以生成攜帶所述第二文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置首先設(shè)置多種狀態(tài)信息,并為各狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,并將各狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系添加至預(yù)設(shè)的映射關(guān)系表中;其次,設(shè)置與所述各狀態(tài)信息分別對應(yīng)的文本信息,并將所述各狀態(tài)信息和各文本信息之間的映射關(guān)系添加至所述映射關(guān)系表中;緊接著,將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫;隨后,接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;然后,根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;最后,檢測當(dāng)前網(wǎng)絡(luò)狀態(tài),并根據(jù)所述當(dāng)前網(wǎng)絡(luò)狀態(tài)篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置可根據(jù)用戶需求預(yù)先設(shè)置多種狀態(tài)信息對應(yīng)的圖像特征和文本信息,并在接收到用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并在相應(yīng)的網(wǎng)絡(luò)狀態(tài)下篩選出與所述狀態(tài)信息相匹配的文本信息,以生成包含相應(yīng)文本信息的融合圖片數(shù)據(jù),以貼合用戶對多媒體數(shù)據(jù)的制作要求,進(jìn)而可對多媒體數(shù)據(jù)提供不同搜索路徑下的圖文搭配的方法,以豐富多媒體數(shù)據(jù)的顯示效果。進(jìn)一步地,再請參見圖8,是本發(fā)明實(shí)施例提供的又一種多媒體數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖,如圖8所示,所述多媒體數(shù)據(jù)處理裝置1000可以包括:至少一個處理器1001,例如CPU,至少一個網(wǎng)絡(luò)接口1004,用戶接口1003,存儲器1005,至少一個通信總線1002。其中,通信總線1002用于實(shí)現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包括顯示屏(Display)、鍵盤(Keyboard),可選用戶接口1003還可以包括標(biāo)準(zhǔn)的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如WI-FI接口)。存儲器1005可以是高速RAM存儲器,也可以是非不穩(wěn)定的存儲器(non-volatilememory),例如至少一個磁盤存儲器。存儲器1005可選的還可以是至少一個位于遠(yuǎn)離前述處理器1001的存儲裝置。如圖8所示,作為一種計(jì)算機(jī)存儲介質(zhì)的存儲器1005中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及設(shè)備控制應(yīng)用程序。在圖8所示的多媒體數(shù)據(jù)處理裝置1000中,用戶接口1003主要用于為用戶提供輸入的接口,獲取用戶輸出的數(shù)據(jù);而處理器1001可以用于調(diào)用存儲器1005中存儲的設(shè)備控制應(yīng)用程序,以實(shí)現(xiàn):接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。在一個實(shí)施例中,所述處理器1001在執(zhí)行所述接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令之前,還執(zhí)行以下步驟:設(shè)置多種狀態(tài)信息,并為各狀態(tài)信息分別配置對應(yīng)的預(yù)設(shè)圖像特征,并將各狀態(tài)信息和各預(yù)設(shè)圖像特征之間的映射關(guān)系添加至預(yù)設(shè)的映射關(guān)系表中;設(shè)置與所述各狀態(tài)信息分別對應(yīng)的文本信息,并將所述各狀態(tài)信息和各文本信息之間的映射關(guān)系添加至所述映射關(guān)系表中;將所述映射關(guān)系表存儲至本地文本數(shù)據(jù)庫,或?qū)⑺鲇成潢P(guān)系表上傳至云端文本數(shù)據(jù)庫。在一個實(shí)施例中,所述處理器1001在執(zhí)行所述根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息時(shí),具體執(zhí)行以下步驟:在預(yù)設(shè)的映射關(guān)系表中查找與所述圖像特征相關(guān)聯(lián)的至少一種預(yù)設(shè)圖像特征;根據(jù)預(yù)設(shè)的選擇規(guī)則在查找到的所述至少一種預(yù)設(shè)圖像特征中選擇目標(biāo)預(yù)設(shè)圖像特征,并將所述目標(biāo)預(yù)設(shè)圖像特征對應(yīng)的狀態(tài)信息確定為所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息。在一個實(shí)施例中,所述處理器1001在執(zhí)行所述篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)時(shí),具體執(zhí)行以下步驟:檢測當(dāng)前網(wǎng)絡(luò)狀態(tài);當(dāng)檢測到當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)未連接狀態(tài)時(shí),獲取所述本地文本數(shù)據(jù)庫中預(yù)設(shè)的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第一文本信息;將所述第一文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第一文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第一文本信息的融合圖片數(shù)據(jù)。在一個實(shí)施例中,所述處理器1001,還執(zhí)行以下步驟:當(dāng)檢測到當(dāng)前網(wǎng)絡(luò)狀態(tài)為網(wǎng)絡(luò)連接狀態(tài)時(shí),獲取所述云端文本數(shù)據(jù)庫中的映射關(guān)系表,并在所述映射關(guān)系表中篩選與所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的所述表情信息和行為信息具有映射關(guān)系的第二文本信息;判斷所述第二文本信息對應(yīng)的出現(xiàn)頻率和點(diǎn)擊率是否均滿足預(yù)設(shè)的融合條件;若判斷為滿足所述融合條件,則將所述第二文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第二文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第二文本信息的融合圖片數(shù)據(jù);若判斷為不滿足所述融合條件,則顯示文本輸入界面,并在所述文本輸入界面中接收到用戶輸入的第三文本信息時(shí),將所述第三文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成攜帶所述第三文本信息的融合圖片數(shù)據(jù),并控制屏幕顯示所述攜帶所述第三文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置1000可用于接收用戶對當(dāng)前圖片數(shù)據(jù)的編輯指令,并根據(jù)所述編輯指令提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并掃描所述目標(biāo)物體圖像的圖像特征;根據(jù)所述圖像特征確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息;所述狀態(tài)信息包括表情狀態(tài)信息和行為狀態(tài)信息;篩選與所述表情狀態(tài)信息和行為狀態(tài)信息相匹配的文本信息,并將所述文本信息與所述當(dāng)前圖片數(shù)據(jù)進(jìn)行數(shù)據(jù)融合,生成包含文本信息的融合圖片數(shù)據(jù)。由此可見,所述多媒體數(shù)據(jù)處理裝置可接受到用戶對當(dāng)前圖片書記的編輯指令時(shí),提取所述當(dāng)前圖片數(shù)據(jù)中的目標(biāo)物體圖像,并在掃描到所述目標(biāo)物體圖像的圖像特征時(shí),確定所述當(dāng)前圖片數(shù)據(jù)對應(yīng)的狀態(tài)信息,并根據(jù)檢測到的當(dāng)前網(wǎng)絡(luò)狀態(tài)進(jìn)行不同搜索路徑下與所述狀態(tài)信息相匹配的文本信息的篩選,并生成包含相應(yīng)文本信息的融合圖片數(shù)據(jù),以對多媒體數(shù)據(jù)提供一種快捷的圖文搭配方法,并可根據(jù)用戶需求豐富表情包的顯示效果。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計(jì)算機(jī)可讀取存儲介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-OnlyMemory,ROM)或隨機(jī)存儲記憶體(RandomAccessMemory,RAM)等。以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。當(dāng)前第1頁1 2 3