專利名稱:具備語音和視頻多模態(tài)交互的數(shù)字化網(wǎng)絡(luò)媒體終端的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型屬于數(shù)字多媒體技術(shù)領(lǐng)域,尤其是一種可進(jìn)行語音交互、視頻交互、無 線聯(lián)網(wǎng)的數(shù)字化多媒體終端。
背景技術(shù):
信息社會的快速發(fā)展,人們獲取信息的途徑和方式正在發(fā)生重大轉(zhuǎn)變,廣告模式 隨之也在發(fā)生翻天覆地的變化,之前的報(bào)紙、廣播、電視等單向傳播的傳統(tǒng)媒體正在逐步被 人們冷落,而具備交互性能的互聯(lián)網(wǎng)廣告等新媒體廣告正在被廣泛采用,讓受眾參與其中、 提供更加豐富的信息,是互聯(lián)網(wǎng)廣告成功的標(biāo)志之一?;ヂ?lián)網(wǎng)只是人們生活圈子的一小部分,在互聯(lián)網(wǎng)之外,還存在眾多的廣告模式,如 展板、廣告牌、數(shù)字媒體廣告網(wǎng)絡(luò)等等,但這些模式無一例外還是單向的展示和播放模式, 受眾只能被動(dòng)的觀看,無法參與其中,獲取的信息量也十分有限,廣告的效果和吸引力比較 差。如何提升傳統(tǒng)廣告的黏性,增大其信息量,交互性能成為傳統(tǒng)廣告必須要面對和解決的 關(guān)鍵問題。語音是人類溝通和獲取信息最自然最便捷的方式,語音交互將是繼圖形交互模式 之后人機(jī)交互模式上具有突破性意義的變革。將語音交互技術(shù)應(yīng)用到廣告媒體終端中,說 指令即可實(shí)現(xiàn)與廣告媒體終端的互動(dòng),實(shí)現(xiàn)語音搜索、語音控制等功能,將提供一種全新體 驗(yàn)的廣告交互模式。通過視頻攝像頭的視頻分析,讓廣告媒體終端能夠感知用戶的肢體動(dòng)作,并產(chǎn)生 相應(yīng)的操作,將為廣告媒體終端提供一種直觀的、所見即所得的視頻交互模式,使得用戶可 以自主控制廣告,選擇關(guān)注點(diǎn)。針對傳統(tǒng)的廣告媒體終端僅僅是單向廣播方式的多媒體播放,無法與廣告受眾交 互的問題,本實(shí)用新型實(shí)現(xiàn)了一種可進(jìn)行語音交互、視頻交互、無線聯(lián)網(wǎng)的數(shù)字化多媒體終 端,受眾可通過語音或視頻與終端進(jìn)行交互,參與到廣告中,獲取更深層次的廣告信息,該 終端可廣泛應(yīng)用于單獨(dú)的廣告、展示、展覽,或組成數(shù)字媒體廣告網(wǎng)絡(luò)。
發(fā)明內(nèi)容針對傳統(tǒng)的廣告媒體終端僅僅是單向廣播方式的多媒體播放,無法與廣告受眾交 互的問題,本實(shí)用新型實(shí)現(xiàn)了一種可進(jìn)行語音交互、視頻交互、無線聯(lián)網(wǎng)的數(shù)字化多媒體終 端。本實(shí)用新型實(shí)現(xiàn)的終端包括語音識別觸發(fā)按鍵、語音采樣麥克風(fēng)、視頻采集攝像 頭、液晶屏、核心電路板、喇叭、電源開關(guān)、外殼;其中,語音識別觸發(fā)按鍵,位于外殼的正面, 液晶屏的下邊,點(diǎn)觸該按鍵開啟語音采樣麥克風(fēng),與終端進(jìn)行語音交互;語音采樣麥克風(fēng), 與核心電路板連接,位于外殼的正面,液晶屏的下邊,進(jìn)行語音采樣;視頻采集攝像頭,與 核心電路板連接,位于外殼的正面,液晶屏的上邊,進(jìn)行視頻采集;液晶屏,位于外殼正面, 與核心電路板連接,顯示圖形界面,可采用非觸摸液晶屏或觸摸液晶屏;觸摸液晶屏還可為終端提供觸摸圖形界面;核心電路板,包括語音識別觸發(fā)按鍵開關(guān)、處理器單元、存儲單 元、Wi-Fi單元、移動(dòng)通信單元、電源管理單元,其中語音識別觸發(fā)按鍵開關(guān)位于語音識別 觸發(fā)按鍵的后面,緊貼語音識別觸發(fā)按鍵,采用輕觸開關(guān)或按鈕開關(guān),將語音識別觸發(fā)按鍵 的操作轉(zhuǎn)化為電開關(guān)信號;處理器單元由嵌入式CPU及外圍電路溝通,嵌入式CPU采用基 于MIPS架構(gòu)、ARM架構(gòu)或Intel Nehalem架構(gòu)的CPU ;存儲單元采用FLASH Memory或固態(tài) 硬盤;Wi-Fi單元由Wi-FI芯片及外圍電路組成,支持802. 11,802. Ila,802. lib,802. llg、 802. Iln ;移動(dòng)通信單元由3G通信模塊組成,支持TD-SCDMA、⑶MA2000、或W⑶MA,提供3G 移動(dòng)通信信道;電源管理單元由電源管理芯片和人體探測裝置組成,終端前長時(shí)間無人,終 端將自動(dòng)進(jìn)入休眠狀態(tài),有人時(shí)喚醒;喇叭,嵌入在外殼內(nèi)部,位于液晶屏周圍,用于播放聲 音;電源開關(guān),位于外殼側(cè)面,可開啟或關(guān)閉終端;外殼,將各個(gè)部件整合為一個(gè)整體,外殼 的外在體現(xiàn)包括1個(gè)語音識別觸發(fā)按鍵、1組麥克風(fēng)孔、1個(gè)視頻采集攝像頭、1個(gè)液晶屏、1 組喇叭孔、1個(gè)電源接口和1個(gè)電源開關(guān)。
圖1為數(shù)字化網(wǎng)絡(luò)媒體終端的外觀視圖圖2為數(shù)字化網(wǎng)絡(luò)媒體終端的核心部件視圖
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例對本實(shí)用新型做進(jìn)一步說明。圖1為數(shù)字化網(wǎng)絡(luò)媒體終端的外觀視圖,包括語音識別觸發(fā)按鍵1、麥克風(fēng)孔801、 視頻采集攝像頭3、液晶屏4、喇叭孔802、電源開關(guān)7、外殼8,其中語音識別觸發(fā)按鍵1位 于外殼8的正面,在液晶屏4的下邊,用于觸發(fā)終端的語音識別功能;麥克風(fēng)孔801是外殼 8表面的開孔,位于語音采用麥克風(fēng)2的前面,用于透過聲音;視頻采集攝像頭3位于外殼 8的正面,在液晶屏4的上邊,可采集視頻;液晶屏4位于外殼8的正面,通過線纜與其后面 的核心電路板5連接;喇叭孔802是外殼8表面的開孔,位于喇叭6的前面,用于透過聲音; 電源開關(guān)7,與核心電路板5中的電源管理單元506連接,位于外殼的側(cè)面,可開啟和關(guān)閉終 端的供電;外殼8將終端的各個(gè)部件整合為一個(gè)整體。圖2為數(shù)字化網(wǎng)絡(luò)媒體終端的核心部件視圖,包括語音采用麥克風(fēng)2、視頻采集攝 像頭3、核心電路板5、語音識別觸發(fā)按鍵開關(guān)501、處理器單元502、存儲單元503、Wi-Fi單 元504、移動(dòng)通信單元505、電源管理單元506、喇叭6、電源開關(guān)7,其中語音采用麥克風(fēng)2位 于外殼8上的麥克風(fēng)孔801的后面,可進(jìn)行語音采用;視頻采集攝像頭3,位于核心電路板 5的上部中間位置,用于采集視頻圖像;核心電路板5固定在外殼8內(nèi)部,由語音識別觸發(fā) 按鍵開關(guān)501、處理器單元502、存儲單元503、Wi-Fi單元504、移動(dòng)通信單元505、電源管理 單元506等組成,其中語音識別觸發(fā)按鍵開關(guān)501位于語音識別觸發(fā)按鍵1的后面,緊貼語 音識別觸發(fā)按鍵1,采用輕觸開關(guān)或按鈕開關(guān),將語音識別觸發(fā)按鍵的操作轉(zhuǎn)化為電開關(guān)信 號;處理器單元502由嵌入式CPU及外圍電路溝通,嵌入式CPU采用基于MIPS架構(gòu)、ARM架 構(gòu)或Intel Nehalem架構(gòu)的CPU ;存儲單元503采用FLASH Memory或固態(tài)硬盤;Wi-Fi單元 504由Wi-FI芯片及外圍電路組成;移動(dòng)通信單元505由3G通信模塊組成,提供3G移動(dòng)通 信信道;電源管理單元506由電源管理芯片和人體探測裝置組成,終端前長時(shí)間無人,終端將自動(dòng)進(jìn)入休眠狀態(tài),有人時(shí)自動(dòng)喚醒;喇叭6固定在外殼8上,位于喇叭孔802的后面,與 核心電路板5連接,用于播放聲音;電源開關(guān)7,固定在外殼8上,與核心電路板5中的電源 管理單元506連接,可開啟關(guān)閉終端。實(shí)施例本實(shí)施例實(shí)現(xiàn)了一種可進(jìn)行語音交互、視頻交互、無線聯(lián)網(wǎng)的數(shù)字化多媒體終端, 圖1為數(shù)字化網(wǎng)絡(luò)媒體終端的外觀視圖,圖2為數(shù)字化網(wǎng)絡(luò)媒體終端的核心部件視圖,該終 端由語音識別觸發(fā)按鍵1、語音采樣麥克風(fēng)2、視頻采集攝像頭3、液晶屏4、核心電路板5、喇 叭6、電源開關(guān)7、外殼8等部件組成;核心電路板5是終端的核心硬件平臺,包括語音識別 觸發(fā)按鍵開關(guān)501、處理器單元502、存儲單元503、Wi-Fi單元504、移動(dòng)通信單元505、電源 管理單元506等幾個(gè)關(guān)鍵功能單元模塊,其中Wi-Fi單元504和移動(dòng)通信單元505可為終 端提供Wi-Fi無線聯(lián)網(wǎng)和3G無線聯(lián)網(wǎng)的功能。該實(shí)施例終端實(shí)現(xiàn)的數(shù)字化網(wǎng)絡(luò)媒體終端具備語音和視頻多模態(tài)交互能力,受眾 可通過語音或視頻與終端進(jìn)行交互,參與到廣告中,獲取更深層次的廣告信息,可廣泛應(yīng)用 于單獨(dú)的廣告、展示、展覽,或組成數(shù)字媒體廣告網(wǎng)絡(luò)。
權(quán)利要求具備語音和視頻多模態(tài)交互的數(shù)字化網(wǎng)絡(luò)媒體終端,包括語音識別觸發(fā)按鍵、語音采樣麥克風(fēng)、視頻采集攝像頭、液晶屏、核心電路板、喇叭、電源開關(guān)、外殼,其特征在于語音識別觸發(fā)按鍵,位于外殼的正面,液晶屏的下邊,點(diǎn)觸該按鍵開啟語音采樣麥克風(fēng),與終端進(jìn)行語音交互;語音采樣麥克風(fēng),與核心電路板連接,位于外殼的正面,液晶屏的下邊,進(jìn)行語音采樣;視頻采集攝像頭,與核心電路板連接,位于外殼的正面,液晶屏的上邊,進(jìn)行視頻采集;液晶屏,位于外殼正面,與核心電路板連接,顯示圖形界面,可采用非觸摸液晶屏或觸摸液晶屏;觸摸液晶屏可為終端提供觸摸圖形界面;核心電路板,包括語音識別觸發(fā)按鍵開關(guān)、處理器單元、存儲單元、Wi Fi單元、移動(dòng)通信單元、電源管理單元;喇叭,嵌入在外殼內(nèi)部,位于液晶屏周圍,用于播放聲音;電源開關(guān),位于外殼側(cè)面,可開啟或關(guān)閉終端;外殼,將各個(gè)部件整合為一個(gè)整體,外殼的外在體現(xiàn)包括1個(gè)語音識別觸發(fā)按鍵、1組麥克風(fēng)孔、1個(gè)視頻采集攝像頭、1個(gè)液晶屏、1組喇叭孔、1個(gè)電源接口和1個(gè)電源開關(guān)。
2.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的語音識別觸發(fā)按鍵開關(guān) 位于語音識別觸發(fā)按鍵的后面,緊貼語音識別觸發(fā)按鍵,采用輕觸開關(guān)或按鈕開關(guān),將語音 識別觸發(fā)按鍵的操作轉(zhuǎn)化為電開關(guān)信號。
3.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的處理器單元由嵌入式CPU 及外圍電路溝通,嵌入式CPU采用基于MIPS架構(gòu)、ARM架構(gòu)或Intel Nehalem架構(gòu)的CPU。
4.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的存儲單元采用 FLASHMemory或固態(tài)硬盤。
5.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的Wi-Fi單元由Wi-FI芯片 及外圍電路組成,支持 802. 11,802. Ila,802. lib,802. Ilg,802. lln。
6.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的移動(dòng)通信單元由3G通信 模塊組成,支持TD-SCDMA、CDMA2000、或WCDMA,提供3G移動(dòng)通信信道。
7.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的電源管理單元由電源管 理芯片和人體探測裝置組成,終端前長時(shí)間無人,終端將自動(dòng)進(jìn)入休眠狀態(tài),有人時(shí)喚醒。
專利摘要一種可進(jìn)行語音交互、視頻交互、無線聯(lián)網(wǎng)的數(shù)字化多媒體終端,該終端包括語音識別觸發(fā)按鍵、語音采樣麥克風(fēng)、視頻采集攝像頭、液晶屏、核心電路板、喇叭、電源開關(guān)、外殼;語音識別觸發(fā)按鍵可開啟語音采樣麥克風(fēng),與終端進(jìn)行語音交互;視頻采集攝像頭將采集的視頻圖像傳送給核心電路板進(jìn)行處理,實(shí)現(xiàn)人與終端的視頻交互;該終端克服了傳統(tǒng)的廣告多媒體終端僅僅是單向廣播方式的多媒體播放,無法與廣告受眾交互的問題,實(shí)現(xiàn)了一種具備便捷的語音交互模式和視頻交互模式的數(shù)字化多媒體終端,受眾可通過語音或視頻與終端進(jìn)行交互,參與到廣告中,獲取更深層次的廣告信息,可廣泛應(yīng)用于單獨(dú)的廣告、展示、展覽,或組成數(shù)字媒體廣告網(wǎng)絡(luò)。
文檔編號H04M7/00GK201667671SQ20102010016
公開日2010年12月8日 申請日期2010年1月25日 優(yōu)先權(quán)日2010年1月25日
發(fā)明者孫敏霞 申請人:北京森博克智能科技有限公司