一種音頻控制裝置及方法
【專利摘要】一種音頻控制裝置及方法,該裝置包括:數(shù)據(jù)通訊模塊、中央處理器、語音合成芯片以及存儲(chǔ)模塊,該中央處理器電性連接于該數(shù)據(jù)通訊模塊、該語音合成芯片與該存儲(chǔ)模塊;該數(shù)據(jù)通訊模塊,用于獲取節(jié)目文件,該節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù);該中央處理器,用于將該節(jié)目文件緩存于該存儲(chǔ)模塊,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏上,同時(shí)將該文本數(shù)據(jù)發(fā)送給該語音合成芯片;該語音合成芯片,用于將該文本數(shù)據(jù)合成為語音信息,按照預(yù)設(shè)的播放控制參數(shù)在顯示該節(jié)目文本內(nèi)容的同時(shí)同步播放該語音信息。上述裝置及方法可實(shí)現(xiàn)聲文并茂的圖文實(shí)時(shí)同步播放。
【專利說明】一種音頻控制裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及媒體播放領(lǐng)域,尤其涉及一種音頻控制裝置及方法。
【背景技術(shù)】
[0002]隨著發(fā)光二極管(Lighting Emitting D1de,LED)顯示屏的快速發(fā)展,廣告商或者其他用戶對(duì)LED顯示屏已經(jīng)不再滿足單畫面的需求,對(duì)多媒體的需求也越來越大。如何將音頻與字幕整合在一起,提供更好地廣告服務(wù)是當(dāng)前亟需解決的問題。
[0003]現(xiàn)有技術(shù)中,基于LED顯示屏的音頻控制方式主要包括以下兩種:
[0004]方式一,通過計(jì)算機(jī)實(shí)時(shí)發(fā)送圖像與聲音,其原理框圖可如圖1所示。
[0005]圖1中LED屏顯示屏101連接聲音播放設(shè)備104,并加入音控集成電路(圖中未示出),由計(jì)算機(jī)103將待播放的內(nèi)容發(fā)送給LED顯示屏101,并同步將聲音發(fā)送給聲音播放設(shè)備104,該技術(shù)的關(guān)鍵是通過軟件控制PCB (Printed Circuit Board,印制電路板)電路板的音控集成電路,通過軟件發(fā)出聲音控制指令,發(fā)送給主控器102,以此來同步語音播報(bào)顯示屏信息。其中,LED顯示屏101包括屏體、電源,屏體包括PCB電路板和LED陣列,PCB電路板上集成音控集成電路,該部分同聲音播放設(shè)備104—起作用,實(shí)現(xiàn)外部語音文件的輸入及播放控制。主控器104主控器包括發(fā)送卡與接收卡,其中發(fā)送卡用于將DVI (DigitalVisual Interface,數(shù)字視頻接口)信號(hào)轉(zhuǎn)化成接收卡識(shí)別的數(shù)據(jù)信息,并通過網(wǎng)線發(fā)給接收卡,接收卡用于控制LED顯示屏101顯示信息。計(jì)算機(jī)103主要負(fù)責(zé)將圖像個(gè)聲音的生成。聲音播放設(shè)備104包括揚(yáng)聲器與功放電路,用于放大聲音信號(hào),并通過揚(yáng)聲器播放。
[0006]方式二,將視頻圖文同步壓縮混合顯示,其原理框圖可如圖2所示。
[0007]圖2所示的視頻圖文同步壓縮混合顯示控制裝置20包括:微控制器201、視頻字符疊加模塊202、視頻編碼器203、模擬開關(guān)204、音頻功放模塊205、視頻解碼器206以及視頻處理器207。該裝置實(shí)現(xiàn)了多媒體的處理、播放功能,并加入音頻功放,可以通過聲音設(shè)備30播放聲音。通過視頻圖文同步壓縮混合顯示控制裝置20內(nèi)置的視頻解碼器206將多媒體視頻信息解碼壓縮,然后將壓縮后的信息與文字信息進(jìn)行組合處理,并將編碼后的信號(hào)輸出到視頻顯示終端40,并同步將聲音發(fā)送給聲音設(shè)備30。該技術(shù)的關(guān)鍵是通過視頻處理器207與視頻字符疊加模塊202將多媒體信息處理后進(jìn)行播放,通過字幕疊加將播放信息與原有視頻信息進(jìn)行混合,以此來同步語音播報(bào)顯示屏信息。
[0008]但,上述方式一存在以下缺點(diǎn):
[0009]1、由于沒有對(duì)接收到的信息進(jìn)行處理,只是通過將文字信息與音頻信息分離后分別播放來實(shí)現(xiàn)視頻音頻的共放,很容易造成視頻、音頻不同步;
[0010]2、由于需要計(jì)算機(jī)實(shí)時(shí)參與,無法實(shí)現(xiàn)脫機(jī)播放。
[0011]而上述方式二雖然可以實(shí)現(xiàn)視頻、音頻同步,但存在以下缺點(diǎn):
[0012]1、系統(tǒng)結(jié)構(gòu)復(fù)雜,硬件成本太高;
[0013]2、聲音信息直接由外部輸入,無法做到實(shí)時(shí)同步。
【發(fā)明內(nèi)容】
[0014]有鑒于此,本發(fā)明提供一種音頻控制裝置及方法,可實(shí)現(xiàn)聲文并茂的音、視頻同步播放,并具有結(jié)構(gòu)簡單、穩(wěn)定可靠、成本低的優(yōu)點(diǎn)。
[0015]本發(fā)明實(shí)施例提供的音頻控制裝置,包括:數(shù)據(jù)通訊模塊、中央處理器、語音合成芯片以及存儲(chǔ)模塊,所述中央處理器電性連接于所述數(shù)據(jù)通訊模塊、所述語音合成芯片與所述存儲(chǔ)模塊;所述數(shù)據(jù)通訊模塊,用于獲取節(jié)目文件,所述節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù);所述中央處理器,用于將所述節(jié)目文件緩存于所述存儲(chǔ)模塊,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理所述文本數(shù)據(jù),使得所述節(jié)目文本內(nèi)容按照所述顯示控制參數(shù)顯示在LED顯示屏上,同時(shí)將所述文本數(shù)據(jù)發(fā)送給所述語音合成芯片;所述語音合成芯片,用于將所述文本數(shù)據(jù)合成為語音信息,所述語音信息與所述節(jié)目文本內(nèi)容相對(duì)應(yīng),按照預(yù)設(shè)的播放控制參數(shù)在顯示所述節(jié)目文本內(nèi)容的同時(shí)同步播放所述語音信息。
[0016]本發(fā)明實(shí)施例提供的音頻控制方法,包括:獲取并存儲(chǔ)節(jié)目文件,所述節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù);根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理所述文本數(shù)據(jù),使得所述節(jié)目文本內(nèi)容按照所述顯示控制參數(shù)顯示在LED顯示屏上;同時(shí)將所述文本數(shù)據(jù)合成為語音信息,所述語音信息與所述節(jié)目文本內(nèi)容相對(duì)應(yīng);按照預(yù)設(shè)的播放控制參數(shù)在顯示所述節(jié)目文本內(nèi)容的同時(shí)同步播放所述語音信息。
[0017]本發(fā)明實(shí)施例提供的一種音頻控制裝置及方法,通過中央處理器根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)的同時(shí),將該文本數(shù)據(jù)發(fā)送給內(nèi)置的語音合成芯片,以便該語音合成芯片將該文本數(shù)據(jù)合成為語音信息,并按照預(yù)設(shè)的播放控制參數(shù)同步播放該語音信息,可實(shí)現(xiàn)聲文并茂的圖文實(shí)時(shí)同步播放,并具有以下優(yōu)點(diǎn):1、系統(tǒng)結(jié)構(gòu)簡單,穩(wěn)定可靠,成本低;2、LED播放音頻數(shù)據(jù)由文本合成而來,所需數(shù)據(jù)量小。
[0018]為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附圖式,作詳細(xì)說明如下。
【專利附圖】
【附圖說明】
[0019]圖1為現(xiàn)有技術(shù)中一種音頻控制系統(tǒng)的結(jié)構(gòu)示意圖;
[0020]圖2為現(xiàn)有技術(shù)中一種視頻圖文同步壓縮混合顯示控制裝置的結(jié)構(gòu)示意圖;
[0021]圖3為本發(fā)明第一實(shí)施例提供的音頻控制裝置的結(jié)構(gòu)示意圖;
[0022]圖4為本發(fā)明第二實(shí)施例提供的音頻控制裝置的結(jié)構(gòu)示意圖;
[0023]圖5為本發(fā)明第三實(shí)施例提供的一種音頻控制方法的流程圖;
[0024]圖6為本發(fā)明第四實(shí)施例提供的一種音頻控制方法的流程圖;
[0025]圖7為本發(fā)明第五實(shí)施例提供的一種音頻控制方法的流程圖;
[0026]圖8為本發(fā)明第五實(shí)施例提供的一種音頻控制方法中一步驟的具體流程圖。
【具體實(shí)施方式】
[0027]為更進(jìn)一步闡述本發(fā)明為實(shí)現(xiàn)預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明的【具體實(shí)施方式】、結(jié)構(gòu)、特征及其功效,詳細(xì)說明如后。
[0028]第一實(shí)施例
[0029]請(qǐng)參閱圖3,為本發(fā)明第一實(shí)施例提供一種音頻控制裝置,可應(yīng)用于單/雙色LED控制卡。音頻控制裝置50包括:數(shù)據(jù)通訊模塊501、中央處理器502、語音合成芯片503以及存儲(chǔ)模塊504,中央處理器502電性連接于數(shù)據(jù)通訊模塊501、語音合成芯片503與存儲(chǔ)模塊504。
[0030]其中,中央處理器502包括微控制單元(Micro Control Unit,MCU)處理器,用于調(diào)度數(shù)據(jù)通訊模塊501、語音合成芯片503等各個(gè)模塊以及處理來自上述各個(gè)模塊的數(shù)據(jù)。存儲(chǔ)模塊504優(yōu)選為閃存(Flash)。
[0031]具體地,數(shù)據(jù)通訊模塊501,用于獲取節(jié)目文件,該節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)。中央處理器502,用于將該節(jié)目文件緩存于存儲(chǔ)模塊504,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏70上,同時(shí)將該文本數(shù)據(jù)發(fā)送給語音合成芯片503。語音合成芯片503,用于將該文本數(shù)據(jù)合成為語音信息,該語音信息與該節(jié)目文本內(nèi)容相對(duì)應(yīng),按照預(yù)設(shè)的播放控制參數(shù)在顯示該節(jié)目文本內(nèi)容的同時(shí)同步播放該語音信息。
[0032]需要說明的是,MCU處理器控制語音合成芯片503,結(jié)合LED顯示屏70顯示的內(nèi)容,通過播放設(shè)備80將對(duì)應(yīng)的語音信息進(jìn)行播放。播放設(shè)備80將語音合成芯片503發(fā)出的語音信息進(jìn)行放大,并推動(dòng)揚(yáng)聲器發(fā)出聲音。
[0033]本實(shí)施例提供的一種音頻控制裝置,通過中央處理器根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)的同時(shí),將該文本數(shù)據(jù)發(fā)送給內(nèi)置的語音合成芯片,以便該語音合成芯片將該文本數(shù)據(jù)合成為語音信息,并按照預(yù)設(shè)的播放控制參數(shù)同步播放該語音信息,可實(shí)現(xiàn)聲文并茂的圖文實(shí)時(shí)同步播放,并具有以下優(yōu)點(diǎn):1、系統(tǒng)結(jié)構(gòu)簡單,穩(wěn)定可靠,成本低;2、LED播放音頻數(shù)據(jù)由文本合成而來,所需數(shù)據(jù)量小。
[0034]第二實(shí)施例
[0035]為了更好的理解本發(fā)明實(shí)施例中的技術(shù)方案,請(qǐng)參閱圖4,為本發(fā)明第二實(shí)施例提供的一種音頻控制裝置的結(jié)構(gòu)示意圖。本實(shí)施例提供的音頻控制裝置60包括:如圖3所示實(shí)施例中描述的數(shù)據(jù)通訊模塊501、中央處理器502、語音合成芯片503以及存儲(chǔ)模塊504,且與圖3所示實(shí)施例中描述的內(nèi)容相似,此處不再贅述。
[0036]于本實(shí)施例中,該節(jié)目文件還包括顯示控制參數(shù)的數(shù)據(jù),數(shù)據(jù)通訊模塊501包括移動(dòng)存儲(chǔ)設(shè)備接口 5011,移動(dòng)存儲(chǔ)設(shè)備接口 5011用于當(dāng)檢測到有移動(dòng)存儲(chǔ)設(shè)備接入時(shí),讀取該移動(dòng)存儲(chǔ)設(shè)備中存儲(chǔ)的該節(jié)目文件。具體地,移動(dòng)存儲(chǔ)設(shè)備接口 5011包括:USB (Universal Serial Bus,通用串行總線)接口、IEEE1394 (Institute of Electricaland Electronics Engineers 1395,俗稱火線(FireWire)接口)接口中的任一種。
[0037]進(jìn)一步地,音頻控制裝置60還包括語音獲取模塊601。語音獲取模塊601,用于獲取用戶錄入的語音數(shù)據(jù)。中央處理器502,用于對(duì)該語音數(shù)據(jù)進(jìn)行語音識(shí)別,以得到該文本數(shù)據(jù)。
[0038]進(jìn)一步地,語音獲取模塊601包括:語音錄入模塊6011與模數(shù)轉(zhuǎn)換模塊6012,語音輸入模塊601電性連接于模數(shù)轉(zhuǎn)換模塊602,模數(shù)轉(zhuǎn)換模塊602電性連接于中央處理器502。語音錄入模塊601 (如,麥克風(fēng)),用于獲取該用戶錄入的模擬聲音信號(hào),并將該模擬聲音信號(hào)發(fā)送給模數(shù)轉(zhuǎn)換模塊602。模數(shù)轉(zhuǎn)換模塊602,用于將該模擬聲音信號(hào)量化為數(shù)字聲音信號(hào)并緩存于存儲(chǔ)模塊504。
[0039]進(jìn)一步地,數(shù)據(jù)通訊模塊501還包括網(wǎng)絡(luò)通訊模塊5012。網(wǎng)絡(luò)通訊模塊5012,電性連接于中央處理器502,用于與服務(wù)器90建立網(wǎng)絡(luò)連接,當(dāng)該用戶的錄入結(jié)束時(shí),將該數(shù)字聲音信號(hào)發(fā)送給服務(wù)器90,使得服務(wù)器90對(duì)該數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,以得到該文本數(shù)據(jù),接收服務(wù)器90返回的該文本數(shù)據(jù)。具體地,網(wǎng)絡(luò)通訊模塊5012包括:以太網(wǎng)接口、通用分組無線服務(wù)技術(shù)(General Packet Rad1 Service)接口、3G (3rd_Generat1n,第三代移動(dòng)通信技術(shù))接口以及WIFI (Wireless-Fidelity,無線保真)接口的一種或多種,用于與外部服務(wù)器90進(jìn)行數(shù)據(jù)通訊。
[0040]本實(shí)施例提供的一種音頻控制裝置,通過中央處理器根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)的同時(shí),將該文本數(shù)據(jù)發(fā)送給內(nèi)置的語音合成芯片,以便該語音合成芯片將該文本數(shù)據(jù)合成為語音信息,并按照預(yù)設(shè)的播放控制參數(shù)同步播放該語音信息,可實(shí)現(xiàn)聲文并茂的圖文實(shí)時(shí)同步播放,并具有以下優(yōu)點(diǎn):1、系統(tǒng)結(jié)構(gòu)簡單,穩(wěn)定可靠,成本低;2、LED播放音頻數(shù)據(jù)由文本合成而來,所需數(shù)據(jù)量小。此外,利用語音獲取模塊與數(shù)據(jù)通訊模塊,更可通過語音輸入、云端識(shí)別等多種方式來實(shí)現(xiàn)圖文同步。
[0041]第三實(shí)施例
[0042]請(qǐng)參閱圖5,為本發(fā)明第三實(shí)施例提供的一種音頻控制方法的流程圖,該音頻控制方法可應(yīng)用于圖3和圖4所示實(shí)施例描述的音頻控制裝置,用于控制實(shí)現(xiàn)圖文實(shí)時(shí)同步播放,包括:
[0043]步驟S501,獲取并存儲(chǔ)節(jié)目文件,該節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù);
[0044]具體地,節(jié)目文件可由中央處理器501通過USB接口或IEEE1394接口從外部移動(dòng)存儲(chǔ)設(shè)備(如,U盤、移動(dòng)硬盤)中獲取,或通過語音識(shí)別利用語音獲取模塊(如,麥克風(fēng))錄入的用戶錄入的語音數(shù)據(jù)獲得。節(jié)目文本內(nèi)容包括將要在LED顯示屏上顯示的一個(gè)或多個(gè)文字。中央處理器501獲取該節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)并緩存于內(nèi)置的Flash (如,板載Flash)中。
[0045]步驟S502,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏上;
[0046]顯示控制參數(shù)可以但不限于包括:字體大小、字模的值、顯示位置、顯示順序等等。具體地,中央處理器501從板載Flash讀取該節(jié)目文件,根據(jù)顯示控制參數(shù),對(duì)待顯示的該節(jié)目文件所包括的節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)進(jìn)行處理,根據(jù)該顯示控制參數(shù)配置該節(jié)目文本內(nèi)容中所包含的各個(gè)文字的字體大小與字模的值,并按照該顯示控制參數(shù)對(duì)應(yīng)的顯示位置、顯示順序逐幀地將符合該字體大小與字模的值的該節(jié)目文本內(nèi)容在LED顯示屏70上進(jìn)行顯示。
[0047]可以理解地,顯示控制參數(shù)可根據(jù)用戶的編輯指令預(yù)先編輯并存儲(chǔ)于U盤中,或者也可以根據(jù)用戶的設(shè)定指令預(yù)先設(shè)定在音頻控制裝置內(nèi)置的存儲(chǔ)器中。
[0048]步驟S503,同時(shí)將該文本數(shù)據(jù)合成為語音信息,該語音信息與該節(jié)目文本內(nèi)容相對(duì)應(yīng);
[0049]在根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該文本數(shù)據(jù)的同時(shí),中央處理器501將讀取的緩存于Flash中的該節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)發(fā)送給語音合成芯片503,并指示語音合成芯片503將該文本數(shù)據(jù)合成為語音信息。
[0050]步驟S504,按照預(yù)設(shè)的播放控制參數(shù)在顯示該節(jié)目文本內(nèi)容的同時(shí)同步播放該語音信息。
[0051]播放控制參數(shù)可以但不限于包括:播放速度、音量大小、聲音類型(如男、女聲)等等。
[0052]具體地,中央處理器501檢測當(dāng)前幀是否播放完成,若播放完成,則顯示下一幀,并控制語音合成芯片503按照播放控制參數(shù)同步播放與該幀對(duì)應(yīng)的語音信息;若未播放完成,則控制語音合成芯片503按照播放控制參數(shù)繼續(xù)同步播放當(dāng)前幀對(duì)應(yīng)的語音信息。
[0053]本實(shí)施例提供的一種音頻控制方法,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)以進(jìn)行顯示,同時(shí)將該文本數(shù)據(jù)合成為語音信息,并按照預(yù)設(shè)的播放控制參數(shù)同步播放該語音信息,可實(shí)現(xiàn)聲文并茂的圖文實(shí)時(shí)同步播放,并且由于LED播放音頻數(shù)據(jù)由文本合成而來,同時(shí)具有所需數(shù)據(jù)量小的優(yōu)點(diǎn)。
[0054]第四實(shí)施例
[0055]請(qǐng)參閱圖6,為本發(fā)明第四實(shí)施例提供的一種音頻控制方法的流程圖,該音頻控制方法可應(yīng)用于圖3和圖4所示實(shí)施例描述的音頻控制裝置,用于控制實(shí)現(xiàn)圖文實(shí)時(shí)同步播放,包括:
[0056]步驟S601,當(dāng)檢測到有移動(dòng)存儲(chǔ)設(shè)備接入時(shí),讀取該移動(dòng)存儲(chǔ)設(shè)備中存儲(chǔ)的該節(jié)目文件,該節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)與預(yù)設(shè)的顯示控制參數(shù)的數(shù)據(jù);
[0057]中央處理器501 (如,MCU處理器)通過USB接口或IEEE1394接口從外部移動(dòng)存儲(chǔ)設(shè)備(如,U盤、移動(dòng)硬盤)中獲取該節(jié)目文件并緩存于板載Flash。其中,節(jié)目文本內(nèi)容包括將要在LED顯示屏上顯示的所有文字。顯示控制參數(shù)可以但不限于包括:字體大小、字模的值、顯示位置、顯示順序等等。
[0058]步驟S602,根據(jù)該顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏上;
[0059]步驟S603,將該文本數(shù)據(jù)合成為語音信息,該語音信息與該節(jié)目文本內(nèi)容相對(duì)應(yīng);
[0060]步驟S604,按照預(yù)設(shè)的播放控制參數(shù)在顯示該節(jié)目文本內(nèi)容的同時(shí)同步播放該語音信息。
[0061]步驟S602至步驟S603與第三實(shí)施例中的步驟S502至步驟S503相似,具體可參考第三實(shí)施例中的相關(guān)內(nèi)容,此處不再贅述。
[0062]為進(jìn)一步說明本實(shí)施例,舉例來說,用戶通過安裝有系統(tǒng)上位機(jī)軟件的計(jì)算機(jī)編輯想要顯示節(jié)目文件,該節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)與預(yù)設(shè)的顯示控制參數(shù)的數(shù)據(jù);然后將通過該系統(tǒng)上位機(jī)軟件生成好的數(shù)據(jù)導(dǎo)入U(xiǎn)盤。圖3或圖4所示實(shí)施例描述的音頻控制裝置在檢測到該U盤插入系統(tǒng)PCB電路板上的USB插孔時(shí),通過MCU處理器讀取該U盤中儲(chǔ)存的該節(jié)目文件并緩存于板載Flash中;然后,MCU處理器讀取Flash中存儲(chǔ)的該節(jié)目文件,根據(jù)該節(jié)目文件中的該顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏上;與此同時(shí),MCU處理器將該文本數(shù)據(jù)發(fā)送給語音合成芯片,指示語音合成芯片將該文本數(shù)據(jù)合成為語音信息;接著,MCU處理器控制語音合成芯片根據(jù)LED顯示屏當(dāng)前顯示的內(nèi)容,播放對(duì)應(yīng)的語音信息,播放設(shè)備將語音合成芯片發(fā)出的語音信息進(jìn)行放大,并推動(dòng)揚(yáng)聲器發(fā)出聲音。
[0063]可以理解地,上述節(jié)目文本內(nèi)容所包含的多個(gè)文字可通過多幀顯示,MCU處理器首先從Flash中讀取一幀數(shù)據(jù),然后將該幀數(shù)據(jù)對(duì)應(yīng)的文字(字幕信息)顯示在LED顯示屏上,同時(shí)將對(duì)應(yīng)的文本數(shù)據(jù)發(fā)送給語音合成芯片以便語音合成芯片進(jìn)行語音合成與播放,并由MCU處理器控制合成的語音的播放速度,以達(dá)到字幕與聲音的同步播放;接著,MCU處理器判斷當(dāng)前幀是否播放完成,并當(dāng)判斷結(jié)果為播放完當(dāng)前幀后,載入下一幀,然后重復(fù)將該幀數(shù)據(jù)對(duì)應(yīng)的文字(字幕信息)顯示在LED顯示屏上,同時(shí)將對(duì)應(yīng)的文本數(shù)據(jù)發(fā)送給語音合成芯片以便語音合成芯片進(jìn)行語音合成與播放,并由MCU處理器控制合成的語音的播放速度,以達(dá)到字幕與聲音的同步播放的操作,直至按照預(yù)設(shè)的顯示控制參數(shù)將節(jié)目文本內(nèi)容中包含的所有文字在LED顯示屏中顯示完成為止。
[0064]本實(shí)施例提供的一種音頻控制方法,獲取移動(dòng)存儲(chǔ)設(shè)備中存儲(chǔ)的節(jié)目文件,該節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)與預(yù)設(shè)的顯示控制參數(shù)的數(shù)據(jù),根據(jù)該顯示控制參數(shù)處理該節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)以進(jìn)行顯示,同時(shí)將該文本數(shù)據(jù)合成為語音信息,并按照預(yù)設(shè)的播放控制參數(shù)同步播放該語音信息,可實(shí)現(xiàn)聲文并茂的圖文實(shí)時(shí)同步播放,并且由于LED播放音頻數(shù)據(jù)由文本合成而來,同時(shí)具有所需數(shù)據(jù)量小的優(yōu)點(diǎn)。此外,按照移動(dòng)存儲(chǔ)設(shè)備中存儲(chǔ)的顯示控制參數(shù)處理節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù),更可節(jié)省音頻控制裝置的內(nèi)部存儲(chǔ)空間,提高處理的靈活性。
[0065]第五實(shí)施例
[0066]請(qǐng)參閱圖7,為本發(fā)明第五實(shí)施例提供的一種音頻控制方法的流程圖,該音頻控制方法可應(yīng)用于圖3和圖4所示實(shí)施例描述的音頻控制裝置,用于控制實(shí)現(xiàn)圖文實(shí)時(shí)同步播放,包括:
[0067]步驟S701,獲取用戶錄入的語音數(shù)據(jù);
[0068]具體地,通過語音錄入模塊6011獲取用戶錄入的待播放的節(jié)目文件所包括的節(jié)目文本內(nèi)容對(duì)應(yīng)的模擬聲音信號(hào),然后通過模數(shù)轉(zhuǎn)換模塊6012將該模擬聲音信號(hào)量化為數(shù)字聲音信號(hào)并緩存于Flash中。
[0069]步驟S702,對(duì)該語音數(shù)據(jù)進(jìn)行語音識(shí)別,以得到文本數(shù)據(jù);
[0070]中央處理器501可通過內(nèi)置的語音識(shí)別模塊對(duì)Flash中緩存的數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,以得到該節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)。
[0071]于其他實(shí)施例中,本步驟具體可包括:
[0072]步驟S7021,當(dāng)該用戶的錄入結(jié)束時(shí),將該數(shù)字聲音信號(hào)發(fā)送給服務(wù)器,使得該服務(wù)器對(duì)該數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,以得到該文本數(shù)據(jù);
[0073]中央處理器501檢測用戶的錄入是否結(jié)束,并當(dāng)用戶的錄入結(jié)束時(shí)讀取Flash中緩存的數(shù)字聲音信號(hào),并發(fā)送給外部服務(wù)器90。可以理解地,在發(fā)送數(shù)字聲音信號(hào)之前,中央處理器501檢測是否接入網(wǎng)絡(luò)并與外部服務(wù)器90建立網(wǎng)絡(luò)連接,若否,則通過網(wǎng)絡(luò)通訊模塊5012與外部服務(wù)器90建立網(wǎng)絡(luò)連接,該網(wǎng)絡(luò)連接可基于以太網(wǎng)協(xié)議、GPRS協(xié)議、3G協(xié)議或WIFI協(xié)議等網(wǎng)絡(luò)協(xié)議建立。
[0074]步驟S7022,接收該服務(wù)器返回的該文本數(shù)據(jù)。
[0075]服務(wù)器90收到數(shù)字聲音信號(hào)的數(shù)據(jù)包后,對(duì)該數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,并返回包含識(shí)別后的該數(shù)字聲音信號(hào)對(duì)應(yīng)的文本信息的文字?jǐn)?shù)據(jù)。
[0076]網(wǎng)絡(luò)通訊模塊5012接收服務(wù)器90返回的該文本數(shù)據(jù)并緩存于Flash中。
[0077]步驟S703,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏上;
[0078]步驟S704,將該文本數(shù)據(jù)合成為語音信息,該語音信息與該節(jié)目文本內(nèi)容相對(duì)應(yīng);
[0079]步驟S705,按照預(yù)設(shè)的播放控制參數(shù)在顯示該節(jié)目文本內(nèi)容的同時(shí)同步播放該語音信息。
[0080]步驟S703至步驟S705與第三實(shí)施例中的步驟S502至步驟S503相似,具體可參考第三實(shí)施例中的相關(guān)內(nèi)容,此處不再贅述。
[0081]為進(jìn)一步說明本實(shí)施例,舉例來說,音頻控制裝置首先通過網(wǎng)絡(luò)通訊模塊接入互聯(lián)網(wǎng)中,并與服務(wù)器建立網(wǎng)絡(luò)連接;接收用戶使用麥克風(fēng)錄入的想要播報(bào)的節(jié)目文本內(nèi)容,通過該麥克風(fēng)將用戶錄入的該節(jié)目文本內(nèi)容對(duì)應(yīng)的音頻信號(hào)轉(zhuǎn)化為模擬聲音信號(hào);然后通過MCU處理器控制模數(shù)轉(zhuǎn)換器將該模擬聲音信號(hào)量化為數(shù)字聲音信號(hào),并儲(chǔ)存在Flash中;MCU處理器在判斷用戶錄入完成后,將量化后的數(shù)字聲音信號(hào)通過以太網(wǎng)上傳至服務(wù)器,使得該服務(wù)器對(duì)接收的該數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,并將識(shí)別出的該節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)返回給音頻控制裝置;音頻控制裝置在接收到該服務(wù)器返回的該文本數(shù)據(jù)后,將該文本數(shù)據(jù)儲(chǔ)存在Flash中;通過MCU處理器從Flash中讀取該文本數(shù)據(jù)并發(fā)送給語音合成芯片,指示語音合成芯片將該文本數(shù)據(jù)合成為語音信息,同時(shí)根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該文本數(shù)據(jù),使得該節(jié)目文本內(nèi)容按照該顯示控制參數(shù)顯示在LED顯示屏上,并控制語音合成芯片,結(jié)合LED顯示屏顯示的內(nèi)容,將對(duì)應(yīng)的語音信息進(jìn)行播放,播放設(shè)備將語音合成芯片發(fā)出的語音信息進(jìn)行放大,并推動(dòng)揚(yáng)聲器發(fā)出聲音。
[0082]可以理解地,上述節(jié)目文本內(nèi)容包含的多個(gè)文字可通過多幀顯示,MCU處理器從Flash中讀取一幀數(shù)據(jù),然后將該幀數(shù)據(jù)對(duì)應(yīng)的文字(字幕信息)顯示在LED顯示屏上,同時(shí)將對(duì)應(yīng)的文本數(shù)據(jù)發(fā)送給語音合成芯片以便語音合成芯片進(jìn)行語音合成與播放,并由MCU處理器控制合成的語音的播放速度,以達(dá)到字幕與聲音的同步播放;接著,MCU處理器判斷當(dāng)前幀是否播放完成,并當(dāng)判斷結(jié)果為播放完當(dāng)前幀后,載入下一幀,然后重復(fù)將該幀數(shù)據(jù)對(duì)應(yīng)的文字(字幕信息)顯示在LED顯示屏上,同時(shí)將對(duì)應(yīng)的文本數(shù)據(jù)發(fā)送給語音合成芯片以便語音合成芯片進(jìn)行語音合成與播放,并由MCU處理器控制合成的語音的播放速度,以達(dá)到字幕與聲音的同步播放的操作,直至將節(jié)目文本內(nèi)容中包含的所有文字在LED顯不屏中顯不完成為止。
[0083]本實(shí)施例提供的一種音頻控制方法,獲取用戶錄入的語音數(shù)據(jù),并發(fā)送給服務(wù)器進(jìn)行語音識(shí)別,接收服務(wù)器返回的識(shí)別出的文本數(shù)據(jù),根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理該節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù)以進(jìn)行顯示,同時(shí)將該文本數(shù)據(jù)合成為語音信息,并按照預(yù)設(shè)的播放控制參數(shù)同步播放該語音信息,可實(shí)現(xiàn)基于語音輸入與云端識(shí)別的聲文并茂的圖文實(shí)時(shí)同步播放,并且由于LED播放音頻數(shù)據(jù)由文本合成而來,同時(shí)具有所需數(shù)據(jù)量小的優(yōu)點(diǎn)。
[0084]需要說明的是,本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對(duì)于裝置類實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
[0085]需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括要素的過程、方法、物品或者裝置中還存在另外的相同要素。
[0086]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
[0087]以上,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容做出些許更動(dòng)或修飾為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
【權(quán)利要求】
1.一種音頻控制裝置,其特征在于,包括:數(shù)據(jù)通訊模塊、中央處理器、語音合成芯片以及存儲(chǔ)模塊,所述中央處理器電性連接于所述數(shù)據(jù)通訊模塊、所述語音合成芯片與所述存儲(chǔ)模塊; 所述數(shù)據(jù)通訊模塊,用于獲取節(jié)目文件,所述節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù); 所述中央處理器,用于將所述節(jié)目文件緩存于所述存儲(chǔ)模塊,根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理所述文本數(shù)據(jù),使得所述節(jié)目文本內(nèi)容按照所述顯示控制參數(shù)顯示在LED顯示屏上,同時(shí)將所述文本數(shù)據(jù)發(fā)送給所述語音合成芯片; 所述語音合成芯片,用于將所述文本數(shù)據(jù)合成為語音信息,所述語音信息與所述節(jié)目文本內(nèi)容相對(duì)應(yīng),按照預(yù)設(shè)的播放控制參數(shù)在顯示所述節(jié)目文本內(nèi)容的同時(shí)同步播放所述語音信息。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述節(jié)目文件還包括所述預(yù)設(shè)的顯示控制參數(shù)的數(shù)據(jù),所述數(shù)據(jù)通訊模塊包括移動(dòng)存儲(chǔ)設(shè)備接口,所述移動(dòng)存儲(chǔ)設(shè)備接口用于當(dāng)檢測到有移動(dòng)存儲(chǔ)設(shè)備接入時(shí),讀取所述移動(dòng)存儲(chǔ)設(shè)備中存儲(chǔ)的所述節(jié)目文件。
3.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述裝置還包括語音獲取模塊; 所述語音獲取模塊,用于獲取用戶錄入的語音數(shù)據(jù); 所述中央處理器,用于對(duì)所述語音數(shù)據(jù)進(jìn)行語音識(shí)別,以得到所述文本數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的裝置,其特征在于,所述語音獲取模塊包括:語音錄入模塊與模數(shù)轉(zhuǎn)換模塊,所述語音輸入模塊電性連接于所述模數(shù)轉(zhuǎn)換模塊,所述模數(shù)轉(zhuǎn)換模塊電性連接于所述中央處理器。 所述語音錄入模塊,用于獲取所述用戶錄入的模擬聲音信號(hào),并將所述模擬聲音信號(hào)發(fā)送給所述模數(shù)轉(zhuǎn)換模塊; 所述模數(shù)轉(zhuǎn)換模塊,用于將所述模擬聲音信號(hào)量化為數(shù)字聲音信號(hào)并緩存于所述存儲(chǔ)豐旲塊。
5.根據(jù)權(quán)利要求4所述的裝置,其特征在于,所述數(shù)據(jù)通訊模塊還包括網(wǎng)絡(luò)通訊模塊; 所述網(wǎng)絡(luò)通訊模塊,電性連接于所述中央處理器,用于與服務(wù)器建立網(wǎng)絡(luò)連接,當(dāng)所述用戶的錄入結(jié)束時(shí),將所述數(shù)字聲音信號(hào)發(fā)送給所述服務(wù)器,使得所述服務(wù)器對(duì)所述數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,以得到所述文本數(shù)據(jù),接收所述服務(wù)器返回的所述文本數(shù)據(jù)。
6.根據(jù)權(quán)利要求1至5的任一項(xiàng)所述的裝置,其特征在于,所述移動(dòng)存儲(chǔ)設(shè)備接口包括:USB接口、IEEE1394接口中的任一種。
7.根據(jù)權(quán)利要求1至5的任一項(xiàng)所述的裝置,其特征在于,所述網(wǎng)絡(luò)通訊模塊包括:以太網(wǎng)接口、通用分組無線服務(wù)技術(shù)接口、3G接口以及WIFI接口中的一種或多種。
8.一種音頻控制方法,其特征在于,包括: 獲取并存儲(chǔ)節(jié)目文件,所述節(jié)目文件包括節(jié)目文本內(nèi)容對(duì)應(yīng)的文本數(shù)據(jù); 根據(jù)預(yù)設(shè)的顯示控制參數(shù)處理所述文本數(shù)據(jù),使得所述節(jié)目文本內(nèi)容按照所述顯示控制參數(shù)顯示在LED顯示屏上; 同時(shí)將所述文本數(shù)據(jù)合成為語音信息,所述語音信息與所述節(jié)目文本內(nèi)容相對(duì)應(yīng); 按照預(yù)設(shè)的播放控制參數(shù)在顯示所述節(jié)目文本內(nèi)容的同時(shí)同步播放所述語音信息。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述節(jié)目文件還包括所述預(yù)設(shè)的顯示控制參數(shù)的數(shù)據(jù),所述獲取節(jié)目文件包括: 當(dāng)檢測到有移動(dòng)存儲(chǔ)設(shè)備接入時(shí),讀取所述移動(dòng)存儲(chǔ)設(shè)備中存儲(chǔ)的所述節(jié)目文件。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述獲取節(jié)目文件還包括: 獲取用戶錄入的語音數(shù)據(jù); 對(duì)所述語音數(shù)據(jù)進(jìn)行語音識(shí)別,以得到所述文本數(shù)據(jù)。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述獲取用戶錄入的語音數(shù)據(jù)包括: 獲取所述用戶錄入的模擬聲音信號(hào); 將所述模擬聲音信號(hào)量化為數(shù)字聲音信號(hào)并緩存于存儲(chǔ)模塊。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述對(duì)所述語音數(shù)據(jù)進(jìn)行語音識(shí)別,以得到所述文本數(shù)據(jù)包括: 當(dāng)所述用戶的錄入結(jié)束時(shí),將所述數(shù)字聲音信號(hào)發(fā)送給服務(wù)器,使得所述服務(wù)器對(duì)所述數(shù)字聲音信號(hào)進(jìn)行語音識(shí)別,以得到所述文本數(shù)據(jù); 接收所述服務(wù)器返回的所述文本數(shù)據(jù)。
【文檔編號(hào)】H04N21/485GK104519403SQ201410819948
【公開日】2015年4月15日 申請(qǐng)日期:2014年12月25日 優(yōu)先權(quán)日:2014年12月25日
【發(fā)明者】王晨, 劉延 申請(qǐng)人:西安諾瓦電子科技有限公司