具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置制造方法
【專(zhuān)利摘要】本實(shí)用新型公開(kāi)了一種具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置,包括人機(jī)交互模塊、語(yǔ)音輸入模塊、語(yǔ)音數(shù)據(jù)處理模塊、中央處理器、媒體存儲(chǔ)模塊、播放解碼模塊、音頻輸出模塊和網(wǎng)絡(luò)接口模塊,語(yǔ)音輸入模塊與語(yǔ)音數(shù)據(jù)處理模塊的輸入端相連,語(yǔ)音數(shù)據(jù)處理模塊與中央處理器相連,中央處理器還分別與人機(jī)交互模塊、媒體存儲(chǔ)模塊、網(wǎng)絡(luò)接口模塊相連,且所述中央處理器的輸出端通過(guò)播放解碼模塊與音頻輸出模塊相連。本實(shí)用新型具有能夠解放用戶(hù)的雙手、用戶(hù)體驗(yàn)好、使用方便、哼唱檢測(cè)精確、應(yīng)用范圍廣的優(yōu)點(diǎn)。
【專(zhuān)利說(shuō)明】具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置
【技術(shù)領(lǐng)域】
[0001]本實(shí)用新型涉及多媒體設(shè)備領(lǐng)域,具體涉及一種具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)的音樂(lè)播放裝置所具備的僅僅是對(duì)音頻文件手動(dòng)的播放、暫停、上一曲等等常規(guī)的操控,對(duì)于數(shù)字音頻的資源搜索也僅僅是通過(guò)用戶(hù)輸入歌曲名、歌唱者等等限制條件來(lái)完成。這一些限制條件使得用戶(hù)在使用播放器時(shí),并不能解放出自己的雙手,同時(shí)對(duì)于自己不確定名稱(chēng)的歌曲無(wú)法搜索到歌曲資源,這些都極大的降低了用戶(hù)的體驗(yàn)度。
實(shí)用新型內(nèi)容
[0003]本實(shí)用新型要解決的技術(shù)問(wèn)題是提供一種能夠解放用戶(hù)的雙手、用戶(hù)體驗(yàn)好、使用方便、哼唱檢測(cè)精確、應(yīng)用范圍廣的具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置。
[0004]為了解決上述技術(shù)問(wèn)題,本實(shí)用新型采用的技術(shù)方案為:
[0005]一種具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置,包括人機(jī)交互模塊、語(yǔ)音輸入模塊、語(yǔ)音數(shù)據(jù)處理模塊、中央處理器、媒體存儲(chǔ)模塊、播放解碼模塊、音頻輸出模塊和網(wǎng)絡(luò)接口模塊,所述語(yǔ)音輸入模塊與語(yǔ)音數(shù)據(jù)處理模塊的輸入端相連,所述語(yǔ)音數(shù)據(jù)處理模塊與中央處理器相連,所述中央處理器還分別與人機(jī)交互模塊、媒體存儲(chǔ)模塊、網(wǎng)絡(luò)接口模塊相連,且所述中央處理器的輸出端通過(guò)播放解碼模塊與音頻輸出模塊相連。
[0006]作為上述技術(shù)方案的進(jìn)一步改進(jìn):
[0007]所述人機(jī)交互模塊為觸摸顯示屏模塊。
[0008]所述語(yǔ)音數(shù)據(jù)處理模塊為DSP處理器。
[0009]所述網(wǎng)絡(luò)接口模塊為3G接口模塊、GPRS接口模塊、WIFI接口模塊中的一種。
[0010]本實(shí)用新型具有下述優(yōu)點(diǎn):本實(shí)用新型包括人機(jī)交互模塊、語(yǔ)音輸入模塊、中央控制模塊、媒體存儲(chǔ)模塊、播放解碼模塊、音頻輸出模塊、哼唱數(shù)據(jù)處理模塊和網(wǎng)絡(luò)接口模塊,中央控制模塊分別與人機(jī)交互模塊、語(yǔ)音輸入模塊、播放解碼模塊、哼唱數(shù)據(jù)處理模塊、網(wǎng)絡(luò)接口模塊相連,哼唱數(shù)據(jù)處理模塊分別與媒體存儲(chǔ)模塊、網(wǎng)絡(luò)接口模塊相連,播放解碼模塊的數(shù)據(jù)輸入端與媒體存儲(chǔ)模塊相連,播放解碼模塊的音頻數(shù)據(jù)輸出端與音頻輸出模塊相連,本實(shí)用新型結(jié)合語(yǔ)音控制和哼唱檢索,用戶(hù)能夠?qū)崿F(xiàn)兩種方式的音頻播放控制以及資源管理,第一種通過(guò)觸屏的方式,第二種通過(guò)語(yǔ)音輸入控制指令的方式完成系統(tǒng)的控制與管理,語(yǔ)音控制基于網(wǎng)絡(luò)方式傳輸識(shí)別請(qǐng)求,具有實(shí)現(xiàn)簡(jiǎn)單的特點(diǎn),同時(shí)用戶(hù)通過(guò)哼唱數(shù)據(jù)處理模塊可以實(shí)現(xiàn)無(wú)手動(dòng)控制,解放了用戶(hù)的雙手,特別適合于用戶(hù)在車(chē)載、加工操作等場(chǎng)合中。哼唱數(shù)據(jù)處理模塊利用用戶(hù)提供簡(jiǎn)單的一段哼唱旋律實(shí)現(xiàn)數(shù)字音頻資源的搜索,并通過(guò)網(wǎng)絡(luò)傳輸?shù)姆绞椒祷赜脩?hù)所搜索的音頻資源,避免了用戶(hù)在忘記歌曲名稱(chēng)和歌唱者時(shí)無(wú)法獲取音頻資源的尷尬情況。綜上所述,本實(shí)用新型相對(duì)于傳統(tǒng)的音頻播放裝置極大的提升了應(yīng)用場(chǎng)合的適應(yīng)性和用戶(hù)體驗(yàn)度,能夠解放用戶(hù)的雙手,具有用戶(hù)體驗(yàn)好、使用方便、哼唱檢測(cè)精確、應(yīng)用范圍廣的優(yōu)點(diǎn)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0011]圖1為本實(shí)用新型實(shí)施例方法的實(shí)施流程示意圖。
[0012]圖2為本實(shí)用新型實(shí)施例的框架結(jié)構(gòu)示意圖。
[0013]圖3為本實(shí)用新型實(shí)施例中人機(jī)交互模塊的電路原理示意圖。
[0014]圖4為本實(shí)用新型實(shí)施例中語(yǔ)音輸入模塊、播放解碼模塊和音頻輸出模塊的電路原理示意圖。
[0015]圖5為本實(shí)用新型實(shí)施例中網(wǎng)絡(luò)接口模塊的電路原理示意圖。
[0016]圖6為本實(shí)用新型實(shí)施例中語(yǔ)音數(shù)據(jù)處理模塊的框架結(jié)構(gòu)示意圖。
[0017]圖7為本實(shí)用新型實(shí)施例中匹配搜索服務(wù)端的框架結(jié)構(gòu)示意圖。
[0018]圖8為本實(shí)用新型實(shí)施例中語(yǔ)音控制模式的工作原理示意圖。
[0019]圖9為本實(shí)用新型實(shí)施例中哼唱檢索模式的工作原理示意圖。
[0020]圖例說(shuō)明:1、人機(jī)交互模塊;2、語(yǔ)音輸入模塊;3、語(yǔ)音數(shù)據(jù)處理模塊;31、預(yù)處理模塊;311、分幀子模塊;312、加窗子模塊;313、短時(shí)能量計(jì)算子模塊;314、過(guò)零率計(jì)算子模塊;315、端點(diǎn)判斷子模塊;316、語(yǔ)音增強(qiáng)子模塊;32、哼唱數(shù)據(jù)處理模塊;321、短時(shí)平均幅度差計(jì)算子模塊;322、基音序列提取子模塊;323、音符序列轉(zhuǎn)換子模塊;4、中央處理器;5、媒體存儲(chǔ)模塊;6、播放解碼模塊;7、音頻輸出模塊;8、網(wǎng)絡(luò)接口模塊;9、匹配搜索服務(wù)端;91、廣度搜索子模塊;92、精細(xì)匹配子模塊;10、語(yǔ)音識(shí)別服務(wù)端。
【具體實(shí)施方式】
[0021]如圖1所示,本實(shí)施例具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置包括人機(jī)交互模塊1、語(yǔ)音輸入模塊2、語(yǔ)音數(shù)據(jù)處理模塊3、中央處理器4、媒體存儲(chǔ)模塊5、播放解碼模塊6、音頻輸出模塊7和網(wǎng)絡(luò)接口模塊8,語(yǔ)音輸入模塊2與語(yǔ)音數(shù)據(jù)處理模塊3的輸入端相連,語(yǔ)音數(shù)據(jù)處理模塊3與中央處理器4相連,中央處理器4還分別與人機(jī)交互模塊
1、媒體存儲(chǔ)模塊5、網(wǎng)絡(luò)接口模塊8相連,且中央處理器4的輸出端通過(guò)播放解碼模塊6與音頻輸出模塊7相連。
[0022]本實(shí)施例中,人機(jī)交互模塊I用于接收用戶(hù)選擇包括語(yǔ)音控制模式和哼唱檢索模式在內(nèi)的工作模式;語(yǔ)音輸入模塊2用于采集語(yǔ)音數(shù)據(jù);語(yǔ)音數(shù)據(jù)處理模塊3用于對(duì)采集的語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理,以及在哼唱檢索模式下進(jìn)一步根據(jù)預(yù)處理后的語(yǔ)音數(shù)據(jù)提取基音序列并轉(zhuǎn)換為音符序列;中央處理器4用于在語(yǔ)音控制模式下將預(yù)處理后的語(yǔ)音數(shù)據(jù)與語(yǔ)法規(guī)則上傳至互聯(lián)網(wǎng)上的語(yǔ)音識(shí)別服務(wù)端10進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別服務(wù)端10返回的識(shí)別結(jié)果對(duì)本地的多媒體資源進(jìn)行播放控制或者資源管理,以及在哼唱檢索模式下將音符序列發(fā)送給互聯(lián)網(wǎng)上的匹配搜索服務(wù)端9,通過(guò)匹配搜索服務(wù)端9在音符特征數(shù)據(jù)庫(kù)中進(jìn)行匹配搜索找到與音符序列相匹配的多媒體資源身份信息,并根據(jù)多媒體資源身份信息從互聯(lián)網(wǎng)下載對(duì)應(yīng)的多媒體資源并存儲(chǔ)到媒體存儲(chǔ)模塊;媒體存儲(chǔ)模塊5用于存儲(chǔ)本地的多媒體資源;播放解碼模塊6用于對(duì)播放控制的多媒體資源進(jìn)行解碼;音頻輸出模塊7用于將多媒體資源解碼后得到的音頻輸出;網(wǎng)絡(luò)接口模塊8用于為中央處理器提供互聯(lián)網(wǎng)訪問(wèn)語(yǔ)音識(shí)別服務(wù)端和匹配搜索服務(wù)端的功能;匹配搜索服務(wù)端9用于在音符特征數(shù)據(jù)庫(kù)中進(jìn)行匹配搜索找到與音符序列相匹配的多媒體資源身份信息并返回給中央處理器4,語(yǔ)音數(shù)據(jù)處理模塊3的輸入端與語(yǔ)音輸入模塊2相連,中央處理器4分別與人機(jī)交互模塊1、語(yǔ)音數(shù)據(jù)處理模塊3、媒體存儲(chǔ)模塊5相連,中央處理器4通過(guò)網(wǎng)絡(luò)接口模塊8與互聯(lián)網(wǎng)的語(yǔ)音識(shí)別服務(wù)端10和匹配搜索服務(wù)端9相連,中央處理器4的輸出端通過(guò)播放解碼模塊6與音頻輸出模塊7相連。如圖2所示,本實(shí)施例的工作過(guò)程如下:1)用戶(hù)通過(guò)人機(jī)交互模塊I選擇工作模式,語(yǔ)音輸入模塊2采集語(yǔ)音數(shù)據(jù)并通過(guò)專(zhuān)用語(yǔ)音數(shù)據(jù)處理芯片(語(yǔ)音數(shù)據(jù)處理模塊3)進(jìn)行預(yù)處理,當(dāng)用戶(hù)選擇的工作模式為語(yǔ)音控制模式則跳轉(zhuǎn)執(zhí)行步驟2),如果用戶(hù)選擇的工作模式為哼唱檢索模式則跳轉(zhuǎn)執(zhí)行步驟3);2)中央處理器4將預(yù)處理后的語(yǔ)音數(shù)據(jù)與語(yǔ)法規(guī)則上傳至互聯(lián)網(wǎng)上的語(yǔ)音識(shí)別服務(wù)端10進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別服務(wù)端10返回的識(shí)別結(jié)果對(duì)本地的多媒體資源進(jìn)行播放控制或者資源管理;3)中央處理器4將預(yù)處理后的語(yǔ)音數(shù)據(jù)通過(guò)專(zhuān)用語(yǔ)音數(shù)據(jù)處理芯片(語(yǔ)音數(shù)據(jù)處理模塊3)提取基音序列并轉(zhuǎn)換為音符序列,將音符序列發(fā)送給互聯(lián)網(wǎng)上的匹配搜索服務(wù)端9,通過(guò)匹配搜索服務(wù)端9在音符特征數(shù)據(jù)庫(kù)中進(jìn)行匹配搜索找到與音符序列相匹配的多媒體資源身份信息,并根據(jù)多媒體資源身份信息從互聯(lián)網(wǎng)下載對(duì)應(yīng)的多媒體資源并存儲(chǔ)到本地的媒體存儲(chǔ)模塊5。
[0023]人機(jī)交互模塊I用于系統(tǒng)界面顯示和操作的控制,本實(shí)施例的人機(jī)交互模塊I采用4線(xiàn)電阻觸摸屏實(shí)現(xiàn),4線(xiàn)電阻觸摸屏的控制器采用TI公司的ADS7843觸摸屏解碼芯片,具有功耗低,觸摸敏感度高的特點(diǎn)。如圖3所示,ADS7843觸摸屏解碼芯片的CS、DCLK、DIN、BUSY、PENRQ, IN3、IN4引腳分別外接中央處理器4,ADS7843觸摸屏解碼芯片的X+、Y+、X-、Y-引腳分別連接4線(xiàn)電阻觸摸屏的XM、XP、YM、YP引腳,然后作為4線(xiàn)電阻觸摸屏的輸出。
[0024]語(yǔ)音輸入模塊2、播放解碼模塊6和音頻輸出模塊7采用ALC5621芯片以及輔助電路實(shí)現(xiàn),ALC5621芯片以及輔助電路內(nèi)置了語(yǔ)音輸入、播放解碼和音頻輸出功能,從而能夠通過(guò)一塊芯片及其外圍電路實(shí)現(xiàn)語(yǔ)音輸入模塊2、播放解碼模塊6和音頻輸出模塊7三個(gè)部件的功能,實(shí)現(xiàn)簡(jiǎn)單方便,而且使得電路結(jié)構(gòu)更加緊湊。ALC5621芯片的四個(gè)外接引腳連接電路如圖4所示,其中ALC5621芯片的與外接中央處理器4相連的外圍接口中MIC_1N、MIC_1P、MIC_2N、MIC_2P 引腳分別連接兩路 MIC_P、MIC_M,外圍接 口中的 EAR1_0N、EAR1_0P分別連接麥克風(fēng)(MICROPHONE)REC的EAR_M、EAR_P信號(hào)引腳,外圍接口中的MIC_BIAS引腳連接麥克風(fēng)(microphone)mi c的micbia信號(hào)引腳,外圍接口中的line_on、line_op引腳連接ALC5621芯片所連接的MIC_P,MIC_M信號(hào)引腳。
[0025]中央處理器4是系統(tǒng)實(shí)施核心單元,本實(shí)施例的中央處理器4采用ARM Cortex_A8架構(gòu)具體型號(hào)為SAMSUNG S5PV210的ARM微處理器芯片,并且中央處理器4中移植了Android2.0嵌入式操作系統(tǒng)。
[0026]媒體存儲(chǔ)模塊5具體基于芯片K4T1G084QE-HCF7實(shí)現(xiàn)。
[0027]網(wǎng)絡(luò)接口模塊8用于系統(tǒng)與外界的數(shù)據(jù)通訊,可選方式有3G接口模塊、GPRS接口模塊、WIFI接口模塊,本實(shí)施例中采用芯片信號(hào)為REALTEK8188UM3WIFI芯片的WIFI接口模塊。如圖5所示,網(wǎng)絡(luò)接口模塊8基于REALTEK8188UM3WIFI芯片實(shí)現(xiàn),網(wǎng)絡(luò)接口模塊8的SDCH_D1、SDCH_D0、USBDN、USBDP等引腳分別外接中央處理器4。
[0028]匹配搜索服務(wù)端9為接入互聯(lián)網(wǎng)的服務(wù)器,內(nèi)置有音符特征數(shù)據(jù)庫(kù)。
[0029]本實(shí)施例中,語(yǔ)音數(shù)據(jù)處理模塊3采用TI公司的型號(hào)為F28335的DSP芯片實(shí)現(xiàn),本實(shí)施例利用DSP芯片多媒體運(yùn)算能力強(qiáng)的優(yōu)點(diǎn),能夠極大地提升整個(gè)系統(tǒng)的語(yǔ)音數(shù)據(jù)處理速度。如圖6所示,語(yǔ)音數(shù)據(jù)處理模塊3包括用于對(duì)采集的語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理的預(yù)處理模塊31和用于提取基音序列并轉(zhuǎn)換為音符序列的哼唱數(shù)據(jù)處理模塊32,預(yù)處理模塊31包括:
[0030]分幀子模塊311,用于對(duì)語(yǔ)音輸入模塊2采集得到的語(yǔ)音數(shù)據(jù)進(jìn)行分幀。
[0031]加窗子模塊312,用于對(duì)每一幀語(yǔ)音信號(hào)進(jìn)行加漢明窗處理。
[0032]短時(shí)能量計(jì)算子模塊313,用于根據(jù)式(I)計(jì)算每一幀語(yǔ)音信號(hào)的短時(shí)能量。
[0033]
【權(quán)利要求】
1.一種具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置,其特征在于:包括人機(jī)交互模塊(I)、語(yǔ)音輸入模塊(2 )、語(yǔ)音數(shù)據(jù)處理模塊(3 )、中央處理器(4)、媒體存儲(chǔ)模塊(5 )、播放解碼模塊(6 )、音頻輸出模塊(7 )和網(wǎng)絡(luò)接口模塊(8 ),所述語(yǔ)音輸入模塊(2 )與語(yǔ)音數(shù)據(jù)處理模塊(3)的輸入端相連,所述語(yǔ)音數(shù)據(jù)處理模塊(3)與中央處理器(4)相連,所述中央處理器(4)還分別與人機(jī)交互模塊(I)、媒體存儲(chǔ)模塊(5)、網(wǎng)絡(luò)接口模塊(8)相連,且所述中央處理器(4)的輸出端通過(guò)播放解碼模塊(6)與音頻輸出模塊(7)相連。
2.根據(jù)權(quán)利要求1所述的具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置,其特征在于:所述人機(jī)交互模塊(I)為觸摸顯示屏模塊。
3.根據(jù)權(quán)利要求2所述的具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置,其特征在于:所述語(yǔ)音數(shù)據(jù)處理模塊(3)為DSP處理器。
4.根據(jù)權(quán)利要求3所述的具有語(yǔ)音控制和哼唱檢索功能的多媒體播放裝置,其特征在于:所述網(wǎng)絡(luò)接口模塊(8)為3G接口模塊、GPRS接口模塊、WIFI接口模塊中的一種。
【文檔編號(hào)】G10L15/28GK203522960SQ201320422658
【公開(kāi)日】2014年4月2日 申請(qǐng)日期:2013年7月16日 優(yōu)先權(quán)日:2013年7月16日
【發(fā)明者】趙歡, 王飛, 陳佐, 干文潔 申請(qǐng)人:湖南大學(xué)