專(zhuān)利名稱(chēng):智能家居語(yǔ)音控制器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明結(jié)合現(xiàn)場(chǎng)總線(xiàn)技術(shù)可實(shí)現(xiàn)智能家具的集中、非特定人語(yǔ)音控制。
背景技術(shù):
隨著科技的發(fā)展,越來(lái)越多的智能家居產(chǎn)品進(jìn)入人們的生活,現(xiàn)在的智能家居產(chǎn)品是通 過(guò)按鈕控制的,人們要學(xué)會(huì)使用如此多的按鈕是很困難的,且必須接觸按鈕才能實(shí)現(xiàn)智能家 居的控制,盡管遙控器能在一定的距離內(nèi)實(shí)現(xiàn)智能家居的控制,但必須對(duì)準(zhǔn)對(duì)象,這就要求 被控對(duì)象的體積比較大,且距離很有限。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述缺點(diǎn),提供一種更有好的人機(jī)交互界面,使人們能方便地、 自然地對(duì)智能家居進(jìn)行控制。
本發(fā)明為實(shí)現(xiàn)上述目的,采用以下技術(shù)方案智能家居語(yǔ)音控制器,其特征結(jié)合現(xiàn)場(chǎng) 總線(xiàn)技術(shù)、嵌入式技術(shù)可實(shí)現(xiàn)智能家居的集中、非特定人語(yǔ)音控制,且能實(shí)現(xiàn)訓(xùn)練模塊和識(shí) 別模塊的全自動(dòng)化。
所述控制器采用ARM芯片,型號(hào)為S3C2410;所述現(xiàn)場(chǎng)總線(xiàn)技術(shù)釆用RS-485;
本發(fā)明的有益效果提供一種友好的人機(jī)交互界面,使人們能方便地對(duì)智能家居進(jìn)行控
制,其實(shí)現(xiàn)采用嵌入式技術(shù)且操作系統(tǒng)采用Linux,大大節(jié)約了成本。
圖1基于VQ和HMM的語(yǔ)音識(shí)別原理圖 圖2智能家居語(yǔ)音控制系統(tǒng)框圖 圖3RS-485半雙工連接圖 圖4日光燈控制電路圖 圖5電風(fēng)扇控制電路圖 具體實(shí)施措施
下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的具體實(shí)施方式
。
本發(fā)明硬件采用S3C2410處理器、操作系統(tǒng)采用Limix。包括硬件設(shè)計(jì)和軟件設(shè)計(jì)。
硬件部分包括功率放大電路、自增益控制電路(AGC)、低通濾波器和AD變換電路,功 率放大器及自增益電路采用M51304L芯片實(shí)現(xiàn),低通濾波器采用4階巴特沃思性低通濾波器, 截止頻率為4000Hz,其中AD變換電路采用IIS接口。
軟件部分包括音頻設(shè)備程序、特征提取模塊、訓(xùn)練模塊、識(shí)別模塊、以及語(yǔ)音識(shí)別數(shù)據(jù) 庫(kù)的設(shè)計(jì)。
通過(guò)音頻設(shè)備程序可實(shí)現(xiàn)語(yǔ)音信號(hào)的量化,本發(fā)明采用PCM進(jìn)行采樣,采樣頻率為 8000Hz,單聲道量化,量化后的數(shù)據(jù)采用8位有符號(hào)數(shù)據(jù)表示,量化后的數(shù)據(jù)需要進(jìn)行預(yù)加
重,預(yù)加重的傳輸函數(shù)為//(2) = 1-、本系統(tǒng)取為0.98。然后采用多門(mén)限過(guò)零率與短時(shí)能
量相結(jié)合的方法進(jìn)行端點(diǎn)檢測(cè)。
本發(fā)明采用MFCC作為特征向量。首先對(duì)信號(hào)進(jìn)行分幀,每幀為15ms,即120點(diǎn),幀 移為30點(diǎn),分幀后進(jìn)行加窗,窗函數(shù)采用120點(diǎn)的漢明窗,然后對(duì)加窗后的信號(hào)進(jìn)行256點(diǎn) FFT; FFT的輸出經(jīng)過(guò)26維的Mel頻率濾波器組然后取對(duì)數(shù)就得到MFCC,取前面9維及其 一階差分作為特征向量,不取0階。訓(xùn)練模塊設(shè)計(jì)包括碼書(shū)的設(shè)計(jì)和HMM的設(shè)計(jì)以及置信度的設(shè)計(jì)。為每個(gè)單詞設(shè)計(jì)一個(gè) 碼書(shū),碼書(shū)的尺寸選為32.碼書(shū)的設(shè)計(jì)采用LBG算法,但該算法對(duì)初始碼書(shū)的依賴(lài)性較大, 故對(duì)初始碼書(shū)采用刪除算法。在HMM的設(shè)計(jì)中,為每個(gè)單詞建立一個(gè)HMM, HMM的狀態(tài) 數(shù)取為5,察值數(shù)目取為32。HMM的結(jié)構(gòu)采用無(wú)跨越從左到右模型,類(lèi)型則采用離散的HMM。 HMM的訓(xùn)練通常采用Baum-Wdch算法。訓(xùn)練時(shí)需要三至五人,每人對(duì)每個(gè)語(yǔ)句說(shuō)三至五次, 訓(xùn)練的語(yǔ)音存儲(chǔ)在二進(jìn)制文件中,然后再對(duì)該文件進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)。
識(shí)別模塊包括矢量量化和觀察值序列的概率計(jì)算以及拒識(shí)。語(yǔ)音矢量經(jīng)過(guò)矢量量化分配 給某個(gè)碼字所代表的胞腔,然后用該碼字的索引作為待識(shí)別語(yǔ)音的標(biāo)識(shí)。把從矢量量化器輸 出的碼字索引序列轉(zhuǎn)化為觀察值序列,進(jìn)一步計(jì)算該HMM產(chǎn)生該序列的概率,概率的計(jì)算 采用前向-后向算法,然后對(duì)概率的對(duì)數(shù)與量化失真之差最大的詞條進(jìn)一步處理,如果該概率 大于給定的閥值,則執(zhí)行相應(yīng)的控制命令。該命令由ARM通過(guò)其UART端口發(fā)送到RS-485 總線(xiàn)上。如果該HMM產(chǎn)生該序列的概率小于給定的閥值時(shí),則ARM不發(fā)送控制命令。閥 值是訓(xùn)練時(shí)產(chǎn)生的該詞條的概率對(duì)數(shù)與量化失真之差的最小值。拒識(shí)方法除了設(shè)置閥值外, 還結(jié)合該語(yǔ)音模型的幀數(shù),即識(shí)別語(yǔ)句只有幀數(shù)與該模型相接近時(shí),才有可能被認(rèn)為該語(yǔ)句。 圖1中置信度是閥值與語(yǔ)音幀數(shù)同時(shí)滿(mǎn)足的情況。
本發(fā)明中共設(shè)計(jì)兩個(gè)數(shù)據(jù)庫(kù),利用BerkeleyDB實(shí)現(xiàn), 一個(gè)用于存儲(chǔ)碼書(shū),另一個(gè)用于存 儲(chǔ)HMM的參數(shù)。并且利用BerkdeyDB的open函數(shù)實(shí)現(xiàn)了訓(xùn)練模塊和識(shí)別模塊的自動(dòng)化。 方法為首先利用open函數(shù)以DB—RDONLY打開(kāi)數(shù)據(jù)庫(kù),如果函數(shù)返回值為-1,則執(zhí)行識(shí) 別程序,否則執(zhí)行訓(xùn)練程序。
下面講述智能家居語(yǔ)音控制器是如何控制各種設(shè)備的。
經(jīng)智能家居語(yǔ)音控制器識(shí)別后的語(yǔ)音如果是控制信號(hào),如"開(kāi)燈"、"關(guān)燈"等,則通過(guò) RS-485接口發(fā)送到總線(xiàn)上,連接在總線(xiàn)上的智能家居對(duì)信號(hào)進(jìn)行檢測(cè),如果智能家居能識(shí)別 總線(xiàn)上的信號(hào)則執(zhí)行相應(yīng)命令,不能識(shí)別則什么都不做。例如,當(dāng)語(yǔ)音控制器發(fā)送"開(kāi)燈信 號(hào)"時(shí),連接在總線(xiàn)上的圖4的單片機(jī)能識(shí)別該信號(hào),然后向P1.0發(fā)送高電平,三極管導(dǎo)通, 繼電器K吸合,則日光燈打開(kāi),而圖5的單片機(jī)智能識(shí)別"調(diào)為l檔"、"調(diào)為2檔"等指令, 不能識(shí)別"開(kāi)燈",故什么都不做,當(dāng)語(yǔ)音控制器發(fā)送與電風(fēng)扇相關(guān)的控制信號(hào)時(shí),圖5的單 片機(jī)根據(jù)不同的控制信號(hào),向晶閘管發(fā)送不同占空比的信號(hào)則可以控制電風(fēng)扇的轉(zhuǎn)速。
權(quán)利要求
1.智能家居語(yǔ)音控制器通過(guò)按鈕對(duì)智能家居進(jìn)行控制,其特征結(jié)合嵌入式技術(shù)、語(yǔ)音識(shí)別技術(shù)以及現(xiàn)場(chǎng)總線(xiàn)技術(shù)實(shí)現(xiàn)了智能家居的集中、非特定人語(yǔ)音控制且訓(xùn)練模塊和識(shí)別模塊是全自動(dòng)化的。
全文摘要
智能家居語(yǔ)音控制器。它結(jié)合語(yǔ)音識(shí)別技術(shù)、嵌入式技術(shù)以及現(xiàn)場(chǎng)總線(xiàn)技術(shù)實(shí)現(xiàn)了智能家居的集中、非特定人語(yǔ)音控制,且控制模塊和識(shí)別模塊是全自動(dòng)的,提供了良好的人機(jī)交互界面。
文檔編號(hào)G10L15/00GK101673112SQ20091011252
公開(kāi)日2010年3月17日 申請(qǐng)日期2009年9月17日 優(yōu)先權(quán)日2009年9月17日
發(fā)明者李華東 申請(qǐng)人:李華東