两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

嵌入式語音識(shí)別系統(tǒng)的制作方法

文檔序號(hào):2837625閱讀:917來源:國(guó)知局

專利名稱::嵌入式語音識(shí)別系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本實(shí)用新型涉及一種語音的自動(dòng)識(shí)別技術(shù),尤其涉及一種用于小規(guī)模語音識(shí)別產(chǎn)品的嵌入式語音識(shí)別系統(tǒng)。
背景技術(shù)
:自動(dòng)語音識(shí)別技術(shù)屬于IT行業(yè)比較邊緣的技術(shù),經(jīng)20多年的發(fā)展已逐步走向成熟。它是采用電腦或獨(dú)立電子裝置來自動(dòng)識(shí)別人類自然語音的技術(shù),因而,可以應(yīng)用于任何需要使用語音向電子裝置輸入信息的情景。特別是最近五年來,由于微電子產(chǎn)業(yè)的快速發(fā)展以及相關(guān)
技術(shù)領(lǐng)域
的成熟,使得語音識(shí)別這一長(zhǎng)期以來的愿望逐步成為可能。嵌入式語音識(shí)別技術(shù),特指在電腦以外的獨(dú)立裝置上運(yùn)行的技術(shù)。業(yè)界逐漸認(rèn)為,它有著比非嵌入式語音識(shí)別技術(shù)更廣泛的應(yīng)用范圍和前景。由于語音識(shí)別技術(shù)本身的諸多復(fù)雜性,以及一般嵌入式——如手機(jī)等裝置,需要額外解決如環(huán)境噪音等諸多問題,因此,使得這一領(lǐng)域不論在國(guó)內(nèi)還是在國(guó)外,至今均沒有出現(xiàn)令人滿意的實(shí)用產(chǎn)品。進(jìn)而,由于小型嵌入式——如智能玩具等單一芯片系統(tǒng),需要面對(duì)低成本限制所帶來的系統(tǒng)資源有限,并且需要達(dá)到一定的識(shí)別準(zhǔn)確率,因此,就更加具有挑戰(zhàn)性。目前,大多數(shù)嵌入式語音識(shí)別系統(tǒng)中的關(guān)鍵內(nèi)核技術(shù),都是采用現(xiàn)成芯片或模塊集成到系統(tǒng)中去的,由于存在抗噪音和有限系統(tǒng)資源等方面存在的問題,因此,這些芯片或模塊都不能做到相對(duì)完善的程度,市場(chǎng)上也不存在標(biāo)準(zhǔn)的產(chǎn)品供開發(fā)者選用并集成。另外,由于系統(tǒng)控制方式與算法的缺陷,也使得該系統(tǒng)使用時(shí)要占用大量系統(tǒng)資源,在識(shí)別過程中有可能會(huì)耗費(fèi)大量電能,從而影響嵌入式語音識(shí)別系統(tǒng)的正常使用。
發(fā)明內(nèi)容本實(shí)用新型的目的在于提供一種嵌入式語音識(shí)別系統(tǒng),它針對(duì)于中小型嵌入式語音識(shí)別技術(shù)的特點(diǎn),通過科學(xué)合理的算法模型,并通過芯片或模塊的設(shè)計(jì)優(yōu)化與集成,使系統(tǒng)達(dá)到較佳的使用性能。為實(shí)現(xiàn)本實(shí)用新型的目的,一種嵌入式語音識(shí)別系統(tǒng),包括語音拾取裝置,與語音拾取裝置相連的模數(shù)轉(zhuǎn)換器,與模數(shù)轉(zhuǎn)換器相連的識(shí)別算法部分,主程序部分與識(shí)別算法部分、增益控制部分及驅(qū)動(dòng)控制等執(zhí)行部分相連接,以及用于存儲(chǔ)識(shí)別器算法固定參數(shù)的內(nèi)存器,所述的語音識(shí)別算法部分包括與模數(shù)轉(zhuǎn)換器相接的端點(diǎn)檢測(cè)部分、前置降噪、特征提取和隱式馬爾科夫模型(H麗)識(shí)別器部分,馬爾科夫模型識(shí)別器還與語言模型參數(shù)模塊和參數(shù)適配模塊相適配,端點(diǎn)檢測(cè)部分與特征提取部分均與增益控制部分連接。本實(shí)用新型的優(yōu)點(diǎn)是該系統(tǒng)通過科學(xué)的算法模型,結(jié)合嵌入式語音識(shí)別技術(shù)的優(yōu)化設(shè)計(jì),解決了語音識(shí)別技術(shù)在現(xiàn)實(shí)使用過程中的瓶頸,從而實(shí)現(xiàn)了以最經(jīng)濟(jì)有效的形式達(dá)到中小型語音識(shí)別系統(tǒng)所要達(dá)到的使用要求。以下結(jié)合附圖對(duì)本實(shí)用新型嵌入式語音識(shí)別系統(tǒng)作進(jìn)一步的詳細(xì)說明-圖1為本實(shí)用新型嵌入式語音識(shí)別系統(tǒng)的工作原理框圖;圖2為本實(shí)用新型嵌入式語音識(shí)別系統(tǒng)中識(shí)別器的工作原理框圖。具體實(shí)施方式如圖l、2所示,一種嵌入式語音識(shí)別系統(tǒng),主要包括語音拾取裝置,與語音拾取裝置相連的模數(shù)轉(zhuǎn)換器,與模數(shù)轉(zhuǎn)換器相連的識(shí)別算法部分,主程序部分與識(shí)別算法部分、增益控制部分及驅(qū)動(dòng)控制等執(zhí)行部分相連接,以及用于存儲(chǔ)識(shí)別器算法固定參數(shù)的內(nèi)存器;上述的語音拾取裝置主要是指有線或無線的話筒;上述的主程序控制部分通過聲頻輸出與揚(yáng)聲器相連,對(duì)話過程中識(shí)別器發(fā)出的語音、音樂由該揚(yáng)聲器發(fā)出;上述的語音識(shí)別算法部分包括與模數(shù)轉(zhuǎn)換器相接的端點(diǎn)檢測(cè)部分、前置降噪、特征提取和隱式馬爾科夫模型(HMM)識(shí)別器部分,馬爾科夫模型識(shí)別器還與語言模型參數(shù)模塊和參數(shù)適配模塊相適配,端點(diǎn)檢測(cè)部分與特征提取部分均與增益控制部分連接;由所述模數(shù)轉(zhuǎn)換器、識(shí)別算法部分、主程序部分、增益控制部分及驅(qū)動(dòng)控制執(zhí)行部分等組成的專用集成電路(ASIC),其結(jié)構(gòu)基礎(chǔ)采用數(shù)字信號(hào)處理器(DSP)類芯片作為基本硬件結(jié)構(gòu),且內(nèi)部包含有高效運(yùn)算單元和外圍接口電路,所述的數(shù)字信號(hào)處理器(DSP)類芯片采用16位定點(diǎn)數(shù)字信號(hào)處理器(DSP),系統(tǒng)電路中還設(shè)置有電平喚醒電路,該電路設(shè)置在語音拾取裝置之后并與主程序部分連接。具體結(jié)構(gòu)及工作過程描述如下如圖1所示,為嵌入式語音識(shí)別系統(tǒng)的總體結(jié)構(gòu)。其中黑線框內(nèi)為專用集成電路(ASIC)部分,虛線所示模塊表示在某些類型系統(tǒng)中的可選部分。當(dāng)語音拾取裝置采用單一的話筒時(shí),該主話筒收取語音輸入信號(hào),經(jīng)模數(shù)轉(zhuǎn)換為數(shù)碼信號(hào),送至識(shí)別器算法部分。在多話筒產(chǎn)品中,另有一個(gè)或多個(gè)輔話筒收取其它信號(hào)經(jīng)有線或無線連接傳送到另外路徑的模數(shù)轉(zhuǎn)換,同樣送到識(shí)別器算法。這些輔話筒的信號(hào)作用是,在某些聲場(chǎng)環(huán)境下,更佳地去除背景噪音影響的算法所用。所有模數(shù)轉(zhuǎn)換器的增益可以經(jīng)算法和主程序進(jìn)行動(dòng)態(tài)控制。識(shí)別的輸出結(jié)果經(jīng)必要的控制驅(qū)動(dòng),對(duì)外部動(dòng)作進(jìn)行控制,例如電動(dòng)機(jī)、燈、顯示等,具體控制的類型和數(shù)量根據(jù)需要而設(shè)定。語音識(shí)別和對(duì)話過程中識(shí)別器發(fā)出的語音或音樂等輸出,經(jīng)聲頻輸出推動(dòng)揚(yáng)聲器發(fā)聲。內(nèi)存器用來存儲(chǔ)識(shí)別器算法所用的固定參數(shù)部分,以及識(shí)別過程需要的變化部分。另外,整個(gè)系統(tǒng)還設(shè)置有電池供電。在有些類型的系統(tǒng)中,還需要有外存來存儲(chǔ)部分的模型和系統(tǒng)參數(shù),以靈活地滿足中小批量客戶的多樣需求。如圖2所示,為所述語音識(shí)別器及其相關(guān)的主要算法部分。經(jīng)模數(shù)轉(zhuǎn)換的連續(xù)數(shù)碼輸入信號(hào),由端點(diǎn)探測(cè)模塊確定輸入信號(hào)中語音部分的起始和結(jié)束點(diǎn);這樣可以使語音識(shí)別算法部分僅僅集中計(jì)算屬于語音的信號(hào)。同時(shí),結(jié)合外部簡(jiǎn)單的電平喚醒電路,系統(tǒng)諸多運(yùn)算模塊在多數(shù)沒有聲音的時(shí)間段,都處于低耗電的待機(jī)狀態(tài)。在探測(cè)到語音輸入時(shí),由一有限狀態(tài)機(jī)協(xié)助確定,并在這段時(shí)間內(nèi)進(jìn)行語音識(shí)別的運(yùn)算。而后,根據(jù)單話筒或多話筒系統(tǒng),基于當(dāng)時(shí)環(huán)境噪音的強(qiáng)弱,動(dòng)態(tài)地壓縮噪音部分,盡量保持干凈的語音信號(hào)進(jìn)入后繼模塊。降噪模塊部分地利用了端點(diǎn)探測(cè)的結(jié)果,來區(qū)分含語音及純?cè)胍舻男盘?hào)。特征提取模塊將輸入語音信號(hào)分成等時(shí)間間隔的"禎",對(duì)每一禎的數(shù)碼語音信號(hào)進(jìn)行數(shù)字信號(hào)處理操作,而獲取簡(jiǎn)捷描述最有用的語音信息部分,稱為"特征向量"。輸入部分的增益控制量的計(jì)算采用一部分特征;同時(shí)利用了端點(diǎn)探測(cè)模塊所獲取的對(duì)于噪音的跟蹤區(qū)別信息,從而對(duì)于純?cè)胍糨斎胄盘?hào)提供小增益。全部的語音特征送至隱式馬爾科夫模型(HMM)識(shí)別器進(jìn)行識(shí)別。識(shí)別的過程同時(shí)需要模型參數(shù),包括"訓(xùn)練"好的語音模型參數(shù),以及關(guān)于"語法"的語言模型參數(shù),參數(shù)適配模塊動(dòng)態(tài)地對(duì)語音特征向量的多種變化進(jìn)行適配,包括音量變化、說話者語音變化、以及聲音傳輸通道特性如空間回音帶來的變化等,適配的效果是盡量忽略這些變化,使得這些變化對(duì)于語音識(shí)別效果的影響達(dá)到最小。語音識(shí)別的結(jié)果,包括識(shí)別到的詞匯序列、關(guān)鍵詞、以及理解到的概念單元,輸出到系統(tǒng)其它部分。本實(shí)用新型中,這種嵌入式語音識(shí)別技術(shù)所涉及的內(nèi)核技術(shù)是-在語言參數(shù)的模塊中,為在小型數(shù)字信號(hào)處理器(DSP)硬件平臺(tái)上實(shí)現(xiàn)連續(xù)語音識(shí)別、語音理解和"關(guān)鍵詞檢出"功能所采取的一種子詞單元,作為隱式馬爾科夫模型(HMM)模型參數(shù)的結(jié)構(gòu)單元,所選子詞為包含臨域影響的通用無調(diào)雙音(contextdependentgeneralizedtonelessbiphone)。這禾中具體子i司適應(yīng)于中文語音識(shí)別,而對(duì)于其它語種的識(shí)別有類似技術(shù)手段來定義最合適的子詞單元;在上述的嵌入式語音識(shí)別系統(tǒng)的內(nèi)核技術(shù)中,所述的包含臨域影響的通用無調(diào)雙音子詞單元,同時(shí)使用大量不同說話者的語音數(shù)據(jù)對(duì)隱式馬爾科夫模型(HMM)參數(shù)進(jìn)行出廠前訓(xùn)練的方法,識(shí)別系統(tǒng)能夠正確識(shí)別一種語言中全部詞匯和所有未來說話者的語音,而無須采用這些未來說話者的任何語音資料。具體而言,在小型系統(tǒng)上,須實(shí)現(xiàn)基于子詞的連續(xù)語音識(shí)別、關(guān)鍵詞檢出及語音理解等功能要求,其具體技術(shù)過程描述如下-由于現(xiàn)有絕大多數(shù)小型語音識(shí)別系統(tǒng)都是對(duì)于整個(gè)語音指令的識(shí)別,同時(shí)所有指令都需要使用者事先錄入。例如,對(duì)于一個(gè)簡(jiǎn)單的寵物玩具產(chǎn)品,使用者需要錄入"過來"、"走開"、"向左"、"向右"等。錄入完成后,使用中也必須說出完全相同的指令,如上述4個(gè)指令之一。這樣的識(shí)別器系統(tǒng)結(jié)構(gòu)簡(jiǎn)單,但是在使用中受到局限,例如,它無法滿意識(shí)別"你過來呀"等,與錄入時(shí)不完全相同的語句。這類問題被系統(tǒng)地稱為"不規(guī)范語音"問題。人類在自然的語音對(duì)話中,多數(shù)是不完全規(guī)范的,在表示相同"意思"時(shí),可以有很多不同的表示方法。在大型語音識(shí)別己經(jīng)成功使用若干方法來解決這類問題,達(dá)到使用者一定程度上感覺用自然方式對(duì)話,而不是迫使說話者一定說預(yù)先約定的指令。為達(dá)到上述目的,系統(tǒng)首先要能夠識(shí)別連續(xù)的語音,而不僅僅是孤立的指令。最靈活的實(shí)現(xiàn)方式就是采用詞內(nèi)單元"子詞"作為系統(tǒng)的基本模型單元,進(jìn)而用這些單元來組建一種語言中的所有詞匯。實(shí)驗(yàn)語音學(xué)的理論提出若干種常用的基本單元,如"音素"和"音節(jié)"。本實(shí)用新型具體設(shè)計(jì)和實(shí)驗(yàn)過程最終確定了從理論與語音識(shí)別的工程實(shí)踐角度達(dá)到最佳的子詞單元;它既最簡(jiǎn)地代表了一種語言中的不同語音,又包含了音素間不同的轉(zhuǎn)換鄰域聲學(xué)影響。對(duì)于漢語普通話來說,我們選用無調(diào)generalizedbiphone(通用雙音,無字間鄰域影響)作為子詞單元。下表例舉一些通用雙音與漢語單字的關(guān)系。可見,字內(nèi)鄰域的影響己經(jīng)經(jīng)過根據(jù)音素類別的組合,例如dtnl-ai表示,ai左邊(以-表示左)的l的鄰域影響已經(jīng)組合為(d,t,n.l)—類聲母的影響了。<table>tableseeoriginaldocumentpage7</column></row><table>其次,語音識(shí)別器需要建立一種能夠識(shí)別整個(gè)語句中的一部分的能力,而不是僅僅能夠識(shí)別整個(gè)語音。這稱為'關(guān)鍵詞檢出'。從而,對(duì)于上述玩具指令的例子,當(dāng)使用者說"過來"、"你過來呀"、或"請(qǐng)你走過來"等,總之任何包含"過來"的語句時(shí),玩具都能夠正確反應(yīng)。另外,更加進(jìn)一步地允許輸入語音的"模糊"程度,屬于簡(jiǎn)單的"語音理解"功能。對(duì)于一個(gè)具體的對(duì)話互動(dòng)程序,對(duì)于對(duì)話雙方感興趣的話題,將它們通過類似關(guān)鍵詞的方式,在識(shí)別的"語法"中對(duì)于"概念單元"進(jìn)行事先的標(biāo)注。在識(shí)別的過程中,系統(tǒng)根據(jù)這些概念單元出現(xiàn)與否、它們出現(xiàn)的相對(duì)順序等事先約定的關(guān)系,以及它們的取值,綜合判斷出說話者所說的"意思",而不一定是完全固定的語句。本實(shí)用新型中所設(shè)計(jì)并實(shí)驗(yàn)決定使用的技術(shù)達(dá)到了對(duì)于中小型識(shí)別對(duì)話程序的理想效果。在本實(shí)用新型中,還涉及到的嵌入式語音識(shí)別系統(tǒng)的另一內(nèi)核技術(shù)是基于前述的隱式馬爾科夫模型(以下也可簡(jiǎn)稱"HMM")的高精度語音識(shí)別基礎(chǔ)結(jié)構(gòu)和算法,它是在小型數(shù)字信號(hào)處理器(DSP)硬件平臺(tái)上實(shí)時(shí)實(shí)現(xiàn)的;在所述小型數(shù)字信號(hào)處理器(DSP)硬件平臺(tái)上實(shí)時(shí)實(shí)現(xiàn)所必須的、有別于在大型系統(tǒng)上實(shí)現(xiàn)的特殊技術(shù),包括合理高效使用有限存儲(chǔ)空間,和保持運(yùn)算精度的半浮點(diǎn)模擬運(yùn)算;為保持高精度續(xù)概率密度同時(shí)又高效使用有限存儲(chǔ)空間的方法,根據(jù)語音學(xué)知識(shí)以及數(shù)據(jù)統(tǒng)計(jì)分布而做的對(duì)于HMM參數(shù)的分類被共享使用(也被稱為"半連續(xù)概率密度")。為了完成對(duì)中小型嵌入式語音識(shí)別的任務(wù),需要選擇在低價(jià)格芯片架構(gòu)上切實(shí)可行的,同時(shí)又達(dá)到一定運(yùn)算精度的基本算法結(jié)構(gòu)。近代語音識(shí)別的技術(shù)己經(jīng)經(jīng)歷了20多年的發(fā)展歷史,因而對(duì)于最成熟的算法己經(jīng)有了深刻認(rèn)識(shí)。這算法結(jié)構(gòu)除了具有良好的數(shù)學(xué)基礎(chǔ),也已經(jīng)在語音識(shí)別技術(shù)的實(shí)踐中得到驗(yàn)證。至今為止的絕大多數(shù)大型語音識(shí)別系統(tǒng)均采用基于HMM的統(tǒng)計(jì)算法結(jié)構(gòu),取得了業(yè)內(nèi)最好的識(shí)別效果。但是由于該算法所具有的復(fù)雜程度,在小型嵌入式識(shí)別系統(tǒng)實(shí)現(xiàn)它有很大難度。從而至今為止絕大多數(shù)小型嵌入語音識(shí)別都是采用更簡(jiǎn)單的DTW(動(dòng)態(tài)時(shí)軸壓縮)算法。但是DTW的結(jié)構(gòu)帶來若干局限,主要是它無法有效地獲取實(shí)際語音中的諸多變化,諸如口音以及聲學(xué)環(huán)境的變化;從而它的識(shí)別效果較差,特別是針對(duì)多說話者不同的語音,以及連續(xù)語音的識(shí)別。在本實(shí)用新型專利的方法中,針對(duì)小型嵌入式語音識(shí)別系統(tǒng),為了完整地實(shí)現(xiàn)HMM的統(tǒng)計(jì)結(jié)構(gòu)算法。首先,要保證充分的計(jì)算精度,保留了大規(guī)模系統(tǒng)中使用的"連續(xù)概率密度"結(jié)構(gòu)。這結(jié)構(gòu)中,系統(tǒng)事先存儲(chǔ)的是這些高斯密度函數(shù)的參數(shù);對(duì)于輸入的語音特征向量,以及權(quán)重高斯密度函數(shù)來進(jìn)行概率運(yùn)算。這些計(jì)算量比較大。本實(shí)用新型采用的簡(jiǎn)化方法包含對(duì)于一類的參數(shù)浮點(diǎn)值采用相同的冪,而實(shí)際使用定點(diǎn)運(yùn)算,等。對(duì)比的結(jié)構(gòu)可稱為'離散概率'系統(tǒng),它是選取事先存儲(chǔ)的"碼本"值,因此減少了識(shí)別時(shí)的運(yùn)算量。但是由于這些碼本值的獲取過程已經(jīng)引入很大誤差,'離散概率'系統(tǒng)通常的精度會(huì)比'連續(xù)密度'系統(tǒng)有很大下降,因而本實(shí)用新型沒有采用。其次,由于小型系統(tǒng)存儲(chǔ)空間的局限,巨大數(shù)量的HMM參數(shù)經(jīng)過巧妙結(jié)構(gòu),做到很大程度地多次共享使用。這共享的理論基礎(chǔ)是語音學(xué)及語言學(xué)的知識(shí),以及這類信息在統(tǒng)計(jì)系統(tǒng)中的分布結(jié)構(gòu)。以下舉例量化說明共享系統(tǒng)中參數(shù)量的減小系統(tǒng)中每一基本語音單元(如b+a)由一HMM模型表示,而該模型具有S個(gè)"狀態(tài)",例如S-3個(gè)態(tài)sl,s2,s3。每一個(gè)態(tài)包含對(duì)于特征禎信號(hào)的一個(gè)"觀察概率密度",它通常是N個(gè)高斯分布函數(shù)的加權(quán)組合(例如N=8)來比較完善地表述實(shí)際信號(hào)的不同取值分布。通常一個(gè)特征禎向量含M個(gè)分量(例如M-20);而每一個(gè)M—維(獨(dú)立維)高斯密度函數(shù)需要2M個(gè)參數(shù)來表述。進(jìn)而,因?yàn)檎麄€(gè)一種語言語音(如漢語普通話)需要K個(gè)基本語音單元來表示(通常K-300以上),那么,整個(gè)系統(tǒng)就至少需要SxKxN=7200個(gè)高斯密度函數(shù),等于2MxSxKxN-40x3x300x8-288000個(gè)參數(shù)。另外還有7200個(gè)權(quán)重系數(shù)及少量其它參數(shù)。對(duì)于中小型嵌入系統(tǒng)來講,這么多的參數(shù)要求的存儲(chǔ)空間過于繁重。而從另外角度講,中小型的識(shí)別'任務(wù)'中需要分辨的不同語音事件的數(shù)量比較有限,所以可以不需要這么多參數(shù)來表述。本實(shí)用新型采取的方法是,首先用統(tǒng)計(jì)方法獲取代表整個(gè)系統(tǒng)"聲學(xué)空間"的一個(gè)統(tǒng)一的高斯密度函數(shù)庫(kù),它包含從上述7200個(gè)高斯密度函數(shù)中選出的P個(gè)高斯密度函數(shù)(例如P-200)作為代表。而系統(tǒng)中不同的基本語音單元的HMM態(tài)共享這庫(kù)中的高斯密度函數(shù)。每一個(gè)HMM的每一個(gè)態(tài)s根據(jù)語音訓(xùn)練過程中的情況,各自選取這P個(gè)密度函數(shù)中的8個(gè);不同態(tài)可以選用一些相同的高斯密度函數(shù),但有自己各自不同的權(quán)重系數(shù)。這樣,總共只需要2MxP+SxKxN-40x200+3x300x8-15200個(gè)參數(shù),僅相當(dāng)于上述非共享系統(tǒng)參數(shù)量的5%左右。在實(shí)踐中,這種態(tài)共享系統(tǒng)可以達(dá)到與非共享系統(tǒng)基本相同的識(shí)別效果,同時(shí)從根本上解決了有限存儲(chǔ)空間的問題。權(quán)利要求1、一種嵌入式語音識(shí)別系統(tǒng),包括語音拾取裝置,與語音拾取裝置相連的模數(shù)轉(zhuǎn)換器,與模數(shù)轉(zhuǎn)換器相連的識(shí)別算法部分,主程序部分與識(shí)別算法部分、增益控制部分及驅(qū)動(dòng)控制等執(zhí)行部分相連接,以及用于存儲(chǔ)識(shí)別器算法固定參數(shù)的內(nèi)存器,其特征在于所述的語音識(shí)別算法部分包括與模數(shù)轉(zhuǎn)換器相接的端點(diǎn)檢測(cè)部分、前置降噪、特征提取和隱式馬爾科夫模型(HMM)識(shí)別器部分,馬爾科夫模型識(shí)別器還與語言模型參數(shù)模塊和參數(shù)適配模塊相適配,端點(diǎn)檢測(cè)部分與特征提取部分均與增益控制部分連接。2、根據(jù)權(quán)利要求1所述的一種嵌入式語音識(shí)別系統(tǒng),其特征在于由所述模數(shù)轉(zhuǎn)換器、識(shí)別算法部分、主程序部分、增益控制部分及驅(qū)動(dòng)控制執(zhí)行部分等組成的專用集成電路(ASIC),其結(jié)構(gòu)基礎(chǔ)采用數(shù)字信號(hào)處理器(DSP)類芯片作為基本硬件結(jié)構(gòu),且內(nèi)部包含有高效運(yùn)算單元和外圍接口電路。3、根據(jù)權(quán)利要求2所述的一種嵌入式語音識(shí)別系統(tǒng),其特征在于所述的數(shù)字信號(hào)處理器(DSP)類芯片采用16位定點(diǎn)數(shù)字信號(hào)處理器(DSP)。4、根據(jù)權(quán)利要求l所述的一種嵌入式語音識(shí)別系統(tǒng),其特征在于所述的系統(tǒng)中還設(shè)置有電平喚醒電路,該電路設(shè)置在語音拾取裝置之后并與主程序部分連接。5、根據(jù)權(quán)利要求l、2、3或4所述的一種嵌入式語音識(shí)別系統(tǒng),其特征在于所述的主程序控制部分通過聲頻輸出與揚(yáng)聲器相連,對(duì)話過程中識(shí)別器發(fā)出的語音、音樂由該揚(yáng)聲器發(fā)出。專利摘要本實(shí)用新型公開了一種嵌入式語音識(shí)別系統(tǒng),包括語音拾取裝置,與語音拾取裝置相連的模數(shù)轉(zhuǎn)換器,與模數(shù)轉(zhuǎn)換器相連的識(shí)別算法部分,主程序部分與識(shí)別算法部分、增益控制部分及驅(qū)動(dòng)控制等執(zhí)行部分相連接,以及用于存儲(chǔ)識(shí)別器算法固定參數(shù)的內(nèi)存器,所述的語音識(shí)別算法部分包括與模數(shù)轉(zhuǎn)換器相接的端點(diǎn)檢測(cè)部分、前置降噪、特征提取和隱式馬爾科夫模型識(shí)別器部分,馬爾科夫模型識(shí)別器還與語言模型參數(shù)模塊和參數(shù)適配模塊相適配,端點(diǎn)檢測(cè)部分與特征提取部分均與增益控制部分連接,其優(yōu)點(diǎn)是算法模型科學(xué)合理,通過嵌入式語音識(shí)別技術(shù)的優(yōu)化設(shè)計(jì),實(shí)現(xiàn)了系統(tǒng)的最佳使用效果。文檔編號(hào)G10L15/00GK201066582SQ20072003715公開日2008年5月28日申請(qǐng)日期2007年4月30日優(yōu)先權(quán)日2007年4月30日發(fā)明者雪王申請(qǐng)人:張家港市思韻語音科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
务川| 利川市| 东乌珠穆沁旗| 通许县| 章丘市| 榆树市| 通渭县| 曲沃县| 志丹县| 互助| 海安县| 阿拉善盟| 吉水县| 达尔| 犍为县| 石城县| 尚志市| 西峡县| 清原| 佛学| 交口县| 东乡县| 南漳县| 河曲县| 云霄县| 湟中县| 洛宁县| 白沙| 彭州市| 上思县| 长子县| 岚皋县| 万荣县| 芒康县| 彭州市| 磐安县| 麻江县| 施甸县| 潞西市| 芮城县| 东辽县|