两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng)的制作方法

文檔序號:12368745閱讀:487來源:國知局

本發(fā)明屬于車聯(lián)網(wǎng)服務(wù)技術(shù)領(lǐng)域,尤其涉及一種基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng)。



背景技術(shù):

隨著經(jīng)濟的飛速發(fā)展,汽車成了人們最喜歡也最常用的出行工具,給人們生活帶來了巨大的便利;但同時很多交通問題不斷涌現(xiàn),所以這迫使人們采用高新技術(shù)來解決道路交通的許多問題,而智能交通便應(yīng)運而生。而作為智能交通基礎(chǔ)的車聯(lián)網(wǎng)技術(shù)在近幾年得到了飛速發(fā)展,不少人也開始發(fā)現(xiàn)其潛力。車聯(lián)網(wǎng)技術(shù)將成為汽車發(fā)展的另一方向,在并不遙遠的將來,它可能會帶給汽車業(yè)一場新的變革。從這一點出發(fā),本發(fā)明提出了一個基于車聯(lián)網(wǎng)技術(shù)的智能交通系統(tǒng),通過智能交通系統(tǒng)中車輛信息平臺來監(jiān)控和管理車輛。

車聯(lián)網(wǎng)技術(shù)是智能交通的基礎(chǔ),RFID射頻識別技術(shù),GPS定位技術(shù)、傳感器技術(shù)及傳感信息融合技術(shù)等技術(shù)的發(fā)展是智能交通系統(tǒng)的保障,智能交通系統(tǒng)力爭為汽車駕駛者、管理者、政府等提供一系列智能化、可擴展、集成化的服務(wù)平臺。將服務(wù)全面延伸到汽車生活的各個方面,從用戶的角度出發(fā),處處為用戶著想,服務(wù)于用戶。車輛信息服務(wù)平臺是智能交通系統(tǒng)的子系統(tǒng),通過對報警管理、車輛控制、基礎(chǔ)信息管理、系統(tǒng)管理等幾個模塊的設(shè)計,使用戶可以通過平臺來瀏覽車輛信息,了解車輛發(fā)生報警的實時情況,實現(xiàn)對車輛的管理和監(jiān)控。

通常,語音識別系統(tǒng)都會設(shè)置一個詞匯表,系統(tǒng)對包含于該詞匯表中的詞條進行識別。在現(xiàn)有技術(shù)中,大詞匯量語音識別技術(shù)都需要觸發(fā)后才能夠開始識別,因為如果識別系統(tǒng)一直監(jiān)聽錄音,由于大詞匯量語音識別系統(tǒng)詞匯量過多,受到的錄音干擾較大,容易發(fā)生虛警,導(dǎo)致用戶根本沒有說話就會輸出識別結(jié)果。

而這種通過觸發(fā)實現(xiàn)大詞匯量識別的方法不僅智能化低,而且會為用戶帶來諸多不便,比如在行車過程中用手進行觸發(fā)操作會導(dǎo)致安全性問題。

在行車時,當(dāng)遇到一些突發(fā)事情或危險時,用戶會發(fā)出不同的聲音請求,在不能正確處理這些信號時,外部救援中心無法判斷其真實狀況進行救援。



技術(shù)實現(xiàn)要素:

為了解決上述技術(shù)問題,本發(fā)明提供一種基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng),旨在解決現(xiàn)有的基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng)結(jié)構(gòu)復(fù)雜、智能化程度低等的問題。

一種基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng),該基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng)包括汽車車機端、T-BOX端、TSP云平臺數(shù)據(jù)庫;所述汽車車機端由語音識別模塊、語義分析模塊、數(shù)據(jù)檢索模塊、語音播放模塊、語音數(shù)據(jù)處理模塊組成;所述T-BOX端由汽車車聯(lián)網(wǎng)通信模塊、車輛數(shù)據(jù)解析模塊、汽車專題數(shù)據(jù)查詢模塊組成;

所述汽車車機端用于實現(xiàn)人機交互的界面層,汽車駕乘人員通過所述語音識別模塊將人的自然語言進行識別,并將識別后的數(shù)據(jù)送至其內(nèi)部的所述語義分析模塊;

所述語義分析模塊用于進行語義分析,依據(jù)語義分析的結(jié)果檢索需要回復(fù)的聊天內(nèi)容,并通過汽車車機端以音頻的形式告知汽車駕乘人員;

所述數(shù)據(jù)檢索模塊所要檢索的數(shù)據(jù)來源通過汽車的通信網(wǎng)絡(luò)獲得,所述汽車車機端的數(shù)據(jù)檢索模塊將需要檢索的數(shù)據(jù)發(fā)給汽車通信網(wǎng)絡(luò)內(nèi)部的汽車車聯(lián)網(wǎng)通信模塊;

所述汽車車聯(lián)網(wǎng)通信模塊進行判斷是否對車輛實時狀況信息的檢索,若是,則所述汽車車聯(lián)網(wǎng)通信模塊將檢索需求信息發(fā)送給所述車輛數(shù)據(jù)解析模塊;

所述數(shù)據(jù)解析模塊將汽車車聯(lián)網(wǎng)通信模塊發(fā)送的需求信息,解析為汽車內(nèi)部總線可識別的數(shù)據(jù)并發(fā)送給與汽車總線直接相連的汽車狀態(tài)數(shù)據(jù)查詢模塊;

所述汽車狀態(tài)數(shù)據(jù)查詢模塊獲得汽車的實時狀況數(shù)據(jù),并再次通過所述車輛數(shù)據(jù)解析模塊和汽車車聯(lián)網(wǎng)通信模塊返回到語音數(shù)據(jù)處理模塊;

語音數(shù)據(jù)處理模塊對返回的數(shù)據(jù)處理后形成語音信息發(fā)送給所述語音播放模塊;

最后通過所述語音播放模塊以人類的自然語言音頻回復(fù)駕乘人員提出的問題;

所述汽車車聯(lián)網(wǎng)通信模塊對數(shù)據(jù)檢索模塊發(fā)送來的數(shù)據(jù)判斷后,結(jié)果并非是對車輛實時狀況信息的檢索,則汽車車聯(lián)網(wǎng)通信模塊將該數(shù)據(jù)檢索需求發(fā)往車聯(lián)網(wǎng)TSP云平臺數(shù)據(jù)庫進行獲取回復(fù)的信息。

進一步,所述的人車之間的信息交互均通過汽車車機,以人類的自然語言音頻方式直接進行交互。

進一步,所述的人車交互的信息包括來源于汽車自身實時狀況信息和車聯(lián)網(wǎng)數(shù)據(jù)庫中有關(guān)車聯(lián)網(wǎng)涉及的信息。

進一步,所述語音識別模塊將人的自然語言進行識別中,語音識別模塊基于聲波音頻技術(shù)的判斷進行識別,識別方法為:

構(gòu)建小詞匯量語音識別網(wǎng)絡(luò);

構(gòu)建大詞匯量語音識別網(wǎng)絡(luò);

持續(xù)接收錄音輸入;

利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到第一識別結(jié)果;

如果所述第一識別結(jié)果中包含預(yù)設(shè)的命令詞,則利用大詞匯量語音識別網(wǎng)絡(luò)對所述命令詞后的錄音進行識別,得到第二識別結(jié)果;

所述利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到第一識別結(jié)果包括:

利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分;

如果所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值,則將所述候選關(guān)鍵詞作為第一識別結(jié)果;

根據(jù)所述第一識別結(jié)果和第二識別結(jié)果執(zhí)行對應(yīng)操作。

進一步,所述語義分析模塊用于進行語義分析中,語義分析方法為:

獲取多個來用戶語義的基礎(chǔ)聲音樣本,為各個所述基礎(chǔ)聲音樣本設(shè)置標(biāo)簽,形成聲音樣本庫;

接收用戶輸入的待識別聲音,在所述聲音樣本庫中對所述待識別聲音進行匹配,得到匹配結(jié)果;

根據(jù)所述匹配結(jié)果將所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給所述用戶;

所述接收用戶輸入的待識別聲音,在所述聲音樣本庫中對所述待識別聲音進行匹配,得到匹配結(jié)果包括:

接收用戶輸入的待識別聲音,并獲取所述待識別聲音的抽象屬性值;

將所述待識別聲音的抽象屬性值與所述聲音樣本庫中的基礎(chǔ)聲音樣本的抽象屬性值進行匹配,得到匹配結(jié)果;

所述抽象屬性值包括聲波、波長、頻率、音量和關(guān)鍵聲音片段中的至少一個;

所述關(guān)鍵聲音片段包括出現(xiàn)至少兩次的聲音片段或音量達到預(yù)設(shè)閾值的聲音片段。

接收用戶輸入的待識別聲音,在所述聲音樣本庫中對所述待識別聲音進行匹配,得到匹配結(jié)果包括:

接收用戶輸入的待識別聲音和描述信息;

根據(jù)所述描述信息在所述聲音樣本庫中對標(biāo)簽進行篩選,得到篩選出的標(biāo)簽;

在所述篩選出的標(biāo)簽對應(yīng)的基礎(chǔ)聲音樣本中對所述待識別聲音進行匹配,得到匹配結(jié)果;

所述描述信息包括所述用戶的屬性信息或用戶所處場景的屬性信息;

根據(jù)所述匹配結(jié)果將所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給所述用戶包括:

根據(jù)所述匹配結(jié)果確定所述待識別聲音對應(yīng)的至少一個基礎(chǔ)聲音樣本,并獲取所述至少一個基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽,得到至少一個標(biāo)簽;

計算所述至少一個標(biāo)簽中相同標(biāo)簽對應(yīng)的基礎(chǔ)聲音樣本的數(shù)量;

根據(jù)所述基礎(chǔ)聲音樣本的數(shù)量對所述至少一個標(biāo)簽進行排序,得到排序結(jié)果;

將所述基礎(chǔ)聲音樣本的數(shù)量最多的基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽,或者所述排序結(jié)果,或者所述基礎(chǔ)聲音樣本的數(shù)量反饋給所述用戶;

根據(jù)所述匹配結(jié)果將所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給所述用戶之后,還包括:

獲取所述用戶的反饋信息;

根據(jù)所述反饋信息對所述聲音樣本庫中的基礎(chǔ)聲音樣本和/或所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽進行更新;

根據(jù)所述反饋信息對所述聲音樣本庫中的基礎(chǔ)聲音樣本和/或所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽進行更新包括:

若所述反饋信息為對錯值或正確比例值,則:

統(tǒng)計所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本與所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽的對應(yīng)關(guān)系的正確率;

根據(jù)所述正確率更改所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽,或者將所述正確率添加至所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽中;

根據(jù)所述反饋信息對所述聲音樣本庫中的基礎(chǔ)聲音樣本和/或所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽進行更新包括:

若所述反饋信息為所述待識別聲音的語義描述信息,則:

根據(jù)所述語義描述信息提取標(biāo)簽;

將所述待識別聲音作為新的基礎(chǔ)聲音樣本,與提取的標(biāo)簽對應(yīng)存儲到所述聲音樣本庫中。

本發(fā)明實現(xiàn)了人機交互的界面層,汽車駕乘人員通過汽車車機端的語音識別模塊將人的自然語言進行識別,并將識別后的數(shù)據(jù)送至其內(nèi)部的語義分析模塊進行語義分析,依據(jù)語義分析的結(jié)果檢索需要回復(fù)的聊天內(nèi)容,并通過汽車車機端以音頻的形式告知汽車駕乘人員。本發(fā)明實現(xiàn)了人與車通過自然語言的直接交互,解決了汽車駕乘人員與汽車交互的復(fù)雜度,使得汽車自身更為智能化和人性化;

本發(fā)明綜合小詞匯量語音識別系統(tǒng)和大詞匯量語音識別系統(tǒng)各自的優(yōu)點,針對持續(xù)接收的錄音輸入,先利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,以檢查所述錄音中是否包含預(yù)設(shè)的關(guān)鍵詞,在檢查到該錄音中包含相應(yīng)的關(guān)鍵詞后,再利用大詞匯量語音識別網(wǎng)絡(luò)對該關(guān)鍵詞后的錄音進行識別,得到識別結(jié)果,從而實現(xiàn)了無需觸發(fā)一次性完成多命令詞語音識別,在保證語音識別質(zhì)量的前提下,提高了大詞匯量語音識別的智能性。

本發(fā)明通過為獲取的每個來自用戶的語義的基礎(chǔ)聲音樣本設(shè)置標(biāo)簽,形成聲音樣本庫后,在聲音樣本庫中對接收的用戶輸入的待識別聲音進行匹配,并根據(jù)匹配后的匹配結(jié)果將待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給用戶。

附圖說明

圖1是本發(fā)明實施例提供的基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng)的結(jié)構(gòu)示意圖。

圖中:1、汽車車機端;1-1、語音識別模塊;1-2、語義分析模塊;1-3、數(shù)據(jù)檢索模塊;1-4、語音播放模塊;1-5、語音數(shù)據(jù)處理模塊;2、T-BOX端;2-1、汽車車聯(lián)網(wǎng)通信模塊;2-2、車輛數(shù)據(jù)解析模塊;2-3、汽車專題數(shù)據(jù)查詢模塊;3、TSP云平臺數(shù)據(jù)庫。

具體實施方式

為能進一步了解本發(fā)明的發(fā)明內(nèi)容、特點及功效,茲例舉以下實施例,并配合附圖詳細說明如下。

請參閱附圖1:

本發(fā)明提供一種基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng),該基于車聯(lián)網(wǎng)的智能服務(wù)系統(tǒng)包括汽車車機端1、T-BOX端2、TSP云平臺數(shù)據(jù)庫3。其中所述汽車車機端1由語音識別模塊1-1、語義分析模塊1-2、數(shù)據(jù)檢索模塊1-3、語音播放模塊1-4、語音數(shù)據(jù)處理模塊1-5組成;所述T-BOX端2由汽車車聯(lián)網(wǎng)通信模塊2-1、車輛數(shù)據(jù)解析模塊2-2、汽車專題數(shù)據(jù)查詢模塊2-3組成;

所述汽車車機端1主要實現(xiàn)了人機交互的界面層,汽車駕乘人員通過所述語音識別模塊1-1將人的自然語言進行識別,并將識別后的數(shù)據(jù)送至其內(nèi)部的所述語義分析模塊1-2進行語義分析,

依據(jù)語義分析的結(jié)果檢索需要回復(fù)的聊天內(nèi)容,并通過汽車車機端1以音頻的形式告知汽車駕乘人員。所述數(shù)據(jù)檢索模塊1-3所要檢索的數(shù)據(jù)來源是通過汽車的通信網(wǎng)絡(luò)獲得。所述汽車車機端1的數(shù)據(jù)檢索模塊1-3將需要檢索的數(shù)據(jù)發(fā)給汽車通信網(wǎng)絡(luò)內(nèi)部的汽車車聯(lián)網(wǎng)通信模塊2-1,

所述汽車車聯(lián)網(wǎng)通信模塊2-1進行判斷是否是對車輛實時狀況信息的檢索,如果是,則所述汽車車聯(lián)網(wǎng)通信模塊2-1將將檢索需求信息發(fā)送給所述車輛數(shù)據(jù)解析模塊2-2,所述數(shù)據(jù)解析模塊2-2在將該需求解析為汽車內(nèi)部總線可識別的數(shù)據(jù)發(fā)送給與汽車總線直接相連的所述汽車狀態(tài)數(shù)據(jù)查詢模塊2-3,通過所述汽車狀態(tài)數(shù)據(jù)查詢模塊2-3獲得汽車的實時狀況數(shù)據(jù),并再次通過所述車輛數(shù)據(jù)解析模塊2-2和汽車車聯(lián)網(wǎng)通信模2-1塊返回到語音數(shù)據(jù)處理模塊1-5,

由語音數(shù)據(jù)對返回的數(shù)據(jù)處理后形成語音信息發(fā)送給所述語音播放模塊1-4,最后通過所述語音播放模塊1-4以人類的自然語言音頻回復(fù)駕乘人員提出的問題;如果所述汽車車聯(lián)網(wǎng)通信模塊2-1對數(shù)據(jù)檢索模塊發(fā)送來的數(shù)據(jù)判斷后,其結(jié)果并非是對車輛實時狀況信息的檢索,則所述汽車車聯(lián)網(wǎng)通信模塊2-1將該數(shù)據(jù)檢索需求發(fā)往車聯(lián)網(wǎng)TSP云平臺數(shù)據(jù)庫3進行獲取回復(fù)的信息。

進一步,所述的人車之間的信息交互都是通過汽車車機,以人類的自然語言音頻方式直接進行交互,但不排除將本發(fā)明所述車機端的構(gòu)成部分單獨做成一個車載模塊。

進一步,所述的人車交互的信息主要涉及并來源于汽車自身實時狀況信息和車聯(lián)網(wǎng)數(shù)據(jù)庫中有關(guān)車聯(lián)網(wǎng)涉及的信息。

本發(fā)明在具體操作過程中,當(dāng)具備車聯(lián)網(wǎng)小兵的汽車運行中,汽車駕乘人員可以在駕乘汽車過程中隨時與車聯(lián)網(wǎng)小兵通過人類自然語言進行直接交互。若汽車駕乘人員發(fā)出語音提問:“車聯(lián)網(wǎng)小兵,目前燃油剩余多少?”汽車車機端1將通過其內(nèi)部的語音識別模塊1-1對“車聯(lián)網(wǎng)小兵,目前燃油剩余多少?”的語音進行識別,并將識別后的信息發(fā)送給語義分析模塊1-2進行語義分析,語義分析模1-2將分析結(jié)果發(fā)送給數(shù)據(jù)檢索模塊1-3,數(shù)據(jù)檢索模1-3再向T-BOX端2內(nèi)部的汽車車聯(lián)網(wǎng)通信模塊2-1發(fā)出該語義回復(fù)內(nèi)容的檢索需求,汽車車聯(lián)網(wǎng)通信模塊2-1對此檢索需求判斷后得知是對汽車實時狀況信息的檢索,則將該檢索需求信息發(fā)送給車輛數(shù)據(jù)解析模塊2-2,車輛數(shù)據(jù)解析模塊2-2再通過汽車狀況查詢模塊2-3從汽車內(nèi)部總線上獲得該汽車的實時燃油剩余量數(shù)據(jù),并將該實時燃油剩余量數(shù)據(jù)再次通過車輛數(shù)據(jù)解析模塊2-2、汽車車聯(lián)網(wǎng)通信模塊2-1返回到語音數(shù)據(jù)處理模塊1-4,語音數(shù)據(jù)處理模塊1-4對返回的數(shù)據(jù)處理后形成語音信息發(fā)送給語音播放模塊1-5,最后通過語音播放模塊1-5以人類自然語言音頻回復(fù)駕乘人員提出的問題:“目前燃油剩余20升”。若駕乘人員與車聯(lián)網(wǎng)小兵交互的內(nèi)容并非汽車實時狀況信息,則車聯(lián)網(wǎng)小兵通過汽車車聯(lián)網(wǎng)通信模塊2-1從車聯(lián)網(wǎng)TSP云平臺數(shù)據(jù)庫3總獲取有關(guān)的內(nèi)容進行回答。

下面結(jié)合識別方法對本發(fā)明進一步說明。

所述語音識別模塊將人的自然語言進行識別中,語音識別模塊基于聲波音頻技術(shù)的判斷進行識別,識別方法為:

構(gòu)建小詞匯量語音識別網(wǎng)絡(luò);

構(gòu)建大詞匯量語音識別網(wǎng)絡(luò);

持續(xù)接收錄音輸入;

利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到第一識別結(jié)果;

如果所述第一識別結(jié)果中包含預(yù)設(shè)的命令詞,則利用大詞匯量語音識別網(wǎng)絡(luò)對所述命令詞后的錄音進行識別,得到第二識別結(jié)果;

所述利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到第一識別結(jié)果包括:

利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到候選關(guān)鍵詞及所述候選關(guān)鍵詞的置信度得分;

如果所述候選關(guān)鍵詞的置信度得分大于設(shè)定閾值,則將所述候選關(guān)鍵詞作為第一識別結(jié)果;

根據(jù)所述第一識別結(jié)果和第二識別結(jié)果執(zhí)行對應(yīng)操作。

本發(fā)明實施例的語音識別方法,利用小詞匯量語音識別網(wǎng)絡(luò)和大詞匯量語音識別網(wǎng)絡(luò),對錄音輸入的語音信號進行連續(xù)識別解碼,從而利用小詞匯量的無需觸發(fā)識別召回率高和虛警率低的特點,通過判定小詞匯量語音識別結(jié)果的置信度來決定是否輸出大詞匯量語音識別的結(jié)果。

在本發(fā)明實施例中,利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別的過程主要包括:語音信號預(yù)處理、特征提取、特征建模、模式匹配等過程。其中:

預(yù)處理主要是對輸入的語音進行一些前期處理,主要包括采樣量化、預(yù)加重、加窗、端點檢測等操作。

特征提取是指從語音信號中提取有效的特征矢量,進一步地,為了提高識別精度,還需要去除語音信號中的噪聲信息。

特征建模的過程主要是指建立聲學(xué)模型及語言模型,其中,聲學(xué)模型是語音識別系統(tǒng)的底層模型,主要用于刻畫語音信號的聲學(xué)特征;聲學(xué)模型的設(shè)計和語音發(fā)音特點密切相關(guān)。通過聲學(xué)模型,可以估計待識別語音特征矢量序列所對應(yīng)的語音識別單元,從而完成特征矢量序列到語音單元的識別轉(zhuǎn)換。在語音識別中,僅僅只利用聲學(xué)模型對語音信號進行描述或表征是不夠的,還需要利用諸如語法知識、句法知識、語義知識等語言學(xué)知識,

而這些信息的利用是通過語言模型建模來實現(xiàn)的。

模式匹配的過程就是在一個由特征矢量序列、聲學(xué)模型、語言模型構(gòu)建的空間中到最佳匹配路徑的過程。

在本發(fā)明實施例中,首先利用小詞匯量語音識別網(wǎng)絡(luò)對所述錄音進行語音識別,得到多個候選關(guān)鍵詞。其中,小詞匯量語音識別網(wǎng)絡(luò)的構(gòu)建過程大致如下:先將關(guān)鍵詞轉(zhuǎn)為拼音,再將拼音轉(zhuǎn)為音素序列,選取每個音素對應(yīng)的聲學(xué)模型形成聲學(xué)模型序列,將多個關(guān)鍵詞對應(yīng)的聲學(xué)模型序列并聯(lián)起來即形成了小詞匯量語音識別網(wǎng)絡(luò)。

相應(yīng)地,對應(yīng)每個候選關(guān)鍵詞,可以有一個置信度得分,各候選關(guān)鍵詞的置信度得分的高低直接反映了該關(guān)鍵詞的可靠程度。因此,在本發(fā)明實施例中,可以預(yù)先設(shè)定一閾值(比如,置信度區(qū)間為0~100分,閾值設(shè)為70分),如果所述候選關(guān)鍵詞的置信度得分大于該閾值,則將該候選關(guān)鍵詞作為第一識別結(jié)果。

由于影響置信度的因素很多,比如,識別結(jié)果自身的信息、路徑搜索過程中的競爭路徑信息、輔助模型給出的對比信息等,這些都對置信度的計算有不同程度的影響。因此,在本發(fā)明實施例中,置信度可以看作是這些因素的函數(shù),用于衡量識別結(jié)果的可靠程度。

當(dāng)然,在實際應(yīng)用中,所述置信度也可以按照現(xiàn)有技術(shù)中的一些方法進行計算,比如,基于特征分類器的置信度、基于似然比檢驗的置信度、基于后驗概率的置信度等,具體可以根據(jù)實際應(yīng)用環(huán)境來選用,對此本發(fā)明實施例不做限定。

利用小詞匯量語音識別網(wǎng)絡(luò)進行識別得到第一識別結(jié)果后,需要判斷所述第一識別結(jié)果中是否包含預(yù)設(shè)的命令詞,具體地,可以將具體應(yīng)用環(huán)境中所需的命令詞保存在一個命令詞列表中,比如,對應(yīng)于車載系統(tǒng),命令詞列表中可以有:導(dǎo)航、收音機、MP3播放、視頻播放等命令詞。

在第一識別結(jié)果中包含預(yù)設(shè)的命令詞的情況下,繼續(xù)利用大詞匯量語音識別網(wǎng)絡(luò)對所述命令詞后的錄音進行識別,得到第二識別結(jié)果。

上述大詞匯量語音識別網(wǎng)絡(luò)的構(gòu)建過程與小詞匯量語音識別網(wǎng)絡(luò)的構(gòu)建過程類似。

下面結(jié)合語義分析方法對本發(fā)明進一步說明。

所述語義分析模塊用于進行語義分析中,語義分析方法為:

獲取多個來用戶語義的基礎(chǔ)聲音樣本,為各個所述基礎(chǔ)聲音樣本設(shè)置標(biāo)簽,形成聲音樣本庫;

接收用戶輸入的待識別聲音,在所述聲音樣本庫中對所述待識別聲音進行匹配,得到匹配結(jié)果;

根據(jù)所述匹配結(jié)果將所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給所述用戶;

所述接收用戶輸入的待識別聲音,在所述聲音樣本庫中對所述待識別聲音進行匹配,得到匹配結(jié)果包括:

接收用戶輸入的待識別聲音,并獲取所述待識別聲音的抽象屬性值;

將所述待識別聲音的抽象屬性值與所述聲音樣本庫中的基礎(chǔ)聲音樣本的抽象屬性值進行匹配,得到匹配結(jié)果;

所述抽象屬性值包括聲波、波長、頻率、音量和關(guān)鍵聲音片段中的至少一個;

所述關(guān)鍵聲音片段包括出現(xiàn)至少兩次的聲音片段或音量達到預(yù)設(shè)閾值的聲音片段。

接收用戶輸入的待識別聲音,在所述聲音樣本庫中對所述待識別聲音進行匹配,得到匹配結(jié)果包括:

接收用戶輸入的待識別聲音和描述信息;

根據(jù)所述描述信息在所述聲音樣本庫中對標(biāo)簽進行篩選,得到篩選出的標(biāo)簽;

在所述篩選出的標(biāo)簽對應(yīng)的基礎(chǔ)聲音樣本中對所述待識別聲音進行匹配,得到匹配結(jié)果;

所述描述信息包括所述用戶的屬性信息或用戶所處場景的屬性信息;

根據(jù)所述匹配結(jié)果將所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給所述用戶包括:

根據(jù)所述匹配結(jié)果確定所述待識別聲音對應(yīng)的至少一個基礎(chǔ)聲音樣本,并獲取所述至少一個基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽,得到至少一個標(biāo)簽;

計算所述至少一個標(biāo)簽中相同標(biāo)簽對應(yīng)的基礎(chǔ)聲音樣本的數(shù)量;

根據(jù)所述基礎(chǔ)聲音樣本的數(shù)量對所述至少一個標(biāo)簽進行排序,得到排序結(jié)果;

將所述基礎(chǔ)聲音樣本的數(shù)量最多的基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽,或者所述排序結(jié)果,或者所述基礎(chǔ)聲音樣本的數(shù)量反饋給所述用戶;

根據(jù)所述匹配結(jié)果將所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給所述用戶之后,還包括:

獲取所述用戶的反饋信息;

根據(jù)所述反饋信息對所述聲音樣本庫中的基礎(chǔ)聲音樣本和/或所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽進行更新;

根據(jù)所述反饋信息對所述聲音樣本庫中的基礎(chǔ)聲音樣本和/或所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽進行更新包括:

若所述反饋信息為對錯值或正確比例值,則:

統(tǒng)計所述待識別聲音對應(yīng)的基礎(chǔ)聲音樣本與所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽的對應(yīng)關(guān)系的正確率;

根據(jù)所述正確率更改所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽,或者將所述正確率添加至所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽中;

根據(jù)所述反饋信息對所述聲音樣本庫中的基礎(chǔ)聲音樣本和/或所述基礎(chǔ)聲音樣本對應(yīng)的標(biāo)簽進行更新包括:

若所述反饋信息為所述待識別聲音的語義描述信息,則:

根據(jù)所述語義描述信息提取標(biāo)簽;

將所述待識別聲音作為新的基礎(chǔ)聲音樣本,與提取的標(biāo)簽對應(yīng)存儲到所述聲音樣本庫中。

本發(fā)明通過為獲取的每個來自用戶的語義的基礎(chǔ)聲音樣本設(shè)置標(biāo)簽,形成聲音樣本庫后,在聲音樣本庫中對接收的用戶輸入的待識別聲音進行匹配,并根據(jù)匹配后的匹配結(jié)果將待識別聲音對應(yīng)的基礎(chǔ)聲音樣本的標(biāo)簽反饋給用戶。識別正確的語義后,為后期的營救中心提供依據(jù)。

利用本發(fā)明所述的技術(shù)方案,或本領(lǐng)域的技術(shù)人員在本發(fā)明技術(shù)方案的啟發(fā)下,設(shè)計出類似的技術(shù)方案,而達到上述技術(shù)效果的,均是落入本發(fā)明的保護范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
岢岚县| 姜堰市| 磐安县| 慈溪市| 琼中| 南安市| 无为县| 永城市| 阜新| 凉山| 芦溪县| 浦江县| 德格县| 汪清县| 鲜城| 公主岭市| 鞍山市| 建瓯市| 桃园市| 栾城县| 许昌县| 双鸭山市| 青州市| 金川县| 通道| 朝阳区| 陆川县| 美姑县| 镇康县| 凤凰县| 望奎县| 华池县| 乌兰察布市| 青田县| 泰安市| 肃宁县| 南召县| 安岳县| 临城县| 惠州市| 旅游|