語音信號處理方法及裝置的制造方法
【專利摘要】本發(fā)明實(shí)施例提供一種語音信號處理方法及裝置。語音信號處理方法包括:接收客戶端發(fā)送的語音信號;對語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù);對文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果;將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果;將中間解析結(jié)果發(fā)送給客戶端,以供客戶端利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。采用本發(fā)明實(shí)施例對語音信號進(jìn)行語義解析,可以提高語義解析的準(zhǔn)確度。
【專利說明】
語音信號處理方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明實(shí)施例涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種語音信號處理方法及裝置。
【背景技術(shù)】
[0002]隨著語音識別技術(shù)的發(fā)展,基于語音識別的應(yīng)用越來越多,例如語音撥號、語音導(dǎo)航、語音播放控制、語音信息檢索等。在基于語音識別的應(yīng)用中,都需要對語音信號進(jìn)行語義解析,提取語音信號所表達(dá)的用戶意圖,并轉(zhuǎn)換成機(jī)器能夠理解的結(jié)構(gòu)化數(shù)據(jù)格式。
[0003]現(xiàn)有技術(shù)主要使用預(yù)設(shè)的語義解析模板與語音識別出的字符串進(jìn)行匹配的方法來對語音信號進(jìn)行語義解析。這種方法要求語義解析模板足夠多,但實(shí)際上語義解析模板的數(shù)量是有限的,而語音信號的表達(dá)方式又是多種多樣,所以經(jīng)常出現(xiàn)一些無法精準(zhǔn)匹配的情況,導(dǎo)致無法準(zhǔn)確解析語音信號的語義。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供一種語音信號處理方法及裝置,用以對語音信號進(jìn)行語義解析,提高語義解析的準(zhǔn)確度。
[0005]本發(fā)明實(shí)施例提供一種語音信號處理方法,包括:
[0006]接收客戶端發(fā)送的語音信號;
[0007]對所述語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù);
[0008]對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果;
[0009]將所述初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果;
[0010]將所述中間解析結(jié)果發(fā)送給所述客戶端,以供所述客戶端利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。
[0011]本發(fā)明實(shí)施例提供另一種語音信號處理方法,包括:
[0012]向服務(wù)端發(fā)送語音信號,以供所述服務(wù)端對所述語音信號進(jìn)行語義解析;
[0013]接收所述服務(wù)端返回的中間解析結(jié)果,所述中間解析結(jié)果是所述服務(wù)端將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流后獲得的,所述中間解析結(jié)果包括所述初始解析結(jié)果中的固定句式和所述實(shí)體詞轉(zhuǎn)換成的拼音流;
[0014]利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果O
[0015]本發(fā)明實(shí)施例提供一種語音信號處理裝置,位于服務(wù)端實(shí)現(xiàn),所述裝置包括:
[0016]接收模塊,用于接收客戶端發(fā)送的語音信號;
[0017]語音識別模塊,用于對所述語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù);
[0018]語義解析模塊,用于對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果;
[0019]轉(zhuǎn)換模塊,用于將所述初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果;
[0020]發(fā)送模塊,用于將所述中間解析結(jié)果發(fā)送給所述客戶端,以供所述客戶端利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。
[0021]本發(fā)明實(shí)施例提供另一種語音信號處理裝置,位于客戶端實(shí)現(xiàn),所述裝置包括:
[0022]發(fā)送模塊,用于向服務(wù)端發(fā)送語音信號,以供所述服務(wù)端對所述語音信號進(jìn)行語義解析;
[0023]接收模塊,用于接收所述服務(wù)端返回的中間解析結(jié)果,所述中間解析結(jié)果是所述服務(wù)端將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流后獲得的,所述中間解析結(jié)果包括所述初始解析結(jié)果中的固定句式和所述實(shí)體詞轉(zhuǎn)換成的拼音流;
[0024]修正模塊,用于利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。
[0025]本發(fā)明實(shí)施例提供的語音信號處理方法及裝置,在服務(wù)端,采用固定句式語義解析方式對語音信號對應(yīng)的文本數(shù)據(jù)進(jìn)行語義解析,獲得包括固定句式和實(shí)體詞的初始解析結(jié)果,將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果,將中間解析結(jié)果發(fā)送給客戶端,在客戶端,利用本地信息庫對接收到的中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。本發(fā)明實(shí)施例將服務(wù)端解析與客戶端修正相結(jié)合,充分發(fā)揮客戶端本地信息庫對部分實(shí)體詞在語義解析上的作用,對服務(wù)端無法準(zhǔn)確解析的結(jié)果進(jìn)行修正,提高了語義解析的準(zhǔn)確度,同時有利于減少服務(wù)端存儲的語義解析模板的數(shù)量。
【附圖說明】
[0026]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0027]圖1為本發(fā)明一實(shí)施例提供的語音信號處理方法的流程示意圖;
[0028]圖2為本發(fā)明另一實(shí)施例提供的語音信號處理方法的流程示意圖;
[0029]圖3為本發(fā)明又一實(shí)施例提供的語音信號處理裝置的結(jié)構(gòu)示意圖;
[0030]圖4為本發(fā)明又一實(shí)施例提供的語音信號處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0031]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0032]在現(xiàn)有技術(shù)中,主要使用預(yù)設(shè)的語義解析模板與語音識別出的字符串進(jìn)行匹配的方法來對語音信號進(jìn)行語義解析。這種方法要求語義解析模板足夠多,但實(shí)際上語義解析模板的數(shù)量是有限的,而語音信號的表達(dá)方式又是多種多樣,所以經(jīng)常出現(xiàn)一些無法精準(zhǔn)匹配的情況,導(dǎo)致無法準(zhǔn)確解析語音信號的語義。以語音撥號為例,可能有語音信號“請給張三撥打電話”對應(yīng)的語義解析模板,但可能沒有語音信號“請給李四打電話”的語義解析模板,所以“請給李四打電話”可能無法準(zhǔn)備解析出語音信號“請給李四打電話”的語義。
[0033]針對上述問題,本發(fā)明實(shí)施例提供一種解決方案,主要原理是:在服務(wù)端,采用固定句式語義解析方式對語音信號對應(yīng)的文本數(shù)據(jù)進(jìn)行語義解析,獲得包括固定句式和實(shí)體詞的初始解析結(jié)果,實(shí)體詞的不確定性較高,因此將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果,將中間解析結(jié)果發(fā)送給客戶端,在客戶端,利用本地信息庫對接收到的中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。
[0034]本發(fā)明實(shí)施例將服務(wù)端解析與客戶端修正相結(jié)合,充分發(fā)揮客戶端本地信息庫對部分實(shí)體詞在語義解析上的作用,對服務(wù)端無法準(zhǔn)確解析的結(jié)果進(jìn)行修正,提高了語義解析的準(zhǔn)確度,同時有利于減少服務(wù)端存儲的語義解析模板的數(shù)量。
[0035]下面通過具體實(shí)施例對本發(fā)明技術(shù)方案進(jìn)行詳細(xì)說明。
[0036]圖1為本發(fā)明一實(shí)施例提供的語音信號處理方法的流程示意圖。如圖1所示,該方法包括:
[0037]101、接收客戶端發(fā)送的語音信號。
[0038]102、對語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù)。
[0039]103、對文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果。
[0040]104、將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果。
[0041]105、將中間解析結(jié)果發(fā)送給所述客戶端,以供客戶端利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。
[0042]本實(shí)施例提供一種語音信號處理方法,可由語音信號處理裝置來執(zhí)行,用以對語音信號進(jìn)行語義解析,提高語義解析的準(zhǔn)確度。
[0043]本實(shí)施例提供的方法適用于各種需要對語音信號進(jìn)行語義解析的應(yīng)用場景,例如語音撥號、語音導(dǎo)航、語音播放控制、語音信息檢索等。其中,語音信號處理裝置可位于各應(yīng)用場景中的服務(wù)端實(shí)現(xiàn)。
[0044]具體的,在各應(yīng)用場景中,客戶端采集用戶的語音信號,例如對用戶的語音進(jìn)行錄制,從而獲取用戶的語音信號,然后將語音信號發(fā)送給服務(wù)端,具體來說是發(fā)送給服務(wù)端的語音信號處理裝置。語音信號處理裝置接收客戶端發(fā)送的語音信號。
[0045]可選的,客戶端發(fā)送語音信號之前,可以對語音信號進(jìn)行模數(shù)轉(zhuǎn)換、編碼、壓縮等處理。相應(yīng)的,語音信號處理裝置接收到語音信號之后,可以對語音信號經(jīng)解壓縮、解碼等處理,并針對處理后的語音信號進(jìn)行語義解析處理。
[0046]在獲得語音信號之后,語音信號處理裝置可以對語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù)。舉例說明,假設(shè)用戶輸入的語音信號為“我要給張三打電話”,則可以將該語音信號識別為對應(yīng)的文本數(shù)據(jù)。其中,對語音信號進(jìn)行語音識別的具體方案可以參見現(xiàn)有技術(shù),在此不做詳述。
[0047]在獲得語音信號對應(yīng)的文本數(shù)據(jù)之后,語音信號處理裝置可以對文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果。本實(shí)施例中的固定句式語義解析不同于現(xiàn)有技術(shù)中的通用語義解析。其中,通用語義解析是指利用預(yù)設(shè)的通用語義解析模板與文本數(shù)據(jù)進(jìn)行匹配以獲得文本數(shù)據(jù)對應(yīng)的語義的方案。而本實(shí)施例的固定句式語義解析是指利用預(yù)設(shè)的固定句式解析模板與文本數(shù)據(jù)進(jìn)行匹配,以獲得文本數(shù)據(jù)對應(yīng)的語義的方案。
[0048]在本實(shí)施例中,固定句式解析模板包括固定表達(dá)部分和待定表達(dá)部分。固定表達(dá)部分是比較固定的,在相同應(yīng)用場景的不同請求中一般不會發(fā)生變化,而待定表達(dá)部分是不固定的,在相同應(yīng)用場景的不同請求中往往會發(fā)生變化。
[0049]例如,“請給XXX打電話”為一固定句式解析模板,其中“請給…打電話”是該固定句式解析模板中的固定表達(dá)部分,而其中的“XXX”是該固定句式解析模板中的待定表達(dá)部分,在該固定句式解析模板中,待定表達(dá)部分主要指姓名,在不同撥號請求中,請求呼叫的對象姓名經(jīng)常是不同的。
[0050]又例如,“請播放歌曲XXX”為另一固定句式解析模板,其中“請播放歌曲…”是該固定句式解析模板中的固定表達(dá)部分,而其中的“XXX”是該固定句式解析模板中的待定表達(dá)部分,在該固定句式解析模板中,待定表達(dá)部分主要指歌曲名,在不同播放請求中,請求播放的歌曲經(jīng)常是不同的。
[0051]又例如,“請搜索歌曲XXX的歌詞”為又一固定句式解析模板,其中“請搜索歌曲…的歌詞”是該固定句式解析模板中的固定表達(dá)部分,而其中的“XXX”是該固定句式解析模板中的待定表達(dá)部分,在該固定句式解析模板中,待定表達(dá)部分主要指歌曲名,在不同搜索請求中,請求搜索的歌詞經(jīng)常是不同歌曲的。
[0052]基于上述,語音信號處理裝置具體可以利用預(yù)設(shè)的固定句式解析模板與上述語音信號對應(yīng)的文本數(shù)據(jù)進(jìn)行匹配,以獲得該文本數(shù)據(jù)匹配中的固定句式解析模板,為便于描述,將文本數(shù)據(jù)匹配中的固定句式解析模板稱為目標(biāo)固定句式解析模板。該目標(biāo)固定句式解析模板也包括固定表達(dá)部分和待定表達(dá)部分。之后,語音信號處理裝置將文本數(shù)據(jù)中對應(yīng)目標(biāo)固定句式解析模板中的固定表達(dá)部分的內(nèi)容作為初始解析結(jié)果中的固定句式,將文本數(shù)據(jù)中對應(yīng)目標(biāo)固定句式解析模板中的待定表達(dá)部分的內(nèi)容作為初始解析結(jié)果中的實(shí)體詞。
[0053]例如,假設(shè)語音信號對應(yīng)的文本數(shù)據(jù)為“請給張三打電話”,則與該文本數(shù)據(jù)匹配中的目標(biāo)固定句式解析模板為“請給XXX打電話”,則可以將固定表達(dá)部分“請給…打電話”作為初始解析結(jié)果中的固定句式,將“張三”作為初始解析結(jié)果中的實(shí)體詞。
[0054]又例如,假設(shè)語音信號對應(yīng)的文本數(shù)據(jù)為“請播放歌曲小燕子”,則與該文本數(shù)據(jù)匹配中的目標(biāo)固定句式解析模板為“請播放歌曲XXX”,則可以將固定表達(dá)部分“請播放歌曲…”作為初始解析結(jié)果中的固定句式,將“小燕子”作為初始解析結(jié)果中的實(shí)體詞。
[0055]又例如,假設(shè)語音信號對應(yīng)的文本數(shù)據(jù)為“請搜索歌曲童年的歌詞”,則與該文本數(shù)據(jù)匹配中的目標(biāo)固定句式解析模板為“請搜索歌曲XXX的歌詞”,則可以將固定表達(dá)部分“請搜索歌曲…的歌詞”作為初始解析結(jié)果中的固定句式,將“童年”作為初始解析結(jié)果中的實(shí)體詞。
[0056]在一可選實(shí)施方式中,在對語音信號對應(yīng)的文本數(shù)據(jù)進(jìn)行固定句式語義解析之前,可以先對文本數(shù)據(jù)進(jìn)行通用語義解析。具體的,語音信號處理裝置可以先利用預(yù)設(shè)的通用語義解析模板與所述文本數(shù)據(jù)進(jìn)行匹配;若未匹配中通用語義解析模板,語音信號處理裝置可以繼續(xù)對文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果。
[0057]進(jìn)一步,若匹配中通用語義解析模板,則根據(jù)匹配中的通用語義解析模板獲得文本數(shù)據(jù)的解析結(jié)果并返回給客戶端,以供客戶端根據(jù)該解析結(jié)果執(zhí)行相應(yīng)操作。
[0058]在本實(shí)施例中,在獲得文本數(shù)據(jù)對應(yīng)的初始解析結(jié)果之后,并不是像現(xiàn)有技術(shù)那樣直接將初始解析結(jié)果返回給客戶端??紤]到初始解析結(jié)果中實(shí)體詞的不確定性,有可能語音識別出的是錯誤的,例如語音信號中的“張三”,可以被識別為“張傘”,為提高對實(shí)體詞的識別結(jié)果,語音信號處理裝置將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,例如將“張傘”轉(zhuǎn)換為“zhang san”,從而獲得中間解析結(jié)果。舉例說明,初始解析結(jié)果為“請給張傘打電話”,經(jīng)過拼音流轉(zhuǎn)換后的中間解析結(jié)果為“請給zhang san打電話”。
[0059]在獲得中間解析結(jié)果之后,語音信號處理裝置將中間解析結(jié)果發(fā)送給客戶端。對客戶端來說,接收語音信號處理裝置發(fā)送的中間解析結(jié)果,利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。具體的,客戶端可以將該拼音流在本地信息庫中進(jìn)行匹配,例如可以采用最小編輯距離匹配算法,以獲得該拼音流對應(yīng)的實(shí)體詞,進(jìn)而用該實(shí)體詞替換拼音流,獲得最終解析結(jié)果。
[0060]值得說明的是,客戶端的本地信息庫實(shí)際上是與客戶端所屬應(yīng)用場景相關(guān)的信息庫,例如若客戶端屬于語音撥號場景,則本地信息庫可以是通訊錄,若客戶端屬于語音播放控制場景,則本地信息庫可以是本地音樂庫。
[0061]本實(shí)施例通過將不確定性較強(qiáng)的實(shí)體詞轉(zhuǎn)換為拼音流并發(fā)送給客戶端,有利于客戶端根據(jù)本地與應(yīng)用場景相關(guān)的信息庫準(zhǔn)確確定該拼音流對應(yīng)的實(shí)體詞,提高最終解析結(jié)果的準(zhǔn)確度。另外,由于不確定性較強(qiáng)的實(shí)體詞交由客戶端根據(jù)具體應(yīng)用場景來確定,使得服務(wù)端只需存儲固定句式解析模板即可,不用像現(xiàn)有技術(shù)中存儲每個實(shí)體詞對應(yīng)的通用語義解析模板,有利于減少解析模板的數(shù)量。
[0062]圖2為本發(fā)明另一實(shí)施例提供的語音信號處理方法的流程示意圖。如圖2所示,該方法包括:
[0063]201、向服務(wù)端發(fā)送語音信號,以供服務(wù)端對語音信號進(jìn)行語義解析。
[0064]202、接收服務(wù)端返回的中間解析結(jié)果,中間解析結(jié)果是服務(wù)端將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流后獲得的,中間解析結(jié)果包括初始解析結(jié)果中的固定句式和實(shí)體詞轉(zhuǎn)換成的拼音流。
[0065]203、利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果O
[0066]本實(shí)施例提供一種語音信號處理方法,可由語音信號處理裝置來執(zhí)行,用以對語音信號進(jìn)行語義解析,提高語義解析的準(zhǔn)確度。
[0067]本實(shí)施例提供的方法適用于各種需要對語音信號進(jìn)行語義解析的應(yīng)用場景,例如語音撥號、語音導(dǎo)航、語音播放控制、語音信息檢索等。其中,語音信號處理裝置可位于各應(yīng)用場景中的客戶端實(shí)現(xiàn)。
[0068]具體的,在各應(yīng)用場景中,語音信號處理裝置采集用戶的語音信號,例如對用戶的語音進(jìn)行錄制,從而獲取用戶的語音信號,然后將語音信號發(fā)送給服務(wù)端,以供服務(wù)端對語音信號進(jìn)行語義解析。
[0069]其中,服務(wù)端對語音信號進(jìn)行語義解析的過程可參見圖1所示實(shí)施例的描述,在此不再贅述。
[0070]在將語音信號發(fā)送給服務(wù)端之后,語音信號處理裝置等待接收服務(wù)端返回的中間解析結(jié)果,在接收到中間解析結(jié)果后,利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。
[0071]具體的,語音信號處理裝置將拼音流在本地信息庫中進(jìn)行匹配,以獲得拼音流對應(yīng)的實(shí)體詞;將中間解析結(jié)果中的固定句式與拼音流對應(yīng)的實(shí)體詞進(jìn)行組合,以獲得最終解析結(jié)果。
[0072]例如,語音信號處理裝置可以采用最小編輯距離匹配算法,將該拼音流在本地信息庫中進(jìn)行匹配,以獲得該拼音流對應(yīng)的實(shí)體詞。
[0073]值得說明的是,語音信號處理裝置的本地信息庫實(shí)際上是與應(yīng)用場景相關(guān)的信息庫,例如若是語音撥號場景,則本地信息庫可以是通訊錄,若是語音播放控制場景,則本地信息庫可以是本地音樂庫、本地視頻庫等。
[0074]另外,語音信號處理裝置在獲得最終解析結(jié)果后,可以根據(jù)最終解析結(jié)果進(jìn)行相應(yīng)操作,例如根據(jù)最終解析結(jié)果進(jìn)行撥號控制,或者根據(jù)最終解析結(jié)果進(jìn)行播放控制,或者根據(jù)最終解析結(jié)果進(jìn)行搜索等。
[0075]在此說明,若語音信號處理裝置未能在本地信息庫中匹配到拼音流對應(yīng)的實(shí)體詞,語音信號處理裝置可以直接拒絕用戶的相應(yīng)請求,例如拒絕撥號、拒絕播放歌曲或拒絕搜索歌詞等?;蛘?,若語音信號處理裝置未能在本地信息庫中匹配到拼音流對應(yīng)的實(shí)體詞,語音信號處理裝置可以通過與用戶交互的方式進(jìn)行處理,例如向用戶輸出提示信息,以供用戶確定是否繼續(xù)執(zhí)行相應(yīng)操作,并根據(jù)用戶的指示執(zhí)行相應(yīng)操作。
[0076]在本實(shí)施例中,語音信號處理裝置與服務(wù)端相配合,根據(jù)本地與應(yīng)用場景相關(guān)的?目息庫,能夠?qū)Σ淮_定性$父尚的實(shí)體詞對應(yīng)的拼首流進(jìn)彳丁準(zhǔn)確識別,有利于提尚最終解析結(jié)果的準(zhǔn)確度,同時有利于減少解析模板的數(shù)量。
[0077]圖3為本發(fā)明又一實(shí)施例提供的語音信號處理裝置的結(jié)構(gòu)示意圖。該裝置位于服務(wù)端中實(shí)現(xiàn)。如圖3所示,該裝置包括:接收模塊31、語音識別模塊32、語義解析模塊33、轉(zhuǎn)換模塊34和發(fā)送模塊35。
[0078]接收模塊31,用于接收客戶端發(fā)送的語音信號。
[0079]語音識別模塊32,用于對語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù)。
[0080]語義解析模塊33,用于對文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果。
[0081]轉(zhuǎn)換模塊34,用于將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果O
[0082]發(fā)送模塊35,用于將中間解析結(jié)果發(fā)送給客戶端,以供客戶端利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。
[0083]在一可選實(shí)施方式中,語義解析模塊33具體用于:
[0084]利用預(yù)設(shè)的固定句式解析模板與文本數(shù)據(jù)進(jìn)行匹配,以獲得文本數(shù)據(jù)匹配中的目標(biāo)固定句式解析模板,目標(biāo)固定句式解析模板包括固定表達(dá)部分和待定表達(dá)部分;
[0085]將文本數(shù)據(jù)中對應(yīng)固定表達(dá)部分的內(nèi)容作為初始解析結(jié)果中的固定句式,將文本數(shù)據(jù)中對應(yīng)待定表達(dá)部分的內(nèi)容作為初始解析結(jié)果中的實(shí)體詞。
[0086]在本實(shí)施例中,固定句式解析模板包括固定表達(dá)部分和待定表達(dá)部分。固定表達(dá)部分是比較固定的,在相同應(yīng)用場景的不同請求中一般不會發(fā)生變化,而待定表達(dá)部分是不固定的,在相同應(yīng)用場景的不同請求中往往會發(fā)生變化。
[0087]在一可選實(shí)施方式中,語義解析模塊33具體用于:利用預(yù)設(shè)的通用語義解析模板與文本數(shù)據(jù)進(jìn)行匹配,并在未匹配中通用語義解析模板時,觸發(fā)執(zhí)行對文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果的操作。
[0088]本實(shí)施例提供的語音信號處理裝置,位于服務(wù)端實(shí)現(xiàn),采用固定句式語義解析方式對語音信號對應(yīng)的文本數(shù)據(jù)進(jìn)行語義解析,獲得包括固定句式和實(shí)體詞的初始解析結(jié)果,將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果,將中間解析結(jié)果發(fā)送給客戶端,使得客戶端可以利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果,充分發(fā)揮了客戶端本地信息庫對部分實(shí)體詞在語義解析上的作用,對服務(wù)端無法準(zhǔn)確解析的結(jié)果進(jìn)行修正,提高了語義解析的準(zhǔn)確度,同時有利于減少服務(wù)端存儲的語義解析模板的數(shù)量。
[0089]圖4為本發(fā)明又一實(shí)施例提供的語音信號處理裝置的結(jié)構(gòu)示意圖。該裝置位于客戶端實(shí)現(xiàn),如圖4所示,該裝置包括:發(fā)送模塊41、接收模塊42和修正模塊43。
[0090]發(fā)送模塊41,用于向服務(wù)端發(fā)送語音信號,以供服務(wù)端對語音信號進(jìn)行語義解析。[0091 ]接收模塊42,用于接收服務(wù)端返回的中間解析結(jié)果,中間解析結(jié)果是服務(wù)端將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流后獲得的,中間解析結(jié)果包括初始解析結(jié)果中的固定句式和實(shí)體詞轉(zhuǎn)換成的拼音流。
[0092]修正模塊43,用于利用本地信息庫對中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。
[0093]在一可選實(shí)施方式中,修正模塊43具體用于:
[0094]將拼音流在本地信息庫中進(jìn)行匹配,以獲得拼音流對應(yīng)的實(shí)體詞;
[0095]將固定句式與拼音流對應(yīng)的實(shí)體詞進(jìn)行組合,以獲得最終解析結(jié)果。
[0096]例如,修正模塊43具體可以采用最小編輯距離匹配算法,將該拼音流在本地信息庫中進(jìn)行匹配,以獲得該拼音流對應(yīng)的實(shí)體詞。
[0097]值得說明的是,語音信號處理裝置的本地信息庫實(shí)際上是與應(yīng)用場景相關(guān)的信息庫,例如若是語音撥號場景,則本地信息庫可以是通訊錄,若是語音播放控制場景,則本地信息庫可以是本地音樂庫、本地視頻庫等。
[0098]本實(shí)施例提供的語音信號處理裝置,位于客戶端實(shí)現(xiàn),與服務(wù)端相配合,根據(jù)本地與應(yīng)用場景相關(guān)的信息庫,能夠?qū)Σ淮_定性較高的實(shí)體詞對應(yīng)的拼音流進(jìn)行準(zhǔn)確識別,有利于提高最終解析結(jié)果的準(zhǔn)確度,同時有利于減少解析模板的數(shù)量。
[0099]以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動的情況下,即可以理解并實(shí)施。
[0100]通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施方式可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲在計(jì)算機(jī)可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0101]最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1.一種語音信號處理方法,其特征在于,包括: 接收客戶端發(fā)送的語音信號; 對所述語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù); 對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果; 將所述初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果; 將所述中間解析結(jié)果發(fā)送給所述客戶端,以供所述客戶端利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果,包括: 利用預(yù)設(shè)的固定句式解析模板與所述文本數(shù)據(jù)進(jìn)行匹配,以獲得所述文本數(shù)據(jù)匹配中的目標(biāo)固定句式解析模板,所述目標(biāo)固定句式解析模板包括固定表達(dá)部分和待定表達(dá)部分; 將所述文本數(shù)據(jù)中對應(yīng)所述固定表達(dá)部分的內(nèi)容作為所述初始解析結(jié)果中的固定句式,將所述文本數(shù)據(jù)中對應(yīng)所述待定表達(dá)部分的內(nèi)容作為所述初始解析結(jié)果中的實(shí)體詞。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果之前,包括: 利用預(yù)設(shè)的通用語義解析模板與所述文本數(shù)據(jù)進(jìn)行匹配,并在未匹配中通用語義解析模板時,觸發(fā)執(zhí)行對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果的操作。4.一種語音信號處理方法,其特征在于,包括: 向服務(wù)端發(fā)送語音信號,以供所述服務(wù)端對所述語音信號進(jìn)行語義解析; 接收所述服務(wù)端返回的中間解析結(jié)果,所述中間解析結(jié)果是所述服務(wù)端將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流后獲得的,所述中間解析結(jié)果包括所述初始解析結(jié)果中的固定句式和所述實(shí)體詞轉(zhuǎn)換成的拼音流; 利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果,包括: 將所述拼音流在所述本地信息庫中進(jìn)行匹配,以獲得所述拼音流對應(yīng)的實(shí)體詞; 將所述固定句式與所述拼音流對應(yīng)的實(shí)體詞進(jìn)行組合,以獲得所述最終解析結(jié)果。6.一種語音信號處理裝置,位于服務(wù)端實(shí)現(xiàn),其特征在于,所述裝置包括: 接收模塊,用于接收客戶端發(fā)送的語音信號; 語音識別模塊,用于對所述語音信號進(jìn)行語音識別,以獲得文本數(shù)據(jù); 語義解析模塊,用于對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果; 轉(zhuǎn)換模塊,用于將所述初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流,以獲得中間解析結(jié)果;發(fā)送模塊,用于將所述中間解析結(jié)果發(fā)送給所述客戶端,以供所述客戶端利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正后獲得最終解析結(jié)果。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述語義解析模塊具體用于: 利用預(yù)設(shè)的固定句式解析模板與所述文本數(shù)據(jù)進(jìn)行匹配,以獲得所述文本數(shù)據(jù)匹配中的目標(biāo)固定句式解析模板,所述目標(biāo)固定句式解析模板包括固定表達(dá)部分和待定表達(dá)部分; 將所述文本數(shù)據(jù)中對應(yīng)所述固定表達(dá)部分的內(nèi)容作為所述初始解析結(jié)果中的固定句式,將所述文本數(shù)據(jù)中對應(yīng)所述待定表達(dá)部分的內(nèi)容作為所述初始解析結(jié)果中的實(shí)體詞。8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述語義解析模塊具體用于: 利用預(yù)設(shè)的通用語義解析模板與所述文本數(shù)據(jù)進(jìn)行匹配,并在未匹配中通用語義解析模板時,觸發(fā)執(zhí)行對所述文本數(shù)據(jù)進(jìn)行固定句式語義解析,以獲得包括固定句式和實(shí)體詞的初始解析結(jié)果的操作。9.一種語音信號處理裝置,位于客戶端實(shí)現(xiàn),其特征在于,所述裝置包括: 發(fā)送模塊,用于向服務(wù)端發(fā)送語音信號,以供所述服務(wù)端對所述語音信號進(jìn)行語義解析; 接收模塊,用于接收所述服務(wù)端返回的中間解析結(jié)果,所述中間解析結(jié)果是所述服務(wù)端將初始解析結(jié)果中的實(shí)體詞轉(zhuǎn)換為拼音流后獲得的,所述中間解析結(jié)果包括所述初始解析結(jié)果中的固定句式和所述實(shí)體詞轉(zhuǎn)換成的拼音流; 修正模塊,用于利用本地信息庫對所述中間解析結(jié)果中的拼音流進(jìn)行修正,以獲得最終解析結(jié)果。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述修正模塊具體用于: 將所述拼音流在所述本地信息庫中進(jìn)行匹配,以獲得所述拼音流對應(yīng)的實(shí)體詞; 將所述固定句式與所述拼音流對應(yīng)的實(shí)體詞進(jìn)行組合,以獲得所述最終解析結(jié)果。
【文檔編號】G10L15/30GK105895090SQ201610193074
【公開日】2016年8月24日
【申請日】2016年3月30日
【發(fā)明人】王育軍
【申請人】樂視控股(北京)有限公司, 樂視致新電子科技(天津)有限公司