用于發(fā)送語音信息及其文本描述信息的方法、裝置與設(shè)備的制作方法
【專利摘要】本發(fā)明的目的是提供一種用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法、裝置與設(shè)備。其中,首先獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;接著,本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息;隨后,文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。與現(xiàn)有技術(shù)相比,本發(fā)明中移動終端能夠?qū)⒄Z音信息及其文本描述信息相結(jié)合的進(jìn)行發(fā)送,使得作為接受一方的用戶能夠?qū)⒄Z音信息與包括其主要內(nèi)容的文本描述信息相結(jié)合的進(jìn)行信息的獲取,使得用戶在無需收聽語音信息的情況下也能夠了解語音信息的內(nèi)容,并實現(xiàn)了用戶通過聽覺與視覺相結(jié)合的方式直觀地獲取語音信息中的語音內(nèi)容,提高用戶使用體驗。
【專利說明】用于發(fā)送語音信息及其文本描述信息的方法、裝置與設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動終端信息發(fā)送領(lǐng)域,尤其涉及一種用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法、裝置與設(shè)備。
【背景技術(shù)】
[0002]隨著移動互聯(lián)網(wǎng)在人們的生活中扮演越來越重要的角色,人們可隨時隨地通過移動終端在互聯(lián)網(wǎng)中進(jìn)行信息的傳遞與交互。但現(xiàn)有技術(shù)中,移動終端接收用戶輸入的語音信息并直接進(jìn)行發(fā)送,因此,作為接收一方的用戶需要將該語音信息下載至本地并執(zhí)行收聽操作才能夠知道語音信息的內(nèi)容,其無法在沒有收聽語音消息的情況下直觀地獲取該語音信息中的語音內(nèi)容,亦不可以通過聽覺與視覺相結(jié)合的方式獲取語音信息中的語音內(nèi)容,從而導(dǎo)致用戶體驗度不高。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法、裝置與設(shè)備。
[0004]根據(jù)本發(fā)明的一個方面,提供了一種在移動終端中用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法,該方法包括以下步驟:
[0005]a獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;
[0006]b根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息;
[0007]c將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0008]根據(jù)本發(fā)明的另一方面,還提供了一種用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的發(fā)送裝置,該發(fā)送裝置包括:
[0009]識別結(jié)果獲取裝置,用于獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;
[0010]描述信息生成裝置,用于根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息;
[0011]關(guān)聯(lián)發(fā)送裝置,用于將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0012]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:1)移動終端能夠?qū)⒄Z音信息及其文本描述信息相結(jié)合的進(jìn)行發(fā)送,使得作為接受一方的用戶能夠?qū)⒄Z音信息與包括其主要內(nèi)容的文本描述信息相結(jié)合的進(jìn)行信息的獲取,使得用戶在無需收聽語音信息的情況下也能夠了解語音信息的內(nèi)容,并實現(xiàn)了用戶通過聽覺與視覺相結(jié)合的方式直觀地獲取語音信息中的語音內(nèi)容,提高用戶信息獲取體驗;2)由于作為接受一方的用戶僅通過瀏覽該文本描述信息即可直觀的獲取語音信息中的主要內(nèi)容,當(dāng)在語音信息的語音內(nèi)容較多,需要花費(fèi)較多時間收聽語音的情況下,提高了接收到該文本描述信息的用戶的信息獲取效率;3)通過將文本描述信息以多種形式與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送,實現(xiàn)了多元化的語音信息與文本信息相結(jié)合的發(fā)送方式,提高用戶使用體驗;4)進(jìn)一步,作為接收一方的用戶也可首先對文本描述信息進(jìn)行瀏覽,以判斷其是否希望收聽語音信息,從而實現(xiàn)用戶對垃圾語音信息的預(yù)判,避免收聽語音垃圾信息。
【專利附圖】
【附圖說明】
[0013]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0014]圖1示出本發(fā)明一個方面的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的發(fā)送裝置的結(jié)構(gòu)示意圖;
[0015]圖2不出根據(jù)本發(fā)明一個優(yōu)選實施例的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的發(fā)送裝置的設(shè)備示意圖;
[0016]圖3示出根據(jù)本發(fā)明另一個優(yōu)選實施例的用于生成用于描述所述語音信息的語音內(nèi)容的文本描述信息的描述信息生成裝置;
[0017]圖4示出根據(jù)本發(fā)明另一個方面用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法流程圖;
[0018]圖5不出根據(jù)本發(fā)明一個優(yōu)選實施例的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法流程圖;
[0019]圖6示出根據(jù)本發(fā)明另一個優(yōu)選實施例的用于生成用于描述所述語音信息的語音內(nèi)容的文本描述信息的方法流程圖。
[0020]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實施方式】
[0021]下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。
[0022]圖1示出本發(fā)明一個方面的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的發(fā)送裝置的結(jié)構(gòu)示意圖。本實施例的發(fā)送裝置包含于移動終端中;該發(fā)送裝置包括識別結(jié)果獲取裝置1、描述信息生成裝置2和關(guān)聯(lián)發(fā)送裝置3。
[0023]其中,所述移動終端包括一種能夠按照事先設(shè)定或存儲的指令,自動進(jìn)行數(shù)值計算和信息處理的電子設(shè)備,其硬件可包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。所述移動終端包括但不限于任何可適用于本發(fā)明的能夠通過鍵盤、觸摸屏等與用戶進(jìn)行交互的電子產(chǎn)品,諸如平板電腦、手機(jī)、PDA、掌上電腦(PPC)、游戲機(jī)(PSP)等。
[0024]本領(lǐng)域技術(shù)人員應(yīng)能理解上述移動終端僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的移動終端如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。
[0025]首先,識別結(jié)果獲取裝置I獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息。
[0026]其中,所述待識別語音信息的來源包括但不限于:
[0027]I)來自使用移動終端的用戶通過該移動終端輸入的語音信息;
[0028]2)來自存儲于移動終端的本地語音庫中的待發(fā)送語音信息;
[0029]3)來自第三方設(shè)備的轉(zhuǎn)發(fā)至移動終端的待發(fā)送語音信息。[0030]其中,本領(lǐng)域技術(shù)人員應(yīng)能夠根據(jù)實際情況和需求來確定所述語音識別的方式。優(yōu)選地,所述語音識別的方式包括但不限于:
[0031]I)基于DTW(Dynamic Time Warping)和模擬匹配技術(shù)的語音識別方式;其中,DTW和模板匹配技術(shù)直接利用提取的語音特征作為模板,能用于實現(xiàn)孤立詞語音識別中。
[0032]2)基于隱含馬爾科夫模型HMM(Hidden Markov Model)的識別語音識別方式;其中,該語音識別方式通過對大量語音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計,建立識別統(tǒng)計模型,然后從待識別語音中提取特征,與該等模型匹配,通過比較匹配分析以獲得識別結(jié)果。
[0033]3)人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Networks)的語音識別方式;該語音識別方式是在模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,以形成分布式并行信息處理的算法數(shù)學(xué)模型的基礎(chǔ)上的語音識別方式。
[0034]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何語音識別的實現(xiàn)方式,均能夠包含在本發(fā)明的范圍內(nèi)。
[0035]具體地,識別結(jié)果獲取裝置I獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息的方式包括但不限于:
[0036]I)識別結(jié)果獲取裝置I獲取移動終端對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;
[0037]在一示例中,首先,使用移動終端的用戶借助該移動終端的語音交互裝置,如麥克風(fēng),向該移動終端輸入待識別語音信息;移動終端接收該待識別語音信息,接著,該移動終端的識別結(jié)果獲取裝置I對該待識別語音信息進(jìn)行語音識別處理,例如,從該待識別語音中提取語音特征,與基于HMM識別算法生成的語音模型進(jìn)行匹配,通過比較匹配分析以獲得文本識別結(jié)果信息。
[0038]2)識別結(jié)果獲取裝置I獲取網(wǎng)絡(luò)設(shè)備對移動終端提供給其的待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;
[0039]其中,所述網(wǎng)絡(luò)設(shè)備包括一種能夠按照事先設(shè)定或存儲的指令,自動進(jìn)行數(shù)值計算和信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。所述網(wǎng)絡(luò)設(shè)備包括但不限于計算機(jī)、網(wǎng)絡(luò)主機(jī)、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或多個服務(wù)器構(gòu)成的云。在此,云由基于云計算(Cloud Computing)的大量計算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機(jī)集組成的一個超級虛擬計算機(jī)。
[0040]其中,所述移動終端與所述網(wǎng)絡(luò)設(shè)備之間可通過任何通信方式實現(xiàn)通信,包括但不限于,基于3GPP、LTE、WIMAX的移動通信、基于TCP/IP、UDP協(xié)議的計算機(jī)網(wǎng)絡(luò)通信以及基于藍(lán)牙、紅外傳輸標(biāo)準(zhǔn)的近距無線傳輸方式。所述移動終端與所述網(wǎng)絡(luò)設(shè)備之間連接的網(wǎng)絡(luò)包括但不限于:互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。
[0041]在一示例中,識別結(jié)果獲取裝置I將存儲于移動終端的本地語音庫中的一條待發(fā)送語音信息發(fā)送至網(wǎng)絡(luò)設(shè)備;網(wǎng)絡(luò)設(shè)備對該語音信息進(jìn)行語音識別處理,以獲得文本識別結(jié)果信息;隨后網(wǎng)絡(luò)設(shè)備將該網(wǎng)絡(luò)文本識別結(jié)果信息發(fā)送至該移動終端,該移動終端接收該網(wǎng)絡(luò)設(shè)備返回的該文本識別結(jié)果信息。
[0042]3)優(yōu)選地,識別結(jié)果獲取裝置I將從移動終端本地獲取的文本識別結(jié)果信息與從網(wǎng)絡(luò)設(shè)備獲得文本識別結(jié)果相結(jié)合,以獲得結(jié)合后的文本識別結(jié)果;其中,識別結(jié)果獲取裝置包括第一結(jié)果獲取裝置(圖未示)及第二結(jié)果獲取裝置(圖未示);第一結(jié)果獲取裝置獲取所述移動終端對所述待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,以及,網(wǎng)絡(luò)設(shè)備對所述移動終端提供給其的所述待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息;接著,第二結(jié)果獲取裝置根據(jù)所述本地文本識別結(jié)果信息與所述網(wǎng)絡(luò)文本識別結(jié)果信息,獲得所述文本識別結(jié)果信息。
[0043]具體地,第一結(jié)果獲取裝置獲取移動終端對待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,以及,網(wǎng)絡(luò)設(shè)備對該移動終端提供給其的該待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息;接著,第二結(jié)果獲取裝置對該本地文本識別結(jié)果信息及該網(wǎng)絡(luò)文本識別結(jié)果信息,通過自然語言分析規(guī)則分別進(jìn)行分析識別,例如通過句子切分、部分詞性標(biāo)注、名稱抽取、組塊、解析等自然語言分析規(guī)則,對本地及網(wǎng)絡(luò)文本識別結(jié)果信息分別進(jìn)行解析,以確定本地及網(wǎng)絡(luò)文本識別結(jié)果信息中語義正確的文本信息,以作為文本識別結(jié)果信息。其中,所述自然語言分析規(guī)則意指通過該自然語言分析規(guī)則實現(xiàn)人機(jī)之間自然語言的通信,即實現(xiàn)計算機(jī)對自然語言的理解,其可通過OpenNLP、FudanNLP、Standford NLP、語言技術(shù)平臺(LTP)等自然語言處理工具來實現(xiàn)。
[0044]例如,第一結(jié)果獲取裝置獲取移動終端對待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,該本地文本識別結(jié)果信息為“今天晚上6點蛋,咱們東單地鐵站口見,別忘了拿上文件”,以及,網(wǎng)絡(luò)設(shè)備對該移動終端提供給其的該待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息,該網(wǎng)絡(luò)文本識別結(jié)果為“今天晚上6點半,咱們東單地鐵站B 口見,別忘了拿”;接著,第二結(jié)果獲取裝置首先確定本地文本識別結(jié)果信息及網(wǎng)絡(luò)文本識別結(jié)果信息中的交集為“今天晚上6點X,咱們東單地鐵站X 口見,別忘了拿XXX”,并通過句子切分、部分詞性標(biāo)注、名稱抽取、組塊、解析等自然語言分析規(guī)則,分別對該本地文本識別結(jié)果信息及該網(wǎng)絡(luò)文本識別結(jié)果信息進(jìn)行分析識別,以確定該兩個文本識別結(jié)果不相交部分的語音正確的文本內(nèi)容為“點”、“B”和“上文件”,隨后獲取合并后的文本識別結(jié)果為“今天晚上6點半,咱們東單地鐵站B 口見,別忘了拿上文件”。
[0045]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0046]通過從移動終端本地和網(wǎng)絡(luò)分別獲取文本識別結(jié)果,實現(xiàn)了在本地語音識別能力較弱的情況下,網(wǎng)絡(luò)設(shè)備可向該移動終端提供較高語音識別能力的技術(shù)支持,以確保獲得的文本識別結(jié)果的準(zhǔn)確性和可靠性,進(jìn)一步為能夠獲得較為精確的描述語音信息中語音內(nèi)容的文本描述信息提供有力保證。
[0047]接著,描述信息生成裝置2根據(jù)識別結(jié)果獲取裝置I獲取的文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息。
[0048]其中,描述信息生成裝置2根據(jù)文本識別結(jié)果信息生成用于描述語音信息的語音內(nèi)容的文本描述信息的方式包括但不限于:
[0049]I)描述信息生成裝置2根據(jù)文本識別結(jié)果信息中的前第一預(yù)定字符數(shù)或前第二預(yù)定完整語句數(shù),生成文本描述信息;
[0050]例如,語音信息識別出的文本識別結(jié)果信息為“我很想去看碟中諜4,不知道哪里還在上映,咱們找找吧”,描述信息生成裝置2提取該文本識別結(jié)果信息中第I個完整語句“我很想去看碟中諜4”,以作為用于描述該語音信息的語音內(nèi)容的文本描述信息。
[0051]可選地,當(dāng)文本識別結(jié)果信息中包括的字符數(shù)小于或等于第三預(yù)定字符數(shù),或文本識別結(jié)果信息中包括的完整語句數(shù)小于或等于第四預(yù)定語句數(shù)時,則描述信息生成裝置2將該文本識別結(jié)果信息整體作為用于描述語音信息的語音內(nèi)容的文本描述信息;
[0052]例如,語音信息識別出的文本識別結(jié)果信息為“你幾點下班”,即其中僅包括I個完整語句數(shù),即小于第四預(yù)定語句數(shù)2,則描述信息生成裝置2將該文本識別結(jié)果信息整體“你幾點下班”作為用于描述語音信息的語音內(nèi)容的文本描述信息。
[0053]2)該發(fā)送裝置還包括關(guān)鍵詞提取裝置(圖未示),關(guān)鍵詞提取裝置從識別結(jié)果獲取裝置I獲取的文本識別結(jié)果信息中提取至少一個主體關(guān)鍵詞;描述信息生成裝置2包括子生成裝置(圖未示),其根據(jù)所述至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成文本描述信息。
[0054]具體地,關(guān)鍵詞提取裝置從識別結(jié)果獲取裝置I獲取的文本識別結(jié)果信息中提取每一語句的主語、謂語和賓語,優(yōu)選地,還可包括諸如定語、狀語等,或者,關(guān)鍵詞提取裝置從識別結(jié)果獲取裝置I中獲取實詞,以作為該文本識別結(jié)果信息的主體關(guān)鍵詞;接著,子生成裝置根據(jù)該至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成文本描述信息。優(yōu)選地,當(dāng)文本識別結(jié)果信息僅包括一個詞語時,關(guān)鍵詞提取裝置將該詞語作為主體關(guān)鍵詞。
[0055]優(yōu)選地,子生成裝置根據(jù)至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成文本描述信息的方式包括但不限于:
[0056]a將至少一個主體關(guān)鍵詞中的前第六預(yù)定字符數(shù)的主體關(guān)鍵詞相結(jié)合,以生成文本描述信息;
[0057]b將至少一個主體關(guān)鍵詞中的全部關(guān)鍵詞相結(jié)合,以生成文本描述信息。
[0058]在一示例中,語音信息已識別出的文本識別結(jié)果信息為“今天可能下雨,出門時你拿上門后面的雨傘”,關(guān)鍵詞提取裝置通過句子切分、部分詞性標(biāo)注、名稱抽取、解析等自然語言分析規(guī)則,從該文本識別結(jié)果中提取第一句的主語“今天”及謂語“下雨”,提取第二句的主語“你”、謂語“拿上”及賓語“雨傘”;子生成裝置根據(jù)該等全部主體關(guān)鍵詞,將第一句的主語和謂語進(jìn)行合并,以生成“今天下雨”,將第二句的主語、謂語和賓語進(jìn)行合并,以生成“你拿上雨傘”,即生成文本描述信息“今天下雨,你拿上雨傘”。
[0059]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息的實現(xiàn)方式,例如,將能夠文本識別結(jié)果信息與預(yù)定關(guān)鍵詞庫中的關(guān)鍵詞進(jìn)行匹配查詢,并將文本識別結(jié)果信息中能夠匹配出的關(guān)鍵詞作為從其中提取出的關(guān)鍵詞等,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0060]以文本描述信息作為描述語音信息的語音內(nèi)容,能夠保證作為接受一方的用戶僅通過瀏覽該文本描述信息,即可直觀且準(zhǔn)確的獲取語音信息中的主要內(nèi)容,當(dāng)在語音信息的語音內(nèi)容較多,需要花費(fèi)較多時間收聽語音的情況下,還能提高該用戶的信息獲取效率。
[0061]隨后,關(guān)聯(lián)發(fā)送裝置3將描述信息生成裝置2獲取的文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0062]優(yōu)選地,所述文本描述信息與所述語音信息相關(guān)聯(lián)地方式包括但不限于以下至少一種:
[0063]I)將文本描述信息作為語音信息的標(biāo)題信息;
[0064]2)將文本描述信息作為語音信息的摘要信息;
[0065]3)將文本描述信息作為語音信息的屬性信息,例如,將文本描述信息加入語音文件的屬性描述中。
[0066]其中,關(guān)聯(lián)發(fā)送裝置3將文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方式包括但不限于以下情形:
[0067]I)將文本描述信息作為語音信息的標(biāo)題信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;
[0068]例如,關(guān)聯(lián)發(fā)送裝置3將該標(biāo)題信息作為語音信息的文件名,將具有該文件名的語音信息進(jìn)行發(fā)送;當(dāng)作為接受一方的用戶接收到該語音信息時,可直接通過瀏覽該語音Ih息的文件名獲得該語首/[目息的語首內(nèi)容。
[0069]2)將文本描述信息作為語音信息的摘要信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;
[0070]例如,關(guān)聯(lián)發(fā)送裝置3將語音信息作為摘要信息中的語音信息附件,將具有該語音信息附件的摘要信息進(jìn)行發(fā)送;當(dāng)作為接受一方的用戶接收到該摘要信息時,可直接通過該摘要信息的文本內(nèi)容獲得該語音信息的語音內(nèi)容。
[0071]又例如,關(guān)聯(lián)發(fā)送裝置3將摘要信息以隱藏方式,如將摘要信息隱藏為一個能夠被點擊的圖形對象,與語音信息相關(guān)聯(lián)的進(jìn)行發(fā)送,當(dāng)作為接受一方的用戶接收到該語音信息,并對該圖形對象進(jìn)行點擊、懸浮等操作時,所隱藏的摘要信息被呈現(xiàn)。
[0072]3)將文本描述信息作為語音信息的屬性信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;
[0073]例如,關(guān)聯(lián)發(fā)送裝置3將文本描述信息作為語音信息的屬性信息中的屬性標(biāo)題、屬性主題內(nèi)容等,與語音信息相關(guān)聯(lián)的進(jìn)行發(fā)送,當(dāng)作為接受一方的用戶接收到該語音信息時,點擊查看該語音信息的屬性信息,可獲得該文本描述信息。
[0074]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0075]由于移動終端能夠?qū)⒄Z音信息及其文本描述信息相結(jié)合的進(jìn)行發(fā)送,使得作為接受一方的用戶能夠?qū)⒄Z音信息與包括其主要內(nèi)容的文本描述信息相結(jié)合的進(jìn)行信息的獲取,使得用戶在無需收聽語音信息的情況下也能夠了解語音信息的內(nèi)容,并實現(xiàn)了用戶通過聽覺與視覺相結(jié)合的方式直觀地獲取語音信息中的語音內(nèi)容,提高用戶信息獲取體驗;同時,通過將文本描述信息以多種形式與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送,實現(xiàn)了多元化的語音信息與文本信息相結(jié)合的發(fā)送方式,提高用戶使用體驗;進(jìn)一步,作為接收一方的用戶也可首先對文本描述信息進(jìn)行瀏覽,以判斷其是否希望收聽語音信息,可實現(xiàn)用戶對垃圾語音信息的預(yù)判,避免收聽語音垃圾信息。
[0076]作為本實施例的優(yōu)選方案之一(參照圖1),發(fā)送裝置還包括設(shè)置信息獲取裝置(圖未示),設(shè)置信息獲取裝置獲取所述移動終端的發(fā)送設(shè)置信息;關(guān)聯(lián)發(fā)送裝置3將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的操作包括:根據(jù)所述發(fā)送設(shè)置信息,將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0077]具體地,設(shè)置信息獲取裝置獲取移動終端的發(fā)送設(shè)置信息的方式包括但不限于:
[0078]I)從移動終端中用于信息發(fā)送的應(yīng)用的配置信息庫中讀取預(yù)置的發(fā)送設(shè)置信息,例如,發(fā)送設(shè)置信息包括將文本識別結(jié)果信息作為標(biāo)題信息進(jìn)行發(fā)送;
[0079]2)通過與使用移動終端的用戶進(jìn)行交互,實時地獲取用戶設(shè)置的移動終端的發(fā)送設(shè)置信息。
[0080]接著,當(dāng)關(guān)聯(lián)發(fā)送裝置3需要將文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送時,其根據(jù)設(shè)置信息獲取裝置獲取的發(fā)送設(shè)置信息,將文本描述信息與語音信息以發(fā)送設(shè)置信息中示出的相關(guān)聯(lián)發(fā)送方式,進(jìn)行發(fā)送。
[0081]在一示例中,首先,設(shè)置信息獲取裝置讀取移動終端中信息發(fā)送應(yīng)用的配置信息庫,獲得發(fā)送設(shè)置信息為將文本描述信息作為語音信息的摘要信息,與語音信息相關(guān)聯(lián)的進(jìn)行發(fā)送;隨后,關(guān)聯(lián)發(fā)送裝置3根據(jù)該發(fā)送設(shè)置信息,將語音信息作為摘要信息中的語音信息附件,將具有該語音信息附件的摘要信息進(jìn)行發(fā)送。
[0082]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根獲取所述移動終端的發(fā)送設(shè)置信息,將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0083]通過根據(jù)發(fā)送設(shè)置信息將文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送,實現(xiàn)了可配置的關(guān)聯(lián)發(fā)送方式,用戶可預(yù)置或?qū)崟r地選擇其所期望的發(fā)送方式,提高信息發(fā)送方式的可控性,進(jìn)而提高用戶使用體驗。
[0084]圖2不出根據(jù)本發(fā)明一個優(yōu)選實施例的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的發(fā)送裝置的設(shè)備示意圖。本實施例中的發(fā)送裝置包括識別結(jié)果獲取裝置1、描述信息生成裝置2、關(guān)聯(lián)發(fā)送裝置3、位置信息提取裝置4和地圖信息獲取裝置5 ;其中,關(guān)聯(lián)發(fā)送裝置3包括子關(guān)聯(lián)發(fā)送裝置31。
[0085]其中,識別結(jié)果獲取裝置I和描述信息生成裝置2已在參照圖1所示實施例中予以詳述,在此不再贅述。
[0086]位置信息提取裝置4提取所述文本識別結(jié)果信息中的地理位置信息。具體地,位置信息提取裝置4可采用多種方式提取文本識別結(jié)果信息中的地理位置信息,例如,其可采用的方式包括但不限于:
[0087]I)位置信息提取裝置4通過預(yù)定的用于識別地理位置信息的正則表達(dá)式,在文本識別結(jié)果信息中進(jìn)行匹配識別,以確定該文本識別結(jié)果信息中與該正則表達(dá)式相匹配的地理位置信息;
[0088]例如,以C Sharp語言為例,通過預(yù)定的表示地理位置信息“XX市XX區(qū)”的正則表達(dá)式:
[0089]" ( ? <c>.*?)市(?〈d>.*?)區(qū).*",
[0090]在文本識別結(jié)果信息中進(jìn)行匹配,以確定與該正則表達(dá)式相匹配的地理位置信息為“北京市海淀區(qū)”;其中,所述C Sharp語音為一種對象導(dǎo)向(object-oriented)程序語言。
[0091]2)位置信息提取裝置4根據(jù)預(yù)定的地理信息字符串,在文本識別結(jié)果信息中進(jìn)行匹配識別,以確定該文本識別結(jié)果信息中與該預(yù)定地理信息字符串相匹配的地理位置信息;
[0092]例如,預(yù)定的地理信息字符串分別為“北京市海淀區(qū)”、“北京市朝陽區(qū)”、“北京市東城區(qū)”,將該三個地理信息字符串分別在文本識別結(jié)果信息進(jìn)行匹配識別,確定“北京市東城區(qū)”與該文本識別結(jié)果中包括的文本序列相匹配,則提取該地理信息字符串對應(yīng)的該文本序列,以作為地理位置信息。
[0093]接著,地圖信息獲取裝置5根據(jù)所述地理位置信息,獲得所述地理位置信息所屬地理區(qū)域的地圖信息。具體地,地圖信息獲取裝置5可采用多種方式獲得地理位置信息所屬地理區(qū)域的地圖信息,例如,其可采用的方式包括但不限于:
[0094]I)地圖信息獲取裝置5通過調(diào)用移動終端本地的地圖應(yīng)用接口(API),將地理位置信息作為輸入?yún)?shù),在地圖應(yīng)用中進(jìn)行位置查詢,以生成該地理位置信息所屬地理區(qū)域的地圖信息,如生成地圖圖片;
[0095]2)地圖信息獲取裝置5根據(jù)地理位置信息,在移動終端本地或網(wǎng)絡(luò)設(shè)備的地圖信息庫中進(jìn)行匹配查詢,以獲取預(yù)存的與該地理位置相對應(yīng)的地圖信息。
[0096]隨后,子關(guān)聯(lián)發(fā)送裝置31將地圖信息和文本描述信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;如將地圖信息和文本描述信息作為語音信息的圖文摘要信息、又如將文本描述信息作為語音信息與地圖信息的標(biāo)題信息、又如將地圖信息和文本描述信息作為語音信息的屬性信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0097]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何提取所述文本識別結(jié)果信息中的地理位置信息,根據(jù)所述地理位置信息,獲得所述地理位置信息所屬地理區(qū)域的地圖信息,接著將所述地圖信息和所述文本識別結(jié)果信息,與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0098]當(dāng)語音信息中包括地理位置信息時,通過將該地理位置信息所屬地理區(qū)域的對應(yīng)的地圖信息與文本識別結(jié)果信息相關(guān)聯(lián)的發(fā)送,使得接收一方的用戶無需自行查找,即能直接可視化地獲取地理位置信息所屬地理區(qū)域的準(zhǔn)確位置,提高用戶瀏覽體驗。
[0099]圖3示出根據(jù)本發(fā)明另一個優(yōu)選實施例的用于生成用于描述所述語音信息的語音內(nèi)容的文本描述信息的描述信息生成裝置2。描述信息生成裝置2包括初始文本生成裝置21、呈現(xiàn)裝置22和描述信息獲取裝置23。
[0100]其中,初始文本生成裝置21根據(jù)文本識別結(jié)果信息,生成用于描述語音信息的語音內(nèi)容的初始文本描述信息。其方式與參照圖1所示描述信息生成裝置2根據(jù)文本識別結(jié)果信息,生成用于描述語音信息的語音內(nèi)容的文本描述信息的方式相同或相似,在此不再贅述。
[0101]呈現(xiàn)裝置22將所述初始文本描述信息呈現(xiàn)給使用所述移動終端的用戶。
[0102]例如,呈現(xiàn)裝置22將初始文本生成裝置21生成的初始文本描述信息,通過頁面技術(shù),如JSP、ASP、PHP,按一定順序和格式在移動終端顯示屏幕中呈現(xiàn)給用戶,供使用該移動終端的用戶進(jìn)行瀏覽。
[0103]接著,描述信息獲取裝置23根據(jù)所述用戶對所述文本描述信息的調(diào)整操作,獲取調(diào)整后的文本描述信息。
[0104]例如,描述信息獲取裝置23通過與該用戶的交互操作,獲取該用戶對該文本描述信息的調(diào)整操作,如刪除、添加、語序調(diào)整等;隨后根據(jù)該(等)調(diào)整操作,對該文本描述信息進(jìn)行相應(yīng)調(diào)整,以獲取調(diào)整后的文本描述信息。
[0105]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的初始文本描述信息,接著將所述初始文本描述信息呈現(xiàn)給使用所述移動終端的用戶,隨后根據(jù)所述用戶對所述文本描述信息的調(diào)整操作,獲取調(diào)整后的文本描述信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0106]通過獲取用戶對初始文本描述信息進(jìn)行調(diào)整操作以獲取調(diào)整后的文本描述信息,從而使得在初始文本描述信息不準(zhǔn)確的情況下,用戶對初始文本描述信息執(zhí)行調(diào)整編輯操作成為可能,提高文本描述信息的內(nèi)容準(zhǔn)確性,從而保證將更為準(zhǔn)確的調(diào)整后的文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0107]圖4示出本發(fā)明一個方面的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法流程圖。根據(jù)本優(yōu)選實施例的方法包括步驟S1、步驟S2和步驟S3。其中,本發(fā)明的方法主要通過移動終端來實現(xiàn)。
[0108]其中,所述移動終端包括一種能夠按照事先設(shè)定或存儲的指令,自動進(jìn)行數(shù)值計算和信息處理的電子設(shè)備,其硬件可包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。所述移動終端包括但不限于任何可適用于本發(fā)明的能夠通過鍵盤、觸摸屏等與用戶進(jìn)行交互的電子產(chǎn)品,諸如平板電腦、手機(jī)、PDA、掌上電腦(PPC)、游戲機(jī)(PSP)等。
[0109]本領(lǐng)域技術(shù)人員應(yīng)能理解上述移動終端僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的移動終端如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。
[0110]首先,在步驟SI中,移動終端獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息。
[0111]其中,所述待識別語音信息的來源包括但不限于:
[0112]I)來自使用移動終端的用戶通過該移動終端輸入的語音信息;
[0113]2)來自存儲于移動終端的本地語音庫中的待發(fā)送語音信息;
[0114]3)來自第三方設(shè)備的轉(zhuǎn)發(fā)至移動終端的待發(fā)送語音信息。
[0115]其中,本領(lǐng)域技術(shù)人員應(yīng)能夠根據(jù)實際情況和需求來確定所述語音識別的方式。優(yōu)選地,所述語音識別的方式包括但不限于:
[0116]I)基于DTW(Dynamic Time Warping)和模擬匹配技術(shù)的語音識別方式;其中,DTW和模板匹配技術(shù)直接利用提取的語音特征作為模板,能用于實現(xiàn)孤立詞語音識別中。
[0117]2)基于隱含馬爾科夫模型HMM(Hidden Markov Model)的識別語音識別方式;其中,該語音識別方式通過對大量語音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計,建立識別統(tǒng)計模型,然后從待識別語音中提取特征,與該等模型匹配,通過比較匹配分析以獲得識別結(jié)果。
[0118]3)人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Networks)的語音識別方式;該語音識別方式是在模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,以形成分布式并行信息處理的算法數(shù)學(xué)模型的基礎(chǔ)上的語音識別方式。
[0119]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何語音識別的實現(xiàn)方式,均能夠包含在本發(fā)明的范圍內(nèi)。
[0120]具體地,在步驟SI中,移動終端獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息的方式包括但不限于:
[0121]I)在步驟SI中,移動終端獲取移動終端對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;
[0122]在一示例中,首先,使用移動終端的用戶通過與該移動終端的語音交互方式,如通過麥克風(fēng),向該移動終端輸入待識別語音信息;移動終端接收該待識別語音信息,接著,在步驟SI中,移動終端對該待識別語音信息進(jìn)行語音識別處理,例如,從該待識別語音中提取語音特征,與基于HMM識別算法生成的語音模型進(jìn)行匹配,通過比較匹配分析以獲得文本識別結(jié)果信息。
[0123]2)在步驟SI中,移動終端獲取網(wǎng)絡(luò)設(shè)備對移動終端提供給其的待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息;
[0124]其中,所述網(wǎng)絡(luò)設(shè)備包括一種能夠按照事先設(shè)定或存儲的指令,自動進(jìn)行數(shù)值計算和信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。所述網(wǎng)絡(luò)設(shè)備包括但不限于計算機(jī)、網(wǎng)絡(luò)主機(jī)、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或多個服務(wù)器構(gòu)成的云。在此,云由基于云計算(Cloud Computing)的大量計算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機(jī)集組成的一個超級虛擬計算機(jī)。
[0125]其中,所述移動終端與所述網(wǎng)絡(luò)設(shè)備之間可通過任何通信方式實現(xiàn)通信,包括但不限于,基于3GPP、LTE、WIMAX的移動通信、基于TCP/IP、UDP協(xié)議的計算機(jī)網(wǎng)絡(luò)通信以及基于藍(lán)牙、紅外傳輸標(biāo)準(zhǔn)的近距無線傳輸方式。所述移動終端與所述網(wǎng)絡(luò)設(shè)備之間連接的網(wǎng)絡(luò)包括但不限于:互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。
[0126]在一示例中,在步驟SI中,移動終端將存儲于移動終端的本地語音庫中的一條待發(fā)送語音信息發(fā)送至網(wǎng)絡(luò)設(shè)備;網(wǎng)絡(luò)設(shè)備對該語音信息進(jìn)行語音識別處理,以獲得文本識別結(jié)果信息;隨后網(wǎng)絡(luò)設(shè)備將該網(wǎng)絡(luò)文本識別結(jié)果信息發(fā)送至該移動終端,該移動終端接收該網(wǎng)絡(luò)設(shè)備返回的該文本識別結(jié)果信息。
[0127]3)優(yōu)選地,在步驟SI中,移動終端將從移動終端本地獲取的文本識別結(jié)果信息與從網(wǎng)絡(luò)設(shè)備獲得文本識別結(jié)果相結(jié)合,以獲得結(jié)合后的文本識別結(jié)果;其中,步驟Si包括步驟Sll (圖未示)和步驟S12(圖未示);在步驟Sll中,移動終端獲取所述移動終端對所述待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,以及,網(wǎng)絡(luò)設(shè)備對所述移動終端提供給其的所述待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息;接著,在步驟S12中,移動終端根據(jù)所述本地文本識別結(jié)果信息與所述網(wǎng)絡(luò)文本識別結(jié)果信息,獲得所述文本識別結(jié)果信息。
[0128]具體地,在步驟Sll中,移動終端獲取移動終端對待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,以及,網(wǎng)絡(luò)設(shè)備對該移動終端提供給其的該待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息;接著,在步驟S12中,移動終端對該本地文本識別結(jié)果信息及該網(wǎng)絡(luò)文本識別結(jié)果信息,通過自然語言分析規(guī)則分別進(jìn)行分析識別,例如通過句子切分、部分詞性標(biāo)注、名稱抽取、組塊、解析等自然語言分析規(guī)則,對本地及網(wǎng)絡(luò)文本識別結(jié)果信息分別進(jìn)行解析,以確定本地及網(wǎng)絡(luò)文本識別結(jié)果信息中語義正確的文本信息,以作為文本識別結(jié)果信息。其中,所述自然語言分析規(guī)則意指通過該自然語言分析規(guī)則實現(xiàn)人機(jī)之間自然語言的通信,即實現(xiàn)計算機(jī)對自然語言的理解,其可通過OpenNLP、FudanNLP、Standford NLP、語言技術(shù)平臺(LTP)等自然語言處理工具來實現(xiàn)。[0129]例如,在步驟Sll中,移動終端獲取移動終端對待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,該本地文本識別結(jié)果信息為“今天晚上6點蛋,咱們東單地鐵站口見,別忘了拿上文件”,以及,網(wǎng)絡(luò)設(shè)備對該移動終端提供給其的該待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息,該網(wǎng)絡(luò)文本識別結(jié)果為“今天晚上6點半,咱們東單地鐵站B 口見,別忘了拿”;接著,在步驟S12中,移動終端首先確定本地文本識別結(jié)果信息及網(wǎng)絡(luò)文本識別結(jié)果信息中的交集為“今天晚上6點X,咱們東單地鐵站X 口見,別忘了拿XXX”,并通過句子切分、部分詞性標(biāo)注、名稱抽取、組塊、解析等自然語言分析規(guī)則,分別對該本地文本識別結(jié)果信息及該網(wǎng)絡(luò)文本識別結(jié)果信息進(jìn)行分析識別,以確定該兩個文本識別結(jié)果不相交部分的語音正確的文本內(nèi)容為“點”、“B”和“上文件”,隨后獲取合并后的文本識別結(jié)果為“今天晚上6點半,咱們東單地鐵站B 口見,別忘了拿上文件”。
[0130]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0131]通過從移動終端本地和網(wǎng)絡(luò)分別獲取文本識別結(jié)果,實現(xiàn)了在本地語音識別能力較弱的情況下,網(wǎng)絡(luò)設(shè)備可向該移動終端提供較高語音識別能力的技術(shù)支持,以確保獲得的文本識別結(jié)果的準(zhǔn)確性和可靠性,進(jìn)一步為能夠獲得較為精確的描述語音信息中語音內(nèi)容的文本描述信息提供有力保證。
[0132]接著,在步驟S2中,移動終端根據(jù)其在步驟SI中獲取的文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息。
[0133]其中,在步驟S2中,移動終端根據(jù)文本識別結(jié)果信息生成用于描述語音信息的語音內(nèi)容的文本描述信息的方式包括但不限于:
[0134]I)在步驟S2中,移動終端根據(jù)文本識別結(jié)果信息中的前第一預(yù)定字符數(shù)或前第二預(yù)定完整語句數(shù),生成文本描述信息;
[0135]例如,語音信息識別出的文本識別結(jié)果信息為“我很想去看碟中諜4,不知道哪里還在上映,咱們找找吧”,在步驟S2中,移動終端提取該文本識別結(jié)果信息中第I個完整語句“我很想去看碟中諜4”,以作為用于描述該語音信息的語音內(nèi)容的文本描述信息。
[0136]可選地,當(dāng)文本識別結(jié)果信息中包括的字符數(shù)小于或等于第三預(yù)定字符數(shù),或文本識別結(jié)果信息中包括的完整語句數(shù)小于或等于第四預(yù)定語句數(shù)時,則在步驟S2中,移動終端將該文本識別結(jié)果信息整體作為用于描述語音信息的語音內(nèi)容的文本描述信息;
[0137]例如,語音信息識別出的文本識別結(jié)果信息為“你幾點下班”,即其中僅包括I個完整語句數(shù),即小于第四預(yù)定語句數(shù)2,則在步驟S2中,移動終端將該文本識別結(jié)果信息整體“你幾點下班”作為用于描述語音信息的語音內(nèi)容的文本描述信息。
[0138]2)該方法還包括步驟S6(圖未示),在步驟S6中,移動終端從其在步驟SI中獲取的文本識別結(jié)果信息中提取至少一個主體關(guān)鍵詞;步驟S2包括步驟S24(圖未示),在步驟S24中,移動終端其根據(jù)所述至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成文本描述信肩、O
[0139]具體地,在步驟S6中,移動終端從其在步驟SI中獲取的文本識別結(jié)果信息中提取每一語句的主語、謂語和賓語,優(yōu)選地,還可包括諸如定語、狀語等,或者,在步驟S6中,移動終端從其在步驟SI中獲取的文本識別結(jié)果信息中獲取實詞,以作為該文本識別結(jié)果信息的主體關(guān)鍵詞;接著,在步驟S24中,移動終端根據(jù)該至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成文本描述信息。優(yōu)選地,當(dāng)文本識別結(jié)果信息僅包括一個詞語時,在步驟S6中,移動終端將該詞語作為主體關(guān)鍵詞。
[0140]優(yōu)選地,在步驟S24中,移動終端根據(jù)至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成文本描述信息的方式包括但不限于:
[0141]a將至少一個主體關(guān)鍵詞中的前第六預(yù)定字符數(shù)的主體關(guān)鍵詞相結(jié)合,以生成文本描述信息;
[0142]b將至少一個主體關(guān)鍵詞中的全部關(guān)鍵詞相結(jié)合,以生成文本描述信息。
[0143]在一示例中,語音信息已識別出的文本識別結(jié)果信息為“今天可能下雨,出門時你拿上門后面的雨傘”,在步驟S6中,移動終端通過句子切分、部分詞性標(biāo)注、名稱抽取、解析等自然語言分析規(guī)則,從該文本識別結(jié)果中提取第一句的主語“今天”及謂語“下雨”,提取第二句的主語“你”、謂語“拿上”及賓語“雨傘”;在步驟S24中,移動終端根據(jù)該等全部主體關(guān)鍵詞,將第一句的主語和謂語進(jìn)行合并,以生成“今天下雨”,將第二句的主語、謂語和賓語進(jìn)行合并,以生成“你拿上雨傘”,即生成文本描述信息“今天下雨,你拿上雨傘”。
[0144]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息的實現(xiàn)方式,例如,將能夠文本識別結(jié)果信息與預(yù)定關(guān)鍵詞庫中的關(guān)鍵詞進(jìn)行匹配查詢,并將文本識別結(jié)果信息中能夠匹配出的關(guān)鍵詞作為從其中提取出的關(guān)鍵詞等,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0145]以文本描述信息作為描述語音信息的語音內(nèi)容,能夠保證作為接受一方的用戶僅通過瀏覽該文本描述信息,即可直觀且準(zhǔn)確的獲取語音信息中的主要內(nèi)容,當(dāng)在語音信息的語音內(nèi)容較多,需要花費(fèi)較多時間收聽語音的情況下,還能提高該用戶的信息獲取效率。
[0146]隨后,在步驟S3中,移動終端將其在步驟S2中獲取的文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0147]優(yōu)選地,所述文本描述信息與所述語音信息相關(guān)聯(lián)地方式包括但不限于以下至少一種:
[0148]I)將文本描述信息作為語音信息的標(biāo)題信息;
[0149]2)將文本描述信息作為語音信息的摘要信息;
[0150]3)將文本描述信息作為語音信息的屬性信息,例如,將文本描述信息加入語音文件的屬性描述中。
[0151]其中,在步驟S3中,移動終端將文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方式包括但不限于以下情形:
[0152]I)將文本描述信息作為語音信息的標(biāo)題信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;
[0153]例如,在步驟S3中,移動終端將該標(biāo)題信息作為語音信息的文件名,將具有該文件名的語音信息進(jìn)行發(fā)送;當(dāng)作為接受一方的用戶接收到該語音信息時,可直接通過瀏覽該語首/[目息的文件名獲得該語首/[目息的語首內(nèi)容。
[0154]2)將文本描述信息作為語音信息的摘要信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;
[0155]例如,在步驟S3中,移動終端將語音信息作為摘要信息中的語音信息附件,將具有該語音信息附件的摘要信息進(jìn)行發(fā)送;當(dāng)作為接受一方的用戶接收到該摘要信息時,可直接通過該摘要信息的文本內(nèi)容獲得該語音信息的語音內(nèi)容。
[0156]又例如,在步驟S3中,移動終端將摘要信息以隱藏方式,如將摘要信息隱藏為一個能夠被點擊的圖形對象,與語音信息相關(guān)聯(lián)的進(jìn)行發(fā)送,當(dāng)作為接受一方的用戶接收到該語音信息,并對該圖形對象進(jìn)行點擊、懸浮等操作時,所隱藏的摘要信息被呈現(xiàn)。
[0157]3)將文本描述信息作為語音信息的屬性信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;
[0158]例如,在步驟S3中,移動終端將文本描述信息作為語音信息的屬性信息中的屬性標(biāo)題、屬性主題內(nèi)容等,與語音信息相關(guān)聯(lián)的進(jìn)行發(fā)送,當(dāng)作為接受一方的用戶接收到該語音信息時,點擊查看該語音信息的屬性信息,可獲得該文本描述信息。
[0159]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0160]由于移動終端能夠?qū)⒄Z音信息及其文本描述信息相結(jié)合的進(jìn)行發(fā)送,使得作為接受一方的用戶能夠?qū)⒄Z音信息與包括其主要內(nèi)容的文本描述信息相結(jié)合的進(jìn)行信息的獲取,使得用戶在無需收聽語音信息的情況下也能夠了解語音信息的內(nèi)容,并實現(xiàn)了用戶通過聽覺與視覺相結(jié)合的方式直觀地獲取語音信息中的語音內(nèi)容,提高用戶信息獲取體驗;同時,通過將文本描述信息以多種形式與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送,實現(xiàn)了多元化的語音信息與文本信息相結(jié)合的發(fā)送方式,提高用戶使用體驗;進(jìn)一步,作為接收一方的用戶也可首先對文本描述信息進(jìn)行瀏覽,以判斷其是否希望收聽語音信息,可實現(xiàn)用戶對垃圾語音信息的預(yù)判,避免收聽語音垃圾信息。
[0161]作為本實施例的優(yōu)選方案之一(參照圖4),該方法還包括步驟S7 (圖未示),在步驟S7中,移動終端獲取所述移動終端的發(fā)送設(shè)置信息;在步驟S3中,移動終端將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的步驟包括:根據(jù)所述發(fā)送設(shè)置信息,將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0162]具體地,在步驟S7中,移動終端獲取移動終端的發(fā)送設(shè)置信息的方式包括但不限于:
[0163]I)從移動終端中用于信息發(fā)送的應(yīng)用的配置信息庫中讀取預(yù)置的發(fā)送設(shè)置信息,例如,發(fā)送設(shè)置信息包括將文本識別結(jié)果信息作為標(biāo)題信息進(jìn)行發(fā)送;
[0164]2)通過與使用移動終端的用戶進(jìn)行交互,實時地獲取用戶設(shè)置的移動終端的發(fā)送設(shè)置信息。
[0165]接著,當(dāng)在步驟S3中,移動終端需要將文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送時,其根據(jù)其在步驟S7中獲取的發(fā)送設(shè)置信息,將文本描述信息與語音信息以發(fā)送設(shè)置信息中示出的相關(guān)聯(lián)發(fā)送方式,進(jìn)行發(fā)送。
[0166]在一示例中,首先,在步驟S7中,移動終端讀取移動終端中信息發(fā)送應(yīng)用的配置信息庫,獲得發(fā)送設(shè)置信息為將文本描述信息作為語音信息的摘要信息,與語音信息相關(guān)聯(lián)的進(jìn)行發(fā)送;隨后,在步驟S3中,移動終端根據(jù)該發(fā)送設(shè)置信息,將語音信息作為摘要信息中的語音信息附件,將具有該語音信息附件的摘要信息進(jìn)行發(fā)送。
[0167]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根獲取所述移動終端的發(fā)送設(shè)置信息,將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。[0168]通過根據(jù)發(fā)送設(shè)置信息將文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送,實現(xiàn)了可配置的關(guān)聯(lián)發(fā)送方式,用戶可預(yù)置或?qū)崟r地選擇其所期望的發(fā)送方式,提高信息發(fā)送方式的可控性,進(jìn)而提高用戶使用體驗。
[0169]圖5示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法流程圖。本實施例中的方法包括步驟S1、步驟S2、步驟S31、步驟S4和步驟S5。
[0170]其中,步驟SI和步驟S2已在參照圖3所示實施例中予以詳述,在此不再贅述。
[0171]在步驟S4中,移動終端提取所述文本識別結(jié)果信息中的地理位置信息。具體地,在步驟S4中,移動終端可采用多種方式提取文本識別結(jié)果信息中的地理位置信息,例如,其可采用的方式包括但不限于:
[0172]I)在步驟S4中,移動終端通過預(yù)定的用于識別地理位置信息的正則表達(dá)式,在文本識別結(jié)果信息中進(jìn)行匹配識別,以確定該文本識別結(jié)果信息中與該正則表達(dá)式相匹配的地理位置信息;
[0173]例如,以C Sharp語言為例,通過預(yù)定的表示地理位置信息“XX市XX區(qū)”的正則表達(dá)式:
[0174]" ( ?〈C〉.* ?)市(?〈d>.* ?)區(qū).*",
[0175]在文本識別結(jié)果信息中進(jìn)行匹配,以確定與該正則表達(dá)式相匹配的地理位置信息為“北京市海淀區(qū)”;其中,所述C Sharp語音為一種對象導(dǎo)向(object-oriented)程序語言。
[0176]2)在步驟S4中,移動終端根據(jù)預(yù)定的地理信息字符串,在文本識別結(jié)果信息中進(jìn)行匹配識別,以確定該文本識別結(jié)果信息中與該預(yù)定地理信息字符串相匹配的地理位置信息;
[0177]例如,預(yù)定的地理信息字符串分別為“北京市海淀區(qū)”、“北京市朝陽區(qū)”、“北京市東城區(qū)”,將該三個地理信息字符串分別在文本識別結(jié)果信息進(jìn)行匹配識別,確定“北京市東城區(qū)”與該文本識別結(jié)果中包括的文本序列相匹配,則提取該地理信息字符串對應(yīng)的該文本序列,以作為地理位置信息。
[0178]接著,在步驟S5中,移動終端根據(jù)所述地理位置信息,獲得所述地理位置信息所屬地理區(qū)域的地圖信息。具體地,在步驟S5中,移動終端可采用多種方式獲得地理位置信息所屬地理區(qū)域的地圖信息,例如,其可采用的方式包括但不限于:
[0179]I)在步驟S5中,移動終端通過調(diào)用移動終端本地的地圖應(yīng)用接口(API),將地理位置信息作為輸入?yún)?shù),在地圖應(yīng)用中進(jìn)行位置查詢,以生成該地理位置信息所屬地理區(qū)域的地圖信息,如生成地圖圖片;
[0180]2)在步驟S5中,移動終端根據(jù)地理位置信息,在移動終端本地或網(wǎng)絡(luò)設(shè)備的地圖信息庫中進(jìn)行匹配查詢,以獲取預(yù)存的與該地理位置相對應(yīng)的地圖信息。
[0181]隨后, 在步驟S31中,移動終端將地圖信息和文本描述信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送;如將地圖信息和文本描述信息作為語音信息的圖文摘要信息、又如將文本描述信息作為語音信息與地圖信息的標(biāo)題信息、又如將地圖信息和文本描述信息作為語音信息的屬性信息,與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0182]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何提取所述文本識別結(jié)果信息中的地理位置信息,根據(jù)所述地理位置信息,獲得所述地理位置信息所屬地理區(qū)域的地圖信息,接著將所述地圖信息和所述文本識別結(jié)果信息,與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0183]當(dāng)語音信息中包括地理位置信息時,通過將該地理位置信息所屬地理區(qū)域的對應(yīng)的地圖信息與文本識別結(jié)果信息相關(guān)聯(lián)的發(fā)送,使得接收一方的用戶無需自行查找,即能直接可視化地獲取地理位置信息所屬地理區(qū)域的準(zhǔn)確位置,提高用戶瀏覽體驗。
[0184]圖6示出根據(jù)本發(fā)明另一個優(yōu)選實施例的用于生成用于描述所述語音信息的語音內(nèi)容的方法流程圖。本實施例的方法中步驟S2包括步驟S21、步驟S22和步驟S23。
[0185]其中,在步驟S21中,移動終端根據(jù)文本識別結(jié)果信息,生成用于描述語音信息的語音內(nèi)容的初始文本描述信息。其方式與參照圖4所示移動終端在步驟S2中根據(jù)文本識別結(jié)果信息,生成用于描述語音信息的語音內(nèi)容的文本描述信息的方式相同或相似,在此不再贅述。
[0186]在步驟S22中,移動終端將所述初始文本描述信息呈現(xiàn)給使用所述移動終端的用戶。
[0187]例如,在步驟S22中,移動終端將其在步驟S21中生成的初始文本描述信息,通過頁面技術(shù),如JSP、ASP、PHP,按一定順序和格式在移動終端顯示屏幕中呈現(xiàn)給用戶,供使用該移動終端的用戶進(jìn)行瀏覽。
[0188]接著,在步驟S23中,移動終端根據(jù)所述用戶對所述文本描述信息的調(diào)整操作,獲取調(diào)整后的文本描述信息。
[0189]例如,在步驟S23中,移動終端通過與該用戶的交互操作,獲取該用戶對該文本描述信息的調(diào)整操作,如刪除、添加、語序調(diào)整等;隨后根據(jù)該(等)調(diào)整操作,對該文本描述信息進(jìn)行相應(yīng)調(diào)整,以獲取調(diào)整后的文本描述信息。
[0190]需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的初始文本描述信息,接著將所述初始文本描述信息呈現(xiàn)給使用所述移動終端的用戶,隨后根據(jù)所述用戶對所述文本描述信息的調(diào)整操作,獲取調(diào)整后的文本描述信息的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
[0191]通過獲取用戶對初始文本描述信息進(jìn)行調(diào)整操作以獲取調(diào)整后的文本描述信息,從而使得在初始文本描述信息不準(zhǔn)確的情況下,用戶對初始文本描述信息執(zhí)行調(diào)整編輯操作成為可能,提高文本描述信息的內(nèi)容準(zhǔn)確性,從而保證將更為準(zhǔn)確的調(diào)整后的文本描述信息與語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
[0192]需要注意的是,本發(fā)明可在軟件和/或軟件與硬件的組合體中被實施,例如,其中的硬件可采用專用集成電路(ASIC)或任何其他類似硬件設(shè)備來實現(xiàn)。在一個實施例中,本發(fā)明的軟件程序可以通過處理器執(zhí)行以實現(xiàn)上文所述步驟或功能。同樣地,本發(fā)明的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲到計算機(jī)可讀記錄介質(zhì)中,例如,RAM存儲器,磁或光驅(qū)動器或軟磁盤及類似設(shè)備。另外,本發(fā)明的一些步驟或功能可采用硬件來實現(xiàn),例如,作為與處理器配合從而執(zhí)行各個步驟或功能的電路。
[0193]對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此夕卜,顯然“包括”一詞不排除其他步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多個裝置也可以由一個裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
【權(quán)利要求】
1.一種在移動終端中用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的方法,該方法包括以下步驟: a獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果信息; b根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息; c將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
2.根據(jù)權(quán)利要求1所述的方法,其中,該方法還包括: -從所述文本識別結(jié)果信息中提取至少一個主體關(guān)鍵詞; 其中,所述步驟b包括: -根據(jù)所述至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成所述文本描述信息。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述文本描述信息與所述語音信息相關(guān)聯(lián)地方式包括但不限于以下至少一種: -將所述文本描述信息作為所述語音信息的標(biāo)題信息; -將所述文本描述信息作為所述語音信息的摘要信息; -將所述文本描述信息作為所述語音信息的屬性信息。
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中,該方法還包括: -提取所述文本識別結(jié)果信息中的地理位置信息; -根據(jù)所述地理位置信息,獲得所述地理位置信息所屬地理區(qū)域的地圖信息; 其中,所述步驟c包括: -將所述地圖信息和所述文本描述信息,與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
5.根據(jù)權(quán)利要求1至4中任一項所述的方法,其中,該方法還包括: -獲取所述移動終端的發(fā)送設(shè)置信息; 其中,所述將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的步驟包括: -根據(jù)所述發(fā)送設(shè)置信息,將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
6.根據(jù)權(quán)利要求1至5中任一項所述的方法,其中,所述步驟b包括: -根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的初始文本描述信息; -將所述初始文本描述信息呈現(xiàn)給使用所述移動終端的用戶; -根據(jù)所述用戶對所述文本描述信息的調(diào)整操作,獲取調(diào)整后的文本描述信息。
7.根據(jù)權(quán)利要求1至6中任一項所述的方法,其中,所述步驟a包括以下步驟: -獲取所述移動終端對所述待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,以及,網(wǎng)絡(luò)設(shè)備對所述移動終端提供給其的所述待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息; -根據(jù)所述本地文本識別結(jié)果信息與所述網(wǎng)絡(luò)文本識別結(jié)果信息,獲得所述文本識別結(jié)果息。
8.一種用于將語音信息與其文本描述信息相關(guān)聯(lián)地進(jìn)行發(fā)送的發(fā)送裝置,該發(fā)送裝置包括: 識別結(jié)果獲取裝置,用于獲取對待識別語音信息進(jìn)行語音識別處理所得的文本識別結(jié)果/[目息;描述信息生成裝置,用于根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的文本描述信息; 關(guān)聯(lián)發(fā)送裝置,用于將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
9.根據(jù)權(quán)利要求8所述的發(fā)送裝置,其中,該發(fā)送裝置還包括: 關(guān)鍵詞提取裝置,用于從所述文本識別結(jié)果信息中提取至少一個主體關(guān)鍵詞; 其中,所述描述信息生成裝置包括: 子生成裝置,用于根據(jù)所述至少一個主體關(guān)鍵詞中的部分或全部關(guān)鍵詞,生成所述文本描述信息。
10.根據(jù)權(quán)利要求8或9所述的發(fā)送裝置,其中,所述文本描述信息與所述語音信息相關(guān)聯(lián)地方式包括但不限于以下至少一種: -將所述文本描述信息作為所述語音信息的標(biāo)題信息; -將所述文本描述信息作為所述語音信息的摘要信息; -將所述文本描述信息作為所述語音信息的屬性信息。
11.根據(jù)權(quán)利要求8至10中任一項所述的發(fā)送裝置,其中,該發(fā)送裝置還包括: 位置信息提取裝置,用于提 取所述文本識別結(jié)果信息中的地理位置信息; 地圖信息獲取裝置,用于根據(jù)所述地理位置信息,獲得所述地理位置信息所屬地理區(qū)域的地圖信息; 其中,所述關(guān)聯(lián)發(fā)送裝置包括: 子關(guān)聯(lián)發(fā)送裝置,用于將所述地圖信息和所述文本描述信息,與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
12.根據(jù)權(quán)利要求8至11中任一項所述的發(fā)送裝置,其中,該發(fā)送裝置還包括: 設(shè)置信息獲取裝置,用于獲取所述移動終端的發(fā)送設(shè)置信息; 其中,所述關(guān)聯(lián)發(fā)送裝置將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送的操作包括: 根據(jù)所述發(fā)送設(shè)置信息,將所述文本描述信息與所述語音信息相關(guān)聯(lián)地進(jìn)行發(fā)送。
13.根據(jù)權(quán)利要求8至12中任一項所述的發(fā)送裝置,其中,所述描述信息生成裝置包括: 初始文本生成裝置,用于根據(jù)所述文本識別結(jié)果信息,生成用于描述所述語音信息的語音內(nèi)容的初始文本描述信息; 呈現(xiàn)裝置,用于將所述初始文本描述信息呈現(xiàn)給使用所述移動終端的用戶; 描述信息獲取裝置,用于根據(jù)所述用戶對所述文本描述信息的調(diào)整操作,獲取調(diào)整后的文本描述信息。
14.根據(jù)權(quán)利要求8至13中任一項所述的發(fā)送裝置,其中,所述識別結(jié)果獲取裝置包括: 第一結(jié)果獲取裝置,用于獲取所述移動終端對所述待識別語音信息進(jìn)行語音識別處理所得的本地文本識別結(jié)果信息,以及,網(wǎng)絡(luò)設(shè)備對所述移動終端提供給其的所述待識別語音信息進(jìn)行語音識別處理所得的網(wǎng)絡(luò)文本識別結(jié)果信息; 第二結(jié)果獲取裝置,用于根據(jù)所述本地文本識別結(jié)果信息與所述網(wǎng)絡(luò)文本識別結(jié)果信息,獲得所述文本識別結(jié)果信息。
15.一種移動終端,包括·如權(quán)利要求8至14中至少一項所述的發(fā)送裝置。
【文檔編號】G06F17/30GK103546623SQ201210242430
【公開日】2014年1月29日 申請日期:2012年7月12日 優(yōu)先權(quán)日:2012年7月12日
【發(fā)明者】陳瑩 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司