一種基于語音識別的即時通信方法和即時通信系統(tǒng)與流程

文檔序號：11628127閱讀：236來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本申請涉及即時通信技術(shù)領(lǐng)域，尤其涉及一種基于語音識別的即時通信方法和即時通信系統(tǒng)。

背景技術(shù)：

通過手機或平板電腦的社交app對講聊天是很多軟件常用的便利功能，例如騰訊的微信、阿里的釘釘、支付寶、淘寶等都具備這樣的功能。目前這類功能主要的實現(xiàn)方式是發(fā)送終端通過語音方式錄制自己的留言，接受方點按收到的信息，通過聽筒或外放收聽。

這類功能在方便發(fā)送終端的同時，對接收終端實際帶來了一定障礙。主要缺點在于：接收終端無法像文字信息一樣一目了然的看到信息內(nèi)容，需要點按再將手機或平板拿到耳邊用聽筒收聽，或是用手機或平板的揚聲器外放，這在很多場合(例如會議中、或旁邊有其他人)，這是非常不便的，也可能存在隱私泄露的問題。

技術(shù)實現(xiàn)要素：

鑒于上述問題，提出了本申請實施例以便提供一種克服上述問題或者至少部分地解決上述問題的基于語音識別的即時通信方法和即時通信系統(tǒng)。

為解決上述問題，本申請公開一種基于語音識別的即時通信方法，包括：

接收發(fā)送終端發(fā)送的語音信息；

將該語音信息進行語音識別，生成文字信息；

將該語音信息發(fā)送至接收終端；以及

將該文字信息發(fā)送至接收終端。

本申請另一實施例提出一種基于語音識別的即時通信方法，包括：

錄制語音信息并發(fā)送至服務(wù)器；

接收經(jīng)過識別該語音信息生成的文字信息，并顯示該文字信息；

在接收到糾正操作指令后，進入編輯文字信息的界面；

顯示編輯后文字信息，并將編輯后文字信息發(fā)送至服務(wù)器。

本申請再一實施例提出一種基于語音識別的即時通信方法，包括：

接收服務(wù)器發(fā)送的語音信息；

接收服務(wù)器發(fā)送的識別該語音信息后生成的文字信息；

顯示并標(biāo)記該文字信息。

本申請一實施例提出一種基于語音識別的即時通信系統(tǒng)，其特征在于，包括：

語音信息接收模塊，用于接收發(fā)送終端發(fā)送的語音信息；

文字信息生成模塊，用于將該語音信息進行語音識別，生成文字信息；

第一發(fā)送模塊，用于將該語音信息發(fā)送至接收終端；以及

第二發(fā)送模塊，用于將該文字信息發(fā)送至接收終端。

本申請另一實施例提出一種基于語音識別的即時通信系統(tǒng)，包括：

語音信息錄制發(fā)送模塊，用于錄制語音信息并發(fā)送至服務(wù)器；

文字信息接收顯示模塊，用于接收經(jīng)過識別該語音信息生成的文字信息，并顯示該文字信息；

編輯模塊，用于在接收到糾正操作指令后，進入編輯文字信息的界面；

顯示發(fā)送模塊，用于顯示編輯后文字信息，并將編輯后文字信息發(fā)送至服務(wù)器。

本申請再一實施例提出一種基于語音識別的即時通信系統(tǒng)，包括：

語音信息獲取模塊，用于接收服務(wù)器發(fā)送的語音信息；

文字信息獲取模塊，用于接收服務(wù)器發(fā)送的識別該語音信息后生成的文字信息；

文字信息顯示標(biāo)記模塊，用于顯示并標(biāo)記該文字信息。

本申請實施例至少具有以下優(yōu)點：

本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，通過語音識別功能，將語音信息和文字信息均發(fā)送至接收終端，克服了接收終端獲得信息的障礙，方便了使用者的使用，避免了隱私泄露的問題。

附圖說明

圖1是本申請第一實施例的基于語音識別的即時通信方法的流程圖。

圖2是本申請第二實施例的基于語音識別的即時通信方法的流程圖。

圖3是本申請第三實施例的基于語音識別的即時通信方法的流程圖。

圖4是本申請第四實施例的基于語音識別的即時通信方法的流程圖。

圖5是對應(yīng)于本申請第一實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)的方框圖。

圖6是對應(yīng)于本申請第二實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)的方框圖。

圖7是對應(yīng)于本申請第三實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)的方框圖。

圖8是對應(yīng)于本申請第四實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)的方框圖。

具體實施方式

下面將結(jié)合本申請實施例中的附圖，對本申請實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本申請一部分實施例，而不是全部的實施例?；诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員所獲得的所有其他實施例，都屬于本申請保護的范圍。

本申請的核心思想之一在于，提出一種即時通信方法和即時通信系統(tǒng)，使用語音識別將語音信息進行識別，并通過服務(wù)器將文字信息直接顯示在發(fā)送終端和接收終端的屏幕上，方便了接收終端接收信息，克服了某些場合下接收終端收到語音信息后無法收聽的障礙，避免了使用者隱私泄露的問題。

第一實施例

本申請第一實施例提出一種基于語音識別的即時通信方法，如圖1所示為本申請第一實施例的基于語音識別的即時通信方法的流程圖。本申請第一實施例中的即時通信方法應(yīng)用于服務(wù)器，包括如下步驟：

s101，接收發(fā)送終端發(fā)送的語音信息；

在這一步驟中，發(fā)送終端可以在即時通信界面(例如聊天界面)錄制語音信息，錄音完成之后松開該標(biāo)記或按鈕，則錄制完成。之后，發(fā)送終端將語音信息通過網(wǎng)絡(luò)發(fā)送至服務(wù)器。

s102，將該語音信息識別為文字信息；

在這一步驟中，服務(wù)器接受到該方發(fā)送的語音信息之后，通過語音識別技術(shù)，將該語音信息識別為文字信息。語音識別技術(shù)是本領(lǐng)域常用的技術(shù)，在此并不贅述。

s103，將該語音信息發(fā)送至接收終端；

在這一步驟中，服務(wù)器將步驟s101中接收到的語音信息發(fā)送至接收終端。

值得注意的是，步驟s103可以與步驟s102同時執(zhí)行或先后執(zhí)行，當(dāng)先后執(zhí)行時，步驟s102和步驟s103的步驟順序并不特別限定。

s104，將識別后生成的該文字信息發(fā)送至接收終端；

在這一步驟中，服務(wù)器將經(jīng)過語音識別處理后生成的文字信息發(fā)送給接收終端。優(yōu)選地，在這一步驟中，服務(wù)器在發(fā)送文字信息的同時發(fā)送指定標(biāo)記，用于區(qū)別由語音信息轉(zhuǎn)成的文字信息和發(fā)送方直接以文字方式輸入的文字信息。

值得注意的是，當(dāng)步驟s103在步驟s102之后執(zhí)行時，步驟s104可以與步驟s103同時執(zhí)行，或者步驟s104可以先于或后于步驟s103執(zhí)行，本申請并不特別限定。

在一實施例中，可以先執(zhí)行步驟s103，將步驟s101中收到的語音信息發(fā)送至接收終端，再執(zhí)行步驟s102，將語音信息經(jīng)過語音識別生成文字信息，之后執(zhí)行步驟s104，將識別后生成的文字信息發(fā)送至接收終端；在另一實施例中，可以先執(zhí)行步驟s102，將步驟s101中收到的語音信息進行語音識別生成文字信息，再同時或先后執(zhí)行步驟s103和步驟s104，將語音信息和識別后生成的文字信息發(fā)送至接收終端。

綜上所述，本申請第一實施例提出一種基于語音識別的即時通信方法，將語音信息通過識別生成文字信息，通過服務(wù)器將語音信息和文字信息均發(fā)送至接收終端。該實施例提供的即時通信方法方便了接收終端接收信息，克服了某些場合下接收終端收到語音信息后無法收聽的障礙，避免了使用者隱私泄露的問題。

第二實施例

本申請第二實施例提出一種基于語音識別的即時通信方法，如圖2所示為本申請第二實施例的基于語音識別的即時通信方法的流程圖。本申請第一實施例中的即時通信方法應(yīng)用于服務(wù)器，包括如下步驟：

s201，接收發(fā)送終端發(fā)送的語音信息；

s202，將該語音信息識別為文字信息；

s203，將該語音信息發(fā)送至接收終端；

s204，將識別后生成的該文字信息發(fā)送至接收終端；

上述步驟s201至s204與第一實施例中的步驟s101至步驟s104相同或相似，在此并不贅述。

在一優(yōu)選實施例中，在步驟s202之后，該方法還可以包括

s205，將識別后生成的該文字信息發(fā)送至發(fā)送終端；

在這一步驟中，服務(wù)器將在步驟s202中生成的文字信息發(fā)送至發(fā)送終端。

其中，步驟s205、步驟s204和步驟s203的執(zhí)行順序并不限制，三者可以同時執(zhí)行，或者以任意順序先后執(zhí)行，本申請并不特別限制。

另外，在步驟s202之后，所述方法還可以包括：

s206，將識別后生成的該文字信息儲存于數(shù)據(jù)庫；

在這一步驟中，服務(wù)器將識別后生成的文字信息發(fā)送至與服務(wù)器連接的數(shù)據(jù)庫中備用。這一步驟s206可以與步驟s203至s205中的任一者同時或以任意順序先后執(zhí)行，本申請并不特別限制。

在步驟s202之后，所述方法還可以包括：

s207，將輔助錯誤糾正信息發(fā)送至發(fā)送終端；

這一步驟可以與步驟s203至s205中的任一者同時或以任意順序先后執(zhí)行，本申請并不特別限制。優(yōu)選地，步驟s207可以與步驟s205同時執(zhí)行，即在將識別后生成的文字信息發(fā)送至發(fā)送終端的同時，將錯誤輔助糾正信息同時發(fā)送至發(fā)送終端，供發(fā)送終端修改識別后的文字信息。

在語音識別過程中，將會產(chǎn)生詞圖(wordgraph)及識別詞多候選信息，在步驟s207中，可以根據(jù)詞圖里的信息，使用算法，推薦備選的糾錯詞給使用者點選。這些信息通過回傳發(fā)送終端，可以輔助更高效的對識別文本進行錯誤糾正。例如，當(dāng)發(fā)送終端的使用者選擇錯誤糾正、并點擊識別錯誤的某字詞時，可通過輔助糾正信息得到該字詞的其他候選字詞，并顯示在虛擬鍵盤上，使用者可通過點擊正確候選高效的進行錯誤糾正。具體地，舉例來說，使用者說：“我要買黃色的”，語音識別錯誤識別成“我要買紅色的”，當(dāng)使用者點擊“紅色”這個詞時，算法可根據(jù)詞圖信息，提示出“黃色”這個第二候選供使用者點選。用戶點擊“黃色”，即完成了替換糾錯的操作，非常簡單快捷。

之后，所述方法還可以包括：

步驟s208，接收發(fā)送終端發(fā)出的編輯后文字信息，并發(fā)送至接收終端；

在這一步驟中，當(dāng)發(fā)送終端的使用者完成糾正后，發(fā)送終端將編輯后文字信息發(fā)送至服務(wù)器，服務(wù)器接收該編輯后文字信息，并發(fā)送至接收終端。

優(yōu)選地，在步驟s208之后，本申請還可以包括：

步驟s209，將編輯后文字信息發(fā)送至數(shù)據(jù)庫。

在這一步驟中，被糾正過的自動語音識別結(jié)果價值很高、尤為重要，它提示了：1)服務(wù)器未能完全正確地識別該語音信息；2)該語音信息的正確文字信息已由用戶通過糾正給出。對這類編輯后文字信息，可以利用語音識別系統(tǒng)的訓(xùn)練算法，記錄識別錯誤的文字內(nèi)容、所對應(yīng)的語音內(nèi)容和正確的語音內(nèi)容，避免此后再犯類似錯誤。這類錯誤糾正數(shù)據(jù)對語音識別系統(tǒng)自我進化的功能是其他數(shù)據(jù)所不可比擬的。

綜上所述，本申請第二實施例提出一種基于語音識別的即時通信方法，將語音信息通過識別生成文字信息，通過服務(wù)器將語音信息和文字信息均發(fā)送至接收終端，并將文字信息發(fā)送至發(fā)送終端，在發(fā)送給發(fā)送終端之后提供輔助修改信息，利用該信息可以讓發(fā)送終端的使用者能夠高效地修改。該實施例提供的即時通信方法方便了接收終端接收信息，克服了某些場合下接收終端收到語音信息后無法收聽的障礙，避免了使用者隱私泄露的問題，同時進一步保證了接收終端接收到信息的準(zhǔn)確性。

第三實施例

本申請第三實施例提出一種基于語音識別的即時通信方法，如圖3所示為本申請第三實施例的基于語音識別的即時通信方法的流程圖。本申請第三實施例中的即時通信方法應(yīng)用于信息的發(fā)送終端，包括如下步驟：

s301，錄制語音信息并發(fā)送至服務(wù)器；

在這一步驟中，發(fā)送終端可以在即時通信界面(例如聊天界面)錄制語音信息，例如按住輸入框的指定標(biāo)記或按鈕不放，則開始錄音，錄音完成之后松開該標(biāo)記或按鈕，則錄制完成。在錄制完成之后，該即時通信界面可以默認為直接發(fā)送，或者發(fā)送終端點擊另一標(biāo)記或按鈕，將信息通過網(wǎng)絡(luò)發(fā)送至服務(wù)器。

s302，接收經(jīng)過服務(wù)器識別該語音信息后的生成文字信息，并顯示該文字信息；

在這一步驟中，服務(wù)器將發(fā)送終端發(fā)送的語音信息進行語音識別生成文字信息并回傳給發(fā)送終端，發(fā)送終端接收識別后的文字信息，并進行顯示。例如在聊天界面，發(fā)送終端在步驟s301中將錄制好的語音信息發(fā)送給服務(wù)器，在此步驟s302中，發(fā)送終端可在同一聊天界面中接收服務(wù)器回傳的識別該語音信息后生成的文字信息，并顯示于該聊天界面。

s303，在接收到糾正操作指令后，開啟錯誤糾正界面，進入編輯文字信息的界面；

在這一步驟中，當(dāng)發(fā)送終端的使用者認為語音識別后生成的文字信息的內(nèi)容與語音信息不一致，則可以通過發(fā)出糾正操作指令開啟錯誤糾正界面。例如，糾正操作指令可以為使用者長按該文字信息，發(fā)送終端即接收該指令并開啟錯誤糾正界面，進入編輯文本狀態(tài)，同時該糾正界面可以顯示虛擬鍵盤或者手寫鍵盤等輸入界面，供使用者糾正錯誤。使用者可以通過虛擬鍵盤等對文字信息進行增、刪等操作。

之后，本方法還可以包括：

s304，顯示編輯后文字信息，并將編輯后文字信息發(fā)送至服務(wù)器。

在這一步驟中，發(fā)送終端的使用者編輯之后的編輯后文字信息已顯示在發(fā)送端，該文字信息同時由發(fā)送終端上傳至服務(wù)器中，由該服務(wù)器發(fā)送至接收方并進行同步顯示，本申請不再贅述。

在一優(yōu)選實施例中，步驟s302之后還可以包括：

步驟s302a，接收服務(wù)器發(fā)送的輔助修改信息；

在這一步驟中，將在語音識別過程中產(chǎn)生的詞圖(wordgraph)及識別詞多候選信息發(fā)送至發(fā)送終端，可以輔助發(fā)送終端使用者更高效的對識別文本進行錯誤糾正。

在步驟s303中，該錯誤糾正界面不僅可以顯示文本信息進入編輯狀態(tài)、虛擬鍵盤或者手寫鍵盤等輸入界面，同時可以顯示步驟s302a中服務(wù)器發(fā)送的輔助修改信息，例如，當(dāng)服務(wù)器認為語音識別之后生成的文本信息中某一句話或某一個詞不符合語法構(gòu)成，則可以在該句或該詞的下方加上虛線下劃線，同時在發(fā)送終端顯示界面的其他位置(例如輸入界面)顯示服務(wù)器發(fā)送來的輔助修改信息中包含的多個候選詞，供使用者點選正確的候選詞?；蛘撸?dāng)發(fā)送方選擇錯誤糾正、并點擊識別錯誤的某字詞時，可通過輔助糾正信息得到該字詞的其他候選字詞，并顯示在虛擬鍵盤上，用戶可通過點擊正確候選高效的進行錯誤糾正。

在一優(yōu)選實施例中，步驟s302之后還包括：

s302b，在接收到播放語音信息指令后，播放語音信息；

在該步驟中，若發(fā)送終端的使用者通過點擊所顯示的文字信息等方式發(fā)出播放語音信息指令，則發(fā)送終端可以通過聽筒或揚聲器播放在步驟3101中錄制的語音信息。

綜上所述，本申請第三實施例提出一種基于語音識別的即時通信方法，將語音信息通過識別生成文字信息，并提供錯誤糾正功能，可以讓發(fā)送終端的使用者能夠修改識別后的文字信息。該實施例提供的即時通信方法方便了接收終端接收信息，克服了某些場合下接收終端收到語音信息后無法收聽的障礙，避免了使用者隱私泄露的問題，同時保證了接收終端接收到信息的準(zhǔn)確性。

優(yōu)選地，本申請第三實施例還可以接收服務(wù)器發(fā)出的輔助修改信息，可以讓使用者高效地修改文本信息，進一步提高了信息的準(zhǔn)確性和及時性。

第四實施例

本申請第四實施例提出一種基于語音識別的即時通信方法，如圖4所示為本申請第四實施例的基于語音識別的即時通信方法的流程圖。本申請第四實施例中的即時通信方法應(yīng)用于信息的接收終端，包括如下步驟：

s401，接收服務(wù)器發(fā)送的語音信息；

在這一步驟中，發(fā)送終端錄制語音信息并發(fā)送至服務(wù)器，在由服務(wù)器將該語音信息發(fā)送至接收終端；

s402，接收服務(wù)器發(fā)送的識別該語音信息后生成的文字信息；

在這一步驟中，服務(wù)器將該語音信息經(jīng)過語音識別生成文字信息之后，發(fā)送至接收終端，接收終端接收經(jīng)過識別生成的這一文字信息。

值得注意的是，步驟s401和步驟s402可以同時或先后執(zhí)行，即接收終端可以同時或先后接收語音信息和生成的文字信息，本申請并不特別限制。優(yōu)選地，服務(wù)器將語音信息轉(zhuǎn)成文字信息之后，再將語音信息和文字信息同時發(fā)送給接收終端，接收終端同時接收該語音信息和該文字信息。

s403，顯示并標(biāo)記該文字信息；

在這一步驟中，接收終端可以將該文字信息顯示于即時通信的界面上。由于該文字信息是由語音信息經(jīng)過識別后生成，為了將其區(qū)別于發(fā)送方直接以文字輸入的文字信息，可以對該文字信息進行標(biāo)記，例如通過設(shè)置特別的底色、字體、標(biāo)記特別的字符(例如“語音識別”或“asr”)來區(qū)分普通文字信息和語音識別的文字信息。

在標(biāo)記該文字信息中，一種可能的方式是，當(dāng)接收終端接收到語音信息和對應(yīng)于該語音信息的文字信息，則接收終端將該文字信息進行標(biāo)記，使之區(qū)別于服務(wù)器發(fā)來的由發(fā)送終端直接以文字形式輸入的文字信息；另一種可能的方式是，服務(wù)器在發(fā)送該文字信息時同時發(fā)送標(biāo)記，該標(biāo)記與該文字信息同時顯示于接收終端的顯示界面上。在這一種情況下，步驟s402之后還包括：

s402a，接收服務(wù)器發(fā)送的標(biāo)記信息。

在這一步驟中，這一標(biāo)記信息例如可以為設(shè)置特別的底色、字體、標(biāo)記特別的字符(例如“語音識別”或“asr”)等。

優(yōu)選地，在步驟s403之后，該方法還可以包括：

s404，當(dāng)接收到使用者的播放該語音信息的指令，播放該語音信息；

在這一實施例中，播放語音信息的指令可以為使用者點擊該文字信息，當(dāng)使用者點擊所顯示的文字信息，該接收終端怎通過聽筒或揚聲器播放步驟s401中接收到的語音信息；

優(yōu)選地，在步驟s403之后，該方法還可以包括：

s405，接收服務(wù)器發(fā)送的編輯后文字信息，并顯示編輯后文字信息；

在該步驟中，當(dāng)發(fā)送終端對文字信息進行錯誤糾正后，發(fā)送終端將糾正后文本信息發(fā)送至服務(wù)器，由服務(wù)器發(fā)送至接收終端，接收終端接收該編輯后文字信息，并進行顯示。優(yōu)選地，接收終端可以用編輯后文字信息覆蓋修改之前的文字信息。

綜上所述，本申請第四實施例提出一種基于語音識別的即時通信方法，將語音信息通過識別生成文字信息，并提供錯誤糾正功能，可以讓接收終端的使用者直接接收經(jīng)過語音識別的文字信息，并能夠明確該文字信息是由發(fā)送終端直接以文字形式發(fā)出還是經(jīng)過語音識別后生成的文字信息。該實施例提供的即時通信方法方便了接收終端接收信息，克服了某些場合下接收終端收到語音信息后無法收聽的障礙，避免了使用者隱私泄露的問題。

圖5所示為對應(yīng)于本發(fā)明第一實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)，如圖5所示，該實施例中的即時通信系統(tǒng)500包括如下模塊：

語音信息接收模塊501，用于接收發(fā)送終端發(fā)送的語音信息；

文字信息生成模塊502，用于將該語音信息進行語音識別，生成文字信息；

第一發(fā)送模塊503，用于將該語音信息發(fā)送至接收終端；以及

第二發(fā)送模塊504，用于將該文字信息發(fā)送至接收終端。

圖6所示為對應(yīng)于本發(fā)明第二實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)，如圖6所示，在一優(yōu)選實施例中，除了上述語音信息接收模塊601、文字信息生成模塊602、第一發(fā)送模塊603、第二發(fā)送模塊604之外，所述系統(tǒng)600還包括：

第三發(fā)送模塊605，用于將該文字信息發(fā)送至發(fā)送終端。

此外，所述系統(tǒng)600還包括：

信息收發(fā)模塊606，用于接收所述發(fā)送終端發(fā)出的編輯后文字信息，并發(fā)送至接收終端。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

第一存儲模塊607，將該文字信息儲存于數(shù)據(jù)庫。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

第四發(fā)送模塊608，用于將輔助錯誤糾正信息發(fā)送至發(fā)送終端；以及

信息收發(fā)模塊609，用于接收所述發(fā)送終端發(fā)出的編輯后文字信息，并發(fā)送至接收終端。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

文字信息關(guān)聯(lián)模塊610，用于將編輯后文字信息發(fā)送至數(shù)據(jù)庫，并與糾正前的所述文字信息關(guān)聯(lián)。

在一優(yōu)選實施例中，所述輔助錯誤糾正信息包括針對所述文字信息的指定字、詞或句的詞圖和候選字詞。

在一優(yōu)選實施例中，所述指定字、詞或句的詞圖和候選字詞從所述數(shù)據(jù)庫中獲得。

在一優(yōu)選實施例中，所述第一發(fā)送模塊和所述第二發(fā)送模塊同時執(zhí)行，將所述將該語音信息和所述文字信息同時發(fā)送至接收終端。

圖7所示為對應(yīng)于本發(fā)明第三實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)，如圖7所示，該實施例中的即時通信系統(tǒng)700包括如下模塊：

語音信息錄制發(fā)送模塊701，用于錄制語音信息并發(fā)送至服務(wù)器；

文字信息接收顯示模塊702，用于接收經(jīng)過識別該語音信息生成的文字信息，并顯示該文字信息；

編輯模塊703，用于在接收到糾正操作指令后，進入編輯文字信息的界面；

顯示發(fā)送模塊704，用于顯示編輯后文字信息，并將編輯后文字信息發(fā)送至服務(wù)器。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

輔助修改信息接收模塊705，用于接收服務(wù)器發(fā)送的輔助修改信息。

在一優(yōu)選實施例中，所述輔助錯誤糾正信息包括針對所述文字信息的指定字、詞或句的詞圖和候選字詞，所述候選字詞顯示在所述編輯文字信息的界面中。

在一優(yōu)選實施例中，所述編輯文字信息的界面包括輸入界面。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

語音信息播放模塊706，用于在接收到播放語音信息指令后，播放語音信息。

在一優(yōu)選實施例中，所述播放語音信息指令通過使用者點擊該文字信息生成。

圖8所示為對應(yīng)于本發(fā)明第四實施例的基于語音識別的即時通信方法的即時通信系統(tǒng)，如圖8所示，該實施例中的即時通信系統(tǒng)800包括如下模塊：

語音信息獲取模塊801，用于接收服務(wù)器發(fā)送的語音信息；

文字信息獲取模塊802，用于接收服務(wù)器發(fā)送的識別該語音信息后生成的文字信息；

文字信息顯示標(biāo)記模塊803，用于顯示并標(biāo)記該文字信息。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

標(biāo)記信息獲取模塊804，用于接收服務(wù)器發(fā)送的標(biāo)記信息。

在一優(yōu)選實施例中，所述文字信息獲取模塊和所述標(biāo)記信息獲取模塊同時執(zhí)行，將所述文字信息和所述標(biāo)記信息同時獲取。

在一優(yōu)選實施例中，文字信息顯示標(biāo)記模塊用于顯示所述文字信息，利用所述標(biāo)記信息對所述文字信息進行標(biāo)記。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

語音信息播放模塊805，用于當(dāng)接收到使用者的播放該語音信息的指令，播放該語音信息。

在一優(yōu)選實施例中，所述播放該語音信息的指令通過使用者點擊該文字信息生成。

在一優(yōu)選實施例中，所述系統(tǒng)還包括：

接收顯示模塊806，用于接收服務(wù)器發(fā)送的編輯后文字信息，并顯示該編輯后文字信息。

在一優(yōu)選實施例中，所述編輯后文字信息以覆蓋編輯前文字信息的方式顯示。

對于裝置實施例而言，由于其與方法實施例基本相似，所以描述的比較簡單，相關(guān)之處參見方法實施例的部分說明即可。

綜上所述，本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)，至少具有以下優(yōu)點：

(1)本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，通過語音識別功能，克服了接收終端獲得信息的障礙，方便了使用者的使用，避免了隱私泄露的問題。

(2)本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，通過錯誤修改功能，使得發(fā)送終端有機會糾正語音識別系統(tǒng)的錯誤；

(3)本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，通過數(shù)據(jù)收集功能，獲得真實識別錯誤數(shù)據(jù)以改進語音識別系統(tǒng)的性能。

(4)本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，錯誤糾正的步驟方便發(fā)送終端進行錯誤糾正；

(5)本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，信息標(biāo)記的步驟方便接收終端辨識收到的信息是虛擬鍵盤輸入還是語音信息；

(6)本申請實施例提出的基于語音識別的即時通信方法和即時通信系統(tǒng)中，如果是語音信息，接收終端可以點選識別語音信息后生成的文字信息，對原始的語音信息進行回放。

本說明書中的各個實施例均采用遞進的方式描述，每個實施例重點說明的都是與其他實施例的不同之處，各個實施例之間相同相似的部分互相參見即可。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本申請實施例的實施例可提供為方法、裝置、或計算機程序產(chǎn)品。因此，本申請實施例可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本申請實施例可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。

在一個典型的配置中，所述計算機設(shè)備包括一個或多個處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器，隨機存取存儲器(ram)和/或非易失性內(nèi)存等形式，如只讀存儲器(rom)或閃存(flashram)。內(nèi)存是計算機可讀介質(zhì)的示例。計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術(shù)來實現(xiàn)信號存儲。信號可以是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括，但不限于相變內(nèi)存(pram)、靜態(tài)隨機存取存儲器(sram)、動態(tài)隨機存取存儲器(dram)、其他類型的隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學(xué)存儲、磁盒式磁帶，磁帶磁磁盤存儲或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì)，可用于存儲可以被計算設(shè)備訪問的信號。按照本文中的界定，計算機可讀介質(zhì)不包括非持續(xù)性的電腦可讀媒體(transitorymedia)，如調(diào)制的數(shù)據(jù)信號和載波。

本申請實施例是參照根據(jù)本申請實施例的方法、終端設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個機器，使得通過計算機或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理終端設(shè)備上，使得在計算機或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理，從而在計算機或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

盡管已描述了本申請實施例的優(yōu)選實施例，但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念，則可對這些實施例做出另外的變更和修改。所以，所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本申請實施例范圍的所有變更和修改。

最后，還需要說明的是，在本文中，諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來，而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且，術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者終端設(shè)備所固有的要素。在沒有更多限制的情況下，由語句“包括一個……”限定的要素，并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。

以上對本申請所提供的一種基于語音識別的即時通信方法和即時通信系統(tǒng)，進行了詳細介紹，本文中應(yīng)用了具體個例對本申請的原理及實施方式進行了闡述，以上實施例的說明只是用于幫助理解本申請的方法及其核心思想；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本申請的思想，在具體實施方式及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本申請的限制。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2