本發(fā)明涉及殘疾人裝備,具體涉及一種便攜語言輔助設備及其方法,特別應用于語障人群。
背景技術:
語言障礙,簡稱語障,有先天原因和后天原因。他們是發(fā)音困難,或完全不能發(fā)聲的人群,因此無法通過說話表達自身意思。語障人員是少數(shù)人群體,語障人員之間雖然可以使用啞語,但是不能說話。然而在常人社會中說話交流的方式是最基本的方式,因此語障人員很難融入常人社會。
另一方面,語障人員雖然條件受限,但也有自己的日常生活,可能需要獨自乘車、買菜、工作等等。這些都需要面對普通人,因此須要能通過語音表達自身意思。但是,目前還沒有這樣的語言輔助設備或這樣的語言輔助設備被公開。
技術實現(xiàn)要素:
本發(fā)明需要解決的技術問題是,如何提供一種便攜語言輔助設備及其方法,能幫助語障人員獨自與他人進行說話交流。
本發(fā)明的上述第一個技術問題這樣解決:構建一種便攜語言輔助設備,包括設備殼體和設備電路,其特征在于,所述設備電路包括:
快捷菜單模塊,用于產(chǎn)生、顯示當前可選的菜單選項和/或說話內容選項并接收用戶的選擇;
語音模塊,輸入端連接所述快捷菜單模塊,輸出端連接聲音輸出裝置,用于根據(jù)用戶選擇的說話內容選項輸出對應語音音頻。
這個方案是純菜單方式,方便快捷,可以滿足語障人員具有重復性的日常生活需要,比如:乘車、買菜。一般而言,普通人的日常生活中絕大多數(shù)都是重復的,因此很好地解決了語障人員獨自與他人進行說話交流的大部分需要。
另一方面,工作也是重復的。比如:餐廳服務員,使用純菜單方式也可讓語障人員適應更多的工作,更好地融入生活。
更進一步, 所述菜單選項是指:買菜、打車、工作,選擇后進入該菜單選項的下級內容,特別地菜單選項還包括文本輸入,選擇后切換成文本輸入方式;所述說話內容選項 是指:“您好”等,選擇后由語音模塊直接輸出對應語音或語音音頻;所述菜單選項與說話內容選項可以混合。
更進一步,菜單選項和/或說話內容選項是動態(tài),可以有默認開啟菜單、時間段默認菜單(比如:上班時間)等。
更進一步,所述聲音輸出裝置包括二種方式:
設備內部:所述聲音輸出裝置是位于所述殼體上的喇叭;
設備外部:所述聲音輸出裝置是經(jīng)所述設備電路中藍牙模塊無線連接的外部藍牙音箱;所述藍牙模塊電連接所述語音模塊。由于藍牙技術特別在節(jié)電效果的優(yōu)越性,設備外部方式優(yōu)選采用藍牙。
更進一步,所述快捷菜單模塊包括文本輸入單元,用于接收用戶的文字輸入并將最終輸入文本發(fā)送給所述語音模塊、經(jīng)文本語音轉換處理后輸出。
這個方案是菜單+文本輸入方式,二種方式可以切換。其中的文本輸入方式語音交流速度比較慢,但也適應一些特別的場合,比如:法庭辯論等,因此很好地解決了語障人員獨自與他人進行說話交流的部分需要。
更進一步,在上述文本輸入方式融合聯(lián)想輸入、快捷輸入菜單,加快輸入。
更進一步,所述快捷菜單模塊由硬件和軟件功能模塊共同組成,其中硬件結構優(yōu)選二種方式:
所述快捷菜單模塊包括位于所述殼體表面的顯示屏和按鍵及其連接的微處理器;這種硬件結構是純菜單方式的優(yōu)選。
所述快捷菜單模塊包括位于所述殼體表面的觸摸屏及其連接的微處理器;這種硬件結構是菜單+文本輸入方式的優(yōu)選。
所述微處理器是所有軟件功能模塊共用的,所述快捷菜單模塊中的軟件功能模塊可以是人機交互界面模塊。
更進一步,所述觸摸屏或顯示屏位于殼體正面,所述喇叭位于殼體背面,這樣方便面對面語言交流。
更進一步,所述語音模塊由硬件或軟件實現(xiàn),優(yōu)選二種方式:
文本語音轉換單元,優(yōu)選軟件實現(xiàn);這種方式語音不受限,菜單+文本輸入方式的方案必須采用它;
存儲說話內容選項對應語音的語音芯片,語音芯片中存儲多條語音音頻,每條語音音頻對應一個語音編碼,比如:001-“您好”,001是語音編碼,“您好”,是一條語音音頻。這種方式語音受限,適用于純菜單方式的方案,實現(xiàn)簡單、成本低。
更進一步,所述設備可以更新、自定義,包括二種方式:
㈠內部調整或更新:所述快捷菜單模塊包括保存使用者個人使用習慣或常用選項的存儲單元,用于更新的菜單選項、說話內容選項或語音音頻;
㈡外部更新:所述設備電路還包括設置在所述殼體上的接口,用于接收更新的菜單選項、說話內容選項或語音音頻。所述接口可以USB端口、串口、并口等。
這樣設備可以升級,也可以由用戶自定義菜單選項、說話內容選項或語音音頻。
更進一步,快捷菜單模塊包括麥克風及其連接的語音識別單元,用于對麥克風采集接收的聲音進行語音識別并根據(jù)識別內容產(chǎn)生可選的菜單選項或說話內容選項。這樣可以機器輔助回復,加快語音交流速度。
語音識別單元優(yōu)選軟件實現(xiàn)。
本發(fā)明的上述另一個技術問題這樣解決:構建一種語言輔助方法,其特征在于,包括以下步驟:
利用快捷菜單模塊生成當前可選的菜單選項或說話內容選項;
所述快捷菜單模塊接收用戶選擇;
所述快捷菜單模塊控制語音模塊根據(jù)用戶選擇的說話內容選項直接選取對應語音音頻進行輸出,或者所述快捷菜單模塊將用戶選擇的說話內容選項輸出給所述語音模塊、經(jīng)文本語音轉換處理后輸出。
更進一步,該語言輔助方法還包括:
所述快捷菜單模塊中麥克風采集接收聲音;
所述快捷菜單模塊中語音識別單元對所述聲音進行語音識別;
所述快捷菜單模塊根據(jù)所述語音識別的內容生成當前菜單選項和/或說話內容選項。
更進一步,該語言輔助方法還包括:
所述快捷菜單模塊中麥克風采集接收聲音;
所述快捷菜單模塊中語音識別單元根據(jù)所述聲音的聲音特征識別當前場景;
所述快捷菜單模塊根據(jù)所述當前場景生成當前菜單選項和/或說話內容選項。
更進一步,該語言輔助方法還包括文本輸入方式:
所述快捷菜單模塊中文本輸入單元接收用戶的文字輸入;
所述快捷菜單模塊根據(jù)所述文字輸入生成快捷輸入菜單;
所述快捷輸入菜單將自身接收的用戶輸入提供給所述文本輸入單元;
所述文本輸入單元將最終輸入文本發(fā)送給所述語音模塊;
所述語音模塊對所述最終輸入文本進行文本語音轉換處理、再輸出。
更進一步,在文本輸入方式中也加入語音識別:
所述快捷菜單模塊中麥克風采集接收聲音;
所述快捷菜單模塊中語音識別單元對所述聲音進行語音識別;
所述快捷菜單模塊根據(jù)所述語音識別的內容生成快捷輸入菜單。
更進一步,所述快捷輸入菜單包括詞語選項或句子選項;文本輸入單元接收用戶的文字輸入和快捷輸入菜單的輸入;文本輸入單元由軟件實現(xiàn),包括文本輸入框和完成輸入的“說話”圖形按鈕。
本發(fā)明提供的便攜語言輔助設備及其方法,采用菜單交互方式輸出語音,較現(xiàn)有技術具有以下優(yōu)勢:
1、滿足語障人員絕大多數(shù)日常生活語言交流需要,比如:買菜、乘車,使他們能獨立生活;
2、擴大語障人員可適應的工作范圍,比如:餐廳服務員、公交售票員,使他們能獨立工作;
3、進一步,追加文本輸入方式,滿足特別的、不太重視交流時間與效率的場合,比如:法庭答辯、商務談判;
4、進一步,追加輸入聯(lián)想、語音識別、場景識別等協(xié)助語障人員快速回復;
5、進一步,追加智能音量控制避免無法被聽清或打擾他人。
附圖說明
下面結合附圖和具體實施例進一步對本發(fā)明進行詳細說明:
圖1是本發(fā)明第一實施例的便攜語言輔助設備的正面結構示意圖;
圖2是圖1所示設備的背面結構示意圖;
圖3是本發(fā)明第一和二實施例的功能模塊結構示意圖;
圖4是本發(fā)明第一實施例的主控制程序的流程示意圖;
圖5是本發(fā)明第二實施例的主控制程序的流程示意圖;
圖6是本發(fā)明第三實施例的便攜語言輔助設備的功能模塊結構示意圖;
圖7是本發(fā)明第二和三實施例的文本輸入控制程序的流程示意圖;
圖8是本發(fā)明第一、二和三實施例的語音識別程序的流程示意圖。
其中附圖標記:11-電源開關、12-顯示屏、13-按鍵、14-喇叭、15-麥克風、16-USB端口、2-藍牙音箱、31-快捷菜單模塊、32-語音模塊和33-藍牙模塊。
具體實施方式
首先,說明本發(fā)明思路和出發(fā)點:
1、語言交流因快速便捷應用范圍最廣。語障人員通過菜單交互輸出語音,不會影響正常的交流速度;
2、大部分必須的語言交流場景是重復的。便攜語言輔助設備保存少量內容即可滿足大部分的需要,這個內容可以由廠家設定、用戶修改或自定義;
3、有些場合,人們愿意犧牲交流效率,比如:法庭答辯、商務談判等。這時使用文本輸入方式更合適;
4、通過語音識別,以及機器人回復,幫助語障人員提高交流效率;
5、通過聯(lián)想輸入,場景識別,幫助語障人員提高交流效率。
第二,結合具體實施例說明本發(fā)明:
第一實施例
該實施例是采用純菜單方式的單獨便攜設備。
主體結構
如圖1和2所示,該獨立便攜設備包括殼體和殼體頂端的電源開關11,殼體正面設置顯示屏12和三個按鍵13,背面設置喇叭 14、麥克風15和USB端口16,殼體內部設置有控制電路板和充電電池。開機或復蘇后顯示三條菜單選項、三條說話內容選項或組合,三個按鍵13用于對應選擇。該獨立便攜設備長時間不使用自動休眠。
㈡電路與功能模塊
如圖3所示,該獨立便攜設備包括依次電連接的麥克風15、快捷菜單模塊31、語音模塊32和喇叭14 :
快捷菜單模塊31,用于產(chǎn)生、顯示當前可選的菜單選項和/或說話內容選項并接收用戶的選擇;
語音模塊32,輸入端連接所述快捷菜單模塊,輸出端連接喇叭14,用于根據(jù)用戶選擇的說話內容選項輸出對應語音音頻;
喇叭14,用于聲音輸出;
麥克風15,用于接收采集聲音。
快捷菜單模塊31包括微處理器及其連接的顯示屏12和三個按鍵13,快捷菜單模塊的具體功能由軟件實現(xiàn),語音模塊32由語音芯片實現(xiàn)。這種結構實現(xiàn)簡單、成本低,但保存語音的數(shù)量和內容受到語音芯片的限制。
該獨立便攜設備還包括USB端口16,用于外部更新菜單選項、說話內容選項和保存語音芯片的語音。
軟件流程
該獨立便攜設備中微處理器需要加載控制程序完成具體電路控制實現(xiàn)對應功能。所述控制程序包括:
主控制程序
該主控制程序,具體如圖4所示,包括以下步驟:
100)開始;
101)顯示當前可選的選項;該選項是菜單選項或說話內容選項;
102)接收用戶按鍵輸入;
103)判斷對應選項是否說話內容選項?是下一步;否則進入選擇的菜單選項,返回步驟101;
104)輸出說話內容選項對應的內部編碼、控制語音芯片輸出;
105)結束。
語音識別程序
第二和三實施例也同樣使用,在后面的第三實施例中統(tǒng)一進行描述。
第二實施例
該實施例是采用菜單+文本輸入方式的單獨便攜設備。
主體結構
在第一實施例基礎上,使用觸摸屏替代顯示屏12與按鍵13的組合,其他一致。
㈡電路與功能模塊
在第一實施例基礎上,增加如下變化:
1、使用觸摸屏替代顯示屏12與按鍵13的組合;
2、語音模塊32由軟件實現(xiàn):文本語音轉換單元,可以采用現(xiàn)有技術的文本語音轉換(TTS)算法,這樣替代語音芯片,語音內容不受限,滿足文本輸入方式的需要;
3、USB端口16,用于外部更新菜單選項、說話內容選項。
軟件流程
該獨立便攜設備中微處理器需要加載控制程序完成具體電路控制實現(xiàn)對應功能。所述控制程序包括:
主控制程序
該主控制程序,具體如圖5所示,包括以下步驟:
200)開始;
201)顯示當前可選的選項;該選項是菜單選項或說話內容選項;
202)接收用戶按鍵輸入;
203)判斷對應選項是否說話內容選項?是下一步;否則進入選擇的菜單選項,返回步驟201;
204)文本語音轉換處理,得到對應的語音音頻;
205)把語音音頻輸出給喇叭;
206)結束。
在步驟205中,包括根據(jù)背景聲音進行的音量控制。
語音識別程序
第三實施例也同樣使用,在后面的第三實施例中統(tǒng)一進行描述。
文本輸入程序
第三實施例也同樣使用,在后面的第三實施例中統(tǒng)一進行描述。
第三實施例
該實施例是分體設備。
主體結構
整個設備包括智能手機和藍牙音箱二個分開的獨立裝置,智能手機中安裝有本發(fā)明用于語言輔助的手機應用(APP)。藍牙音箱是可戴在頸上的小音箱。藍牙音箱可以彌補手機免提的聲音輸出中音質與音量缺陷。
㈡電路與功能模塊
如圖6所示,該設備在智能手機端包括依次電連接的麥克風15、快捷菜單模塊31、語音模塊32和藍牙模塊33,通過藍牙模塊33把聲音輸出裝置延伸到藍牙音箱2。智能手機普遍配置藍牙模塊33,而快捷菜單模塊31與語音模塊32在智能手機硬件基礎上也由上述手機APP中對應軟件功能模塊實現(xiàn)。
因此,該實施例中手機硬件電路與普通手機一致。
軟件流程
上述手機APP包括菜單交互控制模塊,具體可以采用第二實施例中的主控制流程。
上述手機APP另外還包括:
語音識別模塊(程序)
該語音識別程序,具體如圖7所示,包括以下步驟:
400)開始;
401)判斷是否接收到聲音或語音?是下一步;否則返回本步驟開始;
402)通過語音識別算法把聲音識別為文字;
403)分析、生成快速回復選項菜單;
404)結束。
在步驟403中,分析包括關鍵字分析、場合分析、習慣分析等,進行智能回復;
在步驟403中,所述快速回復選項包括菜單方式下的菜單選項或說話內容選項,也可以包括文本輸入方式下的聯(lián)想詞語選項或聯(lián)想句子選項。
文本輸入模塊(程序)
該文本輸入程序,具體如圖8所示,包括以下步驟:
500)開始;
501)判斷是否有文字輸入?是下一步,否則進入步驟503;
502)分析、顯示聯(lián)想選項菜單;
503)判斷是否有菜單輸入?是進入步驟501,否則下一步;
504)判斷是否有輸入完畢?是下一步,否則進入步驟501;
505)把所有輸入的文本通過文本語音轉換算法進行處理;
506)輸出音頻;
507)結束。
在步驟502中,所述聯(lián)想選項菜單包括聯(lián)想詞語選項或聯(lián)想句子選項,選擇詞語選項以追加形式加入到文本輸入中,選擇聯(lián)想句子選項以替換形式代替所有文本輸入;
在步驟504中,根據(jù)用戶是否按下“說話”圖形按鈕判斷輸入完畢與否。
在第一、二和三實施例中,都可以增加記錄保存使用者個人使用習慣或常用選項,用于更新的菜單選項、說話內容選項或語音音頻。
在第一、二和三實施例中,都可以增加環(huán)境音量檢測,根據(jù)環(huán)境背景聲或噪聲分貝越大調高音量,用于智能調整輸出語音的音量,這樣避免影響他人或無法聽清,方便語言交流。
在第一、二和三實施例中,在上述智能調整輸出語音音量的基礎上,還分成三檔高、中、低,滿足個體不同的使用習慣。
在第一、二和三實施例中,都包括開機或復蘇后的默認菜單,可以根據(jù)時間、地點等選擇不同的默認菜單。
在第一、二和三實施例中,都可以增加場景識別,比如:檢測汽車喇叭聲,用于幫助生成貼合的菜單選項或說話內容選項或快捷輸入菜單,這樣節(jié)省語障人員菜單或文本輸入時間,方便語言交流。
在第一、二和三實施例中,都可以應用在打電話/接聽場合:手機或座機開免提,和本設備放在一起,語障人員就能象正常人一樣打電話了。
當然,以上所述僅是本發(fā)明的較佳實施例,故凡依本發(fā)明專利申請范圍所述的構造、特征及流程所做的等效變化或修飾,均包括于本發(fā)明專利申請范圍為內。