两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

在智能漢語(yǔ)語(yǔ)音口述記錄校正中使用字符描述器有效輸入模糊字符的制作方法_2

文檔序號(hào):8435919閱讀:來(lái)源:國(guó)知局
2,且系統(tǒng)然后基于字符描述提示502執(zhí)行自動(dòng)語(yǔ)音識(shí)別以確定語(yǔ)音輸入501對(duì)應(yīng)于字符“黎”,其如圖5B所示向用戶(hù)顯示為識(shí)別輸出503。
[0032]實(shí)現(xiàn)基于使用這樣的布置的一種方式可通過(guò)提供包含常見(jiàn)流行詞(例如公知的地點(diǎn)名稱(chēng)、著名人士的名字等)的識(shí)別字典來(lái)開(kāi)始。此外,可為通常通過(guò)描述字符的偏旁部分和/或結(jié)構(gòu)要素來(lái)區(qū)分的字符創(chuàng)建描述規(guī)則。不是很多字符需要這個(gè)規(guī)則,因?yàn)槿藗兺ǔH對(duì)具有非常少的偏旁部分的那些字符這樣操作。這些資源可基于數(shù)據(jù)收集和來(lái)自現(xiàn)有應(yīng)用的用戶(hù)反饋而發(fā)展,并接著用于設(shè)計(jì)可覆蓋最典型的講漢語(yǔ)的人的校正行為的靈活的識(shí)別語(yǔ)法。這樣的擴(kuò)展識(shí)別語(yǔ)法可接著使用正確的編程邏輯被添加到現(xiàn)有識(shí)別應(yīng)用,以從而提供靈活和有效的字符輸入/校正功能。
[0033]在特定的系統(tǒng)體系結(jié)構(gòu)中,用戶(hù)可能能夠在無(wú)約束自然語(yǔ)言理解(NLU)模式中或在使用約束格式輸入的命令模式中使用字符描述提示來(lái)輸入字符。字符描述提示可包括如下信息:
[0034].字符描述
[0035].動(dòng)作(例如替換、插入、附加等)(可選的)
[0036].位置(例如將字符放置在哪里/替換哪個(gè)字符)(可選的)
[0037]在NLU模式中輸入字符描述提示的一個(gè)例子是“我要把禮替換為木子李”。這像說(shuō)英文“I want to replace ‘two,with ‘toe,which ends with ‘oe,,,一樣。類(lèi)似地,用戶(hù)可以用自然語(yǔ)音說(shuō)一些東西如“木子李”(例如,像“‘toe’ ends with ‘oe’”一樣)。在那種情況下,用戶(hù)只提供字符描述,且因此系統(tǒng)可假設(shè)它表示附加字符。或者用戶(hù)可以說(shuō)比如“說(shuō)的是木子李” (“It’s ‘toe’ that ends with ‘oe’.,,)之類(lèi)的內(nèi)容。因?yàn)樵撦斎胍浴癷t’s”開(kāi)始,所以系統(tǒng)假設(shè)輸入是誤識(shí)別的校正,且因?yàn)橛脩?hù)不提供位置信息,系統(tǒng)可能假定替換句子中最接近光標(biāo)的具有最相似發(fā)音的“ two ”字符。
[0038]在命令模式中,字符描述提示的輸入格式被限制到幾個(gè)嚴(yán)格的格式。例如“把禮替換為木子李”(如同 “Replace ‘two,as ‘toe,which ends with ‘oe,.,,)。
[0039]系統(tǒng)開(kāi)發(fā)者可使用講漢語(yǔ)的人的大部分方法搜索、收集和過(guò)濾字符描述例子,并從其構(gòu)建描述列表--例如以“oe”結(jié)尾的Toe、如在“big toe”中的Toe等。描述列表可包含多于50,000個(gè)條目來(lái)描述多于6,000個(gè)漢語(yǔ)字符??煞指蠲總€(gè)描述,并可構(gòu)建另外可能的部分描述——例如具有“oe”的Toe。最終描述列表可以比50,000個(gè)條目的原始列表大兩到三倍。該列表可接著被構(gòu)建成識(shí)別語(yǔ)法,且其它輔助語(yǔ)法也可被添加以識(shí)別動(dòng)作信息和位置信息。也可合并其它可選的特征,例如選通命令或喚醒詞。
[0040]圖6示出使用基于語(yǔ)法的方法的識(shí)別系統(tǒng)體系結(jié)構(gòu)的一個(gè)特定的實(shí)施方式。用戶(hù)話(huà)音輸入601連同輸入語(yǔ)音和字符描述提示被提供到ASR引擎602,例如,其使用模糊匹配算法并具有用于字符描述604、動(dòng)作605和位置606的三個(gè)特定的獨(dú)立語(yǔ)法以執(zhí)行語(yǔ)音識(shí)另O。使用來(lái)自字符描述提示的信息來(lái)從ASR引擎602選擇最高置信度識(shí)別結(jié)果603。
[0041]圖7示出模糊匹配口述記錄引擎體系結(jié)構(gòu)的例子。提供用于字符描述707、動(dòng)作706和位置705的語(yǔ)法列表,并由語(yǔ)法轉(zhuǎn)換模塊708解釋以形成轉(zhuǎn)換信息A 709?用戶(hù)話(huà)音輸入701連同輸入語(yǔ)音和字符描述提示被提供到話(huà)音轉(zhuǎn)換模塊702以形成轉(zhuǎn)換信息B 703。然后根據(jù)轉(zhuǎn)換信息A 709和轉(zhuǎn)換信息B 703中的相關(guān)部分從口述記錄引擎模糊匹配模塊704得到口述記錄結(jié)果。從ASR引擎704選擇最高置信度識(shí)別結(jié)果710,且編輯動(dòng)作繼續(xù)進(jìn)行。
[0042]實(shí)驗(yàn)測(cè)試的結(jié)果表明準(zhǔn)確和自然地輸入并選擇單個(gè)漢語(yǔ)字符非常有效,而不需要來(lái)自用戶(hù)的特殊培訓(xùn)或記憶。這樣的單字符很少能夠通過(guò)現(xiàn)有的ASR布置被正確地識(shí)別。
[0043]例如,可使用VHDL、SystemC, Verilog、ASM等任何常規(guī)計(jì)算機(jī)編程語(yǔ)言全部或部分地實(shí)現(xiàn)本發(fā)明的實(shí)施方式。本發(fā)明的可選實(shí)施方式可被實(shí)現(xiàn)為預(yù)先編程的硬件元件、其它相關(guān)的部件或硬件和軟件部件的組合。
[0044]實(shí)施方式可全部或部分地被實(shí)現(xiàn)為用在計(jì)算機(jī)系統(tǒng)上的計(jì)算機(jī)程序產(chǎn)品。這樣的實(shí)現(xiàn)可包括固定在例如計(jì)算機(jī)可讀介質(zhì)(例如磁盤(pán)、CD-ROM、ROM或固定磁盤(pán))的有形介質(zhì)上或可經(jīng)由調(diào)制解調(diào)器或其它接口設(shè)備(例如在介質(zhì)上連接到網(wǎng)絡(luò)的通信適配器)傳輸?shù)接?jì)算機(jī)系統(tǒng)的一系列計(jì)算機(jī)指令。介質(zhì)可以是有形介質(zhì)(例如光學(xué)或模擬通信線)或使用無(wú)線技術(shù)(例如微波、紅外或其它傳輸技術(shù))實(shí)現(xiàn)的介質(zhì)。計(jì)算機(jī)指令系列體現(xiàn)本文之前關(guān)于該系統(tǒng)所描述的全部或部分功能。本領(lǐng)域中的技術(shù)人員應(yīng)認(rèn)識(shí)到,可以使用用在很多計(jì)算機(jī)體系結(jié)構(gòu)或操作系統(tǒng)上的多種編程語(yǔ)言編寫(xiě)這樣的計(jì)算機(jī)指令。此外,這樣的指令可存儲(chǔ)在例如半導(dǎo)體、磁性存儲(chǔ)器、光學(xué)存儲(chǔ)器或其它存儲(chǔ)器設(shè)備的任何存儲(chǔ)器設(shè)備中,并可使用例如光學(xué)、紅外、微波或其它傳輸技術(shù)的任何通信技術(shù)來(lái)傳輸。預(yù)期這樣的計(jì)算機(jī)程序產(chǎn)品可作為具有附隨的打印文檔或電子文檔(例如緊湊包裝的軟件)的可移動(dòng)介質(zhì)進(jìn)行發(fā)布、通過(guò)預(yù)裝在計(jì)算機(jī)系統(tǒng)(例如在系統(tǒng)ROM或固定磁盤(pán)上)或通過(guò)網(wǎng)絡(luò)(例如互聯(lián)網(wǎng)或萬(wàn)維網(wǎng))從服務(wù)器或電子公告欄進(jìn)行發(fā)布。當(dāng)然,本發(fā)明的一些實(shí)施方式可被實(shí)現(xiàn)為軟件(例如計(jì)算機(jī)程序產(chǎn)品)和硬件的組合。本發(fā)明的又一些其它實(shí)施方式被實(shí)現(xiàn)為純硬件、或純軟件(例如計(jì)算機(jī)程序產(chǎn)品)。
[0045]雖然公開(kāi)了本發(fā)明的各種示例性實(shí)施方式,但是對(duì)本領(lǐng)域中的技術(shù)人員將明顯的是,可做出將實(shí)現(xiàn)本發(fā)明的一些優(yōu)點(diǎn)的各種變化和修改,而不偏離本發(fā)明的真實(shí)范圍。
【主權(quán)項(xiàng)】
1.一種使用至少一個(gè)硬件實(shí)現(xiàn)的計(jì)算機(jī)處理器用于漢語(yǔ)語(yǔ)音識(shí)別輸入的用戶(hù)消歧的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括: 從用戶(hù)接收漢語(yǔ)語(yǔ)音輸入用于自動(dòng)語(yǔ)音識(shí)別; 從所述用戶(hù)接收描述在所述語(yǔ)音輸入中的一個(gè)或多個(gè)字符的自發(fā)字符描述提示;以及基于字符描述提示,使用所述語(yǔ)音輸入的自動(dòng)語(yǔ)音識(shí)別來(lái)確定對(duì)應(yīng)于所述語(yǔ)音輸入的一個(gè)或多個(gè)漢語(yǔ)語(yǔ)言字符。
2.如權(quán)利要求1所述的方法,其中所述字符描述提示是從所述用戶(hù)輸入的命令模式約束格式。
3.如權(quán)利要求1所述的方法,其中所述字符描述提示是從所述用戶(hù)輸入的無(wú)約束自然語(yǔ)言。
4.如權(quán)利要求3所述的方法,其中所述字符描述提示包括描述要執(zhí)行的動(dòng)作的字符動(dòng)作信息。
5.如權(quán)利要求3所述的方法,其中所述字符描述提示包括描述文本位置的字符位置信息。
6.如權(quán)利要求3所述的方法,其中所述字符描述提示包括描述所描述的字符的發(fā)音音調(diào)的音調(diào)描述信息。
7.如權(quán)利要求3所述的方法,其中所述字符描述提示包括使用所描述的字符的示例!?r] ο
8.如權(quán)利要求3所述的方法,其中所述字符描述提示包括所描述的字符的一個(gè)或多個(gè)偏旁部分的描述。
9.如權(quán)利要求3所述的方法,其中所述字符描述提示包括所描述的字符的一個(gè)或多個(gè)字符結(jié)構(gòu)要素的描述。
10.如權(quán)利要求1所述的方法,其中所述自動(dòng)語(yǔ)音識(shí)別使用用于操縱所述字符描述提示的識(shí)別語(yǔ)法。
11.如權(quán)利要求1所述的方法,其中所述自動(dòng)語(yǔ)音識(shí)別使用用于操縱所述字符描述提示的模糊匹配口述記錄引擎。
【專(zhuān)利摘要】描述了用于漢語(yǔ)語(yǔ)音識(shí)別輸入的用戶(hù)消歧的計(jì)算機(jī)實(shí)現(xiàn)的方法。從用戶(hù)接收用于自動(dòng)語(yǔ)音識(shí)別的漢語(yǔ)語(yǔ)音輸入。也從用戶(hù)接收描述語(yǔ)音輸入中的一個(gè)或多個(gè)字符的自發(fā)字符描述提示。然后基于字符描述提示來(lái)執(zhí)行語(yǔ)音輸入的自動(dòng)語(yǔ)音識(shí)別以確定對(duì)應(yīng)于語(yǔ)音輸入的一個(gè)或多個(gè)漢語(yǔ)語(yǔ)言字符。
【IPC分類(lèi)】G10L15-22
【公開(kāi)號(hào)】CN104756183
【申請(qǐng)?zhí)枴緾N201280075499
【發(fā)明人】李偉, 徐然, 任曉琳
【申請(qǐng)人】紐昂斯通訊公司
【公開(kāi)日】2015年7月1日
【申請(qǐng)日】2012年9月7日
【公告號(hào)】WO2014035437A1
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
五指山市| 射洪县| 昌图县| 邛崃市| 新田县| 洛宁县| 措美县| 南江县| 双鸭山市| 奇台县| 富源县| 嘉鱼县| 安化县| 江源县| 洛阳市| 个旧市| 突泉县| 汉寿县| 邵阳县| 万年县| 鞍山市| 万荣县| 县级市| 长治县| 江川县| 阳曲县| 靖西县| 乐安县| 双桥区| 全南县| 甘谷县| 翁源县| 浦东新区| 拜城县| 清河县| 七台河市| 岫岩| 岱山县| 浦城县| 浠水县| 固原市|