两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語音識別錯誤的糾正方法及裝置制造方法

文檔序號:2826460閱讀:507來源:國知局
語音識別錯誤的糾正方法及裝置制造方法
【專利摘要】本發(fā)明提出了語音識別錯誤糾正方法及裝置。語音識別錯誤糾正方法包括如下步驟:對語音識別結(jié)果的錯誤可能性進行判斷;在錯誤可能性大于事先定義的基準的情況下,根據(jù)正確答案語料庫以及語音識別結(jié)果是否匹配生成平行語料庫;以平行語料庫為基礎(chǔ),生成語音識別模型;以語音識別模型及語言模型為基礎(chǔ),對錯誤的語音識別結(jié)果進行糾正。根據(jù)本發(fā)明,可對通過語音識別所產(chǎn)生錯誤進行糾正。
【專利說明】語音識別錯誤的糾正方法及裝置
[0001]本申請主張申請日為2012年12月7日的韓國專利申請N0.10-2012-0141972的優(yōu)先權(quán),該在先申請的全文引入本說明書作為參考。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及語音識別錯誤的糾正方法及裝置,更詳細地涉及一種用于糾正在語音識別裝置中產(chǎn)生的錯誤的語音識別錯誤糾正方法及裝置。
【背景技術(shù)】
[0003]由于智能手機、平板電腦等移動設(shè)備的普及,提高了對語音識別應(yīng)用軟件(例如,如蘋果公司的SIRI —樣的對話系統(tǒng))的關(guān)注。但是現(xiàn)在語音識別技術(shù)的準確度不高,由此頻繁產(chǎn)生語音識別的錯誤,這導(dǎo)致了語音識別應(yīng)用軟件中出現(xiàn)故障。

【發(fā)明內(nèi)容】

[0004]用于解決上述問題的本發(fā)明的目的在于,提供一種語音識別錯誤糾正方法,其用于以平行語料庫為基礎(chǔ)對語音識別的錯誤進行糾正。
[0005]用于解決上述問題的本發(fā)明的另一個目的在于,提供一種語音識別錯誤糾正裝置,其用于以平行語料庫為基礎(chǔ)對語音識別的錯誤進行糾正。
[0006]在一些實施例中,語音識別錯誤糾正裝置執(zhí)行的語音識別錯誤糾正方法包括如下步驟:以通過正確答案語料庫以及領(lǐng)域語料庫學習的語言模型為基礎(chǔ),對語音識別結(jié)果的錯誤可能性進行判斷;在上述錯誤可能性大于事先定義的基準的情況下,根據(jù)語音識別結(jié)果是否與正確答案語料庫相匹配生成平行語料庫;根據(jù)平行語料庫生成語音識別模型;以及根據(jù)語音識別模型和語言模型,對錯誤的語音識別結(jié)果進行糾正。
[0007]在此,在判斷錯誤可能性的步驟中,可根據(jù)上述語音識別結(jié)果的生成概率對語音識別結(jié)果的錯誤可能性進行判斷。
[0008]在此,上述生成平行語料庫的步驟可包括如下步驟:從上述正確答案語料庫以及上述語音識別結(jié)果中對正確答案集進行檢測;從上述正確答案語料庫以及上述語音識別結(jié)果中對錯誤答案集進行檢測;以及以上述正確答案語料庫、上述語音識別結(jié)果、上述正確答案集及上述錯誤答案集為基礎(chǔ),生成上述平行語料庫。
[0009]在此,上述生成語音識別模型步驟可包括如下步驟:從上述平行語料庫中對語音識別前的第一語法進行檢測;從上述平行語料庫中對語音識別后的第二語法進行檢測;對上述第一語法和上述第二語法之間的語音識別概率進行計算;以及以上述第一語法、上述第二語法以及上述語音識別概率為基礎(chǔ),生成上述語音識別模型。
[0010]在此,上述對語音識別結(jié)果的錯誤進行糾正的步驟可包括如下步驟:根據(jù)上述第一語法和上述第二語法之間的對應(yīng)關(guān)系生成圖表;從上述圖表中對具有最小錯誤的路徑進行檢測;以及以檢測的路徑為基礎(chǔ),對上述錯誤的語音識別結(jié)果進行糾正。
[0011]在此,上述生成圖表的步驟中,在不存在對應(yīng)于第二語法的第一語法的情況下,可將第二語法假設(shè)為第一語法。
[0012]在此,在以上述檢測的路徑為基礎(chǔ)對錯誤的語音識別結(jié)果進行糾正的步驟中,在無需根據(jù)語言模型進行重新排列的情況下,可對錯誤的語音識別結(jié)果進行糾正。
[0013]根據(jù)用于實現(xiàn)上述目的的本發(fā)明的另一個實施例的語音識別錯誤糾正裝置,其包括:處理部,其以通過正確答案語料庫以及領(lǐng)域語料庫學習的語言模型為基礎(chǔ),對語音識別結(jié)果的錯誤可能性進行判斷,并且在錯誤可能性大于事先定義的基準的情況下,根據(jù)正確答案語料庫以及語音識別結(jié)果是否相匹配生成平行語料庫,并且以平行語料庫為基礎(chǔ)生成語音識別模型,并且以語音識別模型以及語言模型為基礎(chǔ)對錯誤的語音識別結(jié)果進行糾正;存儲部,其對上述處理部中所處理的信息以及已處理的信息進行存儲。
[0014]在此,所述處理部根據(jù)語音識別結(jié)果的生成概率對語音識別結(jié)果的錯誤可能性進行判斷。
[0015]在此,所述處理部從正確答案語料庫以及語音識別結(jié)果中對正確答案集進行檢測,并且從正確答案語料庫以及語音識別結(jié)果中對錯誤答案集進行檢測,并且以正確答案語料庫、語音識別結(jié)果、正確答案集以及錯誤答案集為基礎(chǔ)生成平行語料庫。
[0016]所述處理部從平行語料庫中對語音識別前的第一語法進行檢測,并且從平行語料庫中對語音識別后的第二語法進行檢測,并且對第一語法和第二語法之間的語音識別概率進行計算,并且以第一語法、第二語法以及語音識別概率為基礎(chǔ)生成所述語音識別模型。
[0017]在此,所述處理部對根據(jù)第一語法和第二語法之間的對應(yīng)關(guān)系生成圖表,并且從所述圖表中對具有最小錯誤的路徑進行檢測,并且以檢測到的路徑為基礎(chǔ),對錯誤的語音識別結(jié)果進行糾正。
[0018]在此,所述處理部在不存在對應(yīng)于第二語法的第一語法的情況下,將第二語法假設(shè)為第一語法,從而生成所述圖表。
[0019]在此,所述處理部在無需根據(jù)語言模型進行重新排列的情況下,對錯誤的語音識別結(jié)果進行糾正。
[0020]根據(jù)本發(fā)明,可對語音識別產(chǎn)生的錯誤進行糾正,從而提高語音識別的準確度。
【專利附圖】

【附圖說明】
[0021]圖1是表示語音識別裝置的框圖;
[0022]圖2是表示根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正方法的流程圖;
[0023]圖3是表示根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正方法中生成平行語料庫的步驟的流程圖;
[0024]圖4是根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正方法中生成語音識別模型的步驟的流程圖;
[0025]圖5是表示語音識別模型的示意圖;
[0026]圖6是表示根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正方法中對語音識別結(jié)果的錯誤進行糾正的步驟的流程圖;
[0027]圖7是表不根據(jù)語法對應(yīng)關(guān)系的圖表的不意圖。
[0028]圖8是表示根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正裝置的框圖。
[0029]圖9是表示根據(jù)本發(fā)明的另一個實施例的語音識別錯誤糾正裝置的框圖。【具體實施方式】
[0030]本發(fā)明可增加各種變更,并且可具有各種實施例,將特定實施例示出于附圖中,并且將會進行詳細說明。但是,上述不會將本發(fā)明限定在特定實施例形態(tài),而是應(yīng)理解為包括在本發(fā)明的思想以及技術(shù)范圍內(nèi)的所有變更、等同物或者替代物。
[0031]第一、第二等術(shù)語可用于說明各種構(gòu)成部件,但是不能使用上述術(shù)語對上述構(gòu)成部件進行限定。使用上述術(shù)語的目的是將一個構(gòu)成部件與其他構(gòu)成部件進行區(qū)別。例如,在不脫離本發(fā)明的權(quán)利范圍的情況下,第一構(gòu)成部件可命名為第二構(gòu)成部件,同樣第二構(gòu)成部件也可命名為第一構(gòu)成部件。術(shù)語“以及/或者”包括多個相關(guān)的所記載的組件的組合或者多個相關(guān)的所記載的組件中的任何組件。
[0032]當提到某構(gòu)成部件“連接”或者“耦合”于其他構(gòu)成部件時,可直接連接或者耦合于其他構(gòu)成部件中,也可理解為在中間存在其他的構(gòu)成部件。相反地,當提到某構(gòu)成部件“直接連接”或者“直接耦合”于其他構(gòu)成部件時,應(yīng)理解為在中間不存在其他的構(gòu)成部件。
[0033]在本申請中所使用的術(shù)語只是為了說明特定的實施例而使用的,因此沒有限定本發(fā)明的意圖。單數(shù)的表達在上下文上只要沒有明確地指出其他的意思,則包括復(fù)數(shù)的表達。在本申請中,“包括”或者“具有”等術(shù)語應(yīng)理解為指定記載于說明書中的特征、數(shù)字、步驟、操作、構(gòu)成部件、部件或者組合上述部分的存在,而不是排除一個或者一個以上的其他特征或者數(shù)字、步驟、操作、構(gòu)成部件、部件或者組合上述部分的存在或者附加可能性。
[0034]只要不做其他定義,包括技術(shù)性或者科學性的術(shù)語,在此使用的全部術(shù)語與本發(fā)明所屬的【技術(shù)領(lǐng)域】中具有一般知識的技術(shù)人員通常所理解的意思相同。通常所使用的事先定義的術(shù)語應(yīng)理解為與相關(guān)技術(shù)的上下文上所具有的意思一致,只要在本申請中沒有明確地定義,就不能理解為理想性或者過于形式性的意思。
[0035]以下,參照附圖,對本發(fā)明的優(yōu)選實施例進行更詳細說明。在說明本發(fā)明時,為了幫助整體上的理解,對附圖上的相同構(gòu)成部件使用相同的參照符號,并且對相同的構(gòu)成部件省略重復(fù)說明。
[0036]圖1是表示語音識別裝置的框圖。
[0037]參照圖1,語音識別裝置可包括語音識別部20、錯誤糾正部30以及語音識別應(yīng)用部40。語音識別部20可接收語音信號10,并且對語音信號10進行識別,從而可生成語音識別結(jié)果(文本)。錯誤糾正部30可分析在語音識別結(jié)果中是否包括有錯誤,并且在包括有錯誤的情況下,可對包括于語音識別結(jié)果中的錯誤進行糾正。實質(zhì)上,錯誤糾正部30可具有與圖8以及圖9所示的語音識別錯誤糾正裝置30相同的配置。
[0038]語音識別應(yīng)用部40可將語音識別結(jié)果適用于各種應(yīng)用。應(yīng)用可以是語音文字處理軟件、語音對話系統(tǒng)等。
[0039]圖2是表示根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正方法的流程圖。
[0040]參照圖2,語音識別錯誤糾正方法包括如下步驟:以通過正確答案語料庫以及領(lǐng)域語料庫學習的語言模型為基礎(chǔ),對語音識別結(jié)果的錯誤可能性進行判斷(Sioo);在錯誤可能性大于事先定義的基準的情況下,根據(jù)語音識別結(jié)果是否與正確答案語料庫相匹配生成平行語料庫(S200);以平行語料庫為基礎(chǔ)生成語音識別模型(S300);以及以語音識別模型以及語言模型為基礎(chǔ),對錯誤的語音識別結(jié)果進行糾正(S400)。在此,語音識別的錯誤糾正方法的各個步驟可通過圖8以及圖9所示的語音識別錯誤糾正裝置30執(zhí)行。
[0041]語音識別錯誤糾正裝置可判斷在語音識別結(jié)果中是否包括錯誤(換句話說,錯誤的可能性)(S100)。語音識別的錯誤糾正裝置使用語言模型來判斷錯誤的可能性,上述語言模型通過與語音識別結(jié)果相關(guān)的正確答案語料庫和大容量的領(lǐng)域語料庫的學習而獲得。在此,可將η元語法(N-gram)用作語言模型,具體地,可使用二元語法(bigram)或三元語法(trigram)ο
[0042]例如,在語音識別結(jié)果為“蘋果美味地吃”的情況下,語音識別錯誤糾正裝置通過二元語法可對“蘋果美味地”、“美味地吃”的生成概率進行計算,并且通過三元語法可對“蘋果美味地吃”的生成概率進行計算。此時,語言模型是通過正確答案語料庫學習的,因此作為二元語法的“蘋果美味地”具有低生成概率,由此,語音識別錯誤糾正裝置可將“蘋果美味地”判斷為具有高錯誤可能性的語法。最終,語音識別錯誤糾正裝置可將“蘋果美味地吃”判斷為具有高錯誤可能性的語法。
[0043]語音識別錯誤糾正裝置在錯誤可能性大于事先定義的基準的情況下,可根據(jù)正確答案語料庫以及語音識別結(jié)果是否匹配生成平行語料庫(S200 )。
[0044]圖3是表示根據(jù)本發(fā)明的一個實施例的語音識別錯誤糾正方法中生成平行語料庫的步驟的流程圖。
[0045]參照圖3,生成平行語料庫的步驟(S200)可包括如下步驟:從正確答案語料庫以及語音識別結(jié)果中對正確答案集進行檢測(S210);從正確答案語料庫以及語音識別結(jié)果中對錯誤答案集進行檢測(S220);以及以正確答案語料庫、語音識別結(jié)果、正確答案集以及錯誤答案集為基礎(chǔ),生成平行語料庫(S230 )。
[0046]語音識別錯誤糾正裝置可從現(xiàn)有平行語料庫中對正確答案集進行檢測(S210),上述現(xiàn)有平行語料庫可包括正確答案語料庫以及語音識別結(jié)果。
[0047]【表1】
[0048]
【權(quán)利要求】
1.一種語音識別錯誤糾正方法,其在語音識別錯誤糾正裝置中執(zhí)行,其特征在于,包括如下步驟: 以通過正確答案語料庫以及領(lǐng)域語料庫學習的語言模型為基礎(chǔ),對語音識別結(jié)果的錯誤可能性進行判斷; 在上述錯誤可能性大于事先定義的基準的情況下,根據(jù)正確答案語料庫以及語音識別結(jié)果是否匹配生成平行語料庫; 以上述平行語料庫為基礎(chǔ),生成語音識別模型;以及 以語音識別模型以及語言模型為基礎(chǔ),對錯誤的語音識別結(jié)果進行糾正。
2.根據(jù)權(quán)利要求1所述的語音識別錯誤糾正方法,其特征在于: 在判斷錯誤可能性的步驟中,根據(jù)語音識別結(jié)果的生成概率對語音識別結(jié)果的錯誤可能性進行判斷。
3.根據(jù)權(quán)利要求1所述的語音識別錯誤糾正方法,其特征在于,生成平行語料庫的步驟可包括如下步驟: 從上述正確答案語料庫以及上述語音識別結(jié)果中對正確答案集進行檢測; 從上述正確答案語料庫以及上述語音識別結(jié)果中對錯誤答案集進行檢測;以及以上述正確答案語料庫、上述語音識別結(jié)果、上述正確答案集以及上述錯誤答案集為基礎(chǔ),生成上述平行語料庫。
4.根據(jù)權(quán)利要求1`所述的語音識別錯誤糾正方法,其特征在于,生成語音識別模型的步驟包括如下步驟: 從上述平行語料庫中對語音識別前的第一語法進行檢測; 從上述平行語料庫中對語音識別后的第二語法進行檢測; 對第一語法和第二語法之間的語音識別概率進行計算;以及 以第一語法、第二語法以及語音識別概率為基礎(chǔ),生成上述語音識別模型。
5.根據(jù)權(quán)利要求4所述的語音識別錯誤糾正方法,其特征在于,對錯誤的語音識別結(jié)果進行糾正的步驟包括如下步驟: 根據(jù)第一語法和第二語法之間的對應(yīng)關(guān)系生成圖表; 從上述圖表中對具有最小錯誤的路徑進行檢測;以及 以檢測的路徑為基礎(chǔ),對錯誤的語音識別結(jié)果進行糾正。
6.根據(jù)權(quán)利要求5所述的語音識別錯誤糾正方法,其特征在于: 在生成圖表的步驟中,在不存在對應(yīng)于第二語法的第一語法的情況下,假設(shè)第二語法為第一語法。
7.根據(jù)權(quán)利要求5所述的語音識別錯誤糾正方法,其特征在于: 在以檢測的路徑為基礎(chǔ)對錯誤的語音識別結(jié)果進行糾正的步驟中,在無需根據(jù)語言模型進行重新排列的情況下,對錯誤的語言識別結(jié)果進行糾正。
8.一種語音識別錯誤糾正裝置,其特征在于,包括: 處理部,其以通過正確答案語料庫以及領(lǐng)域語料庫學習的語言模型為基礎(chǔ),對語音識別結(jié)果的錯誤可能性進行判斷,并且在錯誤可能性大于事先定義的基準的情況下,根據(jù)正確答案語料庫以及語音識別結(jié)果是否相匹配生成平行語料庫,并且以平行語料庫為基礎(chǔ)生成語音識別模型,并且以語音識別模型以及語言模型為基礎(chǔ)對錯誤的語音識別結(jié)果進行糾正;以及 存儲部,其對上述處理部中所處理的信息以及已處理的信息進行存儲。
9.根據(jù)權(quán)利要求8所述的語音識別錯誤糾正裝置,其特征在于: 所述處理部根據(jù)語音識別結(jié)果的生成概率對語音識別結(jié)果的錯誤可能性進行判斷。
10.根據(jù)權(quán)利要求8所述的語音識別錯誤糾正裝置,其特征在于: 所述處理部從正確答案語料庫以及語音識別結(jié)果中對正確答案集進行檢測,并且從正確答案語料庫以及語音識別結(jié)果中對錯誤答案集進行檢測,并且以正確答案語料庫、語音識別結(jié)果、正確答案集以及錯誤答案集為基礎(chǔ)生成平行語料庫。
11.根據(jù)權(quán)利要求8所述的語音識別錯誤糾正裝置,其特征在于: 所述處理部從平行語料庫中對語音識別前的第一語法進行檢測,并且從平行語料庫中對語音識別后的第二語法進行檢測,并且對第一語法和第二語法之間的語音識別概率進行計算,并且以第一語法、第二語法以及語音識別概率為基礎(chǔ)生成所述語音識別模型。
12.根據(jù)權(quán)利要求11所述的語音識別錯誤糾正裝置,其特征在于: 所述處理部對根據(jù)第一語法和第二語法之間的對應(yīng)關(guān)系生成圖表,并且從所述圖表中對具有最小錯誤的路徑進行檢測,并且以檢測到的路徑為基礎(chǔ),對錯誤的語音識別結(jié)果進行糾正。
13.根據(jù)權(quán)利要求12所述的語音識別錯誤糾正裝置,其特征在于: 所述處理部在不存在對應(yīng)于`第二語法的第一語法的情況下,將第二語法假設(shè)為第一語法,從而生成所述圖表。
14.根據(jù)權(quán)利要求12所述的語音識別錯誤糾正裝置,其特征在于: 所述處理部在無需根據(jù)語言模型進行重新排列的情況下,對錯誤的語音識別結(jié)果進行糾正。
【文檔編號】G10L15/06GK103871407SQ201310604269
【公開日】2014年6月18日 申請日期:2013年11月25日 優(yōu)先權(quán)日:2012年12月7日
【發(fā)明者】李根培, 崔俊輝, 李仁載, 李東賢, 徐弘錫, 金龍熙, 柳成瀚, 具??? 申請人:浦項工科大學校產(chǎn)學協(xié)力團
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
万全县| 鸡西市| 中超| 阿克苏市| 青铜峡市| 陕西省| 桓台县| 阿克苏市| 通道| 柳江县| 突泉县| 沙雅县| 南阳市| 合水县| 大竹县| 兴国县| 会理县| 芜湖市| 青州市| 靖西县| 甘谷县| 六安市| 泸溪县| 泸定县| 岢岚县| 韶关市| 青冈县| 高唐县| 樟树市| 厦门市| 西乌珠穆沁旗| 修文县| 娱乐| 汕尾市| 新兴县| 抚顺县| 壤塘县| 东港市| 京山县| 牡丹江市| 苍溪县|