專利名稱:一種智能發(fā)音學習語料生成方法
技術(shù)領(lǐng)域:
本發(fā)明涉及發(fā)音學習領(lǐng)域,具體涉及一種根據(jù)發(fā)音學習者的發(fā)音問題情況, 綜合運用基于發(fā)音混淆的專家知識、語料分析技術(shù)、以及文本搜索技術(shù)自動生成 發(fā)音學習語料的方法。發(fā)明背景普通話水平測試是推廣普通話工作的重要方法,是使推廣普通話工作逐步走 上科學化、規(guī)范化、制度化的重要舉措。2000年10月31日第九屆全國人民代 表大會常務(wù)委員會第十八次會議通過的《中華人民共和國國家通用語言文字法》 規(guī)定,以普通話作為工作語言的播音員、節(jié)目主持人和影視話劇演員、教師、國 家機關(guān)工作人員必須參加普通話水平測試并達到國家規(guī)定的等級標準。目前進行的普通話水平學習主要以老師面授的方式為主,由師資力量有限很 難做到隨時隨地對學習者一對一的指導學習。指導老師的水平的高低,對普通話 學習也有很大到影響。因此,結(jié)合現(xiàn)代計算機技術(shù)的發(fā)展,研究開發(fā)如何將先進 的信息技術(shù)應(yīng)用于普通話學習,全部替代或部分替代普通話老師,從而彌補傳統(tǒng) 的普通話水平學習方法的不足,對于節(jié)省人力物力等成本和提高學習的效果、效 率方面都具有重大的意義。目前國際上針對語言學習的系統(tǒng)大都是基于計算機輔 助語言學習(CALL)的評測學習系統(tǒng),雖然也有在中文學習和評測方面的應(yīng)用, 但此類的評測學習系統(tǒng),由于沒有結(jié)合專家知識和智能搜索技術(shù),系統(tǒng)的針對性 不強,多半是采用系統(tǒng)化的學習內(nèi)容,不能根據(jù)每個學習者的情況進行動態(tài)定制。發(fā)明的內(nèi)容本發(fā)明針對現(xiàn)有技術(shù)的不足,開發(fā)出了在專家知識的指導下,結(jié)合計算機語 料構(gòu)建技術(shù)和智能搜索技術(shù)生成針對性的學習語料,能根據(jù)每個學習者的情況進 行動態(tài)定制以供學習者強化訓練,從而提升學習者學習發(fā)音的效率和效果的發(fā)音學習語料生成方法。本發(fā)明是通過以下技術(shù)方案實現(xiàn)的一種智能發(fā)音學習語料生成方法,包括有專家知識庫、專家系統(tǒng)、基礎(chǔ)語 料庫和搜索機,其實現(xiàn)方法包括以下步驟(1) 專家知識庫的構(gòu)建和分類從專家們以往處理發(fā)音問題的眾多實例中選取 專家處理眾多發(fā)音問題的方案,將眾多的處理方案知識以合適的組織形式存入知 識庫中,從而構(gòu)建了專家知識庫;專家知識庫的知識分為發(fā)音缺陷參數(shù)數(shù)據(jù)、事 實、診斷型知識和元知識4類;專家系統(tǒng)的構(gòu)建基于專家知識庫中分類好的各 個方案例子,在統(tǒng)計分析基礎(chǔ)上引入人工智能,構(gòu)建形成專家系統(tǒng),實現(xiàn)輸入案 例到發(fā)音練習語料搜索條件的自動決策系統(tǒng);(2) 基礎(chǔ)語料庫的構(gòu)建根據(jù)已有的系統(tǒng)化的發(fā)音訓練語料和從互聯(lián)網(wǎng)上搜尋 并篩選的語料由計算機處理并構(gòu)建;根據(jù)不同學習需要構(gòu)建不同內(nèi)容的基礎(chǔ)語料 數(shù)據(jù)庫,每一條語料可以按照這種格式存儲對象,屬性,類型;搜索機的構(gòu)建 對基礎(chǔ)語料庫進行倒排序索引,獲得從任意長度關(guān)鍵字到目標語料的索引;建立 可并行計算的快速搜索算法,可以從關(guān)鍵字或關(guān)鍵字組合快速搜索到相對應(yīng)的語料文本;(3) 學習者通過各種渠道獲得自己的發(fā)音問題情況,學習者將自己的發(fā)音問題 情況輸入專家系統(tǒng);(4) 專家系統(tǒng)根據(jù)其情況生成針對該發(fā)音問題情況的學習解決方案;該方案對 其發(fā)音情況進行分類和擴充,基本涵蓋學習者的發(fā)音問題和與發(fā)音問題相關(guān)聯(lián)的 易混淆發(fā)音;(5) 將專家系統(tǒng)給出的學習解決方案輸入給搜索機;搜索機根據(jù)學習方案中的 關(guān)鍵字輪流到基礎(chǔ)語料庫中進行搜索,搜索機將多次搜索的結(jié)果進行分類合并, 組成最終的學習語料。一種智能發(fā)音學習語料生成方法,所述步驟(1)專家知識庫的知識來源也 包括從大量發(fā)音樣本發(fā)音錯誤規(guī)律的結(jié)果中總結(jié)統(tǒng)計出來的知識。一種智能發(fā)音學習語料生成方法,所述步驟(1)所述知識庫組織形式采用 多庫結(jié)構(gòu)的組織模式,包括數(shù)據(jù)庫、事實庫和規(guī)則庫。一種智能發(fā)音學習語料生成方法,所述的規(guī)則庫包括有診斷規(guī)則庫和元規(guī)則庫。一種智能發(fā)音學習語料生成方法,步驟(1)所述發(fā)音缺陷數(shù)據(jù)可以用謂詞 邏輯表示為謂詞名"對象,類型,等級"。一種智能發(fā)音學習語料生成方法,所述步驟(1)的事實為用模糊謂詞描述 含有模糊信息的事實,模糊謂詞邏輯用四元組表示為謂詞名"對象,屬性,模 糊值,隸屬度"。一種智能發(fā)音學習語料生成方法,所述步驟(1)的診斷型知識采用產(chǎn)生式 規(guī)則表示,最初形式為IF "前提"THEN "結(jié)論"。一種智能發(fā)音學習語料生成方法,所述步驟(2)中先對搜集到的原始語料 進行對比篩選出信息熵最大的語料,然后對語料進行領(lǐng)域分類,再對語料進行音 標或拼音的標注和詞語邊界、句子邊界進行標定,然后以音標或拼音、音標串或 拼音串、字、詞為關(guān)鍵字進行分級索引而形成基礎(chǔ)語料庫。一種智能發(fā)音學習語料生成方法,所述步驟(2)中每個語料內(nèi)部根據(jù)使用 頻率進一分為若干等級,所述每一條語料的格式存儲可以為對象,屬性,類型,等級,范圍。一種智能發(fā)音學習語料生成方法,所述步驟(3)中所述學習者獲得自己發(fā) 音問題情況的渠道,包括自我總結(jié)、由語音專家對其發(fā)音情況進行診斷和由計算 機智能語音評測系統(tǒng)進行診斷。一種智能發(fā)音學習語料生成方法,所述步驟(5)中搜索機搜索的同時考慮 用戶的附加條件選項。本發(fā)明具體根據(jù)發(fā)音學習者的發(fā)音問題情況,綜合運用基于發(fā)音混淆的專家 知識、語料分析技術(shù)、以及文本搜索技術(shù)自動生成有很強的針對性的發(fā)音學習語 料,從而提高發(fā)音學習者學習發(fā)音的效率和效果。由于針對被學習者自身的發(fā)音 缺陷生成最優(yōu)的解決方案,學習更有針對性,使得學習的效果和效率有了明顯的 提升。學習系統(tǒng)的普適性增強。由于引入了專家系統(tǒng),可針對不同的學習類型進 行定制;同時,本發(fā)明框架可針對不同語種構(gòu)建相應(yīng)的語料生成系統(tǒng),可以迅速 的進行不同語種的切換,從而使得系統(tǒng)的普適性增強。
具體實施方式
本發(fā)明實現(xiàn)的具體方法如下 1、專家知識庫的獲取和表示專家知識獲取和表示語音教學所需要的專業(yè)知識基礎(chǔ)可以從專業(yè)著作、相 關(guān)資料中得到,以及同長期從事該專業(yè)領(lǐng)域的專家們對話、從專家們以往處理問 題的實例中抽取專家知識選擇合適的形式把整理好的專家知識存入知識庫中。專家系統(tǒng)的構(gòu)建基于專家知識庫中分類好的各個方案例子,在統(tǒng)計分析基 礎(chǔ)上引入人工智能,構(gòu)建形成專家系統(tǒng),實現(xiàn)輸入案例到發(fā)音練習語料搜索條件 的自動決策系統(tǒng);專家系統(tǒng)的知識分為發(fā)音缺陷參數(shù)數(shù)據(jù)、事實、診斷型知識和 元知識4類。發(fā)音缺陷數(shù)據(jù)可以用謂詞邏輯表示為謂詞名(對象,類型,等級), 對象指發(fā)音的音素,如"n, uo"等,類型只發(fā)音的缺陷類型,如"錯誤"、"缺 陷"等,等級指缺陷類型的等級,定位5級,用"1, 2, 3, 4, 5"表示。事實 為用模糊謂詞描述含有模糊信息的事實,模糊謂詞邏輯用四元組表示為謂詞名 (對象,屬性,模糊值,隸屬度)。診斷型知識采用產(chǎn)生式規(guī)則表示,最初形式 為IF規(guī)則條件部分(條件l,條件2,,條件n) THEN結(jié)論。元知識是關(guān)于知 識的知識,在產(chǎn)生式系統(tǒng)中,它一般采用與目標層次知識相同的表示形式,并作 為一個知識實體與目標層次知識共存于知識庫中。(1)元級推理與目標層次推理 可共享一個推理機;(2)當元規(guī)則與目標規(guī)則由當前數(shù)據(jù)庫內(nèi)容確定為可用規(guī)則 時,將優(yōu)先執(zhí)行元規(guī)則;(3)當系統(tǒng)分設(shè)目標層次規(guī)則庫和元級規(guī)則庫,系統(tǒng) 還將增加一個調(diào)度程序;(4)當有多個目標規(guī)則可用時,由調(diào)度程序根據(jù)元級規(guī) 則與可用目標規(guī)則沖突集的匹配情況,從中選擇一條可用規(guī)則執(zhí)行。專家知識庫組織形式知識庫采用多庫結(jié)構(gòu)的組織模式,包括數(shù)據(jù)庫、事實 庫和規(guī)則庫。這樣可以提高系統(tǒng)工作效率,也便于知識的搜索。各庫之間相互獨 立, 一個庫的修改不會影響其它庫。 2、學習語料生成器的搭建語料庫的建設(shè)根據(jù)不同學習需要構(gòu)建不同內(nèi)容的語料數(shù)據(jù)庫,如PSC, HSK 等。每個語料內(nèi)部根據(jù)使用頻率進一分為若干等級。每一條語料可以按照這種格 式存儲(對象,屬性,類型,等級,范圍)如,單字"我"可以存儲為(我, wo3,單字, 一級,PSC)。3、用戶按照以下步驟使用該系統(tǒng)1) 學習者通過各種渠道獲得自己的發(fā)音問題情況,包括自我總結(jié)、由語音專家對其發(fā)音情況進行診斷、由計算機智能語音評測系統(tǒng)進行診斷;學習 者將自己的發(fā)音問題情況輸入系統(tǒng);2) 學習者根據(jù)自己的情況選擇需要生成的語料的領(lǐng)域、類型、規(guī)模、和對 其發(fā)音問題的覆蓋率;學習者也可以不做任何選擇,使用系統(tǒng)的默認選項;3)系統(tǒng)將學習者輸入的發(fā)音問題情況輸入給基于發(fā)音混淆知識的專家系 統(tǒng),專家系統(tǒng)根據(jù)其情況生成針對該發(fā)音問題情況的學習方案;該方案對 其發(fā)音情況進行分類和擴充,基本涵蓋學習者的發(fā)音問題和與發(fā)音問題相 關(guān)聯(lián)的易混淆發(fā)音;4) 系統(tǒng)將專家系統(tǒng)給出的學習方案輸入給搜索機;5) 搜索機根據(jù)學習方案中的關(guān)鍵字輪流到基礎(chǔ)發(fā)音學習語料庫中進行 搜索,搜索的同時考慮用戶的附加條件選項;6) 搜索機將多次搜索的結(jié)果進行分類合并,組成最終的學習語料;7) 學習者從系統(tǒng)得到跟其發(fā)音問題密切相關(guān)的發(fā)音學習語料,學習者可以 使用該語料進行強化學習,其學習方式可以是自己朗讀、讓語音專家?guī)ёx 并診斷、使用計算機智能診斷系統(tǒng)進行帶讀和診斷;8) —個學習內(nèi)容完成后,用戶可以獲得發(fā)音水平改進后的發(fā)音問題情況。 專家系統(tǒng)和搜索機是本系統(tǒng)的核心所在,合理的專家系統(tǒng)和高校的搜索機可以大大提升語料生成系統(tǒng)的科學性、有效性,同時使椿本系統(tǒng)對于不同語種和方 言區(qū)可以做到迅速的改進從而適應(yīng)具體情況,大大提升了系統(tǒng)的普適性。
權(quán)利要求
1、一種智能發(fā)音學習語料生成方法,其特征在于生成方法包括以下步驟(1)專家知識庫和專家系統(tǒng)的構(gòu)建和分類從專家們以往處理發(fā)音問題的眾多實例中選取專家處理眾多發(fā)音問題的方案,將眾多的處理方案知識以合適的組織形式存入知識庫中,從而構(gòu)建了專家知識庫;專家知識庫的知識分為發(fā)音缺陷參數(shù)數(shù)據(jù)、事實、診斷型知識和元知識4類;專家系統(tǒng)的構(gòu)建基于專家知識庫中分類好的各個方案例子,在統(tǒng)計分析基礎(chǔ)上引入人工智能,構(gòu)建形成專家系統(tǒng),實現(xiàn)輸入案例到發(fā)音練習語料搜索條件的自動決策系統(tǒng);(2)基礎(chǔ)語料庫和搜索機的構(gòu)建根據(jù)已有的系統(tǒng)化的發(fā)音訓練語料和從互聯(lián)網(wǎng)上搜尋并篩選的語料由計算機處理并構(gòu)建;根據(jù)不同學習需要構(gòu)建不同內(nèi)容的基礎(chǔ)語料數(shù)據(jù)庫,每一條語料可以按照這種格式存儲對象,屬性,類型;搜索機的構(gòu)建對基礎(chǔ)語料庫進行倒排序索引,獲得從任意長度關(guān)鍵字到目標語料的索引;建立可并行計算的快速搜索算法,可以從關(guān)鍵字或關(guān)鍵字組合快速搜索到相對應(yīng)的語料文本;(3)學習者通過各種渠道獲得自己的發(fā)音問題情況,學習者將自己的發(fā)音問題情況輸入專家系統(tǒng);(4)專家系統(tǒng)根據(jù)其情況生成針對該發(fā)音問題情況的學習解決方案;該方案對其發(fā)音情況進行分類和擴充,基本涵蓋學習者的發(fā)音問題和與發(fā)音問題相關(guān)聯(lián)的易混淆發(fā)音;(5)將專家系統(tǒng)給出的學習解決方案輸入給搜索機;搜索機根據(jù)學習方案中的關(guān)鍵字輪流到基礎(chǔ)語料庫中進行搜索,搜索機將多次搜索的結(jié)果進行分類合并,組成最終的學習語料。
2、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(1)專家知識庫的知識來源也包括從大量發(fā)音樣本發(fā)音錯誤規(guī)律的結(jié)果中總 結(jié)統(tǒng)計出來的知識。
3、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(1)所述知識庫組織形式采用多庫結(jié)構(gòu)的組織模式,包括數(shù)據(jù)庫、事實庫和 規(guī)則庫。
4、 根據(jù)權(quán)利要求3所述的一種智能發(fā)音學習語料生成方法,其特征在于所述的規(guī)則庫包括有診斷規(guī)則庫和元規(guī)則庫。
5、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于步驟(l)所述發(fā)音缺陷數(shù)據(jù)可以用謂詞邏輯表示為謂詞名"對象,類型,等級"。
6、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(1)的事實為用模糊謂詞描述含有模糊信息的事實,模糊謂詞邏輯用四元組 表示為謂詞名"對象,屬性,模糊值,隸屬度"。
7、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(1)的診斷型知識采用產(chǎn)生式規(guī)則表示,最初形式為IF "前提"T服N "結(jié) 論"。
8、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(2)中先對搜集到的原始語料進行對比篩選出信息熵最大的語料,然后對語 料進行領(lǐng)域分類,再對語料進行音標或拼音的標注和詞語邊界、句子邊界迸行標 定,然后以音標或拼音、音標串或拼音串、字、詞為關(guān)鍵字進行分級索引而形成 基礎(chǔ)語料庫。
9、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(2)中每個語料內(nèi)部根據(jù)使用頻率進一分為若干等級,所述每一條語料的格 式存儲可以為對象,屬性,類型,等級,范圍。
10、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(3)中所述學習者獲得自己發(fā)音問題情況的渠道,包括自我總結(jié)、由語音專 家對其發(fā)音情況進行診斷和由計算機智能語音評測系統(tǒng)進行診斷。
11、 根據(jù)權(quán)利要求1所述的一種智能發(fā)音學習語料生成方法,其特征在于所述步 驟(5)中搜索機搜索的同時考慮用戶的附加條件選項。
全文摘要
本發(fā)明涉及一種智能發(fā)音學習語料生成方法,包括有專家知識庫構(gòu)建、專家系統(tǒng)構(gòu)建、基礎(chǔ)語料庫構(gòu)建和搜索機的構(gòu)建,綜合運用基于發(fā)音混淆的專家知識、語料分析技術(shù)、以及文本搜索技術(shù)自動生成有很強的針對性的發(fā)音學習語料,從而提高發(fā)音學習者學習發(fā)音的效率和效果。由于針對被學習者自身的發(fā)音缺陷生成最優(yōu)的解決方案,學習更有針對性,使得學習的效果和效率有了明顯的提升。學習系統(tǒng)的普適性增強。
文檔編號G06F17/30GK101236615SQ200810019528
公開日2008年8月6日 申請日期2008年1月22日 優(yōu)先權(quán)日2008年1月22日
發(fā)明者峻 嚴, 劉慶峰, 吳曉如, 易中華, 王仁華, 胡國平 申請人:安徽科大訊飛信息科技股份有限公司