本發(fā)明涉及言語測聽和聽力損失程度評估,具體涉及一種基于漢語特點數(shù)字三聯(lián)音測試庫的設(shè)計及其使用方法。
背景技術(shù):
1、miller等(1951)發(fā)現(xiàn)在所有語音材料中,數(shù)字內(nèi)容的語音最容易被辨認,于是提出把數(shù)字作為測試材料用來探討語境對言語清晰度的影響。2004年smits等在miller等(1951)研究下,首次研發(fā)出基于固定電話的荷蘭語數(shù)字三聯(lián)音測試并進行了驗證,確立了數(shù)字三聯(lián)音測試(digit?triplets?test,dtt)的測試流程和測試規(guī)范。在過去的十年中,包括美國、英國、澳大利亞、德國、波蘭、瑞士和法國在內(nèi)的多個國家都先后開發(fā)了基于固定電話、互聯(lián)網(wǎng)、手機app的數(shù)字三聯(lián)音測試。在我國,首都醫(yī)科大學(xué)附屬北京同仁醫(yī)院于2012年率先與英國南安普頓大學(xué)合作,開展數(shù)字三聯(lián)音中文測試材料錄制、正常值收集等研究。近年來,從事言語測聽領(lǐng)域的研究者們也陸續(xù)在老年性聾患者、感音神經(jīng)性聽力損失患者等進行應(yīng)用探索,還開發(fā)了寧波方言版等多套dtt測聽詞表。
2、數(shù)字三聯(lián)音測試方法是基于言語識別閾來評價受試者聽力情況的方法,數(shù)字三聯(lián)音庫設(shè)計流程以及問題如下:
3、(1)在數(shù)字選擇步驟中:由于現(xiàn)有數(shù)字三聯(lián)音測試方法從國外引入國內(nèi),延續(xù)國外的數(shù)字選擇習(xí)慣,選擇語言中0-9發(fā)音為單音節(jié)的數(shù)字作為材料,不符合漢語數(shù)字發(fā)音特點,僅僅以音節(jié)數(shù)統(tǒng)一為標準,較為容易混淆聽錯,從而導(dǎo)致影響測試精準度;
4、(2)在組合形成三聯(lián)音庫步驟中:僅要求每個數(shù)字在三聯(lián)音的每個位置出現(xiàn)的頻率盡可能相等,同時每個三聯(lián)音中沒有重復(fù)的數(shù)字,從而進行優(yōu)化得到單音節(jié)數(shù)字組合成三聯(lián)音詞庫,由于組合成三聯(lián)音詞庫時沒有考慮數(shù)字聲學(xué)頻域范圍,導(dǎo)致選取的三聯(lián)音數(shù)字包含的音位有概率不能覆蓋言語聲主要頻率范圍(500-4000hz),并且三聯(lián)音詞庫也沒有考慮聲韻調(diào)均衡,聲韻調(diào)的差異會引起聽辨誤差,影響測試精準度。
5、由于現(xiàn)有數(shù)字三聯(lián)音設(shè)計流程造成的誤差,最終導(dǎo)致使用數(shù)字三聯(lián)音庫的數(shù)字三聯(lián)音測試方法測試結(jié)果誤差較大。
技術(shù)實現(xiàn)思路
1、本發(fā)明需要解決的技術(shù)問題是:由于現(xiàn)有技術(shù)缺乏對數(shù)字發(fā)音的混淆性(聽感)、頻率覆蓋性(聲學(xué))以及聲韻調(diào)的均衡性(音系)三方面的考慮,導(dǎo)致用于測試的三聯(lián)音庫不能覆蓋言語聲主要頻率范圍(500-4000hz),混淆和聲韻調(diào)的差異還會引起聽辨誤差,使得建立的數(shù)字三聯(lián)音庫誤差較大,最終降低測試結(jié)果的可信度。
2、為了解決上述技術(shù)問題,本發(fā)明的技術(shù)方案提供了一種基于漢語特點數(shù)字三聯(lián)音測試庫的設(shè)計方法,包括以下步驟:
3、獲取標準化數(shù)字測聽材料,由多名受試者進行數(shù)字辨認實驗,根據(jù)實驗結(jié)果得到混淆矩陣p;
4、根據(jù)相似性估值公式,對混淆矩陣p內(nèi)的數(shù)據(jù)計算相似性估值p′ij,結(jié)合感知距離公式,計算數(shù)字間的感知距離dij,確定較為容易混淆數(shù)字組,并根據(jù)發(fā)音中聲母、韻母數(shù)量,保留數(shù)字組中的部分數(shù)字,根據(jù)剔除的數(shù)字數(shù)量、連續(xù)性以及聲調(diào),補充相對應(yīng)的數(shù)字,確定測聽材料;
5、對測聽材料進行同質(zhì)性優(yōu)化測試,其中,對測聽材料中各數(shù)字在不同言語強度下或不同信噪比下的平均言語識別率曲線進行保形插值,確定測聽材料中各數(shù)字均衡前的言語識別閾值及測聽材料中所有數(shù)字的平均言語識別閾值,并根據(jù)校正因子公式確定校正因子factor,根據(jù)校正因子對測聽材料進行校正,得到校正后的測聽材料;
6、將校正后的測聽材料進行隨機三三組合組成多個初始三聯(lián)音,分別計算單個初始三聯(lián)音中每個數(shù)字的聲母和韻母部分的頻率并進行整合形成每個數(shù)字的頻率范圍,根據(jù)預(yù)設(shè)言語聲頻率范圍,選取各初始三聯(lián)音中每個數(shù)字的頻率范圍總和平均值大于等于預(yù)設(shè)言語聲頻率范圍上界和下界總和均值的初始三聯(lián)音,按照預(yù)設(shè)評分規(guī)則進行評分并組成符合頻率覆蓋性三聯(lián)音庫;
7、根據(jù)每個數(shù)字測試的聲母、韻母和聲調(diào)建立數(shù)字聲韻調(diào)統(tǒng)計表,從符合頻率覆蓋性三聯(lián)音庫中剔除測試同一種聲母、同一種韻母和同一種聲調(diào)的三聯(lián)音,得到待優(yōu)化三聯(lián)音庫;
8、根據(jù)聲母、韻母和聲調(diào)使用頻率由頻率高至頻率低的順序依次降低分數(shù)進行賦分,生成普通話聲韻調(diào)動態(tài)使用頻率統(tǒng)計及對應(yīng)分數(shù)表,根據(jù)符合頻率覆蓋性三聯(lián)音庫的評分和普通話聲韻調(diào)動態(tài)使用頻率統(tǒng)計及對應(yīng)分數(shù)表,生成具有數(shù)字、拼音、音標、頻率、聲母使用頻率、韻母使用頻率和聲調(diào)使用頻率的屬性表;
9、根據(jù)屬性表確定待優(yōu)化三聯(lián)音庫中每個三聯(lián)音的總和得分,根據(jù)總和得分對待優(yōu)化三聯(lián)音庫進行排序,篩選預(yù)設(shè)數(shù)量的三聯(lián)音組成優(yōu)化后三聯(lián)音庫;
10、對優(yōu)化后三聯(lián)音庫進行遍歷,根據(jù)預(yù)設(shè)平衡數(shù)字頻率,結(jié)合三聯(lián)音總和得分,篩選出最終數(shù)字三聯(lián)音測試庫。
11、優(yōu)選地,所述相似性估值公式如下:
12、
13、其中,sij表示將i音聽成j音的概率。
14、優(yōu)選地,所述感知距離公式如下:
15、dij=-ln(sij)。
16、優(yōu)選地,所述校正因子公式如下:
17、
18、其中,srti表示測聽材料中各數(shù)字均衡前的言語識別閾值,表示測聽材料中所有數(shù)字的平均言語識別閾值。
19、優(yōu)選地,所述根據(jù)屬性表確定待優(yōu)化三聯(lián)音庫中每個三聯(lián)音的總和得分,包括以下步驟:
20、根據(jù)屬性表確定每個數(shù)字的所述頻率、聲母使用頻率、韻母使用頻率和聲調(diào)使用頻率,并計算待優(yōu)化三聯(lián)音庫中每個三聯(lián)音的不重復(fù)的聲母數(shù)量sn、韻母數(shù)量sf和聲調(diào)數(shù)量tn,得到每個三聯(lián)音的七維度屬性值;
21、對七維度屬性值進行最大值歸一化處理并計算總和,得到總和得分。
22、優(yōu)選地,所述預(yù)設(shè)言語聲頻率范圍為500-4000hz。
23、優(yōu)選地,所述預(yù)設(shè)數(shù)量為23組。
24、優(yōu)選地,所述預(yù)設(shè)平衡數(shù)字頻率為大于等于6且小于等于8。
25、本發(fā)明的技術(shù)方案還提供了一種基于漢語特點數(shù)字三聯(lián)音測試庫的使用方法,采用如上所述的一種基于漢語特點數(shù)字三聯(lián)音測試庫的設(shè)計方法建立的最終數(shù)字三聯(lián)音測試庫,包括以下步驟:
26、打亂最終數(shù)字三聯(lián)音測試庫中三聯(lián)音順序,并打亂三聯(lián)音中數(shù)字順序,得到打亂順序的多組三聯(lián)音;
27、測試時,首先根據(jù)第1組三聯(lián)音進行測試,判斷標準為當患者對三聯(lián)音中的全部3個數(shù)字均作出正確回答時,此時判定為回答正確;
28、若回答正確,則刺激聲強度降低預(yù)設(shè)值,繼續(xù)第2組三聯(lián)音進行測試,若回答錯誤,則刺激聲強度升高預(yù)設(shè)值,繼續(xù)第2組三聯(lián)音進行測試,直至將多組三聯(lián)音全部測試完畢;
29、根據(jù)測試強度的波動情況計算信噪比,得到最終聽力評價指標。
30、本發(fā)明技術(shù)方案提出一種基于漢語特點的數(shù)字三聯(lián)音測試庫的設(shè)計方法,通過計算數(shù)字與數(shù)字之間的相似性估值及其相對應(yīng)的感知距離,確定較為容易混淆數(shù)字組,根據(jù)發(fā)音中聲母、韻母數(shù)量,保留數(shù)字組中的部分數(shù)字,根據(jù)剔除的數(shù)字數(shù)量、連續(xù)性以及聲調(diào),補充相對應(yīng)的數(shù)字,確定測聽材料。
31、接著,對測聽材料進行同質(zhì)性優(yōu)化測試,通過對測聽材料中各數(shù)字在不同言語強度下或不同信噪比下的平均言語識別率曲線進行保形插值,確定測聽材料中各數(shù)字均衡前的言語識別閾值及測聽材料中所有數(shù)字的平均言語識別閾值,并根據(jù)校正因子公式確定校正因子以對測聽材料進行校正使語音材料均衡化。
32、然后,將校正后的測聽材料進行隨機三三組合組成多個初始三聯(lián)音,分別計算單個初始三聯(lián)音中每個數(shù)字的聲母和韻母部分的頻率并進行加權(quán)整合形成每個數(shù)字的頻率范圍,根據(jù)預(yù)設(shè)言語聲頻率范圍,選取各初始三聯(lián)音中每個數(shù)字的頻率范圍總和平均值大于等于預(yù)設(shè)言語聲頻率范圍上界和下界總和均值的初始三聯(lián)音,按照預(yù)設(shè)評分規(guī)則進行評分并組成符合頻率覆蓋性三聯(lián)音庫。根據(jù)每個數(shù)字測試的聲母、韻母和聲調(diào)建立數(shù)字聲韻調(diào)統(tǒng)計表,從符合頻率覆蓋性三聯(lián)音庫中剔除測試同一種聲母、同一種韻母和同一種聲調(diào)的三聯(lián)音,得到待優(yōu)化三聯(lián)音庫。根據(jù)聲母、韻母和聲調(diào)使用頻率由頻率高至頻率低的順序依次降低分數(shù)進行賦分,生成普通話聲韻調(diào)動態(tài)使用頻率統(tǒng)計及對應(yīng)分數(shù)表。根據(jù)符合頻率覆蓋性三聯(lián)音庫的評分和普通話聲韻調(diào)動態(tài)使用頻率統(tǒng)計及對應(yīng)分數(shù)表生成具有數(shù)字、拼音、音標、頻率、聲母頻率、韻母頻率和聲調(diào)的屬性表,根據(jù)屬性表確定待優(yōu)化三聯(lián)音庫中每個三聯(lián)音的總和得分,根據(jù)總和得分對待優(yōu)化三聯(lián)音庫進行排序,篩選預(yù)設(shè)數(shù)量的三聯(lián)音組成優(yōu)化后三聯(lián)音庫。
33、最后,對優(yōu)化后三聯(lián)音庫進行遍歷,根據(jù)預(yù)設(shè)平衡數(shù)字頻率,結(jié)合三聯(lián)音總和得分,篩選出最終數(shù)字三聯(lián)音測試庫。
34、該技術(shù)方案解決了由于現(xiàn)有技術(shù)缺乏對數(shù)字發(fā)音的混淆性(聽感)、頻率覆蓋性(聲學(xué))以及聲韻調(diào)的均衡性(音系)三方面的考慮,導(dǎo)致用于測試的三聯(lián)音庫不能覆蓋言語聲主要頻率范圍(500-4000hz),混淆和聲韻調(diào)的差異還會引起聽辨誤差,使得建立的數(shù)字三聯(lián)音庫誤差較大,最終降低測試結(jié)果的可信度的問題。