本發(fā)明涉及多功能呼叫分機(jī),屬于醫(yī)療設(shè)備領(lǐng)域。
背景技術(shù):
:呼叫分機(jī)主要配合護(hù)士站主機(jī)使用,與主機(jī)之間對(duì)講通訊。由于醫(yī)院的床位較多,網(wǎng)絡(luò)帶寬無(wú)法滿足多分機(jī)同時(shí)通訊的要求?,F(xiàn)有技術(shù)中沒(méi)有提供一種解決方案用于對(duì)呼叫分機(jī)的傳輸數(shù)據(jù)進(jìn)行篩檢、壓縮以降低對(duì)帶寬的需求。技術(shù)實(shí)現(xiàn)要素:為將降低呼叫分機(jī)對(duì)帶寬的需求,本發(fā)明提出了一種多功能呼叫分機(jī)。本發(fā)明技術(shù)方案如下:多功能呼叫分機(jī),包括主控芯片,還包括各自分別與主控芯片相連接的麥克風(fēng)、揚(yáng)聲器以及接收模塊,所述主控芯片還通過(guò)一級(jí)緩存連接有判別模塊,所述判別模塊通過(guò)二級(jí)緩存連接有發(fā)送模塊;所述判別模塊基于FPGA芯片,所述FPGA芯片內(nèi)搭建有用于判別無(wú)效語(yǔ)音數(shù)據(jù)片段的BP神經(jīng)網(wǎng)絡(luò),所述BP神經(jīng)網(wǎng)絡(luò)判別無(wú)效語(yǔ)音數(shù)據(jù)片段的方法步驟為:(A)主控芯片將麥克風(fēng)收錄的語(yǔ)音轉(zhuǎn)化為語(yǔ)音數(shù)據(jù),將該語(yǔ)音數(shù)據(jù)中50Hz以下及1200Hz以上的頻段全部濾除,再將濾除后的語(yǔ)音數(shù)據(jù)以3s為單位分割為語(yǔ)音數(shù)據(jù)序列并將該語(yǔ)音數(shù)據(jù)序列存放在一級(jí)緩存中;主控芯片從一級(jí)緩存中依次讀取語(yǔ)音數(shù)據(jù)序列中的元素,分別作如下處理:(A-1)記該元素的整體平均分貝值為x1,、整體碼率為x2;(A-2)對(duì)該元素進(jìn)行頻域分析,以50Hz為起點(diǎn),計(jì)算每過(guò)50Hz分貝值的變化率,記錄第一個(gè)變化率大于0.1dB/Hz的頻率值為x3、第一個(gè)變化率小于-0.1dB/Hz的頻率值為x4;若未找到符合條件的x3,則將x3設(shè)定為50Hz,若未找到符合條件的x4,則將x4設(shè)定為1200Hz;(A-3)計(jì)算x3至x4頻段的平均分貝值為x5;(A-4)將x1、x2、x3、x4和x5作為一組輸入數(shù)據(jù)存儲(chǔ)至一級(jí)緩存中;(B)將一級(jí)緩存中的各組輸入數(shù)據(jù)依次傳送至判別模塊的BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行判別;該BP神經(jīng)網(wǎng)絡(luò)沿輸入至輸出方向依次設(shè)置有輸入層、預(yù)處理層、中間層和輸出層;所述輸入層包括用于輸入x1的輸入單元一、用于輸入x2的輸入單元二、用于輸入x3的輸入單元三、用于輸入x4的輸入單元四和用于輸入x5的輸入單元五;所述預(yù)處理層包括預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四;所述中間層包括中間單元一、中間單元二和中間單元三;所述輸出層包括輸出單元;所述輸入層、預(yù)處理層、中間層和輸出層分別為BP神經(jīng)網(wǎng)絡(luò)的第1層、第2層、第3層和第4層;所述輸入單元一、輸入單元二、輸入單元三、輸入單元四和輸入單元五分別為第1層的第1單元、第2單元、第3單元、第4單元和第5單元;所述預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四分別為第2層的第1單元、第2單元、第3單元和第4單元;所述中間單元一、中間單元二和中間單元三分別為第3層的第1單元、第2單元和第3單元;所述輸出單元為第4層的第1單元;設(shè)第l層第i單元的輸出值為偏置項(xiàng)為激活函數(shù)為fi(l)(),第l層的單元總數(shù)為n(l),第l層第j單元的輸出值傳遞至第l+1層第i單元時(shí)的權(quán)值為則對(duì)于第1層:對(duì)于第2至4層:設(shè)和恒為0;BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸入的數(shù)據(jù)判斷出該元素是否為無(wú)效語(yǔ)音數(shù)據(jù)片段,若為無(wú)效語(yǔ)音數(shù)據(jù)片段則將該元素替換為空白音數(shù)據(jù);(C)判別模塊將替換處理過(guò)的語(yǔ)音數(shù)據(jù)序列傳送至二級(jí)緩存中。進(jìn)一步地:所述預(yù)處理層各單元的激活函數(shù)為:fi(l)(x)=e3x+3x3-1e2x+1-x,x≥0sin(x5),x<0.]]>進(jìn)一步地:所述中間層和輸出層各單元的激活函數(shù)為:fi(l)(x)=max(0,x-0.2)。進(jìn)一步地,BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法為:在背景噪聲頻率為20Hz、80Hz、150Hz、200Hz、360Hz、500Hz、750Hz、1000Hz、1500Hz、2000Hz且各自均無(wú)人聲的環(huán)境中分別錄制100條時(shí)長(zhǎng)30s的無(wú)效樣本語(yǔ)音數(shù)據(jù),并在背景噪聲頻率為20Hz、80Hz、150Hz、200Hz、360Hz、500Hz、750Hz、1000Hz、1500Hz、2000Hz且各自均具有人聲的環(huán)境中分別錄制100條時(shí)長(zhǎng)30s的有效樣本語(yǔ)音數(shù)據(jù);將2000條樣本語(yǔ)音數(shù)據(jù)各自分別以3s為單位分割為語(yǔ)音數(shù)據(jù)序列,將所有語(yǔ)音數(shù)據(jù)序列的20000個(gè)元素進(jìn)行亂序排列構(gòu)成樣本序列,依次讀取樣本序列中的元素:對(duì)于每一元素,記該元素的整體平均分貝值為x1,、整體碼率為x2,對(duì)該元素進(jìn)行頻域分析,以50Hz為起點(diǎn),計(jì)算每過(guò)50Hz分貝值的變化率,記錄第一個(gè)變化率大于0.1dB/Hz的頻率值為x3、第一個(gè)變化率小于-0.1dB/Hz的頻率值為x4,若未找到符合條件的x3,則將x3設(shè)定為50Hz,若未找到符合條件的x4,則將x4設(shè)定為1200Hz,計(jì)算x3至x4頻段的平均分貝數(shù)為x5,將x1、x2、x3、x4和x5作為一組訓(xùn)練樣本輸入數(shù)據(jù);將20000組訓(xùn)練樣本輸入數(shù)據(jù)結(jié)合各元素原所對(duì)應(yīng)的有效/無(wú)效期待結(jié)果對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練時(shí)保持和恒為0。進(jìn)一步地:所述主控芯片還連接有FM模塊。進(jìn)一步地:所述主控芯片還連接有顯示屏。進(jìn)一步地:所述主控芯片還連接有存儲(chǔ)模塊。相對(duì)于現(xiàn)有技術(shù),本發(fā)明具有以下優(yōu)點(diǎn):(1)本發(fā)明具有基于FPGA的判別模塊,能夠利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)算法根據(jù)語(yǔ)音數(shù)據(jù)片段的特征信息判別出是否為人聲內(nèi)容空白的無(wú)效語(yǔ)音數(shù)據(jù)片段,并將無(wú)效語(yǔ)音數(shù)據(jù)片段替換為空白音數(shù)據(jù),壓縮了傳輸語(yǔ)音數(shù)據(jù)的大小,降低了呼叫分機(jī)對(duì)帶寬的需求;(2)本檢測(cè)方法利用神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行判別,具有非線性逼近能力強(qiáng)、判斷效率高和準(zhǔn)確率高的優(yōu)點(diǎn);(3)神經(jīng)網(wǎng)絡(luò)中引入了預(yù)處理層,由于每個(gè)人的人聲頻率范圍較為集中,因此預(yù)處理層中對(duì)部分權(quán)數(shù)進(jìn)行了強(qiáng)制設(shè)定,并將第一個(gè)變化率大于0.1dB/Hz的頻率值x3和第一個(gè)變化率小于-0.1dB/Hz的頻率值x4這兩種相關(guān)性較明顯但又無(wú)法完全合并的特征信息進(jìn)行了非完全性的合并處理,然后再將預(yù)處理層的結(jié)果輸出到中間層中,保證了后續(xù)的計(jì)算過(guò)程中x3和x4始終保有一定的相關(guān)性,從而提高了判斷結(jié)果的準(zhǔn)確性,同時(shí)也提高了訓(xùn)練的效率;(4)預(yù)處理層的激活函數(shù)設(shè)定充分考慮了x3和x4兩個(gè)特征信息非完全性合并處理在計(jì)算效率、微分求解難度和相關(guān)性保留方面的要求,具有求解、訓(xùn)練效率高和判斷準(zhǔn)確性高的優(yōu)點(diǎn)。附圖說(shuō)明圖1為本發(fā)明所提出的多功能呼叫分機(jī)的結(jié)構(gòu)示意圖。圖2為BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的技術(shù)方案:如圖1,多功能呼叫分機(jī),包括主控芯片,還包括各自分別與主控芯片相連接的麥克風(fēng)、揚(yáng)聲器以及接收模塊,所述主控芯片還通過(guò)一級(jí)緩存連接有判別模塊,所述判別模塊通過(guò)二級(jí)緩存連接有發(fā)送模塊;所述主控芯片還連接有FM模塊、液晶顯示屏和存儲(chǔ)模塊,所述存儲(chǔ)模塊可以是內(nèi)置存儲(chǔ)芯片也可以是通過(guò)USB接口接入本呼叫分機(jī)的優(yōu)盤裝置。病人可通過(guò)本呼叫分機(jī)與主機(jī)通訊,還可以通過(guò)揚(yáng)聲器收聽(tīng)FM廣播,或欣賞存儲(chǔ)模塊中的音樂(lè)。液晶顯示屏還可顯示病人的姓名、年齡等相關(guān)信息。所述判別模塊基于FPGA芯片,所述FPGA芯片內(nèi)搭建有用于判別無(wú)效語(yǔ)音數(shù)據(jù)片段的BP神經(jīng)網(wǎng)絡(luò),所述BP神經(jīng)網(wǎng)絡(luò)判別無(wú)效語(yǔ)音數(shù)據(jù)片段的方法步驟為:(A)主控芯片將麥克風(fēng)收錄的語(yǔ)音轉(zhuǎn)化為語(yǔ)音數(shù)據(jù),考慮到人聲頻率范圍為65至1100Hz,將該語(yǔ)音數(shù)據(jù)中50Hz以下及1200Hz以上的頻段全部濾除,再將濾除后的語(yǔ)音數(shù)據(jù)以3s為單位分割為語(yǔ)音數(shù)據(jù)序列并將該語(yǔ)音數(shù)據(jù)序列存放在一級(jí)緩存中;主控芯片從一級(jí)緩存中依次讀取語(yǔ)音數(shù)據(jù)序列中的元素,分別作如下處理:(A-1)記該元素的整體平均分貝值為x1,、整體碼率為x2;(A-2)對(duì)該元素進(jìn)行頻域分析,以50Hz為起點(diǎn),計(jì)算每過(guò)50Hz分貝值的變化率,記錄第一個(gè)變化率大于0.1dB/Hz的頻率值為x3、第一個(gè)變化率小于-0.1dB/Hz的頻率值為x4;若未找到符合條件的x3,則將x3設(shè)定為50Hz,若未找到符合條件的x4,則將x4設(shè)定為1200Hz;(A-3)計(jì)算x3至x4頻段的平均分貝值為x5;(A-4)將x1、x2、x3、x4和x5作為一組輸入數(shù)據(jù)存儲(chǔ)至一級(jí)緩存中;(B)將一級(jí)緩存中的各組輸入數(shù)據(jù)依次傳送至判別模塊的BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行判別;該BP神經(jīng)網(wǎng)絡(luò)沿輸入至輸出方向依次設(shè)置有輸入層、預(yù)處理層、中間層和輸出層;所述輸入層包括用于輸入x1的輸入單元一、用于輸入x2的輸入單元二、用于輸入x3的輸入單元三、用于輸入x4的輸入單元四和用于輸入x5的輸入單元五;所述預(yù)處理層包括預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四;所述中間層包括中間單元一、中間單元二和中間單元三;所述輸出層包括輸出單元;所述輸入層、預(yù)處理層、中間層和輸出層分別為BP神經(jīng)網(wǎng)絡(luò)的第1層、第2層、第3層和第4層;所述輸入單元一、輸入單元二、輸入單元三、輸入單元四和輸入單元五分別為第1層的第1單元、第2單元、第3單元、第4單元和第5單元;所述預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四分別為第2層的第1單元、第2單元、第3單元和第4單元;所述中間單元一、中間單元二和中間單元三分別為第3層的第1單元、第2單元和第3單元;所述輸出單元為第4層的第1單元;設(shè)第l層第i單元的輸出值為偏置項(xiàng)為激活函數(shù)為fi(l)(),第l層的單元總數(shù)為n(l),第l層第j單元的輸出值傳遞至第l+1層第i單元時(shí)的權(quán)值為則對(duì)于第1層:對(duì)于第2至4層:設(shè)和恒為0,此設(shè)置的原因是:每個(gè)人的人聲頻率范圍通常較為集中,即x3與x4差值不會(huì)過(guò)大,因此預(yù)處理層中對(duì)部分權(quán)數(shù)進(jìn)行了強(qiáng)制設(shè)定,并將x3和x4這兩種相關(guān)性較明顯但又無(wú)法完全合并的特征信息進(jìn)行了非完全性的合并處理,然后再將預(yù)處理層的結(jié)果輸出到中間層中,保證了后續(xù)的計(jì)算過(guò)程中x3和x4始終保有一定的相關(guān)性,從而提高了判斷結(jié)果的準(zhǔn)確性,同時(shí)也提高了訓(xùn)練的效率;BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸入的數(shù)據(jù)判斷出該元素是否為無(wú)效語(yǔ)音數(shù)據(jù)片段,若為無(wú)效語(yǔ)音數(shù)據(jù)片段則將該元素替換為空白音數(shù)據(jù);(C)判別模塊將替換處理過(guò)的語(yǔ)音數(shù)據(jù)序列傳送至二級(jí)緩存中。所述預(yù)處理層各單元的激活函數(shù)為:fi(l)(x)=e3x+3x3-1e2x+1-x,x≥0sin(x5),x<0.]]>該激活函數(shù)的設(shè)定充分考慮了x3和x4兩個(gè)特征信息非完全性合并處理后在計(jì)算效率、微分求解難度和相關(guān)性保留方面的要求,具有求解、訓(xùn)練效率高和判斷準(zhǔn)確性高的優(yōu)點(diǎn);所述中間層和輸出層各單元的激活函數(shù)為:fi(l)(x)=max(0,x-0.2)。該BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法為:在背景噪聲頻率為20Hz、80Hz、150Hz、200Hz、360Hz、500Hz、750Hz、1000Hz、1500Hz、2000Hz且各自均無(wú)人聲的環(huán)境中分別錄制100條時(shí)長(zhǎng)30s的無(wú)效樣本語(yǔ)音數(shù)據(jù),并在背景噪聲頻率為20Hz、80Hz、150Hz、200Hz、360Hz、500Hz、750Hz、1000Hz、1500Hz、2000Hz且各自均具有人聲的環(huán)境中分別錄制100條時(shí)長(zhǎng)30s的有效樣本語(yǔ)音數(shù)據(jù);取樣時(shí),應(yīng)盡可能的選擇不同的環(huán)境,并安排聲線相互不同的人員參與人聲的錄制;將2000條樣本語(yǔ)音數(shù)據(jù)各自分別以3s為單位分割為語(yǔ)音數(shù)據(jù)序列,將所有語(yǔ)音數(shù)據(jù)序列的20000個(gè)元素進(jìn)行亂序排列構(gòu)成樣本序列,依次讀取樣本序列中的元素:對(duì)于每一元素,記該元素的整體平均分貝值為x1,、整體碼率為x2,對(duì)該元素進(jìn)行頻域分析,以50Hz為起點(diǎn),計(jì)算每過(guò)50Hz分貝值的變化率,記錄第一個(gè)變化率大于0.1dB/Hz的頻率值為x3、第一個(gè)變化率小于-0.1dB/Hz的頻率值為x4,若未找到符合條件的x3,則將x3設(shè)定為50Hz,若未找到符合條件的x4,則將x4設(shè)定為1200Hz,計(jì)算x3至x4頻段的平均分貝數(shù)為x5,將x1、x2、x3、x4和x5作為一組訓(xùn)練樣本輸入數(shù)據(jù);將20000組訓(xùn)練樣本輸入數(shù)據(jù)結(jié)合各元素原所對(duì)應(yīng)的有效/無(wú)效期待結(jié)果對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練時(shí)保持和恒為0。病人由于健康狀況等原因,在通訊時(shí)常出現(xiàn)階段性的聲音停歇,因而傳輸?shù)恼Z(yǔ)音數(shù)據(jù)體積較大,占用了相當(dāng)部分的帶寬。為了將語(yǔ)音數(shù)據(jù)中人聲內(nèi)容為空白的片段去除,以減小對(duì)帶寬的需求,本方案通過(guò)使用判別模塊,根據(jù)語(yǔ)音數(shù)據(jù)片段的特征信息判別出無(wú)效語(yǔ)音數(shù)據(jù)片段,而后將無(wú)效語(yǔ)音數(shù)據(jù)片段替換為體積極小的空白音數(shù)據(jù)后再由二級(jí)緩存通過(guò)發(fā)送模塊傳輸至主機(jī),壓縮了傳輸語(yǔ)音數(shù)據(jù)的大小,降低了呼叫分機(jī)對(duì)帶寬的需求。當(dāng)前第1頁(yè)1 2 3