本公開涉及音頻數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種夢話提取方法、裝置及用于提取夢話的裝置。
背景技術(shù):
隨著智能設(shè)備的普及,智能設(shè)備上安裝的應(yīng)用(APP)越來越多,以提供越來越豐富的功能,更好滿足用戶需求。
相關(guān)技術(shù)中雖然已有很多種APP,但是,目前還缺乏對夢話提取的相關(guān)方案。
技術(shù)實(shí)現(xiàn)要素:
為克服相關(guān)技術(shù)中存在的問題,本公開提供一種夢話提取方法、裝置及用于提取夢話的裝置。
根據(jù)本公開實(shí)施例的第一方面,提供一種夢話提取方法,包括:響應(yīng)夢話提取功能的啟動指令;采集周圍的音頻信號;確定待記錄的音頻信號的門限值;當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
可選的,所述確定待記錄的音頻信號的門限值,包括:在采集的音頻信號中,獲取一段音頻信號,其中所述一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;根據(jù)所述獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值。
可選的,所述根據(jù)獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值,包括:將獲取的一段音頻信號的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
可選的,還包括:將記錄的音頻信號保存為音頻文件,且不同的音頻文件保存在不同的存儲區(qū)域中。
可選的,還包括:對不同存儲區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,所述將記錄的音頻信號保存為音頻文件,包括:對所述記錄的音頻信號進(jìn)行語音識別,將滿足所述語音識別的預(yù)設(shè)條件的記錄的音頻信號保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語音識別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語音識別結(jié)果中包含分詞。
可選的,所述將記錄的音頻信號保存為音頻文件,包括:對所述記錄的音頻信號進(jìn)行語音識別,根據(jù)語音識別結(jié)果對所述記錄的音頻信號進(jìn)行打分,根據(jù)記錄的音頻信號的分值從高到低的順序依次保存對應(yīng)的音頻文件。
根據(jù)本公開實(shí)施例的第二方面,提供一種夢話提取裝置,包括:響應(yīng)模塊,用于響應(yīng)夢話提取功能的啟動指令;采集模塊,用于采集周圍的音頻信號;確定模塊,用于確定待記錄的音頻信號的門限值;記錄模塊,用于當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
可選的,所述確定模塊包括:確定子模塊,用于在采集的音頻信號中,獲取一段音頻信號,其中所述一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;計(jì)算子模塊,用于根據(jù)所述獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值。
可選的,所述計(jì)算子模塊進(jìn)一步用于:將獲取的一段音頻信號的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
可選的,還包括:保存模塊,用于將記錄的音頻信號保存為音頻文件,且不同的音頻文件保存在不同的存儲區(qū)域中。
可選的,還包括:刪除模塊,用于對不同存儲區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,還包括:所述保存模塊進(jìn)一步用于:對所述記錄的音頻信號進(jìn)行語音識別,將滿足所述語音識別的預(yù)設(shè)條件的記錄的音頻信號保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語音識別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語音識別結(jié)果中包含分詞。
可選的,所述保存模塊進(jìn)一步用于:對所述記錄的音頻信號進(jìn)行語音識別,根據(jù)語音識別結(jié)果對所述記錄的音頻信號進(jìn)行打分,根據(jù)記錄的音頻信號的分值從高到低的順序依次保存對應(yīng)的音頻文件。
根據(jù)本公開實(shí)施例的第三方面,提供一種用于提取夢話的裝置,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為:響應(yīng)夢話提取功能的啟動指令;采集周圍的音頻信號;確定待記錄的音頻信號的門限值;當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集音頻信號的幅度值小于所述門限值時(shí),停止記錄。
可選的,所述確定待記錄的音頻信號的門限值,包括:在采集的音頻信號中,獲取一段音頻信號,其中所述一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;根據(jù)所述獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值。
可選的,所述根據(jù)獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值,包括:將獲取的一段音頻信號的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
可選的,還包括:將記錄的音頻信號保存為音頻文件,且不同的音頻文件保存在不同的存儲區(qū)域中。
可選的,還包括:對不同存儲區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,所述將記錄的音頻信號保存為音頻文件,包括:對所述記錄的音頻信號進(jìn)行語音識別,將滿足所述語音識別的預(yù)設(shè)條件的記錄的音頻信號保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語音識別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語音識別結(jié)果中包含分詞。
可選的,所述將記錄的音頻信號保存為音頻文件,包括:對所述記錄的音頻信號進(jìn)行語音識別,根據(jù)語音識別結(jié)果對所述記錄的音頻信號進(jìn)行打分,根據(jù)記錄的音頻信號的分值從高到低的順序依次保存對應(yīng)的音頻文件。
根據(jù)本公開實(shí)施例的第四方面,提供一種非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由移動終端的處理器執(zhí)行時(shí),使得移動終端能夠執(zhí)行一種夢話提取方法,所述方法包括:響應(yīng)夢話提取功能的啟動指令;采集周圍的音頻信號;確定待記錄的音頻信號的門限值;當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
可選的,所述確定待記錄的音頻信號的門限值,包括:在采集的音頻信號中,獲取一段音頻信號,其中所述一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;根據(jù)所述獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值。
可選的,所述根據(jù)獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值,包括:將獲取的一段音頻信號的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
可選的,還包括:將記錄的音頻信號保存為音頻文件,且不同的音頻文件保存在不同的存儲區(qū)域中。
可選的,還包括:對不同存儲區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,所述將記錄的音頻信號保存為音頻文件,包括:對所述記錄的音頻信號進(jìn)行語音識別,將滿足所述語音識別的預(yù)設(shè)條件的記錄的音頻信號保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語音識別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語音識別結(jié)果中包含分詞。
可選的,所述將記錄的音頻信號保存為音頻文件,包括:對所述記錄的音頻信號進(jìn)行語音識別,根據(jù)語音識別結(jié)果對所述記錄的音頻信號進(jìn)行打分,根據(jù)記錄的音頻信號的分值從高到低的順序依次保存對應(yīng)的音頻文件。
本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
通過采集音頻信號,并保存幅度值大于門限值的音頻信號,可以提取出夢話,豐富降噪技術(shù)的應(yīng)用。
進(jìn)一步的,通過根據(jù)采集的音頻信號確定門限值,可以確定出更準(zhǔn)確的門限值,更利于夢話提取。
進(jìn)一步的,通過刪除相似度較大的音頻文件可以刪除無用的鼾聲。
進(jìn)一步的,通過對記錄的音頻信號進(jìn)行語音識別,可以根據(jù)識別結(jié)果確定音頻信號是夢話或者無用的鼾聲等,從而可以根據(jù)語音識別結(jié)果保存更準(zhǔn)確的音頻信號。
進(jìn)一步的,通過對記錄的音頻信號進(jìn)行打分,并根據(jù)打分結(jié)果進(jìn)行排序保存,可以優(yōu)先保存為夢話的音頻信號。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。
圖1是根據(jù)一示例性實(shí)施例示出的一種夢話提取方法的流程圖。
圖2是根據(jù)一示例性實(shí)施例示出的另一種夢話提取方法的流程圖。
圖3是根據(jù)一示例性實(shí)施例示出的一種夢話提取裝置框圖。
圖4是根據(jù)一示例性實(shí)施例示出的另一種夢話提取裝置框圖。
圖5是根據(jù)一示例性實(shí)施例示出的一種用于提取夢話的裝置的框圖。
具體實(shí)施方式
這里將詳細(xì)地對示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
圖1是根據(jù)一示例性實(shí)施例示出的一種夢話提取方法的流程圖,如圖1所示,夢話提取方法用于移動終端中,包括以下步驟。
在步驟S11中,響應(yīng)夢話提取功能的啟示指令。
例如,當(dāng)用戶需要提取夢話時(shí),可以在睡覺之前,通過點(diǎn)擊或其他指令啟動夢話提取功能。
在步驟S12中,采集周圍的音頻信號。
以移動終端是手機(jī)為例,當(dāng)接收到啟動指令后,可以觸發(fā)手機(jī)的音頻輸入裝置(如麥克風(fēng))采集周圍的音頻信號。
在步驟S13中,確定待記錄的音頻信號的門限值。
一些實(shí)施例中,可以預(yù)先設(shè)置固定的一個(gè)門限值。
一些實(shí)施例中,可以根據(jù)采集的音頻信號確定門限值。
例如,可以在采集的音頻信號中獲取一段音頻信號,該一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值,也就是相對穩(wěn)定且幅度較小的音頻信號,再根據(jù)獲取的一段音頻信號確定門限值。例如,將這一段音頻信號的幅度值的均值作為基準(zhǔn)值,再將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
在步驟S14中,當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
其中,可以將記錄的每段音頻信號保存為一個(gè)音頻文件。由于用戶在睡夢過程中,可能會多次說夢話,因此,可以保存多個(gè)音頻文件。不同音頻文件在保存時(shí)可以分開不保存,以避免相互覆蓋。
人們在睡夢中時(shí),存在的音頻信號可能是噪聲,也可能是夢話,當(dāng)音頻信號的幅度小于門限值時(shí),可以認(rèn)為其是噪聲,不進(jìn)行記錄,而當(dāng)音頻信號的幅度大于門限值時(shí),可以認(rèn)為其是夢話,進(jìn)行記錄,以滿足用戶對夢話提取的需求。
本實(shí)施例中,通過采集音頻信號,并保存幅度值大于門限值的音頻信號,可以提取出夢話,豐富降噪技術(shù)的應(yīng)用。
圖2是根據(jù)一示例性實(shí)施例示出的另一種夢話提取方法的流程圖,如圖2所示,夢話提取方法用于移動終端中,包括以下步驟。
在步驟S21中,接收夢話提取功能的啟動指令并響應(yīng)所述啟動指令。
例如,當(dāng)用戶需要提取夢話時(shí),可以在睡覺之前,通過點(diǎn)擊或其他指令啟動夢話提取功能。
在步驟S22中,采集周圍的音頻信號。
以移動終端是手機(jī)為例,當(dāng)接收到啟動指令后,可以觸發(fā)手機(jī)的音頻輸入裝置(如麥克風(fēng))采集周圍的音頻信號。
在步驟S23中,在采集的音頻信號中,獲取一段音頻信號,其中,一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)值,以及,根據(jù)獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值。
例如,可以在采集的音頻信號中獲取幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值的一段音頻信號,也就是相對穩(wěn)定且幅度較小的音頻信號,再根據(jù)獲取的該段音頻信號確定門限值。例如,將這段音頻信號的幅度值的均值作為基準(zhǔn)值,再將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
在步驟S24中,當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
例如,在T11時(shí)間點(diǎn),采集的音頻信號的幅度值大于門限值,則開始記錄音頻信號,當(dāng)T12時(shí)間點(diǎn),音頻信號的幅度值小于門限值,則停止記錄,從而可以記錄T11~T12這一時(shí)間區(qū)間內(nèi)的一段音頻信號。又例如,在T21時(shí)間點(diǎn),采集的音頻信號的幅度值大于門限值,則開始記錄音頻信號,當(dāng)T22時(shí)間點(diǎn),音頻信號的幅度值小于門限值,則停止記錄,從而可以記錄T21~T22這一時(shí)間區(qū)間內(nèi)的一段音頻信號。
在步驟S25中,將記錄的音頻信號保存為音頻文件,且不同的音頻文件保存在不同的存儲區(qū)域中。
假設(shè)T11~T12這一時(shí)間區(qū)間內(nèi)的一段音頻信號被保存為第一音頻文件,T21~T22這一時(shí)間區(qū)間內(nèi)的一段音頻信號被保存為第二音頻文件,則第一音頻文件和第二音頻文件可以保存在不同的存儲區(qū)域。例如,每次存儲之前先查找空閑的存儲區(qū)域,在空閑的存儲區(qū)域中將幅度值大于門限值的音頻信號保存為音頻文件。
進(jìn)一步的,所述將記錄的音頻信號保存為音頻文件,包括:
對所述記錄的音頻信號進(jìn)行語音識別,將滿足所述語音識別的預(yù)設(shè)條件的記錄的音頻信號保存為音頻文件;
其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):
語音識別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;
語音識別結(jié)果中包含分詞。
具體如,當(dāng)記錄一段音頻信號后,對該段音頻信號進(jìn)行語音識別,得到音頻信號對應(yīng)的文本,如果該文本中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值(如大于5個(gè)字),和/或,該文本中包含分詞(如動詞),則將該段音頻信號保存為音頻文本。通常來講,當(dāng)上述的文本包含的字?jǐn)?shù)大于字?jǐn)?shù)閾值或包含分詞時(shí),可以說明該段音頻信號是夢話,而非無用的鼾聲或磨牙等噪聲,因此通過對音頻信號進(jìn)行語音識別,可以提高保存的音頻文件的準(zhǔn)確度。
進(jìn)一步的,所述將記錄的音頻信號保存為音頻文件,包括:
對所述記錄的音頻信號進(jìn)行語音識別,根據(jù)語音識別結(jié)果對所述記錄的音頻信號進(jìn)行打分,根據(jù)記錄的音頻信號的分值從高到低的順序依次保存對應(yīng)的音頻文件。
例如,如果對一段音頻信號的語音識別結(jié)果中包含的字?jǐn)?shù)越多則該段音頻信號的分值越高,在保存為音頻文件時(shí)排序在越靠前。因此,可以將質(zhì)量更優(yōu)的夢話排序在前。
在步驟S26中,對不同存儲區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
其中,在存儲的所有音頻文件中,可以兩兩進(jìn)行相似度判斷,具體的,可以采用語音相似度算法進(jìn)行相似度判斷,以確定兩個(gè)音頻文件的相似度。假設(shè)第一音頻文件與第二音頻文件的相似度大于閾值,則刪除第一音頻文件和第二音頻文件。
進(jìn)一步的,語音相似度的計(jì)算算法有多種,例如,可以對每個(gè)音頻文件進(jìn)行特征提取,獲取每個(gè)音頻文件對應(yīng)的特征向量,之后再計(jì)算兩個(gè)音頻文件對應(yīng)的兩個(gè)特征向量之間的余弦距離或歐式距離等,將計(jì)算得到的距離值作為相似度數(shù)值,進(jìn)而判斷相似度數(shù)值是否大于閾值。
人們在睡夢中時(shí),超過門限值的音頻信號除了夢話之前,還可能是打鼾的聲音,而打鼾的聲音的相似度較大,本實(shí)施例通過刪除相似度較大的音頻文件可以刪除無用的鼾聲。
在步驟S27中,判斷是否結(jié)束夢話提取功能,若是,執(zhí)行步驟S28,否則,重復(fù)執(zhí)行步驟S22及其后續(xù)步驟。
其中,可以是接收到夢話提取功能的結(jié)束指令后,確定結(jié)束夢話提取功能,或者,也可以是預(yù)先設(shè)置結(jié)束時(shí)間,當(dāng)達(dá)到結(jié)束時(shí)間時(shí),確定結(jié)束夢話提取功能。進(jìn)一步的,上述的結(jié)束時(shí)間可以是絕對時(shí)間,如凌晨6點(diǎn),則在凌晨6點(diǎn)結(jié)束夢話提取功能?;蛘撸鲜龅慕Y(jié)束時(shí)間也可以是與夢話提取功能的啟動指令的產(chǎn)生時(shí)間之間的間隔時(shí)間,如8小時(shí),則如果啟動指令的產(chǎn)生時(shí)間是12點(diǎn),則在8點(diǎn)結(jié)束夢話提取功能。
在步驟S28中,結(jié)束對周圍音頻信號的采集。
可以理解的是,上述S26進(jìn)行相似度判斷時(shí),可以是每次保存得到一個(gè)音頻文件后,將該音頻文件與已有的音頻文件進(jìn)行兩兩相似度運(yùn)算,以刪除相似度較大的音頻文件?;蛘撸部梢允菈粼捥崛」δ芙Y(jié)束后,對保存的所有音頻文件進(jìn)行兩兩相似度運(yùn)算,以刪除相似度較大的音頻文件。
本實(shí)施例中,通過采集音頻信號,并保存幅度值大于門限值的音頻信號,可以提取出夢話,豐富降噪技術(shù)的應(yīng)用。進(jìn)一步的,通過根據(jù)采集的音頻信號確定門限值,可以確定出更準(zhǔn)確的門限值,更利于夢話提取。進(jìn)一步的,通過刪除相似度較大的音頻文件可以刪除無用的鼾聲。進(jìn)一步的,通過對記錄的音頻信號進(jìn)行語音識別,可以根據(jù)識別結(jié)果確定音頻信號是夢話或者無用的鼾聲等,從而可以根據(jù)語音識別結(jié)果保存更準(zhǔn)確的音頻信號。進(jìn)一步的,通過對記錄的音頻信號進(jìn)行打分,并根據(jù)打分結(jié)果進(jìn)行排序保存,可以優(yōu)先保存為夢話的音頻信號。
圖3是根據(jù)一示例性實(shí)施例示出的一種夢話提取裝置框圖。參照圖3,該裝置30包括:響應(yīng)模塊31、采集模塊32、確定模塊33和記錄模塊34。
響應(yīng)模塊31,用于響應(yīng)夢話提取功能的啟動指令;
采集模塊32,用于在接收到所述啟動指令后,采集周圍的音頻信號;
確定模塊33,用于確定待記錄的音頻信號的門限值;
記錄模塊34,用于當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
一些實(shí)施例中,參見圖4,所述確定模塊33包括:
確定子模塊331,用于在采集的音頻信號中,獲取一段音頻信號,其中所述一段音頻信號的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;
計(jì)算子模塊332,用于根據(jù)所述獲取的一段音頻信號的幅度值,確定待記錄的音頻信號的門限值。
一些實(shí)施例中,所述計(jì)算子模塊332進(jìn)一步用于:
將獲取的一段音頻信號的幅度值的均值作為基準(zhǔn)值;
將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號的門限值。
一些實(shí)施例中,參見圖4,該裝置30還包括:
保存模塊35,用于將記錄的音頻信號保存為音頻文件,且不同的音頻文件保存在不同的存儲區(qū)域中。
一些實(shí)施例中,參見圖4,該裝置30還包括:
刪除模塊36,用于對不同存儲區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
一些實(shí)施例中,所述保存模塊35進(jìn)一步用于:
對所述記錄的音頻信號進(jìn)行語音識別,將滿足所述語音識別的預(yù)設(shè)條件的記錄的音頻信號保存為音頻文件;
其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):
語音識別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;
語音識別結(jié)果中包含分詞。
一些實(shí)施例中,所述保存模塊35進(jìn)一步用于:
對所述記錄的音頻信號進(jìn)行語音識別,根據(jù)語音識別結(jié)果對所述記錄的音頻信號進(jìn)行打分,根據(jù)記錄的音頻信號的分值從高到低的順序依次保存對應(yīng)的音頻文件。
關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
本實(shí)施例中,通過采集音頻信號,并保存幅度值大于門限值的音頻信號,可以提取出夢話,豐富降噪技術(shù)的應(yīng)用。進(jìn)一步的,通過根據(jù)采集的音頻信號確定門限值,可以確定出更準(zhǔn)確的門限值,更利于夢話提取。進(jìn)一步的,通過刪除相似度較大的音頻文件可以刪除無用的鼾聲。
圖5是根據(jù)一示例性實(shí)施例示出的一種用于提取夢話的裝置的框圖。例如,裝置500可以是移動電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
參照圖5,裝置500可以包括以下一個(gè)或多個(gè)組件:處理組件502,存儲器504,電源組件506,多媒體組件508,音頻組件510,輸入/輸出(I/O)的接口512,傳感器組件514,以及通信組件516。
處理組件502通??刂蒲b置500的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件502可以包括一個(gè)或多個(gè)處理器520來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件502可以包括一個(gè)或多個(gè)模塊,便于處理組件502和其他組件之間的交互。例如,處理組件502可以包括多媒體模塊,以方便多媒體組件508和處理組件502之間的交互。
存儲器504被配置為存儲各種類型的數(shù)據(jù)以支持在裝置500的操作。這些數(shù)據(jù)的示例包括用于在裝置500上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器504可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
電源組件506為裝置500的各種組件提供電力。電源組件506可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置500生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件508包括在所述裝置500和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件508包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置500處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件510被配置為輸出和/或輸入音頻信號。例如,音頻組件510包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置500處于操作模式,如呼叫模式、記錄模式和語音識別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器504或經(jīng)由通信組件516發(fā)送。在一些實(shí)施例中,音頻組件510還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號。
I/O接口512為處理組件502和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
傳感器組件514包括一個(gè)或多個(gè)傳感器,用于為裝置500提供各個(gè)方面的狀態(tài)評估。例如,傳感器組件514可以檢測到裝置500的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置500的顯示器和小鍵盤,傳感器組件514還可以檢測裝置500或裝置500一個(gè)組件的位置改變,用戶與裝置500接觸的存在或不存在,裝置500方位或加速/減速和裝置500的溫度變化。傳感器組件514可以包括接近傳感器,被配置用來在沒有任何的物理接觸時(shí)檢測附近物體的存在。傳感器組件514還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件514還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件516被配置為便于裝置500和其他設(shè)備之間有線或無線方式的通信。裝置500可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信組件516經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信組件516還包括近場通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
在示例性實(shí)施例中,裝置500可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法:響應(yīng)夢話提取功能的啟動指令;采集周圍的音頻信號;確定待記錄的音頻信號的門限值;當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。
在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),例如包括指令的存儲器504,上述指令可由裝置500的處理器520執(zhí)行以完成上述方法:響應(yīng)夢話提取功能的啟動指令;采集周圍的音頻信號;確定待記錄的音頻信號的門限值;當(dāng)所述采集的音頻信號的幅度值大于所述門限值時(shí),開始記錄所述采集的音頻信號,直至所述采集的音頻信號的幅度值小于所述門限值時(shí),停止記錄。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)可以是ROM、隨機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。