两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

語音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40610433發(fā)布日期:2025-01-07 20:53閱讀:10來源:國知局
語音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)與流程

本公開涉及計(jì)算機(jī)領(lǐng)域,具體涉及語音處理、深度學(xué)習(xí)、圖像處理等,尤其涉及一種語音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。


背景技術(shù):

1、目前市面上主流的座艙語音系統(tǒng)均支持多音區(qū)交互,如雙音區(qū)、四音區(qū)、六音區(qū)等,同時(shí)跟音區(qū)配套的功能也有許多,如分區(qū)空調(diào)、分區(qū)車控、系統(tǒng)控制等。

2、各個(gè)音區(qū)配套的功能均獨(dú)立實(shí)現(xiàn),用戶在控制相應(yīng)音區(qū)的部件時(shí)需要通過關(guān)鍵字喚醒后加上識(shí)別固定的指令才可以實(shí)現(xiàn),控制算法的運(yùn)算量大,用戶體驗(yàn)差。


技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種語音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。

2、根據(jù)第一方面,提供了一種語音控制方法,該方法包括:接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。

3、根據(jù)第二方面,提供了一種語音控制裝置,該裝置包括:接收單元,被配置成接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;關(guān)鍵檢測單元,被配置成檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;意圖檢測單元,被配置成響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);執(zhí)行單元,被配置成響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。

4、根據(jù)第三方面,提供了一種電子設(shè)備,該電子設(shè)備包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。

5、根據(jù)第四方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。

6、根據(jù)第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面任一實(shí)現(xiàn)方式描述的方法。

7、本公開的實(shí)施例提供的語音控制方法和裝置,首先,接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;其次,檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;再次,響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);最后,響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。由此,在第一音區(qū)的語音信息與意圖繼承關(guān)鍵信息相匹配時(shí),若檢測到的第二音區(qū)的可繼承意圖信息,直接執(zhí)行該可繼承意圖信息,可以使第一音區(qū)的用戶無需發(fā)出與指令動(dòng)作相匹配的控制指令,簡化了用戶語音控制流程,節(jié)省了控制算法的運(yùn)算量,提高了用戶體驗(yàn)。

8、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。



技術(shù)特征:

1.一種語音控制方法,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述檢測所述語音信息是否與意圖繼承關(guān)鍵信息相匹配包括:

3.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語義信息,所述檢測所述語音信息是否與意圖繼承關(guān)鍵信息相匹配包括:

4.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測是否具有所述第二音區(qū)的可繼承意圖信息包括:

5.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測是否具有所述第二音區(qū)的可繼承意圖信息包括:

6.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測是否具有所述第二音區(qū)的可繼承意圖信息包括:

7.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到具有所述可繼承意圖信息,控制所述第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作包括:

8.根據(jù)權(quán)利要求1-7之一所述的方法,所述方法還包括:

9.根據(jù)權(quán)利要求8所述的方法,所述方法還包括:

10.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:

11.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:

12.根據(jù)權(quán)利要求8所述的方法,其中,所述響應(yīng)于判斷結(jié)果為所述語音信息包括喚醒控制信息,基于所述語音信息,識(shí)別動(dòng)作執(zhí)行意圖包括:

13.一種語音控制裝置,所述裝置包括:

14.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述關(guān)鍵檢測單元被配置成:基于所述語音信息,得到轉(zhuǎn)化文本;檢測所述轉(zhuǎn)化文本中是否具有所述意圖繼承關(guān)鍵詞;響應(yīng)于檢測到所述轉(zhuǎn)化文本中具有所述意圖繼承關(guān)鍵詞,確定所述語音信息與意圖繼承關(guān)鍵信息相匹配。

15.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語義信息,所述關(guān)鍵檢測單元被配置成:基于所述語音信息,提取文本語義信息;檢測所述文本語義信息是否與所述意圖繼承語義信息相匹配;響應(yīng)于檢測到所述文本語義信息與所述意圖繼承語義信息相匹配,確定所述語音信息與意圖繼承關(guān)鍵信息相匹配。

16.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測單元被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,從本地存儲(chǔ)的至少兩個(gè)音區(qū)的可繼承意圖信息中選取與所述語音信息時(shí)間相差最短的可繼承意圖信息;檢測與所述語音信息時(shí)間相差最短的可繼承意圖信息是否屬于所述第一音區(qū);響應(yīng)于檢測到與所述語音信息時(shí)間相差最短的可繼承意圖信息不屬于所述第一音區(qū),確定具有所述第二音區(qū)的可繼承意圖信息。

17.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測單元被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測本地?cái)?shù)據(jù)庫是否存儲(chǔ)有所述第二音區(qū)的動(dòng)作執(zhí)行意圖;響應(yīng)于檢測到所述動(dòng)作執(zhí)行意圖,且所述動(dòng)作執(zhí)行意圖只有一個(gè);將所述動(dòng)作執(zhí)行意圖確定為可繼承意圖信息,并確定所述第二音區(qū)具有可繼承意圖信息。

18.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測單元被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測所述意圖繼承關(guān)鍵信息是否包括所述第二音區(qū)的意圖繼承語義信息;響應(yīng)于檢測到所述意圖繼承關(guān)鍵信息包括所述第二音區(qū)的意圖繼承語義信息,確定具有所述第二音區(qū)的可繼承意圖信息。

19.根據(jù)權(quán)利要求13所述的裝置,所述執(zhí)行單元被配置成:基于所述可繼承意圖信息,生成并發(fā)送意圖問詢信息;響應(yīng)于接收到對(duì)所述意圖問詢信息的答復(fù)信息,控制第一音區(qū)的被控對(duì)象執(zhí)行所述可繼承意圖信息和所述答復(fù)信息對(duì)應(yīng)的指令動(dòng)作。

20.根據(jù)權(quán)利要求13-19之一所述的裝置,所述裝置還包括:第一實(shí)施單元,被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息不相匹配,判斷所述語音信息是否包括喚醒控制信息;響應(yīng)于判斷結(jié)果為所述語音信息包括喚醒控制信息,基于所述語音信息,識(shí)別動(dòng)作執(zhí)行意圖;控制所述第一音區(qū)的被控對(duì)象執(zhí)行所述動(dòng)作執(zhí)行意圖的指令動(dòng)作。

21.根據(jù)權(quán)利要求20所述的裝置,所述裝置還包括:第二實(shí)施單元,被配置成:檢測所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息;響應(yīng)于檢測到所述動(dòng)作執(zhí)行意圖是所述第一音區(qū)的可繼承意圖信息,將所述動(dòng)作執(zhí)行意圖作為所述第一音區(qū)的可繼承意圖信息存儲(chǔ)在本地?cái)?shù)據(jù)庫中。

22.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場景下的被控對(duì)象;檢測所述被控對(duì)象是否屬于預(yù)設(shè)垂類;響應(yīng)于檢測到所述被控對(duì)象屬于預(yù)設(shè)垂類,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。

23.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場景下的被控對(duì)象;檢測所述第二音區(qū)是否具有與所述被控對(duì)象類型相同的對(duì)象;響應(yīng)于檢測到所述第二音區(qū)具有與所述被控對(duì)象類型相同的對(duì)象,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。

24.根據(jù)權(quán)利要求20所述的裝置,其中,所述第一實(shí)施單元被配置成:響應(yīng)于判斷結(jié)果為所述語音信息包括喚醒控制信息,基于所述語音信息,得到轉(zhuǎn)化文本;將所述轉(zhuǎn)化文本輸入訓(xùn)練完成的意圖識(shí)別模型,得到意圖識(shí)別模型輸出的動(dòng)作執(zhí)行意圖。

25.一種電子設(shè)備,其特征在于,包括:

26.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-12中任一項(xiàng)所述方法。

27.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-12中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本公開提供了一種語音控制方法和裝置,涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及語音處理、深度學(xué)習(xí)、圖像處理等技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為:接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有第二音區(qū)的可繼承意圖信息,所述第二音區(qū)是與所述第一音區(qū)不同的音區(qū);響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作,提高了用戶體驗(yàn)。

技術(shù)研發(fā)人員:毛文強(qiáng)
受保護(hù)的技術(shù)使用者:阿波羅智聯(lián)(北京)科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
监利县| 寿宁县| 扬州市| 正镶白旗| 竹山县| 突泉县| 嘉义市| 民和| 陆丰市| 东光县| 天峻县| 望江县| 望都县| 贺州市| 宜宾县| 阿拉尔市| 阳朔县| 宜兰县| 柳州市| 伊金霍洛旗| 高碑店市| 舟曲县| 八宿县| 泗洪县| 江陵县| 山阳县| 营山县| 贺兰县| 罗山县| 常宁市| 饶阳县| 南皮县| 安塞县| 承德市| 漳州市| 宁明县| 通城县| 安丘市| 新野县| 鄂托克前旗| 黄梅县|