本公開涉及計(jì)算機(jī)領(lǐng)域,具體涉及語音處理、深度學(xué)習(xí)、圖像處理等,尤其涉及一種語音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、目前市面上主流的座艙語音系統(tǒng)均支持多音區(qū)交互,如雙音區(qū)、四音區(qū)、六音區(qū)等,同時(shí)跟音區(qū)配套的功能也有許多,如分區(qū)空調(diào)、分區(qū)車控、系統(tǒng)控制等。
2、各個(gè)音區(qū)配套的功能均獨(dú)立實(shí)現(xiàn),用戶在控制相應(yīng)音區(qū)的部件時(shí)需要通過關(guān)鍵字喚醒后加上識(shí)別固定的指令才可以實(shí)現(xiàn),控制算法的運(yùn)算量大,用戶體驗(yàn)差。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供了一種語音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。
2、根據(jù)第一方面,提供了一種語音控制方法,該方法包括:接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。
3、根據(jù)第二方面,提供了一種語音控制裝置,該裝置包括:接收單元,被配置成接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;關(guān)鍵檢測單元,被配置成檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;意圖檢測單元,被配置成響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);執(zhí)行單元,被配置成響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。
4、根據(jù)第三方面,提供了一種電子設(shè)備,該電子設(shè)備包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。
5、根據(jù)第四方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。
6、根據(jù)第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面任一實(shí)現(xiàn)方式描述的方法。
7、本公開的實(shí)施例提供的語音控制方法和裝置,首先,接收至少兩個(gè)音區(qū)中第一音區(qū)的語音信息;其次,檢測語音信息是否與意圖繼承關(guān)鍵信息相匹配;再次,響應(yīng)于檢測到語音信息與意圖繼承關(guān)鍵信息相匹配,檢測是否具有第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);最后,響應(yīng)于檢測到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。由此,在第一音區(qū)的語音信息與意圖繼承關(guān)鍵信息相匹配時(shí),若檢測到的第二音區(qū)的可繼承意圖信息,直接執(zhí)行該可繼承意圖信息,可以使第一音區(qū)的用戶無需發(fā)出與指令動(dòng)作相匹配的控制指令,簡化了用戶語音控制流程,節(jié)省了控制算法的運(yùn)算量,提高了用戶體驗(yàn)。
8、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種語音控制方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述檢測所述語音信息是否與意圖繼承關(guān)鍵信息相匹配包括:
3.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語義信息,所述檢測所述語音信息是否與意圖繼承關(guān)鍵信息相匹配包括:
4.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測是否具有所述第二音區(qū)的可繼承意圖信息包括:
5.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測是否具有所述第二音區(qū)的可繼承意圖信息包括:
6.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測是否具有所述第二音區(qū)的可繼承意圖信息包括:
7.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測到具有所述可繼承意圖信息,控制所述第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作包括:
8.根據(jù)權(quán)利要求1-7之一所述的方法,所述方法還包括:
9.根據(jù)權(quán)利要求8所述的方法,所述方法還包括:
10.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:
11.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:
12.根據(jù)權(quán)利要求8所述的方法,其中,所述響應(yīng)于判斷結(jié)果為所述語音信息包括喚醒控制信息,基于所述語音信息,識(shí)別動(dòng)作執(zhí)行意圖包括:
13.一種語音控制裝置,所述裝置包括:
14.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述關(guān)鍵檢測單元被配置成:基于所述語音信息,得到轉(zhuǎn)化文本;檢測所述轉(zhuǎn)化文本中是否具有所述意圖繼承關(guān)鍵詞;響應(yīng)于檢測到所述轉(zhuǎn)化文本中具有所述意圖繼承關(guān)鍵詞,確定所述語音信息與意圖繼承關(guān)鍵信息相匹配。
15.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語義信息,所述關(guān)鍵檢測單元被配置成:基于所述語音信息,提取文本語義信息;檢測所述文本語義信息是否與所述意圖繼承語義信息相匹配;響應(yīng)于檢測到所述文本語義信息與所述意圖繼承語義信息相匹配,確定所述語音信息與意圖繼承關(guān)鍵信息相匹配。
16.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測單元被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,從本地存儲(chǔ)的至少兩個(gè)音區(qū)的可繼承意圖信息中選取與所述語音信息時(shí)間相差最短的可繼承意圖信息;檢測與所述語音信息時(shí)間相差最短的可繼承意圖信息是否屬于所述第一音區(qū);響應(yīng)于檢測到與所述語音信息時(shí)間相差最短的可繼承意圖信息不屬于所述第一音區(qū),確定具有所述第二音區(qū)的可繼承意圖信息。
17.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測單元被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測本地?cái)?shù)據(jù)庫是否存儲(chǔ)有所述第二音區(qū)的動(dòng)作執(zhí)行意圖;響應(yīng)于檢測到所述動(dòng)作執(zhí)行意圖,且所述動(dòng)作執(zhí)行意圖只有一個(gè);將所述動(dòng)作執(zhí)行意圖確定為可繼承意圖信息,并確定所述第二音區(qū)具有可繼承意圖信息。
18.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測單元被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測所述意圖繼承關(guān)鍵信息是否包括所述第二音區(qū)的意圖繼承語義信息;響應(yīng)于檢測到所述意圖繼承關(guān)鍵信息包括所述第二音區(qū)的意圖繼承語義信息,確定具有所述第二音區(qū)的可繼承意圖信息。
19.根據(jù)權(quán)利要求13所述的裝置,所述執(zhí)行單元被配置成:基于所述可繼承意圖信息,生成并發(fā)送意圖問詢信息;響應(yīng)于接收到對(duì)所述意圖問詢信息的答復(fù)信息,控制第一音區(qū)的被控對(duì)象執(zhí)行所述可繼承意圖信息和所述答復(fù)信息對(duì)應(yīng)的指令動(dòng)作。
20.根據(jù)權(quán)利要求13-19之一所述的裝置,所述裝置還包括:第一實(shí)施單元,被配置成:響應(yīng)于檢測到所述語音信息與所述意圖繼承關(guān)鍵信息不相匹配,判斷所述語音信息是否包括喚醒控制信息;響應(yīng)于判斷結(jié)果為所述語音信息包括喚醒控制信息,基于所述語音信息,識(shí)別動(dòng)作執(zhí)行意圖;控制所述第一音區(qū)的被控對(duì)象執(zhí)行所述動(dòng)作執(zhí)行意圖的指令動(dòng)作。
21.根據(jù)權(quán)利要求20所述的裝置,所述裝置還包括:第二實(shí)施單元,被配置成:檢測所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息;響應(yīng)于檢測到所述動(dòng)作執(zhí)行意圖是所述第一音區(qū)的可繼承意圖信息,將所述動(dòng)作執(zhí)行意圖作為所述第一音區(qū)的可繼承意圖信息存儲(chǔ)在本地?cái)?shù)據(jù)庫中。
22.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場景下的被控對(duì)象;檢測所述被控對(duì)象是否屬于預(yù)設(shè)垂類;響應(yīng)于檢測到所述被控對(duì)象屬于預(yù)設(shè)垂類,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。
23.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場景下的被控對(duì)象;檢測所述第二音區(qū)是否具有與所述被控對(duì)象類型相同的對(duì)象;響應(yīng)于檢測到所述第二音區(qū)具有與所述被控對(duì)象類型相同的對(duì)象,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。
24.根據(jù)權(quán)利要求20所述的裝置,其中,所述第一實(shí)施單元被配置成:響應(yīng)于判斷結(jié)果為所述語音信息包括喚醒控制信息,基于所述語音信息,得到轉(zhuǎn)化文本;將所述轉(zhuǎn)化文本輸入訓(xùn)練完成的意圖識(shí)別模型,得到意圖識(shí)別模型輸出的動(dòng)作執(zhí)行意圖。
25.一種電子設(shè)備,其特征在于,包括:
26.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-12中任一項(xiàng)所述方法。
27.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-12中任一項(xiàng)所述的方法。