本發(fā)明涉及機(jī)械臂協(xié)同控制領(lǐng)域,更具體地,涉及一種多機(jī)械臂協(xié)同運(yùn)動(dòng)規(guī)劃方法。
背景技術(shù):
1、在工業(yè)生產(chǎn)流程中,工業(yè)機(jī)器人代替人工進(jìn)行生產(chǎn)活動(dòng),特別是流水線生產(chǎn)的作業(yè)模式,逐漸成為工業(yè)生產(chǎn)制造的主要發(fā)展趨勢(shì)。與單臂機(jī)器人相比,多臂機(jī)器人可以完成一些比較有難度的協(xié)同任務(wù),同時(shí)可以操作更大的目標(biāo)載荷。
2、在實(shí)現(xiàn)本發(fā)明構(gòu)思的過程中,發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)中至少存在如下問題:多機(jī)械臂協(xié)作過程中抓取運(yùn)動(dòng)存在耦合,造成協(xié)同運(yùn)動(dòng)的穩(wěn)定性差,且場(chǎng)景適應(yīng)性低。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種多機(jī)械臂協(xié)同運(yùn)動(dòng)規(guī)劃方法。
2、本發(fā)明的一個(gè)方面提供了一種多機(jī)械臂協(xié)同運(yùn)動(dòng)規(guī)劃方法,包括:將多個(gè)機(jī)械臂各自的動(dòng)作值和觀察值輸入動(dòng)作預(yù)測(cè)模型的編碼器,得到多個(gè)機(jī)械臂各自的中間動(dòng)作值和參考中間動(dòng)作值,動(dòng)作值表征機(jī)械臂執(zhí)行的動(dòng)作操作,觀察值表征機(jī)械臂執(zhí)行動(dòng)作操作后的狀態(tài)信息,參考中間動(dòng)作值為多個(gè)機(jī)械臂均處于預(yù)設(shè)狀態(tài)下機(jī)械臂的動(dòng)作值;將多個(gè)機(jī)械臂各自的中間動(dòng)作值、參考中間動(dòng)作值、觀察值、與參考中間動(dòng)作值對(duì)應(yīng)的部分可觀察值分別輸入與多個(gè)機(jī)械臂各自對(duì)應(yīng)解碼器,得到多個(gè)機(jī)械臂各自的目標(biāo)動(dòng)作值,動(dòng)作預(yù)測(cè)模型包括解碼器,部分可觀察值為機(jī)械臂處于預(yù)設(shè)狀態(tài)下的狀態(tài)信息;控制多個(gè)機(jī)械臂按照各自的目標(biāo)動(dòng)作值運(yùn)動(dòng),以對(duì)發(fā)動(dòng)機(jī)的缸蓋執(zhí)行裝配任務(wù),其中,裝配任務(wù)包括多個(gè)階段,動(dòng)作預(yù)測(cè)模型是基于激勵(lì)函數(shù)訓(xùn)練得到的,激勵(lì)函數(shù)包括與裝配任務(wù)中與各階段對(duì)應(yīng)的子激勵(lì)函數(shù)。
3、本發(fā)明的另一個(gè)方面提供了一種多機(jī)械臂協(xié)同運(yùn)動(dòng)規(guī)劃裝置,包括:第一輸入模塊,用于將多個(gè)機(jī)械臂各自的動(dòng)作值和觀察值輸入動(dòng)作預(yù)測(cè)模型的編碼器,得到多個(gè)機(jī)械臂各自的中間動(dòng)作值和參考中間動(dòng)作值,動(dòng)作值表征機(jī)械臂執(zhí)行的動(dòng)作操作,觀察值表征機(jī)械臂執(zhí)行動(dòng)作操作后的狀態(tài)信息,參考中間動(dòng)作值為多個(gè)機(jī)械臂均處于預(yù)設(shè)狀態(tài)下機(jī)械臂的動(dòng)作值;第二輸入模塊,用于將多個(gè)機(jī)械臂各自的中間動(dòng)作值、參考中間動(dòng)作值、觀察值、與參考中間動(dòng)作值對(duì)應(yīng)的部分可觀察值分別輸入與多個(gè)機(jī)械臂各自對(duì)應(yīng)解碼器,得到多個(gè)機(jī)械臂各自的目標(biāo)動(dòng)作值,動(dòng)作預(yù)測(cè)模型包括解碼器,部分可觀察值為機(jī)械臂處于預(yù)設(shè)狀態(tài)下的狀態(tài)信息;控制模塊,用于控制多個(gè)機(jī)械臂按照各自的目標(biāo)動(dòng)作值運(yùn)動(dòng),以對(duì)發(fā)動(dòng)機(jī)的缸蓋執(zhí)行裝配任務(wù),其中,裝配任務(wù)包括多個(gè)階段,動(dòng)作預(yù)測(cè)模型是基于激勵(lì)函數(shù)訓(xùn)練得到的,激勵(lì)函數(shù)包括與裝配任務(wù)中與各階段對(duì)應(yīng)的子激勵(lì)函數(shù)。
4、本發(fā)明的另一個(gè)方面提供了一種電子設(shè)備,包括:
5、一個(gè)或多個(gè)處理器;
6、存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序,
7、其中,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行時(shí),使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上述的方法。
8、本發(fā)明的另一方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令,指令在被執(zhí)行時(shí)用于實(shí)現(xiàn)如上述的方法。
9、本發(fā)明的另一方面提供了一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可執(zhí)行指令,指令在被執(zhí)行時(shí)用于實(shí)現(xiàn)如上述的方法。
10、根據(jù)本發(fā)明的實(shí)施例,通過將多個(gè)機(jī)械臂各自的動(dòng)作值和觀察值輸入動(dòng)作預(yù)測(cè)模型的編碼器,得到多個(gè)機(jī)械臂各自的中間動(dòng)作值和參考中間動(dòng)作值,由于參考中間動(dòng)作值為多個(gè)機(jī)械臂均處于預(yù)設(shè)狀態(tài)下機(jī)械臂的動(dòng)作值,再將多個(gè)機(jī)械臂各自的中間動(dòng)作值、參考中間動(dòng)作值、部分可觀察值、與參考中間動(dòng)作值對(duì)應(yīng)的參考可觀察值分別輸入與多個(gè)機(jī)械臂各自對(duì)應(yīng)解碼器,得到多個(gè)機(jī)械臂各自的目標(biāo)動(dòng)作值,使得多個(gè)機(jī)械臂各自的目標(biāo)動(dòng)作值可使協(xié)同運(yùn)動(dòng)更穩(wěn)定。同時(shí)只需獲取單個(gè)機(jī)械臂單獨(dú)的部分可觀察值,也可準(zhǔn)確預(yù)測(cè)得到該機(jī)械臂的目標(biāo)動(dòng)作值,使得適用的場(chǎng)景更多。因此,控制多個(gè)機(jī)械臂按照各自的目標(biāo)動(dòng)作值運(yùn)動(dòng),以對(duì)發(fā)動(dòng)機(jī)的缸蓋進(jìn)行裝配,使得多個(gè)機(jī)械臂協(xié)同運(yùn)動(dòng)的穩(wěn)定性提高、該運(yùn)動(dòng)規(guī)劃方法適用的場(chǎng)景更多。
1.一種多機(jī)械臂協(xié)同運(yùn)動(dòng)規(guī)劃方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述裝配任務(wù)包括以下階段:抓取待裝配件階段、提升待裝配件階段、平移待裝配件階段和放置待裝配件階段,待裝配件包括凸輪軸和氣門室蓋,所述機(jī)械臂包括夾持器。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述控制多個(gè)所述機(jī)械臂按照各自的所述目標(biāo)動(dòng)作值運(yùn)動(dòng),以對(duì)發(fā)動(dòng)機(jī)的缸蓋進(jìn)行裝配包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述多機(jī)械臂協(xié)同裝配平臺(tái)還包括深度相機(jī),所述方法還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述動(dòng)作預(yù)測(cè)模型是基于如下訓(xùn)練方式得到的:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述利用多個(gè)所述仿真機(jī)械臂各自的所述模擬動(dòng)作值、所述模擬觀察值和所述模擬部分可觀察值訓(xùn)練所述動(dòng)作預(yù)測(cè)模型包括:
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述激勵(lì)函數(shù)包括與所述抓取待裝配件階段對(duì)應(yīng)的抓取子激勵(lì)函數(shù),所述抓取子激勵(lì)函數(shù)如下:
8.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述激勵(lì)函數(shù)還包括與所述提升待裝配件階段對(duì)應(yīng)的提升子激勵(lì)函數(shù),所述提升子激勵(lì)函數(shù)如下:
9.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述激勵(lì)函數(shù)還包括與所述平移待裝配件階段對(duì)應(yīng)的平移子激勵(lì)函數(shù),所述平移子激勵(lì)函數(shù)如下:
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述激勵(lì)函數(shù)還包括與所述放置待裝配件階段對(duì)應(yīng)的放置子激勵(lì)函數(shù),所述放置子激勵(lì)函數(shù)如下: