一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法

文檔序號(hào)：10726004閱讀：706來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法
【專利摘要】本發(fā)明提供了一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法，該系統(tǒng)在每個(gè)團(tuán)隊(duì)成員中均設(shè)置基于行為的控制層、面向角色的決策層以及任務(wù)計(jì)劃層?？刂茖犹峁┳詣?dòng)巡航和需要連續(xù)傳感器反饋的行為。任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文。面向角色的決策層包括團(tuán)隊(duì)角色表，任務(wù)管理器以及態(tài)勢感知器。團(tuán)隊(duì)角色表存儲(chǔ)角色信息。任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī)，任務(wù)列表保存初始任務(wù)以及在任務(wù)執(zhí)行過程中產(chǎn)生的新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配。態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)的事件評(píng)估，團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。
【專利說明】
一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于多智能體控制技術(shù)領(lǐng)域，具體涉及一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法。
【背景技術(shù)】
[0002] 信息化戰(zhàn)爭中，各種無人作戰(zhàn)平臺(tái)在戰(zhàn)場上得到越來越廣泛的應(yīng)用，從陸上無人車到水下無人潛艇，再到空中無人機(jī)，無人作戰(zhàn)平臺(tái)能夠充分利用其機(jī)動(dòng)性強(qiáng)、成本低、行動(dòng)隱蔽性能好等優(yōu)勢，執(zhí)行枯燥、惡劣和危險(xiǎn)的任務(wù)，達(dá)到"非接觸、零傷亡"的作戰(zhàn)目標(biāo)。由于作戰(zhàn)環(huán)境的高度動(dòng)態(tài)、不確定性及作戰(zhàn)任務(wù)的復(fù)雜性，基于程序化指揮和控制的無人作戰(zhàn)平臺(tái)對(duì)戰(zhàn)場態(tài)勢的全局判斷和應(yīng)急反應(yīng)能力無法達(dá)到有人作戰(zhàn)平臺(tái)相應(yīng)的水平。因此將無人平臺(tái)融入有人平臺(tái)的任務(wù)環(huán)境，二者協(xié)同指揮共同執(zhí)行作戰(zhàn)任務(wù)無疑將成為未來戰(zhàn)爭中一種新穎的指揮控制模式，該方向研究也得到越來越多國內(nèi)外學(xué)者的關(guān)注。
[0003] 針對(duì)傳統(tǒng)多智能體協(xié)同指揮模式，現(xiàn)有的解決方案主要有以下幾種：
[0004] 方案 1:文獻(xiàn)（B Gerkey，M Mataric · A Framework for studying multi-robot task allocation[C].Proceedings of the 2003International Workshop on Multi-Robot Systems.Washington DC，USA，2003:15-26.)和文獻(xiàn)（Atay N，Bayazit B.Mixed-integer linear programming solution to multi-robot task allocation problem [J] .Washington Univ，2006.)提出了線性規(guī)劃方法，用于解決多智能體任務(wù)分配問題。但其運(yùn)算量隨系統(tǒng)規(guī)模呈指數(shù)級(jí)增長，需要全局信息和集中管理，因而擴(kuò)展性差，效率低。
[0005] 方案2:文獻(xiàn)（Dias M B，Zlot R，Kalra N，et al .Market-based Multi-robot Coordination:A Survey and Analysis[J].Proceedings of the IEEE，2006，94(7): 1257-1270.)和文獻(xiàn)（Zlot R，Stentz A.Market-based Multi-robot Coordination for Complex tasks[J]. International Journal of Robotics Research，2007，25(1):578-589.)提出了一種基于自由市場架構(gòu)的決策控制方法，智能體通過競拍和協(xié)商執(zhí)行多個(gè)子任務(wù)。由于在不確定環(huán)境信息和分布式任務(wù)分配問題中的優(yōu)良性能，該方法被廣泛應(yīng)用于多機(jī)器人分布式目標(biāo)分配中，能夠在規(guī)定的時(shí)間約束下得到滿意的多機(jī)協(xié)同目標(biāo)分配方案。但是該方法資源消耗多，對(duì)通信依賴性高。在資源有限、通信不可靠的環(huán)境中難以發(fā)揮預(yù)期的效果。
[0006] 方案3:文獻(xiàn)（Satterfield B，Choxi H，Housten D.Role Based 0perations[M] .Springer Netherlands，2004.)和文南犬（B.Satterf ield，S·Jameson，H·Choxi，and J.Franke，〃A Role-Based Approach to Unmanned Team Operations，〃in Association for Unmanned Vehicle Systems International conference ,Baltimore,MD, June 2005.)提出一種基于角色的無人團(tuán)隊(duì)指揮方式J亥方式受社會(huì)學(xué)與商業(yè)管理學(xué)研究啟發(fā)，使用人類團(tuán)隊(duì)概念，定義責(zé)任領(lǐng)域和成員內(nèi)在關(guān)系，適應(yīng)人類團(tuán)隊(duì)中的任務(wù)計(jì)劃和執(zhí)行的協(xié)作方式，使無人平臺(tái)自然融入到存在人類的團(tuán)隊(duì)當(dāng)中。但由于其依賴固有的原始作戰(zhàn)方案，缺少完善的態(tài)勢感知單元，以及缺乏事件處理規(guī)則的更新過程，因而難以適應(yīng)動(dòng)態(tài)、不確定的復(fù)雜作戰(zhàn)環(huán)境。

【發(fā)明內(nèi)容】

[0007] 有鑒于此，本發(fā)明提供了一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法，使用該系統(tǒng)及其方法的有人/無人平臺(tái)組成的多智能體系統(tǒng)，其處理事件、分配任務(wù)和完成任務(wù)的過程更加靈活，且更加可靠。
[0008] 為了達(dá)到上述目的，本發(fā)明的技術(shù)方案為:一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)，該系統(tǒng)針對(duì)由有人平臺(tái)和無人平臺(tái)作為團(tuán)隊(duì)成員而組成的團(tuán)隊(duì)進(jìn)行協(xié)同指揮控制，該系統(tǒng)在每個(gè)團(tuán)隊(duì)成員中均設(shè)置基于行為的控制層、面向角色的決策層以及任務(wù)計(jì)劃層。
[0009] 基于行為的控制層提供自動(dòng)巡航和需要連續(xù)傳感器反饋的行為。
[0010] 任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文，任務(wù)報(bào)文包括任務(wù)目標(biāo)、交戰(zhàn)規(guī)則以及明確不同團(tuán)隊(duì) 成員責(zé)任需要的息。
[0011]面向角色的決策層包括團(tuán)隊(duì)角色表，任務(wù)管理器以及態(tài)勢感知器。
[0012] 團(tuán)隊(duì)角色表用于存儲(chǔ)角色信息，角色信息中包括每個(gè)角色對(duì)應(yīng)的團(tuán)隊(duì)成員以及每個(gè)團(tuán)隊(duì)成員的狀態(tài)，其中一個(gè)角色對(duì)應(yīng)多個(gè)團(tuán)隊(duì)成員，一個(gè)團(tuán)隊(duì)成員也對(duì)應(yīng)多種角色，團(tuán)隊(duì) 成員在執(zhí)行不同任務(wù)時(shí)角色不同；在通信無效的狀態(tài)下，依據(jù)團(tuán)隊(duì)角色表預(yù)測團(tuán)隊(duì)成員的行為。
[0013] 任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī)，任務(wù)列表保存初始任務(wù)以及在任務(wù)執(zhí)行過程中產(chǎn)生的新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配。
[0014] 態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)的事件評(píng)估，團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。
[0015] 進(jìn)一步地，包含以下步驟：
[0016] 步驟一、在任務(wù)開始前，有人平臺(tái)中的任務(wù)計(jì)劃層依據(jù)各團(tuán)隊(duì)成員的能力特點(diǎn)，賦予各自角色，基于角色進(jìn)行初始任務(wù)分配，并向團(tuán)隊(duì)成員發(fā)布任務(wù)報(bào)文。
[0017] 步驟二、各團(tuán)隊(duì)成員將接收到的任務(wù)報(bào)文存儲(chǔ)在任務(wù)列表中，并按照優(yōu)先級(jí)原則選取優(yōu)先級(jí)較高的任務(wù)作為將要執(zhí)行的任務(wù);該團(tuán)隊(duì)成員中面向角色的決策層根據(jù)該任務(wù) 類型初始化該團(tuán)隊(duì)成員的角色，生成團(tuán)隊(duì)角色表。
[0018] 步驟二、有人平臺(tái)下達(dá)開始指令，各團(tuán)隊(duì)成員開始執(zhí)行將要執(zhí)行的任務(wù);其中任務(wù) 中涉及自動(dòng)巡航或者需要連續(xù)傳感器反饋的行為由基于行為的控制層執(zhí)行。
[0019] 步驟三、團(tuán)隊(duì)成員在任務(wù)執(zhí)行過程中，決策層中的態(tài)勢感知器采集傳感器反饋信息，采用ΒΡ神經(jīng)網(wǎng)絡(luò)對(duì)環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)進(jìn)行事件評(píng)估。
[0020] 進(jìn)一步地，ΒΡ神經(jīng)網(wǎng)絡(luò)為ΒΡ網(wǎng)絡(luò)結(jié)構(gòu)，激活函數(shù)為s i gmo i d函數(shù)，該ΒΡ神經(jīng)網(wǎng)絡(luò)以傳感器的反饋值作為輸入層神經(jīng)元，其數(shù)量為η，以評(píng)估值作為輸出層神經(jīng)元，其數(shù)量為m;
[0023]節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法。有人平臺(tái)和無人平臺(tái)中預(yù)先設(shè) 置事件處理規(guī)則庫，用于存儲(chǔ)各類事件的處理規(guī)則，有人平臺(tái)和無人平臺(tái)依據(jù)態(tài)勢感知器共享的事件評(píng)估結(jié)果與事件處理規(guī)則庫對(duì)比，采取相應(yīng)處理規(guī)則，若一個(gè)團(tuán)隊(duì)成員的事件評(píng)估結(jié)果超出事件處理規(guī)則庫的范圍，有人平臺(tái)協(xié)助該團(tuán)隊(duì)成員完成事件處理。
[0024]若一團(tuán)隊(duì)成員在任務(wù)執(zhí)行中產(chǎn)生新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu) 先級(jí)將該新任務(wù)發(fā)送給其他團(tuán)隊(duì)成員或自身。
[0025] 事件處理規(guī)則庫中一個(gè)事件評(píng)估結(jié)果對(duì)應(yīng)多種處理規(guī)則，且每種處理規(guī)則具有一個(gè)采用指數(shù)，采用指數(shù)最高的處理規(guī)則為該事件評(píng)估結(jié)果優(yōu)先采取的處理規(guī)則;采用指數(shù) 采用適應(yīng)度函數(shù)進(jìn)行計(jì)算，當(dāng)采用指數(shù)低于設(shè)定閾值時(shí)，對(duì)其進(jìn)行更新。進(jìn)一步地，當(dāng)采用指數(shù)低于設(shè)定閾值時(shí)，對(duì)其進(jìn)行更新的過程具體為：
[0026] i、在事件處理規(guī)則庫中隨機(jī)選取兩個(gè)處理規(guī)則作為父體，每個(gè)處理規(guī)則被選取的概率是其采用指數(shù)的增函數(shù)。
[0027] ii、對(duì)于選中的父體，按照預(yù)設(shè)的交換概率P。進(jìn)行交換，交換后產(chǎn)生兩個(gè)交換后的后代。
[0028] iii、對(duì)于產(chǎn)生的兩個(gè)交換后的后代，分別在每個(gè)位置上按照變異概率Pm發(fā)生變異，產(chǎn)生兩個(gè)變異后的后代。
[0029] iv、若變異后的后代高于閾值時(shí)，則采用該變異后的后代替換一個(gè)低于設(shè)定閾值的采用指數(shù)集，否則轉(zhuǎn)向步驟i。
[0030] 有益效果：
[0031] 1、該方法利用角色概念，適應(yīng)人類團(tuán)隊(duì)的協(xié)作方式，使無人平臺(tái)自然融入到有人團(tuán)隊(duì)當(dāng)中。傳統(tǒng)指揮模式中，有人/無人平臺(tái)之間的協(xié)作往往依賴于高度集中和精確的控制 (如【背景技術(shù)】中方案1、2中所示），難以發(fā)揮無人平臺(tái)的自主性，從而影響指揮效率?；诮?色的指揮模式利用角色這一傳統(tǒng)團(tuán)隊(duì)概念(如【背景技術(shù)】中方案3中所示），使無人平臺(tái)適應(yīng) 人類團(tuán)隊(duì)中的任務(wù)計(jì)劃和執(zhí)行的協(xié)作方式，發(fā)揮無人平臺(tái)自主性，同時(shí)人類可通過角色概念，準(zhǔn)確理解無人平臺(tái)的行為，提高指揮效率。
[0032] 2、該方法基于角色劃定成員責(zé)任范圍，使無人平臺(tái)在不可預(yù)知的復(fù)雜環(huán)境中做出合理響應(yīng)。傳統(tǒng)指揮模式依賴固化的原始作戰(zhàn)方案(如【背景技術(shù)】中方案3中所示），難以對(duì)未知事件做出正確響應(yīng)。基于角色的指揮模式劃定成員責(zé)任范圍，通過態(tài)勢感知和規(guī)則集的動(dòng)態(tài)更新，使無人平臺(tái)適應(yīng)復(fù)雜環(huán)境，對(duì)未知事件做出合理響應(yīng)，提高指揮的靈活性。
[0033] 3、該方法建立分級(jí)感知評(píng)估框架，通過態(tài)勢感知網(wǎng)絡(luò)評(píng)估環(huán)境態(tài)勢、自身狀態(tài)、任務(wù)代價(jià)等進(jìn)行評(píng)估，作為事件處理、任務(wù)分配和角色跳轉(zhuǎn)的依據(jù)，以提高多智能體系統(tǒng)的靈活性。該方法建立事件處理規(guī)則庫更新機(jī)制，通過選擇、交叉和變異等手段創(chuàng)造出新的響應(yīng) 規(guī)則，以維持團(tuán)隊(duì)對(duì)動(dòng)態(tài)變化環(huán)境的適應(yīng)能力，提高多智能體系統(tǒng)可靠性。
[0034] 4、該方法基于角色的隱協(xié)作控制方式，可在動(dòng)態(tài)、快節(jié)奏和通信不可靠的環(huán)境中完成指揮協(xié)作。傳統(tǒng)指揮模式通常對(duì)通信具有較強(qiáng)依賴性，但復(fù)雜戰(zhàn)場環(huán)境往往難以保證可靠的通信，因此導(dǎo)致協(xié)調(diào)指揮和任務(wù)分配的崩潰。隱協(xié)作控制方式在通信失效情況下，基于角色預(yù)測團(tuán)隊(duì)成員行為，根據(jù)預(yù)測對(duì)響應(yīng)做出調(diào)整，因而可在復(fù)雜環(huán)境中完成指揮協(xié)作，提尚指揮魯棒性。
【附圖說明】
[0035] 圖1 一基于角色的有人/無人協(xié)同指揮模式分層結(jié)構(gòu)；
[0036] 圖2-基于角色的任務(wù)分配和事件響應(yīng)示意圖；
[0037]圖3-角色轉(zhuǎn)變流程圖；
[0038]圖4 一態(tài)勢感知網(wǎng)絡(luò)輸入。
【具體實(shí)施方式】
[0039]下面結(jié)合附圖并舉實(shí)施例，對(duì)本發(fā)明進(jìn)行詳細(xì)描述。
[0040] 實(shí)施例1、角色(Role)的概念是根據(jù)具體成員不同的技能特性，對(duì)成員責(zé)任范圍的描述。具體的，一個(gè)角色包括能夠符合角色的能力，角色可勝任的任務(wù)類型以及對(duì)情況或事件的特定行為或反應(yīng)。角色描述有人平臺(tái)、無人平臺(tái)的能力以及團(tuán)隊(duì)對(duì)個(gè)體成員的預(yù)期。無論通信狀況如何，依據(jù)這些預(yù)期可預(yù)測各個(gè)成員在團(tuán)隊(duì)中的行為。定義兩種類型的角色，任務(wù)角色和團(tuán)隊(duì)角色。任務(wù)角色聯(lián)系任務(wù)的執(zhí)行，例如偵察平臺(tái)和武器平臺(tái)。團(tuán)隊(duì)角色聯(lián)系團(tuán) 隊(duì)管理和凝聚，例如協(xié)調(diào)和團(tuán)隊(duì)維護(hù)。
[0041] 本發(fā)明提供的一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)，如圖1所示，該系統(tǒng) 針對(duì)由有人平臺(tái)和無人平臺(tái)作為團(tuán)隊(duì)成員而組成的團(tuán)隊(duì)進(jìn)行協(xié)同指揮控制，該系統(tǒng)在每個(gè) 團(tuán)隊(duì)成員中均設(shè)置基于行為的控制層、面向角色的決策層以及任務(wù)計(jì)劃層。
[0042] 基于行為的控制層提供自動(dòng)巡航和需要連續(xù)傳感器反饋的行為。
[0043] 任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文，任務(wù)報(bào)文包括任務(wù)目標(biāo)、交戰(zhàn)規(guī)則以及明確不同團(tuán)隊(duì) 成員責(zé)任需要的息。
[0044] 面向角色的決策層包括團(tuán)隊(duì)角色表，任務(wù)管理器以及態(tài)勢感知器。
[0045] 團(tuán)隊(duì)角色表用于存儲(chǔ)角色信息，角色信息中包括每個(gè)角色對(duì)應(yīng)的團(tuán)隊(duì)成員以及每個(gè)團(tuán)隊(duì)成員的狀態(tài)，其中一個(gè)角色對(duì)應(yīng)多個(gè)團(tuán)隊(duì)成員，一個(gè)團(tuán)隊(duì)成員也對(duì)應(yīng)多種角色，團(tuán)隊(duì) 成員在執(zhí)行不同任務(wù)時(shí)角色不同；在通信無效的狀態(tài)下，依據(jù)團(tuán)隊(duì)角色表預(yù)測團(tuán)隊(duì)成員的行為。
[0046] 任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī)，任務(wù)列表保存初始任務(wù)以及在任務(wù)執(zhí)行過程中產(chǎn)生的新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配。
[0047] 態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)的事件評(píng)估，團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。
[0048]圖2顯示基于角色的任務(wù)分配流程。團(tuán)隊(duì)角色表根據(jù)各成員能力水平分配各成員可勝任的角色。任務(wù)管理器訪問團(tuán)隊(duì)角色表和任務(wù)角色表，確定執(zhí)行任務(wù)的最優(yōu)個(gè)體，通過全局優(yōu)化得到最優(yōu)分配方案。
[0049] 圖3顯示個(gè)體成員角色轉(zhuǎn)變流程。開始時(shí)個(gè)體從任務(wù)列表中選取優(yōu)先級(jí)較高的任務(wù)開始執(zhí)行。由于角色代表了個(gè)體的職責(zé)，每種角色對(duì)應(yīng)一種任務(wù)，因此當(dāng)個(gè)體決定執(zhí)行一種任務(wù)時(shí)，實(shí)際上選擇自己轉(zhuǎn)變?yōu)閷?duì)應(yīng)的角色，履行相應(yīng)的職責(zé)。確定角色后，個(gè)體按照該角色進(jìn)行任務(wù)執(zhí)行和事件響應(yīng)。最后更新團(tuán)隊(duì)角色表中自身狀態(tài)。當(dāng)接收到主機(jī)或其他分機(jī)的任務(wù)時(shí)，將其加入任務(wù)列表。
[0050] 實(shí)施例2、在上述基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的基礎(chǔ)上，本發(fā)明提供了一種控制方法，包含以下步驟：
[0051] 步驟一、在任務(wù)開始前，有人平臺(tái)中的任務(wù)計(jì)劃層依據(jù)各團(tuán)隊(duì)成員的能力特點(diǎn)，賦予各自角色，基于角色進(jìn)行初始任務(wù)分配，并向團(tuán)隊(duì)成員發(fā)布任務(wù)報(bào)文。
[0052] 步驟二、各團(tuán)隊(duì)成員將接受到的任務(wù)報(bào)文存儲(chǔ)在任務(wù)列表中，并按照優(yōu)先級(jí)原則選取優(yōu)先級(jí)較高的任務(wù)作為將要執(zhí)行的任務(wù);該團(tuán)隊(duì)成員中面向角色的決策層根據(jù)該任務(wù) 類型初始化該團(tuán)隊(duì)成員的角色，生成團(tuán)隊(duì)角色表。
[0053] 步驟二、有人平臺(tái)下達(dá)開始指令，各團(tuán)隊(duì)成員開始執(zhí)行將要執(zhí)行的任務(wù)。其中任務(wù) 中涉及自動(dòng)巡航或者需要連續(xù)傳感器反饋的行為由基于行為的控制層執(zhí)行。
[0054]步驟三、團(tuán)隊(duì)成員在任務(wù)執(zhí)行過程中，決策層中的態(tài)勢感知器采集傳感器反饋信息，采用BP神經(jīng)網(wǎng)絡(luò)對(duì)環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)進(jìn)行事件評(píng)估。
[0055] BP神經(jīng)網(wǎng)絡(luò)為BP網(wǎng)絡(luò)結(jié)構(gòu)，激活函數(shù)為sigmoid函數(shù)，該BP神經(jīng)網(wǎng)絡(luò)以傳感器的反饋值作為輸入層神經(jīng)元，其數(shù)量為η，以評(píng)估值作為輸出層神經(jīng)元，其數(shù)量為m;
[0058]節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法。
[0059]本實(shí)施例中其中，考慮到戰(zhàn)場環(huán)境的復(fù)雜性，評(píng)估的過程利用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)，通過專家經(jīng)驗(yàn)訓(xùn)練好的網(wǎng)絡(luò)來進(jìn)行評(píng)估層面的工作。以下以威脅度評(píng)估為例進(jìn)行神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)：
[0060] (1)設(shè)計(jì)網(wǎng)絡(luò)的輸入輸出
[0061 ]以傳感器的反饋值作為輸入;評(píng)估值作為輸出
[0062] 針對(duì)具體情境，說明該感知框架的應(yīng)用，戰(zhàn)場環(huán)境為偵察車和坦克混合編隊(duì)執(zhí)行偵查區(qū)域任務(wù)。
[0063] 對(duì)于沒有打擊能力的偵察車，可從傳感器中得到數(shù)據(jù)信息如圖4(a)作為態(tài)勢感知神經(jīng)網(wǎng)絡(luò)的輸入。可根據(jù)這些量對(duì)當(dāng)前的態(tài)勢進(jìn)行評(píng)估，獲取當(dāng)前的態(tài)勢評(píng)估，網(wǎng)絡(luò)輸出及對(duì)應(yīng)的評(píng)估結(jié)果如表(輸出范圍0~5):
[0065] (2)坦克車
[0066] 同樣，考慮坦克車的因素如圖4(b)所示，其中包括監(jiān)控得到的自身信息以及輸入的環(huán)境信息?？筛鶕?jù)這些量對(duì)當(dāng)前的態(tài)勢進(jìn)行評(píng)估，獲取當(dāng)前的態(tài)勢評(píng)估，網(wǎng)絡(luò)輸出及對(duì)應(yīng) 的評(píng)估結(jié)果如表：

[0068]為了得到一個(gè)能客觀體現(xiàn)目標(biāo)威脅度的BP神經(jīng)網(wǎng)絡(luò)，對(duì)訓(xùn)練網(wǎng)絡(luò)的樣本采集要求很高。需要通過按照式(1)歸一化來提高訓(xùn)練效果：
[0070] u為輸入(傳感器的輸出數(shù)據(jù)），min和max為該傳感器的測量范圍。
[0071] (2)建立神經(jīng)網(wǎng)絡(luò)
[0072]采用BP網(wǎng)絡(luò)結(jié)構(gòu)，激活函數(shù)為sigmoid函數(shù)形式為式(2)
[0076]其中1為隱層神經(jīng)元個(gè)數(shù)，η為輸入層神經(jīng)元數(shù)，m為輸出層神經(jīng)元數(shù)，p為樣本總數(shù) (訓(xùn)練樣本)。
[0077]設(shè)計(jì)學(xué)習(xí)算法，節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法，其調(diào)節(jié)方式為式⑷
[0079]匕神經(jīng)網(wǎng)絡(luò)輸出值與樣本期望輸出值之差的絕對(duì)值;節(jié)點(diǎn)權(quán)值，η學(xué)習(xí)率，預(yù)設(shè) 的常數(shù)值；
[0080] (3)設(shè)計(jì)訓(xùn)練樣本：
[0081] 利用10折交叉確認(rèn)法，即將100組樣本數(shù)據(jù)平均分成10個(gè)部分，每一份用作測試，剩余的進(jìn)行樣本訓(xùn)練。這個(gè)過程一共重復(fù)10次，最終每一部分樣本都有機(jī)會(huì)進(jìn)行測試。 [0082]有人平臺(tái)和無人平臺(tái)中預(yù)先設(shè)置事件處理規(guī)則庫，用于存儲(chǔ)各類事件的處理規(guī) 貝1J，有人平臺(tái)和無人平臺(tái)依據(jù)態(tài)勢感知器共享的事件評(píng)估結(jié)果與事件處理規(guī)則庫對(duì)比，采取相應(yīng)處理規(guī)則，若一個(gè)團(tuán)隊(duì)成員的事件評(píng)估結(jié)果超出事件處理規(guī)則庫的范圍，有人平臺(tái) 協(xié)助該團(tuán)隊(duì)成員完成事件處理。
[0083]若一團(tuán)隊(duì)成員在任務(wù)執(zhí)行中產(chǎn)生新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu) 先級(jí)將該新任務(wù)發(fā)送給其他團(tuán)隊(duì)成員或自身；
[0084] 事件處理規(guī)則庫中一個(gè)事件評(píng)估結(jié)果對(duì)應(yīng)多種處理規(guī)則，且每種處理規(guī)則具有一個(gè)采用指數(shù)，采用指數(shù)最高的處理規(guī)則為該事件評(píng)估結(jié)果優(yōu)先采取的處理規(guī)則;采用指數(shù) 采用適應(yīng)度函數(shù)進(jìn)行計(jì)算，當(dāng)采用指數(shù)低于設(shè)定閾值時(shí)，對(duì)其進(jìn)行更新，過程具體為：
[0085] i、在事件處理規(guī)則庫中隨機(jī)選取兩個(gè)處理規(guī)則作為父體，每個(gè)處理規(guī)則被選取的概率是其采用指數(shù)的增函數(shù)；
[0086] ii、對(duì)于選中的父體，按照預(yù)設(shè)的交換概率P。進(jìn)行交換，交換后產(chǎn)生兩個(gè)交換后的后代；
[0087] iii、對(duì)于產(chǎn)生的兩個(gè)交換后的后代，分別在每個(gè)位置上按照變異概率Pm發(fā)生變異，產(chǎn)生兩個(gè)變異后的后代；
[0088] iv、若變異后的后代高于閾值時(shí)，則采用該變異后的后代替換一個(gè)地獄設(shè)定閾值的采用指數(shù)集，否則轉(zhuǎn)向步驟i。
[0089]綜上，以上僅為本發(fā)明的較佳實(shí)施例而已，并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù) 范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)，其特征在于，該系統(tǒng)針對(duì)由有人平臺(tái) 和無人平臺(tái)作為團(tuán)隊(duì)成員而組成的團(tuán)隊(duì)進(jìn)行協(xié)同指揮控制，該系統(tǒng)在每個(gè)團(tuán)隊(duì)成員中均設(shè) 置基于行為的控制層、面向角色的決策層W及任務(wù)計(jì)劃層；所述基于行為的控制層提供自動(dòng)巡航和需要連續(xù)傳感器反饋的行為；所述任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文，所述任務(wù)報(bào)文包括任務(wù)目標(biāo)、交戰(zhàn)規(guī)則W及明確不同團(tuán)隊(duì)成員責(zé)任需要的信息；所述面向角色的決策層包括團(tuán)隊(duì)角色表，任務(wù)管理器W及態(tài)勢感知器；所述團(tuán)隊(duì)角色表用于存儲(chǔ)角色信息，角色信息中包括每個(gè)角色對(duì)應(yīng)的團(tuán)隊(duì)成員W及每個(gè)團(tuán)隊(duì)成員的狀態(tài)，其中一個(gè)角色對(duì)應(yīng)多個(gè)團(tuán)隊(duì)成員，一個(gè)團(tuán)隊(duì)成員也對(duì)應(yīng)多種角色，團(tuán)隊(duì) 成員在執(zhí)行不同任務(wù)時(shí)角色不同；在通信無效的狀態(tài)下，依據(jù)團(tuán)隊(duì)角色表預(yù)測團(tuán)隊(duì)成員的行為；所述任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī)，任務(wù)列表保存初始任務(wù)W及在任務(wù)執(zhí)行過程中產(chǎn)生的新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表W及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配；所述態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)W及任務(wù)代價(jià)的事件評(píng)估，團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。2. -種如權(quán)利要求1所述的基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的控制方法，其特征在于，包含W下步驟：步驟一、在任務(wù)開始前，有人平臺(tái)中的任務(wù)計(jì)劃層依據(jù)各團(tuán)隊(duì)成員的能力特點(diǎn)，賦予各自角色，基于角色進(jìn)行初始任務(wù)分配，并向團(tuán)隊(duì)成員發(fā)布任務(wù)報(bào)文；步驟二、各團(tuán)隊(duì)成員將接收到的任務(wù)報(bào)文存儲(chǔ)在任務(wù)列表中，并按照優(yōu)先級(jí)原則選取優(yōu)先級(jí)較高的任務(wù)作為將要執(zhí)行的任務(wù);該團(tuán)隊(duì)成員中面向角色的決策層根據(jù)該任務(wù)類型初始化該團(tuán)隊(duì)成員的角色，生成團(tuán)隊(duì)角色表；步驟二、有人平臺(tái)下達(dá)開始指令，各團(tuán)隊(duì)成員開始執(zhí)行所述將要執(zhí)行的任務(wù);其中任務(wù) 中設(shè)及自動(dòng)巡航或者需要連續(xù)傳感器反饋的行為由所述基于行為的控制層執(zhí)行；步驟Ξ、團(tuán)隊(duì)成員在任務(wù)執(zhí)行過程中，決策層中的態(tài)勢感知器采集傳感器反饋信息，采用BP神經(jīng)網(wǎng)絡(luò)對(duì)環(huán)境態(tài)勢、自身狀態(tài)W及任務(wù)代價(jià)進(jìn)行事件評(píng)估；有人平臺(tái)和無人平臺(tái)中預(yù)先設(shè)置事件處理規(guī)則庫，用于存儲(chǔ)各類事件的處理規(guī)則，有人平臺(tái)和無人平臺(tái)依據(jù)態(tài)勢感知器共享的事件評(píng)估結(jié)果與事件處理規(guī)則庫對(duì)比，采取相應(yīng) 處理規(guī)則，若一個(gè)團(tuán)隊(duì)成員的事件評(píng)估結(jié)果超出事件處理規(guī)則庫的范圍，有人平臺(tái)協(xié)助該團(tuán)隊(duì)成員完成事件處理；若一團(tuán)隊(duì)成員在任務(wù)執(zhí)行中產(chǎn)生新任務(wù)，任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表W及任務(wù)優(yōu)先級(jí) 將該新任務(wù)發(fā)送給其他團(tuán)隊(duì)成員或自身；所述事件處理規(guī)則庫中一個(gè)事件評(píng)估結(jié)果對(duì)應(yīng)多種處理規(guī)則，且每種處理規(guī)則具有一個(gè)采用指數(shù)，采用指數(shù)最高的處理規(guī)則為該事件評(píng)估結(jié)果優(yōu)先采取的處理規(guī)則;所述采用指數(shù)采用適應(yīng)度函數(shù)進(jìn)行計(jì)算，當(dāng)采用指數(shù)低于設(shè)定闊值時(shí)，對(duì)其進(jìn)行更新。3. 如權(quán)利要求2所述的基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的控制方法，其特征在于，所述BP神經(jīng)網(wǎng)絡(luò)為BP網(wǎng)絡(luò)結(jié)構(gòu)，激活函數(shù)為sigmoid函數(shù)，該BP神經(jīng)網(wǎng)絡(luò)W傳感器的反饋值作為輸入層神經(jīng)元，其數(shù)量為η，W評(píng)估值作為輸出層神經(jīng)元，其數(shù)量為m; 節(jié)點(diǎn)數(shù)量/ = V"十。!; 訓(xùn)練樣本數(shù)i節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法。4.如權(quán)利要求2所述的基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的控制方法，其特征在于，所述當(dāng)采用指數(shù)低于設(shè)定闊值時(shí)，對(duì)其進(jìn)行更新的過程具體為： i、在事件處理規(guī)則庫中隨機(jī)選取兩個(gè)處理規(guī)則作為父體，每個(gè)處理規(guī)則被選取的概率是其采用指數(shù)的增函數(shù)； ii、對(duì)于選中的父體，按照預(yù)設(shè)的交換概率P。進(jìn)行交換，交換后產(chǎn)生兩個(gè)交換后的后代； iii、對(duì)于產(chǎn)生的兩個(gè)交換后的后代，分別在每個(gè)位置上按照變異概率P"發(fā)生變異，產(chǎn)生兩個(gè)變異后的后代； iv、若變異后的后代高于闊值時(shí)，則采用該變異后的后代替換一個(gè)低于設(shè)定闊值的采用指數(shù)集，否則轉(zhuǎn)向步驟i。
【文檔編號(hào)】G06Q10/10GK106096911SQ201610391084
【公開日】2016年11月9日
【申請(qǐng)日】2016年6月3日公開號(hào)201610391084.5, CN 106096911 A, CN 106096911A, CN 201610391084, CN-A-106096911, CN106096911 A, CN106096911A, CN201610391084, CN201610391084.5
【發(fā)明人】方浩, 陳杰, 張浩
【申請(qǐng)人】北京理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：方浩;陳杰;張浩;
技術(shù)所有人：北京理工大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

無人機(jī)協(xié)同相關(guān)技術(shù)

多無人機(jī)協(xié)同作戰(zhàn)技術(shù)相關(guān)技術(shù)

多無人機(jī)協(xié)同任務(wù)規(guī)劃相關(guān)技術(shù)

無人機(jī)協(xié)同路徑規(guī)劃相關(guān)技術(shù)

無人機(jī)指揮車相關(guān)技術(shù)

多無人機(jī)協(xié)同相關(guān)技術(shù)

無人機(jī)指揮控制系統(tǒng)相關(guān)技術(shù)

無人機(jī)協(xié)同決策與控制相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法