两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法

文檔序號(hào):10726004閱讀:706來源:國知局
一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法
【專利摘要】本發(fā)明提供了一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法,該系統(tǒng)在每個(gè)團(tuán)隊(duì)成員中均設(shè)置基于行為的控制層、面向角色的決策層以及任務(wù)計(jì)劃層??刂茖犹峁┳詣?dòng)巡航和需要連續(xù)傳感器反饋的行為。任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文。面向角色的決策層包括團(tuán)隊(duì)角色表,任務(wù)管理器以及態(tài)勢感知器。團(tuán)隊(duì)角色表存儲(chǔ)角色信息。任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī),任務(wù)列表保存初始任務(wù)以及在任務(wù)執(zhí)行過程中產(chǎn)生的新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配。態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)的事件評(píng)估,團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。
【專利說明】
一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于多智能體控制技術(shù)領(lǐng)域,具體涉及一種基于角色的有人/無人協(xié)同指 揮控制系統(tǒng)及其方法。
【背景技術(shù)】
[0002] 信息化戰(zhàn)爭中,各種無人作戰(zhàn)平臺(tái)在戰(zhàn)場上得到越來越廣泛的應(yīng)用,從陸上無人 車到水下無人潛艇,再到空中無人機(jī),無人作戰(zhàn)平臺(tái)能夠充分利用其機(jī)動(dòng)性強(qiáng)、成本低、行 動(dòng)隱蔽性能好等優(yōu)勢,執(zhí)行枯燥、惡劣和危險(xiǎn)的任務(wù),達(dá)到"非接觸、零傷亡"的作戰(zhàn)目標(biāo)。由 于作戰(zhàn)環(huán)境的高度動(dòng)態(tài)、不確定性及作戰(zhàn)任務(wù)的復(fù)雜性,基于程序化指揮和控制的無人作 戰(zhàn)平臺(tái)對(duì)戰(zhàn)場態(tài)勢的全局判斷和應(yīng)急反應(yīng)能力無法達(dá)到有人作戰(zhàn)平臺(tái)相應(yīng)的水平。因此將 無人平臺(tái)融入有人平臺(tái)的任務(wù)環(huán)境,二者協(xié)同指揮共同執(zhí)行作戰(zhàn)任務(wù)無疑將成為未來戰(zhàn)爭 中一種新穎的指揮控制模式,該方向研究也得到越來越多國內(nèi)外學(xué)者的關(guān)注。
[0003] 針對(duì)傳統(tǒng)多智能體協(xié)同指揮模式,現(xiàn)有的解決方案主要有以下幾種:
[0004] 方案 1:文獻(xiàn)(B Gerkey,M Mataric · A Framework for studying multi-robot task allocation[C].Proceedings of the 2003International Workshop on Multi-Robot Systems.Washington DC,USA,2003:15-26.)和文獻(xiàn)(Atay N,Bayazit B.Mixed-integer linear programming solution to multi-robot task allocation problem [J] .Washington Univ,2006.)提出了線性規(guī)劃方法,用于解決多智能體任務(wù)分配問題。但 其運(yùn)算量隨系統(tǒng)規(guī)模呈指數(shù)級(jí)增長,需要全局信息和集中管理,因而擴(kuò)展性差,效率低。
[0005] 方案2:文獻(xiàn)(Dias M B,Zlot R,Kalra N,et al .Market-based Multi-robot Coordination:A Survey and Analysis[J].Proceedings of the IEEE,2006,94(7): 1257-1270.)和文獻(xiàn)(Zlot R,Stentz A.Market-based Multi-robot Coordination for Complex tasks[J]. International Journal of Robotics Research,2007,25(1):578-589.)提出了一種基于自由市場架構(gòu)的決策控制方法,智能體通過競拍和協(xié)商執(zhí)行多個(gè)子 任務(wù)。由于在不確定環(huán)境信息和分布式任務(wù)分配問題中的優(yōu)良性能,該方法被廣泛應(yīng)用于 多機(jī)器人分布式目標(biāo)分配中,能夠在規(guī)定的時(shí)間約束下得到滿意的多機(jī)協(xié)同目標(biāo)分配方 案。但是該方法資源消耗多,對(duì)通信依賴性高。在資源有限、通信不可靠的環(huán)境中難以發(fā)揮 預(yù)期的效果。
[0006] 方案3:文獻(xiàn)(Satterfield B,Choxi H,Housten D.Role Based 0perations[M] .Springer Netherlands,2004.)和文南犬(B.Satterf ield,S·Jameson,H·Choxi,and J.Franke,〃A Role-Based Approach to Unmanned Team Operations,〃in Association for Unmanned Vehicle Systems International conference ,Baltimore,MD, June 2005.)提出一種基于角色的無人團(tuán)隊(duì)指揮方式J亥方式受社會(huì)學(xué)與商業(yè)管理學(xué)研究啟發(fā), 使用人類團(tuán)隊(duì)概念,定義責(zé)任領(lǐng)域和成員內(nèi)在關(guān)系,適應(yīng)人類團(tuán)隊(duì)中的任務(wù)計(jì)劃和執(zhí)行的 協(xié)作方式,使無人平臺(tái)自然融入到存在人類的團(tuán)隊(duì)當(dāng)中。但由于其依賴固有的原始作戰(zhàn)方 案,缺少完善的態(tài)勢感知單元,以及缺乏事件處理規(guī)則的更新過程,因而難以適應(yīng)動(dòng)態(tài)、不 確定的復(fù)雜作戰(zhàn)環(huán)境。

【發(fā)明內(nèi)容】

[0007] 有鑒于此,本發(fā)明提供了一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng)及其方法, 使用該系統(tǒng)及其方法的有人/無人平臺(tái)組成的多智能體系統(tǒng),其處理事件、分配任務(wù)和完成 任務(wù)的過程更加靈活,且更加可靠。
[0008] 為了達(dá)到上述目的,本發(fā)明的技術(shù)方案為:一種基于角色的有人/無人協(xié)同指揮控 制系統(tǒng),該系統(tǒng)針對(duì)由有人平臺(tái)和無人平臺(tái)作為團(tuán)隊(duì)成員而組成的團(tuán)隊(duì)進(jìn)行協(xié)同指揮控 制,該系統(tǒng)在每個(gè)團(tuán)隊(duì)成員中均設(shè)置基于行為的控制層、面向角色的決策層以及任務(wù)計(jì)劃 層。
[0009] 基于行為的控制層提供自動(dòng)巡航和需要連續(xù)傳感器反饋的行為。
[0010] 任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文,任務(wù)報(bào)文包括任務(wù)目標(biāo)、交戰(zhàn)規(guī)則以及明確不同團(tuán)隊(duì) 成員責(zé)任需要的息。
[0011]面向角色的決策層包括團(tuán)隊(duì)角色表,任務(wù)管理器以及態(tài)勢感知器。
[0012] 團(tuán)隊(duì)角色表用于存儲(chǔ)角色信息,角色信息中包括每個(gè)角色對(duì)應(yīng)的團(tuán)隊(duì)成員以及每 個(gè)團(tuán)隊(duì)成員的狀態(tài),其中一個(gè)角色對(duì)應(yīng)多個(gè)團(tuán)隊(duì)成員,一個(gè)團(tuán)隊(duì)成員也對(duì)應(yīng)多種角色,團(tuán)隊(duì) 成員在執(zhí)行不同任務(wù)時(shí)角色不同;在通信無效的狀態(tài)下,依據(jù)團(tuán)隊(duì)角色表預(yù)測團(tuán)隊(duì)成員的 行為。
[0013] 任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī),任務(wù)列表保存初始任務(wù)以及在任務(wù)執(zhí)行 過程中產(chǎn)生的新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配。
[0014] 態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代 價(jià)的事件評(píng)估,團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。
[0015] 進(jìn)一步地,包含以下步驟:
[0016] 步驟一、在任務(wù)開始前,有人平臺(tái)中的任務(wù)計(jì)劃層依據(jù)各團(tuán)隊(duì)成員的能力特點(diǎn),賦 予各自角色,基于角色進(jìn)行初始任務(wù)分配,并向團(tuán)隊(duì)成員發(fā)布任務(wù)報(bào)文。
[0017] 步驟二、各團(tuán)隊(duì)成員將接收到的任務(wù)報(bào)文存儲(chǔ)在任務(wù)列表中,并按照優(yōu)先級(jí)原則 選取優(yōu)先級(jí)較高的任務(wù)作為將要執(zhí)行的任務(wù);該團(tuán)隊(duì)成員中面向角色的決策層根據(jù)該任務(wù) 類型初始化該團(tuán)隊(duì)成員的角色,生成團(tuán)隊(duì)角色表。
[0018] 步驟二、有人平臺(tái)下達(dá)開始指令,各團(tuán)隊(duì)成員開始執(zhí)行將要執(zhí)行的任務(wù);其中任務(wù) 中涉及自動(dòng)巡航或者需要連續(xù)傳感器反饋的行為由基于行為的控制層執(zhí)行。
[0019] 步驟三、團(tuán)隊(duì)成員在任務(wù)執(zhí)行過程中,決策層中的態(tài)勢感知器采集傳感器反饋信 息,采用ΒΡ神經(jīng)網(wǎng)絡(luò)對(duì)環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)進(jìn)行事件評(píng)估。
[0020] 進(jìn)一步地,ΒΡ神經(jīng)網(wǎng)絡(luò)為ΒΡ網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)為s i gmo i d函數(shù),該ΒΡ神經(jīng)網(wǎng)絡(luò)以 傳感器的反饋值作為輸入層神經(jīng)元,其數(shù)量為η,以評(píng)估值作為輸出層神經(jīng)元,其數(shù)量為m;
[0023]節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法。有人平臺(tái)和無人平臺(tái)中預(yù)先設(shè) 置事件處理規(guī)則庫,用于存儲(chǔ)各類事件的處理規(guī)則,有人平臺(tái)和無人平臺(tái)依據(jù)態(tài)勢感知器 共享的事件評(píng)估結(jié)果與事件處理規(guī)則庫對(duì)比,采取相應(yīng)處理規(guī)則,若一個(gè)團(tuán)隊(duì)成員的事件 評(píng)估結(jié)果超出事件處理規(guī)則庫的范圍,有人平臺(tái)協(xié)助該團(tuán)隊(duì)成員完成事件處理。
[0024]若一團(tuán)隊(duì)成員在任務(wù)執(zhí)行中產(chǎn)生新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu) 先級(jí)將該新任務(wù)發(fā)送給其他團(tuán)隊(duì)成員或自身。
[0025] 事件處理規(guī)則庫中一個(gè)事件評(píng)估結(jié)果對(duì)應(yīng)多種處理規(guī)則,且每種處理規(guī)則具有一 個(gè)采用指數(shù),采用指數(shù)最高的處理規(guī)則為該事件評(píng)估結(jié)果優(yōu)先采取的處理規(guī)則;采用指數(shù) 采用適應(yīng)度函數(shù)進(jìn)行計(jì)算,當(dāng)采用指數(shù)低于設(shè)定閾值時(shí),對(duì)其進(jìn)行更新。進(jìn)一步地,當(dāng)采用 指數(shù)低于設(shè)定閾值時(shí),對(duì)其進(jìn)行更新的過程具體為:
[0026] i、在事件處理規(guī)則庫中隨機(jī)選取兩個(gè)處理規(guī)則作為父體,每個(gè)處理規(guī)則被選取的 概率是其采用指數(shù)的增函數(shù)。
[0027] ii、對(duì)于選中的父體,按照預(yù)設(shè)的交換概率P。進(jìn)行交換,交換后產(chǎn)生兩個(gè)交換后的 后代。
[0028] iii、對(duì)于產(chǎn)生的兩個(gè)交換后的后代,分別在每個(gè)位置上按照變異概率Pm發(fā)生變 異,產(chǎn)生兩個(gè)變異后的后代。
[0029] iv、若變異后的后代高于閾值時(shí),則采用該變異后的后代替換一個(gè)低于設(shè)定閾值 的采用指數(shù)集,否則轉(zhuǎn)向步驟i。
[0030] 有益效果:
[0031] 1、該方法利用角色概念,適應(yīng)人類團(tuán)隊(duì)的協(xié)作方式,使無人平臺(tái)自然融入到有人 團(tuán)隊(duì)當(dāng)中。傳統(tǒng)指揮模式中,有人/無人平臺(tái)之間的協(xié)作往往依賴于高度集中和精確的控制 (如【背景技術(shù)】中方案1、2中所示),難以發(fā)揮無人平臺(tái)的自主性,從而影響指揮效率?;诮?色的指揮模式利用角色這一傳統(tǒng)團(tuán)隊(duì)概念(如【背景技術(shù)】中方案3中所示),使無人平臺(tái)適應(yīng) 人類團(tuán)隊(duì)中的任務(wù)計(jì)劃和執(zhí)行的協(xié)作方式,發(fā)揮無人平臺(tái)自主性,同時(shí)人類可通過角色概 念,準(zhǔn)確理解無人平臺(tái)的行為,提高指揮效率。
[0032] 2、該方法基于角色劃定成員責(zé)任范圍,使無人平臺(tái)在不可預(yù)知的復(fù)雜環(huán)境中做出 合理響應(yīng)。傳統(tǒng)指揮模式依賴固化的原始作戰(zhàn)方案(如【背景技術(shù)】中方案3中所示),難以對(duì)未 知事件做出正確響應(yīng)。基于角色的指揮模式劃定成員責(zé)任范圍,通過態(tài)勢感知和規(guī)則集的 動(dòng)態(tài)更新,使無人平臺(tái)適應(yīng)復(fù)雜環(huán)境,對(duì)未知事件做出合理響應(yīng),提高指揮的靈活性。
[0033] 3、該方法建立分級(jí)感知評(píng)估框架,通過態(tài)勢感知網(wǎng)絡(luò)評(píng)估環(huán)境態(tài)勢、自身狀態(tài)、任 務(wù)代價(jià)等進(jìn)行評(píng)估,作為事件處理、任務(wù)分配和角色跳轉(zhuǎn)的依據(jù),以提高多智能體系統(tǒng)的靈 活性。該方法建立事件處理規(guī)則庫更新機(jī)制,通過選擇、交叉和變異等手段創(chuàng)造出新的響應(yīng) 規(guī)則,以維持團(tuán)隊(duì)對(duì)動(dòng)態(tài)變化環(huán)境的適應(yīng)能力,提高多智能體系統(tǒng)可靠性。
[0034] 4、該方法基于角色的隱協(xié)作控制方式,可在動(dòng)態(tài)、快節(jié)奏和通信不可靠的環(huán)境中 完成指揮協(xié)作。傳統(tǒng)指揮模式通常對(duì)通信具有較強(qiáng)依賴性,但復(fù)雜戰(zhàn)場環(huán)境往往難以保證 可靠的通信,因此導(dǎo)致協(xié)調(diào)指揮和任務(wù)分配的崩潰。隱協(xié)作控制方式在通信失效情況下,基 于角色預(yù)測團(tuán)隊(duì)成員行為,根據(jù)預(yù)測對(duì)響應(yīng)做出調(diào)整,因而可在復(fù)雜環(huán)境中完成指揮協(xié)作, 提尚指揮魯棒性。
【附圖說明】
[0035] 圖1 一基于角色的有人/無人協(xié)同指揮模式分層結(jié)構(gòu);
[0036] 圖2-基于角色的任務(wù)分配和事件響應(yīng)示意圖;
[0037]圖3-角色轉(zhuǎn)變流程圖;
[0038]圖4 一態(tài)勢感知網(wǎng)絡(luò)輸入。
【具體實(shí)施方式】
[0039]下面結(jié)合附圖并舉實(shí)施例,對(duì)本發(fā)明進(jìn)行詳細(xì)描述。
[0040] 實(shí)施例1、角色(Role)的概念是根據(jù)具體成員不同的技能特性,對(duì)成員責(zé)任范圍的 描述。具體的,一個(gè)角色包括能夠符合角色的能力,角色可勝任的任務(wù)類型以及對(duì)情況或事 件的特定行為或反應(yīng)。角色描述有人平臺(tái)、無人平臺(tái)的能力以及團(tuán)隊(duì)對(duì)個(gè)體成員的預(yù)期。無 論通信狀況如何,依據(jù)這些預(yù)期可預(yù)測各個(gè)成員在團(tuán)隊(duì)中的行為。定義兩種類型的角色,任 務(wù)角色和團(tuán)隊(duì)角色。任務(wù)角色聯(lián)系任務(wù)的執(zhí)行,例如偵察平臺(tái)和武器平臺(tái)。團(tuán)隊(duì)角色聯(lián)系團(tuán) 隊(duì)管理和凝聚,例如協(xié)調(diào)和團(tuán)隊(duì)維護(hù)。
[0041] 本發(fā)明提供的一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng),如圖1所示,該系統(tǒng) 針對(duì)由有人平臺(tái)和無人平臺(tái)作為團(tuán)隊(duì)成員而組成的團(tuán)隊(duì)進(jìn)行協(xié)同指揮控制,該系統(tǒng)在每個(gè) 團(tuán)隊(duì)成員中均設(shè)置基于行為的控制層、面向角色的決策層以及任務(wù)計(jì)劃層。
[0042] 基于行為的控制層提供自動(dòng)巡航和需要連續(xù)傳感器反饋的行為。
[0043] 任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文,任務(wù)報(bào)文包括任務(wù)目標(biāo)、交戰(zhàn)規(guī)則以及明確不同團(tuán)隊(duì) 成員責(zé)任需要的息。
[0044] 面向角色的決策層包括團(tuán)隊(duì)角色表,任務(wù)管理器以及態(tài)勢感知器。
[0045] 團(tuán)隊(duì)角色表用于存儲(chǔ)角色信息,角色信息中包括每個(gè)角色對(duì)應(yīng)的團(tuán)隊(duì)成員以及每 個(gè)團(tuán)隊(duì)成員的狀態(tài),其中一個(gè)角色對(duì)應(yīng)多個(gè)團(tuán)隊(duì)成員,一個(gè)團(tuán)隊(duì)成員也對(duì)應(yīng)多種角色,團(tuán)隊(duì) 成員在執(zhí)行不同任務(wù)時(shí)角色不同;在通信無效的狀態(tài)下,依據(jù)團(tuán)隊(duì)角色表預(yù)測團(tuán)隊(duì)成員的 行為。
[0046] 任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī),任務(wù)列表保存初始任務(wù)以及在任務(wù)執(zhí)行 過程中產(chǎn)生的新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配。
[0047] 態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代 價(jià)的事件評(píng)估,團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。
[0048]圖2顯示基于角色的任務(wù)分配流程。團(tuán)隊(duì)角色表根據(jù)各成員能力水平分配各成員 可勝任的角色。任務(wù)管理器訪問團(tuán)隊(duì)角色表和任務(wù)角色表,確定執(zhí)行任務(wù)的最優(yōu)個(gè)體,通過 全局優(yōu)化得到最優(yōu)分配方案。
[0049] 圖3顯示個(gè)體成員角色轉(zhuǎn)變流程。開始時(shí)個(gè)體從任務(wù)列表中選取優(yōu)先級(jí)較高的任 務(wù)開始執(zhí)行。由于角色代表了個(gè)體的職責(zé),每種角色對(duì)應(yīng)一種任務(wù),因此當(dāng)個(gè)體決定執(zhí)行一 種任務(wù)時(shí),實(shí)際上選擇自己轉(zhuǎn)變?yōu)閷?duì)應(yīng)的角色,履行相應(yīng)的職責(zé)。確定角色后,個(gè)體按照該 角色進(jìn)行任務(wù)執(zhí)行和事件響應(yīng)。最后更新團(tuán)隊(duì)角色表中自身狀態(tài)。當(dāng)接收到主機(jī)或其他分 機(jī)的任務(wù)時(shí),將其加入任務(wù)列表。
[0050] 實(shí)施例2、在上述基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的基礎(chǔ)上,本發(fā)明提供 了 一種控制方法,包含以下步驟:
[0051] 步驟一、在任務(wù)開始前,有人平臺(tái)中的任務(wù)計(jì)劃層依據(jù)各團(tuán)隊(duì)成員的能力特點(diǎn),賦 予各自角色,基于角色進(jìn)行初始任務(wù)分配,并向團(tuán)隊(duì)成員發(fā)布任務(wù)報(bào)文。
[0052] 步驟二、各團(tuán)隊(duì)成員將接受到的任務(wù)報(bào)文存儲(chǔ)在任務(wù)列表中,并按照優(yōu)先級(jí)原則 選取優(yōu)先級(jí)較高的任務(wù)作為將要執(zhí)行的任務(wù);該團(tuán)隊(duì)成員中面向角色的決策層根據(jù)該任務(wù) 類型初始化該團(tuán)隊(duì)成員的角色,生成團(tuán)隊(duì)角色表。
[0053] 步驟二、有人平臺(tái)下達(dá)開始指令,各團(tuán)隊(duì)成員開始執(zhí)行將要執(zhí)行的任務(wù)。其中任務(wù) 中涉及自動(dòng)巡航或者需要連續(xù)傳感器反饋的行為由基于行為的控制層執(zhí)行。
[0054]步驟三、團(tuán)隊(duì)成員在任務(wù)執(zhí)行過程中,決策層中的態(tài)勢感知器采集傳感器反饋信 息,采用BP神經(jīng)網(wǎng)絡(luò)對(duì)環(huán)境態(tài)勢、自身狀態(tài)以及任務(wù)代價(jià)進(jìn)行事件評(píng)估。
[0055] BP神經(jīng)網(wǎng)絡(luò)為BP網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)為sigmoid函數(shù),該BP神經(jīng)網(wǎng)絡(luò)以傳感器的反 饋值作為輸入層神經(jīng)元,其數(shù)量為η,以評(píng)估值作為輸出層神經(jīng)元,其數(shù)量為m;
[0058]節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法。
[0059]本實(shí)施例中其中,考慮到戰(zhàn)場環(huán)境的復(fù)雜性,評(píng)估的過程利用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),通 過專家經(jīng)驗(yàn)訓(xùn)練好的網(wǎng)絡(luò)來進(jìn)行評(píng)估層面的工作。以下以威脅度評(píng)估為例進(jìn)行神經(jīng)網(wǎng)絡(luò)的 設(shè)計(jì):
[0060] (1)設(shè)計(jì)網(wǎng)絡(luò)的輸入輸出
[0061 ]以傳感器的反饋值作為輸入;評(píng)估值作為輸出
[0062] 針對(duì)具體情境,說明該感知框架的應(yīng)用,戰(zhàn)場環(huán)境為偵察車和坦克混合編隊(duì)執(zhí)行 偵查區(qū)域任務(wù)。
[0063] 對(duì)于沒有打擊能力的偵察車,可從傳感器中得到數(shù)據(jù)信息如圖4(a)作為態(tài)勢感知 神經(jīng)網(wǎng)絡(luò)的輸入。可根據(jù)這些量對(duì)當(dāng)前的態(tài)勢進(jìn)行評(píng)估,獲取當(dāng)前的態(tài)勢評(píng)估,網(wǎng)絡(luò)輸出及 對(duì)應(yīng)的評(píng)估結(jié)果如表(輸出范圍0~5):
[0065] (2)坦克車
[0066] 同樣,考慮坦克車的因素如圖4(b)所示,其中包括監(jiān)控得到的自身信息以及輸入 的環(huán)境信息??筛鶕?jù)這些量對(duì)當(dāng)前的態(tài)勢進(jìn)行評(píng)估,獲取當(dāng)前的態(tài)勢評(píng)估,網(wǎng)絡(luò)輸出及對(duì)應(yīng) 的評(píng)估結(jié)果如表:

[0068]為了得到一個(gè)能客觀體現(xiàn)目標(biāo)威脅度的BP神經(jīng)網(wǎng)絡(luò),對(duì)訓(xùn)練網(wǎng)絡(luò)的樣本采集要求 很高。需要通過按照式(1)歸一化來提高訓(xùn)練效果:
[0070] u為輸入(傳感器的輸出數(shù)據(jù)),min和max為該傳感器的測量范圍。
[0071] (2)建立神經(jīng)網(wǎng)絡(luò)
[0072]采用BP網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)為sigmoid函數(shù)形式為式(2)
[0076]其中1為隱層神經(jīng)元個(gè)數(shù),η為輸入層神經(jīng)元數(shù),m為輸出層神經(jīng)元數(shù),p為樣本總數(shù) (訓(xùn)練樣本)。
[0077]設(shè)計(jì)學(xué)習(xí)算法,節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法,其調(diào)節(jié)方式為 式⑷
[0079]匕神經(jīng)網(wǎng)絡(luò)輸出值與樣本期望輸出值之差的絕對(duì)值;節(jié)點(diǎn)權(quán)值,η學(xué)習(xí)率,預(yù)設(shè) 的常數(shù)值;
[0080] (3)設(shè)計(jì)訓(xùn)練樣本:
[0081] 利用10折交叉確認(rèn)法,即將100組樣本數(shù)據(jù)平均分成10個(gè)部分,每一份用作測試, 剩余的進(jìn)行樣本訓(xùn)練。這個(gè)過程一共重復(fù)10次,最終每一部分樣本都有機(jī)會(huì)進(jìn)行測試。 [0082]有人平臺(tái)和無人平臺(tái)中預(yù)先設(shè)置事件處理規(guī)則庫,用于存儲(chǔ)各類事件的處理規(guī) 貝1J,有人平臺(tái)和無人平臺(tái)依據(jù)態(tài)勢感知器共享的事件評(píng)估結(jié)果與事件處理規(guī)則庫對(duì)比,采 取相應(yīng)處理規(guī)則,若一個(gè)團(tuán)隊(duì)成員的事件評(píng)估結(jié)果超出事件處理規(guī)則庫的范圍,有人平臺(tái) 協(xié)助該團(tuán)隊(duì)成員完成事件處理。
[0083]若一團(tuán)隊(duì)成員在任務(wù)執(zhí)行中產(chǎn)生新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表以及任務(wù)優(yōu) 先級(jí)將該新任務(wù)發(fā)送給其他團(tuán)隊(duì)成員或自身;
[0084] 事件處理規(guī)則庫中一個(gè)事件評(píng)估結(jié)果對(duì)應(yīng)多種處理規(guī)則,且每種處理規(guī)則具有一 個(gè)采用指數(shù),采用指數(shù)最高的處理規(guī)則為該事件評(píng)估結(jié)果優(yōu)先采取的處理規(guī)則;采用指數(shù) 采用適應(yīng)度函數(shù)進(jìn)行計(jì)算,當(dāng)采用指數(shù)低于設(shè)定閾值時(shí),對(duì)其進(jìn)行更新,過程具體為:
[0085] i、在事件處理規(guī)則庫中隨機(jī)選取兩個(gè)處理規(guī)則作為父體,每個(gè)處理規(guī)則被選取的 概率是其采用指數(shù)的增函數(shù);
[0086] ii、對(duì)于選中的父體,按照預(yù)設(shè)的交換概率P。進(jìn)行交換,交換后產(chǎn)生兩個(gè)交換后的 后代;
[0087] iii、對(duì)于產(chǎn)生的兩個(gè)交換后的后代,分別在每個(gè)位置上按照變異概率Pm發(fā)生變 異,產(chǎn)生兩個(gè)變異后的后代;
[0088] iv、若變異后的后代高于閾值時(shí),則采用該變異后的后代替換一個(gè)地獄設(shè)定閾值 的采用指數(shù)集,否則轉(zhuǎn)向步驟i。
[0089]綜上,以上僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在 本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù) 范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于角色的有人/無人協(xié)同指揮控制系統(tǒng),其特征在于,該系統(tǒng)針對(duì)由有人平臺(tái) 和無人平臺(tái)作為團(tuán)隊(duì)成員而組成的團(tuán)隊(duì)進(jìn)行協(xié)同指揮控制,該系統(tǒng)在每個(gè)團(tuán)隊(duì)成員中均設(shè) 置基于行為的控制層、面向角色的決策層W及任務(wù)計(jì)劃層; 所述基于行為的控制層提供自動(dòng)巡航和需要連續(xù)傳感器反饋的行為; 所述任務(wù)計(jì)劃層產(chǎn)生任務(wù)報(bào)文,所述任務(wù)報(bào)文包括任務(wù)目標(biāo)、交戰(zhàn)規(guī)則W及明確不同 團(tuán)隊(duì)成員責(zé)任需要的信息; 所述面向角色的決策層包括團(tuán)隊(duì)角色表,任務(wù)管理器W及態(tài)勢感知器; 所述團(tuán)隊(duì)角色表用于存儲(chǔ)角色信息,角色信息中包括每個(gè)角色對(duì)應(yīng)的團(tuán)隊(duì)成員W及每 個(gè)團(tuán)隊(duì)成員的狀態(tài),其中一個(gè)角色對(duì)應(yīng)多個(gè)團(tuán)隊(duì)成員,一個(gè)團(tuán)隊(duì)成員也對(duì)應(yīng)多種角色,團(tuán)隊(duì) 成員在執(zhí)行不同任務(wù)時(shí)角色不同;在通信無效的狀態(tài)下,依據(jù)團(tuán)隊(duì)角色表預(yù)測團(tuán)隊(duì)成員的 行為; 所述任務(wù)管理器包括任務(wù)列表和任務(wù)分配機(jī),任務(wù)列表保存初始任務(wù)W及在任務(wù)執(zhí)行 過程中產(chǎn)生的新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表W及任務(wù)優(yōu)先級(jí)進(jìn)行任務(wù)分配; 所述態(tài)勢感知器根據(jù)傳感器信息完成態(tài)勢感知并進(jìn)行環(huán)境態(tài)勢、自身狀態(tài)W及任務(wù)代 價(jià)的事件評(píng)估,團(tuán)隊(duì)角色表和態(tài)勢感知器的事件評(píng)估結(jié)果在團(tuán)隊(duì)中實(shí)時(shí)更新和共享。2. -種如權(quán)利要求1所述的基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的控制方法,其特 征在于,包含W下步驟: 步驟一、在任務(wù)開始前,有人平臺(tái)中的任務(wù)計(jì)劃層依據(jù)各團(tuán)隊(duì)成員的能力特點(diǎn),賦予各 自角色,基于角色進(jìn)行初始任務(wù)分配,并向團(tuán)隊(duì)成員發(fā)布任務(wù)報(bào)文; 步驟二、各團(tuán)隊(duì)成員將接收到的任務(wù)報(bào)文存儲(chǔ)在任務(wù)列表中,并按照優(yōu)先級(jí)原則選取 優(yōu)先級(jí)較高的任務(wù)作為將要執(zhí)行的任務(wù);該團(tuán)隊(duì)成員中面向角色的決策層根據(jù)該任務(wù)類型 初始化該團(tuán)隊(duì)成員的角色,生成團(tuán)隊(duì)角色表; 步驟二、有人平臺(tái)下達(dá)開始指令,各團(tuán)隊(duì)成員開始執(zhí)行所述將要執(zhí)行的任務(wù);其中任務(wù) 中設(shè)及自動(dòng)巡航或者需要連續(xù)傳感器反饋的行為由所述基于行為的控制層執(zhí)行; 步驟Ξ、團(tuán)隊(duì)成員在任務(wù)執(zhí)行過程中,決策層中的態(tài)勢感知器采集傳感器反饋信息,采 用BP神經(jīng)網(wǎng)絡(luò)對(duì)環(huán)境態(tài)勢、自身狀態(tài)W及任務(wù)代價(jià)進(jìn)行事件評(píng)估; 有人平臺(tái)和無人平臺(tái)中預(yù)先設(shè)置事件處理規(guī)則庫,用于存儲(chǔ)各類事件的處理規(guī)則,有 人平臺(tái)和無人平臺(tái)依據(jù)態(tài)勢感知器共享的事件評(píng)估結(jié)果與事件處理規(guī)則庫對(duì)比,采取相應(yīng) 處理規(guī)則,若一個(gè)團(tuán)隊(duì)成員的事件評(píng)估結(jié)果超出事件處理規(guī)則庫的范圍,有人平臺(tái)協(xié)助該 團(tuán)隊(duì)成員完成事件處理; 若一團(tuán)隊(duì)成員在任務(wù)執(zhí)行中產(chǎn)生新任務(wù),任務(wù)分配機(jī)根據(jù)團(tuán)隊(duì)角色表W及任務(wù)優(yōu)先級(jí) 將該新任務(wù)發(fā)送給其他團(tuán)隊(duì)成員或自身; 所述事件處理規(guī)則庫中一個(gè)事件評(píng)估結(jié)果對(duì)應(yīng)多種處理規(guī)則,且每種處理規(guī)則具有一 個(gè)采用指數(shù),采用指數(shù)最高的處理規(guī)則為該事件評(píng)估結(jié)果優(yōu)先采取的處理規(guī)則;所述采用 指數(shù)采用適應(yīng)度函數(shù)進(jìn)行計(jì)算,當(dāng)采用指數(shù)低于設(shè)定闊值時(shí),對(duì)其進(jìn)行更新。3. 如權(quán)利要求2所述的基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的控制方法,其特征在 于,所述BP神經(jīng)網(wǎng)絡(luò)為BP網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)為sigmoid函數(shù),該BP神經(jīng)網(wǎng)絡(luò)W傳感器的反 饋值作為輸入層神經(jīng)元,其數(shù)量為η,W評(píng)估值作為輸出層神經(jīng)元,其數(shù)量為m; 節(jié)點(diǎn)數(shù)量/ = V"十。!; 訓(xùn)練樣本數(shù)i節(jié)點(diǎn)權(quán)值的訓(xùn)練方法采用學(xué)習(xí)算法為梯度下降法。4.如權(quán)利要求2所述的基于角色的有人/無人協(xié)同指揮控制系統(tǒng)的控制方法,其特征在 于,所述當(dāng)采用指數(shù)低于設(shè)定闊值時(shí),對(duì)其進(jìn)行更新的過程具體為: i、 在事件處理規(guī)則庫中隨機(jī)選取兩個(gè)處理規(guī)則作為父體,每個(gè)處理規(guī)則被選取的概率 是其采用指數(shù)的增函數(shù); ii、 對(duì)于選中的父體,按照預(yù)設(shè)的交換概率P。進(jìn)行交換,交換后產(chǎn)生兩個(gè)交換后的后代; iii、 對(duì)于產(chǎn)生的兩個(gè)交換后的后代,分別在每個(gè)位置上按照變異概率P"發(fā)生變異,產(chǎn)生 兩個(gè)變異后的后代; iv、 若變異后的后代高于闊值時(shí),則采用該變異后的后代替換一個(gè)低于設(shè)定闊值的采 用指數(shù)集,否則轉(zhuǎn)向步驟i。
【文檔編號(hào)】G06Q10/10GK106096911SQ201610391084
【公開日】2016年11月9日
【申請(qǐng)日】2016年6月3日 公開號(hào)201610391084.5, CN 106096911 A, CN 106096911A, CN 201610391084, CN-A-106096911, CN106096911 A, CN106096911A, CN201610391084, CN201610391084.5
【發(fā)明人】方浩, 陳杰, 張 浩
【申請(qǐng)人】北京理工大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
千阳县| 宜章县| 武威市| 阿拉尔市| 长沙市| 东丰县| 长宁县| 八宿县| 旬阳县| 峡江县| 龙里县| 城步| 英山县| 邵阳市| 开阳县| 定结县| 安远县| 邻水| 巴林左旗| 锡林浩特市| 龙井市| 射洪县| 保靖县| 松原市| 马边| 庆元县| 松原市| 临桂县| 监利县| 台州市| 永德县| 西安市| 永州市| 时尚| 盐津县| 黄浦区| 敦化市| 英吉沙县| 汨罗市| 乌兰察布市| 内丘县|