本發(fā)明涉及通信,尤其涉及一種相控陣天線多波束自動優(yōu)化方法、裝置、設備及存儲介質。
背景技術:
::1、控陣天線工作模式多,波束數(shù)量多,指向精度要求高,并且需要在地面測試完成后存儲波束控制碼以待輸入波控系統(tǒng)使用,波束控制碼中包含控制波束掃描的饋電組件控制信息,如發(fā)送接收組件饋電幅度衰減控制量、饋電相位移相控制量以及延時放大組件延時控制量等。為完成相控陣天線多波束校準,獲取各波束的波束控制碼,需要采用合適的優(yōu)化方法。因此,如何有效地針對相控陣天線的多波束系統(tǒng)開發(fā)一種全自動化的優(yōu)化方法,以確保在各種復雜的空間環(huán)境下,精確測定并應用各個波束的波束控制碼,從而實現(xiàn)快速準確的波束指向與切換,滿足空間通信和探測任務對高指向精度和多目標追蹤的要求,已越來越成為一個亟需解決的問題。技術實現(xiàn)思路1、本發(fā)明實施例提供一種相控陣天線多波束自動優(yōu)化方法、裝置、設備及存儲介質,能夠實時自適應優(yōu)化相控陣天線多波束,實現(xiàn)了快速準確的波束指向與切換,滿足空間通信和探測任務對高指向精度和多目標追蹤的要求,確保其在復雜多變的空間環(huán)境中始終發(fā)揮最佳效能。2、本發(fā)明一實施例提供一種相控陣天線多波束自動優(yōu)化方法,包括:3、構建基于稀疏編碼和深度神經(jīng)網(wǎng)絡的波束優(yōu)化模型;所述波束優(yōu)化模型用于預測不同波束指向下的最優(yōu)饋電參數(shù)組合,所述波束優(yōu)化模型的輸入層用于接收特征向量,所述波束優(yōu)化模型的輸出層用于預測對應的波束控制碼值;所述波束優(yōu)化模型是基于預先獲取到的相控陣天線的工作數(shù)據(jù)樣本進行訓練的;4、利用強化學習策略對構建好的所述波束優(yōu)化模型進行優(yōu)化,使得所述波束優(yōu)化模型能根據(jù)實際空間環(huán)境和工作狀態(tài)的反饋,自主調整波束控制策略;5、建立一個多任務學習框架,讓所述波束優(yōu)化模型同時學習多個波束之間的相互影響和耦合效應,以實現(xiàn)全局最優(yōu)解;6、將訓練好的所述波束優(yōu)化模型部署到星載衛(wèi)星中,以使得訓練好的所述波束優(yōu)化模型根據(jù)所述星載衛(wèi)星當前的相控陣天線的工作參數(shù)來輸出最優(yōu)的波束控制碼,從而使得星載衛(wèi)星基于所述最優(yōu)的波束控制碼控制相控陣天線的工作。7、作為上述方案的改進,所述構建基于稀疏編碼和深度神經(jīng)網(wǎng)絡的波束優(yōu)化模型,包括:8、初始化基于稀疏編碼和深度神經(jīng)網(wǎng)絡的波束優(yōu)化模型;初始化的波束優(yōu)化模型的模型架構包括輸入層、隱藏層和輸出層;其中,輸入層用于接收特征向量;隱藏層的第一層為稀疏編碼層,編碼維度設為原始特征向量長度的1/4,激活函數(shù)采用硬閾值函數(shù),保持輸入的稀疏性,后續(xù)隱藏層為3個全連接層,每層節(jié)點數(shù)分別為512、256、128,激活函數(shù)均為relu;輸出層用于預測對應波束指向下的波束控制碼值;初始化的波束優(yōu)化模型的優(yōu)化器選用了adam優(yōu)化器,設置學習率為0.001;損失函數(shù)設定為:9、nbeams為波束總數(shù),為各控制碼損失項的權重;10、獲取到的相控陣天線的工作數(shù)據(jù)樣本進行特征提;所述工作數(shù)據(jù)樣本包括:波束指向掃描角度和饋電參數(shù),饋電參數(shù)包括:注入信號功率、透射功率、饋電幅度ai和饋電相位11、應用深度學習特征提取技術,對所述工作數(shù)據(jù)樣本進行特征提取,得到對應的特征向量:關鍵特征包括:發(fā)送接收組件的電氣特性曲線、波束形狀參數(shù)和空間分布關系;12、將特征向量與實際測量的波束控制碼值配對,劃分為訓練集和驗證集;13、將訓練集劃分為多個小批量,進行mini-batch梯度下降,每次迭代,從訓練集中隨機抽取一個批量數(shù)據(jù)送入模型進行前向傳播;14、計算模型在當前批量訓練集上輸出的預測控制碼,并計算損失函數(shù)值;15、根據(jù)損失函數(shù)的梯度,通過反向傳播算法計算模型參數(shù)的梯度;16、利用adam優(yōu)化器根據(jù)梯度更新模型參數(shù);17、每經(jīng)過預定次數(shù)的迭代,使用驗證集評估模型性能;如果驗證集性能不再提升或達到預設的停止條件,則終止對所述波束優(yōu)化模型的訓練。18、作為上述方案的改進,所述應用深度學習特征提取技術,對所述工作數(shù)據(jù)樣本進行特征提取,得到對應的特征向量,包括:19、針對每個發(fā)送接收組件,使用插值法擬合其在不同波束指向下的饋電幅度衰減曲線ai(θ,φ)和饋電相位移相曲線φi(θ,φ)兩者,并計算兩者隨時間的動態(tài)變化率,得到電氣特性變化曲線;20、對于每個波束指向掃描角度,根據(jù)透射功率計算波束增益gj,從而得到波束形狀參數(shù):21、ptransmitj為透射功率,pinjected為注入信號功率;22、利用三維繪圖軟件,根據(jù)波束指向數(shù)據(jù)繪制波束覆蓋范圍圖,明確相鄰波束交疊區(qū)域,從而得到所述空間分布關系。23、作為上述方案的改進,所述利用強化學習策略對構建好的所述波束優(yōu)化模型進行優(yōu)化,使得所述波束優(yōu)化模型能根據(jù)實際空間環(huán)境和工作狀態(tài)的反饋,自主調整波束控制策略,包括:24、定義強化學習環(huán)境;其中,通過以下方式定義強化學習的狀態(tài):其中,θ為當前波束的方位角,表示波束在水平面上的指向;φ為當前波束的俯仰角,表示波束在垂直面上的指向;為第i個發(fā)送接收組件的饋電幅度,反映天線在該組件處的信號強度;t為環(huán)境溫度,表征影響天線材料的電氣性能和發(fā)送接收組件的穩(wěn)定性;n為空間噪聲水平,包表征影響通信質量和波束檢測準確性;通過以下方式定義強化學習的動作:其中,δai為第i個發(fā)送接收組件的饋電幅度調整量,用于校正幅度失配或優(yōu)化波束指向;為第i個發(fā)送接收組件的饋電相位調整量,用于調整波束指向或改善波束形狀;δtk為第k個延時放大組件的延時控制量(delaycontro?l,用于精確控制信號到達各發(fā)送接收組件的時間差,進而調整波束指向;通過以下方式定義強化學習的獎勵函數(shù):r=f(g,hpbw,sll,preflect,ptransmit,ntotal)其中,g為波束增益,反映天線將能量集中到主瓣的能力;hpbw為半功率波束寬度,表征波束的聚焦程度;sll為旁瓣電平,衡量波束副瓣對主瓣的影響;preflect為反射功率,表示天線向后散射的能量;ptransmit為透射功率,即有效發(fā)射到指定方向的功率;ntotal為總噪聲功率,反映系統(tǒng)信噪比;其中,獎勵函數(shù)的具體公式設定為:其中,wg,whpbw,wsll,是權重系數(shù),用于平衡不同性能指標對獎勵函數(shù)的貢獻;25、創(chuàng)建一個表格q-table,其大小為狀態(tài)空間大小(|s|)乘以動作空間大小(|a|),所有元素初始值設為0;q-table用于存儲在每個狀態(tài)s下執(zhí)行每個動作a的預期累積獎勵;26、根據(jù)當前狀態(tài)s,根據(jù)ε-greedy策略從q-table中選擇一個動作a執(zhí)行;27、在相控陣天線上執(zhí)行選定的動作,觀測到新的狀態(tài)s′和獲得的即時獎勵r;28、按照以下設定的q-learning更新規(guī)則更新q-table中的對應項:29、其中,α為學習率,控制新經(jīng)驗對已有q-value的影響程度,α=0.1;γ是折扣因子,決定對未來獎勵的重視程度,γ=0.9。30、作為上述方案的改進,所述建立一個多任務學習框架,讓所述波束優(yōu)化模型同時學習多個波束之間的相互影響和耦合效應,以實現(xiàn)全局最優(yōu)解,包括:31、在所述波束優(yōu)化模型的模型結構中,為多波束設置共享的隱藏層,該共享的隱藏層包括稀疏編碼層與前兩個全連接層,該共享的隱藏層用于學習共性的波束形成規(guī)律;32、為每個波束設置獨立的輸出層,預測各自的波束控制碼;33、在預測新波束控制碼時,通過注意力機制考慮其他波束的狀態(tài),以實現(xiàn)全局最優(yōu)解;注意力機制實現(xiàn)過程包括:34、對于第j個波束的控制碼預測,引入一個注意力向量aj來加權融合其他波束的狀態(tài)信息:其中,nbeams為波束總數(shù),表示系統(tǒng)中可以獨立控制的波束數(shù)量;hi為第i個波束對應的隱藏層輸出向量,包含了該波束在模型內部學習到的特征表示;w為可學習的注意力權重向量,用于計算每個波束隱藏層輸出向量的注意力得分,經(jīng)過softmax函數(shù)歸一化后,形成對其他波束信息的加權組合;softmax(·)為歸一化函數(shù),將權重向量與隱藏層輸出向量的點積結果轉換為概率分布,確保加權和為1;35、將加權后的注意力向量aj與當前波束j的隱藏層輸出向量hi拼接,作為新的輸入傳遞給獨立輸出層,預測波束j的控制碼:分別為第j個波束的饋電幅度調整量、饋電相位調整量和延時控制量預測值,outputlayer表示模型的最后一層神經(jīng)網(wǎng)絡,負責將拼接后的向量轉化為控制碼預測;36、在訓練過程中,通過以下方式同時更新共享的底層特征層和獨立的輸出層參數(shù):使用多任務學習策略,將多個波束的控制碼預測作為不同的子任務,共同優(yōu)化一個損失函數(shù):,37、其中,l為總損失函數(shù),用于衡量模型在所有波束控制碼預測任務上的表現(xiàn);mse為均方誤差函數(shù),用于計算模型預測值與真實值之間的差異;分別為模型預測的第j個波束的饋電幅度調整量、饋電相位調整量和延時控制量;分別為真實的第j個波束的饋電幅度調整量、饋電相位調整量和延時控制量。38、作為上述方案的改進,所述將訓練好的所述波束優(yōu)化模型部署到星載衛(wèi)星中,以使得訓練好的所述波束優(yōu)化模型根據(jù)所述星載衛(wèi)星當前的相控陣天線的工作參數(shù)來輸出最優(yōu)的波束控制碼,包括:39、獲取波束j當前的狀態(tài)信息和其他波束的狀態(tài)信息;狀態(tài)信息包括:波束指向掃描角度和饋電參數(shù),饋電參數(shù)包括:注入信號功率、透射功率、饋電幅度ai和饋電相位40、將所有其他波束的狀態(tài)信息作為所述波束優(yōu)化模型的輸入,通過共享的底層特征層進行特征提取,得到每個其他波束對應的隱藏層輸出向量hi(i≠j);41、對每個其他波束的隱藏層輸出向量hi,利用訓練過程中設定好的注意力權重wi向量進行點積,并通過softmax函數(shù)歸一化,得到注意力得分αi:αi=softmax(wthi);42、根據(jù)注意力得分對其他波束的隱藏層輸出向量進行加權求和,生成波束j的注意力向量aj:nbeams為波束總數(shù);43、將波束j的當前狀態(tài)對應的隱藏層輸出向量hi與計算得到的注意力向量aj拼接,形成新的輸入向量:44、將拼接后的輸入向量送入所述波束優(yōu)化模型的獨立輸出層outputlayer,通過神經(jīng)網(wǎng)絡計算得到波束j的控制碼調整量:45、根據(jù)預測的控制碼調整量,調整波束j的實際饋電幅度aj和相位aj←aj+△aj46、47、根據(jù)延時控制量δtj調整與波束j關聯(lián)的延時放大組件的延時;48、最后通過訓練好的所述波束優(yōu)化模型在訓練過程中預先設置好的多任務學習策略優(yōu)化所有波束的整體性能。49、本發(fā)明另一實施例對應提供了一種相控陣天線多波束自動優(yōu)化裝置,包括:50、構建模塊,用于構建基于稀疏編碼和深度神經(jīng)網(wǎng)絡的波束優(yōu)化模型;所述波束優(yōu)化模型用于預測不同波束指向下的最優(yōu)饋電參數(shù)組合,所述波束優(yōu)化模型的輸入層用于接收特征向量,所述波束優(yōu)化模型的輸出層用于預測對應的波束控制碼值;所述波束優(yōu)化模型是基于預先獲取到的相控陣天線的工作數(shù)據(jù)樣本進行訓練的;51、優(yōu)化模塊,用于利用強化學習策略對構建好的所述波束優(yōu)化模型進行優(yōu)化,使得所述波束優(yōu)化模型能根據(jù)實際空間環(huán)境和工作狀態(tài)的反饋,自主調整波束控制策略;52、建立模塊,用于建立一個多任務學習框架,讓所述波束優(yōu)化模型同時學習多個波束之間的相互影響和耦合效應,以實現(xiàn)全局最優(yōu)解;53、應用模塊,用于將訓練好的所述波束優(yōu)化模型部署到星載衛(wèi)星中,以使得訓練好的所述波束優(yōu)化模型根據(jù)所述星載衛(wèi)星當前的相控陣天線的工作參數(shù)來輸出最優(yōu)的波束控制碼,從而使得星載衛(wèi)星基于所述最優(yōu)的波束控制碼控制相控陣天線的工作。54、本發(fā)明另一實施例提供了一種相控陣天線多波束自動優(yōu)化系統(tǒng),包括處理器、存儲器以及存儲在所述存儲器中且被配置為由所述處理器執(zhí)行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述發(fā)明實施例所述的相控陣天線多波束自動優(yōu)化方法。55、本發(fā)明另一實施例提供了一種存儲介質,所述計算機可讀存儲介質包括存儲的計算機程序,其中,在所述計算機程序運行時控制所述計算機可讀存儲介質所在設備執(zhí)行上述發(fā)明實施例所述的相控陣天線多波束自動優(yōu)化設備方法。56、相比于現(xiàn)有技術,本發(fā)明實施例具有如下有益效果:57、本發(fā)明實施例首先通過構建基于稀疏編碼和深度神經(jīng)網(wǎng)絡的波束優(yōu)化模型,該模型通過接收包含相控陣天線工作狀態(tài)特征的向量作為輸入,預測不同波束指向下的最優(yōu)饋電參數(shù)組合,并輸出對應的波束控制碼值。模型基于預先獲取的相控陣天線工作數(shù)據(jù)樣本進行訓練,確保其具備實際場景適應能力。接著,利用強化學習策略對構建好的波束優(yōu)化模型進行優(yōu)化,使模型能夠根據(jù)實際空間環(huán)境和工作狀態(tài)的反饋,自主調整波束控制策略,實現(xiàn)動態(tài)適應性和自學習能力。此外,通過建立一個多任務學習框架,使波束優(yōu)化模型同時學習多個波束之間的相互影響和耦合效應,確保模型在優(yōu)化單個波束性能的同時,兼顧整體系統(tǒng)的全局最優(yōu)解。最后,將訓練好的波束優(yōu)化模型部署至星載衛(wèi)星,使其根據(jù)當前相控陣天線的工作參數(shù)實時輸出最優(yōu)的波束控制碼,指導衛(wèi)星基于此控制碼精確控制相控陣天線工作,實現(xiàn)快速準確的波束指向與切換。由上分析可知,本發(fā)明實施例能夠實時自適應優(yōu)化相控陣天線多波束的工作,確保在復雜多變的空間環(huán)境中始終保持最佳效能,有效滿足空間通信和探測任務對高指向精度和多目標追蹤的要求。當前第1頁12當前第1頁12