帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器及方法
【專利摘要】本發(fā)明公開了一種帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器及方法,定義注視差異為目標速度與眼球速度的差值,設定注視差異的最大允許值,以注視差異最小為控制目標,得到目標速度的預測值;根據(jù)目標速度預測值后控制眼球產(chǎn)生相同的速度。本發(fā)明能確保整個跟蹤過程中,注視差異始終在允許的范圍內(nèi),并最終收斂于0,很好地解決了現(xiàn)有平滑追蹤眼動控制方法不能分析暫態(tài)控制性能的不足。
【專利說明】
帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器及方法
技術(shù)領域
[0001] 本發(fā)明設及平滑追蹤眼動技術(shù)領域,尤其設及一種帶有注視差異約束的平滑追蹤 眼動自適應跟蹤控制器及控制方法。
【背景技術(shù)】
[0002] 平滑追蹤眼動作為五大眼動行為之一,在臨床上具有十分重要的價值,因此國內(nèi) 外眾多學者對其進行了大量的研究。平滑追蹤眼動的目的是將緩慢運動的物體保持在中央 窩區(qū)域,使得移動物體速度與眼球速度的差值即注視差異最小。一旦眼球速度追趕上移動 物體的速度,注視差異即降為0。在平滑追蹤眼動過程中不僅需要預測物體的運動速度和方 向,還需要調(diào)控眼動的速度和幅值從而保證運動物體位于視網(wǎng)膜的中央窩處,保持眼動與 目標運動的同步性。在對哺乳類動物平滑追蹤眼動的研究中,通常用平滑追蹤增益(SPG)即 眼球速度與移動物體目標速度的比值來評估眼球跟蹤系統(tǒng)的性能。實驗結(jié)果表明,人類和 猴子對勻速運動或者正弦運動的物體進行跟蹤時,SPG近似為1。但是,由于圖像處理、信號 傳遞W及運動執(zhí)行機構(gòu)存在一定的時間延遲(80-130ms),僅通過簡單的視覺負反饋是無法 得到近似為1的SPG的。
[0003] 如果目標速度是可預測的,則可W降低甚至消除視覺延時。實驗結(jié)果表明,平滑追 蹤系統(tǒng)是可W預測目標動態(tài)的。跟蹤重復性運動時,眼球可及時甚至有些超前地轉(zhuǎn)換方向, 運個研究第一次提供證據(jù)證明平滑追蹤眼球運動具有預測機制。隨后,眼球的預測跟蹤控 審IJ問題引起了廣泛的關注。
[0004] Shiba化等人將一個遞歸神經(jīng)網(wǎng)絡(RNN)映射到MST區(qū)域中,W達到預測的目的。在 預測的過程中采用最小二乘法,通過上一時刻目標的速度和位置信息預測出當前時刻的速 度,不過該模型無法實現(xiàn)正弦運動的零延時跟蹤。
[0005] Zambrano等人在化ibata的模型上,添加了與目標動態(tài)模型參數(shù)相關的基于內(nèi)存 的內(nèi)部模型。利用神經(jīng)網(wǎng)絡的方法將運動形式與收斂系數(shù)對應起來,當相同或相近的運動 形式再次出現(xiàn)時,可W直接調(diào)用已經(jīng)存儲的收斂系數(shù),加快收斂速度。化yhoe等人認為在模 型中加入一個內(nèi)部記憶模塊是十分有必要的,運種模塊不僅可W對目標運動進行預測,同 時對人體頭眼協(xié)調(diào)及身體軀體的協(xié)調(diào)運動有一定的作用。Orban de Xiv巧等人提出了基于 兩個卡爾曼濾波器(一個處理視覺信息,一個保持目標動態(tài)的內(nèi)部儲存)的模型,此模型學 習并提升了目標軌跡的內(nèi)部估計。W上各個模型均可預測目標速度的未來值,但需要目標 動態(tài)的先驗知識。
[0006] 從神經(jīng)生理學的角度來看,注視差異是受約束的。也就是說,在平滑追蹤眼動過程 中,注視差異應保持在特定的范圍內(nèi)。據(jù)我們所知,現(xiàn)有的所有針對平滑追蹤眼動的控制方 法僅能保證閉環(huán)系統(tǒng)的注視差異漸近收斂,而無法保證注視差異的變化范圍。然而,如果能 保證注視差異在平滑追蹤眼動過程中始終在一個已知/設定的范圍內(nèi)(即暫態(tài)跟蹤性能已 知),并收斂于0,則具有非常重要的神經(jīng)生理學意義。另一方面,W上所有控制方法要求系 統(tǒng)參數(shù)完全已知,而在實際中想要獲得眼球系統(tǒng)參數(shù)是非常困難的。并且,已有控制方法僅 可跟蹤勻速、正弦等周期運動。
【發(fā)明內(nèi)容】
[0007] 基于上述問題,針對平滑追蹤眼動系統(tǒng),本發(fā)明提出一種帶有注視差異約束的平 滑追蹤眼動自適應跟蹤控制器及控制方法。該方法能精確地跟蹤任意運動軌跡的物體;此 夕h該方法能保證目標速度與眼球速度之間的誤差即注視差異始終保持在預先設定的范圍 內(nèi),并最終收斂于0。
[0008] 為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0009] 帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器,包括:
[0010] 定義注視差異為目標速度與眼球速度的差值,設定注視差異的最大允許值P, W注視差異最小為控制目標,得到目標速度的預測值為:
[0011]
[001。其中,w(t) = [wi(t) W2(t) W3(t)]T為系統(tǒng)參數(shù)估計向量,無(/) =[.子(/)巧/).?(>)]廠 為眼球目標狀態(tài)估計向量,.氣0為目標位置估計值,為目標速度估計值,為目標加 速度估計值;A為時間延遲。
[0013] 進一步地,所述系統(tǒng)參數(shù)估計向量w(t)的更新率為:
[0014]
[001引其中,A = diag(、,Ai,A3)為正定對角矩陣,屬fe紙為正的控制增益,臾+為注 視差異<·,(/)的最大允許值。
[0016] 帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方法,包括:
[0017] (1)定義注視差異為目標速度與眼球速度的差值;
[0018] (2)設定注視差異的約束條件,W注視差異最小為平滑追蹤眼動的控制目標構(gòu)建 控制函數(shù);
[0019] (3)假設眼球速度與目標預測速度相等,根據(jù)注視差異得到目標速度的估計值;
[0020] (4)在注視差異滿足約束條件的情況下,根據(jù)所述目標速度的估計值得到目標位 置估計值W及目標速度的預測值;
[0021] (5)眼球速度等于目標速度的預測值,得到目標速度預測值后控制眼球產(chǎn)生相同 的速度。
[0022] 進一步地,所述步驟(2)中注視差異的約束條件具體為:
[0023] |e(i)|</?,V/ >0;
[0024] 其中,?巧為注視差異,fG睞為注視差異?的的最大允許值。
[0025] 進一步地,所述步驟(2)中控制函數(shù)具體為:注視差異的極限值為0。
[0026] 進一步地,所述步驟(3)中目標速度的估計值為目標預測速度與注視差異的和。
[0027] 進一步地,所述步驟(4)中,對目標速度的估計值關于時間積分得到目標位置估計 值。
[0028] 進一步地,所述步驟(4)中,對目標速度的估計值關于時間求導得到目標速度的預 測值。
[0029] 本發(fā)明的有益效果是:
[0030] 本發(fā)明方法把平滑追蹤眼動系統(tǒng)的鎮(zhèn)定問題轉(zhuǎn)化為目標軌跡的跟蹤控制問題。
[0031] 本發(fā)明控制方法能確保整個跟蹤過程中,注視差異始終在允許的范圍內(nèi),并最終 收斂于0,很好地解決了現(xiàn)有平滑追蹤眼動控制方法不能分析暫態(tài)控制性能的不足。借助 Lyapunov方法對閉環(huán)系統(tǒng)信號的有界性與收斂性進行了分析。數(shù)值仿真結(jié)果表明所提控制 方法針對不同目標軌跡具有良好的跟蹤性能。
【附圖說明】
[0032] 圖1為本發(fā)明控制方法示意圖;
[0033] 圖2(a)為本發(fā)明第一組實驗第1種情況下眼球速度、目標速度W及注視差異示意 圖;
[0034] 圖2(b)為本發(fā)明第一組實驗第巧巾情況下參數(shù)估計示意圖;
[0035] 圖3(a)為本發(fā)明第一組實驗第巧巾情況下眼球速度、目標速度W及注視差異示意 圖;
[0036] 圖3(b)為本發(fā)明第一組實驗第巧巾情況下參數(shù)估計示意圖;
[0037] 圖4(a)為本發(fā)明第一組實驗第3種情況下眼球速度、目標速度W及注視差異示意 圖;
[0038] 圖4(b)為本發(fā)明第一組實驗第巧巾情況下參數(shù)估計示意圖;
[0039] 圖5(a)為本發(fā)明第一組實驗第4種情況下眼球速度、目標速度W及注視差異示意 圖;
[0040] 圖5(b)為本發(fā)明第一組實驗第4種情況下參數(shù)估計示意圖;
[0041] 圖6(a)為本發(fā)明第二組實驗第1種情況下眼球速度、目標速度W及注視差異示意 圖;
[0042] 圖6(b)為本發(fā)明第二組實驗第巧巾情況下參數(shù)估計示意圖;
[0043] 圖7(a)為本發(fā)明第二組實驗第巧巾情況下眼球速度、目標速度W及注視差異示意 圖;
[0044] 圖7(b)為本發(fā)明第二組實驗第巧巾情況下參數(shù)估計示意圖;
[0045] 圖8(a)為本發(fā)明第二組實驗第3種情況下眼球速度、目標速度W及注視差異示意 圖;
[0046] 圖8(b)為本發(fā)明第二組實驗第巧巾情況下參數(shù)估計示意圖;
[0047] 圖9(a)為本發(fā)明第二組實驗第4種情況下眼球速度、目標速度W及注視差異示意 圖;
[0048] 圖9(b)為本發(fā)明第二組實驗第4種情況下參數(shù)估計示意圖。
【具體實施方式】:
[0049] 下面結(jié)合附圖與實施例對本發(fā)明做進一步說明:
[0050] 1、現(xiàn)有的基于最小二乘法的平滑追蹤眼動模型中主要包含了兩個模塊:1)將一個 神經(jīng)網(wǎng)絡模型(RNN)映射到內(nèi)側(cè)顛葉上部MST區(qū)域,根據(jù)目標的運動信息來對目標的速度進 行預測;2)將逆動力學控制器(IDC)映射到腦干和小腦中,用來產(chǎn)生眼球速度。
[0051] 注視差異定義為目標速度與眼球速度的差值,即:
[0052] (-'(〇 = '/-(-/) - £(〇 (1)
[0化引其中,為目標速度,古W為眼球速度,為注視差異。
[0054] 平滑追蹤眼動的控制目標是使目標速度與眼球速度的差值即注視差異最小,可寫 為:
[0055]
巧
[0056] 除了控制目標(2)之外,從神經(jīng)生理學的角度,還應滿足W下要求:
[0057] |各〇)|<戶,耐>0 口)
[0化引其中,礦€紙+為注視差異。(0的最大允許值。
[0059] 小腦和腦干具有眼球系統(tǒng)逆動力學控制器的作用。假設逆動力學控制器可完全消 除眼球動力學方程,則由圖1可得:
[0060] Ε{? = ^{? (4)
[0061 ] 其中,表示預測速度。
[0062]目標速度估計值可寫為:
[006;3]去(?-Δ) = ?(?-Δ) + (ψ-Δ) 巧)
[0064] 其中,.可〇為目標速度估計值,Δ表示視覺延時。
[0065] 對(5)式關于時間積分可得目標位置估計:
[0066] 二'.?(''一&):+.@(?_Δ): .狗:
[0067] 其中,王的為目標位置估計值。
[0068] 對(5)式關于時間求導可得目標加速度估計值為:
[0069] f(r-A) = .i(r-A) + cH/-A) (7)
[0070] 將目標速度的預測值用下式表示:
[0071] = {t)x( t-A) (鮮
[0072] 其中w(t) = [wi(t) W2(t) W3(t)]T為系統(tǒng)參數(shù)估計向量,文(/) = [.-γ(ν) ;f(f) X(f)]. 為眼球目標狀態(tài)估計向量。W( t)的更新率為:
[0073]
(9)
[0074] 其中,λ = (?3Κ(λι,λι,λ3)為正定對角矩陣,住焚'為正的控制增益,戶€費為注 視差異的最大允許值。
[0075] 2、穩(wěn)定性分析
[0076] 定理1:自適應控制器(8)-(9)能保證注視差異始終在允許的范圍內(nèi),并且保證眼 球速度漸近跟蹤上目標速度,即注視差異漸近收斂于ο:
[0086] 運表明此閉環(huán)系統(tǒng)是Lyapunov穩(wěn)定的。當且僅當Φ)無(>-Δ)二0時,巧句=0。那 么由Lyapunov穩(wěn)定性定理可得
[0095] 為不失一般性,令[?(0)| = 0。假設在整個控制過程中,|?(0| ^ P,那么
運與(17)式的結(jié)論相矛盾。所W假設不成立。那么則有:
[0096] ?(?) <度,'.皆《.>〇 (18)
[0097]備注1:由于預測器的輸入為?(Ζ-Δ),因此對(9)式做進一步的修改:
[009引
(19)
[0099] 備注2:當初始目標速度不為加寸,(18)式應改為:
[0100] |?:的|<p,W>A (:2??)
[0101] 所提控制方法的結(jié)構(gòu)框圖如圖1所示。
[0102] 3、仿真結(jié)果
[0103] 為驗證所提控制方法的跟蹤性能,進行兩組仿真實驗。更準確地說,在第一組仿真 實驗中,對幾組0初始目標估計進行跟蹤。隨后,在第二組仿真實驗中,驗證所提控制方法對 非0初始目標軌跡的跟蹤性能。
[0104]仿真環(huán)境為Matlab/Simulink,采樣周期設置為0.01s。在仿真中,注視差異的最大 允許值設置為
[0105] p = 5°/s (21)
[0106] 視覺延時設置為:
[0107] Δ = 100ms (22)
[0108] 經(jīng)過充分調(diào)試后,控制增益選取如下:
[0109] 入1 = 〇.2,入2 = 12,入3 = 5,0=1, 丫 =0.01 (23)
[0110] 系統(tǒng)參數(shù)估計向量w(t)的初始值設置為:
[0111] "(0) = [0 0.8 0]τ (24)
[0112] 接下來進行兩組仿真實驗。第一組仿真實驗中,將驗證所提自適應跟蹤控制方法 針對0初始目標軌跡的跟蹤性能。隨后,所提自適應跟蹤控制方法針對非0初始目標軌跡的 跟蹤控制性能在第二組仿真實驗中進行了驗證。
[0113] 第一組實驗:針對0初始目標速度軌跡,驗證了所提帶有注視差異約束的自適應跟 蹤控制器的跟蹤性能。為此,考慮如下四種目標軌跡:
[0118] 仿真結(jié)果如圖2(a)-圖5(b)所示。由圖2(a)、圖3(a)、圖4(a)、圖5(a)可知,注視差 異始終保持在5°/sW內(nèi),并最終收斂于0。眼球速度在Is內(nèi)即可跟蹤上目標速度,此時注視 差異降為0。在整個平滑追蹤眼動過程中,注視差異被控制在很小的范圍內(nèi)。圖2(b)、圖3 (b)、圖4(b)、圖5(b)為系統(tǒng)未知系統(tǒng)參數(shù)的估計結(jié)果,系統(tǒng)參數(shù)估計向量在運四種情況下, 2s內(nèi)收斂于穩(wěn)定值。
[0119] 第二組仿真:本組仿真進一步驗證了所提控制方法針對非0初始目標速度的跟蹤 性能。為此,考慮如下四種情況:
[0120]情況1:Γ的= 20;
[0121 ]情況2:f(i) = 20cos(Tit);
[0122] 情況3: Γ的=2化-'cos(Tit);
[0123] 情況4: Γ的二 5.7滬]'sin (Tit)。
[0124] 仿真時間從100ms開始,控制增益與第一組仿真實驗完全一致。仿真結(jié)果如圖6 (a)-9(b)所示,給出了運四種情況下眼球速度/目標速度、注視差異、參數(shù)估計隨時間變化 的曲線。由圖可知,即使在目標速度的初始值不為0的情況下,眼球速度軌跡仍可迅速跟蹤 上目標速度軌跡,并且在整個平滑追蹤眼動過程中,注視差異始終在允許的范圍內(nèi)。
[0125] 上述雖然結(jié)合附圖對本發(fā)明的【具體實施方式】進行了描述,但并非對本發(fā)明保護范 圍的限制,所屬領域技術(shù)人員應該明白,在本發(fā)明的技術(shù)方案的基礎上,本領域技術(shù)人員不 需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護范圍W內(nèi)。
【主權(quán)項】
1. 帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器,其特征是,包括: 定義注視差異4^為目標速度與眼球速度的差值,設定注視差異的最大允許值P, 以注視差異最小為控制目標,得到目標速度的預測值為:其中,'?(1:) = [¥1(1:)¥2(1:)¥3(1:)]1'為系統(tǒng)參數(shù)估計向量,無(/) =「.〒(7)習/);^(/)」'為眼 球目標狀態(tài)估計向量,為目標位置估計值,芎0為目標速度估計值,? 為目標加速度 估計值;△為時間延時。2. 如權(quán)利要求1所述的一種帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器,其特 征是,所述系統(tǒng)參數(shù)估計向量w( t)的更新率為:其中,為正定對角矩陣,爲;re礦為正的控制增益,尸e:!T為注視差 異?:(〇的最大允許值。3. 帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方法,其特征是,包括: (1) 定義注視差異為目標速度與眼球速度的差值; (2) 設定注視差異的約束條件,以注視差異最小為平滑追蹤眼動的控制目標構(gòu)建控制 函數(shù); (3) 假設眼球速度與目標預測速度相等,根據(jù)注視差異得到目標速度的估計值; (4) 在注視差異滿足約束條件的情況下,根據(jù)所述目標速度的估計值得到目標位置估 計值以及目標速度的預測值; (5) 眼球速度等于目標速度的預測值,得到目標速度預測值后控制眼球產(chǎn)生相同的速 度。4. 如權(quán)利要求3所述的帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方 法,其特征是,所述步驟(2)中注視差異的約束條件具體為:其中,為注視差異,尸e識+為注視差異的最大允許值。5. 如權(quán)利要求3所述的帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方 法,其特征是,所述步驟(2)中控制函數(shù)具體為:注視差異的極限值為0。6. 如權(quán)利要求3所述的帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方 法,其特征是,所述步驟(3)中目標速度的估計值為目標預測速度與注視差異的和。7. 如權(quán)利要求3所述的帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方 法,其特征是,所述步驟(4)中,對目標速度的估計值關于時間積分得到目標位置估計值。8. 如權(quán)利要求3所述的帶注視差異約束的平滑追蹤眼動自適應跟蹤控制器的控制方 法,其特征是,所述步驟(4)中,對目標速度的估計值關于時間求導得到目標速度的預測值。
【文檔編號】G05B13/04GK105824239SQ201610181378
【公開日】2016年8月3日
【申請日】2016年3月25日
【發(fā)明人】馬昕, 張夢華, 徐衍亮, 宋銳, 李貽斌
【申請人】山東大學