專利名稱:基于多右端技術(shù)的三維互連寄生電感電阻的快速提取方法
技術(shù)領(lǐng)域:
基于多右端技術(shù)的三維互連寄生電感電阻的快速提取方法屬于集成電路計算機(jī)輔助設(shè)計(IC-CAD)技術(shù)領(lǐng)域。
背景技術(shù):
集成電路(Integrated Circuit,IC)是當(dāng)前電子工業(yè)、乃至信息產(chǎn)業(yè)的基石。隨著半導(dǎo)體集成電路制造技術(shù)的發(fā)展,電路中金屬互連線越來越窄(達(dá)到0.13微米以下),線與線的間距也越來越小。這使得互連線之間的電磁場寄生效應(yīng)已成為影響諸如延遲、功耗和可靠性等電路性能的主要因素。因此,在集成電路設(shè)計中必須考慮互連寄生效應(yīng)。
當(dāng)前VLSI-CAD的設(shè)計流程如圖1所示。要設(shè)計一塊芯片,首先要提出功能描述,然后經(jīng)過邏輯設(shè)計、版圖設(shè)計得到描述半導(dǎo)體工藝結(jié)構(gòu)的版圖。這時需要進(jìn)行一個“版圖驗證”的步驟,來驗證電路設(shè)計是否能達(dá)到當(dāng)初設(shè)定的性能要求,如果滿足要求就可以進(jìn)行生產(chǎn)制造,否則還要回到邏輯設(shè)計進(jìn)行修正,重復(fù)一個迭代的過程。在版圖驗證中,一個重要的環(huán)節(jié)稱為“寄生參數(shù)提取”,它包括計算金屬互連線之間的寄生電阻、電容、電感等參數(shù)。只有得到這些互連寄生參數(shù)后,才能進(jìn)行電路模擬以判斷電路是否達(dá)到性能要求。
在芯片特征尺寸持續(xù)縮小和集成度不斷提高的同時,電路時鐘頻率不斷提高,目前已達(dá)到3GHz以上。過去,互連延時一般只考慮寄生電容與電阻的影響,而忽略了電感的影響。但是,在高頻復(fù)雜互連結(jié)構(gòu)中,導(dǎo)體間相互電磁影響十分顯著,電感與電阻對芯片性能產(chǎn)生顯著影響。與電容一樣,電感對信號的傳輸產(chǎn)生延遲以及振鈴現(xiàn)象,影響信號完整性。因此,精確提取互連線間的電感電阻對設(shè)計高性能集成電路尤為重要。
在當(dāng)前工藝特征下,為進(jìn)行精確的電感電阻提取,需要對集成電路版圖的三維模型進(jìn)行數(shù)值模擬,其主要方法包括體積元法和邊界元法。前者較為成熟,已廣泛應(yīng)用于實際計算。七十年代由IBM公司W(wǎng)atson研究中心Ruehli等人引進(jìn)互連電感電阻提取的PEEC(PartialElement Equivalent Circuit)模型以及著名軟件RAPHAEL與FastHenry使用的都屬于體積元方法。它們精度高,穩(wěn)定性好。近年來,多種快速算法如多極加速、層次式計算等被應(yīng)用于體積元方法中,使速度得到顯著提高。雖然體積元方法有上述優(yōu)點,但由于工業(yè)實際中計算需求越來越多、其中考慮的三維結(jié)構(gòu)也越來越大,如何提高三維電感電阻提取方法的計算速度就成了當(dāng)務(wù)之急。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種可加速迭代收斂速度的基于多右端技術(shù)的三維互連寄生電感電阻的快速提取方法。
對一塊導(dǎo)體而言,電感提取是計算導(dǎo)體兩端電壓與通過導(dǎo)體電流之間的關(guān)系。對一個K個端口對的正弦穩(wěn)態(tài)系統(tǒng)Yt(ω)Vt(ω)=It(ω) (1)其中,Yt(ω)是一個k×k階的復(fù)數(shù)矩陣,其物理意義為導(dǎo)納矩陣。導(dǎo)納矩陣是阻抗矩陣的逆。ω為角頻率,It,Vt是k維的復(fù)數(shù)向量,其物理意義分別為端口對的電流、電壓向量。為方便描述如何計算端口電感,可考察一個只包含兩個端口對的系統(tǒng),如圖2所示。對于該系統(tǒng)Yt(ω)=Y11Y12Y21Y22---(2)]]>其中Yij為第i個端口對與第j個端口對之間的互導(dǎo)納。
在兩個端口對分別設(shè)置1伏特和0伏特的電壓,通過計算求出各端口對上的電流從而得到導(dǎo)納阻抗的一列。
在準(zhǔn)靜態(tài)電磁場的假設(shè)下,在導(dǎo)體細(xì)長的條件下,可以認(rèn)為電流僅沿導(dǎo)體的長度方向流動。為描述趨膚效應(yīng),將導(dǎo)體在截面上離散為一束電流細(xì)絲(filament),每個電流細(xì)絲上的電流密度為常數(shù),如圖3所示。在離散平板導(dǎo)體或襯底時,由于電流在二維平面內(nèi)流動,需要在一點上設(shè)定2個相互正交方向,才能描述二維電流方向,如圖4所示。導(dǎo)體劃分為電流細(xì)絲后,即可看作一個電路網(wǎng)絡(luò),其中節(jié)點是細(xì)導(dǎo)線之間的連接點,邊為電流細(xì)絲,圖5顯示將一個導(dǎo)體離散成2×2的電流細(xì)絲,并看作一個電路網(wǎng)絡(luò)。離散化后的系統(tǒng)寫成矩陣形式如下(R+jωL)Ib=Vb(3)其中,R和L分別為離散化后電流細(xì)絲的電阻矩陣和電感矩陣,b為電流支路數(shù),Ib為b維的細(xì)絲電流向量,Vb為b維的細(xì)絲壓降向量。而Rii=liσai,Lij=μ4πaiaj∫Vi∫Vjli0·lj0rijdVjdVi---(4)]]>其中,Rii為b×b的直流電阻對角陣,li為細(xì)絲的長度,σ為電導(dǎo)率,ai為細(xì)絲的橫截面積。Lij是b×b的稠密、對稱正定部分電感陣。μ為真空中的磁導(dǎo)率,ai,aj分別為細(xì)絲i與j的截面積,Vi,Vj為其體積,li0,lj0為細(xì)絲單位軸向量,rij為細(xì)絲微元dvj與dvi中心點之間的距離。矩陣方程(3)可以簡寫為ZIb=Vb(5)其中Z為細(xì)絲之間的阻抗矩陣。
我們采用網(wǎng)孔分析法(mesh analaysis)對該電路進(jìn)行分析。獨立網(wǎng)孔是電路圖中任意一個不包含其它支路的回路。引入網(wǎng)孔矩陣M,M為n×b的矩陣,其中n是電路中的獨立網(wǎng)孔數(shù),b是電流支路的數(shù)量,也就是電流細(xì)絲的數(shù)量。網(wǎng)孔矩陣實際上描述了網(wǎng)孔與支路的關(guān)系,圖6為將圖5(a)的一個導(dǎo)體離散成2×2的電流細(xì)絲,并表示成網(wǎng)孔電路網(wǎng)絡(luò)示意。
對于該結(jié)構(gòu),網(wǎng)孔矩陣M=1-10001-10001-10001.]]>根據(jù)基爾霍夫電壓定律(KVL),有MVb=Vs(6)其中Vs是電源支路的電壓向量,電源支路是指含有電源的支路。另外,根據(jù)基爾霍夫電流定律(KIL),有MtIm=Ib(7)其中,Mt為M的轉(zhuǎn)置,Im為網(wǎng)孔電流向量。
將式(6)與(7)代入式(5),得到MZMtIm=Vs(8)用迭代法求解方程(8),得到網(wǎng)孔電流。用已知的電壓除以電流即可計算出阻抗矩陣。
本發(fā)明的特征在于主要是求解多右端系統(tǒng)以得到多端口對系統(tǒng)的阻抗矩陣時,采用了可使迭代過程超速收斂的在不同端口對上設(shè)置電壓的方法以及一種擴(kuò)展的基于種子投影技術(shù)的多右端廣義極小化殘余(ESGMRES)方法,具體而言,本提取方法依次含有以下步驟(1)向計算機(jī)輸入以下信息 導(dǎo)體和襯底的位置坐標(biāo)和幾何形狀信息, 各導(dǎo)體的電導(dǎo)率、劃分?jǐn)?shù)和劃分比值, 版圖尺寸的單位, 要求計算的端口對, 計算頻率, 用戶選擇的預(yù)條件;(2)用考慮了趨膚效應(yīng)的電流細(xì)絲自動劃分方法將導(dǎo)體與襯底離散化,即使靠近導(dǎo)體表面的電流細(xì)絲尺寸小于趨膚深度δ,趨膚深度的公式為δ=1/(πμσf),]]>其中π為圓周率,μ=4π×10-7為真空中的磁導(dǎo)率,σ為導(dǎo)體的電導(dǎo)率,f為計算頻率,設(shè)W、T為導(dǎo)體矩形橫截面的寬度和高度,n、m為兩個方向劃分?jǐn)?shù),ΔW、ΔT分別為電流細(xì)絲在寬度和高度方向的尺寸,則當(dāng)W/n≤δ/2(T/m≤δ/2),鄰近導(dǎo)體表面n-1(m-1)個電流細(xì)絲的尺寸ΔW=δ/4(ΔT=δ/4),中間電流細(xì)絲尺寸為ΔW=W-(n-1)δ/4(ΔT=T-(m-1)δ/4),當(dāng)W/n>δ/2(T/m>δ/2),鄰近導(dǎo)體表面n-1(m-1)個電流細(xì)絲的尺寸ΔW=δ/2(ΔT=δ/2),中間電流細(xì)絲尺寸為ΔW=W-(n-1)δ/2(ΔT=T-(m-1)δ/2);(3)把公知的多極加速算法用于矩陣—向量乘中,計算多極加速算法所需的系數(shù)首先按下述策略對離散化的整個系統(tǒng)作非均勻立方體劃分以區(qū)分粒子間的聚集程度和遠(yuǎn)近場關(guān)系,在非均勻立方體劃分方法的基礎(chǔ)上,作如下改進(jìn)策略當(dāng)電流細(xì)絲的長度大于其所屬立方體邊長的二倍時,沿電流細(xì)絲長度方向?qū)㈦娏骷?xì)絲等切割成2份,電流細(xì)絲的位置由其中心確定;其次,用公知技術(shù)計算多極加速算法中所需的系數(shù);(4)用已知技術(shù)把每一個電流細(xì)絲視為一個小電阻與小電感的串聯(lián)電路,把整個離散化系統(tǒng)構(gòu)成一個復(fù)雜的電路網(wǎng)絡(luò),用網(wǎng)孔分析方法形成我們要求解的細(xì)絲阻抗矩陣系數(shù)(4.1)根據(jù)所形成的電路網(wǎng)絡(luò)中網(wǎng)孔與支路的關(guān)系形成網(wǎng)孔矩陣M,M為n×b的矩陣,其中n是電路中的獨立網(wǎng)孔數(shù),b是電流支路的數(shù)量;(4.2)形成細(xì)絲阻抗系數(shù)矩陣MZMt,其中Z為細(xì)絲之間的阻抗矩陣;(5)根據(jù)用戶的選擇,形成預(yù)條件以便把方程組(8)化為一個與之等價的方程組,加速迭代收斂速度;(6)求解離散化系統(tǒng)方程組(6.1)在不同端口對上設(shè)置電壓在第一個端口對設(shè)置1伏電壓,在其余端口對設(shè)置0伏電壓,從而得到右端V的第1列V(0);再在第一個端口對設(shè)置1伏電壓,在第i個端口對設(shè)置ζ伏電壓,從而得到右端V的第i列V(i)(2≤i≤k),表示成矩陣形式如下 (6.2)用擴(kuò)展的基于種子的多右端GMRES方法得到方程組(8)的解網(wǎng)孔電流向量I=[I(1),I(2),…,I(k)](6.2.1)輸入第一個右端V(1)和系數(shù)矩陣MZMt,將該矩陣記為A,把第一個右端選為種子,用附錄中的Arnoldi過程得到種子右端的搜索空間[d1,d2,…,dm],記為{Dm};(6.2.2)用已知的非種子右端[V(2),V(3),…,V(k)]和(6.2.2)得到的種子右端搜索空間{Dm},通過擴(kuò)展的Arnoldi過程來形成非種子右端的搜索空間;(6.2.3)求解非種子右端得到網(wǎng)孔電流向量[I(2),I(3),…,I(k)];(6.2.4)用設(shè)置的端口對電壓除以網(wǎng)孔電流向量計算出端口對上的阻抗以及它與其它端口對之間的互阻抗。
在Smith等人提出的基于種子的投影方法中,待解右端的搜索空間并沒有得到擴(kuò)充。而Lingen則提出了一種擴(kuò)展的GCR方法(EGCRExtended Generalized Conjugate Residual)求解非對稱多右端線性系統(tǒng)。它最突出的一個優(yōu)點就是將待解右端的搜索空間與已解右端得到的搜索空間正交化,從而使得搜索空間的維數(shù)得到了很大的提高,加速了迭代的收斂速度。在將EGCR應(yīng)用于電感提取時,有以下三個缺點被注意到。第一,正交化過程中向量內(nèi)積次數(shù)與搜索空間的維度成正比,隨著搜索空間的擴(kuò)大,每次迭代中用于正交化的時間也會逐步增加。當(dāng)搜索空間維度增加到一定程度時,它所能帶來的好處將被正交化時間的增加所淹沒。第二,隨著搜索空間不斷擴(kuò)大,正交化的次數(shù)逐步增多,大量的計算誤差會使基的正交性下降,既影響結(jié)果精度,也影響迭代的收斂速度。第三,相對GMRES算法,GCR算法在迭代過程中會產(chǎn)生中斷。
ESGMRES算法克服了上述缺點,其優(yōu)點為(1)不同于EGCR算法將待解右端的搜索空間與前面所有已解右端的搜索空間正交化,ESGMRES算法將非種子右端的搜索空間僅與種子右端的搜索空間正交化。在EGCR算法中,隨著已解右端數(shù)的增加,搜索空間的維數(shù)越來越大,每次迭代中用于正交化的時間也會急劇增加。而在ESGMRES算法中,當(dāng)已解右端數(shù)增加時,由于種子右端的搜索空間并沒有變化,因此每次迭代中正交化的時間基本保持是一個常數(shù)。
(2)在EGCR算法中,正交化的計算量與右端數(shù)成正比關(guān)系。在ESGMRES算法中,正交化的計算量是與右端數(shù)無關(guān)的。因此,當(dāng)問題的右端數(shù)增加時,ESGMRES算法對EGCR算法的加速比也會逐漸增加。
(3)由于正交化的次數(shù)基本保持一個常數(shù),搜索空間的基向量的正交性也得到了很好的保證。
(4)ESGMRES算法在迭代中不會產(chǎn)生中斷。
圖1集成電路設(shè)計流程。
圖2一個包含兩個端口對的系統(tǒng)。
圖3導(dǎo)體分為5段,每段分成35個細(xì)導(dǎo)線。
圖4襯底的離散化示意圖。
圖5離散化形成電路網(wǎng)絡(luò)。(a)分段導(dǎo)體;(b)離散成細(xì)導(dǎo)線;(c)看作電路,方框表示細(xì)導(dǎo)線的電阻與電感,電感包括互感。
圖6網(wǎng)孔電路網(wǎng)絡(luò)示意。
圖7三維電感電阻提取軟件FIE的流程框圖。
圖8處理輸入流程框圖。
圖9離散化系統(tǒng)流程框圖。
圖10不同的盒劃分(最細(xì)層盒所含粒子數(shù)小于等于4)。(a)粒子分布;(b)均勻盒劃分;(c)不均勻盒劃分;(d)改進(jìn)的不均勻盒劃分。
圖11電流細(xì)絲再劃分。(a)細(xì)絲再劃分前示意圖;(b)細(xì)絲再劃分后示意圖。
圖12形成多極加速算法所需的系數(shù)流程框圖。
圖13形成方程組和預(yù)條件處理流程框圖。
圖14ESGMRES算法各模塊間關(guān)系圖。
圖15求解種子右端流程框圖。
圖16構(gòu)造非種子右端搜索空間流程框圖。
圖17求解非種子右端流程框圖。
圖18EGCR與ESGMRES具有相同加速效果時,p/q隨右端數(shù)增加的變化曲線。
圖19實施實例1。(a)頂視圖;(b)沿y軸方向的側(cè)視圖。
圖20(a)梯形近似 (b)矩形近似。
圖21算例30管腿示意圖。
圖22算例30管腿中一個管腿示意圖。
具體實施例方式
基于上述模型,我們實現(xiàn)了一個快速三維互連寄生電感電阻提取軟件FIE(FastInductance Extraction)。FIE主要包括以下幾個步驟(如圖7)1.處理輸入的互連結(jié)構(gòu)。我們要計算的版圖互連結(jié)構(gòu)由用戶按照我們提出的描述格式寫成一個輸入文件。FIE通過從硬盤讀入該輸入文件進(jìn)而計算該互連結(jié)構(gòu)的寄生電感電阻。輸入的信息包括導(dǎo)體和襯底的位置坐標(biāo)和幾何形狀信息,各導(dǎo)體的電導(dǎo)率、劃分?jǐn)?shù)和劃分比值,版圖尺寸的單位,要求計算的端口對,計算頻率。我們提出了一種基于層定義的方便用戶使用的描述格式。與FastHenry(FastHenry是由MIT開發(fā)的著名三維電感電阻提取軟件)只能描述和計算頂視為矩形的結(jié)構(gòu)不同,而在我們的描述格式中,可描述和計算頂視為梯形的結(jié)構(gòu),在涉及復(fù)雜結(jié)構(gòu)計算時,具有較高的幾何描述精度。流程如圖8所示。
2.離散化系統(tǒng)。根據(jù)由我們提出的一種考慮趨膚效應(yīng)的電流細(xì)絲自動劃分方法將導(dǎo)體與襯底進(jìn)行離散化。在交流電路里,隨著頻率的增加,在導(dǎo)體橫截面上的電流分布越來越向?qū)w表面集中,這種現(xiàn)象叫做趨膚效應(yīng)。在確定了由用戶給出的各導(dǎo)體劃分?jǐn)?shù)后,我們提出了一種改進(jìn)的劃分規(guī)則。為準(zhǔn)確反映導(dǎo)體橫截面電流的非均勻分布,需使靠近導(dǎo)體表面的電流細(xì)絲尺寸小于趨膚深度。記設(shè)W、T為導(dǎo)體矩形橫截面的寬度和高度,n、m為兩個方向劃分?jǐn)?shù),ΔW、ΔT分別為電流細(xì)絲在寬度和高度方向的尺寸。下面給出ΔW、ΔT的計算規(guī)則1)如果W/n≤δ/2(T/m≤δ/2),鄰近導(dǎo)體表面n-1(m-1)個電流細(xì)絲的尺寸ΔW=δ/4(ΔT=δ/4),中間電流細(xì)絲尺寸為ΔW=W-(n-1)δ/4(ΔT=T-(m-1)δ/4)。
2)如果W/n>δ/2(T/m>δ/2),鄰近導(dǎo)體表面n-1(m-1)個電流細(xì)絲的尺寸ΔW=δ/2(ΔT=δ/2),中間電流細(xì)絲尺寸為ΔW=W-(n-1)δ/2(ΔT=T-(m-1)δ/2)。
流程如圖9所示。
3.形成多極加速算法所需的系數(shù)。我們在后面的迭代求解方程組的過程中將多極加速算法(Fast Multipole Method)應(yīng)用于矩陣—向量乘中。多極加速的主要原理,是運用了稱為多極展開(Multipole Expansions)和局部展開(Local Expansions)的兩種近似。該方法把要計算的矩陣—向量乘視為電場計算,并把電場計算分為近場(nearfield)計算和遠(yuǎn)場(far field)計算兩大部分,近場計算用式(4)直接求出,遠(yuǎn)場部分則用多極展開和局部展開兩種近似求出。由于遠(yuǎn)場部分的計算采用了近似計算,從而使得計算復(fù)雜度與問題規(guī)模呈線性關(guān)系,大大提高了計算速度。其中多極展開的公式為Ψ(rj,θj,Φj)≈Σn=0lΣm=-nnMnmrjn+1Ynm(θj,Φj)---(10)]]>其中l(wèi)為展開階數(shù),rj、θj和Φj是第j個評價點關(guān)于環(huán)中心(展開中心)的球坐標(biāo)。Ynm(θj,Φj)為球諧函數(shù),Mnm稱為多極系數(shù)。局部展開的公式為
Ψ(rj,θj,Φj)≈Σn=0lΣm=-nnLnmYnm(θj,Φj)rjn---(11)]]>其中,l為展開的階數(shù),rj,θj和Φj是第j個評價點關(guān)于環(huán)中心(展開中心)的球坐標(biāo)。Ynm(θj,Φj)為球諧函數(shù),Lnm稱為局部展開系數(shù)。式(10)和(11)中的多極展開系數(shù)Mnm和局部展開系數(shù)Lnm可以通過公知技術(shù)(“L.Greengard,‘The rapid evaluationof potential fields in particle systems,’The MIT Press,Cambridge,MA 1987”)計算求出。
由多極展開和局部展開的原理可知,必須區(qū)分粒子之間的遠(yuǎn)、近距離關(guān)系,然后分別對待。通過對離散化后的整個系統(tǒng)作不同層次的立方體(cube,三維)或盒子(box,二維)劃分以區(qū)分粒子間的聚集程度和遠(yuǎn)近關(guān)系。圖10(b)是對示于圖10(a)的粒子分布進(jìn)行均勻盒劃分的情形。但對大多數(shù)來自實際版圖的互連寄生器件來說,離散后的粒子分布往往極不均勻,將產(chǎn)生大量空盒,使計算效率嚴(yán)重下降。圖10(c)是非均勻盒劃分的情況。它與均勻盒劃分的區(qū)別在于只細(xì)分那些粒子數(shù)大于某常數(shù)的盒,從而避免空盒的大量出現(xiàn)。上述非均勻盒劃分存在兩點不足,一是未能避免出現(xiàn)空盒,如圖10(c)中的盒A和盒B;二是某些粒子的近場較之均勻劃分明顯增加,如圖10(c)中的點a,整個計算域都是它的近場,而在均勻劃分下,對a的作用均可視為遠(yuǎn)場。為此,我們采用了一種完全去除空盒并有效控制近場計算量的非均勻立方體劃分方法,如圖10(d)所示。
在電感提取中,離散化后的電流細(xì)絲長度要遠(yuǎn)遠(yuǎn)大于其橫截面尺寸。而在多極加速中我們將電流細(xì)絲認(rèn)為是在其中心點處的一個粒子,這樣就會使得矩陣—向量乘中的遠(yuǎn)場計算精度受到很大的影響。如果簡單的將電流細(xì)絲沿長度方向切割成長度與橫截面尺寸相近的電流細(xì)絲,固然能夠得到很好的計算精度,但是過量的離散化量將使得計算效率極大的降低。因此我們提出了一種基于非均勻立方體劃分方法的改進(jìn)策略當(dāng)電流細(xì)絲的長度大于其所屬立方體邊長的二倍時,沿電流細(xì)絲長度方向?qū)㈦娏骷?xì)絲等切割成2份,電流細(xì)絲的位置由其中心確定。如圖11所示。
(見“楊柳,王澤毅,‘三維互連電感電阻的快速提取,’電子學(xué)報,vol.30,no.11,pp1593-1596,November,2002”)。在完成立方體劃分后,我們就可以計算出多極加速算法中所需的系數(shù)。流程如圖12所示。
4.形成阻抗方程。把每一個電流細(xì)絲視為一個小電阻與小電感的串聯(lián)電路,把整個離散化系統(tǒng)構(gòu)成一個復(fù)雜的電路網(wǎng)絡(luò)。用已知的網(wǎng)孔分析方法,根據(jù)形成的電路網(wǎng)絡(luò)中網(wǎng)孔與支路的關(guān)系得到網(wǎng)孔矩陣M。從而計算出細(xì)絲阻抗系數(shù)矩陣MZMt。
5.形成預(yù)條件。預(yù)條件的基本思想是將原方程化成一個與之等價的方程組,其比原方程更加容易求解。例如對于方程組Ax=f,我們找到一個預(yù)條件矩陣P,將原方程組變?yōu)榕c之等價的方程組PAx=Pf。如果矩陣P很近似于矩陣A的逆,那么變換后的方程組收斂速度將明顯高于原方程組的收斂速度。在實驗中我們發(fā)現(xiàn)方程組(8)在沒有使用預(yù)條件時收斂速度非常慢。為了提高計算速度,我們實現(xiàn)了四種有效的預(yù)條件。為方便描述,我們將方程組(8)中的細(xì)絲阻抗系數(shù)矩陣MZMt記為A,預(yù)條件矩陣為P。由于我們使用了多極加速技術(shù),矩陣MZMt中的Z沒有顯式形式,也就是說在整個計算過程矩陣Z的大多數(shù)系數(shù)都沒有求出。另一方面,Z是一個n×n的稠密矩陣(其中n是離散化的電流細(xì)絲數(shù)),計算MZMt的近似逆的工作量非常大。因此,我們用另一個矩陣Zs近似矩陣Z。
Zs=R+jωLs(12)其中Ls=[l1,l2,…,li,…,ln]是一個稀疏矩陣,它的第i行如下 其中Lii是第i個電流細(xì)絲的自感,Lij是第i個電流細(xì)絲與第j個電流細(xì)絲的互感,它屬于第i個電流細(xì)絲的近場。下面四種預(yù)條件就是通過用四種方法求出MZsMt的近似逆P,P即為形成的預(yù)條件矩陣1)Jacobi預(yù)條件。對矩陣MZsMt的對角元進(jìn)行求逆形成預(yù)條件,構(gòu)造方法如下 2)Block預(yù)條件。我們發(fā)現(xiàn)相互靠近的電流細(xì)絲耦合作用較大,也就是說,在MZsMt的第i行中,靠近第i列的元的值較其他元的值大。預(yù)條件矩陣P的第i行可以通過求解如下方程組得到ai-1,i-1ai-1,iai-1,i+1ai,i-1ai,iai,i+1ai+1,i-1ai+1,iai+1,i+1Pi-1,iPi,iPi+1,i=010---(15)]]>其中aij為矩陣MZsMt的第i行第j列的元素。方程組(15)的解就是預(yù)條件矩陣P的第i行。
3)ILU預(yù)條件。用不完全LU分解將矩陣MZsMt分解成一個稀疏的上三角矩陣L和一個稀疏的下三角矩陣U。分解因子L和U即為我們所求的預(yù)條件矩陣。本文中采用的不完全LU分解技術(shù)為沒有填充的0級不完全LU分解,記為ILU(0)。
4)LU預(yù)條件。數(shù)值實驗顯示ILU預(yù)條件對某些算例效果并不太好,這是因為某些被ILU(0)分解忽略的項是很重要的。因此我們使用準(zhǔn)確的LU分解矩陣MZsMt作為預(yù)條件。
流程如圖13所示。
6.求解離散化系統(tǒng)方程。對于一個含k個端口對的結(jié)構(gòu),若要得到端口對間依賴頻率的阻抗復(fù)矩陣Z(ω),需逐次在第i(i=1,…,k)個端口對設(shè)置1伏電壓,其余端口對設(shè)置0伏電壓,以得到Z(ω)的第i列。也就是說,問題成為求解如下多右端線性系統(tǒng)MZMtI=V (16)其中,I=[I(1),I(2),…,I(k)]為n×k階的網(wǎng)孔電流矩陣,I(i)為在第i個端口對設(shè)置1伏電壓時待求的網(wǎng)孔電流向量。V=[V(1),V(2),…,V(k)]n×k階的電源支路的電壓矩陣,V(i)為在第i個端口對設(shè)置1伏電壓時的電源支路的電壓向量。求解方程組(16),所有端口對上的電流均可得到,最后用1伏特電壓除以電流即可計算出該端口對上的阻抗以及與其他端口對之間的互阻抗。
在步驟6中,通常的方法是對每一右端V(i)分別用廣義極小殘余方法(GMRES)求解I(i)。本專利申請中提出一種新的設(shè)置電壓的方法以及一種擴(kuò)展的基于種子的多右端GMRES方法,稱其為ESGMRES。用我們提出的多右端技術(shù)代替步驟6求解方程組(16),使三維互連寄生電感電阻提取軟件FIE的計算速度得到了很大的提高。
在三維互連寄生電感電阻提取中,若要得到一個多端口對系統(tǒng)的阻抗矩陣,那么需要求解一個多右端線性系統(tǒng)(16)。
目前,求解多右端線性系統(tǒng)的方法大致分為三類。一是塊方法(Block Methods),例如塊共軛梯度法(Block Conjugate Gradient)。第二類是全局方法,例如Global GMRES(Gl-GMRES)方法。第三類是基于種子的投影方法,它首先由Smith等人在文(“A conjugategradient algorithm for the treatment of multiple incident electromagnetic fields,”IEEE Transactions On Antennas And Propagation,37(11)1490-1493,1989)中提出,Chan和Wang在文(“Analysis of projection methods for solving linear systems withmultiple right-hand sides,”SIAM J.Sci.Comput.18(1997)1698-1721)中給出了這類方法相關(guān)的理論分析。
在電感電阻提取中,所形成線性方程組的系數(shù)矩陣是稠密的,這使每一次Krylov子空間迭代過程中矩陣—向量乘的計算量遠(yuǎn)大于其它運算的計算量。而塊和全局兩類方法著重于減少矩陣—向量乘以外運算的計算量,比較適合于使用有限差分或有限元方法所形成具有良好稀疏性的多右端系統(tǒng)。因此,針對電感電阻提取中方程組的性質(zhì),我們著重研究基于種子的投影方法。
基于種子的投影方法由Smith等人在1989年應(yīng)用于共軛梯度法(Conjugate Gradient)。它的主要思想是,從所有右端中選出一個作為種子(seed),并用一般的迭代法求解,然后,將余下右端產(chǎn)生的殘余用Galerkin方法投影到種子求解過程已形成的Krylov子空間中,可得到非種子右端的近似解。基于投影的思想,隨后很多人將它應(yīng)用于其它迭代方法中,如 GMRES(Generalized Minimal RESidual)、QMR(Quasi Minimal Residual)、GCR(Generalized Conjugate Residual)等。數(shù)值結(jié)果和理論分析表明,投影方法相對一般的迭代方法具有超收斂性,而且,當(dāng)右端相互靠近時,非種子右端只需要較少的迭代次數(shù)就能收斂。
Ligen對GCR的種子投影方法加以擴(kuò)展,提出了一種EGCR(Extended GeneralizedConjugate Residual)方法(“A generalized conjugate residual method for the solutionof non-symmetric systems of equations with multiple right-hand sides,”International journal for numerical methods in engineering,44,641-656,1999)加速多右端問題求解。它不僅通過投影得到待解右端的初始解,同時在構(gòu)造這些右端的搜索空間時,將其與已解右端形成的搜索空間正交化,從而增加待解右端搜索空間的維數(shù),以提高迭代的收斂速度。
本專利申請中算法用于求解電感電阻提取中出現(xiàn)的多右端系統(tǒng)(FIE中的步驟6),它包括兩個部分一種新的設(shè)置電壓的方法以及一種擴(kuò)展的基于種子的多右端GMRES方法(ESGMRESExtended Seed Generalized Minimal RESidual)。
新的設(shè)置電壓的方法Chan和Wang的理論分析指出當(dāng)右端相互靠近時,基于種子的投影方法對非種子右端只需要較少的迭代次數(shù)就能收斂。相反地,如果右端相對獨立時,其收斂速度將會明顯下降。在電感電阻提取中,右端V=[V(1),V(2),…,V(k)]為分別在不同端口對上設(shè)置電壓得到的電源支路的電壓向量。V(i)為在第i個端口對設(shè)置1伏電壓,其余端口對設(shè)置0伏電壓時的電源支路的電壓向量。根據(jù)原來設(shè)置電壓的方法,方程組(16)中得到的右端為 其中ei為第i個分量等于1的單位向量。很顯然經(jīng)這樣設(shè)置電壓方法得到的右端是相互線性無關(guān)的,而數(shù)值結(jié)果也顯示對于這樣的右端,投影方法與通常的迭代方法收斂速度相近。
根據(jù)投影方法的收斂速度與右端間相關(guān)性的關(guān)系,我們提出了一種新的設(shè)置電壓的方法在第一個端口對設(shè)置1伏電壓,在其余端口對設(shè)置0伏電壓,從而得到右端V的第1列V(1)。在第一個端口對設(shè)置1伏電壓,在第i個端口對設(shè)置ξ伏電壓,從而得到右端V的第i列V(i)(2≤i≤k)。表示成矩陣形式如下 其中ξ為一可選擇的適當(dāng)小量。新的設(shè)置電壓方法明顯的提高了右端間的相關(guān)性,從而使得投影方法更有效。數(shù)值結(jié)果也顯示在可比精度下,投影方法對于(18)的迭代次數(shù)要遠(yuǎn)低于(17)。另一方面,參數(shù)ξ的取值不能太小,以避免過量的精度損失。
擴(kuò)展的基于種子的多右端GMRES方法(ESGMRES)為解決電感電阻提取中的多右端問題(16),我們提出了一種擴(kuò)展的基于種子的多右端GMRES方法,簡稱為ESGMRES(Extended Seed Generalized Minimal RESidual)算法。數(shù)值結(jié)果與分析均表明,相對于通常的迭代方法以及原有的基于種子的投影方法,它的迭代次數(shù)以及解方程時間得到了很大的提高。
下面將詳細(xì)描述ESGMRES算法應(yīng)用于寄生電感電阻提取中。為更好的理解該算法,附錄中給出了廣泛應(yīng)用于工程中求解線性方程組的迭代方法GMRES算法。
為方便描述和討論ESGMRES算法,將方程組(16)簡寫成如下形式AI=V(19)其中A=MZMt為形成的系數(shù)矩陣,V=[V(1),V(2),…,V(k)]為電源支路的電壓向量,I=[I(1),I(2),…,I(k)]為待求解的網(wǎng)孔電流向量。V,I均為n×k的長方形矩陣,k為遠(yuǎn)小于矩陣階數(shù)n的右端數(shù)(k<<n)。
ESGMERS算法的輸入為根據(jù)版圖幾何結(jié)構(gòu)信息經(jīng)離散化后得到的一個系數(shù)矩陣A,以及在端口對上設(shè)置相應(yīng)的電壓得到的電壓向量V=[V(1),V(2),…,V(k)]。輸出為網(wǎng)孔電流向量I=[I(1),I(2),…,I(k)]。算法主要包括三個模塊模塊1求解種子右端。該模塊的輸入為系數(shù)矩陣A和種子右端V(1),輸出為網(wǎng)孔電流向量I(1)以及種子右端的搜索空間[d1,d2,…,dm],記為{Dm}。
模塊2構(gòu)造非種子右端的搜索空間。該模塊的輸入為非種子右端[V(2),V(3),…,V(k)]和模塊1得到的種子右端搜索空間{Dm}。輸出為非種子右端的搜索空間。
模塊3求解非種子右端。輸入為模塊2得到的非種子右端搜索空間。輸出為非種子右端的解網(wǎng)孔電流向量[I(2),I(3),…,I(k)]。
上述三個算法模塊的關(guān)系如圖14所示。其中模塊2和模塊3要循環(huán)執(zhí)行,直至得到所有待求解的網(wǎng)孔電流向量I=[I(1),I(2),…,I(k)]。下面分別予以描述。
求解種子右端用來求解種子右端,并得到種子右端的搜索空間。因為在模塊2中,為了擴(kuò)大非種子右端的搜索空間,需要與種子右端的搜索空間正交化。首先給出殘余的定義對于方程組Ax=b,在得到一個近似解 之后,殘余就是 迭代的收斂條件就是使得近似解 的殘余 小于一個給定的小量。在迭代求解前,首先要為每個網(wǎng)孔電流向量I(i)選擇一個初始值,記為[I0(1),I0(2),…,I0(k)]。相應(yīng)得到的殘余為R=[r(1),r(2),···,r(k)]=[V(1)-AI0(1),V(2)-AI0(2),···,V(k)-AI0(k)].]]>將第一個右端V(1)選為種子,用公知技術(shù)Arnoldi過程得到種子右端的搜索空間[d1,d2,…,dm],記為{Dm},并用GMRES算法求解得到種子右端的網(wǎng)孔電流向量I(1)。具體流程框圖見圖15。
構(gòu)造非種子右端的搜索空間在已知的非種子右端[V(2),V(3),…,V(k)]和模塊1中得到的種子右端搜索空間{Dm}的基礎(chǔ)上構(gòu)造出非種子右端的搜索空間。該模塊是ESGMRES算法的核心部分。它通過將非種子右端的搜索空間與種子右端的搜索空間{Dm}正交化,從而達(dá)到擴(kuò)展非種子右端的搜索空間的目的。我們提出了一種擴(kuò)展的Arnoldi過程(Extended Arnoldi Process)來形成非種子右端的搜索空間。由于對于每個非種子右端而言,都使用同樣的擴(kuò)展的Arnoldi過程來完成,因此不失一般性,我們以第i個非種子右端為例來說明如何構(gòu)造非種子右端搜索空間。輸入為V(i)和{Dm},輸出為第i個非種子右端的搜索空間。算法流程為(如圖16)1.計算殘余r(i)。r(i)=V(i)-AI0(i),其中I0(i)為對應(yīng)第i個非種子右端的初始網(wǎng)孔電流向量。
2.歸一化殘余。u1=r(i)/‖r(i)‖2,其中‖□‖2是指向量的二范數(shù)。
3.將u1與種子右端搜索空間{Dm}正交化,歸一化后得到第一個基向量w1。w~1=u1-Σj=1m(u1,dj)dj,w1=w~1/||w~1||2.]]>其中(,)表示兩個向量的內(nèi)積,下同。
4.構(gòu)造第p+1個基向量wp+1。For p=1,2,…,l do1)計算up+1.u~p+1=Aup-Σj=1pcj,puj,]]>其中cj,p=(Aup,uj)。將 歸一化得到up+1,up+1=u~p+1/||u~p+1||2.]]>2)將Aup與種子右端搜索空間{Vm}以及已得到的p個基向量[w1,w2,…,wp]正交化得到 w~p+1=Aup-Σj=1mhj,m+p-1dj-Σj=m+1m+phj,m+p-1wj-m,]]>其中 3)歸一化 得到第p+1個基向量wp+1。wp+1=w~p+1/hm+p+1,m+p-1,]]>其中hm+p+1,m+p-1=||w~p+1||2.]]>5.End for6.將新形成的一組基向量{Wl+1}=[w1,w2,…,wl+1]與種子右端搜索空間{Dm}合并,構(gòu)造出第i個非種子右端的搜索空間{Dm,Wl+1}=[d1,d2,…,dm,w1,w2,…,wl+1]。記 =[d1,d2,…,dm-1,u1,u2,…,ul]。
很顯然,上述過程擴(kuò)充了非種子右端的搜索空間,從而加速了其迭代收斂速度。
求解非種子右端求解非種子右端的輸入為模塊2中得到的非種子右端搜索空間。通過在搜索空間中找一個向量y,使得殘余量‖r(i)-A[Dm-1,Ul]y‖2極小化,從而得到非種子右端的解網(wǎng)孔電流向量[I(2),I(3),…,I(k)]。其實質(zhì)就是求解一個最小二乘問題miny∈Cm+l-1||[Dm,Wl+1]Tr(i)-H‾m+l-1y||2,]]>其中Hm+l-1形式如下 下面介紹如何求解這個最小二乘問題來得到非種子右端的解。由于對于每個非種子右端而言,都使用同樣的極小化過程來完成,因此不失一般性,我們以第i個非種子右端為例來說明如何在搜索空間中找到向量y,從而得到非種子右端的解網(wǎng)孔電流向量[I(2),I(3),…,I(k)]。算法流程為(如圖17)1.消去Hm+l-1主對角元下第二個非零元,也就是(20)中的hm+2,m,hm+3,m+1,…,hm+l+1,m+l-1。
定義變換矩陣如下Si
選擇變換矩陣序列Si,對應(yīng)的系數(shù)序列為αi(i=m,m+1,…,m+l-1)。變換矩陣Si消去的元為hi+2,i。
2.消去Hm+l-1主對角元下第一個非零元,也就是(20)中的hm+1,m,hm+2,m+1,…,hm+l,m+l-1。
定義變換矩陣Tj如下 選擇變換矩陣序列Tj,對應(yīng)的系數(shù)序列為βj(j=1,2,…,m+l-1)。變換矩陣Tj消去的元為hj+1,j。
3.經(jīng)過第1、2步運算后,Hm+l-1變成一個上三角矩陣,形式如下 分別將第1、2步中的變換矩陣序列Si和Tj左乘以右端殘余g=[Dm,Wl+1]Tr(i),得到一個新的向量gm+l-1=(γ1,γ2,…,γm+l,γm+l+1)T4.刪去Rm+l-1和gm+l-1的最后兩行,記為Rm+l-1和gm+l-1。求解方程Rm+l-1y=gm+l-1,結(jié)果ym+l-1即為最小二乘問題的解。
5.殘余‖[Dm,Wl+1]Tr(i)-Hm+l-1ym+l-1‖2則是gm+l-1的最后兩個元形成的向量的二范數(shù)‖(γm+l,γm+l+1)‖2。
6.計算網(wǎng)孔電流I(i)=I0(i)+[Dm-1,Ul]ym+l-1。
ESGMRES算法的復(fù)雜性分析我們將給出EGCR算法與ESGMRES算法的計算復(fù)雜度分析與比較。
EGCR算法及ESGMRES算法的每一次迭代計算包括三部分正交化過程形成新的基向量、矩陣—向量乘和求近似解。其中,求近似解的計算量很小,僅少數(shù)幾次向量內(nèi)積,與另外兩部分的計算量相比完全可以忽略,因此在下面的討論中將忽略這部分的計算量。正交化過程的計算量與當(dāng)前搜索空間的維度成正比。由于本文采用多極加速技術(shù),迭代中每次矩陣—向量乘計算量為O(nlog2n),也就是cnlog2n,其中c為常數(shù)。為了方便我們在后面的討論以及公式(22)和(23)中令c=1。
首先分析EGCR算法計算量與右端數(shù)的關(guān)系。假設(shè)矩陣階數(shù)為n,右端數(shù)為k。假設(shè)用EGCR算法后每個右端的平均迭代次數(shù)為p次,p是與右端數(shù)k相關(guān)的一個函數(shù),p=f(k)。一般來說,它隨k的增加而減少。注意,應(yīng)用EGCR和ESGMRES算法時,種子求解過程所需的迭代次數(shù)一般較非種子的多,但為討論方便,引入了平均迭代次數(shù)的概念,即將種子求解等同于一般非種子求解。這樣,用通常EGCR求解k個右端的計算量為(以n維的向量內(nèi)積為單位)TEGCR=kplog2n+(1+2+···+kp)]]>=kplog2n+kp(kp+1)2---(22)]]>其中,第一部分為矩陣—向量乘計算量,第二部分為搜索空間正交化計算量。
假設(shè)使用ESGMRES算法后每個右端的平均迭代次數(shù)減少為q次,q=g(k)。一般來說,它也隨k的增加而減少。下面給出ESGMRES的計算復(fù)雜度。
TESGMRES=kq log2n+k(1+2+…+2q)=kq(log2n+2q+1) (23)圖18給出了EGCR與ESGMRES兩種方法具有相同加速比時,即TEGCR=TESGMRES,平均迭代次數(shù)比值p/q隨右端數(shù)增加的變化曲線。由圖18可以看出,隨著右端數(shù)增加,EGCR的迭代次數(shù)需減少許多才具有與ESGMRES相同的加速效果。其原因是ESGMRES有效限制了擴(kuò)大Krylov子空間所需正交化計算量。
實施例本專利申請的電感電阻提取方法計算程序用C++語言編程實現(xiàn),名為FIE(FastInductance Extraction)。可以在SUN SPARC系列工作站上的UNIX操作系統(tǒng)及PC機(jī)的Linux操作系統(tǒng)上運行。下面結(jié)合一個具體實例說明基于多右端技術(shù)的三維互連寄生電感電阻的快速提取的執(zhí)行過程。圖19給出了算例的結(jié)構(gòu)示意圖,其中圖19(a)為該結(jié)構(gòu)頂視圖,圖19(b)為沿y軸方向的側(cè)視圖。導(dǎo)體的電導(dǎo)率為5.8e7,計算頻率為10G赫茲。
我們在Sun SPARC工作站上運行基于多右端技術(shù)的FIE電感電阻快速提取軟件,來計算上述算例中兩個端口對的自阻抗以及端口對之間的互阻抗。下面FIE的詳細(xì)過程。
1.首先從硬盤讀入該算例的輸入文件,確定出計算區(qū)域為8×4×7(單位為微米,下同)。從輸入文件中得到導(dǎo)體的位置坐標(biāo)和幾何形狀信息,導(dǎo)體的電導(dǎo)率為5.8e7、劃分?jǐn)?shù)均為3×3,劃分比值為1×1,要求計算的端口對共兩個,計算頻率為10GHz。本算例共有3塊導(dǎo)體。導(dǎo)體1的尺寸為8×2×2(長×寬×高,下同),導(dǎo)體2的尺寸為2×6×2,導(dǎo)體3的尺寸為5×2×2。其中導(dǎo)體1和導(dǎo)體2是相互連接的,構(gòu)成了端口對1;導(dǎo)體3與其他兩塊導(dǎo)體沒有連接關(guān)系,單獨構(gòu)成了端口對2。由于FIE能夠計算頂視為梯形的結(jié)構(gòu),因此我們用如圖20(a)所示的兩塊梯形去描述端口對1(包含導(dǎo)體1和導(dǎo)體2)。而FastHenry只能計算頂視為矩形的結(jié)構(gòu),它描述端口對1的示意如圖20(b)所示。比較上述兩個圖,我們可以看出我們的描述方法比FastHenry的描述方法具有更好的幾何描述精度。
2.離散化系統(tǒng),也就是按照輸入文件中指定的劃分?jǐn)?shù)3×3和劃分比值1×1,根據(jù)我們提出的考慮了趨膚效應(yīng)的自動劃分方法,將導(dǎo)體劃分成電流細(xì)絲。在本算例中,趨膚深度為0.66微米。首先確定寬度方向上電流細(xì)絲的尺寸,W/n=2/3=0.67>δ/2=0.33,因此鄰近導(dǎo)體表面的兩個電流細(xì)絲在寬度方向上的尺寸為0.33,中間一個電流細(xì)絲在寬度方向上的尺寸為1.34。然后確定長度方向上電流細(xì)絲的尺寸,T/m=2/3=0.67>δ/2=0.33,因此鄰近導(dǎo)體表面的兩個電流細(xì)絲在長度方向上的尺寸為0.33,中間一個電流細(xì)絲在長度方向上的尺寸為1.34。
3.計算多極加速算法所需的系數(shù)。首先對離散化的整個系統(tǒng)作包含了改進(jìn)策略的非均勻立方體劃分以區(qū)分粒子間的聚集程度和遠(yuǎn)近場關(guān)系。然后用公知技術(shù)求出多極加速算法中所需的系數(shù)。
4.形成細(xì)絲阻抗系數(shù)矩陣。將整個離散化系統(tǒng)視為一個復(fù)雜的電路網(wǎng)絡(luò)。根據(jù)所形成的電路網(wǎng)絡(luò)中網(wǎng)孔與支路的關(guān)系形成網(wǎng)孔矩陣M。在本算例中,M=1-1000000000001-1000000000001-10000000000001-1000000000001-1000000000001-10000000100010000000000001-1000000000001-1000000000001-1000000000001.]]>然后形成細(xì)絲阻抗系數(shù)矩陣MZMt。
5.選擇的預(yù)條件方法為Block預(yù)條件。根據(jù)公式(15),求出矩陣Zs,然后計算出矩陣MZsMt。我們以預(yù)條件矩陣P的第三行為例,說明如何形成Block預(yù)條件。從矩陣MZsMt中分別取出第二行中的第1、2、3列的元;第三行中的第2、3、4列的元;第四行中的第3、4、5列的元,構(gòu)成如下方程組
0+0i0.47+0.42i0.31+0.077i0.31+0.3i0.62+0.15i-0.31-0.077i-0.31-0.077i0.62+0.15i-0.31-0.77ip=010]]>求解上面的方程組,得到的解p=(1.18-0.72i,0.25-0.25i,-0.67+0.21i)即為預(yù)條件矩陣P的第三行。依此類推,可以得到預(yù)條件矩陣P的其他行。
6.求解網(wǎng)孔電流向量。
(6.1)在不同端口對上設(shè)置電壓。根據(jù)公式(18)中新的設(shè)置電壓的方法,在端口對1上設(shè)置1伏電壓,在端口對2上設(shè)置0伏電壓,得到右端V的第1列V(1)=[1,0,…,0]。在端口對1上設(shè)置1伏電壓,在端口對2上設(shè)置ξ伏電壓,從而得到右端V的第2列V(2)=[1,0.001,0,…0]。在本算法中參數(shù)ξ=0.001。
(6.2)用ESGMERS算法求解方程組,得到網(wǎng)孔電流向量I=[I(1),I(2)]。
(6.2.1)把第一個右端V(0)=[1,0,…,0]選為種子,用Arnoldi過程得到種子右端的搜索空間{Dm}=[d1,d2,…,d10],共10個基向量,分別為d1=(0.14-0.22i,0.16+0.18i,0+0i,0+0i,0+0i,0+0i,0+0i,0.02+0.022i,0+0i,0+0i,0+0i,0+0i,0+0i,0+0i,0+0i,0+0i,0+0i,0+0i,-0.57-0.69i,0.104-0.06i,-0.003-0.086i,-0.076+0.0031i,-0.025+0.14i,0.104-0.06i,-0.003-0.086i,0.043+0.029i)d2=(-0.05+0.49i,-0.23+0.01i,-0.64+0.29i,-0.04-0.09i,-0.07-0.02i,-0.01+0.06i,0.10+0.05i,-0.02-0.09i,-0.06-0.02i,0.03-0.03i,-0.230.11i,-0.01-0.03i,-0.04-0.00i,-0.01+0.02i,0.04+0.02i,-0.01-0.03i,-0.02-0.00i,0.01-0.01i,-0.15-0.10i,-0.10-0.05i,-0.06-0.05i,0.05+0.04i,0.12+0.06i,-0.10-0.05i,-0.06-0.05i,-0.01-0.02i)d3=(0.56+0.53i,0.21-0.16i,0.09-0.42i,0.11-0.02i,0.08-0.05i,-0.06-0.02i,-0.11+0.06i,0.11-0.01i,0.06-0.04i,0.01+0.02i,0.03-0.15i,0.04-0.00i,0.03-0.02i,-0.02-0.01i,-0.04+0.02i,0.04-0.00i,0.02-0.01i,0.0+0.01i,-0.13+0.02i,-0.09+0.04i,-0.05+0.01i,0.04-0.00i,0.10-0.04i,-0.09+0.04i,-0.05+0.01i,-0.01-0.01i)d4=(0.29+0.06i,-0.15+0.08i,-0.01-0.05i,-0.05+0.14i,-0.10+0.10i,0.07-0.07i,0.04-0.11i,-0.06+0.14i,-0.07+0.06i,-0.04+0.01i,-0.00-0.02i,-0.01+0.04i,-0.04+0.03i,0.02-0.02i,0.01-0.04i,-0.02+0.04i,-0.02+0.02i,-0.01+0.01i,0.08+0.22i,0.14-0.40i,0.18-0.16i,-0.20+0.20i,-0.11+0.36i,0.14-0.40i,0.18-0.16i,0.13-0.05i)d5=(0.04+0.00i,0.12+0.03i,-0.08-0.00i,-0.08+0.06i,0.20+0.02i,-0.10+0.04i,0.09-0.09i,-0.02+0.09i,0.10-0.00i,0.11-0.03i,-0.04-0.00i,-0.04+0.02i,0.07+0.02i,-0.02+0.02i,0.05-0.03i,-0.02+0.03i,0.02-0.00i,0.03-0.02i,0.06+0.06i,0.20-0.14i,-0.32+0.06i,0.41-0.15i,-0.29+0.23i,0.20-0.14i,-0.32+0.06i,-0.42+0.06i)
d6=(0.00+0.00i,0.16-0.39i,0.16+0.24i,0.01-0.06i,0.04-0.42i,-0.09-0.07i,0.11+0.08i,-0.02-0.31i,0.03-0.09i,-0.05+0.04i,0.04+0.11i,0.01+0.01i,0.06-0.16i,-0.03-0.08i,0.03-0.02i,0.02-0.09i,0.02+0.01i,-0.02+0.06i,0.09-0.12i,-0.02-0.19i,0.00-0.07i,0.22+0.33i,-0.20-0.08i,-0.02-0.19i,0.00-0.07i,0.21+0.10i)d7=(0.00+0.00i,-0.31+0.11i,0.11-0.13i,-0.09+0.04i,-0.16+0.04i,0.00-0.14i,-0.07+0.24i,-0.19+0.03i,0.02+0.01i,0.07-0.14i,0.05-0.06i,-0.03+0.01i,-0.10-0.01i,-0.00-0.04i,-0.03+0.08i,-0.08+0.01i,0.00-0.00i,0.04-0.05i,-0.06-0.03i,0.02-0.09i,-0.16+0.02i,-0.03+0.33i,0.16-0.26i,0.02-0.09i,-0.16+0.02i,-0.19+0.57i)d8=(0.00+0.00i,0.21+0.10i,-0.06-0.00i,0.13-0.01i,-0.23-0.01i,0.05-0.04i,0.06+0.05i,0.09-0.03i,-0.25+0.01i,0.11-0.07i,0.03+0.02i,0.09+0.06i,-0.02+0.08i,-0.10-0.07i,-0.05-0.06i,0.03+0.05i,0.01+0.06i,0.13+0.03i,-0.08+0.03i,-0.21-0.00i,0.35+0.01i,0.16+0.03i,-0.30-0.04i,-0.21-0.00i,0.35+0.01i,-0.48+0.13i)d9=(0.00+0.00i,0.14-0.08i,0.01+0.15i,-0.01-0.02i,-0.13+0.23i,-0.03+0.07i,-0.04+0.07i,-0.12+0.10i,-0.00-0.01i,0.17+0.10i,0.03-0.13i,0.11-0.27i,0.22-0.17i,-0.13+0.36i,-0.11+0.39i,0.12-0.12i,0.13-0.31i,0.09-0.25i,0.05-0.05i,-0.00-0.13i,0.04+0.13i,-0.03+0.08i,-0.02-0.08i,-0.00-0.13i,0.04+0.13i,-0.01-0.11i,)d10=(0.00+0.00i,0.03-0.05i,0.00+0.01i,0.14-0.04i,-0.10+0.20i,0.16+0.12i,0.03+0.09i,0.29-0.04i,-0.19+0.02i,-0.49+0.50i,0.09+0.08i,-0.00-0.09i,-0.33-0.08i,-0.00+0.00i,-0.07+0.13i,-0.14-0.13i,-0.06-0.01i,-0.02+0.08i,0.03-0.01i,0.06-0.04i,-0.10+0.04i,0.06-0.01i,-0.02+0.01i,0.06-0.04i,-0.10+0.04i,-0.09+0.11i)用廣義最小殘余(GMRES)算法求解種子右端,得到種子右端對應(yīng)的網(wǎng)孔電流向量I(1)=(1.73-7.54i,-0.48+1.08i,0.37-0.94i,0.30-0.79i,0.18-0.65i,0.10-0.53i,0.08-0.40i,0.00-0.27i,-0.01-0.18i,0.02-0.09i,0.38-0.96i,0.32-0.84i,0.21-0.72i,0.19-0.60i,0.21-0.47i,0.18-0.34i,0.11-0.23i,0.07-0.11i,-1.33+6.70i,-1.23+5.86i,-0.83+5.01i,-0.73+4.18i,-1.00+3.37i,-0.90+2.53i,-0.50+1.68i,-0.40+0.85i)(6.2.2)用已知的非種子右端V(2)=[1,0.001,0,…0]和(6.2.1)得到的種子右端搜索空間{Dm}=[d1,d2,…,d10],通過擴(kuò)展的Arnoldi過程來形成非種子右端的搜索空間。得到4個新的基向量{W4}=[w1,w2,w3,w4],分別為w1=(-0.00-0.00i,0.59-0.05i,-0.18-0.05i,-0.19+0.15i,-0.35-0.03i,0.08-0.13i,0.03-0.16i,-0.36+0.07i,-0.08+0.07i,0.07+0.04i,-0.10-0.02i,-0.12+0.03i,-0.24-0.09i,0.11-0.03i,0.09-0.05i,-0.15-0.01i,-0.11+0.00i,-0.04+0.02i,0.17-0.03i,0.01+0.04i,-0.08+0.01i,-0.07+0.01i,0.14-0.06i,0.01+0.04i,-0.08+0.01i,0.05+0.02i)w2=(-0.00+0.00i,0.21+0.09i,0.08+0.05i,0.09-0.36i,-0.08+0.17i,-0.27+0.36i,-0.15+0.42i,-0.09-0.08i,0.16-0.19i,0.15-0.18i,0.02+0.14i,-0.06-0.03i,-0.27+0.15i,-0.03-0.04i,0.00-0.01i,-0.18-0.01i,-0.03+0.08i,0.05+0.07i,0.10+0.06i,0.04-0.08i,0.02-0.03i,-0.07-0.04i,0.01+0.15i,0.04-0.08i,0.02-0.03i,0.06-0.06i)w3=(0.00+0.00i,0.03+0.00i,0.06+0.07i,0.04-0.19i,-0.21+0.03i,0.20-0.41i,-0.19+0.31i,-0.02-0.19i,-0.10+0.13i,-0.21-0.18i,-0.10-0.14i,0.05-0.04i,0.12+0.28i,0.22-0.04i,0.04+0.10i,0.23+0.08i,-0.12+0.02i,-0.24-0.05i,0.03-0.02i,0.03-0.06i,-0.09+0.09i,0.10-0.14i,-0.05+0.11i,0.03-0.06i,-0.09+0.09i,0.01-0.17i)w4=(0.00-0.00i,0.01+0.00i,-0.01-0.10i,0.04-0.14i,-0.05+0.29i,0.43+0.10i,-0.12+0.06i,0.04+0.04i,-0.18+0.04i,0.32-0.05i,0.01+0.23i,0.03+0.02i,0.25-0.34i,0.06-0.17i,-0.01-0.22i,0.13-0.24i,0.05+0.11i,0.02+0.25i,0.02-0.00i,0.03-0.02i,-0.08+0.03i,0.10+0.01i,-0.04-0.02i,0.03-0.02i,-0.08+0.03i,0.18+0.04i)(6.2.3)求解非種子右端得到網(wǎng)孔電流向量I(2)。首先求解最小二乘問題‖[Dm,Wl+1]Tr(i)-Hm+l-1ym+l-1‖2,解為y=(0.04+0.53i,-1.09+0.23i,1.69+0.57i,0.48-0.41i,-0.00-0.04i,0.00+0.00i,-0.00-0.00i,0.00+0.00i,-0.00-0.00i,1.24-0.44i,0.06+0.54i,-1.57-0.92i,-0.46+0.65i)根據(jù)最小二乘的解y得到第二個右端V(2)的解網(wǎng)孔電流向量I(2)I(2)=(1.28+0.09i,-0.40-0.10i,-0.26-0.12i,0.01+0.01i,-0.01+0.00i,-0.02-0.01i,0.02+0.01i,-0.02+0.00i,-0.01-0.00i,0.01+0.00i,-0.09-0.04i,0.01+0.00i,-0.01-0.00i,-0.01-0.00i,0.01+0.00i,0.01+0.00i,-0.01-0.00i,0.01+0.00i,1.21+0.28i,-0.07-0.02i,0.07+0.02i,0.09+0.01i,-0.09-0.01i,-0.07-0.02i,0.07+0.02i,-0.07-0.02i)(6.2.4)用設(shè)置的端口對電壓除以網(wǎng)孔電流向量計算出端口對上的阻抗以及它與其它端口對之間的互阻抗。阻抗矩陣如下Z=Z11Z12Z21Z22=0.0555+0.270i0.000328+0.0421i0.000328+0.0421i0.0277+0.132i]]>計算結(jié)果比較下面就算例1的情況,通過與沒有使用多右端技術(shù)的FIE電感電阻提取方法比較,說明多右端技術(shù)的優(yōu)點。下表顯示了兩種FIE電感電阻提取方法計算算例1的有關(guān)數(shù)據(jù)
從上表可以看出,在使用了多右端技術(shù)后,方程求解總迭代次數(shù)從19次降低至14次,整體電感電阻提取時間也從0.02秒降低至0.01秒。
著名三維寄生電感電阻提取軟件FastHenry是MIT的VLSI小組開發(fā)完成的。該組的主頁(http//rle-vlsi.mit.edu)提供了一些實際例子,我們從中選出一個要求解多右端問題的例子30pin用作數(shù)值比較。圖21為算例30pin的結(jié)構(gòu)示意圖。它是用于芯片封裝的管腿結(jié)構(gòu),計算區(qū)域的大小是11.575×22.5×8.325。該算例由30個管腿構(gòu)成。每個管腿由三個部分管腿部分、V型夾子部分和右拐彎部分構(gòu)成,共10塊導(dǎo)體,如圖22所示。其中導(dǎo)體1的尺寸為2×0.4×1.3,導(dǎo)體2的尺寸為2.8×0.4×0.4,導(dǎo)體3的尺寸為3.02×0.25×0.6,導(dǎo)體4的尺寸為3.02×0.25×0.6,導(dǎo)體5的尺寸為1.7×0.25×0.9,導(dǎo)體6的尺寸為1.7×0.25×0.9,導(dǎo)體7的尺寸為0.9×1.7×0.25,導(dǎo)體8的尺寸為7×0.25×0.7,導(dǎo)體9的尺寸為8.5×0.25×0.4,導(dǎo)體10的尺寸為5.575×0.25×0.4。導(dǎo)體的電導(dǎo)率為5.8e7,計算頻率為1GHz。要求計算30個管腿的自阻抗以及它們之間的互阻抗,其右端數(shù)為30,因此最后得到的計算結(jié)果為30×30階的一個矩陣。表2為使用了多右端技術(shù)的電感電阻快速提取方法與沒有使用多右端技術(shù)的提取方法的結(jié)果比較。從表中可以看出,變量數(shù)為1820時,迭代次數(shù)減少了64.2%,求解網(wǎng)孔電流時間的加速比為3.01;變量數(shù)為2730時,迭代次數(shù)減少了64.1%,求解網(wǎng)孔電流時間的加速比為2.88;變量數(shù)為3640時,迭代次數(shù)減少了63.7%,求解網(wǎng)孔電流時間的加速比為2.79。在使用了多右端技術(shù)后,無論在迭代次數(shù)還是求解方程時間上,三維互連寄生電感電阻提取器FIE均得到了很大的提高。
表2 沒有使用多右端技術(shù)與使用多右端技術(shù)的結(jié)果比較
權(quán)利要求
1.基于多右端技術(shù)的三維互連寄生電感電阻的快速提取方法,包含對集成電路版圖進(jìn)行數(shù)值模擬的體積元方法,其特征在于主要是求解多右端系統(tǒng)以得到多端口對系統(tǒng)的阻抗矩陣時,采用了可使迭代過程超速收斂的在不同端口對上設(shè)置電壓的方法以及一種擴(kuò)展的基于種子投影技術(shù)的多右端廣義極小化殘余(ESGMRES)方法,具體而言,本提取方法依次含有以下步驟(1)向計算機(jī)輸入以下信息 導(dǎo)體和襯底的位置坐標(biāo)和幾何形狀信息, 各導(dǎo)體的電導(dǎo)率、劃分?jǐn)?shù)和劃分比值, 版圖尺寸的單位, 要求計算的端口對, 計算頻率, 用戶選擇的預(yù)條件;(2)用考慮了趨膚效應(yīng)的電流細(xì)絲自動劃分方法將導(dǎo)體與襯底離散化,即使靠近導(dǎo)體表面的電流細(xì)絲尺寸小于趨膚深度δ,設(shè)W、T為導(dǎo)體矩形橫截面的寬度和高度,n、m為兩個方向劃分?jǐn)?shù),ΔW、ΔT分別為電流細(xì)絲在寬度和高度方向的尺寸,則當(dāng)W/n≤δ/2(T/m≤δ/2),鄰近導(dǎo)體表面n-1(m-1)個電流細(xì)絲的尺寸ΔW=δ/4(ΔT=δ/4),中間電流細(xì)絲尺寸為ΔW=W-(n-1)δ/4(ΔT=T-(m-1)δ/4),當(dāng)W/n>δ/2(T/m>δ/2),鄰近導(dǎo)體表面n-1(m-1)個電流細(xì)絲的尺寸ΔW=δ/2(ΔT=δ/2),中間電流細(xì)絲尺寸為ΔW=W-(n-1)δ/2(ΔT=T-(m-1)δ/2);(3)把公知的多極加速算法用于矩陣-向量乘中,計算多極加速算法所需的系數(shù)首先按下述策略對離散化的整個系統(tǒng)作非均勻立方體劃分以區(qū)分粒子間的聚集程度和遠(yuǎn)近場關(guān)系,在非均勻立方體劃分方法的基礎(chǔ)上,作如下改進(jìn)策略當(dāng)電流細(xì)絲的長度大于其所屬立方體邊長的二倍時,沿電流細(xì)絲長度方向?qū)㈦娏骷?xì)絲等切割成2份,電流細(xì)絲的位置由其中心確定;其次,用公知技術(shù)計算多極加速算法中所需的系數(shù);(4)用已知技術(shù)把每一個電流細(xì)絲視為一個小電阻與小電感的串聯(lián)電路,把整個離散化系統(tǒng)構(gòu)成一個復(fù)雜的電路網(wǎng)絡(luò),用網(wǎng)孔分析方法形成我們要求解的細(xì)絲阻抗矩陣系數(shù)(4.1)根據(jù)所形成的電路網(wǎng)絡(luò)中網(wǎng)孔與支路的關(guān)系形成網(wǎng)孔矩陣M,M為n×b的矩陣,其中n是電路中的獨立網(wǎng)孔數(shù),b是電流支路的數(shù)量;(4.2)形成細(xì)絲阻抗系數(shù)矩陣MZMt,其中Z為細(xì)絲之間的阻抗矩陣;(5)根據(jù)用戶的選擇,形成預(yù)條件以便把方程組化為一個與之等價的方程組,加速迭代收斂速度;(6)求解離散化系統(tǒng)方程組(6.1)在不同端口對上設(shè)置電壓在第一個端口對設(shè)置1伏電壓,在其余端口對設(shè)置0伏電壓,從而得到右端V的第1列V(0);再在第一個端口對設(shè)置1伏電壓,在第i個端口對設(shè)置ζ伏電壓,從而得到右端V的第i列V(i)(2≤i≤k),表示成矩陣形式如下 (6.2)用擴(kuò)展的基于種子的多右端GMRES方法得到解網(wǎng)孔電流向量I=[I(1),I(2),…,I(k)](6.2.1)輸入第一個右端V(1)和系數(shù)矩陣MZMt,將該矩陣記為A,把第一個右端選為種子,用附錄中的Arnoldi過程得到種子右端的搜索空間[d1,d2,…,dm],記為{Dm};(6.2.2)用已知的非種子右端[V(2),V(3),…,V(k)]和(6.2.2)得到的種子右端搜索空間{Dm},通過擴(kuò)展的Arnoldi過程來形成非種子右端的搜索空間;(6.2.3)求解非種子右端得到網(wǎng)孔電流向量[I(2),I(3),…,I(k)];(6.2.4)用設(shè)置的端口對電壓除以網(wǎng)孔電流向量計算出端口對上的阻抗以及它與其它端口對之間的互阻抗。
全文摘要
基于多右端技術(shù)的三維互連寄生電感電阻的快速提取方法,屬于集成電路計算機(jī)輔助設(shè)計技術(shù)領(lǐng)域,其特征在于主要是求解多右端系統(tǒng)以得到多端口對系統(tǒng)的阻抗矩陣時,采用了可使迭代過程超速收斂的在不同端口對上設(shè)置電壓的方法以及一種擴(kuò)展的基于種子投影技術(shù)的多右端廣義極小化殘余(ESGMRES)方法。與現(xiàn)有的方法相比,每次迭代中正交化的時間基本保持是一個常數(shù),迭代過程可以實現(xiàn)超速收斂,使得計算速度得到很大的提高。
文檔編號G06F17/50GK1540556SQ200410004528
公開日2004年10月27日 申請日期2004年2月20日 優(yōu)先權(quán)日2003年10月31日
發(fā)明者王澤毅, 楊柳 申請人:清華大學(xué)