一種fpga內(nèi)嵌獨立雙端口bram ip硬核的制作方法
【專利摘要】本發(fā)明屬于FPGA【技術(shù)領(lǐng)域】,具體為一種FPGA內(nèi)嵌獨立雙端口BRAM?IP硬核。本發(fā)明通過在模塊中引進電路模擬延遲控制模塊,動態(tài)模擬得到在不同的工藝角、工作溫度以及電壓下的電路信號的傳輸延遲并將其反饋給脈沖產(chǎn)生模塊進行控制,從而提高整體設(shè)計的異步時序控制可靠性。另外,通過使用高閾值管SRAM降低靜態(tài)漏電功耗,通過優(yōu)化SRAM的傳輸門尺寸,使位線上拉模塊的驅(qū)動能力降低而減少由于驅(qū)動源互拉引起的動態(tài)功耗,從而使得BRAMIP硬核的功耗顯著降低。本發(fā)明使得BlockRAM所支持的可編程存儲資源能有更加廣泛的應(yīng)用。
【專利說明】—種FPGA內(nèi)嵌獨立雙端口 BRAM IP硬核
[0001]【技術(shù)領(lǐng)域】
本發(fā)明屬于FPGA【技術(shù)領(lǐng)域】,具體涉及設(shè)計實現(xiàn)FPGA中具有高可靠性、低功耗的獨立雙端口 Block RAM的IP硬核。
【背景技術(shù)】
[0002]在被廣泛應(yīng)用于數(shù)字電路設(shè)計及驗證中的FPGA中引入Block RAM、DSP等IP硬核,可以解決FPGA中邏輯資源的性能和功能限制問題,使得FPGA得以更好的支持?jǐn)?shù)字電路設(shè)計中對于大規(guī)模,高速以及功耗優(yōu)化的要求。
[0003]Block RAM (以下簡稱BRAM)是一種在電子系統(tǒng)得到廣泛應(yīng)用的電路模塊,主要用于支持設(shè)計中的較大規(guī)模數(shù)據(jù)存儲及交換。雖然將BRAM嵌入到FPGA中的想法很早就已經(jīng)實現(xiàn),但是很少有研究是基于優(yōu)化該嵌入硬核本身的,這里的優(yōu)化包括速度、功耗等。對于傳統(tǒng)的BRAM,由于其較大規(guī)模的存儲容量和內(nèi)部控制信號傳輸?shù)漠惒綇?fù)雜性,使得對傳輸距離較長的控制信號和數(shù)據(jù)來說,無論從速度還是可靠性上都成為FPGA應(yīng)用的制約因素。同時,作為FPGA的內(nèi)部嵌入IP核,隨著FPGA規(guī)模的增加,嵌入的IP核數(shù)目也會隨之增加,從而優(yōu)化BRAM的功耗使之能夠滿足數(shù)字電路設(shè)計所提出的低功耗的要求也顯得尤為重要。
[0004]在設(shè)計中,提出了針對FPGA中的BRAM IP硬核模塊的優(yōu)化設(shè)計。這些優(yōu)化包括對數(shù)據(jù)存儲控制時序可靠性方面的以及對動態(tài)、靜態(tài)功耗方面的。使得BRAM不再是FPGA中功能和性能的瓶頸模塊,而得以廣泛支持高性能的電路應(yīng)用要求。在設(shè)計中通過采用反饋思想對數(shù)據(jù)和信號的傳輸進行電路層次上的動態(tài)模擬,從而保證能夠在不同的工藝角、溫度和工作電壓下得到最準(zhǔn)確的實時傳輸延遲來對各個模塊進行控制,保證了數(shù)據(jù)存儲控制時序的可靠性。對于功耗問題,通過深入研究電路之間的控制信號關(guān)系及驅(qū)動強度間的競爭關(guān)系,優(yōu)化了電路控制時序及電路上重要節(jié)點的驅(qū)動強度,使得驅(qū)動節(jié)點上的電源互拉問題得到大幅度緩解,進而使得電路的動態(tài)功耗大幅度降低。同時,在工藝上采用高閾值管的SRAM來降低整體SRAM陣列的靜態(tài)漏電流,從而減少整體電路的靜態(tài)功耗。基于以上的優(yōu)化設(shè)計方案使得整體設(shè)計達到高可靠性和低功耗的設(shè)計目標(biāo)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供一種優(yōu)化的FPGA中的內(nèi)嵌高性能BRAM IP硬核,以提高BRAM的可靠性及優(yōu)化功耗,使得FPGA中BRAM能夠支持更加廣泛的數(shù)字電路設(shè)計中的應(yīng)用。
[0006]本發(fā)明提供的FPGA中的內(nèi)嵌高性能BRAM IP硬核,其整體的電路架構(gòu)如圖1所示。該BRAM以SRAM陣列105為存儲中心,連接輸入數(shù)據(jù)通路、輸出數(shù)據(jù)通路以及地址譯碼控制通路,同時由脈沖發(fā)生模塊110產(chǎn)生控制整體電路的異步信號;其中:
所述輸入數(shù)據(jù)通路,包括輸入緩沖器102和輸入數(shù)據(jù)位寬調(diào)整模塊103,用于鎖存輸入數(shù)據(jù)及實現(xiàn)輸入數(shù)據(jù)位寬的可配置性;
所述輸出數(shù)據(jù)通路,包括靈敏放大器106、輸出位寬調(diào)整107及輸出鎖存器108,其中靈敏放大器106用于對從SRAM中讀取出的數(shù)據(jù)進行模擬轉(zhuǎn)數(shù)字的差分放大,以保證后續(xù)數(shù)據(jù)的正確傳輸,輸出位寬調(diào)整模塊107用于確保輸出數(shù)據(jù)位寬的可配置性,輸出鎖存器108用于對輸出數(shù)據(jù)進行鎖存;
所述地址譯碼控制通路,由一級行列譯碼模塊111和二級行列譯碼模塊104、112構(gòu)成,主要用于對輸入地址進行譯碼,控制相應(yīng)的字線和位線。這里采用兩級地址譯碼的原因是由于采用單級譯碼時輸入地址的扇出過大,需要同時控制的字線過多,而使得對驅(qū)動要求太高,故采用兩級驅(qū)動的形式進行譯碼操作;
所述脈沖發(fā)生模塊110主要是根據(jù)輸入時鐘、輸入使能及反饋信號產(chǎn)生控制整體電路工作的電路脈沖,使得電路的各個模塊在特定的異步時序下進行工作。
[0007]另外,在整體BRAM IP核中,為支持FIFO的可擴展功能,而在IP核配置為FIFO功能時加入FIFO控制器109與脈沖發(fā)生模塊110進行配合,共同控制FIFO的時序。
[0008]為了支持配置為ROM的功能,加入初始化SRAM陣列101進行BRAM的初始化,通過在輸入緩沖器102中加入可選輸入端口功能,保證在配置為ROM時輸入數(shù)據(jù)來自初始化SRAM陣列101 ;而配置為BRAM和FIFO時,數(shù)據(jù)來自正常的數(shù)據(jù)輸入端。
[0009]可靠性設(shè)計說明
作為數(shù)字電路設(shè)計,在BRAM的設(shè)計中最重要的一項內(nèi)容就是保證數(shù)據(jù)的正確傳輸(包括寫入和讀出)。而保證這一目標(biāo)的前提就是讀寫時序控制的正確性。但鑒于實際芯片制造或工作時工藝角、溫度和電壓等都不確定并且讀寫數(shù)據(jù)對應(yīng)的SRAM在陣列中的位置也不確定,故時序間關(guān)系并不存在固定延遲情況。若采用固定延遲鏈的方式必定需要考慮各種情況下的延遲并取最壞情況進行設(shè)計,這就會對整體芯片的工作頻率造成影響,所以本發(fā)明中引入動態(tài)電路模擬單元反饋的控制方法,通過模擬信號的傳輸路徑來動態(tài)的反饋信號延遲,從而得到準(zhǔn)確的時序控制信息以保證數(shù)據(jù)傳輸?shù)目煽啃浴?br>
[0010]如圖2所示,時鐘上升沿到來時,脈沖發(fā)生模塊201的WS信號和GTP信號由低電平變?yōu)楦唠娖?。WS信號傳過整個存儲單元207的高度的位線直到模擬字線驅(qū)動單元204和字線模擬單元205,來模擬字線產(chǎn)生的過程。隨后信號傳輸?shù)轿痪€模擬單元203來模擬數(shù)據(jù)在位線上傳輸?shù)倪^程,最后作為FB反饋信號傳輸?shù)矫}沖發(fā)生模塊201以產(chǎn)生控制輸出數(shù)據(jù)。當(dāng)FB信號的上升沿到來時,GTP的信號產(chǎn)生下降沿,傳遞給輸出數(shù)據(jù)路徑模塊208,表示可以開始采集數(shù)據(jù),保證了數(shù)據(jù)的正確采入。
[0011]在本發(fā)明設(shè)計下,電路就可以動態(tài)的模擬信號傳輸過程中的延遲,并且反饋給脈沖控制模塊使其產(chǎn)生控制脈沖,從而動態(tài)控制調(diào)整電路的工作頻率,使其既能夠在好的工作狀態(tài)下高速工作,又能在最壞情況下保證數(shù)據(jù)的正確性。
[0012]功耗優(yōu)化設(shè)計說明
高性能Block RAM的另一個重要方面就是功耗優(yōu)化,包括靜態(tài)功耗優(yōu)化和動態(tài)功耗優(yōu)化。靜態(tài)功耗主要是從減少靜態(tài)下的漏電流的設(shè)計角度來優(yōu)化的。目前主要的解決靜態(tài)漏電流的方式是在工藝上進行改進,故本設(shè)計也解決靜態(tài)漏電流的方式是采用高閾值的MOS管來進行八管SRAM的設(shè)計。
[0013]在動態(tài)功耗優(yōu)化方面,由于設(shè)計存儲器時,八管SRAM的四個NMOS傳輸管(圖3中T5?T8)連接的是位線。而對于陣列SRAM,一個字線會同時控制一行SRAM的打開或關(guān)閉,這樣就使得對于同一行SRAM在字線打開時只有部分的SRAM對應(yīng)傳輸管上的位線是有效數(shù)據(jù)(即BL =?BL_)。而對于不需要寫入的SRAM所對應(yīng)的位線在存儲器設(shè)計時要求將其全部置為高電平(即BL = BL_ = “1”),從而使得SRAM內(nèi)部存儲節(jié)點的數(shù)據(jù)不會發(fā)生變化。而這時存在的問題就是對于不需要寫入的SRAM,其內(nèi)部節(jié)點會通過打開的NMOS傳輸門與位線形成驅(qū)動能力的互拉(因為從SRAM內(nèi)部節(jié)點輸出的數(shù)據(jù)在位線上必定一個為高電平,一個為低電平,而外部位線上都為高電平),從而在寫入或讀出時消耗大量的動態(tài)功耗。
[0014]針對這一問題引起的動態(tài)功耗的解決方式,主要是通過優(yōu)化驅(qū)動能力從而緩解互拉問題。通過降低SRAM內(nèi)部節(jié)點輸出的驅(qū)動能力和位線上拉控制電路的驅(qū)動能力來減弱互拉情況,從而大幅度降低動態(tài)功耗。主要的優(yōu)化方式為:
(1)采用當(dāng)前工藝下允許的最小尺寸MOS管設(shè)計NMOS傳輸門(圖3中T5?T8),使得從SRAM內(nèi)部節(jié)點讀出的數(shù)據(jù)通過傳輸門后的驅(qū)動能力減弱,從而降低互拉電流;
(2)由于二級列譯碼模塊(圖4)就是具有上拉位線電路模塊302的電路結(jié)構(gòu)。讀出操作時,數(shù)據(jù)從8管SRAM單元402讀出到位線上。此時WS信號保證409模塊電路關(guān)閉,位線上的數(shù)據(jù)能夠不受影響的傳入敏感放大器404以及后續(xù)模塊數(shù)據(jù)存儲器405并最終讀出。完成讀出操作后,WS信號保證409電路打開,位線由BL=、L_被驅(qū)動為BL=BL_=” 1”,上述的驅(qū)動能力的互拉就會形成并產(chǎn)生較大的動態(tài)電流。故在本設(shè)計中通過加入降壓弱驅(qū)電路301/403使得上拉的驅(qū)動能力減弱,即降低位線上被置為高電平時的實際電壓,從而減少該部分電路與SRAM存儲節(jié)點間的電壓競爭而引起的功耗。如圖3所示,將二級列譯碼模塊(圖4)中的8管SRAM單元402和409模塊電路單獨在圖3中示意,使用降壓弱驅(qū)電路301將位線上被置為高電平時的實際電壓降低,從而保證在SRAM單元寫“O”的情況下,驅(qū)動互拉點A處的互拉電平差降低,從而大幅度的降低功耗。
[0015]技術(shù)效果
采用優(yōu)化設(shè)計以高性能的Block RAM設(shè)計方案后,電路對于各類工作環(huán)境的適應(yīng)性顯著提高,在TT/27°C/1.2V (通常情況)下能夠工作在600MHz,而在SS/125°C/1.08V (仿真得到的最壞情況)下也能夠工作在400MHz且保證數(shù)據(jù)的正確寫入和讀出。另外,采用優(yōu)化功耗設(shè)計的Block RAM電路的功耗僅為未優(yōu)化前的47.5%,達到了明顯的電路功耗優(yōu)化目的。
【專利附圖】
【附圖說明】
[0016]圖1為Block RAM設(shè)計結(jié)構(gòu)框圖。
[0017]圖2為數(shù)據(jù)讀取可靠性策略示意圖。
[0018]圖3為SRAM與位線相連電路示意圖。
[0019]圖4為二級列譯碼部分功耗優(yōu)化設(shè)計電路圖。
[0020]圖5為控制時序波形圖。
【具體實施方式】
[0021]如圖2所示,當(dāng)整體電路中脈沖發(fā)生器201產(chǎn)生WS的工作使能控制信號后,該脈沖信號Pulsel會首先穿過字線模擬驅(qū)動單元204,輸出的脈沖Pulse2較原先脈沖的延遲為信號通過模擬驅(qū)動單元204的延遲;接著Pulse2輸入到字線模擬單元205,輸出的Pulse3較Pulse2的延遲為信號通過最長的字線距離傳輸?shù)较鄳?yīng)SRAM所對應(yīng)的延遲;接著Pulse3輸入到位線模擬驅(qū)動單元202,輸出的Pulse4較Pulse3的延遲為信號通過最長的位線距離傳輸?shù)较鄳?yīng)SRAM所對應(yīng)的延遲;最后Pulse4脈沖反饋給脈沖發(fā)生模塊201,由所得到的總體的延遲來控制寫入/讀出操作,因為這時得到的延遲就是在當(dāng)前工作環(huán)境下要訪問到最遠處SRAM所需要的傳輸時間。由于這里的字線模擬驅(qū)動單元204,字線模擬單元205和位線模擬單元202與支持正常工作的字線驅(qū)動單元(112的子電路)、字線單元(112的子電路)和位線單元(104的子電路)所對應(yīng)的晶體管的尺寸相同,并且在版圖中的位置也緊鄰工作模塊,故可以非常好的反應(yīng)出在當(dāng)前狀態(tài)下工作模塊的傳輸延遲,所以以本專利提出的動態(tài)電路模擬方法就可以很好的模擬當(dāng)前工作狀態(tài)下的信號傳輸延遲情況并反饋給相關(guān)的控制模塊進行寫入/讀出脈沖信號的控制。
[0022]另外,在本發(fā)明中,還考慮到工藝角、溫度、內(nèi)部工作電壓等對信號傳輸?shù)挠绊?,為了保證流片后測試的功能正確性,引入了延遲調(diào)整模塊209。該模塊利用FPGA的可編程性,通過兩個編程點控制對FB信號的4種不同的延遲(分別是零延遲,F(xiàn)B延遲的30%增加(只使用延遲單元1),F(xiàn)B延遲的50%增加(延遲單元1+延遲單元2)和FB延遲的100%增加(延遲單元1+延遲單元2+延遲單元3)),使得可以保證在各種工作條件下數(shù)據(jù)傳輸時間的充足性。
[0023]對于動態(tài)功耗優(yōu)化,如圖3所示,左側(cè)的電路為八管SRAM存儲單元,兩組NMOS傳輸門(T5?T8)對應(yīng)的是A端口和B端口的寫入/讀出操作以支持雙端口 Block RAM,這里以A端口為例。使用最小尺寸MOS管設(shè)計的T5/T6,將從SRAM內(nèi)部存儲節(jié)點輸出到BLA和BLA_i的電平驅(qū)動能力減弱以減小在位線上的電平互拉。另外,在二級列譯碼模塊中,如圖4所示,在三管的PMOS上拉管結(jié)構(gòu)中,加入降壓弱驅(qū)電路403,使得電源電壓在該模塊上有
0.3V的電壓降,同時減少電源的上拉驅(qū)動能力,從而降低位線上的電平互拉作用,進而大幅度減少由于電平互拉而弓I起的動態(tài)功耗問題。
[0024]當(dāng)然,加入降壓弱驅(qū)電路403會帶來的問題就是使得寫入/讀出操作完成后,由于上拉操作的驅(qū)動能力減弱,使得出現(xiàn)有效數(shù)據(jù)的位線(存在BL =?BL_的位線)將從低電平被拉成高電平的時間變長。而根據(jù)圖5所示的控制時序波形圖來看,讀出的數(shù)據(jù)是在GTP下降沿到來后就順利讀出的。而對于工作在400MHz下的BRAM,WS在下降沿后到GTP的下一個下降沿有0.9ns的時間。這對于BRAM的數(shù)據(jù)寫入/讀出操作的實現(xiàn)上是足夠的(在優(yōu)化后的電路中為0.3ns左右),故認為該優(yōu)化電路帶來的影響不會影響到整體電路的工作時序。所以可以說明,該優(yōu)化方案能夠在保證整體BRAM正常工作的情況下,較為明顯的優(yōu)化整體電路的功耗。
【權(quán)利要求】
1.一種FPGA內(nèi)嵌獨立雙端口 BRAM IP硬核,其特征在于,以SRAM陣列(105)為存儲中心,分別連接輸入數(shù)據(jù)通路、輸出數(shù)據(jù)通路以及地址譯碼控制通路,同時由脈沖發(fā)生模塊(110)產(chǎn)生控制整體電路的異步信號;其中: 所述輸入數(shù)據(jù)通路包括輸入緩沖器(102)和輸入數(shù)據(jù)位寬調(diào)整模塊(103),用于鎖存輸入數(shù)據(jù)及實現(xiàn)輸入數(shù)據(jù)位寬的可配置性; 所述輸出數(shù)據(jù)通路包括靈敏放大器(106)、輸出位寬調(diào)整(107)及輸出鎖存器(108),其中,靈敏放大器(106)用于對從SRAM中讀取出的數(shù)據(jù)進行模擬轉(zhuǎn)數(shù)字的差分放大以保證后續(xù)數(shù)據(jù)的正確傳輸,輸出位寬調(diào)整模塊(107)用于確保輸出數(shù)據(jù)位寬的可配置性,輸出鎖存器(108)用于對輸出數(shù)據(jù)進行鎖存; 所述地址譯碼控制通路由一級行列譯碼模塊(111)和二級行列譯碼模塊(104、112)構(gòu)成,用于對輸入地址進行譯碼,控制相應(yīng)的字線和位線; 所述脈沖發(fā)生模塊(110)是根據(jù)輸入時鐘、輸入使能及反饋信號產(chǎn)生控制整體電路工作的電路脈沖,使得電路的各個模塊在特定的異步時序下進行工作。
2.根據(jù)權(quán)利要求1所述的FPGA內(nèi)嵌獨立雙端口BRAM IP硬核,其特征在于,還設(shè)有FIFO控制器(109),在IP核配置為FIFO功能時,F(xiàn)IFO控制器(109)與脈沖發(fā)生模塊(110)進行配合,共同控制FIFO的時序。
3.根據(jù)權(quán)利要求1或2所述的FPGA內(nèi)嵌獨立雙端口BRAM IP硬核,其特征在于,還設(shè)有初始化SRAM陣列(101 ),用于對BRAM的初始化,通過在輸入緩沖器(102)中加入可選輸入端口功能,保證在配置為ROM時輸入數(shù)據(jù)來自初始化SRAM陣列(101);而配置為BRAM和FIFO時,數(shù)據(jù)來自正常的數(shù)據(jù)輸入端。
4.根據(jù)權(quán)利要求3所述的FPGA內(nèi)嵌獨立雙端口BRAM IP硬核,其特征在于,引入動態(tài)電路模擬單元反饋的控制模式,通過模擬信號的傳輸路徑來動態(tài)的反饋信號延遲,從而得到準(zhǔn)確的時序控制信息以保證數(shù)據(jù)傳輸?shù)目煽啃裕? 時鐘上升沿到來時,脈沖發(fā)生模塊(201)的WS信號和GTP信號由低電平變?yōu)楦唠娖?;WS信號傳過整個存儲單元(207)的高度的位線直到模擬字線驅(qū)動單元(204)和字線模擬單元(205),來模擬字線產(chǎn)生的過程;隨后信號傳輸?shù)轿痪€模擬單元(203)來模擬數(shù)據(jù)在位線上傳輸?shù)倪^程,最后作為FB反饋信號傳輸?shù)矫}沖發(fā)生模塊(201)以產(chǎn)生控制輸出數(shù)據(jù);當(dāng)FB信號的上升沿到來時,GTP的信號產(chǎn)生下降沿,傳遞給輸出數(shù)據(jù)路徑模塊(208),表示可以開始采集數(shù)據(jù),保證數(shù)據(jù)的正確采入。
5.根據(jù)權(quán)利要求4所述的FPGA內(nèi)嵌獨立雙端口BRAM IP硬核,其特征在于,還進行功耗優(yōu)化,包括靜態(tài)功耗優(yōu)化和動態(tài)功耗優(yōu)化;靜態(tài)功耗優(yōu)化主要是減少靜態(tài)下的漏電流;動態(tài)功耗優(yōu)化,主要是通過優(yōu)化驅(qū)動能力從而緩解互拉問題,即通過降低SRAM內(nèi)部節(jié)點輸出的驅(qū)動能力和位線上拉控制電路的驅(qū)動能力來減弱互拉情況,從而大幅度降低動態(tài)功耗。
6.根據(jù)權(quán)利要求5所述的FPGA內(nèi)嵌獨立雙端口BRAM IP硬核,其特征在于,所述動態(tài)功耗優(yōu)化的方式為: (1)采用當(dāng)前工藝下允許的最小尺寸MOS管設(shè)計NMOS傳輸門,使得從SRAM內(nèi)部節(jié)點讀出的數(shù)據(jù)通過傳輸門后的驅(qū)動能力減弱,從而降低互拉電流; (2)由于二級列譯碼模塊就是具有上拉位線電路模塊(302)的電路結(jié)構(gòu);讀出操作時,數(shù)據(jù)從8管SRAM單元(402)讀出到位線上,此時WS信號保證電路模塊(409)關(guān)閉,位線上的數(shù)據(jù)能夠不受影響的傳入敏感放大器(404)以及后續(xù)模塊數(shù)據(jù)存儲器(405)并最終讀出;完成讀出操作后,WS信號保證電路模塊(409)打開,位線由BL=~BL_被驅(qū)動為BL=BL_=”1”,上述的驅(qū)動能力的互拉就會形成并產(chǎn)生較大的動態(tài)電流;通過加入降壓弱驅(qū)電路(301/403)使得上拉的驅(qū)動能力減弱,即降低位線上被置為高電平時的實際電壓,從而減少該部分電路與SRAM存儲節(jié)點間的電壓競爭而引起的功耗。
【文檔編號】G11C11/413GK103500584SQ201310459013
【公開日】2014年1月8日 申請日期:2013年10月7日 優(yōu)先權(quán)日:2013年10月7日
【發(fā)明者】來金梅, 張昕睿, 王鍵 申請人:復(fù)旦大學(xué)