改進(jìn)的可置換地址的處理器及方法

文檔序號(hào)：6454680閱讀：226來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：改進(jìn)的可置換地址的處理器及方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種在存儲(chǔ)裝置和運(yùn)算單元之間實(shí)現(xiàn)的可置換地址模式處理器及方法。
背景技術(shù)：
早先的計(jì)算機(jī)或處理器僅僅具有一個(gè)計(jì)算單元，因此，例如在一個(gè)像素具有八位(字節(jié))時(shí)每次進(jìn)行一個(gè)像素的圖像處理。隨著圖像尺寸的不斷增長，出現(xiàn)了對(duì)于高性能高密度流水線的向量處理處理器的需要。向量處理器是可以在一個(gè)指令中在整個(gè)向量上操作的處理
器。單指令多數(shù)據(jù)(SIMD)是面向向量的處理的另一形式，面向向量的處理可以在像素級(jí)應(yīng)用并行。該方法適合于不依賴于前一操作結(jié) 果的圖像操作。由于SIMD處理器可以在不同的數(shù)據(jù)組上并行解決類似的問題，因此它可以被表征為比單個(gè)計(jì)算單元處理器快n倍，這里n 是SIMD中的計(jì)算單元的數(shù)目。對(duì)于SIMD操作，存儲(chǔ)器讀取必須每個(gè) 周期將數(shù)據(jù)給到每個(gè)計(jì)算單元或利用n速度的優(yōu)點(diǎn)。典型地，例如，在32位(四個(gè)字節(jié))機(jī)器中，在來自存儲(chǔ)器的兩條總線上載入數(shù)據(jù)到兩個(gè)32位(四個(gè)字節(jié))寄存器中的行中，該字節(jié)處于四個(gè)相鄰的列中，每個(gè)字節(jié)具有與其相關(guān)的計(jì)算單元。然后，在一個(gè)周期中，單個(gè)指令
可以指示所有計(jì)算單元以其自然(native)模式對(duì)寄存器字節(jié)中的數(shù)據(jù) 逐字節(jié)地執(zhí)行相同的操作，并在存儲(chǔ)器中存儲(chǔ)該32位結(jié)果。在2D圖像處理應(yīng)用中，例如，其對(duì)于垂直邊緣過濾具有很好的效果。但是對(duì)于在列中存儲(chǔ)數(shù)據(jù)的水平邊緣過濾來說，在可以開始操作之前，必須加載所有的寄存器，以及在完成之后，不得不每次一個(gè)字節(jié)地存儲(chǔ)結(jié)果。這是費(fèi)時(shí)且低效的，以及隨著計(jì)算單元數(shù)碼的增加而變得更加嚴(yán)重。在適應(yīng)"小字節(jié)序，，(little endian )和"大字節(jié)序，，(big endian )數(shù)據(jù)類型時(shí)，SIMD或向量處理機(jī)器也遇到問題。"小字節(jié)序"和"大字節(jié)序，，涉及的是多字節(jié)類型中哪些字節(jié)是最高有效位，并描述在處理器存儲(chǔ)器中存儲(chǔ)字節(jié)序列的順序。在小字節(jié)序的系統(tǒng)中，在最低的存儲(chǔ)器地址(第一)，存儲(chǔ)該序列中的最低有效字節(jié)。"大字節(jié)序"相反它在最低存儲(chǔ)器地址存儲(chǔ)中存儲(chǔ)該序列中的最有效字節(jié)。當(dāng)前，系統(tǒng) 對(duì)從用戶界面到操作系統(tǒng)到加密到低層信號(hào)處理的所有層級(jí)提供服務(wù)。這些導(dǎo)致"混合字節(jié)序，，應(yīng)用，因?yàn)橥ǔ］^高層級(jí)的用戶界面和操作系統(tǒng)使用"小字節(jié)序"，而信號(hào)處理和加密使用"大字節(jié)序"。因此在處理數(shù)據(jù)之前，程序員必須提供指令以從一種變換為另一種，或配置該處理，以利用它給出的數(shù)據(jù)形式來工作。
SIMD操作中遇到的另一問題是，該數(shù)據(jù)為了算法中的下一個(gè)步驟而實(shí)際上已被擴(kuò)展或調(diào)換或置換。在該數(shù)據(jù)處于由算法中的下一步驟調(diào)用的格式之前，這需要單獨(dú)的步驟，涉及到流水線停滯。

發(fā)明內(nèi)容
因此，本發(fā)明的目的是提供一種具有可置換地址模式的改進(jìn)的處理器和方法。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，其提高諸如SIMD的面向向量的處理器的效率。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，在運(yùn)算單元之外在地址模式中實(shí)現(xiàn)置換，由此避免管線停滯。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，其可以統(tǒng)一數(shù)據(jù)表現(xiàn)(presentation)，由此統(tǒng)一問題的
解決方案，減小編程工作和投放市場的時(shí)間。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，可以統(tǒng)一數(shù)據(jù)表現(xiàn)，由此統(tǒng)一問題的解決方案，利用更多算術(shù)單元和更快的存儲(chǔ)結(jié)果。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，可以在負(fù)載上置換該數(shù)據(jù)，以其自然的形式有效地利用算術(shù)單元，并隨后在存儲(chǔ)時(shí)置換回其初始形式，使得負(fù)載、解決方案和存儲(chǔ)操作更快和更有效。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，容易適合于混合字節(jié)序模式。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，能夠快速、容易和有效地重新排序計(jì)算操作之間的數(shù)據(jù)。
本發(fā)明的再一目的是提供具有可置換地址模式的這種改進(jìn)的處理器和方法，為了快速、容易的處理，能夠使任意形式的數(shù)據(jù)重新排
序?yàn)闄C(jī)器的自然域(domain)形式，然后如果希望，重新排序回其初始形式。
本發(fā)明源于如下認(rèn)識(shí)，通過從存儲(chǔ)裝置加載數(shù)據(jù)字，并在它到達(dá) 運(yùn)算單元之前將它重新排序?yàn)榕c面向向量的運(yùn)算單元的自然順序相容的格式，以及對(duì)該運(yùn)算單元中的數(shù)據(jù)字進(jìn)行向量處理，處理器和方法可以處理大量不同的數(shù)據(jù)格式。參見美國專利號(hào)5，961，628, Nguyen 等人的名稱為LOAD AND STORE UNIT FOR A VECTOR PROCESSOR,和 VECTOR VS. SUPERSCALAR AND VLIW ARCHITECTURES FOR EMBEDDED MULTIMEDLA BENCHMARKS,作者Christoforos Kozyrakis和David Patterson, 在the Proceedings of the 35th International Symposiumon Microarchitecture, Istanbul, Turkey, November 2002， 11 pages, 在jt匕通過這些參考文獻(xiàn)將其全部引入。
但是，在其他實(shí)施例中，該主題發(fā)明不必實(shí)現(xiàn)所有這些目的，以及由此權(quán)利要求不應(yīng)該限于能實(shí)現(xiàn)這些目的的結(jié)構(gòu)或方法。
本發(fā)明的特點(diǎn)在于具有可置換地址;廣式的處理器，包括具有寄存器堆的運(yùn)算單元?；ミB寄存器堆與存儲(chǔ)裝置的至少一個(gè)加栽總線和至少一個(gè)存儲(chǔ)總線。以及至少一個(gè)總線中的置換電路，用于重新排序在該寄存器堆和存儲(chǔ)裝置之間傳送的字的數(shù)據(jù)元。
在優(yōu)選實(shí)施例中，該加載和存儲(chǔ)總線可以包括置換電路。可以有兩個(gè)加載總線，其每一個(gè)可以包括置換電路。該置換電路可以包括用于重新排序在該寄存器堆和存儲(chǔ)裝置之間傳送的字的數(shù)據(jù)元和/或調(diào) 換電路，用于重新排序在該寄存器堆和存儲(chǔ)裝置之間傳送的字的數(shù)據(jù) 元。該寄存器堆可以包括至少一個(gè)寄存器。該映射電路可以包括至少一個(gè)映射寄存器。該映射寄存器可以包括用于每個(gè)數(shù)據(jù)元的字段。該映射寄存器可以從運(yùn)算單元加載。該映射寄存器可以用大字節(jié)序、小
字節(jié)序映射缺省地加載。該數(shù)據(jù)元可以是字節(jié)。
本發(fā)明的特點(diǎn)使處理器適應(yīng)于處理大量不同的數(shù)據(jù)格式的方法，包括從存儲(chǔ)裝置加栽具有字的數(shù)據(jù)寄存器，在它到達(dá)運(yùn)算單元數(shù)據(jù)寄存器堆之前將它重新排序?yàn)榕c面向向量的運(yùn)算單元的自然順序相容的第二格式，以及向量處理所述運(yùn)算單元中的數(shù)據(jù)寄存器。
在優(yōu)選實(shí)施例中，該向量處理的結(jié)果可以被存儲(chǔ)在第二數(shù)據(jù)寄存器裝置中。該存儲(chǔ)結(jié)果可以被重新排序?yàn)榈谝桓袷健Ｔ摰诙鎯?chǔ)裝置和第一存儲(chǔ)裝置可以被包括在相同的存儲(chǔ)器中。

從優(yōu)選實(shí)施例的以下描述和附圖，所屬領(lǐng)域的技術(shù)人員將想到其
他目的、特點(diǎn)和優(yōu)點(diǎn)，其中
圖l是根據(jù)本發(fā)明具有可置換地址模式的處理器的示意性框圖2是圖1的處理器的更詳細(xì)的視圖3是根據(jù)本發(fā)明的大字節(jié)序載入映射的示意圖4是根據(jù)本發(fā)明的小字節(jié)序載入映射的示意圖5是根據(jù)本發(fā)明的另一載入映射的示意圖6是根據(jù)本發(fā)明的存儲(chǔ)映射的示意圖7是根據(jù)本發(fā)明的調(diào)換的示意圖8A-C圖示了本發(fā)明對(duì)于圖像邊緣過濾的應(yīng)用；
圖9是根據(jù)本發(fā)明的映射電路的更詳細(xì)示意圖10是根據(jù)本發(fā)明的調(diào)換電路的更詳細(xì)示意圖；以及
圖ll是根據(jù)本發(fā)明的方法的流程圖。
具體實(shí)施例方式
除了下面公開的優(yōu)選實(shí)施例或?qū)嵤├酝?，本發(fā)明可以是其他實(shí) 施例和能夠用多種方式實(shí)施或進(jìn)行。因此，應(yīng)當(dāng)理解，本發(fā)明不被在以下描述或圖中所示的結(jié)構(gòu)細(xì)節(jié)和部件布置所限制。如果在此僅僅描述了一個(gè)實(shí)施例，那么權(quán)利要求不僅限于那個(gè)實(shí)施例。此外，權(quán)利要求不應(yīng)被限制性地解讀，除非有清楚的和令人信服的證據(jù)表明某種排除、限制或放棄。
圖1示出了根據(jù)本發(fā)明的處理器10,具有外部存儲(chǔ)裝置、存儲(chǔ)器 12。處理器10典型地包括以普通方式工作的運(yùn)算單元14、數(shù)字?jǐn)?shù)據(jù)地址發(fā)生器16和序列發(fā)生器18。數(shù)據(jù)地址發(fā)生器16是相對(duì)于存儲(chǔ)器12的所有加載和存儲(chǔ)的控制器，序列發(fā)生器18控制指'令的順序。具有存儲(chǔ) 總線20和一個(gè)或多個(gè)加載總線22和24，其將各種運(yùn)算單元14和數(shù)據(jù)地址發(fā)生器16與外部儲(chǔ)存器12互連。根據(jù)本發(fā)明，在一個(gè)或多個(gè)總線20、 22和24中，布置了置換電路26a、 b、 c。
圖2中，運(yùn)算單元14典型地包括數(shù)據(jù)寄存器堆30和一個(gè)或多個(gè)計(jì) 算單元32，該計(jì)算單元32可以包含，例如，乘法累加器電路36、運(yùn)算邏輯單元38和移位器40,結(jié)果總線21為所有上述部件提供服務(wù)。與現(xiàn) 有技術(shù)相同，數(shù)據(jù)地址發(fā)生器16包括指針寄存器42和數(shù)據(jù)地址發(fā)生器 (DAG)寄存器44。序列發(fā)生器18包括指令譯碼電路48和序列發(fā)生器電路50。由置換電路26a例示的每個(gè)置換電路26a、 26b和26c可以包括映射電路54a、 b和調(diào)換電路56a、 b中的一個(gè)或兩個(gè)。如相對(duì)于映射電路54a說明的每個(gè)相關(guān)映射電路與一組寄存器57a相關(guān)聯(lián)，寄存器57a 包括缺省寄存器58a和附加映射寄存器，如映射A寄存器60a和映射B 寄存器62a。每個(gè)映射寄存器包含用于大量不同的映射變換的指令。例如，缺省寄存器58a和58b可以被設(shè)為執(zhí)行大字節(jié)序變換。大字節(jié)序變換是這樣的變換，其中序列中的最低存儲(chǔ)地址字節(jié)被載入寄存器的最高有效字節(jié)段中以及最高地址位置中的信息被載入該寄存器的最低有效字節(jié)位置。例如，如圖3所示，在存儲(chǔ)器12中存儲(chǔ)有兩個(gè)數(shù)據(jù)字70和72,在字節(jié)的情況下，每個(gè)數(shù)據(jù)字具有被標(biāo)識(shí)為O， 1， 2和3的四個(gè)字節(jié)數(shù)據(jù) 元。在字70中，字節(jié)O, 1， 2和3分別包含值5， 44， 42和10，而在字 72中，數(shù)據(jù)序列或字節(jié)O, 1， 2, 3包含值66， 67, 68和69。在數(shù)據(jù)地址發(fā)生器44中有兩個(gè)指針寄存器，指針寄存器74和76。指針寄存器74 對(duì)字70進(jìn)行尋址，而指針寄存器76對(duì)字72進(jìn)行尋址。根據(jù)缺省寄存器 58a中的指令，根據(jù)矩陣80，字70將被映射到數(shù)據(jù)寄存器78，或字70 中的字節(jié)0將被映射至數(shù)據(jù)寄存器78的段0，字70的字節(jié)1將被映射到數(shù)據(jù)寄存器78的段1，字70的字節(jié)2將被映射至數(shù)據(jù)寄存器78的段2和字70的字節(jié)3將被映射至數(shù)據(jù)寄存器78的段3。以此方式，最低地址 ——具有值5的字節(jié)0，結(jié)束在數(shù)據(jù)寄存器78的最有效字節(jié)段和最高存儲(chǔ)地址中，值10的第三字節(jié)結(jié)束在最低有效字節(jié)段——數(shù)據(jù)寄存器78 的段3中?？梢钥闯?，利用相同的大字節(jié)序變換，矩陣82中應(yīng)用的映射寄存器58b中的指令的應(yīng)用將具有值66， 67， 68和69的字72的字節(jié)0， 1， 2和3分別移動(dòng)到數(shù)據(jù)寄存器84中。亦即，具有值66的字72的零字節(jié)處于寄存器84的最高有效字節(jié)段以及，字72的最高地址字節(jié)3的值 69處于數(shù)據(jù)寄存器84的最低有效字節(jié)段。
在圖4中，利用缺省寄存器58a和58b中的默認(rèn)指令，以類似方式完成小字節(jié)序變換。在該小字節(jié)序變換中，在矩陣80和矩陣82的最終布置中，最低存儲(chǔ)地址字節(jié)結(jié)束在每個(gè)數(shù)據(jù)寄存器78和84的最低有效字節(jié)段。
圖3和4分別圖示的大字節(jié)序和小字節(jié)序映射是簡單的，但是本發(fā) 明的映射不局限于那些，用本發(fā)明可以完成任意方式的擴(kuò)展或混合。例如，如圖5所示，映射寄存器60a可以對(duì)邏輯矩陣80a進(jìn)行編程，從而在最高有效字節(jié)段中放置字70的字節(jié)3，在接下來的兩個(gè)段中放置字節(jié)l，在最低有效字節(jié)段中放置字節(jié)O,并忽略字節(jié)2。類似地，在字72中，映射寄存器60b可以使得字72的字節(jié)l被放入數(shù)據(jù)寄存器84的最高有效字節(jié)段中，字節(jié)O被放入下一段中，字節(jié)3被放入下一個(gè)段中以及字節(jié)2被放入最低有效字節(jié)段中。置換電路可被用于加栽總線22和24中的一個(gè)或二者，以及也可以被用于存儲(chǔ)總線。
在圖6中，數(shù)據(jù)寄存器92可以將字90傳遞到存儲(chǔ)器12，映射A或映射B寄存器58c或68c將提供映射矩陣94，該映射矩陣94僅僅簡單地忽略數(shù)據(jù)寄存器92中的最高有效字節(jié)段和下一段的內(nèi)容，并將數(shù)據(jù)寄存器92的最低有效字節(jié)段中的值放置在字90的字節(jié)位置0和3中，同時(shí) 將寄存器92的段2的值放置在字90的字節(jié)位置1和2中。盡管從寄存器和部分存儲(chǔ)器或存儲(chǔ)裝置發(fā)生映射，但是調(diào)換電路56a， 56b和56c進(jìn) 行的調(diào)換實(shí)際上可以從存儲(chǔ)裝置或存儲(chǔ)器到多個(gè)寄存器或從多個(gè)寄存器到存儲(chǔ)裝置。例如，在圖7中，指針寄存器74和指針寄存器76對(duì) 存儲(chǔ)器12中的位置100和102進(jìn)行尋址。存儲(chǔ)器100中的字是四個(gè)字節(jié) 例如A， B, C和D的32位字，同樣，存儲(chǔ)器102中的字是具有四個(gè)字節(jié) E、 F、 G和H的32位字。被標(biāo)識(shí)為"高調(diào)換"101的調(diào)換獲取存儲(chǔ)器字節(jié) A、 B、 C、 D，并將它們載入四個(gè)數(shù)據(jù)寄存器106, 108, 110和112的第一列104中。指針寄存器76從存儲(chǔ)位置102獲取四個(gè)字節(jié)E、 F、 G和 H，并將它們放置在相同的四個(gè)數(shù)據(jù)寄存器106, 108， 110和112的下一列114中。DAG指針寄存器74和76接下來可以指向存儲(chǔ)器12中的存儲(chǔ)位置116和118,以在列120和122中分別放置它們的字節(jié)I、 J、 K、 L 以及M、 N、 O、 P。在"低調(diào)換，，模式103中，字節(jié)A、 B、 C、 D將被放入列120中，字節(jié)E、 F、 G、 H將補(bǔ)j欠入列122中，字節(jié)I、 J、 K、 L將凈皮方丈入列104中，和字節(jié)N、 M、 O、 P將被放入列114中。
關(guān)于圖8A、 8B和8C，描述了表現(xiàn)出其顯著通用性和益處的本發(fā) 明的一個(gè)應(yīng)用。在圖8A中，示出了由十六個(gè)子塊132組成的圖像的宏塊130。每個(gè)4x4子塊包括十六個(gè)像素。例如，包含所示的像素值p0-p3 的子塊32a,包含四朽"像素134， 136， 138和140。為了去除邊緣142的邊緣效應(yīng)，執(zhí)行垂直與水平143過濾。由于每一行包含所有相同的數(shù) 據(jù)，由此可以在用于高速處理的面向向量的機(jī)器中進(jìn)行單指令多數(shù)據(jù) 操作，因此垂直過濾足夠容易。因此，分別通過四個(gè)不同的算術(shù)單元 152， 154， 156和158，可以在每一列144， 146， 148， 150上同時(shí)進(jìn)行過濾算法。而當(dāng)并行處理結(jié)束時(shí)，例如，在行140中，將出現(xiàn)全部結(jié)果，并且將在一個(gè)周期中被遞交到下一操作寄存器或存儲(chǔ)寄存器。通
過機(jī)器以用于處理的自然順序排列該數(shù)據(jù)的圖8A中出現(xiàn)的另一個(gè)優(yōu) 點(diǎn)是，例如，一旦當(dāng)兩個(gè)DAG指針寄存器74和76加載行134和136時(shí)，算術(shù)單元152-158就可以工作。
相反，對(duì)于水平過濾，在圖8B中，在算術(shù)單元168， 170， 172, 174可以開始操作之前，所有四行160， 162, 164， 166必須被加載。此外，當(dāng)過濾操作結(jié)束時(shí)，與圖8A中容易地讀出行140中的像素po的情況相反，由于列176中的輸出p0處于四個(gè)不同的寄存器，它們必須被每次放入一個(gè)字節(jié)。為了做到這點(diǎn)，必須有附加的編程來處理該數(shù) 據(jù)的非自然布局。通過使用置換電路，例如，調(diào)換電路26a或26b之一，如圖8C所示，可以通過四個(gè)算術(shù)單元數(shù)據(jù)寄存器RO、 Rl、 R2和R3的加載來調(diào)換行160， 162， 164， 166中的像素?cái)?shù)據(jù)，由此使得它目前與圖8A的處理機(jī)器的自然域?qū)?zhǔn)?，F(xiàn)在，加載進(jìn)行得更加迅速，運(yùn)算單元可以更快的開始工作，以及結(jié)果可以每次輸出整個(gè)字四個(gè)字節(jié)。
盡管在到目前為止的例子中，通過字節(jié)操作的方面解釋本發(fā)明，但是這不是本發(fā)明的必需限制。其他更大的或更小的數(shù)據(jù)元可以被使用，以及典型地可以使用多個(gè)字節(jié)，在一種應(yīng)用中，例如，兩個(gè)字節(jié) 或十六位可以是數(shù)據(jù)元。因此，利用該可置換地址模式，如SIMD的面向向量的處理的效率被大大提高。由于置換在運(yùn)算單元之外在地址模式中發(fā)生，因此該置換是特別有效的。它們由此避免了流水線停滯并且沒有干擾算術(shù)單元的操作。在加載或存儲(chǔ)操作的地址模式過程中，在DAG16和序列發(fā)生器18的控制下在運(yùn)行中完成該轉(zhuǎn)換或置換。本發(fā)明允許統(tǒng)一的數(shù)據(jù)表現(xiàn)，因此統(tǒng)一了問題解決方法。這不僅減輕了編程工作，而且縮短了新設(shè)備投放市場的時(shí)間。如剛剛說明的，處理器的自然域中的這些統(tǒng)一的數(shù)據(jù)表現(xiàn)也使算術(shù)單元的使用和存儲(chǔ) 變得更快。其容易適應(yīng)于大字節(jié)序、小字節(jié)序或混合字節(jié)序的操作。能夠?qū)⑷我庑问降臄?shù)據(jù)重新排序?yàn)橛糜诳焖偬幚淼臋C(jī)器的自然域形式，如果希望，那么其可以隨后被重新排序回到其初始形式，或用于后續(xù)運(yùn)算操作或在存儲(chǔ)器中永久或臨時(shí)存儲(chǔ)使用的某些其他形式。在圖9中示出了映射電路54a、 b、 c的一種實(shí)施方式， MAPA/MAPB寄存器中的一個(gè)，例如60a，被編程。這里再一次，包括用于每個(gè)數(shù)據(jù)元的字段180， 182, 184和186，所述數(shù)據(jù)元例如是，典型地可從運(yùn)算單元14加載的字節(jié)。映射寄存器60a驅(qū)動(dòng)開關(guān)188， 190， 192， 194。在操作中，具有寄存器204的四個(gè)部分196, 198， 200, 202中的四個(gè)字節(jié)A、 B、 C和D的32位字被映射到寄存器204a，以便寄存器部分196a、 198a、 200a、 202a分別接收字節(jié)C、 D、 A和B。這通過將每一字段180, 182, 184， 186中的指令應(yīng)用到開關(guān)188, 190， 192 和194來完成。例如，用于字段180的指令是1告知開關(guān)188連接C，這使能寄存器204的部分200中的字節(jié)C的輸入1;字段182提供0到開關(guān) 190，這促使它從寄存器204的部分202傳遞字節(jié)D到寄存器204a的部分 198a等。調(diào)換電路56a、 b、 c的一種實(shí)施方式可以包括簡單的硬布線網(wǎng)絡(luò)210，在圖10中，其分別將寄存器212中的字節(jié)A、 B、 C、 D的行連接到寄存器222， 224， 226和228的第一部分214, 216, 218和220。來自寄存器228的E、 F、 G和H同樣通過網(wǎng)絡(luò)210硬布線連接。
在圖ll中示出了根據(jù)本發(fā)明的方法。開始，240，為向量處理242 加載并重新排序數(shù)據(jù)，然后對(duì)該數(shù)據(jù)進(jìn)行向量處理244，隨后該數(shù)據(jù) 被重新排序用于存儲(chǔ)246。該數(shù)據(jù)可以以任意格式進(jìn)入并將會(huì)被重新格式化為向量處理機(jī)器的自然域。在例如SIMD處理的向量處理之后，如果是其希望的格式或它可以被再次重新排序?yàn)槌跏几袷交蚰承┢?他格式，那么該數(shù)據(jù)可以被原樣存儲(chǔ)。其可以被存儲(chǔ)在初始存儲(chǔ)器中或其它存儲(chǔ)裝置中，如對(duì)于后續(xù)處理將很快被使用的運(yùn)算單元中的寄存器堆。
盡管在某些圖中示出了和在其它部分沒有示出本發(fā)明的具體特點(diǎn)，但是這些僅僅是為了方便起見，根據(jù)本發(fā)明，每一特征可以與任意或所有其他特點(diǎn)相結(jié)合。在此 <吏用的單詞"including"、 "comprising"、 "having，，和"with"將,皮廣泛地和全面地理解，以及并不局限于任意物理關(guān)聯(lián)。此外，在該主題應(yīng)用中公開的任意實(shí)施例不被認(rèn)為是僅僅可能的實(shí)施例。此外，在本專利的專利申請(qǐng)的法律程序中出現(xiàn)的任何修改不是提
出的該申請(qǐng)中任意權(quán)利要求元素的放棄所屬領(lǐng)域的技術(shù)人員不能合理地期望草擬一個(gè)將字面上包含所有可能等價(jià)的權(quán)利要求，在該修改的時(shí)候，許多等效權(quán)利將不可預(yù)見，并超出所放棄權(quán)利的公平解釋(如果有的話)，在該改正下的基本原理可以不超過與許多等效權(quán)利相關(guān) 的關(guān)系，和/或有許多其他原因，本申請(qǐng)人不能預(yù)期描述用于修改的任意權(quán)利要求元素的某些無實(shí)質(zhì)替代。
在以下權(quán)利要求范圍內(nèi)所屬領(lǐng)域的技術(shù)人員將容易想到其他實(shí)施例。
權(quán)利要求
1、一種具有可置換地址模式的處理器，包括包括寄存器堆的運(yùn)算單元；互連所述寄存器堆與存儲(chǔ)裝置的至少一條加載總線和至少一條存儲(chǔ)總線；以及至少一條所述總線中的置換電路，用于重新排序在所述寄存器堆和存儲(chǔ)裝置之間傳送的字的數(shù)據(jù)元。
2. 如權(quán)利要求1的處理器，其中每個(gè)所述加載和存儲(chǔ)總線包括所述置換電路。
3. 如權(quán)利要求1的處理器，其中存在兩條加載總線，以及其每一個(gè)都包括置換電路。
4. 如權(quán)利要求1的處理器，其中所述置換電路包括映射電路，用于重新排序在所述寄存器堆和存儲(chǔ)裝置之間傳送的字的數(shù)據(jù)元。
5. 如權(quán)利要求1的處理器，其中所述置換電路包括調(diào)換電路，所述調(diào)換電路用于重新排序在所述寄存器堆和存儲(chǔ)裝置之間傳送的字的數(shù)據(jù)元。
6. 如權(quán)利要求4的處理器，其中所述寄存器單元包括至少一個(gè)寄存器。
7. 如權(quán)利要求5的處理器，其中所述寄存器堆包括至少一個(gè)寄存器。
8. 如權(quán)利要求4的處理器，其中所述映射電路包括至少一個(gè)映射寄存器。
9. 如權(quán)利要求8的處理器，其中所述映射寄存器包括用于每個(gè)數(shù) 據(jù)元的字段。
10. 如權(quán)利要求8的處理器，其中能夠從所述運(yùn)算單元加栽所述映射寄存器。
11. 如權(quán)利要求8的處理器，其中至少一個(gè)所述映射寄存器是用大字節(jié)序小字節(jié)序映射缺省加載的。
12. 如權(quán)利要求1的處理器，其中所述數(shù)據(jù)元是字節(jié)。
13. —種使處理器適于處理多種不同數(shù)據(jù)格式的方法，包括用來自存儲(chǔ)裝置的字加載數(shù)據(jù)寄存器；在該字到達(dá)運(yùn)算單元數(shù)據(jù)寄存器堆之前，將該字重新排序?yàn)榕c面向向量的運(yùn)算單元的自然順序相容的第二格式；以及向量處理所述運(yùn)算單元中的數(shù)據(jù)寄存器字。
14. 如權(quán)利要求13的方法，在第二數(shù)據(jù)寄存器裝置中存儲(chǔ)該向量處理的結(jié)果。
15. 如權(quán)利要求13的方法，其中該存儲(chǔ)結(jié)果可以被重新排序?yàn)樗?述第一格式。
16. 如權(quán)利要求13的方法，其中所述第二存儲(chǔ)裝置和所述第一存儲(chǔ)裝置被包括在相同的存儲(chǔ)器中。
全文摘要
適應(yīng)處理器以處理大量不同的數(shù)據(jù)格式，包括從第一存儲(chǔ)裝置載入第一格式的數(shù)據(jù)字；在它到達(dá)運(yùn)算單元之前，將第一格式的數(shù)據(jù)字重新排序?yàn)榕c運(yùn)算單元的自然順序相容的第二格式；以及向量處理運(yùn)算單元中的數(shù)據(jù)字。
文檔編號(hào)G06F15/00GK101432710SQ200780015628
公開日2009年5月13日申請(qǐng)日期2007年3月1日優(yōu)先權(quán)日2006年3月6日
發(fā)明者C·J·普倫德加斯特, C·M·梅爾, G·M·尤克納, J·A·卡布羅特斯基, J·A·海登, J·威爾遜, Y·斯坦恩申請(qǐng)人:阿納洛格裝置公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：J.威爾遜;J.A.卡布羅特斯基;Y.斯坦恩;C.J.普倫德加斯特;G.M.尤克納;C.M.梅爾;J.A.海登
技術(shù)所有人：阿納洛格裝置公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

改進(jìn)型clock置換算法相關(guān)技術(shù)

改進(jìn)工作方法相關(guān)技術(shù)

家教方法明顯改進(jìn)案例相關(guān)技術(shù)

改進(jìn)方法相關(guān)技術(shù)

身邊物品小改進(jìn)的方法相關(guān)技術(shù)

工作方法有待改進(jìn)相關(guān)技術(shù)

績效改進(jìn)的方法與策略相關(guān)技術(shù)

两个人的电影免费视频_国产精品久久久久久久久成人_97视频在线观看播放_久久这里只有精品777_亚洲熟女少妇二三区_4438x8成人网亚洲av_内谢国产内射夫妻免费视频_人妻精品久久久久中国字幕

改進(jìn)的可置換地址的處理器及方法