日韩欧美国产极速不卡一区,国产手机视频在线观看尤物,国产亚洲欧美日韩蜜芽一区,亚洲精品国产免费,亚洲二区三区无码中文,A大片亚洲AV无码一区二区三区,日韩国语国产无码123

您好,歡迎來到維庫電子市場網(wǎng) 登錄 | 免費注冊

ALU
閱讀�19682時間�2011-05-01 16:02:49

  ALU是計算機中執(zhí)行各種算術和邏輯運算操作的部件,運算�的基本操作包括加、減、乘、除四則運算,�、或、非、異或等邏輯操作,以及移位、比較和傳送等造作,都稱作算術邏輯部�(ALU)�

運算基本原理

  計算機運行時,運算器的操作和操作種類由控制器決定。運算器處理的數(shù)�(jù)來自存儲�;處理后的�(jié)果數(shù)�(jù)通常送回存儲�,或暫時寄存在運算器中�

  �(shù)�(jù)運算器的處理對象是數(shù)�(jù),所以數(shù)�(jù)長度和計算機�(shù)�(jù)表示方法,對運算器的性能影響極大�70年代微處理器常以1��4個�8��16個二進制位作為處理數(shù)�(jù)的基本單�。大多數(shù)通用計算機則�16�32�64位作為運算器處理�(shù)�(jù)的長�。能對一個數(shù)�(jù)的所有位同時進行處理的運算器稱為并行運算�。如果一次只處理一�,則稱為串行運算器。有的運算器一次可處理幾位 (通常�6�8�),一個完整的�(shù)�(jù)分成若干段進行計算,稱為串 并行運算�。運算器往往只處理一種長度的�(shù)�(jù)。有的也能處理幾種不同長度的�(shù)�(jù),如半字長運�、雙倍字長運算、四倍字長運算等。有的數(shù)�(jù)長度可以在運算過程中指定,稱為變字長運算�

  按照�(shù)�(jù)的不同表示方法,可以有二進制運算�、十進制運算�、十六進制運算�、定點整�(shù)運算器、定點小�(shù)運算�、浮點數(shù)運算器等。按照數(shù)�(jù)的性質(zhì),有地址運算器和字符運算器等�

  操作運算器能�(zhí)行多少種操作和操作速度,標志著運算器能力的強弱,甚至標志著計算機本身的能力。運算器最基本的操作是加法。一個數(shù)與零相加,等于簡單地傳送這個數(shù)。將一個數(shù)的代碼求�,與另一個數(shù)相加,相當于從后一個數(shù)中減去前一個數(shù)。將兩個數(shù)相減可以比較它們的大小�

  左右移位是運算器的基本操作。在有符號的�(shù)�,符號不動而只移數(shù)�(jù)�,稱為算術移�。若�(shù)�(jù)連同符號的所有位一齊移�,稱為邏輯移位。若將數(shù)�(jù)的位與位鏈接進行邏輯移位,稱為循�(huán)移位�

  運算器的邏輯操作可將兩個數(shù)�(jù)按位進行�、或、異或,以及將一個數(shù)�(jù)的各位求�。有的運算器還能進行二值代碼的16種邏輯操��

  �、除法操作較為復�。很多計算機的運算器能直接完成這些操作。乘法操作是以加法操作為基礎�,由乘數(shù)的一位或幾位譯碼控制逐次�(chǎn)生部分積,部分積相加得乘積。除法則又常以乘法為基礎,即選定若干因子乘以除數(shù),使它近似為1,這些因子乘被除數(shù)則得�。沒有執(zhí)行乘�、除法硬件的計算機可用程�?qū)崿F(xiàn)�、除,但速度慢得�。有的運算器還能�(zhí)行在一批數(shù)中尋求數(shù),對一批數(shù)�(jù)連續(xù)�(zhí)行同一種操作,求平方根等復雜操作�

�(fā)�

  算術邏輯單元(ALU)是進行整數(shù)運算的結(jié)�(gòu)?,F(xiàn)階段是用電路來實�(xiàn),應用在電腦芯片��

  在計算機�,算術邏輯單元(ALU)是專門�(zhí)行算術和邏輯運算的數(shù)字電路。ALU是計算機中央處理器的最重要組成部分,甚至連最小的微處理器也包含ALU作計�(shù)功能。在�(xiàn)代CPU和GPU處理器中已含有功能強大和復雜的ALU;一個單一元件也可能含有ALU�

  1945年數(shù)學家馮諾伊曼在一篇介紹被稱為EDVAC的一種新型電腦的基礎�(gòu)成的報告中提出ALU的概��

  早期�(fā)�

  1946�,馮諾伊曼與同事合作為普林斯頓高等學習學�(IAS)設計計算機。隨后IAS計算機成為后來計算機的原�。在論文中,馮諾伊曼提出他相信計算機中所需的部�,其中包括ALU� 馮諾伊曼寫到,ALU是計算機的必備組成部�,因為已確定計算機一定要完成基本的數(shù)學運�,包括加減乘除。于是他相信「(計算機)應該含有專門完成此類運算的部�。�

  �(shù)字系�(tǒng)

  ALU必須使用與數(shù)字電路其他部分使用同樣的格式進行�(shù)字處�.對現(xiàn)代處理器而言,幾乎全都使用二進制補碼表示方式。早期的計算機曾使用過很多種�(shù)字系�(tǒng),包括反碼、符號數(shù)值碼,甚至是十進制碼,每一位用十個管�� 以上這每一種數(shù)字系�(tǒng)所對應的ALU都有不同的設計,而這也影響了當前對二進制補碼的優(yōu)先選�,因為二進制補碼能簡化ALU加法和減法的運算� 一個簡單的能進行與或非和加運算的2位ALU�

  可行性分�

  絕大部分計算機指令都是由ALU�(zhí)行的。ALU從寄存器中取出數(shù)�(jù),數(shù)�(jù)�(jīng)過處理將運算�(jié)果存入ALU輸出寄存器中。其他部件負責在寄存器與�(nèi)存間傳送數(shù)�(jù)� 控制單元控制著ALU,通過控制電路來告訴ALU該執(zhí)行什么操作�

  簡單運算

  大部分ALU都可以完成以下運算∶

  整數(shù)算術運算(加、減,有時還包括乘和�,不過成本較高)

  位邏輯運算(�、或、非、異或)

  移位運算(將一個字向左或向右移位或浮動特定�,而無符號延伸�,移位可被認為是乘以2或除�2�

  復雜運算

  工程師可設計能完成任何運算的ALU,不論運算有多復�;問題在于運算越復雜,ALU成本越高,在處理器中占用的空間越�,消耗的電能越多� 于是,工程師們經(jīng)常計算一個折中的方案,提供給處理器(或其他電路)一個能使其運算高速的ALU,但同時又避免ALU設計的太復雜而價格昂�。設想你需要計算一個數(shù)的平方根,數(shù)字工程師將評估以下的選項來完成此操作�

  設計一個極度復雜的ALU,它能夠一步完成對任意�(shù)字的平方根運�。這被稱為單時鐘脈沖計��

  設計一個非常復雜的ALU,它能夠分幾步完成一個數(shù)字的平方根運算。不�,這里有個訣�,中間結(jié)果經(jīng)過一連串電路,就像是工廠里的生產(chǎn)�。這甚至使得ALU能夠在完成前一次運算前就接受新的數(shù)�。這使得ALU能夠以與單時鐘脈沖同樣的速度�(chǎn)生數(shù)�,雖然從ALU輸出的結(jié)果有一個初始延遲。這被稱為計算流水��

  設計一個復雜的ALU,它能夠計算分幾步計算一個數(shù)字的平方�。這被稱為互動計算,經(jīng)常依賴于帶有嵌入式微碼的復雜控制單元�

  在處理器中設計一個簡單的ALU,去掉一個昂貴的專門用于此運算的處理器,再選擇以上三個選項之一。這被稱為�(xié)處理��

  告訴編成人員沒有�(xié)處理器和仿真設備,于是他們必須自己寫出算法來用軟件計算平方根。這是由軟件圖書館完成的�

  對協(xié)處理器進行仿真,也就是�,只要一個程序想要進行平方根的計算,就讓處理器檢查當前有沒有協(xié)處理器。如果有的話就使用其進行計算,如果沒有的�,中斷程序進程并調(diào)用操作系�(tǒng)通過軟件算法來完成平方根的計�。這被稱為軟件仿真�

  以上給出的選項按最快和最貴到最慢和最�(jīng)濟排�。于�,雖然甚至是最簡單的計算機也能計算最復雜的公�,但是最簡單的計算機�(jīng)常需要耗費大量時間,通過若干步才能完�� 強大的處理器,比如英特爾酷睿和AMD64系列對一些簡單的運算采用1號選項,對最常見的復雜運算采�2號選�,對極為復雜的運算采�3號選�。這是具有在處理器中構(gòu)造非常復雜的ALU的能力為前提��

  輸入和輸�

  ALU的輸入是要進行操作的數(shù)�(jù)(稱為操作數(shù))以及來自控制單元的指令代碼,用來指示進行哪種運算。它的輸出即為運算結(jié)�� 在許多設計中ALU也接收或�(fā)出輸入或輸出條件代碼到(或來自)狀�(tài)寄存器。這些代碼用來指示一些情�,比如進位或借位、溢�、除�(shù)為零��

  ALU與FPU

  浮點單元也對兩個數(shù)值進行算術運算,但是這種運算已浮點數(shù)表示,比在ALU中一般使用的補碼表示方式復雜的多。為了完成此類運�,F(xiàn)PU里嵌入了多個復雜電路,包括一些內(nèi)部ALU� 工程師一般認為ALU是處理整�(shù)型(比如補碼和BCD碼)算術運算的的電路,而對更為復雜的格式(比如浮點�、復�(shù)型)進行計算的電路則擁有一個更加匹配的稱謂�

�(jié)�(gòu)簡單的低壓低功耗單元設�

  1.引言

  隨著手持式個人通訊系統(tǒng)等的�(fā)�,低壓低功耗高吞吐量電路的需求越來越�,因此低功耗微處理器和元件的設計已�(jīng)變成了主�。ALU是微處理器最重要的組成部�,其中全加器電路是所有運算電路的基本單元,設計低功耗快速加法器單元是獲得低功耗高速運算電路的關鍵。ALU單元的設計標準是多種多樣�,晶體管�(shù)量顯然是一個主要的關注點,因為它極大的影響了功能單元ALU的設計復雜�。另外兩個重要的卻又相互矛盾的因素是功耗和速度。與功耗降低相關的一個因素是電路能工作的電壓, 還有一個是晶體管的�(shù)�,而全加器晶體管的�(shù)量又極大的影響了ALU單元的晶體管�(shù)量,因此全加器的設計也是ALU設計中必須重點考慮的一部分。對于已有的全加器的設計按照種類來分有靜�(tài)CMOS電路,動�(tài)電路,傳送管和傳輸門邏輯。其中全靜態(tài)CMOS電路是最傳統(tǒng)�,但需�28個管�。動�(tài)電路能極大的減少晶體管的�(shù)量但是短路功耗卻很大;使用傳送門邏輯是一個可選的降低電路復雜性的方案。在中基于傳送門和反向器的全加器設計中各使用�20�16個晶體管,為了得到更少管子的全加�,在中基于XOR/XNOR的傳送門邏輯電路組成的全加器只用�14個管子,在中,介紹了一個基于傳輸管的靜�(tài)能量恢復全加器(SERE�,它只使用了10個管�,且不管它自稱的功耗小,這個設計相比同類的設計來講速度比較�,同時這個設計不能用來級�,因為在低電壓下工作時有多閥值損失問題。在中一種新的基于選擇電路的10管全加器設計被提�,然而這個設計也同樣有多閥值損失問題,以至于不能在低電壓級連模式下正確的工�,前面提到的10管全加器都是基于�1的原理來的。文中的ALU單元將采用一種新�10管全加器,它可以減輕閥值損失問�,這個設計可以在使用少量管子的情況下組成快速的并行加法器(RCA)同時保持較低的能量損�,另�,這個設計可以在較低的工作電壓下正確運行�

現(xiàn)有的10管全加器結(jié)構(gòu)

  �1 .�(xiàn)有的10管全加器�(jié)�(gòu)

  2.新的基于CLRCL全加器的ALU單元

  首先考慮全加器的設計,全加器的邏輯表達式為:

  Sum=(A⊙B)·Cin+(A⊕B) ·!Cin Count=(A⊕B) ·Cin+(A⊙B) ·A

  可以看出有兩個基本的模型需要使用――XOR�2�1選擇�。一個XOR/XNOR功能用傳送門邏輯只用四個管子就可以達到,一�2�1選擇器可以用兩個管子實�(xiàn)。但是這些電路都有不同程度的閥值電壓損失,所以在使用時必須小�,文中將采用一種新的全加電�,這個全加器的特點是進位邏輯電平恢復稱之為(Complementary and Level Restoring Carry Logic or CLRCL�。目的是為了減小電路的復雜性和達到快速的級連運作。為了避免進位鏈的多閥值電壓損�,為此重寫全加器的和以及進位邏輯公式�

  Sum =(A⊕Cin) ·!Cout+(A⊙Cin) ·B Count =(A⊕Cin) ·B+(A⊙Cin) ·A

  改進后的電路圖如圖2.其中MUX的電路如�3所示。這樣設計的合理之處在于以下幾點:首先,避免了使用有閥值損失的信號作為下一個單元的控制信號,這是在現(xiàn)有的10管全加器中普遍存在的問題,這將導致在電路級連的時候有多閥值電壓損失從而使電路不能正確工作;第二,在傳送管鏈中去除了沒有緩沖的進位信號傳�。根�(jù)Elmore公式,傳送延遲時間跟級連的傳送門�(shù)目是二次方的關系。即使是中等�(shù)目的級連長�,這樣的延遲也是不能忍受的�

新的1位ALU單元電路圖

  �2.新的1位ALU單元電路�

MUX 的MOS電路圖

  �3 .MUX 的MOS電路�

  正如�2中全加器部分電路所示,XNOR電路采用了一�2�1選擇器加一個反向器來實�(xiàn),這個反向器的功用有三個:,反向器INV1可以用來補償輸出傳送門輸出電壓的損�,這個輸出將用來與另外兩�2�1選擇器一起實�(xiàn)和以及進位功能,這樣和以及進位信號的閥值電壓損失可以控制在一個|V t|;第�,反向器INV2在進位鏈中充當了一個緩沖器的作�,從而加速了進位的傳送;第三,同時這個反向器提供了一個進位的互補信號(!Count)供下一級電路使�。這樣全部的全加器部分電路就只需�10個管子(5個PMOS�5個NMOS),這是目前我們所知的最少的實現(xiàn)全加器電路的晶體管數(shù)��

  在邏輯與或的功能部分,采用了兩個信號來控制(Cnt2和Cnt3�(Figure 2所�),當全加器的和信號以及邏輯�/或功能信號產(chǎn)生后,再使用一�2�1選擇器(控制信號為Cnt1�,共使用了三個控制信號實�(xiàn)了全加及邏輯�/或的功能(見Table 1�,使用了兩個用傳送門實現(xiàn)�2�1選擇器串�(lián)�,這個電路會有兩個閥值電壓的損失,不過這并不影響最終電路的正確操作,因為兩個閥值電壓的損失�3.3v的工作電壓下還是可以正確工作�

  至于左移、右移和SWAP功能可以通過傳輸門來實�(xiàn)(見Figure 2右部分),通過不同的控制信號可以輕易的實現(xiàn)這些功能�

  前面提到了本文中提出的電路會有兩個閥值電壓的損失,為了后�(xù)電路的正確工作我們可以加一個電平恢復電�,同時這個電路還可以加快電路的傳送速度(見Figure 2右半部分�,在此恢復電路中我們使用了一個控制信號(Cnt4)來實現(xiàn)三態(tài)門的功能以控制信號的輸出與�。加上這部分電路后輸出信號會取反,在許多處理器中信號采用的是補碼形�,而這為補碼的實�(xiàn)提供了便��

  3. 電路分析和仿真結(jié)�

  一些其他的全加器設計將用來和本文的全加器比�,因為設計的目標是降低電路的復雜性和提高電路的速度以及能量損耗的降低,所以主要關注于門�(shù)少并基于傳送門的全加器之間的比較。已有的全加器總�(jié)如下�2�

  �0.35um工藝下仿真一�10管的全加器的DC特性,其中Vdd�3.3v,反向器的(W/L)p=1.4um/0.35um 以及(W/L)n=0.7um/0.35um(table3)。另�,此電路�1.9v的電壓下依然可以正確工作,這為進一步降低功耗提供了一個很好的途徑�

  對整個電路進行DC分析,得到整個電路的功耗為12.12 uw,延�1.5ns,仿真�(jié)果見�4。另外在AC方面,這個電路的工作頻率也是比較高的�

電路仿真結(jié)果

  �4 . 電路仿真�(jié)�

  4.結(jié)�

  本文提出了一種新�1位的ALU單元。所提議的ALU單元在DC方面,可以在很低的工作電壓下工作,功耗小且速度�;在AC方面,由于采用了CLRCL全加器可以工作在很高的頻率下。同時,比較了現(xiàn)有的一些全加器的性能,可以看到文中的CLRCL電路不僅使用的晶體管的數(shù)目較少,同時它的功耗和速度性能也是比較�(yōu)良的,極大的提高了1位ALU的性能�

維庫電子�,電子知�,一查百通!

已收錄詞�160382