过渡至65纳米工艺的FPGA具备采用更小尺寸工艺所带来的优势:低成本、高性能和更强的逻辑能力。尽管这些优势能够为高级系统设计带来激动人心的机会,但65纳米工艺节点本身也带来了新的挑战。例如,在为产品选择FPGA时,功耗的考虑变得越来越重要。很可能下一代设计会需要在功耗预算不变(或更小)的情况下,集成更多的特性和实现更高的性能。
本文将分析功耗降低所带来的益处,还将介绍Virtex-5器件中所采用的多种技术和结构上的革新,它们能提供功耗最低的解决方案,并且不牺牲性能。
1 降低功耗的好处
低功耗的FPGA设计所带来的优势不仅是能满足器件工作的散热要求。虽然满足元件指标对于性能和可靠性十分重要,但如何实现这一点对于系统成本和复杂性都有着巨大的影响。
首先,降低FPGA的功耗使设计人员能够采用更便宜的电源,这样的电源使用的元件数量较少,并且占用的PCB面积也较小。高性能电源系统的成本通常为每瓦0.5到1美元。低功耗的FPGA直接降低了系统的整体成本。
其次,由于功耗直接与散热相关,低功耗使设计人员能够使用更简单、更便宜的热量管理解决方案。在很多情况下,设计者将不再需要散热器,或者只需要更小、更便宜的散热器。
最后,由于低功耗工作意味着更少的元件和更低的器件温度,因此将提高整个系统的可靠性。器件工作温度每降低10℃,就相当于元件寿命提高了两倍,因此对于需要高可靠性的系统而言,控制功耗和温度十分重要。
2 功耗:挑战和解决方案
FPGA(或任何半导体器件)中的总功耗等于静态功耗和动态功耗之和。静态功耗主要由晶体管的泄漏电流引起,即晶体管在逻辑上被关断时,从源极“泄漏”到漏极或通过栅氧“泄漏”的小电流。动态功耗是器件核心或I/O在开关过程中消耗的能量,与频率相关。
2.1 静态功耗
在缩小晶体管尺寸时(例如,从90纳米到65纳米),泄漏电流将会增大。新工艺节点所使用的短沟长和薄栅氧使电流更容易从晶体管的沟道区或通过栅氧泄漏。
在90纳米Virtex-4系列产品中,赛灵思公司使用了“三栅极氧化层”的工艺技术,向电路设计者提供了一种强有力的阻止漏电工具。在前几代FPGA中,使用两种栅氧厚度:薄栅氧用于FPGA核心中高性能、低工作电压的晶体管,而厚栅氧用于I/O模块中尺寸较大,需要承受大电压的晶体管。简言之,“三栅极氧化层”指增加一种中间厚度栅氧的晶体管,它的漏电比薄栅氧的核心晶体管要小得多。
“中间栅氧”的晶体管用在器件核心外围非关键性能的电路(像设置存储器)或不需要对变化的栅压进行快速开关响应的电路(像传输门)中。薄栅氧、漏电最大的晶体管只保留在需要快速开关速度的路径部分。结果,总的器件漏电大幅减小,同时性能比上一代FPGA有很大提高。
三栅极氧化层工艺使Virtex-4器件比竞争性90纳米FPGA在静态功耗上平均减少了超过70%。这一结果非常成功,因此Virtex-5系列产品中大量使用了这一技术,在65纳米工艺节点上降低漏电。
尽管业界预测65纳米器件的静态功耗将会大幅提高,但是图1显示了三栅极氧化层工艺使65纳米Virtex器件在最坏(温度最高)工作条件下达到了与尺寸相当的90纳米Virtex-4器件相同水平的静态功耗。因此,Virtex-5系列产品和竞争性高性能FPGA产品相比,在静态功耗方面具有真正的优势。
图1:Virtex-4与Virtex-5器件在85℃时的静态功耗比较。
2.2 动态功耗
动态功耗为65纳米FPGA带来一些其它方面的挑战。动态功耗的公式为:
动态功耗=C×V2×f
其中,C是总开关电容、V是电源电压、f是开关频率。65纳米工艺使FPGA的逻辑能力和性能比传统器件有了显著提高,也就是说更多的结点工作在更高的频率上。
如果其它方面的条件不变,动态功耗将会增大。不过对于动态功耗而言,也有一个好消息:FPGA电源电压和结点电容通常在每一代新工艺中都会下降,从而使得动态功耗比上一代FPGA有所下降。
Virtex-5器件中,核心电源电压(VCCINT)从Virtex-4中所使用的1.2V下降到1.0V。由于寄生电容变小(与更小的晶体管相关),以及逻辑块间的互联线长度变短、电容变小,使结点电容减小。此外,Virtex-5器件在金属互联层之间使用了一种介电常数较低的材料。
Virtex-5器件的平均结点电容比Virtex-4器件大约减小了15%。加上电压降低带来的好处,至少相当于将Virtex-5器件的核心动态功耗降低了35~40%。
除了因工艺尺寸缩小到65纳米所致固有的35~40%动态功耗降低外,Virtex-5器件的架构创新还能进一步降低每个设计的功耗。大多数可增加动态 功耗的结点电容,是由逻辑单元间的互连线引起的。新型Virtex-5架构从以下方面减小了连线电容:
Virtex-5的可配置逻辑模块(CLB)是基于6输入查找表(6-LUT)逻辑结构的,在以前的器件中是使用4输入查找表。这意味着在每个LUT中能够实现更多的逻辑,相当于较少的逻辑级,从而降低了对逻辑单元之间大电容连线的需求。
Virtex-5的互联结构目前包括了对角线对称的连线,意味着每个CLB与所有相邻的模块(包括处于对角线位置的模块)之间都有直接的“单一”连接。当逻辑功能之间需要连接时,这一连接更有可能成为总电容最小的“单一”连接,而以往的互联结构对于相同的连接问题可能会需要两个或更多结点。
6-LUT结构和改进的互联模式,通过降低平均结点电容来降低核心动态功耗,效果远远超过仅使用65纳米工艺所带来的改进。图2显示了来自标准设计的核心动态功耗的测量结果,其中每个Virtex-5器件和Virtex-4器件中都有1,024个8位计数器。这些实际的测量结果显示,工艺和结构上的共同优化所带来的动态功耗的降低超过了50%。
2.2 硬IP模块
Virtex-5器件中所包含的硬IP模块(专门用来实现一些常用功能的电路)数量,超过业界其他任何一款FPGA。相比使用通用FPGA逻辑而言,使用搭载这些模块的FPGA设计来实现相同功能,可进一步降低功耗。
与FPGA结构不同,这些专用模块中只含有为实现所要求功能而必需的晶体管,并且没有可编程的互联,因此互联电容最小。较少的晶体管和较小的结点电容能降低静态和动态功耗。因而这些专用模块在实现相同功能的同时,功耗只有采用通用FPGA结构的十分之一。
除了增加新型的专用模块之外,Virtex-4器件中融合的很多模块,在Virtex-5器件中都被重新设计,以增加新的特性,提高性能并降低功耗。例如,Virtex-4系列中18Kb的block RAM存储器在Virtex-5器件中被增加到了36Kb;每个block RAM能被分成两个独立的18Kb的存储器,以便向下兼容Virtex-4的设计。
有趣的是,从功耗的角度来看,每个18Kb的子模块由两个9Kb的物理存储阵列构成。对于大多数block RAM配置,任何对block RAM的读写请求一次只需要访问9Kb物理存储器中的一个。因此其余的9Kb存储器能在不被访问时可有效地“关断”。在过渡至65纳米工艺所带来的功耗降低的基础上,这种结构又使功耗进一步降低了50%。这一对于9Kb模块的乒乓式存取是新型block RAM结构所固有的,这就意味着使用这项功能不需要用户或软件来进行控制。它能动态并自动地进行,使所有使用block RAM的设计降低了大量的功耗,并且不会影响模块的性能。
Virtex-5器件中专用的DSP元件也进行了大量的改进,以实现更多的功能,提高性能并降低功耗。在片与片的功耗比较中,新型的Virtex-5 DSP片比Virtex-4 DSP片降低了大约40%。这主要归功于前面所讨论的65纳米工艺中电压和电容的减小。
然而,由于Virtex-5 DSP片具有更强的功能和更广泛的接口,许多DSP运算通过利用这些附加的功能进一步降低了功耗。在许多情况下,当使用新型DSP片的全部功能时,总功耗最高可降低75%。即使你不是在设计一个DSP产品,也能使用DSP片来实现标准的逻辑功能(计数器、加法器、桶式移位器),这样会比在标准FPGA逻辑中实现同样的功能节省功耗。
最后介绍经过改进的专用模块——Virtex-5系列的LXT平台,其中包括了几吉位的串行收发机,能以高达3.125Gbps的速率工作。这些“SERDES”模块在实现时着重考虑了低功耗需求。每个Virtex-5 LXT器件中的全双工收发机在3.125Gbps的速度下的总功耗小于100mW,与Virtex-4串行收发机相比降低了大约75%。
与Virtex-4系列产品一样,Virtex-5器件也采用了一系列工艺和架构上的革新,力求在提供尽可能低的功耗的同时,仍然使性能提高30%或更多。如图3所示,Virtex-5系列产品的静态功耗与Virtex-4器件相当,但比竞争性FPGA具有明显的优势。
Virtex-5器件核心的动态功耗比市场上其高性能FPGA低至少35~40%。新型6-LUT和对角线对称的互联等架构上的革新,使实际核心动态功耗进一步降低了50%或以上。此外,利用改进的专用模块也进一步降低了功耗。
全部0条评论
快来发表一下你的评论吧 !