可编程逻辑
今天针对DSP优化的高性能FPGA已经在DSP领域扮演着重要的角色。DSP领域的设计工程师逐渐发现他们所处的环境变化十分迅速,标准快速演化并且不断融合,上市周期越来越短,设计工作受到经济和技术上的约束增多,但设计一旦成功获得的回报也很巨大。
由于在性能和灵活性方面的完美组合,FPGA在DSP领域的应用越来越普遍(参看图1)。诸如通信、多媒体和国防行业等高增长的市场都非常需要高性能的DSP技术。这些市场的特点在于始终处于连续的变化之中,不断变化的标准、市场需求、客户需求以及竞争态势。要跟上市场变化,企业就需要一种强大且灵活的处理器---FPGA就是这种特别适合的技术。
图 1.DSP技术对比
DSP市场研究机构Forward Concepts最近在题为“DSP战略”的报告中,该机构分析师Will Strauss预测:未来五年内,可重配置DSP(99%是FPGA)市场增长速度将超过DSP整体市场中的任何其它部分。Strauss还指出:FPGA经常被用来分流承担大量计算任务,帮助提高传统DSP芯片的能力。换句话来说,FPGA并非替代DSP。相反的是,功能和性能都不断增强的FPGA为DSP技术开拓了新市场。
推动DSP应用对FPGA需求的最重要因素之一就是传统处理器性能增长放缓。尽管在摩尔定律的推动下,处理器的制造工艺不断向更小节点发展,但仅仅简单地通过减小工艺节点来大幅提高DSP和GPP的性能变得越来越困难。
与此同时,由于通信系统将数据传输效率不断推向香农定理(参见图2))的上限,算法的复杂性以更快的速度提高。Turbo编码和MIMO系统等先进技术已经非常接受香农定律的理论极限,成本就是极高的计算复杂性。 这就导致了算法性能要求和处理器性能之间的差距越来越大。因此,设计人员必须寻找新的设计解决方案(如DSP),在固定结构处理器之外选择FPGA。
图 2.FPGA填补算法复杂性和固定架构处理器效率造成的性能差距
FPGA 的DSP性能领先的关键是其内在的并行机制,即利用并行架构实现DSP功能的功能。这一并行机制使得FPGA特别适用于完成像滤波这样的重复性DSP任务。因此,对于高度并行执行DSP任务来说,FPGA性能远超通用DSP处理器的串行执行架构。
例如,传统DSP处理器每个时钟周期最多可完成8个MAC操作。要执行一个256抽头的滤波器,传统DSP处理器需要在1 GHz时钟下执行 32个时钟周期,才能达到31.25 MSPS的采样处理性能。与此相对比,有512个并行XtremeDSP逻辑片的赛灵思Virtex-4 SX55在500 MHz时钟下可达到500 MSPS的性能。(参看图3)因此在时钟慢一倍的情况下,FPGA提供的性能高了一个量级还多。
图 3.并行实现的滤波器性能比传统DSP串行实现时的性能高了一个量级。
显然,实际应用不会仅仅涉及滤波,因此这一例子有点简单了。然而,独立的基准测试表明,即使在实际工作负载下,FPGA也有很大的性能优势。
当然,性能并非一切:对几乎所有DSP应用来说,成本和功率也是考虑的关键因素。许多设计人员仍然有这样的错误印象,认为采用FPGA的成本要几千美元。实际上,在摩尔定律的推动下,FPGA的成本已经大大降低,比如,2000年时,百万系统门器件的成本为350美元,而采用90nm工艺后,成本还不到9美元。今天, FPGA产品已经进入了65nm工艺,十多种65nm 产品已经上市并有几种已经量产,而45nm工艺的设计工作也已在进行中。因此,实际上FPGA现在已经成为领先半导体生产技术的重要推动力 – FPGA成为每个新的工艺结点生产的首批器件之一。因此,FPGA将会继续在摩尔定律的推动下进一步降低成本,提高性能。
许多设计人员还认为FPGA是功耗大户。实际上,FPGA能够做到非常高的功效。U.C. Berkeley教授Bob Broderson在其58分钟的教学视频中充分表明了这一点:“利用重配置实现通用低功耗超级计算”(“GeneralPurpose, Low Power Supercomputing Using Reconfiguration”)。在视频教程中,Broderson教授利用国际半导体电路大会上获得的芯片数据回顾了并行机制和功耗之间的相关性。如图4所示,他的结论给出明确的强有力信息:FPGA同时在性能和功率效率方面领先于DSP。(这一点在BDIT 2007年1月11日的DesignLine文章中进一步得到了证实:“FPGA与DSP:有关问题的重新审视”(FPGAs vs. DSPs: A look at the unanswered questions))
图 4.FPGA的能源效率比通用DSP更好
近几年来,FPGA供应商始终将功耗做为优先考虑的问题来抓,并在65nm工艺结点的创新功率优化技术方面投入了大量资金。事实上,一些最新的FPGA采用了与手机芯片一样的制造工艺。
然而, DSP性能的范围、功耗和成本要求非常宽泛,高性能DSP市场也需要一个DSP平台系列来满足如此广泛的要求,单单靠一种器件无法满足高端应用的极高性能要求以及大批量应用对价格和功率的要求。
几年前,FPGA供应商就开始为高性能应用提供DSP增强的FPGA。赛灵思公司的Virtex-DSP系列就是此类FPGA中的典型例子。今天,FPGA供应商正在推出新的低成本FPGA系列产品来扩充产品线。例如,赛灵思公司刚刚推出了Spartan-DSP系列。
做为两种产品组合中新增加的成员,Virtex-5 SXT 和Spartan-3A DSP平台瞄准不同的应用。Virtex-5 SXT平台有三种器件可供选择,主要面向要求超高DSP带宽和更低系统成本的下一代无线、国防和多媒体视频应用。这些FPGA器件在550MHz时钟下提供了超过350 GMAC/s(即每秒3500亿乘法累积运算)的性能。65-nm Virtex-5 SXT则集中于高性能,值得一提的是比此前的90nm产品消耗的动态功耗低35%。
Spartan-3A DSP是赛灵思产品线中的最新成员,也是第一款DSP优化的Spartan FPGA.Virtex-5 SXT主要集中于性能,而Spartan-3A DSP则致力于价格、性能和功耗的平衡。Spartan-3A DSP平台以低于30美元的批量生产起价提供了超过30 GMAC/s的性能和高达2,200 Mbps的存储器带宽。这一突破性的性能价格比使其可用于以下应用:单通道微小型(pico-cell)无线基站中的数字前端(DFE)和基带解决方案、军用移动软件无线电(SDR)、超声系统、高分辨率视频和智能IP相机。
如图5所示,DSP或高端FPGA无法满足很多此类应用的需要。因此Spartan-3A DSP这样的新器件为DSP技术打开了新市场。
图 5.Spartan-DSP系列了填补DSP和高端FPGA之间的鸿沟。
随着FPGA供应商对DSP应用关注的加大,其面向DSP的产品已经不仅仅是提供FPGA器件。例如,赛灵思公司于2000年启动了“XtremeDSP”计划,旨在为通信、多媒体和国防行业提供应用优化的DSP解决方案。XtremeDSP方案包括:
不断扩展为DSP设计提供的高性能器件产品线
提供开发板和开发套件、参考设计和知识产权(IP)
推出用于不同DSP系统设计的方法和设计开发工具
提供相关的可编程逻辑、连接功能和嵌入式处理功能
建立提供培训和支持的业界和大学战略合作伙伴关系
开发工具特别关键,因此没有强大的开发工具就无法充分发挥FPGA的潜力。对于FPGA工具和设计方法来说,需要关注三类不同的设计人员群体:系统设计师、DSP工程师以及FPGA/硬件工程师。每一类设计人员有不同的职责分工,从而对他们所使用的特定设计环境提出了要求。系统设计师必须快速确定如何在选择的处理资源条件下最好地划分不同的系统级功能。他们关注的重点是选择适当的FPGA产品来满足产品性能和吞吐能力要求,同时满足尺寸、成本和功耗方面的预算。 DSP工程师更关注DSP算法的创建和改进。他们通常不熟悉硬件设计细节,要依赖工具将细节抽象掉,这样他们才能够更专注于更高层的设计探索和验证。 硬件工程师通常采用VHDL 或 Verilog来从设计中获得最高的性能。他们通过需要在同一设计环境中与更高层功能模块以及自己的寄存器传输级(RTL)设计协同工作的能力,并且可以运行测试基准进行功能和性能验证。
现代FPGA设计工具可满足所有三类设计群体的要求,在单个设计环境中提供了系统建模、算法开发和试验、测试基准向量自动生成、设计验证和调试、以及HDL生成和仿真等功能。无论设计人员使用C/C++、MATLAB、Simulink、HDL还是他们的任意组合,当今的FPGA设计工具(包括EDA合作伙伴提供的第三方工具)都能够支持他们快速高效地充分发挥FPGA的所有潜力。
在当今要求最苛刻的数字信号处理(DSP)系统设计和开发中, FPGA扮演着越来越重要的角色,这一点并非偶然。经过二十多年的研究和工程努力,以及与数百DSP客户的密切合作,赛灵思FPGA已经演化为无与伦比的高价值DSP解决方案平台,在性能、灵活性、上市时间以及产品寿命方面都提升到了极高水平,同时还大大降低了总体系统成本和功耗。
全部0条评论
快来发表一下你的评论吧 !