FPGA加速卡从芯片到系统的发展历程

可编程逻辑

1364人已加入

描述

在2019年MWC大会的第一天,英特尔又推出了一款针对5G应用的FPGA加速卡PAC N3000。这款加速卡可以实现高达100Gbps的网络流量的加速处理,同时支持9GB DDR4和144MB QDR IV板上内存。

对于英特尔的FPGA加速卡产品而言,它们最大的优势之一就是英特尔在数据中心处理器领域的核心支配地位。由于英特尔Xeon处理器占据了数据中心市场的x86处理器的绝大部分市场份额,因此无论何家的FPGA加速卡都必须针对Xeon处理器做大量的兼容性设计和优化,而英特尔FPGA在这方面有着先天的血统优势。这也使得英特尔成为目前唯一一个能够提供全栈式数据中心解决方案的公司。

此外,英特尔与各大服务器制造商保持着良好的合作关系,因此包括戴尔、HPE、富士通等服务器制造商会很自然的在自家的服务器产品中加入并销售基于英特尔FPGA的加速卡。然而,这对于其他FPGA厂商而言就没有那么水到渠成,他们往往很难说服服务器厂商或者客户在已经内置了FPGA的服务器中,再花费额外的成本,并冒着兼容性的风险去添加其他的FPGA加速器。

赛灵思的FPGA加速卡产品起步相对较晚。在2018年10月,赛灵思才正式发布了旗下首款面向数据中心应用加速的FPGA加速卡产品,名为Alveo。首批推出的Alveo U200和U250板卡均基于赛灵思的16纳米UltraScale FPGA器件,分别拥有89.2万和134.1万个可编程逻辑单元。在FPGA器件方面,这两款Alveo卡与英特尔的PAC相比,可以说在伯仲之间。

这两款板卡主要针对的都是大型数据中心应用,因此板上集成了64GB DDR4内存,以及两个QSFP28网络接口和一个PCIe Gen3接口。与PAC相比,这两款板卡的板级资源要丰富的多。然而,这也导致Alveo板卡的外形尺寸和功耗都比较大。当采用主动散热时,板卡尺寸为全高全长,标准功耗为100瓦~110瓦,功耗峰值可达225W,远超过PAC的45W~60W。

在生态系统建设方面, Alveo加速卡将主要基于赛灵思的SDAccel软件进行开发,SDAccel是一个集成的开发环境。

SDAccel最主要的特点之一是包含针对诸如C/C++和OpenCL等高层次语言的FPGA编译器、软件库和API等基础架构,以期帮助软件开发者更快的对FPGA硬件进行开发。这一点,与英特尔的面向Xeon和FPGA的加速堆栈有异曲同工之妙。这也印证了当前FPGA软件系统发展的趋势,就是需要不断降低FPGA开发的门槛,通过尽量多的提供高层次语言的支持,以提高FPGA的开发效率,缩短产品面世时间。

除了英特尔和赛灵思推出的原厂FPGA加速卡之外,很多第三方厂商也在近年相继推出了基于FPGA的硬件加速卡产品。其中比较典型的有我国浪潮、华为等公司推出的加速卡,以及国外Mellanox公司推出的基于FPGA的智能网卡产品。

浪潮的F10A FPGA加速卡是目前在售的一款FPGA加速卡产品。它采用了英特尔Arria10 FPGA,最多包含115万个片上可编程逻辑单元。加速卡上提供了两个SFP+ 10Gbps以太网端口,PCIe Gen3x8接口,以及最高32GB板载DDR内存。在2018年10月底的赛灵思开发者大会上,浪潮和华为都发布了自己的新FPGA加速卡产品,分别叫做浪潮F37X和华为FX系列。

这两款加速卡都采用了赛灵思的16纳米UltraScale+ FPGA器件。相比赛灵思的原厂Alveo加速卡,这两款加速卡产品的主要特点是功耗得到了进一步削减,这可能得益于FPGA芯片规格的提升。例如,浪潮的F37X加速卡的典型功耗只有75瓦左右,而华为的FX系列的中端加速卡的典型功耗最大为75瓦,高端卡为200瓦。

在其他技术规格方面,浪潮F37X加速卡使用的FPGA集成了8GB的HBM2片上高速缓存,相比DDR而言,能大幅提高存储带宽和访存效率。相比Alveo,新推出的这两类第三方加速卡都有着更高的片上逻辑单元数量,足以应对各种新兴的数据中心计算与应用场景,比如机器学习、视频编解码、NFV、图像与语音识别等等。

老石在之前的文章《Mellanox为何让多家巨头公司趋之若鹜》中介绍过,Mellanox是一家总部位于以色列的著名的网络设备供应商,旗下产品包括网络控制芯片、网卡、线缆、交换机、软件等等,可以说几乎涵盖了数据中心网络产品的各大门类。Mellanox的基于FPGA的智能网卡产品名为Innova-2 Flex。

这款智能网卡上包括两个主要芯片,一个是Mellanox的ConnectX-5以太网控制器,另一个是Xilinx的Kintex UntraScale FPGA。板上包含两个25G以太网端口,都与ConnectX-5相连,然后再通过PCIe Switch连接Host和FPGA。ConnectX-5本身就可以实现不少硬件加速功能,比如常见的虚拟交换、SRIOV、QoS与流量控制等。因此FPGA在这个卡上更像是一个“辅助”的加速单元,主要的设计目的是用来实现和加速各种CPU上不支持、或性能较低的定制化需求。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分