可编程逻辑
让时光倒退回到2015年,这一年2月份,FPGA龙头企业赛灵思(Xilinx)发布了业界首款16nm工艺的FPGA产品——UltraScale+系列FPGA,在FPGA领域风光无两。同年6月份,当时的半导体行业龙头英特尔宣布以167亿美元收购Altera。此后,人们给赛灵思设计出无数种前途,可是考虑到当年50亿美元的FPGA市场,大家都觉得这是一场实力悬殊的竞争。
把目光拉回到当下,翻看今天的赛灵思官网,如果单看FPGA产品,赛灵思似乎没有什么进步,因为FPGA产品工艺没有精进,丰富的是合作伙伴和开发支持工具。作为“摩尔定律”的倡导者,英特尔则在FPGA上依然在宣讲先进工艺的重要性,14nm的FPGA产品和10nm的FPGA产品计划都公诸于世。不过需要注意的是,现在FPGA依然是一个小市场,结合中国报告网的数据来看,2017年全球FPGA市场份额只有67.5亿美元,放到4204亿美元的半导体市场里,规模太小了。如果是一家仅有FPGA产品的公司,吃掉整个市场后相对于英特尔来说也不够大。
FPGA被誉为“万能芯片”,能量就只有这么一点?当然不是的。目前FPGA在数据中心领域已经得到认可,采用FPGA的加速卡解决方案成为数据中心的首选。而人工智能通过深度学习算法在认知智能和推理智能上遇到难题,擅长推理的FPGA被寄予厚望。赛灵思如何借助这一历史性的机遇实现跳跃性发展呢?答案在10月16日的2018赛灵思XDF(赛灵思开发者)大会上揭晓了。
数据中心优先
目前,各行各业的数据在源源不断产生,数据中心需要越来越多的存储设备承载数据,同时也要通过大量计算将无序的数据加以提取,形成有用信息,从而服务于人们的生活。面对海量的数据分析,只凭借CPU来进行大数据计算远远无法满足需求,因此设计人员想到为数据中心加速。而可供选择的加速方案有两个,一个是专用的ASIC,一个是FPGA。FPGA相比其他芯片,最大的优点表现在低延迟性、可编程性、低功耗,这是数据中心服务器的刚需。
数据中心是FPGA继通信领域后又一大杀手级应用领域。在数据中心解决方案上,FPGA不再仅仅是FPGA,而是加速卡中的加速解决方案。
在英特尔10nm“难产”的关键时间节点上,赛灵思的产品走到了前面。开发者大会上,赛灵思总裁及首席执行官Victor Peng宣布赛灵思将进行战略转型,转型之后将采取数据中心优先战略。伴随而来的还有一个重磅的新品——Versal ACAP。
赛灵思总裁及首席执行官Victor Peng
为什么叫ACAP?Victor Peng解释说:“ACAP是可扩展的一体化程度非常高的计算平台,硬件和软件都是可编程,所以缩写为ACAP。”
从介绍材料了解到,Versal 产品组合基于台积电(TSMC)的 7 nm FinFET 工艺技术,是第一个将软件可编程性与特定领域硬件加速和灵活应变能力相结合的平台。该产品组合包括 6 个系列的器件,其独特架构针对云端、网络、无线通信乃至边缘计算和端点等不同市场的众多应用提供了可扩展性和 AI 推断功能。
Versal系列产品将于 2019 年下半年上市。有了Versal 系列产品,赛灵思在产品工艺和性能上同时实现了超越,无论英特尔如何称赞自己的10nm工艺,台积电的7nm都更被认可,何况英特尔10nm“难产”了。
除了基于台积电先进的7nm工艺打造的Versal ACAP,显示赛灵思产品改变的还有一款已经量产的产品——Alveo。Victor Peng通过三点解读了这款加速卡的特殊性,第一是速度快;第二是架构和算法灵活多变;第三是容易访问、易于使用。
对英特尔产生威胁的除了产品之外还有产品背后的平台和生态。在开发者大会上,Victor Peng表示,赛灵思已经不再是一家FPGA企业,而是一家平台公司,并且要超越FPGA来开发整个平台。Alveo有一个很广泛的生产系统和合作伙伴ISA,包括数据库的加速、数据分析,视频处理、金融服务、机器学习,已经有14个应用合作伙伴为Alveo平台开发。
此外,在会上开发者们也看到了华为、浪潮基于赛灵思的FPGA打造自己的加速卡产品。
FPGA在人工智能推理上的“天赋异禀”
赛灵思实现跳跃式发展还有一个机会是人工智能。分析师们认为FPGA是人工智能推理时代的“GPU”,背后的巨头公司将成为下一个英伟达。赛灵思软件及IP产品执行副总裁Salil Raje指出:“今后AI模型必须应用在云端和边缘的模型上,所以未来的模式更多的是推断,而不是训练。赛灵思关注的就是推断。”
GPU在人工智能的感知智能和认知智能前期获得了巨大的成功,英伟达也借此实现公司股价的水涨船高。随着认知智能的发展和推理智能的到来,GPU数据并行的体系结构出现了弊端,流水线并行的FPGA拥有更低的延迟特性。Salil Raje提到:“对CPU和GPU而言,内存的带宽非常关键,内存就是一个瓶颈,对于大的结果来说,希望能够一次上载和下载。CPU和GPU通过批量可以做高吞吐量或者是低延迟,但是没有办法两者兼顾。FPGA获得高通量的方式是通过自定义数据流、自定义内存层次结构和自定义精度来实现,所以有高吞吐量,同时还可以实现低延迟。”
同时实现高数据吞吐量和低时延,加上FPGA现场可编程的特性,其在人工智能推理阶段的前途被广泛看好。
因此,赛灵思将战略中心转移到数据中心业务上,拼的是FPGA的现在,广泛关注人工智能推理则是押注未来。在数据洪流和人工智能推理时代的FPGA是没有人敢小觑的,在FPGA深耕多年的赛灵思也就更无人敢忽视。正如Victor Peng所言:“我们起点很低,只要大家有热情、有准备,而且有非常高远的目标,随着时间的推移,我们就能够实现非常了不起的结果。”
全部0条评论
快来发表一下你的评论吧 !