赛灵思超越FPGA转型为平台供应商 打造灵活应变的世界

可编程逻辑

1339人已加入

描述

“我在跑马拉松的时候,身心都受到了磨砺。因此我明白了一个道理,想要把一件事做得更好,必须要持续不断地转型。”在近日的赛灵思开发者大会(XDF)上,赛灵思总裁兼首席执行官 Victor Peng 以他35年的长跑经历来形容赛灵思的战略转型。此外,赛灵思还向全球消费者推出了两款重磅转型之作……

超越FPGA转型为平台供应商

“我23岁第一次跑马拉松,当时没有任何准备,我坚持跑完了全程。整个过程非常痛苦,但让我明白了提前做准备的重要性。在今后的35年里,我累计跑了100多场马拉松,最长的一场是10年前参加的,赛程为100英里。“大会一开始,Victor 讲述了他的马拉松经历, “我在跑马拉松的时候,身心都受到了磨砺。同时我也明白了,想要把一件事做得更好,必须要持续不断地转型。”

Victor表示,当今时代的变化呈几何级数发生,FPGA也变得更加复杂和强大。此前,赛灵思的可编程逻辑器件主要应用在原型设计和互联上。而如今,随着FPGA的复杂程度越来越高,赛灵思已经超越了FPGA器件,转变为一家平台提供商。

打造灵活应变、万物智能的世界

数据爆炸的发生,人工智能的兴起,摩尔定律的放缓,颠覆了原有的市场和业务。系统和基础设施在全球迅速扩张,对计算能力和带宽也有了更高的要求。同时,也需要更加迅速地变化来满足不断变化的要求和标准。Victor解释:“就像自然界‘物竞天择,适者生存’自然法则一样,在数字世界,即使是量产型应用,灵活应变的系统也是最具弹性和可持续性的。”

正如Victor所言,“打造灵活应变、万物智能的世界”正是赛灵思的使命,这个使命还将会延续几十年。

为了更好地完成使命,赛灵思制定了新的战略,即:数据中心优先,加速核心市场发展,驱动灵活应变的计算。Victor比喻:“像是一把椅子的三条腿,每一条腿都相互关联,对策略的完整性至关重要。”

基于新使命和新战略,赛灵思推出了全新的产品类别——自适应计算加速平台ACAP。大会上,Victor重点介绍了赛灵思业界首款ACAP平台Versal和AI加速器卡Alveo两款新品。

ACAP:赛灵思转型后的全新类别

Victor揭示,当前的设计周期已经超过了硅片发展周期。即使采用先进的架构,保证迅速流程化,也要花费18-24个月,而市场的变化往往在一夕之间。赛灵思的平台要求既能加速机器学习,又能加速非机器学习部分,并可动态、迅速地完成加速,帮助用户缩短集成人工智能到应用中的时间,提升上市速度。

为了更好地满足用户需求,赛灵思推出了全新的产品类别——ACAP(Adaptive Compute Acceleration Platform)。

ACAP是可扩展、一体化程度非常高的计算平台,其硬、软件都可编程。A指灵活应变。ACAP支持采用任何架构来优化网络、算法和应用,具备低时延,高通量的优势;CA指计算加速。ACAP是多核计算平台,其内部有不同的计算引擎,可扩展性非常强,用户可对它进行定制化的配置;P指平台。数据流动、计算工作等都可在ACAP上来实现,并有更好的安全性和能耗。

在软件层面,ACAP是非常一体化的开发平台,内部含有编译器等,具有高通量、可扩展、低延迟的性能,未来将能应用到任何场景中。

·Versal

VERSAL是行业首款ACAP自适应计算加速平台。据赛灵思产品与技术市场营销高级总监Kirk Saban介绍,VERSAL能够实现异构加速,可用于各种类型的应用,其设计面向所有开发者。Kirk表示,赛灵思有一个全面的工具流,帮助用户充分利用Versal架构在熟悉的环境中进行开发。

Kirk认为,Versal的异构处理能力,由其多个不同类型的处理引擎带来,使得Versal可应对不同的工作负载。Versal的引擎包括标量处理引擎、灵活应变的硬件引擎、智能引擎、高级协议引擎等。

标量处理引擎,有双ARM Cortex-A72应用处理器,能效高且支持广泛的应用。还有双ARM Cortex-R5实时处理器,可满足安全性非常强的应用需。另外,赛灵思还引入了革新性的引擎——平台管理控制器,可对整个器件进行控制,可满足自上而下的设计,实现软件的可编程。

灵活应变的硬件引擎,适用于更高计算密度的再构建基础硬件架构,它支持定制存储器层级,用户可看到不同层次的应用和外部应用,比如高级机器学习和AI推断部署和实施,可提供动态重新配置功能,比之前各大产品快8倍。

智能引擎,其软件可编程,硬件灵活应变。比如DSP引擎,在Versal架构可实现高精度浮点和低时延,面向定制化数据路径的粒度控制。比如AI引擎,具备高吞吐量,低时延和高功效的特性,专为AI推断和高级信号处理工作负载而优化。使用紧密耦合存储器的向量处理器阵列,可直接访问自适应硬件,实现定制存储器层级,其软件可编程。可用在无线的计算,雷达型的应用等。

值得注意的是,赛灵思AI引擎并没有采用深鉴科技的技术。赛灵思软件与AI解决方案产品市场营销与产品规划副总裁Ramine Roane先生在媒体群访中解释,深鉴科技的AI引擎应用范围比较窄,更适用于某些神经网络DNA,而赛灵思希望AI引擎可用于包括AI、DSP还有5G在内的更广泛的领域。

Versal系列共六个产品

Versal产品组合将采用台积电7nm FinFET制程工艺。目前共规划六个系列:AI核心系列,AI Edge系列,AI RF系列,基础系列,旗舰系列以及HBM系列。

其中,AI核心系列和基础系列已经通过早期使试用计划与多家关键客户合作,将于明年下半年上市。基础系列是通用性非常强的产品,可针对包括传统互联应用、加速应用在内的各个市场。AI系列是应用于对性能要求非常高的领域,比如机器学习的推断。

AI Edge系列主要针对自动驾驶、机器人的应用,或者对独立运营要求以及安全性比较高的应用,预计量产的时间为2020年。Versal旗舰版量产时间为2020年,HBM系列可用在高端的数据中心和测试产品中,其量产时间在2021年之后。RF系列可支持5G架构和应用,主要用在一些高性能的应用当中,包括天线的系统等,将于2020年量产。

·Alveo AI加速器卡

除了Versal之外,Alveo也是赛灵思主要介绍的重磅产品。

赛灵思软件和IP产品部执行副总裁Salil Raje先生在演讲中强调了AI加速在人工智能训练和推断阶段的特点。他表示,当前在推断阶段面临创新的速度,低时延的性能,更低的功耗,整体的应用加速等方面的挑战。

另外,Ramine 也明确表示,当前的赛灵思更专注于推断部分的市场。推断市场仍然处于上升期,推断在加速应用这方面处于快速增长阶段,现在正处于从CPU向加速卡转换的阶段,推断的市场未来将比训练市场规模更大。

此背景下,赛灵思Alveo诞生了。Alveo将用来大幅度提升云端和本地数据中心中业界标准服务器的性能。利用 Alveo,客户在运行实时机器学习推断以及视频处理、基因组学、数据分析等关键的数据中心应用时,有望以较低时延实现突破性的性能提升。

据了解,Alveo基于16nm 工艺。目前,Alveo™ U200 和 Alveo U250已经开始接受量产订单,起价为8995 美元。

就机器学习而言,Alveo U250实时推断吞吐量比高端 CPU高出20 倍,相对于高端 GPU等固定功能的加速器,能让 2 毫秒以下的低时延应用性能提升 4 倍以上。此外,Alveo 加速器卡相对于 GPU 能将时延减少 3 倍,在运行实时推断应用时提供显著的性能优势。数据库搜索等一些应用可从根本上得到加速,性能比 CPU 高90 倍以上。

与合作伙伴发布的其他新品

此外,赛灵思还与其芯片合作伙伴进行了合作,并制定了新的标准和方案。比如:赛灵思与华为联合发布FX系列加速卡,具备高带宽、低时延功能,可让FPGA、CPU、GPU交互使用;赛灵思与浪潮联合发布了全球首款集成HBM2的FPGA AI加速卡F37X,该加速卡可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,适用于机器学习推理、视频转码、图像识别、语音识别等应用场景的AI计算加速。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分