电子说
2108年10月16日,赛灵思开发者大会在北京召开,本次大会有近千人参加,为广大软硬件、嵌入式开发者提供了一个面对面交流、学习、分享经验的机会。赛灵思的专家团队以及华为、阿里巴巴、浪潮等数十家国内外领先企业的专家汇聚一堂,与广大开发者共同探讨行业趋势,分享设计经验,展示先进案例。
在本次大会上赛灵思产品与技术市场营销高级总监Kirk Saban与赛灵思软件和IP产品部执行副总裁Salil Raje分别进行精彩主题演讲。
一、颠覆性的创新
Kirk Saban在大会上说道:“现在的世界是一个互联的世界,发展与创新的速度都是非常快的。我们每天都在面对海量的数据,单一的计算架构已经不能应对如此大规模的数据,需要各种各样的计算架构彼此配合。”
如今的开发者结构发生了变化,不单单有硬件开发者,也涌现了很多软件开发者。但是并不是所有的软件开发者都熟悉硬件开发,他们需要有可以使其可以快速上手的平台与工具,也需要相应的能力来优化产品性能并用在不同的工作负载中。
那么如何来解决这个问题呢?过去有三个解决方案:CPU、固定功能的加速器(像ASSP和GPU)与FPGA。但是就如今的技术发展程度来说,这三种解决方案或多或少的都存在不足,不能很好的应对各种各样的问题。
为此,Kirk Saban向大家介绍了ACAP平台与其首款产品Versal。ACAP是可扩展性非常高的、软硬件都可编程的、高度集成的多核异构计算平台。
因为ACAP的出现,未来的计算拉开了序幕,首款ACAP产品Versal应运而生。Versal具有异构处理能力,有多个不同类型的处理引擎,可以应对市场上多样的工作负载。Versal有哪些特点呢?
1、标量处理引擎。Versal有双ARM Cortex-A72应用处理器。嵌入式处理来自于ARM,拥有高性能的同时又支持非常广泛的应用。双ARM Cortex-R5实时处理器,适用于对安全性要求非常高的应用,而且有一些步骤锁定功能可以进行平台管理。
2、灵活应变的硬件引擎。灵活应变的硬件进行重新架构提高计算密度,能够支持客户内存层次结构,比如要求不同的内存层次结构高级机器学习和AI推断部署和实施。
3、智能引擎。
●DSP引擎,DSP的引擎在Versal架构当中能够实现高精度浮点和低时延,主要面向定制化数据路径的粒度控制。
●AI引擎,能够大大提高应用的AI推断能力,专为AI推断和高级信号处理工作负载而优化。
4、集成主机接口。PCIe Gen4x16,集成AXI-DMA。还有实现服务器级CPU,提供无缝加速CCIX。
5、集成各种协议引擎。包括100G多速率以太网,600G以太网和Interlaken,以及600G加密引擎(AES/IPSEC/MACSEC)
6、集成RF信号链。下一代GSPS直接射频采样ADC/DAC,集成DDC/DUC。面向5G和DOCSIS的SD-FEC。
7、可编程的I/O界面。支持传感器的MIPI D-PHY大于3Gb/s;支持NAND和存储级存储器;包括LVDS和通用的I/O。
8、片上网络(NOC)。本质上软件可编程,简单易用;高带宽、低时延;与软实现相比功率效率提升8倍,跨异构引擎仲裁。
9、此外还是可扩展的集成存储器控制器与范围最广泛的收发器。
在赛灵思开发者大会上, 主要两个Versal Prime基础系列与AI Core核心系列。
二、AI加速
在赛灵思开发者大会上,Salil Raje先生进行了主题为“AI加速”的精彩演讲,激情描绘赛灵思灵活应变的新型器件将如何加速当今AI时代各种创新的整体应用,拥抱所有的开发者。
赛灵思软件和IP产品部执行副总裁Salil Raje
Salil Raje谈到AI人工智能有两个阶段,训练和推断。
在训练的阶段要将海量的数据放到模型当中,然后微调模型减少误差。海量的数据在这个阶段是至关重要的,相对而言延迟和功耗在训练阶段不是重要。而在推断过程中,用到数据量比较少,在此阶段延迟是极其关键的,甚至会成为一种制约。这是因为很多推断引擎都是实时响应的,响应速度至关重要,这样一来,功耗在这个阶段也就显得非常重要了。在过去几年全球的关注点都集中在训练上,但是今后AI模型必须应用在云端和边缘的模型上,所以未来的模式更多的将是推断。而赛灵思关注的就是推断。
那么推断这个模式将带来哪些挑战呢?第一是AI创新的速度。第二,低时延、高通量和高性能的要求。第三,低功耗。最后同样是实现整体的应用加速。
那么赛灵思是怎么应对这些挑战的呢?Salil Raje认为只有灵活应变的硬件才能应对推断所面临的挑战,比如赛灵思的FPGA和ACAP。灵活应变的硬件的优势在于:
1、自定义数据流。针对最先进的当前的网络与最先进的技术变化,可以重新实施而不需要重新更换芯片;
2、自定义内存的层次结构。可以用更多的片上内存而不是DDR;
3、改善功耗和时延;
4、自定义精度。可以选择网络最合适的精度。
赛灵思开始创造的一个特定领域架构是DSA,这些DSA在FPGA或者ACAP器件上进行实施和部署,能够在自定义的数据流、自定义的内存层次结构和自定义精度三个维度上进行优化。一旦在ACAP实施就可以将现有的网络转到DSA来实现AI模型。
而赛灵思收购了在DSA方面的领先企业——深鉴科技,深鉴科技有非常独特的技术,可以自定义数据流来适用大家所需要的网络。此外,深鉴科技还有量化的技术,即可以自定义精度也可以重新训练,然后重新获得精度。如Deephi LSTM与XDNN。
人工智能的革命已经开始了,在AI推断面前有很多的机会和挑战。赛灵思的器件包括FPGA、ACAP等能够提供同步AI创新的速度、低时延的最佳性能、最佳功耗效果以及加速整体应用。无论是AI专家还是AI新人,赛灵思都非常期待和大家共同合作,携手并进。
全部0条评论
快来发表一下你的评论吧 !