AMD 通过第二代 Versal 器件为 AI 驱动型嵌入式系统提供单芯片智能

描述

随着嵌入式 AI、视频和控制应用的爆炸式增长,对异构处理的需求越来越大,以便在狭小的区域和功率限制内加速端到端计算。多芯片处理解决方案具有巨大的功耗、面积和复杂性开销;相反,设计人员需要在单个设备上支持灵活、实时的预处理、高效的 AI 推理和高性能的后处理。

AMD 正在扩展其 Versal™ 产品组合,以满足这一不断变化的需求。AMD Versal AI Edge 系列第 2 代和 AMD Versal Prime 系列第 2 代自适应 SoC 为 AI 驱动型和经典嵌入式系统提供单芯片智能,平衡性能、功耗、面积、功能安全和信息安全功能。

实现 AI 驱动型嵌入式系统的端到端加速

Versal AI Edge 系列 Gen 2 器件通过异构处理器的独特集成实现端到端加速,支持嵌入式计算的所有三个阶段:

预处理:传感器处理、融合和数据调节

AI 推理: 深度学习算法的执行

后处理:决策和结果操作

在预处理过程中,可编程逻辑可提供出色的性能和灵活性,支持自定义传感器组合和低延迟处理管道,有助于缩短系统响应时间。在下一阶段,AI 引擎将通过 Versal AI Edge Series Gen 2 中的 AIE-ML v2 计算平铺架构实现高效的 AI 推理。与第一代 Versal AI Edge 器件中的 AIE-ML 计算瓦架构相比,AIE-ML v2 中的 MX6 数据类型提供的每瓦 TOPS(每秒数万亿次运算)高出 3 倍。[1] 在后处理阶段,AI Edge 系列 Gen 2 设备通过增强的集成 CPU 系统轻松处理复杂的决策和控制算法。与第一代产品相比,Versal AI Edge 系列 Gen 2 和 Versal Prime 系列的标量计算能力提高了 10 倍。[2]

第二代 AI Edge 系列包括一系列器件,使工程师能够轻松实现自动驾驶、传感器融合智能相机和医学成像等应用的性能和安全目标。

 

为经典嵌入式系统释放更高水平的性能

Versal Prime 系列第 2 代器件以最小的占用空间提供极致的性能,具有灵活的实时传感器处理功能,可轻松处理复杂的嵌入式计算工作负载。这些自适应 SoC 将世界一流的可编程逻辑与第一代 Versal Prime 器件的 10 倍标量计算能力相结合[2],提高了经典嵌入式系统(即不需要 AI 的系统)的标准。

Versal Prime 系列第 2 代器件采用用于高吞吐量视频处理(包括 8K 多通道工作流)的全新硬核 IP,是 UHD 流传输和录制、机器人和飞行计算机等应用的理想选择。

40 年来,将出色的自适应解决方案和工具推向市场

选择 AMD Versal ACACIT SoC 后,您将获得广泛的器件组合,并放心地与在嵌入式系统领域拥有 40 年经验的成熟合作伙伴合作,包括服务于高安全性、高可靠性、长生命周期和安全关键型应用的应用。

在设计这些嵌入式系统时,生产力是关键,我们的自适应 SoC 设计工具、库和嵌入式软件生态系统可提高生产力并简化设计周期。这些资源与最新的 Versal 器件相结合,为设计人员和系统架构师提供了他们所需的一切,使他们能够自信地设计、开发和扩展面向当今和未来的嵌入式系统。

借助第二代 AMD Versal ACACIT SoC 实现高级 AI、控制和视频应用

随着 AI 驱动型嵌入式系统和经典嵌入式系统的计算需求不断增长,在单个设备中提供端到端加速势在必行。平衡性能、功耗、面积、功能安全和信息安全特性的自适应解决方案对于满足和超越不断变化的需求至关重要。在 AMD,我们很自豪能够为汽车、工业、视觉、医疗保健、航空航天和国防、广播和专业 AV 市场及其他市场提供下一代解决方案。

了解有关 Versal AI Edge 系列 Gen 2 和 Versal Prime 系列 Gen 2 器件的更多信息。

1. 基于使用 MX6 数据类型的 Versal AI Edge 系列第 2 代 AIE-ML v2 计算块架构的 AMD 内部性能和功耗预测,与使用 INT8 数据类型的第一代 Versal AI Edge 系列中 AIE-ML 计算块架构的性能规格和 AMD Power Design Manager 功耗结果进行比较。假设:2 行 8 列子数组。工作条件:1 GHz Fmax,0.7V AIE 工作电压,100°C 结温,典型过程,60% 矢量负载,激活百分比 = 0 < 10%。当最终产品投放市场时,实际性能会有所不同。截至 2024 年 3 月的业绩预测。(版本 023)

2. 基于对 Versal™ AI Edge 系列第 2 代和 Versal Prime 系列第 2 代处理系统的组合总 DMIP 的流前估计,当配置 8 个 2.2 GHz 的 Arm® Cortex-A78AE® 应用内核和 10 个 1.05 GHz 的 Arm Cortex-R52 实时内核时,与第一代 Versal AI Edge 系列和 Versal Prime 系列的总 DMIP 相比。Versal AI Edge 系列 Gen 2 和 Versal Prime 系列 Gen 2 工作条件:最高可用速度等级、0.88V PS 工作电压、分模工作模式和支持的最大工作频率。第一代 Versal AI Edge 系列和 Versal Prime 系列工作条件:最高可用速度等级、0.88V PS 工作电压和支持的最大工作频率。当最终产品投放市场时,实际 DMIP 的性能会有所不同。(版本 027)

审核编辑 黄宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分