作者:Arm 云 AI 事业部行业市场高级总监 Dilip Ramachandran
在代理式系统蓬勃发展的趋势下,人工智能 (AI) 重心正从模型训练转向推理,数据中心行业迈入全新的增长阶段。其挑战不再局限于理论性能,而是如何在混合部署环境中,高效扩展并编排始终在线的分布式 AI 工作负载。
代理式 AI 系统需要持续运行,以协调各项任务、与数据流水线交互并实时做出决策。这一演进对基础设施提出更严苛的需求,要求其能实现更优的能效、更大的计算密度,以及跨技术栈的无缝编排能力。
面向大规模 AI 的全栈式方案
Arm 携手红帽打造深度集成、生产级的 AI 技术栈,共同破解行业现存难题。双方依托Arm AGI CPU 与红帽企业级开源平台,构建统一底层架构,支撑云端及本地数据中心顺畅运行 AI 智能体、云原生工作负载与各类企业级应用。
软件层面,红帽可提供专为 Arm 架构深度优化的全栈企业级平台。基于 Arm 架构的红帽企业 Linux (RHEL) 是一款兼具稳定与安全特性的操作系统,全面兼容现有企业工具、框架及工作流。对于采用混合云架构的企业,该系统可确保一致的运行时环境,助力工作负载在 Arm 架构云实例与本地基础设施之间无缝迁移。
红帽 OpenShift 进一步拓展了这一能力,使企业能够在 Arm 架构上规模化部署和管理 Kubernetes 集群。AI 智能体、微服务和数据流水线可在统一的云原生平台中进行编排,从而简化跨环境的运维管理。借助红帽 OpenShift 虚拟化对 Arm AGI CPU 的支持,企业可以同时运行虚拟机和容器,实现循序渐进的现代化升级,并在不影响现有工作负载的前提下迁移至 Arm 平台。
红帽 AI 工程副总裁 Steven Huels 表示:“红帽打造企业级开源平台,助力混合云环境创新,并为客户实现从应用层到底层架构的多元选择。Arm 生态持续扩展,让我们得以提供更丰富的行业解决方案;Arm AGI CPU 更将延续这一发展态势,依托红帽安全可靠、开放的技术底座,构筑新一代面向 AI 的基础设施。”
面向 AI 基础设施的定制化芯片
要在不同环境中实现这种一致性与可扩展性,就必须从芯片底层搭建全新技术根基。
该解决方案的核心是 Arm AGI CPU。这是 Arm 于今年三月发布的首款面向数据中心基础设施的系统级芯片 (SoC)。AGI CPU 专为 AI 工作负载量身打造,能够支持从大规模推理与任务编排,到数据库、视频处理以及企业级服务在内的多样化应用场景。
Arm AGI CPU 集成了 136 个 Arm Neoverse V3 核心、96 条 PCIe Gen6 通道,并配备 12 通道 DDR5 内存,最高运行速率可达 8800 MT/s,可为新一代工作负载提供卓越的性能与带宽。
Amazon Graviton、Microsoft Azure Cobalt 以及 Google Axion 等 Arm 架构云平台,已充分展现出能效比和总体拥有成本 (TCO) 的优势。Arm AGI CPU 将这些优势进一步延伸至本地环境,使企业能够将针对云环境优化的 Arm 工作负载引入本地数据中心,同时在不同部署环境之间保持一致性。
为代理式 AI 需求而生
这一点对代理式 AI 发展尤为关键。如今企业不再局限于周期性模型训练,转而搭建始终在线运行系统,这类系统需具备持续推理、实时编排能力,并实现大规模场景下的高效数据传输。
Arm AGI CPU 专为适配此类场景需求设计,300 瓦 TDP 设计,能效表现远超传统 500 瓦级别 x86 处理器。在标准风冷 36 千瓦开放计算项目 (Open Compute Project, OCP) 机架中,单机架可部署约 8,160 个核心,而传统 x86 架构仅能部署 4,352 个核心,同等功耗上限内,计算密度近乎翻倍。
在 OCP 第三代开放机架等液冷环境中,算力规模可进一步扩容,单机架最高可搭载 336 颗 AGI CPU,核心总数可达 45,696,实现计算密度高达五倍的飞跃。
GPU 平台虽在 AI 模型训练领域具备领先优势,而 Arm AGI CPU 则精准攻克数据预处理、任务编排与大规模推理环节的关键瓶颈,全面匹配代理式 AI 系统的核心运行诉求。
成熟的生态体系,已可投入部署
该平台已获得了包括 Supermicro、联想以及永擎电子等在内的广泛的 OEM 与 ODM 合作伙伴生态支持,为企业在基础设施部署与扩展方式上提供了高度灵活性。
Arm 与红帽在数据中心领域拥有长期而稳固的合作基础。伴随 Arm AGI CPU 的推出,双方联手打造出一套高度整合、适配企业级应用的 AI 技术栈,融合经优化的硬件、成熟可靠的软件,以及高效性能,全面满足量产部署需求。
依托这套集成技术栈打造的解决方案,预计将于 2026 年第四季度正式面世,助力企业稳步落地新一代 AI 基础设施。
全部0条评论
快来发表一下你的评论吧 !