Scale-up网络是以推理的大显存并行计算流量和训练的张量并行(TP)以及专家并行(MoE)流量为主,来满足在网计算的加速需求。据相关大模型厂商介绍,对Scale-up网络规模的需求预计在未来2-3年还要扩大2到3倍以上。在MoE模型的驱动下,Scale-up的部署趋势将超出单个服务器机架的范围。
面对其对互联性能的极致追求,目前业内主要采用专门设计的协议比如NVIDIA的NVlink及NVSwitch技术。然而,这些基于私有协议的技术不仅成本高昂,且不对外开放。为了打破这一局面,AI网络产业链在近期共同发起了UALink 加速器互联协议联盟,旨在推动AI网络Scale-up互联的创新技术发展。
奇异摩尔荣幸宣布加入UALink(Ultra Accelerator Link ) 加速器间互联协议联盟,凭借其在互联领域的丰富积累,为GPU卡间的高效互联贡献技术力量,携手生态开启AI网络的新篇章。
关于UALink联盟
Ultra Accelerator Link (UALink) 是一种高速、纵向扩展的加速器互联技术,可提升下一代 AI 网络的性能。UALink 1.0 规范将为 AI Pod 中多达 1024 个加速器的每通道扩展连接实现高达 200Gbps 的扩展连接。该规范于今年向 Contributor 成员开放,并在 2025 年第一季度供一般审查。
UALink主要特点
1通过行业标准协议在加速卡之间实现高效通信
2更灵活地扩大Pod中加速卡的数量
3优化当前和未来计算密集型工作负载所需的性能
4与Scale-out 相关标准兼容如UEC
UALink的开源性质鼓励了AI网络产业链的协同开发模式,摒弃专有系统不仅催生了创新,还加速了技术的广泛采纳与持续优化。 UALink的核心价值不止于作为NVLink的替代选项,它更在于为各类企业,无论是巨头,还是中小型企业,如奇异摩尔般的Chiplet&互联企业可以凭借在互联领域的专长,为联盟的互联技术进步贡献力量,并在这一开放体系中实现技术成果的最大化。
UALink如何在中国市场落地
作为国际互联系统开发标准,UALink在落地过程中需要覆盖多个产业环节,因此成员涵盖了芯片制造商、交换机提供商、服务器提供商等整个产业链的关键角色。然而,由于AI大模型产业在国内具备本土特色,因此UALink如何在中国市顺利落地,也面临着挑战。
为了打造一个原生支持AI场景的Scale-up开放生态系统,阿里云在今年9月倡议并牵头成立了ALS(ALink System,加速器互连系统)开放生态系统,依托于ODCC(开放数据中心委员会),解决Scale-up互连系统的行业发展规范问题。ALS系统生态也是首个兼容UALink的国内生态标准体系。
奇异摩尔作为ALS系统的核心成员之一通过加入ALS与UALink互联系统联盟,有效融合国际标准与国内AI产业链生态,进一步推动产品应用的本土化实施与落地。
UEC与UALink并驾齐驱
AI网络生态的建立正在逐步完善中;UEC超以太联盟即将在2025年第一季度推出1.0标准版本,这与UALink的首个标准版本发布时间相近。这两个联盟虽然各自独立,但成员之间存在着较高的重叠,这为行业内的技术融合和创新提供了良好的基础。
这还意味着生态成员们在Scale-out互联层面可以利用UEC标准成就北向网络更大规模集群的扩展,在Scale-up互联层面可以利用UALink来实现南向网络更高效的GPU加速卡间通信。不谋而合的是,这些生态标准的基础正是以太网。以太网拥有最成熟的生态无论是国际还是国内。
复用以太网生态,与产业链的上下游兼容适配是奇异摩尔正在践行的。正如特斯拉使用了私有的TTPoE协议 ,在保持与标准以太网基础设施兼容的同时实现了片内/片间/网间的统一互联。 AI网络的终点是三网融合,这一愿景的实现,依赖于行业内每一个参与者的共同努力。随着技术标准的逐步成熟,AI网络的新篇章正在缓缓揭开序幕。
关于我们
AI网络全栈式互联架构产品及解决方案提供商
奇异摩尔,成立于2021年初,是一家行业领先的AI网络全栈式互联产品及解决方案提供商。公司依托于先进的高性能RDMA 和Chiplet技术,创新性地构建了统一互联架构——Kiwi Fabric,专为超大规模AI计算平台量身打造,以满足其对高性能互联的严苛需求。
我们的产品线丰富而全面,涵盖了面向不同层次互联需求的关键产品,如面向北向Scale out网络的AI原生智能网卡、面向南向Scale up网络的GPU片间互联芯粒、以及面向芯片内算力扩展的2.5D/3D IO Die和UCIe Die2Die IP等。这些产品共同构成了全链路互联解决方案,为AI计算提供了坚实的支撑。
奇异摩尔的核心团队汇聚了来自全球半导体行业巨头如NXP、Intel、Broadcom等公司的精英,他们凭借丰富的AI互联产品研发和管理经验,致力于推动技术创新和业务发展。团队拥有超过50个高性能网络及Chiplet量产项目的经验,为公司的产品和服务提供了强有力的技术保障。我们的使命是支持一个更具创造力的芯世界,愿景是让计算变得简单。奇异摩尔以创新为驱动力,技术探索新场景,生态构建新的半导体格局,为高性能AI计算奠定稳固的基石。
全部0条评论
快来发表一下你的评论吧 !