服务器系统对RISC架构的追求正在加强。
许多人等了好几年才听到像 Meta 高级工程总监 Prahlad Venkatapuram 这样的人说出本周在 RISC-V 峰会上发表的内容:
“我们已经确定,RISC-V是我们前进道路上所有产品前进的方向。这不仅包括下一代视频转码器,还包括下一代推理加速器和训练芯片。”
他解释说,在过去4年中,他们不仅推出了硬件,而且还通过标准化的基于 RISC 的控制系统为未来的定制 RISC-V 芯片奠定了基础,并使其具有可扩展性,因此,Meta 为所有领域开发的任何 IP 都将适应并轻松连接到 NOC。
换句话说,Meta 有一个模板可以快速将任何此类新芯片投入生产,这对于那些寻求大规模 RISC-V 成功案例的人来说是一件大事。所有这一切都是在高端 GPU 供不应求的时候进行的,而且价格也有所反映。
Venkatapuram 表示,Meta 之所以选择 RISC,是因为需要加速所有“我们在 CPU 上无法完成的关键业务”,以及“服务器上的能效、性能和绝对低延迟”。他补充说,支持不同工作负载的灵活性和架构中的弹性也至关重要。
“无论何时我们设计或部署,都希望它能够存在 3-4 年,因此,必须具有弹性和可编程性——我们希望让软件负责我们如何使用硬件资源。”
他补充说,64 位寻址至关重要,内核中的矢量和 SIMD 功能也是必不可少的,并强调了深度定制的必要性。“很明显,RISC-V可以做所有这些事情;它是开放的,有强大的支持,有多个知识产权提供商,以及我们在过去 4-5 年中看到的不断发展的生态系统。但归根结底,定制是关键。”
仅基于 RISC-V 构建的视频转码硬件 Meta 就为定制部分提供了背景信息。根据 Venkatapuram 的说法,Meta 的可扩展视频处理器 (MSVP) 是 Meta 制作 RISC 之旅的起点,正在制作中,并处理其 Facebook、Messenger 和 Instagram 服务上 100% 的所有视频上传。“我们之前在 CPU 上这样做,但现在已经替换了其中的 85%,所以我们只使用了其中的 15%。”
真实的故事,应该引起处理器界注意的是,Meta 正在跳过无处不在的 GPU,并在 RISC-V 上构建 AI 推理和训练芯片。
目前,RISC-V AI处理器致力于在推理和训练中加速推荐模型。该架构对 8×8 网格的处理元素并不陌生,每个元素托管 2 个 RISC-V 内核(一个标量,一个向量)和一个用于控制的内核。标量和矢量内核与命令处理器同步,命令处理器与 Meta 开发的内置固定函数协同工作。
除此之外,我们所知不多,但我们将寻求更多答案,包括 Meta 对 RISC-V 架构的生产量。
虽然所有这些都是有希望的,但也有一些挑战确实让人不得不停下来,尽管它们似乎并没有削弱Venkatapuram的乐观情绪。
尽管进行了大规模定制,但 Meta 仍然需要从现有的 IP 选项中获得更多。他解释说:“很少有产品能够将自定义指令和资源无缝集成到 RTP、模拟器、软件工具和编译器中。另一个挑战是各个供应商缺乏互操作性,但他没有提供深入的细节。归根结底,我们感觉到挑战并非不可克服。”
最重要的障碍之一是对矩阵扩展的支持,尤其是当 Meta 寻求在 RISC-V 上构建更多生产 AI 工作负载时。他解释说,矩阵数学是人工智能的一个关键组成部分,虽然RISC-V有向量扩展,但矩阵没有标准的扩展。他引用了这方面的工作(许多供应商,包括Stream Computing和T-Head Semi),但最终,无论他们想出什么都应该标准化。
Venkatapuram 强调了更广泛的生态系统支持的重要性,从对所有主要库和工具的支持到硬件生态系统。
RISC-V由于其开放标准性质,有可能吸引更多的第三方工具、软件、外围设备供应商,而不仅仅是专有的ISA,但这种潜力尚未完全实现。
全部0条评论
快来发表一下你的评论吧 !