Agentic AI时代RISC-V迎来了什么机会

描述

近日,业界正在形成一个新共识:当 AI 的重心从大模型训练转向主动式人工智能(Agentic AI),CPU 的角色也从“埋头计算”变成了“指挥调度”。在 Agent = LLM + Harness 的新范式里,GPU 跑大模型,CPU 负责编排工具、读写记忆、执行安全治理。

本文通过在 RISC-V 上运行真实 agent 框架的指令级实测,揭示出一个关键事实:Harness 编排逻辑中整数运算、访存与控制流合计占比超过 99%,浮点运算趋近于零——Agent 需要的是“指挥核”,而非“算力核”。而这,恰好与 RISC-V 精简、开放、自主的设计哲学形成了一场跨越时代的。

01 Build CPU for Agent

近期,COMPUTEX 2026 期间的NVIDIA Keynote上,⻩仁勋抛出了CPU for agent的概念:在过去,CPU是built for human的,Application = Coding + OS。程序员负责写软件代码,操作系统(Operating System) 负责代码在硬件上的运⾏和调度。(1)

但是现在,AI 的重⼼从⼤模型训练和本地推理转向了 Agentic AI,CPU的重要性再次来到台⾯,⼀个新的范式正在 emerging:Agent = LLM + Harness。

LLM 是 Agent 的⼤脑,负责处理 Context、推理、执⾏,同时,还需要⼀套挽具 Harness 去控制它的⾏为:它要调⽤ Tools & Skills(⼯具与技能),要受 Security & Governance(安全与治理)的约束,要和 Memory(内存)反复交互,要靠CPU把这⼀切编排起来。

 

RISC-V

 

图片来源:NVIDIA GTC Taipei 2026主题演讲

在这⼀整套系统⾥⾯,GPU 负责跑 LLM,⽽ CPU 负责orchestration(编排调度),和memory、DPU协同。在 Agent 时代,CPU 从“埋头计算”变成了“指挥调度”,CPU 成了站在指挥台上调动全局的⻆⾊。

这种转变并⾮凭空发⽣,⽽是源于两代 AI 在架构上的根本差异。Chatbot AI 是 Generative AI 的第⼀波浪潮,在"prompt-in-answer-out"的范式下,架构天然是 GPU 主导的。⽽ Agentic AI 不同:它要把⽬标拆成多步,⾃主决定下⼀步做什么,调⽤模型、查询数据库、对接 API、检查权限、读取记忆、校验输出,再循环往复。如此繁复的编排,让它的基础设施需求与上⼀代截然不同。可以预⻅,未来 CPU 与 GPU 的配⽐将持续上升,⽽这恰恰打开了⼀个全新的市场。(2)

当 CPU 被重新推回舞台中央,RISC-V ⼜迎来了什么机会?答案或许要从这套为"⾃由"⽽⽣的指令集本⾝说起。

02 RISC-V 的设计哲学

RISC-V 诞⽣于 UC Berkeley 的并⾏计算实验室(Par Lab),核⼼推动者是 Krste Asanović 教授,以及图灵奖得主、RISC 概念的奠基⼈ David Patterson。他们的出发点是⼀个朴素到近乎理想主义的信念:

开源标准和开源软件,已经⼀次次重塑了整个⾏业——就像 TCP/IP 之于⽹络,Linux 之于操作系统。⽽指令集(ISA)作为软件与硬件之间最重要的那⼀层接⼝,它凭什么应该是 proprietary 的?我们需要⼀个 Free、Open 的 ISA。(3)

在这个背景下,RISC-V 诞⽣了。它采⽤ BSD 许可证,任何⼈——⽆论是⼤学⽣、初创公司还是芯⽚巨头——都能免费使⽤、⾃由实现、随意修改,⽆需向任何⼈⽀付授权费。

但"免费开放"只是它的商业属性。真正让 RISC-V 在 Agent 时代显得特别的,是它的设计哲学。

1. Base-plus-extension:⼩⽽精的技术结构

RISC-V 的基础指令集(base,如 RV64I、RV64E)极其精简:只有⼏⼗条指令,乘除法(M 扩展)、压缩指令(C 扩展)、向量(V 扩展)全都是可选的扩展。它的理念是:基础指令集只放运⾏编译器和操作系统需要的的最⼩集合,其余扩展按需增加。

2. ⾃定义指令:演进⾃由

RISC-V 在编码空间⾥留了官⽅的⾃定义区域,任何⼈都能为⾃⼰的⼯作负载添加专⽤指令。这意味着:当你实测出某个性能热点时,你可以直接为它加⼀条专⽤指令,⽽不必苦等 ISA ⼚商把它放进下⼀代路线图。在⼀个⼯作负载还在剧烈变化的领域,"能⾃⼰改 ISA"是结构性的⾃由。

3. 稳定基线 + 永不强制

RISC-V 的 base ⼀旦冻结就永久稳定、永远向后兼容,⽽扩展则始终保持可选,不会被某个⼚商单⽅⾯"升级成强制"。"该实现什么、不实现什么"的决定权,始终留在做芯⽚的⼈⼿⾥,不会被 ISA ⼚商的路线图绑架。

把这三点合起来,RISC-V 的哲学可以概括为:技术上精简、演进上⾃由、治理上⾃主。

那么,当 Agent ⼯作负载重新把 CPU 推回舞台中央时,这套为“⾃由”⽽⽣的哲学,会不会获得新的意义?

03 Agent 时代的 RISC-V CPU

和传统应⽤不同,Agent 对 CPU 提出了另⼀套更偏向调度与协同的要求:它需要更敏捷的调度,它没有耐⼼、对延迟极度敏感,⽽它所处的时代⼜太新,连性能瓶颈都还没定型。(4)这三点,恰好对应 RISC-V 的三个特质。

"指挥核",⽽⾮"算⼒核"

Agent = LLM + Harness 的体系⾥,算⼒的重活交给了 GPU,CPU 负责的是编排调度、调⽤⼯具、读写记忆、执⾏安全检查,这些都是控制流密集的⼯作。

为了验证这⼀点,我们做了⼀个实测。在 QEMU 模拟的 RISC-V 64 位环境中运⾏主流 agent 框架 smolagents,接⼊真实的 Claude 模型作为⼤脑,让 agent 完成⼀个贴近⽇常的多步任务:分析⼀份个⼈消费流⽔(数百笔记录),找出钱花在了哪、哪类开销最⾼、与上⽉相⽐有何变化,并给出省钱建议。这类任务恰好体现了 agent 的价值——消费数据是⽤户私有的,模型本⾝⽆从知晓,必须依靠Harness 反复调⽤⼯具去查询、统计、对⽐,才能完成。Agent 为此真实地进⾏了多轮"思考 → 调⽤⼯具 → 观察结果 → 再决策"的循环。

我们⽤⾃研的指令级插桩⼯具,对 Harness 在 RISC-V 上执⾏的全部指令按类型分类计数,并通过基线差分剥离了解释器启动等固定开销,得到 Harness 编排逻辑本⾝的指令构成:

 

RISC-V

 

Smolagents 多步任务 profiling 演示

在 Harness 执⾏的全部指令⾥,整数运算、访存和控制流三者合计超过 99%——它们对应的正是地址计算、读写记忆、分⽀判断与⼯具调度这些"指挥"动作。代表纯算⼒的浮点运算,占⽐只有万分之⼀量级,⼏乎可以忽略。这说明 Agent Harness 更接近⼀种控制平⾯(Control Plane)负载,⽽⾮传统意义上的计算密集型负载。对于这类⼯作负载,CPU 的价值更多体现在调度效率、访存延迟和控制流处理能⼒上,⽽不是浮点吞吐率。

这与 RISC-V 的设计哲学显得格外契合:设计者可以从⼀个极⼩的基础指令集出发,按需选择扩展,以更细粒度地构建⾯向特定场景的处理器,⽽不必预先接受⼀套固定的功能组合。相⽐已经预先定义好功能组合和演进路径的主流架构,RISC-V 允许设计者从更⼩的基线出发,以更细粒度组合扩展。这种灵活性在需求尚未完全定型的新领域⾥,它提供了更多探索空间。

低延迟的⾃由度

⼈类⽣活在⼀个⽤秒丈量的世界:点⼀下⿏标,等⼏百毫秒出结果,毫⽆感觉;打开⽹⻚,加载两秒也能接受;即便是最顶尖的 FPS 职业选⼿,反应时间也不低于 100 毫秒。但 Agent 不⼀样。它在 observe → reason → act 之间不断⾼速迭代,中途还要反复调⽤⼯具、读写记忆,每⼀次调度的延迟都会被成百上千倍地放⼤。Agent 活在⼀个以纳秒计的世界⾥,它对单线程性能和低延迟的渴求,远超任何⼈类⽤户。

延迟由微架构决定,但 ISA 可以"绊住"或"放开"实现者的⼿脚,这种影响体现在两个层⾯。

⼀是演进⾃由度。早期 RISC(如 MIPS)曾把流⽔线细节(如 branch delay slot)写进指令集,给后续演进留下了包袱;RISC-V 吸取了这⼀教训,让指令集保持得像数学公理⼀样⼲净、正交、不预设流⽔线结构。于是,⽆论实现者想做多激进的流⽔线、分⽀预测还是乱序设计,ISA都不会成为约束。

⼆是解码开销。RISC-V 指令⻓度固定(32 位或 16 位),寻址⽅式也相对简单;相⽐于 x86 的变⻓指令(8 〜 120 位)和复杂的寻址⽅式,RISC-V 的解码难度远低于 CISC,在延迟和功耗上天⽣占据优势。

⼆者⼀前⼀后,共同让 RISC-V 在低延迟这条路上拥有更⼤的施展余地。

⾯向未定型的负载

如果说前两点是“在已知需求上做到刚好”,这⼀点针对的是未知:Agent 时代才刚开始,真正的性能瓶颈在哪⾥还没有定论,⽽且仍在快速变化。

⾯对这种不确定性,RISC-V 的⾃定义指令给出了⼀条独特的路:⼀旦发现稳定且⾼频的性能热点,RISC-V 允许设计者尝试通过专⽤扩展或⾃定义指令进⾏优化,⽽不必等待整个⽣态形成统⼀标准。这种能⼒未必意味着最终⼀定会产⽣成功的扩展,但在⼀个⼯作负载仍快速变化的时代,它为探索提供了额外的可能性。

尾声:属于开放架构的时间窗⼝

Agent 时代真正改变的,或许不只是CPU应该有多快,⽽是“谁来决定 CPU 应该⻓什么样”。

过去⼏⼗年,主流计算平台的演进路径⼤多由少数架构和⽣态主导;⽽ Agentic AI 带来的,是⼀个负载仍在快速变化、最佳实践尚未形成的新阶段。

在这样的阶段⾥,开放架构第⼀次拥有了不同于过去的机会。因为竞争的不只是性能,还有适应变化的速度。

RISC-V 还很年轻,⽣态也仍在成⻓。但它所坚持的那套理念——精简、开放、⾃主——恰好与这个时代的不确定性形成了⼀种有趣的共振。

开放曾赢得网络(TCP/IP)和操作系统(Linux),下一个被开放重塑的,是否会是 Agent 时代的 CPU?

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分