Agentic AI时代RISC-V迎来了什么机会

睿思芯科 2026-06-18 128

描述

近日，业界正在形成一个新共识：当 AI 的重心从大模型训练转向主动式人工智能(Agentic AI)，CPU 的角色也从“埋头计算”变成了“指挥调度”。在 Agent = LLM + Harness 的新范式里，GPU 跑大模型，CPU 负责编排工具、读写记忆、执行安全治理。

本文通过在 RISC-V 上运行真实 agent 框架的指令级实测，揭示出一个关键事实：Harness 编排逻辑中整数运算、访存与控制流合计占比超过 99%，浮点运算趋近于零——Agent 需要的是“指挥核”，而非“算力核”。而这，恰好与 RISC-V 精简、开放、自主的设计哲学形成了一场跨越时代的。

01 Build CPU for Agent

近期，COMPUTEX 2026 期间的NVIDIA Keynote上，⻩仁勋抛出了CPU for agent的概念：在过去，CPU是built for human的，Application = Coding + OS。程序员负责写软件代码，操作系统(Operating System) 负责代码在硬件上的运⾏和调度。(1)

但是现在，AI 的重⼼从⼤模型训练和本地推理转向了 Agentic AI，CPU的重要性再次来到台⾯，⼀个新的范式正在 emerging：Agent = LLM + Harness。

LLM 是 Agent 的⼤脑，负责处理 Context、推理、执⾏，同时，还需要⼀套挽具 Harness 去控制它的⾏为：它要调⽤ Tools & Skills(⼯具与技能)，要受 Security & Governance(安全与治理)的约束，要和 Memory(内存)反复交互，要靠CPU把这⼀切编排起来。

RISC-V

图片来源：NVIDIA GTC Taipei 2026主题演讲

在这⼀整套系统⾥⾯，GPU 负责跑 LLM，⽽ CPU 负责orchestration(编排调度)，和memory、DPU协同。在 Agent 时代，CPU 从“埋头计算”变成了“指挥调度”，CPU 成了站在指挥台上调动全局的⻆⾊。

这种转变并⾮凭空发⽣，⽽是源于两代 AI 在架构上的根本差异。Chatbot AI 是 Generative AI 的第⼀波浪潮，在"prompt-in-answer-out"的范式下，架构天然是 GPU 主导的。⽽ Agentic AI 不同：它要把⽬标拆成多步，⾃主决定下⼀步做什么，调⽤模型、查询数据库、对接 API、检查权限、读取记忆、校验输出，再循环往复。如此繁复的编排，让它的基础设施需求与上⼀代截然不同。可以预⻅，未来 CPU 与 GPU 的配⽐将持续上升，⽽这恰恰打开了⼀个全新的市场。(2)

当 CPU 被重新推回舞台中央，RISC-V ⼜迎来了什么机会?答案或许要从这套为"⾃由"⽽⽣的指令集本⾝说起。

02 RISC-V 的设计哲学

RISC-V 诞⽣于 UC Berkeley 的并⾏计算实验室(Par Lab)，核⼼推动者是 Krste Asanović 教授，以及图灵奖得主、RISC 概念的奠基⼈ David Patterson。他们的出发点是⼀个朴素到近乎理想主义的信念:

开源标准和开源软件，已经⼀次次重塑了整个⾏业——就像 TCP/IP 之于⽹络，Linux 之于操作系统。⽽指令集(ISA)作为软件与硬件之间最重要的那⼀层接⼝，它凭什么应该是 proprietary 的?我们需要⼀个 Free、Open 的 ISA。(3)

在这个背景下，RISC-V 诞⽣了。它采⽤ BSD 许可证，任何⼈——⽆论是⼤学⽣、初创公司还是芯⽚巨头——都能免费使⽤、⾃由实现、随意修改，⽆需向任何⼈⽀付授权费。

但"免费开放"只是它的商业属性。真正让 RISC-V 在 Agent 时代显得特别的，是它的设计哲学。

1. Base-plus-extension：⼩⽽精的技术结构

RISC-V 的基础指令集(base，如 RV64I、RV64E)极其精简：只有⼏⼗条指令，乘除法(M 扩展)、压缩指令(C 扩展)、向量(V 扩展)全都是可选的扩展。它的理念是：基础指令集只放运⾏编译器和操作系统需要的的最⼩集合，其余扩展按需增加。

2. ⾃定义指令：演进⾃由

RISC-V 在编码空间⾥留了官⽅的⾃定义区域，任何⼈都能为⾃⼰的⼯作负载添加专⽤指令。这意味着：当你实测出某个性能热点时，你可以直接为它加⼀条专⽤指令，⽽不必苦等 ISA ⼚商把它放进下⼀代路线图。在⼀个⼯作负载还在剧烈变化的领域，"能⾃⼰改 ISA"是结构性的⾃由。

3. 稳定基线 + 永不强制

RISC-V 的 base ⼀旦冻结就永久稳定、永远向后兼容，⽽扩展则始终保持可选，不会被某个⼚商单⽅⾯"升级成强制"。"该实现什么、不实现什么"的决定权，始终留在做芯⽚的⼈⼿⾥，不会被 ISA ⼚商的路线图绑架。

把这三点合起来，RISC-V 的哲学可以概括为：技术上精简、演进上⾃由、治理上⾃主。

那么，当 Agent ⼯作负载重新把 CPU 推回舞台中央时，这套为“⾃由”⽽⽣的哲学，会不会获得新的意义?

03 Agent 时代的 RISC-V CPU

和传统应⽤不同，Agent 对 CPU 提出了另⼀套更偏向调度与协同的要求：它需要更敏捷的调度，它没有耐⼼、对延迟极度敏感，⽽它所处的时代⼜太新，连性能瓶颈都还没定型。(4)这三点，恰好对应 RISC-V 的三个特质。

"指挥核"，⽽⾮"算⼒核"

Agent = LLM + Harness 的体系⾥，算⼒的重活交给了 GPU，CPU 负责的是编排调度、调⽤⼯具、读写记忆、执⾏安全检查，这些都是控制流密集的⼯作。

为了验证这⼀点，我们做了⼀个实测。在 QEMU 模拟的 RISC-V 64 位环境中运⾏主流 agent 框架 smolagents，接⼊真实的 Claude 模型作为⼤脑，让 agent 完成⼀个贴近⽇常的多步任务：分析⼀份个⼈消费流⽔(数百笔记录)，找出钱花在了哪、哪类开销最⾼、与上⽉相⽐有何变化,并给出省钱建议。这类任务恰好体现了 agent 的价值——消费数据是⽤户私有的，模型本⾝⽆从知晓，必须依靠Harness 反复调⽤⼯具去查询、统计、对⽐，才能完成。Agent 为此真实地进⾏了多轮"思考 → 调⽤⼯具 → 观察结果 → 再决策"的循环。

我们⽤⾃研的指令级插桩⼯具，对 Harness 在 RISC-V 上执⾏的全部指令按类型分类计数,并通过基线差分剥离了解释器启动等固定开销，得到 Harness 编排逻辑本⾝的指令构成：

RISC-V

Smolagents 多步任务 profiling 演示

在 Harness 执⾏的全部指令⾥，整数运算、访存和控制流三者合计超过 99%——它们对应的正是地址计算、读写记忆、分⽀判断与⼯具调度这些"指挥"动作。代表纯算⼒的浮点运算，占⽐只有万分之⼀量级，⼏乎可以忽略。这说明 Agent Harness 更接近⼀种控制平⾯(Control Plane)负载，⽽⾮传统意义上的计算密集型负载。对于这类⼯作负载，CPU 的价值更多体现在调度效率、访存延迟和控制流处理能⼒上，⽽不是浮点吞吐率。

这与 RISC-V 的设计哲学显得格外契合：设计者可以从⼀个极⼩的基础指令集出发，按需选择扩展，以更细粒度地构建⾯向特定场景的处理器，⽽不必预先接受⼀套固定的功能组合。相⽐已经预先定义好功能组合和演进路径的主流架构，RISC-V 允许设计者从更⼩的基线出发，以更细粒度组合扩展。这种灵活性在需求尚未完全定型的新领域⾥，它提供了更多探索空间。

低延迟的⾃由度

⼈类⽣活在⼀个⽤秒丈量的世界：点⼀下⿏标，等⼏百毫秒出结果，毫⽆感觉;打开⽹⻚，加载两秒也能接受;即便是最顶尖的 FPS 职业选⼿，反应时间也不低于 100 毫秒。但 Agent 不⼀样。它在 observe → reason → act 之间不断⾼速迭代，中途还要反复调⽤⼯具、读写记忆，每⼀次调度的延迟都会被成百上千倍地放⼤。Agent 活在⼀个以纳秒计的世界⾥，它对单线程性能和低延迟的渴求，远超任何⼈类⽤户。

延迟由微架构决定，但 ISA 可以"绊住"或"放开"实现者的⼿脚，这种影响体现在两个层⾯。

⼀是演进⾃由度。早期 RISC(如 MIPS)曾把流⽔线细节(如 branch delay slot)写进指令集，给后续演进留下了包袱;RISC-V 吸取了这⼀教训，让指令集保持得像数学公理⼀样⼲净、正交、不预设流⽔线结构。于是，⽆论实现者想做多激进的流⽔线、分⽀预测还是乱序设计，ISA都不会成为约束。

⼆是解码开销。RISC-V 指令⻓度固定(32 位或 16 位)，寻址⽅式也相对简单;相⽐于 x86 的变⻓指令(8 〜 120 位)和复杂的寻址⽅式，RISC-V 的解码难度远低于 CISC，在延迟和功耗上天⽣占据优势。

⼆者⼀前⼀后，共同让 RISC-V 在低延迟这条路上拥有更⼤的施展余地。

⾯向未定型的负载

如果说前两点是“在已知需求上做到刚好”,这⼀点针对的是未知：Agent 时代才刚开始，真正的性能瓶颈在哪⾥还没有定论，⽽且仍在快速变化。

⾯对这种不确定性，RISC-V 的⾃定义指令给出了⼀条独特的路：⼀旦发现稳定且⾼频的性能热点，RISC-V 允许设计者尝试通过专⽤扩展或⾃定义指令进⾏优化，⽽不必等待整个⽣态形成统⼀标准。这种能⼒未必意味着最终⼀定会产⽣成功的扩展，但在⼀个⼯作负载仍快速变化的时代，它为探索提供了额外的可能性。

尾声：属于开放架构的时间窗⼝

Agent 时代真正改变的，或许不只是CPU应该有多快，⽽是“谁来决定 CPU 应该⻓什么样”。

过去⼏⼗年，主流计算平台的演进路径⼤多由少数架构和⽣态主导;⽽ Agentic AI 带来的，是⼀个负载仍在快速变化、最佳实践尚未形成的新阶段。

在这样的阶段⾥，开放架构第⼀次拥有了不同于过去的机会。因为竞争的不只是性能，还有适应变化的速度。

RISC-V 还很年轻，⽣态也仍在成⻓。但它所坚持的那套理念——精简、开放、⾃主——恰好与这个时代的不确定性形成了⼀种有趣的共振。

开放曾赢得网络(TCP/IP)和操作系统(Linux)，下一个被开放重塑的，是否会是 Agent 时代的 CPU?

打开APP阅读更多精彩内容