对于长期依赖 QEMU 模拟进行 RISC-V 软件开发和测试的工程师来说,漫长的等待是日常工作的一部分。随着RISC-V 生态快速扩张,QEMU 的仿真开销已成为 CI/CD 流程的核心瓶颈。
进迭时空(SpacemiT)K3——全球首颗符合 RVA23 规范的 RISC-V 量产芯片,内置 8 个 SpacemiT X100 Core,最高主频 2.4GHz。凭借其强大的真机性能,为开发者提供了一个新的更优选择:直接在 K3 硬件上运行编译任务,效率相比 QEMU 仿真提升 7.6~10倍,以 Linux 内核为例,编译时间从仿真环境下的 3.8 小时缩短至 22 分钟,同时具备真实 RISC-V 环境的验证能力。

01.
为什么真机编译如此重要?
在 GitHub Actions 等主流 CI 平台上,RISC-V 工作流的常见做法是利用 QEMU 进行模拟。这种方案虽然无需自备硬件,但性能代价显著。一个典型的构建任务在 QEMU 环境下的耗时往往是真机的 5 到 10 倍。更关键的是,模拟环境无法真实反映硬件特性——包括缓存行为、内存访问延迟,以及 RVV 向量指令等扩展在真实处理器上的表现。这意味着即使 CI 通过,软件在实际 RISC-V 硬件上仍可能遭遇难以复现的问题。
因此,越来越多的 OS 发行版、基础软件项目开始寻求真机编译与测试的机会。但过去受限于高性能 RISC-V 硬件的匮乏,开发者只能使用仿真或性能有限的开发板。进迭时空 K3 的出现,首次将高性能 RVA23 的 RISC-V 算力带入量产,让真机编译成为可规模化部署的现实。
02.
硬核实测:
K3 真机 vs QEMU,差距到底多大?
使用进迭时空 K3 芯片原生环境与 QEMU 仿真环境进行对比测试,编译三个经典开源项目:Linux 内核 6.18、binutils 2.46 和 sqlite3 3.46。测试采用相同的工具链版本(15.2.0)和并行参数(-j8),以保证测试的公平性。QEMU 宿主机为 Intel Xeon Gold 6548Y+(分配 8 核),K3 真机环境为 8 核 RISC-V 大核 @2.2GHz。

以 Linux kernel 为例,在 K3 真机编译时,相较于 QEMU system-mode,编译时间缩短 90%,实现 10 倍加速;相较于 QEMU user-mode,编译时间缩短 86.8%,实现 7.6 倍加速。
03.
K3 芯片的独特优势:
全球首颗 RISC-V RVA23 量产芯片
进迭时空 K3 之所以能够实现如此卓越的真机编译效率,其根源在于该芯片架构具备前瞻性:
全球首颗符合 RVA23 规范的 RISC-V 量产芯片
RVA23 是 RISC-V 国际基金会最新的应用处理器规范,相较于 RVA22 增加了矢量加密、更高效的原子操作等关键扩展,能够更好地支持现代操作系统和编译器优化。K3 的量产使 RISC-V 量产芯片首次迈入 RVA23 时代,为真机编译提供了最前沿的指令集基础
8 个高性能计算大核 + 8 个 AI 核(共 16 核)
8 个高性能 RISC-V 大核支持乱序执行,主频 2.4 GHz;另 8 个 RISC-V AI 核主要为 AI 推理设计,但在编译场景中同样可以作为通用计算单元参与并行编译任务,支持多个编译任务同时开展,大幅提升吞吐量
基于 K3 芯片,进迭时空联合合作伙伴,推出以下生态硬件,为 RISC-V 软件生态提供硬件基础设施:
K3 Pico-ITX
适用于个人开发者或小团队进行真机编译验证

K3 集群产品
联合 Firefly 团队,推出包括 1U/2U 标准机架式服务器,面向 OS 发行版、基础软件供应商及企业 CI/CD 平台,作为 RISC-V 真机持续集成与测试集群节点

业界首款 RVA23 Profile 量产服务器;
支持高密度部署,原生编译性能相比 X86 QEMU 提升 7 倍以上;
可选配 10/48 个节点,提供强劲算力;
集成 BMC 远程管理系统;
04.
真机编译对 OS 社区和基础软件的实际价值
大幅提升编译效率,缩短迭代周期
以 Linux 内核为例,单次 CI 构建从近 3.8 小时缩短到 22 分钟,对于每天数百次构建的大型社区(如 Debian RISC-V、OpenEuler RISC-V、Fedora RISC-V),服务器占用时间减少 90%,意味着更少的硬件投入和更快的版本发布节奏。
真实硬件环境测试,提前发现仿真无法捕获的问题
QEMU 模拟无法完全复现实体芯片的行为差异——内存顺序模型、原子指令实现、页表行为、时序相关的竞态条件等。在 K3 真机上运行测试,能够提前暴露那些仅在真实硬件上才会触发的 bug,提升软件发布质量。
支持高并发构建,满足大规模持续集成需求
K3 的 16 个核心可同时运行多个编译任务。配合分布式编译工具(distcc、Icecream)和多台 K3 服务器集群,Chromium、LLVM、GCC 等大型软件项目的全量构建时间可从数天压缩至数小时。
全部0条评论
快来发表一下你的评论吧 !