在中国科学院软件研究所智能软件研究中心与如意 RISC-V 软件生态的持续推动下,国际主流开源科学计算库NumPy正式完成对RISC-V Vector(RVV)向量扩展的优化适配,并在算能第二代服务器级RISC-V处理器SG2044平台上完成了系统性性能验证。在与同等向量宽度的 ARM NEON 平台对比中,SG2044 在多数浮点算子场景下,实现最高23%性能领先。
该成果由标志着NumPy正式融入RISC-V高性能基础软件生态体系,为科学计算、数据分析、机器学习与工程仿真 等关键应用场景提供了坚实的软件基础。
这一进展不仅是RISC-V基础软件生态的重要里程碑,也充分验证了算能SG2044在服务器级高性能向量计算场景下的性能潜力。
本次适配工作的核心在于,在NumPy中引入基于Highway库的RVV向量化支持,打通了从高层NumPy算子到底层RISC-V向量指令的完整优化链路。通过这一方式NumPy在保持跨平台可移植性的同时,能够充分利用RVV的并行计算能力,为数据分析、机器学习、工程仿真等典型科学计算负载提供稳定且可持续的性能提升。这一实践为RISC-V在高性能数值计算领域的规模化应用奠定了关键的软件基础。

1. RVV CPU特性检测先行突破
聚焦NumPy的底层架构支持,率先引入了RISC-V CPU特性检测机制。通过扩展系统配置和构建框架,实现了对RISC-V Vector(RVV)扩展的原生识别与支持,为后续在RISC-V架构上进行SIMD指令级优化奠定了基础。
2. NumPy算子RVV优化
通过深入研究Highway库的函数接口与向量抽象机制,并严格遵循其编程规范,结合支持RVV的CPU硬件环境,成功实现了NumPy算子的向量化加速。该工作不仅验证了Highway在可伸缩向量架构上的适配能力,也为后续在RISC-V平台开展系统性性能优化奠定了关键技术基础。
3. NumPy RVV单元测试模块
在完成NumPy算子的RVV优化后,为确保功能正确性,新增了对CPU调度器工具和硬件特性检测模块的专项单元测试,推动NumPy对RISC-V架构的支持从"能跑"迈向"可靠、可测、可维护"的工程化阶段。
围绕NumPy的底层架构,项目团队对构建系统与CPU特性检测机制进行了系统性完善,使其在RISC-V架构下能够原生识别并启用RVV扩展能力。在算子实现层面,既保证了性能,又兼顾了代码的可维护性与扩展性。同时,对部分底层实现进行了重构,为后续持续优化提供了良好的工程基础。
目前,相关成果已向NumPy上游社区提交19个PR,累计代码改动8689行,完成了逻辑判断、基础数学运算、数学函数、比较操作以及ArgMax / ArgMin等多类核心算子的RVV向量化优化,并同步完善了针对RISC-V平台的单元测试体系。这些工作推动NumPy对RISC-V的支持从“可运行”迈向“可验证、可维护”的工程化阶段,也为后续更多科学计算库在RISC-V平台上的适配提供了可参考的实践路径。

项目团队在多款支持 RVV 1.0 的硬件平台上对优化效果进行了评估。测试结果显示,RVV优化在多类 NumPy 算子上均带来了显著性能提升,尤其是在ArgMax/ ArgMin等典型归约算子中,不同数据类型均实现稳定加速,且数据位宽越小,加速效果越明显。



进一步的对比测试中,算能SG2044(RVV 1.0,128-bit 向量宽度)与 ARM(NEON,128-bit 向量宽度)在相同算子负载下进行了性能对比。结果显示,SG2044在浮点算子场景中表现突出,float32与float64类型在多数测试条件下均实现性能领先,最高提升幅度达到23%,充分体现了RISC-V向量扩展在高精度科学计算和服务器级应用场景中的架构优势。

● 64 核 RISC-V,最高主频 2.6GHz,支持 RVV 1.0 向量扩展
● 片内集成自研 TPU,支持 FP8 / BF16 / FP16 / FP32 等多精度计算
● 128GB LPDDR5X,最高 8533 MT/s,带宽最高 546GB/s
● 40 lane PCIe 5.0,支持高性能外设扩展
● 支持 8K 视频编解码(最高 128 路 1080P 解码 / 64 路编码)
● 支持 AES、SM 系列加密算法与硬件安全模块
● 支持 SV48 大地址空间,满足大规模应用需求

● 基于算能第二代RISC-V服务器级处理器SG2044
● 64核RISC-V核心,支持RVV1.0向量扩展
● 片内融合异构TPU,内置原生FP8算力
● 128GB LPDDR5X统一高速内存
● 支持 4U 8 卡配置,可搭载多张智算加速卡
● 支持 12 块 SAS / SATA 硬盘 + NVMe SSD
● 支持 openEuler / Ubuntu / deepin 等主流操作系统

面向未来,中国科学院软件研究所智能软件研究中心团队将继续围绕NumPy在RISC-V平台上的性能演进开展工作,包括探索基于RISC-V Zfh扩展的16-bit半精度浮点支持,以及进一步挖掘RVV在矩阵运算等更复杂数值计算场景中的优化空间。
算能也将持续携手如意社区与生态伙伴,共同推动RISC-V高性能基础软件生态的完善与成熟,加速RISC-V在服务器与智能计算领域的规模化应用。
全部0条评论
快来发表一下你的评论吧 !