基于北海云计算试验平台的 RISC-V 虚拟化技术探索

嵌入式技术

1411人已加入

描述

当前,RISC-V 芯片在性能和生态方面存在局限,导致高性能计算领域缺乏大规模的云计算和验证环境,上层应用技术方案也有所欠缺。由于缺少大规模应用验证,企业对 RISC-V 的适用业务场景、性能及稳定性存在顾虑,这限制了其在高性能领域的推广。而 RISC-V 虚拟化技术的突破与实践,正从根本上改变这种认知,让行业看到了 RISC-V 从 “潜力” 走向 “实用” 的清晰路径。
 
2025 年 7 月 18 日,在第五届(2025)RISC-V 中国峰会的软件与生态系统分论坛上,中国电信研究院李天正分享了基于北海云计算试验平台的虚拟化技术探索,目标是提供端到端、可规模验证的 RISC-V 云解决方案,并借助电信丰富的业务场景加速技术创新与落地。
 
该平台架构分为三层:​
·底层基于 RISC-V 服务器搭建了超过上千核心的 RISC-V 集群,并集成了 TPU、NPU 和 VPU 等异构硬件。​
·中间层在 RISC-V 服务器上部署了 K8S,以及一套云原生管理服务平台。​
·上层应用层以容器方式部署了 AI、大数据、web 等常用的验证测试。
 
北海云平台已于去年的 RISC-V 中国峰会上联合业界合作伙伴正式推出。以下是北海云计算平台取得的一些成果:​
·RISC-V 视频转码卡 TeleVPU​
针对视频存储和传输成本高的问题,北海平台推出了 RISC-V 视频转码卡 TeleVPU。该设备基于国产 RISC-V 芯片设计,能够保证图像质量的同时大幅降低视频大小,从而降低存储和传输成本。TeleVPU 作为一款 PCIE 设备,可集成于 2U、4U 机架式服务器中,单服务器可插 8 卡,整体存储成本可降低 30% 至 50%。
 
·RISC-V 智算解决方案​
北海平台依托北海云计算试验平台开展了国产 RISC-V AI 卡和大模型的适配和测试工作。除了几款常用的大模型外,平台还适配了电信资源的 TeleChat 大模型。未来,北海平台计划推出集成服务器、国产 AI 卡和大模型应用的整体解决方案,并在电信领域进行应用示范。​

·云计算技术​
北海平台在容器和虚拟化技术方面取得了显著成果。在容器方面,平台通过二进制方式部署了 K8S 集群,并基于 KE 部署了云原生管理平台。用户可以通过前端页面直接构建和运行容器应用,无需学习 K8S 容器技术,降低了使用难度。平台还支持从程序源码和容器镜像进行构建,并提供集群监控、多用户管理和多集群管理等功能。​
 
在虚拟化方面,北海平台自研了 RISC-V 轻量级虚拟机 TeleVM。TeleVM 依赖于 RISC-V 硬件虚拟化,实现了强隔离性,并且只实现了虚拟机的基础功能,资源占用少。经过测试和验证,TeleVM 可降低 90% 的内存消耗,启动时延降低 80%。目前,TeleVM 已获得业界认可,成为软件所虚拟化操作系统的引擎。
 
团队调研了业界常用的虚拟化方案后,选择采用 KubeVirt 方案。KubeVirt 通过扩展 Kubernetes 的功能,使虚拟机能够像容器一样被管理、调度和编排,实现容器和虚拟机的混合部署与管理。KubeVirt 架构包括 virt-controller、virt-api 和 virt-handler 等核心组件。
 
在适配 KubeVirt 的过程中,北海平台首先准备了编译环境,并在 X86 环境上通过交叉编译的方式适配 KubeVirt。平台使用 openEULER 系统替代 CentOS,并对 KubeVirt 源码进行了修改,增加了架构相关代码。最终,北海平台成功在 RISC-V 架构上部署了 KubeVirt,并在超睿科技的板卡上创建了虚拟机。
 
性能测试显示,使用 Qemu+KVM 硬件加速方案的性能损失仅为 6%,而纯软件模拟方案的性能损失约为 85%。
 
展望未来,北海平台将继续优化 RISC-V 版本的 KubeVirt,提高整体稳定性,使其达到商用级别。同时,平台将研究将 GPU、VPU 等设备透传至虚拟机,并在虚拟机中搭建相关服务,针对 AI、视频处理等场景推出完整的 RISC-V 云化解决方案。此外,北海平台计划向业界开放,并联合合作伙伴共建 RISC-V 云计算生态,加速 RISC-V 在云计算场景的落地应用。
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 相关推荐
  • 热点推荐

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分