具身智能正推动机器人从自动化向智能化演进,系统软件作为连接模型、应用与算力的桥梁,成为技术突破的关键。当前主流操作系统缺乏面向具身智能的成熟技术栈,而开源鸿蒙凭借其分布式、异构协同等特性,有望在该领域实现“换道超车”。本次开源鸿蒙领学课堂具身智能专题第一期直播,邀请了开源鸿蒙具身智能PMC(筹)主席、上海交通大学计算机学院副教授古金宇老师,分享具身智能操作系统相关内容,介绍了具身智能操作系统的机遇与挑战、开源鸿蒙具身智能项目情况。
一、开源鸿蒙具身智能PMC愿景:
面向具身智能,开源鸿蒙“换道超车”
无论传统还是新型端侧无人平台,在具身智能技术发展下均呈现新趋势:从自动化到智能化、智能体编程范式、新人机交互范式。开源鸿蒙具身智能PMC将主要聚集于以下几个方面的工作:
● 抢占关键窗口期:开源鸿蒙具身智能PMC可高效协同生态力量,加速开源鸿蒙在具身智能领域的布局与商用落地。
● 系统能力创新:主流操作系统均缺乏成熟的具身智能关键技术栈,开源鸿蒙处于同一起跑线。开源鸿蒙具身智能PMC汇聚产学研资源,可助力快速构建核心能力,抢占标准主导权。
●扩展开源鸿蒙生态:当前具身机器人操作系统多基于Linux碎片化自研,系统能力复用度低。开源鸿蒙作为智能终端底座,天然适配具身场景,通过开源鸿蒙具身智能PMC引领可打造统一具身操作系统平台,降低开发门槛,提升产业整体竞争力。

二、具身智能系统软件面临的六大挑战
● 挑战1:具身智能机器人任务实时性
机器人功能安全依赖系统实时性,但传统实时性技术围绕CPU设计。具身智能机器人使用AI算力/异构算力,需构建操作系统XPU实时技术。
通过统一任务队列抽象(异构XPU共有抽象)和多级抢占能力模型(L1抢占未加载任务、L2抢占未执行任务、L3抢占执行中任务),适配不同XPU硬件抢占能力(时延不同),保障任务实时性。

● 挑战2:具身模型推理性能 vs. 端侧受限算力
端侧算力成本、功耗与性能构成“不可能三角”,制约模型推理效率。系统软件需充分使能端侧算力,通过CPU+NPU+GPU异构协同,根据硬件特性划分计算任务(参数加载、反量化、矩阵运算等),实现流水线并行,提升能效比。

●挑战3:系统软件缺乏对具身智能模型运行特征的感知
视觉-语言模型(VLM)运行时呈现明显阶段特征:Prefill阶段GPU利用率高但时间短,Diffusion阶段利用率低但时间长;相邻时间步图片的KV Cache相似度高达97%以上。基于此可采用异步流水线优化,利用上一帧VLM Prefill的KVCache并行启动Diffusion阶段。实验数据表明,在保持成功率的前提下,端到端推理时延可降低30%(如LibTorch并行模型端到端时延从150.12ms降至106.19ms)。

●挑战4:具身智能模型VLA推理的可靠性问题
当训练集未覆盖特定场景(如抓取物体数量超出范围)时,模型成功率显著下降。操作系统需具备经验管理与异常修复能力,对运行时异常进行干预,提升任务可靠性。

●挑战5:入端、入边还是端云协同?
在工厂、酒店等场景中,多个机器人可共享一个“边缘大脑”,降低单机BOM成本;端侧仅保留轻量级执行单元以延长续航。系统软件需支持端云协同架构,实现资源动态调度,提升运营ROI。

●挑战6:具身智能应用的可解释性与高效开发
端到端模型难以解释,而“智能体+工作流”的混合范式更利于构建泛化易用的开发节点。系统软件需提供可视化“拖拉拽”开发框架,降低开发门槛。

●其他挑战与机会
具身智能仿真:
需构建高保真物理引擎与环境,缩小Sim-to-Real差距,支持大规模并行训练与复杂交互模拟。
具身智能安全:
确保人机协作中的实时风险评估、故障安全机制及伦理法规遵从。
异构模型异构算力适配:
实现端云协同计算、模型压缩加速、统一软件栈与接口标准化,提升跨平台性能。

三、开源鸿蒙具身智能PMC组织结构、成员单位以及技术架构介绍
在组织结构上,开源鸿蒙具身智能PMC下设Arch SIG、Release SIG、ROS Common SIG等14个技术专项组,覆盖架构设计、版本管理、ROS生态移植、具身模型适配、模拟器开发等核心方向。各SIG协同推进从底层算力到上层应用的系统能力构建,为开源鸿蒙在具身智能领域的技术研发与生态落地提供组织保障。

开源鸿蒙具身智能PMC首批共建伙伴由上海交通大学牵头,联合了北京大学、清华大学、中科院软件所等国内多所顶尖高校及中科院软件所,并汇聚了华为、智元机器人、Dora社区等在内的科技企业与开源社区,汇聚了多家产学研用成员单位。
在架构规划上,目前已形成了覆盖底层算力到上层应用的系统架构。该架构以开源鸿蒙为底座,整合国产算力(如昇腾)、异构协同框架、模型推理引擎及智能体开发工具,为具身智能系统提供全栈支撑。具体成员单位及架构细节参见社区官方资料。

四、开源鸿蒙具身智能项目介绍
● 项目产出目标
标准/参考平台:
提供开源鸿蒙具身本体+算力+模拟器,开箱即用。
开源系统软件:
打造具身模型端侧推理框架、具身智能体开发框架,补齐传统机器人开发框架生态。
行业示范:
在工业柔性制造、家居服务、智慧农业等领域推动应用落地。

● 核心技术突破
打破垄断,自主可控:
提供业界首个基于国产硬件的端到端方案,终结NVIDIA生态单一依赖,提供高性价比“第二选择”。
攻克“三高”,极致能效:
在国产昇腾端侧算力上实现对标4090的极致性能,证明开源鸿蒙+国产算力是解决高延迟、高功耗、高成本的有效路径。
填补空白,树立标杆:
打造首个支持全栈国产的具身智能标杆系统,填补开源鸿蒙+国产算力在具身领域空白,激活万亿级赛道的底层生态。

● 生态建设进展
目前,开源鸿蒙具身智能PMC成果已支撑华为“RoboMind智能机器人开发者大赛”,推动技术普及。

五、结语
具身智能系统软件正处于发展窗口期,开源鸿蒙凭借其协同优势,有望构建统一的具身操作系统平台,降低产业开发门槛,提升整体竞争力。未来,随着更多产学研力量加入,具身智能将从“作诗做秀”走向创造技术与经济价值。
相关社区代码仓库已在gitcode开放(https://gitcode.com/openharmony-robot),欢迎各界参与共建。
全部0条评论
快来发表一下你的评论吧 !