“AI x开源鸿蒙” 智启新五年：Agent OS从概念走向系统，从系统走向生态，从生态走向真正的产业价值

OpenHarmony TSC 2026-06-08 154

描述

Agent

2026年6月7日，以“智能体操作系统（Agent OS）”为主题的开源鸿蒙城市技术论坛上海站在上海交通大学举行。开源鸿蒙项目群技术指导委员会主席、华为Fellow、基础软件首席科学家陈海波作开场致辞。

陈海波教授在致辞中，以强化学习泰斗Richard Sutton的“大世界假设”以及图灵提出的“机器能思考吗”这一经典命题开场，与来自学术界和产业界的专家们共同探讨了近期Agent业界与学术界的最新动态和关键技术趋势，提出以开源开放的方式共建开源鸿蒙Agent OS的发展新思路；指出开源鸿蒙Agent OS的核心使命是要从工具调用走向系统级智能，为AI概率性构建系统级确定性；提出开源鸿蒙Agent OS要从静态评测走向真实任务检验，从单机智能走向万物智能。他着重分享了开源鸿蒙Agent OS的最近的一系列系统级技术创新实践，并呼吁与会专家共建共赢Agent系统级创新技术与生态。

Agent

陈海波致辞

陈海波教授的致辞稿全文

各位老师、各位同仁、各位朋友：

大家好，很高兴与大家在开源鸿蒙AgentOS城市技术论坛相聚，共同探讨智能体时代的操作系统。

过去一年，智能体发展明显加速。大模型不再只是回答问题的工具，而是逐步具备理解意图、调用工具、组织任务、协同执行和持续改进的能力。智能体正从对话入口走向任务执行，从个人助手走向产业流程，从数字空间走向物理世界。

这带来了一个更根本的问题：当智能体成为未来数字世界的重要执行主体，支撑其运行、协同和治理的底层系统应该是什么？智能体时代是否需要一种新的操作系统？

我认为，Agent OS的出现，不是应用层交互方式的简单升级，也不是把大模型接入现有操作系统，而是一次从“应用逻辑”到“系统逻辑”的架构重构。传统操作系统管理进程、线程、内存、文件和设备；Agent OS则需要进一步管理模型、上下文、工具、记忆、权限、任务流、执行轨迹和多智能体协同。它的核心任务，是把智能体从“能用的工具”变成“可信赖的系统能力”。

在展开三个观点之前，我想先分享一个重要的理论背景。强化学习泰斗Richard Sutton近期提出了“大世界假设”：现实世界的复杂度与体量，远超智能体的计算、存储和内部建模能力。智能体无法在内部完美建模整个世界，必须学会利用环境，在与大世界的持续交互和纠错中自然涌现“行动智慧”——这正是AI从“基于表征的小世界”走向“智能大世界”的必经之路。开源鸿蒙正通过产学研协同创新，让智能体不再只处理世界的“替代物”（如文本、图像），而是直接介入真实的物理与数字环境。

这一思路，其实可以追溯到人工智能的开山之作：图灵在1950年发表的《计算机器与智能》。在这篇划时代论文中，图灵当年就敏锐地意识到：关于“智能”的本质定义可能是一场无休止的概念争论，真正有意义的是“它在行为上是否足以令人信服地参与智能活动”；这实际上是一种“以行动检验智能”的务实立场。

基于对一段时期以来AI Agent发展趋势的观察，以及我和团队的创新实践，我想跟大家分享关于开源鸿蒙Agent OS发展的三个观点：

1.要以开源开放的方式共建开源鸿蒙Agent OS，赋能万物智联世界

如果Agent OS要成为泛在智能时代的基础设施，就不能依赖单一厂商、模型或封闭生态。智能体的运行天然需要连接模型、工具、数据、设备和服务。若这些能力被封装在彼此割裂的系统中，短期可能形成好的单点体验，长期却会制造新的系统孤岛，限制生态扩展与创新。

因此，Agent OS首先需要开放架构。开放不仅是开源代码，更是开放接口、协议、生态和能力边界。模型应可替换，工具应可注册，数据应可安全访问，智能体之间应可协同，开发者应在统一规则下构建系统能力。

大模型可以理解为Agent OS的“大脑”，但这个大脑不能与外部工具、存储、权限、数据流紧耦合，而应通过清晰的系统抽象解耦。只有这样，系统才能支持不同模型、不同应用、不同设备、不同行业的持续接入。

近期大家关注的MCP、A2A、Skill、CLI等协议与抽象，以及OpenClaw 、openJiuwen等开源智能体项目，都反映了这一趋势：智能体系统正从“个体能力”走向“生态能力”。用户可以自由选择模型，在本地保存记忆，在安全隔离环境中运行智能体。这种开放架构，既有利于生态繁荣，也有利于保护用户数据，为个性化智能系统奠定基础。开源鸿蒙也筹建了具身智能PMC和AI Agent TSG/PMC，面向万物智联世界，提供开放架构与生态。

开放不是Agent OS的附加属性，而是它能否成为基础设施的前提。

2. Agent OS的核心使命是要从工具调用走向系统级智能，为AI概率性构建系统级确定性

开放不意味着简单拼接。越开放，越需要强大的系统能力来组织复杂性。

今天的智能体应用已远非“一个模型回答一个问题”。真实任务往往包含多轮交互、多工具调用、多设备协同、多智能体分工和长时间状态维护。差旅规划需调用日历、地图、天气、票务、支付、审批系统；软件开发需理解需求、修改代码、运行测试、分析错误、提交补丁、跟踪反馈；工业运维需融合传感器、知识库、控制系统与现场设备。

这些场景中，真正的难点已不只是模型是否聪明，而是系统能否可靠地组织智能：上下文如何保存与更新？任务如何分解与调度？多智能体如何分工？工具调用如何约束？高危权限如何控制？失败如何回滚？经验如何沉淀与迁移？这些本质上都是系统问题。

这里存在一个根本性挑战：传统操作系统基于还原论与确定性，要求强收敛；大模型却具有天然的概率性。操作系统必须双向演进：既要“被AI重塑”，更要“为AI进化”。开源鸿蒙围绕系统确定性、安全隐私、Token效率等方向创新，其核心逻辑是参考钱学森先生的“系统论”，通过架构重塑在“模型不确定性”上构建“系统级确定性”。

一段时期以来，我和我的团队围绕如何为AI概率性构建系统级确定性进行了一系列的技术探索，希望今天与各位同仁进行深入交流：

1) 系统级确定性：我们提出“概率性规划-约束执行-可验证收敛”范式。运行时创新“AI确定性运行时”，引入“先验证、后提交”及即时回滚；开发层面，SpecFS验证了利用AI构建高精准、高并发、可持续演进的大规模系统软件的新范式。

2) AI安全隐私：提出“以AI治理AI安全”理念，端云协同安全底座、鸿蒙AI防诈（通话/视频/亲情防诈）成为鸿蒙5&6的TOP卖点。FM-Agent实现基于大模型的自然语言霍尔逻辑驱动的大规模形式化验证，已在Claude C Compiler等多个系统中发现1000+bug。

3) Token效率：以智能收益率（Intelligence Yield）为核心度量。端侧通过鸿蒙格物、PowerInfer、SmallThinker、SmartServe等降低内存、提升推理性能；云侧通过异构融合操作系统、BlitzScale、XSched等提升推理效率。

4) 智能体友好API&AI与人共生UX：开源鸿蒙秉承Butler Lampson“接口定义是系统设计之魂”的思想，重新定义智能时代接口原语——从面向人类的“视觉流畅度”转向面向机器的“语义清晰度与结构极简化”，推出Symphony API与Declarative Model Interface (DMI)。同时，SkillVM实现技能“Write Once, Run Anywhere”，跨设备、跨平台无缝迁移。人机共生UX也从“以人为中心”迈向“人机共生”范式，实践了OpenDesk、MobiAgent等技术。

Agent OS的核心不是“把大模型接进操作系统”，而是建立面向智能体的新型系统抽象。传统OS抽象出进程、线程、虚拟内存、文件系统，支撑了软件生态数十年；Agent OS需要抽象出任务、意图、上下文、工具、记忆、权限、轨迹、经验，使智能体在可管理、可观测、可恢复的框架内运行。

一些新框架已经开始从“以应用为中心”转向“以意图和任务为中心”：系统不再等待用户打开应用，而是从意图出发动态调度多个应用、设备和智能体共同完成任务。这意味着，Agent OS不只是应用入口的变化，而是操作系统组织方式的基础性变化。过去，OS管理计算资源；未来，Agent OS还要管理智能资源。过去，OS把硬件抽象给应用；未来，Agent OS要把模型、工具、数据、任务流程抽象给智能体和用户。

因此，Agent OS的技术引领，不能只看模型能力或交互体验，而要看它是否形成了真正的系统级认知抽象与运行机制。

3. Agent OS要从静态评测走向真实任务检验，从单机智能走向万物智能

今天，智能体已有许多评测基准，涵盖软件工程、网页操作、工具调用、问答推理等。这些基准在技术发展早期提供了共同标尺，推动了能力快速提升。我们去年也提出了MobiFlow来从过程而非结果来评估智能体。

但我们也要看到，静态评测与真实业务之间存在显著差距。真实世界的任务不是一次性问答，而是长周期、多步骤、状态连续、成本敏感、权限敏感的复杂过程。智能体系统不仅要偶尔做对，更要长期可靠；不仅要给出正确结果，还要以安全、低成本、可解释、可恢复的方式完成任务。不仅拉高上限，下限也要足够好。

近年研究表明，智能体评测可能存在漏洞——有的智能体通过篡改脚本、利用环境漏洞或偷看答案获取高分。这说明，缺乏严格的沙箱、权限约束和执行轨迹审计，榜单高分并不代表真实能力。我们研制了DeltaBox、virtualized eBPF等系统，提升操作系统Agent沙箱、隔离等基础能力。长周期任务更暴露可靠性问题：即便是能力很强的模型，在连续执行数百天后也可能出现状态漂移、一致性丧失、异常行为。这些问题不会在单轮问答中暴露，却会在真实企业应用中造成严重风险。

因此，评价Agent OS不能只看最终答案是否正确，还要看执行过程是否可信。它需要回答：智能体是否调用了不该调用的权限？是否产生不可接受的成本？能否解释关键决策？异常后能否恢复？多步任务中能否保持状态一致？能否在真实业务环境中长期稳定运行？

这意味着，评估体系需从“结果评测”走向“过程评测”，从“静态基准”走向“动态任务”，从“单点成功率”走向“长期可靠性”。执行轨迹、权限边界、资源消耗、异常恢复、状态一致性、用户可控性，都应成为核心指标。

真正有价值的Agent OS，不是只能在演示中完成漂亮任务，而是能在真实、动态、复杂、充满异常的业务环境中稳定工作——经得起长周期运行、成本核算、安全审计和用户信任。

在这里，我想特别强调，开源鸿蒙已经展示了从单机智能走向万物智能的实践路径。“鸿蒙”之意是“一生万物，万物归一”：“一”作为万物智联的基座，万物在这个“一”上智慧互联。如今，开源鸿蒙不仅用在手机、PC、PAD、穿戴、智能车等消费终端，还广泛应用于金融、能源、工业、交通、航空航天、医疗、教育、政务等关键产业。业界已推出90多个基于开源鸿蒙的行业发行版，超过1800款软硬件产品通过兼容性测评，成为名副其实的万物智联时代千行百业的数字底座。

去年9月开源鸿蒙技术大会上，我们宣布了《开源鸿蒙：智启新五年，共赢新生态》，号召产学研各界参与“AIx开源鸿蒙”的技术与生态共建。如今，众多空调、冰箱、电视、自行车、电动二轮车、地铁、公交等设备，都通过“AI x 开源鸿蒙”实现了万物智能。这些真实场景的大规模部署，也是为Agent OS提供严苛、最有说服力的检验的平台，因为它们不是一次性的演示，而是每天在真实环境、真实负载、真实约束下持续运行的系统。

总结：通过开源鸿蒙Agent OS的发展，推动着智能体技术正从应用创新走向系统创新。

开源鸿蒙Agent OS首先需要开放架构，打破模型、工具、数据、设备之间的生态孤岛；它也需要系统级技术能力，在模型概率性之上建立系统级确定性，把复杂的多智能体协同、上下文管理、权限控制和任务调度组织起来；最终，它必须在真实任务中接受检验，无论是消费终端的日常交互，还是关键产业的万物智联场景，用长期可靠性、安全性和成本效益证明自己的产业价值。

从更长远看，Agent OS可能成为智能时代新的基础软件形态。它既连接模型，也连接应用；既管理资源，也管理任务；既服务个人，也支撑产业；既面向数字世界，也将逐步走向物理世界。

今天这个技术论坛的意义，就在于我们能够在这个方向尚处早期时，汇聚学术界和产业界的力量，共同讨论根本性问题：Agent OS的核心抽象是什么？关键系统机制在哪里？开放生态如何形成？安全边界如何定义？真实任务如何评估？中国在这一轮系统软件创新中，如何形成自己的技术路线和产业优势？

希望今天的讨论能带来新的判断、新的问题、新的合作。期待大家畅所欲言，共同推动开源鸿蒙Agent OS从概念走向系统，从系统走向生态，从生态走向真正的产业价值。

谢谢大家！

Agent

审核编辑黄宇

打开APP阅读更多精彩内容