“AI x开源鸿蒙” 智启新五年:Agent OS从概念走向系统,从系统走向生态,从生态走向真正的产业价值

描述

Agent

2026年6月7日,以“智能体操作系统(Agent OS)”为主题的开源鸿蒙城市技术论坛上海站在上海交通大学举行。开源鸿蒙项目群技术指导委员会主席、华为Fellow、基础软件首席科学家陈海波作开场致辞。

陈海波教授在致辞中,以强化学习泰斗Richard Sutton的“大世界假设”以及图灵提出的“机器能思考吗”这一经典命题开场,与来自学术界和产业界的专家们共同探讨了近期Agent业界与学术界的最新动态和关键技术趋势,提出以开源开放的方式共建开源鸿蒙Agent OS的发展新思路;指出开源鸿蒙Agent OS的核心使命是要从工具调用走向系统级智能,为AI概率性构建系统级确定性;提出开源鸿蒙Agent OS要从静态评测走向真实任务检验,从单机智能走向万物智能。他着重分享了开源鸿蒙Agent OS的最近的一系列系统级技术创新实践,并呼吁与会专家共建共赢Agent系统级创新技术与生态。

Agent

陈海波致辞

陈海波教授的致辞稿全文

各位老师、各位同仁、各位朋友:

大家好,很高兴与大家在开源鸿蒙AgentOS城市技术论坛相聚,共同探讨智能体时代的操作系统。

过去一年,智能体发展明显加速。大模型不再只是回答问题的工具,而是逐步具备理解意图、调用工具、组织任务、协同执行和持续改进的能力。智能体正从对话入口走向任务执行,从个人助手走向产业流程,从数字空间走向物理世界。

这带来了一个更根本的问题:当智能体成为未来数字世界的重要执行主体,支撑其运行、协同和治理的底层系统应该是什么?智能体时代是否需要一种新的操作系统?

我认为,Agent OS的出现,不是应用层交互方式的简单升级,也不是把大模型接入现有操作系统,而是一次从“应用逻辑”到“系统逻辑”的架构重构。传统操作系统管理进程、线程、内存、文件和设备;Agent OS则需要进一步管理模型、上下文、工具、记忆、权限、任务流、执行轨迹和多智能体协同。它的核心任务,是把智能体从“能用的工具”变成“可信赖的系统能力”。

在展开三个观点之前,我想先分享一个重要的理论背景。强化学习泰斗Richard Sutton近期提出了“大世界假设”:现实世界的复杂度与体量,远超智能体的计算、存储和内部建模能力。智能体无法在内部完美建模整个世界,必须学会利用环境,在与大世界的持续交互和纠错中自然涌现“行动智慧”——这正是AI从“基于表征的小世界”走向“智能大世界”的必经之路。开源鸿蒙正通过产学研协同创新,让智能体不再只处理世界的“替代物”(如文本、图像),而是直接介入真实的物理与数字环境。

这一思路,其实可以追溯到人工智能的开山之作:图灵在1950年发表的《计算机器与智能》。在这篇划时代论文中,图灵当年就敏锐地意识到:关于“智能”的本质定义可能是一场无休止的概念争论,真正有意义的是“它在行为上是否足以令人信服地参与智能活动”;这实际上是一种“以行动检验智能”的务实立场。

基于对一段时期以来AI Agent发展趋势的观察,以及我和团队的创新实践,我想跟大家分享关于开源鸿蒙Agent OS发展的三个观点:

1.要以开源开放的方式共建开源鸿蒙Agent OS,赋能万物智联世界

如果Agent OS要成为泛在智能时代的基础设施,就不能依赖单一厂商、模型或封闭生态。智能体的运行天然需要连接模型、工具、数据、设备和服务。若这些能力被封装在彼此割裂的系统中,短期可能形成好的单点体验,长期却会制造新的系统孤岛,限制生态扩展与创新。

因此,Agent OS首先需要开放架构。开放不仅是开源代码,更是开放接口、协议、生态和能力边界。模型应可替换,工具应可注册,数据应可安全访问,智能体之间应可协同,开发者应在统一规则下构建系统能力。

大模型可以理解为Agent OS的“大脑”,但这个大脑不能与外部工具、存储、权限、数据流紧耦合,而应通过清晰的系统抽象解耦。只有这样,系统才能支持不同模型、不同应用、不同设备、不同行业的持续接入。

近期大家关注的MCP、A2A、Skill、CLI等协议与抽象,以及OpenClaw 、openJiuwen等开源智能体项目,都反映了这一趋势:智能体系统正从“个体能力”走向“生态能力”。用户可以自由选择模型,在本地保存记忆,在安全隔离环境中运行智能体。这种开放架构,既有利于生态繁荣,也有利于保护用户数据,为个性化智能系统奠定基础。开源鸿蒙也筹建了具身智能PMC和AI Agent TSG/PMC,面向万物智联世界,提供开放架构与生态。

开放不是Agent OS的附加属性,而是它能否成为基础设施的前提。

2. Agent OS的核心使命是要从工具调用走向系统级智能,为AI概率性构建系统级确定性

开放不意味着简单拼接。越开放,越需要强大的系统能力来组织复杂性。

今天的智能体应用已远非“一个模型回答一个问题”。真实任务往往包含多轮交互、多工具调用、多设备协同、多智能体分工和长时间状态维护。差旅规划需调用日历、地图、天气、票务、支付、审批系统;软件开发需理解需求、修改代码、运行测试、分析错误、提交补丁、跟踪反馈;工业运维需融合传感器、知识库、控制系统与现场设备。

这些场景中,真正的难点已不只是模型是否聪明,而是系统能否可靠地组织智能:上下文如何保存与更新?任务如何分解与调度?多智能体如何分工?工具调用如何约束?高危权限如何控制?失败如何回滚?经验如何沉淀与迁移?这些本质上都是系统问题。

这里存在一个根本性挑战:传统操作系统基于还原论与确定性,要求强收敛;大模型却具有天然的概率性。操作系统必须双向演进:既要“被AI重塑”,更要“为AI进化”。开源鸿蒙围绕系统确定性、安全隐私、Token效率等方向创新,其核心逻辑是参考钱学森先生的“系统论”,通过架构重塑在“模型不确定性”上构建“系统级确定性”。

一段时期以来,我和我的团队围绕如何为AI概率性构建系统级确定性进行了一系列的技术探索,希望今天与各位同仁进行深入交流:

1) 系统级确定性:我们提出“概率性规划-约束执行-可验证收敛”范式。运行时创新“AI确定性运行时”,引入“先验证、后提交”及即时回滚;开发层面,SpecFS验证了利用AI构建高精准、高并发、可持续演进的大规模系统软件的新范式。

2) AI安全隐私:提出“以AI治理AI安全”理念,端云协同安全底座、鸿蒙AI防诈(通话/视频/亲情防诈)成为鸿蒙5&6的TOP卖点。FM-Agent实现基于大模型的自然语言霍尔逻辑驱动的大规模形式化验证,已在Claude C Compiler等多个系统中发现1000+bug。

3) Token效率:以智能收益率(Intelligence Yield)为核心度量。端侧通过鸿蒙格物、PowerInfer、SmallThinker、SmartServe等降低内存、提升推理性能;云侧通过异构融合操作系统、BlitzScale、XSched等提升推理效率。

4) 智能体友好API&AI与人共生UX:开源鸿蒙秉承Butler Lampson“接口定义是系统设计之魂”的思想,重新定义智能时代接口原语——从面向人类的“视觉流畅度”转向面向机器的“语义清晰度与结构极简化”,推出Symphony API与Declarative Model Interface (DMI)。同时,SkillVM实现技能“Write Once, Run Anywhere”,跨设备、跨平台无缝迁移。人机共生UX也从“以人为中心”迈向“人机共生”范式,实践了OpenDesk、MobiAgent等技术。

Agent OS的核心不是“把大模型接进操作系统”,而是建立面向智能体的新型系统抽象。传统OS抽象出进程、线程、虚拟内存、文件系统,支撑了软件生态数十年;Agent OS需要抽象出任务、意图、上下文、工具、记忆、权限、轨迹、经验,使智能体在可管理、可观测、可恢复的框架内运行。

一些新框架已经开始从“以应用为中心”转向“以意图和任务为中心”:系统不再等待用户打开应用,而是从意图出发动态调度多个应用、设备和智能体共同完成任务。这意味着,Agent OS不只是应用入口的变化,而是操作系统组织方式的基础性变化。过去,OS管理计算资源;未来,Agent OS还要管理智能资源。过去,OS把硬件抽象给应用;未来,Agent OS要把模型、工具、数据、任务流程抽象给智能体和用户。

因此,Agent OS的技术引领,不能只看模型能力或交互体验,而要看它是否形成了真正的系统级认知抽象与运行机制。

3. Agent OS要从静态评测走向真实任务检验,从单机智能走向万物智能

今天,智能体已有许多评测基准,涵盖软件工程、网页操作、工具调用、问答推理等。这些基准在技术发展早期提供了共同标尺,推动了能力快速提升。我们去年也提出了MobiFlow来从过程而非结果来评估智能体。

但我们也要看到,静态评测与真实业务之间存在显著差距。真实世界的任务不是一次性问答,而是长周期、多步骤、状态连续、成本敏感、权限敏感的复杂过程。智能体系统不仅要偶尔做对,更要长期可靠;不仅要给出正确结果,还要以安全、低成本、可解释、可恢复的方式完成任务。不仅拉高上限,下限也要足够好。

近年研究表明,智能体评测可能存在漏洞——有的智能体通过篡改脚本、利用环境漏洞或偷看答案获取高分。这说明,缺乏严格的沙箱、权限约束和执行轨迹审计,榜单高分并不代表真实能力。我们研制了DeltaBox、virtualized eBPF等系统,提升操作系统Agent沙箱、隔离等基础能力。长周期任务更暴露可靠性问题:即便是能力很强的模型,在连续执行数百天后也可能出现状态漂移、一致性丧失、异常行为。这些问题不会在单轮问答中暴露,却会在真实企业应用中造成严重风险。

因此,评价Agent OS不能只看最终答案是否正确,还要看执行过程是否可信。它需要回答:智能体是否调用了不该调用的权限?是否产生不可接受的成本?能否解释关键决策?异常后能否恢复?多步任务中能否保持状态一致?能否在真实业务环境中长期稳定运行?

这意味着,评估体系需从“结果评测”走向“过程评测”,从“静态基准”走向“动态任务”,从“单点成功率”走向“长期可靠性”。执行轨迹、权限边界、资源消耗、异常恢复、状态一致性、用户可控性,都应成为核心指标。

真正有价值的Agent OS,不是只能在演示中完成漂亮任务,而是能在真实、动态、复杂、充满异常的业务环境中稳定工作——经得起长周期运行、成本核算、安全审计和用户信任。

在这里,我想特别强调,开源鸿蒙已经展示了从单机智能走向万物智能的实践路径。“鸿蒙”之意是“一生万物,万物归一”:“一”作为万物智联的基座,万物在这个“一”上智慧互联。如今,开源鸿蒙不仅用在手机、PC、PAD、穿戴、智能车等消费终端,还广泛应用于金融、能源、工业、交通、航空航天、医疗、教育、政务等关键产业。业界已推出90多个基于开源鸿蒙的行业发行版,超过1800款软硬件产品通过兼容性测评,成为名副其实的万物智联时代千行百业的数字底座。

去年9月开源鸿蒙技术大会上,我们宣布了《开源鸿蒙:智启新五年,共赢新生态》,号召产学研各界参与“AIx开源鸿蒙”的技术与生态共建。如今,众多空调、冰箱、电视、自行车、电动二轮车、地铁、公交等设备,都通过“AI x 开源鸿蒙”实现了万物智能。这些真实场景的大规模部署,也是为Agent OS提供严苛、最有说服力的检验的平台,因为它们不是一次性的演示,而是每天在真实环境、真实负载、真实约束下持续运行的系统。

总结:通过开源鸿蒙Agent OS的发展,推动着智能体技术正从应用创新走向系统创新。

开源鸿蒙Agent OS首先需要开放架构,打破模型、工具、数据、设备之间的生态孤岛;它也需要系统级技术能力,在模型概率性之上建立系统级确定性,把复杂的多智能体协同、上下文管理、权限控制和任务调度组织起来;最终,它必须在真实任务中接受检验,无论是消费终端的日常交互,还是关键产业的万物智联场景,用长期可靠性、安全性和成本效益证明自己的产业价值。

从更长远看,Agent OS可能成为智能时代新的基础软件形态。它既连接模型,也连接应用;既管理资源,也管理任务;既服务个人,也支撑产业;既面向数字世界,也将逐步走向物理世界。

今天这个技术论坛的意义,就在于我们能够在这个方向尚处早期时,汇聚学术界和产业界的力量,共同讨论根本性问题:Agent OS的核心抽象是什么?关键系统机制在哪里?开放生态如何形成?安全边界如何定义?真实任务如何评估?中国在这一轮系统软件创新中,如何形成自己的技术路线和产业优势?

希望今天的讨论能带来新的判断、新的问题、新的合作。期待大家畅所欲言,共同推动开源鸿蒙Agent OS从概念走向系统,从系统走向生态,从生态走向真正的产业价值。

谢谢大家!

Agent

审核编辑 黄宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分