基于软通天擎Artisan平台实现机器人VLA闭环实践

软通动力 2026-02-26 463

描述

当大模型开始“看懂”图像、理解语言，是否意味着AI已经足够强大？答案显然是否定的。真正决定下一阶段产业格局的，不是模型在屏幕里的推理能力，而是它是否能够走进物理世界，理解环境、规划行动，并稳定、可靠地完成任务——即我们所谓的具身智能。

从“看见世界”到“动手改变世界”，中间跨越的是一整套从算法、数据到硬件系统的工程体系。围绕这一目标，软通天擎构建了覆盖机器人本体、数据平台与算法模型的全栈能力，并以软通天擎ArtisanBrain-X0 为核心小脑模型，推动视觉-语言-动作（VLA）能力的真正落地。

人形机器人

软通天擎全栈能力架构图

从大模型能力走向具身落地：

软通天擎的全栈布局

软通天擎是一家聚焦具身智能的科技企业，致力于成为国内领先的具身智能人形机器人产品与场景应用解决方案提供商。公司以大模型的泛化能力为核心驱动，构建覆盖以下四大方向的全栈技术体系：

具身智能数据采集平台

具身数据模型与算法

机器人操作系统

人形机器人本体硬件与关键部件设计制造

当前，公司聚焦三大主营业务方向：

具身智能数据基础设施解决方案与技术服务

具身智能人形机器人本体及关键部件研发与生产制造（天擎 A/T 系列）

面向工业智造、康养、教育科研等具身智能场景应用解决方案与技术服务

在真实产业推进过程中，软通天擎深刻认识到具身智能的落地并非简单的模型训练问题，而是一个系统工程问题。围绕行业现状，公司总结出四大核心壁垒：

本体硬件稳定性与成本控制难题

高质量真实数据匮乏

采集—训练—推理部署流程割裂

缺乏真正可泛化的具身大模型

针对这些问题，软通天擎打造了“采-训-推”一体化闭环体系，并推出Artisan一站式具身智能开发平台，实现从数据采集到模型部署的全流程打通。

软通天擎认为只有当硬件本体、数据与模型形成统一协同体系，具身智能才能真正实现规模化复制。

ArtisanBrain-X0：

跨本体泛化的小脑核心

具身智能领域长期存在一个关键问题——模型能力被“锁死”在单一本体上。不同机器人结构差异巨大：自由度不同、动力学不同、控制接口不同。这导致每适配一种新本体，都需要重新采集数据、重新训练模型，难以形成数据飞轮。ArtisanBrain-X0 正是在这样的背景下提出跨本体统一建模方案。

1统一动作空间：打破本体差异

传统机器人模型多基于关节空间建模，本体之间难以共享数据。ArtisanBrain-X0 将不同机器人控制信号统一抽象为末端执行器（EE）位姿表示——即三维空间中的位置与姿态变化。这意味着：

• 单臂、双臂、移动底盘系统

• 不同自由度结构

• 不同驱动形式

在模型视角中都使用同一种“动作语言”。这一抽象使模型不再依赖具体关节结构，而直接面向物理世界交互目标进行建模。

2动作Tokenizer：离散化物理行为

连续高维控制轨迹直接建模存在泛化困难，ArtisanBrain-X0 引入分组残差量化（GRVQ）机制，将连续轨迹压缩为离散动作原语 token。这一机制带来三大核心收益：

• 长时序控制更加稳定

• 计算效率显著提升

• 动作知识可迁移共享

模型输出的不再是复杂控制流，而是一组“接近—抓取—放置”等可解释动作词汇序列。

3三层闭环推理：从语言到执行

ArtisanBrain-X0 采用分层决策架构，实现从自然语言到物理控制的闭环：

• 高层：任务理解与语义拆解

• 中层：动作原语生成

• 底层：控制信号解码

通过“语义一致—控制一致—执行一致”的三层对齐机制，模型能够稳定完成复杂任务。在 Libero 仿真评测中，ArtisanBrain-X0 综合成功率达 96.3%，在真实机器人测试中总体成功率达 48.9%，几乎是基线 π0 的 2.5 倍。这意味着跨本体泛化不再停留在理论层面，而是具备真实世界可行性。

采-训-推闭环：

从模型能力到工程体系

模型能力只是第一步，真正决定产业化速度的是是否具备规模化复制能力。软通天擎将 ArtisanBrain 2.0 作为“大脑”基础模型，将 ArtisanBrain-X0 作为“小脑”执行模块，并集成至 ArtisanBrain Platform系统，实现模型训练与部署闭环。

1采：高质量数据资产体系

我们构建“四维融合”采集策略：

• 视觉数据（RGB、深度、点云）

• 控制数据（关节角度、末端位姿、力矩）

• 环境信号

• 仿真合成数据

通过数据治理、版本管理、自动清洗、智能标注和合成，实现高质量数据资产化管理。数据不再是一次性消耗品，而是成为持续驱动模型迭代的核心燃料。

2训：自动化训练与迁移学习

软通天擎ArtisanBrain Training 子系统支持：

• 预训练

• 小样本微调

• 迁移学习

• 多模型适配（支持 ArtisanBrain-X0、π0.5 等）

典型工业场景适配约 48 卡天即可完成训练与部署。通过自动触发训练与双轨验证机制（离线验证+真机验证），确保模型“学得快、用得稳”。

3推：跨芯片部署与实时控制

软通天擎ArtisanBrain Infer 子系统支持：

• 云端部署

• 边缘推理

• 本体侧实时控制

• OTA 升级与生命周期监控

实现模型从云端到真机环境的无缝迁移，这一能力使模型具备持续演进能力。

工业柔性智造实践：

从实验到产线

在工业场景中，基于软通天擎Artisan一站式具身智能开发平台，实现机器人视觉-语言-动作（VLA）的闭环实践。通过VR设备与机器人本体的协同，软通天擎自主研发的天擎A2作业版机器人将进行高精度的动作捕捉与多模态数据采集，重点攻克显卡、鼠标等异形物料的分拣、抓取与装箱放置等核心工序。采集到的海量原始数据通过数据平台进行清洗、标注与合成，转化为高质量、标准化的工业场景数据集，再通过模型训练、推理验证，最终实现机器人全自主无人化作业。

具身智能的竞争，已经从“模型参数规模”转向“工程闭环能力”。从“看见”到“动手”，软通天擎正以 ArtisanBrain-X0 为核心，构建真正可泛化、可部署、可持续进化的视觉-语言-动作（VLA）闭环体系。具身智能的时代已经开启，而我们正在推动它加速到来。

打开APP阅读更多精彩内容