GR00T N1 由 NVIDIA 推出,是全球首个开源且完全可定制的通用人形机器人基础模型。其技术架构受人类认知原理启发,采用双系统协同设计
在 NVIDIA ,我们正在开发 AI 解决方案,使通用人形机器人能够理解人类世界、遵循语言指令并执行各种任务。强大的视觉-语言-作 (VLA) 模型对于此类高级功能至关重要。为此,我们开发了 GR00T N1,这是一种在多样化数据集上训练的通用机器人模型,其中包括以自我为中心的人类视频、真实和模拟的机器人轨迹以及合成数据。
GR00T N1 在多个机器人实施例的仿真基准测试中优于最先进的仿真学习模型。此外,它还展示了在家务中对 Fourier GR-1 和 1X 人形机器人进行有效的语言条件双手作。
为了帮助物理 AI 构建者解决我们社会最关键的问题,我们通过 NVIDIA ISAAC GR00T 提供宽容的许可证,使我们的模型成为轻量级的。
作者
朱玉可
Linxi “Jim” 范
NVIDIA GEAR 团队
出版日期
2025 年 3 月 17 日星期一
论文下载:
*附件:GR00T_1_Whitepaper:GR00T N1 An Open Foundation Model for Generalist.pdf
GR00T N1是全球首款开源人形机器人通用基础模型,其核心架构灵感来源于人类认知的双系统理论:
这种架构通过端到端的单神经网络设计,直接从视觉输入到动作输出,简化了传统机器人控制中的复杂层级结构,提升了执行效率。
GR00T N1的训练数据融合了 真实人类操作视频 、合成数据和 真实机器人遥操作轨迹 ,形成“数据金字塔”:
训练中结合 模仿学习 (从人类视频中提取动作令牌)与 强化学习 (在模拟环境中优化策略),大幅提升模型的泛化能力。测试显示,合成数据与真实数据结合使性能提升40%。
GR00T N1不仅是技术突破,更是行业生态重构的起点。其开源模式将催生更多创新应用,推动人形机器人从实验室走向家庭、工厂和公共服务领域。随着英伟达与DeepMind、迪士尼等巨头的合作深化(如Newton物理引擎项目),通用机器人时代已拉开序幕。开发者、企业及投资者需抓住这一变革机遇,探索AI与物理世界的深度融合。
全部0条评论
快来发表一下你的评论吧 !