NVIDIA 德克萨斯大学,奥斯丁和加州理工学院的研究人员开发了一种简单、高效、即插即用的不确定性量化方法,用于六自由度(自由度)物体姿态估计任务,使用 K 预先训练的估计器与不同的体系结构和/或训练数据源的集合。
研究人员在 2021 年国际机器人与自动化会议( ICRA 2021 )上发表了他们的论文“ 用于深部目标姿态估计的快速不确定性量化( FastUQ ) ”。
FastUQ 主要研究深部目标姿态估计的不确定性量化问题。在基于深度学习的目标姿态估计中(参见 NVIDIA DOPE ),一个很大的挑战是基于深度学习的姿态估计器 MIG 不能对其姿态预测过于自信。
例如,下面的两个图是操纵任务中来自摄影模型的“番茄酱”对象的姿势估计结果。两个结果都很有把握,但左一个是不正确的。
解决的另一个挑战是 sim2real 缺口。通常,基于深度学习的姿态估计器是从合成数据集(由 NVIDIA 的光线跟踪渲染器 NViSII )中训练出来的,但是我们希望将这些估计器应用于现实世界并量化不确定性。例如,左图来自合成 NViSII 数据集,右图来自真实世界。
在本计画中,我们提出一种基于集合的方法来快速量化基于深度学习的姿态估计器的不确定性。这一想法在下面两幅图中得到了证明,在左边的图中,集合中的深层模型彼此不一致,这意味着更多的不确定性;在右图中,这些模型彼此一致,反映了较少的不确定性。
这项研究绝对是跨学科的,由 NVIDIA 的不同研究团队共同努力解决:
由 Anima Anandkumar 领导的人工智能算法团队和西雅图的 NVIDIA 人工智能机器人研究实验室正在研究不确定性量化方法
Jan Kautz 领导的学习和感知研究团队负责训练深部物体姿态估计模型,并从 NVIDIA 的光线跟踪渲染器 NViSII 提供真实感合成数据
为了训练深度估计和生成高保真的真实感合成数据集,团队使用 NVIDIA V100GPU 和 NVIDIA OptiX ( C ++ / CUDA 后端)进行加速。
FastUQ 是一种新的用于深部目标姿态估计的快速不确定性量化方法,具有高效、即插即用的特点,支持一类通用的姿态估计任务。这项研究在自主驾驶和一般自主性方面具有潜在的重大影响,包括更稳健和安全的感知,以及不确定性感知控制和规划。
关于作者
Yuke Zhu 是 NVIDIA 人工智能算法团队的研究员。他获得了硕士和博士学位。斯坦福大学的学位。他的博士学位。论文围绕闭合感知 - 动作回路,使机器人智能更具普遍性,更适用于控制较少的环境。他的研究处于机器人学、机器学习和计算机视觉的交叉点。他开发了感知和控制的计算方法,产生了智能机器人的行为。通过他的工作,他渴望教会机器人理解周围的视觉世界并与之互动。他的专业知识得到了各种新闻媒体、领先科技机构和奖项机构的关注。他的作品曾多次获得奖项和提名,包括 ICRA 2019 年最佳会议论文奖。他的作品曾被麻省理工学院技术评论和斯坦福新闻等媒体报道。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !