一个用于自适应感知问题的连续剔除框架AdaSearch,帮助机器人实现高效自适应感知

李倩 发表于 2018-11-18 09:59:49 收藏 已收藏
赞(0) •  评论(0

一个用于自适应感知问题的连续剔除框架AdaSearch,帮助机器人实现高效自适应感知

李倩 发表于 2018-11-18 09:59:49
+关注

对于通常的机器学习问题来说,我们会通过给定的提前收集好的数据来解答。但对于某些任务,我们需要自己去收集数据来解答问题。虽然我们可以集中收集与问题最相关的数据收集,但要确认哪个数据源可以获取有效的测量却十分困难。此外,当我们使用机器人、无人机、卫星等收集数据时,还需要考虑如何结合主体的运动来规划测量问题,这个问题通常被抽象为具象自适应感知问题。

自适应感知在机器人领域有着广泛的研究,包括快速识别污染泄露和放射源、救援搜索等任务。这些任务的关键在于规划出一条感知路径,尽可能快的得到正确的结果。为了进一步提高这一问题的解决效率,伯克利的研究人员以放射源检测问题为例子,利用无人机来进行搜索。这一任务不仅要面临各异的背景噪声、以及建立一个符合统计置信区间的传感器模型。

在这一研究中,研究者提出了一个用于自适应感知问题的连续剔除框架AdaSearch( successive-elimination framework for general adaptive sensing problems)来解决这一问题。它可以清晰的根据放射源的发射率来建立一个置信度区间,并通过这一区间来识别并保留最具可能性的放射源,同时剔除其他点。

搜索与假设测试

机器人研究领域一般将具象搜索问题看做是连续的运动规划问题,机器人必须平衡好探索环境和路径选择效率之间的关系。这使得轨迹优化和探索融合到了同一目标函数中来优化。在这一研究中,伯克利的研究人员将这一问题通过假设检验的方式转换为了一个“序列最佳行动识别的问题”。

通过迭代的收集数据,序列假设可以从多个不同的问题中得到综合结论。那么可以将机器人的搜索测量过程看做是N个测量行为,每个观测都符合不同的但确定的分布。

例如在A/B测试中N=2,两个产品对应着两个测量行为,需要解决的问题是消费者更喜欢哪个产品。为了解决这个问题,我们可以不断的追踪A、B产品受喜好的均值,并不断通过最低/最高置信度边界来更新置信度区间。随着测量数据的增加,我们对于产品的估计就会变得越来越准确。当产品A的上界小于产品B的下界时,我们就可以以很高的概率得出B比A更好的结论。

在环境感知中,每个测量行为对应着利用传感器以特定的方向和位姿读取数据。主体希望得知哪次测量或者哪k次测量是最有意义的观测结果。这时候就可以通过先前的观测结果来确定下一步要怎样走才能获取最多的信息。为了使用精确的统计语言描述搜索问题,研究人员提出了行为置信区间来描述与感知行为相关的观测均值,这就决定了在确定目标被确信地检测到之前需要进行一系列的感知行为。

放射源搜索

这一工作中,研究人员们展示了如何在一个栅格平面环境中搜索一个高强度的放射源。定位这个放射源的困难在于测量面临着背景辐射的干扰。放射信号是通过四旋翼无人机上的传感器进行测量的。这一任务的目标是规划出一条测量线路,把隐藏在背景噪声中的放射源尽可能快的找出来。下面我们就来具体看看AdaSearch是如何工作的。

AdaSearch结合了全局规划和基于假设测试的自适应感知规则来定义飞行轨迹。在首次测量时无人机需要对整个空间进行如下图所示的均匀采样:

在第一次测量后可以通过观测结果来剔除某些点。如果某个点置信区间估计的上界小于最大值置信区间的下界,这在很大概率上意味着它不是期望搜索的射线源,将它剔除。

接下来在剩下的点中进行更为仔细的测量(飞行速度变慢),它们是放射源的可能性更高。

随着这一过程的迭代,放射源可能的位置不断收缩直到只剩下一个点。Ada算法将会返回这个点作为搜索结果。

由于统计学的置信概率保证我们可以在很高精度上确定算法返回的结果的正确性,并可以通过置信区间(例如±σ)的大小来获得固定大小的置信度。

研究人员将这一算法与通用的自适应搜索方法——最大化信息法和朴素搜索法做了比较,在一个64*64m栅格4m分辨率的环境对单一放射源进行搜索下得到了下面的结果。

我们可以从上面左图中看到自适应方法所带来的优势,本文的方法耗时短且置信度更高。Ada方法在全局覆盖的前提下保证了精度和速度。

未来,研究人员希望将这一算法应用于更多领域。Ada算法在收集数据时应对多源噪声环境有着很好的表现,它可以适应不同的噪声模型。在不同的置信区间下计算出可靠的边界将有助于提高测量的精度与效率,更快更准确地搜寻到目标所在的位置。

收藏

相关话题

评论(0)

加载更多评论

分享到

QQ空间 QQ好友 微博
取消