基于卷积神经网络的部分可观测马尔科夫决策过程( POMDP)值迭代算法QMDP-net在无先验知识的情况下具有较好的性能表现,但其存在训练效果不稳定、参数敏感等优化难题。提岀基于循环卷积神经网络的 POMDP值迭代算法 RQMDP-net,使用门控循环单元网络实现值迭代更新,在保留输亼和递归权重矩阵卷积特性的同时增强网络时序处理能力。实验结果表明, RQMDP-net在10×10网格地图规划任务中导航准确率高达98.5%,且在36×36网格地图规划任务中相比QMDP-net最多提升58个百分点,具有更快的网络收敛速度和更强的导航任务规划能力。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !