通信网络
中文摘要: 交通信号控制正从被动控制过渡到主动控制,以引导当前交通流按预期状态运行。一个有效的预测模型对主动交通信号控制至关重要;其中预测什么交通状态,如何高精度预测,以及如何利用预测优化控制策略是主动交通信号控制研究的关键问题。本文使用车辆位置图像描述路口交通状态,同时受基于模型的强化学习方法DreamerV2的启发,引入基于学习的交通世界模型。该世界模型以图像序列描述交通动态,并作为交通环境的抽象替代以生成多步预测样本用于控制策略优化。在执行阶段,优化后的交通信号控制器根据交通状态的抽象表示直接实时输出控制指令,同时世界模型能够预测不同控制行为对未来交通状态的影响。实验结果表明,基于交通世界模型优化的控制策略的性能优于一般基准,并且世界模型实现了基于图像的高精度预测;这些结果显示了世界模型在未来交通信号控制中的应用前景。
关键词: 交通信号控制;交通预测;交通世界模型;强化学习
作者: 戴星原1,2,赵宸1,2,王晓3,吕宜生1,2,林懿伦4,王飞跃1,2
单位: 1中国科学院自动化研究所复杂系统管理与控制国家重点实验室,中国北京市,100190 2中国科学院大学人工智能学院,中国北京市,100049 3安徽大学人工智能学院,中国合肥市,230039 4上海人工智能实验室,中国上海市,200232
本文引用格式: Xingyuan Dai, Chen Zhao, Xiao Wang, Yisheng Lv, Yilun Lin, Fei-Yue Wang, 2022. Image-based traffic signal control via world models. Frontiers of Information Technology & Electronic Engineering, 23(12):1795-1813. https://doi.org/10.1631/FITEE.2200323
本文精要导读:
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !