会议专题

城市交通信号的在线强化学习控制

城市交通信号控制系统具有非线性、模糊性、自组织性和不确定性等特征,传统的建模和控制方法难以取得理想的效果,人工智能方法提供了解决问题的新途径.针对交通信号控制系统的特点。提出了基于Dyna-Q强化学习的在线控制算法,利用交通信号控制Agent在试错过程中获得的经验知识进行模型估计,然后从估计的模型中规划动作,从而可以加速Q-学习迭代过程.采用TSIS交通分析软件对由8个路口组成的两条交通干线进行仿真,与定时控制、遗传算法和Q-学习控制方法进行比较,结果表明:Dyna-Q强化学习算法具有明显的优越性。

城市交通信号 在线控制系统 交通干线协调控制 强化学习 Dyna-Q算法 智能体

刘智勇 马凤伟

五邑大学304信箱,广东江门529020

国内会议

第26届中国控制会议

湖南张家界

中文

34-37

2007-07-26(万方平台首次上网日期,不代表论文的发表时间)