会议专题

基于强化学习的智能体避障研究

针对智能体避障问题,采用强化学习算法予以解决.首先,介绍强化学习的原理,分析对比了解决强化学习中探索与利用平衡问题的ε-greedy算法和softmax算法;然后,对经典强化学习算法Sarsa算法和Q-Learning算法进行了分析说明,通过对智能体避障问题进行合理地简化与建模,将两种经典强化学习算法用于解决智能体避障问题,使用softmax算法解决探索与利用平衡问题.最后,采用matlab进行仿真,仿真结果表明Sarsa算法和Q-Learning算法都能在有限时间步内解决智能体避障问题,并给出最优解.

智能体 障碍躲避 强化学习算法

应小昆 庞毅 孙青林 陈增强

中国兵器工业新技术推广研究所,北京 100086 南开大学计算机与控制工程学院,天津 300071

国内会议

第九届中国多智能体系统与控制会议(MASC2013)

河南焦作

中文

1-6

2014-07-26(万方平台首次上网日期,不代表论文的发表时间)