基于强化学习的智能体避障研究

摘要：

针对智能体避障问题,采用强化学习算法予以解决.首先,介绍强化学习的原理,分析对比了解决强化学习中探索与利用平衡问题的ε-greedy算法和softmax算法;然后,对经典强化学习算法Sarsa算法和Q-Learning算法进行了分析说明,通过对智能体避障问题进行合理地简化与建模,将两种经典强化学习算法用于解决智能体避障问题,使用softmax算法解决探索与利用平衡问题.最后,采用matlab进行仿真,仿真结果表明Sarsa算法和Q-Learning算法都能在有限时间步内解决智能体避障问题,并给出最优解.

关键词：智能体障碍躲避强化学习算法

作者: 应小昆庞毅孙青林陈增强

作者单位: 中国兵器工业新技术推广研究所,北京 100086 南开大学计算机与控制工程学院,天津 300071

会议类型: 国内会议

会议名称: 第九届中国多智能体系统与控制会议(MASC2013)

会议地点: 河南焦作

会议语种:中文

页码: 1-6

在线出版日期: 2014-07-26（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于强化学习的智能体避障研究