基于强化学习的智能体避障研究
针对智能体避障问题,采用强化学习算法予以解决.首先,介绍强化学习的原理,分析对比了解决强化学习中探索与利用平衡问题的ε-greedy算法和softmax算法;然后,对经典强化学习算法Sarsa算法和Q-Learning算法进行了分析说明,通过对智能体避障问题进行合理地简化与建模,将两种经典强化学习算法用于解决智能体避障问题,使用softmax算法解决探索与利用平衡问题.最后,采用matlab进行仿真,仿真结果表明Sarsa算法和Q-Learning算法都能在有限时间步内解决智能体避障问题,并给出最优解.
智能体 障碍躲避 强化学习算法
应小昆 庞毅 孙青林 陈增强
中国兵器工业新技术推广研究所,北京 100086 南开大学计算机与控制工程学院,天津 300071
国内会议
河南焦作
中文
1-6
2014-07-26(万方平台首次上网日期,不代表论文的发表时间)