机器人足球中3打2战术的强化学习

摘要：

通过对机器人足球中的agent进行强化学习,研究连续性决策问题;介绍了机器人足球竞赛策略的一个子问题3打2战术.然后在这个分布的、实时、局部可观察的及有噪音的领域内,提出一种能够强化学习的思维来进行策略评价和动作选择的方法.实验结果证明,该文提出的自学习的策略明显优于Hand-Coded策略.

关键词： 3打2战术强化学习逼近函数智能机器人

作者: 方宝富王浩

作者单位: 合肥工业大学计算机与信息学院(安徽合肥)

会议类型: 国内会议

会议地点: 合肥

会议语种:中文

页码: 497-500

在线出版日期: 2002-09-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题