会议专题

机器人足球中3打2战术的强化学习

通过对机器人足球中的agent进行强化学习,研究连续性决策问题;介绍了机器人足球竞赛策略的一个子问题3打2战术.然后在这个分布的、实时、局部可观察的及有噪音的领域内,提出一种能够强化学习的思维来进行策略评价和动作选择的方法.实验结果证明,该文提出的自学习的策略明显优于Hand-Coded策略.

3打2战术 强化学习 逼近函数 智能机器人

方宝富 王浩

合肥工业大学计算机与信息学院(安徽合肥)

国内会议

2002年合肥工业大学研究生学术交流年会

合肥

中文

497-500

2002-09-01(万方平台首次上网日期,不代表论文的发表时间)