机器人足球中3打2战术的强化学习
通过对机器人足球中的agent进行强化学习,研究连续性决策问题;介绍了机器人足球竞赛策略的一个子问题3打2战术.然后在这个分布的、实时、局部可观察的及有噪音的领域内,提出一种能够强化学习的思维来进行策略评价和动作选择的方法.实验结果证明,该文提出的自学习的策略明显优于Hand-Coded策略.
3打2战术 强化学习 逼近函数 智能机器人
方宝富 王浩
合肥工业大学计算机与信息学院(安徽合肥)
国内会议
合肥
中文
497-500
2002-09-01(万方平台首次上网日期,不代表论文的发表时间)