会议专题

基于目标分解的多Agent协作强化学习方法

本文将单agent Q学习引入到多agent环境,提出了一种多agent协作团队的Q学习方法,即基于承诺和约定先给agent分配求解子目标,然后针对系统求解过程中的相似性,用相似性来减少学习过程的状态空间,并利用Q值共享来实现协作,进而加速多agent的学习,提高求解效率。根据上述思想,我们就猎人捕物问题域(pursuit game)实验了我们的方法,结果表明该方法是完全可行的。

强化学习 agentQ学习 多agent协作团队 猎人捕物问题域 目标分解

尹晓虎 王长缨 姚莉 鲍翊平

国防科技大学管理科学与工程 系信息与决策实验室 长沙 410073

国内会议

中国人工智能学会第10届全国学术年会

广州

中文

464-469

2003-09-21(万方平台首次上网日期,不代表论文的发表时间)