会议专题

基于场景任务划分的多智能体Q-学习研究

从研究分层强化学习入手,提出由MAS中任务结构分析产生的分层合作研究方法,通过区分子任务并以此建立更大粒度层面上的基于任务场景的状态空间,并结合以联合动作为基础的任务动作与势能场模型,从而解决强化学习中的状态空间的维数灾难.文中给出了基于机器人足球的子任务的算法应用,其效能得到实验的验证.

多Agent系统 分层强化学习 Q-学习法 任务场景 状态空间

刘亮 李龙澍

安徽大学,计算智能与信号处理教育部重点实验室,合肥,230039

国内会议

2009年全国理论计算机科学学术年会

哈尔滨

中文

21-24

2009-08-07(万方平台首次上网日期,不代表论文的发表时间)