会议专题

一种基于划分和集成思想的多智能体强化学习

针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能。

多智能体系统 强化学习 状态空间划分 集成思想 在线学习性能

王云 韩伟

南京财经大学,信息工程学院,江苏,南京,210046

国内会议

第三届江苏计算机大会

南京

中文

59-62

2008-11-14(万方平台首次上网日期,不代表论文的发表时间)