一种基于划分和集成思想的多智能体强化学习

摘要：

针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能。

关键词：多智能体系统强化学习状态空间划分集成思想在线学习性能

作者: 王云韩伟

作者单位: 南京财经大学,信息工程学院,江苏,南京,210046

会议类型: 国内会议

会议地点: 南京

会议语种:中文

页码: 59-62

在线出版日期: 2008-11-14（万方平台首次上网日期，不代表论文的发表时间）

会议专题