一种基于划分和集成思想的多智能体强化学习
针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能。
多智能体系统 强化学习 状态空间划分 集成思想 在线学习性能
王云 韩伟
南京财经大学,信息工程学院,江苏,南京,210046
国内会议
南京
中文
59-62
2008-11-14(万方平台首次上网日期,不代表论文的发表时间)