会议专题

多智能体合作环境下的分布式强化学习

针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该阶段中引入对环境的适应性因子,当智能体学习的误差小于该值时,智能体达到了对坏境的较高适应度.第二阶段中智能体采用不同的学习率进行交替适应学习,经过智能体间学习率的调整,实现了智能体学习系统中慢者与快者间的适应,最终形成协作直至收敛.与经典算法仿真结果的比较表明了二阶段适应性学习算法的可行性与高效性.

多智能体系统 分布式强化学习算法 计算机仿真 精度控制

傅波 陈鑫 何勇 吴敏

中南大学信息科学与工程学院,先进控制与智能自动化湖南省工程实验室,湖南 长沙 410083

国内会议

第十届中国智能机器人会议

长沙

中文

363-366

2013-11-01(万方平台首次上网日期,不代表论文的发表时间)