基于势能场的MAS局部合作Q学习算法
人工智能研究越来越关注基于强化学习的多智能主体系统(MAS)的研究。研究多智能主体学习问题时,可将所有的Agent的联合动作看作一个动作进而应用单Agent Q学习算法。然而,联合动作空间与Agent个数呈现指数关系,使得这种方法几乎不可行。本文提出基于势能的局部合作Q学习算法,即仅仅在确实需要合作的阶段考虑联合动作。而在其他不需要合作的阶段应用单Agent Q学习算法。这种方法不但能保留原有算法解决问题的性能,而且有效地压缩状态-动作空间。
机器学习 人工智能 势能场 合作学习算法
宋楠 赵忠文 刘帅 戴迎春
装备指挥技术学院重点实验室,北京 101400
国内会议
杭州
中文
94-97
2011-08-01(万方平台首次上网日期,不代表论文的发表时间)