一种多智能体分层强化学习方法

摘要：

现有的多智能体强化学习方法不能很好地解决维数灾难问题。本文将融合Option和MAXQ的分层强化学习方法并推广到多智能体领域,形成一种新的多智能体分层强化学习方法,以多出租车问题为任务背景进行了仿真实验,结果表明该方法行之有效。

关键词：人工智能多智能体机器学习维数灾难分层强化

作者: 沈晶程晓北刘海波张国印顾国昌

作者单位: 哈尔滨工程大学计算机科学与技术学院 150001

会议类型: 国内会议

会议地点: 哈尔滨

会议语种:中文

页码: 157-162

在线出版日期: 2007-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题