会议专题

一种多智能体分层强化学习方法

现有的多智能体强化学习方法不能很好地解决维数灾难问题。本文将融合Option和MAXQ的分层强化学习方法并推广到多智能体领域,形成一种新的多智能体分层强化学习方法,以多出租车问题为任务背景进行了仿真实验,结果表明该方法行之有效。

人工智能 多智能体 机器学习 维数灾难 分层强化

沈晶 程晓北 刘海波 张国印 顾国昌

哈尔滨工程大学计算机科学与技术学院 150001

国内会议

中国人工智能学会第12届全国学术年会

哈尔滨

中文

157-162

2007-11-20(万方平台首次上网日期,不代表论文的发表时间)