一种多智能体分层强化学习方法
现有的多智能体强化学习方法不能很好地解决维数灾难问题。本文将融合Option和MAXQ的分层强化学习方法并推广到多智能体领域,形成一种新的多智能体分层强化学习方法,以多出租车问题为任务背景进行了仿真实验,结果表明该方法行之有效。
人工智能 多智能体 机器学习 维数灾难 分层强化
沈晶 程晓北 刘海波 张国印 顾国昌
哈尔滨工程大学计算机科学与技术学院 150001
国内会议
哈尔滨
中文
157-162
2007-11-20(万方平台首次上网日期,不代表论文的发表时间)