基于任务层次分解的多智能体决策规划
对于较大规模的多智能体决策规划问题,用传统的基于Markov决策过程的方法一般很难解决.本文研究完全分布式控制方式、存在部分感知的条件下智能体的决策规划方法,以达到多智能体协同完成总体任务的目标.基于MAXQ值函数分解方法对问题进行层次分解,设计利用有限感知的多智能体决策框架结构,提出了采用与或图表示可行策略路径并结合Q-learning学习算法在线策略求解的算法.在RoboCup2D平台上对算法的性能进行试验,结果表明该算法在保证实时性的同时,能得到较好的策略.
多智能体 决策规划问题 目标定位 任务层次分解理论
孙清 杨马英 贾玉博
浙江工业大学信息工程学院,浙江杭州310023
国内会议
吉林通化
中文
176-180
2015-06-01(万方平台首次上网日期,不代表论文的发表时间)