会议专题

一种多Agent协作的Q学习算法及其试验研究

鉴于人类组织在协作完成任务时的特点,本文将之应用到MAS中,提出了一种多agent协作的Q学习方法,该方法首先根据agent的特性将整体目标分成多个子目标,使得每个agent各司其职;其次,根据子目标的相似性和agent求解过程的相似性提出了知识共享的学习方法,有效地提高了单agent求解的效率。但是需要注意的是,单agent学习过程中的局部最优解之和并不一定是全局最优解;对agent进行点目标的分配和进行面目标的分配相比哪种分配方法更加有效,是否面目标的分配更具有灵活性?在实际问题中,agent常常只能是部分感知的,那么如何解决由于系统的部分可观测性带来的求解结果的振荡?本文将对此进行进一步的探讨。

多Agent协作 Q学习算法 人工智能

鲍翊平 姚莉 王长缨 尹晓虎

国防科学技术大学管理科学与工程系,长沙,410073

国内会议

第二十一届中国数据库学术会议

厦门

中文

129-131

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)