会议专题

未知环境中基于概率模型的动态分层强化学习

为解决大规模强化学习中的“维度灾难”问题, 克服以往学习算法的性能高度依赖于先验知识或者探测程度的局限性,本文提出一种未知环境中基于概率模型的动态分层强化学习方法。首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法, 进而通过聚类动态生成若干状态子空间和学习分层结构下的最优策略。仿真结果表明该算法能显著提高复杂环境下智能体的学习效率, 适用于未知环境中的大规模学习。

dynamic hierarchical reinforcement learning Bayesian learning states transition probabilitymodel agent

袁姣红 吴敏

中南大学信息科学与工程学院 长沙 410083

国内会议

湖南省第三届研究生创新论坛——信息与控制工程的新理论和新技术分论坛

长沙

中文

19-26

2010-11-01(万方平台首次上网日期,不代表论文的发表时间)