部分感知马氏决策过程的强化学习方法

摘要：

强化学习是机器学习研究的重要方向之一,它可以通过和环境交互来学习马尔科夫决策过程(MDP)问题中的最优策略。部分感知马尔科夫决策过程(POMDP)模型引入了隐藏状态,是状态不确定情形下顺序任务的通用理论模型。本文介绍了以强化学习技术为基础解决POMDP的主要方法,包括基本原理、特点以及算法。此外,本文还实现了三种主要算法,并以迷宫问题为实验平台,比较了这些算法的性能。

关键词：人工智能机器学习强化学习部分感知马氏决策

作者: 葛屾王巍巍高阳陈世福

作者单位: 南京大学软件新技术国家重点实验室 210093

会议类型: 国内会议

会议名称: 中国人工智能学会第12届全国学术年会

会议地点: 哈尔滨

会议语种:中文

页码: 196-202

在线出版日期: 2007-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

部分感知马氏决策过程的强化学习方法