Markov控制过程在紧致行动集上的性能优化

摘要：

文中研究了一类离散时间和连续时间Markov控制过程(MCP)在紧致行动集上,关于平均代价性能准则的优化问题.根据MCP的平均代价Poisson方程和性能势的性质,导出了最优性方程且证明了其解的存在性定理,并讨论了求解ε-最优平稳控制策略的数值迭代和策略迭代算法.

关键词： Markov控制过程紧致行动集 Poisson方程性能势控制决策驱动

作者: 奚宏生唐昊殷保群周亚平

作者单位: 中国科学技术大学自动化系(合肥)

会议类型: 国内会议

会议地点: 杭州

会议语种:中文

页码: 409-413

在线出版日期: 2002-08-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题