Markov控制过程在紧致行动集上的性能优化
文中研究了一类离散时间和连续时间Markov控制过程(MCP)在紧致行动集上,关于平均代价性能准则的优化问题.根据MCP的平均代价Poisson方程和性能势的性质,导出了最优性方程且证明了其解的存在性定理,并讨论了求解ε-最优平稳控制策略的数值迭代和策略迭代算法.
Markov控制过程 紧致行动集 Poisson方程 性能势 控制决策驱动
奚宏生 唐昊 殷保群 周亚平
中国科学技术大学自动化系(合肥)
国内会议
杭州
中文
409-413
2002-08-01(万方平台首次上网日期,不代表论文的发表时间)