会议专题

半Markov控制过程在线自适应优化算法

考虑半Markov控制过程核未知情况下的优化问题,提出一种基于强化学习的在线自适应优化算法.运用基于事件的优化方法,通过建立半Markov控制过程事件驱动的随机切换分析模型,利用此模型的动态结构特性,结合在线学习估计梯度与随机逼近改进策略,导出在线自适应优化算法.该算法不依赖于半Markov核的信息,也无需计算相关状态的性能势,且以概率1收敛到全局最优.仿真实验结果验证了算法的有效性.

半Markov控制过程 性能势 梯度估计 随机逼近 自适应 优化算法

江琦 奚宏生 殷保群

中国科学技术大学自动化系,安徽合肥230027

国内会议

第25届中国控制会议

哈尔滨

中文

1056-1061

2006-08-07(万方平台首次上网日期,不代表论文的发表时间)