会议专题

基于改进PID神经网络的近似动态规划输出反馈控制

近似动态规划(ADP)是一种在线学习算法,通过近似计算代价函数,避免动态规划中的”维数灾”问题。这种方法理论上需要系统全状态反馈才能实现对HJB 方程真实解的逼近,然而实际系统的全部状态通常是难以获取的。本文提出了一种基于改进PID神经网络(ImprovedPID-NN)的直接启发式近似动态规划算法(Direct HDP),以实现输出反馈控制。该神经网络与常规PID神经网络相比,结构简单而具有更好的扩展性。通过对倒立摆系统仿真测试,结果表明该方法可以在部分状态反馈的情况下取得与常规ADP 方法在全状态反馈输入下相似的效果,在适当增加隐层节点的情况下,能获得更好的收敛性。

神经网络 倒立摆控制 近似动态规划 仿真测试

孙健 刘锋 梅生伟

清华大学电机系电力系统国家重点实验室 北京市 100084

国内会议

中国高等学校电力系统及其自动化专业第二十五届学术年会

长沙

中文

1-4

2009-10-01(万方平台首次上网日期,不代表论文的发表时间)