基于改进PID神经网络的近似动态规划输出反馈控制
近似动态规划(ADP)是一种在线学习算法,通过近似计算代价函数,避免动态规划中的”维数灾”问题。这种方法理论上需要系统全状态反馈才能实现对HJB 方程真实解的逼近,然而实际系统的全部状态通常是难以获取的。本文提出了一种基于改进PID神经网络(ImprovedPID-NN)的直接启发式近似动态规划算法(Direct HDP),以实现输出反馈控制。该神经网络与常规PID神经网络相比,结构简单而具有更好的扩展性。通过对倒立摆系统仿真测试,结果表明该方法可以在部分状态反馈的情况下取得与常规ADP 方法在全状态反馈输入下相似的效果,在适当增加隐层节点的情况下,能获得更好的收敛性。
神经网络 倒立摆控制 近似动态规划 仿真测试
孙健 刘锋 梅生伟
清华大学电机系电力系统国家重点实验室 北京市 100084
国内会议
长沙
中文
1-4
2009-10-01(万方平台首次上网日期,不代表论文的发表时间)