会议专题

使用直接神经动态规划方法的倒立摆控制

通过直接神经动态规划方法的原理分析,并根据倒立摆的状态变量,构建了评价网络和执行网络。把4个状态变量和执行网络的1个输出作为评价网络的输入,评价网络的输出作为代价(cost)函数的近似,通过最小化该近似值的误差来调整评价网络的权值,再通过调整后的评价网络来影响执行网络的权值调整,使得执行网络的输出产生次优控制信号.2个网络的训练误差函数都使用了Bellman最优原理的思想,其中,评价网络训练实际上包含了一个模型网络,这样就不需要对被控对象建立模型,并简化了结构.对倒立摆控制进行实验仿真,结果表明:响应速度较快,控制效果良好。

神经网络 直接神经动态规划 倒立摆 评价网络 执行网络

叶伟宝 林小峰 宋春宁

广西大学,电气工程学院,广西,南宁,530004

国内会议

2007年中国智能自动化会议

兰州

中文

52-56

2007-08-24(万方平台首次上网日期,不代表论文的发表时间)