基于自适应评价设计的一种控制算法
本文主要是研究自适应评价设计(ACD)中的在线学习控制方法,该方法称为执行依赖双启发式动态规划(ADDHP)。阐述了自适应评价设计的原理,构建了一个在线学习控制器,并且详细地介绍了控制算法中有关评价网络和执行网络的学习过程.通过了车载平衡杆的实验, 表明了在线学习控制算法的适用性。
自适应评价 在线学习 动态规划 控制算法 车载平衡杆
林小峰 叶伟宝 宋春宁 宋绍剑
广西大学电气工程学院,南宁530004
国内会议
湖南张家界
中文
716-719
2007-07-26(万方平台首次上网日期,不代表论文的发表时间)