模糊优胜再励学习
本文提出了一种新的再励学习方法,即模糊优胜学习结构(Fuzzy Advantage Learning,FAL),并将其成功地应用于倒立摆的控制问题.该结构接受连续值的状态输入,产生连续值的控制输出:并根据再励信号实时调节模糊控制器的后件参数.仿真研究将该方法与其他再励学习方法进行了比较.仿真结果表明:该方法学习速度快,学习性能优于其他方法.
再励学习 模糊推理系统 优胜学习 倒立摆系统 模糊学习优胜结构
晏雄伟 邓志东 孙增圻
清华大学计算机系,智能技术与系统国家重点实验室(北京)
国内会议
昆明
中文
352-357
2001-08-01(万方平台首次上网日期,不代表论文的发表时间)