模糊优胜再励学习

摘要：

本文提出了一种新的再励学习方法,即模糊优胜学习结构(Fuzzy Advantage Learning,FAL),并将其成功地应用于倒立摆的控制问题.该结构接受连续值的状态输入,产生连续值的控制输出:并根据再励信号实时调节模糊控制器的后件参数.仿真研究将该方法与其他再励学习方法进行了比较.仿真结果表明:该方法学习速度快,学习性能优于其他方法.

关键词：再励学习模糊推理系统优胜学习倒立摆系统模糊学习优胜结构

作者: 晏雄伟邓志东孙增圻

作者单位: 清华大学计算机系,智能技术与系统国家重点实验室(北京)

会议类型: 国内会议

会议名称: 2001年中国智能自动化会议

会议地点: 昆明

会议语种:中文

页码: 352-357

在线出版日期: 2001-08-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

模糊优胜再励学习