会议专题

模糊优胜再励学习

本文提出了一种新的再励学习方法,即模糊优胜学习结构(Fuzzy Advantage Learning,FAL),并将其成功地应用于倒立摆的控制问题.该结构接受连续值的状态输入,产生连续值的控制输出:并根据再励信号实时调节模糊控制器的后件参数.仿真研究将该方法与其他再励学习方法进行了比较.仿真结果表明:该方法学习速度快,学习性能优于其他方法.

再励学习 模糊推理系统 优胜学习 倒立摆系统 模糊学习优胜结构

晏雄伟 邓志东 孙增圻

清华大学计算机系,智能技术与系统国家重点实验室(北京)

国内会议

2001年中国智能自动化会议

昆明

中文

352-357

2001-08-01(万方平台首次上网日期,不代表论文的发表时间)