会议专题

基于蚁群优化的模糊Sarsa学习算法

  提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则。有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率。整个模糊推理模块被看作是蚂蚁觅食的过程。利用蚁群算法优良的随机搜索性能求解该组合优化问题。给出了该算法的设计方法和流程。小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能。

模糊Sarsa学习算法 蚁群优化 小车爬山问题

陈学松 杨宜民

广东工业大学 应用数学学院,广东广州 510006 广东工业大学 自动化学院,广东广州 510006 广东工业大学 自动化学院,广东广州 510006

国内会议

第九届中国智能机器人学术研讨会

深圳

中文

340-343

2011-11-11(万方平台首次上网日期,不代表论文的发表时间)