基于蚁群优化的模糊Sarsa学习算法
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则。有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率。整个模糊推理模块被看作是蚂蚁觅食的过程。利用蚁群算法优良的随机搜索性能求解该组合优化问题。给出了该算法的设计方法和流程。小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能。
模糊Sarsa学习算法 蚁群优化 小车爬山问题
陈学松 杨宜民
广东工业大学 应用数学学院,广东广州 510006 广东工业大学 自动化学院,广东广州 510006 广东工业大学 自动化学院,广东广州 510006
国内会议
深圳
中文
340-343
2011-11-11(万方平台首次上网日期,不代表论文的发表时间)