会议专题

基于对等SAP 的Q学习在机器人作业分配中的应用

本文讨论了高速搬运系统中多个机器人的作业分配问题。针对状态空间随机器人个数增加呈指数增大这一难题,提出对等状态-行动对(State-Action Pair)概念,设计了一种改进的Q学习算法。在该算法中,每次采取一个行动后,更新相应的所有对等SAP的Q 值,且只需保存其中一个SAP的Q 值。与标准Q 学习相比,该算法能够节省存储空间,提高系统的学习效率。

机器人 高速搬运系统 作业分配 状态空间 Q学习算法

丁丽洁 唐昊 周雷

合肥工业大学计算机与信息学院,合肥230009

国内会议

第26届中国控制会议

湖南张家界

中文

536-539

2007-07-26(万方平台首次上网日期,不代表论文的发表时间)