基于Q学习的无人机三维航迹规划

摘要：

　　现有的基于Q学习的无人机航迹规划方法很少考虑无人机本身的航迹约束，导致规划获得的航迹的可用性较差。本文提出一种更有效的无人机三维航迹规划方法：利用无人机的航迹约束条件指导规划空间离散化过程，不仅在一定程度上降低了获得的离散规划问题的规模，而且在一定程度上提高了规划获得的航迹的可用性；在回报函数构造时引入了回报成型技术以加快算法收敛速度，并提出两种利用启发式信息进一步提高算法收敛速度的方法。无人机三维航迹规划的仿真结果表明了算法的有效性。

关键词：无人机航迹规划 Q学习回报函数

作者: 郝钏钏方舟李平

作者单位: 浙江大学控制科学与工程学系, 杭州 310027 浙江大学航空航天学院, 杭州 310027

会议类型: 国内会议

会议名称: 第23届过程控制会议

会议地点: 厦门

会议语种:中文

页码: 1-6

在线出版日期: 2012-08-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于Q学习的无人机三维航迹规划