会议专题

基于Q学习的无人机三维航迹规划

  现有的基于Q学习的无人机航迹规划方法很少考虑无人机本身的航迹约束,导致规划获得的航迹的可用性较差。本文提出一种更有效的无人机三维航迹规划方法:利用无人机的航迹约束条件指导规划空间离散化过程,不仅在一定程度上降低了获得的离散规划问题的规模,而且在一定程度上提高了规划获得的航迹的可用性;在回报函数构造时引入了回报成型技术以加快算法收敛速度,并提出两种利用启发式信息进一步提高算法收敛速度的方法。无人机三维航迹规划的仿真结果表明了算法的有效性。

无人机 航迹规划 Q学习 回报函数

郝钏钏 方舟 李平

浙江大学控制科学与工程学系, 杭州 310027 浙江大学航空航天学院, 杭州 310027

国内会议

第23届过程控制会议

厦门

中文

1-6

2012-08-01(万方平台首次上网日期,不代表论文的发表时间)