基于Q学习的无人机三维航迹规划
现有的基于Q学习的无人机航迹规划方法很少考虑无人机本身的航迹约束,导致规划获得的航迹的可用性较差。本文提出一种更有效的无人机三维航迹规划方法:利用无人机的航迹约束条件指导规划空间离散化过程,不仅在一定程度上降低了获得的离散规划问题的规模,而且在一定程度上提高了规划获得的航迹的可用性;在回报函数构造时引入了回报成型技术以加快算法收敛速度,并提出两种利用启发式信息进一步提高算法收敛速度的方法。无人机三维航迹规划的仿真结果表明了算法的有效性。
无人机 航迹规划 Q学习 回报函数
郝钏钏 方舟 李平
浙江大学控制科学与工程学系, 杭州 310027 浙江大学航空航天学院, 杭州 310027
国内会议
厦门
中文
1-6
2012-08-01(万方平台首次上网日期,不代表论文的发表时间)