会议专题

基于增强学习的空空导弹智能精确制导律研究

根据现代战争的对抗格局,提出了空空导弹拦截高速大机动目标的智能制导律.这种制导律是采用基于Q-learning算法的.Q-learning的思想是直接优化一个可迭代计算的Q函数,并利用增强学习实现知识的自动获取,来扩展所能得到的知识资源.在Q-learning算法中,系统通过计算状态的值函数或者状态-动作对的值函数来控制导弹的飞行.根据环境的评价性回报函数来实现决策的优化,从而能够达到行为优化.这种制导规律只需要导弹和目标的位置、状态变量和法向过载的测量量,易于弹上实时实现,并且将这种制导律和传统制导相比较.结果表明:这种制导具有一定的智能行为,可以拦截大机动目标.这种智能制导方法有利于提高打击精度和载机的作战生存能力.

微分对策 机器学习 神经网络 精确制导 空空导弹

卢超群 江加和 任章

北京航空航天大学精确制导技术研究中心,中国,北京,100083

国内会议

2006年中国航天学会导弹控制专业委员会年会

湖南张家界

中文

19-22,76

2006-10-01(万方平台首次上网日期,不代表论文的发表时间)