基于注意力GRU模型的高分辨率遥感图像语义描述
随着遥感技术的快速发展,高分辨率遥感图像数据急剧增加,如何从海量的遥感图像数据中提取有效的语义描述信息具有重要的研究价值.然而,现有方法通常忽略遥感图像中的细节特征,从而导致图像的重要内容不能被语义信息准确描述.针对上述问题,本文提出了一种基于注意力机制的门控循环单元(Attention based Gated Recurrent Unit,Att-GRU)模型,并将该模型应用于高分辨率遥感图像的语义描述.首先,利用卷积神经网络提取高分辨率遥感图像的全局特征;然后在门控循环单元网络中引入注意力机制,以捕捉遥感图像中的细节视觉特征;最后,将图像视觉特征和描述文本特征共同作为Att-GRU模型的输入,以保证描述文本和图像内容的语义一致性,最终生成具有丰富语义内容的高分辨率遥感图像描述文本.实验结果表明,本文提出的模型在高分辨率遥感图像语义描述方面取得了较好的效果.
高分辨率遥感图像 语义描述 深度学习 注意力模型 门控循环单元
乔雪 许舟军 焦程波 彭晨 段贺
中国科学院电子学研究所苏州研究院 江苏省苏州市215123;苏州市空天大数据智能应用技术重点实验室 江苏省 苏州市 215123 北京信息技术研究所 北京市100000
国内会议
西安
中文
1-17
2018-10-17(万方平台首次上网日期,不代表论文的发表时间)