会议专题

基于深度模型的图像语义分析方法发展综述

随着大数据时代的到来,图像的数量规模急剧增加,由于图像包含丰富的语义信息成为大众获取相关信息的重要来源.基于深度模型的图像语义分析就是一种通过深度模型将图像内容转换成可直观理解的语义知识的技术,从而受到国内外研究者广泛关注.该技术根据生成目标语义层次差异可分标签、语句和段落三类,本文详细介绍了以上三类方法对应的深度模型结构特点,并从技术的演化趋势出发对比分析了三类方法的应用场景、技术特点和发展现状;同时针对图像语句转换以及图像段落转化方法的应用场景与性能要求的差异,分别从学术界和产业界进行了详细的对比分析,指出了二者在研究侧重点的差异与对应的发展现状.最后本文对具有深度模型的图像语义分析方法进行了总结和展望,指明了该技术当前存在的问题与发展趋势.

图像处理 语义分析 深度模型 卷积神经网络 递归神经网络

毛典辉 李子沁 王帆 蔡强

北京工商大学计算机与信息工程学院,北京中国 100048

国内会议

2017中国智能物联系统会议

厦门

中文

181-188

2017-11-17(万方平台首次上网日期,不代表论文的发表时间)