基于深度学习编码模型的图像分类方法
本文针对矢量量化编码的量化误差严重,而稀疏编码只是一种浅层学习模型,容易导致视觉词典对图像特征缺乏选择性的问题,提出了一种基于深度学习特征编码模型的图像分类方法.首先,采用深度学习网络-无监督的受限玻尔兹曼机(RBM)代替传统的K-Means聚类及稀疏编码等方法对SIFT特征库进行编码学习,生成视觉词典;其次,根据学习得到的词典,得到每一个SIFT特征对应的稀疏向量,并对其进行融合得到图像的深度学习表示向量,并以此训练SVM分类器;然后,利用训练数据的类别标签信息对RBM网络学习进行有监督的微调,并利用SVM分类器完成分类.实验结果表明,本文方法能有效克服传统矢量量化编码及稀疏编码等方法的缺点,有效地提升图像分类性能.
图像分类 局部特征 深度学习 视觉词典
赵永威 杨晓元 蔺博宇
武警工程大学电子技术系 陕西西安710000 63618部队 新疆库尔勒8410000
国内会议
合肥
中文
294-304
2016-10-15(万方平台首次上网日期,不代表论文的发表时间)