会议专题

多方向上下文特征结合空间金字塔模型的场景分类

  针对场景分类问题中,传统的“词包”模型不包含图像的上下文信息,且没有考虑图像特征间的类别差异问题,本文提出一种多方向上下文特征结合空间金字塔模型的场景分类方法。该方法首先对图像进行均匀网格分块并提取尺度不变(SIFT)特征,对每个局部图像块分别结合其周围三个方向的空间相邻区域,形成三种上下文特征;然后,将每类训练图像的上下文特征分别聚类形成视觉词汇,再将其连接形成最终的视觉词汇表,得到图像的视觉词汇直方图;最后,结合空间金字塔匹配算法形成金字塔直方图,并采用SVM分类器来进行分类。该方法将图像块在特征域的相似性同空间域的上下文关系有机地结合起来并加以类别区分,从而形成了具有更好区分力的视觉词汇表。在通用场景图像库上的实验表明,相比传统方法具有更好的分类性能。

场景分类 局部邻域上下文 具体类视觉词汇 空间金字塔匹配

胡正平 涂潇蕾

燕山大学信息科学与工程学院,秦皇岛066004

国内会议

第十五届全国信号处理学术年会

北京

中文

1536-1542

2011-11-17(万方平台首次上网日期,不代表论文的发表时间)