会议专题

基于视觉词典的建筑物图像识别算法

目的:著名建筑物如长城、天安门、凯旋门、埃菲尔铁塔等三维刚性物体,会在不同视点、光照、背景和部分遮挡情况下出现在各种图像和视频中.建筑物图像识别是利用已知集合中的建筑物类别来标记任一幅图像中存在的建筑物. 方法:本文从视觉词汇和视觉词典生成入手,以具有不变性的视觉特征如SIFT、PHOW作为视觉词汇的基础特征,利用K-Means对其进行聚类形成视觉词典.通过词袋模型统计每张图像词频,实现图像的特征表达.采用均值法、最近邻法和SVM支持向量机三种分类器分别实现建筑物图像分类识别算法. 结果:本文建立了一个建筑物图像数据集XJTU-Building,它包含16个著名建筑物共1755幅图像.在该数据集上,对所提出的算法进行了测试和性能比较,实验结果证明方法的有效性和可行性. 结论:采用相同分类器时,采用PHOW特征的效果优于SIFT特征;在相同特征视觉词典条件下,SVM方法的效果明显优于KNN和均值法.

建筑物识别 图像特征 信息提取 视觉词典

崔志超 苏远歧 刘杰峰 刘跃虎

西安交通大学人工智能与机器人研究所,西安710049

国内会议

第17届全国图象图形学学术会议

珠海

中文

501-508

2014-11-14(万方平台首次上网日期,不代表论文的发表时间)