小规模和非平衡数据下的目标分类

摘要：

针对小规模和非平衡的训练数据集下的目标分类问题,本文提出了一种新的目标分类学习算法gentleBoost-BFKO(Balance Feature Knock Out).该算法利用数据扩充算法BFKO在gentleBoost学习的过程中自动产生新样本扩充弱势类数据,既扩大数据规模的同时又平衡了数据,大幅度的提高了gentleBoost分类器的性能.实验显示,在小样本情况下,基于gentleBoost-BFKO算法学习得到的分类器的分类错误率比基于gentleBoost算法得到的分类器的错误率降低了20％～30％,达到了与线性SVM相同的水平.而且样本越少,正负样本越不均衡,提高的幅度越大.

关键词：非平衡数据集目标分类学习算法数据扩充算法

作者: 周维庄连生俞能海

作者单位: 中国科学技术大学信息科学技术学院,合肥,230027 中国科学技术大学多媒体计算与通信教育部-微软重点实验室,合肥,230027;中国科学技术大学信息科学技术学院,合肥,230027

会议类型: 国内会议

会议名称: 第十四届全国图象图形学学术会议

会议地点: 福州

会议语种:中文

页码: 389-392

在线出版日期: 2008-05-16（万方平台首次上网日期，不代表论文的发表时间）

会议专题

小规模和非平衡数据下的目标分类