基于粒度偏移因子的支持向量机学习方法
在实际应用中,数据集样本规模、分布密度的不平衡性,可能会使传统支持向量机(Support VectorMachine,SVM)得到的分类超平面不是最优。本文在对传统支持向量机最优分类面分析的基础上,结合粒度计算(Granular Computing,GrC)理论,针对数据规模和分布密度不平衡的数据集,提出一种基于粒度偏移因子的粒度支持向量机(Granular SVM,GSVM)学习方法,称为S_GSVM 方法。该方法将原始样本用Mercer 核映射到高维空间,然后在高维空间中对数据进行有效的粒划分,通过对不同的粒构造不同的超平面偏移因子,重新构造支持向量机的凸二次优化问题,以得到一个泛化能力更好的分类超平面。本文提出的方法充分考虑了数据复杂分布对于泛化能力的影响,对基于最大间隔的分类面进行改进,实验结果表明,本文提出的S_GSVM 方法在非平衡数据集上能得到较好的泛化性能。
粒度支持向量机 不平衡分布 粒 偏移因子
郭虎升 王文剑
山西大学 计算机与信息技术学院 太原 030006 山西大学 计算智能与中文信息处理教育部重点实验室 太原 030006
国内会议
长春
中文
1-14
2012-08-04(万方平台首次上网日期,不代表论文的发表时间)