基于留一交叉验证的类不平衡危害预评估策略
近年来,类不平衡问题已逐渐成为人工智能、机器学习和数据挖掘等领域的研究热点,目前已有大量实用有效的方法.然而,近期的研究结果却表明,并非所有的不平衡数据分类任务都是有害的,在无害的任务上采用类不平衡学习算法将很难提高,甚至会降低分类的性能,同时可能大幅度增加训练的时间开销.针对此问题,提出了一种危害预评估策略.该策略采用留一交叉验证法(LOOCV.Leave-one-out cross validation)测试训练集的分类性能,并据此计算一种称为危害测度(HM.Harmful-ness Measure)的新指标,用以量化危害的大小,从而为学习算法的选择提供指导.通过8个类不平衡数据集对所提策略进行了验证,表明该策略是有效和可行的.
类不平衡 留一交叉验证 危害测度 预评估
于化龙 倪军 徐森
江苏科技大学计算机科学与工程学院,江苏镇江212003 爱荷华大学卡佛医学院,美国爱荷华城52242 盐城工学院信息工程系,江苏盐城224051
国内会议
大连
中文
2287-2292
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)