不平衡数据分类方法综述
分类问题是机器学习领域的重要研究内容之一,现有的一些分类方法都已经相对成熟,用它们来对平衡数据进行分类一般都能取得较好的分类性能,但在现实世界中数据往往都是不平衡的,而现有的分类器的设计都是基于类分布大致平衡这一假设的,如果用这些方法来对不平衡数据进行分类就会导致分类器的性能下降,因而研究用于处理不平衡数据集的分类方法显得相当重要.为便于读者更清晰地了解数据不平衡分类问题的研究现状和未来研究的动向,本文对相关的研究进行了综述和展望.
不平衡数据集 分类方法 过抽样 欠抽样 代价敏感 单分类器 特征选择 机器学习
杨明 尹军梅 吉根林
南京师范大学,数学与计算机科学学院,江苏,南京,210097
国内会议
南京
中文
7-12
2008-11-14(万方平台首次上网日期,不代表论文的发表时间)