基于互信息率的不均衡数据集属性约简算法
属性约简是粗糙集理论的核心内容,基于互信息的属性约简算法是其中非常重要的一类算法。然而,基于互信息的属性约简算法存在一定的不足:属性选取的度量标准存在偏向性;对不均衡数据集分类效果不理想;难以处理连续型属性等。本文主要针对前两点不足提出了一种改进算法--基于互信息率的不均衡数据集属性约简算法。 该算法选用互信息率作为度量,有效避免了属性选取的偏向问题,同时,通过引入类别比重、少数类中条件属性比重和条件属性中少数类比重三个参数,实现了对少数类分类统计显著的条件属性的优先选取,提高了对不均衡数据集的分类效果。
粗糙集 属性约简 互信息率 不均衡数据集 约简算法
武森 吴玲玉 全喜伟 高学东
北京科技大学经济管理学院,北京,100083
国内会议
广州
中文
128-133
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)