会议专题

基于交互信息的混合特征选择算法

  针对传统的特征选择算法只专注于特征间的相关性和冗余性而没有考虑特征之间交互作用的问题,提出一种基于交互信息的混合特征选择(hybrid feature selection based on mutual information,MIHFS)算法,该算法以K-最近邻算法的分类准确率作为衡量所选特征分类性能的评价指标,有效地去除了冗余和不相关的特征,保留了具有交互作用的特征。为了评估该算法的性能,从分类准确率、所选特征数量以及算法稳定性三方面,与最大相关最 小冗余、联合互信息等7种特征选择算法在8个数据集上进行了实验比较和分析。实验结果表明:MIHFS算法具有较强的稳定性,不仅有效降低了特征空间的维数,而且在所选特征的 分类性能方面明显优于其他特征选择算法。最后将MIHFS算法与灰色关联分析法-逼近理想解的排序技术法相结合并应用到高邮凹陷永安地区戴一段地质评价中,其评价结果准确率为 80%,与实际钻探结果基本吻合,具有较高的可靠性,能够有效指导油气地质评价。

特征选择 交互信息 混合特征选择 K-最近邻 灰色关联分析法 逼近理想解的排序技术

姜文煊 段友祥 孙歧峰

中国石油大学(华东)计算机科学与技术学院,山东青岛266580

国内会议

CCF第35届中国计算机应用大会

湖北襄阳

中文

545-558

2020-10-16(万方平台首次上网日期,不代表论文的发表时间)