会议专题

基于混合特征相关性的特征选择方法

针对现有相关性度量方法只能直接计算两个连续特征或两个离散特征之问的相关度的问题,本文提出了一种度量连续特征与离散特征之间的相关性方法,在此基础上,进一步提出一种基于混合特征相关度的特征选择方法,并给出了一种闽值选择的指导性策略。提出的特征选择方法关于数据集大小具有线性时间复杂度,可以用于大规模数据集中的特征选择。在真实数据集、UCI机器学习数据集上的实验结果表明,本文提出的相关度计算方法及特征选择方法是有效、可行的。

混合特征 特征选择 时间复杂度 机器学习

蒋盛益 王连喜

广东外语外贸大学信息学院,广东 广州,510006

国内会议

2009中国计算机大会

天津

中文

747-756

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)