基于邻域粗糙集多粒度估计的特征选择
在模式识别,机器学习和数据挖掘中,特征选择是重要的一步。在当今各领域中,需要处理大量的数值型数据。基于邻域粗糙集(NRS)模型的特征选择方法很好地处理了数值与符号属性共存问题。该模型以实数空间中的每一个点形成一个δ邻域,δ邻域族构成了描述空间中任意概念的基本信息粒子。在NRS模型中,粒度δ扮演了重要角色,决定了特征选择效果和分类精度。如何选择合适的粒度使分类效果更好?本文提出多粒度估计概念,在邻域粗糙集模型基础上构造了多粒度估计算法,避免了粒度选择问题,实现了NRS特征选择的非参数化。改进算法保持或显著提高了属性约简和分类能力。
多粒度估计 邻域粗糙集 特征选择 模式识别 机器学习
车勋建 胡清华 于达仁
哈尔滨工业大学能源学院 哈尔滨 150001
国内会议
第九届中国Rough集与软计算、第三届中国Web智能、第三届中国粒计算联合会议(CRSSC-CWI-CGrC’2009)
石家庄
中文
15-18,23
2009-08-01(万方平台首次上网日期,不代表论文的发表时间)