会议专题

关于决策表约简CEBARKCC算法的改进

属性约简是Rough集研究的重要内容之一。所谓属性约简是指在保证信息系统分类或决策能力不变的条件下,删除条件属性中的冗余属性,从而减少数据挖掘要处理的数据量,提高数据挖掘结果的简洁性。国内外学者在这方面做了大量的研究,提出了多种属性约简算法。如基于正区域的属性约简算法,基于Skowron提出的区分矩阵的约简算法和基于信息熵的属性约简算法。然而属性约简的求解是一个NP困难问题,导致该问题的主要原因是属性的组合爆炸。目前还不存在一种非常有效的方法,因此寻求快速的约简算法及其增量版这一问题仍是粗糙集理论的研究热点之一。本文根据当属性集合A的条件信息熵等于属性集合AU”a”的条件信息熵时,属性a不能为属性集A添加任何分类信息,可以将a删除为基础。对CEBARKCC算法进行改进,从而减少了不必要的计算,节省了时间。

决策表 约简算法 属性约简 冗余属性 数据挖掘

黄丽萍 吴顺祥

厦门大学系统与控制研究中心,厦门 361005;漳州师范学院计算机科学与工程系,漳州 363000 厦门大学系统与控制研究中心,厦门 361005

国内会议

第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC”2007)

太原

中文

37-38

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)