连续特征离散化方法综述
离散特征在数据挖掘的过程中具有重要的作用,如何将实际数据集中的连续特征最好地离散化是一个NP-hard问题。本文介绍了离散化方法的不同角度的分类、离散化过程中用到的术语及一般离散化的过程。同时按照离散化方法有监督和无监督的分类方法体系,介绍了儿种有代表性的离散化方法。提出需根据学习环境选择合适的离散化方法,将关联分析中连续特征离散化作为以后的研究方向。
数据挖掘 数据结构 离散特征 关联分析
汪庆 张巍 刘鹏
上海财经大学 信息管理与工程学院,上海 200439
国内会议
上海
中文
1091-1096
2008-05-01(万方平台首次上网日期,不代表论文的发表时间)