会议专题

数据挖掘中基于遗传算法的数据预处理研究

该文提出了一种基于遗传算法的数据预处理方法。数据挖掘过程中该方法能够解决如何对一个样本集进行数据分割,从而得到最佳训练集和测试集的问题。通过该方法进行数据分割,不仅提高了分类模型的分类精度,而且能够最小化训练集和测试集之间的噪声百分比。最后,利用一组软件项目样本数据为例说明该方法的有效性。

数据挖掘 数据预处理 遗传算法 数据分割

冯楠 李敏强 寇纪淞

天津大学管理学院天津 300072

国内会议

信息系统协会中国分会第二届学术年会

昆明

中文

779-782

2007-11-08(万方平台首次上网日期,不代表论文的发表时间)