数据挖掘中基于遗传算法的数据预处理研究
该文提出了一种基于遗传算法的数据预处理方法。数据挖掘过程中该方法能够解决如何对一个样本集进行数据分割,从而得到最佳训练集和测试集的问题。通过该方法进行数据分割,不仅提高了分类模型的分类精度,而且能够最小化训练集和测试集之间的噪声百分比。最后,利用一组软件项目样本数据为例说明该方法的有效性。
数据挖掘 数据预处理 遗传算法 数据分割
冯楠 李敏强 寇纪淞
天津大学管理学院天津 300072
国内会议
昆明
中文
779-782
2007-11-08(万方平台首次上网日期,不代表论文的发表时间)