会议专题

聚类分析算法的研究与改进

本文详细阐述了数据挖掘领域关于数据集的聚类的研究课题。数据集常用的聚类分析由于数据量巨大、数据类型众多等而成为分析的难点。传统的聚类分析算法多以k均值算法为基础,而k均值算法对于一个是极大值的孤立点的加入非常敏感,会对中心值产生非常大的影响。本文引入模拟退火策略的思想,对传统的k均值聚类算法进行了改进。使用模拟退火思想改进的k均值聚类算法在对样本点进行规类和计算聚类中心点的时候,并不是单纯只考虑每个样本点同中心点的距离,而是综合考虑各个样本点的分布。改进后的聚类算法达到更好的聚类效果,避免由于孤立点数据造成聚类结果局部最优化。理论分析和实验结果表明:此算法可以有效的解决对孤立点的加入所产生的影响。

退火算法 数据挖掘 聚类分析 k 均值算法

赵炜妹 郭庆琳

华北电力大学计算机学院,北京,102206

国内会议

华北电力大学第五届研究生学术交流年会

北京

中文

1-5

2007-12-24(万方平台首次上网日期,不代表论文的发表时间)