会议专题

增量聚类算法的研究和分析

随着各个领域数据量的迅速增长,增量聚类算法随即被提出用来解决动态数据的聚类问题.本文介绍了增量聚类算法的分类,分析了数据在插入、删除和更新时使用增量聚类算法的益处.选择合适的增量聚类算法,可以保证数据在变化时能够降低时间复杂度、提高聚类的精度和效率.本文主要对几种增量聚类算法进行分析,最后给出了进一步的研究方向.本文的第一部分对该论文的相关工作进行描述,第二部分对每类增量聚类算法进行分析和描述,第三部分对每类增量聚类算法进行了归纳总结。可以看出增量聚类算法仍存在待解决和不足的地方,基于层次增量聚类算法的复杂度较高,因此不太适合处理大型数据。基于划分增量聚类算法只能发现非凹的球形簇,对于噪声数据很敏感,需要给出一个初始划分。基于密度的增量聚类算法对输人参数比较敏感,对数据维数的伸缩性较差。基于网格的增量聚类算法对噪声敏感,当数据中有噪音时,如果不加特殊处理,算法的聚类质量会很差。

增量聚类 数据挖掘 聚类质量

张晓芬 封筠

石家庄铁道大学信息科学与技术学院,河北石家庄市050043

国内会议

SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)

石家庄

中文

267-273

2014-06-30(万方平台首次上网日期,不代表论文的发表时间)