一种新颖、高效、基于综合因素的聚类算法

摘要：

聚类是数据挖掘中一项重要的技术。分析了现有聚类算法的优点，并在此基础上首次提出了一种基于综合因素的高效的聚类算法。它以数据点之间距离和数据点的密度作为识别簇的依据，利用统计信息以数据方格代替了单个数据点，从而相对减小了聚类的数据量，使得算法的时间复杂度近拟于线性。实验表明在和多种算法的比较中，该聚类算法在效率和质量上具有明显的优势。

关键词：数据挖掘数据仓库聚类

作者: 金文钱卫宁周傲英施伯乐

作者单位: 大学计算机科学系(上海)

会议类型: 国内会议

会议名称: 第十六届全国数据库学术会议

会议地点: 兰州

会议语种:中文

页码: 351～357

在线出版日期: 1999-08-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种新颖、高效、基于综合因素的聚类算法