会议专题

一种新颖、高效、基于综合因素的聚类算法

聚类是数据挖掘中一项重要的技术。分析了现有聚类算法的优点,并在此基础上首次提出了一种基于综合因素的高效的聚类算法。它以数据点之间距离和数据点的密度作为识别簇的依据,利用统计信息以数据方格代替了单个数据点,从而相对减小了聚类的数据量,使得算法的时间复杂度近拟于线性。实验表明在和多种算法的比较中,该聚类算法在效率和质量上具有明显的优势。

数据挖掘 数据仓库 聚类

金文 钱卫宁 周傲英 施伯乐

大学计算机科学系(上海)

国内会议

第十六届全国数据库学术会议

兰州

中文

351~357

1999-08-01(万方平台首次上网日期,不代表论文的发表时间)