基于改进的凝聚性和分离性的层次聚类算法
由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法--ICCSH(a hierarchical clustering algorithm based on improved cluster cohesion and separation),该算法首先通过ID传播把关系数据库中的各个表联系起来,再通过计算共享最近邻的相似度和改进的凝聚性算法将数据对象聚类为大量相对较小的子聚类,然后通过计算改进的簇间分离性合并子类来找到真正的结果簇.实验表明,该算法不仅运行时间相对较短,具有较强的可伸缩性,还可以得到较高精确的聚类结果.
共享最近邻 关系数据库 层次聚类 凝聚性 簇间分离性
郭景峰 赵玉艳 边伟峰 李晶
燕山大学信息科学与工程学院,秦皇岛,066004
国内会议
南宁
中文
202-206
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)