会议专题

一种新的基于层次和K-means方法的聚类算法

业界提出的传统H-K(Hierarchical K-means)聚类算法虽有效解决了K-means算法初始化中心选择的经验性和随机性,但昂贵的计算复杂度使其被难以广泛应用。本文提出一种新的基于层次和K-means的聚类算法,具有较优的计算复杂度。首先引入轮廓系数的概念,从而确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用K-means 方法完成聚类。IRIS 测试数据集的实验结果验证了该算法的有效性。

层次聚类 轮廓系数 聚类算法 测试数据集 算法初始化

李文超 周勇 夏士雄

中国矿业大学计算机科学与技术学院,江苏,徐州,221008

国内会议

第26届中国控制会议

湖南张家界

中文

605-609

2007-07-26(万方平台首次上网日期,不代表论文的发表时间)