一种基于网格的改进的K-Means聚类算法
K—Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K—Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出了一种基于网格的改进的K—Means聚类算法(IKMG).IKMG利用网格连通性原理并借助树形结构,将多个密集网格单元作为初始根节点,周围网格作为它的子节点,以此类推,广度优先扩展树最终得到K个聚类树.实验结果表明,IKMG不但大大缩短了K—Means算法对大数据集的处理时间,而且能有效消除聚类结果对初始聚类中心的敏感性,无需人为指定K值,能找出不同大小、不同形状的聚类.
K-Means聚类算法 数据集 网格连通性 树形结构
任家东 孟丽丽 张冬梅
燕山大学信息科学与工程学院 河北秦皇岛 066004 北京理工大学计算机科学技术学院 北京 100081 燕山大学信息科学与工程学院 河北秦皇岛 066004
国内会议
南昌
中文
453-458
2009-10-15(万方平台首次上网日期,不代表论文的发表时间)