一种基于复合近邻的聚类中心点初始化算法
提出了一种有效选择初始聚类中心的算法CNICC.该算法参考了网格聚类算法的思路.划分数据空间为相应维度上的网格单元,然后根据实例的分布情况确定初始聚类中心.从二阶差分的概念出发,CNICC定义了网格单元的一阶邻居和二阶邻居,算法根据每个网格单元的一阶和二阶邻居的局部密度变化寻找包含聚类中心的网格单元.在人工数据集上进行的实验表明,与现有初始化聚类中心的方法相比,CNICC能够有效减少K-means算法的迭代次数,提升聚类精度.同时,随着数据集实例数、维度和网格单元数量的增加,算法的时间复杂度呈线性增加.
网格单元 聚类中心 初始化算法 K-means 人工数据集
牛琨 张舒博 陈俊亮
北京邮电大学,计算机科学与技术学院,北京,100876 中国电信,北京研究院,北京,100035
国内会议
第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)
哈尔滨
中文
379-383
2006-08-05(万方平台首次上网日期,不代表论文的发表时间)