一种基于邻域筛选的K均值聚类优化算法
K-means 聚类算法,是无监督学习中的一种重要算法,在大数据处理,计算机视觉等研究领域发挥着重要作用,但由于其自身对初始划分、离群点和噪声等因素较为敏感,造成了在数据分析,图像分割等领域中聚类结果不稳定,鲁棒性较低等特性。本文在快速全局K 均值聚类算法的基础上提出了一种改进的K-means 聚类算法,能够有效地降低初始划分的随机性,并且提高初始划分的效率。该算法在聚类过程中使用了马氏距离,能更好地兼顾数据的全局性,在真实数据集上进行测试,其聚类结果相比于传统聚类算法及其他优化算法都有显著的提高。
全局 K均值 聚类 邻域 马氏距离
韩金涛 李海明 曹湘
上海电力大学计算机科学与技术学院,上海市200090
国内会议
上海
中文
425-432
2019-05-17(万方平台首次上网日期,不代表论文的发表时间)