会议专题

基于K均值聚类的改进算法研究

在如今信息爆炸的现代社会,怎样从浩瀚的数据海洋中提取有用的信息,挖掘出数据背后隐藏的深层信息和知识一直是众多学者研究的一个热点.数据挖掘正是力求解决这个问题的一门新兴技术.聚类分析是数据挖掘中的一种有效方法,把具有相似性质的对象归为一类,不同性质的对象归为不同类别,从而发现或预测用户感兴趣的信息. 为提高算法的精度和效率,本文引进4-dist图来对数据进行预处理,在初始类中心的选取和噪声点的辨别两个问题上提出改进。本文利用生成的四个不同类型的数据集和863项目“大数据地理信息时序分析和变化特征提取”的一部分数据,进行了多次K均值聚类的改进算法和传统的K均值聚类算法的对比实验。实验证明了改进后聚类算法的迭代次数少,聚类稳定,所得结果理想。

数据挖掘 K均值聚类法 改进算法 稳定性

江京亚 郭庆胜 孙雅庚 陈旺

武汉大学资源与环境科学学院,武汉,430079 武汉大学资源与环境科学学院,武汉,430079;武汉大学测绘遥感信息工程国家重点实验室,武汉,430079

国内会议

中国地理信息科学2014学术年会

徐州

中文

66-67

2014-10-11(万方平台首次上网日期,不代表论文的发表时间)