会议专题

基于数据场的改进DBSCAN聚类算法

  DBSCAN算法是一种典型的基于密度的聚类算法。该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正确类簇个数的聚类结果,也可能将部分数据错分为噪声。为此,利用数据场能较好描述数据分布,反映数据关系的优势,提出了一种基于数据场的改进DBSCAN聚类算法。该算法引入平均势差的概念,在聚类过程中动态地确定每个类的Eps和平均势差,从而能够在一些密度相差较大的数据集上得到较好的聚类结果。实验表明,所提算法的性能优于DBSCAN算法。

数据场 聚类算法 全局优化 性能测试

YANG Jing 杨静 GAO Jiawei 高嘉伟 LIANG Jiye 梁吉业 LIU Yanglei 刘杨磊

Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Educa 山西大学计算智能与中文信息处理教育部重点实验室,太原030006;山西大学计算机与信息技术学院,太原030006 Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Educa 山西大学计算智能与中文信息处理教育部重点实验室,太原030006 Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Educa

国内会议

第29届中国数据库学术会议

合肥

中文

903-911

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)