会议专题

基于数据场的改进DBSCAN聚类算法

DBSCAN算法是一种典型的基于密度的聚类算法.该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正确类簇个数的聚类结果,也可能将部分数据错分为噪声.为此,本文利用数据场能较好描述数据分布、反映数据关系的优势,提出一种基于数据场的改进DBSCAN聚类算法.该算法引入平均势差的概念,在聚类过程中动态地确定每个类的Eps和平均势差,从而能够在一些密度相差较大的数据集上得到较好的聚类结果.实验表明,提出的算法在AC和RI等指标上均优于DBSCAN算法.

DBSCAN Data field Clustering

杨静 高嘉伟 梁吉业 刘杨磊

山西大学计算智能与中文信息处理教育部重点实验室 太原030006 山西大学计算机与信息技术学院 太原030006

国内会议

第十二届中国Rough集与软计算学术会议、第六届中国Web智能学术研讨会及第六届中国粒计算学术研讨会联合学术会议

合肥

中文

65-65

2012-10-13(万方平台首次上网日期,不代表论文的发表时间)