基于密度流的聚类算法
基于密度的聚类算法是到目前已提出的多种聚类算法中的一种非常有效的方法,这类算法可以检测数据空间中任意形状的簇,然而目前已有的一些基于密度的算法,如DBSCAN,DENCLUE,因为算法的全局参数问题而不适合处理不同密度的簇;SNN算法则由于需要从k最近邻相似矩阵中重构出共享最近邻图而在效率上有所欠缺.为了更有效率地检测数据集中的簇,提出了一种基于密度流模型的算法DEFAT.算法假设数据集中的每个对象都有一定的密度流,对象间通过传送密度流以共享密度信息,从而达到分离密集区域和稀疏区域的目的,DEFAT能够很好地检测不同形状、不同密度、不同大小以及有重叠的簇.在人工数据集和真实数据集上的实验表明,DEFAT无论在效果上还是在效率上,都优于现有经典的基于密度的算法.
数据挖掘 聚类算法 性能测试 密度流
Lin Zezhen 林泽桢 Bai Xue 白雪
School of Computer Science, Fudan University, Shanghai 201203 复旦大学计算机科学技术学院 上海 201203
国内会议
合肥
中文
209-214
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)