会议专题

通过数据取样扩展基于密度的聚类算法

数据聚类(clustering)是数据挖掘中是广为研究的课题之一。聚类技术在许多领域有着广泛的应用。基于密度的聚类算法(DBSCAN)是一种有效的空间聚类算法,它能发现任意形状的聚类和有效地处理噪声点(noise),并且只需用户输入一个参数。但DBSCAN算法在进行大规模空间数据库数据聚类时需要较大的内存和I/O消耗。该文在分析原有DBSCAN算法的基础上,通过数据取样来扩展DBSCAN算法,使之有效地处理大规模空间数据库,测试结果表明该文方法是有效的、可行的。

空间数据库 数据挖掘 数据聚类 数据取样 DBSCAB算法

范晔 周水庚 曹晶 周傲英

大学计算机科学系(上海)

国内会议

第十六届全国数据库学术会议

兰州

中文

319~325

1999-08-01(万方平台首次上网日期,不代表论文的发表时间)