通过数据取样扩展基于密度的聚类算法
数据聚类(clustering)是数据挖掘中是广为研究的课题之一。聚类技术在许多领域有着广泛的应用。基于密度的聚类算法(DBSCAN)是一种有效的空间聚类算法,它能发现任意形状的聚类和有效地处理噪声点(noise),并且只需用户输入一个参数。但DBSCAN算法在进行大规模空间数据库数据聚类时需要较大的内存和I/O消耗。该文在分析原有DBSCAN算法的基础上,通过数据取样来扩展DBSCAN算法,使之有效地处理大规模空间数据库,测试结果表明该文方法是有效的、可行的。
空间数据库 数据挖掘 数据聚类 数据取样 DBSCAB算法
范晔 周水庚 曹晶 周傲英
大学计算机科学系(上海)
国内会议
兰州
中文
319~325
1999-08-01(万方平台首次上网日期,不代表论文的发表时间)