数据分区:一种改善基于密度的聚类算法的方法
数据聚类(clustering)在数据挖掘、模式识别、图象处理和数据压缩等领域有着广泛的应用。DBSCAN算法是一种基于密度的空间聚类算法,在处理空间数据时具有快速、能够处理噪声点和发现任意形状的聚类等优点。但由于直接对数据库进行操作,需要较多的内存和I/O时间,并且当数据密度和聚类间的距离不均匀时聚类质量较差。该文在分析原有DBSCAN算法不足的基础上,提出用数据分区来改善DBSCAN算法。实验结果表明新算法不仅提高了聚类速度,而且改善了聚类质量。
空间数据库 数据挖掘 聚类 数据分区 DBSCAN算法
曹晶 周水庚 范晔
大学计算机系,上海(国际)数据库研究中心
国内会议
兰州
中文
326~333
1999-08-01(万方平台首次上网日期,不代表论文的发表时间)