基于取样的DBSCAN聚类算法及其遗传优化
在数据挖掘领域中,聚类技术有着非常重要的应用。DBSCAN是一种基于密度的聚类算法,该算法将具有足够高密度的区域划分为一类,并可以在带有噪声的空间数据库中发现任意形状的聚类.但该算法是直接对整个数据库进行聚类,需要把所有数据载入内存,因此当数据量很庞大时对主存要求较高并且时间性能不高。基于取样技术对DBSCAN算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于取样的DBSCAN算法及其遗传优化。
数据挖掘 聚类算法 DBSCAN 取样技术 遗传算法
朵春红 王翠茹
华北电力大学计算机学院
国内会议
扬州
中文
125-129
2007-07-27(万方平台首次上网日期,不代表论文的发表时间)