一种基于网格和密度的数据流高效聚类算法
数据流环境下的内存限制和线性扫描要求使得传统的聚类方法不再适用.本文提出的基于网格和密度的数据流算法,是一种增量更新的算法,保证只扫描一遍数据.通过保存局部密集单元的信息并丢弃其它单元克服了内存的限制,运行时间与数据量呈线性关系,能够动态输出聚类结果.实验分析证明了该算法的有效性和高效性.
数据流算法 数据流 聚类分析 数据挖掘
高晶 李建中 张兆功 张艳秋
哈尔滨工业大学计算机科学与技术学院(哈尔滨)
国内会议
长沙
中文
681-683
2003-10-10(万方平台首次上网日期,不代表论文的发表时间)