基于分层聚类的并行数据预处理算法
分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一.针对目前并行分层聚类算法处理大数据集时速度较慢的特点,提出一种并行数据预处理算法,该算法可使原始输入数据的规模最多减少为原来的1/10,从而可减少总的并行分层聚类时间.在测试数据集上的实验结果表明使用本算法进行预处理后,能显著减少分层聚类的运行时间.
分层聚类 并行算法 数据预处理
李朝鹏 李肯立
湖南大学,计算机与通讯学院,湖南,长沙,410082
国内会议
南宁
中文
187-189
2007-10-12(万方平台首次上网日期,不代表论文的发表时间)