会议专题

基于分层聚类的并行数据预处理算法

分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一.针对目前并行分层聚类算法处理大数据集时速度较慢的特点,提出一种并行数据预处理算法,该算法可使原始输入数据的规模最多减少为原来的1/10,从而可减少总的并行分层聚类时间.在测试数据集上的实验结果表明使用本算法进行预处理后,能显著减少分层聚类的运行时间.

分层聚类 并行算法 数据预处理

李朝鹏 李肯立

湖南大学,计算机与通讯学院,湖南,长沙,410082

国内会议

2007全国开放式分布与并行计算学术年会

南宁

中文

187-189

2007-10-12(万方平台首次上网日期,不代表论文的发表时间)