会议专题

面向大规模图数据的分布式并行聚类算法研究

  图聚类作为一种重要的图数据挖掘技术,在许多实际应用中已得到广泛的关注。针对图数据日益普及、规模不断增大的现实,提出了一种高效的分布式并行图聚类算法,即MR-LSH算法。该算法是在MapReduce框架的基础上,通过对传统的位置敏感哈希(locality sensitive hashing,LSH)算法的并行化改造,使其可在分布式的集群环境中实现对大规模图数据的高效聚类。通过在真实数据集上的实验,表明该算法的可行性与有效性。

大规模图数据 分布式并行聚类算法 优化设计 信息采集

Chen Dehua 陈德华 Xie Wei 解维 Li Yue 李悦

School of Computer Science&Technology, Donghua University, Shanghai 201620 东华大学计算机科学与技术学院 上海201620

国内会议

第29届中国数据库学术会议

合肥

中文

222-227

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)