会议专题

SparkSCAN:一种基于Spark的结构相似度聚类算法

针对目前有向图聚类算法存在的时延高、资源损耗大、迭代式数据处理性能较差等问题,提出一种基于Spark的结构相似度聚类并行算法(SparkSCAN):考虑网络中节点间的有向交互性,将结构相似的节点聚集起来:针对有向图数据规模巨大的特点,结合Spark框架,设计了适于分布式图计算的数据结构:并提出了一种分布式并行聚类算法,在确保聚类结果正确性的前提下,提高处理性能.实验结果表明,SparkSCAN有着良好的表现,能够高效地处理大规模有向图聚类问题.

图像处理 结构相似度 聚类算法 并行计算

周岐军 汪璟玢

福州大学数学与计算机科学学院 福州中国350108

国内会议

第七届社会计算会议

福州

中文

1-8

2015-12-11(万方平台首次上网日期,不代表论文的发表时间)