SparkSCAN:一种基于Spark的结构相似度聚类算法

摘要：

针对目前有向图聚类算法存在的时延高、资源损耗大、迭代式数据处理性能较差等问题,提出一种基于Spark的结构相似度聚类并行算法(SparkSCAN):考虑网络中节点间的有向交互性,将结构相似的节点聚集起来:针对有向图数据规模巨大的特点,结合Spark框架,设计了适于分布式图计算的数据结构:并提出了一种分布式并行聚类算法,在确保聚类结果正确性的前提下,提高处理性能.实验结果表明,SparkSCAN有着良好的表现,能够高效地处理大规模有向图聚类问题.

关键词：图像处理结构相似度聚类算法并行计算

作者: 周岐军汪璟玢

作者单位: 福州大学数学与计算机科学学院福州中国350108

会议类型: 国内会议

会议名称: 第七届社会计算会议

会议地点: 福州

会议语种:中文

页码: 1-8

在线出版日期: 2015-12-11（万方平台首次上网日期，不代表论文的发表时间）

会议专题

SparkSCAN:一种基于Spark的结构相似度聚类算法