SparkSCAN:一种基于Spark的结构相似度聚类算法
针对目前有向图聚类算法存在的时延高、资源损耗大、迭代式数据处理性能较差等问题,提出一种基于Spark的结构相似度聚类并行算法(SparkSCAN):考虑网络中节点间的有向交互性,将结构相似的节点聚集起来:针对有向图数据规模巨大的特点,结合Spark框架,设计了适于分布式图计算的数据结构:并提出了一种分布式并行聚类算法,在确保聚类结果正确性的前提下,提高处理性能.实验结果表明,SparkSCAN有着良好的表现,能够高效地处理大规模有向图聚类问题.
图像处理 结构相似度 聚类算法 并行计算
周岐军 汪璟玢
福州大学数学与计算机科学学院 福州中国350108
国内会议
福州
中文
1-8
2015-12-11(万方平台首次上网日期,不代表论文的发表时间)