基于非负矩阵分解的大规模异构数据联合聚类
异构信息网络中包含多类实体和关系.随着数据规模增大时,不同类实体规模增长不平衡,异构关系数据也变得异常稀疏,导致聚类算法的时间复杂度高、准确率低.针对上述问题,提出了一种基于关联矩阵分解的两阶段联合聚类算法FNMTF-CM.第一阶段,抽取规模较小的一类实体中的关联关系构建关联矩阵,通过对称非负矩阵分解得到划分指示矩阵.与原始关系矩阵相比,关联矩阵的稠密度更高,规模更小.第二阶段,将划分指示矩阵作为关系矩阵三分解的输入,进而快速求解另一类实体的划分指示矩阵.在标准测试数据集和异构关系数据集上的实验表明,算法准确率和性能整体优于传统的基于非负矩阵分解的联合聚类算法.
异构信息网络 数据挖掘 聚类算法 矩阵分解
申国伟 杨武 王巍 于淼 董国忠
哈尔滨工程大学信息安全研究中心 哈尔滨150001
国内会议
北京
中文
1-10
2014-12-01(万方平台首次上网日期,不代表论文的发表时间)