基于加权系数与邻域密度因子的近邻传播算法
传统近邻传播聚类算法对多重尺度和任意形状的数据敏感,有学者将领域密度和流行理论引入近邻传播算法在一定程度上解决了数据敏感问题,但是在具有离群噪声以及粘连样本的复杂数据集上聚类效果不佳.在此基础上,提出一种基于加权系数和邻域密度因子改进的近邻传播算法.该算法利用加权系数改进领域密度的计算,并将“邻域密度因子“的思想引入近邻传播,将数据集中样本点划分为核心样本点与非核心样本点,并根据样本点的类型采用不同的方式构造连通图,依此计算得到更加能体现数据真实分布关系的相似度矩阵并进行聚类.在人工数据集与UCI标准数据集上进行实验,结果表明该算法在一定程度上提高了聚类精度,从而验证了该算法的有效性与可行性.
数据敏感 近邻传播算法 加权系数 邻域密度因子
巨东东 倪志伟 韩杰
合肥工业大学 管理学院 安徽 合肥 230009;合肥工业大学 过程优化与智能决策教育部重点实验室 安徽 合肥 230009
国内会议
天津
中文
1-12
2017-10-28(万方平台首次上网日期,不代表论文的发表时间)