会议专题

高斯加权的重构性K-NN算法研究

本文提出基于高斯加权距离以及聚类重构机制的K-NN文本聚类算法.文章提出K-NN邻近域的概念,通过高斯加权的邻近域算法实施K-NN聚类.利用高斯函数根据样本与聚类中心的距离为样本赋权,计算聚类距离.基于邻近域权重和聚类密度对形成的聚类实施重构,实现聚类数目的自适应调整.使用拆分算子拆分稀疏聚类并调整异常样本;使用合并算子合并相似聚类.实验显示聚类重构机制能够有效地提高聚类的准确率及召回率,增加聚类密度,使得形成的聚类结果更加合理.

文本聚类 K-NN算法 高斯加权 邻近域规则 聚类重构

刘作国 陈笑蓉

贵州大学计算机科学与技术学院,贵州省 贵阳市 550025

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-7

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)