高斯加权的重构性K-NN算法研究
本文提出基于高斯加权距离以及聚类重构机制的K-NN文本聚类算法.文章提出K-NN邻近域的概念,通过高斯加权的邻近域算法实施K-NN聚类.利用高斯函数根据样本与聚类中心的距离为样本赋权,计算聚类距离.基于邻近域权重和聚类密度对形成的聚类实施重构,实现聚类数目的自适应调整.使用拆分算子拆分稀疏聚类并调整异常样本;使用合并算子合并相似聚类.实验显示聚类重构机制能够有效地提高聚类的准确率及召回率,增加聚类密度,使得形成的聚类结果更加合理.
文本聚类 K-NN算法 高斯加权 邻近域规则 聚类重构
刘作国 陈笑蓉
贵州大学计算机科学与技术学院,贵州省 贵阳市 550025
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-7
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)