一种基于自动阈值发现的文本聚类方法
本文通过分析文本的特征以及常用的文本聚类方法,提出了一种对文本进行细致划分获取细化簇、并在细化簇基础上进行聚类的文本聚类方法,在聚类过程中,采用曲线的多项式拟合技术提出了一种自动发现阈值的方法,并把该方法应用于细化簇的寻找步骤中.与凝聚的层次聚类方法的实验比较结果表明,使用自动阈值发现的方法在时间消耗、聚类效果、以及对孤立点的容忍性方面都具有更优的性能。
文本聚类 细化簇 自动阈值发现 多项式拟合 孤立点
张猛 王大玲 于戈
东北大学信息科学与工程学院,沈阳,110004
国内会议
厦门
中文
142-147
2004-10-14(万方平台首次上网日期,不代表论文的发表时间)