会议专题

一种基于自动阈值发现的文本聚类方法

本文通过分析文本的特征以及常用的文本聚类方法,提出了一种对文本进行细致划分获取细化簇、并在细化簇基础上进行聚类的文本聚类方法,在聚类过程中,采用曲线的多项式拟合技术提出了一种自动发现阈值的方法,并把该方法应用于细化簇的寻找步骤中.与凝聚的层次聚类方法的实验比较结果表明,使用自动阈值发现的方法在时间消耗、聚类效果、以及对孤立点的容忍性方面都具有更优的性能。

文本聚类 细化簇 自动阈值发现 多项式拟合 孤立点

张猛 王大玲 于戈

东北大学信息科学与工程学院,沈阳,110004

国内会议

第二十一届中国数据库学术会议

厦门

中文

142-147

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)