会议专题

基于多质心的不良文本快速过滤方法

  本文针对Roeehio容易受到类别样本分布及噪声影响的而导致错误扩大类别范围的问题,提出对训练样本进行聚类,使用聚类形成的多个簇的质心向量替代单个质心向量作为过滤判定向量组的方法。该方法既能保证过滤效率,又比单质心的Rocchio过滤法具有更高的召回率和准确率。

不良文本 快速过滤 多质心向量 Rocchio K-means

黄家裕 刘连芳

南宁市平方软件新技术有限责任公司,广西南宁 530007

国内会议

广西计算机学会2010年年会

南宁

中文

436-438

2010-09-01(万方平台首次上网日期,不代表论文的发表时间)