会议专题

利用质心向量构建增量式分类器

本文给出三种启发式规则用于获取根集文档的质心向量。通过使用给定的正例文档,本文首先构建一个与其对应的质心向量,然后利用它提取未标识数据集中的可靠正反样例。文本分类器使用这个逐步扩展的训练集进行增量训练。在Reuters-21578数据集上的实验结果表明,Sum质心向量可以协助分类器提高其分类精度。最后,本文通过实验验证了论文中提出的方法比PEBL算法更高效。

质心向量 文本分类 文档特征权重 质心特征权重 启发式规则

王辉 左万利

吉林大学,长春 130012

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

144-150

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)