基于多质心的不良文本快速过滤方法
本文针对Roeehio容易受到类别样本分布及噪声影响的而导致错误扩大类别范围的问题,提出对训练样本进行聚类,使用聚类形成的多个簇的质心向量替代单个质心向量作为过滤判定向量组的方法。该方法既能保证过滤效率,又比单质心的Rocchio过滤法具有更高的召回率和准确率。
不良文本 快速过滤 多质心向量 Rocchio K-means
黄家裕 刘连芳
南宁市平方软件新技术有限责任公司,广西南宁 530007
国内会议
南宁
中文
436-438
2010-09-01(万方平台首次上网日期,不代表论文的发表时间)