基于样本差异性的关联文本分类
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分类器的分类效果受到影响。本文提出了一种根据训练样本偏离“真实类中心”的程度——离心度,给训练样本赋予权值的算法WS-ARC-BC(Weighted SampleARC-BC),提高分类器的稳定性,从而提高分类器的分类效果。实验表明,该算法能够有效提高分类效果。
关联文本分类 样本 差异性 权重
林堃 白清源 谢丽聪 谢伙生 张莹
福州大学数学与计算机科学学院,福州,350002
国内会议
苏州
中文
137-143
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)