一种含有负项的关联文本分类
关联文本分类中,如果特征词分布不均衡,特征词出现频率低的类别的规则集常被特征词出现频率高的类别的规则集所掩盖,分类器的预测能力变弱,因此提出了一种新奇的挖掘含有负项的分类规则的方法,一定程度上增强了被掩盖类别的规则集的分辨能力。从大量的实验结果看出该方法是行之有效的,能够提高分类器的预测能力。
特征词 分布不均衡 负项 关联分类
王孟 白清源 谢丽聪 谢伙生 张莹
福州大学计算机科学与技术系,福州,350002
国内会议
苏州
中文
171-177
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)