基于互信息规则剪枝的关联文本分类
传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器.对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.
互信息 规则剪枝 关联分类 ARC-BC算法
商炳章 白清源
福州大学,数学与计算机科学学院,福建,福州,350002
国内会议
南京
中文
173-177
2008-11-14(万方平台首次上网日期,不代表论文的发表时间)