会议专题

利用规则权重改进文本关联分类

本文提出了基于规则权重调整的关联规则文本分类算法(WARC),该算法利用分类关联规则对训练样本进行分类测试,根据误分类训练样本的数量定义规则强度,对强规则通过乘以小于1的调整因子降低其权重,而弱规则乘以大于1的调整因子提高其权重,研究结果表明,经过规则权重的调整,其分类精度显著提高。

数据挖掘 关联分类 规则强度 权重 文本分类

陈晓云 胡运发

复旦大学计算机与信息技术系,上海,200433;福州大学数学与计算机科学学院,福州,350002 复旦大学计算机与信息技术系,上海,200433

国内会议

第二十一届中国数据库学术会议

厦门

中文

450-455

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)