会议专题

一种改进的增量贝叶斯分类算法

贝叶斯分类器在知识储备不足的情况下,容易对新增未标注的训练文本(新增训练集)产生分类错误,若这些分类错误的文本过早地加入到分类器中会降低其分类性能;另外,新增训练集的规模过大将会降低增量学习的速度。为了解决这些问题,提出一种增量学习序列选择的新方法:首先利用当前分类器选择分类正确的文本组成新增训练子集,然后利用0-1损失率对新增训练子集进行增量实例选择。通过选择合理的学习序列强化了较完备数据对分类的积极影响,弱化了噪音数据的消极影响。对比实验结果表明,改进算法不仅提高了分类效率同时也提高了分类精度。

贝叶斯分类算法 算法改进 增量学习序列 序列选择

马后锋 樊兴华

重庆邮电大学计算机科学与技术研究所 重庆 400065

国内会议

2007年首届仪表、自动化与先进集成技术大会

重庆·云南丽江

中文

312-316

2007-12-07(万方平台首次上网日期,不代表论文的发表时间)