会议专题

一种结合参数优化的贝叶斯文本分类算法

朴素贝叶斯算法的主要特征是分类速度快而分类精度较低,算法的目标是在传统贝叶斯文本分类算法的前提下达到令人满意的分类精度,并进一步提高分类速度.算法的技术手段包括在原有多项式贝叶斯模型的基础上建立简化的贝叶斯实现模型,建立仅包含单词在类别中信息的类别特征信息数据库和优化lidstone修正因子等.算法实验在Reuters-21578测试语料集上进行.结果表明,与相关文献相比,分类速度明显高于对比算法,且精度优于或近于相关文献的改进贝叶斯算法.

简化模型 快速贝叶斯算法 参数优化 文本分类 数据库

高影繁 马润波 刘玉树

北京理工大学计算机科学与技术学院,北京,100081 山西大学物理电子工程学院,太原,030006

国内会议

第二届中国分类技术及应用学术会议

郑州

中文

1-5

2007-05-27(万方平台首次上网日期,不代表论文的发表时间)