通过弱化朴素贝叶斯假设提高朴素贝叶斯文本分类器的性能
本文中,我们用CO特征定义来表述单词间的相互依存关系,并给出了基于 CO特征定义的文档表示法,特征筛选算法和朴素贝叶斯文本分类算法。从实验结果中可以明显地看出,使用CO特征定义,可以提高朴素贝叶斯文本分类器的分类性能。其根本原因在于:采用CO特征定义,可以将特征fi,fj间的相互依赖关系在某种程度上体现到分类器中,弱化了朴素贝叶斯假设的强度。
朴素贝叶斯假设 文本分类器 CO特征定义
张阳 李战怀 卢维扬
西北工业大学计算机科学与工程系,西安,710072
国内会议
郑州
中文
69-72
2002-08-26(万方平台首次上网日期,不代表论文的发表时间)