会议专题

一种基于TAN的文本分类方法

提出了一种基于TAN模型的文本分类方法,朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系.TAN(Tree Augmented Naive Bayes)是综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力,其分类性能可与当前流行的一些分类器相竞争.介绍了TAN模型,将其引入到文本分类中,并用实验比较了朴素贝叶斯和TAN,实验结果表明:该方法具有较好的分类性能.

文本分类 朴素贝叶斯 贝叶斯网 特征选择 树状结构模型

石洪波 王志海 黄厚宽

北方交通大学计算机与信息技术学院(北京)

国内会议

第七届中国人工智能联合学术会议

桂林

中文

81-85

2003-01-01(万方平台首次上网日期,不代表论文的发表时间)