会议专题

一种基于混合模型的文本分类器的研究与实现

本文通过分析文章写作习惯,提出了一种基于混合模型的文本分类算法,通过EM算法发现局部最大后验估计模型参数,并将其应用于中文文本的分类,实验证明,基于混合模型的分类算法的整体性能明显优于NB,是一种比较稳定的算法;在小训练样本的情况下,混合模型分类算法表现突出。

混合模型 EM算法 文本分类 朴素贝叶斯算法 分类算法

汪传建 李晓光 王大玲 于戈

东北大学信息科学与工程学院,沈阳,110004;石河子大学信息工程学院,石河子,832003 东北大学信息科学与工程学院,沈阳,110004

国内会议

第二十一届中国数据库学术会议

厦门

中文

353-357

2004-10-14(万方平台首次上网日期,不代表论文的发表时间)