一种基于混合模型的文本分类器的研究与实现
本文通过分析文章写作习惯,提出了一种基于混合模型的文本分类算法,通过EM算法发现局部最大后验估计模型参数,并将其应用于中文文本的分类,实验证明,基于混合模型的分类算法的整体性能明显优于NB,是一种比较稳定的算法;在小训练样本的情况下,混合模型分类算法表现突出。
混合模型 EM算法 文本分类 朴素贝叶斯算法 分类算法
汪传建 李晓光 王大玲 于戈
东北大学信息科学与工程学院,沈阳,110004;石河子大学信息工程学院,石河子,832003 东北大学信息科学与工程学院,沈阳,110004
国内会议
厦门
中文
353-357
2004-10-14(万方平台首次上网日期,不代表论文的发表时间)