会议专题

一种基于两级分类器的垃圾短信过滤方法

垃圾短信过滤是一个文本分类问题。如何设计分类器,可以在训练样本较少的情况下达到可观的精度是一个重要的问题。本文对传统分类器的结构加以改进,设计了一种基于潜在中间层的两级分类器,每级用贝叶斯方法实现。进一步地,将朴素贝叶斯分类器与之加权结合。实验结果表明,两级分类器大幅度提升了分类错误率的收敛速度。组合分类器在此基础上提高了训练样本较多时的精度,集成了两者的优点。

垃圾短信过滤 文本分类 朴素贝叶斯 潜在中间层 组合分类器

王占一 徐蔚然 刘东鑫 郭军

北京邮电大学,北京,10086

国内会议

第五届全国信息检索学术会议CCIR2009

上海

中文

404-411

2009-11-14(万方平台首次上网日期,不代表论文的发表时间)