会议专题

基于改进的贝叶斯模型的中文网页分类器

本文提出了一种改进的基于统计的中文网页的分类算法,通过对传统的基于计算机似度文本分类方法和基于贝叶斯模型文本分类算法的研究,我们对贝叶斯模型分类算法进行了改进,提出了利用类别密度函数似然比来增加特征词的可分性信息的算法.通过对计算机似度方法,贝叶斯方法及改进的贝叶斯方法对比实验表明,改进算法可以最大化类与类的间隔,因而具有较高的分类精确率和召回率.

似然比 贝叶斯方法 文本概率模型 文本过滤系统 网页过滤 信息安全 信息检索

秦兵 郑实福 刘挺 张刚 李生

哈尔滨工业大学信息检索组(哈尔滨)

国内会议

全国第六届计算语言学联合学术会议

太原

中文

373-378

2001-08-04(万方平台首次上网日期,不代表论文的发表时间)