会议专题

kNN与NB算法在中文网页分类上的比较研究

针对中文网页,比较研究了kNN和NB分类算法.主要的实验结果有:(1)kNN的分类质量明显优于NB;(2)即使是同一个算法对于不同领域的文档,其分类能力也是各有差异的.从总体而言,NB算法对不同类别比较敏感,是一种不稳定的分类算法,kNN的分类质量受领域的影响不大.

机器学习 中文网页分类 kNN NB 评测 数据集

龚笔宏 冯是聪

北京大学计算机科学技术系(北京)

国内会议

全国搜索引擎和网上信息挖掘学术讨论会

北京

中文

73-79

2003-03-01(万方平台首次上网日期,不代表论文的发表时间)