会议专题

网页文本分类中特征压缩对分类器性能的影响

本文主要研究特征压缩对分类器性能的影响。文中第2部分采用基于先验知识的阑值词频特征压缩方法,将关键词词频的维数从185到9849分为16个等级,在每个维数的特征向量空间上对提取IDTIF和归一化两种特征,第3部分介绍3种计算复杂度较低的分类器算法,即K一均值、感知机、Na-iveBayes;第4部分对上述特征进行了分类训练和无交叉测试,并作了简要分析。

中文网页 文本分类 分类器 网页检索

梁久祯

浙江师范大学,信息学院,智能计算与并行计算研究所,金华,321004

国内会议

第五届中国Rough集与软计算学术研讨会

辽宁鞍山

中文

158-161

2005-08-01(万方平台首次上网日期,不代表论文的发表时间)