会议专题

基于支持向量机的Web文本分类方法

Web文本分类技术是数据挖掘中一个研究热点领域,而支持向量机又是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势.文章通过分析Web文本的特点,研究了向量空间模型(VSM)的分类方法和核函数的选取,在此基础上结合决策树方法提出了一种基于决策树支持向量机的Web文本分类模型,并给出具体的算法.通过实验测试表明,该方法训练数据规模大大减少,训练效率较高,同时具有较好的精确率(90.11%)和召回率(89.38%).

支持向量机 特征提取 Web文本 文本分类

牛强 王志晓 陈岱 夏士雄

中国矿业大学计算机科学与技术学院,江苏,徐州,221008

国内会议

2006年全国开放式分布与并行计算学术会议

西安

中文

102-104

2006-10-19(万方平台首次上网日期,不代表论文的发表时间)