会议专题

基于潜在语义分析的Web文本分类

传统的基于向量空间的文本分类方法很难处理文本的高维特性,本文首先综述了潜在语义分析的理论及方法,并且解释其数学意义,提出基于潜在语义分析的Web文本分类方法,给出Web文本的特征表示,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间.在潜在语义空间中利用支持向量机方法实现文本分类.最后采用两种文本分类方法进行对比实验,实验表明基于潜在语义分析的方法比传统方法取得更好的文本分类效果.

潜在语义分析 Web文本 支持向量机 文本分类

王剑锋 苑津莎

华北电力大学电子与通信工程系,保定,071003

国内会议

全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会

南京

中文

247-249

2006-10-01(万方平台首次上网日期,不代表论文的发表时间)