会议专题

基于语义概念空间的渐进直推式文本分类

在渐进直推支持向量机中,合理的降维在很大程度上可以提高分类的性能和降低计算的复杂度。降维通常有特征选择和特征提取两种方式。通过核主成分分析(KPCA)提取语义概念空间实现特征提取,因为GHA算法在每次KPCA迭代过程中,无需直接计算和存储协方差矩阵,实现了较好的时间和空间性能。实验表明,本文所提出的基于KPCA和PTSVMs相结合的文本分类方法,在少量有标签样本和大量无标签样本所构成的混合样本训练集上取得了良好的分类效果。

文本分类 渐进直推支持向量机 核主成分分析 核化Hebbian算法 语义概念空间

张晓滨 尹英顺 赵培坤 魏聪明

西安工程大学计算机学院,陕西,西安,710048 华东交通大学机电工程学院,江西,南昌,330013

国内会议

第七届中文信息处理国际会议

武汉

中文

470-474

2007-10-13(万方平台首次上网日期,不代表论文的发表时间)