会议专题

一种新的投影寻踪计算方法及在文本分类中的应用

在文本分类中,特征维数高是必须处理的问题,有效的维数约简技术可以提高分类器学习任务的效率和分类性能,已有研究表明投影寻踪是一种有效的降维方法,但在计算多个投影方向的时间复杂性太高,且投影方向的个数难于确定。本文针对这一问题提出一种新的计算方法,即根据剩余文档矩阵信息递归计算每步的主投影方向及判断投影方向个数,并将该方法应用于文本分类,在Reuters-21578文档集上进行实验,结果表明此方法能有效提取投影方向,在3-5维时就能达到很好的分类效果。

文本分类 维数约简 投影寻踪 投影方向

万中英 王明文 廖海波

江西师范大学计算机信息工程学院,南昌 330022 江西师范大学科学技术学院,南昌 330027

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

178-182

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)