会议专题

模拟退火的投影寻踪模型在文本分类中的应用

在文本分类中,特征维数高是必须处理的问题,有效的维数约简技术可以提高分类器学习任务的效率和分类性能,已有研究表明投影寻踪是一种有效的降维方法。投影寻踪是通过寻找最能反映原高维数据的结构或特征的投影方向,把高维数据投影到低维子空间上,从而实现在低维空间上研究分析高维数据的目的。传统投影寻踪技术计算复杂、编程实现困难,其本质问题是投影方向不易确定,且当投影方向包含的指标较多时计算尤为不易。本文提出一种模拟退火的投影寻踪模型,该模型有效的解决了投影方向的寻优问题。本文将该方法应用于文本分类,在Reuters-21578文档集和复旦文档集上进行实验,并与基于遗传算法的投影寻踪模型进行了比较,实验结果表明此方法能有效提取投影方向,得到了很好的分类性能。

模拟退火 投影寻踪模型 投影方向 文本分类

廖海波 万中英 王明文

江西师范大学科学技术学院,南昌 330027 江西师范大学计算机信息工程学院,南昌 330022

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

628-635

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)