会议专题

基于粒子群优化的快速KNN分类算法

提出了一种有效的快速k近邻分类文本分类算法,即PSOKNN算法,该算法利用粒子群优化方法的随机搜索能力在训练文档集中进行有指导的全局随机搜索.在搜索k近邻的过程中,粒子群跳跃式移动,掠过大量不可能成为k近邻的文档向量,从而可以快速找到测试样本的k个近邻.以Reuters-21578文档集分类为例验证算法的有效性,结果表明,保持k近邻法分类精度,新算法比KNN算法降低分类时间70%.

KNN分类器 粒子群优化算法 文本分类 文本相似度

张国英 沙芸 江慧娜

北京石油化工学院,信息工程学院,北京,102617

国内会议

第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)

济南

中文

34-36,42

2006-07-21(万方平台首次上网日期,不代表论文的发表时间)