基于k-近邻方法的渐进式中文文本分类技术
针对k-近邻方法分类准确率较高、但分类效率较低的特性,提出了一种基于k-近邻方法的渐进式中文文本分类技术,利用文本的标题、摘要、关键词、重点段落进行渐进式的分类处理.这样,不用分析全文就能将部分待分类文本成功分类,从而提高了文本分类的效率.实验结果表明,该方法在保证分类准确率的基础上能够有效地提高分类效率.
文本分类 k近邻分类 渐近式分类
袁方 杨柳 张红霞
东北大学信息科学与工程学院(辽宁沈阳) 河北大学数学与计算机学院(河北保定) 保定金融高等专科学校计算机系(河北保定)
国内会议
第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004)
广州
中文
88-91
2004-11-12(万方平台首次上网日期,不代表论文的发表时间)