基于信息反馈的文本主题分类过滤方法
为了更加准确地分辨文本主题、过滤无关信息,在分析现有分类算法的基础上选取了SNOW作为基本主题分类算法,并提出了信息反馈和阈值过滤的策略以达到准确过滤无关信息的目的,提出了IG和CHI融合特征提取算法进一步提高系统的准确率。实验结果表明,采用信息反馈和阈值过滤以及融合特征提取的分类算法使系统更高效地实现了将相关信息准确地分类到其所属主题领域、过滤掉无关信息的双重功能。
主题分类 信息反馈 阈值过滤 特征提取
侯风巍 郭东军 李世磊 徐钊峰
北京京航计算通讯研究所,北京 100074
国内会议
天津
中文
139-144
2009-10-01(万方平台首次上网日期,不代表论文的发表时间)