基于夹角离散度的文本相似度检测
文本相似度的检测是文本分类的基础,根据文本与各类的相似度运用检测理论,将其自动归到一个或者几个类别中去.本文改进了传统方法,将夹角离散度引入文本相似度的检测,提出新的分类算法.针对中文文本开放测试集测试结果表明该分类算法查全率和准确率均有所提高,而且新分类算法的实施有效地改善了分类性能,证明了其有效性和可行性.
文本分类 夹角离散度 相似度检测 文本信息 信息处理
刘涛 毛伟 郭军
北京邮电大学信息工程学院,北京,100876
国内会议
宜昌
中文
82-86
2005-10-01(万方平台首次上网日期,不代表论文的发表时间)