基于夹角离散度的文本相似度检测

摘要：

文本相似度的检测是文本分类的基础,根据文本与各类的相似度运用检测理论,将其自动归到一个或者几个类别中去.本文改进了传统方法,将夹角离散度引入文本相似度的检测,提出新的分类算法.针对中文文本开放测试集测试结果表明该分类算法查全率和准确率均有所提高,而且新分类算法的实施有效地改善了分类性能,证明了其有效性和可行性.

关键词：文本分类夹角离散度相似度检测文本信息信息处理

作者: 刘涛毛伟郭军

作者单位: 北京邮电大学信息工程学院,北京,100876

会议类型: 国内会议

会议名称: 2005年全国测控、计量、仪器仪表学术年会

会议地点: 宜昌

会议语种:中文

页码: 82-86

在线出版日期: 2005-10-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于夹角离散度的文本相似度检测