会议专题

基于词向量空间模型的文本分类方法

大多文本分类方法是基于向量空间模型的,基于这一模型的文档向量维数较高,导致分类器效率难以提高.针对这一不足,本文提出基于词向量空间模型的文本分类方法.其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度.实验证明,这种分类方法不仅保持了较高的召回率和准确率还提高了分类效率.

文本分类 向量空间模型 K-最近邻居 词向量空间模型 支持度矩阵

董学春 胡学钢 谢飞 吴共庆

合肥工业大学计算机与信息学院,安徽,合肥,230009

国内会议

全国第17届计算机科学与技术应用(CACIS)学术会议

太原

中文

250-254

2006-07-16(万方平台首次上网日期,不代表论文的发表时间)