基于词向量空间模型的文本分类方法
大多文本分类方法是基于向量空间模型的,基于这一模型的文档向量维数较高,导致分类器效率难以提高.针对这一不足,本文提出基于词向量空间模型的文本分类方法.其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度.实验证明,这种分类方法不仅保持了较高的召回率和准确率还提高了分类效率.
文本分类 向量空间模型 K-最近邻居 词向量空间模型 支持度矩阵
董学春 胡学钢 谢飞 吴共庆
合肥工业大学计算机与信息学院,安徽,合肥,230009
国内会议
太原
中文
250-254
2006-07-16(万方平台首次上网日期,不代表论文的发表时间)