会议专题

基于背景知识的文本自动分类

文本自动分类是智能信息处理的一个重要分支,目前大量的研究都是基于统计的,采用的文本表示方法大都是基于向量空间模型的,这些方法存在着一些缺陷.本文在分析了这些缺陷的基础上,提出了一种新的分类方法--基于背景知识的文本自动分类方法.该方法模拟了人的分类过程,建立能够代表类别的背景知识--知识树,利用相应的分类算法对文本进行处理,试图让计算机在背景知识下具有人的认知能力.这种方法在已知知识树的前提下,考虑了文本的语义层次结构,把文本的结构与知识树相整合,以激活相应的树枝,最后得出文本类别的归属.试验表明,该方法具有较高的分类正确率和召回率.

文本自动分类 知识树 认知能力 背景知识 信息处理

卢朋 曾隽芳 杨一平

中科院自动化研究所,北京,100080

国内会议

第三届学术计算语言学研讨会

沈阳

中文

347-352

2006-08-15(万方平台首次上网日期,不代表论文的发表时间)