基于汉语分析的中文分类方法
标题同文章的主题有着密切关系。在人工分类过程中,大多数文献的类别均可通过其标题来判定。基于这一事实,该文提出一种复合分类方法,它将汉语分析技术同传统分类方法结合起来。即对文献的标题进行语法分析,求出标题中对于分类有意义的核心词汇,从而确定文献的类别。当这种方法无法判定类别时,则用基于词汇的统计方法进行分类。实验结果表明,这种方法在精度和效率方面均高于单纯的统计方法。
文献分类 语法分析 自然语言理解 主题标引
战学刚 姚天顺
大学计算机科学与工程系(沈阳)
国内会议
北京
中文
412~417
1998-09-01(万方平台首次上网日期,不代表论文的发表时间)