一种基于加权投票的术语自动识别方法

摘要：

术语自动识别是获取领域术语表中未登录的规范化词汇的方法，并且是信息抽取、文本挖掘等领域的重要任务。近年来，基于统计分析的术语抽取方法取得了一定进展，出现了C-Value、NC-Value、TermExtractor等有效方法。但是，对各种方法进行加权投票的研究相对较少。本文首先从大量已知术语中收集术语的词性模板，并借之抽取候选术语，接着利用了加权投票算法对这些候选术语进行排序。在IEEE2006-2007电子工程领域文献上的实验结果表明，加权投票方法比任何单一方法的识别效果更好。

关键词：自动术语识别投票算法信息抽取文本挖掘

作者: 张巍游宏梁张吉才

作者单位: 北京文献服务处,北京,100142

会议类型: 国内会议

会议名称: 第六届全国信息检索学术会议

会议地点: 黑龙江镜泊湖

会议语种:中文

页码: 513-520

在线出版日期: 2010-08-12（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于加权投票的术语自动识别方法