基于SVM方法的中文实体关系抽取

摘要：

实体关系抽取是很多自然语言处理任务的重要基础。本文针对中文中实体关系的特点,设计了一系列的特征。包括词、词性标注、实体和出现信息、包含关系和知网提供的概念信息等,以构成实体间关系的上下文特征向量并使用SVM方法进行了中文实体关系抽取。以ACE2004的训练语料作为实验数据,得到了较好的识别性能。同时根据分级实验的结果,考察了各种特征集对识别性能的影响,得到下一步研究的方向。

关键词：信息抽取实体关系抽取特征选择知网信息自然语言处理词性标注

作者: 徐芬王挺陈火旺

作者单位: 国防科学技术大学计算机学院,湖南长沙,410073

会议类型: 国内会议

会议名称: 第九届全国计算语言学学术会议

会议地点: 大连

会议语种:中文

页码: 497-502

在线出版日期: 2007-08-06（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于SVM方法的中文实体关系抽取